前の記事 | 目次 | 研究所 | 次の記事 2000年5月からの訪問者数(画像)
農業と環境 No.148 (2012年8月1日)
独立行政法人農業環境技術研究所

農環研ウェブ高座 「農業環境のための統計学」
第1回 「前口上−統計学の世界を鳥瞰するために」

○これから統計ワールドに出家されるみなさんへ

みなさん、めくるめく生物統計学の世界へようこそ。憂き世のデータ至上主義に疲れ果てたみなさんは、数字の海を日々懸命に泳ぎつつ、どこかにあるだろう 「至高の統計分析」 なる蜘蛛(クモ)の糸にすがりつこうとしているのではないでしょうか。苦しくないですか? つらくはないですか? 日々、農業環境研究に邁進しているみなさんに、私は今回の連続高座を通じて、次のような引導を渡した上で、悩ましい憑きものを落としてさしあげたいと思います。

データの荒海を泳ぎ切ってもどこにも 「究極の真実」 などありはしないのだ。

統計学はその時その場かぎりでの 「最良の結論」 を導く便法にすぎないのだ。

現世を生き続ける私たち人間にとって天上の極楽浄土を説くことは何の意味もありません。みなさんが研究活動の過程でときおり手にする統計学というツールは、表面的には数学と数式のヨロイに包まれ、その大魔神のごときいかつい形相は多くの初心者を震え上がらせてきました。しかし、実際には統計学とは、永遠なるイデア界のお花畑を散策するための案内書ではありません。むしろ、憂き世の荒野を切り拓(ひら)いてゆかねばならない生身の人間が手にする武器と言うのがふさわしいでしょう。

生物としてのヒトは、太古の昔から現在にいたるまで、さまざまな環境のもとで生き続け、その進化の過程で多くの特性を獲得してきました。不確定な状況のもとでの推論能力もそのひとつです。あやふやな状況のもとで、あるいはさまざまな情報が錯綜(さくそう)するとき、いかにして妥当な結論を導き出し次なる行動への意思決定を行なうか。ヒトの祖先が生きた先史時代にはそのような知的能力の有無は生死を分けることになったかもしれません。現代人にとってもあふれかえるデータや情報をいかに使いこなしてベストの選択肢を選びとるかは、ビジネスの現場や科学研究の最前線のみならず、日常生活をしていく上でも必要な資質でしょう。

統計学とはヒトがもともと持っていたそのような推論能力を強力に補佐する武器であると私は考えています。つまり、われわれ人間が日常的に行なっている推論行為の延長線上の自然な位置に、統計学のさまざまなツールが占めるべき場所があるという考えです。

統計学の厳密な数学的理論はたしかに重要です。演繹(えんえき)体系としての数学があるからこそ、私たちはさまざまな統計ツールの確固たる論理的基盤をお守り袋の中に入れておくことができるからです。しかし、多くの統計ユーザーにとって数学よりももっと大切なことがあるはずです。それは個々の統計手法を用いることにより人間の直感的な認識がどれくらい深まるのかという点です。身体的に納得できてこそデータ解析の御利益を実感できるでしょう。やみくもに統計ツールに振り回されたり、統計数学に挫折(ざせつ)したりというよくある光景は 「武器として役立つ統計学」 という立場からいえば残念の一言に尽きます。

○本「高座」のおおよその予定

いまの予定では、これから向こう一年にわたって毎月連載をしていくつもりです。おおまかには次のような構成と内容を考えています:

第1回 前口上:統計学の世界を鳥瞰するために

第2回 統計学のロジックとフィーリング

第3回 直感的な素朴統計学からはじまる道

第4回 統計学的推論としてのアブダクション

第5回 データを観る・見る・診る

第6回 情報可視化と統計グラフィクス

第7回 データのふるまいを数値化する:平均と分散

第8回 記述統計学と推測統計学:世界観のちがい

第9回 統計モデルとは何か:既知から未知へ

第10回 確率変数と確率分布:確率分布曼荼羅をたどる

第11回 正規分布帝国とその臣下たち

第12回 パラメトリック統計学の世界を眺める

必要に応じて、図表や統計言語Rを用いた計算デモを示すこともありますが、基本的に、数式を書き連ねることはないと思ってください。統計学は数学ではありませんから。

○自分自身がたどってきた研究の道を振り返ってみると

ここ農業環境技術研究所での私の本職(オモテの仕事)は生物統計学です。だからこそこの連続講座(高座)を担当する機会をいただきました。しかし、その本論に入る前に、しばらく自分語りをさせていただきます。

話はいまから20年あまり前にさかのぼります。農学系の大学院で博士号を首尾よく取ったものの、すぐに就職口のないオーバードクターとして数年間過ごしたのち、私は運よく旧農林水産省のころの農業環境技術研究所に選考採用で常勤職を得ることができました。最初に配属されたのは 「調査計画研究室」 という統計分析を専門とする研究室でした。着任してまもなく上司である室長から 「毎年開催される数理統計研修での講師をすることが室員の義務である」 と言い渡されました。統計研究という本務の他に、農水省あるいは都道府県の農林水産系研究員をつくばに集めて2週間にわたって開催される研修会で統計について講義をせよということでした。

こうして、つくばでの数理統計研修の講師を引き受けるようになってはや20年以上が過ぎました。その間、研修生から受けた質問のうち、最も多かったのが 「教わった統計手法がバラバラで相互の関連づけができない」 というものでした。本来ならば、「統計学総論」 のような講義があるべきなのでしょう。しかし、データ解析が必須であるはずの農学分野でも、統計学者の個体数は顕著に減少していました。それだけの資質をもった講師を調達することが難しかったということです。

苦肉の策として1993年の数理統計研修最終日の質疑時間にふと思い付いたのが、「統計学の世界」 を一枚の絵に描いてしまうという 「統計曼荼羅(まんだら)」 のアイデアでした。講義室のその場で質問用紙の裏側に 「曼荼羅」 を鉛筆で描きコピーして研修員に配ったのが統計曼荼羅の 「初版」 でした。意外にも大きな反響があったので、おおいに気をよくして修正加筆しながらその後の統計研修で配布し続けました。

さいわい、翌年の統計研修からはこの 「統計学概論」 という科目が設けられ、短い時間ですが、「統計」 という広大な世界について鳥瞰(ちょうかん)的な話ができる機会に恵まれました。その後、密教(タントラ)とその曼荼羅の描き方についてしばらく勉強してもみたのですが、結局最初の鉛筆書き初版の修正版をそのまま掲載することに決めました。非最節約的な書き込みを削ったり、新たな相姦関係を記入したりしたところもあります。しかし、骨格はまったく変わりありません。いまでは私のウェブサイト〈 租界〈R〉の門前にて ―― 統計言語「R」との極私的格闘記録 〉でも画像ファイルとして公開していますが()、けっこう頻繁にダウンロードされているようです。

いまもチベットに残るタントラの教えでは、本来の曼荼羅は彩色した砂で描かれるそうです。そして、タントラ修法の終了とともにその曼荼羅は壊されるべきものなのだそうです。私の 「大曼荼羅」 もまた同じ運命をたどるべきであると考えます。それは、私自身、この 「大曼荼羅」 を改良していく意志を私がもっているという意味です。しかし、できることなら、読者のみなさんが自分だけの 「マンダラ」 を描くのがベストだろうと思います。

本連載に関心を持たれたみなさんとはなにかしらの御縁があったにちがいありません。いまから始まる統計修業の間に、自分自身の手によって 「統計マンダラ」 をそのつど描かれることを私は願っています。

○統計数学との清く正しい交際法:道を踏み外さないために

これからの修行中、みなさんはいたるところで 「統計数学」 なるものに必ず遭遇します。場合によっては狼藉(ろうぜき)の限りを尽くす確率分布軍団に圧倒されたり、強烈な微積分アッパーカットを食らったりすることもあるでしょう。では、数学を 「とうの昔に忘れてしまった」(きっと)多くのみなさんは、統計修行から無慈悲にも見離されてしまうのでしょうか? たしかに、「統計イコール数学」 あるいは 「数学は統計の基礎である」 という風説が巷間(こうかん)に流れています。しかし、修行の道を踏み出されたみなさんは、そのような誤った雑念にとらわれてはいけないのです。

1. 統計学の本質は直面している問題状況である

2. 数学なんかぜんぜん怖くない

という人生の真理をぜひ会得していただきたいと心から願っています。

「どうせ俺(私)なんか、数学オンチなんだから、わかんなくってもしかたない」 なんて諦(あきら)めるのは 10年早いのです。数学はただの言葉です。言葉がわからなければ、ボディランゲージで意志疎通を図ればいいのです。えっ、統計学のボディランゲージって何って? 図と想像力ですよ。おそらくほとんどすべての統計手法は、適切な図を用いれば数式ゼロで説明でき、想像力をちょっとだけ働かせれば涙なしに理解できるはずです。数式いらずの統計学は絵空言ではないのです。受講生のみなさんは数式樹海で遭難しそうになったら、すかさず 「要するにこの数式は何が言いたいのか?」 とつぶやいてください。きっと、道が見えてくるでしょう。いったいいつから数学はにくいにくい仇役(かたきやく)になってしまったのでしょうね。数学はちょっと無愛想な友達なのです。統計修行を通じて 「愛せる数学、頼れる統計学」 を少しでも実感してみてください。

自分のデータを統計解析するとき、あるいは他人に頼まれて統計コンサルティングをするとき、ユーザーがあらゆる統計理論に通暁することは現在では不可能です。おそらくほとんどの統計ユーザーは、自らの限られた統計学の知識を酷使して問題解決にあたっているという方がむしろ事実に近いでしょう。事態をさらに悪くしているのは、統計学の世界があまりに広すぎるため、数理統計学に一生を捧(ささ)げている専門の統計学者以外、この世界のどこにどのような統計手法があるのか、それらの手法の間の相互関係はどうなっているのかについてまったく闇(やみ)の中という現実です。

とりわけ、統計学をはじめて学ぶ者にとって、いま学んでいる手法が統計界の中のどこに位置しているのかをまったく知らされないまま、数式やソフトをいじらされるというのは、教育上のみならず精神衛生上もよいはずがありません。この点で統計学ユーザーに望みたいのは、統計学の世界の鳥瞰(ちょうかん)です。できるだけ広く遠く統計学の裾野(すその)を見渡してみようということです。自分の抱えている問題解決にとって、いま使っている統計手法ははたして適切なのか、他にももっと使える方法があるのではないか−−この素朴な知的好奇心こそ、蔓延する無思考症候群を予防し、主体的かつ積極的な統計学ユーザーへの道を拓(ひら)くのです。

では、みなさんの統計修業の成功を祈りつつ、本論に入っていきましょう。

【注】

*) 三中信宏: 租界〈R〉の門前にて ―― 統計言語「R」との極私的格闘記録 (http://www.naro.affrc.go.jp/archive/niaes/minaka/R/R-top.html)。 統計曼荼羅の JPEG 画像ファイルはこのサイトからダウンロードできます。

(生態系計測研究領域 三中 信宏)

農環研ウェブ高座「農業環境のための統計学」 掲載リスト

第1回 前口上−統計学の世界を鳥瞰するために (2012年8月)

第2回 統計学のロジックとフィーリング (2012年9月)

第3回 直感的な素朴統計学からはじまる道 (2012年10月)

第4回 統計学的推論としてのアブダクション (2012年11月)

第5回 データを観る・見る・診る (2013年1月)

第6回 情報可視化と統計グラフィックス (2013年2月)

第7回 データのふるまいを数値化する:平均と分散 (2013年3月)

第8回 記述統計学と推測統計学:世界観のちがい (2013年4月)

第9回 統計モデルとは何か:既知から未知へ (2013年5月)

第10回 確率変数と確率分布:確率分布曼荼羅をたどる (2013年6月)

第11回 正規分布帝国とその臣下たち (2013年7月)

第12回 パラメトリック統計学の世界を眺める (2013年8月)

前の記事 ページの先頭へ 次の記事