前の記事 | 目次 | 研究所 | 次の記事 2000年5月からの訪問者数(画像)
農業と環境 No.149 (2012年9月1日)
独立行政法人農業環境技術研究所

農環研ウェブ高座 「農業環境のための統計学」 第2回 「統計学のロジックとフィーリング」

確率論や統計学をまったく知らなくても、私たち人間は実は日常生活を営む上で必ず確率的・統計的な推論を行なっています。統計学もまた、人間が外界を観察したときに気づいたデータの変動から結論にいたる推論をするための道具として整備されてきました。

「統計学」と聞くと、多くの学生はいやな数式やらめんどうな計算やらを条件反射的に思い出してしまいます。けれども、統計学の核は「統計」ではなく、むしろ「対象」にあります。みなさんが日常的に取り組んでいるさまざまな対象がまずはじめにあるわけです。統計とはこれらの対象に関する問題から発する推論を行なう道具を提供します。ですから、生物学畑の統計ユーザーにとって必要なのは、どのような統計手法が自分にとって道具となり得るのか(なり得ないのか)、そしてユーザーが選んだ統計手法をどこまで責任をもって使いこなせるのか、という問題意識であると私は考えます。

以下では導入として、統計学の基本となる統計学的なものの考え方を説明しましょう。まずはじめに、統計学的な解析の対象となる「変量」とその記述方法について理解する必要があります。自然現象を反映する数値データは、ある確率をともなってばらつく「変量(variate)」と呼ばれます。この変量を対象としてデータ解析・推定・検定・予測そして意思決定をおこなう学問が統計学です。

ものごとの因果関係が必ずしも明らかではないあいまいな状況のもとで、変量に関する限られた知見に基づいて、ある仮説の是非を判定することは日常生活では頻繁に生じます。私たち人間はそういう不確定状況での推論能力(素朴な確率論・統計学)をもちあわせています。

しかし、人間がもつ素朴な確率統計の感覚的認知は必ずしもつねに妥当であるとはいえません。場合によっては、あるバイアスがかかった確率統計的認知を行ない、結論を誤ることもあるでしょう。ですから、必ずしも無謬(むびゅう)ではない発見的思考法としての素朴確率統計認知が人間にもともと備わっていることを前提として、統計学の合理的な利用法を考える必要があります。統計学の理論を長らく支えてきたのは、人間が行なう直感的判断への健全な懐疑心−すなわち経験主義の哲学−にほかなりません。直感にたよっているかぎり、統計理論の出る幕はないのです。しかし、人間は実際に誤りを犯すことのある生き物であるからこそ、どれくらい確率統計的判断を誤るのか、その誤りを事前に防ぐにはどうすればよいのかという問題意識を統計学は持ち続けてきました。

数理統計学という数学の一分野は、統計ユーザーにとっては手ごわい相手と一般にみなされています。その理由はおそらく変量の誤差構造の定量的分析という一見わかりにくいものの考え方にあるのかもしれません。ある変量がどのような確率で値を生じるかという確率分布のモデル化を研究したドイツの数学者フリードリッヒ・ガウス(Friedrich Gauss)は、誤差のばらつきを表現するために「正規分布(normal distribution)」という関数を開発しました。この正規分布という確率分布は、現在もなお数理統計学の定礎の地位を保ち続けています。確かに、正規分布を前提とする数理統計学の理論体系は、推定と検定のためのさまざまなモデルと道具を統計学者に提供してきました。その貢献は正しく評価する必要があるでしょう。

しかし、正規分布の定礎の上にそびえ立つ理論の城を見上げる多くの統計ユーザーは、数理統計学を学ぶためには正規分布に基づく理論体系を会得することが城門の通過儀礼として求められていると思い込み、そして悩み続けています。その悩みのある部分は、学習者の初等的な数学的能力の欠如に起因するのですが、別の部分ははたして正規分布に基づく数理統計学が個々の対象にどれほど通用するのかという疑念に起因しています。統計学を実践するには「正規分布を学べ」というスローガンだけでは学習者の心理的動機づけとしては不十分なのです。

今日では、機能的にも操作的にもすぐれた多くの統計解析ソフトウェアが高速のパーソナル・コンピューター上で比較的容易に利用できるようになりました。大量の統計計算そのものに苦労したかつての時代とは彼我の感があります。しかし、ハードウェアとソフトウェアの進歩の恩恵を受け、統計計算の負担から解放された今日の統計学ユーザーには次なる陥穽(かんせい)が待ちかまえています。それは、得られたデータを手近にある適当な統計解析プログラムに無思慮に投げ込んでそれで満足してしまうという現代ならではの症候群です。

いったん開発された統計学の手法は、数学的に磨き上げればごく一般的な数理統計学の理論となります。数学的に洗練されてしまうと、データの形式さえ適合しているかぎり、どんな統計的手法でも適用できます。たとえ、その手法の前提条件が満たされていなかったとしても、統計計算はつつがなく完了し、計算結果はきれいに出力され、ユーザーはその出力をみて満足してしまう−−残念なことに、この症候群はしだいに蔓延(まんえん)しつつあるようです。

しかし、ある統計的手法の適用が妥当であるかどうかは、数学的にではなく、むしろ現場的に判断されるべきです。そのためには、ある統計理論が生まれ出てきた生物学的ルーツこそ学ぶべきでしょう。そのときはじめてある統計的手法の適用限界がわかるからです。その手法がどのような問題状況のもとで生み出されてきたのかを知ったあとで、現代的に洗練された数学理論と格闘しようと決心しても、あるいは使用する統計解析プログラムのマニュアルをひもといても、けっして遅くはないはずです。

三中 信宏(生態系計測研究領域)

農環研ウェブ高座「農業環境のための統計学」 掲載リスト

第1回 前口上−統計学の世界を鳥瞰するために (2012年8月)

第2回 統計学のロジックとフィーリング (2012年9月)

第3回 直感的な素朴統計学からはじまる道 (2012年10月)

第4回 統計学的推論としてのアブダクション (2012年11月)

第5回 データを観る・見る・診る (2013年1月)

第6回 情報可視化と統計グラフィックス (2013年2月)

第7回 データのふるまいを数値化する:平均と分散 (2013年3月)

第8回 記述統計学と推測統計学:世界観のちがい (2013年4月)

第9回 統計モデルとは何か:既知から未知へ (2013年5月)

第10回 確率変数と確率分布:確率分布曼荼羅をたどる (2013年6月)

第11回 正規分布帝国とその臣下たち (2013年7月)

第12回 パラメトリック統計学の世界を眺める (2013年8月)

前の記事 ページの先頭へ 次の記事