予測誤差を小さくするための並列型モデル合成法

［要約］

幾つかの方法で作成されたモデルが与える推定値から１つを採用する際に、推定値を必要とする予測変数の値における予測誤差の絶対値が最も小さくなる推定値を選ぶ。これによって、単独のモデルを用いる場合に比べて予測誤差が小さい推定値が得られる。

［キーワード］ノンパラメトリック回帰、モデル選択、モデル合成、予測

［担当］中央農研・農業情報研究部・生産支援システム開発チーム、明治大学・理工学部
［連絡先］電話 029-838-8975
［区分］関東東海北陸農業・情報研究、共通基盤・情報研究
［分類］科学・参考

［背景・ねらい］

　これまでのモデル選択は、同じデータを用いて複数のモデルを作成し、何らかのモデル選択基準を利用してその中の１つを採用するものである。しかし、予測変数の値によって採用すべきモデルが異なることもあり得る。目的変数の振る舞いが予測変数の領域によって多様に変化する場合には、それぞれのモデルが得意とする領域があると見なされるからである。この見方を生かしたアルゴリズムをノンパラメトリック回帰に応用すれば、従来のものよりも予測誤差が小さい推定値を与えるモデルが実現することが期待できる。

［成果の内容・特徴］

１．並列型モデル合成法のアルゴリズムの基本的な形態は図1である。

２．並列型モデル合成法の実行例として、「青果市況データベース」NAPASS(Nationwide Agricultural Products Analysis Support System)から取り出した東京都太田市場のだいこんのデータを利用する。

３．並列型モデル合成の機能を調べるために用いたデータは、表1に示した３種類である。それぞれのデータは、９つの予測変数（曜日、旬、入荷量など）と１つの目的変数（当日の価格）からなっている。

４．モデル作製手法として用いたのは、CART（樹形モデル）、MARS(Multivariate Adaptive Regression Splines)、TreeNet、ニューラルネットワーク（バックプロパゲーションを用いたもの）の４つである。

5 ．予測誤差の２乗和を比較した結果が表2と表３である。ここで、「単独モデル」とは、それぞれのモデル作製手法を単独に用いた場合である。「合成モデル」とは、{Mq}を得るための手法として(4)で示した４つの方法を用い、{Pq}を得るための手法としてCARTを用いた場合である。並列型モデル合成法によって予測誤差が減少していることが分かる。

［成果の活用面・留意点］

１．それぞれのモデル（図1の{Mq}のそれぞれ）を作製する手法としていろいろなものを利用することができる。

２．それぞれのモデル（図1の{Pq}のそれぞれ）として、他のデータを使って作製された既製のモデルを利用することも考えられる。

３．並列型モデル合成法には様々な発展的な形態が考えられるので、それらを比較して選択すると更に優れた予測が可能になる。

［具体的データ］

［その他］

研究課題名：モデル作成のための対話型プログラムの開発
課題ID: 03-04-05-01-07-03
予算区分：交付金
研究期間：2001～2003年度
研究担当者：竹澤邦夫、南石晃明、橋本大輔（明治大学）、大滝　厚（明治大学）
発表論文等：
1)橋本・竹澤・南石・大滝　厚(2003) 品質管理学会第33回年次大会. 予稿集71-74ページ.
2)特許出願　特願2003-372638, 2003年10月31日

目次へ戻る