近似を用いた大規模データの処理法

※アーカイブの成果情報は、発表されてから年数が経っており、情報が古くなっております。
同一分野の研究については、なるべく新しい情報を検索ください。

要約

1)近似を用い制限最尤法(REML)の推定値を得る方法を示した。
2)育種価及び母性効果の推定誤差分散を近似的に求める方法を明らかにした。

  • 担当:東北農試 畜産部 家畜育種研
  • 連絡先:0196-41-2145
  • 部会名:畜産
  • 専門:育種
  • 対象:家畜類
  • 分類:研究

背景・ねらい

家畜育種においては、誤差分散の育種価分散に対する比を正確に推定する必要がある。制限最尤法(REML)による推定値が選抜によるバイアスを受けにくいが、データが数万をこえると計算不能あるいは困難であった。本研究では簡便な近似を用いREMLの推定値を得る方法を示す。さらに大量のデータを扱う場合における育種価推定及び母性効果推定値の誤差分散を近似的に求める方法を明らかにする。

成果の内容・特徴

  • 誤差分散の育種価分散に対する比の近似について(図1)
    大規模データからランダムに大きさの異なるサンプルデータをとり、サンプルデータにおける分散の差を用いて、もとの大規模データにおける分散比を推定した。 シミュレーションにより400頭の家畜集団を作り分散比を推定した。従来のREALでは、分散比10.8、近似法では、12.7の値が得られ有効な方法であることが確認された。
  • 近似による推定誤差分散について(表1)
    従来は血縁係数行列を含んだ大規模な行列の逆行列を用いて予測誤差分散を推定したが、親子関係のみ用いて近似的にこれを求めた。シミュレーションの結果、育種価及び母性効果の推定値について従来法による推定誤差分散と近似によって得られたものの相関は各々0.70、0.88であり、この方法が実用的な近似法であることが認められた。

成果の活用面・留意点

  • 大規模データの処理が容易になる。
  • 本研究では育種価を母性効果しか取り上げていないが、より複雑なモデルに対応した近似法について研究する必要がある。 尚、この研究に用いたプログラムの提供は可能である。

具体的データ

図1 大規模データの分散比を部分データから推定

表1 従来法による推定誤差分散とその近似値の比較

その他

  • 研究課題名:肉用牛改良の効率化
  • 予算区分 :経常
  • 研究期間 :平4年度(昭63~平4年)
  • 発表論文等:1)Approximate prediction error variance with additive and maternal effect under animal model
                         家畜育種研究会報、NO1、1992。
                      2)Approximate of trace in restricted maximum likelihood estimation
                         日蓄会報、64巻3号、1993。