DNA塩基置換確率の新しい推定法
- [要 約]
- 種のDNA塩基配列データを,無作為抽出した複数の系統樹上で最節約復元することにより,枝ごとの塩基置換確率の値を推定する方法を開発し,
モンテカルロ・シミュレーションを用いてその実用性を示した。
農業環境技術研究所 環境管理部 計測情報科 調査計画研究室
[部会名]環境評価・管理
[専 門]情報処理
[対 象]
[分 類]研究
- [背景・ねらい]
- 生物多様性を理解するための基礎として生物分類体系は構築される。近年,急速に蓄積されてきた核酸やタンパク質の分子配列データに基づく分子系統学が分
類体系の作成や生物資源・遺伝資源の評価に用いられるようになってきた。大量の分子データの解析にはいまだ未解決の統計学的・数学的問題点が残されてい
る。本課題では,その一つである分子配列データの変異性の定量的評価方法の開発を行なった。核酸塩基やタンパク質アミノ酸の置換頻度の推定値
は,系統分類を行なう上でデータの重み付けに反映されなければならない。変異しやすい配列は推定上のノイズとなりやすいのに対し,変異しにくい配列はより
信頼できる情報を与えるからである。しかし,これまでは形質データの客観的な重み付けの方法は開発されていなかった。
- [成果の内容・特徴]
- 対象生物のDNA塩基配列をデータとするとき,系統樹の樹形を与えて,分岐点の共通祖先の形質状態を復元するアルゴリズムを開発した。このアルゴリズムは,
塩基置換の回数が最小になるような祖先形質状態の最節約復元推定値を与える(図1)。このとき,与えられた系統樹のもとでの塩基
置換の推定値が得られる。
- 塩基配列の変異性の大小は系統推定に先だって評価されねばならない。そこで,系統樹の樹形の全体集合から無作為に系統樹を抽出し,その
上で1に示した手続きで塩基置換回数の最節約復元推定値を計算する。この操作を複数回実行し,全置換数を集計すれば,データ塩基配列から期待される変異確
率が計算できる。従来のやり方(対比較法)では,配列対ごとに変異数を計算していた。
- 2の方法(無作為系統樹法)が従来の方法と比較してどの程度すぐれているのかを調べるために,モンテカルロ・シミュレーションを行 なった,あるモデル
系統樹の根に無作為に塩基を与え,ある置換確率(αとする)のとで仮想進化させ,末端種の塩基を得る。これを500回反復し,塩基数 500の末端種配列を得た
(図2)。次に,この末端配列から無作為系統樹法および従来の対比較法によって推定されたαの推定値を比較したところ,最節約
推定値の法が従来法に比べて真の値に近いことがわかった。これにより,無作為系統樹の方がより優れていることが示唆された(図3)。
- ヤマアリ類13種について,ミトコンドリアにあるチトクローム酸化酵素遺伝子の塩基配列に基づいて,各コドン位置の塩基置換確率を本研究の無作為系統樹法
によって推定した(図4)。
- [成果の活用面・留意点]
- 今回開発した方法は,与えられた塩基配列データのみから遺伝子ごとあるいはコドン位置ごとに変異率を推定することができる。
- 本方法は,上例の他に,単細胞円石藻類・イネや果樹の病原菌・ツグミ類など多くの生物群の分子系統解析において実際に利用されている。

[その他]
研究課題名:生物系統分類のための数量的方法の開発
予算区分 :経常
研究期間 :平成9年度(平成6〜9年)
協力・分担:国立環境研究所
発表論文等:1)三中信宏:『生物系統学』(東京大学出版会)(1997)
2)Minaka, N. : Most parsimonious reconstructions of internal node states
of a phylogenetic tree. Fifth Conference of the International Federation
of Classification Societies, (1996)
3)三中信宏:分岐分類学に基づく形質進化の最節約復元,種生物学研究,19,
37-47, (1995)
目次へ戻る