プレスリリース
(研究成果) バイオとデジタルの融合でイネの収量や品質を予測

- ゲノム選抜AIがイネ育種を変える -

情報公開日:2021年1月 8日 (金曜日)

ポイント

農研機構は、イネ育種事業で蓄積した大量の形質1)データに加え、多数の品種・系統2)ゲノム3)情報を取得し、イネの大規模な統合的データベースを整備しました。このデータの一部を利用して、ゲノム情報から形質を予測する「ゲノム選抜AI4)」を構築し、収量(精玄米重5))や玄米品質などを正確に予測できることを明らかにしました。「ゲノム選抜AI」は良食味・高品質と高い収量性を兼ね備えたイネ品種の育成の加速化・効率化に役立つと期待されます。

概要

農研機構は「Society5.0 農業・食品版6)」の実現のため、スマート育種7)システムの開発と、それを活用した品種育成を目指して研究を進めています。その一環として、今回、保有するイネの膨大な形質データや、多数の品種・系統のゲノム情報を統合したイネのデータベースを整備しました。さらに、このデータの一部を用いて、ゲノム情報から形質を予測する「ゲノム選抜AI」を構築しました。本技術を用いることにより、ゲノム情報から収量(精玄米重)、玄米品質等の重要形質を高い精度で予測することに成功しました。
近年、イネの品種改良では、ゲノム情報の違いから形質を予測し個体を選抜する手法(DNAマーカー選抜8))の利用が進んでいます。しかし、この方法が適用できるのは耐病性などの、関わる遺伝子が少数の形質に限られています。収量性など農業上重要な形質の多くには多数の遺伝子が複雑に関わっており、DNAマーカー選抜が利用できませんでした。本成果により、従来は予測による選抜が困難であった、多数の遺伝子が関わる形質についても、蓄積した膨大なデータを活用しゲノム情報に基づく選抜を実施することで、育種に必要な水田と労力を削減し、期間を短くできる可能性が示されました。
「ゲノム選抜AI」の活用により、食味がよく高品質な日本型の品種と、収量の多いインド型の品種から、両者の長所を兼ね備えた品種を育成するなど、イネの品種改良の加速化・効率化が期待されます。

関連情報

予算:運営費交付金

問い合わせ先
研究推進責任者 :
農研機構農業情報研究センター センター長 本島 邦明
研究担当者 :
同 農業AI研究推進室 上級研究員 松下 景 (兼 次世代作物開発研究センター)
同 農業AI研究推進室 主席研究員 米丸 淳一 (兼 次世代作物開発研究センター)
同 農業AI研究推進室 林 武司 (元次世代作物開発研究センター ユニット長)
同 農業AI研究推進室 主任研究員 鐘ヶ江 弘美
広報担当者 :
同 連携企画室 大久保 さゆり

詳細情報

背景

農研機構は「Society5.0 農業・食品版」の実現のため、AI(人工知能)9)等の先端技術を取り入れたスマート育種システムの開発と、それを活用した品種育成を目指して研究を進めています。スマート育種の大きな目的の一つは、育種の効率化です。国際競争力の強化、また、激しさを増す気候変動に対応するため、今まで以上に品種開発の加速とそのための効率化が必要です。
イネをはじめとする穀物の育種(図1)では、両親となる品種の交配から多くの系統(品種の候補)を養成し、その中から複数年にわたる長い時間をかけて、最も優秀な系統に絞り込んでいきます。選抜のための調査項目は早晩性、収量性、品質関連、耐病虫性など多岐に渡りますが、選抜の初期においては多数の系統を扱うため、高精度な調査は困難である場合も多く、収量性や食味などは、選抜がある程度進んだ段階でしか調査できません。また選抜作業を行う担当者には長年の経験が必要とされています。さらに、多数の系統を大面積の水田においてミスなく栽培管理していく作業には大きな労力が求められます。このため、多くの系統から優秀な特性を備えたものを効率的に選抜する手法の確立が求められています。

経緯

近年、イネの品種改良では、ゲノム情報の違いから形質を予測し個体を選抜する手法(DNAマーカー選抜)の利用が進んでいます。しかし、この方法が適用できるのは耐病性などの、関わる遺伝子が少数の形質に限られています。収量性など農業上重要な形質の多くには多数の遺伝子が複雑に関わっているため、DNAマーカー選抜が利用できませんでした。一方、家畜やトウモロコシ、林木の育種分野においては、新たな選抜手法であるゲノム選抜法10)が注目され、実用化が進んでいます。ゲノム情報のごく一部しか利用しない従来のDNAマーカー選抜とは異なり、ゲノム選抜法では、品種・系統ごとの形質の違いとゲノム全体との関係を統計的に学習した予測モデルを作成することで、育成途中の品種候補についてもゲノム情報のみで形質の値や程度を予測することができます。そこで本研究ではゲノム選抜法のイネ育種への応用を目指し、農研機構における過去の育種過程で蓄積された膨大な形質データを活用して、ゲノム情報から形質を予測する「ゲノム選抜AI」を構築し、その有効性を検証しました。

研究の内容・意義

  • 「ゲノム選抜AI」の構築に必要な形質データおよびゲノムデータをデータベース化しました。農研機構でイネ育種を行っている6つの研究センターにおいて、過去22年間に育成した668品種・系統を対象に、1991年以降に調査した、品種・系統あたり平均約9回の試験データを収集しました。対象形質は、出穂期、成熟期、稈長、穂長、穂数、全重、収量(精玄米重)、玄米千粒重、玄米品質、食味としました。
  • 農研機構AI研究用スーパーコンピュータ「紫峰」を利用し、2020年度内の完了を目指して、形質データの得られた品種・系統の全ゲノム 塩基配列解析を実施しています。これまでに750品種・系統程度の解析が終了し、最終的には900品種・系統以上の全ゲノム塩基配列が整備される予定です。
  • このうち、次世代作物開発研究センター(作物研/茨城県つくばみらい市)における試験で得られた129品種・系統の形質データと、ゲノムデータから得られた一塩基多型 (SNP)11) 約4万箇所のデータを用いて、統計モデルの一つであるゲノミックBLUP法12)により「ゲノム選抜AI」を構築しました(図2)。
  • 「ゲノム選抜AI」による予測値と実測値を比較したところ、多くの形質について高い精度(相関)を得ることができ、特に穂長、穂数、精玄米重、玄米品質を精度よく予測できました(実測値と予測値との相関係数13)0.7以上)(表1)。
  • 過去の育種で記録された既存の品種・系統のデータをもとに構築した「ゲノム選抜AI」によって、育種に必要な水田と労力を削減し、期間を短くできる可能性が示されました(図1)。

今後の予定・期待

  • 今後は農研機構内の全ての研究センターのデータを用いて「ゲノム選抜AI」の構築に取り組むと同時に、形質データの収集を継続する予定です。
  • 苗の段階で得られるゲノム情報から形質を予測できるため、人工気象室などを利用した季節を問わない選抜手法の開発に取り組み、手間と時間を節約できる効率的な育種法を確立することを目指します。具体的には、交配から品種育成に至るまでの期間を2年程度短くすることが期待できます。
  • 「ゲノム選抜AI」を用いた選抜が実用化すれば、遠縁で形質の違いが大きいため従来は難しかった、インド型品種と日本型品種の優れる点を併せ持つ品種の育成を加速化できると期待できます。
  • さらにその先には、目標となる品種が持つべき形質を実現するゲノムを人工知能がデザインし、それに基づいて交配親を選定して育種を行う「データ駆動型作物デザイン」の実現を目指します。

用語の解説

形質
身長や体重、血液型などの生物の特性を形質と呼びます。コメの単位面積当たり収穫量(収量)や果実の糖度などは農業的に重要な形質です。
品種・系統
例えば「コシヒカリ」の種子は、全て「コシヒカリ」のゲノムをもち、どれを植えても「コシヒカリ」の形質を示します。このように共通のゲノムをもち、他と区別できる形質を示す集団のうち、種苗法による登録が行われたものを「登録品種」とよび、一般に栽培されている在来種、品種登録されたことがないもの、品種登録期間が切れたものを「一般品種」と呼びます。一方、「系統」とは、研究素材や品種登録前の育種素材を指します。
ゲノム
個体を特徴づける遺伝情報の総体をゲノムと呼びます。遺伝情報はDNAの構成要素である塩基の配列として記述されているため、塩基配列の全体をゲノムとみなすことができます。
ゲノム選抜AI
農研機構が開発したゲノム選抜システム。ゲノミックBLUP法によって、ゲノム情報が利用できる個体については、目的の形質の値を予測することができます。
精玄米重
一定の面積から収穫した玄米を粒の厚さで選別し、商品にならない粒の薄い米を除いた後の重量のこと。単位面積あたりの売れる米の収穫量。
Society5.0 農業・食品版
フィジカル(現実)空間とサイバー(仮想)空間を高度に融合することで農業・食品産業に高い価値を創造すること。農研機構はその実現により、我が国の将来像の実現と成長戦略へ貢献することを目指します。
https://www.naro.affrc.go.jp/project/socierty5-sdgs/about.html
スマート育種
情報解析技術の発展により多量のデータ解析が可能となったことから、遺伝子型、栽培環境、生育特性など育種に関する大規模なデータに基づいた育種選抜が行えるようになりました。データ取得および解析に関する種々の技術に加え、遺伝的な変異の拡大と効率的な選抜、さらには品種の迅速な作出を図るための新たな技術を融合した育種の仕組みをスマート育種と呼びます。
DNAマーカー選抜育種
イネの品種間には、DNAの塩基配列に少しずつ違いがあります。この違いを目印(マーカー)とすることで、交雑育種で得られた数多くの個体の中から目的の遺伝子を持つ個体を選抜することができます。この方法を用いて行う育種をDNAマーカー選抜育種といいます。
AI(人工知能)
人間の知能をコンピュータで模倣したシステムをAI(人工知能)と呼び、学習、推測、判断などの機能を備えています。AIはデータをもとに推測のルールを学習し、分類や予測と言った判断を下すように作動します。データが多いほど正しい推測ルールを習得し、正確な判断を下すAIが構築できます。
ゲノム選抜法
ゲノム情報にもとづいて優良と期待される個体を選抜する方法であり、通常はSNPと呼ばれる塩基配列上の一つの塩基の違いを多数用いてその個体が潜在的に有する形質をゲノム情報から予測し、望ましいと期待される個体を選抜することになります。
一塩基多型(SNP)
同一種内の個体間や品種間でゲノムを構成するDNAの塩基配列に違いがあることを多型と呼びます。特に一個の塩基が異なる多型が一塩基多型で、その英語名(Single Nucleotide Polymorphism)を略してSNPと呼ばれています。
ゲノミックBLUP法(Best Linear Unbiased Prediction, BLUP)
個体間の血縁の程度を考慮して、形質に関する個体の遺伝的能力を高い精度で予測する方法はBLUP法と呼ばれ、乳牛の個体選抜で広く使われています。BLUP法は遺伝的能力の類似性が血縁の近さに関連していることを利用した方法ですが、特にゲノム情報に基づいて評価された血縁の程度を利用するBLUP法をゲノミックBLUP法と呼びます。
相関係数
身長と体重のように2つの量の関係性の強さを示す数量で-1と1の間の値を取ります。相関係数が0に近い場合は2つの量の独立性が高く、相関係数が1に近づくにつれて同じ傾向の変動を、また-1に近づくにつれて逆の傾向の変動を示すことになります。予測値と実測値の相関係数が1に近い場合には、予測値が実測値に近い値となり、実際の測定をしなくても予測値によっておおよその値を知ることが可能となります。

発表論文

なし

参考図

図1.育種プロセスの概要
イネの育種は交配から始まり、世代促進(無選抜での世代交代と種子増殖)、選抜(個体選抜および系統選抜)、生産力検定(農家の水田に近い条件での詳細な試験)を経て、新品種に至るまで10年程度の時間が必要です。「ゲノム選抜AI」の利用により、選抜に必要な水田と労力を削減し、交配から選抜にかかる期間を2年程度短縮することが期待できます。
図2.ゲノム選抜AIの概要
ゲノム情報はイネの茎葉から得ることができるので、まだ苗のうちにデータが取得できます。「ゲノム選抜AI」はゲノム情報を入力として受け取り、形質予測値を出力します。
表1.構築した「ゲノム選抜AI」の精度