プレスリリース
(研究成果) AIによる温州みかん糖度予測手法を開発

- 早期予測を生産・出荷に活用し収益向上をめざす -

情報公開日:2020年3月 6日 (金曜日)

ポイント

農研機構は、温州みかんを対象に、前年までに蓄積された糖度データと気象データから、AI(人工知能)による機械学習1)を用いて当年の糖度を予測する手法を開発しました。本手法を用いることで、出荷時の平均糖度を7月ごろから地区を単位として高精度に予測できます。本手法により、適切な栽培管理が可能となり温州みかんの品質の向上に役立つと期待されます。

概要

高品質な温州みかんを生産するためには、摘果や水管理、施肥など様々な管理が必要です。このため、その年の糖度をできるだけ早い時期に予測できれば、これらを適切に行うのに大きく役立ちます。しかし、これまでに提案されている予測手法では十分な精度が得られないため、正確な手法の開発が望まれていました。そこで農研機構では、JAながさき西海(さいかい)、長崎県と協力し、AIを利用した温州みかんの新しい糖度予測手法を開発しました。
開発した方法は、機械学習の技術を用いて、出荷時の果実の糖度2)を、地区(数~数十の果樹園を地域的にまとめたグループ)を単位として品種・系統別に予測するもので、前年の出荷時の糖度と当年の気象予報データ(気温、降水量、日射量、日照時間)を使用します。
長崎県のJAながさき西海の協力により提供された14の地区(JA支部)における出荷時糖度データ(2009~2019年)を利用し本手法の検証を行いました。まず、実際の気象値を用いて2016~2019年の糖度を予測したところ、予測誤差は0.47度(平均二乗平方根誤差3))と高い成績が得られました。そして、実用上重要な、気象の予報値を用いた予測では、7月20日時点の予報データ4)で予測誤差0.61度の成績が得られ、実用上十分な精度と確認されました。

関連情報

予算 : 農林水産省「スマート農業技術の開発・実証プロジェクト(課題番号:果H09、課題名:温州みかんの生産から出荷をデータ駆動でつなぐスマート農業技術一貫体系の実証)」(事業主体:国立研究開発法人農業・食品産業技術総合研究機構)、運営費交付金

問い合わせ先
研究推進責任者 :
農研機構農業情報研究センター センター長 本島 邦明
研究担当者 :
同 農業AI研究推進室 森岡 涼子
同 副センター長 大野 宏之
広報担当者 :
同 連携企画室 大久保 さゆり

詳細情報

背景と経緯

高品質な温州みかんを生産する産地では、出荷品質の安定をはかる目的から、収穫された果実の糖度や酸度が光センサーにより出荷時に全数検査され、膨大なデータが蓄積しています。このデータを有効に活用し、収穫前の早い時期から当該年の糖度や酸度の傾向を予測できれば、果樹への乾燥ストレス5)付与や粗摘果、植物調整剤の施用などの、高糖度が条件となるブランド果実の割合を高めるために必要な管理に反映できます。
一般に、温州みかんの糖度は10~13度程度なので、予測手法の精度としては誤差0.5度(二乗平均平方根誤差)程度以下が望まれます。これまで、糖度予測手法として気象データを説明変数とした重回帰で推定するものや、生育初期の糖度と出荷時の糖度との相関から推定するものなどが提案されていましたが、いずれも誤差は1程度であり、より正確な予測手法が求められていました。
そこで農研機構では、温州みかんの主要産地の一つであるJAながさき西海、長崎県と協力して、AIを利用した新しい糖度予測手法を開発しました。

研究の内容・意義

  • 開発した手法は、出荷時の全数検査で得られた前年の糖度と当年の気象データ(気温、降水量、日射量、日照時間)を入力データとし、当年の糖度を出力データとして予測するものです(図1a)。両者の関係は、予測の前年までに蓄積されたデータを機械学習して求めます(図1b)。
  • 学習用データの選択により、品種や、早生など熟期別の品種・系統ごとの予測が可能です。
  • 予測する糖度は、数~数十の果樹園を地域的にまとめた地区の平均値です。
  • 長崎県のJAながさき西海の支部を地区とみなし、14の支部が保有する、2009年~2019年の糖度の出荷時検査結果で本手法を検証しました。地区のグループごと、品種・系統ごとに2016年~2019年産温州みかんの出荷時の糖度を予測し測定値と比較した結果、予測値と測定値はよく一致し、予測全体の二乗平均平方根誤差は0.47度、誤差の最小値、最大値はそれぞれ-0.87度、+1.12度と、高い精度が得られました(図2左)。
  • 糖度を上げるための果樹への乾燥ストレス付与は、品種にもよりますが概ね7月頃に開始されるので、この時点で出荷時の糖度が予測できれば、ストレスの強度や付与時期を調節することで、高糖度果実の生産が可能になります。そこで、一例として7月20日の時点で得られる気象予測データで同様の予測を行いました。その結果、予測誤差はある程度増加しますが、それでも、全体の二乗平均平方根誤差は0.61度、最小値、最大値はそれぞれ-1.43度、+1.53度と実用的な精度であることが確かめられました(図2右)。
  • 予測の誤差は、予報する期間が長い(早くから予測する)ほど大きく、短い(収穫日に近い)ほど小さくなります。
  • 本手法では、年ごとに取得される出荷時の果実データを逐次学習データに追加するので、今後、精度の向上が期待できるほか、温暖化の影響や管理技術の変遷も学習し精度を保つことが期待できます。
  • 生育途中の果実の糖度を期日を定めて測定している産地では、その期日の糖度を本手法で予測することも可能です。

今後の予定・期待

収穫前に糖度が予測できると、収穫作業、販売、出荷の計画に利用できます。また、予測された糖度によって、糖度を上げるための栽培管理の要否を判断することもできるので、この技術の実用化によって、これまで以上にみかんの品質の向上と生産安定を図る管理に活用できるものと期待されます。
今後、この予測手法をシステム化し、産地が栽培に活用できるようにして、高品質のみかん生産、生産者の収益向上を目指します。

用語の解説

機械学習
機械学習は、AIの1つの要素技術で、データからパターンやルールを発見したり推測したりする技術です。そして、発見したり推測したりしたパターンやルールに基づいて、事物の識別や予測に利用できます。
出荷時の果実の糖度
収穫された温州みかんは、選果場に集められ、出荷される前に傷などのある果実の選別や、果実の糖度、酸度や大きさを測定して等階級ごとに分けられます。この過程を選果といいます。本資料では、この時点の糖度を「出荷時の糖度」としています。
二乗平均平方根誤差
予測した値と実際の値の差の大きさを示す指標のひとつです。予測値と測定値の差を二乗した値をサンプルにわたって和をとり、最後にそれの平方根をとることで得られる数値です。誤差の大きさを元のデータと同じ単位で評価できます。英語の頭文字をとってRMSEと略記されることもあります。
7月20日の時点で得られる気象予測データ
7月20日時点の予測に利用した気象データは、7月19日までの実況値(アメダス等の実測値から推定した値)、7月20日から8月15日までの予報値、8月16日以降収穫日までの平年値を連結した気象データです。ただし、気温、降水量、日射量、日照時間のうち、日射量と日照時間データについては、7月19日までの実況値と7月20日以降の平年値を連結したものを用いました。このデータは、農研機構メッシュ農業気象データシステムから取得することができます。
乾燥ストレス
作物が水分を十分に吸収できない状態にあることを乾燥ストレスといいます。温州みかんなどの柑橘類は、果実が肥大する時期(夏、秋頃)に乾燥ストレスを受けると果実の糖度が上昇する性質を持っています。このため、ミカンの糖度を上昇させることを目的に、農業用マルチシートで圃場を覆い雨水の浸透を遮断することで、みかんに乾燥ストレスを与えることがあります。

参考図

図1 機械学習により温州みかんの糖度を予測する方法(a:予測の方法、b:学習の方法)
本手法では、ある年(当年)の出荷時の糖度を、その年(当年)の気象データとその1年前(前年)の糖度の測定値から予測します(a)。気象データに予報を用いることで、収穫よりも早い時期に糖度を予測できます。
予測に用いるAIは、予測の前年までに得られたデータを学習データとする機械学習により導きます。例えば、2019年の出荷時の糖度を予測する場合、まず、暫定的なAIを作り2018年までの糖度を予測して、それを測定値と比較し予測誤差を年ごとに計算します。次に、これらの誤差がより小さくなるようAIを修正して再び糖度を予測し誤差を求めます。この操作をコンピューターに繰り返し実行させて、学習データを適切に説明するAIを導きます(b)。このような方法を機械学習と呼びます。
本手法において、機械学習は、品種・系統ごと、地区ごとに行います。

図2 本手法で予測した出荷時糖度の予測誤差のヒストグラム(2016~2019年産)
2016年~2019年にJAながさき西海から出荷された温州みかんの糖度を予測し、その誤差をヒストグラムに表しました(左:収穫日時点の気象データ(全期間が観測値)を用いて糖度を予測した場合の誤差分布、右:7月20日時点の気象データ(7月19日までは観測値、7月20日以降は予報値)を用いて糖度を予測した場合の誤差分布)。