社会的背景
農作物の安全性確保や高品質化のためには、農作物に関するデータが生産から消費に至るフードチェーン4)全体で共有されると同時に、そのデータを統合的に解析できる環境が求められています。農作物は、植物(例;"ダイズ")、作物(例;"エダマメ")、商品(例;"枝付きエダマメ")のようにフードチェーンの段階によって、データを表す名称(以下、データ名)が異なることがあります。また、ひとつのフードチェーンの段階でも、農作物データを管理する組織によってデータの名称が異なることもあります(例;"エンドウ"、"エンドウマメ")。さらに、グローバルな農作物流通の場合は、農作物データが日本語以外の言語で管理されます。このように、データが様々な農作物名で管理されていると、コンピュータが農作物の履歴をデータ名でたどることは容易ではありません。農作物データの連携には、情報の基準として農作物の名称を定義する語彙体系(例;"エンドウ"、"エンドウマメ"を同じ意味と定義)を構築して、それをコンピュータから利用できるようにする必要があります。
開発の経緯
これまで、農作物名を整理した冊子体は発行されていたものの、複数のコンピュータから利用することは考慮されていませんでした。また、栽培時の「農薬使用基準(農薬登録における適用作物名、農林水産省が管轄)」と、人が摂取しても安全と評価された「残留農薬基準(食品残留農薬基準における食品名、厚生労働省が管轄)」は相互に関連しているにもかかわらず、データ名が統一されていないため、2種類の農薬基準データの連携は困難でした。そこで、NAROとNIIはコンピュータ処理が可能な「農作物語彙体系(Crop Vocabulary 、CVO)」を、2種類の農薬基準データの連携を主目的に、対象を生産者から卸売り業者までのフードチェーンの上流として共同で構築することとなりました。
農作物語彙体系の特徴
農作物語彙体系は2種類の農薬基準データに含まれる1,249の農作物を、作物名(以下、CVO農作物名)、別名、英名、学名等で表したもので、コンピュータから扱うことが可能です。農作物語彙体系は、「ITシステムで用いる農作物の名称に関する個別ガイドライン(内閣官房)」で優先使用が推奨された農作物名(以下、ガイドライン農作物名)、2種類の農薬基準のデータ名、国際的農業標準語彙であるAGROVOC(国際連合食糧農業機関 http://aims.fao.org/vest-registry/vocabularies/agrovoc)、及び生物分類データベースNCBI Taxonomy5)等と連携しています。これらは、農作物語彙体系の公開ページで確認でき、データのダウンロードも可能です(http://www.cavoc.org/cvo/)。
農作物語彙体系に基づく開発サービスの特徴
【農作物名称サーチ】
( http://cavoc.org/cvo/application/CropNameSearch/)
開発した農作物名称サーチは、農作物語彙体系を農作物名(図1"きゅうり")とその同義語("キュウリ")で部分一致検索し、該当するCVO農作物名、「農薬使用基準」、「残留農薬基準」情報等を表示するものです。農作物名称サーチを利用することで、農作物によっては、1.農薬基準のデータ名が収穫部位(図2"キュウリ(葉)")、生育ステージ(例"未成熟スイカ")、用途(例"食用ギク")で異なること、2.「農薬使用基準」と「残留農薬基準」のデータ名が異なること(図1 "きゅうり(葉)"、"きゅうりの葉・花")が確認でき、3.連携するCVO農薬使用基準ページにより「農薬使用基準」データ名の意味を明確にできます(図3) 「農薬使用基準」では"トマト"を3cmより大きいと定義)。収穫部位等で農薬基準が複数設定された農作物や2種類の農薬基準のデータ名が異なる農作物を簡単に確認できるため、農薬基準情報の正確かつ効率的収集の一助となります。
【農作物語彙体系にリンクする外部語彙ページの参照】
農作物語彙体系にリンクする外部のAGROVOC学名ページから、生産物ページに移動することでCVO農作物の多言語表記が確認できるため(図4)、グローバルな農産物流通に活用できます。また、リンクするNCBI TaxonomyページからCVO農作物の遺伝的情報が確認できるため(図5)、例えば作物の収量や品質に及ぼす環境の影響を遺伝的要因から解析する際に活用できます。
【外部プログラムによる情報収集を支援】
農作物名を(1)ガイドライン農作物名へ変換、(2)学名、英名へ変換するサービスを提供しています。このサービスを利用することで外部プログラムから農作物語彙体系の情報が簡単に収集できます。
( http://cavoc.org/cvo.php#api)。ガイドライン農作物名へ変換するサービスは、ガイドライン農作物名の使用を促進します。
今後の予定
農作物語彙体系のデータは農業データ連携基盤(WAGRI)に実装されています。今後はWAGRI上のデータ連携に農作物語彙体系が寄与することを目指します。また、本成果は日本中央競馬会畜産振興事業で構築される「牛の飼養衛生オントロジー」の研究にも活用されます。
用語の解説
1)語彙体系 :用語を体系的に整理したもの。
2) スマート・フードチェーンシステム:ICTを活用し、国内外の多様化するニーズなどの情報を産業の枠を超えて伝達することで、それに即した生産体制を構築し、さらには商品開発や技術開発(育種、生産・栽培、加工技術、品質管理、鮮度保持等)にフィードバックし、農林水産業から食品産業の情報連携を実現するシステム(出典:内閣府農林水産戦略協議会(第4回;平成29年1月11日)配布資料-参考資料2)。
3)農業データ連携基盤(WAGRI) :データの連携・共有・提供を可能にするため、今までバラバラだった農業に関わるデータを集約・蓄積し、農業関係者が必要なデータを相互運用できるようにするデータプラットフォーム(公開ページ https://wagri.net/ より)。
4) フードチェーン:食品の一次生産から販売に至るまでの食品供給の行程のこと(出典:内閣府食品安全委員会ホームページ-用語集)。
5) NCBI Taxonomy:NCBI(アメリカ国立生物工学情報センター)のEntrezデータベースに少なくとも1件以上登録されている全ての生物種と上位分類名を収集したデータベース。160,000以上の生物種が登録されています(出典:科学技術振興機構 Integbioデータベースカタログ)。
参考図