[ 農業生物資源研究所トップページ ] [ プレスリリースリスト ]


プレスリリース  開発背景 開発内容 今後の展開  SALAD databaseの使い方の説明

【開発背景】

ゲノムとは、生き物が持つ遺伝子情報のすべてのセットを指します。例えば、イネでは、3万個を超える遺伝子があり、それ全体がイネのゲノム情報になります。各遺伝子はタンパク質を作る機能を持っていて、そのアミノ酸配列の情報が各遺伝子にはDNA配列として暗号のように書き込まれています。これからの作物の品種改良には、遺伝子の機能解析からの知見はなくてはならないものになると予想されています。そのため、作物のゲノム情報解析もどんどん行われています。一方、実験がしやすい植物であるシロイヌナズナでは、盛んに遺伝子の機能解析が行われ報告されていますが、他の作物・植物の遺伝子の機能解析は、それほどは進んでいないというのが現状です。これまでの知見を効率的に利用するには、これまで得られたいろいろな植物の遺伝子解析からの知見を、他の植物・作物にあてはめていくことが重要になります。しかしながら、ゲノム情報は膨大で、しかも、種を超えると、どんどんアミノ酸配列が変化するので、同じ機能を持つと推測されるタンパク質をコンピューター上の情報から選び出して、整理整頓することは、非常に手間がかかり、研究者個人がパソコンを片手に解析するのは効率的ではありません。そのため、遺伝子機能の研究者は、これらの情報解析に多くの時間を費やしているのが現状でした。そこで、農業生物資源研究所は、タンパク質のアミノ配列の類似性を指標に、膨大なゲノム情報を比較し、非常に簡単な操作・短時間で、同様な遺伝子機能をもつであろう遺伝子を種を超えて推定することができるゲノムデータベースを作成しました。このデータベースにより、遺伝子機能解析を効率的に進めることが可能になります。

【開発内容】

膨大なゲノム情報を効率的に情報解析するには、大型の高速コンピュータを使った計算をし、その結果をデータベース化しておき、ニーズに応じて、検索し、閲覧することが必要です。今回の比較ゲノムデータベースの作成では、まず、主要作物であるイネ、実験植物であるシロイヌナズナ、比較対照の紅藻の3種類の植物について全ゲノム情報を整理整頓しました。そして、ユーザーの方が一目で判断できるように、タンパク質の違いを色違いでビジュアル的に簡単に分かるように表示しました。また、今回、このデータベース開発を行うために、新規なアルゴリズムを開発、特許出願もしました。名前も親しみやすいように、SALAD database (サラダ データーベース)としました。SALAD (Surveyed conserved motif ALignment diagram and the Associating Dendrogram) database (Ver.1)の略です。 以下に特徴をまとめます。SALAD database を利用することにより、多くの研究者が自分の知りたいゲノム(遺伝子)情報を、簡単に得ることができ、研究の効率化を進めることができるようになると考えられます。

  1. タンパク質のアミノ酸配列が似ているかどうかで種を超えて遺伝子を整理整頓。
  2. 全遺伝子情報・タンパク質情報を処理したデータを内蔵している。
  3. いろいろな検索機能。
  4. 簡単操作。カラフルなビジュアル表示。
  5. より専門的な詳細な情報も解析可能。

今回の研究は、農林水産省委託プロジェクト研究「アグリ・ゲノム研究の総合的な推進」の「多様性ゲノム解析研究」(課題番号GD1003)で実施したものです。

この成果の一部はすでに「井澤 毅・藤宮 仁 遺伝子クラスタリング装置、遺伝子クラスタリング方法およびプログラム 特願2007-060745」として特許出願をしています。

【今後の展開】

研究者はSALAD databaseを利用することで、機能が似ていると推定される遺伝子情報をすばやく検索できます。現在のSALAD databaseには、イネ、シロイヌナズナと紅藻のアミノ酸配列(遺伝子)情報(合計で約84,000個)が入っていますが、今後は、随時、公開された対象ゲノム情報を増やしていき、研究者の解析効率をさらに上げるため、いろいろな植物の遺伝子情報が一緒になったサラダデーターベースを構築していく予定です。


[ 農業生物資源研究所トップページ ] [ プレスリリースリスト ]