研究紹介

大量遺伝情報研究室の紹介・特色

2009年から新規にスタートしたバイオインフォマティクスの研究室です。高速かつ大量に決定されつつある塩基配列情報は、生物学のあらゆる分野で活用されなければならない情報基盤です。しかし情報の爆発的な大容量化によって、データベースからの実験生物学者への情報提供は難しさを増しており、また配列注釈の不足や特徴情報の記載の誤りの増幅も問題となってきています。
中村研究室は、日本DNAデータバンク (DDBJ)事業を推進し発展させることを業務の中心に据え、データベース運用の高度化と配列注釈の質の向上に取り組んでいます。

研究室メンバー(2010年4月現在)

教授: 中村 保一
助教: 神沼 英里
シニアアノテーター: 真島 淳, 青野 英雄, 李 慶範, 大城戸 利久, 小菅 武英, 児玉 悠一, 坂井 勝呂, 筒井 波留, 野崎 亜沙美
ジュニアアノテーター : 江嶋 真由美, 杉田 里江, 三村 公子, 横山 会美
研究協力者: 猿橋 智 望月 孝子
秘書: 村形 直子

[ 1 ] DDBJ国際塩基配列データベースの塩基配列登録の自動処理化

DDBJ は,欧州の EBI/EMBL-Bank および米国の NCBI/GenBank との密接な連携のもと,『DDBJ / EMBL / GenBank 国際塩基配列データベース』を構築している三大国際 DNA データバンクのひとつです。DDBJにおける塩基配列のデータ登録は、アノテーターと呼ばれるDDBJ所属のバイオ実験研究の専門家が行っており、アノテーターの確認により登録データの品質を維持しています。塩基配列データの登録では、登録支援システムを使ってデータのチェック作業が行われます(右図)。これらデータの登録には、自動化処理が可能な手作業処理が含まれています。配列登録に関わるシステムの自動化処理手法を研究します。

[ 2 ] アノテーション・キュレーション 情報のプロトコル・データベースの構築

データに生物学的医学的な注釈付けを付与する作業をアノテーションと呼び、注釈付けが正しいか確認する作業をキュレーションと呼びます。バイオ実験研究者などの専門家がアノテーションやキュレーションを行うには、手作業が必要です。手作業処理の一部を自動化処理に変更すると、作業効率が上がります。本研究では、プロトコルと呼ばれるアノテーションやキュレーション処理の流れのデータベース化を推進します。プロトコルがデータベース化されれば、異なるアノテーション作業中の同一処理を検出することができます。このため自動処理化やアドバイスツールの作成が容易になります。データベース構築と共に、アノテーター同士の情報共有法、注釈付データの評価法を研究します。

[ 3 ] 次世代シーケンサーの配列アノテーション・パイプラインの構築

次世代シーケンサーの技術的進歩によってゲノム解析が容易に出来る時代が到来し、DDBJでは「Short Reads」と呼ばれる短く大量規模の配列データへの対応が迫られています。本研究室では、次世代シーケンサーの大量配列データに対応する為の、解析プラットホームを開発しています。特に、一塩基多型同定などのアノテーション自動化に着目して、配列解析処理の自動パイプライン化を目指しています。また、DDBJでは次世代シーケンサーの生成配列を登録するShort Read Archive(SRA)システムが稼働しています。登録処理も含めた一連の流れに総括できるアノテーション・パイプラインを確立し、バイオインフォマティクス研究を推進します。