Jul2014東京工業大学「バイオインフォマティクス」演習 topへ戻る
ゲノムプロジェクト
シークエンシングテクノロジの進歩
蛍光によるdideoxy法(サンガー法)
- Polymerase Chain Reaction
- Sanger Sequencing (dideoxy method)
New Generation Sequencer (NGS)
- illumina Genome Analyser – http://www.youtube.com/watch?v=77r5p8IBwJk (youtube)
- フラットな固層上に適当な間隔でDNAを1分子ずつ固定、基盤上で「ブリッジPCR」を行い、スポットとしてDNAを増幅
- 相補鎖合成を行いながら、4つの塩基に別々の蛍光標識をつけておいて、結合した塩基の場所をスポットの光として特定し、塩基配列を解読していく
どのような目的でシーケンスを行うのか
NGSの出現によって可能になった塩基配列決定プロジェクト
- 1000ゲノムプロジェクト
- 環境ゲノミクス
DDBJ @ 国立遺伝学研究所 http://www.ddbj.nig.ac.jp/
GenBank, ENA と国際協力関係にある、塩基配列のアーカイブです
【実習】配列情報へのアクセス
1. Entrez 改め GQuery
National Center for Biotechnology Information (NCBI)の、配列と論文に関連した情報を何でも引けるNCBIの生物系検索決定版
http://www.ncbi.nlm.nih.gov/gquery
- GQuery をひらき、眺める(大量のデータベースの複合体)
- interleukin-2 から検索スタート
- AND human を追加して絞ってみる (interleukin-2 AND human で検索)
- AND full length cDNA を追加 (interleukin-2 AND full length cDNA で検索)
- 左下あたりの「Nucleotide 43 件」を開いてみると、Mouse などがコンタミしてるので、右ペインの Top Organisms から Homo sapiens (11) を選択
- 検索結果を開き、それぞれのFeatures(特徴)とそこからのリンクを確認しよう。
- 【応用】: Pubmed で同様に論文を検索しなさい。
- 【応用】: 右上の Sign in to NCBI からログインすると、どのようなすばらしいサービスが受けられるのかを確認しよう。まだ使ってない人は登録して他のラボメンバーに差をつけよう。
2. GOLD
世界中のゲノムプロジェクトとESTプロジェクトを網羅したすごいテーブル http://www.genomesonline.org
- メタゲノムプロジェクト(複数の生物をまとめて読んでしまうやりかた) metagenomes
- 終了したプロジェクト: Complete Projects
- 進行中のプロジェクト: Incomplete Projects
- アナウンスされているプロジェクト: Targeted Projects
- 生物の種名の調べ方
- いきなりgoogleとかでもいいんですよ http://www.google.co.jp/
- 【実習】大腸菌O111ゲノムは決められている?
- 【実習】大腸菌のゲノムプロジェクトはいくつ存在?そのうち、完成して発表 (Complete and Published) されたプロジェクトはいくつか?
- 【実習】ネコゲノムプロジェクトって存在する?そのフェイズは?
See also: 統合TV「GOLD -Genomes Online Databaseを使い倒す 2013」http://togotv.dbcls.jp/20131029.html
3. NCBI Taxonomy
生物分類と配列情報を関連させて調べたい場合にはここ。30万種以上の生物が網羅されています。分類体系は独自な場合もあるので注意 http://www.ncbi.nlm.nih.gov/Taxonomy
- 【実習】あなたが興味のある生物種のプロジェクトはないかNCBI Taxonomy で調べてみよう (例:Arabidopsis, cat, mouse, … あなたの研究対象/興味のある生物でどうぞ)
- 生物名(common name =一般名 も可)で検索できます。
- 右ペインの Entrez records から、その生物種の NCBI のリソースにおさめられている DB を展開してみましょう(Nucleotide〜Genome, PopSet, GEO, SRA, BioProject, BioSample, BioSystems, …)
- 下部の Lineage から類縁の生物種を展開してみましょう
- 下スクロールして Genome Information, External Information Resources を確認しましょう。GOLD へはここからも行けますね。学名で引かなくて良いのでここから行く方が早そう
See also: 統合TV「NCBI Taxonomy Browserを使って、生物分類と配列情報を関連させて調べる」 http://togotv.dbcls.jp/20090226.html
4. DDBJ の NGS アーカイブと、解析パイプライン、BioProject
- NGS データアーカイブ: DDBJ SRA (DRA) http://trace.ddbj.nig.ac.jp/dra/
- SRA は NGS の生データアーカイブです。自分でデータ取得できなくても類縁生物との比較による SNP 発見や発現解析などは公開データを使って実施できる場合があります
- 【実習】DRAsearch を使って興味のある材料/方法論のデータを検索してみましょう。SRA 単独を探す場合には NCBI よりも使いやすいという評判もありますよ
- NGS の解析処理を支援するクラウド: DRA pipeline http://p.ddbj.nig.ac.jp/
- 【デモ】右上の Login as “guest” から利用イメージをみてみましょう
See also: 統合TV「今日からはじめるDDBJ Read Annotation Pipeline」http://togotv.dbcls.jp/20100617.html
- スパコンくらい自分でガシガシつかえるよってひと>「遺伝研」「スーパーコンピュータ」で検索。無料です!
- 今後重要になってくる Bundle 型 DB
- DDBJ BioProject: http://trace.ddbj.nig.ac.jp/bioproject/
- DDBJ BioSample: http://trace.ddbj.nig.ac.jp/biosample/