2013年3月20日水曜日

Integrative Genomics Viewer(IGV)を使ってみた

Integrative Genomics Viewer(IGV)とは、Standalone(自分のパソコン上)で動かせるゲノムビューワの代表格です。illuminaが提供しているGenome Studioに近いものと考えてくれればいいです。

IGVを利用する主な利点としては、

・Web上で動かす「UCSC genome browser」と比較して、動作が軽快。
⇒UCSC genome browserはサーバーを介してデータのやり取りを行うので、どうしてもタイムラグが生じる。イライラする。

・マッピング後のBAMファイルなど様々な形式のファイルを簡単に可視化できる。
⇒UCSC genome browserでは、BAMファイルの場合、サーバー上にファイルをストレージする必要があり、アップロードにも時間を要する。

・クローズドな環境でデータを見れるので、セキュリティ上安全。
⇒UCSC genome browserだとどうしてもデータを外部に提示する(アップロードする)必要があり、セキュリティ上安全とはいえないかも。

といったところでしょうか。

ではIGVのダウンロード・起動方法などについての説明に移りたいと思います。

〈IGVのダウンロード〉
(1)Integrative Genomics Viewer(IGV)のホームページへ行く。

(2)左側にある「Downloads」をクリック。

(3)「Log In」画面に移るので、
 ・初めてIGVをダウンロードする場合は、
 (ⅰ)「To use IGV, registration is required. Click here to register」で「Click here」をクリック。

 (ⅱ)Registrationに移るので、「Name」「Email」「Organization」を記入後、「Agree」をクリック。

 ・Registrationを済ませている場合は、
 (ⅰ)「email address」を記入後、「Login」ボタンをクリック。

(3)「Downloads」画面に移るので、「Binary Distribution」のIGV_2.2.11.zipをクリックし、IGV本体をダウンロードする。

(4)また「igvtools」igvtools_2.2.2.zip     includes .genome files (225 MB) をクリックし、Genome情報をあわせてダウンロードしておく。

〈IGVの起動方法〉
(1)Zipファイルを解凍した中に、「igv.bat」というファイルがあり、そのファイルをクリックするとIGVが起動します。

〈使用するゲノムを導入〉
デフォルトではヒトゲノムである「hg18」しか入っていないので、これ以外のゲノムを使いたい場合は自身でIGVの中にファイルをインポートする必要があります。

そこで、先ほどダウンロードしてきた「igvtools」中のファイルを使います。
「igvtools」にはさまざまなゲノム情報のファイルが入っており、このファイルをIGVの中にインポートすることで目的のゲノムを使用することができるようになります。

(1)「igvtools」を解凍する。

(2)「igvtools」→「genomes」内にさまざまな生物種のゲノム情報が入っています。(場所を確認)

(3)IGVを起動し、メニューバーの「Genomes」→「Load genome from File…」をクリック。

(4)使用したいゲノム情報をクリック(hg19.genome等のファイル)

(5)「Loading Genome…」というウインドウが出るのでしばらく待つ。

(6)ロードが終わった後、メニューバーの右端下のプルダウンメニューから、先ほどインポートしたゲノムが選択できるようになっている。

〈BAMファイルの可視化〉
IGVでBAMファイルを可視化するにはいくつか条件があります。

・「Chromosome」および「Start Position」でソートする必要あり。
・マッピングしたファイル(.bam)およびIndexファイル(bam.bai)が必要。

「Tophat」でマッピングした場合、BAMファイルはソートされた状態で生成されますが、「Bowtie」でマッピングした場合、生成されるSAMファイルはソートされていないので注意が必要です。

SAMtoolsを使って、sortとindexの生成を行います。
コマンドは以下のとおり。(TophatからBAMファイルを生成した場合は(3)から。)

(1)SAMファイルからBAMファイルへの変換
$samtools view -bS INPUT_file.sam > OUTPUT_file.bam
⇒標準出力により、BAMファイルは生成されます。

(2)BAMファイルのソート
$ samtools sort INPUT_file.bam OUTPUT_file
⇒アウトプットのファイルには自動的に「.bam」の拡張子がつくのでコマンド内で記述する必要はありません。

(3)BAMファイルのindex生成
$ samtools index INPUT_file.bam(sort済み)
⇒今度はOUTPUTファイルの名前を指定する必要はありません。上記の例では、「INPUT_file.bam.bai」というindexファイルが作られます。

〈IGVでBAMファイルを可視化〉
(1)IGVを起動。(igv.bat」ファイルをクリック

(2)メニューから「File」→「Load from File…」をクリック。

(3)見たいBAMファイル(.bam)をクリック。
⇒このとき、あわせてindexファイル(.bam.bai)を開く必要はない。BAMファイルと同じ場所にindexファイルがあれば問題なくBAMファイルを開くことができる。

0 件のコメント:

コメントを投稿