2012年12月17日月曜日

RNA-seqのデータをUCSC genome browser上で視覚化する(1)

Bowtieなどのマッピングソフトから出力される「bamファイル」を「Wigファイル」に変換し、UCSC genome browserにアップロードできるファイル形式にする。

(1)bamToBed
ダウンロード先:http://code.google.com/p/bedtools/downloads/list

〈コマンド〉
$ bamToBed -i  Input_name > Output_name
$ sortBed -i Input_name > Output_name

(2)bed2Wig
ダウンロード先:不明

〈コマンド〉
$ cut -f 1-3 Input_name > Output_name
$ perl bed2Wig.pl Input_name > Output_name

〈スクリプト〉
ファイル名:bed2Wig.pl

内容:
#!/usr/local/bin/perl
use strict;
my $m;
while (<>) {
    my @tok = split "\t";
    for ($tok[1]..$tok[2]) {
$m->{$tok[0]}{$_}++
    }
}
my $track = shift || "name";
my $desc = shift || "desc";
#track name / description: 任意の名前に入力, color: 任意の色を指定
print "track name=\"$track\" description=\"$desc\" type=\"wiggle_0\" color=250,180,10 yLineMark=0.0 yLineOnOff=on visibility=2 maxHeightPixels=40:40:20 priority=1\n";
for my $chr (sort keys %$m) {
    my $prev = 0;
    for my $pos (sort {$a<=>$b} keys %{$m->{$chr}}) {
    if ($pos - $prev > 1) {
   print "fixedStep chrom=$chr start=$pos step=1\n";
    }
    print $m->{$chr}{$pos}, "\n";
    $prev = $pos;
    }
}

0 件のコメント:

コメントを投稿