Non-BioinfomaticianによるNGS解析メモ
2013年9月14日土曜日
WindowsとLinux間での改行コードの違いによる問題
›
改行コードの違いから、Perlなどのスクリプトで処理した時、予期せぬところに改行が入ったりすることがあります。 そこで、Linuxの改行コードに変換するcommandを紹介します。 dos2unix ファイル名 でLinuxの改行コードに変換可能です。データは上書きされま...
Illumina Adapter Sequences Letter: アダプター配列等の情報を探す(illumina)
›
fastqファイルのpreprocessingを段階で、アダプター配列を除去したい場合があると思います(small RNAのRNA-seqやCLIP-seqなど3'末端にリンカー配列を結合させたケースなど)。 しかし残念ながら、論文のMaterial&Meth...
liftOver: ゲノム座標を異なるバージョンのゲノム座標に対応付けする
›
hg18のゲノム座標のデータを持っていて、hg19のゲノム座標に変換したい。そんな場面があるかと思います。 こういった異なるバージョン間でのゲノム座標の対応付けは、UCSCが提供している「liftOver」が便利です。 〈liftOverのダウンロード〉 (1)下記のU...
2013年8月10日土曜日
grep: and / or条件での検索
›
Linuxのコマンドの1つである「grep」でAND条件・OR条件での検索に関するメモ。 (1)AND検索 パイプ「|」でつなぐことでgrepコマンドのAND検索が可能になります。 grep "chr6:125111" INPUT.txt | grep...
2013年8月3日土曜日
sortBed: bedファイルをソートする
›
bedファイルをsortコマンドでソートしようとしたことがあるのですがこれが意外と難しい(´・ω・`) そこで便利なのが、BedtoolsのsortBedコマンドです。 sortBed -i /path/to/INPUT.bed > OUTPUT.bed BED, ...
2013年7月27日土曜日
RNA-seqデータの解析パイプラインを作ろう(データの視覚化)
›
RNA-seqのデータ(fastqファイル)をBowtieやTopHatなどでマッピングした後、bamファイルやsamファイル(場合によってはbedファイル)として出力されます。 そのデータを用いて、Cufflinksなどのリードの集計ソフトで定量値(FRKM値やRPKM値)...
2013年7月21日日曜日
RNA-seqデータの解析パイプラインを作ろう(TopHat-Cuffilnks)
›
RNA-seqデータの解析例をメモ。 あくまで一例なので、ここで取り上げた方法がすべてのデータに対して良いとは限りません。 一つ一つコマンドを入力していってもいいのですが、手間なのでシェルスクリプトを活用し複数の処理(コマンド)をまとめて行った例を示します(いわゆる、バッチ...
›
ホーム
ウェブ バージョンを表示