fastqファイルのpreprocessingを段階で、アダプター配列を除去したい場合があると思います(small RNAのRNA-seqやCLIP-seqなど3'末端にリンカー配列を結合させたケースなど)。
しかし残念ながら、論文のMaterial&Methodsをみてもそのアダプターの配列が記載されていないことがあります。
アダプター配列がわからない場合、FastQCなどでリード中に高頻度で出現する配列をチェックして、それらの配列を除去するというのも1つの手ですが、単純にメーカーのサイトから配列情報を入手することも可能です。
Illuminaの場合、下記のサイトから「Illumina Adapter Sequences Letter」と呼ばれるアダプター配列等の配列情報が記載されたファイルをダウンロードできます。
http://support.illumina.com/downloads/illumina_adapter_sequences_letter.ilmn
このように、論文中に配列情報が記載されていなくてもサンプルプレップで使用したキットがわかっていればアダプター配列を特定することが可能です。
0 件のコメント:
コメントを投稿