BioProspectorでは、複数のモチーフ配列が予想されます。このスクリプトに通すことで予測されたモチーフ配列に対してそれぞれのweblogo用のfastaファイルが生成されるようになっています。(5つのモチーフ配列が予想されていれば、このスクリプトで5つのfastaファイルが生成されます。)
あとは、生成されたfastaファイルを一つ一つweblogoで視覚化するだけ。(あと、一連のステップもバッチ処理で一気に生成出来ればよいのですが…。)
#!/usr/local/bin/perl
####################################
#BioProspector2weblogo##############
#var1.0_Perl
#update: 2012.4.5
####################################
use strict;
use warnings;
my $file = $ARGV[0];
my $number = $ARGV[1];
#main####################################################
open (IN,"<./$file\.result") || die;
my $flg=0;
my $filehandle = 1;
my $count = 1;
while(my $line = <in>){
if($line eq "\n"){
next;
}
chomp $line;
if($line =~ /^Try/
|| $line =~ /^The highest/
|| $line =~ /^Width/
|| $line =~ /^Blk1/
|| $line =~ /^[1-6]/){
next;
}
if($line =~ /^Motif/){
if($filehandle == 0){
close(OUT);
$count++;
}else{
$filehandle = 0;
}
open (OUT,">./$file\#$count\.fasta") || die;
}else{
if($line =~ /^>/){
print OUT "$line\n";
$flg=1;
}elsif($flg == 1){
print OUT "$line\n";
$flg=0;
}
}
}
close(IN);
close(OUT);
print "...process successfully completed\n";
〈使用方法〉$ perl Bioprospector2weblogo INPUT_file⇒INPUT_fileの拡張子は「.result」にしておくこと。(もしくはスクリプトを適宜書き換え。)
〈ダウンロード先〉
・github -non-bioinformatician_NGS_analysis
https://github.com/Naoto-Imamachi/non-bioinformatician_NGS_analysis
0 件のコメント:
コメントを投稿