■
初心者ながらもドライなインフォマティクスにも手を広げている。手持ちのノートにもStandaloneBlastServerを入れようかと思って午前中はずっとデスクワーク。darwinのシェルがbashなことを知らず、pathを通すところでず〜っと悩んでしまった。また同じ間違いをしないためにも、メモメモ。rootに/bioを作ってその下に展開。
#環境変数.ncbirc $ cd ~ $ emacs .ncbirc [NCBI] Data=/bio/blast/data [BLAST] BLASTDB=/bio/db
#bashでblastallにpathを通す $ cd ~ $ emacs .bashrc PATH=$PATH:/bio/blast/bin $ source .bashrc $ env
テストでecoli.aaのデータベースを取ってきて、フォーマット。
$ formatdb -p T -i ecoli.aa -o T
queryをhumanのhsp90にしてサーチしてみる。
$ blastall -p blastp -i hsp90.fasta -d ecoli.aa | less
1秒ぐらいで・・・
Searching..................................................done Score E Sequences producing significant alignments: (bits) Value gb|AAC73575.1| (AE000153) chaperone Hsp90, heat shock protein C ... 261 1e-70 gb|AAC77008.1| (AE000477) orf, hypothetical protein [Escherichia... 30 0.56 gb|AAC74200.1| (AE000212) orf, hypothetical protein [Escherichia... 28 2.1 gb|AAC73376.1| (AE000135) ornithine carbamoyltransferase 2, chai... 28 2.1 gb|AAC76337.1| (AE000408) 50S ribosomal subunit protein L29 [Esc... 28 2.8 gb|AAC77211.1| (AE000496) ornithine carbamoyltransferase 1 [Esch... 27 3.6 gb|AAC77265.1| (AE000501) orf, hypothetical protein [Escherichia... 27 4.7 gb|AAC74725.1| (AE000260) member of ATP-dependent helicase super... 26 8.1
トランスクリプトームのデータが溜まってきたので、いろんな生物とのトランスクリプトーム比較とかやる時とかは、データセットの総当たりblastなんかをやるしかないだろなぁ。