初心者ながらもドライなインフォマティクスにも手を広げている。手持ちのノートにもStandaloneBlastServerを入れようかと思って午前中はずっとデスクワーク。darwinのシェルがbashなことを知らず、pathを通すところでず〜っと悩んでしまった。また同じ間違いをしないためにも、メモメモ。rootに/bioを作ってその下に展開。

#環境変数.ncbirc
$ cd ~
$ emacs .ncbirc 
  [NCBI]
  Data=/bio/blast/data
  [BLAST]
  BLASTDB=/bio/db
#bashでblastallにpathを通す
$ cd ~
$ emacs .bashrc
  PATH=$PATH:/bio/blast/bin
$ source .bashrc
$ env

テストでecoli.aaのデータベースを取ってきて、フォーマット。

$ formatdb -p T -i ecoli.aa -o T

queryをhumanのhsp90にしてサーチしてみる。

$ blastall -p blastp -i hsp90.fasta -d ecoli.aa | less 

1秒ぐらいで・・・

Searching..................................................done

                                                                 Score    E
Sequences producing significant alignments:                      (bits) Value

gb|AAC73575.1| (AE000153) chaperone Hsp90, heat shock protein C ...   261   1e-70
gb|AAC77008.1| (AE000477) orf, hypothetical protein [Escherichia...    30   0.56 
gb|AAC74200.1| (AE000212) orf, hypothetical protein [Escherichia...    28   2.1  
gb|AAC73376.1| (AE000135) ornithine carbamoyltransferase 2, chai...    28   2.1  
gb|AAC76337.1| (AE000408) 50S ribosomal subunit protein L29 [Esc...    28   2.8  
gb|AAC77211.1| (AE000496) ornithine carbamoyltransferase 1 [Esch...    27   3.6  
gb|AAC77265.1| (AE000501) orf, hypothetical protein [Escherichia...    27   4.7  
gb|AAC74725.1| (AE000260) member of ATP-dependent helicase super...    26   8.1  

トランスクリプトームのデータが溜まってきたので、いろんな生物とのトランスクリプトーム比較とかやる時とかは、データセットの総当たりblastなんかをやるしかないだろなぁ。