スーパーコンピュータ
DBGET 利用法
利用例
BLASTの使用方法
BLAST ディストリビューションには以下のような実行プログラムがあります。
- blastall
- BLAST サーチを以下の5つの BLAST プログラムのうちの1つを使って実行します。
blastp, blastn, blastx, tblastn, tblastx - blastpgp
- PSI-BLAST もしくは PHI-BLAST モードでサーチを行います。
- bl2seq
- 2つのシークエンスのローカルアライメントを行います。
- formatdb
- FASTA フォーマットのファイルのシークエンスデータベースを BLAST データベースに変換します。
blastall コマンドの主なオプション
- [-p]
- 以下の 5 つの BLAST プログラムのうち 1 つを指定します
プログラム 問い合わせ配列 データベース blastn 塩基配列 塩基配列 blastp アミノ酸配列 アミノ酸配列 tblastn アミノ酸配列 塩基配列(翻訳しながら比較) blastx 塩基配列(翻訳後比較) アミノ酸配列 tblastx 塩基配列(翻訳後比較) 塩基配列(翻訳しながら比較) - [-d]
- データベース名。
- [-i]
- クエリーシークエンスのファイル名。
- [-o]
- 出力ファイル名。デフォルト:標準出力
- [-a]
- 並列実行数
- <使用例>
-
gomoku% bget -f up:AHSP_BOVIN > input.fasta
gomoku% blastall -p blastp -d nr-aa -i input.fasta -o blast.out -a 8
gomoku% less blast.out
BLASTP 2.2.10 [Oct-19-2004]
Reference: Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer,
Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997),
"Gapped BLAST and PSI-BLAST: a new generation of protein database search
programs", Nucleic Acids Res. 25:3389-3402.
Query= up:AHSP_BOVIN [Q865F8] Alpha-hemoglobin stabilizing protein
(Erythroid associated factor). (92)
(92 letters)
Database: nr-aa : Non-redundant protein sequence database Release
05-04-13
1,931,858 sequences; 627,445,769 total letters
Searching..................................................done
Score E
Sequences producing significant alignments: (bits) Value
up:AHSP_BOVIN [Q865F8] Alpha-hemoglobin stabilizing protein (Ery... 182 2e-45
gp:AY072612_1 [AY072612] EDRF [Homo sapiens] 137 6e-32
up:AHSP_HUMAN [Q9NZD4] Alpha-hemoglobin stabilizing protein (Ery... 137 8e-32
up:AHSP_MOUSE [Q9CY02] Alpha-hemoglobin stabilizing protein (Ery... 130 8e-30
gp:AX971749_1 [AX971749] Sequence 2552 from Patent EP1104808. [H... 117 5e-26
gp:AF317803_1 [AF317803] erythroid association factor [Bos taurus] 107 7e-23
<以下省略>
FASTA/SSEARCHの使用方法
プログラム | 問い合わせ配列 | データベース |
---|---|---|
fasta | 塩基配列 | 塩基配列 |
fasta | アミノ酸配列 | アミノ酸配列 |
tfasta | アミノ酸配列 | 塩基配列(翻訳しながら比較) |
ssearch | 塩基配列 | 塩基配列 |
ssearch | アミノ酸配列 | アミノ酸配列 |
主なオプション
- [-T]
- 並列実行数
- [-q]
- 非対話形式
- <使用例 (1)>
-
gomoku% bget -f up:AHSP_BOVIN > input.fasta
gomoku% fasta -q input.fasta /bio/db/blast/db/nr-aa > fasta.out & - <使用例 (2)>
-
gomoku% fasta_t -T 8 -q input.fasta /bio/db/blast/db/nr-aa > fasta_t.out &
gomoku% less fasta_t.out
FASTA searches a protein or DNA sequence data bank
version 3.4t25 Nov 12, 2004
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query library input.fasta vs /bio/db/blast/db/nr-aa library
searching /bio/db/blast/db/nr-aa library
1>>>up:AHSP_BOVIN [Q865F8] Alpha-hemoglobin stabilizing protein (Erythroid associated factor). (92) - 92 aa
vs /bio/db/blast/db/nr-aa library
<以下省略> - <使用例 (3)>
-
gomoku% ssearch_t -T 8 -q input.fasta /bio/db/blast/db/nr-aa > ssearch_t.out &
gomoku% less ssearch_t.out
# ssearch_t -T 8 -q input.fasta /bio/db/blast/db/nr-aa
SSEARCH searches a sequence data bank
version 3.4t25 Nov 12, 2004
Please cite:
T. F. Smith and M. S. Waterman, (1981) J. Mol. Biol. 147:195-197;
W.R. Pearson (1991) Genomics 11:635-650
Query library input.fasta vs /bio/db/blast/db/nr-aa library
searching /bio/db/blast/db/nr-aa library
1>>>up:AHSP_BOVIN [Q865F8] Alpha-hemoglobin stabilizing protein (Erythroid associated factor). (92) - 92 aa
vs /bio/db/blast/db/nr-aa library
<以下省略>
ClustalWの使用方法
累進法を用いたマルチプルアライメントプログラム。
オプション
- -INFILE=<input sequences>
- 複数のアミノ酸配列が登録されたファイルを指定
- -OUTPUT=<format>
- 出力形式を指定 (GCG, GDE, PHYLIP, PIR, NEXUS)
- <使用例>
gomoku% bfind uniprot globin | head -50 | bget -f > globin50.fasta gomoku% less globin50.fasta >up:AHSP_BOVIN [Q865F8] Alpha-hemoglobin stabilizing protein (Erythroid associated factor). (92) MALIQTNKDLISKGIKEFNILLNQQVFSDPAISEEAMVTVVNDWVSFYINYYKKQLSGEQ DEQDKALQEFRQELNTLSASFLDKYRNFLKSS >up:AHSP_HUMAN [Q9NZD4] Alpha-hemoglobin stabilizing protein (Erythroid associated factor) (Erythroid differentiation-related factor). (102) MALLKANKDLISAGLKEFSVLLNQQVFNDPLVSEEDMVTVVEDWMNFYINYYRQQVTGEP QERDKALQELRQELNTLANPFLAKYRDFLKSHELPSHPPPSS >up:AHSP_MOUSE [Q9CY02] Alpha-hemoglobin stabilizing protein (Erythroid associated factor) (Erythroid differentiation-related factor). (102) MAPFQSNKDLISTGIKEFNVLLDQQVFDDPLISEEDMVIVVHDWVNLYTNYYKKLVHGEQ EEQDRAMTEFQQELSTLGSQFLAKYRTFLKSKEPPSNTLPSS >up:BAHG_VITST [P04252] Bacterial hemoglobin (Soluble cytochrome O). (146) MLDQQTINIIKATVPVLKEHGVTITTTFYKNLFAKHPEVRPLFDMGRQESLEQPKALAMT
- <以下省略>
gomoku% clustalw -INFILE=globin50.fasta -OUTPUT=GCG
globin50.msf globin50.dnd
HMMERの使用方法
隠れマルコフモデルを用いたアライメントプログラム
- hmmbuild
- HMM のプロファイルを生成
- hmmcalibrate
- HMM のプロファイルを較正する
- hmmsearch
- HMM のプロファイルを読み類似した配列を検索する
- hmmpfam
- クエリーシークエンスでプロフィール HMM データベースを検索する
- <使用例>
- a. DBGET の bfind コマンドと bget コマンドを使用し、uniprot データベースからヘモグロビンのアミノ酸配列を検索し、fasta 形式で globin50.fasta ファイルに出力します。
gomoku% bfind uniprot globin | head -50 | bget -f > globin50.fasta
b. アミノ酸配列のアライメントを生成しますgomoku% clustalw -INFILE=globin50.fasta -OUTPUT=GCG
c. HMM のプロファイルを生成します
globin50.msf globin50.dndgomoku% hmmbuild globin.hmm globin50.msf
d. HMM のプロファイルを較正しますgomoku% hmmcalibrate globin.hmm
e. HMM のプロファイルを読み類似した配列を検索しますgomoku% hmmsearch globin.hmm nr-aa > hmmsearch.out