配列データベース

ミラーデータベース

GenBank、EMBL、RefSeq など、主要な生物系データベースの最新版のミラーデータベースを SHIROKANE の /usr/local/db/ 以下に設置しています。 これにより、インターネットを経由してデータを取得することなく、各データベースに高速にアクセスすることができます。

設置されているファイルの形式は、以下の 3 種類です。

  • Flat ファイル形式 (圧縮されたデータを展開したもの)
  • FASTA 形式
  • BLAST インデックスファイル形式 (BLAST 検索を行うための形式)

詳しくは下記のページを参照してください。

また、HGC Anonymous FTPサイトでは、各種データのミラーをそのままの状態で再配布しています。 詳しくは Anonymous FTP サービスを参照してください。

関連

検索対象となるデータベースとエイリアスファイルのパス情報

検索対象となるデータベースと、エイリアスファイルのパスの確認の際には、以下の表をご参照ください。

検索対象となるデータベースエイリアスファイルのパス
GenBank リリースの全ファイル /usr/local/db/blast/genbank/genbank-rel.nal
GenBank リリース + アップデート /usr/local/db/blast/genbank-upd/genbank.nal
GenPept リリース + アップデート /usr/local/db/blast/genpept-upd/genpept.pal
EMBL リリースの全ファイル /usr/local/db/blast/embl/embl-rel.nal
EMBL リリース + アップデート /usr/local/db/blast/embl-upd/embl.nal
RefSeq-Genomic + RefSeq-RNA /usr/local/db/blast/refseq/refseq-na-rel.nal
RefSeq リリース + アップデート Genomic + RNA /usr/local/db/blast/refseq-upd/refseq.nal
RefSeq リリース + アップデート Protein /usr/local/db/blast/refseq-upd/refseq.pal
Swissprot + TrEMBL /usr/local/db/blast/uniprot/uniprot.pal
NCBI nt + EST + GSS + HTGS + STS + patnt + WGS /usr/local/db/blast/ncbi/ncbi.nal

BLAST 検索時の検索対象 DB として、エイリアスファイルを指定することで、複数の BLAST ファイルを対象とした検索を行なうことができます。

エイリアスファイルを使用し、BLAST 検索を行う場合は、従来のBLASTユーザ向けBLAST+利用方法をご参照ください。

BLAST 検索で使用する検索用クエリが必要な場合に、EMBOSS のコマンドで作成することが可能です。

各データベースファイルの設置パスと詳細

各データベースの設置パス、および詳細は以下の表をご参照ください。

(例) GenBank の blast 形式のファイルの設置パス: /usr/local/db/blast/genbank/ 以下
データベース名パス
/usr/local/db/
設置されているファイルの詳細
(圧縮ファイルは解凍し設置)
GenBank flat/genbank/ ftp://ftp.ncbi.nih.gov/genbank/ 以下の*.seq ファイル
fasta/上記を FASTA 形式に変換したもの
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
GenBank-UPD flat/genbank-upd/ ftp://ftp.ncbi.nih.gov/genbank/daily-nc/ 以下の全ファイル
fasta/上記ファイルの内*.flat を FASTA 形式に変換したもの
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
GenPept-genpept/-
fasta/GenBank の seq ファイル内の翻訳可能なエントリを翻訳し、FASTA 形式に変換したもの
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
GenPept-UPD-genpept-upd/-
fasta/GenBank-UPD の*.flat ファイル内の翻訳可能なエントリを翻訳し、FASTA 形式に変換したもの
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
EMBL flat/embl/ ftp://ftp.ebi.ac.uk/pub/databases/embl/release/ 以下の*.dat ファイル
fasta/上記を FASTA 形式に変換したもの
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
EMBL-UPD flat/embl-upd/ ftp://ftp.ebi.ac.uk/pub/databases/embl/new/ 以下の全ファイル
fasta/ 上記ファイルの内、r*.dat を FASTA 形式に変換したものの
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
RefSeq-Genomic flat/refseq/ ftp://ftp.ncbi.nih.gov/refseq/release/ 以下の全ファイル
fasta//usr/local/db/flat/refseq/ 以下の各ディレクトリに含まれる*.genomic.fna をそれぞれ統合したファイル
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
RefSeq-RNA flat/refseq/ RefSeq-Genomic と同様
fasta//usr/local/db/flat/refseq/ 以下の各ディレクトリに含まれる*.rna.fna をそれぞれ統合したファイル
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
RefSeq-Protein flat/refseq/ RefSeq-Genomic と同様
fasta//usr/local/db/flat/refseq/ 以下の各ディレクトリに含まれる*.protein.faa をそれぞれ統合したファイル
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
RefSeq-UPD-NA flat/refseq-upd/ ftp://ftp.ncbi.nih.gov/refseq/daily/ 以下の全ファイル
fasta//daily 以下の rsnc.*.*.fna を統合したファイル
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
RefSeq-UPD-AA flat/refseq-upd/ RefSeq-UPD-NA と同様
fasta//daily 以下の rsnc.*.*.faa を統合したファイル
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
UniProt flat/uniprot/ ftp://ftp.uniprot.org/pub/databases/uniprot/knowledgebase/ 以下の全ファイル
fasta/Swiss-Prot、TrEMBL の対象ファイル
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
Swiss-Prot
(UniProt の一部として設置)
flat/uniprot/ UniProt と同様
fasta/uniprot_sprot.fasta と uniprot_sprot_varsplic を flat/からコピーしたもの
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
TrEMBL
(UniProt の一部として設置)
flat/uniprot/ UniProt と同様
fasta/uniprot_trembl.fasta と uniprot_trembl_varsplic を flat/からコピーしたもの
blast/上記 FASTA 形式のファイルを BLAST 検索の対象となるよう変換したもの
NCBI-nt -ncbi/ -
fasta/ftp://ftp.ncbi.nih.gov/blast/db/FASTA/nt.gz を解凍し設置
blast/ftp://ftp.ncbi.nih.gov/blast/db/ 以下の nt.*.tar.gz を解凍し設置
NCBI-nr -ncbi/ -
fasta/ftp://ftp.ncbi.nih.gov/blast/db/FASTA/nr.gz を解凍し設置
blast/ftp://ftp.ncbi.nih.gov/blast/db/ 以下の nr.*.tar.gz を解凍し設置
PDB flat/pdb/ ftp://ftp.rcsb.org/pub/pdb/data/structures/divided/pdb/ 以下の全ファイル
--
--
EPD flat/epd/ ftp://ccg.vital-it.ch/epd/current/ 以下の全ファイル
--
--
PROSITE flat/prosite/ftp://au.expasy.org/databases/prosite/release_with_updates/ 以下の全ファイル
--
--
Pfam flat/pfam/ftp://ftp.ebi.ac.uk/pub/databases/Pfam/current_release 以下の全ファイル
--
--