RepeatMasker の利用方法

SHIROKANE では RepeatMasker が利用できます。

以下が SHIROKANE にインストール済みのバージョンとデータベースです。

  • RepeatMasker 4.1.0
  • Dfam 3.1
  • RMBlast+ 2.10.0

RepeatMasker は module コマンドで <modulefile> を読み込むことで利用できます。

$ module load /usr/local/package/modulefiles/repeatmasker/4.1.0


上記以外のバージョン、別のデータベースを使用する場合は、以下のインストール手順を参考に、自身のホームディレクトリにインストールしてください。

RepeatMasker のインストール手順(参考例)

~/RepeatMasker/ に RepeatMasker をインストールする手順です。

以下の環境でのインストール手順となります。

  • RepeatMasker 4.1.0
  • Dfam 3.1
  • RMBlast+ 2.10.0

RepeatMasker をダウンロードします

[~]$ wget http://www.repeatmasker.org/RepeatMasker-4.1.0.tar.gz
--2020-07-07 14:39:23--  http://www.repeatmasker.org/RepeatMasker-4.1.0.tar.gz
www.repeatmasker.org (www.repeatmasker.org) をDNSに問いあわせています... 174.127.185.155
www.repeatmasker.org (www.repeatmasker.org)|174.127.185.155|:80 に接続しています... 接続しました。
HTTP による接続要求を送信しました、応答を待っています... 200 OK
長さ: 339833028 (324M) [application/x-gzip]
`RepeatMasker-4.1.0.tar.gz' に保存中

100%[=====================================================================================================================================>] 339,833,028 1.57MB/s 時間 3m 39s

2020-07-07 14:43:03 (1.48 MB/s) - `RepeatMasker-4.1.0.tar.gz' へ保存完了 [339833028/339833028]

RepeatMasker のアーカイブを展開します

カレントディレクトリに RepeatMasker ディレクトリが作成されます。

[~]$ tar xvzf RepeatMasker-4.1.0.tar.gz
RepeatMasker/
RepeatMasker/.gitattributes
RepeatMasker/Matrix.pm
...
RepeatMasker/ReleaseNotes
RepeatMasker/RepeatMasker
RepeatMasker/TRF.pm

ライブラリをダウンロードします

Dfam 3.1 ライブラリは、 RepeatMasker に含まれているため個別のインストールは不要です。

異なるライブラリを使用する場合は、 各ライブラリの Web サイトから必要なバージョンをダウンロードしてください。

ダウンロードしたアーカイブを展開し、 ~/RepeatMasker/Libraries に設置します。

RMBlast+ をダウンロードします

[RepeatMasker]$ cd ~
[~]$ wget http://www.repeatmasker.org/rmblast-2.10.0+-x64-linux.tar.gz
--2020-06-17 17:17:29--  http://www.repeatmasker.org/rmblast-2.10.0+-x64-linux.tar.gz
www.repeatmasker.org (www.repeatmasker.org) をDNSに問いあわせています... 174.127.185.155
www.repeatmasker.org (www.repeatmasker.org)|174.127.185.155|:80 に接続しています... 接続しました。
HTTP による接続要求を送信しました、応答を待っています... 200 OK
長さ: 187284032 (179M) [application/x-gzip]
`rmblast-2.10.0+-x64-linux.tar.gz' に保存中

100%[=============================================================================>] 187,284,032 64.2KB/s 時間 63m 40s

2020-06-17 18:21:38 (47.9 KB/s) - `rmblast-2.10.0+-x64-linux.tar.gz' へ保存完了 [187284032/187284032]

RMBlast のアーカイブを展開します

カレントディレクトリに rmblast-2.10.0 ディレクトリが作成されます。

[~]$ tar xvzf rmblast-2.10.0+-x64-linux.tar.gz
rmblast-2.10.0/
rmblast-2.10.0/bin/
rmblast-2.10.0/bin/blastp
...
rmblast-2.10.0/LICENSE.rmblast
rmblast-2.10.0/README.blast
rmblast-2.10.0/README.rmblast

利用している Perl が /usr/local/package/perl/5.26.1/bin/perl であることを確かめます

[~]$ which perl
/usr/local/package/perl/5.26.1/bin/perl

Text::Soundex をインストールします

以下のページを参考に、 Perl モジュールインストールをします。

Text/Soundex.pm をインストールします。 (CPAN バージョン 1.9464)

[~]$  Text::Soundex

configure スクリプトを実行し、インストールします

~/RepeatMasker/ 以下に RepeatMasker がインストールされます。

[~]$ cd ./RepeatMasker/
[RepeatMasker]$ perl ./configure

RepeatMasker Configuration Program

**TRF PROGRAM**

This is the full path to the TRF program.
This is now used by RepeatMasker to mask simple repeats.

Enter path  [ ]: /usr/local/package/trf/4.09/bin/trf409.linux64


Add a Search Engine:
   1. Crossmatch - Phrap             [ Configured, Default ]
   2. RMBlast - Improved NCBI Blast  [ Un-configured ]
   3. HMMER3.1 & DFAM                [ Un-configured ]
   4. ABBlast/WUBlast                [ Un-configured ]

   5. Done

Enter Selection: 2


**RMBlast (rmblastn) INSTALLATION PATH**

  This is the path to the location where
  the rmblastn and makeblastdb programs can be found.

Enter path  [ /usr/local/rmblast ]: /home/username/rmblast-2.10.0/bin
Building RMBlast frozen libraries..


Do you want RMBlast to be your default
search engine for Repeatmasker? (Y/N)  [ Y ]: Y


Add a Search Engine:
   1. CrossMatch: [ Un-configured ]
   2. RMBlast - NCBI Blast with RepeatMasker extensions: [ Configured, Default ]
   3. WUBlast/ABBlast (required by DupMasker): [ Un-configured ]
   4. DeCypher (TimeLogic): [ Un-configured ]

   5. Done

Enter Selection: 5


 -- Setting perl interpreter...

Building RMBlast frozen libraries..
The program is installed with a the following repeat libraries:
  Dfam database version Dfam_3.1
  RepeatMasker Combined Database: Dfam_3.1
Further documentation on the program may be found here:
   home/username/RepeatMasker/repeatmasker.help