企業の方もスパコンを利用できます

利用料金の詳細

スーパーコンピュータ

Univa Grid Engine (UGE) 利用法

UGE (Univa Grid Engine) の利用方法を解説します。

参考情報

講習会の資料がダウンロードできます(閲覧にはスパコンのアカウントが必要です)
UGE (Univa Grid Engine) User Guid 完全なマニュアルです。 (英語のみ。閲覧にはスパコンのアカウントが必要です)
スパコン Wiki にも情報があります

目次

Univa Grid Engine (UGE) とは

UGE とは
UGE を利用するメリットとは?
UGE の基本的な利用方法
シェルスクリプトについて
ジョブ実行時のユーザ間の優先度について
GE、OGS、SGE、 N1GE、 OGE とは

環境の設定

UGE の利用に必要な環境変数の設定
qmon の利用について

基本的な利用法

qstat コマンド実行時の state 列の意味

高度な利用法、キューの設定

現在の SHIROKANE のキューの設定について
マルチスレッドジョブ、および子プロセスを生成するジョブを円滑に実行する方法
ジョブをグループ分けしてジョブ群毎にジョブを管理したい
ジョブの実行順を制御したい
実行順を設定したジョブにおいて、先に実行されたジョブ内で、後に実行されるジョブを制御したい
複数の種類のキューを指定してジョブを qsub する方法

利用時の注意点

UGE の仕組みに関して

FAQ

環境変数を設定して、ジョブを投入したい
R を実行したい
ジョブを専有キューに投入したい
qstat コマンド実行時にエラーが出力される
自分の利用可能スロット数を知りたい

Univa Grid Engine (UGE) とは

UGE とは

UGE: Univa Grid Engine は Univa 社のグリッドコンピューティングシステム構築ソフトウェアです。
UGE を利用することで、1 台のマシン上で実行していたプログラムを、複数の計算機上で円滑に逐次実行することが可能となります。
SHIROKANE は、UGE による利用を前提として設計されたシステムです。
バッチジョブ、及びインタラクティブジョブの実行が可能です。ユーザがある 1 台の計算機からジョブを発行 (qsub) すると、UGE は負荷の少ない他の計算機にジョブを投入し実行します。
ジョブ投入時に何も指定しないと、実行結果はホームディレクトリに出力されます。
詳細な使い方については、こちらの講習会資料をご参照ください。

UGE を利用するメリットとは?

複数の計算機にジョブを投入することで、多くのプログラムを同時に実行できます。
UGE が自動でスケジューリングを行うため大量のジョブを円滑に実行できます。
1 つのプログラムに複数のパラメータを設定し投入する Array Job 機能が利用できます。
GUI を利用したジョブの投入も可能です。


UGE の基本的な利用方法

全てのユーザがすぐに利用を開始できます。
ジョブの投入は、基本的には、実行したいコマンドをシェルスクリプト内に記述し、以下のように qsub コマンドを用いて行ないます。 % qsub [シェルスクリプト名] 上記のコマンド実行すると、実行されたシェルスクリプトからの標準出力と標準エラー出力の内容が、ファイルとしてユーザのホームディレクトリに出力されます。
ジョブとして投入されるスクリプトは、デフォルトでは /bin/csh として動作します。スクリプトの先頭に「#!/bin/bash」や「#!/usr/local/bin/perl」と記述しても、/bin/csh としての動作が試みられます。意図するインタプリンタを指定するためには、下記のようにジョブを投入する必要があります。% qsub -S [スクリプトを実行するインタプリンタのパス] [スクリプト名]
通常ジョブはユーザのホームディレクトリ上で実行されますが、カレントディレクトリ上でジョブを実行する際には以下のオプションを利用します。% qsub -cwd [スクリプト名]カレントディレクトリは全実行ホストから同じパスで参照できる領域 (ホームディレクトリ以下等) である必要があります。
バイナリを直接ジョブとして投入することもできます。以下のオプションを使用します。% qsub -b y [バイナリ名]多くのバイナリがジョブとして投入できますが、バイナリを直接投入することは推奨されておりません。通常はシェルスクリプトとしてジョブを投入してください。
ジョブをホームディレクトリ上で実行し、指定のパスに標準出力 [パス A] と標準エラー出力 [パスB] を出力するには、以下のオプションを使用します。% qsub -o [パス A] -e [パス B]
投入されたジョブの実行状況の確認は以下のコマンドを用いて行ないます。% qstat-f オプションを利用することで、より詳細にジョブの実行状況を確認することができます。
投入したジョブを取り消す際には、qstat コマンドでジョブの ID を確認し、以下のコマンドを実行します。-u オプションを使用すると、指定したユーザ ID のジョブを全て消去します。% qdel [ジョブ ID]
% qdel -u [ユーザ ID]


シェルスクリプトについて

シェルスクリプトとは、UNIX コマンドを内容として持つテキストファイルの事です。
UGE のジョブとするシェルスクリプトには、スクリプト内の shebang (#!) を以下のように書き換える、もしくは、追加する必要があります。 perl の場合
[書き換える場合]
#!/usr/local/bin/perl → #$ -S /usr/local/bin/perl

[書き加える場合]
#!/usr/local/bin/perl
#$ -S /usr/local/bin/perl

上記以外の例
#$ -S /bin/bash
#$ -S /bin/tcsh
ジョブ投入時にインタプリタを指定することも可能です。この場合はシェルスクリプト内に上述の変更を加える必要はありません。 % qsub -S /usr/local/bin/perl [スクリプト名]
UGE に用いるシェルスクリプト内では、 #$を含む行を実行時オプションとして、UGE に渡す事ができます。 #$ -cwd 上記のように記述すると、シェルスクリプト内で qsub のオプションを指定することができます。


ジョブ実行時のユーザ間の優先度について

ジョブ実行時のユーザ間の優先度は、各ユーザが持つ「チケット」の量により決定されます。ここで言う優先度とは、qsub コマンド実行後の、実行ホストに投入される際の優先度を指します。
初期状態においては、すべてのユーザに対して十分な量のチケット割り振られています。
保持しているチケット量は意識する必要はありません。ユーザ間のチケット所持量の相対差をUGEが自動で検出して実行待ちジョブの優先順位を自動決定します。
以下のコマンドでジョブの実行優先順位を確認できます。「 PENDING JOBS 」と表示されている行から下が、優先順位で降順にならんだ実行待ちジョブのリストです。 % qstat -f -u '*'
チケットは、投入した UGE ジョブの CPU 使用率に応じて減少します。ジョブの実行から 1 週間が経過すると、チケットの量は自動で回復します。時間の経過すればするほど、チケット減少に与える影響は大きく減少していきます。

GE、OGS、SGE、 N1GE、 OGE とは

HGC のスパコン Web サイト、資料や変数名に、 UGE ではなく SGE や OGE という表記があります。これらはどれも過去のグリッドエンジンの名前です。基本的に現在の UGE と互換がありますので Web サイトと資料では、 UGE に読み替えてお読みください。変数名は SGE のままです。

GE (Grid Engine) : 過去に提供されていたオープンソースのフリーソフトウエアです。 有志により開発・保守が行われている Open Grid Scheduler へ引き継がれます。
OGS (Open Grid Scheduler) : 過去に提供されていたオープンソースのフリーソフトウエアです。GE 開発に関わっていた有志により開発・保守が行われていました。
SGE (Sun Grid Engine) : Sun Microsystems 社が提供していた有償ソフトウェアです。後に N1GE と名称が変わります。
N1GE (N1 Grid Engine) : Sun Microsystems 社が提供していた有償ソフトウェアです。後に Oracle 社 が Sun Microsystems 社 を買収したことにより、 Oracle Grid Engine へ引き継がれます。
OGE (Oracle Grid Engine) : Oracle 社が提供している有償ソフトウェアです。
UGE (Univa Grid Engine) : N1GE 開発チームのメンバーが現在所属している Univa 社により、N1GE の機能を引き継いで提供されている有償ソフトウェアです。

環境の設定

UGE の利用に必要な環境変数の設定

基本的にはログインするだけで環境変数が設定されます。

qmon の利用について

qmon とは GUI を持った UGE のコマンドツールの事です。qmon をご利用いただくことで GUI を利用してジョブを投入することが可能となります。
slogin.hgc.jp にログイン後、qlogin し、コマンドラインから qmon とコマンドすることでご利用いただけます。slogin.hgc.jp では qmon は実行できません。
X ウィンドウシステムを利用しているため、 Windows マシンから利用するためには、 X サーバソフトが必要となります。
Windows 用 X サーバソフトとしては ASTEC-X や、WiredX 等があります。
上記ソフトウェアをご利用の際には、パーソナルファイアーウォールの設定にご注意ください。 使用するポート
ASTEC-X 6000/TCP
WiredX 8000/TCP
Xサーバソフトによっては、slogin 上において環境変数 DISPLAY の設定が必要である場合があります。また、ご利用されている PC 上で xhost コマンドの実行が必要である場合もあります。
Mac OS X をご利用の方は、購入直後の状態では X サーバソフトがインストールされておりません。しかし、 XCode と印刷された CD が購入時に同梱されており、CD 内の X11 をインストールすることで qmon がご利用いただけます。 また、 Apple 社のホームページ上から X11 を無償でダウンロードすることも可能となっております。

基本的な利用法

qstat コマンド実行時の state 列の意味

state は現在のジョブの状態を示しています。表示の意味はスパコン Wiki の qstat コマンドのページをご覧ください。


高度な利用法、キューの設定

現在の SHIROKANE のキューの設定について

ご利用いただけるキューは以下の 10 種類です (2017 年 3 月 27 日更新)
キュー名 ジョブ投入方法 スロット数 実行時間の上限
ljobs.q qsub -l ljob sample.sh 1,968 2 か月
mjobs.q qsub sample.sh 7,728 2 日
lmem.q qsub -l lmem sample.sh 156 2 週間
intr.q qlogin 240 なし(※)
web.q qsub -q web.q sample.sh 48 なし
cp.q qsub -l cp sample.sh
qlogin -l cp
96 なし
mjobs_rerun.q qsub sample.sh 3,600 2 日
docker.q qsub –l docker ,docker_images="*[image name]*" sample.sh 48 2 日
knl.q qsub -l knl sample.sh 128 2 日
gpu.q qsub -l gpu sample.sh 48 2 日
※ qlogin は、無操作状態が 6 時間続くと自動でログアウトされます。
上記の表は最新情報への更新までに若干のタイムラグがある可能性があります。 最新のキューの設定状況は以下のコマンドを実行することで確認することができます。
・スロット数 [username@hostname ~]$ qavail -af
※slot の all 列に各キューの現在のスロット数が表示されます。
・実行時間の上限 [username@hostname ~]$ qconf -sq <キュー名> | grep h_rt
h_rt 48:00:00
※h_rt の右側に表示される数字が実行時間の上限 (hh:mm:ss) です。上記の例では実行時間の上限は 48 時間になります。
キューの指定は、qsub のコマンドオプションである「 -q 」と「 -l 」を組み合わせて行います。「 -q 」はキューを指定するオプションですが、「 -l 」はコンプレックスを指定するオプションです。コンプレックスとは、ジョブやキューに属性を付与するためのもので、オプション無しの qsub 実行時に mjobs.q のみにジョブが投入され、他のキューにジョブが投入されないよう設定するために使用しています。
キュー名は、ljobs.q、lmem.q 等、[実行時間等の名称].q という命名規則となっていますが、コンプレックス名は ljob,lmem 等、「 .q 」が付与されておりませんので、指定時には誤りのないようご注意ください。
以下にジョブ投入時によく見られる誤りと正しい投入方法を示します。
mjobs.q のみでジョブを実行したいケース
誤った例 qsub sample.sh
qsub -l mjob sample.sh
正しい投入方法 qsub -q mjobs.q sample.sh
備考 オプションを付けずに qsub すると Shirokane1,2 では mjobs.q と専有キューのどちらかでジョブが実行されたが、SHIROKANE ではmjobs.q、ljobs.q、lmem.q、専有キューのいずれかでジョブが実行される。また、「-l mjob」というコンプレックスは存在しない。
2 TB メモリを搭載したノードで実行時間 2 週間以内のジョブを実行したいケース
誤った例 qsub -l lmem,ljob sample.sh
正しい投入方法 qsub -l lmem sample.sh
備考 「 -l lmem」と「 -l ljob」の両方に対応したキューが存在しないため、ジョブが実行されない。「 -l lmem 」指定のみとすれば、実行時間の上限が 2 週間の lmem.q のみでジョブが実行される
intr.q はインタラクティブキューです。qlogin コマンドによって計算ノードにログインでき、対話式ジョブの実行やバッチジョブのデバッグにご利用いただけます。ログインする計算ノードは計算機の負荷によって自動で選択されます。 [username@hostname ~]$ qlogin
Your job 10765 ("QLOGIN") has been submitted
waiting for interactive job to be scheduled ...
Your interactive job 10765 has been successfully scheduled.
Establishing /home/geadmin/N1GE/utilbin/lx-amd64/qlogin_wrapper session to host sc091i ...
Last login: Mon Jan 1 1:00:00 2016 from sc001i
[username@sc091 ~]$
mjobs_rerun.q は専有キューと同一ノードに割り当てたキューです。mjobs.q と同様に実行時間の上限が 2 日のキューです。
以下のようにオプションを指定すると、 mjobs_rerun.q に投入されます。 [username@hostname ~]$ qsub -l mjobs_rerun sample.sh このようにオプションを指定すると、ジョブが混雑している状況ではジョブが実行されやすくなります。
但し、mjobs_rerun.q は専有キューと同一ノードに割り当てたキューのため、mjobs_rerun.q で実行中のジョブは、同一ノードの専有キューにジョブが投入されると差し戻されます。差し戻されたジョブは、再スケジューリングされ、最初から再実行されます。

マルチスレッドジョブ、および子プロセスを生成するジョブを円滑に実行する方法

1 ジョブで同時に複数のプロセスを起動するジョブを UGE に投入すると、UGE による負荷分散が適切に働かない場合があります
UGE はジョブの数をキューに定義されたスロットで制御していますが、同時に複数スロットにジョブが投入され、それらのジョブが複数のプロセスを起動するジョブであると、定義されたスロット数以上のプロセスが計算機内で稼働してしまいます。
可能な限り、複数のプロセスを起動するジョブを UGE には投入しないでください。
やむを得ず、そのようなジョブを UGE に投入する場合には、以下のオプションを使用してジョブを投入してください。 % qsub -pe def_slot 2 [シェルスクリプト]
上記のオプションを使用してジョブを投入すると、このジョブはスロットを 2 つ消費します。1 ジョブが使用するスロット数を再定義することで、ジョブの過剰投入を防止できます。

ジョブをグループ分けしてジョブ群毎にジョブを管理したい

複数のジョブに同一の名前を付けることで、グループ毎の管理を行うことができます。
名前はジョブ投入時、もしくは、実行待ちのジョブに対して付けることができます。既に実行されているジョブに名前を付けることはできません。 % qsub -N GROUP1 [スクリプト名 1]
% qsub -N GROUP1 [スクリプト名 2]
% qsub -N GROUP2 [スクリプト名 3]
% qsub -N GROUP2 [スクリプト名 4]
グループ単位でジョブを削除する GROUP1 を削除する
% qdel GROUP1
グループ単位でジョブのオプションを変更する。 GROUP2 の SGE オプションと、シェルスクリプト引数を変更する。
% qalter [SGE オプション] GROUP2 [シェルスクリプト引数]


ジョブの実行順を制御したい

下記のようなオプション指定で実現できます。 % qsub -N job1 [スクリプト名]
% qsub -N job2 -hold_jid job1 [スクリプト名]
% qsub -N job3 -hold_jid job1,job2 [スクリプト名]
各ジョブには別名 「job1」「job2」「job3」が設定されます。「job1」が実行完了した後に「job2」が実行され、「job1」と「job2」が実行完了した後に「job3」実行されます。
下記のように正規表現を利用しても上述と同様の実行順が設定可能です。 % qsub -N job1 [スクリプト名]
% qsub -N job2 -hold_jid job1 [スクリプト名]
% qsub -N job3 -hold_jid "job*" [スクリプト名]

実行順を設定したジョブにおいて、先に実行されたジョブ内で、後に実行されるジョブを制御したい

「ジョブ A の実行完了後に実行されるジョブ B が存在する。ジョブ A でエラーが発生した際にはジョブ B の実行を中止する」ことは、下記の設定により実現可能です。      ジョブ A のエラー処理内に、下記のコマンドを実行するよう記述する。
% qdel jobB

ジョブの実行順を設定してジョブを投入する
% qsub -N jobA [スクリプト名]
% qsub -N jobB -hold_jid jobA [スクリプト名]

複数の種類のキューを指定してジョブを qsub する方法

SHIROKANE では、実行までの待ち時間が短くするために、qsub 時に何もオプションを指定せずとも mjobs.q、ljobs.q、lmem.q のいずれかのキューを候補としてジョブが投入されます。Shirokane2 ではオプションを指定しない場合、投入される候補となるキューは mjobs.q のみでした。

キューを候補とした際のキューの選択順位は以下の通りです。

SHIROKANE
lmem.q > ljobs.q > 専有キュー > mjobs.q

例 1 SHIROKANE の mjobs.q、ljobs.q、lmem.q、mjobs_rerun.q のいずれかでジョブを実行する
% qsub [スクリプト名]

オプションを何も指定しなければ mjobs.q、ljobs.q、lmem.q、mjobs_rerun.q のいずれかでジョブが実行されます。

例 2 SHIROKANE の mjobs.q、ljobs.q のいずれかでジョブを実行する
% qsub -soft -l ljob [スクリプト名] または % qsub -q mjobs,q.ljobs.q [スクリプト名]

上記のオプションを使用することで mjobs.q、ljobs.q のいずれかでジョブが実行されます。lmem.q ではジョブは実行されません。

例 3 SHIROKANE の mjobs.q、ljobs.q、lmem.q のいずれかでジョブを実行する
% qsub -q '!mjobs_rerun.q' [スクリプト名]

例 1 から mjobs_rerun.q を除く方法です。ジョブが自動再実行されにくくなりますが、待ち時間は増えます。

例 4 SHIROKANE で mjobs.q を優先し、 mjobs.q、ljobs.q、lmem.q のいずれかでジョブを実行する場合

-q オプションと -soft オプションを組み合わせることで mjobs.q を優先的に選択させることができます。

% qsub -soft -q mjobs.q -l ljob,lmem [スクリプト名]

この場合の場合のキューの選択順位は mjobs.q > ljobs.q > lljobs.q > lmem.q > 専有キュー です。 この場合、 mjobs.q に空きがあれば、 mjobs.q 以外のキューでジョブが実行されることはありません。

メモリ利用量を宣言したい場合には、 "-l s_vmem=XG,mem_req=XG" を指定する場所に気をつける必要があります。

例 5 (誤った例) -soft を使用しつつ、メモリ宣言量を指定する
% qsub -soft -l s_vmem=8G,mem_req=8G,ljob,lmem [スクリプト名]
例 6 (正しい例) -soft を使用しつつ、メモリ宣言量を指定する

% qsub -l s_vmem=8G,mem_req=8G -soft -l ljob,lmem [スクリプト名] または % qsub -soft -l ljob,lmem -hard -l s_vmem=8G,mem_req=8G [スクリプト名]

"-l s_vmem=XG,mem_req=XG" は -hard オプションの後ろに指定する必要があり、-soft オプションの後ろに指定することはできません。 ただし qsub のオプションはデフォルトでは -hard オプションとして扱われるため、-soft オプションを使用しない場合は意識する必要はありません。
-soft を使用する場合は -soft の前、もしくは明示的に -hard を指定した上で、"-l s_vmem=XG,mem_req=XG" を記述してください。


UGE利用時の注意点

UGE の仕組みに関して

UGE はジョブを並列化して実行するわけではありません。複数のマシンの負荷を監視し、大量のジョブを逐次実行するためのソフトウェアです。
ジョブが参照するファイルは、全てのマシンから参照できるホームディレクトリ以下等に設置してください。 /tmp 、 /ram 以下に、入力ファイル、中間ファイルを設置することは可能ですが、最終出力結果ファイルは設置しないでください。ローカルファイルシステムのため、内容を閲覧することができません。
UGE のジョブが生成する子プロセスは UGE の管理下にありません。大量の子プロセスを生成するシェルスクリプトにおいては、子プロセスを UGE のジョブとして投入するよう記述し (シェルスクリプト内で qsub を行なうよう記述する)、UGE に子プロセスを投げる形で実行すると、円滑にジョブを実行することができます。

FAQ

環境変数を設定して、ジョブを投入したい

ジョブの環境変数の設定は、投入するシェルスクリプトの種類に依存します。
csh スクリプトをジョブとして投入する際には、$HOME/.cshrc が読み込まれますが、Perl スクリプトをジョブとして投入する際には、$HOME/.cshrc は読み込まれません。
Perl スクリプト等を実行する際に、環境変数を設定するためには、-v オプションを使用します。 qsub -v LD_LIBRARY_PATH=$HOME/lib:$LD_LIBRARY_PATH,PATH=$HOME/bin:$PATH ¥      -S /usr/local/bin/perl ¥      [Perl スクリプト名]
下記のように、Perl スクリプト内に UGE オプションを記述することもできます。 #!/usr/local/bin/perl #$ -S /usr/local/bin/perl #$ -v LD_LIBRARY_PATH=$HOME/lib:$LD_LIBRARY_PATH,PATH=$HOME/bin:$PATH

R を実行したい

バッチモードで R を実行することで、R を UGE で実行できます。
まず、以下のような R コマンドを含むテキストファイルを作成してください。 ファイル名:/home/[userID]/r_batch.R

x <- matrix(1:12,3,4)
x
R をバッチモードで実行するシェルスクリプトを作成します。 ファイル名:/home/[userID]/R.sh

#!/bin/tcsh
#$ -S /bin/tcsh
/usr/local/bin/R CMD BATCH /home/[userID]/r_batch.R

qsub し、ジョブを投入します。 qsub /home/[userID]/R.sh
実行結果は R がホームディレクトリに [R コマンドを含むファイル名]out の名前で出力します。

ジョブを専有キューに投入したい

専有コアを持つユーザは、専有キューをご利用いただけます。qsub 時にオプションを指定せずにジョブを投入すると、SHIROKANE ではキューの使用状況に応じて mjobs.q、ljobs.q、lmem.q、専有キューのいずれかに投入されます。専有キューのみに投入する際には、以下ようにオプションを指定してジョブを投入する必要があり ます。 % qsub -q [専有キュー名] [シェルスクリプト名]
専有キューは実行時間の上限を設定しておりません。ljobs.q が混み合っている際に、上記の通り指定することで、専有キューで実行時間の長いジョブを実行することができます。
[専有キュー名] は、通常は、 [グループ名 + ".q"] です。 hgc0361 グループの場合は hgc0361.q になります。
ご自身のグループ名は、以下の id コマンドで表示されます。 % id -gn

qstat コマンド実行時にエラーが出力される

qstat コマンド実行時に以下のようなエラーが出力される % qstat -f
error: commlib error: got select error (Connection refused)
error: unable to send message to qmaster using port 6444 on host "c722i": got send error
%

保守作業や計算機の高負荷により Univa Grid Engine のマスターデーモンの切り替わりが発生している、もしくは障害によりマスターデーモンが停止しているためこのようなメッセージが表示されることがあります。
マスターデーモンは自動的に復帰しますのでしばらくお待ちください。通常 5 分程度で qstat コマンドが発行できるようになります。障害による停止の場合は、対応状況を以下のページに随時アップしております。こちらの Web ページからご確認ください。

自分の利用可能スロット数を知りたい

qfree コマンドで確認できます。申請利用コースの利用可能スロット数がキューごとに、 QUOTA LIMIT 列、その内の利用しているスロット数が [USER] JOBS 、[GROUP] JOBS 列に表示されます。
% qfree 
SUMMARY OF RUNNING JOBS

                 [USER] [GROUP] QUOTA      ALL                  
        QNAME     JOBS     JOBS  LIMIT     JOBS AVAIL STDBY  TOTAL
------------- ----------------- ------ ---------------------------
         cp.q        0        0      0        1    95     0     96
       intr.q        2        8      0      111    70     0    192
      ljobs.q        0        0      0      675    35    96   1488
       lmem.q        0        0      0       35    21     0     60
      mjobs.q        0        0      0     2089  1850   456   4992
mjobs_rerun.q        0        0      0       64  1262  1752   3024
        web.q        0        0      0        0    48     0     48
------------- ----------------- ------ ---------------------------
                     2        8      0     2975  3381  2304   9900

THE NUMBER OF RUNNING JOBS BY USER IN THE GROUP [GROUP]

        QNAME     userA     userB     userC     userD     userE
------------- --------------------------------------------------
         cp.q         0         0         0         0         0
       intr.q         3         2         1         1         1
      ljobs.q         0         0         0         0         0
       lmem.q         0         0         0         0         0
      mjobs.q         0         0         0         0         0
mjobs_rerun.q         0         0         0         0         0
        web.q         0         0         0         0         0
           qw         0         0         0         0         0
------------- --------------------------------------------------
各列の意味は、以下の通りです。
列名説明
[USER] JOBS [USER] ユーザが利用しているスロット数。 [USER] は、 qfree コマンドを実行したユーザ名が表示されます。
[GROUP] JOBS [GROUP] グループのユーザが利用しているスロット数。 [GROUP] は、 qfree コマンドを実行したユーザのグループが表示されます。
QUOTA LIMIT [GROUP] グループが利用できるスロット数の上限。0 の場合は、グループごとの制限はありません。 (TOTAL 列に表示されているスロット数まで利用できます)
ALL JOBS 全ユーザが実行しているジョブが利用しているスロット数
AVAIL 要求メモリ量を 2 GB としたときのジョブをすぐに実行できるスロット数
STDBY サスペンドや停止している計算ノードのスロット数。 (ジョブが少なく休止している計算ノード、障害のため停止してる計算ノードに設定されているスロット数。休止している計算ノードは、ジョブがサブミットされ、実行待ちのジョブが増えると自動的に起動します)
TOTAL キューごとのスロット数
引数にユーザ名、グループ名を指定すると、指定したユーザ、グループの情報を表示します。 % qfree [USER] % qfree [USER] [GROUP]
"-h" オプションを利用すると、ヘルプを表示します。 % qfree -h

ページトップへ ページトップへ

医科学研究所 東京大学

Copyright©2005-2018 Human Genome Center