目次 (4.1.キュー)
4.1. キュー
4.1.1. キューの一覧
4.1.2. キュー情報の確認方法
4.1.3. 利用可能なノード数の確認方法
4.1.キュー
4.1.1.キューの一覧
フロントエンドサーバから演算ノードに対して、ジョブを投入できるキューの一覧を示します。
表4.1.1 キューの一覧
キュー名 | 最大ジョブ数 | 最大ジョブ投入数 | 最長実行時間 | 最大ノード数(※) | ジョブあたり最大ノード数(※) | システム | 備考 |
a024h | 未設定 | 無制限 | 24時間 | 224 | 224 | A | |
a096h | 未設定 | 5/ユーザ | 96時間 | 224 | 112 | A | |
b024h | 未設定 | 無制限 | 24時間 | 2 | 2 | B | |
b096h | 未設定 | 5/ユーザ | 96時間 | 2 | 1 | B | |
c024h | 未設定 | 無制限 | 24時間 | 22 | 22 | C | |
c096h | 未設定 | 5/ユーザ | 96時間 | 22 | 11 | C | |
d024h | 未設定 | 無制限 | 24時間 | 80 | 80 | D | |
d072h | 未設定 | 5/ユーザ | 72時間 | 80 | 40 | D | |
e024h | 未設定 | 無制限 | 24時間 | 48 | 16 | E | |
e072h | 未設定 | 5/ユーザ | 72時間 | 48 | 8 | E | |
debug6m | 未設定 | 5/ユーザ | 6分 | 4 | 2 | G | デフォルトキュー |
※最大ノード数、計算資源の予約状況により変動します。
(1)デフォルトキューは「debug6m」となります。ジョブ実行時にキュー名が省略された場合「debug6m」で実行されます。
(2)実際に本システムを利用する際には、sinfo -s コマンドで利用できるキュー名を確認して下さい。
(3)キューのノード実行状況を確認する際には、squeuesコマンドで確認して下さい。
4.1.2.キュー情報の確認方法
ジョブ投入先のキュー名を確認するには、sinfoコマンドを実行します。
$ sinfo -s |
【実行例】
$ sinfo -s PARTITION AVAIL TIMELIMIT NODES(A/I/O/T) NODELIST a024h up 1-00:00:00 0/224/0/224 a[001-224] a096h up 3-00:00:00 0/224/0/224 a[001-224] b024h up 1-00:00:00 0/2/0/2 b[001-002] b096h up 3-00:00:00 0/2/0/2 b[001-002] c024h up 1-00:00:00 0/20/0/20 c[001-224] c096h up 3-00:00:00 0/20/0/20 c[001-224] d024h up 1-00:00:00 0/80/0/80 d[001-080] d096h up 3-00:00:00 0/80/0/80 d[001-080] e024h up 1-00:00:00 0/48/0/48 e[001-044] e096h up 3-00:00:00 0/48/0/48 e[001-044] debug6m up 6:00 0/2/0/2 e[045-046] |
<出力説明>
PARTITION | キュー名(パーティション名) |
AVAIL | キューの状態(up or inact) |
TIMELIMIT | 最大実行時間 |
NODES(A/I/O/T) | ノードの状態(available/idle/other/total) |
NODELIST | キュー(パーティション)に割り当てられたノード |
キューのノード実行状況を確認するには、squeuesコマンドを実行します。
注意:SLURMの標準コマンドのsqueueとは別コマンドです。
$ squeues |
【実行例】
$ squeues QUEUE_NAME TIMELIMIT STATUS MAXNODES NNODES PEND RUN a024h 1-00:00:00 up 222 2 0 2 a096h 4-00:00:00 up 222 0 0 0 ma002yim infinite up 2 0 0 0 b024h 1-00:00:00 up 2 0 0 0 b096h 4-00:00:00 up 2 0 0 0 c024h 1-00:00:00 up 18 0 0 0 c096h 4-00:00:00 up 18 0 0 0 yc004ooh infinite up 4 0 0 0 d024h 1-00:00:00 up 80 3 0 3 d072h 3-00:00:00 up 80 0 0 0 e024h 1-00:00:00 up 32 21 0 21 e072h 3-00:00:00 up 32 0 0 0 ye001uta3m 3:00 up 16 0 0 0 ye016uta24h 1-00:00:00 up 16 0 0 0 ye016uta72h 3-00:00:00 up 16 0 0 0 ye004uta48h 2-00:00:00 up 16 0 0 0 debug6m* 6:00 up 4 0 0 0 |
<出力説明>
QUEUE_NAME | キュー名(パーティション名) |
TIMELIMIT | 最大実行時間 |
STATUS | キューの状態(up or inact) |
MAXNODES | 最大ノード数 |
NNODES | キュー(パーティション)に割り当てられているノード |
PEND | 予約済みで待ち状態のノード数 |
RUN | 実行中のノード数 |
4.1.3.利用可能なノード数の確認方法
空きノード数を確認するfreenodesというコマンドを用意しています。ジョブ投入のための空きノード数の確認の目安にご利用ください。
$ freenodes |
【出力形式】
Number of free nodes in A sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数. Number of free nodes in B sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数. Number of free nodes in C sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数. Number of free nodes in D sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数. Number of free nodes in E sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数. Number of free nodes in G sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数. |
【実行例】
$ freenodes Number of free nodes in A sys. with FDR-IB connected is 108 / 224 . Number of free nodes in B sys. with FDR-IB connected is 2 / 2 . Number of free nodes in C sys. with FDR-IB connected is 8 / 20 . Number of free nodes in D sys. with FDR-IB connected is 76 / 80 . Number of free nodes in E sys. with FDR-IB connected is 14 / 14 . Number of free nodes in G sys. with FDR-IB connected is 2 / 4 . |