Quantcast
Channel: FOCUSスパコン利用案内
Viewing all articles
Browse latest Browse all 881

4.1.キュー

$
0
0

目次 (4.1.キュー)

4.1.   キュー
4.1.1.  キューの一覧
4.1.2.  キュー情報の確認方法
4.1.3.  利用可能なノード数の確認方法

 

▲このページの先頭へ

4.1.キュー

 

4.1.1.キューの一覧

フロントエンドサーバから演算ノードに対して、ジョブを投入できるキューの一覧を示します。
表4.1.1 キューの一覧

キュー名 最大ジョブ数 最大ジョブ投入数 最長実行時間 最大ノード数(※) ジョブあたり最大ノード数(※) システム 備考
a024h 未設定 無制限 24時間 224 224 A  
a096h 未設定 5/ユーザ 96時間 100 100 A  
b024h 未設定 無制限 24時間 2 2 B  
b096h 未設定 5/ユーザ 96時間 1 1 B  
c024h 未設定 無制限 24時間 22 22 C  
c096h 未設定 5/ユーザ 96時間 11 11 C  
d024h 未設定 無制限 24時間 80 80 D  
d072h 未設定 5/ユーザ 72時間 40 40 D  
e024h 未設定 無制限 24時間 48 16 E  
e072h 未設定 5/ユーザ 72時間 24 8 E  
debug6m 未設定 5/ユーザ 6分 4 2 G デフォルトキュー

※最大ノード数は計算資源の予約状況により変動します。

(1)デフォルトキューは「debug6m」となります。ジョブ実行時にキュー名が省略された場合「debug6m」で実行されます。

(2)実際に本システムを利用する際には、sinfo -s コマンドで利用できるキュー名を確認して下さい。

(3)キューのノード実行状況を確認する際には、squeuesコマンドで確認して下さい。

 

▲このページの先頭へ

4.1.2.キュー情報の確認方法

ジョブ投入先のキュー名を確認するには、sinfoコマンドを実行します。

$ sinfo -s

 

【実行例】

$ sinfo -s
PARTITION  AVAIL  TIMELIMIT   NODES(A/I/O/T)  NODELIST
a024h         up 1-00:00:00     0/224/0/224  a[001-224]
a096h         up 3-00:00:00     0/100/0/100  a[001-100]
b024h         up 1-00:00:00         0/2/0/2  b[001-002]
b096h         up 3-00:00:00         0/1/0/1  b001
c024h         up 1-00:00:00       0/20/0/20  c[001-020]
c096h         up 3-00:00:00       0/10/0/10  c[001-010]
d024h         up 1-00:00:00       0/80/0/80  d[001-080]
d096h         up 3-00:00:00       0/40/0/40  d[001-040]
e024h         up 1-00:00:00       0/48/0/48  e[001-048]
e096h         up 3-00:00:00       0/24/0/24  e[001-024]
debug6m       up       6:00         0/4/0/4  g[001-004]

 

<出力説明>

PARTITION キュー名(パーティション名)
AVAIL キューの状態(up or inact)
TIMELIMIT 最大実行時間
NODES(A/I/O/T) ノードの状態(allocated/idle/other/total)
NODELIST キュー(パーティション)に割り当てられたノード

 

キューのノード実行状況を確認するには、squeuesコマンドを実行します。

注意:SLURMの標準コマンドのsqueueとは別コマンドです。

$ squeues

 

【実行例】

$ squeues
QUEUE_NAME      TIMELIMIT  STATUS MAXNODES NNODES PEND RUN
a024h           1-00:00:00 up          222      2    0   2
a096h           4-00:00:00 up          100      0    0   0
b024h           1-00:00:00 up            2      0    0   0
b096h           4-00:00:00 up            2      0    0   0
c024h           1-00:00:00 up           18      0    0   0
c096h           4-00:00:00 up            9      0    0   0
d024h           1-00:00:00 up           80      3    0   3
d072h           3-00:00:00 up           40      0    0   0
e024h           1-00:00:00 up           32     21    0  21
e072h           3-00:00:00 up           16      0    0   0
debug6m*        6:00       up            4      0    0   0

<出力説明>

QUEUE_NAME キュー名(パーティション名)
TIMELIMIT 最大実行時間
STATUS キューの状態(up or inact)
MAXNODES 最大ノード数
NNODES 実行中及び実行待ちのジョブが要求しているノード数
PEND 実行待ちのジョブが要求しているノード数
RUN 実行中のノード数

 

▲このページの先頭へ

4.1.3.利用可能なノード数の確認方法

空きノード数を確認するfreenodesというコマンドを用意しています。ジョブ投入のための空きノード数の確認の目安にご利用ください。

$ freenodes

【出力形式】

Number of free nodes in A sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in B sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in C sys. with GbE    connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in D sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in E sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in G sys. with GbE    connected is 空きノード数 / 提供最大ノード数.

 

【実行例】

$ freenodes
Number of free nodes in A sys. with FDR-IB connected is 108/224 .
Number of free nodes in B sys. with FDR-IB connected is   2/  2 .
Number of free nodes in C sys. with GbE    connected is   8/ 20 .
Number of free nodes in D sys. with FDR-IB connected is  76/ 80 .
Number of free nodes in E sys. with FDR-IB connected is  14/ 14 .
Number of free nodes in G sys. with GbE    connected is   2/  4 .

 

▲このページの先頭へ



Viewing all articles
Browse latest Browse all 881

Trending Articles