Quantcast
Channel: FOCUSスパコン利用案内
Viewing all articles
Browse latest Browse all 874

4.1.キュー

$
0
0

目次 (4.1.キュー)

4.1.   キュー
4.1.1.  キューの一覧
4.1.2.  キュー情報の確認方法
4.1.3.  利用可能なノード数の確認方法

 

▲このページの先頭へ

4.1.キュー

 

4.1.1.キューの一覧

フロントエンドサーバから演算ノードに対して、ジョブを投入できるキューの一覧を示します。
表4.1.1 キューの一覧

キュー名 最大ジョブ数 最大ジョブ投入数 最長実行時間 最大ノード数(※1) ジョブあたり最大ノード数(※2) 実行システム 備考
a024h 未設定 200/利用者 24時間 224 224 A  
b024h 未設定 2/利用者 24時間 2 2 B  
c024h 未設定 200/利用者 24時間 20 20 C  
d024h 未設定 200/利用者 24時間 80 80 D 下記(5)参照
e024h 未設定 200/利用者 24時間 44 16 E Phi1基、下記(6)参照
e024h_phi 未設定 200/利用者 24時間 4 4 E Phi4基、下記(6)参照
f024h 未設定 無制限 24時間 12 12 F  
h024h 未設定 200/利用者 24時間 136 136 H  
a006m 未設定 5/利用者 6分 2 2 A 下記(4)参照
b006m 未設定 5/利用者 6分 2 2 B 下記(4)参照
c006m 未設定 5/利用者 6分 2 2 C 下記(4)参照
d006m 未設定 5/利用者 6分 2 2 D 下記(4)(5)参照
e006m 未設定 5/利用者 6分 2 2 E Phi4基、下記(4)(6)参照
f006m 未設定 5/利用者 6分 2 2 F 下記(4)参照
g006m 未設定 5/利用者 6分 2 2 G 下記(1)(4)参照
h006m 未設定 5/利用者 6分 2 2 H 下記(4)参照

※1 最大ノード数は計算資源の予約状況により変動します。
※2 ジョブあたり最大ノード数は計算資源の混雑状況により変動します。

(1)デフォルトキューは「g006m」となります。ジョブ実行時にキュー名が省略された場合「g006m」で実行されます。

(2)実際に本システムを利用する際には、sinfo -s コマンドで利用できるキュー名を確認して下さい。

(3)キューのノード実行状況を確認する際には、squeuesコマンドで確認して下さい。

(4)デバッグキューです。計算資源利用料金は発生しません。デバッグ(ソフトウェアの動作検証等)にご利用ください。
  なお、FOCUS スパコン従量利用ソフトウェア(Gaussian09 等)を実行した場合、計算資源利用料金は発生しませんが、
  ソフトウェア利用料金は発生します。

(5) 【H28.04.12現在】下記のソフトウェアにてDシステム上で
  ジョブを実行した際にジョブが正常に実行されない場合があるとの報告があります。
  各ソフトウェアをご利用の際は下記のとおりご対応ください。
 
・ANSYS CFX : 回避策をベンダーにお問い合わせください。
(6) 【H28.04.12現在】下記のソフトウェアにてEシステム上で
  ジョブを実行した際にジョブが正常に実行されない場合があるとの報告があります。
  各ソフトウェアをご利用の際は下記のとおりご対応ください。
 
・ANSYS FLUENT : 回避策をベンダーにお問い合わせください。
・ANSYS CFX : Eシステムの利用を回避してください。
・STAR-CCM+ : Eシステムの利用を回避してください。
 
その他ソフトウェアのEシステムでの稼働状況につきましては提供ベンダーにお問い合わせください。
 


 

▲このページの先頭へ

4.1.2.キュー情報の確認方法

ジョブ投入先のキュー名を確認するには、sinfoコマンドを実行します。

$ sinfo -s

 

【実行例】

$ sinfo -s
PARTITION   AVAIL     TIMELIMIT   NODES(A/I/O/T)    NODELIST
a024h                up       1-00:00:00           0/196/1/197    a[014-016,030-095,097-224]
b024h                up       1-00:00:00                  0/2/0/2     b[001-002]
c024h                up       1-00:00:00              0/22/0/22     c[001-022]
d024h               up        1-00:00:00              0/76/0/76    d[005-080]
e024h               up        1-00:00:00              0/45/0/45    e[004-048]
e024h_phi        up        1-00:00:00                  0/4/0/4    e[045-048]
f024h               up        1-00:00:00               0/12/0/12    f[201-212]
h024h              up        1-00:00:00           0/132/0/132    h[005-136]
g006m*           up                   6:00                   0/2/0/2    g[003-004]
a006m            up                   6:00                   0/2/0/2    a[223-224]
b006m            up                   6:00                   0/2/0/2    b[001-002]
c006m            up                   6:00                   0/2/0/2    c[021-022]
d006m            up                   6:00                   0/2/0/2    d[079-080]
e006m            up                   6:00                   0/2/0/2    e[047-048]
f006m             up                   6:00                   0/2/0/2    f[211-212]
h006m            up                   6:00                   0/2/0/2    h[068,102,136]

 

<出力説明>

PARTITION キュー名(パーティション名)
AVAIL キューの状態(up or inact)
TIMELIMIT 最大実行時間
NODES(A/I/O/T) ノードの状態(allocated/idle/other/total)
NODELIST キュー(パーティション)に割り当てられたノード

 

キューのノード実行状況を確認するには、squeuesコマンドを実行します。

注意:SLURMの標準コマンドのsqueueとは別コマンドです。

$ squeues

 

【実行例】

$ squeues
QUEUE_NAME TIMELIMIT STATUS MAXNODES NNODES DEPEND PEND RUN FREE
a024h     1-00:00:00     up      126      0      0    0   0  124
a096h     4-00:00:00     up       50      2      0    0   2   48
b024h     1-00:00:00     up        2      0      0    0   0    2
b096h     4-00:00:00     up        1      0      0    0   0    1
c024h     1-00:00:00     up       16      0      0    0   0   16
c096h     4-00:00:00     up        8      0      0    0   0    8
c006m           6:00     up        2      0      0    0   0    2
d024h     1-00:00:00     up       56     51     36    0  15   34
d072h     3-00:00:00     up       40      7      0    0   7   24
e024h     1-00:00:00     up       37     14      0    0  14   11
e072h     3-00:00:00     up       24     12      0    0  12    2
e024h_phi 1-00:00:00     up        4      0      0    0   0    4
f024h     1-00:00:00     up       12      0      0    0   0   12
g024h     1-00:00:00     up        4      0      0    0   0    4
h024h     1-00:00:00     up       68      0      0    0   0   68

<出力説明>

QUEUE_NAME キュー名(パーティション名)
TIMELIMIT 最大実行時間
STATUS キューの状態(up or inact)
MAXNODES 最大ノード数
NNODES 実行中及び実行待ちのジョブが要求しているノード数
DEPEND 実行待ち(Dependency)のジョブが要求しているノード数
PEND 実行待ちのジョブが要求しているノード数
RUN 実行中のノード数
FREE 空きノード数

 

▲このページの先頭へ

4.1.3.利用可能なノード数の確認方法

空きノード数を確認するfreenodesというコマンドを用意しています。ジョブ投入のための空きノード数の確認の目安にご利用ください。

$ freenodes

【出力形式】

Number of free nodes in A sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in B sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in C sys. with GbE    connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in D sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in E sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in F sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in G sys. with 10GbE  connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in H sys. with 10GbE  connected is 空きノード数 / 提供最大ノード数.

 

【実行例】

$ freenodes
Number of free nodes in A sys. with FDR-IB connected is 108/224 .
Number of free nodes in B sys. with FDR-IB connected is   2/  2 .
Number of free nodes in C sys. with GbE    connected is   8/ 20 .
Number of free nodes in D sys. with FDR-IB connected is  76/ 80 .
Number of free nodes in E sys. with FDR-IB connected is  14/ 14 .
Number of free nodes in F sys. with FDR-IB connected is  11/ 12 .
Number of free nodes in G sys. with 10GbE  connected is   2/  4 .
Number of free nodes in H sys. with 10GbE  connected is  68/ 68 .

 

▲このページの先頭へ



Viewing all articles
Browse latest Browse all 874

Trending Articles