Quantcast
Channel: FOCUSスパコン利用案内
Viewing all articles
Browse latest Browse all 874

4.1.キュー

$
0
0

目次 (4.1.キュー)

4.1.   キュー
4.1.1.  キューの一覧
4.1.2.  キュー情報の確認方法
4.1.3.  利用可能なノード数の確認方法

 

▲このページの先頭へ

4.1.キュー

 

4.1.1.キューの一覧

フロントエンドサーバから演算ノードに対して、ジョブを投入できるキューの一覧を示します。
表4.1.1 キューの一覧

キュー名 最大ジョブ数 最大ジョブ投入数 最長実行時間 最大
ノード数(※1)
ジョブあたり
最大
ノード数(※2)
実行
システム
備考
a024h 未設定 200/利用者 24時間 224 224 A  
a072h 未設定 10/利用者 72時間 110 110 A  
b024h 未設定 2/利用者 24時間 2 2 B  
b072h 未設定 2/利用者 72時間 2 2 B  
c024h 未設定 200/利用者 24時間 22 22 C  
c072h 未設定 10/利用者 72時間 9 9 C  
d024h 未設定 200/利用者 24時間 80 80 D 下記(5)参照
d072h 未設定 10/利用者 72時間 38 38 D 下記(5)参照
e024h 未設定 200/利用者 24時間 48 48 E Phi1基、下記(6)参照
e024h_phi 未設定 200/利用者 24時間 4 4 E Phi4基、下記(6)参照
e072h 未設定 10/利用者 72時間 22 22 E Phi1基、下記(6)参照
f024h 未設定 200/利用者 24時間 14 14 F  
f024h_p100 未設定 200/利用者 24時間 2 2 F P100 搭載
f072h 未設定 10/利用者 72時間 5 5 F  
h024h 未設定 200/利用者 24時間 136 136 H  
h072h 未設定 10/利用者 72時間 67 67 H  
a006m 未設定 2/利用者 6分 2 2 A 下記(4)参照
b006m 未設定 2/利用者 6分 2 2 B 下記(4)参照
c006m 未設定 2/利用者 6分 2 2 C 下記(4)参照
d006m 未設定 2/利用者 6分 2 2 D 下記(4)(5)参照
e006m 未設定 2/利用者 6分 2 2 E Phi4基、下記(4)(6)参照
f006m 未設定 2/利用者 6分 2 2 F P100 搭載、下記(4)参照
g006m 未設定 2/利用者 6分 2 2 G 下記(3)(4)参照
h006m 未設定 2/利用者 6分 3 3 H 下記(4)参照

※1 最大ノード数は計算資源の予約状況により変動します。
※2 ジョブあたり最大ノード数は計算資源の混雑状況により変動します。

(1)実際に本システムを利用する際には、sinfo -s コマンドで利用できるキュー名を確認して下さい。

(2)キューのノード実行状況を確認する際には、squeuesコマンドで確認して下さい。

(3)デフォルトキューは「g006m」となります。ジョブ実行時にキュー名が省略された場合「g006m」で実行されます。

(4)デバッグキューです。計算資源利用料金は発生しません。デバッグ(ソフトウェアの動作検証等)にご利用ください。
  なお、FOCUS スパコン従量利用ソフトウェア(Gaussian09 等)を実行した場合、計算資源利用料金は発生しませんが、
  ソフトウェア利用料金は発生します。

(5) 【H28.04.12現在】下記のソフトウェアにてDシステム上で
  ジョブを実行した際にジョブが正常に実行されない場合があるとの報告があります。
  各ソフトウェアをご利用の際は下記のとおりご対応ください。
 
・ANSYS CFX : 回避策をベンダーにお問い合わせください。
(6) 【H28.04.12現在】下記のソフトウェアにてEシステム上で
  ジョブを実行した際にジョブが正常に実行されない場合があるとの報告があります。
  各ソフトウェアをご利用の際は下記のとおりご対応ください。
 
・ANSYS FLUENT : 回避策をベンダーにお問い合わせください。
・ANSYS CFX : Eシステムの利用を回避してください。
・STAR-CCM+ : Eシステムの利用を回避してください。
 
その他ソフトウェアのEシステムでの稼働状況につきましては提供ベンダーにお問い合わせください。
 


 

▲このページの先頭へ

4.1.2.キュー情報の確認方法

ジョブ投入先のキュー名を確認するには、sinfoコマンドを実行します。

$ sinfo -s

 

【実行例】

$ sinfo -s
PARTITION AVAIL  TIMELIMIT   NODES(A/I/O/T)  NODELIST
a024h        up 1-00:00:00      0/196/1/197  a[014-016,030-095,097-224]
b024h        up 1-00:00:00          0/2/0/2  b[001-002]
c024h        up 1-00:00:00        0/22/0/22  c[001-022]
d024h        up 1-00:00:00        0/76/0/76  d[005-080]
e024h        up 1-00:00:00        0/45/0/45  e[004-048]
e024h_phi    up 1-00:00:00          0/4/0/4  e[045-048]
f024h        up 1-00:00:00        0/14/0/14  f[201-212,601-602]
f024h_p100   up 1-00:00:00          0/2/0/2  f[601-602]
h024h        up 1-00:00:00      0/132/0/132  h[005-136]
g006m*       up       6:00          0/2/0/2  g[003-004]
a006m        up       6:00          0/2/0/2  a[223-224]
b006m        up       6:00          0/2/0/2  b[001-002]
c006m        up       6:00          0/2/0/2  c[021-022]
d006m        up       6:00          0/2/0/2  d[079-080]
e006m        up       6:00          0/2/0/2  e[047-048]
f006m        up       6:00          0/2/0/2  f[601-602]
h006m        up       6:00          0/3/0/3  h[068,102,136]

 

<出力説明>

PARTITION キュー名(パーティション名)
AVAIL キューの状態(up or inact)
TIMELIMIT 最大実行時間
NODES(A/I/O/T) ノードの状態(allocated/idle/other/total)
NODELIST キュー(パーティション)に割り当てられたノード

 

キューのノード実行状況を確認するには、squeuesコマンドを実行します。

注意:SLURMの標準コマンドのsqueueとは別コマンドです。

$ squeues

 

【実行例】

$ squeues
QUEUE_NAME       TIMELIMIT   STATUS MAXNODES NNODES DEPEND PEND RUN FREE
a024h           1-00:00:00       up      196      0      0    0   0  196
b024h           1-00:00:00       up        2      0      0    0   0    2
c024h           1-00:00:00       up       22      0      0    0   0   22
d024h           1-00:00:00       up       76      0      0    0   0   76
e024h           1-00:00:00       up       45      0      0    0   0   45
e024h_phi       1-00:00:00       up        4      0      0    0   0    4
f024h           1-00:00:00       up       14      0      0    0   0   14
f024h_p100      1-00:00:00       up        2      0      0    0   0    2
h024h           1-00:00:00       up      132      0      0    0   0  132
g006m                 6:00       up        2      0      0    0   0    2
a006m                 6:00       up        2      0      0    0   0    2
b006m                 6:00       up        2      0      0    0   0    2
c006m                 6:00       up        2      0      0    0   0    2
d006m                 6:00       up        2      0      0    0   0    2
e006m                 6:00       up        2      0      0    0   0    2
f006m                 6:00       up        2      0      0    0   0    2
h006m                 6:00       up        3      0      0    0   0    3

 

<出力説明>

QUEUE_NAME キュー名(パーティション名)
TIMELIMIT 最大実行時間
STATUS キューの状態(up or inact)
MAXNODES 最大ノード数
NNODES 実行中及び実行待ちのジョブが要求しているノード数
DEPEND 実行待ち(Dependency)のジョブが要求しているノード数
PEND 実行待ちのジョブが要求しているノード数
RUN 実行中のノード数
FREE 空きノード数

 

▲このページの先頭へ

4.1.3.利用可能なノード数の確認方法

空きノード数を確認するfreenodesというコマンドを用意しています。ジョブ投入のための空きノード数の確認の目安にご利用ください。

$ freenodes

【出力形式】

Number of free nodes in A sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in B sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in C sys. with GbE    connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in D sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in E sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in F sys. with FDR-IB connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in G sys. with 10GbE  connected is 空きノード数 / 提供最大ノード数.
Number of free nodes in H sys. with 10GbE  connected is 空きノード数 / 提供最大ノード数.

 

【実行例】

$ freenodes
Number of free nodes in A sys. with FDR-IB connected is 196/196 .
Number of free nodes in B sys. with FDR-IB connected is   0/  2 .
Number of free nodes in C sys. with GbE    connected is  19/ 22 .
Number of free nodes in D sys. with FDR-IB connected is  68/ 75 .
Number of free nodes in E sys. with FDR-IB connected is  35/ 44 .
Number of free nodes in F sys. with FDR-IB connected is   1/ 14 .
Number of free nodes in G sys. with 10GbE  connected is   4/  4 .
Number of free nodes in H sys. with 10GbE  connected is 132/132 .

 

▲このページの先頭へ



Viewing all articles
Browse latest Browse all 874

Trending Articles