■ユーザーコマンド | SLURM | LSF |
ジョブ実行 | sbatch [script_file] | bsub [script_file] |
ジョブキャンセル | scancel [job_id] | bkill [job_id] |
ジョブ実行状況(ジョブ毎) | squeue ?j [job_id] | bjobs [job_id] |
ジョブ実行状況(ユーザー毎) | squeue -u [user_name] | bjobs -u [user_name] |
ジョブのホールド | scontrol hold [job_id] | bstop [job_id] |
ジョブのリリース | scontrol release [job_id] | bresume [job_id] |
キューリストの表示 | squeue | bqueues |
ノードリストの表示 |
sinfo -N または scontrol show node |
bhosts |
クラスタ全体のステータス | sinfo | bqueues |
■環境変数など | SLURM | LSF |
ジョブID | $SLURM_JOBID | $LSB_JOBID |
実行ディレクトリ指定 | $SLURM_SUBMIT_DIR | $LSB_SUBCWD |
実行ホストの指定 | $SLURM_SUBMIT_HOST | $LSB_SUB_HOST |
ノードリストの表示 | $SLURM_JOB_NODELIST | $LSB_HOSTS/LSB_MCPU_HOST |
アレイジョブのインデックス表示 | $SLURM_ARRAY_TASK_ID | $LSB_JOBINDEX |
依存ジョブのインデックス表示 | $SLURM_JOB_DEPENDENCY | - |
■ジョブの詳細 | SLURM | LSF |
バッチスクリプトのディレクティブ | #SBATCH | #BSUB |
キュー(パーティション)指定 | -p [queue] | -q [queue] |
実行ノード数 | -N [min[-max]] | -n [count] |
プロセス数の指定 | -n [count] | -n [count] |
実行時間の上限指定(wall time) |
-t [min] または -t [days-hh:mm:ss] |
-W [hh:mm:ss] |
出力ファイル指定 | -o [file_name] | -o [file_name] |
エラー出力指定 | -e [file_name] | -e [file_name] |
出力・エラー出力の総合出力 | (-e指定無しで-oを使用) | (-e指定無しで-oを使用) |
イベント通知 | --mail-type=[events] |
-B または -N |
イベント通知先メールアドレス指定 | --mail-user=[address[,address]] | -u [address] |
ジョブ再投入 |
--requeue または --no-requeue (未指定時は--no-requeue) |
-r |
実行ディレクトリ指定 | --workdir=[dir_name] | (submission directory) |
メモリサイズ指定 |
--mem=[mem][M|G|T] または --mem-per-cpu=[mem][M|G|T] |
-M [MB] |
アカウント名の変更 | --account=[account] | -P [account] |
ノード当たりのタスク数指定 | --tasks-per-node=[count] | - |
タスク当たりのCPU数指定 | --cpus-per-task=[count] | - |
依存ジョブ | --dependency=[type:job_id] | - |
ジョブのプロジェクト化 | --wckey=[name] | -P [name] |
ジョブ実行ホストの詳細 |
--nodelist=[nodes] または --exclude=[nodes] |
-m [nodes] |
アレイジョブ | --array=[array_spec] | J "name[array_spec]" |
ライセンスの指定 | --licenses=[license_spec] | -R "rusage[license_spec]" |
開始時間指定 | --begin=YYYY-MM-DD[THH:MM[:SS]] | -b[[year:][month:]daty:]hour:minute |