地球シミュレータES(第一世代)システム概要


地球シミュレータES(第一世代)システム概要

システムの概要(ES)

オペレーティングシステム

ESで使用されているOSは、NECの SXシリーズのスーパーコンピュータのために開発された「SUPER-UX」といわれるNEC UNIXベースのOSの機能を拡張させたものである。超大型科学技術計算を支援するため、SUPER-UXは主に以下の2点についての機能強化が図られた。

  • スケーラビリティの確保
  • ES専用機能の提供


ESに搭載するオペレーティングシステムには、システム全体(640PN)までスケーラビリティを確保することが求められる。この要求を満たすために、プロセス,メモリ, ファイルの管理といったOSの全ての機能は十分に最適化されている。例えば、全PNにデータを逐次的に配るようなオーダn(ノード数をnとする)の処理は、可能な限り、二分木コピーのようなオーダlog nの等価な処理で置き換えられた。一方、OSは大規模システムを効果的に使用するための特別な機能を有している。その機能とは、INを経由しての計算ノード間の高速通信、複数の計算ノード間でのグローバルアドレス、スーパークラスタシステム(図1)、バッチジョブ環境などである。


図1:スーパークラスタシステム: 640計算ノードを有するESを管理するため、階層構造の管理システムが導入されている。全ての16個の計算ノードはクラスタを構成している。従って、全体で40クラスタとなる。その一つは「Sクラスタ」と呼ばれ、会話型処理や小規模のバッチジョブ用として割り当てられている。その他の39クラスタは「Lクラスタ」と呼ばれ、中規模あるいは大規模のバッチジョブ用として割り当てられている。多くの計算ノードを使用して行われる並列ジョブは、いくつかのクラスタを使用して処理される。各々のクラスタでは、クラスタ制御ステーション(CCS)により、計算ノードの状況監視や、そのクラスタに所属する計算ノードの電力制御が行われる。スーパークラスタ制御ステーション(SCCS)は、全てのCCSを統括する重要な任務を帯びている。


戻る