性能
地球シミュレータはピーク性能40Tflops(1秒間で40兆回の計算ができる)とともに、実際にプログラムを実行したときの実効性能が高いのが特徴です。
【ピーク性能】
演算性能 | 40 TFLOPS |
---|---|
1ノードあたり | 64 GFLOPS |
1プロセッサあたり | 8 GFLOPS |
TFLOPS: Tera Floating Operations
per Second
GFLOPS: Giga Foating Operations per Second
GFLOPS: Giga Foating Operations per Second
【実効性能】
以下のグラフは、各種のプログラムを高並列で実行した時の性能が、ピーク性能(理論上そのシステムが出しうる最大の性能)の何%で実行できるかを示しています。 高並列のシステムはピーク性能比が5%~10%程度と言われることもありますが、地球シミュレータでは比較的ベクトル機に向いていると言われる流体系プログラム(AFESなど)も、やや不向きとされる粒子系プログラム(GTC)も、かなり効率よく実行させることができます。 また、各地球シミュレータ利用プロジェクトの最大規模のプログラムと、その性能グラフを見ても、使いやすく効率のよいシステムであることがわかります。
なお、地球シミュレータでは各プロジェクトに対し、プログラムを高並列で実行する際、並列化効率50%以上(並列実行時の各プロセッサの性能が、単一プロセッサ実行時の性能の50%以上)にチューニングされるよう、求めています。 下記の各種アプリケーションコードの高並列実行における達成性能は非常に画期的なものです。
コード |
最大総合性能 (GFLOPS) |
使用 CPU数 |
ピーク 性能比 |
測定 年度 |
参考論文 掲載場所 |
---|---|---|---|---|---|
大気大循環(AFES) | 26,580 |
5120 |
65% |
2002 |
|
3D SEM法による地震 伝搬解析(SpecFEM3D) |
5,000 |
1944 |
30% |
2003 |
|
宇宙物理(CACTUS) | 2,765 |
1024 |
34% |
2003 |
|
材料科学(PARATEC) | 3,700 |
2048 |
23% |
2004 |
|
核融合(GTC) | 3,701 |
2048 |
23% |
2004 |
|
地球ダイナモ(yycore) | 15,182 |
4096 |
46% |
2004 |
|
磁気流体(LBMHD) | 26,249 |
4800 |
68% |
2005 |
|
非静力学大気海洋陸面大循環モデル(MSSG) | 17,039 |
4096 |
52% |
2005 |
|
PCG法による多体量子計算 | 18,692 |
4096 |
57% |
2006 |
|
第一原理による半導体表面・界面反応シミュレーション(PHASE) | 16,183 |
4096 |
49% |
2007 |
【平成18年度の最高性能一覧】
以下のグラフは平成18年度の地球シミュレータ利用プロジェクトにおいて、それぞれのプロジェクトで年間で最も高い性能を出したプログラムの性能とその際使用したノード数を示しています。