表3:ベクトル並列機の性能比較
*1) NECに確認済み
項目 地球シミュレータ SX-8/8A(*1) SX-8R/8A(*1) SX-9/16A(*1) SX-9/E 京速計算機(*2) NEC SX-ACE (*3) NEC SX-Aurora-TSUBASA (A500) 速度/CPU 8 GFLOPS 16 GFLOPS 35.2 GFLOPS 102.4 GFLOPS 同左 128-256 GFLOPS 256 GFLOPS 2.15/4.30 TFLOPS 動作周波数 500 MHz (1 GHz)
(0.15μm)2 GHz(90 nm) 2.2 GHz(90 nm) 3.2 GHz(65 nm) 同左 8 GHz(45 nm) 1 GHz 1.6/1.4GHz 消費電力 8 kVA/ノード 7 kVA/ノード 8 kVA/ノード 30 kVA/ノード
(4.9平方m)20 kVA/ノード程度? CPU数/ノード 8 8 8 16 8 8〜32 1 (4コア) 8 共有メモリ/ノード 16 GB 128 GB(大容量)
64 GB(高速)256 GB(大容量)
128 GB(高速)1 TB 125 GB 256〜512 GB 64 GB 48/24 GB ノード内CPU-メモリ間速度
メモリバンド幅
最大主記憶転送速度256 GB/秒 512 GB/秒 563.2 GB/秒 4 TB/秒 ? 4 TB/秒 256 GB/秒 750 GB/秒 ノード数 640 〜512 〜512 〜512 160 1024 5120 64 ノード間転送速度
(双方向)12.3 GB/秒×2 8 GB/秒×2
16 GB/秒×28 GB/秒×2
16 GB/秒×2〜128 GB/秒×2
光多芯ケーブル? 128〜256 GB/秒×2 4/8 GB/秒×2 76.8 TB/秒 分散メモリ合計 10 TB 64 TB(大容量)
32 TB(高速)128 TB(大容量)
64 TB(高速)〜512 TB 20 TB 250〜500 TB 340 TB 3.072 TB
*2) 矢川元基監修「ペタフロップス コンピューティング−地球シミュレータを原点に"和"のスパコンを求めて」(2007, 培風館)
*3) HPCIハードウェア資源一覧(2009.6.1のMIND(於JAMSEC)より)
・ES(SX-6)のプロセッサは加減と乗除の2つの演算器が4プレーンあったが、SX-9では加減と乗除が2倍に、プレーンが2倍の8プレーンに、クロック数が3倍になったため、プロセッサあたりの2×2×3=12倍の性能となっている。また、CashではないがAssignable Data Bufferが設けられている。
・ESのノード間結合は単段クロスバースイッチで任意のノード間が1ステップで常時接続されているが、ES2では2段階のFat Tree方式でルーターによるパケット通信となっている。この分、ノード全体の効率はESよりも低下している。・ES2(SX-9/E)の1ノードは、本来16プロセッサで共有メモリ250 GBとして80ノードにしてもよいところを、8プロセッサで共有メモリ125 GBとして160ノードとなっている。なぜそうしたかというと、250 GBを16プロセッサで共有すると輻輳してしまって効率が低下するため、1ノードを8プロセッサに減らしたとのこと。
トップメニュー>地球科学の話題>耳学問>地球シミュレータ