世界最速のスーパーコンピュータ「神威太湖之光」が採用する中国独自CPU「SW26010」の概要が明かされる | スラド

中国のスーパーコンピューター。
世界最速のスーパーコンピュータ「神威太湖之光」が採用する中国独自CPU「SW26010」の概要が明かされる | スラド

神威太湖之光で使われているCPU「SW26010」は、メインプロセッサとベクターユニットを備えた多数の演算プロセッサで構成されており、PlayStation 3で採用されていた「Cell Broadband Engine」(Cell B.E.)と似た構成だという。ただしCell B.E.はメインプロセッサ1コア+演算ユニット(SPU)8コアという構成だったのに対し、SW26010は管理コア1個+演算コア64個の組み合わせを4つ、合計260個のコアで構成されている。管理コアは64ビットRISC系の独自命令セットを採用しており、一般的なCPUと同様の演算能力を備えている。また、演算コアは並列処理に特化しており、この点もCell .B.E.のSPUに似ているという。
こういった構成により、SW26010は単体プロセッサでGPU並の演算性能を実現できるとのこと。ただ、メモリ帯域幅はGPUと比較して明らかに低いようだ。

元記事。
【後藤弘茂のWeekly海外ニュース】世界最速スパコン中国「神威太湖之光」のCPU「SW26010」の概要 ~PS3の「Cell B.E.」と似た設計 – PC Watch
CPE Cluster = 8×8 (64) CPE、クロスバー
プロセッサにはCPE Clusterが4個あって、256 CPE。
それにMPE (Management Processing Element)がCPE Clusterに1個ずつ、計4個あって、合計260コア。
CPEごとに64kBと書いてあるのは、「64KBのスクラッチパッドメモリ(Scratch Pad Memory: SPM)を備える。このメモリは、LDM(ローカルデータメモリ: Local Data Memory)と呼ばれ、ソフトウェアマネージドで、プログラマに対して露出している。」
なるほど。それを活用しないといけない。

 SW26010は、単体プロセッサで3.06 TFLOPS (64-bit倍精度浮動小数点演算)と、GPU並の演算性能を達成する。
 動作周波数は1.45GHzで、256個のCPEがそれぞれ256-bit(64-bit x4way)の積和算が各サイクルに可能、4個のMPEが2ユニットの256-bit(64-bit x4way)の積和算が各サイクルに可能。合計で3.06 TFLOPSとなる。Sunway TaihuLightシステム全体では、40,960ノードとなり、ピーク性能は125PFLOPSとなる。

掲示板では名前がいじられてる。
「神威太湖之光(Sunway TaihuLight)」
じんいたいこのひかり、じゃないのか。
「人衣一体」神衣・鮮血!

コメントを残す

メールアドレスが公開されることはありません。