株式会社Preferred Networks (本社:東京都千代田区、代表取締役 最高経営責任者:西川徹、プリファードネットワークス、以下、PFN) と国立大学法人神戸大学 (本部:神戸市灘区、学長:武田廣、以下、神戸大学) は、共同開発した超低消費電力の深層学習用プロセッサーMN-Core?を搭載した、PFNの深層学習用スーパーコンピュータMN-3が、最新のGreen500*1?リストにおいて、世界第1位に認定されたことを発表します。
神戸大学からは、大学院理学研究科惑星学専攻の牧野淳一郎 教授、惑星科学研究センターの野村昴太郎 特命助教、細野七月 特命助教が、本共同開発に参加しています。
MN-3は、スーパーコンピュータの電力あたりの演算性能 (省電力性能) を示す、High Performance Linpack (HPL) ベンチマーク*2 で21.11Gflops/W*3 (1W?1秒あたり約211億回の演算) の処理性能を実現しました。
これは、Green500リストにおける歴代の最高性能 (18.404Gflops/W、2018年6月) の1.15倍であり、世界が競い合う「深層学習用スーパーコンピュータの超低消費電力化」において、MN-CoreおよびMN-3の技術が世界をリードするものであることが証明されました。
MN-3は、JAMSTEC (国立研究開発法人 海洋研究開発機構) 横浜研究所シミュレータ棟に設置され、2020年5月より稼働を開始しています。
今回の測定に使ったシステムは、MN-3全体のうち40ノード、MN-Core160個です。
- ピーク性能 (理論値) :3.92Pflops
- 連立一次方程式を解く計算速度 (HPLベンチマーク) :1.62Pflops
- 消費電力1Wあたりの性能:21.11 Gflops/W
- MN-3 - MN-CORE SERVER, XEON 8260M 24C 2.4GHZ, MN-CORE, ROCEV2/MN-CORE DIRECTCONNECT
(リンク中のCores: 2080の内訳はMN-Core 160個、Intel Xeon 1920個です。HPLベンチマークでは主にMN-Coreが演算を担当しています)
今回の省電力性能を達成した主な技術は次の通りです。
1. 超低消費電力を実現する深層学習専用回路を持つ「MN-Core」
MN-Coreは、PFNと神戸大学が、理化学研究所AICS/R-CCSの協力のもとに開発しました。
2. 高速?高効率のノード間データ転送を実現するインターコネクト「MN-Core DirectConnect」
3. HPLベンチマークの中核部分である倍精度行列積演算を効率化する最適化技術
この最適化技術は深層学習の計算処理においても有効であり、深層学習計算の効率化にも応用していきます。
4. 多数のMN-Coreを集約して電力効率を最大化する技術
電力消費による環境負荷と運転コストを大幅に削減したこれらの技術は、次々世代深層学習用スーパーコンピュータの基礎技術となるだけでなく、将来の超低消費電力情報システム全般を構築する基礎技術としての応用も期待されます。
今後MN-3は、実装方法、冷却方法、MN-Core専用ミドルウェア*4 の改良により、省電力性能をさらに数十%向上できる見込みです。
用語解説
- *1 Green500
- これからのスーパーコンピュータはエネルギー効率が最重要である、という見地から、2005 年に始まったプロジェクト。バージニア工科大学の Feng 教授を中心とするグループが 2007年11月から年 2回発表している。対象となるのはHPLベンチマークでTOP500 にランク入りしたシステムで、演算性能/消費電力比で順位が決まる。
- *2 ベンチマーク
- 多様なスーパーコンピュータの性能評価法としてもっとも普及し、上位 500 システムの順位付けを出す TOP 500 で用いられているベンチマーク。巨大な連立一次方程式を直接法で解くことを要求する。最新のGreen500は、2020年6月22日のInternational Supercomputing Conference (ISC) で発表。
- *3 flops/W (フロップスパーワット)
- プログラム実行において、1Wの電力で実行できる浮動小数点演算回数 (単位は1秒あたり10億演算) であり、省電力性能の目安となる。
- *4 MN-Core専用ミドルウェア
- ハードウェアと深層学習フレームワークとの橋渡しを行うソフトウェア。
株式会社Preferred Networksについて
深層学習やロボティクスなどの先端技術を実用化することを目的に、2014年3月に創業。交通システム、製造業、バイオ?ヘルスケアの3つの重点事業領域をはじめ、パーソナルロボット、プラント最適化、材料探索、スポーツ解析、エンターテイメントなどの分野にも深層学習の応用領域を拡大しています。2015年にオープンソースの深層学習フレームワークChainer?を開発。2020年に自社開発のプロセッサー、MN-Core?を使った深層学習専用スーパーコンピュータMN-3を稼働。
* Chainer?、MN-Core?は、株式会社Preferred Networksの日本国およびその他の国における商標または登録商標です。