日本Preferred Networks公司(以下简称“PFN”)与日本神户大学共同开发的配备超低功耗深度学习用处理器MN-Core的PFN深度学习用超级计算机MN-3,在最新的发布的Green500排行榜中名列第一。
PFN的深度学习用超算MN-3
MN-3在表示超算单位电力运算性能(节电性能)的High Performance Linpack(HPL)性能评估中,实现了21.11Gflops/W(1W、每秒约211亿次运算)的处理性能。
这个数值为上期(2019年11月发布)Green500冠军的最高性能(16.876Gflops/W)的1.25倍,是该榜单此前最高性能(18.404Gflops/W,2018年6月)的1.15倍,在全球争相推进的“深度学习用超算超低功耗化”中,MN-Core及MN-3的技术处于全球领先地位。
Green500榜单证书
MN-3设置在日本国立海洋研究开发机构(JAMSTEC)横滨研究所的模拟器大楼内,于2020年5月投入运行。
此次测试使用的系统为整个MN-3中的40个节点和160个MN-Core,具体测试数据如下:
峰值性能(理论值):3.92Pflops
线性方程计算速度(HPL基准测试):1.62Pflops
每W耗电量的性能:21.11Gflops/W
MN-3-MN-CORE SERVER, XEON 8260M 24C 2.4GHZ, MN-CORE, ROCEV2/MN-CORE DIRECTCONNECT
(总内核数量:共2080个,其中MN-Core为160个,Intel Xeon为1920个。HPL基准测试主要由MN-Core负责运算)
实现如此高的节电性能的主要技术如下。
1. 具备实现超低功耗的深度学习专用电路的“MN-Core”
这是PFN和神户大学在理化学研究所AICS/R-CCS的协助下开发的。
2. 实现高速高效节点间数据传输的互连“MN-Core Direct Connect”
3. 提高HPL基准测试的核心部分——双精度矩阵乘法运算效率的优化技术
这种优化技术在深度学习的计算处理中也有效,还将用来提高深度学习计算的效率。
4. 通过集成大量MN-Core使功率效率最大化
这些技术大幅削减了耗电造成的环境负荷和运行成本,不仅会成为下下代深度学习用超算的基础技术,还有望作为将来构建整体的超低功耗信息系统的基础技术使用。
今后,通过改良安装方法、冷却方法和MN-Core专用中间件,预计MN-3还能将电力性能再提高几十个百分点。
MN-Core
文:JST客观日本编辑部