在法兰克福举行的世界超算年会上,Top 500 公布了最新榜单:中国的超算占据了前两名,而美国自 1996 年以来首次无缘三甲。
  中国的神威太湖之光以 93 petaflop/s 继续称霸,天河二号以 33.9 petaflop/s 排名第二,排名第三的是瑞士的 Piz Daint,运算速度 19.6 petaflop/s,之后是美国橡树岭国家实验室超算泰坦的 17.59 petaflop/s,Sequoia 的 17.17 petaflop/s、Cori 的 14 petaflop/s,日本 Oakforest-PACS 的 13.55 petaflop/s,K computer 的 10.51 petaflop/s。
  前十的主要变化是瑞士超算从去年 12 月的第八跃升到第三,其余超算基本不变。
  神威太湖之光采用了中国自行研发的申威 SW26010 260C 1.45GHz 处理器,每个处理器 260 个核心,总共 10,649,600 个核心,内存 1280 TB,操作系统是基于 Linux 的 RaiseOS 2.0.5。
  Top 500 中,美国 有 169 台,中国有 160 台,之后是日本 33 台,德国 28 台,法国和英国各有 17 台。
  464 台超算使用了英特尔的处理器,21 台超算使用了 IBM Power 处理器,使用 AMD 处理器的只有 6 台。
  惠普企业(HPE)制造的超算最多共 143 台,其次是联想的 85 台,克雷的 57 台,曙光的 46 台,IBM 的 27 台。
  美国的超算“泰坦”则名列第四。这也是 20 年来美国首次跌出该榜单的前三名。
  除了此次落败,美国还面临着另一个尴尬局面:中国将会超越美国,成为世界上首个建造出百亿亿次级(Exascale)超级计算机的国家。有鉴于此,美国能源部选择对慧与科技(HPE,2015年从惠普拆分出来的独立公司)提供一大笔研究资金,在其“The Machine”项目构架的基础上开发出一款百亿亿次级超级计算机,目的就是夺回全球超级计算机的霸主地位。
  
图丨“The Machine”计划的刀片服务器单元。慧与准备在接下来的几年内将其发展为能与DRAM相抗衡的超低延迟存储系统。
  一直以来,美国能源部所使用的超级计算机长期占据着世界第一的位置。但是在最近的几年里,中国已经成功实现追赶超越美国。我国的神威·太湖之光93 PFLOP的极限性能(1 PFLOP 等于每秒一千兆次的浮点运算),相当于美国能源部下属橡树岭国家实验室开发的“泰坦”(18 PFLOP)超级计算机的 5 倍 。
  
图丨美国能源部的“泰坦”(Titan)超级计算机
  针对中国的赶超,美国政府曾高调宣布,将在 2021 年左右正式突破百亿亿次级,以夺回全球最强超级计算机的桂冠。但是中国并没有原地踏步,反而加速前进:今年 1 月,中国国家超级计算中心正式宣布:将在 2017 年底推出百亿亿次级超级计算机的原型机,并于 2020 年投入运行。
  建造一台百亿亿次级超级计算机有三个需要攻克的难关:首先就是其海量(GW级别的)的电力需求和冷却需求;其次是一款可以高效连接成千上万块芯片和内存的构架;最终是一个可以进行每秒10的18次方次计算的操作系统和软件。
  
  其实,不解决这三个难题也可以建造百亿亿级超级计算机:你只需要把大量的 CPU 堆在一起,直到加起来的 FLOP 量级达到每秒 10 的 18 次方即可。但问题就在于,它并不可能真正以这个速度来运行,或者它的运行成本会高得突破天际。
  但是,这样做的好处就是可以快速搭建出超级计算机原型,而且中国方法可能就是基于此想法:在 2017 年把硬件基础打好,再花 3 年的时间让它跑起来。
  美国能源部则通过与慧与科技的合作,选择了一个目的性虽强、但更为缓慢的路径来实现其百亿亿次级超级计算机的目标。
  实际上,慧与获得的研究资金来自于美国能源部百亿亿次级超级计算机项目(Exascale Computing Project, ECP)旗下一个名为PathForward的专项基金。在奥巴马时代就已经设立的ECP已经对美国多个这类超级计算机研究项目提供了数千万美元的资金。
  但慧与科技所获得的经费目前还处于保密状态。
  
图丨美国能源部“百亿亿次级计算计划” (ECP)
  那么,慧与的超算计划到底是什么?它能否顺利通过美国能源部的三轮资助方案,并抢在中国之前造出百亿亿次级超级计算机?
  慧与的计划是在其“The Machine”项目中的“Memory Driven Computing”(基于存储的计算架构)的基础上打造超级计算机。简单来说,“基于存储的计算架构”是慧与一系列存储相关技术的统称。通过这些技术,慧与可以通过一个由硅光电芯片驱动的光学连接器,将海量(4096尧字节,即和宇宙中原子数同量级)的相联内存以高速、低能耗的方式集合在一起。
  
图丨慧与“The Machine”项目基本概念图
  其实,慧与科技在 2016 年底就发布了 “The Machine”计划的原型机。该项目在2014年启动,旨在从“重新定义计算的基础架构”。
  然而,目前为止的结果却差强人意,因为慧与不再计划将“The Machine”进行整体商业化,而是选择其中的部分技术融入到其他产品线。上述将用于超级计算机的内存架构就是方向之一。
  总体上看,目前所有的内存还属于易失性内存(断电后内存数据消失)。但是如果惠普能够成功将其忆阻器进行商业化,或者转而选择使用 Intel 的 3D XPoint,这些内存就会变成非易失性内存(断电后内存数据不消失)。这样做的直接结果就是极大的模糊传统内存与传统硬盘存储器之间的界限,在存储速度和存储容量上找到最佳的平衡点。
  
图丨惠普自家的忆阻器晶圆(上图)与Intel的3D XPoint内存(下图)。这类产品旨在模糊传统内存与硬盘之间的界限
  此外,芯片与内存的连接方式也是慧与技术方案中的一大亮点:从下图的原型机来看,系统芯片通过硅光电材料连接到非易失性内存,因此推断机箱底部的排线应为光纤线缆。根据慧与的介绍,通过这种连接方式,最终将使非易失性内存的可访问数据量达到成百上千TB!
  
图丨“The Machine”项目2016年底发布的原型机,系统芯片与内存间通过硅光电材料连接
  更重要的是,慧与表示,它们已经开发出可以完全利用这海量内存的软件工具了:不论是Facebook上所有的个人状态、整个互联网上的数据,还是全球每个人的医疗数据,该软件都可以从巨量的数据中提取科学的分析结论。
  慧与曾非常乐观的表示,现有软件工具和数据库系统可将内存系统的性能提升300倍,而且这还不是最理想的状态,最终的目标将会是8000倍。
  
图丨据分析,金属框内的绿色芯片就是慧与的X1硅光电连接芯片
  慧与首席技术官 Mark Potter 甚至非常自信的认为,这个技术可以拯救全人类。他表示:“我们相信‘基于存储的计算架构’是一个可以让科技推动全社会所有领域进步的技术。我们的架构可以用于一切计算领域,从智能终端到超级电脑!”
  虽然事实可能离 Mark Potter 的梦想还差得比较远,慧与的技术确实朝着百亿亿级计算踏出了重要的一步。但如果把慧与的技术与前文提到的建构百亿亿次级超算的三大难题进行权重评分,慧与的技术组合仅会获得1.5分:即慧与在软件、能耗,以及可扩展性方面确实做出了一些成绩,但是离百亿亿次级计算能力还有很长的一段距离。
  
图丨慧与“基于存储的计算构架”的“The Machine”40芯片版,据观察可能是通过光纤来连接芯片,其他细节还不得而知
  与此同时,中国的赶超也一直都未停止,在美国政府对中国实施禁运Intel、Nvidia、以及AMD生产的可用于超级计算机的芯片之后,中国国家超级计算中心成功自主开发出一款专为超级计算而设计的260核的RISC(精简指令集)芯片。这款5平方厘米大小的芯片集成了260个运算核心,共计数十亿个晶体管,单芯片计算能力达到了3万亿次/秒,达到了当今世界先进水平,相当于2000年全球排名第一的超级计算机运算能力的3倍。
  与中国相比,慧与显然不具备独立设计制造芯片的能力。它唯一能提供的就是其芯片对芯片通信的Gen-Z协议,然后把希望寄托在芯片厂商身上。
  当然,目前只是第一轮经费申请,慧与只需要提供百亿亿级超级计算机相关的技术方案。只有在第二轮和第三轮经费申请时,慧与才需要设计和建造真正的超级计算机,这才是真正的挑战所在。
  
图丨慧与“基于存储的计算构架”的“The Machine”40芯片版
  如果一切按照计划进行,Intel最新的 72 核 288 线程 Xeon Phi 很有可能就是美国超越中国所需要的那颗最关键的芯片。但是其 6400 美元的价签,对于一台需要30万颗CPU才能在理论上达到1 EFLOP(每秒10的18次方次计算)的超级计算机来说,将是一个天文数字。
  
图丨Intel最新的72核288线程Xeon Phi处理器
  目前的情况是,美国能源部绝大部分的百亿亿次级计算相关经费都花在了软件开发上。在投资慧与之后,美国能源部又在PathFoward项目框架下对AMD、Cray、IBM、Intel、以及 Nvidia 进行了资助,承诺将在3年内提供2.58亿美元的资金,同时也要求各公司承诺从自己的研究经费中划拨至少 1.72 亿美元用于超算相关研发。
  很明显,在对中国实施芯片禁运不奏效的情况下,美国政府想在超级计算机领域再度超越中国,已经不惜投入巨资,举全产业之力,启动一次大规模的联合研发。
  面对挑战,中国的超级计算虽然前途看好,但守擂之路也不会十分坦荡。
  来源:solidot,DeepTech深科技