6月20日,新一期全球超级计算机500强榜单公布,使用中国自主芯片制造的“神威太湖之光”取代“天河二号”登上榜首,中国超算上榜总数量也有史以来首次超过美国名列第一。
  据国际TOP500组织当天发布的榜单,“神威太湖之光”的浮点运算速度为每秒9.3亿亿次,不仅速度比第二名“天河二号”快出近两倍,其效率也提高3倍。
  更重要的是,与“天河二号”使用英特尔芯片不一样,“神威太湖之光”使用的是中国自主知识产权的芯片。 “神威太湖之光”由国家并行计算机工程技术研究中心研制,安装在国家超级计算无锡中心。
  此前,由中国国防科技大学研制的“天河二号”超级计算机已在TOP500榜单上连续六度称雄,但是在2015年遭到美国禁售的干扰。
  如今短短一年之后,中国自研的超级计算机就取得了计算能力第一的位置,令人欢欣鼓舞。
  虽然,笔者早在一年前禁售的时候,就写文章提过中国超级计算机行业的后手神威,但是短短一年就造出来大新闻还是挺出乎意料之外的。
  这个神威太湖之光是怎么冒出来的?它是怎么做到世界第一的呢?这得从头说起。
  
  一、超级计算机的发展

    计算机最早就是满足人类高性能计算要求的,无论是第一台机械计算机(英国巴贝奇爵士设计,未最终完成),还是第一台电子计算机Eniac,都是做科学计算和军事用途用的。
  当进入电子计算机时代之后吗,计算机性能的扩展有两条道路,一条的不断改进制造工艺,提升芯片设计水平,把单个芯片设计的很强悍,提升性能。还有一条道路是尽可能用比较多的机器并行,用多机机器一起运算来提升性能。
  早期,超级计算机都是昂贵的高级货,处理器是专门设计的,芯片组是配套的,甚至每根连接线都是定制的,成本极高。
  而随着PC和网络的发展,人们发现追求强大的计算能力可以不那么昂贵。于是,人们开始尝试用大批量生产的PC或者工作站来攒超级计算机。
  若干台PC或者工作站通过网络连接起来,把任务分给这些机器并行,然后返回,计算能力丝毫不弱于昂贵的专用超级计算机,于是传统的超级计算机开始没落。
  这个时代出现了很多平民化的超级计算机,一个美国学校把MAC电脑凑成超级计算机,看似玩具的东西居然一度占据了TOP500超级计算机排行榜,甚至谷歌自己用的服务器也是用这种办法攒出来的。
  而攒机有极限,人们发现,限制超级计算机能力居然是功耗,人们不能堆积太多的数量是因为功率和发热限制,于是,IBM开发出蓝色基因,不追求单个核心的高性能。
  之后就是异构浪潮了,索尼为了提升PS3游戏机的性能,联合IBM搞了Cell处理器,这是异构计算的开始。因为在计算任务中,有些任务是简单的,不需要复杂的逻辑处理,只需要足够的计算单元暴力计算,这样处理器就可以设计成两部分,一个简单的运算核心,几个强大的简单计算单元,这就是Cell的思路。
  而后来人们发现,这种简单暴力计算GPU最擅长,于是就有了GPU通用计算。
  中国在2009年搞出来天河一号超级计算机,就是就是CPU和GPU异构组成的超级计算机,一度排名世界第一。百度搞人工智能的计算机也是这种异构的超级计算机。
  Intel也发展出“众核架构”(MIC)的Xeon Phi协处理器。并且获得了天河2号的选用。成为目前超级计算机的主流配置。
  二、神威太湖之光是从哪来的?

    在神威太湖之光上新闻之前,大多数人都对其一无所知。不是这个项目历史短,而是它太低调了。
  关于国产CPU,大家熟知的是龙芯,骗经费的汉芯,而国产CPU里面真正的高端其实是江南所的神威系列。
  因为神威是军方项目,所以各项信息没有非常公开,其来源只有一个不太确定的传说。
  话说70年代,在Intel横行天下之前,业界的明星是一家名叫DEC的公司,这家公司研发出小型机,把计算机普及到普通的商业机构,成为一代明星。
  而当PC出现之后,这家公司开始研发高端产品,这就是Alpha系列处理器,当年IBM,惠普,SGI,SUN都研发自家的处理器,而Alpha算其中的佼佼者。
  Alpha系列处理器经过几代发展,有非常好的性能和大量前瞻性的设计。无奈商用运作失败,最终DEC被COMPAQ收购,而COMPAQ后来又与HP合并,Alpha系列也就被搁置起来。
  就在此时,处理器方面极其落后的中国在国家还不富裕的情况下重金买下了Alpha的全套技术,准备开发国产的高性能处理器。当时的国家主席江泽民亲自题词“神威”。这就是神威的由来。
  当年Alpha堪称处理器的黑科技大全,它的EV6总线被AMD采用,开发出超过Intel的K7,这是AMD历史上唯一一段性能领先Intel的时期。
  Intel也没有落后,Intel随即开发出超线程技术(至今仍然在用),而超线程技术也是Alpha先搞起来的。
  Alpha的21364甚至看到了未来众核的趋势,预留了方案。要知道,Intel搞众核已经差不多是Alpha消失后10年的事情了。
  Alpha被中国买下之后,消化吸收改进创新,逐步发展出来神威系列处理器和超级计算机。
  其实,早在2008年,神威已经搞出来神威1600处理器,这个16核心的神威1600在1.1ghz的时候,双精度浮点运算能力是140.8G,i7 980xe 6核心在3.2ghz,双精度浮点是107.55G。i7的功耗是130W,神威1600的功耗是70W。神威1600同样集成了四路双通道DDR3内存控制器和I/O,水平已经相当高了。
  2011年的时候,神威曾经露了一小脸,有过一个叫神威蓝光的超级计算机,进入了世界前十,而且只用了9个机柜。
  如果当年神威蓝光要搞个大新闻,只要加到160个机柜就可以当2011年的世界第一了,根本不用等到今天。
  当时神威就已经提出来下一代要搞众核,也就是今天太湖之光用的CPU。因为当年Alpha21364已经考虑了128个核心众核结构的通讯问题,所以神威新一代众核产品也很顺利。
  如今,太湖之光出来,无论是性能还是功耗,效率都是世界第一,其实这是从1999年开始持续研发10多年的水到渠成。
  三、太湖之光的意义

    目前,太湖之光用的神威处理器工艺还是非常落后的,大约落后Intel两到三代。但是凭借架构的优势,太湖之光依然达到了顶级的运算能力。
  如果未来中芯国际给力,追近Intel,那么神威性能会更强。
  不过,我们要知道,神威这种项目是给军方研发的,用于高科技项目,编程是非常困难的,通用型也很差。其他领域就是有授权使用,编程也会很困难。所以这个世界第一的超级计算机不会有很高的利用率。
  但是,这台计算机告诉世界,中国已经自己的超级计算能力,各种禁运就没有必要搞了。高科技军事中国可以用自主的超级计算机算。
  至于游戏,动画,金融,天气……,IBM和Intel还是可以卖机器,卖处理器的。
  非军用领域,不仅仅要考虑性能,还要考虑生态和成本。工具方便,开发简单的东西效益更高。这些领域用神威就太贵太麻烦了,效率也未必高。
  2015年,美国还对中国搞禁运,不允许Intel出口高性能的协处理器。说中国人用于军事用途,用于核研究云云。
  而神威太湖之光告诉美国人,这种禁运是脱裤子放屁,根本就没有必要。买你们的高性能处理器,协处理器是商用,军用我们有更强的。
  “敌人有的,我们要有,敌人没有的,我们也要有。”这是毛主席说的,神威做到了。
    文/maomaobear
来源:新浪创事记