2 + 2 都算错，英伟达两万块钱的显卡爆了大bug_消费电子与智能设备-面包板社区

楼主

2 + 2 都算错，英伟达两万块钱的显卡爆了大bug

Killoser

1910 主题
1946 帖子
13537 积分

身份：LV7 中级工程师

E币：30

发消息

 1995

 0

发表于 2018-3-28 11:57:09

显示全部楼层

英伟达去年推出的号称 “ 终极核弹 ” 的 Nvidia Titan V 显卡出了个运算 Bug。。

国外有研究人员使用 Titan V 进行运算时，输入的是同一个方程，却得出了不一样的结果。
举个栗子。。
研究人员在计算蛋白质和酶的合成运算过程中，需要计算生物学中的 “ 2 + 2 = ？”。
这个简单的问题，别说是计算机了，幼儿园的小朋友都可以算出来好不。。
但每一次 Titan V 输出的答案居然都不一样：4 , 4.1 , 4.2。。。

而且这不是某一台 Titan V 显卡的问题，研究人员使用 4 台机器进行运算，发现其中有两台都爆出了这样的 Bug 。。
这就很尴尬了。。

这看起来可能是一个很小的 Bug ，但他的严重程度远远超过了我们的想象。。
Titan V 是英伟达去年 12 月份发布的。采用 12nm 工艺，内建 211 亿颗晶体管，加上单精度浮点 15 TFLOPS，双精度浮点 7.5 TFLOPS，性能基本上秒杀了前几代。
性能高价格当然也贵了不少。
售价 2999 美元，约合人民币 20000 元
怎么说，排除掉传言中的图灵 ( Turing ) 和安培 ( Ampere ) ，目前民用领域级别最高的就是英伟达的 Titan V。

当然，Titan V 这么爆炸的性能不是给你玩游戏的，更多的是偏向于用来超算、科研等科学运算领域的。
你用 Titan V 吃个鸡出了问题最多也就骂上几句，但要是用在科学工程领域。
比如说，科学家研究一种新的药物，需要对人类的基因组进行测序和分析，进行大量的模拟计算，才能确保新研发的药物能发挥作用。
但是呢，计算机计算过程出现了一点错误。
最后的结果可能就导致新研发的药物完全没有作用甚至这个药物还会对我们身体有危害。
再比如说，现在需要新建一座大桥，研究人员需要大量的计算结构力学之类的东西。。。
这些项目对精度要求十分高，你要是出个错，后果嘛。。。。
还有很多的例子，正因为 Titan V 性能太强了，以后的应用领域可能更广，药物开发，石油勘探，汽车设计等等，而这一点看起来很小的错误造成的影响是不可小觑的。

NV先前拒绝回应，不过现在已经出面表示，这些遇到计算错误的用户请联系官方解决。他们同时表示，目前确认，至少在使用分子动力学中被称为“Amber（琥珀）”的科学应用程序时，TITAN V会异常。

资深业内人士表示，这是由于TITAN V显存出现了溢出错误导致的，由于NVIDIA TITAN全系列显卡都禁用了ECC纠错功能功能，在处理庞大的科学计算数据时，显存因为来不及处理导致部分数据溢出，因此最后的运算结果自然不同。

前一天Bug小刷屏，后一天黄老板就带着性能逆天，价格更逆天的“世界最大GPU” 来了。

在GTC 2018大会上，黄仁勋发布全球最大GPU——DGX-2。DGX-2能够实现每秒2千万亿次浮点运算（2 PFLOPS），性能比去年9月推出的DGX-1性能提高了10倍，售价39.9万美元（人民币250万元）。