编者按:本文根据Tom’s Hardware深度分析文章翻译而来,同意其中的技术观点,ARM阵营的处理器设计能力和生产工艺与英特尔的确还有一定的距离,当然市场的竞争不单单是技术问题,本文只讲技术,不论其余。
如果你读完这篇文章,你就会认同我所说的英特尔会在三年之内超越高通的看法。尽管我们知道,英特尔技术还没有用于任何智能手机,而高通上个季度的收入已经超过了40亿美元。
为了证明我们的观点,我们必须变个魔术。魔术包含三个部分:第一个部分称作“以虚代实”,这是我们写文章的常规做法:谈论一下CPU的构架。第二个步骤称作“偷天换日”。我们利用普通的文章做一些不同寻常的事情。在这一部分,我们将探讨芯片制造的细节以及移动GPU的历史。
现在,你肯定在寻找魔术的关键部分,你仍不相信英特尔具备所需的能力。但你不会了解其中的奥秘,因为你不知道应该在何处寻找。你并不真的想知道,而是等待被欺骗。你也不会鼓掌,因为仅仅写一些有关CPU架构、芯片制造和移动图形的内容是远远不够的。这就是为什么魔术都有第三个步骤“化腐朽为神奇”,这是最难的一步。
三年前,Internet Explorer是行业内占主导地位的浏览器。现在,谷歌Chrome处于领先地位。现在,高通是移动系统芯片(MSoC)行业的霸主。而在不到三年内,英特尔将取而代之。
当然,这是一个大胆的论断。我们的团队已经跟踪技术行业超过15年了,这赋予了我们独特的视角。我们已经见证英特尔打败了AMD,ARM取代了MIPS和Super-H,而PowerVR 和BitBoys卷土重来。
MSoC将会成为未来三年的热点话题。因此你会看到很多类似的预测,这其中不乏疯狂的预测,比如Robert X. Cringley的预测。他以前在PBS.org的技术频道担任撰稿人,曾被揭露伪造斯坦福大学的博士学位。最近他预测英特尔将会收购高通!
根据我们的分析,英特尔会最终在移动市场上证明自己。
观点不同
产品白皮书和构架分析与现实应用以及实际测试有着很大的差距。技术领域的大多数撰稿者在讨论公司的发展前景时,他们都喜欢用抽象的数字和概念。但是有一点需要明白:不是公司创造了技术,而是公司中的人创造了技术。
就以体育为例。洛杉矶湖人队也许在某些年份里要比其他球队优秀,但是正是有了像科比•布莱恩特这样的球员和菲尔•杰克逊这样的主教练才使得他们成就了一个冠军梦之队。说的再简单一些,当一个公司被收购,买家其实并不是真正需要它的所有资产。买家可能是想通过支付高昂收购费来使用某些专利而已,当然更重要的是,买家能够把关键性技术人才收到麾下。
因此,MSoC的未来发展取决于以下三点:其一,系统芯片构架;其二,制造工艺;其三,图形技术。
(一) 以虚代实:CPU架构
很多人都认为所有的MSoC都一样。某家公司购买了ARM公司授权的芯片(比如说是Cortex-A9 或者 Cortex-A15),然后与Mali的图形处理器或者PowerVR 公司的技术整合在一起,再加上内存以及I/O接口,然后就可以进行生产了。
很多认为所有授权的芯片的功能自然也是一样。但是略微懂行的读者们则知道ARM仅仅是一种指令集。公司可以从ARM公司购买完整的CPU。布局设计(例如Intrinsity公司为苹果以及三星公司设计的产品)则可以改善性能。而有的公司可以自主设计全新的芯片,而不采用ARM公司提供的设计方案。高通公司生产的Scorpion核心以及即将推出的Krait设计就是采用此种方式。英伟达的“丹佛计划”(Project Denver)自然也属于这一类别,它通过收购PortalPlayer、Transmeta以及 ULi公司获得专利技术以及专业研发团队。
但是值得注意的是,计算核心在整体系统的性能表现方面发挥的作用并不是很大。还有很多因素需要考虑,例如内存的带宽、总线架构和缓存设计等等。带宽是一个重要指标,但是内存的延迟也起着同等重要的作用。这就是为什么AMD Athlon 64芯片的性能要优于英特尔的奔腾4芯片的原因之一。同理,这也是为什么苹果的iPad 2在操控反应速度以及整体性能上要好于同类产品的主要原因。这绝对不是简单的“拿来就用”的产品设计方案。
为了能够预测未来三年内哪家公司能够在MSoC市场领先对手,我们必须要搞清楚两件事情:哪家公司的研发团队最擅长实现芯片的最高原始性能以及哪家公司的研发团队最有可能在芯片功耗领域领先竞争对手。
原始CPU性能
在谈论芯片功耗之前,让我们先说说芯片的性能。毫无疑问,英特尔在实现最快处理器方面有着最优秀的资源。ARM公司以及高通将会不可避免地经历x86构架厂商所经历的成长之痛。
在下一代处理器中,高通将会从部分乱序执行的Scorpion构架转变成完全乱序执行的Krait构架。Krait应该能够实现处理器达到峰值时候的运行效率从而实现效率最优化。
与此同时,高通却已驶入了未知领域。在这个领域,高通的工程师缺乏相应的专业知识。ARM公司在研发采用了乱序执行设计的Cortex-A9芯片过程中积累了部分经验,但是在其新的Cortex-A15设计方案中,ARM将会为每一个执行单元提供独立的预留缓存空间(指令队列)。英特尔和AMD过去也采用过独立预留缓存空间的方式,但是现在却都采用统一预留缓存空间来改善性能和使用效率。与ARM公司不同,高通想直接采用统一预留缓存空间技术。最初奔腾Pro首先成功地采用了统一预留缓存空间,所以认为高通采用这样跳跃式发展不能成功的想法是站不住脚的。
英特尔的凌动构架并没有采用公司的任何先进技术,这还是一款采用顺序执行的单核处理器,它更会你人们想起古老的奔腾处理器而不是任何现代的处理器。这正是关键所在:尽管采用如此过时的技术,凌动构架的运行速度已经快于ARM构架的产品。随着产品对处理器性能要求的不断提升,英特尔自然会把积累了数十年的技术应用到凌动中去。我们听说凌动会在发布后的5年内采用乱序执行内核,也就是2013年。所以,先抛开功耗不说,英特尔毫无疑问会设计出速度更快的处理器。
原始平台性能
内存架构和延迟方面很相似。除了苹果的方案,今天市场上的大多数MSoC的性能都差强人意。苹果的系统总线设计不同于其他MSoC厂商。苹果总线设计得益于收购了P.A. Semi以及Intrinsity这两家公司。P.A. Semi公司的创始人员来自DEC Alpha以及Strong ARM处理器的顶级设计工程师,而Intrinsity是由Paul Nixon创立,他曾经负责Exponential Technology X86构架处理器项目,目前Paul Nixon就职于德州仪器MCU部门。
目前为止,我们还未看到ARM、德州仪器以及高通展示高性能系统总线。而来自英伟达的Tegra产品线采用的系统总线与其竞争对手的产品并无太大的区别,现在发售的Tegra 3的内存带宽仍然低于去年的苹果A5处理器。但是英伟达的研发能力不容小觑,毕竟英伟达在NV2的环形内存总线这个nForce 2平台获得业界的认可,并且在其显卡使用交叉内存控制器方面积累了丰富的经验。只是目前英伟达并没有在Tegra系列中将这些事情提上日程。
另一方面,英特尔的平台性能向来不俗,不妨看看英特尔现在的Sandy Bridge-E架构。再一次重申,性能从来不是英特尔的拦路虎,而芯片功耗则是英特尔面临的最大挑战!
原始无线性能
英特尔在3G/LTE无线领域的经验几乎为零。但是在基于802.11标准的无线方面却有着良好的口碑。英特尔的迅驰平台更是把英特尔推上了笔记本电脑市场的王者宝座。
但是随着英特尔完成对英飞凌的收购,英特尔已经获得了在3G/LTE领域的重要技术资源。而高通一直是3G/LTE领域的强者。但802.11无线网络确是高通的软肋,通过收购Atheros来加强。在无线领域,高通的3G网络技术是领先的。但是在LTE制式技术方面,高通的优势并不十分明显。英特尔和高通还要面临的共同敌人包括:英伟达(拥有软调制解调器芯片公司Icera)、以及由三星,NTT DOCOMO,富士通以及NEC共同研发的3G/LTE产品的压力。
性能总结
未来三年,ARM和高通需要在提高CPU性能方面加大投资力度。他们的设计工程师并不精通这个领域,因此可能要经历几十年以前x86厂商所经历的痛苦。忽略能耗而单从性能方面来说,英特尔、AMD和苹果(通过收购Intrinsity 以及 PA Semi)在高性能移动计算领域人才济济,而在系统总线架构和内存管理方面的人才更可谓出类拔萃。而英伟达坐拥丰富的技术组合,很有可能是一匹黑马,尽管还未见采用其复杂总线以及内存设计的方案。
当然,强调功耗才是MSoC与众不同之处,而这一直是英特尔难以逾越的挑战。
(二) 偷天换日:制造工艺
ARM在移动市场所向披靡的原因是,英特尔至今都不能够展示高能效的MSoC。在移动世界里,大肆宣扬让人印象深刻的性能功耗比数值是远远不够的。实际上智能手机生产厂家必须要让自己的产品能够至少持续一天的通话时间以及更长的待机时间,这样的标准才算产品能够正常工作。伴随着Medfield的发布,英特尔至少向我们展示了其具备生产能与ARM构架一决高下的移动芯片的技术能力。正如英特尔自己所说的那样,Medfield至少为公司在移动市场占据了一席之地。
您一定听说过许多有关ARM和x86构架的各种优缺点的讨论。的确,ARM和高通在低功耗方面取得了更多的成功。在Medfield发布之前,人们根本不确定这些采用ARM构架的产品的功耗优势有多明显,现在我们可以说他们领先了英特尔四年之久。因为英特尔在发布凌动之后花费了四年之久才研发了一款能够与ARM抗衡的移动平台。
但是,在接下来的三年之内又会发生什么呢?现在的情况是英特尔的Medfield达到了与目前已经上市ARM移动芯片相当的水平。所以我们必须要拿下一代产品进行比较。在前面的讨论中,我们已经提及ARM和高通在提升CPU核心性能方面所面临的挑战正如英特尔在降低芯片功耗方面遭遇的挑战一样多。
我们可以很客观地评价制造工艺方面的优劣。英特尔拥有半导体行业最优秀的工厂,这使得其能够在K6和K7时代与AMD的竞争中胜出,并在AMD成功推出K8构架核心时保持自己的市场地位。Medfield目前采用了32纳米制程技术,与ARM解决方案相比已经很有竞争力。而英特尔的下一步计划则是把制程技术提升到22纳米的3-D三栅极晶体管。这实质上是代表着制程技术的两次进步。英特尔在制程技术提升方面从未失手过,并且很快英特尔会在Ivy Bridge处理器生产过程中积累丰富的经验。如果公司按照目前的态势发展,那么英特尔的芯片制造将领先对手18个月左右的时间。竞争对手出货28纳米芯片时,英特尔则会推出22纳米芯片。而竞争对手全面采用3-D三栅极晶体管的时间则会更长。这些工艺的优势能够使得英特尔再降低20-30%的功耗,同时把密度加倍。
高K/金属栅极
基于ARM构架的厂商目前争相将高K/金属栅极技术纳入MSoC的生产工艺。除了英特尔和三星之外,其他的厂商则要依靠IBM、Globalfoundries和TSMC等芯片制造工厂。三星也为其他厂商代工,因此也在这个名单上。
高通与Globalfoundries签署了合同,让后者为其生产采用28纳米工艺的MSoC。而Globalfoundries采用了“先栅极”("gate-first")高k/金属栅极28纳米制程。IBM和三星也会如此。除非20纳米微影技术出现,否则他们都不会采用“后栅极”。TSMC(可能为苹果A6处理器代工)虽然在不久的将来也会采用“后栅极”("gate-last")方案,但是英特尔已经领先其他竞争对手提前采用了。
“先栅极”和“后栅极”说的是在金属栅极上实施现代高k绝缘体的方式。从外行的角度来说,我们谈论的是从基于纯二氧化硅的芯片转向包含铪元素的不同绝缘体的芯片。先栅极设计在加热前即把金属栅极和铪元件放到晶圆上,而后栅极设计(就像英特尔的)则是在加热后。
先栅极能够增加芯片管密度,有助于大幅提升产品性能。但是产品良品率则不高,在生产过程中良品率较低。而后栅极则能很好地保证产品的良品率,但是对产品设计的要求会更高。英特尔在2007年就开始出货采用高K技术的Penryn芯片。Globalfoundries直到2011年还没有成功地量产高K芯片。
英特尔选择后栅极是不会错的,这已经在其Penryn、Nehalem和Sandy Bridge构架中得以验证。高通选择先栅极则可能是错误的。Globalfoundries有一条采用先栅极制程的生产线,为AMD生产APU。不幸的是,据AMD第三季度的财务报表显示,产品良品率一直未达到预期,从而导致了公司的营收也未达到预期。
英特尔领先两步
重要的是,据公司负责研发的高级副总裁透露:TSMC决定采用“后栅极”工艺的想法由来已久。导致“先栅极”工艺良品率低的部分原因是由于这种技术需要厂商精确地控制阀值电压,因为N-和P-信道使用相同的金属。而这个问题已经困扰半导体行业20余年之久。但是采用“后栅极”工艺则不需如此复杂的电压控制,因为P信道的金属与N信道不同。尽管后栅极技术的密度没有前栅极技术高,但是良品率却很高。很明显,最容易失去市场的原因是产品迟迟不能上市。然而,如果想从前栅极转向后栅极也不是一蹴而就的事情。这可不像把给Globalfoundries的订单取消然后直接在TSMC的订单上划勾打叉一样简单,因为工艺的转变则意味着需要重新设计。
似乎高通也意识到先栅极的良品率根本无法满足需要。在洛杉矶举行的2010年国际电子设备大会上,高通宣称其绝大多数28纳米产品不会采用高k/金属栅极技术。这对高通来说,是个十分不利的条件。
总结
英特尔32纳米高K设计(Medfield)与采用40/45纳米工艺的基于ARM构架的芯片相比有着竞争优势。
而在下一次产品升级过程中,英特尔将会从32纳米跳至22纳米的3D三栅极晶体管技术,这相当于制造工艺的两次飞跃。高通则是由45纳米工艺转向28纳米(1.5个节点)工艺。但是其并不能采用先进的高K技术,这样的结果则是在性能提升以及功耗降低方面做出牺牲。苹果和英伟达预计都会选择TSMC生产下一代芯片,因此会从45纳米工艺转向28纳米高k技术。与高通相比,这意味着苹果和英伟达的28纳米工艺所带来的性能提升会高于高通的28纳米工艺。
凡事有利有弊,英特尔通过采用先进的生产工艺可以提升性能并降低功耗。高通将赌注押在28纳米先栅极技术上,如果产品良品产出率让人满意的话,芯片的高密度会让高通占用优势。而现在,似乎别无选择,高通必须支持芯片生产工艺迈向28纳米工艺。
但是有的事偏偏利大于弊。要想提高产品竞争力,高通必须要在采取乱序执行以及改善内存结构上苦下功夫。而公司的设计工程师则是在Krait中首次设计这样的方案。他们必须确保执行时万无一失。而英特尔却在这款没有太多技术含量的凌动芯片设计中表现十分优秀。而取得这样的成绩的前提是英特尔根本没有使用在x86构架产品积累和研发的任何一项新技术!
当然,英特尔在生产工艺上的领先优势会一直持续。当所有竞争对手试图追赶英特尔的高k/金属栅极生产工艺的时候,英特尔已经公开展示了Claremont,一款近阀值电压处理器,能够在低于10毫瓦的电压下工作。更有意思的是,和凌动一样,英特尔的这款芯片还是基于原来的奔腾核心构架。
所以英特尔在芯片构架以及生产工艺方面将会胜出。那么只剩下一个因素形势还不甚明了:图形处理器!
用户1406868 2012-9-30 06:01
能够在低于10毫瓦的电压下工???有吗?
100325258_284169027 2012-4-12 20:37
用户1247239 2012-4-12 17:33
用户1295444 2012-4-12 15:42
用户1646898 2012-4-12 13:43
用户1627826 2012-4-12 09:47
用户1635994 2012-4-12 09:18
用户1410841 2012-4-12 09:15