在智能手机领域,苹果从指令集到微架构一手打造的 64 位芯片可说打遍天下无敌手,即便是三星、高通等芯片产业龙头,也难以撼动其市场地位。
然而,这次在 MWC 2018 中,我们可以看到包含三星、高通,都已经推出基于自有微架构的手机处理芯片,在 GeekBench 效能的测试数据中仅落后去年推出的苹果 A11 芯片约 2 成,而不再是仅能达到其同世代产品一半性能的窘况,自研微架构可说已经带来了一定的成果。不过,严格说来,其性能差距仍是相当明显,未来数年这个格局应该也很难被转变。
虽然华为早些年也投入微架构的自研工作,但 2018 年 MWC 上并没有宣布相关的信息,其最新的麒麟 970 因为基于标准 ARM 公版架构,整体效能约为 A11 的一半左右,落差相当大。华为自研微架构芯片应该会随着年底新款高端手机一并发布,而届时期 AI 核心也会有一定的变革,借以应对高通和三星,甚至苹果在高端手机市场的挑战。
像联发科、瑞芯微、全志等追求性能价格比的公司,基本上就和自研微架构无缘了,ARM 官方发表的架构表现如何,基本上这些公司的产品就是长怎么样,不会有太大意外。也因此,落后苹果产品一大截已经是可预见的结果,不过这些公司的目标市场本来就不是高端定位,所以也不用期待太多。
所以,当年苹果对 ARM 指令集的布局可以说回报丰厚,其投资效益不出意外的话甚至还可继续延续数年之久,当然,苹果在芯片研发和布局的资本投入并不是其他芯片厂商可以相提并论的,即便占了先机,但持续的投入才是苹果未来得以维持绝对优势的关键。
苹果布了一个“王炸之局”
无论如何,整件事情要从一个影响手机、半导体产业极为深远,但又不为人知的老故事开始说起,然后回头看看目前的 ARM 架构市场变化。
这一切都要由苹果所布的局开始。一位在半导体产业资历极深、曾在各大处理器厂商中担任要职的人士对 DT 君透露,苹果自有芯片的布局,甚至要往上延伸至 IP 供货商,也就是 ARM 身上。
那么,身为芯片最上游的 ARM 如何受到苹果的影响?这要从 ARM 对 64 位架构发展态度的消极开始看。
ARM 从推出高端 Cortex-A 架构之后,就一直固守在 32 位,并且强调 32 位的性能已经足够使用,甚至在 PC 或服务器市场也能和 X86 相提并论。但事实上,ARM 的 32 位指令在移动市场表现虽不错,但成长性有限,且随着未来应用复杂度增加,其先天的 4GB 内存寻址限制将会成为整个应用生态的紧箍咒,而在服务器市场,缺乏 64 位寻址能力的 ARM 架构,也几乎找不到半点市场空间。
如果没有前进到 64 位,ARM 架构不只在服务器市场将持续空白,移动市场也可能早就被重新经营低功耗移动市场的 X86 架构给击倒了。
2012 年,ARM 终于在其长远的处理器列表上添加了 64 位架构,晚了 X86 架构 13 年,然而这并非完全出自 ARM 自己之手。
苹果希望维持 A 系列处理器在移动市场上的性能优势,且将应用扩及包含笔记本与 PC 市场,作为取代 X86 架构的武器。但是在迟迟等不到 64 位架构到来的情况下,只好主动和 ARM 进行沟通,提供其研究多年的 64 位指令集设计建议,苹果总共定义了 26 条 64 位指令,在 2012 年发表的 ARM v8.0a 使用了其中的 18 条指令,次年的 ARM v8.1a 则补上了其余的 8 条指令。
谈到这边,各位应该对苹果 A 系列芯片性能要比同时期产品更高的理由心里有点底了吧。
当然,ARM 作为公正 IP 供应者,理论上不应该也不会偏向任何一方,虽然在大客户的要求下,硬着头皮推出采用苹果建议的 64 位架构设计,但完成后也同样对外开放授权。苹果无偿贡献这些指令集,最后所有芯片厂商都能借助授权使用,乍看之下是为人作嫁衣,让竞争者捡了便宜。
但实际上,苹果在芯片设计方面早有深厚的基础,且在 A5 之后转而自行设计芯片架构,最后一款 32 位芯片 A6 更是自行设计微架构,对相关指令集所需要的配套优化架构了然于心,反观套用 64 位 ARM 公版架构的厂商纷纷在市场上受挫而叫苦连天。
ARM 后续虽不断改进其公版微架构,但苹果已经稳居市场先机,包含高通、三星、华为等都认为继续采用公版架构将无法拉近与苹果的距离,因此纷纷投入研发基于 64 位 ARM 指令集的自有微架构,但市场的落差已然存在,即便到现在,苹果仍在处理器微架构的效率表现上遥遥领先其他芯片设计厂商,甚至逼近 X86 的程度。
所以说,苹果已为其 64 位架构布了一个非常深远的局,而且其影响将持续下去。
不过 ,ARM 被软银(SoftBank)并购之后,除了在 IoT 市场推出各种相应方案,也积极布局服务器市场,没有死守在由苹果开拓出来的 64 位路径上,而是以此为基础,增加更多的应用可能性。
然而,过去几年被苹果远远抛开的移动芯片供货商也逐渐走出自己的路,毕竟,如果只是单纯依照建议公版,那永远也追不上苹果。通过自有微架构的开发,这些厂商也逐渐拉近与苹果的距离。
苹果不仅拔得 64 位 ARM 架构头筹,性能亦持续领先
我们都知道,苹果 A 系列芯片是最早进入 64 位的 ARM 架构,其他方案几乎都晚了苹果 1 年以上,其最主要的原因是前面提到的,苹果早在 ARM 推出其官方 64 位架构指令集前就已经先行布局自有架构的开发。
另外还有一个原因,除了当时手机等移动平台上没有 64 位应用开发经验,芯片厂看不到苹果所看到的差别,担心最终只是落得噱头一场,投资开发新架构可能成泡沫,且 ARM 的 64 位架构的由来也让各大芯片厂商不怎么放心,因此裹足不前,坐看苹果拔得头筹,而当苹果取得市场关注之后,才接连引发移动市场的 64 位革命。
A4、A5 芯片采用 ARM 官方 IP,实际效能表现只能说普通,若没有 GPU 的帮助,那跟一般 ARM 架构方案根本没有落差。A6 虽然转用自行开发的 swift 微架构,但性能表现也仅略优于同时其竞争产品,真正拉开差距的,就是首代 64 位架构,也就是基于 Cyclone 架构的 A7 处理器。
与其他基于标准公版 Cortex-A57 的同时期位 ARM 架构芯片比较起来,Cyclone 架构把指令发射宽度 (issue-width) 从标准的 3 个增加到 6 个,并且大幅增加片上缓存以及存取带宽。而基于 A7 的终端产品从 2013 年底逐渐上市,反观业界首款基于 64 位 ARM 架构 Cortex-A57 迟至 2015 年初才有产品上市,且因为 A57 只是在 32 位架构 A15 的基础上增加 64 位指令,很多东西都是等比例放大,没有经过优化,配置非常不均衡,加上芯片代工工艺跟不上,首波推出的芯片与终端方案表现可说是极为凄惨。
2015 年,苹果也理所当然的用基于 Cyclone 二代微架构的 A8 以及 Twister 微架构的 A9 碾压 Android 高端产品阵营,其设计理念也很一致,用大规模同步指令译码能力取代原本的高频设计,并且增加带宽与缓存,让指令集运行更有效率,而同时期的芯片厂仍持续强调运作频率等苹果根本看不上眼的规格。
也因此,苹果能够长期稳定运作在相对高效能之下,而其他产品通常只能全力运作非常短的时间,然后就碰到功耗门,被强制降频,该时期代表作骁龙 810 甚至只能在低于一半的预设频率下才能勉强维持稳定运作,虽然号称 8 核心,但实际性能远远落后于苹果的双核产品。
移动领域虽称霸,但意图取代 X86 的大计并不成功
前面也提到,苹果布局 64 位 ARM 架构其实目的不是只为了手机等移动终端,而是要全面取代其在 Mac 计算器上的处理器,然而理想很丰满,现实状况是,即便增加了 64 位指令,ARM 的基本结构本来就不适合大规模高频率的运作方式,即便苹果已经做了很多尝试,但仍然事倍功半。
而英特尔过去几年在市场上毫无敌手,core 微架构撑了十几年仍淘汰不了,每年固定挤牙膏的作法虽然让其包括苹果在内的客户非常不满,但也只能无奈的买单。英特尔虽然躺着赚,但也不敢忽视了苹果的一举一动。
只要苹果推新架构,英特尔就会推出性能刚好领先一段距离的产品压阵,甚至部分小改版,或者是针对特殊市场的处理器产品也会优先供应苹果,避免苹果真的下了要全面替换处理器的决定。
这个策略也被证实十分有效,截至目前为止,苹果要替换处理器架构都还只是停留在传言的阶段而没有成真。当然,之前的确有某家代工厂已经在帮苹果设计代工基于 ARM 架构的 NB 产品,只是最后因为市场策略调整,或是因为产品性能表现不佳,亦或者是因为来自英特尔的压力,相关产品最终胎死腹中。
虽然苹果相关的规划进行状况并不顺利,但未来肯定还是会继续尝试替换掉来自英特尔的芯片产品,毕竟苹果的最高准则就是单一类型产品有要第二供货来源,而英特尔已经独占太久了。换句话说,就是苹果认为英特尔实在赚太多了。
不过,在 AMD 咸鱼翻身之后,或许苹果又会有不同的决定,但一切还是要回归市场选择以及苹果的策略方向。
被苹果推向 64 位的 ARM,虽成霸主但客户皆怀异心
ARM 虽然用了来自苹果的架构,却也没有自满于现况而裹足不前,v8.0a 到 v8.1a 都是针对移动平台跨向 64 位而设计,并且希望兼顾 PC 市场所需要的高性能表现,其随后发表的 ARM v8.2a 是针对服务器所需要的半精度浮点计算、增强内存模型,并且引入 RAS(可靠性可用性可服务性) 的支持与统计分析扩展,而在短短不到 3 个月的时间内,ARM 又发表了 v8.3a,改善了处理器本身的资安特性,而 2018 年推出的 v8.4a,则是再度强化加密与内存管理,从这边也可看出,未来 ARM 已经逐渐从移动处理器的 IP 供货商角色抽离,希望能做到包含服务器等全方位市场的布局。
也因为这些架构上的布局,服务器市场终于渐有起色,部分云服务客户也开始采用基于 ARM 架构的服务器芯片,而不再偏好来自英特尔的架构。
另一方面,ARM 被软银收购之后,不只 NRE 及一次性技术许可费大涨 3 倍以上,每年也都大幅调升专利费的比重,但好在手机市场上还有个万恶的高通以及微软坐收高额技术许可费,所以看起来增加的幅度还不明显,但是在其他 IoT 或者嵌入式领域中,就造成了芯片方案厂商很大的负担。
但其实连三星都已经有点受不了了,原本三星是采用最顶级的架构订阅模式,只要有推出新架构,三星都可以直接使用,但后来也改为只签订有使用到的架构授权,而非全包。
另外,ARM 当然也知道继续一直涨价下去,很多低端嵌入式的芯片设计厂商都会受不了,于是也提出 DesignStart 项目,包含了几款 Cortex-M0 到 M3 等低端 MCU 核心,免除了初始专利费这个门坎,乍看之下十分优惠。不过这些架构其实都已经很古老,性能有点追不上目前 IoT 所需要的性能门槛,所以客户如果要开发新应用,多半也不会使用 DesignStart 项目。而 ARM 每次推出新架构,价格都会继续往上迭加,旧方案则是每年涨价。
也因为如此,ARM 的营收也不断成长。
市场看到 ARM 已经逐渐走向另一个巨头的垄断道路,也开始有所警觉,因此包括 ANDES、RISC-V 等费用较合理、甚至免费架构采用的人也越来越多,然而这些架构缺乏了关键的非循序 (Out-Of-Order) 执行能力,无法肩负手机等高端计算环境需求,但是在低端嵌入式环境中,已经开始有不少应用实例出现,生态也逐渐成熟,诸如联发科、WD、华为也都成为 RISC-V 的拥护者,并开发相关方案,性能与功耗表现亦获得市场肯定。
成为霸主的路上自然挑战不断,ARM 希望把自己打造成处理器 IP 界的霸主,自然也要面对各种考验,虽然目前来看,这些考验都还是属于小儿科的阶段,对 ARM 产生不了威胁,但霸主往往都会过于轻敌,并把自己的需求看得太重要,以致于忽视客户的心声,ARM 未来是否也会如此,值得观察。
DeepTech深科技