近日,英伟达发布基于Arm架构的CPU——“Grace”,引发硬科技领域小伙伴一众关注。这款专为加速计算而设计的 CPU 和服务器架构,在与英伟达的 GPU 结合使用时,整套系统可以提供相比当今基于 x86 CPU 的最新 NVIDIA DGX 快 10 倍的性能。Arm架构相比x86架构有何异同?选择不同指令集架构对CPU影响是什么?国内外发展情况如何?带着问题,我们来认识下CPU架构。

CPU是啥?

中央处理器单元(CPUCentral Processor Unit)是计算机系统的核心。CPU 的功能主要为处理指令、执行操作、控制时间、处理数据。中央处理器主要包括逻辑运算器、控制器和寄存器等部件。同时,CPU 还包括高速缓冲存储器(Cache)及实现它们之间联系的数据、控制的总线。其中,逻辑运算器是多功能的运算单元,主要进行相关的逻辑运算,如执行移位操作和逻辑操作。除此之外,逻辑运算器还可以执行定点或浮点算术运算操作,以及地址运算和转换等命令。控制器则是主要用来对指令进行分析并且能够发出相应的控制信号。寄存器则是用来暂存指令、数据和地址信息。

1971 年 11 月 15 日,美国英特尔公司(INTC US,无评级)推出世界第一款商用计算机微处理器 Intel 4004,被认为是 CPU 发展史的开端。作为 4 位处理器,Intel 4004 由 10um制程工艺在 2 英寸晶圆上打造,集成了 2300 个晶体管,主频为 740kHz。而到了 49 年后的 2020 年,第十一代酷睿处理器芯片基于英特尔 10nm 工艺打造,将集成超过百亿个晶体管,最高主频可高达 4.8Ghz。这颗 CPU 芯片不再是单一的 CPU,而是集成了全新架构的 Willow Cove 内核、Iris X 图形处理器、内存控制器、图像处理器、媒体解码器、电源管理、神经元加速器和各类高速接口控制器等各种组件。其中 Willow Cove 内核正是这颗 CPU 芯片集成的传统意义上的 CPU。

图表英特尔第十一代酷睿处理器芯片
1.png


指令集是一套“给计算机硬件下命令”的指令集合

计算机指令(Instruction)是计算机硬件直接能识别的命令。指令是由一串二进制数码组成。一条指令通常由两个部分组成:操作码和地址码。操作码指明该指令要完成的操作的类型或性质,如取数、做加法或输出数据等;地址码指明操作对象的内容或所在的存储单元地址。计算机程序在硬件上执行是由成千上万条指令组成的。一段程序通过编译翻译成汇编语言,而后通过汇编器翻译成一条一条机器码。这些机器码是由 0 和 1 组成的机器语言表示,也就是计算机指令。

指令集架构(Instruction Set Architecture)是指一种类型 CPU 中用来计算和控制计算机系统的一套指令的集合。指令集架构主要规定了指令格式、寻址访存(寻址范围、寻址模式、寻址粒度、访存方式、地址对齐等)、数据类型、寄存器。指令集通常包括三大类主要指令类型:运算指令、分支指令和访存指令。此外,还包括架构相关指令、复杂操作指令和其他特殊用途指令。因此,一种 CPU 执行的指令集架构不仅决定了 CPU 所要求的能力,而且也决定了指令的格式和 CPU 的结构。X86 架构和 ARMv8 架构就是指令集架构的范畴。

复杂指令集架构CISC vs 简单指令集架构 RISC

指令集架构以其复杂性可被分类为复杂指令集架构(CISC,Complex Instruction Set Computer)和精简指令集架构(RISC, Reduced Instruction Set Computer)两大类。

CISC 和 RISC 指令集架构是计算机指令系统的优化发展中先后出现。在计算机发展初期, 计算机的优化方向是通过设置一些功能复杂的指令,把一些原来由软件实现的、常用的功能改用硬件的指令系统实现,以此来提高计算机的执行速度,这种计算机系统就被称为复杂指令系统计算机。20 世纪 80 年代,尽量简化计算机指令功能的基本思想被提出,功能简单、能在一个节拍内执行完成的指令被保留,而较复杂的功能用一段子程序来实现,这种计算机系统就被称为精简指令系统计算机。

图表指令集是计算机系统中硬件和软件之间交互的规范标准
2.png


X86 架构是目前唯一的主流复杂指令集(CISC),垄断个人计算机和服务器处理器市场。X86 架构是英特尔公司在 1978 年发布。在过去四十多年,x86 家族不断壮大,从桌面转战笔记本、服务器、超级计算机。目前,X86 架构授权被英特尔、超微半导体(AMD US,无评级)和台湾威盛三家把持。其中,英特尔和 AMD 的 X86 处理器在桌面电脑和笔记本市场占据主导地位。据 2017 年 IDC 的报告统计,X86 处理器在服务器市场占有率也高达 96%。根据 Mercury Research 统计,2019 年台湾威盛仅占有 0.1%的 X86 桌面处理器市场份额。

ARM 指令集架构作为目前最成功 RISC 架构,主导了智能手机和物联网芯片处理器市场。 根据英伟达公告,基于 ARM 架构的芯片已累计出货 1800 亿颗。ARM 架构处理器在智能 手机芯片、车载信息芯片、可穿戴设备、物联网微控制器等领域占到 90%以上市场份额。 90 年代,MIPS 和 Alpha 作为知名 RISC 在与 X86 竞争计算机市场中失败,又在错过智能终端高速发展的机遇中走向衰弱。2010 年发布的 RISC-V 作为从发明伊始即以开源为最大特色的RISC ISA 受到全球学界、产业界的高度关注。全球顶级学府、科研机构、芯片巨头纷纷参与,各国政府出台政策支持 RISC-V 的发展和商业化。RISC-V 有望成为 X86 和 ARM 之后 ISA (指令集)第三极。

处理器微架构:实现指令集架构的物理电路

冯·诺依曼体系结构是现代计算机的基础。1946 年美籍匈牙利科学家冯·诺伊曼提出存储程序原理,把程序本身当作数据来对待,程序和该程序处理的数据用同样的方式存储,并确定了存储程序计算机的五大组成部分和基本工作方法。

冯·诺依曼体系结构主要由 CPU、存储器(Memory)和输入输出设备(I/O Device)组成。在该体系结构下,指令和数据需要从同一存储空间存取,经由同一总线传输,无法重叠执行。冯·诺依曼体系的 CPU 工作分为 5 个阶段:取指令阶段(instruction fetch)、指令译码阶段(instruction decode)、执行指令阶段(execute)、访存取数(read memory)和结果写回(write back)。哈佛结构是另一种主要计算机架构体系。与冯诺依曼处理器相比,哈佛结构的指令和数据存在两个相互独立的存储器模块,使用两条独立的总线连接 CPU 和存储模块。而在改进型哈佛结构(Modified Harvard Architecture)中,指令和数据存在两个相互独立的存储器模块,但是共用地址和数据总线。现代的复杂芯片上,已经看到纯粹的冯·诺伊曼体系或者哈佛体系,而大多数能看到是两者融合或者并存的体系。

图表冯·诺伊曼计算机体系基本结构
3.png


实现指令集架构的物理电路被称为处理器的微架构(Micro-architecture)。因此,通俗来讲处理器架构就是处理器电路。通常,具备独立设计处理器微架构的企业被认为有处理器研发能力。大多数情况下,一种处理器的微架构是针对一种特定指令集架构进行物理实现。少部分处理器架构设计为了更好的兼容性,会在电路设计上实现多个指令集架构。虽然,指令集架构可以授权给多家企业,但微架构的设计细节,也就是对指令的物理实现方式是各家厂商绝对保密的。由于处理器的功能要求、使用场景不同、各家企业设计技术的差异等因素,即使基于同一指令集架构,各个企业也会设计生产出不同的处理器架构。

图表ARM Cortex-A77 处理器架构图
4.png

IP授权 = 卖处理器微架构”版权”

在计算机时代,英特尔和 AMD 等主要处理器厂商研发处理器架构仅供应自家处理器芯片。

作为垄断个人电脑和服务器的 X86 架构阵营,英特尔和 AMD 继续延续只为自家处理器芯片设计供应处理器内核的模式。2016 年,AMD 和中国服务器企业海光合作,授权给海光的 Zen 架构正是处理器微架构。这个授权物实际就是 AMD 根据 X86 架构设计完成的处理器电路,并不是 X86 指令集架构。即使是以这种 IP 授权方式的合作,在 X86 阵营中也是极少的个例。

在智能移动设备兴起的近 20 年,以 ARM 模式为代表的内核微架构 IP 授权模式兴起。ARM开发内核微架构后,将它们以 IP 形式上架出售,芯片厂商以 ARM 授权的内核为基础设计芯片使用或对外销售。基于 ARM 精简指令集架构的 ARM 内核微架构 IP 选择多样、设计精简可靠、在低功耗领域表现优异,这种授权模式在以手机、平板为代表的移动终端芯片、机顶盒、视频监控等应用媒体芯片等应用为代表移动智能领域获得广泛的成功。ARM 因此也成为移动互联时代的处理器 IP 授权霸主。

图表部分先进处理器芯片架构对比
5.png

产业分工细化,ARM 成为处理器 IP 授权领域王者半导体产业垂直分工催生芯片 IP 产业。20 世纪 90 年代开始,信息产业核心从个人计算机向手机产业过渡,信息时代从互联网为主体的阶段向移动互联阶段过渡。智能移动终端和智能多媒体产品更加复杂多样,对芯片功能和性能需求差异化增加了设计的复杂度。另一方面,随着摩尔定律推进,先进工艺制程芯片设计研发资源和成本持续增加。

根据 2020 年 IBS 报告预测,一款先发使用 5nm 制程芯片设计成本将高达 4.97 亿美元,相比 16nm 增长多达 5 倍;即使 5nm 将来成为成熟制程,单款芯片设计成本也将高达 2.5 亿美元,接近 7nm 的先发芯片设计成本。全球半导体产业在 fabless+foundry+OSAT(无晶圆设计+晶圆代工+封装测试)的分工大趋势下继续细化分工,芯片设计产业进一步拆分出芯片 IP(Intellectual Property)产业。

图表不同制程工艺设计成本预测
6.png
半导体 IP(Intellectual Property)指已验证的、可重复利用的、具有某种确定功能的集成电路模块。IP 供应商专注开发 IP 微架构,通过收取 IP 架构授权费、版税进行盈利。设计公司在芯片设计中将得到授权的 IP 直接集成到芯片中实现功能,避免重新开发。根据Markets and Markets 预测,半导体 IP 市场到 2024 年将达到 65 亿美元规模,市场增长的推动因素是消费电子领域不断进步的多核技术和现代 SoC 设计领域持续增加的需求。根据 IP 功能细分,处理器 IP 占据整最大的 IP 市场份额,根据 IPnest 统计,2019 年包括CPU、GPU、NPU、VPU、DSP 和 ISP 六大类处理器 IP 占全市场 51%份额。

图表2019 年半导体 IP 以功能分类市场份额
7.png


IP授权让精简指令集(ARM架构)生态蓬勃发展

ARM 英文全称 Advanced RISC Machines,总部位于英国剑桥。该公司成立于 1990 年11 月,是苹果电脑、Acorn 电脑集团和 VLSI Technology 的合资公司。ARM 不制造芯片,也不销售实际的芯片给终端客户,而是通过授权其 RISC ISA 和处理器设计方案,由合作伙伴生产出各具特色的芯片。ARM 公司利用架构授权的模式与伙伴达成双赢,迅速成了全球性的精简指令集微处理器标准的缔造者。2016 年 7 月,日本软银(Softbank)宣布斥资 243 亿英镑收购 ARM 公司,但在业务上仍然保持独立运营。

ARM 凭借在通用处理器 IP 领域垄断优势,在 IP 营收上稳居全球 IP 供应商排名榜首。基于 ARM 指令集开发的 ARM 处理器内核被广泛应用于智能手机、电视机、汽车、智能家居、智慧城市和可穿戴等设备上。据软银 2017 年世界大会公布的 ARM 市场份额显示,超过 99%的智能手机、调制解调器,超过 95%的车载信息设备和超过 90%的可穿戴设备搭载了 ARM 架构处理器。

图表2019 年全球十大半导体 IP 供应商
8.png

ARM 授权ARM架构,商业模式开创半导体行业先河

作为半导体企业,ARM 独特的商业模式是不设计和制造整芯片,而是专注处理器内核架构的授权。ARM 一直以来保持作为处理器 IP 供应商的中立地位。中立地位帮助 ARM 通过架构授权广泛推广了基于 ARM 架构的生态系统。ARM 处理器架构授权主要分为指令集授权和处理器架构授权两个层次:一是 ARM 指令集架构授权,二是 ARM 处理器架构授权。

公司收入来源包括:1)对半导体公司的授权费用,一定时间范围内是一次性的;2)半导体公司向其他客户销售芯片的 royalty 费用,客户每生产一颗芯片 ARM 都有一定百分点的版税收入;3)向半导体公司、用户提供技术咨询服务的费用。

图表:ARM 授权体系
9.png


ARM 指令集架构授权指 ARM 将 ARM RISC 精简指令集授权给受让方。受让方可以对ARM 指令集进行大幅度改造,甚至可以对 ARM 指令集进行扩展或缩减。之后,受让方根据自己改进过的指令集研发处理器架构,从而在根源上做到了对处理器架构的差异化设计,保持对自研芯片的掌控力,达成独特竞争力同时又兼容 ARM 的完善生态环境。而 ARM在这种合作模式中与合作伙伴结成高度紧密的技术合作关系。

图表复杂指令集和精简指令集对比
10.png

苹果的 A 系列处理器是基于 ARM 指令集架构授权自研内核的成功典范。2012 年 9 月,苹果随 iPhone5 上市发布了 A6 处理器 SoC,这颗 SoC 基于 ARMv7 架构打造的 Swift 内核微架构开启了苹果基于 ARM 架构自研处理器内核的序幕。2013 年 9 月,苹果率先发布搭载基于 ARMv8 架构研发的 64 位 Cyclone 架构的双核 A7 处理器。A7 作为世界首款 64 位智能手机处理器,在性能表现力压还在 32 位四核方案上竞争的安卓阵营。苹果 A 系列处理器内核性能力压所有安卓阵营竞争对手序幕由此开启,并延续至今。2020 年,苹果宣称新发布的 A14 Bionic 芯片性能已经堪比部分笔记本处理器。

苹果在2020年 WWDC2020 宣布 Mac 电脑将转向使用公司自主开发的基于 ARM 架构处理器。 我们认为,苹果结束与英特尔长达 15 年的合作,转而使用自研 ARM 处理器最重要目的是进一步封闭苹果的软硬件生态。苹果希望如同 iPhone 的成功一样,从硬件上得到充分自主,做到差异化竞争优势。从 ARM 角度来看,苹果一旦成功也将帮助 ARM 实现一直以来希望撕开 X86 垄断的个人计算机市场的野心。

ARM 处理器架构授权指 ARM 将自行设计的处理器内核 IP 授权给客户。客户可以直接将内核 RTL(Register Transition Level)代码在芯片前端设计时集成在芯片处理器模块中。客户也可以对处理器缓存、核数、频率进行配置。通过系统总线与其他的功能模块、外设接口、主存储接口模块等连接,生成完整的芯片。ARM 为各种应用场景提供多样化的家族化处理器 IP 解决方案,覆盖高性能计算、高性能实时、低功耗嵌入式、云端计算、硬件安全和高性能机器学习等场景。ARM 的处理器 IP 授权模式为合作伙伴提供可靠处理器的同时降低芯片开发成本,推动应用的创新。而广泛的合作伙伴丰富了ARM 的生态,奠定 ARM 在智能时代中智能手机、物联网等领域处理器主导地位。

ARM Cortex 系列处理器之Cortex-ACortex-MCortex-R

ARM Cortex 系列处理器内核是 ARM 家族中占据处理器 IP 市场的核心系列。其中, Cortex-A 系列面向高性能计算需求、运行丰富操作系统和程序任务的应用领域。例如智能手机、平板电脑、机顶盒、数字电视、路由器和监控 SoC 芯片等。Cortex-A 目前有 A7x系列为代表的性能大核产品线和 A5x 系列为代表低功耗小核产品线。  

现代多核 SoC 为了兼顾性能峰值表现和低功耗,经常同时集成一定数量大核和小核。其中大核运行短时间的高性能需求任务;小核运行低性能需求的任务或者在待机状态支持背景任务运行。目前,除了苹果自研处理器内核以外,以高通、海思、联发科为首的安卓智能机 SoC 芯片设计企业都采用 Cortex-A7x A5x 搭配作为内核集合(cluster)配置。其中,高通和华为会在架构上做不同程度的优化。

相比 Cortex-A 处理器内核,Cortex-M 处理器内核被设计成面积更小,能效比更高。通常这些处理器的流水线很短,设计简单,最高时钟频率很低,功耗表现优异。Cortex-M 系列在目前智能互联时代应用前景非常广阔,覆盖智能测量、人机接口设备、汽车和工业控制系统、大型家用电器、消费性产品和医疗器械等应用需求,Cortex-M 在目前全球 32 MCU 市场占据主导地位。Cortex-R 处理器是面向实时应用的高性能处理器系列,运行在比较高的时钟频率,其响应延迟非常低。主要应用于硬盘控制器,汽车传动系统和无线通讯的基带控制等领域。

图表ARM Cortex 系列处理器 IP
11.jpg

国内基于ARM 架构芯片的发展情况

根据 CINNO Research 发布的最新数据显示,2020 年上半年,国内市场智能机销量约 1.4亿部,其中华为(含荣耀)市场份额达到 40.2%。另据市场调研机构 Counterpoint 发布的报告显示,2020Q2海思麒麟芯片占据41%的国内智能手机芯片市场份额,成为国内第一。

同时,海思麒麟芯片在全球智能机芯片市场份额提升到 16%,超过苹果和三星。近年来华为手机质和量形成双击,特别是旗舰手机得到全球市场广泛认可。除去全球疫情蔓延和美国打压带来的国货消费潮等偶然因素,我们认为内在主因是基于硬件上的自主创新获得的用户体验提升和形成差异化竞争。搭载 ARM 处理器的华为海思自研的麒麟芯片是一系列硬件创新的核心之一。

图表2020Q2 全球智能手机处理器市场份额
12.jpg

半导体产业 fabless + foundry + OSAT 分工体系从工程上成就了包括麒麟芯片在内的海思芯 片的成功。华为对海思不断持续巨额投入带来的芯片设计能力提升成功对接全球最先进的 制程工艺和封装工艺。而在芯片设计领域,ARM 的处理器 IP 授权模式成为历代麒麟芯片 成功的重要因素之一。ARM 的授权模式对麒麟芯片积极影响有以下几方面:一是在创业初期,ARM 的授权模式可以帮助作为后发者的海思在处理器内核性能上直接拉到和安卓阵营竞争对手同一个层级。二是对于 ARM 在智能手机领域的主导地位,使海思自研手机芯片能够借助 ARM 完善的生态,帮助华为手机快速进入主流智能机市场。三是基于消费电子市场的特点,ARM 的处理器授权有效缩短了包括海思在内的企业开发周期和成本。

图表华为海思历代旗舰手机芯片
13.jpg

除了基于 ARM 公版内核架构开发芯片以外,华为已经具备基于 ARM 指令集架构的处理 器内核开发能力。海思在麒麟 990 官方发布和配置表都宣称为使用“基于 A76 A76 Based) 内核,显示海思已经对 ARM 处理器内核和指令集有深入了解,掌握了自行对架构修改的能力。2019 年 1 月,华为跟进一步发布自研服务器芯片鲲鹏 920。该服务器芯片搭载了64 颗海思基于 ARMv8 架构自研的泰山内核。整体服务器性能较市场现有竞品提升 20%。2019 年 5 月,华为宣布获得 ARMv8 架构永久授权,并且强调华为海思有持续自行开发设计基于 ARM 授权架构的处理器。

近年来,智能手机 SoC 以外的国产智能终端 SoC 芯片也借助 Cortex-A 系列处理器 IP 逐步实现国产替代。国产搭载 ARM 架构处理器的 SoC 涵盖了智能高清机顶盒、IPC、网络摄像头、车载娱乐信息设备等。根据格兰研究院数据,2018 年华为海思和晶晨股份(688099, 无评级)分别占据国内 60.7%和 32.6%的 IPTV/OTT 机顶盒芯片市场。而在 2013 年,欧洲芯片巨头意法半导体还占据国内机顶盒芯片市场 30%以上。在安防领域,以海思为代表的国内厂商已经实现 IPC 芯片实现低端替代到全档次布局。

图表部分中国本土基于 ARM 处理器的 SoC 产品
14.jpg

物联网时代 MCU 需求提升,本土厂商借助 ARM Cortex-M 卡位高端市场。

根据 IC Insights 数据,2019 年 MCU 全球销售额为 164 亿美元。产品主要用于汽车电子、 工控/医疗、计算机网络和消费电子等领域,占比分别为 33%、25%、23%和 11%。IC Insights 同时预计 MCU 在经历 2019 年和 2020 年下滑后,将在 2021 年出现温和复苏,销售额将增长 5%至 157 亿美元,其次是 2022 年将同比增长 8%,2023 年将同比增长 11%。届时MCU 收入将创下 188 亿美元的新高。全球 MCU 市场主要由瑞萨电子(日本)、恩智浦(荷兰)、英飞凌(德国)、微芯科技(美国)、三星电子(韩国)、意法半导体(意法)、赛普拉斯(美国)占据。根据 HIS 和 ASPENCORE 数据,2019 年中国 MCU 市场规模达到 256 亿人民币。

中国MCU 应用市场主要集中在家电/消费电子、计算机网络、汽车电子、智能卡、工控等领域,市场占比分别为 25.6%、18.4%、16.2%、15.3%和 11.2%。受益于国内物联网和新能源车行业的增长领先于全球,中国 MCU 市场规模在 2008 年到 2018 年间 CAGR 为 7.2%,领先全球。同时,HIS 预计 2022 年,中国 MCU 市场规模将达到 319 亿人民币,增速继续超过全球。预计 2020 年国产 MCU 厂商的销售额将达到 148 亿元人民币,占整个中国MCU 市场的 55%。

图表2019 年中国 MCU 应用市场构成
15.jpg

ARM Cortex-M 处理器助力国内厂商卡位 MCU 市场的价值链上游。目前,国内 MCU 厂商在消费电子、智能卡和水电煤气仪表等中低端应用领域实现国产替代。随着物联网终端需求推进,物联网时代任务的复杂化对计算能力的要求将使 MCU 往 16 或 32 位设计。32 位MCU 是基于未来物联网的市场发展方向。既满足厂商上述要求又具有丰富生态系统资源的 ARM Cortex-M 系列处理器内核成为 32 位 MCU 内核市场主导。兆易创新、中颖电子等国内 MCU 厂商也纷纷借助基于 ARM Cortex-M 系列处理器的 32 位 MCU 积极布局国内中高端市场,向产业价值链上游卡位。国产 32 位 MCU 已经开始进入国外传统厂商所垄断的高端 MCU 市场。

作为国产 IC设计领军企业,兆易主要提供基于 ARM Cortex-M 系列 32 位通用 MCU 产品, 其 GD32 是 ARM® Cortex-M3 及 Cortex-M4 内核通用 MCU 产品系列,也是目前中国 32 位通用 MCU 主流产品,广泛应用于工业自动化、人机互动、电机控制、安防家弄、智能家居家电及物联网等领域。根据公司 2020 年中报,兆易 MCU 产品包括 330 余个产品型号、23 个产品系列和 11 种不同封装类型,累计出货已超过 4 亿颗。2020 年 7 月,兆易创新发布基于全新 Arm Cortex-M33 内核的 GD32E5 系列高性能微控制器,确定以无线连接、电池供电设备以及便携式、可穿戴设备、汽车级 MCU 几大方向的产品路线。

图表部分中国本土 32 MCU 供应商和代表产品
16.jpg

RISC-V 开源模式赋予国内处理器换道超车机会

RISC-V 是新兴精简指令集,开源模式吸引关注。

2011 年,新兴的开源架构 RISC-V 出现引起全球处理器产学研关注。RISC-V 是一种简单、开放、免费的全新精简指令集架构,其最大的特点是“开放”。它的开放性允许它可以自由地被用于任何目的、允许任何人设计、制造和销售基于 RISC-V 的芯片或软件,这种开放性在处理器领域是彻底的第一次。RISC-V 起源于 2010 年加州大学伯克利分校的David Patterson 教授与 Krste Asanovic 教授研究团队准备启动一个新项目。项目需要选择一种处理器指令集。由于当时已有的指令集 ARM、MIPS、SPARC、X86 存在设计越来越复杂和知识产权问题,因此他们开始重新设计一套指令集。

伯克利大学团队在指令集发布同时决定将 RISC-V 指令集彻底开放,使用 BSD License 开源协议设计了开源处理器核 Rocket Core。伯克利研究团队认为,指令集作为软硬件接口的一种说明和描述规范,不应该像 ARMPowerPCX86 等指令集那样需要付费授权才能使用,而应该开放和免费。他们选择的 BSD 开源协议给予使用者很大自由,允许使用者修改和重新发布开源代码,也允许基于开源代码开发商业软件发布和销售。因此 BSD开源协议对商业集成很友好,很多的企业在选用开源产品时都会首选 BSD 开源协议。

RISC-V 基金会于 2015 年由硅谷相关公司发起并成立,RISC-V 商业化进入快车道。基金会作为非盈利性组织,负责 RISC-V 指令集架构及其软硬件生态的标准化、保护和推广。RISC-V 成立时基金会董事会来自 Bluespec、谷歌、Microsemi、英伟达、恩智浦半导体、加州大学伯克利分校和西部数据的七名代表组成。据 RISC-V 基金会统计,目前已有来自25 个国家的 210 多个机构、学术和个人加入。中国企业和研究机构积极参与基金会,阿里巴巴、华为、中兴通讯和赛昉科技目前是基金会顶级成员。

图表RISC-V 大事件汇总
17.jpg

由于长期的发展,X86 和 ARM 形成了强大生态体系,RISC-V 在短期内难以在计算机领域和移动互联领域替代 X86 和 ARM。但在新兴的 AIoT 时代,RISC-V 将迎来机遇。包括ARM 在内的 CPU 架构经过几十年的发展演变,已变得极为复杂和冗繁。即使是作为精简指令集的 ARM 架构文档也长达数千页。指令数目已经日趋复杂,并且版本众多,彼此之间既不兼容,也不支持模块化。另外现有主流指令集还存在着高昂的专利和架构授权问题。作为设计之初就定位为完全开源架构的RISC-V,后发优势规避了计算机体系几十年发展的弯路。架构文档只有二百多页,基本指令数目仅40 多条。模块化使得用户可根据需求自由定制,配置不同的指令子集。

精简和灵活使新兴的 RISC-V 架构在智能物联网市场有机会实现突破。智能物联网(AIoT) 时代带来的低延时大容量万亿设备互联,场景丰富、万物互联、智能化将催生新的芯片市场需求。但是丰富的应用场景也导致 AIoT 市场呈现碎片化和多样化,对 CPU 的需求也极为多样。现有的处理器设计并不能有效应对。RISC-V 架构的极致精简和灵活的架构以及模块化的特性,可以针对不同应用灵活修改指令集和芯片架构设计。相比之下使用 ARM往往只能做一个标准化设计,很难实现差异化。此外,很多智能设备对于成本较敏感,RISC-V 架构免费授权的特点对于芯片厂商也非常重要。

市场调研机构 Semico Research 研究结果显示,预计到 2025 年,采用 RISC-V 架构的芯片数量将增至 624 亿颗。在包括计算机,消费者,通讯,运输和工业市场在内的细分市场, 2018 年至 2025 年复合增长率高达 146%。Semico Research 与 RISC-V 基金会共同确定了 34 个细分市场,并研究了每个市场的 CPU IP 内核的总可用市场和 RISC-V IP 内核的服务可用市场,最终对 2025 年数据进行了预测。研究认为四个具有使用 RISC-V 内核的高价值机会是高性能多核 SoC、高性价比多核 SoC、基础 SoC 和 FPGA。

图表RISC-V 内核需求数量构成预期
18.jpg

开放和合作使 RISC-V 有潜力成为中国处理器自主可控的指令集架构选择。RISC-V 架构开源模式使该指令集架构避免如 X86 和 ARM 被极少数公司控制,从而在架构源头实现自主可控。广阔的使用前景和未来潜在市场规模,吸引了全球著名企业、研究机构和高等学府积极合作,多方投入合作有望促进 RISC-V 产业链成熟和生态的完善。生态繁荣的前景有利于国内参与企业持续盈利,提高继续投入积极性,进入良性发展循环。乐观的市场预期、成熟的产业链和完善的开发生态,是 RISC-V 成为主流指令集架构,甚至于成为 X86 和 ARM 外指令集架构第三极的必备条件。

图表RISC-V 和其他架构授权模式比较
19.jpg

全面布局指令集架构优化、处理器内核开发和终端芯片设计,是真正实现处理器自主可控的客观要求。RISC-V 强调完全开源的设计,并且让取用者可任意加上专属指令集,甚至可以自由选择将架构封闭还是维持开源。因此,虽然指令集架构是开源免费,但是基于指令集衍生的专利、内核微架构并不是开源和免费。目前,RISC-V 指令集和微架构均已发展出开放免费、可授权和封闭的三种知识产权模式。

目前,类似于 ARM 商业模式的 RISC-V 内核 IP 授权公司已经兴起。美国 SiFive 由 RISC-V 创始人 Krste Asanovic 创立,是世界最大的 RISC-V 商业处理器 IP 授权公司。目前 SiFive 已完成 E 轮融资,股东除了专业 VC 以外还有高通、西部数据、SK 海力士等半导体行业巨头。SiFive 产品已涵盖 MCU、边缘计算、人工智能、物联网、存储器、AR/VR、机器学习等领域。台湾的晶心科技是另一家著名 RISC-V 内核 IP 提供商。2020 年 10 月,瑞萨半导体(Renesas)宣布开始采用晶心旗下 AndesCore IP 32 位 RISC- V CPU 内核开发新的特定应用标准产品。

以中美贸易摩擦为鉴,安卓式的开源陷阱需要被避免:谷歌利用安卓开源免费的框架,吸引智能手机厂商使用安卓。再把 GMS(Google Mobile Service)闭源做成授权模式,成为自己盈利模式。在美国对华为进行“实体清单”制裁时,谷歌毫不犹豫停止 GMS 授权,使华为智能手机因无法下载、更新、使用 Gmail、Youtube、Google Map 等广泛普及的应用,在海外市场陷入被动。

从处理器发展史来看,一款指令架构的成功,不仅仅在于芯片设计成功,更需要完善的软硬件生态系统。英特尔推动的 x86 架构市场庞大,从传统 PC 到数据中心规模的服务器都在使用基于 x86 架构的处理器,同时相关软件带动的应用服务也有长达 40 年的优化发展历史。ARM 的 IP 授权模式已经趋于完善,ARM 架构已催生庞大的移动和智能设备市场应用规模,加上有 EDA 公司、晶圆代工厂、软件公司在 ARM 生态上的鼎力支持,尽管授权费用高昂,各大芯片厂商依旧愿意进行合作。目前,RISC-V 生态刚开始起步,操作系统、编译器、开发工具、EDA 工具等配套逐渐起步完善。推动生态系统的深度发展,有利于吸引更多企业使用 RISC-V 架构,将 RISC-V 打造成主流架构。

AIoT 市场碎片化以及 RISC-V 架构本身开源灵活的特点,更需要国内外通过开放合作推进 RISC-V 架构向标准化方向发展。维护 RISC-V 开放合作,更有利于 RISC-V 良性发展,积极参与全球合作,中国企业可以提高自身技术能力,提高中国在处理器领域话语权;积极推进国内生态企业合作,有效整合资源,形成完善的产业链,将自主可控处理器和庞大丰富智能物联网应用有效对接,形成双击。

AIoT 爆发在即,国内多方面推进 RISC-V 发展

政策陆续出台,推动产业发展

上海在国内第一个出台与 RISC-V 相关的扶持政策。2018 年 7 月,上海市经信委发布《上 海市经济信息化委关于开展 2018 年度第二批上海市软件和集成电路产业发展专项资金 (集成电路和电子信息制造领域)项目申报工作的通知》,将从事 RISC-V 相关设计和开发的公司作为扶持对象。2018 年 10 月,乐鑫 ESP32-Marlin 物联网芯片项目入选拟支持项目。2020 年 2 月,广东省人民政府办公厅印发的《加快半导体及集成电路产业发展若干意见的通知》中,明确将 RISC-V(基于精简指令集原则的开源指令集架构)芯片设计列入芯片设计重点发展方向。

产学研齐登场,积极投身国内外合作

除了参与 RISC-V 基金会以外,中国的企业和科研院所在国内外还以各类技术共享平台、论坛、产业联盟等形式的参与合作。2018 年 10 月 17 日,由国内外 RISC-V 领域重点企业、研究机构、和行业协会发起成立中国 RISC-V 产业联盟。联盟秉承开放、合作、平等、互利的原则,致力于解决中国 RISC-V 领域共同面对的关键问题,建立中国国产自主、可控、安全的 RISC-V 异构计算平台,促进形成贯穿 IP 核、芯片、软件、系统、应用等环节的 RISC-V 产业生态链。

2018 年 11 月 8 日,中国开放指令生态(RISC-V)联盟在乌镇举行的第五届世界互联网大会上宣布成立,联盟理事长由倪光南院士担任。CRVA 联盟旨在召集从事 RISC-V 指令集、架构、芯片、软件和整机应用等产业链各环节企事业单位及相关社会团体,自愿组成一个全国性、综合性、联合性和非营利性的社团组织。此联盟将围绕 RISC-V 指令集,整合各方资源,通过产、学、研、用深度融合,力图推进 RISC-V 生态在国内的快速发展。同日,同样在世界物联网大会上,RISC-V 基金会在宣布成立中国顾问委员会将就 RISC-V基金会的教育和应用推广战略提供指导。

2019 年,新的非营利性全球组织 OpenHW Group 成立,旨在通过提供合作平台,创建生态系统发展的焦点,以及促进开源处理器的采用,以及为处理器内核提供开源基于 RISC-V架构的 Core-V IP。包括阿里巴巴、华为、恩智浦、英伟达、Silicon Labs 和苏黎世联邦理工大学、美国犹他大学在内的国内外顶尖企业和院校成为 OpenHW Group 的加盟成员。

科研机构发力,展开多领域研究

依托国内大学和研究机构,基于 RISC-V 架构研究在多领域内展开。在 2015 年之前,大多数微结构和芯片相关的研究受限于指令集的授权问题而难以开展。随着 RISC-V 开源开放理念的流行,越来越多的科研项目受益于 RISC-V 而得以开展。

根据中国开放指令生态(RISC-V)联盟不完全统计,截至 2019 年 2 月,围绕 RISC-V 开展科学研究或领域生态调研的科研机构包括但不限于:北京大学、南京大学、南开大学、宁波中国科学院信息技术应用研究院、鹏城实验室、清华大学、上海交通大学、上海科技大学、天津大学、浙江大学、中国电子信息产业发展研究院、中国科学技术大学、中国科学院计算技术研究所、中国科学院上海微系统所、中国科学院微电子所和中国科学院信息工程研究所等。预计未来国内基于 RISC-V 的研究将越来越繁荣。

图表部分国内科研机构基于 RISC-V 研究项目
20.jpg

根据中国开放指令生态(RISC-V)联盟统计,截至 2018 年年底,可查询到的与 RISC-V 芯片、硬件、软件、投资、知识产权及生态相关的中国公司(含外资公司中国分公司)数量已接近一百家。

近年来,国产 RISC-V 商业化产品不断落地,其中不乏亮点。阿里巴巴旗下平头哥半导体推出的玄铁 910 AI 向量加速引擎的 64 位 16 核处理器在性能方面优于 ARM Cortex-A73; 玄铁 902/903 已被应用于 IoT 和工业控制的 MCU。2018 年 9 月,华米科技(HMI.US)正式发布了“黄山 1 号”,成为全球可穿戴领域的第一颗 AI 芯片。作为后续产品,黄山 2 号 RISC-V 智能可穿戴芯片,将于 2020Q4 量产。华米宣称黄山 2 号相比于在可穿戴设备 中常见的 ARM Cortex-M4 架构处理器,整体运算效率提升了 38%。

国内出现本土基于 RISC-V 处理器 IP 核供应商与本土设计企业联手先例。2019 年 8 月 22 日,兆易创新发布了全球首款基于 RISC-V 内核的 GD32VF103 系列 MCU。该款 MCU 采用Bumblebee 处理器内核是兆易创新携手 RISC-V 处理器内核 IP 和解决方案厂商芯来科技(未上市)面向物联网联合开发的一款商用 RISC-V 处理器内核。本次合作实现了本土处理器 IP 供应商和本土芯片设计公司意义非凡的联手。

图表中国本土部分设计企业及其基于 RISC-V 架构的芯片产品
21.jpg

内容来源:华泰证券;创道硬科技研究院