简谈Intel Lakefield处理器,反攻Arm之策
面包板社区 2020-07-14


谈下这两天 Intel 发布的 Lakefield 处理器。AnandTech 前两天发了一篇长文来解释这颗处理器,这篇文章我扫了一眼,绝对是当今尖端半导体工艺的绝佳科普文,所以我决定做全篇翻译:但因为最近事情太多了,我挖的坑也实在有点多,得往后排。这里我概括一下这篇文章,看不懂的同学可以等全文。



首先呢,三星的 Galaxy Book S 笔记本已经开始采用这颗芯片了——日程上的 ThinkPad X1 Fold 和 Surface Neo(去年微软展示的一款 9 寸双屏设备)也有推产品的计划。Lakefield 应该是 Intel 的第一颗异构处理器产品(这里单纯是指 CPU 部分的异构),就是很多人熟知的大小核设计——不过和诸位的理解可能略有些小差异。我觉得这是 Intel 对 Arm 的一个反攻计划。



光看这颗芯片(采用 3D 堆叠技术的一枚 SoC)计算 die(3D 堆叠的最上层)的话,CPU 部分是 5 个核心。1 个“大”核心是 Sunny Cove,就是十代酷睿处理器 Ice Lake 的那个核心;4 个“小”核心就是诸位熟悉的 Atom 凌动处理器(名为 Tremont 的核心)。这两组不同核心的相对性能与功耗关系大致如上图...

如果四个 Tremont 小核全开的话,这个相对关系就会有变化,具体如下图。所以怎么调度,要高效发挥两种核心的效率,其实还是考验功力的;毕竟实际工作中的负载状态,应该是介于上面这张图和下面这张图之间的状态。



和很多人想的不同的是,Intel 自己说 4 个 Atom 处理器核心会负责重负载和并行性能需求,毕竟有 4 个核心;而酷睿大核则是在用户加载应用、触屏操作,或者滚动浏览器的时候会第一时间响应。所以其调度理念跟 Arm 的那种大小核还是不一样的。




Lakefield 采用的是 Intel 的 Fevoros 堆叠技术,堆叠技术的优点和缺点这里不谈——其实网上相关的资料已经不少了。也就是说这颗 SoC 叠了几层,顶层是计算 die,其 die shot 如下图,主体上包括了核显和 CPU,用的是 10nm+ 工艺。核显部分其实也是 Ice Lake 类似的设计,不过频率应该会更低——很显然,高通的设计是给 Intel 造成了压力的。

Intel 似乎有提到,其中酷睿大核去掉了 AVX-512 相关的晶体管。上层这片 die 的面积在 82.x mm²,40.5 亿晶体管,13 个金属层...



下层 base die/interposer die 这里就不多说了,参数党应该并不怎么关心,这层的工艺是 22FFL。底层 die 包含一些音频 codec、I/O 资源;另外就是 PoP 封装最最上层堆了一个 DRAM,有 8GB、4GB 可以选配,LPDDR4X-4266......这部分并非来自 Intel...具体是怎么个堆叠关系,如下图...




Sunny Cove 大核就不谈了,因为算是很有名了,Ice Lake 的核心——Intel 今年的主要成果,虽然暂时只应用在了 U 系列低压处理器领域。

这里说一说小核心的 Tremont,这是今年新推的 Atom 处理器微架构,乱序设计(光这一点其实就意味着比 Arm 的小核心要更重性能),相比上一代的提升比较大。首先是新的双 3-wide decoder...(酷睿是 5-wide decoder),能够管理双数据流。Intel 说这个设计会比单纯的 6-wide decoder 要效率更高,也可以在设计上有更大的 μop cache(貌似 Atom 没有 μop cache?)...

另外就是 Tremont 核心的 L1-D cache,升级到 32KiB...且延迟未增长;貌似还有新指令...



Lakefield 处理器部分可能存在的问题包括,第一是软件层面的。桌面领域的软件,普遍默认现在的处理器都是同构结构的,但现在来了一个大小核设计的处理器,而且两者的指令都有差别,这在很多时候会造成错误。所以在设计上,好像 Intel 做了一些妥协,比如前面提到的,Sunny Cove 移除了 AVX-512 单元,保持两部分核心一些基本的指令支持的一致性(待确认)。

Intel 需要跟微软合作去搞 scheduler 做线程调度,这个工作其实是不容易的,需要考虑的东西也非常多——尤其 1+4 这种在很多场景下要确保体验,存在较大调度难度的设计。不过估计也没什么,因为 Windows on Arm 的经验有一些了,Windows 在 x86 平台可能还有一些先天的基础优势。

有关 1+4 这种搭配方案,在手机领域其实没有多少可借鉴的经验。而且 Intel 之所以这么做,很可能是因为 Sunny Cove 大核心的占地面积太大了,在 82mm² 的 die size 上面塞不下两个大核了。从实际性能考虑,两个大核,可能会是更合理的搭配。所以 Lakefield 的实际性能如何,其实是值得深究的。



整体尺寸加周边,比 Intel 以前的板子小了很多,基本上跟现在高通平台的方案差不多,而且还考虑塞 LTE Modem(下图,明摆着就是看 Arm 的那些 Windows 本子很不爽...)



这个处理器具体的 SKU,如下图,大核有更高的睿频;闲时功耗 2-3mW,睡眠模式下总算也有真正的长续航了;产品名称还是在“酷睿”系列之下,也切分 i3/i5;

另:这个产品定位其实是偏高端的,而且设备价格都不会便宜,起码跟骁龙 8cx 同一定位。比如 Surface Book Neo 会用这个处理器。



最后说下预期的性能,Intel 公布的成绩是,相比超低压的 Amber Lake i7-8500Y(5W TDP),新结构的单线程性能高 12%(SPEC2006),图形性能高 70%,每瓦性能高 24%;另外,考虑有大核和没大核的设计,Intel 宣称前者比后者的 web 性能高出 33%,效率高出 17%(因为四个小核全开,实际上效率比不上单个大核)...

这些数据其实并不令人意外,因为 Sunny Cove 原本就应该有 IPC 的提升,而且 Lakefiled 相比酷睿超低压,也有 TDP 的一丢丢优势。看起来跟高通骁龙 8cx 打,可能会有点勉强...

而且从 NotebookCheck 已经公开的 Galaxy Book S 的测试结果,Cinebench R15 单线程得分是 88分,比不上酷睿超低压 Amber Lake,这表明在调度上的思路的确跟我们想的不大一样(跟 SPEC2006 测试还不大一样?);多线程测试,也更倾向于让小核心满载,而让大核闲置——表明 Intel 设定可能就是这样,估计也是基于功耗、温度考量。

感觉这样的话,略有点小失望。请等我的全文翻译。


作者:欧阳洋葱, 来源:面包板社区

链接:https://mbb.eet-china.com/blog/uid-me-3893689.html

声明: 本文转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们及时删除。(联系我们,邮箱:evan.li@aspencore.com )
0
评论
  • 相关技术文库
  • 处理器
  • DSP
  • CPU
  • GPU
  • STM32手册:串口流控制功能

    串口接收方CPU拿取数据的速度赶不上串口数据的通信速度时,会导致丢数据的现象。使用串口流控制功能可以解决以上问题

    11-22
  • 一个简单的例子,轻松搞懂CPU的工作原理

    本文我们将从软件工程师的角度去了解计算机是如何工作的,通过对计算机核心工作机制的学习,有利于理解我们平时编程时

    09-24
  • 数字信号处理中的FIR滤波器应用

    考虑一个数字信号处理的实例,比如有限冲击响应滤波器(FIR)。用数学语言来说,FIR滤波器是做一系列的点积。取一个输入量和一个序数向量,在系数和输入样本的滑动窗口间作乘法,然后将所有的乘积加起来,形成一个输...

    09-12
  • 数字信号处理的模数转换与数模转换详解

    数字信号处理是将信号以数字方式表示并处理的理论和技术。数字信号处理与模拟信号处理是信号处理的子集。数字信号处理的目的是对真实世界的连续模拟信号进行测量或滤波。因此在进行数字信号处理之前需要将信号从模...

    09-12
  • CXL存储器扩充对DRAM市场的影响分析

    Oct. 11, 2022 ---- 据TrendForce集邦咨询最新服务器相关报告指出,CXL(Compute Express Link)原是希望能够整合各种xPU之间的性能,进而优化AI与HPC所需要的硬件成本,并突破原先的硬件限制。CXL的支援仍是以CPU为...

    09-12
  • 微处理器运算器、寄存器与控制器的作用

    微处理器 微处理器(CPU)是计算机的核心部件,其中除了运算器和控制器外, 还包括用于暂存数据的寄存器和传输信息用的内部总线。图 1-8 为一个简化的 CPU 模型,CPU 需要通过三 总线(数据总线、地址总线和控制总...

    08-26
  • 存储器选片的常见误区

    存储器相当于我们的大脑的存储单元,能够保存我们的电子数据。为增进大家对存储器的认识,本文将对随机存取存储器、寄存器和存储器的区别予以介绍。如果你对存储器具有兴趣,不妨和小编一起来继续认真地往下阅读哦...

    08-26
  • 显示芯片的价格差异主要取决于什么因素?

    显示芯片(Display chip)是提供显示功能的芯片。显示芯片一般有两种:一种是主板板载的显示芯片,有显示芯片的主板不需要独立显卡,也是平时说的集成显卡;另一种是独立显卡的核心芯片,独立显卡通过插槽连接到主板上...

    07-18
  • 双通道内存技术的未来发展方向是什么?

    内存双通道,就是在北桥(又称之为MCH)芯片级里设计两个内存控制器,这两个内存控制器可相互独立工作,每个控制器控制一个内存通道。在这两个内存通CPU可分别寻址、读取数据,从而使内存的带宽增加一倍,数据存取速度...

    07-18
  • 芯片组在计算机中的作用是什么?

    芯片组(英语:Chipset)是一组共同工作的集成电路“芯片”,并作为一个产品销售。它负责将计算机的核心——微处理器和机器的其它部分相连接,是决定主板级别的重要部件。以往,芯片组由多颗芯片组成,慢慢的简化为两颗芯...

    07-18
  • 单片机控制系统搭建:详细步骤和注意事项

    单片机(Single-Chip Microcomputer)是一种集成电路芯片,是采用超大规模集成电路技术把具有数据处理能力的中央处理器CPU、随机存储器RAM、只读存储器ROM、多种I/O口和中断系统、定时器/计数器等功能(可能还包括显示...

    07-18
下载排行榜
更多
评测报告
更多
广告