tag 标签: 手机

相关帖子
相关博文
  • 热度 10
    2021-2-20 15:51
    6718 次阅读|
    2 个评论
    用三角形的镜头光圈会怎样?聊聊焦外的弥散圆
    个人专栏又很久没更文章了,去年大量坑都没填。这次就把 2019 年年初宣称要翻译,但一直都没翻译的文章翻译一下吧。 这篇文章的作者 Harold Merklinger 在光学领域是相当知名的专家,也著作不少。原文题为 The Technical View of Boke。这篇文章我个人感觉相当通俗易懂。Boke(或 Bokeh)是源自日本的一个词,描绘的是照片的焦外虚化特性,本文会将这个词统一译作虚化。某些文章也可能会将该词译作“散景”(比如 DxOMark 中文网)。 这篇文章的撰写时间是 1997 年,当时的成像介质主要是胶片(film,菲林 ;)),所以文中出现胶片,大致上可以将其对等于现在的图像传感器。这篇文章其实整体上和“电子”关系不大,不过我写专栏一直都是这么随意的嘛(下次还可以聊聊娱乐圈)......另外,这篇文章中出现“焦平面”一词时,若无特别说明,则就是指物方焦平面(像方焦平面会特别说明)。 如果你对“焦外”“对焦”“焦点”“焦平面”这些基本概念并不了解,那么建议阅读以下两篇文章(或回答)。本文面向的是成像技术爱好者。文章内容会有少量二次演绎。 1. 用算法合成的背景虚化效果与用大光圈镜头拍出的效果相比差距有多大,主要区别在哪里? 2. 聊聊照片的背景虚化,和二线性! 正文开始: 摄影师都很清楚,区分摄影照片和画作之间的其中一个因素,就是对焦(或焦点)。我们人类看世界的时候,双眼倾向于将一切都放到焦内,人眼是能够做到自动对焦的。通常艺术家们也会以类似的方式去描绘世界。画作中的主体可能会以更明亮的色彩去描绘,也可能有更多的细节;不过画面中的次要对象通常也是很锐利的。 而镜头(也包括眼睛的“镜头”)则会对画面做一些“取舍”,近处和背景的对象会被“弱化”(原文用的词是 de-emphasis,即不强调),也就是焦外。善于观察的摄影师会发现,不同的镜头表现会有差异:大光圈镜头会呈现出较强的焦外虚化效果,而小光圈的镜头在焦外柔化方面就没有那么显著。另外即便是相同焦距、相同光圈的不同镜头,在虚化效果呈现上仍然是有差别的。日本人就将焦外虚化的呈现质量称作 boke。究竟什么是 boke,不同的镜头在这方面为什么会有不同的表现? 图 1,镜头后放置一枚三角形的光阑,投射到像方平面的光线会形成三角形的横截面。如果胶片放置到焦点的前方,则胶片上会出现朝上的三角形;而如果将胶片放置在焦点后方,则会出现倒置的三角形。(需要注意,摄影照片最终会进行倒置) 无论成像质量如何,镜头都是遵循光学原理的,所以我推测虚化应该是能够直接用技术术语去做解释的。其本质就是卷积的问题。 接下来的讨论,看起来应该首先用画画来类比。我们可以将摄影成像看做是画画的某种特殊形式。随后我们再去探讨,将镜头比作是画家的各种画笔,而镜头之间又有何区别。这样的类比当然并不严谨,画家是用颜料,从纸张或者画布上去除光和色彩的过程,而摄影师则用光去构造画面。 卷积(convolution)的概念,也就是将某个画面中的每个基本元素,替换成另一个画面的;但限定,第二幅画面每个元素的整体亮度,必须与第一个画面中的一致。然后对整个场景的整体结果,一点一点做汇总。 那么接下来,我们就用卷积的方法来画张画。想象一下,某个场景中的每个细节都要画出来。我们用的画笔多种多样,从最精细的画笔,到相当粗调的。首先我们选择场景中,最远的对象的某个点。调制一下颜料,来表现这个点的颜色和亮度。然后我们取 1/100 克重的颜料,均匀地蘸到笔刷上——总之就是极少量。 因为我们是在模拟摄影,镜头会对焦到画面中的某个对象。那么我们选择的首个笔刷,大约是 1/4 英寸直径——这个尺寸通常是较远的光点在画面中呈现的弥散圆尺寸。将这枚笔刷放到画布上方,精准定位到场景远处对象所在位置。将笔刷轻轻点到画布上,1/4 英寸直径晕染的圆就出现在了画布上。然后我们将这个操作重复再重复,逐一进行。 首先是远处的这些细节,然后渐渐转到越来越近位置的细节,随着这种方式的画画持续,我们用的笔刷也越来越细。当进行到焦点位置的对象时(比如说某个人),用极细的笔触即可,也用同样 0.01g 的颜料量。再然后就是画近处(前景)的对象了,用的画笔则又开始逐渐越来越大。 整个画作过程中,我们是一点一点地画的;只有笔刷的尺寸,以及颜料的颜色在换。如果全过程都采用固定的极细笔触,那么就能画出整幅画都很锐利、细节丰富的图了。不过因为我们选择了各种尺寸的笔刷,所以背景对象,以及很近的近景就会显得比较模糊——这就跟相机拍的照片一样。 相机的工作过程,与前面所述的这种画画方式(采用各种尺寸的圆形笔刷)很相似。相机能够根据画面中对象所在的位置、对焦点的位置,以及镜头光圈,来选择笔刷的尺寸。随后相机就能完成一整副画了。而光的量,则与画作中每处细节一致,弥散圆尺寸也对应于每处细节。 画作中虚化的质量,是由笔刷设置决定的:也就是镜头的弥散圆特性、其光圈以及焦外离得有多远。 图 2,上面这张图是采用三角形的光阑-即光圈,从画面中其实很容易看出来。观察前景高光位置朝下的三角形,以及背景中朝上的三角形。这种弥散圆(弥散三角...)看起来其实很不自然,但实际上这张照片可是 100% 纯天然的。这个例子也表明,不应该采用三角形的光圈。 要理解虚化,我们需要简单地来了解一下弥散圆。 理想情况下,一枚镜头呈现的弥散圆应该是亮度一致的,且形状与光圈形状一致。弥散圆的尺寸(直径)取决于胶片与画面中的对焦点所在位置有多远。图 1 呈现了这一原则,不过那张图中的光圈是三角形的。像这样三角形的光圈,那就不是弥散圆了,而是“弥散三角”。 图 2 呈现的照片,用的就是三角形光阑(光圈)的镜头。注意其中焦外的高光区域,看起来就是三角形的。在这一例中,靠近相机的高光(焦平面前方)表现为向下的三角形,而背景位置(焦平面后方)的高光就是方向向上的三角形。(在此例中,镜头中的光圈本身是方向朝上的三角形) 所以,虚化很大程度取决于光圈的形状。应该较大程度地避免采用三角形光圈。 图 3,上图是黑底白图测试图案,可用于理解光圈形状对于焦外的影响 图 4,方向朝上的三角形为光圈的镜头,胶片与镜头很靠近的情况下,拍下的照片 (译者注:图 4 和图 3 貌似并不是同一张测试图) 我尝试拍摄图 3 的测试图案,其中包含了各种形状,且以故意将这些图案放到焦外。图 4 则展示了三角形光圈拍下的其中一张样张。注意右上角焦外的三角形图案:与“弥散三角”本身朝向方向一致的那个三角形,呈现得比较锐利,虽然整体亮度不均匀。 而图 4 右上角朝向方向相反的那个三角形图案,看起来就比较有趣了。整体看起来这是个六边形,而且有三条比较明显的亮线贯穿。实际上这三条亮线并不真正存在于原图案中,这只是视觉错误。 (译者注:在我翻译的另一篇文章中有提到过这种视觉错误:《 聊聊照片的背景虚化,和二线性! 》) 图 5 放大了这两个图案,注意这个三角形靠近下方位置多加了一条白线,下方的曲线则是该白线所在不同位置的亮度变化。这条亮度曲线并没有在某处发生陡升或陡降,其实也能够说明视觉上的那几条“亮线”并不真正存在,只是我们的错觉。 这个错觉也表明,虚化的细节呈现不仅关乎光学特性,也一定程度和“生理效应”有关(原用词是 physiological effects,我想此处表达的意思就是虚化表现,其实和我们的眼睛特性也有关)。虽然可能是错觉,但对人眼而言,起码看起来是存在的——这种错觉也就实实在在地影响到了画面的呈现,即便它们事实上并不真实存在。 图 5,这是图 4 的一部分。下面那个六边形图案看起来有三条亮线贯穿。图案靠近下方的位置,人为添加了一条白线,用于作为下面亮度曲线的采样位置。亮度曲线在最下面,这条曲线表明图片仅有亮度的渐进式变化,以及一个稳定区。并不存在能够反映错觉中“贯穿图案亮线”的尖峰位置。所以三条亮线只是错觉。 图 4 还出现了另一个现象,某个形状图案如果其边,与镜头光圈的边(此处应该是指三角形光圈的三边)方向一致,则图案更能分辨得清。图 4 中可以看到,画面下方的扇形条纹图案,水平方向的线条,以及与水平方向呈大约 30° 角的线条都能分辨得清,而其他角度的线就不大能够分辨了。所以镜头光圈的理想形状应该是什么样呢?这就取决于拍摄对象本身了。完美的圆形,可能是我们能够采用的比较折中的选择:它在所有角度都会表现出一定程度的伪分辨率。不过圆形光圈不会存在太大的偏向。 (译者注:spurious resolution,伪分辨率,这其实是个挺反直觉的概念。比如像下面这种典型的放射状分辨率测试图案,越往中心位置每毫米线对数量越多。将其故意放到焦外拍摄,整体画面虚化。从拍摄结果来看,从外围到中心,原本每毫米线对稳定增加,但随后线对分辨率会降至 0,随后又增加了,但在逐渐增加一段过后又降至 0。 放大图片可见,中心位置最密集的线对其实都可以分辨得出,即便这些线条的密度程度,本身可能比失焦后的弥散圆尺寸还要小。这是题外话了,不再做扩展。来源: DPReview ) 不过摄影师通常也都知道,不同镜头设计,也会带来不同的虚化特性,即便光圈形状相似也是如此。以 Leitz 35/2 Summicron 为例,这枚镜头一直被人们认为有比较好的虚化表现;还有一些镜头设计经常被说存在“二线性”,或者其他形式的虚化表现不佳。其区别在哪儿呢? 拍摄图 2 和图 4 这两张照片所用的镜头(150/6.3 Rodenstock Geronar)在虚化表现上就相当中性。弥散圆(从毛玻璃取景屏上)看起来就是简单的一致亮度的形状(从后方照亮一个小针孔,在画面中令其处于焦外),外圈可能会有不是很明显的、较亮的勾边。无论是在对焦点之前还是之后,弥散圆都基本上一样。那一圈亮边,我感觉有可能是视觉错误。虽说这种亮边可能是菲涅尔衍射造成的,不过如果的确如此的话,应该会看到有色光晕才对。而这张图上的亮边基本就是白色的。 图 6,这几张小针孔影像,是采用 Rodenstock Imagon 镜头拍摄,在四种不同距离下的弥散圆。从左到右,分别是影像位于焦平面前方 4cm、焦平面前方 2cm、焦平面内,以及焦平面后方 2cm。影像下方展示的是这些弥散圆从左到右(直径)的亮度变化曲线。 我测试的比较反常的镜头是 Rodenstock Imagon。图 6 展示了几个弥散圆,分别是在距离镜头不同位置下拍摄的。在焦平面前方的弥散圆,会出现周围的一圈亮边。弥散圆的实际尺寸也比预期得更小——当然这一点需要经过仔细测量才会发现。而在焦平面后方的弥散圆,则出现了相反的情况。弥散圆中心位置比较亮,且弥散圆的整体尺寸也比预期(原应有的)尺寸更大。这是由球面像差造成的。镜头光圈外围的光,对焦距离比应有的镜头焦距更近。 Imagon 镜头有相当特殊的滤光镜(水槽滤网式...原文是 sink-strainer),将这种滤光镜放到镜头前方,光圈外围的这种光线收敛会更为明显。图 7 就有所表现。左侧我们能够看到这种独特的水槽滤网式的图案。而第二张图,两排小孔已经聚合成了一排。图 8 则对这两个图案进行了放大。图 7 最右边的影像展现的是,“水槽滤网”小孔在画面中形成的点呈现出了放射状。 图 7,这张图是 Imagon 镜头加上其滤光镜之后,拍下的弥散圆 图 8,放大图 7 的前两个弥散圆。注意围绕中心的两圈圆点,右边那张影像的两圈已经汇聚成了一圈,这也是球面像差存在的证据。(这些影像中出现的条纹,可能是镜头被手指弄脏所致) (译者注:罗敦斯特 Imagon 所谓的“可控柔焦镜头”,带有一组特殊的滤光镜,不止一种。原文称其为水槽滤网,其实也可以说是花洒或者莲藕,或者蓬蓬乳嘛...... 通过不同数量、不同规格的这种小孔,就能达成所谓的柔光效果。画面中高光部分因此会有一种晕开的感觉。) 图 9,上面这些弥散圆,则是用 Nikkor-W 镜头拍摄的,同样是不同距离下的小针孔影像。影像下方的亮度曲线表明,焦平面后方的影像会表现出亮边,而靠近镜头侧(即焦平面前方)的弥散圆亮度曲线,两侧就没有尖峰,也就是说焦外影像就比较柔和。 图 9 展示的是 Nikkor-W 180/5.6 镜头所摄的一组弥散圆。相比 Imagon,其带“亮边”的弥散圆出现在焦平面的另一侧。我觉得,这应该是球差修正过度所致。 这种“亮边”效应,也被认为是虚化表现不好,甚至是“二线性”。带亮边的弥散圆,会让场景中的焦外区域出现某种程度的细节,甚至可能会有重影。其实带这种亮边特性弥散圆最典型的,就是折返镜头了。图 10 由 Kevin Hawk 拍摄,背景焦外就有独特的重影。 而中心位置更亮的弥散圆,则出现在 35/2 Summicron 镜头上,焦点前后方的弥散圆都如此。我觉得,只要弥散圆中心不是太亮,那么这种弥散圆应该能够表现出比较讨喜的焦外影像。如果中心较亮的区域所占尺寸太小,则影像焦外区域又有可能出现一些细节信息,虽然这种情况下是不会出现重影的。 需要注意的是,很多镜头在所有情况下,都不会表现出“好的虚化”或者“坏的虚化”。Imagon 的这种“亮边”现象,藉由水槽滤网式的光圈是可以做到某种程度的控制的。不过即便如此,这种镜头仍然能够对背景(焦平面后方)表现出平滑的焦外虚化。焦外近处(焦平面前方)的对象则可能会表现得相对生硬。而像 180/5.6 Nikkor 这样的镜头,则正好相反,在靠近相机的近处(焦平面前方)表现出更平滑的焦外影像,背景虚化会相对生硬。Summicron 的出色,就在于拍摄主体前后的焦外影像都比较平滑。 (过于)简单地说,一般的球面像差(如 Imagon)能够产生“好的虚化”,而过度修正球差则会导致“坏的虚化”。而且实际上,背景部分的虚化(焦平面后方)更重要一些,也会比前景更令人在意。 镜头呈现出的弥散圆是表现出“亮边”还是“中心部位比较亮”,主要取决于镜头的球差修正情况。而且会随实际所用的光圈,发生变化。此外,也可取决于镜头对于轴外像差(off-axis)的修正 (译者注:彗差、像散、场曲、畸变都属于轴外像差;球差属于轴上像差) 。在我的测试中,180/5.6 Nikkor 镜头在轴外的亮边现象,会比轴上略严重一点。 另一个观察所得是,为了表现出真正均匀的虚化(中性的虚化表现,即弥散圆亮度均匀),像差一定程度的权衡是有必要的,用于抑制弥散圆的亮边现象,达成理想的一致亮度的圆形。 图 10,这张图和图 2 拍摄的场景一样,不过这次所用的是 180/5.6 Nikkor-W,光圈全开。前景有比较出色的很柔和的高光表现,背景部分的弥散圆略带亮边。 图 11,这张图采用 250 Imagon 镜头拍摄,光圈 H=7.7,将“水槽滤网”式光圈外围的小孔关闭,不过从实际样张来看,仍有一排小孔没有关严实。不过无论如何,样张的前景高光部分会带亮边,而背景的弥散圆则表现出中心位置更亮的特性。 本文最后,我还拍了两张照片。仍是图 2 拍的那三个陶瓷人像。图 10 采用 180/5.6 Nikkor-W 镜头拍摄,图 11 则采用 250 Imagon 镜头拍摄。图 11 中,中间渔夫整体影像比较软,但前景的女士则有比较显著的亮边效果,看起来很不讨喜。作为对比,Nikkor 镜头所摄的前景很柔和,渔夫则非常锐利。 背景男性人像的高亮位置,两张照片整体表现差不多,不过细看还是能够看到 Nikkor 镜头所摄那张会有轻微的亮边现象,而 Imagon 镜头所摄那张的弥散圆中间部分偏亮。另外,女性人像右眼的高光部分,两张照片都只能看到一个半圆。这表明,此处高光位置的光,有着更偏的照射方向,镜头只有下半部分才被照到。 总结一下,相机“作画”会采用一系列的笔刷,笔刷的选择是由光圈形状、镜头设计的像差特点决定的。某些笔刷的边缘会更柔和,这是产生虚化差异的关键所在。 感谢在准备这篇文章过程中,Oren Grad 与 Mike Johnson 给予十分有帮助的探讨。 英文原文: A Technical View of Bokebokeh - Luminous Landscape ,转载请注明英文原文、作者,及译者欧阳洋葱
  • 热度 10
    2020-12-16 18:33
    7334 次阅读|
    4 个评论
    Exynos 1080剖析:三星和vivo合作了啥?三星5nm是啥样?
    写在前面:很久没更专栏了,其实近期有太多东西值得去细细谈了,但工作忙始终没时间。这篇文章算是此前一些发布学习内容的总结,也加入了很多新的内容——正好也是跟一跟 vivo X60 发布的热点。虽然整体上算是个“云”评论,而且都是公开的 IP 信息,但对于技术爱好者一定是有价值的,希望爱好手机 SoC 技术的各位同学喜欢。也算是自我学习的一个过程,内容分享给各位。 上个月参加完 Exynos 1080 芯片的发布会,我就提过,Exynos 1080 可能将会是在2021年的甜品级终端产品比较长寿的一颗芯片。就其纸面数字,以及定位特点来看,2021 年中高端定位手机产品,大约也会迎来一次性能飞跃。 所谓的纸面数字,可列举的是三星电子系统 LSI(以下简称三星或三星 SLSI)官方给的数字, Exynos 1080 的 CPU 单核性能提升 50%,多核性能提升 100%(基于 Geekbench 5 测试);GPU 性能提升 130%(基于 Manhattan V.3 测试数据)等。这个提升程度在如今两代同档定位产品的升级间,应该说是相当大的。其“提升”的对比对象是 Exynos 980。有关这颗芯片是否真的达成了这种提升,下文再谈。 需明确的是,Exynos 1080 并不是最顶级旗舰的定位,未来三星应该还会推出一颗 Exynos 2100 芯片(当然也可能是 Exynos 1888……)。但从配置来看,Exynos 1080 在定位上明显高于前代 Exynos 980。理论上,Exynos 1080 的同档竞争对手应该是骁龙 765G 和麒麟 820,甚至和一部分骁龙865的新品有一战之力,当然很快高通还会推更新款的中高端定位 SoC(骁龙 777???)。也因此 Exynos 1080 极有可能拉高 2021 年这块市场的竞争水平。 就在这几天,vivo 正式官宣了 X60 系列将搭载 Exynos 1080。其实 vivo 作为这颗芯片的首发品牌也并不让人意外,毕竟三星 S.LSI 在发布会上就提到了这一点。而且和去年的 Exynos 980 一样,vivo 也参与了 Exynos 1080 的研发,这也是三星在芯片发布会上反复强调的一件事。 与此同时,Exynos 1080 未来甚至可能还会出现在更多的国产手机上,11 月初 BusinessKorea 就报道了三星 SLSI 计划在 2021 年向更多中国智能手机制造商提供 Exynos 芯片的传言。实则从甜品级的配置来看,如果三星/vivo 在设计和制造上实施得宜,则 Exynos 1080 极有可能成为很长寿且受欢迎的一颗中高端手机芯片。 那么本文,我就尝试来剖析 Exynos 1080 这颗芯片本身(包括主要的几个 IP,以及三星 Foundry 的 5nm 工艺),并谈一谈三星和 vivo 之间所谓的“联合”研发,究竟“联合”了些什么。毕竟 vivo 在此作为终端制造商,与上游供应商做联合研发,一方面是其开发实力的体现,另一方面也是差异化竞争的依据——我对此也一直非常好奇。 本文分成 6 大部分,分别是 (1)Exynos 1080 概览; (2)CPU 部分; (3)GPU 部分; (4)NPU、ISP 等其他 IP; (5)三星与 vivo 合作了什么; (6)三星 5nm 工艺是什么。 文章篇幅较长,各位同学 可以根据自己的喜好,选择性阅读 。 Exynos 1080 配置概览 此类常规的媒体发布会,三星透露的技术细节通常都比较少,主要就局限在芯片的配置和特色 IP 上。vivo 方面给出的信息是,针对 Exynos 1080,vivo 从 2019 年 6 月起,提前 18 个月投入超过 50 人的技术专家团队,与三星共同定义配置,包括选用 5nm EUV FinFET 工艺、最新 Cortex-A78 CPU 及 Mali-G78 GPU,制定 RGB scaler(RGB 色彩标准化)、加入 CLAHE 影像算法等。 芯片 18 个月的开发周期算是 IC 设计的日常了,有关 vivo 在此间的合作,后面的段落将会展开。首先罗列 Exynos 1080 的配置如下表: 这其中的一些亮点包括,制造方面在选择了三星 Foundry 的 5nm工艺(5LPE),这部分将在后面的段落中详述。实际上,三星 Foundry 自 7nm 开始,就与台积电在工艺路线上有了较大的差异,5nm 也体现了这种差异。(下文将把三星电子系统 LSI 与三星 Foundry 统称为三星,不做区分) 设计 IP 相关的部分,这颗芯片的 CPU 核心为 1+3+4 搭配——这应该是 Exynos 系列芯片首次采用这种搭配方法,这原本就是 DynamIQ 的灵活性体现。且其中的“1+3”都采用 Arm Cortex-A78 大核,其中最大的那颗核心频率最高 2.8GHz——这个频率算不上高,与 Exynos 1080 的定位相符;随 Arm v8.2 指令集一同到来的小核心自然就是 Cortex-A55 了。 GPU 部分也选择了 Arm 最新的 Mali-G78,10 月份海思发布的麒麟 9000 也用上了这个GPU IP。不过由于定位上的差异,Exynos 1080 的 Mali-G78 是 10 核心配置,核心数量规模实则不到麒麟 9000 的一半,频率未知。不过麒麟 9000 为 Mali-G78 MP24 核心的“顶配”,可能本身也并不见得有多合理(尤其在峰值性能下的效率表现上)。 三星在发布会上也提到,Exynos 1080 的“GPU性能相比上代提升 130%,是上代的 2.3 倍之多”(基于 Manhattan V.3 测试数据)。有关这一点下文还将做详述。 有关 Exynos 1080 的 AI 专核,三星官网给出的数据是算力 5.7TOPS——这是在 Exynos 1080 产品定位上,相对甜品级的性能数字;作为参照,定位更高端的 Exynos 990 这个数字是10TOPS,竞品骁龙 765G 的 AI 算力为 5.5TOPS。Exynos SoC 在 AI inference方面的部署似乎一直比较神秘,从此前为数不多的介绍来看,主要是 NPU+DSP 的异构计算。这既不像 Arm 官方的 Ethos NPU;也不像高通那种单纯加强 DSP 的 tensor core,外加各种核心异构计算的 AI Engine;而且从此前 AnandTech 针对 Exynos 990 的测试来看,三星面向 NNAPI 似乎也并未完全开放NPU的算力。 这颗芯片的其他亮点还包括:(1)集成 modem 的 5G 支持,包括 Exynos 980 没有的毫米波的支持,且最高下行速率推升到了 5.1Gbps;(2)全高清+分辨率搭配 144Hz 刷新率的支持,也是为游戏手机做配的体现;(3)AISP,实际上也就是在成像数据的后处理上,除了 ISP 之外,也加入了 AI 专核的干预,以 AI 来进一步提升成像质量——这一点,也是当代手机 SoC 厂商的主旋律。 从明面上能看到 Exynos 1080 相较前代的一个缺失应该是 MFC 编解码能力,失去了对 4K 120fps 的支持。接下来我就尝试针对其中的一些细节,做更深入的“云”剖析。鉴于三星和 vivo 公开的信息有限,我也只能从公开的 IP 资料来谈谈这颗芯片——借此机会,也算是为爱好者们准备开拓视野的内容了。 CPU:着力效率调优的Cortex-A78 10 月份发布的旗舰定位的麒麟 9000 比较遗憾的一点就是未能采用 Arm Cortex-A78 和 Cortex-X1。这让其在对阵 2021 年的中高端芯片时,可能都会有些力不从心——比较典型的就是 Exynos 1080。 Exynos 1080 应该会是首颗将 Cortex-A78 实体化的手机芯片。三星在发布会上提到,基于 Geekbench 5 的测试,Exynos 1080 的 CPU 单核性能与多核性能分别有 50% 和 100% 的提升。 从网上的公开数据来看,基于 Exynos 980(vivo S6 5G)的 Geekbench 5 测试成绩(单核 695,多核 1850) ,如果抛开系统设计层面的影响不谈,若三星公开的这一成绩属实,则 Exynos 1080 的 CPU 性能是妥妥地超过了骁龙 865 的(与麒麟 9000 基本持平)。隔代的两个定位的芯片之间,做到性能赶超也并不多见。 1080 的性能跃升多少也在意料之中,一方面是 Exynos 1080 的 CPU 最高频率相比 980 提升了27%,加上大核心 IP 从 Cortex-A77 升级到 A78,以及制造工艺从 8LPP 升级至 5LPE,多重因素促成单核 50% 提升也并不奇怪;至于多核,Exynos 1080 的 A78 核心实际上有 4 个,比前代的 2 个 A77 大核就明显有多核性能上的优势了。 所以我才说,感觉 Exynos 1080 在定位上相比 Exynos 980 是明显拔高了的——或者说三星和 vivo 有将中高端定位手机 SoC 提升竞争水平的决心。所以 2021 年高通和联发科这些竞争对手预备推的同档产品,会采用什么样的配置会显得十分关键。 微架构 Cortex-A78 是 Austin 家族的第三代产品。事实上,A78 相比 A77 的 IPC 提升应该算是比较普通的水平。Arm 此前发布这代 IP 时提到,单核心在 1W 功耗下,A78(3.0GHz,N5 工艺)会比 A77(2.6GHz,N7 工艺)提升 20% 的性能。若以相同性能为前提,则 A78(2.1GHz,N5 工艺)功耗是 A77(2.3GHz,N7 工艺)的一半。 这组对比的变量实在是有点多了,而且 Arm 是以台积电 N5 和 N7 工艺作为参照的。实际上,如果以相同制造工艺为前提,且核心配置相同的情况下,A78 相比 A77 大约有 7% 的性能提升,另外有 4% 的功耗红利和 5% 的占 die 面积红利。那么结合 Exynos 1080 相比前代 27% 的频率提升,Exynos 1080 收获来自三星 5LPE 工艺的性能红利似乎相当可观——这一点也完全合理,毕竟此处对比的是 8LPP 和 5LPE。 在功耗方面,Arm的数字是,在 A77 与 A78 达到相同性能(A77 的峰值性能)水平下,A78 功耗可降低至多 36%;同功耗水平下,A78 的性能优势在全区间内最多是 7% 左右。不过 Exynos 1080 比 980 提频了这么多,其实际的峰值功耗和效率水平还是待实测的。 这里再简单谈一谈 Cortex-A78 微架构本身的一些调整。 A76 和 A77 实则已经在核心的宽度、OoO 能力和频率方面做了提升。A78 属于典型的优化型 IP;相比 A77 主要是面积、功耗及效率上的改进。 前端、执行及存储系统都有对应的结构和尺寸缩减,主要是针对原本设计中,收益并不高的结构做缩减(典型的比如 L1I 指令缓存开始提供 32KB 的选择,也就是 IC 设计厂商可以将其做得更小——前面提到的性能、功耗对比都是基于 32KB 的 L1I),做到效率上的优化。 A78 前端最大的变化是分支预测器,除了精度提升外,能够处理至多每周期 2 个分支,也就提升了吞吐,能够更好地从错误预测中恢复。而且去年的 A77 后端多出第二个分支执行单元,A78 则在前端做了平衡。分支预测器部分结构做了精简,提升面积和功耗方面的表现。 执行核心的发射队列(Issue Queue)其实是有比较大的变化的,只不过 Arm 此前并未详述变化细节,只提到此间变化能够带来功耗效率方面的提升。寄存器重命名结构和寄存器堆也做了优化,部分有尺寸上的缩减,寄存器堆在相同的芯片面积内可以容纳更多的数据,这对整体结构的面积缩减也就有帮助。ROB(re-order buffer,乱序执行的重排序缓冲)尺寸不变,但效率和指令密度也都有了提升。 每周期 Mop(Macro-ops)的 dispatch 似有拓宽。执行单元部分,唯一较大的变化是,A78 在一条简单 ALU 管线中,增加了第二个整数乘法单元,每周期的整数乘法吞吐就获得了提升。执行单元其余部分变化比较小。 存储子系统部分,多加一个 load AGU(地址生成单元),load 带宽提升 50%。Load/store 队列到 L1D 数据缓存的带宽翻倍至每周期 32 bytes,核心到 L2 缓存的读写带宽也翻倍;prefetcher(预取器)在存储面积、精度和时机表现上都有加强;还有前文提到的L1I 指令缓存现可选更小的 32KB;L2 TLB(translation lookaside buffer)缩减至 1024 pages,算是典型的效率优化。 其实就这些微架构调优来看,这一代 Arm CPU 核的性能重任应该的确是落在了 X1 身上的。不过也因此,Exynos 1080 CPU 部分的效率预计会不错。 GPU:130% 性能提升? 三星在发布会上提到,Exynos 1080 的图形算力较前代提升 130%,也就是前代的 2.3 倍。这个数字初听还是挺恐怖的——半导体行业很少存在隔代产品这种幅度的性能提升。不过 Exynos 980 的图形计算基础实际上也的确不算高,具体为 Mali-G76 MP5,即 5 核心的 G76。G76 属于 Bifrost 架构的末代产品,G77 换用了 Valhall 新架构。 而 Mali-G78 属于 Valhall 的二代产品,从 Arm 公布的结构调整来看也属于小改款。 不过 Exynos 1080 的 GPU 配置为 Mali-G78 MP10,即核心数量相比前代翻了一倍。加上架构迭代,以及新工艺加持,130% 的图形算力提升似乎也的确不算什么。 Arm Mali 阵营曾在 G76 时代掀起过一阵效率追上隔壁 Adreno 的宣传热潮。Mali G76 实际上也的确在性能和效率(特指能效,而非面积效率)方面,表现出即将与 Adreno 640 齐头并进的意思。不过高通在 Adreno 650 身上小小发挥了一把,而 Mali G77 在具体实施上似乎并没有一款真正具有代表性的芯片产品,所以 Adreno 仍然还是那个 Adreno。 个人倒是觉得,从麒麟 9000 采用 Arm 推荐的满载 24 核心 Mali-G78 实际表现来看,Mali GPU 的确能够在性能上通过堆料来达成与 Adreno 的同等水平,但峰值性能下的效率却差了一大截。所以缩小规模,找性能与功耗的甜蜜点,才是 Mali 这两代产品真正比较合理的选择。Exynos 1080 的 Mali-G78 MP10 也因此应该不会在效率方面有崩坏的情况发生;不过其图形性能预计也就是中高端定位水准。而且这种配置,应该也是为 Exynos 2100 预留空间。 Valhall 架构初代的 Mali-G77 相比前代,在相同性能与工艺的前提下,有 30% 的能效与密度提升。除了 ISA 本身的变化让指令对 compiler 更友好,也更适用于 Vulkan 这样的 API,在架构层面,它相比 Bifrost 有几个比较大的变化,其一是拓宽到 16-wide warp 执行——虽然这个宽度还是和苹果、高通、Imagination 这类走宽核心、少核心路线的 GPU 不能比,但自 Bifrost 的 G71 开始就已经是数次成倍拓宽了。 Arm 一直以来都在走这种窄核心、小 warp size、多核心的路线,应该主要是为了减少 ALU 的闲置时间,获得更高的 ALU 利用率。不过当代图形负载在计算方面正变得越来越复杂,很容易实现多个线程的并发,并利用好更宽的 warp size。(而且这也很大程度上,是 Mali GPU 占 die 面积明显较大的原因) 在具体的执行引擎方面,早前的 Bifrost 核心采用 3 个执行引擎的设计,每个都有独立的数据路径控制逻辑、独立的 scheduler 和指令缓存、寄存器堆以及 messaging blocks。Valhall 把几个小的执行引擎合并成一个单独的更大的模块,采用共享的控制逻辑。不过 ALU 管线在此仍然分成了两大块,每个都有单独的 16-wide FMA(融合乘加)单元和相应的执行引擎。 除了执行引擎,shader 核心中的另一个变化是 TMU(纹理贴图单元)吞吐翻番(每周期过滤 4 个纹素,渲染输出 2 个像素)。由于篇幅关系,本文不再介绍 Valhall 架构的更多变化,这里还是回到 Mali G78 本身,相比前代 G77 的一些改进。 如前文所述,G78 是 Valhall 架构的第二代产品,属于针对 G77 的改款。其执行核心部分和 G77 相比变化不大。最大的变化应该在于,原本整个 GPU 的全局频域(frequency domain)变为两层结构,shader 核心本身是个单独的频域,顶层的各种共享 GPU 模块为一个频域。这样一来 GPU 内部可以有不同步的时钟域,shader 核心可以跑在不同的频率下。 这不失为一种节能和提高效率的方案。以前要在屏幕上显示更多数量的多边形时,只能全面推高 GPU 的运行频率。当代的游戏作品普遍是几何处理工作偏重的,将 tiler 和几何引擎运行频率解耦,能够解决吞吐不平衡的问题。不过这么做需要增加额外的电压域实施,增加了系统成本。另外,这个分层频域设计应该也是可选的,不知三星和 vivo 是否为 Exynos 1080 增加了这个设计。 除此之外,G78 的 FMA 引擎有变化,主要是 FP32 与 FP16 路径做了隔离;tiler 吞吐提升;shader 核心缓存更好的复用和关联性追踪,核心就能更智能地处理缓存数据,避免不必要的数据移动,最终减少带宽需求和功耗。 其中的很多方案普遍是以额外的面积,来换取能效。 最后,针对 Mali-G78,Arm 官方给出的最高 shader 核心数配置是 24 个,听起来还真的是比较疯狂——要知道 Adreno 才 2-3 个核心。因为其实前面几代产品,Arm 似有将核心持续拓宽、做大的意思,以提升每核性能。比如 G77 一个核心其实差不多就相当于两个 G76 核心的规模。Mali-G78 的这种配置变化看起来还真是有些令人摸不着头脑。 Arm 此前宣称,在同工艺前提下,Mali-G78 的性能密度提升 15%(即同面积下,较前代有 15% 的性能提升;或者相同性能下,缩减 15% 的面积),能效提升 10%。在 GPU 实施规模有成倍差距的情况下,Exynos 1080 的图形算力比 980 提升 130% 也就很合理了。 这个 130% 的提升数据,三星此前在发布会上标注时提到基于“Manhattan V.3”测试,那就默认是 3.0 离屏渲染测试好了。此前有记录的 Exynos 980(vivo S6)的 Manhattan 3.0 离屏渲染测试得分大约在 51fps 的水平上 。提升 130% 也就是 117fps,这个成绩是优于骁龙 855 的 Adreno 640 和 Kirin 990 的 Mali-G76 MP16 的(也能够看出 Valhall 架构本身的提升),也远高于骁龙 765G。 当然这只是一个项目的对比,Manhattan 是更偏 ALU 计算的负载测试。不过这个成绩,对于应付市面上现有的绝大部分 3D 游戏应该是不成问题的——当然前提是手机的系统设计也需要合理,以及我暂时还不知道 Mali-G78 在这种规模的实施方案中,持续性能是否可坚挺。如此,FHD+ @144Hz 的支持也才有意义。 所以实际上,基于 Exynos 1080 在 CPU 和 GPU 方面的提升,我才觉得 2021 年的中高端手机市场竞争可能会更激烈。而 Exynos 1080 的实际定位,可能更偏高端(次旗舰),可能不会下放到“那么”中端的市场。 在 Exynos 1080 的图形计算方面,最后一点值得一提的是 Amigo 电源管理方案。此前三星SLSI 在发布会上提到,这是一种面向游戏的节电解决方案,能够实时监控各流程电源消耗情况,优化游戏过程中的总功耗,令电源效率提升 10%。 此方案所处层级未知——如果这是更偏系统层级的解决方案,那么这项技术可能就是 vivo 和三星共同合作完成的。比如像此前知名的 GPU Turbo 那样,在应用和 GPU 驱动之间有个监听层,来监听渲染调用——令其作为神经网络模型的 input,针对特定游戏、特定设备就有了优化过的 DVFS 设定;不过这也可能是更简单的 reactive DVFS 控制。 NPU、ISP 等其他 IP 当代手机主 SoC,在 CPU 和 GPU 之外的其他专用处理器或者 IP 其实也正变得越来越重要。无奈的是,其发展并不像 CPU/GPU IP 那样有如此悠久和成熟的历史,所以其内部细节对我们这些普通人而言,也就没那么公开了。比如说三星的 AI 解决方案,是 NPU 和 DSP 共同完成的。还有包括 5G modem 在内,它们更像是一个个黑匣子。 事实上,从很多测试来看,Exynos SoC 的 Mali GPU 也是面向 NNAPI 可见的。三星在自家 AI inference 专属SDK的开发上是比较晚的,我从三星开发者官网看到目前针对 NPU,三星有专门的 Neural SDK 。这个 SDK 现在支持 Caffe 和 TensorFlow 框架。 从描述上来看,它实际上也能同时利用各种计算引擎,包括 CPU、GPU,和 NPU 与 DSP。所以就有些难以理解,Exynos 系列所标的 AI 算力,究竟是谁的算力;我暂时也没有研究过三星对于 Android NNAPI 的支持情况。 三星自己列举的一些 Neural SDK 用例包括了 AI 相册、实时自拍对焦、拍摄建议、人像、场景优化等——这都属于计算摄影(Computational Photography)组成部分。从版本更新情况来看,该 SDK 的开发是有待持续完善的。不过就现阶段 AI 在手机设备上的应用场景来说,AI 专核对于用户的价值究竟有多大,可能仍需要打个问号。沉浸式 VR/XR、智能语音助理识别当然是比较典型的应用,另一个比较重要的想必就是计算摄影了。 谈到计算摄影,三星作为第一方,以及与 vivo 的合作下,推了一个 AISP 的概念。我的理解是这个词就是指 AI+ISP。 vivo 的资料提到了 vivo 美国圣地亚哥、深圳、上海、杭州、东莞等地的专家团队与三星专家团队积极沟通,在第一代 Exynos 980 合作的基础之上,通过一年半的时间迭代和升级,在 Exynos 1080 之上导入了全新 ISP 架构(AISP)与 NPU 的接入点,使得 AI 在影像拍照和视频上的使用更加便捷和实时,并进一步升级了智能自动白平衡、自动曝光、降噪等功能。 事实上在 Android 阵营内,谷歌在 PVC(Pixel Visual Core)介入成像 post processing 的过程还是有标杆作用的,谷歌 AI Blog 也列出了不少如何利用机器学习来参与 3A(自动白平衡、自动曝光、自动对焦),以及降噪、防抖,甚至是 HDR 画面实时预览的过程——我的知乎专栏也翻译过其中的部分文章。不过谷歌不具备将一个专用单元集成到主 SoC 的能力,所以 Pixel 设备利用 PVC 进行 AI 摄影的芯片间通讯延迟应该还是有点久的。 三星在发布会上提到 Exynos 1080 通过 NPU,可以做拍摄物体与风景的检测,优化白平衡和曝光。其实用简单的话来概括,以自动白平衡为例,夜间自动白平衡难度较大——通过机器学习的方式,在模型训练过程里,尽可能去喂大量夜间照片的白平衡调整策略,作为输出就能让 NPU 去做 inference 了。不过我不清楚,在整个流程里,ISP 和 NPU 是如何协作的,每个阶段又如何分配。 聊完 NPU,再来谈谈 ISP。Exynos 1080 的 ISP 纸面参数是单路最高 2 亿像素支持,最多可接收 6 路传感器信号,同时可接收 3 路输入信号;视频原生 10bit 色深拍摄,4K 60fps 支持。其下还有一些细节值得一提,比如说 TNR(Temporal Noise Reduction)硬件级时域降噪模块,在 RAW 域上进行降噪处理,提升录制视频的效果。 “vivo 影像专家团队针对视频拍摄中的运动和夜拍等场景,在分析了全系列用户的使用情况和反馈之后,针对夜景和运动视频中的鬼影、噪声、动态范围等极易影响视频效果的维度,在新一代 ISP 的基础之上做出了硬件级的升级和优化,极大提高了视频的成片率。” 也就是说 vivo 是参与了 TNR 降噪模块的优化的。TNR 降噪其实本身并没有什么新奇的,它是相对 Spatial Noise Reduction 而言的,TNR 是对照多帧,基于某些噪声在画面中分布的随机性来降噪的过程——很多视频后期软件中都有类似的功能。手机产品历史上,iPhone 4s 就宣传过摄像头的 TNR,只是可能当年并未达到“硬件级”,算力和算法也都差着辈儿。 AI 降噪的功能示意 当然这其中涉及到复杂的算法,当其层级位于芯片 ISP 之时,效率应该就会高很多了。所以 Exynos 1080 也因此将硬件 TNR 替代超级夜景算法中的降噪处理部分,实现夜景录像同时的 HDR 功能,也就是实时的夜间降噪和 HDR。另外,针对这一点,vivo 作为更高抽象层级的市场参与者,为 TNR 提供支持,的确也是更到位的做法。 另外,在系统层面,vivo 重构了相机框架代码,压缩软件调度时间;针对运动抓拍场景,可以很大程度规避运动拖影、模糊、延迟等问题。所以不同层级参与者的共同协作,对于终端设备拍摄体验优化,应当还是多有好处的。 SoC 之上的其他大型 IP,另值得一提的是 5G modem 相比前代加入了对毫米波的支持,以及最高下行速率提至 5.1Gbps;无线通讯支持主流的蓝牙 5.2 和 WiFi 6;存储控制器对 LPDDR5 做出支持,带宽在 51.2GB/s——这就是旗舰级的配置了,猜测应该是四通道 16bit,3200 MHz 的水平。 vivo 究竟和三星合作了什么? 有关 vivo 与三星联合开发 Exynos 1080 的问题,其实前文已经列举了不少。vivo 这些年都有与上游厂商做“联合开发”的传统,比如说当年与汇顶合作,推屏下指纹解决方案。而与三星SLSI 的合作,则在上代 Exynos 980 就开始了。 去年的沟通会上,vivo 提到 Exynos 980 的原型机就是 vivo X30——这是作为其他品牌 Exynos 980 手机的母版存在的。当时 vivo 派驻了数百人团队,参与 Exynos 980 芯片开发周期,其中包括了对 5G modem,及系统级 RF 系统相关的功能特性的补充,似乎在偏射频前端部分,vivo 给了很多投入。 今年我也从 vivo 那边看到了一些官方资料。就大方向来看,除了本文开头提到提前 18 个月就投入超过 50 人的技术专家团队,参与 Exynos 1080 的配置定义,vivo 很大程度上是将终端产品使用场景,及终端用户需求,带到 Exynos 1080 的研发过程里。 “在为期一年的前期技术沟通中,vivo 与三星通过每周的技术周会来严格审查芯片中的各个模块和技术细节(CPU/GPU/Modem/ISP/NPU/DSP/PMIC/射频/连接/音频/视频编码/外围设备/安全/传感器中枢/低功耗/系统/内存等),形成超过 10000 项技术点检规格。 “在联合研发期间,vivo 投入总计超过 1400 名技术工程师,包括技术规格专家 50+ 人、电子开发工程师 150+ 人、软件工程师 600+ 人、影像工程师 100+ 人、品质测试工程师 500+ 人等轮流驻厂和派遣团队,共计解决软件层面问题 13000+ 个,硬件层面问题 1000+ 个。” 其中的细节问题,其实前文已经列举了一些具体的参与内容:包括了前期配置定义、 IP 及工艺选择等、AISP 架构的推动、ISP 之上 TNR 硬件降噪模块的优化……;在 SoC 之上系统层级(可能包括了外围、板级、操作系统、中间件、上层应用等)的参与典型如重构相机框架代码,规避拍摄中的运动拖影、模糊等问题…… 这里再列举几个系统层级的优化: 1. 5G无线通讯的功耗优化:“将 CP-engine(modem 加速器)和多传输模式架构及功率进行调整优化”,提升数据传输效能;另提升系统快速唤醒和休眠效率,使得“搭载 Exynos 1080 的终端与 vivo X3 相比可降低至少 20% 的功耗”。 2. 基于游戏场景,提升游戏体验:通过第三方应用算力需求的调研,针对不同的应用,来分配算力,如用户唤起应用时调用大算力,应用和游戏运行过程则均衡算力,应用保持后台运行则确保低功耗——这应当算是系统层级的调度策略优化了。 3. 动态帧率自适应:在 Exynos 平台上导入动态帧率自适应,适应内容刷新速度,包括游戏内容帧率匹配。 我所获取的这些资讯,可能仍然没有那么具体,或许我将来有机会时还可与 vivo 的工程师再做深入探讨,在不涉及商业机密的基础上,去理出一些更细节和对爱好者们有价值的资料。 可总结的是,Android 阵营比较少见从 IC 设计到终端设备生产全包的企业,这很容易造成需求与生产的脱节,而且中间层变多也会降低效率。vivo 的主要身份是终端设备制造商,和用户是更靠近的,所以也更懂得用户需求。以需求为出发点,与三星 SLSI 合作,参与最初的设计,加上自己在系统层级上的优化,其实是落实最终手机体验更好的方法。 这也是 vivo“OS+芯片”软硬件生态持续布局,以及构建自身差异化优势的一个体现。 三星的 5nm 工艺 文章篇幅有些过长了,最后一部分就给感兴趣的同学做选读吧。而且这部分内容的阅读可能需要一些相关晶体管制造的基础知识,和前面我们探讨的微架构抽象又有较大差别。而且制造属于三星 Foundry 的业务范畴。推荐在阅读这部分之前,首先阅读我的另外两篇文章: 为什么说Intel 10nm工艺比别家7nm先进?(上) 同样是台积电7nm,苹果和华为的7nm其实不一样 需要有个基本概念是, 像 7nm、5nm 这样的工艺节点数字,实则并不代表微观层面晶体管的任何一个长宽高或者某个具体的参数(如果硬要说的话,应该就只有 fin 宽度和节点数字比较靠近了) 。所以 5nm 并不是晶体管的某个部分比 7nm 缩减了 2nm。而且不同晶圆厂对工艺节点的命名有自己的规则,比如说三星的 5nm 工艺与台积电的 5nm 工艺可能就有很大差异。 事实上, 自芯片制造厂步入 7nm 时代之后,三星 Foundry 就与台积电/Intel 有了较大的路线演进差异。 比如说三星在 10nm 工艺之后,就立刻为 7nm 节点选择了某几层的 EUV(极紫外光)光刻。台积电至少前两代 7nm 工艺(N7/N7P)都仍在用 193nm 波长的浸入式光刻;Intel 同代 10nm 也是如此。 所以在完整节点迭代上,三星 7nm 工艺的起步迈得略大了一点。而三星此后对 6nm、5nm、4nm 的定义,都属其 7LPP 工艺的同代演进,就类似于三星 10nm 与 8nm 工艺的关系那样,如下图。 三星 Foundry 目前的策略都是完整迭代时,走大步子。比如说下一代 3GAE,晶体管结构要改用 GAAFET(Gate-All-Around FET),包括纳米线的 GAAFET,和纳米片的 MBCFET(Multi-Bridge Channel FET)。而在台积电的规划路径上,3nm 仍然采用 FinFET。当然这是后话了。所以目前两者的路线演进,已经出现了较大的分歧。 三星在发布会上提到,其 5nm 工艺(5LPE)令芯片面积降低 35%,功耗效率提升 20%,性能表现提升 10%。 Wikichip 的数据是,三星 5LPE 的 UHD 单元库密度 126.89 MTr/mm²(百万晶体管每平方毫米),相比 7LPP 提升 1.3 倍 。不过个人觉得,Wikichip 目前预估的这些数字很难做跨不同晶圆厂的晶体管密度对比。这在我先前的文章中也提过,晶体管密度计算方法有差别,而且晶体管在芯片上也不是均匀分布的,所以不同厂商的晶体管密度数字并不应该做直接对比。 有关三星的 5LPE 工艺这里就简单地谈一谈,其实在常规晶体管尺寸方面,5LPE 相比 7LPP 是几乎没有变化的,包括 fin pitch、gate pitch,以及各层金属间距等。所以对于 IC 设计企业而言,7LPP 到 5LPE 的设计 IP 就能极大程度复用。 那么 1.3 倍的提升是怎么做到的呢?就三星此前在 Arm TechCon 2018/2019 的介绍来看,重点当然就是从单元(cell)着手了。 5LPE 引入了一种新型的 6T UHD 单元库。来看下 Wikichip 画的 5LPE 新增 UHD 单元高度的缩减,相较 7nm(HD 高密度单元)的变化。以及更早的 10nm(高密度单元)、8nm(超高密度单元)在 fin 间距和单元高度上的变化: 来源:Wikichip 加上 gate 以后就变这样了: 来源:Wikichip 不难发现,三星的 8nm 和 7nm HD 高密度单元相比前代都减掉了一个 fin,减 fin 自然是为了实现面积的缩减、密度的提升。当然在更具体的晶体管改进上,实则 7LPP 的每个 fin 都实现了更高的驱动电流,即更高的性能——这样减 fin 才可行。5LPE 的 UHD 超高密度单元库相比 7LPP 再去掉了 1 个 fin,这样单元高度就变小了。晶体管本身,有包括 low-k spacer 间隔、DC 等方面的加强,要不然性能就得下滑严重了。 当然,这样的 UHD 单元库并不会应用在高性能需求的关键路径部分,这样的话,更大的7.5T HD 单元仍然是必要选择。所以我们才说,所谓的“晶体管密度”实则与芯片设计是息息相关的。6T UHD 与 7.5T HD 单元的主要参数如下: 来源:Arm TechCon 2019 5LPE 相比 7LPP 的实际提升是:对于 7.5T HD 高密度单元库而言,性能提升了11%(同功耗下,速度提升 11%;同性能下,功耗降低约 20%);而 6T UHD 超高密度单元库则实现了大约 33% 的密度提升。 展开一下 6T UHD 单元的一些特性。这种单元包括采用 SDB(single diffusion break)、36nm 的 M2 间距,CB on RX edge(RX是指单元的活跃区域,CB属于额外的本地互联层,在单元内横向布局,将接触层的触点连接到多晶硅本地互联——位于第一层金属层之下,也就是MOL互联;所以CB on RX edge也就是CB互联层用到单元活跃区域边缘)。 除了 6T UHD 以外,5LPE 还引入了一种低漏电的 1-fin device(1个p fin,1个n fin),能够提供至多 20% 的功耗节约。见下图: 所谓的 SDB,三星在更早的工艺节点中就引入过,只不过 7LPP 节点没有选择 SDB。Intel 将 SDB 称作共享 dummy gate。这是指,一般每个单元的两端都会有 dummy gate,而 SDB 或者说共享 dummy gate,就是让两个单元共享一个 dummy gate,以实现尺寸的缩减。上图的 6T SDB 棕色那几条就是 single dummy gate 了。 值得一提的是,从 TechInsights 的拆解来看,这里的 dummy gate 实际上并不是真正的 gate,而是个蚀刻足够深的凹槽,如下图 : 三星 10nm 工艺中的 dummy gate,来源:TechInsights via Solid State Technology 7.5T UHD 单元之间并未采用 SDB,而是 MDB,混合间隔的 dummy gate:pMOS 为 SDB,nMOS 则是 DDB(double dummy gate),性能自然更好。 最后总结一下,其实前面差不多都已经说完了。一方面是期望,这样的文章能够为半导体技术爱好者开拓视野,理解如今的手机 SoC 从大方向上来看是怎么回事,以及 2021 年的手机 SoC 会是什么样。这在本文第三部分 GPU 介绍的结尾处已经有了小节,即 Exynos 1080 可能会推升中高端定位手机产品的竞争水平;以及这是一颗甜品级,且可能获得较长寿命的手机 SoC。 另一方面,则在 vivo 与三星 SLSI 的联合研发层面,vivo 更多以终端用户的需求为出发点,让 Exynos 芯片在设计之初就更考虑用户体验层面的问题。所以在消费电子爱好者关注 vivo X60 这款手机时,也不要忘记观察,其中的 Exynos 1080 带来了多少细节方面的体验提升,比如夜间拍照降噪与同时 HDR 是否明显有了更快的速度。 参考来源 vivo S6评测体验:5G自拍求对手 - 快科技 https://news.mydrivers.com/1/683/683229_all.htm Samsung Neural SDK - Samsung Developers https://developer.samsung.com/neural/overview.html Samsung 5 nm and 4 nm Update - Wikichip Fuse https://fuse.wikichip.org/news/2823/samsung-5-nm-and-4-nm-update/ High-Performance 5LPE Implementation Next-Generation Arm “Hercules” CPU. Kevin K. Yee (Samsung), Fakhruddin Ali Bohra (Arm), Edson Gomersall (Cadence). Arm TechCon 2019 IEDM 2017: Intel’s 10nm Platform Process - Solid State Technology https://sst.semiconductor-digest.com/chipworks_real_chips_blog/2017/12/18/iedm-2017-intels-10nm-platform-process/
  • 热度 13
    2020-12-11 09:20
    1118 次阅读|
    3 个评论
    配图来自Canva可画 近两年来,国内手机厂商进军彩电市场,已经成为行业常态。 在华为推出智慧屏产品后,OPPO、一加等手机厂商也相继跟进入局,这无疑对彩电市场产生了不小的冲击。而在手机企业跨界布局的同时,TCL、海信等彩电企业,也纷纷推出了5G智能手机,向手机厂商发起“反击”。 不过,从目前来看,彩电企业在国内手机市场的表现并不如意。而在AIoT大潮全面袭来之后,作为重要的入口智能电视的作用日益凸显,这对曾经失意的彩电企业而言无疑是重大利好。不过,彩电企业能否在这一轮的市场竞争中赢得主动,却仍是未知之数。 跨界博弈 手机、彩电企业的跨界博弈由来已久。早在功能机时代,国内的长虹、TCL、海信等彩电企业,就已经在手机领域展开布局。不过,在智能手机时代,国内的彩电企业并没有真正抓住这个市场机遇,因而其在智能手机市场并没有留下深刻的印记。 到了2014年整个彩电行业开始负增长后,长虹开始重启手机战略再次进军手机市场,海信、TCL等彩电企业,也先后推出智能手机新产品,争相在手机市场抢食。 而在彩电企业发力手机市场的同时,国内的手机企业也纷纷转战彩电市场展开跨界“反击”。比如,率先在彩电行业布局的小米,早在2013年就推出了47英寸的电视产品,后来入局的华为,也推出了自家的智慧屏产品。 从市场方面来看,彩电、手机企业早期的跨界布局,主要还是为了寻找新的增长点。特别是在手机、彩电市场进入存量竞争阶段之后,它们各自寻找新增长点的需求就愈加迫切。而手机和电视的产业链存在一定重合,这为手机和电视企业跨界布局创造了可能性。 在AI、5G通信等新兴科技爆发后,手机、电视产品的地位也逐渐升级,手机、电视产品也不再只是单一的电子产品,更是各家企业切入AIoT生态领域的入口。这样的情况下,手机、彩电企业之间的跨界博弈也变得越来越激烈。 手机厂商略胜一筹 和TCL、海信、长虹在手机市场的表现相比,小米、华为等手机厂商在彩电行业取得的成绩,就显得十分亮眼了。 从市场表现来看,小米电视在2019年出货量达到了1046万台,以19.25%的市场份额,稳居国内彩电市场首位;而推出智慧屏产品的华为,更是凭借其荣耀智慧屏X1获得今年618京东电视品类销量冠军,在今年上半年电视市场销量排名中位列第七,表现也不逊色于其他电视厂商。 对比之下,彩电企业在手机领域取得的成绩,则要逊色许多。比如一直致力于手机行业的TCL,目前在手机市场占有的份额不足1%,曾经名噪一时的长虹手机也缺席5G手机市场,而发布5G手机产品的海信,虽然仍在和华为、小米、苹果等手机企业博弈,但其在市场销量上,依旧没有取得太多亮眼的成绩。 除了市场表现之外,华为、小米等手机企业在智能化技术应用方面,同样表现出色。具体来看,华为、小米等手机厂商,充分利用各自在AI技术方面的积累,主推智能化技术应用,这为它们进军彩电市场增添了筹码。而被迫进行智能化转型的海信、TCL,却因为在智能电视领域丧失先机而处于极其被动的状态。 品类差异成制胜要诀 手机、彩电企业相互跨界,成果却大相径庭,跟市场形势、行业特性的差异等因素,均有很大关系。 首先,手机行业的飞速发展,使得手机市场的头部效应愈加明显,彩电企业想要市场夺食非常困难。据Canalys调查数据统计显示,目前国内市场中,华为、小米、vivo、oppo、苹果等五家智能手机厂商,就占据了96%的市场份额,几乎垄断了整个国内市场。 其次,随着手机行业进入存量竞争阶段,市场竞争进一步加剧,行业对新技术要求也越来越高,各家手机厂商不得不通过新技术研发,来提升其市场竞争力。这种情况下,没有抓住智能时代机遇的海信、TCL、长虹,要想在目前的手机市场寻求突破就更难了。 最后,手机、彩电品类特性的差距,也是造成这种差异的重要原因。和电视机相比,用户对手机的使用频率更高,因此手机的用户粘性也更高,因而手机更容易建立品牌忠诚度;而用户在选择品牌众多的彩电产品时则没有这方面的考虑,来自市场价格、新兴技术等因素更容易影响用户决策。品类的这种差异,使得彩电企业进入手机行业,远比手机企业进军彩电市场发展要困难得多。 另外,华为、小米等企业在手机行业奠定的技术、性价比优势,也为它们进军彩电市场增添了不少助力。对比之下,海信、TCL在电视领域积累的显示技术,在手机领域的应用则相当有限。 这也是彩电企业在手机市场鲜有成绩,而OPPO、一加等手机厂商,却扎堆进军彩电市场抢食的原因所在。不过,在全新的AIoT新时代,彩电企业也并不是没有夺食手机市场的机会。 AIoT时代,彩电企业还有机会吗? 随着AIoT时代到来,万物智联成为新的风口,科技消费市场也迎来了更多变数,这为进军手机市场的彩电企业,带来了新的机会。 从AIoT生态产品切入来看,智能音箱、智能手机仍然是主要切入口,其在AIoT生态的核心地位无可取代,这也是彩电企业再次争夺手机市场的重要原因。不过,在目前格局稳定的手机市场,彩电企业要想掀起风浪依然很难。 而在彩电市场,随着AIoT市场进入中期发展阶段,每个入口产品都将具备一定的中心化能力,电视机在AIoT领域的生态地位也会得到加强。这种情况下,彩电企业就可以通过其在电视领域的优势,借助AIoT生态的联动,通过“电视+手机”的布局模式,再次回归市场。 与此同时,在同质化严重的手机市场,变革性的技术研发愈发艰难,这也为彩电企业在手机技术方面,追赶华为、小米提供了契机。不过,这种机会并不足以让它们撼动手机市场的固有格局,但这对其在AIoT时代调整手机战略大有助益。 因此,如何把握AIoT时代的新机遇,对彩电企业来说就显得尤为重要。目前来看,海信、TCL在AIoT市场仍处在拓展市场阶段,目前其取得的成绩还比较有限。不过,随着AIoT市场的发展,接下来彩电企业则有望迎来更多的机遇,从而有机会参与到头部手机厂商的角力中。 文/刘旷公众号,ID:liukuang110
  • 热度 4
    2020-7-22 17:32
    1504 次阅读|
    0 个评论
    vivo X50系列手机通过百佳泰HDR10+认证测试
    百佳泰作为全球首批HDR10+认证测试实验室(Authorized Test Center, ATC) ,近日为 vivo X50系列手机(X50、X50 Pro、X50 Pro+) 颁发了 HDR10+认证通知书 ,该证书标志着vivo X50系列手机已通过HDR10+的认证标准,屏幕支持HDR10+视频格式,能为用户带来 高动态范围的明暗对比,鲜艳饱和的视觉呈现 和 最为出色的观影效果 。vivo对X50系列手机有着严苛的品质追求,彰显了其在业界的领先地位。 现代人们的生活已逐渐依赖使用手机来观看视频影音,因此对电子设备的使用体验要求越来越高,希望输出的视频能够画质清晰且明暗对比分明。vivo深知视觉感官的重要性,在百佳泰测试实验室针对其产品荧幕进行认证,以确保其产品能满足用户需求。通过精准且严密的测试考核,vivo X50系列手机的 屏幕亮度、BT.2020、DCI-P3色域表现,动态元数据(Dynamic metadata)处理 均符合国际HDR10+认证标准,能有效发挥其卓越的性能。 HDR10+改良现有的HDR10的图像处理,原本只采用静态元数据(Static metadata)升级成可支持动态元数据(Dynamic metadata),因影像中不同的场景调节强化亮度、对比度、色彩饱和度等的层次分布,可以使每帧画面独立调节HDR效果。 本次百佳泰技术团队,针对产品进行全方位的验证与测试评估 ,作为高端专业影像旗舰级别的vivo X50系列手机,具备顶级的图像及视频显示效果,能够随着不同动态画面调节HDR效果,呈现更广泛的色彩范围,让画面看起来更自然舒服。除此之外,借助HDR10+的丰富色彩与动态映射对比度,能有效且准确还原每个图像中的逼真度,呈现栩栩如生的高清效果,为用户创造高品质的观影体验,可谓口袋式电影院的最佳代言人。 关于百佳泰: 百佳泰为全球第一批HDR10+认证测试实验室,拥有专业测试能力与完善的仪器设备,除了执行HDR10+的标准认证测试外,同时也能针对UHDA、DisplayHDR、HDMI等使用影音传输接口的产品提供专业的认证测试、debug调试、兼容性测试等服务。 蕴含多年测试经验与技术,百佳泰的专业团队可以为您量身定制,依照您的产品属性提供客制化测试、分析及反馈,加速通过协会标准,赢得市场先机。 关于vivo: vivo是一家以极致产品驱动,以智能终端和智慧服务为核心的科技公司。vivo始终坚持以独特的创造力,融合科技与时尚,设计让用户更加心动的产品,让消费者与数字化生活连接。vivo总部位于中国东莞,且充分利用本地的人才资源,布局了全球化研发网络,覆盖深圳、东莞、南京、北京、杭州、上海、台北、日本东京以及美国圣地亚哥9个城市,范围包括5G通信、人工智能、工业设计、影像技术等众多个人消费电子产品和服务的前沿领域。
  • 热度 14
    2020-6-15 18:59
    3118 次阅读|
    2 个评论
    聊聊Exynos 990,为什么三星放弃自研CPU?
    我一直都觉得三星 Exynos 还是挺有趣的 SoC:我记得之前翻译 AnandTech 的苹果 A12 和三星 Exynos 9810 评测文章的时候,有句话我印象特别深刻:“采用 M3 核心的三星 Exynos 9810,能耗达到苹果 A11 的两倍,性能却落后了 55%(注意,是 A11)!” 尔后,AnandTech 通过魔改 Exynos 9810 系统层面调度机制的方案,达成了系统性能相较原版的一个显著提升。这些其实都表明,三星在移动 SoC 设计和制造上都可以认为是整体掉队的。所以也不难理解,三星为什么决定放弃自研 CPU 架构。Exynos 990 是三星最后一款采用自研架构的 SoC。 想必很多同学也已经听说了,这次 Exynos 990 相比竞争对手依然有差距的事实。这里我将 AnandTech 的一些评论和测试做了综合,分享给各位。本文的绝大部分数据和内容均来自 AnandTech,若需查看英文原文,可拉至本文末尾。我觉得这篇文章能够非常到位地阐释,为什么三星放弃了自研架构,因为无论从哪个层面来看,其自研架构不仅问题极多,而且还远远及不上 Arm 的架构。 请注意,注意区分本文的几个词汇:能耗 energy,是指跑测试消耗的能量,单位焦耳;功耗(或功率)power,是指单位时间内消耗的能量,单位瓦特;功效 power efficiency,一般是指每瓦性能;能效 energy efficiency,这里特别指每焦耳的性能——这个性能可以是跑的分值,也可以是游戏帧率。 这里需要强调一点,我们日常所说的“能效比”,或者“效率”指的其实是这里的 power efficiency。本文的能效,严格意义上都不是用的这个通俗的意义。 综述 三星 LSI 的这颗旗舰 SoC 是在去年 10 月份宣布推出的:它在 CPU 大核心上采用了三星新一代的 M5 架构;中型规模的核心则升级到了 Cortex-A76;采用新的 Mali-G77 GPU。Exynos 990 采用 7nm LPP 制造,即芯片的某些部分采用 EUV 光刻。 Exynos 9820 这里看一下上一代的 Exynos 9820,,也就是 Galaxy S10 采用的 SoC。以此可了解 Exynos 990 做了怎样的提升和变化。 Exynos 9820 的大核心簇是三星定制的 M4 架构,它跟 Arm 公版架构的差异还是比较大的:从互联到缓存一致性,都采用三星的 Coherent Interconnect。Andrei Frumusanu(AnandTech 著名博士编辑)对这种结构有做核心到核心的延迟测试,起码它比 Arm 公版架构的延迟是要大出很多,当然也比骁龙 865 明显更糟糕。 Exynos 990 Exynos 990 相较 Exynos 9820 的改进其实还是比较多的。首先三星这次终于在小核心上,将 A55 的 L2 cache 推升到了 64KB。要知道 Exynos 9810 和 9820 在这方面就差一截,所以这两款 SoC 相比以前的骁龙 SoC,在效率上就有差距。不过 64KB L2 cache,这个容量仍然只有骁龙 865 的一半(128KB),三星在 Arm 核的 cache 配置上还是比较保守。 中核心从先前的 Arm Cortex-A75 升级到了 A76,频率也有提升,从 2.3GHz 提到了 2.5GHz,基于负载不同性能提升可达 38%-50%,也是 Exynos 990 大部分工作的主要动力来源。中核心的 L2 cache 仍然是每个核心 256KB,共享的 L3 cache 也是比较保守的 1MB。 大核心部分,早前代号为 Cheetah(猎豹)的 M4 这次升级到了代号为 Lion(狮子)的 M5——也就是三星的自研架构。其最高频率仍然是 2.73GHz,三星宣称会有 20% 的提升,应该主要是来自 IPC 提升。 外部可以观察到的最大变化,在于 M5 大核心不再享有各自的 L2 cache,而是 2MB 的核心共享 L2 cache。现如今,这样的微架构设计变化还是比较少见的。这一变化,从核心到核心的延迟降低能看得出来,毕竟这次的缓存一致性是在更低的 cache 层级发生的,和 CPU 也靠的近。 Exynos 990 采用三星 7LPP 工艺制造,部分采用了 EUV 光刻。TechInsights 提到,Exynos 990 是首个采用完整 7LPP PDK(Process Design Kit)设计的芯片,这一点和先前的 Exynos 9825 还是有不同的)。 三星宣称,7LPP 工艺相比之前的 8LPP 有 7% 的性能提升,应该也意味着同频功耗的降低。实际是个什么情况呢?我把 AnandTech 的内容做个概括: 一 Exynos 990 的 binning(可以理解为根据不同的芯片体质,对芯片进行等级分组)看起来是比较糟糕的,而且绝大部分芯片都位列相对较差的体质分组,甚至可能更糟,这表明这颗芯片的良率可能很不理想。 二 M5 的核心电压不是很乐观,不仅在同频下相比上一代 M4(8LPP)没有提升,而且随频率升高还表现更差了。M5 需要更高的电压,才能达到先前相同的频率:同样 2.75GHz 最高频率,M5 的峰值电压为 1118mV,而先前的 M4 为 1068mV。 三 从功耗与效率曲线来看,纵观性能变化周期内,M5 核心显然在效率上弱于 Cortex-A76(同一个 Exynos 990 SoC 上的);Exynos 990 A55 小核心的效率比先前的 Exynos 9820 要理想很多; 四 Exynos 9820 时期,三星引入了一种更为复杂的 scheduler,基于应用跑的 ISA(指令集结构)选择不同的功耗模型。这种机制会分别追踪 32bit 和 64bit app,然后根据不同 CPU 在不同执行模式下的微架构性能和功耗特性,做出调度决策。三星宣称这种机制能够提升效率,更多的工作可能会分派给 Arm 中核心——因为 A76 在 32bit 执行效率上会更好。 从 SPECint2006 的综合成绩来看,其实很难看出这种执行模式有什么大差别。但某些个别的测试子项,比如说 456.hmmer——这是个偏向执行能力的测试,就能看出 A76 核心的优势——A76 核在这个项目的成绩上的确领先于 M5 核。从这个角度来看,三星的调度策略是合理的。 另一个例子是,400.perbench 在 32bit 模式下,A76 核心同样优于 M5 核心,所用功耗还低了超过一半。不过更偏存储性能的负载,M5 在跑分上还是有优势的,这可能与两者的 cache size 差异有关。 AnandTech 在文章中提到,这是 AnandTech 首次针对 AArch32 和 AArch64 两种执行模式,分别公布跑分成绩。 五 在存储延迟测试方面,Exynos 990 相比 Exynos 9820 还是有提升的,但和骁龙 865 比起来却有差距。 下面这几张图是 Exynos 990 M5(大核心)、Exynos 990 A76(中核心)、Exynos 9820 M4,以及骁龙 865 A77(大核心)的存储子系统延迟对比。很显然,相比 Exynos 9820,可以看到 Exynos 990 的 L2 cache 在尺寸上变大。M5 核心当然还是会有一些优势,比如说 3 周期的 L1 延迟设计,Arm 核心都是 4 周期。 去年的 M4 核心其实就存在 TLB 问题(Translation Lookaside Buffer,一种页表的 cache,是一个内存管理单元,用于提升虚拟地址到物理地址转换速度),今年的 M5 这个问题并未得到合理解决。 这会导致一些比较无语的问题,比如说随机访问超过 2MB 的区块,可能还比 1MB 尺寸内的速度更快。相比 L2 cache 区域,L3 的 cache line 访问,TLB 未命中惩罚的访问延迟还更低…(这也可能是 16-64MB 区块内,Exynos 990 弱于 9820 的原因)。 而 A76 核心部分显然就比较符合预期了。A76 的 prefetcher 原本就有比较大的提升,在 Exynos 990 之上也有体现,两个 A76 中核心在某些数据访问模式上是优于 M5 核心的。实际上,三星自 M3 设计以来,在存储子系统方面就有比较大的问题,到 M5 也依旧未能解决。 六 从 SPECint2006 的测试结果来看,Galaxy S20 的两个不同 SoC 版本,骁龙 865 相比 Exynos 990,各方面都有优势。 主要表现在骁龙 865 显然在能效/功效方面有着比较大的提升。 早前 Arm 曾表示,A77 核心相比 A76 会在性能上有进步,但两者的功效(energy efficiency)其实是差不多的——也就意味着 A77 需要以功耗换性能。但骁龙 865 则显然超出了 Arm 的预期,不仅使用更少能耗(energy),而且功耗(power)也更低。 这可能和骁龙 865 相比上一代改用台积电 N7P 工艺有关,这或许表明 N7P 工艺相比 N7 的确有显著提升。 Exynos 990 相比上一代当然也有性能提升,但肯定比不上骁龙的步子。其中有一些成绩比较诡异,比如说 403.gcc 的成绩还不如上一代。更悲伤的是功耗(power)和能耗(energy)。Exynos 990 的能耗其实跟 Exynos 9820 很相近,有时略好,有时又略差。但在有性能提升的情况下,功耗却也明显发生了飙升。 其实功耗高,有时问题也不算大,只要能换得所需的性能即可,苹果即是个中翘楚——至少能效比是不错的,而峰值性能对于提升体验也是有帮助的。但这并不适用于 Exynos 990,因为 Exynos 990 显然性能也并不怎么样。 SPECfp2006 测试情况类似,虽然 Exynos 990 的性能有提升,但却是以高很多的功耗换来的——这个代价其实是得不偿失的。某些测试,比如 447.dealII 和 470.lbm,在能效(energy efficiency)方面甚至还有 30-40% 的倒退。也有好的一面,433.milc 这个子项,M5 的成绩比 M4 提升超过一倍,但功耗也就提升 50%。 在整数测试的综合成绩中,Exynos 990 相比 Exynos 9820 有 17% 的性能提升;浮点测试综合成绩,则有 36% 的提升。但 Exynos 990 相较骁龙 865,在这两个大项上仍然分别落后了 11% 和 3%。 绝对性能可能还不是什么大问题,悲剧的其实主要是能耗(energy)问题。 Exynos 990 付出了双倍的能耗,性能却还略弱于骁龙 865! 六 很多同学可能会想,三星的 7LPP 工艺是不是严重不给力。有个对比对象,高通骁龙 765G 用的就是三星 7LPP 工艺。骁龙 765G 的 A76 核心频率 2.4GHz,而 Exynos 990 中核心的 A76 频率是 2.5GHz。这两者的性能和能耗非常相近,都明显弱于台积电造的 A76 SoC(尤其是 Kirin 990)。 可见三星 7LPP 的确不如台积电的 N7/N7P/N7+ 工艺,AnandTech 给的数据是,在功耗表现上差距可能达到了 20%-30%。 七 不过就算把 7LPP 的差距算上,三星 M5 核心依然被 A77 核心远远甩在身后。Frumusanu 说,虽然没有看到骁龙 865 和 Exynos 990 的 die shot,不过他认为 M5 核心在面积上至少比 A77 大了 3 倍。 综合来说,Exynos 990 相比骁龙 865,效率差 2 倍,性能差 10%,PPA 总体就差了 6-7 倍。 八 在 AI 方面,三星宣称 Exynos 990 的 AI 性能为 10 TOPS,综合了 NPU 和 DSP。理论上,Mali G77 应该也是可以参与 AI 运算的。这其实一直也不是三星的长项。不过 Exynos 990 相比前代在 AI 算力上的提升很大。 从 AnandTech 的测试结果来看,NNAPI 的 INT8 测试,骁龙 865 更强。不过这一点其实仍有待商榷,因为它和软件层面关联很大,Frumusanu 也认为三星很有可能面向 NNAPI 时只给了 GPU 资源。在 NNAPI FP16 这样的测试里,Mali G77 就有优势;FP32 测试,Exynos 990 也表现很好。总体上,AI 性能这部分,Exynos 990 表现是十分出色的。 九 GPU 部分,这个其实也是我个人一直想要去仔细看一看的。Exynos 990 应该是首款采用 Mali G77 GPU 的 SoC(也可能是天玑?),而且也是首款采用 Valhall 架构的 GPU。去年我写移动 GPU 对比的时候有提到,Mali G77 很可能会在性能上实现对 Adreno 阵营的反超。 Exynos 990 在 GPU 方面选择了 11 个核心的 Mali G77,频率提升到 800MHz,电压也随之提高了。由于 Exynos 990 也支持了 LPDDR5,图形计算面对 3D 渲染这类带宽要求比较高的工作时,理论上会有更高的效率。 十 GPU 性能测试,除了骁龙 865 版 Galaxy S20 Ultra 在 3DMark Sling Shot 3.1 Extreme Unlimited - Graphics 的测试中,有作弊的嫌疑,这里就不放出具体成绩了。后续测试则极大程度免除了作弊问题,所以我们着重看一些图形测试的子项。 峰值性能上,Exynos 990 和骁龙 865 比较接近,但持续性能前者就会明显比较弱了。这里面不知道有没有系统散热设计的锅,但这是基于同一个散热设计。Basemark GPU 1.2 测试里,Galaxy S20 Ultra 骁龙 865 版的图形性能,持续状态也只损失了峰值性能的 22%。而 Galaxy S20+ 的 Exynos 990 版则在持续性能上还比不过上一代的 Galaxy S10+。 但这里面的温控机制其实也很迷,Galaxy S20 Ultra 的 Exynos 990 在持续性能上表现最糟糕——还比不上 S20+,可能应该从其他层面来找问题根源。 GFXBench 图形测试绝对性能的情况也类似,骁龙 865 和 Exynos 990 的图形计算峰值性能差不多,而 Exynos 990 显然没办法持续稳定,很快因为温控而产生性能较大程度的滑坡,其实这个滑坡幅度比 Exynos 9820 还要大。 而这项测试的功效(power efficiency)表现,也是今年高通 Adreno 被盛赞的一个点,即 Adreno 650 的效率跨越甚大,虽然绝对性能比不上苹果,但效率已经追上苹果 A13 了。至于 Exynos 990,情况就比较悲剧——尤其跟进步这么大的 Adreno 比起来,实在是有点拿不出手。我觉得光从每瓦帧率来看,情况还算不上太糟,Aztec Ruins - Normal - Offscreen 测试,骁龙 865 比 Exynos 990 有 35% 的效率优势。 Manhattan 3.1 与 T-Rex 测试也比较类似, Exynos 990 的 Mali G77 都可以用悲惨来形容,持续性能都只有峰值性能的一半,而且功耗还很高,甚至要高于上一代。 整体来说,Exynos 990 的图形性能似乎和上一代 Exynos 9820 一个水平。三星可能是有意抬高 Mali GPU 的频率,令峰值性能可与高通的 Adreno 差不多,但代价就是高得多的功耗和悲惨的持续性能。其实上面的表格中有出现联发科的天玑 1000L,都是 Mali G77,它的表现是好于 Exynos 990 的。 十一 续航测试部分,其实也没什么意外吧。Exynos 990 与骁龙 865 版本续航的差距大约在 10-13%,是大于三星、高通上一代的差距的。 这里我没有加入 AnandTech 的系统性能测试,有兴趣的可以去看一看 AnandTech 测试全文。不过我觉得,涉及到堆了很多软件的整个系统,则三星肯定会有意削弱两者的这种差距(虽然续航的差距还是无法避免)。 其实从上面的很多点滴都不难发现,三星不存在任何继续自研 CPU 架构的必要性(尤其传说 M6 还支持超线程),因为问题太多了。而且在某些决策上,三星 LSI 自己都没有对于 M5 核心的信心,比如针对 32 位、64 位不同 app 的 scheduler 机制;以及缓存方面的决策。 但我觉得,放弃自研核心,就爱好者的角度,仍然是件值得惋惜的事情。这样一来,移动 SoC 主战场上,自研 CPU 架构,也就剩苹果一人了。 阅读原文: The Samsung Galaxy S20+, S20 Ultra Exynos & Snapdragon Review: Megalomania Devices - AnandTech Samsung Galaxy S20+ & Ultra (Snapdragon & Exynos) Battery Life Preview - AnandTech
相关资源
  • 所需E币: 1
    时间: 2021-4-10 21:11
    大小: 1.92MB
    上传者: ZHUANG
    基于DSP的手机流媒体实时图像浏览平台的软件设计.
  • 所需E币: 1
    时间: 2021-4-8 13:29
    大小: 3.53MB
    上传者: czd886
    基于DSP的手机实时图像浏览平台的硬件设计
  • 所需E币: 2
    时间: 2021-4-1 23:36
    大小: 459.08KB
    上传者: samewell
    4层使用AM8252B做的带WiFi-HDMI功能的手机互联原理图和PCB
  • 所需E币: 0
    时间: 2021-3-23 22:51
    大小: 952.24KB
    上传者: stanleylo2001
    高通手机RFPCBLAYOUTGUIDELINES
  • 所需E币: 0
    时间: 2021-3-21 18:23
    大小: 952.24KB
    上传者: Goodluck2020
    高通手机RFPCBLAYOUTGUIDELINES
  • 所需E币: 0
    时间: 2021-3-18 17:52
    大小: 6.93MB
    上传者: Argent
    电子电器维修工程师要求对电子、仪器有深入的了解,能够根据合同要求与技术人员沟通或组织技术人员实施,有一定独立工作能力和创新精神,有维修电路板经验,会画原理图,精通各类元器件的专业人才。本人收集了一些关于电子维修的技术资料,欢迎下载。
  • 所需E币: 0
    时间: 2021-3-18 17:55
    大小: 35.6MB
    上传者: Argent
    电子电器维修工程师要求对电子、仪器有深入的了解,能够根据合同要求与技术人员沟通或组织技术人员实施,有一定独立工作能力和创新精神,有维修电路板经验,会画原理图,精通各类元器件的专业人才。本人收集了一些关于电子维修的技术资料,欢迎下载。
  • 所需E币: 0
    时间: 2021-3-18 17:56
    大小: 42.16MB
    上传者: Argent
    电子电器维修工程师要求对电子、仪器有深入的了解,能够根据合同要求与技术人员沟通或组织技术人员实施,有一定独立工作能力和创新精神,有维修电路板经验,会画原理图,精通各类元器件的专业人才。本人收集了一些关于电子维修的技术资料,欢迎下载。
  • 所需E币: 0
    时间: 2021-3-18 17:51
    大小: 1.77MB
    上传者: Argent
    电子电器维修工程师要求对电子、仪器有深入的了解,能够根据合同要求与技术人员沟通或组织技术人员实施,有一定独立工作能力和创新精神,有维修电路板经验,会画原理图,精通各类元器件的专业人才。本人收集了一些关于电子维修的技术资料,欢迎下载。
  • 所需E币: 0
    时间: 2021-3-18 17:52
    大小: 5.69MB
    上传者: Argent
    电子电器维修工程师要求对电子、仪器有深入的了解,能够根据合同要求与技术人员沟通或组织技术人员实施,有一定独立工作能力和创新精神,有维修电路板经验,会画原理图,精通各类元器件的专业人才。本人收集了一些关于电子维修的技术资料,欢迎下载。
  • 所需E币: 0
    时间: 2021-3-18 17:58
    大小: 48.17MB
    上传者: Argent
    电子电器维修工程师要求对电子、仪器有深入的了解,能够根据合同要求与技术人员沟通或组织技术人员实施,有一定独立工作能力和创新精神,有维修电路板经验,会画原理图,精通各类元器件的专业人才。本人收集了一些关于电子维修的技术资料,欢迎下载。
  • 所需E币: 0
    时间: 2021-3-18 17:58
    大小: 52.33MB
    上传者: Argent
    电子电器维修工程师要求对电子、仪器有深入的了解,能够根据合同要求与技术人员沟通或组织技术人员实施,有一定独立工作能力和创新精神,有维修电路板经验,会画原理图,精通各类元器件的专业人才。本人收集了一些关于电子维修的技术资料,欢迎下载。
  • 所需E币: 1
    时间: 2021-3-18 17:59
    大小: 57.41MB
    上传者: Argent
    电子电器维修工程师要求对电子、仪器有深入的了解,能够根据合同要求与技术人员沟通或组织技术人员实施,有一定独立工作能力和创新精神,有维修电路板经验,会画原理图,精通各类元器件的专业人才。本人收集了一些关于电子维修的技术资料,欢迎下载。
  • 所需E币: 0
    时间: 2021-3-18 18:00
    大小: 67.8MB
    上传者: Argent
    电子电器维修工程师要求对电子、仪器有深入的了解,能够根据合同要求与技术人员沟通或组织技术人员实施,有一定独立工作能力和创新精神,有维修电路板经验,会画原理图,精通各类元器件的专业人才。本人收集了一些关于电子维修的技术资料,欢迎下载。
  • 所需E币: 0
    时间: 2021-3-18 18:03
    大小: 88.29MB
    上传者: Argent
    电子电器维修工程师要求对电子、仪器有深入的了解,能够根据合同要求与技术人员沟通或组织技术人员实施,有一定独立工作能力和创新精神,有维修电路板经验,会画原理图,精通各类元器件的专业人才。本人收集了一些关于电子维修的技术资料,欢迎下载。
  • 所需E币: 1
    时间: 2021-3-18 18:07
    大小: 116.33MB
    上传者: Argent
    电子电器维修工程师要求对电子、仪器有深入的了解,能够根据合同要求与技术人员沟通或组织技术人员实施,有一定独立工作能力和创新精神,有维修电路板经验,会画原理图,精通各类元器件的专业人才。本人收集了一些关于电子维修的技术资料,欢迎下载。
  • 所需E币: 3
    时间: 2021-3-17 18:05
    大小: 415.84KB
    上传者: xiaosh728
    手机电路原理手机的电路结构手机的结构可分为三部分,即射频处理部分、逻辑/音频部分以及输入输出接口部分主要电路组成:1射频部分一般指手机射频接收与射频发射部分,主要电路包括:天线、天线开关、接收滤波、高频放大、接收本振、混频、中频、发射本振、功放控制、功放等。1.1发送部分发
  • 所需E币: 1
    时间: 2021-3-12 20:51
    大小: 1.14MB
    上传者: czd886
    智能温度记录仪的手机管理软件设计与开发
  • 所需E币: 0
    时间: 2021-3-9 10:19
    大小: 1.57MB
    上传者: czd886
    基于蓝牙技术的高校手机自动考勤与管理系统的设计
  • 所需E币: 0
    时间: 2021-3-8 19:46
    大小: 2.62MB
    上传者: czd886
    部队手机智能管理平台研制
广告