tag 标签: 高通

相关帖子
相关博文
  • 2022-7-28 10:13
    0 个评论
    7 月 26 日,由 广和通 与高通共同举办的物联网技术开放日于深圳顺利举办,来自高通与广和通的多位高层领导、产品技术专家现场与众多物联网行业专家、通信技术大咖齐聚一堂,共同分享、探讨 5G+AIoT 技术趋势与成功应用案例,全面赋能技术开发者们,探索行业发展态势。 活动伊始, 高通公司高级副总裁盛况 进行开场致辞。盛况表示, 5G+AIoT 的科技创新正展现巨大魅力,以 5G 、 AI 、云计算、大数据为代表的创新技术正改变人们的生活,连接未来世界。在这其中,芯片、运营商、模组以及终端发挥重要的作用,期待大家能通过本次大会体会到技术与开放的力量,为开放者和创新者们提供更多灵感。 高通公司高级副总裁盛况 随后, 广和通 CEO 应凌鹏 在开场致辞中欢迎高通嘉宾的莅临,他表示,广和通与高通公司是密切的产业链合作伙伴,长期以来保持着稳定的合作关系。当前 5G+AIoT 技术正以加速度推动各行业变革,广和通与高通在 5G 技术、 AI 算力、智能应用、车载等行业重点发力,紧密合作双方帮助客户打造创新型的高性能终端设备。 广和通 CEO 应凌鹏 5G 、 AI 引领市场风向,开启“元宇宙”入口 5G与 AI 作为当前驱动科技发展的两大引擎,同样也在驱动物联网产业创新。 高通公司产品市场总监李骏捷 在演讲中分享了 5G 与 AI 的重要物联网应用,包括精准农业、数字化教育、联网医疗、智能制造、智慧零售、工业自动化和机器人、智能显示与视频、城市基础设施建设等 16 大场景,针对 5G+AI 应用场景,高通公司以边缘侧 AI 、影像、图形图像、 CPU 处理、连接 5 大技术方向进行行业价值赋能,可扩展以支持增长业务。广和通始终与高通保持紧密合作,搭载了高通系统级芯片平台的广和通模组,能广泛赋能数字化转型与工业互联,全面发挥连接、安全与计算的作用。 高通公司产品市场总监李骏捷 随后, 广和通 MBB 产品管理部总经理陶曦 以“ 5G 时代下的行业机会与展望”为主题,探讨了多个 5G 行业商机,包括无线宽带、超高清与泛娱乐、智能移动设备和行业数字化转型。陶曦在演讲中表示,得益于 5G 高带宽、低时延、广连接特性,广和通已推出了多款 5G 模组 ,包括基于高通骁龙 X62 5G 调制解调器的 R16 模组 FG160&FM160 系列,全面满足 5G AIoT 市场需求。同时,广和通重视技术研发,目前已在 5G LAN 、 R17 、高精度授时上进行突破研究。值得一提的是,广和通 5G “全场景”研发测试验证体系全面保障 5G 产品严苛的工规级标准,提供 5G 射频、可靠性、 5G 毫米波 RF 、 5G 光学实验等多个测试实验室。 广和通 MBB 产品管理部总经理陶曦 面对 XR 等新应用领域, 5G 技术又是如何持续满足规模商用需求? 高通公司高级资深工程师 / 经理陈波 以“元宇宙的入口:基于 5G 空口的 5G XR ”为主题的视频演讲进行了回答。他表示, 5G 技术发展之初即为了实现更低时延与更高可靠性,通过对 5G 技术进行端到端的优化,便可满足更多 5G 新应用需求,并提供技术保障。 高通公司高级资深工程师 / 经理陈波 5G 创新应用点亮数字化未来 干货满满的物联网前沿技术分享的上半场之后, 广和通市场拓展部总经理朱涛 则从物联网关键垂直领域机遇出发,与大家探讨了无人机、机器人、车联网、 AI 边缘计算、智慧农业、物联网医疗、高算力直播、区块链等领域的行业机会。广和通也始终保持与生态伙伴的合作,为全球物联网客户提供更具商业性的解决方案。同时,广和通也荣幸地邀请了来自终端垂直行业的客户分享成功案例。 广和通市场拓展部总经理朱涛 中讯邮电终端 BU 总监王运付 通过视频方式与大家详细分享了 5G 智慧油田解决方案与典型应用场景,全面解读 5G 专网如何赋能智慧油田,加速场景规模化落地。 中讯邮电终端 BU 总监王运付 谈及工业元宇宙, 蒂姆维澳公司总经理吕新伟 则对未来工厂进行解读,他表示, 5G+AR 为未来工厂提供智能高效运作的技术支持,实现数字工厂颠覆性升级。 蒂姆维澳公司总经理吕新伟 TCL 通讯智能连接产品线研发总监王建中 则对 TCL 于 5G 时代中的 FWA 目标进行介绍。他表示 TCL 始终与高通、广和通携手在源头上即保障产品质量,三者深度合作,为全球客户提供高质的移动宽带产品,赋能各行业用户实现万物互联。 TCL通讯智能连接产品线研发总监王建中 5G协同 AI 、边缘计算、大数据等技术,为物联网产业提供了稳定安全的无线通信与强大计算能力。广和通作为全球领先的无线模组提供商,不仅专注于高性能模组产品与无线通信解决方案研发,还始终保持对物联网及通信技术的前瞻性研究,进而推动产品研发与客户终端方案落地。通过此次物联网技术开放日,广和通与高通分享了丰富的技术趋势,更是展现了双方紧密的合作关系,未来双方将持续携手推出更多无线通信解决方案,推动行业数智化升级。
  • 热度 1
    2022-3-28 18:46
    247 次阅读|
    0 个评论
    传Arm Cortex-X3更耗电?高通、三星、联发科束手无策
    据外媒technave及台媒qooah报道,目前为非苹果处理器广泛使用的Arm Cortex-X2超大核心,因为相较上一代的Cortex-X1在功耗上没有太多改进而饱受争议。 目前主流的高通Snapdragon 8 Gen 1、三星Exynos 2200以及联发科Dimensity 9000等各家处理器在功耗测试上未能达标。不幸的是,各家厂商的新一代处理器Snapdragon 8 Gen 2 、 Exynos 2300 和天玑10000 的情况预计不会改善,因为据说这三款产品都将采用耗电的Cortex-X3 。 消息称,高通、 三星和联发科已经检查了早期的Cortex-X3 样品,可能要进行一些调整。Cortex-X2 所提升的那一点点性能,带来的功耗足以提供更大的性能运行,造成这种不成正比的原因是,人工智能性能增加了100% 以上,而基本的IPC 性能没有看到重大影响。 由此看来,如果不进行调整的话, Cortex-X3 在改进的制造工艺上增加的功耗,对Snapdragon 8 Gen 2、 Exynos 2300 和天玑10000 来说是一个令人不安的情况。但是到目前为止,高通、联发科和Samsung 没有代替方案可以采用,只能继续使用ARM 的设计。 不久前高通以14亿美元完成对世界级CPU和技术设计公司NUVIA的收购,用于研发自家ARM。不过能做到像Apple那样,为其A 系列所做的那样改用定制设计,这个计划预计也要到2024年才会实现。 这一传言的积极方面是,ARM的Cortex-X3发布还有几个月的时间,因此修订版可能会降低功耗,使骁龙8Gen 2、Exynos2300和天玑10000在效率上不那么令人担忧。 找国产替代芯片,上道合顺大数据
  • 热度 11
    2021-11-21 10:11
    2365 次阅读|
    4 个评论
    联发科的高端之殇
    2021/11/19,联发科推出天玑9000手机Soc,联发科表示该芯片是业界第一款采用台积电4nm的手机芯片,同时率先 采用ARM V9架构,从 据官方消息,天玑9000处理器在GeekBench中的多核跑分已超过4000,在安兔兔中也拥有 超过百万的跑分表现。 国内主流媒体纷纷发布相关信息,评测机构也开始PK高通 GEN1,彷佛联发科有机会在高端市场抢食更多的蛋糕。 从Helio X30,天玑1000,天玑1200,天玑9000,联发科在高端市场上已经尝试多年,效果非常的有限,我们可以 抛开技术层面的问题,从品牌,产业链经营等来分析联发科的困难。 高通从安卓手机逆袭以来,从MSM8960开始到800,810,820,835,845,855,865,888,GEN1,一直占据着安卓手机商用 Soc的 高端市场的半垄断地位,联发科从山寨手机芯片开发起家,到中低端市场进军,逐渐开始高端市场。 1.联发科的品牌形象建设未能达到客户的联想的高端形象,做山寨产品开始,给到市场品牌形象的不太好,为后续 发力高端埋下了隐患,同样在市场上发力高端的小米手机,也是遇到了同样的问题,性价比的传统形象根深蒂固, 而品牌形象会同消费者群体关联,形成消费需求。中低端手机主要以下沉市场,学生,普通蓝领和白领,大中城市 中低收入者,大部分人对手机的核心参数等了解和关注不大,品牌忠诚度比较低,注重性价比;高端市场的消费者 不一样,对于手机的核心参数有一定了解,而且品牌忠诚度相对较高,苹果,三星,华为都凭借品牌经营能力构筑 高端市场的护城河。高通同样也是,通过对三星,索尼,LG等传统巨头的渗透,包括对于小米OV旗舰机的垄断,完全 碾压了联发科的高端市场的位置。 媒体对于高端市场的关注,绝大部分都是首发高通系列旗舰机,而非年度首发联发科旗舰,高端客户人群对于联发科 的品牌接受度很低,需要品牌运作的高手持续的颠覆品牌形象。 2.在过去几年,占据高端市场的Soc市场的品牌有苹果,三星和华为,苹果的A系列没有办法挑剔,三星的E系列也是 性能强悍,华为的海思高端系列,三家的Soc在市场上可以PK高通骁龙系列,而联发科为什么在高端持续落败呢? Soc的高端形象在消费者形成印象是通过手机来完成的,而不是Soc研发厂家。 三星从早期骁龙旗舰策略,到推出的骁龙和E系列双旗舰策略,最终也是提高了E系列的高端形象,市场是通过接受 三星的旗舰手机接受了三星的E系列,而不是接受了E系列,再接受三星的旗舰手机; 同样,华为也是,华为将海思旗舰手机同其高端930,990等结合起来,在终端市场的品牌推广上,持续的发力, 砸银子,找明星,当然技术水平和性能跟骁龙不分上下的前提下,最终在高端市场占有一席之地; 联发科没有自有品牌的Soc,手机整机需要小米OV的产品来呈现,连HTC,NOKIA这些老牌厂家不接受,而小米OV的旗舰 机一定是高通骁龙8系列,终端厂家没有自己的Soc,他们没有办法打自己的脸,同时宣传两类高端产品,势必会导致 其品牌宣传的巨大矛盾,早期OV也只做联发科的高端产品,但是高端消费者接受度低,销量证明了一切,主流的终端 厂家还不敢得罪高通,魅族可能是个典型例子。 联发科需要一个很好的出口合作伙伴来深度捆绑冲击高端,对方估计得搞定高通,难度很大。 3.高端手机Soc的同质化,ARM架构下的开发,V7/V8/V9,最终无非是跑分,功耗等参数,旗舰级的SOC都会支持最新的 拍照,内存和计算速度等关键和核心,AI等性能加入也没有从根本上明显改善消费者的体验感。 同质化的产品性能下,最重要的就是拼价格,另外就是拼市场和品牌形象。 如果降价赢取市场,又会走回低端路线和市场,达不到想要的结果,两难。 4.消费者心理影响,我们不能简单的称国人崇洋媚外,美国在计算机和芯片领域积累了多年的专利技术,在高端产品的 开发一直占据着优势地位,而且厂家通过代理,渠道和合作伙伴向消费者灌输了其技术和品牌的高端形象,而这个形象 是很难在短期内颠覆的,观念的改变尤其困难;除非高通自己犯了巨大的错误,哪怕他年年挤牙膏,也很难一下子一落 千丈,像三星发热爆炸的错误,估计概率低之又低。 同样,贸易战打到这地步,我国政府也不敢对高通下手,因为影响太大,联发科的高端之路,只有靠自己合纵连横, 通过改善和继续强化自己的品牌形象,也许可以单独成立高端产品品牌,来冲击高端路线也未尝不可。
  • 热度 6
    2020-7-10 09:33
    4157 次阅读|
    1 个评论
    简谈Intel Lakefield处理器,反攻Arm之策
    谈下这两天 Intel 发布的 Lakefield 处理器。AnandTech 前两天发了一篇长文来解释这颗处理器,这篇文章我扫了一眼,绝对是当今尖端半导体工艺的绝佳科普文,所以我决定做全篇翻译:但因为最近事情太多了,我挖的坑也实在有点多,得往后排。这里我概括一下这篇文章,看不懂的同学可以等全文。 一 首先呢,三星的 Galaxy Book S 笔记本已经开始采用这颗芯片了——日程上的 ThinkPad X1 Fold 和 Surface Neo(去年微软展示的一款 9 寸双屏设备)也有推产品的计划。Lakefield 应该是 Intel 的第一颗异构处理器产品(这里单纯是指 CPU 部分的异构),就是很多人熟知的大小核设计——不过和诸位的理解可能略有些小差异。我觉得这是 Intel 对 Arm 的一个反攻计划。 光看这颗芯片(采用 3D 堆叠技术的一枚 SoC)计算 die(3D 堆叠的最上层)的话,CPU 部分是 5 个核心。1 个“大”核心是 Sunny Cove,就是十代酷睿处理器 Ice Lake 的那个核心;4 个“小”核心就是诸位熟悉的 Atom 凌动处理器(名为 Tremont 的核心)。这两组不同核心的相对性能与功耗关系大致如上图... 如果四个 Tremont 小核全开的话,这个相对关系就会有变化,具体如下图。所以怎么调度,要高效发挥两种核心的效率,其实还是考验功力的;毕竟实际工作中的负载状态,应该是介于上面这张图和下面这张图之间的状态。 和很多人想的不同的是,Intel 自己说 4 个 Atom 处理器核心会负责重负载和并行性能需求,毕竟有 4 个核心;而酷睿大核则是在用户加载应用、触屏操作,或者滚动浏览器的时候会第一时间响应。所以其调度理念跟 Arm 的那种大小核还是不一样的。 二 Lakefield 采用的是 Intel 的 Fevoros 堆叠技术,堆叠技术的优点和缺点这里不谈——其实网上相关的资料已经不少了。也就是说这颗 SoC 叠了几层,顶层是计算 die,其 die shot 如下图,主体上包括了核显和 CPU,用的是 10nm+ 工艺。核显部分其实也是 Ice Lake 类似的设计,不过频率应该会更低——很显然,高通的设计是给 Intel 造成了压力的。 Intel 似乎有提到,其中酷睿大核去掉了 AVX-512 相关的晶体管。上层这片 die 的面积在 82.x mm²,40.5 亿晶体管,13 个金属层... 下层 base die/interposer die 这里就不多说了,参数党应该并不怎么关心,这层的工艺是 22FFL。底层 die 包含一些音频 codec、I/O 资源;另外就是 PoP 封装最最上层堆了一个 DRAM,有 8GB、4GB 可以选配,LPDDR4X-4266......这部分并非来自 Intel...具体是怎么个堆叠关系,如下图... 三 Sunny Cove 大核就不谈了,因为算是很有名了,Ice Lake 的核心——Intel 今年的主要成果,虽然暂时只应用在了 U 系列低压处理器领域。 这里说一说小核心的 Tremont,这是今年新推的 Atom 处理器微架构,乱序设计(光这一点其实就意味着比 Arm 的小核心要更重性能),相比上一代的提升比较大。首先是新的双 3-wide decoder...(酷睿是 5-wide decoder),能够管理双数据流。Intel 说这个设计会比单纯的 6-wide decoder 要效率更高,也可以在设计上有更大的 μop cache(貌似 Atom 没有 μop cache?)... 另外就是 Tremont 核心的 L1-D cache,升级到 32KiB...且延迟未增长;貌似还有新指令... 四 Lakefield 处理器部分可能存在的问题包括,第一是软件层面的。桌面领域的软件,普遍默认现在的处理器都是同构结构的,但现在来了一个大小核设计的处理器,而且两者的指令都有差别,这在很多时候会造成错误。所以在设计上,好像 Intel 做了一些妥协,比如前面提到的,Sunny Cove 移除了 AVX-512 单元,保持两部分核心一些基本的指令支持的一致性(待确认)。 Intel 需要跟微软合作去搞 scheduler 做线程调度,这个工作其实是不容易的,需要考虑的东西也非常多——尤其 1+4 这种在很多场景下要确保体验,存在较大调度难度的设计。不过估计也没什么,因为 Windows on Arm 的经验有一些了,Windows 在 x86 平台可能还有一些先天的基础优势。 有关 1+4 这种搭配方案,在手机领域其实没有多少可借鉴的经验。而且 Intel 之所以这么做,很可能是因为 Sunny Cove 大核心的占地面积太大了,在 82mm² 的 die size 上面塞不下两个大核了。从实际性能考虑,两个大核,可能会是更合理的搭配。所以 Lakefield 的实际性能如何,其实是值得深究的。 五 整体尺寸加周边,比 Intel 以前的板子小了很多,基本上跟现在高通平台的方案差不多,而且还考虑塞 LTE Modem(下图,明摆着就是看 Arm 的那些 Windows 本子很不爽...) 这个处理器具体的 SKU,如下图,大核有更高的睿频;闲时功耗 2-3mW,睡眠模式下总算也有真正的长续航了;产品名称还是在“酷睿”系列之下,也切分 i3/i5; 另:这个产品定位其实是偏高端的,而且设备价格都不会便宜,起码跟骁龙 8cx 同一定位。比如 Surface Book Neo 会用这个处理器。 六 最后说下预期的性能,Intel 公布的成绩是,相比超低压的 Amber Lake i7-8500Y(5W TDP),新结构的单线程性能高 12%(SPEC2006),图形性能高 70%,每瓦性能高 24%;另外,考虑有大核和没大核的设计,Intel 宣称前者比后者的 web 性能高出 33%,效率高出 17%(因为四个小核全开,实际上效率比不上单个大核)... 这些数据其实并不令人意外,因为 Sunny Cove 原本就应该有 IPC 的提升,而且 Lakefiled 相比酷睿超低压,也有 TDP 的一丢丢优势。看起来跟高通骁龙 8cx 打,可能会有点勉强... 而且从 NotebookCheck 已经公开的 Galaxy Book S 的测试结果,Cinebench R15 单线程得分是 88分,比不上酷睿超低压 Amber Lake,这表明在调度上的思路的确跟我们想的不大一样(跟 SPEC2006 测试还不大一样?);多线程测试,也更倾向于让小核心满载,而让大核闲置——表明 Intel 设定可能就是这样,估计也是基于功耗、温度考量。 感觉这样的话,略有点小失望。请等我的全文翻译。
  • 热度 14
    2020-6-15 18:59
    4778 次阅读|
    2 个评论
    聊聊Exynos 990,为什么三星放弃自研CPU?
    我一直都觉得三星 Exynos 还是挺有趣的 SoC:我记得之前翻译 AnandTech 的苹果 A12 和三星 Exynos 9810 评测文章的时候,有句话我印象特别深刻:“采用 M3 核心的三星 Exynos 9810,能耗达到苹果 A11 的两倍,性能却落后了 55%(注意,是 A11)!” 尔后,AnandTech 通过魔改 Exynos 9810 系统层面调度机制的方案,达成了系统性能相较原版的一个显著提升。这些其实都表明,三星在移动 SoC 设计和制造上都可以认为是整体掉队的。所以也不难理解,三星为什么决定放弃自研 CPU 架构。Exynos 990 是三星最后一款采用自研架构的 SoC。 想必很多同学也已经听说了,这次 Exynos 990 相比竞争对手依然有差距的事实。这里我将 AnandTech 的一些评论和测试做了综合,分享给各位。本文的绝大部分数据和内容均来自 AnandTech,若需查看英文原文,可拉至本文末尾。我觉得这篇文章能够非常到位地阐释,为什么三星放弃了自研架构,因为无论从哪个层面来看,其自研架构不仅问题极多,而且还远远及不上 Arm 的架构。 请注意,注意区分本文的几个词汇:能耗 energy,是指跑测试消耗的能量,单位焦耳;功耗(或功率)power,是指单位时间内消耗的能量,单位瓦特;功效 power efficiency,一般是指每瓦性能;能效 energy efficiency,这里特别指每焦耳的性能——这个性能可以是跑的分值,也可以是游戏帧率。 这里需要强调一点,我们日常所说的“能效比”,或者“效率”指的其实是这里的 power efficiency。本文的能效,严格意义上都不是用的这个通俗的意义。 综述 三星 LSI 的这颗旗舰 SoC 是在去年 10 月份宣布推出的:它在 CPU 大核心上采用了三星新一代的 M5 架构;中型规模的核心则升级到了 Cortex-A76;采用新的 Mali-G77 GPU。Exynos 990 采用 7nm LPP 制造,即芯片的某些部分采用 EUV 光刻。 Exynos 9820 这里看一下上一代的 Exynos 9820,,也就是 Galaxy S10 采用的 SoC。以此可了解 Exynos 990 做了怎样的提升和变化。 Exynos 9820 的大核心簇是三星定制的 M4 架构,它跟 Arm 公版架构的差异还是比较大的:从互联到缓存一致性,都采用三星的 Coherent Interconnect。Andrei Frumusanu(AnandTech 著名博士编辑)对这种结构有做核心到核心的延迟测试,起码它比 Arm 公版架构的延迟是要大出很多,当然也比骁龙 865 明显更糟糕。 Exynos 990 Exynos 990 相较 Exynos 9820 的改进其实还是比较多的。首先三星这次终于在小核心上,将 A55 的 L2 cache 推升到了 64KB。要知道 Exynos 9810 和 9820 在这方面就差一截,所以这两款 SoC 相比以前的骁龙 SoC,在效率上就有差距。不过 64KB L2 cache,这个容量仍然只有骁龙 865 的一半(128KB),三星在 Arm 核的 cache 配置上还是比较保守。 中核心从先前的 Arm Cortex-A75 升级到了 A76,频率也有提升,从 2.3GHz 提到了 2.5GHz,基于负载不同性能提升可达 38%-50%,也是 Exynos 990 大部分工作的主要动力来源。中核心的 L2 cache 仍然是每个核心 256KB,共享的 L3 cache 也是比较保守的 1MB。 大核心部分,早前代号为 Cheetah(猎豹)的 M4 这次升级到了代号为 Lion(狮子)的 M5——也就是三星的自研架构。其最高频率仍然是 2.73GHz,三星宣称会有 20% 的提升,应该主要是来自 IPC 提升。 外部可以观察到的最大变化,在于 M5 大核心不再享有各自的 L2 cache,而是 2MB 的核心共享 L2 cache。现如今,这样的微架构设计变化还是比较少见的。这一变化,从核心到核心的延迟降低能看得出来,毕竟这次的缓存一致性是在更低的 cache 层级发生的,和 CPU 也靠的近。 Exynos 990 采用三星 7LPP 工艺制造,部分采用了 EUV 光刻。TechInsights 提到,Exynos 990 是首个采用完整 7LPP PDK(Process Design Kit)设计的芯片,这一点和先前的 Exynos 9825 还是有不同的)。 三星宣称,7LPP 工艺相比之前的 8LPP 有 7% 的性能提升,应该也意味着同频功耗的降低。实际是个什么情况呢?我把 AnandTech 的内容做个概括: 一 Exynos 990 的 binning(可以理解为根据不同的芯片体质,对芯片进行等级分组)看起来是比较糟糕的,而且绝大部分芯片都位列相对较差的体质分组,甚至可能更糟,这表明这颗芯片的良率可能很不理想。 二 M5 的核心电压不是很乐观,不仅在同频下相比上一代 M4(8LPP)没有提升,而且随频率升高还表现更差了。M5 需要更高的电压,才能达到先前相同的频率:同样 2.75GHz 最高频率,M5 的峰值电压为 1118mV,而先前的 M4 为 1068mV。 三 从功耗与效率曲线来看,纵观性能变化周期内,M5 核心显然在效率上弱于 Cortex-A76(同一个 Exynos 990 SoC 上的);Exynos 990 A55 小核心的效率比先前的 Exynos 9820 要理想很多; 四 Exynos 9820 时期,三星引入了一种更为复杂的 scheduler,基于应用跑的 ISA(指令集结构)选择不同的功耗模型。这种机制会分别追踪 32bit 和 64bit app,然后根据不同 CPU 在不同执行模式下的微架构性能和功耗特性,做出调度决策。三星宣称这种机制能够提升效率,更多的工作可能会分派给 Arm 中核心——因为 A76 在 32bit 执行效率上会更好。 从 SPECint2006 的综合成绩来看,其实很难看出这种执行模式有什么大差别。但某些个别的测试子项,比如说 456.hmmer——这是个偏向执行能力的测试,就能看出 A76 核心的优势——A76 核在这个项目的成绩上的确领先于 M5 核。从这个角度来看,三星的调度策略是合理的。 另一个例子是,400.perbench 在 32bit 模式下,A76 核心同样优于 M5 核心,所用功耗还低了超过一半。不过更偏存储性能的负载,M5 在跑分上还是有优势的,这可能与两者的 cache size 差异有关。 AnandTech 在文章中提到,这是 AnandTech 首次针对 AArch32 和 AArch64 两种执行模式,分别公布跑分成绩。 五 在存储延迟测试方面,Exynos 990 相比 Exynos 9820 还是有提升的,但和骁龙 865 比起来却有差距。 下面这几张图是 Exynos 990 M5(大核心)、Exynos 990 A76(中核心)、Exynos 9820 M4,以及骁龙 865 A77(大核心)的存储子系统延迟对比。很显然,相比 Exynos 9820,可以看到 Exynos 990 的 L2 cache 在尺寸上变大。M5 核心当然还是会有一些优势,比如说 3 周期的 L1 延迟设计,Arm 核心都是 4 周期。 去年的 M4 核心其实就存在 TLB 问题(Translation Lookaside Buffer,一种页表的 cache,是一个内存管理单元,用于提升虚拟地址到物理地址转换速度),今年的 M5 这个问题并未得到合理解决。 这会导致一些比较无语的问题,比如说随机访问超过 2MB 的区块,可能还比 1MB 尺寸内的速度更快。相比 L2 cache 区域,L3 的 cache line 访问,TLB 未命中惩罚的访问延迟还更低…(这也可能是 16-64MB 区块内,Exynos 990 弱于 9820 的原因)。 而 A76 核心部分显然就比较符合预期了。A76 的 prefetcher 原本就有比较大的提升,在 Exynos 990 之上也有体现,两个 A76 中核心在某些数据访问模式上是优于 M5 核心的。实际上,三星自 M3 设计以来,在存储子系统方面就有比较大的问题,到 M5 也依旧未能解决。 六 从 SPECint2006 的测试结果来看,Galaxy S20 的两个不同 SoC 版本,骁龙 865 相比 Exynos 990,各方面都有优势。 主要表现在骁龙 865 显然在能效/功效方面有着比较大的提升。 早前 Arm 曾表示,A77 核心相比 A76 会在性能上有进步,但两者的功效(energy efficiency)其实是差不多的——也就意味着 A77 需要以功耗换性能。但骁龙 865 则显然超出了 Arm 的预期,不仅使用更少能耗(energy),而且功耗(power)也更低。 这可能和骁龙 865 相比上一代改用台积电 N7P 工艺有关,这或许表明 N7P 工艺相比 N7 的确有显著提升。 Exynos 990 相比上一代当然也有性能提升,但肯定比不上骁龙的步子。其中有一些成绩比较诡异,比如说 403.gcc 的成绩还不如上一代。更悲伤的是功耗(power)和能耗(energy)。Exynos 990 的能耗其实跟 Exynos 9820 很相近,有时略好,有时又略差。但在有性能提升的情况下,功耗却也明显发生了飙升。 其实功耗高,有时问题也不算大,只要能换得所需的性能即可,苹果即是个中翘楚——至少能效比是不错的,而峰值性能对于提升体验也是有帮助的。但这并不适用于 Exynos 990,因为 Exynos 990 显然性能也并不怎么样。 SPECfp2006 测试情况类似,虽然 Exynos 990 的性能有提升,但却是以高很多的功耗换来的——这个代价其实是得不偿失的。某些测试,比如 447.dealII 和 470.lbm,在能效(energy efficiency)方面甚至还有 30-40% 的倒退。也有好的一面,433.milc 这个子项,M5 的成绩比 M4 提升超过一倍,但功耗也就提升 50%。 在整数测试的综合成绩中,Exynos 990 相比 Exynos 9820 有 17% 的性能提升;浮点测试综合成绩,则有 36% 的提升。但 Exynos 990 相较骁龙 865,在这两个大项上仍然分别落后了 11% 和 3%。 绝对性能可能还不是什么大问题,悲剧的其实主要是能耗(energy)问题。 Exynos 990 付出了双倍的能耗,性能却还略弱于骁龙 865! 六 很多同学可能会想,三星的 7LPP 工艺是不是严重不给力。有个对比对象,高通骁龙 765G 用的就是三星 7LPP 工艺。骁龙 765G 的 A76 核心频率 2.4GHz,而 Exynos 990 中核心的 A76 频率是 2.5GHz。这两者的性能和能耗非常相近,都明显弱于台积电造的 A76 SoC(尤其是 Kirin 990)。 可见三星 7LPP 的确不如台积电的 N7/N7P/N7+ 工艺,AnandTech 给的数据是,在功耗表现上差距可能达到了 20%-30%。 七 不过就算把 7LPP 的差距算上,三星 M5 核心依然被 A77 核心远远甩在身后。Frumusanu 说,虽然没有看到骁龙 865 和 Exynos 990 的 die shot,不过他认为 M5 核心在面积上至少比 A77 大了 3 倍。 综合来说,Exynos 990 相比骁龙 865,效率差 2 倍,性能差 10%,PPA 总体就差了 6-7 倍。 八 在 AI 方面,三星宣称 Exynos 990 的 AI 性能为 10 TOPS,综合了 NPU 和 DSP。理论上,Mali G77 应该也是可以参与 AI 运算的。这其实一直也不是三星的长项。不过 Exynos 990 相比前代在 AI 算力上的提升很大。 从 AnandTech 的测试结果来看,NNAPI 的 INT8 测试,骁龙 865 更强。不过这一点其实仍有待商榷,因为它和软件层面关联很大,Frumusanu 也认为三星很有可能面向 NNAPI 时只给了 GPU 资源。在 NNAPI FP16 这样的测试里,Mali G77 就有优势;FP32 测试,Exynos 990 也表现很好。总体上,AI 性能这部分,Exynos 990 表现是十分出色的。 九 GPU 部分,这个其实也是我个人一直想要去仔细看一看的。Exynos 990 应该是首款采用 Mali G77 GPU 的 SoC(也可能是天玑?),而且也是首款采用 Valhall 架构的 GPU。去年我写移动 GPU 对比的时候有提到,Mali G77 很可能会在性能上实现对 Adreno 阵营的反超。 Exynos 990 在 GPU 方面选择了 11 个核心的 Mali G77,频率提升到 800MHz,电压也随之提高了。由于 Exynos 990 也支持了 LPDDR5,图形计算面对 3D 渲染这类带宽要求比较高的工作时,理论上会有更高的效率。 十 GPU 性能测试,除了骁龙 865 版 Galaxy S20 Ultra 在 3DMark Sling Shot 3.1 Extreme Unlimited - Graphics 的测试中,有作弊的嫌疑,这里就不放出具体成绩了。后续测试则极大程度免除了作弊问题,所以我们着重看一些图形测试的子项。 峰值性能上,Exynos 990 和骁龙 865 比较接近,但持续性能前者就会明显比较弱了。这里面不知道有没有系统散热设计的锅,但这是基于同一个散热设计。Basemark GPU 1.2 测试里,Galaxy S20 Ultra 骁龙 865 版的图形性能,持续状态也只损失了峰值性能的 22%。而 Galaxy S20+ 的 Exynos 990 版则在持续性能上还比不过上一代的 Galaxy S10+。 但这里面的温控机制其实也很迷,Galaxy S20 Ultra 的 Exynos 990 在持续性能上表现最糟糕——还比不上 S20+,可能应该从其他层面来找问题根源。 GFXBench 图形测试绝对性能的情况也类似,骁龙 865 和 Exynos 990 的图形计算峰值性能差不多,而 Exynos 990 显然没办法持续稳定,很快因为温控而产生性能较大程度的滑坡,其实这个滑坡幅度比 Exynos 9820 还要大。 而这项测试的功效(power efficiency)表现,也是今年高通 Adreno 被盛赞的一个点,即 Adreno 650 的效率跨越甚大,虽然绝对性能比不上苹果,但效率已经追上苹果 A13 了。至于 Exynos 990,情况就比较悲剧——尤其跟进步这么大的 Adreno 比起来,实在是有点拿不出手。我觉得光从每瓦帧率来看,情况还算不上太糟,Aztec Ruins - Normal - Offscreen 测试,骁龙 865 比 Exynos 990 有 35% 的效率优势。 Manhattan 3.1 与 T-Rex 测试也比较类似, Exynos 990 的 Mali G77 都可以用悲惨来形容,持续性能都只有峰值性能的一半,而且功耗还很高,甚至要高于上一代。 整体来说,Exynos 990 的图形性能似乎和上一代 Exynos 9820 一个水平。三星可能是有意抬高 Mali GPU 的频率,令峰值性能可与高通的 Adreno 差不多,但代价就是高得多的功耗和悲惨的持续性能。其实上面的表格中有出现联发科的天玑 1000L,都是 Mali G77,它的表现是好于 Exynos 990 的。 十一 续航测试部分,其实也没什么意外吧。Exynos 990 与骁龙 865 版本续航的差距大约在 10-13%,是大于三星、高通上一代的差距的。 这里我没有加入 AnandTech 的系统性能测试,有兴趣的可以去看一看 AnandTech 测试全文。不过我觉得,涉及到堆了很多软件的整个系统,则三星肯定会有意削弱两者的这种差距(虽然续航的差距还是无法避免)。 其实从上面的很多点滴都不难发现,三星不存在任何继续自研 CPU 架构的必要性(尤其传说 M6 还支持超线程),因为问题太多了。而且在某些决策上,三星 LSI 自己都没有对于 M5 核心的信心,比如针对 32 位、64 位不同 app 的 scheduler 机制;以及缓存方面的决策。 但我觉得,放弃自研核心,就爱好者的角度,仍然是件值得惋惜的事情。这样一来,移动 SoC 主战场上,自研 CPU 架构,也就剩苹果一人了。 阅读原文: The Samsung Galaxy S20+, S20 Ultra Exynos & Snapdragon Review: Megalomania Devices - AnandTech Samsung Galaxy S20+ & Ultra (Snapdragon & Exynos) Battery Life Preview - AnandTech
相关资源