tag 标签: amd

相关博文
  • 热度 3
    2022-8-21 11:05
    4299 次阅读|
    1 个评论
    英特尔的机遇与风险
    2022年, 美国当地时间 7月29日周五,半导体行业发生了一件颇具标志性意义的事件,即Intel的股票市值被AMD所超越。在周五股市收盘后,Intel市值为1480亿美元,而AMD为1530亿美元。 霎时间,媒体中各种雷人的标题“弱爆了”“亏麻了”铺天盖地,唯恐天下不乱。 Intel无论从市场表现,技术表现都是优秀的,只是财务出现短暂的困难,让竞争对手开始慢慢蚕食市场。其整体表现符合大部分人对优秀企业的评价, 只是作为一家志在全球市场长期占据龙头和领导者地位的目标,Intel离开这个目标越来越远。 就像美国继续称霸世界,已经力不从心,但是美国作为世界最强的大国完全是没有任何问题。 一、 CCG业务和DCAI业务:CPU市场 CCG业务1:Intel笔记本处理器从2019年83%下降为73%,从中长期来看,ARM的份额会有继续增长的空间;AMD增长的空间应该不大,除非Intel的下一代处理器的制程工艺继续拉跨。 CCG业务2:Intel桌面电脑处理器从全球市场来看,长期稳定在80%左右,从中长期来看ARM低功耗完全不占任何优势,AMD也无法实现更高级别的市场突破。 DCAI业务:Intel 服务器CPU从最高位的96%下滑到目前的89%,其中大部分的市场被AMD抢占,但是从整体格局看Intel依然占据着绝对统治地位。8月份Intel可以逆势涨价,无疑是向外界继续宣告统治地位。在服务器CPU中最大的变数是来自CSP厂商的ARM自研CPU,目前亚马逊的graviton3已经发布;阿里发布自研 CPU 芯片倚天 710 ;微软在2020年底也开始推进自研ARM CPU;Ampere,高通,以及国内的鲲鹏和飞腾都在推动ARM去同X86竞争,未来的市场 格局是存在一定的变数的。 二、 AXG业务:GPU市场: Jon Peddie Research发布了最新的GPU市场数据统计报告,显示2022年 Q1 PC使用的GPU出货量(包括集成和独立显卡)为9600万,环比下降了6.2%,同比下降了19%。 在2022年 Q1 中, GPU和PC的整体连接率(包括集成和独立显卡、台式机、笔记本电脑和工作站)为129%,环比增长5%;桌面独立显卡出货量环比增长1.4%;2022年第一季度PC使用的GPU出货量中,AMD出货量下降了1.5%,英特尔出货量下降8.7%,英伟达出货量增长3.2%。 从数据上看,出货量减少似乎主要来自OEM厂商的机器,特别是笔记本电脑。 在整个市场上, Intel依然是当之无愧的领导者,当然在独立GPU和数据中心GPU上,英伟达是绝对的领先者,AMD也是领先于Intel的市场。Intel也开始利用在CPU市场的优势地位,开始对独立GPU和加速计算GPU进行了市场争夺,从当前的市场格局看,难度很大。 三、 Mobileye:自动驾驶ADAS市场 依据中信证券的数据,在汽车 ADAS市场里,Intel的Mobileye占据了70%的市场份额,依旧占据着领先地位,虽然其主要市场集中在L1/L2的市场,但开始在L3市场开始发力,提升市场占有比例。其竞争对手里面英伟达和高通虽然也在积极抢占市场,短期依然无法撼动Intel的领导地位。 四、 IFS业务:晶圆代工市场和技术 首先看晶圆代工市场,台积电是处于半垄断式的技术领先地位,市场占比 51.6%,三星市场占比17.1%,联华电子6.9%,格芯6%,中芯国际4.9%,从市场占比来看台积电完全是碾压级的,确实没INTEL什么事。 其次看晶圆代工工艺技术情况,台积电和三星都开始试产 3nm,但是台积电的技术和良率要更领先三星,处于第一梯队;第二梯队的就是Intel的7nm,但是一直未能量产,处于研发和试产中;第三梯队的就是格芯和中芯国际,在14nm徘徊。 Intel清楚的定位了自己在行业地位,其集中资源在模拟IC和汽车半导体等高端业务争取一部分市场,其中收购高塔,成立汽车半导体代工部门就是其关键的举措。 最后, Intel是IDM的半导体工厂,其在晶圆代工存在的最主要意义不是为占有多少的市场份额,而是需要去保持技术的领先地位跟其半导体设计的CPU,GPU和FPGA等可以在自己的工厂生产并稳定供货客户。而目前Intel目前面临最大的问题就是其CPU产品由于制程研发的滞后性,全面拖累了IC设计研发的进度,从而面临着CPU技术能力落后死对手AMD的情况。AMD也是很好的利用了Intel垂直整合策略中的“木桶效应”,抓住战略机遇期,在市场上取得了不少战果。同样,Intel也因为在制造工艺上的落后,被大客户苹果给抛弃,遭遇了重大损失。 综合市场和技术的数据分析, Intel整体的市场份额和技术水平都是处于领先地位,基辛格的IDM 2.0从宏观上具备理论上的可行性。 一. 财务上进行开源:出售非核心的存储业务,并推动自动驾驶上市。 2020年10月20日 ,英特尔与SK海力士宣布签署收购协议 : SK海力士将以90亿美元收购英特尔的NAND闪存及存储业务。 2022年7月, 英特尔确认将逐步结束 Optane(傲腾)存储业务,不再开发新产品 。 2021年12月,Intel就宣布推动mobileye于2022年年中上市,截止目前,暂时还没有得到相关上市消息。 二. 技术上寻求芯片制造技术领先:提升晶圆代工能力 首先, 2022年2月15日晚间,英特尔宣布将以54亿美元收购以色列半导体代工厂高塔半导体,提升在晶圆代工的业务范围,扩张到汽车和模拟芯片领域。 其次,英特尔已计划把部分芯片外包给台积电,后者将于 2022年下半年给英特尔打造3nm芯片。近期台积电反馈出来的信息是量产时间推迟到2023年,其中合作存在变数,反应英特尔内部对于制造外包存在不一致的声音,也就是利益考量的犹豫不决。 再次,就是拓展晶圆代工客户,英特尔 7/25宣布,获得联发科投片于旗下晶圆代工服务IntelFoundry Services的先进制程制造晶片。联发科则强调,此次将投片于英特尔为成熟制程,为Intel16制程 。 最后,利用美国芯片法案的资金,迅速提升在半导体制造领域的技术和产能,确保核心业务整体的领先优势。 从财务角度来看,收购高塔和引入联发科,是为晶圆代工业务增加收入,而非 Intel终极目标是发展成熟的制造工艺,目前INTEL晶圆代工业务营收1.22美元,7nm先进制程工厂投资需要100亿美元,2nm预计是340亿美元,如果intel的代工业务依靠其他事业部的利润和股市融资,自身部门无法获取利润,是无法通过华尔街投资者的同意的,也肯定导致内部部门间的斗争。美国当下的芯片法案可以说是给INTEL“雪中送炭”,不过钱不一定够用。 英特尔虽然在当下的市场竞争中面临着巨大的压力,但在大盘上看其依然掌握着市场和技术的主动权,新任高管也顶住内部利益集团的七嘴八舌,进行了大刀阔斧的变革,行还是不行,都需要时间,毕竟实践才是检验真理的唯一标准。
  • 热度 7
    2020-10-15 09:55
    4454 次阅读|
    0 个评论
    配图来自Canva 近日,AMD Zen 3桌面端处理器正式发布,算是把Intel、AMD、NVIDIA三大通用芯片巨头近几年的激烈角逐推向了一个高潮。 如今Zen 3处理器正式发布,从纸面参数上来看,Zen 3桌面端CPU已经实现了对Intel十代酷睿的超越。而在GPU市场中,AMD同时也对NVIDIA的霸权构成了巨大威胁,于是9月初发布的RTX3000系列,让我们罕见的看到了NVIDIA在高端显卡上的性价比。 AMD明显已经让CPU霸主Intel和GPU霸主NVIDIA都感受到了巨大的压力。那么在通用芯片领域,AMD究竟能掀起多大的变化就成了一个很值得探讨的问题。 AMD较Intel优势更加明显 Zen 3处理器的发布,让AMD较Intel的优势进一步凸显。 AMD Zen 3在性能方面的进步非常显著。Zen 3重新调整了CCX与核心布局、缓存体系,再次显著提升了IPC和最高加速频率,相比上一代IPC有19%的显著提升,最高加速频率从4.7GHz提升到了4.9GHz。对比Intel,在多核性能方面AMD的优势继续得到巩固,在单核性能表现上,AMD进一步缩小了和Intel的差距。 AMD Zen 3的性能提升已经足够令人感到振奋,但真正令人惊喜的是AMD在能效方面的巨大进步。Zen 3是Zen、Zen+、Zen 2之后的第三代新架构,尽管依然采用了和Zen 2相同的台积电7nm工艺,但相比初代Zen架构,Zen 3架构实现了每瓦性能2.4倍的大幅提升,把热设计功耗保持在了105W。对比Intel,据AMD官方介绍,采用Zen 3架构的新款锐龙9处理器能效比是i9-10900K的2.8倍。 从实际体验来看,基于Zen 3架构的全新一代AMD锐龙5000系列桌面级处理器在重度工作负载方面或将占据领先地位,其中AMD锐龙9 5900X处理器和上代产品相比,在选定游戏中性能提升高达26%。 性能显著提升、能效比优势进一步凸显,重度工作负载和游戏表现大幅提升。AMD Zen 3的这些优异表现,都建立在7nm工艺的基础上。 说到底,AMD相对Intel最大的优势,就是率先采用了台积电7nm先进工艺制程。Intel的桌面级处理器,无论是今年4月发布的10代酷睿Comet Lake,还是明年一季度将要发布的11代酷睿Rocket Lake采用的依然都是Intel的14nm工艺。 所以现在CPU市场的情况,简单来讲就是AMD在台积电先进制程工艺平台上有了更好的表现,这使得AMD彻底发挥出先进制程的优势,并以这种领先优势不断动摇Intel在CPU市场的长期霸权。 AMD对NVIDIA构成巨大威胁 GPU市场的情况和CPU市场有些类似。在过去的近20年中,和Intel一样,NVIDIA同样逐渐在全球GPU市场中建立起了牢不可破的霸权。到了现在,NVIDIA同样需要面临AMD凭借先进制程工艺发起的挑战。 2000年之后,全球GPU市场中只剩下NVIDIA和AMD两个玩家,AMD也只在2004-2005年市场份额短暂超过NVIDIA,其余时间NVIDIA一直相对AMD保持着巨大的优势。数据显示,在2018年第四季度,两者的差距扩大到了极致,在当时的GPU市场中,NVIDIA份额超过81%,而AMD的市场份额只有19%。 绝对的市场主导地位,让NVIDIA直接把RTX2000系列的高端消费级显卡卖到了上万元。然而到了2019年,AMD率先推出全球首款7nm游戏显卡AMD Radeon™ Ⅶ,一举扭转了局势。2019年的GPU市场,AMD的份额上涨了近10个百分点,相应的NVIDIA的市场份额下降了近10个百分点,2020年这个趋势仍在持续。 为了应对AMD的先进制程工艺挑战,在今年9月1日,NVIDIA正式发布基于全新Ampere架构GPU的GeForce RTX 30系列显卡。新一代的Ampere GPU在性能和特性上有着飞跃式的进步。在制程工艺方面,也从台积电的12nm特色工艺变成了三星8nm特色工艺,而在价格方面,NVIDIA更是作出了令人吃惊的让步。 举例来说,传统性能方面RTX 3080能超越上代旗舰显卡RTX 2080 Ti 28%左右,而且首发价格差不多只有RTX 2080ti的一半。 NVIDIA之所以突然变得如此具有“性价比”显然并不是因为“良心发现”,而是受到了AMD实实在在的市场威胁。 在AMD近日处理器发布会的最后阶段,AMD还披露了新显卡的一些信息,苏姿丰博士在会上表示,RX 6000系列Big Navi将是AMD打造的性能最强的游戏GPU,这无疑是AMD在显卡市场吹响了又一轮向NVIDIA发起进攻的冲锋号。 背后的晶圆代工暗战 从苏姿丰博士2014年10月上任AMD CEO到2019年的5年里,AMD在CPU和GPU市场双线作战,2019年同时在两大市场双双丰收。AMD的这一波逆袭,被称为“硅谷最伟大的卷土重来之一”。 不容忽视的是,AMD的“卷土重来”建立在先进制程工艺的基础上。更确切地讲,正式配合台积电先进制程工艺不断革新架构,才有了AMD近年来在通用芯片市场的巨大成功。 同样的,Intel和NVIDIA的市场霸权之所以被AMD动摇,最根本的原因也是因为他们在先进制程方面的相对保守。 Intel在先进制程方面的落后,归根结底是因为其所坚持的IDM模式,被台积电的Foundry模式所超越。而NVIDIA在先进制程方面的保守,则是因为NVIDIA在市场中的巨大成功,令其缺乏更新制程工艺的动力。 如今AMD凭借先进制程工艺“卷土重来”,引发了通用芯片巨头们在先进制程工艺领域的“鲶鱼效应”。现在无论是NVIDIA抑或是Intel都明显加快了各自在先进制程工艺领域的布局,NVIDIA联合起了三星半导体,而Intel则加快了其10nm生产线建设。 所以通用芯片巨头间的这些明争暗斗,其实也对全球晶圆代工行业产生了显著影响。当然,这些通用芯片巨头间的争斗,和中国同样也有紧密的联系。 国产芯任重道远 目前来看,虽然Intel、AMD和NVIDIA都是三家美国企业,但对他们之间的竞争态势,我们却不能只是看热闹。 一方面,我们目前无法摆脱对这些通用芯片巨头的依赖。 无论是CPU还是GPU,目前全球也只有这三家公司能够设计生产,国产自研芯片虽然有了一些成果并且已经可以投入市场,比如说龙芯、兆芯的一些产品已经可用,但想要做到完全替代Intel、AMD和NVIDIA的产品,目前还并不现实。 而这些通用芯片除了应用于消费级市场,用在台式机电脑和笔记本电脑上,还被大规模的应用于服务器中。更进一步说,其实目前蓬勃发展的云计算技术,就需要大量的服务器支持,并不能摆脱对Intel、AMD和NVIDIA这些通用芯片巨头的依赖。 另一方面,这些通用芯片巨头早已不是单纯只做通用芯片。 Intel、AMD和NVIDIA三大通用芯片巨头固然是做CPU、GPU这类通用芯片起家的,目前主要做得也还是这些,但却绝不局限于此。 Intel从2014年就开始做AI芯片,目前其AI芯片发展已经进入成熟阶段。除了自研基于CPU、GPU的AI芯片外,还收购了Moviduis、Nervana及Habana等AI芯片公司。AMD在AI芯片方面同样也在努力进取。 NVIDIA的GPU之前被大量应用于人工智能计算,目前NVIDIA无论硬件、抑或软件算法在人工智能领域都颇为领先。除此之外,NVIDIA近期努力推进收购ARM的事项,一旦NVIDIA完成对ARM的收购,那么国产自研基于ARM指令集的芯片都会大受影响。 总之,我们既没有摆脱对这些通用芯片巨头的依赖,Intel、AMD和NVIDIA三巨头的影响力又不仅限于通用芯片。三巨头之间的大战,最后终将对我国产生直接影响。而要想摆脱这种局面,归根结底还是需要国产芯片、国产半导体产业尽快发展。 文/刘旷公众号,ID:liukuang110
  • 热度 30
    2020-9-22 10:38
    1620 次阅读|
    0 个评论
    禁令后,AMD首获对华为供货许可,华为Mate 40即将到来
    9月15日,在经过了120天的缓冲后,美国5月15日发布的相关禁令正式生效。 当时,来自证券时报的消息称,台积电已停止为华为代工生产麒麟芯片,高通、三星及SK海力士、美光等都将不再供应芯片给华为。来自华为产业链的消息则显示,华为目前没有B计划。 在这种情况下,华为的未来发展再次引起了大家的关注,产品供货问题成为了一个热议话题。 来自外媒的报道提到, 美国处理器巨头AMD宣布,该公司已经获得了对华为的供货许可。 据悉,这一消息由AMD高级副总裁Forrest Norrod在德银技术大会上宣布,并表示,预计不会因为这些措施而对AMD的业务产生重大影响。 而 这也是自相关禁令正式生效后,第一家公开声明已获得许可的公司。也就是说,AMD将恢复与华为的业务,接下来华为的相关业务也可以继续推进。 此外,英特尔、美光科技、三星、SK海力士、台积电、联发科以及中芯国际等都透露过,他们已经向美国商务部提交了许可证申请,以继续向华为供货。 这些厂商的申请是否会通过,目前还没有明确的消息回应。不过部分申请方与业界专家认为,申请通过的可能性不高。且相关消息显示,由于程序复杂,审批时间或许会达到8个月甚至1年。 与此同时,由于现有情况的不确定性也对华为的手机销售造成了一定的影响。 来自路透社的消息提到,过去一个月,华强北华为新手机和二手手机的价格稳步上涨,平均上涨约400 - 500元。还有一位卖家表示,华为旗舰产品Mate 30的保时捷设计版售价也从1月份时的10000元上涨到了14000 元。 同样,来自新京报贝壳财经的消息也提到,华为Mate 30 5G的价格涨幅达到620元,华为P40 Pro的涨幅也达到了300元。 而关于价格上涨的原因,报道显示,代理商普遍认为是与华为的芯片缺货有关,不过近日价格已有所回落。 此外,鉴于目前的情况,华为推出的机型处理器搭载也令人关注。 今年4月,华为发布了新一代的华为nova7 SE,其核心搭载了华为自研的麒麟820 5G SoC芯片。不过最近有消息称,华为正在准备一款换装了联发科处理器的新版本华为nova7 SE。 现在,一款型号为 CND-AN00 的华为新机通过了入网认证,相关推测认为其就是华为nova7 SE的新版本。 根据介绍,这款新版本的华为nova7 SE仅进行了核心处理器调整,将麒麟820换成了主频2.4GHz的天玑800U。与之相对应的,调整过后的华为nova7 SE新版本定价也会更低一些。 但将麒麟820更换为天玑800U也就意味着,4个高频A76换成2个高频A76,6核G57换成3核G57。这样的调整方案,不知道最终将如何进行机型定位? 其实,对于华为旗下机型,目前外界的关注重点主要集中在新一代华为Mate 40系列上。虽然其正式的发布时间还未公布,但相关消息却并不少。 继余承东在HDC 2020大会个人日志视频中表示,华为Mate 40系列还需要“再等一等,一切都会如期而至”后,华为的海外官方账号也进行了预热宣传。 消息显示,华为的海外账号发布消息称:我们为您带来了一个令人振奋的消息,下一代华为Mate即将推出,敬请期待。 基于此可以确定,全新一代华为Mate 40系列仍旧会兼顾到海外市场,且距离正式到来应该已经不远了。 除此之外,相关报道还显示,华为Mate 40 Pro已经获得了NBTC认证、EEC认证,还现身了Bluetooth Launch Studio。 基于这些信息来看,华为正在进行新品推出前的准备,而这也意味着大家期待已久的新机系列快要来了。 此外,相关报道还表示,将在华为Mate系列上搭载的麒麟9000芯片将是业界第一款5nm 5G Soc。与苹果最新发布的A14仿生芯片不同,麒麟9000是直接将5G基带集成到了芯片中。 而就现有消息而言,华为Mate 40系列已经曝光了大致的版本定位、参数规格、外观设计等信息,其中无论是“瀑布屏”的延续,还是首发搭载的麒麟9000芯片,都吸引着不少用户的目光。 此外,一款华为旗下的专利设计也于近日现身网络。 结合渲染图可见,这款专利设计采用了完整全面屏设计,且机身四周并没有可以用来放置弹出式镜头模块的开口,据此推测其应该会应用屏下摄像头技术。 同时,其机身后置了四摄组合,四颗摄像头呈“十”字状环绕着闪光灯排列,且整体模块位置有着不同的方案。 基于这一专利其实可以看出,华为的新机研发思路正在把屏下摄像头技术加入其中。而这也就意味着,随着技术的成熟,接下来大家也可以期待一下华为的屏下摄像头新机了。 来源:科技美学 * *有采购芯片需求(样板可售),详情联系芯广场公众号。
  • 热度 7
    2020-8-8 03:04
    7129 次阅读|
    1 个评论
    PS5游戏机:AMD秒杀英伟达的开始
    这篇文章主要是给大家推荐一个视频,提供一个思路——视频在本文末尾,不过看我的这篇文章也够了。这则视频的很多内容,其实是值得商榷的(尤其制作视频的这位 Coreteks 大嘴真的是什么都说得出来)。这个视频的信息量巨大,我觉得非常有意思,所以这里分享给各位。只不过看的时候,注意很多内容别当真。 这则视频的主题是: 从 PlayStation 5 游戏机,看索尼和 AMD 改变游戏行业的杀招,以及英伟达的水深火热 (我瞎说的)... Coreteks 这个人我关注已经两周了,他大部分视频都体现了同一个思路,就是将来的处理器都要融合到一起,一切都要融合到一起,CPU、GPU、内存什么乱七八糟的全部都可能放到同一颗芯片上。(而且不是异构那么简单,而是彻底从架构上去颠覆,对这一点我就已经很不同意了,不过这是背景) 不过他在近一年的视频里,都讲对了数字芯片的一个共识。那就是处理器现在性能提不上去了,所以需要依赖各种专用硬件单元(或专用核心、专用处理器)来提升性能和效率——靠 CPU 或者 GPU 的通用单元是不行的,因为通用单元发展到现在已经极限了。所以我们要做专用单元,一个专用单元就只能做一件事情(或某几件事),虽然可能有浪费,但执行这一件事的时候效率奇高啊。 这一点是本身现在就在发生的过程,不管是哪个层面的专用。而且历史上一直就存在的,比如 CPU 的扩展指令集——或 GPU 早年就是一种极为专用的 ASIC 图形处理器——只不过这些年的这个趋势越来越激进。比如 Intel 对于 CPU 在机器学习算力上的执著(其实 Arm 也在搞)...比如英伟达在光线追踪方面 RT 专用核心的执著...比如谷歌为 Pixel 手机开发的专用影像处理核心...比如谷歌用脉动阵列做的 TPU... 对于这种“专用”的理念转变,可能是多层级多方位的...在提升性能以外,它势必造成一定程度的浪费,比如你买 Pixel 手机可能根本就不拍照,那这个专用影像处理器对你而言就多花了钱;比如你买来 Intel 处理器的 PC,就只用来上上网,那显然像 AVX512 这种指令对你来说没有半毛钱用处。这是一定的...但你不能说这种趋势不对。 Coreteks 的这则视频是从 PS5 的整体架构着手的...网上对 PS5 的骂声一大片,主要是觉得其用力的点完全不对,包括对于变频这种设计在游戏主机上的应用感到匪夷所思;包括 SSD 可能带来昂贵的售价,以及算力参数上不及 Xbox...我觉得,这可能表现出,索尼在实现目标过程中,具体实施方案可能做得没有那么理想(或者无法那么理想)... 如果撇开 CPU 不谈(两台游戏机都是 Zen 2,频率略有差别)。GPU 部分,(似)已公开数据显示,PS5 是 36CU(2.25GHz,可变频),标称 10.28 TeraFLOPs 算力;而 Xbox 这边是 52CU(1.825GHz),12 TeraFLOPs。同 GDDR6,Xbox 在其中 10GB 有带宽上的一定优势。Coreteks 认为,这些在最终游戏上,基本不会带来什么大差距。(其实我也这么觉得) 先说个结论,Coreteks 认为,PS5(以及 AMD)将带来的游戏革命,是其他任何平台,包括 PC 都给不了的。下面解释: 1. Coreteks 认为,Xbox 和 PS5 的主要差别在 I/O 层面(指数据与通信):Xbox 的数据压缩速率在 4.8GB/s,PS5 则为 8-9GB/s——"In my opinion, Sony has won the console war right here." SSD 与存储子系统的低延迟、高带宽,是 PS5 的主要特性(这原本也算是 RDNA 着眼的,以及 RDNA2 要加强的,虽然我觉得怎么看都是一个普通理念啊喂)... 2. 事实上,英伟达 Turing 架构的主要优势之一,也是低延迟、高带宽。英伟达的 RTX 显卡有两种加速器用于加速光追——这是现在大部分人都知道的了,RT core 和 tensor core;另外针对高带宽,还有两个比较重要的专用单元,一个用于压缩内存中的数据,一个用于解压——以此,数据可以更快地访问到。这一次 PS5 也是类似的增带宽思路... 当代处理器的很大一部分瓶颈就是带宽或者通信,而非单纯的计算部分;计算单元数量并不能反映实际性能。英伟达去年在莱斯大学的一次演讲中提到: Accelerator Design is Guided by Cost. Arithmetic is Free (particularly low-precision) Memory is expensive. Communication is prohibitively expensive. 这里的"cost"指的主要是芯片功耗上的开销,"free"和"expensive"也是这个意思。即算术是极低开销,存储代价很大,通信代价非常大... 我自己觉得,这的确是现在不少专用处理器(如 GPU、AI 处理器)的一个现状。所以 Graphcore 造的 IPU(一种 AI 处理器),就是在疯狂堆片上 SRAM,大量提升本地存储容量(IPU 二代是 900MB 的片上 SRAM),以及百倍提升带宽。 至于真正到执行单元,低精度的数学运算,真的都不是个事儿:算术的功耗,跟通信的功耗,那就不是一个数量级。(如上图,这个数据可能是有问题的,但各操作间的比例应该是这么回事吧,用以表现从 DRAM 读取 32bit 数据耗费远高于运算的能量) 英伟达首席科学家 William Dally 在 2019 年曾经说过,"Accessing even a small memory array costs way more than doing an operation. And a lot of what we think of memory cost today is really communication cost." 3. 索尼 PS5 践行的就是上述思路,即一方面用专用计算单元,另一方面大幅提升数据传输带宽(虽然如很多知乎大佬所说,在具体实现上可能是很不理想的),包括高速 SSD(下图)。Coreteks 特别提到,PC 平台难以大规模推行这类方案,因为 PC 毕竟是个开放的平台(PC 平台的游戏需要迁就大众,不能像 PS5 那样搞高带宽需求)。 PS5 本身用了一些专用处理器,专门针对主机,以及游戏负载,某些技术未来也是不会进入 PC 领域的。比如说这次很多人在谈的 DMA 控制器,12 个通道——也是知乎上很多人认为索尼错误决策的一部分,因为这部分可能极大增加成本(上图)。显然 Coreteks 认为,这是加速“通信”与带宽的重要组成部分。 (注:Coreteks 似乎是当年 PS3 的 CELL 处理器的支持者,所以上述表达也不难理解吧。我近期有打算写一篇当年 CELL 处理器的文章...) PS5 专用压缩单元 Kraken,也包含在 SoC 里面,也是专用单元且提升内存带宽的一部分(Xbox 实际上也有,而且 RDNA2 和 Turing 什么的其实都有)。 4. 下图给出了 PS5 完整的 I/O 思路,而且随着时代的推进,越来越多的专用单元会加入进来。(就像苹果的 A 系列 SoC 那样,加入越来越多的专用处理器,分别解决专门的问题——Coreteks 的表达是,A13 Bionic 有超过 40 个专用加速器;在客观数字上我没去了解过,不过其实这一点原本就是趋势) 这张图左下角出现了一个 Coherency Engines(一致性引擎),也算是 PS5 游戏机的 I/O 群体中的另一个重要的专用处理器(或者加速器)了,专门负责跨 CPU 与 GPU 的存储一致性(memory coherency)——这也是 AMD 下一代 APU 的一个重要特性。 Jim Keller 曾经说过这样一段话: "What Graphics need is a really high bandwidth memory system. In the past graphics had its own memory system, and for the CPU and GPU to talk to each other you'd use PCIexpress." "With HSA, we made a memory architecture where CPU and GPU share the memory. So graphics sees memory, CPU sees memory and we can pass pointers between them, we have a common address space." 简单翻译,就是图形计算,需要高带宽的存储系统,以前图形计算有专门的内存系统,CPU 与 GPU 对话用 PCIexpress...而“我们搞了个存储架构,让 CPU 和 GPU 共享存储,两者都能看到内存,我们就能在两者间传递 pointer 了,我们有共同的地址空间。”这是 2014 年 Jim Keller 还在 AMD 构建 Zen 的时候说的。其中提到的 HSA,也就是 heterogeneous system architecture,异构系统架构...HSA 应该是一套规格,让不同的处理器部分做融合的... HSA 规格的首个践行者就是 PS3 的那个“传奇”CELL 处理器,苏妈(Lisa Su)还在 IBM 的时候,也是这规格的重要缔造者。所以 Coreteks 认为,AMD 现在的思路其实和苏妈早年在 IBM 和 Freescale 嵌入式系统和异构计算方面的经历,是有很大关系的。 这种异构融合的思路,则是未来几年 PC 发展首先在游戏机上的一种尝试(虽然我个人真心觉得,难道现在的笔记本和手机处理器不就是这样吗?)——Coreteks 表达比较重要的一点,应该就是一颗芯片解决多种问题...这样一来,PS5 也可以不用过于 bulky(已公布的索尼 PS5 算是 bulky 吗?)...因为索尼在设计上还比较有追求,同时还要控制发热之类的问题。 其实我看 Coreteks 的很多视频,并没有搞清楚他是支持类似 AMD 这样 chiplet 异构的方案,还是颠覆架构去做 monolithic 单 die 方案,因为他似乎对于富士通 A64FX 超算处理器是非常赞赏的;或者他可能最在意的是“通信”部分的高效。 5. 甚至可以认为(coreteks 认为的),AMD 未来的 CPU 很可能会越来越轻 CU 数量,而偏重于频率以及固定功能单元(也就是专用加速单元)... 6. 那么以上这种思路,在游戏机上带来的体验,为什么是将来 PC 给不了呢? (1) 前面我们说到了高带宽的这种诉求,不过知乎上蛮多人提到索尼有“带宽过剩,算力不行”的传统。存储子系统的这种提升,对于开发者而言意味着什么呢? 去年网上出现过一个开发者 demo,用以"showing instantaneous asset streaming",如果没有前文提到的存储一致性(memory coherency)支持,以及超快的 SSD,还有数据解压专用加速器,则完全不可能做到 demo 中演示的样子(具体为什么,我不清楚,各位可以去找一下这个 demo)。这些,正是前面这么多内容提到的 PS5 所专注的方向。 这个 demo“可以实现无缝的开放战争游戏体验,游戏中不会有加载等待画面;画面角色移动速度,甚至可以用来创造一些新的游戏类型,包括开放世界环境的竞速游戏——而且游戏内容元素的数量级可以远超过去的那些游戏;还有过去我们没看到过的游戏类型——比如可能是'画面频繁缩放'的游戏,比如可能是从银河系大画面,极速放大到某个星球,甚至再快速放大到分子级别的画面——在任何一个画面级别,都会有非常牛逼的细节”。 这一点,PC 平台就几乎不大可能实现,起码 PC 平台的 SSD 大部分都不会做到 PS5 的程度。 (2) AMD 去年在 Computex 上做过一个 demo 演示(现在是 3DMarks PCIe 特性测试场景之一),对比的是 Intel Core i9-9900K + 英伟达 RTX 2080 Ti,以及自家的 AMD Ryzen 7 3800X + AMD Radeon RX 5700 Series,如下图。当时的这个演示其实引起了比较大的争议,因为这个演示本质上偏向于高带宽测试,而大家普遍觉得,没有哪个游戏会需要这种场景。 这次 Computex 展会上,AMD 还特别提到了和索尼之间的合作,以及期望革新未来 10 年的游戏。这可能就是索尼游戏主机所真正着力的方向,和未来游戏将要出现的画面——PS5 的带宽也就真正有了用武之地。 PC 享受不到这些游戏,原因同上,毕竟绝大部分 PC 都不会在架构上像 PS5 那样做。 (3) 还有一个 demo,是原本要在 PS4 上发布的一个游戏《觉醒计划(Project Awakening)》,现在放出了一个预告片。预告中的画面可能是即时演算的,比 PS4 游戏画面要好多了。Coreteks 认为,这可能是索尼早前提到的加入了光线追踪效果的一个游戏。 番外. 从微软演示的 Xbox Series X《战争机器 5》来看,4K 60fps 效果基本和 RTX2080 Super + R7 3700X 差不多。但算一下一台游戏机多少钱,而后者光一个英伟达的显卡就多少钱,两者加起来 1040 美元...英伟达这种策略怎么还没有翻车? Coreteks 认为,未来的 APU 可以扫清中低端市场的那些独立 GPU,至于那些硬核玩家,普遍都会转向游戏主机,因为如前文所述,未来很多游戏将是 PC 根本应付不了的,根源在专用处理单元以及带宽差异上。 Coreteks 另外认定,英伟达在这个战局中显得非常被动(说起来英伟达收购 Arm 的话,按照 Coreteks 的说法,做架构变更岂不是可以改变战局?)。Coreteks 为英伟达提了三个建议,其一是“使用硬件加速降低渲染精度”,其二“加强数据本地性·”,其三“加强视觉真实度”。 这部分 Coreteks 其实谈的还是挺悬的,比如第一部分,用硬件加速来降低渲染精度(以节约功耗),而光追也可以用这种方案去做,增加某种类型的硬件,考虑将 FP32 转为 Int8(??有这种操作吗?)... VRS(variable rate shading)就是在精度方面的一项举措,游戏画面背景可以以明显更低的精度去渲染,前景则用高精度渲染,人眼看起来,整体画面其实也没太大差别。还有 advanced culling(前些年有个针对 Turing 架构 Mesh Shaders 的 demo 演示,就提到过这种 advanced bulling)——coreteks 认为会有专用单元来加速这项技术,如果有 3 个固定单元来渲染画面中,不同远近的对象,则针对主要注意力的部分做高精度渲染,而某些部分则完全可以用低精度去搞,又完全不会影响到游戏体验(当然估计会对跑分有影响)。 另外,英伟达还有一个强项,就是 AI 部分,也可以用来降低精度。早前英伟达曾经放出过,把画面中缺失的部分给自动补上的技术,靠的就是 AI(下图)。这种技术或许就可以应用到游戏中去,用以渲染游戏画面中一些无关紧要的对象。 前面提到第二点,“加强数据本地化”,其实就没什么要多说的了。现在的专用芯片制造商,恨不得把片内存储堆到可以把一大堆模型放下的程度,这主要还是个成本的问题。 第三点,“加强视觉真实度”。Coreteks 针对这一点有特别提到,英伟达现在应该再引入一项类似实时光线追踪这样的技术点,但要足够吸引人,实现对竞争对手的绝对技术领先——比如 AMD GPU 的游戏机也实现不了,那就真的炸裂了。可能还是跟 AI 机器学习相关的技术——毕竟这是英伟达投入了很多年、花了很多钱的优势项。 英伟达今年的 GTC2020 有演示在网上放出来,部分内容其实跟游戏关系并没有那么大,但也是图形计算相关的。好像是迪士尼的一个什么电视节目场景,采用虚幻引擎去录制——或者说是一个 AR 现实增强实现,生成虚拟的背景,前景还是拍摄的真人,类似于实时特效,而且随时都可以切换!好像完全看不出破绽,完全高保真,让人觉得,主持人或者演员就是在现场。类似这样的技术,也就可以拍死 AMD 企图构建的上面提到的世界了。 好了,以上大部分内容都出自 Coreteks,有兴趣的去看看这个视频吧,我觉得我基本上已经把他要说的东西传达到位了。这则视频的意淫成分颇多(而且 Coreteks 的绝大部分视频都是在意淫)。如果有事实错误,也欢迎各位指出。事实上,即便存在非常多相当夸张的想法,但我总体上觉得,数字芯片往“专用”化发展,以及企图解决数据与通信问题的方向,可能都是值得思考借鉴的。仅供各位娱乐。 资料来源: Coreteks 推荐阅读: 如何评价现在全网黑PS5的现象? 深度学习的兴起,是通用计算的挽歌?
  • 热度 5
    2020-2-6 17:05
    6766 次阅读|
    5 个评论
    CPU市场正在发生变化,Intel的逆天优势悄然消失
    其实近两年,桌面与笔记本 CPU 市场正在变天。AMD 在 2017 年发布 Zen 架构以后,这种变化就开始了。一方面是从 AMD 的财报,其中的营业利润和毛利率变化非常显著,另一方面是看 CPU 市场份额。 市面上大部分统计机构的市场份额数据实际上都不准确,包括福布斯(Forbes)去年年底宣称 2019Q3 在 PC 处理器市场上,AMD 的份额已经达到 32%——32% 是个什么概念各位知道吗? 从 2007 年往后,AMD 的市场份额一路下跌。直到 2011 年,AMD 还点错技能树,选择 CMT 路线以后,处理器性能开始与 Intel 产生银河系级别的差距。AMD 从那个时候开始就被认为是无力回天的,不同机构的数据显示,AMD 的 PC 处理器市场份额始终徘徊在不到 10%(也有认为是 18% 的)。 可想见 32% 意味着什么呢?至少我觉得,32% 这个数字是靠不住的。另外去年年末,德国最大零售商的数据显示,当季 CPU 销量中,86% 是来自 AMD 的。这个数字就十分恐怖了,但讲真的,零售商渠道的 CPU 主要给的都是 DIY 市场——这部分市场和 PC OEM 市场比起来还是很小一部分。 我最近在写 Intel 和 AMD 的市场分析文章,查数据的时候发现很多媒体提到,AMD 的市场份额如今接近 40%。这个数据的出处应该是一个跑分工具,PassMark。2020Q1 提交给 PassMark 跑分成绩的用户中,接近 40% 的用户用的是 AMD 处理器。但 40% 这个数据仍然有不小的幸存者偏差,就是会去提交跑分成绩的,很大程度上也都是技术爱好者。普通用户谁没事去跑分提交成绩呢? 但这些成绩仍然有不小的参考价值,各位看看 PassMark 给的用户占比的趋势走向(图 1)。它虽然和全局状况仍然有区别,但在趋势上是和全局走势一致的。至少就目前看来,AMD 的 PC 处理器市场正从低迷中彻底走出来。 图 1,来源:PassMark 另外我们观察几个现象: 1. Surface 这类设备开始有 AMD 版,虽然今年的 Surface Laptop 3 的 AMD Zen+ 其实相比 Intel 的 Ice Lake 还是很水的,但 Zen+ 和 Ice Lake 本来就有代差。很多 OEM 厂商跟进了一个型号,有 Intel、AMD 两个版本的操作。 2. Intel 十代酷睿的 Ice Lake 10nm 挺不争气的,主要源于 Intel 的 10nm 还很不成熟;而 AMD 用的是台积电的 7nm 工艺。Intel 10nm 和 TSMC 7nm 可以认为是同代工艺,但后者已经走向成熟了。 3. Intel 这两年来陆陆续续地降价,尤其 AMD Ryzen 3000 发布的时候,Intel 高端产品线立减 50%。这种操作放在以前,可是 Intel 非常不屑的。 4. AMD 在发布 Zen 架构以后,真正抛弃了 CMT,处理器的单线程性能第一次站到了和 Intel 同等高度。以前 Intel 从来不在乎 AMD 处理器无脑堆核心的问题,因为自己太稳了,真正的“i3 秒全家”,要堆你自己去堆吧。但今时不同往日了,这迫使 Intel 不得不也开始堆核心,从八代酷睿开始就已经这样了。 5. Intel 已经两次抢在 AMD 前头开发布会了,而且都是在知道 AMD 的发布会召开时间后抢发。因为 Intel 的计划表太慢了,看看今年 CES 上,AMD 发的 Ryzen Mobile 4000,用在笔记本上的处理器——秒 Intel 的 Ice Lake 根本不是问题;再看看高端产品线,Ryzen 9 3950X,对战 Intel 的十代酷睿 i9,用“白嫖王”的话来说,“Intel Could Take YEARS to Catch Up”,十分的悲伤。所以 Intel 必须抢在 AMD 前面开发布会。 图 2,Intel 与 AMD 历年收益对比 Intel 今年在 PC 处理器市场的日子(甚至服务器处理器市场)不会好过,这真的是十几年难得一见的。不过讲真的,从这两家公司的财报来看,AMD 在 Intel 面前真的就是个小公司(图 2,我整理的两家公司的年度收益对比)。Intel 光是服务器业务的年度收益,就可以买两个 AMD。 对于一个财力雄厚,以及以往市场策略具有教科书级别水准的公司来说,像从前那样再灭一次 AMD,应该也不会是什么问题。但至少现在,Intel 要重视这件事情了。 有关偏市场层面的具体内容可以参见《国际电子商请》3 月刊我写的文章。 偏技术层面的内容则可以参见: PC处理器市场在变天:Intel的王者宝座还能坐多久?
相关资源
  • 所需E币: 0
    时间: 2021-3-25 01:20
    大小: 152.5KB
    上传者: stanleylo2001
    硬件工程师培训教程04CPUAMD阵营
  • 所需E币: 0
    时间: 2021-3-25 01:21
    大小: 108.64KB
    上传者: stanleylo2001
    硬件工程师培训教程13AMD640750芯片组
  • 所需E币: 0
    时间: 2021-3-25 01:31
    大小: 182.92KB
    上传者: stanleylo2001
    硬件工程师培训教程08AMD公司的新款CPU
  • 所需E币: 0
    时间: 2020-12-18 23:08
    大小: 14.8KB
    上传者: samewell
    AMD:已获得对华为供货许可证
  • 所需E币: 5
    时间: 2019-12-27 20:53
    大小: 119.81KB
    上传者: 978461154_qq
    LTC3719低电压、大电流电源满足AMDHammer处理器的电压调节模块的需要,可实现小尺寸高效率的设计。输入输出电容、电感和散热器不再需要使电源成本减少。对于多核CPU的应用,LTC1629可与LTC3719组合使用,使输出的相数最高可达12个,供电电流可达200A。advertisementCostEffective,LowProfile,HighEfficiency42ASupplyPowersAMDHammerProcessors……
  • 所需E币: 4
    时间: 2019-12-27 20:54
    大小: 153.61KB
    上传者: 二不过三
    基于LTC3733的低电压、大电流电源系统满足AMD处理器的电压调节模块的需要,具有3相开关电源和良好的轻负载工作模式,可获得高效率、小面积、低成本解决方案。精准的电流共享提高了热效能和CPU供电的长期可靠性。advertisement3-PhaseLTC3733ProvidesHighPerformancePowerSolutionsforAMDOpteronandAthlon64Processors……
  • 所需E币: 4
    时间: 2019-12-25 12:39
    大小: 2.03KB
    上传者: quw431979_163.com
    AMD、Opera合作开发嵌入式浏览器.……
  • 所需E币: 5
    时间: 2019-12-25 12:37
    大小: 5.86KB
    上传者: 978461154_qq
    片上调试促成Nexus标准的形成……
  • 所需E币: 3
    时间: 2019-12-25 12:38
    大小: 39.25KB
    上传者: 二不过三
    处理器……
  • 所需E币: 3
    时间: 2019-12-25 09:45
    大小: 1.35MB
    上传者: quw431979_163.com
    AMD的高速电路板设计资料,我看过很受益,讲的都是一些基础知识,但是都通过理论加实践,讲的很仔细,例如为什么有的时候滤波电容要一个大电容与与一个小电容并用等等。一会还要上传我整理的HighSpeedBoardDesign中文版希望大家共同进步。程海全ApplicationNotesHigh-SpeedBoardDesignTechniquesINTRODUCTIONThemostimportantfactorinthedesignofmanysystemstodayisspeed.66-MHzthru200-MHzprocessorsarecommon;233and266-MHzprocessorsarebecomingreadilyavailable.Thedemandforhighspeedresultsfrom:a)therequirementthatsystemsperformcomplextasksinatimeframeconsideredcomfortablebyhumans;andb)theabilityofcomponentm……
  • 所需E币: 5
    时间: 2019-12-25 06:00
    大小: 341.14KB
    上传者: givh79_163.com
    AMD驱动……
  • 所需E币: 4
    时间: 2019-12-24 23:00
    大小: 702.56KB
    上传者: 微风DS
    ISL6559EVAL2:VoltageRegulatorDownSolutionforAMDHammerFamilyProcessorsISL6559EVAL2:VoltageRegulatorDownSolutionforAMDHammerFamilyProcessorsApplicationNoteAugust2004AN1137Author:RossO.StaffhorstIntroductionTheIntersilmulti-phasefamilydriverportfoliocontinuestoexpandwithnewselectionstobetterfitourcustomer’sTheAMDHammerfamilymicroprocessorsfea……