tag 标签: Intel

相关帖子
相关博文
  • 热度 2
    2024-10-29 10:34
    145 次阅读|
    0 个评论
    当前使用的QPP版本为23.4,工程在经过多次编译后,发现工程文件夹变得逐渐宏大,几天的时间,发现整个工程大小超过了2G字节。和以前老版本一样,工程建立后经过编译都会生成几个文件夹,其中有个文件夹用来存储数据库,之前版本产生的文件夹名称为”DB“。而最新的QPP会有一个名为DNI的文件夹来替换DB文件夹,存储数据库。 每次编译后,经过仔细研究,发现工程目录变大的根本原因就是DNI会逐渐变大。在Intel的论坛咨询,给出的回复是这是QPP23.3与23.4一个已知的问题,目前无法解决,可能会在未来版本中解决。当前可以通过定期手动方式删除DNI目录下的Sandbox文件夹。 查看DNI文件夹,发现果然在DNI下还有几个文件夹,而大部分容量大小都产生与整个Sandbox文件夹。 下述链接给出了该问题的答案。 https://www.intel.com/content/www/us/en/support/programmable/articles/000098118.html 手动删除,也可以通过TCL脚本来实现,创建一个TCL脚本文件,将下述命令放置在脚本文件中,用实际工程名替换”project_name“ project_open dni::delete_stale_sandboxes project_close 需要清除的时候,执行上述脚本。可以直接在命令行中通过命令“quartus_sh -t ”,或者在Quartus软件中TCL控制台执行此文件。
  • 热度 1
    2024-9-20 18:35
    524 次阅读|
    0 个评论
    有关Lunar Lake的少量信息更新...
    前两周写了一篇有关 Lunar Lake 如何实现低功耗的文章: 谈谈Lunar Lake的低功耗设计:听说x86做不了低功耗? 有读者一笔评论如上,感觉这个总结是比较到位的——虽然我在文章里也没直接提,不过在 ring 总线之外,本质应该也就是跟电源管理有关吧。 这里再给些补充资料,虽然感觉干货也不算多。Hot Chips 上, Chip and Cheese 采访了 Intel ,以下我摘取部分内容做了翻译,方括号里头的是我的屁话: Q:...Lion Cove 核心不带 SMT(超线程)。我们也从行业内的其他人那里听说,要在相同功耗下获得出色性能,SMT 并不是个好方法。所以为什么会取消 SMT,是否的确如他们所说? Arik Gihon:这种说法并不完全准确。SMT 对于扩展多线程是个不错的特性。相同的核心上跑 2 个线程,在不需要增加太多功耗的情况下,就能获得 nT 性能,所以以相似的模式就提升了性能。以前比现在的收益还多一点,以前大约 30% 额外的性能,现在大约 20% 左右。 现在情况发生了一些变化。我们在扩展多线程性能的高层级架构方面,增加了 E-core。这是扩展多线程更为高效的方式。所以现在,如果我们期望在核心上高效地跑单线程,方法之一就是去除(同时)多线程,并且构建更为有效的、能够以更低功耗提供 IPC 性能的核心。 Q:提到 Lunar Lake 上的 E-core,你们把所有 E-core 都放到了 ring 以外。以前在 Meteor Lake 上,E-core 放在 CPU tile 上,而 LP E-core 放在 SoC tile 上。这次你们将全部 E-core 都放到了低功耗岛上,原因是什么? Arik:是的,上一代我们将两个 LP E-core 放到了 ring 总线之外,不在 compute die 上。我们对其做了进一步优化,Lunar Lake 之上我们将 4 个 E-core 放到了 ring 以外,以提升效率。Ring 和 LLC 的确会在某些情况下带来收益,但有时代价也很大。 相较于 LLC 能够给到的额外 IPC,要让 Lunar Lake 具备低功耗特性,这么做带来了相当不错的收益,包括延迟、存储,以及功耗开销。 Q:从缓存架构角度来看,新的 P-core 有了新层级的 intermediate L1 cache。现在也就有了 4 级数据 cache 和 SLC cache,这对延迟敏感型程序会带来怎样的影响? Arik:很不错的问题。我不确定这是否会影响到延迟,的确会提升延迟表现(improving latency)...相较于原 L1 cache,可能改善了多个周期(several cycles)... Q:某些情况下能够帮助延迟方面的表现,因为让原本要放进 L2 的部分离核心更近了。 Arik:是的。我在演讲中展示了延迟数据,可以看到相较于上一代 Redwood Cove,在更低层级 buffer size 部分,大核心的延迟表现有提升... Q:Memory Side Cache 在 Lunar Lake 里头是个新东西... 内存操作减少程度如何? Arik:这主要取决于负载,和应用的 footprint;取决于多少东西能够放进 cache 里,情况会有差别。会有一些负载从中获益颇多,因为我们将更多东西分配进了 system cache... Q:谈到负载,这也会包含 iGPU 吗?iGPU 也会是 Memory Side Cache 的使用大户吗? Arik:No it's not due to the footprint . Q: iGPU 实际上无法真正从光追单元获得多少有效性能,为什么要增加完整光追单元的用料?是为了缩减验证时间吗 ? Arik:不是的。架构的某些部分能够更好地利用硬件资源,更好地利用光追单元,所以在 Lunar Lake 上就这么做了。 Q: Lunar Lake 上很多东西都重新整合到了同一片 die 上,为什么回到这种 monolithic 设计? Arik:这是种权衡(trade-off)... ...
  • 热度 4
    2024-7-4 13:40
    312 次阅读|
    0 个评论
    各大Logo更新汇报 | NEW 百佳泰为ISO/IEC17025实验室,亦获得国际协会授权,可提供超过30种标准认证测试,特为您整理2024年6月各大Logo的最新规格信息。 Bluetooth ▶Bluetooth SIG 董事会于6月11日批准了第三版QPRD,其中概述了新的蓝牙资格流程 ■ https://www.bluetooth.com/download/qprd-document/?tmstv=1718127803 Intel EVO (Project Athena) IAT Test ▶英特尔EVO系统设计规范第5版修订版1.0于2024年5月发布,适用于Lunar Lake和Arrow Lake平台。 Matter ▶CSA会员会议 – 华盛顿特区 ■ 2024年6月24-27日 ■ 华盛顿特区 USB ▶百佳泰台湾获准进行USB 3.2 Gen 2×2 主机及外围测试。 ▶若您的公司首次进行USB4认证,以下产品必须参加PIL认证。 ■ USB4 v1 芯片主机和集线器/扩展坞 Wi-Fi® ▶Wi-Fi CERTIFIED WPA3和Wi-Fi Enhanced Open Deployment Guide已发布。 ■ https://www.wi-fi.org/file-member/wpa3-and-wi-fi-enhanced-open-deployment-and-implementation-guide
  • 热度 4
    2022-7-31 15:37
    4353 次阅读|
    1 个评论
    从Imagination GPU聊起:当手机芯片,应用于服务器和超算
    说个挺有趣的推论啊。上周 参加 Imagination Technologies 的技术研讨会 ,这家公司当然就是要宣传自家的 TBDR 架构 GPU 嘛——对 GPU 架构比较熟的同学应该知道,这叫基于 tile 的延后渲染架构。 就不科普立即渲染(IMR)、TBR、TBDR 的差别了——不理解也没关系。从直觉来看——或者至少是我理解的,TBR / TBDR 这里面的 TB (tile-base),以及 D (deferred),最初都是面向移动设备的,或者说面向那些功耗敏感型设备的。 因为所谓的 tile-based,可以简单理解为把要渲染的东西切分成一块一块的。某种程度上,之所以要这么做是因为移动设备的功耗和带宽,上限都不可能放宽到桌面平台的水平。所以这么一切,GPU 就不需要频繁地跟内存做交互了。 Arm Mali、苹果 GPU、高通 Adreno 什么的都是这么搞的嘛。至于“D”的部分,那又是另一个话题。但核心就是移动 GPU 有针对带宽、功耗特别优化过的渲染管线。(至于很多人所说 Nvidia、AMD 的 GPU 也有 tile-based 这种设定,这一点有兴趣的可以自己去查资料,这个话题要展开有点过大) 补充:知乎有同学提到,TBDR 是在桌面端战不过竞争对手,所以才转而面向移动市场,而非天然针对移动设备。好吧,似乎的确是这么回事...那么姑且就以厂商后期的宣传来这么定义好了... 一 我们知道,现在 GPU 的地位跟以前不一样了,GPU 开始上天入地了 - 在手机、汽车、IoT、PC、数据中心里面的地位都越来越重要。做 GPU 芯片和 GPU IP 的公司,普遍在谈 GPU 架构的弹性扩展能力。 就是我设计一个基础单元,然后把这个基础单元复制粘贴两份,算力不就变高了吗?复制粘贴 4 份,可以用在手机上了;复制粘贴 20 份,可以用在电脑上了;复制粘贴 n 份,就能用在服务器上了......当然了,这个复制粘贴“基础单元”的设备形态会有变化,而且算力也不会线性提升;另外作为 GPU 嘛,还需要一些固定功能单元之类的搭配。 那就涉及到一个问题。比如 Imagination 做的 GPU IP,这个 IP 以前不就是给手机准备的吗?——前面说的 TBDR,功耗、带宽受限...那把这种架构的“基础单元”复制个几十份几百份,用在服务器上,真的合理吗? 这个事情呢,感觉好像也不怎么复杂。苹果 GPU 在架构上基本就是沿袭自 Imagination PowerVR,所以整体上也是 TBDR 的。这种设计最初用在 iPhone 上,后来用在 iPad 上,现在已经用在了 Mac 上,而且是工作站级别的计算机上——充分表示,好像这么复制粘贴问题也不是很大。所以起码在 PC 上用 TBDR 架构的 GPU 好像也挺好的(虽然现在也有相关这方面的讨论)... 二 这基于一个大前提,就是以前那些所谓“对功耗不敏感”的设备和场景,在这个时代背景下,考察其 KPI 的方法已经不一样了。你看以前我们说台式机,那肯定不是什么功耗敏感型设备——你说桌面 CPU、GPU 功耗高,再高,上限也高不过空调吧?不过多耗几度电的问题。 现在就不是这么回事了,媒体、评测机构对桌面 CPU/GPU 的功耗和效率都在意得不得了;苹果更是在发布会上带头说 Mac Studio 一年能节约多少电,保护多少地球......而更高算力和功耗需求的数据中心就更是如此了,一方面是节电能力涉及到总体成本问题——而且在规模很大的时候,电费和散热系统产生的费用还真的是一笔不小的开支。还有汽车,里程焦虑晓得伐? 所以这个时候,大量设备都变得“功耗敏感”了,“功耗敏感”就不仅限于手机、笔记本这种东西。这个时候像 TBDR 这种原本给手机的架构,又是 tile-based,又是各个环节数据压缩来缩减带宽的,是不是就突然在更大型的设备上变得很吃香了呢? 这其实也是 Imagination 在宣扬的事情。不过也不止于此。 三 另一点是周末跟朋友在聊天的时候说的一些感悟。就是你们看苹果 Mac 这一路的发展啊,还挺有意思。上古时代基于 68k 就不谈了。在 68k 以后,苹果开始给 Mac 电脑用 PowerPC 处理器——那是早在和 Intel 合作以前的故事。PowerPC 是苹果、IBM、摩托罗拉合作的东西。 要说 PowerPC 的血统,其实有很大一部分是大算力设备下放的(虽然好像并非全然如此);某一些是 IBM 搞 POWER 之余,下放给 PC 的。比较具有代表性的,末代 PowerPC G5 是脱胎于 IBM POWER4 服务器处理器。 在当时那个时代似乎是个很稀松平常的事情。而且周末还跟朋友聊到说,那些搞大东西的公司,起初是不怎么瞧得上消费电子市场的。而且当年听 IBM 说,越到后期,PowerPC 越成为他们开发的一个累赘。但这种“下放”的思路本身应该是有问题的。 抛开什么规模效应、芯片设计与制造脱钩之类的历史故事不谈,当时 Intel 能够脱颖而出的一个重要原因,我觉得是 Intel 起家就是给 PC 做处理器的,而不是给商用设备做了处理器、然后下放给个人电脑。血统、思路就有相当差异。 四 而随着时代发展,移动时代到来,智能手机成为一个大生意。Intel 没能抓住这个机遇是挺可惜的。其实最初 Intel 也是不怎么瞧得上这个市场的,像当年的故事重演吧? 不要说什么“下放”,现在的时代趋势,像开头说 TBDR 架构的 GPU 用到工作站、服务器上都没什么毛病了。真的就是大算力设备,已经普遍在用,原本那些专门面向“功耗敏感型”设备的处理器基础架构了。 比如亚马逊云服务器 Graviton 芯片,应用的那个 Arm Neoverse 架构,本质上是 Cortex A 系列的改款——这不就是手机处理器的架构吗?当然了,这个“改款”涉及的东西比较多,因为“复制粘贴”在规模做得很大以后,就没那么简单了。 还有现在 Nvidia 很红的 Grace CPU,面向的是 HPC AI - 真正的大算力应用场景。这个 Grace 也是基于 Arm Neoverse......苹果的 M1 Ultra 就更不用说了吧:应用于工作站的处理器芯片,其核心本质上也就是 A14 的规模扩大版——也就是 iPhone 12 上那个芯片和架构。挺有意思的吧? Arm 是靠什么起家的呢?低功耗~查 Acorn 的缘起,真的是妥妥的低功耗,当年他们应该都没想过还要上大算力设备。 这叫啥?如果以前“下放”的思路是常规,那现在就是“上放”的时代了吧。我们总结说:以前那些做大东西的有多瞧不上消费电子的小东西,现在做小东西的就有多瞧不上那些做大东西的。 当然了,这个故事还是说简单了,其中还是有很多细节问题的。 不过我想说的是,回看开头咱们在谈 Imagination 的 TBDR 架构要从手机,一路覆盖到服务器;不说 Imagination 能不能行,单就说这种思路,就是时代的主旋律了。(不过还有一种可能性,就是不同的时代,谁比较红,谁的架构就能一统天下...至于“需求”和“市场说辞”,那总是可以找得到的。 以上皆为瞎扯,下回书再见。
  • 热度 6
    2022-5-5 16:43
    3947 次阅读|
    1 个评论
    从Intel 4004聊到苹果M1:聊聊摩尔定律的续命
    译者的话:很多同学可能对半导体尖端制造工艺更感兴趣,毕竟 5nm、3nm 这些词听起来就格外的一颗赛艇。不过行业不是整天在说“摩尔定律停滞/放缓”吗?大体上说的就是晶体管器件微缩的速度变慢了,那么驱动整个电子科技行业的底层技术也就变慢了,做不到 12-18 个月单位面积的晶体管数量翻番。 几年前就看到有人提出 More than Moore 还有“超越摩尔”之类的市场营销词汇。包括现在有像 Synopsys 这样的 EDA 公司提出 SysMoore 从系统层面来延续摩尔定律。其实这些都离不开先进封装工艺的发展。 “封装”“封装”,应该是说把芯片给密封、包装起来把?放在纸盒子里?一般我们说,“封装”要达成的是对芯片的支撑和机械保护,以及把电信号从芯片上引出来。在封装技术上做文章,也就是现在我们常说的“先进封装”工艺,应该是当代半导体制造技术发展的一个主旋律。 所以我预计会翻译 4-5 篇这方面的技术文章,个人感觉都还相对通俗易懂,且比较有科普价值的。期望对各位半导体技术爱好者有帮助吧。本文是此系列文章的第一篇,我觉得可以作为先进封装技术的一个概览,从“形式”上让各位同学对“封装”有个基本的概念。后面的几篇会做进一步的深入。 原文标题: Semiconductor Packaging History and Primer ,作者:Doug O'Laughlin 个人转载的请随意,但起码标明原文地址和我这个译者吧(毕竟我翻译的文章都有浓重的个人风味...)... 正文开始: 为什么现在封装技术很重要? 封装(packaging)原本是半导体制造流程后面的一道工序。将小片的硅造出来,然后用某种方法把它连接到什么板子上。随着摩尔定律的发展,工程师们认为应当充分利用芯片的各个组成部分、工序,包括封装,让最终产品达到最佳状态。采用更优的封装方式,能够带来很多好处,比如说更厚的金属片提供了更好的导电性,还有像是 I/O 问题——也仍是半导体产品需要考虑的最重要的问题之一。 只不过以前,封装企业并不像传统的前道(front-end)制造工艺企业那样受重视。封装供应链常被称作“后道”(back-end),被视为成本中心,类似于银行的前厅和后勤办公室的关系。但现在前道生产工艺的器件缩放进度放缓,那么新的技术热点也就随之转移,封装也就受到了重视。本文将讨论各种封装工艺,让你了解包括 2.5D、3D 封装等在内的概念究竟是什么意思。 封装简史 下面这张图是封装技术一个简单的层级关系,来自于某个油管课程。建议有时间的同学 前往观看 。这个课程展示了封装技术从过去到现在的发展情况。 WLP 显然有挺多不同的封装技术的,不过我们只谈谈其中简单的一些——具有一定的代表性,然后再谈谈现在的一些技术。下面这张图作为高层级的一个总揽,也相当不错,虽然这张图有些过时了,但内容上没什么问题。 在封装技术发展初期,陶瓷、金属罐(metal cans)很常见;密封以达成最佳可靠性。这类方案绝大部分应用于航天、军用领域——这些领域的可靠性要求非常高。不过这样的要求对于日常民用设备而言就没有必要了,于是我们开始采用塑料封装以及 DIP(dual in-line packaging,双列直插式封装)。 DIP 封装(1964-1980s) DIP 最早是在 20 世纪 70 年代引入的。在表面贴装技术出现以前,DIP 在大约 10 年的时间里成为一项标准。DIP 采用塑料外壳,包围半导体器件;有两排伸出的 pin 脚——名为引线框(leadframes)——连接到 PCB 板,如下图所示。 内部的芯片 die 通过焊线(bonding wire)连接到两侧的引线框,引线框连接到 PCB 板 DIP 是于 1964 年由仙童半导体打造的。DIP 封装现在是具备了象征意义的,其设计方案在当时也比较好理解。Die 完全密封在树脂里面,达成较高的可靠性,且成本较低。早期不少颇具代表性的半导体器件都采用这种封装方式。Die 是通过引线连接到外部的引线框的,也就让这种封装方式称为“引线键合(wire-bonding)”,后文还将详细介绍。 下面这颗芯片是 Intel 8008,应该是最早的一批现代微处理器了。注意这颗芯片就采用了具代表性的 DIP 封装。类似于这种看起来像蜘蛛形态的半导体器件,那就表明是 DIP 封装了。 Intel 最早的微处理器,8008 家族 这样的金属片会焊到 PCB 板上,令其与其他电子器件和系统其余部分连接。下面这张图展示的,就是焊到 PCB 板上的样子。 PCB 本身通常由铜和非导电材料层积而成。PCB 能够从不同位置导通电信号,实现 PCB 板上的器件互联互通。PCB 板上不同电路器件之间会有很精细的线路连接,这些线路嵌入在主板上,扮演着导管的作用。上图的这个模块自然是封装过后的器件,不过其实从系统层级来看,PCB 板也可认为是最高层级的封装形式。 DIP 的传奇故事当然不止于此,不过接下来我们就来谈谈下一个时代的封装技术:表面贴装(Surface Mount Packaging)吧。 表面贴装(1980s-1990s) 表面贴装简称 SMT。顾名思义,表面贴装是直接贴装到 PCB 的表面上。这样一来 PCB 板能容纳更多组件,单基板实现了更低的成本。下面这张图就是典型的表面贴装应用。 这种封装方案有很多不同的变体。在半导体创新发展的全盛时期,这样的封装技术在较长时间里扮演着重要角色。这里需要注意的是,原本 DIP 上的两排引线框,换成了 4 边都有了引线。值得一提的是,封装技术的发展,在于占据越来越小的空间,同时增大连接带宽。每次技术演进,都是期望在这方面做文章。 这项工艺曾经是手工完成的,当然现在已经高度自动化了。除此之外,这项技术其实也给 PCB 带来了不少问题,比如说 popcorning。Popcorning 是指塑料封装内部存在的湿气,在焊接过程中被加热,则导致在快速加热、冷却的过程里,PCB 产生问题。此处值得一提的是,每次封装工艺进步,都意味着复杂度在增加、出错率也在增加。 BGA 封装(1990s-2000s) 随着半导体性能持续进化,封装技术的要求也越来越高。在此期间 QFN(quad-flat no-leads,方形扁平无引脚封装)和其他表面贴装技术其实也在持续发展,不过我想介绍一下随后的封装技术——这些封装设计也成为后续技术发展的开端。首先是 BGA 封装(Ball Grid Array packaging,球柵阵列封装)。 这些球或者说凸起,名为焊接凸点/焊球 这就是 BGA 球柵阵列的样子,可以直接把一片硅和 PCB 连起来,或者是连接到 PCB 板更下层的基板上,而不像之前的表面贴装技术那样只能局限在四边。 所以 BGA 封装本质上也属于封装技术发展的必然,即占据更小的空间、达成更多的连接点。BGA 封装是把一个封装模块直接连接到另一个模块(译者注:也就是 PCB)上,而不再是通过精细的连线。这样一来能够达成更高的密度、更好的 I/O 表现,与此同时也增加了复杂度——BGA 封装是否正常工作是需要仔细检查的。此前 BGA 封装需要从视觉上去观察和测试。现在我们已经看不到封装的样子了,需要藉由 X 光等更复杂的技术来进行检查。 像焊接凸点这样的方案,目前仍然是键合的一个主要技术,是模块之间互连最常见的类型。 现代封装(2000s-2010s) 接下来就该谈谈当代的封装技术了。其实前文谈到的不少方案今天依然在应用,只不过当代涌现出了更多的封装类型——其中的一些技术将来也会变得更普及。接下来我就谈谈这些技术。需要指出的是,其中的一些技术其实在很多年以前就已经发明出来了,但受限于成本,此前一直没有广泛应用。 倒装芯片(Flip Chip) 这应该是现在你们经常看到或者听到的一种常见的封装技术。很高兴我能在这儿给倒装芯片下个定义,因为我还从来没有在别的地方看到对这项技术满意的解释。芯片倒装是由 IBM 发明的,经常被简写成 C4。实际上芯片倒装并不是一种独立的封装形式,它描述的是某一种封装形态。它也需要搭配 die 上的焊接凸点。互连不是通过引线键合达成的,而且在封装的时候,芯片是翻转过来,面朝其他芯片;两者中间当然需要连接介质;所以被称作“倒装”芯片。 这句话可能还是很费解,所以我打算举个例子——来自维基百科,我觉得是比较好理解的。我们来谈谈这其中的步骤。 1.首先 IC 从晶圆上造出来; 2.芯片表面形成金属层的 pad;(译者注:原句为 Pads are metalized on the surface of the chip) 3.Pad 上沉积出焊接点; 4.把芯片从晶圆上切下来; 5.把芯片倒过来,如此一来这些焊接球就面向了电路; 6.焊接球再度融化; 7.然后再填充绝缘的胶粘剂 (译者注:个人感觉这个解释仍然不够完备,尤其是没有解释为什么要这么做,以及到底什么样的芯片用了倒装方案。实际上我们现在所见的很多基于尖端工艺的芯片,比如 Intel 酷睿处理器基本都是芯片倒装。另外,某些企业也将芯片倒装称作“先进封装工艺”...这部分将在未来翻译的文章里做更详细的解释...) 引线键合 注意倒装芯片和引线键合(wirebond)是不同的。还记得上面的 DIP 封装吗?那就是基于引线键合,die 藉由引线连接到另一片金属上,最终焊接到 PCB 板。引线键合已经不是某一种特定的技术方案了,而是一类技术的统称,可以衍生出各种不同形态的封装方案。我认为,这是描述倒装芯片最好的方法。引线键合相对于倒装芯片而言,是某种前置技术(译者注:原句为 Wirebond is a precursor to filp-chip to be clear;这句话可能也是着重在表达这两个词是不同层级的描述方式)。 这部分了解到这个程度也就可以了。实际上每种形式的封装方案都有不同的变体。顺带一提,KLIC(库力索法半导体)是这一领域的市场领导者,谈到旧封装技术,就应该想到这家公司。 先进封装(2010s 至今) 进入“先进封装”半导体时代还是相当漫长,我期望谈谈某些高层级的概念。这里面其实有多个层级的“封装”要谈。前面我们在谈的绝大部分封装,是专注在芯片到 PCB 的封装;而先进封装要从手机开始说。 从各个层面来看,手机都可以说是先进封装诞生的巨大前提。这其实也很合理,毕竟手机是以那么小的体积装下那么多的晶体管和硅相关技术,比笔记本和电脑密集多了。而且一切都需要被动散热,还必须尽可能地薄。每年苹果和三星都会发布性能更强、但外形更薄的手机,这也就驱动了封装技术的发展。我下面要谈的很多概念都是从智能手机封装开始的,并且最终将这样的技术在半导体行业的更多应用上普及开。 芯片级封装(Chip Scale Packaging,CSP) 芯片级封装描述的范围其实比较广,原本的意思是达到芯片尺寸的封装。其确切定义应该是描绘某一个封装模块,其尺寸不大于内部 die 尺寸的 1.2 倍,必须为单 die 且可连接。前面其实已经引入过 CSP 的概念了,就是在倒装芯片的部分。不过 CSP 还是藉由智能手机,将技术带到了新的高度。 本世纪 10 年代,CSP 几乎成为一种标准;上面这张图的一切封装尺寸,都大约是芯片 die 尺寸的 1.2 倍左右,极尽所能地节约占板面积。CSP 也有多种不同类型,包括倒装芯片、right substrate(?这是啥,欢迎评论补充)等其他技术。不过其实知道其中细节对你们应该也不会有多大帮助。 晶圆级封装(Wafer-level packaging,WLP) 这里其实还有一种更小的方案,属于“终极版”芯片级封装尺寸,或者可以叫晶圆级封装。基本上就是将封装直接放到 die 身上;在此,封装就是 die 本身。它比最高层级的 I/O 还要薄,显然也非常难于制造。先进封装解决方案当前仍在 CSP 级别,但未来将完全转向晶圆级。 这样的进化方向很有趣,封装某种程度上是被硅包含在内了。芯片即为封装,封装即为芯片。这样的方案比在芯片上焊个锡球就贵多了,那为什么还要用这样的方案呢?为什么我们还在追求高级封装呢?(译者注:个人感觉,这番解释还是有点问题) 先进封装:未来 这也是我之前一直在说的一个趋势。异构计算并不仅是架构专用化,还在于怎么将这些专用芯片放到一起。先进封装就是其中非常关键的技术。 我们来看看苹果 M1 芯片,典型的异构计算芯片,而且还配了统一内存架构。M1 出来的时候,我并没有感觉到多惊讶,它只是异构计算的典型代表。M1 的确表明了未来的方向,很多芯片设计也将很快追随苹果的方案。SoC(System on Chip)本身并不能说是异构,但采用定制化的封装方案,把内存放到 SoC 旁边就是异构了。(译者注:对这个说法深表不赞同) 这张图虽然是宣传图,但注意 PCB 上没有出现引线,应该是因为 2.5D 集成的关系(译者注:个人认为,这个说法应该也不对;苹果的这种统一内存充其量就是从基板走线的 2D 封装) 先进封装方案中比较具有代表性的另一个产品是英伟达 A100,注意 PCB 板上同样没有出现引线。 下面这段话来自英伟达的白皮书: A100 并没有像传统方案那样,在 GPU 芯片周围放上好几个独立的内存芯片(如 GDDR5 GPU 显卡设计),而是采用 HBM2 内存——这种内存本身在垂直方向就叠了多个内存 die。这些存储 die 通过一些很微小的“线”连接起来(基于 TSV 硅通孔和 microbump 微凸点)。1 个 8Gb HBM2 die 包含超过 5000 个 TSV 孔。然后再用一层有源(passive)硅中介(silicon interposer),把内存堆栈和 GPU die 连起来。HBM2 堆栈、GPU die、硅中介一起,装到一个 55mm x 55mm BGA 封装中。图 9 展示了 GP100 加上两个 HBM2 堆栈;图 10 则展示了 P100 的 GPU 和内存微观图片。 我们把这段话变成人话,首先要谈谈“高级封装”的两个类别:“2.5D 封装”和“3D 封装”。 2.5D 封装 2.5D 本质上属于倒装芯片的升级版本,不过不是将 die 堆在 PCB 板上,而是把多个 die 放在一层叫做“硅中介(silicon interposer)”的东西上面。下面这张图应当很好地解释了这个方案。 2.5D 就类似于开了个地下通道,通到邻居家里;实际上这个“通道”是藉由凸点(bump)或者 TSV 硅通孔深入到硅中介,然后通过硅中介把你和你的邻居连起来。这种方案在速度上当然不会比直接在芯片内部通信更快,但其输出表现取决于封装性能,两颗 die 之间的距离缩短、连接点增多。其价值还是比较大的。其中一个好处在于可以用“known good die”,或者说把更小片的 die 封装到一起,形成一个更大的封装。之所以这么做会比 1 整片 die 的方案要更优,是因为它让制造变得更容易了,毕竟只需要造小尺寸的 die。 这些小片的 die,常被称为 chiplet(译者注:国内有译作“芯粒”的),你们应该也常听到。如此一来,把较小功能模块的 chiplet 组合到一起,在一块硅基板上对这些 chiplet 进行连接,就构成了 2.5D 封装的芯片。 Chiplet 和 2.5D 封装可能还会应用较长的一段时间。它在各方面都有优势,比如质量、相比 3D 封装工艺更简单,而且成本也更低。另外,这种技术也具备了弹性,比如复用新的 chiplet,通过替换 chiplet 的方式把全新的芯片带到相同的封装之上。AMD Zen 3 就是一个例子,封装本身是类似的,chiplet 可做扩展。但还有个终极版本,3D 封装。 3D 封装 3D 封装乃是封装的超级形态(ultimate ending)。前面谈到的那些封装,其实都是把房子建在地上、一层楼高,然后通过地下室相连;而 3D 封装则是建高楼,按照功能需要做定制化。这就是 3D 封装,封装都建基于 die 本身。这是最快,且具备了能效比的方法;而且用这种方法能够打造规模更大、更复杂的结构,大幅“扩展”摩尔定律。未来或许要实现器件尺寸微缩会有很大的难度,但有了 3D 封装,就能延续摩尔定律。 其实整个半导体市场,已经有了 3D 堆叠的示范:存储器。3D 结构的存储就属于未来的写照。NAND 发展为 3D 结构的原因就是器件尺寸微缩难度变得很大。把存储介质想象成大型的 3D 高楼,每一层都通过电梯相连——也就是 TSV 硅通孔。 这就是未来的样子,甚至有可能把 CPU、GPU 相互叠起来,或者把存储堆栈放到 CPU 上面。这是最终的发展方向,而且我们很快应当就能达成这个目标。我们应该在未来 5 年内就会看到各种 3D 封装芯片的涌现。 2.5D/3D 封装解决方案一览 我不打算深入去谈 3D/2.5D 封装,还是展示一些已经在用的封装工艺会比较好。我想专注在 fab 厂的工艺上,这些也是驱动 3D/2.5D 集成往前发展的一些技术。 台积电 CoWoS 这应该是 2.5D 集成工艺的主力技术,赛灵思是采用该技术的先驱。 这项工艺主要是把所有的逻辑 die 放到一片硅中介上,然后再放到封装基板(package substrate)上。其上所有组成部分都通过 microbump(微凸点)或者焊球来连接。这是比较典型的 2.5D 结构。 (译者注:这里其实如果能够列举硅桥方案会更好。因为并非所有的 2.5D 封装都需要藉由硅中介来实现。不过未来高级封装技术的系列文章还是会仔细去谈这个部分的) 台积电 SoIC 这是台积电的 3D 封装平台,属于比较新的技术。 注意下图中的 bump 密度和键合间距(bonding pitch),SoIC 的这两个参数与倒装芯片/2.5D 封装相去甚远,基于密度和尺寸都属于前道工艺。 下面这张图则对其技术做了对比,SoIC 的确实现了芯片之间的堆叠,而不单是通过硅中介来实现 2.5D 集成。 三星 XCube 三星这些年也成为很重要的 foundry 厂, 这则视频 是其 XCube 技术的展示。 这则视频呈现的信息其实不多,不过要指出的是英伟达 A100 就是基于三星的这项工艺,这应该也是英伟达最近的一些芯片采用的技术方案。另外值得一提的是,三星可能是在 TSV 硅通孔技术上经验最多的企业,毕竟他们在 3D 存储平台上积累颇多。 Intel Foveros 最后要谈的是 Intel 的 Foveros 3D 封装 。未来我们应该还会看到更多这项技术的身影,尤其是 Intel 未来的 7nm(译者注:已更名为 Intel 4)及其 CPU 混合架构。Intel 也在 Architecture Day 上谈到了这会是他们未来发展的重点。 (译者注:这里之所以提到混合架构,也就是一般人所说的大小核设计,是因为 Intel 最早的大小核芯片 Lakefield 其实就用到了 3D 堆叠,具体可 参见这篇文章 ;不过目前混合架构的 Alder Lake 并没有采用这项封装技术) 比较有趣的是,其实三星、台积电、Intel 在 3D 工艺方面的差别并不是特别大。(译者注:对这一说法持严重怀疑态度) 先进封装的赢家 先进封装,在流程中实际上属于“中道(mid-end)”技术(译者注:mid-end 是相对于 frond-end 和 back-end 而言的,如下图所示)。技术本身是在发展中的。 以前,封装预算是被排除在 WFE(Wafer Fab Equipment)预算之外的;但从 2020 年开始,也开始把晶圆级封装包含在内。这本身就是风向变化的一个信号,以及中道工艺变得重要的原因。中道的另一个定义是 BOEL(Back End of Line)。要了解封装相关企业信息,可以 参见这篇文章 。
相关资源