GPU峰值电流控制技术
2022-09-23

  1.引言

  超大规模高性能并行图像处理器常常集成了数十亿计的晶体管,工作频率达GHz以上。这样当处理复杂图像应用程序时,GPU将在微秒时间内急剧上升到数百瓦功耗,这对电源分布系统(PDS)将产生巨大的冲击,导致GPU芯片电压不足,从而出现系统功能异常。

  2.系统异常的原因分析

  GPU中CMOS工艺的要求:

  为了降低功耗,GPU芯片工作电压较低,并允许在宽的范围工作,如0.7V-1.2V。电压越高时,内部开关MOS管的Vgs越高,MOS管导通电阻越小,因而传输时间常数减少,工作频率提高;当电压过低时,MOS管将无法形成正常导电沟道,引起逻辑错误。因次,一个电压相对稳定的电源供应系统(PDS)是系统正常工作的前提。

  GPU动态工作模式的需求:

  高性能GPU采用了很多先进功率控制技术,使得最大功耗达到几百瓦,而待机功耗约几瓦,动态性能模式切换(DPM)便是其中技术之一。通常DPM时钟频率设置在100MHz-1000MHz范围,电压在0.7V-1.2V之间。如图1所示,GPU可在不同DPM状态切换,当GPU处理负载加重时,将快速转换到高性能模式,如HCLK1-HCLK4,电压V3,而如果电压不足,内部电路将不能维持这个模式,而引起系统故障。

  峰值电流控制在高端显卡设计中的应用

  图1 GPU动态工作模式

  PDS性能限制

  开关电源本身性能的限制。开关电源供电能力强,体积小,成本便宜,带有OCP、OVP保护功能。但是开关电源周期性地打开和关闭MOS管,会产生很大的电源纹波和噪声。

  电源分布网络参数限制。它是指从电源至负载的所有电气分布参数的总和,即线路的R、L、C、G的整体效应,来源于PCB材料、层叠、印制线、过孔、屏蔽以及GPU封装以及内部硅。所有这些分布参数,会在电路中产生分压、分流以及反射、衰减损耗等多种影响。

  对GPU负载而言,交流高频信号来源于负载的动态切换引起的电流瞬态变化,加之电源分布网络中的阻抗不连续,而在LC分布网络中产生高频噪声信号。对大电流(如200A以上)的GPU来说,电压跌落达数百毫伏,超出DPM设置范围。

  3.峰值电流控制技术

  GPU瞬态电流变化过大,必然造成供电网络损耗增大,GPU可获得电压降低。为了避开电压跌落造成的冲击,GPU须及时向下切换动态模式,降低时钟频率,降低工作电压。峰值电流控制技术正是基于这个目的所设计的,它还需要软件一起协作。图2所示是峰值电流控制技术软件流程图。系统通过及时检测工作电流变化,可快速调整工作状态,减少芯片功耗,避免系统死机。

  峰值电流控制在高端显卡设计中的应用

  图2 峰值电流控制技术软件流程图

  4.GPU工作电流感应的硬件电路实现

  如图3所示,为了对GPU瞬间大电流变化做出及时反应,电流检测由硬件电路完成。当GPU动态电流超过预定阈值时,硬件电路会产生一个逻辑信号通知软件单元。本技术巧妙地利用电源网络分布电阻来感应在线路中损耗而产生的电压降。我们取电源输出端A点和负载端B点作为电流放大器的输入。当A、B点压降过大时,GPU消耗的电流过大,电压比较器输出一个高电平通知软件及时调整GPU动态模式,降低频率和电压,从而保证GPU及电源均能够正常工作,避免死机。

  峰值电流控制在高端显卡设计中的应用

  图3 GPU电流感应的硬件实现框图

  5.测试结果

  该方案已经应用到某型号GPU产品上,经过调试及性能测试,取得了满意的效果。图4是GPU芯片电流瞬间变化时用示波器所测试得到的波形图。

  峰值电流控制在高端显卡设计中的应用

  图4 峰值电流控制技术波形图

  图4所示中,通道1为预设电流阈值(约47.7A);通道2为实际A、B点压降,除以0.1ohm(线路分布阻抗)后表示最大电流约为55.2A;通道3为迟滞比较器输出;通道4为GPU管脚电压波形。当电流超过阈值时,迟滞比较器被触发,产生高电平中断信号。软件开始切换动态工作模式,设置GPU电压VLOAD降低约100mV。当电流减小并小于阈值时,比较器输出低电平,系统回归正常并继续监测。

  6.结论

  由上分析及测试结果可知,峰值电流控制技术是一种能够合理分配GPU负载,避免系统意外死机的很好的控制机制,可显著提高系统的稳定性和可靠性,可在高性能计算、图形处理芯片设计等领域投入实际应用。

声明: 本文转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们及时删除。(联系我们,邮箱:evan.li@aspencore.com )
0
评论
  • 相关技术文库
  • 处理器
  • DSP
  • CPU
  • GPU
  • pcie和pci插槽的区别

      现在主板上的插槽基本上都是PCI插槽或者PCI-E插槽,这两种插槽有什么区别呢?主要是插哪些卡的呢?现在我们就针对这两个不同的插槽进行详细的分析。   PC

    11-30
  • 处理器单元优缺点对比

      带有多个处理单元的SoC器件目前是产品设计链上的重要一环。本文综合各种因素评估了不同处理单元的优缺点,并通过卫星无线电接收器的设计实例帮助开发人员理解SoC

    11-30
  • 怎样设计实现一个基于DSP和PCI总线的通信数据采集系统?

    随着数字信号处理器性能的不断提高及其成本与售价的大幅下降,数字信号处理应用领域飞速扩展,信号处理进入了一个新的发展时期。同时随着计算机技术以及互联网络技术的不断

    11-29
  • cpu总线逻辑上的三个分类

    cpu和其他芯片连接的导线,通常称为总线,从物理意义上讲,就是由一根根组成的。根据传送的信息的不同,从逻辑上可以分为地址总线、数据总线、控制总线。1.地址总线:

    11-29
  • TI C6000系列DSP的片内总线架构、存储系统和外设

      TIC6000系列的DSP的内部总线架构、存储系统和各种外设(如EDMA3和PRU等),特别是片内的程序数据RAM和Cache系统,以及外设的EDMA控制器

    11-24
  • 基于ADSP21062的雷达信号处理系统的调试

            ADSP2106x SHARC是一个适用于语音、通信和图像处理的高速32位数字信号处理器。该芯片是基于ADSP21000系列DSP芯片发展起来的一个完整的单片系统,增加了一个双口片内SRAM,并集成了I/O设备。借助它的片内指令缓存,处理器可以在一个时钟周期内执行每一个指令。ADSP2106x SHARC体现了数字信号处理器的一个新的集成标准,它把一个高速运行的浮点DSP主处理器与...

    11-24
  • 提升 WLAN 測試系統的量測速度

    概觀由於業界正不斷降低測試成本,許多 RF 測試工程師更必須縮短量測時間。如你所想,無線區域網路 (WLAN) 裝置的測試作業亦必須迎合此趨勢。不論是設計檢驗的自動化測試系統,或最後的生產測試作業,測試系統的量測速度愈趨重要。然而在許多情況下,除了縮短測試時間並降低成本之外,亦不能犧牲測試的精確性與可重複性。此篇技術文件將針對 WLAN 量測作業,說明可影響量測速度的多個平衡要素。在了解相關概念之...

    11-17
  • 智能控制的半导体激光器电源设计

    由于具有体积小、重量轻等特点,半导体激光器(LD)在信息、通讯、医疗等领域得到日益广泛的应用,且与电子器件结合实现单片光电子集成。但是LD 容易受到过电压、电流

    11-17
  • 和CPU同样重要 教你读懂手机之内存篇

      经常关注手机圈的朋友都会对智能手机有着自己的倾向,这也是根据不同需求而定的,人们在挑选手机时也会不自觉的主要关注自己感兴趣的点。像屏幕、处理器、电池容量、摄

    11-16
  • 可编程片上系统(PSoC)电源管理方案

    为什么要关心电源管理?由于多种因素,电源管理正变得非常重要。对于移动手持嵌入式系统来说,总是存在着在增加电池寿命的同时要提供更多功能的压力。当电池本身无法提高却

    11-15
  • 测试 3G 手机的 DigRF 技术

        一种生产型测试仪应有这种能力,即在各次测试间对测试仪硬件和DUT作必要修改时,仍保持数字子系统的运行。它使测试仪能够维持相对于DUT输出的选通时序,避免在正式运行中的选通相位重调,节省了测试时间。      下一个重要的测试挑战是寻找一个能处理多级不确定性数据包传输性能的方式。如图3所示,在DUT的每个RF接收测试期间,测试仪都不知道每个包会在哪个测试循环中传输,包的类型会是什么,或者包的...

    11-14
  • SoC基本概念和设计流程

      集成电路的发展已有40年的历史,它一直遵循摩尔所指示的规律推进,现已进入深亚微米阶段。由于信息市场的需求和微电子自身的发展,引发了以微细加工为主要特征的多种

    11-10
下载排行榜
更多
广告