自2020提出建设“5G新基建以来”,云计算更加快速地发展,各大云计算供应商也在不断增加数据中心基础设施支出,以应对云技术的发展及信息化更替。云计算为服务器下游产业,它的需求量直接影响到服务器的采购数量,所以带动了服务器行业的需求,极大地刺激服务器市场增长。
在服务器领域,电源可谓是重中之重,服务器的稳定性首要影响因素便是电源。在服务器上,一年365天不停机运行是常事,所以对电源的可靠性要求很高。
确保服务器电源的可靠,必须按照相应规范设计。随着对服务器性能要求的提升和技术的进步,电源规范逐渐由ATX规范演进为SSI规范。ATX规范在普通PC和早期服务器中应用较广。
ATX电源规范
ATX电源规范的标准是 Intel在1997年推出的一个规范,输出功率一般在125W~350W之间。ATX电源通常采用20Pin(20针)的双排长方形插座给主板供电。随着Intel推出Pentium4处理器,电源规范也由ATX修改为ATX12V,和ATX电源相比,ATX12V电源主要增加了一个4Pin的12V电源输出端,以便更好地满足Pentium4的供电要求。
而最新的 ATX 12V 2.03规范电源采用双路+12V输出,其中一路+12V仍然为CPU提供专门的供电输出。而另一路+12V输出则为主板和PCI-E显卡供电,以满足高性能PCI-E显卡的需求。由于采用了双路+12V输出,连接主板的主电源接口也从原来的20Pin增加到24Pin,分别由12×2的主电源和2×2的CPU专用电源接口组成。虽然接口连接在了一起,但两路+12V电源在布线上是完全分开,独立输出的。
除此之外,ATX 12V 2.3规范还将电源满载转换效率的标准提升至80%以上,进一步达到环保节能的要求,并再次加强了+12V的电流输出能力,规定电源中对+12V的总输出至少要达到22A,同时提高了+5VSB的电流输出要求,对+12V的涌浪电流峰值、滤波电容的容量、保护等也作出了新规定。
如图1所示,是ATX规范的演进过程。目前的服务器电源主要参考SSI规范。
SSI规范
SSI(Server System Infrastructure)规范是Intel联合一些主要的IA架构服务器生产商推出的新型服务器电源规范。SSI规范的推出是为了规范服务器电源技术,降低开发成本,延长服务器的使用寿命而制定的,主要包括服务器电源规格、背板系统规格、服务器机箱系统规格和散热系统规格。
根据使用的环境和规模的不同,如表1SSI规范又可以分为EPS、TPS、MPS、DPS四种子规范。
EPS规范(Entry Power Supply Specifi cation):主要为单电源供电的中低端服务器设计,设计中秉承了ATX电源的基本规格,但在电性能指标上存在一些差异。它适用于额定功率在300W~400W的电源,独立使用,不用于冗余方式。后来该规范发展到EPS12V(Version2.0),适用的额定功率达到450W~650W。
TPS规范(Thin Power Supply Specification):具有PFC(功率因数校正)、自动负载电流分配功能。电源系统最多可以实现4组电源并联冗余工作,由系统提供风扇散热。TPS电源对热插拔和电流均衡分配要求较高,它可用于N+1冗余工作,有冗余保护功能。
MPS规范(Midrange Power Supply Specification):这种电源被定义为针对4路以上CPU的高端服务器系统。MPS电源适用于额定功率在375W~450W的电源,可单独使用,也可冗余使用。它具有PFC、自动负载电流分配等功能。采用这种电源元件电压、电流规格设计和半导体、电容、电感等器件工作温度的设计裕量超过15%。
DPS规范(Distributed Power Supply Specification):电源是单48V直流电压输出的供电系统,提供的最小功率为800W,输出为+48V和+12VSB。DPS电源采用二次供电方式,输入交流电经过AC-DC转换电路后输出48V直流电,48VDC再经过DC-DC转换电路输出负载需要的+5V、+12V、+3.3V直流电。制定这一规范主要是为简化电信用户的供电方式,便于机房供电,使IA服务器电源与电信所采用的电源系统接轨。
表格 1 SSI规范从上述规范我们可以看出,EPS规范电源主要是为需要单电源供应的中低端服务器设计的,设计中继承了ATX电源的设计风格;EPS规范定义的是中低端服务器所用的通用电源供应系统,主要用于单电源模式,支持双处理器系统;在EPS规范中只对电源的容量、引脚等做出了规定,而并没指定确定的电源额定功率,电源开发商可以根据各自不同的开发平台设计不同额定功率的电源,但必须在300-400W范围内。
从接口来说,EPS规范电源和早期ATX电源最直观的区别在于提供了24Pin的主板电源接口和8Pin的CPU电源接口,而随着时间的推移,普通PC对电源的要求也越来越高,双核,SLI等技术越发需要更大的电流,因此很多高端主板也开始采用了EPS规范的电源。
对于服务器电源的设计,遵循相应的规范是必要的。对应的规范之内,对于功耗和性能的把握也很重要。由于性能强劲的服务器对于散热的要求,所以机房的空间利用率不得不有所下降。所以目前集中式的机房对于服务器的要求需要把握功耗和性能的平衡。因此在设计或者选择开关电源时需要突破效率屏障,从源头降低热损功耗。
降低热损耗是因为服务器长期运行,小小的损耗经过时间的积分就变得比较庞大。而这些损耗最后对于服务器电源本身造成损害。长期运行的服务器电源突然损坏,那数据怎么办呢?这就要提到冗余电源,这通常是在需要遵循TPS规范、MPS规范的服务器电源中常见的词汇。
图 2 冗余电源示例
由于长期运行的需要,服务器的电源需要兼顾安全性和稳定性。所以服务器一般都配置有多个并行电源,以支持N+1冗余与持续使用。冗余电源实际上是由N+1个独立电源组成的,实现冗余功能主要是靠电源所连接的背板,当背板检测到某电源出错或低于某个阈值时,就会将负载转移到其他正常的电源单元并停掉出错的电源、发出警报。(如图2为一种较简单的冗余电源)
冗余电源的好处是显而易见的,比如双电源具有均流、故障切换、独立电源热插拔等功能。
在电源正常工作时,由于具有均流的特性(也被称为负载平衡),每个电源单元承受的负载为服务器整机负载的一半,这样可以使每个单元的开关电源工作在低负荷状态,以提高连续工作的稳定性。
在某一个开关电源单元出现故障时,电源将所有负载切换到另一个尚能工作的电源单元上,同时发出告警信号通知维护人员及时处理。由于电源单元支持热插拔特性,所以可以将出现故障的单元抽出维修,将备用单元直接插上,使电源系统重新恢复到原来正常状态。整个替换过程中电源系统一直不间断供电,保证了服务器工作的连续性。
前文写到的冗余N+1电源架构是把并行电源的输出连接在一起,并保证某个电源的故障不会影响到其它的电源。在每个电源的输出端(如图3中A B处),有一个功率MOSFET管可以让众电源分担正常工作时的负载,同时各电源又彼此隔离,当一个电源出现问题时冗余电源可以即时补上。
起这种作用的MOSFET管被称为"ORing"FET,因为它们本质上是以"OR"逻辑来连接多个电源的输出。MOSFET管在此处起到的作用是开关,在设备开启、关断、电源故障时起到开关作用。当正常工作时,此处的MOSFET一直处于导通状态。
图 3 电源输出端使用的功率MOSFET
功率MOSFETFET作为电源中的核心元器件,其特性决定了电源的可靠性以及效率指标。
此处的MOSFET选择时,对于RDS(ON)有一定的要求。在电源设计中,每个电源常常需要多个ORing MOSFET管并行工作,需要多个器件来把电流传送给负载。在许多情况下,设计人员必须并联MOSFET管,以有效降低RDS(ON)。因此,在相同额定电流情况下,尽量选择低RDS(ON)值的MOSFET管。
此外,基于服务器的散热考虑,MOSFET的热参数也要纳入观察范围,而日渐升高的解温也会导致RDS(ON)的增加。
还要考虑漏电流和漏电压,查看数据手册上的安全工作区(SOA)曲线,该曲线同时描述了漏极电流和漏源电压的关系,定义了MOSFETFET能够安全工作的电源电压和电流。SOA对于设计实现热插拔功能具有参考作用,热插拔时MOSFET管需要部分导通工作,SOA曲线定义了不同脉冲期间的电流和电压限值。