原创 AI与高速运算时代来临:采购白牌服务器会有什么潜在风险?

2023-11-17 11:46 408 4 4 分类: 测试测量
随着32GT/s 的PCIe 5.0产品问市后,高速运算及AI人工智能开始显露出其效能,特别是生成式AI更迅速地融入进入人们的日常生活,逐渐在各产业扮演重要角色,同时也带动对高速服务的依赖需求不断增长。这个效应带动了服务器产业的持续成长,同时也加速了服务器的世代升级周期缩短。
客制化数量不大的白牌市场或DIY服务器市场客户在采购时,通常会考虑到成本因素,因此会分散采购后,再客制化组成所需的系统规格,其中机壳、主板及储存装置更是系统稳定性与否的重要关键部分,但随着主板开始导入高速的PCIe 5.0技术后,此类型的服务器将面临更严峻的潜在风险挑战。
白牌服务器五大潜在风险

1. 散热不平均

支持PCIe 5.0的CPU,其TDP(Thermal Design Power)都大于350W以上,对散热要求非常高!不同的主板其CPU设计的位置也不同,不一定能跟机壳风扇完全对应,此时就会引发CPU的散热不平均问题。

2. 机壳风扇效能不够

当CPU的TDP大于350W时,通常必须搭配高转速或高电流的风扇来满足其散热需求,当机壳厂商所安装的风扇规格不够时,就会导致整体散热效能不足,造成系统温度不断升高,影响运算访问速度,甚至严重致系统热当机。

Source:双鸿、富果研究部

3. Cable走线无法优化

由于机壳与主板是分开采购,主板的连接器位置可能与机壳设计的走线不一致,这时就会造成散热风流的干扰,也会降低散热的效能,此类风险问题较不容易于第一时间察觉。

4. 内部线材质量问题

进入高速的PCIe 5.0时,对于缆线的高频特性要求非常的高,通常机壳厂商对于高频技术并不专业,此时所配置的缆线有可能因为高频特性不佳而导致系统效能降低。

5. 高频背板设计挑战

同样的情境还会引发另一个潜在问题,因机壳厂商对高频技术并不专业,因此在设计储存装置的背板时会面临极高的挑战,如Impedance mismatch、Insertion loss/Return loss过大及Cross talk等问题的产生,导致讯号干扰过多而降低服务器效能及系统稳定性。

上述的潜在风险,除了会导致系统效能大幅降低、CPU寿命缩短及系统不稳定外,更严重时将导致系统不断重启、关机或热当机。所影响的会是布署在服务器上的应用服务状态长时间不稳定或中断服务,甚至造成数据的流失,这些将会造成严重的使用者负面体验,并引起众多客诉,进而影响业绩及客户整体数量,品牌的声望也岌岌可危。

作者: 百佳泰测试实验室, 来源:面包板社区

链接: https://mbb.eet-china.com/blog/uid-me-400317.html

版权声明:本文为博主原创,未经本人允许,禁止转载!

文章评论0条评论)

登录后参与讨论
我要评论
0
4
关闭 站长推荐上一条 /2 下一条