tag 标签: ai服务器

相关博文
  • 热度 3
    2025-1-24 16:58
    475 次阅读|
    0 个评论
    前篇文章中 『服务器散热效能不佳有解吗?』 提到气冷式的服务器其散热效能对于系统稳定度是非常重要的关键因素,同时也说明了百佳泰对于散热效能能提供的协助与服务。 本篇将为您延伸说明我们如何进行评估,同时也会举例在测试过程中发现的问题及改善后的数据。 AI服务器的散热架构三大重点: GPU导风罩:尝试不同的GPU导风罩架构,用以集中服务器进风量,加强对GPU的降温效果。 GPU托盘:改动GPU托盘架构,验证出风面积大小对GPU散热的影想程度。 CPU导风罩:尝试封闭CPU导风罩间隙,集中风流,验证CPU降温效果。 我们会先与您讨论现况,并实际确认散热架构后,将开始进行温度监控的热电偶布点,完成布点后,开始执行加压程序及温度数据的收集。加压过程中会有不同部件的加压(ex. GPU or CUP)及加压的程度 (ex. 30%~100%),同时也会尝试对风扇的转速控制或制造风扇的故障来模拟各种情境以收集相关的数据做分析,以确保服务器在遇到突发状况时仍能够保持散热的稳定性。 百佳泰针对此项目尝试了两个散热架构的数据收集,经过分析后确认散热架构1的表现较符合预期,测试结果如下图: 在数据收集的过程中,我们也发现了一个异常的现象,在收集PSU布点的电热偶数据中发现:温度的曲线并非是越靠近中心温度越高,有两个点呈现相反的状态。经过分析、与客户讨论后找出其实际原因是因为热风回流所导致,而发生的地方就是在PSU附近的机壳侧面或缝隙。数据数据及过程如下: 改善前PSU温度异常 : 靠近核心的Temperature_2温度 竟低于 外侧温度 Temperature→ 可能的原因为机构设计导致积热/热回流等散热问题 改善后系统PSU温度正常 : PSU核心Temperature_3温度 靠近核心的Temperature_2温度 外侧温度Temperature_1 百佳泰对于服务器散热架构的评估服务有丰富的经验及相关的能力,能够协助客户尽速完成各种架构的评估及最终方案的选定。同时,百佳泰亦建置下列各种不同热负载的Walk-in Chamber,能满足各类型的服务器进行散热架构评估。 13KW Walk-in Chamber Temperature Range: -20 ℃ ~ 80 ℃ 20KW Walk-in Chamber Temperature Range: -40 ℃ ~ 150 ℃ 65KW Walk-in Chamber Temperature Range: -40 ℃ ~ 90 ℃
  • 热度 6
    2024-8-5 13:58
    383 次阅读|
    0 个评论
    金融、人工智能(AI)、物联网(IoT)等行业对服务器的选择有特定的需求,以下是针对这些行业的一些关键考虑因素: 一、金融行业 合规性:确保服务器符合金融行业法规和标准,如PCI DSS(支付卡行业数据安全标准)。 安全性:高等级的安全措施,包括数据加密、防火墙、入侵检测系统和DDoS防护。 稳定性:金融交易需要高度可靠的系统,选择具有高可用性和故障转移能力的服务器。 性能:快速的交易处理能力,选择高性能CPU和低延迟内存。 数据备份:定期备份和灾难恢复计划,确保数据安全。 二、人工智能(AI) 计算能力:AI和机器学习需要大量的计算资源,选择具有高性能GPU的服务器。 存储性能:AI训练需要处理大量数据,选择高速存储系统,如SSD。 可扩展性:AI项目可能需要不断增加计算资源,选择易于扩展的云服务或硬件。 数据隐私:遵守数据保护法规,确保客户数据的安全和隐私。 网络带宽:AI服务可能需要快速的数据传输能力,特别是在分布式学习环境中。 三、物联网(IoT) 连接性:IoT设备产生大量数据,需要高带宽和大量连接支持。 实时处理:IoT应用需要实时数据处理能力,选择低延迟的服务器。 可扩展性:IoT设备数量和数据量可能迅速增长,选择可扩展的服务器解决方案。 安全性:保护IoT设备和数据不受攻击,实施强安全措施。 地理位置:根据IoT设备分布选择地理位置优越的数据中心。 四、通用考虑因素 服务水平协议(SLA):确保服务商提供的SLA满足业务需求,包括正常运行时间、性能和支持。 成本效益:评估总体拥有成本(TCO),包括硬件、软件、维护和电力成本。 技术支持:选择提供24/7技术支持的服务商,确保快速响应和问题解决。 硬件规格:根据具体应用需求选择合适的CPU、内存、存储和网络接口卡(NIC)。 虚拟化/容器化:考虑使用虚拟化或容器化技术提高资源利用率和灵活性。 以上是金融、AI、物联网行业选择服务器的考虑因素,希望能帮助到大家参考!