tag 标签: PCIe Gen5

相关博文
  • 热度 5
    2024-6-14 11:16
    915 次阅读|
    0 个评论
    为了追求效能,通常会认为需换上更快的处理器、频率更高、容量大的内存、以及更高等级的显示适配器,但往往忽略了储存装置的重要性,若储存装置带宽没有一并提升,整体系统效能便会大打折扣,无法得到有效提升。随着PCIe Gen5问世,以及芯片大厂Intel、AMD相继投入的局势下,PCIe Gen5已成为接下来高性能系统关键角色之一。 PCIe Gen5备受瞩目之原因 以较直接的角度来看,PCIe Gen5效能速率(Link Speed)为前一世代PCIe Gen4的2倍:前者的规格速度可高达32GT/s ,后者的规格速度则为16GT/s;且PCIe Gen5拥有16倍 (x16) 通道的带宽,可高达128GBps的速度。高带宽所带来的优点在于:不同的连接装置可依其需求来平衡带宽及其成本。举例来说,对于可使用较少信道的装置来说,典型的像SSD,一般只需x4通道即可。而对于一些有高带宽需求的设备,则可充分利用x16通道,例如:人工智能/高效能运算卡。储存装置大厂也陆续发表基于PCIe Gen5的SSD,让储存装置也从PCIe Gen4之后有了进化的契机。 不同情况的SSD效能实例分享 PCIe Gen5效能强悍,但若只使用一般市面上的系统来测试其效能程度,会有平台效能不够的疑虑存在,让数据大打折扣,无法完整发挥产品效能。百佳泰拥有专业的PCIe Gen5 SSD测试平台”SANBlaze RM5”可以进行效能验证。 百佳泰以实际数据分析企业级PCIe Gen5 SSD并评鉴其效能,完整不藏私的将其效能数据以及特性揭露,除了PCIe Gen5 SSD的效能信息,我们也挑选了另一高规格企业级的Gen 4 SSD来进行相同的效能测试,考虑现实使用者情境下可能的应用,以不同的档案读写应用比较不同PCIe世代SSD效能表现。 1. 大档循序读取效能: 应用场景:影片播放浏览、大型档案读取浏览、3A游戏执行加载等 关于大档128KB循序读取的效能表现,首先我们从PCIe Gen5 SSD表现来看,此次用来执行效能测试的PCIe Gen5储存装置为Samsung PM1743 Gen5 U.2 SSD,从官网可以得知其效能强大,实际是否真的是如此? 让我们透过实际测试来一探究竟。 在序列深度1的情况下,可以看到效能将近1.5GB/s,也可观察到此时的功耗约在8~9W中间排徘徊,以只有设定序列深度1的情况来说,效能着实不凡。 接着我们将序列深度设置到128,以多线程的角度来观察其效能变化为何,下图中发现其效能明显提升至约13GB/s,同时功耗部份也来到了18~19W之间的高功耗。从这效能结果来看可以发现Gen5 SSD效能强悍。 在此同时我们也来看看相同效能测试下,PCIe Gen4 SSD的效能表现如何。此次选用的PCIe Gen4储存装置为Intel D7-P5620 U.2 SSD。 在相同测试条件下,序列深度1的部份效能约在2GB/s,对比Gen5 SSD表现较好。 但在序列深度设定为128的情况下,效能约只有3.5GB/s,对比Gen5 SSD效能明显低了许多,从这边也能够看出Gen5 SSD在循序读取效能是比Gen4 SSD要来的好。 2. 大檔循序写入效能: 应用场景:定期系统备份、影片备份储存、下载大型档案 关于大档128KB循序写入的效能表现,一样先从Gen5 SSD来看。对于循序写入来说,序列深度设置大小与效能无正相关,因此这部份直接来看序列深度128的效能表现。大档循序写入的效能约在3GB/s,算是相当不错的表现。 那么在Gen4 SSD的循序写入表现如何呢? 从下表可以看出效能落在约1.4GB/s,约只有Gen5 SSD的效能一半。从这边可以了解到在大档下,Gen5 SSD能比Gen4 SSD得到更佳的效能表现。 3. 小档随机读取效能: 应用场景:执行读取应用程序、病毒防护扫描、阅览文件档案 看完了大档循序读写得效能比较后,接着我们来比较小档随机读取的部份。关于小档4KB随机读取,一样先从Gen5 SSD的部份来看,在序列深度1的情况下,Gen5 SSD小档随机读取的效能约在60MB/s左右。 不过到了序列深度128的情况,效能有了爆发性的成长,直接跳到了将近3GB/s,其效能表现已接近部份Gen3/4 SSD循序读取的表现。 接着比对Gen4 SSD的小档随机读取效能表现,在序列深度1的情况下,效能约在60MB/s左右,与Gen5 SSD差异不大。 到了序列深度128的情况下,与Gen5 SSD相同,效能有了显著的提升,约达1.7GB/s。但与Gen5 SSD的表现比较下,还是稍逊一截。 4. 小档随机写入效能: 应用场景:文书编辑处理、 短影音创作、数据库写入 最后我们来观察小档随机写入的部份,关于小档4KB随机写入,先从Gen5 SSD的部份来看,在序列深度1的情况下,Gen5 SSD小档随机写入的效能约在250MB/s左右。 接着来看序列深度128的情况为何,这边出现了跟前面截然不同的表现,可以看到在测试前期效能可以在3.3GB/s左右,不过随着写入容量增加,效能也掉到了约650MB/s左右,写入效能明显衰退。 比对Gen4 SSD的小档随机写入效能表现,在序列深度1的情况下,效能约在250MB/s左右,与Gen5 SSD差异不大。 而在序列深度128的情况下,我们可以看出这颗Gen4 SSD写入效能约在1.4GB/s,虽然明显比Gen5 SSD效能低落,只有一半左右,不过其SSD写入效能可以持续维持到测试结束,效能表现一致。 从以上效能测试数据可以发现,Gen 5 SSD在大多数情况下效能表现明显超越Gen4 SSD,Gen 5 SSD效能能够在我们强大的测试平台上完整发挥其强大的效能。除了大方向的效能优越外,也能找出随机写入效能衰退的情形。透过平台数据,更能快速了解其产品效能水平及其特性。
  • 热度 5
    2022-11-3 16:45
    1017 次阅读|
    0 个评论
    服务器采购质量大解密 – 质量验证三大要求 ,分别对应到 质量基础(规格要求)、用户体验(效能要求)及维护成本(稳定性要求) 等三个面向,说明采购单位如何确认并验证其产品质量,本次将我们将以应用服务面的角度切入,藉由使用者应用情境来探讨规格的要求、实际运用面临的问题以及提高测试效率与精准度的对应治具说明。 应用情境分析 – 云端串流媒体与PCIe测试案例 以云端OTT (Over-the-top)串流媒体应用服务举例,当消费者在家享受 4K/ UHD (Ultra HD) 串流影片时,所需的网络速度约为 20Mbps (依各家OTT服务供货商的媒体压缩技术不同而有所差别),也就是服务器端需要提供2.5MB/s的带宽来服务一位消费者。 再以最基础的 PCIe 规格来看,当服务器连接 JOBD (Just a Bunch Of Disks)的接口使用 PCIe 4.0 时,每个接口的资料吞吐量为 31.51GBs (x16) ,换算下来约可同时服务12,600位消费者。 但当我们将服务器连接 JOBD 的接口改用 PCIe 5.0 时,其资料吞吐量马上 提高一倍到63.02GBs (x16) ,可同时服务的消费者人员数也提高一倍到25,200人。 因此,选用PCIe 5.0规格的服务器,可以大量降低整体服务器布署的数量,进而降低采购成本,后续在电源及维护等成本也会间接降低。 服务器采用的PCIe规格从4.0提升到5.0,虽然可有效的提升服务人数并降低采购总成本,但在质量确认及验收上会变的非常重要。高速讯号提高一倍从16GT/s到32GT/s,除了设计上的挑战之外,讯号质量的验证也变的更困难。 为符合PCIe 5.0的讯号质量要求,在设计上须考虑到: PCB 的材质是否需使用符合高频的PCB材质。 在实际的设计上,因讯号线较长,而必须使用Redriver IC。 连结服务器转接卡的高频线材及连接器高频质量必须是符合需求且可靠。 若是讯号质量不佳,会让服务器无法运行在 PCIe Gen5 的速度,而无法发挥服务器应该有的规格,进而导致服务消费者的应有人数降低或整体系统忙碌而造成服务延迟,使消费者产生负面的使用体验。 在讯号质量的验证上,基本的项目为发送端的眼图量测及接收端的误码率测试。这两个验证项目所用到的设备为 50GHz带宽 的示波器及 32Gbps的误码仪 ,而这两台的设备投资金额需要120万美金。 另外,测试治具的开发也是另一个挑战,一般的测试实验并不具备高频治具的设计开发工程能力,而百佳泰是少数有能力投资上述两台设备同时又兼具高频治具设计开发能力的实验室。 PCIe Gen5 对应测试治具说明 百佳泰针对 PCIe Gen5 开发了涵盖所有的form factor治具,包含 CEM、M.2、U.2/U.3、EDSFF E1/E3及OCP NIC 3.0 。除此之外,百佳泰身为治具的使用者,我们了解到市面上的其它治具在使用体验及坚固度都无法让使用者满意,因此在开发时特别针对这两点设计出特殊的连接器及线材整合模块,实现在高质量的条件下同时满足治具的坚固度及良好的使用者体验。 CEM、M.2、U.2/U.3、EDSFF E1/E3及OCP NIC 3.0的图片与网页链接如下图: 除此之外,为了缩短整体采购质量验证上的时间,百佳泰也开发独有的 PCIe Gen5 自动化量测解决方案 。它采用带宽高达 40GHz的高频硬件 ,搭配百佳泰自行开发的各种form factor治具及自动化执行软件,而且此软件同时具备有向下兼容的自动化测试,让 整体PCIe Gen1~Gen5一个slot (x16)的全部测试从五天缩短到 一天完成 ,在达成五倍的测试效率的同时亦维持测试质量的一致性及避免人为操作上的疏失。