从只提供简单的连接到具有媒体播放的功能,网络正迅速地地演进。从面向数据流传送发展到了支持多媒体业务,这是一个很大的变化。这个变化的最终结果是能满足诸如HDTV、VoIP、游戏、高保真音频和很多其它对质量要求十分苛刻的流媒体的应用。这种环境的一个例子就是我们翘首以待多时的数字家庭,其中包括家用无线网关,游戏控制台,VoIP电话,数字媒体播放器,电视和网络存储设备(NAS),要求同时实现传送,存储,分发和播放媒体数据等功能。 这个丰富多彩、激动人心的崭新应用给人们带来了新的挑战。尤其是对处理器设计师们而言,他们正面临着以往从未遇到过的难题。一直以来,处理器的设计者们惯于用“重拳出击”的办式来解决所有问题——即设计处理速度越来越快的处理器,各种问题便随之迎刃而解了。然而对于这个新的应用环境,速度已不再是唯一的因素了,而是需要更高的性能,因为多媒体应用对各方面的性能的要求都将是非常苛刻的。 已有的体系架构和解决方案并不能经济有效地解决多媒体应用中一些其它的需求。这些需求包括持久的高吞吐率,确定性的处理能力,并发应用管理能力,更高的安全性,最优性价比和实时操作系统。随着在网络上应用的这些改变,促生了专门满足上述媒体播放所引起的挑战的新一代处理器,这就是众所周知的通讯和媒体处理器(CMP),这类处理器完全能够满足网络上提供多媒体内容的各种苛刻要求。 基于精简指令集(RISC)设计的处理器的缺陷 传统的处理器(基于RISC)体系架构最初是为了满足标准的网络应用需求而设计的。在这类应用中,网络中数据量的增加是突发性的——即只是阶段性需要一个高吞吐率,随即相对平静。而对于多媒体(如音、视频流)的应用,需要一个在极低的抖动情况下的稳定高带宽数据包处理。传统的基于RISC架构的处理器是采用很繁杂的关联交换体系,基于中断的处理方法,然而这个体系架构在面对需要持久的高带宽,低抖动及具有QoS要求的应用时就显得束手无策了。传统的处理器在别的一些方面也存在根深蒂固的缺陷,比如体系架构的低效率,较长的存储器潜伏时间及使用通用目的的操作系统。 图1:传统的处理器具有繁杂的关联交换中断驱动进程 体系架构的效率是指完成一个特定任务或者标准任务所需的指令数。对于指令数量相对较少的指令集,在时钟周期相同的情况下,能很快完成任务。基于RISC设计的处理器具有载入(load)/存储(store)指令集,因此数据在使用前必须存放在寄存器中,将数据从一个位置移动到另一个位置需要两条指令:一条载入,一条存储。对于服务器来说这类处理器是很好的选择,因为最初就是专门为它们的使用而设计的。但是如果用于通信和多媒体所需的数据处理就不是最佳的选择了。一个数据包在存储器中是按一系列的字节存放的。当处理一个数据包时,CPU先对其进行扫描,在做少量的调整后,可能对其复制。对于数据包处理来说,存储器存储指令集的体系架构具有最好的效率,但是用传统的处理器无法实现。 所有管线型CPU都具有管道延迟时间,因为后面指令所要的数据不能从前面一个的指令中得到,当出现这种情况,管道必须等待,从而降低了性能。选用的或者被错估的分支具有最大的潜伏时间,该潜伏时间也是频率的函数。高频所需的深管道会增加该潜伏时间。当使用LOAD指令调用数据时,如果在使用前不能得到,精简指令集(RISC)的CPU就会发生等待。 存储器等待时间指的是处理器等待指令或者从片外存储器获取数据时每条指令所耗费掉的时间。基于RISC的处理器使用片外存储器降低了处理能力,不能满足多媒体应用的苛刻要求。同时也增加了成本和功耗。随着CPU核的频率越来越快,访问DRAM所需时钟更多了,存储器损耗也相应增加了。 CMP满足多媒体应用新挑战 与基于RISC的处理器相比CMP在体系架构上有很多优势:包括片内存储器,多线程和专用操作系统。除了速度上的优势,这些系统架构上的优势使CMP还能提供持续的高吞吐率,确定性处理能力,并发应用管理能力,安全加速,最优的性价比和实时操作系统。 图2:CMP采用存储器存储体系架构和多线程来实现高效处理能力 满足多媒体应用最有效的设计方案是多线程与存储器存储架构相结合的体系架构。得益于片内存储器,数据包可以直接存入片内存储器中,可以由任何一个独立的线程来处理完成(每个线程可以作为一个独立的处理器来运行),然后再发送出去。这种架构与传统架构相比,能维持持久的高吞吐率,而且抖动减少95%。相反,传统的处理器通过高速缓存从片外DRAM获取数据,而等待时间中有30-60%是用于等待高速缓存。 多媒体应用对传输中的抖动很敏感。抖动影响系统的响应和用户的感受。确定性处理能力能以固定的时间处理每个数据包,从而将抖动从毫秒级降低到微秒级。再加上多线程极低的延迟,就可以提供具有最好的QoS和用户体验的多媒体应用。 如今数字环境提供的应用琳琅满目,这就意味着需要能够并行处理多种多样的不同的应用,而且都要求抖动很小。存储器存储和多线程处理器的优势是显而易见的,因为它能够独立处理多个应用,而且抖动很小。 图3:CMP具有显著的优势——其相对性能大约是基于RISC处理器的2倍 一个专用的硬件安全引擎从核心处理器上卸载安全处理功能,增加了安全性和提供最可靠的网络保护。这个引擎将加密功能和认证改进结合在一起,像一个有国界又像一个无国界的专业级防火墙,防止外部黑客的入侵和偷袭,避免数字财产被非法盗用。 CMP和RISC处理器在每个时钟峰值执行一条指令,所以通常的理解是它们的行为完全由时钟周期决定。然而,事实并非如此。正如上面所述,其它的因素诸如:体系架构的效率,潜伏时间,存储器等待时间和操作系统的类型都直接影响处理器的处理能力。因此对于相同的时钟频率,CMP本质上比传统的处理器更具优势,也具有更好的性/价比。 一个效率较高的软件指的是使用较少的指令来完成相同的工作量。很多基于RISC的处理器采用的是像Linux这样的通用操作系统。因为这些操作系统大多数是为计算方面的应用而设计的,并没有为了通信和多媒体方面的应用而做相应的优化,所以它们速度慢、效率低、延迟时间较长和抖动较大也就不令人感到惊奇了。另外这些操作系统还缺乏与新出现的多媒体应用的兼容性。相反,CMP采用专用操作系统,所以在降低抖动、实时操作性上具有很多优势,效率比基于RISC的处理器高3倍。 作者:Ali Simnad 产品部高级经理 Ubicom公司 | ||
文章评论(0条评论)
登录后参与讨论