作者:张轶群,EDN China技术编辑 发表时间:2007-07-05
网络向我们提供日益丰富的内容(包括:文本、图像、视频和音频),这些内容的表现形式多种多样,仅视频和音频就有几十种格式。传统的ASIC芯片最大缺点是缺乏灵活性和通用性,例如DVD解码芯片通常只支持MPEG-2,MPGE-4和MP3标准,如果要处理更多的格式还需要设计新的芯片,因此ASIC类的芯片不适合网络功能的消费类电子产品应用。X86架构是针对数据处理而设计,可以高效的处理32位或64位整型数字流,但视频数据流的变长数据(不是32位或64位对齐的整型数据)处理和位运算量很大,由此,X86架构不能高效地处理各种媒体应用,而且成本也不适合消费电子产品。
像ADI的Blackfin处理器和TI的DaVinci技术(采用ARM+通用DSP架构)都采用可编程DSP SoC芯片,因为通用DSP的体系结构加入长指令,针对乘法累加等运算优化,其效率比X86提高很多。通用DSP架构针对所有数字信号处理,强调
通用性,应用范围包括医疗、勘测和音/视频。但这种架构并没有专门针对音频、视频进行优化,这导致用于音视频处理的DSP主频通常很高,价格也较贵。那么,是否有一种架构,能够处理所有数字多媒体数据,并且专门针对视频和音频进行优化?专注于通信(Communication)与消费(Consumer)融合的北京希图视鼎科技有限公司(C2 Microsytems)向我们介绍了一种低成本、高性能的可编程平台CC1100,它可满足“网络化娱乐”的要求。该平台从形态上讲是DSP类型的可编程SoC,它是一个完整的编解码器,完全软件可编程性使它适合处理一切音、视频数据。目前C2自己开发了基于CC1100平台的MPEG-2、MPEG-4、H.264、Real Media、Flash和AAC、MP3、AC-3等的编解码算法。
结构特点:1个CPU作主控,3个DSP分别为三类关键运算优化
CC1100平台(见图1)采用C2公司自主设计的1个CPU+3个DSP架构,其中CPU是精简指令集计算机(RSIC)CPU,3个DSP分别针对三类计算进行优化。这三类计算分别是:1,运动估计,这是视频处理中最耗费时间的一类计算,块匹配和运动向量搜索都有专有的指令做运算加速;2,熵编码,这也是图像处理中使用频率很高的计算;3,向量处理,图像是二维数据,对于8×8的图像块,一行像素或者一列像素都视作一个向量进行处理,向量之间的运算在图像处理中也非常常用,另外,这部分也可以兼作音频数据的处理。除了CPU本身固化的加减乘除等指令外,C2公司将上述三类运算量最大的计算抽出来固化为指令库,通过CPU调用这些指令库中的指令,可大大提高运算效率。
需要特别指出的是,在音频数据处理方面一般采用24位整数DSP处理(例如Blackfin),而CC1100平台集成了256位的向量处理器,支持浮点处理,可以支持7.1声道解码和添加复杂的音效处理。该平台架构对视频流码率并不敏感:已验证过15Mbps MPEG-2码流和8Mbps MPEG-4码流。CC1100单芯片支持网络接口和USB,SATA等存储接口,适用于公共场所网络监控设备、流媒体电视、时移电视、硬盘媒体播放机、IPTV等数字家庭娱乐设备以及个人娱乐(例如PMP)和汽车娱乐。关于CC1100是否能应用到手机上,C2公司总裁兼执行官刘锦湘指出,虽然手机也可以处理多媒体的需求,但手机和数字家庭娱乐设备对芯片的规格要求还是有差异的,比如手机芯片多集成基带处理器,功耗要求更低。手机应用不是CC1100的设计目标市场。C2的下一代平台CC1200将采用90nm设计,能够支持所有视频格式的高清解码,并且能够支持WinCE和Linux双系统,可以应用在更广泛的行业市场。CC1100芯片目前采用0.15mm工艺设计,在台积电(TSMC)制造流片。
经验借鉴:找准软件和硬件实现的结合点
CC1100平台最大的特点是实现了一种全新的处理架构,很好地平衡了硬件加速和软件可编程的灵活性。芯片运行在350MHz,视频编解码的性能可以超过700MHz的通用DSP SoC。软件可编程性的优点是使产品保持高度的灵活性、可重用和新产品面世时间短。硬件实现的优点是高性能、低功耗和小尺寸,其中的关键在于采用何种层次的实现,从而达到性能和灵活度的最佳结合。C2公司市场经理刘明璋分析了下一代平台的发展方向:除了降低功耗之外,CC1200平台一个主要的改进是增加一颗ARM CPU,以支持Window CE操作系统,这样原有CPU的处理负担可以减轻很多;另外,CC1200采用90nm工艺制造,而且适于处理高清1080p分辨率的视频应用。
文章评论(0条评论)
登录后参与讨论