H.264/AVC发展史 随着电脑硬件设备成本下降以及普及化,渐渐地,多媒体应用的需求越来越大。加上近年来,3G以及Wireless Network发展迅速,因此高效率以及高品质的影像压缩技术越来越受到大众的关注。有鉴于此,国际两大组织ITU-T以及ISO/IEC的MPEG从1993年起也制定了许多影像压缩标准。直到2001年时,MPEG与ITU-T合作成立一个新的单位Joint Video Team(JVT)。到了2003年,其间经过多次的JVT会议之后,终于在第二季提出了统一的标准H.264/AVC。这个标准在ITU-T叫做H.264,而在ISO/IEC则称为MPEG4-Part 10 AVC (Advanced Video Coding),这也是H.264/AVC这个名称的由来。整个流程如图 1所示。
图 1 影像压缩标准时程表
H.264/AVC除了在压缩率上有很显着的提昇之外,在应用层面也比H.263 /MPEG4广泛许多,举凡视频电话,视频会议,监控系统,影像串流(video streaming),手机电视,数字电视以及IPTV等。尽管目前H.264/AVC有取代MPEG2成为下一个世代DVD播放机(HD-DVD,Blue-Ray DVD)影像标准的气势,但是目前仍然有微软VC-1以及中国自行发展的AVS虎视眈眈,因此H.264/AVC仍然有相当大的挑战。接下来就针对H.264/AVC做一些技术上以及现今产业发展和未来挑战的介绍。
H.264/AVC技术解析 H.264/AVC包含了相当多可以改进压缩率以及更适合网路传输的新技术。可以达到上述两项效果,主要是因为H.264/AVC提出了两层的设计:视频编码层(Video Coding Layer,VCL),以及网路提取层(Network Abstraction Layer,NAL)。前者负责提高编码效率,而后者是负责提高在不同网路特性上传输的适应能力。以下我们就视频编码层以及网路提取层来做介绍。
■高编码效率的设计
多参考影像的动作补偿(Multiple reference frame motion compensation) 在H.264/AVC中,最多可以参考到前后多张的影像,这比起之前的标准(MPEG-1,MPEG-2,MPEG-4仅支援前后一张)宽松许多。如图 2所示。在这项改进当中,很明显的就是会看到位元率(Bit Rate)的降低,尤其是在特殊的景色当中。比如说有些背景可能会被某个主体遮住而没有出现在前一张影像,这时候便可在前几张影像中找到这些背景可以提高动作估测(Motion Estimation)的效率减低位元率,提高压缩率。
图 2 多参考影像示意图
可变尺寸区块的动作补偿(Variable block size motion compensation) 一般来说,我们为了提高压缩的效率,会以Macroblock(16 x 16)当成一个编码的单位。可是每张影像都有不同的细致度,有些地方较为细腻,有些地方较为平滑。如果不看影像内容都采用16x16 为单位的编码方式,会降低压缩率。因此,在H.264/AVC中,除了使用16x16为编码单位之外,又提供了16x8,8x16,8x8,8x4,4x8,4x4等六种区块大小。如图 3所示
图 3可变区块种类
Adaptive MB Frame Field Coding(MBAFF) 就影像编码的特性来说,Frame Coding适合用在空间关联性较强的影像而Field coding适合用在时间关联性较强的地方。所以在移动性较小的影像当中Frame coding比Field coding来的有效率,反之则否。在之前的影像标准中,可以选择一张影像为单位的Frame或Field coding。但是因为每个MB都会有不同的移动向量(Motion Vector),所以如果可以依照不同MB特性来做Frame/Field coding的调整,会获得更好的压缩效率。根据这个理论,H.264/AVC中提供了以MB为单位的Frame/Field coding。
环路去区块效应滤波器(In-loop de-blocking filter) 由于H.264/AVC和先前的标准一样都是采用区块基准(block-based)的编码方式,所以会有区块效应(blocking effect)的产生,因此需要去区块效应滤波器去除区块效应。H.264/AVC把去区块效应滤波器放在动作补偿的回路当中,这样既可以去除区块效应,也可以保护影像的细节,改善影像品质。因为需要把滤波后的影像储存起来做动作估测,所以这个滤波器是位在编码器的环路之内而非环路之外,故称为环路(In-Loop)去区块滤波器。
画面内空间预测(Intra prediction) 同一张影像内的空间预测 (Intra prediction)因为一张影像内通常都有很高的空间相关性,所以在空间上做预测可以得到更好的压缩率。在H.264/AVC中提供两种区块大小的空间预测:4x4,16x16。其中4x4的有提供九种预测的方向,16x16的提出四种。如图 4所示,此为九种4X4空间预测模式。
图 4 空间预测4X4九种模式
Context adaptive binary arithmetic coding(CABAC) 这是一种算数编码(entropy coding)的方式。可以达到相当高的压缩率,尤其跟CAVLC来比,更可以提高将近15~20%的压缩率。可以达到这样的效果,主要是因为下面三种原因:1. 针对每一个syntax element’s context 选择机率模型;2. 可以依据统计特性调整估测的机率;3. 利用arithmetic coding。
Context adaptive variable length coding(CAVLC) 这是一个相较于CABAC复杂度较低的编码方式。尽管效果没有CABAC来的好,但是和先前标准所采用的方法比起来,仍然有很大的增加。这些增加主要是因为CAVLC是针对4x4 区块的特性来设计的:1.量化后的区块,其DCT系数含有大量的0,所以再利用run-level coding之后,可以用很少的位元数表示一连串的0。2. 经过zig-zag 扫描之后,在最高层的细数通常为+1/-1。CAVLC可以提供常出现的+1/-1信号很高的压缩率。3. 利用查表将非零系数编码。
■提高网路适应能力的设计
影像/序列参数集(Picture/Sequence parameter set) 由于序列或是影像性质的信息往往比编码内容来的更加重要。所以针对这个特性,H.264/AVC的影像/序列参数集可以独立出来,使之可以在稳定的环境下传输。而在解码端时,也可以判断这些重要的信息封包是否有完整收到,以便可以及时採取一些补救措施,如此一来也可以增强抵抗错误的能力。
资料分割(Data partition,DP) 因为每种信息重要性都不尽相同,所以H.264/AVC提供了一种可以依据重要性将资料包成不同的封包功能。例如可以将动作向量,DCT系数,以及区块信息分成三个不同的封包。如此一来,可以检测出失去的资料类型,以减少影像品质的伤害。
Slice编码模式 Slice就是由许多MB所组成的,而一张影像是由许多Slice所组成的。而Slice可以独自解码不需要其他Slice的资讯。因此,Slice也可以当作抗错的工具之一。图 5(a)(b)表示MPEG-2以及MPEG-4支援的Slice模式。在H.264/AVC中,还有另一个新的架构叫做Flexible Macroblock Ordering (FMO)。如图 5(c)所示。也就是说组成Slice的MB顺序不需要依照循序扫描(raster scan),还可以利用其他的顺序排法,例如:反循序扫描(reverse raster scan)。
(a) (b) (c)
图 5 Slice 的不同示意图
Redundant slices(RS) 这个功能主要是利用传输一个不同表示的影像资料,通常这个资料所表示的影像品质较差。当主要的资料因为环境而产生错误时,就可以利用RS来修补受伤害的影像。
H.264/AVC产业发展现况与挑战 在相同的影像品质之下,H.264/AVC所需频宽比起之前的标准节省40%~100%。直接地说,若把MPEG-2的频宽使用量当做100%,MPEG-4要达相同效能只需60%频宽,H.264更是低至40%,约为MPEG-2的1/2~1/3。目前H.264的发展大致上有三种应用平台:个人电脑,嵌入式系统以及IC。
在个人电脑及嵌入式系统的发展上,国内外都有相当多的厂商投入研发。国外的如Main concept, Ateme以及Moonlight等都有相当不错的研发成果。国内的则有资策会网多所极力投入研发。在研发成果方面,目前国内资策会不论在H.264整体效能不论在个人电脑上以及嵌入式平台上都有相当不错的成果。
IC方面的发展,也是有很多厂商投入人力开发。比较着名的是Broadcom在2005年推出型号为BCM7411D可以支援MPEG-2/H.264/VC-1的解码晶片。
H.264/AVC来势汹汹,不管在效率以及抗错能力的表现上面都有一定的水准,看起来似乎有接替MPEG2成为下一带影像压缩标准的气势。但是H.264/AVC想要成为下一代多媒体应用的使用标准仍然还有很多问题需要克服,下面我们为大家分析一下现阶段H.264/AVC所面临的挑战以及需要改进的地方。
■VC-1、MPEG4、AVS对H.264/AVC的威胁 VC-1是由Society of Motion Picture and Television Engineers(SMPTE)所发佈的视讯压缩标准。VC-1提出了三种profile以及十种levels供不同需求的使用者挑选。
AVS是由中国「数字影视编解码技术标准工作小组」所建立的标准。其全名叫做Audio Video Coding Standard。由这个名称可以得知,这个标准类似MPEG2/4除了Video之外还包括了Audio的标准。目前在大陆有138个会员单位共同参与标准的制定,其中包含了国内外的电子大厂以及中国国内许多着名的大专院校,例如清华大学,北京大学等。
一般业界在选择所用的标准时,不外乎就是讨论两个主要的因素:1.成本,2.效能。所以以下我们针对这两个议题来做讨论。
1. 成本 成本就是复杂度以及权利金。但是复杂度方面可以利用技术以及制程来让整个成本下降,而权利金的支出则是固定的,所以接下来我们会针对不同标准所需的权利金讨论。目前可以对H.264/AVC授权的有MPEG LA以及Via两间公司。如图 6所示。图 7则为Via授权公司对H.264技术的授权金。
图 6 MPEG-LA 的授权金 [6]
图 7 Via的授权金 [6]
另外,目前H.264/AVC已经确定Baseline Profile免收权利金了,所以如果以H.264/AVC和MPEG4来比较的话, H.264/AVC在权利金方面的确是有较大的吸引力。但MPEG4虽然压缩效率比较差,但是其复杂度则相对来说低的多,所以如果MPEG4的权利金突然下降的话,仍然会对H.264/AVC的发展造成很大的威胁。
另外,自从VC-1以及AVS标准制定以后,因为进入市场较晚,纷纷以压低权利金的方式想要抢进市场并且获得各大厂的青睐。VC-1推出编码压缩硬件仅需0.1美元的权利金,而在内容权利金方面更是免收。AVS也推出相当大的优惠,提出了只需要一元人民币(0.12美金)的权利金便可使用所有AVS的权利。但是因为VC-1和AVS目前都只有一间公司提供授权,所以就授权的弹性以及将来性来说,不确定性较大,这也是现在业界所考虑的因素之ㄧ。
2. 效能 目前以效能来看,藉由复杂度的提高,H.264/AVC压缩率大约MPEG4的1.5倍,并且加入了容错机制,减少影像因为传输错误所造成的影响,因此有机会取代MPEG4在网路串流上有更广泛的应用。至于VC-1,就目前官方所提出的资料来看,其压缩率上面的表现并不输给H.264/AVC,而且在复杂度方面也较为简单。另外,目前AVS-P2(AVS高解析视频标准)的表现来看,在压缩率方面大概是MPEG2的两倍,几乎与H.264/AVC不相上下,而其复杂度大约是H.264的70%。目前AVS-P2只有定义baseline profile。和H.264/AVC比起来最大的差异就是增加了B-Frame以及Interlace的功能。
结论 多媒体影音压缩标准从1993年开始发展至今十多年,目前该领域还是依旧有多重互不相容标准共存的现象,而且就目前的局势来看,未来这种情形还是会维持一段时间。第一代影音压缩标准MPEG-2由于建立时间长,技术成熟,可靠性高等优势,成为应用最广泛的标准。MPEG-2不仅被欧洲DVB-X,美国ATSC以及日本的ISDB等数字电视系统所采用,而且也是目前所有DVD市场的主流标准,因此近期以来想要撼动MPEG-2的地位相当不易。再加上现在业界仍有公司努力提高MPEG-2的压缩效率,成果也相当显着,所以MPEG-2在过去以及未来的一段时间都还是国际上最为通行的标准。
由于上述的原因,第二代影音编码标准(MPEG-4,H.264/AVC,AVS)只有在新兴领域开发竞争。由于3G网路以及Wireless Network的普及,所以影音串流的需求量越来越大,这也开辟了第二代影音编码标准竞争的新战场。就目前业界的发展来看,最早起步的H.264/AVC有较大的机会赢得这场战役,而且以目前厂商的态度来看,H.264/AVC拿下影音压缩标准的霸主也只是时间早晚的问题。但是就如同我们之前所分析过的问题,H.264/AVC仍有许多的问题和挑战仍须克服,所以我们就拭目以待这场战役的结果吧。 |
文章评论(0条评论)
登录后参与讨论