原创 数字电视的一些标准

2007-11-28 17:18 3244 4 4 分类: 消费电子

1  ITU-R 601标准


信源编码的第一步是对模拟电视信号进行模数变换,即取样、量化、编码,因此需要一个统一的国际标准,数字演播室标准ITU-R
601正是为此制定的国际标准。早在20世纪70年代末,英国广播公司和索尼公司就分别展示了各自开发的彩色数字录像机,成为最早的数字电视编录产品,由
此促成了电视信号模数转换规范的产生。1980年,国际无线电咨询委员会(CCIR)提出了电视信号模数转换标准的建议,即称为数字演播室标准的CCIR
-601建议。后来CCIR改名为国际电信联盟无线电标准化部门,即ITU-R,相应的CCIR-601建议也改称为ITU-R
601建议,它足模拟电视向数字电视转变过程中的第一个标准规范。


ITU-R
601建议是采用分量数字视频编码方式的国际标准,即以亮度分量y、两个色差分量R-y与B-y为基础进行编码,它在欧洲、日本和北美经过八年的研究和折
衷后于1982年被采纳为电视演播中心数字化编码国际标准。ITU-R601标准适应了国际上已经存在的PAL、NTSC、SECAM三人彩色电视制式的
编码参数,它既支持每帧525行、每秒60场的格式,也支持每帧625行、每秒50场的格式。视频图像信号是由三个分量组成的复合信号,即一个亮度分量
Y,和两个色差分量U(即B-y)与-(即R-y),对视频信号的数字化,根据对三个分量的不同处理方式可分为数字化分量视频和数字化复合视频两类。


ITU-R 601标准规定:


·  对于PAL制与:NTSC制电视,y、R-y、B-y三分量的取样频率分别为13.5 MHz、    6.75 MHz、6.75 MHz。


·  取样后采用线性量化,每个样点的量化比特数用于演播室为10 bit,用于传输为    8bit。


    ·  数字分量视频是对三个分量分别进行取样、量化并形成三个分量视频信号的时    分复用数字码流,y、R-y、B-y三分量样点之间比例为4:2:2,代表三个分量的取样频率之比。这种格式又称为D-1格式,是在数字分量录像机中采用的磁    带格式。


  在1983年9月召开的CCIR中期会议上,又对601建议作了三点补充:


  ·  明确规定编码信号是经过Y预校正的y、R-y、B-y信号;


  ·  相应于量化级0和255的码字专用于同步,l~254的量化级用于视频信号;


  ·  进一步明确了模拟行与数宁行之间的对应关系,规定从数字有效行末尾至基准时间样点的间隔,对525行、60场/秒制式来说为16个样点,对625行、50场/秒制式则为12个样点。


  ITU-R 601标准的演播室分量编码参数(4:2:2格式)如表3-1所示,主要参数说明
如下:


点击看大图
(1)取样频率


根据奈奎斯特定理,取样频率应至少不低于信号最高频率的2倍,其次,为便于进行信源编码,取样结构最好为正交结构,即每个取样点应与其相邻行和相邻
帧对齐,为此取样频率必须为行频的整数倍。要同时满足PAL与NTSC的正交取样,取样频率应为两者行频的公倍数,同时,取样频率的选取还必须兼顾码率和
带宽。综合考虑上述因素,亮度信号的取样频率定为13.5 MHz,在4:2:2格式中,每个色差信号取样数为亮度信号的一半,取样频率定为6.75
MHz。


(2)每行样点数


由取样频率除以行频得到每行取样数,为提高编码效率,去掉行场逆程的取样,得到降低的每数字有效行的取样数。


(3)编码方式


采用简单的线性PCM编码,量化比特数为8 bit,这是一个由实验决定的结果。具体实验显示,8 bit量化产生的256个量化级,已完全能满足人眼对亮度与色度层次分辨的需要。


ITU-R 601主要是一个取样标准,模拟电视信号据此取样后进行8
bit量化和线性PCM编码,即可得到符合数字演播室标准的基带数字信号。,但是,南此得到的数字电视信号具有非常高的码率和带宽,难以进入实用。虽然
ITU-R
60l建议早在1980年已经制定,但直到20世纪90年代一系列有效的图像数码压缩技术及相应的国际标准出现以后,数字电视才得到了迅速发展。


2 H.261标准


H.261是世界上第一个得到广泛承认并产生巨大影响的数字视频图像压缩编码标准,此后国际上制定的JPEG、MPEG-1、MPEG-2、MPEG-4、MPEG-7、H.262、H263等数字图像编码标准都是以H.261标准为基础和核心。


由于意识到会议电视和可视电话在综合业务数字网中的广泛应用前景,CCITT(国际电报电话咨询委员会,现改名为ITU-T,即国际电信联盟电信标
准化部门)于1990年制定了H.261标准,即P×64kb/s上声像业务的视频编解码器。H.26l的目标是会议电视和可视电话,标准推荐的视频压缩
算法必须具有实时性,同时要求最小的延迟时间。当P=1或2时,由于传输码率较低,只能传输低清晰度的图像,因此,只适合于面对面的桌面视频通信(通常指
可视电话)。当P≥6时,由于增加了额外的有效比特数,可以传输较好质量的复杂图像,因此,更适合于会议电视应用。


1.H.261视频格式


CCITT采用CIF(Common Intermediate Format,通用中间格式)和QCIF(Quaiter
CIF,即四分之一的通用中间格式)作为可视电话和会议电视的视频输入格式,即首先将PAL,制、NTSC制或SECAM制的数字视频信号转化为CIF或
QCIF格式,这称为CIF或QCIF格式转换。视频解码时,再将CIF或QCIF格式信号转换回PAL、NTSC或SECAM制视频信号。CIF与
QCIF格式的主要参数如表3-2所示。H.261规定所有的编解码器必须支持对QCIF格式进行操作,而CIF格式则为选项。两种格式的最大图像帧频频
率为30 000/1001(大约是29.97)帧/秒。在传输帧之问,编码器可以允许抛弃1~3帧。


 


522636802.jpg

于每秒29.97帧的CIF和QCIF格式,无压缩速率分别是36.45Mb/s和9.115Mb/s。比特码率减少的最终目的足能够在ISDN信道(P
×64
kb/s,P=1或2,…,30)传输这些视频信号。选择CIF或QCIF依赖于有效的信道容量,例如,对于P=1、2,通常选择QCIF格式作为桌面视
频应用的视频格式。即使对于每秒lO帧的QCIF格式,要想在64kb/s的信道中传输,也需要大约47.5:l的压缩比,这实现起来非常困难。对于
P≥6,可以选择CIF格式。


H.261推荐的视频编码算法是把输入的CIF和QCIF格式的视频分成一系列以块为基础的结构,分为图像(Picture)、块组(GOB)、宏
块(MB)和块(Block)。每个宏块由4个8×8的亮度块和2个8×8的色度块(CR和CB各1个)组成,一个块组由3×11个宏块组成,一个
QCIF图像由3个GOB组成,一个CIF图像则包含12个GOB,如图3-3所示。这种复杂的分级结构是高压缩比视频编码算法所必需的。


522497605.jpg
2.H.261视频压缩编码算法


在ISO和ITU制定的数字视频压缩标准中,压缩算法都采用了混合编码方案,即带有运动补偿的帧间DPCM+二维DCT变换编码。在混合编码中,编
码器中的编码算法主要是利用前一帧来产生当前帧的估值,然后用估值图像和当前帧中相应部分产生差值图像,用适当的机理对差值图像进行编码。在混合编码中,
算法的核心是DCT变换编码。 
原则上DCT对图像不引入失真,仅是实现从一个域变换到另一个域,以便能够更加有效地进行编码。这也意味着如果DCT和IDCT的计算具有无限精度和
DCT系数没有量化,则原始的8×8块能够精确恢复。但是,FDCT(Forward DCT,正向DCT变换)和IDCT(Inverse
DCT,反向DCT变换)在实际实现时均需进行有限精度的运算。FDCT输出的64个DCT系数采用线性量化,量化表由64个元素组成,每个元素是
0~255(或0~1023)中一个整数,它定义了对应于DCT系数的量化步长。量化的目的是通过去除没有视觉意义的信息而达到更进一步压缩,量化是有失
真处理,并且是造成DCT编码器失真的主要来源。


在没有视觉失真的情况下,为了尽可能多地压缩图像,每个量化步长选择为视觉门限。这些视觉门限是源图像特性、显示特性和观看距离的函数。8×8个
DCT变换系数构成一个方形矩阵,左上角代表直流分量,其他系数代表交流分量,右下角足最高频率交流系数,对应于图像信号的最高频率。为了使变换系数所代
表的频率分量由高到低排列,增加连零的个数,提高后面的变字长游程编码效率,对DCT系数采用之字型扫描将变换系数排列成一维数据串。


量化处理交流分量之后,单独处理代表64个图像样值平均值的直流系数。因为相邻块的直流系数之间通常具有很高的相关性,量化后的直流系数可进行差分编码,即把当前块的直流系数值和前一个块的直流系数值的差值进行编码。


H.261视频压缩编解码算法原理框图分别如图3-4、图3-5所示,其基础和核心是混合编码技术,即带有运动补偿的帧问DPCM+二维DCT变换编码+熵编码。


 


点击看大图
压缩编解码算法主要分为帧内编码和帧问编码两类。


    (1)帧内编码


帧内编码系统单独压缩视频的每一帧(有时为每一场),其算法优点是提供了精确的帧定位,便于编辑,但它们的数据量比帧间算法要大2~10倍。


在帧内模式,不进行DPCM运算,图像中每个8×8的子块经DCT变换后生成DCT系数,然后对系数量化和熵编码,最后送给复接器与其他边信息复接到一起构成一路比特码流。此图像帧经类似的反处理后存入帧存中,用于帧间编码。


(2)帧间编码


帧间编、解码器使用了有效的双向预测、运动预测和DCT的组合,以达到高压缩比,从而实现低码率,这类算法的典型例子包括MPEG与H.26x系列算法。


在帧间模式中,要进行帧间DPCM编码。首先,当前帧中的亮度宏块和前一帧相应位置的亮度宏块进行比较,产生活动物体的运动估值:然后,利用此运动
矢量对前一帧中的运动物体进行运动补偿,得到相应的预测宏块。如果当前宏块和预测宏块的差值小于一定门限,则此宏块的数据不进行DCT变换,而是在收端用
预测宏块代替当前宏块。反之,差值进行DCT变换、线性量化、熵编码,然后与运动矢量等边信息一起送到复接器组成一路比特码流。当需要时,可以通过把环路
滤波打开或关闭来滤除高频噪声,以提高图像质量。根据传输缓存器中的数据多少,编码器自适应地调整量化器的量化步长。当缓存器接近写满时,增加量化步长以
减少编码数据量,但这将导致图像质量下降。另一方而,当缓存器不满时,减小量化步长,提高图像质量。


   
为了进一步提高编码效率,在源编码之后紧接着采用变字长熵编码技术。熵编码技术在量化后的DCT系数的统计特性基础上,通过使它们更加紧凑从而实现无失真
压缩。熵编码可看作由两步组成:第一步是把量化后的系数序列转化成中间符号序列,第二步是把符号转换成码流,此时符号表面上不再有可确认的边界。常用的熵
编码有两种:Huffman编码和算术编码。连续图像的编解码器使用Huffman编码,但是对于操作的所有模式,编码器规定了具有上述两种熵编码的方
法。算术编码比Huffman编码可提高10%的压缩效率,但实现较为复杂。Huffman编码需要定义一个或多个编码表,而且压缩图像
和解压图像需要相同码表,Huffman码表可以预先设置和使用内部缺省的码表,也可在实

压缩之前先对给定训练图像进行统计搜集以得到特定码表。 
在H.26l建议中,对于DCT系数有5个变字长码表和各种边信息。视频复接器的输出送到传输缓存器,通过控制量化器的量化步长,缓存器起到平滑码流的作
用,防止其出现上溢出或下溢出,以保证输出码流的码率为恒定值,达到某种预定的图像质量要求。


为能够支持实时编解码,采用不对称的压缩算法卜分必要。对于对称算法,压缩处理和解压处理需要相同的运算量,而不对称压缩算法中解码器比编码器需要
更少的运算量。在理论上,这可使解码器成木降低。随着集成电路技术的不断进步,特别是编解码系统芯片的出现,采用不对称压缩算法的优势已经变得不十分明
显。


3.H.261视频数据流结构


视频编码标准的最重要方面之一是数据结构的定义,以便保证解码器对接收的数据流进行解码时不存在二义性。H.261建议采用层次化数据结构,将
CIF和QCIF的数据结构分为四个层次:图像(Picture)、块组层(GOB)、宏块层(MB)和块层(Block),如图3-6所示。


点击看大图
·  图像层:由帧头和随后的12个块组数据组成,帧头包括一个20比特帧起始码和其他诸如视频格式CIF/QCIF、帧数等标志信息;


    ·  块组层:由GOB头和随后的33个宏块数据组成,GOB头包括16bit块组起始码、块组编号、块组量化步长等标志信息;


·  宏块层:由宏块头和随后的6个块数据组成,MB头包括宏块地址、类型信息、运动矢量数据和编码块图样CBP等信息;


·  块层:由DCT变换系数和块结束码组成,每块为8×8个数据。


4.H.261信道纠错编码


为提高抗信道误码的性能,H.261标准采用了BCH(51l,493)前向纠错编码技术,码长,n=511比特,其中信息码元k=493比特,校
验位为18比特,再加上1比特的同步信息构成一个512比特的子帧,每8个子帧组成一个复帧。复帧的同步方式是分散式,同步字为00011011。18位
校验码的生成多项式是:g(x)=(x9+x1+1)(x9+x6+x3+1),根据纠错编码理论可知,H.261标准推荐的BCH:码可以纠正2个误
码、检出3个误码。


3 H.263标准


公用电话交换网(PSTN,Public Switching Telephone
Network)是全球范围内的一种覆盖面最广、最经济、实用、灵活的通信网,普及程度远远大于ISDN(Integrated
ServiceDigital
Network,综合业务数字网)等数字网,因此,在PSTN上开展视频业务是人们关心的课题。近年来,随着调制解调器(Modem)技术的突破,ITU
于1995年11月制定了V.34和V.34bis的Modem标准,使Modem的速率上升到33.6
kb/s,而且具有良好的抗误码性能。后来ITU又制订通过了56 kb/s
Modem的国际标准V.90,为在PSTN上开展窄带视频业务提供了可能。V.34、V.34bis和V.90建议的制订加速了ITU对于PSTN上多
媒体可视电话标准的制定。1996年6月ITu批准了H.324框架性标准,它可在两个多媒体电话终端之间通过V.34Modem和PSTN实现实时声
音、图像和数据传输,H.324标准的视频压缩编码部分就是ITU H.263标准。H.263足ITU关于码率低于64
kb/s的窄带信道视频编码建议,它在H.261建议的基础之上发展而来,其帧频为每秒10帧以上,图像分辨率为176像素×144行(QCIF格式)或
者128像素×96行(SQCIF格式)。H.261与H.263所支持的不同数据格式,如表3-3所示。


点击看大图
H.263由H.261发展而来,因此两者有许多共同之处,H.263视频编码算法的核心仍然采用H.261标准中的DPCM+DCT混合编码,但是考虑到低比特率的特点,H.263做了以下改进,以提高图像质量。


(1)H.263增加了一种图像格式


在H.26l标准CIF和QCIF格式基础上,H.263增加了SQCIF格式(128×96),H.263要求所有的解码器能以QCIF和SQCIF格式工作。


(2)H.263不限制运动矢量模式


在H.263的默认模式下,运动矢量是受限的。而在不限制运动矢量的模式下,如果图像运动超过原有图像的边缘,特别是在小画面图像SQCIF格式时,允许运动矢量指向图像范围的边缘,获得更好的预测结果,得到更高的编码效率,这正是考虑了可视电话小画面的特点。


(3)H.263采用了高级预测模式


高级预测模式采用了两种新的预测方法,一种是在P帧图像的编码中采用了交叠块的运动补偿,提高了补偿误差的精度;另一种是采用一个宏块包含四个运动矢量模式,宏块中的每个8×8亮度块对应一个运动矢量,预测块尺寸的减少必然带来预测效果提高,使图像质量得到改善。


(4)H.263采用了P、B帧模式


H.263引入了MPEG标准中非常成功的B图像帧模式,即双向预测编码,可以得到较高的图像压缩比,利用将来的参考帧可以正确处理暴露区域,而且能获得更好的统计特性,减少噪声的影响。H.263在不增加码率的基础上,增加了图像的帧频。


(5)H.263采用语义基算术编码模式


H.263用基于语义的算术编码代替霍夫曼编码,霍夫曼编码是在同定比特的整数倍上进行编码,而算术编码可以非整数倍关系进行编码,因此,算术编码编码效率较高。


以上改进措施是H.263提高视频编解码性能的关键技术所在,也是与H.261标准的主要区别。当然H.263与H.261还有一些其他方面的区别,例如块组GOB结构、字头、DCT系数的变字长编码、运动估值精度等。


H.263+和H.263++则是在H.263的基础上增加了更多的编码可选项,它们在语法上与H.263兼容,编码效率有了进一步提高,适用范围
也更加广泛。值得注意的是,H.263+与H.263++中既增加了一些改进编码效率的选项,同时也增加了提高抗误码性能的选项,将适应信道的问题也纳入
了信源编码中加以考虑。


4  H.264标准


1.标准概述


H.264是ITU-T的VCEG(Video Coding Experts
Group,视频编码专家组)和ISO/IEC的MPEG(Moving Picture
Expmrt(3roup,运动图像专家组)联合成立的联合视频组(JVT,Joint Video
Team)共同制订的一个新的数字视频编码标准。由于这个标准是由两个不同的国际组织共同提出,因此有两个不同的称谓:在ITU-T中,称为H.264,
而在ISO/IEC中,它被称为MPEG-4的第10部分(MPEG-4 Part 10),即AVC(Advanced Video
Coding,高级视频编码),这里我们统称为H.264标准。H.264标准的产生如图3-7所示。


点击看大图
H.264
的草案征集始于1998年1月,当时VCEG就已提出了H.26L编码建议,其设计目标是与现有的视频编码标准相比,在相同的图像质量下,压缩比提高一
倍,并且能够满足其他方面更加广泛的应用。1999年10月H.264建议的第一份草案被采纳,2001年5月制定了测试模式T2ML-8。2001年
11月,VCEG和MPEG联合组成了JVT联合视频组,共同制订这一最新的视频编码标准,JVT组织的目标就是研究新的视频编码算法,使其在性能上要比
以往制订的最好标准提高很多。2002年6月JVT第5次会议通过了H.264的FCD版,2003年5月在日内瓦举行的JVT第8次会议上,联合视频组
通过了最后的H.264视频编码标准草案。


目前H.264标准仍处在不断完善之中,有趋势表明,H.264很可能会成为广播电视领域、通信领域及存储媒体领域的统一标准,而且会成为宽带交互
新媒体的国际标准。H.264能够适应现有以及未来网络的发展要求,并能在网络及广播信道中传输与接收。在数字电视领域,H.264已经成为数字高清晰度
电视的编码方案,因此对数字电视与高清晰度电视的普及与发展具有非常重要的意义。


2.H.264与其他视频编码标准


深入理解H.264,必须了解视频编码技术及其国际标准的大致发展历程。这里先简单回顾一下ISO/IEC与ITU-T所制订的两大系列视频编码国
际标准,即MPEG系列与H.26x系列,它们对多媒体通信及存储技术的发展起到了不可估量的巨大推动作用。从H.261到H.262、H.263、
H.263+、H.263++,从MPEG-1至MPEG-2、MPEG-4、MPEG-7,它们都有一个不断追求的共同目标,即实现尽可能低的码率下获
得尽可能高的图像质量,同时又不断引入视频编码的最新技术和最新思想,推动着视频编码技术不断向前发展。


H.261是最早出现的用于会议电视和可视电话的视频编码建议,即“采用p×64
kb/s的声像业务的图像编解码”,因而又简称为p×64,其中p=l,2,3,…,32。当p取l或2时,速率只能达到64~128
kb/s,只能传送清晰度不太高的图像,所以适合于而对面的电视电话;当p取值较大(p>6)时,速率>384kb/s,可以传输清晰度较好
的会议电视图像,所以适用于电视会议。H.261采用了离散余弦变换(DCT)与帧间预测相结合的混合编码方案,它利用运动补偿帧间预测去除图像的时间冗
余度,然后利用离散余弦变换去除空间冗余度,最后利用变字长统计编码去除量化后的DCT系数中的统计冗余度。


H.263是低比特率视频编码标准,它于1996年3月提出,其压缩措施与H.261基本相同,但数据格式各异。H.263在技术上是H.261的
改进和扩充,支持码率小于64kb/s的应用,但实质上H.263以及后来的H.263+和H.263++已发展成支持全码率应用的建议,它们支持众多的
图像格式,如Sub-QCIF(亚1/4通用中间格式)、QCIF(1/4通用中间格式)、CIF(通用中间格式,Common
Intermediate Format)、4CIF(4倍通用中间格式)、16CIF(16倍通用中间格式)等。


MPEG-1的标准码率为1.2
Mb/s左右,可提供30帧CIF(352×288)质量的图像,足为CD-ROM、CD-R、VCD等光盘的视频存储和播放所制订的。MPEG-1标准
中视频编码部分的基本算法与H.261/H.263相似,也采用运动补偿的帧间预测、二维.DCT、可变长度编码(VLC,Variable
Length Coding)、游程编码(RLC,Run Length
Coding)等措施,此外还引入了帧内帧(I)、预测帧(P)、双向预测帧(B)和直流帧(D)等概念,进一步提高了编码效率。


MPEG-2基于MPEG-1标准之上,它在提高图像分辨率、兼容数字电视等方面做了许多重大改进,它采用半像素精度的运动矢量,在运动估计和
DCT的编码运算中区分了帧和场,并引入了编码的可分级性技术,如空间可分级性、时间可分级性、信噪比可分级性,MPEG-2已经成功应用于DVD、数字
电视、高清晰度电视等领域。


MPEG-4标准则引入了基于视听对象(AVO,Audio-Visual
Object)的编码新思想,它采用了新一代视频编码新技术,如形状编码、自适应DCT、任意形状视频对象编码,大大提高了视频通信的交互能力和编码效
率,同时实现了基于像素的传统编码向基于内容的现代编码的转变,但是MPEG-4的基本视频编码器还是采用与H.263相似的混合编码器,其编码方案仍然
是基于DCT(离散余弦变换)+MC(Motion Compensation,运动补偿)+VLC(可变长度编码)的混合编码方案。


 


 




PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
我要评论
0
4
关闭 站长推荐上一条 /3 下一条