原创 【博客大赛】H.264高性能可重构2-D变换结构-1

2013-3-16 15:11 1326 11 15 分类: 消费电子

这是我翻译的一篇文章,原文《A high-performance reconfigurable 2-D transform architecture for H.264》,有兴趣的可以共同探讨一下~~~,限于字数要求,分开发布~~~

 

H.264高性能可重构2-D变换结构

摘要:

MPEG-4 AVC/H.264标准中采用了4*4整数变换矩阵。本文中采用了两种新型的4*4前向和反向变换信号结构用于H.264。本文提出了基于新SFGs的高性能可重构的2-D结构,此结构没有使用转置存储器。本文的设计采用的是0.18um CMOS工艺。本文的设计相对于已经存在的设计在性能上要更优越。在100Mhz的频率下,本结构能够实现在60fps4096*2048进行实时处理。

一:简介

MPEG-4 AVC(高级视频编码)/H.264 标准相比MPEG-2H.263MPEG-4分别能够减少比特率64%49%39%。转换模型是H.264中的主要部分。当进行图像数据往频域数据转换时,H.264变换采用的是无乘法的整数算法。整数变换能够消除编码器与译码器之间数据的不匹配,而且计算复杂度较之前要小很多。然而硬件结构实现却仍需要精细的模型。

目前,一些变换VLSI结构已经存在。文献参考[2][3]给出了一种包含21-D变换结构,16registers作为转置存储器,此文献中多个变换处理器,对于4*4结构,能够在80MHZ情况下处理320M pixels/sec,其硬件消耗为6538gates。设计[4]给出了一种直接2-D变换结构,此结构不包含转置存储器,能够在200Mhz下实现1.6G pixels/s。文献[5]给出了一种只包含一个1-D变换结构,16registers作为转置存储器,其硬件消耗为3524 gates,能够支持单变换译码,实现在120Mhz情况下完成M pixels/sec。文献[6]给出了一种设计,在FPGA上处理1720 M pixels/sec,硬件消耗为77280 gates。文献[7]包含了21-D变换核,输入可以通过增加或减少一个4*4 block6pixels来获得。设计[8]给出了一种包含对H.264量化的变换结构。

本文将重点放在对4*4变换结构的算法和结构进行优化,同时实现高性能的目的。一种更有效的可重构包含之前提到的SFG,能够在H.264支持多变换。本文余下部分的组织如下。第三部分描述新的SFGs和先前提到的结构。第四部分给出结构实现和对比。最后在第五部分将对本文进行总结。

二:H.264中的4*4变换结构

H.264中包含三种变换:4*4前向/反向整数DCT变换4*4前向/反向Hadamard变换,2*2Hadamard变换。本文将着重介绍4*4变换的实现,因为2*2变换包含在4*4Hadamard变换中。4*4前向/反向整数DCT变换可以定义为:20130316145510815001.gif20130316145658603001.gif 其中X4*4冗余块数据输入。DCT系数矩阵CfCi如下:

20130316145519925003.gif

4*4前向/反向Hadamard变换可定义为:20130316145524481004.gif,其中WD16*16内部宏模块中4*4DC组成部分。Hadamard变换系数矩阵H如下:

20130316145529268005.gif

2-D变换结构可以用1-D变换采用行列分解的方法实现,但是会引入转置存储器。本文将给出一种2-D可重构变换,此变换基于信号流图,不需要转置存储器。

三:结构

A. 新型变换(SFG

4*4前向DCT可以用21-D变换替代,如公式:P=CfXW=PCf(转置),W可以表示为(CfPTT22*2数组T1T2可表述如下:

20130316145534274006.gif

PW可以用下面的公式表示:

20130316145538703007.gif

20130316150220683001.jpg

 

其中PijWijAijBij4*4数组中的元素,PWAB是独立的。AijBij如下:

20130316145543125009.gif

其中Xij是输入矩阵X中的元素,定义两个置换矩阵如下:

20130316145548242010.gif

依靠左乘M1M2,矩阵XPTAB中的第2.3.4行能够改变,以便P,W可以通过公式(3),(5)获得。因此,4*4前向DCT变换SFG可以从公式(3)和公式(7)提取出来。SFG详细信息如图1所示,如果r等于2,就是一个2-DSFG,可以每个周期计算16pxiels

 

 

20130316145553823011.gif

如果T2定义为20130316145557338012.gifr等于1。图1可改为4*4Hadamard变换的SFG

对于4*4反向DCT,和前面的方法相同,可用于SFG4*4反向DCT可以被改写为20130316145602179013.gif,其中的三个数组可以表示如下:

20130316150648452001.gif  

 

其中QX数组可以表示为如下等式:

20130316145612682015.gif

 

PARTNER CONTENT

文章评论4条评论)

登录后参与讨论

sunyzz 2013-3-19 18:36

今天看了EDHChina的博客,才知道有这个功能,以后会用的,三克油!!

用户403664 2013-3-19 14:43

试试用“一键排版”功能?

sunyzz 2013-3-18 15:09

我看了字数没那么多,但是提交的时候说字数超了,另外我编辑的时候图片是对的,而且预览时对的,但是提交后再查看,有的图片不能显示。。

用户403664 2013-3-18 14:57

用高级编辑器应该可以解决字数问题?
相关推荐阅读
sunyzz 2017-08-19 10:38
【博客大赛】AVALON总线介绍
1、AVALON总线简介Avalon总线是一种协议较为简单的片内总线,是ALTERA公司定义的片上互联总线,该总线可以将诸如NIOS II的CPU与其他外设连接起来,进而进行数据交换。AVALON总线...
sunyzz 2017-08-17 21:36
【博客大赛】不要轻易做职场滥好人
小A毕业于国内普通高校,但是他聪明,勤奋,能干,动手能力强,可是即便有这些优点也不能让小A轻轻松松找到一份好工作。这不,去年9月份小A好不容易找到一份工作,然后立马就入职了C公司,生怕C公司过两天不要...
sunyzz 2017-08-16 21:15
【博客大赛】IC设计低功耗技术四
五:工艺层面的降低功耗前面几节都是在讨论设计人员如何在前期阶段,中期阶段降低功耗,涉及到软件层面的,硬件层面的,这些技巧基本都是前辈总结出来的,或者根据理论推论出来的。但是到了后期,想降低功耗基本就要...
sunyzz 2017-08-14 22:35
【博客大赛】IC设计之低功耗技术三
四:RTL(寄存器传输)级的低功耗设计4.1 状态机的设计状态机编码中一般有两种方式,普通的二进制编码,特殊的格雷码,格雷码的特点是两个数据之间的跳变时只会有一个bit在toggle,显然比起多bit...
sunyzz 2017-08-12 16:51
【博客大赛】IC设计之低功耗技术二
三、架构层面的降低功耗系统的实现有很多的方式,每种方式对功耗的影响都不相同,本节主要介绍架构对功耗的影响。3.1 高级门口电路 在同步电路系统中,时钟占据了大部分的动态功耗,因而在一些情况下,如果有些...
sunyzz 2017-08-12 10:37
【博客大赛】IC 设计之低功耗技术一
一、前言随着计算机技术和微电子技术的迅速发展,嵌入式系统应用领域越来越广泛。节能是全球化的热潮,如计算机里的许多芯片过去用5V供电,现在用3.3V,1.8V,甚至更低的电压。目前的低功耗设计主要从芯片...
EE直播间
更多
我要评论
4
11
关闭 站长推荐上一条 /3 下一条