 

sunyzz

文章：289 阅读：703855 评论：699 赞：5117

 好友  私信个人主页

文章 289
原创 0
阅读 703855
评论 699
赞 5117

原创【博客大赛】H.264高性能可重构2-D变换结构-1

 2013-3-16 15:11  1483 13 17 分类: 消费电子

这是我翻译的一篇文章，原文《A high-performance reconfigurable 2-D transform architecture for H.264》，有兴趣的可以共同探讨一下~~~，限于字数要求，分开发布~~~

H.264高性能可重构2-D变换结构

摘要：

在MPEG-4 AVC/H.264标准中采用了4*4整数变换矩阵。本文中采用了两种新型的4*4前向和反向变换信号结构用于H.264。本文提出了基于新SFGs的高性能可重构的2-D结构，此结构没有使用转置存储器。本文的设计采用的是0.18um CMOS工艺。本文的设计相对于已经存在的设计在性能上要更优越。在100Mhz的频率下，本结构能够实现在60fps下4096*2048进行实时处理。

一：简介

MPEG-4 AVC（高级视频编码）/H.264 标准相比MPEG-2，H.263和MPEG-4分别能够减少比特率64%，49%和39%。转换模型是H.264中的主要部分。当进行图像数据往频域数据转换时，H.264变换采用的是无乘法的整数算法。整数变换能够消除编码器与译码器之间数据的不匹配，而且计算复杂度较之前要小很多。然而硬件结构实现却仍需要精细的模型。

目前，一些变换VLSI结构已经存在。文献参考[2]和[3]给出了一种包含2个1-D变换结构，16个registers作为转置存储器，此文献中多个变换处理器，对于4*4结构，能够在80MHZ情况下处理320M pixels/sec，其硬件消耗为6538gates。设计[4]给出了一种直接2-D变换结构，此结构不包含转置存储器，能够在200Mhz下实现1.6G pixels/s。文献[5]给出了一种只包含一个1-D变换结构，16个registers作为转置存储器，其硬件消耗为3524 gates，能够支持单变换译码，实现在120Mhz情况下完成M pixels/sec。文献[6]给出了一种设计，在FPGA上处理1720 M pixels/sec，硬件消耗为77280 gates。文献[7]包含了2个1-D变换核，输入可以通过增加或减少一个4*4 block的6个pixels来获得。设计[8]给出了一种包含对H.264量化的变换结构。

本文将重点放在对4*4变换结构的算法和结构进行优化，同时实现高性能的目的。一种更有效的可重构包含之前提到的SFG，能够在H.264支持多变换。本文余下部分的组织如下。第三部分描述新的SFGs和先前提到的结构。第四部分给出结构实现和对比。最后在第五部分将对本文进行总结。

二：H.264中的4*4变换结构

在H.264中包含三种变换：4*4前向/反向整数DCT变换，4*4前向/反向Hadamard变换，2*2Hadamard变换。本文将着重介绍4*4变换的实现，因为2*2变换包含在4*4Hadamard变换中。4*4前向/反向整数DCT变换可以定义为：和，其中X是4*4冗余块数据输入。DCT系数矩阵Cf和Ci如下：

4*4前向/反向Hadamard变换可定义为：，其中WD是16*16内部宏模块中4*4DC组成部分。Hadamard变换系数矩阵H如下：

2-D变换结构可以用1-D变换采用行列分解的方法实现，但是会引入转置存储器。本文将给出一种2-D可重构变换，此变换基于信号流图，不需要转置存储器。

三：结构

A．新型变换（SFG）

4*4前向DCT可以用2个1-D变换替代，如公式：P=CfX和W=PCf（转置），W可以表示为（CfPT）T，2个2*2数组T1和T2可表述如下：

P和W可以用下面的公式表示：

其中Pij，Wij，Aij，Bij是4*4数组中的元素，P，W，A和B是独立的。Aij和Bij如下：

其中Xij是输入矩阵X中的元素，定义两个置换矩阵如下：

依靠左乘M1和M2，矩阵X，PT，A和B中的第2.3.4行能够改变，以便P,W可以通过公式（3），（5）获得。因此，4*4前向DCT变换SFG可以从公式（3）和公式（7）提取出来。SFG详细信息如图1所示，如果r等于2，就是一个2-DSFG，可以每个周期计算16pxiels。

如果T2定义为，r等于1。图1可改为4*4Hadamard变换的SFG。

对于4*4反向DCT，和前面的方法相同，可用于SFG。4*4反向DCT可以被改写为，其中的三个数组可以表示如下：

其中Q和X数组可以表示为如下等式：

博客大赛 h.264

写原创有奖励！2025面包板原创奖励正在进行中

上一篇：【博客大赛】我学代码的苦逼历程
下一篇：【博客大赛】H.264高性能可重构2-D变换结构-2

PARTNER CONTENT

换一换> 更多>

文章评论（4条评论）

登录后参与讨论

sunyzz 2013-3-19 18:36

今天看了EDHChina的博客，才知道有这个功能，以后会用的，三克油！！

回复

用户403664 2013-3-19 14:43

试试用“一键排版”功能？

回复

sunyzz 2013-3-18 15:09

我看了字数没那么多，但是提交的时候说字数超了，另外我编辑的时候图片是对的，而且预览时对的，但是提交后再查看，有的图片不能显示。。

回复

用户403664 2013-3-18 14:57

用高级编辑器应该可以解决字数问题？

回复

查看更多评论

相关推荐阅读

sunyzz 2017-08-19 10:38: 【博客大赛】AVALON总线介绍; 1、AVALON总线简介Avalon总线是一种协议较为简单的片内总线，是ALTERA公司定义的片上互联总线，该总线可以将诸如NIOS II的CPU与其他外设连接起来，进而进行数据交换。AVALON总线...

sunyzz 2017-08-17 21:36: 【博客大赛】不要轻易做职场滥好人; 小A毕业于国内普通高校，但是他聪明，勤奋，能干，动手能力强，可是即便有这些优点也不能让小A轻轻松松找到一份好工作。这不，去年9月份小A好不容易找到一份工作，然后立马就入职了C公司，生怕C公司过两天不要...

sunyzz 2017-08-16 21:15: 【博客大赛】IC设计低功耗技术四; 五：工艺层面的降低功耗前面几节都是在讨论设计人员如何在前期阶段，中期阶段降低功耗，涉及到软件层面的，硬件层面的，这些技巧基本都是前辈总结出来的，或者根据理论推论出来的。但是到了后期，想降低功耗基本就要...

sunyzz 2017-08-14 22:35: 【博客大赛】IC设计之低功耗技术三; 四：RTL（寄存器传输）级的低功耗设计4.1 状态机的设计状态机编码中一般有两种方式，普通的二进制编码，特殊的格雷码，格雷码的特点是两个数据之间的跳变时只会有一个bit在toggle，显然比起多bit...

sunyzz 2017-08-12 16:51: 【博客大赛】IC设计之低功耗技术二; 三、架构层面的降低功耗系统的实现有很多的方式，每种方式对功耗的影响都不相同，本节主要介绍架构对功耗的影响。3.1 高级门口电路在同步电路系统中，时钟占据了大部分的动态功耗，因而在一些情况下，如果有些...

sunyzz 2017-08-12 10:37: 【博客大赛】IC 设计之低功耗技术一; 一、前言随着计算机技术和微电子技术的迅速发展，嵌入式系统应用领域越来越广泛。节能是全球化的热潮，如计算机里的许多芯片过去用5V供电，现在用3.3V，1.8V，甚至更低的电压。目前的低功耗设计主要从芯片...