原创如何使用Verilog將YCbCr轉RGB? (SOC) (Verilog) (DE2-70)

 2009-7-8 14:00  3653 6 6 分类: FPGA/CPLD

Abstract
由於不少視訊設備採用的是YCbCr信號(如DVD、DV)，但VGA使用的RGB信號，若要將input結果經過影像處理後，output在VGA，就必須將YCbCr信號轉成RGB才可處理。

Introduction
小美與阿帥是Lab中碩一的新生，最近正在研究DE2-70 CD中的DE2_70_TV範例，由於DE2-70_TV的input是YCbCr信號，需要轉成RGB信號後才能輸出到VGA，範例中提供了YCbCr2RGB.v提供轉換，小美與阿帥研究了很久，還是不太了解其中的意義，最後決定請教Lab中玩DE2-70很久的無雙學長，想徹底了解其中的奧秘。

『我知道YCbCr轉RGB的公式如下：』

R = 1.164(Y-16) + 1.596(Cr-128)
G = 1.164(Y-16) - 0.391(Cb-128) - 0.813(Cr-128)
B = 1.164(Y-16) + 2.018(Cb-128)

『但整個YCbCr2RGB.v看起來與這個公式差很遠，到底Verilog是怎麼辦到的呢?』小美一臉無助地發問。
YCbCr2RGB.v / Verilog

1 module YCbCr2RGB (
2   input        iCLK,
3   input        iRESET,
4   input        iDVAL,
5   input [7:0] iY,
6   input [7:0] iCb,
7   input [7:0] iCr,
8   output reg   oDVAL,
9   output [9:0] Red,
10   output [9:0] Green,
11   output [9:0] Blue
12 );
13
14 // Internal Registers/Wires
15 reg [9:0] oRed,oGreen,oBlue;
16 reg [3:0] oDVAL_d;
17 reg [19:0] X_OUT,Y_OUT,Z_OUT;
18 wire [26:0] X,Y,Z;
19
20 assign Red   = oRed;
21 assign Green = oGreen;
22 assign Blue = oBlue;
23
24 always@(posedge iCLK) begin
25   if (iRESET) begin
26     oDVAL   <= 0;
27     oDVAL_d <= 0;
28     oRed    <= 0;
29     oGreen <= 0;
30     oBlue   <= 0;
31   end
32   else begin
33     // Red
34     if (X_OUT[19])
35       oRed <= 0;
36     else if (X_OUT[18:0] > 1023)
37       oRed <= 1023;
38     else
39       oRed <= X_OUT[9:0];
40
41     // Green
42     if (Y_OUT[19])
43       oGreen<=0;
44     else if (Y_OUT[18:0] > 1023)
45       oGreen<=1023;
46     else
47       oGreen<=Y_OUT[9:0];
48
49     // Blue
50     if (Z_OUT[19])
51       oBlue<=0;
52     else if (Z_OUT[18:0] > 1023)
53       oBlue<=1023;
54     else
55       oBlue<=Z_OUT[9:0];
56
57     // Control
58     {oDVAL, oDVAL_d} <= {oDVAL_d, iDVAL};
59   end
60 end
61
62 always@(posedge iCLK) begin
63   if (iRESET) begin
64     X_OUT <= 0;
65     Y_OUT <= 0;
66     Z_OUT <= 0;
67   end
68   else begin
69     X_OUT <= ( X - 114131 ) >>7;
70     Y_OUT <= ( Y + 69370 ) >>7;
71     Z_OUT <= ( Z - 141787 ) >>7;
72   end
73 end
74
75 // Y 596, 0, 817
76 MAC_3 u0 (
77   iY, iCb, iCr,
78   17'h00254, 17'h00000, 17'h00331,
79   X, iRESET, iCLK
80 );
81
82 // Cb 596, -200, -416
83 MAC_3 u1 (
84   iY, iCb, iCr,
85   17'h00254, 17'h3FF38, 17'h3FE60,
86   Y, iRESET, iCLK
87 );
88
89 // Cr 596, 1033, 0
90 MAC_3 u2 (
91   iY, iCb, iCr,
92   17'h00254, 17'h00409, 17'h00000,
93   Z, iRESET, iCLK
94 );
95
96 endmodule

『對啊!!尤其69行更詭異，114131、69370、141787是怎麼來的?公式裡完全沒出現這3個數字，而且為什麼最後又要 >> 7呢?』阿帥在旁邊也趕緊附和。

69行

X_OUT <= ( X - 114131 ) >>7;
Y_OUT <= ( Y + 69370 ) >>7;
Z_OUT <= ( Z - 141787 ) >>7;

無雙學長最近正埋首幫教授編寫DE2-70教材與畢業論文，不過看到小美與阿帥的好學，心裡還是非常感動，就打算暫停手邊的工作，先解決學弟妹的問題。

『這個問題很多人問過我，主要是因為YCbCr轉RGB的公式牽涉到浮點運算，在Verilog並不容易實現，所以使用了一些技巧重新推導了整個公式，我在(原創) 如何計算浮點數? (SOC) (Verilog)曾經提過這個技巧，當時也有考慮直接拿YCbCr2RGB.v來解講，不過怕這個公式太複雜而模糊了焦點，所以才另外寫了攝氏溫度轉華氏溫度的範例，但在實務上，YCbCr轉RGB應該是最多人第一次遇到浮點運算的機會，趁這個機會，我就把整個module講解一次。』

無雙學長拿了一張紙，準備將公式重新推導一次。

『這是原本YCbCr轉RGB的公式，我們可以發現這需要浮點運算，Verilog雖然有real型別，但只能用在testbench，不能用在RTL。』

R = 1.164(Y-16) + 1.596(Cr-128)
G = 1.164(Y-16) - 0.391(Cb-128) - 0.813(Cr-128)
B = 1.164(Y-16) + 2.018(Cb-128)

『現在將整個算式展開』

R = 1.164Y + 1.596Cr - 222.912
G = 1.164Y - 0.391Cb - 0.813Cr + 135.488
B = 1.164Y + 2.018Cb - 276.928

『因為Verilog無法處理浮點數，所以我們打算使用(原創) 如何計算浮點數? (SOC) (Verilog)提到的技巧：將整個算式先放大處理，最後再縮小，現在將算式左右兩邊放大512倍，也就是2^9，相當於<<9。』

R >> 9 = 596Y + 817Cr - 114131
G >> 9 = 596Y - 200Cb - 416Cr + 69370
B >> 9 = 596Y + 1033Cb - 141787

『為什麼要*512呢?不可以乘其他數字嗎?』細心的小美馬上發現問題。

『當然可以，你也可以*1024，也就是<<10，只要最後記得>>10還原就好。』

『114131、69370、141787這些整數都出現了耶，為什麼75行要使用megafunction呢?』阿帥又發現了另外一個問題。

75行

// Y 596, 0, 817
MAC_3 u0 (
iY, iCb, iCr,
17'h00254, 17'h00000, 17'h00331,
X, iRESET, iCLK
);

// Cb 596, -200, -416
MAC_3 u1 (
iY, iCb, iCr,
17'h00254, 17'h3FF38, 17'h3FE60,
Y, iRESET, iCLK
);

// Cr 596, 1033, 0
MAC_3 u2 (
iY, iCb, iCr,
17'h00254, 17'h00409, 17'h00000,
Z, iRESET, iCLK
);

『596 * Y + 817 * Cr這種乘加運算，當然也可以自己用Verilog寫，並自己處理pipeline以提高Fmax，DE2-70 CD中的範例有個特色，就是工程師對Altera的megafunction相當的熟悉，CD範例中到處可看到工程師巧妙使用megafunction之處，這裡使用了ALTMULT_ADD做乘加，透過megawizard設定就可自動幫你處理pipeline了。阿帥啊，你也自己用Verilog而不用megafunction寫寫看當練習。』

『69行為什麼要減114131呢?又為什麼要>>7呢?』這是小美原本百思不解之處。

69行

X_OUT <= ( X - 114131 ) >>7;
Y_OUT <= ( Y + 69370 ) >>7;
Z_OUT <= ( Z - 141787 ) >>7;

『根據新推導的算式：R >> 9 = 596Y + 817Cr - 114131，X已經MAC_3算出來了，所以還要減去114131才行，至於 >> 7，這是個簡略的寫法，我將完整寫法還原，你們就一目了然了』。

X_OUT <= (( X - 114131 ) >> 9) << 2;
Y_OUT <= (( Y + 69370 ) >> 9) << 2;
Z_OUT <= (( Z - 141787 ) >> 9) << 2;

『原本算式經過 <<9 放大，最後要用 >>9 還原，這很合理，但別忘了output [9:0] Red是10 bit，而input [7:0] iY是8 bit，所以最後還得放大 <<2 才行，一來一往就變成 >> 7了』。

『啊!!原來是這樣啊!!』小美恍然大悟。

『這樣看起來就很完美了，但為什麼34行還要對output做些判斷呢?』阿帥果然思考敏捷，立刻又提出了新的問題。

34行

// Red
if (X_OUT[19])
oRed <= 0;
else if (X_OUT[18:0] > 1023)
oRed <= 1023;
else
oRed <= X_OUT[9:0];

// Green
if (Y_OUT[19])
oGreen<=0;
else if (Y_OUT[18:0] > 1023)
oGreen<=1023;
else
oGreen<=Y_OUT[9:0];

// Blue
if (Z_OUT[19])
oBlue<=0;
else if (Z_OUT[18:0] > 1023)
oBlue<=1023;
else
oBlue<=Z_OUT[9:0];

『由於做了放大再縮小的運算，難免會造成overflow的狀況，所以最後多加了判斷，若大於1023，就當1023記，若小於0，就當成0，這樣結果才合理。』

『無雙學長，我還有最後一個問題，為什麼在DE2-70的範例常常看到58行這種寫法，這倒底是什麼意思呢?』這也是小美困惑很久的問題。

58行

// Control
{oDVAL, oDVAL_d} <= {oDVAL_d, iDVAL};

『這是友晶工程師一種技巧的寫法，讓code可以一行完成，看起來比較精簡，學弟妹們可以將這種技巧學起來，事實上它就相當於以下寫法。』

oDVAL_d <= iDVAL;
oDVAL <= oDVAL_d;

『因為多了一些運算，所以希望data valid的信號多一個clock做delay，若寫成兩行大家就都能看的懂了。』無雙學長做了以上的解釋。

『謝謝學長，我總算看懂整個module在幹什麼了。』

完整程式碼下載
YCbCr2RGB.7z

Conclusion
無雙學長最後做了以下結論：『演算法多多少少都會牽涉到浮點運算，不可能剛剛好都是整數，夠過這個技巧，就能將很多演算法從C語言改用Verilog實現，並配合硬體的parallel、concurrent、pipeline等特性做硬體加速。』

写原创有奖励！2024面包板原创奖励正在进行中