像壓縮編碼基礎

psac · 2005-10-20, 06:23 PM

圖像壓縮編碼基礎

《Visual C++數位圖像獲取、處理及實踐套用》
楊枝靈王開等編著

圖像編碼與壓縮，從本質上來說，就是對要處理的圖像源資料用一定的規則進行變換和組合，從而達到以盡可能少的程式碼（符號）來表示盡可能多的資料訊息的目的。

壓縮通過編碼來實現，或者說編碼帶來壓縮的效果。所以，一般把此項處理稱為壓縮編碼。

壓縮的理論基礎是訊息論。從訊息論的角度來看，壓縮就是去掉訊息中的冗余，即保留不確定的訊息，去掉確定的訊息（可推知的），也就是用一種更接近訊息本質的描述來替代原有冗余的描述。這個本質的東西就是訊息量（即不確定因素）。

在數位圖像壓縮中，有三種基本的資料冗余：像素相關冗余，編碼冗余，心理視覺冗余。如果能減少或者消除其中的一種或多種冗余，就能取得資料壓縮的效果。

1. 像素相關冗余：

指圖像的像素之間一般都有相關性。根據相關性，由一個像素的性質可以獲得其相鄰像素的性質。這種冗余常稱為空間冗余或幾何冗余。

另外連續圖像序列中的各連續畫格之間的冗余也是一種像素相關冗余。

2. 編碼冗余：

圖像編碼需要用一些符號（序列），根據一定的規則來表達圖像。這些符號序列就叫碼字，每個碼字裡的符號個數就叫碼字長度。在實際圖像中，每個訊息出現的概率不一樣，如果它們對應的碼字長度都一樣的話，就不能使編碼產生的符號序列達到最小，就會產生編碼冗余。

3. 心理視覺冗余：因為人的眼睛並不是對所有視覺訊息有相同的敏感度，這些不敏感的訊息就是心理視覺冗余的。去掉這種冗余訊息，並不會明顯降低主觀圖像品質，但實際上會導致定量訊息的損失。

一般情況下，編碼器包括以下順序的三個獨立操作，而對應的解碼器包含反序的兩個獨立操作，如圖所顯示：

http://hqtech.nease.net/Article/Images/ImageCodec.jpg

注意：因為量化操作是不可反轉的，所以解碼器裡沒有對量化的逆操作模組。

根據解碼圖像對原始被壓縮圖像的保真程度，圖像的壓縮方法可分成兩大類：
有損壓縮和無損壓縮。

下面介紹圖像編碼的香農（Shannon）訊息論第一定理——無損編碼理論。如果用H(u)表示信源的熵，定義觀察到單個信源符號輸出時所獲得的平均訊息量。熵達到最大的情況出現在信源各符號的出現概率相等時，而信源此時提供最大可能的每信源符號平均訊息量。

那麼，信源編碼可以使每個信源符號所需要的碼字元號的平均數L』avg/n小到逼近信源的熵，但不能比信源的訊息熵更小。

根據這一定理，圖像信源無損編碼所能達到的最低碼率是受圖像信源的訊息熵限制的。一個給定的編碼方案，其編碼效率y可定義為：
y = n * H(u) / L』avg。

圖像編碼的方法很多，主要分成四大類：像素編碼，預測編碼，變換編碼和其他編碼。

1. 像素編碼：指在編碼時對每個像素單獨處理，不考慮像素之間的相關性。常用的方法有：脈衝編碼調製（Pulse Code Modulation，簡稱PCM）、熵編碼（Entropy Coding）、游程編碼（Run Length Coding）、位平面編碼（Bit Plane Coding）。

2. 預測編碼：指只對新的訊息進行編碼，從而去掉相鄰像素之間的相關性和冗余性。常用的方法有：增量調製（Delta Modulation，簡稱DM）、差分脈衝編碼調製（Differential Pulse Code Modulation，簡稱DPCM）。

3. 變換編碼：指將給定的圖像變換到另一個資料域（如頻域）上，使得大量的訊息能有較少的資料來表示。常用的方法有：離散傅立葉變換（DFT）、離散餘弦變換（DCT）、離散哈達瑪變換（DHT）。

4. 其他編碼方法，一般的有：混合編碼（Hybrid Coding）、向量量化（Vector Quantize，簡稱VQ）、LZW算法等。還有近年來新出現的編碼方法，如使用人工神經元網路（Artificial Neural Network，簡稱ANN）的算法、分形（Fractal）、小波（Wavelet）、關於對像（Object-Based）的算法、關於模型（Model-Based）的算法等。
一般的霍夫曼（Huffman）編碼、香農-費諾（Shannon-Fano）編碼以及算術編碼（Arithmetic Coding）都屬於統計編碼（對於無記憶性信源來說，像素間沒有相關性，而根據像素灰度值出現概率的分佈特性進行的壓縮編碼叫做統計編碼）的範疇。

從圖像壓縮編碼的發展程序來說，可以分成三個階段：

第一代，著重於圖像訊息冗余度的壓縮方法。

第二代，著重於圖像視覺冗余訊息的壓縮方法。

第三代關於模型的圖像壓縮方法。

有關圖像壓縮編碼的國際標準主要有以下幾種：

1. JPEG標準，Joint Picture Expert Group，於1991年提出。

2. JPEG 2000標準，1997年提出，1999年完成。

JPEG 2000關於小波變換的靜止圖像壓縮標準，不僅有更優秀的壓縮效能，而且有更豐富的處理功能。

3. MPEG-1標準，用於多媒體和廣播電視，資料率要求1.5Mbps。

4. MPEG_2/H.262標準，DVD制式的壓縮標準，資料率要求4-10Mbps。

5. MPEG-4標準，1999年完成第三版，是一個新的視瀕和音瀕編碼的國際標準。

最大特點是關於對象的編碼方式以及對合成對象的編碼能力。支持固定和可變速率視瀕編碼（低速小於64Kbps，中速64K-384Kbps，高速384K-4Mbps），目的在於提供適合用於交互多媒體環境下套用的核心技術，解決視瀕信號的有效儲存於和傳輸問題。

6. MPEG-7標準，對圖像內容進行描述，根據描述一般檢索。

7. H.261，全彩色既時視瀕圖像壓縮標準。

8. H.263，低碼率通信視瀕圖像編碼標準。

2005-10-20, 06:23 PM	#1
psac 榮譽會員榮譽勳章勳章總數19 UID - 3662 在線等級: 註冊日期: 2002-12-07 住址: 木柵市立動物園文章: 17381 精華: 2 現金: 5253 金幣資產: 33853 金幣	像壓縮編碼基礎圖像壓縮編碼基礎《Visual C++數位圖像獲取、處理及實踐套用》楊枝靈王開等編著圖像編碼與壓縮，從本質上來說，就是對要處理的圖像源資料用一定的規則進行變換和組合，從而達到以盡可能少的程式碼（符號）來表示盡可能多的資料訊息的目的。壓縮通過編碼來實現，或者說編碼帶來壓縮的效果。所以，一般把此項處理稱為壓縮編碼。壓縮的理論基礎是訊息論。從訊息論的角度來看，壓縮就是去掉訊息中的冗余，即保留不確定的訊息，去掉確定的訊息（可推知的），也就是用一種更接近訊息本質的描述來替代原有冗余的描述。這個本質的東西就是訊息量（即不確定因素）。在數位圖像壓縮中，有三種基本的資料冗余：像素相關冗余，編碼冗余，心理視覺冗余。如果能減少或者消除其中的一種或多種冗余，就能取得資料壓縮的效果。 1. 像素相關冗余：指圖像的像素之間一般都有相關性。根據相關性，由一個像素的性質可以獲得其相鄰像素的性質。這種冗余常稱為空間冗余或幾何冗余。另外連續圖像序列中的各連續畫格之間的冗余也是一種像素相關冗余。 2. 編碼冗余：圖像編碼需要用一些符號（序列），根據一定的規則來表達圖像。這些符號序列就叫碼字，每個碼字裡的符號個數就叫碼字長度。在實際圖像中，每個訊息出現的概率不一樣，如果它們對應的碼字長度都一樣的話，就不能使編碼產生的符號序列達到最小，就會產生編碼冗余。 3. 心理視覺冗余：因為人的眼睛並不是對所有視覺訊息有相同的敏感度，這些不敏感的訊息就是心理視覺冗余的。去掉這種冗余訊息，並不會明顯降低主觀圖像品質，但實際上會導致定量訊息的損失。一般情況下，編碼器包括以下順序的三個獨立操作，而對應的解碼器包含反序的兩個獨立操作，如圖所顯示：注意：因為量化操作是不可反轉的，所以解碼器裡沒有對量化的逆操作模組。根據解碼圖像對原始被壓縮圖像的保真程度，圖像的壓縮方法可分成兩大類：有損壓縮和無損壓縮。下面介紹圖像編碼的香農（Shannon）訊息論第一定理——無損編碼理論。如果用H(u)表示信源的熵，定義觀察到單個信源符號輸出時所獲得的平均訊息量。熵達到最大的情況出現在信源各符號的出現概率相等時，而信源此時提供最大可能的每信源符號平均訊息量。那麼，信源編碼可以使每個信源符號所需要的碼字元號的平均數L』avg/n小到逼近信源的熵，但不能比信源的訊息熵更小。根據這一定理，圖像信源無損編碼所能達到的最低碼率是受圖像信源的訊息熵限制的。一個給定的編碼方案，其編碼效率y可定義為： y = n * H(u) / L』avg。圖像編碼的方法很多，主要分成四大類：像素編碼，預測編碼，變換編碼和其他編碼。 1. 像素編碼：指在編碼時對每個像素單獨處理，不考慮像素之間的相關性。常用的方法有：脈衝編碼調製（Pulse Code Modulation，簡稱PCM）、熵編碼（Entropy Coding）、游程編碼（Run Length Coding）、位平面編碼（Bit Plane Coding）。 2. 預測編碼：指只對新的訊息進行編碼，從而去掉相鄰像素之間的相關性和冗余性。常用的方法有：增量調製（Delta Modulation，簡稱DM）、差分脈衝編碼調製（Differential Pulse Code Modulation，簡稱DPCM）。 3. 變換編碼：指將給定的圖像變換到另一個資料域（如頻域）上，使得大量的訊息能有較少的資料來表示。常用的方法有：離散傅立葉變換（DFT）、離散餘弦變換（DCT）、離散哈達瑪變換（DHT）。 4. 其他編碼方法，一般的有：混合編碼（Hybrid Coding）、向量量化（Vector Quantize，簡稱VQ）、LZW算法等。還有近年來新出現的編碼方法，如使用人工神經元網路（Artificial Neural Network，簡稱ANN）的算法、分形（Fractal）、小波（Wavelet）、關於對像（Object-Based）的算法、關於模型（Model-Based）的算法等。一般的霍夫曼（Huffman）編碼、香農-費諾（Shannon-Fano）編碼以及算術編碼（Arithmetic Coding）都屬於統計編碼（對於無記憶性信源來說，像素間沒有相關性，而根據像素灰度值出現概率的分佈特性進行的壓縮編碼叫做統計編碼）的範疇。從圖像壓縮編碼的發展程序來說，可以分成三個階段：第一代，著重於圖像訊息冗余度的壓縮方法。第二代，著重於圖像視覺冗余訊息的壓縮方法。第三代關於模型的圖像壓縮方法。有關圖像壓縮編碼的國際標準主要有以下幾種： 1. JPEG標準，Joint Picture Expert Group，於1991年提出。 2. JPEG 2000標準，1997年提出，1999年完成。 JPEG 2000關於小波變換的靜止圖像壓縮標準，不僅有更優秀的壓縮效能，而且有更豐富的處理功能。 3. MPEG-1標準，用於多媒體和廣播電視，資料率要求1.5Mbps。 4. MPEG_2/H.262標準，DVD制式的壓縮標準，資料率要求4-10Mbps。 5. MPEG-4標準，1999年完成第三版，是一個新的視瀕和音瀕編碼的國際標準。最大特點是關於對象的編碼方式以及對合成對象的編碼能力。支持固定和可變速率視瀕編碼（低速小於64Kbps，中速64K-384Kbps，高速384K-4Mbps），目的在於提供適合用於交互多媒體環境下套用的核心技術，解決視瀕信號的有效儲存於和傳輸問題。 6. MPEG-7標準，對圖像內容進行描述，根據描述一般檢索。 7. H.261，全彩色既時視瀕圖像壓縮標準。 8. H.263，低碼率通信視瀕圖像編碼標準。
	__________________
	送花文章: 3, 收花文章: 1631 篇, 收花: 3205 次

Google 提供的廣告