TW201419860A - 小波壓縮感測影像編碼之方法 - Google Patents
小波壓縮感測影像編碼之方法 Download PDFInfo
- Publication number
- TW201419860A TW201419860A TW101140560A TW101140560A TW201419860A TW 201419860 A TW201419860 A TW 201419860A TW 101140560 A TW101140560 A TW 101140560A TW 101140560 A TW101140560 A TW 101140560A TW 201419860 A TW201419860 A TW 201419860A
- Authority
- TW
- Taiwan
- Prior art keywords
- band
- zero
- present
- wavelet
- encoding
- Prior art date
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本發明以小波轉換技術及新近壓縮取樣理論為基礎,發展出編碼端簡單,而解碼端較複雜之影像編碼法,適用於分散式影像視訊編碼系統。因小波轉換及JND量化後,各次頻帶的特性明顯不同,若以傳統CS的均勻隨機取樣,效果不佳。本發明方法係以小波壓縮感測相關的研究成果為基礎,目標是研究在給定的量測率MR下,如何作各小波次頻帶相對應之MR分配比例,以獲得較佳的影像重建品質。因而本發明方法分析統計出各次頻帶之CS相關特性,如稀疏性(或稠密性)、Entropy值等作為各頻帶MR分配的依據,進而提出各次頻帶之MR比例與其非零係數比成正比。實驗證明加入非零個數當作分配比例,雖然計算量提升,但是品質比傳統CS隨機分配架構高出10db左右。因為CS的理論是適用於稀疏訊號,對於低頻次頻帶而言,若分配到的MR較高時,次頻帶所有係數做直接傳送的效果會比經過CS還要好。
Description
本發明係涉及影像壓縮處理的方法,尤指係針對小波壓縮感測的編碼方式進行改良,以提升影像重建速度及其品質的一種影像壓縮編碼的方法,同時本發明亦可適用於分散式影像視訊編碼系統。
首先最傳統的影像編碼架構如第73圖所示,一開始進行取樣再來壓縮,然後經過儲存與傳輸,最後到解碼端接收後再解壓縮。再來看到壓縮感測(compressing sensing,簡稱CS)基本架構如第74圖所示,在該壓縮感測步驟時已經完成取樣及壓縮的動作,然後一樣儲存與傳輸,最後到解碼端接收後再重建。接續,將傳統編碼架構及CS基本架構作結合如第75圖所示的CS改良式架構,一開始一樣有取樣,但是在壓縮時,變更為CS的隨機取樣,然後儲存及傳輸,接收後再進行CS重建的工作,目的是利用CS編碼端是非常簡單,來取代傳統的編碼,以利發展分散式視訊編碼器(Distributed Vedio Coding,簡稱DVC),因為DVC系統是很多個編碼器對上單一解碼器,跟傳統的影像或視訊編碼(如JPEG、JPEG2000)是不一樣的,DVC只要簡單的解碼器,這樣可以降低成
本,解碼器是可以複雜的。
另由由本發明人申請本國發明專利,且經編列第100102685號的『基於小波轉換域訊號與人眼視覺特性之壓縮取樣影像編碼技術及其性能評估方法』。該案係使用離散小波(Discrete Wavelet Transformation,簡稱DWT)的Daubechies(9,7)filter,再重建部分則使用梯度投影稀疏重構(Gradient Projection Sparse Reconstruction,簡稱GPSR)的重建方法。
又該案更使用了下述影像編碼技巧:(1)、採用BF當作CS的量測方法;(2)、採用五階段小波轉換;(3)、使用DWT當作CS的稀疏基;(4)、運用小波域的性號特性;(5)、運用了小波轉換後的HL/LH頻帶係數的方向性;(6)使用了JDN量化於小波的次頻帶;(7)分配權重至次頻帶。
如第76圖所示者,特別一提,該案的特色係其壓縮取樣的量測向量未經過量測矩陣隨機取得,而係以各次頻帶之間的訊號特徵(稀疏性和均勻性)來分配量測向量的大小,初步分配給五階小波轉換後各次頻帶的權重LL(包含LL5、HL5、LH5,...,LH2、HH2)、HL、LH、HH分別獲得M/2、M/5、M/5、M/10。
因此,該案係以編碼觀點、信號的特性,據以提出小波的方向性、各個頻帶的重要性以及量化觀念,以lena512*512來說,可以在相同Bit_Rate下,JND-Q+W+D的架構下,該PSNR值會比原始CS隨機取樣架構高出3.5db到6db左右(0.75bpp到1.75bpp),而在計算量上只比原始CS隨機取樣架構多花了6%到18%而已。
鑒於為解決上述問題及滿足影像的快速編碼儲存、快速影像傳輸、其壓縮重建後影像的品質之目的,本發明人乃憑恃著長期對影像編碼技術之構思,而發明出一種小波壓縮感測影像的編碼方法,其方法步驟係包含有:(a).輸入一張圖片,其解析度為m×n;(b).進行多階小波轉換;(c)各頻帶分別進行純量量化;(d)計算各頻帶的非零係數比並分配各次頻帶權重;(e).針對各頻帶去進行壓縮感測處理後,再經round處理;(f)分別送到霍夫曼編碼。
而本發明方法係另包含一解碼方法,其中該解碼方法係包含有以下步驟:(g).將接收到的霍夫曼編碼以進行霍夫曼解碼;(h).分別對各個頻帶進行梯度投影稀疏重建;(i).分別對各個頻帶進行反量化;(j).把各個頻帶合成一個矩陣進行反小波轉換;(k).重建影像並計算其峰值訊噪比值完成後,輸出該影像。
而上述所述round處理係為:NZR_band×M=round(NZR_band×m×n×MR);上述公式中,該NZR_band係指各頻帶的非零係數比,該M=m×n×MR為總取樣個數,該MR係為給定的量測值,最後經過round四捨五入變成整數。
茲由以上說明得知,本發明方法相較先前技術,確可達到如下之功效增進:
1.本發明方法在相同的Bit_Rate下,加入非零係數比(non-zero-ratio)分配的架構,雖然計算量上有大幅提升,但是品質
會比原始隨機分配架構高出10db左右。
2.本發明方法,若頻帶分配到的MR較高時,次頻帶所有係數做直接傳送的效果可能比經過CS還要好,在相同Bit_Rate下,影像品質會高出12db左右。
3.本發明方法若以趨近於零值的HH1直接用零矩陣取代時,品質最多不會相差超過0.5db。
4.另外本發明方法也跟文獻[7]做比較,在相同的條件下,文獻[7]的lena結果是28.39db,而本發明的是32.10db,文獻[7]的boat的結果是25.84db,本發明的是33.86db,明顯可以看到增加許多。
5.本發明與現今JPEG及JPEG2000的編碼方法作比較,雖本發明方法的影像品質都較低,但是在其編碼複雜度方面,本發明方法所發展的架構要比JPEG2000還要快1779%,故本發明方法將有利於發展分散式視訊技術(DVC)。
為進一步說明本發明上述目的、所運用方法及其所達成功效,本發明人將予以詳細說明如后:請參閱第1圖所示,本發明系關於一種小波壓縮感測影像的編碼方法,其方法步驟係包含有:(a).輸入一張圖片,其解析度為m×n;(b).進行多階小波轉換;(c)各頻帶分別進行純量量化;(d)計算各頻帶的非零係數比並分配各次頻帶權重;(e).針對各頻帶去進行壓縮感測處理後,再經round處理;(f)分別送到霍夫曼編碼。
請參閱第2圖所示,另本發明對應前述編碼的方法,亦設有一解碼方法,其中該解碼方法係包含有以下步驟:(g).將接收到的霍夫曼編碼以進行霍夫曼解碼;(h).分別對各個頻帶進行梯度投影稀疏重建;(i).分別對各個頻帶進行反量化;(j).把各個頻帶合成一個矩陣進行反小波轉換;(k).重建影像並計算其峰值訊噪比值完成後,輸出該影像。
茲分別對上述本發明方法的編碼步驟分別詳述如下:
步驟(a).輸入一張圖片,其解析度為m×n:
電腦上的圖片影像是利用影像的小方格就是所謂的像素(Pixel)所構成的,這些小方格是影像中最小的單位,每一個小方格都有一個明確的位置,和單一的色彩,而這些一格格的位置和色彩就決定了該圖片影像所呈現出來的樣子。
而所謂解析度,指的是單位長度上像素的數目,單位可分「像素/英吋」或是「像素/公分」(pixels/inch;pixels/cm)。解析度的設定是決定列印輸出品質的重要因素,高解析度的影像運用較多的像素,所以可呈現出比低解析度影像更細膩的色調變化,相對的檔案體積也更大。因此一張圖片影像的像素總數可以m×n表示,例如上圖的像素總量為:400(寬)X 561(高)=224400。
步驟(b).進行多階小波轉換:
現有的小波壓縮感測技術在影像編碼上具有非常低的複雜度,但是如果實際來運用的話,他的R-D效能卻是非常低的。因此本發明係利用變換域的信號特性和量化方法,讓信號不僅變稀疏,
而且具有較低的編碼訊息量,最後目的是利用壓縮感測編碼端的簡單編碼來降低成本,進而發展分散式視訊編碼器DVC(Distributed Video Coding)。
一、壓縮感測架構:
通常小波壓縮感測(CS理論)架構主要包括訊號的稀疏表示、編碼量測模型、解碼重建模型等這三個方面。分別說明如下:
1.信號的稀疏表示:
請參閱第3圖所示,CS理論的前提條件是訊號具有稀疏性(Sparsity)或可壓縮性(Compressible),考慮長度為N的離散實值信號,記為x,n[1,2,...,N]。由訊號理論可知x能够用一組基ΨT=[Ψ1,Ψ2,...,Ψm,...,ΨM]的線性組合表示(其中ΨT代表Ψ的轉置),
式2.1中:αk=〈x,ΨK〉,α與是N×1矩陣,Ψ是k矩陣。當訊號x在某個基Ψ上僅有α=Ψ x個非零係數(或遠大於零的係數)αK時,稱Ψ為訊號x的稀疏基。信號在稀疏基上只有k個非零係數屬於嚴格稀疏的情況,多數情況下訊號無法滿足嚴格稀疏的要求,但仍具有可壓縮性,即訊號的轉換係數經排序後可以指數進行衰減趨近於零時,訊號也是可以近似稀疏表示的。合理選擇稀疏基Ψ,使得訊號的稀疏係數盡可能減少,不僅有利於提高採集訊號的速度,且有利於減少傳輸信號所佔用的資源。常用的稀疏基有:正(餘)
弦基、小波基、chirplet基以及curvelet基等。
2. CS量測編碼模型:
請參閱第4圖所示,在CS編碼量測模型中並不是直接量測稀疏信號x本身,而是將信號x投影到一組量測向量 s.t.y=ΦΨα上,而得到量測值,ym=〈x,φT m〉。寫成矩陣形式為y=Φx (式2.2)式2.2中:x是N×1矩陣,y是M×1矩陣,Φ是M×N的量測矩陣。將式2.1代入式2.2會得到y=Φx=ΦΨα=Θα (式2.3)
請參閱第5圖所示,式2.3中:Θ=ΦΨ是M×N矩陣。由於量測值維數M遠遠小於信號維數N,求解式2.2的逆問題是一個病態問題,所以無法直接從y的M個量測值中解出信號x。而由於式2.3中α是k稀疏的,即僅有k個非零數,而且k<M<<N,那麼利用訊號稀疏分解理論中已有的稀疏分解演算法,可以通過求解式2.3的逆問題得到稀疏係數α,再帶回式2.1進一步得到訊號x。Candes等人指出為了保證算法上的收斂性,使得k個係數能夠由M個量測值準確的恢復,式2.3中矩陣Θ必須滿足受限等距特性(restricted isometry property,RIP)準則,即對於任意具有嚴格k稀疏(可壓縮情況下要求為3k)的向量v,矩陣Θ都能保證如式2.4之不等式成立
式2.4中ε必須要大於零。RIP準則的一種等價的情況是量測矩陣Φ和稀疏矩陣Ψ滿足不相關特性的要求(Incoherence)。實際量測中稀疏基Ψ可能會因訊號的不同而改變,因此本發明希望找到對任意的稀疏基Ψ都能滿足和量測基Φ不相關。對一維訊號而言,量測矩陣Φ選取服從高斯分佈的基向量能保證和任意稀疏基Ψ不相關的機率很高。故實際中一般採用隨機矩陣進行量測,常見的有二值量測矩陣、複利葉量測矩陣即不相關測量矩陣等。當然,隨著壓縮感測理論的發展,還可能湧出更多的隨機量測方式或方法。
3. CS解碼重建模型
當式2.3中的矩陣Θ滿足RIP準則時,CS理論能夠通過對式2.3的逆問題先求解稀疏係數α=ΨT x後代入式2.1將稀疏度為k的訊號x從M維的量測投影值y中正確地恢復出來。解碼的最直接方法是透過l0範數下求解式2.3的最優化問題
從而得到稀疏係數的估計。由於式2.5的求解釋個NP-hard問題,而該最優化問題與訊號的稀疏分解十分類似,所已有學者從訊號稀疏分解的相關理論中尋找更有效的求解途徑。文獻[1]表明l1最小範數下在一定條件下和l0最小範數具有等價性,可得到相同的解。那麼式2.5轉化為l1最小範數下的最優化問題
稍微的差別使得問題變成了一個凸優化問題(Convex Optimization),
於是可以方便地化簡為線性規劃的問題。l1最小範數下最優化問題又稱為基追蹤(Basic Pursuit,BP)文獻[2],儘管BP算法可行,但在實際應用中存在二個問題:第一,即使是常見的圖片尺寸,計算量複雜度很高,取樣點個數滿足Mlog2 時,重建計算複雜度的量級在O(N3)。第二,由於l1範數無法區分稀疏係數尺度位置,所以儘管整體上重建訊號在歐氏距離上逼近訊號,但存在低尺度能量般移到了高尺度的現象,從而容易出現一些人工效應,如一維訊號會在高頻出現震盪。由於l1最小範數下的算法速度較慢,新的快速貪婪法被逐漸採用,通過局部最優化依次找到各個非零係數,如正交匹配追蹤(Orthogonal Matching Pursuit,OMP)文獻[3]等,這些算法的計算複雜度比BP方法低,但需要更多的觀測值及更大儲存空間。此外,還有很多其他種類的算法,如內點法(Interior Point)文獻[4]、梯度投影法(Gradient Projection Sparse Reconstruction,GPSR)文獻[5]、分段正交匹配追蹤(Stage-wise OMP,StOMP)文獻[6]等。
二、評估CS的四種量測方法:
本發明係使用的CS是由John Hopkins University Thong Do所提出的文獻[8],它們的Transform是使用DWT的Daubechies(9,7)filter文獻[9],再重建部分是使用GPSR(Gradient Projection Sparse Reconstruction)的重建方法。在CS量測方法有四種,分別為BF,SFFT,Ha512 and DCT512,輸入圖片是lena,大小為512*512,將會比較R-D效能及複雜度。
由第6圖及第7圖所示,可以看到BF方法的R-D效能,比其
他三種都好,而複雜度也是比其他人低的,因此本發明係採用BF當作CS的量測方法。
三、評估CS_wavelet小波轉換階數:
在這裡本發明評估要以多少階的小波轉換來用在CS中,因為不同的小波階層,子頻帶的總數也有所不同,例如4階小波轉換有13個子頻帶,5階小波轉換有16個子頻帶等,所以本發明就評估了4、5、6三個不同階層的R-D效能及複雜度。一樣是以lena,大小為512*512。
由第8圖及第9圖所示,可以看到第五階和第六階的R-D效能非常接近,而在計算複雜度方面,可以發現(1)CS編碼器速度遠遠高於CS解碼器(在0.75bpp時編碼器1BCU解碼器為65.22BCU),(2)bpp越大時編碼時間稍微有增加(1BCU到1.11BCU),解碼時間減少(65.22到57.91BCU),(3)小波階數由4變到6得時候,編碼時間增加(1BCU到1.04BCU),解碼時間則減少(65.22BCU到64.84BCU),因為6階的計算複雜度比5階多,但是品質不會提升特別高,所以本發明最後決定採用五階段小波轉換。
四、評估使用DCT或DWT當作CS的稀疏基:
DCT和DWT都是兩種常見的稀疏基,那本發明將評估他們的非零係數、非零係數率、平均訊息量、R-D效能及編解碼複雜度,一樣使用lena圖片,大小為512*512。
由第10圖可以看到DWT的非零係數及非零係數率都比DCT還要好,也可以發現訊號經過這兩個轉換後所得到的平均訊息量
和R-D效能(1)DWT的平均訊息量是4.48bpp而DCT為5.09bpp,(2)從第11圖可以看到DWT的R-D效能優於DCT從1.5db(0.75bpp)到3.2db(1.5bpp)。如第12圖所示,計算複雜度方面DWT的編解碼時間也稍微比DCT還要短一點(編碼1BCU到1.039BCU比上1.20BCU到1.16BCU),解碼時間也是DWT比DCT還要短一些(59.22BCU到50.16BCU比上58.75BCU到52.11BCU),所以本發明決定使用DWT來加入往後的研究。
五、影像編碼利用小波域的性號特性及方向性評估:
在這裡本發明分析CS相關的信號特性,分別是稠密性、稀疏性及均勻性,再來針對小波轉換中HL和LH頻帶係數的方向性進行探討。
1.稠密性、稀疏性和均勻性
在這裡本發明給定N維的稀疏向量(K)為x[n],n[1,N],本發明可以定義稠密性D(x),稀疏性S(x)還有均勻性U(x):
2.小波轉換後的HL/LH頻帶係數的方向性
LH和HL的子頻帶在經過一階小波轉換分解後的子頻帶方向如第13圖所示者。
LH的特點是水平方向的頻率會比垂直方向的頻率還高,如第13圖右上角所示,相反HL的特點是垂直方向的頻率會比水平方向的頻率還高,如第13圖左下角所示。因此本發明就研究這兩個頻帶對於CS會不會有更好的效能。在這裡矩陣向量有兩種方法,以水平為主和以垂直為主。
第14圖和第15圖是XLH取水平方向的結果,第16圖和第17圖是XLH取垂直方向的結果,這裡本發明係針對C_XLH和R_XLH的訊號特性分析,包含稀疏性、平均訊息量和均勻性,如第18圖所示。
本發明可以看到(1)兩個的稀疏性和平均訊息量是一樣的,(2)均勻性是C_XLH比R_XLH好。那本發明這裡為了改進X的稀疏度,假設門檻值小於5的係數都設為0,在第18圖的After可以看到稀疏度從0.063提高到0.96,E(di(X))從1.96升至53.18,這是因為很多系數都變成零的關係(K非零數3837下降至149)。在來比較C_XLH和R_XLH在CS的效能,本發明把C_XLH裡的總個數NLH=4096分成三個點分別是MLH=NLH/2,MLH=NLH/4 and MLH=NLH/8,來估計bit-rate、平均訊息量還有PSNR。
第19圖和第20圖是C_XLH和R_XLH的R-D效能圖及數據表,可以發現C_XLH的R-D效能比R_XLH的還要好,以上面這樣分析來說,本發明可以推斷在HL頻帶,R_XHL的均勻性和R-D效能應該都會比C_XHL還要好。
步驟(c).各頻帶分別進行純量量化:
一、將JND量化於小波次頻帶:
本發明係為在編碼中加入量化可以有效改進R-D效能,舉例來說像JPEG(Joint Picture Expert Group)影像壓縮標準有採用8*8量化表來改進R-D效能。每一個8*8DCT係數都有對應的量化表,這個量化表示依照人類視覺所產生的。一般情況下,在比較低頻係數,人類的視覺會比較敏感,在比較高頻的係數,相對比較不敏感。因此本發明將小波編碼原影像分解成若干的次頻帶,每個次頻帶的JND_threshold的計算方法如下:
其中u,v:honzontal & vertical frequency vespectively.JND sb,ori (u,v)的意義是:次頻帶(sb)在frequency domain中的每一個頻率(u,v) sb計算出其綜合頻率,而由頻率JND曲線JND ori (f)所對應之JND值。JND_threshold Γ sb 可視為在該次頻帶各頻率JND值的方均根(mean square root),各個subband的JND_threshold基本上只與人眼特性有關而不受影像特性所影響。表3.6為上述公式計算出
各次頻帶之JND_threshold,可以依據JND_threshold把不重要(insignificant)的係數捨去。所謂的捨去就是把絕對值小於JND_threshold的係數量化為零,最後本發明採用該次頻帶每個頻率所對應的JND值之均方根值為本發明的JND_threshold,如第21圖所示者。
步驟(d).計算各頻帶的非零係數比並分配各次頻帶權重:
一、量測向量之FLC與VLC性能評估:
因為過去做法是用Entropy來估計Bit_Rate,而本發明為了更接近實際情況,所以在量測向量後加入了實際編碼狀況,並且比較加入FLC與VLC,目前已知VLC的效果一定會比FLC還要好,但是複雜度會增加,那如果經過VLC後的R-D曲線優勢比FLC還要大很多,就會採用VLC來當作量測向量後的處理。
(一)、對於Y M×1後面加入FLC的位元率評估步驟:FLC(Fixed Length Coding)固定長度編碼是N個符號symbol,每個符號用固定log2 N個bits表示。詳細步驟如下:
1.求輸出量測向量YM×1={y1,y2,……yM}T的係數:
這邊本發明將YM×1裡的M個係數都先round(四捨五入)到整數位,向量YM×1中共有N個不同係數值,N=Ymax-Ymin+1其中Ymax及Ymin分別為YM×1的最大值和最小值,不同影像的YM×1其最大值和最小值也會有所不同。
2.計算出向量YM×1的bit數Y_bit。公式為Ybit=ceil(log2 N)N>0,ceil:無條件進位,單位:bit (式4.1)
Ex.ceil(log2 6)=3 Y_bit=3
3.計算位元率Bit rate(bpp,bits per pixel)。公式為
(二)、對於Y M×1後面加入VLC的位元率評估步驟:VLC(Variable Length Coding)可變長度編碼是將資料中出現機率較低之符號以較長位元的字碼來編碼;而出現機率較高之符號則是用較短位元的字碼來編碼,這樣的好處是,可以在編碼同時也達到資料壓縮的效果,其中霍夫曼編碼是非常逼近entropy的,所以本發明選擇使用霍夫曼編碼來加入本發明的架構中。使用的霍夫曼程式是數位影像處理-運用MATLAB課本裡面的toolbox。詳細步驟如下:
1.把原本量測向量YM×1先round(四捨五入)到整數位,表示為YM×1=round(YM×1) (式4.3)
2.經過霍夫曼編碼後會得到新的資料量,表示為huff_YM=mat2huff(YM×1) (式4.4)
3.計算位元率Bit rate(bpp,bits per pixel)。公式為
4.計算YM×1經過霍夫曼之後的平均編碼長度
(三)、對於Y M×1的Entropy計算
1.求輸出量測向量YM×1={y1,y2,……yM}T
機率分佈(histogram):
這邊本發明一樣將YM×1裡的M個係數都先round(四捨五入)到整數位,向量YM×1中共有N個不同係數值,N=Ymax-Ymin+1其中Ymax及Ymin分別為YM×1的最大值和最小值,不同影像的YM×1其最大值和最小值也會有所不同,這時候YM×1量測向量的機率分佈histogram其中nk是第k個係數k{1,2,...,N}出現在YM×1的次數。
2.計算出YM×1的entropy。公式為
(四)評估其效能及複雜度的估計:
在這裡是用PSNR vs.Bit Rate當作效能評估,複雜度則是用時間來估計,測試環境是在沒有執行其他應用程式與其他干擾下執行。執行程式時,加入FLC及加入VLC是分開進行的。測試圖片是用lena、peppers、boat、baboon為樣本如第22圖所示,其解析度大小為512*512灰階,檔案格式為bmp。Measurment_Rate則是使用0.1、0.15、0.2、0.25、0.3來當作同一品質下的固定參數,並會得到不同的Bit rate來做比較。程式所執行的時間,分為編碼及解碼,所使用實驗設備如第第23圖所示。
以PSNR vs.Bit Rate實驗結果第24圖到第27圖來看,以第24圖lena來說,x軸表示Bit_Rate,y軸表示PSNR,取最低點的座標VLC(0.43,23.33)、FLC(0.8,23.35)來看,當MR固定在0.1的時候Bit_Rate分別為0.43bpp和0.8bpp,PSNR分別為23.33db及23.35db,可以發現(1)固定MR,但是PSNR不會一樣,因為他是
以隨機取樣的方式進行,所以固定MR所得到品質會很接近(PSNR不會差超過0.2db),(2)VLC可變長度編碼所需要的Bit_Rate比FLC固定長度編碼少很多,最多可以少1.13bpp(第24圖,1.27bpp和2.4bpp的差值),(3)如果以Bit_Rate大約為1.2bpp來看,VLC所得到的品質大約比32.06db在一低點,FLC所得到的品質25.82db,兩者相差大約6.26db,(4)也可以發現曲線開口會隨MR越高,開口越高。
以時間來估計複雜度的第28圖到第31圖來看,以第28圖leana來說,當MR從0.1調整到0.3時,FLC編碼時間從0.26s增加至0.27s,VLC編碼時間從0.33s增加至0.42s,如果換算就是27%增加到56%,可以發現VLC可變長度編碼所花的編碼時間都比FLC固定長度編碼所花的編碼時間還多,最多是增加56%(如表3.4,MR=0.3)的時間。
最後第32圖到第35圖是說明本發明所使用的霍夫曼編碼所得到的bit數和Entropy是非常接近的,以第32圖lena來說,MR從0.1增加至0.3,Entropy和Huff_avg最少差0.03,最多差0.04,也間接說明本發明所使用的霍夫曼編碼程式的可靠度。
(五).Y M×1 在VLC時分開處理:
在YM×1裡面有LL、HL、LH、HH四個band的所有係數,在VLC的時候,因為是利用機率分佈來編碼,四個band裡面每個band的係數都有相關性,所以本發明在這裡把四個band分別做VLC之後再做傳送,合起來架構如第36圖,分開的架構圖是第37圖。
這樣做複雜度可能會增加,但是總bits數會變少,最後將由實驗結果來評估是否將四個band分別做VLC。
從第38圖所示者係表示四個band一起做VLC及分開做VLC的總bits數比較,可以發現總bits數都是減少的狀態,其中減少最多的為表4.14,MR等於0.3時,兩個相差57808個bits數;第39圖及第40圖所示者係時間複雜度的比較,可以發現時間上沒有大幅上升很多。從以上實驗結果,本發明決定使用四個band分別做VLC可變長度編碼來加入本發明的架構中,當作往後各步驟的基準。
二、小波轉換各頻帶的CS特性分析
壓縮取樣的基本假設是信號具有稀疏性(SPARSITY),而小波轉換後的各次頻帶經個別JND量化後的稀疏程度都有所不同,直覺上去推論量測率MR分配應與SPARSITY成反比,因稀疏度越高,帶訊息的非零係數越少,其訊息量(ENTROPY)較低、故其MR或Bit_Rate(BR)應相對較小。本節目的是探討各次頻帶稀疏性與訊息量的關係,並據以分配各次頻帶適當之MR及BR。
1.各次頻帶的CS特性分析
各個band因為特性不同,所以非零係數所佔的比例也不一樣,這邊以來代表,K表示非零的個數,N表示該頻帶的總係數,K的數量越多就越不稀疏,因此定義稀疏性,S越大代表非零係數越少即稀疏性高。下面有lena、peppers、boat、baboon四張圖片,檔案格式為bmp檔,大小為512*512,各個不同band
的稀疏性SPARSITY及ENTROPY分析。
第41圖及第42圖分別是lena、peppers、boat、baboon四張圖片各個band的稀疏性與訊息量,可以發現越高頻帶稀疏程度越高,而越低頻帶稀疏程度越低,也可以發現越稀疏的時候,Entropy也越小。根據這樣的結果,下面一章,會探討利用稀疏度延伸出非零係數比的觀點。
三、使用非零個數比例來分配次頻帶權重:
1.非零個數比例來分配次頻帶權重動機
本發明方法若以初步分配量測率,分配後的品質比原先的好。本發明係進一步的由第41圖及第42圖的各band的CS特性分析,可以發現越低頻帶稀疏度越低,ENTROPY越高,這也表示,非零的個數相對越多,因此本發明將藉由各個band非零個數的關係,來做為量測率分配的基準。
2.介紹非零個數及非零係數比
以第41圖lena的LL5頻帶來看,LL5的大小為256,稀疏度是0,以HH1頻帶來看,HH1的大小是256*256,稀疏度是0.9999,可以發現越低頻帶,所占的非零個數越多,稀疏度也就越低,重要資訊也都集中在低頻帶,高頻帶的地方所占的非零個數也就較少,相對就很稀疏,資訊的重要性也比較低。
因此本發明定義非零係數比,簡稱NZR(non-zero-ratio),一張圖片經過小波轉換及量化後的的非零係數比(NZR)等於各個頻帶的非零個數(non_zero_band)除以全部頻帶的非零個數總合
(total_non_zero),以計算LL5的非零係數比為例,LL5的非零係數比公式為
藉由式4.8將所有band的非零個數比(NZR)求出來,如第43圖及第44圖所示者。
如此可以觀察到baboon這張圖片因為是屬於高頻訊號較多,所以總非零個數非比其他圖片的非零個數還要多很多,因此在低頻帶的非零係數比,會相對比其他圖片還小,而在高頻帶的非零係數比也比其他圖片還大。
3.使用非零係數比分配次頻帶權重的方法及步驟
上述介紹了非零係數比,在這裡本發明將非零係數比加入壓縮感測的量測率權重分配,之前由本實驗室提出初步分配,是將五階小波轉換,分成四個頻帶去做處理,那本發明這裡討論了各頻帶的非零係數比,以這些非零係數比當作量測率權重分配,因此本發明將五階小波轉換的各頻帶,分別經過量化後,分成十六個頻帶去做壓縮感測處理其編碼及解碼流程如第45圖、第46圖所示者。
四、本步驟會遭遇到的困難與其解決辦法:
本節係以John Hopkins University Thong Do所提供的壓縮取樣架構下,來執行本發明的實驗。
1.所遭遇的困難
困難1,如果MR小於某個值,會發生影像沒辦重建回來,PSNR值變成負的造成重建失敗(程式可執行),第47圖為boat在MR=0.1時,所重建回來的圖片。本發明發現連boat的外型都無法產生,這個原因可能是給的MR太低,導致總取樣個數太少,所以沒辦法將圖片完整重建回來。
困難2,如果HH1向量內的值全部未滿0.5會造成HH1無法執行GPSR重建工作(程式無法執行完成)。當本發明執行壓縮感測後,會先進行round處理,讓他四捨五入到整數,才進行huffman編碼,因為在huffman編碼時,是依原始訊源符號出現機率由大到小排序,這個過程會一直重複直到訊源碼只剩下兩個符號為止,所以如果不進行整數化的動作,會使這個過程消耗大量時間。因為執行round這個動作,使的未滿0.5的數都會變成0,如果HH1裡面的值全部都變為0,解碼時沒有資料可以重建回來,就會造成HH1無法執行GPSR重建工作,所以本發明的解決辦法是當HH1全部的值都未滿0.5就捨棄HH1。
困難3,如果MR大於某個值,會發生無法執行此程式,以lena 512×512圖片的LL5做說明,LL5的解析度為16×16,NZR_LL5=0.0056(LL5的非零係數比),因此NZR_LL5×M=0.0056×512×512×MR,如果MR太大會造成NZR_LL5×M>16×16,也就是超過LL5頻帶解析度的大小,造成無法執行此程式。當給定的MR值會使NZR_band×M>band_size,會變成取樣總數大於等於原本該頻帶的大小,造成沒有意義的行為,所以
本發明的解決辦法就是直接讓他傳送不做壓縮感測。
2.解決辦法
困難1的解決辦法,在最後計算完PSNR的地方加入第一判別式,如果PSNR小於零,代表重建失敗,因此本發明把MR值進行累加的動作,然後重新執行程式,直到PSNR大於零才進行輸出的動作,如第48圖所示者。
困難2的解決辦法,加入第二判別式,當HH1經過壓縮感測後所得到的向量,針對此向量去進行掃描,如果全部的值都未滿0.5,則捨棄HH1,在解碼時用相同大小的零矩陣來代替HH1,如果原本HH1有值大於等於0.5就依照原本流程走,如第49、50圖所示者。
困難3的解決方法,加入第三判別式,在輸入固定MR之後,每個band要做壓縮感測前進行判別,如果NZR_band×M>band_size的話,就讓該頻帶直接傳送到VLC編碼,不做壓縮感測,如果NZR_band×M<band_size就依照原本流程走,如第49、50圖所示者。
實驗的測試平台軟硬體規格都如第23圖所示者,在這裡是用PSNR vs.Bit Rate當作效能評估,以時間當作複雜度評估,測試環境是在沒有執行其他應用程式與其他干擾下執行。測試圖片是用lena、peppers、boat、baboon為樣本,檔案格式為bmp檔,其解析度大小為512*512灰階。Measurment_Rate則是依照圖片不同而設定不同的值,lena分別是0.11、0.14、0.17,baboon分別是0.39、
0.42、0.45,boat分別是0.18、0.21、0.24,peppers分別是0.12、0.15、0.18,由十六個頻帶分開做壓縮感測加上非零個數比例分配次頻帶權重和次頻帶全部合起來做一次壓縮感測全部隨機分配來做比較。
第51圖至第52圖係為四張圖片非零個數比例分配權重和全部隨機分配的R-D曲線,接著來看第53圖的時間複雜度。
第51圖的lena512*512非零個數比例分配權重和全部隨機分配可以觀察到,隨機分配在大約0.53bpp的時候,品質大約是18.12db,而藉由非零個數比例來分配各頻帶權重所得到的結果,在0.55bpp的時候,品質可以遠遠超出全部隨機分配大約12db,來到30.17db,可以看到在同一bpp下雖然複雜度增加,但是品質有驚人的提升,其他三張圖片也顯示出,使用非零個數比例分配次頻帶權重效果大大的提升。在這裡可以觀察到每張圖片所給的MR的範圍有所不同,尤其是baboon這張圖片,最低能重建的MR值需要到0.39,本發明也針對這樣的結果來觀察是否和其他數據有關係,進而發現到baboon的非零個數是四張圖片中最多的,也代表說,在低頻帶的非零係數比相較於另外三張圖片會是偏低的狀態,因此在重建的時候如果一開始給的MR值太低,也就是總取樣數太少,就會發生重建失敗的現象,另外也發現除了baboon以外的圖片,HH1都是用零矩陣取代,也就是說明大部分圖片的HH1可能都是如此。
五、各頻帶分別不經過壓縮感測處理的品質評估:
因為CS的理論是適用於稀疏訊號,對於低頻次頻帶而言,若分配到的MR較高時,次頻帶所有係數做直接傳送的效果可能比經過CS還要好,因此本發明這節評估各頻帶如果不經過CS_Wavelet而直接傳送的效果會是如何。
在第49圖所示的流程圖,進行壓縮感測前,都會進行判斷,而本發明這邊是不用判斷,直接把其中幾個的band不經過壓縮感測直接做傳送的動作。這邊本發明分成A、B、C、D、E五種CASE,如第54圖所示者。
另外要注意的地方是,在不同曲線,總取樣各數和總非零個數都要扣掉一些,舉例來說,再計算M的時侯,原本是圖片解析度假設是lena512*512,那麼M=512×512×MR,但是如果要計算CASE_D的時候必須要把不做壓縮感測範圍的大小扣掉,CASE_D不做壓縮感測的範圍是Lv5(LL5到HH5),也就是32*32的範圍,因此計算M的時候要扣掉32*32變成M=(512×512-32×32)×MR。
計算非零係數比時,分母也要跟著扣掉不做壓縮感測範圍內的各頻帶非零個數的和,也就代表如果是要算全不經過CS的lena LH4的,原本就依照定義
但是如果到Case_D的話因為Lv5不做壓縮感測,所以公式變成
針對不同的狀況,就扣掉不同的範圍。
一樣是選用四張圖片,分別是lena、peppers、boat、baboon,解析度大小都為512*512,這邊的實驗結果共分成8種CASE,8種CASE的說明,如第55圖所示者。
一樣是選用四張圖片,分別是lena、peppers、boat、baboon,解析度大小都為512*512,這邊的實驗結果共分成8種CASE,8種CASE的說明,如第56圖所示者。
由第56圖至第59圖來看,發現(1)CASE_A到CASE_E最左邊的點是MR等於零,也就是A、B、C、D、E這五種CASE有固定的頻帶做直接傳送,代表有一定的資訊量傳送到解碼端去做解碼的動作,因此在MR可以由零開始,(2)另外F、G、H這三種CASE,因為沒有固定的頻帶做直接傳送的動作,因此會發生困難2,也就是MR等於零的時候無法執行壓縮感測,也就代表解碼端沒有資訊可以做重建,(3)CASE_A到CASE_H的MR值都可以到0.99,除了CASE_G不行以外,因為CASE_G是初步分配,沒有加入判別式,所以在MR大於等於0.5的時候,就會發生困難3,也就是總取樣數就會大於其解析度大小,因此無法執行壓縮感測,圖片上也就無法顯示了,(4)CASE_A在MR等於零時,因為是頻帶LL5到頻帶HH2做直接傳送的動作,所以起始的bpp就會偏高,品質也會較好,(5)當MR越高也就是bpp越高時,因為判別式NZR_band×M>band_size都會成立,所以頻帶都不會經過壓縮感測,因此CASE_A到CASE_F的曲線就會越來越趨近於某個值。
因為baboon是屬於高頻訊號較多的一張圖片,在一般比較不常見,因此對此圖片先不做探討,四張圖片的CASE_H曲線(隨機分配),因為在MR=0.5及0.99,Bit_Rate都很大但是品質最多到33db而已,所以H曲線就沒有完整的呈現。
在時間複雜度方面也可以看到,在F曲線(使用非零個數比例分配次頻帶權重)的時候,編碼時間都會偏高,但是到了各頻帶分別不做壓縮感測直接傳送時,編碼時間有稍微下降一點點。
由第60圖至第63圖來看,除了baboon以外的三張圖片,都可以發現是A曲線(Lv2不經過壓縮感測直接傳送)在同一Bit_Rate所得到的品質會是最好的,也可以由表4.21觀察到當總非零個數接近時,例如lena和peppers,跑出來的圖片趨勢也會很接近。也可以觀察到MR越高時,編碼所花的時間也會稍微增加,因為取樣數變多,所以再編碼時會多花一點時間,但是增加時間不會很明顯,解碼部分則是MR越高的情況,速度稍微快一點點。這裡本發明也可以站在使用者的角度來看,如果使用者想要品質大約在30db~34db,本發明就會建議他使用A曲線(Lv2不做壓縮感測直接傳送)的方法,但是如果使用者想要的品質是28db~32db,本發明可能就會建議他使用B曲線(Lv3不做壓縮感測直接傳送)的方法,因為在品質差不多的情況下,Bit_Rate可以稍微降低一點,也是可以推薦給使用者考慮的。
六、針對baboon這張圖片探討HH1的必要性:
根據上述實驗結果會發現,除了baboon這張圖片以外的HH1
都是用空矩陣所取代,那麼這節就來探討,如果也把baboon這張圖片的HH1也用空矩陣取代的話,效果會不會差很多。在上述實驗裡面,總共測試了四張圖片分別是lena、baboon、boat、peppers,其中有三張圖片(lena、boat、peppers)的HH1,因為在經過壓縮感測之後,矩陣內所有的值都未滿0.5,導致沒辦法進行重建的動作,所以在解碼端會以零矩陣取代,那如果把原本baboon的HH1也直接用零矩陣取代,在品質及複雜度會發生怎樣的改變,是本發明要觀察的重點。
在原本的架構中,直接把有關HH1的地方全部都刪除,包含壓縮感測、霍夫曼編碼、霍夫曼解碼、GPSR重建,然後解碼的地方設定一個零矩陣取代HH1。
這裡本發明只針對baboon進行測試,所以測試圖片只有baboon,大小為512*512,MR是使用固定參數,0.39、0.42、0.45,一樣會探討品質及時間複雜度。
由第64圖所示者可以發現,在同一個Bit_Rate下,其實品質是沒有差很多的,最多0.5是db,但是由第65圖可以看到,baboon的HH1在沒有經過壓縮感測,然後在解碼端用零矩陣取代時,編碼時間減少大約3%~5%,而解碼時間少大約25%~27%。由此可知,HH1的重要性真的很低,因此將在原架構中,把HH1的部分都移除,在解碼端由零矩陣取代。
七、與JPEG及JPEG2000比較:
這節主要是把本發明的架構與JPEG及JPEG2000做比較,
JPEG是目前很廣泛使用的圖像壓縮標準方法,他是基於離散餘弦變換,而JPEG2000是基於小波轉換的圖像壓縮標準,那本發明的架構也是有關壓縮方面的處理,因此想與現今的壓縮標準進行比較。
本發明首先找出JPEG及JPEG2000的編解碼程式,分別在文獻[11-12],對於JPEG及JPEG2000本發明調整的參數為量化步階大小,然後會得到相對應的Bit_Rate及PSNR,測試圖片分別是lena、peppers、boat、baboon,大小皆為512*512,檔案格式為bmp檔。顯示圖片是四條,分別是proposed_Lv2、proposed_Lv3、JPEG、JPEG2000,會只選用proposed_Lv2及proposed_Lv3是因為上一小節跑出來的實驗結果,proposed_Lv2及proposed_Lv3效果最好,因此避免產生結果圖太過複雜,所以只選用兩條來加入JPEG及JPEG2000的評估裡。實驗一樣會以品質及時間複雜度分開評估。
請參閱第66圖至第69圖所示者係JPEG、JPEG2000與本實驗室發展出架構proposed_Lv2及proposed_Lv3的RD曲線,表4.35到第70圖是複雜度的比較,其中旁邊的比例是以proposed_Lv2當做基準。那每張圖片因為JPEG及JPEG2000要調整QP值,所以執行出來的Bit_Rate比較難控制,因此四格表格都是分別找出相近的Bit_Rate來進行時間複雜度的比較。第69圖baboon在JPEG這條曲線可以看到Bit_Rate超過1.5bpp之後就沒有,是因為當QP調整到一定的值會發生重建回來圖型會有問題,所以只顯示到Bit_Rate小於1.5bpp。接下來以lena為代表,探討不同架構在不
同Bit_Rate時,編解碼時間以及品質為何。
第71圖是以lena為代表,來探討不同Bit_Rate時,編解碼時間以及品質的不同,可以發現proposed_Lv2、proposed_Lv3及JPEG這三個架構在Bit_Rate逐漸增大時,編碼時間沒有很明顯的增加,但是在JPEG2000卻是大幅度的增加。也可以特別注意到,proposed_Lv2在Bit_Rate等於1.3bpp時,品質來到38.89db,但是在JPEG2000只要Bit_Rate等於0.64bpp的時候,就可以到達38.25db這麼高的品質,但是編碼時間還是比本發明的還要慢。
由此可以發現JPEG2000在Bit_Rate越高的情況下,編碼時間會大幅度增加,因為本發明的架構也是使用小波轉換,所以本發明這邊就針對小波轉換在不同Bit_Rate,對JPEG2000編碼時間是否有直接影響做一個實驗。測試圖片一樣是選用四張,分別是lena、peppers、boat、baboon,解析度大小都為512*512,其結果如第72圖所示,可以發現JPEG2000在Bit_Rate比較低的時後,小波轉換時間占編碼時間的比率比較大,反過來當Bit_Rate比較高的時候,小波轉換時間占編碼時間的比率就比較低。這樣的結果也就說明了,在Bit_Rate較高的情況下小波轉換並沒有直接影響到JPEG2000,而是後續處理的Bit plane影響較大。
因此可以觀察到,JPEG及JPEG2000在同一Bit_Rate下,大部分的品質都比本實驗室架構還高,但是以lena為例,在Bit_Rate大約在1.3bpp時,品值會比JPEG還高一些,在來看到時間複雜度,如果以第70圖的lena的圖片來看,可以發現在Bit_Rate接
近的情況下,proposed_Lv2的編碼時間是0.67s,而JPEG2000的編碼時間是11.92s,本發明的架構比JPEG2000快11.25(1779%)秒,如果要發展DVC,分散式視訊編碼的觀點,也就是編碼簡單降低成本而解碼可以複雜,那本發明的架構就會很適用於此。
步驟(e).針對各頻帶去進行壓縮感測處理後,再經round處理:
其中本步驟的round處理係為:NZR_band×M=round(NZR_band×m×n×MR);上述公式中,該NZR_band係指各頻帶的非零係數比,該M=m×n×MR為總取樣個數,該MR係為給定的量測值,最後經過round四捨五入變成整數。
步驟(f).分別送到霍夫曼編碼:
該霍夫曼編碼法在許多標準中被採用,最著名的就是應用於失真影像壓縮標準的JPEG中。在JPEG標準中,影像被切割為8x8的區塊,每一區塊各自進行轉換編碼,轉換後的64個係數就是使用霍夫曼編碼法加以編碼、壓縮。由於霍夫曼編碼、解碼係為現有技術,在此不做贅述。
另本發明解碼步驟(g)、(h)、(i)、(j)、(k)係相對應於前述的編碼方法原理,以進行解碼,因此步驟(g)、(h)、(i)、(j)、(k)在此不做贅述。
本發明方法以發明專利申請案第100102685號的基礎架構下,並且提出以初步分配次頻帶權重來讓R-D效能變好。在來針對ENTROPY來估計Bit_Rate,本發明決定使用FLC及VLC來更實
際貼近Bit_Rate的值,評估後發現VLC在同一Bit_Rate下,品質可以比ECL高大約6.26db(lena,1.2bpp),再來針對信號的特性,像稀疏性(或稠密性)、Entropy值作為各頻帶MR分配的依據,從一開始次頻帶分成四個頻帶去做壓縮感測和初步分配,進而延伸至十六個次頻帶分開做壓縮感測及利用非零係數比當作次頻帶權重的分配比例,由實驗可以看出,在相同的Bit_Rate下,加入non-zero-ratio分配的架構,雖然計算量上有大幅提升,但是品質會比原始隨機分配架構高出10db左右。再來本發明評估若分配到的MR較高時,次頻帶所有係數做直接傳送的效果可能比經過CS還要好,實驗結果也發現Lv2也就是LL5、HL5、LH5、...、LH2,HH2都不經過壓縮感測,跟傳統壓縮感測隨機分配架構相比,在相同Bit_Rate下,品質會高出12db左右,但是可以根據使用者所要求不同的品質範圍,推薦不同的方法。最後評估HH1是否可以直接以零矩陣取代,實驗結果也發現HH1直接用零矩陣取代時,品質最多不會相差超過0.5db,也決定將HH1都用零矩陣取代。另外本發明也跟文獻[7]做比較,在相同的條件下,他們的lena結果是28.39db,而本發明的是32.10db,他們boat的結果是25.84db,本發明的是33.86db,明顯可以看到增加許多。最後也與現今的編碼方法JPEG及JPEG2000去做比較,雖然品質都會比較低,但是在編碼複雜度方面,本發明的架構比JPEG2000還要快1779%,而且本發明所使用的JPEG及JPEG2000都是MATLAB提供已經優化後的程式碼,而本發明的程式碼是尚未經過優化的處理,往
後如果優化後就可以把本實驗室架構加入分散式視訊編碼來發展及研究。
文獻[1] Y. Tsaig and D. L. Donoho, "Extensions of compressed sensing," Signal Process., vol. 86, pp. 549-571, 2006.
文獻[2] S. S. Chen, et al., "Atomic Decomposition by Basis Pursuit," SIAM Rev., vol. 43, pp. 129-159, 2001.
文獻[3] J. A. Tropp and A. C. Gilbert, "Signal Recovery From Random Measurements Via Orthogonal Matching Pursuit," Information Theory, IEEE Transactions on, vol. 53, pp. 4655-4666, 2007.
文獻[4] K. Seung-Jean, et al., "An Interior-Point Method for Large-Scale <i>1</i><sub>1</sub>-Regularized Least Squares," Selected Topics in Signal Processing, IEEE Journal of, vol. 1, pp. 606-617, 2007.
文獻[5] M. A. T. Figueiredo, et al., "Gradient Projection for Sparse Reconstruction: Application to Compressed Sensing and Other Inverse Problems," Selected Topics in Signal Processing, IEEE Journal of, vol. 1, pp. 586-597, 2007.
文獻[6] D. L. Donoho, et al., "Sparse Solution of Underdetermined Systems of Linear Equations by Stagewise Orthogonal Matching Pursuit,"
Information Theory, IEEE Transactions on, vol. 58, pp. 1094-1121, 2012.
文獻[7] B. Huihui,et al., "Compressive Sensing for DCT Image," in Computational Aspects of Social Networks (CASoN), 2010 International Conference on, 2010, pp. 378-381.
文獻[8] T. T. Do, et al., "Fast compressive sampling with structurally random matrices," in Acoustics, Speech and Signal Processing, 2008. ICASSP 2008. IEEE International Conference on, 2008, pp. 3369-3372.
文獻[9] 吳炳飛,et al., JPEG2000影像壓縮技術,2003.
文獻[10]
http://www.cs.cf.ac.uk/Dave/Multimedia/Lecture_Examples/Compression/jpeg/im2jpeg.m.
文獻[11]
http://www.cs.cf.ac.uk/Dave/Multimedia/Lecture_Examples/Compression/jpeg/jpeg2im.m.
文獻[12]
http://www.mathworks.com/matlabcentral/fileexchange/36419-jpeg2000-matlab-wrapper.
綜合以上說明,本發明係關於一種『小波壓縮感測影像的編
碼方法』,且其未曾見於書刊或公開使用,誠符合發明專利申請要件,懇請 鈞局明鑑,早日准予專利,至為感禱;需陳明者,以上所述乃是本發明之具體實施立即所運用之技術原理,若依本發明之構想所作之改變,其所產生之功能作用仍未超出說明書及圖式所涵蓋之精神時,均應在本發明之範圍內,合予陳明。
(a)、(b)、(c)、(d)、(e)、(f)、(g)、(h)、(i)、(j)、(h)‧‧‧方法步驟
第1圖:係為本發明小波壓縮感測的編碼步驟流程圖。
第2圖:係為本發明小波壓縮感測的解碼步驟流程圖。
第3圖:係為本發明小波壓縮感測所運用基Ψ進行稀疏性的表示圖。
第4圖:係為本發明小波壓縮感測所運用量測值表示矩陣圖。
第5圖:係為本發明小波壓縮感測線性量測過程圖。
第6圖:係為本發明針對lena 4種CS量測方法的PSNR vs.Bit-rate的比較圖。
第7圖:係為本發明針對lena 4種CS量測方法的複雜度比較圖。
第8圖:係為本發明針對lena不同小波階層的PSNR vs.Bit-rate的比較圖。
第9圖:係為本發明針對lena的不同階層的編解碼複雜度的比較圖。
第10圖:係為本發明針對lena的DWT和DCT的非零係數、非零係數率、平均訊息量的比較圖。
第11圖:係為本發明針對lena的DWT和DCT的PSNR vs.Bit-rate比較圖。
第12圖:係為本發明針對lena的DWT和DCT的編解碼複雜度比較圖。
第13圖:係為本發明小波壓縮感測的四個子頻帶圖。
第14圖:係為本發明的lena的C_XLH在經過門檻值5之前的訊號圖。
第15圖:係為本發明的lena的C_XLH在經過門檻值5之後的訊號圖。
第16圖:係為本發明的lena的R_XLH在經過門檻值5前的訊號圖。
第17圖:係為本發明的lena的R_XLH在經過門檻值5之後的訊號圖。
第18圖:係為本發明的lena的統計C_XLH和R_XLH的特性圖。
第19圖:係為本發明的lena的C_XLH和R_XLH的R-D效能曲線圖。
第20圖:係為本發明的lena的C_XLH和R_XLH的R-D效能數據圖。
第21圖:係為本發明的基本SQT來自SY JND模型顯示26.256像素/每度的分辨率圖。(其觀看距離係在60厘米)
第22圖:係為本發明小波壓縮感測的四張測試圖片(a)lena(b)peppers(c)boat(d)baboon。
第23圖:係為本發明小波壓縮感測的測試平台設備。
第24圖:係為本發明的lena 512*512 PSNR vs.Bit Rate的編解碼效能比較圖。
第25圖:係為本發明的peppers 512*512 PSNR vs.BitRate的編解碼效能比較圖。
第26圖:係為本發明的boat 512*512 PSNR vs.BitRate的編解碼效能比較圖。
第27圖:係為本發明的baboon 512*512 PSNR vs.BitRate的編解碼效能比較圖。
第28圖:係為本發明的lena的FLC、VLC的計算複雜度比較圖。
第29圖:係為本發明的peppers的FLC、VLC的計算複雜度比較圖。
第30圖:係為本發明的boat的FLC、VLC的計算複雜度比較圖。
第31圖:係為本發明的baboon的FLC、VLC的計算複雜度比較圖。
第32圖:係為本發明的lena的Entropy與huffman_avg的比較圖。
第33圖:係為本發明的peppers的Entropy、huffman_avg的比較圖。
第34圖:係為本發明的boat的Entropy與huffman_avg的比較圖。
第35圖:係為本發明的baboon的Entropy、huffman_avg的比較圖。
第36圖:係為本發明的量測向量合起來做VLC的示意圖。
第37圖:係為本發明的量測向量分開做VLC的示意圖。
第38圖:係為本發明分別將lena、peppers、boat及baboon的四個band一起做VLC處理及分開做處理的bits數比較圖。
第39圖:係為本發明分別將lena及peppers的四個band一起做VLC處理及分開做處理的計算複雜度的比較圖。
第40圖:係為本發明分別將boat及baboon的四個band一起做VLC處理及分開做處理的計算複雜度的比較圖。
第41圖:係為本發明的lena圖和peppers圖512*512小波轉換五階各band的稀疏性與訊息量比較圖。
第42圖:係為本發明的boat圖和baboon圖512*512小波轉換各band的稀疏性與訊息量。
第43圖:係為本發明小波壓縮感測的lena圖和peppers圖各BAND的非零個數、稀疏度及非零係數比(NZR)的比較。
第44圖:係為本發明的boat和baboon各BAND的非零個數、稀疏度及非零係數比(NZR)的比較。
第45圖:係為本發明所使用非零個數分配次頻帶權重的編碼流程圖。
第46圖:係為本發明所使用非零個數分配次頻帶權重的解碼流程圖。
第47圖:係為本發明的圖片影像重建失敗的態樣圖。
第48圖:係為本發明加入第一判別式的編碼、解碼的步驟流程圖。
第49圖:係為本發明加入第二、三判別式的編碼的步驟流程圖。
第50圖:係為本發明加入第二、三判別式的解碼的步驟流程圖。
第51圖:係為本發明分別將lena及peppers的非零個數比例分配權重和全部隨機分配比較圖。
第52圖:係為本發明分別將boat及baboon的非零個數比例分配權重和全部隨機分配比較圖。
第53圖:係為本發明分別將boat及baboon的非零個數比例分配權重和全部隨機分配的複雜度比較圖。
第54圖:係為本發明直接把其中幾個的band不經過壓縮感測直接做傳送的動作,且分成A、B、C、D、E五種CASE。
第55圖:係為本發明的第54圖中的lena、peppers、boat、baboon圖片中各CASE所使用的MR值。
第56圖:係為本發明的lena 512*512的8種CASE的PSNR vs.bit_rate比較圖。
第57圖:係為本發明的peppers 512*512的8種CASE的PSNR vs.bit_rate比較圖。
第58圖:係為本發明的boat 512*512的8種CASE的PSNR vs.bit_rate比較圖。
第59圖:係為本發明的baboon 512*512的8種CASE的PSNR vs.bit_rate比較圖。
第60圖:係為本發明的lena 512*512的8種CASE的編解碼時間圖。
第61圖:係為本發明的peppers 512*512的8種CASE的編解碼時間圖。
第62圖:係為本發明的boat 512*512的8種CASE的編解碼時間圖。
第63圖:係為本發明的baboon 512*512的8種CASE的編解碼時間圖。
第64圖:係為本發明的baboon 512*512的HH1有經過壓縮感測及沒經過壓縮感測的PSNR vs.bit_rate比較圖。
第65圖:係為本發明的baboon 512*512的HH1有經過壓縮感測及沒經過壓縮感測的PSNR vs.bit_rate的時間複雜度比較圖。
第66圖:係為lena 512*512的JPEG、JPEG2000與本發明方法的PSNR vs.bit_rate比較圖。
第67圖:係為peppers 512*512的JPEG、JPEG2000與本發明方法的PSNR vs.bit_rate比較圖。
第68圖:係為boat 512*512的JPEG、JPEG2000與本發明方法的PSNR vs.bit_rate比較圖。
第69圖:係為baboon 512*512的JPEG、JPEG2000與本發明方法的PSNR vs.bit_rate比較圖。
第70圖:係為lena 512*512、peppers 512*512、boat 512*512、baboon 512*512的JPEG、JPEG2000與本發明方法的PSNR vs.bit_rate比較圖。
第71圖:係為lena512*512的JPEG、JPEG2000在不同Bit_Rate的品質及編解碼時間測。
第72圖:係為本發明的lena、peppers、boat、baboon的四張圖片在不同Bit_Rate的小波轉換所占JPEG2000編碼時間的百分比圖。
第73圖:係為傳統的影像編碼架構圖。
第74圖:係為CS影像編碼的基本架構圖。
第75圖:係為CS影像編碼的改良式架構圖。
第76圖:係為發明申請案第100102685號的影像編碼架構圖。
方法步驟‧‧‧(a)、(b)、(c)、(d)、(e)、(f)
Claims (9)
- 一種小波壓縮感測影像編碼之方法係包含以下步驟:(a).輸入一張圖片,其解析度為m×n;(b).進行多階小波轉換;(c)各頻帶分別進行純量量化;(d)計算各頻帶的非零係數比並分配各次頻帶權重;(e).針對各頻帶去進行壓縮感測處理後,再經round處理;(f)分別送到霍夫曼編碼。
- 依據申請專利範圍第1項所述壓縮取樣影像編碼方法,另包含一解碼方法,其中該解碼方法係包含有以下步驟:(g).將接收到的霍夫曼編碼以進行霍夫曼解碼;(h).分別對各個頻帶進行梯度投影稀疏重建;(i).分別對各個頻帶進行反量化;(j).把各個頻帶合成一個矩陣進行反小波轉換;(k).重建影像並計算其峰值訊噪比值完成後,輸出該影像。
- 依據申請專利範圍第1或2項所述小波壓縮感測影像編碼之方法,其中該round處理係為:NZR_band×M=round(NZR_band×m×n×MR);上述公式中,該NZR_band係指各頻帶的非零係數比,該M=m×n×MR為總取樣個數,該MR係為給定的量測值,最後經過round四捨五入變成整數。
- 依據申請專利範圍第3項所述壓縮取樣影像編碼方法,其中該步驟(b)係進行五階小波轉換。
- 依據申請專利範圍第3項所述小波壓縮感測影像編碼之方法,其中該步驟(f)的霍夫曼編碼及該步驟(g)的霍夫曼解碼係皆以可變長度編碼方式(VLC)為之。
- 依據申請專利範圍第3項所述小波壓縮感測影像編碼之方法,其中該步驟(k)的計算峰值訊噪比值的地方加入一第一判別式,該第一判別式係判別該峰值訊噪比值小於零時,將MR值進行累加,然後重新執行解碼;若該第一判別式係判別該峰值訊噪比值若大於零時,才輸出該影像。
- 依據申請專利範圍第3項所述小波壓縮感測影像編碼之方法,其中該步驟(e)中加入第二判別式,又該第二判別式係掃描HH1經過壓縮感測所得到的向量,若其全部值都未滿0.5,則設棄HH1,同時在解碼方法的步驟(i)中以相同大小的零矩陣來代替該HH1。
- 依據申請專利範圍第3項所述小波壓縮感測影像編碼之方法,其中該步驟(e)前加入第三判別式,針對每個頻帶作步驟(e)的壓縮感測前的判別,若NZRband×M大於該頻帶大小的話,就讓該頻帶直接傳送到步驟(f)霍夫曼編碼而不作壓縮感測,如果NZRband×M小於該頻帶大小就續行下一個流程步驟。
- 依據申請專利範圍第1項所小波壓縮感測影像編碼之方法,其中該非零係數比係為各個頻帶的非零個數(non_zero_band)除以全部頻帶的非零個數總和(total_non_zero)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101140560A TWI533236B (zh) | 2012-11-01 | 2012-11-01 | 小波壓縮感測影像編碼之方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101140560A TWI533236B (zh) | 2012-11-01 | 2012-11-01 | 小波壓縮感測影像編碼之方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201419860A true TW201419860A (zh) | 2014-05-16 |
TWI533236B TWI533236B (zh) | 2016-05-11 |
Family
ID=51294549
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101140560A TWI533236B (zh) | 2012-11-01 | 2012-11-01 | 小波壓縮感測影像編碼之方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI533236B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105306936A (zh) * | 2015-07-17 | 2016-02-03 | 福州大学 | 一种基于块压缩感知的图像编码方法 |
-
2012
- 2012-11-01 TW TW101140560A patent/TWI533236B/zh not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105306936A (zh) * | 2015-07-17 | 2016-02-03 | 福州大学 | 一种基于块压缩感知的图像编码方法 |
CN105306936B (zh) * | 2015-07-17 | 2018-06-15 | 福州大学 | 一种基于块压缩感知的图像编码方法 |
Also Published As
Publication number | Publication date |
---|---|
TWI533236B (zh) | 2016-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Walker et al. | Wavelet-based image compression | |
Yuan et al. | Research on image compression technology based on Huffman coding | |
CN102637302B (zh) | 一种图像编码方法 | |
US20080008395A1 (en) | Image compression based on union of DCT and wavelet transform | |
CN106658004B (zh) | 一种基于图像平坦区域特征的压缩方法和装置 | |
CN104199627A (zh) | 基于多尺度在线字典学习的可分级视频编码系统 | |
CN105825530B (zh) | 基于感兴趣区域的海岸带高光谱图像分布式有损编码和解码方法 | |
PraveenKumar et al. | Medical image compression using integer multi wavelets transform for telemedicine applications | |
Kalavathi et al. | A wavelet based image compression with RLC encoder | |
CN105392014B (zh) | 一种优化的小波变换图像压缩方法 | |
Ghazel | Adaptive fractal and wavelet image denoising | |
TWI533236B (zh) | 小波壓縮感測影像編碼之方法 | |
Bhatnagar et al. | Image compression using dct based compressive sensing and vector quantization | |
CN116723333B (zh) | 基于语义信息的可分层视频编码方法、装置及产品 | |
CN103678801B (zh) | 一种基于图像信息熵的自适应压缩感知采样方法 | |
Ranjan et al. | The HAAR-the JPEG based image compression technique using singular values decomposition | |
Naveen et al. | An efficient low dynamic range image compression using improved block based EZW | |
CN104486631B (zh) | 一种基于人眼视觉与自适应扫描的遥感图像压缩方法 | |
KR100381204B1 (ko) | 칼라 정지영상의 부호화 및 복호화 방법 | |
Wu et al. | Comparisons of Threshold EZW and SPIHT Wavelets Based Image Compression Methods | |
Annadurai et al. | Wavelet based color image compression using vector quantization and morphology | |
Vrindavanam et al. | Wavelet and JPEG based image compression: an experimental analysis | |
Xin et al. | Adaptive sampling rate assignment for block compressed sensing of images using wavelet transform | |
Jagadeesh et al. | Linear adaptive global node-tree filters based SPIHT MR image codec | |
EP3151565A1 (en) | A low complexity perceptual visual quality evaluation method for jpeg2000 compressed streams |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |