TWI603590B - 用於減少直流增益不匹配及直流漏電的方法及數位媒體解碼器 - Google Patents

用於減少直流增益不匹配及直流漏電的方法及數位媒體解碼器 Download PDF

Info

Publication number
TWI603590B
TWI603590B TW105104644A TW105104644A TWI603590B TW I603590 B TWI603590 B TW I603590B TW 105104644 A TW105104644 A TW 105104644A TW 105104644 A TW105104644 A TW 105104644A TW I603590 B TWI603590 B TW I603590B
Authority
TW
Taiwan
Prior art keywords
overlap
operand
solution
leakage
tile
Prior art date
Application number
TW105104644A
Other languages
English (en)
Other versions
TW201628342A (zh
Inventor
史瓊柏格丹尼爾
瑞古納森夏可
孫錫君
蘇利文蓋瑞J
羅希勞伯
饒齊
史瑞尼凡森史瑞德哈
Original Assignee
微軟技術授權有限責任公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 微軟技術授權有限責任公司 filed Critical 微軟技術授權有限責任公司
Publication of TW201628342A publication Critical patent/TW201628342A/zh
Application granted granted Critical
Publication of TWI603590B publication Critical patent/TWI603590B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation

Description

用於減少直流增益不匹配及直流漏電的方法及數位媒體解 碼器
本發明係關於減少直流增益不匹配及直流漏電。
變換編碼係一種用於許多音訊、影像及視訊壓縮系統中的壓縮技術。未經壓縮之數位影像及視訊通常係作為以二維(2D)網格配置之影像或視訊圖框中之諸位置處的圖像元素或顏色之樣本來表示或擷取。此情形被稱為影像或視訊之空間域表示。舉例而言,矩形形狀影像之典型格式由8位元顏色樣本之三個二維陣列組成。每一樣本係表示一網格中之一空間位置處之顏色分量的值之數,其中每一顏色分量表示沿著諸如RGB或YUV以及其他之顏色空間內之一軸線的幅度。此等陣列之一者中的個別樣本可被稱為像素。(在其他一般使用中,術語像素亦常用於代表共存於空間中n個顏色分量樣本之n元組-例如,代表給定空間位置之R、G及B顏色分量值之3元組分組-然而,該術語在本文中歸類為純量值樣本)。各種影像及視訊系統可使用取樣之各種不同顏色、空間及時間解析度。類似地,數位音訊通常表示為 經時間取樣之音訊信號串流。舉例而言,典型音訊格式由表示規則間隔之時刻之音訊信號幅度的音訊信號之16位元幅度樣本之串流組成。
未經壓縮之數位音訊、影像及視訊信號可消耗大量儲存及傳輸容量。變換編碼可用於藉由將信號之空間域(時域)表示變換為頻域(或其他類似轉換域)表示,來減少表示此等數位音訊、影像及視訊所需之資料量,以致能表示該信號所需之資料量的減少。資料量之減少通常係藉由應用稱為量化之程序或藉由轉換域表示之特定頻率分量之選擇性丟棄(或兩者之組合)之後,應用諸如適應性霍夫曼(Huffman)編碼或適應性算術編碼之熵編碼技術來實現。可基於個別頻率分量之知覺敏感性之所估計的程度或基於其他準則來選擇性地應用量化程序。與直接在空間域減小影像或視訊之顏色樣本保真度或空間解析度或在時域中減小音訊之顏色樣本保真度或空間解析度相比,變換編碼之適當應用通常產生數位信號之更少可知覺之降級。
更具體言之,典型區塊變換式編碼技術將數位影像之未經壓縮像素劃分為固定大小之二維區塊(X1,…Xn)。執行空間頻率分析之線性變換應用於該等區塊,其將區塊內之空間域樣本轉換為大體表示數位信號在區塊間隔範圍內在對應頻帶中之強度的一組頻率(或變換)係數。對於壓縮而言,該等變換係數可經量化(意即,減小精確度,諸如藉由丟棄系數值之最低有效位 元或另外將較高精確度數集中之值映射至較低精確度)且亦熵或可變長度編碼為經壓縮之資料串流。在解碼時,該等變換係數將經逆量化且逆變換回為空間域而幾乎重建該原始經顏色/空間取樣之影像/視訊信號(經重建之區塊X^1,…X^n)。
開發一區塊內樣本間之相關聯性且因此最大化壓縮能力的能力為變換設計中之主要要求。在許多區塊變換式編碼應用中,取決於變換域中所應用之量化運算,該變換應為可逆的以支援有損與無損壓縮。舉例而言,在未應用量化之情況下,一種利用可逆變換之編碼技術可在應用對應解碼程序後使輸入資料之準確再現。然而,在此等應用中之可逆性之要求約束可藉以設計編碼技術之變換的選擇。變換之實施複雜性為另一重要設計約束。因此,變換設計通常經選擇以使得正逆變換之應用僅涉及乘以小整數之乘法及其他簡單數學運算,諸如,加法、減法及移位運算,以使得具有最小動態範圍擴展之快速整數實施可被獲得。
諸如JPEG(ITU-T T.81|ISO/IEC 10918-1)及MPEG-2(ITU-T H.262|ISO/IEC 13818-2)以及其他的許多影像及視訊壓縮系統利用基於離散餘弦變換(Discrete Cosine Transform,DCT)的變換。DCT以具有良好能量壓實特性為人所知。DCT由N.Ahmed、T.Natarajan及K.R.Rao描述於「Discrete Cosine Transform」,IEEE Transactions on Computers,C-23(1974年1月),第90-93頁。
當壓縮一靜態影像(或一視訊序列中之經框內編碼之圖框)時,諸如JPEG及MPEG-2之最常用標準是將表示該影像之陣列分割為8×8區域並將一區塊變換應用於每一此影像區域。此等設計中之給定分割區(通常稱為區塊)中的變換係數僅受區塊區域內之樣本值影響。在影像及視訊編碼中,此等獨立建構之區塊的量化可導致區塊邊界處之不連續性,且因此產生視覺上煩人之假影(稱為區塊假影或區塊效應)。類似地,對於音訊資料而言,當非重疊之區塊經獨立變換編碼時,量化誤差將在解碼器處重建音訊信號後產生區塊邊界處的信號之不連續性。對於音訊而言,可聽到週期性喀嚦效應(clicking effect)。
用於減輕區塊假影之技術包括使用解區塊濾波器使跨越於區塊間邊緣邊界的信號值平滑,及使用空間外插法以編碼原始輸入資料與來自相鄰區塊邊緣之預測之間的差異。此等技術自身具有缺點。舉例而言,該解區塊濾波器方法為「開放迴路」,亦即,正變換程序通常不考慮以下事實:將在解碼器進行之逆變換後執行解區塊。又,此等技術兩者皆需要大量計算實施資源。
減少區塊效應之另一方法為藉由使用如H.Malvar於「Signal Processing with Lapped Transforms」,Artech House,Norwood MA, 1992年中所述之折疊變換(lapped transform)。折疊變換為除了當前區塊中之資料樣本之外,具有向相鄰區塊中之一些鄰近樣本擴展之輸入區域的變換。同樣,在重建側,逆折疊變換影響相鄰區塊中之一些經解碼之資料樣本以及當前區塊之資料樣本。因此,逆變換可甚至在存在量化之情況下仍保存跨越區塊邊界的連續性,因此導致區塊效應之減少。折疊變換之另一優點在於其可開發交叉區塊相關性,其產生較大的壓縮能力。
對於2維(2D)資料之狀況而言,折疊2D變換為當前區塊與左側、上方、右側、下方區塊之選擇元素,及可能的左上、右上、左下及右下區塊之元素一起的一函數。用於計算當前變換之相鄰區塊中之資料樣本的數目被稱為重疊量。
對於圖片(影像)壓縮而言,良好執行比率失真效能之n項的實例變換為折疊雙正交變換(lapped biorthogonal transform,LBT)。參見H.S.Malvar之「Biorthogonal And Nonuniform Lapped Transforms For Transform Coding With Reduced Blocking And Ringing Artifacts」,IEEE Trans.on Signal Processing,第46卷,第1043-1053頁,1998年4月。
概括言之,【實施方式】係針對用於數位媒體壓縮及解壓縮之各種技術。舉例而言,應用各種技術以解決重疊運算中之直流增益不匹配及直流漏電現象。
100‧‧‧代表性2維(2D)資料編碼器
110‧‧‧2D資料
120‧‧‧經壓縮之位元流
142‧‧‧陰影區塊
200‧‧‧代表性2維(2D)資料解碼器
205‧‧‧經壓縮之位元流
210‧‧‧擷取
220‧‧‧解碼
230‧‧‧解量化
240‧‧‧直流係數
242‧‧‧交流係數
250‧‧‧4×4逆變換
260‧‧‧逆重疊濾波
400、500‧‧‧簡圖
600、630‧‧‧實例方法
610、620、640、650‧‧‧步驟
700‧‧‧計算環境
710‧‧‧處理單元
720‧‧‧記憶體
730‧‧‧最基本組態
740‧‧‧儲存器
750‧‧‧輸入裝置
760‧‧‧輸出裝置
770‧‧‧通信連接
780‧‧‧軟體
第1圖為基於利用可逆重疊運算元之折疊變換的編碼器的流程圖。
第2圖為基於折疊變換之解碼器的流程圖。
第3圖為描繪用於第一階段重疊變換及用於重疊變換第二階段之全解析度通道的重疊運算元之佈局之區塊的配置圖。
第4圖為描繪在第二階段重疊變換中,用於4:2:2降低取樣之色度通道的重疊運算元之佈局之區塊的配置圖。
第5圖為描繪在第二階段重疊變換中,用於4:2:0降低取樣之色度通道的重疊運算元之佈局之區塊的配置圖。
第6A圖為描繪用於選擇硬或軟圖塊邊界並將其用信號發送之實例方法之流程圖。
第6B圖為描繪用於接收選定之硬或軟圖塊邊界指示符之實例方法之流程圖。
第7圖為用於實施本文中所述之技術之合適計算環境的方塊圖。
以下描述相關於一種數位媒體壓縮或解壓縮系統或編碼器或解碼器,其利用重疊變換設計以解決直流增益不匹配及直流漏電現象。出於說明之目的,具有此等技術之壓縮/解壓縮系統之一實施例為影像或視訊壓縮/解壓縮系統。或者,本文中所述之技術可包含用於其他2D資料之壓縮或解壓縮系統、或編碼器或解碼器中。本文中所述之技術不需要數位媒體壓縮系統以特定編碼格式來編碼經壓縮之數位媒體資料。
下文呈現之第一及第二實施例提供對JPEG XR標準之擴展或修改。JPEG XR標準之2008年9月版本之複本係包括於附錄A。附錄A中之圖式及參考數字使用附錄A內之編號。第一及第二實施例之各部分參考JPEG XR標準中所定義之運算元。
第一及第二實施例亦參考在4×4運算元中解決直流漏電之方式,如2008年6月30日申請之美國專利申請案第12/165,474號中所述,其複本包括於附錄B。附錄B中之圖式及參考數字使用附錄B內之編號。
1. 編碼器/解碼器
如下說明並描述具代表性但一般化及簡化之資料編碼器及解碼器。
第1圖及第2圖為基於使用解決直流增益不匹配及直流漏電之技術之折疊變換的代表性2維(2D)資料編碼器100及解碼器200中所使用的程序的一般化簡圖。該等簡圖呈現本文中所述之技術在包含2D資料編碼 器及解碼器之壓縮系統及解壓縮系統中的使用及應用的一般化或簡化說明。在基於此等直流增益不匹配及直流漏電技術的替代性編碼器及解碼器中,比那些代表性編碼器及解碼器中所說明的更多或較少的程序可用於2D資料壓縮。舉例而言,一些編碼器/解碼器亦可包括顏色轉換、各種顏色格式、可擴充(scalable)編碼。取決於量化之應用,所述之壓縮及解壓縮系統(編碼器及解碼器)可提供2D資料之無損及/或有損壓縮,該量化可基於一或多個量化控制參數,其控制經編碼之表示之保真度流失的程度介於在完全無損至極粗略(高壓縮比)表示的廣範圍之可選擇保真度。
2D資料編碼器100、300產生經壓縮之位元流120,其為作為編碼器之輸入呈現的2D資料110之較緊湊表示(針對典型輸入)。在示範性實施例中,前後重疊運算元(展示為陰影區塊142)為四個照片重疊變換運算元。舉例而言,2D資料輸入可為影像、視訊序列之圖框或具有二維之其他資料(通常稱為影像)。
參閱第2圖,作為簡要綜述,解碼器200執行逆程序。在解碼器側,變換係數位元自其在經壓縮之位元流205中之各別封包被擷取210,自此,係數自身得以解碼220及解量化230。直流係數240藉由應用逆變換而再生,且直流係數之平面係使用跨越直流區塊邊緣應用之合適平滑化運算元來「逆重疊」。隨後,整個資料藉由將4×4逆變換250應用於直流係數而再生,且自 位元流解碼之交流係數242。最終,所得影像平面中之區塊邊緣經逆重疊濾波260。此產生經重建之2D資料輸出。
2. 所述技術之通用實例
此節含有在重疊變換編碼中減輕直流增益不匹配及直流漏電現象之技術的通用實例。
第6A圖描繪選擇硬或軟圖塊邊界並將其用信號發送之實例方法600。在610,硬圖塊邊界及軟圖塊邊界中之一者經選擇於變換編碼期間執行重疊處理時使用。舉例而言,該選擇可基於待編碼之影像中所呈現之圖塊之數目、所要解碼計算複雜性、所要輸出品質、使用者設定或另一因數。
在620,在經編碼之位元流中用信號發送選定之圖塊邊界決策。舉例而言,獨立語法元素(例如,作為指示硬或軟圖塊邊界經選擇以用於重疊處理的單一位元)可用信號發送選定之圖塊邊界決策。亦可與其他語法元素組合或聯合地用信號發送選定之圖塊邊界。
第6B圖描繪用於接收選定之硬或軟圖塊邊界指示符的實例方法630。在640,在指示選定之圖塊邊界選項之經編碼之位元流中接收資訊,其中選定之圖塊邊界選項指示用於重疊處理之硬圖塊邊界及軟圖塊邊界中之一者。舉例而言,獨立語法元素或聯合編碼之語法元素可接收選定之圖塊邊界選項。
在650,至少部分基於選定之圖塊邊界選項執行逆變換解碼。
圖塊邊界指示符亦可與選定之重疊模式組合。舉例而言,重疊模式選項可指示重疊階段及硬/軟圖塊化之組合。舉例而言,重疊模式選項之一值可指示重疊未被應用(例如,未應用第一及第二重疊階段),重疊模式選項之另一值可指示僅兩個重疊階段中之第一者應用於軟圖塊化,重疊模式選項之另一值可指示兩個重疊階段應用於軟圖塊化,重疊模式選項之另一值可指示僅兩個重疊階段中之第一者應用於硬圖塊化,且重疊模式選項之又一值可指示兩個重疊階段應用於硬圖塊化。此重疊模式選項可經選擇、在當執行重疊變換編碼時使用,並在經編碼之位元流中用信號發送。可由解碼器接收經編碼之位元流,且當執行逆重疊變換解碼時可解碼並使用選定之重疊模式選項。
3. 第一實施例
HD Photo/JPEG XR影像編碼設計包括折疊變換技術。折疊變換(亦稱為重疊變換)概念上類似於區塊變換。
區塊變換設計由兩個步驟組成:1.將輸入資料分割為區塊區域(由1-D系列中之樣本串或諸如影像之2-D資料集中之樣本的矩形區塊形狀陣列組成的區域),及 2.將變換程序應用於每一區塊以分析其頻率內容。
對於壓縮應用而言,區塊變換之輸出被量化,且熵編碼被應用於該結果。此等步驟有時與諸如預測程序及機率估計程序之其他運算組合。此等處理階段中之每一者之反逆或近似逆運算被應用於建構經編碼之資料之解碼程序。
與區塊變換相關聯之熟知現象為區塊假影之產生,其為在產生自解碼程序之經重建之近似中發生的知覺不連續性。減輕區塊假影現象之熟知方式為使用折疊變換設計(亦稱為重疊變換設計)。在折疊變換設計中,形成對變換程序之輸入的資料區塊彼此重疊。
折疊變換之使用過程中產生的一個問題為如何處置信號之邊緣。在一組輸入資料之邊緣(諸如,影像之邊緣),通常編碼器之折疊變換輸入之部分的一些資料並不存在。系統設計者必須判定如何處置此等邊緣狀況。
在影像編碼技術中,關鍵概念為將大的經編碼之影像分解成多個圖塊。經編碼之圖塊為準確地或大致地對應於圖片之特定(通常矩形)空間影像區域的一組資料。藉由將影像分段為圖塊且獨立地編碼每一圖塊,有可能存取影像之部分並將其解碼但不解碼完整影像。存取影像之特定區域之此能力尤其在影像較大時適用。然而,將大影像分段為較小圖塊區域可在圖片中產生較 多邊緣。在此等邊緣中之每一者處,可發生直接類似於區塊假影的圖塊邊界現象。
如同JPEG XR(亦稱為HD Photo)中之最初設計,重疊運算在啟用時亦跨越影像圖塊邊界且同時跨越區塊變換之個別區塊邊界而加以應用。雖然此方法在一些情形下具有優點,但此設計選擇之結果在於,當存取圖塊對準之影像區域時,圖塊式影像編碼及擷取與不跨越影像圖塊邊界應用重疊運算之情況相比需要更大計算複雜性。此係歸因於由變換區域之重疊誘發的跨越相鄰圖塊資料相依性,其結果在於:為解碼特定圖塊區域,亦有必要存取並部分解碼針對空間相鄰圖塊儲存的資料。
在此實施例中,圖塊邊界如下分為兩種類型中之一者:-「硬」圖塊邊界,以使得圖塊之邊緣與影像之邊緣以相同方式得以處理,因此不存在跨越圖塊邊界應用之變換區塊的重疊,及-「軟」圖塊邊界,其中變換區塊之重疊跨越圖塊邊界應用。
在諸如JPEG 1及JPEG 2000之一些先前設計中,所有圖塊邊界為「硬」圖塊邊界。相反的,在原始HD Photo設計中,圖塊邊界為「軟」的。每一類型之邊界處理實際上適用在一些情形下。在此實施例中, 編碼器可根據其意願選擇使用硬或軟圖塊邊界並用信號發送此選擇與經壓縮之資料表示。
HD Photo變換設計亦為提升式變換運算。在此等變換中,稱為「直流漏電」之現象有時可為問題。若變換展現直流漏電,則正變換之輸出有可能含有一些定值輸入信號之大量非直流變換係數。直流漏電有時可導致壓縮效能之損失及經解碼之輸出中的可察覺假影。
在大影像中,具有僅在影像之外邊界附近發生的壓縮效能之一些損失及假影現象,在壓縮編碼設計中為可接受的。然而,因為使用硬圖塊邊界之圖塊分段造成較多區域發生此等現象,所以在可包括硬圖塊邊界支援的設計時,仔細設計邊緣區域之處置變得較為重要。
與影像編碼器中之圖塊支援一起出現的相同問題,亦可藉由各自分別經編碼之多個較小影像建構較大資料集,而與系統層級處之大「元影像」的較高層級支援一起出現。再一次在此情形下,如此使用情形中仔細處置影像邊緣變得較重要。
茲敘述需要具有硬圖塊邊界編碼選項,以使得每一影像圖塊可經獨立處置。一種明顯解決方案為將圖塊邊界視為與所有影像邊緣相同。然而,在原始HD Photo設計中,變換設計在影像之邊緣附近使用的運算中,具有不良高直流漏電現象。另外且更為顯著地,在變換設計中之邊緣處置運算之輸出,與產生自針對影像 之內部區域執行之處理的直流增益之間,存在直流增益差異。
可藉由認識以下各者來解決影像邊界附近之重疊變換現象中的直流增益不匹配及直流漏電:
1.重疊運算元遭受內部運算元與角落及邊緣運算元之間的直流增益不匹配,因此引起降低之壓縮效率及顯著視覺假影。
2.邊緣、角落及色度內部運算元亦遭受直流漏電,其亦可引起壓縮效率之降低及顯著視覺假影。
另外,亦可解決在4:2:0及4:2:2色度狀況中對影像之內部區域之處置的直流漏電特性之改良。
3.1 綜述
HD Photo/JPEG XR使用階層折疊變換。該變換具有4個階段,如附錄A中詳述:
1.第一階段重疊變換
2.第一階段核心變換
3.第二階段重疊變換
4.第二階段核心變換
重疊階段對相對於核心變換運算元的歪斜網格運算。亦即,核心變換對配置於與影像中之左上像素對準之網格中的4×4區塊運算。重疊階段對類似大小之網格運算,但其具有相對於左上角像素的2像素水平偏移及2像素垂直偏移。
JPEG XR之圖塊化可描述為「軟」圖塊化,亦即,變換之重疊階段跨越圖塊邊界而運算。為實現分別且較有效之圖塊處理,「硬」圖塊化為所慾特徵。亦即,吾人慾允許JPEG XR位元流中之選項以指明重疊是否跨越圖塊邊界而運算。
遺憾地,經設計後,重疊運算元具有兩個缺點:直流增益不匹配及直流漏電。尤其係針對邊緣重疊運算元(在由重疊階段之網格偏移誘發的2像素寬邊緣中運算的運算元)。因為硬圖塊化需要在影像之中央區域中使用此等邊緣運算元(作為允許硬圖塊化之最自然解決方案),所以由此等運算元之問題所誘發之假影變得更顯而易見。甚至在無硬圖塊化的情形下,現有的重疊運算元仍在影像中產生可見假影。
在此實施例中,經由6個不同運算元實施重疊變換。吾人將此等運算元分為兩個具有3個運算元之群組:全解析度群組及色度群組。三個全解析度運算元為:
1. Overlap4×4運算元-內部運算
2. Overlap4×1運算元-邊緣運算
3. CornerOverlap2×2運算元-角落運算
此等運算元之佈局簡圖300係可見於第3圖。第3圖描繪區塊之2×2配置。對區塊之2×2配置而言,重疊運算元之佈局應用於全解析度樣本。點表示像素佈局,且中央水平及垂直虛線指示區塊邊界。圓圈因此表示各種重疊運算元之域。像素之中央4×4區域表示 內部Overlap4×4運算元、像素之4個角落2×2區域表示CornerOverlap2×2運算元,且像素之其他8個4×1(或1×4)區域表示Overlap4×1運算元。此三個運算元用於第一階段重疊變換中之所有通道且用於第二階段重疊變換中之全解析度通道(亦即,4:4:4取樣模式中之明度及色度)。
三個色度運算元為:
1. Overlap2×2運算元-內部運算
2. Overlap2×1運算元-邊緣運算
3. CornerOverlap1×1運算元-角落運算
此等運算元係用於第二階段重疊變換之經降低取樣(4:2:2或4:2:0再取樣)色度通道。應用於4:2:2再取樣之此等運算元的佈局之簡圖400,展示於第4圖中。第4圖描繪用於第二階段重疊變換中之4:2:2降低取樣色度通道之重疊運算元。對區塊之2×2配置而言,重疊運算元之佈局應用於4:2:2樣本。點表示像素佈局,且中央水平及垂直虛線指示區塊邊界。圓圈因此表示各種重疊運算元之域。像素之中央2×2區域表示內部Overlap2×2運算元,像素之4個角落1×1區域表示CornerOverlap1×1運算元,且像素之其他8個2×1(或1×2)區域表示Overlap2×1運算元。
應用於4:2:0再取樣之此等運算元之佈局的簡圖500,展示於第5圖中。第5圖描繪用於第二階段重疊變換中之4:2:0降低取樣色度通道之重疊運算元。對 區塊之2×2配置而言,重疊運算元之佈局應用於4:2:0樣本。點表示像素佈局,且中央灰線指示區塊邊界。圓圈因此表示各種重疊運算元之域。像素之中央2×2區域表示內部Overlap2×2運算元,像素之4個角落1×1區域表示CornerOverlap1×1運算元,且像素及其他4個2×1(或1×2)區域表示Overlap2×1運算元。
在此等運算元之設計中產生兩個問題:直流增益不匹配及直流漏電。理想地,在兩個運算元集合(全解析度及色度)之每一者中,所有三個運算元之直流增益因數應為相當的。直流增益不匹配之問題在三個直流增益確實不匹配時產生。
直流漏電為對變換之完全平坦輸入顯示於直流及交流係數之現象。直流漏電藉由產生交流係數的量值來量測。
由於此兩個問題,僅使用直流係數(忽略所有高頻係數)編碼之完全平坦之影像,將不具有完全平坦之重建。經重建之像素值之差異可視為以下兩項之總和:a)定比(scaling)直流增益不匹配,及b)直流漏電。
Difference~ScalingGainMismatch+DCLeakage
先前研究(參見附錄B)解決Overlap4×4運算元之直流漏電的問題。在此實施例中,吾人描述若干解決方案,其中上述六個運算元中之五個(除Overlap4×4運算元外之五個運算元)可經替換以解決直流增益不 匹配及直流漏電的兩個問題。應注意,在HD Photo/JPEG XR中,ScalingGainMismatch之量值遠大於DCLeakage。因此,吾人正解決之主要問題為重疊運算元之間的直流增益不匹配。吾人解決之次要問題為重疊運算元中之直流漏電。
吾人始於描述語法之若干解決方案以在JPEG XR中啟用硬圖塊邊界。吾人接著提議新重疊運算元,以消除由現有重疊運算元誘發之假影。應注意,除硬圖塊化情形外,此等運算元亦適用於「縫合」情形。縫合情形係單一大影像分為經獨立壓縮之小塊的情形。稍後,該等影像藉由以其原始關係鄰近地顯示而「縫合」在一起。
3.2 硬圖塊化之語法之綜述
需要支援硬及軟圖塊邊界。軟圖塊邊界於處理圖塊化影像中之大數目之圖塊且防止假影較為有效。硬圖塊邊界允許處理影像中之有限數目之圖塊較為有效。吾人考慮關於硬圖塊邊界之語法的兩個選項。吾人考慮呈現破壞性改變語法及允許舊版解碼器產生合理影像的語法兩者。
3.2.1 破壞性改變語法
第一選項為添加用信號發送使用硬或軟圖塊化的新語法元素。
第二選項為將重疊層級語法標誌(OVERLAP_MODE)之值相加。如當前定義, OVERLAP_MODE為2位元語法元素。吾人在下文列舉該等值及此等語法元素之對應解譯。
1. OVERLAP_MODE=0-未應用任何重疊階段。
2. OVERLAP_MODE=1-僅應用兩個重疊階段中之第一者。
3. OVERLAP_MODE=2-應用兩個重疊階段。
吾人提議將此改為3位元語法元素。吾人藉由添加以下額外值及解譯,將上文重疊模式改為對應於軟圖塊化模式(僅針對OVERLAP_MODE=1或OVERLAP_MODE=2,因為OVERLAP_MODE=0根據預設為硬圖塊邊界)。
4. OVERLAP_MODE=3-在硬圖塊化格式中,僅應用重疊階段中之第一者。
5. OVERLAP_MODE=4-在硬圖塊化格式中,應用兩個重疊階段。
現有解碼器無法使用此語法成功地解碼影像。新位元之添加將導致舊版解碼器無法解碼任何影像。
3.2.2 反向相容語法
為允許舊版解碼器能夠處理新位元流(雖然可能導致顯著假影),吾人提議使用子版本(在JPEG XR規範草案中標記為RESERVED_C)號碼語法元素。當前,含有附錄B中所呈現之改變的位元流具有子版本值 為1,否則具有子版本值為0。吾人提議使用子版本號碼之第二最低有效位元,以用信號發送硬或軟圖塊化。在此方案中,藉由將第二最低有效位元設定為零來對軟圖塊發送信號,且藉由將第二最低有效位元設定為一來對硬圖塊發送信號。雖然對硬圖塊影像產生假影,但忽略子版本值之舊版解碼器將成功解碼硬及軟圖塊化影像。較先進的解碼器將能夠對子版本號碼之值回應並正確地解碼影像而無假影。
吾人如下讀取硬圖塊化設定:HardTilingTrueFlag=(RESERVED_C×>1)&1
3.3 現有重疊運算元之綜述
在解碼器處,Overlap4×4經設計以具有定比比例1/(s^2),其中s=0.8272,亦即,Overlap4×4以大致1.4614按比例增大直流值。Overlap4×1經設計以具有直流值之定比比例1/s,亦即,Overlap4×1以大致1.2089按比例增大直流值。角落運算元CornerOverlap2×2為零(未執行運算),因此對應直流值具有1.0之隱式定比。
應注意,Overlap4×4運算元在附錄B中所展示之揭示內容中係固定的。
吾人現提供關於運算元之若干注意事項:
1.此等定比確保逆重疊之基礎係平滑的,且除提供較不顯著假影外亦提供較大編碼增益。
2.由運算元執行之實際定比因整數化實施而略不同。
3.編碼器重疊運算元執行解碼器之定比的逆定比。
4.編碼器處之此按比例減小具有無損編碼之一些暗示。對於無損編碼而言,甚至完全平坦影像需要產生交流係數(且因此必要地損失一些壓縮效率)。
5.整數化實施中所使用之捨入對一些分析及實驗的結果具有小影響。尤其,諸如ScalingGainMismatch及DCLeakageRatio之許多量僅大致為線性的。
在下文中,吾人計算運算元之直流漏電及直流增益不匹配。應注意,下文用於計算直流漏電之方法基於矩陣係數大致給予與之理論分析相同的結果。然而,此方法係較簡單/快速的。
為使直流漏電及直流增益不匹配清楚,吾人藉由考慮所有像素值等於1000000(10^6)之輸入區塊導出每一運算元之直流定比增益比及直流漏電。吾人將此輸入值稱為X1
3.3.1 全解析度運算元
Overlap4×4。對實例Overlap4×4運算元(參見附錄A)而言,若給定輸入X1,則輸出像素具有的值為1461540或1461547。因此Overlap4×4之ScalingGainRatio為約1.461543。輸出值之差異 (亦即,|1461540-1461547|=7)係歸因於直流漏電。Overlap4×4之DCLeakageRatio為7/10^6。
對每樣本影像8位元而言,吾人編碼之最大範圍為+/-128/(ScalingGainRatio)。因此,8位元影像上之4×4運算元的最大DCLeakage為(7/10^6)*128/ScalingGainRatio=0.000896/ScalingGainRatio=0.000614。16位元影像上之直流漏電為256*0.000614~0.157。
Overlap4×1。對實例Overlap4×1運算元(參見附錄A)而言,若給定輸入X1,則輸出像素具有的值為1206726或1205078。Overlap4×1之ScalingGainRatio為約1.2058。若對逆Overlap4×1運算元之輸入全部為相同值,則此運算元對一對輸入值之定比階段的矩陣表示可表示為: ,其中x=3/32且y=3/16。
對輸入中之一者之定比為1+xy+x(2+xy)=19771/16384~1.206726,且對另一輸入之定比為
DCleakageRatio為19771/16384-617/512=27/16384=0.001648。
輸出值之差異1206726-1205078=1648係歸因於直流漏電。DCleakageRatio為 (1408/10^6)。此直流漏電係較小的但仍顯著。對每樣本影像8位元而言,最大直流漏電為127/ScalinGainRatio*(1408/10^6)~0.1788/ScalingGainRatio~0.12247。對每樣本影像16位元而言,最大直流漏電可為+/-46/ScalingGainRatio~31.35。
CornerOverlap2×2。當前,角落不存在重疊運算元。ScalingGainRatio為1.0。DCLeakageRatio為0.0。
直流增益不匹配之效應。如吾人可見,主要問題為直流增益不匹配,且其最壞狀況效應理論上應可量化如下。對每樣本影像8位元而言,在邊緣處,最壞狀況ScalingGainMismatch將為(1.4615-1,205)*128/ScalinGainRatio~22.48。對每樣本影像8位元而言,在角落處,最壞狀況ScalingGainMismatch為約(1.4615-1.0)*128/ScalinGainRatio~59/ScalingGainRatio~40.46。對每樣本影像16位元而言,在邊緣及角落處,最壞狀況ScalingGainMismatch將分別為22.4*256及40.46*256=10,393.6。最壞狀況的總差異可為定比增益不匹配及直流漏電之總和。
3.3.2 色度運算元
Overlap2×2。對實例Overlap2×2運算元而言,參見附錄A。若對逆Overlap2×2運算元之輸入全部為相同值,則此運算元對一對輸入值之定比階段的矩陣表示可表示為:
,其中x=1/4且y=1/2。
對輸入中之一者之定比為1+xy+x(2+xy)= 53/32=1.656235且對另一輸入之定比為1.625。
DCLeakageRatio為53/32-13/8=1/32=0.03125。
Overlap2×1。對實例Overlap2×1運算元而言,參見附錄A。若對逆Overlap2×1運算元之輸入全部為相同值,則此運算元對一對輸入值之定比階段的矩陣表示可表示為:
,其中x=1/8且y=1/4。
對輸入中之一者之定比為1+xy+x(2+xy)=329/256=1.28515625且對另一輸入之定比為
DCLeakageRatio為329/256-41/32=1/256=0.003906。
CornerOverlap1×1。當前,角落不存在重疊運算元。ScalingGainRatio為1.0。DCLeakageRatio為0.0。
3.4 Overlap4×1運算元之所提議的解決方案
吾人對此運算元提議3個解決方案。應注意,吾人將現有Overlap4×1運算元在其像素上之應用表示為Overlap4×1(a,b,c,d)。
3.4.1 解決方案1
因為Overlap4×1之直流增益大致為Overlap4×4之直流增益之平方根,所以吾人之第一解決方案為應用原始Overlap4×1運算元兩次。具體言之,Overlap4×1Solution1(a,b,c,d)規定為:
1. Overlap4×1(a,b,c,d)
2. Overlap4×1(d,c,b,a)
藉由顛倒兩個實施例之間的次序,由第一階段引入之直流漏電由第二階段消除。重複排序將導致漏 電累積。遺憾地,此解決方案仍遭受顯著直流增益不匹配。
若此運算元採用輸入X1,則輸出像素具有的值為1454061或1453548或1454852或1454340。ScalingGainRatio大致為1.4542。DCLeakageRatio為(1454852-1453548)/10^6=1304/10^6。對每樣本影像8位元而言,8位元影像之最壞狀況ScalingGainMismatch為(1.4615-1.4542)*128/ScalinGainRatio=0.9344/ScalinGainRatio~0.64。最壞狀況DCLeakage可為127/ScalinGainRatio*1304/10^6~0.16561/ScalingGainRatio。對每樣本影像16位元而言,最壞狀況ScalingGainMismatch為0.9344*256/ScalinGainRatio~239.2064/ScalingGainRatio~163。最壞狀況DCLeakage可為256*0.16561/ScalingGainRatio~42.39/ScalinGainRatio~28.76。就複雜性而言,此解決方案具有約兩倍於現有運算元的複雜性。
3.4.2 解決方案2
解決方案2在精神上類似於解決方案1,尤其在於其涉及將單一運算元應用於相同像素兩次。但是,對於此修整,吾人藉由添加額外的提升步驟改變原始 Overlap4×1運算元的定比比例。如前文,Overlap4×1Solution2(a,b,c,d)規定為:
1. Overlap4×1Altered(a,b,c,d)
2. Overlap4×1Altered(d,c,b,a)
此等修改在定比階段中需要6個額外的提升步驟,其中每一提升步驟具有一次加法及一次移位。
此解決方案(2)之理念為改變x及y以使得直流漏電及直流定比增益不匹配最小化。可如下描述該程序。
用於最小化直流漏電之條件如下1+xy+x(2+xy)=y+1+xy
因此,吾人使
在此狀況下,此運算元之一階段之ScalingGainRatio可計算為
令Overlap4×4運算元之直流增益之平方根表示為k。因此,最小化ScalingGainmismatch之x值由以下給出
一旦吾人使用此方程式判定最小化ScalingGainmismatch之x值,吾人可使用早先的方 程式判定y值(其最小化直流漏電)。
在吾人所述之狀況下,Overlap4×4運算元之ScalingGainRatio1.461543。
因此,ksqrt(1.461543)1.208943且吾人設計之直流定比增益必須近似此值,以最小化直流定比增益不匹配。因此,x值必須近似0.094589554且y值應根據早先的方程式來選擇。
在實務上,吾人以可使用二進位提升步驟實施之值來近似x值並選擇y值,且接著以可使用二進位提升步驟實施之值來近似y值。在實務上,最小化直流漏電之目標比最小化直流定比增益不匹配之目標重要。因此,針對給定x值的y值之近似必須比x值之初始近似準確。
解決方案a。選擇x=3/32及y=775/4096=3/16+1/512-1/4096。此解決方案具有最小直流漏 電。此解決方案之直流增益為
因此,此解決方案仍具有少量ScalingGainMismatch。
應注意,與現有解決方案相比,不存在用於實施x之額外的提升步驟。與現有解決方案相比,y之實施需要兩個額外的提升步驟。
解決方案b。選擇x=97/1024=3/32+1/1024及y=49/256=3/16+1/256。此解決方 案具有最小直流漏電。此解決方案之直流增益為
因此,此解決方案仍具有少量ScalingGainMismatch,但比解決方案a小。
應注意,與現有解決方案相比,存在用於實施x之一個額外的提升步驟。與現有解決方案相比,y之實施需要一個額外的提升步驟。因為定比階段需要實施x兩次且實施y一次,所以在新解決方案中,存在3個額外的提升步驟。
解決方案c。選擇x=775/8192,即3/32+1/1024-1/8192,及y=391/2048=3/32+1/512-1/2048。此解決方案之直流增益為
因此,此解決方案具有最少量之ScalingGainMismatch。
在實施x時,存在兩個額外的提升步驟。在實施y時,存在兩個額外的提升步驟。
因為定比階段需要實施x兩次且實施y一次,所以在新解決方案中,存在6個額外的提升步驟。
對Overlap4×1之修改具有進一步減少直流增益不匹配及直流漏電之優點。藉由保留解決方案1之精神,其所有益處同樣得以保留。
若此運算元採用輸入X1,則所有輸出像素具有的值為1461631。ScalingGainRatio為約1.4616。DCLeakageRatio大致為0(遠小於2-16)。
對每樣本影像8位元而言,最壞狀況ScalingGainMismatch為(1.461543-1.461631)*128/ScalinGainRatio=0.000088/ScalingGainRatio。最壞狀況DCLeakage為0。
對每樣本影像16位元而言,最壞狀況ScalingGainMismatch為0.000088*256/ScalingGainRatio=0.022528/ScalingGainRatio。最壞狀況DCLeakage為0。
就複雜性而言,Overlap4×1Altered中之六個額外的提升步驟使得其複雜性比Overlap4×1大1.5倍。因此,總解決方案Overlap4×1Solution2具有約3倍於現有解決方案的複雜性。
3.4.3 解決方案3
在此修整中,吾人藉由Overlap4×4之定比階段替換Overlap4×1之定比階段以形成新運算元Overlap4×1Solution3。此解決方案為單一步驟解決方案,且因此不需要重複任何運算元(如同在原始設計中)。此等修改確保Overlap4×1Solution3之直流增益及直流漏電大致與Overlap4×4運算元之直流增益及 直流漏電相同。然而,歸因於定比階段外之運算之捨入效應,仍存在一些小差異。
若此運算元採用輸入X1,則輸出像素具有的值為1461552、1461547、1461540及1461535。ScalingGainRatio大致為1.45615435。DCLeakageRatio為(1461552-1461535)/10^6。
對每樣本影像8位元而言,最壞狀況ScalingGainMismatch為(1.461543-1.45615435)*128/ScalingGainRatio~0.000064/ScalingGainRatio。最壞狀況DCLeakage為(1461552-1461535)/10^6*128=0.002176/ScalingGainRatio。
對每樣本影像16位元而言,最壞狀況ScalingGainMismatch為0.000064*256=0.016384/ScalingGainRatio。最壞狀況DCLeakage為0.002176*256=0.557056/ScalingGainRatio<1/2。
用新定比階段替換舊定比階段因兩個額外定比步驟而增加複雜性。針對邊緣,此大致將複雜性增加至1.2倍於當前解決方案的複雜性。
3.5 CornerOverlap2×2運算元之所提議的解決方案
吾人對CornerOverlap2×2運算元提議兩個可能的解決方案。
3.5.1 解決方案1
解決方案1為針對角落開發新Overlap6×1運算元,進而使角落像素與鄰近邊緣像素合併。此解決方案為不良之一個原因,係因為其需要消除直流增益不匹配及直流漏電的複雜設計。另外,若此等運算元之定向為水平的,則影像寬度小於3個巨集區塊,則此解決方案失敗。類似地,若此等運算元之定向為垂直的,則少於3個巨集區塊之高度的4:2:0影像及少於2個巨集區塊之高度的4:2:2影像不對此解決方案起作用。
3.5.2 解決方案2
解決方案為將應用於邊緣的相同Overlap4×1運算元以光柵掃描次序應用於角落像素。因為兩個運算元均作用於4個像素,所以此解決方案具有角落運算元將具有與邊緣運算元準確相同之直流增益不匹配及直流漏電特性的優點。
吾人將此解決方案表示為:CornerOverlap2×2(a,b,c,d)=Overlap4×1AppliedSolution(Top Left,Top Right,Bottom Left,Bottom Right)
吾人提議針對每一角落使用相同像素排序。此具有實現跨越所有角落之均勻實施的優點。此實施之缺點為旋轉可能引入一些小誤差。若Overlap4×1Solution3經選擇,則誤差將僅在捨入之間。或者,旋轉排序可用於每一角落處。
3.6 色度之Overlap2×2運算元的所提議的解決方案
Overlap2×2運算元之問題為直流漏電。在此節中,吾人重新設計此運算元之定比階段以使得直流漏電最小化。在以下節中,Overlap2×1及CornerOverlap2×1運算元經重新設計以使此運算元增益匹配。
解碼器處之此運算元之直流漏電,可藉由將對此運算元之所有輸入設定為相同值來估計。若對逆Overlap2×2運算元之輸入全部為相同值,則此運算元對一對輸入值之效應可表示為:
對無直流漏電而言,條件為1+xy+y=x(2+xy)+1+xy
y=x(2+xy)
直流漏電之量可量化為y-x(2+xy)
當前設計設定x=1/4及y=½,且因此當前輸出為(1+xy+y)=13/8及(x(2+xy)+1+xy)=53/32,且此差異為1/32之直流漏電的原因。
應注意,現有設計之複雜性較小,因為x值及y值順從使用極簡單二進位提升步驟的實施例。
雖然通用解決方案可改變x及y以便減輕直流漏電,但此等解決方案可具有大於現有設計之複雜性。因此,吾人可著重於可減少直流漏電同時最小化複雜性之增加的解決方案。
在一可能的解決方案中,吾人保留x=1/4並調整y值,以使得直流漏電最小化。應注意,發生使用y值之提升,且因此與改變x值同時保留現有y值之解決方案相比,此解決方案將具有較小複雜性。
3.6.1 解決方案1
消除直流漏電之y值為y=2*(1/4)/(1-1/16)=8/15。此解決方案中之直流漏電為零。然而,y=8/15無法使用二進位提升步驟來實施。因此,此解決方案因為需要除法運算而具有較高複雜性。
3.6.2 解決方案2a
將值設定為y=17/32且可使用二進位提升步驟實施(在無乘數之情況下)為½+1/32。此值具有直流漏電1/512。
3.6.3 解決方案2b
將y值設定為273/512。此解決方案可使用二進位提升步驟實施(在無乘數之情況下)為½+1/32+1/512。此直流漏電值為1/8192。
3.6.4 解決方案2c
將y值設定為4369/8192。此解決方案可使用二進位提升步驟實施(在無乘數之情況下)為½+1/32+1/512+1/8192。此直流漏電值為1/131072,亦即,1/(2^17)。
應注意,
因此,吾人使直流漏電自1/32(0.03125)減少至1/(2^17)。因此直流漏電減少至低於16位元精確度。直流定比增益比在此狀況下為1+xy+y=54613/32768~1.666656494。
3.7 Overlap2×1運算元之所提議的解決方案
類似於Overlap4×1之解決方案,吾人對Overlap2×1提議3個解決方案。每一解決方案在精神上類似於三個Overlap2×1解決方案中之每一者。
3.7.1 解決方案1
因為Overlap2×1之直流增益大致為Overlap2×2之直流增益之平方根,所以吾人之第一解決方案為應用原始Overlap2×1運算元兩次。具體言之,Overlap2×1Solution1(a,b)規定為:
3. Overlap2×1(a,b)
4. Overlap2×1(b,a)
藉由顛倒兩個實施例之間的次序,由第一階段引入之直流漏電由第二階段消除。重複排序將導致漏電累積。
遺憾地,此解決方案仍遭受大量直流增益不匹配。就複雜性而言,此解決方案具有約兩倍於現有運算元的複雜性。
3.7.2 解決方案2
解決方案2為在精神上類似於解決方案1,尤其在於其涉及將單一運算元應用於相同像素兩次。但是,對於此修整,吾人藉由添加額外的提升步驟改變原始Overlap2×1運算元之定比比例。如前文,Overlap2×1Solution2(a,b)規定為:
3. Overlap2×1Altered(a,b)
4. Overlap2×1Altered(b,a)
此解決方案(2)之理念為改變x及y以使得直流漏電及直流定比增益不匹配最小化。可如下描述該程序。
用於最小化直流漏電之條件如下1+xy+x(2+xy)=y+1+xy
因此,吾人使
在此狀況下,此運算元之一階段之ScalingGainRatio可計算為
令Overlap2×2運算元之增益之平方根表示為k。因此,最小化直流定比增益不匹配之x值由以下給出
一旦吾人使用此方程式判定最小化ScalingGainMismatch之x值,吾人可使用早先的方 程式判定y值(其最小化直流漏電)。
在吾人所述之狀況下,Overlap4×4運算元之ScalingGainRatio1.666656494。
因此,ksqrt(1.666656494)1.290990509,且吾人之設計之直流定比增益必須近似此值以最小化DC定比增益不匹配。
因此,x值必須近似0.127015153且y值應為根據早先的方程式來選擇。
在實務上,吾人以可使用二進位提升步驟實施之值來近似x值並選擇y值,且接著以可使用二進位提升步驟實施之值來近似y值。
在實務上,最小化直流漏電之目標比最小化直流定比增益不匹配之目標重要。因此,針對給定x值的y值之近似,必須比x值之初始近似準確。
3.7.3 解決方案2a
選擇x=1/8及y=65/256=1/4+1/256。此解決方案具有最小直流漏電。此解決方案之直流定比增益為
因此,此解決方案仍具有少量直流定比增益不匹配。
應注意,與現有解決方案相比,不存在用於實施x之額外的提升步驟。與現有解決方案相比,y之實施需要一個額外的提升步驟。
3.7.4 解決方案2b
選擇x=65/512=1/8+1/512及y=33/128=1/4+1/128。此解決方案具有最小直流漏電。此解決方案之直流定比增益為
因此,此解決方案仍具有少量定比增益不匹配,但比解決方案a更少。
應注意,與現有解決方案相比,存在用於實施x之一個額外的提升步驟。與現有解決方案相比,y之實施需要一個額外的提升步驟。因為定比階段需要實施x兩次且實施y一次,所以在新解決方案中,存在3個額外的提升步驟。
3.7.5 解決方案2c
選擇x=2081/16384及y=33/128。此解決 方案之直流定比增益為
因此,此解決方案具有最少量之直流定比增益不匹配。
在實施x時,存在兩個額外的提升步驟。在實施y時,存在一個額外的提升步驟。
因為定比階段需要實施x兩次且實施y一次,所以在新解決方案中,存在5個額外的提升步驟。就複雜性而言,Overlap2×1Altered中之五個額外的提升步驟使得其複雜性比Overlap2×1大1.5倍。因此,總解決方案Overlap2×1Solution2具有約3倍於現有解決方案的複雜性。
3.7.6 解決方案3
在此修整中,吾人藉由Overlap2×2之定比階段替換Overlap2×1之定比階段以形成新運算元Overlap2×1Solution3。此解決方案為單一步驟解決方案且因此不必重複任何運算元(如同在原始設計中)。此等修改確保Overlap2×1Solution3之直流增益及直流漏電大致與Overlap2×2運算元之直流增益及直流漏電相同。然而,歸因於定比階段外之運算之捨入效應,仍存在一些小差異。
用新定比階段替換舊定比階段因三個額外定比步驟而增加複雜性。針對邊緣,此大致比當前解決方案之複雜性增加1.2倍的複雜性。
3.8 CornerOverlap1×1運算元之所提議的解決方案
CornerOverlap1×1運算元因為其僅對單一像素運算,呈現特定設計挑戰。當直流增益不匹配為顯著問題時,直流漏電因此並不為問題。吾人呈現若干可能解決方案。
3.8.1 解決方案1
類似於CornerOverlap2×2運算元之解決方案1,一個解決方案為設計新Overlap3×1運算元。但此解決方案具有類似缺點。此解決方案除遭受額外直流增益不匹配及直流漏電問題的可能性外,亦遭受最小影像大小要求(沿運算元之方向的3個巨集區塊)。
3.8.2 解決方案2
對此解決方案而言,吾人衡量以下事實:角落像素可能與其鄰近像素高度相關。回憶起此運算元作用於原始影像區塊中之每一者的平均值。因此在重疊運算元之前,角落像素及其鄰近像素之值很可能類似。若消除直流增益不匹配,則角落像素值將亦在重疊變換後極類似於其鄰近像素。
吾人因此提議基於角落像素之預測的方案。吾人視左上角為一實例且如下標記該等像素:
A B...
C D...
...
因此,左上像素標記為A,A右側之一像素處的像素標記為B,且A下方之一像素處的像素標記為C。吾人之預測方案因此如下實施(假設在適當處使用計算)。
1.在應用第二階段重疊運算元之前:a.值(A)=值(A)-(值(B)+值(C)+1)>>1
2.在應用第二階段重疊運算元之後:a.值(A)=值(A)+(值(B)+值(C)+1)>>1
應注意,「>>1」表示向右移位1且等效於除以2。因為在步驟1之後的A之殘差值可能較小,所以此運算大致等效於將相同增益應用於角落像素。直接將此解決方案應用於其他三個角落。
此解決方案具有優點在於:其就旋轉而言係對稱。此解決方案的一缺點為需要影像至少具有2巨集區塊寬度及2巨集區塊高度(僅針對4:2:0,而非4:2:2),否則,該預測方案變得無意義。
3.8.3 解決方案3
吾人提議一第二計畫類似於其解決方案2。一些實施例可能不一次執行HD Photo/JPEG XR變換之每一階段,而是使該等階段交錯。此事實上使得在重 疊變換前後難以同時存取B及C。吾人針對此情形提議以下方案:
1.在第二階段重疊運算元應用於B之前:a.值(A)=值(A)-值(B)>>1
2.在第二階段重疊運算元應用於C之前:a.值(A)=值(A)-值(C)>>1
3.在第二階段重疊運算元應用於B之後:a.值(A)=值(A)+值(B)>>1
4.在第二階段重疊運算元應用於C之後:a.值(A)=值(A)+值(C)>>1
應注意,在此解決方案中,步驟之排序僅需要在3之前發生1且在4之前發生2。只要符合此兩個條件,任何重排序為可接受的。
此解決方案允許在各種實施例中與時序問題分離。遺憾地,此解決方案可能具有一些在解決方案2中不存在的捨入問題。否則,此解決方案具有與解決方案2相同之特性。
3.8.4 解決方案4
在此解決方案中,吾人微調解決方案3以僅在水平方向上運算。吾人如下規定此解決方案:
1.在第二階段重疊運算元應用於B之前:a.值(A)=值(A)-值(B)
2.在第二階段重疊運算元應用於B之後:a.值(A)=值(A)+值(B)
此解決方案之優點為其需要較少記憶體存取。因為其與解決方案2及3之一半多的像素相互作用,所以複雜性較低。此解決方案之缺點在於:其缺少對稱性且因此具有旋轉問題。當考慮降低取樣引入較非對稱性情況所引入更大之損失時,此關注事項得以減輕。
鑒於其他解決方案,此解決方案需要影像具有至少2個巨集區塊的寬度。但一個優點在於:所有經降低取樣色度運算係類似的。
3.8.5 解決方案5
在此解決方案中,吾人微調解決方案3以僅在垂直方向上運算。吾人如下規定此解決方案:
1.在第二階段重疊運算元應用於C之前:a.值(A)=值(A)-值(C)
2.在第二階段重疊運算元應用於C之後:a.值(A)=值(A)+值(C)
此解決方案之優點為其需要較少記憶體存取。因為其與解決方案2及3之一半多的像素相互作用,所以複雜性較低。此解決方案之缺點在於:其缺少對稱性且因此具有旋轉問題。當考慮降低取樣引入較非對稱性情況所引入更大之損失時,此關注事項得以減輕。
鑒於其他解決方案,此解決方案需要4:2:0影像具有至少2個巨集區塊的高度。此解決方案不產生其他大小要求。因此4:2:0及4:2:2運算並不平行,其為此解決方案之一個缺點。
3.8.6 解決方案6
此最終解決方案為解決方案4及5之組合。吾人藉由將一語法元素添加至位元流,以指明預測為水平還是垂直。此解決方案具有之優點在於旋轉簡單地得以支援。語法元素之添加為此方案之缺點。
4. 第二實施例
吾人提議當將重疊運算元用於編碼經編碼之圖塊內之影像資料時,添加對「硬」(非重疊)圖塊邊界的支援(在一些情形下,以增強圖塊式影像編碼之靈活性及減小解碼圖塊對準之空間區域所需的複雜性)。
吾人將此視為使設計支援之適用額外特徵。根據先前設計,不存在使解碼器完善解碼整個圖塊區域(包括靠近其邊界之樣本)的方式,除非應用以下各者中之一者: -編碼器針對圖塊內之圖片區域之編碼停用重疊(其不利地影響設計之壓縮能力),或 -解碼器另外解碼相鄰於所要圖塊之區域,應用重疊處理並丟棄額外資料。
先前操作模式之保持亦重要,因為其使編碼器能夠以避免圖塊邊界處之可見「縫隙」假影的方式編碼圖片,且甚至允許圖塊邊界位置僅使用經壓縮之域運算而改變(而不需要全解碼及重新編碼)。事實上,吾人認為出於大多數目的,當前(重疊圖塊)操作模式對於「硬圖塊邊界」模式為大體較佳的。吾人僅提議新模式以便 僅向編碼器設計者提供為自身選擇是否重疊圖塊邊界的能力(而不需要其切斷圖塊內之重疊來達成此目的)。
雖然可用技術複製以軟圖塊化架構的硬圖塊化的一些優點,但吾人覺得顯式硬圖塊化支援將輔助JPEG XR的採用。吾人因此提議將新硬圖塊化語法元素添加至JPEG XR。在此文獻中,吾人進一步論述解決方案在JPEG XR標準草案中,限制硬圖塊化選項之實施所遭遇的問題。因為硬圖塊化之最直接的解決方案為將影像現有重疊運算元用於硬圖塊邊界處之影像邊界,吾人提議替換JPEG XR之重疊運算元以改良硬圖塊效能。
應注意,吾人提議將此等新運算元用於所有狀況以允許進行一致運算。因此,藉由此提議達成之益處亦適用於影像縫合情形。亦即,當單一影像被分為區域,經獨立編碼,繼而顯示為「縫合」在一起之單一影像時。
藉由添加硬圖塊化支援而提供之靈活性將增強該標準適當解決許多應用之需要的能力,且因此將強化該標準之技術設計。支援硬圖塊之複雜性影響最小。此提議之採用僅將兩個最小約束添加至影像編解碼器。其為:
.藉由OVERLAP_MODE=2且藉由色度子取樣(4:2:0或4:2:2)編碼之所有影像具有大於1個巨集區塊的寬度
.藉由OVERLAP_MODE=2,藉由色度子取樣(4:2:0或4:2:2)且藉由硬圖塊邊界編碼之所有圖塊具有1個巨集區塊的寬度
吾人覺得此等限制並不具有影響。
4.1 硬圖塊化支援
吾人提議以與現有設計相容之方式添加「硬圖塊邊界」支援,其係藉由提供何時在被現有解碼器忽略之一部分語法中以此方式操作的語法指示而為之。具體言之,吾人提議使用稱為RESERVED_C之子版本號碼欄位。
因此吾人如下定義一變數:DisableTileOverlapFlag=(RESERVED_C>>3)&1
當OVERLAP_MODE等於0時,吾人提議命令DisableTileOverlapFlag等於零、經解碼器忽略、且經保留以用於未來反向相容的未來使用。
當OVERLAP_MODE不等於0且DisableTileOverlapFlag等於0時,先前規定之行為將適用一其中,無論何時重疊應用於經編碼之圖塊內,跨越圖塊邊界便應用重疊。
當OVERLAP_MODE不等於0且DisableTileOverlapFlag等於1,重疊將被應用於經編碼之圖塊內但不跨越其邊界。
若在存在DisableTileOverlapFlag之定義之前設計的解碼器將遭遇DisableTileOverlapFlag為TRUE的經編碼之影像,其仍可解碼基本上可見之圖片,但是該圖片將在圖塊邊界附近含有假影。後處理可假想地經應用(若可用)以減小此等假影之嚴格性。吾人將此方法視為優於使用某一其他語法指示,該指示將使先前解碼器完全不能解碼圖片。
4.2 待解決以啟用硬圖塊化之重疊問題的綜述
JPEG XR變換為階層折疊變換。自編碼器之觀點言之,其由四個有序步驟組成:(1)第一階段重疊變換、(2)第一階段核心變換、(3)第二階段重疊變換及(4)第二階段核心變換。此等變換中之每一者對不彼此重疊之4×4區塊的網格運算。(在經降低取樣之色度通道的情況下,變換之第二階段實際上對2×2網格運算。在稍後節對關於此等狀況予以更多細節)。對兩個核心變換而言,其在無相對於影像之左上像素之偏移的情況下對準。兩個重疊變換對相對於核心變換移位之網格運算。重疊網格具有相對於核心變換網格的兩像素水平偏移及兩像素垂直偏移。
藉由軟圖塊化,僅在圖片之邊緣及角落處發生此兩像素偏移。(應注意,吾人假設巨集區塊對準之影像。在實務上,未經巨集區塊對準之影像經填補以滿足 此條件。)因此,應用於影像之邊緣及角落處時之重疊變換不同於應用於影像之內部時之重疊變換。因此,實際上存在用於實施重疊變換的3個運算元。其為:
1. Overlap4×4-應用於內部4×4區塊
2. Overlap4×1-應用於沿著邊緣之兩個行及兩個列
3. CornerOverlap2×2-應用於四個角落中之每一者中。
吾人在下圖中圖示此等運算元。
樣本2區塊×2區塊區域,其中黑點表示像素且淺灰色表示區塊邊界。在此影像上繪製藍色迴圈以表示該等重疊運算元中每一者之支援的區域。中央區域表示Overlap4×4運算元,角落區域表示CornerOverlap2×2區域,且剩餘區域為Overlap4×1運算元。
吾人必須給一個額外警告。當影像之內部顏色格式設定為4:2:2或4:2:0時,則第二階段變換實際上必須對每巨集區塊較少像素運算。結果,存在額外3個重疊運算元。此等運算元如下:
1. Overlap2×2-應用於內部2×2區塊
2. Overlap2×1-應用於沿著邊緣之行及列
3. CornerOverlap1×1-應用於四個角落中之每一者中。
吾人在以下諸圖中針對4:2:2且針對4:2:0圖示此等運算元。
樣本2巨集區塊×2巨集區塊第二階段區域,其中黑點表示直流像素且淺灰色表示4:2:2子取樣之色度通道的巨集區塊邊界。在此影像上繪製藍色迴圈以表示該等重疊運算元中每一者之支援的區域。中央區域表示 Overlap2×2運算元,角落區域表示CornerOverlap1×1區域且剩餘區域為Overlap2×1運算元。
樣本2巨集區塊×2巨集區塊第二階段區域,其中黑點表示直流像素且淺灰色表示4:2:0子取樣之色度通道的巨集區塊邊界。在此影像上繪製藍色迴圈以表示該等重疊運算元中每一者之支援的區域。中央區域表示Overlapp2×2運算元,角落區域表示CornerOverlap1×1區域且剩餘區域為Overlap2×1運算元。
因為大多數此等運算元僅在角落處或在特殊狀況下運算,所以其效應具有極少可見性。當吾人引入硬圖塊邊界時,此等區域可自影像之周邊移動至中央。在影像之中央,此等運算元之問題變得明顯且可見。
除提供新語法以啟用硬圖塊邊界外,吾人提議新重疊運算元。此等新重疊運算元經設計以在兩個特徵方面匹配主要內部重疊運算元:(1)定比直流增益及(2)直流漏電。定比直流增益及直流漏電(附錄B中所論述)因引入必須編碼之額外交流係數而降低編碼效率。吾人在下文論述所提議的重疊運算元。
4.3 所提議之新的主要重疊運算元
在此節中,吾人著重於三個主要重疊運算元。吾人如下量測此等運算元之現有直流增益層級及直流漏電:
1. Overlap4×4-直流增益:1.4614直流漏電:0.000007
2. Overlap4×1-直流增益:1.2089直流漏電:0.001408
3. CornerOverlap2×2-直流增益:1.0000直流漏電:0.000000
應注意,目前,角落重疊運算元不由運算組成,因此其展現單位增益。Overlap4×4運算元之設計論述於前文獻中,如附錄B中所展示。吾人因此將吾人之所提議的重疊運算元建立於此運算元基礎上。
4.3.1 邊緣運算元
Overlap4×1運算元中之直流增益不匹配及直流漏電之解決方案為用Overlap4×4運算元之定比階段替換其定比階段(參見附錄B)。此解決方案確保邊緣重疊運算元具有與內部重疊運算元相同的準確直流增益。另外,固定於內部重疊運算元之直流漏電與邊緣運算元匹配。
藉由替換邊緣運算元之定比階段,複雜性增加約20%。此增加複雜性係因應用兩個額外定比步驟所致。
4.3.2 角落運算元
因為角落運算元係為特殊狀況而呈現設計挑戰。如上文所論述,當前設計不包括此等像素之運算,此意味新運算元無法根據舊運算元修改。此外,由於區域獨特形狀,運算元應專用於該區域。
吾人提議將來自部分為0之邊緣重疊運算元以光柵掃描次序應用於4個角落像素。因為兩個運算元均作用於4個像素,所以Operator4×1可應用於角落像素。吾人按以下次序對像素運算:左上像素、右上像素、左下像素及右下像素。
此解決方案具有若干優點。此解決方案之一個優點在於其消除所有直流增益不匹配,因為角落運算元之直流增益準確地等效於邊緣運算元之直流增益。此外,藉由以此方式使用邊緣運算元,邊緣運算元之所有直流漏電特性由角落運算元繼承。此方案之一額外優點為每一角落之等效處置簡化硬體實施。
此方案存在兩個缺點。主要缺優點為其相對於現有方案之增加的複雜性。但增加的複雜性最小(尤其認為此運算元僅應用於四個角落)。吾人考慮之第二缺點係在影像旋轉中。類似於核心運算元之捨入效應的額外捨入效應自此新運算元而產生。
總之,吾人覺得此解決方案之益處遠勝於其他可能解決方案。
4.4 所提議之新色度重疊運算元
在此節中,吾人著重於三個色度重疊運算元。吾人如下量測此等運算元之現有直流增益層級及直流漏電:
1. Overlap2×2-直流增益:1.6406直流漏電:0.0313
2. Overlap2×1-直流增益:1.2832直流漏電:0.0039
3. CornerOverlap1×1-直流增益:1.0000直流漏電:N/A(僅單一像素)
應注意,目前,角落重疊運算元不由運算組成,因此其展現單位增益。
不同於Overlap4×4運算元,尚未對Overlap2×2運算元作改變。因此,吾人藉由論述Overlap2×2運算元開始論述此等運算元。吾人接著將吾人之所提議的重疊運算元建立於此運算元基礎上。
吾人應注意,此等運算元之使用係相當有限的。其僅用於子取樣之色度通道且僅用於重疊之兩個層級得以啟用時。此外,因為此等運算元僅應用於第二階段,所以其對影像之低通濾波版本運算。此外,此操作模式主要著重於低速率情形。因此,雖然複雜性因下文提議而增加,但是此增加之效應最小。
4.4.1 內部運算元
鑒於附錄B中所展示者之前的原始Overlap4×4運算元,Overlap2×2展現直流漏電。亦 即,完全平坦輸入因變換導致交流係數。類似於固定Overlap4×4運算元,吾人提議額外的提升步驟以減輕此問題。
若對逆Overlap2×2運算元之輸入全部為相同值,則此運算元對一對輸入值之定比階段的矩陣表示可表示為:
在現有設計中,吾人使x=1/4及y=1/2。
對於此構造,吾人瞭解到應用於一個輸入之定比為1+xy+y且應用於另一者之定比為x(2+xy)+1+xy。吾人可因此根據此兩個定比因數之間的差異量測直流漏電。吾人因此將直流漏電計算為x(2+Xy)-y。
因此,理想地,吾人設定y=2x/(1-x2)。固定x=1/4將得出y=8/15。鑒於附錄B之Overlap4×4運算元,此理想解決方案無法藉由二進位提升步驟來實施。因此,因為此解決方案需要除法運算元,而其具有較高複雜性。
或者,鑒於Overlap4×4運算元,吾人提議額外的提升步驟以驅使直流漏電低於最低有效位元之層級。吾人提議保持x=1/4並設定:y=1/2+1/32+1/512+1/8192=4369/8192
產生自此改變之運算元之直流漏電量測為1/217=0.00000763。此明顯低於顯著影響計算之臨限值。
因為此解決方案僅需要添加3個新定比步驟,所以複雜性影響最小,如同在附錄B中。吾人僅改變y值而非x值以確保對複雜性的最小影響。
4.4.2 邊緣運算元
鑒於主要運算元,吾人藉由將運算元的定比階段替換為來自部分為0之Overlap2×2運算元之經更新的定比階段,來修整Overlap2×1運算元。藉由使用經更新之定比階段,吾人確保吾人與內部運算元之直流增益匹配。另外,吾人與內部運算元之直流漏電特性匹配。
此改變具有小的複雜性增加。類似於主要邊緣運算元,複雜性增加僅為小分數。
4.4.3 角落運算元
CornerOverlap1×1運算元呈現又一設計挑戰。因為其作用於單一像素,所以應用定比運算元並不可能。因為整數算術用於維持無損編碼能力,所以分數乘數無法在維持無損能力的同時得以使用。結果,此運算元之所有所提議的解決方案都具有缺點。
吾人提議基於預測及殘差之方案作為折衷解決方案。在此方案中,吾人利用對第二階段變換之輸入資料的低通性質以註明角落像素將很可能具有極類似於 其鄰近像素之值。在自然影像中,角落之區域中之像素將在第二階段重疊變換之前具有幾乎相同值且應理想地在變換之後具有幾乎彼此相同的值。
擴展此理念,吾人將角落像素中之每一者視為由可預測部分及殘差值組成。必要之處在於維持像素值為殘差值。吾人如下擴展此理念並將其實施:
-在第2階段重疊運算元應用於任何像素之前
值(角落像素)-=值(水平鄰近像素)
-在第2階段重疊運算元應用於除角落像素外之所有像素之後
值(角落像素)+=值(水平鄰近像素)
此方案維持角落像素與其相鄰像素之間的殘差差異,且當被應用於鄰近之像素時,具有將類似的直流增益應用於角落像素的效力。直流漏電並非係問題,因為此僅為單一像素。
主要因為複雜性,吾人提議僅使用水平像素而非垂直像素。雖然僅用於四個角落中,僅對每一角落的一個像素而非對兩個像素之請求存取會減少運算之次數。另外,水平定向迫使4:2:2及4:2:0方案兩者使用相同處理。最終,因為此等像素全部高度相關,所以水平鄰近與垂直鄰近之像素之間的差異可能最小。
或者,一語法元素可用於在水平及垂直像素之間切換,但吾人覺得此等像素之相對顯著性不驗證額外語法。
僅使用水平預測之一個缺點產生自旋轉。但是,吾人認為此等效應最小。如上文所述,水平鄰近與垂直鄰近之像素之值係高度相關且不可能顯著改變。結果,吾人注意到應用於色度之子取樣將導致比預測器不匹配更大的失真源。
使用此解決方案會強加上述約束,此處加以重複。
.藉由OVERLAP_MODE=2且藉由色度子取樣(4:2:0或4:2:2)編碼之所有具有大於1個巨集區塊的寬度
.藉由OVERLAP_MODE=2,藉由色度子取樣(4:2:0或4:2:2)且藉由硬圖塊邊界編碼之所有圖塊具有1個巨集區塊的寬度
此使得用於預測之像素自身並非角落像素。吾人應注意,需要使用鄰近像素解決直流增益匹配的任何方案將亦招致此限制(或可能更嚴格的要求)。
總之,此解決方案提供對修整CornerOverlap1×1運算元的折衷。
4.5 使用所提議之重疊運算元的實驗結果
此節對使用本文中所述之所提議的重疊運算元進行的實驗之結果而進行報告。吾人使用此等實驗以論證此等新重疊運算元不引入壓縮效能的衰退。
針對如題為「JPEG XR AHG,“JPEG-XR:Core Experiments Description 2.0,”ISO/IEC JTC 1/SC 29/WG 1 N4600,April 2008」:PSNR的CE計劃文獻中所規定的以下量度來量測編碼結果:多標度MSSIM、單標度MSSIM及L-無限。在此文獻中,吾人著重於多標度MSSIM。關於其他量度之報告可見於與此案一起包括之附加的資料檔案。
在每樣本8位元測試集中存在102個影像,其如下概括:-11個灰階影像,-2複合影像(RGB),及-89自然影像(RGB)。
在每樣本16位元資料集之中存在31個影像。針對PSNR及L-無限量測結果,所有CE3源影像均為每樣本16位元的RGB格式且經轉換回為原始格式。此外,針對單標度及多標度MSSIM量測結果,該等影像亦轉換為每樣本8位元格式。格式轉換工具由CE參與者提供並同意。
在以下子節中概括該等結果。在以下曲線圖中之每一資料點表示針對對應編解碼器組態在特定量化品質設定下的跨越所有測試影像(亦即,針對每樣本8位 元、102個影像,及針對每樣本16位元、31個影像)的平均多標度MSSIM值及平均位元速率。
每樣本8位元影像結果
吾人呈現在使用重疊層級1及重疊層級2之情況下的4:2:0及4:4:4內部顏色格式之平均結果。此等結果用於每樣本8位元影像。
每樣本16位元影像結果
吾人呈現在使用重疊層級1及重疊層級2之情況下的4:2:0及4:4:4內部顏色格式之平均結果。此等結果用於每樣本16位元影像。
4.6 注釋
上述節中所呈現之結果論證:在作為單一圖塊編碼之大影像上,所提議之重疊運算元具有極少影響且因此不呈現效能衰退。但是,相比而言,在小硬圖塊上,新重疊運算元提供防止編碼假影的顯著益處。
因為此等新運算元對複雜性及額外限制提供小成本同時改良效能並啟用新功能性,所以吾人提議其用於JPEG XR標準草案內。
4.7 硬及軟圖塊邊界之間的譯碼
在已建立實施硬圖塊邊界所需之修整後,吾人現考慮硬及軟圖塊之間的轉換。基於4.2節中所提議之語法,改變語法是直截了當的。因此模式之間的譯碼之努力導致重疊運算元的改變。
幸運地,軟及硬圖塊化之間的轉換將不需要全解碼,但是將需要大量運算。遠離圖塊邊界之區域不需要應用所改變之重疊運算元。具體言之,對於第二層級重疊(編碼器觀點),圖塊邊界上或鄰近於圖塊邊界上之巨集區塊的多個巨集區塊需要加以解碼。對於第一層級重疊,僅圖塊邊界上之多個巨集區塊需要加以解碼。一旦解碼,應用替代的重疊選項可為適用的。
4.8 觀察及結論
因為初始提議已導致針對可用特徵集在本文中所述的增強,對HD Photo/JPEG XR設計進行JPEG的檢查。此處提議改變以按應與現有先前技術相容達適用程度之方式添加此增強。
藉由此小修改提供之靈活性將實質上增強該標準的能力,以適當地解決許多應用之需要,且因此將強化該標準之技術設計。在解碼器中支援此等增強之複雜性影響可忽略。
此提議不影響經核心編碼之影像語法或基本解碼程序。
5. 計算環境
可在執行數位媒體信號處理的各種裝置中之任一者上執行上文所述之直流增益不匹配及直流漏電技術,該等裝置之實例尤其包括電腦、影像及視訊記錄、傳輸及接收設備、攜帶型視訊播放器、視訊會議裝置等。該等數位媒體編碼技術可實施於硬體電路中以及執行於一電腦或其他計算環境(諸如第7圖中所示)的數位媒體處理軟體中。
第7圖圖示適當計算環境(700)的一般化實例,其可實施所述之實施例。計算環境(700)不欲暗示對本發明之使用範疇或功能性之任何限制,因為本發明可實施於不同通用或專用計算環境中。
參閱第7圖,計算環境(700)包括至少一個處理單元(710)及記憶體(720)。在第7圖中,此最基本組態(730)係包括於虛線內。處理單元(710)執行電腦可執行指令且可為真實或虛擬處理器。在多處理系統中,多個處理單元執行電腦可執行指令以增加處理能力。記憶體(720)可為揮發性記憶體(例如,暫存器、快取記憶體、RAM)、非揮發性記憶體(例如,ROM、EEPROM、快閃記憶體等),或兩者之一些組合。記憶體(720)儲存軟體(780),其實施減少直流漏電及/或控制影像或圖塊之內部與邊緣部分之間的直流增益不匹配的所述編碼器/解碼器及變換。
一計算環境可具有額外特徵。舉例而言,計算環境(700)包括儲存器(740)、一或多個輸入裝置 (750)、一或多個輸出裝置(760)及一或多個通信連接(770)。諸如匯流排、控制器或網路之互連機構(未圖示)互連計算環境(700)之組件。通常,作業系統軟體(未圖示)提供用於該計算環境(700)中執行之其他軟體之作業環境,且協調計算環境(700)之組件的活動。
儲存器(740)可為可卸的或非可卸的,且包括磁碟、磁帶或磁帶盒、CD-ROM、CD-RW、DVD或可用於儲存資訊且可在計算環境(700)內加以存取之任何其他媒體。儲存器(740)儲存用於實施所述直流增益不匹配及直流漏電技術之軟體(780)的指令。
該或該等輸入裝置(750)可為觸控輸入裝置,諸如,鍵盤、滑鼠、筆或軌跡球、語音輸入裝置、掃描裝置或將輸入提供給計算環境(700)之另一裝置。對於音訊,該或該等輸入裝置(750)可為聲音卡或接收類比或數位形式之音訊輸入的類似裝置,或將音訊樣本提供給計算環境的CD-ROM讀取器。該或該等輸出裝置(760)可為顯示器、印表機、揚聲器、CD寫入器或自計算環境(700)提供輸出之另一裝置。
該或該等通信連接(770)使一通信媒體能夠與另一計算實體通信。該通信媒體傳達諸如電腦可執行指令、經壓縮之音訊或視訊資訊或經調變之資料信號中之其他資料的資訊。經調變之資料信號為具有一或多個其特性,以於信號中編碼資訊的方式,設定或改變的一種信號。舉例而言且並非限制,通信媒體包括實施於電、 光學、RF、紅外線、聲學或其他載體中之有線或無線技術。
可在電腦可讀媒體之一般情形下描述本文中之數位媒體處理技術。電腦可讀媒體為可在計算環境中加以存取的任何可用有形媒體。舉例而言且並非限制,關於計算環境(700),電腦可讀媒體包括記憶體(720)及儲存器(740)及兩者之組合。電腦可讀媒體為有形媒體。電腦可讀媒體不包括經調變之資料信號。
可在電腦可執行指令(諸如,包括於程式模組中、執行於目標真實或虛擬處理器上之計算環境中之電腦可執行指令)之一般情形下,描述本文中之數位媒體處理技術。大體而言,程式模組包括常式、程式、程式庫、物件、類別、組件、資料結構等,其執行特定任務或實施特定抽象資料類型。程式模組之功能性可在各種實施例中視需要組合或在程式模組之間分裂。程式模組之電腦可執行指令可執行於本端或分散式計算環境內。
為了呈現的方便起見,【實施方式】使用諸如「判定」、「產生」、「調整」及「應用」之術語描述計算環境中之電腦運算。此等術語為由電腦執行之操作的高級抽象詞且不應與由人類執行之動作相混淆。對應於此等術語之實際電腦運算取決於實施而改變。
700‧‧‧計算環境
710‧‧‧處理單元
720‧‧‧記憶體
730‧‧‧最基本組態
740‧‧‧儲存器
750‧‧‧輸入裝置
760‧‧‧輸出裝置
770‧‧‧通信連接
780‧‧‧軟體

Claims (5)

  1. 一種利用一數位媒體解碼裝置來解碼數位媒體之方法,該方法包含以下步驟:用該數位媒體解碼裝置,來:在一經編碼位元流中,接收指示出一經選擇圖塊邊界選項的資訊,其中該經選擇圖塊邊界選項指示出處理重疊運算元的一硬圖塊邊界及處理重疊運算元的一軟圖塊邊界中之一者;至少部分地基於該經選擇圖塊邊界選項,來實施逆重疊處理。
  2. 如申請專利範圍第1項之方法,該方法另包含以下步驟:當該經選擇圖塊邊界選項是指示處理重疊運算元的該軟圖塊邊界時,實施具有跨圖塊邊界的逆重疊運算的該逆重疊處理;及當該經選擇圖塊邊界選項是指示處理重疊運算元的該硬圖塊邊界時,實施不具有跨圖塊邊界的逆重疊運算的該逆重疊處理,其中該逆重疊處理仍包含對該等各自的圖塊邊界之至少一側上的邊緣樣本的逆重疊運算,以便減少直流增益不匹配。
  3. 如申請專利範圍第1項之方法,其中該經選擇圖塊邊界選項是在一影像標頭中用信號發送。
  4. 如申請專利範圍第1項之方法,其中:當該經選擇圖塊邊界選項是指示處理重疊運算元的該軟圖塊邊界時,針對一當前圖塊的該逆重疊處理包含至少部分地解碼至少一個空間相鄰圖塊;及當該經選擇圖塊邊界選項是指示處理重疊運算元的該硬圖塊邊界時,針對該當前圖塊的該逆重疊處理是無關於解碼空間相鄰圖塊。
  5. 如申請專利範圍第1項之方法,其中該經選擇圖塊邊界選項是作為經編碼為單一位元的一獨立語法元素(separate syntax element)而在該經編碼位元流中被接收。
TW105104644A 2008-10-10 2009-10-12 用於減少直流增益不匹配及直流漏電的方法及數位媒體解碼器 TWI603590B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10466808P 2008-10-10 2008-10-10
US12/571,365 US8275209B2 (en) 2008-10-10 2009-09-30 Reduced DC gain mismatch and DC leakage in overlap transform processing

Publications (2)

Publication Number Publication Date
TW201628342A TW201628342A (zh) 2016-08-01
TWI603590B true TWI603590B (zh) 2017-10-21

Family

ID=42098915

Family Applications (2)

Application Number Title Priority Date Filing Date
TW098134515A TWI540845B (zh) 2008-10-10 2009-10-12 用於減少直流增益不匹配及直流漏電的方法及數位媒體解碼器
TW105104644A TWI603590B (zh) 2008-10-10 2009-10-12 用於減少直流增益不匹配及直流漏電的方法及數位媒體解碼器

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW098134515A TWI540845B (zh) 2008-10-10 2009-10-12 用於減少直流增益不匹配及直流漏電的方法及數位媒體解碼器

Country Status (14)

Country Link
US (1) US8275209B2 (zh)
EP (1) EP2332334A4 (zh)
JP (1) JP5306469B2 (zh)
KR (1) KR101683313B1 (zh)
CN (1) CN102177714B (zh)
AR (1) AR073820A1 (zh)
AU (1) AU2009303343B2 (zh)
BR (1) BRPI0918932A2 (zh)
CA (1) CA2735973C (zh)
MX (1) MX2011003530A (zh)
MY (1) MY159055A (zh)
RU (1) RU2518932C2 (zh)
TW (2) TWI540845B (zh)
WO (1) WO2010042875A2 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008109389A (ja) * 2006-10-25 2008-05-08 Canon Inc 画像処理装置および画像処理装置の制御方法
EP2294826A4 (en) * 2008-07-08 2013-06-12 Mobile Imaging In Sweden Ab COMPRESSION METHOD OF IMAGES AND FORMAT OF COMPRESSED IMAGES
JP5199956B2 (ja) * 2009-06-16 2013-05-15 キヤノン株式会社 画像復号装置及びその制御方法
JP5199955B2 (ja) * 2009-06-16 2013-05-15 キヤノン株式会社 画像復号装置及びその制御方法
CN107959854B (zh) * 2011-07-15 2021-07-23 Ge视频压缩有限责任公司 解码器和方法、编码器和方法及存储介质
SG11201407417VA (en) 2012-05-14 2014-12-30 Luca Rossato Encoding and reconstruction of residual data based on support information
US9224213B2 (en) * 2013-12-31 2015-12-29 Facebook, Inc. Systems and methods for context based image compression
CN113011585B (zh) * 2021-03-19 2023-09-26 上海西井科技股份有限公司 消除拼接算子的编译优化方法、系统、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW364980B (en) * 1996-02-02 1999-07-21 Rohm Co Ltd Data decoding device
US6041145A (en) * 1995-11-02 2000-03-21 Matsushita Electric Industrial Co., Ltd. Device and method for smoothing picture signal, device and method for encoding picture and device and method for decoding picture
US20050013497A1 (en) * 2003-07-18 2005-01-20 Microsoft Corporation Intraframe and interframe interlace coding and decoding
US20050053150A1 (en) * 2003-09-07 2005-03-10 Microsoft Corporation Conditional lapped transform
TWI286706B (en) * 2002-11-28 2007-09-11 Shenzhen Syscan Technology Co Two-dimensional barcode card and the decoding method
US20080131013A1 (en) * 2002-07-17 2008-06-05 Tooru Suino Image decoding technique for suppressing tile boundary distortion

Family Cites Families (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4754492A (en) * 1985-06-03 1988-06-28 Picturetel Corporation Method and system for adapting a digitized signal processing system for block processing with minimal blocking artifacts
US4698672A (en) * 1986-10-27 1987-10-06 Compression Labs, Inc. Coding system for reducing redundancy
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
JP2639176B2 (ja) 1990-05-28 1997-08-06 日本電気株式会社 2次元信号符号化復号化方法とその符号化装置・復号化装置
JPH0591459A (ja) 1990-12-21 1993-04-09 Casio Comput Co Ltd 電子カメラ
JP3052516B2 (ja) 1990-12-21 2000-06-12 カシオ計算機株式会社 符号化データ処理装置
JP2549479B2 (ja) * 1991-12-06 1996-10-30 日本電信電話株式会社 動き補償フレーム間帯域分割符号化処理方法
KR0148130B1 (ko) * 1992-05-18 1998-09-15 강진구 블럭킹아티팩트를 억제시키는 부호화/복호화 방법 및 그 장치
JP3401823B2 (ja) 1993-03-31 2003-04-28 ソニー株式会社 画像コーデック用プロセッサ
US5438590A (en) * 1993-05-24 1995-08-01 Comstream Corporation Transmitting and receiving apparatus and method including punctured convolutional encoding and decoding
US5982459A (en) * 1995-05-31 1999-11-09 8×8, Inc. Integrated multimedia communications processor and codec
FR2737931B1 (fr) * 1995-08-17 1998-10-02 Siemens Ag Procede destine au traitement de blocs d'images decodes d'un procede de codage d'images a base de blocs
US5995670A (en) * 1995-10-05 1999-11-30 Microsoft Corporation Simplified chain encoding
US6064776A (en) * 1995-10-27 2000-05-16 Kabushiki Kaisha Toshiba Image processing apparatus
US5850294A (en) * 1995-12-18 1998-12-15 Lucent Technologies Inc. Method and apparatus for post-processing images
KR100196838B1 (ko) * 1995-12-23 1999-06-15 전주범 블럭벌 상관 관계에 의한 부호화 장치
US5805739A (en) * 1996-04-02 1998-09-08 Picturetel Corporation Lapped orthogonal vector quantization
JPH1070717A (ja) * 1996-06-19 1998-03-10 Matsushita Electric Ind Co Ltd 画像符号化装置及び画像復号化装置
JP2907146B2 (ja) * 1996-09-11 1999-06-21 日本電気株式会社 メモリlsiの特定箇所探索方法および探索装置
US5802107A (en) * 1996-09-13 1998-09-01 Zenith Electronics Corporation Symbol rotator
US6233017B1 (en) * 1996-09-16 2001-05-15 Microsoft Corporation Multimedia compression system with adaptive block sizes
US5999656A (en) * 1997-01-17 1999-12-07 Ricoh Co., Ltd. Overlapped reversible transforms for unified lossless/lossy compression
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US5973755A (en) * 1997-04-04 1999-10-26 Microsoft Corporation Video encoder and decoder using bilinear motion compensation and lapped orthogonal transforms
AU8055798A (en) * 1997-06-05 1998-12-21 Wisconsin Alumni Research Foundation Image compression system using block transforms and tree-type coefficient truncation
US6151296A (en) * 1997-06-19 2000-11-21 Qualcomm Incorporated Bit interleaving for orthogonal frequency division multiplexing in the transmission of digital signals
JP3375539B2 (ja) 1997-07-14 2003-02-10 ペンタックス株式会社 画像圧縮装置および画像伸張装置
US5859788A (en) * 1997-08-15 1999-01-12 The Aerospace Corporation Modulated lapped transform method
TW364269B (en) 1998-01-02 1999-07-11 Winbond Electronic Corp Discreet cosine transform/inverse discreet cosine transform circuit
US6393156B1 (en) 1998-01-07 2002-05-21 Truong Q. Nguyen Enhanced transform compatibility for standardized data compression
US6393061B1 (en) 1998-05-15 2002-05-21 Hughes Electronics Corporation Method for reducing blocking artifacts in digital images
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6154762A (en) * 1998-06-03 2000-11-28 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6073153A (en) * 1998-06-03 2000-06-06 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6253165B1 (en) * 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
US6011625A (en) * 1998-07-08 2000-01-04 Lockheed Martin Corporation Method for phase unwrapping in imaging systems
US6421464B1 (en) 1998-12-16 2002-07-16 Fastvdo Llc Fast lapped image transforms using lifting steps
US6487574B1 (en) 1999-02-26 2002-11-26 Microsoft Corp. System and method for producing modulated complex lapped transforms
US6496795B1 (en) 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6771829B1 (en) * 1999-10-23 2004-08-03 Fastvdo Llc Method for local zerotree image coding
US6377916B1 (en) * 1999-11-29 2002-04-23 Digital Voice Systems, Inc. Multiband harmonic transform coder
US6865229B1 (en) * 1999-12-14 2005-03-08 Koninklijke Philips Electronics N.V. Method and apparatus for reducing the “blocky picture” effect in MPEG decoded images
US6771828B1 (en) * 2000-03-03 2004-08-03 Microsoft Corporation System and method for progessively transform coding digital data
US6968564B1 (en) * 2000-04-06 2005-11-22 Nielsen Media Research, Inc. Multi-band spectral audio encoding
US7177358B2 (en) * 2000-06-27 2007-02-13 Mitsubishi Denki Kabushiki Kaisha Picture coding apparatus, and picture coding method
US6832232B1 (en) * 2000-07-10 2004-12-14 Advanced Micro Devices, Inc. Dual-block inverse discrete cosine transform method
JP2004509531A (ja) * 2000-09-12 2004-03-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化方法
EP1202219A1 (en) 2000-10-30 2002-05-02 Fast Video, LLC Fast lapped image transforms
JP2002182693A (ja) 2000-12-13 2002-06-26 Nec Corp オーディオ符号化、復号装置及びその方法並びにその制御プログラム記録媒体
WO2002051157A2 (en) * 2000-12-19 2002-06-27 Pulsent Corporation Adaptive transforms
JP2002304624A (ja) 2001-04-05 2002-10-18 Canon Inc フィルタ処理装置及び撮像装置
US7027654B1 (en) * 2001-08-16 2006-04-11 On2 Technologies Video compression system
US6882685B2 (en) * 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
US7460993B2 (en) * 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US6763068B2 (en) * 2001-12-28 2004-07-13 Nokia Corporation Method and apparatus for selecting macroblock quantization parameters in a video encoder
JP2003283840A (ja) 2002-03-25 2003-10-03 Canon Inc フィルタ処理装置およびフィルタ処理方法
US7155065B1 (en) * 2002-03-27 2006-12-26 Microsoft Corporation System and method for progressively transforming and coding digital data
US7006699B2 (en) 2002-03-27 2006-02-28 Microsoft Corporation System and method for progressively transforming and coding digital data
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
JP3855827B2 (ja) 2002-04-05 2006-12-13 ソニー株式会社 2次元サブバンド符号化装置
US7275036B2 (en) * 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
US7120297B2 (en) * 2002-04-25 2006-10-10 Microsoft Corporation Segmented layered image system
US7242713B2 (en) * 2002-05-02 2007-07-10 Microsoft Corporation 2-D transforms for image and video coding
GB2388502A (en) * 2002-05-10 2003-11-12 Chris Dunn Compression of frequency domain audio signals
US7376280B2 (en) * 2002-07-14 2008-05-20 Apple Inc Video encoding and decoding
US6728315B2 (en) 2002-07-24 2004-04-27 Apple Computer, Inc. Method and apparatus for variable accuracy inter-picture timing specification for digital video encoding with reduced requirements for division operations
JP2004064190A (ja) * 2002-07-25 2004-02-26 Ricoh Co Ltd 画像処理装置、方法、プログラムおよび記録媒体
US7031392B2 (en) * 2002-09-20 2006-04-18 Seiko Epson Corporation Method and apparatus for video deblocking
US7227901B2 (en) * 2002-11-21 2007-06-05 Ub Video Inc. Low-complexity deblocking filter
JP2004201047A (ja) 2002-12-19 2004-07-15 Ricoh Co Ltd 画像処理装置、プログラム及び記憶媒体
US7542036B2 (en) * 2003-02-19 2009-06-02 California Institute Of Technology Level set surface editing operators
US7239990B2 (en) * 2003-02-20 2007-07-03 Robert Struijs Method for the numerical simulation of a physical phenomenon with a preferential direction
US7167522B2 (en) * 2003-02-27 2007-01-23 Texas Instruments Incorporated Video deblocking filter
US7471726B2 (en) * 2003-07-15 2008-12-30 Microsoft Corporation Spatial-domain lapped transform in digital media compression
US20080075377A1 (en) * 2003-07-29 2008-03-27 Topiwala Pankaj N Fast lapped image transforms using lifting steps
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7315822B2 (en) * 2003-10-20 2008-01-01 Microsoft Corp. System and method for a media codec employing a reversible transform obtained via matrix lifting
KR101044940B1 (ko) * 2004-06-23 2011-06-28 삼성전자주식회사 에지 플로우 방향성 필터와 커블릿 변환을 이용한 블록현상 제거 방법 및 장치
US8374238B2 (en) * 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
US7305139B2 (en) * 2004-12-17 2007-12-04 Microsoft Corporation Reversible 2-dimensional pre-/post-filtering for lapped biorthogonal transform
US7471850B2 (en) * 2004-12-17 2008-12-30 Microsoft Corporation Reversible transform for lossy and lossless 2-D data compression
US7428342B2 (en) * 2004-12-17 2008-09-23 Microsoft Corporation Reversible overlap operator for efficient lossless data compression
AU2005239628B2 (en) * 2005-01-14 2010-08-05 Microsoft Technology Licensing, Llc Reversible 2-dimensional pre-/post-filtering for lapped biorthogonal transform
KR100676226B1 (ko) 2005-04-06 2007-01-30 엠텍비젼 주식회사 동영상 코덱의 후처리 방법 및 이를 위한 에지 보상 및 향상 필터링 방법
US7640283B2 (en) * 2005-06-27 2009-12-29 The Aerospace Corporation Shared Haar wavelet transform
US7805476B2 (en) * 2005-06-27 2010-09-28 The Aerospace Corporation Extended Haar transform
US7634525B2 (en) * 2005-06-27 2009-12-15 The Aerospace Corporation Haar wavelet transform embedded lossless type IV discrete cosine transform
US7613761B2 (en) * 2005-06-27 2009-11-03 The Aerospace Corporation Haar wavelet transform embedded lossless type II discrete cosine transform
US7933337B2 (en) 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
EP2082583A2 (en) 2006-11-08 2009-07-29 THOMSON Licensing Methods and apparatus for in-loop de-artifact filtering
US20080137982A1 (en) 2006-12-06 2008-06-12 Ayahiro Nakajima Blurring determination device, blurring determination method and printing apparatus
US8054886B2 (en) 2007-02-21 2011-11-08 Microsoft Corporation Signaling and use of chroma sample positioning information
US8942289B2 (en) * 2007-02-21 2015-01-27 Microsoft Corporation Computational complexity and precision control in transform-based digital media codec
CN101046964B (zh) * 2007-04-13 2011-09-14 清华大学 基于重叠变换压缩编码的错误隐藏帧重建方法
US8447591B2 (en) * 2008-05-30 2013-05-21 Microsoft Corporation Factorization of overlapping tranforms into two block transforms

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6041145A (en) * 1995-11-02 2000-03-21 Matsushita Electric Industrial Co., Ltd. Device and method for smoothing picture signal, device and method for encoding picture and device and method for decoding picture
TW364980B (en) * 1996-02-02 1999-07-21 Rohm Co Ltd Data decoding device
US20080131013A1 (en) * 2002-07-17 2008-06-05 Tooru Suino Image decoding technique for suppressing tile boundary distortion
TWI286706B (en) * 2002-11-28 2007-09-11 Shenzhen Syscan Technology Co Two-dimensional barcode card and the decoding method
US20050013497A1 (en) * 2003-07-18 2005-01-20 Microsoft Corporation Intraframe and interframe interlace coding and decoding
US20050053150A1 (en) * 2003-09-07 2005-03-10 Microsoft Corporation Conditional lapped transform

Also Published As

Publication number Publication date
JP5306469B2 (ja) 2013-10-02
CN102177714A (zh) 2011-09-07
RU2011113975A (ru) 2012-10-20
CA2735973A1 (en) 2010-04-15
AR073820A1 (es) 2010-12-01
US20100092098A1 (en) 2010-04-15
RU2518932C2 (ru) 2014-06-10
KR101683313B1 (ko) 2016-12-06
BRPI0918932A2 (pt) 2015-12-01
CN102177714B (zh) 2014-01-08
CA2735973C (en) 2017-12-19
AU2009303343B2 (en) 2014-06-19
AU2009303343A1 (en) 2010-04-15
TWI540845B (zh) 2016-07-01
MY159055A (en) 2016-12-15
MX2011003530A (es) 2011-04-21
TW201019615A (en) 2010-05-16
JP2012505613A (ja) 2012-03-01
WO2010042875A2 (en) 2010-04-15
KR20110091849A (ko) 2011-08-16
WO2010042875A3 (en) 2010-07-08
US8275209B2 (en) 2012-09-25
EP2332334A4 (en) 2012-06-06
TW201628342A (zh) 2016-08-01
EP2332334A2 (en) 2011-06-15

Similar Documents

Publication Publication Date Title
US8724916B2 (en) Reducing DC leakage in HD photo transform
TWI603590B (zh) 用於減少直流增益不匹配及直流漏電的方法及數位媒體解碼器
CN102833545B (zh) 灵活量化
RU2603548C2 (ru) Получение режима внутреннего прогнозирования для цветоразностных значений
JP5457199B2 (ja) 変換ベースのデジタル・メディア・コーデックにおける計算の複雑性及び精度の制御
JP5065272B2 (ja) 画像圧縮に関する変換係数の予測
TWI454154B (zh) 色度採樣位置資訊的訊令及使用
JP2005333622A (ja) イメージおよびビデオの予測可逆符号化
CN114450945A (zh) 编码方法、解码方法、编码器、解码器以及存储介质
EP2887667A1 (en) Coding of high dynamic range images

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees