TWI496438B - Image coding apparatus, method and program, and image decoding apparatus, method and program - Google Patents

Image coding apparatus, method and program, and image decoding apparatus, method and program Download PDF

Info

Publication number
TWI496438B
TWI496438B TW098145872A TW98145872A TWI496438B TW I496438 B TWI496438 B TW I496438B TW 098145872 A TW098145872 A TW 098145872A TW 98145872 A TW98145872 A TW 98145872A TW I496438 B TWI496438 B TW I496438B
Authority
TW
Taiwan
Prior art keywords
recorded
field
segmentation method
tree structure
small
Prior art date
Application number
TW098145872A
Other languages
English (en)
Other versions
TW201032596A (en
Inventor
Yoshinori Suzuki
Choong Seng Boon
Thiow Keng Tan
Original Assignee
Ntt Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ntt Docomo Inc filed Critical Ntt Docomo Inc
Publication of TW201032596A publication Critical patent/TW201032596A/zh
Application granted granted Critical
Publication of TWI496438B publication Critical patent/TWI496438B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Description

影像編碼裝置、方法及程式、以及影像解碼裝置、方法及程式
本發明係有關於影像編碼裝置、方法及程式、以及影像解碼裝置、方法及程式。
為了有效率地進行影像資料(靜止影像資料及動畫資料)之傳輸或積存,先前以來就將影像資料以壓縮編碼技術進行壓縮。作為此種壓縮編碼技術,例如在動畫資料的情況下,MPEG1~4或H.261~H.264等方式係被廣泛使用。
在這些編碼方式中,是將身為編碼對象的影像資料分割成複數區塊,然後才進行編碼處理。然後,對要作為編碼對象之對象區塊內的像素訊號,生成預測訊號。此處,用來生成預測訊號的預測方法,係有根據畫面內的已編碼領域的解碼訊號來進行預測的畫面內預測,和根據過去已編碼之畫面的解碼訊號來進行預測的畫面間預測。
其中,畫面內預測,係有將編碼對象區塊所相鄰之已再生之像素值,在所定之方向進行外插,以生成預測訊號之方法(例如參照下記專利文獻1)。
另一方面,在通常的畫面間預測時,關於編碼對象區塊,是以從已再生之畫面中探索出類似於該像素訊號之訊號的方法,來生成預測訊號。然後,將探索到的訊號所構成之領域與對象區塊之間的空間性位移量亦即運動向量,加以編碼。
在H.264中,為了對應於影像的局部性特徵變化,會採用將對象區塊(例如16×16)分割成不同的區塊尺寸(除了16×16以外,還有例如8×8、8×16、16×8、8×4、4×8、4×4等)之小區塊,就每一小區塊來生成預測訊號的方法。關於H.264中的預測區塊尺寸,例如記載於專利文獻2。
接著,生成從對象區塊的預測訊號中扣除對象區塊之像素訊號而成的殘差訊號,藉由離散餘弦轉換等而進行頻率轉換。一般而言,若轉換區塊內的殘差訊號沒有起伏,則頻率轉換的區塊尺寸係越大而轉換效率越高。然而,預測區塊交界係因為訊號是不連續的,所以若對跨過預測區塊交界而將殘差訊號總結成較大的殘差區塊來實施頻率轉換,則高頻成分會增加,因而導致編碼效率降低。因此,頻率轉換係以和預測訊號生成時相同的區塊單位或比預測訊號生成時還小的區塊單位,來實施之。
然後,已被頻率轉換之轉換係數係被量化,成為量化轉換係數而被熵編碼。各區塊的量化轉換係數中會有含0值較多之傾向,該傾向係預測效率越高則越強。將0值係數作高效率編碼的方法中,係有零樹(zero-tree)編碼。此方法中,係將區塊內的量化轉換數,映射至樹狀結構的葉片(樹狀結構的下端),基於葉片的係數值,來更新樹狀結構的節點(樹狀結構的中途之分歧點)和葉片的狀態(0或1)。然後,將樹狀結構的狀態與非零之量化轉換係數的值,加以編碼。因此,比樹狀結構的某個節點還下方的節點和葉片係呈0值的方式,將區塊內的量化轉換係數對映至樹狀結構的葉片,藉此,就可將值0之量化轉換係數,以較少的編碼量而整個加以編碼。關於零樹編碼,係例如記載於下記專利文獻3。
[先前技術文獻] [專利文獻]
[專利文獻1]美國專利公報第6765964號
[專利文獻2]美國專利公報第7003035號
[專利文獻3]美國專利公開公報第2006-133680號
如先前技術所示,藉由區塊形狀或區塊尺寸不同的多樣性預測方法來實施預測處理,可提升預測效率。另一方面,關於殘差訊號的熵編碼,係越是將統計性質類似的資料加以集中而以一致的機率模型來加以處理的方式,則越是能以較少的編碼要素或較小的編碼表來實施編碼處理。
可是,當以多樣的方法(多樣的區塊尺寸)來生成預測訊號時,若以較少的編碼要素來進行熵編碼,則由於各編碼要素的統計性自由度變大,因此要獲得適合於殘差訊號之熵編碼的一致性機率模型,是較為困難,結果而言,要有效率地實施殘差訊號的熵編碼,是有困難的。
本發明係為了解決上記課題而研發,目的在於能夠一面以適切的預測區塊之尺寸或形狀來進行預測處理,一面能有效率地實施殘差訊號的熵編碼。
在本發明中,為了解決上記課題,將為了以不同區塊尺寸或不同區塊形狀來生成預測訊號而具有不同統計性質的量化轉換係數,轉換成共通的樹狀結構之節點與葉片之狀態,以上記不同之區塊尺寸或不同之區塊形狀所共通的機率模型,來進行零樹編碼。又,在本發明中,係將區塊內的量化轉換係數映射至樹狀結構的葉片所需的映射圖,針對尺寸或形狀不同的區塊而個別地加以準備,藉此以抑制樹狀結構的各節點與葉片之狀態的統計上的參差。
本發明所述之影像編碼裝置,其特徵為,具備:領域分割手段,係將輸入影像分割成複數領域;和分割方法選擇手段,係從複數分割方法中,選擇出前記複數領域當中身為處理對象之對象領域的分割方法;和分割方法編碼手段,係將用來識別前記己選擇之分割方法的資訊,加以編碼;和小領域分割手段,係以前記已選擇之分割方法,將前記對象領域,分割成複數小領域;和預測手段,係生成針對前記小領域中所含之像素訊號的預測訊號;和殘差訊號生成手段,係生成前記小領域的預測訊號與像素訊號的殘差訊號;和轉換手段,係將前記小領域的殘差訊號,進行頻率轉換,以生成轉換係數;和量化手段,係將前記小領域的轉換係數加以量化,以生成量化轉換係數;和零樹映射手段,係備妥前記複數分割方法所共通的樹狀結構,從用來把前記小領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記小領域的屬性資訊而定的1個映射圖,基於前記所選擇之映射圖,將前記小領域的量化轉換係數映射至前記樹狀結構的葉片,依照各葉片的係數值來更新前記樹狀結構的節點與葉片之狀態;和零樹編碼手段,係將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型來進行熵編碼;和非零係數編碼手段,係將前記小領域的非零之量化轉換係數,進行熵編碼;和輸出手段,係將用來識別前記已選擇之分割方法的資訊的編碼資料、和前記樹狀結構的節點與葉片之狀態的編碼資料、和前記小領域的非零之量化轉換係數的編碼資料,加以輸出。此外,前記小領域的屬性資訊,係為前記對象領域的前記己選擇之分割方法,較為理想。
本發明所述之影像解碼裝置,其特徵為,具備:資料解析手段,係從壓縮資料之中,抽出用來指示身為處理對象之對象領域之分割方法的編碼資料和前記對象領域所分割成之小領域之殘差訊號的編碼資料;和分割方法解碼手段,係從用來指示對象領域之分割方法的編碼資料,將用來在複數分割方法之中識別前記對象領域之分割方法的資訊,進行熵解碼;和零樹解碼手段,係備妥前記分割方法所共通之樹狀結構,從前記小領域的殘差訊號的編碼資料,將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型,進行熵解碼;和非零係數解碼手段,係從前記小領域的殘差訊號的編碼資料,將前記已解碼之樹狀結構的葉片之狀態為1的量化轉換係數的解碼值,進行熵解碼;和零樹量化轉換係數映射手段,係從用來把前記小領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記小領域之已解碼屬性資訊而定的1個映射圖,基於前記所選擇之映射圖,將前記已解碼之樹狀結構的節點與葉片之狀態與前記已解碼之小領域的量化轉換係數的解碼值,復原成前記小領域的再生量化轉換係數;和逆量化手段,係將前記小領域的再生量化轉換係數進行逆量化,以生成再生頻率轉換係數;和逆轉換手段,係將前記小領域的再生頻率轉換係數進行逆轉換,以復原出再生殘差訊號;和預測手段,係生成針對前記小領域中所含之像素訊號的預測訊號;和影像復原手段,係藉由將前記小領域的前記預測訊號和前記再生殘差訊號進行加算,以復原出前記小領域的像素訊號。此外,前記小領域的已解碼屬性資訊,係為已解碼之前記對象領域的分割方法,較為理想。
本發明所述之影像編碼裝置,係除了前述的影像編碼裝置以外,還可採用以下的樣態。亦即,本發明所述之影像編碼裝置,其特徵為,具備:領域分割手段,係將輸入影像分割成複數領域;和分割方法選擇手段,係從複數分割方法中,選擇出前記複數領域當中身為處理對象之對象領域的分割方法;和分割方法編碼手段,係將用來識別前記已選擇之分割方法的資訊,加以編碼;和小領域分割手段,係以前記已選擇之分割方法,將前記對象領域,分割成複數小領域;和預測手段,係生成針對前記對象領域之各小領域中所含之像素訊號的預測訊號;和殘差訊號生成手段,係生成前記對象領域之各小領域的預測訊號與像素訊號的殘差訊號;和轉換手段,係將前記對象領域之各小領域的殘差訊號,進行頻率轉換,以生成轉換係數;和量化手段,係將前記對象領域之各小領域的轉換係數加以量化,以生成量化轉換係數;和零樹映射手段,係備妥前記複數分割方法所共通的樹狀結構,從用來把前記對象領域內的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記對象領域之屬性資訊而定的1個映射圖,基於前記所選擇之映射圖,將前記對象領域內的量化轉換係數映射至前記樹狀結構的葉片,依照各葉片的係數值來更新前記樹狀結構的節點與葉片之狀態;和零樹編碼手段,係將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型來進行熵編碼;和非零係數編碼手段,係將前記對象領域之各小領域的非零之量化轉換係數,進行熵編碼;和輸出手段,係將用來識別前記已選擇之分割方法的資訊的編碼資料、和前記樹狀結構的節點與葉片之狀態的編碼資料、和前記對象領域之各小領域的非零之量化轉換係數的編碼資料,加以輸出。此外,前記對象領域的屬性資訊,係為前記對象領域的前記已選擇之分割方法,較為理想。
本發明所述之影像解碼裝置,係除了前述的影像解碼裝置以外,還可採用以下的樣態。亦即,本發明所述之影像解碼裝置,其特徵為,具備:資料解析手段,係從壓縮資料之中,抽出用來指示身為處理對象之對象領域之分割方法的編碼資料和前記對象領域之殘差訊號的編碼資料;和分割方法解碼手段,係從用來指示對象領域之分割方法的編碼資料,將用來在複數分割方法之中識別前記對象領域之分割方法的資訊,進行熵解碼;和零樹解碼手段,係備妥前記分割方法所共通之樹狀結構,從前記對象領域的殘差訊號的編碼資料,將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型,進行熵解碼;和非零係數解碼手段,係從前記對象領域的殘差訊號的編碼資料,將前記已解碼之樹狀結構的葉片之狀態為1的量化轉換係數的解碼值,進行熵解碼;和零樹量化轉換係數映射手段,係從用來把前記對象領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記對象領域之已解碼屬性資訊而定的1個映射圖,基於前記所選擇之映射圖,將前記已解碼之樹狀結構的節點與葉片之狀態與前記已解碼之對象領域的量化轉換係數的解碼值,轉換成前記對象領域之各小領域的再生量化轉換係數;和逆量化手段,係將前記對象領域之各小領域的再生量化轉換係數進行逆量化,以生成再生頻率轉換係數;和逆轉換手段,係將前記對象領域之各小領域的再生頻率轉換係數進行逆轉換,以復原出再生殘差訊號;和預測手段,係生成針對前記對象領域之小領域中所含之像素訊號的預測訊號;和影像復原手段,係藉由將前記對象領域之各小領域的前記預測訊號和前記再生殘差訊號進行加算,以復原出前記對象領域之各小領域的像素訊號而生成再生影像訊號;和領域整合手段,係藉由將前記對象領域之各小領域的再生影像訊號加以整合,以生成前記對象領域的再生影像訊號。此外,前記對象領域的已解碼屬性資訊,係為已解碼之前記對象領域的分割方法,較為理想。
上述的涉及影像編碼裝置之發明,係可視為涉及影像編碼方法之發明以及涉及影像編碼程式之發明,可描述如以下。
本發明所述之影像編碼方法,係屬於被影像編碼裝置所執行的影像編碼方法,其特徵為,具備:領域分割步驟,係將輸入影像分割成複數領域;和分割方法選擇步驟,係從複數分割方法中,選擇出前記複數領域當中身為處理對象之對象領域的分割方法;和分割方法編碼步驟,係將用來識別前記已選擇之分割方法的資訊,加以編碼;和小領域分割步驟,係以前記已選擇之分割方法,將前記對象領域,分割成複數小領域;和預測步驟,係生成針對前記小領域中所含之像素訊號的預測訊號;和殘差訊號生成步驟,係生成前記小領域的預測訊號與像素訊號的殘差訊號;和轉換步驟,係將前記小領域的殘差訊號,進行頻率轉換,以生成轉換係數;和量化步驟,係將前記小領域的轉換係數加以量化,以生成量化轉換係數;和零樹映射步驟,係備妥前記複數分割方法所共通的樹狀結構,從用來把前記小領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記對象領域之前記已選擇之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記小領域的量化轉換係數映射至前記樹狀結構的葉片,依照各葉片的係數值來更新前記樹狀結構的節點與葉片之狀態;和零樹編碼步驟,係將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型來進行熵編碼;和非零係數編碼步驟,係將前記小領域的非零之量化轉換係數,進行熵編碼;和輸出步驟,係將用來識別前記已選擇之分割方法的資訊的編碼資料、和前記樹狀結構的節點與葉片之狀態的編碼資料、和前記小領域的非零之量化轉換係數的編碼資料,加以輸出。
本發明所述之影像編碼程式,其特徵為,係使電腦動作成為:領域分割手段,係將輸入影像分割成複數領域;和分割方法選擇手段,係從複數分割方法中,選擇出前記複數領域當中身為處理對象之對象領域的分割方法;和分割方法編碼手段,係將用來識別前記已選擇之分割方法的資訊,加以編碼;和小領域分割手段,係以前記己選擇之分割方法,將前記對象領域,分割成複數小領域;和預測手段,係生成針對前記小領域中所含之像素訊號的預測訊號;和殘差訊號生成手段,係生成前記小領域的預測訊號與像素訊號的殘差訊號;和轉換手段,係將前記小領域的殘差訊號,進行頻率轉換,以生成轉換係數;和量化手段,係將前記小領域的轉換係數加以量化,以生成量化轉換係數;和零樹映射手段,係備妥前記複數分割方法所共通的樹狀結構,從用來把前記小領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記對象領域之前記已選擇之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記小領域的量化轉換係數映射至前記樹狀結構的葉片,依照各葉片的係數值來更新前記樹狀結構的節點與葉片之狀態;和零樹編碼手段,係將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型來進行熵編碼;和非零係數編碼手段,係將前記小領域的非零之量化轉換係數,進行熵編碼;和輸出手段,係將用來識別前記已選擇之分割方法的資訊的編碼資料、和前記樹狀結構的節點與葉片之狀態的編碼資料、和前記小領域的非零之量化轉換係數的編碼資料,加以輸出。
本發明所述之影像編碼方法,係除了前述的影像編碼方法以外,還可採用以下的樣態。亦即,本發明所述之影像編碼方法,係屬於被影像編碼裝置所執行的影像編碼方法,其特徵為,具備:領域分割步驟,係將輸入影像分割成複數領域;和分割方法選擇步驟,係從複數分割方法中,選擇出前記複數領域當中身為處理對象之對象領域的分割方法;和分割方法編碼步驟,係將用來識別前記已選擇之分割方法的資訊,加以編碼;和小領域分割步驟,係以前記已選擇之分割方法,將前記對象領域,分割成複數小領域;和預測步驟,係生成針對前記對象領域之各小領域中所含之像素訊號的預測訊號;和殘差訊號生成步驟,係生成前記對象領域之各小領域的預測訊號與像素訊號的殘差訊號;和轉換步驟,係將前記對象領域之各小領域的殘差訊號,進行頻率轉換,以生成轉換係數;和量化步驟,係將前記對象領域之各小領域的轉換係數加以量化,以生成量化轉換係數;和零樹映射步驟,係備妥前記複數分割方法所共通的樹狀結構,從用來把前記對象領域內的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記對象領域之前記已選擇之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記對象領域內的量化轉換係數映射至前記樹狀結構的葉片,依照各葉片的係數值來更新前記樹狀結構的節點與葉片之狀態;和零樹編碼步驟,係將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型來進行熵編碼;和非零係數編碼步驟,係將前記對象領域之各小領域的非零之量化轉換係數,進行熵編碼;和輸出步驟,係將用來識別前記已選擇之分割方法的資訊的編碼資料、和前記樹狀結構的節點與葉片之狀態的編碼資料、和前記對象領域之各小領域的非零之量化轉換係數的編碼資料,加以輸出。
本發明所述之影像編碼程式,係除了前述的影像編碼程式以外,還可採用以下的樣態。本發明所述之影像編碼程式,係除了前述的影像編碼程式以外,還可採用以下的樣態。亦即,本發明所述之影像編碼程式,其特徵為,係使電腦動作成為:領域分割手段,係將輸入影像分割成複數領域;和分割方法選擇手段,係從複數分割方法中,選擇出前記複數領域當中身為處理對象之對象領域的分割方法;和分割方法編碼手段,係將用來識別前記已選擇之分割方法的資訊,加以編碼;和小領域分割手段,係以前記已選擇之分割方法,將前記對象領域,分割成複數小領域;和預測手段,係生成針對前記對象領域之各小領域中所含之像素訊號的預測訊號;和殘差訊號生成手段,係生成前記對象領域之各小領域的預測訊號與像素訊號的殘差訊號;和轉換手段,係將前記對象領域之各小領域的殘差訊號,進行頻率轉換,以生成轉換係數;和量化手段,係將前記對象領域之各小領域的轉換係數加以量化,以生成量化轉換係數;和零樹映射手段,係備妥前記複數分割方法所共通的樹狀結構,從用來把前記對象領域內的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記對象領域之前記已選擇之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記對象領域內的量化轉換係數映射至前記樹狀結構的葉片,依照各葉片的係數值來更新前記樹狀結構的節點與葉片之狀態;和零樹編碼手段,係將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型來進行熵編碼;和非零係數編碼手段,係將前記對象領域之各小領域的非零之量化轉換係數,進行熵編碼;和輸出手段,係將用來識別前記已選擇之分割方法的資訊的編碼資料、和前記樹狀結構的節點與葉片之狀態的編碼資料、和前記小領域的非零之量化轉換係數的編碼資料,加以輸出。
上述的涉及影像解碼裝置之發明,係可視為涉及影像解碼方法之發明以及涉及影像解碼程式之發明,可描述如以下。
本發明所述之影像解碼方法,係屬於被影像解碼裝置所執行的影像解碼方法,其特徵為,具備:資料解析步驟,係從壓縮資料之中,抽出用來指示身為處理對象之對象領域之分割方法的編碼資料和前記對象領域所分割成之小領域之殘差訊號的編碼資料;和分割方法解碼步驟,係從用來指示對象領域之分割方法的編碼資料,將用來在複數分割方法之中識別前記對象領域之分割方法的資訊,進行熵解碼;和零樹解碼步驟,係備妥前記分割方法所共通之樹狀結構,從前記小領域的殘差訊號的編碼資料,將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型,進行熵解碼;和非零係數解碼步驟,係從前記小領域的殘差訊號的編碼資料,將前記已解碼之樹狀結構的葉片之狀態為1的量化轉換係數的解碼值,進行熵解碼;和零樹量化轉換係數映射步驟,係從用來把前記小領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記已解碼之前記對象領域之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記已解碼之樹狀結構的節點與葉片之狀態與前記已解碼之小領域的量化轉換係數的解碼值,復原成前記小領域的再生量化轉換係數;和逆量化步驟,係將前記小領域的再生量化轉換係數進行逆量化,以生成再生頻率轉換係數;和逆轉換步驟,係將前記小領域的再生頻率轉換係數進行逆轉換,以復原出再生殘差訊號;和預測步驟,係生成針對前記小領域中所含之像素訊號的預測訊號;和影像復原步驟,係藉由將前記小領域的前記預測訊號和前記再生殘差訊號進行加算,以復原出前記小領域的像素訊號。
本發明所述之影像解碼程式,其特徵為,係使電腦動作成為:資料解析手段,係從壓縮資料之中,抽出用來指示身為處理對象之對象領域之分割方法的編碼資料和前記對象領域所分割成之小領域之殘差訊號的編碼資料;和分割方法解碼手段,係從用來指示對象領域之分割方法的編碼資料,將用來在複數分割方法之中識別前記對象領域之分割方法的資訊,進行熵解碼;和零樹解碼手段,係備妥前記分割方法所共通之樹狀結構,從前記小領域的殘差訊號的編碼資料,將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型,進行熵解碼;和非零係數解碼手段,係從前記小領域的殘差訊號的編碼資料,將前記已解碼之樹狀結構的葉片之狀態為1的量化轉換係數的解碼值,進行熵解碼;和零樹量化轉換係數映射手段,係從用來把前記小領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記已解碼之前記對象領域之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記已解碼之樹狀結構的節點與葉片之狀態與前記已解碼之小領域的量化轉換係數的解碼值,復原成前記小領域的再生量化轉換係數;和逆量化手段,係將前記小領域的再生量化轉換係數進行逆量化,以生成再生頻率轉換係數;和逆轉換手段,係將前記小領域的再生頻率轉換係數進行逆轉換,以復原出再生殘差訊號;和預測手段,係生成針對前記小領域中所含之像素訊號的預測訊號;和影像復原手段,係藉由將前記小領域的前記預測訊號和前記再生殘差訊號進行加算,以復原出前記小領域的像素訊號。
本發明所述之影像解碼方法,係除了前述的影像解碼方法以外,還可採用以下的樣態。亦即,本發明所述之影像解碼方法,係屬於被影像解碼裝置所執行的影像解碼方法,其特徵為,具備:資料解析步驟,係從壓縮資料之中,抽出用來指示身為處理對象之對象領域之分割方法的編碼資料和前記對象領域之殘差訊號的編碼資料;和分割方法解碼步驟,係從用來指示對象領域之分割方法的編碼資料,將用來在複數分割方法之中識別前記對象領域之分割方法的資訊,進行熵解碼;和零樹解碼步驟,係備妥前記分割方法所共通之樹狀結構,從前記對象領域的殘差訊號的編碼資料,將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型,進行熵解碼;和非零係數解碼步驟,係從前記對象領域的殘差訊號的編碼資料,將前記已解碼之樹狀結構的葉片之狀態為1的量化轉換係數的解碼值,進行熵解碼;和零樹量化轉換係數映射步驟,係從用來把前記對象領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記已解碼之前記對象領域之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記已解碼之樹狀結構的節點與葉片之狀態與前記已解碼之對象領域的量化轉換係數的解碼值,轉換成前記對象領域之各小領域的再生量化轉換係數;和逆量化步驟,係將前記對象領域之各小領域的再生量化轉換係數進行逆量化,以生成再生頻率轉換係數;和逆轉換步驟,係將前記對象領域之各小領域的再生頻率轉換係數進行逆轉換,以復原出再生殘差訊號;和預測步驟,係生成針對前記對象領域之小領域中所含之像素訊號的預測訊號;和影像復原步驟,係藉由將前記對象領域之各小領域的前記預測訊號和前記再生殘差訊號進行加算,以復原出前記對象領域之各小領域的像素訊號而生成再生影像訊號;和領域整合步驟,係藉由將前記對象領域之各小領域的再生影像訊號加以整合,以生成前記對象領域的再生影像訊號。
本發明所述之影像解碼程式,係除了前述的影像解碼程式以外,還可採用以下的樣態。亦即,本發明所述之影像解碼程式,其特徵為,係使電腦動作成為:資料解析手段,係從壓縮資料之中,抽出用來指示身為處理對象之對象領域之分割方法的編碼資料和前記對象領域之殘差訊號的編碼資料;和分割方法解碼手段,係從用來指示對象領域之分割方法的編碼資料,將用來在複數分割方法之中識別前記對象領域之分割方法的資訊,進行熵解碼;和零樹解碼手段,係備妥前記分割方法所共通之樹狀結構,從前記對象領域的殘差訊號的編碼資料,將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型,進行熵解碼;和非零係數解碼手段,係從前記對象領域的殘差訊號的編碼資料,將前記已解碼之樹狀結構的葉片之狀態為1的量化轉換係數的解碼值,進行熵解碼;和零樹量化轉換係數映射手段,係從用來把前記對象領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記已解碼之前記對象領域之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記已解碼之樹狀結構的節點與葉片之狀態與前記已解碼之對象領域的量化轉換係數的解碼值,轉換成前記對象領域之各小領域的再生量化轉換係數;和逆量化手段,係將前記對象領域之各小領域的再生量化轉換係數進行逆量化,以生成再生頻率轉換係數;和逆轉換手段,係將前記對象領域之各小領域的再生頻率轉換係數進行逆轉換,以復原出再生殘差訊號;和預測手段,係生成針對前記對象領域之小領域中所含之像素訊號的預測訊號;和影像復原手段,係藉由將前記對象領域之各小領域的前記預測訊號和前記再生殘差訊號進行加算,以復原出前記對象領域之各小領域的像素訊號而生成再生影像訊號;和領域整合手段,係藉由將前記對象領域之各小領域的再生影像訊號加以整合,以生成前記對象領域的再生影像訊號。
若依據本發明,則由於對以複數分割方法所生成之預測訊號,可用共通的樹狀結構來實施零樹編碼,因此可以適切的預測區塊尺寸或形狀來進行預測處理,且可有效率地實施殘差訊號的熵編碼。
以下,針對本發明的實施形態,使用圖1~圖22來說明。
(關於影像編碼裝置)
圖1中係圖示了本發明所述之影像編碼裝置100的區塊圖。影像編碼裝置100,係具備:輸入端子101、區塊分割器102、分割方法切換器103、分割方法1預測編碼器104a、分割方法2預測編碼器104b、分割方法3預測編碼器104c、零樹熵編碼器105、非零係數熵編碼器106、輸出端子107、畫格記憶體108、分割方法1預測解碼器109a、分割方法2預測解碼器109b、分割方法3預測解碼器109c、分割方法選擇器110、及分割方法熵編碼器111。此外,分割方法1預測編碼器104a、分割方法2預測編碼器104b、及分割方法3預測編碼器104c,係在以下中總稱為「分割方法p預測編碼器104」。分割方法1預測解碼器109a、分割方法2預測解碼器109b、及分割方法3預測解碼器109c,係在以下中總稱為「分割方法p預測解碼器109」。
以下,說明如上記所構成之影像編碼裝置100之動作。由複數張影像所成之動畫的訊號,係被輸入至輸入端子101。作為編碼對象之影像,係於區塊分割器102中,被分割成複數領域。在本實施形態中作為一例,係被分割成8×8像素所成的區塊,但亦可分割成其以外之區塊大小或形狀。
接著,編碼處理對象之領域(以下稱作「對象區塊」),係被輸入至分割方法切換器103。
與此同時,分割方法選擇器110,係從複數分割方法中決定對象區塊的分割方法,並將已決定之分割方法的識別資訊,輸出至分割方法切換器103。分割方法的選擇方法係於後述(圖10的流程圖中會說明)。然後,分割方法選擇器110,係將已選擇之分割方法的識別資訊,輸出至分割方法熵編碼器111。分割方法熵編碼器111,係將所被輸入之分割方法的識別資訊加以編碼,輸出至輸出端子107。此外,以下雖然是以3種類的分割方法來說明,但關於對象區塊的分割方法的數目,在本發明中係沒有限定。
另一方面,分割方法切換器103,係當分割方法選擇器110中從3種類分割方法所選擇出來的分割方法是分割方法1時則將對象區塊之像素訊號輸出至分割方法1預測編碼器104a,是分割方法2時則將對象區塊之像素訊號輸出至分割方法2預測編碼器104b,是分割方法3時則將對象區塊之像素訊號輸出至分割方法3預測編碼器104c。
此處,以選擇了分割方法1時為例來說明。分割方法1預測編碼器104a,係將所被輸入之對象區塊,分割成小領域(以下稱作「子區塊」),對每一子區塊,生成預測訊號,將子區塊之像素訊號與預測訊號之間的殘差訊號,進行頻率轉換並量化。然後,分割方法1預測編碼器104a,係將各子區塊的量化轉換係數映射至預先定好的樹狀結構的葉片,依照各葉片的係數而將樹狀結構的狀態予以更新,然後輸出至零樹熵編碼器105(細節將於後述)。此時,在本發明中,作為樹狀結構,係使用不依存於對象區塊的分割方法的共通之樹狀結構。同時,為了局部解碼訊號,將樹狀結構的節點與葉片之狀態與各子區塊的非零之量化轉換係數,輸出至分割方法1預測解碼器109a。
如以上之分割方法1預測編碼器104a的動作,係在分割方法2預測編碼器104b、分割方法3預測編碼器104c中也是同樣如此。這些分割方法p預測編碼器104的細節,將用圖2而於後述。
此外,在本發明中,各子區塊的區塊尺寸與區塊形狀,係沒有特別限定。
(樹狀結構與零樹編碼之說明)
此處,說明樹狀結構、子區塊分割及零樹編碼。本發明中的共通之樹狀結構,係大致分成2種類。第1樹狀結構,係為將對象區塊內的所有量化轉換係數加以包含的樹狀結構。第2樹狀結構,係為僅含有一定像素數之子區塊之量化轉換係數的樹狀結構。
第1樹狀結構,因為不依存於對象區塊的分割方法,所以無論哪種子區塊均可適用。關於此例係於後述,此處先來說明第2樹狀結構的例子。
在使用第2樹狀結構的案例中,無視於分割方法而將對象區塊分割成相同像素數的子區塊,是使用基於該像素數之樹狀結構。在本實施形態中,係以對象區塊是8×8像素且將對象區塊分割成由16像素所成的4個子區塊的方法為例,進行說明。分割方法,係有4×4像素(圖6的子區塊61)、2×8像素(圖7的子區塊71)、8×2像素(圖8的子區塊81)之3種類,使用圖6的樹62(圖7的樹72和圖8的樹82也是相同構造)所示的樹狀結構。
為了說明樹狀結構的生成方法,先來看圖6。在樹狀結構中,打x記號的分歧點稱作「節點」,以數字表示的樹的下端稱作「葉片」。節點與葉片之狀態係以0或1的值來表示,各節點的狀態,係由2個分枝的節點或葉片的狀態而決定。關於x所示的某個節點(對象節點),分枝的2個節點(或葉片)的狀態皆為0時則對象節點的狀態係為0,2個分枝的節點(或葉片)的狀態中有任一方或雙方是1時則對象節點的狀態係為1。
子區塊61的數字係表示各量化轉換係數在子區塊內的位置,係對應於樹狀結構的樹62的數字。將子區塊61的各量化轉換係數,映射至樹62的相同數字的葉片。各葉片的狀態,係當所被映射之量化轉換係數為非零的情況下則是1,為零的情況下則是0。一旦決定葉片的狀態,則從樹狀結構的右下往左上,依序決定x標記之節點的狀態。因此可知,x的狀態為0時,則以該當節點為起點的樹中所屬的葉片所對應之量化轉換係數的值係皆為0。
在零樹編碼中,是將樹狀結構的節點與葉片之狀態,以預先定好的程序(例如將x記號從左上往右下依序搜尋)而加以編碼。此時,若某個節點的狀態為0,則以該節點為起點之樹中所屬的節點與葉片之狀態係皆為0,因此這些節點與葉片之狀態就沒有進行編碼之必要。因此,表示樹狀結構的葉片與各量化轉換係數之對應的映射圖,係以使得量化轉換係數的零係數能被較少編碼量而有效率地被編碼的方式,而被決定。
在本發明中,樹狀結構係對於各分割方法皆為共通。然後,基於子區塊內的各量化轉換係數會成為零值的機率,將往各葉片之量化轉換係數的映射規則,依照各分割方法而個別地決定。此處,將圖6、圖7、圖8中的子區塊內的量化轉換係數指派至樹狀結構之葉片的規則,稱作「映射圖」(map),將子區塊內的量化轉換係數映射至樹狀結構之葉片的處理,稱作「映射」(mapping)。
(圖1的說明的後續)
零樹熵編碼器105係將所被輸入的節點與葉片之狀態,使用不依循於對象區塊之分割方法的共通之機率模型,來進行熵編碼。然後,零樹熵編碼器105,係將對象區塊中的節點與葉片之狀態的編碼資料,和非零之量化轉換係數的值,輸出至非零係數熵編碼器106。
此處,所謂機率模型,係針對各節點以及葉片,來設定1個節點變成0的機率(或是變成1的機率),機率模型係決定了,在將節點或葉片之狀態加以編碼時所輸出的碼。此外,若有預先定好,則亦可使用與複數節點與葉片之狀態的編碼時相同的機率模型。又,在算術編碼的情況下,各節點或葉片的機率模型,係亦可基於已發生之編碼而被更新。
非零係數熵編碼器106,係將所被輸入之對象區塊中的子區塊內的非零量化轉換係數,以所定之程序(例如逐線掃描順序)而加以編碼,將所得到的編碼資料,與節點與葉片之狀態的編碼資料一起輸出至輸出端子107。熵編碼之方法係可為算術編碼,亦可為可變長度編碼。
分割方法1預測解碼器109a,係從所被輸入之樹狀結構的節點與葉片之狀態與各子區塊的非零之量化轉換係數的解碼值,復原出各子區塊的量化轉換係數。各子區塊的量化轉換係數,係被逆量化、逆轉換而生成再生殘差訊號。同時,分割方法1預測解碼器109a,係以和分割方法1預測編碼器104a相同的手段,來生成各子區塊的預測訊號。最後,各子區塊的再生殘差訊號與預測訊號係被加算而復原出再生訊號。如以上之分割方法1預測解碼器109a的動作,係在分割方法2預測解碼器109b、分割方法3預測解碼器109c中也是同樣如此。這些分割方法p預測解碼器109的細節,將用圖4而於後述。
已被復原之再生訊號,係被輸出至畫格記憶體108,當作預測處理時所使用的參照影像而被保存。
此外,分割方法p預測編碼器104中的預測方法係為不參照畫格記憶體108中所保存的影像訊號時,則分割方法p預測解碼器109就不被需要。
(關於分割方法p預測編碼器104)
分割方法p預測編碼器104(分割方法1預測編碼器104a、分割方法2預測編碼器104b、及分割方法3預測編碼器104c)係具備圖2所示的共通之構成。以下,說明分割方法p預測編碼器104之構成。如圖2所示,分割方法p預測編碼器104係具備:小領域分割器201、預測器202、差分器203、轉換器204、量化器205、及量化轉換係數零樹映射器206。
小領域分割器201,係將所被輸入之對象區塊,依照分割方法p而分割成子區塊,輸出至差分器203。
預測器202,係將對於各子區塊之像素訊號的預測訊號加以生成,輸出至差分器203。預測方法中,係有畫面間預測和畫面內預測。在畫面間預測時,係將過去曾被編碼之後又被復原的再生影像當作參照影像,從該當參照影像,求出能夠對於子區塊給予最小誤差之預測訊號的運動資訊。另一方面,在畫面內預測時,是基於使用與子區塊在空間上相鄰之已再生之像素值的所定方法來進行複製處理(對子區塊內的各像素位置進行複製處理),以生成畫面內預測訊號。關於具體的預測訊號之生成方法,在本發明中係沒有限定。對於各分割方法,備妥複數種預測方法,從該複數預測方法中按照每一對象區塊或每一子區塊而選擇出預測方法,可將已選擇之預測方法的資訊加以編碼,亦可針對各分割方法而預先決定預測方法,也可就對象區塊內的各子區塊之位置來預先決定好預測方法。
差分器203,係藉由算出所被輸入之各子區塊的影像訊號與預測訊號之差分,而生成各子區塊的殘差訊號,輸出至轉換器204。
各子區塊的殘差訊號,係於轉換器204中被離散餘弦轉換,轉換後的各子區塊的轉換係數係被輸出至量化器205。
量化器205係將各子區塊的轉換係數予以量化以生成量化轉換係數,輸出至量化轉換係數零樹映射器206。
量化轉換係數零樹映射器206,係針對各子區塊,將子區塊的量化轉換係數,映射至不依存於對象區塊之分割方法的樹狀結構的葉片,依照各葉片的係數值來更新樹狀結構的節點與葉片之狀態(細節將於後述)。然後,量化轉換係數零樹映射器206,係針對各子區塊,將樹狀結構的節點與葉片之狀態、和狀態為1的葉片所對應之量化轉換係數,輸出至零樹熵編碼器105。
此外,在圖1中,雖然是針對分割方法1、2、3而分別準備了分割方法p預測編碼器104,但若是圖2中所示的小領域分割器201、預測器202、差分器203、轉換器204、量化器205、及量化轉換係數零樹映射器206都含有分割方法1~3的機能,具有隨著分割方法來切換處理之機能的情況下,則圖1的分割方法1預測編碼器104a、分割方法2預測編碼器104b及分割方法3預測編碼器104c,係可置換成1個分割方法p預測編碼器104。例如,1個分割方法1預測編碼器104a,就能達成3個分割方法p預測編碼器104的機能,對分割方法1預測編碼器104a係從分割方法選擇器110輸入著分割方法的識別資訊。分割方法2預測編碼器104b與分割方法3預測編碼器104c就不被需要。
接著,使用圖3,說明被圖2的量化轉換係數零樹映射器206所執行的零與非零係數之生成處理。
量化轉換係數零樹映射器206,係於最初的S302中,將k的值(子區塊的識別號碼)初期設定成0,將KK的值(對象區塊內的子區塊之數目)初期設定成4,於之後的S303中,將第k個(最初是第0個)子區塊內的量化轉換係數,依逐線掃描順序而加以取得。然後於S304中,量化轉換係數零樹映射器206,係選擇出對應於對象區塊之分割方法p(p係為1~3的值;分割方法1係表示圖6的4×4、分割方法2係表示圖7的2×8、分割方法3係表示圖8的8×2)的映射圖。在之後的S305中,量化轉換係數零樹映射器206係基於已選擇之映射圖(圖6~圖8的樹62或72或82),將量化轉換係數,映射至複數分割方法所共通之樹狀結構的葉片,依照各葉片的係數值,將各葉片的狀態決定成0(係數值為0時)或是1(係數值為0以外之情形),然後,依照所決定的各葉片之狀態,來更新各節點的狀態。
接著,量化轉換係數零樹映射器206,係於S306中將k的值增加1,針對第k個(此處係為第1個)子區塊,實施上記S303~S305之處理。以下,重複S303~S306之處理,直到針對4個子區塊的處理完畢為止(S307)。
如此,若依據本發明,則即使將對象區塊以複數不同分割方法進行分割而進行預測訊號之生成時,仍可將量化轉換係數映射至共通的樹狀結構的葉片,因此不需要準備複數個樹狀結構。又,可用不依存於對象區塊之分割方法的共通之機率模型,來進行零樹的編碼。
此外,在此實施形態中,將對象區塊之分割方法分成4×4、2×8、8×2這3種,但關於分割方法的種類與數目,係除了子區塊內的像素數要固定以外,並無特別限定。
(關於分割方法p預測解碼器109)
分割方法p預測解碼器109(分割方法1預測解碼器109a、分割方法2預測解碼器109b、及分割方法3預測解碼器109c)係具備圖4所示的共通之構成。以下,說明分割方法p預測解碼器109之構成。如圖4所示,分割方法p預測解碼器109係具備:零樹量化轉換係數映射器401、逆量化器402、逆轉換器403、預測器202、加算器404、及區塊整合器405。此外,圖4的預測器202,係和前述圖2所示者相同。
對零樹量化轉換係數映射器401係輸入著,針對各子區塊,不依存於對象區塊之分割方法的共通之樹狀結構的節點與葉片之狀態、和狀態為1之葉片(亦即量化轉換係數為非零)的量化轉換係數的解碼值。零樹量化轉換係數映射器401,係從所被輸入之樹狀結構的節點與葉片之狀態與非零的量化係數的解碼值,復原出各子區塊的量化轉換係數(細節後述),輸出至逆量化器402。
逆量化器402,係將各子區塊的量化轉換係數予以逆量化而將轉換係數予以復原,輸出至逆轉換器403。
逆轉換器403,係將各子區塊的轉換係數進行逆轉換而將殘差訊號予以復原,輸出至加算器404。
預測器202,係和前述圖2的預測編碼器104中的預測器202同樣地,將對於各子區塊之像素訊號的預測訊號加以生成,輸出至加算器404。
加算器404,係各子區塊的已復原之殘差訊號與預測訊號進行加算,以復原各子區塊的再生訊號,輸出至區塊整合器405。
區塊整合器405,係依照分割方法p,將各子區塊的再生訊號加以統合而復原對象區塊的再生訊號。
此外,在圖1中,雖然是針對分割方法1、2、3而分別準備了分割方法p預測解碼器109,但若是圖4所示的零樹量化轉換係數映射器401、逆量化器402、逆轉換器403、預測器202、加算器404、及區塊整合器405都含有分割方法1~3的機能,具有隨著分割方法來切換處理之機能的情況下,則圖1的分割方法1預測解碼器109a、分割方法2預測解碼器109b、及分割方法3預測解碼器109c,係可置換成1個分割方法p預測解碼器109。例如,1個分割方法1預測解碼器109a,就能達成3個分割方法p預測解碼器109的機能,對分割方法1預測解碼器109a係從分割方法選擇器110輸入著分割方法的識別資訊。分割方法2預測解碼器109b與分割方法3預測解碼器109c就不被需要。
接著,使用圖5,說明被圖4的零樹量化轉換係數映射器401所執行的量化轉換係數之復原處理。
零樹量化轉換係數映射器401,係最初於S502中,將k的值(子區塊的識別號碼)初期設定成0,將KK的值(對象區塊內的子區塊之數目)初期設定成4,於之後的S503中,針對第k個(最初是第0個)子區塊,取得已被解碼之樹狀結構的節點與葉片之狀態,並且將狀態為1的葉片(非零之量化轉換係數)所對應之量化轉換係數的解碼值,加以取得。
然後,零樹量化轉換係數映射器401,係於S504中,選擇出對應於對象區塊之分割方法p(p係為1~3的值;分割方法1係表示圖6的4×4、分割方法2係表示圖7的2×8、分割方法3係表示圖8的8×2)的映射圖。在之後的S505中,零樹量化轉換係數映射器401係基於已選擇之映射圖(圖6~圖8的樹62或72或82),從樹狀結構的節點與葉片之狀態以及狀態為1之葉片所對應的量化轉換係數的解碼值,復原出第k個(最初是第0個)子區塊的量化轉換係數。
接著,零樹量化轉換係數映射器401,係於S506中將k的值增加1,針對第k個(此處係為第1個)子區塊,實施上記S503~S505之處理。以下,重複S503~S506之處理,直到針對4個子區塊的處理完畢為止(S507)。
(關於影像解碼裝置)
圖9中係圖示了本發明所述之影像解碼裝置900的區塊圖。影像解碼裝置900,係具備:輸入端子901、資料解析器902、零樹熵解碼器903、非零係數熵解碼器904、分割方法熵解碼器905、分割方法切換器906、及輸出端子907。圖9的畫格記憶體108,係和前述的圖1之畫格記憶體108相同,圖9的分割方法p預測解碼器109,係和前述的圖1之分割方法p預測解碼器109相同。
以下,說明如上記所構成之影像解碼裝置900之動作。一旦已被編碼之位元串流被輸入至輸入端子901,則資料解析器902,係將處理對象的對象區塊解碼所必須之編碼資料,從位元串流中切出。然後,資料解析器902,係將所取得的編碼資料,分離成殘差訊號的編碼資料(亦即將樹狀結構的節點與葉片之狀態進行零樹編碼所得到的編碼資料、及非零之量化轉換係數的編碼資料)、和用來識別分割方法的資訊的編碼資料,將殘差訊號的編碼資料,輸出至零樹熵解碼器903,並且將分割方法的識別資訊的編碼資料,輸出至分割方法熵解碼器905。
分割方法熵解碼器905,係將所被輸入之分割方法的識別資訊的編碼資料,加以解碼,將對象區塊中的子區塊分割方法的識別資訊,加以復原。已被復原之識別資訊,係被輸出至分割方法切換器906。
另一方面,零樹熵解碼器903,係將對象區塊中的各子區塊的樹狀結構的節點與葉片之狀態,使用不依存於對象區塊之分割方法的共通之機率模型,來進行熵解碼。然後,零樹熵解碼器903,係將已被解碼之樹狀結構的節點與葉片之狀態,和已被解碼之表示葉片狀態為1的量化轉換係數(非零之量化轉換係數)所對應之解碼值的編碼資料,輸出至非零係數熵解碼器904。
非零係數熵解碼器904,係將所被輸入之非零之量化轉換係數的編碼資料,進行熵解碼,復原出量化轉換係數的值。已被復原之非零之量化轉換係數的解碼值,和所被輸入之樹狀結構的節點與葉片之狀態,係被輸出至分割方法切換器906。
分割方法切換器906,係基於分割方法的識別資訊,將樹狀結構的節點與葉片之狀態及各子區塊的非零之量化轉換係數的解碼值,輸出至3個分割方法p預測解碼器109當中的其中1個。
例如,當作為分割方法的識別資訊是分割方法1被解碼出來時,樹狀結構的節點與葉片之狀態及各子區塊的非零之量化轉換係數的解碼值,係被輸出至分割方法1預測解碼器109a,分割方法1預測解碼器109a,係從所被輸入的樹狀結構的節點與葉片之狀態及各子區塊的非零之量化轉換係數的解碼值,復原出各子區塊的量化轉換係數。然後,分割方法1預測解碼器109a,係將各子區塊的量化轉換係數予以逆量化,其後進行逆轉換,以生成再生殘差訊號。同時,分割方法1預測解碼器109a,係和圖1的分割方法1預測編碼器104a同樣地,生成各子區塊的預測訊號。最後,分割方法1預測解碼器109a,係將各子區塊的再生殘差訊號與預測訊號予以加算而復原出再生訊號。已被復原之再生訊號,係被輸出至畫格記憶體108,當作預測處理時所使用的參照影像而被保存。
關於圖9的分割方法p預測解碼器109之動作,由於已經在圖4和圖5中說明,因此省略說明。此外,在圖9中,雖然是針對分割方法1、2、3而分別準備了分割方法p預測解碼器109,但若是圖4所示的零樹量化轉換係數映射器401、逆量化器402、逆轉換器403、預測器202、加算器404、及區塊整合器405都含有分割方法1~3的機能,具有隨著分割方法來切換處理之機能的情況下,則圖9的分割方法1預測解碼器109a、分割方法2預測解碼器109b、及分割方法3預測解碼器109c,係可置換成1個分割方法p預測解碼器109。例如,1個分割方法1預測解碼器109a,就能達成3個分割方法p預測解碼器109的機能,對分割方法1預測解碼器109a係從分割方法熵解碼器905輸入著分割方法的識別資訊。分割方法2預測解碼器109b與分割方法3預測解碼器109c就不被需要。
(關於影像編碼方法)
以下,使用圖10,來說明影像編碼裝置100所執行的影像編碼方法所涉及之處理。此處係假設對象區塊是8×8像素的區塊。
首先,在影像編碼裝置100中,分割方法選擇器110係將用來識別對象區塊之分割方法所需的計數器p,初期設定成1(此處係假設例如1是4×4像素、2是2×8像素、3是8×2像素),將分割方法的數目PP,初期設定成3(S102)。藉此,對分割方法切換器103係從分割方法選擇器110輸入著分割方法1的選擇訊號,已被區塊分割器102所分割的對象區塊,係被從分割方法切換器103輸出至分割方法1預測編碼器104a。
接著,分割方法1預測編碼器104a,係以分割方法1,將對象區塊,分割成4×4像素的子區塊(小領域)(S103)。接著,分割方法1預測編碼器104a,係生成各子區塊的預測訊號,將預測訊號之生成上所必須之附加資訊,加以編碼(S104)。接下來,分割方法1預測編碼器104a,係針對各子區塊,生成預測訊號與影像訊號的殘差訊號,對該殘差訊號實施轉換及量化,而生成各子區塊的量化轉換係數(S105)。然後,分割方法1預測編碼器104a,係藉由於圖3中所說明過的S300之處理,將對象區塊的量化轉換係數映射至樹狀結構的葉片,依照各葉片的係數值,更新樹狀結構的節點與葉片之狀態(S300)。
接著,零樹熵編碼器105係使用不依存於對象區塊之分割方法的共通之機率模型,將上記所生成之樹狀結構的葉片與節點之狀態,進行零樹編碼,並且針對狀態為1之葉片(非零之量化轉換係數),將量化轉換係數的值,加以編碼(S106)。
接下來,分割方法1預測解碼器109a,係藉由於圖5中所說明過的S500之處理,針對對象區塊的各子區塊,從樹狀結構的節點與葉片之狀態以及非零之量化轉換係數的值,復原出各子區塊的量化轉換係數,對各子區塊的已復原之量化轉換係數,實施逆量化及逆轉換,以生成各子區塊的殘差訊號。同時,分割方法1預測解碼器109a,係以和分割方法1預測編碼器104a相同的方法,來生成各子區塊的預測訊號,藉由將該預測訊號與上記殘差訊號進行加算,以復原出各子區塊的再生訊號。此處,影像編碼裝置100,係將已被復原之對象區塊的再生訊號和已被編碼之編碼資料的位元率失真成本,基於所定的計算式(例如,對編碼資料的位元數乘上由量化精度所決定之係數後所得到的值,加上由對象區塊的再生訊號減去影像訊號所得到之差分訊號的平方和)而予以算出(S107)。
接著,影像編碼裝置100,係將計數器p的值加1,然後,針對分割方法p(亦即分割方法2),實施上記S103至S107的處理。
然後,一旦針對3種類的分割方法(分割方法1、2、3)而實施完上記S103至S107之處理,則S108中計數器p的值係為「4」,S109中計數器p的值係變成大於分割方法的數目PP(此處係為「3」),而往S110前進。在此時點上,會得到分割方法1、2、3各自的位元率失真成本。
然後,於S110中,分割方法選擇器110係在3個分割方法當中,選擇出位元率失真成本最小的分割方法,就已被選擇之分割方法而被生成的對象區塊之再生訊號,係被暫時儲存至畫格記憶體108中。又,分割方法熵編碼器111,係將所被選擇之分割方法的識別資訊,進行熵編碼(S111)。
最後,影像編碼裝置100,係將已編碼的分割方法之識別資訊、已選擇的關於分割方法的樹狀結構的零樹編碼資料及非零之量化轉換係數的編碼資料、和預測訊號之生成上所使用的附加資訊的編碼資料,從輸出端子107輸出(S112)。
(關於影像解碼方法)
以下,使用圖11,來說明影像解碼裝置900所執行的影像解碼方法所涉及之處理。此處係假設對象區塊是8×8像素的區塊。
首先,在影像解碼裝置900中,係被輸入壓縮資料,資料解析器902係將對象區塊的編碼資料予以抽出(S902),藉由零樹熵解碼器903和非零係數熵解碼器904和分割方法熵解碼器905,進行上記已被抽出之資料的熵解碼,以將對象區塊之分割方法、對象區塊的各子區塊所相關之樹狀結構的節點與葉片之狀態、對象區塊的非零之量化轉換係數(樹狀結構中對應於狀態為1之葉片的係數)所對應之解碼值、預測訊號之生成上所需要的附加資訊(附加資訊在圖9中並未圖示),加以解碼(S903)。此時,樹狀結構的節點與葉片之狀態的零樹解碼時,是使用了不依存於對象區塊之分割方法的共通之機率模型。
分割方法p預測解碼器109,係基於已被復原之分割方法和附加資訊,來生成對象區塊的預測訊號(S904)。
接下來,分割方法p預測解碼器109係從上記解碼所得到的樹狀結構的節點與葉片之狀態、及表示葉片狀態為1的量化轉換係數(非零之量化轉換係數)所對應之解碼值,藉由圖5所示的S500之處理,轉換成各子區塊的量化轉換係數。
甚至,分割方法p預測解碼器109,係對各子區塊的量化轉換係數,實施逆量化及逆轉換而復原出殘差訊號(S905)。
最後,分割方法p預測解碼器109,係對已復原之殘差訊號,加算上預測訊號,以生成各子區塊的再生訊號,將所生成之各子區塊的再生訊號加以整合,以復原出對象區塊的再生訊號。已被復原的再生訊號,係被暫時儲存在畫格記憶體108中(S906)。
(映射圖的變形例)
在圖3的S304與圖5的S504中,係基於對象區塊的子區塊分割之方法,而從複數映射圖中選擇出量化轉換係數映射至樹狀結構之葉片之際所使用的映射圖,但在本發明中,該選擇方法係沒有限定。只要是能夠被影像解碼裝置所識別的資訊,則無論關於對象區塊或子區塊所附隨之屬性資訊或相鄰區塊的解碼資訊等,都可利用於映射圖的選擇。
例如,亦可準備,基於對象區塊中的子區塊之位置,或子區塊的量化係數中的非零係數之數目或非零係數的值、相鄰的對象區塊之分割方法,子區塊的區塊形狀或像素數等而被分類的映射圖。又,亦可將這些與分割方法進行組合。甚至,亦可於影像編碼裝置中選擇要使用哪個映射圖,將該選擇資訊以畫格單位或區塊單位而加以編碼。
在圖6~圖8中,關於3種類的分割方法,雖然子區塊內的像素數係為一定,但當子區塊的數目或子區塊內的像素數是任意時,仍可適用本發明。
在圖14~圖16中,相對於圖14的對象區塊1401是4個子區塊分割,圖15的對象區塊1501與圖16的對象區塊1601,係被分割成3個子區塊。又,亦還包含子區塊內的像素數係為16個或32個時之情形。
此種案例也是可以藉由使用將對象區塊內的量化轉換係數映射至葉片用的共通之樹狀結構(圖14的樹1402與圖15的樹1502與圖16的樹1602),以不依存於對象區塊之分割方法的1個機率模型,來實施零樹的編碼。
圖12係針對使用對象區塊單位的樹狀結構時,於圖2的量化轉換係數零樹映射器206中,將樹狀結構的節點與葉片之狀態予以更新之處理的流程圖S300-2。以下,說明該圖12的處理。
量化轉換係數零樹映射器206,係於最初的S1201中,將k的值(子區塊的識別號碼)初期設定成0,將KK的值(對象區塊內的子區塊之數目)初期設定成4(圖14的分割方法1)或3(圖15的分割方法4與圖16的分割方法5),於S303中,將第0個子區塊內的量化轉換係數,依逐線掃描順序而加以取得。
接著,量化轉換係數零樹映射器206,係於S306中將k的值增加1,針對第k個(此處係為第1個)子區塊,實施S303之處理。以下,重複S303、S306之處理,直到針對所有的子區塊的S303之處理完畢為止(S307)。
然後,一旦對所有的子區塊都完成了S303之處理,則於S1202中,量化轉換係數零樹映射器206,係選擇出對應於對象區塊之分割方法p(p係1或4或5;參照圖14~圖16)的映射圖,在之後的S1203中,係基於已選擇之映射圖(圖6~圖8的樹62或72或82),將對象區塊內的量化轉換係數映射至樹狀結構的葉片,然後,依照各葉片的係數值,更新樹狀結構的節點與葉片之狀態。
如此,若依據本發明,則即使對象區塊內的子區塊的數目或子區塊內的像素數有所不同時,仍可將量化轉換係數映射至不依存於對象區塊之分割方法的樹狀結構的葉片,因此可以用同樣的樹狀結構以及同樣的機率模型來進行零樹的編碼。
此外,在上記的映射圖的變形例中,對象區塊之分割方法的種類或數量係沒有限定。
圖13係針對使用區塊單位的樹狀結構時,於圖4的零樹量化轉換係數映射器401中的量化係數轉換復原處理的流程圖S500-2。以下,說明該圖13的處理。
零樹量化轉換係數映射器401,係於最初的S1301中,針對對象區塊內的量化轉換係數,取得複數分割方法所共通之樹狀結構的節點與葉片之狀態,於S1302中,選擇出對應於對象區塊之分割方法p(p係1或4或5;參照圖14~圖16)的映射圖。
接著,零樹量化轉換係數映射器401係於S1303中,將k的值(子區塊的識別號碼)初期設定成0,將KK的值(對象區塊內的子區塊之數目)初期設定成4(圖14的分割方法1)或3(圖15的分割方法4與圖16的分割方法5)。接著,零樹量化轉換係數映射器401,係於S1304中,針對狀態為1的樹狀結構之葉片所對應且為第0個子區塊內的係數,取得解碼值,於S1305中,基於S1302所選擇的映射圖,從樹狀結構中的葉片之狀態與非零之量化轉換係數的解碼值,復原出子區塊內的量化係數。
然後,零樹量化轉換係數映射器401,係於S506中將k的值增加1,針對第k個(此處係為第1個)子區塊,實施S1304~S1305之處理。以下,重複S1304、S1305及S506之處理,直到針對所有的子區塊的S1304~S1305之處理完畢為止(S507)。
此外,在圖12~圖16的例子中,雖然是將對象區塊內的64個量化轉換係數映射至樹狀結構的葉片,但亦可以使用該樹狀結構的一部分,以生成各子區塊之樹狀結構的方式,來生成映射圖。關於各子區塊,若基於區塊尺寸與形狀而預先定好要利用之節點與葉片,則可使影像編碼裝置與影像解碼裝置同樣地動作。
甚至,亦可將圖6~圖8所示的子區塊單位的樹狀結構,和圖14~圖16所示之對象區塊單位的樹狀結構,加以並用。例如,亦可在畫面內預測區塊是使用子區塊單位的樹狀結構,而在畫面間預測區塊是使用對象區塊單位的樹狀結構。又,亦可按照每一對象區塊來決定要使用子區塊單位的樹狀結構與對象區塊單位的樹狀結構的哪一者,將所被使用的樹狀結構的識別資訊,從影像編碼裝置發送至影像解碼裝置。
在上記實施形態中,雖然樹狀結構、和用來將該樹狀結構的各節點與葉片之狀態加以編碼所需之機率模型,是不依存於對象區塊之分割方法而為共通,但亦可僅其中一方為共通。例如,亦可為,樹狀結構係使用不依存於對象區塊之分割方法而為共通者,但用來將樹狀結構之各節點與葉片之狀態加以編碼所需的機率模型,係使用隨著每一對象區塊之分割方法而不同定義者。反之,所備妥之用來將各節點與葉片之狀態加以編碼所需的機率模型,係不依存於對象區塊之分割方法而共通,但亦可使用隨著每一對象區塊之分割方法而不同的樹狀結構。此時,亦可為,關於各樹狀結構的節點與葉片,是從已備妥之1個以上的機率模型中,預先選擇出所使用的機率模型,將該選擇資訊,以畫格層級或區塊層級進行編碼,從影像編碼裝置發送至影像解碼裝置。
(關於影像編碼程式、影像解碼程式)
涉及影像編碼裝置之發明,係可視為涉及令電腦成為影像編碼裝置而發揮機能的影像編碼程式之發明。或者,亦可將本實施形態所涉及之影像編碼裝置,以程式的方式儲存在記錄媒體中來提供。又,涉及影像解碼裝置之發明,係可視為涉及令電腦成為影像解碼裝置而發揮機能的影像解碼程式之發明。或者,亦可將本實施形態所涉及之影像解碼方法,以程式的方式儲存在記錄媒體中來提供。
影像編碼程式及影像解碼程式,係例如被儲存在記錄媒體中來提供。作為記錄媒體則例如有,軟碟片、CD-ROM、DVD等記錄媒體,或是ROM等記錄媒體,或是半導體記憶體等。
圖19中係圖示了,用來使電腦成為影像編碼裝置而發揮機能所需的影像編碼程式之模組。如圖19所示,影像編碼程式P100,係具備:區塊分割模組P101、預測編碼模組P102、預測解碼模組P103、分割方法選擇模組P104、記憶模組P105、切換模組P106、零樹編碼模組P107、非零係數編碼模組P108、分割方法編碼模組P109、及輸出模組P110。其中,預測編碼模組P102係可視為1個程式,如圖20所示,包含有:子區塊分割模組P201、預測模組P202、差分模組P203、轉換模組P204、量化模組P205、及量化轉換係數零樹映射模組P206。
藉由執行上記各模組所實現的機能,係和上述圖1的影像編碼裝置100的機能相同。亦即,於機能面而言,圖19的區塊分割模組P101係相當於圖1的區塊分割器102,預測編碼模組P102係相當於分割方法p預測編碼器104,預測解碼模組P103係相當於分割方法p預測解碼器109,分割方法選擇模組P104係相當於分割方法選擇器110,記憶模組P105係相當於畫格記憶體108,切換模組P106係相當於分割方法切換器103,零樹編碼模組P107係相當於零樹熵編碼器105,非零係數編碼模組P108係相當於非零係數熵編碼器106,分割方法編碼模組P109係相當於分割方法熵編碼器111,輸出模組P110係相當於輸出端子107。又,圖20的子區塊分割模組P201係相當於圖2的小領域分割器201,預測模組P202係相當於預測器202,差分模組P203係相當於差分器203,轉換模組P204係相當於轉換器204,量化模組P205係相當於量化器205,量化轉換係數零樹映射模組P206係相當於量化轉換係數零樹映射器206。
圖21中係圖示了,用來使電腦成為影像解碼裝置而發揮機能所需的影像解碼程式之模組。如圖21所示,影像解碼程式P900,係具備:資料解析模組P901、零樹解碼模組P902、非零係數解碼模組P903、切換模組P904、分割方法解碼模組P905、預測解碼模組P103、及記憶模組P105。其中,預測解碼模組P103係可視為1個程式,如圖22所示,包含有:零樹量化轉換係數映射模組P401、逆量化模組P402、逆轉換模組P403、預測模組P202、加算模組P404、及區塊整合模組P405。
藉由執行上記各模組所實現的機能,係和上述圖9的影像解碼裝置900的機能相同。亦即,於機能面而言,圖21的資料解析模組P901係相當於圖9的資料解析器902,零樹解碼模組P902係相當於零樹熵解碼器903,非零係數解碼模組P903係相當於非零係數熵解碼器904,切換模組P904係相當於分割方法切換器906,分割方法解碼模組P905係相當於分割方法熵解碼器905,預測解碼模組P103係相當於分割方法p預測解碼器109,記憶模組P105係相當於畫格記憶體108。又,圖22的零樹量化轉換係數映射模組P401係相當於圖4的零樹量化轉換係數映射器401,逆量化模組P402係相當於逆量化器402,逆轉換模組P403係相當於逆轉換器403,預測模組P202係相當於預測器202,加算模組P404係相當於加算器404,區塊整合模組P405係相當於區塊整合器405。
如上記所被構成的影像編碼程式P100及影像解碼程式P900,係被記憶在圖17所示的記錄媒體10中,被後述的電腦30所執行。
圖17係將記錄媒體中所記錄之程式加以執行所需之電腦的硬體構成之圖示,圖18係將記錄媒體中所記憶之程式加以執行所需之電腦的斜視圖。作為電腦,亦包含具備CPU而可進行軟體所致之處理或控制的DVD播放器、機上盒、行動電話等。
如圖17所示,電腦30,係具備:軟碟驅動裝置、CD-ROM驅動裝置、DVD驅動裝置等讀取裝置12、讓作業系統常駐的作業用記憶體(RAM) 14、用來記憶記錄媒體10中所記憶之程式的記憶體16、顯示器這類顯示裝置18、屬於輸入裝置的滑鼠20及鍵盤22、進行資料收送用的通訊裝置24、控制著程式之執行的CPU26。電腦30,係一旦把記錄媒體10插入至讀取裝置12,則從讀取裝置12就可向記錄媒體10中所儲存的影像編碼程式P100與影像解碼程式P900進行存取,藉由該當影像編碼程式P100和影像解碼程式P900,就可成為本發明所述之影像編碼裝置或影像解碼裝置而動作。
如圖18所示,影像編碼程式或是影像解碼程式,係可以被重疊於載波之電腦資料訊號40的方式,透過網路而提供。此時,電腦30,係將通訊裝置24所接收到的影像編碼程式或影像解碼程式,記憶在記憶體16,就可執行該當影像編碼程式或影像解碼程式。
若依據以上說明的本實施形態,則由於對以複數分割方法所生成之預測訊號,可用共通的樹狀結構來實施零樹編碼,因此可以適切的預測區塊尺寸或形狀來進行預測處理,且可有效率地實施殘差訊號的熵編碼。
101、901...輸入端子
102...區塊分割器
103...分割方法切換器
104a...分割方法1預測編碼器
104b...分割方法2預測編碼器
104c...分割方法3預測編碼器
105...零樹熵編碼器
106...非零係數熵編碼器
107、907...輸出端子
108...畫格記憶體
109a...分割方法1預測解碼器
109b...分割方法2預測解碼器
109c...分割方法3預測解碼器
110...分割方法選擇器
111...分割方法熵編碼器
201...小領域分割器
202...預測器
203...差分器
204...轉換器
205...量化器
206...量化轉換係數零樹映射器
401...零樹量化轉換係數映射器
402...逆量化器
403...逆轉換器
404...加算器
405...區塊整合器
902...資料解析器
903...零樹熵解碼器
904...非零係數熵解碼器
905...分割方法熵解碼器
906...分割方法切換器
[圖1]本實施形態所述之影像編碼裝置的區塊圖。
[圖2]對每一分割方法所設置的預測編碼器的區塊圖。
[圖3]從量化轉換係數往零樹之映射處理的第1流程圖。
[圖4]對每一分割方法所設置的預測解碼器的區塊圖。
[圖5]從零樹往量化轉換係數之映射處理的第1流程圖。
[圖6]從量化轉換係數往零樹之映射處理的第1模式圖。
[圖7]從量化轉換係數往零樹之映射處理的第2模式圖。
[圖8]從量化轉換係數往零樹之映射處理的第3模式圖。
[圖9]本實施形態所述之影像解碼裝置的區塊圖。
[圖10]本實施形態所述之影像編碼方法的說明用流程圖。
[圖11]本實施形態所述之影像解碼方法的說明用流程圖。
[圖12]從量化轉換係數往零樹之映射處理的第2流程圖。
[圖13]從零樹往量化轉換係數之映射處理的第2流程圖。
[圖14]從量化轉換係數往零樹之映射處理的第4模式圖。
[圖15]從量化轉換係數往零樹之映射處理的第5模式圖。
[圖16]從量化轉換係數往零樹之映射處理的第6模式圖。
[圖17]將記錄媒體中所記錄之程式加以執行所需之電腦的硬體構成圖。
[圖18]圖17之電腦的斜視圖。
[圖19]影像編碼程式之模組構成例的區塊圖。
[圖20]預測編碼模組之構成例的區塊圖。
[圖21]影像解碼程式之模組構成例的區塊圖。
[圖22]預測解碼模組之構成例的區塊圖。
100...影像編碼裝置
101...輸入端子
102...區塊分割器
103...分割方法切換器
104a...分割方法1預測編碼器
104b...分割方法2預測編碼器
104c...分割方法3預測編碼器
105...零樹熵編碼器
106...非零係數熵編碼器
107...輸出端子
108...畫格記憶體
109a...分割方法1預測解碼器
109b...分割方法2預測解碼器
109c...分割方法3預測解碼器
110...分割方法選擇器
111...分割方法熵編碼器
L101~L111...訊號線

Claims (16)

  1. 一種影像編碼裝置,其特徵為,具備:領域分割手段,係將輸入影像分割成複數領域;和分割方法選擇手段,係從複數分割方法中,選擇出前記複數領域當中身為處理對象之對象領域的分割方法;和分割方法編碼手段,係將用來識別前記已選擇之分割方法的資訊,加以編碼;和小領域分割手段,係以前記已選擇之分割方法,將前記對象領域,分割成複數小領域;和預測手段,係生成針對前記小領域中所含之像素訊號的預測訊號;和殘差訊號生成手段,係生成前記小領域的預測訊號與像素訊號的殘差訊號;和轉換手段,係將前記小領域的殘差訊號,進行頻率轉換,以生成轉換係數;和量化手段,係將前記小領域的轉換係數加以量化,以生成量化轉換係數;和零樹映射手段,係備妥前記複數分割方法所共通的樹狀結構,從用來把前記小領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記小領域的屬性資訊而定的1個映射圖,基於前記所選擇之映射圖,將前記小領域的量化轉換係數映射至前記樹狀結構的葉片,依照各葉片的係數值來更新前記樹狀結構的節點與葉片之狀態;和零樹編碼手段,係將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型來進行熵編碼;和非零係數編碼手段,係將前記小領域的非零之量化轉換係數,進行熵編碼;和輸出手段,係將用來識別前記已選擇之分割方法的資訊的編碼資料、和前記樹狀結構的節點與葉片之狀態的編碼資料、和前記小領域的非零之量化轉換係數的編碼資料,加以輸出。
  2. 如申請專利範圍第1項所記載之影像編碼裝置,其中,前記小領域的屬性資訊,係為前記對象領域的前記已選擇之分割方法。
  3. 一種影像解碼裝置,其特徵為,具備:資料解析手段,係從壓縮資料之中,抽出用來指示身為處理對象之對象領域之分割方法的編碼資料和前記對象領域所分割成之小領域之殘差訊號的編碼資料;和分割方法解碼手段,係從用來指示對象領域之分割方法的編碼資料,將用來在複數分割方法之中識別前記對象領域之分割方法的資訊,進行熵解碼;和零樹解碼手段,係備妥前記分割方法所共通之樹狀結構,從前記小領域的殘差訊號的編碼資料,將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型,進行熵解碼;和非零係數解碼手段,係從前記小領域的殘差訊號的編碼資料,將前記已解碼之樹狀結構的葉片之狀態為1的量化轉換係數的解碼值,進行熵解碼;和零樹量化轉換係數映射手段,係從用來把前記小領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記小領域之已解碼屬性資訊而定的1個映射圖,基於前記所選擇之映射圖,將前記已解碼之樹狀結構的節點與葉片之狀態與前記已解碼之小領域的量化轉換係數的解碼值,復原成前記小領域的再生量化轉換係數;和逆量化手段,係將前記小領域的再生量化轉換係數進行逆量化,以生成再生頻率轉換係數;和逆轉換手段,係將前記小領域的再生頻率轉換係數進行逆轉換,以復原出再生殘差訊號;和預測手段,係生成針對前記小領域中所含之像素訊號的預測訊號;和影像復原手段,係藉由將前記小領域的前記預測訊號和前記再生殘差訊號進行加算,以復原出前記小領域的像素訊號。
  4. 如申請專利範圍第3項所記載之影像解碼裝置,其中,前記小領域的已解碼屬性資訊,是已解碼的前記對象領域的分割方法。
  5. 一種影像編碼裝置,其特徵為,具備:領域分割手段,係將輸入影像分割成複數領域;和分割方法選擇手段,係從複數分割方法中,選擇出前記複數領域當中身為處理對象之對象領域的分割方法;和分割方法編碼手段,係將用來識別前記已選擇之分割方法的資訊,加以編碼;和小領域分割手段,係以前記已選擇之分割方法,將前記對象領域,分割成複數小領域;和預測手段,係生成針對前記對象領域之各小領域中所含之像素訊號的預測訊號;和殘差訊號生成手段,係生成前記對象領域之各小領域的預測訊號與像素訊號的殘差訊號;和轉換手段,係將前記對象領域之各小領域的殘差訊號,進行頻率轉換,以生成轉換係數;和量化手段,係將前記對象領域之各小領域的轉換係數加以量化,以生成量化轉換係數;和零樹映射手段,係備妥前記複數分割方法所共通的樹狀結構,從用來把前記對象領域內的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記對象領域之屬性資訊而定的1個映射圖,基於前記所選擇之映射圖,將前記對象領域內的量化轉換係數映射至前記樹狀結構的葉片,依照各葉片的係數值來更新前記樹狀結構的節點與葉片之狀態;和零樹編碼手段,係將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型來進行熵編碼;和非零係數編碼手段,係將前記對象領域之各小領域的非零之量化轉換係數,進行熵編碼;和輸出手段,係將用來識別前記已選擇之分割方法的資訊的編碼資料、和前記樹狀結構的節點與葉片之狀態的編碼資料、和前記對象領域之各小領域的非零之量化轉換係數的編碼資料,加以輸出。
  6. 如申請專利範圍第5項所記載之影像編碼裝置,其中,前記對象領域的屬性資訊,係為前記對象領域的前記已選擇之分割方法。
  7. 一種影像解碼裝置,其特徵為,具備:資料解析手段,係從壓縮資料之中,抽出用來指示身為處理對象之對象領域之分割方法的編碼資料和前記對象領域之殘差訊號的編碼資料;和分割方法解碼手段,係從用來指示對象領域之分割方法的編碼資料,將用來在複數分割方法之中識別前記對象領域之分割方法的資訊,進行熵解碼;和零樹解碼手段,係備妥前記分割方法所共通之樹狀結構,從前記對象領域的殘差訊號的編碼資料,將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型,進行熵解碼;和非零係數解碼手段,係從前記對象領域的殘差訊號的編碼資料,將前記已解碼之樹狀結構的葉片之狀態為1的量化轉換係數的解碼值,進行熵解碼;和零樹量化轉換係數映射手段,係從用來把前記對象領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記對象領域之已解碼屬性資訊而定的1個映射圖,基於前記所選擇之映射圖,將前記已解碼之樹狀結構的節點與葉片之狀態與前記已解碼之對象領域的量化轉換係數的解碼值,轉換成前記對象領域之各小領域的再生量化轉換係數;和逆量化手段,係將前記對象領域之各小領域的再生量化轉換係數進行逆量化,以生成再生頻率轉換係數;和逆轉換手段,係將前記對象領域之各小領域的再生頻率轉換係數進行逆轉換,以復原出再生殘差訊號;和預測手段,係生成針對前記對象領域之小領域中所含之像素訊號的預測訊號;和影像復原手段,係藉由將前記對象領域之各小領域的前記預測訊號和前記再生殘差訊號進行加算,以復原出前記對象領域之各小領域的像素訊號而生成再生影像訊號;和領域整合手段,係藉由將前記對象領域之各小領域的再生影像訊號加以整合,以生成前記對象領域的再生影像訊號。
  8. 如申請專利範圍第7項所記載之影像解碼裝置,其中,前記對象領域的已解碼屬性資訊,是已解碼的前記對象領域的分割方法。
  9. 一種影像編碼方法,係屬於被影像編碼裝置所執行的影像編碼方法,其特徵為,具備:領域分割步驟,係將輸入影像分割成複數領域;和分割方法選擇步驟,係從複數分割方法中,選擇出前記複數領域當中身為處理對象之對象領域的分割方法;和分割方法編碼步驟,係將用來識別前記已選擇之分割方法的資訊,加以編碼;和小領域分割步驟,係以前記已選擇之分割方法,將前記對象領域,分割成複數小領域;和預測步驟,係生成針對前記小領域中所含之像素訊號的預測訊號;和殘差訊號生成步驟,係生成前記小領域的預測訊號與像素訊號的殘差訊號;和轉換步驟,係將前記小領域的殘差訊號,進行頻率轉換,以生成轉換係數;和量化步驟,係將前記小領域的轉換係數加以量化,以生成量化轉換係數;和零樹映射步驟,係備妥前記複數分割方法所共通的樹狀結構,從用來把前記小領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記對象領域之前記已選擇之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記小領域的量化轉換係數映射至前記樹狀結構的葉片,依照各葉片的係數值來更新前記樹狀結構的節點與葉片之狀態;和零樹編碼步驟,係將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型來進行熵編碼;和非零係數編碼步驟,係將前記小領域的非零之量化轉換係數,進行熵編碼;和輸出步驟,係將用來識別前記已選擇之分割方法的資訊的編碼資料、和前記樹狀結構的節點與葉片之狀態的編碼資料、和前記小領域的非零之量化轉換係數的編碼資料,加以輸出。
  10. 一種影像解碼方法,係屬於被影像解碼裝置所執行的影像解碼方法,其特徵為,具備:資料解析步驟,係從壓縮資料之中,抽出用來指示身為處理對象之對象領域之分割方法的編碼資料和前記對象領域所分割成之小領域之殘差訊號的編碼資料;和分割方法解碼步驟,係從用來指示對象領域之分割方法的編碼資料,將用來在複數分割方法之中識別前記對象領域之分割方法的資訊,進行熵解碼;和零樹解碼步驟,係備妥前記分割方法所共通之樹狀結構,從前記小領域的殘差訊號的編碼資料,將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型,進行熵解碼;和非零係數解碼步驟,係從前記小領域的殘差訊號的編碼資料,將前記已解碼之樹狀結構的葉片之狀態為1的量化轉換係數的解碼值,進行熵解碼;和零樹量化轉換係數映射步驟,係從用來把前記小領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記已解碼之前記對象領域之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記已解碼之樹狀結構的節點與葉片之狀態與前記已解碼之小領域的量化轉換係數的解碼值,復原成前記小領域的再生量化轉換係數;和逆量化步驟,係將前記小領域的再生量化轉換係數進行逆量化,以生成再生頻率轉換係數;和逆轉換步驟,係將前記小領域的再生頻率轉換係數進行逆轉換,以復原出再生殘差訊號;和預測步驟,係生成針對前記小領域中所含之像素訊號的預測訊號;和影像復原步驟,係藉由將前記小領域的前記預測訊號和前記再生殘差訊號進行加算,以復原出前記小領域的像素訊號。
  11. 一種影像編碼方法,係屬於被影像編碼裝置所執行的影像編碼方法,其特徵為,具備:領域分割步驟,係將輸入影像分割成複數領域;和分割方法選擇步驟,係從複數分割方法中,選擇出前記複數領域當中身為處理對象之對象領域的分割方法;和分割方法編碼步驟,係將用來識別前記已選擇之分割方法的資訊,加以編碼;和小領域分割步驟,係以前記已選擇之分割方法,將前記對象領域,分割成複數小領域;和預測步驟,係生成針對前記對象領域之各小領域中所含之像素訊號的預測訊號;和殘差訊號生成步驟,係生成前記對象領域之各小領域的預測訊號與像素訊號的殘差訊號;和轉換步驟,係將前記對象領域之各小領域的殘差訊號,進行頻率轉換,以生成轉換係數;和量化步驟,係將前記對象領域之各小領域的轉換係數加以量化,以生成量化轉換係數;和零樹映射步驟,係備妥前記複數分割方法所共通的樹狀結構,從用來把前記對象領域內的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記對象領域之前記已選擇之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記對象領域內的量化轉換係數映射至前記樹狀結構的葉片,依照各葉片的係數值來更新前記樹狀結構的節點與葉片之狀態;和零樹編碼步驟,係將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型來進行熵編碼;和非零係數編碼步驟,係將前記對象領域之各小領域的非零之量化轉換係數,進行熵編碼;和輸出步驟,係將用來識別前記已選擇之分割方法的資訊的編碼資料、和前記樹狀結構的節點與葉片之狀態的編碼資料、和前記對象領域之各小領域的非零之量化轉換係數的編碼資料,加以輸出。
  12. 一種影像解碼方法,係屬於被影像解碼裝置所執行的影像解碼方法,其特徵為,具備:資料解析步驟,係從壓縮資料之中,抽出用來指示身為處理對象之對象領域之分割方法的編碼資料和前記對象領域之殘差訊號的編碼資料;和分割方法解碼步驟,係從用來指示對象領域之分割方法的編碼資料,將用來在複數分割方法之中識別前記對象領域之分割方法的資訊,進行熵解碼;和零樹解碼步驟,係備妥前記分割方法所共通之樹狀結構,從前記對象領域的殘差訊號的編碼資料,將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型,進行熵解碼;和非零係數解碼步驟,係從前記對象領域的殘差訊號的編碼資料,將前記已解碼之樹狀結構的葉片之狀態為1的量化轉換係數的解碼值,進行熵解碼;和零樹量化轉換係數映射步驟,係從用來把前記對象領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記已解碼之前記對象領域之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記已解碼之樹狀結構的節點與葉片之狀態與前記已解碼之對象領域的量化轉換係數的解碼值,轉換成前記對象領域之各小領域的再生量化轉換係數;和逆量化步驟,係將前記對象領域之各小領域的再生量化轉換係數進行逆量化,以生成再生頻率轉換係數;和逆轉換步驟,係將前記對象領域之各小領域的再生頻率轉換係數進行逆轉換,以復原出再生殘差訊號;和預測步驟,係生成針對前記對象領域之小領域中所含之像素訊號的預測訊號;和影像復原步驟,係藉由將前記對象領域之各小領域的前記預測訊號和前記再生殘差訊號進行加算,以復原出前記對象領域之各小領域的像素訊號而生成再生影像訊號;和領域整合步驟,係藉由將前記對象領域之各小領域的再生影像訊號加以整合,以生成前記對象領域的再生影像訊號。
  13. 一種影像編碼程式,其特徵為,係使電腦動作成為:領域分割手段,係將輸入影像分割成複數領域;和分割方法選擇手段,係從複數分割方法中,選擇出前記複數領域當中身為處理對象之對象領域的分割方法;和分割方法編碼手段,係將用來識別前記已選擇之分割方法的資訊,加以編碼;和小領域分割手段,係以前記已選擇之分割方法,將前記對象領域,分割成複數小領域;和預測手段,係生成針對前記小領域中所含之像素訊號的預測訊號;和殘差訊號生成手段,係生成前記小領域的預測訊號與像素訊號的殘差訊號;和轉換手段,係將前記小領域的殘差訊號,進行頻率轉換,以生成轉換係數;和量化手段,係將前記小領域的轉換係數加以量化,以生成量化轉換係數;和零樹映射手段,係備妥前記複數分割方法所共通的樹狀結構,從用來把前記小領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記對象領域之前記已選擇之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記小領域的量化轉換係數映射至前記樹狀結構的葉片,依照各葉片的係數值來更新前記樹狀結構的節點與葉片之狀態;和零樹編碼手段,係將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型來進行熵編碼;和非零係數編碼手段,係將前記小領域的非零之量化轉換係數,進行熵編碼;和輸出手段,係將用來識別前記已選擇之分割方法的資訊的編碼資料、和前記樹狀結構的節點與葉片之狀態的編碼資料、和前記小領域的非零之量化轉換係數的編碼資料,加以輸出。
  14. 一種影像解碼程式,其特徵為,係使電腦動作成為:資料解析手段,係從壓縮資料之中,抽出用來指示身為處理對象之對象領域之分割方法的編碼資料和前記對象領域所分割成之小領域之殘差訊號的編碼資料;和分割方法解碼手段,係從用來指示對象領域之分割方法的編碼資料,將用來在複數分割方法之中識別前記對象領域之分割方法的資訊,進行熵解碼;和零樹解碼手段,係備妥前記分割方法所共通之樹狀結構,從前記小領域的殘差訊號的編碼資料,將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型,進行熵解碼;和非零係數解碼手段,係從前記小領域的殘差訊號的編碼資料,將前記已解碼之樹狀結構的葉片之狀態為1的量化轉換係數的解碼值,進行熵解碼;和零樹量化轉換係數映射手段,係從用來把前記小領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記已解碼之前記對象領域之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記已解碼之樹狀結構的節點與葉片之狀態與前記已解碼之小領域的量化轉換係數的解碼值,復原成前記小領域的再生量化轉換係數;和逆量化手段,係將前記小領域的再生量化轉換係數進行逆量化,以生成再生頻率轉換係數;和逆轉換手段,係將前記小領域的再生頻率轉換係數進行逆轉換,以復原出再生殘差訊號;和預測手段,係生成針對前記小領域中所含之像素訊號的預測訊號;和影像復原手段,係藉由將前記小領域的前記預測訊號和前記再生殘差訊號進行加算,以復原出前記小領域的像素訊號。
  15. 一種影像編碼程式,其特徵為,係使電腦動作成為:領域分割手段,係將輸入影像分割成複數領域;和分割方法選擇手段,係從複數分割方法中,選擇出前記複數領域當中身為處理對象之對象領域的分割方法;和分割方法編碼手段,係將用來識別前記已選擇之分割方法的資訊,加以編碼;和小領域分割手段,係以前記已選擇之分割方法,將前記對象領域,分割成複數小領域;和預測手段,係生成針對前記對象領域之各小領域中所含之像素訊號的預測訊號;和殘差訊號生成手段,係生成前記對象領域之各小領域的預測訊號與像素訊號的殘差訊號;和轉換手段,係將前記對象領域之各小領域的殘差訊號,進行頻率轉換,以生成轉換係數;和量化手段,係將前記對象領域之各小領域的轉換係數加以量化,以生成量化轉換係數;和零樹映射手段,係備妥前記複數分割方法所共通的樹狀結構,從用來把前記對象領域內的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記對象領域之前記已選擇之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記對象領域內的量化轉換係數映射至前記樹狀結構的葉片,依照各葉片的係數值來更新前記樹狀結構的節點與葉片之狀態;和零樹編碼手段,係將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型來進行熵編碼;和非零係數編碼手段,係將前記對象領域之各小領域的非零之量化轉換係數,進行熵編碼;和輸出手段,係將用來識別前記已選擇之分割方法的資訊的編碼資料、和前記樹狀結構的節點與葉片之狀態的編碼資料、和前記小領域的非零之量化轉換係數的編碼資料,加以輸出。
  16. 一種影像解碼程式,其特徵為,係使電腦動作成為:資料解析手段,係從壓縮資料之中,抽出用來指示身為處理對象之對象領域之分割方法的編碼資料和前記對象領域之殘差訊號的編碼資料;和分割方法解碼手段,係從用來指示對象領域之分割方法的編碼資料,將用來在複數分割方法之中識別前記對象領域之分割方法的資訊,進行熵解碼;和零樹解碼手段,係備妥前記分割方法所共通之樹狀結構,從前記對象領域的殘差訊號的編碼資料,將前記樹狀結構的節點與葉片之狀態,以前記複數分割方法所共通之機率模型,進行熵解碼;和非零係數解碼手段,係從前記對象領域的殘差訊號的編碼資料,將前記已解碼之樹狀結構的葉片之狀態為1的量化轉換係數的解碼值,進行熵解碼;和零樹量化轉換係數映射手段,係從用來把前記對象領域的量化轉換係數映射至前記樹狀結構之葉片所需的複數映射圖中,選擇出基於前記已解碼之前記對象領域之分割方法而定的1個映射圖,基於前記所選擇之映射圖,將前記已解碼之樹狀結構的節點與葉片之狀態與前記已解碼之對象領域的量化轉換係數的解碼值,轉換成前記對象領域之各小領域的再生量化轉換係數;和逆量化手段,係將前記對象領域之各小領域的再生量化轉換係數進行逆量化,以生成再生頻率轉換係數;和逆轉換手段,係將前記對象領域之各小領域的再生頻率轉換係數進行逆轉換,以復原出再生殘差訊號;和預測手段,係生成針對前記對象領域之小領域中所含之像素訊號的預測訊號;和影像復原手段,係藉由將前記對象領域之各小領域的前記預測訊號和前記再生殘差訊號進行加算,以復原出前記對象領域之各小領域的像素訊號而生成再生影像訊號;和領域整合手段,係藉由將前記對象領域之各小領域的再生影像訊號加以整合,以生成前記對象領域的再生影像訊號。
TW098145872A 2009-02-18 2009-12-30 Image coding apparatus, method and program, and image decoding apparatus, method and program TWI496438B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009035339A JP5001964B2 (ja) 2009-02-18 2009-02-18 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
TW201032596A TW201032596A (en) 2010-09-01
TWI496438B true TWI496438B (zh) 2015-08-11

Family

ID=42633633

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098145872A TWI496438B (zh) 2009-02-18 2009-12-30 Image coding apparatus, method and program, and image decoding apparatus, method and program

Country Status (7)

Country Link
US (1) US8542936B2 (zh)
EP (2) EP2400738A4 (zh)
JP (1) JP5001964B2 (zh)
CN (1) CN102301691B (zh)
ES (1) ES2563743T3 (zh)
TW (1) TWI496438B (zh)
WO (1) WO2010095341A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5001964B2 (ja) 2009-02-18 2012-08-15 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム
CN106067985B (zh) 2010-04-13 2019-06-28 Ge视频压缩有限责任公司 跨平面预测
KR102159896B1 (ko) 2010-04-13 2020-09-25 지이 비디오 컴프레션, 엘엘씨 샘플 배열 멀티트리 세부분할에서 계승
TWI678916B (zh) 2010-04-13 2019-12-01 美商Ge影像壓縮有限公司 樣本區域合倂技術
CN106231335B (zh) 2010-04-13 2019-07-02 Ge视频压缩有限责任公司 解码器、解码方法、编码器以及编码方法
WO2012069990A1 (en) * 2010-11-26 2012-05-31 Koninklijke Philips Electronics N.V. Image processing apparatus
JP6056122B2 (ja) 2011-01-24 2017-01-11 ソニー株式会社 画像符号化装置と画像復号装置およびその方法とプログラム
CN102176750B (zh) * 2011-03-10 2012-12-26 西安电子科技大学 高性能自适应二进制算术编码器
KR102079311B1 (ko) * 2011-12-15 2020-02-19 타지반 투 엘엘씨 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 화상 부호화 복호 장치
CN103209323A (zh) * 2012-12-26 2013-07-17 辽宁师范大学 基于k阶零树间向量的图像压缩方法
CN104104958B (zh) * 2013-04-08 2017-08-25 联发科技(新加坡)私人有限公司 图像解码方法及其图像解码装置
US10298927B2 (en) * 2014-03-28 2019-05-21 Sony Corporation Image decoding device and method
US10547872B2 (en) * 2015-09-10 2020-01-28 Samsung Electronics Co., Ltd. Encoding device, decoding device, and encoding method and decoding method thereof
WO2017043763A1 (ko) * 2015-09-10 2017-03-16 삼성전자 주식회사 부호화 장치, 복호화 장치, 그 부호화 및 복호화 방법
CN106888380B (zh) * 2017-01-04 2019-05-03 西安万像电子科技有限公司 图像中文字块的编码方法及装置
EP3742403A4 (en) * 2018-01-19 2021-03-17 Panasonic Intellectual Property Corporation of America METHOD FOR CODING THREE-DIMENSIONAL DATA, METHOD FOR DECODING THREE-DIMENSIONAL DATA, DEVICE FOR CODING THREE-DIMENSIONAL DATA AND DEVICE FOR DECODING THREE-DIMENSIONAL DATA
CN109660803A (zh) * 2019-01-22 2019-04-19 西安电子科技大学 一种编码块的量化方法及用于hevc编码的量化方法
CN111191386B (zh) * 2020-01-20 2023-04-14 浙江省森林资源监测中心 一种多尺度相容的林木年生长模型组建模方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5724451A (en) * 1994-09-27 1998-03-03 Samsung Electronics Co., Ltd. Image compression method and apparatus using conditional quadtree split sysyem
US6157746A (en) * 1997-02-12 2000-12-05 Sarnoff Corporation Apparatus and method for encoding wavelet trees generated by a wavelet-based coding method
US20040114683A1 (en) * 2002-05-02 2004-06-17 Heiko Schwarz Method and arrangement for coding transform coefficients in picture and/or video coders and decoders and a corresponding computer program and a corresponding computer-readable storage medium
TWI300311B (en) * 2005-11-22 2008-08-21 Aspeed Technology Inc Progressive differential motion jpeg codec
TWI304303B (en) * 2006-01-04 2008-12-11 Sunplus Technology Co Ltd Apparatus for image encoding and the method thereof

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997017797A2 (en) * 1995-10-25 1997-05-15 Sarnoff Corporation Apparatus and method for quadtree based variable block size motion estimation
DE10022331A1 (de) * 2000-05-10 2001-11-15 Bosch Gmbh Robert Verfahren zur Transformationscodierung von Bewegtbildsequenzen
US6765964B1 (en) 2000-12-06 2004-07-20 Realnetworks, Inc. System and method for intracoding video data
US7003035B2 (en) 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
US7660475B2 (en) 2004-12-22 2010-02-09 Ntt Docomo, Inc. Method and apparatus for coding positions of coefficients
JP5001964B2 (ja) 2009-02-18 2012-08-15 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム
BRPI1014232A2 (pt) * 2009-06-09 2016-04-12 Sony Corp aparelho para gerar múltiplas árvores de codificação de candidato para uso durante codificação, sistema para codificação e de codificação adaptável de imagens ou vídeos, e, método para gerar múltiplas árvores de codificação de candidato
US8406546B2 (en) * 2009-06-09 2013-03-26 Sony Corporation Adaptive entropy coding for images and videos using set partitioning in generalized hierarchical trees
KR20170116253A (ko) * 2009-07-02 2017-10-18 톰슨 라이센싱 적응적 트리 선택을 사용한 이진 집합의 비디오 인코딩 및 디코딩을 위한 방법 및 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5724451A (en) * 1994-09-27 1998-03-03 Samsung Electronics Co., Ltd. Image compression method and apparatus using conditional quadtree split sysyem
US6157746A (en) * 1997-02-12 2000-12-05 Sarnoff Corporation Apparatus and method for encoding wavelet trees generated by a wavelet-based coding method
US20040114683A1 (en) * 2002-05-02 2004-06-17 Heiko Schwarz Method and arrangement for coding transform coefficients in picture and/or video coders and decoders and a corresponding computer program and a corresponding computer-readable storage medium
TWI300311B (en) * 2005-11-22 2008-08-21 Aspeed Technology Inc Progressive differential motion jpeg codec
TWI304303B (en) * 2006-01-04 2008-12-11 Sunplus Technology Co Ltd Apparatus for image encoding and the method thereof

Also Published As

Publication number Publication date
EP2615820A1 (en) 2013-07-17
CN102301691A (zh) 2011-12-28
ES2563743T3 (es) 2016-03-16
CN102301691B (zh) 2014-04-02
TW201032596A (en) 2010-09-01
EP2400738A4 (en) 2012-09-05
EP2400738A1 (en) 2011-12-28
EP2615820B1 (en) 2015-11-25
WO2010095341A1 (ja) 2010-08-26
US20110299788A1 (en) 2011-12-08
JP2010193162A (ja) 2010-09-02
JP5001964B2 (ja) 2012-08-15
US8542936B2 (en) 2013-09-24

Similar Documents

Publication Publication Date Title
TWI496438B (zh) Image coding apparatus, method and program, and image decoding apparatus, method and program
TWI521890B (zh) Image coding apparatus, method and program, and image decoding apparatus, method and program
CN103227923B (zh) 图像解码方法以及图像解码装置
CN103339940B (zh) 运动图像编码方法以及运动图像解码方法
CN110024393A (zh) 用于视频译码的低复杂度符号预测
CN101836455A (zh) 用于处理视频信号的方法和装置
JP2002315004A (ja) 画像符号化方法及び装置、画像復号方法及び装置、並びに画像処理システム
MX2013000372A (es) Intraprediccion de baja comlejidad para la codificacion de video.
KR20110066109A (ko) 트리 구조를 이용한 부호화/복호화 방법 및 장치
CN103339938A (zh) 执行视频译码的运动向量预测
KR100574702B1 (ko) 화상부호/복호방법 및 그 프로그램을 기록한 기록매체
CN107347155A (zh) 用于编码和解码图像的方法、编码和解码设备、以及相应的计算机程序
CN106454346A (zh) 编码和解码图像的方法、编码和解码设备
CN105723709A (zh) 用于编码和解码图像的方法、用于编码和解码图像的装置及对应计算机程序
CN105230021A (zh) 屏幕内容的词典编码和解码
CN104604228A (zh) 图像解码方法和使用其的装置
CN105794208A (zh) 编码解码图像方法、编码解码图像设备及相应计算机程序
CN103069798B (zh) 用于在实施变换域估计过程中对至少一个图像进行编码和解码的方法和装置
EP3056002A2 (en) Method for encoding and decoding a media signal and apparatus using the same
WO2006011197A1 (ja) 符号化データ再符号化装置及びその復号装置並びにプログラム
CN107409216B (zh) 图像编码和解码方法、编码和解码设备以及相应的计算机程序
JP2009021786A (ja) 画像符号化装置及び画像符号化方法
CN107343391A (zh) 通过向量量化对图像进行编码
CN116998156A (zh) 变换跳过的系数符号预测
KR20130070618A (ko) 트리 구조를 이용한 부호화/복호화 방법 및 장치