TWI572192B - An image coding method, an image coding apparatus, an image decoding method, an image decoding apparatus, and an image coding / decoding apparatus - Google Patents

An image coding method, an image coding apparatus, an image decoding method, an image decoding apparatus, and an image coding / decoding apparatus Download PDF

Info

Publication number
TWI572192B
TWI572192B TW101101441A TW101101441A TWI572192B TW I572192 B TWI572192 B TW I572192B TW 101101441 A TW101101441 A TW 101101441A TW 101101441 A TW101101441 A TW 101101441A TW I572192 B TWI572192 B TW I572192B
Authority
TW
Taiwan
Prior art keywords
context
signal
binary
decoding
image
Prior art date
Application number
TW101101441A
Other languages
English (en)
Other versions
TW201249209A (en
Inventor
Hisao Sasai
Takahiro Nishi
Youji Shibahara
Toshiyasu Sugio
Original Assignee
Sun Patent Trust
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Patent Trust filed Critical Sun Patent Trust
Publication of TW201249209A publication Critical patent/TW201249209A/zh
Application granted granted Critical
Publication of TWI572192B publication Critical patent/TWI572192B/zh

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • H03M7/4012Binary arithmetic codes
    • H03M7/4018Context adapative binary arithmetic codes [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

圖像編碼方法、圖像編碼裝置、圖像解碼方法、圖像解碼裝置、及圖像編碼解碼裝置 技術領域
本發明係有關於一種圖像編碼方法、圖像編碼裝置、圖像解碼方法、圖像解碼裝置、及圖像編碼解碼裝置,特別是有關於一種進行算術編碼及算術解碼之圖像編碼方法、圖像編碼裝置、圖像解碼方法、圖像解碼裝置、及圖像編碼解碼裝置。
背景技術
近年來例如包括透過網際網路之視訊會議、數位視訊廣播及影像內容之串流在內之隨選視訊(video on demand)式服務用之應用程式之數量正增加中,其等應用程式係有賴於影像資訊之傳送者。影像資料被傳送或被記錄時,有相當量的資料是經由有限頻寬之習知傳輸通道傳送,或被記憶在有限資料容量之習知記憶媒體中。為了透過習知傳輸通道傳送影像資訊及將影像資料記憶至習知的傳輸通道,要進行壓縮或削減數位資料之量是不可避免的。
在此,為了壓縮影像資料,已開發了多種影像編碼規格。如此影像編碼規格例如有以H.26x所示之ITU-T(國際電氣通訊聯合電氣通訊制定標準部門)規格及以MPEG-x所示之ISO/IEC規格。最新且最先進之影像編碼規格係於目前是以H.264/AVC所示之規格或者是以MPEG-4 AVC所示之規格(參考非專利文獻1及非專利文獻2)。
在H.264/AVC規格中,大致分為所謂預測、變換、量化、熵編碼之處理所構成者。在這之中,熵編碼係從預測所使用之資訊或已量化之資訊删減冗長之資訊。熵編碼係已知有可變長度編碼、適應編碼、固定長度編碼等方式。可變長度編碼則有哈夫曼編碼、運行長度編碼(run-length encoding)、算術編碼等方式。
其中算術編碼係一種一邊計算符號之發生機率且一邊決定輸出編碼之方式。即,在算術編碼中,一邊依每一上下文而將符號發生機率更新,一邊預測在與圖像資料之特徵對應之上下文中之符號發生機率,而進行圖像資料之編碼者。因此已知,與使用固定的編碼表之哈夫曼編碼等相比,算術編碼可因應圖像資料之特徵而決定編碼,所以編碼效率較高者。
先行技術文獻
[非專利文獻]
[非專利文獻1] ISO/IEC 14496-10「MPEG-4 Part10 Advanced Video Coding」
[非專利文獻2] Thomas Wiegand et al、“Overview of the H.264/AVC Video Coding Standard”、IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY、JULY 2003、PP.1-19.
惟,在算術編碼中,很難對於圖像資料之特徵適宜地決定上下文者。例如,在與1個上下文對應之圖像資料之特徵之範圍太小時(在上下文已經細分之情況),使符號發生機率之更新頻率降低,且使得符號發生機率之預測之精度降低。結果而有造成要適應圖像資料之特徵進行編碼變得困難,使得編碼效率惡化之課題衍生。
在此,本發明係乃為了解決上述習知之課題而所創建者,其目的係於提供一種可提高符號發生機率等機率資訊之預測精度,且可提昇圖像編碼效率之圖像編碼方法及圖像解碼方法。
為解決上述習知課題,本發明一態樣之圖像編碼方法係將圖像資料進行編碼之圖像編碼方法,包含有:變換步驟,係對前述圖像資料進行頻率變換,而產生頻率區域之處理單位者;2進制處理步驟,係對前述處理單位中所含之係數進行2進制處理,而產生2進制訊號者;上下文決定步驟,係決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述2進制訊號用之上下文,前述區分為分割前述處理單位而所得到之多數區分中之1個區分且為含有業經2進制處理之前述係數者;2進制算術編碼步驟,係依照與所決定之前述上下文對應之機率資訊,而將前述2進制訊號進行2進制算術編碼者;及更新步驟,係根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新者。
又,本發明一態樣之圖像編碼裝置係將圖像資料進行編碼之圖像編碼裝置,包含有:變換部,係對前述圖像資料進行頻率變換,而產生頻率區域之處理單位者;2進制處理部,係將前述處理單位所含之係數進行2進制處理,而產生2進制訊號者;上下文控制部,係決定前述2進制訊號用之上下文者;及2進制算術編碼部,係按照與所決定之前述上下文對應之機率資訊,而將前述2進制訊號進行算術編碼者;前述上下文控制部係決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述2進制訊號用之上下文,前述區分為分割前述處理單位而所得到之多數區分中之1個區分且為含有業經2進制處理之前述係數之區分,並根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新。
又,本發明一態樣之圖像解碼方法係將編碼圖像資料進行解碼之圖像解碼方法,包含有:取得步驟,係於前述編碼圖像資料所含之解碼對象訊號表示頻率區域之處理單位所含之係數時,取得表示前述係數之處理單位內之位置之位置資訊者;上下文決定步驟,係決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述解碼對象訊號用之上下文,前述區分為分割前述處理單位而所得到之多數區分中之1個區分且為前述位置資訊所示之位置所屬之區分;2進制算術解碼步驟,係依照與所決定之前述上下文對應之機率資訊,將前述解碼對象訊號進行算術解碼,而產生2進制訊號者;多進制處理步驟,係將前述2進制訊號進行多進制處理者;及更新步驟,係根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新者。
又,本發明一態樣之圖像解碼裝置係將編碼圖像資料進行解碼之圖像解碼裝置,包含有:上下文控制部,係決定前述編碼圖像資料所含之解碼對象訊號用之上下文者;2進制算術解碼部,係依照與所決定之前述上下文對應之機率資訊,將前述解碼對象訊號進行算術解碼,而產生2進制訊號者;及多進制處理部,係將前述2進制訊號進行多進制處理者;前述上下文控制部係於前述解碼對象訊號表示頻率區域之處理單位所含之係數時,取得顯示前述係數之處理單位內之位置之位置資訊,決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述解碼對象訊號用之上下文,前述區分為分割前述處理單位而所得到之多數區分中之1個區分且為前述位置資訊所示之位置所屬之區分,並根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新。
又,本發明一態樣之圖像編碼解碼裝置係具有藉將圖像資料進行編碼而產生編碼圖像資料之圖像編碼裝置、及藉將編碼圖像資料進行解碼之圖像解碼裝置,前述圖像編碼裝置包含有:變換部,係對前述圖像資料進行頻率變換,而產生頻率區域之處理單位者;2進制處理部,係對前述處理單位所含之係數進行2進制處理,而產生2進制訊號者;第1上下文控制部,係決定前述2進制訊號用之上下文者;及2進制算術編碼部,係依照與所決定之前述上下部對應之機率資訊,而將前述2進制訊號進行算術編碼者;且前述第1上下文控制部係決定相對於成為分割前述處理單位而所得到之多數區分中之1個區分且含有業經2進制處理之前述係數之區分所含之多數係數共通之1個以上之上下文,作為前述2進制訊號用之上下文,並根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新,又,前述圖像解碼裝置包含有:第2上下文控制部,係決定前述編碼圖像資料中所含之解碼對象訊號用之上下文者;2進制算術解碼部,係依照與所決定之前述上下文對應之機率資訊,將前述解碼對象訊號進行算術解碼,而產生2進制訊號者;及多進制處理部,係對前述2進制訊號進行多進制處理者;且前述第2上下文控制部係於前述解碼對象訊號顯示為頻率區域之處理單位所含之係數時,取得顯示前述係數之處理單位內之位置之位置資訊,決定相對於成為分割前述處理單位而所得到之多數區分中之1個區分且為前述位置資訊所示之位置所屬之區分之多數係數共通之1個以上之上下文,作為前述解碼對象訊號用之上下文,並根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新。
依本發明,由於可提高符號發生機率等之機率資訊之預測精度,所以可提昇圖像編碼效率。
圖式簡單說明
第1圖係顯示比較用算術編碼方法之流程圖。
第2圖係顯示比較用算術編碼裝置之構成之方塊圖。
第3圖係顯示本發明實施形態1之算術編碼部之一構成例之方塊圖。
第4圖係顯示本發明實施形態1之符號發生機率表之一例之圖。
第5圖(a)、(b)係顯示本發明實施形態1之上下文圖表之一例之圖。
第6圖係顯示本發明實施形態1之算術編碼方法之一例之流程圖。
第7圖係顯示本發明實施形態1之算術編碼方法之一例之流程圖。
第8圖係顯示本發明實施形態1之上下文方塊區分控制之一例之流程。
第9A圖係顯示用以說明本發明實施形態1之上下文區分之一例之模式圖。
第9B圖係顯示本實施形態1之上下文區分之設定例之圖。
第9C圖係顯示本發明實施形態1之上下文區分之設定例之圖。
第10圖係顯示本發明實施形態1之圖像編碼裝置之一構成例之方塊圖。
第11A圖係顯示本發明實施形態1之變形例之2進制處理之一例之圖。
第11B圖係顯示本發明實施形態1之變形例之2進制訊號所含之2進制符號之位元位置與上下文索引之對應關係之一例之圖。
第11C圖係用以說明本發明實施形態1之變形例之上下文之決定方法之一例之圖。
第12圖係顯示本發明一態樣之圖像編碼裝置之一構成例之方塊圖。
第13圖係顯示本發明一態樣之圖像編碼方法之一例之流程圖。
第14圖係顯示本發明實施形態2之算術解碼部之一構成例之方塊圖。
第15圖係顯示本發明實施形態2之算術解碼方法之一例之流程圖。
第16圖係顯示本發明實施形態2之算術解碼方法之一例之流程圖。
第17圖係顯示本發明實施形態2之圖像解碼裝置之一構成例之方塊圖。
第18圖係顯示本發明一態樣之圖像解碼裝置之一構成例之方塊圖。
第19圖係顯示本發明一態樣之圖像解碼方法之一例之流程圖。
第20圖係實現內容發送服務之內容供給系統之整體構成圖。
第21圖係數位廣播用系統之整體構成圖。
第22圖係顯示電視機之構成例之方塊圖。
第23圖係顯示在光碟之記錄媒體進行資訊讀寫之資訊再生/記錄部之構成例之方塊圖。
第24圖係顯示光碟之記錄媒體之構成例之圖。
第25圖(a)係顯示行動電話機之一例;(b)係顯示行動電話機之構成例之方塊圖。
第26圖係顯示多工資料之構成之圖。
第27圖係模式地顯示各串流在多工資料中如何被多工之圖。
第28圖係更詳細地顯示視訊流如何被儲存在PES封包列之圖。
第29圖係顯示多工資料中之TS封包與原始封包之構造之圖。
第30圖係顯示PMT之資料構成之圖。
第31圖係顯示多工資料資訊之內部構成之圖。
第32圖係顯示串流屬性資訊之內部構成之圖。
第33圖係顯示識別影像資料之步驟之圖。
第34圖係顯示將各實施形態之動態圖像編碼方法及動態圖像解碼方法予以實現之積體電話之構成例之方塊圖。
第35圖係顯示切換驅動頻率之構成之圖。
第36圖係顯示識別影像資料且切換頻率之步驟之圖。
第37圖係顯示將影像資料之規格與驅動頻率相對應之查找表之一例之圖。
第38圖(a)係顯示將訊號處理部之模組共有之一構成例之圖;(b)係顯示將訊號處理部之模組共有之另一例之圖。
用以實施發明之形態
(原委)
首先一面參照比較用之算術編碼之動作,一面說明完成本發明之經過。
首先,利用第1圖,如下說明比較用之算術編碼之流程。
編碼對象訊號,例如是量化係數般之方塊尺寸有關係之訊號時,進行方塊尺寸之判斷。一開始進行算術編碼,在步驟S11中,因應訊號之類別,以事先決定之手法進行2進制處理(Binarization)。其次,在步驟S12中,進行因應含有方塊尺寸之資訊之訊號的類別之上下文控制處理。在上下文控制處理中,由儲存有多數符號發生機率之記憶體讀出對應於訊號類別之符號發生機率,並予以輸出者。在步驟S13中,使用由步驟S12所收到之符號發生機率,對處理對象之資訊進行算術編碼,將結果作為輸出訊號而予以輸出。
在步驟S14中,根據在步驟S11中所算出之2進制資訊,而將對應之符號發生機率之值更新,且作為符號發生機率而予以儲存。當處理對象之資訊之算術編碼一結束,又,進行下一處理對象之資訊之算術編碼。
第2圖係顯示習知之H.264/AVC之顯現算術編碼之處理之算術編碼部之構成之方塊圖。如第2圖所示,算術編碼部10包含有2進制處理部11、符號發生機率儲存部12、上下文控制部13及2進制算術編碼器14。
算術編碼部10係輸入有成為編碼對象訊號之輸入訊號SI與表示該輸入訊號SI之類別之訊號類別資訊SE。2進制處理部11係根據訊號類別資訊SE,將輸入訊號SI變換成“0”、“1”之2進制資訊(符號),且將2進制訊號BIN送至2進制算術編碼器14與上下文控制部13。
上下文控制部13係將對應於訊號類別資訊SE之上下文之符號發生機率PE輸出至符號發生機率儲存部12。又,上下文控制部13係根據與由2進制處理部11所輸入之輸入訊號SI對應之2進制訊號BIN,進行與訊號類別資訊SE對應之上下文之符號發生機率PE之更新處理,且將更新結果儲存至符號發生機率儲存部12。
2進制算術編碼器14係根據符號發生機率PE,對2進制訊號BIN進行算術編碼處理,產生輸出位元資訊OB而予以輸出。
惟,在上述之算術編碼中,於上下文控制部13取得與編碼對象訊號之訊號類別資訊對應之上下文之符號發生機率1個,但要適當地設定訊號類別資訊與上下文之對應關係是極為困難的。
例如,要將以方塊尺寸單位執行頻率變換且量化之量化係數進行算術編碼時,位置相異之量化係數被當作為相異之類別來處理。然後依類別而對應有相異之上下文。方塊尺寸變大時,亦依每一類別或按每一一定個數之類別對應有上下文。即,上下文被細分。
惟,在上下文被細分時,符號發現機率之更新頻率會降低,導致符號發生機率之預測精度降低。結果造成要適應圖像資料之特徵而進行編碼一事就變得困難,使編碼效率惡化。
在此,為解決上述課題,本發明一態樣之圖像編碼方法係將圖像資料進行編碼者,包含有以下步驟,即:變換步驟,係藉將前述圖像資料進行頻率變換,產生頻率區域之處理單位者;2進制處理步驟,係將前述處理單位所含之係數進行2進制處理,產生2進制訊號者;上下文決定步驟,係決定相對於區分所含之多數係數共通之1以上之上下文,作為前述2進制訊號用之上下文,前述區分為分割前述處理單位而所得到之多數區分中之1個區分且為含有業經2進制處理之前述係數之區分;2進制算術編碼步驟,係依照與所決定之前述上下文對應之機率資訊,將前述2進制訊號進行2進制算術編碼者;及更新步驟,係根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新者。
藉此,可以決定相對於含有業經2進制處理之係數之區分所含之多數係數共通之1個以上之上下文,作為2進制訊號用之上下文。因此,能將與上下文對應之機率資訊之更新次數提高,使得很容易將統計資訊反映在機率資訊上。結果能提高機率資訊之預測精度,且可提昇編碼效率。進而,亦可相對於決定按係數不同而有所不同之上下文之情況,更能減少上下文的數量。因此,亦能縮小儲存與各上下文對應之機率資訊用之記憶體之尺寸。
又,在本發明另一態樣之圖像編碼方法中,前述多數區分所含之第1區分宜為比位於前述第1區分更高頻率之區域之第2區分小者。
藉此,可將第1區分變得比位於第1區分更高之頻率區域之第2區分小。因此,可因應依存於頻率成分之統計性質而設定區分,因此可抑制上下文之數量,並提昇機率資訊之預測精度。結果能提昇編碼效率。
又,在本發明另一態樣之圖像編碼方法中,在前述2進制處理步驟中,藉以事先設定之掃描順序掃描前述處理單位所含之多數係數而所得到之前述係數為掃描順序上最後之非零係數時,產生顯示前述係數之位置之訊號,作為前述2進制訊號者為佳。
藉此,可適當地決定顯示在掃描順序上最後之非零係數之位置之2進制訊號之上下文,且能提昇編碼效率。
又,在本發明另一態樣之圖像編碼方法中,在前述2進制處理步驟中,前述係數為在掃描順序上最後之非零係數時,產生以2維座標之座標值顯示前述係數之位置之訊號,作為前述2進制訊號者為佳。
藉此,就算是以2維座標之座標值顯示在掃描順序上最後之非零係數之位置之2進制訊號,亦可適當地決定上下文,且能提昇編碼效率。
又,為解決上述課題,本發明一態樣之圖像編碼裝置係將圖像資料進行編碼之圖像編碼裝置,包含有:變換部,係藉將前述圖像資料進行頻率變換,而產生頻率區域之處理單位者;2進制處理部,係藉將前述處理單位所含之係數進行2進制處理,而產生2進制訊號者;上下文控制部,係決定前述2進制訊號用之上下文者;及2進制算術編碼部,係依照與所決定之前述上下文對應之機率資訊,而將前述2進制訊號進行算術編碼者;前述上下文控制部係決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述2進制訊號用之上下文,前述區分為分割前述處理單位而所得到之多數區分中之1個區分且為含有業經2進制處理之前述係數之區分;並根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新。
藉此,可展現與上述圖像編碼方法同樣之效果。
又,為解決上述課題,本發明一態樣之圖像解碼方法係將編碼圖像資料進行解碼之圖像解碼方法,包含有:取得步驟,係於前述編碼圖像資料所含之解碼對象訊號顯示頻率區域之處理單位所含之係數時,取得顯示前述係數之處理單位內之位置之位置資訊者;上下文決定步驟,係決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述解碼對象訊號用之上下文,前述區分為分割前述處理單位而所得到之多數區分中之1個區分且為前述位置資訊所示之位置所屬之區分;2進制算術解碼步驟,係依照與所決定之前述上下文對應之機率資訊,將前述解碼對象訊號進行算術解碼,而產生2進制訊號者;多進制處理步驟,係將前述2進制訊號進行多進制處理者;及更新步驟,係根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新者。
依此,可決定相對於顯示位置資訊之位置所屬之區分所含之多數係數共通之1個以上之上下文,作為解碼對象訊號用之上下文。因此,可提昇與上下文對應之機率資訊之更新次數,能輕易地在機率資訊反映出統計資訊。結果可提高機率資訊之預測精度,能提昇編碼效率。然後能正確地將藉如此高之編碼效率所編碼之編碼圖像資料進行解碼者。
又,在本發明另一態樣中之圖像解碼方法中,前述多數區分所含之第1區分宜小於位於比前述第1區分高頻之區域之第2區分者。
依此,可將第1區分比位於第1區分高頻之區域之第2區分小。因此,因應與頻率成分相依之統計性質而設定區分,可抑制上下文之數量,並提昇機率資訊之預測精度。即,能正確地將以更高的編碼效率所編碼之編碼圖像資料進行解碼者。
又,在本發明另一態樣之圖像解碼方法中,前述解碼對象訊號係於以事先設定之掃描順序掃描前述處理單位所含之多數係數而所得到之前述係數為掃描順序上位於最後之非零係數時,宜為顯示前述係數的位置之訊號者。
依此,可適當地決定顯示在掃描順序上位於最後之非零係數之位置之解碼對象訊號之上下文,且可正確地將以高編碼效率所編碼之之編碼圖像資料進行解碼。
又,在本發明另一態樣之圖像解碼方法中,前述解碼對象訊號係於前述係數為掃描順序上位於最後之非零係數時,宜為以2維座標之座標值顯示前述係數之位置之訊號者。
依此,即使是以2維座標之座標值顯示掃描順序上位於最後之非零係數之位置之解碼對象訊號,亦可適當地決定上下文,且可正確地將以高編碼效率所編碼之編碼圖像資料進行解碼。
又,為解決上述課題,本發明一態樣之圖像解碼裝置係將編碼圖像資料進行解碼之圖像解碼裝置,包含有:上下文控制部,係決定前述編碼圖像資料所含之解碼對象訊號用之上下文者;2進制算術解碼部,係依照與所決定之前述上下文對應之機率資訊,將前述解碼對象訊號進行算術解碼,而產生2進制訊號者;及多進制處理部,係將前述2進制訊號進行多進制處理者;前述上下文控制部係於前述解碼對象訊號顯示頻率區域之處理單位所含之係數時,取得顯示前述係數之處理單位內之位置之位置資訊;決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述解碼對象訊號用之上下文,該區分為分割前述處理單位而所得到之多數區分中之1個區分且為前述位置資訊所示之位置所屬之區分;並根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新。
依此,可展現與上述圖像解碼方法同樣之效果。
又,為解決上述課題,本發明一態樣之圖像編碼解碼裝置係包含有藉將圖像資料進行編碼而產生編碼圖像資料之圖像編碼裝置、及將前述編碼圖像資料進行解碼之圖像解碼裝置之圖像編碼解碼裝置,前述圖像編碼裝置包含有;變換部,係藉將前述圖像資料進行頻率變換,產生頻率區域之處理單位者;2進制處理部,係藉將前述處理單位所含之係數進行2進制處理,而產生2進制訊號者;第1上下文控制部,係決定前述2進制訊號用之上下文者;及2進制算術編碼部,係依照與所決定之前述上下文對應之機率資訊,而將2進制訊號進行算術編碼者;前述第1上下文控制部係決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述2進制訊號用之上下文,前述區分為分割前述處理單位而所得到之多數區分中之1個區分且為含有業經2進制處理之前述係數者;且根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新;又,圖像解碼裝置包含有:第2上下文控制部,係決定前述編碼圖像資料所含之解碼對象訊號用之上下文者;2進制算術解碼部,係依照與所決定之前述上下文對應之機率資訊,將前述解碼對象訊號算術解碼,而產生2進制訊號者;及多進制處理部,係將前述2進制訊號進行多進制處理者;前述第2上下文控制部係於前述解碼對象訊號顯示頻率區域之處理單位所含之係數時,取得顯示前述係數之處理單位內之位置之位置資訊;決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述解碼對象訊號用之上下文,前述區分為分割前述處理單位所得到之多數區分中之1個區分且為前述位置資訊所示之位置所屬之區分;並根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新。
依此,可展現與上述圖像編碼方法及上述圖像解碼方法同樣之效果。
以下一邊參考附圖,一邊說明本發明之實施形態。此外,以下說明之實施形態每一者是顯示本發明之較佳的一具體例。即,在以下實施形態所示之數值、形狀、材料、構成要素、構成要素之配置及連接形態、步驟、步驟的順序等只是本發明之一例,不是限定本發明之主旨。本發明係根據申請專利範圍之記載所界定者。因此,在以下實施形態中之構成要素之中未記載於顯示本發明的最上位概念之獨立項之構成要素對於為達成本發明課題是未必必要,但當作為構成更佳之形態之構成要素予以說明。
(實施形態1)
針對本發明實施形態1之圖像編碼方法之概要予以說明。在本實施形態之圖像編碼方法中,使用依區分各所設定之上下文進行算術編碼,前述區分係根據頻率成分而適當地分割處理單位而所得到者。藉此,在對各區分所含之係數進行算術編碼之際,可使用根據共通之統計資訊之符號產生機率進行算術編碼,可提昇編碼效率。進而,藉以區分所含之係數利用共通之上下文,比起利用按係數各有所不同之上下文之情況,更能減少上下文之數量。因此,可減少安裝時之記憶體尺寸。
此外,處理單位係指在空間區域或頻率區域中將圖像分割而所得到之區塊。依各該處理單位進行與編碼有關之處理。例如,處理單位為變換單位(TU:Transform Unit)。此外,以下亦可將處理單位之事項表現為大型區塊之情況,但處理單位無須限制在大型區塊。
以上為針對本實施形態之算術編碼方法之概要之說明。
其次,針對進行本實施形態之算術編碼方法之算術編碼部之構成予以說明。第3圖係顯示本發明實施形態1之算術編碼部100之一構成例之方塊圖。此外,如後述所示,本實施形態1之算術編碼部100係相當於將圖像資料進行壓縮編碼之圖像編碼裝置之一部分。
如第3圖所示,算術編碼部100包含有:2進制處理部101、符號產生機率儲存部102、上下文控制部103、2進制算術編碼器104及上下文區分控制部105。
算術編碼部100係將作為編碼對象訊號之輸入訊號SI進行算術編碼,而產生輸出訊號OB予以輸出。又,在算術編碼部100輸入有顯示輸入訊號SI之類別之訊號類別資訊SE。在輸入訊號SI為與量化係數有關聯之訊號時,訊號類別資訊SE含有顯示係數位置之資訊。
此外,輸入訊號SI係圖像資料之編碼對象訊號,例如是顯示將圖像資料變換及量化所產生之量化係數之訊號。即,輸入訊號SI係顯示將圖像資料進行頻率變換而所產生之頻率區域之處理單位之訊號。又,輸入訊號SI亦可為顯示為產生量化係數而所使用之資訊之訊號,而非量化係數。
又,訊號類別資訊SE係顯示作為編碼對象訊號之輸入訊號SI之類別。輸入訊號SI之類別例如是顯示編碼對象訊號之性質或特徵之資訊。例如在適用在輸入訊號SI之預測方法為內預測時,訊號類別資訊SE亦可含有顯示內預測之預測方向之資訊。
或,訊號類別資訊SE係於輸入訊號SI顯示大型區塊所含之多數量化係數中之1個量化係數時,亦可含有顯示該量化係數之大型區塊內之位置(係數位置)之位置資訊。進而,訊號類別資訊SE係於輸入訊號S1為與處理單位所含之多數量化係數中之1個量化係數有關之資訊時,亦可含有顯示該量化係數之周圍之量化係數為零或非零之資訊時。更具體地說,訊號類別資訊SE係於輸入訊號為顯示大型區塊所含之多數量化係數中之1個量化係數時,亦可含有該大型區塊之直流成分之量化係數為零或非零之資訊。
惟,在下面的說明中,是以輸入訊號S1為掃描順序上位於最後之非零係數之位置之訊號之形態為主進行說明。在本實施形態中,在掃描順序上位於最後的非零係數之位置之訊號係指在以某特定順序掃描多數量化係數而所得到之1個量化係數為非零係數時,顯示該非零係數是否為顯示掃描順序上位於最後的非零係數之訊號。
2進制處理部101係將編碼對象訊號進行2進制處理,產生2進制訊號。具體來說,2進制處理部101係根據輸入訊號SI與訊號類別資訊SE,進行輸入訊號之2進制處理(Binarization),而產生2進制訊號BIN。更具體來說,2進制處理部101係藉將輸入訊號SI所示之頻率區域之處理單位所含之係數進行2進制處理,而產生2進制訊號。
符號產生機率儲存部102係固持多數符號發生機率之記憶體等。例如符號發生機率儲存部102係固持符號發生機率表。符號發生機率表係將上下文與機率資訊附與對應關係之表格。符號發生機率表容後詳述。
又,符號發生機率儲存部102係固持上下文表。上下文表係將編碼對象訊號之類別與上下文附與對應關係之表。上下文表容後詳述。
上下文控制部103係根據編碼對象訊號之類別來決定上下文。具體來說,上下文控制部103首先取得訊號類別資訊SE,並由上下文區分控制部105取得控制訊號STRS。接著上下文控制部103係根據所取得之訊號類別資訊SE及控制訊號CTRS,且參考上下文表,而決定編碼對象訊號用之上下文。
此時,上下文控制部103係根據藉控制訊號CTRS所指定之區分,決定上下文。在此,在1個區分含有多數係數時,上下文控制部103係決定其等多數係數共通之上下文。即,上下文控制部103係決定相對於控制訊號CTRS所示之區分所含之多數係數共通之上下文,作為2進制訊號用之上下文。此外,上下文控制部103亦可固持上下文表。在此,針對上下文區分控制部105之動作容後說明。
進而,上下文控制部103係決定與所決定之上下文對應之編碼機率資訊。即,上下文控制部103係參考符號發生機率表,決定使用符號發生機率儲存部102所儲存之多數符號發生機率中之哪一符號發生機率。
編碼機率資訊係2進制訊號之算術編碼處理上所使用之機率資訊。此外,編碼機率資訊例如為顯示符號發生機率之值之索引,或者是顯示符號發生機率之值。此外,在下面亦有單純將編碼機率資訊稱為機率資訊的時候。
如此,與藉上下文控制部103所決定之上下文對應之符號發生機率係由符號發生機率儲存部102而輸出至2進制算術編碼器104。
2進制算術編碼器104係使用編碼機率資訊,將2進制訊號進行算術編碼。具體來說,2進制算術編碼器104係使用符號發生機率儲存部102所輸出之符號發生機率PE,進行2進制處理部101所產生之2進制訊號之算術編碼。
以上是針對本實施形態之算術編碼部100之構成的說明。
在此,針對符號發生機率儲存部102所固持之符號發生機率表予以說明。第4圖係顯示本發明實施形態1之符號發生機率表之一例之圖。
符號發生機率表係將上下文與符號發生機率附與對應關係之表。第4圖中之索引(ctxIdx)係表示上下文之索引,具體來說是編碼中之大型區塊之周邊的資訊,或者是區塊內已編碼完畢之資訊,或者是因應編碼之位元位置所決定之索引。
各索引所示之登錄係含有顯示符號發生機率之機率資訊(pStateIdx)及顯示發生機率高之符號(Most Probable Symbol)之符號(valMPS)。這些是與H.264規格所示者同等。即,pStateIdx係顯示符號發生機率之值之索引。索引發生機率儲存部102更固持顯示與索引(pStateIdx)對應之符號發生機率之值之表。
此外,在此,符號發生機率係藉顯示符號發生機率之索引(pStateIdx)與上下文(ctxIdx)對應之表來管理,但亦可將上下文與符號發生機率之值直接對應來管理者。此時,例如藉以16位元精度(0-65535)表示符號發生機率之值,比起利用上述表來管理來說,更能處理詳細的值。為此,可提昇編碼效率。在下面說明將符號發生機率作為值來管理之方法。
其次,針對符號發生儲存部102所固持之上下文表進行說明。第5圖係顯示本發明實施形態1之上下文表之一例之圖。
上下文表係將多數類別、上下文與區分相對應之表。輸入訊號SI係與量化係數有關聯之訊號,在訊號類別資訊SE含有係數位置資訊時,上下文區分控制部105係選擇對應於編碼對象訊號之類別,即如第5圖所示之上下文表。
在第5圖所示之上下文表中,訊號類別資訊SE之號碼係對應於掃描順序。即,訊號類別資訊SE之號碼,即號碼0表示低頻率成分之直流成分(DC)之係數,隨著號碼愈大,則表示愈高頻率成分之係數。
又,對應於相同的上下文之係數(訊號類別資訊SE之號碼)之集合係相當於1個區分。即,在第5圖中,設定有相對於同一區分所含之全部的係數共通之上下文。
例如在第5圖(a)中,訊號類別資訊SE的號碼0~2係顯示為第1區分所含之係數者。進而,設定上下文索引“0”之上下文,作為相對於第1區分所含之多數係數共通之上下文。
在訊號類別資訊SE所示之係數位置超過某一定之位置時(包含在最高之頻率成分之區域時),如第5圖(b)所示,相對於超過一定位置之係數位置全部對應有相同上下文。
藉參考如第5圖所示之上下文表,上下文控制部103係決定含有業經2進制處理之係數之區分所含之多數係數共通之上下文,作為用以將2進制訊號進行算術編碼之上下文。
其次,依照第6圖所示之流程,說明第3圖所示之算術編碼部100所進行之算術編碼方法。第6圖係顯示本發明實施形態1之算術編碼方法之一例之流程圖。又,第6圖係顯示著編碼對象訊號係對應於1個區塊之量化係數群,且將對應於1個區塊之量化係數群之中係數為零或非零之資訊進行編碼時之算術編碼。
如第6圖所示,在本實施形態之算術編碼方法中,首先,2進制處理部101係進行符合成為編碼對象之輸入訊號SI之量化係數群之2進制處理(S101)。具體而言,2進制處理部101係藉事先設定之掃描順序讀出量化係數。此時,2進制處理部101係藉使量化係數是否為非零係數(不是0之係數)表現為“0”或“1”,進行2進制處理。具體來說,2進制處理部101係產生顯示該量化係數是否為非零係數之訊號,作為2進制訊號。在此所產生之2進制訊號被稱為有效旗標(Significant Flag)。
在此,在量化係數為非零係數時,2進制處理部101係藉以前述之掃描順序而將該非零係數之後是否還是非零係數表現為“0”或“1”,產生2進制訊號。將在此所產生之2進制訊號稱為最後旗標(Last Flag)。該最後旗標(Last Flag)係顯示在掃描順序上位於最後之非零係數之位置之資訊。產生如此之2進制訊號,就沒必要將在掃描順序上位於最後之非零係數之後被掃描之零係數之有效旗標(Significant Flag)進行編碼,因此可減少資訊量。
其次,算術編碼部100係對於成為2進制訊號之一之有效旗標(Significant Flag),實施算術編碼(S102)。此外,針對算術編碼,例如亦可為與H.264相同之方法。其次,在編碼對象之係數為零係數時(在S103中,否(NO)),算術編碼部100係進行對下一有效旗標(Significant Flag)之處理。另一方面,在編碼對象之係數為非零係數時(在S103中,是(YES)),算術符号化部100係對於顯示該非零係數是否為在掃描順序上位於最後之非零係數之最後旗標(Last Flag),實施算術編碼(S104)。此外,針對算術編碼,容後詳述之。其次,算術編碼部100係實施對於非零係數之係數值(係數等級)之資訊之編碼(S105)。在此,對於非零係數之係數等級之編碼(具體來說2進制處理、算術編碼)之方法,例如為與H.264相同之方法。
在此,在編碼對象之係數不是掃描順序上位於最後的非零係數時(在S106中,否(NO)),算術編碼部100係進行對下一有效旗標(Significant Flag)之處理。另一方面,在編碼對象之係數為掃描順序上位於最後之非零係數時(在S106中,是(YES)),結束對1個區塊之處理。
第7圖係顯示本發明實施形態1之算術編碼方法之一例之流程。例如,對應於第6圖所示之算術編碼步驟(第6圖之S102、S104)。上下文區分控制部105首先取得含有位置資訊之訊號類別資訊SE(S201)。
其次,上下文區分控制部105係根據所取得之位置資訊,決定編碼對象訊號用之區分,且將顯示所決定之區分之控制訊號CTRS輸出至上下文控制部103。上下文控制部103係參照與編碼對象訊號之類別有關聯之上下文表,決定與由上下文區分控制部105所得到之控制訊號CTRS所示之區分對應之上下文,作為與輸入訊號SI對應之上下文(S202)。即,上下文控制部,103係由符號發生機率儲存部102所儲存之多數上下文之中,選擇將輸入訊號SI進行算術編碼用之上下文。此外,針對上下文區分控制部105之動作容後詳述。
其次,符號發生機率儲存部102係將與藉上下文控制部103所決定之上下文對應之符號發生機率讀出,且將用在算術編碼之符號發生機率予以輸出者。
2進制算術編碼器104係使用編碼機率資訊,將2進制訊號進行算術編碼(S203)。具體來說,2進制算術編碼器104係使用由符號發生機率儲存部102所輸出之符號發生機率,藉H.264規格所示之方法,進行由2進制處理部101所取得之2進制訊號之算術編碼。
上下文控制部103係根據藉2進制處理部101所產生之2進制訊號,而將機率資訊更新(S204)。具體來說,上下文控制部103係因應由2進制處理部101所取得之2進制訊號,而將符號發生機率儲存部102所儲存之符號發生機率且對應於所決定之上下文之符號發生機率更新。此外,更新係藉例如H.264規格所示之方法所進行者。
其次,利用第8圖及9A~9C圖說明上下文區分控制部105之動作(對應於第7圖之步驟S201~S202)。第8圖係顯示本發明實施形態1之上下文區分控制部之動作之一例之流程圖。第9A~9C圖係用以說明本發明實施形態1之上下文區分控制部之動作之模式圖。
上下文區分控制部105,例如在將前述之最後旗標(Last Flag)進行編碼時如下動作。
上下文區分控制部105係取得作為編碼對象之最後旗標(Last Flag)之係數位置資訊(S301)。接著,上下文區分控制部105,如以下之步驟S302~S308所示,根據由最後旗標(Last Flag)之係數位置資訊可取得之頻率成分,決定區分。
量化係數係指使圖像訊號頻率變換且量化後之訊號。因此,係數位置係對應於在頻率變換時之頻率成分。例如,與低頻成分對應之量化係數係位於左上方,與高頻成分對應之量化係數係位於右下方。
多數量化係數係如前述,依特定之掃描順序予以讀出者。在此,掃描順序亦可為被稱為鋸齒形(zigzag)掃描之方法,即,諸如與H.264相同,按序由右上方向而往左下方向讀出區塊,且在區塊之端改變讀出之方向者。
其次,在編碼對象之最後旗標(Last Flag)包含在比事先設定之頻率成分F0低之頻率成分之區域時(在S302中,是(YES)),上下文區分控制部105係決定第1區分,作為編碼對象之最後旗標(Last Flag)之區分(S303)。另一方面,在編碼對象之最後旗標(Last Flag)為包含在比頻率成分F0高之頻率成分之區域時(在S302中,否(NO)),上下文區分控制部105係進行與編碼對象之最後旗標(Last Flag)對應之頻率成分與比頻率成分F0更高之頻率成分F1之比較(S304)。
在此,在編碼對象之最後旗標(Last Flag)包含在比頻率成分F1低之頻率成分之區域時(在S304中,是(YES)),上下文區分控制部105係決定第2區分,作為編碼對象之最後旗標(Last Flag)之區分(S305)。另一方面,在編碼對象之最後旗標(Last Flag)包含在比頻率成分F1更高之頻率成分之區域時(在S304中,否(NO)),上下文區分控制部105係進行與編碼對象之最後旗標(Last Flag)對應之頻率成分與比頻率成分F1更高之頻率成分F2之比較(S306)。
在此,在編碼對象之最後旗標(Last Flag)包含在比頻率成分F2更低之頻率成分之區域時(在S306中,是(YES)),上下文區分控制部105係決定第3成分,作為編碼對象之最後旗標(Last Flag)之區分(S307)。另一方面,在編碼對象之最後旗標(Last Flag)包含在比頻率成分F2更高之頻率成分之區域時(在S306中,否(NO)),上下文區分控制部105係決定第4成分,作為編碼對象之最後旗標(Last Flag)之區分(S308)。顯示如此所決定之區分之資訊係決定第3成分,作為編碼對象之最後旗標(Last Flag)之區分(S307)作為控制訊號CTRS而對於上下文控制部103予以輸出。
此外,含有直流成分之低頻成分是一種最容易顯現圖像之特徵之訊號。進而,在含有直流成分之低頻成分存在有有效旗標(Significant Flag)及最後旗標(Last Flag)以作為2進制訊號之頻率(次數)很高。因此,含有直流成分之低頻成分是容易取得統計資訊之頻率成分。為此,與位於高頻成分之區域之區分相比,更將位於低頻成分之區域之區分縮小,就能實現使用更配合圖像特徵之統計資訊之算術編碼,可將編碼效率提昇。
利用第9A圖~9C圖進一步詳細說明之。第9A圖係相對於區塊而所設定之區分之模式圖。又,第9B圖係顯示相對於8×8區塊之係數之區分之設定例之圖。又,第9C圖係顯示相對於4×4區塊之係數之區分之設定例之圖。圖中之F0、F1、F2各顯示為第8圖之步驟S302、S304、及S306中之比較值。
第9A圖所示之正方形係顯示成為處理單位之區塊。在區塊內配置有由左上方往右下方頻率成分變高之狀態之係數。在此,各決定有頻率成分F0、F1、F2。
接著,對於比頻率成分F0小之頻率成分之區分,設定有第1區分。又,對於以頻率成分F0與頻率成分F1所包圍之區域,設定有第2區分。又,對於以頻率成分F1與頻率成分F2所包圍之區域,設定有第3區分。又,對於頻率成分F2更高頻率成分之區域,設定有適於高頻成分之第4區分。
如此,多數區分所含之某一個區分(例如第1區分)係比位於比該區分高頻之區域之區分(例如第2區分、第3區分或第4區分)小。具體來說,第2區分、第3區分或第4區分遠比第1區分所含之係數的數量更多。
上下文區分控制部105係於最後旗標(Last Flag)之編碼時,藉判斷與最後旗標(Last Flag)對應之係數是包含在哪一區分,即可決定最後旗標(Last Flag)之區分。
此外,如第9A圖所示,與低頻成分對應之區分係區隔地比與高頻區域對應之區分小。這是因為對於低頻區分,量化係數成為非零之情況較多,所以像這樣設定區分,因此可以適當的均衡性利用統計資訊,所以能提高編碼效率。
第9B圖係顯示具體上對於8×8尺寸之區塊適應如第9A圖之區分之形態之一例。此時,對於左上方之3個係數是設定有第1區分,對於F0與F1包圍之區域之係數是設定有第2區分,對於F1與F2所包圍之區域之係數是設定有第3區分,最後對於比F2高區域之係數是設定有第4區分。此外,對於8×8以上之區塊亦同樣設定有區分。
另一方面,第9C圖係顯示對於4×4尺寸之區塊適應如第9A圖之區分之形態之一例。此時亦與第9B圖之形態同樣,第1區分所含之係數成為只有與直流成分(DC)對應之係數。
此外,在此所示之區分是一例,如果位於低頻區分之區分較小、位於高頻區分之區分較大時,區分數、區分位置就不限於此。例如,位於最低頻率之區分之區分亦可為含有只有1個係數之區分。又,例如區分數亦可為2個。
此外,在此之區分資訊(例如頻率成分F0、F1、F2或顯示區分數之資訊)亦可記錄在位元流之前頭(串流標頭)。如此將區分資訊記錄在串流標頭,就可藉圖像之特徵改變區分,進一步能期待編碼效率提昇。
此外,區分資訊,亦可以切片或與圖片對應之單位予以記錄,而非串流單位。此時,與以串流單位記錄之形態相比,可能更細微地控制區分,因此能期待更進一步的編碼效率之提昇。
此外,本發明實施形態1之算術編碼部100設置於將圖像資料進行壓縮編碼之圖像編碼裝置。第10圖係顯示本發明實施形態1之圖像編碼裝置200之一構成例之方塊圖。
圖像編碼裝置200係將圖像資料進行壓縮編碼。例如在圖像編碼裝置200係按每一區塊輸入有圖像資料,作為輸入訊號。圖像編碼裝置200係對所輸入之輸入訊號進行變換、量化及可變長度編碼,而產生編碼訊號。
如第10圖所示,圖像編碼裝置200包含有減法器205、變換量化部210、熵編碼部220、反量化反變換部230、加法器235、解塊濾波器240、記憶體250、內預測部260、動量偵測部270、動量補償部280、及內/間切換開關290。
減法器205係算出輸入訊號與預測訊號之差值,即,算出預測誤差。
變換量化部210係變換空間區分之預測誤差,而產生頻率區域之變換係數。例如,變換量化部210係對預測誤差進行離散餘弦變換(DCT,Discrete Cosine Transform),而產生變換係數。進而,變換量化部210係將變換係數量化,而產生量化係數。即,變換量化部210係將圖像資料頻率變換,而產生頻率區域之處理單位。在該處理單位內,因應頻率成分而配置有多數係數。
熵編碼部220係將量化係數進行可變長度編碼,而產生編碼訊號。又,熵編碼部220係將藉動量偵測部270所測出之動量資料(例如動量向量)進行編碼,包含在編碼訊號中予以輸出。
反量化反變換部230係將量化係數反量化,而將變換係數復原。進而,反量化反變換部230係將所復原之變換係數反變換,而將預測誤差復原。此外,所復原之預測誤差係藉量化而失去資訊,因此與減法器205所產生之預測誤差不一致。即,所復原之預測誤差包含有量化誤差。
加法器235係將所復原之預測誤差與預測訊號相加,而產生局部解碼圖像。
解塊濾波器240係對所產生之局部解碼圖像進行解塊濾波處理。
記憶體250係用以儲存動量補償所使用之參考圖像之記憶體。具體來說,記憶體250係儲存施有解塊濾波處理之局部解碼圖像。
內預測部260係進行內預測,而產生預測訊號(內預測訊號)。具體來說,內預測部260係參考藉加法器235所產生之局部解碼圖像中之編碼對象區塊(輸入訊號)周圍之圖像,進行內預測,而產生內預測訊號。
動量偵測部270係偵測輸入訊號與記憶體250所儲存之參考圖像之間之動量資料(例如動量向量)。
動量補償部280係根據所測出之動量資料,進行動量補償,而產生預測訊號(間預測訊號)。
內/間切換開關290係選擇內預測訊號及間預測訊號之其中一者,將所選擇之訊號作為預測訊號而輸出至減法器250及加法器235。
藉以上之構成,本發明實施形態1之圖像編碼裝置200係將圖像資料進行壓縮編碼。
此外,在第10圖中,本發明實施形態1之算術編碼部100係設置於熵編碼部220。即,算術編碼部100係將量化係數,作為輸入訊號SI,進行2進制處理及算術編碼。又,訊號類別資訊SE係顯示量化係數之係數位置、第10圖所示之動量資料、或使用內預測部260之內預測方向等之資訊。
如上,依本發明實施形態1之圖像編碼裝置及圖像編碼方法,決定相對於含有業經2進制處理之係數之區分所含之多數係數共通之1個以上之上下文,作為2進制訊號用之上下文。因此,能提高對應於上下文之機率資訊之更新次數,所以就容易使統計資訊反映在機率資訊。結果可提高機率資訊之預測精度,且可提昇編碼效率。進而,與決定按係數不同之上下文之形態相比,更可減少上下文之數量。因此,亦可將用以儲存與各上下文對應之機率資訊之記憶體之尺寸縮小。
又,依本發明實施形態1之圖像編碼裝置及圖像編碼方法,可縮小第1區分比位於比第1區分高頻之區域之第2區分小。因此,可因應與頻率成分相依之統計性質而設定區分,所以可抑制上下文之數量,且可提昇機率資訊之預測精度。結果可提昇編碼效率。
此外,在本實施形態中,將處理單位之尺寸為8×8或4×4時之算術編碼當作為一例而予以說明,在處理單位為其他尺寸(例如16×16或32×32)時,亦可與上述同樣進行算術編碼。處理單位之尺寸愈大,利用相對於區分所含有之多數係數共通之上下文而所得到之上下文數量之減少效果愈大。
又,在本實施形態中,最後旗標(Last Flag)係與有效旗標(Significant Flag)一起按非零係數所存在之係數位置而進行編碼,但未必要像這樣予以編碼。例如從掃描順序上位於最初之係數位置開始迄至位於最後之非零係數之係數位置間之全部的係數位置中之最後旗標(Last Flag)可匯集後再編碼,亦無妨。例如,在於掃描順序上位於第5個之係數為最後的非零係數時,2進制處理部101產生2進制符號列「00001」,作為1個2進制訊號,亦無妨。如此之形態下,2進制符號列中之位元位置係對應於係數位置。即,例如第1個的2進制符號係對應於直流成分之係數。
(實施形態1之變形例)
其次,針對上述實施形態1之變形例予以說明。在上述實施形態1中,主要是針對顯示掃描順序上位於最後之非零係數之位置之2進制訊號為最後旗標(Last Flag)時之算術編碼進行說明。惟,很清楚的是,本發明之圖像編碼方法亦可適用在最後旗標(Last Flag)以外之2進制訊號之算術編碼。
在此,在本變形例中,為確認,針對對於將掃描順序上位於最後之非零係數之位置以與最後旗標(Last Flag)不同之方法顯示之2進制訊號之算術編碼適用本發明之形態予以說明。具體來說,在本實施例中,針對以2維座標之座標值顯示掃描順序上位於最後之非零係數之位置之2進制訊號之算術編碼予以說明。
此外,本變形例之算術編碼部100之構成等係與實施形態1同樣,而適當地省略圖示及說明。
本變形例之2進制處理部101係於業經2進制處理之係數為掃描順序上位於最後之非零係數時,產生以2維座標之座標值顯示該係數之位置之訊號,作為2進制訊號。即,在本變形例中,掃描順序上位於最後之非零係數之位置是以2維座標(x,y)之座標值表示。
例如在掃描順序上位於最後之非零係數為直流成分之係數(左上方之係數)時,在掃描順序上位於最後之非零係數之位置是以(0,0)表示。如此之x及y之各座標值,例如第11A圖所示,進行2進制處理。
第11A圖係顯示本發明實施形態1之變形例之2進制處理之一例之圖。第11A圖係顯示有掃描順序上位於最後之非零係數之位置(最終位置)之x座標值或y座標值(成分之大小)對應之2進制訊號。此外,在本變形例中,當作為成為利用上下文將截斷一元碼(Truncated Unary,TU)進行算術編碼之對象之2進制訊號來處理。
第11A圖中,2進制處理部101係例如將座標值“0”進行2進制處理,產生2進制訊號“0”。又,2進制處理部101係例如將座標值“5”進行2進制處理,產生2進制訊號“11110“。
此外,在第11A圖中,在括弧內所載之2進制符號顯示未必要包含在2進制訊號之2進制符號。即,以尺寸為8×8之處理單位中,2進制訊號“11111”係顯示座標值為“6”或“7”者。
其次,針對如此所產生之2進制訊號用之上下文之決定方法予以說明。
本變形例之上下文控制部103係與上述實施形態1同樣,決定相對於含有業經2進制處理之係數之區分所含之多數係數共通之至少1個之上下文,作為2進制訊號用之上下文。
在此,使用第11B圖及第11C圖說明上下文決定方法之具體例。
第11B圖係顯示2進制訊號所含之2進制符號之位元位置(binIdx)與上下文索引(cntIdx)之對應關係之一例。在第11B圖中,例如位元位置為第1個(binIdx=0)之2進制符號用之上下文,是決定上下文索引“0”(cntIdx=0)。
此外,如上述,在尺寸為8×8之處理單位中位元位置為第5個(binIdx=0)之2進制符號亦可不包括在2進制訊號。在如此情況下,對應於上下文索引“2”(cntIdx=2)之位元位置(binIdx=2、3)之數量變得比上下文索引“3”(cntIdx=3)之位元位置(binIdx=4)之數量多。
第11C圖係用以說明尺寸為8×8之處理單位中之上下文之決定方法之一例之圖。具體而言,第11C圖係模式地表示依照第11A圖及第11B圖所決定之上下文之圖。
在第11C圖中,以實線所包圍之區域表示區分。又,記載於各區分內之符號是表示顯示x座標值之2進制訊號用之上下文索引(上段)及顯示y座標值之2進制訊號用之上下文索引(下段)之符號。
例如對於顯示係數位置(5,2)之2進制訊號用之上下文,是決定有上下文索引“0”、“1”、“2”及“3”所示之上下文組合及上下文索引“0”、“1”及“2”所示之上下文組合。
在此,更具體說明用以將x座標值“5”進行編碼之上下文之決定方法。依第11A圖,顯示x座標值“5”之2進制訊號為“11110”。在此,依照第11B圖,對於2進制訊號之第1~3位元之“1”,各決定為上下文索引“0”、“1”、“2”之上下文。又,對於2進制訊號之第4及5位元之“10”是決定有上下文索引“3”之上下文。即,如第11C圖所示,對於用以將x座標值“5”進行編碼之上下文,是決定上下文索引“0”、“1”、“2”及“3”所示之上下文之組合。
如此在本變形例中,多數區分所含之某一個區分(例如位於最低頻之區域之區分)係比位於該區分高頻之區域之區分(例如位於最高頻之區域之區分)小。
如上,對於以2維座標顯示掃描順序上位於最後之非零係數之位置之2進制訊號,亦可適用本發明。接著,在將以2維座標之座標值顯示掃描順序上位於最後之非零係數之位置之2進制訊號進行算術編碼時,亦可展現與上述實施形態1同樣之效果。
此外,位於較大值之位元位置(binIdx)之2進制符號亦可不使用上下文來編碼。例如,位元位置(binIdx)大於預定值之2進制符號亦可使用固定的符號發生機率(例如50%等)進行旁路編碼者。
此外,在本變形例中,針對成為使用上下文進行算術編碼之對象之2進制訊號為截斷一元碼(Truncated Unary,TU)之形態予以說明,但2進制訊號不限於此。例如對於座標值是準備有事先設定之2進制符號列之情況,亦可與上述同樣決定該2進制符號列之位元位置(binIdx)與上下文索引(cntIdx)之對應關係,可展現與上述同樣之效果。
以上是根據實施形態及其變形例說明了本發明一態樣之圖像編碼裝置及圖像編碼方法,但本發明並不限於其等實施形態者。只要不脫離本發明旨趣,熟知此項技藝之人士可思及之各種變形施行在本實施形態之形態亦涵蓋在本發明範圍內。
例如在上述實施形態1及其變形例中,算術編碼部100包含有上下文區分控制部105,但未必要具備上下文區分控制部105。在如此情況下,例如只要上下文控制部103直接由係數之位置資訊決定上下文即可。具體來說,只要上下文控制部103參考如第5圖所示之上下文表,直接由係數位置決定上下文即可。
更具體來說,圖像編碼裝置亦可構成為如第12圖所示者。第12圖係顯示本發明一態樣之圖像編碼裝置500之一構成例之方塊圖。如第12圖所示,圖像編碼裝置500包含有變換部501、2進制處理部502、上下文控制部503及2進制算術編碼部504。
該圖像編碼裝置500係如第13圖所示,進行編碼處理。第13圖係顯示本發明一態樣之圖像編碼方法之一例之流程圖。
在第13圖中,變換部501係相當於變換量化部210。變換部501係藉將圖像資料頻率變換,而產生頻率區域之處理單位(S601)。2進制處理部502係藉將處理單位所含之係數進行2進制處理,而產生2進制處理(S602)。上下文控制部503係決定相對於含有分割處理單位而所得到之多數區分中之一個區分且為含有業經2進制處理之係數之區分所含之多數係數共通之1個以上之上下文,作為2進制訊號之上下文(S603)。2進制算術編碼部504係相當於2進制算術編碼器104。2進制算術編碼部504係依照與所決定之上下文對應之機率資訊,將2進制訊號進行算術編碼(S604)。上下文控制部503係根據2進制訊號,而將與所決定之上下文對應之機率資訊更新(S605)。
如此就算在已執行編碼處理之情況下,圖像編碼裝置500亦可決定相對於含有業經2進制處理之係數之區分所含之多數係數共通之上下文,作為2進制訊號用之上下文。因此,圖像編碼裝置500可提昇機率資訊之預測精度,且能提昇編碼效率。
(實施形態2)
其次,根對本發明實施形態2之算術解碼方法之概要予以說明。在本實施形態之圖像解碼方法中,將藉實施形態1之圖像編碼方法所編碼之編碼圖像資料進行解碼。即,將使用根據頻率成分而適當地將處理單位分割而所得到之區分分別設定之符號發生機率進行算術編碼之編碼圖像資料進行解碼。藉此,在將各區分所含之係數進行算術編碼時,可使用根據共通之統計資訊之符號發生機率進行算術編碼,可提昇編碼效率。即,在本實施形態之圖像解碼方法中,可將提昇了編碼效率之訊號進行解碼。
以上是針對本實施形態之算術解碼方法之概要之說明。
其次,針對進行本實施形態之算術解碼方法之算術解碼部之構成進行說明。第14圖係顯示本發明實施形態2之算術解碼部300之一構成例之方塊圖。此外,如後述,本發明實施形態2之算術解碼部300係相當於將業經壓縮編碼之編碼圖像資料進行解碼之圖像解碼裝置之一部分。
如第14圖所示,算術解碼部300包含有2進制算術解碼部301、符號發生機率儲存部302、上下文控制部303、多進制處理部304、及上下文區分控制部305。
算術解碼部300係將作為解碼對象訊號之輸入流IS進行算術解碼,而將圖像資料復原並予以輸出。又,在算術解碼部300係輸入有顯示輸入流IS之類別之訊號類別資訊SE。
輸入流IS係顯示編碼圖像資料之解碼對象訊號,例如顯示為將圖像資料進行壓縮編碼而所產生之量化係數之訊號。即,相當於將實施形態1之輸入訊號SI進行算術編碼而所產生之訊號。
訊號類別資訊SE係編碼圖像資料之解碼對象訊號之類別資訊之一例。具體來說,訊號類別資訊SE係顯示輸入流IS之類別之資訊。更具體來說,訊號類別資訊SE係與實施形態1之訊號類別資訊SE同樣之資訊。即,在輸入流IS為與變換係數有關聯之訊號(例如量化係數)時,訊號類別資訊SE包括顯示該變換係數之處理單位內之位置(係數位置)之位置資訊。
2進制算術解碼器301係使用解碼機率資訊,將解碼對象訊號進行算術解碼,而產生2進制訊號。具體來說,2進制算術解碼器301係使用符號發生機率儲存部302所輸出之符號發生機率PE,進行輸入流IS之算術解碼,而產生輸出2進制訊號OBIN。
符號發生機率儲存部302係固持多數符號發生機率之記憶體等。例如,符號發生機率儲存部302係固持符號發生機率表。符號發生機率表係使上下文與機率資訊對應之表。符號發生機率表,例如為第4圖所示之表。符號發生機率表之詳細內容係與實施形態1同樣。
又,符號發生機率儲存部302係固持上下文表。上下文表係使解碼對象訊號之類別與上下文對應之表,例如為第5圖所示之表。上下文表之詳細內容係與實施形態1同樣。
上下文控制部303係根據解碼對象訊號之類別而決定上下文。具體來說,上下文控制部303首先取得訊號類別資訊SE,並由上下文區分控制部305取得控制訊號CTRS。接著,上下文控制部303係根據表示所取得之輸入流IS之類別之訊號類別資訊SE及控制訊號CTRS參考上下文表,而決定解碼對象訊號用之上下文。
此時,上下文控制部303係根據藉控制訊號CTRS所指定之區分,而決定上下文。在此,在1個區分含有多數係數時,上下文控制部303係決定其等多數係數共通之上下文。即,上下文控制部303係決定相對於分割處理單位而所得到之多數區分中之1個區分且為位置資訊所示之位置所屬之區分所含之多數係數共通之上下文,作為解碼對象訊號用之上下文。此外,上下文控制部303亦可固持上下文表。在此,針對上下文區分控制部305之動作容後說明。
進而,上下文控制部303係決定與所決定之上下文對應之解碼機率資訊。即,上下文控制部303係參考符號發生機率表,決定使用符號發生機率儲存部302所儲存之多數符號發生機率中之哪一符號發生機率。解碼機率資訊係使用在業經算術編碼之2進制訊號之算術解碼之機率資訊。此外,解碼機率資訊例如為顯示符號發生機率之值之索引或顯示符號發生機率之值。此外,以下將解碼機率資訊亦單純稱為機率資訊。
如此與藉上下文控制部303所決定之上下文對應之符號發生機率係由符號發生機率儲存部302,而輸出至2進制算術解碼器301。此外,上下文控制部303之具體的動作係與實施形態1之上下文控制部103同樣。
多進制處理部304係將藉2進制算術解碼器301所產生之輸出2進制訊號OBIN多進制處理,來將圖像資料復原。此外,多進制處理之方式係根據訊號類別資訊SE而所決定。
以上是針對本實施形態之算術解碼部300之構成之說明。
其次依照第15圖及第16圖所示之流程說明第14圖所示之算術解碼部300進行之算術解碼方法。第15圖係顯示本發明實施形態2之算術解碼方法之一例之流程圖。又,第15圖係顯示解碼對象訊號為與1個區塊對應之量化係數群,且在將與1個區塊對應之量化係數群中係數為零或非零之資訊解碼時之算術解碼。
如第15圖所示,在本實施形態之算術解碼方法中,首先算術解碼部300係取得成為解碼對象之輸入流IS(S401)。具體來說,在輸入流IS有藉事先設定之掃描順序所掃描之量化係數已進行編碼。此時,輸入流IS中有將量化係數是否為非零係數(不是0之係數)以“0”或“1”表現之2進制訊號已進行編碼。將顯示該量化係數是否為非零係數之訊號稱為有效旗標(Significant Flag)。
在此,在量化係數為非零係數時,有對於前述掃描順序上在該非零係數以後還是否是非零係數以“0”或“1”表現之2進制訊號已進行編碼。在此,將該2進制訊號稱為最後旗標(Last Flag)。該最後旗標(Last Flag)係顯示在掃描順序上位於最後之非零係數之位置之資訊。針對將以如此方法編碼之訊號解碼之形態予以說明。
其次,算術解碼部300係對於有效旗標(Significant Flag)實際算術解碼(S402)。此外,針對算術解碼,亦可為諸如與H.264相同之方法。其次,若所解碼之訊號顯示為零係數時(在S403中否(NO)),算術解碼部300係進行對於下一個有效旗標(Significant Flag)之處理。另一方面,若解碼對象之係數顯示為非零係數時(在S403中是(YES)),算術解碼部300係對於顯示該非零係數是否為掃描順序上位於最後之非零係數之最後旗標(Last Flag)實施算術解碼(S404)。此外,針對算術解碼之詳細內容容後詳細說明。其次,算術解碼部300係實施對於非零係數之係數值(係數等級)之資訊之解碼(S405)。在此,針對對於非零係數之係數等級之解碼之方法,例如是與H.264相同之方法。
在此,在解碼對象之係數顯示為掃描順序上位於最後之非零係數時(在S406中,否(NO)),算術解碼部300係進行對於下一個有效旗標(Significant Flag)之處理。另一方面,在解碼對象之係數顯示為在掃描順序上位於最後之非零係數之時(在S406中是(YES)),將對於1個區塊之處理結束。
又,第16圖係顯示1個解碼對象訊號之算術解碼。例如1個解碼對象訊號係顯示前述之最後旗標(Last Flag)之1值。
如第16圖所示,在本實施形態之算術解碼方法中,上下文區分控制部305首先取得含有位置資訊之訊號類別資訊SE(S501)。
其次,上下文區分控制部305係根據所取得之位置資訊,決定係數包含在哪一區分,且將顯示所決定之區分之控制訊號CTRS予以輸出。上下文控制部303係決定與由上下文區分控制部305所得到之控制訊號CTRS所示之區分對應之上下文,作為與解碼對象訊號對應之上下文(S502)。即,上下文控制部303係由符號發生機率儲存部302所儲存之多數上下文之中,選擇用以將解碼對象訊號算術解碼之上下文。
其次,符號發生機率儲存部302係讀出與藉上下文控制部303所決定之上下文對應之符號發生機率,將使用在算術解碼之符號發生機率予以輸出。
2進制算術解碼器301係使用解碼機率資訊而將解碼對象訊號算術解碼,而產生輸出2進制訊號OBIN(S503)。具體來說,2進制算術解碼器301係使用由符號發生機率儲存部302所輸出之符號發生機率,藉H.264規格所示之方法進行解碼對象訊號之算術解碼。
此外,上下文區分控制部305、上下文控制部303之動作的詳細內容係與實施形態1之編碼時之上下文控制同樣進行。
上下文控制部303係根據輸出2進制訊號OBIN,而將機率資訊更新(S504)。具體來說,上下文控制部303係因應藉2進制算術解碼器301所產生之輸出2進制訊號OBIN,將符號發生機率儲存部302所儲存之符號發生機率且與所決定之上下文對應之符號發生機率更新。針對更新之方法,與實施形態1同樣。
多進制處理部304係將輸出2進制訊號OBIN多進制處理,而將圖像資料復原。
藉採取上述方法,可將提昇了編碼效率之編碼訊號進行解碼者。
此外,本發明實施形態2之算術解碼部300係設置於將業經壓縮編碼之編碼圖像資料進行解碼之圖像解碼裝置。第17圖係顯示本發明實施形態2之圖像解碼裝置400之一構成例之方塊圖。
圖像解碼裝置400係將業經壓縮編碼之編碼圖像資料進行解碼。例如,圖像解碼裝置400係將編碼圖像資料作為解碼對象訊號而輸入至每一區塊。圖像解碼裝置400係對所輸入之解碼對象訊號進行可變長度解碼、反量化及反變換,而將圖像資料復原。
如第17圖所示,圖像解碼裝置400包含有:熵解碼部410、反量化反變換部420、加法部425、解塊濾波器430、記憶體440、內預測部450、動量補償部460、及內/間切換開關470。
熵解碼部410係將輸入訊號(輸入流)可變長度解碼,而將量化係數復原。此外,在此,輸入訊號(輸入流)為解碼對象訊號,相當於編碼圖像資料之每一區塊之資料。又,熵解碼部410係由輸入訊號取得動量資料,且將所取得之動量資料輸出至動量補償部460。
反量化反變換部420係將藉熵解碼部410所復原之量化係數反量化,而將變換係數復原。接著,反量化反變換部420係將所復原之變換係數反變換,而將預測誤差復原。
加法器425係將所復原之預測誤差與預測訊號相加,而產生解碼圖像。
解塊濾波器430係對所產生之解碼圖像進行解塊濾波處理。業將解塊濾波處理之解碼圖像係作為而予以輸出。
記憶體440係用以儲存動量補償所使用之參考圖像之記憶體。具體來說,記憶體440係儲存施有解塊濾波處理之解碼圖像。
內預測部450係進行內預測,而產生預測訊號(內預測訊號)。具體來說,內預測部450係參考藉加法器425所產生之解碼圖像中之解碼對象區塊(輸入訊號)周圍的圖像,進行內預測,而產生內預測訊號。
動量補償部460係根據由熵解碼部410所輸出之動量資料,進行動量補償,而產生預測訊號(間預測訊號)。
內/間切換開關470係選擇內預測訊號及間預測訊號之其中一者,且將所選擇之訊號作為預測訊號而輸出至加法器425。
藉以上之構成,本發明實施形態2之圖像解碼裝置400係將業經壓縮編碼之編碼圖像資料進行解碼。
此外,在第17圖中,本發明實施形態2之算術解碼部300係設置於熵解碼部410。即,算術解碼部300係將作為輸入流IS之已執行預測編碼之編碼圖像資料進行算術解碼及多進制解碼。又,訊號類別資訊SE係顯示量化係數之位置、動量資料、或內預測部450所使用之內預測方向等之資訊。
此外,在區分資訊(例如頻率成分F0、F1、F2或顯示區分數之資訊)係記錄於位元流之前頭(串流標頭)時,上下文區分控制部105或上下文控制部103亦可依照該所記錄之區分資訊而設定區分者。藉此,圖像解碼裝置400可將進一步提昇編碼效率之編碼流進行解碼。
此外,在不是串流單位,而是在切片或與圖片對應之單位記錄區分資訊,圖像解碼裝置400亦可與上述同樣進行解碼。
如上,依本發明實施形態2之圖像解碼裝置及圖像解碼方法,可決定相對於位置資訊所示之位置所屬之區分所含之多數係數共通之1個以上之上下文,作為解碼對象訊號用之上下文。因此,可讓與上下文對應之機率資訊之更新次數提高,因此容易將統計資訊反映在機率資訊。結果可提高機率資訊之預測精度,可提昇編碼效果。藉此,可正確地將已提昇編碼效率之訊號進行解碼。
具體來說,依本發明實施形態2之圖像解碼裝置及圖像解碼方法,如實施形態1所示,可因應頻率成分,而根據取得統計上符號發生機率之平衡之區分來決定上下文。因此,可一邊減少上下文之數量,一邊使用反映有適當的統計資訊之機率資訊,提高編碼圖像資料之編碼效率。即,本發明實施形態2之圖像解碼裝置及圖像解碼方法可正確地將已提昇編碼效率之編碼圖像資料進行解碼。
以上,針對本發明一態樣之圖像解碼裝置及圖像解碼方法是根據實施形態及其變形例予以說明,但本發明並不限於其等實施形態者。只要不脫離本發明旨趣,熟悉此項技術之人可思及之各種變形施行在本實施形態之形態亦涵蓋於本發明之範圍內。
例如,與實施形態1之變形例同樣,明白本發明之圖像解碼方法亦可適用在最後旗標(Last Flag)以外之2進制訊號含有業經算術編碼之訊號之編碼流之解碼。即,在本實施形態中,解碼對象訊號係藉事先設定之掃描順序掃描處理單位所含之多數係數而所得到之係數為掃描順序上位於最後之非零係數時,亦可為以座標值顯示該係數之位置之訊號。
如此情況下,與實施形態1之變形例同樣,只要決定上下文即可。具體來說,例如第11A圖~第11C圖所示,只要決定上下文即可。此外,在如此情況下,位於較大值之位元位置(binIdx)之2進制符號已經編碼之訊號亦可不使用上下文來解碼。例如,使位元位置之值大於預定值之2進制符號已經編碼之訊號亦可使用固定之符號發生機率(例如50%等)進行旁路解碼。
此外,在本變形例中,針對成為使用上下文進行算術解碼之對象之訊號為將截斷一元碼進行算術編碼之訊號之形態進行了說明,但成為算術解碼之對象之訊號並不限於此。例如即使是在對於座標值而將事先設定之2進制符號列進行算術編碼之訊號算術解碼之情況時,藉將該2進制符號列之位元位置(binIdx)與上下文索引(cntIdx)之對應關係與上述同樣予以決定,亦能展現與上述同樣之效果。
又,在本實施形態中,算術解碼部300具備有上下文區分控制部305,但未必要具有上下文區分控制部305。在如此情況下,例如上下文控制部303只要由係數之位置資訊直接決定上下文即可。具體來說,上下文控制部303只要參考如第5圖所示之上下文表,由係數位置直接決定上下文即可。
更具體來說,圖像解碼裝置亦可構成為如第18圖所示者。第18圖係顯示本發明一態樣之圖像解碼裝置600之一構成例之方塊圖。如第18圖所示,圖像解碼裝置600包含有上下文控制部601、2進制算術解碼部602及多進制處理部603。
該圖像解碼裝置600係如第19圖所示,進行解碼處理。第19圖係顯示本發明一態樣之圖像解碼方法之一例之流程圖。
在第19圖中,上下文控制部601係於編碼圖像資料所含之解碼對象訊號顯示頻率區域之處理單位所含之係數時,取得顯示該係數之處理單位內之位置之位置資訊(S701)。上下文控制部601係決定相對於分割處理單位而所得到之多數區分中之1個區分且為位置資訊所示之位置所屬之區分所含之多數係數共通之1個以上之上下文,作為解碼對象訊號用之上下文(S702)。2進制算術解碼部602係相當於2進制算術解碼器301。2進制算術解碼器602係依照與所決定之上下文對應之機率資訊,將解碼對象訊號算術解碼,而產生2進制訊號(S703)。多進制處理部603係將2進制訊號多進制處理(S704)。上下文控制部601係根據2進制訊號,而將與所決定之上下文對應之機率資訊更新(S705)。
在如此進行了解碼處理的時候,圖像解碼裝置600亦可決定相對於位置資訊所示之位置所屬之區分所含之多數係數共通之1個以上之上下文,作為解碼對象訊號用之上下文。結果圖像解碼裝置600可將機率資訊之預測精度提高,可將以高編碼效率進行編碼之編碼圖像資料進行解碼者。
此外,在上述實施形態1及其變形例、與實施形態2中,第1區分係比位於第1區分高頻之區域之第2區分小,但第1區分未必要小於第2區分。例如第1區分亦可為與第2區分相同大小者。又,例如第1區分亦可大於第2區分。在如此情況時,使用相對於各區分所含之多數係數共通之上下文進行編碼,因此可提高機率資訊之預測精度,且可將記憶體之尺寸縮小。
(實施形態3)
藉將用以實現上述各實施形態所示之動畫圖像編碼方法(圖像編碼方法)或動畫圖像解碼方法(圖像解碼方法)之構成之程式記錄在記憶媒體,就可在獨立的電腦系統上簡單實施上述各實施形態所示之處理。記憶媒體只要是磁碟、光碟、光學磁碟、IC卡、半導體記憶體等可記錄程式者即可。
進而在此,說明上述各實施形態所示之動畫圖像編碼方法(圖像編碼方法)或動畫圖像解碼方法(圖像解碼方法)之應用例與使用該應用例之系統。該系統係以具有使用圖像編碼方法之圖像編碼裝置、及使用圖像解碼方法之圖像解碼裝置所構成之圖像編碼解碼裝置者為特徵所在。針對系統中之其他構成,能因應情況而做適當的變更。
第20圖係顯示實現內容發送服務之內容供給系統ex100之整體構成圖。將通訊服務之提供領域分割成所期望之大小,在各胞元內各設置有為固定無線台之基地台ex106、ex107、ex108、ex109、ex110。
該內容供給系統ex100係於網際網路ex101,由網際網路服務提供者ex102及電話線路ex104、及經由基地台ex106至ex110,而連接有電腦ex111、PDA(Personal Digital Assistant)ex112、相機ex113、行動電話機ex114、遊戲機ex115等各種機器。
惟,內容供給系統ex100不限定於如第20圖之構成,亦可連接組合任一種要素構成者。又,亦可使各機器直接連接於電話線路ex104,而不經過固定無線台之基地台ex106至ex110連接者。又,各機器亦可經由近距離無線等而直接相連接者。
相機ex113係數位錄放影機等可進行動畫攝影之機器,相機ex116係數位相機等可進行靜態圖像攝影、動畫攝影之機器。又,行動電話機ex114諸如為GSM(註冊商標)(Global System for Mobile Communications)方式、CDMA(Code Division Multiple Access)方式、W-CDMA(Wideband-Code Division Multiple Access)方式或者是LTE(Long Term Evolution)方式、HSPA(High Speed Packet Access)之行動電話機、或PHS(Personal Handyphone System)等,不管那一個都無妨。
在內容供給系統ex100上,相機ex113等透過基地台ex109、電話線路ex104而連接於串流伺服器ex103,即可實現即時發送等者。在即時發送上,對於用戶利用相機ex113所攝影之內容(例如音樂演唱會之影像等),如上述各實施形態中所說明的,進行編碼處理(即,作為本發明之圖像編碼裝置而發揮功能),且傳送至串流伺服器ex103。另一方面,串流伺服器ex103係將對有要求之客戶而所傳送之內容資料進行串流發送。對於客戶,有諸如可將業經上述編碼處理之資料解碼之電腦ex111、PDAex112、相機ex113、行動電話機ex114、遊戲機機ex115等。在接收有所發送之資料之各機器中,將所接收之資料解碼處理後予以再生(即,作為本發明之圖像解碼裝置而發揮功能者)。
此外,所攝影之資料之編碼處理可以相機ex113進行,亦可在進行資料之傳送處理之串流伺服器ex103進行,亦可相互分擔進行。同樣,對於所發送之資料之解碼處理可在客戶端進行,亦可在串流伺服器ex103進行,亦可相互分擔進行。又,不限於要使用相機ex113,亦可將以相機ex116所攝影之靜態圖像及/或動畫圖像資料經由電腦ex111而傳送至串流伺服器ex103。此時之編碼處理可在相機ex116、電腦ex111、串流伺服器ex103任一者進行,亦可相互分擔進行。
又,其等編碼解碼處理一般是在電腦ex111或各機器所具有之LSIex500中進行處理。LSIex500可為單一晶片,亦可為由多數晶片所構成之構造。此外,亦可將動畫圖像編碼解碼用之軟體內建於電腦ex111等可讀取之任一記錄媒體(CD-ROM、可撓性磁片、硬碟等),且使用該軟體進行編碼解碼處理。進而,在行動電話機ex114為附有相機時,亦可將以該相機所取得之動畫資料傳送者。此時之動畫資料係以行動電話機ex114所具有之LSIex500編碼處理之資料。
又,串流伺服器ex103亦可為多數伺服器護多數電腦,且為將資料分散處理、記錄、發送者。
按如上執行,在內容供給系統ex100中,可讓客戶接收業已編碼之資料後進行再生者。如此,在內容供給系統ex100中,客戶可實時接收用戶所傳送之資訊再予以解碼並再生,就算沒有特別的權利或設備之用戶,亦可實現個人廣播。
又,不限於內容供給系統ex100之例,如第21圖所示,在數位式廣播用系統ex200中亦可組裝上述各實施形態之至少動畫圖像編碼裝置(圖像編碼裝置)或動畫圖像解碼裝置(圖像解碼裝置)之任一者。具體來說,在廣播台ex201中,可透過電波而將在影像資料多工有音樂資料等之多工資料進行通訊或傳送至衛星ex202。該影像資料係指藉上述各實施形態所說明之動畫圖像編碼方法所編碼之資料(即,藉本 發明之圖像編碼裝置進行編碼之資料)。接收該資料之廣播衛星ex202係傳送廣播用之電波,讓可進行衛星廣播接收之家庭之天線ex204接收該電波。電視機(接收機)ex300或機上盒(STB)ex217等之裝置將所接收之多工資料解碼後再生(即,作為本發明之圖像解碼裝置而展現功能)。
又,讀取暨解碼記錄在DVD、BD等之記錄媒體ex215之多工資料、或將影像訊號編碼至記錄媒體ex215,進而依情況而多工有音樂訊號而寫入之讀取器(reader)/記錄器(recorder)ex218,亦可安裝上述各實施形態所示之動畫圖像解碼裝置或動畫圖像編碼裝置。此時,所再生之影像訊號顯示在監視器ex219,藉記錄有多工資料之記錄媒體ex215可在其他裝置或系統將影像訊號再生。又,在連接於電纜線電視機用之電纜線ex203或衛星/地上波廣播之天線ex204之機上盒ex217內亦可安裝動畫圖像解碼裝置,將此在電視機之監視器ex219顯示者。此時,亦可不在機上盒,而在電視機內安裝動畫圖像解碼裝置。
第22圖係顯示使用有上述各實施形態所說明之動畫圖像解碼方法及動畫圖像編碼方法之電視機(接收機)ex300之圖。電視機ex300包含有:調諧器ex301,係經由接收上述廣播之天線ex204或電纜線ex203等,而取得或輸出影像資料上多工有聲音資料之多工資料者;調變/解調部ex302,係將所接收之多工資料解調或將傳送至外部之多工資料調變;及多工/分離部ex303,係將具有已解調之多工資料分離成影像資料與聲音資料,或將以訊號處理部ex306所編碼之 影像資料、聲音資料多工者。
又,電視機ex300包含有:具有各將聲音資料、影像資料解碼或將各自的資訊編碼之聲音訊號處理部ex304、影像訊號處理部ex305(作為本發明之圖像編碼裝置或圖像解碼裝置發揮功能)之訊號處理部ex306、及具有將業經解碼之聲音訊號輸出之揚聲器ex307、顯示所解碼之影像訊號之顯示器等之顯示部ex308之輸出部ex309。進而,電視機ex300具有介面部ex317,該介面部ex317具有受理用戶操作之操作輸入部ex312等。進而,電視機ex300包含有統籌地控制各部之控制部ex310、供電至各部之電源電路部ex311。介面部ex317,除了操作輸入部ex312外,還有與讀取器/記錄器ex218等之外部機器連接之橋接器ex313、可裝設SD卡等之記錄媒體ex216用之插槽部ex314、與硬碟等之外部記錄媒體連接用之驅動器ex315、及與電話線路網連接之數據機ex316等。此外,記錄媒體ex216是可藉所儲存之非依電性(non-volatile)/依電性之半導體記憶體元件進行電性資訊記錄者。電視機ex300之各部係經由同步匯流排而相互連接。
首先,針對電視機ex300將藉天線ex204等而由外部取得之多工資料解碼並再生之構成予以說明。電視機ex300係接受來自遙控器ex220等之用戶操作,根據具有CPU等之控制部ex310之控制,在多工/分離部ex303將調變/解調部ex302所解調之多工資料分離。進而,電視機ex300係於聲音訊號處理部ex304將所分離之聲音資料解碼,且將所分離之影像資料在影像訊號處理部ex305使用在上述各實施形態所說明解碼方法予以解碼。已解碼之聲音訊號、影像訊號各由輸出部ex309而向外部輸出。又在輸出之時,為了使聲音訊號與影像訊號同步再生,只要先暫時將其等訊號儲存在緩衝器ex318、ex319等即可。又,電視機ex300,亦可不由廣播等,亦可由磁碟/光碟、SD卡等之記錄媒體ex215、ex216將多工資料讀出。其次,針對電視機ex300將聲音訊號或影像訊號進行編碼後傳送至外部或寫入至記錄媒體等之構成予以說明。電視機ex300係接受來自遙控器ex220等之用戶操作,根據控制部ex310之控制,在聲音訊號處理部ex304將聲音訊號進行編碼,在影像訊號處理部ex305,使用在上述各實施形態所說明之編碼方法進行編碼。業經編碼之聲音訊號、影像訊號係於多工/分離部ex303多工,而輸出至外部。在多工之時,為了使聲音訊號與影像訊號同步,只要先暫時將其等訊號儲存在緩衝器ex320、ex321等即可。此外,緩衝器ex318、ex319、ex320、ex321係如圖所示,可具有多數,亦可為共有一個以上之緩衝器之構成。進而,除圖示之外,例如調變/解調部ex302或多工/分離部ex303之間等亦可先將資料儲存在避免系統的溢位(overflow)、下溢(underflow)之緩衝件之緩衝器。
又,電視機ex300除了由廣播等或記錄媒體等取得聲音資料、影像資料外,亦可具有受理麥克風或相機之AV輸入之構成,對於由其等取得之資料進行編碼處理。此外,在此電視機ex300係以可進行上述之編碼處理、多工處理及外部輸出之構成進行說明,但不能進行其等處理,但亦可為只做上述接收、解碼處理、外部輸出之構成。
又,在讀取器/記錄器ex218由記錄媒體讀出多工資料或將多工資料寫入記錄媒體時,上述解碼處理或編碼處理亦可由電視機ex300、讀取器/記錄器ex218之任一者進行,亦可使電視機ex300與讀取器/記錄器ex218相互分擔進行。
以一例而言,將由光碟進行資料之讀入或寫入時之資訊再生/記錄部ex400之構成顯示在第23圖。資訊再生/記錄部ex400包含有以下所說明之要素ex401、ex402、ex403、ex404、ex405、ex406、及ex407。光學磁頭ex401係於作為光碟之記錄媒體ex215之記錄面照射雷射光點寫入資訊,檢測來自記錄媒體ex215之記錄面之反射光來讀入資訊。調變記錄部ex402係電驅動內建在光學磁頭ex401之半導體雷射,因應記錄資料進行雷射光之調變。再生解調部ex403係將內建在光學磁頭ex401之光學探測器電檢測來自記錄面之反射光之再生訊號放大,將記錄媒體ex215所記錄之訊號成分分離且解調,將所需的資訊再生。緩衝器ex404係將由用以記錄在記錄媒體ex215之資訊及記錄媒體ex215再生之資訊暫時固持。光碟馬達ex405係將記錄媒體ex215旋轉。伺服器控制部ex406係控制光碟馬達ex405之旋轉驅動,且將光學磁頭ex401移動在預定之資訊軌道,進行雷射光點之追蹤處理。系統控制部ex407係進行資訊再生/記錄部ex400整體之控制。上述之讀出或寫入之處理係使系統控制部ex407利用緩衝器ex404所固持之各種資訊,又因應必要進行新的資訊的產生及追加,並一邊使調變記錄部ex402、再生解調部ex403、伺服器控制部ex406協調作動,一邊透過光學磁頭ex401,進行資訊之記錄再生而予以實現。系統控制部ex407係以例如微處理部構成,執行讀出寫入之程式,而執行其等之處理。
在以上的說明中,光學磁頭ex401係照射雷射光點來進行說明,亦可為利用接近場光而進行更高密度之記錄之構成。
第24圖係顯示成為光碟之記錄媒體ex215之模式圖。記錄媒體ex215之記錄面形成螺旋狀的導槽(溝槽groove),在資訊軌道ex230上事先記錄有溝槽的形狀變化而顯示光碟上的絕對位置之地點資訊。該地點資訊含有用以界定記錄區塊ex231之位置之資訊,該記錄區塊ex231係記錄資料之單位,在進行記錄或再生之裝置中將資訊軌道ex230再生,讀取地點資訊,以界定記錄區塊。又,記錄媒體ex215係含有資料記錄區ex233、內周區ex232、及外周區ex234。為記錄用戶資料所用之區域為資料記錄區ex233,配置在資料記錄區ex233內周或外周之內周區ex232及外周區ex234係用於用戶資料之記錄以外之特定用途。資訊再生/記錄部ex400係對於如此記錄媒體ex215之資料記錄區ex233,進行將業已編碼之聲音資料、影像資料或其等資料多工之多工資料之讀寫。
在以上說明中,是以一層的DVD、BD等之光碟為例進行說明,但不限於其等,亦可為多層構造且在表面以外亦可記錄之光碟。又,亦可為在光碟之相同地方利用各種不同波長之顏色之光記錄資訊,或由各種角度記錄不同資訊之層等進行多次元之記錄/再生之構造之光碟。
又,亦可在數位廣播用系統ex200中,在具有天線ex205之車輛ex210由衛星ex202等接收資料,在車輛ex210所具有之車輛導航系統ex211等之顯示裝置將動畫再生。此外,車輛導航系統ex211之構成可考慮如第22圖所示之構成中加上GPS接收部之構成,同樣的事情亦可考慮在電腦ex111或行動電話機ex114等實現。
第25圖(a)係顯示使用上述實施形態所說明之動畫圖像解碼方法及動畫圖像編碼方法之行動電話機ex114之圖。行動電話機ex114包含有用以於基地台ex110之間接送電波之天線ex350、可攝影影像、靜態影像之相機部ex365、及顯示以相機部ex365所攝影之影像、將天線ex350所接收之影像解碼之資料之液晶顯示器等之顯示部ex358。行動電話機ex114更包含有具有操作鍵部ex366之本體部、諸如用以輸出聲音之麥克風等之聲音輸入部ex356、及保存所攝影之影像、靜態影像、所錄音之聲音或所接收之影像、靜態影像、郵件等之業已編碼之資料或者是業已解碼之資料之記憶體部ex367、或同樣,在與作為保存資料之記錄媒體之間之介面部之插槽(slot)部ex364。
進而,針對行動電話機ex114之構成例,使用第25圖(b)予以說明。行動電話機ex114係相對於統籌地控制具有顯示部ex358及操作鍵部ex366之本體部之各部之主控制部ex360,經由匯流排ex370而使電源電路部ex361、操作輸入 控制部ex362、影像訊號處理部ex355、相機介面部ex363、液晶顯示器(LCD,Liquid Crystal Display)控制部ex359、調變/解調部ex352、多工/分離部ex353、聲音訊號處理部ex354、插槽部ex364、記憶體部ex367相互連接。
電源電路部ex361係一藉用戶之操作而將結束對話及電源鍵呈開啟狀態時,由電池組對著各部供電,將行動電話機ex114起動為可作動之狀態。
行動電話機ex114係根據具有CPU、ROM、RAM等之主控制部ex360之控制,在聲音通話模式時,以聲音訊號處理部ex354而將以聲音輸入部ex356收音之聲音訊號轉換成數位聲音訊號,以調變/解調部ex352對此進行頻譜擴散處理,以傳送/接收部ex351施行數位類比轉換處理及頻率變換處理之後,經由天線ex350而傳送。又,行動電話機ex114係於聲音通話模式時,將經由天線ex350所接收之接收資料放大,施行頻率變換處理及類比數位轉換處理,以調變/解調部ex352進行頻譜反擴散處理,以聲音訊號處理部ex354轉換成類比聲音訊號之後,且由聲音輸出部ex357予以輸出。
進而,在於資料通訊模式時傳送電子郵件時,藉本體部之操作鍵部ex366等之操作所輸入之電子郵件之正文資料係經由操作輸入控制部ex362而送出至主控制部ex360。主控制部ex360係以調變/解調部ex352而將正文資料進行頻譜擴散處理,以傳送/接收部ex351施行數位類比轉換處理及頻率變換處理之後,經由天線ex350而傳送至基地台 ex110。在接收電子郵件時,對於所接收之資料進行與前述處理幾乎相反之處理,輸出至顯示部ex358。
在於資料通訊模式時傳送影像、靜態影像或影像與聲音時,影像訊號處理部ex355係將由相機部ex365所供給之影像訊號,藉以上述各實施形態所示之動畫圖像編碼方法進行壓縮編碼(即,當作本發明之圖像編碼裝置發揮功能),而將業經編碼之影像資料送出至多工/分離部ex353。又,聲音訊號處理部ex354係在以相機部ex365將影像、靜態影像等攝影之中將聲音輸入部ex356所收音之聲音訊號進行編碼,將業已編碼之聲音資料送出至多工/分離部ex353。
多工/分離部ex353係以預定方式將由影像訊號處理部ex355所供給且業已編碼之影像資料及由聲音訊號處理部ex354所供給且業已編碼之聲音資料進行多工處理,將其結果所得到之多工資料在調變/解調部(調變/解調電路部)ex352進行頻譜擴散處理,在於傳送/接收部ex351施行數位類比轉換處理及頻率變換處理之後,經由天線ex350而傳送者。
為了在資料通訊模式時、在接收連到網頁等之動畫圖像檔案之資料時、或在接收附有影像或聲音之電子郵件時,將經由天線ex350而所接收之多工資料進行解碼,多工/分離部ex353將多工資料分離,分成影像資料之位元流與聲音資料之位元流,經由同步匯流排ex370而將業已編碼之影像資料供給至影像訊號處理部ex355,並將業已編碼之聲音資料供給至聲音訊號處理部ex354。影像訊號處理部ex355 係藉由與上述各實施形態所示之動畫圖像編碼方法對應之動畫圖像解碼方法解碼,將影像訊號進行解碼(即,作為本發明之圖像解碼裝置發揮),經由LCD控制部ex359,由顯示部ex358顯示例如連到網路之動畫圖像檔案所含之影像、靜態影像。又,聲音訊號處理部ex354係將聲音訊號進行解碼,且由聲音輸出部ex357輸出聲音。
又,上述行動電話機ex114等之終端機係與電視機ex300同樣,可考慮到除了具有編碼器及解碼器兩者之收發型終端機之外,只有編碼器之傳送終端機、只有解碼器之接收終端機等三種安裝方式。進而,在數位廣播用系統ex200中,是說明接收、傳送在影像資料多工有音樂資料等之多工資料,但除了聲音資料外,亦可為有與影像有關連之文字資料等多工之資料,亦可為影像資料本身而非多工資料。
如此,可將上述各實施形態所示之動畫圖像編碼方法或動畫圖像解碼方法運用在上述之任一種機器或系統,藉此,可得到在上述各實施形態所說明之效果。
又,本發明不限於上述實施形態者,可在不脫離本發明範圍下可做各種變形或修正。
(實施形態4)
亦可因應情況適當地切換上述各實施形態所示之動畫圖像編碼方法或裝置、與依據MPEG-2、MPEG4-AVC、VC-1等相異之規格之動畫圖像編碼方法或裝置,產生影像資料者。
在此,在產生有依據各為不同之規格之多數影像資料時,在解碼時,必須選擇與各規格對應之解碼方法。惟,由於不能識別欲解碼之影像資料是依據哪一規格,因此衍生有不能選擇適當的解碼方法之課題。
為了解決該課題,將聲音資料等多工至影像資料之多工資料係構建為含有顯示影像資料是依據哪一規格者之識別資訊之構成。如下說明含有藉以上述各實施形態所示之動畫圖像編碼方法或裝置所產生之影像資料之多工資料之具體構成。多工資料為MPEG-2傳輸流形式之數位流。
第26圖係顯示多工資料之構成圖。如第26圖所示,多工資料係將視訊流、聲訊流、表達圖形流(PG)、交互圖形流之中將一個以上多工而所得到者。視訊流表示電影之主影像及副影像、聲訊流(IG)表示電影之主聲音部分及與該主聲音混合之副聲音部分,表達圖形流表示電影之字幕。在此,主影像係指顯示在畫面之通常影像,副影像係指以小畫面顯示在主影像中之影像者。又,交互圖形流係指於畫面上配置GUI零件所作成之對話畫面。視訊流係指藉以上述各實施形態所示之動畫圖像編碼方法或裝置、以習知之MPEG-2、MPEG4-AVC、VC-1等規格為準之動畫圖像編碼方法或裝置所編碼者。聲訊流係以杜比AC-3、Dolby Digital Plus、MLP、DTS、DTS-HD或、線性PCM等方式所編碼者。
多工資料所含之各串流係藉PID所識別。例如在於電影之影像所利用之視訊流劃分有0×1011,聲訊流劃分有0×1100至0×111F,表達圖形流劃分有0×1200至0×121F,交 互圖形流劃分有0×1400至0×141F,在於電影之副影像所利用之視訊流劃分有0×1B00至0×1B1F,與主聲音混合之副聲音所利用之聲訊流劃分有0×1A00至0×1A1F。
第27圖係模式地顯示多工資料是如何被多工之圖。首先,將由多數視訊框所構成之視訊流ex235、由多數聲訊流所構成之聲訊流ex238各變換成PES封包列ex236及ex239、TS封包ex237及ex240。同樣將表達圖形流ex241及交互圖形流ex244之資料各變換成PES封包列ex242及ex245,進行變換成TS封包ex243及ex246。多工資料ex247係將其等TS封包多工成一條串流來構成者。
第28圖係進一步詳細顯示在PES封包列中如何儲存視訊流。第31圖中之第1段係顯示視訊流之視訊框列。第2段係顯示PES封包列。如第28圖之箭頭符號yy1、yy2、yy3、yy4所示,視訊流中之多數視訊表達單元(Video Presentation Unit)之I圖片、B圖片、P圖片係按每一圖片分割,且儲存在PES封包之酬載。各PES封包係具有PES標頭,PES標頭儲存有成為圖片之顯示時刻之表達時間戳記(PTS,Presentation Time-Stamp)或圖片之解碼時刻之解碼時間戳記(DTS,Decoding Time-Stamp)。
第29圖係顯示最終寫入於多工資料之TS封包之形式。TS封包係188位元組(Byte)固定長度之封包,由具有識別串流之PID等之資訊之4位元組之TS標頭及儲存資料之184位元組之TS酬載所構成,上述PES封包被分割而儲存在TS酬載。在BD-ROM時,TS封包被附與有4位元組之TP額外標頭 (TP_Extra_Header),構成192位元組之原始封包,寫入至多工資料。TP額外標頭(TP_Extra_Header)記載有ATS(到達時間戳記,Arrival_Time_Stamp)等之資訊。ATS係顯示該TS封包轉送至解碼器之PID濾波器之轉送開始時間。多工資料中,如第32圖下段所示,構成有原始封包排列者,由多工資料之前頭開始增加之號碼被稱為原始封包號碼(SPN;source packet number)。
又,多工資料所含之TS封包,除了影像、聲音、字幕等之各串流外,更有PAT(Program Association Table)、PMT(Program Map Table)、PCR(Program Clock Reference)等。PAT表示多工資料中所利用之PMT之PID為何者,PAT本身之PID係登錄為0。PMT係具有多工資料中所含之影像‧音声‧字幕等之各串流之PID及與各PID對應之串流之屬性資訊,又具有與多工資料有關之各種描述符。描述符具有指示允許及不允許多工資料之複製之複製控制資訊等。PCR係為了取得作為ATS之時軸之到達時間時鐘(ATC,Arrival Time Clock)與成為PTS‧DTS之時軸之系統時間時鐘(STC,System Time Clock)之同步,而具有與該PCR封包轉送至解碼器之ATS對應之STC時間之資訊。
第30圖詳細說明PMT之資料構造之圖。PMT之前頭係配置有記有該PMT所含之資料之長度等之PMT標頭。在其之後方配置有多數與多工資料有關之描述符。上述複製控制資訊等記載為描述符。描述符之後配置有多數與多工資料所含之各串流有關之串流資訊。串流資訊係為識別串流之壓縮編解碼器等,而由記載有串流型式、串流之PID、串流之屬性資訊(框速率、長寬比等)之串流描述符所構成。串流描述符有存在於多工資料之串流數這樣多。
在記錄在記錄媒體等的時候,上述多工資料係與多工資料資訊檔案一起記錄。
多工資料資訊檔案,如第31圖所示,為多工資料之管理資訊,與多工資料呈一對一之對應關係,由多工資料資訊、串流屬性資訊及登錄圖(entry map)所構成者。
多工資料資訊,如第31圖所示,由系統速率、再生開始時刻、再生結束時刻所構成者。系統速率表示多工資料轉送至後述的系統指標解碼器之PID濾波器之最大轉送速率。多工資料中所含之ATS之間隔係設定為系統速率以下。再生開始時刻係多工資料之前頭之視訊框之PTS,再生結束時刻係於於多工資料之末端之視訊框之PTS加上一框量之再生間隔者。
串流屬性資訊,如第32圖所示,針對多工資料所含之各串流之屬性資訊係登錄於每PID。屬性資訊具有視訊流、聲訊流、表達圖形流、交互圖形流各為不同之資訊。視訊流屬性資訊具有該視訊流是以何種壓縮編碼解碼器所壓縮、構成視訊流之每個圖片資料之影像解析度有多少、長寬比有多少、框速率有多少等之資訊。聲訊流屬性資訊具有該聲訊流是以哪種壓縮編碼解碼器所壓縮、該聲訊流所含之頻道數是什麼、是對應哪一語言、抽樣頻率有多少等之資訊。其等資訊是利用在於播放器再生前之記錄器之初始化等。
在本實施形態中,利用上述多工資料中PMT所含之串流型式。又,記錄媒體記錄有多工資料時,利用包含在多工資料資訊之視訊流屬性資訊。具體來說,在於上述各實施形態所示之動畫圖像編碼方法或裝置中,設置設定固有資訊之步驟或手法,固有資訊係相對於PMT所含之串流型式或視訊流屬性資訊,顯示藉以上述各實施形態所示之動畫圖像編碼方法或裝置所產生之影像資料者。藉該構成,可識別藉以上述各實施形態所示之動畫圖像編碼方法或裝置所產生之影像資料與依據其他規格之影像資料。
又,將本實施形態中之動畫圖像解碼方法之步驟顯示在第33圖。在步驟exS100中,由多工資料取得PMT所含之串流型式或多工資料資訊所含之視訊流屬性資訊。其次,在步驟exS101中,判斷串流型式或視訊流屬性資訊是否顯示為藉以上述各實施形態所示之動畫圖像編碼方法或裝置所產生之多工資料。接著,在串流型式或視訊流屬性資料被判斷為藉以上述各實施形態所示之動畫圖像編碼方法或裝置所產生者之時,在步驟exS102中,藉上述各實施形態所示之動畫圖像解碼方法進行解碼。又,在串流型式或視訊流屬性資訊被判斷為以習知之MPEG-2、MPEG4-AVC、VC-1等之規格者之時,在步驟exS103中,藉依據習知之規格之動畫圖像解碼方法進行解碼。
如此,藉於串流型式或視訊流屬性資訊設定新的固有值,在解碼時,能判斷是否可以上述各實施形態所示之動 畫圖像解碼方法或裝置解碼者。因此,即使在輸入有依據不同的規格之多工資料時,亦可選擇適當的解碼方法或裝置,因此可在不產生錯誤之狀態下進行解碼。又,亦可將本實施形態所示之動畫圖像編碼方法或裝置或者是動畫圖像解碼方法或裝置運用在上述任一機器及系統。
(實施形態5)
上述各實施形態所示之動畫圖像編碼方法及裝置、動畫圖像解碼方法及裝置典型上可以積體電路之LSI實現。以一例來說,在第37圖顯示構成為單一晶片之LSIex500之構成。LSIex500包含有以下說明之要素ex501、ex502、ex503、ex504、ex505、ex506、ex507、ex508、ex509,各要素係經由匯流排ex510而連接者。電源電路部ex505係於電源為開啟狀態時,對於各部供電,而在可作動之狀態下起動。
例如在進行編碼處理時,LSIex500係根據具有CPUex502、記憶體控制器ex503、串流控制器ex504、驅動頻率控制部ex512等之控制部ex501之控制,藉AV I/Oex509而由麥克風ex117或相機ex113等輸入AV訊號。所輸入之AV訊號係暫時儲存在SDRAM等之外部記憶體ex511。根據控制部ex501之控制,所儲存之資料因應處理量或處理速度而適當地分成多次等,傳送至訊號處理部ex507,且在訊號處理部ex507中進行聲音訊號之編碼及/或影像訊號之編碼。訊號處理部ex507中,更依情況之不同對所編碼之聲音資料及所編碼之影像資料進行多工等之處理,由串流I/Oex506輸出至外部。該所輸出之多工資料係朝基地台ex107傳送,或寫入記錄媒體ex215。在多工之時,為了要同步,可將資料暫時儲存在緩衝器ex508即可。
此外,在上述中說明記憶體ex511為LSIex500之外部構成,亦可為包含在LSIex500之內部之構成。緩衝器ex508亦不限於1個,亦可具備多數緩衝器。又,LSIex500亦可單一晶片構成,亦可多晶片構成。
又,在上述中,控制部ex501係具有CPUex502、記憶體控制器ex503、串流控制部ex504、驅動頻率控制部ex512等,但控制部ex501之構成不限於該構成。例如,訊號處理部ex507亦可為具有CPU之構成。在訊號處理部ex507之內部亦設有CPU,可將處理速度進一步提昇。又,對於另一例,CPUex502亦可為具有訊號處理部ex507或訊號處理部ex507之局部例如聲音訊號處理部之構成。在如此情況下,控制部ex501係具備訊號處理部ex507或具有該一部分之CPUex502之構成者。
另外,在此,是以LSI予以表現,但依積體度的不同,也有被稱為IC(積體電路:Integrated Circuit)、系統LSI、超級(Super)LSI、超(Ultra)LSI。
又,積體電路化的手法不僅限於LSI者,亦可以專用電路或萬用處理器予以實現。又,亦可利用能在製造LSI後再程式化之現場可程式化邏輯閘陣列(FPGA:Field Programmable Gate Array)、能將LSI內部之電路胞元(cell)之連接或設定再構成之重組態處理器(ReConfigurable Processor)。
進而,透過半導體技術的進步或衍生之其他技術,如有可替補LSI之積體電路技術問世時,當然亦可使用該技術將功能方塊積體化。對於可能性而言生物科學技術亦有可能適用等。
(實施形態6)
在將藉以上述各實施形態所示之動畫圖像編碼方法或裝置所產生之影像資料解碼時能考慮到的是,與將依據習知之MPEG-2、MPEG4-AVC、VC-1等規格之影像資料解碼之情況相比,處理量增加者。為此,在LSIex500中,有必要設定在比將依據習知規格之影像資料解碼時之CPUex502之驅動頻率更高之驅動頻率。惟,一提高驅動頻率時,則衍生有消費電力變高之課題。
為解決該課題,電視機ex300、LSIex500等之動畫圖像解碼裝置係識別影像資料是依據哪一規格者,因應規格來切換驅動頻率之構成。第35圖係顯示本實施形態中之構成ex800。驅動頻率切換部ex803係於影像資料為藉以上述各實施形態所示之動畫圖像編碼方法或裝置所產生者時,將驅動頻率提高設定。接著,對執行以上述各實施形態所示之動畫圖像解碼方法之解碼處理部ex801,指示要將影像資料解碼者。另一方面,在影像資料為依據習知規格之影像資料時,與影像資料為藉以上述各實施形態所示之動畫圖像編碼方法或裝置所產生者時相比,要將驅動頻率降低設定。接著,對依據習知規格之解碼處理部ex802,指示要將影像資料解碼者。
更具體來說,驅動頻率切換部ex803係由第34圖之CPUex502與驅動頻率控制部ex512所構成者。又,執行以上述各實施形態所示之動畫圖像解碼方法之解碼處理部ex801及依據習知規格之解碼處理部ex802係相當於第34圖之訊號處理部ex507。CPUex502係識別影像資料依據哪一規格者。接著,根據來自CPUex502之訊號,驅動頻率控制部ex512係設定驅動頻率。又,根據來自CPUex502之訊號,訊號處理部ex507係進行影像資料之解碼。在此,在影像資料之識別上,考慮到例如利用實施形態4所記載之識別資訊者。有關於識別資訊,不限於實施形態4所記載者,只要能識別影像資料是依據哪一規格之資訊即可。例如,在根據識別影像資料是被利用在電視機者、或被利用在磁碟者等之外部訊號,能識別影像資料是依據哪一規格時,亦可根據如此之外部訊號予以識別。又,在CPUex502中之驅動頻率之選擇,能考慮到例如根據如第37圖所示之影像資料之規格與驅動頻率對應之查找表者。將查找表先儲放在緩衝器ex508或LSI之內部記憶體,CPUex502參照該查找表,即可選擇驅動頻率者。
第36圖係顯示實施本實施形態之方法之步驟。首先在步驟exS200中,於訊號處理部ex507中由多工資料取得識別資訊。其次,在步驟exS201中,於CPUex502中,根據識別資訊,識別影像資料是否為藉以上述各實施形態所示之編碼方法或裝置所產生者。在影像資料為藉以上述各實施形態所示之編碼方法或裝置所產生者時,在步驟exS202中,CPUex502係將驅動頻率提高設定之訊號送至驅動頻率控制部ex512。接著,在驅動頻率控制部ex512中,設定在高驅動頻率。另一方面,在顯示為依據習知之MPEG-2、MPEG4-AVC、VC-1等規格之影像資料時,在步驟exS203中,CPUex502係將驅動頻率降低設定之訊號送至驅動頻率控制部ex512。接著,在驅動頻率控制部ex512中,與影像資料是藉以上述各實施形態所示之編碼方法或裝置所產生之形態相比,設定在低驅動頻率。
進而,連動於驅動頻率之切換,變更供給至LSIex500或含有LSIex500之裝置之電壓,就能更提高省電效果。例如在將驅動頻率降低設定時,隨此,與將驅動頻率提高設定之情況相比,可考慮將供應至LSIex500或含有LSIex500之裝置之電壓降低設定者。
又,驅動頻率之設定方法只要在解碼時之處理量大時,將驅動頻率提高設定,而在解碼時之處理量小時,將驅動頻率降低設定即可,不限於上述之設定方法。例如將依據MPEG4-AVC規格之影像資料解碼之處理量係於大於以上述各實施形態所示之動畫圖像編碼方法或裝置所產生之影像資料解碼之處理量時,可考慮將驅動頻率之設定作成與上述情況相反者。
進而,驅動頻率之設定方法不限於降低驅動頻率之構成。例如,在識別資訊顯示藉以上述各實施形態所示之動畫圖像編碼方法或裝置所產生之影像資訊時,將供給至LSIex500或含有LSIex500之裝置之電壓提高設定,在顯示為 依據習知之MPEG-2、MPEG4-AVC、VC-1等規格之影像資料時,亦可降低設定提供至LSIex500或含有LSIex500之裝置之電壓。又,以另一例而言,在識別資訊顯示為藉以上述各實施形態所示之動畫圖像編碼方法或裝置所產生之影像資料時,無須將CPUex502之驅動停止,在顯示為依據習知之MPEG-2、MPEG4-AVC、VC-1等規格之影像資料時,在處理上有餘裕,因此亦可將CPUex502之驅動暫時停止者。在識別資訊顯示為藉以上述各實施形態所示之動畫圖像編碼方法或裝置所產生之影像資料時,如果處理上有餘裕時,亦可考慮將CPUex502之驅動暫時停止者。該情況係與顯示為依據習知MPEG-2、MPEG4-AVC、VC-1等規格之影像資料之情況相比,可考慮將停止時間縮短設定者。
如此,因應影像資料所依據之規格而切換驅動頻率,就可謀求省電之實現。又,在使用電池而將LSIex500或含有LSIex500之裝置驅動時,就能隨著省電而延長電池的壽命。
(實施形態7)
在電視機或行動電話機等上述機器暨系統上有依據不同規格之多數影像資料輸入之情況。如此,為於有依據不同規格之多數影像資料輸入之情況亦能解碼,有必要使LSIex500之訊號處理部ex507對應於多數規格。惟,一個別使用與各規格對應之訊號處理部ex507,就有LSIex500之電路規模變大,又,成本增加之課題衍生。
為解決該課題,構建成將用以執行以上述各實施形態 所示之動畫圖像解碼方法用之解碼處理部與依據習知之MPEG-2、MPEG4-AVC、VC-1等規格之解碼處理部局部共有之構成。將該構成例顯示在第38圖(a)之ex900。例如在上述各實施形態所示之動畫圖像解碼方法與依據MPEG4-AVC規格之動畫圖像解碼方法係於熵編碼、反量化、解塊濾波器、動量補償等之處理中,處理內容有局部共通者。考慮一種構成,其針對共通之處理內容係共有與MPEG4-AVC規格對應之解碼處理部ex902,針對不對應MPEG4-AVC規格之本發明特有之其他處理內容則使用專用之解碼處理部ex901之構成。尤其能考慮到本發明係於熵解碼上具有特徵,例如針對熵解碼,使用專用之解碼處理部ex901,而對於除此以外之反量化、解塊濾波器、動量補償任一者或全部的處理,共有解碼處理部者。有關於解碼處理部之共有,亦可針對共通之處理內容,共有用以執行上述各實施形態所示之動畫圖像解碼方法之解碼處理部,而對於MPEG4-AVC規格特有之處理內容,則使用專用之解碼處理部之構成。
又,將處理局部共有之另一例顯示在第38圖(b)之ex1000。在該例中,使用與本發明特有之處理內容對應之專用之解碼處理部ex1001、與另一習知規格特有之處理內容對應之專用的解碼處理部ex1002、與本發明動畫圖像解碼方法與另一習知規格之動畫圖像解碼方法共通之處理內容對應之共用的解碼處理部ex1003之構成。在此,專用的解碼處理部ex1001、ex1002未必為對本發明或其他習知規格特有之處理內容特化者,亦可為可執行其他萬用處理者。又,本實施形態之構成亦可以LSIex500安裝者。
如此,針對本發明之動畫圖像解碼方法與習知規格之動畫圖像解碼方法上共通之處理內容共有解碼處理部,便能將LSI之電路規模縮小、降低成本者。
產業之可利用性
本發明之圖像編碼方法及圖像解碼方法能利用在各種用途,例如可利用在電視機、數位攝影機、車用導航系統、行動電話機、數位相機、數位攝影相機等之高影像解析度之資訊顯示機器或攝影機器。
10...算術編碼部
11...2進制處理部
12...符號發生機率儲存部
13...上下文控制部
14...2進制算術編碼器
100...算術編碼部
101、502...2進制處理部
102、302...符號發生機率儲存部
103、303、503、601...上下文控制部
104...2進制算術編碼器
105、305...上下文區分控制部
200、500...圖像編碼裝置
205...減法器
210...量化部
220...熵編碼部
230、420...反變換部
235、425...加法器
240、430...解塊濾波器
250、440...記憶體
260、450...內預測部
270...動量偵測部
280、460...動量補償部
290、470...內/間切換器
300...算術解碼部
301...2進制算術解碼器
304、603...多進制處理部
400、600...圖像解碼裝置
410...熵解碼部
501...變換部
504...2進制算術編碼部
602...2進制算術解碼部
ex100...內容供給系統
ex101...網際網路
ex102...網際網路服務提供者
ex104...電話線路網
ex106~ex110...基地台
ex107...基地台
ex111...電腦
ex112...PDA
ex113...相機
ex114...行動電話機
ex115...遊戲機
ex117...麥克風
ex201...廣播台
ex202...衛星
ex203...電纜線
ex204...天線
ex210...車輛
ex211...車輛導航系統
ex215、ex216...記錄媒體
ex217...機上盒(STB)
ex218...讀取器/記錄器
ex219...監視器
ex220...遙控器
ex230...資訊軌道
ex231...記錄區塊
ex232...內周區
ex233...資料記錄區
ex234...外周區
ex235...視訊流
ex238...聲訊流
ex236,ex239,ex242,ex245...PES封包列
ex237,ex240,ex243,ex246...TS封包
ex241...表達圖形流
ex244...交互圖形流
ex247...多工資料
ex300...電視機
ex301...調諧器
ex302...調變/解調部
ex303...多工/分離部
ex304...聲音訊號處理部
ex305...影像訊號處理部
ex306...訊號處理部
ex307...揚聲器
ex308...顯示部
ex309...輸出部
ex310...控制部
ex311...電源電路部
ex312...操作輸入部
ex313...橋接器
ex314...插槽部
ex315...驅動器
ex316...數據機
ex317...介面部
ex318、ex319...緩衝器
ex350...天線
ex351...傳送/接收部
ex352...調變/解調部
ex353...多工/分離部
ex354...聲音訊號處理部
ex355...影像訊號處理部
ex356...聲音輸入部
ex357...聲音輸出部
ex358...顯示部
ex359...LCD控制部
ex360...主控制部
ex361...電源電路部
ex362...操作輸入控制部
ex363...相機I/F部
ex364...插槽部
ex365...相機部
ex366...操作鍵部
ex367...記憶體部
ex400...資訊再生/記錄部
ex401...光學磁頭
ex402...調變記錄部
ex403...再生解調部
ex404...緩衝器
ex405...光碟馬達
ex406...伺服器控制部
ex407...系統控制部
ex500...LSI
ex501...控制部
ex502...CPU
ex503...記憶體控制器
ex504...串流控制器
ex505...電源電路部
ex506...串流I/O
ex507...訊號處理部
ex508...緩衝器
ex509...AVI/O
ex510...匯流排
ex511...記憶體
ex512...驅動頻率控制部
ex801,ex802...解碼處理部
ex803...驅動頻率切換部
ex900...構成
ex901,ex902,ex1001~ex1003...解碼處理部
第1圖係顯示比較用算術編碼方法之流程圖。
第2圖係顯示比較用算術編碼裝置之構成之方塊圖。
第3圖係顯示本發明實施形態1之算術編碼部之一構成例之方塊圖。
第4圖係顯示本發明實施形態1之符號發生機率表之一例之圖。
第5圖(a)、(b)係顯示本發明實施形態1之上下文圖表之一例之圖。
第6圖係顯示本發明實施形態1之算術編碼方法之一例之流程圖。
第7圖係顯示本發明實施形態1之算術編碼方法之一例之流程圖。
第8圖係顯示本發明實施形態1之上下文方塊區分控制之一例之流程。
第9A圖係顯示用以說明本發明實施形態1之上下文區分之一例之模式圖。
第9B圖係顯示本實施形態1之上下文區分之設定例之圖。
第9C圖係顯示本發明實施形態1之上下文區分之設定例之圖。
第10圖係顯示本發明實施形態1之圖像編碼裝置之一構成例之方塊圖。
第11A圖係顯示本發明實施形態1之變形例之2進制處理之一例之圖。
第11B圖係顯示本發明實施形態1之變形例之2進制訊號所含之2進制符號之位元位置與上下文索引之對應關係之一例之圖。
第11C圖係用以說明本發明實施形態1之變形例之上下文之決定方法之一例之圖。
第12圖係顯示本發明一態樣之圖像編碼裝置之一構成例之方塊圖。
第13圖係顯示本發明一態樣之圖像編碼方法之一例之流程圖。
第14圖係顯示本發明實施形態2之算術解碼部之一構成例之方塊圖。
第15圖係顯示本發明實施形態2之算術解碼方法之一例之流程圖。
第16圖係顯示本發明實施形態2之算術解碼方法之一例之流程圖。
第17圖係顯示本發明實施形態2之圖像解碼裝置之一構成例之方塊圖。
第18圖係顯示本發明一態樣之圖像解碼裝置之一構成例之方塊圖。
第19圖係顯示本發明一態樣之圖像解碼方法之一例之流程圖。
第20圖係實現內容發送服務之內容供給系統之整體構成圖。
第21圖係數位廣播用系統之整體構成圖。
第22圖係顯示電視機之構成例之方塊圖。
第23圖係顯示在光碟之記錄媒體進行資訊讀寫之資訊再生/記錄部之構成例之方塊圖。
第24圖係顯示光碟之記錄媒體之構成例之圖。
第25圖(a)係顯示行動電話機之一例;(b)係顯示行動電話機之構成例之方塊圖。
第26圖係顯示多工資料之構成之圖。
第27圖係模式地顯示各串流在多工資料中如何被多工之圖。
第28圖係更詳細地顯示視訊流如何被儲存在PES封包列之圖。
第29圖係顯示多工資料中之TS封包與原始封包之構造之圖。
第30圖係顯示PMT之資料構成之圖。
第31圖係顯示多工資料資訊之內部構成之圖。
第32圖係顯示串流屬性資訊之內部構成之圖。
第33圖係顯示識別影像資料之步驟之圖。
第34圖係顯示將各實施形態之動態圖像編碼方法及動態圖像解碼方法予以實現之積體電話之構成例之方塊圖。
第35圖係顯示切換驅動頻率之構成之圖。
第36圖係顯示識別影像資料且切換頻率之步驟之圖。
第37圖係顯示將影像資料之規格與驅動頻率相對應之查找表之一例之圖。
第38圖(a)係顯示將訊號處理部之模組共有之一構成例之圖;(b)係顯示將訊號處理部之模組共有之另一例之圖。
S601~S605...步驟

Claims (11)

  1. 一種圖像編碼方法,係將圖像資料進行編碼之圖像編碼方法,包含有:變換步驟,係藉將前述圖像資料進行頻率變換,而產生頻率區域之處理單位者;2進制處理步驟,係藉將前述處理單位所含之係數進行2進制處理,而產生2進制訊號者;上下文決定步驟,係決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述2進制訊號用之上下文,前述區分為分割前述處理單位而所得到之多數區分中之1個區分且為含有業經2進制處理之前述係數之區分;2進制算術編碼步驟,係依照與所決定之前述上下文對應之機率資訊,而將前述2進制訊號進行2進制算術編碼者;更新步驟,係根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新者;及記錄步驟,係將顯示前述多數區分之區分資訊記錄於位元流內者。
  2. 如申請專利範圍第1項之圖像編碼方法,其中前述多數區分所含之第1區分係小於位於比前述第1區分高頻之區域之第2區分。
  3. 如申請專利範圍第2項之圖像編碼方法,其中前述2進制處理步驟中,在藉以事先設定之掃描順序掃描前述處理 單位所含之多數係數而所得到之前述係數為掃描順序上位於最後之非零係數時,產生顯示前述係數之位置之訊號,作為前述2進制訊號。
  4. 如申請專利範圍第3項之圖像編碼方法,其中前述2進制處理步驟中,在前述係數為掃描順序上位於最後之非零係數時,產生以2維座標之座標值顯示前述係數之位置之訊號,作為前述2進制訊號。
  5. 一種圖像編碼裝置,係將圖像資料進行編碼之圖像編碼裝置,包含有:變換部,係將前述圖像資料進行頻率變換,而產生頻率區域之處理單位者;2進制處理部,係將前述處理單位所含之係數進行2進制處理,而產生2進制訊號者;上下文控制部,係決定前述2進制訊號用之上下文者;及2進制算術編碼部,係依照與所決定之前述上下文對應之機率資訊,而將前述2進制訊號進行算術編碼者;前述上下文控制部係:決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述2進制訊號用之上下文,前述區分為分割前述處理單位而所得到之多數區分中之1個區分且為含有業經2進制處理之前述係數之區分,根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新, 並將顯示前述多數區分之區分資訊記錄於位元流內。
  6. 一種圖像解碼方法,係將編碼圖像資料進行解碼之圖像解碼方法,包含有:取得步驟,係於前述編碼圖像資料所含之解碼對象訊號顯示為頻率區域之處理單位所含之係數時,取得顯示前述係數之處理單位內之位置之位置資訊者;上下文決定步驟,係決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述解碼對象訊號用之上下文者,前述區分為根據位元流中所含之區分資訊分割前述處理單位而得到之多數區分中之1個區分且為前述位置資訊所示之位置所屬之區分;2進制算術解碼步驟,係依照與所決定之前述上下文對應之機率資訊,將前述解碼對象訊號進行算術解碼,而產生2進制訊號者;多進制處理步驟,係將前述2進制訊號進行多進制處理者;及更新步驟,係根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新者。
  7. 如申請專利範圍第6項之圖像解碼方法,其中前述多數區分所含之第1區分係小於位於比前述第1區分高頻率之區域之第2區分。
  8. 如申請專利範圍第7項之圖像解碼方法,其中前述解碼對象訊號係於藉以事先設定之掃描順序掃描前述處理單位所含之多數係數而所得到之前述係數為掃描順序上位於 最後的非零係數時,為顯示前述係數之位置之訊號。
  9. 如申請專利範圍第8項之圖像解碼方法,其中前述解碼對象訊號係於前述係數為掃描順序上位於最後的非零係數時,為以2維座標之座標值顯示前述係數的位置之訊號。
  10. 一種圖像解碼裝置,係將編碼圖像資料進行解碼之圖像解碼裝置,包含有:上下文控制部,係決定前述編碼圖像資料所含之解碼對象訊號用之上下文者;2進制算術解碼部,係依照與所決定之前述上下文對應之機率資訊,將前述解碼對象訊號進行算術解碼,而產生2進制訊號者;及多進制處理部,係將前述2進制訊號進行多進制處理者;前述上下文控制部係:於前述解碼對象訊號顯示頻率區域之處理單位所含之係數時,取得顯示前述係數之處理單位內之位置之位置資訊;決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述解碼對象訊號用之上下文,前述區分為根據位元流中所含之區分資訊分割前述處理單位而得到之多數區分中之1個區分且為前述位置資訊所示之位置所屬之區分;並根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新。
  11. 一種圖像編碼解碼裝置,包含有:圖像編碼裝置,係藉將圖像資料進行編碼,而產生編碼圖像資料者;及圖像解碼裝置,係將前述編碼圖像資料進行解碼者;前述圖像編碼裝置包含有:變換部,係藉將前述圖像資料進行頻率變換,而產生頻率區域之處理單位者;2進制處理部,係藉將前述處理單位所含之係數進行2進制處理,而產生2進制訊號者;第1上下文控制部,係決定前述2進制訊號用之上下文者;及2進制算術編碼部,係按照與所決定之前述上下文對應之機率資訊,而將前述2進制訊號進行算術編碼者;前述第1上下文控制部係:決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述2進制訊號用之上下文,前述區分為分割前述處理單位而所得到之多數區分中之1個區分且為含有業經2進制處理之前述係數之區分;並根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新;前述圖像解碼裝置包含有:第2上下文控制部,係決定前述編碼圖像資料所含之解碼對象訊號用之上下文者;2進制算術解碼部,係依照與所決定之前述上下文對 應之機率資訊,將前述解碼對象訊號進行算術解碼,而產生2進制訊號者;及多進制處理部,係將前述2進制訊號進行多進制處理者;前述第2上下文控制部係:於前述解碼對象訊號顯示為頻率區域之處理單位所含之係數時,取得顯示前述係數之處理單位內之位置之位置資訊,決定相對於區分所含之多數係數共通之1個以上之上下文,作為前述解碼對象訊號用之上下文,前述區分為根據位元流中所含之區分資訊分割前述處理單位而得到之多數區分中之1個區分且為前述位置資訊所示之位置所屬之區分,並根據前述2進制訊號,而將與所決定之前述上下文對應之機率資訊更新。
TW101101441A 2011-01-14 2012-01-13 An image coding method, an image coding apparatus, an image decoding method, an image decoding apparatus, and an image coding / decoding apparatus TWI572192B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201161432724P 2011-01-14 2011-01-14

Publications (2)

Publication Number Publication Date
TW201249209A TW201249209A (en) 2012-12-01
TWI572192B true TWI572192B (zh) 2017-02-21

Family

ID=46490815

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101101441A TWI572192B (zh) 2011-01-14 2012-01-13 An image coding method, an image coding apparatus, an image decoding method, an image decoding apparatus, and an image coding / decoding apparatus

Country Status (3)

Country Link
US (1) US8687904B2 (zh)
TW (1) TWI572192B (zh)
WO (1) WO2012096185A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9042440B2 (en) * 2010-12-03 2015-05-26 Qualcomm Incorporated Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding
US20120163456A1 (en) 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
WO2012114711A1 (ja) * 2011-02-23 2012-08-30 パナソニック株式会社 画像符号化方法および画像復号方法
US9106913B2 (en) 2011-03-08 2015-08-11 Qualcomm Incorporated Coding of transform coefficients for video coding
US10499059B2 (en) 2011-03-08 2019-12-03 Velos Media, Llc Coding of transform coefficients for video coding
US8805099B2 (en) * 2011-06-22 2014-08-12 Panasonic Intellectual Property Corporation Of America Image decoding method and image coding method
US9167253B2 (en) 2011-06-28 2015-10-20 Qualcomm Incorporated Derivation of the position in scan order of the last significant transform coefficient in video coding
ES2496365T3 (es) * 2011-10-24 2014-09-18 Blackberry Limited Codificación y descodificación de mapas significativos usando selección de la partición
US9503717B2 (en) 2012-01-09 2016-11-22 Texas Instruments Incorporated Context adaptive binary arithmetic coding (CABAC) with scalable throughput and coding efficiency
US9621894B2 (en) 2012-01-13 2017-04-11 Qualcomm Incorporated Determining contexts for coding transform coefficient data in video coding
US9172962B2 (en) * 2012-01-20 2015-10-27 Blackberry Limited Methods and systems for pipelining within binary arithmetic coding and decoding
US9237344B2 (en) 2012-03-22 2016-01-12 Qualcomm Incorporated Deriving context for last position coding for video coding
US10284613B2 (en) 2014-02-18 2019-05-07 Dropbox, Inc. Streaming of variable length content segments
US10264264B2 (en) * 2016-09-24 2019-04-16 Apple Inc. Multi-bin decoding systems and methods
WO2020106795A1 (en) * 2018-11-21 2020-05-28 Interdigital Vc Holdings, Inc. Residual coding with reduced usage of local neighborhood

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070110153A1 (en) * 2005-11-14 2007-05-17 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding an image using the same coding mode across components
US20070237240A1 (en) * 2006-04-06 2007-10-11 Samsung Electronics Co., Ltd. Video coding method and apparatus supporting independent parsing

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4368575B2 (ja) 2002-04-19 2009-11-18 パナソニック株式会社 可変長復号化方法、可変長復号化装置およびプログラム
JP4090862B2 (ja) 2002-04-26 2008-05-28 松下電器産業株式会社 可変長符号化方法および可変長復号化方法
JP4230188B2 (ja) 2002-06-06 2009-02-25 パナソニック株式会社 可変長符号化方法および可変長復号化方法
US6795584B2 (en) 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
JP3959039B2 (ja) 2003-02-28 2007-08-15 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム
EP1453004A2 (en) 2003-02-28 2004-09-01 NTT DoCoMo, Inc. Image encoding apparatus and method
US6900748B2 (en) * 2003-07-17 2005-05-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for binarization and arithmetic coding of a data value
US7379608B2 (en) * 2003-12-04 2008-05-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Arithmetic coding for transforming video and picture data units
JP2006019814A (ja) 2004-06-30 2006-01-19 Fujitsu Ltd エントロピ復号器
US7573407B2 (en) 2006-11-14 2009-08-11 Qualcomm Incorporated Memory efficient adaptive block coding
KR101356733B1 (ko) * 2007-03-07 2014-02-05 삼성전자주식회사 컨텍스트 기반 적응적 이진 산술 부호화, 복호화 방법 및장치
NO328295B1 (no) 2007-12-20 2010-01-25 Tandberg Telecom As VLC-fremgangsmate og -innretning
US8891615B2 (en) * 2008-01-08 2014-11-18 Qualcomm Incorporated Quantization based on rate-distortion modeling for CABAC coders
WO2011002914A1 (en) 2009-06-30 2011-01-06 Massachusetts Institute Of Technology System and method for providing high throughput entropy coding using syntax element partitioning
JP5679980B2 (ja) 2009-11-02 2015-03-04 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置
WO2011128268A1 (en) * 2010-04-13 2011-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Probability interval partioning encoder and decoder
US8913666B2 (en) * 2010-10-01 2014-12-16 Qualcomm Incorporated Entropy coding coefficients using a joint context model
US20120082235A1 (en) * 2010-10-05 2012-04-05 General Instrument Corporation Coding and decoding utilizing context model selection with adaptive scan pattern
US9042440B2 (en) * 2010-12-03 2015-05-26 Qualcomm Incorporated Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding
US20120163448A1 (en) * 2010-12-22 2012-06-28 Qualcomm Incorporated Coding the position of a last significant coefficient of a video block in video coding
US20120163456A1 (en) * 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070110153A1 (en) * 2005-11-14 2007-05-17 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding an image using the same coding mode across components
US20070237240A1 (en) * 2006-04-06 2007-10-11 Samsung Electronics Co., Ltd. Video coding method and apparatus supporting independent parsing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
J. Sole, R. Joshi, I. S. Chong, M. Coban, M. Karczewicz, "Parallel Context Processing for the significance map in high coding efficiency", JCTVC-D262, 2011-01-21 *

Also Published As

Publication number Publication date
US8687904B2 (en) 2014-04-01
US20120183235A1 (en) 2012-07-19
WO2012096185A1 (ja) 2012-07-19
TW201249209A (en) 2012-12-01

Similar Documents

Publication Publication Date Title
TWI572192B (zh) An image coding method, an image coding apparatus, an image decoding method, an image decoding apparatus, and an image coding / decoding apparatus
JP6531924B2 (ja) 動画像復号方法及び動画像復号装置
TWI572193B (zh) An image coding method, an image coding apparatus, an image decoding method, an image decoding apparatus, and an image coding / decoding apparatus
TWI604717B (zh) Coding method and encoding device
AU2012206251B2 (en) Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
TWI554947B (zh) 動態圖像編碼方法、動態圖像編碼裝置、動態圖像解碼方法、及動態圖像解碼裝置
TWI559752B (zh) An image coding method, an image decoding method, an image coding apparatus, an image decoding apparatus, and an image coding / decoding apparatus
RU2609064C9 (ru) Способ кодирования изображений, способ декодирования изображений, устройство кодирования изображений и устройство декодирования изображений
TWI580265B (zh) An image coding method, an image decoding method, an image coding apparatus, an image decoding apparatus, and an image coding / decoding apparatus
TW201334563A (zh) 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、及圖像編碼解碼裝置
SG187781A1 (en) Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
JP6489337B2 (ja) 算術復号方法および算術符号化方法
TW201404171A (zh) 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置及圖像編碼解碼裝置
TW201412125A (zh) 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置及圖像編碼解碼裝置
CA2841107A1 (en) Image encoding and decoding using context adaptive binary arithmetic coding with a bypass mode
AU2013300958A1 (en) Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
KR101888218B1 (ko) 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치
WO2012105267A1 (ja) 画像符号化方法
WO2012077349A1 (ja) 画像符号化方法および画像復号化方法