JP3920849B2 - 画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法 - Google Patents

画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法 Download PDF

Info

Publication number
JP3920849B2
JP3920849B2 JP2003509782A JP2003509782A JP3920849B2 JP 3920849 B2 JP3920849 B2 JP 3920849B2 JP 2003509782 A JP2003509782 A JP 2003509782A JP 2003509782 A JP2003509782 A JP 2003509782A JP 3920849 B2 JP3920849 B2 JP 3920849B2
Authority
JP
Japan
Prior art keywords
appearance frequency
decoding
partial image
image
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003509782A
Other languages
English (en)
Other versions
JPWO2003003745A1 (ja
Inventor
俊一 関口
晃 金野
和夫 杉本
稔 栄藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of JPWO2003003745A1 publication Critical patent/JPWO2003003745A1/ja
Application granted granted Critical
Publication of JP3920849B2 publication Critical patent/JP3920849B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/97Matching pursuit coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Description

技術分野
本発明は、画像を少ない符号化量で伝送及び蓄積することができる画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法に関する。
背景技術
従来から、ITU−T H.26xやMPEGシリーズなどの標準動画像符号化方式が知られている。この標準動画像符号化方式では、圧縮効率と実装負荷とのバランスや専用LSIの普及等の観点から、主に離散コサイン変換(discrete cosine transform:以下、「DCT」という。)が用いられている。しかし、DCTは、基底係数の量子化を行うため、極めて低いビットレートで符号化を行う場合、本来の信号の表現にとって重要である基底が復元できなくなり、その結果、歪みが発生するという問題を有している。このような問題を解決する手法として、R.Neff et.al,“Very Low Bit−rate Video Coding Based on Matching Pursuits”,IEEE Trans.on CSVT,vol.7,pp.158−171,Feb.1997、などで提案されているMatching Pursuitsベースの映像符号化方式がある。Matching Pursuitsとは、フレーム間予測残差信号を過完備(over−complete)な基底セットの線形和として表現する手法であり、基底表現の単位がブロックに限定されないこと、過完備な基底パターンによって非定常な信号を少ない基底係数でコンパクトに表現できる可能性とから、低レート符号化時にDCT符号化よりも視覚的に優れた映像品質が得られるという特徴を有する。Matching Pursuitsでは、符号化対象となる予測残差画像信号fは、n種類の基底g∈G(1≦k≦n)からなる予め用意される過完備(over−complete)な基底セットGを用いて、次式のように表現することができる。
Figure 0003920849
ここで、mは基底探索総ステップ数、iは基底探索ステップ番号、rは第i−1ステップ目の基底探索まで完了した後の予測残差画像信号であり、これをそのまま第iステップ目の基底探索の対象となる予測残差画像信号とする。ただし、r=fとする。またsおよびgkiは、第iステップ目の基底探索においてr上の任意の部分領域s(フレーム内の部分領域)と基底セットGに含まれる任意の基底gのうち、sとgの内積値を最大とする組み合わせを選択することによって得られる部分領域および基底である。基底探索をこのように行えば、基底探索ステップ数mが大きければ大きいほどrの持つエネルギーは小さくなる。これは、予測残差画像信号fの表現に使用する基底の数が多ければ多いほど信号をよく表現できることを意味する。
符号化される情報は、各基底探索ステップにおいて、
▲1▼gkiを示すインデックス(gは符号化側、復号側で共通して保持しており、そのインデックス情報だけを交換することで基底を特定することができる)、
▲2▼内積値<s,gki>(基底係数に該当する)、
▲3▼sの中心点の画面内位置情報p=(x,y)である。
これらのパラメータの組をまとめて、アトムと呼ぶ。この画像信号表現および符号化方法によれば、符号化するアトムの数を増やす、すなわち基底探索総ステップ数mを増やすほど符号化量が増加し、歪みが小さくなる。
一方、Matching Pursuits符号化の優れた性能を引き出すためには、その符号化対象情報であるアトムパラメータを効率的にエントロピー符号化することが重要となる。Matching Pursuits映像符号化では、フレーム間予測残差信号をフレーム単位で用意し、まず、フレーム内で符号化情報として表現すべき部分信号を特定する。この部分信号はフレーム内のどの位置にあっても良いが、通常映像信号では、動きが大きい、すなわち情報量の大きな信号箇所は、残差信号の電力が大きい箇所と考えて良いため、まず予測残差フレーム内で電力最大の箇所を当該部分信号として検出する方法が一般的である。このとき、当該部分信号が基底表現されるのであるが、そのフレーム内の位置情報を符号化する必要がある。基底表現に関しては、予め与えられた基底コードブックに含まれる基底の内、当該部分信号をもっともよく表現する基底を選択して、そのインデックスと基底係数(上記部分信号と基底との内積値)とを符号化情報として伝送・記録する。
上記のMatching Pursuits、DCTに関わらず、従来の映像符号化方式では、信号の冗長度削減、量子化を経た後の符号化パラメータは、ハフマン符号によるエントロピー符号化を行ってきた。一方、ハフマン符号は、符号化しようとするシンボルに対して整数長の符号しか割り当てることができないという制約がある。これを克服する手段として算術符号化が提案されている。算術符号化の原理については、例えば、″The Data Compression Book 2nd edition″,Mark Nelson and Jean−Loup Gailly,M&T Books,1995などに詳説されている。符号化対象シンボルの各アルファベットの典型的な出現頻度を0〜1の数直線上の区間に割り当て、あるシンボルが現れたときに、まず、そのシンボルが属する区間を選択し、次のシンボルでは前のシンボルが属する区間を0〜1とみなして、その中での当該シンボルの属する区間を選択する。この操作を繰り返すことによって、有限長のシンボル系列をひとつの0〜1の間の数値の形で表現することが可能となる。このことから、算術符号化は、シンボルあたりの符号長を小数精度で表現することができ、一般にハフマン符号よりもエントロピー符号化効率が向上することが知られている。
発明の開示
映像符号化に算術符号化の技術を導入した例としては、ITU−T H.263映像符号化方式 Annex Eに採用されているSyntax−based Arithmetic Coding mode(以下、「SAC」という。)がある。SACでは、H.263における各符号化データごとに独立な固定の出現頻度テーブルを与え、それに基づいた算術符号化を行っている。従って、ある符号化データの発生確率が他の符号化データの発生状況に影響されるケースや、映像フレームを固定ブロックなどの領域単位で符号化を行う場合に、各ブロックのある符号化データが、その周辺のブロックの同一符号化データの発生状況に影響を受けるケースなどは考慮されていない。このため、特に、映像のように時間的・空間的な依存性を有する信号において、算術符号化の効率を十分に生かすことができない。
上記の論文に示されるような従来のMatching Pursuits符号化方式では、他の多くの映像符号化標準方式と同様に、アトムパラメータのエントロピー符号化において、個々のデータ発生頻度に基づいたハフマン符号を固定的に割り振る手法が採られている。これに対し、本発明は、算術符号化を導入することにより、Matching Pursuits符号化のアトムパラメータのエントロピー符号化効率の向上を図ることを目的とする。さらに、算術符号化の効率を向上させるために、Matching Pursuits符号化におけるアトムパラメータの相互依存関係に着目し、条件付き確率に基づく文脈(コンテキスト)モデルを定義し、コンテキストによって出現頻度テーブルを切り替えてアトムパラメータのエントロピー符号化効率の改善を行うことを目的とする。
上記課題を解決するために、本発明の画像符号化装置は、所定の部分画像領域内における予測残差データの単位要素の位置を示す位置情報を上記部分画像領域ごとに獲得する位置情報獲得手段と、上記部分画像領域内に存在する予測残差データの単位要素の数に応じて、符号化対象である部分画像領域内の上記位置情報の出現頻度分布を決定するコンテキスト決定手段と、上記決定された出現頻度分布に基づいて上記位置情報の算術符号化を行う可逆符号化手段とを備えることを特徴とする。
また、これに対応する画像復号装置は、所定の部分画像領域内における予測残差データの単位要素の位置を示す位置情報を上記部分画像領域ごとに復号する可逆復号手段と、上記部分画像領域内に存在する予測残差データの単位要素の数に応じて、復号対象である部分画像領域内の上記位置情報の出現頻度分布を決定するコンテキスト決定手段と、上記決定された出現頻度分布に基づいて上記位置情報の算術復号を行う算術復号手段とを備えることを特徴とする。
さらに、上記課題を解決するために、本発明の画像符号化方法は、所定の部分画像領域内における予測残差データの単位要素の位置を示す位置情報を上記部分画像領域ごとに獲得する位置情報獲得ステップと、上記部分画像領域内に存在する予測残差データの単位要素の数に応じて、符号化対象となる部分画像領域内の上記位置情報の出現頻度分布を決定するコンテキスト決定ステップと、上記決定された出現頻度分布に基づいて上記位置情報の算術符号化を行う可逆符号化ステップとを含むことを特徴とする。
また、これに対応する画像復号方法は、所定の部分画像領域内における予測残差データの単位要素の位置を示す位置情報を上記部分画像領域ごとに復号する可逆復号ステップと、上記部分画像領域内に存在する予測残差データの単位要素の数に応じて、復号対象である部分画像領域内の上記位置情報の出現頻度分布を決定するコンテキスト決定ステップと、上記決定された出現頻度分布に基づいて上記位置情報の算術復号を行う算術復号ステップとを含むことを特徴とする。
位置情報の値(例えばあるアトム位置から他のアトム位置までの差分)の分布は、部分画像領域内に存在する予測残差データの単位要素(アトム)の数に大きく依存する。従って、部分画像領域内に存在する予測残差データの単位要素の数に応じて、符号化対象となる部分画像領域内の位置情報の出現頻度分布を決定し、このように決定された出現頻度分布に基づいて位置情報の算術符号化を行うことで、位置情報のエントロピー符号化効率の向上が図られる。
また、上記課題を解決するために、本発明の画像符号化装置は、所定の部分画像領域内における予測残差データ分布のクラス分けを行い、クラス情報を上記部分画像領域ごとに獲得する予測残差分布クラス分け手段と、上記部分画像領域のクラス情報に基づいて、上記部分画像領域内における予測残差データの単位要素の表現に用いる基底係数情報の出現頻度分布を決定するコンテキスト決定手段と、上記決定された出現頻度分布に基づいて上記基底係数情報の算術符号化を行う可逆符号化手段とを備えることを特徴とする。
また、これに対応する画像復号装置は、所定の部分画像領域内における予測残差データ分布のクラス情報、及び上記部分画像領域内における予測残差データの単位要素の表現に用いる基底係数情報を復号する可逆復号手段と、上記クラス情報に基づいて、上記部分画像領域内における予測残差データの単位要素の表現に用いる基底係数情報の出現頻度分布を決定するコンテキスト決定手段と、上記決定された出現頻度分布に基づいて上記基底係数情報の算術復号を行う算術復号手段とを備えることを特徴とする。
さらに、上記課題を解決するために、本発明の画像符号化方法は、所定の部分画像領域内における予測残差データ分布のクラス分けを行い、クラス情報を上記部分画像領域ごとに獲得する予測残差分布クラス分けステップと、上記部分画像領域のクラス情報に基づいて、上記部分画像領域内における予測残差データの単位要素の表現に用いる基底係数情報の出現頻度分布を決定するコンテキスト決定ステップと、上記決定された出現頻度分布に基づいて上記基底係数情報の算術符号化を行う可逆符号化ステップとを含むことを特徴とする。
また、これに対応する画像復号方法は、所定の部分画像領域内における予測残差データ分布のクラス情報、及び上記部分画像領域内における予測残差データの単位要素の表現に用いる基底係数情報を復号する可逆復号ステップと、上記クラス情報に基づいて、上記部分画像領域内における予測残差データの単位要素の表現に用いる基底係数情報の出現頻度分布を決定するコンテキスト決定ステップと、上記決定された出現頻度分布に基づいて上記基底係数情報の算術復号を行う算術復号ステップとを含むことを特徴とする。
予測残差データ分布は特定の特徴量を用いていくつかのクラス(グループ)に分けられる場合が多い。クラス情報に基づいて基底係数情報の出現頻度分布を決定し、このように決定された出現頻度分布に基づいて基底係数情報の算術符号化を行うことで、変換基底情報のエントロピー符号化効率の向上が図られる。
また、上記課題を解決するために、本発明の画像符号化装置は、所定の部分画像領域内における予測残差データの単位要素の個数を示す個数情報を上記部分画像領域ごとに獲得する個数情報獲得手段と、符号化対象となる部分画像領域に隣接する部分画像領域における上記個数情報に応じて当該符号化対象となる部分画像領域の上記個数情報の出現頻度分布を決定するコンテキスト決定手段と、上記決定された出現頻度分布に基づいて上記個数情報の算術符号化を行う可逆符号化手段とを備えることを特徴とする。
また、これに対応する画像復号装置は、所定の部分画像領域内における予測残差データの単位要素の個数を示す個数情報を上記部分画像領域ごとに復号する可逆復号手段と、復号対象となる部分画像領域に隣接する部分画像領域内における上記個数情報に応じて当該復号対象となる部分画像領域の上記個数情報の出現頻度分布を決定するコンテキスト決定手段と、上記決定された出現頻度分布に基づいて上記個数情報の算術復号を行う算術復号手段とを備えることを特徴とする。
さらに、上記課題を解決するために、本発明の画像符号化方法は、所定の部分画像領域内における予測残差データの単位要素の個数を示す個数情報を上記部分画像領域ごとに獲得する個数情報獲得ステップと、符号化対象となる部分画像領域に隣接する部分画像領域における上記個数情報に応じて当該符号化対象となる部分画像領域の上記個数情報の出現頻度分布を決定するコンテキスト決定ステップと、上記決定された出現頻度分布に基づいて上記個数情報の算術符号化を行う可逆符号化ステップとを備えることを特徴とする。
また、これに対応する画像復号方法は、所定の部分画像領域内における予測残差データの単位要素の個数を示す個数情報を上記部分画像領域ごとに復号する可逆復号ステップと、復号対象となる部分画像領域に隣接する部分画像領域内における上記個数情報に応じて当該復号対象となる部分画像領域の上記個数情報の出現頻度分布を決定するコンテキスト決定ステップと、上記決定された出現頻度分布に基づいて上記個数情報の算術復号を行う算術復号ステップとを備えることを特徴とする。
所定の部分画像領域内における予測残差データの単位要素(アトム)の個数は、当該部分画像領域に隣接する部分画像領域における予測残差データの単位要素(アトム)の個数に大きく依存する。従って、隣接する部分画像領域における単位要素(アトム)の個数情報に応じて、符号化対象となる上記所定の部分画像領域の個数情報の出現頻度分布を決定し、このように決定された出現頻度分布に基づいて個数情報の算術符号化を行うことで、上記個数情報のエントロピー符号化効率の向上が図られる。
また、上記課題を解決するために、本発明の画像符号化装置は、所定の部分画像領域内における予測残差データの単位要素の個数を示す個数情報を上記部分画像領域ごとに獲得する個数情報獲得手段と、符号化対象となる部分画像領域の画像の動き情報を検出する動き検出手段と、符号化対象となる部分画像領域における画像の動き情報に応じて当該符号化対象となる部分画像領域の上記個数情報の出現頻度分布を決定するコンテキスト決定手段と、上記決定された出現頻度分布に基づいて上記個数情報の算術符号化を行う可逆符号化手段とを備えることを特徴とする。
また、これに対応する画像復号装置は、所定の部分画像領域内における予測残差データの単位要素の個数を示す個数情報を上記部分画像領域ごとに復号する可逆復号手段と、復号対象となる部分画像領域における画像の動き情報を上記部分画像領域ごとに復号する可逆復号手段と、上記部分画像領域内における画像の動き情報に応じて復号対象となる部分画像領域の上記個数情報の出現頻度分布を決定するコンテキスト決定手段と、上記決定された出現頻度分布に基づいて上記個数情報の算術復号を行う算術復号手段とを備えることを特徴とする。
さらに、上記課題を解決するために、本発明の画像符号化方法は、所定の部分画像領域内における予測残差データの単位要素の個数を示す個数情報を上記部分画像領域ごとに獲得する個数情報獲得ステップと、符号化対象となる部分画像領域の画像の動き情報を検出する動き検出ステップと、符号化対象となる部分画像領域における画像の動き情報に応じて当該符号化対象となる部分画像領域の上記個数情報の出現頻度分布を決定するコンテキスト決定ステップと、上記決定された出現頻度分布に基づいて上記個数情報の算術符号化を行う可逆符号化ステップとを備えることを特徴とする。
また、これに対応する画像復号方法は、所定の部分画像領域内における予測残差データの単位要素の個数を示す個数情報を上記部分画像領域ごとに復号する可逆復号ステップと、復号対象となる部分画像領域における画像の動き情報を上記部分画像領域ごとに復号する可逆復号ステップと、上記部分画像領域内における画像の動き情報に応じて復号対象となる部分画像領域の上記個数情報の出現頻度分布を決定するコンテキスト決定ステップと、上記決定された出現頻度分布に基づいて上記個数情報の算術復号を行う算術復号ステップとを備えることを特徴とする。
所定の部分画像領域内における予測残差データの単位要素の個数は、当該所定の部分画像領域における画像の動き情報に大きく依存する。従って、符号化対象となる部分画像領域における画像の動き情報に応じて当該符号化対象となる部分画像領域における上記単位要素の個数情報の出現頻度分布を決定し、このように決定された出現頻度分布に基づいて個数情報の算術符号化を行うことで、上記個数情報のエントロピー符号化効率の向上が図られる。
また、上記課題を解決するために、本発明の画像符号化装置は、所定の部分画像領域内における予測残差データの単位要素の表現に用いる基底係数情報を上記単位要素ごとに獲得する係数情報獲得手段と、符号化対象となる部分画像領域内における予測残差データの検出された順序に応じて当該符号化対象となる部分画像領域の上記基底係数情報の出現頻度分布を決定するコンテキスト決定手段と、上記決定された出現頻度分布に基づいて上記基底係数情報の算術符号化を行う可逆符号化手段とを備えることを特徴とする。
また、これに対応する画像復号装置は、所定の部分画像領域内における予測残差データの単位要素の表現に用いる基底係数情報の復号順序に応じて復号対象となる部分画像領域の上記基底係数情報の出現頻度分布を決定するコンテキスト決定手段と、上記決定された出現頻度分布に基づいて上記基底係数情報の算術復号を行う算術復号手段とを備えることを特徴とする。
さらに、上記課題を解決するために、本発明の画像符号化方法は、所定の部分画像領域内における予測残差データの単位要素の表現に用いる基底係数情報を上記単位要素ごとに獲得する係数情報獲得ステップと、符号化対象となる部分画像領域内における予測残差データの検出された順序に応じて当該符号化対象となる部分画像領域の上記基底係数情報の出現頻度分布を決定するコンテキスト決定ステップと、上記決定された出現頻度分布に基づいて上記基底係数情報の算術符号化を行う可逆符号化ステップとを備えることを特徴とする。
また、これに対応する画像復号方法は、所定の部分画像領域内における予測残差データの単位要素の表現に用いる基底係数情報の復号順序に応じて復号対象となる部分画像領域の上記基底係数情報の出現頻度分布を決定するコンテキスト決定ステップと、上記決定された出現頻度分布に基づいて上記基底係数情報の算術復号を行う算術復号ステップとを備えることを特徴とする。
所定の部分画像領域内における予測残差データの単位要素の表現に用いる基底係数情報は、当該所定の部分画像領域内における予測残差データの検出された順序に大きく依存する。符号化対象となる部分画像領域内における予測残差データの検出された順序に応じて当該符号化対象となる部分画像領域の上記基底係数情報の出現頻度分布を決定し、このように決定された出現頻度分布に基づいて上記基底係数情報の算術符号化を行うことで、上記基底係数情報のエントロピー符号化効率の向上が図られる。
発明を実施するための最良の形態
(実施の形態1)
実施の形態1に係る画像符号化装置及び復号装置は、画像フレーム列からなる映像信号を入力し、主に、フレーム間動き補償予測手段と、符号化モード選択手段、テクスチャ信号の圧縮符号化手段とから構成される符号化装置と、この符号化装置によって生成された圧縮映像データ(以下、「ビットストリーム」という。)を受信して映像信号を再生する復号装置とから構成される。
図1を参照して、実施の形態1に係る画像符号化装置について説明する。入力映像信号101は、フレーム画像の時間系列であり、以下、フレーム画像単位の信号を表すものとする。フレームは、16画素×16ライン固定の正方矩形領域(以下、「マクロブロック」という。)に分割され、その単位で以下の処理が行われる。すなわち、入力映像信号101のマクロブロックデータは、まず動き検出部102に送られ、動き検出部102において動きベクトル105の検出が行われる。動きベクトル105は、フレームメモリ103に格納されている過去の符号化済みフレーム104(以下、「局所復号画像」という。)の所定の探索領域を参照して、符号化しようとするマクロブロックと類似するパターンを見つけ出し、そのパターンと現在のマクロブロックとの間の空間的移動量を求めたものである。動きベクトル105は2次元の平行移動量で表現される。この動きベクトル105の検出方法としては、一般にブロックマッチングなどの手法が用いられる。動きベクトル105を付与する単位は、図3A〜Gに示すように、マクロブロックを種々の矩形領域に均等分割した単位で定義できるようにし、どのようなブロック形状を使用するかを示す識別情報を符号化モード情報として伝送するようにしてもよい。
例えば、図3Aに示すMC(Motion Compensation)モード1では、マクロブロックそのものを動きベクトル付与単位とするため、マクロブロックにつき1本の動きベクトルが定まる。それに対し、図3Bに示すMCモード2では、マクロブロックを左右半分に分割した領域を動きベクトル付与単位とし、1マクロブロックあたり2本の動きベクトルが定まる。同様に、図3Gに示すMCモード7では1マクロブロックあたり16本の動きベクトルが定まる。
また、動き検出に用いられる局所復号画像は、過去のフレームだけに限定されるものではなく、未来のフレームを先に符号化しておきフレームメモリに格納して使用することもできる。例えばMPEGシリーズにおけるBフレーム予測がこれに該当する。
一方、過去のフレームのみを使用する予測をPフレーム予測と呼び、フレーム間予測を使用せずに自身のフレーム内で閉じた符号化を行う場合をIフレームと呼んで区別している。未来のフレームを使用すると、符号化順序の入れ替えが生じて処理遅延が増えるものの、過去と未来の間に生じた映像内容の変動を予測しやすくなり、時間冗長度を更に効果的に削減することができるメリットがある。
動きベクトル105が求まると、動き補償部107において、動きベクトル105を用いてフレームメモリ内の局所復号画像104から予測画像106を取り出す。動き検出部102と動き補償部107とは、マクロブロックごとに処理を行うが、入力映像信号101との差分信号(予測残差信号108)は、フレームを単位として得るものとする。すなわち、個々のマクロブロックの動きベクトル105は、フレーム全体に渡って保持され、予測画像106は、フレーム単位の画像として構成される。
次に、アトム抽出部109において、予測残差信号108に対して、上述したMatching Pursuitsのアルゴリズムに基づいて、アトムパラメータ112が生成される。基底セットg111は、基底コードブック110に格納されており、この中から各部分信号に充てるべき基底を選択する。アトムの抽出は、マクロブロックの構造にとらわれず、フレーム全域を対象として実施される。その実施動作を図4A,Bに示す。図4A,Bでは、アトムの位置がマクロブロックの構造に依存していないことを示している。ここで、図4A,Bは、予測残差フレームを示しており、図中の点線で区切られている複数の矩形領域はマクロブロックMBである。また、図4Bに示すアトムATの中心位置は、その中心位置が存在するマクロブロックと、そのマクロブロック内の座標によって表現される。一方、アトムの符号化シンタックスとしては、マクロブロック単位で伝送できる規則を用いる。そのため、数式(1)からもわかるように、アトムの符号化順序が復号画像に影響を与えないことを用いて、フレームの左上隅を原点とする2次元座標上で順番に並ぶようにソートを行い、かつ、マクロブロックの単位にアトムをカウントするように符号化順序を構成する。こうして、マクロブロック単位に、その内部に含まれるアトムの数分だけ、アトムパラメータ112(基底インデックス、位置情報、基底係数)を符号化する構成とする。また、マクロブロック内に何個のアトムが含まれるのかを示す情報(マクロブロック内アトム数)も符号化する。これらのアトムパラメータは、可変長符号化部113によってエントロピー符号化された後、圧縮ストリーム114として伝送・記録される。
アトム復号部115では、これらのアトムパラメータ112から局所復号残差信号116を復元し、予測画像106と加算することによって、局所復号画像117を得る。局所復号画像117は、次のフレームの動き補償予測に用いられるため、フレームメモリ103に格納される。
次に、図2を参照して、実施の形態1に係る復号装置について説明する。この復号装置では、圧縮ストリーム114を受信した後、可変長復号部118で各フレームの先頭を表す同期ワードを検出し、以後、マクロブロック単位に、動きベクトル105、アトムパラメータ112が一意に復元される。動きベクトル105は、動き補償部107に送られ、予測画像106を得る。アトムパラメータ112は、アトム復号部115で復号される。基底は、基底コードブック110に基底インデックスを与えることで取り出される。アトム復号部115の出力116は、予測画像106と加算され、復号画像117となる。復号画像117はこれ以降のフレームの動き補償予測に用いられるため、フレームメモリ103に格納される。復号画像117は、所定の表示タイミングで表示デバイスへ出力され、映像が再生される。
次に、本発明のポイントとなる可変長符号化部113、及び可変長復号部118について説明する。可変長符号化部113、及び可変長復号部118は、図1の画像符号化装置において得られるアトムパラメータに対して、個々のパラメータにおける近傍領域間の依存関係や各パラメータ間の依存関係を用いて、出現頻度テーブルを適応的に切り替えることによって、状況に応じて最も適した出現頻度テーブルを用いるようにし、算術符号化の符号化効率を向上させる。
図5に、可変長符号化部113の構成を示す。図5において、入力119は、上述したアトムパラメータ112に加え、当該マクロブロックの符号化モード情報も含めるものとする。実施の形態1では、入力119のうち、以下の情報に対してコンテキストを定義する。
▲1▼符号化モード情報
▲2▼位置情報
▲3▼基底を示すインデックス
▲4▼マクロブロック内アトム数
これらの情報は、出現頻度テーブルをビット単位で切り替えられるようにするため、二値化処理部121において所定の規則で二値化される。これにより、0、1の出現頻度のテーブルが二値化後のビット位置に応じて切り替わるように構成される。出現頻度テーブルの切替えは、コンテキスト決定部120において行われる。コンテキスト決定部120は、二値化処理部121から与えられる符号化対象のビット位置125に応じて、その時点でのコンテキストに適した出現頻度テーブル123を決定し、算術符号化部124へ与える。
次に、各情報に対するコンテキストの定義について説明する。
(1)符号化モード情報と対応コンテキスト
入力119のうち、符号化モード情報とは、例えば、当該マクロブロックが図3A〜Gに示したいずれかの動きベクトル付与単位で符号化されているか、あるいはフレーム間(インター)符号化されているかフレーム内(イントラ)符号化されているかなどの情報をマクロブロックの符号化データとして復号装置に与えるものである。実施の形態1では、この符号化モードの選択肢を、例えば以下のように定める。
符号化モード1 :スキップ
符号化モード2 :MCモード1(図3A)、アトムなし
符号化モード3 :MCモード2(図3B)、アトムなし
符号化モード4 :MCモード3(図3C)、アトムなし
符号化モード5 :MCモード4(図3D)、アトムなし
符号化モード6 :MCモード5(図3E)、アトムなし
符号化モード7 :MCモード6(図3F)、アトムなし
符号化モード8 :MCモード7(図3G)、アトムなし
符号化モード9 :イントラ符号化、アトムなし
符号化モード10:MCモード1(図3A)、アトムあり
符号化モード11:MCモード2(図3B)、アトムあり
符号化モード12:MCモード3(図3C)、アトムあり
符号化モード13:MCモード4(図3D)、アトムあり
符号化モード14:MCモード5(図3E)、アトムあり
符号化モード15:MCモード6(図3F)、アトムあり
符号化モード16:MCモード7(図3G)、アトムあり
符号化モード17:イントラ符号化、アトムあり
ここで、符号化モード1の「スキップ」とは、動きベクトルがゼロでアトムも符号化しないケースで、これは参照画像の空間的に同位置の画像をそのままコピーするモードに該当する。符号化モード2〜8は、図3A〜Gにおける個々のMCモードに対応した動きベクトルが存在するが、残差として符号化すべきアトムがない場合、符号化モード10〜16は、図3A〜Gにおける個々のMCモードに対応した動きベクトルが存在し、残差として符号化すべきアトムがある場合、符号化モード9は、イントラ符号化を行う場合であって、残差として符号化すべきアトムがない場合、符号化モード17はイントラ符号化を行う場合であって、残差として符号化すべきアトムがある場合である。なお、ここではイントラ符号化とは、DC成分のみの符号化を想定しており、AC成分は残差の形でアトムで符号化されることを想定している。
符号化モード情報に対するコンテキストは、図6に示すように定義する。図6において、A〜Cは、隣接し合うマクロブロックを示しており、マクロブロックCの符号化モード情報に対するコンテキストを以下のように定義する。
Figure 0003920849
ここで、CM1は、A又はBがスキップモードであるか否かをコンテキストとする。例えば、AもBもスキップの場合、CM1=0となり、AもBもスキップでない場合は、CM1=3となる。画像信号の性質から、明らかにCM1の値の違いはマクロブロックCの符号化モード情報の出現頻度に影響を与えるため、CM1の値に応じて出現頻度テーブルを切り替えることにより、算術符号化の効率改善が見込まれる。同時に、CM2では、A又はBが残差として符号化すべきアトムを含んでいるかどうかをコンテキストとする。これもCM1と同様、周辺の状況に応じて、マクロブロックCの中にアトムがあるか否かの頻度が変わってくるため、CM2の値に応じて出現頻度テーブルを切り替える。
二値化処理部121は、CM1及びCM2がそれぞれ、第1ビット目、第2ビット目に対応するように、符号化モード1〜17の符号化モード情報の二値化を実施する。これによって、ビット位置に応じた出現頻度テーブルの切替えを行うようにする。また、上記コンテキストは、常に、左及び上のマクロブロックの情報を必要とするため、これ以降のマクロブロックにおけるコンテキスト判断のため、現在のマクロブロックの符号化モード情報をコンテキスト決定部120にバッファリングしておく。
図13に符号化モード情報の二値化処理の一例を、図14に第1ビット目に対する4種類の出現頻度テーブル、図15に第2ビット目に対する4種類の出現頻度テーブルの一例を示す。
以下に本発明による符号化モード情報の算術符号化を図14および図15を用いて説明する。例えば、図6において符号化対象となっているマクロブロックCに隣接するマクロブロックAおよびマクロブロックBの符号化モード情報がいずれもスキップであった場合には、上記に示した式により算出されるCM1の値は0となる。この場合、マクロブロックCの符号化モード情報もスキップである可能性が高いと考えられ、図14に示すように、符号化モード情報の二値化処理後の第1ビット目が0となる(すなわちスキップモードが選択される)確率が高いテーブルであるCM1=0に対応する出現頻度テーブルを選択するよう動作する。
同様に例えばマクロブロックAおよびマクロブロックBの符号化モード情報がいずれもスキップモードでない場合には、上記に示した式により算出されるCM1の値は3となる。この場合、マクロブロックCの符号化モード情報もスキップとなる可能性は低いと考えられ、図14に示すように、符号化モード情報の二値化処理後の第1ビット目が0となる確率が低いテーブルであるCM1=3に対応する出現頻度テーブルを選択するよう動作する。
また、同様に例えばマクロブロックAおよびマクロブロックBの符号化モード情報がいずれもアトムが存在しないモードである場合には、上記に示した式により算出されるCM2の値は0となる。この場合、マクロブロックCの符号化モード情報もアトムが存在しないモードとなる可能性が高いと考えられ、図15に示すように、符号化モード情報の二値化処理後の第2ビット目が0となる(すなわちアトムが存在しないモードが選択される)確率が高いテーブルである、CM2=0に対応する出現頻度テーブルを選択するよう動作する。
同様に例えばマクロブロックAおよびマクロブロックBの符号化モード情報がいずれもアトムが存在するモードである場合には、上記に示した式により算出されるCM2の値は3となる。この場合、マクロブロックCの符号化モード情報はアトムが存在しないモードとなる可能性は低いと考えられ、図15に示すように、符号化モード情報の二値化処理後の第2ビット目が0となる(すなわちアトムが存在しないモードが選択される)確率が低いテーブルである、CM2=3に対応する出現頻度テーブルを選択するよう動作する。
(2)位置情報と対応コンテキスト
入力119のうち、位置情報とは、当該マクロブロック内におけるアトムの位置を、それらの差分として表現するデータである。図7A,Bに示すように、位置情報の値の分布はマクロブロック内アトム数に大きく依存する。例えば図7Aに示すように、マクロブロック内にアトムが少なければ、アトム間の距離は遠くなり、図7Bに示すように、アトムが多ければ必然的にアトム間の距離が縮まる。すなわち、マクロブロック内アトム数の値に応じて、位置情報の頻度分布が変わってくるため、これに基いてコンテキストを以下のように定める。
Figure 0003920849
ここで、Naは、マクロブロック内アトム数を示す。CM3は、マクロブロック内アトム数が所定の範囲内にある場合に、その時の位置情報の頻度分布を最もよく反映するように出現頻度テーブルを指定するための値である。
二値化処理部121は、CM3が第1ビット目の出現頻度の切替に使用できるよう、位置情報の二値化を実施する。
図16にアトムの位置情報の二値化処理の一例を、図17に第1ビット目に対する4種類の出現頻度テーブルの一例を示す。
以下に本発明によるアトムの位置情報の算術符号化を図16および図17を用いて説明する。例えば、符号化対象マクロブロックにおけるマクロブロック内アトム数が1つであった場合には、上記に示した式により算出されるCM3の値は0となる。この場合、マクロブロックCにおけるアトムの位置情報(すなわち、アトム間距離)は大きい値となる可能性が高いため、図17に示すように、アトムの位置情報の二値化処理後の第1ビット目が0となる(すなわちアトムの位置情報が0〜3の値を取る)確率が低いテーブルであるCM3=0に対応する出現頻度テーブルを選択するよう動作する。
同様に例えばマクロブロックCのマクロブロック内アトム数が10個であった場合には、上記に示した式により算出されるCM3の値は3となる。この場合、マクロブロックCにおけるアトム間の距離は小さな値をとる可能性が高くなるため、図17に示すように、アトムの位置情報の二値化処理後の第1ビット目が0となる(すなわちアトムの位置情報が0〜3の値を取る)確率が高いテーブルであるCM3=3に対応する出現頻度テーブルを選択するよう動作する。
(3)基底インデックスと対応コンテキスト
入力119のうち、基底インデックスとは、当該マクロブロック内における個々のアトムの基底係数を特定するためのインデックス番号である。図8Aに示すように、アトム抽出の第nステップ目の残差信号f(n)において、電力が大きくステップエッジのような急峻な波形変化を含むような残差信号が局在している場合、それ以降のアトム抽出ステップにおいて複数のアトムが同一箇所で集中的に抽出される確率が高い。f(n)から抽出されたアトムgknを差し引いて得られる残差信号f(n+1)は、図8Bに示すようにより小さい波形に分割されるため、第n+1ステップ以降で抽出されるアトムはその基底のサイズがより小さいものになる傾向が現れる。従って、もし基底のサイズがより大きい基底に対してより小さいインデックス番号を、基底のサイズがより小さい基底に対してより大きいインデックス番号を割り当てるように基底コードブックを構成すれば、マクロブロック内アトム数が多いマクロブロックでは、アトムの基底インデックスの出現頻度分布は大きい値の方に偏る傾向がある。これを利用して、コンテキストを次のように定める。
Figure 0003920849
ここで、Naは、マクロブロック内アトム数を示す。CM4は、マクロブロック内アトム数が所定の範囲内にある場合に、その時の基底インデックスの頻度分布を最もよく反映するように出現頻度テーブルを指定するための値である。二値化処理部121は、CM4が第1ビット目の出現頻度の切替に使用できるよう、基底インデックスの二値化を実施する。
図18にアトムの基底インデックスの二値化処理の一例を、図19に第1ビット目に対する4種類の出現頻度テーブルの一例を示す。
以下に本発明によるアトムの基底インデックスの算術符号化を図18および図19を用いて説明する。例えば、符号化対象マクロブロックにおけるマクロブロック内アトム数が1つであった場合には、上記に示した式により算出されるCM4の値は0となる。この場合、マクロブロックCにおけるアトムの基底インデックスが大きい値となる可能性は低いため、図19に示すように、アトムの基底インデックスの二値化処理後の第1ビット目が0となる(すなわちアトムの基底インデックスが0〜3の値を取る)確率が高いテーブルであるCM4=0に対応する出現頻度テーブルを選択するよう動作する。
同様に例えばマクロブロックCのマクロブロック内アトム数が10個であった場合には、上記に示した式により算出されるCM4の値は3となる。この場合、マクロブロックCにおけるアトムの基底インデックスが大きい値となる可能性が高くなるため、図19に示すように、アトムの基底インデックスの二値化処理後の第1ビット目が0となる(すなわちアトムの基底インデックスが0〜3の値を取る)確率が低いテーブルであるCM4=3に対応する出現頻度テーブルを選択するよう動作する。
(4)マクロブロック内アトム数と対応コンテキスト
入力119のうち、マクロブロック内アトム数とは、当該マクロブロック内におけるアトムの個数Naである。前述したように、図8A,Bにおいてアトム抽出の第nステップ目の残差信号f(n)において、電力が大きくステップエッジのような急峻な波形変化を含むような残差信号が局在している場合、それ以降のアトム抽出ステップにおいて複数のアトムが同一箇所で集中的に抽出される確率が高い。従って、隣接するマクロブロック内のアトム数が多ければ、当該マクロブロックにおけるアトム数も多くなる可能性が高くなる。逆に、隣接するマクロブロック内のアトム数が少なければ、当該マクロブロックにおけるアトム数も少なくなる可能性が高くなる。画面内のアトムの典型的な分布の一例を図12に示す。図12において、白い部分がアトムATである。ここで、図6に示すように当該マクロブロックCの上に隣接するマクロブロックをA、左に隣接するマクロブロックをBとし、A,Bのそれぞれのマクロブロック内アトム数をNa(A)、Na(B)とする。マクロブロック内アトム数に対するコンテキストを次のように定める。
Figure 0003920849
CM5は、隣接するマクロブロック内のアトム数が所定の範囲内にある場合に、その時の当該マクロブロック内のアトム数の頻度分布を最もよく反映するように出現頻度テーブルを指定するための値である。二値化処理部121は、CM5が第1ビット目の出現頻度の切替に使用できるよう、マクロブロック内アトム数の二値化を実施する。
図20にマクロブロック内アトム数の二値化処理の一例を、図21に第1ビット目に対する4種類の出現頻度テーブルの一例を示す。
以下に本発明によるマクロブロック内アトム数の算術符号化を図20および図21を用いて説明する。例えば、図6において符号化対象となっているマクロブロックCに隣接するマクロブロックAおよびマクロブロックBにおけるマクロブロック内アトム数の合計数が1であった場合には、上記に示した式により算出されるCM5の値は0となる。この場合、マクロブロックCにおけるマクロブロック内アトム数は少なくなる可能性が高いため、図21に示すように、マクロブロック内アトム数の二値化処理後の第1ビット目が0となる(すなわちマクロブロック内アトム数が1〜2の値を取る)確率が高いテーブルであるCM5=0に対応する出現頻度テーブルを選択するよう動作する。
同様に例えばマクロブロックAおよびマクロブロックBにおけるマクロブロック内アトム数の合計数が10個であった場合には、上記に示した式により算出されるCM5の値は3となる。この場合、マクロブロックCにおけるマクロブロック内アトム数は多くなる可能性が高くなるため、図21に示すように、マクロブロック内アトム数の二値化処理後の第1ビット目が0となる(すなわちマクロブロック内アトム数が1〜2の値を取る)確率が低いテーブルであるCM5=3に対応する出現頻度テーブルを選択するよう動作する。
また、別の例では、マクロブロック内アトム数に対するコンテキストを次のように定めてもよい。
Figure 0003920849
ここで、MVDxおよびMVDyは当該マクロブロックにおける動きベクトルの水平成分MVxおよび垂直成分MVyとその予測値PMVx,PMVyとの差分値である差分動きベクトルであり、予測値PMVx,PMVyは例えばMPEG−4やH.26Lなどの符号化方式で用いられているように、近傍のマクロブロックにおける動きベクトルの値のメディアン値を用いる。また、Max(x)はマクロブロック内の全ての差分動きベクトルxのうち差分動きベクトルの絶対値が最大値を与える差分動きベクトルに対する処理であることを意味する。
マクロブロック内の差分動きベクトルの大きさが大きければ大きいほど当該マクロブロックにおける画像の動きは複雑であるため、残差信号の電力は大きくなる傾向がある。従って、このようなマクロブロックにアトムが集中しやすい。従って、CM6を当該マクロブロック内のアトム数の頻度分布を最もよく反映するように出現頻度テーブルを指定するための値として用いることによって、符号化効率を高めることができる。二値化処理部121は、CM6が第1ビット目の出現頻度の切替に使用できるよう、マクロブロック内アトム数の二値化を実施する。
図22にマクロブロック内アトム数の二値化処理後の第1ビット目に対する4種類の出現頻度テーブルの一例を示す。
以下に本発明によるマクロブロック内アトム数の算術符号化の別の例を図20および図22を用いて説明する。例えば、符号化対象となっているマクロブロックの差分動きベクトルが4つあり、それぞれMV1=(0,1)、MV2=(2,−1)、MV3=(−2,−2)、MV4=(0,0)であった場合、MV1からMV4のうち絶対値が最大となるMV3に対して上記に示した式を適用することにより算出されるCM6の値は0となる。この場合、符号化対象マクロブロックにおける動きはあまり複雑ではないと考えられ、マクロブロック内アトム数は少なくなる可能性が高いため、図22に示すように、マクロブロック内アトム数の二値化処理後の第1ビット目が0となる(すなわちマクロブロック内アトム数が1〜2の値を取る)確率が高いテーブルであるCM6=0に対応する出現頻度テーブルを選択するよう動作する。
同様に例えば、符号化対象となっているマクロブロックの差分動きベクトルが2つあり、それぞれMV1=(0,1)、MV2=(3,−2)であった場合、MV1とMV2のうち絶対値が最大となるMV2に対して上記に示した式を適用することにより算出されるCM6の値は1となる。この場合、符号化対象マクロブロックにおける動きは複雑であると考えられ、マクロブロック内アトム数は多くなる可能性が高いため、図22に示すように、マクロブロック内アトム数の二値化処理後の第1ビット目が0となる(すなわちマクロブロック内アトム数が1〜2の値を取る)確率が低いテーブルであるCM6=1に対応する出現頻度テーブルを選択するよう動作する。
尚、本実施の形態1においては、コンテキストを決定する数式に閾値として具体的な数値を用いて例を示したが、もちろん本発明はこれらの数値に限定されることなく適用することができる。
図9に、可変長復号部118の構成を示す。可変長復号部118は、圧縮ストリーム114を入力とし、可変長符号化部113と同様に、コンテキスト決定部120で定められたコンテキストに応じてビット単位で出現頻度テーブル123(可変長符号化部113と同じテーブル定義)を切り替えて、算術復号部126において二値化データへ算術復号していく。復元された二値化データ122は、符号化側と同じ規則に従って、逆二値化処理部127において最終的な復号データ119に変換される。すなわち、エントロピー符号化であるため、可変長符号化部113への入力119と同一の無歪み復号値が得られる。復号データのうち、以降のマクロブロックの復号処理のコンテキスト決定に用いられるデータは、コンテキスト決定部120に送られ、バッファリングされる。
(実施の形態2)
実施の形態2では、実施の形態1における符号化・復号装置において、アトムパラメータを、マクロブロックの単位ではなく、フレームの単位で符号化・復号化する装置について説明する。図10に圧縮ストリーム114のフレーム単位の符号化データ並び(シンタックス)の様子を示す。フレームのタイムスタンプや初期パラメータ、アクティビティ情報(詳細は後述)などを格納するフレームヘッダに続いて、例えば、実施の形態1で述べたマクロブロックなどを固定ブロック単位で動きに関する情報をまとめて多重する。ここで、カウンタNとは、マクロブロックのフレーム内の個数であり、一般に、画像サイズに対して一意に決まる定数である。次に、同期ワードを挿入する。この同期ワードは、当該フレームのアトムパラメータの始まりを示すユニークな符号である必要がある。この同期ワードの挿入により、復号装置は、マクロブロック単位に符号化される動き情報と、フレーム単位に符号化されるアトムパラメータとを事前に分離して、それぞれの復号処理ブロックに並列処理させることができるため、復号処理の高速化を図ることが可能となる。また、回線誤りなどの場合に、同期ワードよりも後で誤りが発生したことが確認された場合は、動き情報のみで誤り隠蔽処理を行うなどの柔軟性も確保することができる。同期ワードに続いて、フレーム内で検出された順序でアトムパラメータを多重する。ここで、アトムパラメータのカウンタMは、一般にフレーム毎に変動し、既知ではない。カウンタMを確定させるための手段としては、同期ワード自体にカウンタMの値を埋め込んだり、各アトムパラメータの先頭の情報である位置情報に、Terminate符号を設け、Terminate符号を検出した時点で当該フレームのアトムパラメータの復号処理を終了するなどの方法がある。
各アトムパラメータは、フレーム内で検出された順序に符号化される。以降、検出された各アトムに対する基底係数をアトム係数情報、またはアトム係数と呼ぶこととする。アトムは通常、映像情報における重要な箇所から順に符号化される。一般に、映像情報における本質的な情報は、動きの度合いにあり、動きが大きくフレーム間予測残差電力が大きい箇所から順番に抽出されるよう制御される。このような規則に従ってアトムが検出される場合、図11に示すように、アトム係数情報は、検出開始当初は大きな値になるが、各アトムによって徐々に電力が取り除かれることで、検出されるたびに係数情報の値は小さくなっていく傾向がある。このことにより、K番目のアトム係数情報は、直前に多重されるK−1番目のアトム係数情報との間に強い相関関係を有すると言える。そこで、K番目のアトム係数は、K−1番目のアトム係数からの差分情報として符号化する。ただし、フレーム間予測残差信号の状況によっては、同一電力を有する箇所が複数に分散するなどして図11における分布からはずれるケースもある。
従って、このような残差信号分布をクラス分けするアクティビティ情報をフレームヘッダに挿入しておき、このアクティビティ情報に従って、アトム係数情報の出現頻度テーブルを切り替えて算術符号化を実施するように構成する。これにより、フレーム毎に変動するアトム係数分布に適応した算術符号化を行うことが可能となる。
具体的には、例えばフレーム間予測残差信号の電力Eの分布における分散値をσとし、分散値σの値に応じて以下の式によってクラス分けを行う。
Figure 0003920849
ただし、ACTはクラス分けされたアクティビティ情報、TH1およびTH2は予め設定された閾値である。
このようにしてクラス分けされたアクティビティ情報ACTに対する典型的なアトム係数情報の分布を図23A〜Cに例示する。このように、ACTの値が大きいほどアトム係数情報はアトム検出順序Kが大きくなるにつれて大きい値から小さい値まで大きい範囲で変化する。逆にACTの値が小さいほどアトム係数情報はアトム検出順序Kが変化してもあまり大きい範囲にわたって変化しない。
アトム係数情報のコンテキストは以下の式によって決定する。
Figure 0003920849
ただし、Kはアトム検出順序である。K番目のアトム係数情報は上述したようにK−1番目のアトム係数とK番目のアトム係数との差分情報として符号化する。図23に示したように、Kの値が大きくなるにつれてこの差分情報は小さくなる傾向がある。
以下に本発明によるアトム係数情報の算術符号化の例を図24および図25を用いて説明する。まず、動き補償部107において生成されるフレーム間予測残差信号よりアクティビティ情報ACTを算出する。例えば画面の動きがあまり複雑でなく、フレーム間予測残差信号の電力の分布があまり分散していない場合には、分散値σが小さい値となり、ACTの値は0となる。この場合、アトム検出順序Kによらずあまりアトム係数が変化しないため、図25に示すように、アトム係数情報の二値化処理後の第1ビット目が0となる(すなわち、アトム係数情報が0〜3の値を取る)確率がそれぞれのCM7に対して比較的高いテーブルセットであるACT=0に対するテーブルセットが選ばれるよう動作する。
逆に例えば画面の動きが複雑で、フレーム間予測残差信号の電力の分布が広く分散している場合には、分散値σが大きい値となり、ACTの値は例えば2となる。この場合、アトム係数の変化が大きいため、図25に示すように、アトム係数情報の二値化処理後の第1ビット目が0となる(すなわち、アトム係数情報が0〜3の値を取る)確率がそれぞれのCM7に対して比較的高くないテーブルセットであるACT=2に対するテーブルセットが選ばれるよう動作する。
次に、それぞれの検出順序Kに応じて上記の式よりCM7の値を算出する。例えば最初に検出されたアトムに対しては検出順序K=1であるため、CM7の値は0となる。この場合、先にACTの値に応じて選択されたテーブルセットのうち、CM7=0に対応する出現頻度テーブルを選択するよう動作する。また、例えば10番目に検出されたアトムに対しては検出順序K=10であるため、CM7の値は2となる。この場合、先にACTの値に応じて選択されたテーブルセットのうち、CM7=2に対応する出現頻度テーブルを選択するよう動作する。
以上のように構成すれば、画面全体の動き情報およびアトム検出順序に応じてアトム係数情報の算術符号化に用いる出現頻度テーブルを適切に選択することができるため、符号化効率を向上させることが可能となる。また、復号側では上述した符号化方法によって符号化された圧縮ストリームのフレームヘッダに含まれている上記アクティビティ情報を復号し、復号されたアクティビティ情報に応じて符号化側と同様の方法でテーブルセットを選択することによって正しく復号することができる。また、アトム係数を復号する際には、先に復号されたマクロブロック内アトム数に応じて符号化側と同様の方法で出現頻度テーブルを選択することによって正しく復号することができる。
産業上の利用可能性
本発明は、動画像の符号化装置、あるいは復号装置として利用可能である。
【図面の簡単な説明】
図1は、実施の形態1に係る画像符号化装置の構成図である。
図2は、実施の形態1に係る復号装置の構成図である。
図3A〜Gは、マクロブロックを示す図である。
図4A,Bは、マクロブロックとアトムとを示す図である。
図5は、可変長符号化部の構成を示す図である。
図6は、マクロブロックCの符号化モード情報に対するコンテキストを定義する図である。
図7A,Bは、位置情報の値の分布を示す図である。
図8A,Bは、アトムgknと残差信号f(n)との関係を示す図である。
図9は、可変長復号部の構成を示す図である。
図10は、圧縮ストリームのフレーム単位の符号化データ並び(シンタックス)の様子を示す図である。
図11は、アトム検出順序Kとアトム係数情報との関係を示す図である。
図12は、アトムの分布の例を示す図である。
図13は、符号化モード情報の二値化パターンを示す図である。
図14は、コンテキストCM1に対する出現頻度テーブルを示すである。
図15は、コンテキストCM2に対する出現頻度テーブルを示すである。
図16は、アトム位置情報の二値化パターンを示す図である。
図17は、コンテキストCM3に対する出現頻度テーブルを示すである。
図18は、基底インデックスの二値化パターンを示す図である。
図19は、コンテキストCM4に対する出現頻度テーブルを示すである。
図20は、マクロブロック内アトム数の二値化パターンを示す図である。
図21は、コンテキストCM5に対する出現頻度テーブルを示すである。
図22は、コンテキストCM6に対する出現頻度テーブルを示すである。
図23A〜Cは、ACTの値に応じたアトム検出順序Kとアトム係数情報との関係を示す図である。
図24は、アトム係数情報の二値化パターンを示す図である。
図25は、ACTの値に応じたコンテキストCM7に対する出現頻度テーブルを示すである。

Claims (36)

  1. Matching Pursuits符号化方式によって画像を符号化する画像符号化装置において、
    所定の部分画像領域内におけるアトムの位置を示す位置情報を前記部分画像領域ごとに獲得する位置情報獲得手段と、
    前記部分画像領域内に存在するアトムの数に応じて、符号化対象である部分画像領域内の前記位置情報の出現頻度分布を決定するコンテキスト決定手段と、
    前記決定された出現頻度分布に基づいて前記位置情報の算術符号化を行う可逆符号化手段と
    を備えることを特徴とする画像符号化装置。
  2. 前記位置情報の種類を二値化して表現する二値化手段を備え、
    前記コンテキスト決定手段は、二値化データの特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項1記載の画像符号化装置。
  3. Matching Pursuits符号化方式によって画像を符号化する画像符号化装置において、
    所定の部分画像領域内における予測残差データ分布のクラス分けを行い、クラス情報を前記部分画像領域ごとに獲得する予測残差分布クラス分け手段と、
    前記部分画像領域のクラス情報に基づいて、前記部分画像領域内におけるアトムの表現に用いる基底係数情報の出現頻度分布を決定するコンテキスト決定手段と、
    前記決定された出現頻度分布に基づいて前記基底係数情報の算術符号化を行う可逆符号化手段と
    を備えることを特徴とする画像符号化装置。
  4. Matching Pursuits符号化方式によって符号化された画像を復号する画像復号装置において、
    所定の部分画像領域内におけるアトムの位置を示す位置情報を前記部分画像領域ごとに復号する可逆復号手段と、
    前記部分画像領域内に存在するアトムの数に応じて、復号対象である部分画像領域内の前記位置情報の出現頻度分布を決定するコンテキスト決定手段と、
    前記決定された出現頻度分布に基づいて前記位置情報の算術復号を行う算術復号手段と
    を備えることを特徴とする画像復号装置。
  5. 前記算術復号手段から出力されるビット系列を、予め定められた規則で前記位置情報を示す情報に変換する逆二値化手段を備え、
    前記コンテキスト決定手段は、前記算術復号手段で処理される特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項4記載の画像復号装置。
  6. Matching Pursuits符号化方式によって符号化された画像を復号する画像復号装置において、
    所定の部分画像領域内における予測残差データ分布のクラス情報、及び前記部分画像領域内におけるアトムの表現に用いる基底係数情報を復号する可逆復号手段と、
    前記クラス情報に基づいて、前記部分画像領域内におけるアトムの表現に用いる基底係数情報の出現頻度分布を決定するコンテキスト決定手段と、
    前記決定された出現頻度分布に基づいて前記基底係数情報の算術復号を行う算術復号手段と
    を備えることを特徴とする画像復号装置。
  7. Matching Pursuits符号化方式によって画像を符号化する画像符号化装置において、
    所定の部分画像領域内におけるアトムの個数を示す個数情報を前記部分画像領域ごとに獲得する個数情報獲得手段と、
    符号化対象となる部分画像領域に隣接する部分画像領域における前記個数情報に応じて当該符号化対象となる部分画像領域の前記個数情報の出現頻度分布を決定するコンテキスト決定手段と、
    前記決定された出現頻度分布に基づいて前記個数情報の算術符号化を行う可逆符号化手段と
    を備えることを特徴とする画像符号化装置。
  8. 前記個数情報の種類を二値化して表現する二値化手段を備え、
    前記コンテキスト決定手段は、二値化データの特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項7記載の画像符号化装置。
  9. Matching Pursuits符号化方式によって符号化された画像を復号する画像復号装置において、
    所定の部分画像領域内におけるアトムの個数を示す個数情報を前記部分画像領域ごとに復号する可逆復号手段と、
    復号対象となる部分画像領域に隣接する部分画像領域内における前記個数情報に応じて当該復号対象となる部分画像領域の前記個数情報の出現頻度分布を決定するコンテキスト決定手段と、
    前記決定された出現頻度分布に基づいて前記個数情報の算術復号を行う算術復号手段と
    を備えることを特徴とする画像復号装置。
  10. 前記算術復号手段から出力されるビット系列を、予め定められた規則で前記個数情報を示す情報に変換する逆二値化手段を備え、
    前記コンテキスト決定手段は、前記算術復号手段で処理される特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項9記載の画像復号装置。
  11. Matching Pursuits符号化方式によって画像を符号化する画像符号化方法において、
    所定の部分画像領域内におけるアトムの位置を示す位置情報を前記部分画像領域ごとに獲得する位置情報獲得ステップと、
    前記部分画像領域内に存在するアトムの数に応じて、符号化対象となる部分画像領域内の前記位置情報の出現頻度分布を決定するコンテキスト決定ステップと、
    前記決定された出現頻度分布に基づいて前記位置情報の算術符号化を行う可逆符号化ステップと
    を含むことを特徴とする画像符号化方法。
  12. 前記位置情報の種類を二値化して表現する二値化ステップを含み、
    前記コンテキスト決定ステップでは、二値化データの特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項11記載の画像符号化方法。
  13. Matching Pursuits符号化方式によって画像を符号化する画像符号化方法において、
    所定の部分画像領域内における予測残差データ分布のクラス分けを行い、クラス情報を前記部分画像領域ごとに獲得する予測残差分布クラス分けステップと、
    前記部分画像領域のクラス情報に基づいて、前記部分画像領域内におけるアトムの表現に用いる基底係数情報の出現頻度分布を決定するコンテキスト決定ステップと、
    前記決定された出現頻度分布に基づいて前記基底係数情報の算術符号化を行う可逆符号化ステップと
    を含むことを特徴とする画像符号化方法。
  14. Matching Pursuits符号化方式によって符号化された画像を復号する画像復号方法において、
    所定の部分画像領域内におけるアトムの位置を示す位置情報を前記部分画像領域ごとに復号する可逆復号ステップと、
    前記部分画像領域内に存在するアトムの数に応じて、復号対象である部分画像領域内の前記位置情報の出現頻度分布を決定するコンテキスト決定ステップと、
    前記決定された出現頻度分布に基づいて前記位置情報の算術復号を行う算術復号ステップと
    を含むことを特徴とする画像復号方法。
  15. 前記算術復号ステップから出力されるビット系列を、予め定められた規則で前記位置情報を示す情報に変換する逆二値化ステップを含み、
    前記コンテキスト決定ステップでは、前記算術復号ステップで処理される特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項14記載の画像復号方法。
  16. Matching Pursuits符号化方式によって符号化された画像を復号する画像復号方法において、
    所定の部分画像領域内における予測残差データ分布のクラス情報、及び前記部分画像領域内におけるアトムの表現に用いる基底係数情報を復号する可逆復号ステップと、
    前記クラス情報に基づいて、前記部分画像領域内におけるアトムの表現に用いる基底係数情報の出現頻度分布を決定するコンテキスト決定ステップと、
    前記決定された出現頻度分布に基づいて前記基底係数情報の算術復号を行う算術復号ステップと
    を含むことを特徴とする画像復号方法。
  17. Matching Pursuits符号化方式によって画像を符号化する画像符号化方法において、
    所定の部分画像領域内におけるアトムの個数を示す個数情報を前記部分画像領域ごとに獲得する個数情報獲得ステップと、
    符号化対象となる部分画像領域に隣接する部分画像領域における前記個数情報に応じて当該符号化対象となる部分画像領域の前記個数情報の出現頻度分布を決定するコンテキスト決定ステップと、
    前記決定された出現頻度分布に基づいて前記個数情報の算術符号化を行う可逆符号化ステップと
    を備えることを特徴とする画像符号化方法。
  18. 前記個数情報の種類を二値化して表現する二値化ステップを含み、
    前記コンテキスト決定ステップでは、二値化データの特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項17記載の画像符号化方法。
  19. Matching Pursuits符号化方式によって符号化された画像を復号する画像復号方法において、
    所定の部分画像領域内におけるアトムの個数を示す個数情報を前記部分画像領域ごとに復号する可逆復号ステップと、
    復号対象となる部分画像領域に隣接する部分画像領域内における前記個数情報に応じて当該復号対象となる部分画像領域の前記個数情報の出現頻度分布を決定するコンテキスト決定ステップと、
    前記決定された出現頻度分布に基づいて前記個数情報の算術復号を行う算術復号ステップと
    を備えることを特徴とする画像復号方法。
  20. 前記算術復号ステップから出力されるビット系列を、予め定められた規則で前記個数情報を示す情報に変換する逆二値化ステップを備え、
    前記コンテキスト決定ステップでは、前記算術復号手段で処理される特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項19記載の画像復号方法。
  21. Matching Pursuits符号化方式によって画像を符号化する画像符号化装置において、
    所定の部分画像領域内におけるアトムの個数を示す個数情報を前記部分画像領域ごとに獲得する個数情報獲得手段と、
    符号化対象となる部分画像領域の画像の動きベクトルを検出する動き検出手段と、
    符号化対象となる部分画像領域における画像の動きベクトルに応じて当該符号化対象となる部分画像領域の前記個数情報の出現頻度分布を決定するコンテキスト決定手段と、
    前記決定された出現頻度分布に基づいて前記個数情報の算術符号化を行う可逆符号化手段と
    を備えることを特徴とする画像符号化装置。
  22. 前記個数情報の種類を二値化して表現する二値化手段を備え、
    前記コンテキスト決定手段は、二値化データの特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項21記載の画像符号化装置。
  23. Matching Pursuits符号化方式によって符号化された画像を復号する画像復号装置において、
    所定の部分画像領域内におけるアトムの個数を示す個数情報を前記部分画像領域ごとに復号する可逆復号手段と、
    復号対象となる部分画像領域における画像の動きベクトルを前記部分画像領域ごとに復号する可逆復号手段と、
    前記部分画像領域内における画像の動きベクトルに応じて復号対象となる部分画像領域の前記個数情報の出現頻度分布を決定するコンテキスト決定手段と、
    前記決定された出現頻度分布に基づいて前記個数情報の算術復号を行う算術復号手段と
    を備えることを特徴とする画像復号装置。
  24. 前記算術復号手段から出力されるビット系列を、予め定められた規則で前記個数情報を示す情報に変換する逆二値化手段を備え、
    前記コンテキスト決定手段は、前記算術復号手段で処理される特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項23記載の画像復号装置。
  25. Matching Pursuits符号化方式によって画像を符号化する画像符号化装置において、
    所定の部分画像領域内におけるアトムの表現に用いる基底係数情報を前記アトムごとに獲得する係数情報獲得手段と、
    符号化対象となる部分画像領域内におけるアトムの検出された順序に応じて当該符号化対象となる部分画像領域の前記基底係数情報の出現頻度分布を決定するコンテキスト決定手段と、
    前記決定された出現頻度分布に基づいて前記基底係数情報の算術符号化を行う可逆符号化手段と
    を備えることを特徴とする画像符号化装置。
  26. 前記基底係数情報の種類を二値化して表現する二値化手段を備え、
    前記コンテキスト決定手段は、二値化データの特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項25記載の画像符号化装置。
  27. Matching Pursuits符号化方式によって符号化された画像を復号する画像復号装置において、
    所定の部分画像領域内におけるアトムの表現に用いる基底係数情報の復号順序に応じて復号対象となる部分画像領域の前記基底係数情報の出現頻度分布を決定するコンテキスト決定手段と、
    前記決定された出現頻度分布に基づいて前記基底係数情報の算術復号を行う算術復号手段と
    を備えることを特徴とする画像復号装置。
  28. 前記算術復号手段から出力されるビット系列を、予め定められた規則で前記基底係数情報を示す情報に変換する逆二値化手段を備え、
    前記コンテキスト決定手段は、前記算術復号手段で処理される特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項27記載の画像復号装置。
  29. Matching Pursuits符号化方式によって画像を符号化する画像符号化方法において、
    所定の部分画像領域内におけるアトムの個数を示す個数情報を前記部分画像領域ごとに獲得する個数情報獲得ステップと、
    符号化対象となる部分画像領域の画像の動きベクトルを検出する動き検出ステップと、
    符号化対象となる部分画像領域における画像の動きベクトルに応じて当該符号化対象となる部分画像領域の前記個数情報の出現頻度分布を決定するコンテキスト決定ステップと、
    前記決定された出現頻度分布に基づいて前記個数情報の算術符号化を行う可逆符号化ステップと
    を備えることを特徴とする画像符号化方法。
  30. 前記個数情報の種類を二値化して表現する二値化ステップを含み、
    前記コンテキスト決定ステップは、二値化データの特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項29記載の画像符号化方法。
  31. Matching Pursuits符号化方式によって符号化された画像を復号する画像復号方法において、
    所定の部分画像領域内におけるアトムの個数を示す個数情報を前記部分画像領域ごとに復号する可逆復号ステップと、
    復号対象となる部分画像領域における画像の動きベクトルを前記部分画像領域ごとに復号する可逆復号ステップと、
    前記部分画像領域内における画像の動きベクトルに応じて復号対象となる部分画像領域の前記個数情報の出現頻度分布を決定するコンテキスト決定ステップと、
    前記決定された出現頻度分布に基づいて前記個数情報の算術復号を行う算術復号ステップと
    を備えることを特徴とする画像復号方法。
  32. 前記算術復号ステップから出力されるビット系列を、予め定められた規則で前記個数情報を示す情報に変換する逆二値化ステップを含み、
    前記コンテキスト決定ステップは、前記算術復号ステップで処理される特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項31記載の画像復号方法。
  33. Matching Pursuits符号化方式によって画像を符号化する画像符号化方法において、
    所定の部分画像領域内におけるアトムの表現に用いる基底係数情報を前記アトムごとに獲得する係数情報獲得ステップと、
    符号化対象となる部分画像領域内におけるアトムの検出された順序に応じて当該符号化対象となる部分画像領域の前記基底係数情報の出現頻度分布を決定するコンテキスト決定ステップと、
    前記決定された出現頻度分布に基づいて前記基底係数情報の算術符号化を行う可逆符号化ステップと
    を備えることを特徴とする画像符号化方法。
  34. 前記基底係数情報の種類を二値化して表現する二値化ステップを含み、
    前記コンテキスト決定ステップは、二値化データの特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項34記載の画像符号化方法。
  35. Matching Pursuits符号化方式によって符号化された画像を復号する画像復号方法において、
    所定の部分画像領域内におけるアトムの表現に用いる基底係数情報の復号順序に応じて復号対象となる部分画像領域の前記基底係数情報の出現頻度分布を決定するコンテキスト決定ステップと、
    前記決定された出現頻度分布に基づいて前記基底係数情報の算術復号を行う算術復号ステップと
    を備えることを特徴とする画像復号方法。
  36. 前記算術復号ステップから出力されるビット系列を、予め定められた規則で前記基底係数情報を示す情報に変換する逆二値化ステップを含み、
    前記コンテキスト決定ステップは、前記算術復号ステップで処理される特定ビット位置の情報に応じて複数の出現頻度分布の中から特定の出現頻度分布を決定する
    ことを特徴とする請求項35記載の画像復号方法。
JP2003509782A 2001-06-29 2002-06-28 画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法 Expired - Fee Related JP3920849B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001199008 2001-06-29
JP2001199008 2001-06-29
PCT/JP2002/006615 WO2003003745A1 (en) 2001-06-29 2002-06-28 Image encoder, image decoder, image encoding method, and image decoding method

Publications (2)

Publication Number Publication Date
JPWO2003003745A1 JPWO2003003745A1 (ja) 2004-10-21
JP3920849B2 true JP3920849B2 (ja) 2007-05-30

Family

ID=19036358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003509782A Expired - Fee Related JP3920849B2 (ja) 2001-06-29 2002-06-28 画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法

Country Status (5)

Country Link
US (1) US7292731B2 (ja)
EP (1) EP1404133A4 (ja)
JP (1) JP3920849B2 (ja)
CN (1) CN1305311C (ja)
WO (1) WO2003003745A1 (ja)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6965644B2 (en) * 1992-02-19 2005-11-15 8×8, Inc. Programmable architecture and methods for motion estimation
JP3764458B2 (ja) * 2001-11-16 2006-04-05 株式会社エヌ・ティ・ティ・ドコモ 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及びプログラム
JP4019790B2 (ja) * 2002-05-23 2007-12-12 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
EP1453004A2 (en) * 2003-02-28 2004-09-01 NTT DoCoMo, Inc. Image encoding apparatus and method
JP3959039B2 (ja) * 2003-02-28 2007-08-15 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム
FR2852179A1 (fr) 2003-03-06 2004-09-10 Thomson Licensing Sa Procede de codage d'une image video
US8705613B2 (en) * 2003-06-26 2014-04-22 Sony Corporation Adaptive joint source channel coding
KR20060060000A (ko) * 2003-08-05 2006-06-02 코닌클리케 필립스 일렉트로닉스 엔.브이. 비디오 엔코딩 및 디코딩 방법들 및 장치들
CN1864177B (zh) 2003-08-12 2010-12-08 三叉微系统(远东)有限公司 视频编码和解码方法及其相应设备
US8582640B2 (en) * 2003-12-16 2013-11-12 Sony Corporation Adaptive joint source channel coding
US7689051B2 (en) * 2004-04-15 2010-03-30 Microsoft Corporation Predictive lossless coding of images and video
US20060262860A1 (en) * 2005-02-23 2006-11-23 Chou Jim C Macroblock adaptive frame/field coding architecture for scalable coding
JP4444180B2 (ja) * 2005-07-20 2010-03-31 株式会社東芝 テクスチャ符号化装置、テクスチャ復号化装置、方法、およびプログラム
GB2429593A (en) 2005-08-26 2007-02-28 Electrosonic Ltd Data compressing using a wavelet compression scheme
JP4662171B2 (ja) * 2005-10-20 2011-03-30 ソニー株式会社 符号化装置および方法、復号化装置および方法、プログラム、並びに記録媒体
JP2007166039A (ja) * 2005-12-09 2007-06-28 Matsushita Electric Ind Co Ltd 画像符号化装置
US8265349B2 (en) * 2006-02-07 2012-09-11 Qualcomm Incorporated Intra-mode region-of-interest video object segmentation
US8150155B2 (en) * 2006-02-07 2012-04-03 Qualcomm Incorporated Multi-mode region-of-interest video object segmentation
US8265392B2 (en) * 2006-02-07 2012-09-11 Qualcomm Incorporated Inter-mode region-of-interest video object segmentation
JP4555257B2 (ja) * 2006-06-06 2010-09-29 パナソニック株式会社 画像符号化装置
JP4902854B2 (ja) * 2006-09-12 2012-03-21 パナソニック株式会社 動画像復号化装置、動画像復号化方法、動画像復号化プログラム、動画像符号化装置、動画像符号化方法、動画像符号化プログラム、及び動画像符号化復号化装置
US7974488B2 (en) 2006-10-05 2011-07-05 Intellectual Ventures Holding 35 Llc Matching pursuits basis selection
US20080084924A1 (en) * 2006-10-05 2008-04-10 Donald Martin Monro Matching pursuits basis selection design
US7522076B1 (en) * 2007-10-16 2009-04-21 Mediatek Inc. Parallel context adaptive binary arithmetic coding
US20110002334A1 (en) * 2009-01-09 2011-01-06 Thilmee Baduge Communication terminal and communication state change method
US8934548B2 (en) * 2009-05-29 2015-01-13 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method, and image decoding method
KR20110090511A (ko) * 2010-02-04 2011-08-10 삼성전자주식회사 통신 기기에서 3차원 영상을 위한 영상 처리 방법 및 장치
US9461872B2 (en) * 2010-06-02 2016-10-04 Hewlett Packard Enterprise Development Lp Compressing data in a wireless network
KR20120014676A (ko) * 2010-08-10 2012-02-20 에스케이 텔레콤주식회사 적응적 부호화/복호화 모드 인덱싱 기법을 이용한 영상 부호화/복호화 장치 및 방법
JP5485851B2 (ja) 2010-09-30 2014-05-07 日本電信電話株式会社 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置およびそれらのプログラム
US9286698B2 (en) * 2010-12-14 2016-03-15 Telefonaktiebolaget L M Ericsson (Publ) Method and device for storing a compression ratio indication in a pixel value buffer in tile encoding
US8446301B2 (en) 2011-04-15 2013-05-21 Research In Motion Limited Methods and devices for coding and decoding the position of the last significant coefficient
CA2837532C (en) 2011-06-23 2018-10-02 Panasonic Corporation Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
US9106919B2 (en) 2011-06-24 2015-08-11 Panasonic Intellectual Property Corporation Of America Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
CN106878722B (zh) 2011-06-24 2019-11-12 太阳专利托管公司 解码方法、解码装置、编码方法、编码装置
EP2725793A4 (en) 2011-06-27 2014-12-03 Panasonic Ip Corp America IMAGE DECODING METHOD, IMAGE ENCODING METHOD, IMAGE DECODING DEVICE, IMAGE ENCODING DEVICE, AND IMAGE ENCODING / DECODING DEVICE
CN106878724B (zh) 2011-06-28 2020-06-05 太阳专利托管公司 图像编码解码装置
KR102006032B1 (ko) 2011-06-29 2019-07-31 선 페이턴트 트러스트 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치
WO2013001769A1 (ja) 2011-06-30 2013-01-03 パナソニック株式会社 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置
AU2012277220B2 (en) 2011-06-30 2016-08-11 Sun Patent Trust Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
CN107087185B (zh) 2011-07-11 2020-01-10 太阳专利托管公司 编码方法及编码装置、解码方法及解码装置
BR112014007494B1 (pt) * 2011-09-29 2022-05-31 Sharp Kabushiki Kaisha Dispositivo de decodificação de imagem, método de decodificação de imagem, e dispositivo de codificação de imagem
EP3754982B1 (en) 2011-09-29 2024-05-01 SHARP Kabushiki Kaisha Image decoding device, image decoding method, image encoding method and image encoding device for performing bi-prediction to uni-prediction conversion
KR102073868B1 (ko) * 2011-11-07 2020-02-05 타지반 투 엘엘씨 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 및 화상 부호화 복호 장치
US9154792B2 (en) * 2011-11-08 2015-10-06 Qualcomm Incorporated Progressive coding of position of last significant coefficient
BR112014023948B1 (pt) * 2012-03-28 2021-05-25 JVC Kenwood Corporation dispositivo de decodificação de imagem
CN103675444B (zh) * 2012-08-30 2016-09-14 中国石油化工股份有限公司 一种高精度的时频分析方法
CN105551503B (zh) * 2015-12-24 2019-03-01 武汉大学 基于原子预选择的音频匹配追踪方法与系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5136371A (en) * 1990-03-15 1992-08-04 Thomson Consumer Electronics, Inc. Digital image coding using random scanning
US5150209A (en) * 1990-05-11 1992-09-22 Picturetel Corporation Hierarchical entropy coded lattice threshold quantization encoding method and apparatus for image and video compression
JPH06331535A (ja) * 1993-05-25 1994-12-02 Asahi Chem Ind Co Ltd 流動状態における粉体付着力の測定方法
JP3115199B2 (ja) * 1994-12-16 2000-12-04 松下電器産業株式会社 画像圧縮符号化装置
US5654702A (en) * 1994-12-16 1997-08-05 National Semiconductor Corp. Syntax-based arithmetic coding for low bit rate videophone
JP3943634B2 (ja) * 1995-11-02 2007-07-11 キヤノン株式会社 情報処理装置及び方法
US6614847B1 (en) * 1996-10-25 2003-09-02 Texas Instruments Incorporated Content-based video compression
JPH11220728A (ja) * 1998-02-02 1999-08-10 Canon Inc 画像圧縮時のコンテクスト生成方法及び画像圧縮方法、画像処理装置
JP3132456B2 (ja) * 1998-03-05 2001-02-05 日本電気株式会社 階層的画像符号化方式、及び階層的画像復号方式
US6563953B2 (en) * 1998-11-30 2003-05-13 Microsoft Corporation Predictive image compression using a single variable length code for both the luminance and chrominance blocks for each macroblock
JP2001103315A (ja) * 1999-09-28 2001-04-13 Matsushita Graphic Communication Systems Inc 画像符号化方法および画像符号化装置

Also Published As

Publication number Publication date
US7292731B2 (en) 2007-11-06
EP1404133A1 (en) 2004-03-31
WO2003003745A1 (en) 2003-01-09
JPWO2003003745A1 (ja) 2004-10-21
EP1404133A4 (en) 2010-04-21
CN1465190A (zh) 2003-12-31
CN1305311C (zh) 2007-03-14
US20040131268A1 (en) 2004-07-08

Similar Documents

Publication Publication Date Title
JP3920849B2 (ja) 画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法
JP3842803B2 (ja) 信号符号化方法、信号復号方法、信号符号化装置、信号復号装置、信号符号化プログラム、及び信号復号プログラム
KR100527690B1 (ko) 신호 부호화 방법 및 장치, 및 복호 방법 및 장치
CN101001374B (zh) 为隔行扫描和逐行扫描视频编码和解码宏块和运动信息中的革新
JP4937741B2 (ja) 映像符号化方法及び装置、映像復号方法及び装置、それらのプログラムおよびそれらプログラムを記録した記録媒体
JP4611640B2 (ja) ビデオシーケンス内の動きを符号化する方法
JP5421408B2 (ja) αチャンネル映像復号化装置、αチャンネル復号化方法及び記録媒体
CN102239693B (zh) 运动图像解码方法和运动图像编码方法
KR20060123939A (ko) 영상의 복부호화 방법 및 장치
JP2016129405A (ja) 画像復号装置、画像符号化装置および符号化データのデータ構造
CN101005620B (zh) 为隔行扫描和逐行扫描视频编码和解码宏块和运动信息中的革新
JP2002532029A (ja) ビデオ圧縮のための効率的マクロブロックヘッダ符号化
JPWO2003021971A1 (ja) 動画像符号化伝送システム、動画像符号化伝送方法、これらに用いて好適な符号化装置、復号化装置、符号化方法、復号化方法及びプログラム
JPWO2003043346A1 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、プログラム、コンピュータデータ信号、及び画像伝送システム
JPWO2011121894A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
KR20100046202A (ko) 이미지들을 처리하기 위한 방법 및 그 대응하는 전자 장치
WO2019069602A1 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、プログラムおよび映像システム
CN106028029A (zh) 低延时低复杂度的数字kvm切换器视频无损压缩方法及系统
JP3491001B1 (ja) 信号符号化方法、信号復号方法、信号符号化装置、信号復号装置、信号符号化プログラム、及び、信号復号プログラム
KR20070090494A (ko) 평균 움직임 벡터를 이용한 인터 프레임 에러 은닉 장치 및방법
JP5533885B2 (ja) 動画像符号化装置および動画像復号装置
JP2005184525A (ja) 画像処理装置
JPH1051792A (ja) 動画像符号化装置及び符号化方法
JP2003209844A (ja) 動画像符号化装置および動画像符号化方法
JPWO2007088912A1 (ja) 画像符号化方法、画像復号化方法、画像符号化装置及び画像復号化装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060207

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070215

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100223

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120223

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120223

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees