JPWO2012042646A1 - 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム - Google Patents

動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム Download PDF

Info

Publication number
JPWO2012042646A1
JPWO2012042646A1 JP2012536091A JP2012536091A JPWO2012042646A1 JP WO2012042646 A1 JPWO2012042646 A1 JP WO2012042646A1 JP 2012536091 A JP2012536091 A JP 2012536091A JP 2012536091 A JP2012536091 A JP 2012536091A JP WO2012042646 A1 JPWO2012042646 A1 JP WO2012042646A1
Authority
JP
Japan
Prior art keywords
coefficient
frequency
unit
sign
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012536091A
Other languages
English (en)
Other versions
JP5590133B2 (ja
Inventor
中川 章
章 中川
数井 君彦
君彦 数井
三好 秀誠
秀誠 三好
純平 小山
純平 小山
智史 島田
智史 島田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2012042646A1 publication Critical patent/JPWO2012042646A1/ja
Application granted granted Critical
Publication of JP5590133B2 publication Critical patent/JP5590133B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]

Abstract

動画像符号化装置は、動画像データに含まれる既に符号化されたピクチャまたは符号化対象ピクチャの既に符号化された領域から、符号化対象ブロックに対する予測画像を生成する予測画像生成部と、符号化対象ブロックと予測画像間で差分演算することにより符号化対象ブロックの予測誤差画像を生成する予測誤差画像生成部と、予測誤差画像を直交変換することにより、複数の第1の周波数係数を算出する予測誤差直交変換部と、予測画像を直交変換することにより、複数の第2の周波数係数を算出する予測画像直交変換部と、複数の第2の周波数係数の正負の符号を判定する符号判定部と、複数の第1の周波数係数のそれぞれについての正負の符号と、複数の第2の周波数係数のうちの第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて複数の第1の周波数係数を符号化する適応符号化部とを有する。

Description

本発明は、例えば、予測符号化方式により動画像データを符号化する動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラムに関する。また本発明は、例えば、予測符号化方式により符号化された動画像データを復号する動画像復号装置、動画像復号方法及び動画像復号用コンピュータプログラムに関する。
動画像データは、一般に非常に大きなデータ量を有する。そのため、動画像データを扱う装置は、動画像データを他の装置へ送信しようとする場合、あるいは、動画像データを記憶装置に記憶しようとする場合、動画像データを高能率符号化することにより圧縮する。「高能率符号化」は、あるデータ列を他のデータ列に変換する符号化処理であり、元のデータ列のデータ量を圧縮する処理をいう。
代表的な動画像の符号化標準として、International Standardization Organization/International Electrotechnical Commission(ISO/IEC)で策定されたMoving Picture Experts Group phase 2(MPEG-2)、MPEG-4、あるいはH.264 MPEG-4 Advanced Video Coding(MPEG-4 AVC/H.264)が広く利用されている。
このような符号化標準では、予測符号化方式が採用されている。予測符号化方式では、符号化対象のピクチャが複数のブロックに分割される。そして複数のブロックのうちの符号化対象ブロックと、そのブロックの予測画像間の画素ごとの誤差を表す予測誤差画像が算出される。予測誤差画像は直交変換されて各周波数の成分を表す周波数係数が求められる。そして、その周波数係数を量子化した量子化係数がエントロピー符号化される。このような量子化及びエントロピー符号化を行うことにより、動画像のデータ量が削減される。
ここで、符号化による動画像データの画質劣化を抑制しつつ、データ量をできるだけ削減するには、周波数係数を量子化する際に用いられる量子化代表値を適切に決定することが重要である。また、予測誤差画像を直交変換することにより得られた周波数係数について、正の符号を持つ周波数係数の分布と負の符号を持つ周波数係数の分布とが略対称となることが知られている。そして、このような、中心対称な確率分布、例えば、ラブラシアン分布及びガウシアン分布に対して適切に量子化代表値を設定する技術が提案されている(例えば、非特許文献1を参照)。
また、Llord-Maxアルゴリズムを用いて、任意の確率分布を持つシンボルを量子化するための量子化代表値を最適化する技術も提案されている(例えば、非特許文献2を参照)。
M. D .Paez, T. H. Glisson, "Minimum Mean-Squared-Error Quantization in Speech PCM and DPCM Systems", IEEE TRANSACTIONS ON COMMUNICATIONS, 1972年4月, pp.225-230 Matthew I. Noah, "Optimal Lloyd-Max quantization of LPC speech parameters", Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP, 1984年, pp.29-32
しかしながら、近年、動画像に対する高画質化の要求の高まりに応じて、動画像データに含まれる各ピクチャの画素数が増え、その結果として動画像データのデータ量も増える傾向にある。そのため、より圧縮効率の高い画像符号化技術が求められている。
そこで、本明細書は、動画像データの符号化効率を向上可能な動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法を提供することを目的とする。
一つの実施形態によれば、動画像データを符号化する動画像符号化装置が提供される。この動画像符号化装置は、動画像データに含まれる、既に符号化されたピクチャまたは符号化対象ピクチャの既に符号化された領域から、符号化対象ピクチャの符号化対象ブロックに対する予測画像を生成する予測画像生成部と、符号化対象ブロックと予測画像間で差分演算することにより符号化対象ブロックの予測誤差画像を生成する予測誤差画像生成部と、予測誤差画像を直交変換することにより、複数の第1の周波数係数を算出する予測誤差直交変換部と、予測画像を直交変換することにより、複数の第2の周波数係数を算出する予測画像直交変換部と、複数の第2の周波数係数のそれぞれの正負の符号を判定する符号判定部と、複数の第1の周波数係数のそれぞれの正負の符号と、複数の第2の周波数係数のうちのその第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて複数の第1の周波数係数を符号化する適応符号化部とを有する。
また、他の実施形態によれば、符号化された動画像データを復号する動画像復号装置が提供される。この動画像復号装置は、符号化された動画像データに含まれる、既に復号されたピクチャまたは復号対象ピクチャの既に復号された領域から、復号対象ピクチャの復号対象ブロックに対する予測画像を生成する予測画像生成部と、予測画像を直交変換することにより、複数の第2の周波数係数を算出する予測画像直交変換部と、複数の第2の周波数係数のそれぞれの正負の符号を判定する符号判定部と、復号対象ブロックと予測画像間の予測誤差画像を直交変換することにより算出される複数の第1の周波数係数のそれぞれについての正負の符号と、複数の第2の周波数係数のうちのその第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて複数の第1の周波数係数を復号する適応復号部と、複数の第1の周波数係数を逆直交変換することにより予測誤差画像を再生する逆変換部と、予測誤差画像の各画素の値に予測画像の対応する画素の値を加算することにより、復号対象ブロックを再生する加算器とを有する。
さらに他の実施形態によれば、動画像データを符号化する動画像符号化方法が提供される。この動画像符号化方法は、動画像データに含まれる、既に符号化されたピクチャまたは符号化対象ピクチャの既に符号化された領域から、符号化対象ピクチャの符号化対象ブロックに対する予測画像を生成し、符号化対象ブロックと予測画像間で差分演算することにより符号化対象ブロックの予測誤差画像を生成し、予測誤差画像を直交変換することにより、複数の第1の周波数係数を算出し、予測画像を直交変換することにより、複数の第2の周波数係数を算出し、複数の第2の周波数係数のそれぞれの正負の符号を判定し、複数の第1の周波数係数のそれぞれの正負の符号と、複数の第2の周波数係数のうちのその第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて複数の第1の周波数係数を符号化することを含む。
さらに他の実施形態によれば、符号化された動画像データを復号する動画像復号方法が提供される。この動画像復号方法は、符号化された動画像データに含まれる、既に復号されたピクチャまたは復号対象ピクチャの既に復号された領域から、復号対象ピクチャの復号対象ブロックに対する予測画像を生成し、予測画像を直交変換することにより、複数の第2の周波数係数を算出し、複数の第2の周波数係数のそれぞれの正負の符号を判定し、復号対象ブロックと予測画像間の予測誤差画像を直交変換することにより算出される複数の第1の周波数係数のそれぞれについての正負の符号と、複数の第2の周波数係数のうちのその第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて複数の第1の周波数係数を復号し、複数の第1の周波数係数を逆直交変換することにより予測誤差画像を再生し、予測誤差画像の各画素の値に予測画像の対応する画素の値を加算することにより、復号対象ブロックを再生することを含む。
本発明の目的及び利点は、請求項において特に指摘されたエレメント及び組み合わせにより実現され、かつ達成される。
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を制限するものではないことを理解されたい。
ここに開示される動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法は、動画像データの符号化効率を向上できる。
図1は、第1の実施形態による動画像符号化装置の概略構成図である。 図2は、予測画像の各周波数係数について、正負の符号を判定する順序の一例を示す図である。 図3は、符号化対象ブロックのパワースペクトルと対応する予測画像のパワースペクトルの関係を示す図である。 図4は、符号化対象ブロックの周波数係数の絶対値から予測画像の周波数係数の絶対値を引いた差分値の確率分布を示す図である。 図5は、補正周波数係数の確率分布と、予測誤差画像の周波数係数の確率分布を示す図である。 図6は、周波数係数適応符号化部の概略構成図である。 図7は、補正周波数係数の確率密度分布と量子化スケールの関係の一例を表す図である。 図8は、補正周波数係数の確率密度分布と量子化代表値の関係の一例を表す図である。 図9は、周波数係数の参照順序と有効係数情報との関係を示す図である。 図10は、図9に対応する予測画像の周波数係数と、符号一致予測値を示す図である。 図11は、第1の実施形態による動画像符号化処理の動作フローチャートである。 図12は、第1の実施形態による動画像符号化処理の動作フローチャートである。 図13は、第1の実施形態による動画像符号化装置により符号化された動画像データを復号する第2の実施形態による動画像復号装置の概略構成図である。 図14は、第2の実施形態による周波数係数適応復号部の概略構成図である。 図15は、第2の実施形態による動画像復号処理の動作フローチャートである。 図16は、第2の実施形態による動画像復号処理の動作フローチャートである。 図17は、第3の実施形態による動画像符号化装置の概略構成図である。 図18は、第3の実施形態による周波数係数適応符号化部の概略構成図である。 図19は、第3の実施形態による動画像符号化処理の動作フローチャートである。 図20は、第3の実施形態による動画像符号化処理の動作フローチャートである。 図21は、第3の実施形態による動画像符号化装置により符号化された動画像データを復号する第4の実施形態による動画像復号装置の概略構成図である。 図22は、第4の実施形態による周波数係数適応復号部の概略構成図である。 図23は、第4の実施形態による動画像復号処理の動作フローチャートである。 図24は、第4の実施形態による動画像復号処理の動作フローチャートである。 図25は、第5の実施形態による動画像符号化装置の概略構成図である。 図26は、第5の実施形態による周波数係数適応符号化部の概略構成図である。 図27は、第5の実施形態による動画像符号化処理の動作フローチャートである。 図28は、第5の実施形態による動画像符号化処理の動作フローチャートである。 図29は、第5の実施形態による動画像符号化装置により符号化された動画像データを復号する第6の実施形態による動画像復号装置の概略構成図である。 図30は、第6の実施形態による周波数係数適応復号部の概略構成図である。 図31は、第6の実施形態による動画像復号処理の動作フローチャートである。 図32は、第6の実施形態による動画像復号処理の動作フローチャートである。 図33は、各実施形態による動画像符号化方法または動画像復号方法を実行するコンピュータの概略構成図である。
以下、図を参照しつつ、様々な実施形態による、動画像符号化装置及び動画像復号装置について説明する。一般に、符号化しようとするシンボルの確率分布に偏りがある方が、少ない情報量でそのシンボルを伝送できることがシャノンにより示されている。すなわち、符号化しようとするシンボルの確率分布に偏りがあるほど、そのシンボルを含むデータ列に対する圧縮効率は高くなる。
そこで、発明者は、予測誤差画像について求めた周波数係数を直接符号化する代わりに、確率分布に偏りがある情報を符号化することを検討した。その結果、発明者は、予測誤差画像の周波数係数の正負の符号と、その周波数係数が表す周波数成分と同じ周波数成分を表す予測画像の対応する周波数係数の正負の符号との一致、不一致を表す符号一致情報の確率分布に偏りがあることを見出した。
そこで、以下に説明する動画像符号化装置は、予測誤差画像を直交変換するだけでなく、予測画像も直交変換する。そして動画像符号化装置は、予測誤差画像を直交変換することにより求められた周波数係数と、予測画像を直交変換することにより求められた、対応する周波数係数の正負の符号とに基づいて求めた符号一致情報を用いて予測誤差画像の周波数係数を符号化する。
なお、以下では、符号化された動画像データに含まれる各情報に割り当てられた符号と正負の符号とを区別するために、正負の符号をサインと呼ぶ。
なお、ピクチャは、フレームまたはフィールドの何れであってもよい。フレームは、動画像データ中の一つの静止画像であり、一方、フィールドは、フレームから奇数行のデータあるいは偶数行のデータのみを取り出すことにより得られる静止画像である。
また、符号化された動画像は、カラー動画像であってもよく、あるいは、モノクロ動画像であってもよい。
図1は、第1の実施形態による動画像符号化装置の概略構成図である。動画像符号化装置1は、予測モード判定部11と、イントラ予測部12と、動き補償部13と、セレクタ14と、予測誤差画像生成部15と、予測誤差直交変換部16と、予測画像直交変換部17と、符号判定部18と、周波数係数適応符号化部19と、逆変換部20と、加算器21と、画像メモリ22と、サイド情報符号化部23とを有する。
動画像符号化装置1が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像符号化装置1が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像符号化装置1に実装されてもよい。さらに、動画像符号化装置1が有するこれらの各部は、動画像符号化装置1が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
動画像符号化装置1は、図示しない、符号化する動画像データを記憶するバッファメモリから、符号化する動画像データのピクチャのデータをマクロブロック単位で順次読み込む。そして動画像符号化装置1は、符号化対象マクロブロックを予測モード判定部11、動き補償部13及び予測誤差画像生成部15へ渡す。
予測モード判定部11は、符号化対象マクロブロックに含まれる各ブロックに対する予測画像の生成方法を規定する予測符号化モードを決定する。そのために、予測モード判定部11は、各予測符号化モードについてのマクロブロックの符号化されたデータ量の評価値であるコストをそれぞれ算出する。そして予測モード判定部11は、コストが最小となる予測符号化モードを、符号化対象マクロブロックに対して適用される予測符号化モードとする。例えば、コストが最小となる予測符号化モードがインター予測符号化することを表すインター予測符号化モードであれば、予測モード判定部11は、予測符号化モードとしてインター予測符号化モードを選択する。一方、コストが最小となる予測符号化モードがイントラ予測符号化することを表すイントラ予測符号化モードであれば、予測モード判定部11は、予測符号化モードとしてイントラ予測符号化モードを選択する。
あるいは、予測モード判定部11は、符号化対象マクロブロックが含まれる符号化対象ピクチャの種別に応じて、予測符号化モードを決定してもよい。例えば、符号化対象ピクチャがイントラ予測符号化されるIピクチャであれば、予測モード判定部11は、予測符号化モードとしてイントラ予測符号化モードを選択する。また、符号化対象ピクチャがインター予測符号化されるBピクチャまたはPピクチャであれば、予測モード判定部11は、予測符号化モードとしてインター予測符号化モードを選択する。
予測モード判定部11は、選択した予測符号化モードをセレクタ14及びサイド情報符号化部23へ通知する。また予測モード判定部11は、選択した予測符号化モードがイントラ予測符号化モードであれば、イントラ予測部12へ予測画像を生成するよう通知する。一方、選択した予測符号化モードがインター予測符号化モードであれば、予測モード判定部11は、動き補償部13へ動き補償された予測画像を生成するよう通知する。
イントラ予測部12は、予測画像生成部の一例であり、予測モード判定部11によって選択されたイントラ予測符号化モードに従って、符号化対象マクロブロック内の各ブロックに対する予測画像を生成する。その際、イントラ予測部12は、例えば、MPEG-4 AVC/H.264に規定されている水平モード、DCモード、または垂直モードなどに従って、既に符号化され、その後復号された、符号化対象ブロックに隣接する参照ブロックの画素値を用いて予測画像を生成する。何れのモードにおいても、予測画像の各画素の値は、参照ブロック内の複数の画素の値を平均または加重平均することにより算出される。平均演算または加重平均演算は、ローパスフィルタ処理の一例である。したがって、予測画像の各画素の値は、参照ブロックに対してローパスフィルタリングを行って得られた値である。従って、一般に、イントラ予測により作成される予測画像の高周波数成分は、参照ブロックの高周波数成分よりも小さくなる。
イントラ予測部12は、生成された予測画像をセレクタ14へ渡す。
動き補償部13は、予測画像生成部の他の一例であり、符号化対象マクロブロックがインター予測符号化される場合、符号化対象マクロブロック内の符号化対象ブロックと参照ピクチャとを用いて動きベクトルを算出する。動きベクトルは、符号化対象ブロックと、そのブロックに最も類似する参照ピクチャとの空間的な移動量を表す。
動き補償部13は、符号化対象ブロックと、参照ピクチャとのブロックマッチングを実行することにより、符号化対象ブロックと最も一致する参照ピクチャ及びその参照ピクチャ上の領域の位置を決定する。
動き補償部13は、符号化対象ブロックのピクチャ上の位置と、そのブロックに最も一致する参照ピクチャ上の領域との水平方向及び垂直方向の移動量を動きベクトルとする。
動き補償部13は、画像メモリ22から得た参照ピクチャ中の符号化対象ブロックと最も一致する参照ピクチャ上の領域を動きベクトルに基づいて動き補償することにより予測画像を生成する。なお、動き補償は、動きベクトルで表された、符号化対象ブロックとそれに対して最も類似する参照ピクチャ上の領域の位置ずれ量を相殺するように、その最も類似する参照ピクチャ上の領域の位置を移動する処理である。
符号化対象ブロックと最も良好に一致する参照ピクチャ上の領域間の水平方向または垂直方向の移動量が画素サイズの整数倍でない場合もある。そこで動き補償部13は、予測画像中の注目画素について、その注目画素の近傍に位置する対応する参照ピクチャの複数の画素を用いて補間演算処理を行うことにより、その注目画素の値を求める。例えば、注目画素が、参照ピクチャ上のある画素に対して水平方向に画素サイズの1/4ずれている場合、補間演算は、例えば、次式で表される。
Figure 2012042646
ここで、補間により求められるp(x)は、予測画像の注目画素xの値であり、r(A)〜r(F)は、それぞれ、注目画素xの周囲に位置し、水平方向に一列に並んだ参照ピクチャの画素A〜Fの値である。この例では、注目画素xは、画素Cと画素Dの間に位置し、画素Cから画素サイズの1/4離れ、かつ、画素Dから画素サイズの3/4離れている。
(1)式から明らかなように、注目画素xの値は、参照ピクチャに対してローパスフィルタリングを行って得られた値である。従って、一般に、インター予測により作成される予測画像の高周波数成分は、参照ピクチャの対応する領域の高周波数成分よりも小さくなる。
動き補償部13は、符号化対象マクロブロック内の各ブロックについての動きベクトルとともに参照ピクチャの識別子をサイド情報符号化部23へ渡す。また動き補償部13は、符号化対象マクロブロック内の各ブロックについての予測画像をセレクタ14へ渡す。
セレクタ14は、予測モード判定部11から通知された予測符号化モードに応じて、イントラ予測部12及び動き補償部13の何れかから受け取った予測画像を予測誤差画像生成部15、予測画像直交変換部17及び加算器21へ出力する。
予測誤差画像生成部15は、符号化対象マクロブロックに含まれる各ブロックと、セレクタ14から受け取った、各ブロックに対応する予測画像との差分演算を実行することにより、各ブロックについての予測誤差画像を算出する。予測誤差画像生成部15は、各予測誤差画像を予測誤差直交変換部16へ出力する。
予測誤差直交変換部16は、符号化対象マクロブロック内の各ブロックについての予測誤差画像を直交変換することにより、予測誤差画像の水平方向の周波数成分及び垂直方向の周波数成分を表す複数の周波数係数を求める。例えば、予測誤差直交変換部16は、直交変換処理として、離散コサイン変換(Discrete Cosine Transform、DCT)を予測誤差画像に対して実行することにより、複数の周波数係数として、DCT係数の組を得る。あるいは、予測誤差直交変換部16は、離散コサイン変換の代わりに、他の直交変換処理、例えば、アダマール変換またはウェーブレット変換を用いてもよい。
予測誤差直交変換部16は、各予測誤差画像について得られた複数の周波数係数を周波数係数適応符号化部19へ出力する。
予測画像直交変換部17は、符号化対象マクロブロックに含まれる各ブロックの予測画像を直交変換することにより、各予測画像の複数の周波数係数を算出する。なお、予測画像直交変換部17は、予測誤差直交変換部16により実行される直交変換と同じ直交変換を用いる。
予測画像直交変換部17は、各予測画像の複数の周波数係数を符号判定部18へ出力する。
符号判定部18は、符号化対象マクロブロック内の各ブロックの予測画像の各周波数係数のサインを所定の順序に従って順に判定する。そして符号判定部18は、予測画像の注目する周波数係数のサインが正である場合、'1'を周波数係数適応符号化部19の適応量子化/逆量子化部191へ出力し、'0'を周波数係数適応符号化部19の出力適応量子化係数符号化部192へ出力する。
一方、符号判定部18は、注目する周波数係数のサインが負である場合、'-1'を適応量子化/逆量子化部191へ出力し、'1'を適応量子化係数符号化部192へ出力する。
なお、所定の順序は、適応量子化/逆量子化部191及び適応量子化係数符号化部192が予測誤差画像の各周波数係数を量子化及びエントロピー符号化する順序と同じ順序であり、例えば、MPEG-4 AVC/H.264に規定された順序とすることができる。
図2は、予測画像の各周波数係数について、サインを判定する順序の一例を示す図である。図2に示された例では、予測画像200は4×4画素のサイズを有する。そして予測画像200において、例えば、左上端の画素の画素値が最も低い周波数成分を表す周波数係数である。そして左上端の画素に近い画素ほど、低い周波数成分に相当する周波数係数を表す。
一般に、予測誤差画像及び予測画像に関して、低い周波数成分に対応する周波数係数ほど、大きな絶対値となる傾向がある。逆に、右下端に近い画素、すなわち、高い周波数成分に対応する周波数係数の絶対値は相対的に小さな値となる。その結果、予測誤差画像の周波数係数が量子化されると、右下端に近い画素は量子化係数'0'となる可能性が高い。そして、特定のシンボルが連続するデータは、効率良く符号化できる。そこで、本実施形態では、符号判定部18は、矢印201で示されるように、左上端画素に近い方から順に各周波数係数のサインを判定する。なお、予測画像及び予測誤差画像が他のサイズ、例えば、8×8画素を有している場合も、符号判定部18は、同様に、最も低い周波数成分に対応する画素から順に各周波数係数のサインを判定する。
周波数係数適応符号化部19は、適応符号化部の一例である。そして周波数係数適応符号化部19は、予測誤差画像の複数の周波数係数のそれぞれに対して、その周波数係数が表す周波数成分と同じ周波数成分を表す予測画像の対応する周波数係数のサインを乗じることにより補正周波数係数を算出する。この補正周波数係数は、符号一致情報の一例である。そして周波数係数適応符号化部19は、補正周波数係数を量子化し、その量子化により得られた量子化係数をエントロピー符号化する。
ここで、補正周波数係数の出現確率の偏りについて説明する。
図3は、符号化対象ピクチャの符号化対象ブロックのパワースペクトルと、符号化対象ブロックに対する予測画像のパワースペクトルの関係を示す図である。この図において、横軸は周波数を表し、縦軸はパワースペクトル密度を表す。そしてグラフ300は、符号化対象ブロックのパワースペクトルを表し、一方、グラフ301は、予測画像のパワースペクトルを表す。
上述したように、予測画像は、一旦符号化され、その後復号された参照ピクチャまたは参照ブロックに対してローパスフィルタ処理が行われることにより算出される。そのため、予測画像の高周波数成分は、予測画像を作成するために利用された参照ピクチャの領域または参照ブロックの高周波数成分よりも小さい。また、予測画像は、符号化対象ブロックと類似するように作成されるため、予測画像の作成に利用された参照ピクチャの領域または参照ブロックも、符号化対象ブロックと類似している可能性が高い。したがって、符号化対象ブロックの高周波数成分は、予測画像の作成に利用された参照ピクチャの領域または参照ブロックの高周波数成分と同程度である可能性が高い。
したがって、図3に示されるように、各周波数において、予測画像のパワースペクトルは、符号化対象ブロックのパワースペクトルよりも小さくなる。その結果、例えば、周波数ωiに対応する予測画像のi番目の周波数係数の絶対値|Coefpred(i)|は、符号化対象ブロックを直接直交変換して得られたi番目の周波数係数の絶対値|Coeforg(i)|よりも小さくなる可能性が高い。
図4は、符号化対象ブロックの周波数係数の絶対値から予測誤差画像の対応する周波数係数の絶対値を引いた差分値{|Coeforg(i)|- |Coefpred(i)|}の確率分布を示す図である。図4において、横軸は{|Coeforg(i)|- |Coefpred(i)|}を表し、縦軸は確率密度を表す。そしてグラフ400は、{|Coeforg(i)|- |Coefpred(i)|}に対する確率密度分布を表すグラフである。
上述したように、各周波数において、予測画像の周波数係数の絶対値|Coefpred(i)|は、符号化対象ブロックの周波数係数の絶対値|Coeforg(i)|よりも小さくなる可能性が高い。そのため、図4に示されるように、{|Coeforg(i)|- |Coefpred(i)|}が正となる確率は、{|Coeforg(i)|- |Coefpred(i)|}が負となる確率よりも高くなる。
ここで、変数xのサインを返す関数sign(x)を次式のように定義する。
Figure 2012042646
この関数sign(x)を用いることにより、{|Coeforg(i)|- |Coefpred(i)|}は次式のように表される。
Figure 2012042646
ここで、符号化対象ブロックと予測画像間の差分により求められる予測誤差画像を直交変換することにより得られる周波数係数は、符号化対象ブロックの周波数係数から予測画像の周波数係数を引いた値となる。従って、次式が成立する。
Figure 2012042646
なお、Coefdiff(i)は、周波数ωiに対応する、予測誤差画像のi番目の周波数係数である。
また、予測画像は、符号化対象ブロックと類似するように作成されたものであるため、符号化対象ブロックの各周波数係数の符号sign(Coeforg(i))は、予測画像の対応する周波数係数の符号sign(Coefpred(i))と同一である可能性が高い。
したがって、(3)式において、sign(Coeforg(i))をsign(Coefpred(i))で置換し、かつ(4)式を適用することにより次式が得られる。
Figure 2012042646
したがって、予測誤差画像の周波数係数に、予測画像の対応する周波数係数のサインを乗じた値、すなわち補正周波数係数sign(Coefpred(i))Coefdiff(i)の確率密度分布も、図4に示されるように、正の値となる確率の方が負の値となる確率よりも高い。
図5は、補正周波数係数の確率分布と、予測誤差画像の周波数係数の確率分布を示す図である。図5において、横軸は周波数を表し、縦軸は確率密度を表す。そしてグラフ500は、補正周波数係数sign(Coefpred(i))Coefdiff(i)の確率分布を表し、一方、グラフ501は、予測誤差画像の周波数係数Coefdiff(i)の確率分布を表す。
上記のように、補正周波数係数sign(Coefpred(i))Coefdiff(i)が正となる確率密度は、補正周波数係数sign(Coefpred(i))Coefdiff(i)が負となる確率密度よりも高い。その結果、補正周波数係数sign(Coefpred(i))Coefdiff(i)の確率分布は、周波数'0'に対して非対称な、偏りのある分布となっている。一方、予測誤差画像の周波数係数Coefdiff(i)の確率分布は、正の値と負の値の確率密度がほぼ等しい分布である。
したがって、補正周波数係数sign(Coefpred(i))Coefdiff(i)の情報量は、予測誤差画像の周波数係数Coefdiff(i)の情報量よりも小さい。そこで動画像符号化装置1は、補正周波数係数sign(Coefpred(i))Coefdiff(i)を符号化することにより、符号化効率を向上できる。
図6は、周波数係数適応符号化部19の概略構成図である。周波数係数適応符号化部19は、適応量子化/逆量子化部191と、適応量子化係数符号化部192とを有する。
適応量子化/逆量子化部191は、符号化対象マクロブロック内の各ブロックについての予測誤差画像の補正周波数係数を算出し、その補正周波数係数を量子化する。そのために、適応量子化/逆量子化部191は、3個の乗算器1911〜1913と、非線形量子化部1914と、非線形逆量子化部1915とを有する。
乗算器1911は、予測誤差画像の各周波数係数に、符号判定部18により求められたその周波数係数が表す周波数成分と同じ周波数成分を表す予測画像の対応する周波数のサインを乗じることで各補正周波数係数を算出する。したがって、予測誤差画像の注目する周波数係数のサインと、予測画像の対応する周波数係数のサインが一致する場合、その注目する周波数係数に対応する補正周波数係数のサインは'正'となる。一方、注目する周波数係数のサインと、予測画像の対応する周波数係数のサインが一致しない場合、その注目する周波数係数に対応する補正周波数係数のサインは'負'となる。
乗算器1911は、各予測誤差画像についてそれぞれ求めた複数の補正周波数係数を非線形量子化部1914へ出力する。
非線形量子化部1914は、補正周波数係数を量子化する。
図7は、補正周波数係数の確率密度分布と量子化スケールの関係の一例を表す図である。図7において、横軸は補正周波数係数を表し、縦軸は確率密度を表す。そしてグラフ700は、補正周波数係数の確率密度分布を表す。なお、このグラフ700は、図5における、sign(Coefpred(i))Coefdiff(i)の確率分布500に対応する。また、QP1、QP2は、それぞれ、補正周波数係数が'正'、'負'の値を有する場合の量子化スケールである。そしてlevelは、補正量子化係数である。またq(i)は、level(i)に対応する量子化代表値である。ここでは、量子化代表値は、補正周波数係数を量子化した場合の補正周波数係数の代表値である。そして補正量子化係数は、対応する量子化代表値のインデックス値である。
上記のように、補正周波数係数、すなわち、sign(Coefpred(i))Coefdiff(i)が正となる確率密度は、sign(Coefpred(i))Coefdiff(i)が負となる確率密度よりも高い。その結果、グラフ700に表されるように、補正周波数係数sign(Coefpred(i))Coefdiff(i)の確率分布は、'0'に対して非対称な、偏りのある分布となっている。
このような、非対称な、偏りのある分布については、出現確率が高いシンボルほど、そのシンボルに対する隣接する量子化代表値間の間隔を狭くすることで、量子化誤差が小さくなることが知られている。そして本実施形態では、上記のように、補正周波数係数の絶対値が同一であれば、'正'の値を有する補正周波数係数の出現確率は、'負'の値を有する補正周波数係数の出現確率よりも高い。
そこで、非線形量子化部1914は、補正周波数係数が'負'の値を有する場合の量子化スケールQP2を、補正周波数係数が'正'の値を有する場合の量子化スケールQP1よりも大きくする。これにより、非線形量子化部1914は、出現確率の高い、正の値を持つ補正周波数係数は正確に再現されるように量子化しつつ、出現確率の低い、負の値を持つ補正周波数係数の情報を削減できる。
例えば、非線形量子化部1914は、次式に従って補正周波数係数を量子化することにより、補正量子化係数を算出する。
Figure 2012042646
ここで関数int(x)は、x以下の最大の整数を出力する関数である。また関数abs(x)は、変数xの絶対値を出力する関数である。そしてCoefc(i)は、i番目の補正周波数係数であり、Coefc(i) = sign(Coefpred(i))Coefdiff(i)である。これにより、各補正周波数係数は、量子化スケール間隔で設定される複数の周波数係数代表値のうちの最も近い代表値に対応する補正量子化係数に量子化される。
なお、非線形量子化部1914は、上記の関数int()内の演算の代わりに、補正周波数係数の絶対値に量子化スケールの1/2を加えた値に対して量子化スケールQP1またはQP2に相当する右方向へのビットシフト演算を行って補正量子化係数を求めてもよい。例えば、量子化スケールQP1が'8'であれば、8=23であるため、非線形量子化部1914は、補正周波数係数の絶対値に量子化スケールの1/2を加えた値を3ビット右方向へシフトする。
なお、量子化スケールQP1、QP2は、例えば、以下のように事前に決定され、非線形量子化部1914が有するメモリに予め記憶される。
まず、量子化スケールの初期値QP及び定数αが設定される。このQP及びαを用いて、QP1及びQP2は次式のように表される。
Figure 2012042646
そして、予め準備されたテスト用動画像データに対して、量子化スケールQPを変化させつつ、テスト用動画像データを本実施形態に従って符号化し、符号化レート・歪特性を求める。なお、符号化レート・歪特性は、例えば、符号化レートを様々に変更した場合における、符号化されたテスト用動画像データを復号した動画像データの信号対ノイズ比により表される。そして符号化レート・歪特性が最も良いQPの値が選択される。次に、テスト用動画像データに対して、定数αを変化させつつ、テスト用動画像データを本実施形態に従って符号化し、符号化レート・歪特性を求める。そして符号化レート・歪特性が最も良いαの値が選択される。そして選択されたQP及びαを(7)式に代入することにより、QP1及びQP2が決定される。
また、非線形量子化部1914は、隣接する量子化代表値間の間隔を、補正周波数係数の確率密度分布に応じて最適な間隔となるように、その間隔が量子化代表値の絶対値に応じて非線形に変化するように設定してもよい。この場合、量子化誤差を最小化するために、量子化代表値に対応する確率が高いほど、隣接する量子化代表値間の間隔が狭くなる。
例えば、M. D .Paez, T. H. Glisson, “Minimum Mean-Squared-Error Quantization in Speech PCM and DPCM Systems”, IEEE TRANSACTIONS ON COMMUNICATIONS, 1972年4月, pp.225-230には、確率密度分布がラプラシアン分布に従う場合の量子化代表値が示されている。ラプラシアン分布に従う確率分布PDF(x)は、一般には、aを任意の定数とし、xをシンボルの値として、以下の式で表される。
PDF(x) = a/2・exp|-a・x|
そして、xの値が大きいほど、確率分布PDF(x)の値は指数関数的に0に近づく。そして上記の文献には、量子化代表値の数Nが2、4、8、16、32の場合の量子化代表値が示されている。例えば、量子化代表値の数Nが8であり、yiが(i=1,2,3,4)が、それぞれ0に近い順、かつ正負対称な、各量子化代表値とする。この場合、第一の量子化代表値y1=±0.222、第二の量子化代表値y2=±0.785、第三の量子化代表値y3=±1.576、第四の量子化代表値y4=±2.994、となる。よって、それぞれ、隣接する量子化代表値の間隔は、y2-y1=0.563、y3-y2=0.791、y4-y3=1.418となる。すなわち、シンボルの値が大きくなり、かつそのシンボルの値に対する確率が小さくなるほど、量子化代表値の間隔が広がっていることが分かる。
本実施形態では、補正周波数係数の絶対値が同一であれば、正の値を持つ補正周波数係数の出現確率は、負の値を持つ補正周波数係数の出現確率よりも高くなる。したがって、各量子化代表値は、補正周波数係数の絶対値が同一であれば、隣接する二つの負の値を持つ補正周波数係数に対する量子化代表値間の間隔が、隣接する二つの正の値を持つ補正周波数係数に対する量子化代表値間の間隔よりも広くなるよう設定される。そのために、補正周波数係数に対する各量子化代表値は、例えば、テスト用動画像シーケンスに対して求めた補正周波数係数の出現確率分布に基づいて、Llord-Max法に従って決定されてもよい。そして各量子化代表値は、例えば、非線形量子化部1914が有するメモリに予め記憶される。
この場合、非線形量子化部1914は、各補正周波数係数を量子化する際、複数の量子化代表値のうちの補正周波数係数に最も近い量子化代表値を求め、その量子化代表値に対応する補正量子化係数を出力する。
図8は、補正周波数係数の確率密度分布と量子化代表値の関係の一例を表す図である。図8において、横軸は補正周波数係数を表し、縦軸は確率密度を表す。そしてグラフ800は、補正周波数係数の確率密度分布を表す。なお、このグラフ800は、図5における、sign(Coefpred(i))Coefdiff(i)の確率分布500に対応する。そしてlevelは、補正量子化係数である。またq(i)は、level(i)に対応する量子化代表値である。
上記のように、補正周波数係数、すなわち、sign(Coefpred(i))Coefdiff(i)が正となる確率密度は、sign(Coefpred(i))Coefdiff(i)が負となる確率密度よりも高い。その結果、絶対値が等しい補正量子化係数に対応する量子化代表値間の間隔は、負の値を持つ量子化代表値よりも正の値を持つ量子化代表値に対して広くなるように設定される。例えば、補正量子化係数'-1'に対応する量子化代表値q(-1)と補正量子化係数'-2'に対応する量子化代表値q(-2)との間隔801は、補正量子化係数'1'に対応する量子化代表値q(1)と補正量子化係数'2'に対応する量子化代表値q(2)との間隔802よりも広い。
非線形量子化部1914は、各補正周波数係数に対応する補正量子化係数を、非線形逆量子化部1915及び乗算器1912へ出力する。
乗算器1912は、各補正量子化係数に、その補正量子化係数が表す周波数成分と同じ周波数成分を表す予測画像の対応する周波数係数のサインを乗じることにより、予測誤差画像の各周波数係数に対応する量子化係数を算出する。このサインの乗算の結果、各補正量子化係数に対応する予測誤差画像の周波数係数に対して、予測画像の対応する周波数係数のサインが2回乗じられたことになる。したがって、乗算器1912から出力される各量子化係数のサインは、予測誤差画像の対応する周波数係数のサインと一致する。
乗算器1912から出力された各量子化係数は、適応量子化係数符号化部192へ入力される。
非線形逆量子化部1915は、各補正量子化係数を逆量子化することにより、各補正周波数係数を再生する。本実施形態では、非線形逆量子化部1915は、非線形量子化部1914と同様に、補正量子化係数のサインに応じて異なる量子化スケールを用いて逆量子化する。
例えば、非線形逆量子化部1915は、次式に従って各補正量子化係数を逆量子化する。
Figure 2012042646
ここでlevelは補正量子化係数である。またQP1、QP2は、それぞれ、補正量子化係数のサインが'正'、'負'であるときの量子化スケールであり、非線形量子化部1914が用いる量子化スケールQP1、QP2と同一である。そしてq(level)は、再生される補正周波数係数であり、補正量子化係数levelに応じた補正周波数係数の代表値である。
あるいは、量子化代表値間の間隔が、補正周波数係数の絶対値に応じて変化するように設定されている場合、非線形逆量子化部1915は、例えば、補正量子化係数と量子化代表値との対応関係を表す参照テーブルを内蔵するメモリに予め記憶しておく。そして非線形逆量子化部1915は、その参照テーブルを参照して、補正量子化係数に対応する量子化代表値を、再生される補正周波数係数として求める。
非線形逆量子化部1915は、再生した各補正周波数係数を乗算器1913へ出力する。
乗算器1913は、再生された各補正周波数係数に、予測画像の対応する周波数係数のサインを乗じることにより、予測誤差画像の各周波数係数を再生する。これにより、再生された各周波数係数に対応する予測誤差画像の周波数係数に対して、予測画像の対応する周波数係数のサインが2回乗じられたことになる。したがって、乗算器1913から出力される再生された各周波数係数のサインは、予測誤差画像の対応する周波数係数のサインと一致する。
乗算器1913から出力された、再生された各周波数係数は、逆変換部20へ入力される。
適応量子化係数符号化部192は、適応量子化/逆量子化部191から受け取った、符号化対象マクロブロック内の各予測誤差画像の量子化係数をエントロピー符号化する。そのために、適応量子化係数符号化部192は、有効係数情報生成部1921と、有効係数位置情報符号化部1922と、有効係数絶対値情報符号化部1923と、排他的論理和部1924と、有効係数符号情報予測符号化部1925とを有する。
有効係数情報生成部1921は、符号化対象マクロブロック内の各ブロックについての予測誤差画像の複数の量子化係数のうち、'0'以外の値を持つ量子化係数である有効係数を抽出する。有効係数情報生成部1921は、符号判定部18が予測画像の周波数係数のサインを判定する順序と同一の順序に従って、量子化係数が'0'か否か判定する。そして有効係数情報生成部1921は、有効係数の位置を表す有効係数位置情報を有効係数位置情報符号化部1922へ出力する。また有効係数情報生成部1921は、有効係数の絶対値を表す有効係数絶対値情報を有効係数絶対値情報符号化部1923へ出力する。そして有効係数情報生成部1921は、有効係数のサインを表す有効係数符号情報を排他的論理和部1924へ出力する。
図9は、量子化係数の参照順序と有効係数情報との関係を示す図である。図9における画像900は、予測誤差画像の量子化係数を表す画像である。そして画像900の各画素の値は量子化係数を表す。また画像900内に示された矢印901は、参照される量子化係数の順序を表す。この例では、'0'以外の値を持つ画素は、1〜5番目、7番目、及び9〜10番目に参照される。
表910は、画像900に対応する有効係数位置情報、有効係数絶対値情報及び有効係数符号情報を表す。表900において、行911は、各有効係数の識別番号を表す。この識別番号は、量子化係数の参照順序に従って、最初に検出された有効係数から順に1ずつ大きくなるように付される。
また行912は、有効係数位置情報を表す。有効係数位置情報は、有効係数が含まれる画素の参照順序に従った番号を含み、この例では、有効係数の識別番号'1'から順に、1、2、3、4、5、7、9、10となる。
さらに、行913は、有効係数絶対値情報を表す。この例では、有効係数の識別番号'1'は、左上端の画素に対応するので、有効係数の識別番号'1'に対応する有効係数の絶対値は'3'となる。同様に、有効係数の識別番号'5'は、左端及び上端からそれぞれ2番目の画素に対応するので、有効係数の識別番号'1'に対応する有効係数の絶対値は'1'となる。
さらに、行914は、有効係数符号情報を表す。本実施形態では、有効係数符号情報は、有効係数のサインが'正'である場合、その有効係数のサインを'0'で表し、一方、有効係数のサインが'負'である場合、その有効係数のサインを'1'で表す。この例では、5番目に参照される画素についてのみ、有効係数が負の値を持つ。そのため、有効係数の識別番号'5'に対応する有効係数符号情報のみが'1'となり、その他の識別番号に対応する有効係数符号情報は'0'となっている。
有効係数位置情報符号化部1922は、有効係数位置情報をエントロピー符号化する。そこで、有効係数位置情報符号化部1922は、対応する周波数が低い量子化係数ほど有効係数となる頻度が高いことを利用して、最適なエントロピー符号を割り当てる。例えば、有効係数位置情報符号化部1922は、ハフマン符号化方式、またはContext Adaptive Binary Arithmetic Coding(CABAC)といった算術符号化方式といったエントロピー符号化方式を用いて有効係数位置情報をエントロピー符号化する。
有効係数位置情報符号化部1922は、エントロピー符号化された有効係数位置情報を図示しない統合部へ出力する。
有効係数絶対値情報符号化部1923は、有効係数絶対値情報をエントロピー符号化する。そこで、有効係数絶対値情報符号化部1923は、対応する周波数が低い量子化係数ほど大きな値となる確率が高く、逆に対応する周波数が高い量子化係数ほど小さな値となる確率が低いことを利用して、最適なエントロピー符号を割り当てる。例えば、有効係数絶対値情報符号化部1923は、ハフマン符号化方式、またはCABACなどの算術符号化方式といったエントロピー符号化方式を用いて有効係数絶対値情報をエントロピー符号化する。
有効係数絶対値情報符号化部1923は、エントロピー符号化された有効係数絶対値情報を図示しない統合部へ出力する。
排他的論理和部1924は、有効係数が表す周波数成分と同じ周波数成分を表す予測画像の対応する周波数係数のサインを表す値を符号判定部18から受け取る。そして排他的論理和部1924は、有効係数のサインを表す有効係数符号情報の値と、予測画像の対応する周波数係数のサインを表す値との間で排他的論理和演算を実行することにより符号一致予測値を求める。この符号一致予測値は、符号一致情報の一例である。
本実施形態では、有効係数のサインが'正'である場合、有効係数符号情報が表す値は'0'であり、有効係数のサインが'負'である場合、有効係数符号情報が表す値は'1'である。一方、予測画像の周波数係数のサインが'正'である場合、符号判定部18から受け取る値は'0'であり、予測画像の周波数係数のサインが'負'である場合、符号判定部18から受け取る値は'1'である。したがって、有効係数のサインと予測画像の対応する周波数係数のサインが一致する場合、符号一致予測値は'0'となり、一方、有効係数のサインと予測画像の対応する周波数係数のサインが一致しない場合、符号一致予測値は'1'となる。
排他的論理和部1924は、各有効係数に対応する符号一致予測値を含む符号一致予測情報を有効係数符号情報予測符号化部1925へ出力する。
有効係数符号情報予測符号化部1925は、符号一致予測情報をエントロピー符号化する。ここで、符号一致予測情報に含まれる符号一致予測値は、上記のように、有効係数、すなわち'0'でない値を持つ量子化係数のサインと、予測画像の対応する周波数係数のサインが一致する場合に'0'となる値である。そして量子化係数のサインと、予測画像の対応する周波数係数のサインとが一致する確率は、それらのサインが一致しない確率よりも高い。従って、符号一致予測値が'0'となる確率も、符号一致予測値が'1'となる確率よりも高い。
図10は、図9に対応する予測画像の周波数係数と、符号一致予測値を示す図である。図10において、画像1000は、図9に示された予測誤差画像の周波数係数を表す画像に対応する、予測画像の周波数係数を表す画像である。また図10に示された表1010は、図9に示された表900に、有効係数に対応する予測画像の周波数係数及びそのサインと、符号一致予測値とを追加したものである。
表1010において行1011〜1014は、それぞれ、各有効係数の識別番号、有効係数位置情報、有効係数絶対値情報及び有効係数符号情報を表す。また行1015は、有効係数に対応する予測画像の周波数係数の値を表す。この例では、最初に参照される有効係数に対応する画像1000の左上端の画素値は'227.25'であるため、有効係数の識別番号'1'に対応する行1015中の欄の値も、'227.25'となっている。
また、行1016は、有効係数に対応する予測画像の周波数係数のサインの値、すなわち、有効係数符号情報の予測値を表す。本実施形態では、この有効係数符号情報の予測値は、符号化判定部18から受け取った値である。したがって、周波数係数のサインが'正'である場合'0'であり、周波数係数のサインが'負'である場合、その値は'1'である。この例では、2、5、9番目に参照される画素の周波数係数が'負'の値を持ち、有効係数に対応するその他の画素の周波数係数は'正'の値を持つ。そのため、有効係数の識別番号'2'、'5'及び'7'に対応する予測画像の周波数係数のサインの値が'1'となり、その他の識別番号に対応する予測画像の周波数係数のサインの値は'0'となっている。
そして行1017は、符号一致予測値を表す。この例では、識別番号'2'と'7'に対応する有効係数のサインと予測画像の周波数係数のサインが一致するので、識別番号'2'及び'7'の符号一致予測値は'1'となる。
このように、符号一致予測値の出現頻度には、値に応じた偏りが存在する。そこで有効係数符号情報予測符号化部1925は、その偏り度合いに応じた最適なエントロピー符号を用いて符号一致予測情報に含まれる複数の符号一致予測値をエントロピー符号化する。例えば、有効係数符号情報予測符号化部1925は、CABACなどの算術符号化方式を用いて符号一致予測情報をエントロピー符号化する。あるいは、有効係数符号情報予測符号化部1925は、複数の符号一致予測値に対してエントロピー符号を割り当てるように、他のエントロピー符号化方式を適用してもよい。これにより、有効係数符号情報予測符号化部1925は、一つの有効係数のサインに対して1ビット未満の情報量で符号化できる。
これに対し、予測誤差画像の各周波数係数の値が'正'となる確率と'負'となる確率は略等しいため、従来技術では、一つの有効係数のサインに対して1ビット割り当てる必要があった。したがって、本実施形態による動画像符号化装置1は、従来技術よりも少ない情報量で、有効係数のサインに関する情報を符号化できる。
なお、有効係数符号情報予測符号化部1925は、周波数係数ごとに、適用する符号化方式、あるいは割り当てる符号を最適化してもよい。図2に示されるように、一般に、符号化対象ブロックのパワースペクトルに対する予測画像のパワースペクトルの比は、周波数ごとに異なる。そして、そのパワースペクトルの比が'1'に近づくほど、予測画像の周波数係数の確率密度分布は、符号化対象ブロックの周波数係数の確率密度分布に近づく。その結果、予測誤差画像の周波数係数のサインが、予測画像の対応する周波数係数のサインと一致する確率も高くなる。そして、予測誤差画像の周波数係数のサインと予測画像の対応する周波数係数のサインが一致する確率が高いほど、符号一致予測値の分布の偏りも大きくなる。
そこで、例えば、予め準備されたテスト用動画像データに基づいて、周波数係数ごとに、符号一致予測値の分布を求め、その分布に応じて各予測値に対する適切なエントロピー符号が予め決定される。そして周波数係数ごとに、あるいは、上記のパワースペクトルの比が略一致する周波数係数の組ごとに、符号一致予測値の分布に応じたエントロピー符号が有効係数符号情報予測符号化部1925が有するメモリに記憶される。そして有効係数符号情報予測符号化部1925は、周波数係数に応じて適用するエントロピー符号を切り替える。
あるいは、有効係数符号情報予測符号化部1925がCABACのような適応型の算術符号化方式を用いる場合には、周波数係数ごとに別個に符号一致予測値の出現確率を調べることで、周波数係数ごとに符号一致予測値に割り当てるエントロピー符号を決定してもよい。
また、有効係数符号情報予測符号化部1925は、予測画像の画素値の分散に応じて、適用する符号化方式、あるいは割り当てる符号を最適化してもよい。予測画像の画素値の分散が大きい場合には、予測画像内に高周波数成分が多く含まれる。このような場合、符号化対象ブロックに写っている像が予測画像に写っている像に対して僅かに変形していても、符号化対象ブロックと予測画像との間で一致しない画素が多くなる。そのため、予測誤差画像の周波数係数のサインと予測画像の対応する周波数係数のサインも一致する確率が低くなる。その結果として、符号一致予測値の偏り度合いは小さくなる。
一方、予測画像の画素値の分散が小さい場合には、予測画像内に含まれる高周波数成分は少ない。このような場合、符号化対象ブロックに写っている像が予測画像に写っている像に対して変形していても、符号化対象ブロックと予測画像との間で一致しない画素が少なくなる。そのため、予測誤差画像の周波数係数のサインと予測画像の対応する周波数係数のサインも一致する確率が高くなる。その結果として、符号一致予測値の偏り度合いは大きくなる。
そこで、例えば、予め準備されたテスト用動画像データに基づいて、予測画像の画素値の分散ごとに、符号一致予測値の分布を求めることにより、その分布に応じて各予測値に対する適切なエントロピー符号が予め決定される。そして分散ごとに、符号一致予測値に割り当てられるエントロピー符号が有効係数符号情報予測符号化部1925が有するメモリに記憶される。
有効係数符号情報予測符号化部1925は、予測画像をセレクタ14から受け取って予測画像の分散を求め、その分散に応じて適用するエントロピー符号を切り替える。あるいは、有効係数符号情報予測符号化部1925がCABACのような適応型の算術符号化方式を用いる場合には、分散ごとに別個に符号一致予測値の出現確率を調べることで、分散ごとに符号一致予測値に割り当てるエントロピー符号を決定してもよい。
有効係数符号情報予測符号化部1925は、エントロピー符号化した符号一致予測情報を図示しない統合部へ出力する。
また実施形態によっては、補正量子化係数に対する量子化代表値がその出現確率に応じて最適化されている、すなわち、出現確率が高いほど、隣接する量子化代表値間の間隔が狭くなるように量子化代表値が設定されている。この場合、周波数係数適応符号化部19の他の一例は、量子化代表値の出現確率に応じたエントロピー符号を、その量子化代表値に対応する量子化係数に割り当ててもよい。
この場合、各量子化代表値の出現確率は、例えば、テスト用動画像シーケンスに対して求めた補正周波数係数の出現確率分布に基づいて、Llord-Max法により決定される。このようなエントロピー符号は、例えば、ハフマン符号あるいは算術符号とすることができる。これにより、例えば、ハフマン符号が適用される場合、出現確率の高い量子化代表値に対応する量子化係数ほど、符号長の短いエントロピー符号が割り当てられる。また算術符号が適用される場合も、量子化代表値の出現確率に応じてその量子化代表値に対応する量子化係数に割り当てられるエントロピー符号が最適化される。その結果、周波数係数適応符号化部19は、より効率よく量子化係数を符号化できる。
逆変換部20は、周波数係数適応符号化部19から受け取った、各予測誤差画像の再生された複数の周波数係数を逆直交変換する。例えば、予測誤差直交変換部16においてDCT処理が行われる場合、逆変換部20は、逆DCT処理を実行する。逆直交変換処理を再生周波数係数の組に対して実行することにより、符号化前の予測誤差画像と同程度の情報を有する、予測誤差画像が再生される。
そして逆変換部20は、再生された予測誤差画像を加算器21へ出力する。
加算器21は、セレクタ14から受け取った予測画像の各画素の値に、逆変換部20から受け取った、予測誤差画像の対応する画素の値を加算することにより、その予測画像及び予測誤差画像に対応するブロックを再生する。加算器21は、符号化対象ブロック内の各ブロックをそれぞれ再生し、それらを所定の符号化順序に従って結合することにより、符号化対象マクロブロックを再生する。加算器21は、再生したマクロブロックを参照ブロックとしてイントラ予測部12へ供給する。
さらに、加算器21は、再生された符号化対象マクロブロックを所定の符号化順序に従って結合することにより、その後に符号化されるピクチャに対する予測画像を生成するために利用される参照ピクチャを生成する。
加算器21は、得られた参照ピクチャを画像メモリ22に記憶させる。
画像メモリ22は、例えば、半導体メモリを有する。そして画像メモリ22は、加算器21から受け取った参照ピクチャを一時的に記憶する。そして画像メモリ22は、イントラ予測部12、動き補償部13及び予測モード判定部11にその参照ピクチャを供給する。なお、画像メモリ22は、予め定められた所定枚数分の参照ピクチャを記憶し、参照ピクチャの枚数がその所定枚数を超えると、符号化順序が古い参照ピクチャから順に破棄する。
サイド情報符号化部23は、符号化対象マクロブロックごとの予測符号化モード、動き補償ベクトルなどのサイド情報を、例えばハフマン符号またはCABACを用いてエントロピー符号化する。そしてサイド情報符号化部23は、エントロピー符号化されたサイド情報を図示しない統合部へ出力する。
統合部は、周波数係数適応符号化部19から受け取ったエントロピー符号化された有効係数位置情報、有効係数絶対値情報及び符号一致予測情報と、サイド情報符号化部23から受け取ったエントロピー符号化されたサイド情報を、所定のフォーマットに従って一つのデータストリームに格納する。そして統合部は、そのデータストリームを磁気記録媒体、光記録媒体あるいは半導体メモリなどを有する記憶部(図示せず)に記憶するか、あるいはそのデータストリームを他の機器へ出力する。なお、所定のフォーマットは、例えば、MPEG-2において規定されたデータフォーマットとすることができる。
図11及び図12は、第1の実施形態による動画像符号化処理の動作フローチャートである。なお、動画像符号化装置1は、この動画像符号化処理を予測符号化される符号化対象マクロブロックごとに実行する。なお、動画像符号化装置1は、符号化対象マクロブロックが予測符号化されない場合、その符号化対象マクロブロックを、例えば、MPEG-4 AVC/H.264に規定されたイントラ予測符号化方式に従って符号化する。
予測モード判定部11は、符号化対象マクロブロック及び画像メモリ22に記憶されている参照ピクチャに基づいて予測符号化モードを決定する(ステップS101)。
動画像符号化装置1は、予測符号化モードに応じて、符号化対象マクロブロック内の各ブロックについての予測画像を生成する(ステップS102)。具体的には、予測符号化モードがイントラ予測符号化モードである場合、イントラ予測部12が予測画像を生成する。一方、予測符号化モードがインター予測符号化モードである場合、動き補償部13が予測画像を生成する。そしてイントラ予測部12または動き補償部13は予測画像をセレクタ14へ出力する。セレクタ14は、受け取った予測画像を、予測誤差画像生成部15、予測画像直交変換部17及び加算器21へ出力する。
また、予測誤差画像生成部15は、符号化対象マクロブロック内のブロックと予測画像間の差分により予測誤差画像を生成する(ステップS103)。そして予測誤差画像生成部15は、予測誤差画像を予測誤差直交変換部16へ出力する。そして予測誤差直交変換部16は、予測誤差画像を直交変換することにより予測誤差画像の複数の周波数係数を算出する(ステップS104)。そして予測誤差直交変換部16は、予測誤差画像の複数の周波数係数を周波数係数適応符号化部19へ出力する。
一方、予測画像直交変換部17は、予測画像を直交変換することにより予測画像の複数の周波数係数を算出する(ステップS105)。そして予測画像直交変換部17は、予測画像の複数の周波数係数を符号判定部18へ出力する。
符号判定部18は、予測画像の各周波数係数のサインを判定する(ステップS106)。そして符号判定部18は、予測画像の各周波数係数のサインを表す値を、周波数係数適応符号化部19の適応量子化/逆量子化部191及び適応量子化係数符号化部192へそれぞれ出力する。
適応量子化/逆量子化部191の乗算器1911は、予測誤差画像の各周波数係数に予測画像の対応する周波数のサインを乗じて各補正周波数係数を算出する(ステップS107)。そして乗算器1911は、各補正周波数係数を適応量子化/逆量子化部191の非線形量子化部1914へ出力する。
非線形量子化部1914は、各補正周波数係数に対して、正の補正周波数係数に対する隣接量子化代表値間の間隔よりも負の補正周波数係数に対する隣接量子化代表値間の間隔が広くなるように定められた量子化代表値のうちの最も近い量子化代表値を求める。そして非線形量子化部1914は、量子化代表値に対応する補正量子化係数を求める(ステップS108)。非線形量子化部1914から出力された補正量子化係数は、適応量子化/逆量子化部191の非線形逆量子化部1915へ入力される。また非線形量子化部1914から出力された補正量子化係数は、乗算器1912により予測誤差画像の対応する周波数のサインと一致するよう、予測画像の対応する周波数のサインが乗じられて各量子化係数が算出される。その後、各量子化係数は、適応量子化係数符号化部192に入力される。
図12に示されるように、適応量子化係数符号化部192の有効係数情報生成部1921は、各量子化係数のうち、0でない絶対値を持つ有効係数の位置、絶対値及びサインに関する情報を抽出する(ステップS109)。そして有効係数情報生成部1921は、有効係数の位置情報を適応量子化係数符号化部192の有効係数位置情報符号化部1922へ出力する。また有効係数情報生成部1921は、有効係数の絶対値情報を適応量子化係数符号化部192の有効係数絶対値情報符号化部1923へ出力する。そして有効係数情報生成部1921は、有効係数の符号情報を適応量子化係数符号化部192の排他的論理和部1924へ出力する。
有効係数位置情報符号化部1922は、有効係数の位置情報をエントロピー符号化する。また有効係数絶対値情報符号化部1923は、有効係数の絶対値をエントロピー符号化する(ステップS110)。有効係数位置情報符号化部1922及び有効係数絶対値情報符号化部1923は、それぞれ、エントロピー符号化された有効係数の位置情報及び有効係数の絶対値情報を図示しない統合部へ出力する。
一方、排他的論理和部1924は、各有効係数のサインを表す値と予測画像の対応する周波数のサインを表す値との間で排他的論理和演算を実行する。そして排他的論理和部1924は、各有効係数のサインが予測画像の対応する周波数のサインと一致するか否かを表す符号一致予測情報を算出する(ステップS111)。排他的論理和部1924は、符号一致予測情報を有効係数符号情報予測符号化部1925へ出力する。
有効係数符号情報予測符号化部1925は、符号一致予測情報をエントロピー符号化する(ステップS112)。そして有効係数符号情報予測符号化部1925は、エントロピー符号化された符号一致予測情報を統合部へ出力する。
また、サイド情報符号化部23は、動きベクトルなどのサイド情報を符号化する(ステップS113)。そしてサイド情報符号化部23は、符号化されたサイド情報を統合部へ出力する。
また、動画像符号化装置1は、以降のマクロブロックまたはピクチャを符号化するために利用される参照ピクチャまたは参照ブロックを生成する。そのために、周波数係数適応符号化部19の非線形逆量子化部1915は、各補正量子化係数を逆量子化して各補正周波数係数を再生する。そして再生された各補正周波数係数は、乗算器1913により、予測画像の対応する周波数のサインが乗じられることで、予測誤差画像の複数の周波数係数が再生される(ステップS114)。その後、再生された予測誤差画像の複数の周波数係数は、逆変換部20に入力される。
逆変換部20は、再生された予測誤差画像の複数の周波数係数を逆直交変換することにより予測誤差画像を再生する(ステップS115)。そして逆変換部20は、再生した予測誤差画像を加算器21へ出力する。加算器21は、再生された予測誤差画像の各画素の値に予測画像の対応する画素の値を加算して符号化対象マクロブロック内の、その予測画像及び予測誤差画像に対応するブロックを再生する(ステップS116)。そして加算器21は、再生されたブロックを所定の順序に従って結合することにより、符号化対象マクロブロックを再生する。さらに加算器21は、再生された符号化対象マクロブロックを所定の符号化順序に従って順次結合することにより、参照ピクチャを作成する。そして加算器21は、参照ピクチャを画像メモリ22に記憶させる。
なお、ステップS102〜S116の処理は、符号化対象マクロブロック内の各ブロックについて実行される。
その後、動画像符号化装置1は、動画像符号化処理を終了する。なお、動画像符号化装置1は、ステップS104の処理とS105の処理の順序を入れ換えてもよい。また動画像符号化装置1は、ステップS110の処理とS111及びS112の処理の順序を入れ換えてもよい。さらに、動画像符号化装置1は、ステップS114〜S116の処理と、ステップS109〜S113の処理の順序を入れ換えてもよい。
また、動画像符号化装置1は、ステップS109〜S112の処理の代わりに、各量子化係数に対応する量子化代表値の出現確率に応じたエントロピー符号を各量子化係数に割り当てることで、各量子化係数をエントロピー符号化する処理を実行してもよい。
以上に説明してきたように、第1の実施形態による動画像符号化装置は、符号化対象マクロブロック内の各予測誤差画像の周波数係数よりも情報量が少ない補正周波数係数を算出し、その補正周波数係数を量子化する。またこの動画像符号化装置は、補正周波数係数に対する量子化代表値を、その量子化代表値の出現確率に応じて適切に設定できる。そのため、この動画像符号化装置は、各予測誤差画像の周波数係数を符号化するために要する情報量を削減できるので、各予測誤差画像の周波数係数の符号化効率を向上できる。さらに、この動画像符号化装置は、量子化係数を、その量子化係数に対応する量子化代表値の出現確率に応じてエントロピー符号化するか、有効係数の符号一致予測情報をエントロピー符号化できるので、符号化効率をさらに向上できる。
次に第2の実施形態による動画像復号装置について説明する。この第2の実施形態による動画像復号装置は、第1の実施形態による動画像符号化装置によって符号化された動画像データを再生する。
図13は、第2の実施形態による動画像復号装置の概略構成図である。図13に示されるように、動画像復号装置2は、周波数係数適応復号部24と、イントラ予測部12と、動き補償部13と、セレクタ14と、予測画像直交変換部17と、符号判定部18と、逆変換部20と、加算器21と、画像メモリ22とを有する。
動画像復号装置2が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像復号装置2が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像復号装置2に実装されてもよい。さらに、動画像復号装置2が有するこれらの各部は、動画像復号装置2が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
また図13において、動画像復号装置2の各部には、図1に示された動画像符号化装置1の対応する各部の参照番号と同一の参照番号を付した。
動画像復号装置2のイントラ予測部12、動き補償部13、セレクタ14、予測画像直交変換部17、符号判定部18、逆変換部20、加算器21及び画像メモリ22は、それぞれ、動画像符号化装置1の対応する構成要素と同一の構成及び機能を有する。そのため、イントラ予測部12、動き補償部13、セレクタ14、予測画像直交変換部17、符号判定部18、逆変換部20、加算器21及び画像メモリ22の詳細については、動画像符号化装置1の関連する部分の説明を参照されたい。
動画像復号装置2は、符号化された動画像データを含むデータストリームを、例えば、通信ネットワーク及び動画像復号装置2を通信ネットワークに接続するためのインターフェース回路(図示せず)を介して取得する。そして動画像復号装置2は、そのデータストリームから取り出した符号化された動画像データを、図示しないバッファメモリに記憶させる。動画像復号装置2は、符号化された動画像データを、所定の単位、例えば、マクロブロックごと、あるいはピクチャごとにバッファメモリから読み出し、その読み出したデータを周波数係数適応復号部24へ入力する。
周波数係数適応復号部24は、エントロピー符号化された動きベクトルなどのサイド情報を復号する。そして周波数係数適応復号部24は、各マクロブロックのうち、インター予測符号化されたマクロブロックの動きパラメータを動き補償部13へ出力する。また周波数係数適応復号部24は、各マクロブロックのうち、イントラ予測符号化されたマクロブロックのイントラ予測符号化モードを示す情報をイントラ予測部12へ出力する。さらに周波数係数適応復号部24は、復号対象マクロブロックの予測符号化モードをセレクタ14へ出力する。そして復号対象マクロブロックがイントラ予測符号化されている場合、イントラ予測部12が既に復号されている参照ブロックから予測画像を作成する。一方、復号対象マクロブロックがインター予測符号化されている場合、動き補償部13が、既に復号されている参照ピクチャに基づいて予測画像を作成する。イントラ予測部12または動き補償部13で作成された予測画像は、セレクタ14に入力され、セレクタ14は、その予測画像を予測画像直交変換部17及び加算器21へ出力する。
また周波数係数適応復号部24は、適応復号部の一例であり、符号化された動画像データから、復号対象マクロブロックに含まれる各ブロックの予測誤差画像の複数の周波数係数を再生する。
図14は、予測誤差画像の複数の周波数係数の再生に関する、周波数係数適応復号部24の概略構成図である。
周波数係数適応復号部24は、適応量子化係数復号部241と、適応逆量子化部242とを有する。
適応量子化係数復号部241は、エントロピー符号化されている有効係数位置情報、有効係数絶対値情報及び符号一致予測情報を復号することにより、量子化係数を再生する。そのために、適応量子化係数復号部241は、有効係数位置情報復号部2411と、有効係数絶対値情報復号部2412と、有効係数符号情報予測復号部2413と、排他的論理和部2414と、有効係数情報再生部2415とを有する。
有効係数位置情報復号部2411は、動画像符号化装置1の有効係数位置情報符号化部1922により用いられたエントロピー符号化方式に従って、エントロピー符号化されている有効係数位置情報を復号する。そして有効係数位置情報復号部2411は、復号した有効係数位置情報を有効係数情報再生部2415へ出力する。
また有効係数絶対値情報復号部2412は、動画像符号化装置1の有効係数絶対値情報符号化部1923により用いられたエントロピー符号化方式に従って、エントロピー符号化されている有効係数絶対値情報を復号する。そして有効係数絶対値情報復号部2412は、復号した有効係数絶対値情報を有効係数情報再生部2415へ出力する。
有効係数符号情報予測復号部2413は、動画像符号化装置1の有効係数符号情報予測符号化部1925により用いられたエントロピー符号化方式に従って、エントロピー符号化されている符号一致予測情報を復号する。そして有効係数符号情報予測復号部2413は、復号した符号一致予測情報を排他的論理和部2414へ出力する。
排他的論理和部2414は、符号判定部18から、各有効係数が表す周波数成分と同じ周波数成分を表す予測画像の周波数係数のサインを表す値を受け取る。なお、このサインを表す値は、例えば、第1の実施形態による動画像符号化装置1の排他的論理和部1924が受け取る値と同じ値である。
排他的論理和部2414は、有効係数符号情報予測復号部2413から受け取った符号一致予測情報に含まれる、各有効係数の符号一致予測値と、その有効係数に対応する予測画像の周波数係数のサインを表す値との排他的論理和演算を行う。なお、符号一致予測値は、有効係数の符号情報が表す値と予測画像の対応する周波数係数との排他的論理和である。そのため、符号一致予測値と予測画像の対応する周波数係数との排他的論理和を求めることにより、各有効係数の符号情報が復号される。
排他的論理和部2414は、各有効係数の符号情報を有効係数情報再生部2415へ出力する。
有効係数情報再生部2415は、各有効係数の絶対値情報及び符号情報を組み合わせることにより、各有効係数を再生する。そして有効係数情報再生部2415は、有効係数を、有効係数の位置情報に従って配列し、有効係数以外のところに、'0'の値を挿入することにより、予測誤差画像の複数の量子化係数を再生する。
有効係数情報再生部2415は、再生した予測誤差画像の複数の量子化係数を適応逆量子化部242へ出力する。
また、量子化代表値の出現確率に応じたエントロピー符号が各量子化係数に割り当てられるよう、各量子化係数がエントロピー符号化されている場合、周波数係数適応復号部24は、適用されたエントロピー符号化方式に従って各量子化係数を復号する。
そして周波数係数適応複合部24は、再生した各量子化係数を適応逆量子化部242へ出力する。
適応逆量子化部242は、予測誤差画像の複数の量子化係数に基づいて、予測誤差画像の複数の周波数係数を再生する。そのために、適応逆量子化部242は、乗算器2421、2422と、非線形逆量子化部2423とを有する。
乗算器2421は、予測誤差画像の各量子化係数に、その量子化係数が表す周波数成分と同じ周波数成分を表す予測画像の対応する周波数係数のサインを乗じることで、補正量子化係数を再生する。そして乗算器2421は、補正量子化係数を非線形逆量子化部2423へ出力する。
非線形逆量子化部2423は、動画像符号化装置1の非線形逆量子化部1915と同様に、各補正量子化係数を逆量子化することにより、補正周波数係数を再生する。本実施形態では、非線形逆量子化部2423は、動画像符号化装置1の非線形量子化部1914にて用いられた、補正量子化係数のサインに応じて異なる量子化スケールを用いて逆量子化する。例えば、非線形逆量子化部2423は、(8)式に従って各補正量子化係数を逆量子化する。
あるいは、量子化代表値間の間隔が、補正周波数係数の絶対値に応じて変化するように設定されている場合、非線形逆量子化部2423は、例えば、補正量子化係数と量子化代表値との対応関係を表す参照テーブルを内蔵するメモリに予め記憶しておく。そして非線形逆量子化部2423は、その参照テーブルを参照して、補正量子化係数に対応する量子化代表値を、再生される補正周波数係数として求める。
非線形逆量子化部2423は、再生した各補正周波数係数を乗算器2422へ出力する。
乗算器2422は、再生された各補正周波数係数に、予測画像の対応する周波数係数のサインを乗じることにより、予測誤差画像の複数の周波数係数を再生する。これにより、再生された各量子化係数に対して、予測画像の対応する周波数係数のサインが2回乗じられたことになる。したがって、乗算器2422から出力される再生された各周波数係数のサインは、予測誤差画像の対応する周波数係数のサインと一致する。
乗算器2422から出力された、再生された各周波数係数は、逆変換部20へ入力される。
なお、動画像符号化装置1と同様に、再生された各周波数係数が逆変換部20にて逆直交変換されることにより、予測誤差画像が再生される。そして加算器21が、その予測誤差画像の各画素の値に、対応する予測画像の画素の値を加算することで、復号対象ブロックが再生される。
動画像復号装置2は、ピクチャごとに、再生されたマクロブロックをその符号化順序に従って結合することにより、ピクチャを再生する。そして動画像復号装置2は、ピクチャを時間順に配置して、動画像データを再生する。動画像復号装置2は、再生した動画像データを出力する。出力された動画像データは、例えば、図示しない記憶装置に記憶される。また出力された動画像データは、動画像復号装置2と接続された、図示しない表示装置に表示される。
図15及び図16は、第2の実施形態による動画像復号処理の動作フローチャートである。動画像復号装置2は、この動画像復号処理を復号対象マクロブロックごとに実行する。
周波数係数適応復号部24は、エントロピー符号化された動きベクトルなどのサイド情報を復号する(ステップS201)。そして周波数係数適応復号部24は、イントラ予測部12、動き補償部13及びセレクタ14に対して、サイド情報に含まれる情報のうち、それらの各部で使用される予測符号化モード、動きベクトルなどの情報を出力する。そして動画像復号装置2は、予測符号化モードに応じて、復号対象マクロブロック内の各ブロックについての予測画像を生成する(ステップS202)。具体的には、予測符号化モードがイントラ予測符号化モードである場合、イントラ予測部12が予測画像を生成する。一方、予測符号化モードがインター予測符号化モードである場合、動き補償部13が予測画像を生成する。そしてイントラ予測部12または動き補償部13は予測画像をセレクタ14へ出力する。セレクタ14は、受け取った予測画像を、予測画像直交変換部17及び加算器21へ出力する。
予測画像直交変換部17は、予測画像を直交変換することにより予測画像の複数の周波数係数を算出する(ステップS203)。そして予測画像直交変換部17は、予測画像の複数の周波数係数を符号判定部18へ出力する。
符号判定部18は、予測画像の各周波数係数のサインを判定する(ステップS204)。そして符号判定部18は、予測画像の各周波数係数のサインを表す値を、周波数係数適応復号部24の適応量子化係数復号部241及び適応逆量子化部242へそれぞれ出力する。
適応量子化係数復号部241の有効係数位置情報復号部2411は、有効係数の位置情報をエントロピー復号する。また適応量子化係数復号部241の有効係数絶対値情報復号部2412は、有効係数の絶対値をエントロピー復号する(ステップS205)。有効係数位置情報復号部2411及び有効係数絶対値情報復号部2412は、それぞれ、復号された有効係数の位置情報及び有効係数の絶対値情報を適応量子化係数復号部241の有効係数情報再生部2415へ出力する。
また、適応量子化係数復号部241の有効係数符号情報予測復号部2413は、符号一致予測情報をエントロピー復号する(ステップS206)。そして有効係数符号情報予測復号部2413は、復号された符号一致予測情報を適応量子化係数復号部241の排他的論理和部2414へ出力する。そして排他的論理和部2414は、符号一致予測情報に含まれる各符号一致予測値と予測画像の対応する周波数のサインを表す値との排他的論理和を求めることにより、有効係数の符号情報を再生する(ステップS207)。排他的論理和部2414は、有効係数の符号情報を有効係数情報再生部2415へ出力する。
有効係数情報再生部2415は、有効係数の位置情報、絶対値情報及び符号情報に基づいて予測誤差画像の複数の量子化係数を再生する(ステップS208)。そして有効係数情報再生部2415は、再生した予測誤差画像の複数の量子化係数を適応逆量子化部242へ出力する。
図16に示されるように、適応逆量子化部242の乗算器2421は、予測誤差画像の各量子化係数に、予測画像の対応する周波数係数のサインを乗じることで、補正量子化係数を再生する(ステップS209)。そして乗算器2421は、補正量子化係数を適応逆量子化部242の非線形逆量子化部2423へ出力する。
非線形逆量子化部2423は、正の値と負の値とで隣接する量子化代表値間の間隔が異なるように定められた量子化代表値のうち、補正量子化係数に対応する量子化代表値を求めることで各補正量子化係数を逆量子化する。これにより、非線形逆量子化部2423は各補正周波数係数を再生する(ステップS210)。そして非線形逆量子化部2423は、再生した各補正周波数係数を適応逆量子化部242の乗算器2422へ出力する。
乗算器2422は、再生された各補正周波数係数に、予測画像の対応する周波数係数のサインを乗じることにより、予測誤差画像の複数の周波数係数を再生する(ステップS211)。乗算器2422から出力された、再生された各周波数係数は、逆変換部20へ入力される。
逆変換部20は、再生された予測誤差画像の複数の周波数係数を逆直交変換することにより予測誤差画像を再生する(ステップS212)。そして逆変換部20は、再生した予測誤差画像を加算器21へ出力する。加算器21は、再生された予測誤差画像の各画素の値に予測画像の対応する画素の値を加算して復号対象ブロックを再生する(ステップS213)。そして加算器21は、再生された復号対象ブロックを所定の順序に従って結合することにより、復号対象マクロブロックを再生する。さらに加算器21は、再生された復号対象マクロブロックを所定の符号化順序に従って順次結合することにより、ピクチャを再生する。そして加算器21は、再生されたピクチャを出力するとともに、その再生されたピクチャを参照ピクチャとして画像メモリ22に記憶させる。
なお、ステップS202〜S213の処理は、復号対象マクロブロック内の各ブロックについて実行される。
その後、動画像復号装置2は、動画像復号処理を終了する。なお、動画像復号装置2は、ステップS205の処理とステップS206及びS207の処理の順序を入れ換えてもよい。
また、動画像符号化装置1について説明したように、補正量子化係数の量子化代表値の出現確率に応じたエントロピー符号が各量子化係数に割り当てられるよう、各量子化係数がエントロピー符号化されていてもよい。この場合、動画像復号装置2は、ステップS204〜S208の処理の代わりに、適用されたエントロピー符号化方式に従って各量子化係数を復号してもよい。
以上に説明してきたように、第2の実施形態による動画像復号装置は、第1の実施形態による動画像符号化装置により符号化された動画像データを復号できる。
次に、第3の実施形態による動画像符号化装置について説明する。第3の実施形態による動画像符号化装置は、有効係数の符号情報に関して、第1の実施形態と同様に、有効係数のサインと予測画像の対応する周波数のサインが一致するか否かを表す符号一致予測情報をエントロピー符号化する。ただし、この動画像符号化装置は、予測誤差画像の各周波数係数を従来技術と同様に量子化する。
図17は、第3の実施形態による動画像符号化装置の概略構成図である。動画像符号化装置3は、予測モード判定部11と、イントラ予測部12と、動き補償部13と、セレクタ14と、予測誤差画像生成部15と、予測誤差直交変換部16と、予測画像直交変換部17と、符号判定部18と、周波数係数適応符号化部31と、逆変換部20と、加算器21と、画像メモリ22と、サイド情報符号化部23とを有する。
動画像符号化装置3が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像符号化装置3が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像符号化装置3に実装されてもよい。さらに、動画像符号化装置3が有するこれらの各部は、動画像符号化装置3が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
また図17において、動画像符号化装置3の各部には、図1に示された動画像符号化装置1の対応する各部の参照番号と同一の参照番号を付した。
第3の実施形態による動画像符号化装置3は、第1の実施形態による動画像符号化装置1と比較して、周波数係数適応符号化部31のみが異なる。そのため、以下では、周波数係数適応符号化部31について説明する。動画像符号化装置3のその他の各部の詳細については、動画像符号化装置1の関連する部分の説明を参照されたい。
図18は、第3の実施形態による周波数係数適応符号化部31の概略構成図である。周波数係数適応符号化部31は、適応符号化部の一例であり、量子化部311と、逆量子化部312と、適応量子化係数符号化部192とを有する。
量子化部311は、符号化対象マクロブロック内の各ブロックについての予測誤差画像の複数の周波数係数をそれぞれ量子化する。この場合、上記のように、周波数係数の正の値の出現確率と、周波数係数の負の値の出現確率は略等しい。そこで量子化部311は、周波数係数の符号によらずに決定された量子化代表値を用いて、各周波数係数を量子化する。量子化代表値は、例えば、M. D .Paez, T. H. Glisson, “Minimum Mean-Squared-Error Quantization in Speech PCM and DPCM Systems”, IEEE TRANSACTIONS ON COMMUNICATIONS, 1972年4月, pp.225-230に開示された方法に従って決定される。そして量子化部311は、周波数係数に最も近い量子化代表値を求め、その量子化代表値に対応する量子化係数を、その周波数係数に対する量子化係数として求める。
あるいは、量子化部311は、所定の量子化パラメータの値に対する量子化スケールを表す関数にしたがって、使用される量子化スケールを決定する。またその関数は、量子化パラメータの値に対する単調増加関数とすることができ、予め設定される。
あるいは、水平方向及び垂直方向の周波数成分のそれぞれに対応する量子化スケールを規定する量子化マトリクスが、予め複数準備され、量子化部311が有するメモリに記憶される。そして量子化部311は、量子化パラメータにしたがって、それら量子化マトリクスのうちの特定の量子化マトリクスを選択する。そして量子化部311は、選択された量子化マトリクスを参照して、周波数信号の各周波数成分に対する量子化スケールを決定してもよい。
また量子化部311は、MPEG-2、MPEG-4、MPEG-4 AVC/H.264などの動画像符号化標準に対応した様々な量子化パラメータ決定方法の何れかに従って量子化パラメータを決定すればよい。量子化部311は、例えば、MPEG-2の標準テストモデル5に関する量子化パラメータの算出方法を用いることができる。なお、MPEG-2の標準テストモデル5に関する量子化パラメータの算出方法に関しては、例えば、http://www.mpeg.org/MPEG/MSSG/tm5/Ch10/Ch10.htmlで特定されるURLを参照されたい。
量子化部311は、各量子化係数を逆量子化部312及び適応量子化係数符号化部192へ出力する。
逆量子化部312は、各量子化係数に、量子化部311により決定された、その量子化係数に対応する量子化スケールを乗じることにより逆量子化する。この逆量子化により、予測誤差画像の複数の周波数係数が再生される。この実施形態では、量子化スケールは、'正'の値を持つ量子化係数及び'負'の値を持つ量子化係数の何れについても同一の値が使用される。あるいは、逆量子化部312は、量子化代表値と量子化係数との関係を表す参照テーブルを参照して、量子化係数に対応する量子化代表値を再生される周波数係数として求めてもよい。
逆量子化部312は、再生された予測誤差画像の複数の周波数係数を逆変換部20へ出力する。そして再生された予測誤差画像の各周波数係数は、第1の実施形態による動画像符号化装置1と同様に、参照ピクチャまたは参照ブロックを作成するために利用される。
適応量子化係数符号化部192は、第1の実施形態による動画像符号化装置1が有する適応量子化係数符号化部192と同様の構成及び機能を有する。すなわち、適応量子化係数符号化部192は、有効係数情報生成部1921と、有効係数位置情報符号化部1922と、有効係数絶対値情報符号化部1923と、排他的論理和部1924と、有効係数符号情報予測符号化部1925とを有する。
適応量子化係数符号化部192は、符号化対象マクロブロック内の各予測誤差画像の量子化係数のうちの有効係数を検出し、有効係数の位置情報及び絶対値情報をそれぞれエントロピー符号化する。さらに、適応量子化係数符号化部192は、有効係数に対応する予測画像の周波数係数のサインを表す値を符号判定部18から受け取る。適応量子化係数符号化部192は、有効係数のサインを表す値とその有効係数に対応する予測画像の周波数係数のサインを表す値との排他的論理和演算により、有効係数のサインと予測画像の対応する周波数係数のサインとが一致するか否かを表す符号一致予測情報を求める。この符号一致予測情報は、符号一致情報の一例である。そして適応量子化係数符号化部192は、符号一致予測情報をエントロピー符号化する。
適応量子化係数符号化部192は、エントロピー符号化された有効係数の位置情報及び絶対値情報とエントロピー符号化された符号一致予測情報とを図示しない統合部へ出力する。そして統合部により、これらのエントロピー符号化された情報とエントロピー符号化されたサイド情報とが所定のフォーマットに従ってデータストリームに格納される。
図19及び図20は、第3の実施形態による動画像符号化処理の動作フローチャートである。なお、動画像符号化装置3は、この動画像符号化処理を予測符号化される符号化対象マクロブロックごとに実行する。なお、動画像符号化装置3は、符号化対象マクロブロックが予測符号化されない場合、その符号化対象マクロブロックを、例えば、MPEG-4 AVC/H.264に規定されたイントラ予測符号化方式に従って符号化する。
予測モード判定部11は、符号化対象マクロブロック及び画像メモリ22に記憶されている参照ピクチャに基づいて予測符号化モードを決定する(ステップS301)。動画像符号化装置1は、予測符号化モードに応じて、符号化対象マクロブロック内の各ブロックについての予測画像を生成する(ステップS302)。具体的には、予測符号化モードがイントラ予測符号化モードである場合、イントラ予測部12が予測画像を生成する。一方、予測符号化モードがインター予測符号化モードである場合、動き補償部13が予測画像を生成する。そしてイントラ予測部12または動き補償部13は予測画像をセレクタ14へ出力する。セレクタ14は、受け取った予測画像を、予測誤差画像生成部15、予測画像直交変換部17及び加算器21へ出力する。
また、予測誤差画像生成部15は、符号化対象マクロブロック内のブロックと予測画像間の差分により予測誤差画像を生成する(ステップS303)。そして予測誤差画像生成部15は、予測誤差画像を予測誤差直交変換部16へ出力する。そして予測誤差直交変換部16は、予測誤差画像を直交変換することにより予測誤差画像の複数の周波数係数を算出する(ステップS304)。そして予測誤差直交変換部16は、予測誤差画像の複数の周波数係数を周波数係数適応符号化部31へ出力する。
一方、予測画像直交変換部17は、予測画像を直交変換することにより予測画像の周波数係数の組を算出する(ステップS305)。そして予測画像直交変換部17は、予測画像の複数の周波数係数を符号判定部18へ出力する。
符号判定部18は、予測画像の各周波数係数のサインを判定する(ステップS306)。そして符号判定部18は、予測画像の各周波数係数のサインを表す値を、周波数係数適応符号化部31へ出力する。
量子化部3111は、予測誤差画像の複数の周波数係数のそれぞれを所定の量子化スケールを用いて量子化することにより、複数の量子化係数を求める(ステップS307)。そして量子化部3111は、各量子化係数を逆量子化部312及び適応量子化係数符号化部192へ出力する。
図20に示されるように、適応量子化係数符号化部192の有効係数情報生成部1921は、各量子化係数のうち、0でない絶対値を持つ有効係数の位置、絶対値及びサインに関する情報を抽出する(ステップS308)。そして有効係数情報生成部1921は、有効係数の位置情報を適応量子化係数符号化部192の有効係数位置情報符号化部1922へ出力する。また有効係数情報生成部1921は、有効係数の絶対値情報を適応量子化係数符号化部192の有効係数絶対値情報符号化部1923へ出力する。そして有効係数情報生成部1921は、有効係数の符号情報を適応量子化係数符号化部192の排他的論理和部1924へ出力する。
有効係数位置情報符号化部1922は、有効係数の位置情報をエントロピー符号化する。また有効係数絶対値情報符号化部1923は、有効係数の絶対値をエントロピー符号化する(ステップS309)。有効係数位置情報符号化部1922及び有効係数絶対値情報符号化部1923は、それぞれ、エントロピー符号化された有効係数の位置情報及び有効係数の絶対値情報を図示しない統合部へ出力する。
一方、排他的論理和部1924は、各有効係数のサインを表す値と予測画像の対応する周波数のサインを表す値との間で排他的論理和演算を実行する。そして排他的論理和部1924は、符号一致予測情報を算出する(ステップS310)。排他的論理和部1924は、符号一致予測情報を有効係数符号情報予測符号化部1925へ出力する。
有効係数符号情報予測符号化部1925は、符号一致予測情報をエントロピー符号化する(ステップS311)。そして有効係数符号情報予測符号化部1925は、エントロピー符号化された符号一致予測情報を統合部へ出力する。
また、サイド情報符号化部23は、動きベクトルなどのサイド情報を符号化する(ステップS312)。そしてサイド情報符号化部23は、符号化されたサイド情報を統合部へ出力する。
また、動画像符号化装置3は、以降のマクロブロックまたはピクチャを符号化するために利用される参照ピクチャを生成する。そのために、周波数係数適応符号化部19の逆量子化部312は、各量子化係数を逆量子化して予測誤差画像の複数の周波数係数を再生する(ステップS313)。そして再生された複数の周波数係数は、逆変換部20に入力される。
逆変換部20は、再生された予測誤差画像の複数の周波数係数を逆直交変換することにより予測誤差画像を再生する(ステップS314)。そして逆変換部20は、再生した予測誤差画像を加算器21へ出力する。加算器21は、再生された予測誤差画像の各画素の値に予測画像の対応する画素の値を加算して符号化対象マクロブロック内の、その予測画像及び予測誤差画像に対応するブロックを再生する(ステップS315)。そして加算器21は、再生されたブロックを所定の順序に従って結合することにより、符号化対象マクロブロックを再生する。さらに加算器21は、再生された符号化対象マクロブロックを所定の符号化順序に従って順次結合することにより、参照ピクチャを作成する。そして加算器21は、参照ピクチャを画像メモリ22に記憶させる。
なお、ステップS302〜S315の処理は、符号化対象マクロブロック内の各ブロックについて実行される。
その後、動画像符号化装置3は、動画像符号化処理を終了する。なお、動画像符号化装置3は、ステップS304の処理とS305の処理の順序を入れ換えてもよい。また動画像符号化装置3は、ステップS309の処理とS310及びS311の処理の順序を入れ換えてもよい。さらに、動画像符号化装置3は、ステップS313〜S315の処理と、ステップS308〜S312の処理の順序を入れ換えてもよい。
以上に説明してきたように、第3の実施形態による動画像符号化装置は、符号化対象マクロブロック内の各予測誤差画像の有効係数のサインと予測画像の対応する周波数係数のサインが一致するか否かを表す符号一致予測情報をエントロピー符号化する。両者のサインが一致することを表す値の出現確率の方が両者のサインが一致しないことを表す値の出現確率よりも高いので、符号一致予測情報の情報量は、有効係数のサインそのものの情報量よりも少ない。そのため、この動画像符号化装置は、有効係数のサインそのものを符号化した場合よりも符号化効率を向上できる。
次に第4の実施形態による動画像復号装置について説明する。この第4の実施形態による動画像復号装置は、第3の実施形態による動画像符号化装置によって符号化された動画像データを再生する。
図21は、第4の実施形態による動画像復号装置の概略構成図である。図21に示されるように、動画像復号装置4は、周波数係数適応復号部41と、イントラ予測部12と、動き補償部13と、セレクタ14と、予測画像直交変換部17と、符号判定部18と、逆変換部20と、加算器21と、画像メモリ22とを有する。
動画像復号装置4が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像復号装置4が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像復号装置4に実装されてもよい。さらに、動画像復号装置4が有するこれらの各部は、動画像復号装置4が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
また図21において、動画像復号装置4の各部には、図13に示された動画像復号装置2の対応する各部の参照番号と同一の参照番号を付した。
第4の実施形態による動画像復号装置4は、第2の実施形態による動画像復号装置2と比較して、周波数係数適応復号部41のみが異なる。そのため、以下では、周波数係数適応符号化部41について説明する。
周波数係数適応復号部41は、エントロピー符号化された動きベクトルなどのサイド情報を復号する。そして周波数係数適応復号部41は、各マクロブロックのうち、インター予測符号化されたマクロブロックの動きパラメータを動き補償部13へ出力する。また周波数係数適応復号部41は、各マクロブロックのうち、イントラ予測符号化されたマクロブロックのイントラ予測符号化モードを示す情報をイントラ予測部12へ出力する。さらに周波数係数適応復号部41は、復号対象マクロブロックの予測符号化モードをセレクタ14へ出力する。そして復号対象マクロブロックがイントラ予測符号化されている場合、イントラ予測部12が既に復号されている参照ブロックから予測画像を作成する。一方、復号対象マクロブロックがインター予測符号化されている場合、動き補償部13が、既に復号されている参照ピクチャに基づいて予測画像を作成する。イントラ予測部12または動き補償部13で作成された予測画像は、セレクタ14に入力され、セレクタ14は、その予測画像を予測画像直交変換部17及び加算器21へ出力する。
また周波数係数適応復号部41は、適応復号部の一例であり、符号化された動画像データから、復号対象マクロブロックに含まれる各ブロックの予測誤差画像の複数の周波数係数を再生する。
図22は、予測誤差画像の複数の周波数係数の再生に関する、第4の実施形態による周波数係数適応復号部41の概略構成図である。周波数係数適応復号部41は、適応量子化係数復号部241と、逆量子化部411とを有する。
適応量子化係数復号部241は、第2の実施形態による動画像復号装置2が有する適応量子化係数復号部241と同様の構成及び機能を有する。すなわち、適応量子化係数復号部241は、有効係数位置情報復号部2411と、有効係数絶対値情報復号部2412と、有効係数符号情報予測復号部2413と、排他的論理和部2414と、有効係数情報再生部2415とを有する。
適応量子化係数復号部241の有効係数位置情報復号部2411と、有効係数絶対値情報復号部2412は、それぞれ、エントロピー符号化されている有効係数位置情報、有効係数絶対値情報を復号する。また適応量子化係数復号部241の有効係数符号情報予測復号部2413は、エントロピー符号化されている符号一致予測情報を復号する。そして適応量子化係数復号部241の排他的論理和部2414は符号一致予測情報に含まれる有効係数の符号一致予測値と、判定部18から受け取った予測画像の対応する周波数のサインを表す値との排他的論理和演算を行って、有効係数の符号情報を再生する。
そして適応量子化係数復号部241の有効係数情報再生部2415は、有効係数位置情報、有効係数絶対値情報及び有効係数符号情報に基づいて、複数の量子化係数を再生する。適応量子化係数復号部241は、再生した量子化係数を逆量子化部411へ出力する。
逆量子化部411は、各量子化係数に、その量子化係数に対応する量子化スケールを乗じることにより逆量子化する。この逆量子化により、予測誤差画像の複数の周波数係数が再生される。この実施形態では、量子化スケールは、'正'の値を持つ量子化係数及び'負'の値を持つ量子化係数の何れについても同一の値が使用される。
あるいは、逆量子化部411は、量子化代表値と量子化係数との関係を表す参照テーブルを参照して、量子化係数に対応する量子化代表値を、再生される周波数係数として求めてもよい。
逆量子化部411は、再生された予測誤差画像の複数の周波数係数を逆変換部20へ出力する。
そして動画像復号装置2と同様に、再生された各周波数係数が逆変換部20にて逆直交変換されることにより、予測誤差画像が再生される。そして加算器21が、その予測誤差画像の各画素の値に、対応する予測画像の画素の値を加算することで、復号対象ブロックが再生される。
動画像復号装置4は、ピクチャごとに、再生されたマクロブロックをその符号化順序に従って結合することにより、ピクチャを再生する。
図23及び図24は、第4の実施形態による動画像復号処理の動作フローチャートである。なお、動画像復号装置4は、この動画像復号処理を復号対象マクロブロックごとに実行する。
周波数係数適応復号部41は、エントロピー符号化された動きベクトルなどのサイド情報を復号する(ステップS401)。そして周波数係数適応復号部41は、イントラ予測部12、動き補償部13及びセレクタ14に対して、サイド情報に含まれる情報のうち、それらの各部で使用される予測符号化モード、動きベクトルなどの情報を出力する。そして動画像復号装置2は、予測符号化モードに応じて、復号対象マクロブロック内の各ブロックについての予測画像を生成する(ステップS402)。具体的には、予測符号化モードがイントラ予測符号化モードである場合、イントラ予測部12が予測画像を生成する。一方、予測符号化モードがインター予測符号化モードである場合、動き補償部13が予測画像を生成する。そしてイントラ予測部12または動き補償部13は予測画像をセレクタ14へ出力する。セレクタ14は、受け取った予測画像を、予測画像直交変換部17及び加算器21へ出力する。
予測画像直交変換部17は、予測画像を直交変換することにより予測画像の複数の周波数係数を算出する(ステップS403)。そして予測画像直交変換部17は、予測画像の複数の周波数係数を符号判定部18へ出力する。
符号判定部18は、予測画像の各周波数係数のサインを判定する(ステップS404)。そして符号判定部18は、予測画像の各周波数係数のサインを表す値を、周波数係数適応復号部41の適応量子化係数復号部241へ出力する。
適応量子化係数復号部241の有効係数位置情報復号部2411は、有効係数の位置情報をエントロピー復号する。また適応量子化係数復号部241の有効係数絶対値情報復号部2412は、有効係数の絶対値をエントロピー復号する(ステップS405)。有効係数位置情報復号部2411及び有効係数絶対値情報復号部2412は、それぞれ、復号された有効係数の位置情報及び有効係数の絶対値情報を適応量子化係数復号部241の有効係数情報再生部2415へ出力する。
また、適応量子化係数復号部241の有効係数符号情報予測復号部2413は、符号一致予測情報をエントロピー復号する(ステップS406)。そして有効係数符号情報予測復号部2413は、復号された符号一致予測情報を適応量子化係数復号部241の排他的論理和部2414へ出力する。そして排他的論理和部2414は、符号一致予測情報に含まれる各符号一致予測値と予測画像の対応する周波数のサインとの排他的論理和を求めることにより、有効係数の符号情報を再生する(ステップS407)。排他的論理和部2414は、有効係数の符号情報を有効係数情報再生部2415へ出力する。
有効係数情報再生部2415は、有効係数の位置情報、絶対値情報及び符号情報に基づいて予測誤差画像の複数の量子化係数を再生する(ステップS408)。そして有効係数情報再生部2415は、再生した予測誤差画像の複数の量子化係数を周波数係数適応復号部41の逆量子化部413へ出力する。
図24に示されるように、逆量子化部411は、各量子化係数を、正の値と負の値とで同一の量子化スケールを用いて逆量子化することにより、予測誤差画像の複数の周波数係数を復元する(ステップS409)。そして逆量子化部411は、再生した各周波数係数を逆変換部20へ出力する。
逆変換部20は、再生された予測誤差画像の複数の周波数係数を逆直交変換することにより予測誤差画像を再生する(ステップS410)。そして逆変換部20は、再生した予測誤差画像を加算器21へ出力する。加算器21は、再生された予測誤差画像の各画素の値に予測画像の対応する画素の値を加算して復号対象ブロックを再生する(ステップS411)。そして加算器21は、再生された復号対象ブロックを所定の順序に従って結合することにより、復号対象マクロブロックを再生する。さらに加算器21は、再生された復号対象マクロブロックを所定の符号化順序に従って順次結合することにより、ピクチャを再生する。そして加算器21は、再生されたピクチャを出力するとともに、その再生されたピクチャを参照ピクチャとして画像メモリ22に記憶させる。
なお、ステップS402〜S411の処理は、復号対象マクロブロック内の各ブロックについて実行される。
その後、動画像復号装置4は、動画像復号処理を終了する。なお、動画像復号装置2は、ステップS405の処理とステップS406及びS407の処理の順序を入れ換えてもよい。
以上に説明してきたように、第4の実施形態による動画像復号装置は、第3の実施形態による動画像符号化装置により符号化された動画像データを復号できる。
次に、第5の実施形態による動画像符号化装置について説明する。第5の実施形態による動画像符号化装置は、予測誤差画像の各周波数係数に、予測画像の対応する周波数係数のサインを乗じることで、正の値の出現確率と負の値の出現確率が異なる補正周波数係数を算出する。そしてこの動画像符号化装置は、出現確率の低い負の値を持つ補正周波数係数に対する隣接量子化代表値間の間隔を、出現確率の高い正の値を持つ補正周波数係数に対する隣接量子化代表値間の間隔よりも大きくする。
図25は、第5の実施形態による動画像符号化装置の概略構成図である。動画像符号化装置5は、予測モード判定部11と、イントラ予測部12と、動き補償部13と、セレクタ14と、予測誤差画像生成部15と、予測誤差直交変換部16と、予測画像直交変換部17と、符号判定部18と、周波数係数適応符号化部51と、逆変換部20と、加算器21と、画像メモリ22と、サイド情報符号化部23とを有する。
動画像符号化装置5が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像符号化装置5が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像符号化装置5に実装されてもよい。さらに、動画像符号化装置5が有するこれらの各部は、動画像符号化装置5が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
また図25において、動画像符号化装置5の各部には、図1に示された動画像符号化装置1の対応する各部の参照番号と同一の参照番号を付した。
第5の実施形態による動画像符号化装置5は、第1の実施形態による動画像符号化装置1と比較して、周波数係数適応符号化部51のみが異なる。そのため、以下では、周波数係数適応符号化部51について説明する。動画像符号化装置5のその他の各部の詳細については、動画像符号化装置1の関連する部分の説明を参照されたい。
図26は、第5の実施形態による周波数係数適応符号化部の概略構成図である。周波数係数適応符号化部51は、適応符号化部の一例であり、適応量子化/逆量子化部191と、量子化係数符号化部511とを有する。
適応量子化/逆量子化部191は、第1の実施形態による動画像符号化装置1が有する適応量子化/逆量子化部191と同様の構成及び機能を有する。すなわち、適応量子化/逆量子化部191は、3個の乗算器1911〜1913と、非線形量子化部1914と、非線形逆量子化部1915とを有する。
適応量子化/逆量子化部191は、符号化対象マクロブロック内の各予測誤差画像の各周波数係数に、予測画像の対応する周波数のサインを乗じて得られる各補正周波数係数を量子化する。上述したように、正の値を持つ補正周波数係数の出現確率は、負の値を持つ補正周波数係数の出現確率よりも高い。そこで適応量子化/逆量子化部191は、負の値を持つ補正周波数係数に対する量子化代表値間の間隔を正の値を持つ補正周波数係数に対する量子化代表値管の間隔よりも広くすることで、補正周波数係数を効率良く符号化できる。
適応量子化/逆量子化部191は、さらに、補正量子化係数に、予測画像の対応する周波数係数のサインを乗じて、補正量子化係数のサインを予測誤差画像の対応する周波数係数のサインと一致させることで、予測誤差画像の周波数係数に対する量子化係数とする。そして適応量子化/逆量子化部191は、各量子化係数を量子化係数符号化部511へ出力する。
また適応量子化/逆量子化部191は、補正量子化係数を逆量子化して補正周波数係数を再生し、その再生された補正周波数係数に予測画像の対応する周波数係数のサインを乗じることで、予測誤差画像の複数の周波数係数を再生する。そして適応量子化/逆量子化部191は、再生した予測誤差画像の複数の周波数係数を逆変換部20へ出力する。
量子化係数符号化部511は、符号化対象マクロブロック内に含まれる各ブロックについての各量子化係数をエントロピー符号化する。そのために、量子化係数符号化部511は、有効係数情報生成部5111と、有効係数位置情報符号化部5112と、有効係数絶対値情報符号化部5113と、有効係数符号情報符号化部5114とを有する。
有効係数情報生成部5111は、第1の実施形態による動画像符号化装置1の有効係数情報生成部1921と同様に、符号化対象マクロブロック内の各予測誤差画像の量子化係数のうち、'0'以外の値を持つ量子化係数である有効係数を抽出する。そして有効係数情報生成部5111は、有効係数の位置を表す有効係数位置情報を有効係数位置情報符号化部5112へ出力する。また有効係数情報生成部5111は、有効係数の絶対値を表す有効係数絶対値情報を有効係数絶対値情報符号化部5113へ出力する。そして有効係数情報生成部5111は、有効係数のサインを表す有効係数符号情報を有効係数符号情報符号化部5114へ出力する。
有効係数位置情報符号化部5112は、第1の実施形態による動画像符号化装置1の有効係数情報生成部1921と同様に、有効係数位置情報をエントロピー符号化する。例えば、有効係数位置情報符号化部5112は、ハフマン符号化方式、またはCABACといった算術符号化方式といったエントロピー符号化方式を用いて有効係数位置情報をエントロピー符号化する。
有効係数位置情報符号化部5112は、エントロピー符号化された有効係数位置情報を図示しない統合部へ出力する。
有効係数絶対値情報符号化部5113は、第1の実施形態による動画像符号化装置1の有効係数絶対値情報符号化部1923と同様に、有効係数絶対値情報をエントロピー符号化する。例えば、有効係数絶対値情報符号化部5113は、ハフマン符号化方式、またはCABACなどの算術符号化方式といったエントロピー符号化方式を用いて有効係数絶対値情報をエントロピー符号化する。
有効係数絶対値情報符号化部5113は、エントロピー符号化された有効係数絶対値情報を図示しない統合部へ出力する。
有効係数符号情報符号化部5114は、有効係数符号情報を符号化する。ここで、有効係数のサインが正となる確率は、有効係数のサインが負となる確率と略等しい。そのため、有効係数符号情報に対してエントロピー符号を用いても、符号化効率は殆ど向上しない。そこで有効係数符号情報符号化部5114は、各有効係数のサインに対して、そのサインが正か負かを表す1ビットの符号を割り当てる。
有効係数符号情報符号化部5114は、符号化された有効係数符号情報を図示しない統合部へ出力する。
図27及び図28は、第5の実施形態による動画像符号化処理の動作フローチャートである。動画像符号化装置5は、この動画像符号化処理を予測符号化される符号化対象マクロブロックごとに実行する。なお、動画像符号化装置5は、符号化対象マクロブロックが予測符号化されない場合、その符号化対象マクロブロックを、例えば、MPEG-4 AVC/H.264に規定されたイントラ予測符号化方式に従って符号化する。
予測モード判定部11は、符号化対象マクロブロック及び画像メモリ22に記憶されている参照ピクチャに基づいて予測符号化モードを決定する(ステップS501)。
動画像符号化装置5は、予測符号化モードに応じて、符号化対象マクロブロック内の各ブロックについての予測画像を生成する(ステップS502)。具体的には、予測符号化モードがイントラ予測符号化モードである場合、イントラ予測部12が予測画像を生成する。一方、予測符号化モードがインター予測符号化モードである場合、動き補償部13が予測画像を生成する。そしてイントラ予測部12または動き補償部13は予測画像をセレクタ14へ出力する。セレクタ14は、受け取った予測画像を、予測誤差画像生成部15、予測画像直交変換部17及び加算器21へ出力する。
また、予測誤差画像生成部15は、符号化対象マクロブロック内のブロックと予測画像間の差分により予測誤差画像を生成する(ステップS503)。そして予測誤差画像生成部15は、予測誤差画像を予測誤差直交変換部16へ出力する。そして予測誤差直交変換部16は、予測誤差画像を直交変換することにより予測誤差画像の複数の周波数係数を算出する(ステップS504)。そして予測誤差直交変換部16は、予測誤差画像の複数の周波数係数を周波数係数適応符号化部51へ出力する。
一方、予測画像直交変換部17は、予測画像を直交変換することにより予測画像の複数の周波数係数を算出する(ステップS505)。そして予測画像直交変換部17は、予測画像の複数の周波数係数を符号判定部18へ出力する。
符号判定部18は、予測画像の各周波数係数のサインを判定する(ステップS506)。そして符号判定部18は、予測画像の各周波数係数のサインを表す値を、周波数係数適応符号化部51の適応量子化/逆量子化部191へ出力する。
適応量子化/逆量子化部191の乗算器1911は、予測誤差画像の各周波数係数に予測画像の対応する周波数のサインを乗じて補正周波数係数を算出する(ステップS507)。そして乗算器1911は、各補正周波数係数を適応量子化/逆量子化部の非線形量子化部1914へ出力する。
非線形量子化部1914は、各補正周波数係数に対して、正の補正周波数係数に対する隣接量子化代表値間の間隔よりも負の補正周波数係数に対する隣接量子化代表値間の間隔が広くなるように定められた量子化代表値のうちの最も近い量子化代表値を求める。そして非線形量子化部1914は、量子化代表値に対応する補正量子化係数を求める(ステップS508)。そして非線形量子化部1914から出力された補正量子化係数は、適応量子化/逆量子化部191の非線形逆量子化部1915へ入力される。また非線形量子化部1914から出力された補正量子化係数は、乗算器1912により予測誤差画像の対応する周波数のサインと一致するよう、予測画像の対応する周波数のサインが乗じられて各量子化係数が算出される。その後、各量子化係数は、量子化係数符号化部511に入力される。
図28に示されるように、量子化係数符号化部511の有効係数情報生成部5111は、各量子化係数のうち、0でない絶対値を持つ有効係数の位置、絶対値及びサインに関する情報を抽出する(ステップS509)。そして有効係数情報生成部5111は、有効係数の位置情報を量子化係数符号化部511の有効係数位置情報符号化部5112へ出力する。また有効係数情報生成部5111は、有効係数の絶対値情報を量子化係数符号化部511の有効係数絶対値情報符号化部5113へ出力する。そして有効係数情報生成部5111は、有効係数の符号情報を量子化係数符号化部511の有効係数符号情報符号化部5114へ出力する。
有効係数位置情報符号化部5112は、有効係数の位置情報をエントロピー符号化する。また有効係数絶対値情報符号化部5113は、有効係数の絶対値をエントロピー符号化する(ステップS510)。有効係数位置情報符号化部5112及び有効係数絶対値情報符号化部5113は、それぞれ、エントロピー符号化された有効係数の位置情報及び有効係数の絶対値情報を図示しない統合部へ出力する。
一方、有効係数符号情報符号化部5114は、各有効係数のサインに対して、1ビットの符号を割り当てる(ステップS511)。有効係数符号情報符号化部5114は、各有効係数のサインを表すビットを統合部へ出力する。
また、サイド情報符号化部23は、動きベクトルなどのサイド情報を符号化する(ステップS512)。そしてサイド情報符号化部23は、符号化されたサイド情報を統合部へ出力する。
また、動画像符号化装置5は、以降のマクロブロックまたはピクチャを符号化するために利用される参照ピクチャを生成する。そのために、周波数係数適応符号化部19の非線形逆量子化部1915は、各補正量子化係数を逆量子化して各補正周波数係数を再生する(ステップS513)。そして再生された各補正周波数係数には、予測誤差画像の対応する周波数のサインと一致するよう、乗算器1913により、予測画像の対応する周波数のサインが乗じられ、その後、逆変換部20に入力される。
逆変換部20は、再生された予測誤差画像の複数の周波数係数を逆直交変換することにより予測誤差画像を再生する(ステップS514)。そして逆変換部20は、再生した予測誤差画像を加算器21へ出力する。加算器21は、再生された予測誤差画像の各画素の値に予測画像の対応する画素の値を加算して、符号化対象マクロブロック内のその予測画像及び予測誤差画像に対応するブロックを再生する(ステップS515)。そして加算器21は、再生されたブロックを所定の順序に従って結合することにより、符号化対象マクロブロックを再生する。さらに加算器21は、再生された符号化対象マクロブロックを所定の符号化順序に従って順次結合することにより、参照ピクチャを作成する。そして加算器21は、参照ピクチャを画像メモリ22に記憶させる。
なお、ステップS502〜S515の処理は、符号化対象マクロブロック内の各ブロックについて実行される。
その後、動画像符号化装置5は、動画像符号化処理を終了する。なお、動画像符号化装置5は、ステップS504の処理とS505の処理の順序を入れ換えてもよい。また動画像符号化装置5は、ステップS510の処理とS511の処理の順序を入れ換えてもよい。さらに、動画像符号化装置5は、ステップS513〜S515の処理と、ステップS509〜S512の処理の順序を入れ換えてもよい。
以上に説明してきたように、第5の実施形態による動画像符号化装置は、符号化対象マクロブロック内の各予測誤差画像について、正の値と負の値との間で出現確率に偏りがある補正周波数係数を求める。そしてこの動画像符号化装置は、正の値を持つ補正周波数係数に対する隣接量子化代表値間の間隔と負の値を持つ補正周波数係数に対する隣接量子化代表値間の間隔を異ならせることで、出現頻度が低い負の値を持つ補正周波数係数の情報量を減らすことができる。このように、この動画像符号化装置は、各予測誤差画像の周波数係数を符号化するために要する情報量を削減できるので、各予測誤差画像の周波数係数の符号化効率を向上できる。
次に第6の実施形態による動画像復号装置について説明する。この第6の実施形態による動画像復号装置は、第5の実施形態による動画像符号化装置によって符号化された動画像データを再生する。
図29は、第6の実施形態による動画像復号装置の概略構成図である。図29に示されるように、動画像復号装置6は、周波数係数適応復号部61と、イントラ予測部12と、動き補償部13と、セレクタ14と、予測画像直交変換部17と、判定部18と、逆変換部20と、加算器21と、画像メモリ22とを有する。
動画像復号装置6が有するこれらの各部は、それぞれ別個の回路として形成される。あるいは動画像復号装置6が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路として動画像復号装置6に実装されてもよい。さらに、動画像復号装置6が有するこれらの各部は、動画像復号装置6が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。
また図29において、動画像復号装置6の各部には、図13に示された動画像復号装置2の対応する各部の参照番号と同一の参照番号を付した。
第6の実施形態による動画像復号装置6は、第2の実施形態による動画像復号装置2と比較して、周波数係数適応復号部61のみが異なる。そのため、以下では、周波数係数適応符号化部61について説明する。
周波数係数適応復号部61は、エントロピー符号化された動きベクトルなどのサイド情報を復号する。そして周波数係数適応復号部61は、各マクロブロックのうち、インター予測符号化されたマクロブロックの動きパラメータを動き補償部13へ出力する。また周波数係数適応復号部61は、各マクロブロックのうち、イントラ予測符号化されたマクロブロックのイントラ予測符号化モードを示す情報をイントラ予測部12へ出力する。さらに周波数係数適応復号部41は、復号対象マクロブロックの予測符号化モードをセレクタ14へ出力する。そして復号対象マクロブロックがイントラ予測符号化されている場合、イントラ予測部12が既に復号されている参照ブロックから予測画像を作成する。一方、復号対象マクロブロックがインター予測符号化されている場合、動き補償部13が、既に復号されている参照ピクチャに基づいて予測画像を作成する。イントラ予測部12または動き補償部13で作成された予測画像は、セレクタ14に入力され、セレクタ14は、その予測画像を予測画像直交変換部17及び加算器21へ出力する。
また周波数係数適応復号部61は、適応復号部の一例であり、符号化された動画像データから、復号対象マクロブロックに含まれる各ブロックの予測誤差画像の複数の周波数係数を再生する。
図30は、予測誤差画像の複数の周波数係数の再生に関する、第6の実施形態による周波数係数適応復号部61の概略構成図である。周波数係数適応復号部61は、量子化係数復号部611と、適応逆量子化部242とを有する。
量子化係数復号部611は、予測誤差画像の各量子化係数を再生する。そのために、量子化係数復号部611は、有効係数位置情報復号部6111と、有効係数絶対値情報復号部6112と、有効係数符号情報復号部6113と、有効係数情報再生部6114とを有する。
有効係数位置情報復号部6111は、動画像符号化装置5の有効係数位置情報符号化部5112により用いられたエントロピー符号化方式に従って、エントロピー符号化されている有効係数位置情報を復号する。そして有効係数位置情報復号部6111は、復号した有効係数位置情報を有効係数情報再生部6114へ出力する。
また有効係数絶対値情報復号部6112は、動画像符号化装置5の有効係数絶対値情報符号化部5113により用いられたエントロピー符号化方式に従って、エントロピー符号化されている有効係数絶対値情報を復号する。そして有効係数絶対値情報復号部6112は、復号した有効係数絶対値情報を有効係数情報再生部6114へ出力する。
有効係数符号情報復号部6113は、有効係数のサインを表すビット値を参照することにより、有効係数のサインを表す符号情報を再生する。そして有効係数符号情報復号部6113は、符号情報を有効係数情報再生部6114へ出力する。
有効係数情報再生部6114は、各有効係数の絶対値情報及び符号情報を組み合わせることにより、各有効係数を再生する。そして有効係数情報再生部6114は、有効係数を、有効係数の位置情報に従って配列し、有効係数以外のところに、'0'の値を挿入することにより、予測誤差画像の複数の量子化係数を再生する。
有効係数情報再生部6114は、再生した予測誤差画像の複数の量子化係数を適応逆量子化部242へ出力する。
適応逆量子化部242は、第2の実施形態による動画像復号装置2が有する適応逆量子化部242と同様の構成及び機能を有する。すなわち、適応逆量子化部242は、乗算器2421、2422と、非線形逆量子化部2423とを有する。
適応逆量子化部242は、予測誤差画像の量子化係数の組に基づいて、予測誤差画像の複数の周波数係数を再生する。適応逆量子化部242は、予測誤差画像の各量子化係数に、予測画像の対応する周波数係数のサインを乗じることで、補正量子化係数を再生する。そして適応逆量子化部242は、補正量子化係数に対して、正の値と負の値とで異なる量子化スケールの値を用い、(8)式に従って逆量子化することにより各補正周波数係数を再生する。
あるいは、量子化代表値間の間隔が、補正周波数係数の絶対値に応じて変化するように設定されている場合、適応逆量子化部242は、例えば、補正量子化係数と量子化代表値との対応関係を表す参照テーブルを参照する。そして適応逆量子化部242は、補正量子化係数に対応する量子化代表値を、再生される補正周波数係数として求めてもよい。
さらに適応逆量子化部242は、再生された各補正周波数係数に、予測画像の対応する周波数係数のサインを乗じることにより、予測誤差画像の各周波数係数を再生する。
再生された各周波数係数は、逆変換部20へ入力される。
なお、動画像符号化装置1と同様に、再生された各周波数係数が逆変換部20にて逆直交変換されることにより、予測誤差画像が再生される。そして加算器21が、その予測誤差画像の各画素の値に、対応する予測画像の画素の値を加算することで、復号対象ブロックが再生される。
動画像復号装置6は、ピクチャごとに、再生されたマクロブロックをその符号化順序に従って結合することにより、ピクチャを再生する。そして動画像復号装置6は、ピクチャを時間順に配置して、動画像データを再生する。動画像復号装置6は、再生した動画像データを出力する。出力された動画像データは、例えば、図示しない記憶装置に記憶される。また出力された動画像データは、動画像復号装置6と接続された、図示しない表示装置に表示される。
図31及び図32は、第6の実施形態による動画像復号処理の動作フローチャートである。動画像復号装置2は、この動画像復号処理を復号対象マクロブロックごとに実行する。
周波数係数適応復号部61は、エントロピー符号化された動きベクトルなどのサイド情報を復号する(ステップS601)。そして周波数係数適応復号部61は、イントラ予測部12、動き補償部13及びセレクタ14に対して、サイド情報に含まれる情報のうち、それらの各部で使用される予測符号化モード、動きベクトルなどの情報を出力する。そして動画像復号装置6は、予測符号化モードに応じて、復号対象マクロブロック内の各ブロックについての予測画像を生成する(ステップS602)。具体的には、予測符号化モードがイントラ予測符号化モードである場合、イントラ予測部12が予測画像を生成する。一方、予測符号化モードがインター予測符号化モードである場合、動き補償部13が予測画像を生成する。そしてイントラ予測部12または動き補償部13は予測画像をセレクタ14へ出力する。セレクタ14は、受け取った予測画像を、予測画像直交変換部17及び加算器21へ出力する。
予測画像直交変換部17は、予測画像を直交変換することにより予測画像の周波数係数の組を算出する(ステップS603)。そして予測画像直交変換部17は、予測画像の複数の周波数係数を符号判定部18へ出力する。
符号判定部18は、予測画像の各周波数係数のサインを判定する(ステップS604)。そして符号判定部18は、予測画像の各周波数係数のサインを表す値を、周波数係数適応復号部61の適応逆量子化部242へ出力する。
周波数係数適応復号部61の量子化係数復号部611の有効係数位置情報復号部6111は、有効係数の位置情報をエントロピー復号する。また量子化係数復号部611の有効係数絶対値情報復号部6112は、有効係数の絶対値をエントロピー復号する(ステップS605)。有効係数位置情報復号部6111及び有効係数絶対値情報復号部6112は、それぞれ、復号された有効係数の位置情報及び有効係数の絶対値情報を量子化係数復号部611の有効係数情報再生部6114へ出力する。
また、量子化係数復号部611の有効係数符号情報復号部6113は、有効係数のサインを表すビットを参照して有効係数のサインを求める(ステップS606)。そして有効係数符号情報復号部6113は、有効係数のサインを有効係数情報再生部6114へ出力する。
有効係数情報再生部6114は、有効係数の位置情報、絶対値情報及び符号情報に基づいて予測誤差画像の複数の量子化係数を再生する(ステップS607)。そして有効係数情報再生部6114は、再生した予測誤差画像の複数の量子化係数を適応逆量子化部242へ出力する。
図32に示されるように、適応逆量子化部242の乗算器2421は、予測誤差画像の各量子化係数に、予測画像の対応する周波数係数のサインを乗じることで、補正量子化係数を再生する(ステップS608)。そして乗算器2421は、補正量子化係数を適応逆量子化部242の非線形逆量子化部2423へ出力する。
非線形逆量子化部2423は、正の値と負の値とで隣接する量子化代表値間の間隔が異なるように定められた量子化代表値のうち、補正量子化係数に対応する量子化代表値を求めることで各補正量子化係数を逆量子化する。これにより、非線形逆量子化部2423は各補正周波数係数を再生する(ステップS609)。そして非線形逆量子化部2423は、再生した各補正周波数係数を適応逆量子化部242の乗算器2422へ出力する。
乗算器2422は、再生された各補正周波数係数に、予測画像の対応する周波数係数のサインを乗じることにより、予測誤差画像の複数の周波数係数を再生する(ステップS610)。乗算器2422から出力された、再生された各周波数係数は、逆変換部20へ入力される。
逆変換部20は、再生された予測誤差画像の複数の周波数係数を逆直交変換することにより予測誤差画像を再生する(ステップS611)。そして逆変換部20は、再生した予測誤差画像を加算器21へ出力する。加算器21は、再生された予測誤差画像の各画素の値に予測画像の対応する画素の値を加算して復号対象ブロックを再生する(ステップS612)。そして加算器21は、再生された復号対象ブロックを所定の順序に従って結合することにより、復号対象マクロブロックを再生する。さらに加算器21は、再生された復号対象マクロブロックを所定の符号化順序に従って順次結合することにより、ピクチャを再生する。そして加算器21は、再生されたピクチャを出力するとともに、その再生されたピクチャを参照ピクチャとして画像メモリ22に記憶させる。
なお、ステップS602〜S612の処理は、復号対象マクロブロック内の各ブロックについて実行される。
その後、動画像復号装置6は、動画像復号処理を終了する。なお、動画像復号装置6は、ステップS605の処理とステップS606の処理の順序を入れ換えてもよい。
以上に説明してきたように、第6の実施形態による動画像復号装置は、第5の実施形態による動画像符号化装置により符号化された動画像データを復号できる。
なお、本発明は上記の実施形態に限定されるものではない。例えば、第1及び第5の実施形態による動画像符号化装置が有する適応量子化/逆量子化部は、乗算器の代わりに、符号一致判定部を有してもよい。その符号一致判定部は、周波数係数、補正周波数係数または量子化係数のサインと、予測画像の対応する周波数係数のサインが一致する場合、周波数係数、補正周波数係数または量子化係数のサインを正とする。逆に、周波数係数、補正周波数係数または量子化係数のサインと、予測画像の対応する周波数係数のサインが一致しない場合、符号一致判定部は、周波数係数、補正周波数係数または量子化係数のサインを負とする。同様に、第2及び第6の実施形態による動画像復号装置が有する適応逆量子化部は、乗算器の代わりに、上記のような符号一致判定部を有してもよい。
図33は、各実施形態またはその変形例による動画像符号化方法または動画像復号方法を実行するコンピュータの概略構成図である。コンピュータ100は、入力装置101と、通信インターフェース102と、メモリ103と、可搬記録媒体駆動装置104と、外部記憶装置105と、プロセッサ106と、出力装置107とを有する。
コンピュータ100が有するこれらの各部は、データ及び制御信号を伝送するためのバス108を介して相互に接続されている。
入力装置101は、例えば、キーボードまたはマウスなどのポインティングデバイスを有する。そして入力装置101は、ユーザの操作に応じて、動画像符号化処理または動画像復号処理を開始させる操作信号または動画像符号化処理の対象となる動画像データを選択する操作信号などを生成し、その操作信号をプロセッサ106へ出力する。
通信インターフェース102は、例えば、コンピュータ100を通信ネットワークへ接続するためのインターフェース回路を有する。そして通信インターフェース102は、通信ネットワーク(図示せず)を介して他の機器から符号化対象の動画像データまたは復号対象の符号化された動画像データを取得し、それらのデータをプロセッサ106へ渡す。あるいは、通信インターフェース102は、符号化された動画像データまたは復号された動画像データをプロセッサ106から受け取り、それらのデータを通信ネットワークを介して他の機器へ出力する。
メモリ103は、例えば、揮発性または不揮発性の半導体メモリ回路を有する。そしてメモリ103は、プロセッサ106により実行される動画像符号化処理または動画像復号処理で必要とされるメモリ領域を提供する。例えば、メモリ103は、上記の各実施形態における画像メモリとして機能する。
可搬記録媒体駆動装置104は、光記録媒体またはメモリカードといった持ち運び可能な可搬記録媒体109を駆動するための駆動装置である。そして可搬記録媒体駆動装置104は、例えば、可搬記録媒体109に記録された、上記の実施形態の何れかによる動画像符号化方法または動画像復号方法をコンピュータに実行させるためのコンピュータプログラムを読み込む。そして可搬記録媒体駆動装置104は、そのコンピュータプログラムをプロセッサ106に渡す。あるいは可搬記録媒体駆動装置104は、可搬記録媒体109に記録された符号化対象の動画像データまたは復号対象の符号化された動画像データを読み込み、それらのデータをプロセッサ106へ渡してもよい。さらに、可搬記録媒体駆動装置104は、符号化された動画像データまたは復号された動画像データをプロセッサ106から受け取り、それらのデータを可搬記録媒体109に書き込んでもよい。
外部記憶装置105は、例えば、ハードディスク装置といった磁気記憶装置である。そして外部記憶装置105は、例えば、上記の実施形態の何れかによる動画像符号化方法または動画像復号方法をコンピュータに実行させるためのコンピュータプログラムを記憶する。あるいは、外部記憶装置105は、符号化対象の動画像データまたは復号対象の符号化された動画像データを記憶する。
プロセッサ106は、コンピュータ100全体を制御する。またプロセッサ106は、可搬記録媒体駆動装置104または外部記憶装置105から受け取った、上記の実施形態の何れかによる動画像符号化方法または動画像復号方法をコンピュータに実行させるためのコンピュータプログラムをメモリ103にマップする。そしてプロセッサ106は、そのコンピュータプログラムに従って、動画像符号化方法または動画像復号方法を実行する。
またプロセッサ106は、動画像データまたは符号化された動画像データを、通信インターフェース102または可搬記録媒体駆動装置104から受け取り、そのデータをメモリ103に一時的に記憶させたり、あるいは、外部記憶装置105に記憶させる。
さらにプロセッサ106は、符号化した動画像データまたは復号した動画像データを通信インターフェース102、可搬記録媒体駆動装置104、外部記憶装置105または出力装置107へ出力する。
出力装置107は、例えば、液晶ディスプレイを有する。そして出力装置107は、復号された動画像データをプロセッサ106から受け取って、その動画像データに含まれる各ピクチャを表示する。
コンピュータ上で実行されることにより、上述した実施形態またはその変形例による動画像復号装置及び動画像符号化装置の各部の機能を実現するコンピュータプログラムは、半導体メモリまたは光記録媒体などの記録媒体に記録されて配布されてもよい。
上述した実施形態またはその変形例による動画像符号化装置及び動画像復号装置は、様々な用途に利用される。例えば、この動画像符号化装置及び動画像復号装置は、ビデオカメラ、映像送信装置、映像受信装置、テレビ電話システム、コンピュータあるいは携帯電話機に組み込まれる。例えば、この動画像復号装置が映像受信装置に組み込まれる場合、符号化動画像データは、まず映像送信装置にて生成される。そしてその符号化動画像データは、音声信号等、動画像データと同時に取得される他の信号とともに、所定の通信規格に従ったデータストリームに変換される。そのデータストリームは、映像送信装置の出力部に接続されたアンテナを介して、あるいは通信回線を介して、遠隔地に設置された映像受信装置に伝送される。そして動画像復号装置を組み込んだ映像受信装置は、そのデータストリームから符号化動画像データを取り出し、動画像復号装置に出力する。動画像復号装置は動画像を復号し、出力する。
ここに挙げられた全ての例及び特定の用語は、読者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の精神及び範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。
1、3、5 動画像復号装置
2、4、6 動画像復号装置
11 予測モード判定部
12 イントラ予測部
13 動き補償部
14 セレクタ
15 予測誤差画像生成部
16 予測誤差直交変換部
17 予測画像直交変換部
18 符号判定部
19、31、51 周波数係数適応符号化部
20 逆変換部
21 加算器
22 画像メモリ
23 サイド情報符号化部
191 適応量子化/逆量子化部
1911〜1913 乗算器
1914 非線形量子化部
1915 非線形逆量子化部
192 適応量子化係数符号化部
1921 有効係数情報生成部
1922 有効係数位置情報符号化部
1923 有効係数絶対値情報符号化部
1924 排他的論理和部
1925 有効係数符号情報予測符号化部
24、41、61 周波数係数適応復号部
241 適応量子化係数復号部
2411 有効係数位置情報復号部
2412 有効係数絶対値情報復号部
2413 有効係数符号情報予測復号部
2414 排他的論理和部
2415 有効係数情報再生部
242 適応逆量子化部
2421、2422 乗算器
2423 非線形逆量子化部
311 量子化部
312 逆量子化部
411 逆量子化部
511 量子化係数符号化部
5111 有効係数情報生成部
5112 有効係数位置情報符号化部
5113 有効係数絶対値情報符号化部
5114 有効係数符号情報符号化部
611 量子化係数復号部
6111 有効係数位置情報復号部
6112 有効係数絶対値情報復号部
6113 有効係数符号情報復号部
6114 有効係数情報再生部
100 コンピュータ
101 入力装置
102 通信インターフェース
103 メモリ
104 可搬記録媒体駆動装置
105 外部記憶装置
106 プロセッサ
107 出力装置
108 バス
109 可搬記録媒体

Claims (15)

  1. 動画像データに含まれる、既に符号化されたピクチャまたは符号化対象ピクチャの既に符号化された領域から、該符号化対象ピクチャの符号化対象ブロックに対する予測画像を生成する予測画像生成部と、
    前記符号化対象ブロックと前記予測画像間で差分演算することにより前記符号化対象ブロックの予測誤差画像を生成する予測誤差画像生成部と、
    前記予測誤差画像を直交変換することにより、複数の第1の周波数係数を算出する予測誤差直交変換部と、
    前記予測画像を直交変換することにより、複数の第2の周波数係数を算出する予測画像直交変換部と、
    前記複数の第2の周波数係数のそれぞれの正負の符号を判定する符号判定部と、
    前記複数の第1の周波数係数のそれぞれの正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて前記複数の第1の周波数係数を符号化する適応符号化部と、
    を有する動画像符号化装置。
  2. 前記適応符号化部は、前記複数の第1の周波数係数のそれぞれについて、当該第1の周波数係数の正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かに応じて異なる正負の符号を持ち、かつ当該第1の周波数係数の絶対値と同一の絶対値を持つ補正周波数係数を前記符号一致情報として算出し、前記補正周波数係数を、複数の量子化代表値のうちの当該補正周波数係数に最も近い量子化代表値に対応する量子化係数を求めることで量子化し、かつ、前記複数の量子化代表値は、出現確率の低い前記補正周波数係数の値に対応する量子化代表値ほど、隣接する量子化代表値間の間隔が広くなるように設定される適応量子化部を有する請求項1に記載の動画像符号化装置。
  3. 前記適応符号化部は、前記量子化係数に対して、当該量子化係数に対応する前記量子化代表値の出現確率に応じたエントロピー符号を割り当てることで前記量子化係数をエントロピー符号化する適応量子化係数符号化部をさらに有する、請求項2に記載の動画像符号化装置。
  4. 前記適応符号化部は、前記複数の第1の周波数係数のそれぞれについて、当該第1の周波数係数の正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かに応じて異なる正負の符号を持ち、かつ当該第1の周波数係数の絶対値と同一の絶対値を持つ補正周波数係数を前記符号一致情報として算出し、前記第1の周波数係数の正負の符号が前記第2の周波数係数の正負の符号と一致する場合、前記補正周波数係数を第1の量子化スケールを用いて量子化し、一方、前記第1の周波数係数の正負の符号が前記第2の周波数係数の正負の符号と一致しない場合、前記補正周波数係数を前記第1の量子化スケールよりも大きい第2の量子化スケールを用いて量子化する適応量子化部を有する請求項1に記載の動画像符号化装置。
  5. 前記適応符号化部は、
    前記複数の第1の周波数係数のそれぞれを所定の量子化スケールを用いて量子化することにより複数の量子化係数を算出する量子化部と、
    前記複数の量子化係数のうち、0でない値を持つ量子化係数である有効係数の正負の符号と、前記複数の第2の周波数係数のうち、当該有効係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致予測情報を前記符号一致情報として算出し、前記符号一致予測情報をエントロピー符号化する適応量子化係数符号化部と、
    を有する請求項1または2に記載の動画像符号化装置。
  6. 符号化された動画像データに含まれる、既に復号されたピクチャまたは復号対象ピクチャの既に復号された領域から、該復号対象ピクチャの復号対象ブロックに対する予測画像を生成する予測画像生成部と、
    前記予測画像を直交変換することにより、複数の第2の周波数係数を算出する予測画像直交変換部と、
    前記複数の第2の周波数係数のそれぞれの正負の符号を判定する符号判定部と、
    前記復号対象ブロックと前記予測画像間の予測誤差画像を直交変換することにより算出される複数の第1の周波数係数のそれぞれについての正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて前記複数の第1の周波数係数を復号する適応復号部と、
    前記複数の第1の周波数係数を逆直交変換することにより前記予測誤差画像を再生する逆変換部と、
    前記予測誤差画像の各画素の値に前記予測画像の対応する画素の値を加算することにより、前記復号対象ブロックを再生する加算器と、
    を有する動画像復号装置。
  7. 前記適応復号部は、
    前記複数の第1の周波数係数のそれぞれに対応する複数の量子化係数について、当該量子化係数の正負の符号と、前記複数の第2の周波数係数のうちの当該量子化係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かに応じて異なる正負の符号を持ち、かつ当該量子化係数の絶対値と同一の絶対値を持つ補正量子化係数を前記符号一致情報として算出し、
    前記補正量子化係数を、複数の量子化代表値のうちの当該補正量子化係数に対応する量子化代表値を求めることで逆量子化し、かつ、前記複数の量子化代表値は、出現確率の低い前記補正量子化係数の値に対応する量子化代表値ほど、隣接する量子化代表値間の間隔が広くなるように設定される適応量子化部を有する請求項6に記載の動画像復号装置。
  8. 前記複数の量子化係数のそれぞれは、当該量子化係数に対応する前記量子化代表値の出現確率に応じたエントロピー符号に符号化されており、
    前記適応復号部は、前記エントロピー符号に対応する量子化係数を求めることにより、前記量子化係数をエントロピー復号する適応量子化係数復号部をさらに有する、請求項7に記載の動画像復号装置。
  9. 前記適応復号部は、
    前記複数の第1の周波数係数のそれぞれに対応する複数の量子化係数について、当該量子化係数の正負の符号と、前記複数の第2の周波数係数のうちの当該量子化係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かに応じて異なる正負の符号を持ち、かつ当該量子化係数の絶対値と同一の絶対値を持つ補正量子化係数を前記符号一致情報として算出し、前記量子化係数の正負の符号が前記第2の周波数係数の正負の符号と一致する場合、前記補正量子化係数を第1の量子化スケールを用いて逆量子化し、一方、前記量子化係数の正負の符号が前記第2の周波数係数の正負の符号と一致しない場合、前記補正量子化係数を前記第1の量子化スケールよりも大きい第2の量子化スケールを用いて逆量子化することにより、前記複数の第1の周波数係数を復号する適応逆量子化部を有する請求項6に記載の動画像復号装置。
  10. 前記適応復号部は、
    前記複数の第1の周波数係数のそれぞれに対応する複数の量子化係数のうち、0でない値を持つ量子化係数である有効係数の正負の符号と、前記複数の第2の周波数係数のうち、当該有効係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す、前記符号一致情報である符号一致予測情報をエントロピー復号し、当該符号一致予測情報に基づいて前記有効係数の正負の符号を求めることで前記複数の量子化係数を再生する適応量子化係数復号部と、
    前記複数の量子化係数のそれぞれを所定の量子化スケールを用いて逆量子化することにより前記複数の第1の周波数係数を復号する逆量子化部と、
    を有する請求項6または7に記載の動画像復号装置。
  11. 前記適応復号部は、
    前記複数の第1の周波数係数のそれぞれに対応する複数の量子化係数のうち、0でない値を持つ量子化係数である有効係数の正負の符号と、前記複数の第2の周波数係数のうち、当該有効係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す、前記符号一致情報である符号一致予測情報をエントロピー復号し、当該符号一致予測情報に基づいて前記有効係数の正負の符号を求めることで前記複数の量子化係数を再生する適応量子化係数復号部と、
    前記複数の量子化係数のそれぞれについて、当該量子化係数の正負の符号と、前記複数の第2の周波数係数のうちの当該量子化係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かに応じて異なる正負の符号を持ち、かつ当該量子化係数の絶対値と同一の絶対値を持つ補正量子化係数を前記符号一致情報として算出し、前記量子化係数の正負の符号が前記第2の周波数係数の正負の符号と一致する場合、前記補正量子化係数を第1の量子化スケールを用いて逆量子化し、一方、前記量子化係数の正負の符号が前記第2の周波数係数の正負の符号と一致しない場合、前記補正量子化係数を前記第1の量子化スケールよりも大きい第2の量子化スケールを用いて逆量子化することにより、前記複数の第1の周波数係数を復号する適応逆量子化部と、
    を有する請求項6に記載の動画像復号装置。
  12. 動画像データに含まれる、既に符号化されたピクチャまたは符号化対象ピクチャの既に符号化された領域から、該符号化対象ピクチャの符号化対象ブロックに対する予測画像を生成し、
    前記符号化対象ブロックと前記予測画像間で差分演算することにより前記符号化対象ブロックの予測誤差画像を生成し、
    前記予測誤差画像を直交変換することにより、複数の第1の周波数係数を算出し、
    前記予測画像を直交変換することにより、複数の第2の周波数係数を算出し、
    前記複数の第2の周波数係数のそれぞれの正負の符号を判定し、
    前記複数の第1の周波数係数のそれぞれの正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて前記複数の第1の周波数係数を符号化する、
    ことを含む動画像符号化方法。
  13. 符号化された動画像データに含まれる、既に復号されたピクチャまたは復号対象ピクチャの既に復号された領域から、該復号対象ピクチャの復号対象ブロックに対する予測画像を生成し、
    前記予測画像を直交変換することにより、複数の第2の周波数係数を算出し、
    前記複数の第2の周波数係数のそれぞれの正負の符号を判定し、
    前記復号対象ブロックと前記予測画像間の予測誤差画像を直交変換することにより算出される複数の第1の周波数係数のそれぞれについての正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて前記複数の第1の周波数係数を復号し、
    前記複数の第1の周波数係数を逆直交変換することにより前記予測誤差画像を再生し、
    前記予測誤差画像の各画素の値に前記予測画像の対応する画素の値を加算することにより、前記復号対象ブロックを再生する、
    ことを含む動画像復号方法。
  14. 動画像データに含まれる、既に符号化されたピクチャまたは符号化対象ピクチャの既に符号化された領域から、該符号化対象ピクチャの符号化対象ブロックに対する予測画像を生成し、
    前記符号化対象ブロックと前記予測画像間で差分演算することにより前記符号化対象ブロックの予測誤差画像を生成し、
    前記予測誤差画像を直交変換することにより、複数の第1の周波数係数を算出し、
    前記予測画像を直交変換することにより、複数の第2の周波数係数を算出し、
    前記複数の第2の周波数係数のそれぞれの正負の符号を判定し、
    前記複数の第1の周波数係数のそれぞれの正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて前記複数の第1の周波数係数を符号化する、
    ことをコンピュータに実行させる動画像符号化用コンピュータプログラム。
  15. 符号化された動画像データに含まれる、既に復号されたピクチャまたは復号対象ピクチャの既に復号された領域から、該復号対象ピクチャの復号対象ブロックに対する予測画像を生成し、
    前記予測画像を直交変換することにより、複数の第2の周波数係数を算出し、
    前記複数の第2の周波数係数のそれぞれの正負の符号を判定し、
    前記復号対象ブロックと前記予測画像間の予測誤差画像を直交変換することにより算出される複数の第1の周波数係数のそれぞれについての正負の符号と、前記複数の第2の周波数係数のうちの当該第1の周波数係数と同一の周波数の成分を表す周波数係数の正負の符号とが一致するか否かを表す符号一致情報を用いて前記複数の第1の周波数係数を復号し、
    前記複数の第1の周波数係数を逆直交変換することにより前記予測誤差画像を再生し、
    前記予測誤差画像の各画素の値に前記予測画像の対応する画素の値を加算することにより、前記復号対象ブロックを再生する、
    ことをコンピュータに実行させる動画像復号用コンピュータプログラム。
JP2012536091A 2010-09-30 2010-09-30 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム Active JP5590133B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2010/067135 WO2012042646A1 (ja) 2010-09-30 2010-09-30 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム

Publications (2)

Publication Number Publication Date
JPWO2012042646A1 true JPWO2012042646A1 (ja) 2014-02-03
JP5590133B2 JP5590133B2 (ja) 2014-09-17

Family

ID=45892150

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012536091A Active JP5590133B2 (ja) 2010-09-30 2010-09-30 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム

Country Status (4)

Country Link
US (1) US9509988B2 (ja)
JP (1) JP5590133B2 (ja)
CN (1) CN103141101B (ja)
WO (1) WO2012042646A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017521980A (ja) * 2014-06-27 2017-08-03 ベー<>コムB Com デジタル画像のコーディング方法、デコーディング方法、関連する装置およびコンピュータプログラム

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8958604B2 (en) * 2013-03-25 2015-02-17 Schlumberger Technology Corporation LWD real-time borehole image transmission
JP5989934B2 (ja) * 2013-03-26 2016-09-07 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチレイヤvdr符号化における知覚量子化ビデオコンテンツのエンコーディング
FR3012714A1 (fr) * 2013-10-25 2015-05-01 Orange Procede de codage et de decodage d'images, dispositif de codage et de decodage d'images et programmes d'ordinateur correspondants
FR3014278A1 (fr) * 2013-11-29 2015-06-05 Orange Procede de codage et de decodage d'images, dispositif de codage et de decodage d'images et programmes d'ordinateur correspondants
DE102014101307A1 (de) * 2014-02-03 2015-08-06 Osram Opto Semiconductors Gmbh Kodierverfahren zur Datenkompression von Leistungsspektren eines optoelektronischen Bauteils und Dekodierverfahren
FR3046321B1 (fr) * 2015-12-29 2018-01-26 B<>Com Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes
EP3472806A4 (en) * 2016-06-17 2020-02-26 Immersive Robotics Pty Ltd IMAGE COMPRESSION METHOD AND DEVICE
CN106231318B (zh) * 2016-09-30 2020-04-28 浙江宇视科技有限公司 一种基于量化变换系数的视频加扰方法及装置
US10609367B2 (en) * 2016-12-21 2020-03-31 Qualcomm Incorporated Low-complexity sign prediction for video coding
EP3579941A4 (en) 2017-02-08 2020-10-28 Immersive Robotics Pty Ltd ANTENNA CONTROL FOR COMMUNICATION BETWEEN MOBILE DEVICES
CN107689950B (zh) 2017-06-23 2019-01-29 平安科技(深圳)有限公司 数据发布方法、装置、服务器和存储介质
US11553187B2 (en) 2017-11-21 2023-01-10 Immersive Robotics Pty Ltd Frequency component selection for image compression
AU2018372561B2 (en) 2017-11-21 2023-01-05 Immersive Robotics Pty Ltd Image compression for digital reality
WO2019150411A1 (ja) * 2018-01-30 2019-08-08 富士通株式会社 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
KR102419112B1 (ko) * 2018-03-07 2022-07-07 후아웨이 테크놀러지 컴퍼니 리미티드 변환 도메인에서 잔차 부호 예측 방법 및 장치
CN108460288B (zh) * 2018-04-02 2022-02-08 惠州学院 大数据安全加密方法、装置、存储介质及移动终端
CN109379508B (zh) * 2018-09-18 2019-09-06 湖北工程学院 一种联合加密与压缩的图像保护方法、存储介质
CN112019701B (zh) * 2020-09-08 2021-09-21 中国人民解放军海军航空大学 一种采用非线性低通滤波实现图像加密的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001016588A (ja) * 1999-06-28 2001-01-19 Toshikazu Akama 信号処理システム
JP2002314428A (ja) * 2001-04-09 2002-10-25 Ntt Docomo Inc 信号符号化方法及び装置並びに復号方法及び装置
JP2007116695A (ja) * 2005-10-19 2007-05-10 Samsung Electronics Co Ltd ある階層のフラグを階層間の連関性を用いて符号化する方法、前記符号化されたフラグを復号化する方法、及び装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4343120B2 (ja) * 2005-01-21 2009-10-14 ソニー株式会社 画像検索装置及び方法、並びにプログラム及びプログラム記録媒体
KR100714706B1 (ko) * 2005-09-26 2007-05-04 삼성전자주식회사 엔트로피 코딩의 성능 향상 방법 및 장치, 상기 방법을이용한 비디오 코딩 방법 및 장치
KR100750138B1 (ko) * 2005-11-16 2007-08-21 삼성전자주식회사 인간의 시각 특성을 이용한 영상의 부호화, 복호화 방법 및장치
BRPI0808774A2 (pt) * 2007-03-14 2014-08-19 Nippon Telegraph & Telephone Método de estimativa de quantidade de código, e aparelho, programa e meio de armazenamento para o mesmo
JP5219089B2 (ja) * 2009-04-30 2013-06-26 株式会社メガチップス 画像データの生成方法
US8675726B2 (en) * 2010-02-18 2014-03-18 Blackberry Limited Method and encoder for constrained soft-decision quantization in data compression

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001016588A (ja) * 1999-06-28 2001-01-19 Toshikazu Akama 信号処理システム
JP2002314428A (ja) * 2001-04-09 2002-10-25 Ntt Docomo Inc 信号符号化方法及び装置並びに復号方法及び装置
JP2007116695A (ja) * 2005-10-19 2007-05-10 Samsung Electronics Co Ltd ある階層のフラグを階層間の連関性を用いて符号化する方法、前記符号化されたフラグを復号化する方法、及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017521980A (ja) * 2014-06-27 2017-08-03 ベー<>コムB Com デジタル画像のコーディング方法、デコーディング方法、関連する装置およびコンピュータプログラム

Also Published As

Publication number Publication date
WO2012042646A1 (ja) 2012-04-05
US20130215961A1 (en) 2013-08-22
CN103141101B (zh) 2016-05-11
JP5590133B2 (ja) 2014-09-17
US9509988B2 (en) 2016-11-29
CN103141101A (zh) 2013-06-05

Similar Documents

Publication Publication Date Title
JP5590133B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
US9392282B2 (en) Moving-picture encoding apparatus and moving-picture decoding apparatus
JP5957561B2 (ja) 大きいサイズの変換単位を用いた映像符号化、復号化方法及び装置
US9282329B2 (en) Methods and devices for data compression using offset-based adaptive reconstruction levels
US20070110153A1 (en) Method, medium, and apparatus encoding and/or decoding an image using the same coding mode across components
KR20130051384A (ko) 스킵모드를 이용한 동영상 부호화 및 복호화 방법 및 장치
CN102077595A (zh) 图像处理装置和方法
WO2008004768A1 (en) Image encoding/decoding method and apparatus
US11812021B2 (en) Coding of quantization matrices using parametric models
JP7283024B2 (ja) 画像の符号化方法、復号化方法、エンコーダ、およびデコーダ
CN105850124B (zh) 使用量化误差的额外的控制编码、解码视频信号的方法和装置
JP2015170994A (ja) 画像処理装置および方法、画像符号化装置および方法、並びに、画像復号装置および方法
KR101596085B1 (ko) 적응적인 인트라 예측을 이용한 영상 부호화/복호화 장치 및 방법
KR20110048004A (ko) 움직임 벡터 해상도 제한을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
KR101911587B1 (ko) 적응적인 인트라 예측을 이용한 영상 부호화/복호화 장치 및 방법
KR102020953B1 (ko) 카메라 영상의 복호화 정보 기반 영상 재 부호화 방법 및 이를 이용한 영상 재부호화 시스템
CN115442608A (zh) 图像编码/解码方法及发送数据的方法
JP6402520B2 (ja) 符号化装置、方法、プログラム及び機器
WO2022195409A1 (en) Method, apparatus and computer program product for end-to-end learned predictive coding of media frames
JP2021520698A (ja) ビデオのコード化および復号。
Shen High efficiency image/video coding techniques
EP3533225A1 (en) Method and apparatus for encoding and decoding a picture

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140701

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140714

R150 Certificate of patent or registration of utility model

Ref document number: 5590133

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150