JPWO2010061607A1 - 動画像復号方法、動画像符号化方法、動画像復号装置、動画像符号化装置、プログラム、及び集積回路 - Google Patents

動画像復号方法、動画像符号化方法、動画像復号装置、動画像符号化装置、プログラム、及び集積回路 Download PDF

Info

Publication number
JPWO2010061607A1
JPWO2010061607A1 JP2010540376A JP2010540376A JPWO2010061607A1 JP WO2010061607 A1 JPWO2010061607 A1 JP WO2010061607A1 JP 2010540376 A JP2010540376 A JP 2010540376A JP 2010540376 A JP2010540376 A JP 2010540376A JP WO2010061607 A1 JPWO2010061607 A1 JP WO2010061607A1
Authority
JP
Japan
Prior art keywords
signal
filter
frequency domain
moving image
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010540376A
Other languages
English (en)
Inventor
ナロスキ マティアス
ナロスキ マティアス
マリー ポーリーヌ
マリー ポーリーヌ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2010061607A1 publication Critical patent/JPWO2010061607A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

動画像復号方法は、符号化信号及びフィルタ情報を取得するステップと、符号化信号を復号して復号信号を生成するステップ(S21)と、動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去するフィルタ処理を、フィルタ情報を用いて周波数領域の復号信号に適用するステップ(S22)とを含む。そして、フィルタ情報は、周波数領域の前記動画像信号と、フィルタ処理が適用された後の周波数領域の復号信号との平均二乗誤差を最小にするための情報を含む。

Description

本発明は、動画像信号をフィルタリングするためのフィルタを用いて動画像を符号化および復号する方法および装置に関する。
現在、標準的な動画像符号化アルゴリズムの大多数はハイブリッド動画像符号化に基づくものである。典型的には、ハイブリッド動画像符号化方法は、所望の圧縮成果を達成するために、それぞれ異なるロスが生じない圧縮方式とロスが生じる圧縮方式とを組み合わせたものである。ハイブリッド動画像符号化は、ISO/IEC標準規格(MPEG‐1、MPEG‐2、MPEG‐4のようなMPEG−X標準規格)と同様に、ITU‐T標準規格(H.261やH.263のようなH.26x標準規格)の基礎でもある。最新の動画像符号化標準規格は、H.264/MPEG‐4 Advanced Video Coding(AVC)と称されるものである。これは、ジョイントビデオチーム(JVT)およびITU‐TとISO/IEC MPEGグループとのジョイントチームによる標準化活動の成果である。
エンコーダへ入力される動画像信号は、フレーム(又はピクチャ)と呼ばれる画像のシーケンスであり、各フレームは2次元マトリクスの画素からなる。ハイブリッド動画像符号化に基づく上述の標準規格の全てにおいて、個々の動画像フレームは複数の画素からなる小ブロックへ細分化される。典型的には、マクロブロック(通常は16×16画素ブロックを意味する)が基本的な画像エレメントであり、これに対して符号化がおこなわれる。しかしながら、より小さい画像エレメントに対してさまざまな特定の符号化ステップがおこなわれる場合がある。例えば、8×8、4×4、16×8などのサイズのサブマクロブロックや単なるブロックが挙げられる。
典型的には、ハイブリッド動画像符号化における符号化ステップには、空間的および/または時間的予測が含まれる。したがって、各符号化対象ブロックは、まず、既に符号化された動画像フレームから空間的に隣接したブロックか時間的に隣接したブロックかを用いて予測される。符号化対象ブロックと予測残差とも呼ばれる予測結果との差分ブロックが、次に求められる。次の符号化ステップでは、残差ブロックが空間(画素)領域から周波数領域へ変換される。変換の目的は、入力ブロックの冗長性を削減することである。次の符号化ステップにおいて、変換係数が量子化される。このステップにおいて、実質的にロスが生じる(不可逆的な)圧縮がおこなわれる。通常、圧縮変換係数値は、エントロピー符号化によって(ロスを生じさせずに)さらに圧縮される。さらに、符号化動画像信号を再構築するために必要な補助情報が符号化され、符号化動画像信号とともに提供される。この情報は、例えば、空間的および/または時間的予測や量子化量に関するものである。
図1は、H.264/MPEG AVC標準規格に準拠した、典型的な動画像符号化装置(「エンコーダ」ともいう。以下同じ。)100の一例を示す。H.264/MPEG AVC標準規格は、上述の符号化ステップの全てを組み合わせたものである。減算器105は、まず、動画像(入力信号)の対象ブロック(符号化対象ブロック)と、対応する予測ブロック(予測信号)との差分を特定する。
時間的予測ブロックは、メモリ140に格納されている符号化画像から得られるブロックである。空間的予測ブロックは、符号化されてメモリ140に格納された隣接ブロック内の境界画素の画素値から補間される。よって、メモリ140は、対象信号値と過去の信号値から生成された予測信号とを比較する遅延手段として動作する。メモリ140は、複数の符号化動画像フレームを格納可能である。
入力信号と予測信号との差分は予測誤差または残差と称され、変換/量子化部110によって変換され量子化される。ロスが生じない方法でデータ量をさらに削減するために、エントロピー符号化部190によって量子化係数がエントロピー符号化(「可変長符号化」ともいう。以下同じ。)される。具体的には、値の発生確率に基づいて長さが決められる複数の符号語を用いる可変長符号化によりデータ量が削減される。
H.264/MPEG AVC標準規格には、動画像符号化層(VCL)とネットワーク抽象レイヤ(NAL)という2つの機能層が備えられている。VCLは、既に簡単に触れた符号化機能を提供する。NALは、チャネル上伝送や格納手段への格納といった、さらなるアプリケーションにしたがって、動画像の復号時に必要な補助情報とともに符号化予測誤差信号を、NALユニットと呼ばれる標準単位にカプセル化する。圧縮動画像データおよびその関連情報を含むVCL NALユニットと呼ばれるものがある。
一方、付加データをカプセル化する非VCLユニットと呼ばれるものもある。付加データは、例えば、動画像シーケンス全体に関するパラメータセットや、ポストフィルタヒントのような復号性能を改善するために用いることができる付加情報を提供する、最近追加された補助的拡張情報(SEI)などである。
動画像符号化装置100内に、復号動画像信号を取得する復号手段が備えられる。符号化ステップに準拠して、復号ステップには逆量子化/逆変換部120での処理が含まれる。復号予測誤差信号は、量子化ノイズとも呼ばれる量子化誤差が原因で原予測誤差信号とは異なる。加算器125によって復号予測誤差信号を予測信号に加算することにより、再構築信号が取得される。エンコーダ側とデコーダ側の互換性を保つために、符号化された後に復号された動画像信号に基づいて、双方に知られる予測信号を求める。量子化によって、量子化ノイズが再構築動画像信号に重畳される。
ブロック単位での符号化により、重畳されたノイズはしばしば、ブロッキング特性を有し、特に強い量子化がおこなわれた場合は、復号画像のブロック境界が目立つ結果になる。ブロッキングアーチファクトは、人間の視覚的認識上マイナスの効果がある。アーチファクトを削減するために、再構築画像ブロックごとにデブロッキングフィルタ130が適用される。デブロッキングフィルタ130は、予測信号と復号予測誤差信号との加算結果である再構築信号に適用される。デブロッキング後の動画像信号は、通常は(ポストフィルタリングが適用されなければ)デコーダ側で表示される復号信号である。
H.264/AVCにおけるデブロッキングフィルタ130は、局所的に適用可能なものである。ブロッキングノイズの程度が高い場合は、強い(帯域幅が狭い)ローパスフィルタが適用され、ブロッキングノイズの程度が低い場合は、弱い(帯域幅が広い)ローパスフィルタが適用される。デブロッキングフィルタ130は、通常、ブロックのエッジを平滑化して復号画像の主観的画質を改善する。さらに、画像内のフィルタリング済みの部分が次の画像の動き補償予測に用いられるため、フィルタリングによって予測誤差が削減され、符号化効率を改善することができる。復号動画像信号は、次にメモリ140に格納される。
H.264/AVCにおける予測信号は、時間的予測か空間的予測によって取得される。予測タイプは、マクロブロック単位で異ならせることができる。時間的予測で予測されたマクロブロックは、インター符号化マクロブロックと呼ばれ、空間的予測で予測されたマクロブロックは、イントラ符号化マクロブロックと呼ばれる。
ここで、「インター」という用語は、インターピクチャ予測、つまり先行フレームか後続フレームから得られた情報を用いる予測に関する。「イントラ」という用語は、空間的予測、つまり対象動画像フレーム内で既に符号化された情報のみを用いる予測に関する。可能な限り高い圧縮成果を達成するために、動画像フレームの予測タイプは、ユーザが設定することもでき、動画像符号化装置100に選択させることもできる。選択された予測タイプにしたがってスイッチ175は、対応する予測信号を減算器105へ提供する。
イントラ符号化画像(Iタイプ画像またはIフレームとも呼ばれる)は、イントラ符号化されたマクロブロックのみからなる。つまり、イントラ符号化された画像は、他の復号画像を参照することなく復号可能である。イントラ符号化画像は、符号化動画像シーケンスに対しエラー耐性を与える。なぜなら、時間的予測によって動画像シーケンス内でフレームからフレームへ伝播する可能性があるエラーを取り除く(リフレッシュする)からである。さらに、Iフレームは、符号化動画像シーケンス内でランダムアクセスを可能にする。
イントラフレーム予測では、基本的には、既に符号化された隣接マクロブロックの境界に位置する画素を用いて対象マクロブロックを予測する、予め定められたイントラ予測モードの組が用いられる。空間的予測タイプが異なるということは、エッジの方向、つまり適用された2次元補間の方向が異なるということである。補間によって得られた予測信号は、次に、上述の減算器105によって、入力信号から減算される。また、空間的予測タイプ情報は、エントロピー符号化され、符号化動画像信号とともに提供される。
インター符号化画像を復号するには、符号化された後に復号された画像が必要である。時間的予測は、単一方向つまり符号化対象フレームより早い順序の動画像フレームのみを用いておこなってもよく、後続動画像フレームも用いておこなってもよい。単一方向の時間的予測をおこなえば、Pフレームと呼ばれるインター符号化画像が得られ、双方向の時間的予測をおこなえば、Bフレームと呼ばれるインター符号化画像が得られる。一般的に、インター符号化画像は、PタイプマクロブロックとBタイプマクロブロックとIタイプマクロブロックのいずれかから構成される。
インター符号化マクロブロック(PまたはBマクロブロック)は、動き補償予測部160を採用して予測される。まず、動き予測部165によって、符号化された後に復号された動画像フレーム内で、対象ブロックに最適なブロックが検出される。この最適ブロックは予測信号となり、対象ブロックと最適ブロック間の相対的なずれ(動き)が、符号化動画像データとともに提供される補助情報内に含められる2次元の動きベクトルの形で動きデータとして信号送信される。
予測精度を最適化するため、1/2画素解像度や1/4画素解像度などの小数画素解像度で動きベクトルを特定してもよい。小数画素解像度の動きベクトルは、復号フレーム内の、小数画素位置のように実存する画素値がない位置を指してもよい。よって、動き補償をおこなうには、そのような画素値の空間的補間が必要である。補間は、補間フィルタ150によっておこなわれる。H.264/MPEG AVC標準規格にしたがって、小数画素位置の画素値を得るために、固定フィルタ係数を用いた6タップ・ウィナー補間フィルタとバイナリフィルターが適用される。
イントラ符号化モードおよびインター符号化モードにおいて、変換/量子化部110によって、対象入力信号と予測信号間の差分が変換されて量子化され、量子化変換係数が得られる。一般的に、2次元離散コサイン変換(DCT)またはその整数版のような直交変換が採用される。なぜなら、これにより自然動画像の冗長性を効率的に削減できるからである。通常、低周波数成分は高周波成分よりも画質にとって重要であるため、高周波数よりも低周波数に多くのビットが費やされるように変換される。
量子化後、2次元マトリクスの量子化変換係数が1次元配列に変換されてエントロピー符号化部190に送信される。典型的には、いわゆるジグザグ走査によって変換される。ジグザグ走査においては、2次元マトリクスの左上隅から右下隅まで所定の順序で走査される。典型的には、エネルギーは低周波に相当する画像の左上部分に集中するため、ジグザグ走査をおこなうと、最後のほうでゼロ値が続く配列になる。これにより、実際のエントロピー符号化の一部として、またはそれ以前の段階で、ラン‐レングス符号を用いた効率的な符号化をおこなうことが可能になる。
H.264/MPEG−4AVCは、量子化パラメータ(QP)およびカスタマイズ可能な量子化マトリクス(QM)によって制御可能なスカラ量子化を採用している。量子化パラメータにより、52の量子化器のうちの1つがマクロブロック毎に選択される。加えて、量子化マトリクスは、画質の損失を避けるため、特に、ソース内で特定の周波数を保つように設計される。H.264/MPEG−4AVCにおける量子化マトリクスは、動画像シーケンスに適応可能であり、動画像データと共に信号送信される。
画質を改善するために、ポストフィルタ280と呼ばれるものを、動画像復号装置(「デコーダ」ともいう。以下同じ。)200で適用してもよい。H.264/MPEG AVC標準規格においては、補助的拡張情報(SEI)メッセージを通して、ポストフィルタ280のためのポストフィルタ情報を送信することが可能である。ポストフィルタ情報は、ローカル復号信号と原画入力信号とを比較するポストフィルタ設計部180によって動画像符号化装置100側で特定される。ポストフィルタ設計部180の出力は、エントロピー符号化部190に送られ、符号化されて符号化信号に挿入される。エントロピー符号化部190は、統計を適用した、符号化対象情報のタイプが異なれば長さが異なる可変長コードを採用する。
図2は、H.264/AVC動画像符号化標準規格に準拠した例示的な動画像復号装置200を説明する図である。符号化動画像信号(動画像復号装置200への入力信号)は、まずエントロピー復号部290へ送信される。エントロピー復号部290は、量子化変換係数や動きデータおよび予測タイプなどの復号に必要な情報エレメントや、ポストフィルタ情報を復号する。量子化変換係数は、逆走査されて2次元マトリクスとなり、逆量子化/逆変換部220へ送信される。逆量子化/逆変換部220による逆量子化および逆変換後、復号(量子化)予測誤差信号が得られる。これは、動画像符号化装置100へ入力された信号から予測信号を減算して得られた差分に相当する。
予測信号は、動き補償予測部(時間的予測手段)260またはイントラフレーム予測部(空間的予測手段)270からそれぞれ得られる。どちらの予測信号を採用するかは、動画像符号化装置100で適用された予測を信号送信する情報エレメントにしたがってスイッチ275によって切り替えられる。
復号情報エレメントは、さらに、イントラ予測の場合には、予測タイプなどの予測に必要な情報を含み、動き補償予測の場合には、動きデータなどの予測に必要な情報を含む。動きベクトルの値によっては、動き補償予測をおこなうには画素値を補間する必要がある。補間は、補間フィルタ250によっておこなわれる。
空間領域の量子化予測誤差信号は、次に、加算器225によって、動き補償予測部260かイントラフレーム予測部270から得られる予測信号へ加算される。再構築画像を、デブロッキングフィルタ230へ送信してもよい。復号信号は、メモリ240に格納され、後続ブロックの時間的予測または空間的予測に用いられる。
ポストフィルタ情報は、ポストフィルタ280へ送信され、ポストフィルタ280がそれに応じて設定される。さらに画質を改善するために、ポストフィルタ280は、次に復号信号に適用される。よって、ポストフィルタ280は、フレームごとに動画像符号化装置100へ入力される動画像信号の特性に適応する能力を備える。
要約すると、最新のH.264/MPEG AVC標準規格で用いられるフィルタは以下の3種類である。すなわち、補間フィルタとデブロッキングフィルタとポストフィルタである。一般に、あるフィルタが適切かどうかは、フィルタリング対象の画像内容次第で決まる。それゆえ、画像の特性に適応可能なフィルタ設計は有利である。フィルタ係数を、ウィナーフィルタ係数として設計してもよい。
最新のH.264/MPEG AVC標準規格においては、さらに、適応的ポストフィルタを利用可能である。この目的で、上述のように、ポストフィルタ設計部180によって画像ごとに動画像符号化装置100でポストフィルタが評価される。ポストフィルタ設計部180は、フィルタ情報(ポストフィルタヒントと呼ばれるもの)を生成し、これをSEIメッセージの形で動画像復号装置200へ送信する。動画像復号装置200での表示に先立って復号信号に適用されるポストフィルタ280によって、このフィルタ情報を利用してもよい。動画像符号化装置100から動画像復号装置200へ送信されるフィルタ情報は、フィルタ係数か相互相関ベクトルである。補助情報を送信すれば、フィルタリングの質を改善できる場合があるが、帯域を広げる必要が生じる。送信または計算されたフィルタ係数を用いて、画像全体にポストフィルタリングが施される。H.264/MPEG AVCにおけるデブロッキングフィルタは、ブロックのエッジに生じるブロッキングアーチファクトを削減するループフィルタとして用いられる。3タイプのフィルタは、ウィナーフィルタとして評価される。
図3は、ノイズを削減するためのウィナーフィルタ300を用いた信号の流れを説明する図である。ノイズnが入力信号sに加算されると、フィルタリング対象のノイズを含む信号s’になる。ノイズnを削減するという目的は、信号s’にウィナーフィルタ300を適用してフィルタリング済み信号s’’を得ることである。ウィナーフィルタ300は、所望の信号である入力信号sとフィルタリング済み信号s間の平均二乗誤差を最小限にするよう設計される。ウィナー係数はウィナーHopf方程式と呼ばれるシステムとして表現される最適化問題arg min E[(s‐s’’)]の解に相当する。演算子E[x]は、期待されるxの値である。解は以下の式1で求められる。
Figure 2010061607
ここで、wは、正の整数であるM桁の最適ウィナーフィルタ係数を含むM×1のベクトルである。R−1は、フィルタリング対象のノイズを含む信号s’のM×Mの自己相関マトリクスRの逆数を表す。pは、フィルタリング対象のノイズを含む信号s’と原画信号sとの間のM×1の相互相関ベクトルを表す。適応的フィルタ設計に関する詳細については、S.Haykinの、「Adaptive Filter Theory(特許文献1)」(第4版、Prentice Hall Information and System Sciencesシリーズ、Prentice Hall、2002年)を参照のこと。これをここに引用して援用する。
よって、ウィナーフィルタ300のメリットの1つは、破損した(ノイズを含む)信号の自己相関と、破損信号と所望の信号間の相互相関に基づいて、フィルタ係数を求めることができるという点である。動画像符号化の際に、量子化ステップにおいて、量子化ノイズが原画(入力)動画像信号に重畳される。動画像符号化(のコンテキスト)におけるウィナーフィルタリングは、平均二乗再構築誤差を最小化するために、重畳された量子化ノイズを削減することを目的としている。
図4は、H.264/MPEG−4 AVCのデブロッキングフィルタ130の代わりにウィナーフィルタ及び設計部440が用いられる、H.264/MPEG−4 AVCの動画像符号化装置400を示すブロック図である。これは、特許文献1に記載されており、これをここに引用して援用する。ウィナーフィルタ及び設計部440は、動き補償予測の前に、予測ループ内で実行される。フィルタリングされた画像は、メモリ140に格納され、予測のために提供される。
インループフィルタリングによる利点は、予測および表示に用いられる信号の質が向上することである。デブロッキングフィルタ130がウィナーフィルタ及び設計部440として実装されれば、入力信号と再構築信号を用いて係数が予測される。算出されたフィルタ係数441は、同じ復号結果、つまり同じ画質を保証する目的で、デコーダに提供されなければならない。送信または格納する前に、フィルタ係数441はエントロピー符号化部490によってエントロピー符号化され、補助情報として符号化動画像データに組み込まれる。そのような動画像符号化装置400と互換性を持つデコーダは、フィルタ係数等の符号化されたであろうフィルタ情報441を取得し、それにしたがってデコーダ自体のフィルタを設定する。
図5は、特許文献1に記載されている、H.264/MPEG−4 AVCのデブロッキングフィルタ130の後にウィナーフィルタ及び設計部540がさらに適用された動画像符号化装置500の他の例を示す。ウィナーフィルタ及び設計部540は、入力信号とデブロッキングフィルタ130によってフィルタリングされた再構築信号とに基づいてフィルタ係数541を算出する。フィルタ係数541は、エントロピー符号化部590によって符号化されるが、この符号化は、フィルタ係数の統計に適応していてもよい。
欧州出願第08012036.3号において、これをここに引用して援用するが、予測信号、量子化予測誤差信号、および復号信号をフィルタ設計において別々に考慮することが提案されている。これにより、これら3つの信号の各々のノイズを個々に考慮できる。
図6は、H.264/MPEG−4 AVCに基づくそのような例示的な動画像符号化装置600を示す。図7は、それに対応する動画像復号装置700を示す。したがって、ポストフィルタ係数は、入力信号、デブロッキングフィルタ130適用後の復号信号、予測信号および量子化予測誤差信号に基づいて、動画像符号化装置600においてポストフィルタ設計部640で算出される。ポストフィルタ設計部640は、その後、直接的にフィルタ係数を提供するか、またはデコーダにおいて対応するポストフィルタ740の設定に使用できる、他の種類の新たなポストフィルタ情報641を提供する。そのような新たなポストフィルタ情報641は、例えば、相互相関ベクトル、または他の任意の情報である。やはり、ポストフィルタ情報641はエントロピー符号化部690でエントロピー符号化され、それに対応して動画像復号装置700においてエントロピー復号されてもよい。
次に、図8は、非線形ノイズ除去フィルタを備える動画像復号装置を示すブロック図である。この非線形ノイズ除去フィルタは、動き補償予測部から出力される予測信号と、復号部から出力される復号誤差(量子化予測誤差信号)との和である再構築画像信号に対して適用される。
図9A及び図9Bは、非線形ノイズ除去フィルタのアルゴリズムのフローを示す。まず、図9Aに示される変換部は、平行移動不変変換(translation invariant transform。ブロック開始位置を水平・垂直方向に1画素ずつ平行移動させた変換の組であり、変換の画素数に比例した個数が定義される)により、再構築画像信号yの複数の表現を生成する。具体的には、図10に示されるように、2次元4×4変換の場合、16個の表現が生成される。これらはd,…,d16と表される。d,…,d16は、再構築信号yの互いに異なるサンプルのセットから生成されたものである。
動画像符号化装置側において、同じ変換が原画信号xにも適用可能である。これは、ハイブリッド符号化される前の信号である。これはもちろん動画像復号装置側では入手できない。この結果、図11Bに示されるように、原画信号の16個の表現c,…,c16が得られる。図11A及び図11Bに示される処理によって得られる各cおよび各dは、16個の係数c(j),d(j)のベクトルであり、ここでj=1,…,16である。典型的に動画像符号化装置で実行される量子化により、量子化ノイズは、再構築信号の係数に重畳されるq(j)である。この量子化ノイズにより、再構築信号の係数d(j)と原画信号の係数c(j)の間の依存性は、c(j)=d(j)+q(j)と表すことができる。ノイズ除去フィルタの核となる部分は、ノイズ除去ルールである。このノイズ除去ルールを、式2に示す。
Figure 2010061607
式2の条件1は、原画信号の係数c(j)と、予測された係数ci^(j)との間の平均二乗誤差を最小化する目的で選択される。つまり、式2をより具体的に記述すると、式3のようになる。ここで、記号「^(ハット)」は、それぞれ直前の文字の上に付される記号を示し、本明細書では、以下、記号「^(ハット)」を同様な意味で使用する。
Figure 2010061607
上記式3によると、再構築画像信号の係数d(j)またはゼロが予測値として用いられるが、その予測値としては、二乗再構築誤差がより低くなるものが選択される。その選択は、係数d(j)と閾値τを比較することにより実現できる。つまり、τを用いて式3を書き換えると、式4のようになる。
Figure 2010061607
よって、16個の表現d(j)から、原画信号の係数に対する16個の予測値ci^(j)が、閾値演算により導き出される。これら16個の予測値ci^(j)は、図12に示されるように、重み付け逆変換部で逆変換されて値u^となる。重み付け逆変換とは、16個の予測値ci^(j)を周波数成分毎に重み付け加算し、得られた結果を空間領域に変換する処理である。すなわち、この値u^は、空間領域の値である。さらに、u^をマスキング部でマスキングしてもよい。u^をマスキングすると、画像信号x^となる。マスキング処理により、原画信号xに対する画像信号x^の急激な変化を抑制することができる。
ここまで、ノイズ除去の1つのループのみを説明した。図9Bから分かるように、k=0,…,2によって示される3つのループが実行される。これは、第1ループの結果であるx^=xk=0^=x0^に対し、平行移動不変変換が適用され、kを1増加させた後(k+=1)、係数f1,k-1,・・・, f16,k-1となる。これらの係数に対するノイズ除去ルールは、以下の式5にしたがって適用される。各ループにおいて、個々の閾値τi,kが適用される。
Figure 2010061607
欧州特許出願公開第1841230号明細書
Adaptive Filter Theory(S.Haykin、Prentice Hall Information and System Sciencesシリーズ、Prentice Hall、2002年)
本発明の根底にある課題は、周波数領域において実行される量子化が、恐らく個々の量子化ノイズをもつ各周波数成分を重畳したものと見なされる可能性があることに基づく。これは、ノイズの統計が、各周波数成分毎に異なる可能性があることを意味する。現在のところ動画像符号化に適用されている手法は、空間領域においてフィルタリング(ループおよび/またはポストフィルタリング)を適用することである。しかし、空間領域に適用されたフィルタリングでは、各周波数成分における量子化ノイズの個々の統計は考慮されない。
本発明の目的は、効率的なフィルタリング手法によって符号化および/または復号動画像信号の質を向上させる、符号化および復号メカニズムを提供することである。
本発明の一形態に係る動画像符号化方法は、動画像信号を符号化して得られる符号化信号を復号する方法である。具体的には、前記符号化信号及びフィルタ処理を特定するフィルタ情報を取得するステップと、前記符号化信号を復号して復号信号を生成するステップと、前記動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去する前記フィルタ処理を、前記フィルタ情報を用いて周波数領域の復号信号に適用するステップとを含む。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記復号信号との平均二乗誤差を最小にするための情報を含む。
上記構成によれば、量子化の過程で重畳されたノイズを適切に除去することが可能となる。なお、「量子化の過程で重畳されるノイズ」とは、典型的には、量子化ノイズであり、周波数変換された信号に重畳される。そこで、空間領域の信号に対してではなく、周波数領域の信号に対してフィルタ処理を適用することにより、より効果的にノイズを除去することができる。また、量子化ノイズは、全周波数成分に一様に重畳されるのではなく、周波数成分毎に異なる。そこで、周波数成分毎に独立してフィルタ処理を適用することにより、より適応的に量子化ノイズを除去することができる。さらに、フィルタ情報を符号化側から取得することにより、原動画像信号を考慮したフィルタ処理が可能となる。
なお、本明細書中における「符号化」とは、動画像信号を周波数変換し、量子化し、エントロピー符号化する処理の一部又は全部を含む概念である。また、「復号」とは、符号化信号を逆量子化し、空間領域に変換し、予測信号を加算して再構築信号を生成し、再構築信号にデブロッキングフィルタ処理を適用して復号信号を生成する処理、又は再構築信号から予測信号を生成する処理の一部又は全部を含む概念である。
また、前記フィルタ処理は、前記復号信号を構成する複数のブロックそれぞれについて、処理対象ブロックの各周波数成分の値と、前記処理対象ブロックに時間的又は空間的に隣接するブロックの対応する周波数成分の値とを、前記フィルタ情報に含まれる重み係数を用いて重み付け加算するステップを含む。そして、前記重み係数は、前記フィルタ処理が適用された後の周波数領域の前記処理対象ブロックと、周波数領域の前記動画像信号に含まれる前記処理対象ブロックに対応するブロックとの平均二乗誤差が最小になるように決定されてもよい。
さらに、前記フィルタ処理は、前記重み付け加算を実行する前の前記処理対象ブロックに対して、各周波数成分の値から第1のオフセット値を減算するステップと、前記重み付け加算した後の前記処理対象ブロックに対して、各周波数成分の値に前記フィルタ情報に含まれる第2のオフセット値を加算するステップとを含む。そして、前記第1のオフセット値は、周波数領域の前記復号信号に含まれるブロックのうち、前記処理対象ブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に算出され、前記第2のオフセット値は、周波数領域の前記動画像信号に含まれるブロックのうち、前記処理対象ブロックに対応するブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に算出されてもよい。
一形態として、前記符号化信号は、前記動画像信号が空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られるものであある。前記復号信号を生成するステップには、前記符号化信号をエントロピー復号して前記復号信号としての量子化係数を生成する処理が含まれる。そして、前記フィルタ処理を適用するステップには、前記量子化係数に前記フィルタ処理を適用すると共に、当該量子化係数を逆量子化する処理が含まれてもよい。これにより、量子化係数に重畳されたノイズを適応的に除去することができる。
他の形態として、前記符号化信号は、前記動画像信号から予測信号が減算され、空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られるものである。前記復号信号を生成するステップには、前記符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換し、前記予測信号を加算して前記復号信号としての再構築信号を生成する処理が含まれる。そして、前記フィルタ処理を適用するステップには、前記再構築信号を空間領域から周波数領域に変換する処理と、周波数領域の前記再構築信号に前記フィルタ処理を適用する処理と、前記フィルタ処理を適用した後の前記再構築信号を周波数領域から空間領域に逆変換する処理とが含まれてもよい。これにより、再構築信号に重畳されたノイズを適応的に除去することができる。
他の形態として、前記符号化信号は、前記動画像信号から予測信号が減算されて予測誤差信号が生成され、当該予測誤差信号が空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られるものである。前記復号信号を生成するステップには、前記符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換して量子化予測誤差信号を生成し、前記量子化予測誤差信号と前記予測信号とを加算して再構築信号を生成する処理が含まれる。前記フィルタ処理は、前記復号信号としての前記量子化予測誤差信号、前記予測信号、及び前記再構築信号の互いに対応するブロックに含まれる同一周波数成分の値を前記フィルタ情報に含まれる重み係数を用いて重み付け加算するステップを含む。そして、前記重み係数は、周波数領域の前記予測誤差信号と、前記フィルタ処理が適用された後の周波数領域の前記量子化予測誤差信号との平均二乗誤差が最小になるように決定されてもよい。これにより、量子化予測誤差信号に重畳されたノイズを適応的に除去することができる。
他の形態として、前記符号化信号は、前記動画像信号から予測信号が減算され、空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られるものである。前記復号信号を生成するステップには、前記符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換して量子化予測誤差信号を生成し、前記量子化予測誤差信号と前記予測信号とを加算して再構築信号を生成する処理が含まれる。そして、前記フィルタ処理を適用するステップには、前記予測信号を空間領域から周波数領域に変換する処理と、周波数領域の前記予測信号に前記フィルタ処理を適用する処理と、前記フィルタ処理が適用された後の前記予測信号を周波数領域から空間領域に逆変換する処理とが含まれてもよい。これにより、予測信号に重畳されたノイズを適応的に除去することができる。
本発明の一形態に係る動画像符号化方法は、動画像信号を符号化して符号化信号を生成する方法である。具体的には、少なくとも、前記動画像信号を空間領域から周波数領域に変換し、量子化して、前記符号化信号を生成するステップと、量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するステップと、前記符号化信号及び前記フィルタ情報を出力するステップとを含む。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される。これにより、量子化の過程で重畳されたノイズを適応的に除去することができる。
さらに、前記動画像符号化方法は、量子化後の周波数領域の信号に、前記フィルタ情報を用いて前記フィルタ処理を適用するステップを含む。前記フィルタ処理は、前記量子化後の信号を構成する複数のブロックそれぞれについて、処理対象ブロックの各周波数成分の値と、前記処理対象ブロックに時間的又は空間的に隣接するブロックの対応する周波数成分の値とを、前記フィルタ情報に含まれる重み係数を用いて重み付け加算するステップを含む。そして、前記フィルタ情報を生成するステップは、前記フィルタ処理が適用された前記処理対象ブロックと、周波数領域の前記動画像信号に含まれる前記処理対象ブロックに対応するブロックとの平均二乗誤差が最小になるように前記重み係数を決定してもよい。
さらに、前記フィルタ処理は、前記重み付け加算を実行する前の前記処理対象ブロックに対して、各周波数成分の値から第1のオフセット値を減算するステップと、前記重み付け加算した後の前記処理対象ブロックに対して、各周波数成分の値に第2のオフセット値を加算するステップとを含む。そして、前記フィルタ情報を生成するステップでは、量子化後の周波数領域の信号に含まれるブロックのうち、前記処理対象ブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に前記第1のオフセット値が算出され、周波数領域の前記動画像信号に含まれるブロックのうち、前記処理対象ブロックに対応するブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に前記第2のオフセット値を算出され、少なくとも前記第2のオフセット値を前記フィルタ情報に含められてもよい。
一形態として、前記符号化信号を生成するステップには、前記動画像信号から予測信号を減算して予測誤差信号を生成し、前記予測誤差信号を空間領域から周波数領域に変換し、量子化して量子化係数を生成する処理が含まれる。そして、前記フィルタ情報を生成するステップでは、周波数領域の前記予測誤差信号と、前記フィルタ処理が適用された後の周波数領域の量子化予測誤差信号との平均二乗誤差が最小になるように前記フィルタ情報が決定されてもよい。
他の形態として、前記符号化信号を生成するステップには、周波数領域の前記動画像信号を量子化し、逆量子化して再構築信号を生成する処理が含まれる。そして、前記フィルタ情報を生成するステップでは、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記再構築信号との平均二乗誤差が最小になるように前記フィルタ情報が決定されてもよい。
他の形態として、前記符号化信号を生成するステップには、前記動画像信号から予測信号を減算して予測誤差信号を生成し、前記予測誤差信号を空間領域から周波数領域に変換し、量子化し、逆量子化し、周波数領域から空間領域に変換して量子化予測誤差信号を生成し、前記量子化予測誤差信号に前記予測信号を加算して再構築信号を生成する処理が含まれる。そして、前記フィルタ情報を生成するステップでは、周波数領域の前記予測信号、周波数領域の前記量子化予測誤差信号、及び周波数領域の前記再構築信号に基づいて、周波数領域の前記予測誤差信号と、前記フィルタ処理が適用された後の周波数領域の前記量子化予測誤差信号との平均二乗誤差が最小になるように前記フィルタ情報が決定されてもよい。
他の形態として、前記符号化信号を生成するステップには、前記動画像信号から予測信号を減算して予測誤差信号を生成し、前記予測誤差信号を空間領域から周波数領域に変換し、量子化し、逆量子化し、周波数領域から空間領域に変換して量子化予測誤差信号を生成し、前記量子化予測誤差信号に前記予測信号を加算して再構築信号を生成する処理が含まれる。そして、前記フィルタ情報を生成するステップでは、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記予測信号との平均二乗誤差が最小になるように前記フィルタ情報が決定されてもよい。
本発明の一形態に係る動画像復号装置は、動画像信号を符号化して得られる符号化信号を復号する。具体的には、前記符号化信号及びフィルタ処理を特定するフィルタ情報を取得する取得部と、前記符号化信号を復号して復号信号を生成する復号部と、前記動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去する前記フィルタ処理を、前記フィルタ情報を用いて周波数領域の復号信号に適用するフィルタ部とを備える。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記復号信号との平均二乗誤差を最小にするための情報を含む。
本発明の一形態に係る動画像符号化装置は、動画像信号を符号化して符号化信号を生成する。具体的には、少なくとも、前記動画像信号を空間領域から周波数領域に変換し、量子化して、前記符号化信号を生成する符号化部と、量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するフィルタ設計部と、前記符号化信号及び前記フィルタ情報を出力する出力部とを備える。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される。
本発明の一形態に係るプログラムは、コンピュータに、動画像信号を符号化して得られる符号化信号を復号させる。具体的には、前記符号化信号及びフィルタ処理を特定するフィルタ情報を取得するステップと、前記符号化信号を復号して復号信号を生成するステップと、前記動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去する前記フィルタ処理を、前記フィルタ情報を用いて周波数領域の復号信号に適用するステップとを含む。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記復号信号との平均二乗誤差を最小にするための情報を含む。
本発明の他の形態に係るプログラムは、コンピュータに、動画像信号を符号化して符号化信号を生成させる。具体的には、少なくとも、前記動画像信号を空間領域から周波数領域に変換し、量子化して、前記符号化信号を生成するステップと、量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するステップと、前記符号化信号及び前記フィルタ情報を出力するステップとを含む。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される。
本発明の一形態に係る集積回路は、動画像信号を符号化して得られる符号化信号を復号する。具体的には、前記符号化信号及びフィルタ処理を特定するフィルタ情報を取得する取得部と、前記符号化信号を復号して復号信号を生成する復号部と、前記動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去する前記フィルタ処理を、前記フィルタ情報を用いて周波数領域の復号信号に適用するフィルタ部とを備える。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記復号信号との平均二乗誤差を最小にするための情報を含む。
本発明の他の形態に係る集積回路は、動画像信号を符号化して符号化信号を生成する。具体的には、少なくとも、前記動画像信号を空間領域から周波数領域に変換し、量子化して、前記符号化信号を生成する符号化部と、量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するフィルタ設計部と、前記符号化信号及び前記フィルタ情報を出力する出力部とを備える。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される。
なお、本発明は、画像復号方法(装置)及び画像符号化方法(装置)として実現できるだけでなく、これらの機能を実現する集積回路として実現したり、そのような機能をコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体及びインターネット等の伝送媒体を介して流通させることができるのは言うまでもない。
これは、独立クレームに定義された特徴によって達成される。
好適な実施形態は、従属クレームの主題である。
周波数領域の動画像信号に基づいてフィルタパラメータを決定し、それにしたがってフィルタを設定し、周波数領域に当該フィルタを適用することは、本発明に特有の手法である。
そのような手法により、信号内の様々な周波数成分に対しノイズが異なる場合のフィルタリング後の画質が向上する。そのようなノイズ特性は、典型的に、周波数領域において量子化が実行される場合、特に量子化重み行列が用いられるか、粗量子化が適用された場合に、量子化ノイズにおいて見られるものである。しかしながら、ある特定の送信方法によって、誤差の結果として周波数選択ノイズが生じる場合もある。
本発明の第1の態様によれば、少なくとも1つの動画像フレームを含む動画像信号を符号化する方法が提供される。まず、動画像信号が周波数領域に変換される。その後、周波数領域の動画像信号のフィルタリングに用いられるフィルタデータが、周波数領域に変換された動画像信号に基づいて決定される。フィルタデータは、デコーダ側に提供される。
本発明の他の態様によれば、少なくとも1つの動画像フレームを含む符号化動画像信号を復号する方法が提供される。周波数領域の動画像信号をフィルタリングするフィルタが、周波数領域の動画像信号ブロックに対し個々に設定される。その後、動画像信号ブロックは、周波数領域において当該フィルタを用いて個々にフィルタリングされる。
本発明のさらに他の態様によれば、少なくとも1つの動画像フレームを含む動画像信号を符号化するエンコーダが提供される。当該エンコーダは、動画像信号を周波数領域に変換する変換手段と、フィルタデータを決定するフィルタ設計手段を備える。フィルタデータは、周波数領域の動画像信号のフィルタリングに用いられ、周波数領域に変換された動画像信号に基づいて決定される。さらに、エンコーダは、デコーダ側にフィルタデータを提供することができる。
本発明のさらに他の態様によれば、少なくとも1つの動画像フレームを含む符号化動画像信号を復号する装置が提供される。当該デコーダは、動画像信号ブロックに対し、周波数領域において個々にフィルタを設定する設定手段を備える。当該デコーダはさらにまた、周波数領域において、かつブロック単位で、当該フィルタによって動画像信号をフィルタリングするフィルタ手段を備える。
好ましくは、フィルタを設定するブロック、フィルタ設計、および/またはフィルタリングは、変換されるブロックに対応する。ここで、当該変換は動画像信号を符号化するために実行される変換、または動画像信号を復号するために実行される逆変換に対応してもよい。そのような場合、エンコーダにおいて動画像信号がフレームおよびブロックにセグメント化され、デコーダに信号送信されるか、一般的な方法でデコーダに通知される。しかしながら、符号化/復号に用いられたラスタと異なるラスタ(サイズおよび動画像信号フレーム内の位置)を有するブロックにはまた、追加の変換が適用されてもよい。この場合、エンコーダとデコーダの両方において動画像信号をブロックにセグメント化する必要があってもよく、またはエンコーダでセグメント化し、デコーダに信号送信/知らせてもよい。ラスタのフィルタリングは、変換に用いられるブロックラスタ、または時間的および/または予測に用いられるブロックラスタ等の、符号化/復号において使用されるブロックラスタに依存してもよい。特に、フィルタリングに用いられるブロックラスタは、基礎的な符号化/復号ブロックラスタのブロック群から設定されてもよい。しかしながら、フィルタリングに用いられるブロックラスタは、(もしあれば)符号化/復号に用いられる基礎的なブロックラスタから独立していてもよい。そのようなフィルタリングラスタのブロックのサイズおよび形状は、必ずしも同一とは限らず、異なる形状やサイズのブロックが使用されてもよい。好ましくは、効率よくソフトウェア/ハードウェアに実装できるようなサイズの四角形が用いられる。しかしながら、ラスタのブロックのサイズおよび形状は、例えば動画像信号の内容にしたがって任意に選択されてもよい。
好ましくは、デコーダ側で、エンコーダ側から、周波数領域の動画像信号のフィルタリングに用いられるフィルタデータを取得する。その後、取得されたフィルタデータに基づいてフィルタを設定する。エンコーダ側からフィルタデータを取得することで、デコーダは、(符号化前の)原動画像信号に関する情報等の、エンコーダのみが入手可能な情報を取得することができ、よって、そのような情報にしたがってフィルタを設定することができる。
好ましくは、本発明の符号化はまた、空間領域において入力動画像信号を空間的または時間的に予測し、予測信号を得ることを含む。予測誤差信号は、入力動画像信号と予測信号の差分として取得される。本発明の実施形態によれば、変換された動画像信号は変換された予測誤差信号に対応し、フィルタデータは周波数領域に変換された予測誤差信号に基づいて決定され、変換された予測誤差信号にフィルタリングが適用される。または、予測信号と(量子化)予測誤差信号の和であり、周波数領域に変換された再構築動画像信号に基づいて、フィルタデータが決定される。
好ましくは、符号化は、さらに、変換された動画像信号を量子化することを含み、フィルタデータは、量子化の前と後に、周波数領域に変換された動画像信号に基づいて算出された相関情報またはフィルタ係数を含む。特に、相関情報は、量子化の前と後の周波数領域の動画像信号の相互相関ベクトルであってもよく、または量子化の前と後の周波数領域の動画像信号間の差分によって生じる量子化ノイズの自己相関であってもよい。そのような情報は、エンコーダおよび/またはデコーダにおいて、例えばウィナーフィルタ係数のような、フィルタ係数の算出に有利に用いてもよい。しかしながら、係数はまた、直接的にデコーダに提供されてもよい。フィルタ係数は、ウィナーフィルタリングの場合のように平均二乗誤差を最小化するよりも、他の最適化の課題を解決することに基づいて予測されてもよい。フィルタは、入力信号のみに重み付けする有限インパルス応答フィルタか、または出力信号にも重み付けする無限インパルス応答フィルタであってもよい。
本発明の他の実施形態によれば、当該符号化はまた、フィルタデータに基づいて動画像信号をフィルタリングするフィルタを設定することと、周波数領域においてフィルタによって動画像信号をフィルタリングすることとを含む。特に、エンコーダで実行されるフィルタリングは、予測ループ内で適用されたループフィルタリングであってもよい。しかしながら、フィルタリングは必ずしもエンコーダで実行されるとは限らない。符号化は、デコーダに提供されるフィルタデータを決定するフィルタ設計のみを含んでもよい。その後、デコーダはそれにしたがって自己のフィルタを設定し、ポストフィルタリング等のフィルタリングを実行する。好ましくは、エンコーダにおけるフィルタリングも、ブロック単位で適用される。特に、ループフィルタの場合、エンコーダにおいて適用されたフィルタリングと、デコーダにおいて適用されたフィルタリングとは、同じフィルタデータに基づいており、類似している。
しかしながら、本発明の復号メカニズムは、ループフィルタリングとポストフィルタリングの両方を含んでもよい。それに対応して、フィルタデータは、エンコーダにおいてループフィルタとポストフィルタの両方に用いるために決定され、供給されてもよく、ループフィルタリングはまた、エンコーダとデコーダで等しく実行されてもよい。特に、ループフィルタはデブロッキングフィルタリングも実行してもよい。しかしながら、ループフィルタはまた、既存のデブロッキングフィルタに加えて動作してもよく、デブロッキングフィルタを使う必要が全くなくてもよい。
本発明の他の実施形態によれば、デコーダは、周波数領域に変換された予測誤差信号をエンコーダ側から取得し、それを空間領域に逆変換する。さらに、空間領域の動画像信号は、エンコーダ側から受け取った符号化データに基づいて、予測信号によって空間的または時間的に予測される。その後、再構築動画像信号は、空間領域の予測誤差信号と予測信号との和として算出される。好ましくは、周波数領域に変換された再構築信号か、周波数領域における取得された予測誤差信号の何れかである動画像信号にフィルタリングを適用する。
フィルタデータは、フィルタ係数、および/または周波数領域の動画像信号のオフセットを直接的に含んでもよい。好ましくは、フィルタデータは各スライス、特にスライスヘッダ内に提供される。しかしながら、フィルタデータは、他の定期的または不定期的な時間間隔でも、例えば、ピクチャ単位、マクロブロック単位、ブロック単位、または、そのようなピクチャ要素の数個単位で提供されてもよい。フィルタデータは、ストレージに格納されるか、符号化動画像信号と共に伝送チャネルを通して送信されることで提供される。
設計およびフィルタリングは、選択された周波数のみに対して実行されてもよい。特に、フィルタリングはDC周波数成分のみに適用されてもよい。
本発明の他の実施形態によると、周波数領域のフィルタリングは、フィルタリングに用いられた同一周波数の変換係数の評価に基づいて無効にされる。特に、係数の分散が、閾値と比較される。閾値は、固定されていてもよく、または、例えば量子化設定に基づいて動的に決定されてもよい。係数間の差分といった、他の評価基準が用いられてもよい。
本発明のフィルタリングは、好ましくは、フィルタリングされる対象ブロックに隣接する異なるブロックにおける同一周波数の変換係数に重み付けする。具体的には、隣接ブロックは、空間的に隣接するブロックであり、対象ブロックを囲む復号済みのブロックである。または、あるいはそれに加えて、隣接ブロックは、時間的に隣接するブロックであり、対象ブロックに対応する異なるフレーム(タイムインスタント)内のブロックである。好ましくは、その対応は動き予測を用いて決定される。しかしながら、フレーム内で対象ブロックと同じ位置にあるブロックが用いられてもよく、先行および/または後続フレームの他のブロックが用いられてもよい。
好ましくは、動画像信号はH.264/MPEG−4 AVC標準規格に基づいて符号化および/または復号され、フィルタデータは補助的拡張情報メッセージ内に提供される。しかしながら、本発明はH.264/MPEG−4 AVCや、その拡張版や後続規格に限定されるものではなく、標準化または特許化されたあらゆる動画像符号化メカニズムに用いられてもよい。
本発明のさらに他の実施形態によれば、予測信号と、量子化予測誤差信号と、再構築信号とが、フィルタリングのプロセスにおいて、つまり、エンコーダでフィルタデータを決定するとき、および/またはデコーダでフィルタを設定するときに別々に考慮される。または、予測信号または予測誤差信号のみがフィルタリングされる。2次以上のフィルタを用いるフィルタリングを実行する目的で、予測信号および/または既にフィルタリングされたブロックの予測誤差信号が、メモリに格納される。
本発明の他の態様によれば、本発明を実行するように適応した、コンピュータ読み取り可能なプログラムコードを実装したコンピュータ読み取り可能媒体を備えるコンピュータプログラム製品が提供される。
本発明の他の態様によれば、エンコーダ側からデコーダ側へ動画像信号を送信するためのシステムが提供される。このシステムは、上述のエンコーダと、符号化動画像信号を格納または送信するためのチャネルと、上述のデコーダとを備える。本発明の実施形態によれば、このチャネルは記憶手段に相当し、例えば、揮発性または非揮発性のメモリや、CD、DVDまたはBDのような光学または磁気記憶手段、ハードディスク、フラッシュメモリ、またはその他の記憶手段である。本発明の他の実施形態において、チャネルは伝送手段である。これは、インターネット、WLAN、UMTS、ISDN、xDSLなどの標準化または特許化された伝送技術/システムに準拠した、無線システム、有線システム、またはその両方の組み合わせであるリソースによって形成可能である。
本発明の目的および特徴は、上記以外のものも含め、付随する図面を参照しながら以下に説明される記述および好ましい実施形態によりさらに明確になる。
本発明によれば、符号化の過程で重畳されたノイズを、適切に除去することが可能となる。
図1は、従来のH.264/MPEG−4 AVCビデオエンコーダを示すブロック図である。 図2は、従来のH.264/MPEG−4 AVCビデオデコーダを示すブロック図である。 図3は、ウィナーフィルタ設計を示す概略図である。 図4は、デブロッキングフィルタの代わりに、ウィナーフィルタを備えるビデオエンコーダを示すブロック図である。 図5は、デブロッキングフィルタの補足としてウィナーフィルタを備えるビデオエンコーダを示すブロック図である。 図6は、予測信号、量子化予測誤差信号、および復号信号を伴う入力信号を別々に考慮することで設計されたポストフィルタを備えるビデオエンコーダを示すブロック図である。 図7は、取得されたポストフィルタ情報を用いて設定されたポストフィルタを備えるビデオデコーダを示すブロック図である。 図8は、従来の動画像復号装置の例を示すブロック図である。 図9Aは、平行移動不変変換のブロック図である。 図9Bは、非線形ノイズ除去フィルタのブロック図である。 図10は、平行移動不変変換の結果の例を示す図である。 図11Aは、原画信号xに平行移動不変変換を適用した例を示す図である。 図11Bは、再構築信号yに平行移動不変変換を適用した例を示す図である。 図12は、非線形ノイズ除去フィルタの処理を示す図である。 図13は、周波数領域に加えられたノイズを伴う符号化システムの例を示す概略図である。 図14は、周波数領域に加えられたノイズと空間領域に適用されたフィルタリングとを伴う符号化システムの例を示す概略図である。 図15は、空間領域に加えられたノイズと空間領域に適用されたフィルタリングとを伴う符号化システムの等価な例を示す概略図である。 図16は、周波数領域に加えられたノイズと周波数領域に適用されたフィルタリングとの両方を伴う符号化システムの例を示す概略図である。 図17は、符号化システムの例に用いられる空間領域ではなく、周波数領域においてフィルタリングを設計かつ適用することで達成される、最小平均二乗誤差の削減を表すグラフである。 図18Aは、本発明のビデオエンコーダを示すブロック図である。 図18Bは、本発明の他のビデオエンコーダを示すブロック図である。 図19Aは、本発明の好適な実施形態のビデオデコーダを示すブロック図である。 図19Bは、本発明の好適な実施形態の他のビデオデコーダを示すブロック図である。 図20Aは、周波数領域においてインループフィルタを実施する本発明の実施形態のビデオエンコーダを示すブロック図である。 図20Bは、図20Aに示される動画像符号化装置の動作を示すフローチャートである。 図21Aは、周波数領域においてインループフィルタを実施する本発明の実施形態のビデオデコーダを示すブロック図である。 図21Bは、図21Aに示される動画像符号化装置の動作を示すフローチャートである。 図22は、本発明のエンコーダまたはデコーダに適用される周波数領域のフィルタリングの例を示すブロック図である。 図23は、周波数領域においてポストフィルタを実施する本発明の他の実施形態のビデオエンコーダを示すブロック図である。 図24は、周波数領域においてポストフィルタを実施する本発明の他の実施形態のビデオデコーダを示すブロック図である。 図25は、本発明のエンコーダまたはデコーダに適用される周波数領域のフィルタリングの例を示すブロック図である。 図26は、周波数領域においてループフィルタを実施する本発明のビデオエンコーダの例を示すブロック図である。 図27は、デブロッキングフィルタに加え、周波数領域においてループフィルタを実施する本発明のビデオエンコーダの例を示すブロック図である。 図28は、周波数領域においてポストフィルタ設計を実施する本発明のビデオエンコーダの例を示すブロック図である。 図29は、周波数領域においてポストフィルタ設計を実施する本発明のビデオデコーダの例を示すブロック図である。 図30は、本発明のエンコーダまたはデコーダに適用される周波数領域のフィルタリングの他の例を示すブロック図である。 図31Aは、フィルタリングに用いられてもよい、空間的に隣接し、かつ重複していないブロックの例を示す概略図である。 図31Bは、フィルタリングに用いられてもよい、空間的に隣接し、かつ重複しているブロックの例を示す概略図である。 図32Aは、フィルタリングに用いられてもよい、時間的に隣接しているブロックの例を示す概略図である。 図32Bは、フィルタリングに用いられてもよい、時間的に隣接しているブロックの他の例を示す概略図である。 図33は、周波数領域において予測信号のフィルタリングを実施する本発明のビデオエンコーダの例を示すブロック図である。 図34は、周波数領域において予測信号のフィルタリングを実施する本発明のビデオデコーダの例を示すブロック図である。 図35は、予測誤差信号または予測信号にフィルタリングが適用される、本発明のエンコーダの例の一部分を示すブロック図である。 図36は、予測誤差信号または予測信号に無限インパルス応答フィルタリングが適用される、本発明のエンコーダの例の一部分を示すブロック図である。 図37は、本発明のエンコーダおよびデコーダを備えるシステムを示す概略図である。 図38は、本発明の符号化および復号を適用することで達成される結果を、技術水準の符号化および復号と比較して示すグラフである。 図39Aは、実施の形態6に係る変換部の一例を示す図である。 図39Bは、実施の形態6に係るフィルタ部の処理フローの一例を示す図である。 図40Aは、実施の形態6に係る変換部の他の例を示す図である。 図40Bは、実施の形態6に係るフィルタ部の処理フローの他の例を示す図である。 図41Aは、実施の形態6に係る変換部の他の例を示す図である。 図41Bは、実施の形態6に係るフィルタ部の処理フローの他の例を示す図である。 図42は、コンテンツ配信サービスを実現するコンテンツ供給システムの全体構成の一例を示す模式図である。 図43は、携帯電話の外観を示す図である。 図44は、携帯電話の構成例を示すブロック図である。 図45は、デジタル放送用システムの全体構成の一例を示す模式図である。 図46は、テレビの構成例を示すブロック図である。 図47は、光ディスクである記録メディアに情報の読み書きを行う情報再生記録部の構成例を示すブロック図である。 図48は、光ディスクである記録メディアの構造例を示す図である。 図49は、各実施の形態に係る画像符号化方法および画像復号方法を実現する集積回路の構成例を示すブロック図である。
本発明によれば、動画像信号のフィルタ設計およびフィルタリングは、空間周波数の領域(周波数領域)で実行される。さらに、デコーダが適切にフィルタリングを設定できるようにする目的で、エンコーダ側で入手できるがデコーダ側では入手できない情報が、符号化動画像データと共に提供される。本発明のデコーダでは、周波数領域においてブロック単位でフィルタが設定され、フィルタリングが適用される。
動画像信号をフィルタリングするフィルタを設計することと、周波数領域においてフィルタリングを行うことは、周波数領域にノイズが加えられた場合にも特に利点をもたらす。このことは実際、周波数領域に変換された動画像信号を量子化および送信/格納する今日の動画像符号化方法の大半に該当する。
以下に、空間領域で動作するウィナーフィルタと比較して、周波数領域で動作するウィナーフィルタの利点を、2つのサンプルを伴う1次元信号を符号化する例示的な符号化システムを用いて示す。
図13は、周波数領域における量子化を採用する考慮された例示的な符号化システムを示す。信号sがDCT変換部810に入力される。ここに適用されたDCT変換部810は、ブロックサイズが2の1次元離散コサイン変換(DCT)である。したがって、信号sの2つの連続したサンプルs(x)とs(x+1)とは、そのようなDCT変換部810を用いて周波数領域に変換される。その結果である2つの変換係数cおよびcは、下記の式6によって得られる。
Figure 2010061607
2つの変換係数cおよびcは、独立して量子化され、その結果、量子化変換係数c1’およびc2’が得られる。よって量子化変換係数c1’およびc2’は、変換係数cおよびcと、この例において量子化ノイズに対応するノイズnおよびnとの和として式7のように表されてもよい。
Figure 2010061607
DCT逆変換部820は、量子化変換係数c1’およびc2’に逆DCT変換を適用することによって、再構築サンプルs’(x)およびs’(x+1)を生成する。再構築サンプルs’(x)及びs’(x+1)は、式8で表される。
Figure 2010061607
離散コサイン変換は単一変換であるため、空間領域の平均二乗量子化誤差E[(s−s’)]は、変換(周波数)領域の平均二乗量子化誤差E[(c−c’)]と同じであり、その結果は上記例では式9のようになる。
Figure 2010061607
以下に、周波数領域のウィナーフィルタによるノイズ削減を、空間領域のウィナーフィルタによるノイズ削減と比較する。比較の単純性を保つため、以下の通り仮定する。ノイズの2つの成分nおよびnは、ゼロ平均であり、変換係数cおよびcとペア単位で無相関である。信号sはゼロ平均であり、少なくとも広義に定常である。これらの仮定に基づき、量子化ノイズ信号の最初の2つのモーメントは式10及び式11の通りである。
Figure 2010061607
Figure 2010061607
さらに、変換係数cに適用される量子化がないと仮定すると、式12のようになる。
Figure 2010061607
各i=0,1,2,…,に対する信号sの成分s(x+i)=sの最初の2つのモーメントは式13及び式14の通りである。
Figure 2010061607
Figure 2010061607
変換信号sおよびノイズのジョイントモーメントは、式15の通りである。
Figure 2010061607
信号sの任意の2つの連続するサンプルsおよびsi+1の相関係数は式16の通りである。
Figure 2010061607
ノイズを削減するウィナーフィルタは、フィルタの長さが1であり、1フィルタ係数のみを有する。このフィルタ係数は、空間領域のフィルタリングの場合はhと表され、周波数領域のフィルタリングの場合はhと表される。これらの仮定により、変換係数cおよびcの分散は、下記の式17及び式18によって得られる。
Figure 2010061607
Figure 2010061607
図14は、周波数領域の量子化と、空間領域の1フィルタ係数を有するノイズ削減ウィナーフィルタとを備える対応する符号化システムを示す。DCT変換部910、量子化部、およびDCT逆変換部920を備える符号化システムは、上記仮定を適用すること、および空間領域において1つのフィルタ係数hのみを有するノイズ削減のためのウィナーフィルタ930を用いることで簡易化されている。変換係数cの量子化により、フィルタリング後の入力信号sと信号s’の間の平均二乗誤差は、式19の通りになる。
Figure 2010061607
図15に示される符号化システムは、図14に示される符号化システムと等価である。ゼロ平均のノイズ信号n、分散σ2 q=(σ2 n/2)、および相関E[s・n]=0は、周波数領域に挿入されるノイズnと等価であり、空間領域の信号sに追加される。
入力信号sとフィルタリング後の信号s”との間の平均二乗誤差を最小化するフィルタ係数hは、E[(s−s”)]→minを意味するが、式20の微分関数をゼロに設定することで算出できる。
Figure 2010061607
上記式20の解により、式21の通り、平均二乗誤差を最小化するフィルタ係数hの最適値を得る。
Figure 2010061607
信号sと、空間領域のフィルタ係数hの最適値を用いてノイズ削減ウィナーフィルタリングを行った後の信号s”との間の対応する最小平均二乗誤差は、下記の式22によって得られる。
Figure 2010061607
図16は、DCT変換部1110の後に周波数領域において量子化を適用し、かつ、変換後に(周波数領域において)、1つの係数hを有するノイズ削減のためのウィナーフィルタ1130を適用する符号化システムを示す。DCT逆変換部1120は、ウィナーフィルタ1130から出力される信号c”に対して実行される。
変換係数cの量子化により、また上記と同じ仮定に基づき、変換係数c1と変換量子化信号c1’の間の平均二乗誤差は、σ2 nである。
フィルタリング後の変換された信号cと変換された量子化信号c”との間の平均二乗誤差を最小化するウィナーフィルタ1130のフィルタ係数hは、E[(c−c”)]→minを意味するが、式23の微分項をゼロに設定することで算出できる。
Figure 2010061607
上記式23の解により、平均二乗誤差を最小化するフィルタ係数hの最適値は、式24のように表される。
Figure 2010061607
信号cと、最適なフィルタ係数hを用いてウィナーフィルタでフィルタリングを行った後の信号c”との間の対応する最小平均二乗誤差は、下記の式25によって得られる。
Figure 2010061607
したがって、信号sと、周波数領域のノイズ削減のためのウィナーフィルタ1130による信号s”との間の最小平均二乗誤差は、式26の通りである。
Figure 2010061607
図17は、上記例における、空間領域のフィルタリングから生じる最小平均二乗誤差と、周波数領域のフィルタリングから生じる最小平均二乗誤差との比較である。当該グラフは、式27をグラフ化したものである。
Figure 2010061607
より具体的には、周波数領域の信号c’に適用されるウィナーフィルタ1130によって達成される最小平均二乗誤差の削減を、相関係数ρの値と、信号sの分散によって正規化された量子化ノイズnの分散とに関して、空間領域の信号s’に適用されるウィナーフィルタ930と比較して示したものである。
この例に関するグラフから分かるように、相関係数ρが1と等しくなく、量子化ノイズの分散がゼロよりも大きい場合は常に、平均二乗誤差が削減できる。したがって、2つのサンプルを有する1次元信号に関するこの例は、ノイズが挿入された領域のフィルタリングを行うことにより、平均二乗誤差を削減する結果となることを示している。
これらの考慮に基づき、本発明は、フィルタ設計およびフィルタリングが周波数領域で実行される、動画像符号化装置及び動画像復号方法、ならびに動画像信号の符号化方法および復号方法を提供する。
動画像符号化装置側で、周波数領域においてフィルタ設計が実行され、周波数領域の動画像信号のフィルタリングに用いられるフィルタデータが動画像復号装置側に提供される。動画像復号装置では、フィルタにフィルタ情報が設定され、周波数領域においてブロック単位で適用される。
動画像符号化装置と動画像復号装置とで類似の動作を保証する目的で、本発明の好適な実施形態によれば、フィルタ情報が符号化動画像データと共に、動画像符号化装置で供給される。動画像復号装置は、当該フィルタ情報を取得し、それにしたがってフィルタ特性を設定することができる。
図18Aおよび図18Bは、本発明の動画像符号化装置1300A、1300Bを概略的に示すものである。動画像符号化装置1300Aは、動画像信号1301を周波数領域に変換する変換部1310と、周波数領域に変換された動画像信号1311に基づいてフィルタ情報1331を生成するフィルタ設計部1330とを備える。
ここで動画像信号1301とは、画素値、または予測符号化が適用される場合は予測誤差値といった2次元信号を指す。動画像信号を周波数領域に変換する変換は、フーリエ変換、離散コサイン変換、KL(Karhunen−Loeve)変換、またはそのような変換の高速および/または整数版等の任意の変換であり得る。
その後、周波数領域に変換された動画像信号1311は、周波数領域の動画像信号のフィルタリングに用いられるフィルタ情報1331を決定するフィルタ設計部1330に用いられる。そのようなフィルタ情報1331は、フィルタ係数および/または周波数領域の動画像信号のオフセットであってもよい。しかしながら、そのようなフィルタ情報1331はまた、フィルタ係数の算出および/またはフィルタの設定に用いることができる周波数領域に変換された動画像信号に関連する任意の統計的情報であってもよい。フィルタ情報1331はまた、(変換、またはフィルタ設計部1330の一部として)量子化が変換後に適用される場合は、量子化および非量子化変換係数に基づいて決定されてもよい。
その後、フィルタ情報1331は、動画像復号装置側に提供される。ここで、動画像復号装置側にフィルタ情報1331を提供する利点は、動画像復号装置自体が取得できないフィルタ設定のための情報を、動画像復号装置に提供できる可能性があることである。そのような情報は、例えば、何らかの不可逆圧縮が行われる前の動画像信号に関連する情報である。
フィルタ情報1331と、周波数領域に変換された動画像信号1311の両方が、さらに符号化されてもよい。フィルタ設計部1330はまた、好ましくは、本発明の特定の実施形態に関して説明されるように、周波数領域の符号化および/または圧縮動画像信号を用いてフィルタ情報1331を決定する。
図18Bに示される動画像符号化装置1300Bは、さらに、周波数領域に変換された動画像信号1311にフィルタ処理を適用するフィルタ1340と、フィルタ設計部1330で生成されたフィルタ情報1331をフィルタ1340に設定するフィルタ設定部1335とを備える。
フィルタ1340を設定することは、実行されるフィルタリング動作を定義するフィルタ係数、動画像信号オフセット等のフィルタパラメータを提供することを含む。これらのパラメータは、フィルタ情報1331から取得されるか、フィルタ情報1331および恐らく変換された動画像信号1311に基づいて算出されるかの何れかである。
図19Aは、本発明の動画像復号装置1400A、1400Bの概略的に示すものである。図19Aに示される動画像復号装置1400Aは、周波数領域の動画像信号1411にフィルタ処理を適用するフィルタ1440と、フィルタ1440の設定を行うフィルタ設定部1435と、フィルタ1440によってフィルタ処理が施された周波数領域の動画像信号1411を空間領域の動画像信号1421に変換する逆変換部1420とを備える。
動画像復号装置1400Aには、フィルタ情報1431と、動画像信号1411とが入力される。フィルタ情報1431は、動画像符号化装置側、例えば、図18Aおよび13Bに示される動画像符号化装置1300A、1300Bのうちの1つによって提供される。フィルタ情報1431は、周波数領域の動画像信号1411のフィルタリングに用いられるフィルタ1440の設定に用いられる。
動画像復号装置1400Bに入力される動画像信号1401が周波数領域になければ、まず、図19Bに示されるように、変換部1410で周波数領域の動画像信号1411に変換されなければならない。フィルタ設定部1435は、フィルタ情報1431に加えて、周波数領域に変換された動画像信号1411を用いてフィルタ1440の設定を行ってもよい。
周波数領域のフィルタリング済み動画像信号1441は、逆変換部1420で空間領域に逆変換されてもよく、さらに処理されてもよい。しかしながら、フィルタ設定部1435は、フィルタ情報1431を取得も考慮もせずにフィルタ1440の設定を行ってもよい。フィルタ1440でのフィルタ処理は、ブロック単位で適用される。
(実施の形態1)
図20A及び図20Bを参照して、本発明の実施の形態1に係る動画像符号化装置1500を説明する。図20Aは、動画像符号化装置1500の機能ブロック図である。図20Bは、動画像符号化装置1500の動作を示すフローチャートである。
実施の形態1における符号化信号を生成する処理には、動画像信号から予測信号を減算して予測誤差信号を生成し、予測誤差信号を空間領域から周波数領域に変換し、量子化して量子化係数を生成する処理が含まれる。また、フィルタ情報は、周波数領域の予測誤差信号と、フィルタ処理が適用された後の周波数領域の量子化予測誤差信号との平均二乗誤差が最小になるように決定される。
動画像符号化装置1500は、図20Aに示されるように、減算器105と、変換/量子化部110と、加算器125と、デブロッキングフィルタ130と、逆変換部1520と、フィルタ設計部1530と、フィルタ1540と、エントロピー符号化部1590と、符号化信号を出力する出力部(図示省略)と、予測ブロック生成部(図示省略)とを備える。
この動画像符号化装置1500は、入力信号としての動画像信号を符号化し、符号化信号を出力する。出力先は特に限定されないが、例えば、DVD(Digital Versatile Disc)やBD(Blu−ray Disc)等の記録媒体でもよいし、伝送路を通じて動画像復号装置1600に伝送してもよい。
減算器105は、符号化対象ブロック(入力信号)から予測ブロック(予測信号)を減算して予測誤差信号を生成する。変換/量子化部110は、予測誤差信号をDCT変換(Discrete Cosine Transformation:離散コサイン変換)すると共に、量子化して量子化係数を生成する。エントロピー符号化部1590は、量子化係数をエントロピー符号化して符号化信号を生成する。なお、量子化係数と共に、動き予測部165で生成される動き補償データやフィルタ設計部1530で生成されるフィルタ情報1530等を含めてエントロピー符号化してもよい。
フィルタ設計部1530は、フィルタ係数と、第1及び第2のオフセット値とを含むフィルタ情報1531を生成する。より具体的には、周波数領域に変換された動画像信号と、フィルタ1540での処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように、各種フィルタ情報が決定される。フィルタ情報1531は、フィルタ1540に提供されると共に、エントロピー符号化部1590を経由して出力される。なお、出力されるフィルタ情報1531は、少なくともフィルタ係数及び第2のオフセット値が含まれている必要があり、第1のオフセット値は省略することができる。
フィルタ1540は、量子化後の周波数領域の信号に、フィルタ情報を用いてフィルタ処理を適用する。より具体的には、量子化の過程で重畳されたノイズを、周波数成分毎に除去する処理を適用する。実施の形態1におけるフィルタ1540は、変換/量子化部110で生成された量子化係数を逆量子化する。そして、逆量子化された信号に重畳されたノイズを、周波数成分毎に除去する。フィルタ処理の詳細は、後述する。
逆変換部1520は、フィルタ1540でフィルタ処理されると共に逆量子化された量子化係数をDCT逆変換して量子化予測誤差信号を生成する。加算器125120は、量子化予測誤差信号と予測ブロックとを加算して再構築信号を生成する。デブロッキングフィルタ130は、再構築信号からブロック歪みを除去して復号信号を生成する。
予測ブロック生成部は、符号化対象ブロック(入力信号)より前に符号化された画像に基づいて、当該符号化対象ブロックを予測した予測ブロックを生成する。この予測ブロック生成部は、メモリ140と、補間フィルタ150と、動き予測部165と、動き補償予測部160と、イントラフレーム予測部170と、スイッチ175とによって構成されている。
メモリ140は、復号信号を一時記憶する遅延器として機能する。より具体的には、変換/量子化部110で量子化され、且つ逆量子化されたブロックを順次記憶し、1枚の画像(ピクチャ)を記憶する。補間フィルタ150は、動き補償予測に先立って復号信号の画素値を空間的に補間する。動き予測部165は、復号信号と次の符号化対象ブロックとに基づいて動き予測を行い、動きデータ(動きベクトル)を生成する。動き補償予測部160は、復号信号と動きデータとに基づいて動き補償予測を行い、予測ブロックを生成する。イントラフレーム予測部170は、復号信号を画面内予測して予測信号を生成する。スイッチ175は、予測モードとして「イントラ」モード及び「インター」モードのいずれかを選択する。そして、スイッチ175から出力される予測ブロックは、次の符号化対象ブロックを予測した信号となる。
次に、図20Bを参照して、動画像符号化装置1500の動作を説明する。
まず、減算器105は、入力信号から予測信号を減算して、予測誤差信号を生成する(S11)。次に、変換/量子化部110は、予測誤差信号をDCT変換すると共に、量子化して量子化係数を生成する(S12)。
次に、フィルタ設計部1530は、予測誤差信号と量子化係数とを取得して、フィルタ情報1531を生成する。より具体的には、予測信号を周波数領域に変換(DCT変換)し、量子化係数を逆量子化する。そして、周波数領域の予測信号と、逆量子化され、且つフィルタ処理された後の信号との平均二乗誤差が最小となるようなフィルタ情報1531を生成する。
次に、エントロピー符号化部1590は、量子化係数、動きデータ、及びフィルタ情報1531をエントロピー符号化して符号化信号を生成する(S14)。なお、フィルタ情報1531は、量子化係数等と合わせてエントロピー符号化してもよいし、これらとは別に出力してもよい。一方、エントロピー符号化部1590の動作と平行して、フィルタ1540は、フィルタ情報1530を用いて、量子化係数にフィルタ処理を適用する(S15)。
次に、逆変換部1520は、フィルタ1540からの出力信号をDCT逆変換して量子化予測誤差信号を生成する。また、加算器125は、量子化予測誤差信号と予測ブロックとを加算して再構築信号を生成する。デブロッキングフィルタ130は、再構築信号からブロック歪みを除去して復号信号を生成する。そして、予測ブロック生成部は、復号信号に基づいて予測ブロックを生成する(S16)。
次に、図21A及び図21Bを参照して、本発明の一実施形態に係る動画像復号装置1600の構成及び動作を説明する。図21Aは、動画像復号装置1600のブロック図である。図21Bは、動画像復号装置1600の動作を示すフローチャートである。
実施の形態1における符号化信号は、動画像信号が空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られる。また、復号信号を生成する処理には、符号化信号をエントロピー復号して復号信号としての量子化係数を生成する処理が含まれる。さらに、フィルタ処理には、量子化係数にフィルタ処理を適用すると共に、当該量子化係数を逆量子化する処理が含まれる。
動画像復号装置1600は、図21Aに示されるように、符号化信号を取得する取得部(取得部)と、エントロピー復号部1690と、フィルタ1640と、逆変換部1620と、加算器225と、デブロッキングフィルタ230と、予測ブロック生成部(図示省略)とを備える。この動画像復号装置1600は、図20Aに示される動画像符号化装置1500で符号化された符号化信号を復号して復号ブロック(復号信号)を生成する。
エントロピー復号部1690は、動画像符号化装置1500から出力された符号化信号をエントロピー復号して、量子化係数、動きデータ、及びフィルタ情報1691を取得する。フィルタ1640は、フィルタ1540と同様に、フィルタ情報1691を用いて、量子化係数にフィルタ処理を適用する。
逆変換部1620は、フィルタ1640から出力される信号をDCT逆変換することにより、量子化予測誤差信号を生成する。加算器225は、逆変換部1620から出力される量子化予測誤差信号と、予測ブロック生成部から出力される予測信号とを加算して、再構築信号を生成する。デブロッキングフィルタ230は、加算器225から出力される再構築信号に対して適用され、ブロックのエッジを平滑化して主観的画質を改善する。
予測ブロック生成部は、メモリ240と、イントラフレーム予測部270と、動き補償予測部260と、補間フィルタ250と、スイッチ275とを備える。この予測ブロック生成部は、基本的な構成及び動作は共通するが、動き予測部170を省略して、動きデータをエントロピー復号部1690から取得する点が異なる。
次に、図21Bを参照して、動画像復号装置1600の動作を説明する。
まず、エントロピー復号部1690は、符号化信号をエントロピー復号して、量子化係数、動きデータ、及びフィルタ情報1691を取得する(S21)。次に、フィルタ1640は、フィルタ情報1691を用いて、量子化係数にフィルタ処理を適用する(S22)。
次に、逆変換部1620は、フィルタ1640から出力される信号をDCT逆変換することにより、量子化予測誤差信号を生成する。次に、加算器225は、量子化予測誤差信号と予測ブロックとを加算して再構築信号を生成する(S23)。また、デブロッキングフィルタ230は、再構築信号からブロック歪みを除去する。次に、予測ブロック生成部は、予測ブロックを生成する(S24)。 本発明の実施形態によれば、周波数領域のフィルタ設計およびフィルタリングは、ループフィルタリング用に採用される。図20Aおよび図21Aは、それぞれ、そのような動画像符号化装置1500および動画像復号装置1600の例を示す。
(変換された)予測誤差信号、および対応する量子化変換係数に基づき、フィルタ設計部1530が、周波数フィルタ1540が使用するフィルタ係数を予測し、量子化変換係数をフィルタリングする。その後、フィルタ係数は、符号化のために新たなループフィルタ情報1531内のエントロピー符号化部1590に提供されてもよい。しかしながら、フィルタ係数そのものを提供/符号化する必要がなくてもよい。
新たなループフィルタ情報1531は、概して、動画像符号化装置1500と類似の方法で動画像復号装置1600側にフィルタを設定するために必要な情報を含むべきである。それは、動画像復号装置1600がフィルタ係数を決定できるようにするいかなる情報でもよい。
エントロピー符号化部1590は、指数ゴロム、ゴロム、ユニタリー符号、または符号化される新たなループフィルタ情報の特定の統計を考慮して設計された符号等の整数可変長符号を用いてもよい。符号化された新たなループフィルタ情報は、その後、他の符号化動画像データと共に動画像復号装置1600側に提供される。動画像符号化装置1500におけるフィルタリング済み変換係数は、逆変換部1520で逆変換され、フィルタリング済み量子化予測誤差信号が取得される。
動画像復号装置1600において、新たなループフィルタ情報1691が、エントロピー復号部1690によって復号され、フィルタ設計およびフィルタ処理を実行するフィルタ1640に提供される。フィルタ設計は、フィルタ係数が動画像符号化装置1500から直接提供されない場合に、新たなループフィルタ情報に基づいてフィルタ係数を算出するために必要である。フィルタ1640は、そのように算出されたフィルタ係数を用いて設定されるか、またはフィルタ係数および恐らく新たなループフィルタ情報1691内で取得された他の必要なデータを取得したエントロピー復号部1690から直接設定される。
その後、量子化変換係数がフィルタ1640によってフィルタリングされ、逆変換部1620によって逆変換され、対応するフィルタリング済み量子化予測誤差信号値となり、さらに予測信号に加えられ、再構築信号を得る。再構築信号は、例えば、デブロッキングフィルタ230によって、さらにフィルタリングされてもよい。
図22は、動画像符号化装置1500および/または動画像復号装置1600に採用された例示的な周波数領域のフィルタ1540、1640の詳細を示す。K個の量子化変換係数c1’,…,ck’から、個々のオフセットo1’,…,ok’(第1のオフセットに相当する。以下同じ。)が減算され、オフセット無しの変換係数c1”,…,ck”となる。好ましくは、オフセットo1’,…,ok’は、各量子化変換係数c1’,…,ck’の平均値E[c1’],…,E[ck’]に対応する。
各変換係数c1”,…,ck”は、その後、フィルタ1740でフィルタリングされ、K個の量子化変換係数c1”’,…,ck”’となる。なお、フィルタ1740は、各変換係数c1”,…,ck”それぞれに対応する独立したフィルタ1〜Kを含む。このフィルタ1〜Kには、各変換係数c1”,…,ck”それぞれに適応するフィルタ係数が個別に設定される。
フィルタリング後に、個々のオフセットo,…,o(第2のオフセットに相当する。以下同じ。)の各々がK個のフィルタリング済み変換係数c1”’,…,ck”’の各々に加算される。オフセットo,…,oは、好ましくは、原予測誤差信号sの変換係数c,…,cの平均値である。結果として得られた変換係数1741は、逆変換部1520、1620で逆変換される。逆変換部1520、1620からの出力信号e’は、フィルタリング済み量子化予測誤差値(残差)に対応する。
動画像符号化装置1500において、(M個のフィルタ係数によって得られる)M次のフィルタでK個の変換係数(k=l,…,K)をフィルタリングするフィルタ係数wl,k,…,wM,kが、例えば、ウィナーフィルタとして算出される。動画像復号装置1600が動画像符号化装置1500と同じフィルタリングを行えるようにする目的で、フィルタ情報1531は、オフセットo,…,oおよびフィルタ係数w1,k,…,wM,kを含む。
図22に示されるフィルタ処理は、復号信号を構成する複数のブロックそれぞれについて、処理対象ブロックの各周波数成分の値と、処理対象ブロックに時間的又は空間的に隣接するブロックの対応する周波数成分の値とを、フィルタ情報に含まれる重み係数を用いて重み付け加算するステップと、重み付け加算を実行する前の処理対象ブロックに対して、各周波数成分の値から第1のオフセット値を減算するステップと、重み付け加算した後の処理対象ブロックに対して、各周波数成分の値にフィルタ情報に含まれる第2のオフセット値を加算するステップとを含む。
なお、重み係数は、フィルタ処理が適用された後の周波数領域の処理対象ブロックと、周波数領域の動画像信号に含まれる処理対象ブロックに対応するブロックとの平均二乗誤差が最小になるように決定されている。また、第1のオフセット値は、周波数領域の復号信号に含まれるブロックのうち、処理対象ブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に算出される。さらに、第2のオフセット値は、周波数領域の動画像信号に含まれるブロックのうち、処理対象ブロックに対応するブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に算出されている。
より具体的には、フィルタ1540、1640は、量子化の行われるブロック単位の信号に対して適用される。すなわち、c1’,…,ck’は、量子化係数の各周波数成分の値(すなわち、k=64)に相当する。
フィルタ処理の第1の工程では、量子化係数の各周波数成分の値(c1’,…,ck’)から第1のオフセット値(o1’,…,ok’)を減算する。この第1のオフセット値(o1’,…,ok’)は、量子化係数の各周波数成分の値(c1’,…,ck’)を、時間的又は空間的に連続する複数のブロックから抽出して同一周波数成分毎に平均した値である。
次に、フィルタ処理の第2の工程では、第1のオフセット値(o1’,…,ok’)が減算された後の量子化係数(c1”,…,ck”)を逆量子化し、フィルタ1740を適用する。フィルタ1740は、周波数成分毎のフィルタ1〜Kで構成されており、それぞれにフィルタ係数w1,…,wkが提供される。また、フィルタ係数wkは、M(たとえば、M=9)個の重み係数w1,k,…,wM,kで構成される。この重み係数は、処理対象ブロックの各周波数成分の値と、処理対象ブロックに時間的又は空間的に隣接するブロックの対応する周波数成分の値とを、重み付け加算するのに使用される。
なお、この重み係数w1,k,…,wM,kは、フィルタ1740から出力されるフィルタリング済み変換係数(c1”’,…,ck”’)と、原予測誤差信号sの変換係数(c,…,c)から第2のオフセット値(o1,…,ok)が減算された値(c−o1,…,c−ok)との平均二乗誤差が最小となるように決定される。
次に、フィルタ処理の第3の工程では、フィルタリング済み変換係数(c1”’,…,ck”’)に第2のオフセット値(o1,…,ok)が加算される。この第2のオフセット値(o1,…,ok)は、原予測誤差信号sの変換係数(c,…,c)を、時間的又は空間的に連続する複数のブロックから抽出して同一周波数成分毎に平均した値である。
フィルタ係数を送信する代わりに、動画像復号装置1600で取得できないフィルタ係数取得に必要な情報を送信してもよい。そのような情報は、量子化前の入力変換係数c,…,cに関連する任意の情報であり、フィルタ係数w1,k,…,wM,kの算出に用いることができる。ウィナーフィルタ設計の場合、例えば、入力変換係数とフィルタリング済み変換係数との間の相互相関ベクトル、またはノイズの自己相関等が送信されてもよい。符号化動画像信号と共にオフセットo,…,oを提供することで、フィルタリング後の画質が向上する。しかしながら、オフセットo,…,oを提供せずに本発明を実施することも可能である。
この例において、M次のフィルタは、個々の変換係数のフィルタリングに用いられる個々の係数フィルタに対して等しい。しかしながら、異なる変換係数のフィルタリングに用いられるフィルタ次数が異なれば、利点となる場合がある。様々な変換係数に対する特定のフィルタ次数M,…,Mは、その後、固定される(デフォルトまたは動画像符号化装置/動画像復号装置に設定される)か、フィルタ情報と共に信号送信される。
(実施の形態2)
図23及び図24を参照して、本発明の実施の形態2に係る動画像符号化装置1800及び動画像復号装置1900を説明する。本発明の実施の形態2によれば、周波数領域のフィルタ設計およびフィルタリングは、再構築画像/動画像信号に対し動作するポストフィルタに適用される。図23および図24は、それぞれ、そのような動画像符号化装置1800および動画像復号装置1900を示す。なお、実施の形態1に係る動画像符号化装置1500及び動画像復号装置1600と共通する構成要素には同一の参照番号を付し、詳しい説明を省略する。
実施の形態2に係る符号化信号を生成する処理には、周波数領域の動画像信号を量子化し、逆量子化して再構築信号を生成する処理が含まれる。また、フィルタ情報は、周波数領域の動画像信号と、フィルタ処理が適用された後の周波数領域の再構築信号との平均二乗誤差が最小になるように決定される。
動画像符号化装置1800は、図23に示されるように、フィルタ設計部1530及びフィルタ1540を省略する代わりに、フィルタ設計部1830を備える点で図20Aに示される動画像符号化装置1500と相違する。
フィルタ設計部1830は、動画像復号装置1900のフィルタ1940で使用されるフィルタ情報1831を生成する。具体的には、入力信号と再構築信号とを取得し、それぞれを周波数領域に変換する。そして、周波数領域の入力信号と、フィルタ1940でフィルタ処理された後の周波数領域の再構築信号との平均二乗誤差が最小となるようにフィルタ情報1831を決定する。
動画像復号装置1900は、図24に示されるように、フィルタ1640を省略する代わりに、フィルタ1940を備える点で図6Aに示される動画像復号装置1600と相違する。
実施の形態2に係る符号化信号は、動画像信号から予測信号が減算され、空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られる。また、復号信号を生成する処理には、符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換し、予測信号を加算して復号信号としての再構築信号を生成する処理が含まれる。さらに、フィルタ処理には、再構築信号を空間領域から周波数領域に変換する処理と、周波数領域の再構築信号にフィルタ処理を適用する処理と、フィルタ処理を適用した後の再構築信号を周波数領域から空間領域に逆変換する処理とが含まれる。
フィルタ1940は、加算器225から出力される再構築信号を空間領域から周波数領域に変換し、周波数領域の信号に対してフィルタ情報1991を用いてフィルタ処理を適用し、フィルタ処理後の信号を周波数領域から空間領域に逆変換する。
動画像符号化装置1800内に実装された周波数領域のポストフィルタを設計するフィルタ設計部1830が、新たなポストフィルタ情報1831をエントロピー符号化部1890に提供する。ここで、新たなポストフィルタ情報1831は、フィルタ係数を直接含むか、動画像復号装置1900がポストフィルタ係数を算出できるようにする任意の他の情報を含んでもよい。
動画像符号化装置1800側において、ポストフィルタリングは予測ループで用いられないため、適用される必要はない。フィルタ設計部1830は、入力信号と再構築信号とに基づいて提供されるフィルタ係数、または他の関連情報を算出する。フィルタ係数は、例えば、ウィナーフィルタ係数として予測されてもよく、またはその代わりに、入力信号と再構築信号との間の相互相関、ノイズの自己相関、もしくはノイズと信号との間の相関といった統計的データとして提供されてもよい。
動画像復号装置1900において、符号化動画像データと共に動画像符号化装置1800により提供された新たなポストフィルタ情報1991は、エントロピー復号部1990によって復号される。フィルタ1940は、新たなポストフィルタ情報1991と再構築動画像信号とを取得することができ、かつ、フィルタを設定し、再構築信号をフィルタリングすることができる。
図25は、本発明のこの実施形態に用いられる周波数領域の例示的なフィルタ1940の詳細を示す。再構築信号s’が、変換部2010で周波数領域に変換される。好ましくは、予測誤差の符号化に、動画像符号化装置1800の変換/量子化部110における変換と同じ変換手法が用いられる。これにより、ソフトウェアおよび/またはハードウェアにおいて可能な実施態様を簡易化してもよい。しかしながら、動画像符号化装置1800による変換手法と異なる変換、例えば機能および/またはサイズに基づく変換もまた用いられてもよい。当該変換はまた、フィルタ設計部1830の一部として選択されてもよく、選択された変換は、符号化動画像データと共に動画像復号装置1900に提供されてもよい。当該選択は、予め定められた変換の組から実行されてもよく、または、変換マトリクス全体が決定され信号送信されてもよい。
変換部2010は、入力再構築信号s’をK個の変換係数c1’,…,ck’に変換する。K個の変換係数c1’,…,ck’から、個々のオフセットo1’,…,ok’(第1のオフセット値)が減算され、変換係数c1”,…,ck”となる。やはり、オフセットo1’,…,ok’は、好ましくは、対応する変換係数c1’,…,ck’を、時間的又は空間的に隣接する複数のブロックから抽出して平均した値である。
オフセットを減算した後の変換係数c1”,…,ck”の各々は、フィルタ2040でフィルタリングされ、K個のフィルタリング済み変換係数c1’”,…,ck’”となる。
K個のフィルタリング済み変換係数c1’”,…,ck’”の各々に対し、個々のオフセットo,…,o(第2のオフセット値)が加算される。オフセットo,…,oは、好ましくは、原入力信号sの変換係数c1,…,cを、時間的又は空間的に隣接する複数のブロックから抽出して平均した値に対応する。結果として得られた変換係数2041は、逆変換部2020で逆変換される。出力信号s”は、フィルタリング済み再構築画像を表す。
既に説明した本発明の実施の形態1と同様に、フィルタ係数w1,k,…,wM,kおよびオフセットo,…,oは、好ましくは、エントロピー符号化部1890でエントロピー符号化され、動画像符号化装置1800から動画像復号装置1900に提供される。さらに、変換部2010および/または逆変換部2020で適用される変換手法を信号で伝える変換情報が、動画像符号化装置1800から動画像復号装置1900に送信されてもよい。そのような変換情報は、予め定められた固定の組となっている実行可能な変換のうちの1つを指定するものであってもよい。または、変換および/または逆変換マトリクスが信号送信されてもよい。他の可能性として、受信した動画像データに基づいて変換を暗示的に決定すること等も実施されてもよい。動画像データという用語は、符号化済み量子化変換係数と共に送信される、動画像シーケンスを正しく復号するために必要な全てのシンタックス要素を指す。
(実施の形態3)
図26及び図27を参照して、本発明の実施の形態3に係る動画像符号化装置2100、2200を説明する。本発明の実施の形態3によれば、周波数領域のフィルタリングは、再構築動画像信号に適用される。図26および図27は、そのような動画像符号化装置2100、2200の例を示す。なお、実施の形態1に係る動画像符号化装置1500及び動画像復号装置1600と共通する構成要素には同一の参照番号を付し、詳しい説明を省略する。
特に、図26に示される動画像符号化装置2100は、デブロッキングフィルタ130の代わりにフィルタ及び設計部2140を備える点で図20Aに示される動画像符号化装置1500と相違する。フィルタ及び設計部2140は、フィルタ設計およびフィルタ処理を実行する。フィルタの係数は、入力動画像信号(所望の信号)と再構築動画像信号とに基づいて、周波数領域において算出される。その後、フィルタ情報2131が、符号化のためエントロピー符号化部2190に提供される。
図27に示される動画像符号化装置2200は、デブロッキングフィルタ130に加えて、その後に動作するフィルタ及び設計部2230を備える点で図20Aに示される動画像符号化装置2200と相違する。フィルタ及び設計部2230は、入力(所望の)動画像信号と、再構築かつデブロッキングされた動画像信号とに基づいて、周波数領域において算出されたフィルタ係数等のフィルタ情報2231を、エントロピー符号化部2290に提供する。
なお、図26及び図27に示されるフィルタ及び設計部2140、2230は、例えば、図23に示されるフィルタ設計部1830と同様の方法でフィルタ情報2131、2231を生成すると共に、図25に示されるような方式でフィルタ処理を実行する。但し、図27に示されるフィルタ及び設計部2230は、デブロッキングフィルタ130から出力される信号を取得する点で、加算器125から出力される信号を直接取得する図23及び図26の例と異なる。
周波数領域のループフィルタを備える動画像符号化装置2100、2200に対応する動画像復号装置は、基本的に、フィルタリングに用いられる動画像符号化装置2100、2200と類似の機能的ブロックを備える。フィルタ設計は、取得されたフィルタ情報および/または局所的に算出された情報に基づいて実行される。フィルタ設定後、再構築動画像信号は、周波数領域においてフィルタリングされる。
(実施の形態4)
図28〜図30を参照して、本発明の実施の形態4に係る動画像符号化装置2300及び動画像復号装置2400を説明する。本発明の実施の形態4によれば、予測信号と、量子化予測誤差信号と、再構築信号とが、フィルタリング(設計)のプロセスにおいて別々に考慮される。図28は、動画像符号化装置2300の機能ブロック図である。図29は、動画像復号装置2400の機能ブロック図である。図30は、実施の形態4に係るフィルタリングのプロセスの例を示す。なお、実施の形態1に係る動画像符号化装置1500及び動画像復号装置1600と共通する構成要素には同一の参照番号を付し、詳しい説明を省略する。
実施の形態4に係る符号化信号を生成する処理には、動画像信号から予測信号を減算して予測誤差信号を生成し、予測誤差信号を空間領域から周波数領域に変換し、量子化し、逆量子化し、周波数領域から空間領域に変換して量子化予測誤差信号を生成し、量子化予測誤差信号に予測信号を加算して再構築信号を生成する処理が含まれる。また、フィルタ情報は、周波数領域の予測信号、周波数領域の量子化予測誤差信号、及び周波数領域の再構築信号に基づいて、周波数領域の予測誤差信号と、フィルタ処理が適用された後の周波数領域の量子化予測誤差信号との平均二乗誤差が最小になるように決定される。
図28に示される動画像符号化装置2300は、入力(所望の)動画像信号、予測信号、量子化予測誤差信号、および復号(再構築かつデブロッキングされた)動画像信号に基づいて周波数領域のフィルタ情報2331を決定するフィルタ設計部2330を備える点で図20Aに示される動画像符号化装置1500と相違する。フィルタ情報2331は、エントロピー符号化部2390に提供される。
フィルタ設計部2330は、周波数領域の予測誤差信号と、フィルタ2440でフィルタ処理が適用された後の周波数領域の量子化予測誤差信号との平均二乗誤差が最小になるように、フィルタ情報2331を決定する。
図29に示される動画像復号装置2400は、動画像符号化装置2300に対応する動画像復号装置2400を示す。
エントロピー復号部2490は、フィルタ情報2491を復号し、それをフィルタ2440に提供する。フィルタ2440はポストフィルタを設定し、それを再構築信号に適用する。ここで、フィルタの設定はまた、特に、フィルタ係数の代わりに、フィルタ係数の算出に必要な情報が提供される場合に、動画像符号化装置2300側でのフィルタ設計部2330と類似のフィルタ設計も含んでもよい。
フィルタ設計部2440は、量子化予測誤差信号、予測信号、及び再構築信号を空間領域から周波数領域に変換する。そして、周波数領域に変換された各信号の互いに対応するブロックに含まれる同一周波数成分の値毎に、フィルタ情報2491を用いてフィルタ処理を適用する。
図30は、動画像復号装置2400のフィルタ2440の詳細を示す図である。
この例における符号化信号は、動画像信号から予測信号が減算されて予測誤差信号が生成され、当該予測誤差信号が空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られる。また、復号信号を生成する処理には、符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換して量子化予測誤差信号を生成し、量子化予測誤差信号と予測信号とを加算して再構築信号を生成する処理が含まれる。また、フィルタ処理は、復号信号としての量子化予測誤差信号、予測信号、及び再構築信号の互いに対応するブロックに含まれる同一周波数成分の値をフィルタ情報に含まれる重み係数を用いて重み付け加算するステップを含む。さらに、重み係数は、周波数領域の予測誤差信号と、フィルタ処理が適用された後の周波数領域の量子化予測誤差信号との平均二乗誤差が最小になるように決定される。
このフィルタ2440では、予測信号s^、量子化予測誤差信号e’、および再構築信号s’がフィルタリングにおいて別々に考慮される。
量子化予測誤差信号e’の変換係数c1,e’’,…,ck,e’’を、時間的又は空間的に隣接する複数のブロックから抽出して平均した値と、原予測誤差信号eの変換係数c,…,cを、時間的又は空間的に隣接する複数のブロックから抽出して平均した値とを調整する目的で、図22を参照して既に簡潔に説明したように、平均調整が行われる。
この目的のため、オフセットo1,e’’,…,ok,e’’が、ok,e’’=E[ck,e’’]として算出される。ただし、k=1,…,Kである。オフセットo,…,oが、o=E[c]として算出される。ただし、k=1,…,Kである。ここで算出とは、量子化予測誤差信号e’の平均と、原予測誤差信号eの平均とを、例えば複数の対応するサンプルに渡る平均として予測することを指す。
周波数領域の各変換係数に対するK個のフィルタ設計の最適化基準は、所望の信号c−o,…,c−oとの間の最小平均二乗誤差であり、この所望の信号は、オフセット信号o,…,o無しの原予測誤差信号eの変換係数、およびフィルタリング済み信号c1”’,…,ck”’に対応する。線形フィルタリングが、式28の通り実行される。
Figure 2010061607
ここで、w1,k,…,wM,kは、周波数領域のK個のフィルタのM・Kフィルタ係数であり、1つのM次フィルタ、つまり、各周波数成分に対しM個のフィルタ係数を有するフィルタである。そのような個別フィルタの各々は、例えば、図31Aおよび図31Bに示されるようなMブロックに置かれた同一周波数成分のM個の変換係数ck,m”に重み付けする。
特に、図31Aは、重複していない9個のブロックの配置を示し、当該ブロックの変換係数はフィルタリングに用いられる。しかしながら、ブロック間の相関がより高い可能性があるため、重複するブロックの変換係数を用いる方が利点となる場合がある。対称的に重複するブロックの配置が、図31Bに示される。しかしながら、当該ブロックは、領域のサイズが異なる分、非対称に重複してもよい。重複の方法は、例えば、ブロックの特性にしたがって選択してもよい。さらに、重複は、対象ブロックに対し単一画素(またはサブピクセル)単位で隣接ブロックをずらすことで最大化されてもよい。そのような場合は、フィルタリング済み信号が複数表示され、さらに任意に選択され、かつ/または所望のフィルタリング済み画像を取得するために組み合わされてもよい。
または、フィルタリングにより、時間軸において対象ブロックに隣接する同一周波数のブロック、つまり先行および/または後続フレームのブロックに対応する変換係数に重み付けしてもよい。そのような隣接ブロックの2つの例を、それぞれ図32Aおよび27Bに示す。
図32Aは、対象ブロック2701を含むフレーム2710を示す。時間的に対象ブロック2701に隣接するブロック2702は、フレーム2710に時間的に隣接するフレーム2720にある。他の時間的に隣接するフレームからの他の時間的に隣接するブロックは、M番目のフレーム2730内のM番目のブロック2703までのフィルタリングに考慮可能である。この例において、時間的に隣接するブロック2701、2702、…、2703は、動画像シーケンスの異なるフレーム内で同じ位置に位置する。
図32Bは、対象ブロック2751を有するフレーム2750、および対象ブロック2751に時間的に隣接するブロック2752を有するフレーム2760の他の例を示す。フレーム2750に隣接するフレーム2760内のブロック2752は、動き予測によって取得される。動きベクトル2780は、フレーム2760の最適なブロック2752がフレーム2750の対象ブロック2751となった動きを示す。よって、この例において、時間的に隣接するブロックは、動き予測、つまり隣接フレーム2760の対象ブロック2751に対する最適なブロック2752を見つけることによって取得されたブロックである。他の隣接フレーム(例えば、フレーム2770)のブロック(例えば、ブロック2753)は、対象ブロック2751に対する最適なブロックとして、または隣接フレーム2760内のブロック2752のような対象ブロックの他の隣接ブロックに対する最適なブロックとされてもよい。
図32Bに示されるように、フィルタリングに用いられる隣接ブロックを決定するために動き補償を適用することで、図32Aの例の統計よりも類似した統計を有する隣接ブロックの組が得られる。概して、フィルタリングに用いられる一時的に隣接するブロックは、必ずしも直接的に隣接したフレームにあるわけではない。例えば、遮蔽の場合、隣接フレームからのブロックは、フィルタリングに考慮する必要はない。さらに、M個の隣接ブロックは、既に符号化/復号されたフレームからだけではなく、対象ブロックを含むフレームの後続フレームからも選択されてよい。M個の隣接ブロックはまた、対象ブロックに時間的に隣接したブロックと空間的に隣接したブロックの両方から選択されてもよい。
所望の信号c−o,…,c−oと、フィルタリング済み信号c1”’,…,ck”’の間の平均二乗誤差を最小化するフィルタ係数wk,1,…,wk,Mは、式29のWiener−Hopf方程式の解により決定できる。
Figure 2010061607
フィルタ係数wk,1,…,wk,Mの計算には、Wiener−Hopf方程式における全ての期待される値(相関項)の知識を要する。同様に、動画像復号装置2400のフィルタ2440で用いられるフィルタ情報2491は、動画像符号化装置2300のフィルタ設計部2330で上記の方法で算出される。やはり、再構築信号s’の変換係数c1’,…,ck’ を、時間的又は空間的に隣接する複数のブロックから抽出して平均した値と、原入力信号sの変換係数c,…,cを、時間的又は空間的に隣接する複数のブロックから抽出して平均した値とは、ok’=E[ck’]に対応するオフセットo1’,…,ok’、およびo=E[c]に対応するオフセットo,…,oによって調整される。
ここで、k=1,…,Kである。所望の信号c−o,…,c−oと、フィルタリング済み信号c1”’,…,ck”’の間の平均二乗誤差を最小化することでフィルタ係数を取得すると、やはり、上記のようなWiener−Hopf方程式の方式になる。
動画像符号化装置2100、2200、2300および/または対応する動画像復号装置2400の各例に用いられるフィルタ設計の例を以下に示す。フィルタ設計の結果は、例えば、図30に示されるフィルタの設定に用いられてもよい。
ここで、予測信号s^、量子化予測誤差信号e’、および再構築信号s’が別々に考慮される。対応するオフセットo1,s’’,…,ok,s’’はok,s’’=E[ck,s’’]として算出され、オフセットo1,e’’,…,ok,e’’はok,e’’=E[ck,e’’]として算出され、オフセットo1,s^’,…,ok,s^’はok,s^’=E[ck,s^’]として算出され、オフセットo1,…,okはok=E[ck]として算出される。ここでk=1,…,Kである。
周波数領域のK個のフィルタの設計の最適化基準は、やはり、所望の信号c−o,…,c−oとフィルタリング済み信号c1”’,…,ck”’との間の最小平均二乗誤差である。線形フィルタリングは式30のように実行される。
Figure 2010061607
ここで、wk,s’,1,…,wk,s’,Mは、再構築信号に用いられるM・Kフィルタ係数であり、wk,s^,1,…,wk,s^,Nは、予測信号に用いられるN・Kフィルタ係数であり、wk,e’,1,…,wk,e’,Oは、量子化予測誤差信号に用いられるO・Kフィルタ係数である。パラメータM、N、およびOはフィルタの次数を表す。各フィルタは、M+N+Oブロックの同一周波数成分のM+N+O変換係数ck,s’,m”,ck,s^,n”,ck,e’,o”に重み付けする。
所望の信号c−o,…,c−oと、フィルタリング済み信号c1”’,…,ck”’の間の平均二乗誤差を最小化するフィルタ係数は、式31のWiener−Hopf方程式の方式により決定できる。
Figure 2010061607
ここで、[x]は、xとxの間の全ての相互相関項からなるサブマトリクスを表す。周波数領域におけるフィルタ設計および/またはフィルタリングは、選択された周波数のみに対して実行されてもよい。例えば、DC係数のみがフィルタリングされてもよい。または、例えば、最初のL個の係数の組がフィルタリングされてもよく、フィルタリング対象の係数が動画像の内容に基づいて決定されてもよい。特に、変換係数の値が、フィルタリングを適用すべきか否かを決定する目的で評価される。
これにより、例えば、フィルタリング対象の変換係数値が大幅に異なる場合に、フィルタリングを無効にする可能性が生じる。変換係数値は、好ましくは閾値との比較に基づいて評価される。例えば、対象ブロックの変換係数と、フィルタリングに用いられる他のブロックとの差分が算出され、それに基づいてフィルタリングが有効または無効にされる。
係数間の差分が閾値を超えれば、フィルタリングが無効にされる。超えなければ、フィルタリングが有効にされる。この決定は、または、分散等の、近隣ブロック内の変換係数の統計に基づいて行うことができる。フィルタリングに用いられる近隣ブロックにおける同一周波数の変換係数の分散が閾値を超えれば、フィルタリングが無効にされる。周波数成分毎の閾値は、量子化パラメータに基づいて設定されてもよく、固定されてもよく、符号化動画像データと共に信号送信されてもよい。
フィルタリングを無効にできることにより、フィルタリング対象のブロックの特性が実質的に異なる場合、例えば、高勾配がある場合(空間的に隣接するブロックのエッジ、時間的に隣接するブロックのシーン切り替え)に、フィルタリング済み信号の質が向上する場合がある。
上記の説明において、変換係数は、入力カラーフォーマットによって与えられたラスタにおいて垂直および水平にサンプリングされた通常の(典型的には使用済みの)マクロブロックを変換することで得られたものとして記載した。しかしながら、本発明は、フィルタ情報を決定すること、フィルタを設定すること、および、この方法で取得された変換係数をフィルタリングすることに限定されない。変換されるブロックはまた、例えば45度といった予め定められた角度に回転した後にサンプリングされてもよい。これは、ある特定の内容を有するブロックに有益であってもよい。サンプリングおよび変換は共に、必ずしも適用された動画像コードのサンプリングおよび変換に対応するとは限らない。
なお、図31A、図31B、図32A、及び図33を用いて説明した上記の方式は、実施の形態4のみならず、他の実施の形態1〜3、5におけるフィルタ設計及びフィルタ処理に応用できる。
(実施の形態5)
図33及び図34を参照して、本発明の実施の形態5に係る動画像符号化装置2800及び動画像復号装置2900を説明する。図33は、動画像符号化装置2800の機能ブロック図である。図34は、動画像復号装置200の機能ブロック図である。なお、実施の形態1に係る動画像符号化装置1500及び動画像復号装置1600と共通する構成要素には同一の参照番号を付し、詳しい説明を省略する。
図33に示される動画像符号化装置2800は、ループ内で周波数領域の予測信号のみをフィルタリングするフィルタ2880を備える点で図20Aに示される動画像符号化装置1500と相違する。
実施の形態5に係る符号化信号を生成する処理には、動画像信号から予測信号を減算して予測誤差信号を生成し、予測誤差信号を空間領域から周波数領域に変換し、量子化し、逆量子化し、周波数領域から空間領域に変換して量子化予測誤差信号を生成し、量子化予測誤差信号に予測信号を加算して再構築信号を生成する処理が含まれる。また、フィルタ情報は、周波数領域の動画像信号と、フィルタ処理が適用された後の周波数領域の予測信号との平均二乗誤差が最小になるように決定される。
フィルタ情報は、周波数領域の入力信号および予測信号に基づいてウィナーフィルタ係数として予測される。フィルタリング済みの予測信号は、その後、さらに変換/符号化部110、及びエントロピー符号化部2890に供給されると共に、デブロッキングフィルタ130の前に再構築に用いられる。フィルタ情報は、エントロピー符号化部2890によって符号化され、動画像復号装置2900側に提供される。
図34に示される動画像復号装置2900は、周波数領域の予測信号にフィルタ処理を適用するフィルタ2980を備える点で図21Aに示される動画像復号装置1600と相違する。
実施の形態5に係る符号化信号は、動画像信号から予測信号が減算され、空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られる。また復号信号を生成するステップには、符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換して量子化予測誤差信号を生成し、量子化予測誤差信号と予測信号とを加算して再構築信号を生成する処理が含まれる。さらに、フィルタ処理には、予測信号を空間領域から周波数領域に変換する処理と、周波数領域の予測信号にフィルタ処理を適用する処理と、フィルタ処理が適用された後の予測信号を周波数領域から空間領域に逆変換する処理とが含まれる。
エントロピー復号部2990は、フィルタ情報を復号し、それらを、予測信号のフィルタリングに用いるためフィルタ2980に送る。予測信号は、加算器225およびデブロッキングフィルタ230に用いられる前にフィルタリングされる。予測信号をそのようにフィルタリングすることにより、予測誤差を最小化でき、よって再構築動画像の画質を更に向上させることができる。
図35は、上記の各実施の形態に係る動画像符号化装置の例を詳細に示すブロック図である。異なる(空間的におよび/または時間的に隣接する)ブロックからの同一周波数の変換係数に重み付けすることでフィルタリングを適用する場合、これらの隣接ブロックを記憶する必要がある。フィルタリングが再構築動画像信号に適用される場合、再構築動画像信号はループ内でメモリ140、240に記憶されるため、追加的な記憶容量は必要ない。
しかしながら、フィルタ3030の場合、例えば、予測信号または予測誤差信号の対象ブロック3001、隣接ブロック3002の係数値が、メモリ3020に記憶されなければならない。フィルタリング済み信号は、その後、逆変換され、逆変換された信号3041となり、再構築に使用できる。この例の隣接ブロック3002は、既に符号化/復号された空間的に隣接するブロックである。しかしながら、概して、動画像シーケンス内の異なる位置にある任意の数のブロックが用いられてもよい。
図36は、フィルタ3130が無限インパルス応答(IIR)フィルタリングである他の例を示す。有限応答フィルタリング(FIR)とは異なり、IIRフィルタは、入力信号のサンプルだけではなく出力(フィルタリング済みの)信号のサンプルにも重み付けする。したがって、フィルタリング済み信号は、フィルタリング対象の信号に加えてメモリ3120に記憶されなければならない。上記例のほとんどはFIRフィルタリングに関するが、本発明はそれに限定されない。
FIRフィルタは概して設計しやすいが、周波数領域においてIIRフィルタリングの方が性能がよい場合がある。対象ブロック3101のフィルタリングに関わるブロックは概して、全て、既にフィルタリング済みの隣接ブロック3102である。図36は、4つの先行ブロックのみを示す。しかしながら、既にフィルタリング済みの信号に重み付けすることにより、理論的に、全ての既にフィルタリング済みのブロックがフィルタリング結果に貢献する。各ブロックの貢献度は、対象ブロック3101からの距離(隣接ブロックの選択により、空間的および/または時間的距離)と共に減少する。
なお、図35及び図36を用いて説明した上記の方式は、実施の形態5のみならず、他の実施の形態1〜4におけるフィルタ設計及びフィルタ処理に応用できる。
本発明の上記実施形態は、適用されるフィルタの適応性に関して制限されるものではない。動画像符号化装置1300および/または動画像復号装置1400で採用されたフィルタは、動画像シーケンス毎に、または数個の動画像シーケンスに1回ずつ設計されてもよい。しかしながら、現在の統計にフィルタ設計を適用させると、通常、画質が向上する。フィルタ設計は、例えば、グループオブピクチャ単位、画像単位、スライスもしくはマクロブロック単位、ブロックもしくはそのような画像要素の数個単位で定期的に実行されてもよい。それに対応して、フィルタ情報が同じ規則性で提供(信号送信)されてもよい。
しかしながら、フィルタ設計の実行よりも低い頻度でフィルタ情報を提供すると利点となる場合がある。特に、所望の信号とフィルタリング済み信号との間の相互相関、またはノイズの自己相関といった、フィルタ係数を算出するための情報が提供された場合、この情報は、フィルタ係数が実際に算出されるよりも低い頻度で送信されてもよい。フィルタ情報は更新されないが、復号動画像変換係数および/または動画像信号から取得可能な、フィルタ係数の算出に必要な追加的情報がリフレッシュされる。
フィルタ設計および/またはフィルタ情報の信号送信はまた、不定期に、例えば動画像信号の統計が大幅に変化したときに実行されてもよい。フィルタの局所適応は、欧州出願第08015661.5号に開示の方法と類似の方法で達成されてもよい。当該出願をここに引用し、援用する。さらに、量子化パラメータおよび/または量子化マトリクス値といった量子化設定は、特定の周波数成分に対するフィルタ係数の決定に用いられてもよい。
適応的フィルタ、フィルタ情報、例えばフィルタ係数の場合は、(エントロピー)符号化され、補助情報として動画像復号装置に提供される。H.264/MPEG−4AVC符号化方式またはその将来の拡張版および後続規格のコンテキストにおいて、フィルタ情報は好ましくは、ピクチャパラメータセット(PPS)NALユニット、またはシーケンスパラメータセット(SPS)NALユニットのスライスヘッダ内に送信される。適応的ポストフィルタ方式では、ポストフィルタ情報はまた、SEI(補助強化情報)として動画像復号装置に送信することができる。
量子化予測誤差がフィルタリングのプロセスにおいて(つまり、フィルタ設計および/またはフィルタリングのために)考慮されるとき、その量子化予測誤差は変換領域において既に利用可能であることから、必ずしも図30に示されるように別々に変換される必要はない。しかしながら、動画像符号化装置によって使用される変換/量子化部110、及び逆量子化/逆変換部120に関わらず、他の変換手法が選択されてもよい。そのような変換および/または逆変換は、動画像符号化装置で決定され、符号化され、動画像復号装置に提供されてもよい。
さらに、フィルタリングのプロセス(少なくともフィルタの設計および適用のうちの1つ)における変換に用いられるブロックグリッドは、必ずしも変換/量子化部110といった符号化ステップの内の1つにおけるブロックグリッドと同じである必要はない。フィルタリングのプロセスに用いられるブロックグリッドは、例えば、1つまたは2つのピクチャ要素(例えば画素)単位で、左、右、上およびまたは下にずらしてもよい。他のずらし方も可能である。フィルタ設計およびフィルタ適用に用いられるブロックは、必ずしも、符号化に用いられるブロックと同じサイズである必要はない。
適用された変換の数は、完全なものを超えてもよい。これは、変換を重複して用いることにより、空間領域のピクチャ要素よりも多くの係数が変換領域において生成されてもよいことを意味する。これにより、各ピクチャ要素(例えば画素値)に対して2つ以上のフィルタリング済みの表現が得られるであろう。これらは、最終的なフィルタリング済みの表現を得るために重み付けされてもよい。この重み付けはまた、適応的でもよく、符号化され、動画像復号装置に提供されてもよい。
上記動画像符号化装置の例に適用されたエントロピー符号化部は、必ずしも同じではない。好ましくは、フィルタ情報のエントロピー符号化は、より高い符号化効率を達成するために当該フィルタ情報の統計に適応されてもよい。
本発明の実施形態の例は、ウィナーフィルタ設計に焦点をおいて説明した。これは、ウィナーフィルタは、最初の2つの統計モーメントの知識に基づいて容易に算出できるからである。しかしながら、例えばより高次の統計(例えば、最大尤度推定)も考慮できるか、または平均二乗誤差以外の他の基準や測定基準を最適化できる他のフィルタ設計もまた適用してもよい。
図37は、本発明による、動画像符号化装置3201側から動画像復号装置3203側へ動画像信号を送信するシステムを説明する図である。入力画像信号は、動画像符号化装置3201によって符号化され、チャネル3202へ提供される。上述したように、動画像符号化装置3201は、本発明の任意の実施形態に係る動画像符号化装置である。
図37に示される動画像符号化装置3201は、少なくとも、動画像信号を空間領域から周波数領域に変換し、量子化して、符号化信号を生成する符号化部と、量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するフィルタ設計部と、符号化信号及びフィルタ情報を出力する出力部とを備える。なお、フィルタ情報は、周波数領域の動画像信号と、フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される。
一方、図37に示される動画像復号装置3203は、符号化信号及びフィルタ処理を特定するフィルタ情報を取得する取得部と、符号化信号を復号して復号信号を生成する復号部と、動画像信号を符号化する過程で重畳されたノイズを、周波数領域の復号信号の周波数成分毎に除去するフィルタ処理を、フィルタ情報を用いて周波数領域の復号信号に適用するフィルタ部とを備える。なお、フィルタ情報は、周波数領域の動画像信号と、フィルタ処理が適用された後の周波数領域の復号信号との平均二乗誤差を最小にするための情報を含む。
チャネル3202は、格納手段か伝送チャネルである。格納手段は、例えば、任意の揮発性または非揮発性メモリや、任意の磁気または光学媒体や、大容量格納手段などである。任意の伝送システムや、無線あるいは配線または固定的あるいは移動可能な、xDSL、ISDN、WLAN、GPRS、UMTS、Internetのようなものや、標準化または特許化されたシステムの物理的リソースによって、伝送チャネルを形成してもよい。
動画像符号化装置3201側は、動画像信号の符号化以外にも、チャネル3202を通して符号化動画像信号を伝送するフォーマットコンバータおよび/またはトランスミッタなどによる入力動画像信号の前処理や、符号化動画像信号を記録媒体に送信するためのアプリケーションを含んでもよい。符号化動画像信号は、チャネル3202を通じて動画像復号装置3203によって取得される。上述したように、動画像復号装置3203は、本発明の実施形態に係る動画像復号装置である。動画像復号装置3203は、符号化動画像信号を復号する。動画像復号装置3203側は、動画像信号の復号以外に、さらに、チャネル3202からの符号化動画像信号または格納手段からの符号化動画像データを抽出するためのアプリケーションを受信するレシーバと、さらに/または、フォーマット変換など復号動画像信号の後処理をおこなう後処理手段を備えてもよい。
本発明の他の実施形態は、ハードウェアおよびソフトウェアを用いる、上述のさまざまな実施形態の実施態様に関連するものである。本発明のさまざまな実施形態は、演算装置(プロセッサ)を用いて実現され実施されると分かる。演算装置またはプロセッサは、例えば、汎用プロセッサ、デジタル信号プロセッサ(DSP)、アプリケーション用集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または、プログラマブルロジックデバイスなどであってもよい。本発明のさまざまな実施形態は、それらの装置を組み合わせて実施または具現化されてもよい。
さらに、本発明のさまざまな実施形態を、プロセッサまたはハードウェア内で直接的に実行されるソフトウェアモジュールを用いて実現してもよい。ソフトウェアモジュールとハードウェアの実施態様を組み合わせることも可能であろう。例えばRAM、EPROM、EEPROM、フラッシュメモリ、レジスタ、ハードディスク、CD‐ROM、DVDなど、任意の種類のコンピュータで読み取り可能な記憶媒体にソフトウェアモジュールを格納してもよい。
H.264/AVCに基づく動画像符号化システムに関連して上述の例の大半を概要説明した。用語は、主として、H.264/AVCの用語に関連したものである。しかしながら、H.264/AVCに基づく符号化に対するさまざまな実施形態の用語および記述は、本発明の原理および考えを、当該システムに限定することを意図しない。H.264/AVC標準規格に準拠した符号化および復号に関する詳細な説明は、ここで説明した例示的な実施形態についての理解を深めることを意図しており、動画像符号化におけるプロセスおよび機能を、説明した特定の実施態様に本発明が限定されるように理解されるべきではない。一方、ここで提案した改良策は、動画像符号化において容易に応用可能であろう。さらに、本発明のコンセプトは、JVTによって現在討議されているH.264/AVCの拡張符号化においても容易に利用可能であろう。
図38は、本発明によって達成できる利点の例を示すグラフである。このグラフは、空間解像度が1920×1080画素、かつフレームレートが毎秒24フレームのYUV4:2:0の色空間におけるMPEGテストシーケンス「Dinner」の符号化に必要なビットレートに対するY−PSNR(輝度成分Yのピーク信号対ノイズ比)を示す。本発明の符号化方式が、ポストフィルタ無しのH.264/MPEG−4AVCと、欧州出願第08012036.3号による、分離できない2次元ウィナーポストフィルタで拡張されたH.264/MPEG−4AVCと比較される。実験は量子化重み行列(Qマトリクス)を用いて行われた。イントラ符号化および4×4変換が適用された。
要約すると、本発明による動画像の符号化および復号は、周波数領域におけるフィルタ設計およびフィルタリングを採用し、対応するフィルタを設定するためのフィルタ情報を動画像符号化装置側から動画像復号装置側に提供可能にする。周波数領域においてフィルタリングを行うことは、周波数領域にノイズも挿入された場合に、例えば、変換動画像信号の量子化に基づく動画像符号化において、特に利点をもたらす。
(実施の形態6)
次に、上記ノイズ除去フィルタの効率を向上させる目的で、図39A及び図39Bに示すような拡張アルゴリズムのフローを提案する。図9A及び図9Bのアルゴリズムフローとの違いは、係数ci,k^へのウィナーフィルタ演算である。ウィナーフィルタリングの結果、係数ci,k となる。これらは、重み付き逆変換の計算に用いられる。ウィナーフィルタ演算は、式32に示されるような線形フィルタである。ここで、記号「(チルダ)」は、それぞれ直前の文字の上に付される記号を示し、本明細書では、以下、記号「(チルダ)」を同様な意味で使用する。
Figure 2010061607
上記式32によると、係数ci,k (j)は、係数予測値ci,k^(j)の線形結合の結果である。フィルタ長はLである。オフセットo(j)を付加可能である。係数ci,k (j)はL個の係数予測値ci,k^(j)の重み付け和である。それぞれの係数予測値ci,k^(j)は現在ブロックまたは現在ブロックに隣接するブロックの係数であり(図31A参照)、周波数領域への変換により得られる係数である。隣接するブロックは現在ブロックにオーバーラップしてもよい(図31B参照)。係数al,k(j)およびオフセットo(j)は、好ましくは、k=0,…,2によって示されるノイズ除去ループの各々に対して個別のものである。
係数al,k(j)およびオフセットo(j)は、元の係数c(j)とフィルタ済み係数ci,k (j)との間の平均二乗誤差を最小化することで、動画像符号化装置側で予測される。係数a1,k(j)およびオフセットo(j)は、符号化され、動画像復号装置側に送信される。
係数の符号化は、好ましくは、下記の方法で予測符号化を用いて行われる。k=1,2のとき係数a1,k(j)の各々はa1,k-1(j)によって予測される。差分a1,k(j)−a1,k-1(j)のみが符号化され送信される。この符号化は固定長符号または可変長符号によって実行されてもよい。
k=1,2のときオフセットok(j)の各々はok-1(j)によって予測される。差分ok(j)−ok-1(j)のみが符号化され送信される。この符号化は固定長符号または可変長符号によって実行されてもよい。
このノイズ除去フィルタをウィナーフィルタと組み合わせて、ポストフィルタとして用いることも可能であるが、符号化/復号ループ内では適用されない。この場合、補助的拡張情報(SEI)メッセージを用いてウィナーフィルタ係数を送信することが好ましい。
図40A及び図40Bは、その他の拡張アルゴリズムのフローを示す。図39A及び図39Bに示されるフローとの違いは、ウィナーフィルタの入力信号は1つだけではなく、2つの異なる入力信号があることである。第1の入力信号は、係数ノイズ除去演算前の係数f1,k-1,・・・,fL,k-1であり、第2の入力信号は、ノイズ除去演算後の係数c1,k^,・・・,cL,k^である。ウィナーフィルタリングの結果は、式33の通りである。
Figure 2010061607
ウィナーフィルタリングへの個々の入力として2つの異なる信号f1,k-1,・・・,fL,k-1およびc1,k^,・・・,cL,k^を用いることで、信号c1,k^,・・・,cL,k^のみを用いる場合と比べて、平均二乗誤差をより小さくすることができる。この理由は、両信号は原画信号のノイズを表現したものであるが、ノイズは両信号で異なるからである。上記式33は、3つのウィナーフィルタと1つのオフセットがつなぎ合わされた構成をも包含する。ノイズの表現(f1,k-1,・・・,fL,k-1またはc1,k^,・・・,cL,k^)は、各々、ウィナーフィルタリングされる。2つの結果も、やはりウィナーフィルタリングされる。その結果に対し、オフセットが付加される。係数a1,k(j)およびb1,k(j)が符号化され送信される。さらに、オフセットo(j)が符号化され送信される。この符号化ステップに関し、上記に説明したようなステップkの係数とステップk−1の係数の間の予測が、a1,k(j)、b1,k(j)、およびo(j)に適用可能である。
図41A及び図41Bは、その他の拡張アルゴリズムのフローを示す。この場合、係数がまず線形ウィナーフィルタによってフィルタリングされる。その結果得られたフィルタリング済み係数は、さらに非線形ノイズ除去フィルタによってノイズ除去される。
なお、実施の形態6に係る処理は、実施の形態1〜5に係る動画像符号化装置及び動画像復号装置に適用することができる。
(実施の形態7)
上記実施の形態で示した画像符号化方法または画像復号方法の構成を実現するためのプログラムを記憶メディアに記録することにより、上記実施の形態で示した処理を独立したコンピュータシステムにおいて簡単に実施することが可能となる。記憶メディアは、磁気ディスク、光ディスク、光磁気ディスク、ICカード、半導体メモリ等、プログラムを記録できるものであればよい。
さらにここで、上記実施の形態で示した画像符号化方法および画像復号方法の応用例とそれを用いたシステムを説明する。
図42は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex106〜ex110が設置されている。
このコンテンツ供給システムex100は、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および、基地局ex106〜ex110を介して、コンピュータex111、PDA(Personal Digital Assistant)ex112、カメラex113、携帯電話ex114、ゲーム機ex115などの各機器が接続される。
しかし、コンテンツ供給システムex100は図42のような構成に限定されず、いずれかの要素を組み合わせて接続するようにしてもよい。また、固定無線局である基地局ex106〜ex110を介さずに、各機器が電話網ex104に直接接続されてもよい。また、各機器が近距離無線等を介して直接相互に接続されていてもよい。
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器であり、カメラex116はデジタルカメラ等の静止画撮影、動画撮影が可能な機器である。また、携帯電話ex114は、GSM(Global System for Mobile Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband−Code Division Multiple Access)方式、もしくはLTE(Long Term Evolution)方式、HSPA(High Speed Packet Access)の携帯電話機、または、PHS(Personal Handyphone System)等であり、いずれでも構わない。
コンテンツ供給システムex100では、カメラex113等が基地局ex109、電話網ex104を通じてストリーミングサーバex103に接続されることで、ライブ配信等が可能になる。ライブ配信では、ユーザがカメラex113を用いて撮影するコンテンツ(例えば、音楽ライブの映像等)に対して上記実施の形態で説明したように符号化処理を行い、ストリーミングサーバex103に送信する。一方、ストリーミングサーバex103は要求のあったクライアントに対して送信されたコンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114、ゲーム機ex115等がある。配信されたデータを受信した各機器では、受信したデータを復号処理して再生する。
なお、撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするストリーミングサーバex103で行ってもよいし、互いに分担して行ってもよい。同様に配信されたデータの復号処理はクライアントで行っても、ストリーミングサーバex103で行ってもよいし、互いに分担して行ってもよい。また、カメラex113に限らず、カメラex116で撮影した静止画像および/または動画像データを、コンピュータex111を介してストリーミングサーバex103に送信してもよい。この場合の符号化処理はカメラex116、コンピュータex111、ストリーミングサーバex103のいずれで行ってもよいし、互いに分担して行ってもよい。
また、これら符号化処理および復号処理は、一般的にコンピュータex111および各機器が有するLSI(Large Scale Integration)ex500において処理する。LSIex500は、ワンチップであっても複数チップからなる構成であってもよい。なお、画像符号化用および画像復号用のソフトウェアをコンピュータex111等で読み取り可能な何らかの記録メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込み、そのソフトウェアを用いて符号化処理および復号処理を行ってもよい。さらに、携帯電話ex114がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データは携帯電話ex114が有するLSIex500で符号化処理されたデータである。
また、ストリーミングサーバex103は複数のサーバまたは複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。
以上のようにして、コンテンツ供給システムex100では、符号化されたデータをクライアントが受信して再生することができる。このようにコンテンツ供給システムex100では、ユーザが送信した情報をリアルタイムでクライアントが受信して復号し、再生することができ、特別な権利または設備を有さないユーザでも個人放送を実現できる。
このコンテンツ供給システムを構成する各機器の符号化、復号には上記実施の形態で示した画像符号化方法あるいは画像復号方法を用いるようにすればよい。
その一例として携帯電話ex114について説明する。
図43は、上記実施の形態で説明した画像符号化方法と画像復号方法を用いた携帯電話ex114を示す図である。携帯電話ex114は、基地局ex110との間で電波を送受信するためのアンテナex601、CCDカメラ等の映像、静止画を撮ることが可能なカメラ部ex603、カメラ部ex603で撮影した映像、アンテナex601で受信した映像等が復号されたデータを表示する液晶ディスプレイ等の表示部ex602、操作キーex604群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ex608、音声入力をするためのマイク等の音声入力部ex605、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号されたデータを保存するための記録メディアex607、携帯電話ex114に記録メディアex607を装着可能とするためのスロット部ex606を有している。記録メディアex607はSDカード等のプラスチックケース内に電気的に書換えおよび消去が可能な不揮発性メモリであるEEPROMの一種であるフラッシュメモリ素子を格納したものである。
さらに、携帯電話ex114について図44を用いて説明する。携帯電話ex114は表示部ex602および操作キーex604を備えた本体部の各部を統括的に制御するようになされた主制御部ex711に対して、電源回路部ex710、操作入力制御部ex704、画像符号化部ex712、カメラインターフェース部ex703、LCD(Liquid Crystal Display)制御部ex702、画像復号部ex709、多重分離部ex708、記録再生部ex707、変復調回路部ex706および音声処理部ex705が同期バスex713を介して互いに接続されている。
電源回路部ex710は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付デジタル携帯電話ex114を動作可能な状態に起動する。
携帯電話ex114は、CPU、ROMおよびRAM等でなる主制御部ex711の制御に基づいて、音声通話モード時に音声入力部ex605で集音した音声信号を音声処理部ex705によってデジタル音声データに変換し、これを変復調回路部ex706でスペクトラム拡散処理し、送受信回路部ex701でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex601を介して送信する。また携帯電話ex114は、音声通話モード時にアンテナex601で受信した受信データを増幅して周波数変換処理およびアナログデジタル変換処理を施し、変復調回路部ex706でスペクトラム逆拡散処理し、音声処理部ex705によってアナログ音声データに変換した後、音声出力部ex608を介してこれを出力する。
さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーex604の操作によって入力された電子メールのテキストデータは操作入力制御部ex704を介して主制御部ex711に送出される。主制御部ex711は、テキストデータを変復調回路部ex706でスペクトラム拡散処理し、送受信回路部ex701でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex601を介して基地局ex110へ送信する。
データ通信モード時に画像データを送信する場合、カメラ部ex603で撮像された画像データを、カメラインターフェース部ex703を介して画像符号化部ex712に供給する。また、画像データを送信しない場合には、カメラ部ex603で撮像した画像データをカメラインターフェース部ex703およびLCD制御部ex702を介して表示部ex602に直接表示することも可能である。
画像符号化部ex712は、本願発明で説明した画像符号化装置を備えた構成であり、カメラ部ex603から供給された画像データを上記実施の形態で示した画像符号化装置に用いた符号化方法によって圧縮符号化することにより符号化画像データに変換し、これを多重分離部ex708に送出する。また、このとき同時に携帯電話ex114は、カメラ部ex603で撮像中に音声入力部ex605で集音した音声を、音声処理部ex705を介してデジタルの音声データとして多重分離部ex708に送出する。
多重分離部ex708は、画像符号化部ex712から供給された符号化画像データと音声処理部ex705から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ex706でスペクトラム拡散処理し、送受信回路部ex701でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex601を介して送信する。
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナex601を介して基地局ex110から受信した受信データを変復調回路部ex706でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ex708に送出する。
また、アンテナex601を介して受信された多重化データを復号するには、多重分離部ex708は、多重化データを分離することにより画像データのビットストリームと音声データのビットストリームとに分け、同期バスex713を介して当該符号化画像データを画像復号部ex709に供給すると共に当該音声データを音声処理部ex705に供給する。
次に、画像復号部ex709は、本願で説明した画像復号装置を備えた構成であり、画像データのビットストリームを上記実施の形態で示した符号化方法に対応した復号方法で復号することにより再生動画像データを生成し、これを、LCD制御部ex702を介して表示部ex602に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部ex705は、音声データをアナログ音声データに変換した後、これを音声出力部ex608に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる音声データが再生される。
なお、上記システムの例に限られず、最近は衛星、地上波によるデジタル放送が話題となっており、図45に示すようにデジタル放送用システムにも上記実施の形態の少なくとも画像符号化装置または画像復号装置を組み込むことができる。具体的には、放送局ex201では音声データ、映像データまたはそれらのデータが多重化されたビットストリームが電波を介して通信または放送衛星ex202に伝送される。これを受けた放送衛星ex202は、放送用の電波を発信し、衛星放送受信設備をもつ家庭のアンテナex204はこの電波を受信し、テレビ(受信機)ex300またはセットトップボックス(STB)ex217などの装置はビットストリームを復号してこれを再生する。また、記録媒体であるCDおよびDVD等の記録メディアex215、ex216に記録した画像データと、音声データが多重化されたビットストリームを読み取り、復号するリーダ/レコーダex218にも上記実施の形態で示した画像復号装置を実装することが可能である。この場合、再生された映像信号はモニタex219に表示される。また、ケーブルテレビ用のケーブルex203または衛星/地上波放送のアンテナex204に接続されたセットトップボックスex217内に画像復号装置を実装し、これをテレビのモニタex219で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に画像復号装置を組み込んでも良い。また、アンテナex205を有する車ex210で、衛星ex202または基地局等から信号を受信し、車ex210が有するカーナビゲーションex211等の表示装置に動画を再生することも可能である。
また、DVD、BD等の記録メディアex215に記録した音声データ、映像データまたはそれらのデータが多重化された符号化ビットストリームを読み取り復号する、または、記録メディアex215に、音声データ、映像データまたはそれらのデータを符号化し、多重化データとして記録するリーダ/レコーダex218にも上記実施の形態で示した画像復号装置または画像符号化装置を実装することが可能である。この場合、再生された映像信号はモニタex219に表示される。また、符号化ビットストリームが記録された記録メディアex215により、他の装置およびシステム等は、映像信号を再生することができる。例えば、他の再生装置ex212は、符号化ビットストリームがコピーされた記録メディアex214を用いて、モニタex213に映像信号を再生することができる。
また、ケーブルテレビ用のケーブルex203または衛星/地上波放送のアンテナex204に接続されたセットトップボックスex217内に画像復号装置を実装し、これをテレビのモニタex219で表示してもよい。このときセットトップボックスではなく、テレビ内に画像復号装置を組み込んでもよい。
図46は、上記実施の形態で説明した画像復号方法および画像符号化方法を用いたテレビ(受信機)ex300を示す図である。テレビex300は、上記放送を受信するアンテナex204またはケーブルex203等を介して映像情報のビットストリームを取得、または、出力するチューナex301と、受信した符号化データを復調する、または、生成された符号化データを外部に送信するために変調する変調/復調部ex302と、復調した映像データと音声データとを分離する、または、符号化された映像データと音声データとを多重化する多重/分離部ex303を備える。また、テレビex300は、音声データ、映像データそれぞれを復号する、または、それぞれの情報を符号化する音声信号処理部ex304、映像信号処理部ex305を有する信号処理部ex306と、復号された音声信号を出力するスピーカex307、復号された映像信号を表示するディスプレイ等の表示部ex308を有する出力部ex309とを有する。さらに、テレビex300は、ユーザ操作の入力を受け付ける操作入力部ex312等を有するインターフェース部ex317を有する。さらに、テレビex300は、各部を統括的に制御する制御部ex310、各部に電力を供給する電源回路部ex311を有する。インターフェース部ex317は、操作入力部ex312以外に、リーダ/レコーダex218等の外部機器と接続されるブリッジex313、SDカード等の記録メディアex216を装着可能とするためのスロット部ex314、ハードディスク等の外部記録メディアと接続するためのドライバex315、電話網と接続するモデムex316等を有していてもよい。なお記録メディアex216は、格納する不揮発性/揮発性の半導体メモリ素子により電気的に情報の記録を可能としたものである。テレビex300の各部は同期バスを介して互いに接続されている。
まず、テレビex300がアンテナex204等により外部から取得したデータを復号し、再生する構成について説明する。テレビex300は、リモートコントローラex220等からのユーザ操作を受け、CPU等を有する制御部ex310の制御に基づいて、変調/復調部ex302で復調した映像データ、音声データを多重/分離部ex303で分離する。さらにテレビex300は、分離した音声データを音声信号処理部ex304で復号し、分離した映像データを映像信号処理部ex305で上記実施の形態で説明した復号方法を用いて復号する。復号した音声信号、映像信号は、それぞれ出力部ex309から外部に向けて出力される。出力する際には、音声信号と映像信号が同期して再生するよう、バッファex318、ex319等に一旦これらの信号を蓄積するとよい。また、テレビex300は、放送等からではなく、磁気/光ディスク、SDカード等の記録メディアex215、ex216から符号化された符号化ビットストリームを読み出してもよい。次に、テレビex300が音声信号および映像信号を符号化し、外部に送信または記録メディア等に書き込む構成について説明する。テレビex300は、リモートコントローラex220等からのユーザ操作を受け、制御部ex310の制御に基づいて、音声信号処理部ex304で音声信号を符号化し、映像信号処理部ex305で映像信号を上記実施の形態で説明した符号化方法を用いて符号化する。符号化した音声信号、映像信号は多重/分離部ex303で多重化され外部に出力される。多重化する際には、音声信号と映像信号が同期するように、バッファex320、ex321等に一旦これらの信号を蓄積するとよい。なお、バッファex318〜ex321は図示しているように複数備えていてもよいし、一つ以上のバッファを共有する構成であってもよい。さらに、図示している以外に、例えば変調/復調部ex302と多重/分離部ex303との間等でもシステムのオーバフローおよびアンダーフローを避ける緩衝材としてバッファにデータを蓄積することとしてもよい。
また、テレビex300は、放送および記録メディア等から音声データおよび映像データを取得する以外に、マイクおよびカメラのAV入力を受け付ける構成を備え、それらから取得したデータに対して符号化処理を行ってもよい。なお、ここではテレビex300は、上記の符号化処理、多重化、および、外部出力ができる構成として説明したが、これらのすべての処理を行うことはできず、上記受信、復号処理、および、外部出力のうちいずれかのみが可能な構成であってもよい。
また、リーダ/レコーダex218で記録メディアから符号化ビットストリームを読み出す、または、書き込む場合には、上記復号処理または符号化処理はテレビex300およびリーダ/レコーダex218のうちいずれかで行ってもよいし、テレビex300とリーダ/レコーダex218とが互いに分担して行ってもよい。
一例として、光ディスクからデータの読み込みまたは書き込みをする場合の情報再生/記録部ex400の構成を図47に示す。情報再生/記録部ex400は、以下に説明する要素ex401〜ex407を備える。光ヘッドex401は、光ディスクである記録メディアex215の記録面にレーザスポットを照射して情報を書き込み、記録メディアex215の記録面からの反射光を検出して情報を読み込む。変調記録部ex402は、光ヘッドex401に内蔵された半導体レーザを電気的に駆動し記録データに応じてレーザ光の変調を行う。再生復調部ex403は、光ヘッドex401に内蔵されたフォトディテクタにより記録面からの反射光を電気的に検出した再生信号を増幅し、記録メディアex215に記録された信号成分を分離して復調し、必要な情報を再生する。バッファex404は、記録メディアex215に記録するための情報および記録メディアex215から再生した情報を一時的に保持する。ディスクモータex405は記録メディアex215を回転させる。サーボ制御部ex406は、ディスクモータex405の回転駆動を制御しながら光ヘッドex401を所定の情報トラックに移動させ、レーザスポットの追従処理を行う。システム制御部ex407は、情報再生/記録部ex400全体の制御を行う。上記の読み出しおよび書き込みの処理は、システム制御部ex407が、バッファex404に保持された各種情報を利用し、また必要に応じて新たな情報の生成および追加を行うと共に、変調記録部ex402、再生復調部ex403およびサーボ制御部ex406を協調動作させながら、光ヘッドex401を通して、情報の記録再生を行うことにより実現される。システム制御部ex407は、例えばマイクロプロセッサで構成され、読み出し書き込みのプログラムを実行することでそれらの処理を実行する。
以上では、光ヘッドex401はレーザスポットを照射するとして説明したが、近接場光を用いてより高密度な記録を行う構成であってもよい。
図48に光ディスクである記録メディアex215の模式図を示す。記録メディアex215の記録面には案内溝(グルーブ)がスパイラル状に形成され、情報トラックex230には、あらかじめグルーブの形状の変化によってディスク上の絶対位置を示す番地情報が記録されている。この番地情報はデータを記録する単位である記録ブロックex231の位置を特定するための情報を含み、記録および再生を行う装置は、情報トラックex230を再生し番地情報を読み取ることで記録ブロックを特定することができる。また、記録メディアex215は、データ記録領域ex233、内周領域ex232、外周領域ex234を含んでいる。ユーザデータを記録するために用いる領域がデータ記録領域ex233であり、データ記録領域ex233の内周または外周に配置されている内周領域ex232と外周領域ex234は、ユーザデータの記録以外の特定用途に用いられる。情報再生/記録部ex400は、このような記録メディアex215のデータ記録領域ex233に対して、符号化された音声データ、映像データまたはそれらのデータを多重化した符号化データの読み書きを行う。
以上では、1層のDVD、BD等の光ディスクを例に挙げ説明したが、これらに限ったものではなく、多層構造であって表面以外にも記録可能な光ディスクであってもよい。また、ディスクの同じ場所にさまざまな異なる波長の色の光を用いて情報を記録したり、さまざまな角度から異なる情報の層を記録したりするなど、多次元的な記録/再生を行う構造の光ディスクであってもよい。
また、デジタル放送用システムex200において、アンテナex205を有する車ex210で衛星ex202等からデータを受信し、車ex210が有するカーナビゲーションex211等の表示装置に動画を再生することも可能である。なお、カーナビゲーションex211の構成は例えば図46に示す構成のうち、GPS受信部を加えた構成が考えられ、同様なことがコンピュータex111および携帯電話ex114等でも考えられる。また、上記携帯電話ex114等の端末は、テレビex300と同様に、符号化器および復号器を両方持つ送受信型端末の他に、符号化器のみの送信端末、復号器のみの受信端末という3通りの実装形式が考えられる。
このように、上記実施の形態で示した画像符号化方法あるいは画像復号方法を上述したいずれの機器およびシステムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。
また、本発明は、上記実施の形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形または修正が可能である。
(実施の形態8)
上記各実施の形態で示した画像符号化方法および装置、画像復号方法および装置は、典型的には集積回路であるLSIで実現される。一例として、図49に1チップ化されたLSIex500の構成を示す。LSIex500は、以下に説明する要素ex501〜ex509を備え、各要素はバスex510を介して接続している。電源回路部ex505は電源がオン状態の場合に各部に対して電力を供給することで動作可能な状態に起動する。
例えば符号化処理を行う場合には、LSIex500は、CPUex502、メモリコントローラex503およびストリームコントローラex504等を有する制御部ex501の制御に基づいて、AV I/Oex509によりマイクex117およびカメラex113等からAV信号の入力を受け付ける。入力されたAV信号は、一旦SDRAM等の外部のメモリex511に蓄積される。制御部ex501の制御に基づいて、蓄積したデータは、処理量および処理速度に応じて適宜複数回に分けるなどされ、信号処理部ex507に送られる。信号処理部ex507は、音声信号の符号化および/または映像信号の符号化を行う。ここで映像信号の符号化処理は、上記実施の形態で説明した符号化処理である。信号処理部ex507ではさらに、場合により符号化された音声データと符号化された映像データを多重化するなどの処理を行い、ストリームI/Oex506から外部に出力する。この出力されたビットストリームは、基地局ex107に向けて送信されたり、または、記録メディアex215に書き込まれたりする。なお、多重化する際には同期するよう、一旦バッファex508にデータを蓄積するとよい。
また、例えば復号処理を行う場合には、LSIex500は、制御部ex501の制御に基づいて、ストリームI/Oex506によって基地局ex107を介して得た符号化データ、または、記録メディアex215から読み出して得た符号化データを一旦メモリex511等に蓄積する。制御部ex501の制御に基づいて、蓄積したデータは、処理量および処理速度に応じて適宜複数回に分けるなどされ信号処理部ex507に送られる。信号処理部ex507は、音声データの復号および/または映像データの復号を行う。ここで映像信号の復号処理は、上記実施の形態で説明した復号処理である。さらに、場合により復号された音声信号と復号された映像信号を同期して再生できるようそれぞれの信号を一旦バッファex508等に蓄積するとよい。復号された出力信号は、メモリex511等を適宜介しながら、携帯電話ex114、ゲーム機ex115およびテレビex300等の各出力部から出力される。
なお、上記では、メモリex511がLSIex500の外部の構成として説明したが、LSIex500の内部に含まれる構成であってもよい。バッファex508も一つに限ったものではなく、複数のバッファを備えていてもよい。また、LSIex500は1チップ化されてもよいし、複数チップ化されてもよい。
なお、ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA、または、LSI内部の回路セルの接続および設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
以上、本発明に係る画像符号化方法、画像符号化装置、画像復号方法および画像復号装置について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を当該実施の形態に施した形態、および、異なる実施の形態における構成要素およびステップ等を組み合わせて構築される別の形態も、本発明の範囲内に含まれる。
本発明は、画像符号化方法(装置)及び画像復号方法(装置)に有利に利用される。
100,400,500,600,1300A,1300B,1500,1800,2100,2200,2300,2800,3201 動画像符号化装置
105 減算器
110 変換/量子化部
120,220 逆量子化/逆変換部
125,225 加算器
130,230 デブロッキングフィルタ
140,240,3020,3120 メモリ
150,250 補間フィルタ
160,260 動き補償予測部
165 動き予測部
170,270 イントラフレーム予測部
175,275 スイッチ
180,640 ポストフィルタ設計部
190,490,590,690,1590,1890,2190,2290,2390,2890 エントロピー符号化部
200,700,1400A,1400B,1600,1900,2400,2900,3203 動画像復号装置
280,740 ポストフィルタ
290,1690,1990,2490,2990 エントロピー復号部
300,930,1130 ウィナーフィルタ
440,540 ウィナーフィルタ及び設計部
810,910,1110 DCT変換部
820,920,1120 DCT逆変換部
1301,1311,1401,1411,1441 動画像信号
1310,1410,2010 変換部
1330,1530,1830,2330 フィルタ設計部
641,1331,1431,1531,1691,1831,1991,2131,2231,2331,2491 フィルタ情報
1420 逆変換部
1435 フィルタ設定部
1440,1540,1640,1740,1940,2040,2440,2880,2980,3030、3130 フィルタ
1520,1620,2020,3040,3140 逆変換部
1741,2041 変換係数
2140,2230 フィルタ及び設計部
2710,2720,2730,2750,2760,2770 フレーム
2701,2702,2703,2751,2752,2753 ブロック
2780 動きベクトル
3010,3110 逆量子化部
3041,3141 信号
3001,3101 対象ブロック
3002,3102 隣接ブロック
3202 チャネル
ex100 コンテンツ供給システム
ex101 インターネット
ex102 インターネットサービスプロバイダ
ex103 ストリーミングサーバ
ex104 電話網
ex106,ex107,ex108,ex109,ex110 基地局
ex111 コンピュータ
ex112 PDA
ex113,ex116 カメラ
ex114 カメラ付デジタル携帯電話(携帯電話)
ex115 ゲーム機
ex117 マイク
ex200 デジタル放送用システム
ex201 放送局
ex202 放送衛星(衛星)
ex203 ケーブル
ex204,ex205,ex601 アンテナ
ex210 車
ex211 カーナビゲーション(カーナビ)
ex212 再生装置
ex213,ex219 モニタ
ex214,ex215,ex216,ex607 記録メディア
ex217 セットトップボックス(STB)
ex218 リーダ/レコーダ
ex220 リモートコントローラ
ex230 情報トラック
ex231 記録ブロック
ex232 内周領域
ex233 データ記録領域
ex234 外周領域
ex300 テレビ
ex301 チューナ
ex302 変調/復調部
ex303 多重/分離部
ex304 音声信号処理部
ex305 映像信号処理部
ex306,ex507 信号処理部
ex307 スピーカ
ex308,ex602 表示部
ex309 出力部
ex310,ex501 制御部
ex311,ex505,ex710 電源回路部
ex312 操作入力部
x313 ブリッジ
ex314,ex606 スロット部
ex315 ドライバ
ex316 モデム
ex317 インターフェース部
ex318,ex319,ex320,ex321,ex404,ex508 バッファ
ex400 情報再生/記録部
ex401 光ヘッド
ex402 変調記録部
ex403 再生復調部
ex405 ディスクモータ
ex406 サーボ制御部
ex407 システム制御部
ex500 LSI
ex502 CPU
ex503 メモリコントローラ
ex504 ストリームコントローラ
ex506 ストリームI/O
ex509 AV I/O
ex510 バス
ex603 カメラ部
ex604 操作キー
ex605 音声入力部
ex608 音声出力部
ex701 送受信回路部
ex702 LCD制御部
ex703 カメラインターフェース部(カメラI/F部)
ex704 操作入力制御部
ex705 音声処理部
ex706 変復調回路部
ex707 記録再生部
ex708 多重分離部
ex709 画像復号部
ex711 主制御部
ex712 画像符号化部
ex713 同期バス
本発明は、動画像信号をフィルタリングするためのフィルタを用いて動画像を符号化および復号する方法および装置に関する。
現在、標準的な動画像符号化アルゴリズムの大多数はハイブリッド動画像符号化に基づくものである。典型的には、ハイブリッド動画像符号化方法は、所望の圧縮成果を達成するために、それぞれ異なるロスが生じない圧縮方式とロスが生じる圧縮方式とを組み合わせたものである。ハイブリッド動画像符号化は、ISO/IEC標準規格(MPEG−1、MPEG−2、MPEG−4のようなMPEG−X標準規格)と同様に、ITU−T標準規格(H.261やH.263のようなH.26x標準規格)の基礎でもある。最新の動画像符号化標準規格は、H.264/MPEG−4 Advanced Video Coding(AVC)と称されるものである。これは、ジョイントビデオチーム(JVT)およびITU−TとISO/IEC MPEGグループとのジョイントチームによる標準化活動の成果である。
エンコーダへ入力される動画像信号は、フレーム(又はピクチャ)と呼ばれる画像のシーケンスであり、各フレームは2次元マトリクスの画素からなる。ハイブリッド動画像符号化に基づく上述の標準規格の全てにおいて、個々の動画像フレームは複数の画素からなる小ブロックへ細分化される。典型的には、マクロブロック(通常は16×16画素ブロックを意味する)が基本的な画像エレメントであり、これに対して符号化がおこなわれる。しかしながら、より小さい画像エレメントに対してさまざまな特定の符号化ステップがおこなわれる場合がある。例えば、8×8、4×4、16×8などのサイズのサブマクロブロックや単なるブロックが挙げられる。
典型的には、ハイブリッド動画像符号化における符号化ステップには、空間的および/または時間的予測が含まれる。したがって、各符号化対象ブロックは、まず、既に符号化された動画像フレームから空間的に隣接したブロックか時間的に隣接したブロックかを用いて予測される。符号化対象ブロックと予測残差とも呼ばれる予測結果との差分ブロックが、次に求められる。次の符号化ステップでは、残差ブロックが空間(画素)領域から周波数領域へ変換される。変換の目的は、入力ブロックの冗長性を削減することである。次の符号化ステップにおいて、変換係数が量子化される。このステップにおいて、実質的にロスが生じる(不可逆的な)圧縮がおこなわれる。通常、圧縮変換係数値は、エントロピー符号化によって(ロスを生じさせずに)さらに圧縮される。さらに、符号化動画像信号を再構築するために必要な補助情報が符号化され、符号化動画像信号とともに提供される。この情報は、例えば、空間的および/または時間的予測や量子化量に関するものである。
図1は、H.264/MPEG AVC標準規格に準拠した、典型的な動画像符号化装置(「エンコーダ」ともいう。以下同じ。)100の一例を示す。H.264/MPEG AVC標準規格は、上述の符号化ステップの全てを組み合わせたものである。減算器105は、まず、動画像(入力信号)の対象ブロック(符号化対象ブロック)と、対応する予測ブロック(予測信号)との差分を特定する。
時間的予測ブロックは、メモリ140に格納されている符号化画像から得られるブロックである。空間的予測ブロックは、符号化されてメモリ140に格納された隣接ブロック内の境界画素の画素値から補間される。よって、メモリ140は、対象信号値と過去の信号値から生成された予測信号とを比較する遅延手段として動作する。メモリ140は、複数の符号化動画像フレームを格納可能である。
入力信号と予測信号との差分は予測誤差または残差と称され、変換/量子化部110によって変換され量子化される。ロスが生じない方法でデータ量をさらに削減するために、エントロピー符号化部190によって量子化係数がエントロピー符号化(「可変長符号化」ともいう。以下同じ。)される。具体的には、値の発生確率に基づいて長さが決められる複数の符号語を用いる可変長符号化によりデータ量が削減される。
H.264/MPEG AVC標準規格には、動画像符号化層(VCL)とネットワーク抽象レイヤ(NAL)という2つの機能層が備えられている。VCLは、既に簡単に触れた符号化機能を提供する。NALは、チャネル上伝送や格納手段への格納といった、さらなるアプリケーションにしたがって、動画像の復号時に必要な補助情報とともに符号化予測誤差信号を、NALユニットと呼ばれる標準単位にカプセル化する。圧縮動画像データおよびその関連情報を含むVCL NALユニットと呼ばれるものがある。
一方、付加データをカプセル化する非VCLユニットと呼ばれるものもある。付加データは、例えば、動画像シーケンス全体に関するパラメータセットや、ポストフィルタヒントのような復号性能を改善するために用いることができる付加情報を提供する、最近追加された補助的拡張情報(SEI)などである。
動画像符号化装置100内に、復号動画像信号を取得する復号手段が備えられる。符号化ステップに準拠して、復号ステップには逆量子化/逆変換部120での処理が含まれる。復号予測誤差信号は、量子化ノイズとも呼ばれる量子化誤差が原因で原予測誤差信号とは異なる。加算器125によって復号予測誤差信号を予測信号に加算することにより、再構築信号が取得される。エンコーダ側とデコーダ側の互換性を保つために、符号化された後に復号された動画像信号に基づいて、双方に知られる予測信号を求める。量子化によって、量子化ノイズが再構築動画像信号に重畳される。
ブロック単位での符号化により、重畳されたノイズはしばしば、ブロッキング特性を有し、特に強い量子化がおこなわれた場合は、復号画像のブロック境界が目立つ結果になる。ブロッキングアーチファクトは、人間の視覚的認識上マイナスの効果がある。アーチファクトを削減するために、再構築画像ブロックごとにデブロッキングフィルタ130が適用される。デブロッキングフィルタ130は、予測信号と復号予測誤差信号との加算結果である再構築信号に適用される。デブロッキング後の動画像信号は、通常は(ポストフィルタリングが適用されなければ)デコーダ側で表示される復号信号である。
H.264/AVCにおけるデブロッキングフィルタ130は、局所的に適用可能なものである。ブロッキングノイズの程度が高い場合は、強い(帯域幅が狭い)ローパスフィルタが適用され、ブロッキングノイズの程度が低い場合は、弱い(帯域幅が広い)ローパスフィルタが適用される。デブロッキングフィルタ130は、通常、ブロックのエッジを平滑化して復号画像の主観的画質を改善する。さらに、画像内のフィルタリング済みの部分が次の画像の動き補償予測に用いられるため、フィルタリングによって予測誤差が削減され、符号化効率を改善することができる。復号動画像信号は、次にメモリ140に格納される。
H.264/AVCにおける予測信号は、時間的予測か空間的予測によって取得される。予測タイプは、マクロブロック単位で異ならせることができる。時間的予測で予測されたマクロブロックは、インター符号化マクロブロックと呼ばれ、空間的予測で予測されたマクロブロックは、イントラ符号化マクロブロックと呼ばれる。
ここで、「インター」という用語は、インターピクチャ予測、つまり先行フレームか後続フレームから得られた情報を用いる予測に関する。「イントラ」という用語は、空間的予測、つまり対象動画像フレーム内で既に符号化された情報のみを用いる予測に関する。可能な限り高い圧縮成果を達成するために、動画像フレームの予測タイプは、ユーザが設定することもでき、動画像符号化装置100に選択させることもできる。選択された予測タイプにしたがってスイッチ175は、対応する予測信号を減算器105へ提供する。
イントラ符号化画像(Iタイプ画像またはIフレームとも呼ばれる)は、イントラ符号化されたマクロブロックのみからなる。つまり、イントラ符号化された画像は、他の復号画像を参照することなく復号可能である。イントラ符号化画像は、符号化動画像シーケンスに対しエラー耐性を与える。なぜなら、時間的予測によって動画像シーケンス内でフレームからフレームへ伝播する可能性があるエラーを取り除く(リフレッシュする)からである。さらに、Iフレームは、符号化動画像シーケンス内でランダムアクセスを可能にする。
イントラフレーム予測では、基本的には、既に符号化された隣接マクロブロックの境界に位置する画素を用いて対象マクロブロックを予測する、予め定められたイントラ予測モードの組が用いられる。空間的予測タイプが異なるということは、エッジの方向、つまり適用された2次元補間の方向が異なるということである。補間によって得られた予測信号は、次に、上述の減算器105によって、入力信号から減算される。また、空間的予測タイプ情報は、エントロピー符号化され、符号化動画像信号とともに提供される。
インター符号化画像を復号するには、符号化された後に復号された画像が必要である。時間的予測は、単一方向つまり符号化対象フレームより早い順序の動画像フレームのみを用いておこなってもよく、後続動画像フレームも用いておこなってもよい。単一方向の時間的予測をおこなえば、Pフレームと呼ばれるインター符号化画像が得られ、双方向の時間的予測をおこなえば、Bフレームと呼ばれるインター符号化画像が得られる。一般的に、インター符号化画像は、PタイプマクロブロックとBタイプマクロブロックとIタイプマクロブロックのいずれかから構成される。
インター符号化マクロブロック(PまたはBマクロブロック)は、動き補償予測部160を採用して予測される。まず、動き予測部165によって、符号化された後に復号された動画像フレーム内で、対象ブロックに最適なブロックが検出される。この最適ブロックは予測信号となり、対象ブロックと最適ブロック間の相対的なずれ(動き)が、符号化動画像データとともに提供される補助情報内に含められる2次元の動きベクトルの形で動きデータとして信号送信される。
予測精度を最適化するため、1/2画素解像度や1/4画素解像度などの小数画素解像度で動きベクトルを特定してもよい。小数画素解像度の動きベクトルは、復号フレーム内の、小数画素位置のように実存する画素値がない位置を指してもよい。よって、動き補償をおこなうには、そのような画素値の空間的補間が必要である。補間は、補間フィルタ150によっておこなわれる。H.264/MPEG AVC標準規格にしたがって、小数画素位置の画素値を得るために、固定フィルタ係数を用いた6タップ・ウィナー補間フィルタとバイナリフィルターが適用される。
イントラ符号化モードおよびインター符号化モードにおいて、変換/量子化部110によって、対象入力信号と予測信号間の差分が変換されて量子化され、量子化変換係数が得られる。一般的に、2次元離散コサイン変換(DCT)またはその整数版のような直交変換が採用される。なぜなら、これにより自然動画像の冗長性を効率的に削減できるからである。通常、低周波数成分は高周波成分よりも画質にとって重要であるため、高周波数よりも低周波数に多くのビットが費やされるように変換される。
量子化後、2次元マトリクスの量子化変換係数が1次元配列に変換されてエントロピー符号化部190に送信される。典型的には、いわゆるジグザグ走査によって変換される。ジグザグ走査においては、2次元マトリクスの左上隅から右下隅まで所定の順序で走査される。典型的には、エネルギーは低周波に相当する画像の左上部分に集中するため、ジグザグ走査をおこなうと、最後のほうでゼロ値が続く配列になる。これにより、実際のエントロピー符号化の一部として、またはそれ以前の段階で、ラン−レングス符号を用いた効率的な符号化をおこなうことが可能になる。
H.264/MPEG−4AVCは、量子化パラメータ(QP)およびカスタマイズ可能な量子化マトリクス(QM)によって制御可能なスカラ量子化を採用している。量子化パラメータにより、52の量子化器のうちの1つがマクロブロック毎に選択される。加えて、量子化マトリクスは、画質の損失を避けるため、特に、ソース内で特定の周波数を保つように設計される。H.264/MPEG−4AVCにおける量子化マトリクスは、動画像シーケンスに適応可能であり、動画像データと共に信号送信される。
画質を改善するために、ポストフィルタ280と呼ばれるものを、動画像復号装置(「デコーダ」ともいう。以下同じ。)200で適用してもよい。H.264/MPEG AVC標準規格においては、補助的拡張情報(SEI)メッセージを通して、ポストフィルタ280のためのポストフィルタ情報を送信することが可能である。ポストフィルタ情報は、ローカル復号信号と原画入力信号とを比較するポストフィルタ設計部180によって動画像符号化装置100側で特定される。ポストフィルタ設計部180の出力は、エントロピー符号化部190に送られ、符号化されて符号化信号に挿入される。エントロピー符号化部190は、統計を適用した、符号化対象情報のタイプが異なれば長さが異なる可変長コードを採用する。
図2は、H.264/AVC動画像符号化標準規格に準拠した例示的な動画像復号装置200を説明する図である。符号化動画像信号(動画像復号装置200への入力信号)は、まずエントロピー復号部290へ送信される。エントロピー復号部290は、量子化変換係数や動きデータおよび予測タイプなどの復号に必要な情報エレメントや、ポストフィルタ情報を復号する。量子化変換係数は、逆走査されて2次元マトリクスとなり、逆量子化/逆変換部220へ送信される。逆量子化/逆変換部220による逆量子化および逆変換後、復号(量子化)予測誤差信号が得られる。これは、動画像符号化装置100へ入力された信号から予測信号を減算して得られた差分に相当する。
予測信号は、動き補償予測部(時間的予測手段)260またはイントラフレーム予測部(空間的予測手段)270からそれぞれ得られる。どちらの予測信号を採用するかは、動画像符号化装置100で適用された予測を信号送信する情報エレメントにしたがってスイッチ275によって切り替えられる。
復号情報エレメントは、さらに、イントラ予測の場合には、予測タイプなどの予測に必要な情報を含み、動き補償予測の場合には、動きデータなどの予測に必要な情報を含む。動きベクトルの値によっては、動き補償予測をおこなうには画素値を補間する必要がある。補間は、補間フィルタ250によっておこなわれる。
空間領域の量子化予測誤差信号は、次に、加算器225によって、動き補償予測部260かイントラフレーム予測部270から得られる予測信号へ加算される。再構築画像を、デブロッキングフィルタ230へ送信してもよい。復号信号は、メモリ240に格納され、後続ブロックの時間的予測または空間的予測に用いられる。
ポストフィルタ情報は、ポストフィルタ280へ送信され、ポストフィルタ280がそれに応じて設定される。さらに画質を改善するために、ポストフィルタ280は、次に復号信号に適用される。よって、ポストフィルタ280は、フレームごとに動画像符号化装置100へ入力される動画像信号の特性に適応する能力を備える。
要約すると、最新のH.264/MPEG AVC標準規格で用いられるフィルタは以下の3種類である。すなわち、補間フィルタとデブロッキングフィルタとポストフィルタである。一般に、あるフィルタが適切かどうかは、フィルタリング対象の画像内容次第で決まる。それゆえ、画像の特性に適応可能なフィルタ設計は有利である。フィルタ係数を、ウィナーフィルタ係数として設計してもよい。
最新のH.264/MPEG AVC標準規格においては、さらに、適応的ポストフィルタを利用可能である。この目的で、上述のように、ポストフィルタ設計部180によって画像ごとに動画像符号化装置100でポストフィルタが評価される。ポストフィルタ設計部180は、フィルタ情報(ポストフィルタヒントと呼ばれるもの)を生成し、これをSEIメッセージの形で動画像復号装置200へ送信する。動画像復号装置200での表示に先立って復号信号に適用されるポストフィルタ280によって、このフィルタ情報を利用してもよい。動画像符号化装置100から動画像復号装置200へ送信されるフィルタ情報は、フィルタ係数か相互相関ベクトルである。補助情報を送信すれば、フィルタリングの質を改善できる場合があるが、帯域を広げる必要が生じる。送信または計算されたフィルタ係数を用いて、画像全体にポストフィルタリングが施される。H.264/MPEG AVCにおけるデブロッキングフィルタは、ブロックのエッジに生じるブロッキングアーチファクトを削減するループフィルタとして用いられる。3タイプのフィルタは、ウィナーフィルタとして評価される。
図3は、ノイズを削減するためのウィナーフィルタ300を用いた信号の流れを説明する図である。ノイズnが入力信号sに加算されると、フィルタリング対象のノイズを含む信号s’になる。ノイズnを削減するという目的は、信号s’にウィナーフィルタ300を適用してフィルタリング済み信号s’’を得ることである。ウィナーフィルタ300は、所望の信号である入力信号sとフィルタリング済み信号s間の平均二乗誤差を最小限にするよう設計される。ウィナー係数はウィナーHopf方程式と呼ばれるシステムとして表現される最適化問題arg min E[(s‐s’’)]の解に相当する。演算子E[x]は、期待されるxの値である。解は以下の式1で求められる。
Figure 2010061607
ここで、wは、正の整数であるM桁の最適ウィナーフィルタ係数を含むM×1のベクトルである。R−1は、フィルタリング対象のノイズを含む信号s’のM×Mの自己相関マトリクスRの逆数を表す。pは、フィルタリング対象のノイズを含む信号s’と原画信号sとの間のM×1の相互相関ベクトルを表す。適応的フィルタ設計に関する詳細については、S.Haykinの、「Adaptive Filter Theory(非特許文献1)」(第4版、Prentice Hall Information and System Sciencesシリーズ、Prentice Hall、2002年)を参照のこと。これをここに引用して援用する。
よって、ウィナーフィルタ300のメリットの1つは、破損した(ノイズを含む)信号の自己相関と、破損信号と所望の信号間の相互相関に基づいて、フィルタ係数を求めることができるという点である。動画像符号化の際に、量子化ステップにおいて、量子化ノイズが原画(入力)動画像信号に重畳される。動画像符号化(のコンテキスト)におけるウィナーフィルタリングは、平均二乗再構築誤差を最小化するために、重畳された量子化ノイズを削減することを目的としている。
図4は、H.264/MPEG−4 AVCのデブロッキングフィルタ130の代わりにウィナーフィルタ及び設計部440が用いられる、H.264/MPEG−4 AVCの動画像符号化装置400を示すブロック図である。これは、特許文献1に記載されており、これをここに引用して援用する。ウィナーフィルタ及び設計部440は、動き補償予測の前に、予測ループ内で実行される。フィルタリングされた画像は、メモリ140に格納され、予測のために提供される。
インループフィルタリングによる利点は、予測および表示に用いられる信号の質が向上することである。デブロッキングフィルタ130がウィナーフィルタ及び設計部440として実装されれば、入力信号と再構築信号を用いて係数が予測される。算出されたフィルタ係数441は、同じ復号結果、つまり同じ画質を保証する目的で、デコーダに提供されなければならない。送信または格納する前に、フィルタ係数441はエントロピー符号化部490によってエントロピー符号化され、補助情報として符号化動画像データに組み込まれる。そのような動画像符号化装置400と互換性を持つデコーダは、フィルタ係数等の符号化されたであろうフィルタ情報441を取得し、それにしたがってデコーダ自体のフィルタを設定する。
図5は、特許文献1に記載されている、H.264/MPEG−4 AVCのデブロッキングフィルタ130の後にウィナーフィルタ及び設計部540がさらに適用された動画像符号化装置500の他の例を示す。ウィナーフィルタ及び設計部540は、入力信号とデブロッキングフィルタ130によってフィルタリングされた再構築信号とに基づいてフィルタ係数541を算出する。フィルタ係数541は、エントロピー符号化部590によって符号化されるが、この符号化は、フィルタ係数の統計に適応していてもよい。
欧州出願第08012036.3号において、これをここに引用して援用するが、予測信号、量子化予測誤差信号、および復号信号をフィルタ設計において別々に考慮することが提案されている。これにより、これら3つの信号の各々のノイズを個々に考慮できる。
図6は、H.264/MPEG−4 AVCに基づくそのような例示的な動画像符号化装置600を示す。図7は、それに対応する動画像復号装置700を示す。したがって、ポストフィルタ係数は、入力信号、デブロッキングフィルタ130適用後の復号信号、予測信号および量子化予測誤差信号に基づいて、動画像符号化装置600においてポストフィルタ設計部640で算出される。ポストフィルタ設計部640は、その後、直接的にフィルタ係数を提供するか、またはデコーダにおいて対応するポストフィルタ740の設定に使用できる、他の種類の新たなポストフィルタ情報641を提供する。そのような新たなポストフィルタ情報641は、例えば、相互相関ベクトル、または他の任意の情報である。やはり、ポストフィルタ情報641はエントロピー符号化部690でエントロピー符号化され、それに対応して動画像復号装置700においてエントロピー復号されてもよい。
次に、図8は、非線形ノイズ除去フィルタを備える動画像復号装置を示すブロック図である。この非線形ノイズ除去フィルタは、動き補償予測部から出力される予測信号と、復号部から出力される復号誤差(量子化予測誤差信号)との和である再構築画像信号に対して適用される。
図9A及び図9Bは、非線形ノイズ除去フィルタのアルゴリズムのフローを示す。まず、図9Aに示される変換部は、平行移動不変変換(translation invariant transform。ブロック開始位置を水平・垂直方向に1画素ずつ平行移動させた変換の組であり、変換の画素数に比例した個数が定義される)により、再構築画像信号yの複数の表現を生成する。具体的には、図10に示されるように、2次元4×4変換の場合、16個の表現が生成される。これらはd,…,d16と表される。d,…,d16は、再構築信号yの互いに異なるサンプルのセットから生成されたものである。
動画像符号化装置側において、同じ変換が原画信号xにも適用可能である。これは、ハイブリッド符号化される前の信号である。これはもちろん動画像復号装置側では入手できない。この結果、図11Bに示されるように、原画信号の16個の表現c,…,c16が得られる。図11A及び図11Bに示される処理によって得られる各cおよび各dは、16個の係数c(j),d(j)のベクトルであり、ここでj=1,…,16である。典型的に動画像符号化装置で実行される量子化により、量子化ノイズは、再構築信号の係数に重畳されるq(j)である。この量子化ノイズにより、再構築信号の係数d(j)と原画信号の係数c(j)の間の依存性は、c(j)=d(j)+q(j)と表すことができる。ノイズ除去フィルタの核となる部分は、ノイズ除去ルールである。このノイズ除去ルールを、式2に示す。
Figure 2010061607
式2の条件1は、原画信号の係数c(j)と、予測された係数ci^(j)との間の平均二乗誤差を最小化する目的で選択される。つまり、式2をより具体的に記述すると、式3のようになる。ここで、記号「^(ハット)」は、それぞれ直前の文字の上に付される記号を示し、本明細書では、以下、記号「^(ハット)」を同様な意味で使用する。
Figure 2010061607
上記式3によると、再構築画像信号の係数d(j)またはゼロが予測値として用いられるが、その予測値としては、二乗再構築誤差がより低くなるものが選択される。その選択は、係数d(j)と閾値τを比較することにより実現できる。つまり、τを用いて式3を書き換えると、式4のようになる。
Figure 2010061607
よって、16個の表現d(j)から、原画信号の係数に対する16個の予測値ci^(j)が、閾値演算により導き出される。これら16個の予測値ci^(j)は、図12に示されるように、重み付け逆変換部で逆変換されて値u^となる。重み付け逆変換とは、16個の予測値ci^(j)を周波数成分毎に重み付け加算し、得られた結果を空間領域に変換する処理である。すなわち、この値u^は、空間領域の値である。さらに、u^をマスキング部でマスキングしてもよい。u^をマスキングすると、画像信号x^となる。マスキング処理により、原画信号xに対する画像信号x^の急激な変化を抑制することができる。
ここまで、ノイズ除去の1つのループのみを説明した。図9Bから分かるように、k=0,…,2によって示される3つのループが実行される。これは、第1ループの結果であるx^=xk=0^=x0^に対し、平行移動不変変換が適用され、kを1増加させた後(k+=1)、係数f1,k-1,・・・, f16,k-1となる。これらの係数に対するノイズ除去ルールは、以下の式5にしたがって適用される。各ループにおいて、個々の閾値τi,kが適用される。
Figure 2010061607
欧州特許出願公開第1841230号明細書
Adaptive Filter Theory(S.Haykin、Prentice Hall Information and System Sciencesシリーズ、Prentice Hall、2002年)
本発明の根底にある課題は、周波数領域において実行される量子化が、恐らく個々の量子化ノイズをもつ各周波数成分を重畳したものと見なされる可能性があることに基づく。これは、ノイズの統計が、各周波数成分毎に異なる可能性があることを意味する。現在のところ動画像符号化に適用されている手法は、空間領域においてフィルタリング(ループおよび/またはポストフィルタリング)を適用することである。しかし、空間領域に適用されたフィルタリングでは、各周波数成分における量子化ノイズの個々の統計は考慮されない。
本発明の目的は、効率的なフィルタリング手法によって符号化および/または復号動画像信号の質を向上させる、符号化および復号メカニズムを提供することである。
本発明の一形態に係る動画像符号化方法は、動画像信号を符号化して得られる符号化信号を復号する方法である。具体的には、前記符号化信号及びフィルタ処理を特定するフィルタ情報を取得するステップと、前記符号化信号を復号して復号信号を生成するステップと、前記動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去する前記フィルタ処理を、前記フィルタ情報を用いて周波数領域の復号信号に適用するステップとを含む。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記復号信号との平均二乗誤差を最小にするための情報を含む。
上記構成によれば、量子化の過程で重畳されたノイズを適切に除去することが可能となる。なお、「量子化の過程で重畳されるノイズ」とは、典型的には、量子化ノイズであり、周波数変換された信号に重畳される。そこで、空間領域の信号に対してではなく、周波数領域の信号に対してフィルタ処理を適用することにより、より効果的にノイズを除去することができる。また、量子化ノイズは、全周波数成分に一様に重畳されるのではなく、周波数成分毎に異なる。そこで、周波数成分毎に独立してフィルタ処理を適用することにより、より適応的に量子化ノイズを除去することができる。さらに、フィルタ情報を符号化側から取得することにより、原動画像信号を考慮したフィルタ処理が可能となる。
なお、本明細書中における「符号化」とは、動画像信号を周波数変換し、量子化し、エントロピー符号化する処理の一部又は全部を含む概念である。また、「復号」とは、符号化信号を逆量子化し、空間領域に変換し、予測信号を加算して再構築信号を生成し、再構築信号にデブロッキングフィルタ処理を適用して復号信号を生成する処理、又は再構築信号から予測信号を生成する処理の一部又は全部を含む概念である。
また、前記フィルタ処理は、前記復号信号を構成する複数のブロックそれぞれについて、処理対象ブロックの各周波数成分の値と、前記処理対象ブロックに時間的又は空間的に隣接するブロックの対応する周波数成分の値とを、前記フィルタ情報に含まれる重み係数を用いて重み付け加算するステップを含む。そして、前記重み係数は、前記フィルタ処理が適用された後の周波数領域の前記処理対象ブロックと、周波数領域の前記動画像信号に含まれる前記処理対象ブロックに対応するブロックとの平均二乗誤差が最小になるように決定されてもよい。
さらに、前記フィルタ処理は、前記重み付け加算を実行する前の前記処理対象ブロックに対して、各周波数成分の値から第1のオフセット値を減算するステップと、前記重み付け加算した後の前記処理対象ブロックに対して、各周波数成分の値に前記フィルタ情報に含まれる第2のオフセット値を加算するステップとを含む。そして、前記第1のオフセット値は、周波数領域の前記復号信号に含まれるブロックのうち、前記処理対象ブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に算出され、前記第2のオフセット値は、周波数領域の前記動画像信号に含まれるブロックのうち、前記処理対象ブロックに対応するブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に算出されてもよい。
一形態として、前記符号化信号は、前記動画像信号が空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られるものであある。前記復号信号を生成するステップには、前記符号化信号をエントロピー復号して前記復号信号としての量子化係数を生成する処理が含まれる。そして、前記フィルタ処理を適用するステップには、前記量子化係数に前記フィルタ処理を適用すると共に、当該量子化係数を逆量子化する処理が含まれてもよい。これにより、量子化係数に重畳されたノイズを適応的に除去することができる。
他の形態として、前記符号化信号は、前記動画像信号から予測信号が減算され、空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られるものである。前記復号信号を生成するステップには、前記符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換し、前記予測信号を加算して前記復号信号としての再構築信号を生成する処理が含まれる。そして、前記フィルタ処理を適用するステップには、前記再構築信号を空間領域から周波数領域に変換する処理と、周波数領域の前記再構築信号に前記フィルタ処理を適用する処理と、前記フィルタ処理を適用した後の前記再構築信号を周波数領域から空間領域に逆変換する処理とが含まれてもよい。これにより、再構築信号に重畳されたノイズを適応的に除去することができる。
他の形態として、前記符号化信号は、前記動画像信号から予測信号が減算されて予測誤差信号が生成され、当該予測誤差信号が空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られるものである。前記復号信号を生成するステップには、前記符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換して量子化予測誤差信号を生成し、前記量子化予測誤差信号と前記予測信号とを加算して再構築信号を生成する処理が含まれる。前記フィルタ処理は、前記復号信号としての前記量子化予測誤差信号、前記予測信号、及び前記再構築信号の互いに対応するブロックに含まれる同一周波数成分の値を前記フィルタ情報に含まれる重み係数を用いて重み付け加算するステップを含む。そして、前記重み係数は、周波数領域の前記予測誤差信号と、前記フィルタ処理が適用された後の周波数領域の前記量子化予測誤差信号との平均二乗誤差が最小になるように決定されてもよい。これにより、量子化予測誤差信号に重畳されたノイズを適応的に除去することができる。
他の形態として、前記符号化信号は、前記動画像信号から予測信号が減算され、空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られるものである。前記復号信号を生成するステップには、前記符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換して量子化予測誤差信号を生成し、前記量子化予測誤差信号と前記予測信号とを加算して再構築信号を生成する処理が含まれる。そして、前記フィルタ処理を適用するステップには、前記予測信号を空間領域から周波数領域に変換する処理と、周波数領域の前記予測信号に前記フィルタ処理を適用する処理と、前記フィルタ処理が適用された後の前記予測信号を周波数領域から空間領域に逆変換する処理とが含まれてもよい。これにより、予測信号に重畳されたノイズを適応的に除去することができる。
本発明の一形態に係る動画像符号化方法は、動画像信号を符号化して符号化信号を生成する方法である。具体的には、少なくとも、前記動画像信号を空間領域から周波数領域に変換し、量子化して、前記符号化信号を生成するステップと、量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するステップと、前記符号化信号及び前記フィルタ情報を出力するステップとを含む。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される。これにより、量子化の過程で重畳されたノイズを適応的に除去することができる。
さらに、前記動画像符号化方法は、量子化後の周波数領域の信号に、前記フィルタ情報を用いて前記フィルタ処理を適用するステップを含む。前記フィルタ処理は、前記量子化後の信号を構成する複数のブロックそれぞれについて、処理対象ブロックの各周波数成分の値と、前記処理対象ブロックに時間的又は空間的に隣接するブロックの対応する周波数成分の値とを、前記フィルタ情報に含まれる重み係数を用いて重み付け加算するステップを含む。そして、前記フィルタ情報を生成するステップは、前記フィルタ処理が適用された前記処理対象ブロックと、周波数領域の前記動画像信号に含まれる前記処理対象ブロックに対応するブロックとの平均二乗誤差が最小になるように前記重み係数を決定してもよい。
さらに、前記フィルタ処理は、前記重み付け加算を実行する前の前記処理対象ブロックに対して、各周波数成分の値から第1のオフセット値を減算するステップと、前記重み付け加算した後の前記処理対象ブロックに対して、各周波数成分の値に第2のオフセット値を加算するステップとを含む。そして、前記フィルタ情報を生成するステップでは、量子化後の周波数領域の信号に含まれるブロックのうち、前記処理対象ブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に前記第1のオフセット値が算出され、周波数領域の前記動画像信号に含まれるブロックのうち、前記処理対象ブロックに対応するブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に前記第2のオフセット値を算出され、少なくとも前記第2のオフセット値を前記フィルタ情報に含められてもよい。
一形態として、前記符号化信号を生成するステップには、前記動画像信号から予測信号を減算して予測誤差信号を生成し、前記予測誤差信号を空間領域から周波数領域に変換し、量子化して量子化係数を生成する処理が含まれる。そして、前記フィルタ情報を生成するステップでは、周波数領域の前記予測誤差信号と、前記フィルタ処理が適用された後の周波数領域の量子化予測誤差信号との平均二乗誤差が最小になるように前記フィルタ情報が決定されてもよい。
他の形態として、前記符号化信号を生成するステップには、周波数領域の前記動画像信号を量子化し、逆量子化して再構築信号を生成する処理が含まれる。そして、前記フィルタ情報を生成するステップでは、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記再構築信号との平均二乗誤差が最小になるように前記フィルタ情報が決定されてもよい。
他の形態として、前記符号化信号を生成するステップには、前記動画像信号から予測信号を減算して予測誤差信号を生成し、前記予測誤差信号を空間領域から周波数領域に変換し、量子化し、逆量子化し、周波数領域から空間領域に変換して量子化予測誤差信号を生成し、前記量子化予測誤差信号に前記予測信号を加算して再構築信号を生成する処理が含まれる。そして、前記フィルタ情報を生成するステップでは、周波数領域の前記予測信号、周波数領域の前記量子化予測誤差信号、及び周波数領域の前記再構築信号に基づいて、周波数領域の前記予測誤差信号と、前記フィルタ処理が適用された後の周波数領域の前記量子化予測誤差信号との平均二乗誤差が最小になるように前記フィルタ情報が決定されてもよい。
他の形態として、前記符号化信号を生成するステップには、前記動画像信号から予測信号を減算して予測誤差信号を生成し、前記予測誤差信号を空間領域から周波数領域に変換し、量子化し、逆量子化し、周波数領域から空間領域に変換して量子化予測誤差信号を生成し、前記量子化予測誤差信号に前記予測信号を加算して再構築信号を生成する処理が含まれる。そして、前記フィルタ情報を生成するステップでは、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記予測信号との平均二乗誤差が最小になるように前記フィルタ情報が決定されてもよい。
本発明の一形態に係る動画像復号装置は、動画像信号を符号化して得られる符号化信号を復号する。具体的には、前記符号化信号及びフィルタ処理を特定するフィルタ情報を取得する取得部と、前記符号化信号を復号して復号信号を生成する復号部と、前記動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去する前記フィルタ処理を、前記フィルタ情報を用いて周波数領域の復号信号に適用するフィルタ部とを備える。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記復号信号との平均二乗誤差を最小にするための情報を含む。
本発明の一形態に係る動画像符号化装置は、動画像信号を符号化して符号化信号を生成する。具体的には、少なくとも、前記動画像信号を空間領域から周波数領域に変換し、量子化して、前記符号化信号を生成する符号化部と、量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するフィルタ設計部と、前記符号化信号及び前記フィルタ情報を出力する出力部とを備える。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される。
本発明の一形態に係るプログラムは、コンピュータに、動画像信号を符号化して得られる符号化信号を復号させる。具体的には、前記符号化信号及びフィルタ処理を特定するフィルタ情報を取得するステップと、前記符号化信号を復号して復号信号を生成するステップと、前記動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去する前記フィルタ処理を、前記フィルタ情報を用いて周波数領域の復号信号に適用するステップとを含む。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記復号信号との平均二乗誤差を最小にするための情報を含む。
本発明の他の形態に係るプログラムは、コンピュータに、動画像信号を符号化して符号化信号を生成させる。具体的には、少なくとも、前記動画像信号を空間領域から周波数領域に変換し、量子化して、前記符号化信号を生成するステップと、量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するステップと、前記符号化信号及び前記フィルタ情報を出力するステップとを含む。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される。
本発明の一形態に係る集積回路は、動画像信号を符号化して得られる符号化信号を復号する。具体的には、前記符号化信号及びフィルタ処理を特定するフィルタ情報を取得する取得部と、前記符号化信号を復号して復号信号を生成する復号部と、前記動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去する前記フィルタ処理を、前記フィルタ情報を用いて周波数領域の復号信号に適用するフィルタ部とを備える。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記復号信号との平均二乗誤差を最小にするための情報を含む。
本発明の他の形態に係る集積回路は、動画像信号を符号化して符号化信号を生成する。具体的には、少なくとも、前記動画像信号を空間領域から周波数領域に変換し、量子化して、前記符号化信号を生成する符号化部と、量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するフィルタ設計部と、前記符号化信号及び前記フィルタ情報を出力する出力部とを備える。そして、前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される。
なお、本発明は、画像復号方法(装置)及び画像符号化方法(装置)として実現できるだけでなく、これらの機能を実現する集積回路として実現したり、そのような機能をコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体及びインターネット等の伝送媒体を介して流通させることができるのは言うまでもない。
これは、独立クレームに定義された特徴によって達成される。
好適な実施形態は、従属クレームの主題である。
周波数領域の動画像信号に基づいてフィルタパラメータを決定し、それにしたがってフィルタを設定し、周波数領域に当該フィルタを適用することは、本発明に特有の手法である。
そのような手法により、信号内の様々な周波数成分に対しノイズが異なる場合のフィルタリング後の画質が向上する。そのようなノイズ特性は、典型的に、周波数領域において量子化が実行される場合、特に量子化重み行列が用いられるか、粗量子化が適用された場合に、量子化ノイズにおいて見られるものである。しかしながら、ある特定の送信方法によって、誤差の結果として周波数選択ノイズが生じる場合もある。
本発明の第1の態様によれば、少なくとも1つの動画像フレームを含む動画像信号を符号化する方法が提供される。まず、動画像信号が周波数領域に変換される。その後、周波数領域の動画像信号のフィルタリングに用いられるフィルタデータが、周波数領域に変換された動画像信号に基づいて決定される。フィルタデータは、デコーダ側に提供される。
本発明の他の態様によれば、少なくとも1つの動画像フレームを含む符号化動画像信号を復号する方法が提供される。周波数領域の動画像信号をフィルタリングするフィルタが、周波数領域の動画像信号ブロックに対し個々に設定される。その後、動画像信号ブロックは、周波数領域において当該フィルタを用いて個々にフィルタリングされる。
本発明のさらに他の態様によれば、少なくとも1つの動画像フレームを含む動画像信号を符号化するエンコーダが提供される。当該エンコーダは、動画像信号を周波数領域に変換する変換手段と、フィルタデータを決定するフィルタ設計手段を備える。フィルタデータは、周波数領域の動画像信号のフィルタリングに用いられ、周波数領域に変換された動画像信号に基づいて決定される。さらに、エンコーダは、デコーダ側にフィルタデータを提供することができる。
本発明のさらに他の態様によれば、少なくとも1つの動画像フレームを含む符号化動画像信号を復号する装置が提供される。当該デコーダは、動画像信号ブロックに対し、周波数領域において個々にフィルタを設定する設定手段を備える。当該デコーダはさらにまた、周波数領域において、かつブロック単位で、当該フィルタによって動画像信号をフィルタリングするフィルタ手段を備える。
好ましくは、フィルタを設定するブロック、フィルタ設計、および/またはフィルタリングは、変換されるブロックに対応する。ここで、当該変換は動画像信号を符号化するために実行される変換、または動画像信号を復号するために実行される逆変換に対応してもよい。そのような場合、エンコーダにおいて動画像信号がフレームおよびブロックにセグメント化され、デコーダに信号送信されるか、一般的な方法でデコーダに通知される。しかしながら、符号化/復号に用いられたラスタと異なるラスタ(サイズおよび動画像信号フレーム内の位置)を有するブロックにはまた、追加の変換が適用されてもよい。この場合、エンコーダとデコーダの両方において動画像信号をブロックにセグメント化する必要があってもよく、またはエンコーダでセグメント化し、デコーダに信号送信/知らせてもよい。ラスタのフィルタリングは、変換に用いられるブロックラスタ、または時間的および/または予測に用いられるブロックラスタ等の、符号化/復号において使用されるブロックラスタに依存してもよい。特に、フィルタリングに用いられるブロックラスタは、基礎的な符号化/復号ブロックラスタのブロック群から設定されてもよい。しかしながら、フィルタリングに用いられるブロックラスタは、(もしあれば)符号化/復号に用いられる基礎的なブロックラスタから独立していてもよい。そのようなフィルタリングラスタのブロックのサイズおよび形状は、必ずしも同一とは限らず、異なる形状やサイズのブロックが使用されてもよい。好ましくは、効率よくソフトウェア/ハードウェアに実装できるようなサイズの四角形が用いられる。しかしながら、ラスタのブロックのサイズおよび形状は、例えば動画像信号の内容にしたがって任意に選択されてもよい。
好ましくは、デコーダ側で、エンコーダ側から、周波数領域の動画像信号のフィルタリングに用いられるフィルタデータを取得する。その後、取得されたフィルタデータに基づいてフィルタを設定する。エンコーダ側からフィルタデータを取得することで、デコーダは、(符号化前の)原動画像信号に関する情報等の、エンコーダのみが入手可能な情報を取得することができ、よって、そのような情報にしたがってフィルタを設定することができる。
好ましくは、本発明の符号化はまた、空間領域において入力動画像信号を空間的または時間的に予測し、予測信号を得ることを含む。予測誤差信号は、入力動画像信号と予測信号の差分として取得される。本発明の実施形態によれば、変換された動画像信号は変換された予測誤差信号に対応し、フィルタデータは周波数領域に変換された予測誤差信号に基づいて決定され、変換された予測誤差信号にフィルタリングが適用される。または、予測信号と(量子化)予測誤差信号の和であり、周波数領域に変換された再構築動画像信号に基づいて、フィルタデータが決定される。
好ましくは、符号化は、さらに、変換された動画像信号を量子化することを含み、フィルタデータは、量子化の前と後に、周波数領域に変換された動画像信号に基づいて算出された相関情報またはフィルタ係数を含む。特に、相関情報は、量子化の前と後の周波数領域の動画像信号の相互相関ベクトルであってもよく、または量子化の前と後の周波数領域の動画像信号間の差分によって生じる量子化ノイズの自己相関であってもよい。そのような情報は、エンコーダおよび/またはデコーダにおいて、例えばウィナーフィルタ係数のような、フィルタ係数の算出に有利に用いてもよい。しかしながら、係数はまた、直接的にデコーダに提供されてもよい。フィルタ係数は、ウィナーフィルタリングの場合のように平均二乗誤差を最小化するよりも、他の最適化の課題を解決することに基づいて予測されてもよい。フィルタは、入力信号のみに重み付けする有限インパルス応答フィルタか、または出力信号にも重み付けする無限インパルス応答フィルタであってもよい。
本発明の他の実施形態によれば、当該符号化はまた、フィルタデータに基づいて動画像信号をフィルタリングするフィルタを設定することと、周波数領域においてフィルタによって動画像信号をフィルタリングすることとを含む。特に、エンコーダで実行されるフィルタリングは、予測ループ内で適用されたループフィルタリングであってもよい。しかしながら、フィルタリングは必ずしもエンコーダで実行されるとは限らない。符号化は、デコーダに提供されるフィルタデータを決定するフィルタ設計のみを含んでもよい。その後、デコーダはそれにしたがって自己のフィルタを設定し、ポストフィルタリング等のフィルタリングを実行する。好ましくは、エンコーダにおけるフィルタリングも、ブロック単位で適用される。特に、ループフィルタの場合、エンコーダにおいて適用されたフィルタリングと、デコーダにおいて適用されたフィルタリングとは、同じフィルタデータに基づいており、類似している。
しかしながら、本発明の復号メカニズムは、ループフィルタリングとポストフィルタリングの両方を含んでもよい。それに対応して、フィルタデータは、エンコーダにおいてループフィルタとポストフィルタの両方に用いるために決定され、供給されてもよく、ループフィルタリングはまた、エンコーダとデコーダで等しく実行されてもよい。特に、ループフィルタはデブロッキングフィルタリングも実行してもよい。しかしながら、ループフィルタはまた、既存のデブロッキングフィルタに加えて動作してもよく、デブロッキングフィルタを使う必要が全くなくてもよい。
本発明の他の実施形態によれば、デコーダは、周波数領域に変換された予測誤差信号をエンコーダ側から取得し、それを空間領域に逆変換する。さらに、空間領域の動画像信号は、エンコーダ側から受け取った符号化データに基づいて、予測信号によって空間的または時間的に予測される。その後、再構築動画像信号は、空間領域の予測誤差信号と予測信号との和として算出される。好ましくは、周波数領域に変換された再構築信号か、周波数領域における取得された予測誤差信号の何れかである動画像信号にフィルタリングを適用する。
フィルタデータは、フィルタ係数、および/または周波数領域の動画像信号のオフセットを直接的に含んでもよい。好ましくは、フィルタデータは各スライス、特にスライスヘッダ内に提供される。しかしながら、フィルタデータは、他の定期的または不定期的な時間間隔でも、例えば、ピクチャ単位、マクロブロック単位、ブロック単位、または、そのようなピクチャ要素の数個単位で提供されてもよい。フィルタデータは、ストレージに格納されるか、符号化動画像信号と共に伝送チャネルを通して送信されることで提供される。
設計およびフィルタリングは、選択された周波数のみに対して実行されてもよい。特に、フィルタリングはDC周波数成分のみに適用されてもよい。
本発明の他の実施形態によると、周波数領域のフィルタリングは、フィルタリングに用いられた同一周波数の変換係数の評価に基づいて無効にされる。特に、係数の分散が、閾値と比較される。閾値は、固定されていてもよく、または、例えば量子化設定に基づいて動的に決定されてもよい。係数間の差分といった、他の評価基準が用いられてもよい。
本発明のフィルタリングは、好ましくは、フィルタリングされる対象ブロックに隣接する異なるブロックにおける同一周波数の変換係数に重み付けする。具体的には、隣接ブロックは、空間的に隣接するブロックであり、対象ブロックを囲む復号済みのブロックである。または、あるいはそれに加えて、隣接ブロックは、時間的に隣接するブロックであり、対象ブロックに対応する異なるフレーム(タイムインスタント)内のブロックである。好ましくは、その対応は動き予測を用いて決定される。しかしながら、フレーム内で対象ブロックと同じ位置にあるブロックが用いられてもよく、先行および/または後続フレームの他のブロックが用いられてもよい。
好ましくは、動画像信号はH.264/MPEG−4 AVC標準規格に基づいて符号化および/または復号され、フィルタデータは補助的拡張情報メッセージ内に提供される。しかしながら、本発明はH.264/MPEG−4 AVCや、その拡張版や後続規格に限定されるものではなく、標準化または特許化されたあらゆる動画像符号化メカニズムに用いられてもよい。
本発明のさらに他の実施形態によれば、予測信号と、量子化予測誤差信号と、再構築信号とが、フィルタリングのプロセスにおいて、つまり、エンコーダでフィルタデータを決定するとき、および/またはデコーダでフィルタを設定するときに別々に考慮される。または、予測信号または予測誤差信号のみがフィルタリングされる。2次以上のフィルタを用いるフィルタリングを実行する目的で、予測信号および/または既にフィルタリングされたブロックの予測誤差信号が、メモリに格納される。
本発明の他の態様によれば、本発明を実行するように適応した、コンピュータ読み取り可能なプログラムコードを実装したコンピュータ読み取り可能媒体を備えるコンピュータプログラム製品が提供される。
本発明の他の態様によれば、エンコーダ側からデコーダ側へ動画像信号を送信するためのシステムが提供される。このシステムは、上述のエンコーダと、符号化動画像信号を格納または送信するためのチャネルと、上述のデコーダとを備える。本発明の実施形態によれば、このチャネルは記憶手段に相当し、例えば、揮発性または非揮発性のメモリや、CD、DVDまたはBDのような光学または磁気記憶手段、ハードディスク、フラッシュメモリ、またはその他の記憶手段である。本発明の他の実施形態において、チャネルは伝送手段である。これは、インターネット、WLAN、UMTS、ISDN、xDSLなどの標準化または特許化された伝送技術/システムに準拠した、無線システム、有線システム、またはその両方の組み合わせであるリソースによって形成可能である。
本発明の目的および特徴は、上記以外のものも含め、付随する図面を参照しながら以下に説明される記述および好ましい実施形態によりさらに明確になる。
本発明によれば、符号化の過程で重畳されたノイズを、適切に除去することが可能となる。
図1は、従来のH.264/MPEG−4 AVCビデオエンコーダを示すブロック図である。 図2は、従来のH.264/MPEG−4 AVCビデオデコーダを示すブロック図である。 図3は、ウィナーフィルタ設計を示す概略図である。 図4は、デブロッキングフィルタの代わりに、ウィナーフィルタを備えるビデオエンコーダを示すブロック図である。 図5は、デブロッキングフィルタの補足としてウィナーフィルタを備えるビデオエンコーダを示すブロック図である。 図6は、予測信号、量子化予測誤差信号、および復号信号を伴う入力信号を別々に考慮することで設計されたポストフィルタを備えるビデオエンコーダを示すブロック図である。 図7は、取得されたポストフィルタ情報を用いて設定されたポストフィルタを備えるビデオデコーダを示すブロック図である。 図8は、従来の動画像復号装置の例を示すブロック図である。 図9Aは、平行移動不変変換のブロック図である。 図9Bは、非線形ノイズ除去フィルタのブロック図である。 図10は、平行移動不変変換の結果の例を示す図である。 図11Aは、原画信号xに平行移動不変変換を適用した例を示す図である。 図11Bは、再構築信号yに平行移動不変変換を適用した例を示す図である。 図12は、非線形ノイズ除去フィルタの処理を示す図である。 図13は、周波数領域に加えられたノイズを伴う符号化システムの例を示す概略図である。 図14は、周波数領域に加えられたノイズと空間領域に適用されたフィルタリングとを伴う符号化システムの例を示す概略図である。 図15は、空間領域に加えられたノイズと空間領域に適用されたフィルタリングとを伴う符号化システムの等価な例を示す概略図である。 図16は、周波数領域に加えられたノイズと周波数領域に適用されたフィルタリングとの両方を伴う符号化システムの例を示す概略図である。 図17は、符号化システムの例に用いられる空間領域ではなく、周波数領域においてフィルタリングを設計かつ適用することで達成される、最小平均二乗誤差の削減を表すグラフである。 図18Aは、本発明のビデオエンコーダを示すブロック図である。 図18Bは、本発明の他のビデオエンコーダを示すブロック図である。 図19Aは、本発明の好適な実施形態のビデオデコーダを示すブロック図である。 図19Bは、本発明の好適な実施形態の他のビデオデコーダを示すブロック図である。 図20Aは、周波数領域においてインループフィルタを実施する本発明の実施形態のビデオエンコーダを示すブロック図である。 図20Bは、図20Aに示される動画像符号化装置の動作を示すフローチャートである。 図21Aは、周波数領域においてインループフィルタを実施する本発明の実施形態のビデオデコーダを示すブロック図である。 図21Bは、図21Aに示される動画像符号化装置の動作を示すフローチャートである。 図22は、本発明のエンコーダまたはデコーダに適用される周波数領域のフィルタリングの例を示すブロック図である。 図23は、周波数領域においてポストフィルタを実施する本発明の他の実施形態のビデオエンコーダを示すブロック図である。 図24は、周波数領域においてポストフィルタを実施する本発明の他の実施形態のビデオデコーダを示すブロック図である。 図25は、本発明のエンコーダまたはデコーダに適用される周波数領域のフィルタリングの例を示すブロック図である。 図26は、周波数領域においてループフィルタを実施する本発明のビデオエンコーダの例を示すブロック図である。 図27は、デブロッキングフィルタに加え、周波数領域においてループフィルタを実施する本発明のビデオエンコーダの例を示すブロック図である。 図28は、周波数領域においてポストフィルタ設計を実施する本発明のビデオエンコーダの例を示すブロック図である。 図29は、周波数領域においてポストフィルタ設計を実施する本発明のビデオデコーダの例を示すブロック図である。 図30は、本発明のエンコーダまたはデコーダに適用される周波数領域のフィルタリングの他の例を示すブロック図である。 図31Aは、フィルタリングに用いられてもよい、空間的に隣接し、かつ重複していないブロックの例を示す概略図である。 図31Bは、フィルタリングに用いられてもよい、空間的に隣接し、かつ重複しているブロックの例を示す概略図である。 図32Aは、フィルタリングに用いられてもよい、時間的に隣接しているブロックの例を示す概略図である。 図32Bは、フィルタリングに用いられてもよい、時間的に隣接しているブロックの他の例を示す概略図である。 図33は、周波数領域において予測信号のフィルタリングを実施する本発明のビデオエンコーダの例を示すブロック図である。 図34は、周波数領域において予測信号のフィルタリングを実施する本発明のビデオデコーダの例を示すブロック図である。 図35は、予測誤差信号または予測信号にフィルタリングが適用される、本発明のエンコーダの例の一部分を示すブロック図である。 図36は、予測誤差信号または予測信号に無限インパルス応答フィルタリングが適用される、本発明のエンコーダの例の一部分を示すブロック図である。 図37は、本発明のエンコーダおよびデコーダを備えるシステムを示す概略図である。 図38は、本発明の符号化および復号を適用することで達成される結果を、技術水準の符号化および復号と比較して示すグラフである。 図39Aは、実施の形態6に係る変換部の一例を示す図である。 図39Bは、実施の形態6に係るフィルタ部の処理フローの一例を示す図である。 図40Aは、実施の形態6に係る変換部の他の例を示す図である。 図40Bは、実施の形態6に係るフィルタ部の処理フローの他の例を示す図である。 図41Aは、実施の形態6に係る変換部の他の例を示す図である。 図41Bは、実施の形態6に係るフィルタ部の処理フローの他の例を示す図である。 図42は、コンテンツ配信サービスを実現するコンテンツ供給システムの全体構成の一例を示す模式図である。 図43は、携帯電話の外観を示す図である。 図44は、携帯電話の構成例を示すブロック図である。 図45は、デジタル放送用システムの全体構成の一例を示す模式図である。 図46は、テレビの構成例を示すブロック図である。 図47は、光ディスクである記録メディアに情報の読み書きを行う情報再生記録部の構成例を示すブロック図である。 図48は、光ディスクである記録メディアの構造例を示す図である。 図49は、各実施の形態に係る画像符号化方法および画像復号方法を実現する集積回路の構成例を示すブロック図である。
本発明によれば、動画像信号のフィルタ設計およびフィルタリングは、空間周波数の領域(周波数領域)で実行される。さらに、デコーダが適切にフィルタリングを設定できるようにする目的で、エンコーダ側で入手できるがデコーダ側では入手できない情報が、符号化動画像データと共に提供される。本発明のデコーダでは、周波数領域においてブロック単位でフィルタが設定され、フィルタリングが適用される。
動画像信号をフィルタリングするフィルタを設計することと、周波数領域においてフィルタリングを行うことは、周波数領域にノイズが加えられた場合にも特に利点をもたらす。このことは実際、周波数領域に変換された動画像信号を量子化および送信/格納する今日の動画像符号化方法の大半に該当する。
以下に、空間領域で動作するウィナーフィルタと比較して、周波数領域で動作するウィナーフィルタの利点を、2つのサンプルを伴う1次元信号を符号化する例示的な符号化システムを用いて示す。
図13は、周波数領域における量子化を採用する考慮された例示的な符号化システムを示す。信号sがDCT変換部810に入力される。ここに適用されたDCT変換部810は、ブロックサイズが2の1次元離散コサイン変換(DCT)である。したがって、信号sの2つの連続したサンプルs(x)とs(x+1)とは、そのようなDCT変換部810を用いて周波数領域に変換される。その結果である2つの変換係数cおよびcは、下記の式6によって得られる。
Figure 2010061607
2つの変換係数cおよびcは、独立して量子化され、その結果、量子化変換係数c1’およびc2’が得られる。よって量子化変換係数c1’およびc2’は、変換係数cおよびcと、この例において量子化ノイズに対応するノイズnおよびnとの和として式7のように表されてもよい。
Figure 2010061607
DCT逆変換部820は、量子化変換係数c1’およびc2’に逆DCT変換を適用することによって、再構築サンプルs’(x)およびs’(x+1)を生成する。再構築サンプルs’(x)及びs’(x+1)は、式8で表される。
Figure 2010061607
離散コサイン変換は単一変換であるため、空間領域の平均二乗量子化誤差E[(s−s’)]は、変換(周波数)領域の平均二乗量子化誤差E[(c−c’)]と同じであり、その結果は上記例では式9のようになる。
Figure 2010061607
以下に、周波数領域のウィナーフィルタによるノイズ削減を、空間領域のウィナーフィルタによるノイズ削減と比較する。比較の単純性を保つため、以下の通り仮定する。ノイズの2つの成分nおよびnは、ゼロ平均であり、変換係数cおよびcとペア単位で無相関である。信号sはゼロ平均であり、少なくとも広義に定常である。これらの仮定に基づき、量子化ノイズ信号の最初の2つのモーメントは式10及び式11の通りである。
Figure 2010061607
Figure 2010061607
さらに、変換係数cに適用される量子化がないと仮定すると、式12のようになる。
Figure 2010061607
各i=0,1,2,…,に対する信号sの成分s(x+i)=sの最初の2つのモーメントは式13及び式14の通りである。
Figure 2010061607
Figure 2010061607
変換信号sおよびノイズのジョイントモーメントは、式15の通りである。
Figure 2010061607
信号sの任意の2つの連続するサンプルsおよびsi+1の相関係数は式16の通りである。
Figure 2010061607
ノイズを削減するウィナーフィルタは、フィルタの長さが1であり、1フィルタ係数のみを有する。このフィルタ係数は、空間領域のフィルタリングの場合はhと表され、周波数領域のフィルタリングの場合はhと表される。これらの仮定により、変換係数cおよびcの分散は、下記の式17及び式18によって得られる。
Figure 2010061607
Figure 2010061607
図14は、周波数領域の量子化と、空間領域の1フィルタ係数を有するノイズ削減ウィナーフィルタとを備える対応する符号化システムを示す。DCT変換部910、量子化部、およびDCT逆変換部920を備える符号化システムは、上記仮定を適用すること、および空間領域において1つのフィルタ係数hのみを有するノイズ削減のためのウィナーフィルタ930を用いることで簡易化されている。変換係数cの量子化により、フィルタリング後の入力信号sと信号s’の間の平均二乗誤差は、式19の通りになる。
Figure 2010061607
図15に示される符号化システムは、図14に示される符号化システムと等価である。ゼロ平均のノイズ信号n、分散σ2 q=(σ2 n/2)、および相関E[s・n]=0は、周波数領域に挿入されるノイズnと等価であり、空間領域の信号sに追加される。
入力信号sとフィルタリング後の信号s”との間の平均二乗誤差を最小化するフィルタ係数hは、E[(s−s”)]→minを意味するが、式20の微分関数をゼロに設定することで算出できる。
Figure 2010061607
上記式20の解により、式21の通り、平均二乗誤差を最小化するフィルタ係数hの最適値を得る。
Figure 2010061607
信号sと、空間領域のフィルタ係数hの最適値を用いてノイズ削減ウィナーフィルタリングを行った後の信号s”との間の対応する最小平均二乗誤差は、下記の式22によって得られる。
Figure 2010061607
図16は、DCT変換部1110の後に周波数領域において量子化を適用し、かつ、変換後に(周波数領域において)、1つの係数hを有するノイズ削減のためのウィナーフィルタ1130を適用する符号化システムを示す。DCT逆変換部1120は、ウィナーフィルタ1130から出力される信号c”に対して実行される。
変換係数cの量子化により、また上記と同じ仮定に基づき、変換係数c1と変換量子化信号c1’の間の平均二乗誤差は、σ2 nである。
フィルタリング後の変換された信号cと変換された量子化信号c”との間の平均二乗誤差を最小化するウィナーフィルタ1130のフィルタ係数hは、E[(c−c”)]→minを意味するが、式23の微分項をゼロに設定することで算出できる。
Figure 2010061607
上記式23の解により、平均二乗誤差を最小化するフィルタ係数hの最適値は、式24のように表される。
Figure 2010061607
信号cと、最適なフィルタ係数hを用いてウィナーフィルタでフィルタリングを行った後の信号c”との間の対応する最小平均二乗誤差は、下記の式25によって得られる。
Figure 2010061607
したがって、信号sと、周波数領域のノイズ削減のためのウィナーフィルタ1130による信号s”との間の最小平均二乗誤差は、式26の通りである。
Figure 2010061607
図17は、上記例における、空間領域のフィルタリングから生じる最小平均二乗誤差と、周波数領域のフィルタリングから生じる最小平均二乗誤差との比較である。当該グラフは、式27をグラフ化したものである。
Figure 2010061607
より具体的には、周波数領域の信号c’に適用されるウィナーフィルタ1130によって達成される最小平均二乗誤差の削減を、相関係数ρの値と、信号sの分散によって正規化された量子化ノイズnの分散とに関して、空間領域の信号s’に適用されるウィナーフィルタ930と比較して示したものである。
この例に関するグラフから分かるように、相関係数ρが1と等しくなく、量子化ノイズの分散がゼロよりも大きい場合は常に、平均二乗誤差が削減できる。したがって、2つのサンプルを有する1次元信号に関するこの例は、ノイズが挿入された領域のフィルタリングを行うことにより、平均二乗誤差を削減する結果となることを示している。
これらの考慮に基づき、本発明は、フィルタ設計およびフィルタリングが周波数領域で実行される、動画像符号化装置及び動画像復号方法、ならびに動画像信号の符号化方法および復号方法を提供する。
動画像符号化装置側で、周波数領域においてフィルタ設計が実行され、周波数領域の動画像信号のフィルタリングに用いられるフィルタデータが動画像復号装置側に提供される。動画像復号装置では、フィルタにフィルタ情報が設定され、周波数領域においてブロック単位で適用される。
動画像符号化装置と動画像復号装置とで類似の動作を保証する目的で、本発明の好適な実施形態によれば、フィルタ情報が符号化動画像データと共に、動画像符号化装置で供給される。動画像復号装置は、当該フィルタ情報を取得し、それにしたがってフィルタ特性を設定することができる。
図18Aおよび図18Bは、本発明の動画像符号化装置1300A、1300Bを概略的に示すものである。動画像符号化装置1300Aは、動画像信号1301を周波数領域に変換する変換部1310と、周波数領域に変換された動画像信号1311に基づいてフィルタ情報1331を生成するフィルタ設計部1330とを備える。
ここで動画像信号1301とは、画素値、または予測符号化が適用される場合は予測誤差値といった2次元信号を指す。動画像信号を周波数領域に変換する変換は、フーリエ変換、離散コサイン変換、KL(Karhunen−Loeve)変換、またはそのような変換の高速および/または整数版等の任意の変換であり得る。
その後、周波数領域に変換された動画像信号1311は、周波数領域の動画像信号のフィルタリングに用いられるフィルタ情報1331を決定するフィルタ設計部1330に用いられる。そのようなフィルタ情報1331は、フィルタ係数および/または周波数領域の動画像信号のオフセットであってもよい。しかしながら、そのようなフィルタ情報1331はまた、フィルタ係数の算出および/またはフィルタの設定に用いることができる周波数領域に変換された動画像信号に関連する任意の統計的情報であってもよい。フィルタ情報1331はまた、(変換、またはフィルタ設計部1330の一部として)量子化が変換後に適用される場合は、量子化および非量子化変換係数に基づいて決定されてもよい。
その後、フィルタ情報1331は、動画像復号装置側に提供される。ここで、動画像復号装置側にフィルタ情報1331を提供する利点は、動画像復号装置自体が取得できないフィルタ設定のための情報を、動画像復号装置に提供できる可能性があることである。そのような情報は、例えば、何らかの不可逆圧縮が行われる前の動画像信号に関連する情報である。
フィルタ情報1331と、周波数領域に変換された動画像信号1311の両方が、さらに符号化されてもよい。フィルタ設計部1330はまた、好ましくは、本発明の特定の実施形態に関して説明されるように、周波数領域の符号化および/または圧縮動画像信号を用いてフィルタ情報1331を決定する。
図18Bに示される動画像符号化装置1300Bは、さらに、周波数領域に変換された動画像信号1311にフィルタ処理を適用するフィルタ1340と、フィルタ設計部1330で生成されたフィルタ情報1331をフィルタ1340に設定するフィルタ設定部1335とを備える。
フィルタ1340を設定することは、実行されるフィルタリング動作を定義するフィルタ係数、動画像信号オフセット等のフィルタパラメータを提供することを含む。これらのパラメータは、フィルタ情報1331から取得されるか、フィルタ情報1331および恐らく変換された動画像信号1311に基づいて算出されるかの何れかである。
図19Aは、本発明の動画像復号装置1400A、1400Bの概略的に示すものである。図19Aに示される動画像復号装置1400Aは、周波数領域の動画像信号1411にフィルタ処理を適用するフィルタ1440と、フィルタ1440の設定を行うフィルタ設定部1435と、フィルタ1440によってフィルタ処理が施された周波数領域の動画像信号1411を空間領域の動画像信号1421に変換する逆変換部1420とを備える。
動画像復号装置1400Aには、フィルタ情報1431と、動画像信号1411とが入力される。フィルタ情報1431は、動画像符号化装置側、例えば、図18Aおよび13Bに示される動画像符号化装置1300A、1300Bのうちの1つによって提供される。フィルタ情報1431は、周波数領域の動画像信号1411のフィルタリングに用いられるフィルタ1440の設定に用いられる。
動画像復号装置1400Bに入力される動画像信号1401が周波数領域になければ、まず、図19Bに示されるように、変換部1410で周波数領域の動画像信号1411に変換されなければならない。フィルタ設定部1435は、フィルタ情報1431に加えて、周波数領域に変換された動画像信号1411を用いてフィルタ1440の設定を行ってもよい。
周波数領域のフィルタリング済み動画像信号1441は、逆変換部1420で空間領域に逆変換されてもよく、さらに処理されてもよい。しかしながら、フィルタ設定部1435は、フィルタ情報1431を取得も考慮もせずにフィルタ1440の設定を行ってもよい。フィルタ1440でのフィルタ処理は、ブロック単位で適用される。
(実施の形態1)
図20A及び図20Bを参照して、本発明の実施の形態1に係る動画像符号化装置1500を説明する。図20Aは、動画像符号化装置1500の機能ブロック図である。図20Bは、動画像符号化装置1500の動作を示すフローチャートである。
実施の形態1における符号化信号を生成する処理には、動画像信号から予測信号を減算して予測誤差信号を生成し、予測誤差信号を空間領域から周波数領域に変換し、量子化して量子化係数を生成する処理が含まれる。また、フィルタ情報は、周波数領域の予測誤差信号と、フィルタ処理が適用された後の周波数領域の量子化予測誤差信号との平均二乗誤差が最小になるように決定される。
動画像符号化装置1500は、図20Aに示されるように、減算器105と、変換/量子化部110と、加算器125と、デブロッキングフィルタ130と、逆変換部1520と、フィルタ設計部1530と、フィルタ1540と、エントロピー符号化部1590と、符号化信号を出力する出力部(図示省略)と、予測ブロック生成部(図示省略)とを備える。
この動画像符号化装置1500は、入力信号としての動画像信号を符号化し、符号化信号を出力する。出力先は特に限定されないが、例えば、DVD(Digital Versatile Disc)やBD(Blu−ray Disc)等の記録媒体でもよいし、伝送路を通じて動画像復号装置1600に伝送してもよい。
減算器105は、符号化対象ブロック(入力信号)から予測ブロック(予測信号)を減算して予測誤差信号を生成する。変換/量子化部110は、予測誤差信号をDCT変換(Discrete Cosine Transformation:離散コサイン変換)すると共に、量子化して量子化係数を生成する。エントロピー符号化部1590は、量子化係数をエントロピー符号化して符号化信号を生成する。なお、量子化係数と共に、動き予測部165で生成される動き補償データやフィルタ設計部1530で生成されるフィルタ情報1530等を含めてエントロピー符号化してもよい。
フィルタ設計部1530は、フィルタ係数と、第1及び第2のオフセット値とを含むフィルタ情報1531を生成する。より具体的には、周波数領域に変換された動画像信号と、フィルタ1540での処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように、各種フィルタ情報が決定される。フィルタ情報1531は、フィルタ1540に提供されると共に、エントロピー符号化部1590を経由して出力される。なお、出力されるフィルタ情報1531は、少なくともフィルタ係数及び第2のオフセット値が含まれている必要があり、第1のオフセット値は省略することができる。
フィルタ1540は、量子化後の周波数領域の信号に、フィルタ情報を用いてフィルタ処理を適用する。より具体的には、量子化の過程で重畳されたノイズを、周波数成分毎に除去する処理を適用する。実施の形態1におけるフィルタ1540は、変換/量子化部110で生成された量子化係数を逆量子化する。そして、逆量子化された信号に重畳されたノイズを、周波数成分毎に除去する。フィルタ処理の詳細は、後述する。
逆変換部1520は、フィルタ1540でフィルタ処理されると共に逆量子化された量子化係数をDCT逆変換して量子化予測誤差信号を生成する。加算器125120は、量子化予測誤差信号と予測ブロックとを加算して再構築信号を生成する。デブロッキングフィルタ130は、再構築信号からブロック歪みを除去して復号信号を生成する。
予測ブロック生成部は、符号化対象ブロック(入力信号)より前に符号化された画像に基づいて、当該符号化対象ブロックを予測した予測ブロックを生成する。この予測ブロック生成部は、メモリ140と、補間フィルタ150と、動き予測部165と、動き補償予測部160と、イントラフレーム予測部170と、スイッチ175とによって構成されている。
メモリ140は、復号信号を一時記憶する遅延器として機能する。より具体的には、変換/量子化部110で量子化され、且つ逆量子化されたブロックを順次記憶し、1枚の画像(ピクチャ)を記憶する。補間フィルタ150は、動き補償予測に先立って復号信号の画素値を空間的に補間する。動き予測部165は、復号信号と次の符号化対象ブロックとに基づいて動き予測を行い、動きデータ(動きベクトル)を生成する。動き補償予測部160は、復号信号と動きデータとに基づいて動き補償予測を行い、予測ブロックを生成する。イントラフレーム予測部170は、復号信号を画面内予測して予測信号を生成する。スイッチ175は、予測モードとして「イントラ」モード及び「インター」モードのいずれかを選択する。そして、スイッチ175から出力される予測ブロックは、次の符号化対象ブロックを予測した信号となる。
次に、図20Bを参照して、動画像符号化装置1500の動作を説明する。
まず、減算器105は、入力信号から予測信号を減算して、予測誤差信号を生成する(S11)。次に、変換/量子化部110は、予測誤差信号をDCT変換すると共に、量子化して量子化係数を生成する(S12)。
次に、フィルタ設計部1530は、予測誤差信号と量子化係数とを取得して、フィルタ情報1531を生成する。より具体的には、予測信号を周波数領域に変換(DCT変換)し、量子化係数を逆量子化する。そして、周波数領域の予測信号と、逆量子化され、且つフィルタ処理された後の信号との平均二乗誤差が最小となるようなフィルタ情報1531を生成する。
次に、エントロピー符号化部1590は、量子化係数、動きデータ、及びフィルタ情報1531をエントロピー符号化して符号化信号を生成する(S14)。なお、フィルタ情報1531は、量子化係数等と合わせてエントロピー符号化してもよいし、これらとは別に出力してもよい。一方、エントロピー符号化部1590の動作と平行して、フィルタ1540は、フィルタ情報1530を用いて、量子化係数にフィルタ処理を適用する(S15)。
次に、逆変換部1520は、フィルタ1540からの出力信号をDCT逆変換して量子化予測誤差信号を生成する。また、加算器125は、量子化予測誤差信号と予測ブロックとを加算して再構築信号を生成する。デブロッキングフィルタ130は、再構築信号からブロック歪みを除去して復号信号を生成する。そして、予測ブロック生成部は、復号信号に基づいて予測ブロックを生成する(S16)。
次に、図21A及び図21Bを参照して、本発明の一実施形態に係る動画像復号装置1600の構成及び動作を説明する。図21Aは、動画像復号装置1600のブロック図である。図21Bは、動画像復号装置1600の動作を示すフローチャートである。
実施の形態1における符号化信号は、動画像信号が空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られる。また、復号信号を生成する処理には、符号化信号をエントロピー復号して復号信号としての量子化係数を生成する処理が含まれる。さらに、フィルタ処理には、量子化係数にフィルタ処理を適用すると共に、当該量子化係数を逆量子化する処理が含まれる。
動画像復号装置1600は、図21Aに示されるように、符号化信号を取得する取得部(取得部)と、エントロピー復号部1690と、フィルタ1640と、逆変換部1620と、加算器225と、デブロッキングフィルタ230と、予測ブロック生成部(図示省略)とを備える。この動画像復号装置1600は、図20Aに示される動画像符号化装置1500で符号化された符号化信号を復号して復号ブロック(復号信号)を生成する。
エントロピー復号部1690は、動画像符号化装置1500から出力された符号化信号をエントロピー復号して、量子化係数、動きデータ、及びフィルタ情報1691を取得する。フィルタ1640は、フィルタ1540と同様に、フィルタ情報1691を用いて、量子化係数にフィルタ処理を適用する。
逆変換部1620は、フィルタ1640から出力される信号をDCT逆変換することにより、量子化予測誤差信号を生成する。加算器225は、逆変換部1620から出力される量子化予測誤差信号と、予測ブロック生成部から出力される予測信号とを加算して、再構築信号を生成する。デブロッキングフィルタ230は、加算器225から出力される再構築信号に対して適用され、ブロックのエッジを平滑化して主観的画質を改善する。
予測ブロック生成部は、メモリ240と、イントラフレーム予測部270と、動き補償予測部260と、補間フィルタ250と、スイッチ275とを備える。この予測ブロック生成部は、基本的な構成及び動作は共通するが、動き予測部170を省略して、動きデータをエントロピー復号部1690から取得する点が異なる。
次に、図21Bを参照して、動画像復号装置1600の動作を説明する。
まず、エントロピー復号部1690は、符号化信号をエントロピー復号して、量子化係数、動きデータ、及びフィルタ情報1691を取得する(S21)。次に、フィルタ1640は、フィルタ情報1691を用いて、量子化係数にフィルタ処理を適用する(S22)。
次に、逆変換部1620は、フィルタ1640から出力される信号をDCT逆変換することにより、量子化予測誤差信号を生成する。次に、加算器225は、量子化予測誤差信号と予測ブロックとを加算して再構築信号を生成する(S23)。また、デブロッキングフィルタ230は、再構築信号からブロック歪みを除去する。次に、予測ブロック生成部は、予測ブロックを生成する(S24)。本発明の実施形態によれば、周波数領域のフィルタ設計およびフィルタリングは、ループフィルタリング用に採用される。図20Aおよび図21Aは、それぞれ、そのような動画像符号化装置1500および動画像復号装置1600の例を示す。
(変換された)予測誤差信号、および対応する量子化変換係数に基づき、フィルタ設計部1530が、周波数フィルタ1540が使用するフィルタ係数を予測し、量子化変換係数をフィルタリングする。その後、フィルタ係数は、符号化のために新たなループフィルタ情報1531内のエントロピー符号化部1590に提供されてもよい。しかしながら、フィルタ係数そのものを提供/符号化する必要がなくてもよい。
新たなループフィルタ情報1531は、概して、動画像符号化装置1500と類似の方法で動画像復号装置1600側にフィルタを設定するために必要な情報を含むべきである。それは、動画像復号装置1600がフィルタ係数を決定できるようにするいかなる情報でもよい。
エントロピー符号化部1590は、指数ゴロム、ゴロム、ユニタリー符号、または符号化される新たなループフィルタ情報の特定の統計を考慮して設計された符号等の整数可変長符号を用いてもよい。符号化された新たなループフィルタ情報は、その後、他の符号化動画像データと共に動画像復号装置1600側に提供される。動画像符号化装置1500におけるフィルタリング済み変換係数は、逆変換部1520で逆変換され、フィルタリング済み量子化予測誤差信号が取得される。
動画像復号装置1600において、新たなループフィルタ情報1691が、エントロピー復号部1690によって復号され、フィルタ設計およびフィルタ処理を実行するフィルタ1640に提供される。フィルタ設計は、フィルタ係数が動画像符号化装置1500から直接提供されない場合に、新たなループフィルタ情報に基づいてフィルタ係数を算出するために必要である。フィルタ1640は、そのように算出されたフィルタ係数を用いて設定されるか、またはフィルタ係数および恐らく新たなループフィルタ情報1691内で取得された他の必要なデータを取得したエントロピー復号部1690から直接設定される。
その後、量子化変換係数がフィルタ1640によってフィルタリングされ、逆変換部1620によって逆変換され、対応するフィルタリング済み量子化予測誤差信号値となり、さらに予測信号に加えられ、再構築信号を得る。再構築信号は、例えば、デブロッキングフィルタ230によって、さらにフィルタリングされてもよい。
図22は、動画像符号化装置1500および/または動画像復号装置1600に採用された例示的な周波数領域のフィルタ1540、1640の詳細を示す。K個の量子化変換係数c1’,…,ck’から、個々のオフセットo1’,…,ok’(第1のオフセットに相当する。以下同じ。)が減算され、オフセット無しの変換係数c1”,…,ck”となる。好ましくは、オフセットo1’,…,ok’は、各量子化変換係数c1’,…,ck’の平均値E[c1’],…,E[ck’]に対応する。
各変換係数c1”,…,ck”は、その後、フィルタ1740でフィルタリングされ、K個の量子化変換係数c1”’,…,ck”’となる。なお、フィルタ1740は、各変換係数c1”,…,ck”それぞれに対応する独立したフィルタ1〜Kを含む。このフィルタ1〜Kには、各変換係数c1”,…,ck”それぞれに適応するフィルタ係数が個別に設定される。
フィルタリング後に、個々のオフセットo,…,o(第2のオフセットに相当する。以下同じ。)の各々がK個のフィルタリング済み変換係数c1”’,…,ck”’の各々に加算される。オフセットo,…,oは、好ましくは、原予測誤差信号sの変換係数c,…,cの平均値である。結果として得られた変換係数1741は、逆変換部1520、1620で逆変換される。逆変換部1520、1620からの出力信号e’は、フィルタリング済み量子化予測誤差値(残差)に対応する。
動画像符号化装置1500において、(M個のフィルタ係数によって得られる)M次のフィルタでK個の変換係数(k=l,…,K)をフィルタリングするフィルタ係数wl,k,…,wM,kが、例えば、ウィナーフィルタとして算出される。動画像復号装置1600が動画像符号化装置1500と同じフィルタリングを行えるようにする目的で、フィルタ情報1531は、オフセットo,…,oおよびフィルタ係数w1,k,…,wM,kを含む。
図22に示されるフィルタ処理は、復号信号を構成する複数のブロックそれぞれについて、処理対象ブロックの各周波数成分の値と、処理対象ブロックに時間的又は空間的に隣接するブロックの対応する周波数成分の値とを、フィルタ情報に含まれる重み係数を用いて重み付け加算するステップと、重み付け加算を実行する前の処理対象ブロックに対して、各周波数成分の値から第1のオフセット値を減算するステップと、重み付け加算した後の処理対象ブロックに対して、各周波数成分の値にフィルタ情報に含まれる第2のオフセット値を加算するステップとを含む。
なお、重み係数は、フィルタ処理が適用された後の周波数領域の処理対象ブロックと、周波数領域の動画像信号に含まれる処理対象ブロックに対応するブロックとの平均二乗誤差が最小になるように決定されている。また、第1のオフセット値は、周波数領域の復号信号に含まれるブロックのうち、処理対象ブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に算出される。さらに、第2のオフセット値は、周波数領域の動画像信号に含まれるブロックのうち、処理対象ブロックに対応するブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に算出されている。
より具体的には、フィルタ1540、1640は、量子化の行われるブロック単位の信号に対して適用される。すなわち、c1’,…,ck’は、量子化係数の各周波数成分の値(すなわち、k=64)に相当する。
フィルタ処理の第1の工程では、量子化係数の各周波数成分の値(c1’,…,ck’)から第1のオフセット値(o1’,…,ok’)を減算する。この第1のオフセット値(o1’,…,ok’)は、量子化係数の各周波数成分の値(c1’,…,ck’)を、時間的又は空間的に連続する複数のブロックから抽出して同一周波数成分毎に平均した値である。
次に、フィルタ処理の第2の工程では、第1のオフセット値(o1’,…,ok’)が減算された後の量子化係数(c1”,…,ck”)を逆量子化し、フィルタ1740を適用する。フィルタ1740は、周波数成分毎のフィルタ1〜Kで構成されており、それぞれにフィルタ係数w1,…,wkが提供される。また、フィルタ係数wkは、M(たとえば、M=9)個の重み係数w1,k,…,wM,kで構成される。この重み係数は、処理対象ブロックの各周波数成分の値と、処理対象ブロックに時間的又は空間的に隣接するブロックの対応する周波数成分の値とを、重み付け加算するのに使用される。
なお、この重み係数w1,k,…,wM,kは、フィルタ1740から出力されるフィルタリング済み変換係数(c1”’,…,ck”’)と、原予測誤差信号sの変換係数(c,…,c)から第2のオフセット値(o1,…,ok)が減算された値(c−o1,…,c−ok)との平均二乗誤差が最小となるように決定される。
次に、フィルタ処理の第3の工程では、フィルタリング済み変換係数(c1”’,…,ck”’)に第2のオフセット値(o1,…,ok)が加算される。この第2のオフセット値(o1,…,ok)は、原予測誤差信号sの変換係数(c,…,c)を、時間的又は空間的に連続する複数のブロックから抽出して同一周波数成分毎に平均した値である。
フィルタ係数を送信する代わりに、動画像復号装置1600で取得できないフィルタ係数取得に必要な情報を送信してもよい。そのような情報は、量子化前の入力変換係数c,…,cに関連する任意の情報であり、フィルタ係数w1,k,…,wM,kの算出に用いることができる。ウィナーフィルタ設計の場合、例えば、入力変換係数とフィルタリング済み変換係数との間の相互相関ベクトル、またはノイズの自己相関等が送信されてもよい。符号化動画像信号と共にオフセットo,…,oを提供することで、フィルタリング後の画質が向上する。しかしながら、オフセットo,…,oを提供せずに本発明を実施することも可能である。
この例において、M次のフィルタは、個々の変換係数のフィルタリングに用いられる個々の係数フィルタに対して等しい。しかしながら、異なる変換係数のフィルタリングに用いられるフィルタ次数が異なれば、利点となる場合がある。様々な変換係数に対する特定のフィルタ次数M,…,Mは、その後、固定される(デフォルトまたは動画像符号化装置/動画像復号装置に設定される)か、フィルタ情報と共に信号送信される。
(実施の形態2)
図23及び図24を参照して、本発明の実施の形態2に係る動画像符号化装置1800及び動画像復号装置1900を説明する。本発明の実施の形態2によれば、周波数領域のフィルタ設計およびフィルタリングは、再構築画像/動画像信号に対し動作するポストフィルタに適用される。図23および図24は、それぞれ、そのような動画像符号化装置1800および動画像復号装置1900を示す。なお、実施の形態1に係る動画像符号化装置1500及び動画像復号装置1600と共通する構成要素には同一の参照番号を付し、詳しい説明を省略する。
実施の形態2に係る符号化信号を生成する処理には、周波数領域の動画像信号を量子化し、逆量子化して再構築信号を生成する処理が含まれる。また、フィルタ情報は、周波数領域の動画像信号と、フィルタ処理が適用された後の周波数領域の再構築信号との平均二乗誤差が最小になるように決定される。
動画像符号化装置1800は、図23に示されるように、フィルタ設計部1530及びフィルタ1540を省略する代わりに、フィルタ設計部1830を備える点で図20Aに示される動画像符号化装置1500と相違する。
フィルタ設計部1830は、動画像復号装置1900のフィルタ1940で使用されるフィルタ情報1831を生成する。具体的には、入力信号と再構築信号とを取得し、それぞれを周波数領域に変換する。そして、周波数領域の入力信号と、フィルタ1940でフィルタ処理された後の周波数領域の再構築信号との平均二乗誤差が最小となるようにフィルタ情報1831を決定する。
動画像復号装置1900は、図24に示されるように、フィルタ1640を省略する代わりに、フィルタ1940を備える点で図6Aに示される動画像復号装置1600と相違する。
実施の形態2に係る符号化信号は、動画像信号から予測信号が減算され、空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られる。また、復号信号を生成する処理には、符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換し、予測信号を加算して復号信号としての再構築信号を生成する処理が含まれる。さらに、フィルタ処理には、再構築信号を空間領域から周波数領域に変換する処理と、周波数領域の再構築信号にフィルタ処理を適用する処理と、フィルタ処理を適用した後の再構築信号を周波数領域から空間領域に逆変換する処理とが含まれる。
フィルタ1940は、加算器225から出力される再構築信号を空間領域から周波数領域に変換し、周波数領域の信号に対してフィルタ情報1991を用いてフィルタ処理を適用し、フィルタ処理後の信号を周波数領域から空間領域に逆変換する。
動画像符号化装置1800内に実装された周波数領域のポストフィルタを設計するフィルタ設計部1830が、新たなポストフィルタ情報1831をエントロピー符号化部1890に提供する。ここで、新たなポストフィルタ情報1831は、フィルタ係数を直接含むか、動画像復号装置1900がポストフィルタ係数を算出できるようにする任意の他の情報を含んでもよい。
動画像符号化装置1800側において、ポストフィルタリングは予測ループで用いられないため、適用される必要はない。フィルタ設計部1830は、入力信号と再構築信号とに基づいて提供されるフィルタ係数、または他の関連情報を算出する。フィルタ係数は、例えば、ウィナーフィルタ係数として予測されてもよく、またはその代わりに、入力信号と再構築信号との間の相互相関、ノイズの自己相関、もしくはノイズと信号との間の相関といった統計的データとして提供されてもよい。
動画像復号装置1900において、符号化動画像データと共に動画像符号化装置1800により提供された新たなポストフィルタ情報1991は、エントロピー復号部1990によって復号される。フィルタ1940は、新たなポストフィルタ情報1991と再構築動画像信号とを取得することができ、かつ、フィルタを設定し、再構築信号をフィルタリングすることができる。
図25は、本発明のこの実施形態に用いられる周波数領域の例示的なフィルタ1940の詳細を示す。再構築信号s’が、変換部2010で周波数領域に変換される。好ましくは、予測誤差の符号化に、動画像符号化装置1800の変換/量子化部110における変換と同じ変換手法が用いられる。これにより、ソフトウェアおよび/またはハードウェアにおいて可能な実施態様を簡易化してもよい。しかしながら、動画像符号化装置1800による変換手法と異なる変換、例えば機能および/またはサイズに基づく変換もまた用いられてもよい。当該変換はまた、フィルタ設計部1830の一部として選択されてもよく、選択された変換は、符号化動画像データと共に動画像復号装置1900に提供されてもよい。当該選択は、予め定められた変換の組から実行されてもよく、または、変換マトリクス全体が決定され信号送信されてもよい。
変換部2010は、入力再構築信号s’をK個の変換係数c1’,…,ck’に変換する。K個の変換係数c1’,…,ck’から、個々のオフセットo1’,…,ok’(第1のオフセット値)が減算され、変換係数c1”,…,ck”となる。やはり、オフセットo1’,…,ok’は、好ましくは、対応する変換係数c1’,…,ck’を、時間的又は空間的に隣接する複数のブロックから抽出して平均した値である。
オフセットを減算した後の変換係数c1”,…,ck”の各々は、フィルタ2040でフィルタリングされ、K個のフィルタリング済み変換係数c1’”,…,ck’”となる。
K個のフィルタリング済み変換係数c1’”,…,ck’”の各々に対し、個々のオフセットo,…,o(第2のオフセット値)が加算される。オフセットo,…,oは、好ましくは、原入力信号sの変換係数c1,…,cを、時間的又は空間的に隣接する複数のブロックから抽出して平均した値に対応する。結果として得られた変換係数2041は、逆変換部2020で逆変換される。出力信号s”は、フィルタリング済み再構築画像を表す。
既に説明した本発明の実施の形態1と同様に、フィルタ係数w1,k,…,wM,kおよびオフセットo,…,oは、好ましくは、エントロピー符号化部1890でエントロピー符号化され、動画像符号化装置1800から動画像復号装置1900に提供される。さらに、変換部2010および/または逆変換部2020で適用される変換手法を信号で伝える変換情報が、動画像符号化装置1800から動画像復号装置1900に送信されてもよい。そのような変換情報は、予め定められた固定の組となっている実行可能な変換のうちの1つを指定するものであってもよい。または、変換および/または逆変換マトリクスが信号送信されてもよい。他の可能性として、受信した動画像データに基づいて変換を暗示的に決定すること等も実施されてもよい。動画像データという用語は、符号化済み量子化変換係数と共に送信される、動画像シーケンスを正しく復号するために必要な全てのシンタックス要素を指す。
(実施の形態3)
図26及び図27を参照して、本発明の実施の形態3に係る動画像符号化装置2100、2200を説明する。本発明の実施の形態3によれば、周波数領域のフィルタリングは、再構築動画像信号に適用される。図26および図27は、そのような動画像符号化装置2100、2200の例を示す。なお、実施の形態1に係る動画像符号化装置1500及び動画像復号装置1600と共通する構成要素には同一の参照番号を付し、詳しい説明を省略する。
特に、図26に示される動画像符号化装置2100は、デブロッキングフィルタ130の代わりにフィルタ及び設計部2140を備える点で図20Aに示される動画像符号化装置1500と相違する。フィルタ及び設計部2140は、フィルタ設計およびフィルタ処理を実行する。フィルタの係数は、入力動画像信号(所望の信号)と再構築動画像信号とに基づいて、周波数領域において算出される。その後、フィルタ情報2131が、符号化のためエントロピー符号化部2190に提供される。
図27に示される動画像符号化装置2200は、デブロッキングフィルタ130に加えて、その後に動作するフィルタ及び設計部2230を備える点で図20Aに示される動画像符号化装置2200と相違する。フィルタ及び設計部2230は、入力(所望の)動画像信号と、再構築かつデブロッキングされた動画像信号とに基づいて、周波数領域において算出されたフィルタ係数等のフィルタ情報2231を、エントロピー符号化部2290に提供する。
なお、図26及び図27に示されるフィルタ及び設計部2140、2230は、例えば、図23に示されるフィルタ設計部1830と同様の方法でフィルタ情報2131、2231を生成すると共に、図25に示されるような方式でフィルタ処理を実行する。但し、図27に示されるフィルタ及び設計部2230は、デブロッキングフィルタ130から出力される信号を取得する点で、加算器125から出力される信号を直接取得する図23及び図26の例と異なる。
周波数領域のループフィルタを備える動画像符号化装置2100、2200に対応する動画像復号装置は、基本的に、フィルタリングに用いられる動画像符号化装置2100、2200と類似の機能的ブロックを備える。フィルタ設計は、取得されたフィルタ情報および/または局所的に算出された情報に基づいて実行される。フィルタ設定後、再構築動画像信号は、周波数領域においてフィルタリングされる。
(実施の形態4)
図28〜図30を参照して、本発明の実施の形態4に係る動画像符号化装置2300及び動画像復号装置2400を説明する。本発明の実施の形態4によれば、予測信号と、量子化予測誤差信号と、再構築信号とが、フィルタリング(設計)のプロセスにおいて別々に考慮される。図28は、動画像符号化装置2300の機能ブロック図である。図29は、動画像復号装置2400の機能ブロック図である。図30は、実施の形態4に係るフィルタリングのプロセスの例を示す。なお、実施の形態1に係る動画像符号化装置1500及び動画像復号装置1600と共通する構成要素には同一の参照番号を付し、詳しい説明を省略する。
実施の形態4に係る符号化信号を生成する処理には、動画像信号から予測信号を減算して予測誤差信号を生成し、予測誤差信号を空間領域から周波数領域に変換し、量子化し、逆量子化し、周波数領域から空間領域に変換して量子化予測誤差信号を生成し、量子化予測誤差信号に予測信号を加算して再構築信号を生成する処理が含まれる。また、フィルタ情報は、周波数領域の予測信号、周波数領域の量子化予測誤差信号、及び周波数領域の再構築信号に基づいて、周波数領域の予測誤差信号と、フィルタ処理が適用された後の周波数領域の量子化予測誤差信号との平均二乗誤差が最小になるように決定される。
図28に示される動画像符号化装置2300は、入力(所望の)動画像信号、予測信号、量子化予測誤差信号、および復号(再構築かつデブロッキングされた)動画像信号に基づいて周波数領域のフィルタ情報2331を決定するフィルタ設計部2330を備える点で図20Aに示される動画像符号化装置1500と相違する。フィルタ情報2331は、エントロピー符号化部2390に提供される。
フィルタ設計部2330は、周波数領域の予測誤差信号と、フィルタ2440でフィルタ処理が適用された後の周波数領域の量子化予測誤差信号との平均二乗誤差が最小になるように、フィルタ情報2331を決定する。
図29に示される動画像復号装置2400は、動画像符号化装置2300に対応する動画像復号装置2400を示す。
エントロピー復号部2490は、フィルタ情報2491を復号し、それをフィルタ2440に提供する。フィルタ2440はポストフィルタを設定し、それを再構築信号に適用する。ここで、フィルタの設定はまた、特に、フィルタ係数の代わりに、フィルタ係数の算出に必要な情報が提供される場合に、動画像符号化装置2300側でのフィルタ設計部2330と類似のフィルタ設計も含んでもよい。
フィルタ設計部2440は、量子化予測誤差信号、予測信号、及び再構築信号を空間領域から周波数領域に変換する。そして、周波数領域に変換された各信号の互いに対応するブロックに含まれる同一周波数成分の値毎に、フィルタ情報2491を用いてフィルタ処理を適用する。
図30は、動画像復号装置2400のフィルタ2440の詳細を示す図である。
この例における符号化信号は、動画像信号から予測信号が減算されて予測誤差信号が生成され、当該予測誤差信号が空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られる。また、復号信号を生成する処理には、符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換して量子化予測誤差信号を生成し、量子化予測誤差信号と予測信号とを加算して再構築信号を生成する処理が含まれる。また、フィルタ処理は、復号信号としての量子化予測誤差信号、予測信号、及び再構築信号の互いに対応するブロックに含まれる同一周波数成分の値をフィルタ情報に含まれる重み係数を用いて重み付け加算するステップを含む。さらに、重み係数は、周波数領域の予測誤差信号と、フィルタ処理が適用された後の周波数領域の量子化予測誤差信号との平均二乗誤差が最小になるように決定される。
このフィルタ2440では、予測信号s^、量子化予測誤差信号e’、および再構築信号s’がフィルタリングにおいて別々に考慮される。
量子化予測誤差信号e’の変換係数c1,e’’,…,ck,e’’を、時間的又は空間的に隣接する複数のブロックから抽出して平均した値と、原予測誤差信号eの変換係数c,…,cを、時間的又は空間的に隣接する複数のブロックから抽出して平均した値とを調整する目的で、図22を参照して既に簡潔に説明したように、平均調整が行われる。
この目的のため、オフセットo1,e’’,…,ok,e’’が、ok,e’’=E[ck,e’’]として算出される。ただし、k=1,…,Kである。オフセットo,…,oが、o=E[c]として算出される。ただし、k=1,…,Kである。ここで算出とは、量子化予測誤差信号e’の平均と、原予測誤差信号eの平均とを、例えば複数の対応するサンプルに渡る平均として予測することを指す。
周波数領域の各変換係数に対するK個のフィルタ設計の最適化基準は、所望の信号c−o,…,c−oとの間の最小平均二乗誤差であり、この所望の信号は、オフセット信号o,…,o無しの原予測誤差信号eの変換係数、およびフィルタリング済み信号c1”’,…,ck”’に対応する。線形フィルタリングが、式28の通り実行される。
Figure 2010061607
ここで、w1,k,…,wM,kは、周波数領域のK個のフィルタのM・Kフィルタ係数であり、1つのM次フィルタ、つまり、各周波数成分に対しM個のフィルタ係数を有するフィルタである。そのような個別フィルタの各々は、例えば、図31Aおよび図31Bに示されるようなMブロックに置かれた同一周波数成分のM個の変換係数ck,m”に重み付けする。
特に、図31Aは、重複していない9個のブロックの配置を示し、当該ブロックの変換係数はフィルタリングに用いられる。しかしながら、ブロック間の相関がより高い可能性があるため、重複するブロックの変換係数を用いる方が利点となる場合がある。対称的に重複するブロックの配置が、図31Bに示される。しかしながら、当該ブロックは、領域のサイズが異なる分、非対称に重複してもよい。重複の方法は、例えば、ブロックの特性にしたがって選択してもよい。さらに、重複は、対象ブロックに対し単一画素(またはサブピクセル)単位で隣接ブロックをずらすことで最大化されてもよい。そのような場合は、フィルタリング済み信号が複数表示され、さらに任意に選択され、かつ/または所望のフィルタリング済み画像を取得するために組み合わされてもよい。
または、フィルタリングにより、時間軸において対象ブロックに隣接する同一周波数のブロック、つまり先行および/または後続フレームのブロックに対応する変換係数に重み付けしてもよい。そのような隣接ブロックの2つの例を、それぞれ図32Aおよび27Bに示す。
図32Aは、対象ブロック2701を含むフレーム2710を示す。時間的に対象ブロック2701に隣接するブロック2702は、フレーム2710に時間的に隣接するフレーム2720にある。他の時間的に隣接するフレームからの他の時間的に隣接するブロックは、M番目のフレーム2730内のM番目のブロック2703までのフィルタリングに考慮可能である。この例において、時間的に隣接するブロック2701、2702、…、2703は、動画像シーケンスの異なるフレーム内で同じ位置に位置する。
図32Bは、対象ブロック2751を有するフレーム2750、および対象ブロック2751に時間的に隣接するブロック2752を有するフレーム2760の他の例を示す。フレーム2750に隣接するフレーム2760内のブロック2752は、動き予測によって取得される。動きベクトル2780は、フレーム2760の最適なブロック2752がフレーム2750の対象ブロック2751となった動きを示す。よって、この例において、時間的に隣接するブロックは、動き予測、つまり隣接フレーム2760の対象ブロック2751に対する最適なブロック2752を見つけることによって取得されたブロックである。他の隣接フレーム(例えば、フレーム2770)のブロック(例えば、ブロック2753)は、対象ブロック2751に対する最適なブロックとして、または隣接フレーム2760内のブロック2752のような対象ブロックの他の隣接ブロックに対する最適なブロックとされてもよい。
図32Bに示されるように、フィルタリングに用いられる隣接ブロックを決定するために動き補償を適用することで、図32Aの例の統計よりも類似した統計を有する隣接ブロックの組が得られる。概して、フィルタリングに用いられる一時的に隣接するブロックは、必ずしも直接的に隣接したフレームにあるわけではない。例えば、遮蔽の場合、隣接フレームからのブロックは、フィルタリングに考慮する必要はない。さらに、M個の隣接ブロックは、既に符号化/復号されたフレームからだけではなく、対象ブロックを含むフレームの後続フレームからも選択されてよい。M個の隣接ブロックはまた、対象ブロックに時間的に隣接したブロックと空間的に隣接したブロックの両方から選択されてもよい。
所望の信号c−o,…,c−oと、フィルタリング済み信号c1”’,…,ck”’の間の平均二乗誤差を最小化するフィルタ係数wk,1,…,wk,Mは、式29のWiener−Hopf方程式の解により決定できる。
Figure 2010061607
フィルタ係数wk,1,…,wk,Mの計算には、Wiener−Hopf方程式における全ての期待される値(相関項)の知識を要する。同様に、動画像復号装置2400のフィルタ2440で用いられるフィルタ情報2491は、動画像符号化装置2300のフィルタ設計部2330で上記の方法で算出される。やはり、再構築信号s’の変換係数c1’,…,ck’ を、時間的又は空間的に隣接する複数のブロックから抽出して平均した値と、原入力信号sの変換係数c,…,cを、時間的又は空間的に隣接する複数のブロックから抽出して平均した値とは、ok’=E[ck’]に対応するオフセットo1’,…,ok’、およびo=E[c]に対応するオフセットo,…,oによって調整される。
ここで、k=1,…,Kである。所望の信号c−o,…,c−oと、フィルタリング済み信号c1”’,…,ck”’の間の平均二乗誤差を最小化することでフィルタ係数を取得すると、やはり、上記のようなWiener−Hopf方程式の方式になる。
動画像符号化装置2100、2200、2300および/または対応する動画像復号装置2400の各例に用いられるフィルタ設計の例を以下に示す。フィルタ設計の結果は、例えば、図30に示されるフィルタの設定に用いられてもよい。
ここで、予測信号s^、量子化予測誤差信号e’、および再構築信号s’が別々に考慮される。対応するオフセットo1,s’’,…,ok,s’’はok,s’’=E[ck,s’’]として算出され、オフセットo1,e’’,…,ok,e’’はok,e’’=E[ck,e’’]として算出され、オフセットo1,s^’,…,ok,s^’はok,s^’=E[ck,s^’]として算出され、オフセットo1,…,okはok=E[ck]として算出される。ここでk=1,…,Kである。
周波数領域のK個のフィルタの設計の最適化基準は、やはり、所望の信号c−o,…,c−oとフィルタリング済み信号c1”’,…,ck”’との間の最小平均二乗誤差である。線形フィルタリングは式30のように実行される。
Figure 2010061607
ここで、wk,s’,1,…,wk,s’,Mは、再構築信号に用いられるM・Kフィルタ係数であり、wk,s^,1,…,wk,s^,Nは、予測信号に用いられるN・Kフィルタ係数であり、wk,e’,1,…,wk,e’,Oは、量子化予測誤差信号に用いられるO・Kフィルタ係数である。パラメータM、N、およびOはフィルタの次数を表す。各フィルタは、M+N+Oブロックの同一周波数成分のM+N+O変換係数ck,s’,m”,ck,s^,n”,ck,e’,o”に重み付けする。
所望の信号c−o,…,c−oと、フィルタリング済み信号c1”’,…,ck”’の間の平均二乗誤差を最小化するフィルタ係数は、式31のWiener−Hopf方程式の方式により決定できる。
Figure 2010061607
ここで、[x]は、xとxの間の全ての相互相関項からなるサブマトリクスを表す。周波数領域におけるフィルタ設計および/またはフィルタリングは、選択された周波数のみに対して実行されてもよい。例えば、DC係数のみがフィルタリングされてもよい。または、例えば、最初のL個の係数の組がフィルタリングされてもよく、フィルタリング対象の係数が動画像の内容に基づいて決定されてもよい。特に、変換係数の値が、フィルタリングを適用すべきか否かを決定する目的で評価される。
これにより、例えば、フィルタリング対象の変換係数値が大幅に異なる場合に、フィルタリングを無効にする可能性が生じる。変換係数値は、好ましくは閾値との比較に基づいて評価される。例えば、対象ブロックの変換係数と、フィルタリングに用いられる他のブロックとの差分が算出され、それに基づいてフィルタリングが有効または無効にされる。
係数間の差分が閾値を超えれば、フィルタリングが無効にされる。超えなければ、フィルタリングが有効にされる。この決定は、または、分散等の、近隣ブロック内の変換係数の統計に基づいて行うことができる。フィルタリングに用いられる近隣ブロックにおける同一周波数の変換係数の分散が閾値を超えれば、フィルタリングが無効にされる。周波数成分毎の閾値は、量子化パラメータに基づいて設定されてもよく、固定されてもよく、符号化動画像データと共に信号送信されてもよい。
フィルタリングを無効にできることにより、フィルタリング対象のブロックの特性が実質的に異なる場合、例えば、高勾配がある場合(空間的に隣接するブロックのエッジ、時間的に隣接するブロックのシーン切り替え)に、フィルタリング済み信号の質が向上する場合がある。
上記の説明において、変換係数は、入力カラーフォーマットによって与えられたラスタにおいて垂直および水平にサンプリングされた通常の(典型的には使用済みの)マクロブロックを変換することで得られたものとして記載した。しかしながら、本発明は、フィルタ情報を決定すること、フィルタを設定すること、および、この方法で取得された変換係数をフィルタリングすることに限定されない。変換されるブロックはまた、例えば45度といった予め定められた角度に回転した後にサンプリングされてもよい。これは、ある特定の内容を有するブロックに有益であってもよい。サンプリングおよび変換は共に、必ずしも適用された動画像コードのサンプリングおよび変換に対応するとは限らない。
なお、図31A、図31B、図32A、及び図33を用いて説明した上記の方式は、実施の形態4のみならず、他の実施の形態1〜3、5におけるフィルタ設計及びフィルタ処理に応用できる。
(実施の形態5)
図33及び図34を参照して、本発明の実施の形態5に係る動画像符号化装置2800及び動画像復号装置2900を説明する。図33は、動画像符号化装置2800の機能ブロック図である。図34は、動画像復号装置200の機能ブロック図である。なお、実施の形態1に係る動画像符号化装置1500及び動画像復号装置1600と共通する構成要素には同一の参照番号を付し、詳しい説明を省略する。
図33に示される動画像符号化装置2800は、ループ内で周波数領域の予測信号のみをフィルタリングするフィルタ2880を備える点で図20Aに示される動画像符号化装置1500と相違する。
実施の形態5に係る符号化信号を生成する処理には、動画像信号から予測信号を減算して予測誤差信号を生成し、予測誤差信号を空間領域から周波数領域に変換し、量子化し、逆量子化し、周波数領域から空間領域に変換して量子化予測誤差信号を生成し、量子化予測誤差信号に予測信号を加算して再構築信号を生成する処理が含まれる。また、フィルタ情報は、周波数領域の動画像信号と、フィルタ処理が適用された後の周波数領域の予測信号との平均二乗誤差が最小になるように決定される。
フィルタ情報は、周波数領域の入力信号および予測信号に基づいてウィナーフィルタ係数として予測される。フィルタリング済みの予測信号は、その後、さらに変換/符号化部110、及びエントロピー符号化部2890に供給されると共に、デブロッキングフィルタ130の前に再構築に用いられる。フィルタ情報は、エントロピー符号化部2890によって符号化され、動画像復号装置2900側に提供される。
図34に示される動画像復号装置2900は、周波数領域の予測信号にフィルタ処理を適用するフィルタ2980を備える点で図21Aに示される動画像復号装置1600と相違する。
実施の形態5に係る符号化信号は、動画像信号から予測信号が減算され、空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られる。また復号信号を生成するステップには、符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換して量子化予測誤差信号を生成し、量子化予測誤差信号と予測信号とを加算して再構築信号を生成する処理が含まれる。さらに、フィルタ処理には、予測信号を空間領域から周波数領域に変換する処理と、周波数領域の予測信号にフィルタ処理を適用する処理と、フィルタ処理が適用された後の予測信号を周波数領域から空間領域に逆変換する処理とが含まれる。
エントロピー復号部2990は、フィルタ情報を復号し、それらを、予測信号のフィルタリングに用いるためフィルタ2980に送る。予測信号は、加算器225およびデブロッキングフィルタ230に用いられる前にフィルタリングされる。予測信号をそのようにフィルタリングすることにより、予測誤差を最小化でき、よって再構築動画像の画質を更に向上させることができる。
図35は、上記の各実施の形態に係る動画像符号化装置の例を詳細に示すブロック図である。異なる(空間的におよび/または時間的に隣接する)ブロックからの同一周波数の変換係数に重み付けすることでフィルタリングを適用する場合、これらの隣接ブロックを記憶する必要がある。フィルタリングが再構築動画像信号に適用される場合、再構築動画像信号はループ内でメモリ140、240に記憶されるため、追加的な記憶容量は必要ない。
しかしながら、フィルタ3030の場合、例えば、予測信号または予測誤差信号の対象ブロック3001、隣接ブロック3002の係数値が、メモリ3020に記憶されなければならない。フィルタリング済み信号は、その後、逆変換され、逆変換された信号3041となり、再構築に使用できる。この例の隣接ブロック3002は、既に符号化/復号された空間的に隣接するブロックである。しかしながら、概して、動画像シーケンス内の異なる位置にある任意の数のブロックが用いられてもよい。
図36は、フィルタ3130が無限インパルス応答(IIR)フィルタリングである他の例を示す。有限応答フィルタリング(FIR)とは異なり、IIRフィルタは、入力信号のサンプルだけではなく出力(フィルタリング済みの)信号のサンプルにも重み付けする。したがって、フィルタリング済み信号は、フィルタリング対象の信号に加えてメモリ3120に記憶されなければならない。上記例のほとんどはFIRフィルタリングに関するが、本発明はそれに限定されない。
FIRフィルタは概して設計しやすいが、周波数領域においてIIRフィルタリングの方が性能がよい場合がある。対象ブロック3101のフィルタリングに関わるブロックは概して、全て、既にフィルタリング済みの隣接ブロック3102である。図36は、4つの先行ブロックのみを示す。しかしながら、既にフィルタリング済みの信号に重み付けすることにより、理論的に、全ての既にフィルタリング済みのブロックがフィルタリング結果に貢献する。各ブロックの貢献度は、対象ブロック3101からの距離(隣接ブロックの選択により、空間的および/または時間的距離)と共に減少する。
なお、図35及び図36を用いて説明した上記の方式は、実施の形態5のみならず、他の実施の形態1〜4におけるフィルタ設計及びフィルタ処理に応用できる。
本発明の上記実施形態は、適用されるフィルタの適応性に関して制限されるものではない。動画像符号化装置1300および/または動画像復号装置1400で採用されたフィルタは、動画像シーケンス毎に、または数個の動画像シーケンスに1回ずつ設計されてもよい。しかしながら、現在の統計にフィルタ設計を適用させると、通常、画質が向上する。フィルタ設計は、例えば、グループオブピクチャ単位、画像単位、スライスもしくはマクロブロック単位、ブロックもしくはそのような画像要素の数個単位で定期的に実行されてもよい。それに対応して、フィルタ情報が同じ規則性で提供(信号送信)されてもよい。
しかしながら、フィルタ設計の実行よりも低い頻度でフィルタ情報を提供すると利点となる場合がある。特に、所望の信号とフィルタリング済み信号との間の相互相関、またはノイズの自己相関といった、フィルタ係数を算出するための情報が提供された場合、この情報は、フィルタ係数が実際に算出されるよりも低い頻度で送信されてもよい。フィルタ情報は更新されないが、復号動画像変換係数および/または動画像信号から取得可能な、フィルタ係数の算出に必要な追加的情報がリフレッシュされる。
フィルタ設計および/またはフィルタ情報の信号送信はまた、不定期に、例えば動画像信号の統計が大幅に変化したときに実行されてもよい。フィルタの局所適応は、欧州出願第08015661.5号に開示の方法と類似の方法で達成されてもよい。当該出願をここに引用し、援用する。さらに、量子化パラメータおよび/または量子化マトリクス値といった量子化設定は、特定の周波数成分に対するフィルタ係数の決定に用いられてもよい。
適応的フィルタ、フィルタ情報、例えばフィルタ係数の場合は、(エントロピー)符号化され、補助情報として動画像復号装置に提供される。H.264/MPEG−4AVC符号化方式またはその将来の拡張版および後続規格のコンテキストにおいて、フィルタ情報は好ましくは、ピクチャパラメータセット(PPS)NALユニット、またはシーケンスパラメータセット(SPS)NALユニットのスライスヘッダ内に送信される。適応的ポストフィルタ方式では、ポストフィルタ情報はまた、SEI(補助強化情報)として動画像復号装置に送信することができる。
量子化予測誤差がフィルタリングのプロセスにおいて(つまり、フィルタ設計および/またはフィルタリングのために)考慮されるとき、その量子化予測誤差は変換領域において既に利用可能であることから、必ずしも図30に示されるように別々に変換される必要はない。しかしながら、動画像符号化装置によって使用される変換/量子化部110、及び逆量子化/逆変換部120に関わらず、他の変換手法が選択されてもよい。そのような変換および/または逆変換は、動画像符号化装置で決定され、符号化され、動画像復号装置に提供されてもよい。
さらに、フィルタリングのプロセス(少なくともフィルタの設計および適用のうちの1つ)における変換に用いられるブロックグリッドは、必ずしも変換/量子化部110といった符号化ステップの内の1つにおけるブロックグリッドと同じである必要はない。フィルタリングのプロセスに用いられるブロックグリッドは、例えば、1つまたは2つのピクチャ要素(例えば画素)単位で、左、右、上およびまたは下にずらしてもよい。他のずらし方も可能である。フィルタ設計およびフィルタ適用に用いられるブロックは、必ずしも、符号化に用いられるブロックと同じサイズである必要はない。
適用された変換の数は、完全なものを超えてもよい。これは、変換を重複して用いることにより、空間領域のピクチャ要素よりも多くの係数が変換領域において生成されてもよいことを意味する。これにより、各ピクチャ要素(例えば画素値)に対して2つ以上のフィルタリング済みの表現が得られるであろう。これらは、最終的なフィルタリング済みの表現を得るために重み付けされてもよい。この重み付けはまた、適応的でもよく、符号化され、動画像復号装置に提供されてもよい。
上記動画像符号化装置の例に適用されたエントロピー符号化部は、必ずしも同じではない。好ましくは、フィルタ情報のエントロピー符号化は、より高い符号化効率を達成するために当該フィルタ情報の統計に適応されてもよい。
本発明の実施形態の例は、ウィナーフィルタ設計に焦点をおいて説明した。これは、ウィナーフィルタは、最初の2つの統計モーメントの知識に基づいて容易に算出できるからである。しかしながら、例えばより高次の統計(例えば、最大尤度推定)も考慮できるか、または平均二乗誤差以外の他の基準や測定基準を最適化できる他のフィルタ設計もまた適用してもよい。
図37は、本発明による、動画像符号化装置3201側から動画像復号装置3203側へ動画像信号を送信するシステムを説明する図である。入力画像信号は、動画像符号化装置3201によって符号化され、チャネル3202へ提供される。上述したように、動画像符号化装置3201は、本発明の任意の実施形態に係る動画像符号化装置である。
図37に示される動画像符号化装置3201は、少なくとも、動画像信号を空間領域から周波数領域に変換し、量子化して、符号化信号を生成する符号化部と、量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するフィルタ設計部と、符号化信号及びフィルタ情報を出力する出力部とを備える。なお、フィルタ情報は、周波数領域の動画像信号と、フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される。
一方、図37に示される動画像復号装置3203は、符号化信号及びフィルタ処理を特定するフィルタ情報を取得する取得部と、符号化信号を復号して復号信号を生成する復号部と、動画像信号を符号化する過程で重畳されたノイズを、周波数領域の復号信号の周波数成分毎に除去するフィルタ処理を、フィルタ情報を用いて周波数領域の復号信号に適用するフィルタ部とを備える。なお、フィルタ情報は、周波数領域の動画像信号と、フィルタ処理が適用された後の周波数領域の復号信号との平均二乗誤差を最小にするための情報を含む。
チャネル3202は、格納手段か伝送チャネルである。格納手段は、例えば、任意の揮発性または非揮発性メモリや、任意の磁気または光学媒体や、大容量格納手段などである。任意の伝送システムや、無線あるいは配線または固定的あるいは移動可能な、xDSL、ISDN、WLAN、GPRS、UMTS、Internetのようなものや、標準化または特許化されたシステムの物理的リソースによって、伝送チャネルを形成してもよい。
動画像符号化装置3201側は、動画像信号の符号化以外にも、チャネル3202を通して符号化動画像信号を伝送するフォーマットコンバータおよび/またはトランスミッタなどによる入力動画像信号の前処理や、符号化動画像信号を記録媒体に送信するためのアプリケーションを含んでもよい。符号化動画像信号は、チャネル3202を通じて動画像復号装置3203によって取得される。上述したように、動画像復号装置3203は、本発明の実施形態に係る動画像復号装置である。動画像復号装置3203は、符号化動画像信号を復号する。動画像復号装置3203側は、動画像信号の復号以外に、さらに、チャネル3202からの符号化動画像信号または格納手段からの符号化動画像データを抽出するためのアプリケーションを受信するレシーバと、さらに/または、フォーマット変換など復号動画像信号の後処理をおこなう後処理手段を備えてもよい。
本発明の他の実施形態は、ハードウェアおよびソフトウェアを用いる、上述のさまざまな実施形態の実施態様に関連するものである。本発明のさまざまな実施形態は、演算装置(プロセッサ)を用いて実現され実施されると分かる。演算装置またはプロセッサは、例えば、汎用プロセッサ、デジタル信号プロセッサ(DSP)、アプリケーション用集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、または、プログラマブルロジックデバイスなどであってもよい。本発明のさまざまな実施形態は、それらの装置を組み合わせて実施または具現化されてもよい。
さらに、本発明のさまざまな実施形態を、プロセッサまたはハードウェア内で直接的に実行されるソフトウェアモジュールを用いて実現してもよい。ソフトウェアモジュールとハードウェアの実施態様を組み合わせることも可能であろう。例えばRAM、EPROM、EEPROM、フラッシュメモリ、レジスタ、ハードディスク、CD−ROM、DVDなど、任意の種類のコンピュータで読み取り可能な記憶媒体にソフトウェアモジュールを格納してもよい。
H.264/AVCに基づく動画像符号化システムに関連して上述の例の大半を概要説明した。用語は、主として、H.264/AVCの用語に関連したものである。しかしながら、H.264/AVCに基づく符号化に対するさまざまな実施形態の用語および記述は、本発明の原理および考えを、当該システムに限定することを意図しない。H.264/AVC標準規格に準拠した符号化および復号に関する詳細な説明は、ここで説明した例示的な実施形態についての理解を深めることを意図しており、動画像符号化におけるプロセスおよび機能を、説明した特定の実施態様に本発明が限定されるように理解されるべきではない。一方、ここで提案した改良策は、動画像符号化において容易に応用可能であろう。さらに、本発明のコンセプトは、JVTによって現在討議されているH.264/AVCの拡張符号化においても容易に利用可能であろう。
図38は、本発明によって達成できる利点の例を示すグラフである。このグラフは、空間解像度が1920×1080画素、かつフレームレートが毎秒24フレームのYUV4:2:0の色空間におけるMPEGテストシーケンス「Dinner」の符号化に必要なビットレートに対するY−PSNR(輝度成分Yのピーク信号対ノイズ比)を示す。本発明の符号化方式が、ポストフィルタ無しのH.264/MPEG−4AVCと、欧州出願第08012036.3号による、分離できない2次元ウィナーポストフィルタで拡張されたH.264/MPEG−4AVCと比較される。実験は量子化重み行列(Qマトリクス)を用いて行われた。イントラ符号化および4×4変換が適用された。
要約すると、本発明による動画像の符号化および復号は、周波数領域におけるフィルタ設計およびフィルタリングを採用し、対応するフィルタを設定するためのフィルタ情報を動画像符号化装置側から動画像復号装置側に提供可能にする。周波数領域においてフィルタリングを行うことは、周波数領域にノイズも挿入された場合に、例えば、変換動画像信号の量子化に基づく動画像符号化において、特に利点をもたらす。
(実施の形態6)
次に、上記ノイズ除去フィルタの効率を向上させる目的で、図39A及び図39Bに示すような拡張アルゴリズムのフローを提案する。図9A及び図9Bのアルゴリズムフローとの違いは、係数ci,k^へのウィナーフィルタ演算である。ウィナーフィルタリングの結果、係数ci,k となる。これらは、重み付き逆変換の計算に用いられる。ウィナーフィルタ演算は、式32に示されるような線形フィルタである。ここで、記号「(チルダ)」は、それぞれ直前の文字の上に付される記号を示し、本明細書では、以下、記号「(チルダ)」を同様な意味で使用する。
Figure 2010061607
上記式32によると、係数ci,k (j)は、係数予測値ci,k^(j)の線形結合の結果である。フィルタ長はLである。オフセットo(j)を付加可能である。係数ci,k (j)はL個の係数予測値ci,k^(j)の重み付け和である。それぞれの係数予測値ci,k^(j)は現在ブロックまたは現在ブロックに隣接するブロックの係数であり(図31A参照)、周波数領域への変換により得られる係数である。隣接するブロックは現在ブロックにオーバーラップしてもよい(図31B参照)。係数al,k(j)およびオフセットo(j)は、好ましくは、k=0,…,2によって示されるノイズ除去ループの各々に対して個別のものである。
係数al,k(j)およびオフセットo(j)は、元の係数c(j)とフィルタ済み係数ci,k (j)との間の平均二乗誤差を最小化することで、動画像符号化装置側で予測される。係数a1,k(j)およびオフセットo(j)は、符号化され、動画像復号装置側に送信される。
係数の符号化は、好ましくは、下記の方法で予測符号化を用いて行われる。k=1,2のとき係数a1,k(j)の各々はa1,k-1(j)によって予測される。差分a1,k(j)−a1,k-1(j)のみが符号化され送信される。この符号化は固定長符号または可変長符号によって実行されてもよい。
k=1,2のときオフセットok(j)の各々はok-1(j)によって予測される。差分ok(j)−ok-1(j)のみが符号化され送信される。この符号化は固定長符号または可変長符号によって実行されてもよい。
このノイズ除去フィルタをウィナーフィルタと組み合わせて、ポストフィルタとして用いることも可能であるが、符号化/復号ループ内では適用されない。この場合、補助的拡張情報(SEI)メッセージを用いてウィナーフィルタ係数を送信することが好ましい。
図40A及び図40Bは、その他の拡張アルゴリズムのフローを示す。図39A及び図39Bに示されるフローとの違いは、ウィナーフィルタの入力信号は1つだけではなく、2つの異なる入力信号があることである。第1の入力信号は、係数ノイズ除去演算前の係数f1,k-1,・・・,fL,k-1であり、第2の入力信号は、ノイズ除去演算後の係数c1,k^,・・・,cL,k^である。ウィナーフィルタリングの結果は、式33の通りである。
Figure 2010061607
ウィナーフィルタリングへの個々の入力として2つの異なる信号f1,k-1,・・・,fL,k-1およびc1,k^,・・・,cL,k^を用いることで、信号c1,k^,・・・,cL,k^のみを用いる場合と比べて、平均二乗誤差をより小さくすることができる。この理由は、両信号は原画信号のノイズを表現したものであるが、ノイズは両信号で異なるからである。上記式33は、3つのウィナーフィルタと1つのオフセットがつなぎ合わされた構成をも包含する。ノイズの表現(f1,k-1,・・・,fL,k-1またはc1,k^,・・・,cL,k^)は、各々、ウィナーフィルタリングされる。2つの結果も、やはりウィナーフィルタリングされる。その結果に対し、オフセットが付加される。係数a1,k(j)およびb1,k(j)が符号化され送信される。さらに、オフセットo(j)が符号化され送信される。この符号化ステップに関し、上記に説明したようなステップkの係数とステップk−1の係数の間の予測が、a1,k(j)、b1,k(j)、およびo(j)に適用可能である。
図41A及び図41Bは、その他の拡張アルゴリズムのフローを示す。この場合、係数がまず線形ウィナーフィルタによってフィルタリングされる。その結果得られたフィルタリング済み係数は、さらに非線形ノイズ除去フィルタによってノイズ除去される。
なお、実施の形態6に係る処理は、実施の形態1〜5に係る動画像符号化装置及び動画像復号装置に適用することができる。
(実施の形態7)
上記実施の形態で示した画像符号化方法または画像復号方法の構成を実現するためのプログラムを記憶メディアに記録することにより、上記実施の形態で示した処理を独立したコンピュータシステムにおいて簡単に実施することが可能となる。記憶メディアは、磁気ディスク、光ディスク、光磁気ディスク、ICカード、半導体メモリ等、プログラムを記録できるものであればよい。
さらにここで、上記実施の形態で示した画像符号化方法および画像復号方法の応用例とそれを用いたシステムを説明する。
図42は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex106〜ex110が設置されている。
このコンテンツ供給システムex100は、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および、基地局ex106〜ex110を介して、コンピュータex111、PDA(Personal Digital Assistant)ex112、カメラex113、携帯電話ex114、ゲーム機ex115などの各機器が接続される。
しかし、コンテンツ供給システムex100は図42のような構成に限定されず、いずれかの要素を組み合わせて接続するようにしてもよい。また、固定無線局である基地局ex106〜ex110を介さずに、各機器が電話網ex104に直接接続されてもよい。また、各機器が近距離無線等を介して直接相互に接続されていてもよい。
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器であり、カメラex116はデジタルカメラ等の静止画撮影、動画撮影が可能な機器である。また、携帯電話ex114は、GSM(Global System for Mobile Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband−Code Division Multiple Access)方式、もしくはLTE(Long Term Evolution)方式、HSPA(High Speed Packet Access)の携帯電話機、または、PHS(Personal Handyphone System)等であり、いずれでも構わない。
コンテンツ供給システムex100では、カメラex113等が基地局ex109、電話網ex104を通じてストリーミングサーバex103に接続されることで、ライブ配信等が可能になる。ライブ配信では、ユーザがカメラex113を用いて撮影するコンテンツ(例えば、音楽ライブの映像等)に対して上記実施の形態で説明したように符号化処理を行い、ストリーミングサーバex103に送信する。一方、ストリーミングサーバex103は要求のあったクライアントに対して送信されたコンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114、ゲーム機ex115等がある。配信されたデータを受信した各機器では、受信したデータを復号処理して再生する。
なお、撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするストリーミングサーバex103で行ってもよいし、互いに分担して行ってもよい。同様に配信されたデータの復号処理はクライアントで行っても、ストリーミングサーバex103で行ってもよいし、互いに分担して行ってもよい。また、カメラex113に限らず、カメラex116で撮影した静止画像および/または動画像データを、コンピュータex111を介してストリーミングサーバex103に送信してもよい。この場合の符号化処理はカメラex116、コンピュータex111、ストリーミングサーバex103のいずれで行ってもよいし、互いに分担して行ってもよい。
また、これら符号化処理および復号処理は、一般的にコンピュータex111および各機器が有するLSI(Large Scale Integration)ex500において処理する。LSIex500は、ワンチップであっても複数チップからなる構成であってもよい。なお、画像符号化用および画像復号用のソフトウェアをコンピュータex111等で読み取り可能な何らかの記録メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込み、そのソフトウェアを用いて符号化処理および復号処理を行ってもよい。さらに、携帯電話ex114がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データは携帯電話ex114が有するLSIex500で符号化処理されたデータである。
また、ストリーミングサーバex103は複数のサーバまたは複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。
以上のようにして、コンテンツ供給システムex100では、符号化されたデータをクライアントが受信して再生することができる。このようにコンテンツ供給システムex100では、ユーザが送信した情報をリアルタイムでクライアントが受信して復号し、再生することができ、特別な権利または設備を有さないユーザでも個人放送を実現できる。
このコンテンツ供給システムを構成する各機器の符号化、復号には上記実施の形態で示した画像符号化方法あるいは画像復号方法を用いるようにすればよい。
その一例として携帯電話ex114について説明する。
図43は、上記実施の形態で説明した画像符号化方法と画像復号方法を用いた携帯電話ex114を示す図である。携帯電話ex114は、基地局ex110との間で電波を送受信するためのアンテナex601、CCDカメラ等の映像、静止画を撮ることが可能なカメラ部ex603、カメラ部ex603で撮影した映像、アンテナex601で受信した映像等が復号されたデータを表示する液晶ディスプレイ等の表示部ex602、操作キーex604群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ex608、音声入力をするためのマイク等の音声入力部ex605、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号されたデータを保存するための記録メディアex607、携帯電話ex114に記録メディアex607を装着可能とするためのスロット部ex606を有している。記録メディアex607はSDカード等のプラスチックケース内に電気的に書換えおよび消去が可能な不揮発性メモリであるEEPROMの一種であるフラッシュメモリ素子を格納したものである。
さらに、携帯電話ex114について図44を用いて説明する。携帯電話ex114は表示部ex602および操作キーex604を備えた本体部の各部を統括的に制御するようになされた主制御部ex711に対して、電源回路部ex710、操作入力制御部ex704、画像符号化部ex712、カメラインターフェース部ex703、LCD(Liquid Crystal Display)制御部ex702、画像復号部ex709、多重分離部ex708、記録再生部ex707、変復調回路部ex706および音声処理部ex705が同期バスex713を介して互いに接続されている。
電源回路部ex710は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付デジタル携帯電話ex114を動作可能な状態に起動する。
携帯電話ex114は、CPU、ROMおよびRAM等でなる主制御部ex711の制御に基づいて、音声通話モード時に音声入力部ex605で集音した音声信号を音声処理部ex705によってデジタル音声データに変換し、これを変復調回路部ex706でスペクトラム拡散処理し、送受信回路部ex701でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex601を介して送信する。また携帯電話ex114は、音声通話モード時にアンテナex601で受信した受信データを増幅して周波数変換処理およびアナログデジタル変換処理を施し、変復調回路部ex706でスペクトラム逆拡散処理し、音声処理部ex705によってアナログ音声データに変換した後、音声出力部ex608を介してこれを出力する。
さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーex604の操作によって入力された電子メールのテキストデータは操作入力制御部ex704を介して主制御部ex711に送出される。主制御部ex711は、テキストデータを変復調回路部ex706でスペクトラム拡散処理し、送受信回路部ex701でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex601を介して基地局ex110へ送信する。
データ通信モード時に画像データを送信する場合、カメラ部ex603で撮像された画像データを、カメラインターフェース部ex703を介して画像符号化部ex712に供給する。また、画像データを送信しない場合には、カメラ部ex603で撮像した画像データをカメラインターフェース部ex703およびLCD制御部ex702を介して表示部ex602に直接表示することも可能である。
画像符号化部ex712は、本願発明で説明した画像符号化装置を備えた構成であり、カメラ部ex603から供給された画像データを上記実施の形態で示した画像符号化装置に用いた符号化方法によって圧縮符号化することにより符号化画像データに変換し、これを多重分離部ex708に送出する。また、このとき同時に携帯電話ex114は、カメラ部ex603で撮像中に音声入力部ex605で集音した音声を、音声処理部ex705を介してデジタルの音声データとして多重分離部ex708に送出する。
多重分離部ex708は、画像符号化部ex712から供給された符号化画像データと音声処理部ex705から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ex706でスペクトラム拡散処理し、送受信回路部ex701でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex601を介して送信する。
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナex601を介して基地局ex110から受信した受信データを変復調回路部ex706でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ex708に送出する。
また、アンテナex601を介して受信された多重化データを復号するには、多重分離部ex708は、多重化データを分離することにより画像データのビットストリームと音声データのビットストリームとに分け、同期バスex713を介して当該符号化画像データを画像復号部ex709に供給すると共に当該音声データを音声処理部ex705に供給する。
次に、画像復号部ex709は、本願で説明した画像復号装置を備えた構成であり、画像データのビットストリームを上記実施の形態で示した符号化方法に対応した復号方法で復号することにより再生動画像データを生成し、これを、LCD制御部ex702を介して表示部ex602に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部ex705は、音声データをアナログ音声データに変換した後、これを音声出力部ex608に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる音声データが再生される。
なお、上記システムの例に限られず、最近は衛星、地上波によるデジタル放送が話題となっており、図45に示すようにデジタル放送用システムにも上記実施の形態の少なくとも画像符号化装置または画像復号装置を組み込むことができる。具体的には、放送局ex201では音声データ、映像データまたはそれらのデータが多重化されたビットストリームが電波を介して通信または放送衛星ex202に伝送される。これを受けた放送衛星ex202は、放送用の電波を発信し、衛星放送受信設備をもつ家庭のアンテナex204はこの電波を受信し、テレビ(受信機)ex300またはセットトップボックス(STB)ex217などの装置はビットストリームを復号してこれを再生する。また、記録媒体であるCDおよびDVD等の記録メディアex215、ex216に記録した画像データと、音声データが多重化されたビットストリームを読み取り、復号するリーダ/レコーダex218にも上記実施の形態で示した画像復号装置を実装することが可能である。この場合、再生された映像信号はモニタex219に表示される。また、ケーブルテレビ用のケーブルex203または衛星/地上波放送のアンテナex204に接続されたセットトップボックスex217内に画像復号装置を実装し、これをテレビのモニタex219で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に画像復号装置を組み込んでも良い。また、アンテナex205を有する車ex210で、衛星ex202または基地局等から信号を受信し、車ex210が有するカーナビゲーションex211等の表示装置に動画を再生することも可能である。
また、DVD、BD等の記録メディアex215に記録した音声データ、映像データまたはそれらのデータが多重化された符号化ビットストリームを読み取り復号する、または、記録メディアex215に、音声データ、映像データまたはそれらのデータを符号化し、多重化データとして記録するリーダ/レコーダex218にも上記実施の形態で示した画像復号装置または画像符号化装置を実装することが可能である。この場合、再生された映像信号はモニタex219に表示される。また、符号化ビットストリームが記録された記録メディアex215により、他の装置およびシステム等は、映像信号を再生することができる。例えば、他の再生装置ex212は、符号化ビットストリームがコピーされた記録メディアex214を用いて、モニタex213に映像信号を再生することができる。
また、ケーブルテレビ用のケーブルex203または衛星/地上波放送のアンテナex204に接続されたセットトップボックスex217内に画像復号装置を実装し、これをテレビのモニタex219で表示してもよい。このときセットトップボックスではなく、テレビ内に画像復号装置を組み込んでもよい。
図46は、上記実施の形態で説明した画像復号方法および画像符号化方法を用いたテレビ(受信機)ex300を示す図である。テレビex300は、上記放送を受信するアンテナex204またはケーブルex203等を介して映像情報のビットストリームを取得、または、出力するチューナex301と、受信した符号化データを復調する、または、生成された符号化データを外部に送信するために変調する変調/復調部ex302と、復調した映像データと音声データとを分離する、または、符号化された映像データと音声データとを多重化する多重/分離部ex303を備える。また、テレビex300は、音声データ、映像データそれぞれを復号する、または、それぞれの情報を符号化する音声信号処理部ex304、映像信号処理部ex305を有する信号処理部ex306と、復号された音声信号を出力するスピーカex307、復号された映像信号を表示するディスプレイ等の表示部ex308を有する出力部ex309とを有する。さらに、テレビex300は、ユーザ操作の入力を受け付ける操作入力部ex312等を有するインターフェース部ex317を有する。さらに、テレビex300は、各部を統括的に制御する制御部ex310、各部に電力を供給する電源回路部ex311を有する。インターフェース部ex317は、操作入力部ex312以外に、リーダ/レコーダex218等の外部機器と接続されるブリッジex313、SDカード等の記録メディアex216を装着可能とするためのスロット部ex314、ハードディスク等の外部記録メディアと接続するためのドライバex315、電話網と接続するモデムex316等を有していてもよい。なお記録メディアex216は、格納する不揮発性/揮発性の半導体メモリ素子により電気的に情報の記録を可能としたものである。テレビex300の各部は同期バスを介して互いに接続されている。
まず、テレビex300がアンテナex204等により外部から取得したデータを復号し、再生する構成について説明する。テレビex300は、リモートコントローラex220等からのユーザ操作を受け、CPU等を有する制御部ex310の制御に基づいて、変調/復調部ex302で復調した映像データ、音声データを多重/分離部ex303で分離する。さらにテレビex300は、分離した音声データを音声信号処理部ex304で復号し、分離した映像データを映像信号処理部ex305で上記実施の形態で説明した復号方法を用いて復号する。復号した音声信号、映像信号は、それぞれ出力部ex309から外部に向けて出力される。出力する際には、音声信号と映像信号が同期して再生するよう、バッファex318、ex319等に一旦これらの信号を蓄積するとよい。また、テレビex300は、放送等からではなく、磁気/光ディスク、SDカード等の記録メディアex215、ex216から符号化された符号化ビットストリームを読み出してもよい。次に、テレビex300が音声信号および映像信号を符号化し、外部に送信または記録メディア等に書き込む構成について説明する。テレビex300は、リモートコントローラex220等からのユーザ操作を受け、制御部ex310の制御に基づいて、音声信号処理部ex304で音声信号を符号化し、映像信号処理部ex305で映像信号を上記実施の形態で説明した符号化方法を用いて符号化する。符号化した音声信号、映像信号は多重/分離部ex303で多重化され外部に出力される。多重化する際には、音声信号と映像信号が同期するように、バッファex320、ex321等に一旦これらの信号を蓄積するとよい。なお、バッファex318〜ex321は図示しているように複数備えていてもよいし、一つ以上のバッファを共有する構成であってもよい。さらに、図示している以外に、例えば変調/復調部ex302と多重/分離部ex303との間等でもシステムのオーバフローおよびアンダーフローを避ける緩衝材としてバッファにデータを蓄積することとしてもよい。
また、テレビex300は、放送および記録メディア等から音声データおよび映像データを取得する以外に、マイクおよびカメラのAV入力を受け付ける構成を備え、それらから取得したデータに対して符号化処理を行ってもよい。なお、ここではテレビex300は、上記の符号化処理、多重化、および、外部出力ができる構成として説明したが、これらのすべての処理を行うことはできず、上記受信、復号処理、および、外部出力のうちいずれかのみが可能な構成であってもよい。
また、リーダ/レコーダex218で記録メディアから符号化ビットストリームを読み出す、または、書き込む場合には、上記復号処理または符号化処理はテレビex300およびリーダ/レコーダex218のうちいずれかで行ってもよいし、テレビex300とリーダ/レコーダex218とが互いに分担して行ってもよい。
一例として、光ディスクからデータの読み込みまたは書き込みをする場合の情報再生/記録部ex400の構成を図47に示す。情報再生/記録部ex400は、以下に説明する要素ex401〜ex407を備える。光ヘッドex401は、光ディスクである記録メディアex215の記録面にレーザスポットを照射して情報を書き込み、記録メディアex215の記録面からの反射光を検出して情報を読み込む。変調記録部ex402は、光ヘッドex401に内蔵された半導体レーザを電気的に駆動し記録データに応じてレーザ光の変調を行う。再生復調部ex403は、光ヘッドex401に内蔵されたフォトディテクタにより記録面からの反射光を電気的に検出した再生信号を増幅し、記録メディアex215に記録された信号成分を分離して復調し、必要な情報を再生する。バッファex404は、記録メディアex215に記録するための情報および記録メディアex215から再生した情報を一時的に保持する。ディスクモータex405は記録メディアex215を回転させる。サーボ制御部ex406は、ディスクモータex405の回転駆動を制御しながら光ヘッドex401を所定の情報トラックに移動させ、レーザスポットの追従処理を行う。システム制御部ex407は、情報再生/記録部ex400全体の制御を行う。上記の読み出しおよび書き込みの処理は、システム制御部ex407が、バッファex404に保持された各種情報を利用し、また必要に応じて新たな情報の生成および追加を行うと共に、変調記録部ex402、再生復調部ex403およびサーボ制御部ex406を協調動作させながら、光ヘッドex401を通して、情報の記録再生を行うことにより実現される。システム制御部ex407は、例えばマイクロプロセッサで構成され、読み出し書き込みのプログラムを実行することでそれらの処理を実行する。
以上では、光ヘッドex401はレーザスポットを照射するとして説明したが、近接場光を用いてより高密度な記録を行う構成であってもよい。
図48に光ディスクである記録メディアex215の模式図を示す。記録メディアex215の記録面には案内溝(グルーブ)がスパイラル状に形成され、情報トラックex230には、あらかじめグルーブの形状の変化によってディスク上の絶対位置を示す番地情報が記録されている。この番地情報はデータを記録する単位である記録ブロックex231の位置を特定するための情報を含み、記録および再生を行う装置は、情報トラックex230を再生し番地情報を読み取ることで記録ブロックを特定することができる。また、記録メディアex215は、データ記録領域ex233、内周領域ex232、外周領域ex234を含んでいる。ユーザデータを記録するために用いる領域がデータ記録領域ex233であり、データ記録領域ex233の内周または外周に配置されている内周領域ex232と外周領域ex234は、ユーザデータの記録以外の特定用途に用いられる。情報再生/記録部ex400は、このような記録メディアex215のデータ記録領域ex233に対して、符号化された音声データ、映像データまたはそれらのデータを多重化した符号化データの読み書きを行う。
以上では、1層のDVD、BD等の光ディスクを例に挙げ説明したが、これらに限ったものではなく、多層構造であって表面以外にも記録可能な光ディスクであってもよい。また、ディスクの同じ場所にさまざまな異なる波長の色の光を用いて情報を記録したり、さまざまな角度から異なる情報の層を記録したりするなど、多次元的な記録/再生を行う構造の光ディスクであってもよい。
また、デジタル放送用システムex200において、アンテナex205を有する車ex210で衛星ex202等からデータを受信し、車ex210が有するカーナビゲーションex211等の表示装置に動画を再生することも可能である。なお、カーナビゲーションex211の構成は例えば図46に示す構成のうち、GPS受信部を加えた構成が考えられ、同様なことがコンピュータex111および携帯電話ex114等でも考えられる。また、上記携帯電話ex114等の端末は、テレビex300と同様に、符号化器および復号器を両方持つ送受信型端末の他に、符号化器のみの送信端末、復号器のみの受信端末という3通りの実装形式が考えられる。
このように、上記実施の形態で示した画像符号化方法あるいは画像復号方法を上述したいずれの機器およびシステムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。
また、本発明は、上記実施の形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形または修正が可能である。
(実施の形態8)
上記各実施の形態で示した画像符号化方法および装置、画像復号方法および装置は、典型的には集積回路であるLSIで実現される。一例として、図49に1チップ化されたLSIex500の構成を示す。LSIex500は、以下に説明する要素ex501〜ex509を備え、各要素はバスex510を介して接続している。電源回路部ex505は電源がオン状態の場合に各部に対して電力を供給することで動作可能な状態に起動する。
例えば符号化処理を行う場合には、LSIex500は、CPUex502、メモリコントローラex503およびストリームコントローラex504等を有する制御部ex501の制御に基づいて、AV I/Oex509によりマイクex117およびカメラex113等からAV信号の入力を受け付ける。入力されたAV信号は、一旦SDRAM等の外部のメモリex511に蓄積される。制御部ex501の制御に基づいて、蓄積したデータは、処理量および処理速度に応じて適宜複数回に分けるなどされ、信号処理部ex507に送られる。信号処理部ex507は、音声信号の符号化および/または映像信号の符号化を行う。ここで映像信号の符号化処理は、上記実施の形態で説明した符号化処理である。信号処理部ex507ではさらに、場合により符号化された音声データと符号化された映像データを多重化するなどの処理を行い、ストリームI/Oex506から外部に出力する。この出力されたビットストリームは、基地局ex107に向けて送信されたり、または、記録メディアex215に書き込まれたりする。なお、多重化する際には同期するよう、一旦バッファex508にデータを蓄積するとよい。
また、例えば復号処理を行う場合には、LSIex500は、制御部ex501の制御に基づいて、ストリームI/Oex506によって基地局ex107を介して得た符号化データ、または、記録メディアex215から読み出して得た符号化データを一旦メモリex511等に蓄積する。制御部ex501の制御に基づいて、蓄積したデータは、処理量および処理速度に応じて適宜複数回に分けるなどされ信号処理部ex507に送られる。信号処理部ex507は、音声データの復号および/または映像データの復号を行う。ここで映像信号の復号処理は、上記実施の形態で説明した復号処理である。さらに、場合により復号された音声信号と復号された映像信号を同期して再生できるようそれぞれの信号を一旦バッファex508等に蓄積するとよい。復号された出力信号は、メモリex511等を適宜介しながら、携帯電話ex114、ゲーム機ex115およびテレビex300等の各出力部から出力される。
なお、上記では、メモリex511がLSIex500の外部の構成として説明したが、LSIex500の内部に含まれる構成であってもよい。バッファex508も一つに限ったものではなく、複数のバッファを備えていてもよい。また、LSIex500は1チップ化されてもよいし、複数チップ化されてもよい。
なお、ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA、または、LSI内部の回路セルの接続および設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
以上、本発明に係る画像符号化方法、画像符号化装置、画像復号方法および画像復号装置について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を当該実施の形態に施した形態、および、異なる実施の形態における構成要素およびステップ等を組み合わせて構築される別の形態も、本発明の範囲内に含まれる。
本発明は、画像符号化方法(装置)及び画像復号方法(装置)に有利に利用される。
100,400,500,600,1300A,1300B,1500,1800,2100,2200,2300,2800,3201 動画像符号化装置
105 減算器
110 変換/量子化部
120,220 逆量子化/逆変換部
125,225 加算器
130,230 デブロッキングフィルタ
140,240,3020,3120 メモリ
150,250 補間フィルタ
160,260 動き補償予測部
165 動き予測部
170,270 イントラフレーム予測部
175,275 スイッチ
180,640 ポストフィルタ設計部
190,490,590,690,1590,1890,2190,2290,2390,2890 エントロピー符号化部
200,700,1400A,1400B,1600,1900,2400,2900,3203 動画像復号装置
280,740 ポストフィルタ
290,1690,1990,2490,2990 エントロピー復号部
300,930,1130 ウィナーフィルタ
440,540 ウィナーフィルタ及び設計部
810,910,1110 DCT変換部
820,920,1120 DCT逆変換部
1301,1311,1401,1411,1441 動画像信号
1310,1410,2010 変換部
1330,1530,1830,2330 フィルタ設計部
641,1331,1431,1531,1691,1831,1991,2131,2231,2331,2491 フィルタ情報
1420 逆変換部
1435 フィルタ設定部
1440,1540,1640,1740,1940,2040,2440,2880,2980,3030,3130 フィルタ
1520,1620,2020,3040,3140 逆変換部
1741,2041 変換係数
2140,2230 フィルタ及び設計部
2710,2720,2730,2750,2760,2770 フレーム
2701,2702,2703,2751,2752,2753 ブロック
2780 動きベクトル
3010,3110 逆量子化部
3041,3141 信号
3001,3101 対象ブロック
3002,3102 隣接ブロック
3202 チャネル
ex100 コンテンツ供給システム
ex101 インターネット
ex102 インターネットサービスプロバイダ
ex103 ストリーミングサーバ
ex104 電話網
ex106,ex107,ex108,ex109,ex110 基地局
ex111 コンピュータ
ex112 PDA
ex113,ex116 カメラ
ex114 カメラ付デジタル携帯電話(携帯電話)
ex115 ゲーム機
ex117 マイク
ex200 デジタル放送用システム
ex201 放送局
ex202 放送衛星(衛星)
ex203 ケーブル
ex204,ex205,ex601 アンテナ
ex210 車
ex211 カーナビゲーション(カーナビ)
ex212 再生装置
ex213,ex219 モニタ
ex214,ex215,ex216,ex607 記録メディア
ex217 セットトップボックス(STB)
ex218 リーダ/レコーダ
ex220 リモートコントローラ
ex230 情報トラック
ex231 記録ブロック
ex232 内周領域
ex233 データ記録領域
ex234 外周領域
ex300 テレビ
ex301 チューナ
ex302 変調/復調部
ex303 多重/分離部
ex304 音声信号処理部
ex305 映像信号処理部
ex306,ex507 信号処理部
ex307 スピーカ
ex308,ex602 表示部
ex309 出力部
ex310,ex501 制御部
ex311,ex505,ex710 電源回路部
ex312 操作入力部
ex313 ブリッジ
ex314,ex606 スロット部
ex315 ドライバ
ex316 モデム
ex317 インターフェース部
ex318,ex319,ex320,ex321,ex404,ex508 バッファ
ex400 情報再生/記録部
ex401 光ヘッド
ex402 変調記録部
ex403 再生復調部
ex405 ディスクモータ
ex406 サーボ制御部
ex407 システム制御部
ex500 LSI
ex502 CPU
ex503 メモリコントローラ
ex504 ストリームコントローラ
ex506 ストリームI/O
ex509 AV I/O
ex510 バス
ex603 カメラ部
ex604 操作キー
ex605 音声入力部
ex608 音声出力部
ex701 送受信回路部
ex702 LCD制御部
ex703 カメラインターフェース部(カメラI/F部)
ex704 操作入力制御部
ex705 音声処理部
ex706 変復調回路部
ex707 記録再生部
ex708 多重分離部
ex709 画像復号部
ex711 主制御部
ex712 画像符号化部
ex713 同期バス

Claims (20)

  1. 動画像信号を符号化して得られる符号化信号を復号する動画像復号方法であって、
    前記符号化信号及びフィルタ処理を特定するフィルタ情報を取得するステップと、
    前記符号化信号を復号して復号信号を生成するステップと、
    前記動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去する前記フィルタ処理を、前記フィルタ情報を用いて周波数領域の復号信号に適用するステップとを含み、
    前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記復号信号との平均二乗誤差を最小にするための情報を含む
    動画像復号方法。
  2. 前記フィルタ処理は、前記復号信号を構成する複数のブロックそれぞれについて、処理対象ブロックの各周波数成分の値と、前記処理対象ブロックに時間的又は空間的に隣接するブロックの対応する周波数成分の値とを、前記フィルタ情報に含まれる重み係数を用いて重み付け加算するステップを含み、
    前記重み係数は、前記フィルタ処理が適用された後の周波数領域の前記処理対象ブロックと、周波数領域の前記動画像信号に含まれる前記処理対象ブロックに対応するブロックとの平均二乗誤差が最小になるように決定されている
    請求項1に記載の動画像復号方法。
  3. 前記フィルタ処理は、さらに、
    前記重み付け加算を実行する前の前記処理対象ブロックに対して、各周波数成分の値から第1のオフセット値を減算するステップと、
    前記重み付け加算した後の前記処理対象ブロックに対して、各周波数成分の値に前記フィルタ情報に含まれる第2のオフセット値を加算するステップとを含み、
    前記第1のオフセット値は、周波数領域の前記復号信号に含まれるブロックのうち、前記処理対象ブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に算出され、
    前記第2のオフセット値は、周波数領域の前記動画像信号に含まれるブロックのうち、前記処理対象ブロックに対応するブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に算出されている
    請求項2に記載の動画像復号方法。
  4. 前記符号化信号は、前記動画像信号が空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られるものであり、
    前記復号信号を生成するステップには、前記符号化信号をエントロピー復号して前記復号信号としての量子化係数を生成する処理が含まれ、
    前記フィルタ処理を適用するステップには、前記量子化係数に前記フィルタ処理を適用すると共に、当該量子化係数を逆量子化する処理が含まれる
    請求項1に記載の動画像復号方法。
  5. 前記符号化信号は、前記動画像信号から予測信号が減算され、空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られるものであり、
    前記復号信号を生成するステップには、前記符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換し、前記予測信号を加算して前記復号信号としての再構築信号を生成する処理が含まれ、
    前記フィルタ処理を適用するステップには、前記再構築信号を空間領域から周波数領域に変換する処理と、周波数領域の前記再構築信号に前記フィルタ処理を適用する処理と、前記フィルタ処理を適用した後の前記再構築信号を周波数領域から空間領域に逆変換する処理とが含まれる
    請求項1に記載の動画像復号方法。
  6. 前記符号化信号は、前記動画像信号から予測信号が減算されて予測誤差信号が生成され、当該予測誤差信号が空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られるものであり、
    前記復号信号を生成するステップには、前記符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換して量子化予測誤差信号を生成し、前記量子化予測誤差信号と前記予測信号とを加算して再構築信号を生成する処理が含まれ、
    前記フィルタ処理は、前記復号信号としての前記量子化予測誤差信号、前記予測信号、及び前記再構築信号の互いに対応するブロックに含まれる同一周波数成分の値を前記フィルタ情報に含まれる重み係数を用いて重み付け加算するステップを含み、
    前記重み係数は、周波数領域の前記予測誤差信号と、前記フィルタ処理が適用された後の周波数領域の前記量子化予測誤差信号との平均二乗誤差が最小になるように決定されている
    請求項1に記載の動画像復号方法。
  7. 前記符号化信号は、前記動画像信号から予測信号が減算され、空間領域から周波数領域に変換され、量子化され、エントロピー符号化されて得られるものであり、
    前記復号信号を生成するステップには、前記符号化信号をエントロピー復号し、逆量子化し、周波数領域から空間領域に逆変換して量子化予測誤差信号を生成し、前記量子化予測誤差信号と前記予測信号とを加算して再構築信号を生成する処理が含まれ、
    前記フィルタ処理を適用するステップには、前記予測信号を空間領域から周波数領域に変換する処理と、周波数領域の前記予測信号に前記フィルタ処理を適用する処理と、前記フィルタ処理が適用された後の前記予測信号を周波数領域から空間領域に逆変換する処理とが含まれる
    請求項1に記載の動画像復号方法。
  8. 動画像信号を符号化して符号化信号を生成する動画像符号化方法であって、
    少なくとも、前記動画像信号を空間領域から周波数領域に変換し、量子化して、前記符号化信号を生成するステップと、
    量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するステップと、
    前記符号化信号及び前記フィルタ情報を出力するステップとを含み、
    前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される
    動画像符号化方法。
  9. 前記動画像符号化方法は、さらに、量子化後の周波数領域の信号に、前記フィルタ情報を用いて前記フィルタ処理を適用するステップを含み、
    前記フィルタ処理は、前記量子化後の信号を構成する複数のブロックそれぞれについて、処理対象ブロックの各周波数成分の値と、前記処理対象ブロックに時間的又は空間的に隣接するブロックの対応する周波数成分の値とを、前記フィルタ情報に含まれる重み係数を用いて重み付け加算するステップを含み、
    前記フィルタ情報を生成するステップは、前記フィルタ処理が適用された前記処理対象ブロックと、周波数領域の前記動画像信号に含まれる前記処理対象ブロックに対応するブロックとの平均二乗誤差が最小になるように前記重み係数を決定する
    請求項8に記載の動画像符号化方法。
  10. 前記フィルタ処理は、さらに、前記重み付け加算を実行する前の前記処理対象ブロックに対して、各周波数成分の値から第1のオフセット値を減算するステップと、前記重み付け加算した後の前記処理対象ブロックに対して、各周波数成分の値に第2のオフセット値を加算するステップとを含み、
    前記フィルタ情報を生成するステップでは、
    量子化後の周波数領域の信号に含まれるブロックのうち、前記処理対象ブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に前記第1のオフセット値が算出され、
    周波数領域の前記動画像信号に含まれるブロックのうち、前記処理対象ブロックに対応するブロックを含む時間的又は空間的に連続する複数のブロックを用いて周波数成分毎に前記第2のオフセット値を算出され、
    少なくとも前記第2のオフセット値を前記フィルタ情報に含められる
    請求項9に記載の動画像符号化方法。
  11. 前記符号化信号を生成するステップには、前記動画像信号から予測信号を減算して予測誤差信号を生成し、前記予測誤差信号を空間領域から周波数領域に変換し、量子化して量子化係数を生成する処理が含まれ、
    前記フィルタ情報を生成するステップでは、周波数領域の前記予測誤差信号と、前記フィルタ処理が適用された後の周波数領域の量子化予測誤差信号との平均二乗誤差が最小になるように前記フィルタ情報が決定される
    請求項8に記載の動画像符号化方法。
  12. 前記符号化信号を生成するステップには、周波数領域の前記動画像信号を量子化し、逆量子化して再構築信号を生成する処理が含まれ、
    前記フィルタ情報を生成するステップでは、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記再構築信号との平均二乗誤差が最小になるように前記フィルタ情報が決定される
    請求項8に記載の動画像符号化方法。
  13. 前記符号化信号を生成するステップには、前記動画像信号から予測信号を減算して予測誤差信号を生成し、前記予測誤差信号を空間領域から周波数領域に変換し、量子化し、逆量子化し、周波数領域から空間領域に変換して量子化予測誤差信号を生成し、前記量子化予測誤差信号に前記予測信号を加算して再構築信号を生成する処理が含まれ、
    前記フィルタ情報を生成するステップでは、周波数領域の前記予測信号、周波数領域の前記量子化予測誤差信号、及び周波数領域の前記再構築信号に基づいて、周波数領域の前記予測誤差信号と、前記フィルタ処理が適用された後の周波数領域の前記量子化予測誤差信号との平均二乗誤差が最小になるように前記フィルタ情報が決定される
    請求項8に記載の動画像符号化方法。
  14. 前記符号化信号を生成するステップには、前記動画像信号から予測信号を減算して予測誤差信号を生成し、前記予測誤差信号を空間領域から周波数領域に変換し、量子化し、逆量子化し、周波数領域から空間領域に変換して量子化予測誤差信号を生成し、前記量子化予測誤差信号に前記予測信号を加算して再構築信号を生成する処理が含まれ、
    前記フィルタ情報を生成するステップでは、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記予測信号との平均二乗誤差が最小になるように前記フィルタ情報が決定される
    請求項8に記載の動画像符号化方法。
  15. 動画像信号を符号化して得られる符号化信号を復号する動画像復号装置であって、
    前記符号化信号及びフィルタ処理を特定するフィルタ情報を取得する取得部と、
    前記符号化信号を復号して復号信号を生成する復号部と、
    前記動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去する前記フィルタ処理を、前記フィルタ情報を用いて周波数領域の復号信号に適用するフィルタ部とを備え、
    前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記復号信号との平均二乗誤差を最小にするための情報を含む
    動画像復号装置。
  16. 動画像信号を符号化して符号化信号を生成する動画像符号化装置であって、
    少なくとも、前記動画像信号を空間領域から周波数領域に変換し、量子化して、前記符号化信号を生成する符号化部と、
    量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するフィルタ設計部と、
    前記符号化信号及び前記フィルタ情報を出力する出力部とを備え、
    前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される
    動画像符号化装置。
  17. コンピュータに、動画像信号を符号化して得られる符号化信号を復号させるプログラムであって、
    前記符号化信号及びフィルタ処理を特定するフィルタ情報を取得するステップと、
    前記符号化信号を復号して復号信号を生成するステップと、
    前記動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去する前記フィルタ処理を、前記フィルタ情報を用いて周波数領域の復号信号に適用するステップとを含み、
    前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記復号信号との平均二乗誤差を最小にするための情報を含む
    プログラム。
  18. コンピュータに、動画像信号を符号化して符号化信号を生成させるプログラムであって、
    少なくとも、前記動画像信号を空間領域から周波数領域に変換し、量子化して、前記符号化信号を生成するステップと、
    量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するステップと、
    前記符号化信号及び前記フィルタ情報を出力するステップとを含み、
    前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される
    プログラム。
  19. 動画像信号を符号化して得られる符号化信号を復号する集積回路であって、
    前記符号化信号及びフィルタ処理を特定するフィルタ情報を取得する取得部と、
    前記符号化信号を復号して復号信号を生成する復号部と、
    前記動画像信号を符号化する過程で重畳されたノイズを、周波数領域の前記復号信号の周波数成分毎に除去する前記フィルタ処理を、前記フィルタ情報を用いて周波数領域の復号信号に適用するフィルタ部とを備え、
    前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の前記復号信号との平均二乗誤差を最小にするための情報を含む
    集積回路。
  20. 動画像信号を符号化して符号化信号を生成する集積回路であって、
    少なくとも、前記動画像信号を空間領域から周波数領域に変換し、量子化して、前記符号化信号を生成する符号化部と、
    量子化する過程で重畳されたノイズを、量子化後の周波数領域の信号の周波数成分毎に除去するフィルタ処理を特定するフィルタ情報を生成するフィルタ設計部と、
    前記符号化信号及び前記フィルタ情報を出力する出力部とを備え、
    前記フィルタ情報は、周波数領域の前記動画像信号と、前記フィルタ処理が適用された後の周波数領域の信号との平均二乗誤差が最小となるように決定される
    集積回路。
JP2010540376A 2008-11-27 2009-11-26 動画像復号方法、動画像符号化方法、動画像復号装置、動画像符号化装置、プログラム、及び集積回路 Pending JPWO2010061607A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08020651.9 2008-11-27
EP08020651A EP2192786A1 (en) 2008-11-27 2008-11-27 Frequency domain filters for video coding
PCT/JP2009/006392 WO2010061607A1 (ja) 2008-11-27 2009-11-26 動画像復号方法、動画像符号化方法、動画像復号装置、動画像符号化方法、プログラム、及び集積回路

Publications (1)

Publication Number Publication Date
JPWO2010061607A1 true JPWO2010061607A1 (ja) 2012-04-26

Family

ID=40568483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010540376A Pending JPWO2010061607A1 (ja) 2008-11-27 2009-11-26 動画像復号方法、動画像符号化方法、動画像復号装置、動画像符号化装置、プログラム、及び集積回路

Country Status (6)

Country Link
US (1) US20110228843A1 (ja)
EP (2) EP2192786A1 (ja)
JP (1) JPWO2010061607A1 (ja)
KR (1) KR20110093811A (ja)
CN (1) CN102227910A (ja)
WO (1) WO2010061607A1 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010134973A1 (en) * 2009-05-18 2010-11-25 Thomson Licensing Methods and apparatus for a generalized filtering structure for video coding and decoding
CA2808451C (en) * 2010-09-14 2016-06-21 Research In Motion Limited Methods and devices for data compression with adaptive filtering in the transform domain
US8503528B2 (en) * 2010-09-15 2013-08-06 Google Inc. System and method for encoding video using temporal filter
KR102086145B1 (ko) * 2010-12-13 2020-03-09 한국전자통신연구원 인트라 예측 방법 및 그 장치
WO2012081895A1 (ko) 2010-12-13 2012-06-21 한국전자통신연구원 인트라 예측 방법 및 그 장치
JP4951113B1 (ja) 2010-12-20 2012-06-13 株式会社東芝 画像復号化装置、画像復号化方法およびプログラム
KR101215152B1 (ko) * 2011-04-21 2012-12-24 한양대학교 산학협력단 인루프 필터링을 적용한 예측 방법을 이용한 영상 부호화/복호화 방법 및 장치
CA2823902C (en) 2011-04-21 2018-03-27 Mediatek Inc. Method and apparatus for improved in-loop filtering
WO2012167712A1 (en) * 2011-06-10 2012-12-13 Mediatek Inc. Method and apparatus of scalable video coding
JP2013090034A (ja) * 2011-10-14 2013-05-13 Sony Corp 画像処理装置および方法、プログラム、並びに記録媒体
EP2595382B1 (en) 2011-11-21 2019-01-09 BlackBerry Limited Methods and devices for encoding and decoding transform domain filters
CN103188484A (zh) * 2011-12-27 2013-07-03 华晶科技股份有限公司 具备三维去杂讯化功能的视讯编码/解码装置及其视讯编码方法
US9131073B1 (en) 2012-03-02 2015-09-08 Google Inc. Motion estimation aided noise reduction
US9344729B1 (en) 2012-07-11 2016-05-17 Google Inc. Selective prediction signal filtering
EP2916547A4 (en) 2012-11-30 2016-05-11 Sony Corp IMAGE PROCESSING APPARATUS AND METHOD
US9106888B2 (en) 2013-09-25 2015-08-11 Apple Inc. Reducing quantization artifacts using neighbor-based weighted dithering
US10102613B2 (en) 2014-09-25 2018-10-16 Google Llc Frequency-domain denoising
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
JP2018533284A (ja) * 2015-09-21 2018-11-08 エルジー エレクトロニクス インコーポレイティド 係数誘導予測を用いてビデオ信号を処理する方法及び装置
US10623778B2 (en) * 2015-09-29 2020-04-14 Lg Electronics Inc. Filtering method and apparatus in picture coding system
EP3364657B1 (en) * 2015-10-13 2021-08-11 LG Electronics Inc. Image decoding method and apparatus in image coding system
CN108293111B (zh) * 2015-10-16 2022-07-08 Lg电子株式会社 改善图像编码系统中的预测的滤波方法、装置和存储介质
BR112018073434A2 (pt) * 2016-05-13 2019-03-26 Interdigital Vc Holdings, Inc. método e aparelho para codificação de vídeo com corte adaptativo
KR101974261B1 (ko) * 2016-06-24 2019-04-30 한국과학기술원 Cnn 기반 인루프 필터를 포함하는 부호화 방법과 장치 및 복호화 방법과 장치
US11095922B2 (en) * 2016-08-02 2021-08-17 Qualcomm Incorporated Geometry transformation-based adaptive loop filtering
KR102432580B1 (ko) * 2017-01-05 2022-08-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 화상의 블록 기반 예측 코딩 및 디코딩
US11457239B2 (en) 2017-11-09 2022-09-27 Google Llc Block artefact reduction
WO2020009619A1 (en) * 2018-07-02 2020-01-09 Huawei Technologies Co., Ltd. Apparatus and method for filtering in video coding
WO2020080623A1 (ko) * 2018-10-19 2020-04-23 삼성전자 주식회사 영상의 ai 부호화 및 ai 복호화 방법, 및 장치
DE102018222140B3 (de) 2018-12-18 2020-02-06 Siemens Mobility GmbH Ermitteln einer Durchlassgüte einer Optikeinheit eines Kamerasystems
US11595662B2 (en) * 2019-02-06 2023-02-28 Tencent America LLC Method and apparatus for neighboring block availability in video coding
JP7383736B2 (ja) * 2019-06-18 2023-11-20 ホアウェイ・テクノロジーズ・カンパニー・リミテッド ビデオコーディングにおけるフィルタリング装置および方法
JP6811931B2 (ja) * 2019-06-20 2021-01-13 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
CN110798690B (zh) * 2019-08-23 2021-12-21 腾讯科技(深圳)有限公司 视频解码方法、环路滤波模型的训练方法、装置和设备
US20220312004A1 (en) * 2021-03-23 2022-09-29 Tencent America LLC Method and apparatus for video coding
US20230196623A1 (en) * 2021-12-22 2023-06-22 Red Hat, Inc. Content-based encoding of digital images
WO2023223901A1 (ja) * 2022-05-17 2023-11-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化装置、画像復号装置、画像符号化方法、及び画像復号方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5473384A (en) * 1993-12-16 1995-12-05 At&T Corp. Method of and system for enhancing distorted graphical information
KR100584552B1 (ko) * 2003-01-14 2006-05-30 삼성전자주식회사 동영상 부호화 및 복호화 방법과 그 장치
JP2006211152A (ja) * 2005-01-26 2006-08-10 Hokkaido Univ 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化用プログラム、画像復号用プログラム
JP4775756B2 (ja) * 2005-03-18 2011-09-21 富士ゼロックス株式会社 復号化装置及びそのプログラム
US8050331B2 (en) * 2005-05-20 2011-11-01 Ntt Docomo, Inc. Method and apparatus for noise filtering in video coding
US8189934B2 (en) * 2006-03-27 2012-05-29 Panasonic Corporation Image coding apparatus and image decoding apparatus
EP1841230A1 (en) 2006-03-27 2007-10-03 Matsushita Electric Industrial Co., Ltd. Adaptive wiener filter for video coding
US20080101469A1 (en) * 2006-10-31 2008-05-01 Motorola, Inc. Method and apparatus for adaptive noise filtering of pixel data
EP1944974A1 (en) * 2007-01-09 2008-07-16 Matsushita Electric Industrial Co., Ltd. Position dependent post-filter hints
EP2141927A1 (en) * 2008-07-03 2010-01-06 Panasonic Corporation Filters for video coding
EP2161936A1 (en) * 2008-09-04 2010-03-10 Panasonic Corporation Locally adaptive filters for video coding controlled by local correlation data

Also Published As

Publication number Publication date
EP2352293A4 (en) 2012-05-09
CN102227910A (zh) 2011-10-26
US20110228843A1 (en) 2011-09-22
EP2192786A1 (en) 2010-06-02
EP2352293A1 (en) 2011-08-03
WO2010061607A1 (ja) 2010-06-03
KR20110093811A (ko) 2011-08-18

Similar Documents

Publication Publication Date Title
WO2010061607A1 (ja) 動画像復号方法、動画像符号化方法、動画像復号装置、動画像符号化方法、プログラム、及び集積回路
JP7246008B2 (ja) 復号装置および符号化装置
JP5485983B2 (ja) 動画像符号化方法、動画像復号方法、動画像符号化装置および動画像復号装置
WO2010026770A1 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、システム、プログラム、及び集積回路
JP5588438B2 (ja) 画像符号化方法及び画像符号化装置
KR101746251B1 (ko) 필터 위치 결정 및 선택
WO2010087157A1 (ja) 画像符号化方法及び画像復号方法
WO2010143427A1 (ja) 画像符号化方法、画像復号方法、およびそれらの装置
WO2010050156A1 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、集積回路およびプログラム
JP5659160B2 (ja) 動画像復号装置、動画像符号化装置、動画像復号回路及び動画像復号方法
WO2011016247A1 (ja) 符号化方法、復号方法、符号化装置及び復号装置
EP2375744A1 (en) Complexity reduction for 1/8-pel interpolation
WO2011128055A1 (en) Efficient storing of picture representation using adaptive non-uniform quantizer
WO2011089865A1 (ja) 画像符号化方法、画像復号方法、それらの装置、プログラムおよび集積回路
WO2012167927A1 (en) Coding of control data for adaptive loop filters
WO2012013327A1 (en) Quantized prediction error signal for three-input-wiener-filter
JP2011182132A (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、集積回路およびプログラム