JP2014135552A - 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法 - Google Patents
動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法 Download PDFInfo
- Publication number
- JP2014135552A JP2014135552A JP2013001139A JP2013001139A JP2014135552A JP 2014135552 A JP2014135552 A JP 2014135552A JP 2013001139 A JP2013001139 A JP 2013001139A JP 2013001139 A JP2013001139 A JP 2013001139A JP 2014135552 A JP2014135552 A JP 2014135552A
- Authority
- JP
- Japan
- Prior art keywords
- picture
- unit
- prediction
- block
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】インタレース信号を時間階層符号化する際に、インタレース信号のフィールドピクチャにエラーが発生した場合であっても、符号化効率の低下を抑えることができる動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法を得る。
【解決手段】動き補償予測部は、トップフィールドピクチャに対して、符号化済みのトップフィールドピクチャのみを参照ピクチャとして予測符号化を行い、ピクチャの動きが所定値よりも大きい場合には、ボトムフィールドピクチャに対して、符号化済みで隣接する1つのトップフィールドピクチャと符号化済みのボトムフィールドピクチャとを参照ピクチャとして予測符号化を行い、ピクチャの動きが所定値よりも小さい場合には、ボトムフィールドピクチャに対して、符号化済みのボトムフィールドピクチャのみを参照ピクチャとして予測符号化を行う。
【選択図】図1
【解決手段】動き補償予測部は、トップフィールドピクチャに対して、符号化済みのトップフィールドピクチャのみを参照ピクチャとして予測符号化を行い、ピクチャの動きが所定値よりも大きい場合には、ボトムフィールドピクチャに対して、符号化済みで隣接する1つのトップフィールドピクチャと符号化済みのボトムフィールドピクチャとを参照ピクチャとして予測符号化を行い、ピクチャの動きが所定値よりも小さい場合には、ボトムフィールドピクチャに対して、符号化済みのボトムフィールドピクチャのみを参照ピクチャとして予測符号化を行う。
【選択図】図1
Description
この発明は、動画像を高効率で符号化する動画像符号化装置および動画像符号化方法、並びに高効率で符号化されている動画像を復号する動画像復号装置および動画像復号方法に関する。
MPEG−4 AVC/H.264では、符号化済みの複数の参照フレームを参照して予測符号化することができ、予測の参照関係を階層的に構成する時間階層符号化を行うことができる(例えば、非特許文献1参照)。
以下、図14を参照しながら、時間階層符号化された映像データについて説明する。図14において、矢印は、フレーム間予測符号化の際に参照されるフレームを示している。最初に復号されるフレーム(I0)は、フレーム内の画素値のみを使って予測されるフレームであり、他のフレームを参照しない。
続いて復号されるフレーム(P1)は、復号済みのI0フレームを参照して予測画像が生成され、生成された予測画像との差分画像が符号化されている。次に復号されるフレーム(B2)は、復号済みのI0フレームおよびP1フレームの2フレームを参照して予測画像が生成され、生成された予測画像との差分画像が符号化されている。以下、同様である。
ここで、図14において、I0フレームおよびP1フレームを基本階層フレーム(T0)、B2フレームを第1階層フレーム(T1)、B3フレームおよびB4フレームを第2階層フレーム(T2)、B5フレーム、B6フレーム、B7フレームおよびB8フレームを第3階層フレーム(T3)と称する。
このとき、基本階層フレーム(T0)は、同じ階層に属するフレームのみを参照して復号され、第1階層フレーム(T1)は、同じ階層または基本階層フレーム(T0)に属するフレームのみを参照して復号され、以下同様にして、同じ階層またはそれ以下の階層フレームに属するフレームのみを参照して復号される。
続いて、図15を参照しながら、プログレッシブ信号およびインタレース信号について説明する。図15において、インタレース信号とは、奇数列の画素から構成されるピクチャと偶数列の画素から構成されるピクチャとに分かれた信号フォーマットである。キャプチャされたフレームは、奇数列の画素(トップフィールド)と偶数列の画素(ボトムフィールド)とに分けられる。
なお、プログレッシブ信号とは、奇数フィールドおよび偶数フィールドに分けることなく、フレーム単位で扱う信号フォーマットである。一方、インタレース信号は、ある時刻において片方のフィールドから構成される信号であり、一般的にはトップフィールドとボトムフィールドとが交互に現れる。
ここで、インタレース信号を符号化して伝送する際に、トップフィールドおよびボトムフィールドで相互に参照して符号化された場合には、片方のフィールドピクチャのみにエラーが発生したときであっても、これを参照する他のフィールドピクチャにエラーが拡散されるという問題があった。
そこで、トップフィールドとボトムフィールドとの間で相互参照せずに、それぞれのフィールドを独立して符号化する方法が提案されている(例えば、特許文献1参照)。
MPEG−4 AVC(ISO/IEC 14496−10)/ITU−T H.264規格
しかしながら、従来技術には、以下のような課題がある。
特許文献1に示されたように、それぞれのフィールドを独立して符号化した場合には、例えばトップフィールドを符号化する際に、時間的に近いボトムフィールドピクチャを参照することができないので、動きの大きいシーンにおいて予測効率が低下し、符号化効率が低下するという問題がある。
特許文献1に示されたように、それぞれのフィールドを独立して符号化した場合には、例えばトップフィールドを符号化する際に、時間的に近いボトムフィールドピクチャを参照することができないので、動きの大きいシーンにおいて予測効率が低下し、符号化効率が低下するという問題がある。
この発明は、上記のような課題を解決するためになされたものであり、インタレース信号を時間階層符号化する際に、インタレース信号のフィールドピクチャにエラーが発生した場合であっても、符号化効率の低下を抑えることができる動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法を得ることを目的とする。
この発明に係る動画像符号化装置は、符号化制御部の制御下で、シーケンス内の複数のピクチャを階層分けして符号化する際に、各階層のピクチャを、符号化対象のピクチャ内の符号化済み画素値のみを参照して符号化するか、または同じ階層およびそれ以下の階層に属する符号化済みのピクチャのみを参照して予測符号化する動き補償予測部を備えた動画像符号化装置であって、シーケンス内の各ピクチャは、インタレース信号の各フィールド画像であり、動き補償予測部は、トップフィールドピクチャに対して、符号化済みのトップフィールドピクチャのみを参照ピクチャとして予測符号化を行い、ピクチャの動きが所定値よりも大きい場合には、ボトムフィールドピクチャに対して、符号化済みで隣接する1つのトップフィールドピクチャと符号化済みのボトムフィールドピクチャとを参照ピクチャとして予測符号化を行い、ピクチャの動きが所定値よりも小さい場合には、ボトムフィールドピクチャに対して、符号化済みのボトムフィールドピクチャのみを参照ピクチャとして予測符号化を行うものである。
この発明に係る動画像符号化装置によれば、動き補償予測部は、トップフィールドピクチャに対して、符号化済みのトップフィールドピクチャのみを参照ピクチャとして予測符号化を行い、ピクチャの動きが所定値よりも大きい場合には、ボトムフィールドピクチャに対して、符号化済みで隣接する1つのトップフィールドピクチャと符号化済みのボトムフィールドピクチャとを参照ピクチャとして予測符号化を行い、ピクチャの動きが所定値よりも小さい場合には、ボトムフィールドピクチャに対して、符号化済みのボトムフィールドピクチャのみを参照ピクチャとして予測符号化を行う。
そのため、インタレース信号を時間階層符号化する際に、インタレース信号のフィールドピクチャにエラーが発生した場合であっても、符号化効率の低下を抑えることができる。
そのため、インタレース信号を時間階層符号化する際に、インタレース信号のフィールドピクチャにエラーが発生した場合であっても、符号化効率の低下を抑えることができる。
以下、この発明に係る動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法の好適な実施の形態につき図面を用いて説明するが、各図において同一、または相当する部分については、同一符号を付して説明する。
実施の形態1.
この発明の実施の形態1では、映像の各フレーム画像を入力画像として、符号化済みの近傍画素からのイントラ予測または近接フレーム間での動き補償予測を実施し、得られた予測差分信号に対して直交変換・量子化による圧縮処理を施し、その後、可変長符号化を行って符号化ビットストリームを生成する動画像符号化装置、およびその動画像符号化装置から出力される符号化ビットストリームを復号する動画像復号装置について説明する。
この発明の実施の形態1では、映像の各フレーム画像を入力画像として、符号化済みの近傍画素からのイントラ予測または近接フレーム間での動き補償予測を実施し、得られた予測差分信号に対して直交変換・量子化による圧縮処理を施し、その後、可変長符号化を行って符号化ビットストリームを生成する動画像符号化装置、およびその動画像符号化装置から出力される符号化ビットストリームを復号する動画像復号装置について説明する。
この発明の実施1に係る動画像符号化装置は、映像信号の空間・時間方向の局所的な変化に適応して、映像信号を多様なサイズのブロックに分割し、フレーム内・フレーム間適応符号化を行うことを特徴としている。
一般的に、映像信号は、空間・時間的に信号の複雑さが局所的に変化する特性を有している。空間的に見ると、ある映像フレーム上では、例えば空や壁等のような比較的広い画像領域中で均一な信号特性を有する絵柄もあれば、人物や細かいテクスチャを含む絵画等、小さい画像領域内で複雑なテクスチャパターンを有する絵柄も混在することがある。
また、時間的に見ても、空や壁は、局所的に時間方向の絵柄の変化が小さいが、一方、動く人物や物体は、その輪郭が時間的に剛体・非剛体の運動をするので、時間的な変化が大きい。
また、符号化処理は、時間・空間的な予測によって、信号電力やエントロピーの小さい予測差分信号を生成することにより、全体の符号量を削減する処理を行うが、予測に用いるパラメータをできるだけ大きな画像信号領域に均一に適用することができれば、当該パラメータの符号量を小さくすることができる。
一方、時間的・空間的に変化の大きい画像信号パターンに対して、同一の予測パラメータを大きな画像領域に適用すると、予測の誤りが増えてしまうので、予測差分信号の符号量が増加してしまう。
したがって、時間的・空間的に変化が大きい領域では、同一の予測パラメータを適用して予測処理を行うブロックサイズを小さくして、予測に用いるパラメータのデータ量を増やし、予測差分信号の電力・エントロピーを低減することが望ましい。
そこで、この発明の実施の形態1では、このような映像信号の一般的な性質に適応した符号化を行うために、最初に所定の最大ブロックサイズから予測処理等を開始し、階層的に映像信号の領域を分割して、分割した領域毎に予測処理や、その予測差分の符号化処理を適応化させる構成としている。
また、この発明の実施1に係る動画像符号化装置が処理対象とする映像信号フォーマットは、輝度信号と2つの色差信号とからなるYUV信号や、ディジタル撮像素子から出力されるRGB信号等の任意の色空間のカラー映像信号の他、モノクロ画像信号や赤外線画像信号等、映像フレームが水平・垂直2次元のディジタルサンプル(画素)列から構成される任意の映像信号である。ここで、各画素の階調は、8ビットでもよいし、10ビットや12ビット等の階調であってもよい。
なお、以下の説明においては、便宜上、特に断らない限り、入力画像の映像信号は、YUV信号であるものとし、かつ2つの色差成分U,Vが、輝度成分Yに対してサブサンプルされた4:2:0フォーマットの信号であるものとする。
また、映像信号の各フレームに対応する処理データ単位を「ピクチャ」と称する。また、この発明の実施の形態1では、映像信号をインタレース信号とし、「ピクチャ」は映像フレームを構成する単位であるフィールド画像信号である。一方、映像信号がプログレッシブ信号である場合には、「ピクチャ」は順次走査(プログレッシブスキャン)された映像フレーム信号である。
まず、この発明の実施の形態1に係る動画像符号化装置の構成について説明する。
図1は、この発明の実施の形態1に係る動画像符号化装置100を示すブロック構成図である。図1において、動画像符号化装置100は、符号化制御部1、スライス分割部2、ブロック分割部3、切り換えスイッチ4、イントラ予測部5、動き補償予測部6、減算部7、変換・量子化部8、逆量子化・逆変換部9、加算部10、イントラ予測用メモリ11、ループフィルタ部12、動き補償予測フレームメモリ13および可変長符号化部14を備えている。
図1は、この発明の実施の形態1に係る動画像符号化装置100を示すブロック構成図である。図1において、動画像符号化装置100は、符号化制御部1、スライス分割部2、ブロック分割部3、切り換えスイッチ4、イントラ予測部5、動き補償予測部6、減算部7、変換・量子化部8、逆量子化・逆変換部9、加算部10、イントラ予測用メモリ11、ループフィルタ部12、動き補償予測フレームメモリ13および可変長符号化部14を備えている。
ここで、符号化制御部1は符号化制御手段を構成し、スライス分割部2はスライス分割手段を構成し、ブロック分割部3はブロック分割手段を構成し、イントラ予測部5、イントラ予測用メモリ11、動き補償予測部6および動き補償予測フレームメモリ13は予測手段を構成する。
また、減算部7は差分画像生成手段を構成し、変換・量子化部8は画像圧縮手段を構成し、逆量子化・逆変換部9および加算部10は局所復号画像生成手段を構成し、ループフィルタ部12はフィルタリング手段を構成し、可変長符号化部14は可変長符号化手段を構成する。
以下、動画像符号化装置100の各部の機能について説明する。
符号化制御部1は、スライス分割部2におけるスライス分割情報を決定する処理を実施する。
符号化制御部1は、スライス分割部2におけるスライス分割情報を決定する処理を実施する。
また、符号化制御部1は、符号化処理が実施される際の処理単位となる符号化ブロックの最大サイズを決定するとともに、最大サイズの符号化ブロックが階層的に分割される際の上限の階層数を決定することで、各々の符号化ブロックのサイズ(符号化ブロックサイズ)を決定する処理を実施する。
また、符号化制御部1は、選択可能な1以上の符号化モード(予測処理単位を示す予測ブロックのサイズ等が異なる1以上のイントラ符号化モード、および予測ブロックのサイズ等が異なる1以上のインター符号化モード)の中から、ブロック分割部3から出力される符号化ブロックに適用する符号化モードを選択する処理を実施する。
なお、選択方法の例としては、選択可能な1以上の符号化モードの中から、ブロック分割部3から出力される符号化ブロックに対する符号化効率が最も高い符号化モードを選択する方法がある。
また、符号化制御部1は、符号化効率が最も高い符号化モードがイントラ符号化モードである場合には、そのイントラ符号化モードで符号化ブロックに対するイントラ予測処理を実施する際に用いるイントラ予測パラメータを、上記イントラ符号化モードが示す予測処理単位である予測ブロック毎に決定する処理を実施する。
これに対して、符号化制御部1は、符号化効率が最も高い符号化モードがインター符号化モードである場合には、そのインター符号化モードで符号化ブロックに対するインター予測処理を実施する際に用いるインター予測パラメータを、上記インター符号化モードが示す予測処理単位である予測ブロック毎に決定する処理を実施する。
さらに、符号化制御部1は、変換・量子化部8および逆量子化・逆変換部9に与える予測差分符号化パラメータを決定する処理を実施する。予測差分符号化パラメータには、符号化ブロックにおける直交変換処理単位となる直交変換ブロックの分割情報を示す直交変換ブロック分割情報や、変換係数の量子化を行う際の量子化ステップサイズを規定する量子化パラメータ等が含まれる。
スライス分割部2は、入力画像として映像信号が入力されると、符号化制御部1により決定されたスライス分割情報に従って、その入力画像を1以上の「スライス」という部分画像に分割する処理を実施する。なお、スライスの分割単位は、符号化ブロック単位まで細かくすることができる。
ブロック分割部3は、スライス分割部2により分割されたスライスが入力される毎に、そのスライスを、符号化制御部1により決定された最大サイズの符号化ブロックである最大符号化ブロックに分割する。また、ブロック分割部3は、符号化制御部1により決定された上限の階層数に至るまで、その最大符号化ブロックを階層的に各符号化ブロックへ分割する処理を実施する。
すなわち、ブロック分割部3は、符号化制御部1により決定された符号化ブロックサイズに応じてスライスを各符号化ブロックに分割して、その符号化ブロックを出力する処理を実施する。また、各符号化ブロックは、予測処理単位となる1つまたは複数の予測ブロックに分割される。
切り換えスイッチ4は、符号化制御部1により決定された符号化モードがイントラ符号化モードであれば、ブロック分割部3から出力された符号化ブロックをイントラ予測部5に出力する。一方、切り換えスイッチ4は、符号化制御部1により決定された符号化モードがインター符号化モードであれば、ブロック分割部3から出力された符号化ブロックを動き補償予測部6に出力する処理を実施する。
イントラ予測部5は、切り換えスイッチ4から出力された符号化ブロックに対応する符号化モードとして、符号化制御部1によりイントラ符号化モードが選択された場合には、イントラ予測処理(フレーム内予測処理)を実施して、イントラ予測画像を生成する処理を実施する。
具体的には、イントラ予測部5は、その符号化ブロックの予測処理を行う際の予測処理単位である予測ブロック毎に、イントラ予測用メモリ11に格納されている局所復号画像を参照しながら、符号化制御部1により決定されたイントラ予測パラメータを用いたイントラ予測処理を実施してイントラ予測画像を生成する。
動き補償予測部6は、切り換えスイッチ4から出力された符号化ブロックに対応する符号化モードとして、符号化制御部1によりインター符号化モードが選択された場合には、その符号化ブロックに対するインター予測処理(動き補償予測処理)を予測ブロック単位に実施して、インター予測画像を生成する処理を実施する。
具体的には、動き補償予測部6は、符号化ブロックと動き補償予測フレームメモリ13に格納されている1フレーム以上の局所復号画像とを、予測処理単位である予測ブロック単位に比較して動きベクトルを探索する。また、動き補償予測部6は、その動きベクトルと符号化制御部1により決定された参照するフレーム番号等のインター予測パラメータとを用いて、その符号化ブロックに対するインター予測処理を、予測ブロック単位に実施してインター予測画像を生成する。
減算部7は、ブロック分割部3により出力された符号化ブロックから、イントラ予測部5により生成されたイントラ予測画像、または動き補償予測部6により生成されたインター予測画像を減算して、その減算結果である差分画像を示す予測差分信号を変換・量子化部8に出力する処理を実施する。
変換・量子化部8は、符号化制御部1により決定された予測差分符号化パラメータに含まれる直交変換ブロック分割情報を参照して、減算部7から出力された予測差分信号に対する直交変換処理を、直交変換ブロック単位に実施して変換係数を算出する。
なお、直交変換処理として、例えば離散コサイン変換(DCT:Discrete Cosine Transformation)や離散サイン変換(DST:Discrete Sine Transformation)、あらかじめ特定の学習系列に対して基底設計がなされているKL(Karhunen−Loeve)変換等の直交変換処理が挙げられる。
また、変換・量子化部8は、その予測差分符号化パラメータに含まれる量子化パラメータを参照して、その直交変換ブロック単位の変換係数を量子化し、量子化後の変換係数である圧縮データを逆量子化・逆変換部9および可変長符号化部14に出力する処理を実施する。
なお、変換・量子化部8は、変換係数を量子化する際に、上記量子化パラメータから算出される量子化ステップサイズを変換係数毎にスケーリングする量子化マトリクスを用いて、変換係数の量子化処理を実施するようにしてもよい。
ここで、量子化マトリクスは、各直交変換サイズで色信号や符号化モード(イントラ符号化かインター符号化か)毎に独立しているマトリクスを使用することができる。すなわち、初期値としてあらかじめ動画像符号化装置および動画像復号装置で共通に用意されている量子化マトリクスや、既に符号化された量子化マトリクスの中から選択するか、新しい量子化マトリクスを用いるかをそれぞれ選択することができる。
したがって、変換・量子化部8は、各直交変換サイズに対して色信号や符号化モード毎に、新しい量子化マトリクスを用いるか否かを示すフラグ情報を、符号化すべき量子化マトリクスパラメータに設定する。その後、変換・量子化部8は、設定した量子化マトリクスパラメータを適応パラメータセットの一部として可変長符号化部14に出力する。
逆量子化・逆変換部9は、符号化制御部1により決定された予測差分符号化パラメータに含まれる量子化パラメータおよび直交変換ブロック分割情報を参照して、直交変換ブロック単位に変換・量子化部8から出力された圧縮データを逆量子化する。また、逆量子化・逆変換部9は、逆量子化後の圧縮データである変換係数に対する逆直交変換処理を実施して、減算部7から出力された予測差分信号に相当する局所復号予測差分信号を算出する処理を実施する。
なお、変換・量子化部8が、量子化マトリクスを用いて量子化処理を実施している場合には、逆量子化処理時においても、その量子化マトリクスを参照して、対応する逆量子化処理を実施する。
加算部10は、逆量子化・逆変換部9により算出された局所復号予測差分信号と、イントラ予測部5により生成されたイントラ予測画像、または動き補償予測部6により生成されたインター予測画像とを加算して、ブロック分割部3から出力された符号化ブロックに相当する局所復号画像を算出する処理を実施する。
イントラ予測用メモリ11は、加算部10により算出された局所復号画像を格納する記録媒体である。
ループフィルタ部12は、加算部10により算出された局所復号画像に対して、所定のフィルタ処理を実施して、フィルタ処理後の局所復号画像を出力する処理を実施する。具体的には、ループフィルタ部12は、直交変換ブロックの境界や予測ブロックの境界に発生する歪みを低減するフィルタ(デブロッキングフィルタ)処理や、画素単位に適応的にオフセットを加算する(画素適応オフセット)処理、ウィーナフィルタ等の線形フィルタを適応的に切り替えてフィルタ処理する適応フィルタ処理等を行う。
ここで、ループフィルタ部12は、上記のデブロッキングフィルタ処理、画素適応オフセット処理および適応フィルタ処理のそれぞれについて、処理を行うか否かを決定する。また、ループフィルタ部12は、各処理の有効フラグを、符号化すべき適応パラメータセットの一部およびスライスレベルヘッダの一部として可変長符号化部14に出力する。なお、上記のフィルタ処理を複数使用する際は、各フィルタ処理を順番に実施する。
一般に、使用するフィルタ処理の種類が多いほど、画像品質は向上するが、一方で処理負荷は高くなる。すなわち、画像品質と処理負荷とは、トレードオフの関係にある。また、各フィルタ処理の画像品質改善効果は、フィルタ処理対象画像の特性によって異なる。したがって、動画像符号化装置が許容する処理負荷や符号化処理対象画像の特性にしたがって、使用するフィルタ処理を決めればよい。
図2は、この発明の実施の形態1に係る動画像符号化装置100において、複数のフィルタ処理を用いる場合のループフィルタ部12の一例を示すブロック構成図である。図2において、ループフィルタ部12は、デブロッキングフィルタ処理121、画素適応オフセット処理122および適応フィルタ処理123を有している。
デブロッキングフィルタ処理121では、ブロック境界にかけるフィルタ強度の選択に用いる各種パラメータを、初期値から変更することができる。変更する場合には、デブロッキングフィルタ処理121では、そのパラメータを、符号化すべき適応パラメータセットの一部として可変長符号化部14に出力する。
画素適応オフセット処理122では、最初に、画像を複数のブロックに分割し、そのブロック単位に、オフセット処理を行わない場合もクラス分類方法の1つとして定義して、あらかじめ用意されている複数のクラス分類方法の中から、1つのクラス分類方法を選択する。
次に、画素適応オフセット処理122では、選択したクラス分類方法によって、ブロック内の各画素をクラス分類し、クラス毎に符号化歪みを補償するオフセット値を算出する。最後に、画素適応オフセット処理122では、局所復号画像の輝度値に対して、そのオフセット値を加算する処理を行うことで局所復号画像の画像品質を改善する。
したがって、画素適応オフセット処理122では、ブロック分割情報、各ブロックのクラス分類方法を示すインデックス、およびブロック単位の各クラスのオフセット値を特定するオフセット情報を、符号化すべき適応パラメータセットの一部として可変長符号化部14に出力する。
なお、画素適応オフセット処理122において、例えば最大符号化ブロックといった固定サイズのブロック単位に常に分割し、そのブロック毎にクラス分類方法を選択して、クラス毎の適応オフセット処理を行ってもよい。この場合には、上記のブロック分割情報が不要になるので、ブロック分割情報に要する符号量分だけ符号量を削減することができる。
適応フィルタ処理123では、局所復号画像を所定の方法でクラス分類し、各クラスに属する領域(局所復号画像)毎に、重畳されている歪みを補償するフィルタを設計し、そのフィルタを用いて、当該局所復号画像のフィルタ処理を実施する。
また、適応フィルタ処理123では、クラス毎に設計したフィルタを、符号化すべき適応パラメータセットの一部として可変長符号化部14に出力する。ここで、クラス分類方法としては、画像を空間的に等間隔に区切る簡易な方法や、ブロック単位に画像の局所的な特性(分散等)に応じて分類する方法がある。
また、適応フィルタ処理123で使用するクラス数は、あらかじめ動画像符号化装置および動画像復号装置に共通の値として設定してもよいし、符号化すべき適応パラメータセットの一部としてもよい。このとき、前者と比較して後者の方が、使用するクラス数を自由に設定することができるので、画像品質改善効果が上がるが、一方でクラス数を符号化するために、その分の符号量が増加する。
さらに、適応フィルタ処理123では、適応フィルタ処理のクラス分類およびフィルタ設計・処理を画像全体に対してではなく、例えば最大符号化ブロックといった固定サイズのブロック毎にフィルタ処理を行ってもよい。
すなわち、固定サイズのブロック内を分割した複数の小ブロック単位に画像の局所的な特性(分散等)に応じてクラス分類し、クラス毎にフィルタ設計およびフィルタ処理を行うようにして、固定サイズのブロック毎に、各クラスのフィルタを適応パラメータセットの一部として符号化するようにしてもよい。
このようにすることで、画像全体に対してクラス分類およびフィルタ設計・処理を実施する場合よりも、局所的な性質に応じた高精度なフィルタ処理を実現することができる。なお、画素適応オフセット処理および適応フィルタ処理を行う場合には、映像信号をループフィルタ部12で参照する必要があるので、映像信号がループフィルタ部12に入力されるように、図1の動画像符号化装置100を変更する必要がある。
動き補償予測フレームメモリ13は、ループフィルタ部12のフィルタ処理後の局所復号画像を格納する記録媒体である。
可変長符号化部14は、変換・量子化部8から出力された圧縮データと、符号化制御部1の出力信号(最大符号化ブロック内のブロック分割情報、符号化モード、予測差分符号化パラメータ、イントラ予測パラメータまたはインター予測パラメータ)と、動き補償予測部6から出力された動きベクトル(符号化モードがインター符号化モードである場合)とを可変長符号化して、符号化データを生成する。
また、可変長符号化部14は、符号化ビットストリームのヘッダ情報として、ビデオパラメータセット、シーケンスレベルヘッダ、ピクチャレベルヘッダ、適応パラメータセットを符号化し、ピクチャデータとともに符号化ビットストリームを生成する。ここで、ピクチャデータは、1以上のスライスデータから構成され、各スライスデータは、スライスレベルヘッダと当該スライス内にある上記符号化データとをまとめたものである。
また、シーケンスレベルヘッダは、画像サイズ、色信号フォーマット、輝度信号や色差信号の信号値のビット深度、シーケンス単位でのループフィルタ部12における各フィルタ処理(デブロッキングフィルタ処理121、画素適応オフセット処理122および適応フィルタ処理123)の有効フラグ情報、量子化マトリクスの有効フラグ情報等、一般的にシーケンス単位に共通となるヘッダ情報をまとめたものである。
また、ピクチャレベルヘッダは、参照するシーケンスレベルヘッダのインデックスや動き補償時の参照ピクチャ数、エントロピー符号化の確率テーブル初期化フラグ等、ピクチャ単位で設定するヘッダ情報をまとめたものである。
また、スライスレベルヘッダは、当該スライスがピクチャのどの位置にあるかを示す位置情報、どのピクチャレベルヘッダを参照するかを示すインデックス、スライスの符号化タイプ(オールイントラ符号化、インター符号化等)、当該スライスで使用する適応パラメータセットのインデックスおよび上記インデックスが示す適応パラメータセットを用いたループフィルタ部12における各フィルタ処理(デブロッキングフィルタ処理121、画素適応オフセット処理122および適応フィルタ処理123)を行うか否かを示すフラグ情報等のスライス単位のパラメータをまとめたものである。
また、適応パラメータセットは、デブロッキングフィルタ処理、画素適応オフセット処理および適応フィルタ処理に関わるパラメータ(フィルタパラメータ)並びに量子化マトリクスに関わるパラメータ(量子化マトリクスパラメータ)が存在するか否かのフラグをそれぞれ有し、上記フラグが「有効」であるパラメータのみ対応するパラメータを有するパラメータセットである。さらに、適応パラメータセットは、符号化ビットストリームに多重化されている複数の適応パラメータセットを識別するためのインデックス(aps_id)も有する。
なお、図1の動画像符号化装置100では、符号化制御部1、スライス分割部2、ブロック分割部3、切り換えスイッチ4、イントラ予測部5、動き補償予測部6、減算部7、変換・量子化部8、逆量子化・逆変換部9、加算部10、イントラ予測用メモリ11、ループフィルタ部12、動き補償予測フレームメモリ13および可変長符号化部14のそれぞれが、専用のハードウェア(例えば、CPUを実装している半導体集積回路や、ワンチップマイコン等)で構成されているものを想定している。
これに対して、動画像符号化装置がコンピュータで構成される場合には、符号化制御部1、スライス分割部2、ブロック分割部3、切り換えスイッチ4、イントラ予測部5、動き補償予測部6、減算部7、変換・量子化部8、逆量子化・逆変換部9、加算部10、ループフィルタ部12および可変長符号化部14の処理内容が記述されたプログラムを、コンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
次に、この発明の実施の形態1に係る動画像復号装置の構成について説明する。
図3は、この発明の実施の形態1に係る動画像復号装置200を示すブロック構成図である。図3において、動画像復号装置200は、可変長復号部21、逆量子化・逆変換部22、切り換えスイッチ23、イントラ予測部24、動き補償部25、加算部26、イントラ予測用メモリ27、ループフィルタ部28、動き補償予測フレームメモリ29およびエラーコンシールメント処理部30を備えている。
図3は、この発明の実施の形態1に係る動画像復号装置200を示すブロック構成図である。図3において、動画像復号装置200は、可変長復号部21、逆量子化・逆変換部22、切り換えスイッチ23、イントラ予測部24、動き補償部25、加算部26、イントラ予測用メモリ27、ループフィルタ部28、動き補償予測フレームメモリ29およびエラーコンシールメント処理部30を備えている。
ここで、可変長復号部21は可変長復号手段を構成し、逆量子化・逆変換部22は差分画像生成手段を構成し、イントラ予測部24、イントラ予測用メモリ27、動き補償部25および動き補償予測フレームメモリ29は予測手段を構成する。また、加算部26は復号画像生成手段を構成し、ループフィルタ部28はフィルタリング手段を構成し、エラーコンシールメント処理部30はエラーコンシールメント手段を構成する。
以下、動画像復号装置200の各部の機能について説明する。
可変長復号部21は、図1の動画像符号化装置100により生成された符号化ビットストリームが入力されると、そのビットストリームからシーケンスレベルヘッダ、ピクチャレベルヘッダ、適応パラメータセット、スライスレベルヘッダ等の各ヘッダ情報を復号する。また、可変長復号部21は、そのビットストリームから、階層的に分割されている各々の符号化ブロックの分割状況を示すブロック分割情報を可変長復号する。
可変長復号部21は、図1の動画像符号化装置100により生成された符号化ビットストリームが入力されると、そのビットストリームからシーケンスレベルヘッダ、ピクチャレベルヘッダ、適応パラメータセット、スライスレベルヘッダ等の各ヘッダ情報を復号する。また、可変長復号部21は、そのビットストリームから、階層的に分割されている各々の符号化ブロックの分割状況を示すブロック分割情報を可変長復号する。
このとき、可変長復号部21によって可変長復号された適応パラメータセット内の量子化マトリクスパラメータから、当該適応パラメータセットの量子化マトリクスが特定される。
具体的には、各直交変換サイズの色信号や符号化モード毎に、量子化マトリクスパラメータが、初期値としてあらかじめ動画像符号化装置および動画像復号装置で共通に用意されている量子化マトリクス、または既に復号された量子化マトリクスである(新しい量子化マトリクスでない)ことを示す場合には、上記適応パラメータセットに含まれる上記マトリクスの内のどの量子化マトリクスであるかを特定するインデックス情報を参照して、量子化マトリクスが特定される。
また、量子化マトリクスパラメータが、新しい量子化マトリクスを用いることを示す場合には、量子化マトリクスパラメータに含まれる量子化マトリクスを使用する量子化マトリクスとして特定される。
また、可変長復号部21は、各ヘッダ情報を参照して、スライスデータに含まれる最大復号ブロック(図1の動画像符号化装置100の「最大符号化ブロック」に相当するブロック)を特定し、ブロック分割情報を参照して、最大復号ブロックを階層的に分割して復号処理を行う単位である復号ブロック(図1の動画像符号化装置100の「符号化ブロック」に相当するブロック)を特定する。
その後、可変長復号部21は、各々の復号ブロックに係る圧縮データ、符号化モード、イントラ予測パラメータ(符号化モードがイントラ符号化モードである場合)、インター予測パラメータ(符号化モードがインター符号化モードである場合)、予測差分符号化パラメータおよび動きベクトル(符号化モードがインター符号化モードである場合)を可変長復号する処理を実施する。
また、可変長復号部21は、各ヘッダ情報の復号中または各復号ブロックの復号中にエラーを検出した場合には、復号処理を正常に再開できる同期ポイントまでビットストリームを読み飛ばす処理を行う。なお、エラーを検出した後、復号処理を再開するまで読み飛ばしたデータに相当するピクチャについては、後述するエラーコンシールメント処理を行う。
逆量子化・逆変換部22は、可変長復号部21により可変長復号された予測差分符号化パラメータに含まれる量子化パラメータおよび直交変換ブロック分割情報を参照して、可変長復号部21により可変長復号された圧縮データを直交変換ブロック単位に逆量子化する。また、逆量子化・逆変換部22は、逆量子化後の圧縮データである変換係数に対する逆直交変換処理を実施して、図1の逆量子化・逆変換部9から出力された局所復号予測差分信号と同一の復号予測差分信号を算出する処理を実施する。
ここで、可変長復号部21により可変長復号された各ヘッダ情報が、当該スライスで量子化マトリクスを用いて、逆量子化処理を実施することを示している場合には、逆量子化・逆変換部22は、量子化マトリクスを用いて逆量子化処理を行う。具体的には、逆量子化・逆変換部22は、各ヘッダ情報から特定される、当該スライスで参照する適応パラメータセットの量子化マトリクスを用いて、逆量子化処理を行う。
切り換えスイッチ23は、可変長復号部21により可変長復号された符号化モードがイントラ符号化モードであれば、可変長復号部21により可変長復号されたイントラ予測パラメータを、イントラ予測部24に出力する処理を実施する。一方、切り換えスイッチ23は、可変長復号部21により可変長復号された符号化モードがインター符号化モードであれば、可変長復号部21により可変長復号されたインター予測パラメータおよび動きベクトルを、動き補償部25に出力する処理を実施する。
イントラ予測部24は、可変長復号部21により可変長復号されたブロック分割情報から特定される復号ブロックに係る符号化モードがイントラ符号化モードである場合には、イントラ予測処理(フレーム内予測処理)を実施して、イントラ予測画像を生成する処理を実施する。
具体的には、イントラ予測部24は、その復号ブロックの予測処理を行う際の予測処理単位である予測ブロック毎に、イントラ予測用メモリ27に格納されている復号画像を参照しながら、切り換えスイッチ23から出力されたイントラ予測パラメータを用いたイントラ予測処理を実施してイントラ予測画像を生成する。
動き補償部25は可変長復号部21により可変長復号されたブロック分割情報から特定される復号ブロックに係る符号化モードがインター符号化モードである場合には、インター予測処理(動き補償予測処理)を実施して、インター予測画像を生成する処理を実施する。
具体的には、動き補償部25は、その復号ブロックの予測処理を行う際の予測処理単位である予測ブロック毎に、動き補償予測フレームメモリ29に格納されている復号画像を参照しながら、切り換えスイッチ23から出力された動きベクトルとインター予測パラメータとを用いたインター予測処理を実施して、インター予測画像を生成する。
加算部26は、逆量子化・逆変換部22により算出された復号予測差分信号と、イントラ予測部24により生成されたイントラ予測画像、または動き補償部25により生成されたインター予測画像とを加算して、図1の加算部10から出力された局所復号画像と同一の復号画像を算出する処理を実施する。
イントラ予測用メモリ27は、加算部26により算出された復号画像を格納する記録媒体である。
ループフィルタ部28は、加算部26により算出された復号画像に対して、所定のフィルタ処理を実施して、フィルタ処理後の復号画像を出力する処理を実施する。具体的には、ループフィルタ部28は、直交変換ブロックの境界や予測ブロックの境界に発生する歪みを低減するフィルタ(デブロッキングフィルタ)処理や、画素単位に適応的にオフセットを加算する(画素適応オフセット)処理、ウィーナフィルタ等の線形フィルタを適応的に切り替えてフィルタ処理する適応フィルタ処理等を行う。
ここで、ループフィルタ部28は、上記のデブロッキングフィルタ処理、画素適応オフセット処理および適応フィルタ処理のそれぞれについて、可変長復号部21により可変長復号された各ヘッダ情報を参照して、当該スライスで処理を行うか否かを特定する。
なお、図1の動画像符号化装置100において、ループフィルタ部28で使用するフィルタパラメータを、ヘッダ情報の1つである適応パラメータセットの一部として符号化するのではなく、スライス単位に使用するフィルタパラメータをそれぞれ直接スライスデータで符号化している場合には、可変長復号部21は、スライスデータからループフィルタ部28で使用するフィルタパラメータを復号する。
このとき、2つ以上のフィルタ処理を行う場合において、動画像符号化装置のループフィルタ部12が図2のように構成されていれば、図4に示されるようにループフィルタ部28が構成される。
図4は、この発明の実施の形態1に係る動画像復号装置200において、複数のフィルタ処理を用いる場合のループフィルタ部28一例を示すブロック構成図である。図4において、ループフィルタ部28は、デブロッキングフィルタ処理281、画素適応オフセット処理282および適応フィルタ処理283を有している。
デブロッキングフィルタ処理281では、当該スライスが参照する適応パラメータセットを参照し、ブロック境界にかけるフィルタ強度の選択に用いる各種パラメータを初期値から変更する情報が存在する場合には、その変更情報に基づいて、デブロッキングフィルタ処理を実施する。なお、変更情報がない場合には、あらかじめ定められた方法に従って行う。
画素適応オフセット処理282では、当該スライスが参照する適応パラメータセットを参照し、その適応パラメータセットに含まれるブロック分割情報に基づいて復号画像を分割する。
その後、画素適応オフセット処理282では、そのブロック単位に、その適応パラメータセットに含まれるブロック単位のクラス分類方法を示すインデックスを参照して、そのインデックスが「オフセット処理を行わない」ことを示すインデックスでない場合には、ブロック単位にブロック内の各画素を、上記インデックスが示すクラス分類方法に従ってクラス分類する。
なお、クラス分類方法の候補として、図1のループフィルタ部12の画素適応オフセット処理122のクラス分類方法の候補と同一のものがあらかじめ用意されている。その後、画素適応オフセット処理282では、ブロック単位の各クラスのオフセット値を特定するオフセット情報(適応パラメータセットに含まれているオフセット情報)を参照して、復号画像の輝度値にオフセットを加算する処理を行う。
ここで、図1のループフィルタ部12の画素適応オフセット処理122において、ブロック分割情報を符号化せず、常に画像を固定サイズのブロック単位(例えば、最大符号化ブロック単位)に分割し、そのブロック毎にクラス分類方法を選択して、クラス毎の適応オフセット処理を行うように構成されている場合には、ループフィルタ部28においても、ループフィルタ部12と同一の固定サイズのブロック単位に、画素適応オフセット処理を実施する。
適応フィルタ処理283では、当該スライスが参照する適応パラメータセットを参照し、その適応パラメータセットに含まれるクラス毎のフィルタを用いて、図1の動画像符号化装置100と同一の方法でクラス分類した後に、そのクラス分類情報に基づいてフィルタ処理を行う。このループフィルタ部28によるフィルタ処理後の復号画像が、動き補償予測用の参照画像となり、また、再生画像となる。
なお、図1のループフィルタ部12の適応フィルタ処理123において、上記のクラス分類およびフィルタ設計・処理を、画像全体に対してではなく、例えば最大符号化ブロックといった固定サイズのブロック毎に行うように構成されている場合、ループフィルタ部28においても、ループフィルタ部12と同一の固定サイズのブロック毎に、各クラスで用いるフィルタを復号して上記クラス分類およびフィルタ処理を行う。
動き補償予測フレームメモリ29は、ループフィルタ部28のフィルタ処理後の復号画像を格納する記録媒体である。
エラーコンシールメント処理部30は、可変長復号部21からエラー検出の通知を受け取ると、可変長復号部21で読み飛ばしたデータに相当するピクチャのコンシールメント処理を実施する。
また、エラーコンシールメント処理部30は、コンシールメント処理を行った画像が参照ピクチャである場合には、以降の復号処理においてエラーが伝播するので、コンシールメント処理を行ったピクチャであることを示すエラーピクチャ通知とともに、コンシールメント処理を行った画像を、動き補償予測フレームメモリ29に格納する。
なお、図3の動画像復号装置200では、可変長復号部21、逆量子化・逆変換部22、切り換えスイッチ23、イントラ予測部24、動き補償部25、加算部26、イントラ予測用メモリ27、ループフィルタ部28、動き補償予測フレームメモリ29およびエラーコンシールメント処理部30のそれぞれが、専用のハードウェア(例えば、CPUを実装している半導体集積回路や、ワンチップマイコン等)で構成されているものを想定している。
これに対して、動画像復号装置がコンピュータで構成される場合には、可変長復号部21、逆量子化・逆変換部22、切り換えスイッチ23、イントラ予測部24、動き補償部25、加算部26、ループフィルタ部28およびエラーコンシールメント処理部30の処理内容が記述されたプログラムを、コンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
続いて、この発明の実施の形態1に係る動画像符号化装置100および動画像復号装置200の動作について説明する。
最初に、図5のフローチャートを参照しながら、この発明の実施の形態1に係る動画像符号化装置100の処理内容(動画像符号化方法)について説明する。
最初に、図5のフローチャートを参照しながら、この発明の実施の形態1に係る動画像符号化装置100の処理内容(動画像符号化方法)について説明する。
まず、符号化制御部1は、シーケンス内のピクチャのピクチャタイプ、符号化順、予測に使うピクチャの参照関係等のGOP構造を決定する(ステップST1)。ここで、例えば図6に示されるようなGOP構造でインタレース信号を時間階層符号化する場合における符号化処理の内容について説明する。
図6において、符号化制御部1は、最初のトップフィールドピクチャのピクチャタイプをIピクチャ(I0ピクチャ)とし、次に符号化するボトムフィールドピクチャのピクチャタイプをBピクチャ(B1ピクチャ)として、B1ピクチャを、I0ピクチャのみを参照して予測符号化する。
また、符号化制御部1は、B1ピクチャの次に符号化するトップフィールドピクチャのピクチャタイプをBピクチャ(B2ピクチャ)として、B2ピクチャを、I0ピクチャのみを参照して予測符号化する。
また、符号化制御部1は、B2ピクチャの次に符号化するボトムフィールドピクチャのピクチャタイプをBピクチャ(B3ピクチャ)として、B3ピクチャを、B2ピクチャおよびB1ピクチャを参照して予測符号化する。
ここで、I0ピクチャ、B1ピクチャ、B2ピクチャおよびB3ピクチャは、第1階層に属するピクチャとする。なお、第1階層において、ボトムフィールドピクチャは、時間的に近いトップフィールドピクチャを参照して予測するように構成されているが、トップフィールドピクチャは、トップフィールドピクチャのみを参照して予測するように構成されている。
また、符号化制御部1は、B3ピクチャの次に符号化するトップフィールドピクチャのピクチャタイプをBピクチャ(B4ピクチャ)として、B4ピクチャを、第1階層のI0ピクチャおよびB2ピクチャを参照して予測符号化する。
また、符号化制御部1は、B4ピクチャの次に符号化するボトムフィールドピクチャのピクチャタイプをBピクチャ(B5ピクチャ)として、B5ピクチャを、B4ピクチャ並びに第1階層のB1ピクチャおよびB3ピクチャを参照して予測符号化する。
ここで、B4ピクチャおよびB5ピクチャは、第2階層に属するピクチャとする。なお、第2階層において、ボトムフィールドピクチャは、時間的に近いトップフィールドピクチャを参照して予測するように構成されているが、トップフィールドピクチャは、トップフィールドピクチャのみを参照して予測するように構成されている。符号化制御部1は、これ以降、第3階層のピクチャについても同様に予測符号化を行う。
以上のようなGOP構造で時間階層符号化する場合には、図7に示されるように、動画像復号装置側で、例えば第3階層に属するピクチャでエラーが発生し、正常復号ができなかった場合において、第2階層および第1階層に属するピクチャのみを正しく復号することができる。また、第3階層のボトムフィールドピクチャでエラーが発生し、正常復号ができなかった場合においても、第3階層のトップフィールドピクチャは、正常に復号することができる。
なお、第3階層のトップフィールドピクチャでエラーが発生した場合には、第3階層のボトムフィールドは、トップフィールドを参照しているので、以降の第3階層のボトムフィールド、トップフィールドピクチャともにエラーが伝播し、正常に復号することができない。この場合には、正常に復号された第1階層および第2階層のピクチャを使って、エラー発生およびエラーが伝播したピクチャのコンシールメントを実施する。
また、別の例として、動きが(所定値よりも)大きいシーンでは、ボトムフィールドの符号化時に時間的に近いトップフィールドを参照して予測符号化するように構成し、動きが(所定値よりも)小さいシーンでは、ボトムフィールドを符号化するときにもトップフィールドを参照せず、ボトムフィールドのみを参照して予測符号化するようにして、シーンの動きの特徴に応じて予測の参照関係を切り替えて符号化するようにしてもよい。
また、GOP構造の別の例として、図8に示されるように、ボトムフィールドをすべて最上位階層のピクチャとして符号化し、トップフィールドのピクチャのみを参照して符号化するようにしてもよい。このような構成とすることにより、トップフィールドのピクチャのみを正常に復号することができるので、ボトムフィールドでエラーが発生しても、トップフィールドおよび以降のボトムフィールドを正常に復号することができ、エラーの伝播を抑えることができる。
ここで、分割階層数の上限の決め方としては、例えば、入力画像の映像信号の解像度に応じて、全てのピクチャに対して同一の階層数を定める方法や、入力画像の映像信号の動きが激しい(大きい)場合に、階層数を深くしてより細かい動きが検出できるように設定し、動きが少ない(小さい)場合に、階層数を抑えるように設定する方法等がある。
なお、上記最大符号化ブロックのサイズと、最大符号化ブロックを階層分割する階層数の上限はシーケンスレベルヘッダ等に符号化してもよいし、符号化せずに動画像復号装置側も同一の決定処理を行うようにしてもよい。
前者は、ヘッダ情報の符号量が増加するものの、動画像復号装置側で上記決定処理を行わずに済むので、動画像復号装置の処理負荷を抑えることができる上、動画像符号化装置側で最適な値を探索して送ることができる。これに対して、後者は、動画像復号装置側で上記決定処理を行うので、動画像復号装置の処理負荷が増加するものの、ヘッダ情報の符号量は増加しない。
図5に戻って、符号化制御部1は、利用可能な1以上の符号化モードの中から、階層的に分割される各々の符号化ブロックに対応する符号化モードを選択する(ステップST2)。すなわち、符号化制御部1は、最大符号化ブロックサイズの画像領域毎に、先に定めた分割階層数の上限に至るまで、階層的に符号化ブロックサイズを有する符号化ブロックに分割して、各々の符号化ブロックに対する符号化モードを決定する。
符号化モードには、1つまたは複数のイントラ符号化モード(「INTRA」と総称する)と、1つまたは複数のインター符号化モード(「INTER」と総称する)とがあり、符号化制御部1は、当該ピクチャで利用可能な全ての符号化モード、またはそのサブセットの中から、各々の符号化ブロックに対応する符号化モードを選択する。
ここで、後述するブロック分割部3により階層的に分割される各々の符号化ブロックは、さらに予測処理を行う単位である1つまたは複数の予測ブロックに分割され、予測ブロックの分割状態も、符号化モードの中に情報として含まれる。すなわち、符号化モードは、どのような予測ブロック分割を有するイントラまたはインター符号化モードかを識別するインデックスである。
なお、符号化制御部1による符号化モードの選択方法は、公知の技術なので、詳細な説明を省略するが、例えば、利用可能な任意の符号化モードを用いて、符号化ブロックに対する符号化処理を実施して符号化効率を検証し、利用可能な複数の符号化モードの中で、最も符号化効率がよい符号化モードを選択する方法等がある。
また、符号化制御部1は、各々の符号化ブロック毎に、差分画像が圧縮される際に用いられる量子化パラメータおよび直交変換ブロック分割状態を決定するとともに、予測処理が実施される際に用いられる予測パラメータ(イントラ予測パラメータまたはインター予測パラメータ)を決定する。
ここで、符号化ブロックがさらに予測処理を行う予測ブロック単位に分割される場合には、予測ブロック毎に予測パラメータ(イントラ予測パラメータまたはインター予測パラメータ)を選択することができる。
また、符号化モードがイントラ符号化モードである符号化ブロックにおいては、詳細は後述するが、イントラ予測処理を行う際に予測ブロックに隣接する符号化済みの画素を用いることから、予測ブロック単位に符号化を行う必要があるので、選択可能な変換ブロックサイズは、予測ブロックのサイズ以下に制限される。
このとき、符号化制御部1は、量子化パラメータおよび変換ブロックサイズを含む予測差分符号化パラメータを、変換・量子化部8、逆量子化・逆変換部9および可変長符号化部14に出力する。また、符号化制御部1は、イントラ予測パラメータを、必要に応じてイントラ予測部5に出力する。さらに、符号化制御部1は、インター予測パラメータを、必要に応じて動き補償予測部6に出力する。
また、スライス分割部2は、入力画像として映像信号が入力されると、符号化制御部1により決定されたスライス分割情報に従って、その入力画像を1以上の部分画像であるスライスに分割する。
また、ブロック分割部3は、スライス分割部2から各スライスが入力される毎に、そのスライスを、符号化制御部1により決定された最大符号化ブロックサイズに分割し、さらに、分割した最大符号化ブロックを、符号化制御部1により決定された符号化ブロックへ階層的に分割して、その符号化ブロックを出力する。
ここで、図9を参照しながら、この発明の実施の形態1に係る動画像符号化装置100において、最大符号化ブロックが階層的に複数の符号化ブロックに分割される処理について説明する。
図9において、最大符号化ブロックは、「第0階層」と記されている、輝度成分が(L0,M0)のサイズを有する符号化ブロックである。最大符号化ブロックを出発点として、4分木構造で別途定める所定の深さまで、階層的に分割を行うことによって、符号化ブロックを得るようにしている。
また、深さnにおいては、符号化ブロックは、サイズ(Ln,Mn)の画像領域である。ここで、LnとMnとは、同じであってもよいし、異なっていてもよいが、図9では、Ln=Mnのケースを示している。
これ以降、符号化制御部1により決定される符号化ブロックサイズは、符号化ブロックの輝度成分におけるサイズ(Ln,Mn)と定義する。また、4分木分割を行うために、常に、(Ln+1,Mn+1)=(Ln/2,Mn/2)が成立する。
なお、RGB信号等、全ての色成分が同一サンプル数を有するカラー映像信号(4:4:4フォーマット)では、全ての色成分のサイズが(Ln,Mn)になるが、4:2:0フォーマットを扱う場合には、対応する色差成分の符号化ブロックサイズは、(Ln/2,Mn/2)になる。
これ以降、第n階層の符号化ブロックをBnで表し、符号化ブロックBnで選択可能な符号化モードをm(Bn)で表すものとする。複数の色成分からなるカラー映像信号の場合、符号化モードm(Bn)は、色成分毎に、それぞれ個別のモードを用いるように構成されてもよいし、全ての色成分に対して共通のモードを用いるように構成されてもよい。また、これ以降、特に断らない限り、YUV信号、4:2:0フォーマットの符号化ブロックの輝度成分に対する符号化モードを指すものとして説明を行う。
符号化ブロックBnは、図9に示されるように、ブロック分割部3によって、予測処理単位を表す1つまたは複数の予測ブロックに分割される。これ以降、符号化ブロックBnに属する予測ブロックを、Pi n(iは、第n階層における予測ブロック番号)と表記する。ここで、図9には、P0 0およびP1 0の例が示されている。
符号化ブロックBn内の予測ブロックの分割がどのようになされているかは、符号化モードm(Bn)の中に情報として含まれる。また、予測ブロックPi nは、全て符号化モードm(Bn)に従って予測処理が行われるが、予測ブロックPi n毎に、個別の予測パラメータ(イントラ予測パラメータまたはインター予測パラメータ)を選択することができる。
符号化制御部1は、最大符号化ブロックに対して、例えば、図10に示されるようなブロック分割状態を生成して、符号化ブロックを特定する。図10(a)において、点線で囲まれた矩形が各符号化ブロックを表し、各符号化ブロック内にある斜線で塗られたブロックが各予測ブロックの分割状態を表している。
また、図10(b)は、図10(a)の例について、階層分割によって符号化モードm(Bn)が割り当てられる状況を、4分木グラフで示したものである。図10(b)の□(四角)で囲まれているノードは、符号化モードm(Bn)が割り当てられたノード(符号化ブロック)である。この4分木グラフの情報は、符号化モードm(Bn)とともに符号化制御部1から可変長符号化部14に出力されて、ビットストリームに多重化される。
切り換えスイッチ4は、符号化制御部1により決定された符号化モードm(Bn)がイントラ符号化モードである場合(m(Bn)∈INTRAの場合)には、ブロック分割部3から出力された符号化ブロックBnを、イントラ予測部5に出力する。
一方、切り換えスイッチ4は、符号化制御部1により決定された符号化モードm(Bn)がインター符号化モードである場合(m(Bn)∈INTERの場合)には、ブロック分割部3から出力された符号化ブロックBnを、動き補償予測部6に出力する。
図5に戻って、イントラ予測部5は、符号化制御部1により決定された符号化モードm(Bn)がイントラ符号化モードである場合(m(Bn)∈INTRAの場合)(ステップST3においてYes)には、イントラ予測処理を実施して、イントラ予測画像PINTRAi nを生成する(ステップST4)。
具体的には、イントラ予測部5は、切り換えスイッチ4から符号化ブロックBnを受けると、イントラ予測用メモリ11に格納されている局所復号画像を参照しながら、符号化制御部1により決定されたイントラ予測パラメータを用いて、その符号化ブロックBn内の各予測ブロックPi nに対するイントラ予測処理を実施して、イントラ予測画像PINTRAi nを生成する。
なお、動画像復号装置がイントラ予測画像PINTRAi nと全く同じイントラ予測画像を生成する必要があるので、イントラ予測画像PINTRAi nの生成に用いられたイントラ予測パラメータは、符号化制御部1から可変長符号化部14に出力されて、ビットストリームに多重化される。また、イントラ予測部5の処理内容の詳細は、後述する。
一方、動き補償予測部6は、符号化制御部1により決定された符号化モードm(Bn)がインター符号化モードである場合(m(Bn)∈INTERの場合)(ステップST3においてNo)には、インター予測処理を実施して、インター予測画像PINTERi nを生成する(ステップST5)。
具体的には、動き補償予測部6は、切り換えスイッチ4から符号化ブロックBnを受けると、その符号化ブロックBn内の各予測ブロックPi nと動き補償予測フレームメモリ13に格納されているフィルタ処理後の局所復号画像とを比較して、動きベクトルを探索する。また、動き補償予測部6は、その動きベクトルと符号化制御部1により決定されたインター予測パラメータとを用いて、その符号化ブロックBn内の各予測ブロックPi nに対するインター予測処理を実施して、インター予測画像PINTERi nを生成する。
なお、動画像復号装置がインター予測画像PINTERi nと全く同じインター予測画像を生成する必要があるので、インター予測画像PINTERi nの生成に用いられたインター予測パラメータは、符号化制御部1から可変長符号化部14に出力されて、ビットストリームに多重化される。また、動き補償予測部6により探索された動きベクトルも、可変長符号化部14に出力されて、ビットストリームに多重化される。
続いて、減算部7は、ブロック分割部3から符号化ブロックBnを受けると、その符号化ブロックBn内の予測ブロックPi nから、イントラ予測部5により生成されたイントラ予測画像PINTRAi n、および動き補償予測部6により生成されたインター予測画像PINTERi nの何れか一方を減算して、その減算結果である差分画像を示す予測差分信号ei nを、変換・量子化部8に出力する(ステップST6)。
変換・量子化部8は、減算部7から予測差分信号ei nを受けると、符号化制御部1により決定された予測差分符号化パラメータに含まれる直交変換ブロック分割情報を参照して、その予測差分信号ei nに対する直交変換処理を直交変換ブロック単位に実施して、変換係数を算出する。
なお、直交変換処理として、例えば離散コサイン変換(DCT)や離散サイン変換(DST)、あらかじめ特定の学習系列に対して基底設計がなされているKL変換等の直交変換処理が挙げられる。
また、変換・量子化部8は、その予測差分符号化パラメータに含まれる量子化パラメータを参照して、その直交変換ブロック単位の変換係数を量子化し、量子化後の変換係数である圧縮データを逆量子化・逆変換部9および可変長符号化部14に出力する(ステップST7)。このとき、上記量子化パラメータから算出される量子化ステップサイズを変換係数毎にスケーリングする量子化マトリクスを用いて、変換係数の量子化処理を実施するようにしてもよい。
逆量子化・逆変換部9は、変換・量子化部8から圧縮データを受けると、符号化制御部1により決定された予測差分符号化パラメータに含まれる量子化パラメータおよび直交変換ブロック分割情報を参照して、直交変換ブロック単位にその圧縮データを逆量子化する。
また、逆量子化・逆変換部9は、直交変換ブロック単位に、逆量子化後の圧縮データである変換係数に対する逆直交変換処理(例えば、逆DCT、逆DST、逆KL変換等)を実施して、減算部7から出力された予測差分信号ei nに相当する局所復号予測差分信号を算出し、加算部10に出力する(ステップST8)。
なお、変換・量子化部8が、量子化処理に量子化マトリクスを用いている場合には、逆量子化処理時においても、その量子化マトリクスを参照して、対応した逆量子化処理を実施する。
続いて、加算部10は、逆量子化・逆変換部9から局所復号予測差分信号を受けると、その局所復号予測差分信号と、イントラ予測部5により生成されたイントラ予測画像PINTRAi nおよび動き補償予測部6により生成されたインター予測画像PINTERi nの何れか一方とを加算することで、局所復号画像を算出する(ステップST9)。
また、加算部10は、その局所復号画像をループフィルタ部12に出力するとともに、その局所復号画像をイントラ予測用メモリ11に格納する。この局所復号画像が、以降のイントラ予測処理の際に用いられる符号化済みの画像信号になる。
次に、ループフィルタ部12は、加算部10から局所復号画像を受けると、その局所復号画像に対して、所定のフィルタ処理を実施し、フィルタ処理後の局所復号画像を、動き補償予測フレームメモリ13に格納する(ステップST10)。ループフィルタ部12の構成および機能は、上述したとおりである。
ここで、ステップST3〜ST9の処理は、階層的に分割された全ての符号化ブロックBnに対する処理が完了するまで繰り返し実施され、全ての符号化ブロックBnに対する処理が完了すると、ステップST13の処理に移行する(ステップST11、ST12)。
可変長符号化部14は、変換・量子化部8から出力された圧縮データ、符号化制御部1から出力された最大符号化ブロック内のブロック分割情報(図10(b)を例とする4分木情報)、符号化モードm(Bn)、予測差分符号化パラメータ、符号化制御部1から出力されたイントラ予測パラメータ(符号化モードがイントラ符号化モードである場合)またはインター予測パラメータ(符号化モードがインター符号化モードである場合)、および動き補償予測部6から出力された動きベクトル(符号化モードがインター符号化モードである場合)を可変長符号化して、それらの符号化結果を示す符号化データを生成する(ステップST13)。
また、可変長符号化部14は、上述したように、符号化ビットストリームのヘッダ情報として、ビデオパラメータセット、シーケンスレベルヘッダ、ピクチャレベルヘッダ、適応パラメータセットを符号化し、ピクチャデータとともに符号化ビットストリームを生成する。
ここで、適応パラメータセットは、符号化ビットストリームに多重化されている複数の適応パラメータセットを識別するためのインデックス(aps_id)を有する。また、各適応パラメータセットは、デブロッキングフィルタ処理、画素適応オフセット処理および適応フィルタ処理に関わるそれぞれのフィルタパラメータと、量子化マトリクスパラメータとがそれぞれ存在しているか否かを示すフラグ(present_flag)を有しており、各存在フラグが「有効」の場合には、それに対応するパラメータを有している。
したがって、適応パラメータセットは、各パラメータがあるか否かを自由に設定することができる。また、各スライスは、スライスレベルヘッダ内に、スライスの復号処理時に参照する適応パラメータセットのインデックス(aps_id)を少なくとも1つ以上有しており、対応する適応パラメータセットを参照して、量子化処理・逆量子化処理やループフィルタ処理を実施する。
また、適応パラメータセットを符号化して符号化ビットストリームに多重化する際、同じインデックス(aps_id)を持つ適応パラメータセットが既に符号化ビットストリームに存在する場合には、そのインデックスを持つ適応パラメータセットが、上記の符号化対象の適応パラメータセットに置き換えられる。
したがって、新しい適応パラメータセットを符号化する際、既に符号化された適応パラメータセットが不要の場合には、その不要な適応パラメータセットのインデックスで符号化することにより、適応パラメータセットの上書き更新が可能になり、保存しなければならない適応パラメータセットの数を増やさずに済むので、使用するメモリの容量を抑えることができる。
次に、図11および図12を参照しながら、イントラ予測部5の処理内容を詳細に説明する。図11は、符号化ブロックBn内の各予測ブロックPi nが選択可能なイントラ予測パラメータであるイントラ予測モードの一例を示している。なお、NIはイントラ予測モード数を表している。
図11では、イントラ予測モードのインデックス値と、そのイントラ予測モードが示す予測方向ベクトルとを示しており、図11の例では、選択可能なイントラ予測モードの個数が増えるに従って、予測方向ベクトル同士の相対角度が小さくなるように設計されている。
また、イントラ予測部5は、上述したように、予測ブロックPi nのイントラ予測パラメータを参照して、その予測ブロックPi nに対するイントラ予測処理を実施し、イントラ予測画像PINTRAi nを生成するが、ここでは、輝度信号における予測ブロックPi nのイントラ予測信号を生成するイントラ処理について説明する。
まず、予測ブロックPi nのサイズをli n×mi n画素とする。ここで、図12は、li n=mi n=4の場合の予測ブロックPi n内の画素の予測値を生成する際に用いる画素の一例を示す説明図である。
図12では、予測ブロックPi nの上の符号化済みの画素(2×li n+1)個と、左の符号化済みの画素(2×mi n)個とを予測に用いる画素としているが、予測に用いる画素は、図12に示される画素より多くても少なくてもよい。また、図12では、予測ブロックPi nの近傍の1行または1列分の画素を予測に用いているが、2行もしくは2列、または、それ以上の画素を予測に用いてもよい。
予測ブロックPi nに対するイントラ予測モードのインデックス値が0(平面(Planar)予測)である場合には、予測ブロックPi nの上に隣接する符号化済み画素と予測ブロックPi nの左に隣接する符号化済み画素とを用いて、これらの画素と予測ブロックPi n内の予測対象画素との距離に応じて、内挿した値を予測値として予測画像を生成する。
また、予測ブロックPi nに対するイントラ予測モードのインデックス値が2(平均値(DC)予測)である場合には、予測ブロックPi nの上に隣接する符号化済み画素と予測ブロックPi nの左に隣接する符号化済み画素との平均値を、予測ブロックPi n内の画素の予測値として予測画像を生成する。
また、イントラ予測モードのインデックス値が0(平面予測)または2(平均値予測)以外である場合には、インデックス値が示す予測方向ベクトルυp=(dx,dy)に基づいて、予測ブロックPi n内の画素の予測値を生成する。
図12に示されるように、予測ブロックPi nの左上画素を原点として、予測ブロックPi n内の相対座標を(x,y)と設定すると、予測に用いる参照画素の位置は、下記のLと隣接画素の交点になる。
参照画素が整数画素位置にある場合には、その整数画素を予測対象画素の予測値とし、参照画素が整数画素位置にない場合には、参照画素に隣接する整数画素から生成される補間画素を予測値とする。
図12の例では、参照画素は整数画素位置にないので、参照画素に隣接する2画素から内挿したものを予測値とする。なお、隣接する2画素のみではなく、隣接する2画素以上の画素から補間画素を生成して予測値としてもよい。
ここで、補間処理に用いる画素を多くすることで、補間画素の補間精度を向上させることができるものの、補間処理に要する演算の複雑度が増加することから、演算負荷が大きくても高い符号化性能を要求する動画像符号化装置の場合には、より多くの画素から補間画素を生成するようにした方がよい。
以上に述べた処理によって、予測ブロックPi n内の輝度信号の全ての画素に対する予測画素を生成して、イントラ予測画像PINTRAi nを出力する。また、イントラ予測画像PINTRAi nの生成に用いられたイントラ予測パラメータ(イントラ予測モード)は、ビットストリームに多重化するために、可変長符号化部14に出力される。
なお、MPEG−4 AVC/H.264における8×8画素のブロックのイントラ予測時に、参照画像に対して施される平滑化処理と同様に、イントラ予測部5において、予測ブロックPi nの中間予測画像を生成する際の参照画素を、予測ブロックPi nに隣接する符号化済み画素を平滑化処理した画素とするように構成した場合であっても、上述の例と同様の中間予測画像に対するフィルタ処理を行うことができる。
また、予測ブロックPi nの色差信号に対しても、輝度信号と同様の手順で、イントラ予測パラメータ(イントラ予測モード)に基づくイントラ予測処理を実施し、イントラ予測画像の生成に用いられたイントラ予測パラメータを可変長符号化部14に出力する。
ここで、色差信号で選択可能なイントラ予測パラメータ(イントラ予測モード)は、輝度信号と異なっていてもよい。例えば、YUV信号4:2:0フォーマットの場合には、色差信号(U、V信号)は、輝度信号(Y信号)に対して、解像度を水平方向および垂直方向ともに1/2に縮小した信号であり、輝度信号に比べて画像信号の複雑性が低く予測が容易である。そのため、選択可能なイントラ予測パラメータは、輝度信号よりも少ない数として、イントラ予測パラメータを符号化するのに要する符号量の削減や、予測処理の低演算化を図ってもよい。
次に、図13のフローチャートを参照しながら、この発明の実施の形態1に係る動画像復号装置200の処理内容(動画像復号方法)について説明する。
まず、可変長復号部21は、図1の動画像符号化装置100により生成された符号化ビットストリームが入力されると、そのビットストリームに対する可変長復号処理を実施する(ステップST21)。
具体的には、可変長復号部21は、フレームサイズの情報等の1フレーム以上のピクチャから構成されるシーケンス単位のヘッダ情報(シーケンスレベルヘッダ)やピクチャ単位のヘッダ情報(ピクチャレベルヘッダ)、および適応パラメータセットとして符号化されたループフィルタ部28で使用するフィルタパラメータや量子化マトリクスパラメータを復号する。
続いて、可変長復号部21は、図1の符号化制御部1により決定された最大符号化ブロックサイズおよび分割階層数の上限を、動画像符号化装置と同様の手順で決定する(ステップST22)。
例えば、最大符号化ブロックサイズや分割階層数の上限が、映像信号の解像度に応じて決められた場合には、復号したフレームサイズ情報に基づいて、動画像符号化装置と同様の手順で、最大符号化ブロックサイズを決定する。
また、最大符号化ブロックサイズおよび分割階層数の上限が、動画像符号化装置側でシーケンスレベルヘッダ等に多重化されている場合には、上記ヘッダから復号した値を用いる。これ以降、動画像復号装置では、上記最大符号化ブロックサイズを最大復号ブロックサイズと称し、最大符号化ブロックを最大復号ブロックと称する。
次に、可変長復号部21は、決定された最大復号ブロック単位に、図10で示されるような最大復号ブロックの分割状態を復号する。また、可変長復号部21は、復号された分割状態に基づいて、階層的に復号ブロック(図1の動画像符号化装置100の「符号化ブロック」に相当するブロック)を特定する(ステップST23)。
続いて、可変長復号部21は、復号ブロックに割り当てられている符号化モードを復号する。また、可変長復号部21は、復号した符号化モードに含まれる情報に基づいて、復号ブロックを、さらに1つまたは複数の予測処理単位である予測ブロックに分割し、予測ブロック単位に割り当てられている予測パラメータを復号する(ステップST24)。
すなわち、可変長復号部21は、復号ブロックに割り当てられている符号化モードがイントラ符号化モードである場合には、復号ブロックに含まれており、予測処理単位となる1つ以上の予測ブロック毎にイントラ予測パラメータを復号する。
一方、可変長復号部21は、復号ブロックに割り当てられている符号化モードがインター符号化モードである場合には、復号ブロックに含まれており、予測処理単位となる1つ以上の予測ブロック毎にインター予測パラメータおよび動きベクトルを復号する(ステップST24)。
さらに、可変長復号部21は、予測差分符号化パラメータに含まれる直交変換ブロック分割情報に基づいて、直交変換ブロック毎に圧縮データ(変換・量子化後の変換係数)を復号する(ステップST24)。
ここで、可変長復号部21は、入力ビットストリームに対する可変長復号処理中にエラーを検出した場合には、可変長復号処理を正常に再開できる同期ポイントまでビットストリームを読み飛ばす処理を行う。図7に示されたGOP構造で符号化されたビットストリームにおいて、B7ピクチャの符号化データの可変長復号処理中にエラーを検出した場合を例に挙げて説明する。
ビットストリームが算術符号化されているような場合には、正常に再開できる同期ポイントは、スライスの先頭等になるので、次のスライスの先頭までビットストリームを読み飛ばす。図7の例において、1ピクチャの符号化データが1スライスに含まれるとすると、次のスライスはB8ピクチャになるので、B8ピクチャから復号処理を再開できることになる。
この場合、B7ピクチャは正常に復号されなかったので、コンシールメント処理を実施して、欠損したデータに相当する画素の補填処理を行う必要がある。そこで、コンシールメント処理が必要なピクチャの画素位置を、エラーコンシールメント処理部30に通知する。
エラーコンシールメント処理部30は、可変長復号部からエラー検出の通知とコンシールメント処理が必要なピクチャの画素位置とを受け取ると、指定された位置の画素の補填処理を行う。図7に示されたGOP構造で符号化されたビットストリームにおいて、B7ピクチャ(ボトムフィールド)の符号化データの可変長復号処理中にエラーを検出した場合を例に挙げて説明する。
まず、表示順でB7ピクチャに隣接するB4ピクチャ(トップフィールド)およびB6ピクチャ(トップフィールド)は、すでに正常に復号されているので、これらのピクチャを使ってコンシールメント処理を行う。
また、正常に復号されたB4ピクチャやB6ピクチャの動きベクトルの大きさからB7ピクチャの動きの大きさを推定し、B7ピクチャの動きが大きいと推定された場合には、表示順で近い位置あるB6ピクチャやB4ピクチャを使って、欠損したデータに相当する画素の補填処理を行う。
これに対して、B7ピクチャの動きが小さいと推定された場合には、B7ピクチャと同じボトムフィールドピクチャであるB4ピクチャを使って、画素の補填処理を行う。なお、図8の例では、B7ピクチャは、参照ピクチャとして以降のピクチャの動き補償予測処理に用いられるので、コンシールメント処理を行ったピクチャであることを示すエラーピクチャ通知とともに、動き補償予測フレームメモリに格納される。
ここで、切り換えスイッチ23は、可変長復号部21により可変長復号された符号化モードm(Bn)がイントラ符号化モードである場合(m(Bn)∈INTRAの場合)には、可変長復号部21により可変長復号された予測ブロック単位のイントラ予測パラメータを、イントラ予測部24に出力する。
一方、切り換えスイッチ23は、可変長復号部21により可変長復号された符号化モードm(Bn)がインター符号化モードである場合(m(Bn)∈INTERの場合)には、可変長復号部21により可変長復号された予測ブロック単位のインター予測パラメータおよび動きベクトルを、動き補償部25に出力する。
次に、イントラ予測部24は、可変長復号部21により可変長復号された符号化モードm(Bn)がイントラ符号化モードである場合(m(Bn)∈INTRAの場合)(ステップST25においてYes)には、イントラ予測処理を実施して、イントラ予測画像PINTRAi nを生成する(ステップST26)。
具体的には、イントラ予測部24は、切り換えスイッチ23から出力された予測ブロック単位のイントラ予測パラメータを受け取って、図1のイントラ予測部5と同様の手順で、イントラ予測用メモリ27に格納されている復号画像を参照しながら、上記イントラ予測パラメータを用いた復号ブロックBn内の各予測ブロックPi nに対するイントラ予測処理を実施して、イントラ予測画像PINTRAi nを生成する。
一方、動き補償部25は、可変長復号部21により可変長復号された符号化モードm(Bn)がインター符号化モードである場合(m(Bn)∈INTERの場合)(ステップST25において、No)には、インター予測処理を実施して、インター予測画像PINTERi nを生成する(ステップST27)。
具体的には、動き補償部25は、切り換えスイッチ23から出力された予測ブロック単位の動きベクトルとインター予測パラメータを受け取って、動き補償予測フレームメモリ29に格納されているフィルタ処理後の復号画像を参照しながら、その動きベクトルとインター予測パラメータとを用いた復号ブロックBn内の各予測ブロックPi nに対するインター予測処理を実施して、インター予測画像PINTERi nを生成する。
なお、参照に使う画像がコンシールメント処理を行ったピクチャである場合には、インター予測画像が正しく生成されないので、現復号中のピクチャも正しく復号することができない。したがって、符号化データでエラーを検出したときと同様に、コンシールメント処理部にて現ピクチャのコンシールメント処理を行う。
また、逆量子化・逆変換部22は、可変長復号部21から圧縮データおよび予測差分符号化パラメータを受けると、図1の逆量子化・逆変換部9と同様の手順で、その予測差分符号化パラメータに含まれる量子化パラメータおよび直交変換ブロック分割情報を参照して、直交変換ブロック単位にその圧縮データを逆量子化する。
ここで、可変長復号部21により可変長復号された各ヘッダ情報を参照し、各ヘッダ情報が、当該スライスで量子化マトリクスを用いて、逆量子化処理を実施することを示している場合には、量子化マトリクスを用いて逆量子化処理を行う。
このとき、可変長復号部21により可変長復号された各ヘッダ情報を参照して、各直交変換サイズで色信号や符号化モード(イントラ符号化かインター符号化か)毎に使用する量子化マトリクスを特定する。具体的には、スライスレベルヘッダから特定される当該スライスで参照する適応パラメータセットの量子化マトリクスを、当該スライスで使用する量子化マトリクスに設定する。
続いて、逆量子化・逆変換部22は、直交変換ブロック単位に逆量子化後の圧縮データである変換係数に対する逆直交変換処理を実施して、図1の逆量子化・逆変換部9から出力された局所復号予測差分信号と同一の復号予測差分信号を算出する(ステップST28)。
次に、加算部26は、逆量子化・逆変換部22により算出された復号予測差分信号と、イントラ予測部24により生成されたイントラ予測画像PINTRAi nおよび動き補償部25により生成されたインター予測画像PINTERi nの何れか一方とを加算して復号画像を算出する。また、加算部26は、その復号画像をループフィルタ部28に出力するとともに、その復号画像をイントラ予測用メモリ27に格納する(ステップST29)。この復号画像が、以降のイントラ予測処理の際に用いられる復号済みの画像信号になる。
続いて、ループフィルタ部28は、全ての復号ブロックBnに対するステップST23〜ST29の処理が完了すると(ステップST30)、加算部26から出力された復号画像に対して、所定のフィルタ処理を実施し、フィルタ処理後の復号画像を、動き補償予測フレームメモリ29に格納する(ステップST31)。ループフィルタ部28の構成および機能は、上述したとおりである。
このように、符号化制御部1は、ボトムフィールドピクチャを予測する場合には、時間的に近いトップフィールドピクチャを参照して予測するように構成されているが、トップフィールドピクチャを予測する場合には、トップフィールドピクチャのみを参照して、GOP構造を構成して符号化するので、符号化効率の低減を抑えつつ、エラーの伝播を抑えて符号化することができる。
以上のように、実施の形態1によれば、動き補償予測部は、トップフィールドピクチャに対して、符号化済みのトップフィールドピクチャのみを参照ピクチャとして予測符号化を行い、ピクチャの動きが所定値よりも大きい場合には、ボトムフィールドピクチャに対して、符号化済みで隣接する1つのトップフィールドピクチャと符号化済みのボトムフィールドピクチャとを参照ピクチャとして予測符号化を行い、ピクチャの動きが所定値よりも小さい場合には、ボトムフィールドピクチャに対して、符号化済みのボトムフィールドピクチャのみを参照ピクチャとして予測符号化を行う。
そのため、インタレース信号を時間階層符号化する際に、インタレース信号のフィールドピクチャにエラーが発生した場合であっても、符号化効率の低下を抑えることができる。すなわち、エラー復帰やエラーコンシールメントに効果的な映像符号化および映像復号化装置を得ることができる。
そのため、インタレース信号を時間階層符号化する際に、インタレース信号のフィールドピクチャにエラーが発生した場合であっても、符号化効率の低下を抑えることができる。すなわち、エラー復帰やエラーコンシールメントに効果的な映像符号化および映像復号化装置を得ることができる。
1 符号化制御部(符号化制御手段)、2 スライス分割部(スライス分割手段)、3 ブロック分割部(ブロック分割手段)、4 切り換えスイッチ、5 イントラ予測部(予測手段)、6 動き補償予測部(予測手段)、7 減算部(差分画像生成手段)、8 変換・量子化部(画像圧縮手段)、9 逆量子化・逆変換部(局所復号画像生成手段)、10 加算部(局所復号画像生成手段)、11 イントラ予測用メモリ(予測手段)、12 ループフィルタ部(フィルタリング手段)、13 動き補償予測フレームメモリ(予測手段)、14 可変長符号化部(可変長符号化手段)、21 可変長復号部(可変長復号手段)、22 逆量子化・逆変換部(差分画像生成手段)、23 切り換えスイッチ、24 イントラ予測部(予測手段)、25 動き補償部(予測手段)、26 加算部(復号画像生成手段)、27 イントラ予測用メモリ(予測手段)、28 ループフィルタ部(フィルタリング手段)、29 動き補償予測フレームメモリ(予測手段)、30 エラーコンシールメント処理部(エラーコンシールメント手段)、100 動画像符号化装置、121 デブロッキングフィルタ処理、122 画素適応オフセット処理、123 適応フィルタ処理、200 動画像復号装置、281 デブロッキングフィルタ処理、282 画素適応オフセット処理、283 適応フィルタ処理。
Claims (4)
- 符号化制御部の制御下で、シーケンス内の複数のピクチャを階層分けして符号化する際に、各階層のピクチャを、符号化対象のピクチャ内の符号化済み画素値のみを参照して符号化するか、または同じ階層およびそれ以下の階層に属する符号化済みのピクチャのみを参照して予測符号化する動き補償予測部を備えた動画像符号化装置であって、
前記シーケンス内の各ピクチャは、インタレース信号の各フィールド画像であり、
前記動き補償予測部は、
トップフィールドピクチャに対して、符号化済みのトップフィールドピクチャのみを参照ピクチャとして予測符号化を行い、
前記ピクチャの動きが所定値よりも大きい場合には、ボトムフィールドピクチャに対して、符号化済みで隣接する1つのトップフィールドピクチャと符号化済みのボトムフィールドピクチャとを参照ピクチャとして予測符号化を行い、
前記ピクチャの動きが所定値よりも小さい場合には、ボトムフィールドピクチャに対して、符号化済みのボトムフィールドピクチャのみを参照ピクチャとして予測符号化を行う
動画像符号化装置。 - ビットストリームから、各ヘッダ情報または各復号ブロックに係る圧縮データを可変長復号する可変長復号部であって、前記各ヘッダ情報の復号中または前記各復号ブロックの復号中にエラーを検出した場合に、復号処理を正常に再開できる同期ポイントまでビットストリームを読み飛ばす処理を行う可変長復号部と、
前記可変長復号部でエラーが検出された場合に、読み飛ばしたデータに相当する正常に復号されなかったピクチャに対してコンシールメント処理を行うエラーコンシールメント処理部と、
を備えた動画像復号装置であって、
前記エラーコンシールメント処理部は、
正常に復号されたピクチャの動きベクトルの大きさから、前記正常に復号されなかったピクチャの動きの大きさを推定し、
前記ピクチャの動きが所定値よりも大きい場合には、隣接するトップフィールドピクチャおよびボトムフィールドピクチャを用いてコンシールメント処理を実施し、
前記ピクチャの動きが所定値よりも小さい場合には、隣接するボトムフィールドピクチャのみを用いてコンシールメント処理を実施する
動画像復号装置。 - 符号化制御部の制御下で、シーケンス内の複数のピクチャを階層分けして符号化する際に、各階層のピクチャを、符号化対象のピクチャ内の符号化済み画素値のみを参照して符号化するか、または同じ階層およびそれ以下の階層に属する符号化済みのピクチャのみを参照して予測符号化する動き補償予測部を備えた動画像符号化装置によって実行される動画像符号化方法であって、
前記シーケンス内の各ピクチャは、インタレース信号の各フィールド画像であり、
トップフィールドピクチャに対して、符号化済みのトップフィールドピクチャのみを参照ピクチャとして予測符号化を行うステップと、
前記ピクチャの動きが所定値よりも大きい場合には、ボトムフィールドピクチャに対して、符号化済みで隣接する1つのトップフィールドピクチャと符号化済みのボトムフィールドピクチャとを参照ピクチャとして予測符号化を行うステップと、
前記ピクチャの動きが所定値よりも小さい場合には、ボトムフィールドピクチャに対して、符号化済みのボトムフィールドピクチャのみを参照ピクチャとして予測符号化を行うステップと、
を有する動画像符号化方法。 - ビットストリームから、各ヘッダ情報または各復号ブロックに係る圧縮データを可変長復号する可変長復号部であって、前記各ヘッダ情報の復号中または前記各復号ブロックの復号中にエラーを検出した場合に、復号処理を正常に再開できる同期ポイントまでビットストリームを読み飛ばす処理を行う可変長復号部と、
前記可変長復号部でエラーが検出された場合に、読み飛ばしたデータに相当する正常に復号されなかったピクチャに対してコンシールメント処理を行うエラーコンシールメント処理部と、
を備えた動画像復号装置によって実行される動画像復号方法であって、
正常に復号されたピクチャの動きベクトルの大きさから、前記正常に復号されなかったピクチャの動きの大きさを推定するステップと、
前記ピクチャの動きが所定値よりも大きい場合には、隣接するトップフィールドピクチャおよびボトムフィールドピクチャを用いてコンシールメント処理を実施するステップと、
前記ピクチャの動きが所定値よりも小さい場合には、隣接するボトムフィールドピクチャのみを用いてコンシールメント処理を実施するステップと、
を有する動画像復号方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013001139A JP2014135552A (ja) | 2013-01-08 | 2013-01-08 | 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013001139A JP2014135552A (ja) | 2013-01-08 | 2013-01-08 | 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014135552A true JP2014135552A (ja) | 2014-07-24 |
Family
ID=51413563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013001139A Pending JP2014135552A (ja) | 2013-01-08 | 2013-01-08 | 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014135552A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018150934A1 (ja) * | 2017-02-20 | 2018-08-23 | ソニー株式会社 | 画像処理装置および方法 |
-
2013
- 2013-01-08 JP JP2013001139A patent/JP2014135552A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018150934A1 (ja) * | 2017-02-20 | 2018-08-23 | ソニー株式会社 | 画像処理装置および方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6580185B2 (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 | |
JP6261660B2 (ja) | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 | |
JP6226863B2 (ja) | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 | |
JP5815795B2 (ja) | 画像復号装置及び画像復号方法 | |
JPWO2014199634A1 (ja) | 画像符号化装置及び画像符号化方法 | |
JPWO2014163200A1 (ja) | カラー画像符号化装置、カラー画像復号装置、カラー画像符号化方法及びカラー画像復号方法 | |
WO2014049981A1 (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 | |
JP2014090326A (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 | |
JP2014090327A (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 | |
WO2014049982A1 (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 | |
WO2013108882A1 (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 | |
JP2014135552A (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法および動画像復号方法 | |
JP2013098711A (ja) | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 |