JP5381571B2 - 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法 - Google Patents

画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法 Download PDF

Info

Publication number
JP5381571B2
JP5381571B2 JP2009225520A JP2009225520A JP5381571B2 JP 5381571 B2 JP5381571 B2 JP 5381571B2 JP 2009225520 A JP2009225520 A JP 2009225520A JP 2009225520 A JP2009225520 A JP 2009225520A JP 5381571 B2 JP5381571 B2 JP 5381571B2
Authority
JP
Japan
Prior art keywords
prediction
base layer
image
circuit
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009225520A
Other languages
English (en)
Other versions
JP2011077721A (ja
Inventor
基晴 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2009225520A priority Critical patent/JP5381571B2/ja
Publication of JP2011077721A publication Critical patent/JP2011077721A/ja
Application granted granted Critical
Publication of JP5381571B2 publication Critical patent/JP5381571B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像信号を符号化する技術と、符号化されている画像信号を復号する技術とに関する。
近年、デジタル化された画像・音声信号を高能率符号化して圧縮されたコンテンツを得て、それを記録媒体に記録する装置や、衛星や地上波等の放送波やネットワークを介して配信するサービスが実用化されている。このようなサービスにおいては、膨大な情報量を持つ画像・音声信号を大量に放送・伝送する為に、大きな圧縮率を実現する高能率符号化が必要となっており、動画像の高能率符号化方式として国際規格であるMPEG2(Moving Picture Experts Group phase 2)、MPEG4(Moving Picture Experts Group phase 4)−ASP(Advanced Simple Profile)、及び、MPEG4−AVC(Advanced Video Coding)等の方式が用いられている。これらの符号化方式においては、隣接画素間(空間方向)の相関及び、隣接するフレーム間やフィールド間(時間方向)の相関に基づいて、画像信号は圧縮される。
これらの高能率符号化により圧縮された情報を様々なコンテンツサービスに用いる場合に、サービスを提供する機器の伝送・記録手段の伝送・記録速度となる符号化レートや、再生機器における復号処理速度で対応可能な画像サイズやフレーム周波数等について様々な制限がある。一つの圧縮情報を全てのサービスに共通に用いる為には、サービスで必要とされる条件に合わせた再符号化処理が必要となる。再符号化は復号処理と再度の符号化処理により構成されており、二重に符号化処理が施される為に符号化劣化が増大しコンテンツの品質が低下すると共に、複数のサービスの要求に同時に応えるために複数の符号化処理を同時に行う必要があり、膨大な量の処理を実行する手段が要求される。
これらの要求に応える為に、符号化対象の画像信号を基本階層情報と複数の拡張階層情報に分割して階層的に符号化を行う、スケーラブル符号化技術が考案されており、国際規格においてもMPEG2スケーラブルプロファイル、MPEG4−FGS(Fine Granularity Scalable)、MPEG4−SVC拡張(Scalable Video Coding)で、それぞれMPEG2、MPEG4及びMPEG4−AVCにおけるスケーラブル符号化方式が標準化されている。スケーラブル符号化方式を用いることで、サービスで要求される符号化レートや画像サイズ・フレーム周波数等に合わせて、伝送する階層の符号化情報を制御することが可能となり、再符号化処理を行うことなく、様々なコンテンツサービスにおいて供給できる符号化情報を提供できる。
MPEG4−SVC拡張におけるスケーラブル符号化では、空間周波数成分に対する階層的な符号化構造を用いる空間スケーラブル、時間周波数成分(フレーム周波数)に対する階層的な符号化構造を用いる時間スケーラブル、量子化の細かさに対する階層的な符号化構造を用いるSNRスケーラブルという、3つのスケーラブル処理が規定されており、画像情報を分離して符号化処理を行うために、非スケーラブル符号化のMPEG4−AVCで符号化された符号化ストリームと比較すると符号化効率が低下する。
階層符号化における符号化効率の低下を低減するための技術として、基本階層における画像情報と拡張階層における画像情報の相関性を強める処理を行い、それにより符号量を削減する手法が提案されている。特許文献1は、空間スケーラブル構造の階層符号化装置において、低解像度で符号化された階層の復号信号より高解像度で符号化する階層の画像信号の高周波成分を推定して推定信号と画像信号の差分情報を符号化することにより、高解像度で符号化する階層の符号量を低減させる手法を開示している。
特開2007−174634号公報
このように従来の画像符号化装置においては、スケーラブル符号化を実現した際に、階層間の相関を高めることで、符号化効率を向上させる試みが成されているが、各階層において最も品質(空間解像度、フレーム周波数、及びSNR等)が向上する復号画像を得るためには、拡張階層の符号化ストリームまでを全て復号する必要があり、非スケーラブルな符号化ストリームを復号する場合に比較して、符号量が増加する課題は解決できていない。
また、国際標準化等において策定されている符号化方式を上回る符号化効率を、より複雑な処理を用いて実現出来る符号化アルゴリズムを用いた場合に、既存のスケーラブル符号化では異なる符号化アルゴリズムに対する階層構造を構築することが出来ず、復号装置が処理可能な符号化ストリームしか生成できない。
更に、復号装置がバッテリ駆動であった場合の長時間再生を行う場合や、復号装置が画像情報の処理以外の負荷を有する場合に、復号装置の負荷を低減させるために復号処理を拡張階層までの復号から基本階層のみの復号に切り替えた場合に、解像度の低下や符号化品質の劣化を伴う課題がある。
そこで本発明は、高い復号処理機能を有する復号装置でも高い復号処理機能を有さない復号装置でも低負荷で復号が可能な高い圧縮効率を持つ符号化ストリームを圧縮効率が低下しないように生成する画像符号化装置と、それに対応する画像復号化装置とを提供することを目的とする。
上記課題を解決し上記目的を達成するために、本発明の画像符号化装置は、画像信号を取得する取得部と、前記取得部によって取得された前記画像信号に対して、単独で復号可能な基本階層の符号化を行う基本階層符号化部と、前記取得部によって取得された前記画像信号に対して、前記基本階層と合わせて復号することにより復号可能な拡張階層の符号化を行う拡張階層符号化部とを備え、前記基本階層符号化部は、空間方向の相関を用いる第1の画面内予測部と、時間方向の相関を用いる第1の動き補償予測部とを有し、前記拡張階層符号化部は、空間方向の相関を用い、前記第1の画面内予測部よりも複雑度が低い処理を行う第2の画面内予測部と、時間方向の相関を用い、前記第1の動き補償予測部よりも複雑度が低い処理を行う第2の動き補償予測部とを有し、前記第1の画面内予測部は、複数の2次元ブロックサイズにおける画面内予測モードより選択される予測情報を生成し、前記第2の画面内予測部は、前記第1の画面内予測部によって生成される第1の面内予測信号と予測モードを示す情報との少なくとも一方を取得し、単一の2次元ブロックサイズにおける画面内予測情報を生成して、第2の面内予測信号を生成し、前記第2の動き補償予測部は、前記第1の動き補償予測部によって生成される第1の動き補償予測信号と予測モードを示す情報との少なくとも一方を取得し、第2の動き予測信号を生成する。
前記第2の画面内予測部は、前記第1の面内予測信号との相関性の高い予測情報を検出し、前記第2の動き補償予測部は、前記第1の動き補償予測信号との相関性の高い予測信号を検出してもよい。
本発明の画像符号化装置は、画像信号を取得する取得部と、前記取得部によって取得された前記画像信号に対して、単独で復号可能な基本階層の符号化を行う基本階層符号化部と、前記取得部によって取得された前記画像信号に対して、前記基本階層と合わせて復号することにより復号可能な拡張階層の符号化を行う拡張階層符号化部とを有し、前記基本階層符号化部は、空間方向の相関を用いる画面内予測部と、時間方向の相関を用いる動き補償予測部と、前記画面内予測部又は前記動き補償予測部によって生成された予測画像を用いて生成された差分信号に対して、画面内で隣接する画像領域に対する差分信号を用いて差分信号予測画像を生成し、前記予測画像を用いて生成された差分信号より、前記差分信号予測画像を減算する差分信号相関除去部とを含み、前記拡張階層符号化部は、前記差分信号相関除去部によって得られた前記差分信号予測画像を符号化する。
本発明の画像復号化装置は、単独で復号可能な基本階層と、前記基本階層と合わせて復号することにより復号可能な拡張階層とを有する、符号化された階層符号化ストリームを取得する取得部と、前記基本階層の復号処理演算量を測定する演算処理量測定部と、本装置の外部条件である電力消費量、バッテリ残量、もしくは処理可能な演算量により設定される復号可能演算量と、前記演算処理量測定部によって測定された前記基本階層の復号処理演算量とに基づいて、前記階層符号化ストリームより抽出する階層を選択する復号階層選択部とを備え、前記復号階層選択部は、前記基本階層の復号処理演算量が前記復号可能演算量よりも大きくなる場合、基本階層と拡張階層とを抽出し、前記基本階層の復号処理演算量が前記復号可能演算量よりも大きくならない場合、基本階層のみを抽出する。
本発明の画像符号化方法は、画像信号を取得するステップと、取得した前記画像信号に対して、単独で復号可能な基本階層の符号化を行うステップと、取得した前記画像信号に対して、前記基本階層と合わせて復号することにより復号可能な拡張階層の符号化を行うステップとを含み、基本階層の符号化を行うステップは、空間方向の相関を用いる第1の画面内予測ステップと、時間方向の相関を用いる第1の動き補償予測ステップとを有し、拡張階層の符号化を行うステップは、空間方向の相関を用い、前記第1の画面内予測ステップよりも演算量の少ない処理を行う第2の画面内予測ステップと、時間方向の相関を用い、前記第1の動き補償予測ステップよりも演算量の少ない処理を行う第2の動き補償予測ステップとを有し、前記第1の画面内予測ステップでは、複数の2次元ブロックサイズにおける画面内予測モードより選択される予測情報を生成し、前記第2の画面内予測ステップでは、前記第1の画面内予測ステップによって生成される第1の面内予測信号と予測モードを示す情報との少なくとも一方を取得し、単一の2次元ブロックサイズにおける画面内予測情報を生成して、第2の面内予測信号を生成し、前記第2の動き補償予測ステップでは、前記第1の動き補償予測ステップによって生成される第1の動き補償予測信号と予測モードを示す情報との少なくとも一方を取得し、第2の動き予測信号を生成する。
前記第2の画面内予測ステップでは、前記第1の面内予測信号との相関性の高い予測情報を検出し、前記第2の動き補償予測ステップでは、前記第1の動き補償予測信号との相関性の高い予測信号を検出してもよい。
本発明の画像符号化方法は、画像信号を取得するステップと、取得した前記画像信号に対して、単独で復号可能な基本階層の符号化を行う基本階層符号化ステップと、取得した前記画像信号に対して、前記基本階層と合わせて復号することにより復号可能な拡張階層の符号化を行う拡張階層符号化ステップとを含み、前記基本階層符号化ステップは、空間方向の相関を用いる画面内予測ステップと、時間方向の相関を用いる動き補償予測ステップと、前記画面内予測ステップ又は前記動き補償予測ステップにおいて生成した予測画像を用いて生成した差分信号に対して、画面内で隣接する画像領域に対する差分信号を用いて差分信号予測画像を生成し、前記予測画像を用いて生成された差分信号より、前記差分信号予測画像を減算する差分信号相関除去ステップとを有し、前記拡張階層符号化ステップでは、前記差分信号相関除去ステップにおいて得た前記差分信号予測画像を符号化する。
本発明の画像復号化方法は、単独で復号可能な基本階層と、前記基本階層と合わせて復号することにより復号可能な拡張階層とを有する、符号化された階層符号化ストリームを取得するステップと、前記基本階層の復号処理演算量を測定するステップと、画像符号化装置の外部条件である電力消費量、バッテリ残量、もしくは処理可能な演算量により設定される復号可能演算量と、測定した前記基本階層の復号処理演算量とに基づいて、前記階層符号化ストリームより抽出する階層を選択するステップとを含み、階層を選択するステップでは、前記基本階層の復号処理演算量が前記復号可能演算量よりも大きくなる場合、基本階層と拡張階層とを抽出し、前記基本階層の復号処理演算量が前記復号可能演算量よりも大きくならない場合、基本階層のみを抽出する。
本発明は、高い復号処理機能を有する復号装置でも高い復号処理機能を有さない復号装置でも低負荷で復号が可能な高い圧縮効率を持つ符号化ストリームを圧縮効率が低下しないように生成する画像符号化装置と、それに対応する画像復号化装置とを提供することができる。
従来のスケーラブル符号化装置においては、復号側における符号化レート、解像度、フレーム周波数等の制約によっても再生可能な符号化データを基本階層として符号化し、制約から解放される場合に復号可能な符号化データを拡張階層として符号化を行う構造を有していたため、高負荷な復号が可能な復号装置において、すべての階層を受信・復号して高品質な復号画像を得ることになり、圧縮効率が低下していた。
しかしながら、本発明の符号化装置によれば、復号装置で制約を受けない条件における圧縮率の高い符号化を施した符号化データを基本階層とし、制約を有する場合にも復号可能な符号化データを拡張階層として基本階層との差分を符号化することにより、高負荷な復号が可能な復号装置においては基本階層のみを受信・復号することで、少ない符号化データで高品質な復号画像を得ることができると共に、基本階層と拡張階層を受信・復号することで、低負荷な復号処理で品質のよい復号画像を得ることが出来る、復号処理の複雑度に応じたスケーラブル符号化が可能となる。
また、拡張階層においては基本階層の画面内予測又は動き補償予測と相関性の高い予測画像を負荷の軽い予測処理の中から選択するため、拡張階層の圧縮効率が向上すると共に、差分情報が十分に伝送されなかった場合の再生画像の品質低下を防ぐことが出来る。
実施の形態1の画像符号化装置の構成図である。 実施の形態1の画像符号化装置における16×16固定イントラ予測回路の動作を説明するためのフローチャートである。 実施の形態1の画像符号化装置における1/2画素精度動きベクトル補正/補償回路の動作を説明するためのフローチャートである。 実施の形態1の画像復号化装置の構成図である。 実施の形態2の画像符号化装置の構成図である。 実施の形態2の画像復号化装置の構成図である。
以下に、本発明を実施するための形態について図面を参照して説明する。
(実施の形態1)
まず、実施の形態1の画像符号化装置及び画像復号化装置について説明する。実施の形態1において、基本階層の符号化処理についてはMPEG4−AVCに準拠した符号化処理を行い、拡張階層の符号化処理についてはMPEG4−AVCに対してMPEG2より複雑な処理である1/4画素単位の動き補償予測、4×4又は8×8ブロック単位のイントラ(画面内)予測、及びデブロックフィルタの使用を禁止している。
図1は、実施の形態1の画像符号化装置の構成図である。入力端子101より入力された動画像信号は、入力画像メモリ102に供給されて記憶される。入力画像メモリ102は、入力された動画像信号を符号化予測構造に応じて遅延させ、符号化処理を行うフレーム順に並べ替え、マクロブロック切出回路103に動画像信号を出力する。マクロブロック切出回路103は、入力画像メモリ102から入力された動画像信号を、符号化処理を実行する単位である16×16画素の2次元ブロック画像で構成されるマクロブロック単位で切り出し、減算器109及び減算器122に出力すると共に、4×4/8×8/16×16適応イントラ予測回路104と、1/4画素精度動きベクトル検出/補償回路106とに2次元ブロック画像を出力する。
4×4/8×8/16×16適応イントラ予測回路104は、マクロブロック切出回路103より入力された2次元ブロック画像と、基本階層イントラ予測メモリ105に格納されている符号化・復号済みの基本階層復号画像とを用いてイントラ予測を行う。イントラ予測は、復号済の同一フレーム上の2次元座標で上にあるマクロブロックと左にあるマクロブロックより、符号化ターゲットである2次元ブロック画像に対する複数のフレーム内予測画像を生成し、伝送する予測差分が少ない予測モードを確定し、イントラ予測画像を生成する処理である。
4×4/8×8/16×16適応イントラ予測回路104は、イントラ予測情報を4×4画素単位で生成して符号化する4×4予測モードと、イントラ予測情報を8×8画素単位で生成して符号化する8×8予測モードと、イントラ予測情報を16×16画素単位で生成して符号化する16×16予測モードとのいずれかを、16×16画素の2次元ブロック単位で選択し、選択したイントラ予測モードと生成したイントラ予測画像とを基本階層予測モード判定回路108に出力すると共に、16×16固定イントラ予測回路117に出力する。
1/4画素精度動きベクトル検出/補償回路106は、マクロブロック切出回路103より入力された2次元ブロック画像と、基本階層参照画像メモリ107に格納されている符号化・復号済みの基本階層復号画像とを用いて、1/4画素精度の動きベクトル検出及び動き補償予測を行う。動き補償予測は、復号済みの異なるフレームである複数の参照画像と、符号化ターゲットである2次元ブロックとから、動きベクトルを2次元パターンマッチング等の手法で検出し、伝送する予測差分の少ない動きベクトル量と、使用する参照フレームを確定し、動きベクトルと使用する参照フレームと動きベクトルのブロックサイズを示す動き補償モード情報とを用いて参照画像より動き補償を行って予測画像を生成する方法である。
1画素精度未満の精度の動きベクトルを検出する際には、周辺の参照画像を用いてフィルタリングを行うことにより、少数点精度の補間画像である予測画像を生成する。MPEG4−AVCにおいては、6タップのフィルタリングにより1/2画素精度の補間画像を生成し、更に平均値を生成する2タップフィルタリングにより1/4画素精度の補間画像を生成する。
1/4画素精度動きベクトル検出/補償回路106は、動き補償予測モード情報及び動きベクトル情報と生成した動き補償予測画像を基本階層予測モード判定回路108に出力すると共に、1/2画素精度動きベクトル補正/補償回路119に出力する。
基本階層予測モード判定回路108は、符号化ターゲットである画像フレームの予測モードを判定する際、フレーム面のみで完結する符号化を行うイントラスライスの場合と、動き補償を用いたフレーム間相関で符号化を行うインタースライスの場合で異なる動作を行う。イントラスライスの場合には、イントラ予測のみ適用可能であるため、基本階層予測モード判定回路108は、4×4/8×8/16×16適応イントラ予測回路104より入力されたイントラ予測モードを採用し、イントラ予測モードを基本階層エントロピー符号化回路116と、拡張階層予測モード判定回路121とに出力する。同時に基本階層予測モード判定回路108は、イントラ予測画像を、減算器109、加算器114及び、拡張階層予測モード判定回路121に出力する。
インタースライスの場合には、基本階層予測モード判定回路108は、4×4/8×8/16×16適応イントラ予測回路104より入力されたイントラ予測画像と、1/4画素精度動きベクトル検出/補償回路106より入力された動き補償予測画像とについて、マクロブロック切出回路103より入力されたマクロブロック単位の入力画像との間で差分を生成した場合のそれぞれ情報量を推定する評価値を生成し、より少ない情報量で符号化出来ると判断される予測モードの選択情報をイントラ予測を用いるか動き補償予測を用いるかを示す情報として生成し、採用する予測符号化処理に用いる。
基本階層予測モード判定回路108は、予測モードの選択情報と選択したイントラ予測モード又は、動き補償予測モード及び動きベクトル情報を、基本階層エントロピー符号化回路116に出力すると共に、拡張階層予測モード判定回路121に出力する。同時に基本階層予測モード判定回路108は、イントラ予測画像と動き補償予測画像の内、選択した予測モードの予測画像を減算器109、加算器114及び、拡張階層予測モード判定回路121に出力する。
減算器109は、マクロブロック切出回路103より入力された符号化ターゲットである2次元ブロック画像より、基本階層予測モード判定回路108より入力された予測画像を減算し、それにより基本階層の予測差分情報を生成し、基本階層DCT回路110に出力する。
基本階層DCT回路110は、予測差分情報を周波数成分に変換するために、直交変換の一種である2次元DCTを行う。MPEG4−AVCでは、DCTとして整数で演算可能な整数DCTが採用されており、周波数軸に変換する為の変換処理の中の周波数成分のレベルを正規化するための演算処理を後続する量子化処理と一緒に行うことで、DCT変換・IDCT変換での誤差が発生しないような手段が実現されている。基本階層DCT回路110は、正規化前の整数DCTを行った結果であるDCT係数情報を基本階層量子化回路111に出力する。
基本階層量子化回路111は、基本階層DCT回路110よりDCT係数情報が入力され、符号量制御回路130より入力される量子化処理の基準となる量子化パラメータを用いて、DCT係数毎に量子化処理を行い、量子化したDCT係数及び量子化パラメータを基本階層エントロピー符号化回路116、基本階層逆量子化回路112及び、減算器128に出力する。
基本階層逆量子化回路112は、基本階層量子化回路111より入力された量子化されたDCT係数と量子化パラメータより、逆量子化を実行し復号DCT係数を生成する。基本階層逆量子化回路112は、生成した復号DCT係数を基本階層IDCT回路113に出力する。
基本階層IDCT回路113は、基本階層逆量子化回路112より入力された復号DCT係数に対して整数DCTの逆変換となる整数IDCT処理を施し、基本階層の復号差分画像を生成する。基本階層IDCT回路113は、生成した基本階層の復号差分画像を加算器114に出力する。
加算器114は、基本階層予測モード判定回路108より入力された予測画像情報と、基本階層IDCT回路113より入力された基本階層の復号差分画像を加算し、それにより基本階層の復号画像信号を生成する。加算器114によって生成された復号画像信号は、基本階層イントラ予測メモリ105及びデブロックフィルタ回路115に出力される。
デブロックフィルタ回路115は、加算器114より入力された基本階層の復号画像信号に対して、隣接する2次元ブロックの復号画像との間のブロック境界に、量子化歪の発生条件に応じて歪を除去するための平滑フィルタリングを施す。歪を除去することにより、復号画像の品質と、動き補償予測の参照画像の品質を向上させることが可能となるが、演算の負荷が大きく、復号装置における処理量の最大50%程度をデブロックフィルタ処理が占める場合も存在する。デブロックフィルタ回路115は、平滑フィルタリングを施した復号画像信号を基本階層参照画像メモリ107に出力する。
基本階層イントラ予測メモリ105には加算器114より復号画像信号が入力され、基本階層参照画像メモリ107には、デブロックフィルタ回路115より平滑フィルタリングが施された復号画像信号が入力される。基本階層イントラ予測メモリ105には、復号画像信号が常に格納されるが、基本階層参照画像メモリ107には、復号画像信号が後続する動画像信号の動き補償予測の参照画像となる場合にのみ、参照画像として復号画像信号が格納される。
基本階層エントロピー符号化回路116は、基本階層量子化回路111より入力された量子化されたDCT係数と、基本階層予測モード判定回路108より入力された予測モード情報(予測モードが動き補償予測モードである場合、動きベクトル情報を含む)に対して、所定の構文構造に基づいてエントロピー符号化を施し、基本階層を構成する基本階層符号化ストリームを生成し、階層多重化回路131に出力する。また、基本階層エントロピー符号化回路116は、生成符号化ストリーム量を符号量制御回路130に出力する。
続いて、拡張階層符号化を説明する。実施の形態1の画像符号化装置においては、空間解像度は同一である。
16×16固定イントラ予測回路117は、4×4/8×8/16×16適応イントラ予測回路104より基本階層における同一マクロブロックのイントラ予測画像とイントラ予測モード情報が入力されると共に、拡張階層イントラ予測メモリ118から符号化・復号済みの拡張階層復号画像が入力されて16×16モード固定のイントラ予測を行う。
拡張階層のイントラ予測処理は、復号済の同一フレーム上の2次元座標で上にあるマクロブロックと左にあるマクロブロックより、基本階層におけるイントラ予測画像に対する複数のフレーム内予測画像を生成し、伝送する予測差分が少ない予測モードを確定する処理である。拡張階層におけるイントラ予測処理は、少ない演算処理で基本階層において複雑度の高い演算処理で生成された予測画像に近い予測画像を見つける処理となる。
16×16固定イントラ予測回路117が行う予測モード選択処理の各ステップを図2のフローチャートを用いて説明する。
最初に基本階層のイントラ予測モードと予測画像を取得する(S201)。既存階層のイントラ予測モードが16×16予測モードであった場合(S202でYes)、基本階層のイントラ予測モードに従い、拡張階層イントラ予測メモリ118より符号化・復号済みの拡張階層復号画像を取得して予測画像を生成する(S203)。既存階層のイントラ予測モードが16×16予測モードでない場合(S202でNo)、基本階層のイントラ予測モードが8×8予測モードであったとき(S204でYes)、マクロブロック内のブロック数Mを4に設定する(S205)。基本階層のイントラ予測モードが8×8予測モードでない場合には(S204でNo)、マクロブロック内のブロック数Mを16に設定する(S206)。
続いて、16×16イントラ予測モードである、平均値(モード0)水平(モード1)垂直(モード2)平面予測(モード3)の4つのモードModeに対してステップS207以下の処理を繰りかえす。
最初にモード毎の評価値Err[Mode]とマクロブロック内の基本階層予測ブロック単位でのブロック最大評価値ErrBkMax[Mode]を0に初期化する(S208)。マクロブロック内のブロック位置BNに対して(S209)、ブロック毎の評価値ErrBkを0に初期化する(S210)。ブロック内のすべての画素に対して、基本階層のイントラ予測画像とModeにより拡張階層イントラ予測メモリより取得された予測画像の間の絶対値差分をErrBkに加算する(S211)。
ErrBkがErrBkMax[Mode]以上である場合(S212でYes)、ErrBkMax[Mode]にErrBkを設定する(S213)。ErrBkがErrBkMax[Mode]よりも小さい場合(S212でNo)、また、ErrBkをErr[Mode]に加算する(S214)。すべてのマクロブロック内のブロック位置BNに対してModeに対する評価値を算出した結果、ErrBkMax[Mode]が閾値Th以上である場合(S215でNo)、ErrBkMax[Mode]がそれまでに測定した他のModeのErrBkMaxよりも小さいときには、そのModeを暫定予測モードとする(S216)。ErrBkMax[Mode]が閾値Thよりも小さい場合には(S215でYes)、Err[Mode]が他のModeのErrよりも小さいときに、そのModeを予測モードとする(S217)。
このようにして選択されたイントラ予測モードに従い、拡張階層イントラ予測メモリ118より符号化・復号済みの拡張階層復号画像を取得して予測画像を生成し(S218)、拡張階層のイントラ予測モードとイントラ予測画像を出力する。このアルゴリズムにより、基本階層で複数のイントラ予測から選択された予測画像との対応度が高い16×16イントラ予測モードを設定できるため、品質の良い予測画像が生成できるとともに、拡張階層における予測差分情報の情報量も削減できる。
16×16固定イントラ予測回路117は、上記手順にて確定した拡張階層のイントラ予測モードと生成したイントラ予測画像を拡張階層予測モード判定回路121に出力する。
続いて、1/2画素精度動きベクトル補正/補償回路119は、1/4画素精度動きベクトル検出/補償回路106より、基本階層における同一マクロブロックの動き補償予測画像と動き補償予測モード情報、動きベクトル情報を取得すると共に、拡張階層参照画像メモリ120から符号化・復号済みの拡張階層復号画像を取得して、1/2画素精度の動きベクトルを検出する。1/2画素精度動きベクトル補正/補償回路119は、拡張階層について、MPEG2符号化方式で用いられているような、平均値を生成する2タップフィルタリングにより1/2画素精度の補間画像を生成することで、基本階層よりも少ない演算量で動き補償予測画像を生成できる。
1/2画素精度動きベクトル補正/補償回路119が行う動きベクトル検出処理の各ステップを図3のフローチャートを用いて説明する。
最初に基本階層の動き補償予測モード、動きベクトルと動き補償予測画像を取得する(S301)。取得した基本階層の動き補償予測モードは拡張階層においても引き継ぎ、動き補償予測モードに従い、マクロブロック内の全ての動き補償ブロックに対して(S302)、以下の処理を行う。
まず、基本階層の動きベクトル水平方向成分をMX、垂直方向成分をMYに設定する(S303)。MX、MYが共に1/2画素又は整数画素の精度である場合には(S304でYes)、そのままMX、MYを拡張階層の動きベクトルとし、拡張階層参照画像メモリ120より予測画像を取得する(S305)。それ以外の場合、即ちMX、MYのどちらかが1/4画素精度の動きベクトルであった場合には(S304でNo)、1/2画素精度の動きベクトルを検出するための動き補正処理を行う。動き補正処理は、MX、MYで示される参照画像の周辺をブロックマッチングすることで検出する。
最初に補正用のサーチレンジを設定する(S306)。基本階層の1画素未満の画素を算出するために6タップのフィルタ(±3画素)を用いるのに対して、拡張階層の1画素未満の画素は2タップの平均値フィルタ(±1画素)で生成するため、±2画素の参照画像の成分が予測画像に与える影響があるため、サーチレンジはMX,MYを基準に水平方向・垂直方向共±2画素に設定する。
設定したサーチレンジにおいて、1/2画素単位で動きベクトル値を設定し(S307)、それぞれブロック内のすべての画素に対して、基本階層の動き補償予測画像と、拡張階層参照画像メモリ120より動きベクトル値による動き補償を行った結果の予測画像との間で絶対値差分を計算し積算する(S308)。絶対値差分の積算値が最小となる動きベクトル値を拡張階層の動きベクトル値として設定し、拡張階層参照画像メモリ120より動き補償予測画像を取得する(S309)。
1画素未満の画素生成のアルゴリズムの差による動きベクトル検出ずれを考慮して、基本階層で取得した動き補償予測画像と対応度が高い、拡張階層の動きベクトル及び動き補償予測画像が生成できるため、複雑度の低い動き補償予測処理においても適切な予測画像を生成でき、拡張階層における予測差分情報の情報量を削減できる。
1/2画素精度動きベクトル補正/補償回路119は、上記手順にて確定した拡張階層の動き補償予測モード、動きベクトルと生成した動き補償予測画像を拡張階層予測モード判定回路121に出力する。
拡張階層予測モード判定回路121は、基本階層予測モード判定回路108より入力された、基本階層の予測モードの選択情報に従って、16×16固定イントラ予測回路117より入力された拡張階層のイントラ予測モードと生成したイントラ予測画像と、1/2画素精度動きベクトル補正/補償回路119より入力された拡張階層の動き補償予測モード、動きベクトルと生成した動き補償予測画像のどちらを採用するか、基本階層と拡張階層の予測モードが同一になるように選択する。拡張階層予測モード判定回路121は、予測モードの選択情報と選択されたイントラ予測モード又は、動き補償予測モード及び動きベクトル情報を、拡張階層エントロピー符号化回路129に出力すると共に、選択された予測モードの予測画像を減算器122及び加算器127に出力する。
減算器122は、マクロブロック切出回路103より取得した符号化ターゲットである2次元ブロック画像より、拡張階層予測モード判定回路121より取得した予測画像を減算し、それにより拡張階層の予測差分情報を生成し、拡張階層DCT回路123に出力する。
拡張階層DCT回路123は、基本階層と同様の2次元DCTを実行し、正規化前の整数DCT処理を施した結果のDCT係数情報を拡張階層量子化回路124に出力する。
拡張階層量子化回路124は、拡張階層DCT回路123よりDCT係数情報を取得し、符号量制御回路130より入力される量子化処理の基準となる量子化パラメータを用いて、DCT係数毎に量子化処理を行い、量子化されたDCT係数と量子化パラメータを拡張階層逆量子化回路125及び減算器128に出力すると共に、量子化パラメータを拡張階層エントロピー符号化回路129に出力する。
減算器128は、拡張階層量子化回路124より入力された拡張階層の量子化されたDCT係数より、基本階層量子化回路111より入力された基本階層の量子化されたDCT係数を減算し、それにより拡張階層において新たに発生した予測誤差の量子化されたDCT係数(以降、拡張差分量子化DCT係数と記す)を生成する。減算器128より出力された拡張差分量子化DCT係数は、拡張階層エントロピー符号化回路129に入力される。
拡張階層逆量子化回路125は、拡張階層量子化回路124より入力された量子化されたDCT係数と量子化パラメータより、逆量子化を実行して復号DCT係数を生成する。拡張階層逆量子化回路125は、生成した復号DCT係数を拡張階層IDCT回路126に出力する。
拡張階層IDCT回路126は、拡張階層逆量子化回路125より入力された復号DCT係数に対して整数IDCT処理を施し、拡張階層の復号差分画像を生成する。拡張階層IDCT回路126は、生成した拡張階層の復号差分画像を加算器127に出力する。
加算器127は、拡張階層予測モード判定回路121より入力された予測画像情報と、拡張階層IDCT回路126より入力された拡張階層の復号差分画像を加算し、それにより拡張階層の復号画像信号を生成する。加算器127によって生成された復号画像信号は、拡張階層イントラ予測メモリ118及び拡張階層参照画像メモリ120に出力される。拡張階層イントラ予測メモリ118には、復号画像信号が常に格納されるが、拡張階層参照画像メモリ120には、復号画像信号が後続する動画像信号の動き補償予測の参照画像となる場合にのみ、参照画像として復号画像信号が格納される。
拡張階層エントロピー符号化回路129は、減算器128より入力された拡張差分量子化DCT係数と、拡張階層予測モード判定回路121より入力された予測モード情報(予測モードが動き補償予測モードである場合、動きベクトル情報を含む)に対して、所定の構文構造に基づいてエントロピー符号化を施し、拡張階層を構成する拡張階層符号化ストリームを生成し、階層多重化回路131に出力する。また、拡張階層エントロピー符号化回路129は、生成符号化ストリーム量を符号量制御回路130に出力する。
階層多重化回路131は、基本階層エントロピー符号化回路116より出力される基本階層の符号化ストリームと拡張階層エントロピー符号化回路129より出力される拡張階層の符号化ストリームを多重化し、スケーラブル符号化ストリームとして出力端子132を介して、伝送路や記録メディア等に対して出力する。
符号量制御回路130は、基本階層エントロピー符号化回路116より入力された基本階層の生成符号化ストリーム量と、拡張階層エントロピー符号化回路129より入力された拡張階層の生成符号化ストリーム量を加算し、加算することによって得た量と設定されている符号化レートより算出される目標生成ストリーム量とを比較し、目標符号量に近づけるために、後続するマクロブロックに対して基本階層量子化回路111及び拡張階層量子化回路124が用いる量子化パラメータを制御する。符号量制御回路130は、拡張階層の復号処理の複雑度を減らすために、基本階層と拡張階層の量子化パラメータを一致させるように制御する。
実施の形態1では、MPEG4−AVCの動き補償予測を基準とし、基本階層の動きベクトル検出の精度を1/4画素精度と設定したが、基本階層の動きベクトル検出の精度は、1/4画素精度に限定されることはなく、例えば更に負荷の高い動きベクトル検出・動き補償予測となる1/8画素精度の処理を基本階層について行い、時間方向の相関を高め符号化効率を向上させ、拡張階層については1/4画素精度のMPEG4−AVC互換処理を実行することが可能な構成にすることも可能であり、本発明の意図している所の、基本階層に符号化効率の良い符号化アルゴリズムで符号化した情報を格納し、拡張階層で複雑度の低いまたは従来の符号化アルゴリズムと互換性のある復号処理で復号可能な情報を構成するための差分(追加)情報を符号化する構成となっていればよい。
続いて、図4に実施の形態1の画像復号化装置の構成を示し、その説明を行う。
入力端子401より入力された符号化ストリームは、階層多重分離回路402に供給される。階層多重分離回路402は、階層構造の符号化ストリームを基本階層の符号化ストリームと拡張階層の符号化ストリームに分離し、基本階層の符号化ストリームを基本階層エントロピー復号回路403に、拡張階層の符号化ストリームを拡張階層エントロピー復号回路413に出力する。
基本階層エントロピー復号回路403は、基本階層の符号化ストリームを階層多重分離回路402から受け取ると、所定の構文構造に基づいてエントロピー復号を行い、イントラ予測や動き補償予測に関連する予測モード情報と予測差分情報を構成する量子化されたDCT係数、量子化パラメータとに分離し、予測モード情報(予測モードが動き補償予測モードである場合、動きベクトル情報を含む)基本階層予測モード復号回路412に出力し、量子化されたDCT係数と量子化パラメータを基本階層逆量子化回路404及び加算器414に出力する。
基本階層逆量子化回路404は、基本階層エントロピー復号回路403より入力された量子化されたDCT係数と量子化パラメータより、逆量子化を実行して復号DCT係数を生成する。基本階層逆量子化回路404は、生成した復号DCT係数を基本階層IDCT回路405に出力する。
基本階層IDCT回路405は、基本階層逆量子化回路404より入力された復号DCT係数に対して整数DCTの逆変換となる整数IDCT処理を施し、基本階層の復号差分画像を生成する。基本階層IDCT回路405は、生成した基本階層の復号差分画像を加算器406に出力する。
加算器406は、基本階層予測モード復号回路412より入力された復号予測画像情報と、基本階層IDCT回路405より入力された基本階層の復号差分画像を加算し、それにより基本階層の復号画像信号を生成する。加算器406によって生成された復号画像信号は、基本階層イントラ予測メモリ409及びデブロックフィルタ回路407に出力される。
デブロックフィルタ回路407は、加算器406より入力された基本階層の復号画像信号に対して、隣接する2次元ブロックの復号画像との間のブロック境界に、量子化歪の発生条件に応じて歪を除去するための平滑フィルタリングを施し、フィルタリング処理後の復号画像信号を基本階層参照画像メモリ411に出力すると共に、復号出力切替回路425にも出力する。
基本階層イントラ予測メモリ409には加算器406より復号画像信号が入力され、基本階層参照画像メモリ411には、デブロックフィルタ回路407より平滑フィルタリングが施された復号画像信号が入力される。基本階層イントラ予測メモリ409には、復号画像信号が常に格納されるが、基本階層参照画像メモリ411には、復号画像信号が後続する動画像信号の動き補償予測の参照画像となる場合にのみ、参照画像として復号画像信号が格納される。
基本階層予測モード復号回路412は、予測モード情報(予測モードが動き補償予測モードである場合、動きベクトル情報を含む)を基本階層エントロピー復号回路403より取得し、予測モード情報がイントラ予測モードである場合には、4×4/8×8/16×16適応イントラ予測回路408に、イントラ予測モードを出力するとともに、4×4/8×8/16×16適応イントラ予測回路408が生成したイントラ予測画像を取得する。
4×4/8×8/16×16適応イントラ予測回路408は、基本階層予測モード復号回路412より入力されたイントラ予測モードに従って、基本階層イントラ予測メモリ409より復号画像信号を取得して予測画像を生成し、基本階層予測モード復号回路412に出力する。
同様に、基本階層予測モード復号回路412は、予測モード情報が動き補償予測モードである場合には、1/4画素精度動き補償予測回路410に、動き補償予測モードと動きベクトル情報を出力するとともに、1/4画素精度動き補償予測回路410が生成した動き補償予測画像を取得する。1/4画素精度動き補償予測回路410は、基本階層予測モード復号回路412より入力された動き補償予測モードと動きベクトル情報を用い、基本階層参照画像メモリ411より復号画像信号を取得して予測画像を生成し、基本階層予測モード復号回路412に出力する。
基本階層予測モード復号回路412は、予測モードに応じて4×4/8×8/16×16適応イントラ予測回路408と1/4画素精度動き補償予測回路410の何れかより予測画像を取得し、復号予測画像信号として加算器406に出力する。
拡張階層エントロピー復号回路413は、拡張階層の符号化ストリームを階層多重分離回路402から受け取ると、所定の構文構造に基づいてエントロピー復号を行い、イントラ予測や動き補償予測に関連する予測モード情報と予測差分情報を構成する量子化されたDCT係数、量子化パラメータとに分離し、予測モード情報(予測モードが動き補償予測モードである場合、動きベクトル情報を含む)を拡張階層予測モード復号回路422に出力し、量子化されたDCT係数と量子化パラメータを加算器414に出力する。
加算器414は、基本階層エントロピー復号回路403から出力された基本階層の量子化された復号DCT係数と拡張階層エントロピー復号回路413から出力された拡張階層の量子化された復号DCT係数を加算し、拡張階層逆量子化回路415に出力する。
拡張階層逆量子化回路415は、加算器414より入力された量子化されたDCT係数と量子化パラメータより、逆量子化を実行し復号DCT係数を生成する。拡張階層逆量子化回路415は、生成した復号DCT係数を拡張階層IDCT回路416に出力する。
拡張階層IDCT回路416は、拡張階層逆量子化回路415より入力された復号DCT係数に対して整数DCTの逆変換となる整数IDCT処理を施し、拡張階層の復号差分画像を生成する。拡張階層IDCT回路416は、生成した拡張階層の復号差分画像を加算器417に出力する。
加算器417は、拡張階層予測モード復号回路422より入力された復号予測画像情報と、拡張階層IDCT回路416より入力された拡張階層の復号差分画像を加算し、それにより拡張階層の復号画像信号を生成する。加算器417によって生成された復号画像信号は、拡張階層イントラ予測メモリ419及び拡張階層参照画像メモリ421に格納される。
拡張階層予測モード復号回路422は、予測モード情報(予測モードが動き補償予測モードである場合、動きベクトル情報を含む)を拡張階層エントロピー復号回路413より取得し、予測モード情報がイントラ予測モードである場合には16×16固定イントラ予測回路418に、イントラ予測モードを出力するとともに、16×16固定イントラ予測回路418が生成したイントラ予測画像を取得する。
16×16固定イントラ予測回路418は、拡張階層予測モード復号回路422より入力されたイントラ予測モードに従って、拡張階層イントラ予測メモリ419より復号画像信号を取得して予測画像を生成し、拡張階層予測モード復号回路422に出力する。
同様に、拡張階層予測モード復号回路422は、予測モード情報が動き補償予測モードである場合には、1/2画素精度動き補償予測回路420に、動き補償予測モードと動きベクトル情報を出力するとともに、1/2画素精度動き補償予測回路420が生成した動き補償予測画像を取得する。1/2画素精度動き補償予測回路420は、拡張階層予測モード復号回路422より入力された動き補償予測モードと動きベクトル情報を用い、拡張階層参照画像メモリ421より復号画像信号を取得して予測画像を生成し、拡張階層予測モード復号回路422に出力する。
拡張階層予測モード復号回路422は、予測モードに応じて16×16固定イントラ予測回路418と1/2画素精度動き補償予測回路420の何れかより予測画像を取得し、復号予測画像信号として加算器417に出力する。
演算処理量測定回路423は、復号化装置が行った処理の演算量を測定し復号階層選択回路424に出力する。復号階層選択回路424は、演算処理量測定回路423より入力された演算量と、復号装置の外部条件である電力消費量、バッテリ残量、もしくは、処理可能な演算量などにより設定される復号可能演算量とに基づいて、基本階層と拡張階層のどちらを復号するかの選択を行う。具体的には、復号階層選択回路424は、演算量が復号可能演算量よりも大きくなる場合には、復号処理演算量を少なく出来るように、処理の選択を行う。より具体的には、復号階層選択回路424は、基本階層逆量子化回路404〜基本階層予測モード復号回路412で示された基本階層のみを復号する場合にのみ必要な回路(以降、基本階層復号単独機能部427と記載する)の動作をクロック停止等の手段を用いて機能させないようにする。
また、復号階層選択回路424は、演算量が復号可能演算量よりも大きくなる場合には、基本階層のみを復号し演算量の大きな復号処理を実行するように選択する。この場合には拡張階層の復号処理は必要がないため、拡張階層エントロピー復号回路413〜拡張階層予測モード復号回路422で示された拡張階層を復号する場合にのみ必要な回路(以降、拡張階層復号単独機能部428と記載する)の動作を機能させないようにすることで、不必要な電力消費を防ぐことも可能である。
復号階層選択回路424は、同時にデブロックフィルタ回路407から出力される基本階層の復号画像信号と加算器417から出力される拡張階層の復号画像信号を選択する信号を、復号出力切替回路425に出力する。復号出力切替回路425は、復号階層選択回路424より入力された選択信号を元に、基本階層の復号画像信号と拡張階層の復号画像信号より、出力する復号画像を選択して、出力端子426に出力する。
図4における復号化装置においては、基本階層と拡張階層の復号切替を可能とする形態が示されているが、基本階層のみを復号する復号化装置、拡張階層のみを復号する復号化装置を構成することも可能であり、その場合には演算処理量測定回路423、復号階層選択回路424及び復号出力切替回路425は必要なく、基本階層のみを復号する場合には、拡張階層復号単独機能部428も必要なく、拡張階層のみを復号する場合には、基本階層復号単独機能部427は必要ない。
(実施の形態2)
続いて、実施の形態2の画像符号化装置及び画像復号化装置を説明する。実施の形態2は、国際標準化されているなどの従来に使用されている符号化アルゴリズムに対して、追加の情報削減処理を施すことで符号化効率を向上させる場合に、基本階層で向上させた符号化アルゴリズムを用いて少ない情報量で高品質な復号画像を再生可能とすると共に、拡張階層において追加の情報削減処理により削減される(生成される)情報を符号化することで、従来の符号化アルゴリズムに僅かな処理の追加で復号可能な符号化ストリームを生成する構成を実現している。
図5は、実施の形態2の画像符号化装置の構成図である。追加の情報削減処理では、特開2008−109424号公報において提示されている、隣接する2次元ブロックのDCT係数を元にブロック境界の傾きを境界条件としたポアソン方程式を満たすように、符号化対象となる2次元ブロックのDCT係数を推定し、推定係数を対象となるDCT係数から減算する。
図5において、入力端子501、入力画像メモリ502、マクロブロック切出回路503、4×4/8×8/16×16適応イントラ予測回路504、基本階層イントラ予測メモリ505、1/4画素精度動きベクトル検出/補償回路506、基本階層参照画像メモリ507、基本階層予測モード判定回路508、減算器509、基本階層DCT回路510、基本階層量子化回路511、基本階層逆量子化回路512、基本階層IDCT回路513、加算器514、デブロックフィルタ回路515、符号量制御回路521、階層多重化回路522、及び、出力端子523に関しては、実施の形態1において用いた図1に示す各構成部と同じ機能を有するため、説明を省略する。
基本階層量子化回路511より出力された基本階層の量子化されたDCT係数と量子化スケールは、DCT係数格納メモリ517に格納されると共に、減算器519に入力される。DCT係数格納メモリ517には、基本階層量子化回路511より入力されたDCT係数が格納される。DCT係数格納メモリ517は、2次元ブロックの隣接係数を参照するため、最小でも2マクロブロックラインのDCT係数を保持することができる記憶容量を有する。DCT係数推定回路518は、対象となる2次元ブロックの上下左右に存在するDCT係数を元に、対象となる2次元ブロックの量子化されたDCT係数を推定し、推定したDCT係数を減算器519及び拡張階層エントロピー符号化回路520に出力する。
減算器519は、基本階層量子化回路511より基本階層の量子化されたDCT係数が入力されるとともに、DCT係数推定回路518より推定された量子化されたDCT係数が入力され、量子化されたDCT係数より推定されたDCT係数を減算し、それにより量子化DCT係数差分を生成し、基本階層エントロピー符号化回路516に出力する。
基本階層エントロピー符号化回路516は、減算器519より入力された量子化DCT係数差分と、基本階層予測モード判定回路508より入力された予測モード情報(予測モードが動き補償予測モード出ある場合、動きベクトル情報を含む)に対して、所定の構文構造に基づいてエントロピー符号化を施し、基本階層を構成する基本階層符号化ストリームを生成し、階層多重化回路522に出力する。
拡張階層エントロピー符号化回路520は、DCT係数推定回路518から、推定された量子化されたDCT係数が入力され、それに対して所定の構文構造に基づいてエントロピー符号化を施し、拡張階層を構成する拡張階層符号化ストリームを生成し、階層多重化回路522に出力する。拡張階層の符号化ストリームは、DCT係数推定回路518によって推定された量子化されたDCT係数を符号化することによって得られたストリームであるので、DCT係数推定回路518によって行われる推定処理の替わりに拡張階層の符号化ストリームを復号することで、同じ推定DCT係数を復号出来ることになる。
続いて、図6に実施の形態2の画像復号化装置の構成を示し、説明を行う。図6において、入力端子601、階層多重分離回路602、基本階層エントロピー復号回路603、基本階層逆量子化回路604、基本階層IDCT回路605、加算器606、4×4/8×8/16×16適応イントラ予測回路608、基本階層イントラ予測メモリ609、1/4画素精度動きベクトル検出/補償回路610、基本階層参照画像メモリ611、基本階層予測モード復号回路612、演算処理量測定回路617、及び、出力端子619に関しては、実施の形態1において用いた図4に示す各構成部と同じ機能を有するため、説明を省略する。
デブロックフィルタ回路607は、平滑フィルタリングを施した復号画像信号を出力端子619に常に出力し、基本階層のみを復号する場合にも、拡張階層を復号する場合にも機能する。DCT係数格納メモリ615及びDCT係数推定回路616は、図5における符号化装置の同一回路と同様の動作を行い、推定した量子化されたDCT係数を復号階層選択回路618に出力する。また、拡張階層エントロピー復号回路613は、拡張階層の符号化ストリームが階層多重分離回路602より入力され、所定の構文構造に基づいてエントロピー復号を行い、基本階層について推定された量子化されたDCT係数と同等の係数を復号し、復号階層選択回路618に出力する。
復号階層選択回路618は、演算処理量測定回路617より入力された演算量と、復号装置の外部条件である電力消費量、バッテリ残量、処理可能な演算量、もしくは、対応可能な復号アルゴリズム等により設定される復号可能演算量とに基づいて、基本階層と拡張階層のどちらを復号するかの選択を行う。具体的には、復号階層選択回路618は、演算量が復号可能演算量よりも大きな場合には、復号処理演算量を少なく出来るように、処理の選択を行う。
復号階層選択回路618は、拡張階層エントロピー復号回路613から入力される復号DCT係数と、DCT係数推定回路616より出力される推定DCT係数を処理の選択に応じて切替、加算器614に出力する。加算器614は、基本階層エントロピー復号回路603から入力された量子化されたDCT係数差分と、復号階層選択回路618より出力された量子化されたDCT係数を加算し、それにより量子化された復号DCT係数を生成し、基本階層逆量子化回路604及びDCT係数格納メモリ615に出力する。実施の形態2においては、拡張階層復号単独機能部は拡張階層エントロピー復号回路613であり、DCT係数格納メモリ615とDCT係数推定回路616が基本階層復号単独機能部620となる。
実施の形態2の構成により、国際標準化等において策定されている符号化方式による効率を上回る符号化効率をにより、より複雑な処理を行って実現出来る符号化アルゴリズムを用いた場合にも、既存の符号化アルゴリズムを処理可能な復号装置で復号可能な、階層構造を持つ符号化ストリームを生成することが出来る。
実施の形態2の構成と同じ構成にて、追加の情報削減処理として差分情報の画像信号を画面内予測するアルゴリズムを実現することも可能であり、追加の情報削減処理のために生成された推定情報を拡張情報として符号化する構成に関しては、実施の形態2の構成を基本として展開することが可能である。
(プログラムでの動作に関して)
なお、上述した実施の形態1及び実施の形態2では、本発明の画像符号化装置及び画像復号化装置を、ブロック図を用いてハードウエア的に構成して説明したが、本発明は、これに限らず、CPUがCDやネックワークを介しダウンロードしたプログラムを実行することにより、同様の形態を実現する画像符号化方法及び画像復号化方法も含む。すなわち、本発明の画像符号化装置及び画像復号化装置の各構成要件の機能は、CPUとソフトウエアとが協働することにより実現されてもよい。
また、上述した実施の形態1及び実施の形態2では、基本となる画像符号化規格がMPEG4−AVCである場合を想定したが、画像符号化規格はそれに限定されるものではなく、MPEG1、MPEG2、MPEG4−SP、MPEG4−ASP、又は、VC1等、他の符号化規格であってもよい。
101 入力端子、 102 入力画像メモリ、 103 マクロブロック切出回路、 104 4×4/8×8/16×16適応イントラ予測回路、 105 基本階層イントラ予測メモリ、 106 1/4画素精度動きベクトル検出/補償回路、 107 基本階層参照画像メモリ、 108 基本階層予測モード判定回路、 109 減算器、 110 基本階層DCT回路、 111 基本階層量子化回路、 112 基本階層逆量子化回路、 113 基本階層IDCT回路、 114 加算器、 115 デブロックフィルタ回路、 116 基本階層エントロピー符号化回路、 117 16×16固定イントラ予測回路、 118 拡張階層イントラ予測メモリ、 119 1/2画素精度動きベクトル補正/補償回路、 120 拡張階層参照画像メモリ、 121 拡張階層予測モード判定回路、 122 減算器、 123 拡張階層DCT回路、 124 拡張階層量子化回路、 125 拡張階層逆量子化回路、 126 拡張階層IDCT回路、 127 加算器、 128 減算器、 129 拡張階層エントロピー符号化回路、 130 符号量制御回路、 131 階層多重化回路、 132 出力端子、 401 入力端子、 402 階層多重分離回路、 403 基本階層エントロピー復号回路、 404 基本階層逆量子化回路、 405 基本階層IDCT回路、 406 加算器、 407 デブロックフィルタ回路、 408 4×4/8×8/16×16適応イントラ予測回路、 409 基本階層イントラ予測メモリ、 410 1/4画素精度動き補償予測回路、 411 基本階層参照画像メモリ、 412 基本階層予測モード復号回路、 413 拡張階層エントロピー復号回路、 414 加算器、 415 拡張階層逆量子化回路、 416 拡張階層IDCT回路、 417 加算器、 418 16×16固定イントラ予測回路、 419 拡張階層イントラ予測メモリ、 420 1/2画素精度動き補償予測回路、 421 拡張階層参照画像メモリ、 422 拡張階層予測モード復号回路、 423 演算処理量測定回路、 424 復号階層選択回路、 425 復号出力切替回路、 426 出力端子、 427 基本階層復号単独機能部、 428 拡張階層復号単独機能部、 501 入力端子、 502 入力画像メモリ、 503 マクロブロック切出回路、 504 4×4/8×8/16×16適応イントラ予測回路、 505 基本階層イントラ予測メモリ、 506 1/4画素精度動きベクトル検出/補償回路、 507 基本階層参照画像メモリ、 508 基本階層予測モード判定回路、 509 減算器、 510 基本階層DCT回路、 511 基本階層量子化回路、 512 基本階層逆量子化回路、 513 基本階層IDCT回路、 514 加算器、 515 デブロックフィルタ回路、 516 基本階層エントロピー符号化回路、 517 DCT係数格納メモリ、 518 DCT係数推定回路、 519 減算器、 520 拡張階層エントロピー符号化回路、 521 符号量制御回路、 522 階層多重化回路、 523 出力端子、 601 入力端子、 602 階層多重分離回路、 603 基本階層エントロピー復号回路、 604 基本階層逆量子化回路、 605 基本階層IDCT回路、 606 加算器、 607 デブロックフィルタ回路、 608 4×4/8×8/16×16適応イントラ予測回路、 609 基本階層イントラ予測メモリ、 610 1/4画素精度動きベクトル検出/補償回路、 611 基本階層参照画像メモリ、 612 基本階層予測モード復号回路、 613 拡張階層エントロピー復号回路、 614 加算器、 615 DCT係数格納メモリ、 616 DCT係数推定回路、 617 演算処理量測定回路、 618 復号階層選択回路、 619 出力端子、 620 基本階層復号単独機能部。

Claims (8)

  1. 画像信号を取得する取得部と、
    前記取得部によって取得された前記画像信号に対して、単独で復号可能な基本階層の符号化を行う基本階層符号化部と、
    前記取得部によって取得された前記画像信号に対して、前記基本階層と合わせて復号することにより復号可能な拡張階層の符号化を行う拡張階層符号化部とを備え、
    前記基本階層符号化部は、空間方向の相関を用いる第1の画面内予測部と、時間方向の相関を用いる第1の動き補償予測部とを有し、
    前記拡張階層符号化部は、空間方向の相関を用い、前記第1の画面内予測部よりも複雑度が低い処理を行う第2の画面内予測部と、時間方向の相関を用い、前記第1の動き補償予測部よりも複雑度が低い処理を行う第2の動き補償予測部とを有し、
    前記第1の画面内予測部は、複数の2次元ブロックサイズにおける画面内予測モードより選択される予測情報を生成し、
    前記第2の画面内予測部は、前記第1の画面内予測部によって生成される第1の面内予測信号と予測モードを示す情報との少なくとも一方を取得し、単一の2次元ブロックサイズにおける画面内予測情報を生成して、第2の面内予測信号を生成し、
    前記第2の動き補償予測部は、前記第1の動き補償予測部によって生成される第1の動き補償予測信号と予測モードを示す情報との少なくとも一方を取得し、第2の動き予測信号を生成する
    画像符号化装置。
  2. 前記第2の画面内予測部は、前記第1の面内予測信号との相関性の高い予測情報を検出し、
    前記第2の動き補償予測部は、前記第1の動き補償予測信号との相関性の高い予測信号を検出する
    請求項1に記載の画像符号化装置。
  3. 画像信号を取得する取得部と、
    前記取得部によって取得された前記画像信号に対して、単独で復号可能な基本階層の符号化を行う基本階層符号化部と、
    前記取得部によって取得された前記画像信号に対して、前記基本階層と合わせて復号することにより復号可能な拡張階層の符号化を行う拡張階層符号化部とを備え、
    前記基本階層符号化部は、空間方向の相関を用いる画面内予測部と、時間方向の相関を用いる動き補償予測部と、前記画面内予測部又は前記動き補償予測部によって生成された予測画像を用いて生成された差分信号に対して、画面内で隣接する画像領域に対する差分信号を用いて差分信号予測画像を生成し、前記予測画像を用いて生成された差分信号より、前記差分信号予測画像を減算する差分信号相関除去部とを有し、
    前記拡張階層符号化部は、前記差分信号相関除去部によって得られた前記差分信号予測画像を符号化する
    画像符号化装置。
  4. 単独で復号可能な基本階層と、前記基本階層と合わせて復号することにより復号可能な拡張階層とを有する、符号化された階層符号化ストリームを取得する取得部と、
    前記基本階層の復号処理演算量を測定する演算処理量測定部と、
    本装置の外部条件である電力消費量、バッテリ残量、もしくは処理可能な演算量により設定される復号可能演算量と、前記演算処理量測定部によって測定された前記基本階層の復号処理演算量とに基づいて、前記階層符号化ストリームより抽出する階層を選択する復号階層選択部とを備え、
    前記復号階層選択部は、前記基本階層の復号処理演算量が前記復号可能演算量よりも大きくなる場合、基本階層と拡張階層とを抽出し、前記基本階層の復号処理演算量が前記復号可能演算量よりも大きくならない場合、基本階層のみを抽出する
    画像復号化装置。
  5. 画像信号を取得するステップと、
    取得した前記画像信号に対して、単独で復号可能な基本階層の符号化を行うステップと、
    取得した前記画像信号に対して、前記基本階層と合わせて復号することにより復号可能な拡張階層の符号化を行うステップとを含み、
    基本階層の符号化を行うステップは、空間方向の相関を用いる第1の画面内予測ステップと、時間方向の相関を用いる第1の動き補償予測ステップとを有し、
    拡張階層の符号化を行うステップは、空間方向の相関を用い、前記第1の画面内予測ステップよりも演算量の少ない処理を行う第2の画面内予測ステップと、時間方向の相関を用い、前記第1の動き補償予測ステップよりも演算量の少ない処理を行う第2の動き補償予測ステップとを有し、
    前記第1の画面内予測ステップでは、複数の2次元ブロックサイズにおける画面内予測モードより選択される予測情報を生成し、
    前記第2の画面内予測ステップでは、前記第1の画面内予測ステップによって生成される第1の面内予測信号と予測モードを示す情報との少なくとも一方を取得し、単一の2次元ブロックサイズにおける画面内予測情報を生成して、第2の面内予測信号を生成し、
    前記第2の動き補償予測ステップでは、前記第1の動き補償予測ステップによって生成される第1の動き補償予測信号と予測モードを示す情報との少なくとも一方を取得し、第2の動き予測信号を生成する
    画像符号化方法。
  6. 前記第2の画面内予測ステップでは、前記第1の面内予測信号との相関性の高い予測情報を検出し、
    前記第2の動き補償予測ステップでは、前記第1の動き補償予測信号との相関性の高い予測信号を検出する
    請求項5に記載の画像符号化方法。
  7. 画像信号を取得するステップと、
    取得した前記画像信号に対して、単独で復号可能な基本階層の符号化を行う基本階層符号化ステップと、
    取得した前記画像信号に対して、前記基本階層と合わせて復号することにより復号可能な拡張階層の符号化を行う拡張階層符号化ステップとを含み、
    前記基本階層符号化ステップは、空間方向の相関を用いる画面内予測ステップと、時間方向の相関を用いる動き補償予測ステップと、前記画面内予測ステップ又は前記動き補償予測ステップにおいて生成した予測画像を用いて生成した差分信号に対して、画面内で隣接する画像領域に対する差分信号を用いて差分信号予測画像を生成し、前記予測画像を用いて生成された差分信号より、前記差分信号予測画像を減算する差分信号相関除去ステップとを有し、
    前記拡張階層符号化ステップでは、前記差分信号相関除去ステップにおいて得た前記差分信号予測画像を符号化する
    画像符号化方法。
  8. 単独で復号可能な基本階層と、前記基本階層と合わせて復号することにより復号可能な拡張階層とを有する、符号化された階層符号化ストリームを取得するステップと、
    前記基本階層の復号処理演算量を測定するステップと、
    画像符号化装置の外部条件である電力消費量、バッテリ残量、もしくは処理可能な演算量により設定される復号可能演算量と、測定した前記基本階層の復号処理演算量とに基づいて、前記階層符号化ストリームより抽出する階層を選択するステップとを含み、
    階層を選択するステップでは、前記基本階層の復号処理演算量が前記復号可能演算量よりも大きくなる場合、基本階層と拡張階層とを抽出し、前記基本階層の復号処理演算量が前記復号可能演算量よりも大きくならない場合、基本階層のみを抽出する
    画像復号化方法。
JP2009225520A 2009-09-29 2009-09-29 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法 Active JP5381571B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009225520A JP5381571B2 (ja) 2009-09-29 2009-09-29 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009225520A JP5381571B2 (ja) 2009-09-29 2009-09-29 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法

Publications (2)

Publication Number Publication Date
JP2011077721A JP2011077721A (ja) 2011-04-14
JP5381571B2 true JP5381571B2 (ja) 2014-01-08

Family

ID=44021249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009225520A Active JP5381571B2 (ja) 2009-09-29 2009-09-29 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法

Country Status (1)

Country Link
JP (1) JP5381571B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2870770A2 (en) 2012-07-09 2015-05-13 VID SCALE, Inc. Power aware video decoding and streaming
WO2014162916A1 (ja) * 2013-04-03 2014-10-09 ソニー株式会社 画像符号化装置および方法、並びに、画像復号装置および方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005123737A (ja) * 2003-10-14 2005-05-12 Canon Inc 画像符号化方法、画像符号化装置
CA2609648A1 (en) * 2005-04-29 2006-11-09 Samsung Electronics Co., Ltd. Video coding method and apparatus supporting fast fine granular scalability
JP5017825B2 (ja) * 2005-09-15 2012-09-05 ソニー株式会社 復号装置および復号方法
JP2009010649A (ja) * 2007-06-27 2009-01-15 Sharp Corp スケーラブルビデオストリーム復号装置およびスケーラブルビデオストリーム生成装置

Also Published As

Publication number Publication date
JP2011077721A (ja) 2011-04-14

Similar Documents

Publication Publication Date Title
CA2863170C (en) Video decoder, video encoder, video decoding method, and video encoding method
US8693546B2 (en) Video encoding method and video decoding method
CA2755889C (en) Image processing device and method
KR102518993B1 (ko) 복수의 보간 필터링 방법 및 이를 적용한 부호화 장치
JP5061179B2 (ja) 照明変化補償動き予測符号化および復号化方法とその装置
US20120121020A1 (en) Motion image encoding apparatus, motion image decoding apparatus, motion image encoding method, motion image decoding method, motion image encoding program, and motion image decoding program
US20120027092A1 (en) Image processing device, system and method
WO2008096964A1 (en) Method and apparatus for encoding and decoding based on inter prediction
EP2775718B1 (en) Method, device, and program for coding and decoding of images
JP2014082639A (ja) 画像符号化装置およびその方法
KR20090095317A (ko) 영상 부호화 및 복호화 방법 및 장치
US9294765B2 (en) Video encoder with intra-prediction pre-processing and methods for use therewith
KR101924088B1 (ko) 적응적 예측 블록 필터링을 이용한 영상 부호화/복호화 장치 및 방법
JP2013115583A (ja) 動画像符号化装置及びその制御方法並びにプログラム
US9438925B2 (en) Video encoder with block merging and methods for use therewith
US9055292B2 (en) Moving image encoding apparatus, method of controlling the same, and computer readable storage medium
JP5381571B2 (ja) 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法
JP2010081498A (ja) 画像圧縮符号化方法、及び装置
EP2899975A1 (en) Video encoder with intra-prediction pre-processing and methods for use therewith
US20130170565A1 (en) Motion Estimation Complexity Reduction
KR20180107067A (ko) 영상 부호화/복호화 장치 및 방법
AU2017204660A1 (en) Image processing apparatus and method
WO2012044116A2 (ko) 적응적 예측 블록 필터링을 이용한 영상 부호화/복호화 장치 및 방법
KR20140068741A (ko) 영상 부호화 방법 및 장치

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20111012

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120329

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130916

R150 Certificate of patent or registration of utility model

Ref document number: 5381571

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150