JP2012169763A - 画像符号化装置と画像符号化方法およびプログラム - Google Patents
画像符号化装置と画像符号化方法およびプログラム Download PDFInfo
- Publication number
- JP2012169763A JP2012169763A JP2011027386A JP2011027386A JP2012169763A JP 2012169763 A JP2012169763 A JP 2012169763A JP 2011027386 A JP2011027386 A JP 2011027386A JP 2011027386 A JP2011027386 A JP 2011027386A JP 2012169763 A JP2012169763 A JP 2012169763A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- reference picture
- picture
- encoding
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】多視点画像の符号化における符号化効率をさせる。
【解決手段】特徴量生成部31は、ピクチャの符号化で視点の異なる参照ピクチャを用いる視差予測と時間方向の参照ピクチャを用いる時間予測のいずれが支配的であるかを示す特徴量を生成する。参照ピクチャリスト作成部35は、符号化対象ピクチャの符号化において、該符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、前記参照ピクチャの参照ピクチャリストを更新する。多視点画像の符号化において、参照ピクチャに対して符号量が少なくなるようにインデックスを割り当てることが可能となり、符号化効率を向上できる。
【選択図】 図2
【解決手段】特徴量生成部31は、ピクチャの符号化で視点の異なる参照ピクチャを用いる視差予測と時間方向の参照ピクチャを用いる時間予測のいずれが支配的であるかを示す特徴量を生成する。参照ピクチャリスト作成部35は、符号化対象ピクチャの符号化において、該符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、前記参照ピクチャの参照ピクチャリストを更新する。多視点画像の符号化において、参照ピクチャに対して符号量が少なくなるようにインデックスを割り当てることが可能となり、符号化効率を向上できる。
【選択図】 図2
Description
この技術は、画像符号化装置と画像符号化方法およびプログラムに関する。詳しくは、多視点画像の符号化効率を向上できるようにする。
近年、画像情報をディジタルデータとして取り扱い、その際、効率の高い情報の伝送、蓄積を行う装置、例えば離散コサイン変換等の直交変換と動き補償により圧縮するMPEG等の方式に準拠した装置が、放送局や一般家庭において普及しつつある。
特に、MPEG2(ISO/IEC13818−2)は、汎用画像符号化方式として定義されており、プロフェッショナル用途およびコンシューマー用途の広範なアプリケーションに現在広く用いられている。さらに、MPEG2といった符号化方式に比べ、より高い符号化効率が実現できるH.264/AVC(Advanced Video Coding)という画像符号化方式が標準化されている。
このような画像符号化方式では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行っている。例えば、空間的な冗長性の削減を目的とした画面内予測符号化を行うIピクチャでは、画素間の相関を利用して予測画像の生成が行われている。また、時間的な冗長性の削減を目的とする画面間予測符号化を行う片方向予測ピクチャ(Pピクチャ)では、前方の画像を参照してブロック単位で動きベクトルを検出して、検出した動きベクトルを用いて予測画像の生成が行われている。さらに、双予測ピクチャ(Bピクチャ)では、前方や後方のピクチャを参照してブロック単位で動きベクトルを検出して、検出した動きベクトルを用いて予測画像の生成が行われている。なお、Bピクチャにおいて、1枚目の参照ピクチャをL0予測の参照ピクチャ、2枚目の参照ピクチャをL1予測の参照ピクチャと呼ぶ。
H.264/AVC方式は、既に符号化した複数のピクチャから参照ピクチャを選択することができるようになされている。また、選択された参照ピクチャは、インデックスで管理されている。インデックスは、検出した動きベクトルがどのピクチャを参照した動きベクトルであるかを示す情報と用いられて、検出した動きベクトルを示す情報とともに符号化される。
インデックスは、0以上の値が設定される。また、インデックスは、値が小さいほど符号化後の情報量(符号量)が少ない。さらに、参照ピクチャへのインデックスの割り当ては、自由に設定することができる。そのため、参照される動きベクトルの本数が多い参照ピクチャに番号の小さいインデックスを割り当てることで、インデックスを符号化したときの符号量を少なくして、符号化効率を向上させることが可能となる。
また、特許文献1では、インタレース走査方式の2D画像に対してフィールド符号化を行う場合、符号化対象ピクチャとの時間的な距離が近い参照ピクチャに、小さい値のインデックスを割り当てることが行われている。
ところで、FS(Frame Sequential)−AVCやマルチビュービデオ符号化(MVC:Multiview Video Coding)では、時間方向の画像間での相関を利用する時間予測だけでなく、視点の異なる画像間での相関を利用する視差予測が行われる。
このように、画像符号化装置で時間予測だけでなく視差予測を行う場合、視差予測も含めてインデックスを割り当てる必要がある。
図1は、従来の一般的な画像符号化装置の動作を示すフローチャートである。画像符号化装置は、ステップST1で参照ピクチャリストを決定したのちマクロブロックループ処理を行う。なお、参照ピクチャリストは、参照される画像(参照ピクチャ)とインデックスとの関係を示すリストである。画像符号化装置は、マクロブロックループ処理として、ステップST2で動き予測とイントラ予測およびモード判定を行い、判定結果に基づきステップST3で直交変換、ステップST4で量子化、ステップST5で符号化ストリームの生成を行う。さらに、画像符号化装置は、ステップST6で逆量子化、ステップST7で逆直交変換を行い、ステップST8で参照画を生成する。この生成された参照画を用いて、動き予測とイントラ予測を行う。このように、予め参照ピクチャリストを定義しなければならないため、例えば時間的な距離が近い参照ピクチャに小さい値のインデックスを割り当てた場合、時間予測や視差予測で参照される割合が多い画像の順にインデックスを割り当てることが保証されない。
また、参照される割合が多いピクチャの順に参照ピクチャリストを並び替える必要がある場合には、マクロブロックループ処理を再度行い、参照される割合が多い画像を判別する必要があるため、処理時間が増大してしまう。さらに、リアルタイムが要求される高速な符合化処理では、マクロブロックループ処理を再度行うことが許されない場合も生じる。
そこで、この技術では、多視点画像の符号化における符号化効率を向上できる画像符号化装置と画像符号化方法およびプログラムを提供することを目的とする。
この技術の第1の側面は、ピクチャの符号化で視点の異なる参照ピクチャを用いる視差予測と時間方向の参照ピクチャを用いる時間予測のいずれが支配的であるかを示す特徴量を生成する特徴量生成部と、符号化対象ピクチャの符号化において、該符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、前記参照ピクチャの参照ピクチャリストを更新する参照ピクチャリスト作成部とを有する画像符号化装置にある。
この技術においては、ピクチャの符号化で視点の異なる参照ピクチャを用いる視差予測と時間方向の参照ピクチャを用いる時間予測のいずれが支配的であるかを示す特徴量、例えば視差予測と時間予測を行うブロック割合や、符号化対象ピクチャが双予測ピクチャである場合、時間予測の参照ピクチャ毎に動き予測を行うことにより得られた参照ピクチャ毎の予測誤差を示す情報や、さらに視差予測の参照ピクチャを用いて動き予測を行うことにより得られた予測誤差を示す情報が生成される。
符号化対象ピクチャの符号化では、この符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、参照ピクチャの参照ピクチャリストが更新されて、支配的である予測で用いる参照ピクチャに対して符号長の短いインデックスの割り当てが行われる。また、動き予測では、符号化対象ピクチャの符号化直前に符号化されたピクチャにおける同位置のブロックで選択されているインデックスで示された参照ピクチャから動き予測が行われて、予測誤差が予め設定した閾値以下である場合、動き予測が終了される。さらに、予測誤差が閾値よりも大きい場合、支配的である予測の順に参照ピクチャを用いて動き予測を行い、予測誤差が閾値以下となった場合、動き予測が終了される。
この技術の第2の側面は、ピクチャの符号化で視点の異なる参照ピクチャを用いる視差予測と時間方向の参照ピクチャを用いる時間予測のいずれが支配的であるかを示す特徴量を生成する工程と、符号化対象ピクチャの符号化において、該符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、前記参照ピクチャの参照ピクチャリストを更新する工程とを有する画像符号化方法にある。
この技術の第3の側面は、画像の符号化をコンピュータで実行させるプロクラムであり、ピクチャの符号化で視点の異なる参照ピクチャを用いる視差予測と時間方向の参照ピクチャを用いる時間予測のいずれが支配的であるかを示す特徴量を生成する手順と、符号化対象ピクチャの符号化において、該符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、前記参照ピクチャの参照ピクチャリストを更新する手順とを前記コンピュータで実行させるプログラムにある。
なお、本技術のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能な汎用コンピュータ・システムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、光ディスクや磁気ディスク、半導体メモリなどの記憶媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータ・システム上でプログラムに応じた処理が実現される。
この技術によれば、ピクチャの符号化で視点の異なる参照ピクチャを用いる視差予測と時間方向の参照ピクチャを用いる時間予測のいずれが支配的であるかを示す特徴量が生成される。符号化対象ピクチャの符号化では、符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、参照ピクチャの参照ピクチャリストが更新される。したがって、多視点画像の符号化において、参照ピクチャに対して符号量が少なくなるようにインデックスを割り当てることが可能となり、符号化効率を向上できる。
以下、技術を実施するための形態について説明する。なお、説明は以下の順序で行う。
1.画像符号化装置の構成
2.画像符号化装置の第1の動作
3.画像符号化装置の第2の動作
4.画像符号化装置の動作例
5.画像符号化装置の第3の動作
6.ソフトウェア処理の場合
1.画像符号化装置の構成
2.画像符号化装置の第1の動作
3.画像符号化装置の第2の動作
4.画像符号化装置の動作例
5.画像符号化装置の第3の動作
6.ソフトウェア処理の場合
<1.画像符号化装置の構成>
図2は、画像符号化装置10の構成を例示している。画像符号化装置10は、アナログ/ディジタル変換部(A/D変換部)11、画面並び替えバッファ12、減算部13、直交変換部14、量子化部15、可逆符号化部16、蓄積バッファ17、レート制御部18を備えている。また、画像符号化装置10は、逆量子化部21、逆直交変換部22、加算部23、デブロッキングフィルタ24、フレームメモリ25を有している。さらに画像符号化装置10は、特徴量生成部31、参照ピクチャリスト作成部35、イントラ予測部41、動き予測・補償部42、予測画像・最適モード選択部43を備えている。
図2は、画像符号化装置10の構成を例示している。画像符号化装置10は、アナログ/ディジタル変換部(A/D変換部)11、画面並び替えバッファ12、減算部13、直交変換部14、量子化部15、可逆符号化部16、蓄積バッファ17、レート制御部18を備えている。また、画像符号化装置10は、逆量子化部21、逆直交変換部22、加算部23、デブロッキングフィルタ24、フレームメモリ25を有している。さらに画像符号化装置10は、特徴量生成部31、参照ピクチャリスト作成部35、イントラ予測部41、動き予測・補償部42、予測画像・最適モード選択部43を備えている。
A/D変換部11は、アナログの画像信号をディジタルの画像データに変換して画面並べ替えバッファ12に出力する。
画面並べ替えバッファ12は、A/D変換部11から出力された画像データに対してフレームの並べ替えを行う。画面並べ替えバッファ12は、符号化処理に係るGOP(Group of Pictures)構造に応じてフレームの並べ替えを行い、並べ替え後の画像データを減算部13とイントラ予測部41および動き予測・補償部42に出力する。
減算部13には、画面並べ替えバッファ12から出力された画像データと、後述する予測画像・最適モード選択部43で選択された予測画像データが供給される。減算部13は、画面並べ替えバッファ12から出力された画像データと予測画像・最適モード選択部43から供給された予測画像データとの差分を示す予測誤差データを算出して、直交変換部14に出力する。
直交変換部14は、減算部13から出力された予測誤差データに対して、離散コサイン変換(DCT;Discrete Cosine Transform)、カルーネン・レーベ変換等の直交変換処理を行う。直交変換部14は、直交変換処理を行うことにより得られた変換係数データを量子化部15に出力する。
量子化部15には、直交変換部14から出力された変換係数データと、後述するレート制御部18からレート制御信号が供給されている。量子化部15は変換係数データの量子化を行い、量子化データを可逆符号化部16と逆量子化部21に出力する。また、量子化部15は、レート制御部18からのレート制御信号に基づき量子化パラメータ(量子化スケール)を切り替えて、量子化データのビットレートを変化させる。
可逆符号化部16には、量子化部15から出力された量子化データと、後述するイントラ予測部41と動き予測・補償部42および予測画像・最適モード選択部43から予測モード情報が供給される。なお、予測モード情報には、符号化対象ブロックのブロックサイズを示すマクロブロックタイプ、予測モード等が含まれる。可逆符号化部16は、量子化データに対して例えば可変長符号化または算術符号化等により符号化処理を行い、符号化ストリームを生成して蓄積バッファ17に出力する。また、可逆符号化部16は、予測モード情報等を可逆符号化して、符号化ストリームの例えばヘッダ情報に付加する。さらに、可逆符号化部16は、参照ピクチャを指定するための情報を符号化して符号化ストリームに含める。
蓄積バッファ17は、可逆符号化部16からの符号化ストリームを蓄積する。また、蓄積バッファ17は、蓄積した符号化ストリームを伝送路に応じた伝送速度で出力する。
レート制御部18は、蓄積バッファ17の空き容量の監視を行い、空き容量に応じてレート制御信号を生成して量子化部15に出力する。レート制御部18は、例えば蓄積バッファ17から空き容量を示す情報を取得する。レート制御部18は、空き容量が少なくなっている場合、レート制御信号によって量子化データのビットレートを低下させる。また、レート制御部18は蓄積バッファ17の空き容量が十分大きい場合、レート制御信号によって量子化データのビットレートを高くする。
逆量子化部21は、量子化部15から供給された量子化データの逆量子化処理を行う。逆量子化部21は、逆量子化処理を行うことで得られた変換係数データを逆直交変換部22に出力する。
逆直交変換部22は、逆量子化部21から供給された変換係数データの逆直交変換処理を行うことで得られたデータを加算部23に出力する。
加算部23は、逆直交変換部22から供給されたデータと予測画像・最適モード選択部43から供給された予測画像データを加算して参照ピクチャの画像データを生成して、この画像データをデブロッキングフィルタ24とイントラ予測部41に出力する。
デブロッキングフィルタ24は、画像の符号化時に生じるブロック歪みを減少させるためのフィルタ処理を行う。デブロッキングフィルタ24は、加算部23から供給された画像データからブロック歪みを除去するフィルタ処理を行い、フィルタ処理後の画像データをフレームメモリ25に出力する。
フレームメモリ25は、デブロッキングフィルタ24から供給されたフィルタ処理後の画像データと、ベースビューの符号化を行う画像符号化装置から供給された参照ピクチャの画像データを保持する。
特徴量生成部31は、時間予測と視点予測のいずれがピクチャにおいて支配的であるかを示す特徴量の生成を行う。特徴量は、例えばディペンデントビューのブロック符号化を行う場合、時間方向の参照ピクチャを用いる時間予測のブロックと視点の異なる参照ピクチャを用いる視差予測のブロックのいずれがピクチャ内で多いかを示す情報である。特徴量生成部31は、ピクチャにおける視差予測のブロックと時間予測のブロックとの割合を特徴量として算出する。また、特徴量生成部31は、参照ピクチャを用いてブロック単位で動き予測を行い予測誤差(ME誤差)を算出して、1ピクチャにおけるME誤差を特徴量として用いる。このようにして特徴量生成部31は特徴量の生成を行い、生成した特徴量を参照ピクチャリスト作成部35に出力する。
参照ピクチャリスト作成部35は、特徴量生成部31で生成された特徴量に基づき、参照ピクチャの参照ピクチャリストを更新する。具体的には、参照ピクチャリスト作成部35は、特徴量に基づき参照ピクチャリストの更新を行い、支配的である予測で用いる参照ピクチャに対して符号長の短いインデックスを割り当てた参照ピクチャリストとする。
参照ピクチャリスト作成部35は、例えば特徴量として視差予測のブロックと時間予測のブロックとの割合が用いられる場合、割合の多い予測で用いられる参照ピクチャに符号長の短いインデックスを割り当てた参照ピクチャリストとする。また、参照ピクチャリスト作成部35は、例えば特徴量としてME残差が用いられる場合、ME残差が少なくなる参照ピクチャに対して符号長の短いインデックスを割り当てた参照ピクチャリストとする。なお、参照ピクチャリスト作成部35は、最初のピクチャの符号化において、予め決定されている初期参照ピクチャリストを用いる。
イントラ予測部41は、画面並べ替えバッファ12から出力された符号化対象ピクチャの画像データと加算部23から供給された画像データを用いて、候補となるすべてのイントラ予測モードでイントラ予測処理を行う。さらに、イントラ予測部41は、各イントラ予測モードに対してコスト関数値を算出して、算出したコスト関数値が最小となるイントラ予測モード、すなわち符号化効率が最良となるイントラ予測モードを、最適イントラ予測モードとして選択する。イントラ予測部41は、最適イントラ予測モードで生成された予測画像データと最適イントラ予測モードに関する予測モード情報、および最適イントラ予測モードでのコスト関数値を予測画像・最適モード選択部43に出力する。また、イントラ予測部41は、コスト関数値の算出で用いる発生符号量を得るため、各イントラ予測モードのイントラ予測処理において、イントラ予測モードに関する予測モード情報を可逆符号化部16に出力する。なお、コスト関数値の生成としては、例えばJM(Joint Model)と呼ばれるH.264AVCの参照ソフトウェアに実装されている方法を挙げることができる。
動き予測・補償部42は、符号化対象ブロックのブロックサイズ毎に動き予測・補償処理を行う。動き予測・補償部42は、画面並べ替えバッファ12から読み出された画像における各ブロックサイズの画像毎に、フレームメモリ25から読み出されたデブロックフィルタ処理後の画像データやベースビューの画像データを用いて動きベクトルを検出する。さらに、動き予測・補償部42は、検出した動きベクトルに基づいて参照ピクチャに動き補償処理を施して予測画像の生成を行う。
また、動き予測・補償部42は、符号化対象ブロックのブロックサイズおよび参照ピクチャ毎にコスト関数値を生成して、コスト関数値が最小となるブロックサイズと参照ピクチャを、最適インター予測モードとして選択する。動き予測・補償部42は、最適インター予測モードで生成された予測画像データと最適インター予測モードに関する予測モード情報、および最適インター予測モードでのコスト関数値を予測画像・最適モード選択部43に出力する。また、動き予測・補償部42は、コスト関数値の生成で用いる発生符号量を得るため、各ブロックサイズでのインター予測処理において、インター予測モードに関する予測モード情報を可逆符号化部16に出力する。
予測画像・最適モード選択部43は、イントラ予測部41から供給されたコスト関数値と動き予測・補償部42から供給されたコスト関数値を比較して、コスト関数値が少ない方を、符号化効率が最良となる最適モードとして選択する。また、予測画像・最適モード選択部43は、最適モードで生成した予測画像データを減算部13と加算部23に出力する。さらに、予測画像・最適モード選択部43は、最適モードの予測モード情報(マクロブロックタイプ、予測モード、インデックス等)を可逆符号化部16に出力する。なお、予測画像・最適モード選択部43は、ピクチャ単位やスライス単位でイントラ予測またはインター予測を行う。
なお、視点の異なる画像がフレーム単位で切り替えられるフレームシーケンシャル−AVC方式の画像データを符号化する場合、特徴量生成部31は、入力された画像データから抽出した他の視点の画像データを用いて特徴量の生成を行う。また、フレームメモリ25には、入力された画像データから抽出した他の視点の画像データ、または他視点の画像データの符号化によって生成された参照ピクチャの画像データを記憶させる。このような処理を行うことで、FS(Frame Sequential)方式の画像データの符号化も可能である。
<2.画像符号化装置の第1の動作>
次に画像符号化装置の第1の動作について説明する。画像の符合化において、視差予測または時間予測の割合は、同一シーン内で似た傾向を持つ。したがって、第1の動作では、符号化対象ピクチャの符号化において、この符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、参照ピクチャの参照ピクチャリストを更新することで、多視点画像の符号化効率を向上させる。また、第1の動作では、特徴量として、符号化対象ピクチャの直前に符号化されたピクチャにおいて視差予測が行われたブロックと時間予測が行われたブロックの割合を示す情報を用いた場合を示している。
次に画像符号化装置の第1の動作について説明する。画像の符合化において、視差予測または時間予測の割合は、同一シーン内で似た傾向を持つ。したがって、第1の動作では、符号化対象ピクチャの符号化において、この符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、参照ピクチャの参照ピクチャリストを更新することで、多視点画像の符号化効率を向上させる。また、第1の動作では、特徴量として、符号化対象ピクチャの直前に符号化されたピクチャにおいて視差予測が行われたブロックと時間予測が行われたブロックの割合を示す情報を用いた場合を示している。
視差予測が行われたブロックと時間予測が行われたブロックの割合を示す情報とは、例えば各マクロブロックが各参照ピクチャに割り当てられたインデックスref_idxを選択した割合を意味する。具体的には、符合化対象ピクチャの符号化前に符号化されたピクチャにおいて、視差方向の参照ピクチャを選択したマクロブロックが2割、時間方向の参照ピクチャを選択したマクロブロックが7割、イントラ予測のマクロブロックが1割であるとする。この場合、視差予測と時間予測の割合は、「2:7」となる。
図3は、符号化対象ピクチャ毎の処理を示すフローチャートである。
ステップST11で画像符号化装置10は、視差予測を利用するか否か判別する。画像符号化装置10は、視差予測を利用する場合にはステップST12に進み、視差予測を利用しない場合にはステップST19に進む。
ステップST12で画像符号化装置10は、符号化対象ピクチャが最初のインターピクチャであるか判別する。画像符号化装置10は、符号化対象ピクチャが最初のインターピクチャである場合にはステップST13に進み、最初のインターピクチャでない場合はステップST14に進む。
ステップST13で画像符号化装置10は、固定パターンで参照ピクチャリストを決定する。画像符号化装置10は、符号化対象ピクチャが最初のピクチャであり、直前に符合化したピクチャにおける視差予測と時間予測の割合が得られていないことから、予め設定されている固定のパターンの初期参照ピクチャリストを決定してステップST15に進む。
ステップST14で画像符号化装置10は、参照ピクチャリストを更新する。画像符号化装置10は、符号化対象ピクチャが最初のピクチャでないことから、直前に符合化したピクチャにおける視差予測と時間予測の割合が得られている。したがって、画像符号化装置10は、直前に符合化したピクチャにおける視差予測と時間予測の割合に基づき、参照ピクチャリストを更新してステップST15に進む。具体的には、割合の多い予測で用いられる参照ピクチャに対して符号長の短いインデックスを割り当てた参照ピクチャリストに更新する。
ステップST15で画像符号化装置10は、符号化処理を行う。画像符号化装置10は、符号化対象ピクチャの符号化処理を行いステップST16に進む。
ステップST16で画像符号化装置10は、視差予測と時間予測の割合を計算する。画像符号化装置10は、符号化対象ピクチャの符号化処理において、視差予測が行われたマクロブロックと時間予測が行われたマクロブロックの割合から、視差予測と/時間予測の割合を算出する。また、画像符号化装置は、算出した割合を次の符号化対象ピクチャで利用できるように記憶してステップST17に進む。
ステップST17で画像符号化装置10は、参照ピクチャリストが割合の多い予測の順であるか判別する。画像符号化装置10は、参照ピクチャリストが割合の多い予測の順のリストである場合、符号化対象ピクチャの符号化処理を終了する。また、画像符号化装置10は、参照ピクチャリストが割合の多い予測の順でない場合、ステップST18に進む。
ステップST18で画像符号化装置10は、参照ピクチャリストを割合が多い予測の順のリストに更新する。すなわち、画像符号化装置10は、割合の多い予測で用いられる参照ピクチャに対して符号長の短いインデックスを割り当てた参照ピクチャリストに更新してステップST15に戻り、符号化処理を再度行う。
なお、視差予測を利用しないためステップST1からステップST19に進むと、画像符号化装置10は、視差予測を利用しない従来の符号化処理を行う。
このような符号化処理を行うと、例えば同一シーンであるため視差予測と時間予測の割合の変化が少ない場合は、符号化処理が繰り返し行われない。したがって、画像符号化装置10は、符合化効率を落とさずに符号化処理を高速化に行うことができる。また、割合の多い予測が変更された場合、参照ピクチャリストが割合に応じて更新されて符号化処理が再度行われるので、画像符号化装置10は、符号化効率の高い符号化処理を行うことができる。
ところで、図3に示す処理では、視差予測と時間予測の割合の変化が多い場合は、符号化処理の繰り返しが多くなって、符号化処理に時間を要してしまう。そこで、画像符号化装置10は、図4に示すように、図3におけるステップST17とステップST18の処理を行わないようにすれば、視差予測と時間予測の割合の変化が多い場合でも、符号化処理に要する時間が長くなってしまうことを防止できる。なお、図4に示す処理は、図3に示す処理に比べて符号化効率が低下する場合がある。例えば、符号化処理を繰り返さない場合は、時間予測の割合が多いシーンと視差予測の割合が多いシーンが含まれる場合に、いずれかのシーンの符合化効率が図3に示す処理に比べて低下する。
<3.画像符号化装置の第2の動作>
次に、第2の動作では、符号化対象ピクチャが双予測ピクチャ(Bピクチャ)である場合について説明する。符号化対象ピクチャがBピクチャである場合、画像符号化装置10は、Bピクチャに関して、視差予測と時間予測の割合を示す情報に基づき、参照ピクチャリストL0,L1の更新を行う。なお、参照ピクチャリストL0はLO予測の参照ピクチャのインデックス、参照ピクチャリストL1はL1予測の参照ピクチャのインデックスを示すリストである。
次に、第2の動作では、符号化対象ピクチャが双予測ピクチャ(Bピクチャ)である場合について説明する。符号化対象ピクチャがBピクチャである場合、画像符号化装置10は、Bピクチャに関して、視差予測と時間予測の割合を示す情報に基づき、参照ピクチャリストL0,L1の更新を行う。なお、参照ピクチャリストL0はLO予測の参照ピクチャのインデックス、参照ピクチャリストL1はL1予測の参照ピクチャのインデックスを示すリストである。
Bピクチャの場合、視差の参照ピクチャは、参照ピクチャリストL0,L1のどちらか一方に入れることができる。したがって、初期参照ピクチャリストでは、常に参照ピクチャリストL0,L1のいずれか一方に視差の参照ピクチャを入れる。また、第2の動作では、参照ピクチャリストの更新を行い、時間方向の各参照ピクチャの動き予測の予測誤差(ME残差)が最も小さい参照ピクチャは、視差方向の参照ピクチャを含む参照ピクチャリストと異なる参照ピクチャリストに割り当てる。このように参照ピクチャの割り当てを行うと、最も参照される時間予測の参照ピクチャと視差予測の参照ピクチャの両方を利用した予測(Bi Direction)が可能となり、符合化効率を上げることができる。
また、Bピクチャにおいても視差予測と時間予測の割合は、同一シーン内で似た傾向を持つ。したがって、時間方向の参照ピクチャでME残差が最も小さい参照ピクチャを、視差方向の参照ピクチャを含む参照ピクチャリストと異なる参照ピクチャリストに割り当てる。このように参照ピクチャリストの割り当てを行い、前述の第1の動作と同様に視差予測と時間予測の割合に応じて参照ピクチャリストを更新することで、第1の動作と同様な効果が期待できる。
さらに、第2の動作では、時間方向の各参照ピクチャのME残差を計算することから、視差方向の参照ピクチャを用いてME残差の算出も行えば、時間予測だけでなく視差予測も含めてME残差の小さい順に参照ピクチャリストを割り当てることができる。
図5は、符号化対象ピクチャが双予測ピクチャである場合の符号化処理を示すフローチャートである。
ステップST21で画像符号化装置10は、符号化対象ピクチャがBピクチャであるか判別する。画像符号化装置10は、符号化対象ピクチャがBピクチャである場合にステップST22に進み、Bピクチャでない場合にステップST31に進む。
ステップST22で画像符号化装置10は、視差予測を利用するか判別する。画像符号化装置10は符号化処理で視差予測も利用する場合にステップST23に進み、視差予測を利用しない場合にはステップST31に進む。
ステップST23で画像符号化装置10は、符号化対象ピクチャが最初のBピクチャであるか判別する。画像符号化装置10は、符号化対象ピクチャが最初のBピクチャである場合にはステップST24に進み、最初のBピクチャでない場合にはステップST25に進む。
ステップST24で画像符号化装置10は、初期参照ピクチャリストL0,L1を決定する。画像符号化装置10は、符号化対象ピクチャが最初のBピクチャであり、ME残差が算出されていないことから、予め設定されている所定パターンの初期参照ピクチャリストL0,L1を決定してステップST29に進む。
ステップST25で画像符号化装置10は、ME残差が最も小さい時間方向の参照ピクチャはL0予測であるか判別する。画像符号化装置10は、ME残差が最も小さい時間方向の参照ピクチャが参照ピクチャリストL0に含まれる場合にステップST26に進み、参照ピクチャリストL0に含まれない場合にステップST27に進む。
ステップST26で画像符号化装置10は参照ピクチャリストL1に視差方向の参照ピクチャを割り当ててステップST28に進む。
ステップST27で画像符号化装置10は参照ピクチャリストL0に視差方向の参照ピクチャを割り当ててステップST28に進む。
ステップST28で画像符号化装置10は、視差予測と時間予測の割合の多い順、またはME残差の小さい順に参照ピクチャリストを決定してステップST29に進む。
ステップST29で画像符号化装置10は、符号化処理を行う。画像符号化装置10は、符号化対象ピクチャの符号化処理を行いステップST30に進む。
ステップST30で画像符号化装置10は、視差予測と時間予測の割合およびME残差を計算する。画像符号化装置10は、符号化対象ピクチャの符号化処理において、符号化対象ピクチャの各マクロブロックにおいて、視差方向の参照ピクチャと時間方向の参照ピクチャのいずれが参照されているかに基づき、視差予測と時間予測の割合を算出する。また、画像符号化装置10は、符号化対象ピクチャの符号化処理におけるME残差を計算する。さらに、画像符号化装置10は、算出した割合とME残差を次の符号化対象ピクチャで利用できるように記憶して符号化対象ピクチャの符号化処理を終了する。
また、符号化対象ピクチャがBピクチャでない場合、および視差予測を利用しない場合、画像符号化装置10はステップST31で従来と同様の符号化処理を行う。
このような符号化処理を行うと、画像符号化装置10は、第1の動作と同様な効果を得ることができる。さらに、画像符号化装置10は、双予測ピクチャについてL0予測とL1予測を行う場合にも、符号化効率が高くなるように参照ピクチャリストL0,L1を決定できる。なお、第2の動作では、第1の動作を組み合わせて行うようにしてもよい。
<4.画像符号化装置の動作例>
図6は、画像符号化装置の具体的動作を例示している。例えば、Cam0は左側からの視点の画像データ、Cam1は右側からの視点の画像データとする。また、Cam1の画像データは、Cam0の画像データを参照ピクチャの画像データとして用いて符号化を行うディペンデントビュー(Dependent View)の画像データとする。さらに、ディペンデントビューの画像データを符号化するときに参照される画像データを、ベースビュー(Base View)の画像データという。
図6は、画像符号化装置の具体的動作を例示している。例えば、Cam0は左側からの視点の画像データ、Cam1は右側からの視点の画像データとする。また、Cam1の画像データは、Cam0の画像データを参照ピクチャの画像データとして用いて符号化を行うディペンデントビュー(Dependent View)の画像データとする。さらに、ディペンデントビューの画像データを符号化するときに参照される画像データを、ベースビュー(Base View)の画像データという。
Cam1の画像データにおける片方向予測ピクチャ(Pピクチャ)において、例えば参照ピクチャリストL0(LIST_0)は、実線の矢印で示すように、前方向予測で参照するCam1のPピクチャと視差予測で参照するCam0のPピクチャを参照ピクチャとする。ただし、GOP先頭のアンカーPピクチャに関しては、前方向予測で参照するPピクチャはないので、視差予測で参照するCam0のPピクチャのみを参照ピクチャとする。
Bピクチャにおいて、参照ピクチャリストL0(LIST_0)は、実線の矢印で示すように、前方向予測で参照するCam1のPピクチャと視差予測で参照するCam0のBピクチャを参照ピクチャとする。また、参照ピクチャリストL1(LIST_1)は、点線の矢印で示すように後方向予測で参照するCam1のPピクチャと視差予測で参照するCam0のBピクチャを参照ピクチャとする。ただし、視差予測で参照するCam0のBピクチャは、参照ピクチャリストL0,L1のいずれか一方にしか割り当てることができない。
LIST_X(Xは0または1)で使用可能な2枚の参照ピクチャは、インデックスref_idxという番号で管理されており、「0」以上の値が割り当てられる。また、インデックスref_idxは、可変長符号化されて符号化後の画像データに含められる。 なお、図6のCam1のP2ピクチャでは、時間予測の参照ピクチャに対してインデックスref_idx=0、視差予測の参照ピクチャに対してインデックスref_idx=1を割り当てた場合を例示している。また、インデックスref_idxの可変長符号化では、例えばインデックスref_idx=1よりもインデックスref_idx=0の符号長が短くされている。
以上の前提の基で、例えばCam1のP2ピクチャの視差予測と時間予測の割合が70/30(%)とすると、視差を参照する割合が多い。したがって、Cam1における次のP4ピクチャの参照ピクチャリストは、視差予測の参照ピクチャに対してインデックスref_idx=0、時間予測の参照ピクチャに対してインデックスref_idx=1を割り当てる。
次に、例えばCam1のB1ピクチャにおいて、参照ピクチャリストL0(LIST_0)の時間方向の参照ピクチャのME残差を「1000」、参照ピクチャリストL1(LIST_1)の時間方向の参照ピクチャのME残差を「800」とする。この場合、時間方向のME残差は、参照ピクチャリストL1の方向が小さいので、Cam1のB3ピクチャでは、ME残差が小さい方向の参照ピクチャにインデックスref_idx=0を割り当てる。さらに、例えば視差予測と時間予測の割合を70/30(%)とすると、視差を参照する割合が多い。したがって、Cam1のB3ピクチャの参照ピクチャリストL0(LIST_0)は、視差予測の参照ピクチャに対してインデックスref_idx=0、時間予測の参照ピクチャに対してインデックスref_idx=1を割り当てる。また、視差方向の参照ピクチャのME残差を利用して、参照ピクチャリストを決定してもよい。例えば、視差方向の参照ピクチャのME残差を「500」とすると、ME残差は視差方向の参照ピクチャの方が小さい。したがって、Cam1のB3ピクチャの参照ピクチャリストL0(LIST_0)は、視差予測の参照ピクチャに対してインデックスref_idx=0、時間予測の参照ピクチャに対してインデックスref_idx=1を割り当てる。
次に、Cam1のB3ピクチャにおいて、参照ピクチャリストL0(LIST_0)の時間方向の参照ピクチャのME残差を「1000」、参照ピクチャリストL1(LIST_1)の時間方向の参照ピクチャのME残差を「1500」とする。この場合、時間方向のME残差は参照ピクチャリストL0(LIST_0)の方向が小さいので、Cam1における次のB5ピクチャの視差方向の参照ピクチャは、参照ピクチャリストL1(LIST_1)に割り当てる。さらに、例えば視差予測と時間予測の割合を60/40(%)とすると、視差予測の割合が多い。したがって、Cam1のB5ピクチャの参照ピクチャリストL1(LIST_1)では、視差予測の参照ピクチャに対してインデックスref_idx=0、時間予測の参照ピクチャに対してインデックスref_idx=1を割り当てる。ここでも、視差方向の参照ピクチャのME残差を利用して、参照ピクチャリストL1(LIST_1)のインデックスの割り当てを行うようにしてもよい。例えば、視差方向の参照ピクチャのME残差を「700」とすると、ME残差は視差方向の参照ピクチャの方が小さい。この場合、Cam1のB5ピクチャの参照ピクチャリストL1(LIST_1)は、視差予測の参照ピクチャに対してインデックスref_idx=0、時間予測の参照ピクチャに対してインデックスref_idx=1を割り当てる。
このように、第1の動作と第2の動作を行い、特徴量に基づき参照ピクチャリストを更新することで、割合の多い予測の参照ピクチャやME残差の少ない参照ピクチャに対して値の小さいインデックスを割り当てることができる。したがって、画像符号化装置10は、符号化効率を高めることができる。
<5.画像符号化装置の第3の動作>
ところで、参照ピクチャと符号化対象ピクチャのブロックとのME残差が十分に小さければ、符合化歪みもほとんどないと考えられるので、符号化対象ピクチャの当該ブロックと残りの参照ピクチャとの動き予測を行う必要がない。したがって、視差予測と時間予測の割合を示す情報に基づき、どのような順番で動き予測を行うか決定して、ME誤差に基づき動き予測の打ち切りを行えば、不要な動き予測をスキップさせて、符号化処理を高速化できる。
ところで、参照ピクチャと符号化対象ピクチャのブロックとのME残差が十分に小さければ、符合化歪みもほとんどないと考えられるので、符号化対象ピクチャの当該ブロックと残りの参照ピクチャとの動き予測を行う必要がない。したがって、視差予測と時間予測の割合を示す情報に基づき、どのような順番で動き予測を行うか決定して、ME誤差に基づき動き予測の打ち切りを行えば、不要な動き予測をスキップさせて、符号化処理を高速化できる。
ここで、視差予測と時間予測のいずれか割合が多い順から動き予測を行うと、符合化歪みが少ない順に動き予測を行う場合に近い効果が得られるので、残りの参照ピクチャを用いた動き予測をスキップできる確率が高くなり、高速化が期待できる。また、マクロブロック毎に直前のピクチャが参照する参照ピクチャが視差予測と時間予測のどちらが選択されているかを示す情報を保持しておく。このように選択された予測を示す情報を保持しておき、次のピクチャでマクロブロック毎に、直前のピクチャにおける同位置のマクロブロックで選択した予測に対応する参照ピクチャを最初に用いて動き予測を行う。このように動き予測を行えば、画像符号化装置10では、残りの動き予測をスキップできる確率が高くなり、高速化が期待できる。
図7は、視差予測と時間予測の割合を示す情報に基づいて符号化処理の高速化をはかる場合の動作を示すフローチャートである。
ステップST41で画像符号化装置10は、参照ピクチャリストの並べ替えを行う。画像符号化装置10は、符号化対象ピクチャの符号化前に符号化されたピクチャにおいて、割合が多い予測の順に参照ピクチャリストの並べ替えを行ってステップST42に進む。
ステップST42で画像符号化装置10は、参照ピクチャリスト順に動き予測を行いステップST43に進む。
ステップST43で画像符号化装置10は、最後の参照ピクチャの動き予測であるか判別する。画像符号化装置10は、動き予測に用いた参照ピクチャが最後の参照ピクチャであるときはステップST45に進み、最後の参照ピクチャでないときはステップST44に進む。
ステップST44で画像符号化装置10は、ME残差が閾値以下であるか判別する。画像符号化装置10は、ME残差が予め設定されている閾値以下の場合、すなわち符合化歪みがほとんどないと考えられる場合、ステップST45に進む。また、画像符号化装置10は、ME残差が閾値よりも大きい場合、ステップST42に戻る。
ステップST45で画像符号化装置10は、符号化処理を行いステップST46に進む。
ステップST46で画像符号化装置10は、割合が多い参照ピクチャの順番を計算する。画像符号化装置10は、次の符号化対象ピクチャの符号化において、割合が多い予測の順に参照ピクチャリストの並べ替えを行うことができるように、視差予測と時間予測の割合を算出して、割合が多い予測の順に参照ピクチャの順番を記憶する。
このように、画像符号化装置10は、符号化対象ピクチャの符号化前、例えば直前に符号化されたピクチャにおいて割合が多い予測の順に参照ピクチャリストの並べ替えを行う。さらに、画像符号化装置10は、並べ替え後の参照ピクチャリストの順に動き予測を行うことで、ME残差が十分に小さくなる参照ピクチャの検出を速やかに行うことが可能となる。また、ME残差が十分に小さくなる参照ピクチャが検出されると動き予測がスキップされるので、画像符号化装置10は、符号化処理を高速化できる。
図8は、マクロブロック毎にいずれの参照ピクチャが参照されているかを示す情報に基づいて符号化処理の高速化をはかる場合の動作を示すフローチャートである。
ステップST51で画像符号化装置10は、直前に符号化されたピクチャで選択されたインデックスを利用して動き予測を行う。画像符号化装置10は、直前に符号化されたピクチャにおける同位置のマクロブロックで選択されたインデックスを利用して、このインデックスが示す参照ピクチャを用いて動き予測を行いステップST52に進む。
ステップST52で画像符号化装置10は、ME残差が閾値以下であるか判別する。画像符号化装置10は、ME残差が予め設定された閾値以下である場合にはステップST56に進み、閾値よりも大きい場合にはステップST53に進む。
ステップST53で画像符号化装置10は、残りの参照ピクチャを用いて動き予測を行う。画像符号化装置10は、動き予測に用いられていない参照ピクチャを参照ピクチャリストの順に用いて動き予測を行い、ME残差が最も少なくなる参照ピクチャを選択してステップST56に進む。
ステップST56で画像符号化装置10は、選ばれた参照ピクチャのインデックスを保存する。画像符号化装置10は、直前に符号化されたピクチャで選択されたインデックスの参照ピクチャ、またはME誤差が閾値以下であるとき選択されている参照ピクチャを示すインデックスを保存して、ステップST57に進む。
ステップST57で画像符号化装置10は、符号化処理を行う。画像符号化装置10は、選択された参照ピクチャを用いて符号化処理を行い、マクロブロックの符号化を終了する。
このように、画像符号化装置10は、マクロブロック毎に、直前に符号化されたピクチャで選択された参照ピクチャのインデックスを利用して動き予測を行う。したがって、画像が類似している場合にはインデックスで示された参照ピクチャ以外の参照ピクチャを用いて動き予測を行う必要がないので、画像符号化装置10は、符号化処理を高速化できる。
図9は、視差予測と時間予測の割合を示す情報と、マクロブロック毎に選択された参照ピクチャを示す情報に基づいて符号化処理の高速化をはかる場合の動作を示すフローチャートである。なお、図9において、図7および図8と対応する処理については同一の番号を付している。
ステップST41で画像符号化装置10は、参照ピクチャリストの並べ替えを行う。画像符号化装置10は、符号化対象ピクチャの符号化前に符号化されたピクチャにおいて、割合が多い予測の順に参照ピクチャリストの並べ替えを行って、符号化対象ピクチャのマクロブロック毎の処理を行う。マクロブロック毎の処理のステップST51で画像符号化装置10は、直前に符号化されたピクチャで選択されたインデックスを利用して動き予測を行いステップST52に進む。
ステップST52で画像符号化装置10は、ME残差が閾値以下であるか判別する。画像符号化装置10は、ME残差が予め設定された閾値以下である場合にはステップST56に進み、閾値よりも大きい場合にはステップST53に進む。
ステップST53で画像符号化装置10は、残りの参照ピクチャを用いて動き予測を行う。画像符号化装置10は、動き予測に用いられていない参照ピクチャを参照ピクチャリストの順に用いて動き予測を行い、ME残差が最も少なくなる参照ピクチャを選択してステップST54に進む。
ステップST54で画像符号化装置10は、最後の参照ピクチャの動き予測であるか判別する。画像符号化装置10は、動き予測に用いた参照ピクチャが最後の参照ピクチャである場合はステップST56に進み、最後の参照ピクチャでない場合はステップST55に進む。
ステップST55で画像符号化装置10は、ME残差が閾値以下であるか判別する。画像符号化装置10は、ME残差が閾値以下の場合にはステップST56に進み、閾値よりも大きい場合はステップST53に戻る。
ステップST56で画像符号化装置10は、選ばれた参照ピクチャのインデックスを保存する。画像符号化装置10は、直前に符号化されたピクチャで選択されたインデックスの参照ピクチャ、またはME誤差が閾値以下であるとき選択されている参照ピクチャを示すインデックスを保存して、ステップST57に進む。
ステップST57で画像符号化装置10は、符号化処理を行う。画像符号化装置10は、選択された参照ピクチャを用いて符号化処理を行う。
このようなマクロブロック毎の符号化を行い、符号化対象ピクチャのすべてのマクロブロックについて符号化が終了した場合、ステップST46に進む。
ステップST46で画像符号化装置10は、割合が多い参照ピクチャの順番を計算する。画像符号化装置10は、次の符号化対象ピクチャの符号化において、割合が多い予測の順に参照ピクチャリストの並べ替えを行うことができるように、視差予測と時間予測の割合を算出して、割合が多い予測の順に参照ピクチャの順番を記憶する。
以上のような処理をピクチャ毎に行うと、ME残差が閾値以下であるときは、新たな参照ピクチャを用いた動き予測がスキップされるので、符号化対象ピクチャの符号化に要する時間を短くすることが可能となる。したがって、画像符号化装置10は、符合化効率を落とさずに符号化を高速に行うことができる。
<5.ソフトウェア処理の場合>
上述の一連の処理は、ハードウェア、またはソフトウェア、または両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させる。または、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることも可能である。
上述の一連の処理は、ハードウェア、またはソフトウェア、または両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させる。または、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることも可能である。
図10は、上述した一連の処理をプログラムにより実行するコンピュータ装置の構成を例示した図である。コンピュータ装置80のCPU801は、ROM802、または記録部808に記録されているコンピュータ・プログラムにしたがって各種の処理を実行する。
RAM803には、CPU801が実行するコンピュータ・プログラムやデータなどが適宜記憶される。これらのCPU801、ROM802、およびRAM803は、バス804により相互に接続されている。
CPU801にはまた、バス804を介して入出力インタフェース805が接続されている。入出力インタフェース805には、タッチパネルやキーボード、マウス、マイクロホンなどの入力部806、ディスプレイなどよりなる出力部807が接続されている。CPU801は、入力部806から入力される指令に対応して各種の処理を実行する。そして、CPU801は、処理の結果を出力部807に出力する。
入出力インタフェース805に接続されている記録部808は、例えばハードディスクからなり、CPU801が実行するコンピュータ・プログラムや各種のデータを記録する。通信部809は、インターネットやローカルエリアネットワークなどのネットワークやディジタル放送といった有線または無線の通信媒体を介して外部の装置と通信する。また、コンピュータ装置80は、通信部809を介してコンピュータ・プログラムを取得し、ROM802や記録部808に記録してもよい。
ドライブ810は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディア85が装着された場合、それらを駆動して、記録されているコンピュータ・プログラムやデータなどを取得する。取得されたコンピュータ・プログラムやデータは、必要に応じてROM802やRAM803または記録部808に転送される。
CPU801は、上述した一連の処理を行うコンピュータ・プログラムを読み出して実行して、記録部808やリムーバブルメディア85に記録されている画像信号や、通信部809を介して供給された画像信号に対する符号化を行う。なお、各種の処理は、記載にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
また、本技術は、上述した実施の形態に限定して解釈されるべきではない。例えば、直前に符号化された1つのピクチャから特徴量を算出する場合に限らず、直前に符号化された複数のピクチャから特徴量を算出するようにしてもよい。この場合には、直前に符号化された1つのピクチャでノイズ等の影響が生じても、複数のピクチャを用いて特徴量を算出することで、ノイズ等の影響を軽減できる。この技術の実施の形態は、例示という形態で本技術を開示しており、本技術の要旨を逸脱しない範囲で当業者が実施の形態の修正や代用をなし得ることは自明である。すなわち、本技術の要旨を判断するためには、特許請求の範囲を参酌すべきである。
この技術の画像符号化装置と画像符号化方法およびプログラムでは、ピクチャの符号化で時間方向の参照ピクチャを用いる時間予測と視点の異なる参照ピクチャを用いる視差予測のいずれが支配的であるかを示す特徴量が生成される。また、符号化対象ピクチャの符号化では、符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、参照ピクチャの参照ピクチャリストが更新される。したがって、多視点画像の符号化において、参照ピクチャに対して符号量が少なくなるようにインデックスを割り当てることが可能となり、符号化効率を向上できることから撮像装置や画像編集装置等に適している。
10・・・画像符号化装置、11・・・A/D変換部、12・・・画面並べ替えバッファ、13・・・減算部、14・・・直交変換部、15・・・量子化部、16・・・可逆符号化部、17・・・蓄積バッファ、18・・・レート制御部、21・・・逆量子化部、22・・・逆直交変換部、23・・・加算部、24・・・デブロッキングフィルタ、25・・・フレームメモリ、31・・・特徴量生成部、35・・・参照ピクチャリスト作成部、41・・・イントラ予測部、42・・・動き予測・補償部、43・・・予測画像・最適モード選択部、80・・・コンピュータ装置
Claims (11)
- ピクチャの符号化で視点の異なる参照ピクチャを用いる視差予測と時間方向の参照ピクチャを用いる時間予測のいずれが支配的であるかを示す特徴量を生成する特徴量生成部と、
符号化対象ピクチャの符号化において、該符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、前記参照ピクチャの参照ピクチャリストを更新する参照ピクチャリスト作成部と
を有する画像符号化装置。 - 前記参照ピクチャリスト作成部は、前記参照ピクチャリストの更新を行い、前記支配的である予測で用いる参照ピクチャに対して符号長の短いインデックスを割り当てる請求項1記載の画像符号化装置。
- 前記特徴量生成部は、ピクチャにおいて、前記視差予測を行うブロックと前記時間予測を行うブロックの割合を前記特徴量とする請求項2記載の画像符号化装置。
- 前記参照ピクチャを用いて動き予測を行う動き予測部を備え、
前記特徴量生成部は、前記符号化対象ピクチャが双予測ピクチャである場合、時間予測の参照ピクチャ毎に前記動き予測を行うことにより得られた参照ピクチャ毎の予測誤差を前記特徴量とする請求項2記載の画像符号化装置。 - 前記特徴量生成部は、前記視差予測の参照ピクチャを用いて動き予測を行うことにより得られた予測誤差をさらに前記特徴量とする請求項4記載の画像符号化装置。
- 前記参照ピクチャを用いて動き予測を行う動き予測部を備え、
前記動き予測部は、支配的である予測の順序で前記参照ピクチャを用いて動き予測を行い、予測誤差が予め設定した閾値以下である場合、前記符号化対象ピクチャにおける動き予測を終了する請求項1記載の画像符号化装置。 - 前記参照ピクチャを用いて動き予測を行う動き予測部を備え、
前記動き予測部は、前記符号化対象ピクチャの符号化直前に符号化されたピクチャにおいて、符号化対象のブロックと同位置であるブロックで選択されているインデックスで示された参照ピクチャを用いて動き予測を行う請求項1記載の画像符号化装置。 - 参照ピクチャを用いて動き予測を行う動き予測部を備え、
前記動き予測部は、前記同位置のブロックで選択されているインデックスで示された参照ピクチャを用いた動き予測における予測誤差が予め設定した閾値以下である場合、前記符号化対象のブロックにおける動き予測を終了する請求項7記載の画像符号化装置。 - 前記動き予測部は、前記同位置のブロックで選択されているインデックスで示された参照ピクチャを用いた動き予測における予測誤差が予め設定した閾値より大きい場合、前記インデックスに基づく順序で参照ピクチャを用いて動き予測を行う請求項8記載の画像符号化装置。
- ピクチャの符号化で視点の異なる参照ピクチャを用いる視差予測と時間方向の参照ピクチャを用いる時間予測のいずれが支配的であるかを示す特徴量を生成する工程と、
符号化対象ピクチャの符号化において、該符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、前記参照ピクチャの参照ピクチャリストを更新する工程と
を有する画像符号化方法。 - 画像の符号化をコンピュータで実行させるプロクラムであり、
ピクチャの符号化で視点の異なる参照ピクチャを用いる視差予測と時間方向の参照ピクチャを用いる時間予測のいずれが支配的であるかを示す特徴量を生成する手順と、
符号化対象ピクチャの符号化において、該符号化対象ピクチャの符号化前に符号化されたピクチャで生成された特徴量に基づき、前記参照ピクチャの参照ピクチャリストを更新する手順と
を前記コンピュータで実行させるプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011027386A JP2012169763A (ja) | 2011-02-10 | 2011-02-10 | 画像符号化装置と画像符号化方法およびプログラム |
US13/363,981 US20120207219A1 (en) | 2011-02-10 | 2012-02-01 | Picture encoding apparatus, picture encoding method, and program |
CN2012100239390A CN102638683A (zh) | 2011-02-10 | 2012-02-03 | 图片编码设备、图片编码方法和程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011027386A JP2012169763A (ja) | 2011-02-10 | 2011-02-10 | 画像符号化装置と画像符号化方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012169763A true JP2012169763A (ja) | 2012-09-06 |
Family
ID=46622905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011027386A Withdrawn JP2012169763A (ja) | 2011-02-10 | 2011-02-10 | 画像符号化装置と画像符号化方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20120207219A1 (ja) |
JP (1) | JP2012169763A (ja) |
CN (1) | CN102638683A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014091933A1 (ja) * | 2012-12-11 | 2014-06-19 | ソニー株式会社 | 符号化装置および符号化方法、並びに、復号装置および復号方法 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4102835A1 (en) | 2010-11-24 | 2022-12-14 | Velos Media International Limited | Motion vector calculation method, picture coding method, picture decoding method, motion vector calculation apparatus, and picture coding and decoding apparatus |
EP2665271A4 (en) * | 2011-01-12 | 2014-06-18 | Panasonic Corp | VIDEO ENCODING METHOD AND VIDEO DECODING METHOD |
JP6108309B2 (ja) | 2011-02-22 | 2017-04-05 | サン パテント トラスト | 動画像符号化方法、動画像符号化装置、動画像復号方法、および、動画像復号装置 |
WO2012117728A1 (ja) | 2011-03-03 | 2012-09-07 | パナソニック株式会社 | 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、及び動画像符号化復号装置 |
JP6046923B2 (ja) * | 2012-06-07 | 2016-12-21 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム |
CN108540812B (zh) * | 2012-09-28 | 2020-12-22 | 杜比国际公司 | 图像解码方法、编码方法和装置 |
TW201415898A (zh) | 2012-10-09 | 2014-04-16 | Sony Corp | 影像處理裝置及方法 |
CN103873872B (zh) * | 2012-12-13 | 2017-07-07 | 联发科技(新加坡)私人有限公司 | 参考图像管理方法及装置 |
CN103916673B (zh) * | 2013-01-06 | 2017-12-22 | 华为技术有限公司 | 基于双向预测的编码方法、解码方法和装置 |
US9380305B2 (en) * | 2013-04-05 | 2016-06-28 | Qualcomm Incorporated | Generalized residual prediction in high-level syntax only SHVC and signaling and management thereof |
WO2016006894A1 (ko) | 2014-07-06 | 2016-01-14 | 엘지전자 주식회사 | 비디오 신호의 처리 방법 및 이를 위한 장치 |
-
2011
- 2011-02-10 JP JP2011027386A patent/JP2012169763A/ja not_active Withdrawn
-
2012
- 2012-02-01 US US13/363,981 patent/US20120207219A1/en not_active Abandoned
- 2012-02-03 CN CN2012100239390A patent/CN102638683A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014091933A1 (ja) * | 2012-12-11 | 2014-06-19 | ソニー株式会社 | 符号化装置および符号化方法、並びに、復号装置および復号方法 |
JPWO2014091933A1 (ja) * | 2012-12-11 | 2017-01-05 | ソニー株式会社 | 符号化装置および符号化方法、並びに、復号装置および復号方法 |
US11330300B2 (en) | 2012-12-11 | 2022-05-10 | Sony Corporation | Encoding device and encoding method, and decoding device and decoding method |
Also Published As
Publication number | Publication date |
---|---|
US20120207219A1 (en) | 2012-08-16 |
CN102638683A (zh) | 2012-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012169763A (ja) | 画像符号化装置と画像符号化方法およびプログラム | |
JP5505154B2 (ja) | 画像処理装置と画像処理方法 | |
WO2012008351A1 (ja) | 画像処理装置と画像処理方法 | |
RU2502217C2 (ru) | Устройство обработки изображения, способ обработки изображения и программа | |
TWI684354B (zh) | 動態影像解碼裝置及動態影像解碼方法 | |
KR101420957B1 (ko) | 화상 부호화 장치, 화상 복호 장치, 화상 부호화 방법 및 화상 복호 방법 | |
TWI580263B (zh) | Dynamic image decoding device, dynamic image decoding method and dynamic image decoding program | |
CN102026009A (zh) | 用于视频编码的方法和系统 | |
JP3940657B2 (ja) | 動画像符号化方法と装置及び動画像復号化方法と装置 | |
JP2012023651A (ja) | 画像処理装置と画像処理方法 | |
WO2012098845A1 (ja) | 画像符号化方法、画像符号化装置、画像復号方法及び画像復号装置 | |
JP2009260421A (ja) | 動画像処理システム、符号化装置、符号化方法、符号化プログラム、復号化装置、復号化方法および復号化プログラム | |
JP5706264B2 (ja) | 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラムおよび画像復号プログラム | |
JP2009005217A (ja) | 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラム,画像復号プログラムおよびコンピュータ読み取り可能な記録媒体 | |
JP2004221744A (ja) | 動画像符号化装置、その方法及びそのプログラム、並びに、動画像復号装置、その方法及びそのプログラム | |
TW201251473A (en) | Video decoding device, video decoding method, and video decoding program | |
JP6874844B2 (ja) | 動画像符号化装置、動画像符号化方法、及び、動画像符号化プログラム | |
JP4363484B2 (ja) | 動画像復号化方法 | |
JP5946980B1 (ja) | 画像復号化方法 | |
JPWO2004014085A1 (ja) | データ処理装置およびデータ処理方法 | |
JP6181242B2 (ja) | 画像復号化方法 | |
JP5911982B2 (ja) | 画像復号化方法 | |
JP5951915B2 (ja) | 画像復号化方法 | |
JP5750191B2 (ja) | 画像復号化方法 | |
JP5980616B2 (ja) | 低遅延画像符号化装置及びその予測画像制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20140513 |