JP6101067B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP6101067B2
JP6101067B2 JP2012271593A JP2012271593A JP6101067B2 JP 6101067 B2 JP6101067 B2 JP 6101067B2 JP 2012271593 A JP2012271593 A JP 2012271593A JP 2012271593 A JP2012271593 A JP 2012271593A JP 6101067 B2 JP6101067 B2 JP 6101067B2
Authority
JP
Japan
Prior art keywords
prediction
unit
depth information
classification
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012271593A
Other languages
English (en)
Other versions
JP2014116900A (ja
Inventor
康孝 松尾
康孝 松尾
境田 慎一
慎一 境田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2012271593A priority Critical patent/JP6101067B2/ja
Publication of JP2014116900A publication Critical patent/JP2014116900A/ja
Application granted granted Critical
Publication of JP6101067B2 publication Critical patent/JP6101067B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像をブロック単位で処理する画像処理装置及び画像処理プログラムに関する。
近年、カラー画像とともに近赤外線を利用した距離計測によって、奥行き情報を取得することができる「RGB−Dセンサ」を搭載したカメラが盛んに研究されている。このカメラの一例として、Microsoft社のKinect(登録商標)がある。よって、将来的には、2次元の画像信号と、奥行き情報とを有する動画像情報が増加することが予想される。
従来技術であるH.264/AVC(Advanced Video Coding)や現在規格化作業中のHEVC(High Efficiency Video Coding)などの映像の圧縮符号化方式では、映像の各フレームをブロックと呼ばれる矩形領域に分割して符号化が行われる。
H.264/AVCやHEVCの符号化処理には、符号化対象ブロックの動きベクトルを予測する処理がある。この動きベクトルの予測では、被予測ブロックの左側や上側の隣接ブロック群の動きベクトルを用いて、予測ベクトルを生成する。
図1は、H.264/AVCの動きベクトル予測に用いる隣接ブロック群の一例を示す図である。図1に示すように、H.264/AVCでは、被予測ブロックの上側隣接ブロックと左側隣接ブロックとを、予測ブロックとする(例えば、非特許文献1参照)。予測ブロックは、斜線のブロックで表す。予測ブロックとは、被予測ブロック(処理対象ブロック)の動きベクトル予測に用いるブロックをいう。
図2は、HEVCの動きベクトル予測に用いる隣接ブロック群の一例を示す図である。図2に示すように、HEVCでは、被予測ブロックの左側の隣接ブロック群、上側の隣接ブロック群、時間方向で前のフレームと同じブロック、及び時間方向で前のフレームの右下ブロックを予測ブロックとする(例えば、非特許文献2参照)。
非予測ブロックの動きベクトルに対する予測ベクトルの値としては、予測ブロック群の水平方向の動きベクトルの中央値、垂直方向の動きベクトルの中央値が用いられる。
大久保榮監修,「改訂三版 H.264/AVC 教科書」,インプレス R&D,p124,2009年1月1日 Thomas Davies, "BBC's Response to the Call for Proposals on Video Compression Technology", JCTVC-A125, p11, 1st Meeting: Dresden, DE, 15-23 April, 2010.
H.264/AVCやHEVCなどの従来技術では、隣接ブロック群から予測ブロックとして用いるブロックが決められていたため、その隣接ブロックが予測ブロックとして適切な否かの判断を行っていない。
一方で、予測ベクトルの予測精度が低下する場合は、被予測ブロックと予測ブロック群とが、同一オブジェクトでない場合が多い。従来の画像に対して、例えば色情報などを用いて、同一オブジェクトであるか否かの判定を行うことはできるが、その判定精度には限界があった。例えばオブジェクトが異なっていても、これらのオブジェクトの色が同じであれば、これらのオブジェクトは同一オブジェクトと判定されてしまう。
そこで、本発明は、奥行き情報を用いて予測ブロックの適否を判定することで、予測ベクトルの精度を向上させることができる画像処理装置及び画像処理プログラムを提供することを目的とする。
本発明の一態様における画像処理装置は、奥行き情報を含む画像に対してブロック単位で処理を行う画像処理装置であって、処理対象ブロックに隣接する各予測ブロックに含まれる奥行き情報を、前記処理対象ブロックの奥行き情報と類似する奥行き情報を有する第1分類と、前記処理対象ブロックの奥行き情報と非類似である奥行き情報を有する第2分類とに分類する分類部と、前記分類部の分類結果に基づき、前記処理対象ブロックの動きベクトルの処理に用いられる予測ブロックを選択し、選択された予測ブロックの動きベクトルを用いて予測ベクトルを決定する決定部と、を有し、前記決定部は、前記第2分類に含まれる奥行き情報と、前記処理対象ブロックの奥行き情報との差に応じた重み値を計算する計算部と、前記第2分類に含まれる奥行き情報を有する予測ブロックの動きベクトルに前記重み値が乗算された動きベクトルと、前記第1分類に含まれる奥行き情報を有する予測ブロックの動きベクトルとの中央値により、前記予測ベクトルを決定する予測ベクトル決定部とを有する。
また、前記処理が画像の符号化処理である場合、前記決定部により決定された予測ベクトルと、符号化対象ブロックの動きベクトルとの差分を符号化する符号化部をさらに有してもよい。
また、前記処理が画像の復号処理である場合、前記画像が符号化されたビットストリームを復号し、復号対象ブロック及び前記予測ブロックの奥行き情報と、前記復号対象ブロックの動きベクトルの差分情報とを取得する第1復号部と、前記決定部により決定された予測ベクトルに前記差分情報を加算した動きベクトルを用いて、前記画像を復号する第2復号部とをさらに有してもよい。
また、本発明の他の実施態様における画像処理プログラムは、奥行き情報を含む画像に対してブロック単位で処理を行うために、コンピュータに、処理対象ブロックに隣接する各予測ブロックに含まれる奥行き情報を、前記処理対象ブロックの奥行き情報と類似する奥行き情報を有する第1分類と、前記処理対象ブロックの奥行き情報と非類似である奥行き情報を有する第2分類とに分類する分類ステップ、前記分類ステップによる分類結果に基づき、前記処理対象ブロックの動きベクトルの処理に用いられる予測ブロックを選択し、選択された予測ブロックの動きベクトルを用いて予測ベクトルを決定する決定ステップ、を実行させ、前記決定ステップは、前記第2分類に含まれる奥行き情報と、前記処理対象ブロックの奥行き情報との差に応じた重み値を計算するステップと、前記第2分類に含まれる奥行き情報を有する予測ブロックの動きベクトルに前記重み値が乗算された動きベクトルと、前記第1分類に含まれる奥行き情報を有する予測ブロックの動きベクトルとの中央値により、前記予測ベクトルを決定するステップとを実行する。
本発明によれば、奥行き情報を用いて予測ブロックの適否を判定することで、予測ベクトルの精度を向上させることができる。
H.264/AVCの動きベクトル予測に用いる隣接ブロック群の一例を示す図。 HEVCの動きベクトル予測に用いる隣接ブロック群の一例を示す図。 実施例1における画像処理装置の構成の一例を示すブロック図。 分類結果の一例を示す図。 実施例1における画像処理装置の処理の一例を示すフローチャート。 実施例1における分類処理の一例を示すフローチャート。 実施例1における決定処理の一例を示すフローチャート。 実施例2における画像処理装置の概略構成の一例を示すブロック図。 実施例3における画像処理装置の概略構成の一例を示すブロック図。 実施例4における画像処理装置の構成の一例を示すブロック図。
以下、各実施例について、添付図面を参照しながら詳細に説明する。
[実施例1]
まず、実施例1における画像処理装置について説明する。実施例1における画像処理装置は、動きベクトルの予測値を決定する装置である。この画像処理装置は、プログラムが実行されることで機能してもよいし、集積回路などにより実装されてもよい。また、画像処理とは、画像符号化及び画像復号を含む。
<構成>
図3は、実施例1における画像処理装置10の構成の一例を示すブロック図である。図3に示す画像処理装置10は、分類部101と、決定部103とを有する。分類部101は、クラスタリング部111と、判定部113とを有する。また、決定部103は、切替部131と、第1予測ベクトル決定部133と、計算部135と、第2予測ベクトル決定部137とを有する。
分類部101は、処理対象ブロック(被予測ブロック)に隣接する各予測ブロックに含まれる奥行き情報を、この処理対象ブロックの奥行き情報に類似するか否かを判定して分類する。例えば、分類部101は、予測ブロック群と、予測ブロック群の奥行き情報と、被予測ブロックと、被予測ブロックの奥行き情報とを取得する。
クラスタリング部111は、予測ブロック群の奥行き情報をクラスタリングし、クラスタリング結果情報を判定部113に出力する。
ここで、奥行き情報は、画素毎、又は撮像時に決定されるブロック領域毎に存在する。ブロック領域内の画素は、同じ奥行き情報となる。まず、クラスタリング部111は、予測ブロック毎に、奥行き情報を計算する。
例えば、クラスタリング部111は、予測ブロック内の画素又はブロック領域の奥行き情報の中央値又は平均値などを、この予測ブロックの奥行き情報とする。クラスタリング部111は、例えば、前景、背景を区別するために、k=2として、k−means法を奥行き情報に適用して、予測ブロック毎の奥行き情報のクラスタリングとクラスタ中心とを求める。
判定部113は、被予測ブロックの奥行き情報と、予測ブロック群の奥行き情報と、クラスタリング結果情報とを取得する。判定部113は、クラスタリング部111から取得したクラスタリング結果情報に基づいて、被予測ブロックの動きベクトルの予測に用いるのに適切な予測ブロックの確度判定を行う。
判定部113は、被予測ブロックに対する任意の予測ブロックについて、奥行き情報がともに同じクラスタに属するのであれば、確度が高いと判定し、違うクラスタに属するのであれば確度が低いと判定する。
また、判定部113は、被予測ブロックに対する任意の予測ブロックについて、非予測ブロックと予測ブロックとの奥行き情報の値の差が、閾値Th1未満であれば、確度が高いと判定し、閾値Th1以上であれば、確度が低いと判定する。
判定部113は、確度が高いと判定した奥行き情報を有する予測ブロックを第1分類とし、確度が低いと判定した奥行き情報を有する予測ブロックを第2分類とする。
分類部101は、処理対象ブロックに隣接する各予測ブロックに含まれる奥行き情報を、この処理対象ブロックの奥行き情報に類似するか否かを判定して分類した結果を、決定部103に出力する。分類部101は、予測ブロック群に対して、処理対象ブロックの奥行き情報と類似する奥行き情報を有する第1分類と、処理対象ブロックの奥行き情報と非類似である奥行き情報を有する第2分類とに分類する。分類結果は、第1分類と第2分類とに分類された予測ブロックや奥行き情報を含む。
図4は、分類結果の一例を示す図である。図4に示す例では、「1」のブロックが第1分類に分類された予測ブロック群を示し、「2」のブロックが第2分類に分類された予測ブロック群を示す。
図3に戻り、決定部103は、分類部101の分類結果に基づき、処理対象ブロックの動きベクトルの処理に用いられる予測ブロックを選択し、選択された予測ブロックの動きベクトルを用いて予測ベクトルを決定する。
切替部131は、外部スイッチとして、予めどちらの処理を行うかが決められていても良いし、分類結果に基づいて自動で判定してもよい。例えば、切替部131は、第1分類の予測ブロックの数が閾値Th2以上であれば、第1の処理(第1予測ベクトル決定部133)を行わせるようにし、閾値Th2未満であれば第2の処理(計算部135及び第2予測ベクトル決定部137)を行わせるようにする。
第1予測ベクトル決定部133は、分類結果に基づいて、第1分類の奥行き情報を有する予測ブロックの動きベクトルを用いて予測ベクトルを決定する。例えば、第1予測ベクトル決定部133は、第1分類に含まれる予測ブロックの動きベクトルに対し、水平方向、垂直方向で中央値計算を行って、予測ベクトルを計算する。
計算部135は、第2分類に含まれる奥行き情報と、処理対象ブロックの奥行き情報との差に応じた重み値を計算する。計算部135は、例えば、被予測ブロックの奥行き情報と、予測ブロックの奥行き情報との差が大きいほど、重み値を小さくする。
計算部135は、次の式(1)を用いて、第2分類の予測ブロックの動きベクトルに対する重み値を計算する。
重み値=1−|D1−D2|/|Diff| ・・・式(1)
D1:被予測ブロックの奥行き情報
D2:予測ブロックの奥行き情報
Diff:被予測ブロックの奥行き情報と、全予測ブロックの奥行き情報との差の最大値
計算部135は、第2分類に含まれる各予測ブロックの重み値を第2予測ベクトル決定部137に出力する。
第2予測ベクトル決定部137は、第2分類に含まれる奥行き情報を有する予測ブロックの動きベクトルに重み値が乗算された動きベクトルと、第1分類に含まれる奥行き情報を有する予測ブロックの動きベクトルとを用いて予測ベクトルを決定する。第2予測ベクトル決定部137は、重み値を考慮して予測ベクトルを決定する。
第2予測ベクトル決定部137は、基本的には、第1予測ベクトル決定部133のように、中央値計算を行って、予測ベクトルを決定する。第2予測ベクトル決定部137が、第1予測ベクトル決定部133と異なるところは、第2分類の予測ブロックの動きベクトルに対しては重みを考慮して中央値計算に含めることである。
つまり、第2予測ベクトル決定部137は、第1分類の予測ブロックの動きベクトルに対してはそのまま用い、第2分類の予測ブロックの動きベクトルに対しては重み値を考慮して用いて、中央値計算を行って、予測ベクトルを決定する。
決定部103により決定された予測ベクトルは、符号化処理であれば、処理対象ブロックの動きベクトルから減算され、復号処理であれば、処理対象ブロックの差分ベクトルに加算される。
<動作>
次に、実施例1における画像処理装置10の動作について説明する。図5は、実施例1における画像処理装置10の処理の一例を示すフローチャートである。図5に示すステップS101で、分類部101は、予測ブロック群の奥行き情報に対して、被予測ブロックの奥行き情報と類似するか否かを判定して、分類処理を行う。分類処理の詳細は、図6を用いて説明する。
ステップS102で、決定部103は、分類結果を用いて、被予測ブロックの動きベクトルに対する予測ベクトルを決定する。予測ベクトルの決定処理の詳細は、図7を用いて説明する。
図6は、実施例1における分類処理の一例を示すフローチャートである。図6に示すステップS201で、クラスタリング部111は、予測ブロックの奥行き情報に対して、例えばk=2とするk−means法を適用し、クラスタリングする。
ステップS202で、判定部113は、クラスタリング結果に基づき、予測ブロックの確度を判定する。例えば、判定部113は、被予測ブロックの奥行き情報と同じクラスタに属する奥行き情報を有する予測ブロックを第1分類とし、それ以外の予測ブロックを第2分類とする。
これにより、奥行き情報を用いて、被予測ブロックと同一オブジェクトであるか否かの判定を行うことができる。
図7は、実施例1における決定処理の一例を示すフローチャートである。図7に示すステップS301で、切替部131は、第1の処理と、第2の処理(重み処理)のどちらを行うかを判定する。重み処理を行う場合は(ステップS301−YES)ステップS303に進み、重み処理を行わない場合は(ステップS301−NO)ステップS302に進む。
ステップS302で、第1予測ベクトル決定部133は、第1分類に含まれる予測ブロックの動きベクトルに対し、水平方向及び垂直方向で中央値計算を行って予測ベクトルを決定する。
ステップS303で、計算部135は、第2分類に含まれる予測ブロックの奥行き情報と、被予測ブロックの奥行き情報との差分を用いて重み値を計算する。例えば、計算部135は、式(1)を用いて予測ブロックの動きベクトルに対する重み値を計算する。
ステップS304で、第2予測ベクトル決定部137は、第2分類に含まれる予測ブロックの動きベクトルに重み値が乗算された動きベクトルと、第1分類に含まれる奥行き情報を有する予測ブロックの動きベクトルとを用いて、中央値演算を行い、予測ベクトルを決定する。
これにより、奥行き情報を用いた同一オブジェクト判定に基づく予測ブロックの分類結果を用いることで、予測ベクトルの予測精度を向上させることができる。つまり、第1分類に含まれる予測ブロックは、被予測ブロックと同一オブジェクトである可能性が高い。
以上、実施例1では、奥行き情報を用いて、被予測ブロックと予測ブロック群とで、同一オブジェクト判定を行う。一般的に、同一オブジェクトであれば、近接するブロック間の奥行き位置(奥行き情報)はほぼ同じであり、少なくとも前景と背景とに区別できるほどの差異はない。そこで、画像全体の奥行き情報をクラスタリングして、被予測ブロックと、予測ブロック群とで、異なるクラスタに属するブロックは、確度が低いとして動きベクトルの予測には用いない。または、確度が低い予測ブロックは、重み付けを行って中央値計算に用いる。よって、奥行き情報を用いて予測ブロックの適否を判定することで、予測ベクトルの精度を向上させることができる。なお、第1の処理が行われる場合は、第1分類に含まれる予測ブロックを識別する識別情報をストリームに加えることで、奥行き情報はデコーダ側に送信されなくてもよい。
[実施例2]
実施例2では、実施例1における画像処理装置10をインター予測部に含む画像処理装置(画像符号化装置)について説明する。実施例では、入力される原画に奥行き情報が付与されている。
<構成>
図8は、実施例2における画像処理装置20の概略構成の一例を示すブロック図である。図8に示す例では、画像処理装置20は、前処理部200、予測誤差信号生成部201、直交変換部202、量子化部203、エントロピー符号化部204、逆量子化部205、逆直交変換部206、復号画像生成部207、ループフィルタ部209、復号画像記憶部210、イントラ予測部211、インター予測部212、動きベクトル計算部213及び予測画像選択部215を有する。各部についての概略を以下に説明する。
前処理部200は、ピクチャタイプに合わせてピクチャを並べ替え、ピクチャタイプ及びフレームごとのフレーム画像等を順次出力する。また、前処理部200は、ブロック分割なども行う。また前処理部200は、原画に付与されている奥行き情報をインター予測部212及びエントロピー符号化部204に出力する。
予測誤差信号生成部201は、入力された動画像データの符号化対象画像が、例えば32×32、16×16、8×8画素などのブロックに分割されたブロックデータを取得する。
予測誤差信号生成部201は、そのブロックデータと、予測画像選択部215から出力される予測画像のブロックデータとにより、予測誤差信号を生成する。予測誤差信号生成部201は、生成された予測誤差信号を直交変換部202に出力する。
直交変換部202は、入力された予測誤差信号を直交変換処理する。直交変換部202は、変換された係数値を示す信号を量子化部203に出力する。なお、直交変換の種類が複数ある場合は、いずれの直交変換にするかの決定は、後述するモード制御により行われてもよい。
量子化部203は、直交変換部202からの出力信号を量子化する。量子化部203は、量子化することによって出力信号の符号量を低減し、この出力信号をエントロピー符号化部204及び逆量子化部205に出力する。
エントロピー符号化部204は、量子化部203からの出力信号や、動きベクトル計算部213から出力された動きベクトル情報やループフィルタ部209からのフィルタ係数などをエントロピー符号化して出力する。
また、エントロピー符号化部204は、イントラ予測部211から取得したイントラ予測方向の差分値や、インター予測部212から取得した動きベクトルと予測ベクトルの差分値などをエントロピー符号化してもよい。
また、エントロピー符号化部204は、前処理部200から取得した奥行き情報又は分類結果をエントロピー符号化してもよい。エントロピー符号化とは、シンボルの出現頻度に応じて可変長の符号を割り当てる方式をいう。
逆量子化部205は、量子化部203からの出力信号を逆量子化してから逆直交変換部206に出力する。逆直交変換部206は、逆量子化部205からの出力信号を逆直交変換処理してから復号画像生成部207に出力する。これら逆量子化部205及び逆直交変換部206によって復号処理が行われることにより、符号化前の予測誤差信号と同程度の信号が得られる。
復号画像生成部207は、イントラ予測部211で画面内予測された画像あるいはインター予測部212で動き補償された画像のブロックデータと、逆量子化部205及び逆直交変換部206により復号処理された予測誤差信号とを加算する。復号画像生成部207は、加算して生成した復号画像のブロックデータを、ループフィルタ部209に出力する。
ループフィルタ部209は、例えばALF(Adaptive Loop Filter)やデブロッキングフィルタであり、いずれか又は両方を備えてもよい。
例えば、ループフィルタ部209は、入力画像を所定サイズ毎のグループに分け、グループ毎に適切なフィルタ係数を生成する。ループフィルタ部209は、フィルタ処理された復号画像を、所定サイズ毎にグループ分けし、生成したフィルタ係数を用いてグループ毎にフィルタ処理を行う。ループフィルタ部209は、フィルタ処理結果を復号画像記憶部210に出力し、蓄積された1画像分のフィルタ処理結果を参照画像として記憶させる。所定サイズは、例えば、直交変換サイズである。
復号画像記憶部210は、入力した復号画像のブロックデータを新たな参照画像のデータとして記憶し、イントラ予測部211、インター予測部212及び動きベクトル計算部213に出力する。
イントラ予測部211は、符号化対象画像の処理対象ブロックに対して、すでに符号化された参照画素から予測画像のブロックデータを生成する。イントラ予測部211は、複数の予測方向を用いて予測を行い、最適な予測方向を決定する。予測方向については、符号化済みブロックの予測方向との差分値をビットストリームに含めるために、差分値がエントロピー符号化部204に出力される。
インター予測部212は、復号画像記憶部210から取得した参照画像のデータを動きベクトル計算部213から提供される動きベクトルで動き補償する。これにより、動き補償された参照画像としてのブロックデータが生成される。動きベクトルについては、符号化済みブロックの動きベクトル(予測ベクトル)との差分値をビットストリームに含めるために、差分値がエントロピー符号化部204に出力される。
インター予測部212は、符号化対象ブロックの動きベクトルに対する予測ベクトルを決定するために、実施例1で説明した画像処理装置10の処理を行う。これにより、予測ベクトルの精度を向上させることができる。
動きベクトル計算部213は、符号化対象画像におけるブロックデータと、復号画像記憶部210から取得する参照画像とを用いて、動きベクトルを求める。動きベクトルとは、ブロック単位で参照画像内から処理対象ブロックに最も類似している位置を探索するブロックマッチング技術などを用いて求められるブロック単位の空間的なずれを示す値である。
動きベクトル計算部213は、求めた動きベクトルをインター予測部212に出力し、参照画像を示す情報を含む動きベクトル情報をエントロピー符号化部204に出力する。
イントラ予測部211とインター予測部212から出力されたブロックデータは、予測画像選択部215に入力される。
予測画像選択部215は、イントラ予測部211とインター予測部212から取得したブロックデータのうち、どちらか一方のブロックデータを予測画像として選択する。選択された予測画像は、予測誤差信号生成部201に出力される。なお、予測画像の選択は、後述するモード制御により行われてもよい。
なお、図8に示す画像処理装置20の構成は一例であり、必要に応じて各構成を組み合わせたり、各構成を適宜変更したりしてもよい。また、実施例1と同様の処理で決定された予測ベクトルと、符号化対象ブロックの動きベクトルとの差分を計算するインター予測部212と、その差分を符号化するエントロピー符号化部204とを、総称して符号化部とも称す。
以上、実施例2によれば、予測ブロックの精度を向上させることにより、画像の符号化効率も向上させることができる。
[実施例3]
実施例3では、実施例1における画像処理装置10をインター予測部に含む画像処理装置(画像復号装置)30について説明する。実施例3における画像処理装置30は、実施例2における画像処理装置20で符号化されたビットストリームを復号する装置である。
<構成>
図9は、実施例3における画像処理装置30の概略構成の一例を示すブロック図である。図9に示すように、画像処理装置30は、エントロピー復号部301、逆量子化部302、逆直交変換部303、イントラ予測部304、復号情報記憶部305、インター予測部306、予測画像選択部307、復号画像生成部308、ループフィルタ部310、及びフレームメモリ311を有する。各部についての概略を以下に説明する。
エントロピー復号部301は、ビットストリームが入力されると、画像処理装置20のエントロピー符号化に対応するエントロピー復号を行う。エントロピー復号部301により復号された予測誤差信号などは逆量子化部302に出力される。また、復号したフィルタ係数や、奥行き情報や、インター予測されている場合の、復号された動きベクトルの差分値などは復号情報記憶部305に出力される。
また、エントロピー復号部301は、イントラ予測の場合、イントラ予測部304にその旨通知する。また、エントロピー復号部301は、復号対象画像がインター予測されているか、イントラ予測されているかを予測画像選択部307に通知する。
逆量子化部302は、エントロピー復号部301からの出力信号に対して逆量子化処理を行う。逆量子化された出力信号は逆直交変換部303に出力される。
逆直交変換部303は、逆量子化部302からの出力信号の復号ブロックに対して逆直交変換処理を行い、残差信号を生成する。残差信号は復号画像生成部308に出力される。
イントラ予測部304は、フレームメモリ311から取得する復号対象画像のすでに復号化された周辺画素から、複数の予測方向を用いて予測画像を生成する。
復号情報記憶部305は、復号されたループフィルタのフィルタ係数や動きベクトルや分割モードなどの復号情報を記憶する。
インター予測部306は、フレームメモリ311から取得した参照画像のデータを復号情報記憶部305から動きベクトルの差分値や奥行き情報などを取得する。また、インター予測部306は、実施例1における画像処理装置10と同様の処理を行い、予測ベクトルを決定する。インター予測部306は、決定した予測ベクトルと、動きベクトルの差分値とを加算し、動きベクトルを生成する。インター予測部306は、生成した動きベクトルを用いて動き補償を行う。これにより、動き補償された参照画像としてのブロックデータが生成される。
予測画像選択部307は、イントラ予測画像、又はインター予測画像どちらか一方の予測画像を選択する。選択されたブロックデータは、復号画像生成部308に出力される。
復号画像生成部308は、予測画像選択部307から出力される予測画像と、逆直交変換部303から出力される残差信号とを加算し、復号画像を生成する。生成された復号画像はループフィルタ部310に出力される。
ループフィルタ部310は、復号画像生成部308から出力された復号画像に対し、ブロック歪を低減するためのフィルタをかけ、ループフィルタ処理後の復号画像をフレームメモリ311に出力する。なお、ループフィルタ後の復号画像は表示装置などに出力されてもよい。
フレームメモリ311は、参照画像となる復号画像などを記憶する。なお、復号情報記憶部305とフレームメモリ311は、分けた構成にしているが、同じ記憶部であってもよい。
なお、エントロピー復号部301を第1復号部とも称し、インター予測部306以降の処理部を第2復号部とも称してもよい。
以上、実施例3によれば、実施例2における画像処理装置20で符号化されたビットストリームを適切に復号することができる。
[実施例4]
図10は、実施例4における画像処理装置40の構成の一例を示すブロック図である。図10に示す画像処理装置40は、上述した実施例1〜3で説明した画像処理をソフトウェアで実装した装置の一例である。
図10に示すように、画像処理装置40は、制御部401、主記憶部402、補助記憶部403、ドライブ装置404、ネットワークI/F部406、入力部407、表示部408を有する。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
制御部401は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPU(Central Processing Unit)である。また、制御部401は、主記憶部402又は補助記憶部403に記憶された画像処理のプログラムを実行する演算装置である。制御部401は、入力部407や記憶装置からデータを受け取り、演算、加工した上で、表示部408や記憶装置などに出力する。
また、制御部401は、画像処理のプログラムを実行することで、実施例1〜3で説明した処理を実現することができる。
主記憶部402は、ROM(Read Only Memory)やRAM(Random Access Memory)などである。主記憶部402は、制御部401が実行する基本ソフトウェアであるOS(Operating System)やアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
補助記憶部403は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
ドライブ装置404は、記録媒体405、例えばフレキシブルディスクからプログラムを読み出し、記憶部にインストールする。
また、記録媒体405に、所定のプログラムを格納し、この記録媒体405に格納されたプログラムはドライブ装置404を介して画像処理装置40にインストールされる。インストールされた所定のプログラムは、画像処理装置40により実行可能となる。
ネットワークI/F部406は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器と画像処理装置40とのインターフェースである。
入力部407は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示部408の表示画面上でキーの選択等を行うためのマウスやスライドパット等を有する。表示部408は、LCD(Liquid Crystal Display)等により構成され、制御部401から入力される表示データに応じた表示が行われる。
なお、図3に示す画像処理装置10の構成は、例えば制御部401及びワークメモリとしての主記憶部402により実現されうる。
また、図8に示す復号画像記憶部210は、例えば主記憶部402又は補助記憶部403により実現され、図8に示す復号画像記憶部210以外の構成は、例えば制御部401及びワークメモリとしての主記憶部402により実現されうる。
また、図9に示す復号情報記憶部305及びフレームメモリ311は、例えば主記憶部402又は補助記憶部403により実現されうる。図9に示す復号情報記憶部305及びフレームメモリ311以外の構成は、例えば制御部401及びワークメモリとしての主記憶部402により実現されうる。
画像処理装置40で実行されるプログラムは、実施例1〜3で説明した各部を含むモジュール構成となっている。実際のハードウェアとしては、制御部401が補助記憶部403からプログラムを読み出して実行することにより上記各部のうち1又は複数の各部が主記憶部402上にロードされ、1又は複数の各部が主記憶部402上に生成されるようになっている。
このように、上述した実施例1〜3で説明した画像処理は、コンピュータに実行させるためのプログラムとして実現されてもよい。このプログラムをサーバ等からインストールしてコンピュータに実行させることで、実施例1〜3で説明した処理を実現することができる。
また、このプログラムを記録媒体405に記録し、このプログラムが記録された記録媒体405をコンピュータや携帯端末に読み取らせて、前述した画像処理を実現させることも可能である。なお、記録媒体405は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。また、上述した各実施例で説明した処理は、1つ又は複数の集積回路に実装してもよい。
なお、実施例4における画像処理装置40は、上記の通り、画像処理装置10、20、30としての機能を有してもよい。
以上、各実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、上記変形例以外にも種々の変形及び変更が可能である。
10、20、30、40 画像処理装置
101 分類部
103 決定部
111 クラスタリング部
113 判定部
131 切替部
133 第1予測ベクトル決定部
135 計算部
137 第2予測ベクトル決定部
204 エントロピー符号化部
212 インター予測部
301 エントロピー復号部
306 インター予測部
401 制御部
402 主記憶部
403 補助記憶部

Claims (4)

  1. 奥行き情報を含む画像に対してブロック単位で処理を行う画像処理装置であって、
    処理対象ブロックに隣接する各予測ブロックに含まれる奥行き情報を、前記処理対象ブロックの奥行き情報と類似する奥行き情報を有する第1分類と、前記処理対象ブロックの奥行き情報と非類似である奥行き情報を有する第2分類とに分類する分類部と、
    前記分類部の分類結果に基づき、前記処理対象ブロックの動きベクトルの処理に用いられる予測ブロックを選択し、選択された予測ブロックの動きベクトルを用いて予測ベクトルを決定する決定部と、
    を有し、
    前記決定部は、
    前記第2分類に含まれる奥行き情報と、前記処理対象ブロックの奥行き情報との差に応じた重み値を計算する計算部と、
    前記第2分類に含まれる奥行き情報を有する予測ブロックの動きベクトルに前記重み値が乗算された動きベクトルと、前記第1分類に含まれる奥行き情報を有する予測ブロックの動きベクトルとの中央値により、前記予測ベクトルを決定する予測ベクトル決定部と
    を有する画像処理装置。
  2. 前記処理が画像の符号化処理である場合、
    前記決定部により決定された予測ベクトルと、符号化対象ブロックの動きベクトルとの差分を符号化する符号化部をさらに有する請求項に記載の画像処理装置。
  3. 前記処理が画像の復号処理である場合、
    前記画像が符号化されたビットストリームを復号し、復号対象ブロック及び前記予測ブロックの奥行き情報と、前記復号対象ブロックの動きベクトルの差分情報とを取得する第1復号部と、
    前記決定部により決定された予測ベクトルに前記差分情報を加算した動きベクトルを用いて、前記画像を復号する第2復号部と
    をさらに有する請求項に記載の画像処理装置。
  4. 奥行き情報を含む画像に対してブロック単位で処理を行うために、コンピュータに、
    処理対象ブロックに隣接する各予測ブロックに含まれる奥行き情報を、前記処理対象ブロックの奥行き情報と類似する奥行き情報を有する第1分類と、前記処理対象ブロックの奥行き情報と非類似である奥行き情報を有する第2分類とに分類する分類ステップ、
    前記分類ステップによる分類結果に基づき、前記処理対象ブロックの動きベクトルの処理に用いられる予測ブロックを選択し、選択された予測ブロックの動きベクトルを用いて予測ベクトルを決定する決定ステップ、
    を実行させ
    前記決定ステップは、
    前記第2分類に含まれる奥行き情報と、前記処理対象ブロックの奥行き情報との差に応じた重み値を計算するステップと、
    前記第2分類に含まれる奥行き情報を有する予測ブロックの動きベクトルに前記重み値が乗算された動きベクトルと、前記第1分類に含まれる奥行き情報を有する予測ブロックの動きベクトルとの中央値により、前記予測ベクトルを決定するステップと
    を実行する画像処理プログラム。
JP2012271593A 2012-12-12 2012-12-12 画像処理装置及び画像処理プログラム Active JP6101067B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012271593A JP6101067B2 (ja) 2012-12-12 2012-12-12 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012271593A JP6101067B2 (ja) 2012-12-12 2012-12-12 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2014116900A JP2014116900A (ja) 2014-06-26
JP6101067B2 true JP6101067B2 (ja) 2017-03-22

Family

ID=51172458

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012271593A Active JP6101067B2 (ja) 2012-12-12 2012-12-12 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP6101067B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2269378A2 (en) * 2008-04-25 2011-01-05 Thomson Licensing Multi-view video coding with disparity estimation based on depth information
JP2011130030A (ja) * 2009-12-15 2011-06-30 Panasonic Corp 画像符号化方法及び画像符号化装置
JP4938884B2 (ja) * 2010-09-30 2012-05-23 シャープ株式会社 予測ベクトル生成方法、画像符号化方法、画像復号方法、予測ベクトル生成装置、画像符号化装置、画像復号装置、予測ベクトル生成プログラム、画像符号化プログラムおよび画像復号プログラム
JP6061150B2 (ja) * 2011-03-18 2017-01-18 ソニー株式会社 画像処理装置、画像処理方法、及び、プログラム

Also Published As

Publication number Publication date
JP2014116900A (ja) 2014-06-26

Similar Documents

Publication Publication Date Title
US10291925B2 (en) Techniques for hardware video encoding
US8737482B2 (en) Information processing apparatus and inter-prediction mode determining method
KR102005007B1 (ko) 픽쳐 예측 방법 및 관련 장치
KR20110094765A (ko) 움직임 예측 장치 및 방법과 영상 처리 장치
US11323700B2 (en) Encoding video using two-stage intra search
KR102490854B1 (ko) 영상 코딩 시스템에서 어파인 움직임 예측에 기반한 영상 디코딩 방법 및 장치
US11025913B2 (en) Encoding video using palette prediction and intra-block copy
JP2014045434A (ja) 画像符号化装置、画像復号装置及びそれらのプログラム
JP2014036278A (ja) 画像符号化装置、画像復号装置及びプログラム
US20200236385A1 (en) Video coding device, video decoding device, video coding method, video decoding method and program
US8848798B2 (en) Information processing apparatus and inter-prediction mode determination method
WO2012160626A1 (ja) 画像圧縮装置、画像復元装置、及びプログラム
JP5677576B2 (ja) 動画像復号化方法及び動画像符号化方法
JP2019102861A (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
JP6101067B2 (ja) 画像処理装置及び画像処理プログラム
KR102547353B1 (ko) 영상 코딩 시스템에서 컨스트럭티드 어파인 mvp 후보를 사용하는 어파인 움직임 예측에 기반한 영상 디코딩 방법 및 장치
JP6248783B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2013207402A (ja) 画像符号化装置及びプログラム
JP5937926B2 (ja) 画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム
JP6110724B2 (ja) 画像処理装置、符号化装置、及び符号化プログラム
JP5789172B2 (ja) 画像処理装置及びプログラム
JP6200220B2 (ja) 画像処理装置、符号化装置、復号装置、及びプログラム
JP2014143515A (ja) 画像処理装置及び画像処理プログラム
RU2778993C2 (ru) Способ и аппаратура предсказания видеоизображений
JP5957513B2 (ja) 動画像復号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161027

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170224

R150 Certificate of patent or registration of utility model

Ref document number: 6101067

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250