JP2014150297A - 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム - Google Patents

画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム Download PDF

Info

Publication number
JP2014150297A
JP2014150297A JP2011117425A JP2011117425A JP2014150297A JP 2014150297 A JP2014150297 A JP 2014150297A JP 2011117425 A JP2011117425 A JP 2011117425A JP 2011117425 A JP2011117425 A JP 2011117425A JP 2014150297 A JP2014150297 A JP 2014150297A
Authority
JP
Japan
Prior art keywords
unit
image
prediction
pixel
processing target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011117425A
Other languages
English (en)
Inventor
Makoto Otsu
誠 大津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2011117425A priority Critical patent/JP2014150297A/ja
Priority to PCT/JP2012/063503 priority patent/WO2012161318A1/ja
Publication of JP2014150297A publication Critical patent/JP2014150297A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】符号量の増加を抑えつつ、予測画像の精度を向上させること
【解決手段】入力画像を符号化する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、処理対象画素の画素値を予測する画面内予測を行う画像符号化装置であって、画面内予測を行なう際に、周辺画素のうち、処理対象画素との間に入力画像が表す被写体の境界がある周辺画素を用いることを抑制する画面内予測部を具備することを特徴とする。
【選択図】図1

Description

本発明は、画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラムに関する。
近年、ブロードバンドなどの通信インフラの普及や、携帯電話やビデオカメラなどによって手軽に映像を撮影できる映像取得機器の普及、あるいはテレビ放送をHDD(Hard Disk Drive;ハードディスクドライブ)やBD(Blu-ray Disc;ブルーレイディスク)に録画保存できるハードディスクBDレコーダなどの普及によって、一般消費者が大容量の映像を取り扱う機会が増えてきている。また、映像表示方式の高解像度化に伴って取り扱う映像の容量は益々大きくなり、高性能な映像圧縮技術が必要とされている。
そうした中、国際標準動画圧縮規格H.264(非特許参考文献1)が、画質向上および符号化効率向上を目的として、2003年に規格化された。H.264は、画像を複数のブロック(以下、マクロブロック)に分割を行い、複数の予測方式を駆使し、そのマクロブロック単位で符号化効率の高い予測方式を逐次選択することで符号化効率を高めている。
H.264で行われる符号化方法については、画面内で符号化が既に完了したブロックの画素情報を用いて、符号化対象ブロックを予測して符号化する画面内予測符号化方式(イントラ予測符号化方式)と、処理を行う画像とは異なる画像を参照して符号化対象ブロックを予測して符号化する画像間予測符号化方式(インター予測符号化方式)がある。
イントラ予測符号化方式は、マクロブロック(16画素×16画素)単位、あるいはマクロブロックをさらに分割した4画素×4画素、8画素×8画素(8画素×8画素は、H.264 FRExtにて策定)単位で、規定の予測モードに従って生成される予測画像と符号化を行う元の画像との差分画像(残差成分)を符号化した際の符号量と、予測モードを特定するための情報を符号化する際に必要な符号量に基づいて、最適な予測方式が選択される(非特許文献1)。
16画素×16画素のブロックに対しては、4種類の予測モード(図6、図6については後述する)が適用可能で、1種類のDC成分による予測(平均値予測)と3種類の予測角度を用いた予測(垂直予測、水平予測、平面予測)がある。4画素×4画素、あるいは8画素×8画素のブロックに対しては、9種類の予測モード(図4、図4については後述する)が適用可能であり、1種類のDC成分による予測(平均値予測)と8種類の予測角度を用いた予測(45°〜206.57°の不均等角度の予測)がある。
また、予測モードを特定するための情報(例えばモードを示すインデックス値)の符号化については、処理対象ブロックの上部と左部の予測モードを用いて予測を行い、その予測に合致する場合には、1ビット分のフラグを用意し、合致したというフラグを立てて判断する。予測に合致しない場合には、そのフラグを立てずに、合致しない予測モードを除いた残りの8種類の予測モードを判断するための3ビット分の情報を付加して符号化する。予測が合えば、予測モードを符号化するのに1ビットの情報で済むが、予測が合わなければ4ビット分の情報を必要とする。
例えば、特許文献1に記載の発明は、イントラ予測符号化方式の符号化効率を向上させることを目的に、任意の予測角度で予測ができるように、H.264の方式に比べて予測モードの数を増やしている。予測角度と処理を行う画素の位置から、理論上の参照画素位置を求め、その画素位置に該当する画素値を、周辺の参照画素を補間することにより生成する技術について開示している。
特許文献2に記載の発明は、周囲の予測モードの角度に基づいて精度よく予測モードを予測する方式について開示している。
特開2009−284275号公報 特開2010−056701号公報
角野眞也、大久保榮、菊池義浩、鈴木輝彦、改定三版H.264/AVC教科書、「H.264/AVCの画面内予測符号化」(pp110-pp116)、「8×8画面内(イントラ)予測符号化」(pp264-pp266)他、インプレス
しかしながら、特許文献1に記載の画面間予測方式では、予測精度を向上させるために予測の角度を細かくする必要がある。予測の角度を細かくすると、その角度に1対1に対応する予測モード数が増える。その結果として予測モードを表現するビット数が増えるため符号化する際の符号量が増加する問題がある。
また、特許文献2に記載の画面間予測方式は、予測モードを従来に比べて精度良く予測できたとしても、予測画像の精度を向上させることはできない。
本発明は、このような事情に鑑みてなされたもので、その目的は、符号量の増加を抑えつつ、予測画像の精度を向上させる符号化装置、復号装置、符号化方法、復号方法およびプログラムを提供することにある。
(1)この発明は上述した課題を解決するためになされたもので、本発明の一態様は、入力画像を符号化する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、前記処理対象画素の画素値を予測する画面内予測を行う画像符号化装置であって、前記画面内予測を行なう際に、前記周辺画素のうち、前記処理対象画素との間に前記入力画像が表す被写体の境界がある前記周辺画素を用いることを抑制する画面内予測部を具備することを特徴とする。
(2)また、本発明の他の態様は、上述の画像符号化装置であって、前記画面内予測部は、前記被写体の境界を、前記入力画像の被写体までの距離を示す情報を用いて検出する被写体境界検出部を具備することを特徴とする。
(3)また、本発明の他の態様は、上述の画像符号化装置であって、前記画面内予測部は、前記周辺画素のうち、前記処理対象画素の所定の方向に隣接する画素と、前記処理対象画素との間に前記被写体の境界がないときは、前記所定の方向に隣接する画素を用いて、前記処理対象画素の画素値を予測し、前記所定の方向に隣接する画素と、前記処理対象画素との間に前記被写体の境界があるときは、前記所定の方向に隣接する画素を用いて前記処理対象画素の画素値を予測することを抑制する予測画像生成部を具備することを特徴とする。
(4)また、本発明の他の態様は、上述の画像符号化装置であって、前記画面内予測部は、前記処理対象画素の画素値を予測する際に用いる周辺画素を、前記周辺画素が表す被写体までの距離を示す情報と、前記処理対象画素が表す被写体までの距離を示す情報との差に少なくとも基づき決定する予測画像生成部を具備することを特徴とする。
(5)また、本発明の他の態様は、上述の画像符号化装置であって、前記画面内予測部は、前記処理対象画素の画素値を予測する際に用いる周辺画素を、前記周辺画素と前記処理対象画素との距離に少なくとも基づき決定する予測画像生成部を具備することを特徴とする。
(6)また、本発明の他の態様は、符号化画像を復号する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、前記処理対象画素の画素値を予測する画面内予測を行う画像復号装置であって、前記画面内予測を行なう際に、前記周辺画素のうち、前記処理対象画素との間に前記符号化画像が表す被写体の境界がある前記周辺画素を用いることを抑制する画面内予測部を具備することを特徴とする。
(7)また、本発明の他の態様は、上述の画像復号装置であって、前記画面内予測部は、前記被写体の境界を、前記符号化画像の被写体までの距離を示す情報を用いて検出する被写体境界検出部を具備することを特徴とする。
(8)また、本発明の他の態様は、上述の画像復号装置であって、前記画面内予測部は、前記周辺画素のうち、前記処理対象画素の所定の方向に隣接する画素と、前記処理対象画素との間に前記被写体の境界がないときは、前記所定の方向に隣接する画素を用いて、前記処理対象画素の画素値を予測し、前記所定の方向に隣接する画素と、前記処理対象画素との間に前記被写体の境界があるときは、前記所定の方向に隣接する画素を用いて前記処理対象画素の画素値を予測することを抑制する予測画像生成部を具備することを特徴とする。
(9)また、本発明の他の態様は、上述の画像復号装置であって、前記画面内予測部は、前記処理対象画素の画素値を予測する際に用いる周辺画素を、前記周辺画素が表す被写体までの距離を示す情報と、前記処理対象画素が表す被写体までの距離を示す情報との差に少なくとも基づき決定する予測画像生成部を具備することを特徴とする。
(10)また、本発明の他の態様は、上述の画像復号装置であって、前記画面内予測部は、前記処理対象画素の画素値を予測する際に用いる周辺画素を、前記周辺画素と前記処理対象画素との距離に少なくとも基づき決定する予測画像生成部を具備することを特徴とする。
(11)また、本発明の他の態様は、入力画像を符号化する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、前記処理対象画素の画素値を予測する画面内予測を行う画像符号化方法であって、前記画面内予測を行なう際に、前記周辺画素のうち、前記処理対象画素との間に前記入力画像が表す被写体の境界がある前記周辺画素を用いることを抑制する過程を有することを特徴とする。
(12)また、本発明の他の態様は、符号化画像を復号する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、前記処理対象画素の画素値を予測する画面内予測を行う画像復号方法であって、前記画面内予測を行なう際に、前記周辺画素のうち、前記処理対象画素との間に前記符号化画像が表す被写体の境界がある前記周辺画素を用いることを抑制する過程を有することを特徴とする。
(13)また、本発明の他の態様は、入力画像を符号化する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、前記処理対象画素の画素値を予測する画面内予測を行う画像符号化装置のコンピュータを、前記画面内予測を行なう際に、前記周辺画素のうち、前記処理対象画素との間に前記入力画像が表す被写体の境界がある前記周辺画素を用いることを抑制する画面内予測部として機能させるためのプログラムである。
(14)また、本発明の他の態様は、符号化画像を復号する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、前記処理対象画素の画素値を予測する画面内予測を行う画像復号装置のコンピュータを、前記画面内予測を行なう際に、前記周辺画素のうち、前記処理対象画素との間に前記符号化画像が表す被写体の境界がある前記周辺画素を用いることを抑制する画面内予測部として機能させるためのプログラムである。
この発明によれば、符号量の増加を抑えつつ、画面内予測符号化における、予測画像の精度を向上させることができる。
本発明の一実施形態による画像伝送システムの構成を示すブロック図である。 同実施形態における画像符号化装置の構成を示す概略ブロック図である。 同実施形態における奥行き情報利用イントラ予測部の構成を示す概略ブロック図である。 同実施形態における4×4画素のサブブロック単位の画面内予測の予測モードを示す図である。 同実施形態における4×4画素のサブブロック単位の画面内予測の符号化順序を示す図である。 同実施形態における16×16画素単位の画面内予測の予測モードを示す図である。 同実施形態におけるデプス利用予測モード実施部の処理概念を説明する図(垂直方向)である。 同実施形態におけるデプス利用予測モード実施部の処理概念を説明する図(水平方向)である。 同実施形態におけるデプス利用予測モード実施部の構成を示す概略ブロック図である。 同実施形態における画像符号化装置が行う画像符号化処理を示すフローチャートである。 同実施形態における画像符号化装置が実行するインター予測処理を示すフローチャートである。 同実施形態における画像符号化装置が実行するイントラ予測処理を示すフローチャートである。 同実施形態における画像復号装置の構成を示す概略ブロック図である。 同実施形態における奥行き情報利用イントラ予測部の構成を示す概略ブロック図である。 同実施形態における画像復号装置が実行する画像復号処理を示すフローチャートである。 同実施形態における画像復号装置が実行するインター処理を示すフローチャートである。 同実施形態における画像復号装置が実行するイントラ処理を示すフローチャートである。
以下、図面を参照して、本発明の実施の形態について説明する。図1は、この発明の一実施形態による動画像伝送システムの構成を示す概略ブロック図である。図1に示すように、本実施形態における動画像伝送システム10は、画像符号化装置100、通信網500、画像復号装置800、表示装置600を含んで構成される。画像符号化装置100は、符号化の対象となる画像の画像信号Rと該画像に対応したデプスマップのデプスマップ信号Dとから、該画像およびデプスマップを符号化し、これらを符号化したデータである符号化データEを生成して出力する。通信網500は、画像符号化装置100が出力した符号化データEを、画像復号装置800に伝送する。画像復号装置800は、伝送されてきた符号化データEを復号し、復号結果の画像の画像信号R’を生成する。表示装置600は、液晶ディスプレイ、プラズマディスプレイなどの画像表示デバイスを有し、画像復号装置800が生成した画像信号R’が示す画像を表示する。
画像符号化装置100は、例えば、テレビジョン放送局に設けられ、放送番組を符号化する。この場合、通信網500は、放送波を用いて送信する通信網であり、画像復号装置800および表示装置600は、テレビジョン受像機に備えられる。あるいは、通信網500としてインターネットや携帯電話網などを用いてもよい。また、画像符号化装置100は、DVD(Digital Versatile Disc)やBD(Blu-ray Disc)に格納して販売されるコンテンツを編集するコンテンツホルダに設けられ、これらのコンテンツを符号化する。この場合、符号化画像EはDVD、BDなどに格納され、通信網500に変えて、配送網により、配送される。そして、画像復号装置800は、DVDプレーヤ、BDプレーヤなどに備えられる。
図2は、本実施形態に係る画像符号化装置100の構成を示す概略ブロック図である。画像符号化装置100は、画像入力部101、減算部102、直交変換部103、量子化部104、エントロピー符号化部105、逆量子化部106、逆直交変換部107、加算部108、予測方式制御部109、選択部110、デブロッキング・フィルタ部111、フレームメモリ部112、動き補償部113、動きベクトル検出部114、奥行き情報利用イントラ予測部115、デプスマップ符号化部116、デプスマップ復号部117及びデプス入力部118を含んで構成される。なお、デブロッキング・フィルタ部111と、フレームメモリ112と、動き補償部113と、動きベクトル検出114とで、インター予測部120を構成する。また、奥行き情報利用イントラ予測部115と、デプスマップ復号部117とで、イントラ予測部121を構成する。
画像入力部101は、符号化の対象となる画像(入力画像)を示す画像信号R(入力画像信号)を、一例として5フレーム毎(5フレームの種類については後述する)に、画像符号化装置100の外部から取得する。画像入力部101は、取得した入力画像信号が表す入力画像フレームを予め定めた大きさ(例えば、垂直方向16画素×水平方向16画素)のブロックに分割する。画像入力部101は、分割したブロックの各々を表す画像ブロック信号Bを、減算部102、動きベクトル検出部114及び奥行き情報利用イントラ予測部115に出力する。画像入力部101は、ブロック位置を順次変えながら、画像フレーム内のすべてのブロックについての出力が完了し、そして取得した画像が終了するまで、各画像フレームに対して、この処理を繰り返す。
本実施形態において、画像符号化装置100への入力画像は少なくとも基準画像(ベースビュー;base view)を含む。基準画像とは、立体表示用の多視点(マルチビュー;multi−view)の動画像に含まれる予め定めた一つの視点の画像であって、デプスマップを算出する基礎となる画像である。デプスマップ(depth map)は、基準画像に表された被写体の撮影装置からの奥行又は距離を表す距離情報であって、基準画像の画素毎に与えられた量子化値を含んで構成される。その量子化値の各々をデプス(depth)値といい、例えば8ビットで量子化された値をとる。
画像入力部101に入力される5フレーム毎の画像信号Rは、例えばIピクチャ(I0)、Bピクチャ(B3)、Bピクチャ(B2)、Bピクチャ(B4)及びPピクチャ(P1)の画像信号を含む。画像符号化装置100に入力される画像信号Rは、例えば、この順序(以下、入力順序)で入力される。ここで、符号(I0等)において、先頭のI等は画像の種類を示し、0等は符号化される順序(以下、符号化順序)を示す(従って、入力順序と符号化順序は異なる)。Iピクチャとは、フレーム内画像(Intra Frame Picture)であって、これを符号化した符号だけを用いて入力画像を復号できる画像である。Pピクチャとは、フレーム間順方向予測画像(Predictive Picture)であって、これを符号化した符号と、過去のフレームの画像信号を符号化した符号を用いて入力画像を復号できる画像である。Bピクチャとは、双方向予測符号化画像(Bi−directional Predictive Picture)であって、これを復号した符号と、過去もしくは未来の複数のフレームの画像信号を符号化した符号を用いて入力画像を復号できる画像である。
減算部102は、画像入力部101が出力した画像ブロック信号から、選択部110が出力した予測画像ブロック信号を減算して、差分画像ブロック信号を生成する。減算部102は、生成した差分画像ブロック信号を直交変換部103に出力する。
直交変換部103は、減算部102が出力した差分画像ブロック信号を直交変換し、種々の周波数特性の強度を示す信号を生成する。
直交変換部103は、差分画像ブロック信号を直交変換する際、その差分画像ブロック信号を、例えばDCT変換(離散コサイン変換;Discrete Cosine Transform)して周波数領域信号(例えば、DCT変換を行った場合は、DCT係数)を生成する。直交変換部103は、差分画像ブロック信号に基づき周波数領域信号を生成することができれば、DCT変換に限らず、他の方法(例えば、FFT(高速フーリエ変換;Fast Fourier Transform))を用いてもよい。直交変換部103は、生成した周波数領域信号に含まれる係数値を、量子化部104に出力する。
量子化部104は、直交変換部103が出力した各周波数特性強度を示す係数値を量子化し、生成した量子化信号ED(差分画像ブロック符号)を、エントロピー符号化部105と逆量子化部106に出力する。
逆量子化部106は、量子化部104が出力した量子化信号EDを、逆量子化して復号周波数領域信号を生成し、逆直交変換部107に出力する。
逆直交変換部107は、入力された復号周波数領域信号を、例えば逆DCT変換して空間領域信号である復号差分画像ブロック信号を生成する。逆直交変換部107は、復号周波数領域信号に基づき空間領域信号を生成することができれば、逆DCT変換に限らず、他の方法(例えば、IFFT(高速フーリエ逆変換;Inverse Fast Fourier Transform))を用いてもよい。
逆直交変換部107は、生成した復号差分画像ブロック信号を加算部108に出力する。
加算部108は、選択部110から予測画像ブロック信号を取得し、逆直交変換部107から復号差分画像ブロック信号を取得する。加算部108は、予測画像ブロック信号に復号差分画像ブロック信号を加算し、入力画像を符号化・復号した参照画像ブロック信号RBを生成する(内部デコード)。この参照画像ブロック信号RBは、インター予測部120及びイントラ予測部121に出力される。
インター予測部120は、加算部108より参照画像ブロック信号RBを取得し、画像入力部101より画像ブロック信号を取得する。インター予測部120は、これらの信号を用いてインター予測し、インター予測画像ブロック信号を生成する。インター予測部120は、生成したインター予測画像ブロック信号を予測方式制御部109と選択部110に出力する。同時に、インター予測部120は、生成したインター予測符号化情報を、予測方式制御部109に出力する。インター予測部120については後述する。
イントラ予測部121は、加算部108より参照画像ブロック信号RBを取得し、画像入力部101より画像ブロック信号を取得し、デプスマップ符号化部116よりデプスマップ符号化データを取得する。イントラ予測部121は、これらの信号およびデータを用いてイントラ予測し、イントラ予測画像ブロック信号を生成する。イントラ予測部121は、生成したイントラ予測画像ブロック信号を、予測方式制御部109と選択部110に出力する。同時に、イントラ予測部121は、生成したイントラ予測符号化情報を、予測方式制御部109に出力する。イントラ予測部121については後述する。
デプス入力部118は、画像入力部101に入力される入力画像に対応するデプスマップのデプスマップ信号Dを、画像符号化装置100の外部より取得する。デプス入力部118は、取得したデプスマップを、画像入力部101において分割された入力画像ブロックと同じ位置でかつ、同じブロックサイズとなるように、分割(デプスブロック信号)し、デプスマップ符号化部116に出力する。デプスマップ符号化部116は、デプス入力部118が出力したデプスブロック信号を、例えば可変長符号化(エントロピー符号化)を用いて符号化し、データ量がより圧縮されたデプスマップ符号化データE2を生成する。デプスマップ符号化部116は、生成したデプスマップ符号化データE2をイントラ予測部121と画像符号化装置100の外部(例えば、通信網500を介して画像復号装置800)に出力する。
続いて、インター予測部120について説明する。インター予測部120は、デブロッキング・フィルタ部111、フレームメモリ112、動き補償部113、及び動きベクトル検出部114より構成される。
デブロッキング・フィルタ部111は、加算部108より参照画像ブロック信号RBを取得し、画像の符号化時に発生するブロック歪みを減少させるための、例えば公知の符号化方法(例えば、H.264 Reference Software JM ver. 13.2 Encoder, http://iphome.hhi.de/suehring/tml/, 2008)で用いられたFIR(Finite Impulse Response;有限インパルス応答)フィルタ処理を行う。デブロッキング・フィルタ部111は、処理結果(補正ブロック信号)をフレームメモリ112に出力する。
フレームメモリ112は、デブロッキング・フィルタ部111が出力した補正ブロック信号を、フレーム番号を同定できる情報と共に、該フレーム番号の画像の一部として保持する。
動きベクトル検出部114は、画像入力部101より入力される画像ブロック信号に類似するブロックを、フレームメモリ112に蓄積された画像より探し出し(ブロックマッチング)、探し出したブロックを表すベクトル情報(動きベクトル)を生成する。動きベクトル検出部114は、ブロックマッチングを行う際、当該分割されたブロックとの間の指標値を領域毎に算出し、算出した指標値が最小となる領域を探し出す。入力画像信号がBピクチャである場合は、動きベクトル検出部114は、その指標値が最小となる参照画像の領域におけるブロックと、次に指標値が小さい参照画像の領域におけるブロックと、2つの領域を探し出す。
指標値は、画像信号間の相関性や類似性を示すものであればよい。動きベクトル検出部114は、例えば、分割されたブロックに含まれる画素の輝度値と参照画像のある領域における輝度値の差の絶対値総和(SAD;Sum of Absolute Difference)を用いる。入力画像信号から分割されたブロック(例えば、大きさがN×N画素)と参照画像信号のブロックとの間のSADは次の式(1)で表される。
Figure 2014150297
式(1)において、Iin(i+i,j+j)は入力画像の座標(i+i,j+j)における輝度値、(i,j)は当該分割されたブロックの左上端の画素座標を示す。Iref(i+i+p,j+j+q)は参照画像の座標(i+i+p,j+j+q)における輝度値、(p,q)は当該分割されたブロックの左上端の座標を基準にしたシフト量(動きベクトル)である。
即ち、動きベクトル検出部114は、ブロックマッチングにおいて、(p,q)毎にSAD(p,q)を算出し、SAD(p,q)を最小とする(p,q)を探し出す。(p,q)は、入力画像中の当該分割されたブロックから参照画像中の当該参照領域の位置までのベクトル(動きベクトル)を表す。
動き補償部113は、動き検出ベクトル検出114より動きベクトルを取得し、該当する参照ブロックをインター予測画像ブロック信号として、予測方式制御部109と選択部110に出力する。動き補償部113は、動き検出部114が出力した動きベクトルが1つの場合には、該当する画像ブロックを出力し、動き検出部114が出力した動きベクトルが2つの場合には、該当する2つの画像ブロックを平均化して出力する。動き補償部113は、予測に必要な情報(以下、インター予測符号化情報)、例えば動きベクトルを予測方式制御部109へ出力する。
続いて、イントラ予測部121について説明する。イントラ予測部121は、デプスマップ復号部117、及び奥行き情報利用イントラ予測部115より構成される。
デプスマップ復号部117は、デプスマップ符号化部116が出力したデプスマップ符号化データを、例えば可変長復号を用いて情報量がより多いデプスブロック信号を復号する。デプスマップ復号部117は、復号したデプスマップD’(デプスブロック復号信号)を奥行き情報利用イントラ予測部115に出力する。
図3は、本実施形態に係る奥行き情報利用イントラ予測部115の構成を示す概略ブロック図である。図3を用いて、奥行き情報利用イントラ予測部115の処理について説明する。奥行き情報利用イントラ予測部115は、具体的には、第1予測モード実施部200−1〜第n予測モード実施部200−n(nは1以上の自然数、例えば6)、デプス利用予測モード実施部201、及び予測モード選択部202を含んで構成される。
第1予測モード実施部200−1〜第n予測モード実施部200−nは、加算部108が出力した参照画像ブロック信号RBから各予測モード(予測画像ブロックの生成方式)による処理に従って第1〜第n予測画像ブロック信号をそれぞれ生成する。第1予測モード実施部200−1〜第n予測モード実施部200−nは、生成した第1〜第n予測画像ブロック信号を予測モード選択部202に出力する。
第1予測モード実施部200−1〜第n予測モード実施部200−nの各々は、例えば従来の画面内予測モード(例えば、H.264 Reference Software JM ver. 13.2 Encoder, http://iphome.hhi.de/suehring/tml/, 2008)のいずれかを用いて、画面内予測(イントラ予測)を実施する。H.264では、マクロブロックをさらに分割した4×4画素のサブブロックに適用する9種類の画面内予測と、マクロブロック単位に適用する4種類の画面内予測方式がある(なお、8×8画素のサブブロックを用いた画面内予測については、H.264 FRExtにて策定されている。4×4画素と同じ画面内予測方式が適用される。)。
具体的には、第1予測画像生成部200−1は、例えば4×4のサブブロックを用いたイントラ予測(画面内予測)を行う。第2予測画像生成部200−2は、例えば8×8のサブブロックを用いたイントラ予測を行う。第3予測画像生成部200−3〜第6予測画像生成部200−6は、例えば16×16のマクロブロック単位の4種類の予測方式を行う。
第1予測画像生成部200−1は、加算部108が出力した参照画像ブロック信号をさらに4×4のサブブロックサイズに分割をし、図5に示した順番で4×4画素単位の予測方式を実行する。すなわち、16×16画素のブロックを、4つの8×8画素のブロックに分割し、これらを左上、右上、左下、右下の順に処理する。そして、これらの8×8画素のブロックの各々については、それぞれを、4つの4×4画素のサブブロックに分割し、これら各々の8×8画素のブロック内で、左上、右上、左下、右下の順にイントラ予測を行う。
4×4画素のサブブロックの予測方式は、図4に示したように予測モード0から予測モード8までの9種類の予測方式がある。第1予測画像生成部200−1は、9種類の予測方式の各々で生成した4×4画素の予測画像ブロックと、画像入力部101が出力した画像ブロック信号Bの対応するサブブロックとの間の相関度を示す指標を算出し、その指標に基づき、サブブロック毎に予測方式を選択する。第1予測画像生成部200−1は、その指標として例えば、輝度値の差の絶対値総和(SAD)を算出し、SADの値が一番小さくなる予測方式を該当する4×4画素のサブブロック予測方式として選択し、対応する位置の第1予測画像ブロック信号を生成する。また、その予測方式を保持しておく。
第1予測画像生成部200−1は、16×16画素分の予測方式と第1予測画像ブロック信号が生成されるまで上記処理を繰り返す。
第2予測画像生成部200−2は、加算部108が出力した参照画像ブロック信号RBをさらに4つの8×8画素のサブブロックに分割し、第1予測画像生成部200−1で用いた予測モード0から予測モード8と同様の9種類の予測方式を8×8画素のサブブロックの各々に適用し、予測画像を生成する。同時に、その予測方式を保持しておく。
第2予測画像生成部200−2は、上記処理を繰り返し、順次8×8画素のサブブロック単位で予測方式を確定させ、16×16画素ブロックの全ての予測方式と、その予測方式による予測画像ブロック信号を生成する。
第3予測画像生成部200−3から第6予測画像生成部200−6は、16×16画素単位のイントラ予測(画面内予測)で、加算部108が出力した参照画像ブロック信号を用いて、図6の予測モード0から予測モード3に対応する予測画像ブロック信号をそれぞれ生成する。
デプス利用予測モード実施部201は、加算部108より参照画像ブロック信号とデプスマップ復号部117よりデプスブロック復号信号を取得し、デプスマップを用いて、被写体の境界を跨ぐ予測を抑制した画面内予測を行う。デプス利用予測モード実施部201の詳細については後述する。デプス利用予測モード実施部201は、予測画像ブロック信号と予測方式を予測モード選択部202に出力する。
予測モード選択部202は、第1予測モード実施部200−1から第n予測モード実施部200−n、およびデプス利用予測モード実施部201が生成した予測画像ブロック信号と予測に必要な情報を取得する。予測に必要な情報とは、例えば16×16画素をサブブロックにさらに分割して処理を行う第1予測モード実施部200−1、及び第2予測モード実施部200−2の各サブブロックに適用された予測モードを示す情報や、デプス利用予測モード実施部201の予測の方向を示す予測モードを示す情報である。
予測モード選択部202は、取得した予測画像ブロック信号の中から(デプス利用予測モード実施部201が出力する予測画像ブロック信号も含む)、最も指標値が小さくなる1つの予測画像ブロック信号を選択する。予測モード選択部202は、その指標値として、例えば次式で示すように、画像入力部101から入力された入力画像に含まれる該当する画像ブロックの輝度値Iin(i+i,j+j)と候補予測画像ブロックの輝度値Ip,m(i+i,j+j)とのSADを用いる。
Figure 2014150297
式(2)において、mは、どの予測モード実施部のどの予測モードであるかを表すインデックスである。したがって、Ip,m(x,y)は、予測モードmによる予測画像の座標x,yにおける輝度値である。また、i0、j0は、当該ブロックの左上頂点の座標であり、Nはブロックの大きさ(一辺の画素数)である。なお、本実施形態には、SAD以外にも指標値として入力画像に含まれる画像ブロックと候補予測画像ブロックの相関、類似度、又は符号化後の情報量など、予測モード毎の処理の有効性を表す変数であれば利用することができる。
予測モード選択部202は、この予測モードを表すインデックスを含む予測モード情報を生成する。あるいは、予測モード選択部202は、予測に必要な情報が存在する予測モードを選択した場合(具体的には、第1予測モード実施部200−1、第2予測モード実施部200−2及びデプス利用予測モード実施部201の予測モード)には、インデックスとこの予測に必要な情報をまとめて、予測モード情報を生成する。
予測モード選択部202は、選択した予測画像ブロック信号(以下、イントラ予測画像ブロック信号)を選択部110と予測方式制御部109へ、また前記予測モード情報(以下、イントラ予測符号化情報)を予測方式制御部109へ出力する。
図2に戻り、予測方式制御部109は、入力画像のピクチャの種類と、インター予測部120より入力されるインター予測画像ブロック信号とそのインター予測符号化情報、及びイントラ予測部121より入力されるイントラ予測画像ブロック信号とそのイントラ符号化情報とに基づいて予測方式を決め、その予測方式の情報を選択部110とエントロピー符号化部105に出力する。予測方式制御部109は、入力画像のピクチャの種類を監視し、入力画像がIピクチャの場合はイントラ予測方式を選択する。PピクチャやBピクチャの場合には、予測方式制御部109は、エントロピー符号化部105で行う符号化により生成されるビット数と減算部102の原画像との残差から、例えば従来の手法(例えば、H.264 Reference Software JM ver. 13.2 Encoder, http://iphome.hhi.de/suehring/tml/, 2008)を用いてラグランジュコストを算出し、インター予測方式とイントラ予測方式のいずれかを選択する。
予測方式制御部109は、インター予測符号化情報もしくはイントラ予測符号化情報のうち、前記選択した予測方式に対応する符号化情報に予測方式を特定できる情報を付加し予測符号化情報として、エントロピー符号化部105に出力する。
選択部110は、予測方式制御部109より入力される予測方式の情報に従って、インター予測部120より入力されるインター予測画像ブロック信号、あるいはイントラ予測部121より入力されるイントラ予測画像ブロック信号を選択して、減算部102及び加算部108に予測画像ブロック信号を出力する。選択部110は、予測方式制御部109より入力される予測方式がインター予測である場合には、インター予測部120より入力されるインター予測画像ブロック信号を選択して出力し、予測方式制御部109より入力される予測方式がイントラ予測である場合は、イントラ予測部121より入力されるイントラ予測画像ブロック信号を選択して出力する。
エントロピー符号化部105は、量子化部104より入力される差分画像符号と、予測方式制御部109より入力される予測符号化情報をパッキング(packing;詰込)し、例えば可変長符号化(エントロピー符号化)を用いて符号化し、情報量がより圧縮された符号化データE1を生成する。エントロピー符号化105は、生成した符号化データE1を画像符号化装置100の外部(例えば、通信網500を介して、画像復号装置800)に出力する。
<デプス利用予測モード実施部 処理概要>
次に、デプス利用予測モード実施部201によって、予測画像ブロックを生成する方法について説明する。
画面内予測は、前述のように周囲の画素を用いて処理対象ブロックの画素の予測を行っている。具体的には、画面内予測は、処理の完了した周辺の画素を予測の方向に順次コピーしていくことで予測画像ブロック信号を作成する。
従って、テクスチャの特性が大きく変わらない平坦な領域は、この画面内予測によって処理対象ブロックの画素を精度よく予測することが可能で、処理対象ブロックの画素と予測ブロックの画素の差(残差)を小さくすることができ、その結果、符号量を小さく(あるいは、復号時の誤差を小さく)することができる。
一方、異なる被写体は、一般的にテクスチャの特性が大きく異なる。しかしながら、画面内予測は、異なる被写体間をまたがる領域においても、一様に処理がなされるために、予測精度が落ち、符号量を増加させる問題がある。
ここで、異なる被写体は、同一距離でお互いに接している場合を除いて、異なるデプス値を持っていることが多い。つまり、デプス値の違いを利用(例えば、デプス値のエッジを検出)することで、異なる被写体を分離する(異なる被写体の境界を検知)ことが可能である。
この情報を用いて、上記画面内予測の画素の予測を制御することで予測精度を向上させることができる。具体的には、以下のとおりである。
本実施形態におけるデプス利用予測モード実施部201が実施するデプスを利用した画面内予測の予測方向は、図6に示す垂直方向の予測(予測モード0)と水平方向の予測(予測モード1)である。但し、以下に説明する処理を適用できる場合(但し、図6の予測モード2を除く)には、その他の予測の方向を用いることも可能である。また、図4におけるサブブロック単位の予測方式(但し、予測モード2を除く)に対しても、以下に説明する処理を適用することも可能である。つまり、本実施形態のように、従来の予測モードを残したまま新たな予測モードとして追加するようにしてもよいし、デプス利用予測モード実施部201による予測方式を従来の方式に置き換えて用いることで、モード数を増やさないようにしてもよい。以下は、デプス利用予測モードを新たに追加する例について記載する。
図7、図8は、デプス利用予測モード実施部201の処理概念を説明するための図である。図7、図8において、円で示した図形は、処理の完了した画素を示しており、予測画素ブロックを生成する際に参照することができる。また、四角で示した図形は、処理対象画素を示しており、周辺の参照できる画素を用いて予測される対象である。さらに、矢印は、予測の方向を示しており、参照できる画素を矢印の方向に順次予測(具体的には、単純にコピー)していく。すなわち図7の予測モードでは、垂直方向に画素値をコピーし、図8の予測モードでは、水平方向に画素値をコピーする。図7、図8において、太い破線は、被写体の境界を示す。
図9は、本実施形態に係るデプス利用予測モード実施部201の構成を示す概略ブロック図である。図9に示すように、デプス利用予測モード実施部201は、境界制御予測画像生成部300、境界予測制御部301、及び被写体境界検出部302を含んで構成される。
被写体境界検出部302は、処理対象の画像ブロック信号Bに対応する画素のデプス値を表すデプスブロック信号を、デプスマップ復号部117より取得し、デプスのエッジを検出する。デプスのエッジの検出は、デプスマップの隣接画素の差分を閾値処理することによって行う。デプスのエッジが水平方向に存在するか否かの判定は、式(3)に示すように、垂直方向に隣接する画素の差の絶対値が閾値Tよりも大きいか否かにより行う。同様に、デプスのエッジが垂直方向に存在するか否かの判定は、水平方向に隣接する画素の差の絶対値が閾値Tよりも大きいか否かにより行う。
Figure 2014150297
ここで、D(i,j)は、画素位置(i,j)におけるデプスマップ値を表す。T、Tは、それぞれ水平方向と垂直方向にエッジが存在するか否かを判定する際に用いる閾値である。具体的には、閾値は、例えば10である。
上記方法によるデプスエッジの検出結果の一例として、図7、図8の太点線の様にデプスエッジが検出された場合について説明する。図7の垂直方向予測モードと、図8の水平方向予測モードにおいて、デプスエッジの位置は、同じである。図7、図8の例では、予測対象ブロックを左右に分割するように、デプスのエッジが存在している。この場合、処理対象ブロック内の左側と右側において異なる被写体が映っている可能性が高い。従来の垂直方向の予測、あるいは、水平方向の予測では、このエッジを跨るところ、及び予測方向におけるその先の画素において、予測精度が著しく低下する。
境界予測制御部301は、被写体境界検出部302から入力される水平方向と垂直方向の被写体の境界情報(デプスエッジ)を用いて、境界制御予測画像生成部300で行う予測を制御する。具体的には、境界予測制御部301は、予測方向に対して垂直なデプスエッジが存在する場合、予測方向に隣接する画素からコピーすることを抑制する制御を行う。予測方向に画素をコピーすることを抑制する制御とは、例えば、境界制御予測画像生成部300における処理を、以下の様に制御することである。
境界制御予測画像生成部300は、加算部108より参照画像ブロック信号RBを取得し、以下のように予測画像ブロック信号を生成する。境界制御予測画像生成部300の予測モードには、本実施形態では、図7に示すように予測方向が垂直である予測モードと、図8に示すように予測方向が水平である予測モードとがある(2種類の予測画像ブロック信号を生成する)。境界予測制御部301は、処理対象画素と、その予測方向の一つ前の画素との間に被写体の境界が存在しないとき、すなわち予測方向に垂直な方向にデプスのエッジが存在しないときは、境界制御予測画像生成部300に従来の予測方法と同様に処理させる。すなわち、境界予測制御部301は、予測方向における処理対象画素の一つ前の画素値をコピーするように、境界制御予測画像生成部300を制御する。
例えば、図7において、処理対象画素がQv1のとき、予測方向に一つ前の画素であるPv1との間には、デプスエッジが存在しない。このため、境界予測制御部301は、画素Pv1の画素値をコピーして、画素Qv1の画素値とするように、境界制御予測画像生成部300を制御する。水平方向についても同様(図8の画素Ph2から画素Qh2への処理など)である。一方、予測方向に垂直な方向にエッジが存在する場合は、境界予測制御部301は、境界制御予測画像生成部300に対して、以下の処理を実施するように制御する。
境界制御予測画像生成部300は、予測方向に垂直なデプスエッジが存在する場合には、以下の式によって、予測画素を生成する。
Figure 2014150297
式(5)は、垂直方向の予測モードにおいて、水平方向にデプスのエッジが存在する場合に、予測画素を生成するための式である。式(6)は、水平方向の予測モードにおいて、垂直方向にデプスのエッジが存在する場合に、予測画素を生成するための式である。基本的な処理は、水平方向と垂直方向で同じであるため、以下は水平方向の式(5)について説明する。
式(5)において、左辺のG[x]は、画素xの予測画素値である。右辺のpre={Pv1,…,Pv16}が付されたargmin{}は、preを、画素Pv1〜Pv16のいずれかとしたときに、argmin{}内の評価式が最小となるpreを示す関数である。従って、評価式を最小にする画素値が、pre={Pv1,…,Pv16}(処理を行っている画素の一つ前のラインに存在する画素)の中から選択され、左辺の処理対象画素の画素値としてコピーされる。
評価式は、2つの項から形成されている。第1項(|D(Qvi)−D(pre)|)は、処理対象画素のデプス値と、前記preの中の各画素に対応したデプス値の差の絶対値を表す。第2項(Dis(Qvi,pre))は、処理対象画素の位置と、前記preの中の各画素の画素位置の間の距離を表す。それぞれの項の意味は、第1項は、処理対象画素に映っている被写体と同一と考えられる被写体を映している画素をできるだけ参照できるように、デプス値の近い画素を選択するように制御する項である。すなわち、当該項も、境界予測制御部301による制御と同様に、処理対象画素との間に被写体の境界がある画素を用いることを抑制するようになっている。第2項は、処理対象画素と近い画素をできるだけ選択するようにする項である。また、各項に積算されている、αとβは、第1項と第2項との間の重みづけを変えるための定数である。具体的には、例えばαは0.1、βは1.0である。
なお、上述の式(5)(6)では、第1項と第2項との和を評価式に用いているが、比を用いるようにしてもよい。また、第1項のみを用いるようにしてもよい。
また、本実施形態では、処理対象の画素と、予測方向に一つ前の画素との間にデプスエッジがあるときにのみ、上述の式(5)(6)を用いるようにしているが、常に上述の式(5)(6)を用いるようにしてもよい。
このように、境界予測制御部301は、処理対象の画素と、予測方向(所定の方向)に一つ前の画素(隣接する画素)との間にデプスエッジ(被写体の境界)があるときは、境界制御予測画像生成部300が上述の式(5)(6)を用いるようにすることで、予測方向に一つ前の画素の画素値を用いることを抑制している。
また、上述の式(5)(6)は、第1項が、処理対象画素と、予測方向に一つ前の列(または行)の画素(周辺画素)とのデプス値の差となっているので、処理対象画素との間に被写体の境界があり、デプス値の差が大きくなっている周辺画素を用いることを抑制することができる。
境界制御予測画像生成部300は、水平方向と垂直方向に予測した予測画像ブロックを生成する。境界制御予測画像生成部300は、画像入力部101より入力された画像ブロックと前記2種類の予測モード各々で予測した予測画像ブロックの相関性を、例えばSAD値を用いて判定する。境界制御予測画像生成部300は、この判定の結果、より相関性の高い(類似した)予測画像ブロックを選択して、予測モード選択部202に出力する。境界制御予測画像生成部300は、選択した予測画像ブロックの予測モードを示す予測符号化情報も、予測モード選択部202に出力する。
このように、被写体までの距離を示すデプスマップの境界(被写体境界)において、連続するような画面内画素予測を抑制する制御を行うので、予測精度を向上させることが可能である。
<画像符号化装置100フローチャート>
次に、本実施形態に係る画像符号化装置100が行う画像符号化処理について説明する。図10は、本実施形態に係る画像符号化装置100が行う画像符号化処理を示すフローチャートである。
(ステップS201)画像符号化装置100は、外部からフレームごとの画像とそれに対応するデプスマップを取得する。その後、ステップS202に進む。
(ステップS202)画像入力部101は、画像符号化装置100の外部から取得したフレームごとの入力画像信号を予め定めた大きさ(例えば、垂直方向16画素×水平方向16画素)のブロックに分割して、減算部102とインター予測部120及びイントラ予測部121に出力する。また、デプス入力部118は、画像入力部101に入力された画像と同期されたデプスマップを、画像入力部101で実施された画像の分割と同様に分割して、デプスマップ符号化部116に出力する。
画像符号化装置100は、ステップS203−ステップS211の処理をフレーム内の画像ブロック毎に繰り返す。
(ステップS203)デプスマップ符号化部116は、デプス入力部118から入力されるデプスマップを符号化して、データ量がより圧縮されたデプスマップ符号化データを、イントラ予測部121と画像符号化装置100の外部に(例えば、画像復号装置800)に出力する。その後、ステップS204の処理とステップS205の処理とを並行して行う。
(ステップS204)インター予測部120は、画像入力部101から画像ブロック信号を取得し、加算部108より復号された参照画像ブロック信号を取得する。インター予測部120は、取得したこれらの信号を用いて、インター予測を実施する。インター予測部120は、インター予測により生成したインター予測画像ブロック信号を予測方式制御部109と選択部110に、インター予測符号化情報を予測方式制御部109に出力する。なお、最初の処理において、加算部108の処理が完了していない場合には、加算部108からは、リセットされた画像ブロック(全ての画素値が0の画像ブロック信号)を取得する。インター予測部120の処理が完了すると、ステップS206に進む。
(ステップS205)イントラ予測部121は、画像入力部101から画像ブロック信号を取得し、デプスマップ符号化部116からデプスマップ符号化データを取得し、加算部108より復号された参照画像ブロック信号を取得する。イントラ予測部121は、これらの取得した信号を用いて、イントラ予測を実施する。イントラ予測部121は、イントラ予測により生成したイントラ予測画像ブロック信号を予測方式制御部109と選択部110に、イントラ予測符号化情報を予測方式制御部109に出力する。なお、最初の処理において、加算部108の処理が完了していない場合には、リセットされた画像ブロック(全ての画素値が0の画像ブロック)を取得する。イントラ予測部121の処理が完了すると、ステップS206に進む。
(ステップS206)予測方式制御部109は、インター予測部120よりインター予測画像ブロック信号とインター予測符号化情報を受け取り、イントラ予測部121よりイントラ予測画像ブロック信号とイントラ予測符号化情報を受取る。予測方式制御部109は、上記ラグランジュコストに基づいて、符号化効率の良い予測モードを選択する。予測方式制御部109は、選択した予測モードを示す情報を選択部110に出力する。予測方式制御部109は、選択した予測モードに対応する予測符号化情報をエントロピー符号化部105に出力する。
選択部101は、予測方式制御部109から入力される予測モード情報に従って、インター予測部120から入力されるインター予測画像ブロック信号、あるいはイントラ予測部121から入力されるイントラ予測画像ブロック信号を選択して、減算部102と加算部108に出力する。その後、ステップS207に進む。
(ステップS207)減算部102は、画像入力部101が出力した画像ブロック信号から選択部110が出力した予測画像ブロック信号を減算し、差分画像ブロック信号を生成する。減算部102は、差分画像ブロック信号を直交変換部103に出力する。その後、ステップS208に進む。
(ステップS208)直交変換部103は、減算部102から差分画像ブロック信号を取得し、上記直交変換を実施する。直交変換部103は、直交変換後の信号を量子化部104に出力する。量子化部104は、直交変換部103から入力された信号を、上記量子化処理を実施し、差分画像符号を生成する。量子化部104は、差分画像符号を、エントロピー符号化部105と逆量子化部106に出力する。
エントロピー符号化部105は、量子化部104から入力される差分画像符号と予測方式制御部109から入力される予測符号化情報をパッキング(packing;詰込)し、可変長符号化(エントロピー符号化)を行い、情報量がより圧縮された符号化データE1を生成する。エントロピー符号化部105は、符号化データE1を画像符号化装置100の外部に(例えば、画像復号装置800)に出力する。その後、ステップS209に進む。
(ステップS209)逆量子化部106は、量子化部104から差分画像符号EDを取得し、量子化部104で実施した量子化の逆の処理を行う。逆量子化部106は、この処理により生成された信号を逆直交変換部107に出力する。逆直交変換部107は、逆量子化部106から逆量子化された信号を取得し、直交変換部103で実施した直交変換処理の逆直交変換処理を実施し、差分画像(復号差分画像ブロック信号)を復号する。逆直交変換部107は、復号された差分画像ブロック信号を加算部108に出力する。その後、ステップS210に進む。
(ステップS210)加算部108は、逆直交変換部107が出力した復号された差分画像ブロック信号に、選択部110が出力した予測画像ブロック信号を加算して、入力画像を復号する(参照画像ブロック信号)。加算部108は、参照画像ブロック信号を、インター予測部120とイントラ予測部121に出力する。その後、ステップS211に進む。
(ステップS211)画像符号化装置100が、フレーム内の全ブロックについてステップS203−S210の処理が完了していない場合、処理対象となるブロックを変更してステップS202に戻る。全ての処理が完了している場合、終了する。
図11は、インター予測部120の処理を説明するフローチャートである。
(ステップS301)デブロッキング・フィルタ部111は、インター予測部120の外部である加算部108から参照画像ブロック信号を取得し、上記FIRフィルタ処理を実施する。デブロッキング・フィルタ部111は、フィルタ処理後の補正ブロック信号をフレームメモリ112に出力する。その後、ステップS302に進む。
(ステップS302)フレームメモリ112は、デブロッキング・フィルタ部111の補正ブロック信号を取得し、フレーム番号を同定できる情報と共に画像の一部として補正ブロック信号を保持しておく。その後、ステップS303に進む。
(ステップS303)動きベクトル検出部114は、画像入力部101から画像ブロック信号を受取ると、画像入力部101が出力した画像ブロックに類似するブロックを、フレームメモリ112に蓄積された画像より探し出し(ブロックマッチング)、探し出したブロックを表すベクトル情報(動きベクトル)を生成する。動きベクトル検出部114は、検出したベクトル情報を含めた符号化のために必要な情報を動き補償部113に出力する。その後、ステップS304に進む。
(ステップS304)動き補償部113は、動きベクトル検出114から符号化のために必要な情報を取得し、該当する予測ブロックをフレームメモリより抽出する。動き補償部113は、フレームメモリより抽出した予測画像ブロック信号をインター予測画像ブロック信号として予測方式制御部109と選択部110に出力する。同時に、動き補償部113は、動きベクトル検出部114より取得した予測に必要な情報を予測方式制御部109に出力する。その後、インター予測を終了する。
図12は、イントラ予測部121の処理を説明するフローチャートである。
(ステップS401)デプスマップ復号部117は、デプスマップ符号化部116からデプスマップ符号化データE2を取得し、例えば可変長復号を用いて情報量がより多いデプスマップを復号する。デプスマップ復号部117は、復号したデプスマップ(デプスブロック復号信号)を奥行き情報利用イントラ予測部115に出力する。その後、ステップS402に進む。
(ステップS402)第1予測モード実施部200−1〜第n予測モード実施部200−nは、加算部108から取得した参照画像ブロック信号から各予測モード(予測画像ブロックの生成方式)による処理に応じて第1〜第n予測画像ブロック信号をそれぞれ生成する。第1予測モード実施部200−1〜第n予測モード実施部200−nは、生成した第1〜第n予測画像ブロック信号を予測モード選択部200に出力する。
デプス利用予測モード実施部201は、加算部108から取得した参照画像ブロック信号とデプスマップ復号部117から取得したデプスブロック復号信号より、デプスを利用した予測画像ブロック信号を生成し、予測モード選択部202に出力する。その後、ステップS403に進む。なお、デプス利用予測モード実施部201が行う予測画像生成処理については前述のとおりである。
(ステップS403)予測モード選択部202は、第1予測モード実施部200−1から第n予測モード実施部200−n、およびデプス利用予測モード実施部201から予測画像ブロック信号と予測に必要な情報を入力する。
予測モード選択部202は、前記入力した予測画像ブロック信号の中から(デプス利用予測モード実施部から入力される予測画像ブロック信号も含む)、上記方法により符号化の効率の良い予測モードを選択し、対応する予測モード情報を生成する。
予測モード選択部202は、選択した予測画像ブロック信号(以下、イントラ予測画像ブロック信号)を選択部110と予測方式制御部109へ、また前記予測モード情報(以下、イントラ予測符号化情報)を予測方式制御部109へ出力する。その後、イントラ予測を終了する。
次に、本実施形態に係る画像復号装置800について説明する。図13は、本実施形態に係る画像復号装置800の構成を示す概略ブロック図である。画像復号装置800は、符号化データ入力部813、エントロピー復号部801、逆量子化部802、逆直交変換部803、加算部804、予測方式制御部805、選択部806、デブロッキング・フィルタ部807、フレームメモリ808、動き補償部809、奥行き情報利用イントラ予測部810、デプスマップ復号部811、画像出力部812、及びデプスマップ符号化データ入力部814を含んで構成される。なお、デブロッキング・フィルタ部807と、フレームメモリ808と、動き補償部809とでインター処理部820を構成する。また、奥行き情報利用イントラ予測部810と、デプスマップ復号部811とでイントラ処理部821を構成する。
符号化データ入力部813は、外部(例えば、画像符号化装置100)から取得した符号化データE1を、処理ブロック単位に分割して、エントロピー復号部801に出力する。符号化データ入力部813は、ブロック位置を順次変えながら、フレーム内のすべてのブロックが完了し、そして取得した符号データが終了するまで繰り返して出力する。
エントロピー復号部801は、符号化データ入力部813から取得した処理単位に分割された符号化データを、エントロピー符号化部105が行った符号化方法(例えば、可変長符号化)と逆の処理(例えば、可変長復号)であるエントロピー復号して、差分画像ブロック符号と予測符号化情報PEを生成する。エントロピー復号部801は、差分画像ブロック符号を逆量子化部802に、予測符号化情報PEを予測方式制御部805に出力する。
逆量子化部802は、エントロピー復号部801から入力された差分画像ブロック符号を、逆量子化して復号周波数領域信号を生成し、逆直交変換部803に出力する。
逆直交変換部803は、逆量子化部802が出力した復号周波数領域信号を、例えば逆DCT変換して空間領域信号である復号差分画像ブロック信号を生成する。逆直交変換部803は、復号周波数領域信号に基づき空間領域信号を生成することができれば、逆DCT変換に限らず、他の方法(例えば、IFFT(高速フーリエ逆変換;Inverse Fast Fourier Transform))を用いてもよい。
逆直交変換部803は、生成した復号差分画像ブロック信号を加算部804に出力する。
予測方式制御部805は、エントロピー復号部801から入力される予測符号化情報PEの中から、画像符号化装置100で採用されたマクロブロック単位の予測方式を取り出す。ここで予測方式は、インター予測あるいはイントラ予測である。予測方式制御部805は、抽出した予測方式に関する情報を選択部806に出力する。また、予測方式制御部805は、エントロピー復号部801が出力した予測符号化情報PEの中から抽出した予測方式に対応する予測符号化情報を取り出し、抽出した予測方式に対応する処理部に予測符号化情報を出力する。予測方式制御部805は、予測方式がインター予測である場合には、インター処理部820にインター予測符号化情報を出力する。予測方式制御部805は、予測方式がイントラ予測である場合には、イントラ処理部821にイントラ予測符号化情報を出力する。
選択部806は、予測方式制御部805から入力された予測方式の情報に従って、後述するインター処理部820が出力するインター予測画像ブロック信号、あるいは後述するイントラ処理部821が出力するイントラ予測画像ブロック信号を選択する。予測方式が、インター予測の場合には、インター予測画像ブロック信号を選択する。予測方式が、イントラ予測の場合には、イントラ予測画像ブロック信号を選択する。選択部806は、選択した予測画像ブロック信号を、加算部804に出力する。
加算部804は、逆直交変換部803が出力した復号差分画像ブロック信号に、選択部806が出力した予測画像ブロック信号を加算し、復号画像ブロック信号を生成する。加算部804は、復号した復号画像ブロック信号を、インター処理部820とイントラ処理部821、及び画像出力部812に出力する。
続いて、インター処理部820について説明する。インター処理部820は、デブロッキング・フィルタ部807、フレームメモリ808、及び動き補償部809より構成される。
デブロッキング・フィルタ部807は、加算部804から入力される復号画像ブロック信号に対して、デブロッキング・フィルタ部111で行うFIRフィルタと同じ処理を行い、その処理結果(補正ブロック信号)をフレームメモリ808に出力する。
フレームメモリ808は、デブロッキング・フィルタ部807から補正ブロック信号を取得し、フレーム番号を同定できる情報と共に画像の一部として補正ブロック信号を保持しておく。
動き補償部809は、予測方式制御部805よりインター予測符号化情報を取得し、その中から参照画像情報と予測ベクトル情報(動きベクトル)を取り出す。動き補償部809は、取り出した参照画像情報と予測ベクトル情報に基づいて、フレームメモリ808に蓄積されている画像の中から対象の画像ブロック信号(予測画像ブロック信号)を抽出する。動き補償部809は、上記予測ベクトル(動きベクトル)が1つの場合には、該当する画像ブロックをフレームメモリ808より1つ取り出し、選択部806に出力する。上記予測ベクトル(動きベクトル)が2つの場合には、該当する2つの画像ブロックをフレームメモリ808より取り出し、それらを平均化して、選択部806に出力する。インター処理部820(動き補償部809)より選択部806に出力する、この信号は、インター予測画像ブロック信号である。
続いて、イントラ処理部821について説明する。イントラ処理部821は、奥行き情報利用イントラ予測部810とデプスマップ復号部811より構成される。
デプスマップ符号化データ入力部814は、外部(例えば、画像符号化装置100)から入力されたデプスマップ符号化データE2を処理ブロック単位に分割し、イントラ処理部821に出力する。
デプスマップ復号部811は、デプスマップ符号化データ入力部814が出力したブロック単位のデプスマップ符号化データを、デプスマップ符号化部116が行った符号化方法(例えば、可変長符号化)と逆の処理(例えば、可変長復号)であるエントロピー復号して、デプスブロック復号信号を生成する。デプスマップ復号部811は、デプスブロック復号信号を奥行き情報利用イントラ予測部810に出力する。
図14は、奥行き情報利用イントラ予測部810の構成を示す概略ブロック図である。奥行き情報利用イントラ予測部810は、第1予測モード実施部900−1、第2予測モード実施部900−2、第n予測モード実施部900−n、デプス利用予測モード実施部901及び予測モード選択部902を含んで構成される。
予測モード選択部902は、予測方式制御部805が出力したイントラ予測符号化情報の中から、画像符号化装置100の予測モード選択部202で作成した予測モードを示すインデックス(予測モード)と、予測に必要な情報をそれぞれ取り出す。なお、ここで、予測に必要な情報を取り出すのは、インデックスが示す予測モードが、予測に必要な情報が存在する予測モード(具体的には、第1予測モード、第2予測モードのサブブロック単位で予測画像を生成するモードとデプス利用予測モード)場合である。予測モード選択部902は、予測に必要な情報を取り出した場合には、該当する予測モード実施部900−1〜900−n、901にその情報を出力する。予測モード選択部902は、各予測モード実施部が生成した予測画像ブロック信号の中から、上記インデックス(予測モード)が示す予測モードの予測画像ブロック信号を選択し、イントラ予測画像ブロック信号として、選択部806へ出力する。
第1予測モード実施部900−1、第2予測モード実施部900−2、第n予測モード実施部900−nは、画像符号化装置100の奥行き情報利用イントラ予測部115に備わる第1予測モード実施部200−1、第2予測モード実施部200−2、第n予測モード実施部200−nと同じ処理が実施される。但し、16×16画素をさらに分割したサブブロック単位で予測を行う第1予測モード実施部200−1及び、第2予測モード実施部200−2については、各サブブロックにおける予測モード(予測に必要な情報)を予測モード選択部902より入力し、対応する予測モードを各サブブロック単位で実施する。予測モードについては、図4に示した内容である。
デプス利用予測モード実施部901は、予測モード選択部902より予測に必要な情報(具体的には予測の方向を示す情報)を取得し、デプスマップ復号部811よりデプスブロック復号信号を取得する。デプス利用予測モード実施部901は、これら取得した情報と信号を用いて、画像符号化装置100のデプス利用予測モード実施部201が実施したように予測画像ブロック信号を生成する。予測に必要な情報とは、前記デプス利用予測モード実施部201が選択した予測の方向に関する情報である。デプス利用予測モード実施部901の構成は、基本的にデプス利用予測モード実施部201の構成と同じである。ただし、画像符号化装置100の境界制御予測画像生成部300が水平方向の予測ブロックと垂直方向の予測ブロックを入力画像との相関性を基に選択を行う最後の処理を、デプス利用予測モード実施部901の境界制御予測画像生成部300では、予測に必要な情報を用いて選択するところが異なる。以上の処理によって、デプス利用予測モード実施部901は、符号化時のデプス利用予測モード実施部201と同じ予測画像ブロック信号を生成する。
次に、本実施形態に係る画像復号装置800が行う画像復号処理について説明する。図15は、本実施形態に係る画像復号装置800が行う画像復号処理を示すフローチャートである。
(ステップS601)画像復号装置800は、通信網500を介して画像符号化装置100から画像の符号化データE1とデプスマップの符号化データE2とからなる符号化データEを取得する。その後、ステップS602に進む。
(ステップS602)符号化データ入力部813は、取得した画像の符号化データE1を予め定めた大きさ(例えば、垂直方向16画素×水平方向16画素)に対応する処理ブロックに分割して、エントロピー復号部801に出力する。また、デプスマップ符号化データ入力部814は、符号化データ入力部813に入力された符号化データと同期したデプスマップ符号化データを画像復号装置800の外部から入力し、符号化データ入力部813で実施された分割と同様の処理単位に分割して、イントラ処理部821に出力する。
画像復号装置800は、ステップS603−ステップS608の処理をフレーム内の画像ブロック毎に繰り返す。
(ステップS603)エントロピー復号部801は、符号化データ入力部813が出力した符号化データをエントロピー復号し、差分画像ブロック符号と予測符号化情報を生成する。エントロピー復号部801は、差分画像ブロック符号を、逆量子化部802に出力し、予測符号化情報を予測方式制御部805に出力する。予測方式制御部805は、エントロピー復号部801から予測符号化情報を取得し、予測方式に関する情報とその予測方式に対応する予測符号化情報を取り出す。予測方式が、インター予測の場合には、予測符号化情報をインター予測符号化情報として、インター処理部820に出力する。予測方式が、イントラ予測の場合には、予測符号化情報をイントラ予測符号化情報として、イントラ処理部821に出力する。その後、ステップS604とステップS605に進む。なお、ステップS604とステップS605とは、各ブロックについて、並行して処理を実施するようにしてもよいし、予測方式に応じて、いずれか片方の処理のみを実施するようにしてもよい。
(ステップS604)インター処理部820は、予測方式制御部805が出力するインター予測符号化情報と、加算部804が出力する復号画像ブロック信号とを取得して、インター処理を実施する。インター処理部820は、生成されたインター予測画像ブロック信号を選択部806に出力する。インター処理の内容については後述する。なお、最初の処理において、加算部804の処理が完了していない場合には、リセットされた画像ブロック信号(全ての画素値が0の画像ブロック信号)を入力するものとする。インター処理部の処理が完了すると、ステップS606に進む。
(ステップS605)イントラ処理部821は、予測方式制御部805が出力するイントラ予測符号化情報と、加算部804が出力する復号画像ブロック信号とを取得して、イントラ予測を実施する。イントラ処理部821は、生成されたイントラ予測画像ブロック信号を選択部806に出力する。イントラ予測の処理については後述する。なお、最初の処理において、加算部804の処理が完了していない場合には、リセットされた画像ブロック信号(全ての画素値が0の画像ブロック信号)を入力するものとする。イントラ予測部821の処理が完了すると、ステップS606に進む。
(ステップS606)選択部806は、予測方式制御部805から出力された予測方式に関する情報を取得し、インター処理部820が出力したインター予測画像ブロック信号もしくは、イントラ処理部821が出力したイントラ予測画像信号を選択して、加算部804に出力する。その後、ステップS607に進む。
(ステップS607)逆量子化部802は、エントロピー復号部801から入力した差分画像ブロック符号に対して、画像符号化装置100の量子化部104で実施した量子化の逆の処理を行う。逆量子化部802は、生成された復号周波数領域信号を逆直交変換部803に出力する。逆直交変換部803は、逆量子化部802から逆量子化された復号周波数領域信号を取得し、画像符号化装置100の直交変換部103で実施した直交変換処理の逆直交変換処理を実施し、差分画像(復号差分画像ブロック信号)を復号する。逆直交変換部803は、復号された復号差分画像ブロック信号を加算部804に出力する。加算部804は、逆直交変換部803が出力した復号差分画像ブロック信号に、選択部806が出力した予測画像ブロック信号を加算して、復号画像ブロック信号を生成する。加算部804は、復号した復号画像ブロック信号を画像出力部812とインター処理部820及びイントラ処理部821に出力する。その後、ステップS608に進む。
(ステップS608)画像出力部812は、加算部804が出力した復号画像ブロック信号を、画像内の対応する位置に配置させ出力画像信号R’を生成する。フレーム内の全ブロックについてステップS603−S607の処理が完了していない場合、処理対象となるブロックを変更してステップS602に戻る。
画像出力部812は、生成した出力画像信号R’を画像復号装置800の外部(表示装置600)に出力する際には、例えば上述の入力順序で5フレーム(Iピクチャ(I0)、Bピクチャ(B3)、Bピクチャ(B2)、Bピクチャ(B4)及びPピクチャ(P1))毎に出力する。
図16は、ステップS604のインター処理を説明するフローチャートである。
(ステップS701)デブロッキング・フィルタ部807は、インター処理部820の外部である加算部804から復号画像ブロック信号を取得し、上記符号化時に行ったFIRフィルタ処理を実施する。デブロッキング・フィルタ部807は、フィルタ処理後の補正ブロック信号をフレームメモリ808に出力する。その後、ステップS702に進む。
(ステップS702)フレームメモリ808は、デブロッキング・フィルタ部807が出力した補正ブロック信号を、フレーム番号を同定できる情報と共に画像の一部として保持しておく。その後、ステップS703に進む。
(ステップS703)動き補償部809は、予測方式制御部805からインター予測符号化情報を取得し、該当する予測ブロック信号をフレームメモリより抽出する。動き補償部809は、フレームメモリより抽出した予測画像ブロック信号をインター予測画像ブロック信号として、選択部806に出力する。その後、インター処理を終了する。
図17は、ステップS605のイントラ処理を説明するフローチャートである。
(ステップS801)デプスマップ復号部811は、デプスマップ符号化データ入力部814から処理単位に分割したデプスマップ符号化データを取得し、例えば可変長復号を用いて情報量がより多いデプスマップを復号する。デプスマップ復号部811は、復号したデプスマップ(デプスブロック復号信号)を奥行き情報利用イントラ予測部810に出力する。その後、ステップS802に進む。
(ステップS802)第1予測モード実施部900−1〜第n予測モード実施部900−nは、加算部804が出力した復号画像ブロック信号を用いて、予測画像ブロック信号を生成する。サブブロック単位で処理が実施される予測モード実施部、具体的には、第1予測モード実施部900−1と第2予測モード実施部900−2については、画像符号化装置100で採用された各サブブロックの予想モードを示す情報を予測モード選択部902から取得し、予測画像ブロック信号を生成する。第1予測モード実施部900−1〜第n予測モード実施部900−nは、生成した第1〜第n予測画像ブロック信号を予測モード選択部902に出力する。
デプス利用予測モード実施部901は、加算部108が出力した復号画像ブロック信号と、デプスデプスマップ復号部811が出力したデプスブロック復号信号と、予測モード選択部902が出力した予測に必要な情報(具体的には、予測の方向を示す情報)とを用いて、図3のデプス利用予測モード実施部201で行った処理と同様の処理を実施し、デプス利用予測画像を生成する。デプス利用予測モード実施部901は、生成した予測画像信号を予測モード選択部902に出力する。その後、ステップS803に進む。
(ステップS803)予測モード選択部902は、予測方式制御部805から入力したイントラ予測符号化情報から、画像符号化装置100で採用された予測モードを示す情報を取り出し、該当する予測モードの予測画像ブロック信号を、イントラ予測画像ブロック信号として選択部806に出力する。予測モード選択部902は、取り出した予測モードがサブブロック単位で実施する予測モードである場合には、さらに各サブブロックの予測モードを取り出し、該当する予測モード実施部にその情報を出力する。その後、イントラ予測を終了する。予測モード選択部902は、取り出した予測モードがデプス利用予測モードである場合には、予測の方向に関する情報を取り出し、デプス利用予測モード実施部901に出力する。
なお、上述の画像符号化装置100はデプス入力部118とデプスマップ符号化部116を備え、画像復号装置800は、デプスマップ符号化データ入力部814とデプスマップ復号部811を備えていたが、これに限られない。例えば、入力画像に対応するデプスマップに関する情報を、別途の手段で画像復号装置800において利用できるようにしてもよい。例えば、オフラインでの受け渡し、あるいは外部に設置され映像情報と対応づけてデプスマップを記憶したサーバ装置から通信回線を介して、画像符号化装置100及び画像復号装置800がデプスマップを受信するようにしてもよい。そのために、映像情報を示す映像のタイトルが、通信回線を通じて検索可能であって、その映像情報が選択されたときに、対応するデプスマップが受信できるようにする。
また、本実施形態に係る画像符号化装置100は、入力画像とは異なる視点の画像も取得して、入力画像に含まれる画素と、入力画像とは異なる視点の画像に含まれる画素との間の視差を表す値を画素値とするデプスマップを生成するデプスマップ生成部を備えてもよい。その場合、デプスマップ生成部は、生成したデプスマップをデプス入力部118に出力する。
また、本実施形態に係る画像復号装置800は、出力画像と、その出力画像と同じフレームのデプスマップに基づいて出力画像とは異なる視点の第2の出力画像を生成し、外部に出力してもよい。
また、上述の例では、画像符号化装置100は、入力画像信号を5フレーム毎に入力していたが、本実施形態では、これに限らず、任意の数のフレーム数毎に入力してもよい。
また、上述の例では、画像復号装置800は、出力画像信号を5フレーム毎に出力していたが、本実施形態では、これに限らず、任意の数のフレーム数毎に出力してもよい
また、本実施形態では、符号化する画像を動画像としたが、静止画像であってもよい。また、符号化する画像を、多視点の画像とし、対応するデプスマップのある視点の画像においてのみ、デプス利用の予測モードを用い、対応するデプスマップのない視点の画像については、従来の予測モードを用いるようにしてもよい。
このように、本実施形態では、画面内予測を行う際に、被写体までの距離を示すデプスマップの境界において、連続するような画素予測を抑制する制御を行う予測モードを2つ持つ。従来に比べて、2つの予測モードの追加のみとなっているので、予測モード数の増加による符号量の増加を抑えつつ、予測画像の精度を向上させることができる。そして、予測モード数の増加による符号量の増加を抑えつつ、予測画像の精度が向上しているので、予測画像と入力画像との残差を最小化し、高効率の画像符号化及び復号を実現することができる。
なお、従来の予測モードに変えて、デプス利用の予測モードを用いるようにすると、予測モード数の増加もないので、さらに符号量の増加を抑えることができる。
なお、上述した実施形態における画像符号化装置100、画像復号装置800の一部、例えば、減算部102、直交変換部103、量子化部104、エントロピー符号化部105、逆量子化部106、逆直交変換部107、加算部108、予測方式制御部109、選択部110、デブロッキング・フィルタ部111、動き補償部113、動きベクトル検出部114、奥行き情報利用イントラ予測部115、デプスマップ符号化部116並びにデプスマップ復号部117、及びエントロピー復号部801、逆量子化部802、逆直交変換部803、加算部804、予測方式制御部805、選択部806、デブロッキング・フィルタ部807、動き補償部809、奥行き情報利用イントラ予測部810、並びにデプスマップ復号部811をコンピュータで実現するようにしても良い。
その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、画像符号化装置100又は画像復号装置800に内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
また、上述した実施形態における画像符号化装置100及び画像復号装置800の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。画像符号化装置100及び画像復号装置800の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
以上、この発明の実施形態を、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。
10…動画像伝送システム
100…画像符号化装置
101…画像入力部
102…減算部
103…直交変換部
104…量子化部
105…エントロピー符号化部
106…逆量子化部
107…逆直交変換部
108…加算部
109…予測方式制御部
110…選択部
111…デブロッキング・フィルタ部
112…フレームメモリ部
113…動き補償部
114…動きベクトル検出部
115…奥行き情報利用イントラ予測部
116…デプスマップ符号化部
117…デプスマップ復号部
118…デプス入力部
120…インター予測部
121…イントラ予測部
200−1…第1予測モード実施部
200−2…第2予測モード実施部
200−n…第n予測モード実施部
201…デプス利用予測モード実施部
202…予測モード選択部
300…境界制御予測画像生成部
301…境界予測制御部
302…被写体境界検出部
500…通信網
600…表示装置
800…画像復号装置
801…エントロピー復号部
802…逆量子化部
803…逆直交変換部
804…加算部
805…予測方式制御部
806…選択部
807…デブロッキング・フィルタ部
808…フレームメモリ
809…動き補償部
810…奥行き情報利用イントラ予測部
811…デプスマップ復号部
812…画像出力部
813…符号化データ入力部
814…デプスマップ符号化データ入力部
820…インター処理部
821…イントラ処理部
900−1…第1予測モード実施部
900−2…第2予測モード実施部
900−n…第n予測モード実施部
901…デプス利用予測モード実施部
902…予測モード選択部

Claims (14)

  1. 入力画像を符号化する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、前記処理対象画素の画素値を予測する画面内予測を行う画像符号化装置であって、
    前記画面内予測を行なう際に、前記周辺画素のうち、前記処理対象画素との間に前記入力画像が表す被写体の境界がある前記周辺画素を用いることを抑制する画面内予測部
    を具備することを特徴とする画像符号化装置。
  2. 前記画面内予測部は、
    前記被写体の境界を、前記入力画像の被写体までの距離を示す情報を用いて検出する被写体境界検出部を具備すること
    を特徴とする請求項1に記載の画像符号化装置。
  3. 前記画面内予測部は、
    前記周辺画素のうち、前記処理対象画素の所定の方向に隣接する画素と、前記処理対象画素との間に前記被写体の境界がないときは、前記所定の方向に隣接する画素を用いて、前記処理対象画素の画素値を予測し、前記所定の方向に隣接する画素と、前記処理対象画素との間に前記被写体の境界があるときは、前記所定の方向に隣接する画素を用いて前記処理対象画素の画素値を予測することを抑制する予測画像生成部を具備すること
    を特徴とする請求項2に記載の画像符号化装置。
  4. 前記画面内予測部は、
    前記処理対象画素の画素値を予測する際に用いる周辺画素を、前記周辺画素が表す被写体までの距離を示す情報と、前記処理対象画素が表す被写体までの距離を示す情報との差に少なくとも基づき決定する予測画像生成部を具備すること
    を特徴とする請求項1に記載の画像符号化装置。
  5. 前記画面内予測部は、
    前記処理対象画素の画素値を予測する際に用いる周辺画素を、前記周辺画素と前記処理対象画素との距離に少なくとも基づき決定する予測画像生成部を具備すること
    を特徴とする請求項1に記載の画像符号化装置。
  6. 符号化画像を復号する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、前記処理対象画素の画素値を予測する画面内予測を行う画像復号装置であって、
    前記画面内予測を行なう際に、前記周辺画素のうち、前記処理対象画素との間に前記符号化画像が表す被写体の境界がある前記周辺画素を用いることを抑制する画面内予測部
    を具備することを特徴とする画像復号装置。
  7. 前記画面内予測部は、
    前記被写体の境界を、前記符号化画像の被写体までの距離を示す情報を用いて検出する被写体境界検出部を具備すること
    を特徴とする請求項6に記載の画像復号装置。
  8. 前記画面内予測部は、
    前記周辺画素のうち、前記処理対象画素の所定の方向に隣接する画素と、前記処理対象画素との間に前記被写体の境界がないときは、前記所定の方向に隣接する画素を用いて、前記処理対象画素の画素値を予測し、前記所定の方向に隣接する画素と、前記処理対象画素との間に前記被写体の境界があるときは、前記所定の方向に隣接する画素を用いて前記処理対象画素の画素値を予測することを抑制する予測画像生成部を具備すること
    を特徴とする請求項7に記載の画像復号装置。
  9. 前記画面内予測部は、
    前記処理対象画素の画素値を予測する際に用いる周辺画素を、前記周辺画素が表す被写体までの距離を示す情報と、前記処理対象画素が表す被写体までの距離を示す情報との差に少なくとも基づき決定する予測画像生成部を具備すること
    を特徴とする請求項6に記載の画像復号装置。
  10. 前記画面内予測部は、
    前記処理対象画素の画素値を予測する際に用いる周辺画素を、前記周辺画素と前記処理対象画素との距離に少なくとも基づき決定する予測画像生成部を具備すること
    を特徴とする請求項6に記載の画像復号装置。
  11. 入力画像を符号化する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、前記処理対象画素の画素値を予測する画面内予測を行う画像符号化方法であって、
    前記画面内予測を行なう際に、前記周辺画素のうち、前記処理対象画素との間に前記入力画像が表す被写体の境界がある前記周辺画素を用いることを抑制する過程
    を有することを特徴とする画像符号化方法。
  12. 符号化画像を復号する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、前記処理対象画素の画素値を予測する画面内予測を行う画像復号方法であって、
    前記画面内予測を行なう際に、前記周辺画素のうち、前記処理対象画素との間に前記符号化画像が表す被写体の境界がある前記周辺画素を用いることを抑制する過程
    を有することを特徴とする画像復号方法。
  13. 入力画像を符号化する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、前記処理対象画素の画素値を予測する画面内予測を行う画像符号化装置のコンピュータを、
    前記画面内予測を行なう際に、前記周辺画素のうち、前記処理対象画素との間に前記入力画像が表す被写体の境界がある前記周辺画素を用いることを抑制する画面内予測部
    として機能させるためのプログラム。
  14. 符号化画像を復号する際に、処理対象画素の周辺にある周辺画素の画素値を用いて、前記処理対象画素の画素値を予測する画面内予測を行う画像復号装置のコンピュータを、
    前記画面内予測を行なう際に、前記周辺画素のうち、前記処理対象画素との間に前記符号化画像が表す被写体の境界がある前記周辺画素を用いることを抑制する画面内予測部
    として機能させるためのプログラム。
JP2011117425A 2011-05-25 2011-05-25 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム Withdrawn JP2014150297A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011117425A JP2014150297A (ja) 2011-05-25 2011-05-25 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム
PCT/JP2012/063503 WO2012161318A1 (ja) 2011-05-25 2012-05-25 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011117425A JP2014150297A (ja) 2011-05-25 2011-05-25 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2014150297A true JP2014150297A (ja) 2014-08-21

Family

ID=47217383

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011117425A Withdrawn JP2014150297A (ja) 2011-05-25 2011-05-25 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム

Country Status (2)

Country Link
JP (1) JP2014150297A (ja)
WO (1) WO2012161318A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013074303A (ja) * 2011-09-26 2013-04-22 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム
JP2013074304A (ja) * 2011-09-26 2013-04-22 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム
JP2013126006A (ja) * 2011-12-13 2013-06-24 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116320395A (zh) * 2022-12-27 2023-06-23 维沃移动通信有限公司 图像处理方法、装置、电子设备及可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2081386A1 (en) * 2008-01-18 2009-07-22 Panasonic Corporation High precision edge prediction for intracoding
JP4995789B2 (ja) * 2008-08-27 2012-08-08 日本電信電話株式会社 画面内予測符号化方法,画面内予測復号方法,これらの装置,およびそれらのプログラム並びにプログラムを記録した記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013074303A (ja) * 2011-09-26 2013-04-22 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム及び画像復号プログラム
JP2013074304A (ja) * 2011-09-26 2013-04-22 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム
JP2013126006A (ja) * 2011-12-13 2013-06-24 Nippon Telegr & Teleph Corp <Ntt> 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置、映像符号化プログラム及び映像復号プログラム

Also Published As

Publication number Publication date
WO2012161318A1 (ja) 2012-11-29

Similar Documents

Publication Publication Date Title
CN110121883B (zh) 在图像编码系统中对图像进行解码的方法和装置
KR101773693B1 (ko) 스킵 및 직접 모드들에 대한 3d 비디오 코딩에서의 디스패리티 벡터 유도
EP3672249A1 (en) Inter frame prediction method and device and codec for video images
TWI501611B (zh) 用於3d視訊之視圖間預測之運動向量
CN111971960B (zh) 用于基于帧间预测模式处理图像的方法及其装置
JP6039178B2 (ja) 画像符号化装置、画像復号装置、並びにそれらの方法及びプログラム
KR102658929B1 (ko) 인터 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
EP2537343A2 (en) Smoothing overlapped regions resulting from geometric motion partitioning
EP2559248A2 (en) Fixed point implementation for geometric motion partitioning
KR20170093833A (ko) 인트라 모드들의 코딩
JP2024023960A (ja) 残差コーディングに関する映像デコード方法およびその装置
US20240171749A1 (en) Image encoding/decoding method and device for performing prof, and method for transmitting bitstream
WO2012161318A1 (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム
AU2024203549A1 (en) Image encoding/decoding method and device for performing bdof, and method for transmitting bitstream
US20220279163A1 (en) Image encoding/decoding method and device for performing prediction on basis of hmvp candidate, and method for transmitting bitstream
JP6232117B2 (ja) 画像符号化方法、画像復号方法、及び記録媒体
WO2013077304A1 (ja) 画像符号化装置、画像復号装置、並びにそれらの方法及びプログラム
KR20240052698A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR20230144426A (ko) 영상 부호화/복호화 방법 및 장치
JP2013179554A (ja) 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム
WO2013035452A1 (ja) 画像符号化方法、画像復号方法、並びにそれらの装置及びプログラム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140902