JP2016213664A - 多視点画像符号化装置、多視点画像復号装置、補助情報生成装置、画像復元装置及びプログラム - Google Patents

多視点画像符号化装置、多視点画像復号装置、補助情報生成装置、画像復元装置及びプログラム Download PDF

Info

Publication number
JP2016213664A
JP2016213664A JP2015095606A JP2015095606A JP2016213664A JP 2016213664 A JP2016213664 A JP 2016213664A JP 2015095606 A JP2015095606 A JP 2015095606A JP 2015095606 A JP2015095606 A JP 2015095606A JP 2016213664 A JP2016213664 A JP 2016213664A
Authority
JP
Japan
Prior art keywords
unit
image
block
images
auxiliary information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015095606A
Other languages
English (en)
Other versions
JP6599634B2 (ja
Inventor
俊枝 三須
Toshie Misu
俊枝 三須
康孝 松尾
Yasutaka Matsuo
康孝 松尾
境田 慎一
Shinichi Sakaida
慎一 境田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK filed Critical Nippon Hoso Kyokai NHK
Priority to JP2015095606A priority Critical patent/JP6599634B2/ja
Publication of JP2016213664A publication Critical patent/JP2016213664A/ja
Application granted granted Critical
Publication of JP6599634B2 publication Critical patent/JP6599634B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

【課題】エピポーラ拘束を利用することで多視点画像の符号化効率を改善する。
【解決手段】多視点画像符号化装置200の多視点画像符号化部10は、視点A,B,Cの入力画像を従来の多視点画像符号化方式にて符号化し、多視点画像符号化ストリームを生成する。補間方法判定部20は、視点A,B,Cの入力画像を参照し視点P1〜P6の入力画像をそれぞれ復元するために必要な情報として、最適なブロックの番号を示す最適選択肢S1〜S6及び最適な奥行き値を示す最適奥行き値D1〜D6を生成する。補助情報多重化部30は、視点P1〜P6の入力画像毎の最適選択肢S1〜S6及び最適奥行き値D1〜D6を多重化し、補助情報を生成する。多視点画像復号装置300は、多視点画像符号化ストリームから元の視点A,B,Cの復号画像を生成し、視点A,B,Cの復号画像を参照し、補助情報に基づいて元の視点P1〜P6の復元画像を生成する。
【選択図】図2

Description

本発明は、複数の視点でそれぞれ得られる画像(多視点画像)を圧縮符号化する多視点画像符号化装置、多視点画像符号化ストリームを復号する多視点画像復号装置、画像を復元するための補助情報を生成する補助情報生成装置、補助情報を用いて画像を復元する画像復元装置、及びプログラムに関する。
従来、3次元の対象物を複数の視点から撮影した画像を伝送する多視点画像の符号化方式が知られている。この多視点画像の符号化方式を立体テレビ放送等で用いるためには、高効率な符号化が必要となる。
多視点画像の符号化方式としては、例えば、ITU-T H.264(ITU-T : International Telecommunication Union Telecommunication Standardization Sector)/ISO/IEC MPEG-4 AVC(ISO/IEC : International Organization for Standardization/International Electrotechnical Commission)のStereo ProfileまたはMVC(Multi-view Video Coding)等が知られている。これらの符号化方式では、動き補償予測による時間方向の相関利用のほか、視点間の視差を補償する予測技術等が用いられている。
例えば、視点間の視差を補償する予測技術を用いて、ある視点の低画質画像を、別の視点の高画質画像に基づいて精細化し、低画質画像の画質を改善する方式が提案されている(例えば、特許文献1を参照)。この方式では、高画質画像と低画質画像との間の視差を推定し、高画質画像に対して視差補償を行うことにより低画質画像の画質を改善する。これにより、視差ベクトルの一部をグローバルな主成分とし、グローバルな成分以外の成分との差分に分けて処理を行うことで、視差補償を効率化することができる。
特許第3693407号公報
このように、従来の多視点画像の符号化方式においては、視差を予測することにより視差補償を効率化していた。つまり、視差の予測の仕組みとしては、動きの予測と同様の仕組みを用いていた。
例えば、カメラの配置、姿勢、画角等のカメラパラメータが既知の場合には、複数の視点の対から求められる複数の視差には互いに相関があるため、多視点画像間の部分領域毎に対応付けを行うことで、視差を予測することができる。特許文献1の方式は、視差ベクトルを2段階で表現しており、互いの視差情報の相関を利用することにより視差補償の効率化が図られている。
しかしながら、視差情報の相関のみを用いた従来方式では、限られた伝送帯域で全ての多視点画像を伝送することが困難な場合があり、符号化効率を一層改善することが望まれていた。
そこで、本発明は上記課題を解決するためになされたものであり、その目的は、エピポーラ拘束を利用することで、符号化効率を改善可能な多視点画像符号化装置、多視点画像復号装置、補助情報生成装置、画像復元装置及びプログラムを提供することにある。
前記課題を解決するために、請求項1の多視点画像符号化装置は、N個の視点でそれぞれ得られるN個の入力画像(Nは2以上の整数)及び前記N個の視点以外の視点でそれぞれ得られるL個の入力画像(Lは1以上の整数)を符号化する多視点画像符号化装置において、前記N個の入力画像を符号化し、多視点画像符号化ストリームを生成する多視点画像符号化部と、前記L個の入力画像の部分領域毎に、当該部分領域に対応する前記N個の入力画像におけるエピポーラ線上の座標の部分領域を求め、前記L個の入力画像の部分領域と、前記N個の入力画像の部分領域との間の誤差が最小になるように、前記N個の入力画像から前記L個の入力画像を復元するために用いる補助情報であって、前記N個の入力画像の中から1以上の入力画像を選択する補助情報を、前記L個の入力画像のそれぞれについて生成する補助情報生成部と、を備えることを特徴とする。
係る構成によれば、従来の多視点画像符号化方式にて生成される多視点画像符号化ストリームに加え、補助情報を用いることで、N視点よりも多くの視点数の画像符号化が可能となる。また、N視点の入力画像については、従来の多視点画像符号化方式との互換を保つことができる。
また、請求項2の多視点画像符号化装置は、請求項1に記載の多視点画像符号化装置において、さらに、前記多視点画像符号化部により生成された多視点画像符号化ストリームを復号し、N個の復号画像を生成する多視点画像復号部と、前記L個の入力画像をそれぞれ所定時間遅延させる遅延部と、を備え、前記補助情報生成部が、前記遅延部により遅延させたL個の入力画像の部分領域毎に、当該部分領域に対応する、前記多視点画像復号部により生成されたN個の復号画像におけるエピポーラ線上の座標の部分領域を求め、前記L個の入力画像の部分領域と、前記N個の復号画像の部分領域との間の誤差が最小になるように、前記N個の復号画像から前記L個の入力画像を復元するために用いる補助情報であって、前記N個の復号画像の中から1以上の入力画像を選択する補助情報を、前記L個の入力画像のそれぞれについて生成する、ことを特徴とする。
係る構成によれば、同期したN視点の復号画像及びL視点の入力画像を用いて、劣化の少ない画像を復元可能な補助情報を生成することができる。
また、請求項3の多視点画像符号化装置は、請求項1または2に記載の多視点画像符号化装置において、前記N個の入力画像のそれぞれを参照画像とし、前記L個の入力画像のそれぞれを対象画像として、前記補助情報生成部は、前記L個の対象画像のそれぞれに対応した補助情報生成手段を備え、前記補助情報生成手段が、所定の奥行き値を走査する第1走査部と、前記対象画像の座標を走査する第2走査部と、前記第2走査部により走査された対象画像の座標に基づいて、前記対象画像の部分領域を前記対象画像のブロックとして切り出す第1ブロック切出部と、前記第2走査部により走査された対象画像の座標に対し、前記第1走査部により走査された奥行き値に対応する前記N個の参照画像におけるエピポーラ線上の座標を基準点としてそれぞれ求め、前記基準点に基づいて、前記参照画像の部分領域を前記参照画像のブロックとして切り出す第2ブロック切出部と、前記第2ブロック切出部により切り出された前記N個の参照画像のブロックのうち1個以上のブロックの組み合わせを生成し、前記組み合わせが1個のブロックの場合、当該1個のブロックを出力し、前記組み合わせが複数のブロックの場合、当該複数のブロックを重畳して出力する重畳部と、前記重畳部により出力された組み合わせ毎のブロックと、前記第1ブロック切出部により切り出された対象画像のブロックとの間の差を求め、前記差に基づいて、前記組み合わせ毎のブロックのそれぞれについての評価値を算出する誤差評価部と、前記第1走査部により走査された奥行き値毎に、前記誤差評価部により組み合わせ毎のブロックのそれぞれについて評価値が算出された場合に、前記評価値のうち最小の評価値を判定し、前記最小の評価値に対応する前記奥行き値及び前記組み合わせを、最適奥行き値及び最適選択肢としてそれぞれ決定する誤差最小化部と、前記第2走査部により走査された対象画像の座標毎に、前記誤差最小化部により最適奥行き値及び最適選択肢が決定された場合に、前記対象画像の座標毎の最適奥行き値及び最適選択肢を多重化し、補助情報を生成する多重化部と、を備えることを特徴とする。
係る構成によれば、対象画像のブロックについて、N視点の参照画像のブロックにおける1個以上の組み合わせのうち、対象画像のブロックに最も近似する組み合わせを最適選択肢として決定することができる。また、そのときの奥行き値を最適奥行き値として決定することができる。
さらに、請求項4の多視点画像復号装置は、請求項1の多視点画像符号化装置により生成された多視点画像符号化ストリーム及び補助情報を入力し、前記多視点画像符号化ストリーム及び前記補助情報に基づいて、N個の視点でそれぞれ得られるN個の復号画像(Nは2以上の整数)及び前記N個の視点以外の視点でそれぞれ得られるL個の復元画像(Lは1以上の整数)を生成する多視点画像復号装置において、前記視点画像符号化ストリームを復号し、前記N個の復号画像を生成する多視点画像復号部と、前記L個の入力画像の部分領域毎に、当該部分領域に対応する前記N個の入力画像におけるエピポーラ線上の座標の部分領域を求め、前記N個の入力画像の中から1以上の入力画像を選択する前記補助情報に基づいて、前記1以上の入力画像における前記部分領域のブロックを選択し、前記L個の復元画像を生成する画像復元部と、を備えることを特徴とする。
係る構成によれば、従来の多視点画像復号方式にて復号される復号画像に加え、補助情報を用いることで、N視点よりも多くの視点数の画像復元が可能となる。また、N視点の入力画像については、従来の多視点画像復号方式との互換を保つことができる。
また、請求項5の多視点画像復号装置は、請求項3の多視点画像符号化装置により生成された多視点画像符号化ストリーム及び補助情報を入力する請求項4に記載の多視点画像復号装置において、前記N個の復号画像のそれぞれを参照画像とし、前記L個の復元画像のそれぞれを対象画像として、前記画像復元部が、前記L個の対象画像のそれぞれに対応した画像復元手段を備え、前記画像復元手段が、前記対象画像の座標を走査する走査部と、前記走査部により走査された対象画像の座標に対し、前記補助情報に含まれる最適奥行き値に対応する前記N個の参照画像におけるエピポーラ線上の座標を基準点としてそれぞれ求め、前記基準点に基づいて、前記参照画像の部分領域を前記参照画像のブロックとして切り出すブロック切出部と、前記ブロック切出部により切り出された前記N個の参照画像のブロックのうち1個以上のブロックの組み合わせを生成し、前記組み合わせが1個のブロックの場合、当該1個のブロックを出力し、前記組み合わせが複数のブロックの場合、当該複数のブロックを重畳して出力する重畳部と、前記補助情報に含まれる最適選択肢に基づいて、前記重畳部により出力された組み合わせ毎のブロックのうち1つの組み合わせのブロックを選択する選択部と、前記走査部により走査された対象画像の座標に、前記選択部により選択されたブロックを設定し、前記ブロックを多重化し、前記対象画像である復元画像を生成するブロック多重化部と、を備えることを特徴とする。
係る構成によれば、N視点の復号画像、最適奥行き値及び最適選択肢に基づいて、元のL視点の入力画像に最適に近似する復元画像を生成することができる。
また、請求項6の多視点画像復号装置は、請求項5に記載の多視点画像復号装置において、前記画像復元手段が、前記重畳部及び選択部の代わりに新たな重畳部を備え、前記新たな重畳部が、前記ブロック切出部により切り出された前記N個の参照画像のブロックのうち1個以上のブロックの組み合わせと前記最適選択肢との間の関係が定義されたテーブルを用いて、前記補助情報に含まれる最適選択肢に対応する組み合わせを特定し、前記特定した組み合わせが1個のブロックの場合、当該1個のブロックを出力し、前記特定した組み合わせが複数のブロックの場合、当該複数のブロックを重畳して出力し、前記ブロック多重化部が、前記走査部により走査された対象画像の座標に、前記新たな重畳部により出力されたブロックを設定し、前記ブロックを多重化し、前記対象画像である復元画像を生成する、ことを特徴とする。
係る構成によれば、全ての組み合わせについてブロックを重畳する必要がないから、処理負荷を低減することができる。
さらに、請求項7の補助情報生成装置は、N個の視点でそれぞれ得られるN個の入力画像(Nは2以上の整数)を参照し、前記N個の視点以外の視点で得られる入力画像を復元するための補助情報を生成する補助情報生成装置において、前記N個の入力画像のそれぞれを参照画像とし、前記N個の視点以外の視点で得られる入力画像を対象画像として、所定の奥行き値を走査する第1走査部と、前記対象画像の座標を走査する第2走査部と、前記第2走査部により走査された対象画像の座標に基づいて、前記対象画像の部分領域を前記対象画像のブロックとして切り出す第1ブロック切出部と、前記第2走査部により走査された対象画像の座標に対し、前記第1走査部により走査された奥行き値に対応する前記N個の参照画像におけるエピポーラ線上の座標を基準点としてそれぞれ求め、前記基準点に基づいて、前記参照画像の部分領域を前記参照画像のブロックとして切り出す第2ブロック切出部と、前記第2ブロック切出部により切り出された前記N個の参照画像のブロックのうち1個以上のブロックの組み合わせを生成し、前記組み合わせが1個のブロックの場合、当該1個のブロックを出力し、前記組み合わせが複数のブロックの場合、当該複数のブロックを重畳して出力する重畳部と、前記重畳部により出力された組み合わせ毎のブロックと、前記第1ブロック切出部により切り出された対象画像のブロックとの差を求め、前記差に基づいて、前記組み合わせ毎のブロックのそれぞれについての評価値を算出する誤差評価部と、前記第1走査部により走査された奥行き値毎に、前記誤差評価部により組み合わせ毎のブロックのそれぞれについて評価値が算出された場合に、前記評価値のうち最小の評価値を判定し、前記最小の評価値に対応する前記奥行き値及び前記組み合わせを、最適奥行き値及び最適選択肢としてそれぞれ決定する誤差最小化部と、前記第2走査部により走査された対象画像の座標毎に、前記誤差最小化部により最適奥行き値及び最適選択肢が決定された場合に、前記対象画像の座標毎の最適奥行き値及び最適選択肢を多重化し、補助情報を生成する多重化部と、を備えることを特徴とする。
係る構成によれば、対象画像のブロックについて、N視点の参照画像のブロックにおける1個以上の組み合わせのうち、対象画像のブロックに最も近似する組み合わせを最適選択肢として決定することができる。また、そのときの奥行き値を最適奥行き値として決定することができる。
さらに、請求項8の画像復元装置は、N個の視点でそれぞれ得られるN個の画像(Nは2以上の整数)を参照し、請求項7の補助情報生成装置により生成された補助情報に基づいて、前記N個の視点以外の視点で得られる画像を復元する画像復元装置において、前記N個の画像のそれぞれを参照画像とし、前記復元画像を対象画像として、前記対象画像の座標を走査する走査部と、前記走査部により走査された対象画像の座標に対し、前記補助情報に含まれる最適奥行き値に対応する前記N個の参照画像におけるエピポーラ線上の座標を基準点としてそれぞれ求め、前記基準点に基づいて、前記参照画像の部分領域を前記参照画像のブロックとして切り出すブロック切出部と、前記ブロック切出部により切り出された前記N個の参照画像のブロックのうち1個以上のブロックの組み合わせを生成し、前記組み合わせが1個のブロックの場合、当該1個のブロックを出力し、前記組み合わせが複数のブロックの場合、当該複数のブロックを重畳して出力する重畳部と、前記補助情報に含まれる最適選択肢に基づいて、前記重畳部により出力された組み合わせ毎のブロックのうち1つの組み合わせのブロックを選択する選択部と、前記走査部により走査された対象画像の座標に、前記選択部により選択されたブロックを設定し、前記ブロックを多重化し、前記対象画像である復元画像を生成するブロック多重化部と、を備えることを特徴とする。
係る構成によれば、N視点の復号画像、最適奥行き値及び最適選択肢に基づいて、元のL視点の入力画像に最適に近似する復元画像を生成することができる。
さらに、請求項9の多視点画像符号化プログラムは、コンピュータを、請求項1から3までのいずれか一項に記載の多視点画像符号化装置として機能させることを特徴とする。
また、請求項10の多視点画像復号プログラムは、コンピュータを、請求項4から6までのいずれか一項に記載の多視点画像復号装置として機能させることを特徴とする。
また、請求項11の補助情報生成プログラムは、コンピュータを、請求項7に記載の補助情報生成装置として機能させることを特徴とする。
また、請求項12の画像復元プログラムは、コンピュータを、請求項8に記載の画像復元装置として機能させることを特徴とする。
以上のように、本発明によれば、一部の視点の画像については従来の方式で符号化し、他の視点の画像については、カメラパラメータに起因するエピポーラ拘束を利用した補助情報に変換するようにした。これにより、多視点画像の符号化効率を改善することが可能となる。
入力画像とエピポーラ線との関係を示す概念図である。 本発明の実施形態による多視点画像符号化装置の構成の一例を示すブロック図である。 補間方法判定部の構成の一例を示すブロック図である。 補間方法判定手段の構成の一例を示すブロック図である。 ブロック切出部の構成の一例を示すブロック図である。 式(2)のパラメータの説明を補充する図である。 重畳部の構成の一例を示すブロック図である。 誤差評価部の構成の一例を示すブロック図である。 補間方法判定処理の一例を示すフローチャートである。 本発明の実施形態による多視点画像復号装置の構成の一例を示すブロック図である。 画像復元部の構成の一例を示すブロック図である。 画像復元手段の構成の一例を示すブロック図である。 ブロック切出部の構成の一例を示すブロック図である。 画像復元処理の一例を示すフローチャートである。 本発明の他の実施形態による多視点画像符号化装置の構成の一例を示すブロック図である。 誤差最小化部の処理を説明する図である。
以下、本発明を実施するための形態について図面を用いて詳細に説明する。本発明は、符号化側において、N視点(Nは2以上の整数)の画像については、従来の多視点画像符号化方式にて符号化して出力し、別のL視点(Lは1以上の整数)の画像については、カメラパラメータに起因するエピポーラ拘束を利用した補助情報に変換して出力することを特徴とする。また、本発明は、復号側において、N視点の画像については、従来の多視点画像復号方式にて復号し、別のL視点の画像については、復号したN視点の画像を参照し、補助情報に基づいて復元することを特徴とする。
[エピポーラ線]
まず、3次元空間の被写体を複数の視点から撮影したときの2次元画像の関係を表現するエピポーラ幾何におけるエピポーラ線について説明する。図1は、視点P,A,B,Cから撮影した入力画像とエピポーラ線との関係を示す概念図である。入力画像100,110,120,130は、円柱及び球体からなる被写体140を、異なる視点P,A,B,Cから撮影した画像である。
視点P,A,B,Cの入力画像100,110,120,130を撮像したカメラの相対位置、相対姿勢、及びカメラの内部パラメータ(焦点距離、歪み係数等)は既知であるものとする。このとき、視点Pの入力画像100内において、被写体140上の一点に対応する別の視点Aの入力画像110の座標(以下、対応点という。)は、ある曲線上(視点Aのカメラが幾何歪みのない中心投影である場合にはある直線上)に拘束される。
特に、対応点が直線上に拘束される場合には、直線111(EPA)をエピポーラ線という。例えば、視点Pの入力画像100上の一点101(座標(bx,by))に対応する視点Aの入力画像110上の対応点の画像座標は、エピポーラ線111(EPA)上を移動する。
同様に、視点Bの入力画像120において、視点Pの入力画像100上の一点101(座標(bx,by))に対応する対応点は、エピポーラ線121(EPB)上に存在する。さらに、視点Cの入力画像130において、視点Pの入力画像100上の一点101(座標(bx,by))に対応する対応点は、エピポーラ線131(EPC)上に存在する。
視点A,B,Cの入力画像110,120,130の対応点がエピポーラ線111,121,131上のどの箇所に存在するかは、被写体140上の点101から視点Pの入力画像100へ降ろした垂線の線分長である奥行き値dに応じて一意に決定される。
逆に、視点Pの入力画像100における点101に対応する視点Aの入力画像110の対応点を、視点Pの入力画像100における部分領域102の特徴等によって特定することができれば、視点Pから被写体140上の点101までの奥行き値dを一意に求めることができる。
例えば、視点Pの入力画像100内の点101について、その周りに部分領域102を設定する。そして、視点Aの入力画像110内のエピポーラ線111上に部分領域を設定して移動させることにより、入力画像100内の部分領域102と入力画像110内の部分領域との間で、画像の相関が最大または画像の誤差が最小となるエピポーラ線111上の1点を特定する。この点が、視点Aの入力画像110の対応点となる。これにより、視点Pから被写体140上の点101までの奥行き値dを決定することができる。
ここで、符号化側が、視点Pの入力画像100における点101に対する対応点(視点A,B,Cの入力画像110,120,130の対応点)を求め、視点Pから被写体140上の点101までの奥行き値dを決定し、視点A,B,Cの入力画像110,120,130及び奥行き値dを復号側へ出力する。復号側は、視点A,B,Cの入力画像110,120,130及び奥行き値dを用いて、視点Pの入力画像100を復元することができる。
本発明の実施形態において、多視点画像符号化装置は、N視点(Nは2以上の整数)の入力画像を従来の多視点画像符号化方式にて符号化し、多視点画像符号化ストリームを出力する。また、多視点画像符号化装置は、エピポーラ拘束を利用し、N視点以外のL視点(Lは1以上の整数)の入力画像を、N視点の入力画像を参照して復元するための補助情報に変換し、当該補助情報を出力する。
また、本発明の実施形態において、多視点画像復号化装置は、多視点画像符号化装置から出力された多視点画像符号化ストリームを従来の多視点画像復号方式にて復号し、N視点の復号画像を生成し、多視点画像符号化装置から出力された補助情報、及びN視点の復号画像に基づいて、L視点の復元画像を生成する。
以下、視点Pを6個の視点P1〜P6とし、視点P1〜P6の入力画像を補助情報に変換する場合を例に挙げて説明する。
[多視点画像符号化装置]
まず、本発明の実施形態による多視点画像符号化装置について説明する。図2は、本発明の実施形態による多視点画像符号化装置の構成の一例を示すブロック図である。この多視点画像符号化装置200は、多視点画像符号化部10、補間方法判定部(補助情報生成部)20及び補助情報多重化部30を備えている。
多視点画像符号化部10は、視点A,B,Cから撮影した画像(視点A,B,Cでそれぞれ得られる画像)を入力し、視点A,B,Cの入力画像を従来の多視点画像符号化方式にて符号化し、多視点画像符号化ストリームを生成して外部へ出力する。尚、多視点画像符号化部10は、図示しない単視点用の画像符号化手段を視点の数だけ並列に備えるように構成してもよい。
例えば、多視点画像符号化部10は、視点A,B,Cの入力画像における視点間の画像相関を利用して画像符号化を行う。多視点画像符号化部10は、視点Aの入力画像上に部分領域を設定し、視点Aの入力画像上の部分領域内の画像パターンと、視点B,Cの入力画像内の部分領域とを比較する。そして、多視点画像符号化部10は、視点Aの入力画像上の部分領域の画像パターンに最も近い部分領域を探索する。
多視点画像符号化部10は、視点B,Cの入力画像の部分領域から視点Aの入力画像の部分領域へ至る視差ベクトルを求めると共に、視点B,Cの入力画像における部分領域の画素値から、視点Aの入力画像における部分領域の画素値を減じることで残差画像を生成する。そして、多視点画像符号化部10は、視点Aの入力画像、並びに視点B,Cの視差ベクトル及び残差画像を符号化して多視点画像符号化ストリームを生成する。
この従来の多視点画像符号化方式の例は、視点B,Cの残差画像の画素値が0付近に偏在し、残差画像の高域成分の誤差は人の目に感じ難い性質がある、ことに着目したものである。
補間方法判定部20は、視点A,B,Cから撮影した画像を入力すると共に、視点P1〜P6から撮影した画像(視点A,B,C以外の視点P1〜P6でそれぞれ得られる画像)を入力し、視点A,B,Cの入力画像を参照して視点P1〜P6の入力画像を復元するために最適な選択肢(最適選択肢)及び最適な奥行き値(最適奥行き値)を生成する。そして、補間方法判定部20は、視点P1〜P6の入力画像毎の最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6を補助情報多重化部30に出力する。
補助情報多重化部30は、補間方法判定部20から視点P1〜P6の入力画像毎の最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6を入力し、これらを多重化し、補助情報を生成して外部へ出力する。
(補間方法判定部20)
図3は、補間方法判定部20の構成の一例を示すブロック図である。この補間方法判定部20は、同一の機能を有する複数の補間方法判定手段(補助情報生成手段)20−1〜20−6を備えている。補間方法判定手段20−1〜20−6の数は、視点P1〜P6の視点数と同じである。
補間方法判定手段20−1は、視点A,B,Cから撮影した画像を入力すると共に、視点P1から撮影した画像を入力し、視点A,B,Cの入力画像を参照して視点P1の入力画像を復元するための最適奥行きマップD1及び最適選択肢マップS1を生成する。そして、補間方法判定手段20−1は、視点P1の入力画像の最適奥行きマップD1及び最適選択肢マップS1を補助情報多重化部30に出力する。最適奥行きマップD1及び最適選択肢マップS1は、視点P1の入力画像を復元するために用いられる。
同様に、補間方法判定手段20−2〜20−6は、視点A,B,Cから撮影した画像を入力すると共に、視点P2〜P6から撮影した画像を入力し、視点A,B,Cの入力画像を参照して視点P2〜P6の入力画像を復元するための最適奥行きマップD2〜D6及び最適選択肢マップS2〜S6をそれぞれ生成する。そして、補間方法判定手段20−2〜20−6は、視点P2〜P6の入力画像の最適奥行きマップD2〜D6及び最適選択肢マップS2〜S6を補助情報多重化部30にそれぞれ出力する。最適奥行きマップD2〜D6及び最適選択肢マップS2〜S6は、視点P2〜P6の入力画像を復元するために用いられる。
(補間方法判定手段20−1)
図4は、補間方法判定手段20−1の構成の一例を示すブロック図である。この補間方法判定手段20−1は、走査部21,22、ブロック切出部23,24、重畳部25、誤差評価部26、誤差最小化部27及び最適マップ多重化部28を備えている。補間方法判定手段20−2〜20−6の構成は、補間方法判定手段20−1と同様である。
走査部21は、視点P1から被写体140上の一点までの奥行き値dを、予め設定された範囲内で走査して順次設定し、設定した奥行き値dをブロック切出部24及び誤差最小化部27に出力する。例えば、走査部21は、視点P1の入力画像における奥行き値dを、カメラの最短撮影距離から無限遠までの間において、予め設定された間隔で順次変化させる。予め設定された間隔は、一定の間隔であってもよいし、処理の効率等の関係から不均一な間隔であってもよい。
例えば、視点P1から被写体140上の一点までの奥行き値dの変化量は、視点A,B,Cの入力画像のエピポーラ線上における対応点の移動量の最大値が1画素程度(例えば、0.5画素〜2画素)となるような割合とすることが好ましい。奥行き値dの走査は、
d=(α/z)z=0,1,2,・・,Z
となるように設定することが好ましい。αは正の実定数であり、例えば、α/Zは最短撮影距離程度とし、z=0のときのα/zは+∞とする。
走査部22は、視点P1の入力画像(画像サイズをCx×Cyとする)上において、後段のブロック切出部23がブロックRを切り出すための画像座標(bx,by)を走査して順次設定し、視点P1のブロックR毎に、視点P1のブロック位置(bx,by)をブロック切出部23及びブロック切出部24に出力する。
走査部22は、例えば、ブロックRの大きさをBx×Byとして、走査する画像座標(bx,by)を、以下の式により設定する。
Figure 2016213664
x%yは、整数xを整数yで除したときの剰余とする。
ブロック切出部23は、視点P1から撮影した画像を入力すると共に、走査部22から視点P1のブロック位置(bx,by)を入力し、視点P1の入力画像から、ブロック位置(bx,by)を基準にして部分領域であるブロックRを切り出す。そして、ブロック切出部23は、視点P1のブロックRを誤差評価部26に出力する。
(ブロック切出部24)
ブロック切出部24は、視点A,B,Cから撮影した画像を入力すると共に、走査部21から奥行き値dを入力し、さらに、走査部22から視点P1のブロック位置(bx,by)を入力する。そして、ブロック切出部24は、視点P1の入力画像のブロック位置(bx,by)に撮像された被写体140上の点が奥行き値dの位置にあると仮定したときの、当該被写体140上の点に対応する視点A,B,Cの入力画像の座標(基準点)を求める。つまり、ブロック切出部24は、視点P1の入力画像のブロック位置(bx,by)に対し、奥行き値dに対応する視点A,B,Cの入力画像におけるエピポーラ線上の座標を基準点としてそれぞれ求める。
ブロック切出部24は、視点A,B,Cの入力画像の基準点に基づいて、視点A,B,Cの入力画像から所定形状の部分領域(ブロック)T1,T2,T3をそれぞれ切り出し、視点A,B,CのブロックT1,T2,T3を重畳部25に出力する。
図5は、ブロック切出部24の構成の一例を示すブロック図である。このブロック切出部24は、同一の機能を有する複数のブロック切出手段24−1〜24−3を備えている。ブロック切出手段24−1〜24−3の数は、視点A,B,Cの視点数と同じである。
前述のブロック切出部23は、視点P1の入力画像から、部分領域であるブロックRを切り出すのに対し、ブロック切出手段24−1〜24−3は、視点A,B,Cの入力画像から、部分領域であるブロックT1,T2,T3を切り出す。
ブロック切出手段24−1は、視点Aから撮影した画像を入力すると共に、走査部21から奥行き値dを入力し、さらに、走査部22からブロック位置(bx,by)を入力する。ここで、ブロック切出手段24−1は、視点P1から見た被写体140の奥行き値が未知であるため、視点P1の入力画像の中の画像座標(bx,by)の位置で撮像された被写体140上の点までの距離が奥行き値dであると仮定する。そして、ブロック切出手段24−1は、視点P1の入力画像における被写体140上の点が、奥行き値dをパラメータとして、視点Aの入力画像の中のどの画像座標(qx(d),qy(d))に対応するかを求め、その画像座標(qx(d),qy(d))を基準点とする。ブロック切出手段24−1は、視点Aの入力画像から、その基準点の周りに、予め設定された形状のブロックT1を抽出し、視点AのブロックT1を重畳部25に出力する。基準点とは、例えば部分領域の中心の画像座標をいう。
例えば、ブロック切出手段24−1は、奥行き値dに対応する視点Aの入力画像の基準点である画像座標(qx(d),qy(d))を、以下の式にて算出する。
Figure 2016213664
前記式(2)において、fは視点Pを撮影したカメラの焦点距離、fは視点Aを撮影したカメラの焦点距離を示す。ベクトルtは、視点Pのカメラに固定された座標系(座標系Σ)で測った視点Pから視点Aへ至るベクトル、Rは、座標系Σに対する視点Aのカメラに固定された座標系(座標系Σ)の相対姿勢を表す回転行列、右上付きのTは行列またはベクトルの転置を示す。
図6は、前記式(2)のパラメータの説明を補充する図であり、視点Aの画像平面と視点P1の画像平面との関係を示している。座標系Σは、視点P1のカメラにおいて、画像平面と光軸の交点に原点をとり、画像平面上にx軸及びy軸とする2軸をとる。例えば、x軸及びy軸とする2軸は、画像平面内において水平方向にx軸、垂直方向にy軸をとる。また、座標系Σは、原点から光軸に沿って被写体140側へ向かってz軸をとる。
同様に、座標系Σは、視点Aのカメラにおいて、画像平面と光軸の交点に原点をとり、画像平面上にx軸及びy軸とする2軸をとり、原点から光軸に沿って被写体140側へ向かってz軸をとる。
尚、図5において、ブロック切出手段24−2,24−3の処理は、ブロック切出手段24−1の処理と同様である。
(重畳部25)
図4に戻って、重畳部25は、ブロック切出部24から視点A,B,CのブロックT1,T2,T3を入力し、ブロックT1,T2,T3の中から2個以上を重畳し、重畳したブロックを生成する。重畳部25は、入力したブロックT1,T2,T3及び重畳により生成したブロックを、ブロックW1〜W7として誤差評価部26に出力する。重畳とは、例えば、複数の画像(ブロック)の画素値を画素位置毎に相加平均をとった結果を出力する演算とする。
つまり、重畳部25は、視点A,B,CのブロックT1,T2,T3のうち1個以上の所定数のブロックの組み合わせを生成し、組み合わせが2個以上のブロックの場合、これらのブロックを重畳して重畳ブロックを生成する。この組み合わせの数をMとすると、Mは、2以上であって、かつ2N−1以下の整数である。本例の場合は、N=3であるから、組み合わせの数はM=7である。そして、重畳部25は、組み合わせ毎のブロック、すなわち入力したブロックT1,T2,T3及び重畳により生成した重畳ブロックを、ブロックW1〜W7として出力する。
図7は、重畳部25の構成の一例を示すブロック図である。この重畳部25は、同一の機能を有する複数の重畳手段25−1〜25−4を備えている。重畳手段25−1は、ブロック切出部24から視点A,BのブロックT1,T2を入力し、ブロックT1,T2を重畳することでブロックW3を生成し、ブロックW3を誤差評価部26に出力する。
重畳手段25−2は、ブロック切出部24から視点A,CのブロックT1,T3を入力し、ブロックT1,T3を重畳することでブロックW5を生成し、ブロックW5を誤差評価部26に出力する。また、重畳手段25−3は、ブロック切出部24から視点B,CのブロックT2,T3を入力し、ブロックT2,T3を重畳することでブロックW6を生成し、ブロックW6を誤差評価部26に出力する。また、重畳手段25−4は、ブロック切出部24から視点A,B,CのブロックT1,T2,T3を入力し、ブロックT1,T2,T3を重畳することでブロックW7を生成し、ブロックW7を誤差評価部26に出力する。
重畳部25は、ブロック切出部24から入力した視点A,B,CのブロックT1,T2,T3を、ブロックW1,W2,W4としてそのまま誤差評価部26に出力する。
重畳部25は、例えば以下の式にて、奥行き値dのブロックW1〜W7を生成する。
Figure 2016213664
ブロックT1,T2,T3内の画像座標(i,j)における画素値をT1(i,j),T2(i,j),T3(i,j)とする。
(誤差評価部26)
図4に戻って、誤差評価部26は、重畳部25からブロックW1〜W7を入力すると共に、ブロック切出部23から視点P1のブロックRを入力する。そして、誤差評価部26は、ブロックW1〜W7のそれぞれとブロックRとの間の差である誤差値を定量化することで評価値Q1〜Q7を算出し、評価値Q1〜Q7を誤差最小化部27に出力する。
図8は、誤差評価部26の構成の一例を示すブロック図である。この誤差評価部26は、同一の機能を有する複数の誤差評価手段26−1〜26−7を備えている。誤差評価手段26−1〜26−7は、重畳部25からブロックW1〜W7を入力すると共に、ブロック切出部23から視点P1のブロックRを入力し、例えば以下の式にて、奥行き値dの評価値Q1〜Q7を算出する。
Figure 2016213664
ここで、Qk (d)(bx,by)は、奥行き値d及びブロックW1〜W7の番号kにおいて、視点P1のブロック位置(bx,by)に対応する視点A,B,CのブロックW1〜W7と、視点P1のブロック位置(bx,by)にて切り出されたブロックRとの間の誤差の総和値である。
図4に戻って、誤差最小化部27は、誤差評価部26から評価値Q1〜Q7を入力すると共に、走査部21から奥行き値dを入力し、様々な奥行き値dに対する評価値Q1〜Q7のうち、最小の誤差値を与える評価値(最小評価値)を判定する。誤差最小化部27は、最小評価値に対応する奥行き値dを最適奥行き値D(bx,bx)とし、最小評価値に対応するブロックの識別子(ブロックW1〜W7の識別子のうちの1つ識別子、すなわち最小評価値に対応する視点A,B,CのブロックT1,T2,T3の組み合わせを識別するデータ(ブロック番号))を最適選択肢S(bx,by)とし、視点P1のブロック位置(bx,by)における最適奥行き値D(bx,bx)及び最適選択肢S(bx,by)を、最適マップ多重化部28に出力する。
誤差最小化部27は、例えば以下の式により、視点P1のブロック位置(bx,by)における最適奥行き値D(bx,bx)及び最適選択肢S(bx,by)を求める。
Figure 2016213664
図16は、誤差最小化部27の処理を説明する図である。誤差最小化部27により、奥行き値d1に対するブロック番号毎の評価値Q1 (1),Q2 (1),・・・,Q7 (1)、奥行き値d2に対するブロック番号毎の評価値Q1 (2),Q2 (2),・・・,Q7 (2)、・・・、奥行き値dmに対するブロック番号毎の評価値Q1 (m),・・・,Qn (m),・・・,Q7 (m)等が入力され、これらの評価値Q1 (1)等から最小評価値Qn (m)が判定されるものとする。視点P1のブロック位置(bx,by)における最適奥行き値D(bx,bx)としてdmが求められ、最適選択肢S(bx,by)としてnが求められる。
図4に戻って、最適マップ多重化部28は、誤差最小化部27から視点P1のブロック位置(bx,by)における最適奥行き値D(bx,bx)及び最適選択肢S(bx,by)を入力すると共に、走査部22から視点P1のブロック位置(bx,by)を入力する。そして、最適マップ多重化部28は、様々なブロック位置(b,b)の最適奥行き値D(bx,bx)及び最適選択肢S(bx,by)を多重化することでマップ化し、視点P1の入力画像の最適奥行きマップD1及び最適選択肢マップS1として、補助情報多重化部30に出力する。
このように、最適奥行きマップD1には、様々なブロック位置(b,b)の最適奥行き値D(b,b)が格納され、最適選択肢マップS1には、様々なブロック位置(b,b)の最適選択肢S(b,b)が格納される。最適奥行きマップD1及び最適選択肢マップS1は、視点P1の入力画像を復元するために用いられる。
同様に、補間方法判定手段20−2〜20−6は、視点A,B,Cの入力画像を参照し、視点P2〜P6の入力画像の最適奥行きマップD2〜D6及び最適選択肢マップS2〜S6をそれぞれ生成し、これらを補助情報多重化部30にそれぞれ出力する。最適奥行きマップD2〜D6及び最適選択肢マップS2〜S6は、視点P2〜P6の入力画像を復元するために用いられる。
(補間方法判定手段20−1の動作)
次に、補間方法判定手段20−1の動作について説明する。図9は、補間方法判定手段20−1による補間方法判定処理の一例を示すフローチャートである。補間方法判定手段20−2〜20−6による補間方法判定処理も同様である。
まず、補間方法判定手段20−1のブロック切出部24は、視点A,B,Cの画像を入力し、ブロック切出部23は、視点P1の入力画像を入力する(ステップS101)。
走査部22は、視点P1の入力画像から部分領域であるブロックRを切り出すためのブロック位置(b,b)を設定し、ブロック切出部23は、視点P1の入力画像からブロック位置(b,b)のブロックRを切り出す(ステップS102)。
走査部21は、視点P1の入力画像の奥行き値dを設定する(ステップS103)。そして、ブロック切出部24は、視点P1の入力画像のブロック位置(bx,by)に撮像された被写体140上の点が奥行き値dの位置にあると仮定したときの、当該被写体140上の点に対応する視点A,B,Cの入力画像の座標(基準点)を求め、視点A,B,Cの画像から、基準点のブロックT1,T2,T3をそれぞれ切り出す(ステップS104)。
重畳部25は、視点A,B,CのブロックT1,T2,T3の中から2個以上を重畳し、ブロックW1〜W7を生成する(ステップS105)。そして、誤差評価部26は、ブロックW1〜W7と視点P1のブロックRとの間の誤差値を定量化して評価値Q1〜Q7を算出する(ステップS106)。
補間方法判定手段20−1は、奥行き値dの走査が終了するまで、ステップS104〜ステップS106の処理を繰り返し、奥行き値dの走査が終了すると、ステップS108へ移行する(ステップS107)。
誤差最小化部27は、ステップS107から移行して、様々な奥行き値dに対する評価値Q1〜Q7のうち最小の誤差値を与える最小評価値を判定し、最適奥行き値D(bx,bx)及び最適選択肢S(bx,by)を決定する(ステップS108)。
補間方法判定手段20−1は、視点P1のブロック位置(b,b)の走査が終了するまで、ステップS102〜ステップS108の処理を繰り返す(ステップS109)。
このように、補間方法判定手段20−1により、視点P1の様々なブロック位置(b,b)の最適奥行き値D(bx,bx)及び最適選択肢S(bx,by)が決定される。そして、最適マップ多重化部28により、視点P1の様々なブロック位置(b,b)の最適奥行き値D(bx,by)及び最適選択肢S(bx,by)が多重化され、最適奥行きマップD1及び最適選択肢マップS1として、補助情報多重化部30に出力される。
以上のように、本発明の実施形態による多視点画像符号化装置200によれば、多視点画像符号化部10は、視点A,B,Cの入力画像を従来の多視点画像符号化方式にて符号化し、多視点画像符号化ストリームを生成する。そして、補間方法判定部20は、視点A,B,Cの入力画像を参照して視点P1〜P6の入力画像をそれぞれ復元するための最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6を生成する。そして、補助情報多重化部30は、視点P1〜P6の入力画像毎の最適奥行きマップD2〜D6及び最適選択肢マップS2〜S6を多重化し、補助情報を生成する。
これにより、多視点画像符号化装置200から、視点A,B,Cの入力画像については多視点画像符号化ストリームが出力され、視点P1〜P6の入力画像については補助情報が出力される。後述する多視点画像復号装置は、多視点画像符号化ストリーム及び補助情報を入力し、多視点画像符号化ストリームを復号して元の視点A,B,Cの復号画像を生成することができ、視点A,B,Cの復号画像を参照し、補助情報に基づいて元の視点P1〜P6の復元画像を生成することができる。
したがって、視点P1〜P6の入力画像については、カメラパラメータに起因するエピポーラ拘束を利用した補助情報に変換して出力され、この補助情報は、最適なブロック番号及び最適な奥行き値であり、従来の多視点画像符号化方式にて出力される誤差画像に比べて情報量が少ない。つまり、画像の符号化効率を向上させることができる。
尚、本発明の実施形態による多視点画像符号化装置200のハードウェア構成としては、通常のコンピュータを使用することができる。多視点画像符号化装置200は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。多視点画像符号化装置200に備えた多視点画像符号化部10、補間方法判定部20及び補助情報多重化部30の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。
[多視点画像復号装置]
次に、本発明の実施形態による多視点画像復号装置について説明する。図10は、本発明の実施形態による多視点画像復号装置の構成の一例を示すブロック図である。この多視点画像復号装置300は、多視点画像復号部40、補助情報逆多重化部50及び画像復元部60を備えている。
多視点画像復号装置300は、多視点画像符号化装置200から出力された多視点画像符号化ストリーム及び補助情報を入力し、多視点画像符号化ストリームから視点A,B,Cの復号画像を生成する。そして、多視点画像復号装置300は、補助情報から最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6を生成し、視点A,B,Cの復号画像並びに最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6に基づいて、視点P1〜P6の復元画像を生成する。
多視点画像復号部40は、図2に示した多視点画像符号化部10に対応する。多視点画像復号部40は、多視点画像符号化装置200から出力された多視点画像符号化ストリームを入力し、多視点画像符号化ストリームを従来の多視点画像復号方式にて復号し、視点A,B,Cの復号画像を生成する。そして、多視点画像復号部40は、生成した視点A,B,Cの復号画像を画像復元部60に出力すると共に、外部へ出力する。
補助情報逆多重化部50は、図2に示した補助情報多重化部30に対応する。補助情報逆多重化部50は、多視点画像符号化装置200から出力された補助情報を入力し、補助情報を逆多重化して最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6を生成し、最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6を画像復元部60に出力する。
画像復元部60は、図2に示した補間方法判定部20に対応する。画像復元部60は、多視点画像復号部40から視点A,B,Cの復号画像を入力すると共に、補助情報逆多重化部50から最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6を入力する。そして、画像復元部60は、視点A,B,Cの復号画像を参照し、最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6に基づいて、視点P1〜P6の復元画像を生成し、視点P1〜P6の復元画像を外部へ出力する。
(画像復元部60)
図11は、画像復元部60の構成の一例を示すブロック図である。この画像復元部60は、同一の機能を有する複数の画像復元手段60−1〜60−6を備えている。画像復元手段60−1〜60−6の数は、視点P1〜P6の視点数と同じである。
画像復元手段60−1は、多視点画像復号部40から視点A,B,Cの復号画像を入力すると共に、補助情報逆多重化部50から最適奥行きマップD1及び最適選択肢マップS1を入力する。そして、画像復元手段60−1は、視点A,B,Cの復号画像を参照し、最適奥行きマップD1及び最適選択肢マップS1に基づいて、視点P1の復元画像を生成し、視点P1の復元画像を外部へ出力する。
同様に、画像復元手段60−2〜60−6は、多視点画像復号部40から視点A,B,Cの復号画像を入力すると共に、補助情報逆多重化部50から最適奥行きマップD2〜D6及び最適選択肢マップS1〜S6を入力する。そして、画像復元手段60−2〜60−6は、視点A,B,Cの復号画像を参照し、最適奥行きマップD2〜D6及び最適選択肢マップS1〜S6に基づいて、視点P2〜P6の復元画像を生成し、視点P2〜P6の復元画像を外部へ出力する。
(画像復元手段60−1)
図12は、画像復元手段60−1の構成の一例を示すブロック図である。この画像復元手段60−1は、走査部61、ブロック切出部62、マップデータ選択部63、重畳部64、切替選択部65及びブロック多重化部66を備えている。画像復元手段60−2〜60−6の構成は、画像復元手段60−1と同様である。
走査部61は、復元すべき視点P1の復元画像上に部分領域(ブロック)を指定するための画像位置(bx,by)を走査して順次設定し、視点P1のブロック(bx,by)としてブロック切出部62、マップデータ選択部63及びブロック多重化部66に出力する。
マップデータ選択部63は、補助情報逆多重化部50から最適奥行きマップD1及び最適選択肢マップS1を入力すると共に、走査部61から視点P1のブロック位置(bx,by)を入力する。そして、マップデータ選択部63は、ブロック位置(bx,by)に基づいて、最適奥行きマップD1の中から最適奥行き値D(bx,by)を選択し、ブロック切出部62に出力する。また、マップデータ選択部63は、ブロック位置(bx,by)に基づいて、最適選択肢マップS1の中から最適選択肢S(bx,by)を選択し、切替選択部65に出力する。
前述のとおり、最適奥行きマップD1には、様々なブロック位置(bx,by)における最適奥行き値D(bx,by)が格納されており、最適選択肢マップS1には、様々なブロック位置(bx,by)における最適選択肢S(bx,by)が格納されている。マップデータ選択部63により、ブロック位置(bx,by)に対応する最適奥行き値D(bx,by)及び最適選択肢S(bx,by)が、最適奥行きマップD1及び最適選択肢マップS1からそれぞれ選択される。
(ブロック切出部62)
ブロック切出部62は、多視点画像復号部40から視点A,B,Cの復号画像を入力すると共に、マップデータ選択部63から最適奥行き値D(bx,by)を入力し、さらに、走査部61から視点P1のブロック位置(bx,by)を入力する。そして、ブロック切出部62は、復元される視点P1の復元画像のブロック位置(bx,by)に撮像された被写体140上の点が最適奥行き値D(bx,by)の位置にあると仮定したときの、当該被写体140上の点に対応する視点A,B,Cの復号画像の座標(基準点)を求める。つまり、ブロック切出部62は、視点P1の復元画像のブロック位置(bx,by)について、最適奥行き値D(bx,by)に対応する視点A,B,Cの復号画像におけるエピポーラ線上の座標を基準点としてそれぞれ求める。
ブロック切出部62は、視点A,B,Cの復号画像の基準点に基づいて、視点A,B,Cの復号画像から所定形状の部分領域(ブロック)T1’,T2’,T3’をそれぞれ切り出し、視点A,B,CのブロックT1’,T2’,T3’を重畳部64に出力する。
図4に示したブロック切出部24とこのブロック切出部62とを比較すると、両ブロック切出部24,62は、同じ構成を有する点で同一である。しかし、ブロック切出部24は、走査部21から奥行き値dを入力するのに対し、ブロック切出部62は、マップデータ選択部63から最適奥行き値D(bx,by)を入力する点で相違する。
(ブロック切出部62)
図13は、ブロック切出部62の構成の一例を示すブロック図である。このブロック切出部62は、同一の機能を有する複数のブロック切出手段62−1〜62−3を備えている。ブロック切出手段62−1〜62−3は、図5に示したブロック切出手段24−1〜24−3と同様の処理を行う。
ブロック切出手段62−1は、視点Aの復号画像を入力すると共に、マップデータ選択部63から最適奥行き値D(bx,by)を入力し、さらに、走査部61からブロック位置(bx,by)を入力する。そして、ブロック切出手段62−1は、前述の処理にて視点Aの復号画像から所定形状の部分領域(ブロック)T1’を切り出し、視点AのブロックT1’を重畳部64に出力する。
同様に、ブロック切出手段62−2,62−3は、視点B,Cの復号画像をそれぞれ入力すると共に、マップデータ選択部63から最適奥行き値D(bx,by)を入力し、さらに、走査部61からブロック位置(bx,by)を入力する。そして、ブロック切出手段62−2,62−3は、前述の処理にて視点B,Cの復号画像から所定形状の部分領域(ブロック)T2’,T3’をそれぞれ切り出し、視点B,CのブロックT2’,T3’を重畳部64にそれぞれ出力する。
図12に戻って、重畳部64は、ブロック切出部62から視点A,B,CのブロックT1’,T2’,T3’を入力し、ブロックT1’,T2’,T3’の中から2個以上を重畳し、重畳したブロックを生成する。重畳部64は、入力したブロックT1’,T2’,T3’及び重畳により生成したブロックを、ブロックW1’〜W7’として切替選択部65に出力する。
重畳部64は、図4に示した重畳部25と同様の処理を行い、図7に示した重畳部25と同様の構成を有する。
切替選択部65は、重畳部64からブロックW1’〜W7’を入力すると共に、マップデータ選択部63から最適選択肢S(bx,by)を入力する。そして、切替選択部65は、最適選択肢S(bx,by)に基づいて、ブロックW1’〜W7’の中から1つのブロックを選択し、選択したブロックをブロック多重化部66に出力する。
これにより、切替選択部65にて、図4に示した誤差最小化部27が判定した最小評価値のブロックと同じブロック番号のブロックが選択される。例えば、図4に示した誤差最小化部27により、最小評価値のブロックとしてブロックW3が判定された場合、切替選択部65により、同じブロック番号3のブロックW3’が選択される。
尚、重畳部64及び切替選択部65の代わりに、新たな重畳部を備えるようにしてもよい。新たな重畳部は、ブロック切出部62から視点A,B,CのブロックT1’,T2’,T3’を入力すると共に、マップデータ選択部63から最適選択肢S(bx,by)を入力する。そして、重畳部は、後述するテーブルに基づいて、最適選択肢S(bx,by)に対応するブロックT1’,T2’,T3’の組み合わせを特定し、その組み合わせが2個以上のブロックの場合、これらのブロックを重畳し、重畳したブロックを生成する。重畳部は、特定した組み合わせが1個のブロックの場合、当該ブロックをブロック多重化部66に出力し、特定した組み合わせが2個以上のブロックの場合、重畳により生成したブロックをブロック多重化部66に出力する。
重畳部は、図4に示した符号化側の誤差最小化部27が最適選択肢S(bx,by)を設定する際に用いる規則と同じ規則が定義されたテーブル、すなわち最適選択肢S(bx,by)とブロックT1’,T2’,T3’の組み合わせとの間の関係が定義されたテーブルを保持しているものとする。例えば、テーブルには、最適選択肢S(bx,by)=1とブロックT1’の組み合わせとが対応し、最適選択肢S(bx,by)=2とブロックT2’の組み合わせとが対応し、最適選択肢S(bx,by)=3とブロックT1’,T2’の組み合わせとが対応し、・・・、最適選択肢S(bx,by)=7とブロックT1’,T2’ ,T3’の組み合わせとが対応する関係が定義されている。
ブロック多重化部66は、切替選択部65からブロックを入力すると共に、走査部61から視点P1のブロック位置(b,b)を入力する。そして、ブロック多重化部66は、視点P1のブロック位置(b,b)にブロックを設定してタイル状に貼り合わせることで、ブロックを多重化し、視点P1の復元画像を生成する。ブロック多重化部66は、視点P1の復元画像を外部へ出力する。
同様に、画像復元手段60−2〜60−6は、視点A,B,Cの復号画像を参照し、最適奥行きマップD2〜D6及び最適選択肢マップS2〜S6に基づいて、視点P2〜P6の復元画像をそれぞれ生成し、視点P2〜P6の復元画像を外部へそれぞれ出力する。
(ブロック切出手段62−1の動作)
次に、画像復元手段60−1の動作について説明する。図14は、画像復元手段60−1による画像復元処理の一例を示すフローチャートである。画像復元手段60−2から60−6による画像復元処理も同様である。
まず、画像復元手段60−1のブロック切出部62は、多視点画像復号部40から視点A,B,Cの復号画像を入力し、マップデータ選択部63は、補助情報逆多重化部50から最適奥行きマップD1及び最適選択肢マップS1を入力する(ステップS201)。
走査部61は、復元すべき視点P1の復元画像上に部分領域(ブロック)を指定するためのブロック位置(bx,by)を設定する(ステップS202)。そして、マップデータ選択部63は、ブロック位置(bx,by)に基づいて、最適奥行きマップD1及び最適選択肢マップS1の中から最適奥行き値D(bx,by)及び最適選択肢S(bx,by)を選択する(ステップS203)。
ブロック切出部62は、復元される視点P1の復元画像のブロック位置(bx,by)に撮像された被写体140上の点が最適奥行き値D(bx,by)の位置にあると仮定したときの、当該被写体140上の点に対応する視点A,B,Cの復号画像の座標(基準点)を求め、視点A,B,Cの復号画像から、基準点の部分領域(ブロック)T1’,T2’,T3’をそれぞれ切り出す(ステップS204)。
重畳部64は、視点A,B,CのブロックT1’,T2’,T3’の中から2個以上を重畳し、ブロックW1’〜W7’を生成する(ステップS205)。そして、切替選択部65は、ステップS203にて選択された最適選択肢S(bx,by)に基づいて、ブロックW1’〜W7’の中から1つのブロックを選択する(ステップS206)。
ブロック多重化部66は、視点P1のブロック位置(b,b)に、ステップS206にて選択されたブロックをタイル状に貼り合わせ、視点P1の復元画像を生成する(ステップS207)。
画像復元手段60−1は、視点Pのブロック位置(b,b)の走査が終了するまで、ステップS202〜ステップS207の処理を繰り返す(ステップS208)。
このように、画像復元手段60−1により、視点P1の様々なブロック位置(b,b)におけるブロックW1’〜W7’が生成され、ブロックW1’〜W7’の中から1つのブロックが選択され、そのブロックを貼り合わせることで、視点P1の復元画像を生成される。
以上のように、本発明の実施形態による多視点画像復号装置300によれば、多視点画像復号部40は、多視点画像符号化部10から出力された多視点画像符号化ストリームを復号し、視点A,B,Cの復号画像を生成する。また、補助情報逆多重化部50は、多視点画像符号化装置200から出力された補助情報を逆多重化し、最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6を生成する。そして、画像復元部60は、視点A,B,Cの復号画像を参照し、最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6に基づいて、視点P1〜P6の復元画像を生成する。
これにより、復号側にて、カメラパラメータに起因するエピポーラ拘束を利用した補助情報に基づいて、視点P1〜P6の復元画像が生成されるから、符号化側が、視点P1〜P6の入力画像を多視点画像符号化して出力する必要はない。この補助情報は、最適なブロックの番号を示す値及び最適な奥行き値であり、従来の多視点画像符号化方式及び多視点画像復号方式にて用いる誤差画像に比べて情報量が少ない。したがって、画像の符号化効率を向上させることができる。
尚、本発明の実施形態による多視点画像復号装置300のハードウェア構成としては、通常のコンピュータを使用することができる。多視点画像復号装置300は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。多視点画像復号装置300に備えた多視点画像復号部40、補助情報逆多重化部50及び画像復元部60の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。
[多視点画像符号化装置/他の実施形態]
次に、本発明の他の実施形態による多視点画像符号化装置について説明する。図15は、本発明の他の実施形態による多視点画像符号化装置の構成の一例を示すブロック図である。この多視点画像符号化装置400は、多視点画像符号化部10、補間方法判定部20、補助情報多重化部30、多視点画像復号部40及び遅延部70を備えている。
図2に示した多視点画像符号化装置200とこの多視点画像符号化装置400とを比較すると、両多視点画像符号化装置200,400は、多視点画像符号化部10、補間方法判定部20及び補助情報多重化部30を備えている点で同一である。しかし、多視点画像符号化装置400は、多視点画像復号部40及び遅延部70を備えている点で、多視点画像符号化装置200と相違する。また、多視点画像符号化装置400の補間方法判定部20は、多視点画像復号部40から視点A,B,Cの復号画像を入力し、多視点画像符号化装置200の補間方法判定部20は、視点A,B,Cから撮影した画像を入力する点で、両者は相違する。ここでは、多視点画像符号化部10及び補助情報多重化部30の説明を省略する。
多視点画像復号部40は、多視点画像符号化部10から多視点画像符号化ストリームを入力し、多視点画像符号化ストリームを従来の多視点画像復号方式にて復号して視点A,B,Cの復号画像を生成し、視点A,B,Cの復号画像を補間方法判定部20に出力する。
遅延部70は、視点P1〜P6から撮影した画像を入力し、視点P1〜P6の入力画像を、多視点画像符号化部10及び多視点画像復号部40の処理時間分だけ遅延させ、遅延させた視点P1〜P6の入力画像を補間方法判定部20に出力する。
遅延部70は、同一の機能を有する複数の遅延手段70−1〜70−6を備えている。遅延手段70−1は、視点P1から撮影した画像を入力し、視点P1の入力画像を前述の処理時間分だけ遅延させ、遅延させた視点P1の入力画像を補間方法判定部20に出力する。遅延手段70−2〜70−6は、遅延手段70−1と同様の処理を行う。
補間方法判定部20は、多視点画像復号部40から視点A,B,Cの復号画像を入力すると共に、遅延部70から遅延した視点P1〜P6の画像を入力し、視点A,B,Cの復号画像を参照して視点P1〜P6の画像を復元するために必要な最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6を生成する。
以上のように、本発明の他の実施形態による多視点画像符号化装置400によれば、多視点画像復号部40は、多視点画像符号化ストリームを復号して視点A,B,Cの復号画像を生成し、遅延部70は、視点P1〜P6の入力画像を、多視点画像符号化部10及び多視点画像復号部40の処理時間分だけ遅延させる。そして、補間方法判定部20は、視点A,B,Cの復号画像を参照して視点P1〜P6の画像を復元するために必要な最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6を生成する。
これにより、図2に示した多視点画像符号化装置200と同様の効果を奏する。また、視点A,B,C,P1〜P6の入力画像が動画の場合に、補間方法判定部20に入力される視点A,B,Cの復号画像と視点P1〜P6の入力画像とのタイミングを合わせることができるから、同期した視点A,B,Cの復号画像及びP1〜P6の入力画像を用いて、最適奥行きマップD1〜D6及び最適選択肢マップS1〜S6が生成される。
したがって、補間方法判定部20により、多視点画像符号化部10の符号化処理及び多視点画像復号部40の復号処理による画質劣化を含め、補間方法の最適化がなされる。多視点画像復号装置300において、符号化側に図2に示した多視点画像符号化装置200を用いる場合よりも、視点P1〜P6の画像を正確に復元することができ、画質を向上させることができる。
尚、視点P1〜P6の画像が静止画である場合には、多視点画像符号化装置400は、遅延部70を備えていなくてもよい。
また、本発明の他の実施形態による多視点画像符号化装置400のハードウェア構成としては、通常のコンピュータを使用することができる。多視点画像符号化装置400は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。多視点画像符号化装置400に備えた多視点画像符号化部10、補間方法判定部20、補助情報多重化部30、多視点画像復号部40及び遅延部70の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。
以上、実施形態及び他の実施形態を挙げて本発明を説明したが、本発明は前記実施形態等に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、前記実施形態等では、多視点画像符号化装置200,400の補間方法判定部20は補間方法判定手段20−1〜20−6を備えているが、補間方法判定手段20−1〜20−6のそれぞれを1台の装置として構成するようにしてもよい。補間方法判定装置(補助情報生成装置)は、図4と同様に、走査部21,22等を備え、視点A,B,Cの入力画像及び視点P1の入力画像に基づいて、最適奥行きマップD1及び最適選択肢マップS1を生成する。この補間方法判定装置のハードウェア構成としては、通常のコンピュータを使用することができる。補間方法判定装置は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。補間方法判定装置に備えた走査部21,22等の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。
また、多視点画像復号装置300の画像復元部60は画像復元手段60−1〜60−6を備えているが、画像復元手段60−1〜60−6のそれぞれを1台の装置として構成するようにしてもよい。画像復元装置は、図12と同様に、走査部61等を備え、視点A,B,Cの画像、及び補間方法判定装置により生成された最適奥行きマップD1及び最適選択肢マップS1に基づいて、視点P1の復元画像を生成する。この画像復元装置のハードウェア構成としては、通常のコンピュータを使用することができる。画像復元装置は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。画像復元装置に備えた走査部61等の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。
また、前記実施形態等では、従来の多視点画像符号化方式にて符号化される入力画像(参照画像)の数を3とし、補助情報が生成される入力画像(対象画像)の数を6として説明したが、本発明は、この数に限定されるものではなく、参照画像の数は2以上、対象画像の数は1以上の場合に適用がある。
参照画像の数が1の場合には、図2に示した多視点画像符号化装置200及び図15に示した多視点画像符号化装置400において、補助情報多重化部30を省略することができる。また、図10に示した多視点画像復号装置300において、補助情報逆多重化部50を省略することができる。この場合、多視点画像符号化装置200及び多視点画像符号化装置400の補間方法判定部20は、最適奥行きマップD1及び最適選択肢マップS1をそのまま出力し、多視点画像復号装置300の画像復元部60は、最適奥行きマップD1及び最適選択肢マップS1を直接入力する。
また、前記実施形態等では、図10及び図11に示した多視点画像復号装置300の画像復元部60は、図2及び図15に示した多視点画像符号化装置200,400が入力する視点P1〜P6の画像の数に対応した6つの画像復元手段60−1〜60−6を備えているが、1つ以上6つ未満の画像復元手段を備えるようにしてもよい。要するに、多視点画像復号装置300の画像復元部60は、復元する画像の数分の画像復元手段を備えていればよい。
また、多視点画像符号化装置200,400は、多視点画像符号化ストリーム及び補助情報を、同一の伝送路(例えば、放送波の伝送路、インターネット等の通信回線の伝送路)を介して多視点画像復号装置300へ出力するようにしてもよいし、異なる伝送路を介して出力するようにしてもよい。
また、多視点画像符号化装置200,400は、多視点画像符号化ストリーム及び補助情報を、多視点画像復号装置300による復号処理を前提にして、一旦蓄積媒体に蓄積してもよい。多視点画像符号化装置200,400は、多視点画像符号化ストリーム及び補助情報を、同一の蓄積媒体に蓄積してもよいし、別々の蓄積媒体に蓄積してもよい。多視点画像符号化装置200,400は、多視点画像符号化ストリーム及び補助情報を同一の蓄積媒体に蓄積する場合、例えば、多視点画像符号化ストリームを、DVDの通常のトラックに記録し、補助情報を、特定の機材にて再生可能な特別のトラックに記録する。
10 多視点画像符号化部
20 補間方法判定部(補助情報生成部)
20−1〜20−6 補間方法判定手段(補助情報生成手段)
21,22,61 走査部
23,24,62 ブロック切出部
24−1〜24−3 ブロック切出手段
25,64 重畳部
25−1〜25−4 重畳手段
26 誤差評価部
26−1〜26−6 誤差評価手段
27 誤差最小化部
28 最適マップ多重化部
30 補助情報多重化部
40 多視点画像復号部
50 補助情報逆多重化部
60 画像復元部
60−1〜60−6 画像復元手段
63 マップデータ選択部
65 切替選択部
66 ブロック多重化部
100 視点Pの入力画像
101 視点Pの入力画像内の画像位置(b,b
102 画像位置(b,b)の部分領域
110 視点Aの入力画像
111 エピポーラ線EP
120 視点Bの入力画像
121 エピポーラ線EP
130 視点Cの入力画像
131 エピポーラ線EP
200,400 多視点画像符号化装置
300 多視点画像復号装置

Claims (12)

  1. N個の視点でそれぞれ得られるN個の入力画像(Nは2以上の整数)及び前記N個の視点以外の視点でそれぞれ得られるL個の入力画像(Lは1以上の整数)を符号化する多視点画像符号化装置において、
    前記N個の入力画像を符号化し、多視点画像符号化ストリームを生成する多視点画像符号化部と、
    前記L個の入力画像の部分領域毎に、当該部分領域に対応する前記N個の入力画像におけるエピポーラ線上の座標の部分領域を求め、前記L個の入力画像の部分領域と、前記N個の入力画像の部分領域との間の誤差が最小になるように、前記N個の入力画像から前記L個の入力画像を復元するために用いる補助情報であって、前記N個の入力画像の中から1以上の入力画像を選択する補助情報を、前記L個の入力画像のそれぞれについて生成する補助情報生成部と、
    を備えることを特徴とする多視点画像符号化装置。
  2. 請求項1に記載の多視点画像符号化装置において、
    さらに、前記多視点画像符号化部により生成された多視点画像符号化ストリームを復号し、N個の復号画像を生成する多視点画像復号部と、
    前記L個の入力画像をそれぞれ所定時間遅延させる遅延部と、を備え、
    前記補助情報生成部は、
    前記遅延部により遅延させたL個の入力画像の部分領域毎に、当該部分領域に対応する、前記多視点画像復号部により生成されたN個の復号画像におけるエピポーラ線上の座標の部分領域を求め、前記L個の入力画像の部分領域と、前記N個の復号画像の部分領域との間の誤差が最小になるように、前記N個の復号画像から前記L個の入力画像を復元するために用いる補助情報であって、前記N個の復号画像の中から1以上の入力画像を選択する補助情報を、前記L個の入力画像のそれぞれについて生成する、ことを特徴とする多視点画像符号化装置。
  3. 請求項1または2に記載の多視点画像符号化装置において、
    前記N個の入力画像のそれぞれを参照画像とし、前記L個の入力画像のそれぞれを対象画像として、
    前記補助情報生成部は、前記L個の対象画像のそれぞれに対応した補助情報生成手段を備え、
    前記補助情報生成手段は、
    所定の奥行き値を走査する第1走査部と、
    前記対象画像の座標を走査する第2走査部と、
    前記第2走査部により走査された対象画像の座標に基づいて、前記対象画像の部分領域を前記対象画像のブロックとして切り出す第1ブロック切出部と、
    前記第2走査部により走査された対象画像の座標に対し、前記第1走査部により走査された奥行き値に対応する前記N個の参照画像におけるエピポーラ線上の座標を基準点としてそれぞれ求め、前記基準点に基づいて、前記参照画像の部分領域を前記参照画像のブロックとして切り出す第2ブロック切出部と、
    前記第2ブロック切出部により切り出された前記N個の参照画像のブロックのうち1個以上のブロックの組み合わせを生成し、前記組み合わせが1個のブロックの場合、当該1個のブロックを出力し、前記組み合わせが複数のブロックの場合、当該複数のブロックを重畳して出力する重畳部と、
    前記重畳部により出力された組み合わせ毎のブロックと、前記第1ブロック切出部により切り出された対象画像のブロックとの間の差を求め、前記差に基づいて、前記組み合わせ毎のブロックのそれぞれについての評価値を算出する誤差評価部と、
    前記第1走査部により走査された奥行き値毎に、前記誤差評価部により組み合わせ毎のブロックのそれぞれについて評価値が算出された場合に、前記評価値のうち最小の評価値を判定し、前記最小の評価値に対応する前記奥行き値及び前記組み合わせを、最適奥行き値及び最適選択肢としてそれぞれ決定する誤差最小化部と、
    前記第2走査部により走査された対象画像の座標毎に、前記誤差最小化部により最適奥行き値及び最適選択肢が決定された場合に、前記対象画像の座標毎の最適奥行き値及び最適選択肢を多重化し、補助情報を生成する多重化部と、
    を備えることを特徴とする多視点画像符号化装置。
  4. 請求項1の多視点画像符号化装置により生成された多視点画像符号化ストリーム及び補助情報を入力し、前記多視点画像符号化ストリーム及び前記補助情報に基づいて、N個の視点でそれぞれ得られるN個の復号画像(Nは2以上の整数)及び前記N個の視点以外の視点でそれぞれ得られるL個の復元画像(Lは1以上の整数)を生成する多視点画像復号装置において、
    前記視点画像符号化ストリームを復号し、前記N個の復号画像を生成する多視点画像復号部と、
    前記L個の入力画像の部分領域毎に、当該部分領域に対応する前記N個の入力画像におけるエピポーラ線上の座標の部分領域を求め、前記N個の入力画像の中から1以上の入力画像を選択する前記補助情報に基づいて、前記1以上の入力画像における前記部分領域のブロックを選択し、前記L個の復元画像を生成する画像復元部と、
    を備えることを特徴とする多視点画像復号装置。
  5. 請求項3の多視点画像符号化装置により生成された多視点画像符号化ストリーム及び補助情報を入力する請求項4に記載の多視点画像復号装置において、
    前記N個の復号画像のそれぞれを参照画像とし、前記L個の復元画像のそれぞれを対象画像として、
    前記画像復元部は、前記L個の対象画像のそれぞれに対応した画像復元手段を備え、
    前記画像復元手段は、
    前記対象画像の座標を走査する走査部と、
    前記走査部により走査された対象画像の座標に対し、前記補助情報に含まれる最適奥行き値に対応する前記N個の参照画像におけるエピポーラ線上の座標を基準点としてそれぞれ求め、前記基準点に基づいて、前記参照画像の部分領域を前記参照画像のブロックとして切り出すブロック切出部と、
    前記ブロック切出部により切り出された前記N個の参照画像のブロックのうち1個以上のブロックの組み合わせを生成し、前記組み合わせが1個のブロックの場合、当該1個のブロックを出力し、前記組み合わせが複数のブロックの場合、当該複数のブロックを重畳して出力する重畳部と、
    前記補助情報に含まれる最適選択肢に基づいて、前記重畳部により出力された組み合わせ毎のブロックのうち1つの組み合わせのブロックを選択する選択部と、
    前記走査部により走査された対象画像の座標に、前記選択部により選択されたブロックを設定し、前記ブロックを多重化し、前記対象画像である復元画像を生成するブロック多重化部と、
    を備えることを特徴とする多視点画像復号装置。
  6. 請求項5に記載の多視点画像復号装置において、
    前記画像復元手段は、前記重畳部及び選択部の代わりに新たな重畳部を備え、
    前記新たな重畳部は、
    前記ブロック切出部により切り出された前記N個の参照画像のブロックのうち1個以上のブロックの組み合わせと前記最適選択肢との間の関係が定義されたテーブルを用いて、前記補助情報に含まれる最適選択肢に対応する組み合わせを特定し、前記特定した組み合わせが1個のブロックの場合、当該1個のブロックを出力し、前記特定した組み合わせが複数のブロックの場合、当該複数のブロックを重畳して出力し、
    前記ブロック多重化部は、
    前記走査部により走査された対象画像の座標に、前記新たな重畳部により出力されたブロックを設定し、前記ブロックを多重化し、前記対象画像である復元画像を生成する、ことを特徴とする多視点画像復号装置。
  7. N個の視点でそれぞれ得られるN個の入力画像(Nは2以上の整数)を参照し、前記N個の視点以外の視点で得られる入力画像を復元するための補助情報を生成する補助情報生成装置において、
    前記N個の入力画像のそれぞれを参照画像とし、前記N個の視点以外の視点で得られる入力画像を対象画像として、
    所定の奥行き値を走査する第1走査部と、
    前記対象画像の座標を走査する第2走査部と、
    前記第2走査部により走査された対象画像の座標に基づいて、前記対象画像の部分領域を前記対象画像のブロックとして切り出す第1ブロック切出部と、
    前記第2走査部により走査された対象画像の座標に対し、前記第1走査部により走査された奥行き値に対応する前記N個の参照画像におけるエピポーラ線上の座標を基準点としてそれぞれ求め、前記基準点に基づいて、前記参照画像の部分領域を前記参照画像のブロックとして切り出す第2ブロック切出部と、
    前記第2ブロック切出部により切り出された前記N個の参照画像のブロックのうち1個以上のブロックの組み合わせを生成し、前記組み合わせが1個のブロックの場合、当該1個のブロックを出力し、前記組み合わせが複数のブロックの場合、当該複数のブロックを重畳して出力する重畳部と、
    前記重畳部により出力された組み合わせ毎のブロックと、前記第1ブロック切出部により切り出された対象画像のブロックとの差を求め、前記差に基づいて、前記組み合わせ毎のブロックのそれぞれについての評価値を算出する誤差評価部と、
    前記第1走査部により走査された奥行き値毎に、前記誤差評価部により組み合わせ毎のブロックのそれぞれについて評価値が算出された場合に、前記評価値のうち最小の評価値を判定し、前記最小の評価値に対応する前記奥行き値及び前記組み合わせを、最適奥行き値及び最適選択肢としてそれぞれ決定する誤差最小化部と、
    前記第2走査部により走査された対象画像の座標毎に、前記誤差最小化部により最適奥行き値及び最適選択肢が決定された場合に、前記対象画像の座標毎の最適奥行き値及び最適選択肢を多重化し、補助情報を生成する多重化部と、
    を備えることを特徴とする補助情報生成装置。
  8. N個の視点でそれぞれ得られるN個の画像(Nは2以上の整数)を参照し、請求項7の補助情報生成装置により生成された補助情報に基づいて、前記N個の視点以外の視点で得られる画像を復元する画像復元装置において、
    前記N個の画像のそれぞれを参照画像とし、前記復元画像を対象画像として、
    前記対象画像の座標を走査する走査部と、
    前記走査部により走査された対象画像の座標に対し、前記補助情報に含まれる最適奥行き値に対応する前記N個の参照画像におけるエピポーラ線上の座標を基準点としてそれぞれ求め、前記基準点に基づいて、前記参照画像の部分領域を前記参照画像のブロックとして切り出すブロック切出部と、
    前記ブロック切出部により切り出された前記N個の参照画像のブロックのうち1個以上のブロックの組み合わせを生成し、前記組み合わせが1個のブロックの場合、当該1個のブロックを出力し、前記組み合わせが複数のブロックの場合、当該複数のブロックを重畳して出力する重畳部と、
    前記補助情報に含まれる最適選択肢に基づいて、前記重畳部により出力された組み合わせ毎のブロックのうち1つの組み合わせのブロックを選択する選択部と、
    前記走査部により走査された対象画像の座標に、前記選択部により選択されたブロックを設定し、前記ブロックを多重化し、前記対象画像である復元画像を生成するブロック多重化部と、
    を備えることを特徴とする画像復元装置。
  9. コンピュータを、請求項1から3までのいずれか一項に記載の多視点画像符号化装置として機能させるための多視点画像符号化プログラム。
  10. コンピュータを、請求項4から6までのいずれか一項に記載の多視点画像復号装置として機能させるための多視点画像復号プログラム。
  11. コンピュータを、請求項7に記載の補助情報生成装置として機能させるための補助情報生成プログラム。
  12. コンピュータを、請求項8に記載の画像復元装置として機能させるための画像復元プログラム。
JP2015095606A 2015-05-08 2015-05-08 多視点画像符号化装置、多視点画像復号装置、補助情報生成装置、画像復元装置及びプログラム Active JP6599634B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015095606A JP6599634B2 (ja) 2015-05-08 2015-05-08 多視点画像符号化装置、多視点画像復号装置、補助情報生成装置、画像復元装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015095606A JP6599634B2 (ja) 2015-05-08 2015-05-08 多視点画像符号化装置、多視点画像復号装置、補助情報生成装置、画像復元装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2016213664A true JP2016213664A (ja) 2016-12-15
JP6599634B2 JP6599634B2 (ja) 2019-10-30

Family

ID=57551845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015095606A Active JP6599634B2 (ja) 2015-05-08 2015-05-08 多視点画像符号化装置、多視点画像復号装置、補助情報生成装置、画像復元装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6599634B2 (ja)

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
今泉 浩幸 ほか3名: "対応点の確度分布を考慮した多眼画像からの奥行き推定", 情報処理学会研究報告, vol. 第2000巻、第7号, JPN6019004223, 21 January 2000 (2000-01-21), pages 9 - 16 *
粕谷 満成 ほか1名: "多視点画像符号化を想定した奥行き推定の検討", 画像符号化シンポジウム 第27回シンポジウム資料, JPN6019004224, 24 October 2012 (2012-10-24), pages p. 59〜60 *

Also Published As

Publication number Publication date
JP6599634B2 (ja) 2019-10-30

Similar Documents

Publication Publication Date Title
JP6384744B2 (ja) 符号化装置および符号化方法
JP4414379B2 (ja) 映像符号化方法、映像復号方法、映像符号化プログラム、映像復号プログラム及びそれらのプログラムを記録したコンピュータ読み取り可能な記録媒体
EP2761878B1 (en) Representation and coding of multi-view images using tapestry encoding
JP6000463B2 (ja) 3d映像符号化の仮想深度値の方法および装置
KR102527566B1 (ko) 화상 처리 장치 및 화상 처리 방법
KR20140092910A (ko) 입체 영상 부호화 장치, 입체 영상 복호화 장치, 입체 영상 부호화 방법, 입체 영상 복호화 방법, 입체 영상 부호화 프로그램 및 입체 영상 복호화 프로그램
WO2017082079A1 (ja) 画像処理装置および画像処理方法
JP3693407B2 (ja) 多視点画像符号化装置および復号装置
JP2018519697A (ja) 奥行き情報を用いて全方向視差を圧縮したライトフィールドを合成する方法
KR20150046154A (ko) 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 화상 부호화 프로그램, 화상 복호 프로그램 및 기록매체
KR101648094B1 (ko) 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 화상 부호화 프로그램, 화상 복호 프로그램 및 기록매체
US20150334418A1 (en) Image encoding method, image decoding method, image encoding apparatus, image decoding apparatus, image encoding program, and image decoding program
KR20160118363A (ko) 화상 부호화 장치 및 방법, 화상 복호 장치 및 방법, 및 이들의 프로그램
Farid et al. Panorama view with spatiotemporal occlusion compensation for 3D video coding
JP4851564B2 (ja) 映像符号化方法、映像復号方法、映像符号化プログラム、映像復号プログラム及びそれらのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2009164865A (ja) 映像符号化方法,復号方法,符号化装置,復号装置,それらのプログラムおよびコンピュータ読み取り可能な記録媒体
JP6599634B2 (ja) 多視点画像符号化装置、多視点画像復号装置、補助情報生成装置、画像復元装置及びプログラム
KR101233399B1 (ko) 다시점 깊이 영상 생성 방법 및 장치
JP4815004B2 (ja) 多視点画像符号化装置
WO2017082077A1 (ja) 画像処理装置および画像処理方法
JP2009207183A (ja) 映像符号化方法、映像復号方法、映像符号化プログラム、映像復号プログラム及びそれらのプログラムを記録したコンピュータ読み取り可能な記録媒体
CN117561716A (zh) 用于从多视图视频构建深度图像的方法、用于对表示多视图视频的数据流进行解码的方法、编码方法、设备、系统、终端设备、信号以及与其对应的计算机程序
Lee et al. Technical Challenges of 3D Video Coding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190909

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191003

R150 Certificate of patent or registration of utility model

Ref document number: 6599634

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250