JP4786585B2 - 多視点映像符号化装置 - Google Patents

多視点映像符号化装置 Download PDF

Info

Publication number
JP4786585B2
JP4786585B2 JP2007111828A JP2007111828A JP4786585B2 JP 4786585 B2 JP4786585 B2 JP 4786585B2 JP 2007111828 A JP2007111828 A JP 2007111828A JP 2007111828 A JP2007111828 A JP 2007111828A JP 4786585 B2 JP4786585 B2 JP 4786585B2
Authority
JP
Japan
Prior art keywords
prediction
depth
depth information
image
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007111828A
Other languages
English (en)
Other versions
JP2008271217A (ja
Inventor
整 内藤
淳 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2007111828A priority Critical patent/JP4786585B2/ja
Publication of JP2008271217A publication Critical patent/JP2008271217A/ja
Application granted granted Critical
Publication of JP4786585B2 publication Critical patent/JP4786585B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、多視点映像符号化装置に関し、特に、複数の視点に配置されたカメラにより撮影された映像により構成される多視点映像を符号化する際に、各カメラから送出される画像の相関を考慮して高能率の圧縮符号化を実現する多視点映像符号化装置に関する。
複数の視点に配置されたカメラから送出される画像を、動き補償予測、視差補償予測、奥行き予測、画面内予測を選択的に用いてブロック単位で符号化する多視点映像符号化装置が知られている。
複数の視点に配置されたカメラにより同じ撮影対象物が同時に撮影された場合、各カメラから送出される画像は、時間方向および視点方向に強い相関を有する。したがって、カメラから送出される画像を、動き補償予測、視差補償予測、奥行き予測を選択的に用いて符号化することにより、画像を効率的に圧縮できる。
非特許文献1には、多視点映像の符号化技術が記載されている。これでは、符号化対象画像に対し、時間方向および視点方向についての参照画像を個別に与え、ブロック単位で符号化する。符号化処理では、まず、動き補償予測、視差補償予測、奥行き予測、画面内予測を併用し、それぞれの予測でのブロック内予測値を生成する。
動き補償予測では、時間方向についての参照画像を与え、符号化対象画像内の矩形ブロックの参照画像上の移動量を動きベクトルとして算出し、これに基づいて予測値を生成する。視差補償予測では、視点方向についての参照画像を与え、符号化対象画像内の矩形ブロックの参照画像上の水平および垂直方向の移動量を視差ベクトルとして算出し、これに基づいて予測値を生成する。奥行き予測では、視点方向についての参照画像を与え、符号化対象画像を送出するカメラのカメラパラメータと処理対象ブロックの奥行き情報および参照画像を送出するカメラのカメラパラメータから、処理対象ブロックに含まれる画素に対応する参照画像上の画素を求めることで予測値を生成する。
その後、動き補償予測、視差補償予測、奥行き予測、画面内予測により生成された予測値のうち最適な予測値を与える予測を選択し(予測モードの選択)、該予測値を生成するためのサイド情報と予測値の原画像に対する残差信号を符号化して符号化データを形成する。
特許文献1には、視点方向の予測と時間方向の予測とを同時に使うことによって多視点動画像の符号化効率を向上させる場合に、必要となる映像を、参照関係にある全てのカメラの映像を使うことなく復号できるようにする映像符号化方法が記載されている。つまり、ここでは、隣接するカメラの映像間で視点方向の予測を順次適用すると、ある視点の画像再生を行うためには参照関係にある全てのカメラの復号画像が必要となり、ユーザの選択に応じて限られた視点の画像再生が求められるようなアプリケーションにおいては、本来必要とされない(再生されない)データの送信および処理を伴う点を問題としてとらえ、この問題を解決する手段として、奥行き予測を積極的に採用し、奥行き予測の参照先を特定の視点(基準視点)の画像に限定する手段を提供している。
特開2007−36800号公報 S.Yea et al.:"Report on Core Experiment CE3 of Multi-view Coding", M13695 MPEG Document, July 2006
特許文献1に記載された技術では、奥行き予測を積極的に採用しており、カメラパラメータの信頼度や奥行き情報の探索精度が低く、奥行き予測が有効に機能しない場合を想定していない。したがって、奥行き予測により圧縮が効果的に行われないような場合にも、奥行き情報の探索処理が実行され、奥行き予測が適用されるという課題がある。
非特許文献1に記載された技術では、結果的には最適な予測モードが選択される。しかし、これでは、まず、動き補償予測、視差補償予測、奥行き予測、画面内予測を併用し、それぞれの予測での予測値を生成し、次に、そのうちの最適な予測値を与える予測を判定して選択するので、カメラパラメータの信頼度や奥行き情報の探索精度が低いなどの理由で奥行き予測が明らかに選択されないことが事前に判定できるような場合でも、奥行き情報の探索などを行う必要があるという課題がある。また、予測モード選択の記述に関する符号化シンタックス(記述規則)が必要となるという課題もある。
本発明の目的は、上記課題を解決し、各カメラから送出される画像の相関を考慮して高能率の圧縮符号化を実現する多視点映像符号化装置を提供することにある。
本発明は、上記課題を解決するため、複数の視点に配置されたカメラから送出される画像を、動き補償予測、視差補償予測、奥行き予測、画面内予測を選択的に用いてブロック単位で符号化する多視点映像符号化装置において、カメラから撮影対象までの距離を表す奥行き情報の信頼性を判定する判定手段と、前記カメラから送出される画像の符号化に先立って、前記判定手段により判定された奥行き情報の信頼性に基づき、該画像に対する奥行き予測の適用を許可するか否かの制御を行う制御手段を備え、上記判定手段は、前記カメラから送出される画像に対し視点方向の2枚以上の参照画像をとり、前記画像と前記参照画像の各々とから奥行き情報をそれぞれ取得し、これらの奥行き情報の類似度を表すパラメータを算出し、該パラメータを指標として前記奥行き情報の信頼性を判定するた点に第1の特徴がある。
また、本発明は、複数の視点に配置されたカメラから送出される画像を、動き補償予測、視差補償予測、奥行き予測、画面内予測を選択的に用いてブロック単位で符号化する多視点映像符号化装置において、カメラから撮影対象までの距離を表す奥行き情報の信頼性を判定する判定手段と、前記カメラから送出される画像の符号化に先立って、前記判定手段により判定された奥行き情報の信頼性に基づき、該画像に対する奥行き予測の適用を許可するか否かの制御を行う制御手段を備え、上記判定手段は、前の符号化において、視点方向の参照画像を2枚以上用いた奥行き予測が適用された場合、その符号化結果あるいは符号化処理中に探索した奥行き情報の結果から奥行き情報の類似度を表すパラメータを取得し、該パラメータを指標として前記奥行き情報の信頼性を判定する点に第2の特徴がある。
また、本発明は、前記判定手段が、前の符号化において、視点方向の参照画像を2枚以上用いるが奥行き予測が適用されない場合、前の符号化の対象画像と前記参照画像の各々とから奥行き情報をそれぞれ取得し、これらの奥行き情報の類似度を表すパラメータを算出し、該パラメータを指標として前記奥行き情報の信頼性を判定する点に第の特徴がある。
また、本発明は、前記制御手段が、ブロック単位、画面単位あるいは一連の画像単位で奥行き予測の適用を許可するか否かの制御を行う点に第の特徴がある。
また、本発明は、前記判定手段が、前記パラメータの算出に際し、オクルージョン領域に属するブロックあるいは該ブロックに対する奥行き情報を算出対象から除外する点に第の特徴がある。
また、本発明は、前記パラメータとして、奥行き情報の差分に関する統計量を用いる点に第の特徴がある。
また、本発明は、前記奥行き情報の差分に関する統計量として、差分二乗和、差分絶対値和、差分絶対値の最小値、差分絶対値の最大値のうち少なくとも1つを用いる点に第の特徴がある。
また、本発明は、前記制御手段が、前記パラメータが予め設定された閾値未満の場合、奥行き予測の適用を許可するように制御を行う点に第の特徴がある。
さらに、本発明は、前記制御手段が、前記パラメータが予め設定された閾値以上の場合、奥行き予測の適用を許可しないように制御を行う点に第の特徴がある。
本発明では、カメラから撮影対象までの距離を表す奥行き情報の信頼性を判定し、これにより判定された奥行き情報の信頼性に基づき、画像の符号化に先立って、該画像に奥行き予測の適用を許可するか否かの制御を行う。このように、画像の符号化に先立って、奥行き予測が有効であるか否かを判定する処理を導入し、この判定結果に基づいて奥行き予測の適用を許可あるいは禁止した上で符号化処理を行うことにより、カメラパラメータの信頼度や奥行き情報の探索精度が低いなどの理由で奥行き予測が有効に機能せず、結果として視差補償予測の選択が集中して奥行き予測の選択が皆無となるような場合、奥行き情報の探索を省略することができる。
これにより奥行き情報の探索に要する処理を省略化でき、処理量を削減できる。また、予測モード選択の記述に関する符号化シンタックスを簡素化でき、これにより符号化効率を改善できる。
また、カメラパラメータと奥行き情報の精度が十分に保証される理想的な環境において、奥行き情報は、参照画像によらず一定であると考えられるので、カメラから送出される画像に対し視点方向の2枚以上の参照画像をとり、その画像と参照画像の各々とから奥行き情報をそれぞれ取得し、これらの奥行き情報の類似度を表すパラメータを算出し、該パラメータを奧行き予測の有効性の指標として利用することにより、奥行き予測の有効性を的確に判定できる。なお、奥行き情報の類似度が高いほど、カメラパラメータと奥行き情報の信頼度も高く、奥行き予測の有効性が保証される。
また、前の符号化において、視点方向の参照画像を2枚以上用いた奥行き予測が適用された場合、奥行き予測の符号化結果あるいは符号化処理中に探索した奥行き情報の結果から奥行き情報の類似度を表すパラメータを取得することにより、該パラメータを取得する処理を簡単にすることができる。なお、前の符号化において、奥行き予測が適用されない場合には、前の符号化の対象画像と参照画像の各々とから奥行き情報をそれぞれ取得し、これらの奥行き情報の類似度を表すパラメータを算出すればよい。
さらに、奥行き情報の類似度を表すパラメータの算出に際し、オクルージョン領域に属するブロックあるいは該ブロックに対する奥行き情報を算出対象から除外することにより、オクルージョン領域による奥行き予測の有効性の判定への影響をなくすことができる。
以下、図面を参照して本発明を説明する。本発明は、複数の視点に配置されたカメラから送出される画像を、動き補償予測、視差補償予測、奥行き予測、画面内予測を選択的に用いてブロック単位で符号化する多視点映像符号化装置を前提としている。
図1は、3視点V0,V1,V2に配置されたカメラから送出される多視点映像における画像(画面)間の参照関係の一例を示す。図1において、I,P,Bは当該画像の符号化モードを表し、矢印の先の画像を参照画像としている。Iは画面内予測が適用される画像、Pは参照画像を1枚用いる予測をブロック単位で適用し得る画像、Bは参照画像を2枚用いる予測をブロック単位で適用し得る画像である。
視点V0のカメラは、画像(1),(4),・・・を順次送出し、視点V1のカメラは、画像(2),(5),・・・を順次送出し、視点V2のカメラは、画像(3),(6),・・・を順次送出する。画像(1),(2),(3)は時刻T0で同時に送出され、画像(4),(5),(6)は時刻T1で同時に送出される。
例えば、画像(2)の全ブロックに対しては画面内予測が適用される。画像(1)に対しては画面内予測、視点方向(View)の画像(2)を参照画像とする視差補償予測、あるいは視点方向の画像(2)を参照画像とする奥行き予測をブロック単位で適用することができる。また、画像(4)に対しては画面内予測、時間方向(Time)の画像(1)を参照画像とする動き補償予測、視点方向の画像(5)を参照画像とする視差補償予測、視点方向の画像(5)を参照画像とする奥行き予測、あるいは時間方向の画像(1)および視点方向の画像(5)を参照画像とする予測をブロック単位で適用することができる。
従来の多視点映像符号化装置では、例えば、画像(1)の符号化では、時間方向の予測を適用せず、参照画像を必要としない画面内予測あるいは視点方向の予測をブロック単位で適用する。このために、まず、参照画像を必要としない画面内予測、画像(2)を参照画像とする視差補償予測、画像(2)を参照画像とする奥行き予測を併用し、それぞれの予測での画像(1)に対するブロック内予測値を生成する。次に、それらの予測値のうち最適な予測値を与える予測を選択し(予測モードの選択)、該予測値を生成するためのサイド情報と予測値の原画像に対する残差信号を符号化して符号化データを形成する。
また、画像(4)の符号化では、参照画像を必要としない画面内予測、時間方向の画像(1)を参照画像とする動き補償予測、視点方向の画像(5)を参照画像とする視差補償予測、視点方向の画像(5)を参照画像とする奥行き予測、あるいは時間方向の画像(1)および視点方向の画像(5)を参照画像とする予測を併用し、それぞれの予測での画像(4)に対するブロック内予測値を生成する。次に、それらの予測値のうち最適な予測値を与える予測を選択し(予測モードの選択)、該予測値を生成するためのサイド情報と予測値の原画像に対する残差信号を符号化して符号化データを形成する。
本発明は、視点方向の相関を利用した予測を適用し得る画像(図1では画像(1)や(3)や(4)や(6))を符号化するに先立って、視点方向の予測において奥行き予測の適用を許可するか否かの制御を行う。したがって、画像(2)や画像(5)のように、ある視点の画像だけに閉じて符号化が行われる画像につては問題としない。
次に、本発明に係る多視点映像符号化装置の第1実施形態を説明する。以下では、図1の符号化構造を持つ多視点映像において、画像(1)を符号化する場合を例にあげて説明する。
図2は、第1実施形態における動作を示すフローチャートであり、このフローチャートに従って動作する多視点映像符号化装置は、ハードウエアでもソフトウエアでも実現できる。
符号化に先立ち、符号化対象画像(画像(1))を読み込み(S21)、また、符号化対象画像に対する視点方向の参照画像a,b(画像(2),(3))を予測参照メモリに読み込む(S22)。次に、3視点(V0,V1,V2)に配置されたカメラのカメラパラメータ(CV0,CV1,CV2)を取得する(S23)。カメラパラメータは、カメラ相互の配置関係やカメラの向きなどであり、予め求められているものとする。
次に、画像(1)を構成するブロックを指示するパラメータkを0に初期設定し(S24)、画像(1)のブロックk(=0)について参照画像(2),(3)各々に対して奥行き情報を探索する。これにより探索された奥行き情報をそれぞれD2(k)、D3(k)に格納する(S25)。
奥行き情報の探索には、従来の探索手法をそのまま利用できる。以下に、奥行き情報の探索手法の一例を説明する。まず、エピポーラ拘束による画像座標間の対応は式(1)、式(2)により表現できる。
Figure 0004786585
Figure 0004786585
ここで、K、R、tはそれぞれ、カメラの内部行列、回転行列、並進行列を表し、cur、refはそれぞれ、符号化対象画像の属する視点、参照画像の属する視点を表す。m=[u,v,1]、dはそれぞれ、符号化対象画像における画像座標、奥行き情報を表す。Xworldは、mとdから算出される世界座標を表す。m′=[u′,v′,1]、d′はそれぞれ、Xworldに対応する参照画像における画像座標、奥行き情報を表す。
式(1)で算出されるXworldを式(2)に代入し、式(2)からd′u′,d′v′,d′それぞれの値が算出されるので、それらの関係からd′,u′,v′の値をそれぞれ算出することができる。
奥行き情報dを探索する際に使用する評価関数としては、例えば、式(3)のSSD(Sum of Square Difference)を用いることができる。
Figure 0004786585
以上の奥行き情報の探索手法は、従来技術(例えば非特許文献1)によって実現されている。もちろん、本発明における奥行き情報の探索は、上記の探索手法に限定されるものではない。
図2に戻って、S25の次に、kを1だけインクリメント(k+1→k)する(S26)。この場合、k=1となる。その後、k<kmax+1であるか否かを判定する(S27)。ここで、kmaxは、奥行き予測の有効性を判定する上で十分なサンプル数であり、画面を構成するブロックの総数と比べて格段に少なく設定することが可能である。S27で、k<kmax+1であると判定された場合、S25に戻って奥行き情報の探索を繰り返す。
S25〜S27のループにより、予め決められた複数kmaxのブロックについて奥行き情報の探索が完了したら、画面(1)について求められた奥行き情報D2(k)とD3(k)の類似度を表すパラメータEを求める(S28)。カメラパラメータの信頼度や奥行き情報の探索精度が高い場合、奥行き情報D2(k)とD3(k)の類似度は高い。
パラメータEは、kmax個のブロックについて求められたD2(k)とD3(k)の差分二乗和、差分絶対値和、差分絶対値の最小値、差分絶対値の最大値などの奥行き情報D2(k)とD3(k)の差分に関する統計量から求めることができる。これらの値の複数からパラメータEを求めることもできる。S28で求められたパラメータEを符号化部へ出力する(S29)。
符号化部は、画像(1)をブロック単位で符号化処理する(S30)。この符号化に先立って、パラメータEの値に従って奥行き予測の有効性を判定し、奥行き予測の適用を許可するか否かの制御を行う。この制御に際しては、パラメータEに対する閾値処理を利用できる。パラメータEに対する閾値処理では、例えば、閾値Tを予め設定する。そして、パラメータEが閾値T未満の場合、奥行き予測の適用を許可する。あるいはパラメータEが閾値T以上の場合、奥行き予測の適用を許可しない(禁止)。
奥行き予測の適用が許可された場合、符号化部は、全ての予測モードのうちから最適な予測モードをブロック単位で選択し、該予測モードで符号化する。また、奥行き予測の適用が許可されない場合、符号化部は、奥行き予測を用いない予測モードのうちから最適な予測モードをブロック単位で選択し、該予測モードで符号化する。したがって、この場合、奥行き情報の探索は不要となる。符号化部での動き補償予測、視差補償予測、奥行き予測、画面内予測を選択的に用いてのブロック単位の符号化自体は、従来のものと変わりがないので説明を省略する。
視点方向での画像間にオクルージョン領域(物体の陰になって一方の画像には表れているが、他方の画像では物体の陰などで表れていない領域)が存在する場合、その領域においてはそもそも画像間で対応点が存在しない。そのため、オクルージョン領域についての奥行き情報の類似度まで含めて奥行き予測の有効性を判定すると、その判定が乱される可能性がある。
オクルージョン領域が存在する場合であっても奥行き予測の有効性の判定を安定にするには、ブロックkのとり得る候補としてオクルージョン領域を除外する機能を持たせたり、オクルージョン領域に相当するブロックの奥行き情報を奥行き情報の類似度算出の際に除外する機能を持たせたりすればよい。また、両者の機能を併用してもよい。オクルージョン領域であるか否かは、従来のオクルージョン領域検出技術をそのまま利用できる。
次に、本発明に係る多視点映像符号化装置の第2実施形態を説明する。第2実施形態は、視点方向に参照画像を同時に2枚以上参照する符号化画像を少なくとも1枚含む符号化構造が存在することを前提としている。
この前提の下では、視点方向に参照画像を同時に2枚以上参照して奥行き予測を適用することにより、その符号化結果から奥行き情報の類似度を表すパラメータを取得でき、該パラメータを指標として奥行き情報の信頼性を判定できる。
図3は、視点方向に参照画像を同時に2枚以上参照する符号化画像を少なくとも1枚含む符号化構造を示している。視点V0,V1,V2,V3,V4のカメラはそれぞれ、まず、時刻T0で画像(1),(2),(3),(4),(5)を同時に送出する。ここでは、画像(2)が2枚の画像(1),(3)を参照画像として符号化され、画像(4)が2枚の画像(3),(5)を参照画像として符号化される符号化構造を有する。
図4は、第2実施形態における動作を示すフローチャートである。以下では、視点V1のカメラから送出される画像の符号化処理について説明する。まず、符号化対象画像(画像(2))を読み込み(S41)、また、視点方向の参照画像a,b(画像(1),(3))を読み込む(S42)。次に、奥行き情報の類似度を表すパラメータEが閾値T未満か否か(E<T)を判定する(S43)。当初、パラメータEは0に初期化しておく。したがって、S43では、パラメータEは閾値T未満と判定される。
S43でパラメータEが閾値T未満と判定された場合、フラグFに1を代入した後(S44)、3視点(V0,V1,V2)に配置されたカメラのカメラパラメータ(CV0,CV1,CV2)を取得し(S45)、S47に進む。なお、S43でパラメータEが閾値T未満でないと判定された場合には、フラグFに0を代入した後(S46)、S47に進む。
S47では画像(2)をブロック単位で符号化する。ここでは、フラグFが1であれば奥行き予測の適用を許可し、0であれば奥行き予測の適用を許可しない。画像(2)に対しては画像(1),(3)を参照画像とした奥行き予測の適用が許可されるので、ブロック単位での符号化モードの選択に際し、奥行き予測も行われる。この奥行き予測の際に得られる奥行き情報を保存しておく。
次に、符号化のポスト処理として、視点方向の参照画像の枚数をMに代入した後(S48)、Mが1超であるか否か(M>1)、さらにフラグFが1であるか0であるかを判定する(S49,S50)。画像(2)は2枚の画像(1),(3)を参照画像としている(M=2)ので、Mが1超と判定され、さらにフラグFが1と判定される。なお、S49でMが1超と判定されない場合は、当該画像についての処理を終了し、次に続く画像の符号化(S41〜)を行う。S50でフラグFが0と判定された場合は、S54に進む。
S49でMが1超と判定され、さらにS50でフラグFが1と判定されるのは、先の符号化処理(S47)で、視点方向に参照画像を同時に2枚以上参照する奥行き予測の適用が許可された場合である。この場合には、符号化時にブロック単位で保存しておいた奥行き情報を読み出し、Da(k)、Db(k)にそれぞれ格納する(S51)。kはブロックに対するパラメータkを表し、Da(k)、Db(k)は参照画像a,bに対して探索された奥行き情報を表す。この場合、画像(2)の符号化時に参照画像(1),(3)に対して探索された奥行き情報がD1(k)、D3(k)にそれぞれ格納される。
次に、第1実施形態と同様に、奥行き情報D1(k)とD2(k)の類似度を表すパラメータEを求め(S52)、先に設定されパラメータE(=0)を新たに求められたパラメータEに更新する(S53)。
視点V1のカメラから送出される画像(2)の次に続く画像は、更新されたパラメータEを用いてS41以下のステップで符号化され、また、S48以下のステップでポスト処理される。
このように、前の符号化(画像(2)の符号化)において、視点方向の参照画像を2枚以上用いた奥行き予測が適用された場合、画像(2)に続く画像に対しては、その符号化結果あるいは符号化処理中に探索した奥行き情報の結果から奥行き情報の類似度を表すパラメータが取得され、該パラメータを指標として奥行き情報の信頼性が判定される(S43)ことになる。
画像(2)の次に続く画像の符号化のポスト処理において、S49でMが1超と判定され、S50でフラグFが0と判定された場合、符号化処理(S47)では、視点方向に参照画像を同時に2枚以上参照するが、奥行き予測が非適用であることになる。この場合には、その符号化結果から奥行き情報の類似度を取得することができない。
そこで、この場合には、第1実施形態と同様に、カメラパラメータを取得した上で(S54)、ブロックk(k<kmax+1)について視点方向の参照画像a,b各々に対して奥行き情報を探索し(S55〜S58)、探索された奥行き情報をそれぞれDa(k)、Db(k)に格納する(S56)。
その後、奥行き情報Da(k)とDb(k)の類似度を表すパラメータEを求め(S52)、先に設定されパラメータEを新たに求められたパラメータEに更新する(S53)。さらに次に続く画像は、更新されたパラメータEを用いてS41以下の処理で符号化され、また、S48以下のポスト処理が行われる。
このように、前の符号化が視点方向の参照画像を2枚以上用いるが奥行き予測が非適用である場合には、前の符号化の対象画像と参照画像の各々を用いて奥行き情報をそれぞれ取得し、これらの奥行き情報の類似度を表すパラメータを算出し、該パラメータを指標として奥行き情報の信頼性を判定するようにしている。
第2実施形態では、符号化のポスト処理としてパラメータEを更新し、更新されたパラメータEに基づき、次に続く画像に対する奥行き予測の適用を許可するか否かの制御を行う。ただし、パラメータEを更新するのは、視点方向に参照画像を2枚以上有する場合、つまり前の画像の符号化処理において必然的にこれらの参照画像の読込みが行われる場合(M>1)に限定する。
以上、実施形態を説明したが、本発明は、上記実施形態に限定されず、種々に変形可能である。例えば、上記実施形態では、視点方向の2枚の参照画像を選択し、それらを用いて奥行き情報の類似度を表すパラメータEを求めるものとしたが、視点方向の3枚以上の参照画像を選択し、それらを用いてパラメータEを求めるようにしてもよい。この場合、奥行き情報2つの全ての組合せについての差分二乗和などを算出し、算出された値の最大値あるいは最小値などをパラメータEとして採用すればよい。あるいは特定の2枚を選択した上でパラメータEを算出する手法なども採用できる。
また、以上では、奥行き予測の適用を許可するか否かの制御を画像(画面)単位で行うものとして説明したが、これを画面内オブジェクトや分割画像など、より細かい単位で行うことも可能である。また、カメラパラメータの信頼度や奥行き情報の探索の精度は、一般に、時間方向での変動は少ないので、奥行き情報の信頼度の判定や奥行き予測の適用を許可するか否かの制御を一連の画像(シーケンス)単位で行ってもよく、あるいは過去に得られた、奥行き情報の信頼度の判定結果をそのまま利用したりしてもよい。
さらに、奥行き予測の適用を許可する場合、視差補償予測の適用を禁止するように制御してもよい。奥行き予測は、視差補償予測の機能を完全に包含しているので(奥行き予測では、視差補償予測と同等のサイド情報を保持しつつ、視差補償予測での平行移動に限定された動きモデルを包含している)、奥行き予測の適用を許可する場合の視差補償予測の適用を禁止しても特に問題は生じない。奥行き予測の適用を許可しない場合、視差補償予測の適用を許可するように制御することもできる。
3視点に配置されたカメラから送出される多視点映像における画像間の参照関係の一例を示す図である。 本発明に係る多視点映像符号化装置の第1実施形態における動作を示すフローチャートである。 視点方向に参照画像を同時に2枚以上参照する符号化画像を少なくとも1枚含む符号化構造を示す図である。 本発明に係る多視点映像符号化装置の第2実施形態における動作を示すフローチャートである。
符号の説明
V0〜V4・・・視点、T0,T1・・・時刻、I,P,B・・・符号化モード、(1)〜(6)・・・画像(画面)、

Claims (9)

  1. 複数の視点に配置されたカメラから送出される画像を、動き補償予測、視差補償予測、奥行き予測、画面内予測を選択的に用いてブロック単位で符号化する多視点映像符号化装置において、
    カメラから撮影対象までの距離を表す奥行き情報の信頼性を判定する判定手段と、
    前記カメラから送出される画像の符号化に先立って、前記判定手段により判定された奥行き情報の信頼性に基づき、該画像に対する奥行き予測の適用を許可するか否かの制御を行う制御手段を備え
    上記判定手段は、前記カメラから送出される画像に対し視点方向の2枚以上の参照画像をとり、前記画像と前記参照画像の各々とから奥行き情報をそれぞれ取得し、これらの奥行き情報の類似度を表すパラメータを算出し、該パラメータを指標として前記奥行き情報の信頼性を判定することを特徴とする多視点映像符号化装置。
  2. 複数の視点に配置されたカメラから送出される画像を、動き補償予測、視差補償予測、奥行き予測、画面内予測を選択的に用いてブロック単位で符号化する多視点映像符号化装置において、
    カメラから撮影対象までの距離を表す奥行き情報の信頼性を判定する判定手段と、
    前記カメラから送出される画像の符号化に先立って、前記判定手段により判定された奥行き情報の信頼性に基づき、該画像に対する奥行き予測の適用を許可するか否かの制御を行う制御手段を備え、
    上記判定手段は、前の符号化において、視点方向の参照画像を2枚以上用いた奥行き予測が適用された場合、その符号化結果あるいは符号化処理中に探索した奥行き情報の結果から奥行き情報の類似度を表すパラメータを取得し、該パラメータを指標として前記奥行き情報の信頼性を判定することを特徴とする多視点映像符号化装置。
  3. 前記判定手段は、前の符号化において、視点方向の参照画像を2枚以上用いるが奥行き予測が適用されない場合、前の符号化の対象画像と前記参照画像の各々とから奥行き情報をそれぞれ取得し、これらの奥行き情報の類似度を表すパラメータを算出し、該パラメータを指標として前記奥行き情報の信頼性を判定することを特徴とする請求項に記載の多視点映像符号化装置。
  4. 前記制御手段は、画面単位、ブロック単位、画面内オブジェクト単位あるいは一連の画像単位で奥行き予測の適用を許可するか否かの制御を行うことを特徴とする請求項1ないし3のいずれか1つに記載の多視点映像符号化装置。
  5. 前記判定手段は、前記パラメータの算出に際し、オクルージョン領域に属するブロックあるいは該ブロックに対する奥行き情報を算出対象から除外することを特徴とする請求項ないしのいずれか1つに記載の多視点映像符号化装置。
  6. 前記パラメータとして、奥行き情報の差分に関する統計量を用いることを特徴とする請求項ないしのいずれか1つに記載の多視点映像符号化装置。
  7. 前記奥行き情報の差分に関する統計量として、差分二乗和、差分絶対値和、差分絶対値の最小値、差分絶対値の最大値のうち少なくとも1つを用いることを特徴とする請求項に記載の多視点映像符号化装置。
  8. 前記制御手段は、前記パラメータが予め設定された閾値未満の場合、奥行き予測の適用を許可するように制御を行うことを特徴とする請求項またはに記載の多視点映像符号化装置。
  9. 前記制御手段は、前記パラメータが予め設定された閾値以上の場合、奥行き予測の適用を許可しないように制御を行うことを特徴とする請求項またはに記載の多視点映像符号化装置。
JP2007111828A 2007-04-20 2007-04-20 多視点映像符号化装置 Expired - Fee Related JP4786585B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007111828A JP4786585B2 (ja) 2007-04-20 2007-04-20 多視点映像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007111828A JP4786585B2 (ja) 2007-04-20 2007-04-20 多視点映像符号化装置

Publications (2)

Publication Number Publication Date
JP2008271217A JP2008271217A (ja) 2008-11-06
JP4786585B2 true JP4786585B2 (ja) 2011-10-05

Family

ID=40050135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007111828A Expired - Fee Related JP4786585B2 (ja) 2007-04-20 2007-04-20 多視点映像符号化装置

Country Status (1)

Country Link
JP (1) JP4786585B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5024962B2 (ja) * 2008-07-11 2012-09-12 日本電信電話株式会社 多視点距離情報符号化方法,復号方法,符号化装置,復号装置,符号化プログラム,復号プログラムおよびコンピュータ読み取り可能な記録媒体
JP5281632B2 (ja) * 2010-12-06 2013-09-04 日本電信電話株式会社 多視点画像符号化方法,多視点画像復号方法,多視点画像符号化装置,多視点画像復号装置およびそれらのプログラム
WO2012131895A1 (ja) * 2011-03-29 2012-10-04 株式会社東芝 画像符号化装置、方法及びプログラム、画像復号化装置、方法及びプログラム
JP5794668B2 (ja) * 2011-04-11 2015-10-14 キヤノン株式会社 画像符号化装置
WO2013038679A1 (ja) * 2011-09-13 2013-03-21 パナソニック株式会社 符号化装置、復号装置、再生装置、符号化方法、及び復号方法
JP2013198059A (ja) * 2012-03-22 2013-09-30 Sharp Corp 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム
CN104429075B (zh) * 2012-07-09 2017-10-31 太阳专利托管公司 图像编码方法、图像解码方法、图像编码装置及图像解码装置
WO2014109563A1 (ko) * 2013-01-09 2014-07-17 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
CN112184603B (zh) * 2019-07-04 2022-06-24 浙江商汤科技开发有限公司 一种点云融合方法、装置、电子设备和计算机存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0698312A (ja) * 1992-09-16 1994-04-08 Fujitsu Ltd 画像高能率符号化方式
JP3194258B2 (ja) * 1992-11-12 2001-07-30 日本電気株式会社 画像の符号化方式
JP3776595B2 (ja) * 1998-07-03 2006-05-17 日本放送協会 多視点画像の圧縮符号化装置および伸長復号化装置
JP3696104B2 (ja) * 2001-02-26 2005-09-14 日本電信電話株式会社 ステレオ動画像符号化方法および装置と、ステレオ動画像符号化処理用プログラムおよびそのプログラムの記録媒体
JP4874578B2 (ja) * 2005-06-13 2012-02-15 三菱電機株式会社 画像符号化装置

Also Published As

Publication number Publication date
JP2008271217A (ja) 2008-11-06

Similar Documents

Publication Publication Date Title
JP4786585B2 (ja) 多視点映像符号化装置
KR101533740B1 (ko) 동영상 부호화 방법 및 복호방법, 그들의 장치 및 그들의 프로그램과 프로그램을 기록한 기억매체
KR101023263B1 (ko) 예측 참조 정보 생성방법, 동영상 부호화 및 복호방법, 그들의 장치 및 그들의 프로그램을 기록한 기억매체
JP5268645B2 (ja) カメラパラメータを利用して視差ベクトルを予測する方法、その方法を利用して多視点映像を符号化及び復号化する装置、及びそれを行うためのプログラムが記録された記録媒体
KR101244911B1 (ko) 카메라 파라미터를 이용한 다시점 동영상 부호화 및 복호화장치 및 방법과 이를 수행하기 위한 프로그램이 기록된기록매체
JP4663792B2 (ja) 多視点動映像を符号化及び復号化する装置及び方法
JP4414379B2 (ja) 映像符号化方法、映像復号方法、映像符号化プログラム、映像復号プログラム及びそれらのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5197591B2 (ja) 映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体
US20150172714A1 (en) METHOD AND APPARATUS of INTER-VIEW SUB-PARTITION PREDICTION in 3D VIDEO CODING
US20120189060A1 (en) Apparatus and method for encoding and decoding motion information and disparity information
KR101747434B1 (ko) 움직임 정보 및 변이 정보를 부호화/복호화하는 영상 처리 장치 및 방법
JP2008509592A (ja) 多視点映像のダイレクトモードの動き予測方法及び装置
KR101598855B1 (ko) 입체영상 부호화 장치 및 방법
KR101599042B1 (ko) 다시점 깊이 영상 부호화 장치 및 그 방법, 그리고, 다시점 깊이 영상 복호화 장치 및 그 방법
US20130100245A1 (en) Apparatus and method for encoding and decoding using virtual view synthesis prediction
JP2009164865A (ja) 映像符号化方法,復号方法,符号化装置,復号装置,それらのプログラムおよびコンピュータ読み取り可能な記録媒体
KR20080006494A (ko) 비디오 신호의 디코딩 방법 및 장치
KR100893930B1 (ko) 다시점 비디오 부호화를 위한 시간 직접예측 방법
JP6386466B2 (ja) 映像符号化装置及び方法、及び、映像復号装置及び方法
JP2013085156A (ja) 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置およびそれらのプログラム
US20230419519A1 (en) Depth estimation method in an immersive video context
KR20130022923A (ko) 가상 시점 합성 예측을 이용한 부호화/복호화 장치 및 부호화/복호화 방법
US20170019683A1 (en) Video encoding apparatus and method and video decoding apparatus and method
JP6232117B2 (ja) 画像符号化方法、画像復号方法、及び記録媒体
KR101261577B1 (ko) 다시점 동영상을 부호화 및 복호화하는 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110622

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110713

R150 Certificate of patent or registration of utility model

Ref document number: 4786585

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140722

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees