<実施形態1>
本発明の一実施形態に係る多視点画像生成装置について、図1から図11に基づいて説明すれば、以下のとおりである。但し、この実施形態に記載されている構成は、特に特定的な記載がない限り、この発明の範囲をそれのみに限定する趣旨ではなく、単なる説明例に過ぎない。
なお、本実施形態においては、多視点画像生成装置を備える表示装置がテレビジョン受像機(テレビ)によって実現されている場合を例に挙げて説明する。
〔多視点画像生成装置の構成〕
まず、多視点画像生成装置1の要部構成について、図2から図4を参照して説明する。図2は、多視点画像生成装置1の要部構成を示すブロック図である。
図2に示すように、多視点画像生成装置1は、画像取得部10、多視点変換部20(新視点画像生成手段)、3D描画部30、及び、表示部40を備えている。
なお、本実施形態では、右目用画像及び左目用画像からなる立体視可能な画像を2視点立体画像と呼称する。また、1視点画像及びデプスマップからなる立体視可能な画像を1視点立体画像と呼称する。
ここで、2視点立体画像、及び、1視点立体画像について、図3及び図4を参照して簡単に説明する。図3は、2視点立体画像の一例を模式的に示す図である。
また、図4は、1視点立体画像の一例を模式的に示す図である。図4(a)は、1視点立体画像の画像データを示す2次元画像を示し、(b)は、2次元画像に含まれる前景及び背景の奥行き量を示す奥行きデータを示している。
2視点立体画像は、図3に示すように、左目用画像および右目用画像により1フレームが構成された、サイドバイサイド方式によって供給され、立体視可能に表示される画像である。
なお、本実施形態では、2視点立体画像として、サイドバイサイド方式を用いて表示される画像を例に挙げて説明するが、これに限定されるものではない。例えば、トップアンドボトム方式、及び、フレームシーケンシャル方式などによって供給される画像であってもよい。
・ 1視点立体画像は、図4(a)に示す2次元画像と、(b)に示す奥行きデータであって2次元画像に含まれる前景及び背景の奥行き量を示す奥行きデータとによって、立体視可能に表示される画像である。
(画像取得部)
画像取得部10は、外部から供給される立体視可能な画像(以降、入力画像とも呼称する)を取得する。画像取得部10は、取得した入力画像を多視点変換部20へ供給する。
(多視点変換部)
多視点変換部20は、画像取得部10から供給された入力画像から、基準となる視点位置とは異なる1または複数の新たな視点位置に応じた新視点画像を生成する。本実施形態では、多視点変換部20は、入力画像に含まれる1または2つの視点に応じた画像と、新視点画像とを含め、合計N(Nは2以上の整数)視点分の画像を生成する(以降では、単に「N視点分の画像」とも呼称する)。多視点変換部20は、生成したN視点分の画像を3D描画部30に供給する。
なお、本実施形態では、多視点変換部20において、入力画像に含まれる1または2つの視点に応じた画像と、新視点画像とを含めたN視点分の画像を生成する構成を例に挙げて説明するが、これに限定されるものではない。例えば、多視点変換部20において、入力画像に含まれる1または2つの視点に応じた画像を含まず、新視点画像をN視点分生成することによってN視点分の画像を生成する構成を採用してもよい。
また、多視点変換部20は、新視点画像を生成するに際し、各視点に応じた新視点画像の視差により前景と背景とが乖離することによって生じるオクルージョン領域を補間する補間画像を生成する。なお、多視点変換部20の詳細、及び、補間画像の生成については後述する。
(3D画像描画部)
3D描画部30は、多視点変換部20から供給されたN視点分の画像を、立体視可能に表示部40に表示する。
〔多視点変換部〕
次に、多視点変換部20の要部構成について、図1及び図5を参照して説明する。図1は、多視点変換部20の要部構成を示すブロック図である。また、図5は、本実施形態に係る多視点画像生成装置1を備えるテレビ100と視点との関係を模式的に示す図である。
多視点画像生成装置1は、図5に示すように、ユーザがテレビ100の表示部40に表示される画像を何れの方向から見た場合であっても、立体視される画像の前景と背景とがその視点に適した位置関係となるよう、1または複数の新たな視点位置に応じた新視点画像を生成することにより、複数の視点(図5に示す、視点1〜視点N)の各々に応じた画像を表す複数の画像(すなわち、N視点分の画像)を生成する。
多視点画像生成装置1の備える多視点変換部20は、N視点分の画像を生成するために、図1に示すように、画像種別判定部21、一致ブロック判定部22、奥行き量算出部23、新視差ベクトル算出部24、レンダリング部25、補間画像生成部(補間画像生成手段)26、及び、境界平滑部27を備えている。
(画像種別判定部)
画像種別判定部21は、画像取得部10から供給される入力画像の種別を判定する。具体的には、画像種別判定部21は、取得した画像が2視点立体画像であるか、1視点立体画像であるかを判定する。
画像種別判定部21は、入力画像が2視点立体画像であると判定した場合、入力画像を一致ブロック判定部22に供給する。また、画像種別判定部21は、入力画像が1視点立体画像であると判定した場合、入力画像を新視差ベクトル算出部24に供給する。
(一致ブロック判定部)
一致ブロック判定部22は、画像種別判定部21から供給される、2視点立体画像と判定された入力画像を構成する右目用画像と左目用画像とから、一致する部分(ブロック)を行方向(水平方向)に見て探索する。
一致ブロック判定部22は、まず、左目用画像を基準画像とする。次に、一致ブロック判定部22は、左目用画像を複数のブロックに分割し、右目用画像から、分割された左目用画像のブロックと一致するブロック(一致ブロック)を行方向に見て探索する。
一致ブロック判定部22は、左目用画像および右目用画像のそれぞれにおける一致ブロックの左上の座標値を奥行き量算出部23に供給する。
ここで、一致ブロック判定部22における処理について、具体的に説明する。
一致ブロック判定部22は、まず、左目用画像をn×n画素(nは1以上の整数である)の矩形領域(n)に分割する。そして、一致ブロック判定部22は、分割した領域の1つと水平位置および垂直位置が同じであるn×n画素の矩形領域(n)を右目用画像上にも設定する。
次に、一致ブロック判定部22は、左目用画像および右目用画像のそれぞれのn×n画素の矩形領域(n)を中心としたm×m(mは1以上の整数である)画素の矩形領域(m)を設定する。ただし、mはn以上の整数である。n×n画素の矩形領域(n)とは別に、m×m画素の矩形領域(m)を設定することにより、探索の精度および画質の鮮明さを両立させることができるためである。
一致ブロック判定部22は、一致ブロック探索の探索自体は大きいサイズのm×m画素で行い、それによって求められた奥行き量は小さいサイズのn×n画素に反映させる。これによって、探索の精度が良く、結果の奥行き量は細かく入力画像の絵柄に沿ったものにすることができる。
そして、一致ブロック判定部22は、左目用画像上のm×m画素の矩形領域(m)と、右目用画像上のm×m画素の矩形領域(m)との一致度を計算する。一致度とは、左目用画像上の矩形領域(m)に含まれるm×m画素の各画素値と右目用画像上の矩形領域(m)に含まれるm×m画素の各画素値との違いの度合いを示す値である。なお、求めた一致度が0に近いほど、一致度が高いことになる。
さらに、一致ブロック判定部22は、右目用画像上のn×n画素の矩形領域(n)を、水平方向において予め設定された1画素以上のずらし量ずつ左右にずらしながら、それぞれの矩形領域(n)を中心とするm×m画素の矩形領域(m)を新たに取得し、上記の方法で、前記取得された左目用画像における矩形領域(m)との一致度を計算する。
ずらし量は、1画素以上の値であればよいが、計算された奥行き量の精度を高く求める場合には、より小さい値(例えば、1画素)を設定することが好ましい。ずらし量が小さいほど、奥行き量の精度が高くなるためである。
上述のように、一致ブロック探索において求める奥行き量の精度を向上させるためには、n×n画素の矩形領域を細かく(小さく)設定し、m×m画素の矩形領域を粗く(大きく)設定するとともに、ずらし量を細かく(小さく)設定することが好ましい。また、一致ブロック探索の処理速度を向上させるためには、n×n画素の矩形領域を粗く(大きく)設定し、m×m画素の矩形領域を細かく(小さく)(例えば、n×n画素の矩形領域と同じか、それに近く)設定すると共に、ずらし量を大きくすることが好ましい。
さらに、n×n画素の矩形領域の設定、m×m画素の矩形領域の設定、および、ずらし量のそれぞれを、バランスよく適宜設定することにより、一致ブロック探索の処理速度の向上、および、求める奥行き量の精度の向上の両立を図ることも可能である。
次に、一致ブロック判定部22は、一致度が最も小さい右目用画像上の矩形領域(m)に含まれた矩形領域(n)と、前記左目用画像上の矩形領域(m)に含まれた矩形領域(n)とを、一致ブロックと判定する。そして、一致ブロック判定部22は、一致ブロックと判定した右目用画像における矩形領域(n)の左上座標値と、左目用画像における矩形領域(n)の左上座標値とを一致ブロック対応関係として対応付けて記憶する。
あるいは、一致度が最も小さい矩形領域(m)を一致ブロックと判定し、一致ブロックと判定した右目用画像における矩形領域(m)の左上座標値と、左目用画像における矩形領域(m)の左上座標値とを一致ブロック対応関係として対応付けて記憶してもよい。
それから、一致ブロック判定部22は、左目用画像上のすべての矩形領域(n)に対して、上述と同じように、右目用画像上の矩形領域(n)との一致ブロック対応関係を求める。最後に、一致ブロック判定部22は、記憶された一致ブロック対応関係を奥行き量算出部23に送信する。
なお、左目用画像を基準画像として左目用画像と右目用画像との一致ブロックを判定する構成を例に挙げて説明したが、本実施形態はこれに限定されるものではない。例えば、右目用画像を基準画像として左目用画像と右目用画像との一致ブロックを判定する構成を採用してもよい。
(奥行き量算出部)
奥行き量算出部23は、一致ブロック判定部22から供給された各一致ブロックの左目用画像および右目用画像における座標値から、行方向の座標値の差を計算して、奥行き量を求めるものである。奥行き量算出部23は、例えば、左目用画像を基準画像として、基準画像をn×n画素ごとの矩形領域に細かく分割し、それぞれの画素毎に奥行き量を求める。
具体的には、奥行き量算出部23は、一致ブロック対応関係にある左目用画像の矩形領域(n)の左上座標値と、右目用画像の矩形領域(n)の左上座標値とから、奥行き量を計算する。
次に、奥行き量算出部23は、求めた奥行き量を、左目用画像において、注目していた矩形領域(n)に含まれた全ての画素、すなわちn×n個の各画素に割り当てる。
そして、奥行き量算出部23は、左目用画像上のすべての矩形領域(n)の左上座標値について奥行き量を求めることによって、左目用画像上のすべての画素に奥行き量を割り当てる。それから、奥行き量算出部23は、左目用画像における各画素に割り当てられた奥行き量(以下、「各画素の奥行き量」と称する場合がある)を新視差ベクトル算出部24に送信する。
なお、上の例では、矩形領域(n)および矩形領域(m)は、正方形であるが、それに限らず、長方形であってもよい。さらに、矩形領域(m)のサイズについては、矩形領域(n)と同じサイズであってもよい。
(新視差ベクトル算出部)
新視差ベクトル算出部24は、奥行き量算出部23から供給される奥行き量、又は、画像種別判定部21から供給される1視点立体画像に含まれるデプスマップと、N視点分の各視点位置とから、各視点位置に応じたN視点分の画像を生成するための、新視差ベクトルを算出する。
具体的には、入力画像が2視点立体画像である場合、新視差ベクトル算出部24は、奥行き量算出部23から供給される奥行き量と、各視点位置とから、基準画像としての左目用画像における画素毎の移動量、すなわち、新視差ベクトルを算出する。このとき、行方向(水平方向)において、各視点位置は、新視差ベクトル算出部24により、左目用画像に対応する視点位置を0.0とし、右目用画像に対応する視点位置を1.0として、その相対値によって決定される。
次に、新視差ベクトル算出部24は、奥行き量算出部23から取得した各画素の奥行き量と、新視点位置とから、左目用画像の各画素の新視差ベクトルを求める。具体的には、新視差ベクトル算出部24は、次式(1)に基づいて、各画素の新視差ベクトルを算出する。
(新視差ベクトル)=(奥行き量)×(新視点位置)・・・(1)
また、入力画像が1視点立体画像である場合には、新視差ベクトル算出部24は、1視点立体画像に含まれる1視点画像を基準画像とし、該基準画像における画素毎の移動量、すなわち、新視差ベクトルを、新視点位置とデプスマップとに基づいて算出する。
新視差ベクトル算出部24は、算出した画素毎の新視差ベクトルをレンダリング部25に供給する。
なお、新視差ベクトルは、例えば、内挿ベクトルであってもよいし、外挿ベクトルであってもよいし、これらの組み合わせであってもよい。内挿ベクトルとは、左目用画像の視点位置と右目用画像の視点位置との間に位置する新視点位置から求められる新視差ベクトルである。また、外挿ベクトルとは、左目用画像または右目用画像の視点位置よりも外側に位置する新視点位置から求められる新視差ベクトルである。
(レンダリング部)
レンダリング部25は、N視点分の各視点位置に応じた、N視点分の画像を生成する。具体的には、レンダリング部25は、新視差ベクトル算出部24から供給された新視差ベクトルに基づいて、基準画像(左目用画像または1視点画像)における各画素を移動させ、N視点分の画像を生成する。
具体的には、基準画像となる左目用画像(または、1視点画像)に含まれる各画素について、各画素の行方向成分(後述する図7に示すx方向成分)と新視差ベクトルとを加算することで、各視点に応じた画像に含まれる画素を生成する。
なお、ある視点に対応する画像において、複数の画素が、新視差ベクトルを加算することによって同一の画素に表示される画素となった場合には、最も奥行き量の小さいものを画素として採用してもよい。これは、奥行き量が小さいほど、その奥行き量に対応する画素がより手前にあることを表しており、異なる奥行き量に対応する複数の画素が重なったときは、より後方の画像を示す画素は、より手前の画像を示す画素に隠されるべきであるためである。
レンダリング部25は、生成したN視点分の画像を、新視差ベクトルと共に補間画像生成部26に供給する。
(補間画像生成部)
補間画像生成部26は、レンダリング部25から供給されたN視点分の画像のうち、新視点画像の各々に生じているオクルージョン領域を補間するための補間画像を生成する。このとき、補間画像生成部26は、新視点画像の各々について、オクルージョン領域とオクルージョン領域でない領域とを判定し、オクルージョン領域と判定した領域を補間するように補間画像を生成する。
例えば、補間画像生成部26は、補間画像を、オクルージョン領域に接する複数の領域のうち、より背後に位置する領域における画像(つまり、背景)に基づいて生成する。なお、オクルージョン領域の判定、及び、補間画像の生成については、後述する。
補間画像生成部26は、N視点分の画像を、境界平滑部27に供給する。
(境界平滑部)
境界平滑部27は、新視差ベクトルの差が大きな部分を平滑化する。
境界平滑部27は、まず、N視点分の画像の各々における、ある注目画素(1画素)を中心とする一定領域において、該一定領域内の各画素における新視差ベクトルの最大値および最小値の差が大きい場合に、一定領域に対する平滑化処理を実行することで平滑値を求める。すなわち、所定の領域内における新視差ベクトルのばらつきが大きい場合に、一定領域に対する平滑化処理を実行することで平滑値を求める。
そして、境界平滑部27は、一定領域内の注目画素の画素値を、平滑化処理によって求めた平滑値に置き換えることにより、平滑化されたN視点分の画像を生成する。
具体的には、境界平滑部27は、補間画像生成部26から供給されたN視点分の画像に対して、ある注目画素を中心とする一定領域(例えば、5×5画素の矩形領域)内の各画素における新視差ベクトルを参照する。
次に、境界平滑部27は、所定の領域における新視差ベクトルのばらつきが基準量を上回る場合、例えば、新視差ベクトルの最小値と最大値との差の絶対値が、あらかじめ決めておいた閾値以上の場合は、所定の領域における画素値を平滑化した値(例えば、5×5画素の矩形領域内における各画素の平均値)を求め、その値を注目画素(1画素)の新しい画素値とする。これらの処理をN視点分の画像のすべての画素について行って、N視点分の画像の変更すべき画素の値を新しい画素値に変更して、平滑化されたN視点分の画像を生成する。
なお、ここで、注目画素を1画素として説明したが、注目画素は1画素に限定されず、複数の画素の集合である注目ブロックであってもよい。よって、特に画像のサイズが大きい(画素の数が多い)場合には、処理速度を向上することができるなどの効果を奏する。
また、平滑化処理については、特に限定されず、例えば一般的なローパスフィルタを用いることができる。このような細かい模様をある程度ぼかす平滑化処理には、N視点分の画像において、物体の輪郭を背景と融合させ、物体の一部分が欠けたり、物体の輪郭の周囲に余計な絵柄がついたりする症状がより目立たなくなり、画質の悪化を軽減する効果がある。
〔オクルージョン領域〕
ここで、オクルージョン領域について、図6を参照して説明する。図6は、本実施形態に係る多視点画像生成装置1によって生成された新視点画像において生じるオクルージョン領域の一例を模式的に示す図である。
多視点変換部20において、図5に示すようにテレビ100の表示部40に垂直な方向に対して、水平方向(表示部40の長手方向)に角度のある視点に応じた新視点画像を生成する場合、図6に示すように、前景と背景とが乖離する場合がある。これによって、前景と背景とに挟まれた、画像の欠けた領域が生じる。このように、画像の欠けた領域をオクルージョン領域と呼称する。
(オクルージョン領域の判定)
次に、オクルージョン領域の判定について説明する。補間画像生成部26におけるオクルージョン領域の判定を可能にするため、レンダリング部25は、下記の機能をさらに備えている。
レンダリング部25は、基準画像に含まれる全ての画素に対し、オクルージョン領域であるか否かの判定に用いられる判定フラグを設定する。このとき、レンダリング部25は、判定フラグとして、例えば、全ての画素に対して初期値「−1」を設定する。
次に、レンダリング部25は、新視点画像の各々を生成するに際し、新視差ベクトルから算出された画素値によって基準画像の画素値が置き換えられた場合には、設定された判定フラグの値を「0」に再設定する。
補間画像生成部26は、このように判定フラグの設定された新視点画像をレンダリング部25から取得する。補間画像生成部26は、新視点画像のそれぞれについて、各新視点画像に含まれる画素に対して設定されている判定フラグの値が「−1」である領域をオクルージョン領域と判定し、判定フラグが「0」である領域をオクルージョン領域以外の領域(例えば、前景及び背景など)と判定する。
また、補間画像生成部26は、新視点画像を行方向に検索し、新視点画像の各行に含まれる、判定フラグの値の異なる2つの画素の間を、オクルージョン領域とオクルージョン領域以外の領域との境界であると判定する。
具体的には、補間画像生成部26は、行方向(後述する図7に示すx方向)に検索し、判定フラグの値が「0」から「−1」に変化する境界をオクルージョン領域以外の領域(図6においては、前景)とオクルージョン領域との境界と判定する。また、補間画像生成部26は、判定フラグの値が「0」であるオクルージョン領域以外の領域が背景であるか前景であるかを、奥行き量を参照して判定する。
〔補間画像〕
次に、補間画像生成部26において実行される、オクルージョン領域を補間するための補間画像を表す補間画像の生成について、図7から図11を参照して説明する。
図7は、本実施形態に係る多視点画像生成装置1における、オクルージョン領域を補間する補間画像を構成する補間画素の生成方法を模式的に示す図である。図7(a)は、オクルージョン領域における、オクルージョン領域と背景との境界に隣接する画素に対応する補間画素の生成に用いる画素を模式的に示している。図7(b)は、オクルージョン領域における、境界から2番目の画素に対応する補間画素の生成を模式的に示している。図7(c)は、オクルージョン領域における、境界からある画素数だけ離れた画素に対応する補間画素の生成を模式的に示している。
図7に示すように、補間画像生成部26は、複数の画素を用いて補間画像を生成する。具体的には、オクルージョン領域におけるある画素を補間するための補間画素を生成するために、補間画像生成部26は、当該ある画素を含む行(x方向)に含まれる画素であって境界に隣接する背景側の画素を中心として設定された対象領域に含まれる画素群を構成する画素の各々に対応する画素値を用いて補間画素を生成する。
図7を参照し、オクルージョン領域におけるある画素を(x、y)として、対象領域について説明する。なお、対象領域は、1つ以上の画素を含んでいれば十分である。
図7(a)〜(c)に示すように、多視点変換部20は、補間画素の生成の対象となるある画素I’をI’(x,y)とし、当該ある画素I’を含む行(x方向)に含まれる画素であって境界に隣接する背景側の画素を中心画素(x0,y0)として設定された対象領域から補間画像を生成する。
図7(a)に示すように、ある画素I’(x,y)が境界に隣接した画素(境界から−x方向(行の負方向)に1番目の画素)である場合、補間画像生成部26は、当該ある画素に隣接した背景側の中心画素(x0,y0)を中心として設定された対象領域に含まれる1×1の画素の各々に対応する画素値を用いて補間画素を生成する。
また、図7(b)に示すように、ある画素I’(x,y)が境界から−x方向に2番目の画素である場合、補間画像生成部26は、当該ある画素を含む行に含まれる画素であって境界に隣接した背景側の中心画素(x0,y0)を中心とした3×3の画素群を用いて補間画素を生成する。
このように、ある画素が境界から−x方向に│x−x0│番目の画素である場合、補間画像生成部26は、当該ある画素を含む行に含まれる画素であって境界に隣接した背景側の中心画素(x0,y0)を中心として生成された対象領域(2│x−x0│−1)×(2│x−x0│−1)に含まれるの画素の各々に対応する画素を用いて補間画素を生成する。なお、│x−x0│=k(1≦k)とすると、対象領域は、(2k−1)×(2k−1)とも表現できる。
補間画像生成部26は、上述のようにして生成した複数の補間画素から、補間画像を生成する。
(補間画素値の算出)
次に、補間画像を構成する補間画素の値(補間画素値)の算出方法の一例について、図7(c)を参照して説明する。
補間画像生成部26は、補間画素の生成の対象となるある画素が境界から−x方向に│x−x0│番目の画素である場合、当該ある画素を含む行に含まれる画素であって境界に隣接した背景側の画素を中心として設定された対象領域に含まれる各画素の画素値に、重み(パラメータ)を積算し、さらに積算結果を和算することによって補間画素値を算出する。
図7(c)に示すように、対象領域に含まれる中心画素(x0,y0)からx軸方向にi画素分、y軸方向にj画素分離れた位置の画素を(i+x0,j+y0)とすると、ある画素I’の補間画素値は、次式(2)によって求めることができる。
ここで、式(2)におけるI(i+x0,j+y0)は、対象領域に含まれる各画素Iの画素値を示し、w(i,j)は、対象領域に含まれる各画素に積算される重みを表す重み関数を示している。また、重み関数w(i,j)の値は、対象領域に含まれる各画素Iの判定フラグFの値によって、次式のように与えられる。
w(i,j)=0 (F(i,j)=−1のとき)
w(i,j)≠0 (それ以外のとき) ・・・(3)
ここで、対象領域(2k−1)×(2k−1)に含まれる各画素の画素値に積算される重みの一例について、図8から図10を参照して説明する。
まず、図8を参照して、補間画素値の算出の対象となるある画素が、境界から−x方向に2番目(k=2)の画素である場合の補間画素値の算出について説明する。図8は、3×3の画素群に含まれる各画素の画素値に対して積算する重みを定めた重みテーブルの一例を示す図である。図8(a)は、境界が一直線である場合の重みテーブルの一例を示し、(b)は、境界が一直線でない場合の重みテーブルの一例を示している。
なお、図8に示すように、対象領域中のオクルージョン領域に含まれる画素値に積算される重みとして「0」が設定され、対象領域中の背景に含まれる画素値に積算される重みとして互いに等しい値が設定されている。また、対象領域中の背景に含まれる画素値に積算される重みは、その合計が1に近くなるよう設定される。
補間画像生成部26は、図7(b)に示すように、k=2の場合、(x0,y0)を中心とした3×3の画素群に含まれる各画素値を用いて補間画素値を生成する。このとき、補間画像生成部26は、図8(a)に示す3×3の重みテーブルに定められている重みを、(x0,y0)を中心とした3×3の画素群に含まれる各画素のうち対応する画素の画素値に積算する。
具体的には、補間画像生成部26は、図7(a)及び図8(a)に示すように、オクルージョン領域に含まれる各画素の画素値に重み「0」を積算し、背景に含まれる各画素の画素値に重み「0.1667」を積算する。
そして、補間画像生成部26は、画素値と重みとの積算結果を和算し、オクルージョン領域における、ある画素を補間するための補間値を算出する。
なお、図8(a)に示すように、3×3の画素群のうち、第1列に属する画素が全てオクルージョン領域に含まれる(つまり、3×3の画素群において、オクルージョン領域と背景との境界が一直線となる)場合を例に挙げて説明したが、これに限定されない。例えば、図8(b)に示すように、3×3の画素群において境界が一直線でなくてもよい。
補間画像生成部26は、このような場合には、図8(b)に示す3×3の重みテーブルに定められている重みを、図7(b)に示す(x0,y0)を中心とした3×3の画素群に含まれる各画素のうち対応する画素の画素値に積算する。
具体的には、補間画像生成部26は、オクルージョン領域に含まれる各画素の画素値に重み「0」を積算し、背景に含まれる各画素の画素値に重み「0.1428」又は「0.1429」を積算する。そして、補間画像生成部26は、画素値と重みとの積算結果を和算し、オクルージョン領域に含まれるある画素を補間するための補間画素値を算出することで、補間画素を生成する。
次に、図9を参照して、補間画素値の算出の対象となるある画素が、境界から−x方向に3番目(k=3)の画素である場合における、補間画素値の算出について説明する。図9は、5×5の画素群に含まれる各画素の画素値に対して積算する重みを定めた重みテーブルの一例を示す図である。図9(a)は、境界が一直線である場合の重みテーブルの一例を示し、(b)は、境界が一直線でない場合の重みテーブルの一例を示している。
補間画像生成部26は、k=3の場合、(x0,y0)を中心とした5×5の画素群に含まれる各画素の画素値を用いて補間画素値を算出する。このとき、補間画像生成部26は、図9(a)に示す5×5の重みテーブルに定められている重みを、(x0,y0)を中心とした5×5の画素群に含まれる画素のうち対応する画素の画素値に積算する。
具体的には、補間画像生成部26は、図9(a)に示すように、対象領域中のオクルージョン領域に含まれる各画素の画素値に重み「0」を積算し、対象領域中の背景に含まれる各画素の画素値に重み「0.0667」を積算する。そして、補間画像生成部26は、画素値と重みとの積算結果を和算し、オクルージョン領域に含まれるある画素を補間するための補間画素値を算出する。
なお、図9(a)に示すように、5×5の画素群のうち、第1列及び第2列に属する画素が全てオクルージョン領域に含まれる(つまり、5×5の画素群において、オクルージョン領域と背景との境界が一直線となる)場合を例に挙げて説明したが、例えば、図9(b)に示すように、5×5の画素群において境界が一直線でなくてもよい。
補間画像生成部26は、このような場合には、図9(b)に示す5×5の重みテーブルに定められている重みを、(x0,y0)を中心とした5×5の画素群に含まれる画素のうち対応する画素の画素値に積算する。
具体的には、補間画像生成部26は、図9(b)に示すように、対象領域中のオクルージョン領域に含まれる各画素の画素値に重み「0」を積算し、対象領域中の背景に含まれる各画素の画素値に重み「0.0476」を積算する。そして、補間画像生成部26は、画素値と重みとの積算結果を和算し、オクルージョン領域に含まれるある画素を補間するための補間画素値を算出することで、補間画素を生成するする。
図8及び図9では、背景に含まれる画素の画素値に積算される重みが等しく設定されている(例えば、1を対象領域中の背景に含まれる画素の数で割ることによって求められる値)場合を例に挙げて説明したが、これに限定されるものではない。例えば、図10に示すように、背景に含まれる画素の画素値に積算される重みを、ガウス分布を用いて設定してもよいし、他の方法を用いて設定されていてもよい。
なお、背景に含まれる画素値に積算される重みを、単純平均、ガウス分布、及び他の方法の何れの方法を用いて設定する場合であっても、その合計が1に近いことが好ましい。
図10を参照して、重みがガウス分布を用いて設定されている場合における、補間画素値の算出について説明する。図10は、画素群に含まれる各画素の画素値に対して積算する重みが、ガウス分布を用いて設定されている場合の重みテーブルの一例を示す図である。図10(a)は、ガウス分布を用いて設定された3×3の重みテーブルの一例を示し、(b)は、ガウス分布を用いて設定された5×5の重みテーブルの一例を示している。
補間画像生成部26は、k=2である場合には、図7(b)に示す(x0,y0)を中心とした3×3の画素群に含まれる各画素の画素値を用いて補間画素値を算出する。このとき、補間画像生成部26は、図10(a)に示す、ガウス分布を用いて3×3の重みテーブルに定められた重みを、3×3の画素群に含まれる画素のうち対応する画素の画素値に積算する。
具体的には、補間画像生成部26は、図(a)に示すように、オクルージョン領域に含まれる画素の画素値に重み「0」を積算し、背景に含まれる画素の画素値にガウス分布を用いて設定された重みを積算する。
また、補間画像生成部26は、k=3である場合、(x0,y0)を中心とした5×5の画素群に含まれる各画素の画素値を用いて補間画素値を算出する。このとき、補間画像生成部26は、図10(b)に示す、ガウス分布を用いて5×5の重みテーブルに定められた重みを、5×5の画素群に含まれる画素のうち対応する画素の画素値に積算する。
具体的には、補間画像生成部26は、オクルージョン領域に含まれる各画素の画素値に重み「0」を積算し、背景に含まれる各画素の画素値にガウス分布を用いて設定された重みを積算する。
そして、補間画像生成部26は、画素値と重みとの積算結果を和算し、オクルージョン領域に含まれるある画素を補間するための補間画素値を算出することで、補間画素を生成する。
なお、図8から図10に示した重みテーブルは、補間画像生成部26が補間画素を生成する際に最適に設定すればよいが、これに限定されず、例えば、予め記憶部(不図示)に格納されていてもよい。
上記の構成のように、オクルージョン領域に含まれる画素に「0」を積算することにより、補間画像生成部26は、補間画素を生成する際に、境界に隣接した背景の画素を中心としつつ、オクルージョン領域を用いないようにすることができる。
また、上記の構成によれば、補間画像生成部26は、補間画像を生成する際に、対象領域に含まれる背景(オクルージョン領域以外の領域)に属する画素に対し、互いに等しい重み、または、ガウス分布を用いて定められた重みを積算する。これによって、補間画像生成部26は、対象領域に含まれる背景に属する画素を用いて最適な補間画像を生成することができる。
また、補間画像生成部26は、オクルージョン領域と背景との境界に隣接した背景側の画素を中心とするため、補間画像を生成する際に、前景の画素が用いられることはない。したがって、補間画像生成部26は、補間画像を生成するに際し、背景のみを用いて補間画像を生成することができる。
上述の構成によって、補間画像生成部26は、背景の画素のみから補間画像を生成することができるため、本実施形態に係る多視点画像生成装置1を備えるテレビ100は、補間画像と背景とが滑らかに繋がった画像を表示部40に表示させることができる。さらに、テレビ100は、補間画像と前景とが、その境界で切り離された画像を表示部40に表示させることができる。
したがって、多視点画像生成装置1は、図11(a)に示すように、新視点画像を新たに生成する際にオクルージョン領域が生じた場合であっても、(b)に示すように、該オクルージョン領域を補間する補間画像を背景のみから生成し、ユーザに自然に知覚される画像を生成することができる。
図11は、入力画像に含まれる前景及び背景と、オクルージョン領域との関係の一例を模式的に示す図である。図11(a)は、前景と背景とに視差をつけることによりオクルージョン領域が生じた場合の画像の一例を示し、(b)は、背景のみからオクルージョン領域を補間した場合の画像の一例を示している。
また、多視点画像生成装置1は、背景のみを用いて補間画像を生成することにより、オクルージョン領域を補間する際にも前景と背景との遠近感、及び、前景と背景とのバランスを適切に保つことができる。したがって、多視点画像生成装置1は、ユーザに与える違和感を低減した新視点画像を生成することができ、テレビ100は、ユーザに与える違和感を低減した新視点画像を表示することができる。
これによって、ユーザは、違和感を感じることなく、オクルージョン領域の補間された新視点画像を視聴することができる。
なお、オクルージョン領域に含まれるある画素を含む行(x方向)に含まれる画素であって境界に隣接する背景側の画素を中心として設定される対象領域に含まれる画素を用いて、補間画素を生成する構成を例に挙げて説明したが、これに限定されるものではない。例えば、オクルージョン領域に含まれるある画素を含む列(y方向)に含まれる画素であって境界に隣接する背景側の画素を中心として設定される対象領域に含まれる画素を用いて、補間画素を生成する構成を採用してもよい。
また、テレビ100の表示部40に垂直な方向に対して、表示部40の長手方向に角度を有する視点位置に応じた新視点画像を生成する場合に発生するオクルージョン領域における補間画像を生成する場合を例に挙げて説明したが、これに限定されるものではない。例えば、表示部40に垂直な方向に対して、表示部40の短手方向に角度を有する視点位置に応じた新視点画像を生成する場合にも、同様に発生するオクルージョン領域における補間画像を生成することができる。また、表示部40に垂直な方向に対して、表示部40の長手方向及び短手方向の双方に角度を有する視点位置に応じた新視点画像を生成する場合においても、同様に発生するオクルージョン領域における補間画像を生成することができる。
換言すれば、テレビ100は、該テレビ100を利用するユーザの両眼を結ぶ線分と平行な直線上に位置する新視点位置に応じた新視点画像を生成する場合に発生するオクルージョン領域における補間画像を生成する。
<変形例>
本実施形態における補間画素値の、他の算出方法について図12を参照して説明する。図12を参照して、オクルージョン領域の左側(x軸負方向)が背景である場合における補間画素値の算出方法について、説明する。
図12は、本変形例に係る多視点画像生成装置1における、オクルージョン領域の左側が背景である場合における補間画素値の算出方法の一例を模式的に示す図である。図12(a)は、オクルージョン領域における、オクルージョン領域と背景との境界に隣接する画素に対応する補間画素値の算出に用いる画素を模式的に示している。図12(b)は、オクルージョン領域における、境界から2番目の画素に対応する補間画素値の算出を模式的に示している。図12(c)は、オクルージョン領域における、境界から所定の画素数だけ離れた画素に対応する補間画素の生成を模式的に示している。
図12(a)〜(c)に示すように、多視点変換部20は、ある画素I’(x,y)を含む行(x方向)に含まれる画素であって境界に隣接する背景側の画素を中心画素(x1,y1)として設定された対象領域から補間画素値を算出する。図12(c)に示すように、中心画素(x1,y1)からx軸方向にi画素分、y軸方向にj画素分離れた位置の画素を(i+x1,j+y1)とすると、ある画素I’(x,y)の補間画素値は、次式(4)によって求めることができる。なお、iおよびjは、負の値をとることもできる。
ここで、式(4)におけるI(i+x1,j+y1)は、対象領域に含まれる各画素の画素値を示している。また、重み関数w(i,j)の値は、対象領域に含まれる各画素Iの判定フラグFの値によって、式(3)のように与えられる。なお、重み関数w(i,j)の値は、実施形態1において図8から図10に示した重みと同じ重みの値を用いることができる。
<実施形態2>
実施形態1では、背景と前景とによって挟まれたオクルージョン領域を補間する補間画像を生成する構成について説明したが、本発明はこれに限定されるものではない。例えば、オクルージョン領域が背景と背景とによって挟まれた領域であっても、補間画像を生成することが出来る。
背景と背景とによって挟まれたオクルージョン領域における補間画像の生成について、図13から図15を参照して以下に説明する。図13は、本実施形態に係る多視点画像生成装置1によって生成された新視点画像において生じるオクルージョン領域の一例を模式的に示す図である。
また、図14は、背景と背景とに挟まれたオクルージョン領域の生じる過程を模式的に示す図である。図14(a)は、入力画像に含まれる前景と背景との関係を示す図であり、(b)は、前景と背景とが大きく乖離した際の前景及び背景と、及びオクルージョン領域との関係を示している。
多視点変換部20において、図14(a)に示す位置関係の前景及び背景を含む入力画像から、テレビ100の表示部40に垂直な方向に対して、水平方向に角度を有する視点位置に応じた新視点画像を表示する場合、図14(b)に示すように、基準画像に含まれる前景と背景とが大きく乖離することもある。このような場合には、図14(b)に示すように、前景が入力画像における位置と全く重複することのない位置まで視差がつけられるため、図14に示すように、背景と背景とによって挟まれたオクルージョン領域が生じることになる。
(補間画素値の算出)
次に、補間画像生成部26において実行される、オクルージョン領域における補間画像を構成する補間画素の補間画素値の算出方法について、図15を参照して説明する。
図15は、本実施形態に係る補間画像生成部26における、オクルージョン領域の左右が共に背景である場合における補間画素値の算出方法の一例を模式的に示す図である。図15(a)は、オクルージョン領域における、オクルージョン領域と背景との境界に隣接するオクルージョン領域側の画素における補間画素値の算出に用いる画素を模式的に示している。図15(b)は、オクルージョン領域における、境界から2番目の画素に対応する補間画素値の算出を模式的に示している。図15(c)は、オクルージョン領域における、境界からある画素数だけ離れた画素に対応する補間画素値の算出を模式的に示している。
図15(a)〜(c)に示すように、多視点変換部20は、ある画素I’がオクルージョン領域のx方向の中心よりも左側(左側オクルージョン領域)に位置している場合には、当該ある画素I’を含む行に含まれる画素であって境界に隣接する背景側の画素を中心画素(x0,y0)として設定する。また、多視点変換部20は、ある画素I’がオクルージョン領域のx方向の中心よりも右側(右側オクルージョン領域)に位置している場合には、当該ある画素I’を含む行に含まれる画素であって境界に隣接する背景側の画素を中心画素(x1,y1)として設定する。
多視点変換部20は、上記のように中心画素の設定された対象領域から補間画素値を算出する。図15(a)〜(c)に示すように、ある画素I’の補間画素値は、当該ある画素I’が左側オクルージョン領域に位置している場合には、式(4)によって求めることができる。また、当該ある画素I’が右側オクルージョン領域に位置している場合には、式(2)によって求めることができる。
また、重み関数w(i,j)の値は、対象領域に含まれる各画素Iの判定フラグFの値によって、式(3)のように与えられる。なお、重み関数w(i,j)の値は、実施形態1において図8から図10に示した重みと同じ重みの値を用いることができるため、ここでは説明を省略する。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
〔プログラム、記録媒体〕
最後に、表示部40を除く多視点画像生成装置1の各ブロック、特に、多視点変換部20は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。
すなわち、表示部40を除く多視点画像生成装置1は、各機能を実現する制御プログラムの命令を実行するCPU、上記プログラムを格納したROM、上記プログラムを展開するRAM、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである多視点画像生成装置1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記多視点画像生成装置1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM(登録商標)/フラッシュROM等の半導体メモリ系などを用いることができる。
また、多視点画像生成装置1を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
なお、多視点画像生成装置1を備える表示装置がテレビ100によって実現されている場合を例に挙げて説明したが、上記の実施形態は、これに限定されるものではない。例えば、表示装置は、多視点画像を利用して立体表示を行うことのできるパーソナルコンピュータ、携帯電話、スマートフォン、タブレット端末、タブレット型PC、カメラ、及び、PDAなどによって実現されていてもよい。