WO2001039512A1

WO2001039512A1 - Device and method for converting two-dimensional video to three-dimensional video

Info

Publication number: WO2001039512A1
Application number: PCT/JP2000/008315
Authority: WO
Inventors: Syugo Yamashita; Haruhiko Murata; Toshiya Iinuma; Mitsuo Nakashima; Takayuki Mori
Original assignee: Sanyo Electric Co., Ltd.
Priority date: 1999-11-26
Filing date: 2000-11-24
Publication date: 2001-05-31
Also published as: EP1235438A4; EP1235438B1; ATE278298T1; TW521519B; DE60014420T2; DE60014420D1; US7161614B1; EP1235438A1

Description

明細書

2次元映像を 3次元映像に変換する装置及びその方法 <技術分野〉、

本発明は、 2次元映像を 3次元映像に変換する装置とその方法に関する。

<背景技術〉

2次元映像を 3次元映像に変換する方法として、特開平 9一 1 0 7 5 6 2号公報、および特開平 1 0— 5 1 8 1 2号公報に開示されている方法が知られている。まず、特開平 9 _ 1 0 7 5 6 2号公報に開示されている 2次元映像を 3次元映像に変換する方法の概要を、図 1に基づいて説明する。

2次元映像（2 D映像）では、鳥が山の前を左から右へ飛んでいる様子を画像 1から 5に示すように、撮像したとする。

まず、画像 1から画像 2に移行する際の動きベクトル、画像 2から画像 3に移行するための動きべクトル等のように、各画像間の動きべクトルを画面内に設定された複数の動きべクトル検出領域毎に抽出する。次に、抽出した動きべクトルから被写体（鳥）領域と背景（山）領域とを決定する。そして、被写体が背景の前に来るように基準画像を右または左目画像の一方に決め、動きべクトルの大きさに応じたフィールド数分だけ遅延させた画像を他方として決める。

例えば、基準画像である現在の画像が画像 4とし、画像 3と画像 4とから得られた動きべクトルの大きさに応じて所定フィールド数分遅延させた画像（遅延画像）が画像 2であるとすると、動きべクトルの方向から基準画像（画像 4 ) を左目用画像として提示し、遅延画像（画像 2 ) を右目用画像として提示する。

この動作を繰り返し実行することにより、立体感のある映像、即ち 3次元映像を表示するのである。以下、この方法を MT D法と呼ぶことにする。

特開平 1 0— 5 1 8 1 2号公報に開示されている 2次元映像を 3次元映像に変換する方法の概要を説明する。

まず、 2次元画像を複数の領域に分割し、各分割領域毎に色成分、高周波成分、コントラスト等の画像特徴量を抽出する。次に各分割領域毎に色成分に基づいて、同じ物体が属する領域毎にグループ化する。そして、グループ化された領域単位で、その領域の平均コントラスト及び平均高周波成分等の情報により、奥行き推定を行って、視差量を算出する。算出した視差量に基づいて、各分割領域毎に左目用画像と右目用画像を反対方向に水平シフトさせて、 3次元映像を生成する。このようにして作成した左目用映像及び右目用映像を立体表示手段に表示させて立体表示するのである。この方法は、 C I D法と呼ぶことにする。

MT D法および C I D法について、さらに詳しく説明する。

1 . MT D法

MT D法では、画面内の動きに応じて、左右いずれかの目に入る映像を遅延させて立体感を作りだす。この際、映像にとって最適である（目標となる）フィールド遅延量（目標遅延量 dly 一 target) は、被写体背景判別によって得た被写体領域の水平方向べクトルの平均値 obj 一 xvec [pixel / field]と背景領域の水平方向べクトル bg— xvec [pixel I field]を用い、次式（1 ) により決定する。なお、べクトルは右方向の動きに対して正の値を取る。 d — target = Mdly_sisa / ( obj_xvec - bg_xvec) [field] · · · (1)

ここで、 Mdly— sisaは MT D法によって生成する立体感を決定する視差量 [pi xel] を表し、その値はユーザーインタ一フェース等を介し予め設定される。

なお、左右いずれの目を遅延させるかを示す遅延方向は、目標遅延量 dly— t argetを用い次式（2 ) により決定される。 dly arget > 0 右目遅延 (2)

dly_target < 0 左目遅延

dlyjarget ― 0 遅延無し

ここでは、便宜上、目標遅延量を例に遅延量の説明を行ったが実際の制御では、目標遅延量を時間的に平滑化した実遅延量 delay により遅延するブイールド数と遅延方向を決定する。

2 . 被写体位置制御

被写体位置制御は、 M T D法を行った場合に生じる管面に対する物体呈示位置のあいまいさを是正するために使用する。すなわち、 M T D法では、図 2に示すように被写体が動くか背景が動くかによつて、見え方が異なる。このため、被写体位置制御では、被写体が動く場合は、右眼映像の呈示位置を右にシフトし、左目映像の呈示位置を左にシフトすることで画面全体を奥方向にもっていくことによって、被写体から管面の画素数と管面から背景の画素数が等しくなるようにしている。また、背景が動く場合は、右眼映像の呈示位置を左にシフトし、左目映像の呈示位置を右にシフトすることで画面全体を手前方向にもっていくことによつて、被写体から管面の画素数と管面から背景の画素数が等しくなるようにしている。

この被写体位置制御によって算出される右眼の水 51 ^立相量 t _jhr と左眼の水平位相量 t _phl は、フィールド遅延により発生する被写体の位相量 obj _s i saと背景の位相量 bg— sisaを次式（3 ) で表した場合、次式（4 ) で表現でさる。 obj_sisa = obj_xvec * delay [pixel] (3)

bg一 sisa = bg一 xvec * delay [pixel] t _phr = ( obj_sisa + bg—sisa) / 2 [pixel] (

t _phl = - t _phr [pixel]

なお、実遅延量 delay は目標遅延量 dly—targetを時間的に平滑化しているため、 MT D法により生成される視差量 dly— sisa (=obj — sisa - bg— sisa) [pixel] (dly— sisaは飛び出している場合は正の値を、奥まっている場合は負の値を取る。）の絶対値とユーザ設定によって予め決定した Mdly— sisa [pixel] とは完全に一致しない。また、遅延がない（dly—target = 0) 場合は、 dly 一 sisa=0となる。

3 . C I D法

C I D法は、一画面を複数の領域に分割し、各々の領域から得た画像情報及び構図から各領域の奥行きを推定し、この推定した奥行きを基に画面内の各画素をシフトすることによって両眼視差を生成する手法である。

また、本出願人は、既に開発した C I D法をさらに改良した C I D法をも開発している。

図 3は、改良後の C I D法（公知ではない）の制御手順を示している。

まず、一画面を複数の領域に分割し、各々の領域から高周波、輝度コントラスト、色 (B - Y、 R-Y成分）の情報を得る（ステップ 1 ) 。そして、これらの情報及び構図から推定した各領域の奥行き推定値を求める（ステップ 2 ) 。求めた奥行き推定値を単にシフト量に変換すると変換画像に歪みが目立っため、歪み抑圧処理を行う（ステップ 3 ) 。歪み抑圧処理後の奥行き推定値に距離スケール変換を施す（ステップ 4 ) 。

歪み抑圧処理について説明する。 C I D法では、 2 D画像を変形し左右画像を生成する。この変形が大きくなりすぎると不自然な映像となるため、 C I D法では、隣接する領域間の位相量の差が、ユーザによって予め定められた変換画像の歪み許容範囲 h—supp—lev [Pixel]以下になるよう制御している。すなわち、まず、推定した奥行きを Mfrontと rear との間に割り当てることによって求めた各領域の位相量から、隣接する領域の位相量の差を求める。そして、この差の展大値を h― dv ma Lpixel]とし、 h― dv一 max 力歪み午容肇 β囲 h― sup― lev [pixel]を越える場合は、次式（5 ) を満足するまで Mfront と Mrear を 0 [pixe 1] に近づける方向に小さくする。 h—dv—max≤ h_supp_iev · · · (5)

従って、 h— dv— max が h—supp— lev より大きい場合は、図 4の右側の図に示すように、変換映像の飛び出し位相量 front [Pixel]と奥まり位相量 rear [Pi xel] を、次式（6 ) の線形演算により、ユーザが予め定めた最大飛び出し位相量 Mfront [Pixel] および最大奥まり位相量 Mrear [Pixel]より小さくする。

front = Mfront * h_supp_lev / n—dv—max

· · · (6)

for h_dv_max > h_s pp_lev rear = Mrear * h— supp— lev / h_dv_max

for h—dv—max > h— supp— lev

逆に、 h— dv— max が h—supp— lev より小さい場合は、変換画像の歪みは許容範囲内であるから、図 4の左側の図に示すように、次式（7 ) が成り立つ。 front - Mfront for h—dv—max < h一 supp一 lev … (7)

rear = Mrear for h—dv—max < h_supp_tev

つまり、 h— dv— max が h _supp_lev より小さい場合は、変換映像の位相のダイナミックレンジ dv— range (=front rear) と、ユーザが予め定めた位相のダイナミックレンジ Mdv range (=Mfront Mrear) とは等しくなる。なお、実機におけるこのダイナミックレンジを抑圧する歪み抑圧処理では、 C P U負荷を軽減するため、 h — supp— lev を、推定した奥行きの単位に置き換えて行っているが、ここでは便宜上、画素の単位系を用いて説明を行った。

距離スケール変換方法について説明する。

2眼式立体ディスプレイでは、右眼用画像（R画像）と左眼用画像（L画像）の対応点の視差量 Wとその融像位置（実際に見える管面からの距離） Ypとは、非線形の関係にある。

すなわち、ディスプレイ面上で視差 W[mra]を持つ R画像および L画像を管面から距離 K [mm]離れた位置から観察した場合、管面からの融像位置までの距離 Yp [mm]は次式（8 ) で表される。

Yp = KW /(W - 2E) … （8)

上記式（8 ) において、各変数は以下の値を表す。

K ：ディスプレイ管面からの観察者までの距離 [mm]

E ：眼間の 1/2 の長さ [ram]

W ：ディスプレイ面上での左眼用画像と右眼用画像の対応点の視差量 [删] Yp：管面から融像位置までの距離 [匪]

K^lOOOmra, 2E=65mm として上記式（8 ) をグラフで表すと、図 5のようになる。図 5より、奥行き推定値を線形的に画素の単位に置き換えただけでは、融像する映像には空間的な歪みを生じることが分かる。そこで、距離スケール手法では、空間歪みを考慮して、奥行き推定値を画素の単位に変換する。

以下、距離スケール変換手法について簡単に説明する。

今、ディスプレイ上の 1画素の幅を U[mra] とし、対応点が α画素分の視差 W があるとすると、視差 Wは次式（9 ) で表される。

W = U ■·■ (9) 上記式（9) を上記式（8) に代入することにより、次式（10) に示すように、画素と融像位置の関係が求まる。

Yp = KaU /( U -2E) ··· (10)

また、上記式（1 0) を変形し次式（1 1) を得る。 a = 2E*Y_P/UYp-K)U} ■■■ (11)

完全距離スケール変換では、管面からの最大飛び出し量 Ymax' と管面からの最大奥まり量 Ymin' を指定すると、奥行き推定値 d印 th (0〜100の値を持つ）が決まれば対応する奥行き Ypは、次式（12) で表される単純なスケール変換で得ることができる。

Yp = (Ymax' - Ymin ' )xdepth / 100 ··· (12)

そして、 Ypに対応する視差量 αは、上記式（1 1) により求められる。これにより、空間歪みを考慮して、奥行き推定値を画素の単位に変換することができる。

完全距離スケール変換において、 256段の視差量変換テーブル W" を用いる場合は、図 6に示すように、まず、 Ymax' 〜Ymin' の間を 256等分し、各奥行き値 Yp毎に対応した視差量変換テーブル [pixel]を上記式（1 1) に基づいて求める。

この場合、 W"[255] が Ymax' に対応した視差量となり、 W"[0] が Ymin に対応した視差量となる。そして、奥行き推定値 depth が決まれば、対応する視差量 αは次式（13) より求まる。 = W" [lev] · ·■ (13)

ここで、 lev は視差量変換テーブル上の段数を表し、次式（1 4 ) で与えられる。 lev = 255 depth / 100 … （14)

ここまで、 2 D Z 3 D変換における完全距離スケール変換手法について述べた力この手法には以下に示す 2つの問題がある。

(1) 奥行き Ypが飽和する所まで最大飛び出し量 Ymax' を大きくすると、 Ymax ' 近傍の奥行き値を持つ部分において、変換画像自体の歪み（ R画像、 L画像自体の歪み）が大きくなる。

(2) 奥行き再現空間のダイナミックレンジを大きく取ろうとすると、最大奥まり量 Ymin' を小さくするしかないので、管面より前に飛び出す領域が極端に少なくなる。

上記の問題を回避するためには、奥行きと視差量がある程度比例関係にある領域のみ使用して変換する必要がある。し力、し、それでは画素スケール変換とほぼ同じになってしまい、複雑な処理を行う関係上、完全距離スケール変換はもはや有用とは言い難い。

そこで、考案したのが次に紹介する折れ線距離スケール変換である。折れ線距離スケール変換では、図 7に示すように、飛び出し量比 C [H を導入し、 Ymax' 〜0 を 255*C/100等分し、 0〜Ymin' を 255 { (1-O/100) } 等分することで、視差量変換テ一ブルを求める。

すなわち、飛び出し量比 Cを制御することで、管面より前の飛び出し量を変え、かつ、最大飛び出しとなる部分での変換画像自体の歪みを抑えることができる。なお、折れ線距離スケール変換において上記式（1 2 ) に対応する式は、次式 (1 5) となる。

Yp = Ymax'x {depth - (100 -C)}/C for depth ≥ (100 - C) (15)

Yp = f-Ymin ' x depth / (100 -C)} + Ymin ' for depth < C

また、視差量変換テーブル W〃の段数を表す上記式（14) に対応する式は、次式（16) となる。

lev ^(255 - Dlev) xf depth - (100 -C)}/C + Dlev for depth ≥ (100 - C) . .

··· (16) lev = Dlev x depth /(100-C) for depth < (100 - C)

ここで、 Dlevは、次式（1 7) で定義され、管面に対応する視差量変換テーブル上の段数を表す。

Dlev = (100-C)x255/ 100 … (17)

折れ線距離スケール変換は管面より前と、管面より奥において、それぞれ空間的な歪みが出ないようになつている。逆に言えば、管面において空間的な歪みがでることになる。これは、「立体映像を見た場合、管面前後で見え方が違う。」という多くの視聴者から得た言葉より、空間的な歪みは管面近傍で最も分かりづらくなるという仮説に基づいている。

なお、実際に使用している値は、管面前後での奥行き視差量変換テーブルの傾向（ステップ幅）が大きく違わないよう Ymax',Ymin',C を決定している。

ところで、上述した線形演算を用いた歪み抑圧処理は画素スケール変換には有効であるが、距離スケール変換に対しては有効な手段とは言えない。これは、図 8に示すように、距離スケール変換では、奥行き Ypと視差量 W [pixel] とが非線形であり、奥行き推定量が同じ値、たとえば" 1 " でも管面の前後ではその視差量が大きく異なるという性質を持っためである。なお、この傾向は、大画面デイスプレイにおいて顕著になる。完全距離スケールの改良型である折れ線距離スケールでは、この特性を緩和する意味でも、飛び出し量比 Cを導入している。し力し、飛び出し量比 Cを制御可能な折れ線距離スケールでも、隣接領域間の位相差の最大値 h—dv— max [pixel]を歪み許容範囲 h—supp— lev [pixel]内に完全に抑えることはできない（画素スケールにおける歪み抑圧の原理を忠実に実現することはできない）。この歪み抑圧の原理を実現するためには、歪み抑圧処理を距離スケール変換後に行う必要がある。

4 . MT D法と C I D法との併用

一般に、人は、左右の目の位置の違いにより生じる左右各々の目に入ってくる像の死角部の差（ォクルージョン）などにより立体視時の距離感などを知覚している。この点、 MT D法では、カバーできる反面、動きのない映像や動きの複雑な映像ではうまく 3次元映像に変換できなかった。また、 C I D法では左右目用画像の視差量は自由に変更できる反面、人の左右の目にはその視差により被写体の影になる死角部分が異なって見えるように見せることができなかった。

そこで、動画に対して効果的な MT D法と、静止画も変換可能な C I D法を併用して、 2 D/ 3 D変換を行なうことが考えられる。この場合には、 MT D法で得られた視差と C I D法で得られた視差を単純に加算することが考えられる。しかしながら、 MT D法による視差と C I D法による視差を個別に制御しているため、変換によって生成される視差は入力映像の動きの有無によって大きく左右される。すなわち、入力映像が動画の場合は MT D法の視差と C I D法の視差が変換映像に反映されるが、静止画の場合は MT D法の視差はなく C I D法の視差のみとなる。

このように入力映像により変換映像の立体感が大きく異なる現象は、ユーザーが立体感を調整する際に都合が悪レ、。

この発明は、 MT D法と C I D法とを併用して 2次元映像を 3次元映像に変換する場合に、入力映像により変換映像の立体感が大きく異なるといったことを回避できる 2次元映像を 3次元映像に変換する方法を提供することを目的とする。また、この発明は、距離スケール変換を用いて奥行き推定量を視差量に変換する場合に、変換画像の歪みを押さえることができる 2次元映像を 3次元映像に変換する方法を提供することを目的とする。

<発明の開示〉

〔1〕この発明による 2次元映像を 3次元映像に変換する装置の説明

この発明による 2次元映像を 3次元映像に変換する装置は、映像信号源から入力された 2次元映像信号をフィールド毎に記憶するフィールドメモリ、入力映像信号のフィールド間の動きに応じた動きべクトルを、入力映像の各領域毎に検出する動きべクトル検出手段、フィールドメモリに格納された映像信号のうちから、入力映像信号に対して、動きべクトル検出手段によって検出された各領域の動きべクトルから求められた遅延量だけ遅延した映像信号をフィールドメモリから読み出す読み出し手段、動きべクトル検出手段で検出された各領域の動きべクトルの水平成分の方向に基づいて、入力映像信号とフィールドメモリから読み出された映像信号とのうち、一方の映像信号を左目映像信号として、他方の映像信号を右目映像信号として出力する切替手段、入力映像信号から映像特徴量を、入力映像の各領域毎に抽出する特徴量抽出手段、特徴量抽出手段で抽出された各領域毎の画像特徴量に基づいて、入力映像の各領域毎に奥行き量を算出し、算出した各領域毎の奥行き量から各領域毎の視差量を算出する視差量算出手段、視差量算出手段で算出された各領域毎の視差量を動きべクトル検出手段で検出された各領域毎の動きべクトルの大きさに応じて修正する視差量修正手段、ならびに視差量修正手段で修正された各領域の視差量に基づいて、切替手段で出力された右目用映像及び左目用映像の各領域の位相を修正して、立体映像信号として出力する位相制御手段を備えていることを特徴とする。

視差量修正手段としては、たとえば、視差量算出手段によって算出された各領域毎の視差量から、対応する領域の動きべクトルの大きさに応じた視差量を減算した差分視差量を各領域毎に算出する手段、および隣接領域間の差分視差量の差の最大値が所定範囲内となるように、ダイナミックレンジを変更して各領域毎の差分視差量を算出する手段を備えているものが用いられる。

視差量修正手段によつて得られた各領域毎の差分視差量と対応する領域の動きべクトルの大きさに応じた視差量との和が所定範囲を越える場合には、その余剰視差量に応じた量だけ、遅延量を減少させる手段を設けることが好ましい。〔 2〕この発明による第 1の 2次元映像を 3次元映像に変換する方法の説明この発明による第 1の 2次元映像を 3次元映像に変換する方法は、映像信号源から入力された 2次元映像信号をフィールド毎にフィールドメモリに記憶させる第 1ステップ、入力映像信号のフィールド間の動きに応じた動きべクトノレを、入力映像の各領域毎に検出する第 2ステップ、フィールドメモリに格納された映像信号のうちから、入力映像信号に対して、第 2ステップによって検出された各領域の動きべクトルから求められた遅延量だけ遅延した映像信号をフィールドメモリから読み出す第 3ステップ、第 2ステップで検出された各領域の動きベクトルの水平成分の方向に基づいて、入力映像信号とフィールドメモリから読み出された映像信号とのうち、一方の映像信号を左目映像信号として、他方の映像信号を右目映像信号として出力する第 4ステップ、入力映像信号から映像特徴量を、入力映像の各領域毎に抽出する第 5ステップ、第 5ステップで抽出された各領域毎の画像特徴量に基づいて、入力映像の各領域毎に奥行き量を算出し、算出した各領域毎の奥行き量から各領域毎の視差量を算出する第 6ステップ、第 6ステップで算出された各領域毎の視差量を第 2ステツプで検出された各領域毎の動きべクトルの大きさに応じて修正する第 7ステップ、ならびに第 7ステツプで修正された各領域の視差量に基づいて、第 4ステップで出力された右目用映像及び左目用映像の各領域の位相を修正して、立体映像信号として出力する第 8ステップを備えていることを特徴とする。

第 7ステップとしては、たとえば、第 6ステップによって算出された各領域毎の視差量から、対応する領域の動きべクトルの大きさに応じた視差量を減算した差分視差量を各領域毎に算出するステップ、および隣接領域間の差分視差量の差の最大値が所定範囲内となるように、ダイナミックレンジを変更して各領域毎の差分視差量を算出するステップを備えているものが用いられる。

第 7ステップによつて得られた各領域毎の差分視差量と対応する領域の動きベクトルの大きさに応じた視差量との和が所定範囲を越える場合には、その余剰視差量に応じた量だけ、遅延量を減少させるステップを備えていることが好ましレ、。〔 3〕この発明による第 2の 2次元映像を 3次元映像に変換する方法の説明この発明による第 2の 2次元映像を 3次元映像に変換する方法は、 2次元映像信号に基づいて、 1画面内に設定された複数の視差算出領域それぞれに対して映像の遠近に関する画像特徴量を抽出し、抽出した画像特徴量に基づいて、各視差算出領域毎の奥行き推定値を生成する第 1ステップ、各奥行き推定値に対して、所定の最大飛び出し量と所定の最大奥行き量とによって規定されるダイナミックレンジを用いた距離スケール変換を施すことにより、各視差算出領域毎に仮の目標位相量を求める第 2ステップ、各視差算出領域毎の仮の目標位相量に基づいて、隣接する視差算出領域間での位相差の最大値を求める第 3ステップ、隣接する視差算出領域間での位相差の最大値が予め定められた歪み許容範囲内である力、否かを判定する第 4ステップ、ならびに隣接する視差算出領域間での位相差の最大値が予め定められた歪み許容範囲外である場合には、上記視差算出領域間での位相差が歪み許容範囲内となるようなダイナミックレンジを探索し、各奥行き推定値に対して、探索したダイナミックレンジを用いた距離スケール変換を施し、各視差算出領域毎に仮の目標位相量を求めた後、第 3ステツプに移行する第 5ステツプを備えていることを特徴とする。

ここで、距離スケール変換とは、奥行き推定値を融像位置を考慮して画素の単位（視差量）に変換する手法をいう。これに対して、奥行き推定値を線形的に画素の単位（視差量）に変換する手法を画素スケール変換という。

上記第 5ステップにおいて、探索したダイナミックレンジによって規定される最大飛び出し量と最大奥行き量との比が、予め定められた比となるように、ダイナミックレンジを補正した後、補正後のダイナミックレンジを用いた距離スケール変換を各奥行き推定値に施すようにしてもよい。 <図面の簡単な説明 >

図 1は、従来の MT D法を説明するための模式図である。

図 2は、被写体位置制御を説明するための模式図である。

図 3は、従来の C I D法の制御処理手順を示すフローチヤ一トである。

図 4は、従来の C I D法におけるダイナミックレンジの抑圧処理を説明するための模式図である。

図 5は、視差量 Wとその融像位置 Ypとの関係を示すグラフである。

図 6は、完全距離スケール変換を説明するためのグラフである。

図 7は、折れ線距離スケール変換を説明するためのグラフである。

図 8は、奥行き Ypと視差量 W [pixel] とが非線形であるため、奥行き推定量が同じ値、たとえば" 1 " でも管面の前後ではその視差量が大きく異なるという性質を示すためのグラフである。

図 9は、この発明の第 1の実施の形態による C I D法の制御手順を示すフローチヤ一トである。

図 1 0は、図 9のステップ 1 3の距離スケール変換および歪み抑圧処理の詳細を示すフローチャートである。

図 1 1は、距離比維持の手法を導入することにより、ダイナミックレンジが変わっても管面の前後の奥行き関係が保持されることを示すグラフである。

図 1 2は、量比維持のみの折れ線距離スケール変換を行なった場合と、さらに距離比維持のための処理を行なった場合とを示す模式図である。

図 1 3は、第 2の実施の形態である 2 DZ 3 D変換装置の概略構成を示す図である。

図 1 4は、図 1の 2 DZ 3 D変換装置の動作を示すフローチヤ一トである。図 1 5は、第 2の実施の形態である 2 DZ 3 D変換装置の概略構成を示す図である。

図 1 6は、統合位相制御の全体的な制御処理手順を示すフローチャートである。図 1 7は、統合位相制御の全体的な振る舞いを示す模式図である。

図 1 8は、統合位相制御時の各領域の振る舞いを示す模式図である。

図 1 9は、図 1 6のステップ 5 3、 5 4、 5 5の詳細な処理手順を示すフローチヤ一トである。

図 2 0は、統合位相制御において行なわれる歪み抑圧例を示す模式図である。図 2 1は、 MT D法による位相の調整が必要な場合と必要でない場合とを示す模式図である。

図 2 2は、 MT D法の位相抑圧処理を説明するための模式図である。

図 2 3は、遅延量抑圧処理手順を示すフローチャートである。

<発明を実施するための最良の形態 >

〔1〕第 1の実施の形態についての説明

以下、図 9〜図 1 2を参照して、この発明の第 1の実施の形態について説明する。

図 9は、この発明の第 1の実施の形態による C I D法の制御手順を示している。まず、一画面を複数の領域に分割し、各々の領域から高周波、輝度コントラスト、色 (B- Y、 R-Y 成分）の情報を得る（ステップ 1 1 ) 。そして、これらの情報及び構図から推定した各領域の奥行き推定値を求める（ステップ 1 2 ) 。求めた奥行き推定値に対して距離スケール変換および歪み抑圧処理を施すことにより、目標位相量を得る（ステップ 1 3 ) 。

図 1 0は、図 9のステップ 1 3の距離スケール変換おょぴ歪み抑圧処理の詳細を示している。

まず、 Mfrontと Mrear によって規定されるダイナミックレンジで距離スケール変換を施し、仮の目標位相量を得る（ステップ 2 1、 2 2 ) 。得られた仮の目標位相量に基づいて、隣接領域間の位相差の最大値 h一 dv— max [pixel] を算出する（ステップ 2 3 ) 。

隣接領域間の位相差の最大値 h—dv— max [pixel] が歪み許容範囲 h— supp —lev [pixel] であるか否かを判定する（ステップ 2 4 ) 。許容範囲内である場合には、仮の目標位相量を真の目標位相とする（ステップ 2 7 ) 。

隣接領域間の位相差の最大値が歪み許容範囲外である場合には、当該位相差の最大値が h—supp— lev以下になるまで、 Mfrontと Mrear によって規定されるダイナミックレンジを段階的に小さくすることによって最適な front 、 rear値を得る（ステップ 2 5 ) 。以下、便宜上、ステップ 2 5の処理を逐次探索処理ということにする。逐次探索処理の詳細については後述する。

逐次探索処理によって求めた front と rearとの距離比を、ユーザ指定の距離比になるよう、 front と rearとを変更した後（ステップ 2 6 ) 、ステップ 2 2 に戻り、更に距離スケール変換を行う。

ステップ 2 2、 2 3、 2 4、 2 5、 2 6の処理を、隣接領域間の位相差の最大値 h—dv— max [pixel]が歪み許容範囲 h—supp— lev [pixel] 内になるまで繰り返し、最終的な目標位相量を得る。なお、このようにダイナミックレンジが変更する都度、距離スケール変換を施すのは、立体ディスプレイの空間的な歪みに左右されず奥行き推定量に従つた立体映像を観察者に知覚させるという、距離スケールの原理を正確に実現するためである。

次に、逐次探索処理について説明する。

奥行き推定値と位相量とが非線形である距離スケールでは、 front と rear値で規定されるダイナミックレンジを大きくするため、レンジの決定は逐次探索処理によって行なわれる。

逐次探索処理において、視差量の算出は、奥行き視差量変換式（式 1 5 ) を用いても可能だが、以下に示すように予め算出した視差量変換テーブル W〃を用いた方が効率的である。この方法について、 0 〜100 の間に奥行き推定値が規格化された場合の管面レベルの奥行き推定値を surface depth (= 100- C) として、説明する。

front 値と rear値に対応する視差量変換テーブル W〃上の段数をそれぞれ Ma X—lev (=255〜！) lev) 、 in—lev (=Dlev 〜0 ) とした場合、ある奥行き推定値 V depth の視差量変換テーブルの段数 lev は、次式（1 8 ) で表される。

lev = (v_depth - surface— depth)* (Max— lev - Dlev)/ ( 100 - surface— depth) + Diev

… (18) for v一 depth > surface _depth lev - ( v—depth - Minjev )* ( Dlev - 0) / ( surface一 depth - Min— lev )

for v— depth < surface— depth lev― Dlev for v_depth = surface— depth

lev に対応する位相量 phase は、視差量変換テーブル W〃により一意で求まるので、次式（1 9 ) で表すことができる。 phase = W" (lev ) · · · (19)

逐次探索処理では、隣接領域間の位相差の最大となる 2つの領域の位相差が h ― sup― lev 以下になる front 直と rear値を、 Max ― lev や km― lev を徐々に変化させことによって見つけることができる。

上記式（1 8 ) から明らかなように、逐次探索処理では、隣接領域間の位相差が最大となる 2つの領域が持つ位相量の関係に応じ、最適な front 値と rear値の探索方法は以下の 3種類となる。

第 1ケース：両領域が共に管面より前の位相量を持つ場合は、 front 値を 0に近づけて行く（Max _lev を Dlevに近づけていく）。

第 2ケース：両領域が共に管面より後ろの位相量を持つ場合は、 rear値を 0 に近づけて行く（Min lev を Dlevに近づけていく）。第 3ケース：一方の領域が管面より前の位相量を持ち、もう一方の領域が管面より後ろの位相量を持つ場合は、 front, rear値を共に 0に近づけて行く（Max— 1 ev, in —lev を Dlevに近づけていく）。

第 3ケースの場合には、逐次探索処理時に、ユーザが予め指定した距離比を保持するように、つまり次式（2 0 ) の関係を保持するように、 Max —lev と Min —lev を Dlevに近づけていく。

(255 - Dlev)： Dlev = (Maxjev - Dlev)： (Dlev - Minjev) - · · (20)

上記式（2 0 ) は、図 1 0のステップ 2 6の処理と同義である。第 1ケースと第 2ケースでは、演算量を減らすため、距離比の変更処理を逐次探索処理時に行わず図 1 0のステップ 2 6で行う。

距離スケールにおいてこの距離比維持の手法を導入しているのは、ダイナミックレンジが変わっても管面の前後の奥行き関係を保持するためである。具体的には、図 1 1に示すように、第 1ケースで管面より前の距離を 2 0 %減少させた場合には、管面より後ろの距離も 2 0 %減少させ、管面前後の関係を維持している。視差量変換テーブル上でこの距離比維持を行うと、飛び出し量比 Cの関係も維持することができる。これにより、相対的な奥行きで空間を認知する傾向がある観察者には違和感のない変換映像を提示することができる。

し力、し、観察者の目の特性によっては、全体のダイナミックレンジを広げた方が良い映像とみなす場合がある。このような場合は、第 1ケース、第 2ケースにおいて距離比維持を行わず、量比維持のみを行う。

図 1 2は、量比維持のみの折れ線距離スケール変換を行なった場合と、さらに距離比維持のための処理を行なった場合とを示している。量比維持のみの折れ線距離スケール変換では、管面の奥行き推定値を境に別個のレンジ変換により奥行き推定値と視差量変換テーブルの対応を取る。なお、距離比維持をした場合は、奥行き推定値の視差量変換テーブルは 1つのレンジ変換で対応できる。なお、図 1 2における関数 lev (phase)は上記式（1 9 ) の逆関数を表し、位相量 phase [p ixel]から視差量変換テーブルの段数を求めることを意味する。

〔2〕第 2の実施の形態の説明

以下、図 1 3および図 1 4を参照して、この発明の第 2の実施の形態について説明する。

図 1 3において、 1は V T R、 C D - R OM, T V放送等の映像信号供給手段となる映像供給源、 2は映像供給源 1から供給された 2次元映像信号を 3次元映像信号、即ち左目用映像信号 L及び右目用映像信号 Rに変換する 2 D Ζ 3 D変換装置、 3は 2 D/ 3 D変換装置 2から出力された 3次元映像信号を表示するィメ一ジスプリッター方式等を使用した立体表示手段である。

2 D/ 3 D変換装置 2の構成について説明する。

4は、該映像供給源 1からの映像信号を 1フィーノレド単位で映像を記憶するフィールドメモリ、 5は映像供給源 1からの映像信号から動きべクトルを検出する動きべクトル検出手段である。

6は映像供給源 1から供給される映像から色成分を抽出する色抽出手段、 7は映像供給源 1の映像からコントラストを抽出するコントラスト抽出手段、 8は映像信号源 1の映像から高周波成分を抽出する高周波成分抽出手段である。色抽出手段 6、コントラスト抽出手段 7および高周波成分抽出手段 8は、画像特徴量抽出手段を構成する。

9は動きべクトル検出手段 5で検出した動きべクトルから動きの方向とその動き量（動きベクトルの大きさ）とを求めて、出力する動き量算出手段、 1 0は現在の画像を基準として動き量算出手段 9から出力された動き量に応じたフィールド数分、遅延した画像（遅延画像）をフィールドメモリ 4から読みだすメモリ制御手段、 1 1は動き量算出手段 9から出力された動きの方向に基づいて、基準画像（現在の画像）および遅延画像のうち、いずれを左目用映像信号 Lとし、いずれを右目用映像信号 Rとして出力するかを切り替える切換手段である。

1 2は映像供給源 1の映像から色抽出手段 6の色成分及び動き量算出手段 9で算出した動き量及び方向により被写体や背景などのように同じ物体と判断できる部分をグループィヒし、グループ化情報を出力するグループィヒ手段、 1 3は動き量算出手段 9で算出した動き量とグループィヒ手段で得られたグループ化情報とから奥行き情報を算出し、奥行きマップを作成する第 1奥行きマツプ作成手段である。

1 4はグループ化手段 1 2でグループィヒした領域毎にコントラスト抽出手段 7 で抽出したコントラスト情報から奥行き情報を算出し、奥行きマップを作成する第 2奥行きマツプ作成手段、 1 5はグループ化手段 1 2でグループィヒした領域毎に高周波成分抽出手段 8で抽出した高周波成分情報より奥行き情報を算出し、奥行きマップを作成する第 3奥行きマップ作成手段、 1 6は予め設定された構図情報とグループ化手段 1 2でグループィヒされた領域情報とから奥行き情報を算出し、奥行きマツプを作成する第 4奥行きマツプ作成手段である。

1 7は第 1〜第 4奥行きマップ作成手段 1 3、 1 4、 1 5， 1 6で作成した奥行きマツプを加重加算して合成し、合成マツプを作成する合成マップ作成手段、 1 8は合成マップ作成手段 1 7で作成した合成マップょり、予め設定された視差量算出領域毎の視差量を算出する視差量算出手段、 1 9は視差量算出手段 1 8で算出した各視差量算出領域毎の視差量に基づき、切換手段 1 1から出力された左右目用画像を、たとえば画素単位で水平方向にシフトさせ、合成する水^立置設定手段である。

なお、視差量算出手段 1 8は、動き量算出手段 9で算出された動き量に基づいてフレーム遅延が行われる分を考慮するため、前記動き量に応じて水平位置設定手段 1 9に出力する視差量を修正、即ち減少させている。

図 1 4は、 2 D/ 3 D変換装置 2の動作を示している。

映像供給源 1の映像信号が、 1フィールド単位でフィールドメモリ 4に記憶せしめられる（ステップ 3 1 ) 。動きベクトル検出手段 5によって、映像供給源 1 の 2次元映像信号から動きベクトルが検出され、動き量算出手段 9によって、動きべクトルの動き量及びその方向が算出される（ステップ 3 2 ) 。具体的には、動きべクトル検出手段 5は、現在の画像と 1フィールド前の画像とを比較し、画像内の被写体の移動量とその方向とを動きべクトルとして抽出する。

次に、ステップ 3 2で検出された動きベクトルの動き量に応じて、映像供給源 1からの 2次元映像信号（基準画像）に対して所定フィールド数分遅延した画像 (遅延画像） 1S フィールドメモリ 4から読み出されて、切換手段 1 1に送られる（ステップ 3 3 ) 。切換手段 1 1は、ステップ 3 2で検出された動きベクトルの動きの方向に基づいて、基準画像および遅延画像のうちの一方を左目用映像信号 Lとして出力し、他方を右目用映像信号 Rとして出力する。

上記ステップ 3 1〜ステップ 3 3の動作は、 MT D法の動作に相当する。

次に、映像供給源 1からの 2次元映像信号に基づいて画像特徴量が抽出される (ステップ 3 4 ) 。 1フィールドの画像領域が複数の領域に分割されることにより、 1フィールドの画像領域内に、複数の画像特徴量検出領域が設定されている。色抽出手段 6は、各画像特徴量検出領域毎に色情報を抽出する。コントラスト抽出手段 7は、各画像特徴量検出領域毎にコントラストを抽出する。高周波抽出手段 8は、各画像特徴量検出領域毎に高周波成分を抽出する。また、グループ化手段 1 2は、被写体や背景などの判別に使用するために、色抽出手段 6によって抽出された画像特徴量検出領域毎の色情報と、ステップ 3 2で検出された動き量と画像内の領域をグループ化する。

次に、奥行きマップが作成される（ステップ 3 5 ) 。つまり、第 1奥行きマツプ作成手段 1 3は、動き量算出手段 9によって算出された動きべクトルの動き量およびグループ化手段 1 2によって得られたグループィヒ情報に基づいて第 1奥行きマップを作成する。

また、第 2奥行きマップ作成手段 1 4は、コントラスト抽出手段 7によって抽出された各画像特徴量検出領域毎のコントラストおよびグループ化手段 1 2によつて得られたグループィヒ情報に基づいて第 2奥行きマップを作成する。第 3奥行きマップ作成手段 1 5は、高周波抽出手段 8によって抽出された各画像特徴量検出領域毎の高周波成分およびグループ化手段 1 2によって得られたグループ化情報に基づいて第 3奥行きマツプを作成する。さらに、第 4奥行きマップ作成手段 1 6は、予め設定された画面の構図（たとえば風景画が主体であれば画面下部が地面で、画面上部が空、画面中央部に被写体という構図）およびグループ化手段 1 2によって得られたグループィヒ情報に基づいて第 4奥行きマップを作成する。

次に、合成奥行きマップが作成される（ステップ 3 6 ) 。つまり、合成マップ作成手段 1 7は、第 1〜第 4奥行きマップ作成手段 1 3、 1 4、 1 5、 1 6によつて作成された第 1〜第 4奥行きマップを加重加算することによって、合成奥行きマップを作成する。

次に、視差量が算出される（ステップ 3 7 ) 。つまり、視差量算出手段 1 8は、合成マップ作成手段 1 7によって作成された合成奥行きマップに基づいて、予め定められた視差量算出領域毎に、左目用画像と右目用画像との視差量を算出する。以上ステップ 3 4及びステップ 3 7は、 C I D法の動作に相当する。

次に、視差量が修正される（ステップ 3 8 ) 。つまり、視差量算出手段 1 8は、動き量算出手段 9によって算出された動きべクトルの動き量に応じて、ステップ 3 7で算出した各視差量算出領域毎の視差量を修正する。具体的には、基準画像に対する遅延画像の遅延量に対応する視差量分だけ、ステップ 3 7で算出した各視差量を減少させる。

次に、修正後の視差量に応じて、左目用画像 Lおよび右目用画像 Rが水平シフトせしめられる（ステップ 3 9 ) 。つまり、水平位置設定手段 1 9は、切替手段 1 1から出力される左目用画像 Lおよび右目用画像 Rを、ステップ 3 8で修正された視差量に基づいて、たとえば、画素毎に水平シフトする。

そして、水平位置設定手段 1 9によって水平シフトされた後の左目用画像および右目用画像 Rが、立体表示手段 3によって表示される（ステップ 4 0 ) 。〔3〕第 3の実施の形態の説明

以下、図 1 5〜図 2 3を参照して、この発明の第 3の実施の形態について説明する。

図 1 5は、 2次元映像を 3次元映像に変換する装置（2 DZ 3 D変換装置）の構成を示している。

図 1 5において、 1 0 1は V T R、 C D - R OM, T V放送等の映像信号供給手段となる映像供給源、 1 0 2は映像供給源 1から供給された 2次元映像信号を 3次元映像信号、即ち左目用映像信号 L及び右目用映像信号 Rに変換する 2 D/ 3 D変換装置、 1 0 3は 2 DZ 3 D変換装置 2から出力された 3次元映像信号を表示するイメージスプリツター方式等を使用した立体表示手段である。

2 073 0変換装置1 0 2の構成について説明する。

1 0 4は、該映像供給源 1 0 1からの映像信号を 1フィールド単位で記憶するフィールドメモリ、 1 0 5は映像供給源 1 0 1からの映像信号から動きべクトルを検出する動きべクトル検出手段である。

1 0 6は映像供給源 1 0 1から供給される映像から色成分、コントラスト、高周波成分等の画像特徴量を領域毎に抽出する画像特徴量抽出手段である。

1 1 0は、動きべクトル検出手段 1 0 5で検出した動きべクトルから遅延量を算出する遅延量算出手段である。 1 0 7は現在の入力画像を基準として遅延量算出手段 1 1 0によって算出された遅延量に応じたフィールド数分遅延した画像 (遅延画像）をフィールドメモリ 1 0 4から読みだすメモリ制御手段である。 1 0 8は遅延量算出手段 1 1 0から出力された動きの方向に基づいて、入力画像および遅延画像のうちの、いずれを左目用映像信号 Lとし、いずれを右目用映像信号 Rとするかを切り換える切換手段である。

1 0 9は画像特徴抽出手段 1 0 6によって抽出された領域毎の画像特徴量に基づいて、奥行き推定値を領域毎に算出する奥行き推定値算出手段である。 1 1 1 は奥行き推定値算出手段によって算出された領域毎の奥行き推定値に基づいて、領域毎の C I D法による視差量（位相量）を算出するとともに、遅延量算出手段 1 1 0から出力された MT D法の視差量に基づいて、 C I D法による視差量を修正して統合視差量（統合位相量）を算出する視差量算出手段である。

1 1 3は視差量算出手段 1 1 1で算出した統合視差量に基づき、切換手段 1 0 8から出力された左右目用画像の各領域（たとえば画素単位）を、水平方向にシフトさせ、合成する立体映像合成手段である。

1 1 2は、視差量算出手段 1 1 1で算出した統合視差量および遅延量算出手段 1 1 0から出力された MT D法の視差量に基づいて、遅延量を制御するための視差量監視手段である。

この実施の形態では、 C I D法で得た奥行き推定値をベースに立体空間の再現を行う。すなわち、 C I D法に MT D法によるォクルージョンを付加した立体映像の提示を行う。具体的な方法としては、 C I D法で算出した各領域の位相（視差量）から MT D法の位相（視差量：フィールド遅延によって結果として生成される位相）を減算することによって、 MT D法と C I D法を併用した後でも各領域の位相は C I D法による位相と等しくなるようにする。このため、下記の優先順位により MT D法と C I D法によって生成される位相量を制御する。

優先順位 1 ユーザが設定する位相量の最大レンジ Urange [pixel] 優先順位 2 変換画像における位相シフトに伴う画像歪みの制限 h _supp 一 lev[pixe丄」

優先順位 3 C I D法によって推定される奥行き形状（奥行き推定値の形状）

優先順位 4 Urangeを越えない MT D法によって生成される位相量 dly— s isa[pixel]

優先順位 5 C I D法によって生成される位相量 [pixel]

以下、この優先順位の意味づけについて説明する。

最も優先順位が高い優先順位 1は、統合位相がユーザが設定する位相量の最大レンジ Urangeを越えないことを保証する。

優先順位 2は、統合位相制御（特に C I D法）によって生成される画像の歪み、ある限界値内 (h— supp— lev 以内）であることを保証する。

優先順位 3は、 C I D法によって算出される各領域に対する奥行き推定値（奥行きの形状）が MT D法と C I D法を併用した後も保全されることを意味する。優先順位 4は、 MT D法によって生成される視差量が Urangeを越えないことを保証する。

最も優先順位が低い優先順位 5は、 C I D法によって生成される位相は、 MT D法と併用することによって C I D法単独で生成した位相と異なる値になることを意味する。

図 1 6は、 C I D法の奥行き形状を保った統合位相制御処理手順を示している。また、図 1 7は、実施時の位相の振る舞いを示している。

まず、画像特徴抽出手段 1 0 6によって画像特徴量を抽出する（ステップ 5 1 ) 。奥行き推定値算出手段 1 0 9は、画像特徴抽出手段 1 0 6によって抽出された画像特徴量に基づいて、 C I D法の奥行き推定を行なう（ステップ 5 2 ) 。すなわち、算出周波数、コントラスト、構図重み、被写体背景判別結果重みを適当な割合で加算し、奥行き推定値を求める。

なお、統合位相制御では、 C I D法は動画に対しても使用するため、この加算比率は映像内の動きの速さに応じ可変とする。具体的には、速い動きによる高周波成分の値が下がる傾向を補償するため、動きが速くなる程、高周波成分を加算する割合を減らしている。

そして、このようにして求めた奥行き推定値を Ufrontと Urear 内に距離スケール変換（完全距離スケール変換または折れ線距離スケール変換）し、 C I D法による各領域の位相量を求める（ステップ 5 3 ) 。この C I D法の位相から MT D法の位相（=フィールド遅延量 Xその領域の水平方向動きベクトル値）を引いた差分位相を求め（ステップ 5 4 ) 、この差分位相に対して隣接する領域の位相量の差が h—supp— lev [pixel]以下となるよう歪み抑圧処理を施す（ステップ 5 5 ) ₀

なお、図 1 7の差分位相（= C I D位相— MT D位相）において MT D位相の右端と C I D位相の左端がオーバラップしているのは、領域毎に両手法の位相が異なるためである。これは、図 1 8に示す C I D法の各領域の位相 ph— cidj力、ら MT D法の各領域の位相 ph— mtdjを引いた各領域の差分位相 ph— diff j (= ph— cidj— ph— mtdj) の振る舞いから明らかである。 jは領域番号を表す。図 1 8では、上側の 3行 4列の値は各領域の位相量 [pixel] を表し、下側の図で各領域の位相量を一列に並べて視覚的に分かりやすくしている。

また、図 1 7の歪み抑圧処理後の位相は、差分位相に対して歪み抑圧処理を行うことを示している。上記の歪み抑圧処理後の MT D法と C I D法を統合した位相（統合位相）の最大飛び出し位相量 ufront [pixel] と最大奥まり位相量 urear [pixel]とは、図 1 9に示すループ処理によって求められる。

図 1 9は、図 1 6のステップ 5 3、 5 4、 5 5の処理の詳細を示している。これらの処理は、視差量算出手段 1 1 1によって行なわれる。

まず、変数 Ufront' と Urear'に、ユーザが設定した Ufrontと Urear を設定した後（ステップ 6 1 ) 、 Ufront' と Urear'とによって規定されるダイナミツクレンジで距離スケール変換を施し、 C I D位相量を得る（ステップ 6 2 ) 。次に、 C I D位相から MT D位相を引いた仮の差分位相を求める（ステップ 6 3 ) 。この仮の差分位相量から求めた隣接領域間の位相差の最大値 h— dv一 max [pixe 1] 、（各隣接領域間での差分位相量の差のうちの最大値）を求める（ステップ 6 4 ) 。そして、ステップ 6 5に進む。

後述するように、隣接領域間の位相差の最大値 h—dv— max [pixel] が歪み許容範囲 h— supp—lev [pixel] 内でない場合には、当該隣接領域間の位相差が歪み許容範囲内になるように、ダイナミックレンジが小さくした後、再び上記ステップ 6 2、 6 3、 6 4の処理が行なわれる。

ステップ 6 5では、このようなループ処理が行なわれた場合に前回のステップ 6 4で算出された位相差の最大値 h—dv— max [pixel] 力今回のステップ 6 4で算出された位相差の最大値 h 一 dv— max [pixel] より小さいか否かを判別する。

上記ループ処理が行なわれてない時点では、ステップ 6 5で N Oとなり、今回のステップ 6 4で算出された位相差の最大値 h—dv— max [pixel] I 歪み許容範囲 h— supp— lev [pixel] 内であるか否かを判定する（ステップ 6 6 ) 。範囲内であるなら、仮の差分位相を真の目標位相とする（ステップ 7 2 ) 。逆に、範囲外であるなら、 C P U負荷を軽減するために、ループ回数が制限ループ回数内であるか否かを判定する（ステップ 6 7 ) 。ループ回数が制限ループ回数より大きい場合は、仮の差分位相に対する後述する強制歪み抑圧処理により真の目標位相を求める（ステップ 7 3 ) 。

また、ループ回数が制限ループ回数より少ない場合は、仮の差分位相を退避した後（ステップ 6 8 ) 、隣接領域間の位相差が h — supp— lev 以下になるまで、 Ufront' と Urear によって規定されるダイナミックレンジを段階的に小さくすることによって最適な ufront、 urear値を得る（ステップ 6 9 ) 。この処理を、以下、逐次探索処理ということにする。逐次探索処理の詳細については後述する。逐次探索処理で求めた ufront と urear との距離比がユーザ指定の距離比になるよう変更する（ステップ 7 0 ) 。そして、得られた ufrontおよび urear を、 Ufront' および Urear'に設定することにより、ダイナミックレンジを変更した後（ステップ 7 1 ) 、ステップ 6 2に戻って、再度、距離スケール変換を行う。ステップ 6 2〜ステップ 7 1の一連の処理を隣接領域間の位相差の最大値 h —dv_max [pixel]が歪み許容範囲 h —supp— lev [pixel] 内になる力途中で中断されるまで繰り返し、最終的な目標位相量を得る。

図 1 9における 2種類のループの中断について順に説明する。

まず、第 1の中断は、ステップ 6 7において、 C P U負荷を軽減するためにループ回数が制限ループ回数に達したときに発生する。この条件によって中断した場合は、仮の差分位相に対し、次式（2 1 ) に示すような、上記式（6 ) と同意義の画素スケール的な歪み抑圧処理を行い ufront, urear値を決定し、このレンジ内に奥行き推定値をレンジ変換する。 ufront二 df— ufront * h— supp—lev /

for n_dv_max > h一 supp—lev urear = df_urear * h_supp_lev / h—dv—max for h—dv—max > h— supp— lev ■· · (21)

ここで、 df ufront, df urear はそれぞれ仮の差分位相の最大値と最小値を表し、差分位相に対する隣接領域間の最大位相差を算出する段階で取得するものとする。そして、このようにして新たに求められたレンジ内に差分位相が収まるようにする。なお、上記式（2 1 ) の ufrontと urear に対し、次式（2 2 ) で表される距離比維持の処理を行っても何等問題はなレ、。

(255 - Dlev): Dlev = flev(ufront) - Dlev}： fDlev - lev (urear)} · · - (22)

第 2の中断は、ステップ 6 5において、ステップ 6 2〜ステップ 7 1のループ処理が行なわれた場合に前回のステップ 6 4で算出された位相差の最大値 h 一 d V— max [pixel] 力今回のステップ 6 4で算出された位相差の最大値 h—dv— max [pixel] より小さい場合に発生する。

この中断が起こるのは、現ループでの隣接領域間の位相差の最大値 h _dv__m ax 、ダイナミックレンジを十分小さくしたにも関わらず、 1つ前のループで得た際の値より小さくならない場合である。これは、歪み抑圧処理により MT D 法によって生成される位相が変更されないことにより起こる。すなわち、図 2 0 に示すように、 MT D法によって生成される被写体と背景の位相の差が大きい場合は、ループ数を増やしても MT D位相の位相差が邪魔をしダイナミックレンジが小さくならず、結果として差分位相が、 h— supp— lev 以下にはならない。このような場合は、処理を中断し、ステップ 7 3と同様な処理によって、ダイナミックレンジ変更を行う（ステップ 7 4 ) 。ただし、この場合には、ステップ 6 8で退避された仮の退避差分位相に対しダイナミックレンジ変更を行う。ここで仮の退避差分位相に対してダイナミックレンジを変更しているのは、歪み抑圧のループを重ねるごとに MT D法の位相が差分位相の形状に影響を及ぼしかつ差分位相のダイナミックレンジが減少する傾向を緩和するためである。

しかし、このような手法はあくまで対症療法であり、根本的に MT D法の位相によって引き起こされる強制歪み抑圧処理の発生頻度を下げるまでには至らなレヽ。

このような現象の発生頻度を下げるためには、 MT D位相自体の隣接領域間の位相差を小さくする必要がある。このため、統合位相制御では、各領域の MT D 位相 ph— ratdjとして、本来その領域が持つ視差量（二フィールド遅延量 Xその領域の水平方向動きべクトル値）を隣接領域間と平滑化した後の値を用いている。また、強制歪み抑圧処理の発生頻度を下げるためには、 MT D法と C I D法の位相の形状を似せる必要がある。このため、統合位相では図 1 6に示すように、 MT D位相が大きくなる領域では C I D位相も大きくなるように被写体背景判別の結果を考慮して奥行き推定を行っている。

図 1 9のステップ 6 9のダイナミックレンジの逐次探索処理について説明する。 ①差分位相の隣接領域間の位相差が最大となる領域を決定する。

②探索の方向を決定する。具体的には、 ①で決定した位相差が互いに最大となる 2領域の C I D位相の値に応じて探索の方向を決定する。

③ ufront値ないし urear値を管面の値に近づける。

④上記 2領域に対して、更新後の ufront値および urear値で規定されるダイナミックレンジを用いた距離スケール変換を行なって、上記 2領域の C I D位相を算出する。

⑤ 2領域の差分位相 (=C I D位相一 MT D位相）を算出する。

⑥両領域間の差分位相の位相差 h 一 dv— max を算出する。

⑦⑥で求めた位相差 h 一 dv— max を下記の順で判定する。

1) . h— dv— max が h— supp— lev以下の場合は、処理を終了する。

2) . h— dv— max が 1つ前のループの h— dv— max より大きくなる場合は、求める値を 1つ前のループで使用した ufront値ないし urear値として、処理を終了する。

3) . h— dv— max が h— su卯— lev より大きい場合は、 ③に飛ぶ。

次に、視差量監視手段 1 1 2によって行なわれる、 MT D法によって生成される視差（位相）の制御方法について説明する。

C I D法の立体再現性を保った統合位相制御では、 MT D法では被写体位置制御を用いていない。このため、 MT D法によって生成される位相はユーザが予め定めた最大飛び出し位相量 Ufront Cpixel] と最大奥まり位相量 Urear [pixel]を越えることがある。このような現象が起きる場合の位相の振る舞いを図 2 1に示す。図中の右端の O Kマークは、 MT D位相と差分位相との和である統合位相が、ユーザによって予め定められたダイナミックレンジ Urange内であることを表し、 N Gマークは統合位相がダイナミックレンジ Urangeを越えることを表す。

N Gのケースでは、以下に示す問題が発生する。

Urear が眼間と同程度である場合、距離スケールでは眼間以上の奥行きが規定できない。また、 N Gの現象が歪み抑圧処理後も維持する場合は、統合位相はその大前提である Urange内の立体再現の原則が守られない。

このような問題を解決するため、 MT D法によって生成する立体感を決定する視差量 Mdly— sisaを予め小さく設定し、 N Gの現象が起こらないようにすることも可能であるが、この方法は MT D法による立体感を損なうため好ましいとは言い難い。そこで、 Mdly— sisaを大きく取る代償として N Gの現象の発生をある程度認め、 Ufront、 Urear を越える位相が発生した場合にのみ目標遅延量 dly —targetを小さくするという制御が必要となる（図 2 2参照）。

なお、この方法で Urange内に位相を抑えるためには、最初からュ一ザ設定値の Ufront、 Urear の代わりに、 MT D併用時に発生する Urangeのオーバー分を見込んで、各々の値より絶対値が小さくなるような値を内部的な Ufrontと Urea r として処理する必要がある。また、視差量変換テーブルを用いて距離スケール変換を行う手法では、変換テーブル外となる位相量に対しては変換テーブルに収まるよう丸める必要がある。

図 2 3は、図 2 2の処理を実現する制御処理手順（視差量監視手段 1 1 2によつて行なわれる制御処理手順）を示している。

図 2 3では、各領域の統合位相（実位相と実遅延量による位相との和）が Ufr ont、 Urear を越える場合に目標遅延量を小さくする。

このため、毎フィールド被写体領域及び背景領域それぞれの MT D法による位相量を算出する必要がある（ステップ 8 1 ) 。現フィールドの位相量の算出には、精度を高めるため実位相 phase [pixel]及ぴ実遅延量 delay [field] を用いて行う。

実際の制御では、まず、 MT D法のフィールド遅延によって生じる被写体領域の実視差 obj _s isa' [pixe] 及び背景領域の実視差 bg— sisa' [pixel]、いずれの領域に属するか不明の N G領域の実視差 ng— si sa' [piexel ] を、次式（2 3 ) で求める。 obj— sisa' = obj— vect * delay

bg—sisa ' - bg_vect * delay ■■■ (23)

ng—sisa ' = ( obj一 sisa ' + bg—sisa ' )/ 2

次式（2 4 ) に示すように、これらと各領域の真の目標位相量を時間的に平滑化した実位相量 rph — diffj [pixel]を加算することによって、各領域の実統合位相量 u jahasej [pixel]を求める（ステップ 8 2 ) 。 u _phasej = obj_sisa' + ph_dijfj for 被体部の領域

u ^phasej = bg_sisa' + ph_diffj for 背景部の領域 (24) u _phasej = ng_sisa' + ph_diffj for NGの領域

そして、この実統合位相量 u _phase がユーザの設定した Ufrontから Urear の範囲に入る力否かを計るため、範囲外の場合はその領域の位相がユーザ設定からどのくらい離れているかを表す位相量 over__phase [pixel]を次式（2 5 ) により求める（ステップ 8 3 ) 。 over _phasei = u _phasej - U front for u _phasej > Ufront

over _j>nasej = ~ (u _j?hasej - Urear) for Urear > u _phasej

… (25) over ^phasej = 0 for Ufront ≥ u _phasej≥ Urear 次に 1画面を構成する各領域の over— phase の最大値 over— maxp [pixel] を求め、 over_maxpが 0でない場合は、目標遅延量を小さくする目標遅延量抑圧処理を行う（ステップ 8 4 ) 。

目標遅延量抑圧処理では、まずフィ一ルド遅延によって発生する現フィールドの実視差量 dly — sisa' [pixel]の絶対値から上記式（2 5 ) で求めた over— max pを引き、 M T D法が生成可能な視差量 dly —sisa" を次式（2 6 ) により求める。 dly一 sisa " = I diy_sisa ' I - over一 maxp

= I obj一 sisa' - bg sisa' I - over一 maxp

そして、この dly —si sa" を基に抑圧した目標遅延量 dly _tartget'を次式 ( 2 7 ) により求める。 dly_target ' = dly_sisa " / ( obj_xvec - bg_xvec) [field] … (27)

実遅延量の推移速度が実遅延量と目標遅延量との差に応じて変化する手法に備え、 dly —target' と抑圧前の目標遅延量 dly —targetの大きさを比較し、より小さい方を最終的な抑圧後の目標遅延量 dly 一 target" とする。つまり、最終的な抑圧後の目標遅延量 dly —targe は、次式（2 8 ) で表される。 dly— target" = delay - 1 for 0 < delayぐ dly— target'

dly_target" = delay + 1 for 0 > delay > dly一 tar get' … (28) dly—target" = dly— target' for \ delay ] > I dly Jar get' \

ここでは、実遅延量と実視差により MT D法の位相の抑圧を行ったが、精度より C P Uへの負荷を優先させる場合は、目標位相、目標遅延量により行うことも可能である。

Claims

請求の範囲

1 . 映像信号源から入力された 2次元映像信号をフィールド毎に記憶するフィ一ノレドメモリ、

入力映像信号のフィールド間の動きに応じた動きベクトルを、入力映像の各領域毎に検出する動きべクトル検出手段、

フィーノレドメモリに格納された映像信号のうち力ゝら、入力映像信号に対して、動きべクトル検出手段によって検出された各領域の動きべクトルから求められた遅延量だけ遅延した映像信号をフィールドメモリから読み出す読み出し手段、動きべクトル検出手段で検出された各領域の動きべクトルの水平成分の方向に基づいて、入力映像信号とフィールドメモリから読み出された映像信号とのうち、一方の映像信号を左目映像信号として、他方の映像信号を右目映像信号として出力する切替手段、

入力映像信号から映像特徴量を、入力映像の各領域毎に抽出する特徴量抽出手段、

特徴量抽出手段で抽出された各領域毎の画像特徴量に基づいて、入力映像の各領域毎に奥行き量を算出し、算出した各領域毎の奥行き量から各領域毎の視差量を算出する視差量算出手段、

視差量算出手段で算出された各領域毎の視差量を動きべクトル検出手段で検出された各領域毎の動きベクトルの大きさに応じて修正する視差量修正手段、ならびに

視差量修正手段で修正された各領域の視差量に基づいて、切替手段で出力された右目用映像及ぴ左目用映像の各領域の位相を修正して、立体映像信号として出力する位相制御手段、

を備えていることを特徴とする 2次元映像を 3次元映像に変換する装置。

2 . 視差量修正手段は、

視差量算出手段によつて算出された各領域毎の視差量から、対応する領域の動きべクトルの大きさに応じた視差量を減算した差分視差量を各領域毎に算出する手段、および

隣接領域間の差分視差量の差の最大値が所定範囲内となるように、ダイナミックレンジを変更して各領域毎の差分視差量を算出する手段、

を備えていることを特徴とする請求項 1に記載の 2次元映像を 3次元映像に変換する装置。

3 . 視差量修正手段によって得られた各領域毎の差分視差量と対応する領域の動きべクトルの大きさに応じた視差量との和が所定範囲を越える場合には、その余剰視差量に応じた量だけ、遅延量を減少させる手段を備えていることを特徴とする請求項 2に記載の 2次元映像を 3次元映像に変換する装置。

4 . 映像信号源から入力された 2次元映像信号をフィールド毎にフィールドメモリに記憶させる第 1ステップ、

入力映像信号のフィールド間の動きに応じた動きべクトノレを、入力映像の各領域毎に検出する第 2ステップ、

フィールドメモリに格納された映像信号のうちから、入力映像信号に対して、第 2ステップによって検出された各領域の動きべクトルから求められた遅延量だけ遅延した映像信号をフィールドメモリから読み出す第 3ステツプ、

第 2ステツプで検出された各領域の動きべクトルの水平成分の方向に基づいて、入力映像信号とフィールドメモリから読み出された映像信号とのうち、一方の映像信号を左目映像信号として、他方の映像信号を右目映像信号として出力する第 4ステップ、

入力映像信号から映像特徴量を、入力映像の各領域毎に抽出する第 5ステップ、第 5ステップで抽出された各領域毎の画像特徴量に基づいて、入力映像の各領域毎に奥行き量を算出し、算出した各領域毎の奥行き量から各領域毎の視差量を算出する第 6ステップ、

第 6ステップで算出された各領域毎の視差量を第 2ステップで検出された各領域毎の動きべクトルの大きさに応じて修正する第 7ステップ、ならびに第 7ステツプで修正された各領域の視差量に基づレ、て、第 4ステツプで出力された右目用映像及び左目用映像の各領域の位相を修正して、立体映像信号として出力する第 8ステップ、

を備えていることを特徴とする 2次元映像を 3次元映像に変換する方法。

5 . 第 7ステップは、

第 6ステップによって算出された各領域毎の視差量から、対応する領域の動きべクトルの大きさに応じた視差量を減算した差分視差量を各領域毎に算出するステツプ、および

隣接領域間の差分視差量の差の最大値が所定範囲内となるように、ダイナミックレンジを変更して各領域毎の差分視差量を算出するステップ、

を備えていることを特徴とする請求項 5に記載の 2次元映像を 3次元映像に変換する方法。

6 . 第 7ステップによって得られた各領域毎の差分視差量と対応する領域の動きべクトルの大きさに応じた視差量との和が所定範囲を越える場合には、その余剰視差量に応じた量だけ、遅延量を減少させるステップを備えていることを特徴とする請求項 5に記載の 2次元映像を 3次元映像に変換する方法。

7 . 2次元映像信号に基づいて、 1画面内に設定された複数の視差算出領域それぞれに対して映像の遠近に関する画像特徴量を抽出し、抽出した画像特徴量に基づいて、各視差算出領域毎の奥行き推定値を生成する第 1ステップ、

各奥行き推定値に対して、所定の最大飛び出し量と所定の最大奥行き量とによつて規定されるダイナミックレンジを用いた距離スケール変換を施すことにより、各視差算出領域毎に仮の目標位相量を求める第 2ステップ、

各視差算出領域毎の仮の目標位相量に基づいて、隣接する視差算出領域間での位相差の最大値を求める第 3ステップ、

隣接する視差算出領域間での位相差の最大値が予め定められた歪み許容範囲内である力否かを判定する第 4ステップ、

隣接する視差算出領域間での位相差の最大値が予め定められた歪み許容範囲外である場合には、上記視差算出領域間での位相差が歪み許容範囲内となるようなダイナミックレンジを探索し、各奥行き推定値に対して、探索したダイナミックレンジを用いた距離スケール変換を施し、各視差算出領域毎に仮の目標位相量を求めた後、第 3ステップに移行する第 5ステップ、

を備えている 2次元映像を 3次元映像に変換する方法。

8 . 上記第 5ステップにおいて、探索したダイナミックレンジによって規定される最大飛び出し量と最大奥行き量との比が、予め定められた比となるように、ダイナミックレンジを補正した後、補正後のダイナミックレンジを用いた距離スケール変換を各奥行き推定値に施すようにしたことを特徴とする請求項 7に記載の 2次元映像を 3次元映像に変換する方法。