JP2004242000A - 符号化装置および方法、並びに復号装置および方法 - Google Patents
符号化装置および方法、並びに復号装置および方法 Download PDFInfo
- Publication number
- JP2004242000A JP2004242000A JP2003028353A JP2003028353A JP2004242000A JP 2004242000 A JP2004242000 A JP 2004242000A JP 2003028353 A JP2003028353 A JP 2003028353A JP 2003028353 A JP2003028353 A JP 2003028353A JP 2004242000 A JP2004242000 A JP 2004242000A
- Authority
- JP
- Japan
- Prior art keywords
- image
- encoding
- distance
- decoding
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】復号側が、符号化側と同じ状況でステレオ表示することができるようにする。
【解決手段】ビデオカメラ21,22は、対象物3をそれぞれ同時に撮像し、撮像信号に変換する。ビデオカメラ22は、画面内を複数の領域に分割し、分割された領域毎に、各領域内における最大の面積を有する対象物3までの距離を算出し、それを焦点情報B3とする。ステレオ符号化部23は、入力された撮像信号に対して所定の処理を施し、符号化データC1に符号化するとともに、左右の画像の視差を算出し、それを差分情報B4とする。レンズ間距離発生部24は、ビデオカメラ21,22のレンズ間の距離情報A1を発生する。多重化部25は、入力された符号化データC1、距離情報A1、焦点情報B3、および差分情報B4を、所定のフォーマットに基づいて多重化し、復号側に伝送する。本発明は、ビデオカメラに適用できる。
【選択図】 図2
【解決手段】ビデオカメラ21,22は、対象物3をそれぞれ同時に撮像し、撮像信号に変換する。ビデオカメラ22は、画面内を複数の領域に分割し、分割された領域毎に、各領域内における最大の面積を有する対象物3までの距離を算出し、それを焦点情報B3とする。ステレオ符号化部23は、入力された撮像信号に対して所定の処理を施し、符号化データC1に符号化するとともに、左右の画像の視差を算出し、それを差分情報B4とする。レンズ間距離発生部24は、ビデオカメラ21,22のレンズ間の距離情報A1を発生する。多重化部25は、入力された符号化データC1、距離情報A1、焦点情報B3、および差分情報B4を、所定のフォーマットに基づいて多重化し、復号側に伝送する。本発明は、ビデオカメラに適用できる。
【選択図】 図2
Description
【0001】
【発明の属する技術分野】
本発明は、符号化装置および方法、並びに復号装置および方法に関し、特に、例えば、ステレオ動画像の符号化および復号に用いて好適な符号化装置および方法、並びに復号装置および方法に関する。
【0002】
【従来の技術】
従来、ステレオ動画像の符号化方式として、さまざまな手法が提案されている。例えば、2台のカメラを用いて左右の画像を符号化する際、一方の画像には、MPEG(Moving Picture Experts Group)等で用いられている動き補償フレーム間予測符号化方式を、他方の画像には、視差補償予測または視差成分を、それぞれアフィン(Affine)変換を用いて冗長性を除き、符号化する方式が提案されている。
【0003】
また、1つの視点の画像を基準画像と定め、その基準画像に対して動き補償を行うとともに、基準画像以外の視差画像に対して視差補償を行い、ブロック毎に補償方法を選択することにより、符号化しているものもある(特許文献1参照)。
【0004】
【特許文献1】
特開平10−191394号公報
【0005】
【発明が解決しようとする課題】
上述した特許文献1に開示されている技術によれば、平面動画像に比べて、ステレオ動画像は2倍のデータレートとなることから、左右画像の相関を利用して、冗長性を削減している。
【0006】
しかしながら、この技術では、符号化側のデータレートの削減だけが考慮されており、復号側の表示に関しては、全く考慮されていない。
【0007】
近年、符号化技術の進歩、およびプロセッサの演算速度の向上により、符号化側でデータレートを削減することが可能になっているとともに、ADSL(Asynchronous Digital Subscriber Loop)の普及、または、記録メディアの記録容量の増大により、データレートを削減することが、必ずしも重要ではなくなってきている。
【0008】
ところで、復号側のステレオ表示については、例えば、「視差(パララックス)バリア方式」を利用した裸眼立体視液晶ディスプレイが提案されている。しかしながら、このディスプレイには、立体視が可能な範囲が狭いという課題があった。
【0009】
また、符号化側の状況を復号側で正確に再現できていないため(すなわち、符号化側の状況と異なる表示を復号側で行っているため)、観察者に対し、ステレオ表示は、不安定、不自然、あるいは疲れるといった印象を与えてしまう課題があった。
【0010】
本発明はこのような状況に鑑みてなされたものであり、符号化側の状況をパラメータとしてデータストリームに重畳することにより、復号側が、符号化側と同じ状況でステレオ表示することができるようにするものである。
【0011】
【課題を解決するための手段】
本発明の符号化装置は、2つの撮像装置により対象物を撮像する撮像手段と、撮像手段により撮像された画像を符号化する符号化手段と、撮像手段により撮像された画像に基づいて、符号化時の画像に係るパラメータを算出する算出手段と、符号化手段により符号化された符号化データ、および、算出手段により算出されたパラメータを多重化する多重化手段とを備えることを特徴とする。
【0012】
前記パラメータは、2つの撮像手段の間の距離に関する情報であるものとすることができる。
【0013】
前記パラメータは、対象物までの距離に関する情報であるものとすることができる。
【0014】
前記画像は、ステレオ動画像であるものとすることができる。
【0015】
本発明の符号化方法は、2つの撮像装置により対象物を撮像する撮像ステップと、撮像ステップの処理により撮像された画像を符号化する符号化ステップと、撮像ステップの処理により撮像された画像に基づいて、符号化時の画像に係るパラメータを算出する算出ステップと、符号化ステップの処理により符号化された符号化データ、および、算出ステップの処理により算出されたパラメータを多重化する多重化ステップとを含むことを特徴とする。
【0016】
本発明の復号装置は、符号化側から伝送されてきたデータを、符号化データ、およびパラメータに分離する分離手段と、分離手段により分離された符号化データを復号する復号手段と、復号手段により復号された画像を、分離手段により分離されたパラメータに基づいて、画像変換する画像変換手段と、画像変換手段により画像変換された画像を表示する表示手段とを備えることを特徴とする。
【0017】
前記パラメータは、符号化時の画像に係るパラメータであるものとすることができる。
【0018】
前記画像は、ステレオ動画像であるものとすることができる。
【0019】
本発明の復号方法は、符号化側から伝送されてきたデータを、符号化データ、およびパラメータに分離する分離ステップと、分離ステップの処理により分離された符号化データを復号する復号ステップと、復号ステップの処理により復号された画像を、分離ステップの処理により分離されたパラメータに基づいて、画像変換する画像変換ステップと、画像変換ステップの処理により画像変換された画像の表示を制御する表示制御ステップとを含むことを特徴とする。
【0020】
第1の本発明においては、2つの撮像装置により対象物が撮像され、撮像された画像が符号化され、撮像された画像に基づいて、符号化時の画像に係るパラメータが算出され、符号化データおよびパラメータが多重化される。
【0021】
第2の本発明においては、符号化側から伝送されてきたデータが、符号化データおよびパラメータに分離され、分離された符号化データが復号され、復号された画像が、分離されたパラメータに基づいて画像変換され、表示される。
【0022】
【発明の実施の形態】
以下、図を参照して、本発明の実施の形態について説明する。
【0023】
図1は、観察者1が、対象物である背景2および前景3を観察した場合における立体視の原理を説明するための図である。ここで、観察者1の眼球間の距離をA1とし、観察者1から背景2までの距離をB1とし、観察者1から前景3までの距離をB2とする。同図に示されるように、観察者1から背景2までの距離B1と前景3までの距離B2では、視差が異なり、この視差が観察者1に対し、距離間を与え、立体視を可能にしている。
【0024】
通常、眼球間の距離A1は、個人差があるものの、ほぼ7乃至8センチとされている。一方、ステレオ・ビデオカメラにおける2組のレンズ間の距離は、7乃至8センチに限定されるものではない。従って、本実施の形態においては、レンズ間の距離、あるいは、レンズ間の距離と初期値(例えば、8センチ)との差をパラメータA1とする。同様に、対象物(背景2および前景3)までの距離、あるいは、対象物までの距離と初期値との差をパラメータBとする。
【0025】
図2は、本発明を適用した符号化システム11の構成例を示す図である。
【0026】
左右のビデオカメラ21,22は、対象物である図1に示した前景3をそれぞれ同時に撮像し、撮像された画像を電気信号(撮像信号)に変換し、ステレオ符号化部23に出力する。
【0027】
また左右のビデオカメラ21,22のうち、いずれか一方(図2の例の場合、ビデオカメラ22)は、例えば、画面内を複数の領域(後述するマクロブロック)に分割し、分割された領域毎に、各領域内における最大の面積を有する対象物(前景3)までの距離を算出するか、あるいは、前景(最短距離にある対象物)までの距離を算出し、それを焦点情報B3(以下、必要に応じてパラメータB3と記載する)として多重化部25に出力する。
【0028】
なお、多くの場合、前景(最短距離にある対象物)までの距離が重要であり、背景(最長距離、または測定不可能な無限にある対象物)までの距離は、焦点が合致しないため、鮮明に表示させなくても大した問題とはならない。
【0029】
ステレオ符号化部23は、左右のビデオカメラ21,22から入力された撮像信号に対して、一方の撮像信号を、通常のMPEG(Moving Picture Experts Group)2またはMPEG4等の符号化方式によって所定の処理を施し、冗長性の少ないデータに符号化する。これに対し、他方の撮像信号は、前記一方の撮像信号との誤差分として、例えば、差分符号化、またはアフィン符号化などにより冗長性が削減され、符号化データとされる。これら両者のデータにおいて、主符号化データとしては、前記一方の符号化データが用いられ、副符号化データとしては、前記他方の符号化データが、いわゆるエンハンスドデータとして用いられ、符号化データC1として多重化部25に出力される。
【0030】
この多重化により、主符号化データは、通常のMPEG符号化データとして扱うことができ、復号側が従来の平面表示装置である場合、従来のMPEG復号装置をそのまま使用することができる。
【0031】
またステレオ符号化部23は、左右のビデオカメラ21,22から入力された撮像信号に基づいて、左右の画像の差分(視差)を算出し、それを差分情報B4(以下、必要に応じてパラメータB4と記載する)として多重化部25に出力する。ここでステレオ符号化部23は、対象物を特定することなく、マクロブロック毎に左右の画像を比較して、誤差(視差)の大きさを距離に換算し、それをパラメータB4に設定するか、あるいは、左右の画像を合成し、マクロブロック毎に距離を算出し、それをパラメータB4に設定する。
【0032】
さらにステレオ符号化部23は、多重化のための同期信号D1を多重化部25に出力する。
【0033】
レンズ間距離発生部24は、左右のビデオカメラ21,22のレンズ間の距離を発生し、それを多重化部25に出力する。具体的には、レンズ間距離発生部24は、予め左右のビデオカメラ21,22のレンズ間の距離が固定されている場合、その固定値をパラメータA1として出力し、レンズ間の距離が固定されていない場合、その撮影時のレンズ間の距離をパラメータA1として出力する。
【0034】
なお、レンズ間の距離は、レンズの中心からの垂直軸間の距離で表わされるため、仮にレンズ間の距離が固定されていたとしても、ビデオカメラ21,22が左右に傾いた場合には、擬似的にレンズ間の距離が変更されてしまう。すなわち、ビデオカメラ21,22が傾くと、擬似的に変更されてしまったレンズ間の距離に基づいて、ステレオ動画像が形成されてしまうが、復号側の立体表示装置45(図4)では、そのカメラの傾きを想定していない。
【0035】
例えば、ビデオカメラ21,22が傾くことにより、7乃至8センチに設定されていたレンズ間の距離が、擬似的に5乃至6センチに変更されてしまう。この状態で形成されたステレオ動画像を復号側の立体表示装置45で表示させた場合、画面が傾くだけでなく、視差の変化により距離が変動し、観察者に対し、不快感を生じさせる。付言すれば、画面が傾くこと、およびレンズ間の距離が変動することが相乗効果となって、観察者に対し、より不快感を与えることになる。
【0036】
そこで、本実施の形態においては、左右のビデオカメラ21,22が傾いた場合、傾きによるレンズ間の距離の変化を、パラメータA1とする。従って、レンズ間距離発生部24は、例えば、船や航空機などに搭載されている電子傾き計(ジャイロ)を含むことにより、左右のビデオカメラ21,22の傾きを検出するとともに、その傾きによるレンズ間の距離の擬似的変化をパラメータA1として発生する。
【0037】
多重化部25は、ステレオ符号化部23から供給される同期信号D1に基づいて、スイッチング動作を行い、ビデオカメラ22から入力されたパラメータB3(焦点情報)、ステレオ符号化部23から入力された符号化データC1およびパラメータB4(差分情報)、レンズ間距離発生部24から入力されたパラメータA1(レンズ間の距離情報)を、所定のフォーマットに基づいて多重化する。
【0038】
例えば、ステレオ符号化部23からのシーケンス、GOP(Group of Pictures)、あるいはマクロブロックなどのヘッダタイミングに応じて、MPEGの符号化データC1に、パラメータA1,B3,B4が多重化される。そして、多重化されたデータストリームEは、所定の伝送路またはメディア(いずれも図示せず)を介して復号システム31(図4)に伝送される。
【0039】
ここで、図3を参照して、MPEGのビットストリーム(データストリーム)に多重化された各パラメータの位置について説明する。
【0040】
同図に示されるように、MPEGのビットストリームは、GOP層、ピクチャ層、および複数のマクロブロック層で構成されている。レンズ間の距離に関するパラメータA1は、GOP層、またはピクチャ層に1つ設けられ、対象物までの距離に関するパラメータB(パラメータB3,B4)は、マクロブロック毎に設けられる。
【0041】
すなわち、レンズ間の距離の変化は、最短でも1画面内でしか発生しないのに対し、1画面中に含まれる対象物は、様々な距離を有しており(厳密には、画素毎に対象物の距離が異なり)、パラメータBについては、マクロブロック毎に設けられる。
【0042】
図4は、本発明を適用した復号システム31の構成例を示す図である。
【0043】
デマルチプレクサ41は、所定の伝送路またはメディアを介して、符号化システム11(図2)から供給されたデータストリームEを、符号化データC1、および、多重化されたパラメータA/B(以下、多重パラメータA/Bと記載する)に分離する。分離された符号化データC1は、復号部42に出力され、多重パラメータA/Bは、パラメータ分離部43に出力される。
【0044】
復号部42は、デマルチプレクサ41から入力された符号化データC1に対して所定の処理を施し、ステレオ動画像に復号するとともに、分離のためのタイミング信号Fをパラメータ分離部43に供給する。パラメータ分離部43は、復号部42から供給されるタイミング信号Fに応じて、デマルチプレクサ41から入力された多重パラメータA/Bを、MPEGのGOP層、およびマクロブロック層毎に、パラメータA1,B3,B4にそれぞれ分離する。分離されたパラメータA1,B3,B4は、表示制御部44にそれぞれ出力される。
【0045】
表示制御部44は、パラメータ分離部43から供給されたパラメータA1(レンズ間の距離情報)および、パラメータB3,B4(対象物までの距離情報)に基づいて、復号部42で復号されたステレオ動画像に対し、所定の画像変換処理を施す。立体表示装置45は、表示制御部44で画像変換されたステレオ動画像を表示する。
【0046】
次に、図5のフローチャートを参照して、符号化システム11が実行するステレオ動画像の符号化処理について説明する。
【0047】
ステップS1において、左右のビデオカメラ21,22は、例えば、図6に示されるように、撮影範囲61内に存在する対象物をそれぞれ同時に撮影する。図6の例の場合、撮影される対象物には、背景2および前景3が存在する。
【0048】
ステップS2において、左右のビデオカメラ21,22のうち、いずれか一方(例えば、ビデオカメラ22)は、例えば、画面内を複数のマクロブロックに分割し、マクロブロック毎に、対象物までの距離を算出し、それをパラメータB3(焦点情報)に設定する。
【0049】
ここで、図6に示す撮影範囲61のうち、4つのマクロブロック62−1乃至62−4における、対象物までの距離を算出する処理について説明する。同図に示されるように、4つのマクロブロック62−1乃至62−4には、背景2であるビルと雲、および前景3である樹木が含まれている。
【0050】
その拡大図を図7に示す。すなわち、マクロブロック62−1には、背景2であるビルが含まれており、マクロブロック62−2には、背景2であるビルと雲が含まれており、マクロブロック62−3には、背景2であるビルおよび前景3である樹木が含まれており、マクロブロック62−4には、背景2であるビルと雲が含まれている。
【0051】
ビデオカメラ22は、各マクロブロックで最大の面積を有する対象物を選択し、選択された対象物までの距離を算出し、それをパラメータB3に設定する。図7の例の場合、マクロブロック62−1において、最大の面積を有する対象物はビルであり、ビルまでの距離が15mであった場合、その値がパラメータB3に設定される。また、マクロブロック62−2,62−3において、最大の面積を有する対象物は雲であり、雲までの距離は無限であるため、その値がパラメータB3に設定される。また、マクロブロック62−4において、最大の面積を有する対象物は、樹木であり、樹木までの距離が2mであった場合、その値がパラメータB3に設定される。
【0052】
以上のようにして、マクロブロック毎に対象物までの距離が算出され、それらがパラメータB3に設定される。
【0053】
上述した例では、ビデオカメラ22が、各マクロブロックにおいて、最大の面積を有する対象物までの距離をそれぞれ算出し、それらをパラメータB3に設定するようにしているが、より具体的には、左右のビデオカメラ21,22の画面の同位置におけるマクロブロック同士の差分(視差)を求め、マクロブロック内の対象物の平均距離を算出することが望ましい。
【0054】
図5の説明に戻る。ステップS3において、ステレオ符号化部23は、ステップS1の処理で撮影された撮像信号に対して、MPEG等の符号化方式によって所定の処理を施し、冗長性の少ないデータに符号化する。ステップS4において、ステレオ符号化部23は、ステップS1の処理で撮影された撮像信号に基づいて、左右の画像の差分(視差)を算出し、それをパラメータB4(差分情報)に設定する。このとき、ステレオ符号化部23は、多重化部25に、多重化のために必要な同期信号D1を供給する。
【0055】
ステップS5において、レンズ間距離発生部24は、左右のビデオカメラ21,22のレンズ間の距離を発生し、それをパラメータA1に設定する。ステップS6において、多重化部25は、ステレオ符号化部23から供給される同期信号D1に基づいて、スイッチング動作を行い、ステップS3の処理で得られた符号化データC1、ステップS2の処理で得られたパラメータB3(焦点情報)、ステップS4の処理で得られたパラメータB4(差分情報)、およびステップS5の処理で得られたパラメータA1(レンズ間の距離情報)を、所定のフォーマットに基づいて多重化する。
【0056】
ステップS7において、多重化部25は、ステップS6の処理で多重化されたデータストリームEを、所定の伝送路またはメディアを介して復号システム31に伝送する。
【0057】
このように、符号化システム11で符号化されたデータストリームには、符号化側の撮影状況に関する、パラメータA1(レンズ間の距離情報)、および、パラメータB(対象物までの距離に関する焦点情報および差分情報)の2つのパラメータが重畳されるため、復号側に対し、有益な符号化側の状況を知らせることができる。従って、復号システム31では、この2つのパラメータに基づいて、復号処理を実行することにより、最適なステレオ動画像を表示させることができる。
【0058】
次に、図8のフローチャートを参照して、復号システム31が実行するステレオ動画像の復号処理について説明する。
【0059】
ステップS21において、デマルチプレクサ41は、符号化システム11から供給されたデータストリームEを、符号化データC1、および多重パラメータA/Bに分離する。ステップS22において、復号部42は、ステップS21の処理により分離された符号化データC1に対して所定の処理を施し、ステレオ動画像に復号する。このとき、復号部42は、パラメータ分離部43に、多重パラメータA/Bを分離するために必要なタイミング信号Fを供給する。
【0060】
ステップS23において、パラメータ分離部43は、復号部42から供給されるタイミング信号Fに応じて、ステップS21の処理で分離された多重パラメータA/Bを、MPEGのGOP層、およびマクロブロック層毎に、パラメータA1(レンズ間の距離情報)、パラメータB3(焦点情報)、およびパラメータB4(差分情報)にそれぞれ分離する。
【0061】
ステップS24において、表示制御部44は、ステップS23の処理で分離された各パラメータA1,B3,B4に基づいて、ステップS22の処理で復号されたステレオ動画像に対し、所定の画像変換処理を施す。
【0062】
より具体的には、立体表示装置45のレンズ間の距離が8センチで構成されている場合(すなわち、観察者の眼球間の距離(8センチ)で自然に観察される状況である場合)、ステレオ動画像の一方あるいは両方について、生じる視差(誤差)に対し、アフィン変換を用いて補正する。
【0063】
例えば、符号化システム11から伝送されてきた、レンズ間の距離に関するパラメータA1が6センチであった場合、アフィン変換を用いて、対象物の本来撮影できていない陰面分を補間処理し、正常な視差が得られるように補正する。
【0064】
また例えば、レンズ間の距離に関するパラメータA1が30センチであった場合、立体感が強調されすぎているため、アフィン変換を用いて、強調された部分を本来観察できない陰面部とし、より自然な表示結果となるように補正する。
【0065】
また例えば、撮影時のビデオカメラ21,22の傾きにより、擬似的にレンズ間の距離が変化した場合、立体表示装置45の表示結果が最適となるように、適応的にアフィン変換を用いて、対象物の本来撮影できていない陰面分を補間処理し、観察者に安定した距離感を与えるようにする。
【0066】
なお、撮影時のビデオカメラ21,22の傾きにより、擬似的にレンズ間の距離が変化する場合において、適応的にアフィン変換を用いて、対象物の本来撮影できていない陰面分を補間処理するだけでは、必ずしも充分な表示結果とならない場合がある。そこで、このような場合、対象物内の隣接ブロックの距離が緩やかに変化することを利用して、対象物までの距離方向に対し、スムーズフィルタをかける。換言すれば、撮影時のビデオカメラ21,22の傾きにより、画面内のほぼ同距離に存在する対象物の視差がほぼ同一となることを利用して、ブロック毎にアフィン変換の量を決める際、隣接ブロック間でスムーズなつながりとなるように、アフィン変換の量をコントロールする。
【0067】
ステップS25において、立体表示装置45は、ステップS24の処理で画像変換されたステレオ動画像を表示する。
【0068】
このように、符号化システム11から伝送されてきたデータストリームには、符号化側の撮影状況に関する、パラメータA1(レンズ間の距離情報)、および、パラメータB(対象物までの距離に関する焦点情報および差分情報)の2つのパラメータが重畳されているため、復号システム31は、まず、伝送されてきたデータストリームを符号化データと多重パラメータに分離した後、さらに多重パラメータを各パラメータに分離する。これにより、復号システム31では、符号化側の撮影状況に関する各パラメータに基づいて、ステレオ動画像を画像変換し、符号化側と同じ状況でステレオ表示させることができる。
【0069】
以上においては、各マクロブロックにおいて、最大の面積を有する対象物までの距離を算出し、それをパラメータB3に設定するようにしたが、これに限らず、例えば、最短距離を有する対象物までの距離を算出し、それをパラメータB3に設定するようにしてもよい。
【0070】
また、対象物までの距離に関する情報であるパラメータBは、特殊効果の改善に利用することが可能である。すなわち、怪獣映画などの特殊撮影において、実際には2m程度の身長の怪獣を、50m以上の身長に見せるため、背景として遠景が用いられる。しかしながら、スタジオのセットでは、背景までの距離に限界があり、数メートル乃至数十メートルである。このような状況で、ステレオ動画像を符号化した場合、背景までの距離が、そのまま数メートル乃至数十メートルに知覚され、観察者は距離感を感じることができない。
【0071】
そこで、符号化側で、例えば、前景(いまの場合、怪獣)までの距離であるパラメータBが5メートルとされているものを30メートルに置き換えるとともに、背景までの距離が数メートル乃至数十メートルとされているものを無限に置き換える。これにより、復号側の表示制御部44は、ステレオ動画像に対して、距離感が強調されるようにアフィン変換の量をコントロールすることができる。その結果、立体表示装置45は、実際のステレオ動画像とは異なり、あたかも遥か彼方に怪獣が存在するかのように表示することができる。
【0072】
また、パラメータBと同様に、レンズ間の距離に関するパラメータAについても、符号化側で、実際の値とは異なるパラメータに故意に変更し、それをデータストリームに重畳して伝送して、復号側の表示制御装置44で、ステレオ動画像に所定の画像変換を行わせることができる。
【0073】
さらに、符号化側において、パラメータAおよびパラメータBを画像処理に利用することも勿論可能である。例えば、レンズ間の距離がほぼ3センチのビデオカメラ21,22を用いる場合、撮影された画像にアフィン変換処理を施し、レンズ間の距離を8センチに故意に変更することにより、符号化側での処理を容易にすることができる。
【0074】
上述した一連の処理(図5の符号化処理および図8の復号処理)は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、ネットワークや記録媒体からインストールされる。
【0075】
図9は、汎用のコンピュータの内部の構成例を示す図である。コンピュータのCPU(Central Processing Unit)101は、ROM(Read Only Memory)102に記憶されているプログラム、または記憶部108からRAM(Random Access Memory)103にロードされたプログラムに従って各種の処理を実行する。RAM103にはまた、CPU101が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0076】
CPU101、ROM102、およびRAM103は、バス104を介して相互に接続されている。このバス104にはまた、入出力インターフェース105も接続されている。
【0077】
入出力インターフェース105には、ボタン、スイッチ、キーボードあるいはマウスなどで構成される構成される入力部106、CRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)などのディスプレイ、並びにスピーカなどで構成される出力部107、ハードディスクなどで構成される記憶部108、およびモデムやターミナルアダプタなどで構成される通信部109が接続されている。通信部109は、インターネットを含むネットワークを介して通信処理を行う。
【0078】
入出力インターフェース105にはまた、必要に応じてドライブ110が接続され、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどよりなるリムーバブルメディア111が適宜装着され、そこから読み出されたコンピュータプログラムが、記憶部108にインストールされる。
【0079】
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを記録する記録媒体は、図9に示されるように、装置本体とは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD−ROM(Compact Disc−Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini−Disc)(登録商標)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア111により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM103またはハードディスクなどの記憶部108で構成される。
【0080】
なお、本明細書において、プログラム格納媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0081】
また、本明細書において、システムとは、複数の装置により構成される装置全体を表わすものである。
【0082】
【発明の効果】
以上のように、第1の本発明によれば、ステレオ動画像を符号化することが可能となる。特に、符号化側の状況をパラメータとしてデータストリームに重畳することにより、復号側に、有益な符号化側の状況を知らせることが可能となる。
【0083】
第2の本発明によれば、ステレオ動画像を復号することが可能となる。特に、符号化側と同じ状況でステレオ表示することが可能となる。
【図面の簡単な説明】
【図1】立体視の原理を説明するための図である。
【図2】本発明を適用した符号化システムの構成例を示す図である。
【図3】データストリームに多重化された各パラメータの位置を示す図である。
【図4】本発明を適用した復号システムの構成例を示す図である。
【図5】ステレオ動画像の符号化処理を説明するフローチャートである。
【図6】対象物までの距離を算出する処理を説明するための図である。
【図7】図6に示すマクロブロックの拡大図である。
【図8】ステレオ動画像の復号処理を説明するフローチャートである。
【図9】汎用のコンピュータの内部の構成例を示す図である。
【符号の説明】
11 符号化システム, 21,22 ビデオカメラ, 23 ステレオ符号化部, 24 レンズ間距離発生部, 25 多重化部, 31 復号システム, 41 デマルチプレクサ, 42 復号部, 43 パラメータ分離部, 44 表示制御部, 45 立体表示装置
【発明の属する技術分野】
本発明は、符号化装置および方法、並びに復号装置および方法に関し、特に、例えば、ステレオ動画像の符号化および復号に用いて好適な符号化装置および方法、並びに復号装置および方法に関する。
【0002】
【従来の技術】
従来、ステレオ動画像の符号化方式として、さまざまな手法が提案されている。例えば、2台のカメラを用いて左右の画像を符号化する際、一方の画像には、MPEG(Moving Picture Experts Group)等で用いられている動き補償フレーム間予測符号化方式を、他方の画像には、視差補償予測または視差成分を、それぞれアフィン(Affine)変換を用いて冗長性を除き、符号化する方式が提案されている。
【0003】
また、1つの視点の画像を基準画像と定め、その基準画像に対して動き補償を行うとともに、基準画像以外の視差画像に対して視差補償を行い、ブロック毎に補償方法を選択することにより、符号化しているものもある(特許文献1参照)。
【0004】
【特許文献1】
特開平10−191394号公報
【0005】
【発明が解決しようとする課題】
上述した特許文献1に開示されている技術によれば、平面動画像に比べて、ステレオ動画像は2倍のデータレートとなることから、左右画像の相関を利用して、冗長性を削減している。
【0006】
しかしながら、この技術では、符号化側のデータレートの削減だけが考慮されており、復号側の表示に関しては、全く考慮されていない。
【0007】
近年、符号化技術の進歩、およびプロセッサの演算速度の向上により、符号化側でデータレートを削減することが可能になっているとともに、ADSL(Asynchronous Digital Subscriber Loop)の普及、または、記録メディアの記録容量の増大により、データレートを削減することが、必ずしも重要ではなくなってきている。
【0008】
ところで、復号側のステレオ表示については、例えば、「視差(パララックス)バリア方式」を利用した裸眼立体視液晶ディスプレイが提案されている。しかしながら、このディスプレイには、立体視が可能な範囲が狭いという課題があった。
【0009】
また、符号化側の状況を復号側で正確に再現できていないため(すなわち、符号化側の状況と異なる表示を復号側で行っているため)、観察者に対し、ステレオ表示は、不安定、不自然、あるいは疲れるといった印象を与えてしまう課題があった。
【0010】
本発明はこのような状況に鑑みてなされたものであり、符号化側の状況をパラメータとしてデータストリームに重畳することにより、復号側が、符号化側と同じ状況でステレオ表示することができるようにするものである。
【0011】
【課題を解決するための手段】
本発明の符号化装置は、2つの撮像装置により対象物を撮像する撮像手段と、撮像手段により撮像された画像を符号化する符号化手段と、撮像手段により撮像された画像に基づいて、符号化時の画像に係るパラメータを算出する算出手段と、符号化手段により符号化された符号化データ、および、算出手段により算出されたパラメータを多重化する多重化手段とを備えることを特徴とする。
【0012】
前記パラメータは、2つの撮像手段の間の距離に関する情報であるものとすることができる。
【0013】
前記パラメータは、対象物までの距離に関する情報であるものとすることができる。
【0014】
前記画像は、ステレオ動画像であるものとすることができる。
【0015】
本発明の符号化方法は、2つの撮像装置により対象物を撮像する撮像ステップと、撮像ステップの処理により撮像された画像を符号化する符号化ステップと、撮像ステップの処理により撮像された画像に基づいて、符号化時の画像に係るパラメータを算出する算出ステップと、符号化ステップの処理により符号化された符号化データ、および、算出ステップの処理により算出されたパラメータを多重化する多重化ステップとを含むことを特徴とする。
【0016】
本発明の復号装置は、符号化側から伝送されてきたデータを、符号化データ、およびパラメータに分離する分離手段と、分離手段により分離された符号化データを復号する復号手段と、復号手段により復号された画像を、分離手段により分離されたパラメータに基づいて、画像変換する画像変換手段と、画像変換手段により画像変換された画像を表示する表示手段とを備えることを特徴とする。
【0017】
前記パラメータは、符号化時の画像に係るパラメータであるものとすることができる。
【0018】
前記画像は、ステレオ動画像であるものとすることができる。
【0019】
本発明の復号方法は、符号化側から伝送されてきたデータを、符号化データ、およびパラメータに分離する分離ステップと、分離ステップの処理により分離された符号化データを復号する復号ステップと、復号ステップの処理により復号された画像を、分離ステップの処理により分離されたパラメータに基づいて、画像変換する画像変換ステップと、画像変換ステップの処理により画像変換された画像の表示を制御する表示制御ステップとを含むことを特徴とする。
【0020】
第1の本発明においては、2つの撮像装置により対象物が撮像され、撮像された画像が符号化され、撮像された画像に基づいて、符号化時の画像に係るパラメータが算出され、符号化データおよびパラメータが多重化される。
【0021】
第2の本発明においては、符号化側から伝送されてきたデータが、符号化データおよびパラメータに分離され、分離された符号化データが復号され、復号された画像が、分離されたパラメータに基づいて画像変換され、表示される。
【0022】
【発明の実施の形態】
以下、図を参照して、本発明の実施の形態について説明する。
【0023】
図1は、観察者1が、対象物である背景2および前景3を観察した場合における立体視の原理を説明するための図である。ここで、観察者1の眼球間の距離をA1とし、観察者1から背景2までの距離をB1とし、観察者1から前景3までの距離をB2とする。同図に示されるように、観察者1から背景2までの距離B1と前景3までの距離B2では、視差が異なり、この視差が観察者1に対し、距離間を与え、立体視を可能にしている。
【0024】
通常、眼球間の距離A1は、個人差があるものの、ほぼ7乃至8センチとされている。一方、ステレオ・ビデオカメラにおける2組のレンズ間の距離は、7乃至8センチに限定されるものではない。従って、本実施の形態においては、レンズ間の距離、あるいは、レンズ間の距離と初期値(例えば、8センチ)との差をパラメータA1とする。同様に、対象物(背景2および前景3)までの距離、あるいは、対象物までの距離と初期値との差をパラメータBとする。
【0025】
図2は、本発明を適用した符号化システム11の構成例を示す図である。
【0026】
左右のビデオカメラ21,22は、対象物である図1に示した前景3をそれぞれ同時に撮像し、撮像された画像を電気信号(撮像信号)に変換し、ステレオ符号化部23に出力する。
【0027】
また左右のビデオカメラ21,22のうち、いずれか一方(図2の例の場合、ビデオカメラ22)は、例えば、画面内を複数の領域(後述するマクロブロック)に分割し、分割された領域毎に、各領域内における最大の面積を有する対象物(前景3)までの距離を算出するか、あるいは、前景(最短距離にある対象物)までの距離を算出し、それを焦点情報B3(以下、必要に応じてパラメータB3と記載する)として多重化部25に出力する。
【0028】
なお、多くの場合、前景(最短距離にある対象物)までの距離が重要であり、背景(最長距離、または測定不可能な無限にある対象物)までの距離は、焦点が合致しないため、鮮明に表示させなくても大した問題とはならない。
【0029】
ステレオ符号化部23は、左右のビデオカメラ21,22から入力された撮像信号に対して、一方の撮像信号を、通常のMPEG(Moving Picture Experts Group)2またはMPEG4等の符号化方式によって所定の処理を施し、冗長性の少ないデータに符号化する。これに対し、他方の撮像信号は、前記一方の撮像信号との誤差分として、例えば、差分符号化、またはアフィン符号化などにより冗長性が削減され、符号化データとされる。これら両者のデータにおいて、主符号化データとしては、前記一方の符号化データが用いられ、副符号化データとしては、前記他方の符号化データが、いわゆるエンハンスドデータとして用いられ、符号化データC1として多重化部25に出力される。
【0030】
この多重化により、主符号化データは、通常のMPEG符号化データとして扱うことができ、復号側が従来の平面表示装置である場合、従来のMPEG復号装置をそのまま使用することができる。
【0031】
またステレオ符号化部23は、左右のビデオカメラ21,22から入力された撮像信号に基づいて、左右の画像の差分(視差)を算出し、それを差分情報B4(以下、必要に応じてパラメータB4と記載する)として多重化部25に出力する。ここでステレオ符号化部23は、対象物を特定することなく、マクロブロック毎に左右の画像を比較して、誤差(視差)の大きさを距離に換算し、それをパラメータB4に設定するか、あるいは、左右の画像を合成し、マクロブロック毎に距離を算出し、それをパラメータB4に設定する。
【0032】
さらにステレオ符号化部23は、多重化のための同期信号D1を多重化部25に出力する。
【0033】
レンズ間距離発生部24は、左右のビデオカメラ21,22のレンズ間の距離を発生し、それを多重化部25に出力する。具体的には、レンズ間距離発生部24は、予め左右のビデオカメラ21,22のレンズ間の距離が固定されている場合、その固定値をパラメータA1として出力し、レンズ間の距離が固定されていない場合、その撮影時のレンズ間の距離をパラメータA1として出力する。
【0034】
なお、レンズ間の距離は、レンズの中心からの垂直軸間の距離で表わされるため、仮にレンズ間の距離が固定されていたとしても、ビデオカメラ21,22が左右に傾いた場合には、擬似的にレンズ間の距離が変更されてしまう。すなわち、ビデオカメラ21,22が傾くと、擬似的に変更されてしまったレンズ間の距離に基づいて、ステレオ動画像が形成されてしまうが、復号側の立体表示装置45(図4)では、そのカメラの傾きを想定していない。
【0035】
例えば、ビデオカメラ21,22が傾くことにより、7乃至8センチに設定されていたレンズ間の距離が、擬似的に5乃至6センチに変更されてしまう。この状態で形成されたステレオ動画像を復号側の立体表示装置45で表示させた場合、画面が傾くだけでなく、視差の変化により距離が変動し、観察者に対し、不快感を生じさせる。付言すれば、画面が傾くこと、およびレンズ間の距離が変動することが相乗効果となって、観察者に対し、より不快感を与えることになる。
【0036】
そこで、本実施の形態においては、左右のビデオカメラ21,22が傾いた場合、傾きによるレンズ間の距離の変化を、パラメータA1とする。従って、レンズ間距離発生部24は、例えば、船や航空機などに搭載されている電子傾き計(ジャイロ)を含むことにより、左右のビデオカメラ21,22の傾きを検出するとともに、その傾きによるレンズ間の距離の擬似的変化をパラメータA1として発生する。
【0037】
多重化部25は、ステレオ符号化部23から供給される同期信号D1に基づいて、スイッチング動作を行い、ビデオカメラ22から入力されたパラメータB3(焦点情報)、ステレオ符号化部23から入力された符号化データC1およびパラメータB4(差分情報)、レンズ間距離発生部24から入力されたパラメータA1(レンズ間の距離情報)を、所定のフォーマットに基づいて多重化する。
【0038】
例えば、ステレオ符号化部23からのシーケンス、GOP(Group of Pictures)、あるいはマクロブロックなどのヘッダタイミングに応じて、MPEGの符号化データC1に、パラメータA1,B3,B4が多重化される。そして、多重化されたデータストリームEは、所定の伝送路またはメディア(いずれも図示せず)を介して復号システム31(図4)に伝送される。
【0039】
ここで、図3を参照して、MPEGのビットストリーム(データストリーム)に多重化された各パラメータの位置について説明する。
【0040】
同図に示されるように、MPEGのビットストリームは、GOP層、ピクチャ層、および複数のマクロブロック層で構成されている。レンズ間の距離に関するパラメータA1は、GOP層、またはピクチャ層に1つ設けられ、対象物までの距離に関するパラメータB(パラメータB3,B4)は、マクロブロック毎に設けられる。
【0041】
すなわち、レンズ間の距離の変化は、最短でも1画面内でしか発生しないのに対し、1画面中に含まれる対象物は、様々な距離を有しており(厳密には、画素毎に対象物の距離が異なり)、パラメータBについては、マクロブロック毎に設けられる。
【0042】
図4は、本発明を適用した復号システム31の構成例を示す図である。
【0043】
デマルチプレクサ41は、所定の伝送路またはメディアを介して、符号化システム11(図2)から供給されたデータストリームEを、符号化データC1、および、多重化されたパラメータA/B(以下、多重パラメータA/Bと記載する)に分離する。分離された符号化データC1は、復号部42に出力され、多重パラメータA/Bは、パラメータ分離部43に出力される。
【0044】
復号部42は、デマルチプレクサ41から入力された符号化データC1に対して所定の処理を施し、ステレオ動画像に復号するとともに、分離のためのタイミング信号Fをパラメータ分離部43に供給する。パラメータ分離部43は、復号部42から供給されるタイミング信号Fに応じて、デマルチプレクサ41から入力された多重パラメータA/Bを、MPEGのGOP層、およびマクロブロック層毎に、パラメータA1,B3,B4にそれぞれ分離する。分離されたパラメータA1,B3,B4は、表示制御部44にそれぞれ出力される。
【0045】
表示制御部44は、パラメータ分離部43から供給されたパラメータA1(レンズ間の距離情報)および、パラメータB3,B4(対象物までの距離情報)に基づいて、復号部42で復号されたステレオ動画像に対し、所定の画像変換処理を施す。立体表示装置45は、表示制御部44で画像変換されたステレオ動画像を表示する。
【0046】
次に、図5のフローチャートを参照して、符号化システム11が実行するステレオ動画像の符号化処理について説明する。
【0047】
ステップS1において、左右のビデオカメラ21,22は、例えば、図6に示されるように、撮影範囲61内に存在する対象物をそれぞれ同時に撮影する。図6の例の場合、撮影される対象物には、背景2および前景3が存在する。
【0048】
ステップS2において、左右のビデオカメラ21,22のうち、いずれか一方(例えば、ビデオカメラ22)は、例えば、画面内を複数のマクロブロックに分割し、マクロブロック毎に、対象物までの距離を算出し、それをパラメータB3(焦点情報)に設定する。
【0049】
ここで、図6に示す撮影範囲61のうち、4つのマクロブロック62−1乃至62−4における、対象物までの距離を算出する処理について説明する。同図に示されるように、4つのマクロブロック62−1乃至62−4には、背景2であるビルと雲、および前景3である樹木が含まれている。
【0050】
その拡大図を図7に示す。すなわち、マクロブロック62−1には、背景2であるビルが含まれており、マクロブロック62−2には、背景2であるビルと雲が含まれており、マクロブロック62−3には、背景2であるビルおよび前景3である樹木が含まれており、マクロブロック62−4には、背景2であるビルと雲が含まれている。
【0051】
ビデオカメラ22は、各マクロブロックで最大の面積を有する対象物を選択し、選択された対象物までの距離を算出し、それをパラメータB3に設定する。図7の例の場合、マクロブロック62−1において、最大の面積を有する対象物はビルであり、ビルまでの距離が15mであった場合、その値がパラメータB3に設定される。また、マクロブロック62−2,62−3において、最大の面積を有する対象物は雲であり、雲までの距離は無限であるため、その値がパラメータB3に設定される。また、マクロブロック62−4において、最大の面積を有する対象物は、樹木であり、樹木までの距離が2mであった場合、その値がパラメータB3に設定される。
【0052】
以上のようにして、マクロブロック毎に対象物までの距離が算出され、それらがパラメータB3に設定される。
【0053】
上述した例では、ビデオカメラ22が、各マクロブロックにおいて、最大の面積を有する対象物までの距離をそれぞれ算出し、それらをパラメータB3に設定するようにしているが、より具体的には、左右のビデオカメラ21,22の画面の同位置におけるマクロブロック同士の差分(視差)を求め、マクロブロック内の対象物の平均距離を算出することが望ましい。
【0054】
図5の説明に戻る。ステップS3において、ステレオ符号化部23は、ステップS1の処理で撮影された撮像信号に対して、MPEG等の符号化方式によって所定の処理を施し、冗長性の少ないデータに符号化する。ステップS4において、ステレオ符号化部23は、ステップS1の処理で撮影された撮像信号に基づいて、左右の画像の差分(視差)を算出し、それをパラメータB4(差分情報)に設定する。このとき、ステレオ符号化部23は、多重化部25に、多重化のために必要な同期信号D1を供給する。
【0055】
ステップS5において、レンズ間距離発生部24は、左右のビデオカメラ21,22のレンズ間の距離を発生し、それをパラメータA1に設定する。ステップS6において、多重化部25は、ステレオ符号化部23から供給される同期信号D1に基づいて、スイッチング動作を行い、ステップS3の処理で得られた符号化データC1、ステップS2の処理で得られたパラメータB3(焦点情報)、ステップS4の処理で得られたパラメータB4(差分情報)、およびステップS5の処理で得られたパラメータA1(レンズ間の距離情報)を、所定のフォーマットに基づいて多重化する。
【0056】
ステップS7において、多重化部25は、ステップS6の処理で多重化されたデータストリームEを、所定の伝送路またはメディアを介して復号システム31に伝送する。
【0057】
このように、符号化システム11で符号化されたデータストリームには、符号化側の撮影状況に関する、パラメータA1(レンズ間の距離情報)、および、パラメータB(対象物までの距離に関する焦点情報および差分情報)の2つのパラメータが重畳されるため、復号側に対し、有益な符号化側の状況を知らせることができる。従って、復号システム31では、この2つのパラメータに基づいて、復号処理を実行することにより、最適なステレオ動画像を表示させることができる。
【0058】
次に、図8のフローチャートを参照して、復号システム31が実行するステレオ動画像の復号処理について説明する。
【0059】
ステップS21において、デマルチプレクサ41は、符号化システム11から供給されたデータストリームEを、符号化データC1、および多重パラメータA/Bに分離する。ステップS22において、復号部42は、ステップS21の処理により分離された符号化データC1に対して所定の処理を施し、ステレオ動画像に復号する。このとき、復号部42は、パラメータ分離部43に、多重パラメータA/Bを分離するために必要なタイミング信号Fを供給する。
【0060】
ステップS23において、パラメータ分離部43は、復号部42から供給されるタイミング信号Fに応じて、ステップS21の処理で分離された多重パラメータA/Bを、MPEGのGOP層、およびマクロブロック層毎に、パラメータA1(レンズ間の距離情報)、パラメータB3(焦点情報)、およびパラメータB4(差分情報)にそれぞれ分離する。
【0061】
ステップS24において、表示制御部44は、ステップS23の処理で分離された各パラメータA1,B3,B4に基づいて、ステップS22の処理で復号されたステレオ動画像に対し、所定の画像変換処理を施す。
【0062】
より具体的には、立体表示装置45のレンズ間の距離が8センチで構成されている場合(すなわち、観察者の眼球間の距離(8センチ)で自然に観察される状況である場合)、ステレオ動画像の一方あるいは両方について、生じる視差(誤差)に対し、アフィン変換を用いて補正する。
【0063】
例えば、符号化システム11から伝送されてきた、レンズ間の距離に関するパラメータA1が6センチであった場合、アフィン変換を用いて、対象物の本来撮影できていない陰面分を補間処理し、正常な視差が得られるように補正する。
【0064】
また例えば、レンズ間の距離に関するパラメータA1が30センチであった場合、立体感が強調されすぎているため、アフィン変換を用いて、強調された部分を本来観察できない陰面部とし、より自然な表示結果となるように補正する。
【0065】
また例えば、撮影時のビデオカメラ21,22の傾きにより、擬似的にレンズ間の距離が変化した場合、立体表示装置45の表示結果が最適となるように、適応的にアフィン変換を用いて、対象物の本来撮影できていない陰面分を補間処理し、観察者に安定した距離感を与えるようにする。
【0066】
なお、撮影時のビデオカメラ21,22の傾きにより、擬似的にレンズ間の距離が変化する場合において、適応的にアフィン変換を用いて、対象物の本来撮影できていない陰面分を補間処理するだけでは、必ずしも充分な表示結果とならない場合がある。そこで、このような場合、対象物内の隣接ブロックの距離が緩やかに変化することを利用して、対象物までの距離方向に対し、スムーズフィルタをかける。換言すれば、撮影時のビデオカメラ21,22の傾きにより、画面内のほぼ同距離に存在する対象物の視差がほぼ同一となることを利用して、ブロック毎にアフィン変換の量を決める際、隣接ブロック間でスムーズなつながりとなるように、アフィン変換の量をコントロールする。
【0067】
ステップS25において、立体表示装置45は、ステップS24の処理で画像変換されたステレオ動画像を表示する。
【0068】
このように、符号化システム11から伝送されてきたデータストリームには、符号化側の撮影状況に関する、パラメータA1(レンズ間の距離情報)、および、パラメータB(対象物までの距離に関する焦点情報および差分情報)の2つのパラメータが重畳されているため、復号システム31は、まず、伝送されてきたデータストリームを符号化データと多重パラメータに分離した後、さらに多重パラメータを各パラメータに分離する。これにより、復号システム31では、符号化側の撮影状況に関する各パラメータに基づいて、ステレオ動画像を画像変換し、符号化側と同じ状況でステレオ表示させることができる。
【0069】
以上においては、各マクロブロックにおいて、最大の面積を有する対象物までの距離を算出し、それをパラメータB3に設定するようにしたが、これに限らず、例えば、最短距離を有する対象物までの距離を算出し、それをパラメータB3に設定するようにしてもよい。
【0070】
また、対象物までの距離に関する情報であるパラメータBは、特殊効果の改善に利用することが可能である。すなわち、怪獣映画などの特殊撮影において、実際には2m程度の身長の怪獣を、50m以上の身長に見せるため、背景として遠景が用いられる。しかしながら、スタジオのセットでは、背景までの距離に限界があり、数メートル乃至数十メートルである。このような状況で、ステレオ動画像を符号化した場合、背景までの距離が、そのまま数メートル乃至数十メートルに知覚され、観察者は距離感を感じることができない。
【0071】
そこで、符号化側で、例えば、前景(いまの場合、怪獣)までの距離であるパラメータBが5メートルとされているものを30メートルに置き換えるとともに、背景までの距離が数メートル乃至数十メートルとされているものを無限に置き換える。これにより、復号側の表示制御部44は、ステレオ動画像に対して、距離感が強調されるようにアフィン変換の量をコントロールすることができる。その結果、立体表示装置45は、実際のステレオ動画像とは異なり、あたかも遥か彼方に怪獣が存在するかのように表示することができる。
【0072】
また、パラメータBと同様に、レンズ間の距離に関するパラメータAについても、符号化側で、実際の値とは異なるパラメータに故意に変更し、それをデータストリームに重畳して伝送して、復号側の表示制御装置44で、ステレオ動画像に所定の画像変換を行わせることができる。
【0073】
さらに、符号化側において、パラメータAおよびパラメータBを画像処理に利用することも勿論可能である。例えば、レンズ間の距離がほぼ3センチのビデオカメラ21,22を用いる場合、撮影された画像にアフィン変換処理を施し、レンズ間の距離を8センチに故意に変更することにより、符号化側での処理を容易にすることができる。
【0074】
上述した一連の処理(図5の符号化処理および図8の復号処理)は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、ネットワークや記録媒体からインストールされる。
【0075】
図9は、汎用のコンピュータの内部の構成例を示す図である。コンピュータのCPU(Central Processing Unit)101は、ROM(Read Only Memory)102に記憶されているプログラム、または記憶部108からRAM(Random Access Memory)103にロードされたプログラムに従って各種の処理を実行する。RAM103にはまた、CPU101が各種の処理を実行する上において必要なデータなども適宜記憶される。
【0076】
CPU101、ROM102、およびRAM103は、バス104を介して相互に接続されている。このバス104にはまた、入出力インターフェース105も接続されている。
【0077】
入出力インターフェース105には、ボタン、スイッチ、キーボードあるいはマウスなどで構成される構成される入力部106、CRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)などのディスプレイ、並びにスピーカなどで構成される出力部107、ハードディスクなどで構成される記憶部108、およびモデムやターミナルアダプタなどで構成される通信部109が接続されている。通信部109は、インターネットを含むネットワークを介して通信処理を行う。
【0078】
入出力インターフェース105にはまた、必要に応じてドライブ110が接続され、磁気ディスク、光ディスク、光磁気ディスク、あるいは半導体メモリなどよりなるリムーバブルメディア111が適宜装着され、そこから読み出されたコンピュータプログラムが、記憶部108にインストールされる。
【0079】
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを記録する記録媒体は、図9に示されるように、装置本体とは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD−ROM(Compact Disc−Read Only Memory)、DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini−Disc)(登録商標)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア111により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM103またはハードディスクなどの記憶部108で構成される。
【0080】
なお、本明細書において、プログラム格納媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0081】
また、本明細書において、システムとは、複数の装置により構成される装置全体を表わすものである。
【0082】
【発明の効果】
以上のように、第1の本発明によれば、ステレオ動画像を符号化することが可能となる。特に、符号化側の状況をパラメータとしてデータストリームに重畳することにより、復号側に、有益な符号化側の状況を知らせることが可能となる。
【0083】
第2の本発明によれば、ステレオ動画像を復号することが可能となる。特に、符号化側と同じ状況でステレオ表示することが可能となる。
【図面の簡単な説明】
【図1】立体視の原理を説明するための図である。
【図2】本発明を適用した符号化システムの構成例を示す図である。
【図3】データストリームに多重化された各パラメータの位置を示す図である。
【図4】本発明を適用した復号システムの構成例を示す図である。
【図5】ステレオ動画像の符号化処理を説明するフローチャートである。
【図6】対象物までの距離を算出する処理を説明するための図である。
【図7】図6に示すマクロブロックの拡大図である。
【図8】ステレオ動画像の復号処理を説明するフローチャートである。
【図9】汎用のコンピュータの内部の構成例を示す図である。
【符号の説明】
11 符号化システム, 21,22 ビデオカメラ, 23 ステレオ符号化部, 24 レンズ間距離発生部, 25 多重化部, 31 復号システム, 41 デマルチプレクサ, 42 復号部, 43 パラメータ分離部, 44 表示制御部, 45 立体表示装置
Claims (9)
- 2つの撮像装置により対象物を撮像する撮像手段と、
前記撮像手段により撮像された画像を符号化する符号化手段と、
前記撮像手段により撮像された画像に基づいて、符号化時の前記画像に係るパラメータを算出する算出手段と、
前記符号化手段により符号化された符号化データ、および、前記算出手段により算出された前記パラメータを多重化する多重化手段と
を備えることを特徴とする符号化装置。 - 前記パラメータは、前記2つの撮像手段の間の距離に関する情報である
ことを特徴とする請求項1に記載の符号化装置。 - 前記パラメータは、前記対象物までの距離に関する情報である
ことを特徴とする請求項1に記載の符号化装置。 - 前記画像は、ステレオ動画像である
ことを特徴とする請求項1に記載の符号化装置。 - 2つの撮像装置により対象物を撮像する撮像ステップと、
前記撮像ステップの処理により撮像された画像を符号化する符号化ステップと、
前記撮像ステップの処理により撮像された画像に基づいて、符号化時の前記画像に係るパラメータを算出する算出ステップと、
前記符号化ステップの処理により符号化された符号化データ、および、前記算出ステップの処理により算出された前記パラメータを多重化する多重化ステップと
を含むことを特徴とする符号化方法。 - 符号化側から伝送されてきたデータを、符号化データ、およびパラメータに分離する分離手段と、
前記分離手段により分離された前記符号化データを復号する復号手段と、
前記復号手段により復号された画像を、前記分離手段により分離された前記パラメータに基づいて、画像変換する画像変換手段と、
前記画像変換手段により画像変換された画像を表示する表示手段と
を備えることを特徴とする復号装置。 - 前記パラメータは、符号化時の前記画像に係るパラメータである
ことを特徴とする請求項6に記載の復号装置。 - 前記画像は、ステレオ動画像である
ことを特徴とする請求項6に記載の復号装置。 - 符号化側から伝送されてきたデータを、符号化データ、およびパラメータに分離する分離ステップと、
前記分離ステップの処理により分離された前記符号化データを復号する復号ステップと、
前記復号ステップの処理により復号された画像を、前記分離ステップの処理により分離された前記パラメータに基づいて、画像変換する画像変換ステップと、
前記画像変換ステップの処理により画像変換された画像の表示を制御する表示制御ステップと
を含むことを特徴とする復号方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003028353A JP2004242000A (ja) | 2003-02-05 | 2003-02-05 | 符号化装置および方法、並びに復号装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003028353A JP2004242000A (ja) | 2003-02-05 | 2003-02-05 | 符号化装置および方法、並びに復号装置および方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004242000A true JP2004242000A (ja) | 2004-08-26 |
Family
ID=32955844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003028353A Withdrawn JP2004242000A (ja) | 2003-02-05 | 2003-02-05 | 符号化装置および方法、並びに復号装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004242000A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7544919B2 (en) | 2006-11-20 | 2009-06-09 | Red.Com, Inc. | Focus assist system and method |
JP2009296272A (ja) * | 2008-06-04 | 2009-12-17 | Sony Corp | 画像符号化装置及び画像符号化方法 |
JP2011010128A (ja) * | 2009-06-26 | 2011-01-13 | Canon Inc | 再生装置、撮像装置、及びその制御方法 |
US8106939B2 (en) | 2005-11-02 | 2012-01-31 | Sony Corporation | Image processing method, image processing device and image display apparatus employing the image processing device |
-
2003
- 2003-02-05 JP JP2003028353A patent/JP2004242000A/ja not_active Withdrawn
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8106939B2 (en) | 2005-11-02 | 2012-01-31 | Sony Corporation | Image processing method, image processing device and image display apparatus employing the image processing device |
US7544919B2 (en) | 2006-11-20 | 2009-06-09 | Red.Com, Inc. | Focus assist system and method |
JP2009296272A (ja) * | 2008-06-04 | 2009-12-17 | Sony Corp | 画像符号化装置及び画像符号化方法 |
JP4591548B2 (ja) * | 2008-06-04 | 2010-12-01 | ソニー株式会社 | 画像符号化装置及び画像符号化方法 |
US8369630B2 (en) | 2008-06-04 | 2013-02-05 | Sony Corporation | Image encoding device and image encoding method with distance information |
JP2011010128A (ja) * | 2009-06-26 | 2011-01-13 | Canon Inc | 再生装置、撮像装置、及びその制御方法 |
US8836760B2 (en) | 2009-06-26 | 2014-09-16 | Canon Kabushiki Kaisha | Image reproducing apparatus, image capturing apparatus, and control method therefor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10523915B2 (en) | Stereoscopic video and audio recording method, stereoscopic video and audio reproducing method, stereoscopic video and audio recording apparatus, stereoscopic video and audio reproducing apparatus, and stereoscopic video and audio recording medium | |
US7027659B1 (en) | Method and apparatus for generating video images | |
JP5763184B2 (ja) | 3次元画像に対する視差の算出 | |
US8345751B2 (en) | Method and system for encoding a 3D video signal, enclosed 3D video signal, method and system for decoder for a 3D video signal | |
JP2004274125A (ja) | 画像処理装置および方法 | |
US9219911B2 (en) | Image processing apparatus, image processing method, and program | |
US20090190662A1 (en) | Method and apparatus for encoding and decoding multiview video | |
KR100375708B1 (ko) | 3차원 입체영상을 위한 다시점 비디오 시스템 및영상제조방법 | |
US8836758B2 (en) | Three-dimensional image processing apparatus and method of controlling the same | |
US20100002764A1 (en) | Method For Encoding An Extended-Channel Video Data Subset Of A Stereoscopic Video Data Set, And A Stereo Video Encoding Apparatus For Implementing The Same | |
JP2011109671A (ja) | 三次元オブジェクトの分割に基づく背景画像の最適圧縮(acbi) | |
JP5304714B2 (ja) | 擬似立体画像生成装置及びカメラ | |
KR20070040645A (ko) | 3d 입체 영상 처리 장치 및 방법 | |
JP2006191357A (ja) | 再生装置および再生プログラム | |
US8750382B2 (en) | System and method for calculating 3Deeps action specs motion estimation from the motion vectors in an MPEG file | |
KR20140041489A (ko) | 스테레오스코픽 이미지의 동시적인 스테레오스코픽 및 모노스코픽 디스플레이를 가능하게 하기 위한 스테레오스코픽 이미지의 자동 컨버전 | |
WO2012029615A1 (ja) | 画像処理装置および画像処理方法 | |
JP2006140618A (ja) | 3次元映像情報記録装置及びプログラム | |
JP4657258B2 (ja) | 立体画像表示装置およびその方法 | |
JP3733359B2 (ja) | 視差推定方法、画像伝送方法、画像表示方法、多視点画像伝送方法、多視点画像復元方法および視差推定装置 | |
JP2012034215A (ja) | 画像処理装置および方法、並びにプログラム | |
JP4173684B2 (ja) | 立体画像作成装置 | |
JP2004242000A (ja) | 符号化装置および方法、並びに復号装置および方法 | |
JP4815004B2 (ja) | 多視点画像符号化装置 | |
JP2008034893A (ja) | 多視点画像復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060509 |