JP2011024003A - 立体動画記録方法および装置、動画ファイル変換方法および装置 - Google Patents
立体動画記録方法および装置、動画ファイル変換方法および装置 Download PDFInfo
- Publication number
- JP2011024003A JP2011024003A JP2009167708A JP2009167708A JP2011024003A JP 2011024003 A JP2011024003 A JP 2011024003A JP 2009167708 A JP2009167708 A JP 2009167708A JP 2009167708 A JP2009167708 A JP 2009167708A JP 2011024003 A JP2011024003 A JP 2011024003A
- Authority
- JP
- Japan
- Prior art keywords
- image
- moving image
- parallax amount
- compression
- main subject
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/189—Recording image signals; Reproducing recorded image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/204—Image signal generators using stereoscopic image cameras
- H04N13/239—Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Processing Or Creating Images (AREA)
Abstract
【課題】立体動画の良好な表示画質、立体動画を構成する各視点の画像間の正確な視差量の算出、および確実な表示同期性を実現する。
【解決手段】視差量算出部46は、同じタイミングで撮像された左右画像GL、GRに映る同一の主要被写体の視差量を算出する。メディアコントローラ41は、同じタイミングで撮像された左右画像GL、GRを圧縮伸張処理部40でJPEG圧縮したデータ、および視差量算出部46で算出した視差量の情報を一まとまりのブロックとする動画ファイルをメモリカード19に記録する。
【選択図】図6
【解決手段】視差量算出部46は、同じタイミングで撮像された左右画像GL、GRに映る同一の主要被写体の視差量を算出する。メディアコントローラ41は、同じタイミングで撮像された左右画像GL、GRを圧縮伸張処理部40でJPEG圧縮したデータ、および視差量算出部46で算出した視差量の情報を一まとまりのブロックとする動画ファイルをメモリカード19に記録する。
【選択図】図6
Description
本発明は、立体動画記録方法および装置、動画ファイル変換方法および装置に関する。
多視点、例えば二視点で動画撮影した左右画像を用いて立体動画を表示する技術が知られている。従来、立体動画の記録方式としては、左右画像を一水平走査毎に交互に合成し、合成した画像をMPEG形式で圧縮するもの(特許文献1参照)や、1GOP以上のフレーム数のフレーム群が左右交互に配置されるように、左右画像をMPEG形式で圧縮して一つのファイルにインターリーブ記録するもの(特許文献2参照)が提案されている。この他にも、モーションJPEG形式で左右画像を別々のファイルに圧縮し、タイムスタンプで左右画像の表示時の同期をとるものがある。
特許文献1、2で採用しているMPEG圧縮は、動き予測によるフレーム相関演算でいわゆるB、Pフレームを生成するが、B、Pフレームの立体動画を静止画表示すると、圧縮歪みが目立ち立体表示に支障を来す。
また、従来、立体動画の観察者の視覚疲労を軽減するため、左右画像に映る主要被写体(例えば人物の顔や画像中央にある被写体)間の視差量(画素ずれ量)を求め、立体動画を表示する際に主要被写体の視差量をゼロにする補正を行っているが、MPEG圧縮を採用した場合はフレーム相関演算をする必要があるため、さらに視差量の算出をすると処理が煩雑になるうえ、B、Pフレームの視差量は正確さに欠ける。
他方、モーションJPEG形式で左右画像を別々のファイルに圧縮する場合は、タイムスタンプの厳密な正確性が求められる。タイムスタンプが少しでもずれると、まともな立体動画を表示することができなくなる。
本発明は、上記背景を鑑みてなされたものであり、その目的は、立体動画の良好な表示画質、立体動画を構成する各視点の画像間の正確な視差量の算出、および確実な表示同期性を実現することにある。
上記目的を達成するために、本発明の立体動画記録方法は、立体動画を構成する多視点の画像のうち、同じタイミングで撮像された各視点の画像に映る同一の主要被写体の視差量を算出する視差量算出ステップと、動画を構成する各画像が独立に圧縮される静止画用圧縮形式で画像を圧縮する第一圧縮ステップと、同じタイミングで撮像された各視点の画像を前記第一圧縮ステップで圧縮したデータ、および前記視差量算出ステップで算出した視差量の情報を一まとまりのブロックとする動画ファイルを記録媒体に記録する記録ステップとを備えることを特徴とする。
前記視差量算出ステップでは、同じタイミングで撮像された各視点の画像に映る同一の主要被写体を検出する主要被写体検出ステップと、各視点の画像のうちの一つから、検出した同一の主要被写体の特徴点を抽出する特徴点抽出ステップと、特徴点を抽出した画像以外の各視点の画像から、抽出した特徴点に対応する対応点を検出する対応点検出ステップと、特徴点と対応点の画素位置の差分を演算する演算ステップとを実行する。視差量の情報は、演算ステップの演算結果、またはその正負を逆にした値である。
前記主要被写体検出ステップでは、主要被写体として人物の顔を検出する。また、前記特徴点抽出ステップおよび前記対応点検出ステップでは、特徴点および対応点として黒目部分を抽出および検出する。
前記第一圧縮ステップでは、JPEG形式で画像を圧縮することが好ましい。
本発明の動画ファイル変換方法は、請求項1ないし5のいずれかに記載の立体動画記録方法で記録した動画ファイルを伸張する伸張ステップと、各ブロックの視差量の情報を元に、同じタイミングで撮像された各視点の画像に映る同一の主要被写体の視差量がゼロとなるように、前記伸張ステップで伸張した画像を補正する補正ステップと、前記補正ステップで補正した画像を、各画像間の相関情報を元に連続的に圧縮する動画用圧縮形式で圧縮する第二圧縮ステップとを備えることを特徴とする。
前記第二圧縮ステップでは、MPEG形式で画像を圧縮することが好ましい。
本発明の立体動画記録装置は、立体動画を構成する多視点の画像のうち、同じタイミングで撮像された各視点の画像に映る同一の主要被写体の視差量を算出する視差量算出手段と、動画を構成する各画像が独立に圧縮される静止画用圧縮形式で画像を圧縮する第一圧縮手段と、同じタイミングで撮像された各視点の画像を前記第一圧縮手段で圧縮したデータ、および前記視差量算出手段で算出した視差量の情報を一まとまりのブロックとする動画ファイルを記録媒体に記録する記録制御手段とを備えることを特徴とする。
本発明の動画ファイル変換装置は、請求項8に記載の立体動画記録装置で記録した動画ファイルを伸張する伸張手段と、各ブロックの視差量の情報を元に、同じタイミングで撮像された各視点の画像に映る同一の主要被写体の視差量がゼロとなるように、前記伸張手段で伸張した画像を補正する補正手段と、前記補正手段で補正した画像を、各画像間の相関情報を元に連続的に圧縮する動画用圧縮形式で圧縮する第二圧縮手段とを備えることを特徴とする。
本発明によれば、立体動画を構成する多視点の画像のうち、同じタイミングで撮像された各視点の画像を静止画用圧縮形式で圧縮したデータ、および各視点の画像に映る主要被写体の視差量の情報を一まとまりのブロックとする動画ファイルを記録するので、立体動画の良好な表示画質、立体動画を構成する各視点の画像間の正確な視差量の算出、および確実な表示同期性を実現することができる。
図1および図2において、複眼カメラ2は、異なる二視点で被写体を撮影して立体画像を供する装置であり、略直方体形状のカメラ本体10を有する。カメラ本体10の前面には、二組の撮像レンズ11L、11R、ストロボ発光部12、およびファインダ対物窓13が配されている。
撮像レンズ11L、11Rは、主レンズ、ズームレンズ、フォーカスレンズ等の各種レンズ群からなる。撮像レンズ11L、11Rは、カメラ本体10の前面の中心に関して略対称な左右の位置にある。カメラ本体10の長さ方向に関する撮像レンズ11L、11Rの間隔(基線長)は例えば60mmであり、撮像レンズ11L、11Rの光軸同士の交叉角度(輻輳角)は例えば1.5°である。
カメラ本体10の上面には、電源スイッチ14およびレリーズボタン15が設けられている。レリーズボタン15は、二段階押しのスイッチである。静止画撮影モードのとき、電子ビューファインダまたはLCD16による被写体のフレーミングの後に、レリーズボタン15が軽く押圧(半押し)されると、露出条件の決定(AE)、自動焦点調整(AF)などの各種撮影準備処理が施される。この状態でレリーズボタン15がもう一度強く押圧(全押し)されると、決定された露出条件の下で一回の撮影が行われる。動画撮影モードでは、レリーズボタン15の全押しに伴って動画撮影が開始され、再度の全押しにより終了される。また、このとき、マイクロホン(図示せず)により周囲の音声が収録される。
カメラ本体10の背面には、LCD16、ファインダ接眼窓17、および操作部18が設けられている。LCD16は、メモリカード19から読み出した画像やスルー画像、各種メニュー画面を表示する。LCD16の前面には、立体視用のレンチキュラーレンズ(図示せず)が取り付けられている。ファインダ接眼窓17は、ファインダ対物窓13とともに電子ビューファインダを構成する。
操作部18は、撮影/再生モード切替スイッチ20、送り、戻しボタン21、22、ズーム操作ボタン23、通常/立体撮影モード切替ボタン24、メニュー選択/決定/消去ボタン25で構成される。撮影/再生モード切替スイッチ20がスライド操作されると、撮影した画像をLCD16に表示する再生モード、静止画撮影モード、および動画撮影モードが選択的に切り替わる。ズーム操作ボタン23は、撮像レンズ11L、11Rのズームレンズをワイド側、テレ側に変倍する際に操作される。通常/立体撮影モード切替ボタン24が押圧操作されると、撮像レンズ11L、11Rのうちの一方(例えば撮像レンズ11L)を通した撮影(通常撮影)と両方を通した撮影(立体撮影)にモードが切り替わる。
カメラ本体10の底面には、開閉可能な蓋(図示せず)が設けられている。蓋を開けると、メモリカード19やバッテリ(図示せず)が着脱可能に装填されるスロット(図示せず)が露呈する。
図3において、撮像レンズ11L、11Rの背後には、絞り30L、30Rが設けられている。これら撮像レンズ11L、11Rと絞り30L、30Rとで光学系31L、31Rを構成している。光学系31L、31Rには、駆動部32L、32Rが接続されている。駆動部32L、32Rはステッピングモータであり、ズーム操作ボタン23の操作に連動して、撮像レンズ11L、11Rのズームレンズをワイド側、あるいはテレ側に移動させる。また、駆動部32L、32Rは、測光・測距部33L、33Rの制御の下、撮像レンズ11L、11Rのフォーカスレンズを光軸に沿って移動させて合焦位置に停止させたり、絞り30L、30Rを開閉動作させて絞り径を調整する。
光学系31L、31Rの背後には、CCD34L、34Rが配置されている。CCD34L、34Rは、例えばインターライントランスファ型で、プログレッシブスキャンに対応した読み出し方式のCCDイメージセンサからなる。CCD34L、34Rは、光学系31L、31Rを経由した被写体の像光が、撮像面に入射するように配置されている。CCD34L、34Rの撮像面には、複数の色セグメントからなるカラーフィルタ、例えば、ベイヤー配列の原色カラーフィルタが形成されている。
アナログ信号処理部35L、35Rは、相関二重サンプリング回路(以下、CDSと略す)、自動ゲイン制御回路(以下、AGCと略す)、およびアナログ/デジタル変換器(以下、A/Dと略す)から構成されている。CDSは、CCD34L、34Rから出力される撮像信号に対して相関二重サンプリング処理を施し、CCD34L、34Rで生じるリセット雑音およびアンプ雑音の除去を行う。AGCは、CDSによりノイズ除去が行われた撮像信号を所定のゲイン(増幅率)で増幅する。A/Dは、AGCにより増幅された撮像信号を、所定のビット数のデジタル信号に変換する。
A/Dでデジタル化された撮像信号(画像)は、画像処理部(図示せず)でホワイトバランス補正やγ補正等の各種処理を施される。その後、バス36を介してワークメモリであるSDRAM37に入力され、SDRAM37に一旦格納される。
タイミングジェネレータ(TG)38L、38Rは、CCD34L、34Rの駆動パルス(垂直/水平走査パルス、電子シャッタパルス、読み出しパルス、リセットパルス等)とアナログ信号処理部35L、35R用の同期パルスとを発生する。CCD34L、34Rは、TG38L、38Rからの駆動パルスに応じて撮像動作を行い、一定のフレームレートで撮像信号を出力する。アナログ信号処理部35L、35Rの各部は、TG38L、38Rからの同期パルスに基づいて動作する。
YC変換処理部39は、SDRAM37から画像を読み出し、画像に対して、RGBの信号を輝度信号Yと色差信号Cr、Cbとに変換するYC変換を施す。圧縮伸張処理部40は、YC変換された画像に対して、JPEG形式で画像圧縮を施す。圧縮された画像は、メディアコントローラ41を経由してメモリカード19に記録される。また、メモリカード19に記録された画像は、メディアコントローラ41を経てSDRAM37に一旦格納され、圧縮伸張処理部40に読み出されて、圧縮される前の画像に伸張される。なお、煩雑を避けるため図示はしないが、SDRAM37、YC変換処理部39、および圧縮伸張処理部40は、CCD34L、34R等と同様に二台用意されている。
通常/立体撮影モード切替ボタン24で通常撮影モードが選択された場合、CCD34L、34R等の各部のうちの片方(例えばCCD34L等の各部)が駆動する。立体撮影モードが選択された場合は両方が駆動し、立体画像用の左右画像GL、GR(図7参照)を同時に出力する。
LCDドライバ42は、YC変換処理部39でYC変換された画像をアナログのコンポジット信号に変換し、これをLCD16にスルー画像として表示する。また、LCDドライバ42は、圧縮伸張処理部40で伸張された画像を、LCD16に再生画像として表示する。
立体撮影モードのとき、あるいは立体撮影モードで撮影された画像を再生するとき、LCDドライバ42は、左右画像GL、GRを一ライン毎交互にストライプ状に並べた画像をLCD16に出力する。LCD16の前面に配されたレンチキュラーレンズによって、左画像GLを観察者の左目に、右画像GRを右目にそれぞれ映すことで、立体画像を表示することができる。
CPU43は、制御バス(図示せず)を介して複眼カメラ2の各部に制御信号を送信するとともに、各部からの応答信号を受信して、各部の動作を統括的に制御する。CPU43には、レリーズボタン15、操作部18の他、各種制御用のプログラムや設定情報などが記録されたEEPROM44がバス36を介して接続されている。CPU43は、レリーズボタン15からの操作入力信号を受けて、レリーズボタン15の半押し、全押しに伴う処理を各部に実行させ、操作部18から入力される操作入力信号に応じて各部を動作させる。また、CPU43は、各種プログラムや情報をEEPROM44から内蔵RAMに読み出して、処理を実行する。
測光・測距部33L、33Rは、被写体の輝度、および被写体までの距離を検出し、この検出結果から露出量、ホワイトバランス補正量、および焦点距離を決定する。
測光・測距部33L、33Rは、スルー画像の表示中は所定のサイクルで作動している。スルー画像の表示中は、測光・測距部33L、33Rで決定された露出量に応じて駆動部32L、32Rが動作され、絞り30L、30Rの絞り径が制御される。絞り径のみで適正な露出量にすることができない場合はCCD34L、34Rの電荷蓄積時間が制御される。
測光・測距部33L、33Rは、レリーズボタン15が半押しされたときに輝度および距離の検出を開始し、検出結果をCPU43に逐次送信する。CPU43は、測光・測距部33L、33Rからの検出結果に基づいて、撮像レンズ11L、11R、絞り30L、30R、CCD34L、34R、およびストロボ制御部45の動作を制御する。
視差量算出部46は、立体撮影モードのときのみ駆動する。視差量算出部46は、YC変換前の左画像GLおよび右画像GRをSDRAM37から読み出し、両画像GL、GRに映る同一の主要被写体の特徴点の視差量を算出する。図4において、視差量算出部46は、主要被写体検出回路50と、特徴点抽出回路51と、対応点検出回路52と、演算回路53とから構成される。
主要被写体検出回路50は、左画像GLから主要被写体として人物の顔を検出する。顔の検出は、例えば、画像の各画素から肌色の候補となる画素を抽出し、抽出した画素の集合から画像内の肌色部分を求める。そして、求めた肌色部分と予め用意された顔型のテンプレートとを周知のパターン認識技術を用いて照合し、この照合結果を元に肌色部分が顔であるか否かを判定する。あるいは、肌色部分の面積が予め設定された閾値以上であった場合に、その肌色部分を顔として抽出する。もしくは、周知のパターン認識技術を用いて、目や口などの顔の特定部分を抽出することで行う。
左画像GL内に複数の人物がいる場合、主要被写体検出回路50は、例えば最も至近側に映っている人物の顔、面積が最も大きい人物の顔、あるいは画像中央に映っている人物の顔を主要被写体とする。また、左画像GLに人物の顔が検出されない場合、主要被写体検出回路50は、画像中央領域に映るものを主要被写体とする。
特徴点抽出回路51は、主要被写体検出回路50の検出結果に基づき、主要被写体とされた人物の顔から、特徴点として片方の目(この場合は右目)の黒目部分EL(図7参照)を抽出する。黒目部分ELの抽出は、主要被写体検出回路50の場合と同様、周知のパターン認識技術を用いる。
対応点検出回路52は、特徴点抽出回路51の抽出結果に応じて、左画像GL内の黒目部分ELに対応する右画像GR内の黒目部分ER(図7参照)を検出する。対応点の検出には、例えば、ブロックマッチング方式、KLT−Tracker方式等を用い、特徴点と最も相関の高い部分を対応点とする。特徴点抽出回路51および対応点検出回路52は、左右画像GL、GR内の黒目部分EL、ERの画素位置をそれぞれ演算回路53に出力する。画素位置には、例えば画像の左下隅を原点(0、0)とし、水平方向をX軸、垂直方向をY軸とするXY座標を使用する。画素が例えば1068×768ピクセルであった場合、右上隅の画素の座標は(1067、767)である。
特徴点および対応点としては、上記の黒目部分に限らず、画素値の変化が特徴的な点、例えば水平および垂直方向で画素値変化がある角や端点であればよい。また、特徴点および対応点は複数であってもよい。こうした特徴点の抽出には、例えば、Harrisの手法、Moravecの手法、Shi−Tomasiの手法等があり、これらのいずれを用いてもよい。左画像GLに人物の顔が検出されない場合は、画像中央領域の被写体の特徴点を上記の手法により抽出する。
演算回路53は、左画像GLを基準として、特徴点抽出回路51および対応点検出回路52からの黒目部分EL、ERのXY座標の差分ΔX、ΔY(単位:画素)を演算する。ΔXは主に撮像レンズ11L、11Rがカメラ本体10の長さ方向に間隔を開けて配置されていることに起因する視差量であり、ΔYは主に撮像レンズ11L、11Rの光軸の垂直方向のずれに起因する視差量である。なお、左画像GLと同じく右画像GRも主要被写体検出回路50と特徴点抽出回路51に入力し、主要被写体と特徴点を求めてもよい。また、画像の平行移動、回転、拡大縮小、台形歪み等を幾何補正する射影変換やアフィン変換に関わる係数を求め、これを視差量として出力してもよい。
図5および図6を参照して、動画撮影モードにおけるメモリカード19への画像の記録方式を説明する。図5は、動画撮影モード且つ通常撮影モードの場合の、圧縮伸張処理部40にてモーションJPEG形式で圧縮された動画のファイル構造である。図6は、動画撮影モード且つ立体撮影モードの場合のファイル構造である。
ファイルは、ヘッダ領域と画像領域とに大別される。ヘッダ領域には、ストリーム情報と撮影情報とが書き込まれる。画像領域は、動画を構成するフレーム数分のチャンク(ブロックに相当)を有し、一つのチャンクは一つ(図5)または三つ(図6)のストリームで構成される。各ストリームには、ストリームIDを先頭に、チャンク内データ長(チャンク内における画像のデータ長)、および一フレーム分の画像(正確には画像を圧縮したデータ)が書き込まれる。
ストリーム情報は、各ストリームにどのような情報が書き込まれているかを示すものであり、さらにストリーム定義とストリーム属性とに分れる。ストリーム定義は、各ストリームが何を書き込むものかを示し、画像の種類、画像の再生時間、データ量/チャンク(1チャンクあたりの再生時のデータ量)、先頭アドレス(メモリカード19内における画像の各フレームの先頭アドレス)等が記述される。ストリーム属性には、ストリームID、解像度、圧縮方式、表示次元、フレーム数/チャンクが記述される。撮影情報には、視点数、輻輳角、および基線長が記述される。
図5において、画像領域の各チャンクは一つのストリーム(ストリーム1)からなる。各ストリームには、一フレーム分の左画像GLが書き込まれる。左画像GLは、第一フレームを先頭に最後の第nフレームまで順次記録される。マイクロホンで収録された音声は、各フレーム間にインターリーブ記録される(図示せず)。
ストリーム定義は、ストリーム1のみが用意され、画像の種類として2D(二次元)、左画像が記述される。ストリーム属性は、ストリームID=1、圧縮方式=JPEG、表示次元=2D、フレーム数/チャンク=1等が記述される。撮影情報の視点数には1が記述され、輻輳角、基線長は無効である。なお、静止画撮影モード且つ通常撮影モードの場合は、チャンク1のみが記録された形となる。
図6において、画像領域の各チャンクはストリーム1、2、3の三つのストリームからなる。ストリーム1には一フレーム分の左画像GL、ストリーム2には右画像GRがそれぞれ書き込まれる。左右画像GL、GRは、第一フレームを先頭に最後の第nフレームまで順次記録される。マイクロホンで収録された音声は、一定の間隔(例えば数チャンク毎)でストリーム2とストリーム3の間の別のストリーム(図示せず)に記録される。
ストリーム3には、ストリーム1、2の左右画像GL、GRの補正情報が書き込まれる。補正情報は、視差量算出部46の演算回路53から出力された視差量ΔX、ΔYの正負を逆にした値であり、右画像GRを水平、垂直の各方向に何画素分ずらせば、左右画像GL、GRの特徴点と対応点を一致させることができるかを示す。補正情報として視差量ΔX、ΔYそのものを記録してもよい。
より詳しくは図7に示すように、左右画像GL、GRを単に重ね合わせた補正前の立体画像では、視差量ΔX、ΔYがともに0の場合は除いて、左右画像GL、GRの特徴点と対応点である黒目部分が一致しない。この不一致を補正情報に基づいて補正することで、下段に示すように、左右画像GL、GRの特徴点と対応点を一致させることができる。
この左右画像GL、GRの特徴点と対応点を一致させる補正は、立体画像を表示する際にLCDドライバ42にて行われる。これにより、左右画像GL、GRの特徴点と対応点を基準として、その他の部分が手前に迫り出す、または奥に引っ込んで見えるような立体画像が鑑賞される。
ストリーム1、2のストリーム定義には、画像の種類として3D(立体)、左画像または右画像が記述される。ストリーム属性は、ストリームID=1、2、または3、圧縮方式=JPEG、表示次元=3D、フレーム数/チャンク=2である。撮影情報は、視点数=2、輻輳角=1.5°、基線長=60mmである。なお、静止画撮影モード且つ立体撮影モードの場合は、チャンク1のみが記録された形となる。
図5に示すファイル構造は、従来のモーションJPEG形式で圧縮された一視点の動画のファイル構造と同じである。一方、図6に示すファイル構造は、左右画像GL、GRの各フレームと、これらの補正情報を一つのチャンクにインターリーブして記録している。
次に、上記構成を有する複眼カメラ2の動作について説明する。複眼カメラ2で撮影を行う際には、電源スイッチ14を操作して複眼カメラ2の電源を投入する。そして、撮影/再生モード切替スイッチ20を操作して静止画撮影モードまたは動画撮影モードを選択する。以下では、通常/立体撮影モード切替ボタン24で立体撮影モードが選択されたときを説明する。通常撮影モードが選択されたときは、CCD34L等のみが駆動する他は基本的に同じである。
光学系31L、31Rを介して入射した被写体像は、CCD34L、34Rの撮像面に結像され、これによりCCD34L、34Rから撮像信号が出力される。CCD34L、34Rから出力された撮像信号は、アナログ信号処理部35L、35Rで相関二重サンプリング、増幅、およびA/D変換される。
アナログ信号処理部35L、35Rを経て生成された画像は、バス36を介してSDRAM37に入力され、SDRAM37に一旦格納される。SDRAM37に格納された画像は、YC変換処理部39で簡易YC変換が施された後、LCDドライバ42でコンポジット信号に変換され、LCD16にスルー画像として表示される。
スルー画像の表示中にレリーズボタン15が半押しされると、測光・測距部33L、33Rで被写体の輝度および被写体までの距離が検出され、露出量、ホワイトバランス補正量、および焦点距離が決定される。そして、この結果に基づいてCPU43により撮像レンズ11L、11R、絞り30L、30R、およびCCD34L、34Rの動作が制御され、撮影準備処理が施される。
レリーズボタン15の全押しにより撮影が実行されると、決定された露出量に基づいて撮影が行われ、そのときSDRAM37に記録されていたYC変換処理後の画像が圧縮伸張処理部40で圧縮され、メディアコントローラ41によってメモリカード19に記憶される。
動画撮影モードでは、レリーズボタン15が再度全押しされるまで、一定のフレームレート(例えば30フレーム/秒)で順次画像が生成・記憶される。また、これと同時にマイクロホンを通して周囲の音声が収録される。
図8において、動画撮影モード且つ立体撮影モードが選択されて(S10)、レリーズボタン15の全押しにより動画撮影が開始されると(S11)、視差量算出部46が駆動し、YC変換前の左画像GLおよび右画像GRがSDRAM37から視差量算出部46に読み出される。そして、両画像GL、GRに映る同一の主要被写体の特徴点の視差量が算出される(S12)。
具体的には図9に示すように、主要被写体検出回路50で左画像GLから人物の顔が検出される(S20)。次いで、特徴点抽出回路51で左画像GL内の人物の顔の黒目部分ELが抽出され(S21)、さらに対応点検出回路52で、左画像GL内の黒目部分ELに対応する右画像GR内の黒目部分ERが検出される(S22)。最後に、演算回路53によって各黒目部分EL、ERのXY座標の差分ΔX、ΔYが演算され、これが視差量としてメディアコントローラ41に出力される(S23)。
図8に戻って、視差量算出後、左右画像GL、GRはYC変換処理部39でYC変換され、圧縮伸張処理部40にてモーションJPEG形式で圧縮される(S13)。圧縮された左右画像GL、GRは、メディアコントローラ41に入力される。
メディアコントローラ41は、図6に示すファイル構造をメモリカード19内に構築し、ヘッダ領域にストリーム情報と撮影情報を書き込むとともに、画像領域の各チャンクのストリーム1に左画像GLを、ストリーム2に右画像GRを、視差量算出部46からの視差量に基づいた補正情報をストリーム3にそれぞれインターリーブ記録する(S14)。これら一連の処理は、動画撮影が終了するまで(S15でYES)繰り返し実行される。こうした処理を実行することで、メモリカード19には、左右画像GL、GRと補正情報が一まとまりとなったチャンクがフレーム数分順に並んだ動画ファイルが記録される。
立体撮影モードで記録した動画ファイルを再生する際には、各チャンクの補正情報に基づいて、LCDドライバ42が左右画像GL、GRの特徴点と対応点が一致するように補正を行いつつ、各チャンクの左右画像GL、GRをLCD16に順に表示させる。
MPEG形式のような動き予測によるフレーム相関演算で生成されるいわゆるB、Pフレームがないため、画質が良いクリアな立体画像を鑑賞することができる。同一フレームの左右画像GL、GRが一つのチャンクに収まっているので、左右画像GL、GRの表示タイミングがずれることがない。また、MPEG形式では比較的データの信憑性が低いB、Pフレームに対して正確な補正情報を求めることはできないが、本例では圧縮による毀損がない左右画像GL、GRを元に正確な補正情報を求めることができる。
図10において、動画記録再生装置60は、メモリカード19から入出力I/F61経由でストレージ62に動画ファイルを取り込み、これをMPEG形式に変換したうえで、記録制御部63でDVD、BDといった記録メディア64に録画する、表示制御部65で立体表示機能をもつディスプレイ66に表示する、あるいは入出力I/F61を介してネットワークに配信する。
CPU67は、動画記録再生装置60の各部を統括的に制御する。CPU67と各部はバス68により相互接続されている。CPU67は、操作部69からの操作信号に基づき、メモリ70から読み出した各種プログラムやデータを逐次実行し、各部を動作させる。
画像処理部71は、ストレージ62から動画ファイルを読み出し、CPU67の指令の下、動画ファイルに対して図11に示す各種変換処理を実行する。画像処理部71は、まず動画ファイルをJPEG形式で伸張する(S30)。そして、動画ファイルが図6に示すもので補正情報がある場合は、複眼カメラ2のLCDドライバ42と同様、補正情報に基づいて左右画像GL、GRの特徴点と対応点が一致するように、各フレームの右画像GRを補正する(S31)。動画ファイルが図5に示すもので補正情報がない場合は、当然ながら補正は行わない。
その後、CPU67より指定されたデータレート(1秒あたりの再生フレーム数)で、MPEG形式で再度圧縮を施す(S32)。この際のMPEG圧縮には、従来の方式を利用することが可能である。
最後に、元の動画ファイルのストリーム情報と撮影情報をMPEG形式で再圧縮した動画ファイルのヘッダ領域に書き込む(S33)。こうしてモーションJPEG形式からMPEG形式に動画ファイルを変換する。
画像処理部71により変換されたMPEG形式の動画ファイルは、図12に示すファイル構造をもつ。この動画ファイルは、図5および図6に示すモーションJPEG形式の動画ファイルと同様の構造である。ヘッダ領域に記述される各種情報は、モーションJPEG形式の動画ファイルのそれを書き換えて移植したものである。
画像領域は複数のチャンク(GOP)を有している。図6の場合と同様にストリーム1、2に左右フレームが交互に配され、一つのチャンクに一対の左右フレームが四組、計8フレーム収まっている。1チャンクあたりのI、B、Pフレームの内訳は、I、Pフレームが左右併せて1、Bフレームが左右併せて2である。なお、B、Pフレームに該当する第二、第三フレーム等は、動き予測によるフレーム相関演算により生成されたものであり、図6に示す第二、第三フレーム等とは別物である。
動画記録再生装置60は、画像処理部71で変換したMPEG形式の動画ファイルを用いて、上述の録画、立体表示、あるいはネットワーク配信を行う。モーションJPEG形式の動画ファイルを図6のようなMPEG形式の動画ファイルに似た構造とすることで、動画ファイルの変換をスムーズに行うことができる。また、補正情報に応じた補正処理を行った後にMPEG形式に変換するので、従来正確な補正が不可能だったB、Pフレームに対しても高精度な補正を施すことができる。B、Pフレームは従来同様多少画質が劣化するが、本例のように高精度な補正を施すことができれば、画質劣化を補うことができる。
なお、ここでは、S30〜S33の各種処理を画像処理部71がソフトウェア的に実行する例を挙げたが、S30〜S33の各種処理を実行するハードウェアをそれぞれ用意してもよい。同様に、複眼カメラ2の視差量算出部46の機能をソフトウェアで賄ってもよい。各種処理をソフトウェアで実行する場合は、各種処理の機能をハードウェアとしてもたない既存の機器のソフトウェアを更新するだけでよいので、利便性が高まる。
上記実施形態では、静止画用圧縮形式としてJPEG形式、動画用圧縮形式としてMPEG形式をそれぞれ例示したが、GIF形式やH.246等の他の形式を採用してもよい。
上記実施形態では、視点を左右の二つとしているが、視点は二以上であってもよい。この場合も上記実施形態と同様に、多視点で得られた各画像と補正情報とを一つのチャンクにまとめて収め、動画ファイルを構成する。
上記実施形態では、複眼カメラの各撮像レンズの基線長、輻輳角を固定としたが、これらを変更可能な構造として、センサや操作入力等で基線長、輻輳角を検出し、撮影情報に反映させてもよい。
2 複眼カメラ
19 メモリカード
34L、34R CCD
40 圧縮伸張処理部
41 メディアコントローラ
43 CPU
46 視差量算出部
50 主要被写体検出回路
51 特徴点抽出回路
52 対応点検出回路
53 演算回路
60 動画記録再生装置
67 CPU
71 画像処理部
19 メモリカード
34L、34R CCD
40 圧縮伸張処理部
41 メディアコントローラ
43 CPU
46 視差量算出部
50 主要被写体検出回路
51 特徴点抽出回路
52 対応点検出回路
53 演算回路
60 動画記録再生装置
67 CPU
71 画像処理部
Claims (9)
- 立体動画を構成する多視点の画像のうち、同じタイミングで撮像された各視点の画像に映る同一の主要被写体の視差量を算出する視差量算出ステップと、
動画を構成する各画像が独立に圧縮される静止画用圧縮形式で画像を圧縮する第一圧縮ステップと、
同じタイミングで撮像された各視点の画像を前記第一圧縮ステップで圧縮したデータ、および前記視差量算出ステップで算出した視差量の情報を一まとまりのブロックとする動画ファイルを記録媒体に記録する記録ステップとを備えることを特徴とする立体動画記録方法。 - 前記視差量算出ステップでは、同じタイミングで撮像された各視点の画像に映る同一の主要被写体を検出する主要被写体検出ステップと、
各視点の画像のうちの一つから、検出した同一の主要被写体の特徴点を抽出する特徴点抽出ステップと、
特徴点を抽出した画像以外の各視点の画像から、抽出した特徴点に対応する対応点を検出する対応点検出ステップと、
特徴点と対応点の画素位置の差分を演算する演算ステップとを実行することを特徴とする請求項1に記載の立体動画記録方法。 - 前記主要被写体検出ステップでは、主要被写体として人物の顔を検出することを特徴とする請求項2に記載の立体動画記録方法。
- 前記特徴点抽出ステップおよび前記対応点検出ステップでは、特徴点および対応点として黒目部分を抽出および検出することを特徴とする請求項3に記載の立体動画記録方法。
- 前記第一圧縮ステップでは、JPEG形式で画像を圧縮することを特徴とする請求項1ないし4のいずれかに記載の立体動画記録方法。
- 請求項1ないし5のいずれかに記載の立体動画記録方法で記録した動画ファイルを伸張する伸張ステップと、
各ブロックの視差量の情報を元に、同じタイミングで撮像された各視点の画像に映る同一の主要被写体の視差量がゼロとなるように、前記伸張ステップで伸張した画像を補正する補正ステップと、
前記補正ステップで補正した画像を、各画像間の相関情報を元に連続的に圧縮する動画用圧縮形式で圧縮する第二圧縮ステップとを備えることを特徴とする動画ファイル変換方法。 - 前記第二圧縮ステップでは、MPEG形式で画像を圧縮することを特徴とする請求項6に記載の動画ファイル変換方法。
- 立体動画を構成する多視点の画像のうち、同じタイミングで撮像された各視点の画像に映る同一の主要被写体の視差量を算出する視差量算出手段と、
動画を構成する各画像が独立に圧縮される静止画用圧縮形式で画像を圧縮する第一圧縮手段と、
同じタイミングで撮像された各視点の画像を前記第一圧縮手段で圧縮したデータ、および前記視差量算出手段で算出した視差量の情報を一まとまりのブロックとする動画ファイルを記録媒体に記録する記録制御手段とを備えることを特徴とする立体動画記録装置。 - 請求項8に記載の立体動画記録装置で記録した動画ファイルを伸張する伸張手段と、
各ブロックの視差量の情報を元に、同じタイミングで撮像された各視点の画像に映る同一の主要被写体の視差量がゼロとなるように、前記伸張手段で伸張した画像を補正する補正手段と、
前記補正手段で補正した画像を、各画像間の相関情報を元に連続的に圧縮する動画用圧縮形式で圧縮する第二圧縮手段とを備えることを特徴とする動画ファイル変換装置。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009167708A JP2011024003A (ja) | 2009-07-16 | 2009-07-16 | 立体動画記録方法および装置、動画ファイル変換方法および装置 |
| US12/829,607 US20110012991A1 (en) | 2009-07-16 | 2010-07-02 | Moving image recording method and apparatus, and moving image coding method and moving image coder |
| EP20100251204 EP2278819A3 (en) | 2009-07-16 | 2010-07-05 | Moving image recording method and apparatus, and moving image coding method and moving image coder |
| CN201010232980XA CN101959042A (zh) | 2009-07-16 | 2010-07-16 | 移动图像记录方法和装置、移动图像编码方法和移动图像编码器 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009167708A JP2011024003A (ja) | 2009-07-16 | 2009-07-16 | 立体動画記録方法および装置、動画ファイル変換方法および装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2011024003A true JP2011024003A (ja) | 2011-02-03 |
Family
ID=42937343
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009167708A Abandoned JP2011024003A (ja) | 2009-07-16 | 2009-07-16 | 立体動画記録方法および装置、動画ファイル変換方法および装置 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US20110012991A1 (ja) |
| EP (1) | EP2278819A3 (ja) |
| JP (1) | JP2011024003A (ja) |
| CN (1) | CN101959042A (ja) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8610757B2 (en) * | 2009-08-24 | 2013-12-17 | Next3D, Inc. | Stereoscopic video encoding and decoding methods and apparatus |
| CN102822886B (zh) * | 2010-04-05 | 2015-11-25 | 夏普株式会社 | 立体图像显示装置、显示系统、驱动方法、驱动装置、显示控制方法和显示控制装置 |
| JP2012182786A (ja) * | 2011-02-08 | 2012-09-20 | Jvc Kenwood Corp | 3d画像撮影装置 |
| JP5412692B2 (ja) * | 2011-10-04 | 2014-02-12 | 株式会社モルフォ | 画像処理装置、画像処理方法、画像処理プログラム及び記録媒体 |
| JP6049333B2 (ja) * | 2011-10-14 | 2016-12-21 | キヤノン株式会社 | 焦点検出装置及び焦点検出装置の制御方法 |
| JP6039301B2 (ja) * | 2012-08-09 | 2016-12-07 | キヤノン株式会社 | 撮像装置、撮像システム、撮像装置の制御方法、プログラム、および、記憶媒体 |
| US9818040B2 (en) | 2013-06-20 | 2017-11-14 | Thomson Licensing | Method and device for detecting an object |
| KR20160032137A (ko) * | 2013-07-15 | 2016-03-23 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 특징 기반 영상 집합 압축 |
| US9638791B2 (en) * | 2015-06-25 | 2017-05-02 | Qualcomm Incorporated | Methods and apparatus for performing exposure estimation using a time-of-flight sensor |
| CN114764944A (zh) * | 2020-12-30 | 2022-07-19 | 中国科学院长春光学精密机械与物理研究所 | 基于角点检测的瞳孔定位方法及装置 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH089421A (ja) * | 1994-06-20 | 1996-01-12 | Sanyo Electric Co Ltd | 立体映像装置 |
| JP2003032687A (ja) * | 2001-07-17 | 2003-01-31 | Monolith Co Ltd | 画像処理方法および装置 |
| JP2004274091A (ja) * | 2003-01-15 | 2004-09-30 | Sharp Corp | 画像データ作成装置、画像データ再生装置、画像データ記録方式および画像データ記録媒体 |
| JP2005073049A (ja) * | 2003-08-26 | 2005-03-17 | Sharp Corp | 立体映像再生装置および立体映像再生方法 |
| JP2009129420A (ja) * | 2007-11-28 | 2009-06-11 | Fujifilm Corp | 画像処理装置および方法並びにプログラム |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0870475A (ja) | 1994-06-23 | 1996-03-12 | Sanyo Electric Co Ltd | 立体動画像の符号化・復号化方法及び装置 |
| US5767898A (en) * | 1994-06-23 | 1998-06-16 | Sanyo Electric Co., Ltd. | Three-dimensional image coding by merger of left and right images |
| TW436777B (en) * | 1995-09-29 | 2001-05-28 | Matsushita Electric Industrial Co Ltd | A method and an apparatus for reproducing bitstream having non-sequential system clock data seamlessly therebetween |
| CN1286327C (zh) | 1996-02-28 | 2006-11-22 | 松下电器产业株式会社 | 光盘重放装置及光盘记录装置 |
| CN100350420C (zh) * | 2002-01-16 | 2007-11-21 | 虹膜技术公司 | 利用立体人脸识别的虹膜识别系统和方法 |
| US7715595B2 (en) * | 2002-01-16 | 2010-05-11 | Iritech, Inc. | System and method for iris identification using stereoscopic face recognition |
| AU2003231510A1 (en) * | 2002-04-25 | 2003-11-10 | Sharp Kabushiki Kaisha | Image data creation device, image data reproduction device, and image data recording medium |
| JP4638783B2 (ja) * | 2005-07-19 | 2011-02-23 | オリンパスイメージング株式会社 | 3d画像ファイルの生成装置、撮像装置、画像再生装置、画像加工装置、及び3d画像ファイルの生成方法 |
| JP4406937B2 (ja) * | 2006-12-01 | 2010-02-03 | 富士フイルム株式会社 | 撮影装置 |
| JP4403172B2 (ja) * | 2006-12-22 | 2010-01-20 | 富士フイルム株式会社 | ファイル生成方法および装置並びに立体画像の表示制御方法および装置 |
| JP5144237B2 (ja) * | 2007-12-05 | 2013-02-13 | キヤノン株式会社 | 画像処理装置、その制御方法、プログラム |
-
2009
- 2009-07-16 JP JP2009167708A patent/JP2011024003A/ja not_active Abandoned
-
2010
- 2010-07-02 US US12/829,607 patent/US20110012991A1/en not_active Abandoned
- 2010-07-05 EP EP20100251204 patent/EP2278819A3/en not_active Withdrawn
- 2010-07-16 CN CN201010232980XA patent/CN101959042A/zh active Pending
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH089421A (ja) * | 1994-06-20 | 1996-01-12 | Sanyo Electric Co Ltd | 立体映像装置 |
| JP2003032687A (ja) * | 2001-07-17 | 2003-01-31 | Monolith Co Ltd | 画像処理方法および装置 |
| JP2004274091A (ja) * | 2003-01-15 | 2004-09-30 | Sharp Corp | 画像データ作成装置、画像データ再生装置、画像データ記録方式および画像データ記録媒体 |
| JP2005073049A (ja) * | 2003-08-26 | 2005-03-17 | Sharp Corp | 立体映像再生装置および立体映像再生方法 |
| JP2009129420A (ja) * | 2007-11-28 | 2009-06-11 | Fujifilm Corp | 画像処理装置および方法並びにプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| EP2278819A3 (en) | 2012-05-16 |
| CN101959042A (zh) | 2011-01-26 |
| US20110012991A1 (en) | 2011-01-20 |
| EP2278819A2 (en) | 2011-01-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8384802B2 (en) | Image generating apparatus and image regenerating apparatus | |
| JP5249149B2 (ja) | 立体画像記録装置及び方法、立体画像出力装置及び方法、並びに立体画像記録出力システム | |
| CN103493484B (zh) | 成像装置和成像方法 | |
| US8363091B2 (en) | Stereoscopic image pick-up apparatus | |
| JP4897940B2 (ja) | 立体撮像装置 | |
| US9077976B2 (en) | Single-eye stereoscopic image capturing device | |
| JP2011024003A (ja) | 立体動画記録方法および装置、動画ファイル変換方法および装置 | |
| US20110018970A1 (en) | Compound-eye imaging apparatus | |
| US8284294B2 (en) | Compound-eye image pickup apparatus | |
| JP4763827B2 (ja) | 立体画像表示装置、複眼撮像装置及び立体画像表示プログラム | |
| CN102972032A (zh) | 三维图像显示装置、三维图像显示方法、三维图像显示程序及记录介质 | |
| CN102860017B (zh) | 立体摄像装置及其制造方法 | |
| US20110050856A1 (en) | Stereoscopic imaging apparatus | |
| JP5231771B2 (ja) | 立体画像撮影装置 | |
| JP2008294530A (ja) | 撮像装置、画像再生装置、撮像方法、画像再生方法及びプログラム | |
| CN103329549A (zh) | 立体视频处理器、立体视频处理程序及其记录介质、立体成像装置和立体视频处理方法 | |
| JP2010200024A (ja) | 立体画像表示装置および立体画像表示方法 | |
| JP5307189B2 (ja) | 立体画像表示装置、複眼撮像装置及び立体画像表示プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111208 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120921 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121010 |
|
| A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20121120 |