JP2008048374A - ビデオカメラ装置 - Google Patents

ビデオカメラ装置 Download PDF

Info

Publication number
JP2008048374A
JP2008048374A JP2006279811A JP2006279811A JP2008048374A JP 2008048374 A JP2008048374 A JP 2008048374A JP 2006279811 A JP2006279811 A JP 2006279811A JP 2006279811 A JP2006279811 A JP 2006279811A JP 2008048374 A JP2008048374 A JP 2008048374A
Authority
JP
Japan
Prior art keywords
image
sound
signal
subject
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006279811A
Other languages
English (en)
Inventor
Yoshio Ezure
美穂 江連
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2006279811A priority Critical patent/JP2008048374A/ja
Publication of JP2008048374A publication Critical patent/JP2008048374A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Abstract

【課題】 花火の開花から遅延して到着する炸裂音と開花画像とを同期した花火の映像信号として記録、再生出来るようにしたビデオカメラ装置を実現する
【解決手段】 撮影する被写体の大きさを設定する操作設定部31、32と、レンズのズーム倍率を検出するズーム比検出部33と、操作設定部で設定された被写体の大きさとズーム比検出部で検出されたズーム倍率との関係から被写体までの距離を求め、その距離により生じる音声の遅延時間を算出する遅延時間算出部34、35と、被写体を撮影して得られる画像信号を記憶する画像記憶部24と、記憶された画像信号を、遅延時間算出部で求められた遅延時間だけ遅延した遅延画像信号として読みだす画像読出し部25と、音声信号と遅延画像信号とを記録媒体に記録する記録部27とを備えて構成した。
【選択図】 図1

Description

本発明は、撮影して得られる動画信号及びその動画信号に付随する音声信号を媒体に記録して再生するビデオカメラ装置に関する。
最近になり、画像信号及び画像信号に付随する音声信号を符号化して媒体に記録する所謂DV(Digital Video)も製品化されるようになってきた。ディジタル化された画像信号や音声信号は記録媒体の非直線性歪の影響を受けることなく、高画質、高音質の信号として媒体に記録できる。
一方、ビデオカメラ装置に搭載される撮像用レンズのズーム特性も高品質化され、光学10倍ズームはもとより光学20倍以上の鮮明な拡大画像の撮像も可能である。遠方にある被写体をすぐ近くにある被写体として撮影できる。
ところで、光速は毎秒30万kmであるのに比し音速は毎秒340m程度でしかない。高性能の望遠レンズを用いて撮影した画像は、被写体が近くに存在するように撮影できるものの音声は遅れて受音される。画像に比して音声が遅れてしまう。所謂リップシンクが取れなくなり、映像に違和感が感じられる。遠距離の被写体を撮像した画像に付随する音声は画像の動きに同期され、リップシンクが取られている映像として撮影、記録され、再生できることが好ましい。
特許文献1には、簡単な回路構成によって動画像データと音声データとの同期を実現できるようにしたビデオカメラが開示されている。動画像と音声との記録時に、音声フレームに対応する画像のフィールド番号とビデオエンコーダから取得した画像成分の垂直ライン位置および水平画素位置とを音声フレームに付加する。再生時には、再生する音声フレームから取り出した画像フィールド番号情報、垂直ライン位置情報および水平画素位置情報と、現在再生している画像のフィールド番号、垂直ライン位置および水平画素位置とから音声と画像との同期のズレを算出し、このズレが許容範囲を超える場合に、画像を一時停止するかもしくは画像をスキップするようにして音声と画像の同期ズレを修正するようにしたビデオカメラが開示されている。
特開2005−117400号公報
しかしながら、特許文献1に開示されているビデオカメラでは、動画像データと音声データとの同期を簡単な回路構成により実現し、撮影する被写体の画像と音声とが同期関係にある場合は同期された映像を再生することは可能であるものの、例えば花火のように音声が画像から遅延して受音される場合には、開花する花火の画像とその開花画像に同期した炸裂音とを記録したり、開花画像と炸裂音とを同期して再生するようにしたビデオカメラ装置を実現することはできない。
そこで、本発明は、上記のような問題点を解消するためになされたもので、被写体が例えば花火であり、開花してから遅延して到着する炸裂音を開花画像に同期した音声として再生することを可能とするなど、ズームアップ撮影時に近距離画像として得られる画像と、遠距離被写体から到来する遅延音声に対して、再生時には画像と音声との同期が保れた映像信号としての同期再生を可能とするビデオカメラ装置を提供することを目的とする。
本願発明における第1の発明は、被写体から発せられる音を収音して音声信号に変換して出力する収音用マイクロフォンと、前記被写体から発せられる光を被写体画像として検出した後、光電変換して画像信号を出力する撮像素子と、前記収音用マイクロフォンに近接配置され、前記被写体から発せられる光を前記撮像素子に結像するズームレンズと、を備えたビデオカメラ装置において、前記被写体画像が前記撮像素子の撮像範囲内に入るようにズームイン又はズームアウトする操作部と、前記撮像素子の撮像範囲内の前記被写体画像のサイズを検出する画像検出部と、前記ズームイン又は前記ズームアウトした時のズーム比を検出するズーム比検出部と、前記画像信号を一時記憶する一時記憶部と、前記被写体のサイズ、前記画像検出部で検出された前記被写体画像のサイズ及び前記ズーム比検出部で検出されたズーム比に基づいて、前記ズームレンズから前記被写体までの距離を求め、この求められた距離と前記音の速度とから前記被写体から前記収音用マイクロフォンまでの音の伝達時間を算出する伝達時間算出部と、前記一時記憶部に一時記憶された前記画像信号を前記音の伝達時間だけ遅延させて読み出し、前記音声信号に時間同期させた遅延画像信号として出力する画像読出し部と、前記画像読み出し部で読み出された前記遅延画像信号を前記音声信号と共に記録媒体に記録させる記録部と、を備えたことを特徴とするビデオカメラ装置を提供する。
第2の発明は、前記収音用マイクロフォンから出力される音声信号のうち、前記画像信号に時間同期して前記記録媒体に記録される前記音声信号を第1音声信号とし、前記画像信号に時間同期しないで前記記録媒体に記録される前記音声信号を第2音声信号とするとき、前記第1音声信号と前記第2音声信号とを分離する音源分離部と、前記第2音声信号を前記伝達時間だけ遅延させて前記画像信号に時間同期させた遅延音声信号を生成する音声遅延部と、前記音声信号を前記第1音声信号と前記遅延音声信号とに置き換えて前記記録媒体に記録させる記録部と、を備えたことを特徴とするビデオカメラ装置を提供する。
第3の発明は、被写体から発せられる音を収音して音声信号に変換して出力する収音用マイクロフォンと、前記被写体から発せられる光を被写体画像として検出した後、光電変換して画像信号を出力する撮像素子と、前記収音用マイクロフォンに近接配置され、前記被写体から発せられる光を前記撮像素子に結像するズームレンズと、を備えたビデオカメラ装置において、前記被写体画像が前記撮像素子の撮像範囲内に入るようにズームイン又はズームアウトする操作部と、前記撮像素子の撮像範囲内の前記被写体画像のサイズを検出する画像検出部と、前記ズームイン又は前記ズームアウトした時のズーム比を検出するズーム比検出部と、前記被写体のサイズ、前記画像検出部で検出された前記被写体画像のサイズ及び前記ズーム比検出部で検出されたズーム比に基づいて、前記ズームレンズから前記被写体までの距離を求め、この求められた距離と前記音の速度とから前記被写体から前記収音用マイクロフォンまでの音の伝達時間を算出する伝達時間算出部と、前記音声信号をパケット化してタイムスタンプを付したパケット化音声信号を生成するパケット化音声信号生成部と、前記パケット化音声信号生成部で生成されたパケット化音声信号に付されるタイムスタンプで示される発音時刻に前記伝達時間算出部で算出された伝達時間を加算した時刻を表示時刻として示すタイムスタンプを付したパケット化画像信号を生成するパケット画像化信号生成部と、前記パケット画像化信号生成部で生成されたパケット化画像信号と前記パケット化音声信号生成部で生成されたパケット化音声信号とを共に記録媒体に記録させる記録部と、を備えたことを特徴とするビデオカメラ装置を提供する。
本発明によれば、被写体画像が撮像素子の撮像範囲内に入るようにズームイン又はズームアウトする操作部と、撮像素子の撮像範囲内の被写体画像のサイズを検出する画像検出部と、ズームイン又はズームアウトした時のズーム比を検出するズーム比検出部と、画像信号を一時記憶する一時記憶部と、被写体のサイズ、画像検出部で検出された被写体画像のサイズ及びズーム比検出部で検出されたズーム比に基づいて、ズームレンズから被写体までの距離を求め、この求められた距離と音の速度とから被写体から収音用マイクロフォンまでの音の伝達時間を算出する伝達時間算出部と、一時記憶部に一時記憶された画像信号を音の伝達時間だけ遅延させて読み出し、音声信号に時間同期させた遅延画像信号として出力する画像読出し部と、画像読み出し部で読み出された遅延画像信号を音声信号と共に記録媒体に記録させる記録部と、を備える格別な構成があるので、被写体が例えば花火であり、開花してから遅延して到着する炸裂音を開花画像に同期した音声として再生することを可能とするなど、ズームアップ撮影時に近距離画像として得られる画像と、遠距離被写体から到来する遅延音声に対して、再生時には画像と音声との同期が保れた映像信号としての同期再生を可能とするビデオカメラ装置を実現できる。
以下に本発明の実施例に係るビデオカメラ装置について図1〜図10を用いて説明する。
図1は、本発明の実施に係るビデオカメラ装置の構成例を示すブロック図である。図2は、本発明の実施に係るビデオカメラ装置の要部の動作例を説明するための図である。図3は、本発明の実施に係るビデオカメラ装置の動作例をフローチャートで示した図である。図4は、本発明の第1の応用実施に係るビデオカメラ装置の構成例を示すブロック図である。図5は、本発明の第1の応用実施に係るビデオカメラ装置の動作例における音声フレームと画像フィールドの関係を示す図である。図6は、本発明の第1の応用実施に係る音声フレームデータの構成例を示す図である。図7は、本発明の第1の応用実施に係る音声フレーム管理データの構成例を示す図である。図8は、本発明の第1の応用実施に係るビデオカメラ装置の動作例をフローチャートで示した図である。図9は、本発明の第2の応用実施に係るビデオカメラ装置の構成例を示すブロック図である。図10は、本発明の第2の応用実施に係るビデオカメラ装置の要部の動作例を説明するための図である。
そのビデオカメラ装置は、被写体が例えば花火であり、開花してから遅延して到着する炸裂音を開花画像に同期した音声として再生することを可能とするなど、ズームアップ撮影時に近距離画像として得られる画像と、遠距離被写体から到来する遅延音声に対して、再生時には画像と音声との同期が保れた映像信号としての同期再生を可能とするビデオカメラ装置を実現するという目的を、被写体画像が撮像素子の撮像範囲内に入るようにズームイン又はズームアウトする操作部と、撮像素子の撮像範囲内の被写体画像のサイズを検出する画像検出部と、ズームイン又はズームアウトした時のズーム比を検出するズーム比検出部と、画像信号を一時記憶する一時記憶部と、被写体のサイズ、画像検出部で検出された被写体画像のサイズ及びズーム比検出部で検出されたズーム比に基づいて、ズームレンズから被写体までの距離を求め、この求められた距離と音の速度とから被写体から収音用マイクロフォンまでの音の伝達時間を算出する伝達時間算出部と、一時記憶部に一時記憶された画像信号を音の伝達時間だけ遅延させて読み出し、音声信号に時間同期させた遅延画像信号として出力する画像読出し部と、画像読み出し部で読み出された遅延画像信号を音声信号と共に記録媒体に記録させる記録部とを備えるようにして実現した。
ビデオカメラ装置の構成について述べる。
図1に示すビデオカメラ装置1はマイクロフォン11、AD変換器(ADC)12、メモリ13、音声読出し部14、レンズ21、CCD(Charge Coupled Device)22、AD変換器23、画像検出部23a、メモリ24、画像読出し調整部25、符号化復号化部26、記録再生部27、DAC(digital-to-analog converter)28、29、操作部31、制御部32、ズーム比検出部33、距離検出部34、遅延時間計算部35、スピーカ41、及びモニタ42より構成される。
図4に第1応用構成例として示したビデオカメラ装置1aは、図1に示したビデオカメラ装置1に比し、TS(Transport Stream)生成部36及びTS付加部37を多く備える一方、メモリ13、音声読出し部14、メモリ24、及び画像読出し調整部25を備えていない点で異なっている。
図9に第2応用構成例として示したビデオカメラ装置1bは、図1に示したビデオカメラ装置1に比し、マイクロフォン11、AD変換器12、及びメモリ13の代わりに2つの受音素子を有するマイクロフォン11a、2つの信号を変換するAD変換器12a、2系統のオーディオ信号を記憶するメモリ13a、及び音源分離部15を備えている点で異なっている。
ビデオカメラ装置の動作について述べる。
まず、花火大会の映像を撮影する使用者は、ビデオカメラ装置1の操作部31を操作し、被写体の撮影モードを花火大会に設定する。やがて花火大会がスタートし、使用者は打ち上げられた花火を撮影する。例えば、打ち上げられた尺玉(10号玉)は高度330mの位置で開花し、開花直径は280mである。使用者は操作部31を操作し、所定の開花直径の花火が所定の画角に収まるようにレンズ21のズーム比を調整する。レンズ21を介してCCD22で撮像された画像はAD変換器23でディジタル画像とされ、画像検出部23aで輝度の高い部分の画素数が検出されると共にディジタル画像はメモリ24に記憶される。やがて花火の開花時の炸裂音は音速と撮影場所までの距離で決まる時間遅延して到来する。マイクロフォン11で受音された炸裂音はAD変換器12でディジタルオーディオ信号に変換され、メモリ13に記憶される。ズーム比検出部33は使用者により操作されたレンズ21のズーム比、即ちレンズ21の焦点距離を求める。ここで、画像検出部23aで検出される所定の画角で撮影されたCCD22上の花火半径の大きさをM、撮影時のレンズ21の焦点距離がfであるとすると、開花半径Wと花火の炸裂点までの距離dは式(1)により求められる。
d=W×f/M 式(1)
距離検出部34は、Wを140mとする場合に、焦点距離f及び画像検出部23aで検出されるCCD22上の花火の大きさLを用いて距離dを求める。
遅延時間計算部35は求められた距離dを音速340mで除し、炸裂音が受音されるまでの遅延時間を求める。画像読出し調整部25はメモリ24に記憶されたディジタル画像を、遅延時間計算部35で求められた遅延時間分だけ遅延させて読みだす。DAC29はディジタル画像をアナログ画像に変換する。モニタ42はアナログ画像を表示する。
音声読出し部14はメモリ13に記憶されたディジタルオーディオ信号を、直ちに読みだす。DAC28はディジタルオーディオ信号をオーディオ信号(アナログオーディオ信号)に変換する。スピーカ41はオーディオ信号を発音する。
モニタ42に表示されるアナログ画像は、遅延して受音されるオーディオ信号と共に表示される。符号化復号化部26は同期関係にあるディジタル画像とディジタルオーディオ信号とを所定の方式により符号化する。記録再生部27は符号化されたディジタル画像及びディジタルオーディオ信号を記録媒体に記録する。記録媒体は、例えばDVCカセット、ハードディスク、DVD、乃至はBDなどを用いる。
次に、詳細に説明する。
図2を参照して花火までの距離の測定方法について述べる。
同図において、開花した花火5と、レンズ21及びCCD22を備えるビデオカメラ装置1との位置関係を模写的に示している。CCD22中に破線で示す楕円は撮像素子上に投影された花火の結像イメージ22aである。花火5の半径W、花火の結像イメージ22aの半径M、レンズ21の焦点距離f、及びレンズ21から花火5までの距離dには次の関係がある。
M:f=W:d
この関係から上記の
d=W×f/M 式(1)
が求められる。
さらに、レンズ21の焦点距離がfの場合にCCD22で撮影可能な視野の半値角をθとし、距離dにおける撮影可能な距離の半値をVとすると、tanθ=V/dである。CCD22に結像されるイメージの半値幅をLとすると、tanθ=L/fである。
Lに対するMの比率をrとするとr=M/Lである。
式(1)にM=rLを代入すると式(2)が得られる。
d=W×f/(r×L) 式(2)
式(1)がCCD22に結像されるイメージの幅を基に距離dを算出したのに比し、式(2)は花火である被写体が画面の幅に比率rで撮影されている場合に、その比率rを用いて距離dを検出する点で異なっている。距離の算出に式(1)、(2)のいずれを用いるかは設計事項である。
図3を参照し、ビデオカメラ装置1の処理の流れについて説明する。
S(ステップ)61において、マイクロフォン11で収音した音声データとレンズ21を介してCCD22で撮像して得られた画像データとをメモリ13、24に記憶する。S62で、距離検出部34は予め設定された花火の開花直径、レンズ21のズーム比に係る焦点距離、及びCCD22に撮像される花火の大きさを基に花火までの距離を検出する。S63で距離検出部34は検出された距離を音速で除し、到来する音声の遅延時間を求める。S64で音声読出し部14はメモリ13に記憶した音声データを遅延時間なく読み出すと共に画像読出し調整部25はメモリ24に記憶された画像データを音声の遅延時間分だけ遅延して読みだす。S65で音声データがスピーカ41により再生され、遅延された画像データがモニタ42に表示される。S66で画像は音声よりも早いかを検出する。画像が音声よりも早い場合は花火会場をより大きな会場に設定しS61からの流れを繰り返す。S66で画像が音声よりも早いとして検出されない場合はS68で画像は音声よりも遅いかが検出される。画像は音声よりも遅いとして検出された場合は花火会場をより小さな会場に設定しS61からの流れを繰り返す。S68で画像は音声よりも遅いとして検出されなかった場合は、S71で音声と画像を符号化し記録媒体に記録する。S72で花火映像の記録を終えるとして検出されない場合はS61からのフローを繰り返し、終えるとして検出された場合は花火映像の撮影を終了する。
ここで、打ち上げられた花火が例えば10号玉より小さな7号玉である場合がある。花火会場は打ち上げ場所の環境により打ち上げ可能な玉の大きさが定められている。7号玉以下と定められている打ち上げ会場では7号玉が主に打ち上げられる。7号玉の開花直径は約200mであり、10号玉の約7割である。距離検出部はWを100mとして距離dを求める必要がある。上記の操作部31を操作してなされる被写体のモード設定を、花火大会の会場を例えば大、中、小としてランク分けすることにより、その花火会場における距離dの測定精度を向上させることが出来る。花火会場のランク分けをさらに細かくすることにより、距離dの測定精度を高めるようにしても良い。
また、S66やS68における画像が音声よりも早いか又は遅いかの検出は使用者により判定するとして述べた。ビデオカメラ装置1の制御部32に音声の遅延時間の判定を行わせるようにしても良い。制御部32により行う音声遅延時間の判定は、まず花火の開花により画像の輝度レベルの上昇した時刻と、音声に含まれる炸裂音との時間の進み又は遅れを検出する。検出される信号には、複数の花火が開花する場合は複数の輝度レベルの上昇、及び複数の炸裂音が存在する。輝度レベルの上昇に係る輝度パターンの波形と、炸裂音による音声レベルの上昇に係る音声レベルパターンの両者を一致させるための遅延時間を時間軸上で比較しながら求めるようにし、画像と音声との同期の取れた映像信号として得るための遅延時間を求めるようにする。
以上のように、本実施例で示したビデオカメラ装置1によれば、被写体画像が撮像素子の撮像範囲内に入るようにズームイン又はズームアウトする操作部31と、撮像素子の撮像範囲内の被写体画像のサイズを検出する画像検出部23aと、ズームイン又はズームアウトした時のズーム比を検出するズーム比検出部33と、画像信号を一時記憶する一時記憶部24と、被写体のサイズ、画像検出部で検出された被写体画像のサイズ及びズーム比検出部で検出されたズーム比に基づいて、ズームレンズから被写体までの距離を求め、この求められた距離と音の速度とから被写体から収音用マイクロフォンまでの音の伝達時間を算出する伝達時間算出部35と、一時記憶部に一時記憶された画像信号を音の伝達時間だけ遅延させて読み出し、音声信号に時間同期させた遅延画像信号として出力する画像読出し部25と、画像読み出し部で読み出された遅延画像信号を音声信号と共に記録媒体に記録させる記録部27とを備える格別な構成があるので、被写体が例えば花火であり、開花してから遅延して到着する炸裂音を開花画像に同期した音声として再生することを可能とするなど、ズームアップ撮影時に近距離画像として得られる画像と、遠距離被写体から到来する遅延音声に対して、再生時には画像と音声との同期が保れた映像信号としての同期再生を可能とするビデオカメラ装置を実現できる。
≪第1応用実施例≫
図4を参照して第1応用実施例であるビデオカメラ装置1aについて述べる。図1に示したと同じ機能部分については同一の符号を付し、説明を省く。
図1に示すビデオカメラ装置1はメモリ24に記憶した画像データを遅延して読み出すのに比し、図4に示すビデオカメラ装置1aは、記録再生部27に記録した画像を遅延時間計算部35で求められた時間だけ遅延させて読み出させようとするものである。撮影時に音声は遅延されてモニタされるが記録再生部27で記録した映像信号を再生する場合には花火の開花に同期した炸裂音を再生させるものである。
図4において、AD変換器12から出力される音声データ及びAD変換器23から出力される画像データのそれぞれは符号化復号化部26で符号化される。TS付加部37は符号化された符号化信号の復号化開始に係る時刻DTS(Decoding Time Stamp)、及び復号化して得られた画像の表示時刻、音声の発音時刻に係るPTS(Presentation Time Stamp)信号を生成する。音声データのDTS及びPTSの時刻は通常の時刻として生成し、画像データのDTS及びPTSの時刻は遅延時間計算部35で求められた時間だけ遅延して再生するための時刻として生成する。操作部31を操作し、撮影する被写体を花火に設定して撮影した場合は花火の炸裂音に同期して開花する花火の開花映像を再生することができる。この場合は、上記の制御部32により音声と画像との同期状態を得るための自動化された時間合わせは好適な再生用映像信号としての記録を行う。
図5〜図7を参照して遅延した画像を再生させるためのタイムスタンプの付加についてさらに述べる。
図5は、記録媒体に音声データ及び画像データを記録する場合のそれぞれのデータ分割方法について示したものである。音声データは10.5ミリ秒を1フレームとし、それぞれのフレームにはフレーム番号を付して記録する。画像データは1フィールドのデータを16.6ミリ秒ごとの画像フィールドとして記録媒体に記録する。音声フレームと画像フィールドとは異なる区間の信号として記録している。異なる区間の画像及び音声を同期再生するためにタイムスタンプを用いる。
図6(A)は音声フレームの構成を示したものである。各音声フレームは音声データヘッダ、フレーム番号情報、及び音声データより構成される。音声データヘッダには再生時の時刻を表す5バイトのデータであるプレゼンテーションタイムスタンプ([32..30]、マークビット1、[29..15]、マークビット1、[14..0])を含んで記述される。音声データは、例えば2チャンネルのPCM信号で記録される。図6(B)は画像フィールドの構成を示したものである。各画像フィールドは画像データヘッダ、フィールド番号情報、及び画像データより構成される。画像データヘッダには音声データヘッダと同様にプレゼンテーションタイムスタンプが含まれて記述される。画像データは、例えば1フィールドごとの画像が圧縮符号化されて記録される。
図7は画像データを遅延して表示させるための管理情報の記述例である。管理情報はフィールド番号1〜Pと遅延表示のための時間を示す5バイトの時間情報T1〜Tpとして記述される。画像データに付されるプレゼンテーションタイムスタンプ(PTS)は遅延して収音された音声データと同期再生する画像データのPTS情報として記述される。従って、撮影時の、遅延しない画像データとしての表示を行う場合には画像データのPTSから遅延表示時間減算して新たな画像データ用PTSを生成すればよい。
図8を参照し、ビデオカメラ装置1aの再生動作の流れについて述べる。
まずS81で、操作部31の再生ボタンが操作され、制御部32で生成された制御信号により記録再生部27は記録媒体に記録した符号化画像データ及び符号化音声データをデコーダタイムスタンプに従って再生する。S82で、符号化復号化部26は再生された符号化画像データ及び符号化音声データを復号化して画像データ及び音声データを得る。S83で内部タイマーの時刻情報に従い、音声PTSに従った音声データをDAC28を介して出力すると共に、画像PTSに従った画像データをDAC29を介して出力する。S84で映像の再生を終えるための停止ボタンの操作が検出されない場合はS85で映像は音声よりも遅れているかを検出する。それは、花火以外の被写体を花火モードで撮影し、花火モードで再生した場合に生じる遅延画像を検出するステップである。画像が遅くない場合はS81からの動作を継続し、画像が遅れている場合にはS86で画像の遅延処理を中止し、元の状態に戻す操作がなされるかを検出する。操作がなされない場合はS81からの流れを繰り返す。S86で元の状態に戻す操作が検出された場合はS87で、画像データのPTSの値から図7に示した管理情報として記述される遅延表示のための時間を減算して新たな画像データ用のPTSを生成する。新たなPTSを用いて再生動作を行う。即ち、記録再生部27は、符号化画像データに付されるPTSよりも管理情報として記述される遅延表示の時間だけ先行させることにより遅延を伴わない符号化画像データを再生する。
以上、画像データに付すPTS値を花火の炸裂音が遅延して到達する時間分だけ遅延したPTS値として記録し、花火の開花画像と炸裂音を同期して再生するビデオカメラ装置1aについて述べた。画像の再生制御を行うためにPTS値を用いる制御について述べたが、符号化された画像データの復号化を開始させるためのDTS(デコーダタイムスタンプ)についても同様の遅延時間処理を行う。
また、PTSやDTSを符号化画像データと共に画像データと共に記録媒体に記録するとして述べた。その記録領域は補助データ記録領域、又は記録媒体以外の例えば半導体記憶素子に記憶するようにしても良い。
以上のように、本実施の第1応用例で示したビデオカメラ装置1aによれば、被写体画像が撮像素子の撮像範囲内に入るようにズームイン又はズームアウトする操作部31と、撮像素子の撮像範囲内の被写体画像のサイズを検出する画像検出部23aと、ズームイン又はズームアウトした時のズーム比を検出するズーム比検出部33と、被写体のサイズ、画像検出部で検出された被写体画像のサイズ及びズーム比検出部で検出されたズーム比に基づいて、ズームレンズから被写体までの距離を求め、この求められた距離と音の速度とから被写体から収音用マイクロフォンまでの音の伝達時間を算出する伝達時間算出部34、35と、音声信号をパケット化してタイムスタンプを付したパケット化音声信号を生成するパケット化音声信号生成部37と、パケット化音声信号生成部で生成されたパケット化音声信号に付されるタイムスタンプで示される発音時刻に伝達時間算出部で算出された伝達時間を加算した時刻を表示時刻として示すタイムスタンプを付したパケット化画像信号を生成するパケット画像化信号生成部36、37と、パケット画像化信号生成部で生成されたパケット化画像信号とパケット化音声信号生成部で生成されたパケット化音声信号とを共に記録媒体に記録させる記録部27と、を備える格別な構成があるので、被写体が例えば花火であり、開花してから遅延して到着する炸裂音を開花画像に同期した音声として再生することを可能とするなど、ズームアップ撮影時に近距離画像として得られる画像と、遠距離被写体から到来する遅延音声に対して、再生時には画像と音声との同期が保れた映像信号としての同期再生を可能とするビデオカメラ装置を実現できる。
≪第2応用実施例≫
図9を参照して第2応用実施例であるビデオカメラ装置1bについて述べる。図1に示したと同じ機能部分については同一の符号を付し、説明を省く。
図1に示すビデオカメラ装置1はメモリ24に記憶した画像データをマイクロフォン11により収音されたオーディオ信号の炸裂音に同期させるように遅延させて読み出すのに比し、図9に示すビデオカメラ装置1bは、2つの受音素子を有するマイクロフォン11aで収音し、音源分離部15で花火の炸裂音と撮影者の周囲音とを分離して得た後メモリ13aに記憶し、周囲音は所定時間遅延させて読出し炸裂音は直ちに読み出すようにする。メモリ24に記録した画像を遅延時間計算部35で求められた時間だけ遅延させて読み出すことにより、撮影時に遅延して到来する炸裂音を花火の開花に同期した炸裂音として読み出し、記録媒体に記録するものである。
図10を参照し、花火の炸裂音及び撮影者の周囲音の収音についてさらに説明する。
まず、収音用マイクロフォンに対して花火の炸裂音及び撮影者の周囲音が同一方向から到来する場合について述べる。即ち、マイクロフォン11aを構成する受音素子112、受音素子111、撮影者の前方の周囲音である音源51、及び花火の炸裂音である音源52が一直線上に配列される場合である。受音素子111と受音素子112の間の距離をk1、受音素子111と音源51の間の距離をl1、受音素子111と音源52の間の距離をl2とする。また、受音素子111及び受音素子112は共に単一指向性のマイクユニット、又は共に無指向性のマイクユニットを用いるものとする。
音源51及び音源52から発音された音のそれぞれは混合されて受音素子111及び112で受音される。受音素子111で受音される信号をx1とし、受音素子112で受音される信号をx2とする。ここで、受音素子111及び受音素子112の特性は同一であるとする。音源51から発音される音と、音源52から発音される音とのそれぞれは受音素子111及び112までの伝達距離が異なるため、受音素子111及び受音素子112では異なる混合比で受音される。
ここで、音源51の発する音を音源位置で受音して得られる音源信号をS1とし、同様に音源52の音源位置で得られる音源信号をS2とする。受音素子111が図の位置で音源51及び音源52から到来し、受音される混合信号をx1とし、同様に受音素子112で受音して得られる混合信号をx2とする。
混合信号x1及びx2は、距離l1、l2、及びk1を用い、音源信号S1、S2の線形結合により、概念的に式(3)で記述できる。
Figure 2008048374
このため、原理的に、上記の混合信号x1、x2を用い、線形変換によって音源51、52からの音源信号S1、S2に分離できる。音源分離をして得られる信号をy1、y2とする。その線形変換式を式(4)に示す。
Figure 2008048374
ここで、Cij(i,j=1,2)は混合信号x1、x2を用いて音源信号S1、S2を分離するための分離係数である。
距離k1が既知であり、距離l2は距離検出部34で求められるため、マイクロフォン11aの周囲で発音する音源51までの距離l1が例えば2m前方の観客であるとして設定されれば、音源51から発せられ受音素子111及び112で受音される音声の混合比は(l1+k1):l1として算出される。そこでC21=1と、C22=−(l1+k1)/l1とを与え、式(3)を式(4)に代入して、式(4)の左辺のy2には、以下の式(5)に示すように、音源信号S2のみが含まれるようにして式(5)が得られる。
Figure 2008048374
次に、上記の式(4)の出力信号y1と絶対値は異なるが、音源信号S1、S2の混合比を維持し、線形結合で表される信号を次の式(6)に示すように得ることが出来る。
Figure 2008048374
式(6)のy1は、新たに線形結合で表した出力信号であり、式(6)のC12はその結合係数であり、分離係数となる。
上記の式(5)の出力信号y2には音源信号S2のみしか含まれないため、分離係数C12を調整することにより混合信号x1から音源信号S2を除いて、音源信号S1成分のみの式(6)の出力信号y1を得ることが出来る。
式(3)と式(6)を用いて、音源信号S2が除かれて、音源信号S1成分のみとなった出力信号y1を以下の式(7)に示す。
Figure 2008048374
ここで、上記の音源信号S2を除いて音源信号S1成分のみとする方法について、分離係数C12を変化させ、分離係数C12毎に出力信号y1と音源信号S2との相互相関を取り、相互相関の計算値が最も小さくなる分離係数C12における出力信号を取り出す方法がある。これは、音源信号S1と音源信号S2との統計的独立性に基づくものである。
以上のようにして、混合信号x1、x2を用いて音源信号S1と音源信号S2とを分離することが出来、炸裂音である音源52からの音声と周囲音である音源51からの音声信号とを分離し、CCD22により撮影される花火の炸裂画像と収音された音源52からの炸裂音との時間のずれを補正することが出来る。
以上、花火の観客を想定した音源51、花火の炸裂音である音源52、受音素子111、及び受音素子112が直線的に配置される場合の音源51と音源52の分離について述べた。音源分離部15は、入力される2つの受音素子111及び112の信号を上記の式を基に演算処理して音源51からの音と音源52からの音とに分離して出力する。
そして、音源52が前方に配置されるのに対して音源51がビデオカメラ装置1bを囲むように配置される場合では、音源51を指向性マイクロフォンにより、音源52を無指向性マイクロフォンにより収音することにより両者を所定の分離された音として収音することが出来る。
音源52は炸裂音を、音源51はざわめき音である場合には収音された音から低域成分を多く含むインパルス的な信号を炸裂音とし、中域成分の多いランダムノイズ的な音を周囲音としてフィルター処理することにより、さらに音源51と音源52とを分離して得ることが出来る。音源分離部15に、上記のフィルタ処理機能を持たせることにより炸裂音とざわめき音の分離度を改善できる。
第2応用例として示したビデオカメラ装置1bは、CCD22により撮像して得られた画像、及び音源分離部15により分離して得られた音源51である周囲音は遅延時間計算部35で求められた時間だけ遅延させ、音源分離部15により分離して得られた音源52である炸裂音には遅延時間を与えないようにした画像及び音声信号を媒体に記録して再生させるものであり、収音用マイクロフォンから出力される音声信号のうち、画像信号に時間同期して記録媒体に記録される音声信号を第1音声信号とし、画像信号に時間同期しないで記録媒体に記録される音声信号を第2音声信号とするとき、第1音声信号と第2音声信号とを分離する音源分離部15と、第2音声信号を伝達時間だけ遅延させて画像信号に時間同期させた遅延音声信号を生成する音声遅延部13a、14と、音声信号を第1音声信号と遅延音声信号とに置き換えて記録媒体に記録させる記録部27とを備えたビデオカメラ装置を実現するものである。
本発明の実施に係るビデオカメラ装置の構成例を示すブロック図である。 本発明の実施に係るビデオカメラ装置の要部の動作例を説明するための図である。 本発明の実施に係るビデオカメラ装置の動作例をフローチャートで示した図である。 本発明の第1応用実施に係るビデオカメラ装置の構成例を示すブロック図である。 本発明の第1応用実施に係るビデオカメラ装置の動作例における音声フレームと画像フィールドの関係を示す図である。 本発明の第1応用実施に係る音声フレームデータの構成例を示す図である。 本発明の第1応用実施に係る音声フレーム管理データの構成例を示す図である。 本発明の第1応用実施に係るビデオカメラ装置の動作例をフローチャートで示した図である。 本発明の第2応用実施に係るビデオカメラ装置の構成例を示すブロック図である。 本発明の第2応用実施に係るビデオカメラ装置の要部の動作例を説明するための図である。
符号の説明
1、1a、1b ビデオカメラ装置
11、11a マイクロフォン
12、12a、23 AD変換器
13、13a、24 メモリ
14 音声読出し部
15 音源分離部
21 レンズ
22 CCD
23a 画像検出部
25 画像読出し調整部
26 符号化復号化部
27 記録再生部
28、29 DAC
31 操作部
32 制御部
33 ズーム比検出部
34 距離検出部
35 遅延時間計算部
36 TS生成部
37 TS付加部
41 スピーカ
42 モニタ
51、52 音源
111、112 受音素子

Claims (3)

  1. 被写体から発せられる音を収音して音声信号に変換して出力する収音用マイクロフォンと、前記被写体から発せられる光を被写体画像として検出した後、光電変換して画像信号を出力する撮像素子と、前記収音用マイクロフォンに近接配置され、前記被写体から発せられる光を前記撮像素子に結像するズームレンズと、を備えたビデオカメラ装置において、
    前記被写体画像が前記撮像素子の撮像範囲内に入るようにズームイン又はズームアウトする操作部と、
    前記撮像素子の撮像範囲内の前記被写体画像のサイズを検出する画像検出部と、
    前記ズームイン又は前記ズームアウトした時のズーム比を検出するズーム比検出部と、
    前記画像信号を一時記憶する一時記憶部と、
    前記被写体のサイズ、前記画像検出部で検出された前記被写体画像のサイズ及び前記ズーム比検出部で検出されたズーム比に基づいて、前記ズームレンズから前記被写体までの距離を求め、この求められた距離と前記音の速度とから前記被写体から前記収音用マイクロフォンまでの音の伝達時間を算出する伝達時間算出部と、
    前記一時記憶部に一時記憶された前記画像信号を前記音の伝達時間だけ遅延させて読み出し、前記音声信号に時間同期させた遅延画像信号として出力する画像読出し部と、
    前記画像読み出し部で読み出された前記遅延画像信号を前記音声信号と共に記録媒体に記録させる記録部と、
    を備えたことを特徴とするビデオカメラ装置。
  2. 前記収音用マイクロフォンから出力される音声信号のうち、前記画像信号に時間同期して前記記録媒体に記録される前記音声信号を第1音声信号とし、前記画像信号に時間同期しないで前記記録媒体に記録される前記音声信号を第2音声信号とするとき、前記第1音声信号と前記第2音声信号とを分離する音源分離部と、
    前記第2音声信号を前記伝達時間だけ遅延させて前記画像信号に時間同期させた遅延音声信号を生成する音声遅延部と、
    前記音声信号を前記第1音声信号と前記遅延音声信号とに置き換えて前記記録媒体に記録させる記録部と、
    を備えたことを特徴とする請求項1記載のビデオカメラ装置。
  3. 被写体から発せられる音を収音して音声信号に変換して出力する収音用マイクロフォンと、前記被写体から発せられる光を被写体画像として検出した後、光電変換して画像信号を出力する撮像素子と、前記収音用マイクロフォンに近接配置され、前記被写体から発せられる光を前記撮像素子に結像するズームレンズと、を備えたビデオカメラ装置において、
    前記被写体画像が前記撮像素子の撮像範囲内に入るようにズームイン又はズームアウトする操作部と、
    前記撮像素子の撮像範囲内の前記被写体画像のサイズを検出する画像検出部と、
    前記ズームイン又は前記ズームアウトした時のズーム比を検出するズーム比検出部と、
    前記被写体のサイズ、前記画像検出部で検出された前記被写体画像のサイズ及び前記ズーム比検出部で検出されたズーム比に基づいて、前記ズームレンズから前記被写体までの距離を求め、この求められた距離と前記音の速度とから前記被写体から前記収音用マイクロフォンまでの音の伝達時間を算出する伝達時間算出部と、
    前記音声信号をパケット化してタイムスタンプを付したパケット化音声信号を生成するパケット化音声信号生成部と、
    前記パケット化音声信号生成部で生成されたパケット化音声信号に付されるタイムスタンプで示される発音時刻に前記伝達時間算出部で算出された伝達時間を加算した時刻を表示時刻として示すタイムスタンプを付したパケット化画像信号を生成するパケット画像化信号生成部と、
    前記パケット画像化信号生成部で生成されたパケット化画像信号と前記パケット化音声信号生成部で生成されたパケット化音声信号とを共に記録媒体に記録させる記録部と、
    を備えたことを特徴とするビデオカメラ装置。
JP2006279811A 2006-07-21 2006-10-13 ビデオカメラ装置 Pending JP2008048374A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006279811A JP2008048374A (ja) 2006-07-21 2006-10-13 ビデオカメラ装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006199220 2006-07-21
JP2006279811A JP2008048374A (ja) 2006-07-21 2006-10-13 ビデオカメラ装置

Publications (1)

Publication Number Publication Date
JP2008048374A true JP2008048374A (ja) 2008-02-28

Family

ID=39181635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006279811A Pending JP2008048374A (ja) 2006-07-21 2006-10-13 ビデオカメラ装置

Country Status (1)

Country Link
JP (1) JP2008048374A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009207043A (ja) * 2008-02-29 2009-09-10 Casio Comput Co Ltd 動画再生装置、動画再生方法、及びプログラム
JP2010246026A (ja) * 2009-04-09 2010-10-28 Canon Inc 画像処理装置、画像処理方法、及びプログラム
JP2011109557A (ja) * 2009-11-20 2011-06-02 Sony Corp 画像処理装置、画像処理方法およびプログラム
JP2012238964A (ja) * 2011-05-10 2012-12-06 Funai Electric Co Ltd 音分離装置、及び、それを備えたカメラユニット
US20180158446A1 (en) * 2015-05-18 2018-06-07 Panasonic Intellectual Property Management Co., Ltd. Directionality control system and sound output control method
EP3340614A1 (en) * 2016-12-21 2018-06-27 Thomson Licensing Method and device for synchronizing audio and video when recording using a zoom function
CN114125258A (zh) * 2020-08-26 2022-03-01 华为技术有限公司 视频处理方法及电子设备
CN114584648A (zh) * 2020-11-30 2022-06-03 华为技术有限公司 一种音频与视频同步的方法及设备
WO2022262416A1 (zh) * 2021-06-16 2022-12-22 北京荣耀终端有限公司 音频的处理方法及电子设备

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009207043A (ja) * 2008-02-29 2009-09-10 Casio Comput Co Ltd 動画再生装置、動画再生方法、及びプログラム
JP2010246026A (ja) * 2009-04-09 2010-10-28 Canon Inc 画像処理装置、画像処理方法、及びプログラム
JP2011109557A (ja) * 2009-11-20 2011-06-02 Sony Corp 画像処理装置、画像処理方法およびプログラム
US9407804B2 (en) 2009-11-20 2016-08-02 Sony Corporation Method, apparatus, and non-transitory medium for generating a synthetic image from a series of captured images
JP2012238964A (ja) * 2011-05-10 2012-12-06 Funai Electric Co Ltd 音分離装置、及び、それを備えたカメラユニット
US10497356B2 (en) * 2015-05-18 2019-12-03 Panasonic Intellectual Property Management Co., Ltd. Directionality control system and sound output control method
US20180158446A1 (en) * 2015-05-18 2018-06-07 Panasonic Intellectual Property Management Co., Ltd. Directionality control system and sound output control method
EP3340614A1 (en) * 2016-12-21 2018-06-27 Thomson Licensing Method and device for synchronizing audio and video when recording using a zoom function
WO2018115228A1 (en) * 2016-12-21 2018-06-28 Thomson Licensing Method and device for synchronizing audio and video when recording using a zoom function
CN114125258A (zh) * 2020-08-26 2022-03-01 华为技术有限公司 视频处理方法及电子设备
WO2022042387A1 (zh) * 2020-08-26 2022-03-03 华为技术有限公司 视频处理方法及电子设备
CN114125258B (zh) * 2020-08-26 2023-04-18 华为技术有限公司 视频处理方法及电子设备
EP4195653A4 (en) * 2020-08-26 2024-01-03 Huawei Tech Co Ltd VIDEO PROCESSING METHOD AND ELECTRONIC DEVICE
CN114584648A (zh) * 2020-11-30 2022-06-03 华为技术有限公司 一种音频与视频同步的方法及设备
WO2022262416A1 (zh) * 2021-06-16 2022-12-22 北京荣耀终端有限公司 音频的处理方法及电子设备

Similar Documents

Publication Publication Date Title
JP2008048374A (ja) ビデオカメラ装置
JP5235798B2 (ja) 撮影装置及びその制御方法
US8553105B2 (en) Audiovisual data recording device and method
KR101753715B1 (ko) 촬영장치 및 이를 이용한 촬영방법
EP3952276A1 (en) Image processing device, image processing method, and program
JP2009156888A (ja) 音声補正装置及びそれを備えた撮像装置並びに音声補正方法
JP4637045B2 (ja) 撮像装置
JP2007096915A (ja) フレームレート変換装置および撮像装置
JP4407549B2 (ja) 撮影装置、動画再生装置、動画記録再生プログラム
JP2009065587A (ja) 音声記録装置及び音声再生装置
JP2012100216A (ja) カメラおよび動画撮影プログラム
JP2011250340A (ja) 撮像装置およびその制御方法
JP2010171625A (ja) 撮像装置、録音装置、および動画撮影システム
JP2010093671A (ja) カメラ、再生装置、および再生方法
JP2007266659A (ja) 撮像再生装置
JP2010245856A (ja) 映像編集装置
JP2009130767A (ja) 信号処理装置
JP2011035752A (ja) 撮像装置
JP2010245691A (ja) 複眼撮像装置
JP2009088860A (ja) 撮像装置
JP2007266664A (ja) サムネイルソート装置及び撮像装置
JP4217182B2 (ja) 撮影装置
JP2005202037A (ja) 立体カメラ
JP2011101218A (ja) 撮像素子一体型交換レンズ式のカメラシステムとその動画生成方法
JP5171369B2 (ja) 集音環境判定装置及びそれを備えた電子機器並びに集音環境判定方法