JP2009177480A - 撮影装置 - Google Patents

撮影装置 Download PDF

Info

Publication number
JP2009177480A
JP2009177480A JP2008013817A JP2008013817A JP2009177480A JP 2009177480 A JP2009177480 A JP 2009177480A JP 2008013817 A JP2008013817 A JP 2008013817A JP 2008013817 A JP2008013817 A JP 2008013817A JP 2009177480 A JP2009177480 A JP 2009177480A
Authority
JP
Japan
Prior art keywords
sound
photographing
data
shooting
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008013817A
Other languages
English (en)
Inventor
Tetsuo Nishimoto
哲夫 西元
Kiyoshi Ishijima
清 石嶋
Masakazu Kato
正和 加藤
Katsuji Yoshimura
克二 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2008013817A priority Critical patent/JP2009177480A/ja
Publication of JP2009177480A publication Critical patent/JP2009177480A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)

Abstract

【課題】複数の被写体について数多く撮影する場合において、撮影者の作業を軽減することのできる技術を提供する。
【解決手段】撮影装置1には、複数のマイクロホン15が列状に配置されている。撮影装置1の制御部11は、マイクロホン15のそれぞれで収音された音声を表す音声データを解析し、解析結果に応じて音源の方向を推定する。また、制御部11は、推定した音源方向のそれぞれからの音声の音声データを、照合用データ記憶領域121に記憶された照合用データと照合し、その一致度に応じて特定音声の検出の有無を判定する。特定音声が検出されると、制御部11は、回動機構70を制御して、撮影装置1の撮影範囲に、特定音声が検出された方向が含まれるように、撮影範囲を変更し、撮影を行う。
【選択図】図1

Description

本発明は、撮影を行う技術に関する。
静止画や動画を撮影するデジタルカメラ等の撮影装置において、撮影を好適に行うための技術が種々提案されている。例えば特許文献1には、カメラ本体に外付け可能な装置から撮影距離データと誤差データとをカメラ本体に伝えることにより、撮影距離データの誤差を考慮してより正確な制御を行う技術が提案されている。また、近年では、被写体を自動追尾して撮影する装置も提案されている。例えば特許文献2に記載の技術では、撮影用カメラによって撮影された被写体の3次元空間内の位置を計測し、計測結果に基づいて被写体の動きを解析して撮影用カメラを駆動制御する技術が提案されている。
特開平5−188269号公報 特開平9−322052号公報
ところで、多数の人が集まるパーティの会場や運動会等においては、複数の被写体を数多く撮影することが多い。このような場合に、撮影者は、被写体に対してカメラを向けたりピントを合わせたりといった作業を撮影回数だけ行う必要があり、その作業は煩雑であった。特に、撮影に不慣れな者が撮影を行う場合には、カメラの向きを変えたりピントを合わせたりといった撮影に係る作業に時間を要することが多く、また、ピントを合わせたりといった作業を好適に行うことが出来ずに撮影に失敗することもあった。
本発明は上述した背景の下になされたものであり、複数の被写体について数多く撮影する場合において、撮影者の作業を軽減することのできる技術を提供することを目的とする。
上記課題を解決するために、本発明の好適な態様である撮影装置は、撮影範囲が設定され、該撮影範囲内の映像を表す映像データを出力する撮影手段と、前記撮影手段の周囲でマイクロホン毎に収音し、音声データとして出力する複数のマイクロホンと、前記複数のマイクロホンのそれぞれから出力される音声データを解析し、解析結果に応じて発音の有無を判定する発音有無判定手段と、前記複数のマイクロホンのそれぞれから出力される音声データを解析し、解析結果に応じて音源の方向を推定する推定手段と、前記発音有無判定手段により発音有りと判定されたときに、前記推定手段により推定された前記音源の方向を報知する報知手段とを具備することを特徴とする。
また、本発明の別の好適な態様である撮影装置は、撮影範囲が設定され、該撮影範囲内の映像を表す映像データを出力する撮影手段と、前記撮影手段の周囲でマイクロホン毎に収音し、音声データとして出力する複数のマイクロホンと、前記複数のマイクロホンのそれぞれから出力される音声データを解析し、解析結果に応じて発音の有無を判定する発音有無判定手段と、前記複数のマイクロホンのそれぞれから出力される音声データを解析し、解析結果に応じて音源の方向を推定する推定手段と、前記発音有無判定手段により発音有りと判定されたときに、前記撮影手段の前記撮影範囲を、前記方向推定手段により推定された音源の方向を含む範囲に変更する撮影範囲変更手段とを具備することを特徴とする。
上述の態様において、前記撮影範囲変更手段により前記撮影範囲が変更されたときに、前記撮影手段から出力される映像データを所定の記憶手段に記憶する映像データ記憶制御手段を具備してもよい。
また、上述の態様において、音声の特徴を表す照合用データを記憶する照合用データ記憶手段と、前記マイクロホン毎の音声データから、前記推定手段により推定された方向のそれぞれに対応した方向別音声データを生成する方向別音声データ生成手段とを具備し、前記発音有無検出手段は、前記方向別音声データ生成手段により生成された音声データと前記照合用データ記憶手段に記憶された照合用データとを比較し、その一致度に応じて発音の有無を判定してもよい。
また、上述の態様において、前記照合用データは、特定の個人の声の特徴情報を含んでもよい。
また、上述の態様において、前記方向別音声データ生成手段は、前記推定手段により推定された方向からの音圧が高くなるようにミキシングして方向別音声データを生成してもよい。
また、上述の態様において、前記方向別音声データ生成手段は、独立成分分析を用いて前記音声データから音源に対応する音声データを推定することで特定方向音声データを生成してもよい。
また、上述の態様において、前記推定手段は、前記マイクロホン毎の音声データの相関に基づいて、前記撮影手段の周囲における音圧の分布を算出し、算出した分布において音圧のピークが表れる方向を前記音源の方向として推定してもよい。
また、上述の態様において、前記撮影範囲変更手段は、前記発音有無判定手段により発音有りと判定されたときに、前記撮影手段の前記撮影範囲に前記方向推定手段により推定された音源の方向が含まれるように、前記撮影手段の向きを変更してもよい。
本発明によれば、複数の被写体について数多く撮影する場合において、撮影者の作業を軽減することができる。
以下、図面を参照して、本発明の実施形態について説明する。
<A:構成>
図1は、この発明の一実施形態である撮影装置1のハードウェア構成の一例を示すブロック図であり、図2は撮影装置1の外観の一例を示す斜視図である。撮影装置1は、静止画像や動画を撮影する機能を備えた装置であり、例えばデジタルカメラである。図1において、制御部11は、CPU(Central Processing Unit)やROM(Read Only Memory)、RAM(Random Access Memory)を備え、ROM又は記憶部12に記憶されているコンピュータプログラムを読み出して実行することにより、バスBUSを介して撮影装置1の各部を制御する。記憶部12は、制御部11によって実行されるコンピュータプログラムやその実行時に使用されるデータを記憶するための記憶手段であり、例えばハードディスク装置である。表示部13は、液晶パネル等を備え、制御部11による制御の下に各種の画像を表示する。操作部14は、撮影装置1の利用者による操作に応じた信号を制御部11に出力する。操作部14は、十字キー(図示略)や、録音を開始・終了させるための録音ボタンB1、静止画像の撮影及び動画像の撮影を開始・終了させるための撮影ボタンB2等の各種のボタンを備えており、撮影装置1の利用者は、これらのボタンを押下することで、静止画像の撮影や動画像の撮影等の各種の操作を行うことができる。なお、静止画の撮影と動画像の撮影との切替は、撮影装置1に設けられた切替スイッチ(図示略)によって切り替えられるようになっている。
撮影部18は、撮影用レンズ18a等を備え、撮影し、撮影した映像を表す映像データを出力する。撮影部18は、撮影用レンズ18aを前後に移動させることによって撮影範囲を変更可能である。撮影装置1の利用者は、操作部14の十字キー等を用いて撮影部18の撮影範囲を設定できるようになっており、撮影部18は、操作部14からの信号に応じて、撮影用レンズ18aを移動させて撮影範囲を設定する。なお、本実施形態に係る映像データは静止画像を表すデータや動画像を表すデータを含む。
マイクロホンアレイMAは、複数のマイクロホン151,152,…,15n(nは2以上の自然数)が列状に配置されて構成されている。図2に示すように、撮影装置1の前面(撮影用レンズ18aが設けられている面と同じ面)に、複数のマイクロホン151,152,…,15nが列状に配置されており、これらの複数のマイクロホン151,152,…,15nは、撮影装置1の周囲で収音する。なお、これら複数のマイクロホン151,152,…15nは指向性マイクロホンであることが望ましい。以下の説明では、マイクロホン151,152,…15nを各々区別する必要がない場合には、これらを「マイクロホン15」と称して説明する。マイクロホン15は、収音し、収音した音声を表すアナログ信号を音声信号として出力する収音手段である。音声処理部16は、マイクロホン15が出力するアナログ信号(音声信号)をA/D変換してデジタルデータ(音声データ)を生成する。また、音声処理部16は、制御部11の制御の下、デジタル形式の音声データをD/A変換してアナログ信号を生成し、生成したアナログ信号をスピーカ17に出力する。スピーカ17は、音声処理部16から供給されるアナログ信号に応じた強度で放音する放音手段である。
なお、この実施形態では、マイクロホン15とスピーカ17とが撮影装置1に含まれている場合について説明するが、音声処理部16に入力端子及び出力端子を設け、オーディオケーブルを介してその入力端子に外部マイクロホンを接続するとしても良く、同様に、オーディオケーブルを介してその出力端子に外部スピーカを接続するとしても良い。また、この実施形態では、マイクロホン15から音声処理部16へ入力される音声信号及び音声処理部16からスピーカ17へ出力される音声信号がアナログ音声信号である場合について説明するが、デジタル音声データを入出力するようにしても良い。このような場合には、音声処理部16にてA/D変換やD/A変換を行う必要はない。表示部13、操作部14、撮影部18についても同様であり、撮影装置1に内蔵される形式であってもよく、外付けされる形式であってもよい。
記憶部12は、図1に示すように、照合用データ記憶領域121と映像データ記憶領域122とを有している。照合用データ記憶領域121には、音声の特徴(音素の列等)を表す照合用データが記憶されている。この照合用データは、「チーズ」等の、撮影を行う際の掛け声等の音素の列を表すデータであってもよい。この照合用データは、制御部11が後述する照合処理を行う際に、照合用データとして用いられる。なお、以下の説明では、説明の便宜上、照合用データ記憶領域121に記憶された照合用データの表す音声を「特定音声」と称することとする。
映像データ記憶領域122には、撮影部18から出力される映像データが記憶される。制御部11は、撮影者によって撮影ボタンB2が押下されると、操作部14から出力される信号に応じて、撮影部18から出力される映像データを映像データ記憶領域122に記憶する。
撮影装置1は、図2に示すように、回動機構70に取り付けられている。回動機構70は机等の台61に設置されており、撮影装置1は、回動機構70によって矢印P方向に回動可能となっている。図3は、回動機構70の構成の一例を示す図である。回動機構70は、図示のように、回動部71と固定部72とを有している。回動部71は撮影装置1に固定される。固定部72には軸721が設けられており、この軸721が回動部71の軸受711に差し込まれ、回動部71は軸721で回動可能に支持される。固定部72には駆動歯車722と、この駆動歯車722を回転させるモータ723とが設けられている。モータ723は、制御部11の制御の下に駆動歯車722を回転させる。駆動歯車722が回転することにより、駆動歯車722とかみ合った受動歯車712が回転され、これにより、モータ723の駆動により回動部71が、軸721を中心として回転する。
なお、本実施形態では回動機構70の構成として図3に示すものを例示したが、回動機構70の構成はこれに限らず、他の構成によって撮影装置1を回動させるものであってもよく、要は、撮影装置1の撮影範囲を移動させるものであればどのようなものであってもよい。
<B:動作>
次に、撮影装置1が行う撮影動作について説明する。撮影装置1は、動画撮影モードと、静止画撮影モードと、静止画自動撮影モード、との3つのモードを切り替えることができる。利用者は、撮影装置1の操作部14を操作して、撮影モードを切り替えることができる。制御部11は、操作部14から出力される信号に応じて、選択されたモードの撮影処理を行う。以下では、静止画自動撮影モードが選択された場合の動作について説明する。なお、動画撮影や静止画撮影の動作については、従来の撮影装置の動作と同様であり、ここではその詳細な説明を省略する。
図4は、撮影装置1が行う撮影処理の流れを示すフローチャートである。撮影者が撮影装置1の電源をオンにして、自動撮影モードを選択することにより、図4に示す処理が開始される。自動静止画撮影モードが選択されると、マイクロホン15は収音した音声を音声信号に変換し、音声処理部16へ出力する。音声処理部16は、マイクロホン15のそれぞれから出力される音声信号を音声データに変換する。制御部11は、複数のマイクロホン15毎の音声データを、所定単位量の角度毎に、各角度からの音声の音圧が高くなるようにミキシングして、角度毎の音声データ(以下、「方向別音声データ」という)を生成する(ステップS1)。
次いで、制御部11は、生成した方向毎の方向別音声データを解析し、解析結果に応じて音源の方向(以下「音源方向」)を推定する(ステップS2)。ここでは、制御部11は、複数のマイクロホン15のそれぞれから出力された音声信号の音圧を検出し、検出したマイクロホン15毎の音圧の相関に基づいて音圧の分布を算出し、算出した分布において音圧のピークが表れる方向を音源の方向として推定する。この推定処理の具体的な内容の一例について、図5を参照しつつ以下に説明する。
図5は、制御部11が算出する音圧の分布の一例を示す図である。図において、横軸はマイクアレイMAの中心方向に対する角度を示し、縦軸は音圧を示す。制御部11は、複数のマイクロホン15のそれぞれから出力される音声データの音圧を検出し、検出したマイクロホン15毎の音圧の相関に基づいて、方向(角度)に対する音圧の分布を算出する。或る音源で発生した音波が複数のマイクロホン15のそれぞれに到達するまでの時間は撮影装置1からみた音源の方向(角度)によって異なる。この原理を利用して、制御部11は、マイクロホン15毎の音声データを角度毎の遅延時間だけ遅延させた音声データを加算して、角度毎の音圧を算出する。制御部11は、算出した分布においてピークが表れる角度を1又は複数検出し、検出した角度を音源の方向とする。図5に示す例においては、制御部11は角度θ1、θ2、θ3を音源方向として推定する。
次いで、制御部11は、推定した音源方向のそれぞれに対応する方向別音声データを解析して、特定音声が検出されたか否かを判定する。ここでは、制御部11は、まず、生成した方向別音声データのそれぞれから音声の特徴(音素の列等)を表す特徴データを生成し、生成した特徴データのそれぞれと照合用データ記憶領域121に記憶された照合用データと照合する(ステップS3)。次いで、制御部11は、照合結果に基づいて、特定音声が検出されたか否かを判定する(ステップS4)。制御部11は、特徴データと照合用データとの両者の一致度が予め定められた条件を満たす場合に、特定音声を検出したと判定する。
特定音声が検出されていないと判定された場合には(ステップS4;NO)、制御部11は、ステップS1の処理に戻り、特定音声を検出するまで、ステップS1〜ステップS4の処理を所定単位時間毎に繰り返し実行する。
一方、ステップS4において、特定音声が検出されたと判定した場合には(ステップS4;YES)、制御部11は、回動機構70のモータ723を制御して、撮影装置1の撮影範囲に、特定音声が検出された方向(以下「特定方向」という)が含まれるように、撮影装置1の向きを変更する(ステップS5)。このとき、制御部11は、撮影装置1の撮影範囲の中央方向が特定方向となるように撮影装置1の向きを変更するようにしてもよい。
次いで、制御部11は、撮影部18を制御して、静止画の撮影を行う(ステップS6)。制御部11は、撮影部18から出力される映像データを、記憶部12の映像データ記憶領域122に記憶する。なお、このとき、撮影を行う際に「撮影を行います」といったメッセージを音声出力したり表示したりして利用者に報知するようにしてもよい。撮影を終えると、制御部11は、ステップS1の処理に戻り、ステップS1〜ステップS6の処理を繰り返し行う。
<C:動作例>
次に、この実施形態の具体的な動作の一例について、図6(a),(b)を参照しつつ説明する。図6に示す例ではある会場に撮影装置1が設置され、複数の人物A1,A2,A3,A4,A5を被写体として撮影する場合の動作の一例について説明する。なお、撮影装置1の照合用データ記憶領域121には、照合用データとして「ハイチーズ」という音素の列を示すデータが記憶されているものとする。
まず、会場の責任者等が、撮影装置1の操作部14を操作して、撮影装置のモードを「静止画自動撮影モード」に設定する。撮影モードが「静止画自動撮影モード」に設定されると、制御部11は、図4に示すステップS1〜S4の処理を所定単位時間毎(例えば、10ms毎等)に繰り返し実行し、特定音声が検出されるまで待機する。
ここで、図6(a)に示す例において、人物A2が「ハイチーズ」という音声を発し、また、このとき、人物A4と人物A5とが会話を行っていた場合の撮影装置1の動作について説明する。このとき、制御部11は、図4に示すステップS1とステップS2の処理を行い、複数のマイクロホン15毎の音声データを解析して方向別音声データを生成し、生成した方向別音声データのそれぞれの音圧レベルの分布から音源方向を推定する。図6(a)に示す例においては、制御部11は、方向C1と方向C2とを音源方向として推定する。
次いで、制御部11は、図4のステップS3に示す処理を行う。すなわち、制御部11は、方向C1に対応する方向別音声データと方向C2に対応する方向別音声データとをそれぞれ音声解析して音素の列を抽出し、抽出した音素の列と照合用データ記憶領域121に記憶された照合用データの示す音素の列とを照合して、その一致度が予め定められた条件を満たす場合には特定音声が検出されたと判定する。図6(a)に示す例では、制御部11は、方向C1について特定音声が検出されたと判定する。
次いで、制御部11は、図4のステップS5及びステップS6の処理を行う。すなわち、制御部11は、回動機構70を制御して、撮影装置1の撮影範囲Tの中心方向が、特定音声が検出された方向C1と一致するように、撮影装置1を回転させ、撮影を行う(図6(b)参照)。これにより、人物A1,A2,A3が被写体として撮影装置1に撮影される。
撮影を終えると、制御部11は、図4のステップS1の処理に戻り、特定音声を検出するまで待機する。ここで、例えば、人物A4が「ハイチーズ」という音声を発した場合には、制御部11は、ステップS1からステップS4の処理を行うことによってこの音声を検出し、人物A4の方向に撮影装置1の向きを変更して撮影を行う。このようにこの動作例では、撮影装置1が「ハイチーズ」という音声を検出する度に、撮影装置1が、その方向が撮影範囲に含まれるように撮影装置1の向きを変更して撮影を行う。
<D:実施形態の効果>
以上説明したように本実施形態によれば、利用者が撮影装置1に向かって特定音声を発すると、撮影装置1が発音方向に照準(カメラの方向)をあわせてシャッターを切る。これにより、例えば、パーティ等の参加者は、カメラに向かって予め定められた掛け声を発するだけで、撮影を行うことができる。また、他の動作例としては、動物を撮影する場合においては、撮影対象となる動物の鳴き声がすると、撮影装置1がその方向に向いてシャッターを切る。また、この撮影は撮影装置1が自動的に行うから、多数の写真を撮影するためにその都度撮影者が撮影装置1を移動させたり撮影装置1の向きを変えたりといった煩雑な操作を行う必要がない。なお、マイクロホン15の周波数特性は人間の可聴域を超える範囲であってもよく、例えば超音波に対しても適用可能である。
また、本実施形態によれば、マイクロホン15毎の音圧の相関に基づいて、方向に対する音圧の分布を算出し、算出した分布において音圧のピークが表れる方向を、音源の方向として特定するから、複雑な処理を行うことなく音源の方向を特定することができ、音源方向の推定処理に要する処理時間を短くすることができる。
<E:変形例>
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。以下にその一例を示す。なお、以下の各態様を適宜に組み合わせてもよい。
(1)音源方向の推定は、独立成分分析(Independent Component Analysis)を用いてもよい。独立成分分析は、複数の信号源からの各信号が空間内で混合されて複数のセンサに到来し、これらセンサで観測された到来信号から、各源信号の到来方向の推定や各源信号を分離することを、その源信号の混合系の情報を知らずに行うものであり、例えば特許3881367(特許文献2)の背景技術に記載されている。また、特許文献2に記載されている信号源の到来方向を求める技術を用いても良い。
(2)方向別音声データまたは特定方向音声データの生成方法は、上述の実施形態に記載された方法に限らず、前述の独立成分分析を用いてマイクロホン15の音声データから音源に対応する音声データを推定することで生成してもよい。また、特許文献2に記載されている技術を用いても良い。
(3)上述の実施形態における照合用データが表す音声の特徴は、個人の声の特徴(声紋など)であってもよい。制御部11は、方向別音声データを解析し、特定の個人の声の特徴が検出されたか否かを判定することで、特定の個人の声でのみ撮影装置を動作させるようにしてもよい。
(4)上述の実施形態では、特定音声が検出された方向に撮影装置1の向きを変更するようにしたが、これに代えて、特定音声が検出された方向を撮影者に報知するようにしてもよい。具体的には、例えば、撮影装置1が撮影者に撮影方向を案内するための音声メッセージを出力してもよく、また、例えば、表示部13に特定音声が検出された方向(以下「特定方向」という)を報知するメッセージを表示するようにしてもよい。また、例えば、撮影装置1に振動する振動子を設ける構成とし、特定音声が検出されたときに、制御部11が、その振動子を振動させて撮影対象に案内する方向への加速度を発生させるようにしてもよい。具体的には、例えば、撮影装置1の内部に、水平方向に回転する振動子を設け、撮影装置1の撮影範囲の中心方向から特定方向へ回転する向きに振動子を回転させるようにしてもよい。
(5)上述の実施形態では、撮影装置1が静止画像の撮影を自動的に行ったが、これに限らず、撮影者が撮影ボタンB2を押下することによって撮影を行うようにしてもよい。すなわち、撮影装置1が撮影範囲を自動的に変更し、撮影者が、変更された撮影範囲を確認しつつ撮影を行うようにしてもよい。
(6)上述の実施形態では、特定音声を検出したときに、撮影範囲を変更するようにしたが、これに代えて、予め定められた閾値以上の音圧が検出されたときに、撮影範囲を変更するようにしてもよい。すなわち、特定音声の発音の検出の有無を判定してもよく、また、任意の音声の発音の検出の有無を判定してもよく、要は、制御部11が、撮影装置1の周囲で収音された音声を表す音声データを解析し、解析結果に応じて発音の有無を判定し、発音有りと判定されたときに、発音有りと判定された方向を含むように撮影範囲を変更するようにすればよい。
また、上述の実施形態では、制御部11が撮影範囲を変更した後に静止画の撮影を行うようにしたが、これに限らず、動画の撮影を行うようにしてもよい。また、動画の撮影を行う場合には、制御部11が、所定時間毎に方向別音声データを生成し、生成した方向別音声データを解析して解析結果に基づいて音源の方向の遷移を検出し、音源の方向の遷移に追尾して撮影範囲をリアルタイムで変更するようにしてもよい。このようにすれば、例えば鳥などの発音体を追いつつ継続して撮影することができる。
(7)上述の実施形態では、制御部11がモータ723を駆動して撮影装置1の向きを変更するようにしたが、撮影範囲の変更の態様はこれに限らず、例えば、図7に示すように、撮影用レンズ18bやCCD18c等を含む撮影部18Aを図中P方向に回動させる回動機構を撮影装置1Aに設ける構成とし、撮影部18Aを回動させることによって撮影範囲を変更するようにしてもよい。図7に示す例において、回動部75はローラ76a,76b,76cによって撮影装置1Aに回動可能に支持されており、この回動部75に撮影部18Aが固定されている。回動部75の回動に伴って撮影部18Aが回動する。モータ77は、制御部11の制御の下にローラ78を回転させ、ローラ78の回転に伴って回動部75が回転する。なお、撮影部18Aを回動させる構成はこれに限らず、他の回動機構を用いて撮影部を回動させるようにしてもよい。
このように、撮影装置の撮影範囲を変更する態様としては、撮影装置本体を回動させるようにしてもよく、また、撮影機構を回動させるようにしてもよく、要は、制御部11が、発音有りと判定された方向が撮影範囲に含まれるように、撮影範囲を変更するように撮影装置1を制御すればよい。
(8)上述の実施形態では、図2に示すような、複数のマイクロホン15が列状に配置されて構成されたマイクアレイを備える撮影装置1について説明したが、マイクロホン15の配置態様はこれに限らず、例えば、マイクロホン15が面状(2次元状)に配置されて構成されたマイクアレイを備える構成としてもよい。また、例えば、図8に示すような、撮影装置1の前面及び側面に3次元状に配置されて構成されたマイクアレイを備える構成としてもよい。この場合は、撮影装置1Aは、音源の角度として、x軸方向(図8参照)の角度だけでなく、y軸方向及びz軸方向(図8参照)の角度をも推定することができるから、音源の方向を3次元で推定することができ、より詳細な方向を推定することができる。また、この場合は、より広い範囲で音源を検出することができる。
また、マイクロホンを2次元又は3次元に配置されて構成されたマイクアレイを備える撮影装置を用いる場合には、撮影装置1を水平方向(図8における矢印P方向)に回転させるに加えて垂直方向(図8における矢印Q方向)に回転させる回動機構70Aを備える構成としてもよい。
また、上述の実施形態におけるマイクロホン15は、小型のシリコンマイクを用いるようにしてもよい。
(9)上述の実施形態では、映像データを記憶する記憶手段としてハードディスク装置等の記憶部12を用いたが、映像データを記憶する記憶手段はハードディスク装置に限らず、例えば、SDカード、CD−R、CD−R/W等の記録媒体等であってもよく、要は、制御部11が、映像データを、コンピュータが読取可能な記録媒体に記録するようにすればよい。また、通信ネットワークを介して所定のサーバ装置に映像データを出力するようにしてもよい。
(10)上述の実施形態では、撮影装置1が、上記実施形態に係る全ての処理を実行するようになっていた。これに対し、通信ネットワークや通信I/F等で接続された2以上の装置で上記実施形態に係る処理を分担して実行するようにし、それら複数の装置を備えるシステムが同実施形態の撮影装置1を実現するようにしてもよい。具体的には、例えば、デジタルカメラとコンピュータ装置とが、USB等の通信I/Fを介して接続されたシステムとして構成されていてもよい。
(11)上述の実施形態では、制御部11が、角度における音圧の分布を算出し、算出した分布において音圧のピークが表れる方向を音源方向として推定したが、これに加えて、撮影部18から出力される映像データを画像解析して人物抽出(又は顔抽出)処理を行い、抽出した人物(又は顔)の位置に対応する方向を音源方向として推定するようにしてもよい。
また、上述の実施形態では、制御部11は、音源方向からの音声を表す音声データの特徴を表す特徴データと、照合用データ記憶領域121に記憶された照合用データとを照合し、その一致度に基づいて収音方向を特定するようにしたが、収音方向の特定方法はこれに限らず、例えば、特定の被写体の画像を表すデータを照合用データとして照合用データ記憶領域121に予め記憶しておき、制御部11が、撮影部18から出力される映像データを画像解析し、解析結果に応じて人物抽出(又は顔抽出)処理を行い、抽出した人物(又は顔)の画像データと照合用データ記憶領域121に記憶された照合用データとを照合して、その一致度に基づいて収音方向を特定するようにしてもよい。
(12)上述の実施形態では、撮影装置1の制御部11は、音圧分布を算出してピーク値が表れる角度を音源方向として推定した。音源方向の推定方法はこれに限らず、例えば、所定単位量の角度毎に音圧を検出し、検出した音圧が予め定められた閾値以上となる角度を音源方向として検出するようにしてもよく、要は、制御部11が、マイクロホン15から出力される音声データの音圧を所定単位量の角度毎に検出し、検出した角度毎の音圧から音源方向を推定するようにすればよい。
また、上述の実施形態では、音声データの音圧に基づいて音源方向を推定したが、これに限らず、マイクロホン15毎の音声データの周波数を検出し、検出したマイクロホン15毎の周波数の相関に基づいて音源方向を推定するようにしてもよい。
このように、音源方向は、音声データの音圧に基づいて検出してもよく、また、周波数に基づいて検出するようにしてもよく、要は、制御部11が、マイクロホン15から出力される音声データを解析し、解析結果に応じて音源方向を推定するものであればよい。
(13)また、上述の実施形態において、制御部11が音源(被写体)にピントを合わせるように撮影部18を制御するようにしてもよい。この場合は、例えば、制御部11が、複数の異なるマイクロホン15(例えば、図2に示すマイクロホン151とマイクロホン15n)が収音した音声を表す音声データを解析し、音が複数のマイクロホン15のそれぞれに到達する時間差を算出し、算出した時間差を用いて撮影装置1と音源との距離を算出し、算出結果に応じてフォーカス制御を行うようにしてもよい。
(14)上述の実施形態では、本発明に係る撮影装置をデジタルカメラに適用した例について説明したが、本発明に係る撮影装置が適用される装置はデジタルカメラに限らず、例えば、パーソナルコンピュータ、携帯通信端末、コンピュータゲーム機等であってもよく
本発明に係る撮影装置は様々な装置に適用可能である。
(15)上述の実施形態における撮影装置1の制御部11によって実行されるプログラムは、磁気テープ、磁気ディスク、フレキシブルディスク、光記録媒体、光磁気記録媒体、ROMなどの記録媒体に記録した状態で提供し得る。また、インターネットのようなネットワーク経由で撮影装置1にダウンロードさせることも可能である。
撮影装置のハードウェア構成の一例を示すブロック図である。 撮影装置の外観の一例を示す斜視図である。 回動機構の構成の一例を示す図である。 撮影装置が行う撮影処理の流れを示すフローチャートである。 制御部が算出する音圧分布の一例を示す図である。 撮影装置の動作の一例を説明するための図である。 回動機構の構成の一例を示す図である。 撮影装置の外観の一例を示す斜視図である。
符号の説明
1…撮影装置、11…制御部、12…記憶部、13…表示部、14…操作部、15…マイクロホン、16…音声処理部、17…スピーカ、18…撮影部、61…台、70…回動機構、71…回動部、72…固定部、121…照合用データ記憶領域、122…映像データ記憶領域。

Claims (10)

  1. 撮影範囲が設定され、該撮影範囲内の映像を表す映像データを出力する撮影手段と、
    前記撮影手段の周囲でマイクロホン毎に収音し、音声データとして出力する複数のマイクロホンと、
    前記複数のマイクロホンのそれぞれから出力される音声データを解析し、解析結果に応じて発音の有無を判定する発音有無判定手段と、
    前記複数のマイクロホンのそれぞれから出力される音声データを解析し、解析結果に応じて音源の方向を推定する推定手段と、
    前記発音有無判定手段により発音有りと判定されたときに、前記推定手段により推定された前記音源の方向を報知する報知手段と
    を具備することを特徴とする撮影装置。
  2. 撮影範囲が設定され、該撮影範囲内の映像を表す映像データを出力する撮影手段と、
    前記撮影手段の周囲でマイクロホン毎に収音し、音声データとして出力する複数のマイクロホンと、
    前記複数のマイクロホンのそれぞれから出力される音声データを解析し、解析結果に応じて発音の有無を判定する発音有無判定手段と、
    前記複数のマイクロホンのそれぞれから出力される音声データを解析し、解析結果に応じて音源の方向を推定する推定手段と、
    前記発音有無判定手段により発音有りと判定されたときに、前記撮影手段の前記撮影範囲を、前記方向推定手段により推定された音源の方向を含む範囲に変更する撮影範囲変更手段と
    を具備することを特徴とする撮影装置。
  3. 前記撮影範囲変更手段により前記撮影範囲が変更されたときに、前記撮影手段から出力される映像データを所定の記憶手段に記憶する映像データ記憶制御手段
    を具備することを特徴とする請求項2に記載の撮影装置。
  4. 音声の特徴を表す照合用データを記憶する照合用データ記憶手段と、
    前記マイクロホン毎の音声データから、前記推定手段により推定された方向のそれぞれに対応した方向別音声データを生成する方向別音声データ生成手段と
    を具備し、
    前記発音有無判定手段は、前記方向別音声データ生成手段により生成された音声データと前記照合用データ記憶手段に記憶された照合用データとを比較し、その一致度に応じて発音の有無を判定する
    ことを特徴とする請求項1乃至3のいずれか1項に記載の撮影装置。
  5. 前記照合用データは、特定の個人の声の特徴情報を含むことを特徴とする請求項4に記載の撮影装置。
  6. 前記方向別音声データ生成手段は、前記推定手段により推定された方向からの音圧が高くなるようにミキシングして方向別音声データを生成することを特徴とする請求項4又は5に記載の撮影装置。
  7. 前記方向別音声データ生成手段は、独立成分分析を用いて前記音声データから音源に対応する音声データを推定することで特定方向音声データを生成することを特徴とする請求項4又は5に記載の撮影装置。
  8. 前記推定手段は、独立成分分析を用いて音源の方向を推定することを特徴とする請求項1乃至7のいずれかに記載の撮影装置。
  9. 前記推定手段は、前記マイクロホン毎の音声データの相関に基づいて、前記撮影手段の周囲における音圧の分布を算出し、算出した分布において音圧のピークが表れる方向を前記音源の方向として推定する
    ことを特徴とする請求項1乃至4のいずれか1項に記載の撮影装置。
  10. 前記撮影範囲変更手段は、前記発音有無判定手段により発音有りと判定されたときに、前記撮影手段の前記撮影範囲に前記推定手段により推定された音源の方向が含まれるように前記撮影手段の向きを変更する
    ことを特徴とする請求項2又は3に記載の撮影装置。
JP2008013817A 2008-01-24 2008-01-24 撮影装置 Pending JP2009177480A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008013817A JP2009177480A (ja) 2008-01-24 2008-01-24 撮影装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008013817A JP2009177480A (ja) 2008-01-24 2008-01-24 撮影装置

Publications (1)

Publication Number Publication Date
JP2009177480A true JP2009177480A (ja) 2009-08-06

Family

ID=41032120

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008013817A Pending JP2009177480A (ja) 2008-01-24 2008-01-24 撮影装置

Country Status (1)

Country Link
JP (1) JP2009177480A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013172313A (ja) * 2012-02-21 2013-09-02 Nikon Corp 情報処理装置及び情報処理プログラム
KR20160061706A (ko) * 2014-11-24 2016-06-01 한화테크윈 주식회사 카메라 장치 및 카메라 제어 시스템
WO2019130909A1 (ja) * 2017-12-26 2019-07-04 キヤノン株式会社 撮像装置及びその制御方法及び記録媒体
JP2019117374A (ja) * 2017-12-26 2019-07-18 キヤノン株式会社 撮像装置及びその制御方法及びプログラム
CN111527739A (zh) * 2017-12-26 2020-08-11 佳能株式会社 摄像设备及其控制方法和记录介质
US11102389B2 (en) 2017-09-28 2021-08-24 Canon Kabushiki Kaisha Image pickup apparatus and control method therefor

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013172313A (ja) * 2012-02-21 2013-09-02 Nikon Corp 情報処理装置及び情報処理プログラム
KR20160061706A (ko) * 2014-11-24 2016-06-01 한화테크윈 주식회사 카메라 장치 및 카메라 제어 시스템
KR102236271B1 (ko) * 2014-11-24 2021-04-05 한화테크윈 주식회사 카메라 장치 및 카메라 제어 시스템
US11102389B2 (en) 2017-09-28 2021-08-24 Canon Kabushiki Kaisha Image pickup apparatus and control method therefor
WO2019130909A1 (ja) * 2017-12-26 2019-07-04 キヤノン株式会社 撮像装置及びその制御方法及び記録媒体
JP2019117374A (ja) * 2017-12-26 2019-07-18 キヤノン株式会社 撮像装置及びその制御方法及びプログラム
CN111527739A (zh) * 2017-12-26 2020-08-11 佳能株式会社 摄像设备及其控制方法和记录介质
CN111527446A (zh) * 2017-12-26 2020-08-11 佳能株式会社 摄像设备及其控制方法和记录介质
CN111527446B (zh) * 2017-12-26 2022-05-17 佳能株式会社 摄像设备及其控制方法和记录介质
US11503213B2 (en) * 2017-12-26 2022-11-15 Canon Kabushiki Kaisha Image capturing apparatus, control method, and recording medium
JP7292853B2 (ja) 2017-12-26 2023-06-19 キヤノン株式会社 撮像装置及びその制御方法及びプログラム

Similar Documents

Publication Publication Date Title
JP4896838B2 (ja) 撮像装置、画像検出装置及びプログラム
JP5206095B2 (ja) 構図判定装置、構図判定方法、プログラム
US8264583B2 (en) Information processing apparatus, method and computer program product
CN102263899B (zh) 摄影装置及其控制方法
CN106131413B (zh) 一种拍摄设备的控制方法及拍摄设备
CN104092936A (zh) 自动对焦方法及装置
JP7347597B2 (ja) 動画編集装置、動画編集方法及びプログラム
JP4941895B2 (ja) 音データ付き画像記録装置及びプログラム
JP2009177480A (ja) 撮影装置
JP5477777B2 (ja) 画像取得装置
JP2009141555A (ja) 音声入力機能付き撮像装置及びその音声記録方法
JP4968346B2 (ja) 撮像装置、画像検出装置及びプログラム
JP2009210992A (ja) 撮影装置
JP2007213282A (ja) 講演者支援装置および講演者支援方法
JP2009239346A (ja) 撮影装置
RU2531023C2 (ru) Аудиоуправляемый захват изображений
JP6205941B2 (ja) 撮像プログラム、撮像方法および情報処理装置
JP2009239348A (ja) 撮影装置
JP2024059809A (ja) 情報処理装置、情報処理方法、情報処理システム及び情報処理プログラム
JP2009239349A (ja) 撮影装置
JP2010200084A (ja) 撮像装置
JP6631166B2 (ja) 撮影装置、プログラム及び撮影方法
JP6191333B2 (ja) 情報処理装置、通信システムおよびプログラム
JP5712599B2 (ja) 撮像装置及びプログラム
WO2020006664A1 (zh) 拍摄装置的控制方法、拍摄装置、拍摄系统和存储介质