JP4941895B2 - 音データ付き画像記録装置及びプログラム - Google Patents

音データ付き画像記録装置及びプログラム Download PDF

Info

Publication number
JP4941895B2
JP4941895B2 JP2007110156A JP2007110156A JP4941895B2 JP 4941895 B2 JP4941895 B2 JP 4941895B2 JP 2007110156 A JP2007110156 A JP 2007110156A JP 2007110156 A JP2007110156 A JP 2007110156A JP 4941895 B2 JP4941895 B2 JP 4941895B2
Authority
JP
Japan
Prior art keywords
recording
subject
sound data
image
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007110156A
Other languages
English (en)
Other versions
JP2008271082A (ja
JP2008271082A5 (ja
Inventor
智久 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2007110156A priority Critical patent/JP4941895B2/ja
Publication of JP2008271082A publication Critical patent/JP2008271082A/ja
Publication of JP2008271082A5 publication Critical patent/JP2008271082A5/ja
Application granted granted Critical
Publication of JP4941895B2 publication Critical patent/JP4941895B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Description

本発明は、音データ付き画像記録装置及びプログラムに関し、詳しくは、録音手段で集音した音データと画像とを対応付けして記録する、たとえば、ビデオカメラやデジタルカメラに適用できる音データ付き画像記録装置及びプログラムに関する。
音データ付き画像の記録に関する従来技術としては、たとえば、下記の特許文献1に記載された「撮影装置及び撮影方法」などが知られている。この従来技術では、録画開始ボタンの操作から録画終了ボタンの操作までの間、撮影画像と音データをバッファメモリに展開し続け、録画終了ボタン操作に応答して、それらの撮影画像と音データを用いて音データ付き画像ファイルを生成しメモリに記録している。
これによれば、たとえば、公園などで遊ぶ自分の子供の様子を音データ付き画像で記録する場合には、注目被写体(この場合、自分の子供)にカメラのレンズを向けて構え、必要であればレンズの倍率(ズーム比)を調節し、しかる後、録画ボタンを操作して録画を開始し、必要なシーンを撮り終えたと判断したときに、録画終了ボタンを操作して録画を終了することにより、録画の開始から終了までの間の音データ付き画像ファイルを磁気テープやメモリ等に保存することができる。
特開2006−314136号公報
しかしながら、前記の従来技術は、単に音データ付き画像ファイルを生成してメモリに記録するだけの技術を開示しているに過ぎず、録音の集音範囲を特定条件に応じて変更することはできなかった。
そこで、本発明の目的は、録音の集音範囲を特定条件に応じて変更することにより、良好な録音ができる音データ付き画像記録装置及びプログラムを提供することにある。
本発明による音データ付き画像記録装置またはその制御プログラムは、被写体を撮像する撮像手段と、複数の異なる位置に設置された複数の録音装置であって、画像により各々の録音装置を識別可能な識別情報が付加された複数の録音装置から取得した音データの記録を行う録音手段と、複数の被写体の各々から発せられる複数の音データのうち、撮影または録音の対象となる注目被写体から発せられる音データを前記録音手段により選択的に記録させる録音対象制御手段と、前記撮像手段により撮像された撮影画像内より前記複数の被写体を検出し、この検出結果に応じて前記注目被写体を特定するとともに、前記撮像手段により撮像された撮影画像内における前記識別情報の位置を特定する特定手段と、を備え、前記録音対象制御手段は、前記特定手段により特定された注目被写体の近くに設置されている録音装置を、前記特定手段により特定された識別情報の位置に応じて選択して記録させることを特徴とする。
また、他の態様による音データ付き画像記録装置またはその制御プログラムは、被写体を撮像する撮像手段と、複数の異なる位置に設置された複数の録音装置であって、各々が自己を識別可能な所定形態で音データを送信する複数の録音装置からなる録音手段と、前記撮像手段により撮像された撮影画像に基づく画像認識処理によって、音を発する複数の被写体の中から録音対象となる音を発する注目被写体の位置を特定する被写体特定手段と、前記被写体特定手段により特定された注目被写体の近くに設置されている録音装置を特定する録音装置特定手段と、前記録音装置特定手段により特定された録音装置から送信されてくる音データを、前記録音手段に含まれる複数の録音装置の各々から送信されてくる音データの前記所定形態に基づいて選択して記録させる録音制御手段と、を備えたことを特徴とする。
また、他の態様による音データ付き画像記録装置またはその制御プログラムは、被写体を撮像する撮像手段と、複数の異なる位置に設置された複数の録音装置であって、各々が自己を識別可能な所定形態で音データを送信する複数の録音装置からなる録音手段と、前記撮像手段の撮影位置または撮影方向を特定する撮影状態特定手段と、前記撮影方向特定手段により特定された撮影位置または撮影方向に設置されている録音装置を特定する録音装置特定手段と、前記録音装置特定手段により特定された録音装置から送信されてくる音データを、前記録音手段に含まれる複数の録音装置の各々から送信されてくる音データの前記所定形態に基づいて選択して記録させる録音制御手段と、を備えたことを特徴とする。
また、他の態様による音データ付き画像記録装置またはその制御プログラムは、被写体を撮像する撮像手段と、複数の異なる位置に設置された複数の録音装置からなる録音手段と、前記撮像手段により撮像された撮影画像に基づく画像認識処理によって、録音対象となる音を発する注目被写体の位置を特定する被写体特定手段と、前記撮像手段により撮像された撮影画像に基づく画像認識処理によって、前記被写体特定手段により特定された注目被写体の近くに設置されている録音装置を特定する録音装置特定手段と、前記録音手段に含まれる複数の録音装置の中から前記録音装置特定手段により特定された録音装置を選択して記録させる録音制御手段と、を備えたことを特徴とする。
また、他の態様による音データ付き画像記録装置またはその制御プログラムは、被写体を撮像する撮像手段と、音データの録音を行う録音手段と、前記撮像手段の画角を変化させる画角変更手段と、前記画角変更手段により変化する画角に対応させて前記録音手段の集音範囲を変化させる集音範囲制御手段と、を備え、前記録音手段は、各々が異なる集音範囲を持つ複数の録音装置から音データを選択的に取得して録音し、前記集音範囲制御手段は、前記画角の変化に応じて前記録音手段により音データを取得させる複数の録音装置の組み合わせを変化させることを特徴とする。
本発明によれば、複数の被写体の各々から発せられる複数の音声データのうち、撮影画像内被写体から発せられる音声データを、複数の異なる位置に設置された複数の録音装置から選択的に音声データを取得して記録させることにより、良好な録音ができる。
以下、本発明の実施形態を、音データ付きの画像撮影機能を備えた撮像装置、たとえば、デジタルカメラへの適用を例にして、図面を参照しながら説明する。なお、以下の説明における様々な細部の特定ないし実例および数値や文字列その他の記号の例示は、本発明の思想を明瞭にするための、あくまでも参考であって、それらのすべてまたは一部によって本発明の思想が限定されないことは明らかである。また、周知の手法、周知の手順、周知のアーキテクチャおよび周知の回路構成等(以下「周知事項」)についてはその細部にわたる説明を避けるが、これも説明を簡潔にするためであって、これら周知事項のすべてまたは一部を意図的に排除するものではない。かかる周知事項は本発明の出願時点で当業者の知り得るところであるので、以下の説明に当然含まれている。
<第1実施形態>
図1は、第1実施形態に係る音データ付きの画像撮影機能を備えたデジタルカメラ100の概略構成を示すブロック図である。デジタルカメラ100は、撮影レンズ部101と、CCDやCMOS等の撮像素子102と、中央処理部103とを有している。中央処理部103は、画像データの圧縮・伸張、音データの処理を含む各種のデジタル信号処理機能を有するとともにデジタルカメラ100の各部を制御するワンチップマイクロコンピュータ(以下、単にマイコン又はコンピュータという。)である。
撮影レンズ部101は、可変焦点(いわゆるズーム)機構付のものであり、中央処理部103からの制御を受けた画角変更駆動部104によって広角(ワイド)と望遠(テレ)との間のズーム比を任意に変更し、そのズーム比に対応した撮影画角(以下、単に画角αという。)に調節することができるものである。すなわち、ズーム比をワイド側に変更した場合は、画角αが大きく(広く)なり、テレ側に変更した場合は、画角αが小さく(狭く)なるものである。なお、ズーム機構は、光学的なズームはもちろん電子的なズーム機構であってもよい。
中央処理部103には、撮像素子102を駆動するTG(Timing Generator)105が接続されており、TG105には、撮像素子102から出力される被写体の光学像に応じたアナログの撮像信号が入力する画像処理部106が接続されている。画像処理部106は、撮像素子102から出力される撮像信号を相関二重サンプリングして保持するCDS(Correlated Double Sampling)回路、その撮像信号を増幅するゲイン調整アンプ(AGC)、増幅後の撮像信号をデジタル信号に変換するA/D変換器(AD)などから構成されており、撮像素子102の出力信号は画像処理部106を経てデジタル信号として中央処理部103に送られる。
中央処理部103には、操作部107、表示装置108、音声処理部109が接続されるとともに、アドレス・データバス110を介してDRAM111、内蔵フラッシュメモリ112、カード・インターフェイス113が接続されており、カード・インターフェイス113には、デジタルカメラ100の本体に設けられた図示しないスロットに装着された着脱自在なメモリ・カード114が接続されている。
操作部107はシャッタボタン107aや、音データ付きの画像撮影に使用する録画開始ボタン107b及び録画終了ボタン107c、ズームボタン107d、その他のボタン(電源キーやMENUキー等)を含み、ユーザによるキー操作に応じたボタン入力信号を中央処理部103に出力する。表示装置108はカラーLCDとその駆動回路とを含み、撮影待機状態にあるときには撮像素子102によって撮像された被写体画像をスルー画像(構図確認用のファインダ画像)として表示し、記録画像の再生時には保存用メモリであるメモリ・カード114から読み出され伸張された記録画像(静止画又は動画)を表示する。
音声処理部109は、アンプ、A/D変換器、内蔵スピーカー、D/A変換器等を含み、音データ付きの静止画又は動画の撮影時には、マイク115に入力した音をデジタル信号に変換して中央処理部103へ送る。中央処理部103へ送られた音データはDRAM111に順次蓄積され、最終的には、中央処理部103によって生成された画像データと共にメモリ・カード114に記録される。また、音声処理部109は、音データ付きの静止画又は動画の再生時には、各画像に付属する音データを再生して内蔵スピーカから音響出力する。また、必要に応じ、内蔵スピーカーにより各種の報知音を放音する。
DRAM111は、撮像素子102により撮像された後、デジタル化された被写体の画像データ等を一時記憶するバッファメモリであるとともに、中央処理部103のワーキングメモリとしても使用される。内蔵フラッシュメモリ112には、中央処理部103による各部の制御に必要な制御プログラム、すなわちAF(オートフォーカス制御)やAE(自動露出制御)等を含む各種の制御に必要なプログラム、及び各制御に必要なデータが記憶されている。
マイク115は、詳細には集音範囲可変機構付のものであり、中央処理部103からの制御を受けた集音範囲変更駆動部116によって、集音範囲βを広くしたり狭くしたりすることができるものである。ここで、“集音範囲”とは、そのマイクで集音することができる音の到来方向の範囲のことをいい、マイクの指向方向を中心とした上下左右のある範囲のことをいう。マイク115の集音範囲βは、集音範囲変更駆動部116を経由した中央処理部103からの制御により、任意に変更すること(βを大きくしたり、小さくしたりすること)ができるものである。
図2は、第1実施形態のマイク115に使用することができる集音範囲可変機構付マイクの一例構造図である。マイク115の集音範囲βは、(a)に示すように、マイク115に対する音響到来方向(図では簡単化のために三つの方向a〜cで代表する。)ごとの音響出力レベルを同一レベルで結んだ線図の拡がり角度で与えられる。集音範囲可変とは、このβが可変であることを意味する。
集音範囲可変機構付マイクの実例としては様々なものが知られているが、ここではそのうちの二つのものを例示する。たとえば、(b)は、振動板118が取り付けられたケース119の後ろ側に音響迷路(ラビリンス)と呼ばれる複数の穴120を形成し、この穴120を閉鎖機構121によって選択的に閉鎖することにより、集音範囲βを可変とするものである。この場合、振動板118やケース119及び音響迷路(複数の穴120)は図1のマイク115に相当し、閉鎖機構121は図1の集音範囲変更駆動部116に相当する。この(b)の集音範囲可変機構付マイクを第1実施形態のマイク115として使用する場合、マイクから取り出された音響出力信号S1を図1の音声処理部109に入力すると共に、中央処理部103からの集音範囲制御信号S2を閉鎖機構121に入力すればよい。
また、(c)は、単一指向性の二つのマイクユニット122、123を背中合わせに配置し、それら二つのマイクユニット122、123からの音響出力信号S3、S4を音声合成部124によって任意の比率で合成することにより、集音範囲βを可変とするものである。この場合、二つのマイクユニット122、123は図1のマイク115に相当し、音声合成部124は図1の集音範囲変更駆動部116に相当する。この(c)の集音範囲可変機構付マイクを第1実施形態のマイク115として使用する場合、音声合成部124から取り出された音響出力信号S5を図1の音声処理部109に入力すると共に、中央処理部103からの集音範囲制御信号S2を音声合成部124に入力すればよい。
次に、以上の構成からなるデジタルカメラ100における動作を説明する。
図3は、中央処理部103で実行される音データ付き画像記録処理の手順を示す図である。
この図において、まず、音データ付き画像記録であるか否かを判定し(ステップS1)、判定結果が否(NO)であれば、静止画記録又は音データ無し動画記録或いは記録済み静止画や動画の再生、若しくは、メニュー処理等のその他の処理であると判断して、それらの処理に分岐(ステップS2)する一方、音データ付き画像記録である場合には、以下の処理を逐次に実行する。
すなわち、撮影レンズ部101の現在の画角α(ズーム比)を取得し(ステップS3)、次いで、マイク115の集音範囲βを上記の画角αに対応させて変更する。ここで、“画角αに対応させて”とは、少なくとも、ファインダ内の被写体の音を集音し、且つ、ファインダから外れた被写体の音を集音しないように、マイク115の集音範囲βを適切に可変設定することをいう。なお、“音を集音しない”とは、理想的には集音レベル0のことを意味するが、これに限定されず、たとえば、人間の耳に知覚し得ない小さなレベル、あるいは、知覚し得たとしてもファインダ内の被写体の音と区別できる程度の抑制されたレベルであってもよい。
図4は、集音範囲βと画角αとの対応関係を示す図である。この図において、小さな横長矩形125は、撮影レンズ部101のズーム比をテレ端にしたときのファインダ画面(表示装置108のモニタ画面)を表しており、大きな横長矩形126は、撮影レンズ部101のズーム比をワイド端にしたときのファインダ画面(表示装置108のモニタ画面)を表している。以下、小さな横長矩形125を「テレ端ファインダ画面125」といい、大きな横長矩形126を「ワイド端ファインダ画面126」ということにする。
テレ端ファインダ画面125の各コーナに接して描かれている二重の円127、128は、それぞれテレ端における集音範囲βと画角αの関係を模式的に表しており、また、ワイド端ファインダ画面126の各コーナに接して描かれている二重の円129、130は、それぞれワイド端における集音範囲βと画角αの関係を模式的に表している。前記において、「マイク115の集音範囲βを上記の画角αに対応させて変更する」とは、この図のように、撮影レンズ部101をテレ端にした場合に、そのテレ端の画角α(円127)とほぼ一致させるようにマイク115の集音範囲β(円128)を設定し、また、撮影レンズ部101をワイド端にした場合に、そのワイド端の画角α(円129)とほぼ一致させるようにマイク115の集音範囲β(円130)を設定することを意味する。
ただし、これらの円127、128、129、130は、「マイク115の集音範囲βを上記の画角αに対応させて変更する」ことを概念的に表したものに過ぎず、この定義(円127と128の大きさをほぼ一致させ、また、円129と130の大きさをほぼ一致させる)から発明の外縁を把握してはならない。これは、集音範囲βと画角αは互いに異なる物理量(一方は“音”、他方は“画像”)に属するからであり、両者を同一のスケールで対比できないからである。実際には、たとえば、多方向からの音をマイク115で集音しつつ、ファインダを覗きながら、各々のズーム比(画角α)ごとに、ファインダ外の音を抑制できる適切な集音範囲βを試行錯誤的に調べていけばよい。
再び図3に戻り、ステップS4で「マイク115の集音範囲βを上記の画角αに対応させて変更する」と、次に、表示装置108にスルー画像を表示する(ステップS5)。ユーザは、このスルー画像を見ながら構図を調節し、また、必要であれば、操作部107のズームボタン107cを操作して所要のズーム比(画角α)に設定する。この間、操作部107の録画開始ボタン107aは押されておらず、したがって、図3のステップS5の判定結果が“NO”となって、以上のステップS1〜ステップS5を繰り返す。
所望の構図及び所望のズーム比が得られた場合、ユーザは操作部107の録画開始ボタン107aを操作する。このため、ステップS5の判定結果が“YES”となり、マイク115で集音した集音範囲βの音データをDRAM111に一時記録する(ステップS6)と共に、撮像素子102で撮影した画角αの画像データをDRAM111に一時記録する(ステップS7)。
そして、ユーザによって操作部107の録画終了ボタン107bが押されるまで、ステップS6とステップS7を繰り返し実行し、その間、所望シーンの音データと画像データがDRAM111に一時記録され続ける。しかる後、所望シーンの記録完了時、すなわち、ユーザによって操作部107の録画終了ボタン107bが押され、図3のステップS5の判定結果が“YES”になると、次に、DRAM111に一時記録されていた音データと画像データとを合成して、音データ付き画像ファイルを生成し(ステップS9)、必要であれば、その音データ付き画像ファイルを圧縮(たとえば、MPEG形式のファイルに圧縮)し、その音データ付き画像ファイルを内蔵フラッシュメモリ112又はメモリ・カード114に保存(ステップS10)した後、音データ付き画像記録処理を終了する。
以上のとおり、この第1実施形態によれば、音データ付き画像を記録する際に、マイク115の集音範囲βを撮影レンズ部101の画角αに対応して変更するので、表示装置108のスルー画像(すなわち、ファインダの画像)に含まれる被写体の音データだけを集音することができ、又は、スルー画像に含まれない被写体(ファインダの画像)の音と区別して(集音レベルに差を付けるなどして)集音することができる。したがって、記録された音データ付き画像ファイルには、ファインダ内の被写体(注目被写体)の音データが他の音データと区別可能な状態で含まれているから、その音データ付き画像ファイルの再生時に、注目被写体の音データに他の音データがかぶって聞き取りにくくなるという不都合を来すことがない。
たとえば、このことを図4を参照しながら説明すると、この図において、便宜的に示す三人の被写体131、132、133のうち、テレ端ファインダ画面125に入っているのは右側の被写体133であり、それ以外の被写体131、132は、このテレ端ファインダ画面125の外に位置しているから、この場合の注目被写体は被写体133である。また、ワイド端ファインダ画面126に入っているのは中央と右側の被写体132、133であり、それ以外の被写体131は、このワイド端ファインダ画面126の外に位置しているから、この場合の注目被写体は被写体132、133である。
テレ端ファインダ画面125のときの画角αは円127で示されており、同様に、テレ端ファインダ画面125のときのマイク115の集音範囲βは上記の円127とほぼ一致する大きさの円128で示されている。したがって、マイク115は円128の内側の音を感度よく集音するので、この場合、注目被写体である被写体133の音だけがマイク115で良好に集音され、他の被写体131、132の音は低感度、つまり、レベルゼロ又は大きく抑制されたレベルでマイク115で集音されることになる。
又は、ワイド端ファインダ画面126のときの画角αは円129で示されており、同様に、ワイド端ファインダ画面126のときのマイク115の集音範囲βは上記の円129とほぼ一致する大きさの円130で示されている。したがって、マイク115は円130の内側の音を感度よく集音するので、この場合、注目被写体である被写体132、133の音だけが良好にマイク115で集音され、他の被写体131の音は低感度、つまり、レベルゼロ又は大きく抑制されたレベルでマイク115で集音されることになる。
このように、第1実施形態においては、撮影レンズ部101の画角α(ズーム比)を変えると、その画角αに対応してマイク115の集音範囲βも変化するので、テレ端からワイド端までの間の如何なるズーム比においても、ファインダ内(つまり、撮影画角α内)の被写体の音を識別して画像と一緒に記録できる音データ付き画像記録装置を提供することができる。
なお、以上の第1実施形態では、ズーム機能付の撮影レンズ部101を例にしたが、これに限らない。固定焦点方式の撮影レンズ部101であってもよい。この場合、撮影レンズ部101の焦点距離から画角αを割り出し、その画角αに対応させてマイク115の集音範囲βを適切に設定すればよい。
また、図3では、撮影開始以後、マイクの集音範囲を撮影レンズの画角に対応させて変更する処理を停止しているが当然このようではなくともよく、撮影中であっても撮影レンズの画角が変更された場合に、マイクの集音範囲を変更するようにしてもよい。
また、AFを行うときに取得する被写体までの距離を利用して、この距離に応じて録音音量を変更するように構成してもよい。また、被写体までの距離を取得するのは、AFによらなくとも構わず、位相差センサや距離画像センサを別途搭載することにより、被写体までの距離を取得する構成としても構わない。
<第2実施形態>
図5は、第2実施形態に係る音データ付きの画像撮影機能を備えたデジタルカメラ200の概略構成を示すブロック図である。なお、前記の第1実施形態のデジタルカメラ100と共通する構成要素には同じ符号を付してその説明を省略する。このデジタルカメラ200と、前記の第1実施形態のデジタルカメラ100との相違は、第1実施形態のデジタルカメラ100のマイク115と集音範囲変更駆動部116の代わりに単一指向性(又は超指向性)のマイク201を備えた点にある。
図6(a)は、マイク201の外観図である。マイク201は、マイク本体201aとマイク指向方向駆動部201bとからなり、マイク指向方向駆動部201bは、中央処理部103からの制御を受けて、マイク本体201aの指向方向(マイク感度の最も高い方向)を上下左右に任意に駆動する。したがって、このマイク201は単一指向性のために特定方向(マイク本体201aの指向方向)の音だけを高感度で集音することができ、しかも、音を集音する方向をマイク指向方向駆動部201bによって上下左右に任意に駆動することができる。
なお、マイク201の構成は、図5や図6(a)で示すものに限定されない。たとえば、マイクアレイで構成されたものであってもよい。
図6(b)は、マイク201の他の構成を示す図であり、アレイ方式のマイク202を示す図である。このマイク202は、複数のマイク203a〜203dからなるマイクアレイ203と、複数のマイク203a〜203dから出力された各音響出力信号を中央処理部103からの混合割合指示制御信号S6に従って混合し、音響信号S7として出力する混合回路204とを備えており、各音響出力信号の混合割合を変えることにより、指向方向を電子的に任意に変更することができるものである。このようなアレイ方式のマイク202を図5のマイク201の代わりに用いてもよい。このような構成によっても、音を集音する方向を上下左右に任意に変更することができる。
次に、以上の構成からなるデジタルカメラ200における動作を説明する。
図7は、中央処理部103で実行される音データ付き画像記録処理の手順を示す要部図である。なお、この図は、先の図3のステップS1、ステップS3〜ステップS6に置き換わるものであり、図示を略したその他のステップ(ステップS2、ステップS7〜ステップS11)については、適宜に図3を参照するものとする。
この図において、まず、音データ付き画像記録であることを判定(ステップS1の“YES”)すると、画像中の注目被写体の位置を特定する処理(以下、「注目被写体位置特定処理」という。)を実行し(ステップS100)、次いで、その特定された位置にマイク201を向け(ステップ101)た後、図3と同様に、スルー画像を表示し(ステップS5)、録画開始であるか否かを判定する(ステップS6)。
図8は、注目被写体位置特定処理の手順を示す要部図である。この処理では、まず、スルー画像の中から人物の識別情報(ここでは顔データ)を抽出し(ステップS100a)、次いで、抽出された顔データと予め内蔵フラッシュメモリ112に登録されている人物の顔データとを照合する(ステップS100b)。そして、照合一致を判定し(ステップS100c)、不一致であれば、全ての顔照合が完了したか否かを判定し(ステップS100e)、照合すべき顔データが残っていれば、再びステップS100a以降を繰り返す一方、照合すべき顔データが残っていなければ、スルー画面の中央付近を仮の注目被写体位置として決定(ステップS100f)した後、図7のステップS101に進む。
他方、ステップS100cで、抽出された顔データと予め内蔵フラッシュメモリ112に登録されている人物の顔データとの照合一致が判定された場合には、その人物の位置を注目被写体の位置として特定(ステップS100d)した後、図7のステップS101に進む。
図9は、図8の注目被写体位置特定処理の動作概念図である。この図において、スルー画像205(表示装置108の表示画像)には、複数の被写体、ここでは例として二人の被写体(人物206、207)が写っている。ステップS100aにおける顔データの抽出は、たとえば、肌色などの人物特有の色情報を手がかりにして、人物206、207の顔部分を認識し、その顔部分を顔データ206a、207aとして抽出するものである。そして、ステップS100bにおける顔の照合及びステップS100cにおける照合一致の判定は、抽出された顔データ206a、207aと予め内蔵フラッシュメモリ112に登録されている人物の顔データ208との類似度を評価して、一定以上の類似度を持つ顔データ206aを照合一致と判定し、その顔データ206aの位置を注目被写体の位置、つまり、マイク201を向ける位置として特定するというものである。あるいは、スルー画像205の中から人物の顔が抽出できなかった場合は、暫定的なマイク201の指向位置として、たとえば、スルー画像205の中央付近を仮の注目被写体位置として特定するというものである。
したがって、この第2実施形態によれば、スルー画像中に人物が含まれている場合に、その人物の顔と、予め登録されている人物の顔との一致を判定し、登録者の顔であれば、その人物を注目被写体と認定して、その注目被写体の方向にマイク201を向けることができるという作用が得られ、このマイク201は単一指向性(又超指向性)であるから、スルー画像の外側に位置する他の被写体の音をマイク201で集音しないことはもちろんのこと、仮に、スルー画像に複数の人物(図9の人物206、207参照)が写っていた場合であっても、注目被写体(登録者:図9の人物206)の音だけをマイク201で集音することができるという特有の効果が得られる。
さて、この第2実施形態では、スルー画像内の注目被写体の位置を特定することができ、この位置情報を利用して単一指向性のマイク201の向きを制御しているが、これに加えて、たとえば、その位置情報をステレオシステムやサラウンドシステム等の音場情報に利用してもよい。すなわち、ステレオシステムやサラウンドシステムでは、複数のチャンネルで音を録音し、それらのチャンネルを用いて左右(ステレオの場合)又は前後左右(サラウンドの場合)の音の拡がり(音場)を再現しているが、そのためには、たとえば、ステレオの場合であっても最低二つのマイクが必要になる。第2実施形態の“位置情報”を利用すれば、たとえば、ステレオの場合、一つのマイクで左右の音の拡がりを再現することが可能になる。
このことを図9を参照して説明する。この図において、注目被写体は人物206である。この人物206はスルー画像205の左寄りに位置しているので、ステレオで音場を再生する場合、この人物206の声が左寄り方向から聞こえてくるようにしなければならないが、第2実施形態の“位置情報”は人物206の位置を示しているのであるから、結局、音声再生時に左右のスピーカの出力割合をこの人物206の位置情報に応じて設定すればよい。つまり、人物206の位置情報に応じて左側のスピーカから聞こえる人物206の音を若干強めればよい。そのようにすると、一つのマイク201で注目被写体の位置に対応した音場を形成することができる。
なお、第2実施形態では、顔データの照合によって注目被写体の位置を特定しているが、これに限定されず、たとえば、以下の第3実施形態、第4実施形態のようにして、注目被写体の位置を特定してもよい。
また、図7(図3)では、撮影開始以後、マイクの集音方向を変更する処理を停止しているが当然このようではなくともよく、撮影中であっても注目被写体の位置が移動した場合にマイクの集音方向を変更するようにしてもよい。
また、AFを行うときに取得する被写体までの距離を利用して、この距離に応じて録音音量を変更するように構成してもよい。また、被写体までの距離を取得するのは、AFによらなくとも構わず、位相差センサや距離画像センサを別途搭載することにより、被写体までの距離を取得する構成としても構わない。
<第3実施形態>
図10は、第3実施形態に係る音データ付きの画像撮影機能を備えたデジタルカメラ300の概略構成を示すブロック図である。なお、前記の第1実施形態のデジタルカメラ100と共通する構成要素には同じ符号を付してその説明を省略する。このデジタルカメラ300と、前記の第1実施形態のデジタルカメラ100との相違は、第1実施形態のデジタルカメラ100のマイク115と集音範囲変更駆動部116の代わりに、ワイヤレス音声受信部301を備えると共に、中央処理部103の内部にハードウェア又はソフトウェアで構成された画角内ワイヤレスマイク認識部103aを備えた点にある。
また、この第3実施形態では、複数の被写体にそれぞれ識別情報付きのワイヤレスマイクを持たせる必要がある。
図11は、複数の被写体にそれぞれ持たせる識別情報付きのワイヤレスマイク302、303を示す図である。この図において、便宜的に示す二人の人物304、305は、前記の「複数の被写体」であり、たとえば、その内の一人(人物304)がスルー画像306(表示装置108の表示画像)に含まれ、他の一人(人物305)がスルー画像306から外れているものとする。ここで、二人の人物304、305の手に、それぞれ識別情報付きのワイヤレスマイク302、303が握られている。これらのワイヤレスマイク302、303は、いずれもアンテナ302a、303aからワイヤレスで音声信号を出力できるハンドマイク302b、303bと、このハンドマイク302b、303bに取り付けられたプレート302c、303cと、このプレート302c、303cに貼着又は印刷若しくは刻印された識別情報302d、303dとを備える。
識別情報とは、ワイヤレスマイク302、303を特定できると共に、スルー画像内の他の情報と区別できる特異な可視情報であり、たとえば、バーコード、QRコード、特定の数字や文字又はそれらの列、特定の記号又はそれらの列、それらを混在したもの、或いは、図案や絵などとすることができる。なお、この図においては、説明の簡単化のために、スルー画像306内の人物304が手にしているワイヤレスマイク302の識別情報302dをアルファベット大文字の“A”とし、スルー画像306外の人物305が手にしているワイヤレスマイク303の識別情報303dをアルファベット大文字の“B”とするものとする。
再び図10に戻り、ワイヤレス音声受信部301は、図11のワイヤレスマイク302、303からの音声信号を受信するアンテナ301aと、このアンテナ301aで受信された音声信号を再生して音声処理部109に出力する音声信号再生部301bとを備え、画角内ワイヤレスマイク認識部103aは、スルー画像の中からワイヤレスマイクの識別情報を抽出し、その識別情報に基づいて、画角内に位置するワイヤレスマイクを特定するという処理を実行する。ここで、ワイヤレスマイク302、303からの音声信号は、それぞれ異なる周波数チャンネルで送信されるものとする。たとえば、ワイヤレスマイク302からの音声信号は第1の周波数チャネル、ワイヤレスマイク303からの音声信号は第2の周波数チャネルで送信されるものとする。また、音声信号再生部301bは、中央処理部103からの指令に従って特定の周波数チャネル(第1又は第2の周波数チャネル)の音声信号のみを再生して音声処理部109に出力することができるものとする。
次に、以上の構成からなるデジタルカメラ300における動作を説明する。
なお、第3実施形態において、中央処理部103で実行される音データ付き画像記録処理の手順も、先の図7のものと概略同じであるが、第3実施形態では、複数の被写体(ここでは、図11の人物304、305)にワイヤレスマイク302、303を持たせ、そのワイヤレスマイク302、303から送信された音声信号をデジタルカメラ300のワイヤレス音声受信部301で選択的に再生して記録するようにし、これにより、マイクの指向処理(図7のステップS101)を必要としない点で相違する。なお、“選択的に再生”とは、撮影画角に入っているワイヤレスマイクから送信された音声信号のみを周波数チャネル選択によって択一的に再生することをいう。
図12は、第3実施形態における注目被写体位置特定処理の手順を示す要部図である。この処理では、まず、スルー画像の中から識別情報(図11の識別情報302d又は303d参照)を抽出し(ステップS200a)、次いで、識別情報を抽出できたか否かを判定する(ステップS200b)。そして、抽出できなかった場合は、スルー画面の中央付近を仮の注目被写体位置として決定(ステップS200d)した後、図7のステップS106に進み、抽出できた場合は、その識別情報に基づいて、撮影画角内に位置するワイヤレスマイクの位置を注目被写体の位置として特定(ステップS200c)した後、図7のステップS106に進む。
ここで、注目被写体の位置特定について、図11の例で具体的に説明すると、この例の場合、スルー画像306の中から抽出される識別情報は、人物304が手にしたワイヤレスマイク302の識別情報302d(アルファベット大文字の“A”)であるので、この識別情報(“A”)を手がかりにして、撮影画角内に位置するワイヤレスマイクが、人物304が手にしたワイヤレスマイク302であることを認識することができ、そのワイヤレスマイク302の位置を注目被写体の位置として特定することができる。
したがって、この第3実施形態によれば、スルー画像中に識別情報(図11の例では左側の人物204が持ったワイヤレスマイク302の識別情報302d)が写っていた場合には、その識別情報302dに基づいて、画角内のワイヤレスマイク302の位置を注目被写体位置と特定して、その注目被写体位置からの音、つまり、ワイヤレスマイク302で集音した音(人物304の音)と動画とを対応付けして記録することができ、他の被写体の音(ワイヤレスマイク303で集音した人物305の音)を記録しない(又は抑制したレベルで記録する)という効果が得られる。
なお、被写体にワイヤレスマイク302、303を持たせた場合、そのワイヤレスマイク302、303から出力される音響信号レベルは、被写体までの距離に無関係に一定のレベルとなり、たとえば、遠くに位置する被写体の声が大きく記録されてしまい、再生時に違和感を生じることがある。これに対処するためには、何らかの手段で注目被写体(撮影画角内の被写体)までの距離を検出し、その距離に応じて音の記録レベルを変更するようにすればよい。そのような手段としては、たとえば、撮影レンズ部101のAF(オートフォーカス)を利用することができる。AFとは、遠くの被写体から近くの被写体まで自動的にピントを合わせる機構のことをいい、ピントが合った位置が、その被写体までのおおよその距離になるからである。
したがって、ワイヤレスマイク302又は303で集音した注目被写体の音レベルを、注目被写体までの距離に応じて調節することにより、近くの被写体の声を大きく、遠くの被写体の声を小さく記録することができ、再生時の違和感をなくして、より実際に即した音声記録を行うことができる。
また、ここでマイクは、ワイヤレスであるとしたが、当然有線式のものであっても構わない。
<第4実施形態>
図13(a)は、第4実施形態に係る音データ付きの画像撮影機能を備えたデジタルカメラ400の概略構成を示すブロック図である。なお、前記の第1実施形態のデジタルカメラ100と共通する構成要素には同じ符号を付してその説明を省略する。このデジタルカメラ400と、前記の第1実施形態のデジタルカメラ100との相違は、第1実施形態のデジタルカメラ100のマイク115と集音範囲変更駆動部116の代わりに、GPS及びワイヤレス受信部401を備えた点にある。GPS及びワイヤレス受信部401は、GPSアンテナ402と、不図示のGPS衛星からの信号を受信してデジタルカメラ400の現在位置情報(以下、カメラ位置情報という。)を特定するGPS受信部403と、アンテナ404を介して後述のGPS機能付きのワイヤレスマイク500からの情報(マイク位置情報と音声情報)を受信するワイヤレス受信部405とを備える。
図13(b)は、GPS機能付きのワイヤレスマイク500を示す図である。この図において、ワイヤレスマイク500は、GPSアンテナ501を介し不図示のGPS衛星からの信号を受信してワイヤレスマイク500の現在位置情報(以下、マイク位置情報という。)を特定するGPS受信部502と、マイク503と、このマイク503で集音した音を増幅する音声増幅部504と、マイク位置情報と音声情報とを一緒にしてアンテナ506から送信する送信部505とを備える。
図14は、ワイヤレスマイク500とデジタルカメラ400の使用状態を示す図である。この図において、便宜的に示す二人の人物507、508は、「複数の被写体」であり、たとえば、その内の一人(人物507)がスルー画像509(表示装置108の表示画像)に含まれ、他の一人(人物508)がスルー画像509から外れているものとする。ここで、二人の人物507、508の手に、それぞれGPS機能付きのワイヤレスマイク500が握られている。これら二人の人物507、508と、その人物507、508の一人(ここでは人物507)をファインダに捉えるように設置されたデジタルカメラ400は、共に、GPS衛星510からのGPS信号を受信できる場所に位置している。
後の説明からも明らかとなるが、第4実施形態においては、各々のワイヤレスマイク500からデジタルカメラ400に向けて、マイク位置情報と人物507、508の音声情報とが送信され、そして、このマイク位置情報とデジタルカメラ400の位置情報(カメラ位置情報)とに基づいて、スルー画像内のマイク位置(注目被写体位置:図14の例では人物507の位置)が特定され、その注目被写体位置からの音、つまり、人物507が手にしたワイヤレスマイク500で集音した音(人物507の音)と動画とを対応付けして記録することができ、他の被写体の音(図14の例では人物508の音)を記録しない(又は抑制したレベルで記録する)という作用が得られる。
次に、以上の構成からなるデジタルカメラ400における動作を説明する。
図15は、第4実施形態における注目被写体位置特定処理の手順を示す要部図である。この処理では、まず、GPS情報(GPSによる方位等方向情報の取得については、たとえば、特開2007−024617等を参照のこと)に基づいてカメラ位置(デジタルカメラ400の位置)を特定し(ステップS300a)、次いで、GPS情報に基づいて特定されたマイク位置(人物507が手にしたワイヤレスマイク500の位置と人物508が手にしたワイヤレスマイク500の位置)の情報と音声情報とを受信する(ステップS300b)。
ここで、説明を簡便にするために、位置情報とは、座標情報だけではなくどの方向を向いているかを示す姿勢情報も含むものとする。そして、カメラ位置情報とマイク位置情報とに基づいて、デジタルカメラ400から見た各ワイヤレスマイク500の位置を特定する(ステップS300c)。そして、特定したマイク位置がスルー画像内に入っているか否かを判定し(ステップS300d)、入っていなかった場合は、スルー画面の中央付近を仮の注目被写体位置として決定(ステップS300f)した後、図7のステップS106に進み、入っていた場合は、そのマイク位置を注目被写体の位置として特定(ステップS300e)した後、図7のステップS106に進む。
したがって、この第4実施形態によれば、GPS情報によって、複数の人物507、508が持っている各々のワイヤレスマイク500の位置とデジタルカメラ400の位置とを取得して、それらの位置関係からスルー画像内のワイヤレスマイク(図14の例に従えば人物507が持っているワイヤレスマイク500)の位置を特定し、そのマイク位置を注目被写体位置と認定して、その注目被写体位置からの音、つまり、撮影画角内の人物507が持っているワイヤレスマイク500で集音した音(人物507の音)と動画とを対応付けして記録することができ、他の被写体の音(撮影画角外の人物508の音)を記録しない(又は抑制したレベルで記録する)という効果が得られる。
さらに、GPS情報により、注目被写体までの距離も取得できるので、その距離情報に応じて音の録音レベルを制御(遠くの被写体の音を小さく、近くの被写体の音を大きく録音)すれば、前記の第3実施形態と同様に、再生時の違和感をなくして、より実際に即した音声記録を行うことができるというメリットも得られる。
また、ここでマイクは、ワイヤレスであるとしたが、当然有線式のものであっても構わない。
<まとめ>
以上、4つの実施形態(第1実施形態〜第4実施形態)を説明したが、これらをまとめると次のとおりになる。
まず、第1実施形態の特徴的事項は、撮影レンズ部101の画角αとマイク115の集音範囲βとを適切に設定した点にあり、これによって得られる効果は、画角α内の被写体の音と、画角α外の被写体の音との間に明確なレベル差を付けてマイク115で集音できることにある。
図16は、第1実施形態の効果を具体的に説明する図である。この図において、第1実施形態によれば、ファインダ900に捉えられている人物901の音を良好なレベルでマイク115(図1参照)で集音しつつ、ファインダ900の外に位置する人物902、903の音についてはレベルゼロ又は抑制されたレベルでマイク115で集音することができ、その結果、注目被写体(この場合、人物901)の音と他の被写体(この場合、人物902、903)とを区別して記録できるようになり、再生時に、注目被写体の音に他の被写体の音がかぶって聞き取りにくくなるという不都合を解消することができるのである。
また、第2実施形態の特徴的事項は、登録済みの顔データとスルー画像中の顔データとを照合して注目被写体の位置を特定し、その注目被写体の位置に向けて単一指向性マイク201の向きを制御することにあり、これにより、注目被写体の音と他の被写体の音とを区別して記録することができるという特有の効果を奏するものである。加えて、この第2実施形態では、注目被写体の位置情報を、たとえば、ステレオシステムやサラウンドシステムに利用することにより、一つのマイクでそれらのステレオ効果やサラウンド効果が得られるというメリットも得られる。
また、第3実施形態の特徴的事項は、被写体に持たせたワイヤレスマイク302、303に識別情報302d、303dを取り付けておき、この識別情報302d、303dをカメラ側で認識して撮影画角内の被写体(注目被写体)の位置を特定することにあり、上記の第2実施形態と同様に、注目被写体の音と他の被写体の音とを区別して記録することができるという特有の効果を奏するものである。加えて、この第3実施形態では、たとえば、撮影レンズ部101の距離情報に応じて、ワイヤレスマイク302、303で集音した被写体の音レベルを調節することにより、近くの被写体の声を大きく、遠くの被写体の声を小さく記録することができ、再生時の違和感をなくして、より実際に即した音声記録を行うことができるというメリットも得られる。
また、第4実施形態の特徴的事項は、GPS情報に基づいて被写体の位置とカメラの位置とを取得することにより、上記の第2実施形態と同様に、撮影画角内の被写体(注目被写体)の音と他の被写体の音とを区別して記録することができるという特有の効果を奏するものである。加えて、この第4実施形態でも、GPS情報から得られた距離情報に応じて、マイクで集音した注目被写体の音レベルを調節することにより、近くの被写体の声を大きく、遠くの被写体の声を小さく記録することができ、再生時の違和感をなくして、より実際に即した音声記録を行うことができるというメリットも得られる。
本実施の形態の主要な機能は、マイクロコンピュータ(中央処理部103)を含むハードウェア資産と、内蔵フラッシュメモリ112に格納されたOSや各種プログラムなどのソフトウェア資産との有機的結合によって機能的に実現されるものであるが、ハードウェア資産およびOSは汎用のものを利用できるから、本発明にとって欠くことのできない必須の事項は、実質的に、前記の音データ付き画像記録処理プログラム(図3、図7参照)や、前記の注目被写体位置特定処理プログラム(図8、図12、図15参照)に集約されているということがいえる。したがって、本発明は、これらの処理プログラムのすべてまたはその要部、さらには、それらを格納した、フロッピー(登録商標)ディスク、MO、CD、ハードディスク、半導体メモリなどの記録媒体(それ自体が流通経路に乗るものはもちろん、ネットワーク上にあって記録内容だけを提供するものも含む)を包含するものである。
また、本実施の形態においては、動画データを撮影するものを記載したがこれに限らず、静止画を撮影すると共に、撮影画角を考慮した撮影時の音データをこの静止画と関連付けて保存するように構成してもよい。
また、本実施の形態においては、画角の変更に伴い、集音範囲を変更するものとしたが、これに限らず、集音範囲の変更に伴い、画角を変更するものとしても構わない。
第1実施形態に係る音データ付きの画像撮影機能を備えたデジタルカメラ100の概略構成を示すブロック図である。 第1実施形態のマイク115に使用することができる集音範囲可変機構付マイクの一例構造図である。 中央処理部103で実行される音データ付き画像記録処理の手順を示す図である。 集音範囲βと画角αとの対応関係を示す図である。 第2実施形態に係る音データ付きの画像撮影機能を備えたデジタルカメラ200の概略構成を示すブロック図である。 マイク201の外観図(a)及びマイク201の他の構成を示す図(b)である。 中央処理部103で実行される音データ付き画像記録処理の手順を示す要部図である。 注目被写体位置特定処理の手順を示す要部図である。 図8の注目被写体位置特定処理の動作概念図である。 第3実施形態に係る音データ付きの画像撮影機能を備えたデジタルカメラ300の概略構成を示すブロック図である。 複数の被写体にそれぞれ持たせる識別情報付きのワイヤレスマイク302、303を示す図である。 第3実施形態における注目被写体位置特定処理の手順を示す要部図である。 第4実施形態に係る音データ付きの画像撮影機能を備えたデジタルカメラ400の概略構成を示すブロック図(a)及びGPS機能付きのワイヤレスマイク500を示す図(b)である。 ワイヤレスマイク500とデジタルカメラ400の使用状態を示す図である。 第4実施形態における注目被写体位置特定処理の手順を示す要部図である。 第1実施形態の効果を具体的に説明する図である。
符号の説明
α 画角
β 集音範囲(録音範囲)
100 デジタルカメラ(音データ付き画像記録装置)
101 撮影レンズ部(撮像手段)
102 撮像素子(撮像手段)
103 中央処理部(画角取得手段、集音範囲変更手段、集音範囲制御手段、コンピュータ、方向認識手段、認識手段、状態取得手段、距離取得手段、録音制御手段、位置認識手段)
103a 画角内ワイヤレスマイク認識部(認識手段)
104 画角変更駆動部(画角変更手段)
115 マイク(録音手段)
116 集音範囲変更駆動部(集音範囲変更手段、録音方向制御手段)
200 デジタルカメラ(音データ付き画像記録装置)
201b マイク指向方向駆動部(録音方向制御手段)
301 ワイヤレス音声受信部(受信手段)
300 デジタルカメラ(音データ付き画像記録装置)
302 ワイヤレスマイク(録音手段)
302d 識別情報
303 ワイヤレスマイク(録音手段)
303d 識別情報
400 デジタルカメラ(音データ付き画像記録装置)
401 GPS及びワイヤレス受信部(受信手段)
403 GPS受信部(受信手段)
500 ワイヤレスマイク(録音手段)
510 GPS衛星

Claims (25)

  1. 被写体を撮像する撮像手段と、
    複数の異なる位置に設置された複数の録音装置であって、画像により各々の録音装置を識別可能な識別情報が付加された複数の録音装置から取得した音データの記録を行う録音手段と、
    複数の被写体の各々から発せられる複数の音データのうち、撮影または録音の対象となる注目被写体から発せられる音データを前記録音手段により選択的に記録させる録音対象制御手段と、
    前記撮像手段により撮像された撮影画像内より前記複数の被写体を検出し、この検出結果に応じて前記注目被写体を特定するとともに、前記撮像手段により撮像された撮影画像内における前記識別情報の位置を特定する特定手段と、
    を備え、
    前記録音対象制御手段は、前記特定手段により特定された注目被写体の近くに設置されている録音装置を、前記特定手段により特定された識別情報の位置に応じて選択して記録させることを特徴とする音データ付き画像記録装置。
  2. 前記複数の被写体は複数の人物であり、
    前記特定手段は、前記複数の人物の中で、前記撮影画像内に検出された人物を前記注目被写体として特定することを特徴とする請求項1記載の音データ付き画像記録装置。
  3. 前記特定手段は、前記撮影画像内に検出された複数の人物の中で、予め指定された人物を前記注目被写体として特定することを特徴とする請求項2記載の音データ付き画像記録装置。
  4. 人物の顔の特徴を示す顔情報を登録する顔情報登録手段を更に備え、
    前記特定手段は、前記撮影画像内に検出された複数の人物の中で、前記顔情報登録手段に顔情報が登録されている人物を前記注目被写体として特定することを特徴とする請求項3記載の音データ付き画像記録装置。
  5. 前記録音手段は、録音方向を変化させることが可能であり、
    前記特定手段は、前記撮影画像内における前記注目被写体の位置を更に特定し、
    前記録音対象制御手段は、前記特定手段により特定された注目被写体の撮影画像内における位置に応じて、前記録音手段の録音方向を変化させることを特徴とする請求項1乃至4のいずれか記載の音データ付き画像記録装置。
  6. 被写体までの距離を測定する測定手段を更に備え、
    前記録音手段は、前記撮像手段と同じ位置に設けられ、
    前記録音対象制御手段は、前記測定手段により測定された被写体までの距離に応じて前記録音手段の録音音量を変化させることを特徴とする請求項5記載の音データ付き画像記録装置。
  7. 前記録音対象制御手段は、前記複数の録音装置の中で、前記特定手段により特定された注目被写体に最も近く設置されている録音装置を選択して記録を行うことを特徴とする請求項1乃至6のいずれかに記載の音データ付き画像記録装置。
  8. 前記録音手段は、複数の異なる位置に設置された複数の録音装置の各々で録音された音データを受信する受信手段を備えることを特徴とする請求項1乃至7のいずれかに記載の音データ付き画像記録装置。
  9. 被写体を撮像する撮像手段と、
    複数の異なる位置に設置された複数の録音装置であって、各々が自己を識別可能な所定形態で音データを送信する複数の録音装置からなる録音手段と、
    前記撮像手段により撮像された撮影画像に基づく画像認識処理によって、音を発する複数の被写体の中から録音対象となる音を発する注目被写体の位置を特定する被写体特定手段と、
    前記被写体特定手段により特定された注目被写体の近くに設置されている録音装置を特定する録音装置特定手段と、
    前記録音装置特定手段により特定された録音装置から送信されてくる音データを、前記録音手段に含まれる複数の録音装置の各々から送信されてくる音データの前記所定形態に基づいて選択して記録させる録音制御手段と、
    を備えたことを特徴とする音データ付き画像記録装置。
  10. 前記注目被写体までの距離を測定する測定手段を更に備え、
    前記録音対象制御手段は、前記測定手段により測定された注目被写体までの距離に応じて前記録音手段の録音音量を変化させることを特徴とする請求項9記載の音データ付き画像記録装置。
  11. 前記録音対象制御手段は、前記注目被写体までの距離が近いほど前記録音手段の録音音量が大きくなるように録音音量を制御することを特徴とする請求項10記載の音データ付き画像記録装置。
  12. 被写体を撮像する撮像手段と、
    複数の異なる位置に設置された複数の録音装置であって、各々が自己を識別可能な所定形態で音データを送信する複数の録音装置からなる録音手段と、
    前記撮像手段の撮影位置または撮影方向を特定する撮影状態特定手段と、
    前記撮影方向特定手段により特定された撮影位置または撮影方向に設置されている録音装置を特定する録音装置特定手段と、
    前記録音装置特定手段により特定された録音装置から送信されてくる音データを、前記録音手段に含まれる複数の録音装置の各々から送信されてくる音データの前記所定形態に基づいて選択して記録させる録音制御手段と、
    を備えたことを特徴とする音データ付き画像記録装置。
  13. 前記撮影状態特定手段は、前記撮像手段の位置を特定し、
    前記録音装置特定手段は、前記撮影状態特定手段により特定される前記撮像手段の位置情報と、前記録音位置特定手段により特定される各々の録音装置の位置情報とに応じて録音装置を選択することを特徴とする請求項12記載の音データ付き画像記録装置。
  14. 前記撮影状態特定手段は、前記撮像手段の撮像方向を特定し、
    前記録音対象制御手段は、前記撮影状態特定手段により特定される前記撮像手段の位置情報および撮像方向と、前記録音位置特定手段により特定される各々の録音装置の位置情報とに応じて録音装置を選択することを特徴とする請求項13記載の音データ付き画像記録装置。
  15. 被写体を撮像する撮像手段と、
    複数の異なる位置に設置された複数の録音装置からなる録音手段と、
    前記撮像手段により撮像された撮影画像に基づく画像認識処理によって、録音対象となる音を発する注目被写体の位置を特定する被写体特定手段と、
    前記撮像手段により撮像された撮影画像に基づく画像認識処理によって、前記被写体特定手段により特定された注目被写体の近くに設置されている録音装置を特定する録音装置特定手段と、
    前記録音手段に含まれる複数の録音装置の中から前記録音装置特定手段により特定された録音装置を選択して記録させる録音制御手段と、
    を備えたことを特徴とする音データ付き画像記録装置。
  16. 前記被写体特定手段は、前記撮像手段により撮像された撮影画像に基づく画像認識処理によって、音を発する複数の被写体の中から録音対象となる音を発する注目被写体を選択し、この選択された注目被写体の位置を特定し、
    前記録音制御手段は、前記録音手段に含まれる複数の録音装置の中から録音に用いる録音装置を選択することで、複数の被写体から発せられる複数の音うち、前記注目被写体から発せられる音を選択的に記録させることを特徴とする請求項15記載の音データ付き画像記録装置。
  17. 前記複数の録音装置の各々には、画像認識処理により各々の録音装置を識別可能な識別情報が付加されており、
    前記録音装置特定手段は、前記撮像手段により撮像された撮影画像に基づく画像認識処理によって、撮影画像内における前記識別情報の位置を特定し、この識別情報の位置に基づいて前記注目被写体の近くに設置されている録音装置を特定することを特徴とする請求項15または16に記載の音データ付き画像記録装置。
  18. 被写体を撮像する撮像手段と、
    音データの録音を行う録音手段と、
    前記撮像手段の画角を変化させる画角変更手段と、
    前記画角変更手段により変化する画角に対応させて前記録音手段の集音範囲を変化させる集音範囲制御手段と、
    を備え、
    前記録音手段は、各々が異なる集音範囲を持つ複数の録音装置から音データを選択的に取得して録音し、
    前記集音範囲制御手段は、前記画角の変化に応じて前記録音手段により音データを取得させる複数の録音装置の組み合わせを変化させることを特徴とする音データ付き画像記録装置。
  19. 前記集音範囲制御手段は、前記録音手段により音データを取得させる各録音装置の集音範囲を合わせた全体の集音範囲が前記画角に対応する集音範囲となるように、複数の録音装置の組み合わせを変化させることを特徴とする請求項18記載の音データ付き画像記録装置。
  20. 前記複数の録音装置の現在位置を取得する録音位置取得手段と、
    自身の現在位置と方向の情報を取得する状態取得手段と、
    前記録音位置取得手段によって取得された複数の録音装置の現在位置と、前記状態取得手段によって取得された自身の前記現在位置と方向の情報と、前記撮像手段の画角と、に基づいて、前記撮像手段の画角内に位置する録音装置を認識する認識手段とを更に備え、
    前記集音範囲制御手段は、前記認識手段により認識された録音装置を選択して前記録音手段により音データを取得させるように、前記認識手段による認識結果に応じて複数の録音装置の組み合わせを変化させることを特徴とする請求項19記載の音データ付き画像記録装置。
  21. コンピュータを、
    被写体を撮像する撮像手段と、
    複数の異なる位置に設置された複数の録音装置であって、画像により各々の録音装置を識別可能な識別情報が付加された複数の録音装置から取得した音データの記録を行う録音手段と、
    複数の被写体の各々から発せられる複数の音データのうち、撮影または録音の対象となる注目被写体から発せられる音データを前記録音手段により選択的に録音させる録音対象制御手段と、
    前記撮像手段により撮像された撮影画像内より前記複数の被写体を検出し、この検出結果に応じて前記注目被写体を特定するとともに、前記撮像手段により撮像された撮影画像内における前記識別情報の位置を特定する特定手段と、
    して機能させるためのプログラムであって、
    前記録音対象制御手段は、前記特定手段により特定された注目被写体の近くに設置されている録音装置を、前記特定手段により特定された識別情報の位置に応じて選択して記録させることを特徴とするプログラム。
  22. コンピュータを、
    被写体を撮像する撮像手段と、
    複数の異なる位置に設置された複数の録音装置であって、各々が自己を識別可能な所定形態で音データを送信する複数の録音装置からなる録音手段と、
    前記撮像手段により撮像された撮影画像に基づく画像認識処理によって、音を発する複数の被写体の中から録音対象となる音を発する注目被写体の位置を特定する被写体特定手段と、
    前記被写体特定手段により特定された注目被写体の近くに設置されている録音装置を特定する録音装置特定手段と、
    前記録音装置特定手段により特定された録音装置から送信されてくる音データを、前記録音手段に含まれる複数の録音装置の各々から送信されてくる音データの前記所定形態に基づいて選択して記録させる録音制御手段と、
    して機能させるためのプログラム。
  23. コンピュータを、
    被写体を撮像する撮像手段と、
    複数の異なる位置に設置された複数の録音装置であって、各々が自己を識別可能な所定形態で音データを送信する複数の録音装置からなる録音手段と、
    前記撮像手段の撮影位置または撮影方向を特定する撮影方向特定手段と、
    前記撮影方向特定手段により特定された撮影位置または撮影方向に設置されている録音装置を特定する録音装置特定手段と、
    前記録音装置特定手段により特定された録音装置から送信されてくる音データを、前記録音手段に含まれる複数の録音装置の各々から送信されてくる音データの前記所定形態に基づいて選択して記録させる録音制御手段と、
    して機能させるためのプログラム。
  24. コンピュータを、
    被写体を撮像する撮像手段と、
    複数の異なる位置に設置された複数の録音装置からなる録音手段と、
    前記撮像手段により撮像された撮影画像に基づく画像認識処理によって、録音対象となる音を発する注目被写体の位置を特定する被写体特定手段と、
    前記撮像手段により撮像された撮影画像に基づく画像認識処理によって、前記被写体特定手段により特定された注目被写体の近くに設置されている録音装置を特定する録音装置特定手段と、
    前記録音手段に含まれる複数の録音装置の中から前記録音装置特定手段により特定された録音装置を選択して記録させる録音制御手段と、
    して機能させるためのプログラム。
  25. コンピュータを、
    被写体を撮像する撮像手段と、
    音データの録音を行う録音手段と、
    前記撮像手段の画角を変化させる画角変更手段と、
    前記画角変更手段により変化する画角に対応させて前記録音手段の集音範囲を変化させる集音範囲制御手段と、
    して機能させるためのプログラムであって、
    前記録音手段は、各々が異なる集音範囲を持つ複数の録音装置から音データを選択的に取得して記録し、
    前記集音範囲制御手段は、前記画角の変化に応じて前記録音手段により音データを取得させる複数の録音装置の組み合わせを変化させることを特徴とするプログラム。
JP2007110156A 2007-04-19 2007-04-19 音データ付き画像記録装置及びプログラム Expired - Fee Related JP4941895B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007110156A JP4941895B2 (ja) 2007-04-19 2007-04-19 音データ付き画像記録装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007110156A JP4941895B2 (ja) 2007-04-19 2007-04-19 音データ付き画像記録装置及びプログラム

Publications (3)

Publication Number Publication Date
JP2008271082A JP2008271082A (ja) 2008-11-06
JP2008271082A5 JP2008271082A5 (ja) 2010-05-06
JP4941895B2 true JP4941895B2 (ja) 2012-05-30

Family

ID=40050020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007110156A Expired - Fee Related JP4941895B2 (ja) 2007-04-19 2007-04-19 音データ付き画像記録装置及びプログラム

Country Status (1)

Country Link
JP (1) JP4941895B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010200084A (ja) * 2009-02-26 2010-09-09 Nikon Corp 撮像装置
JP5395716B2 (ja) * 2010-03-25 2014-01-22 株式会社デンソーアイティーラボラトリ 車外音提供装置、車外音提供方法およびプログラム
JP2011215221A (ja) * 2010-03-31 2011-10-27 Daiichikosho Co Ltd カラオケ歌唱者映像及び歌唱音声記録システム
JP5762168B2 (ja) * 2011-06-22 2015-08-12 キヤノン株式会社 撮像装置及び再生装置
JP5773960B2 (ja) * 2012-08-30 2015-09-02 日本電信電話株式会社 音響再生装置とその方法とプログラム
JP6425019B2 (ja) * 2014-12-22 2018-11-21 パナソニックIpマネジメント株式会社 異常音検出システム及び異常音検出方法
WO2016103645A1 (ja) * 2014-12-22 2016-06-30 パナソニックIpマネジメント株式会社 指向性制御システム、指向性制御装置、それらのいずれかを備える異常音検出システム及び指向性制御方法
US9794685B2 (en) 2015-01-23 2017-10-17 Ricoh Company, Ltd. Video audio recording system, video audio recording device, and video audio recording method
JP7397084B2 (ja) * 2019-08-15 2023-12-12 富士フイルム株式会社 データ作成方法及びデータ作成プログラム
JP6739064B1 (ja) * 2020-01-20 2020-08-12 パナソニックIpマネジメント株式会社 撮像装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06303474A (ja) * 1993-04-16 1994-10-28 Sony Corp カメラ装置
JP2004317699A (ja) * 2003-04-15 2004-11-11 Nikon Gijutsu Kobo:Kk デジタルカメラ
JP2004328052A (ja) * 2003-04-21 2004-11-18 Sharp Corp ズームマイクロホン装置
JP2006203860A (ja) * 2004-12-24 2006-08-03 Fuji Photo Film Co Ltd 撮像装置、撮像方法、再生装置、再生方法、及びプログラム
JP2006258836A (ja) * 2005-03-15 2006-09-28 Nikon Corp 外付け照明装置、カメラシステム

Also Published As

Publication number Publication date
JP2008271082A (ja) 2008-11-06

Similar Documents

Publication Publication Date Title
JP4941895B2 (ja) 音データ付き画像記録装置及びプログラム
CN1845582B (zh) 成像装置、录音装置和录音方法
US7002625B2 (en) Image pickup apparatus for recording a photographed image in a directory
JP2009060394A (ja) 撮像装置、画像検出装置及びプログラム
JP5267609B2 (ja) 撮像装置及びそのプログラム
WO2011016322A1 (ja) 撮像装置、編集装置および撮像システム
JP2012100216A (ja) カメラおよび動画撮影プログラム
JP3925054B2 (ja) カメラ装置
JP2006270263A (ja) 撮影システム
CN103888684A (zh) 图像处理装置以及图像处理方法
JP2010148132A (ja) 撮像装置、画像検出装置及びプログラム
JP5120716B2 (ja) 撮像装置、撮像制御方法及びプログラム
EP1488631A1 (en) Camera apparatus, camera control method, and recording medium having camera control method recorded therein
JP2009239346A (ja) 撮影装置
JP2009177480A (ja) 撮影装置
JP2009239348A (ja) 撮影装置
JP2019021966A (ja) 収音装置および収音方法
JP2014122978A (ja) 撮像装置、音声認識方法、及びプログラム
JP2009239349A (ja) 撮影装置
JP2010200253A (ja) 撮像装置
JP2011130134A (ja) 撮像装置、撮像システム
WO2021065398A1 (en) Imaging apparatus, sound processing method, and program
JP4185810B2 (ja) 撮影装置
JP4771524B2 (ja) 撮像装置及びそのプログラム
JP7111202B2 (ja) 収音制御システム及び収音制御システムの制御方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100319

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100319

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120206

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4941895

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120219

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150309

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees