JP2006166007A - 音源方向検出方法、音源方向検出装置及び撮影装置 - Google Patents

音源方向検出方法、音源方向検出装置及び撮影装置 Download PDF

Info

Publication number
JP2006166007A
JP2006166007A JP2004354399A JP2004354399A JP2006166007A JP 2006166007 A JP2006166007 A JP 2006166007A JP 2004354399 A JP2004354399 A JP 2004354399A JP 2004354399 A JP2004354399 A JP 2004354399A JP 2006166007 A JP2006166007 A JP 2006166007A
Authority
JP
Japan
Prior art keywords
sound
sound pressure
sound source
ratio
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004354399A
Other languages
English (en)
Inventor
Takeshi Ogita
猛史 荻田
Mitsuo Sato
光雄 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Ericsson Mobile Communications Japan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Ericsson Mobile Communications Japan Inc filed Critical Sony Ericsson Mobile Communications Japan Inc
Priority to JP2004354399A priority Critical patent/JP2006166007A/ja
Publication of JP2006166007A publication Critical patent/JP2006166007A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Studio Devices (AREA)

Abstract

【課題】 特定したい音源方向の数に対し、少ないマイクロホンの数で音源方向を判別するとともに、各々のマイクロホンの特性を正確に合わせる必要性が軽減されるようにする。
【解決手段】 回転軸と垂直な平面上において互いにほぼ180度反対向きに配置された音響変換手段対を複数用いて音源からの音を検出し、その音響変換手段対で検出された音圧レベルの比を複数対について計算し、算出された各音圧レベルの比をその値に応じてパターン分けし、そのパターンの組み合わせを、予め作成しておいた各音圧レベルの比と音源方向との関係を表すパターン組み合わせ情報と照会して音源の方向を特定する。
【選択図】 図10

Description

本発明は、音源の方向を特定する音源方向検出方法と、その方法を用いた音源方向検出装置及び自動で特定された音源方向を向き撮影を行う撮影装置に関する。
従来、大勢人がいる場所で撮影するには、一人が撮影者になり、撮影者となった人は常にカメラを携帯してスタンバイしていなければならない。しかし、その人に代わりカメラを自動的に撮影方向に向き、撮影してくれる装置があれば非常に便利である。
また、カメラを備え、そのカメラで撮影した映像を音声とともに相手に伝送可能なテレビ電話機能付き携帯端末では、相手方の顔を見ながら話をすることができる。このテレビ電話機能付き携帯端末のカメラを、話をしている人の方向に自動的に向ける装置があれば非常に便利である。例えば、テレビ会議で電話先の人と話をするときに、会議で話をする人の顔が相手先のテレビ電話装置の画面に映れば、あたかも電話先の人はその会議にまさに出席しているかのように会議を進めることができる。
例えば特許文献1に、音源方向にカメラを向けることができる撮影装置が開示されている。特許文献1に記載の撮影装置は、複数の音電気変換手段(マイクロホン等)のうち最大音圧レベルを検出した音電気変換手段が向いている方向にカメラを向けるというものである。
特開2003−348425号公報
ところで、特許文献1に記載のものは、マイクロホンの向きと特定する音源方向が同一である。したがって、特定したい音源方向の数に対し、音電気変換手段の個数も同じだけ設置しなければならないという問題がある。
また、特許文献1の構成で正確に音源方向を特定しようとすると、音電気変換手段の特性を統一しなければならないが、音電気変換手段が等しいものを多数揃えるのは困難であり、それを補完するには同様な特性にさせる回路を設置しなければならないという問題がある。また、ノイズの多い環境や壁際など、装置が置かれた環境によっても影響を受け、これらの要素を満足しようとすると回路が複雑になってしまう。
本発明は斯かる点に鑑みてなされたものであり、特定したい音源方向の数に対し、少ないマイクロホンの数で音源方向を判別するとともに、各々のマイクロホンの特性を正確に合わせる必要性を軽減することを目的とする。
上記課題を解決して目的を達成するため、本発明は、回転軸と垂直な平面上において互いにほぼ180度反対向きに配置された音響変換手段対を複数用いて音源からの音を検出し、その音響変換手段対で検出された音圧レベルの比を複数対について計算し、算出された各音圧レベルの比をその値に応じてパターン分けし、そのパターンの組み合わせを、予め作成しておいた各音圧レベルの比と音源方向との関係を表すパターン組み合わせ情報と照会して音源の方向を特定することを特徴とする。
上述の構成によれば、180度反対向きに設置した複数対の音響変換手段からの音圧レベルの比をとり、その比の値に応じて所定パターン、例えば3つのパターンに分け、そのパターンの組み合わせによって音源方向を特定するようにしている。したがって、音を判別する方向の数に対して、少ない音響変換手段の数で音源の方向を特定することができる。
本発明によれば、音を判別する方向の数に対して、少ない音響変換手段の数で音源方向を特定することができるので、装置の低コスト化が図れるという効果がある。また、180度反対向きに設置した2つの音響変換手段から得られた音圧レベルの比をとるので、各々の音響変換手段の特性を正確に合わせる必要性が軽減されるという効果がある。
以下、本発明の一実施の形態の例について、図1〜図11を参照して説明する。
本発明は、例えばカメラ付き携帯端末などの撮影手段と接続し、手を叩いた音の方向に積載したカメラ付き携帯端末を振り向かせ、その音の方向に向けて自動的に携帯端末のカメラのシャッターを切る音源方向検出装置を考案し、カメラ機能の向上を図るものである。
まず、音源方向(カメラを基準とする、手を叩いた音の方向や話し声などの方向)の判別に用いるパラメータについて説明する。ここでは、パラメータの候補として音源から届く音の音圧と位相についてそれぞれ検討する。始めに、位相を用いる場合であるが、音響変換手段として2つのマイクロホンを用意してマイクロホンで検出した位相差が0度であった場所が音源と特定する方法が考えられる。しかし、位相差で方向を検出するには、常に音を鳴らしていなければならない。また、リアルタイムで処理を行う必要がある。
一方、音圧レベルでは、マイクロホンを複数用意し、検出した音圧レベルを比較することによって音源を特定する方法が考えられる。この方法は、マイクロホンを複数使用することにより一回の手を叩いた音で音源方向を検出できる。また、ハードウェアにより最大音圧レベルを保持することによって、リアルタイムに処理を行うことが必要なく処理が簡潔になる。したがって、本発明では、一回の手の音で音源方向を判別するためのパラメータは、音圧の最大レベルを採用することにした。
通常、マイクロホンの指向性を測定した場合、音源とマイクロホンの距離が一定でない、また手を叩く音を検出する際の環境などの条件によって、左右対称でないなど音圧レベルはさまざまな値をとりうる。本出願人は、これらを無視できる方法を検討した結果、ほぼ180度の反対向きに設置したマイクロホンにより検出される音圧レベルの比(音圧比)を用いることに想到した。
図1は、本発明の概念を説明するための図であり、ほぼ180度反対向きに配置された2つのマイクロホンA,Bを表している。マイクロホンA,Bは、手を叩いた音や話し声といった音声を電気信号等に変換する音響変換手段として機能する。本例のマイクロホンA,Bはそれぞれ、0度を中心として左右同様の特性があると仮定する。音源に正対するマイクロホンAの位置を0度として、中心Oを回転中心とする時計周りへの回転を+方向、反時計回りへの回転を−方向の回転とする。
図2は、ほぼ180度反対向きに設置された2つのマイクロホンの音圧レベルの比のグラフを示す。音源を固定し、円盤上に載置した2つのマイクロホンA,Bを回転させる。横軸はマイクロホンA,Bを載置した円盤の回転角度[°]、縦軸はマイクロホンA,Bから得られた音圧レベルの比(A/B)である。0度のときに音源と正対するマイクロホンAの音圧レベルと、もう一方のマイクロホンBの音圧レベルの比の値をとる。図2からわかるように、回転角度が0度と±180度の周辺では安定した値をとり、90度±15度、−90度±15度で、音圧レベルの比が急激に変化するポイントがある。すなわち、ほぼ180度反対向きの2つのマイクロホンの音圧比をとることで、個々のマイクロホンの特性に影響されることなく、回転角度がおよそ+90度、−90度、及び音圧比が安定した状態を検出することができる。本発明は、この点を利用して回転角度を算出し、音源方向を特定する。
ところで、一般に携帯電話端末に搭載されるカメラの水平画角は、機種によっても異なるが例えば約50度であるとする。その中で、被写体とカメラの距離を約3メートルとしたときの人がカメラに収まる角度は約30度であるので、360度では12方向以上を判別しなければならない。よって、12方向で音源方向を判別するために、マイクロホンの数を最小限にした音源方向判別のアルゴリズムを考える。
マイクロホンの対を3つに増やし、図3に示すように、それぞれ60度ずつずらして6個のマイクロホンを設置した場合について検討する。0度の位置からマイクロホンa→d→e→b→c→fの順に配置され、それぞれのマイクロホンは円周方向を向いている。それぞれのマイクロホンが図2に示したものと同様の指向性であると仮定して、直線上にあるマイクロホン(aとb、cとd、eとf)の音圧レベルの比を検出したグラフを、図4に示す。
図4において、横軸は角度[°]、縦軸は音圧比を表す。図中、「◆」はマイクロホンaとbで検出された音圧レベルの比(=a/b)、「■」は同じくマイクロホンcとdの音圧レベルの比(=c/d)、また、「△」は同じくマイクロホンeとfの音圧レベルの比(=e/f)の値である。
図4では、図1に示した1対の音圧比のときとほぼ同じ形状の曲線が、それぞれ120度の位相差を保って3対形成されている。この音圧比のグラフから、パターン分けの条件となるしきい値sとtを設定する。sは1より大きい値、tは1より小さい値である。但し、s=1/t、α≧s>β>t≧γである。
図4のグラフから、15度、45度、60度、・・・、と30度毎における音圧比の値を読み取り、読み取った音圧比の値を基に2つのしきい値s,tを決定する。そして、3つの音圧比の値をそのしきい値に基づいて3つのパターンに分類する。例えば、図4の例では、s=1.2、t=1/1.2として、音圧比の値をα、β、γに区分する。そして、3つの音圧比の値のα、β、γのパターンの組み合わせ一欄表(図5参照)を参照して、音源方向を特定する。
図5は、各音圧レベルの比の組み合わせとエリア(音源方向)との関係を表した図である。図5に示されたエリア欄は、図4に示された角度の範囲を表している。
予め音源を固定した上で、マイクロホンを回転させて各回転角に対する音圧レベルの比を測定して、図5に示すような音圧比のパターン組み合わせのテーブルを作成し、フラッシュROM等の不揮発メモリに記憶しておく。そして、実際に手を叩いた音を検出したときの3つの音圧比の値が図5のテーブルのどのパターンに該当するかを判定することにより、エリアすなわち音源の角度(音源方向)を特定することができる。
例えば、あるときの手を叩いた音の音圧レベルの比を計算し、その計算された音圧比と記憶しておいたテーブルのパターンを比較したとき、音圧比a/bの値がα、音圧比c/dの値がβ、音圧比e/fの値がγにそれぞれパターン分けできた場合、エリア2、すなわち角度15〜45が音源方向である、というように特定することができる。
次に、本発明の一実施の形態として、実際にマイクロホン6個を使用し、上述した方法により音源方向を30度刻みの12方向で判別する音源方向検出装置について説明する。
図6は、本発明の一実施の形態による音源方向検出装置の外観図であり、音源方向検出装置上にカメラ付きの携帯端末の例として携帯電話端末を載置した状態を示している。音源方向検出装置10は例えば底面直径が10数cmの円柱形状をしており、その円柱面に6個のマイクロホンa〜fが等間隔に設置されている。また、音源方向検出装置10は、アナログ回路部13、マイコン部14、モータ部15を内蔵する筐体(固定部)11aと、モータ部15のモータにより回転し、筐体11aと一体構成の回転テーブル(回転部)11bを有する。回転テーブル11bは、音源方向検出処理の状態を利用者に知らせるための、LED(Light Emitting Diode)等の表示部16を備える。
20は、音源方向検出装置10のマイコン部14と接続された携帯電話端末である。接続手段としては、シリアルコネクタ等の有線又はBluetooth(登録商標)などの近距離無線通信が適用できる。21はカメラ部を構成するカメラレンズ21であり、矢印はカメラレンズの視線方向を表している。22は撮影した被写体の画像データを表示するLCD(Liquid Crystal Display)などの表示装置である。回転テーブル11bが回転し、携帯電話端末20のカメラレンズ21が音源方向を向くことで、音源方向の撮影を行うことができる。なお、図6の例では携帯電話端末20は折り畳み型としているが、これに限るものではない。
図7は、図6に示されたマイクロホンa〜fと、これらのマイクロホンを使って判別する音源方向を表した図である。図7において、マイクロホンaが音源と正対する位置を0度の位置とし、時計回りを+方向の回転とする。6個のマイクロホンa〜fは同一円周上に60度刻みで配置される。すなわち、図7に示されるように0度の位置から60度間隔で、マイクロホンa→d→e→b→c→fの順に配置され、マイクロホンaとb、マイクロホンcとd、マイクロホンeとfを対として、それぞれの音圧レベルの比が求められる。判別する音源方向は30度刻みで12方向である。
図8は、本例の携帯電話端末20と接続された音源方向検出装置10の機能ブロック図を示すものである。音源方向検出装置10は、大きく分けて、マイクロホンa〜f、マイクロホンa〜fからの電気信号が入力されるアナログ回路部13、アナログ回路部13のデータが入力されるマイコン部14、マイコン部14からの制御信号により動作するモータ部15及び表示部16から構成される。31はマイコン部14からの制御信号など、制御データを伝送する制御ラインである。また、32は音圧レベルのデータを伝送する際の伝送ラインとなるデータラインである。これらのデバイスは、全て図示しない電源回路から供給される電源によって動作する。また、マイコン部14は、制御ライン31を経由して携帯電話端末20の携帯電話部23と接続している。
上記アナログ回路部13は、マイクロホンa〜fで検出した音圧レベルを増幅する増幅回路、増幅回路からの出力を絶対値に変換する絶対値回路、絶対値回路からの出力を保持し、それ以上の信号が入力された場合、値を変更し最大値を出力するピークホールド回路(それぞれ図示略)を有し、対となるマイクロホンの音圧レベルの比を計算する音圧比算出手段として機能するものである。
ここで、音圧レベルの最大値検出及びピークホールド処理について説明する。図9は、音圧レベル信号の一例を示し、横軸は時間t[msec]、縦軸は音圧レベルV[V]である。本例では音圧レベルの最大値を用いて音源方向を判別するため、音波の振幅の最大値を検出しなければならない。そこで、絶対値回路により、増幅回路からの出力を絶対値に変換する(図9破線部参照)。そして、ピークホールド回路が、絶対値回路からの出力(P1)を一旦保持し、それ以上の信号(P2)が入力された場合、最大値をP2に変更して出力する。これにより、マイコン部14でリアルタイムに処理を行う必要をなくし、処理を簡潔にすることができる。
マイコン部14は、データライン32を介しアナログ回路部13からの音圧レベルの最大値を受信する。マイコン部14は、計算処理部14a及び制御部14bを有し、汎用のマイコンで構成することができる。計算処理部14aは、A/D(アナログ/デジタル)変換や各種計算処理を行う。また、制御部14bは、マイクロホンa〜fから得られた音圧レベルより音源方向を特定し、モータ部15や携帯電話端末20、表示部16等に制御信号を出力する。なお、マイコン部14は、図示しないフラッシュROM等の不揮発メモリ及びワークエリアとして利用されるDRAM等のメモリを備えている。
モータ部15は回転手段として機能し、回転テーブル11bを回転させるモータ15b、及び制御部14bからの制御信号に従いモータ15bの回転方向を制御するモータドライバ15aから構成される。モータ15が指示された位置への回転を終了後、制御部14bから携帯電話端末20に対し、回転が終了した旨の情報を送出する。なお、モータ15bは精度良く回転させることができるステッピングモータの他、種々のモータが適用できる。
表示部16は例えば緑色と赤色のLEDを備え、手を叩いた音を検出できる状態であるか、及び音源方向の特定ができたかの動作確認を行う。音検出待ちのときに緑点灯、音検出成功のときには緑点滅させる。また、音検出時、大きい音であった場合、赤点滅、携帯電話端末立ち上げ時や小さい音であったときは赤点灯させるように設定する。このようにすることで、利用者は音源方向検出装置の処理状況を把握することができる。なお、表示部のLEDの色、及び動作確認の表示パターン例はこれに限るものではない。
携帯電話端末20は、携帯電話制御部23とカメラ部24から構成される。携帯電話部23は、マイコン部14からの制御信号を受信し、その制御信号によりカメラ部24のシャッターを切るなどのカメラ制御を行なうとともに、携帯電話端末20全体の制御を司る。カメラ部24で撮影された撮影データは、携帯電話端末20内の不揮発メモリ(図示略)に記録される。
次に、音源方向検出装置にカメラ付き携帯電話端末が接続されている場合の動作について説明する。
図10は、本例の音源方向検出処理を示すフローチャートである。
本例の処理では、最初のエリアを基準として動作すべきモータ15bのステップ数を決定するようにしているので、初期設定として、携帯電話端末20の回転前の位置をエリア1(角度0度)とする。また、携帯電話端末20の電源をオンにしておく。なお、電源オンにした場合、近くにいるときに動作しないように、電源をオンした後5秒間の待ち時間を入れるようにするとよい。
まず、音圧レベルを処理した後、再び音を検出するため、アナログ回路部13で保持されていた音圧レベルの最大値の値をリセットする(ステップS1)。次に、マイクロホンa〜fにより、ある値以上の音圧レベルを検出する(ステップS2)。すなわち、周囲のノイズに反応しないようある一定のしきい値を設定し、フラッシュROMに記憶しておく。そして、マイクロホンa〜fで音を検出し、アナログ回路部13で処理した音圧レベルが予め設定したしきい値以上になると、音圧レベルのアナログデータをマイコン部14へ出力する。
マイコン部14では、計算処理部14aがアナログ回路部13から受信したアナログデータをデジタルデータに変換する(ステップS3)。次いで、ステップS4へ移行して音源方向を特定する。音源とマイクロホンa〜fとの距離は一定であるとは限らないし、また音圧レベルはさまざまな値をとりうる。上述したように、本例ではこれらの要素を無視できるようほぼ180度反対向きに設置したマイクロホンの音圧レベルの比を用いる。
図11は、回転テーブル11を360回転させた際の回転角度と実際に得られた各マイクロホンの音圧比との関係を示した線図である。図11の例では、1つの角度に対して音圧比を2回測定している。横軸は回転角度[°]、縦軸は音圧比である。図中、「◆」はマイクロホンaとbで検出された音圧レベルの比(=a/b)、「■」は同じくマイクロホンcとdの音圧比(=c/d)、また、「△」は同じくマイクロホンeとfの音圧比(=e/f)の実際に得られた値である。
ここで、実際に得られた音圧比から、パターン分けの条件となるしきい値sとtを設定する。但し、s=1/t、α≧s>β>t≧γである。例えば、図11のグラフから、s=1.238、t=1/s=1/1.238として、音圧比をα、β、γに区分する。制御部14bはそれぞれの音圧比をα、β、γのパターンに当てはめ、3組のマイクロホンの比のα、β、γのパターンの組み合わせ(図5参照)により、エリアを決定し音源の方向を特定する(ステップS4)。
図5に示したテーブルは、各マイクロホンの音圧比の組み合わせと音源方向との関係を表すデータとして、マイコン部14のフラッシュROM等、不揮発メモリに記憶されている。図5の表に記載された以外のパターンは、エラーとして処理する。制御部14bは、実際に得られた音圧比のパターンが、図5のテーブルに存在するか否かを調べ、音源方向を特定できたかどうか判定する(ステップS5)。音源方向が特定できなかった場合は、ステップS1に移行し、アナログ回路部13に保持されたデータをリセットして、再度音を検出する。
上記判断ステップS5において、音源方向を特定できた場合、図6に示したカメラレンズ21の向きが、ステップS4で特定した音源方向と一致するように、モータ15bを駆動して回転テーブル11bを適切な角度回転させる(ステップS6)。
回転テーブル11aが所定角度回転され、携帯電話端末20のカメラレンズ21が音源方向を向いた後、携帯電話部23は回転が終了したことを受けて、カメラ部24を制御してシャッターを切り、音源方向の被写体を撮影する(ステップS7)。撮影した被写体の画像データは携帯電話端末20内の不揮発メモリに保存する。画像データは、音源方向検出装置10内の不揮発メモリに保存するようにしてもよい。撮影終了後、ステップS1に移行し、次の音検出に備える。
これらの一連の処理において、制御部14bはそれぞれの処理状態に応じて、表示部16の緑色と赤色のLEDの表示を制御する。なお、表示部16に代えて、携帯電話端末20の表示装置22にそれぞれの処理状態を文字や絵などによって表示することも可能である。
なお、携帯電話端末20のカメラ部24がズーム機能を有する場合、ステップS3の処理で得た音圧レベルのデータから、その大きさによりズーム倍率(広角・望遠)を切り替えるようにしてもよい。例えば音圧レベルが小さいときは音源、すなわち被写体が遠い位置にあると判断してズーム倍率を大きくし、音圧レベルが小さいときは被写体が近い位置にあると判断してズーム倍率を小さくして撮影を行なう。
また、カメラ付きの携帯電話端末20に代えて、音源方向検出装置10にテレビ電話機能付きの携帯電話端末を接続した場合を考える。この場合、ステップS7におけるシャッターを切る動作は行なわれない。例えば、テレビ会議の席上で、テレビ電話機能付き携帯電話端末に向かって発表者が話を始めると、その声がマイクロホンa〜fにより収音され、音源方向が特定される。そして、回転テーブル11bが回転しテレビ電話機能付き携帯電話端末が音源方向へ向けられ、テレビ会議で話をする人の顔が撮影されて電話回線やインターネット等の通信回線を経由して相手先のテレビ電話装置に送られる。これにより、電話先でテレビ会議に出席している人々は、あたかも実際にその会議に出席しているかのような臨場感を持って会議を進めることができる。
以上説明した構成によると、音源方向検出装置にほぼ180度反対向きに設置した3対のマイクロホンからの音圧レベルの比をとり、その比の値を3つのパターンに分け、そのパターンの組み合わせによって音源方向を特定するようにしている。したがって、音を判別する方向の数に対して、少ないマイクロホンの数で音源の方向を特定することができる。
また、単体のマイクロホンで得られた音圧レベルをそのまま使うのではなく、2つのマイクロホンで得られた音圧レベルの比を用いるので、各々のマイクロホンの特性を正確に合わせる必要性が軽減される。
また、アナログ回路部にて音圧比の計算を行なうようにしたのでマイコン部での計算処理が簡潔である。
また、音源方向検出装置とテレビ電話機能付き携帯端末を組み合わせた場合、無線を用いてリアルタイムに撮影画像を配信することができる。
なお、上述の実施の形態では、音響変換手段として3対(計6個)のマイクロホンを使用した例について説明したが、少なくとも2対あればよい。すなわち、4個のマイクロホンを同一円周上に90度間隔で配置し、それぞれほぼ180度反対向きに配置した2つのマイクロホンからの音圧レベルの比をとり、その比の値を3つのパターンに分け、そのパターンの組み合わせによって音源方向を特定することができる。勿論、反対向きに配置した2つのマイクロホンの対の数が多いほど、より詳細な音源方向検出を行うことができる。
また、音源方向検出装置に複数対のマイクロホンを設けておき、それらによって検出された音圧レベルの一部を使用して音源の方向を検出するようにしてもよい。例えば、最初に2対のマイクロホンから得られた音圧レベルを利用して音源方向を検出し、さらに精度を高めるため3対のマイクロホンから得られた音圧レベルを利用して音源方向を検出するなどの構成としてもよい。この場合、計算対象のマイクロホン対の数が少ないほど計算時間を短縮でき、かつ消費電力を抑えることができる。
また、撮影手段のカメラとしては、携帯端末に搭載されたデジタルスチルカメラ、デジタルカメラ単体、フィルムを用いるカメラや、ビデオカメラ等のあらゆるカメラを適用可能である。
さらに本発明は上述した実施の形態の例に限られるものではなく、本発明の要旨を逸脱することなくその他種々の構成を取り得ることは勿論である。
本発明の一実施の形態による2つのマイクロホンを180度反対向きに配置した状態を示す図である。 本発明の一実施の形態による180度反対向きに設置したマイクロホンの音圧比を示す線図である。 本発明の一実施の形態による6個のマイクロホンを使用した場合の配置を示す図である。 本発明の一実施の形態による直線上のマイクロホンで検出した音圧比を示す線図である。 本発明の一実施の形態による各マイクロホンの音圧比の組み合わせと音源方向との関係を示す図である。 本発明の一実施の形態による音源方向検出装置上にカメラ付きの携帯電話端末が載置された状態を示す図である。 本発明の一実施の形態によるマイクロホン配置と判別する音源方向を示す図である。 本発明の一実施の形態による機能ブロック図である。 本発明の一実施の形態による音圧レベル信号の絶対値及びピークホールドの説明に供する図である。 本発明の一実施の形態による音源方向検出処理を示すフローチャートである。 本発明の一実施の形態による実際に得られた各マイクロホンの音圧比の例を示す線図である。
符号の説明
10…音源方向検出装置、11a…下部筐体、11b…回転テーブル、13…アナログ回路部、14…マイコン部、14a…計算処理部、14b…制御部、15…モータ部、15a…モータドライバ、15b…モータ、16…表示部、20…携帯電話端末、21…カメラレンズ、22…表示装置、23…携帯電話部、24…カメラ部、A,B,a〜f…マイクロホン

Claims (15)

  1. 回転軸と垂直な平面上において互いにほぼ180度反対向きに配置された音響変換手段対を複数用いて音源からの音を検出し、
    前記音響変換手段対で検出された音圧レベルの比を複数対について計算し、
    算出された各音圧レベルの比をその値に応じてパターン分けし、そのパターンの組み合わせを、予め作成しておいた各音圧レベルの比と音源方向との関係を表すパターン組み合わせ情報と照会して前記音源の方向を特定する
    ことを特徴とする音源方向検出方法。
  2. 音源を固定した状態で前記複数対の音響変換手段の中心を回転中心として前記複数対の音響変換手段を回転させたときの回転角と各音圧レベルの比との関係を測定し、その測定結果に応じて回転角範囲を特定するための音圧レベルの比の値を決定し、その値を前記パターン分けのしきい値とする
    ことを特徴とする請求項1に記載の音源方向検出方法。
  3. 前記しきい値は、1より大きい値の第1しきい値と、1より小さい値の第2しきい値の2つ設定され、前記音圧レベルの比はその2つのしきい値に基づいて3つのパターンに分類される
    ことを特徴とする請求項2に記載の音源方向検出方法。
  4. 前記音響変換手段からの出力を絶対値に変換し、絶対値に変換された出力のピーク値を保持し、そのピーク値より大きい信号が入力された場合、その値を更新し、更新されたピーク値を前記音圧レベルの最大値として前記音圧レベルの比を計算する
    ことを特徴とする請求項1に記載の音源方向検出方法。
  5. 回転テーブルの回転軸と垂直な平面上において互いにほぼ180度反対向きに配置され、音源からの音を検出する複数の音響変換手段対と、
    前記音響変換手段対で検出された音圧レベルの比を複数対について計算する音圧比算出手段と、
    各音圧レベルの比と音源方向との関係を表したパターン組み合わせ情報を記憶する記憶手段と、
    複数対の音響変換手段で算出された各音圧レベルの比をその値に応じてパターン分けし、そのパターンの組み合わせを前記パターン組み合わせ情報と照会して前記音源の方向を特定し、回転指示を出す制御手段と、
    前記制御手段の回転指示に従い、前記回転テーブルを回転させる回転手段と
    を備えることを特徴とする音源方向検出装置。
  6. 音源を固定した状態で前記複数対の音響変換手段の中心を回転中心として前記複数対の音響変換手段を回転させたときの回転角と各音圧レベルの比との関係を測定し、その測定結果に応じて回転角範囲を特定するための音圧レベルの比の値を決定し、その値を前記パターン分けのしきい値とする
    ことを特徴とする請求項5に記載の音源方向検出装置。
  7. 前記しきい値は、1より大きい値の第1しきい値と、1より小さい値の第2しきい値の2つ設定され、前記音圧レベルの比はその2つのしきい値に基づいて3つのパターンに分類される
    ことを特徴とする請求項6に記載の音源方向検出装置。
  8. 前記音圧比算出手段は、前記音響変換手段からの出力を絶対値に変換する絶対値回路と、
    前記絶対値回路の出力のピーク値を保持し、その保持したピーク値より大きい信号が入力された場合、その値を更新し、前記音圧レベルの最大値として出力するピーク値保持回路とから構成され、
    前記音圧レベルの最大値を用いて音圧レベルの比を計算する
    ことを特徴とする請求項5に記載の音源方向検出装置。
  9. 前記音源方向検出装置は、3対の音響変換手段から構成された
    ことを特徴とする請求項5に記載の音源方向検出装置。
  10. 回転テーブルの回転軸と垂直な平面上において互いにほぼ180度反対向きに配置され、音源からの音を検出する複数の音響変換手段対と、
    前記音響変換手段対で検出された音圧レベルの比を複数対に対して計算する音圧比算出手段と、
    各音圧レベルの比と音源方向との関係を表したパターン組み合わせ情報を記憶する記憶手段と、
    複数対の音響変換手段で算出された各音圧レベルの比をその値に応じてパターン分けし、そのパターンの組み合わせを前記パターン組み合わせ情報と照会して前記音源の方向を特定し、回転指示を出す制御手段と、
    前記制御手段の回転指示に従い、前記回転テーブルを回転させる回転手段と
    前記回転テーブルに設置され、前記回転指示による回転が終了したことを感知して撮影を行なう撮影手段と
    を備えることを特徴とする撮影装置。
  11. 音源を固定した状態で前記複数対の音響変換手段の中心を回転中心として前記複数対の音響変換手段を回転させたときの回転角と各音圧レベルの比との関係を測定し、その測定結果に応じて回転角範囲を特定するための音圧レベルの比の値を決定し、その値を前記パターン分けのしきい値とする
    ことを特徴とする請求項10に記載の撮影装置。
  12. 前記しきい値は、1より大きい値の第1しきい値と、1より小さい値の第2しきい値の2つ設定され、前記音圧レベルの比はその2つのしきい値に基づいて3つのパターンに分類される
    ことを特徴とする請求項11に記載の撮影装置。
  13. 前記音圧比算出手段は、前記音響変換手段からの出力を絶対値に変換する絶対値回路と、
    前記絶対値回路の出力のピーク値を保持し、その保持したピーク値より大きい信号が入力された場合、その値を更新し、前記音圧レベルの最大値として出力するピーク値保持回路とから構成され、
    前記音圧レベルの最大値を用いて音圧レベルの比を計算する
    ことを特徴とする請求項10に記載の撮影装置。
  14. 前記撮影装置は、3対の音響変換手段から構成された
    ことを特徴とする請求項10に記載の撮影装置。
  15. 前記回転テーブルに、前記撮影手段としてテレビ電話機能付き携帯端末を固定した
    ことを特徴とする請求項10に記載の撮影装置。

JP2004354399A 2004-12-07 2004-12-07 音源方向検出方法、音源方向検出装置及び撮影装置 Withdrawn JP2006166007A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004354399A JP2006166007A (ja) 2004-12-07 2004-12-07 音源方向検出方法、音源方向検出装置及び撮影装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004354399A JP2006166007A (ja) 2004-12-07 2004-12-07 音源方向検出方法、音源方向検出装置及び撮影装置

Publications (1)

Publication Number Publication Date
JP2006166007A true JP2006166007A (ja) 2006-06-22

Family

ID=36667514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004354399A Withdrawn JP2006166007A (ja) 2004-12-07 2004-12-07 音源方向検出方法、音源方向検出装置及び撮影装置

Country Status (1)

Country Link
JP (1) JP2006166007A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008177802A (ja) * 2007-01-18 2008-07-31 Yamaha Corp 音声会議システムおよび音声会議装置
JP2009020423A (ja) * 2007-07-13 2009-01-29 Fujitsu Ten Ltd 音声認識装置および音声認識方法
JP2010515335A (ja) * 2006-12-29 2010-05-06 タンドベルク・テレコム・エイ・エス 音源追跡マイクロフォン
JP2011080868A (ja) * 2009-10-07 2011-04-21 Hitachi Ltd 音響監視システム、及び音声集音システム
JP2012034362A (ja) * 2010-07-28 2012-02-16 Emprie Technology Development LLC 音方向検出
JP2013142843A (ja) * 2012-01-12 2013-07-22 Fuji Xerox Co Ltd 動作解析装置、音声取得装置、および、動作解析システム
CN103941223A (zh) * 2013-01-23 2014-07-23 Abb技术有限公司 声源定位系统及其方法
JP2016133304A (ja) * 2015-01-15 2016-07-25 本田技研工業株式会社 音源定位装置、音響処理システム、及び音源定位装置の制御方法
CN110017799A (zh) * 2017-12-27 2019-07-16 精工爱普生株式会社 超声波测定装置以及测定方法
JP2019203742A (ja) * 2018-05-22 2019-11-28 Jfeスチール株式会社 音源方位標定装置および音源方位標定方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010515335A (ja) * 2006-12-29 2010-05-06 タンドベルク・テレコム・エイ・エス 音源追跡マイクロフォン
JP2008177802A (ja) * 2007-01-18 2008-07-31 Yamaha Corp 音声会議システムおよび音声会議装置
JP2009020423A (ja) * 2007-07-13 2009-01-29 Fujitsu Ten Ltd 音声認識装置および音声認識方法
JP2011080868A (ja) * 2009-10-07 2011-04-21 Hitachi Ltd 音響監視システム、及び音声集音システム
JP2012034362A (ja) * 2010-07-28 2012-02-16 Emprie Technology Development LLC 音方向検出
JP2013142843A (ja) * 2012-01-12 2013-07-22 Fuji Xerox Co Ltd 動作解析装置、音声取得装置、および、動作解析システム
CN103941223A (zh) * 2013-01-23 2014-07-23 Abb技术有限公司 声源定位系统及其方法
WO2014114364A1 (en) * 2013-01-23 2014-07-31 Abb Technology Ltd A system for localizing sound source and the method therefor
US9743202B2 (en) 2013-01-23 2017-08-22 Abb Schweiz Ag System for localizing sound source and the method therefor
JP2016133304A (ja) * 2015-01-15 2016-07-25 本田技研工業株式会社 音源定位装置、音響処理システム、及び音源定位装置の制御方法
CN110017799A (zh) * 2017-12-27 2019-07-16 精工爱普生株式会社 超声波测定装置以及测定方法
CN110017799B (zh) * 2017-12-27 2022-03-29 精工爱普生株式会社 超声波测定装置以及测定方法
JP2019203742A (ja) * 2018-05-22 2019-11-28 Jfeスチール株式会社 音源方位標定装置および音源方位標定方法

Similar Documents

Publication Publication Date Title
JP2006135837A (ja) テレビ電話
CN102207674A (zh) 全景图像拍摄装置及方法
JP2006217478A (ja) 画像撮影装置及び画像撮影方法
KR20150132802A (ko) 촬영 파라미터를 설정하는 방법, 장치, 프로그램 및 기록매체
JP2006166007A (ja) 音源方向検出方法、音源方向検出装置及び撮影装置
CN105049727A (zh) 全景图像拍摄的方法、装置及系统
JP6815830B2 (ja) 撮像装置およびその制御方法
JP6613131B2 (ja) 電子機器、電子機器の制御方法、電子機器の制御装置、制御プログラム及び電子機器システム
CN104284093B (zh) 全景拍摄方法及装置
CN105592263B (zh) 图像拍摄方法、装置及终端
JP2011055043A (ja) 情報記録装置及びプログラム
JP6071054B2 (ja) 通信装置、及び音声入出力ユニットの制御方法
US11245830B2 (en) Image capture apparatus and control method for same, and storage medium
US20140300760A1 (en) Electronic apparatus and method of controlling the same
JP5358843B2 (ja) 音出力制御装置、音出力制御方法、及び音出力制御プログラム
CN110881096B (zh) 摄像设备及其控制方法和存储介质
JP6394958B2 (ja) 通信装置及び通信方法
TW201740246A (zh) 具有全景攝影功能的指令輸入裝置
KR101763938B1 (ko) 위치정보 기반의 영상데이터의 처리 방법 및 장치
JP2016082356A (ja) 電子機器およびプログラム
KR20050011348A (ko) 전자나침반을 이용한 파노라마식 자동 촬영 장치 및 방법
CN106454128B (zh) 自拍杆调节方法和装置
JP7009604B2 (ja) 撮像装置およびその制御方法
JP6750714B2 (ja) 電子機器およびプログラム
JP2011234210A (ja) カメラ付き携帯端末装置及びカメラ付き携帯端末装置の画像補正方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080304