JP4458128B2 - 方向検出装置、方向検出方法および方向検出プログラム、ならびに、方向制御装置、方向制御方法および方向制御プログラム - Google Patents

方向検出装置、方向検出方法および方向検出プログラム、ならびに、方向制御装置、方向制御方法および方向制御プログラム Download PDF

Info

Publication number
JP4458128B2
JP4458128B2 JP2007199113A JP2007199113A JP4458128B2 JP 4458128 B2 JP4458128 B2 JP 4458128B2 JP 2007199113 A JP2007199113 A JP 2007199113A JP 2007199113 A JP2007199113 A JP 2007199113A JP 4458128 B2 JP4458128 B2 JP 4458128B2
Authority
JP
Japan
Prior art keywords
distribution
audio signal
range
unit
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007199113A
Other languages
English (en)
Other versions
JP2009038466A (ja
Inventor
克明 横溝
拓哉 第新
仁毅 三宅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007199113A priority Critical patent/JP4458128B2/ja
Priority to US12/220,738 priority patent/US8064618B2/en
Publication of JP2009038466A publication Critical patent/JP2009038466A/ja
Application granted granted Critical
Publication of JP4458128B2 publication Critical patent/JP4458128B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/805Systems for determining direction or deviation from predetermined direction using adjustment of real or effective orientation of directivity characteristics of a transducer or transducer system to give a desired condition of signal derived from that transducer or transducer system, e.g. to give a maximum or minimum signal
    • G01S3/807Systems for determining direction or deviation from predetermined direction using adjustment of real or effective orientation of directivity characteristics of a transducer or transducer system to give a desired condition of signal derived from that transducer or transducer system, e.g. to give a maximum or minimum signal the desired condition being maintained automatically
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/805Systems for determining direction or deviation from predetermined direction using adjustment of real or effective orientation of directivity characteristics of a transducer or transducer system to give a desired condition of signal derived from that transducer or transducer system, e.g. to give a maximum or minimum signal
    • G01S3/8055Systems for determining direction or deviation from predetermined direction using adjustment of real or effective orientation of directivity characteristics of a transducer or transducer system to give a desired condition of signal derived from that transducer or transducer system, e.g. to give a maximum or minimum signal adjusting orientation of a single directivity characteristic to produce maximum or minimum signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/695Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects

Description

この発明は、特に撮像装置に被写体を自動追尾させるために用いて好適な方向検出装置、方向検出方法および方向検出プログラム、ならびに、方向制御装置、方向制御方法および方向制御プログラムに関する。
ビデオカメラにより、会議の発言者やパーティーの参加者、遊んでいる子供などを、専任の撮影者無しで撮影する場合、三脚などにビデオカメラを固定し、ある一方向のみを撮影することになる。このようにして撮影された映像は、撮影方向が一定のためその時々における発言者や、歓声などとは無関係であり、単調な映像となってしまう場合が多い。
そこで、従来から、被写体および画角を自動的に選択し、選択された被写体および画角に応じてビデオカメラを左右方向に回動(パン)および上下方向に回動(チルト)させることで、撮影中にビデオカメラの操作を行わなくても注目すべき方向にビデオカメラを自動的に向ける仕組みが提案されている。特許文献1には、方向の不要な切り替わりを防ぎ、自然で見易い映像を収録できるようにした技術が記載されている。
特開平5−56426号公報
上述した特許文献1では、複数のマイクロフォンからの音声信号により話者を検出し、検出された話者をクローズアップ撮像するようにカメラが切り替え制御される。この特許文献1の方法では、話者の検出後の所定時間、検出動作を停止させ、これにより、ノイズや、発言者以外の発言(例えば発言に対する相槌)などによる音声入力によってカメラが頻繁に切り替わってしまう問題を解決している。
しかしながら、この特許文献1の方法では、検出動作の停止時間を短くするとカメラの方向が頻繁に切り替わることになり、撮影された映像を鑑賞するに当たって不都合が生じる可能性があるという問題点があった。特に、近年では撮影された映像を映出させる表示装置も大画面化が進んでおり、撮影方向が頻繁に切り替わることにより映像が激しく移動することになり、視聴者に著しく不快感を与えてしまうおそれがあるという問題点があった。
また、この問題を避けるために検出動作の停止時間を長く設定すると、必要な切り替わりまでもが抑制されてしまうことになるという問題点があった。このように、この特許文献1の方法では、検出動作の停止時間を適切に設定することが難しいという問題点があった。
したがって、この発明の目的は、方向の頻繁な切り替わりを防ぐと共に目標を的確に捕捉することを可能とし、特に撮像装置に被写体を自動追尾させるために用いた場合に、見易い自然な映像の撮影を行えるようにした方向検出装置、方向検出方法および方向検出プログラム、ならびに、方向制御装置、方向制御方法および方向制御プログラムを提供することにある。
上述した課題を解決するために、第1の発明は、複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得する音声取得部と、複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を得る分布取得部と、分布取得部で取得された音声信号の大きさの分布に対して、現在選択している方向を中心とし、予め設定した方向範囲内より狭い第2の範囲に対する音声信号を強調する強調部と、強調部から出力される、第2の範囲において強調がなされた音声信号の大きさの分布の情報から、次に選択する方向を決定する方向選択部とを有し、強調部は、第2の範囲において、現在選択している方向に最大値を持ち、現在選択している方向から離れるにつれ減衰するようにした加算値を音声信号の大きさの分布に加算し、方向選択部は、第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に選択する方向とすることを特徴とする方向検出装置である。
また、第2の発明は、複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得する音声取得のステップと、複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を得る分布取得のステップと、分布取得のステップで取得された音声信号の大きさの分布に対して、現在選択している方向を中心とし、予め設定した方向範囲内より狭い第2の範囲に対する音声信号を強調する強調のステップと、強調のステップから出力される、第2の範囲において強調がなされた音声信号の大きさの分布の情報から、次に選択する方向を決定する方向選択のステップとを有し、強調のステップは、第2の範囲において、現在選択している方向に最大値を持ち、現在選択している方向から離れるにつれ減衰するようにした加算値を音声信号の大きさの分布に加算し、方向選択のステップは、第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に選択する方向とすることを特徴とする方向検出方法である。
また、第3の発明は、複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得する音声取得のステップと、複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を得る分布取得のステップと、分布取得のステップで取得された音声信号の大きさの分布に対して、現在選択している方向を中心とし、予め設定した方向範囲内より狭い第2の範囲に対する音声信号を強調する強調のステップと、強調のステップから出力される、第2の範囲において強調がなされた音声信号の大きさの分布の情報から、次に選択する方向を決定する方向選択のステップとを有し、強調のステップは、第2の範囲において、現在選択している方向に最大値を持ち、現在選択している方向から離れるにつれ減衰するようにした加算値を音声信号の大きさの分布に加算し、方向選択のステップは、第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に選択する方向とすることを特徴とする方向検出方法をコンピュータに実行させる方向検出プログラムである。
また、第4の発明は、指定された方向に駆動部を駆動する駆動制御部と、複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得する音声取得部と、複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を得る分布取得部と、分布取得部で取得された音声信号の大きさの分布に対して、駆動制御部が駆動部を現在駆動している方向を中心とし、予め設定した方向範囲内より狭い第2の範囲に対する音声信号を強調する強調部と、強調部から出力される、第2の範囲において強調がなされた音声信号の大きさの分布の情報から、駆動制御部に対して駆動部を次に駆動させる方向を指定する方向指定部とを有し、強調部は、第2の範囲において、駆動制御部が駆動部を現在駆動している方向に最大値を持ち、駆動制御部が駆動部を現在駆動している方向から離れるにつれ減衰するようにした加算値を音声信号の大きさの分布に加算し、方向指定部は、第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に指定する方向とすることを特徴とする方向制御装置である。
また、第5の発明は、指定された方向に駆動部を駆動する駆動制御のステップと、複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得する音声取得のステップと、複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を得る分布取得のステップと、分布取得のステップで取得された音声信号の大きさの分布に対して、駆動制御のステップが駆動部を現在駆動している方向を中心とし、予め設定した方向範囲内より狭い第2の範囲に対する音声信号を強調する強調のステップと、強調のステップから出力される、第2の範囲において強調がなされた音声信号の大きさの分布の情報から、駆動制御のステップに対して駆動部を次に駆動させる方向を指定する方向指定のステップとを有し、強調のステップは、第2の範囲において、駆動制御のステップが駆動部を現在駆動している方向に最大値を持ち、駆動制御のステップが駆動部を現在駆動している方向から離れるにつれ減衰するようにした加算値を音声信号の大きさの分布に加算し、方向指定のステップは、第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に指定する方向とすることを特徴とする方向制御方法である。
また、第6の発明は、指定された方向に駆動部を駆動する駆動制御のステップと、複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得する音声取得のステップと、複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を得る分布取得のステップと、分布取得のステップで取得された音声信号の大きさの分布に対して、駆動制御のステップが駆動部を現在駆動している方向を中心とし、予め設定した方向範囲内より狭い第2の範囲に対する音声信号を強調する強調のステップと、強調のステップから出力される、第2の範囲において強調がなされた音声信号の大きさの分布の情報から、駆動制御のステップに対して駆動部を次に駆動させる方向を指定する方向指定のステップとを有し、強調のステップは、第2の範囲において、駆動制御のステップが駆動部を現在駆動している方向に最大値を持ち、駆動制御のステップが駆動部を現在駆動している方向から離れるにつれ減衰するようにした加算値を音声信号の大きさの分布に加算し、方向指定のステップは、第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に指定する方向とすることを特徴とする方向制御方法をコンピュータに実行させる方向制御プログラムである。
上述したように、第1、第2および第3の発明は、複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得し、複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を取得し、音声信号の大きさの分布に対して、現在選択している方向を中心とする、予め設定した方向範囲内より狭い第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に選択する方向とするようにしているため、第2の方向範囲以外の方向で音が発生した場合に、その方向が選択されることが抑制される。
また、第4、第5および第6の発明は、複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得し、複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を取得し、音声信号の大きさの分布に対して、駆動制御部が駆動部を現在駆動している方向を中心とする、予め設定した方向範囲内より狭い第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に指定する方向とするようにしているため、第2の範囲以外の方向で音が発生した場合に、その方向に駆動部が駆動されるのが抑制される。
第1、第2および第3の発明は、上述したように、複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得し、複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を取得し、音声信号の大きさの分布に対して、現在選択している方向を中心とする、予め設定した方向範囲内より狭い第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に選択する方向とするようにしているため、第2の方向範囲以外の方向で音が発生した場合に、その方向が選択されることが抑制される効果がある。
また、第4、第5および第6の発明は、複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得し、複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を取得し、音声信号の大きさの分布に対して、駆動制御部が駆動部を現在駆動している方向を中心とする、予め設定した方向範囲内より狭い第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に指定する方向とするようにしているため、第2の範囲以外の方向で音が発生した場合に、その方向に駆動部が駆動されるのが抑制される効果がある。
以下、この発明の実施の一形態について説明する。この発明では、予め設定した方向範囲、例えば全周360°の角度範囲について音の大きさの分布を求め、評価値とする。そして、現在選択されている方向を中心とし、予め設定した方向範囲より狭い第2の方向範囲内の評価値に対して所定に重み付けを行い、当該現在選択されている方向を強調する。この現在選択された方向を中心とした第2の方向範囲内の音が強調された評価値に基づき方向を選択し、選択された方向に対する方向制御を行う。これにより、現在の方向およびその近傍を優先的に選択しつつ、対象(音源)が移動した場合などにその方向を追尾すると共に、当該第2の方向範囲以外の方向で音が発生した場合に、その方向に方向制御されることが抑制されるといったような、自然な方向制御を実現することができる。
図1は、この発明の実施の一形態を概略的に示す。図1Aは、全体図であり、図1Bは、上面図である。雲台2は、例えばビデオカメラ1が取り付けられるようにされ、駆動台4内に設けられた回転駆動部(図示しない)により、回転軸3を介して左右に回動可能とされている。駆動台4は、例えば三脚などに取り付けられて用いられる。駆動台4には、回転軸3を中心として、2次元平面内で90°ずつ角度を異ならせて、全指向性のマイクロフォン5A、5B、5Cおよび5Dが取り付けられる。なお、以下では便宜上、マイクロフォン5Aの方向が正面であるものとする。
なお、図1の例では、理解を容易とするために、マイクロフォン5A、5B、5Cおよび5Dが駆動台4の周囲に取り付けられるように示しているが、実際には、これら4個のマイクロフォンは、より密集して配置される。詳細は後述するが、マイクロフォン5A、5B、5Cおよび5Dは、互いの距離が収音対象の音声の波長以下であることが望ましい。例えば、マイクロフォン5A、5B、5Cおよび5Dは、互いの間隔が数cm以下とされて配置される。
この図1の構成において、マイクロフォン5A、5B、5Cおよび5Dにより周囲の音を収音し、収音結果に基づき雲台2すなわちビデオカメラ1を向けるべき方向を決定するための評価値を求める。そして、この評価値に基づき回転駆動部を駆動して雲台2を回動させ、ビデオカメラ1を被写体の方向に向けるようにする。このとき、収音時にビデオカメラ1が向いている方向に基づき、評価値に対して所定に重み付けを行うことで、現在の被写体の方向以外の方向で音が発生しても、ビデオカメラ1の方向が頻繁に切り替わらないようにしている。
図2は、この発明の実施の一形態による方向制御装置の一例の構成を示す。マイクロフォン5A、5B、5Cおよび5Dから出力されたアナログ音声信号は、図示されないA/D変換部でそれぞれディジタル音声信号に変換されて指向性合成部10に供給される。指向性合成部10は、例えば1個のDSP(Digital Signal Processor)からなり、供給された複数方向の音声を所定の合成比で合成し、単一指向性のマイクロフォンを任意の方向を向けたのと同様の特性を得ることができる。指向性合成部10は、マイクロフォン5A、5B、5Cおよび5Dそれぞれから供給された音声信号に基づき、2次元平面上の全周360°を所定に分割したステップで指向性が得られるように、指向性合成を行う。
以下では、指向性合成部10は、全周360°を50方向に分割し、7.2°ステップで指向性を得るものとする。一般的なビデオカメラの画角は、凡そ45°なので、1ステップが7.2°の分解能は、画角に対して十分な精度を有していると考えることができる。
指向性合成部10は、指向性合成により得られた音声信号を、指向性のステップ毎に出力する。すなわち、指向性合成部10は、正面に対して0°の方向、7.2°の方向、14.4°の方向、21.6°の方向・・・について指向性合成された音声信号をそれぞれ出力する。
指向性合成部10から出力された音声信号は、それぞれ信号処理部11、11、・・・に供給される。信号処理部11は、供給された音声信号に対してピーク検波を行いエンベロープを検出し、マイクロフォン5A、5B、5Cおよび5Dの感度のばらつきや、マイクロフォン5A、5B、5Cおよび5Dが取り付けられる筐体(図1の例では駆動台4)による影響などを除去し、さらにノイズ成分を除去して出力する。
信号処理部11、11、・・・から出力される信号は、指向性合成部10で全周360°が7.2°ステップで50チャンネルに分割されたそれぞれの方向の音の大きさを示している。換言すれば、信号処理部11、11、・・・から出力される信号は、全周360°における音の大きさの分布を、7.2°ステップで示している。詳細は後述するが、雲台2を向ける方向は、このそれぞれの方向の音の大きさに基づき評価を行うことで決定される。そこで、この信号処理部11、11、・・・から出力される信号を、以下では、適宜、評価値と呼ぶ。
信号処理部11、11、・・・から出力された各方向の評価値は、それぞれ現在方向強調部12を介して最大値検出部13に供給される。最大値検出部13は、現在方向強調部12から供給された各方向のうち、最大の評価値を持つ方向を検出する。検出された方向を示す方向情報は、制御信号生成部14に供給される。制御信号生成部14は、最大値検出部13から供給された方向情報に基づき、当該方向情報に示される方向に向くように、例えばステッピングモータからなる回転駆動部15を制御する。
ここで、この発明の実施の一形態に係る現在方向強調部12は、供給された各方向の評価値について、現在ビデオカメラ1すなわち雲台2が向いてる方向を中心とした所定範囲の評価値を強調する。強調処理は、例えば、これらの方向に対応する評価値に対して所定値を加算または乗算することで行われる。最大値検出部13では、この強調処理が所定に施された評価値のうち最大値を検出し、対応する方向を取得する。
次に、上述した方向制御装置を構成する各部について、より詳細に説明する。先ず、指向性合成部10の原理について、図3〜図10を用いて説明する。任意の方向に対する指向性を合成する処理は、原理的には、3個の全指向性マイクロフォンを用いて行うことができる。図3は、3個の全指向性マイクロフォン101、102および103を用いて指向性合成を行い、5チャンネルの単一指向性を得るようにした一例の構成を示す。
マイクロフォン101、102および103は、例えばそれぞれが正三角形の頂点となるように配置することが考えられる。一例として、正面方向に対して垂直な直線上に対してマイクロフォン101、103を配置すると共に、正面方向に対してマイクロフォン102を配置する。これに限らず、正面方向に対して垂直の直線上に対してマイクロフォン101、103を配置し、正面方向と反対側に対してマイクロフォン102を配置し、マイクロフォン101、102および103がそれぞれ逆正三角形の頂点となるように配置してもよい。但し、マイクロフォン101、102および103は、同一直線上に並ぶ配置とすると、例えば前後方向のみ、または左右方向のみしか単一指向性を有する音声信号を生成できないため、同一直線上に配置しないものとする。また、マイクロフォンの間隔は、必要帯域の最低周波数の音波の波長に対し十分に小さい間隔、例えば数cm以内とする必要がある。
図3において、マイクロフォン101、102および103から出力された音声信号は、DSP100に供給され、指向性合成処理が行われる。DSP100は、音声信号を加算する第1の加算部110および第2の加算部111と、音声信号を減算する第1の減算部115および第2の減算部120と、音声信号に所定の係数を乗ずる乗算部112、114、116、117、121および122と、周波数特性を補正する第1の積分部118および第2の積分部123とを備える。そして、5チャンネルの単一指向性を合成するために、5チャンネルの各出力部130a〜130eに対して、音声信号を可変増幅する可変増幅器131a〜131e、132a〜132e、133a〜133eと、可変増幅された音声信号を加算する加算部134a〜134eを備える。さらに、この図3においては、超低域音域の音声信号を出力するための出力部130を備える。
正面方向に対して三角形に配置された全指向性マイクロフォン101、102および103は、音声を収音し音声信号を出力する。マイクロフォン101、102および103から出力される音声信号は、第1の加算部110で加算され、加算結果に対して乗算部114による所定の係数(例えば1/3)が乗ぜられて、全指向性が合成される。
一方、正面方向に対して例えば左側に配置された全指向性マイクロフォン101から出力された音声信号と、正面方向に対し例えば右側に配置された全指向性マイクロフォン103から出力された音声信号とが第2の加算部111で加算され、加算結果に対して乗算部112による所定の係数(例えば1/2)が乗ぜられる。これにより、マイクロフォン101とマイクロフォン103との中点に位置する仮想的な全指向性が合成される。
また、第2の減算部120では、乗算部112が出力する音声信号と、正面方向の全指向性マイクロフォン102から出力された音声信号との差分をとり、この差分に対して乗算部121で所定の係数を乗じて正規化する。これにより、前後方向の両指向性が合成される。
ここで、乗算部114が出力する全指向性の感度を「最大指向感度」と称する。そして、「最大指向感度」を基準とし、他の乗算部116、121から出力する音声信号の指向感度を調整することを、「正規化」と称する。この正規化によって、乗算部114、116、121から出力する音声信号の最大指向感度が揃うため、合成することが容易となる。
さらに、正面方向に対し左側に配置された全指向性マイクロフォン101から出力された音声信号と、正面方向に対し右側に配置された全指向性マイクロフォン103から出力された音声信号とについて、第1の減算部115で差分をとり、差分に対して乗算部116で所定の係数を乗じて最大指向感度で正規化し、左右方向の両指向性を合成する。
乗算部116から出力された左右方向の両指向性信号に対して乗算部117で所定の係数を乗ずると共に、乗算部121から出力された前後方向の両指向性信号に対して乗算部122で所定の係数を乗ずる。これにより、左右方向の両指向性信号と前後方向の両指向性信号とを、乗算部114出力の全指向性と、最大指向感度で正規化する。
なお、乗算部117および乗算部122の出力信号は、前後、左右のマイクロフォンに到達した音波の差をとるため、マイクロフォン間隔よりも音波の波長が長い、低域の信号については、位相差が殆ど現れない。そのため、乗算部117および乗算部122が出力する音声信号の周波数特性は、低域に向かって減衰することになる。マイクロフォンの指向特性は、周波数に対して一様ではないことが周知である。そのため、積分部118および123を用いて、これら乗算部117および122から低域周波数の成分が減衰されて出力された音声信号に対し、低域周波数のゲインを上げ周波数特性を補正する。
図4は、積分部118、積分部123および乗算器114から出力される音声信号の一例の指向特性を示す。図4Aは、積分部118から出力される音声信号の一例の指向特性を示す。積分部118から出力される音声信号は、正面に対して左右に配置されたマイクロフォン101および103の差分に対応する指向特性であって、この図4Aに例示されるように、左右方向の両指向特性を示す。
図4Bは、積分部123から出力される音声信号の一例の指向特性を示す。積分部123から出力される音声信号は、正面に配置されたマイクロフォン102の出力と、当該マイクロフォン102に対して前または後の位置であって、当該マイクロフォン102に対して左右に配置されたマイクロフォン101および103の出力を合成した出力との差分に対応する指向特性であって、この図4Bに例示されるように、前後方向の両指向特性を示す。
図4Cは、乗算器114から出力される音声信号の一例の指向特性を示す。乗算器114から出力される音声信号は、それぞれ全指向性のマイクロフォン101、102および103の出力を加算した信号の指向特性であって、この図4Cに例示されるように、全指向特性を示す。このような全方向の指向性を、最大指向感度と称する。
このように、3個のマイクロフォン101、102および103から出力される音声信号を加算、減算処理し、適宜、周波数補正を行うことで、左右、前後、全方向の指向性を有する音声信号をそれぞれ得ることができる。第1の積分部118および第2の積分部123が出力する音声信号は、それぞれ最大指向感度で正規化された左右方向の両指向性成分と、前後方向の両指向性成分となる。乗算部114が出力する音声信号の全指向成分と、左右方向の両指向性成分と、前後方向の両指向性成分の合成比を変えることによって、単一指向性の音声信号を合成できる。合成できる指向性のパターンには、例えばカーディオイド、ハイパーカーディオイド、スーパーカーディオイドがある。
ここで、単一指向性の音声信号を合成する処理の例について、図5を参照して説明する。図5A〜図5Eは、極座標表示した2入力の音声信号を合成した場合における、出力音声信号の指向性の例を示す。2入力の音声信号のうち、左側は全指向性成分を有し、右側は左右方向の両指向性成分を有している。音声信号の感度を、それぞれ円の大きさで示している。
音声信号は、0°〜90°、270°〜360°までを正相成分としている。2つの音声信号の正相成分を加算すると、正相成分が増加して示される。一方、90°〜270°までを逆相成分としている。2つの音声信号の逆相成分を加算すると、逆相成分が減少して示される。このように、全指向性成分と両指向性成分の感度を可変とし、加算することで左右方向に任意の単一指向性を有する音声信号を作成できることが分かる。図5では、2入力の音声信号を合成した例について説明したが、前後方向の両指向性成分を有する音声信号を合成することで、任意の方向に単一指向性を有する音声信号を作成することが可能である。
図3の例では、各チャンネルの出力部130a〜130eにより、この任意方向に単一指向を有する音声信号の合成が行われる。すなわち、各チャンネルの出力部130a〜130eのそれぞれにおいて、可変増幅器131a〜131eに対して積分部118から出力された左右方向の両指向性信号が入力され、可変増幅器132a〜132eに対して乗算器114から出力された全指向性信号が入力され、可変増幅器133a〜133eに対して積分部123から出力された前後方向の両指向性信号が入力される。出力部130a〜130eにおいて、3つの可変増幅器の出力を加算器134a〜134eでそれぞれ加算して出力する。
このような構成において、各チャンネルの出力部130a〜130eのそれぞれにおいて、可変増幅器131a〜131e、可変増幅器132a〜132eおよび可変増幅器133a〜133eを所定に調整することで、それぞれ任意の方向に指向性を有する単一指向性の信号を合成し出力することができる。一例として、出力部130aでは、可変増幅器131a、132aおよび133aの係数乗算と加算部134aの加算により、全指向性と両指向性の合成比を変えることによって、単一指向性を合成し、係数比を変えれば、任意の方向、任意のサブローブを設定することができる。さらに、可変増幅器131a、132aおよび133aの合成比を変えることで、カーディオイドの形状を変えて、指向特性の感度を変えることも可能である。
図6〜図10は、加算部134a〜134eから出力される、各チャンネルの音声信号の指向性の例を示す。加算部134aから出力される音声信号は、例えば図6に一例が示されるような指向性を有する。音声信号の指向性パターンがハイパーカーディオイドであり、中央前方に単一指向性を有することが分かる。加算部134bから出力される音声信号は、例えば図7に一例が示されるように、音声信号の指向性パターンがハイパーカーディオイドであり、左前方に単一指向性を有することが分かる。加算部134cから出力される音声信号は、例えば図8に一例が示されるように、音声信号の指向性パターンがハイパーカーディオイドであり、右前方に単一指向性を有することが分かる。加算部134dから出力される音声信号は、例えば図9に一例が示されるように、音声信号の指向性パターンがハイパーカーディオイドであり、左後方に単一指向性を有することが分かる。加算部134eから出力される音声信号は、例えば図10に一例が示されるように、音声信号の指向性パターンがハイパーカーディオイドであり、右後方に単一指向性を有することが分かる。
この実施の一形態においては、図2に例示されるように、指向性合成部10は、全周360°を7.2°ステップで分割した50チャンネルの出力を有している。これは、図3の例では、出力部130において積分部118、積分部123および乗算部114から出力された音声信号のそれぞれに係数乗算を行う3つの可変増幅器と、3つの可変増幅器の出力を加算して出力する加算器とからなる構成を50チャンネル分、設けて構成される。
なお、図1および図2の例では、90°ずつ角度を異ならせて4個のマイクロフォン5A、5B、5Cおよび5Dが配置されている。これは、例えば、方向制御に応じて用いるマイクロフォンの組み合わせを切り替えるようにする。一例として、正面方向側を向くように方向制御している場合には、マイクロフォン5A、5Bおよび5Dを用い、背面方向側を向くように方向制御している場合には、マイクロフォン5C、5Bおよび5Dを用いるようにする。
次に、信号処理部11について説明する。図11は、信号処理部11の一例の構成を示す。この図11の例では、信号処理部11は、ピーク検波部20、ばらつき補正部21およびノイズ軽減部22からなる。指向性合成部10から出力されたある方向に指向性を有する音声信号は、信号処理部11に供給されると、ピーク検波部20に供給されピーク検波処理が施され、エンベロープが抽出される。例えば、入力された音声信号を所定のサンプル数単位で区切る。一例として、音声信号のサンプリング周波数が48kHz(キロヘルツ)として、16サンプルを単位として16サンプル毎に区切る。そして、区切られた単位毎に、サンプルの絶対値を求め、求められた絶対値のうち最大値を抽出し、抽出された最大値を、検波後の信号とする。
ピーク検波部20の出力は、ばらつき補正部21に供給される。ばらつき補正部21は、マイクロフォン5A、5B、5Cおよび5Dの特性の個体差や、マイクロフォン5A、5B、5Cおよび5Dが取り付けられる筐体の影響などによる、感度の系統的なばらつきを補正する。図12は、ばらつき補正部21の一例の構成を示す。ばらつき補正部21は、除算部30とローパスフィルタ31とを有し、入力された信号は、除算部30の一方の入力端に入力されると共に、ローパスフィルタ31を介して除算部30の他方の入力端に入力される。除算部30は、一方の入力端に入力された信号を、他方の入力端に入力される信号で除する。
ここで、ローパスフィルタ31の時定数Tcを、数10秒から数分といった、比較的長時間に設定する。これにより、信号処理部11、11、・・・のそれぞれに対して各方向毎に入力される信号を、信号処理部11、11、・・・間で正規化することができる。
ばらつき補正部21の出力は、ノイズ軽減部22に供給される。図13は、ノイズ軽減部22の一例の構成を示す。ノイズ軽減部22は、それぞれ時定数および特性の異なるローパスフィルタ32および33と、ローパスフィルタ32および33の出力の差分を取る減算器34とを有する。ノイズ軽減部22に供給された信号は、ローパスフィルタ32および33にそれぞれ供給される。
ローパスフィルタ32は、マイクロフォンの暗ノイズを軽減するためのフィルタである。この例では、ローパスフィルタ32は、アタック時の時定数TcATKに比べ、リカバリ時の時定数TcRCVを長く設定する。一例として、アタック時の時定数TcATKは、掌を打ち合わせたときに発する音など、立ち上がりおよび立ち下がりが極めて短い時間で発せられる音に対応する時間オーダーであり、リカバリ時の時定数TcRCVは、その音に対して人が反応し注意を奪われる程度の時間オーダーにすることが考えられる。より具体的な例として、ローパスフィルタ32は、アタック時の時定数TcATKを数10ミリ秒、リカバリ時の時定数TcRCVを1〜数秒にそれぞれ設定する。例えば、ローパスフィルタ32のフィルタ係数を動的に可変させ、アタック時とリカバリ時それぞれの時定数TcATK、TcRCVを独立して設定可能とする。
ローパスフィルタ32の特性をこのように設定することで、例えば一度大きな音がすると直ぐにその方向に方向制御し、音がしなくなってからも、暫くの間、その状態を維持するような制御が可能となる。すなわち、暗ノイズは、マイクロフォンそのものが持つノイズであって、全く無音の状態であってもマイクロフォンの出力信号が細かく揺らぐことで発生する。ローパスフィルタ32において、アタック時の時定数TcATKを短く設定することで、暗ノイズを除去しつつ、有効な音に対して直ちに反応することが可能である。また、リカバリ時の時定数TcRCVを長く設定することで、有効音に対して反応直後の別の有効音に対する反応が抑制され、最初の有効音に対する反応が維持される。
ローパスフィルタ33は、固定的な方向から到来する、所謂騒音と称されるノイズを軽減する。すなわち、ローパス33は、例えばエアーコンディショナや据置型のファンといった、固定的な場所で定常的に発生するノイズを除去することを目的としている。ローパスフィルタ33の時定数Tcは、数秒(例えば8〜9秒)程度と比較的長く設定する。ローパスフィルタ33の特性をこのように設定することで、常に同じ場所で発生する騒音と、騒音源が移動する場合とで、バランスよく対応することができる。
減算器34は、ローパスフィルタ32の出力からローパスフィルタ33の出力を減じる。すなわち、ローパスフィルタ32で暗ノイズを軽減された信号から、ローパスフィルタ33で騒音を軽減された信号を減ずることで、ノイズ軽減部22に供給された信号からノイズ成分が除去される。ノイズ成分が除去された信号は、対応する方向の評価値として信号処理部11から出力される。
次に、この発明の主旨に関わる現在方向強調部12における処理について説明する。上述したように、信号処理部11、11、・・・から出力される評価値は、それぞれの方向に対応する音の大きさを評価するものであり、この評価値が最大になる方向が雲台2すなわちビデオカメラ1を向けるべき方向であると考えられる。この評価値に従い雲台2すなわちビデオカメラ1の方向制御を行うと、撮影された画面が頻繁に切り替わってしまう場合が有り得る。
一例として、ビデオカメラ1を挟んで別々の方向にいる二人の人物AおよびBが会話をしている場合を考える。この場合、会話により話者が人物AおよびB間で頻繁に入れ替わると、人物AおよびBそれぞれの方向に対応する評価値も頻繁に変化することになり、ビデオカメラ1は、人物Aの方向と人物Bの方向とを頻繁に往復するように方向制御される。このように方向制御されて撮影された映像は、人物AおよびBの間で移動が頻繁に起こり、非常に見難いものとなる。
別の例として、どの方向からも殆ど音が到来しなくなった場合、全ての方向で、それぞれの方向に対応する評価値が略同一となってしまうため、その中から最大の評価値に対応する方向を検出しても、意味を成さないことになる。この場合には、例えば僅かな評価値のばらつきに反応して、頻繁に方向が切り替わってしまうことが考えられる。
そこで、この発明の実施の一形態では、上述のように、雲台2(すなわちビデオカメラ1)が現在向いている方向(以下、現在方向と呼ぶ)を中心とする所定範囲の方向に対応する評価値に対し、強調処理を行う。評価値の強調処理は、対象となる評価値に対して所定の値(>0)を加算することで行う。これに限らず、対象となる評価値に対して所定の係数(>1)を乗ずることで、当該評価値の強調処理とすることもできる。
このように評価値に対して強調処理を施すことで、現在方向を中心とする所定範囲以外の方向である程度の大きさの音が新たに発生しても、その新たな音の方向に対応する評価値が、現在方向に対応する、強調された評価値よりも大きくなる可能性が低い。これにより、新たな音の方向への方向制御の切り換えが抑制され、雲台2すなわちビデオカメラ1の方向が維持される。
図14は、このような評価値の強調処理を実現するための現在方向強調部12の一例の構成を示す。この現在方向強調部12は、評価値に対して所定値を加算することで、評価値の強調処理を行うようにしている。現在方向強調部12に対して、指向性合成部10で全周360°が7.2°ステップで50チャンネルに分割された音声信号にそれぞれ対応する、信号処理部11、11、・・・の出力すなわち評価値がそれぞれ供給される。現在方向強調部12は、指向性合成部10の出力チャンネル数にそれぞれ対応する加算器41[0]、41[1]、・・・、41[n]、・・・41[49]と、これら加算器41[0]、41[1]、・・・、41[n]、・・・41[49]のそれぞれに対する加算定数k[0]、k[1]、・・・、k[n]、・・・k[49]を供給する加算定数格納部40を有する。
加算器41[0]、41[1]、・・・、41[n]、・・・41[49]それぞれの一方の入力端に、加算定数k[0]、k[1]、・・・、k[n]、・・・k[49]がそれぞれ供給される。加算器41[0]、41[1]、・・・、41[n]、・・・41[49]それぞれの他方の入力端に、信号処理部11、11、・・・から出力された評価値がそれぞれ供給される。例えば、加算器41[0]、41[1]、・・・、41[n]、・・・41[49]それぞれに対して順に、正面に対して0°、7.2°、14.4°、21.6°、・・・、352.8°の指向性を有する音声信号に対応する評価値がそれぞれ供給される。
加算器41[0]、41[1]、・・・、41[n]、・・・41[49]は、それぞれ他方の入力端に供給された評価値に対し、一方の入力端に供給された加算定数を加算して新たな評価値として出力する。
加算定数格納部40に格納される加算定数k[0]、k[1]、・・・、k[n]、・・・k[49]それぞれの値は、現在方向を示す情報に基づき設定される。現在方向は、例えば回転駆動部15に対して回転角を検出するセンサを設け、このセンサの出力に基づき取得することができる。これに限らず、制御信号生成部14において、回転駆動部15を駆動するために生成する駆動制御信号に基づき現在方向を取得することもできる。雲台2や回転軸3そのものにセンサを設け、現在の方向を検出してもよい。また、この方向制御装置を制御する図示されないマイクロプロセッサにより、前回、方向制御を行った方向を示す情報をレジスタなどの記憶手段に記憶しておくようにしてもよい。
この発明の実施の一形態では、現在方向Dr[n]をより強調するように、加算定数k[n]を決定する。このとき、現在方向Dr[n]に対応する加算定数k[n]と、当該方向Dr[n]に隣接する複数の方向Dr[n+1]、Dr[n+2]、・・、Dr[n+a]および方向Dr[n-1]、Dr[n-2]、・・、Dr[n-a]にそれぞれ対応する加算定数k[n+1]、k[n+2]、・・、k[n+a]および加算定数k[n-1]、k[n-2]、・・、k[n-a]とを、所定に設定し、その他の加算定数kは、値を0とする。
図15は、評価値に加算するための一例の加算定数を示す。加算定数の単位は、人間が感じる音の大きさに対応するdBSPL(dB Sound Preasure Level)としている。この図15の例では、7.2°を1ステップとしたとき、現在方向および現在方向に対して左右に4ステップずつの合計9ステップ、すなわち、現在方向を中心に64.8°の範囲内を、評価値を強調する範囲としている。なお、家庭用のビデオカメラの画角は、ズームを行わない状態で45°程度である。評価値を強調する範囲を、このビデオカメラの画角に基づき設定することが考えられる。
また、この例では、現在方向に対応する加算定数を最大値とし、現在方向から左右に離れるに連れ、加算定数の値を小さくしている。この図15の例では、現在方向に対する加算定数を38.4dBSPLとし、現在方向から1ステップ離れる毎に略0.6dBSPLずつ加算定数を減少させている。
一例として、nを20とした場合、加算器41[16]〜加算器41[24]に対して、図15の加算定数k[n-4]〜k[n+4]の値がそれぞれ入力され、それ以外の加算器、すなわち加算器41[0]〜加算器41[15]、加算器41[25]〜加算器41[49]は、値0が入力される。
現在方向強調部12において、各加算定数と加算定数が供給される加算器との関係は、例えば図示されないマイクロプロセッサなどにより所定のプログラムに基づき制御される。プログラムは、マイクロプロセッサに接続されるROM(Read Only Memory)などに予め記憶しておくことが考えられる。
例えば、加算定数格納部40に格納される加算定数を現在方向に応じて書き換える制御が考えられる。これに限らず、加算定数格納部40に各加算定数が格納されるアドレスを、現在方向に応じて変換する制御や、加算定数格納部40における各加算定数それぞれの格納部と加算器41[0]、41[1]、・・・、41[n]、・・・41[49]との接続を切り替えるような制御であってもよい。
現在方向強調部12で、上述のようにして現在方向に応じて強調された各方向の評価値は、最大値検出部13に供給される。最大値検出部13は、現在方向強調部12から供給されたこれらの評価値から最大値を検出し、最大値が検出された評価値に対応する方向を求める。すなわち、この最大値が検出された評価値に対応する方向が、ビデオカメラ1を向けるべき方向である。
最大値検出部13で求められた、評価値の最大値に対応する方向を示す情報が制御信号生成部14に供給される。制御信号生成部14は、供給されたこの方向情報に基づき、雲台2が方向情報に示される方向を向くように回転駆動部15を制御するための制御信号を生成する。制御信号としては、例えば現在回転駆動部15が駆動している方向と方向情報に示される方向との差分の角度を指定するような信号が考えられる。これに限らず、回転駆動部15における絶対的な角度を指定するような信号でもよい。さらに、回転駆動部15が所定の角度を1ステップとしてステップ駆動される場合には、現在回転駆動部15が駆動している方向と方向情報に示される方向との差分の角度に対応するステップ数を指定するような信号も考えられる。回転駆動部15は、この制御信号に従いモータの動作を制御して回転軸3を所定の角度だけ回動させ、雲台2を所定の方向に向けさせる。
図16および図17を用いて、この発明の実施の一形態による、現在方向の評価値を強調した場合の回動駆動制御について説明する。図16は、人物Aが音声を発しながら雲台2に取り付けられたビデオカメラ1の周囲を移動する場合の例である。図16Aに一例が示されるように、雲台2の初期の現在方向は、正面に対して略90°の方向とされ、人物Aは、ビデオカメラ1すなわち雲台2の周囲を、90°方向から0°の方向に移動しているものとする。この場合には、ビデオカメラ1が人物Aの移動に追従するように方向制御されることが期待される。
図16Bは、図16Aのような状況でのある瞬間における、雲台2(ビデオカメラ1)を中心とした全周360°における評価値の一例の分布を示す。なお、評価値は、実際には全周360°を所定の角度で分割したステップ毎の離散値であるが、図16Bおよび後述する図17Bでは、所定に近似化した曲線で示している。
図16Bにおいて、点線は、方向強調部12による強調前の評価値を示す。換言すれば、点線は、各ステップに対応する信号処理部11、11、・・・から出力される評価値に対応する。雲台2の現在方向は、90°より多少大きい角度Angであるものとする。人物Aは、90°より多少小さい角度Angにおり、この位置で声を発している。したがって、強調前の評価値は、角度Angにおいて最大値を示している。なお、角度Angは、加算定数が加算される範囲の外であるものとする。評価値の強調を行わない場合には、雲台2は、角度Angから角度Angまで回動されることになる。
ここで、既に説明したように、現在方向を中心とした所定範囲に対し、評価値に対して加算定数が加算され、評価値が強調される。現在方向を中心に所定範囲が強調された評価値を、図16Bにおいて実線で示す。現在方向の角度Angを中心に、所定範囲の評価値に加算定数が加算され、評価値の最大値が評価値に加算定数が加算される所定範囲内の角度Angとなっている。そのため、雲台2は、角度Angから角度Angまで回動される。この場合、角度Angが示す方向は、角度Angに対して、人物Aの位置に対応する角度Angが示す方向よりも内側にあるため、方向制御は、人物Aを追うような動作として行われる。
図17は、二人の人物BおよびCが、ビデオカメラ1(雲台2)を挟んで会話している場合の例である。図17Aに一例が示されるように、雲台2の初期の現在方向は、正面に対して270°より多少小さい角度Angの方向とされ、人物Bは、この現在方向側で主に音声を発し、人物Cは、略45°の方向で、時折音声を発する。これは、例えば、人物Bが主たる話者であって、人物Cは、人物Bの話に対して相槌を打つような状況が考えられる。このような場合、ビデオカメラ1は、主に人物Bを撮影すべきであり、人物Cに対してビデオカメラ1を向ける必要はほとんど無いと考えられる。
図17Bは、例えば人物Bが話している最中に人物Cが相槌を打った瞬間の評価値の一例の状態を示す。図17Bにおいて、点線は、方向強調部12による強調前の評価値を示す。人物Bの声に応じて角度Angに評価値の第1のピークが存在すると共に、人物Cの声に応じて角度Angに評価値の第2のピークが存在する。この図17Bの例では、強調前の評価値は、第2のピークが第1のピークよりも大きい。したがって、評価値の強調を行わない場合には、雲台2は、角度Angから角度Angまで回動されることになる。
この場合、人物Cの声に応じた雲台2の回動範囲が大きいため、雲台2に取り付けられたビデオカメラ1により撮影された映像において視野の大きな移動が発生する。また、主に人物Bが話し、人物Cが相槌を打つような場合だと、人物Bを撮影しているビデオカメラ1が人物Cの相槌の度に人物Cの方向に移動されることになり、撮影画像において映像の移動が頻繁に発生し、非常に見難い映像となるおそれがある。
既に説明したようにして、現在方向を中心として評価値を強調した場合の評価値を、図17Bに実線で示す。現在方向の角度Angを中心に、所定範囲の評価値に加算定数が加算され、評価値の最大値が評価値に加算定数が加算される所定範囲内の角度Angとなっている。そのため、雲台2は、角度Angから角度Angまで回動されることになる。
角度Angは、角度Angの近傍であって、角度Angに対する差分が角度Angよりも遙かに小さいので、評価値を強調しない場合に比べて雲台2の回動範囲が遙かに小さくなり、人物Cが音声を発する度に人物Cの方向に一々回動されない。これにより、雲台2の取り付けられたビデオカメラ1により撮影された映像も、人物Bが話している間中、人物Bが撮影され続けることになり、本来目的とされた映像を得ることができる。
このように、この発明によれば、音源の移動に追従すると共に、現在方向と大きく異なる方向の音源に対しては反応が抑制された方向制御が可能となる。そのため、例えばこの発明の方法によりビデオカメラ1の方向制御を行うことで、撮影方向が頻繁に切り替えられることが抑制され、より自然な映像を得ることができる。
なお、雲台2の回動が完了した直後に再び雲台2の回動が起きると、雲台2の取り付けられたビデオカメラ1で撮影された映像は、見難いものになることが考えられる。そこで、制御信号生成部14は、雲台2の回動が完了した直後から所定時間経過するまでの間、回動が起こらないように停止制御を行う。停止制御を行う時間は、固定的としてもよいし、可変としてもよい。可変とする場合、例えば、停止制御を行う時間を直前に回動を行った角度の大きさに応じて設定することが考えられる。また、直前に行った回動の角度が所定以下のときは、停止制御を行わないようにすることも考えられる。
また、上述では、各方向の評価値を求めるために音声を収音するマイクロフォン5A〜5Dとして、全指向性マイクロフォンを用いているが、これはこの例に限定されない。例えば、単一指向性のマイクロフォンを各方向のそれぞれに対して設け、これらのマイクロフォンで収音された音声に基づき各方向の評価値を求めるようにしてもよい。また例えば、単一指向性のマイクロフォンを複数、用いる場合において、例えば隣り合う2のマイクロフォンで収音された音声に基づき所定以上の音量の音を発生する発生源の定位を求めることで、方向を検出することも考えられる。
さらに、上述では、水平面内での音の方向を検出し、左右方向の回動(パン)のみを制御するように説明したが、これはこの例に限定されない。例えば、任意の角度の面内で音の方向を検出し、当該面内での方向制御を行うようにできる。一例として、垂直面内で音の方向を検出し、上下方向の回動(チルト)を制御するようにできる。また例えば、音の検出および方向制御は、2次元平面内に限られない。すなわち、水平面および垂直面といった、直交する2平面内においてそれぞれ音の方向を検出し、当該2平面内でそれぞれ方向制御することで、3次元的に方向制御を行うことも可能である。この場合には、回転駆動装置を2平面のそれぞれに対応して設け、それぞれ駆動制御を行う。
さらにまた、上述では、全周360°について方向制御を行うように説明したが、これはこの例に限定されない。すなわち、方向制御を行う方向範囲を、180°や270°といった所定の方向範囲内としてもよい。音の大きさを強調する範囲は、この所定の方向範囲より狭い方向範囲とする。
また、上述では、方向制御装置全体が雲台2や三脚側、すなわち、ビデオカメラ1が取り付けられる側に設けたが、これはこの例に限定されず、例えばビデオカメラ1側に方向制御装置を設けることもできる。
さらに、上述では、図2に例示される方向制御装置がハードウェア的に構成されるものとして説明したが、これはこの例に限定されない。すなわち、図2に例示される方向制御装置は、ソフトウェア的に構成することも可能である。例えば、図2の構成において、指向性合成部10、信号処理部11、11、・・・、現在方向強調部12および最大値検出部13を、ソフトウェアで構成することが可能である。ソフトウェア構成に制御信号生成部14を加えてもよい。マイクロフォン5A〜5Dの出力は、A/D変換によりディジタルオーディオデータとして、指向性合成部10に供給する。
発明の実施の一形態を概略的に示す略線図である。 発明の実施の一形態による方向制御装置の一例の構成を示すブロック図である。 3個の全指向性マイクロフォンを用いて指向性合成を行い5チャンネルの単一指向性を得るようにした一例の構成を示すブロック図である。 3個のマイクロフォンから出力される音声信号を加算、減算処理し、適宜、周波数補正を行うことで得られる指向性特性の例を示す。 単一指向性の音声信号を合成する処理の例について説明するための略線図である。 加算部から出力される各チャンネルの音声信号の指向性の例を示す略線図である。 加算部から出力される各チャンネルの音声信号の指向性の例を示す略線図である。 加算部から出力される各チャンネルの音声信号の指向性の例を示す略線図である。 加算部から出力される各チャンネルの音声信号の指向性の例を示す略線図である。 加算部から出力される各チャンネルの音声信号の指向性の例を示す略線図である。 信号処理部の一例の構成を示すブロック図である。 ばらつき補正部の一例の構成を示すブロック図である。 ノイズ低減部の一例の構成を示すブロック図である。 現在方向強調部の一例の構成を示すブロック図である。 評価値に加算するための一例の加算定数を示略線図であるす。 発明の実施の一形態による、現在方向の評価値を強調した場合の回動駆動制御について説明するための略線図である。 発明の実施の一形態による、現在方向の評価値を強調した場合の回動駆動制御について説明するための略線図である。
符号の説明
1 ビデオカメラ
2 雲台
3 回転軸
5A,5B,5C,5D マイクロフォン
10 指向性合成部
11 信号処理部
12 現在方向強調部
13 最大値検出部
14 制御信号生成部
15 回転駆動部
20 ピーク検波部
21 ぱらつき補正部
22 ノイズ軽減部
40 加算定数格納部
41 加算部

Claims (6)

  1. 複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得する音声取得部と、
    上記複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を得る分布取得部と、
    上記分布取得部で取得された上記音声信号の大きさの分布に対して、現在選択している方向を中心とし、上記予め設定した方向範囲内より狭い第2の範囲に対する音声信号を強調する強調部と、
    上記強調部から出力される、上記第2の範囲において強調がなされた音声信号の大きさの分布の情報から、次に選択する方向を決定する方向選択部と
    を有し、
    上記強調部は、上記第2の範囲において、上記現在選択している方向に最大値を持ち、上記方向から離れるにつれ減衰するようにした加算値を上記音声信号の大きさの分布に加算し、
    上記方向選択部は、上記第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に選択する方向とする
    ことを特徴とする方向検出装置。
  2. 複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得する音声取得のステップと、
    上記複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を得る分布取得のステップと、
    上記分布取得のステップで取得された上記音声信号の大きさの分布に対して、現在選択している方向を中心とし、上記予め設定した方向範囲内より狭い第2の範囲に対する音声信号を強調する強調のステップと、
    上記強調のステップから出力される、上記第2の範囲において強調がなされた音声信号の大きさの分布の情報から、次に選択する方向を決定する方向選択のステップと
    を有し、
    上記強調のステップは、上記第2の範囲において、上記現在選択している方向に最大値を持ち、上記方向から離れるにつれ減衰するようにした加算値を上記音声信号の大きさの分布に加算し、
    上記方向選択のステップは、上記第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に選択する方向とする
    ことを特徴とする方向検出方法。
  3. 複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得する音声取得のステップと、
    上記複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を得る分布取得のステップと、
    上記分布取得のステップで取得された上記音声信号の大きさの分布に対して、現在選択している方向を中心とし、上記予め設定した方向範囲内より狭い第2の範囲に対する音声信号を強調する強調のステップと、
    上記強調のステップから出力される、上記第2の範囲において強調がなされた音声信号の大きさの分布の情報から、次に選択する方向を決定する方向選択のステップと
    を有し、
    上記強調のステップは、上記第2の範囲において、上記現在選択している方向に最大値を持ち、上記方向から離れるにつれ減衰するようにした加算値を上記音声信号の大きさの分布に加算し、
    上記方向選択のステップは、上記第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に選択する方向とする
    ことを特徴とする方向検出方法をコンピュータに実行させる方向検出プログラム。
  4. 指定された方向に駆動部を駆動する駆動制御部と、
    複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得する音声取得部と、
    上記複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を得る分布取得部と、
    上記分布取得部で取得された上記音声信号の大きさの分布に対して、上記駆動制御部が上記駆動部を現在駆動している方向を中心とし、上記予め設定した方向範囲内より狭い第2の範囲に対する音声信号を強調する強調部と、
    上記強調部から出力される、上記第2の範囲において強調がなされた音声信号の大きさの分布の情報から、上記駆動制御部に対して上記駆動部を次に駆動させる方向を指定する方向指定部と
    を有し、
    上記強調部は、上記第2の範囲において、上記駆動制御部が上記駆動部を現在駆動している方向に最大値を持ち、上記方向から離れるにつれ減衰するようにした加算値を上記音声信号の大きさの分布に加算し、
    上記方向指定部は、上記第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に指定する方向とする
    ことを特徴とする方向制御装置。
  5. 指定された方向に駆動部を駆動する駆動制御のステップと、
    複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得する音声取得のステップと、
    上記複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を得る分布取得のステップと、
    上記分布取得のステップで取得された上記音声信号の大きさの分布に対して、上記駆動制御のステップが上記駆動部を現在駆動している方向を中心とし、上記予め設定した方向範囲内より狭い第2の範囲に対する音声信号を強調する強調のステップと、
    上記強調のステップから出力される、上記第2の範囲において強調がなされた音声信号の大きさの分布の情報から、上記駆動制御のステップに対して上記駆動部を次に駆動させる方向を指定する方向指定のステップと
    を有し、
    上記強調のステップは、上記第2の範囲において、上記駆動制御のステップが上記駆動部を現在駆動している方向に最大値を持ち、上記方向から離れるにつれ減衰するようにした加算値を上記音声信号の大きさの分布に加算し、
    上記方向指定のステップは、上記第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に指定する方向とする
    ことを特徴とする方向制御方法。
  6. 指定された方向に駆動部を駆動する駆動制御のステップと、
    複数のマイクロフォンにより、予め設定した方向範囲内の音声を取得する音声取得のステップと、
    上記複数のマイクロフォンの各々から出力される音声信号をそれぞれ合成することによって、各方向の音声信号の大きさの分布を得る分布取得のステップと、
    上記分布取得のステップで取得された上記音声信号の大きさの分布に対して、上記駆動制御のステップが上記駆動部を現在駆動している方向を中心とし、上記予め設定した方向範囲内より狭い第2の範囲に対する音声信号を強調する強調のステップと、
    上記強調のステップから出力される、上記第2の範囲において強調がなされた音声信号の大きさの分布の情報から、上記駆動制御のステップに対して上記駆動部を次に駆動させる方向を指定する方向指定のステップと
    を有し、
    上記強調のステップは、上記第2の範囲において、上記駆動制御のステップが上記駆動部を現在駆動している方向に最大値を持ち、上記方向から離れるにつれ減衰するようにした加算値を上記音声信号の大きさの分布に加算し、
    上記方向指定のステップは、上記第2の範囲において強調がなされた音声信号の大きさの分布の最大値に対応する方向を次に指定する方向とする
    ことを特徴とする方向制御方法をコンピュータに実行させる方向制御プログラム。
JP2007199113A 2007-07-31 2007-07-31 方向検出装置、方向検出方法および方向検出プログラム、ならびに、方向制御装置、方向制御方法および方向制御プログラム Expired - Fee Related JP4458128B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007199113A JP4458128B2 (ja) 2007-07-31 2007-07-31 方向検出装置、方向検出方法および方向検出プログラム、ならびに、方向制御装置、方向制御方法および方向制御プログラム
US12/220,738 US8064618B2 (en) 2007-07-31 2008-07-28 Direction detection apparatus, direction detection method and direction detection program, and direction control apparatus, direction control method, and direction control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007199113A JP4458128B2 (ja) 2007-07-31 2007-07-31 方向検出装置、方向検出方法および方向検出プログラム、ならびに、方向制御装置、方向制御方法および方向制御プログラム

Publications (2)

Publication Number Publication Date
JP2009038466A JP2009038466A (ja) 2009-02-19
JP4458128B2 true JP4458128B2 (ja) 2010-04-28

Family

ID=40338154

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007199113A Expired - Fee Related JP4458128B2 (ja) 2007-07-31 2007-07-31 方向検出装置、方向検出方法および方向検出プログラム、ならびに、方向制御装置、方向制御方法および方向制御プログラム

Country Status (2)

Country Link
US (1) US8064618B2 (ja)
JP (1) JP4458128B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI388205B (zh) * 2008-12-19 2013-03-01 Ind Tech Res Inst 目標追蹤之方法與裝置
US9030520B2 (en) 2011-06-20 2015-05-12 Polycom, Inc. Automatic camera selection for videoconferencing
JP5967848B1 (ja) * 2015-03-25 2016-08-10 株式会社アルブレイン 会議システム
JP6651989B2 (ja) 2015-08-03 2020-02-19 株式会社リコー 映像処理装置、映像処理方法、及び映像処理システム
WO2017157443A1 (en) * 2016-03-17 2017-09-21 Sonova Ag Hearing assistance system in a multi-talker acoustic network

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0497666A (ja) 1990-08-15 1992-03-30 Hitachi Ltd ビデオカメラの自動追尾装置
JPH0556426A (ja) 1991-08-28 1993-03-05 Fujitsu Ltd カメラコントロール回路
US5508734A (en) * 1994-07-27 1996-04-16 International Business Machines Corporation Method and apparatus for hemispheric imaging which emphasizes peripheral content
JP2002218583A (ja) 2001-01-17 2002-08-02 Sony Corp 音場合成演算方法及び装置
JP3739673B2 (ja) 2001-06-22 2006-01-25 日本電信電話株式会社 ズーム推定方法、装置、ズーム推定プログラム、および同プログラムを記録した記録媒体
JP3963261B2 (ja) 2002-06-07 2007-08-22 中央電子株式会社 動画像の自動追尾撮影方法および自動追尾撮影装置

Also Published As

Publication number Publication date
US20090034753A1 (en) 2009-02-05
US8064618B2 (en) 2011-11-22
JP2009038466A (ja) 2009-02-19

Similar Documents

Publication Publication Date Title
JP6023779B2 (ja) オーディオ情報処理の方法及び装置
JP4367484B2 (ja) 音声信号処理装置、音声信号処理方法及び撮像装置
RU2663343C2 (ru) Система, устройство и способ для совместимого воспроизведения акустической сцены на основе адаптивных функций
JP4872871B2 (ja) 音源方向検出装置、音源方向検出方法及び音源方向検出カメラ
JP5426035B2 (ja) 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法
JP4934968B2 (ja) カメラ装置、カメラ制御プログラム及び記録音声制御方法
JP4458128B2 (ja) 方向検出装置、方向検出方法および方向検出プログラム、ならびに、方向制御装置、方向制御方法および方向制御プログラム
JP4670682B2 (ja) オーディオ装置及び指向音生成方法
CN113597776A (zh) 参数化音频中的风噪声降低
JP5020845B2 (ja) 音声処理装置
JP2012178807A (ja) 撮像装置
EP3695617A1 (en) Spatial audio signal processing
JP2009130854A (ja) 音声信号処理装置、音声信号処理方法及び撮像装置
JP5998483B2 (ja) 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体
US9160460B2 (en) Noise cancelling device
JP2022506582A (ja) パノラマ画像
JP2001326990A (ja) 音響信号処理装置及び処理方法
JP2000278581A (ja) ビデオカメラ
JP2011120165A (ja) 撮像装置
JPH10155107A (ja) マイクロホン内蔵型ビデオカメラ
JP2001008285A (ja) 音声帯域信号処理方法及び音声帯域信号処理装置
JP6878137B2 (ja) 音声処理装置、音声処理方法およびプログラム
WO2023228713A1 (ja) 音声処理装置および方法、情報処理装置、並びにプログラム
JP2018207313A (ja) 音声処理装置及びその制御方法
JP2016189584A (ja) 撮像装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100119

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100201

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130219

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees