JPWO2011010426A1 - 収音装置及び収音方法 - Google Patents

収音装置及び収音方法 Download PDF

Info

Publication number
JPWO2011010426A1
JPWO2011010426A1 JP2011506520A JP2011506520A JPWO2011010426A1 JP WO2011010426 A1 JPWO2011010426 A1 JP WO2011010426A1 JP 2011506520 A JP2011506520 A JP 2011506520A JP 2011506520 A JP2011506520 A JP 2011506520A JP WO2011010426 A1 JPWO2011010426 A1 JP WO2011010426A1
Authority
JP
Japan
Prior art keywords
sound
signal
microphone
sound collection
calculation unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011506520A
Other languages
English (en)
Other versions
JP5443469B2 (ja
Inventor
慎一 杠
慎一 杠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2011506520A priority Critical patent/JP5443469B2/ja
Publication of JPWO2011010426A1 publication Critical patent/JPWO2011010426A1/ja
Application granted granted Critical
Publication of JP5443469B2 publication Critical patent/JP5443469B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic Arrangements (AREA)
  • Stereophonic System (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

マイクロホンの設置の自由度を高めるとともに、マイクロホンの現在位置の情報を用いずに、音源からの音を明瞭にステレオ収音することができる収音装置を提供する。指向性の主軸方向が互いに異なるように配置された4以上の収音ユニット(110a〜110d)を備え、スピーカから出力された音を収音可能な位置に設置されるマイクロホン(110)と、4以上の収音ユニット(110a〜110d)の出力信号ごとに、スピーカから出力された音の信号レベルを算出するレベル算出部(112)と、算出された信号レベルを用いて、4以上の収音ユニットの指向性の主軸方向に適応するミキシング係数を算出するミキシング比算出部(113)と、算出されたミキシング係数を用いて、4以上の収音ユニットの出力信号を合成することにより、ステレオ信号を生成する信号合成部(115)とを備える。

Description

本発明は、収音装置及び収音方法等に関し、特に、複数のマイクロホンを用いてステレオ信号を生成する収音装置及び収音方法に関するものである。
従来より、テレビ会議システムなどの音響システムでは、音源(例えば話者など)からの音を明瞭に収音するために、複数のマイクロホンを用いて音を収音する収音装置が用いられていた。このような収音装置は、例えば、自拠点における音源の位置を通信相手拠点で再現する(音像定位を実現する)ためのマルチチャンネル信号を、複数のマイクロホンを用いて生成する。
このような収音装置では、複数のマイクロホンは、各チャンネルに対応して設けられている。また、複数のマイクロホンは、指向性の主軸方向を対応するチャンネルに応じた方向に向けた状態で固定的に設置される。そして、収音装置は、各収音信号を、音像定位を実現するためのマルチチャンネル信号として生成することができる。生成されたマルチチャンネル信号は、通信網を介して通信相手拠点の複数のスピーカへ送信される。これにより、通信相手拠点でマルチチャンネルの音が再生され、通信相手拠点で自拠点の話者の位置が再現される。
ここで、音像定位を実現するためのマルチチャンネル信号を生成するには、複数のマイクロホンが、指向性の主軸方向を対応するチャンネルに応じた方向に向けた状態で、固定的に設置される必要がある。このため、上記収音装置では、話者は、複数のマイクロホンの配置位置を自由に変更することができなかった。
そこで、上記課題を解決するために、図16及び図17に示すような収音装置190が提案されている(例えば、特許文献1参照)。図16は、従来の収音システムの外観図である。図17は、従来のテレビ会議システムの機能構成を示すブロック図である。図17に示すように、テレビ会議システムは、自拠点に設置される第1の収音システム1000と、通信相手拠点に設置される第2の収音システム2000とを備える。なお、第2の収音システム2000は、第1の収音システム1000と同様の構成であるので、図16において外観図を省略する。
図16及び図17の例では、マルチチャンネル信号として、右チャンネル(以下、「Rチャンネル」または「Rch」ともいう)信号と左チャンネル(以下、「Lチャンネル」または「Lch」ともいう)信号とが生成されるとし、通信相手拠点においてステレオ再生が実現されるとする。
マイクロホン90aは、話者102aの前方近傍に配置されるようにテーブル103上に設置される。マイクロホン90bは、話者102bの前方近傍に配置されるようにテーブル103上に設置される。モニター104は、通信相手拠点のカメラ205で撮影された映像を表示するための装置であり、話者102a、102bの前方に設置される。通信相手拠点の映像は、通信網107を介してモニター104に入力される。
カメラ105は、モニター104の上部に設置され、自拠点の話者102a、102bを撮影する。自拠点の映像は、通信網107を介して通信相手拠点のモニター204へ送信される。
第1及び第2のスピーカ106a、106bは、通信相手拠点の収音装置290から通信網107を介して入力されたLチャンネル信号またはRチャンネル信号を再生する。第1及び第2のスピーカ106a、106bは、モニター104の両側にそれぞれ設置される。同様に通信相手拠点の第1のスピーカ206aは、通信相手拠点の話者から見て左側前方に設置され、通信相手拠点の第2のスピーカ206bは、通信相手拠点の話者から見て右側前方に設置されている。
収音装置190は、自拠点に設置され、収音装置290は、通信相手拠点に設置される。なお、収音装置290の内部構成は、収音装置190と同様であるので、ここでは図示及び説明を省略する。
収音装置190は、マイクロホン90a、90b、マイクロホン位置測定部91、係数算出部92、マイクロホン検出部93、及び信号算出部94により構成される。以下、収音装置190の各構成要素について具体的に説明する。
マイクロホン位置測定部91は、測定信号を第1及び第2のスピーカ106a、106bに出力する。その後、マイクロホン位置測定部91は、測定信号を出力してから、当該測定信号がマイクロホン90a、90bで収音されるまでの時間を遅延時間として算出する。マイクロホン位置測定部91は、算出した遅延時間を用いて、マイクロホン90a、90bの現在位置を測定する。
図16の例では、マイクロホン90aは、モニター104から見て右側の位置に配置されるので、当該右側の位置がマイクロホン90aの現在位置として測定される。また、マイクロホン90bは、モニター104から見て左側の位置に配置されるので、当該左側の位置がマイクロホン90bの現在位置として測定される。なお、話者がマイクロホン90a、90bを自由に移動させることができるように、マイクロホン位置測定部91は、マイクロホン90a、90bの移動のたびに、それらの現在位置を測定している。
係数算出部92は、測定されたマイクロホン90a、90bの現在位置を基に、音像定位を実現するためのマルチチャンネル信号が生成されるように、Rチャンネル信号に割り当てるレベルとLチャンネル信号に割り当てるレベルとの比(係数比)を算出する。
図16の例では、測定されたマイクロホン90aの現在位置はモニター104から見て右側の位置となる。よって、係数算出部92は、例えば、(Rチャンネル信号:Lチャンネル信号)=(1:0)をマイクロホン90aの係数比として算出する。一方、測定されたマイクロホン90bの現在位置はモニター104から見て左側の位置となる。よって、係数算出部92は、例えば、(Rチャンネル信号:Lチャンネル信号)=(0:1)をマイクロホン90bの係数比として算出する。
マイクロホン検出部93は、話者102a、102bのいずれかが発言したとき、マイクロホン90a、90bからの収音信号のレベルを基に、発言者に最も近いマイクロホンを検出する。例えば、話者102aが発言した場合、マイクロホン90aからの収音信号のレベルがマイクロホン90bからの収音信号のレベルよりも大きくなる。この場合、マイクロホン検出部93は、マイクロホン90aを、発言者に最も近いマイクロホンとして検出する。その後、係数算出部92は、マイクロホン検出部93で検出されたマイクロホン90aを基に、マイクロホン90aの係数比(Rチャンネル信号:Lチャンネル信号)=(1:0)を、信号算出部94に出力する係数比として決定する。
信号算出部94は、決定された係数比に従って、Rチャンネル信号及びLチャンネル信号を算出する。例えば、マイクロホン90aの係数比が(Rチャンネル信号:Lチャンネル信号)=(1:0)である場合、信号算出部94は、マイクロホン90a、90bの収音信号それぞれに係数1を乗算して加算することで、Rチャンネル信号を算出する。一方、信号算出部94は、マイクロホン90a、90bの収音信号それぞれに係数0を乗算して加算することで、Lチャンネル信号を算出する。
これにより、Rチャンネル信号はマイクロホン90a、90bからの収音信号すべてが加算された信号となり、Lチャンネル信号は無信号となり、音像定位を実現するためのマルチチャンネル信号が生成される。信号算出部94において算出されたLチャンネル信号(Lch)及びRチャンネル信号(Rch)は、通信網107を介して、通信相手拠点のスピーカ206a、206bへそれぞれ送信される。これにより、通信相手拠点では、通信相手拠点の話者から見て右側の位置から話者102aが発言しているように音が再生される。
このように、図16及び図17に示した収音装置190では、マイクロホンの移動のたびに、移動後のマイクロホンの位置(現在位置)を測定し、測定したマイクロホンの現在位置の情報を用いて、音像定位を実現するためのマルチチャンネル信号を生成している。その結果、話者は、マイクロホンの配置位置を自由に変更することができる。
特開平9−182044号公報
しかしながら、図16及び図17に示した収音装置190は、次の課題を有している。
(1)収音装置190は、マイクロホンの現在位置の情報を用いた処理を行っているので、マルチチャンネル信号を生成する前(例えば会議開始前)に、マイクロホンの位置を測定する必要がある。
(2)収音装置190は、マイクロホンの現在位置の情報を用いた処理を行っているので、会議中に話者がマイクロホンを移動させるなどしてマイクロホンの位置が変わるたびに、会議を中断してマイクロホンの位置を測定し直す必要がある。
(3)マイクロホンは話者によって自由に移動させられるので、マイクロホンの指向性の主軸方向が必ずしも話者に向いているとは限らず、マイクロホン検出部93において検出されたマイクロホンが実際には発言者に最も近いものではない場合がある。その場合、収音装置190は、各音源からの音を明瞭に収音することができない。
そこで、本発明は、上記課題を解決するためになされたものであって、マイクロホンの設置の自由度を高めるとともに、マイクロホンの現在位置の情報を用いずに、音源からの音を明瞭にステレオ収音することができる収音装置及び収音方法を提供することを目的とする。
上記目的を達成するために、本発明の一態様に係る収音装置は、指向性の主軸方向が互いに異なるように配置された4以上の収音ユニットを備え、スピーカから出力された音を収音可能な位置に設置されるマイクロホンと、前記4以上の収音ユニットの出力信号ごとに、前記スピーカから出力された音の信号レベルを算出するレベル算出部と、前記レベル算出部によって算出された信号レベルを用いて、前記4以上の収音ユニットの指向性の主軸方向に適応するミキシング係数を算出するミキシング係数算出部と、前記ミキシング係数算出部によって算出されたミキシング係数を用いて、前記4以上の収音ユニットの出力信号を合成することにより、ステレオ信号を生成する信号合成部とを備える。
この構成によれば、スピーカから出力された音の信号レベルを用いて、指向性の主軸方向に適応するミキシング係数を算出できる。したがって、マイクロホンの位置を測定することなく、音源からの音を明瞭にステレオ収音することが可能となる。また、マイクロホンは、互いに指向性の主軸方向が異なる4以上の収音ユニットを備える。したがって、マイクロホンが設置された向きに関わらず、マイクロホンの周囲に位置する音源からの音を明瞭にステレオ収音することができるので、マイクロホンの設置の自由度を高めることが可能となる。
また、前記4以上の収音ユニットは、指向性の主軸方向が90度ごと異なるように配置された4つの収音ユニットであることが好ましい。
この構成により、マイクロホンの設置方向によらず、マイクロホンの周囲に位置する音源からの音をさらに明瞭にステレオ収音することが可能となる。
また、前記ミキシング係数算出部は、前記ステレオ信号が、互いに180度異なる2つの収音方向でステレオ収音された信号となるように、前記ミキシング係数を算出することが好ましい。
この構成により、セパレーションが高いステレオ収音を実現することができ、各音源からの音を明瞭に収音することが可能となる。
また、前記ミキシング係数は、前記ステレオ信号の一方を生成するための第1のミキシング係数と、前記ステレオ信号の他方を生成するための第2のミキシング係数とからなり、前記ミキシング係数算出部は、前記4つの収音ユニットのそれぞれにおいて、当該収音ユニットの一方の隣に位置する収音ユニットの信号レベルを用いて第1のミキシング係数を算出し、当該収音ユニットの他方の隣に位置する収音ユニットの信号レベルを用いて第2のミキシング係数を算出し、前記信号合成部は、前記4つの収音ユニットの出力信号に前記第1のミキシング係数のそれぞれを乗じて加算することにより前記ステレオ信号の一方を生成し、前記4つの収音ユニットの出力信号に前記第2のミキシング係数のそれぞれを乗じて加算することにより前記ステレオ信号の他方を生成することが好ましい。
この構成によれば、各収音ユニットのミキシング係数を、隣に位置する収音ユニットの信号レベルを用いて算出することができる。したがって、マイクロホンの設置角度を厳密に計算する場合などに比べて、比較的容易にミキシング係数を算出することができ、ミキシング係数を算出するための計算負荷を軽減することができる。
また、さらに、前記スピーカから音を出力させるためのスピーカ信号の有無を判定するスピーカ信号検出部を備え、前記レベル算出部は、前記スピーカ信号検出部によってスピーカ信号が有ると判定された場合に前記信号レベルを算出することが好ましい。
この構成によれば、スピーカ信号が有ると判定されたときに出力された信号から信号レベルを算出することができる。したがって、ミキシング係数を算出するためだけにスピーカから音を出力させる必要がないので、例えば、テレビ会議システムなどにおいて、スピーカから出力される話者の音声などを利用してミキシング係数を算出することも可能となる。
また、さらに、前記マイクロホンが動いたか否かを判定する移動判定部を備え、前記ミキシング係数算出部は、前記マイクロホンが動いたと判定された場合に、前記マイクロホンが動いていないと判定される場合よりも、前記ミキシング係数を算出する頻度を高くすることが好ましい。
この構成によれば、マイクロホンが動いた場合には、ミキシング係数が比較的速く更新され、マイクロホンが動いていない場合には、ミキシング係数が比較的遅く更新される。したがって、マイクロホンの動きに対するミキシング係数の追従性を向上させるとともに、ミキシング係数の安定性も向上させることができる。したがって、マイクロホンの周囲に位置する音源からの音をさらに明瞭にステレオ収音することが可能となる。
また、前記移動判定部は、前記ミキシング係数算出部によって算出されたミキシング係数の変化度合いに基づいて、前記マイクロホンが動いたか否かを判定することが好ましい。
この構成により、マイクロホンに移動センサなどを設置する必要がないので、マイクロホンが動いたか否かを簡易な構成で判定することができる。
また、さらに、前記スピーカから音を出力させるためのスピーカ信号から音像定位位置を判定する定位判定部を備え、前記ミキシング係数算出部は、前記定位判定部によって判定された音像定位位置ごとに前記ミキシング係数を算出し、前記信号合成部は、前記ミキシング係数算出部によって算出された前記音像定位位置ごとのミキシング係数の平均値を用いて、前記4以上の収音ユニットの出力信号を合成することが好ましい。
この構成により、スピーカから出力される音の音像定位位置が変わることにより、ミキシング係数が変動することを抑制でき、安定してステレオ収音することが可能となる。
また、前記定位判定部は、それぞれが音像定位位置と前記スピーカとの相対的な位置関係を示す左定位、右定位、及び中央定位のいずれかを前記音像定位位置として判定し、前記レベル算出部は、前記定位判定部によって左定位と判定された場合に、前記信号レベルを算出するLchレベル算出部と、前記定位判定部によって右定位と判定された場合に、前記信号レベルを算出するRchレベル算出部と、前記定位判定部によって中央定位と判定された場合に、前記信号レベルを算出するCchレベル算出部とを備えることが好ましい。
この構成により、左、右、及び中央の3種類の音像定位位置ごとにミキシング係数を算出することが可能となる。
また、さらに、前記マイクロホンが動いたか否かを判定する移動判定部を備え、前記ミキシング係数算出部は、前記マイクロホンが動いたと判定された場合、前記マイクロホンが動いたと判定された後に信号レベルが算出された音像定位位置の信号レベルを用いて、前記マイクロホンが動いたと判定された後に信号レベルが算出されていない音像定位位置のミキシング係数を算出することが好ましい。
この構成により、マイクロホンが動いた後に信号レベルがまだ更新されていない音像定位位置がある場合でも、マイクロホンが動いた後におけるミキシング係数を高精度に算出することができる。
また、さらに、前記4以上の収音ユニットの出力信号のそれぞれから、所定の周波数帯域の信号を抽出する帯域抽出部を備え、前記レベル算出部は、前記帯域抽出部によって抽出された信号を用いて、前記信号レベルを算出することが好ましい。
この構成により、ミキシング係数を算出する際に、ミキシング係数を算出するために必要な音以外の音(例えば騒音)の影響を抑制することができ、ミキシング係数を高精度に算出することができる。
また、前記所定の周波数帯域は、音声帯域であることが好ましい。
この構成により、例えば、スピーカから出力される話者の音声を利用してミキシング係数を算出する際に、高精度にミキシング係数を算出することができる。
また、本発明の一態様に係る収音方法は、指向性の主軸方向が互いに異なるように配置された4以上の収音ユニットを備え、スピーカから出力された音を収音可能な位置に設置されるマイクロホンを用いて、ステレオ信号を生成する収音方法であって、前記4以上の収音ユニットの出力信号ごとに、前記スピーカから出力された音の信号レベルを算出するレベル算出ステップと、算出された信号レベルを用いて、前記4以上の収音ユニットの指向性の主軸方向に適応するミキシング係数を算出するミキシング係数算出ステップと、算出されたミキシング係数を用いて、前記4以上の収音ユニットの出力信号を合成することにより、ステレオ信号を生成する信号合成ステップとを含む。
これにより、上記収音装置と同様の効果を奏することができる。
また、本発明の一態様に係る集積回路は、指向性の主軸方向が互いに異なるように配置された4以上の収音ユニットを備え、スピーカから出力された音を収音可能な位置に設置されるマイクロホンを用いて、ステレオ信号を生成する集積回路であって、前記4以上の収音ユニットの出力信号ごとに、前記スピーカから出力された音の信号レベルを算出するレベル算出部と、前記レベル算出部によって算出された信号レベルを用いて、前記4以上の収音ユニットの指向性の主軸方向に適応するミキシング係数を算出するミキシング係数算出部と、前記ミキシング係数算出部によって算出されたミキシング係数を用いて、前記4以上の収音ユニットの出力信号を合成することにより、ステレオ信号を生成する信号合成部とを備える。
これにより、上記収音装置と同様の効果を奏することができる。
また、本発明は、上記収音方法に含まれる各ステップをコンピュータに実行させるためのプログラムとして実現することができる。そして、そのようなプログラムは、CD−ROM(Compact Disc Read Only Memory)等の記録媒体あるいはインターネット等の伝送媒体を介して配信することができるのは言うまでもない。
本発明によれば、スピーカから出力された信号レベルを用いて、指向性の主軸方向に適応するミキシング係数を算出できる。したがって、スピーカの位置を測定することなく、音源からの音を明瞭にステレオ収音することが可能となる。また、マイクロホンは、互いに指向性の主軸方向が異なる4以上の収音ユニットを備える。したがって、マイクロホンが設置された向きに関わらず、マイクロホンの周囲に位置する音源からの音を明瞭にステレオ収音することができるので、マイクロホンの設置の自由度を高めることが可能となる。
図1は、本発明の実施の形態1に係る収音システムの外観図である。 図2は、本発明の実施の形態1に係る収音システムの外観図である。 図3は、本発明の実施の形態1に係るテレビ会議システムの構成を示す図である。 図4は、本発明の実施の形態1に係る収音装置によって形成されるLch収音ポーラパターンとRch収音ポーラパターンとを示す図である。 図5は、本発明の実施の形態1に係る収音装置の動作を示すフローチャートである。 図6は、本発明の実施の形態2に係る収音装置の機能構成を示すブロック図である。 図7は、本発明の実施の形態3に係る収音装置の機能構成を示すブロック図である。 図8は、本発明の実施の形態3に係る移動判定部の詳細な機能構成を示すブロック図である。 図9Aは、本発明の実施の形態4に係る収音装置の機能構成を示すブロック図である。 図9Bは、本発明の実施の形態4の変形例に係る収音装置の機能構成を示すブロック図である。 図10は、本発明の実施の形態5に係る収音装置の機能構成を示すブロック図である。 図11は、本発明の実施の形態5に係る補正部の詳細な機能構成を示すブロック図である。 図12は、本発明の実施の形態5に係る選択制御部の動作を示すフローチャートである。 図13は、本発明の実施の形態5の変形例に係る収音装置の機能構成を示すブロック図である。 図14Aは、本発明の実施の形態の変形例に係るマイクロホンの構成を示す図である。 図14Bは、本発明の実施の形態の変形例に係るマイクロホンの構成を示す図である。 図14Cは、本発明の実施の形態の変形例に係るマイクロホンの構成を示す図である。 図14Dは、本発明の実施の形態の変形例に係るマイクロホンの構成を示す図である。 図15は、本発明の実施の形態の変形例に係る収音装置の機能構成を示すブロック図である。 図16は、従来の収音システムの外観図である。 図17は、従来のテレビ会議システムの構成を示す図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
図1〜図3を参照して、本発明の実施の形態1に係る収音装置について説明する。
図1及び図2は、本発明の実施の形態1に係る収音システムの外観図である。なお、図2は、収音ユニットの設置向きが図1と比べ、右へ45度回転して設置されている点が図1と異なるだけであり、それ以外は同じである。また、図3は、本発明の実施の形態1に係るテレビ会議システムの構成を示す図である。
なお、本実施の形態では、ステレオ信号として、Rチャンネル信号とLチャンネル信号とが生成されるとし、通信相手拠点においてステレオ再生が実現されるとする。また、図面において、収音ユニットは、円と線分とで表現され、円の中心から円と線分との接点へ向かう方向が当該収音ユニットの指向性の主軸方向と示す。
テレビ会議システムは、自拠点に設置される第1の収音システム100と、自拠点とは物理的に離れている通信相手拠点に設置される。テレビ会議システムは、第1の収音システム100とインターネット等の通信網107を介して接続されている第2の収音システム200とを備える。
図1及び図2に示すように、第1の収音システム100は、収音装置101と、モニター104と、カメラ105と、第1のスピーカ106aと、第2のスピーカ106bとを備える。ここでは、第2の収音システム200は、第1の収音システム100と同様であることとして、外観図を省略する。なお、第2の収音システム200は、第1の収音システム100と同様のシステムに限らず、図16に示した従来のシステム(第2の収音システム2000)と同様であってもよい。
収音装置101は、音源(例えば、話者102aまたは102b)からの音をステレオ収音する。収音装置101は、第1〜第4の収音ユニット110a〜110dを備えるマイクロホン110を備える。本実施の形態では、マイクロホン110は、話者102a、102bの前方に設置されたテーブル103上に載置されている。なお、マイクロホン110は、必ずしもテーブル103上に載置される必要はなく、第1及び第2のスピーカ106a、106bから出力された音を収音可能な位置に設置されればよい。
モニター104は、話者102a、102bの前方に設置される。モニター104は、第2の収音システム200で撮影された映像を、通信網107を介して受信して表示する。
カメラ105は、モニター104の上部に設置され、話者102a、102bを撮影する。カメラ105によって生成された映像信号は、通信網107を介して、第2の収音システム200に送信される。
第1のスピーカ106aは、モニター104から見て右側(話者102a、102bから見て左側)に配置される。第1のスピーカ106aは、第2の収音システム200から通信網107を介して入力されたLチャンネル信号を再生する。
第2のスピーカ106bは、モニター104から見て左側(話者102a、102bから見て右側)に配置される。第2のスピーカ106bは、第2の収音システム200から通信網107を介して入力されたRチャンネル信号を再生する。
次に、マイクロホン110が4以上の収音ユニットを備える理由について説明する。
テレビ会議システムでは、マイクロホン110は、テーブル103の中央に置かれることが多いので、360度全方向の音を収音する必要がある。例えば、1次傾度の単一指向性の収音ユニットを2個用いて収音する場合、左右のセパレーションを得つつ、360度全方向の音を収音するために、2個の収音ユニットは、指向性の主軸方向が互いに180度異なる方向となるように設置される。
また、テレビ会議システム等では、ステレオ収音を行う場合、映像と音の方向(音像)とが一致することにより、音の明瞭度を高めるとともに臨場感を高めることができる。ただ、マイクロホンの設置が利用者に任されている場合、利用者がマイクロホンの指向性の方向まで注意を払ってマイクロホンを設置することは難しい。したがって、利用者が注意を払わない場合にも、マイクロホンの向きによらず映像と音像とが一致するようにステレオ収音されることが望ましい。
しかしながら、前述したように収音ユニットが2個の場合、各収音ユニットの指向性の主軸方向は互いに180度異なる方向となる。このため、左右の収音方向(強調されて収音される音の方向)は、マイクロホンが設置されると固定されてしまうので、左右のセパレーションは、マイクロホンが設置される向きに依存してしまう。
収音ユニットが3個の場合、隣り合う各収音ユニットの指向性の主軸方向は、互いに120度異なる方向となる。そのため、例えば、2つの収音ユニットが前方の左右の音を収音した場合、1個の収音ユニットしか後方の音を収音できない。その結果、後方の音を左右に分離することができない。すなわち、3個の収音ユニットの出力信号を合成しても、任意の方向に対して、セパレーションが高いステレオ収音を実現することが難しい。
そこで、本実施の形態において、マイクロホン110は、指向性の主軸方向が互いに異なる4個以上の収音ユニットを備える。これにより、収音装置101は、360度全方向の収音が可能となり、かつ、左右のセパレーションを確保できるステレオ収音が可能となる。
具体的には、第1〜第4の収音ユニット110a〜110dは、指向性の主軸方向が90度ごと異なるように配置される。より具体的には、第1〜第4の収音ユニット110a〜110dは、円周上に90度ごと異なる位置に並べられ、かつ、各収音ユニットの指向性の主軸方向が、円の中心から外側へ向いて90度ごと異なるように配置されている。
なお、第1〜第4の収音ユニット110a〜110dの指向性の主軸方向は、厳密に90度ごと異なる必要はなく、実質的に90度ごと異なればよい。つまり、第1〜第4の収音ユニット110a〜110dは、指向性の主軸方向が、90度と同視できる程度の角度ごと異なるように配置されればよい。
図4は、本発明の実施の形態1に係る収音装置101によって形成されるLchポーラパターンとRchポーラパターンとを示す図である。つまり、図4は、収音ユニットが4個の場合における指向性合成パターンの一例を示す図である。
本実施の形態に係るマイクロホン110は、指向性の主軸方向が互いに180度異なる収音ユニットのペアを2つ備える。このため、収音装置101は、図4に示すように、各収音ユニットの出力信号(以下、「ユニット信号」ともいう)を合成することにより、任意の方向に対して、指向性の主軸方向が互いに180度異なるように収音することが可能である。
第1〜第4の収音ユニット110a〜110dの各ユニット信号x1(t)〜x4(t)は、レベル算出部112へ出力される。なお、tは時間のサンプルを示す。
なお、本実施の形態では、各収音ユニットは、単一の指向性を有するマイクロホンユニットであるが、必ずしもこのような収音ユニットである必要はない。例えば、各収音ユニットは、単一の指向性が形成されるように設置された複数の無指向性のマイクロホンユニットによって構成されてもよい。
次に、図3を用いて、収音装置101の機能構成について説明する。
図3に示すように、第1の収音システム100は、収音装置101と、モニター104と、カメラ105と、第1のスピーカ106aと、第2のスピーカ106bとを備える。また、第2の収音システム200は、収音装置201と、モニター204と、カメラ205と、第1のスピーカ206aと、第2のスピーカ206bとを備える。
収音装置101は、マイクロホン110と、レベル算出部112と、ミキシング比算出部113と、信号合成部115と、スピーカ信号検出部116とを備える。なお、収音装置201の内部構成は、収音装置101と同様であるので、図示及び説明を省略する。
スピーカ信号検出部116は、通信網107を介して、第2の収音システム200より伝送されてきた受話信号であるステレオ信号を入力として受け付け、その受話信号の有無判定結果であるフラグ信号flgをレベル算出部112へ出力する。ここでは、受話信号が、スピーカから音を出力させるためのスピーカ信号に相当する。つまり、スピーカ信号検出部116は、スピーカ信号の有無を判定する。
レベル算出部112は、第1〜第4の収音ユニット110a〜110dの出力信号ごとに、第1及び第2のスピーカ206a、206bから出力された音の信号レベルを算出する。
具体的には、レベル算出部112は、各ユニット信号x1(t)〜x4(t)と受話信号の有無判定結果であるフラグ信号flgとを入力として受け付け、各ユニット信号x1(t)〜x4(t)のパワーレベルである信号パワーPx1(t)〜Px4(t)を信号レベルとして算出する。
以下、特に断りがない限り、レベル算出部112が算出する信号パワーは、時間平均パワーであるとする。また、時間平均パワーを算出するために設定される、収音した信号のレベルを平均するための時間区間は、短時間であるとする。
ここで、フラグ信号flgは、信号パワーが算出される際の制御信号として用いられる。つまり、レベル算出部112は、受話信号が有ると判定された場合(flg=1)にのみ、信号パワーPx1(t)〜Px4(t)を算出する。つまり、レベル算出部112は、スピーカ信号検出部116によってスピーカ信号が有ると判定された場合に信号レベルを算出する。
レベル算出部112は、算出した信号パワーPx1(t)〜Px4(t)をミキシング比算出部113へ出力するとともに、当該信号パワーを保持する。なお、受話信号が無いと判定された場合(flg=0)は、レベル算出部112は、前回算出された信号パワー(保持されている最新の信号パワー)をミキシング比算出部113へ出力する。
ミキシング比算出部113は、ミキシング係数算出部に相当する。ミキシング比算出部113は、レベル算出部112によって算出された信号レベルを用いて、第1〜第4の収音ユニット110a〜110dの指向性の主軸方向に適応するミキシング係数を算出する。本実施の形態では、ミキシング比算出部113は、ステレオ信号が、互いに180度異なる2つの収音方向でステレオ収音された信号となるように、ミキシング係数を算出する。
具体的には、ミキシング比算出部113は、信号パワーPx1(t)〜Px4(t)を入力として受け付け、Lch再生用のLchミキシング係数A11(t)、A12(t)、A13(t)、A14(t)と、Rch再生用のRchミキシング係数A21(t)、A22(t)、A23(t)、A24(t)とを算出する。
つまり、ミキシング比算出部113は、第1〜第4の収音ユニット110a〜110dのそれぞれにおいて、当該収音ユニットの一方の隣に位置する収音ユニットの信号レベルを用いてLchミキシング係数を算出し、当該収音ユニットの他方の隣に位置する収音ユニットの信号レベルを用いてRchミキシング係数を算出する。ここで、Lchミキシング係数及びRchミキシング係数が、第1のミキシング係数及び第2のミキシング係数に相当する。なお、ミキシング係数の詳細については後述する。
信号合成部115は、ミキシング係数を用いて、第1〜第4の収音ユニット110a〜110dの出力信号を合成することにより、ステレオ信号を生成する。
具体的には、信号合成部115は、Lchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)と、収音ユニットx1(t)〜x4(t)とを入力として受け付ける。そして、信号合成部115は、式(1)に従って、Rチャンネル信号である出力信号y1(t)と、Lチャンネル信号である出力信号y2(t)とを算出する。
つまり、信号合成部115は、第1〜第4の収音ユニット110a〜110dの出力信号にLchミキシング係数のそれぞれを乗じて加算することにより、ステレオ信号の一方であるLチャンネル信号を生成する。また、信号合成部115は、第1〜第4の収音ユニット110a〜110dの出力信号にRchミキシング係数のそれぞれを乗じて加算することにより、ステレオ信号の他方であるLチャンネル信号を生成する。
そして、信号合成部115は、通信網107を介して、算出した出力信号y1(t)を第2の収音システム200が備える第1のスピーカ206aへ送信し、算出した出力信号y2(t)を第2の収音システム200が備える第2のスピーカ206bへ送信する。
Figure 2011010426
次に、以上のように構成された収音装置101における各種動作について説明する。
図5は、実施の形態1に係る収音装置101の動作を示すフローチャートである。
まず、スピーカ信号検出部116は、通信網107を介して、第2の収音システム200より伝送されてきた受話信号であるステレオ信号の有無を判定する(S101)。ここで、ステレオ信号が有ると判定された場合(S101のYes)、レベル算出部112は、各収音ユニットの出力信号ごとに、出力信号の信号パワーを信号レベルとして算出し、保持する(S102)。一方、ステレオ信号が無いと判定された場合(S101のNo)、レベル算出部112は、前回算出された各信号パワーを取得する(S103)。
そして、ミキシング比算出部113は、ステップS102において算出された各信号パワー、またはステップS103において取得された各信号パワーを用いて、Lchミキシング係数とRchミキシング係数とを算出する(S104)。続いて、信号合成部115は、算出されたLchミキシング係数及びRchミキシング係数を用いて、各収音ユニットからの出力信号を合成することにより、ステレオ信号を送話信号として生成し(S105)、ステップS101の処理に戻る。
以上のように収音装置101は、ステップS101〜S105までの処理を繰り返す。
次に、ミキシング係数を算出する処理(S104)及びステレオ信号を生成する処理(S105)について、さらに詳細に説明する。
マイクロホン110は、話者102a、102bによって位置あるいは向きが自由に変更され得る。したがって、第1〜第4の収音ユニット110a〜110dに対して固定的にミキシング係数を設定して、Rチャンネル信号及びLチャンネル信号を生成することはできない。
そこで、本実施の形態では、収音装置101は、第1及び第2のスピーカ106a、106bから再生される通信相手側の音声信号を用いて、各収音ユニットの指向性の主軸方向に適応するミキシング係数を算出する。
図1において、第1及び第2のスピーカ106a、106bから同じ音声が再生されていると仮定すると、第1及び第2のスピーカ106a、106bの中間地点に仮想的に音源があるとみなすことができる。そこで、第1及び第2のスピーカ106a、106bを1つの仮想音源とみなし、その仮想音源の出力信号を音声信号V(t)と表す。
仮想音源の音声信号V(t)は音響空間を経て、第1〜第4の収音ユニット110a〜110dに到達する。このとき、第1〜第4の収音ユニット110a〜110dそれぞれの指向性の主軸方向に依存するゲインを第1〜第4のゲインD1〜D4と表す。なお、ここでは簡単のため音響空間による音声信号の減衰はないと仮定する。
このとき、第1〜第4の収音ユニット110a〜110dが単一指向性のマイクロホンユニットであることを考慮すれば、図1に示すマイクロホン110の配置において、第1〜第4のゲインD1〜D4は、以下のようになる。
すなわち、第1の収音ユニット110aの指向性の主軸方向は、マイクロホン110から仮想音源に向かう方向に対して角度が0度となっているので、第1のゲインD1は「1」とみなすことができる。また、第2及び第3の収音ユニット110b、110cは、指向性の主軸方向がマイクロホン110から仮想音源に向かう方向に対して90度傾いていることから、第2及び第3のゲインD2、D3は、「0.5」とみなすことができる。また、第4の収音ユニット110dの指向性の主軸方向は、マイクロホン110から仮想音源に向かう方向に対して180度傾いていることから、第4のゲインD4は、「0」とみなすことができる。
このように得られる第1〜第4のゲインD1〜D4をミキシング係数として第1〜第4の収音ユニット110a〜110dの出力信号x1(t)〜x4(t)に乗じて加算した信号は、仮想音源の方向に指向性の主軸方向を向けた収音信号となる。
同様に、マイクロホン110を右へ45度回転させた図2の場合は、第1及び第2の収音ユニット110a、110bの指向性の主軸方向は、マイクロホン110から仮想音源に向かう方向に対して45度傾いているので、第1及び第2のゲインD1、D2は、「0.7」とみなすことができる。また、第3及び第4の収音ユニット110c、110dの指向性の主軸方向は、マイクロホン110から仮想音源に向かう方向に対して135度傾いているので、第3及び第4のゲインD3、D4は、「0.2」とみなすことができる。
このように得られる第1〜第4のゲインD1〜D4をミキシング係数として第1〜第4の収音ユニット110a〜110dの出力信号x1(t)〜x4(t)に乗じて加算した信号は、仮想音源の方向に指向性の主軸方向を向けた収音信号となる。
以上のように、第1〜第4の収音ユニット110a〜110dの指向性の主軸方向に依存する第1〜第4のゲインD1〜D4は、マイクロホン110の配置に従って、一意に決定することができる。そして、そのように決定される第1〜第4のゲインD1〜D4をミキシング係数として、第1〜第4の収音ユニット110a〜110dの出力信号x1(t)〜x4(t)のそれぞれに乗じて加算することで、仮想音源の方向に指向性の主軸方向を向けた収音信号を生成することができる。
このことから、第1〜第4のゲインD1〜D4を、右隣の収音ユニットの出力信号の係数として用いれば、仮想音源に対して右に90度傾いた方向に指向性の主軸方向を向けた収音信号を生成することができる。また逆に、第1〜第4のゲインD1〜D4を、左隣の収音ユニットの出力信号のミキシング係数として用いれば、仮想音源に対して左に90度傾いた方向に指向性の主軸方向を向けた収音信号を生成することができる。
これを利用すると、音源に対し左右に分離した音を収音可能となる。つまり、第1〜第4のゲインD1〜D4に基づいて、Lchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)を算出することが可能となる。具体的には、Lchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)は、第1〜第4のゲインD1〜D4を用いて式(2)のように表すことができる。
Figure 2011010426
しかし、マイクロホン110はどのように設置されているか分からないため、第1〜第4のゲインD1〜D4を直接求めることはできない。そこで、ミキシング比算出部113は、第1〜第4の収音ユニット110a〜110dの信号パワーPx1(t)〜Px4(t)を利用して、ミキシング係数を算出する。
第1及び第2のスピーカ106a、106bの音声信号V(t)の信号パワーをPv(t)とすると、第1〜第4の収音ユニット110a〜110dの信号パワーPx1(t)〜Px4(t)は式(3)のように表すことができる。
Figure 2011010426
式(3)を第1〜第4のゲインD1〜D4について変形すると、式(4)となる。
Figure 2011010426
ここで、全収音ユニットの信号パワーの総和をPx(t)(=Px1(t)+Px2(t)+Px3(t)+Px4(t))と表す。Px(t)は、指向性の主軸方向が180度異なる2つの単一指向性マイクロホンの信号パワーの組み合わせを2つ加算したもの(Px(t)={Px1(t)+Px4(t)}+{Px2(t)+Px3(t)})とみなせる。
単一指向性マイクロホンの指向特性は、(1+cosθ)/2で表される。したがって、指向性の主軸方向が180度異なる2つの単一指向性マイクロホンを組み合わせたときの指向特性は、(1+cosθ)/2+(1+cos(θ+180°))/2=1となり、無指向となる。
つまり、Px(t)は、2個の無指向性マイクロホンの信号パワーを加算したものとみなせる。したがって、スピーカより音声が拡声されており、スピーカ拡声音以外がないときは、式(5)に示すようにPv(t)=Px(t)/2とみなせる。
Figure 2011010426
式(2)及び式(5)より、ミキシング比算出部113は、収音ユニットの信号パワーPx1(t)〜Px4(t)を用いて、式(6)のようにLchミキシング係数A11(t)及びRchミキシング係数A21(t)〜A24(t)を算出する。つまり、ミキシング比算出部113は、信号レベルを用いて、各収音ユニットの指向性の主軸方向に適応するミキシング係数を算出する。
Figure 2011010426
図4は、このようにして、Lchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)を用いてステレオ信号を生成した場合に形成される指向性のポーラパターンを示す。
なお、式(4)において、第1〜第4の収音ユニット110a〜110dの信号パワーPx1(t)〜Px4(t)を合計値Px(t)で正規化したが、信号パワーPx1(t)〜Px4(t)の最大値を用いて正規化した値で近似してもよい。つまり、ミキシング比算出部113は、信号レベルを用いて、各収音ユニットの指向性の主軸方向に適応するミキシング係数を算出すればよい。
以上のように、本実施の形態に係る収音装置101によれば、スピーカから出力された音の信号レベルを用いて、指向性の主軸方向に適応したミキシング係数を算出できる。したがって、マイクロホン110の位置を測定することなく、音源からの音を明瞭にステレオ収音することが可能となる。
また、マイクロホン110は、指向性の主軸方向が90度ごと異なるように配置された第1〜第4の収音ユニット110a〜110dを備える。したがって、収音装置101は、マイクロホン110が設置された向きに関わらず、マイクロホンの周囲に位置する音源からの音を明瞭にステレオ収音することができる。すなわち、話者等は、マイクロホン110を自由に設置することが可能となる。
(実施の形態2)
次に、図6を参照して、本発明の実施の形態2に係る収音装置について説明する。
図6は、本発明の実施の形態2に係る収音装置101の機能構成を示すブロック図である。図6に示す収音装置101は、図3に示す実施の形態1に係る収音装置101に入れ代わるように配置される。
また、本実施の形態に係る収音装置101は、図3に示す実施の形態1に係る収音装置101に対して、帯域抽出部111が新たに追加される点のみが異なる。以下、実施の形態1と異なる点を中心に説明する。
帯域抽出部111は、第1〜第4の収音ユニット110a〜110dの出力信号から、所定の周波数帯域の信号のみを抽出して、レベル算出部112へ出力する。
ここで、所定の周波数帯域は、例えば、話者102a、102bの音声帯域(300Hz〜7kHz)である。より好ましくは、所定の周波数帯域は、音声帯域のうち、比較的室内騒音の影響が小さい帯域(例えば、1kHz〜4kHz)である。これにより、収音装置101は、スピーカから出力される話者の音声を利用してミキシング係数を算出する際に、スピーカから出力される音以外の音などの騒音の影響を抑制することができる。つまり、収音装置101は、ミキシング係数を高精度に算出することができる。
また、所定の周波数帯域は、例えば、第1〜第4の収音ユニット110a〜110dそれぞれが有する指向特性(指向性の周波数特性)を考慮して求められる帯域であってもよい。具体的には、所定の周波数帯域は、すべての収音ユニットに対して、指向性が安定して得られる帯域であってもよい。
このような所定の周波数帯域の信号を抽出することにより、ミキシング比算出部113に入力される信号レベルに対する、話者102a、102bの音声以外の騒音の影響を減少させることができる。
以上のように、本実施の形態によれば、ミキシング比算出部113に入力される収音ユニット信号に含まれる、話者102a、102bの音声以外の騒音を減少させることができる。これにより、ミキシング比算出部113が算出するミキシング係数の精度が向上し、より明瞭な音を再生することができるステレオ信号を生成することができる。
(実施の形態3)
次に、図7、図8を参照して、本発明の実施の形態3に係る収音装置について説明する。
図7は、本発明の実施の形態3に係る収音装置101の機能構成を示すブロック図である。図7に示す収音装置101は、図3または図6に示す実施の形態1または2に係る収音装置101と入れ代わるように配置される。
また、本実施の形態に係る収音装置101は、図6に示す実施の形態2に係る収音装置101に対して、更新部117及び移動判定部114が新たに追加される点のみが異なる。以下、実施の形態1または2と異なる点を中心に説明する。
マイクロホン110は、話者102a、102bによって容易に回転されたりあるいは移動されたりする。マイクロホン110が回転されたり移動されたりした場合に、マイクロホン110が回転あるいは移動される前に算出されたミキシング係数を用いてステレオ信号が生成されれば、映像と音像とが一致しなくなる。このため、移動後は再度ミキシング係数を算出し直す必要がある。
また、ミキシング係数が正しく算出されており、マイクロホン110が回転されたり移動されたりしていない場合は、音像が変動しないように、すでに算出されたミキシング係数を更新させない、または更新速度を遅くするなどの制限を加えることが好ましい。
そこで、本実施の形態では、移動判定部114は、マイクロホンが動いたか否かを判定する。具体的には、移動判定部114は、ミキシング比算出部113によって算出されたミキシング係数の変化度合いに基づいて、マイクロホン110が動いたか否かを判定する。
そして、更新部117は、Lchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)を時間方向に平均化することにより、Lch平滑化ミキシング係数B11(t)〜B14(t)及びRch平滑化ミキシングB21(t)〜B24(t)を出力する。
さらに、更新部117は、移動判定部114の判定結果に基づいて、Lch平滑化ミキシング係数B11(t)〜B14(t)及びRch平滑化ミキシング係数B21(t)〜B24(t)を算出する頻度を調整する。つまり、更新部117は、マイクロホン110が動いたと判定された場合に、マイクロホン110が動いていないと判定される場合よりも、平滑化ミキシング係数を算出する頻度を高くする。
その結果、収音装置101は、マイクロホン110の動きに対するミキシング係数の追従性を向上させるとともに、ミキシング係数の安定性も向上させることができる。
次に、図8を用いて、移動判定部114の詳細について説明する。
図8は、本発明の実施の形態3に係る移動判定部114の詳細な機能構成を示すブロック図である。図8に示すように、移動判定部114は、変動量検出部123と変動量判定部124とを備える。
変動量検出部123は、ミキシング比算出部113が算出したLchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)と、更新部117が算出したLch平滑化ミキシング係数B11(t)〜B14(t)及びRch平滑化ミキシング係数B21(t)〜B24(t)とを入力として受け付け、式(7)のようにして、ミキシング係数の変化度合いを示す変動量を検出する。
Figure 2011010426
ここで、Bt−1、Atは式(8)で表現される。
Figure 2011010426
マイクロホン110の動きが無い間、ミキシング係数Atと平滑化ミキシング係数Bt−1はほぼ同じ値となるため、変動量mic_varの値は小さくなる。これに対し、マイクロホン110が動いた場合は、ミキシング係数Atの値がまず変化する。このため、ミキシング係数Atと平滑化ミキシング係数Bt−1との差が大きくなる。よって、変動量mic_varの値は大きくなる。
そこで、変動量判定部124は、変動量mic_varの値を監視する。そして、変動量mic_varが閾値を超えた場合、変動量判定部124は、マイクロホン110が動いたと判定し、move_flg=1と設定する。一方、変動量mic_varが閾値を超えない場合、変動量判定部124は、マイクロホン110が動いていないと判定し、move_flg=0と設定する。
このように設定されたmove_flgの値に従って、更新部117は、平滑化ミキシング係数を算出する頻度を調整する。
以上のように、本実施の形態に係る収音装置101によれば、マイクロホン110が動いた場合に、音像定位の追従性を向上させることができる。また、動いていない場合に、音像定位の安定性を確保することができる。言い換えると、本実施の形態に係る収音装置101によれば、マイクロホン110の動きに対するミキシング係数の追従性を向上させるとともに、ミキシング係数の安定性も向上させることができる。したがって、マイクロホン110の周囲に位置する音源からの音をさらに明瞭にステレオ収音することが可能となる。
また、移動判定部114は、ミキシング係数の変化度合いに基づいて、マイクロホン110が動いたか否かを判定することができ、移動センサなどを設置する必要がないので、マイクロホン110が動いたか否かを簡易な構成で判定することが可能となる。
なお、移動判定部114は、必ずしもミキシング係数の変化度合いに基づいて、マイクロホン110が動いたか否かを判定する必要はない。例えば、移動判定部114は、マイクロホン110に取り付けられたジャイロセンサなどの移動センサからのセンサ信号に基づいて、マイクロホン110が動いたか否かを判定してもよい。この場合、収音装置は、本実施の形態の収音装置101と比べて構成が複雑になるが、マイクロホン110の動きに対するミキシング係数の追従性を向上させるとともに、ミキシング係数の安定性を向上させることができる。
また、本実施の形態において、移動判定部114は、Lch及びRch両方のミキシング係数及び平滑化ミキシング係数を用いて、マイクロホン110が動いたか否かを判定しているが、どちらか一方のチャンネルのミキシング係数及び平滑化ミキシング係数を用いて、マイクロホン110が動いたか否かを判定してもよい。
また、LchとRchの形成する指向性の主軸方向が互いに180度異なる方向であることを考慮すれば、更新部117は、一方の平滑化ミキシング係数を用いて、他方の平滑化ミキシング係数を式(9)のように算出してもよい。
Figure 2011010426
また、本実施の形態において、収音装置101は、更新部117を備えていたが、必ずしも更新部117を備える必要はない。この場合、ミキシング比算出部113が、マイクロホン110が動いたと判定された場合に、マイクロホン110が動いていないと判定される場合よりも、ミキシング係数を算出する頻度を高くすればよい。これにより、収音装置101は、マイクロホン110の動きに対するミキシング係数の追従性を向上させるとともに、ミキシング係数の安定性も向上させることができる。
(実施の形態4)
次に、図9Aを参照して、本発明の実施の形態4に係る収音装置について説明する。
図9Aは、本発明の実施の形態4に係る収音装置101の機能構成を示すブロック図である。図9Aに示す収音装置101は、図3、図6または図7に示す実施の形態1、2または3に係る収音装置101に入れ代わるように配置される。
また、本実施の形態に係る収音装置101は、図6に示す実施の形態2に係る収音装置101に対して、定位判定部122が追加された点と、レベル算出部112がLchレベル算出部112a、Cchレベル算出部112b、Rchレベル算出部112cを備える点のみが異なる。以下、実施の形態1〜3と異なる点を中心に説明する。
第1及び第2のスピーカ106a、106bから再生される音声信号は、ステレオ信号である。このため、第1及び第2のスピーカ106a、106bから再生される音声信号にはレベル差が生じる。その結果、第1のスピーカ106aの再生音が第2のスピーカ106bの再生音より大きな場合(左へ音像定位している場合)と、第1のスピーカ106aの再生音と第2のスピーカ106bの再生音が同等の場合(中央へ音像定位している場合)と、第2のスピーカ106bの再生音が第1のスピーカ106aの再生音より大きな場合(右へ音像定位している場合)とでは、それぞれ音の音像定位位置が異なる。
そのため、第1〜第4の収音ユニット110a〜110dが固定されていたとしても、指向性の主軸方向に依存する第1〜第4のゲインD1〜D4が、音像定位位置によって変動してしまう。つまり、音像定位位置が変わるたびに、ミキシング比算出部113によって算出されるミキシング係数が変動し、安定しない。
そこで、本実施の形態では、収音装置101は、スピーカから出力される音の音像定位位置が変化した場合にも、安定してミキシング係数を算出することを実現する。以下、そのような収音装置101の各構成要素について説明する。
定位判定部122は、スピーカから音を出力させるためのスピーカ信号から音像定位位置を判定する。本実施の形態では、定位判定部122は、音像定位位置とスピーカとの相対的な位置関係を示す、左定位、右定位、及び中央定位のいずれかを音像定位位置として判定する。
具体的には、定位判定部122は、第1及び第2のスピーカ106a、106bから再生される音の音像定位位置が話者102a、102bから見て左側(第1及び第2のスピーカ106a、106bから見て右側)になる場合は、Lch定位(左定位)と判定し、dir_flg=0と設定する。また、定位判定部122は、音像定位位置が話者102a、102bから見て中央(第1及び第2のスピーカ106a、106bから見て中央)になる場合は、Cch定位(中央定位)と判定し、dir_flg=1と設定する。また、定位判定部122は、音像定位位置が話者102a、102bから見て右側((第1及び第2のスピーカ106a、106bから見て左側))になる場合は、Rch定位(右定位)と判定し、dir_flg=2と設定する。
より具体的には、定位判定部122は、例えば、スピーカ信号に含まれるLchスピーカ信号とRchスピーカ信号のうち、Lchスピーカ信号の信号レベルがRchスピーカ信号の信号レベルより閾値以上大きい場合、Lch定位と判定する。また例えば、定位判定部122は、Rchスピーカ信号の信号レベルがLchスピーカ信号の信号レベルより閾値以上大きい場合、Rch定位と判定する。また例えば、定位判定部122は、Rchスピーカ信号の信号レベルとLchスピーカ信号の信号レベルとの差が閾値未満である場合、Cch定位と判定する。
レベル算出部112は、この音の音像定位位置の判定結果dir_flgに応じて、信号レベルを算出する。すなわち、定位判定部122によって判定された音像定位位置に応じて、Lchレベル算出部112a、Cchレベル算出部112b、及びRchレベル算出部112cのいずれかが信号レベルを算出する。
具体的には、Lch定位と判定された場合は、Lchレベル算出部112aのみが信号パワーを更新する。Cch定位と判定された場合は、Cchレベル算出部112bのみが信号パワーを更新する。Rch定位と判定された場合は、Rchレベル算出部112cのみが信号パワーを更新する。
ミキシング比算出部113は、定位判定部122によって判定された音像定位位置ごとに、ミキシング係数を算出する。
具体的には、ミキシング比算出部113は、Lchレベル算出部112aが算出する各信号パワーに基づいて、式(6)を用いて、Lch定位におけるLchミキシング係数A11a(t)〜A14a(t)及びRchミキシング係数A21a(t)〜A24a(t)を算出する。同様に、ミキシング比算出部113は、Cchレベル算出部112bが算出する各信号パワーに基づいて、式(6)を用いて、Cch定位におけるLchミキシング係数A11b(t)〜A14b(t)及びRchミキシング係数A21b(t)〜A24b(t)を算出する。同様に、ミキシング比算出部113は、Rchレベル算出部112cが算出する各信号パワーに基づいて、式(6)を用いて、Rch定位におけるRchミキシング係数A11c(t)〜A14c(t)及びLchミキシング係数A21c(t)〜A24c(t)を算出する。
そして、ミキシング比算出部113は、式(10)に示すように、Lch定位、Cch定位、及びRch定位における、Lchミキシング係数の平均値とRchミキシング係数の平均値とを求めることにより、Lchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)を算出する。
つまり、信号合成部115は、音像定位位置ごとのミキシング係数の平均値を用いて、第1〜第4の収音ユニット110a〜110dの出力信号を合成する。
Figure 2011010426
なお、ミキシング比算出部113は、Lch及びRchの一方のミキシング係数を算出しておき、その結果を用いて他方のミキシング係数を式(2)の関係に基づいて算出してもよい。
以上のように、本実施の形態に係る収音装置101によれば、第1及び第2のスピーカ106a、106bの再生音の音像定位位置が変動することによってミキシング係数が変動することを抑制することができ、安定してステレオ収音することが可能となる。
なお、本実施の形態に係るレベル算出部112は、Lchレベル算出部112a、Cchレベル算出部112b、及びRchレベル算出部112cを備えていたが、必ずしもこれらを備える必要はない。例えば、図9Bに示すように、収音装置101は、実施の形態1などと同様のレベル算出部112を備えてもよい。その場合、ミキシング比算出部113は、定位判定部122の判定結果に基づいて、音像定位位置ごとにミキシング係数を算出すればよい。これにより、図9Bに示す収音装置101であっても、図9Aに示す収音装置101と同様の効果を奏することができる。
(実施の形態5)
次に、図10〜図12を参照して、本発明の実施の形態5に係る収音装置について説明する。
図10は、本発明の実施の形態5に係る収音装置101の機能構成を示すブロック図である。図10に示す収音装置101は、図3などに示す収音装置101に入れ代わるように配置される。
また、図10に示す収音装置101は、図9Aに示す実施の形態4に係る収音装置101に対して、更新部117、移動判定部114及び補正部121が新たに追加された点のみが異なる。なお、移動判定部114は、実施の形態3で説明したものと同様であるので、詳細な説明を省略する。以下、実施の形態1〜4と異なる点を中心に説明する。
Lchレベル算出部112a、Cchレベル算出部112b及びRchレベル算出部112cでは、定位判定部122の判定結果に応じて信号パワーを算出するか否かが決定される。このため、マイクロホン110が動いた場合、Lchレベル算出部112a、Cchレベル算出部112b及びRchレベル算出部112cのうち、いずれか1つまたは2つにおいて、信号パワーがしばらく算出されない可能性がある。その結果、式(10)における一部の係数は、しばらくの間、マイクロホン110が動く前に算出された係数となる可能性がある。
そのような状況において、ミキシング比算出部113が、式(10)に従ってミキシング係数を算出した場合、マイクロホン110が動く前の指向性と動いた後の指向性とが合成されることとなり、正しい指向性を形成することができない。
そこで、補正部121は、移動判定部114の判定結果と、定位判定部122の判定結果とに基づいて、信号パワーを補正する。具体的には、マイクロホン110が動いたと判定された場合、補正部121は、当該判定後に更新されていない信号パワーを補正する。なお、このとき、補正部121は、当該判定後にすでに更新された信号パワーを補正しない。
図11は、本発明の実施の形態5に係る補正部121の機能構成を示すブロック図である。図11に示すように、補正部121は、選択制御部125と、Lch補正選択部126a、Cch補正選択部126b及びRch補正選択部126cとを備える。
補正部121は、マイクロホン110が動いた後に、(1)Lchレベル算出部112aのみが信号パワーを算出した場合、(2)Cchレベル算出部112bのみが信号パワーを算出した場合、または(3)Rchレベル算出部112cのみが信号パワーを算出した場合に、以下のように信号パワーを補正する。
(1)Cch補正選択部126bは、Cchレベル算出部112bによってマイクロホン110が動く前に算出された信号パワーPx1b(t)〜Px4b(t)を、Lchレベル算出部112aによって算出された信号パワーPx1a(t)〜Px4a(t)に係数α1を乗算した値に補正する。
同様に、Rch補正選択部126cは、Rchレベル算出部112cによってマイクロホン110が動く前に算出された信号パワーPx1c(t)〜Px4c(t)を、Lchレベル算出部112aによって算出された信号パワーPx1a(t)〜Px4a(t)に係数α1を乗算した値に補正する。
(2)Lch補正選択部126aは、Lchレベル算出部112aによってマイクロホン110が動く前に算出された信号パワーPx1a(t)〜Px4a(t)を、Cchレベル算出部112bによって算出された信号パワーPx1b(t)〜Px4b(t)に係数α2を乗算した値に補正する。
同様に、Rch補正選択部126cは、Rchレベル算出部112cによってマイクロホン110が動く前に算出された信号パワーPx1c(t)〜Px4c(t)を、Cchレベル算出部112bによって算出された信号パワーPx1b(t)〜Px4b(t)に係数α2を乗算した値に補正する。
(3)Lch補正選択部126aは、Lchレベル算出部112aによってマイクロホン110が動く前に算出された信号パワーPx1a(t)〜Px4a(t)を、Rchレベル算出部112cによって算出された信号パワーPx1c(t)〜Px4c(t)に係数α3を乗算した値に補正する。
同様に、Cch補正選択部126bは、Cchレベル算出部112bによってマイクロホン110が動く前に算出された信号パワーPx1b(t)〜Px4b(t)を、Rchレベル算出部112cによって算出された信号パワーPx1c(t)〜Px4c(t)に係数α3を乗算した値に補正する。
次に、係数α1、α2、α3について説明する。
選択制御部125は、移動判定部114の判定結果であるmove_flgが0→1に変化したとき(固定状態から移動状態へ変わったとき)に、α1=1、α2=1、α3=1と設定する。
ただし、選択制御部125は、定位判定部122の判定結果がdir_flg=0(Lch定位)のときは、α1=0に変更する。また、選択制御部125は、定位判定部122の判定結果がdir_flg=1(Cch定位)のときは、α2=0に変更する。また、選択制御部125は、定位判定部122の判定結果がdir_flg=2(Rch定位)のときは、α3=0に変更する。
次に、係数α1、α2、α3を設定するときの選択制御部125の動作の詳細を、図12を用いて説明する。
図12は、本発明の実施の形態5に係る選択制御部125の動作を示すフローチャートである。
まず、選択制御部125は、移動判定部114によって、マイクロホン110が動いていないと判定された状態からマイクロホン110が動いたと判定された状態に変化したか否かを判定する(S201)。ここで、マイクロホン110の状態が変化したと判定された場合(S201のYes)、選択制御部125は、係数α1、α2、α3に「1」を設定する(S202)。
一方、マイクロホン110の状態が変化していないと判定された場合(S201のNo)、またはステップS202において係数α1、α2、α3に「1」が設定された後、選択制御部125は、定位判定部122によって判定された音像定位位置を取得する(S203)。
ここで、取得した音像定位位置がLch定位(dir_flg=0)である場合(S203のLch定位)、選択制御部125は、係数α1に「0」を設定する(S204)。また、取得した音像定位位置がCch定位(dir_flg=1)である場合(S203のCch定位)、選択制御部125は、係数α2に「0」を設定する(S205)。また、取得した音像定位位置がRch定位(dir_flg=2)である場合(S203のRch定位)、選択制御部125は、係数α3に「0」を設定する(S206)。
以上のように、本実施の形態に係る収音装置101によれば、マイクロホン110が動いた後も速やかに、Lchレベル算出部112a、Cchレベル算出部112b及びRchレベル算出部112cの信号パワーが更新される。つまり、マイクロホン110が動いた後に信号レベルがまだ更新されていない音像定位位置がある場合でも、マイクロホン110が動いた後におけるミキシング係数を高精度に算出することができる。その結果、収音装置101は、より安定したステレオ収音を実現できる。
なお、補正部121において、更新されない信号パワーにおいて、信号の置き換えではなくリセットする等の動作に代用してもよい。
また、本実施の形態に係る収音装置101は、補正部121を備えていたが、必ずしも補正部121を備える必要はない。また、本実施の形態に係るレベル算出部112は、Lchレベル算出部112a、Cchレベル算出部112b、及びRchレベル算出部112cを備えていたが、必ずしもそれらの処理部を備える必要はない。例えば、収音装置101は、図13に示すような機能構成であってもよい。
この場合、ミキシング比算出部113は、マイクロホン110が動いたと判定された場合、マイクロホン110が動いたと判定された後に信号レベルが算出された音像定位位置の信号レベルを用いて、マイクロホン110が動いたと判定された後に信号レベルが算出されていない音像定位位置のミキシング係数を算出すればよい。具体的には、ミキシング比算出部113は、例えば、マイクロホン110が動いたと判定された後にLch定位の信号レベルのみが算出されている場合、当該Lch定位の信号レベルを用いて、Cch定位のミキシング係数とRch定位のミキシング係数とを算出すればよい。
これにより、図13に示す収音装置101であっても、図10に示す収音装置101と同様の効果を奏することができる。
以上、本発明の一態様に係る収音装置101について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したもの、あるいは異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。
例えば、各収音ユニットは、上記実施の形態とは異なるように配置されてもよい。例えば、図14Aに示すように、第1〜第4の収音ユニット110a〜110dは、円周上ではなく、楕円周上に90度ごと異なる位置に並べられてもよい。また、図14Bに示すように、第1〜第4の収音ユニット110a〜110dは、指向性の主軸方向が円の中心から内側へ向いて90度ごと異なるように配置されてもよい。また、図14Cに示すように、第1〜第4の収音ユニット110a〜110dは、直線上に並ぶように配置されてもよい。このような場合であっても、収音装置101は、上記実施の形態に係る収音装置101と同様の効果を奏することができる。
また、図14Dに示すように、マイクロホン110は、第1〜第5の収音ユニット110a〜110eを備えてもよい。図14Dでは、第1〜第5の収音ユニット110a〜110eは、指向性の主軸方向が互いに72度ごと異なるように配置されている。実施の形態1と同様にミキシング係数が算出されれば、信号合成部115によって生成されるステレオ信号は、互いに144度異なる2つの収音方向でステレオ収音された信号となる。
したがって、上記実施の形態に係る収音装置101ほど効率的ではないが、図14Dに示すマイクロホン110を備える収音装置101であっても、マイクロホン110の周囲に位置する音源からの音をある程度明瞭にステレオ収音することができる。なお、マイクロホン110は、さらに多くの収音ユニットを備えてもよい。
また、上記実施の形態において、収音システムは、モニター104及びカメラ105を備えていたが、必ずしもモニター104及びカメラ105を備える必要はない。収音システムがモニター104及びカメラ105を備えない場合、収音装置101は、映像と音像とを一致させることはできないが、マイクロホン110の周囲に位置する音源からの音を明瞭にステレオ収音することはできる。例えば、電話会議システムなどの音声会議システムにおいて、収音装置101は、音源の位置に応じた位置に音像を定位させることができるステレオ信号を生成でき、音の明瞭性を向上させることができる。
また、上記実施の形態において、ミキシング比算出部113は、4つの収音ユニットのそれぞれにおいて、当該収音ユニットの隣に位置する収音ユニットの信号レベルを用いてミキシング係数を算出していたが、必ずしもこのようにミキシング係数を算出する必要はない。例えば、ミキシング比算出部113は、テーブルを参照して、各収音ユニットの信号レベルに対応するミキシング係数を算出してもよい。この場合、収音装置101は、例えば、各収音ユニットの信号レベルの比に対応付けてミキシング係数を格納しているテーブルを記憶している記憶部を備えればよい。このような場合であっても、マイクロホンの位置を測定することなく、音源からの音を明瞭にステレオ収音することができる。
また、上記実施の形態において、収音装置101は、通信相手拠点の収音システムから送信されてきた受話信号を利用して、ミキシング比を算出していたが、必ずしも受話信号を利用する必要はない。例えば、収音装置101が、ミキシング係数を算出するためのスピーカ信号を生成してもよい。この場合、スピーカ信号は、受話信号が再生された音に干渉しない周波数の音を再生するための信号であることが好ましい。これにより、収音装置101は、会議等を中断することなく、ミキシング係数を算出することができる。
また、上記実施の形態において、スピーカは2つであったが、その他の個数であってもよい。
また、上記実施の形態において、収音装置101は、図3などに示す各構成要素を備えていたが、必ずしも図3などに示す構成要素のすべてを備える必要はない。例えば、収音装置101は、図15に示すように、図3に示す構成要素の一部のみを備えてもよい。
図15は、本発明の実施の形態の変形例に係る収音装置101の機能構成を示すブロック図である。図15では、収音装置101は、マイクロホン110と、レベル算出部112と、ミキシング比算出部113と、信号合成部115とを備える。
収音装置101が図15に示すような構成であったとしても、レベル算出部112が、スピーカから出力された音の信号レベルを算出することにより、実施の形態1に係る収音装置101と同様の効果を奏することができる。
また、以下のような場合も、本発明の範囲内に含まれる。
(1)上記の各装置は、具体的には、マイクロプロセッサ、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
(2)上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。例えば、図15に示すように、システムLSI150は、レベル算出部112と、ミキシング比算出部113と、信号合成部115とを備える。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
(3)上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
(4)本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray Disc(登録商標))、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。
また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記デジタル信号を前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
(5)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
本発明の一態様に係る収音装置は、マイクロホンの周囲に位置する音源からの音を明瞭にステレオ収音することができる収音装置として、特に、テレビ会議システム、音声会議システム等として有用である。
100 第1の収音システム
101、201 収音装置
102a、102b 話者
103 テーブル
104、204 モニター
105、205 カメラ
106a、106b、206a、206b スピーカ
107 通信網
110 マイクロホン
110a、110b、110c、110d 収音ユニット
111 帯域抽出部
112 レベル算出部
112a Lchレベル算出部
112b Cchレベル算出部
112c Rchレベル算出部
113 ミキシング比算出部
114 移動判定部
115 信号合成部
116 スピーカ信号検出部
117 更新部
121 補正部
122 定位判定部
123 変動量検出部
124 変動量判定部
125 選択制御部
126a Lch補正選択部
126b Cch補正選択部
126c Rch補正選択部
150 システムLSI
200 第2の収音システム
本発明は、収音装置及び収音方法等に関し、特に、複数のマイクロホンを用いてステレオ信号を生成する収音装置及び収音方法に関するものである。
従来より、テレビ会議システムなどの音響システムでは、音源(例えば話者など)からの音を明瞭に収音するために、複数のマイクロホンを用いて音を収音する収音装置が用いられていた。このような収音装置は、例えば、自拠点における音源の位置を通信相手拠点で再現する(音像定位を実現する)ためのマルチチャンネル信号を、複数のマイクロホンを用いて生成する。
このような収音装置では、複数のマイクロホンは、各チャンネルに対応して設けられている。また、複数のマイクロホンは、指向性の主軸方向を対応するチャンネルに応じた方向に向けた状態で固定的に設置される。そして、収音装置は、各収音信号を、音像定位を実現するためのマルチチャンネル信号として生成することができる。生成されたマルチチャンネル信号は、通信網を介して通信相手拠点の複数のスピーカへ送信される。これにより、通信相手拠点でマルチチャンネルの音が再生され、通信相手拠点で自拠点の話者の位置が再現される。
ここで、音像定位を実現するためのマルチチャンネル信号を生成するには、複数のマイクロホンが、指向性の主軸方向を対応するチャンネルに応じた方向に向けた状態で、固定的に設置される必要がある。このため、上記収音装置では、話者は、複数のマイクロホンの配置位置を自由に変更することができなかった。
そこで、上記課題を解決するために、図16及び図17に示すような収音装置190が提案されている(例えば、特許文献1参照)。図16は、従来の収音システムの外観図である。図17は、従来のテレビ会議システムの機能構成を示すブロック図である。図17に示すように、テレビ会議システムは、自拠点に設置される第1の収音システム1000と、通信相手拠点に設置される第2の収音システム2000とを備える。なお、第2の収音システム2000は、第1の収音システム1000と同様の構成であるので、図16において外観図を省略する。
図16及び図17の例では、マルチチャンネル信号として、右チャンネル(以下、「Rチャンネル」または「Rch」ともいう)信号と左チャンネル(以下、「Lチャンネル」または「Lch」ともいう)信号とが生成されるとし、通信相手拠点においてステレオ再生が実現されるとする。
マイクロホン90aは、話者102aの前方近傍に配置されるようにテーブル103上に設置される。マイクロホン90bは、話者102bの前方近傍に配置されるようにテーブル103上に設置される。モニター104は、通信相手拠点のカメラ205で撮影された映像を表示するための装置であり、話者102a、102bの前方に設置される。通信相手拠点の映像は、通信網107を介してモニター104に入力される。
カメラ105は、モニター104の上部に設置され、自拠点の話者102a、102bを撮影する。自拠点の映像は、通信網107を介して通信相手拠点のモニター204へ送信される。
第1及び第2のスピーカ106a、106bは、通信相手拠点の収音装置290から通信網107を介して入力されたLチャンネル信号またはRチャンネル信号を再生する。第1及び第2のスピーカ106a、106bは、モニター104の両側にそれぞれ設置される。同様に通信相手拠点の第1のスピーカ206aは、通信相手拠点の話者から見て左側前方に設置され、通信相手拠点の第2のスピーカ206bは、通信相手拠点の話者から見て右側前方に設置されている。
収音装置190は、自拠点に設置され、収音装置290は、通信相手拠点に設置される。なお、収音装置290の内部構成は、収音装置190と同様であるので、ここでは図示及び説明を省略する。
収音装置190は、マイクロホン90a、90b、マイクロホン位置測定部91、係数算出部92、マイクロホン検出部93、及び信号算出部94により構成される。以下、収音装置190の各構成要素について具体的に説明する。
マイクロホン位置測定部91は、測定信号を第1及び第2のスピーカ106a、106bに出力する。その後、マイクロホン位置測定部91は、測定信号を出力してから、当該測定信号がマイクロホン90a、90bで収音されるまでの時間を遅延時間として算出する。マイクロホン位置測定部91は、算出した遅延時間を用いて、マイクロホン90a、90bの現在位置を測定する。
図16の例では、マイクロホン90aは、モニター104から見て右側の位置に配置されるので、当該右側の位置がマイクロホン90aの現在位置として測定される。また、マイクロホン90bは、モニター104から見て左側の位置に配置されるので、当該左側の位置がマイクロホン90bの現在位置として測定される。なお、話者がマイクロホン90a、90bを自由に移動させることができるように、マイクロホン位置測定部91は、マイクロホン90a、90bの移動のたびに、それらの現在位置を測定している。
係数算出部92は、測定されたマイクロホン90a、90bの現在位置を基に、音像定位を実現するためのマルチチャンネル信号が生成されるように、Rチャンネル信号に割り当てるレベルとLチャンネル信号に割り当てるレベルとの比(係数比)を算出する。
図16の例では、測定されたマイクロホン90aの現在位置はモニター104から見て右側の位置となる。よって、係数算出部92は、例えば、(Rチャンネル信号:Lチャンネル信号)=(1:0)をマイクロホン90aの係数比として算出する。一方、測定されたマイクロホン90bの現在位置はモニター104から見て左側の位置となる。よって、係数算出部92は、例えば、(Rチャンネル信号:Lチャンネル信号)=(0:1)をマイクロホン90bの係数比として算出する。
マイクロホン検出部93は、話者102a、102bのいずれかが発言したとき、マイクロホン90a、90bからの収音信号のレベルを基に、発言者に最も近いマイクロホンを検出する。例えば、話者102aが発言した場合、マイクロホン90aからの収音信号のレベルがマイクロホン90bからの収音信号のレベルよりも大きくなる。この場合、マイクロホン検出部93は、マイクロホン90aを、発言者に最も近いマイクロホンとして検出する。その後、係数算出部92は、マイクロホン検出部93で検出されたマイクロホン90aを基に、マイクロホン90aの係数比(Rチャンネル信号:Lチャンネル信号)=(1:0)を、信号算出部94に出力する係数比として決定する。
信号算出部94は、決定された係数比に従って、Rチャンネル信号及びLチャンネル信号を算出する。例えば、マイクロホン90aの係数比が(Rチャンネル信号:Lチャンネル信号)=(1:0)である場合、信号算出部94は、マイクロホン90a、90bの収音信号それぞれに係数1を乗算して加算することで、Rチャンネル信号を算出する。一方、信号算出部94は、マイクロホン90a、90bの収音信号それぞれに係数0を乗算して加算することで、Lチャンネル信号を算出する。
これにより、Rチャンネル信号はマイクロホン90a、90bからの収音信号すべてが加算された信号となり、Lチャンネル信号は無信号となり、音像定位を実現するためのマルチチャンネル信号が生成される。信号算出部94において算出されたLチャンネル信号(Lch)及びRチャンネル信号(Rch)は、通信網107を介して、通信相手拠点のスピーカ206a、206bへそれぞれ送信される。これにより、通信相手拠点では、通信相手拠点の話者から見て右側の位置から話者102aが発言しているように音が再生される。
このように、図16及び図17に示した収音装置190では、マイクロホンの移動のたびに、移動後のマイクロホンの位置(現在位置)を測定し、測定したマイクロホンの現在位置の情報を用いて、音像定位を実現するためのマルチチャンネル信号を生成している。その結果、話者は、マイクロホンの配置位置を自由に変更することができる。
特開平9−182044号公報
しかしながら、図16及び図17に示した収音装置190は、次の課題を有している。
(1)収音装置190は、マイクロホンの現在位置の情報を用いた処理を行っているので、マルチチャンネル信号を生成する前(例えば会議開始前)に、マイクロホンの位置を測定する必要がある。
(2)収音装置190は、マイクロホンの現在位置の情報を用いた処理を行っているので、会議中に話者がマイクロホンを移動させるなどしてマイクロホンの位置が変わるたびに、会議を中断してマイクロホンの位置を測定し直す必要がある。
(3)マイクロホンは話者によって自由に移動させられるので、マイクロホンの指向性の主軸方向が必ずしも話者に向いているとは限らず、マイクロホン検出部93において検出されたマイクロホンが実際には発言者に最も近いものではない場合がある。その場合、収音装置190は、各音源からの音を明瞭に収音することができない。
そこで、本発明は、上記課題を解決するためになされたものであって、マイクロホンの設置の自由度を高めるとともに、マイクロホンの現在位置の情報を用いずに、音源からの音を明瞭にステレオ収音することができる収音装置及び収音方法を提供することを目的とする。
上記目的を達成するために、本発明の一態様に係る収音装置は、指向性の主軸方向が互いに異なるように配置された4以上の収音ユニットを備え、スピーカから出力された音を収音可能な位置に設置されるマイクロホンと、前記4以上の収音ユニットの出力信号ごとに、前記スピーカから出力された音の信号レベルを算出するレベル算出部と、前記レベル算出部によって算出された信号レベルを用いて、前記4以上の収音ユニットの指向性の主軸方向に適応するミキシング係数を算出するミキシング係数算出部と、前記ミキシング係数算出部によって算出されたミキシング係数を用いて、前記4以上の収音ユニットの出力信号を合成することにより、ステレオ信号を生成する信号合成部とを備える。
この構成によれば、スピーカから出力された音の信号レベルを用いて、指向性の主軸方向に適応するミキシング係数を算出できる。したがって、マイクロホンの位置を測定することなく、音源からの音を明瞭にステレオ収音することが可能となる。また、マイクロホンは、互いに指向性の主軸方向が異なる4以上の収音ユニットを備える。したがって、マイクロホンが設置された向きに関わらず、マイクロホンの周囲に位置する音源からの音を明瞭にステレオ収音することができるので、マイクロホンの設置の自由度を高めることが可能となる。
また、前記4以上の収音ユニットは、指向性の主軸方向が90度ごと異なるように配置された4つの収音ユニットであることが好ましい。
この構成により、マイクロホンの設置方向によらず、マイクロホンの周囲に位置する音源からの音をさらに明瞭にステレオ収音することが可能となる。
また、前記ミキシング係数算出部は、前記ステレオ信号が、互いに180度異なる2つの収音方向でステレオ収音された信号となるように、前記ミキシング係数を算出することが好ましい。
この構成により、セパレーションが高いステレオ収音を実現することができ、各音源からの音を明瞭に収音することが可能となる。
また、前記ミキシング係数は、前記ステレオ信号の一方を生成するための第1のミキシング係数と、前記ステレオ信号の他方を生成するための第2のミキシング係数とからなり、前記ミキシング係数算出部は、前記4つの収音ユニットのそれぞれにおいて、当該収音ユニットの一方の隣に位置する収音ユニットの信号レベルを用いて第1のミキシング係数を算出し、当該収音ユニットの他方の隣に位置する収音ユニットの信号レベルを用いて第2のミキシング係数を算出し、前記信号合成部は、前記4つの収音ユニットの出力信号に前記第1のミキシング係数のそれぞれを乗じて加算することにより前記ステレオ信号の一方を生成し、前記4つの収音ユニットの出力信号に前記第2のミキシング係数のそれぞれを乗じて加算することにより前記ステレオ信号の他方を生成することが好ましい。
この構成によれば、各収音ユニットのミキシング係数を、隣に位置する収音ユニットの信号レベルを用いて算出することができる。したがって、マイクロホンの設置角度を厳密に計算する場合などに比べて、比較的容易にミキシング係数を算出することができ、ミキシング係数を算出するための計算負荷を軽減することができる。
また、さらに、前記スピーカから音を出力させるためのスピーカ信号の有無を判定するスピーカ信号検出部を備え、前記レベル算出部は、前記スピーカ信号検出部によってスピーカ信号が有ると判定された場合に前記信号レベルを算出することが好ましい。
この構成によれば、スピーカ信号が有ると判定されたときに出力された信号から信号レベルを算出することができる。したがって、ミキシング係数を算出するためだけにスピーカから音を出力させる必要がないので、例えば、テレビ会議システムなどにおいて、スピーカから出力される話者の音声などを利用してミキシング係数を算出することも可能となる。
また、さらに、前記マイクロホンが動いたか否かを判定する移動判定部を備え、前記ミキシング係数算出部は、前記マイクロホンが動いたと判定された場合に、前記マイクロホンが動いていないと判定される場合よりも、前記ミキシング係数を算出する頻度を高くすることが好ましい。
この構成によれば、マイクロホンが動いた場合には、ミキシング係数が比較的速く更新され、マイクロホンが動いていない場合には、ミキシング係数が比較的遅く更新される。したがって、マイクロホンの動きに対するミキシング係数の追従性を向上させるとともに、ミキシング係数の安定性も向上させることができる。したがって、マイクロホンの周囲に位置する音源からの音をさらに明瞭にステレオ収音することが可能となる。
また、前記移動判定部は、前記ミキシング係数算出部によって算出されたミキシング係数の変化度合いに基づいて、前記マイクロホンが動いたか否かを判定することが好ましい。
この構成により、マイクロホンに移動センサなどを設置する必要がないので、マイクロホンが動いたか否かを簡易な構成で判定することができる。
また、さらに、前記スピーカから音を出力させるためのスピーカ信号から音像定位位置を判定する定位判定部を備え、前記ミキシング係数算出部は、前記定位判定部によって判定された音像定位位置ごとに前記ミキシング係数を算出し、前記信号合成部は、前記ミキシング係数算出部によって算出された前記音像定位位置ごとのミキシング係数の平均値を用いて、前記4以上の収音ユニットの出力信号を合成することが好ましい。
この構成により、スピーカから出力される音の音像定位位置が変わることにより、ミキシング係数が変動することを抑制でき、安定してステレオ収音することが可能となる。
また、前記定位判定部は、それぞれが音像定位位置と前記スピーカとの相対的な位置関係を示す左定位、右定位、及び中央定位のいずれかを前記音像定位位置として判定し、前記レベル算出部は、前記定位判定部によって左定位と判定された場合に、前記信号レベルを算出するLchレベル算出部と、前記定位判定部によって右定位と判定された場合に、前記信号レベルを算出するRchレベル算出部と、前記定位判定部によって中央定位と判定された場合に、前記信号レベルを算出するCchレベル算出部とを備えることが好ましい。
この構成により、左、右、及び中央の3種類の音像定位位置ごとにミキシング係数を算出することが可能となる。
また、さらに、前記マイクロホンが動いたか否かを判定する移動判定部を備え、前記ミキシング係数算出部は、前記マイクロホンが動いたと判定された場合、前記マイクロホンが動いたと判定された後に信号レベルが算出された音像定位位置の信号レベルを用いて、前記マイクロホンが動いたと判定された後に信号レベルが算出されていない音像定位位置のミキシング係数を算出することが好ましい。
この構成により、マイクロホンが動いた後に信号レベルがまだ更新されていない音像定位位置がある場合でも、マイクロホンが動いた後におけるミキシング係数を高精度に算出することができる。
また、さらに、前記4以上の収音ユニットの出力信号のそれぞれから、所定の周波数帯域の信号を抽出する帯域抽出部を備え、前記レベル算出部は、前記帯域抽出部によって抽出された信号を用いて、前記信号レベルを算出することが好ましい。
この構成により、ミキシング係数を算出する際に、ミキシング係数を算出するために必要な音以外の音(例えば騒音)の影響を抑制することができ、ミキシング係数を高精度に算出することができる。
また、前記所定の周波数帯域は、音声帯域であることが好ましい。
この構成により、例えば、スピーカから出力される話者の音声を利用してミキシング係数を算出する際に、高精度にミキシング係数を算出することができる。
また、本発明の一態様に係る収音方法は、指向性の主軸方向が互いに異なるように配置された4以上の収音ユニットを備え、スピーカから出力された音を収音可能な位置に設置されるマイクロホンを用いて、ステレオ信号を生成する収音方法であって、前記4以上の収音ユニットの出力信号ごとに、前記スピーカから出力された音の信号レベルを算出するレベル算出ステップと、算出された信号レベルを用いて、前記4以上の収音ユニットの指向性の主軸方向に適応するミキシング係数を算出するミキシング係数算出ステップと、算出されたミキシング係数を用いて、前記4以上の収音ユニットの出力信号を合成することにより、ステレオ信号を生成する信号合成ステップとを含む。
これにより、上記収音装置と同様の効果を奏することができる。
また、本発明の一態様に係る集積回路は、指向性の主軸方向が互いに異なるように配置された4以上の収音ユニットを備え、スピーカから出力された音を収音可能な位置に設置されるマイクロホンを用いて、ステレオ信号を生成する集積回路であって、前記4以上の収音ユニットの出力信号ごとに、前記スピーカから出力された音の信号レベルを算出するレベル算出部と、前記レベル算出部によって算出された信号レベルを用いて、前記4以上の収音ユニットの指向性の主軸方向に適応するミキシング係数を算出するミキシング係数算出部と、前記ミキシング係数算出部によって算出されたミキシング係数を用いて、前記4以上の収音ユニットの出力信号を合成することにより、ステレオ信号を生成する信号合成部とを備える。
これにより、上記収音装置と同様の効果を奏することができる。
また、本発明は、上記収音方法に含まれる各ステップをコンピュータに実行させるためのプログラムとして実現することができる。そして、そのようなプログラムは、CD−ROM(Compact Disc Read Only Memory)等の記録媒体あるいはインターネット等の伝送媒体を介して配信することができるのは言うまでもない。
本発明によれば、スピーカから出力された信号レベルを用いて、指向性の主軸方向に適応するミキシング係数を算出できる。したがって、スピーカの位置を測定することなく、音源からの音を明瞭にステレオ収音することが可能となる。また、マイクロホンは、互いに指向性の主軸方向が異なる4以上の収音ユニットを備える。したがって、マイクロホンが設置された向きに関わらず、マイクロホンの周囲に位置する音源からの音を明瞭にステレオ収音することができるので、マイクロホンの設置の自由度を高めることが可能となる。
図1は、本発明の実施の形態1に係る収音システムの外観図である。 図2は、本発明の実施の形態1に係る収音システムの外観図である。 図3は、本発明の実施の形態1に係るテレビ会議システムの構成を示す図である。 図4は、本発明の実施の形態1に係る収音装置によって形成されるLch収音ポーラパターンとRch収音ポーラパターンとを示す図である。 図5は、本発明の実施の形態1に係る収音装置の動作を示すフローチャートである。 図6は、本発明の実施の形態2に係る収音装置の機能構成を示すブロック図である。 図7は、本発明の実施の形態3に係る収音装置の機能構成を示すブロック図である。 図8は、本発明の実施の形態3に係る移動判定部の詳細な機能構成を示すブロック図である。 図9Aは、本発明の実施の形態4に係る収音装置の機能構成を示すブロック図である。 図9Bは、本発明の実施の形態4の変形例に係る収音装置の機能構成を示すブロック図である。 図10は、本発明の実施の形態5に係る収音装置の機能構成を示すブロック図である。 図11は、本発明の実施の形態5に係る補正部の詳細な機能構成を示すブロック図である。 図12は、本発明の実施の形態5に係る選択制御部の動作を示すフローチャートである。 図13は、本発明の実施の形態5の変形例に係る収音装置の機能構成を示すブロック図である。 図14Aは、本発明の実施の形態の変形例に係るマイクロホンの構成を示す図である。 図14Bは、本発明の実施の形態の変形例に係るマイクロホンの構成を示す図である。 図14Cは、本発明の実施の形態の変形例に係るマイクロホンの構成を示す図である。 図14Dは、本発明の実施の形態の変形例に係るマイクロホンの構成を示す図である。 図15は、本発明の実施の形態の変形例に係る収音装置の機能構成を示すブロック図である。 図16は、従来の収音システムの外観図である。 図17は、従来のテレビ会議システムの構成を示す図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
図1〜図3を参照して、本発明の実施の形態1に係る収音装置について説明する。
図1及び図2は、本発明の実施の形態1に係る収音システムの外観図である。なお、図2は、収音ユニットの設置向きが図1と比べ、右へ45度回転して設置されている点が図1と異なるだけであり、それ以外は同じである。また、図3は、本発明の実施の形態1に係るテレビ会議システムの構成を示す図である。
なお、本実施の形態では、ステレオ信号として、Rチャンネル信号とLチャンネル信号とが生成されるとし、通信相手拠点においてステレオ再生が実現されるとする。また、図面において、収音ユニットは、円と線分とで表現され、円の中心から円と線分との接点へ向かう方向が当該収音ユニットの指向性の主軸方向と示す。
テレビ会議システムは、自拠点に設置される第1の収音システム100と、自拠点とは物理的に離れている通信相手拠点に設置される。テレビ会議システムは、第1の収音システム100とインターネット等の通信網107を介して接続されている第2の収音システム200とを備える。
図1及び図2に示すように、第1の収音システム100は、収音装置101と、モニター104と、カメラ105と、第1のスピーカ106aと、第2のスピーカ106bとを備える。ここでは、第2の収音システム200は、第1の収音システム100と同様であることとして、外観図を省略する。なお、第2の収音システム200は、第1の収音システム100と同様のシステムに限らず、図16に示した従来のシステム(第2の収音システム2000)と同様であってもよい。
収音装置101は、音源(例えば、話者102aまたは102b)からの音をステレオ収音する。収音装置101は、第1〜第4の収音ユニット110a〜110dを備えるマイクロホン110を備える。本実施の形態では、マイクロホン110は、話者102a、102bの前方に設置されたテーブル103上に載置されている。なお、マイクロホン110は、必ずしもテーブル103上に載置される必要はなく、第1及び第2のスピーカ106a、106bから出力された音を収音可能な位置に設置されればよい。
モニター104は、話者102a、102bの前方に設置される。モニター104は、第2の収音システム200で撮影された映像を、通信網107を介して受信して表示する。
カメラ105は、モニター104の上部に設置され、話者102a、102bを撮影する。カメラ105によって生成された映像信号は、通信網107を介して、第2の収音システム200に送信される。
第1のスピーカ106aは、モニター104から見て右側(話者102a、102bから見て左側)に配置される。第1のスピーカ106aは、第2の収音システム200から通信網107を介して入力されたLチャンネル信号を再生する。
第2のスピーカ106bは、モニター104から見て左側(話者102a、102bから見て右側)に配置される。第2のスピーカ106bは、第2の収音システム200から通信網107を介して入力されたRチャンネル信号を再生する。
次に、マイクロホン110が4以上の収音ユニットを備える理由について説明する。
テレビ会議システムでは、マイクロホン110は、テーブル103の中央に置かれることが多いので、360度全方向の音を収音する必要がある。例えば、1次傾度の単一指向性の収音ユニットを2個用いて収音する場合、左右のセパレーションを得つつ、360度全方向の音を収音するために、2個の収音ユニットは、指向性の主軸方向が互いに180度異なる方向となるように設置される。
また、テレビ会議システム等では、ステレオ収音を行う場合、映像と音の方向(音像)とが一致することにより、音の明瞭度を高めるとともに臨場感を高めることができる。ただ、マイクロホンの設置が利用者に任されている場合、利用者がマイクロホンの指向性の方向まで注意を払ってマイクロホンを設置することは難しい。したがって、利用者が注意を払わない場合にも、マイクロホンの向きによらず映像と音像とが一致するようにステレオ収音されることが望ましい。
しかしながら、前述したように収音ユニットが2個の場合、各収音ユニットの指向性の主軸方向は互いに180度異なる方向となる。このため、左右の収音方向(強調されて収音される音の方向)は、マイクロホンが設置されると固定されてしまうので、左右のセパレーションは、マイクロホンが設置される向きに依存してしまう。
収音ユニットが3個の場合、隣り合う各収音ユニットの指向性の主軸方向は、互いに120度異なる方向となる。そのため、例えば、2つの収音ユニットが前方の左右の音を収音した場合、1個の収音ユニットしか後方の音を収音できない。その結果、後方の音を左右に分離することができない。すなわち、3個の収音ユニットの出力信号を合成しても、任意の方向に対して、セパレーションが高いステレオ収音を実現することが難しい。
そこで、本実施の形態において、マイクロホン110は、指向性の主軸方向が互いに異なる4個以上の収音ユニットを備える。これにより、収音装置101は、360度全方向の収音が可能となり、かつ、左右のセパレーションを確保できるステレオ収音が可能となる。
具体的には、第1〜第4の収音ユニット110a〜110dは、指向性の主軸方向が90度ごと異なるように配置される。より具体的には、第1〜第4の収音ユニット110a〜110dは、円周上に90度ごと異なる位置に並べられ、かつ、各収音ユニットの指向性の主軸方向が、円の中心から外側へ向いて90度ごと異なるように配置されている。
なお、第1〜第4の収音ユニット110a〜110dの指向性の主軸方向は、厳密に90度ごと異なる必要はなく、実質的に90度ごと異なればよい。つまり、第1〜第4の収音ユニット110a〜110dは、指向性の主軸方向が、90度と同視できる程度の角度ごと異なるように配置されればよい。
図4は、本発明の実施の形態1に係る収音装置101によって形成されるLchポーラパターンとRchポーラパターンとを示す図である。つまり、図4は、収音ユニットが4個の場合における指向性合成パターンの一例を示す図である。
本実施の形態に係るマイクロホン110は、指向性の主軸方向が互いに180度異なる収音ユニットのペアを2つ備える。このため、収音装置101は、図4に示すように、各収音ユニットの出力信号(以下、「ユニット信号」ともいう)を合成することにより、任意の方向に対して、指向性の主軸方向が互いに180度異なるように収音することが可能である。
第1〜第4の収音ユニット110a〜110dの各ユニット信号x1(t)〜x4(t)は、レベル算出部112へ出力される。なお、tは時間のサンプルを示す。
なお、本実施の形態では、各収音ユニットは、単一の指向性を有するマイクロホンユニットであるが、必ずしもこのような収音ユニットである必要はない。例えば、各収音ユニットは、単一の指向性が形成されるように設置された複数の無指向性のマイクロホンユニットによって構成されてもよい。
次に、図3を用いて、収音装置101の機能構成について説明する。
図3に示すように、第1の収音システム100は、収音装置101と、モニター104と、カメラ105と、第1のスピーカ106aと、第2のスピーカ106bとを備える。また、第2の収音システム200は、収音装置201と、モニター204と、カメラ205と、第1のスピーカ206aと、第2のスピーカ206bとを備える。
収音装置101は、マイクロホン110と、レベル算出部112と、ミキシング比算出部113と、信号合成部115と、スピーカ信号検出部116とを備える。なお、収音装置201の内部構成は、収音装置101と同様であるので、図示及び説明を省略する。
スピーカ信号検出部116は、通信網107を介して、第2の収音システム200より伝送されてきた受話信号であるステレオ信号を入力として受け付け、その受話信号の有無判定結果であるフラグ信号flgをレベル算出部112へ出力する。ここでは、受話信号が、スピーカから音を出力させるためのスピーカ信号に相当する。つまり、スピーカ信号検出部116は、スピーカ信号の有無を判定する。
レベル算出部112は、第1〜第4の収音ユニット110a〜110dの出力信号ごとに、第1及び第2のスピーカ206a、206bから出力された音の信号レベルを算出する。
具体的には、レベル算出部112は、各ユニット信号x1(t)〜x4(t)と受話信号の有無判定結果であるフラグ信号flgとを入力として受け付け、各ユニット信号x1(t)〜x4(t)のパワーレベルである信号パワーPx1(t)〜Px4(t)を信号レベルとして算出する。
以下、特に断りがない限り、レベル算出部112が算出する信号パワーは、時間平均パワーであるとする。また、時間平均パワーを算出するために設定される、収音した信号のレベルを平均するための時間区間は、短時間であるとする。
ここで、フラグ信号flgは、信号パワーが算出される際の制御信号として用いられる。つまり、レベル算出部112は、受話信号が有ると判定された場合(flg=1)にのみ、信号パワーPx1(t)〜Px4(t)を算出する。つまり、レベル算出部112は、スピーカ信号検出部116によってスピーカ信号が有ると判定された場合に信号レベルを算出する。
レベル算出部112は、算出した信号パワーPx1(t)〜Px4(t)をミキシング比算出部113へ出力するとともに、当該信号パワーを保持する。なお、受話信号が無いと判定された場合(flg=0)は、レベル算出部112は、前回算出された信号パワー(保持されている最新の信号パワー)をミキシング比算出部113へ出力する。
ミキシング比算出部113は、ミキシング係数算出部に相当する。ミキシング比算出部113は、レベル算出部112によって算出された信号レベルを用いて、第1〜第4の収音ユニット110a〜110dの指向性の主軸方向に適応するミキシング係数を算出する。本実施の形態では、ミキシング比算出部113は、ステレオ信号が、互いに180度異なる2つの収音方向でステレオ収音された信号となるように、ミキシング係数を算出する。
具体的には、ミキシング比算出部113は、信号パワーPx1(t)〜Px4(t)を入力として受け付け、Lch再生用のLchミキシング係数A11(t)、A12(t)、A13(t)、A14(t)と、Rch再生用のRchミキシング係数A21(t)、A22(t)、A23(t)、A24(t)とを算出する。
つまり、ミキシング比算出部113は、第1〜第4の収音ユニット110a〜110dのそれぞれにおいて、当該収音ユニットの一方の隣に位置する収音ユニットの信号レベルを用いてLchミキシング係数を算出し、当該収音ユニットの他方の隣に位置する収音ユニットの信号レベルを用いてRchミキシング係数を算出する。ここで、Lchミキシング係数及びRchミキシング係数が、第1のミキシング係数及び第2のミキシング係数に相当する。なお、ミキシング係数の詳細については後述する。
信号合成部115は、ミキシング係数を用いて、第1〜第4の収音ユニット110a〜110dの出力信号を合成することにより、ステレオ信号を生成する。
具体的には、信号合成部115は、Lchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)と、収音ユニットx1(t)〜x4(t)とを入力として受け付ける。そして、信号合成部115は、式(1)に従って、Rチャンネル信号である出力信号y1(t)と、Lチャンネル信号である出力信号y2(t)とを算出する。
つまり、信号合成部115は、第1〜第4の収音ユニット110a〜110dの出力信号にLchミキシング係数のそれぞれを乗じて加算することにより、ステレオ信号の一方であるLチャンネル信号を生成する。また、信号合成部115は、第1〜第4の収音ユニット110a〜110dの出力信号にRchミキシング係数のそれぞれを乗じて加算することにより、ステレオ信号の他方であるLチャンネル信号を生成する。
そして、信号合成部115は、通信網107を介して、算出した出力信号y1(t)を第2の収音システム200が備える第1のスピーカ206aへ送信し、算出した出力信号y2(t)を第2の収音システム200が備える第2のスピーカ206bへ送信する。
Figure 2011010426
次に、以上のように構成された収音装置101における各種動作について説明する。
図5は、実施の形態1に係る収音装置101の動作を示すフローチャートである。
まず、スピーカ信号検出部116は、通信網107を介して、第2の収音システム200より伝送されてきた受話信号であるステレオ信号の有無を判定する(S101)。ここで、ステレオ信号が有ると判定された場合(S101のYes)、レベル算出部112は、各収音ユニットの出力信号ごとに、出力信号の信号パワーを信号レベルとして算出し、保持する(S102)。一方、ステレオ信号が無いと判定された場合(S101のNo)、レベル算出部112は、前回算出された各信号パワーを取得する(S103)。
そして、ミキシング比算出部113は、ステップS102において算出された各信号パワー、またはステップS103において取得された各信号パワーを用いて、Lchミキシング係数とRchミキシング係数とを算出する(S104)。続いて、信号合成部115は、算出されたLchミキシング係数及びRchミキシング係数を用いて、各収音ユニットからの出力信号を合成することにより、ステレオ信号を送話信号として生成し(S105)、ステップS101の処理に戻る。
以上のように収音装置101は、ステップS101〜S105までの処理を繰り返す。
次に、ミキシング係数を算出する処理(S104)及びステレオ信号を生成する処理(S105)について、さらに詳細に説明する。
マイクロホン110は、話者102a、102bによって位置あるいは向きが自由に変更され得る。したがって、第1〜第4の収音ユニット110a〜110dに対して固定的にミキシング係数を設定して、Rチャンネル信号及びLチャンネル信号を生成することはできない。
そこで、本実施の形態では、収音装置101は、第1及び第2のスピーカ106a、106bから再生される通信相手側の音声信号を用いて、各収音ユニットの指向性の主軸方向に適応するミキシング係数を算出する。
図1において、第1及び第2のスピーカ106a、106bから同じ音声が再生されていると仮定すると、第1及び第2のスピーカ106a、106bの中間地点に仮想的に音源があるとみなすことができる。そこで、第1及び第2のスピーカ106a、106bを1つの仮想音源とみなし、その仮想音源の出力信号を音声信号V(t)と表す。
仮想音源の音声信号V(t)は音響空間を経て、第1〜第4の収音ユニット110a〜110dに到達する。このとき、第1〜第4の収音ユニット110a〜110dそれぞれの指向性の主軸方向に依存するゲインを第1〜第4のゲインD1〜D4と表す。なお、ここでは簡単のため音響空間による音声信号の減衰はないと仮定する。
このとき、第1〜第4の収音ユニット110a〜110dが単一指向性のマイクロホンユニットであることを考慮すれば、図1に示すマイクロホン110の配置において、第1〜第4のゲインD1〜D4は、以下のようになる。
すなわち、第1の収音ユニット110aの指向性の主軸方向は、マイクロホン110から仮想音源に向かう方向に対して角度が0度となっているので、第1のゲインD1は「1」とみなすことができる。また、第2及び第3の収音ユニット110b、110cは、指向性の主軸方向がマイクロホン110から仮想音源に向かう方向に対して90度傾いていることから、第2及び第3のゲインD2、D3は、「0.5」とみなすことができる。また、第4の収音ユニット110dの指向性の主軸方向は、マイクロホン110から仮想音源に向かう方向に対して180度傾いていることから、第4のゲインD4は、「0」とみなすことができる。
このように得られる第1〜第4のゲインD1〜D4をミキシング係数として第1〜第4の収音ユニット110a〜110dの出力信号x1(t)〜x4(t)に乗じて加算した信号は、仮想音源の方向に指向性の主軸方向を向けた収音信号となる。
同様に、マイクロホン110を右へ45度回転させた図2の場合は、第1及び第2の収音ユニット110a、110bの指向性の主軸方向は、マイクロホン110から仮想音源に向かう方向に対して45度傾いているので、第1及び第2のゲインD1、D2は、「0.7」とみなすことができる。また、第3及び第4の収音ユニット110c、110dの指向性の主軸方向は、マイクロホン110から仮想音源に向かう方向に対して135度傾いているので、第3及び第4のゲインD3、D4は、「0.2」とみなすことができる。
このように得られる第1〜第4のゲインD1〜D4をミキシング係数として第1〜第4の収音ユニット110a〜110dの出力信号x1(t)〜x4(t)に乗じて加算した信号は、仮想音源の方向に指向性の主軸方向を向けた収音信号となる。
以上のように、第1〜第4の収音ユニット110a〜110dの指向性の主軸方向に依存する第1〜第4のゲインD1〜D4は、マイクロホン110の配置に従って、一意に決定することができる。そして、そのように決定される第1〜第4のゲインD1〜D4をミキシング係数として、第1〜第4の収音ユニット110a〜110dの出力信号x1(t)〜x4(t)のそれぞれに乗じて加算することで、仮想音源の方向に指向性の主軸方向を向けた収音信号を生成することができる。
このことから、第1〜第4のゲインD1〜D4を、右隣の収音ユニットの出力信号の係数として用いれば、仮想音源に対して右に90度傾いた方向に指向性の主軸方向を向けた収音信号を生成することができる。また逆に、第1〜第4のゲインD1〜D4を、左隣の収音ユニットの出力信号のミキシング係数として用いれば、仮想音源に対して左に90度傾いた方向に指向性の主軸方向を向けた収音信号を生成することができる。
これを利用すると、音源に対し左右に分離した音を収音可能となる。つまり、第1〜第4のゲインD1〜D4に基づいて、Lchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)を算出することが可能となる。具体的には、Lchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)は、第1〜第4のゲインD1〜D4を用いて式(2)のように表すことができる。
Figure 2011010426
しかし、マイクロホン110はどのように設置されているか分からないため、第1〜第4のゲインD1〜D4を直接求めることはできない。そこで、ミキシング比算出部113は、第1〜第4の収音ユニット110a〜110dの信号パワーPx1(t)〜Px4(t)を利用して、ミキシング係数を算出する。
第1及び第2のスピーカ106a、106bの音声信号V(t)の信号パワーをPv(t)とすると、第1〜第4の収音ユニット110a〜110dの信号パワーPx1(t)〜Px4(t)は式(3)のように表すことができる。
Figure 2011010426
式(3)を第1〜第4のゲインD1〜D4について変形すると、式(4)となる。
Figure 2011010426
ここで、全収音ユニットの信号パワーの総和をPx(t)(=Px1(t)+Px2(t)+Px3(t)+Px4(t))と表す。Px(t)は、指向性の主軸方向が180度異なる2つの単一指向性マイクロホンの信号パワーの組み合わせを2つ加算したもの(Px(t)={Px1(t)+Px4(t)}+{Px2(t)+Px3(t)})とみなせる。
単一指向性マイクロホンの指向特性は、(1+cosθ)/2で表される。したがって、指向性の主軸方向が180度異なる2つの単一指向性マイクロホンを組み合わせたときの指向特性は、(1+cosθ)/2+(1+cos(θ+180°))/2=1となり、無指向となる。
つまり、Px(t)は、2個の無指向性マイクロホンの信号パワーを加算したものとみなせる。したがって、スピーカより音声が拡声されており、スピーカ拡声音以外がないときは、式(5)に示すようにPv(t)=Px(t)/2とみなせる。
Figure 2011010426
式(2)及び式(5)より、ミキシング比算出部113は、収音ユニットの信号パワーPx1(t)〜Px4(t)を用いて、式(6)のようにLchミキシング係数A11(t)及びRchミキシング係数A21(t)〜A24(t)を算出する。つまり、ミキシング比算出部113は、信号レベルを用いて、各収音ユニットの指向性の主軸方向に適応するミキシング係数を算出する。
Figure 2011010426
図4は、このようにして、Lchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)を用いてステレオ信号を生成した場合に形成される指向性のポーラパターンを示す。
なお、式(4)において、第1〜第4の収音ユニット110a〜110dの信号パワーPx1(t)〜Px4(t)を合計値Px(t)で正規化したが、信号パワーPx1(t)〜Px4(t)の最大値を用いて正規化した値で近似してもよい。つまり、ミキシング比算出部113は、信号レベルを用いて、各収音ユニットの指向性の主軸方向に適応するミキシング係数を算出すればよい。
以上のように、本実施の形態に係る収音装置101によれば、スピーカから出力された音の信号レベルを用いて、指向性の主軸方向に適応したミキシング係数を算出できる。したがって、マイクロホン110の位置を測定することなく、音源からの音を明瞭にステレオ収音することが可能となる。
また、マイクロホン110は、指向性の主軸方向が90度ごと異なるように配置された第1〜第4の収音ユニット110a〜110dを備える。したがって、収音装置101は、マイクロホン110が設置された向きに関わらず、マイクロホンの周囲に位置する音源からの音を明瞭にステレオ収音することができる。すなわち、話者等は、マイクロホン110を自由に設置することが可能となる。
(実施の形態2)
次に、図6を参照して、本発明の実施の形態2に係る収音装置について説明する。
図6は、本発明の実施の形態2に係る収音装置101の機能構成を示すブロック図である。図6に示す収音装置101は、図3に示す実施の形態1に係る収音装置101に入れ代わるように配置される。
また、本実施の形態に係る収音装置101は、図3に示す実施の形態1に係る収音装置101に対して、帯域抽出部111が新たに追加される点のみが異なる。以下、実施の形態1と異なる点を中心に説明する。
帯域抽出部111は、第1〜第4の収音ユニット110a〜110dの出力信号から、所定の周波数帯域の信号のみを抽出して、レベル算出部112へ出力する。
ここで、所定の周波数帯域は、例えば、話者102a、102bの音声帯域(300Hz〜7kHz)である。より好ましくは、所定の周波数帯域は、音声帯域のうち、比較的室内騒音の影響が小さい帯域(例えば、1kHz〜4kHz)である。これにより、収音装置101は、スピーカから出力される話者の音声を利用してミキシング係数を算出する際に、スピーカから出力される音以外の音などの騒音の影響を抑制することができる。つまり、収音装置101は、ミキシング係数を高精度に算出することができる。
また、所定の周波数帯域は、例えば、第1〜第4の収音ユニット110a〜110dそれぞれが有する指向特性(指向性の周波数特性)を考慮して求められる帯域であってもよい。具体的には、所定の周波数帯域は、すべての収音ユニットに対して、指向性が安定して得られる帯域であってもよい。
このような所定の周波数帯域の信号を抽出することにより、ミキシング比算出部113に入力される信号レベルに対する、話者102a、102bの音声以外の騒音の影響を減少させることができる。
以上のように、本実施の形態によれば、ミキシング比算出部113に入力される収音ユニット信号に含まれる、話者102a、102bの音声以外の騒音を減少させることができる。これにより、ミキシング比算出部113が算出するミキシング係数の精度が向上し、より明瞭な音を再生することができるステレオ信号を生成することができる。
(実施の形態3)
次に、図7、図8を参照して、本発明の実施の形態3に係る収音装置について説明する。
図7は、本発明の実施の形態3に係る収音装置101の機能構成を示すブロック図である。図7に示す収音装置101は、図3または図6に示す実施の形態1または2に係る収音装置101と入れ代わるように配置される。
また、本実施の形態に係る収音装置101は、図6に示す実施の形態2に係る収音装置101に対して、更新部117及び移動判定部114が新たに追加される点のみが異なる。以下、実施の形態1または2と異なる点を中心に説明する。
マイクロホン110は、話者102a、102bによって容易に回転されたりあるいは移動されたりする。マイクロホン110が回転されたり移動されたりした場合に、マイクロホン110が回転あるいは移動される前に算出されたミキシング係数を用いてステレオ信号が生成されれば、映像と音像とが一致しなくなる。このため、移動後は再度ミキシング係数を算出し直す必要がある。
また、ミキシング係数が正しく算出されており、マイクロホン110が回転されたり移動されたりしていない場合は、音像が変動しないように、すでに算出されたミキシング係数を更新させない、または更新速度を遅くするなどの制限を加えることが好ましい。
そこで、本実施の形態では、移動判定部114は、マイクロホンが動いたか否かを判定する。具体的には、移動判定部114は、ミキシング比算出部113によって算出されたミキシング係数の変化度合いに基づいて、マイクロホン110が動いたか否かを判定する。
そして、更新部117は、Lchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)を時間方向に平均化することにより、Lch平滑化ミキシング係数B11(t)〜B14(t)及びRch平滑化ミキシングB21(t)〜B24(t)を出力する。
さらに、更新部117は、移動判定部114の判定結果に基づいて、Lch平滑化ミキシング係数B11(t)〜B14(t)及びRch平滑化ミキシング係数B21(t)〜B24(t)を算出する頻度を調整する。つまり、更新部117は、マイクロホン110が動いたと判定された場合に、マイクロホン110が動いていないと判定される場合よりも、平滑化ミキシング係数を算出する頻度を高くする。
その結果、収音装置101は、マイクロホン110の動きに対するミキシング係数の追従性を向上させるとともに、ミキシング係数の安定性も向上させることができる。
次に、図8を用いて、移動判定部114の詳細について説明する。
図8は、本発明の実施の形態3に係る移動判定部114の詳細な機能構成を示すブロック図である。図8に示すように、移動判定部114は、変動量検出部123と変動量判定部124とを備える。
変動量検出部123は、ミキシング比算出部113が算出したLchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)と、更新部117が算出したLch平滑化ミキシング係数B11(t)〜B14(t)及びRch平滑化ミキシング係数B21(t)〜B24(t)とを入力として受け付け、式(7)のようにして、ミキシング係数の変化度合いを示す変動量を検出する。
Figure 2011010426
ここで、Bt−1、Atは式(8)で表現される。
Figure 2011010426
マイクロホン110の動きが無い間、ミキシング係数Atと平滑化ミキシング係数Bt−1はほぼ同じ値となるため、変動量mic_varの値は小さくなる。これに対し、マイクロホン110が動いた場合は、ミキシング係数Atの値がまず変化する。このため、ミキシング係数Atと平滑化ミキシング係数Bt−1との差が大きくなる。よって、変動量mic_varの値は大きくなる。
そこで、変動量判定部124は、変動量mic_varの値を監視する。そして、変動量mic_varが閾値を超えた場合、変動量判定部124は、マイクロホン110が動いたと判定し、move_flg=1と設定する。一方、変動量mic_varが閾値を超えない場合、変動量判定部124は、マイクロホン110が動いていないと判定し、move_flg=0と設定する。
このように設定されたmove_flgの値に従って、更新部117は、平滑化ミキシング係数を算出する頻度を調整する。
以上のように、本実施の形態に係る収音装置101によれば、マイクロホン110が動いた場合に、音像定位の追従性を向上させることができる。また、動いていない場合に、音像定位の安定性を確保することができる。言い換えると、本実施の形態に係る収音装置101によれば、マイクロホン110の動きに対するミキシング係数の追従性を向上させるとともに、ミキシング係数の安定性も向上させることができる。したがって、マイクロホン110の周囲に位置する音源からの音をさらに明瞭にステレオ収音することが可能となる。
また、移動判定部114は、ミキシング係数の変化度合いに基づいて、マイクロホン110が動いたか否かを判定することができ、移動センサなどを設置する必要がないので、マイクロホン110が動いたか否かを簡易な構成で判定することが可能となる。
なお、移動判定部114は、必ずしもミキシング係数の変化度合いに基づいて、マイクロホン110が動いたか否かを判定する必要はない。例えば、移動判定部114は、マイクロホン110に取り付けられたジャイロセンサなどの移動センサからのセンサ信号に基づいて、マイクロホン110が動いたか否かを判定してもよい。この場合、収音装置は、本実施の形態の収音装置101と比べて構成が複雑になるが、マイクロホン110の動きに対するミキシング係数の追従性を向上させるとともに、ミキシング係数の安定性を向上させることができる。
また、本実施の形態において、移動判定部114は、Lch及びRch両方のミキシング係数及び平滑化ミキシング係数を用いて、マイクロホン110が動いたか否かを判定しているが、どちらか一方のチャンネルのミキシング係数及び平滑化ミキシング係数を用いて、マイクロホン110が動いたか否かを判定してもよい。
また、LchとRchの形成する指向性の主軸方向が互いに180度異なる方向であることを考慮すれば、更新部117は、一方の平滑化ミキシング係数を用いて、他方の平滑化ミキシング係数を式(9)のように算出してもよい。
Figure 2011010426
また、本実施の形態において、収音装置101は、更新部117を備えていたが、必ずしも更新部117を備える必要はない。この場合、ミキシング比算出部113が、マイクロホン110が動いたと判定された場合に、マイクロホン110が動いていないと判定される場合よりも、ミキシング係数を算出する頻度を高くすればよい。これにより、収音装置101は、マイクロホン110の動きに対するミキシング係数の追従性を向上させるとともに、ミキシング係数の安定性も向上させることができる。
(実施の形態4)
次に、図9Aを参照して、本発明の実施の形態4に係る収音装置について説明する。
図9Aは、本発明の実施の形態4に係る収音装置101の機能構成を示すブロック図である。図9Aに示す収音装置101は、図3、図6または図7に示す実施の形態1、2または3に係る収音装置101に入れ代わるように配置される。
また、本実施の形態に係る収音装置101は、図6に示す実施の形態2に係る収音装置101に対して、定位判定部122が追加された点と、レベル算出部112がLchレベル算出部112a、Cchレベル算出部112b、Rchレベル算出部112cを備える点のみが異なる。以下、実施の形態1〜3と異なる点を中心に説明する。
第1及び第2のスピーカ106a、106bから再生される音声信号は、ステレオ信号である。このため、第1及び第2のスピーカ106a、106bから再生される音声信号にはレベル差が生じる。その結果、第1のスピーカ106aの再生音が第2のスピーカ106bの再生音より大きな場合(左へ音像定位している場合)と、第1のスピーカ106aの再生音と第2のスピーカ106bの再生音が同等の場合(中央へ音像定位している場合)と、第2のスピーカ106bの再生音が第1のスピーカ106aの再生音より大きな場合(右へ音像定位している場合)とでは、それぞれ音の音像定位位置が異なる。
そのため、第1〜第4の収音ユニット110a〜110dが固定されていたとしても、指向性の主軸方向に依存する第1〜第4のゲインD1〜D4が、音像定位位置によって変動してしまう。つまり、音像定位位置が変わるたびに、ミキシング比算出部113によって算出されるミキシング係数が変動し、安定しない。
そこで、本実施の形態では、収音装置101は、スピーカから出力される音の音像定位位置が変化した場合にも、安定してミキシング係数を算出することを実現する。以下、そのような収音装置101の各構成要素について説明する。
定位判定部122は、スピーカから音を出力させるためのスピーカ信号から音像定位位置を判定する。本実施の形態では、定位判定部122は、音像定位位置とスピーカとの相対的な位置関係を示す、左定位、右定位、及び中央定位のいずれかを音像定位位置として判定する。
具体的には、定位判定部122は、第1及び第2のスピーカ106a、106bから再生される音の音像定位位置が話者102a、102bから見て左側(第1及び第2のスピーカ106a、106bから見て右側)になる場合は、Lch定位(左定位)と判定し、dir_flg=0と設定する。また、定位判定部122は、音像定位位置が話者102a、102bから見て中央(第1及び第2のスピーカ106a、106bから見て中央)になる場合は、Cch定位(中央定位)と判定し、dir_flg=1と設定する。また、定位判定部122は、音像定位位置が話者102a、102bから見て右側(第1及び第2のスピーカ106a、106bから見て左側)になる場合は、Rch定位(右定位)と判定し、dir_flg=2と設定する。
より具体的には、定位判定部122は、例えば、スピーカ信号に含まれるLchスピーカ信号とRchスピーカ信号のうち、Lchスピーカ信号の信号レベルがRchスピーカ信号の信号レベルより閾値以上大きい場合、Lch定位と判定する。また例えば、定位判定部122は、Rchスピーカ信号の信号レベルがLchスピーカ信号の信号レベルより閾値以上大きい場合、Rch定位と判定する。また例えば、定位判定部122は、Rchスピーカ信号の信号レベルとLchスピーカ信号の信号レベルとの差が閾値未満である場合、Cch定位と判定する。
レベル算出部112は、この音の音像定位位置の判定結果dir_flgに応じて、信号レベルを算出する。すなわち、定位判定部122によって判定された音像定位位置に応じて、Lchレベル算出部112a、Cchレベル算出部112b、及びRchレベル算出部112cのいずれかが信号レベルを算出する。
具体的には、Lch定位と判定された場合は、Lchレベル算出部112aのみが信号パワーを更新する。Cch定位と判定された場合は、Cchレベル算出部112bのみが信号パワーを更新する。Rch定位と判定された場合は、Rchレベル算出部112cのみが信号パワーを更新する。
ミキシング比算出部113は、定位判定部122によって判定された音像定位位置ごとに、ミキシング係数を算出する。
具体的には、ミキシング比算出部113は、Lchレベル算出部112aが算出する各信号パワーに基づいて、式(6)を用いて、Lch定位におけるLchミキシング係数A11a(t)〜A14a(t)及びRchミキシング係数A21a(t)〜A24a(t)を算出する。同様に、ミキシング比算出部113は、Cchレベル算出部112bが算出する各信号パワーに基づいて、式(6)を用いて、Cch定位におけるLchミキシング係数A11b(t)〜A14b(t)及びRchミキシング係数A21b(t)〜A24b(t)を算出する。同様に、ミキシング比算出部113は、Rchレベル算出部112cが算出する各信号パワーに基づいて、式(6)を用いて、Rch定位におけるRchミキシング係数A11c(t)〜A14c(t)及びLchミキシング係数A21c(t)〜A24c(t)を算出する。
そして、ミキシング比算出部113は、式(10)に示すように、Lch定位、Cch定位、及びRch定位における、Lchミキシング係数の平均値とRchミキシング係数の平均値とを求めることにより、Lchミキシング係数A11(t)〜A14(t)及びRchミキシング係数A21(t)〜A24(t)を算出する。
つまり、信号合成部115は、音像定位位置ごとのミキシング係数の平均値を用いて、第1〜第4の収音ユニット110a〜110dの出力信号を合成する。
Figure 2011010426
なお、ミキシング比算出部113は、Lch及びRchの一方のミキシング係数を算出しておき、その結果を用いて他方のミキシング係数を式(2)の関係に基づいて算出してもよい。
以上のように、本実施の形態に係る収音装置101によれば、第1及び第2のスピーカ106a、106bの再生音の音像定位位置が変動することによってミキシング係数が変動することを抑制することができ、安定してステレオ収音することが可能となる。
なお、本実施の形態に係るレベル算出部112は、Lchレベル算出部112a、Cchレベル算出部112b、及びRchレベル算出部112cを備えていたが、必ずしもこれらを備える必要はない。例えば、図9Bに示すように、収音装置101は、実施の形態1などと同様のレベル算出部112を備えてもよい。その場合、ミキシング比算出部113は、定位判定部122の判定結果に基づいて、音像定位位置ごとにミキシング係数を算出すればよい。これにより、図9Bに示す収音装置101であっても、図9Aに示す収音装置101と同様の効果を奏することができる。
(実施の形態5)
次に、図10〜図12を参照して、本発明の実施の形態5に係る収音装置について説明する。
図10は、本発明の実施の形態5に係る収音装置101の機能構成を示すブロック図である。図10に示す収音装置101は、図3などに示す収音装置101に入れ代わるように配置される。
また、図10に示す収音装置101は、図9Aに示す実施の形態4に係る収音装置101に対して、更新部117、移動判定部114及び補正部121が新たに追加された点のみが異なる。なお、移動判定部114は、実施の形態3で説明したものと同様であるので、詳細な説明を省略する。以下、実施の形態1〜4と異なる点を中心に説明する。
Lchレベル算出部112a、Cchレベル算出部112b及びRchレベル算出部112cでは、定位判定部122の判定結果に応じて信号パワーを算出するか否かが決定される。このため、マイクロホン110が動いた場合、Lchレベル算出部112a、Cchレベル算出部112b及びRchレベル算出部112cのうち、いずれか1つまたは2つにおいて、信号パワーがしばらく算出されない可能性がある。その結果、式(10)における一部の係数は、しばらくの間、マイクロホン110が動く前に算出された係数となる可能性がある。
そのような状況において、ミキシング比算出部113が、式(10)に従ってミキシング係数を算出した場合、マイクロホン110が動く前の指向性と動いた後の指向性とが合成されることとなり、正しい指向性を形成することができない。
そこで、補正部121は、移動判定部114の判定結果と、定位判定部122の判定結果とに基づいて、信号パワーを補正する。具体的には、マイクロホン110が動いたと判定された場合、補正部121は、当該判定後に更新されていない信号パワーを補正する。なお、このとき、補正部121は、当該判定後にすでに更新された信号パワーを補正しない。
図11は、本発明の実施の形態5に係る補正部121の機能構成を示すブロック図である。図11に示すように、補正部121は、選択制御部125と、Lch補正選択部126a、Cch補正選択部126b及びRch補正選択部126cとを備える。
補正部121は、マイクロホン110が動いた後に、(1)Lchレベル算出部112aのみが信号パワーを算出した場合、(2)Cchレベル算出部112bのみが信号パワーを算出した場合、または(3)Rchレベル算出部112cのみが信号パワーを算出した場合に、以下のように信号パワーを補正する。
(1)Cch補正選択部126bは、Cchレベル算出部112bによってマイクロホン110が動く前に算出された信号パワーPx1b(t)〜Px4b(t)を、Lchレベル算出部112aによって算出された信号パワーPx1a(t)〜Px4a(t)に係数α1を乗算した値に補正する。
同様に、Rch補正選択部126cは、Rchレベル算出部112cによってマイクロホン110が動く前に算出された信号パワーPx1c(t)〜Px4c(t)を、Lchレベル算出部112aによって算出された信号パワーPx1a(t)〜Px4a(t)に係数α1を乗算した値に補正する。
(2)Lch補正選択部126aは、Lchレベル算出部112aによってマイクロホン110が動く前に算出された信号パワーPx1a(t)〜Px4a(t)を、Cchレベル算出部112bによって算出された信号パワーPx1b(t)〜Px4b(t)に係数α2を乗算した値に補正する。
同様に、Rch補正選択部126cは、Rchレベル算出部112cによってマイクロホン110が動く前に算出された信号パワーPx1c(t)〜Px4c(t)を、Cchレベル算出部112bによって算出された信号パワーPx1b(t)〜Px4b(t)に係数α2を乗算した値に補正する。
(3)Lch補正選択部126aは、Lchレベル算出部112aによってマイクロホン110が動く前に算出された信号パワーPx1a(t)〜Px4a(t)を、Rchレベル算出部112cによって算出された信号パワーPx1c(t)〜Px4c(t)に係数α3を乗算した値に補正する。
同様に、Cch補正選択部126bは、Cchレベル算出部112bによってマイクロホン110が動く前に算出された信号パワーPx1b(t)〜Px4b(t)を、Rchレベル算出部112cによって算出された信号パワーPx1c(t)〜Px4c(t)に係数α3を乗算した値に補正する。
次に、係数α1、α2、α3について説明する。
選択制御部125は、移動判定部114の判定結果であるmove_flgが0→1に変化したとき(固定状態から移動状態へ変わったとき)に、α1=1、α2=1、α3=1と設定する。
ただし、選択制御部125は、定位判定部122の判定結果がdir_flg=0(Lch定位)のときは、α1=0に変更する。また、選択制御部125は、定位判定部122の判定結果がdir_flg=1(Cch定位)のときは、α2=0に変更する。また、選択制御部125は、定位判定部122の判定結果がdir_flg=2(Rch定位)のときは、α3=0に変更する。
次に、係数α1、α2、α3を設定するときの選択制御部125の動作の詳細を、図12を用いて説明する。
図12は、本発明の実施の形態5に係る選択制御部125の動作を示すフローチャートである。
まず、選択制御部125は、移動判定部114によって、マイクロホン110が動いていないと判定された状態からマイクロホン110が動いたと判定された状態に変化したか否かを判定する(S201)。ここで、マイクロホン110の状態が変化したと判定された場合(S201のYes)、選択制御部125は、係数α1、α2、α3に「1」を設定する(S202)。
一方、マイクロホン110の状態が変化していないと判定された場合(S201のNo)、またはステップS202において係数α1、α2、α3に「1」が設定された後、選択制御部125は、定位判定部122によって判定された音像定位位置を取得する(S203)。
ここで、取得した音像定位位置がLch定位(dir_flg=0)である場合(S203のLch定位)、選択制御部125は、係数α1に「0」を設定する(S204)。また、取得した音像定位位置がCch定位(dir_flg=1)である場合(S203のCch定位)、選択制御部125は、係数α2に「0」を設定する(S205)。また、取得した音像定位位置がRch定位(dir_flg=2)である場合(S203のRch定位)、選択制御部125は、係数α3に「0」を設定する(S206)。
以上のように、本実施の形態に係る収音装置101によれば、マイクロホン110が動いた後も速やかに、Lchレベル算出部112a、Cchレベル算出部112b及びRchレベル算出部112cの信号パワーが更新される。つまり、マイクロホン110が動いた後に信号レベルがまだ更新されていない音像定位位置がある場合でも、マイクロホン110が動いた後におけるミキシング係数を高精度に算出することができる。その結果、収音装置101は、より安定したステレオ収音を実現できる。
なお、補正部121において、更新されない信号パワーにおいて、信号の置き換えではなくリセットする等の動作に代用してもよい。
また、本実施の形態に係る収音装置101は、補正部121を備えていたが、必ずしも補正部121を備える必要はない。また、本実施の形態に係るレベル算出部112は、Lchレベル算出部112a、Cchレベル算出部112b、及びRchレベル算出部112cを備えていたが、必ずしもそれらの処理部を備える必要はない。例えば、収音装置101は、図13に示すような機能構成であってもよい。
この場合、ミキシング比算出部113は、マイクロホン110が動いたと判定された場合、マイクロホン110が動いたと判定された後に信号レベルが算出された音像定位位置の信号レベルを用いて、マイクロホン110が動いたと判定された後に信号レベルが算出されていない音像定位位置のミキシング係数を算出すればよい。具体的には、ミキシング比算出部113は、例えば、マイクロホン110が動いたと判定された後にLch定位の信号レベルのみが算出されている場合、当該Lch定位の信号レベルを用いて、Cch定位のミキシング係数とRch定位のミキシング係数とを算出すればよい。
これにより、図13に示す収音装置101であっても、図10に示す収音装置101と同様の効果を奏することができる。
以上、本発明の一態様に係る収音装置101について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したもの、あるいは異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。
例えば、各収音ユニットは、上記実施の形態とは異なるように配置されてもよい。例えば、図14Aに示すように、第1〜第4の収音ユニット110a〜110dは、円周上ではなく、楕円周上に90度ごと異なる位置に並べられてもよい。また、図14Bに示すように、第1〜第4の収音ユニット110a〜110dは、指向性の主軸方向が円の中心から内側へ向いて90度ごと異なるように配置されてもよい。また、図14Cに示すように、第1〜第4の収音ユニット110a〜110dは、直線上に並ぶように配置されてもよい。このような場合であっても、収音装置101は、上記実施の形態に係る収音装置101と同様の効果を奏することができる。
また、図14Dに示すように、マイクロホン110は、第1〜第5の収音ユニット110a〜110eを備えてもよい。図14Dでは、第1〜第5の収音ユニット110a〜110eは、指向性の主軸方向が互いに72度ごと異なるように配置されている。実施の形態1と同様にミキシング係数が算出されれば、信号合成部115によって生成されるステレオ信号は、互いに144度異なる2つの収音方向でステレオ収音された信号となる。
したがって、上記実施の形態に係る収音装置101ほど効率的ではないが、図14Dに示すマイクロホン110を備える収音装置101であっても、マイクロホン110の周囲に位置する音源からの音をある程度明瞭にステレオ収音することができる。なお、マイクロホン110は、さらに多くの収音ユニットを備えてもよい。
また、上記実施の形態において、収音システムは、モニター104及びカメラ105を備えていたが、必ずしもモニター104及びカメラ105を備える必要はない。収音システムがモニター104及びカメラ105を備えない場合、収音装置101は、映像と音像とを一致させることはできないが、マイクロホン110の周囲に位置する音源からの音を明瞭にステレオ収音することはできる。例えば、電話会議システムなどの音声会議システムにおいて、収音装置101は、音源の位置に応じた位置に音像を定位させることができるステレオ信号を生成でき、音の明瞭性を向上させることができる。
また、上記実施の形態において、ミキシング比算出部113は、4つの収音ユニットのそれぞれにおいて、当該収音ユニットの隣に位置する収音ユニットの信号レベルを用いてミキシング係数を算出していたが、必ずしもこのようにミキシング係数を算出する必要はない。例えば、ミキシング比算出部113は、テーブルを参照して、各収音ユニットの信号レベルに対応するミキシング係数を算出してもよい。この場合、収音装置101は、例えば、各収音ユニットの信号レベルの比に対応付けてミキシング係数を格納しているテーブルを記憶している記憶部を備えればよい。このような場合であっても、マイクロホンの位置を測定することなく、音源からの音を明瞭にステレオ収音することができる。
また、上記実施の形態において、収音装置101は、通信相手拠点の収音システムから送信されてきた受話信号を利用して、ミキシング比を算出していたが、必ずしも受話信号を利用する必要はない。例えば、収音装置101が、ミキシング係数を算出するためのスピーカ信号を生成してもよい。この場合、スピーカ信号は、受話信号が再生された音に干渉しない周波数の音を再生するための信号であることが好ましい。これにより、収音装置101は、会議等を中断することなく、ミキシング係数を算出することができる。
また、上記実施の形態において、スピーカは2つであったが、その他の個数であってもよい。
また、上記実施の形態において、収音装置101は、図3などに示す各構成要素を備えていたが、必ずしも図3などに示す構成要素のすべてを備える必要はない。例えば、収音装置101は、図15に示すように、図3に示す構成要素の一部のみを備えてもよい。
図15は、本発明の実施の形態の変形例に係る収音装置101の機能構成を示すブロック図である。図15では、収音装置101は、マイクロホン110と、レベル算出部112と、ミキシング比算出部113と、信号合成部115とを備える。
収音装置101が図15に示すような構成であったとしても、レベル算出部112が、スピーカから出力された音の信号レベルを算出することにより、実施の形態1に係る収音装置101と同様の効果を奏することができる。
また、以下のような場合も、本発明の範囲内に含まれる。
(1)上記の各装置は、具体的には、マイクロプロセッサ、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。
(2)上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。例えば、図15に示すように、システムLSI150は、レベル算出部112と、ミキシング比算出部113と、信号合成部115とを備える。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。
(3)上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。
(4)本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray Disc(登録商標))、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。
また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記デジタル信号を前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。
(5)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
本発明の一態様に係る収音装置は、マイクロホンの周囲に位置する音源からの音を明瞭にステレオ収音することができる収音装置として、特に、テレビ会議システム、音声会議システム等として有用である。
100 第1の収音システム
101、201 収音装置
102a、102b 話者
103 テーブル
104、204 モニター
105、205 カメラ
106a、106b、206a、206b スピーカ
107 通信網
110 マイクロホン
110a、110b、110c、110d 収音ユニット
111 帯域抽出部
112 レベル算出部
112a Lchレベル算出部
112b Cchレベル算出部
112c Rchレベル算出部
113 ミキシング比算出部
114 移動判定部
115 信号合成部
116 スピーカ信号検出部
117 更新部
121 補正部
122 定位判定部
123 変動量検出部
124 変動量判定部
125 選択制御部
126a Lch補正選択部
126b Cch補正選択部
126c Rch補正選択部
150 システムLSI
200 第2の収音システム

Claims (15)

  1. 指向性の主軸方向が互いに異なるように配置された4以上の収音ユニットを備え、スピーカから出力された音を収音可能な位置に設置されるマイクロホンと、
    前記4以上の収音ユニットの出力信号ごとに、前記スピーカから出力された音の信号レベルを算出するレベル算出部と、
    前記レベル算出部によって算出された信号レベルを用いて、前記4以上の収音ユニットの指向性の主軸方向に適応するミキシング係数を算出するミキシング係数算出部と、
    前記ミキシング係数算出部によって算出されたミキシング係数を用いて、前記4以上の収音ユニットの出力信号を合成することにより、ステレオ信号を生成する信号合成部とを備える
    収音装置。
  2. 前記4以上の収音ユニットは、指向性の主軸方向が90度ごと異なるように配置された4つの収音ユニットである
    請求項1に記載の収音装置。
  3. 前記ミキシング係数算出部は、前記ステレオ信号が、互いに180度異なる2つの収音方向でステレオ収音された信号となるように、前記ミキシング係数を算出する
    請求項2に記載の収音装置。
  4. 前記ミキシング係数は、前記ステレオ信号の一方を生成するための第1のミキシング係数と、前記ステレオ信号の他方を生成するための第2のミキシング係数とからなり、
    前記ミキシング係数算出部は、前記4つの収音ユニットのそれぞれにおいて、当該収音ユニットの一方の隣に位置する収音ユニットの信号レベルを用いて第1のミキシング係数を算出し、当該収音ユニットの他方の隣に位置する収音ユニットの信号レベルを用いて第2のミキシング係数を算出し、
    前記信号合成部は、前記4つの収音ユニットの出力信号に前記第1のミキシング係数のそれぞれを乗じて加算することにより前記ステレオ信号の一方を生成し、前記4つの収音ユニットの出力信号に前記第2のミキシング係数のそれぞれを乗じて加算することにより前記ステレオ信号の他方を生成する
    請求項3に記載の収音装置。
  5. さらに、
    前記スピーカから音を出力させるためのスピーカ信号の有無を判定するスピーカ信号検出部を備え、
    前記レベル算出部は、前記スピーカ信号検出部によってスピーカ信号が有ると判定された場合に前記信号レベルを算出する
    請求項1に記載の収音装置。
  6. さらに、
    前記マイクロホンが動いたか否かを判定する移動判定部を備え、
    前記ミキシング係数算出部は、前記マイクロホンが動いたと判定された場合に、前記マイクロホンが動いていないと判定される場合よりも、前記ミキシング係数を算出する頻度を高くする
    請求項1に記載の収音装置。
  7. 前記移動判定部は、前記ミキシング係数算出部によって算出されたミキシング係数の変化度合いに基づいて、前記マイクロホンが動いたか否かを判定する
    請求項6に記載の収音装置。
  8. さらに、
    前記スピーカから音を出力させるためのスピーカ信号から音像定位位置を判定する定位判定部を備え、
    前記ミキシング係数算出部は、前記定位判定部によって判定された音像定位位置ごとに前記ミキシング係数を算出し、
    前記信号合成部は、前記ミキシング係数算出部によって算出された前記音像定位位置ごとのミキシング係数の平均値を用いて、前記4以上の収音ユニットの出力信号を合成する
    請求項1に記載の収音装置。
  9. 前記定位判定部は、それぞれが音像定位位置と前記スピーカとの相対的な位置関係を示す左定位、右定位、及び中央定位のいずれかを前記音像定位位置として判定し、
    前記レベル算出部は、
    前記定位判定部によって左定位と判定された場合に、前記信号レベルを算出するLchレベル算出部と、
    前記定位判定部によって右定位と判定された場合に、前記信号レベルを算出するRchレベル算出部と、
    前記定位判定部によって中央定位と判定された場合に、前記信号レベルを算出するCchレベル算出部とを備える
    請求項8に記載の収音装置。
  10. さらに、
    前記マイクロホンが動いたか否かを判定する移動判定部を備え、
    前記ミキシング係数算出部は、前記マイクロホンが動いたと判定された場合、前記マイクロホンが動いたと判定された後に信号レベルが算出された音像定位位置の信号レベルを用いて、前記マイクロホンが動いたと判定された後に信号レベルが算出されていない音像定位位置のミキシング係数を算出する
    請求項8に記載の収音装置。
  11. さらに、
    前記4以上の収音ユニットの出力信号のそれぞれから、所定の周波数帯域の信号を抽出する帯域抽出部を備え、
    前記レベル算出部は、前記帯域抽出部によって抽出された信号を用いて、前記信号レベルを算出する
    請求項1に記載の収音装置。
  12. 前記所定の周波数帯域は、音声帯域である
    請求項11に記載の収音装置。
  13. 指向性の主軸方向が互いに異なるように配置された4以上の収音ユニットを備え、スピーカから出力された音を収音可能な位置に設置されるマイクロホンを用いて、ステレオ信号を生成する収音方法であって、
    前記4以上の収音ユニットの出力信号ごとに、前記スピーカから出力された音の信号レベルを算出するレベル算出ステップと、
    算出された信号レベルを用いて、前記4以上の収音ユニットの指向性の主軸方向に適応するミキシング係数を算出するミキシング係数算出ステップと、
    算出されたミキシング係数を用いて、前記4以上の収音ユニットの出力信号を合成することにより、ステレオ信号を生成する信号合成ステップとを含む
    収音方法。
  14. 請求項13に記載の収音方法をコンピュータに実行させるためのプログラム。
  15. 指向性の主軸方向が互いに異なるように配置された4以上の収音ユニットを備え、スピーカから出力された音を収音可能な位置に設置されるマイクロホンを用いて、ステレオ信号を生成する集積回路であって、
    前記4以上の収音ユニットの出力信号ごとに、前記スピーカから出力された音の信号レベルを算出するレベル算出部と、
    前記レベル算出部によって算出された信号レベルを用いて、前記4以上の収音ユニットの指向性の主軸方向に適応するミキシング係数を算出するミキシング係数算出部と、
    前記ミキシング係数算出部によって算出されたミキシング係数を用いて、前記4以上の収音ユニットの出力信号を合成することにより、ステレオ信号を生成する信号合成部とを備える
    集積回路。
JP2011506520A 2009-07-24 2010-06-23 収音装置及び収音方法 Expired - Fee Related JP5443469B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011506520A JP5443469B2 (ja) 2009-07-24 2010-06-23 収音装置及び収音方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009173734 2009-07-24
JP2009173734 2009-07-24
JP2011506520A JP5443469B2 (ja) 2009-07-24 2010-06-23 収音装置及び収音方法
PCT/JP2010/004170 WO2011010426A1 (ja) 2009-07-24 2010-06-23 収音装置及び収音方法

Publications (2)

Publication Number Publication Date
JPWO2011010426A1 true JPWO2011010426A1 (ja) 2012-12-27
JP5443469B2 JP5443469B2 (ja) 2014-03-19

Family

ID=43498907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011506520A Expired - Fee Related JP5443469B2 (ja) 2009-07-24 2010-06-23 収音装置及び収音方法

Country Status (4)

Country Link
US (1) US8767971B2 (ja)
JP (1) JP5443469B2 (ja)
CN (1) CN102144406B (ja)
WO (1) WO2011010426A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103596116B (zh) * 2012-08-15 2015-06-03 华平信息技术股份有限公司 一种视频会议系统中自动调节实现立体声效果的方法
US9148724B2 (en) * 2013-01-21 2015-09-29 Revolabs, Inc. Audio system signal processing control using microphone movement information
US10075795B2 (en) 2013-04-19 2018-09-11 Electronics And Telecommunications Research Institute Apparatus and method for processing multi-channel audio signal
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
US9781539B2 (en) * 2013-10-09 2017-10-03 Sony Corporation Encoding device and method, decoding device and method, and program
US9271069B2 (en) * 2014-01-27 2016-02-23 Revolabs, Inc Microphone housing arrangement for an audio conference system
KR102232045B1 (ko) 2019-01-08 2021-03-25 삼성전자주식회사 전자 장치, 전자 장치의 제어 방법 및 컴퓨터 판독 가능 매체.
US11494160B1 (en) * 2020-06-30 2022-11-08 Apple Inc. Methods and systems for manipulating audio properties of objects
CN115734115A (zh) * 2022-12-28 2023-03-03 深圳市亚昱科技有限公司 一种话筒的拾音方法、装置及话筒

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5664021A (en) * 1993-10-05 1997-09-02 Picturetel Corporation Microphone system for teleconferencing system
JPH09182044A (ja) 1995-12-25 1997-07-11 Matsushita Electric Ind Co Ltd テレビ会議装置
JP2005322953A (ja) * 2004-05-06 2005-11-17 Sony Corp マイクロホン
JP2006303839A (ja) * 2005-04-20 2006-11-02 Sony Corp マイクロホン
US8135143B2 (en) * 2005-11-15 2012-03-13 Yamaha Corporation Remote conference apparatus and sound emitting/collecting apparatus
JP4929685B2 (ja) 2005-11-15 2012-05-09 ヤマハ株式会社 遠隔会議装置
JP4345784B2 (ja) * 2006-08-21 2009-10-14 ソニー株式会社 音響収音装置及び音響収音方法
US8111838B2 (en) * 2007-02-28 2012-02-07 Panasonic Corporation Conferencing apparatus for echo cancellation using a microphone arrangement
US8238569B2 (en) * 2007-10-12 2012-08-07 Samsung Electronics Co., Ltd. Method, medium, and apparatus for extracting target sound from mixed sound
EP2242286B1 (en) * 2007-12-10 2015-08-05 Panasonic Intellectual Property Management Co., Ltd. Sound collecting device, sound collecting method, sound collecting program, and integrated circuit

Also Published As

Publication number Publication date
CN102144406A (zh) 2011-08-03
CN102144406B (zh) 2014-10-08
WO2011010426A1 (ja) 2011-01-27
JP5443469B2 (ja) 2014-03-19
US8767971B2 (en) 2014-07-01
US20110158416A1 (en) 2011-06-30

Similar Documents

Publication Publication Date Title
JP5443469B2 (ja) 収音装置及び収音方法
US11838707B2 (en) Capturing sound
US9913022B2 (en) System and method of improving voice quality in a wireless headset with untethered earbuds of a mobile device
CN108369811B (zh) 分布式音频捕获和混合
JP7082126B2 (ja) デバイス内の非対称配列の複数のマイクからの空間メタデータの分析
US9131298B2 (en) Constrained dynamic amplitude panning in collaborative sound systems
US8831231B2 (en) Audio signal processing device and audio signal processing method
US10834517B2 (en) Audio recording and playback apparatus
US20150030159A1 (en) Audio processing apparatus
WO2015163031A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP2020500480A5 (ja)
US11284211B2 (en) Determination of targeted spatial audio parameters and associated spatial audio playback
US10354651B1 (en) Head-mounted device control based on wearer information and user inputs
JP6596896B2 (ja) 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置
JP6141530B2 (ja) 方向依存処理のためのオーディオ処理器
EP2904817A1 (en) An apparatus and method for reproducing recorded audio with correct spatial directionality
CN108141665A (zh) 信号处理装置、信号处理方法和程序
US11665499B2 (en) Location based audio signal message processing
JP2007235334A (ja) オーディオ装置及び指向音生成方法
US11159905B2 (en) Signal processing apparatus and method
US8422690B2 (en) Audio reproduction apparatus and control method for the same
TWI757763B (zh) 電子裝置及其雙聲道音場平衡方法
CN115698936A (zh) 补充内容
JP2016208285A (ja) 音声無線伝送システム、およびソース機器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131219

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5443469

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees