JP4894353B2 - 放収音装置 - Google Patents

放収音装置 Download PDF

Info

Publication number
JP4894353B2
JP4894353B2 JP2006147228A JP2006147228A JP4894353B2 JP 4894353 B2 JP4894353 B2 JP 4894353B2 JP 2006147228 A JP2006147228 A JP 2006147228A JP 2006147228 A JP2006147228 A JP 2006147228A JP 4894353 B2 JP4894353 B2 JP 4894353B2
Authority
JP
Japan
Prior art keywords
sound
signal
collected
beam signal
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006147228A
Other languages
English (en)
Other versions
JP2007318550A (ja
Inventor
利晃 石橋
田中  良
訓史 鵜飼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2006147228A priority Critical patent/JP4894353B2/ja
Priority to PCT/JP2007/060639 priority patent/WO2007138985A1/ja
Priority to CN2007800194698A priority patent/CN101455094B/zh
Priority to EP07744073A priority patent/EP2040485A4/en
Priority to CA002653598A priority patent/CA2653598A1/en
Priority to US12/302,653 priority patent/US8300839B2/en
Publication of JP2007318550A publication Critical patent/JP2007318550A/ja
Application granted granted Critical
Publication of JP4894353B2 publication Critical patent/JP4894353B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/403Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/403Linear arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/405Non-uniform arrays of transducers or a plurality of uniform arrays with different transducer spacing

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

この発明は、ネットワーク等を介して複数の地点間で行う音声会議等に用いる放収音装置、特にマイクとスピーカとが比較的近い位置に配置された放収音装置に関するものである。
従来、遠隔地間で音声会議を行う方法として、音声会議を行う地点毎に放収音装置を設置して、これら装置をネットワークで接続し、音声信号を通信する方法が多く用いられている。そして、放収音装置では、相手装置側の音声を放音するスピーカと、自装置側の音声を収音するマイクロホンとが1つの筐体に同時に設置されたものが多い。
例えば、特許文献1の音声会議装置(放収音装置)は、ネットワークを介して入力される音声信号を天面に配置されたスピーカから放音し、側面に配置された異なる複数方向をそれぞれの正面方向とする各マイク音声信号を収音し、ネットワークを介して収音信号を外部に送信する。
特開平8−298696号公報
しかしながら、特許文献1の装置では、マイクとスピーカとが近接することで、各マイクの収音信号にスピーカからの回り込み音声が多く含まれる。そして、この回り込み音声の音量が比較的大きく、発話者からの発声音の音量が相対的に小さい場合には、発話者方位を正確に検出して、当該方位からの収音を正確に行うことができない。
したがって、この発明の目的は、回り込み音声に影響されずに発話者方位を検出し、当該発話者からの音声を確実に収音・出力することができる放収音装置を提供することにある。
の発明の放収音装置は、所定基準面に対して対称となる音圧で入力音声信号を放音するスピーカを備えた放音手段と、所定基準面の一方側の音声を収音する第1マイク群および他方側の音声を収音する第2マイク群とからなる収音手段と、第1マイク群の収音信号に遅延・振幅処理を行うことで得られる第1収音ビーム信号群の各収音ビーム信号と、第2マイク群の収音信号に遅延・振幅処理を行うことで得られる第2収音ビーム信号群の各収音ビーム信号とを所定基準面に対して対称に生成する収音ビーム信号生成手段と、各タイミングで基準面に対称な収音ビーム信号同士のエネルギー比を算出して、当該エネルギー比が所定の基準レベル範囲内にない収音ビーム信号の組合せを検出し、エネルギー比が基準レベル範囲よりも高いか低いかにより、組合せを構成する二本の収音ビーム信号から一本の収音ビーム信号を選択する収音ビーム信号選択手段と、を備えたことを特徴としている。
この構成では、収音ビーム信号選択手段は、基準面に対して対称位置にある収音ビーム信号同士のエネルギー比を算出する。ここで、基準面に対して発話者側にあり且つ発話者方位に対応する収音ビーム信号の信号エネルギーは高くなり、これに対称な収音ビーム信号のエネルギーは殆ど変化しない。従って、この組合せによるエネルギー比は変化する。また、発話者方位に対応しない収音ビーム信号の信号エネルギーは殆ど変化しないので、他の組合せによるエネルギー比は変化しない。これにより、発声音の到来方位に対応する収音ビーム信号を含む組合せのエネルギー比のみが高くなる。収音ビーム信号選択手段は、組合せのエネルギー比の平均値を基準にして所定閾値を予め設定しておき、当該閾値を超える信号エネルギー比の絶対値レベルを有する収音ビーム信号の組合せが検出されれば、当該組合せを選択する。そして、収音ビーム信号選択手段は、検出された組合せの信号エネルギーが、平均値よりも高いか低いかによりいずれか一方の収音ビーム信号を選択する。すなわち、エネルギー比の算出時に、基準側とした収音ビーム信号の信号エネルギーが大きければエネルギー比が小さくなる方向に変化し、基準側とした収音ビーム信号の信号エネルギーが小さければエネルギー比が大きくなる方向に変化することを利用して、収音ビーム信号を選択する。
また、この発明の放収音装置は、所定基準面に対して対称となる音圧で入力音声信号を放音するスピーカを備えた放音手段と、所定基準面の一方側に対してそれぞれ異なる方位に指向性を有する複数のマイクを備え、各マイクからの出力信号を収音ビーム信号とする第1マイク群、および他方側に対してそれぞれ異なる方位に指向性を有する複数のマイクを備え、各マイクからの出力信号を収音ビーム信号とする第2マイク群を備え、第1マイク群で得られる収音ビーム信号と第2マイク群で得られる収音ビーム信号とが基準面に対して対称に設定された収音手段と、各タイミングで基準面に対称な収音ビーム信号同士のエネルギー比を算出して、当該エネルギー比が所定の基準レベル範囲内にない収音ビーム信号の組合せを検出し、エネルギー比が前記基準レベル範囲よりも高いか低いかにより、組合せを構成する二本の収音ビーム信号から一本の収音ビーム信号を選択する収音ビーム信号選択手段と、を備えたことを特徴としている。
この構成では、収音ビーム信号を用いることなく、各マイクに指向性を持たせることで、マイク出力から直接に収音ビーム信号を生成する。この際、第1マイク群のマイクの指向性で形成される収音ビーム群と第2マイク群のマイクの指向性で形成される収音ビーム群とを、基準面に対して対称に設定する。これにより、前述のように収音ビーム信号選択手段により収音ビームが選択される。
また、この発明の放収音装置は、収音ビーム信号選択手段で、エネルギー比をデシベル単位に換算して、該デシベル単位に換算された値に基づいて収音ビーム信号を選択することを特徴としている。
この構成では、デシベル単位を利用することで、わずかな信号エネルギー比の変化でも、顕著に表される。これにより、信号エネルギー比による収音ビーム信号および対称位置にある収音ビーム信号の組合せの検出が、より正確に行われる。
この発明によれば、回り込み音声のレベルに影響されることなく、発話者等の音源方位を正確に検出して、当該方位からの音声を確実に収音して出力することができる。
本発明の第1の実施形態に係る放収音装置について図を参照して説明する。
図1(A)は本実施形態に係る放収音装置1のマイク、スピーカ配置を示す平面図であり、図1(B)は図1(A)に示す放収音装置1により形成される収音ビーム領域を示す図である。
図2は本実施形態の放収音装置1の機能ブロック図である。
本実施形態の放収音装置1は、筐体101に、複数のスピーカSP1〜SP3、複数のマイクMIC11〜MIC17,MIC21〜MIC27、図2に示す機能部を備えて成る。
筐体101は一方向に長尺な略直方体形状からなり、筐体101の長尺な辺(面)の両端部には、筐体101の下面を設置面から所定間隔離間する所定高さの脚部(図示せず)が設置されている。なお、以下の説明では、筐体101の四側面のうち、長尺な面を長尺面、短尺な面を短尺面と称する。
筐体101の下面には、同形状からなる無指向性の単体スピーカSP1〜SP3が設置されている。これら単体スピーカSP1〜SP3は長尺方向に沿って一定の間隔で直線状に設置されており、且つ、各単体スピーカSP1〜SP3の中心を結ぶ直線は、筐体101の長尺面に沿い、短尺面の中心間を結ぶ中心軸100に対して水平方向位置が一致するように設置されている。すなわち、中心軸100を含む垂直な基準面にスピーカSP1〜SP3の中心を結ぶ直線が配置される。このように、単体スピーカSP1〜SP3を配列設置することでスピーカアレイSPA10が構成される。このような状態では、スピーカアレイSPA10の各単体スピーカSP1〜SP3から音声を放音すると、放音音声は二つの長尺面に同等に伝わる。この際、二つの対向する長尺面に伝搬する放音音声は、前記基準面に対して直交する互いに対称な方向へ進行する。
筐体101の一方の長尺面には、同スペックのマイクMIC11〜MIC17が設置されている。これらマイクMIC11〜MIC17は長尺方向に沿って一定の間隔で直線状に設置されており、これによりマイクアレイMA10が構成される。また、筐体101の他方の長尺面にも、同スペックのマイクMIC21〜MIC27が設置されている。これらマイクMIC21〜MIC27も長尺方向に沿って一定の間隔で直線状に設置されており、これにより、マイクアレイMA20が構成される。マイクアレイMA10とマイクアレイMA20とはその配列軸の垂直位置が一致するように配置されており、さらに、マイクアレイMA10の各マイクMIC11〜MIC17と、マイクアレイMA20の各マイクMIC21〜MIC27とは、それぞれ前記基準面に対して対称な位置に配置されている。具体的に、例えば、マイクMIC11とマイクMIC21とが基準面に対して対称の関係にあり、同様にマイクMIC17とマイクMIC27とが対称の関係にある。
なお、本実施形態では、スピーカアレイSPA10のスピーカ数を3本とし、各マイクアレイMA10,MA20のマイク数をそれぞれ7本としたが、これに限ることなく、仕様に応じてスピーカ数およびマイク数は適宜設定すればよい。また、スピーカアレイの各スピーカ間隔およびマイクアレイの各マイク間隔は一定ではなくてもよく、例えば、長尺方向に沿って中央部で密に配置され、両端部に向かうに従って疎に配置されるような態様でもよい。
次に、図2に示すように、本実施形態の放収音装置1は、機能的に、入出力コネクタ11、入出力I/F12、放音指向性制御部13、D/Aコンバータ14、放音用アンプ15、前述のスピーカアレイSPA10(スピーカSP1〜SP3)、前述のマイクアレイMA10,MA20(マイクMIC11〜MIC17,MIC21〜MIC27)、収音用アンプ16、A/Dコンバータ17、収音ビーム生成部181,182、収音ビーム選択部19、および、エコーキャンセル部20を備える。
入出力I/F12は、入出力コネクタ11を介して入力された、他の放収音装置からの入力音声信号をネットワークに対応するデータ形式(プロトコル)から変換して、エコーキャンセル部20を介して放音指向性制御部13に与える。また、入出力I/F12は、エコーキャンセル部20で生成される出力音声信号をネットワークに対応するデータ形式(プロトコル)に変換して、入出力コネクタ11を介して、ネットワークに送信する。
放音指向性制御部13は、放音指向性が設定されていなければ、スピーカアレイSPA10の各スピーカSP1〜SP3へ、入力音声信号に基づく放音信号を同時に与える。また、放音指向性制御部13は、仮想点音源の設定等の放音指向性が指定されると、指定された放音指向性に基づいて、スピーカアレイSPA10の各スピーカSP1〜SP3にそれぞれ固有の遅延処理及び振幅処理等を入力音声信号に対して行うことで個別放音信号を生成する。放音指向性制御部13は、これら個別放音信号をスピーカSP1〜SP3毎に設置されたD/Aコンバータ14に出力する。各D/Aコンバータ14は個別放音信号をアナログ形式に変換して各放音用アンプ15に出力し、各放音用アンプ15は個別放音信号を増幅してスピーカSP1〜SP3に与える。
スピーカSP1〜SP3は、与えられた放音信号および個別放音信号を音声変換して外部に放音する。スピーカSP1〜SP3は筐体101の下面に設置されているので、放音された音声は、放収音装置1が設置される机の設置面を反射して、会議者のいる装置の横から斜め上方に向かって伝搬される。また、放音音声の一部は、放収音装置1の底面からマイクアレイMA10,MA20が設置された側面へ回り込む。
マイクアレイMA10,MA20の各マイクMIC11〜MIC17、MIC21〜MIC27は、無指向性であっても有指向性であってもよいが、有指向性であることが望ましく、放収音装置1の外部からの音声を収音して電気変換し、収音信号を各収音用アンプ16に出力する。
この際、このようなスピーカアレイSPA10の構成およびマイクアレイMA10,MA20の構成から、基準面に対して対称位置にあるマイクアレイMA10のマイクMIC1n(n=1〜7)と、マイクアレイMA20のマイクMIC2n(n=1〜7)とで、スピーカアレイSPA10の単体スピーカSP1〜SP3からの回り込み音声が、同等に収音される。
各収音用アンプ16は、収音信号を増幅してそれぞれA/Dコンバータ17に与え、A/Dコンバータ17は、収音信号をデジタル変換して収音ビーム生成部181,182に出力する。収音ビーム生成部181には、一方の長尺面に設置されたマイクアレイMA10の各マイクMIC11〜MIC17での収音信号が入力され、収音ビーム生成部182には、他方の長尺面に設置されたマイクアレイMA20のマイクMIC21〜MIC27での収音信号が入力される。
収音ビーム生成部181は、各マイクMIC11〜MIC17の収音信号に対して所定の遅延処理等を行い、収音ビーム信号MB11〜MB14を生成する。収音ビーム信号MB11〜MB14は、図1(B)に示すように、マイクMIC11〜MIC17が設置された長尺面側で当該長尺面に沿ってそれぞれに異なる所定幅の領域が収音ビーム領域に設定されている。
収音ビーム生成部182は、各マイクMIC21〜MIC27の収音信号に対して所定の遅延処理等を行い、収音ビーム信号MB21〜MB24を生成する。収音ビーム信号MB21〜MB24は、図1(B)に示すように、マイクMIC21〜MIC27が設置された長尺面側で当該長尺面に沿ってそれぞれに異なる所定幅の領域が収音ビーム領域に設定されている。
この際、収音ビーム信号MB11と収音ビーム信号MB21とは、前記中心軸100を有する垂直面(基準面)に対して対称なビームとして形成される。同様に、収音ビーム信号MB12と収音ビーム信号MB22、収音ビーム信号MB13と収音ビーム信号MB23、収音ビーム信号MB14と収音ビーム信号MB24も、前記基準面に対して対称なビームとして形成される。
収音ビーム選択部19は、入力された収音ビーム信号MB11〜MB14、MB21〜MB24から話者音声を主に収音した収音ビーム信号を選択して、収音ビーム信号MBとしてエコーキャンセル部20に出力する。
図3は、収音ビーム選択部19の主要構成を示すブロック図である。
収音ビーム選択部19は、BPF(バンドパスフィルタ)191、全波整流回路192、レベル検出回路193、レベル比算出回路194、レベル比較器195、収音ビーム信号選択回路196を備える。
BPF191は、ビーム特性を主に有する帯域および人の音声の主成分帯域を通過帯域とするバンドパスフィルタであり、収音ビーム信号MB11〜MB14、MB21〜MB24を帯域通過フィルタ処理して、全波整流回路192に出力する。
全波整流回路192は、収音ビーム信号MB11〜MB14、MB21〜MB24を全波整流(絶対値化)する。
レベル検出回路193は、全波整流された収音ビーム信号MB11〜MB14、MB21〜MB24のピーク検出を行い、このピーク値をそのタイミングでの信号レベル(信号エネルギー)とし、それぞれの信号レベルデータE11〜E14,E21〜E24をレベル比算出回路194に出力する。
具体的に、図4(A)〜(C)に示すような状況で放収音が行われ、放音と会議者A,Bの発話とが生じた場合には、各信号レベルデータE11〜E14,E21〜E24は次のようになる。
図4は、本実施形態の放収音装置1を机C上に配置し、二人の会議者A,Bが会議を行っている状況を示した図であり、(A)は会議者Aが発言している状況、(B)は会議者Bが発言している状況、(C)は会議者A,Bともに発言していない状況を示す。
図5は、放音音声の信号レベルデータEsp、各収音ビーム信号の信号レベルデータE11〜E14,E21〜E24の時系列(T)分布を示すものであり、(A)が放音音声の信号レベルデータEsp、(B)〜(E)がそれぞれ収音ビーム信号MB11〜MB14に対応する信号レベルデータE11〜E14、(F)〜(I)がそれぞれ収音ビーム信号MB21〜MB24に対応する信号レベルデータE21〜E24を示す。また、図5(A)において、200は入力音声信号の放音音声成分であり、図5(B)〜(I)において、201は回り込み音声が収音された時に発生する回り込み音声成分である。また、図5(B)〜(I)において、301は会議者Aの発声音が収音された時に発生する収音音声成分であり、302は会議者Bの発声音が収音された時に発生する収音音声成分である。
図5に示すように、放音音声が発生した場合、レベル検出回路193は、各収音ビーム信号MB11〜MB14、MB21〜MB24の信号レベルデータE11〜E14、E21〜E24において、図5(B)〜(I)に示すように回り込み音声成分201を検出する。また、図4(A)、図5(F)に示すように、時刻T1〜T2で会議者Aが発言すると、レベル検出回路193は、収音ビーム信号MB21の信号レベルデータE21において収音音声成分301を検出する。さらに、図4(B)、図5(D)に示すように、時刻T3〜T4で会議者Bが発言すると、レベル検出回路193は、収音ビーム信号MB13の信号レベルデータE13において収音音声成分302を検出する。
しかしながら、図5(D),(F)に示すように、収音音声成分301,302の信号レベルが回り込み音声成分201の信号レベルよりも低い場合がある。この場合、収音音声成分301,302を回り込み音声成分201と区別することができず、話者方位を検出することができない。これを解決するため、本願発明では、次のレベル比算出回路194で所定の信号比を算出して、話者方位を検出する。
レベル比算出回路194は、レベル検出回路193から入力された信号レベルデータE11〜E14,E21〜E24の平均信号レベルデータEavを算出する。そして、レベル比算出回路194は、各信号レベルデータE11〜E14,E21〜E24と平均信号レベルデータEavとのレベル比CE11〜CE14,CE21〜CE24を算出する。具体的には、各信号レベルデータEmn(m=1,2,n=1〜4)に対して、
CEmn=A*Log(Emn/Eav) (Aは定数) ―(1)
を用いて、レベル比CE11〜CE14,CE21〜CE24をデシベル単位で算出する。
図6は、平均信号レベルデータEav、レベル比CE11〜CE14、CE21〜CE24の時系列(T)分布を示すものであり、(A)が平均信号レベルデータEav、(B)〜(E)がそれぞれ収音ビーム信号MB11〜MB14に対応するレベル比データCE11〜CE14、(F)〜(I)がそれぞれ収音ビーム信号MB21〜MB24に対応するレベル比データCE21〜CE24を示す。
このように、各信号レベルデータを平均信号レベルデータで除算して比を算出することで、全ての信号レベルデータE11〜E14,E21〜E24に略同等に含まれる回り込み音声成分201が略「1」、すなわちデシベル単位であれば略「0」相当となる。一方、収音音声成分301は信号レベルデータE21に固有で、収音音声成分302は信号レベルデータE13に固有な成分であるので、レベル比データCE21は、収音音声成分301の発生するタイミング(T1〜T2)で高レベル成分401が発生し、レベル比データCE13は、収音音声成分302の発生するタイミング(T3〜T4)で高レベル成分402が発生する。なお、このようにデシベル単位を用いることにより、定数Aを適宜設定すれば、高レベル成分401,402を他の部分よりも顕著にすることができる。
レベル比算出回路194は、これらレベル比データCE11〜CE14,CE21〜CE24をレベル比較器195に出力する。
レベル比較器195は、レベル比データCEに対して、予め所定の閾値DEthを設定し、当該閾値DEthを超えるレベルのデータを検出すると、該当するレベル比データCEに対応する収音ビーム信号MB11〜MB14、MB21〜MB24の選択情報を収音ビーム信号選択回路196に出力する。ここで、閾値DEthは、予め発声音による収音音声がない状況で暗騒音や意図的に発生させた放音音声に対する回り込み音声の収音レベル等から適宜設定しておく。
具体的に図6の場合、サンプリングタイミングT1〜T2の時点では、高レベル成分401が検出され、レベル比データCE21に対応する収音ビーム信号MB21を選択する選択情報が出力される。また、サンプリングタイムT3〜T4の時点では、高レベル成分402が検出され、レベル比データCE13に対応する収音ビーム信号MB13を選択する選択情報が出力される。
収音ビーム信号選択回路196は、レベル比較器195から入力された選択情報に基づいて、収音ビーム信号MB11〜MB14、MB21〜MB24のうちで該当する収音ビーム信号を選択して、出力収音ビーム信号MBとしてエコーキャンセル部20に出力する。
具体的に、図6の場合、サンプリングタイミングT1〜T2の時点では収音ビーム信号MB21を選択して出力し、サンプリングタイムT3〜T4の時点では収音ビーム信号MB13を選択して出力する。
このような構成、処理を用いることで、会議者(話者)の発声音の収音信号レベルが、回り込み音声信号レベルと同等であったり、回り込み音声信号レベルよりも低くなっても、確実に発声音に対応する収音ビーム信号MBを選択することができる。
エコーキャンセル部20は、適応型フィルタ201とポストプロセッサ202とを備える。適応型フィルタ201は、入力音声信号に対して、選択された収音ビーム信号MBの収音指向性に基づく擬似回帰音信号を生成する。ポストプロセッサ202は、収音ビーム選択部19から出力される収音ビーム信号MBから擬似回帰音信号を減算して、出力音声信号として入出力I/F12に出力する。このようなエコーキャンセル処理を行うことにより、高いS/N比で発声音を収音して出力することができる。
次に、第2の実施形態に係る放収音装置について図を参照して説明する。
本実施形態の放収音装置は、収音ビーム選択部19のレベル比算出回路194、レベル比較器195、収音ビーム信号選択回路196の処理が異なるのみで、他の構成は第1の実施形態に示した放収音装置と同じであるので、レベル比算出回路194、レベル比較器195、収音ビーム信号選択回路196の処理のみを説明し、他の構成については説明を省略する。
レベル比算出回路194は、レベル検出回路193から入力された信号レベルデータE11〜E14,E21〜E24から、互いに図1の基準面100に対して対称な収音ビームの信号レベルデータE同士のレベル比CE1〜CE4を算出する。具体的には、各信号レベルデータE1n,E2n(n=1〜4)に対して、
CEn=B*Log(E2n/E1n) (Bは定数) ―(2)
を用いて、レベル比CE1〜CE4をデシベル単位で算出する。
図7(A)〜(D)はそれぞれレベル比CE1〜CE4の時系列(T)分布を示すものである。
このように、基準面100に対して対称位置にある信号レベルデータ同士を除算して比を算出することで、基準面100に対して略対称な特性の回り込み音声成分201が略「1」、すなわちデシベル単位であれば略「0」相当となる。一方、収音音声成分301は、会議者Aの方位に対応する収音ビーム信号MB21の信号レベルデータE21に現れ、収音ビーム信号MB21と基準面100に対して対称な収音ビーム信号MB11には現れない。したがって、式(2)から、レベル比データCE1は、収音音声成分301の発生するタイミング(T1〜T2)で、基準レベル0dBより正の方向に高い正方向高レベル成分501が発生する。また、収音音声成分302は、会議者Bの方位に対応する収音ビーム信号MB13の信号レベルデータE13に現れ、収音ビーム信号MB13と基準面100に対して対称な収音ビーム信号MB23には現れない。したがって、式(2)から、レベル比データCE3は、収音音声成分302の発生するタイミング(T3〜T4)で、基準レベル0dBよりも低い、すなわち負方向に高い負方向高レベル成分502が発生する。なお、このようにデシベル単位を用いることにより、定数Bを適宜設定すれば、正方向高レベル成分501,負方向高レベル成分502を他の部分よりも顕著にすることができる。
レベル比算出回路194は、これらレベル比データCE1〜CE4をレベル比較器195に出力する。
レベル比較器195は、レベル比データCE1〜CE4に対して、予め所定のレベル範囲DWthを設定し、当該レベル範囲DWthを正方向または負方向に超えるレベルのデータを検出すると、該当するレベル比データCEに対応する収音ビーム信号の組合せを検出して、この組合せの選択情報を収音ビーム信号選択回路196に出力する。また、レベル比較器195は、該当するレベル比データCEが正方向に高いレベルであるのか、負方向に高いレベルであるのかを示す正負レベル情報を収音ビーム信号選択回路196に出力する。ここで、レベル範囲DWthも、前述の閾値DEthと同様に、予め発声音による収音音声がない状況で暗騒音や意図的に発生させた放音音声に対する回り込み音声の収音レベル等から適宜設定しておく。
具体的に、図7の場合、サンプリングタイミングT1〜T2の時点では、正方向高レベル成分501が検出され、レベル比データCE1に対応する収音ビーム信号MB11,MB21の組合せを選択する選択情報が出力される。また、正方向に高いレベルであることを示す正レベル情報が出力される。
一方、サンプリングタイムT3〜T4の時点では、負方向高レベル成分502が検出され、レベル比データCE3に対応する収音ビーム信号MB13,MB23の組合せを選択する選択情報が出力される。また、負方向に高いレベルであることを示す負レベル情報が出力される。
収音ビーム信号選択回路196は、レベル比較器195から入力された選択情報に基づいて、収音ビーム信号MB11〜MB14、MB21〜MB24のうちで該当する収音ビーム信号の組合せを選択して、正負レベル情報に基づいて選択された二つの収音ビーム信号から信号レベルの大きい方の収音ビーム信号を選択して、出力収音ビーム信号MBとしてエコーキャンセル部20に出力する。
具体的に、図7の場合、サンプリングタイミングT1〜T2の時点では収音ビーム信号MB11,MB21を選択する。さらに、式(2)において正方向に高レベルになるには、信号レベルデータE21が信号レベルデータE11よりも高い場合であるので、正レベル情報に基づいて収音ビーム信号MB21を選択する。
一方、サンプリングタイミングT3〜T4の時点では収音ビーム信号MB13,MB23を選択する。さらに、式(2)において負方向に高レベルになるには、信号レベルデータE13が信号レベルデータE23よりも高い場合であるので、負レベル情報に基づいて収音ビーム信号MB13を選択する。
このような構成、処理を用いても、会議者(話者)の発声音の収音信号レベルが、回り込み音声信号レベルと同等であったり、回り込み音声信号レベルよりも低くなっても、確実に発声音に対応する収音ビーム信号MBを選択することができる。
また、前述の説明では、スピーカ配列方向に平行な基準面にマイクアレイが対称に配置された例を示したが、第1の実施形態の方法を用いれば、基準面に対して一方側にしかマイクアレイが存在しない場合にも適用することができる。
また、前述の各実施形態の説明では、収音ビーム生成部により収音ビーム信号を生成する場合を示したが、各マイクMIC11〜MIC17、MIC21〜MIC27に収音指向性を持たせ、各マイクMIC11〜MIC17、MIC21〜MIC27からの出力信号をそのまま収音ビーム信号として用いるようにしてもよい。この場合、基準面100に対して対称位置にあるマイク同士の収音指向性は、基準面100に対して対称に設定すれば、第2の実施形態に対しても適用することができる。
本実施形態に係る放収音装置のマイク、スピーカ配置を示す平面図、および、放収音装置により形成される収音ビーム領域を示す図である。 本実施形態の放収音装置の機能ブロック図である。 図2に示す収音ビーム選択部19の構成を示すブロック図である。 本実施形態の放収音装置1を机C上に配置し、二人の会議者A,Bが会議を行っている状況を示した図である。 放音音声の信号レベルデータEsp、各収音ビーム信号の信号レベルデータE11〜E14,E21〜E24の時系列(T)分布を示す図である。 平均信号レベルデータEav、レベル比CE11〜CE14、CE21〜CE24の時系列(T)分布を示す図である。 それぞれレベル比CE1〜CE4の時系列(T)分布を示す図である。
符号の説明
1−放収音装置、101−筐体、11−入出力コネクタ、12−入出力I/F、13−放音指向性制御部、14−D/Aコンバータ、15−放音用アンプ、16−収音用アンプ、17−A/Dコンバータ、181,182−収音ビーム生成部、19−収音ビーム選択部、191−BPF、192−全波整流回路、193−レベル検出回路、194−レベル比算出回路、195−レベル比較器、196−収音ビーム信号選択回路、20−エコーキャンセル部、201−適応型フィルタ、202−ポストプロセッサ、SP1〜SP3−スピーカ、SPA10−スピーカアレイ、MIC11〜MIC17,MIC21〜MIC27−マイク、MA10,MA20−マイクアレイ

Claims (3)

  1. 所定基準面に対して対称となる音圧で入力音声信号を放音するスピーカを備えた放音手段と、
    所定基準面の一方側の音声を収音する第1マイク群および他方側の音声を収音する第2マイク群とからなる収音手段と、
    前記第1マイク群の収音信号に遅延・振幅処理を行うことで得られる第1収音ビーム信号群の各収音ビーム信号と、前記第2マイク群の収音信号に遅延・振幅処理を行うことで得られる第2収音ビーム信号群の各収音ビーム信号とを前記所定基準面に対して対称に生成する収音ビーム信号生成手段と、
    各タイミングで前記基準面に対称な収音ビーム信号同士のエネルギー比を算出して、当該エネルギー比が所定の基準レベル範囲内にない収音ビーム信号の組合せを検出し、前記エネルギー比が前記基準レベル範囲よりも高いか低いかにより、前記組合せを構成する二本の収音ビーム信号から一本の収音ビーム信号を選択する収音ビーム信号選択手段と、
    を備えた放収音装置。
  2. 所定基準面に対して対称となる音圧で入力音声信号を放音するスピーカを備えた放音手段と、
    所定基準面の一方側に対してそれぞれ異なる方位に指向性を有する複数のマイクを備え、各マイクからの出力信号を収音ビーム信号とする第1マイク群、および他方側に対してそれぞれ異なる方位に指向性を有する複数のマイクを備え、各マイクからの出力信号を収音ビーム信号とする第2マイク群を備え、前記第1マイク群で得られる収音ビーム信号と前記第2マイク群で得られる収音ビーム信号とが前記基準面に対して対称に設定された収音手段と、
    各タイミングで前記基準面に対称な収音ビーム信号同士のエネルギー比を算出して、当該エネルギー比が所定の基準レベル範囲内にない収音ビーム信号の組合せを検出し、前記エネルギー比が前記基準レベル範囲よりも高いか低いかにより、前記組合せを構成する二本の収音ビーム信号から一本の収音ビーム信号を選択する収音ビーム信号選択手段と、
    を備えた放収音装置。
  3. 前記収音ビーム信号選択手段は、前記エネルギー比をデシベル単位に換算して、該デシベル単位に換算された値に基づいて収音ビーム信号を選択する請求項1または2に記載の放収音装置。
JP2006147228A 2006-05-26 2006-05-26 放収音装置 Expired - Fee Related JP4894353B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2006147228A JP4894353B2 (ja) 2006-05-26 2006-05-26 放収音装置
PCT/JP2007/060639 WO2007138985A1 (ja) 2006-05-26 2007-05-24 放収音装置および放収音装置の制御方法
CN2007800194698A CN101455094B (zh) 2006-05-26 2007-05-24 声音发射和采集设备以及声音发射和采集设备的控制方法
EP07744073A EP2040485A4 (en) 2006-05-26 2007-05-24 DISCHARGE BZW. COLLECTING LANGUAGE DEVICE AND CONTROL PROCEDURE FOR A DISCHARGE BZW. COLLECTING LANGUAGE DEVICE
CA002653598A CA2653598A1 (en) 2006-05-26 2007-05-24 Sound emission and collection apparatus and control method of sound emission and collection apparatus
US12/302,653 US8300839B2 (en) 2006-05-26 2007-05-24 Sound emission and collection apparatus and control method of sound emission and collection apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006147228A JP4894353B2 (ja) 2006-05-26 2006-05-26 放収音装置

Publications (2)

Publication Number Publication Date
JP2007318550A JP2007318550A (ja) 2007-12-06
JP4894353B2 true JP4894353B2 (ja) 2012-03-14

Family

ID=38778505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006147228A Expired - Fee Related JP4894353B2 (ja) 2006-05-26 2006-05-26 放収音装置

Country Status (6)

Country Link
US (1) US8300839B2 (ja)
EP (1) EP2040485A4 (ja)
JP (1) JP4894353B2 (ja)
CN (1) CN101455094B (ja)
CA (1) CA2653598A1 (ja)
WO (1) WO2007138985A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4929740B2 (ja) * 2006-01-31 2012-05-09 ヤマハ株式会社 音声会議装置
JP5259622B2 (ja) * 2007-12-10 2013-08-07 パナソニック株式会社 収音装置、収音方法、収音プログラム、および集積回路
JP2010206451A (ja) * 2009-03-03 2010-09-16 Panasonic Corp カメラ付きスピーカ、信号処理装置、およびavシステム
US8897455B2 (en) 2010-02-18 2014-11-25 Qualcomm Incorporated Microphone array subset selection for robust noise reduction
CN102201231B (zh) * 2010-03-23 2012-10-24 创杰科技股份有限公司 语音侦测方法
EP4086891A1 (en) * 2010-10-21 2022-11-09 Acoustic 3d Holdings Limited Acoustic diffusion generator
WO2013058728A1 (en) * 2011-10-17 2013-04-25 Nuance Communications, Inc. Speech signal enhancement using visual information
JP7065414B2 (ja) * 2017-08-29 2022-05-12 パナソニックIpマネジメント株式会社 仮想音像制御システム、照明器具、厨房装置、天井部材、及びテーブル
JP7245034B2 (ja) * 2018-11-27 2023-03-23 キヤノン株式会社 信号処理装置、信号処理方法およびプログラム
CN110351633B (zh) * 2018-12-27 2022-05-24 腾讯科技(深圳)有限公司 声音采集设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4008376A (en) * 1975-10-17 1977-02-15 Bell Telephone Laboratories, Incorporated Loudspeaking teleconferencing circuit
US4554639A (en) * 1983-04-06 1985-11-19 E. I. Du Pont De Nemours And Company Audio dosimeter
CA2032080C (en) * 1990-02-28 1996-07-23 John Charles Baumhauer Jr. Directional microphone assembly
US5335011A (en) * 1993-01-12 1994-08-02 Bell Communications Research, Inc. Sound localization system for teleconferencing using self-steering microphone arrays
US5226076A (en) * 1993-02-28 1993-07-06 At&T Bell Laboratories Directional microphone assembly
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
JP2739835B2 (ja) 1995-04-27 1998-04-15 日本電気株式会社 音声会議装置
JP2910727B2 (ja) * 1997-04-16 1999-06-23 日本電気株式会社 目標信号検出方法及び装置
US20030059061A1 (en) * 2001-09-14 2003-03-27 Sony Corporation Audio input unit, audio input method and audio input and output unit
JP2003087887A (ja) * 2001-09-14 2003-03-20 Sony Corp 音声入出力装置
US7190775B2 (en) 2003-10-29 2007-03-13 Broadcom Corporation High quality audio conferencing with adaptive beamforming
JP2005229422A (ja) * 2004-02-13 2005-08-25 Sony Corp 音声処理装置
US7667728B2 (en) * 2004-10-15 2010-02-23 Lifesize Communications, Inc. Video and audio conferencing system with spatial audio

Also Published As

Publication number Publication date
CA2653598A1 (en) 2007-12-06
WO2007138985A1 (ja) 2007-12-06
US20090180633A1 (en) 2009-07-16
EP2040485A4 (en) 2011-06-29
CN101455094B (zh) 2012-07-18
JP2007318550A (ja) 2007-12-06
EP2040485A1 (en) 2009-03-25
CN101455094A (zh) 2009-06-10
US8300839B2 (en) 2012-10-30

Similar Documents

Publication Publication Date Title
JP4894353B2 (ja) 放収音装置
JP4984683B2 (ja) 放収音装置
JP5050616B2 (ja) 放収音装置
JP4747949B2 (ja) 音声会議装置
EP2007168B1 (en) Voice conference device
JP3972921B2 (ja) 音声集音装置とエコーキャンセル処理方法
JP4802708B2 (ja) 放収音装置
CN102177731A (zh) 音频设备
JP2019161604A (ja) 音声処理装置
JP5028833B2 (ja) 放収音装置
JP4281568B2 (ja) 通話装置
WO2009110576A1 (ja) 収音装置
JP4269854B2 (ja) 通話装置
JP5141442B2 (ja) 収音装置、及び放収音装置
JP2007318521A (ja) 放収音装置
JP4867248B2 (ja) スピーカ装置及び音声会議装置
JP4470413B2 (ja) マイクロフォン・スピーカ一体構成型・通話装置
Suzuki et al. Spot-forming method by using two shotgun microphones
JP2007318274A (ja) 放収音装置
JP4760795B2 (ja) 拡声システム
JP2006148228A (ja) 双方向通話装置
JP2007006073A (ja) スピーカ装置
JP2009010808A (ja) 拡声装置
JP2008278399A (ja) 放収音装置
JP2007028220A (ja) 音声入出力装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111102

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111129

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111212

R150 Certificate of patent or registration of utility model

Ref document number: 4894353

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150106

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees