JP2011182062A - 収音装置、収音方法およびプログラム - Google Patents
収音装置、収音方法およびプログラム Download PDFInfo
- Publication number
- JP2011182062A JP2011182062A JP2010042263A JP2010042263A JP2011182062A JP 2011182062 A JP2011182062 A JP 2011182062A JP 2010042263 A JP2010042263 A JP 2010042263A JP 2010042263 A JP2010042263 A JP 2010042263A JP 2011182062 A JP2011182062 A JP 2011182062A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- sound
- target
- target sound
- direct
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
【課題】目的音源からの音声を高品質な状態で収音可能な、収音装置、収音方法およびプログラムを提供する。
【解決手段】アレイマイク14の指向を目的音源Soに向けて、非目的音源Snから目的音源の方向へ反射して回り込む、非目的音源からの反射成分rnを収音するとともに、指向を非目的音源に向けて、非目的音源からの直接音dnを収音し、反射成分rnに相当する信号と直接音dnに相当する信号から非目的音源からの音声の反射率R(=rn/dn)を帯域毎に算出して学習する。そして、指向を目的音源に向けて、目的音源からの直接音do´と非目的音源からの反射成分rn´からなる処理対象音(do´+rn´)を収音するとともに、指向を非目的音源に向けて、非目的音源からの直接音dn´を収音し、直接音dn´に相当する信号に反射率Rを帯域毎に乗じて、非目的音源からの反射成分rn´を推定し、処理対象音に相当する信号から帯域毎に減算する。
【選択図】図2
【解決手段】アレイマイク14の指向を目的音源Soに向けて、非目的音源Snから目的音源の方向へ反射して回り込む、非目的音源からの反射成分rnを収音するとともに、指向を非目的音源に向けて、非目的音源からの直接音dnを収音し、反射成分rnに相当する信号と直接音dnに相当する信号から非目的音源からの音声の反射率R(=rn/dn)を帯域毎に算出して学習する。そして、指向を目的音源に向けて、目的音源からの直接音do´と非目的音源からの反射成分rn´からなる処理対象音(do´+rn´)を収音するとともに、指向を非目的音源に向けて、非目的音源からの直接音dn´を収音し、直接音dn´に相当する信号に反射率Rを帯域毎に乗じて、非目的音源からの反射成分rn´を推定し、処理対象音に相当する信号から帯域毎に減算する。
【選択図】図2
Description
本発明は、収音装置、収音方法およびプログラムに関する。
マイクロホンを用いて目的音源からの音声を収音する場合、目的音源以外の音源(非目的音源)からの音声の収音を抑圧するために、一般に、アレイマイクを用いた音声処理が行われる。アレイマイクを用いた音声処理としては、目的音源の方向に固定的な指向性を形成する遅延和法、3マイク積分法等の固定方式が挙げられる。
しかし、固定方式では、目的音源の方向に固定的な指向性を形成するので、安定的な指向性が得られる反面、非目的音源からの音声の抑圧性能が低く、抑圧性能を高めるためにマイクロホンの数、大きさを確保しなければならない。また、目的音源とは異なる方向に位置する非目的音源から目的音源の方向へ反射して回り込む、非目的音源からの反射成分を抑圧することができない。このため、目的音源からの音声を高品質な状態で収音することができない場合がある。
そこで、本発明は、目的音源からの音声を高品質な状態で収音可能な、収音装置、収音方法およびプログラムを提供しようとするものである。
本発明のある観点によれば、指向性を変更可能なアレイマイクと、アレイマイクによる収音処理を制御する制御部と、アレイマイクにより収音された音声を処理する音声処理部とを備える収音装置が提供される。
上記収音装置において、制御部は、アレイマイクの指向を目的音源に向けて、目的音源とは異なる方向に位置する非目的音源から目的音源の方向へ反射して回り込む、非目的音源からの反射成分を収音するとともに、アレイマイクの指向を非目的音源に向けて、非目的音源からの直接音を収音するようにアレイマイクを制御し、音声処理部は、非目的音源からの反射成分に相当する信号と非目的音源からの直接音に相当する信号の比率からなる、非目的音源からの音声の反射率を帯域毎に算出して学習し、制御部は、アレイマイクの指向を目的音源に向けて、目的音源からの直接音と非目的音源からの反射成分を処理対象音として同時に収音するとともに、アレイマイクの指向を非目的音源に向けて、非目的音源からの直接音を収音するようにアレイマイクを制御し、音声処理部は、非目的音源からの直接音に相当する信号に非目的音源からの音声の反射率を帯域毎に乗じて、処理対象音に相当する信号から帯域毎に減算する。
かかる構成によれば、非目的音源からの反射成分に相当する信号と非目的音源からの直接音に相当する信号の比率からなる、非目的音源からの音声の反射率が帯域毎に算出されて学習される。そして、非目的音源からの直接音に相当する信号に、非目的音源からの音声の反射率を帯域毎に乗じることで、目的音源の方向へ反射して回り込む非目的音源からの反射成分に相当する信号が推定される。これは、非目的音源の位置やアレイマイクの指向性が変化しなければ、非目的音源からの音声の反射率が帯域毎に一定となるためである。さらに、推定された反射成分に相当する信号を処理対象音に相当する信号から帯域毎に減算することで、非目的音源からの反射成分が除去され、目的音源からの音声を高品質な状態で収音することができる。
非目的音源が複数の音源からなる場合に、上記収音装置において、音声処理部は、複数の音源について、各非目的音源からの音声の反射率を算出して学習し、各非目的音源からの直接音に相当する信号に各非目的音源からの音声の反射率を乗じて、処理対象音に相当する信号から減算してもよい。
目的音源および非目的音源が複数の音源からなり、複数の音源のうち1の音源が目的音源となり、他の音源が非目的音源となる場合に、上記収音装置において、音声処理部は、想定される目的音源と非目的音源の組合せについて、各非目的音源からの音声の反射率を算出して学習し、特定の音源からの直接音により目的音源が特定されると、特定の音源を目的音源として算出された反射率を用いて、各非目的音源からの直接音に相当する信号に各非目的音源からの音声の反射率を乗じて、処理対象音に相当する信号から減算してもよい。
また、本発明の別の観点によれば、アレイマイクの指向を目的音源に向けて、目的音源とは異なる方向に位置する非目的音源から目的音源の方向へ反射して回り込む、非目的音源からの反射成分を収音するとともに、アレイマイクの指向を非目的音源に向けて、非目的音源からの直接音を収音するステップと、非目的音源からの反射成分に相当する信号と非目的音源からの直接音に相当する信号の比率からなる、非目的音源からの音声の反射率を帯域毎に算出して学習するステップと、アレイマイクの指向を目的音源に向けて、目的音源からの直接音と非目的音源からの反射成分を処理対象音として収音するとともに、アレイマイクの指向を非目的音源に向けて、非目的音源からの直接音を収音するステップと、非目的音源からの直接音に相当する信号に非目的音源からの音声の反射率を帯域毎に乗じて、処理対象音に相当する信号から帯域毎に減算するステップとを含む収音方法が提供される。
また、本発明の別の観点によれば、上記収音方法をコンピュータに実行させるためのプログラムが提供される。ここで、プログラムは、コンピュータ読取り可能な記録媒体を用いて提供されてもよく、通信手段を介して提供されてもよい。
以上説明したように本発明によれば、目的音源からの音声を高品質な状態で収音可能な、収音装置、収音方法およびプログラムを提供することができる。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
[1.収音装置10の構成]
まず、図1を参照しながら、本発明の実施形態に係る収音装置10の構成について説明する。図1には、収音装置10の主要な機能構成が示されている。
まず、図1を参照しながら、本発明の実施形態に係る収音装置10の構成について説明する。図1には、収音装置10の主要な機能構成が示されている。
図1に示すように、収音装置10は、アレイモジュール11、音声処理部12、および制御部13からなる。アレイモジュール11は、複数のマイクからなるアレイマイク14と、アレイ処理部15を有する。音声処理部12は、反射率学習部16、反射成分推定部17、および反射成分除去部18を有する。
アレイモジュール11は、アレイマイク14により収音された音声に相当する信号に、必要に応じてアレイ処理を施し、音声処理部12に供給する。アレイモジュール11では、音声信号にアレイ処理を施すことで、アレイマイク14の指向性が変更される。アレイ処理部15の処理は、例えば、目的音源Soまたは目的音源Soとは異なる方向に位置する非目的音源Snに向けられるように、制御部13により制御される。なお、目的音源Soおよび非目的音源Snは、物体として特定されてもよく、領域として特定されてもよい。
音声処理部12は、目的音源Soの方向へ反射して回り込む非目的音源Snからの反射成分rn´を除去する。反射率学習部16は、非目的音源Snからの反射成分rnに相当する信号と非目的音源Snからの直接音dnに相当する信号の比率からなる、非目的音源Snからの音声の反射率Rを帯域毎に算出して学習する。反射成分推定部17は、非目的音源Snからの直接音dn´に相当する信号に、非目的音源Snからの音声の反射率Rを帯域毎に乗じて、非目的音源Snからの反射成分rn´を推定する。
ここで、非目的音源Snの位置やアレイマイク14の指向性が変化しなければ、非目的音源Snからの音声の反射率Rが帯域毎に一定となる。このため、非目的音源Snからの直接音dn´に相当する信号に、非目的音源Snからの音声の反射率Rを乗じることで、非目的音源Snからの反射成分rn´を推定することができる。
反射成分除去部18は、目的音源Soからの直接音do´と非目的音源Snからの反射成分rn´からなる処理対象音(do´+rn´)に相当する信号から、非目的音源Snからの反射成分rn´に相当する信号を除去する。音声処理部12では、反射成分rn´を除去された処理対象音(do´)に相当する信号が不図示の記録装置、出力装置等に出力される。
制御部13は、アレイモジュール11および音声処理部12を制御する。特に、制御部13は、アレイ処理部15によるアレイ処理、反射率学習部16による反射率Rの学習処理を制御する。
なお、上記機能構成のうち少なくとも一部については、収音装置10上で動作するソフトウェア(プログラム)により実現されてもよく、ハードウェアにより実現されてもよい。また、ソフトウェアにより実現される場合には、プログラムが収音装置10上に予め格納されてもよく、外部から供給されてもよい。
[2.収音装置10の動作]
つぎに、図2〜図4を参照しながら、本発明の実施形態に係る収音装置10の動作について説明する。図2には、収音装置10の動作手順が示され、図3には、収音装置10の動作が示され、図4には、反射成分rn´の除去原理が示されている。
つぎに、図2〜図4を参照しながら、本発明の実施形態に係る収音装置10の動作について説明する。図2には、収音装置10の動作手順が示され、図3には、収音装置10の動作が示され、図4には、反射成分rn´の除去原理が示されている。
図2に示すように、まず、制御部13は、音声信号にアレイ処理を施さないように、アレイ処理部15を制御する。この場合、アレイマイク14の指向性が形成されないので、音声処理部12には、目的音源Soおよび非目的音源Snからの音声を含む周辺音声に相当する信号が供給される(ステップS11)。
制御部13は、図3の状態ST11に示すように、アレイマイク14の指向を目的音源Soに向けて(指向Do)、非目的音源Snからの反射成分rnを収音するように、アレイ処理部15を制御する(S12)。制御部13は、ほぼ同時に、アレイマイク14の指向を非目的音源Snに向けて(指向Dn)、非目的音源Snからの直接音dnを収音するように、アレイ処理部15を制御する(S12)。
ここで、非目的音源Snからの反射成分rnとは、非目的音源Snから発生した音声のうち、目的音源Soの方向へ反射して回り込み、指向Do時のアレイマイク14により収音される成分を意味する。非目的音源Snからの直接音dnとは、非目的音源Snから発生した音声のうち、指向Dn時のアレイマイク14に直接収音される成分を意味する。
音声処理部12では、反射成分rnに相当する信号(反射成分信号)および直接音dnに相当する信号(直接音信号)が反射率学習部16に供給され、非目的音源Snからの音声の反射率Rが帯域(スペクトル成分)毎に算出される(S13)。つまり反射率Rは、図4に示すように、直接音dnに対する反射成分rnのパワー比(rn/dn)として帯域毎に算出される。反射率学習部16では、反射率Rの算出値が学習されて、学習結果が反射成分推定部17に供給される。なお、反射率Rの学習とは、反射率Rの算出値を蓄積し、その妥当性等を評価することを意味している。
ここで、反射率Rは、指向Do時の反射成分rnの収音結果と、指向Dn時の直接音dnの収音結果の比率として算出されるべき指標である。よって、指向Do時または指向Dn時に、目的音源Soからの直接音doが収音されると、算出値が変動してしまい、反射率Rを適切に学習することができなくなる。このため、反射率Rの学習は、算出値が安定している場合に限定して行われ、または算出値の標準偏差に基づいて行われることが好ましい。また、反射率Rは、隣接する帯域間である程度の相関性を有しているので、隣接する帯域間で反射率Rの算出値にバラツキが認められた場合には、学習の対象としないことが好ましい。
制御部13は、図3の状態ST12に示すように、アレイマイク14の指向を目的音源Soに向けて(指向Do)、目的音源Soからの直接音do´と、目的音源Soの方向へ反射して回り込む非目的音源Snからの反射成分rn´からなる処理対象音(do´+rn´)を収音するように、アレイ処理部15を制御する(S14)。制御部13は、ほぼ同時に、アレイマイク14の指向を非目的音源Snに向けて(指向Dn)、非目的音源Snからの直接音dn´を収音するように、アレイ処理部15を制御する(S14)。なお、非目的音源Snからの直接音dn´は、他の音源から音声が発生していないタイミングで収音される。
これにより、処理対象音(do´+rn´)に相当する信号(処理対象音信号)と、非目的音源Snからの直接音dn´に相当する信号(直接音信号)について、瞬時スペクトルが各々に検出される。
音声処理部12では、処理対象音信号が反射成分除去部18に供給されるとともに、非目的音源Snからの直接音信号が反射成分推定部17に供給される。反射成分推定部17では、非目的音源Snからの直接音信号に反射率Rを帯域毎に乗算して反射成分信号が推定され、推定結果が反射成分除去部18に供給される(S15)。反射成分除去部18では、処理対象音信号から反射成分信号の推定結果を帯域毎に減算して、処理対象音(do´+rn´)から反射成分rn´が除去される(S16)。そして、目的音源Soからの直接音do´に相当する信号が出力される(S17)。
つまり、目的音源Soからの直接音do´に相当する信号は、図4に示すように、非目的音源Snからの直接音dnに相当する信号に反射率Rを乗算して反射成分rn´に相当する信号を推定し、処理対象音(do´+rn´)に相当する信号から減算して算出される。なお、反射成分rn´の除去処理では、収音処理が終了するまで、ステップS12〜S17の処理が繰返される(S18)。
[3.音声通信システムへの適用例]
図5には、音声通信システムへの収音装置10の適用例が示されている。
図5には、音声通信システムへの収音装置10の適用例が示されている。
音声通信システムは、ネットワークNWを介して接続された通信装置T0、T1により構成される。通信装置T0、T1は、マイクM0およびスピーカS0、マイクM1およびスピーカS1を各々に有している。音声通信システムのユーザU0は、マイクM0に音声を入力し、スピーカS0から出力される他のユーザU1の音声を聴取する。
ここで、ユーザU0(目的音源So)は、他のユーザU1の音声がスピーカS0(非目的音源Sn)から出力されている状態で、音声をマイクM0に入力する場合がある。この場合、エコーキャンセラのためにスピーカS0の出力信号を利用できなければ、ユーザU0の音声を高品質な状態で収音できなくなる。このような場合にマイクM0として、前述した収音装置10を適用することができる。
音声通信システムでは、第1に、指向DoでユーザU0の方向へ反射して回り込むスピーカS0からの反射成分rnが収音されるとともに、指向DnでスピーカS0からの直接音dnが収音される。そして、スピーカS0からの音声の反射率Rが学習される。第2に、指向DoでユーザU0からの直接音do´とスピーカS0からの反射成分rn´が処理対象音(do´+rn´)として同時に収音されるとともに、指向DnでスピーカS0からの直接音dn´が収音される。そして、スピーカS0からの直接音dn´に相当する信号をスピーカS0からの音声の反射率Rを乗じて、スピーカS0からの反射成分rn´が推定され、処理対象音(do´+rn´)に相当する信号から減算される。
これにより、ユーザU0の方向へ反射して回り込むスピーカS0からの反射成分rn´を抑圧することで、ユーザU0からの音声(直接音do´)を高品質な状態で収音することができる。
[4.第1の変形例]
図6には、第1の変形例に係る収音装置10の動作が示されている。第1の変形例では、非目的音源Snが複数の対象からなる。なお、図6では、n=2、つまり非目的音源Sn1、Sn2が2つの対象からなる場合が示されているが、非目的音源Snは、3つ以上の対象からなってもよい。
図6には、第1の変形例に係る収音装置10の動作が示されている。第1の変形例では、非目的音源Snが複数の対象からなる。なお、図6では、n=2、つまり非目的音源Sn1、Sn2が2つの対象からなる場合が示されているが、非目的音源Snは、3つ以上の対象からなってもよい。
収音装置10では、1つの対象が目的音源Soとなり、目的音源Soと異なる方向に位置し、かつ互いに異なる方向に位置するn個の対象が非目的音源Sn1、…、Snnとなる。ここで、目的音源Soは、予め特定されている。
収音装置10では、第1に、状態ST21に示すように、指向Doで目的音源Soの方向へ反射して回り込む非目的音源Sn1、Sn2からの反射成分rn1、rn2が各々に収音されるとともに、指向Dn1、Dn2で非目的音源Sn1、Sn2からの直接音dn1、dn2が各々に収音される。そして、非目的音源Sn1、Sn2からの音声の反射率R1、R2が学習される。なお、非目的音源Sn1、Sn2からの音声の反射率R1、R2は、他の音源から音声が発生していないタイミングで算出された反射率Rを用いて学習される。
第2に、状態ST22に示すように、指向Doで目的音源Soからの直接音do´と非目的音源Sn1、Sn2からの反射成分rn1´、rn2´が処理対象音(do´+rn1´+rn2´)として同時に収音されるとともに、指向Dn1、Dn2で非目的音源Sn1、Sn2からの直接音do1´、do2´が各々に収音される。なお、非目的音源Sn1、Sn2からの直接音do1´、do2´は、他の音源から音声が発生していないタイミングで各々に収音される。例えば、非目的音源Sn1からの直接音do1´は、非目的音源Sn1からのみ音声が発生しているタイミングで収音される。
そして、非目的音源Sn1、Sn2からの直接音do1´、do2´に相当する信号を非目的音源Sn1、Sn2からの音声の反射率R1、R2に乗じて、非目的音源Sn1、Sn2からの反射成分rn1´、rn2´が各々に推定され、処理対象音(do´+rn1´+rn2´)に相当する信号から減算される。
これにより、目的音源Soの方向へ反射して回り込む、複数の非目的音源Sn1、Sn2からの反射成分rn1´、rn2´を抑圧することで、目的音源Soからの音声(直接音do´)を高品質な状態で収音することができる。
また、収音装置10では、各非目的音源Sn1、Sn2からの直接音do1´、do2´の発生の有無が検知されてもよい。これにより、直接音do1´または直接音do2´を発生させた非目的音源Sn1または非目的音源Sn2が目的音源Soとなるように、目的音源Soを変更することができる。
第1の変形例に係る収音装置10は、例えば、目的音源Soに相当する監視対象を映像および音声にて監視する監視システム、または目的音源Soに相当する特定対象の映像および音声を記録する映像音声記録システムに適用することができる。
[5.第2の変形例]
図7A、7Bには、第2の変形例に係る収音装置10の動作が示されている。第2の変形例では、目的音源Soが不特定の対象からなる。なお、図7A、7Bでは、n=3、つまり目的音源Soが1つの対象からなり、非目的音源Sn1、Sn2が残り2つの対象からなる場合が示されていが、非目的音源Snは、3つ以上の対象からなってもよい。
図7A、7Bには、第2の変形例に係る収音装置10の動作が示されている。第2の変形例では、目的音源Soが不特定の対象からなる。なお、図7A、7Bでは、n=3、つまり目的音源Soが1つの対象からなり、非目的音源Sn1、Sn2が残り2つの対象からなる場合が示されていが、非目的音源Snは、3つ以上の対象からなってもよい。
収音装置10では、相異なる方向に位置する第1〜第nの対象S1、…、Snのうち、任意の1つの対象が目的音源Soとなり、残りの対象が非目的音源Sn1、…、Snn−1となる。ここで、目的音源Soは、予め特定されていない。
収音装置10では、第1に、状態ST31に示すように、指向D1で対象S1を目的音源Soと想定して、対象S1の方向へ反射して回り込む他の対象S2、S3からの反射成分r21、r31が各々に収音されるとともに、他の対象S2、S3からの直接音d2、d3が各々に収音される。そして、他の対象S2、S3からの音声の反射率R21、R31が各々に学習される。なお、反射成分rijおよび反射率Rijは、対象jの方向へ反射して回り込む他の対象iからの反射成分rおよび反射率Rを各々に意味している。
同様に、状態ST32、ST33に示すように、指向D2、D3で他の対象S2、S3を目的音源Soと想定して、目的音源So以外の対象からの音声の反射率R12、R32、R13、R23が各々に学習される。なお、対象S1〜S3からの音声の反射率Rは、他の音源から音声が発生していないタイミングで算出された反射率Rを用いて学習される。よって、目的音源Soと非目的音源Snのn×(n−1)個の組合せについて、非目的音源Snからの音声の反射率Rが算出されて学習される。
第2に、各対象S1〜S3からの直接音d1´〜d3´の発生の有無が検知される。そして、例えば、直接音d´のパワー比が最大となる対象、または直接音d´を連続して発生している対象を目的音源Soとして特定される。以下では、対象S1が目的音源Soとして特定された場合を想定して説明する。
第3に、状態ST34に示すように、指向D1で目的音源Soとして特定された対象S1からの直接音d1´と他の対象S2、S3からの反射成分r21´、r31´が処理対象音(d1´+r21´+r31´)として同時に収音されるとともに、指向D2、D3で各対象S2、S3からの直接音d2´、d3´が各々に収音される。なお、対象S2、S3からの直接音d2´、d3´は、他の音源から音声が発生していないタイミングで収音される。例えば、対象S2からの直接音d2´は、対象S2からのみ音声が発生しているタイミングで収音される。
そして、対象S2、S3からの直接音d2´、d3´に相当する信号に対象S2、S3からの音声の反射率R21、R31を乗じて、対象S2、S3からの反射成分rn21´、rn31´が各々に推定され、処理対象音(d1´+r21´+r31´)に相当する信号から減算される。
これにより、任意に変更する目的音源Soの方向へ反射して回り込む、複数の非目的音源Sn1、Sn2からの反射成分rn1o´、…、rn2o´を抑圧することで、目的音源Soからの音声(直接音do´)を高品質な状態で収音することができる。
なお、上記変形例では、目的音源Soが任意に変更するので、目的音源Soと非目的音源Snのn×(n−1)個の組合せについて、非目的音源Snからの音声の反射率Rを予め算出して学習している。よって、対象の数が多くなると、処理リソースに対する負荷が大きくなることが想定される。このため、例えば、各対象からの直接音の発生履歴に基づき、各対象が目的音源となる確率を算出するようにしてもよい。この場合、目的音源となる確率の高い対象については、確率の低い対象に比べて学習頻度を高くすることで、反射率Rを効率的に学習することができる。
[6.まとめ]
以上説明したように、本発明の実施形態に係る収音装置10によれば、非目的音源Snからの反射成分rnに相当する信号と非目的音源Snからの直接音dnに相当する信号の比率(rn/dn)からなる、非目的音源Snからの音声の反射率Rが帯域毎に算出されて学習される。そして、非目的音源Snからの直接音dn´に相当する信号に、非目的音源Snからの音声の反射率Rを帯域毎に乗じることで、目的音源Soの方向へ反射して回り込む非目的音源Snからの反射成分rn´に相当する信号が推定される。さらに、目的音源Soからの直接音do´を含む処理対象音(do´+rn´)に相当する信号から、推定された反射成分rn´に相当する信号を帯域毎に減算することで、非目的音源Snからの反射成分rn´が除去され、目的音源Soからの音声(直接音do´)を高品質な状態で収音することができる。
以上説明したように、本発明の実施形態に係る収音装置10によれば、非目的音源Snからの反射成分rnに相当する信号と非目的音源Snからの直接音dnに相当する信号の比率(rn/dn)からなる、非目的音源Snからの音声の反射率Rが帯域毎に算出されて学習される。そして、非目的音源Snからの直接音dn´に相当する信号に、非目的音源Snからの音声の反射率Rを帯域毎に乗じることで、目的音源Soの方向へ反射して回り込む非目的音源Snからの反射成分rn´に相当する信号が推定される。さらに、目的音源Soからの直接音do´を含む処理対象音(do´+rn´)に相当する信号から、推定された反射成分rn´に相当する信号を帯域毎に減算することで、非目的音源Snからの反射成分rn´が除去され、目的音源Soからの音声(直接音do´)を高品質な状態で収音することができる。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
10 収音装置
11 アレイモジュール
12 音声処理部
13 制御部
14 アレイマイク
15 アレイ処理部
16 反射率学習部
17 反射成分推定部
18 反射成分除去部
So 目的音源
Sn、Sn1、Sn2 非目的音源
Do、Dn、Dn1、Dn2、D1、D2、D3 アレイマイクの指向
rn、rn´、rn1´、rn2´ 非目的音源からの反射成分
do´ 目的音源からの直接音
dn、dn1、dn2、dn´、dn1´、dn2´ 非目的音源からの直接音
S1、S2、S3 音源
r21、r31、r12、r32、r13、r23、r21´、r31´ 音源からの反射成分
d1、d2、d3、d1´、d2´、d3´ 音源からの直接音
11 アレイモジュール
12 音声処理部
13 制御部
14 アレイマイク
15 アレイ処理部
16 反射率学習部
17 反射成分推定部
18 反射成分除去部
So 目的音源
Sn、Sn1、Sn2 非目的音源
Do、Dn、Dn1、Dn2、D1、D2、D3 アレイマイクの指向
rn、rn´、rn1´、rn2´ 非目的音源からの反射成分
do´ 目的音源からの直接音
dn、dn1、dn2、dn´、dn1´、dn2´ 非目的音源からの直接音
S1、S2、S3 音源
r21、r31、r12、r32、r13、r23、r21´、r31´ 音源からの反射成分
d1、d2、d3、d1´、d2´、d3´ 音源からの直接音
Claims (5)
- 指向性を変更可能なアレイマイクと、
前記アレイマイクによる収音処理を制御する制御部と、
前記アレイマイクにより収音された音声を処理する音声処理部と
を備え、
前記制御部は、前記アレイマイクの指向を目的音源に向けて、前記目的音源とは異なる方向に位置する非目的音源から前記目的音源の方向へ反射して回り込む、前記非目的音源からの反射成分を収音するとともに、前記アレイマイクの指向を前記非目的音源に向けて、前記非目的音源からの直接音を収音するように前記アレイマイクを制御し、
前記音声処理部は、前記非目的音源からの反射成分に相当する信号と前記非目的音源からの直接音に相当する信号の比率からなる、前記非目的音源からの音声の反射率を帯域毎に算出して学習し、
前記制御部は、前記アレイマイクの指向を前記目的音源に向けて、前記目的音源からの直接音と前記非目的音源からの反射成分を処理対象音として同時に収音するとともに、前記アレイマイクの指向を前記非目的音源に向けて、前記非目的音源からの直接音を収音するように前記アレイマイクを制御し、
前記音声処理部は、前記非目的音源からの直接音に相当する信号に前記非目的音源からの音声の反射率を帯域毎に乗じて、前記処理対象音に相当する信号から帯域毎に減算する、収音装置。 - 前記非目的音源が複数の音源からなる場合において、
前記音声処理部は、前記複数の音源について、前記各非目的音源からの音声の反射率を算出して学習し、前記各非目的音源からの直接音に相当する信号に前記各非目的音源からの音声の反射率を乗じて、前記処理対象音に相当する信号から減算する、請求項1に記載の収音装置。 - 前記目的音源および前記非目的音源が複数の音源からなり、前記複数の音源のうち1の音源が前記目的音源となり、他の音源が前記非目的音源となる場合において、
前記音声処理部は、想定される目的音源と非目的音源の組合せについて、前記各非目的音源からの音声の反射率を算出して学習し、前記特定の音源からの直接音により前記目的音源が特定されると、前記特定の音源を前記目的音源として算出された反射率を用いて、前記各非目的音源からの直接音に相当する信号に前記各非目的音源からの音声の反射率を乗じて、前記処理対象音に相当する信号から減算する、請求項1に記載の収音装置。 - アレイマイクの指向を目的音源に向けて、前記目的音源とは異なる方向に位置する非目的音源から前記目的音源の方向へ反射して回り込む、前記非目的音源からの反射成分を収音するとともに、前記アレイマイクの指向を前記非目的音源に向けて、前記非目的音源からの直接音を収音するステップと、
前記非目的音源からの反射成分に相当する信号と前記非目的音源からの直接音に相当する信号の比率からなる、前記非目的音源からの音声の反射率を帯域毎に算出して学習するステップと、
前記アレイマイクの指向を前記目的音源に向けて、前記目的音源からの直接音と前記非目的音源からの反射成分を処理対象音として収音するとともに、前記アレイマイクの指向を前記非目的音源に向けて、前記非目的音源からの直接音を収音するステップと、
前記非目的音源からの直接音に相当する信号に前記非目的音源からの音声の反射率を帯域毎に乗じて、前記処理対象音に相当する信号から帯域毎に減算するステップと
を含む収音方法。 - アレイマイクの指向を目的音源に向けて、前記目的音源とは異なる方向に位置する非目的音源から前記目的音源の方向へ反射して回り込む、前記非目的音源からの反射成分を収音するとともに、前記アレイマイクの指向を前記非目的音源に向けて、前記非目的音源からの直接音を収音するステップと、
前記非目的音源からの反射成分に相当する信号と前記非目的音源からの直接音に相当する信号の比率からなる、前記非目的音源からの音声の反射率を帯域毎に算出して学習するステップと、
前記アレイマイクの指向を前記目的音源に向けて、前記目的音源からの直接音と前記非目的音源からの反射成分を処理対象音として収音するとともに、前記アレイマイクの指向を前記非目的音源に向けて、前記非目的音源からの直接音を収音するステップと、
前記非目的音源からの直接音に相当する信号に前記非目的音源からの音声の反射率を帯域毎に乗じて、前記処理対象音に相当する信号から帯域毎に減算するステップと
を含む収音方法をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010042263A JP2011182062A (ja) | 2010-02-26 | 2010-02-26 | 収音装置、収音方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010042263A JP2011182062A (ja) | 2010-02-26 | 2010-02-26 | 収音装置、収音方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011182062A true JP2011182062A (ja) | 2011-09-15 |
Family
ID=44693142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010042263A Withdrawn JP2011182062A (ja) | 2010-02-26 | 2010-02-26 | 収音装置、収音方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011182062A (ja) |
-
2010
- 2010-02-26 JP JP2010042263A patent/JP2011182062A/ja not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109087663B (zh) | 信号处理器 | |
JP5386936B2 (ja) | 放収音装置 | |
JP4767166B2 (ja) | ハウリング抑圧装置、プログラム、集積回路、およびハウリング抑圧方法 | |
JP6090120B2 (ja) | 信号処理システムおよび信号処理方法 | |
US8204198B2 (en) | Method and apparatus for selecting an audio stream | |
US20160205263A1 (en) | Echo Cancellation Method and Apparatus | |
KR20130117750A (ko) | 컴퓨테이셔널 청각 장면 분석에 기초한 단청 노이즈 억제 | |
US9462552B1 (en) | Adaptive power control | |
JP2012216998A (ja) | 信号処理装置及び信号処理方法 | |
US8885815B1 (en) | Null-forming techniques to improve acoustic echo cancellation | |
US10468020B2 (en) | Systems and methods for removing interference for audio pattern recognition | |
CN113170024B (zh) | 回声消除方法、延时估计方法、装置、存储介质及设备 | |
US9313573B2 (en) | Method and device for microphone selection | |
KR20090056598A (ko) | 마이크로폰을 통해 입력된 사운드 신호로부터 잡음을제거하는 방법 및 장치 | |
JP2010268129A (ja) | 電話装置、エコーキャンセラ及びエコーキャンセルプログラム | |
CN107919134B (zh) | 啸叫检测方法及装置和啸叫抑制方法及装置 | |
CN109524018B (zh) | 一种回声处理方法及设备 | |
JP2007181099A (ja) | 放収音装置 | |
US10937441B1 (en) | Beam level based adaptive target selection | |
CN112151051B (zh) | 音频数据的处理方法和装置及存储介质 | |
US11205437B1 (en) | Acoustic echo cancellation control | |
JP4536020B2 (ja) | 雑音除去機能を有する音声入力装置および方法 | |
WO2019239977A1 (ja) | エコー抑圧装置、エコー抑圧方法およびエコー抑圧プログラム | |
JP2011182062A (ja) | 収音装置、収音方法およびプログラム | |
CN115171703B (zh) | 分布式语音唤醒方法和装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20130507 |