JP2005136709A - 収音方法、装置、プログラム、および記録媒体 - Google Patents

収音方法、装置、プログラム、および記録媒体 Download PDF

Info

Publication number
JP2005136709A
JP2005136709A JP2003370697A JP2003370697A JP2005136709A JP 2005136709 A JP2005136709 A JP 2005136709A JP 2003370697 A JP2003370697 A JP 2003370697A JP 2003370697 A JP2003370697 A JP 2003370697A JP 2005136709 A JP2005136709 A JP 2005136709A
Authority
JP
Japan
Prior art keywords
channel
received
sound
speaker
covariance matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003370697A
Other languages
English (en)
Other versions
JP4298466B2 (ja
Inventor
Kazunori Kobayashi
和則 小林
Yoichi Haneda
陽一 羽田
Kiyotaka Sakauchi
澄宇 阪内
Suehiro Shimauchi
末廣 島内
Kenichi Furuya
賢一 古家
Akira Emura
暁 江村
Akitoshi Kataoka
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003370697A priority Critical patent/JP4298466B2/ja
Publication of JP2005136709A publication Critical patent/JP2005136709A/ja
Application granted granted Critical
Publication of JP4298466B2 publication Critical patent/JP4298466B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic Arrangements (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】マイクロホンから見た開き角が小さい位置に話者がいる場合でも音像の定位感のある収音を実現する。
【解決手段】共分散行列計算部104は、受音信号から共分散行列を計算し、共分散行列記憶部106に話者位置検出部105で検出された話者位置ごとに記憶する。L(R)チャネルフィルタ係数計算部107L、107Rはそれぞれ受音された各話者音声成分が各話者位置に対応するL(R)チャネルミキシング係数でミキシングされる条件で、記憶された共分散行列とL(R)チャネルミキシング係数からL(R)チャネルフィルタ係数を算出し、L(R)チャネルフィルタ102L1〜102LM、102R1〜102RMに設定する。Lチャネルフィルタ102L1〜102LMの出力はLチャネル加算器103Lで、Rチャネルフィルタ102R1〜102RMの出力はRチャネル加算器103Rで加算され、Lチャネル出力信号、Rチャネル出力信号が得られる。
【選択図】図1

Description

本発明は、TV会議や音声会議、電話、遠隔講義などの収音方法および装置に関する。
図10は従来技術の収音装置の構成図である。従来技術の収音装置は指向性マイクロホン901Lと901Rで構成され、その指向性の主軸は120°程度の開き角で配置されている。
2個の指向性マイクロホンを異なる方向を向けて配置することにより、話者の位置によってLチャネルとRチャネルに収音される音声レベルに差が生じる。これらの出力信号を2つのスピーカから再生することにより、音像の定位感のある再生を行うことができる。
例えば、図10の話者CはLチャネルマイクロホン901Lの主軸方向にいるので、収音された話者Cの音声レベルはLチャネルのほうが大きく、再生したときにLチャネル側のスピーカに音像が定位する。また、LチャネルとRチャネルのマイクロホン901L,901Rの中間にいる話者Aの音声は、両マイクロホンにほぼ同じレベルで収音されるので、LチャネルとRチャネルのスピーカの中間に音像が定位する。
このように、従来技術では音像の定位感のあるステレオ収音を行うことができる。
中島平太郎ら著、応用電気音響、コロナ社出版、日本音響学会編、pp.262−268、昭和54年
上述した従来技術の収音方法では、以下に示す問題がある。
音声の距離減衰の影響により、マイクロホンから距離が離れている話者の音声レベルが小さく聞き取りづらい。もし、マイクの感度を上昇させ距離の離れている話者に対して適正なレベルとしたとしても、マイクロホンに近い話者の音声が過大なレベルとなる。
図10の話者Aと話者Bのようにマイクロホンから見た開き角が小さい場合、話者Aと話者Bのマイクロホン間のレベル差はほぼ同じとなり、音像の定位感が得られなくなる。
雑音や、スピーカから再生される受話信号がマイクロホンに収音され、聞き取りづらい音声となる。
複数人でテーブルを囲むTV会議や音声会議に従来技術を適用した場合、上記の問題を生じ、高品質な音声で音像の定位感のある通信を行うことが難しい。
本発明の目的は、マイクロホンから距離が離れている話者の音声を適正レベルにすることで聞き取りやすい音量での通話を実現し、マイクロホンから見た開き角が小さい位置に話者がいる場合でもLRチャネル間のレベル差を所望のレベル差とすることで音像の定位感のある収音を実現し、雑音と受話信号を抑圧した高品質な送話音声を得る収音方法、装置、およびプログラムを提供することである。
本発明の第1の態様によれば、収音方法は、
複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出段階と、
複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算段階と、
前記共分散行列を話者位置ごとに記憶する共分散行列記憶段階と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされる条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされる条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階を有する。
複数マイクロホンからの受音信号から話者位置を検出し、共分散行列を求め、話者位置ごとに所望のLRチャネル間のレベル差を与えるフィルタ係数を求め、それらのフィルタ係数でマイクロホン受音信号をチャネルごとにフィルタリングすることで、話者位置ごとに所望のレベル差をもったステレオ出力信号を得ることができる。
本発明の第2の態様によれば、収音方法は、
複数の収音手段の各々で受音された受音信号から話者位置と雑音区間を検出する話者位置検出段階と、
複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算段階と、
前記共分散行列を雑音区間と話者位置ごとに記憶する共分散行列記憶段階と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階を有する。
話者位置および雑音区間を推定し、各話者位置に対する共分散行列と雑音に対する共分散行列を保存しておき、これらを用いてLチャネルとRチャネルフィルタ係数を求め、これらのフィルタ係数で、それぞれマイクロホン受音信号をフィルタリングし加算し、Lチャネル出力信号とRチャネル出力信号を得る。これにより、雑音の抑圧と、各話者からの音声信号がLチャネルとRチャネルでレベル差を持った良好な音像の定位が実現する。
本発明の第3の態様によれば、収音方法は、
複数の収音手段の各々で受音された受音信号と、通信相手からのLチャネル受話信号とRチャネル受話信号から、送話区間、受話区間、雑音区間を検出する送受話検出段階と、
複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出段階と、
複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算段階と、
前記共分散行列を受話区間と雑音区間と話者位置ごとに記憶する共分散行列記憶段階と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階を有する。
受話信号とマイクロホン受音信号から受話区間、送話区間、雑音区間を検出し、送話区間であった場合に話者位置を推定し、各話者位置に対する共分散行列と雑音の共分散行列とエコーの共分散行列を保存しておき、これらを用いてLチャネルとRチャネルフィルタ係数を求め、これらのフィルタ係数で、それぞれマイクロホン受音信号をフィルタリングし加算し、Lチャネル出力信号とRチャネル出力信号を得る。これにより、雑音とエコーが抑圧され、各話者からの音声信号がLチャネルとRチャネルでレベル差を持ち、高品質な音声での通話と良好な音像の定位が実現する。
本発明の第4の態様によれば、収音方法は、
複数の収音手段の各々で受音された受音信号と、通信相手からのLチャネル受話信号とRチャネル受話信号から、送話区間、受話区間、雑音区間を検出する送受話検出段階と、
複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出段階と、
複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号から共分散行列を計算する共分散行列計算段階と、
前記共分散行列を受話区間と雑音区間と話者位置ごとに記憶する共分散行列記憶段階と、
各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
前記複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
前記複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階を有する。
複数マイクロホンの受音信号から受話区間と雑音区間と送話区間を検出し、送話区間では話者位置を検出し、共分散行列を求め、エコー抑圧と雑音抑圧と話者位置ごとに所望のLRチャネル間のレベル差を与えるフィルタ係数を求め、それらのフィルタ係数でマイクロホン受音信号をチャネルごとにフィルタリングすることで、エコーと雑音を抑圧し、話者位置ごとに所望のレベル差をもったステレオ出力信号を得ることができる。第3の態様の収音方法に受話信号をフィルタリングすることを追加したことにより、第3の態様の収音方法よりも高いエコー抑圧が実現する。
本発明の第1の実施態様によれば、収音方法は、
前記記憶された各話者の共分散行列から各話者の音声レベルを推定する話者音声レベル推定段階と、
前記各話者の音声レベルから、各話者音声が適正レベルで出力されるための各話者に対するゲインを各々算出するゲイン算出部とをさらに有し、
前記Lチャネルフィルタ係数計算段階は、さらに前記各話者に対するゲインが乗算され、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出し、
前記Rチャネルフィルタ係数計算段階は、さらに前記各話者に対するゲインが乗算され、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出する。
複数マイクロホンの受音信号から受話区間と雑音区間と送話区間を検出し、送話区間では話者位置を検出し、共分散行列を求め、エコー抑圧と雑音抑圧と話者位置ごとに所望のLRチャネル間のレベル差を与え、各話者から発せられた音を適正レベルで収音するフィルタ係数を求め、それらのフィルタ係数でマイクロホン受音信号をチャネルごとにフィルタリングすることで、エコーと雑音を抑圧し、各話者から発せられた音を適正レベルで収音し、話者位置ごとに所望のレベル差をもったステレオ出力信号を得ることができる。
本発明の第2の実施態様によれば、収音方法は、
前記記憶された共分散行列のうち対角成分で最もパワーの大きい成分、または前記記憶された共分散行列の対角成分の加算値の周波数特性を平滑化するゲインを、前記記憶された共分散行列に乗算し、白色化された共分散行列を、前記Lチャネルフィルタ係数計算段階と前記Rチャネルフィルタ係数計算段階に入力する白色化段階をさらに有する。
共分散行列の白色化により、音源の周波数特性に依存しないフィルタを求めることができる。これにより、音源の周波数特性が変化しても、フィルタ係数の変化がなく、本発明の処理による音色の変化を防ぐことができる。
本発明の第3の実施態様によれば、収音方法は、
前記複数の収音手段の各々で受音された信号および前記受話信号の時間領域信号から周波数領域信号に変換するFFT段階と、
前記Lチャネル加算段階と前記Rチャネル加算段階の出力信号を周波数領域信号から時間領域信号に変換するIFFT段階をさらに有し、
前記各段階は周波数領域で演算する。
これにより、時間領域の演算に比べ低演算量を実現できる。
本発明の第4の実施態様によれば、収音方法は、
前記LおよびRチャネルフィルタ係数計算段階と前記LおよびRチャネルフィルタ段階と前記LおよびRチャネル加算段階を、3チャネル以上の1〜Jチャネルフィルタ係数計算段階と1〜Jチャネルフィルタ段階と1〜Jチャネル加算段階に置き換えている。
複数マイクロホンで収音した信号および受話信号から、以下の条件を満たす指向性を形成するLチャネルフィルタ係数とRチャネルフィルタ係数を求める。(条件1)マイクロホンから距離が離れている話者の音声を適切レベル(聞き取りやすいレベル)にする。(条件2)マイクロホンから見た開き角が小さい位置に話者がいる場合でもLRチャネルのレベル差を所望のレベル差(音像の定位感のあるレベル差)とする。(条件3)雑音と受話信号を抑圧する。次に、求められたLチャネルフィルタ係数とRチャネルフィルタ係数で複数マイクロホンで収音した信号および受話信号をフィルタリングし、それらの出力をLチャネル、Rチャネルごとに加算する。
これにより、マイクロホンから距離が離れている話者とマイクロホンに近い話者の音声レベルが適切となり、聞き取りやすい音量での通話が実現する。また、マイクロホンから見た開き角が小さい位置に話者がいる場合でもLRチャネル間で所望のレベル差となり、音像の定位感のある収音を実現する。さらに、雑音と受話信号を抑圧した高品質な音声での通信が実現する。
[第1の実施形態]
図1は本発明の第1の実施形態の収音装置のブロック図である。
本実施形態の収音装置は、マイクロホン1011〜101Mと、Lチャネルフィルタ102L1〜102LMと、Rチャネルフィルタ102R1〜102RMと、Lチャネル加算器103Lと、Rチャネル加算器103Rと、話者位置検出部105と、共分散行列計算部104と、共分散行列記憶部106と、Lチャネルフィルタ係数計算部107Lと、Rチャネルフィルタ係数計算部107Rと、Lチャネルミキシング係数設定部203Lと、Rチャネルミキシング係数設定部203Rにより構成される。
本実施形態は、話者位置を推定し、各話者位置に対する共分散行列を保存しておき、これらを用いてLチャネルとRチャネルフィルタ係数を求め、これらのフィルタ係数で、それぞれマイクロホン受音信号をフィルタリングし加算し、Lチャネル出力信号とRチャネル出力信号を得る。これにより、各話者からの音声信号がLチャネルとRチャネルで所望のレベル差を持ち、良好な音像の定位が実現する。
まず、話者位置検出部105は、マイクロホン1011〜101Mで受音したマイクロホン受音信号から、話者の位置を検出する。音源位置の推定方法は、例えば相互相関法による方法がある。
M個のマイクロホンがあると想定し、i番目マイクロホン100iとj番目マイクロホン100jで受音された信号より求められる受音信号間遅延時間差を
Figure 2005136709
とする。受音信号間遅延時間差は、信号間の相互相関を求め、その最大ピーク位置から求めることができる。次に、m番目の受音位置を(xm,ym,zm)、推定音源位置を
Figure 2005136709
と表す。これらの位置から求められる推定受音信号間遅延時間差
Figure 2005136709
は、式(1)で表される。
Figure 2005136709
次に、受音信号間遅延時間差
Figure 2005136709
に音速cを乗じ距離に換算したものを、それぞれ受音位置間距離差
Figure 2005136709
とし、測定値
Figure 2005136709
と推定値
Figure 2005136709
の二乗平均誤差
Figure 2005136709
を求めれば、式(2)となる。
Figure 2005136709
式(2)の二乗平均誤差
Figure 2005136709
を最小化する解を求めれば、受音信号間遅延時間差の測定値と推定値の誤差が最小となる推定音源位置を求めることができる。ただし、式(2)は非線形連立方程式となっており、解析的に解くことは困難であるので、逐次修正を用いた数値解析により求める。
式(2)を最小化する推定音源位置
Figure 2005136709
を求めるには、ある点における勾配を求め、誤差が小さくなる方向に推定音源位置を修正していき、勾配が0となる点を求めればよいので、修正式は式(3)のようになる。
Figure 2005136709
以上、式(3)を繰返し計算することで、誤差が最小となる推定音源位置を求めることができる。
次に、共分散行列計算部104では、マイクロホン受音信号の共分散を求め、それを行列にする。まず、マイクロホン受音信号の周波数領域変換信号をX1(ω)〜XM(ω)とする。これれらの信号の共分散行列
Figure 2005136709
は、式(9)により算出される。
Figure 2005136709
次に、共分散行列記憶部106では、話者位置検出部105の検出結果に基づき、共分散行列
Figure 2005136709
を、各音源位置に対する共分散行列
Figure 2005136709
として保存する。
Lチャネルフィルタ係数算出部107LとRチャネルフィルタ係数算出部107Rは、各話者から発せられた音を所望のレベル差で収音するためのフィルタ係数を計算する。まず、各マイクロホンに接続されたLチャネルフィルタ102L1〜102LMとRチャネルフィルタ102R1〜102RMのフィルタ係数を周波数領域に変換したものを、それぞれHL,1(ω)〜HL,M(ω)とHR,1(ω)〜HR,M(ω)とする。次に、これらのフィルタ係数を式(10)と式(11)により行列としたものを
Figure 2005136709
とする。
Figure 2005136709
また、i番目音源が発音している期間のマイクロホン受音信号の周波数領域変換信号をXSi,1(ω)〜XSi,M(ω)とする。
ここで、フィルタ係数行列
Figure 2005136709
に要求される条件は、i番目話者のマイクロホン受音信号XSi,1(ω)〜XSi,M(ω)をフィルタ係数行列
Figure 2005136709
でそれぞれフィルタリングし、フィルタリング後の信号をチャネルごとに加算したときに、LチャネルとRチャネルの各話者音声信号がi番目話者位置(Xi,Yi,Zi)に対応した所望のレベル差PDiff(Xi,Yi,Zi)(良好な音像定位を実現するレベル差であり、あらかじめ話者位置ごとに設定される)となっていることである。したがって、各音源の信号をそれぞれフィルタリングおよび加算した信号が所望のレベル差PDiff(Xi,Yi,Zi)となるようにM行のミキシング係数行列
Figure 2005136709
をマイクロホン受音信号にそれぞれ乗じた信号となる式(12)と式(13)が理想条件となる。
Figure 2005136709
所望のレベル差PDiff(Xi,Yi,Zi)を実現するミキシング係数行列
Figure 2005136709
は、Lチャネルミキシング係数設定部203LとRチャネルミキシング係数設定部203Rで話者位置ごとにあらかじめ設定されている。例えば以下に述べるように設定される。図9は本発明において実現する指向性例を示した図である。図9に示すマイクロホンと話者の配置では、マイクロホンから見た開き角が小さい位置に複数の話者が存在する。このような場合、従来技術のステレオマイクロホンでは、ほとんど音像の定位感を得ることはできない。そこで、本発明では音像の定位感を強調する指向性を形成する。例えば、話者位置3に対しては、Lチャネルのレベルを大きくし、Rチャネルのレベルを小さくして、大きなレベル差が付くようにする。このときミキシング係数行列は
Figure 2005136709
のように設定する。このようにすることで、話者位置3からの発話に対して20dBのレベル差を得ることができる。他の話者位置に対しても同様にミキシング係数行列を設定すれば、図9に示すような指向性が得られ、良好な音像定位を実現できる。
次に、式(12)と式(13)の条件をフィルタ係数行列
Figure 2005136709
について最小二乗解で解けば、式(14)と式(15)となる。ただし、CSiは音源位置の感度拘束に対する重みの定数であり、値が大きくなるほど感度拘束が強くなる。
Figure 2005136709
以上で、所望のレベル差を得るためのフィルタ係数を求める式(14)と式(15)を導出した。
次に、式(14)と式(15)により求められた、Lチャネルフィルタ係数
Figure 2005136709
とRチャネルフィルタ係数
Figure 2005136709
は、Lチャネルフィルタ102L1〜102LMとRチャネルフィルタ102R1〜102RMにそれぞれコピーされ、マイクロホン受音信号をそれぞれフィルタリングする。フィルタリング後の信号は、チャネルごとに加算器103Lと103Rで加算され、ステレオ出力信号として出力される。
以上示したように、本実施形態では、複数マイクロホンの受音信号から話者位置を検出し、共分散行列を求め、話者位置ごとに所望のLRチャネル間のレベル差を与えるフィルタ係数を求め、それらのフィルタ係数でマイクロホン受音信号をチャネルごとにフィルタリングすることで、話者位置ごとに所望のレベル差をもったステレオ出力信号を得ることができる。
[第2の実施形態]
本発明の第2の実施形態の収音装置について説明する。本実施形態のブロック図は、第1の実施形態と同じ図1である。本実施形態は、第1の実施形態の収音装置に雑音抑圧機能を加えたものである。
本実施形態の収音装置は、マイクロホン1011〜101Mと、Lチャネルフィルタ102L1〜102LMと、Rチャネルフィルタ102R1〜102RMと、Lチャネル加算器103Lと、Rチャネル加算器103Rと、話者位置検出部105と、共分散行列計算部104と、共分散行列記憶部106と、Lチャネルフィルタ係数計算部107Lと、Rチャネルフィルタ係数計算部107Rと、Lチャネルミキシング係数設定部203Lと、Rチャネルミキシング係数設定部203Rにより構成される。
本実施形態は、話者位置および雑音区間を推定し、各話者位置に対する共分散行列と雑音に対する共分散行列を保存しておき、これらを用いてLチャネルとRチャネルフィルタ係数を求め、これらのフィルタ係数で、それぞれマイクロホン受音信号をフィルタリングし加算し、Lチャネル出力信号とRチャネル出力信号を得る。これにより、雑音の抑圧と、各話者からの音声信号がLチャネルとRチャネルでレベル差を持った、良好な音像の定位が実現する。
まず、話者位置検出部105は、マイクロホン1011〜101Mで受音したマイクロホン受音信号のパワーから雑音区間と発話区間を検出する。例えば、それぞれのマイクロホン受音信号について、短時間平均パワー(0.1〜1s程度)と、長時間平均パワー(1s〜100s程度)を求め、短時間平均パワーと長時間平均パワーの比が雑音区間の閾値未満の場合に雑音区間と判定し、発話の閾値以上の場合に発話区間と判定する。発話区間と判定された場合は、第1の実施形態と同様にして、話者位置を検出する。
次に、共分散行列計算部104は、第1の実施形態と同様にして、共分散行列
Figure 2005136709
を算出する。
共分散行列記憶部108では、話者位置検出部105の検出結果に基づき、共分散行列
Figure 2005136709
を、各音源位置に対する共分散行列
Figure 2005136709
と雑音の共分散行列
Figure 2005136709
として保存する。
Lチャネルフィルタ係数算出部107LとRチャネルフィルタ係数算出部107Rは、各話者から発せられた音を所望のレベル差で収音し、雑音を抑圧するためのフィルタ係数を計算する。ここで、各マイクロホンに接続されたLチャネルフィルタ
Figure 2005136709
とRチャネルフィルタ
Figure 2005136709
に要求される条件は、以下の2つである。1つ目は、第1の実施形態の式(12)と式(13)に示したLチャネルとRチャネルの各話者音声信号がi番目の話者位置(Xi,Yi,Zi)に対応した所望のレベル差PDiff(Xi,Yi,Zi)となる条件である。2つ目は、雑音を抑圧する条件であり、マイクロホン受音信号の雑音成分XN,1(ω)〜XN,M(ω)がフィルタ部に入力された場合に各チャネルの出力が0となる式(16)と式(17)である。
Figure 2005136709
次に、式(12)と式(16)、式(13)と式(17)の条件をフィルタ係数行列
Figure 2005136709
について最小二乗解で解けば、式(18)と式(19)となる。ただし、CSiは音源位置の感度拘束に対する重みの定数であり、値が大きくなるほど感度拘束が強くなる。CNは雑音抑圧に対する重みの定数であり、値が大きくなるほど雑音抑圧量が増加する。
Figure 2005136709
以上で、雑音を抑圧し、所望のレベル差を得るためのフィルタ係数を求める式(18)と式(19)を導出した。
次に、式(18)と式(19)により求められた、Lチャネルフィルタ係数
Figure 2005136709
とRチャネルフィルタ係数
Figure 2005136709
は、Lチャネルフィルタ102L1〜102LMとRチャネルフィルタ102R1〜102RMにそれぞれコピーされ、マイクロホン受音信号をそれぞれフィルタリングする。フィルタリング後の信号は、チャネルごとに加算器103Lと103Rで加算され、ステレオ出力信号として出力される。
以上示したように、本実施形態では、複数マイクロホンの受音信号から、話者位置と雑音区間を検出し、共分散行列を求め、雑音抑圧と話者位置ごとに所望のLRチャネル間のレベル差を与えるフィルタ係数を求め、それらのフィルタ係数でマイクロホン受音信号をチャネルごとにフィルタリングすることで、雑音を抑圧し、話者位置ごとに所望のレベル差をもったステレオ出力信号を得ることができる。
[第3の実施形態]
図2は本発明の第3の実施形態の収音装置のブロック図である。
本実施形態の収音装置は、マイクロホン1011〜101Mと、Lチャネルフィルタ102L1〜102LMと、Rチャネルフィルタ102R1〜102RMと、Lチャネル加算器103Lと、Rチャネル加算器103Rと、送受話検出部201と、話者位置検出部105と、共分散行列計算部104と、共分散行列記憶部106と、Lチャネルフィルタ係数計算部107Lと、Rチャネルフィルタ係数計算部107Rと、Lチャネルミキシング係数設定部203Lと、Rチャネルミキシング係数設定部203Rにより構成される。
本実施形態は、第1と第2のいずれかの実施形態の収音装置にエコー(マイクロホンにより収音された受話信号)抑圧機能を加えたものである。
本実施形態は、受話信号とマイクロホン受音信号から受話区間、送話区間、雑音区間を検出し、送話区間であった場合に話者位置を推定し、各話者位置に対する共分散行列と雑音の共分散行列とエコーの共分散行列を保存しておき、これらを用いてLチャネルとRチャネルフィルタ係数を求め、これらのフィルタ係数で、それぞれマイクロホン受音信号をフィルタリングし加算し、Lチャネル出力信号とRチャネル出力信号を得る。これにより、雑音とエコーが抑圧され、各話者からの音声信号がLチャネルとRチャネルでレベル差を持ち、高品質な音声での通話と良好な音像の定位が実現する。
まず、送受話検出部201は、マイクロホン1011〜101Mで受音したマイクロホン受音信号とLチャネルおよびRチャネルの受話信号のパワーから受話区間と発話区間と雑音区間を検出する。例えば、各チャネルの受話信号について、短時間平均パワー(0.1〜1s程度)と、長時間平均パワー(1s〜100s程度)を求め、短時間平均パワーと長時間平均パワーの比が受話区間の閾値以上だった場合に受話区間と判定する。また、それぞれのマイクロホン受音信号について、短時間平均パワー(0.1〜1s程度)と長時間平均パワー(1s〜100s程度)を求め、短時間平均パワーと長時間平均パワーの比が雑音区間の閾値未満の場合に雑音区間と判定し、発話の閾値以上の場合に発話区間と判定する。
話者位置検出部105は、送受話検出部201で発話区間と判定された場合に、第1の実施形態と同様にして、話者位置を検出する。
次に、共分散行列計算部104は、第1の実施形態と同様にして、共分散行列
Figure 2005136709
を算出する。
共分散行列記憶部106は、送受話検出部201と話者位置検出部105の検出結果に基づき、共分散行列
Figure 2005136709
を、各音源位置に対する共分散行列
Figure 2005136709
と雑音の共分散行列
Figure 2005136709
とエコーの共分散行列
Figure 2005136709
として保存する。
Lチャネルフィルタ係数算出部107LとRチャネルフィルタ係数算出部107Rは、各話者から発せられた音を所望のレベル差で収音し、エコーと雑音を抑圧するためのフィルタ係数を計算する。ここで、各マイクロホンに接続されたLチャネルフィルタ
Figure 2005136709
とRチャネルフィルタ
Figure 2005136709
に要求される条件は、以下の3つである。1つ目は、第1の実施形態の式(12)と式(13)に示したLチャネルとRチャネルの各話者音声信号がi番目の話者位置(Xi,Yi,Zi)に対応した所望のレベル差PDiff(Xi,Yi,Zi)となる条件である。2つ目は、第2の実施形態の式(16)と式(17)で示した雑音を抑圧する条件である。3つ目の条件は、エコー成分を抑圧する条件であり、マイクロホン受音信号のエコー成分XE,1(ω)〜XE,M(ω)がフィルタ部に入力された場合に各チャネルの出力が0となる式(20)と式(21)である。
Figure 2005136709
次に、式(12)と式(16)と式(20)、式(13)と式(17)と式(21)の条件をフィルタ係数行列
Figure 2005136709
について最小二乗解で解けば、式(22)と式(23)となる。ただし、CSiは音源位置の感度拘束に対する重みの定数であり、値が大きくなるほど感度拘束が強くなる。CNは雑音抑圧に対する重みの定数であり、値が大きくなるほど雑音抑圧量が増加する。CEはエコー抑圧に対する重みの定数であり、値が大きくなるほどエコー抑圧量が増加する。
Figure 2005136709
以上で、雑音とエコーを抑圧し、所望のレベル差を得るためのフィルタ係数を求める式(22)と式(23)を導出した。
次に、式(22)と式(23)により求められた、Lチャネルフィルタ係数
Figure 2005136709
とRチャネルフィルタ係数
Figure 2005136709
は、Lチャネルフィルタ102L1〜102LMとRチャネルフィルタ102R1〜102RMにそれぞれコピーされ、マイクロホン受音信号をそれぞれフィルタリングする。フィルタリング後の信号は、チャネルごとに加算器103Lと103Mで加算され、ステレオ出力信号として出力される。
以上示したように、本実施形態では、複数マイクロホンの受音信号から受話区間と雑音区間と送話区間を検出し、送話区間では話者位置を検出し、共分散行列を求め、エコー抑圧と雑音抑圧と話者位置ごとに所望のLRチャネル間のレベル差を与えるフィルタ係数を求め、それらのフィルタ係数でマイクロホン受音信号をチャネルごとにフィルタリングすることで、エコーと雑音を抑圧し、話者位置ごとに所望のレベル差をもったステレオ出力信号を得ることができる。
[第4の実施形態]
図3は本発明の第4の実施形態の収音装置のブロック図である。
本実施形態の収音装置は、マイクロホン1011〜101Mと、Lチャネルフィルタ102L1〜102LM、301LL、301LRと、Rチャネルフィルタ102R1〜102RM、301RL、301RRと、Lチャネル加算器103Lと、Rチャネル加算器103Rと、送受話検出部201と、話者位置検出部105と、共分散行列計算部104と、共分散行列記憶部106と、Lチャネルフィルタ係数計算部107Lと、Rチャネルフィルタ係数計算部107Rと、Lチャネルミキシング係数設定部203Lと、Rチャネルミキシング係数設定部203Rにより構成される。
本実施形態は、第3の実施形態の収音装置のLチャネルフィルタとRチャネルフィルタに受話信号をフィルタリングするフィルタ301LL、301LR、301RL、301RRを追加した構成であり、第3の実施形態よりもさらに高いエコー抑圧を実現する。
まず、送受話検出部201は、第3の実施形態と同様に受話区間と発話区間と雑音区間を検出する。
話者位置検出部105は、送受話検出部201で発話区間と判定された場合に、第1の実施形態と同様にして、話者位置を検出する。
次に、共分散行列計算部104は、受話信号も含めた共分散行列
Figure 2005136709
を算出する。マイクロホン受音信号の周波数領域変換信号をX1(ω)〜XM(ω)とし、LチャネルとRチャネルの受話信号の周波数領域変換信号をそれぞれZL(ω)とZR(ω)とする。これらの信号の共分散行列
Figure 2005136709
は、式(24)により算出される。
Figure 2005136709
次に、共分散行列記憶部106は、送受話検出部201と話者位置検出部105の検出結果に基づき、共分散行列
Figure 2005136709
を、各音源位置に対する共分散行列
Figure 2005136709
と雑音の共分散行列
Figure 2005136709
とエコーの共分散行列
Figure 2005136709
として保存する。
次に、Lチャネルフィルタ係数算出部107LとRチャネルフィルタ係数算出部107Rは、各話者から発せられた音を所望のレベル差で収音し、エコーと雑音を抑圧するためのフィルタ係数を計算する。まず、各マイクロホンに接続されたLチャネルフィルタ102L1〜102LMとRチャネルフィルタ102R1〜102RMのフィルタ係数を周波数領域に変換したものを、それぞれHL,1(ω)〜HL,M(ω)とHR,1(ω)〜HR,M(ω)とし、LおよびRチャネル受話信号をフィルタリングするためのLチャネルフィルタをFL,L(ω)とFL,R(ω)とし、LおよびRチャネル受話信号をフィルタリングするためのRチャネルフィルタをFR,L(ω)とFR,R(ω)とする。次に、これらのフィルタ係数を式(25)と式(26)により行列としたものを
Figure 2005136709
とする。
Figure 2005136709
ここで、Lチャネルフィルタ
Figure 2005136709
とRチャネルフィルタ
Figure 2005136709
に要求される条件は、以下の3つである。
1つ目は、LチャネルとRチャネルの出力信号の各話者音声信号がi番目の話者位置(Xi,Yi,Zi)に対応した所望のレベル差PDiff(Xi,Yi,Zi)となる条件である。第1の実施形態と同様に、この条件は式(26)と式(27)で表される。
Figure 2005136709
ただし、ミキシング係数行列
Figure 2005136709
は、1〜M番目の要素が第1の実施形態のミキシング係数行列
Figure 2005136709
と同様に設定され、M+1とM+2番目の要素が0であるM+2行1列の行列である。
2つ目は、雑音を抑圧する条件である。マイクロホン受音信号のエコー成分XE,1(ω)〜XE,M(ω)がフィルタ部に入力された場合に各チャネルの出力が0となる式(28)と式(29)が、その条件となる。
Figure 2005136709
3つ目の条件は、エコー成分を抑圧する条件である。マイクロホン受音信号のエコー成分XE,1(ω)〜XE,M(ω)と受話信号ZL(ω)、ZR(ω)がフィルタ部に入力された場合に各チャネルの出力が0となる式(30)と式(31)がその条件となる。
Figure 2005136709
次に、式(26)と式(28)と式(30)、式(27)と式(29)と式(31)の条件をフィルタ係数行列
Figure 2005136709
について最小二乗解で解けば、式(32)と式(33)となる。ただし、CSiは音源位置の感度拘束に対する重みの定数であり、値が大きくなるほど感度拘束が強くなる。CNは雑音抑圧に対する重みの定数であり、値が大きくなるほど雑音抑圧量が増加する。CEはエコー抑圧に対する重みの定数であり、値が大きくなるほどエコー抑圧量が増加する。
Figure 2005136709
以上で、雑音とエコーを抑圧し、所望のレベル差を得るためのフィルタ係数を求める式(32)と式(33)を導出した。
次に、式(32)と式(33)により求められた、Lチャネルフィルタ係数
Figure 2005136709
とRチャネルフィルタ係数
Figure 2005136709
は、Lチャネルフィルタ102L1〜102LM、301LL、301LRと、Rチャネルフィルタ102R1〜102RM、301RL、301RRにそれぞれコピーされ、マイクロホン受音信号と受話信号をそれぞれフィルタリングする。フィルタリング後の信号は、チャネルごとに加算器103Lと103Rで加算され、ステレオ出力信号として出力される。
以上示したように、本実施形態では、複数マイクロホンの受音信号から受話区間と雑音区間と送話区間を検出し、送話区間では話者位置を検出し、共分散行列を求め、エコー抑圧と雑音抑圧と話者位置ごとに所望のLRチャネル間のレベル差を与えるフィルタ係数を求め、それらのフィルタ係数でマイクロホン受音信号をチャネルごとにフィルタリングすることで、エコーと雑音を抑圧し、話者位置ごとに所望のレベル差をもったステレオ出力信号を得ることができる。また、第3の実施形態の収音装置に受話信号をフィルタリングするフィルタを追加したことにより、第3の実施形態の収音装置よりも高いエコー抑圧が実現する。
[第5の実施形態]
図4は本発明の第5の実施形態の収音装置の要部のブロック図である。
本実施形態の収音装置は、第1〜4の実施形態のいずれかの収音装置に話者音声レベル推定部108とゲイン算出部109を追加した構成である。話者音声レベル推定部108は、各話者の共分散行列より各話者の音声レベルを推定し、ゲイン算出部109は、各話者の音声レベルから、各話者の出力音声レベルが適正レベルとなるゲインを算出する。これにより、全ての話者の音声レベルを適正レベルとし、聞き取りやすい音量での収音を実現する。また、第1〜4の実施形態のいずれかの収音装置と同様に、エコー抑圧、雑音抑圧、チャネル間のレベル差をつけた良好な音像定位も同時に実現する。
まず、送受話検出部201、話者位置検出部105、共分散行列計算部104、共分散記憶部106については、第1から第4の実施形態のいずれかの収音装置と同様な処理となる。
話者音声レベル推定部108は、各話者の音声レベルPSiを、共分散行列記憶部106に記憶されている各話者位置に対する共分散行列
Figure 2005136709
と、話者位置ごとのシングルチャネルミキシング係数行列
Figure 2005136709
から式(34)または式(35)を用いて求められる。シングルチャネルミキシング係数行列
Figure 2005136709
には、例えばミキシング係数行列
Figure 2005136709
を加算平均した行列、またはミキシング係数行列
Figure 2005136709
を加算平均した行列を用いる。
Figure 2005136709
次に、ゲイン算出部109は、各話者音声レベルPSiを適正レベルPopt(聞き取りやすいレベルで、あらかじめ設定される)にするためのゲインASiを算出する。ゲインASiは、式(36)により求めることができる。
Figure 2005136709
Lチャネルフィルタ係数算出部107LとRチャネルフィルタ係数算出部107Rは、各話者から発せられた音を適正レベルで収音し、各話者から発せられた音をLRチャネルで所望のレベル差とし、エコーと雑音を抑圧するためのフィルタ係数を計算する。エコーと雑音を抑圧する条件は、第1〜4の実施形態のいずれかの収音装置と同様である。各話者から発せられた音を適正レベルで収音し、各話者から発せられた音をLRチャネルで所望のレベル差とする条件は、式(37)と式(38)、または式(39)と式(40)で表される。
Figure 2005136709
次に、第1〜4の実施形態のいずれかの収音装置のエコーと雑音を抑圧する条件と、各話者から発せられた音を適正レベルで収音し、各話者から発せられた音をLRチャネルで所望のレベル差とする条件である式(37)と式(38)、または式(39)と式(40)を、フィルタ係数行列
Figure 2005136709
または
Figure 2005136709
について最小二乗解で解けば、式(41)と式(42)、または式(43)と式(44)、または式(45)と式(46)、または式(47)と式(48)となる。
Figure 2005136709
ただし、式(41)と式(42)は各話者から発せられた音を適正レベルで収音し、各話者から発せられた音をLRチャネルで所望のレベル差とする条件で求めたフィルタ係数、式(43)と式(44)は各話者から発せられた音を適正レベルで収音し、各話者から発せられた音をLRチャネルで所望のレベル差とし、雑音を抑圧する条件で求めたフィルタ係数、式(45)と式(46)は、各話者から発せられた音を適正レベルで収音し、各話者から発せられた音をLRチャネルで所望のレベル差とし、エコーと雑音を抑圧する条件で求めたフィルタ係数、式(47)と式(48)は、受話信号をフィルタリングするフィルタを持ち、各話者から発せられた音を適正レベルで収音し、各話者から発せられた音をLRチャネルで所望のレベル差とし、エコーと雑音を抑圧する条件で求めたフィルタ係数である。
次に、式(41)と式(42)、または式(43)と式(44)、または式(45)と式(46)、または式(47)と式(48)により求められた、Lチャネルフィルタ係数とRチャネルフィルタ係数は、Lチャネルフィルタ102L1〜102LM、301LL、301LRと、Rチャネルフィルタ102R1〜102RM、301RL、301RRにそれぞれコピーされ、マイクロホン受音信号と受話信号をそれぞれフィルタリングする。フィルタリング後の信号は、チャネルごとに加算器103Lと103Rで加算され、ステレオ出力信号として出力される。
以上示したように、本実施形態では、複数のマイクロホンの受音信号から受話区間と雑音区間と送話区間を検出し、送話区間では話者位置を検出し、共分散行列を求め、エコー抑圧と雑音抑圧と話者位置ごとに所望のLRチャネル間のレベル差を与え、各話者から発せられた音を適正レベルで収音するフィルタ係数を求め、それらのフィルタ係数でマイクロホン受音信号をチャネルごとにフィルタリングすることで、エコーと雑音を抑圧し、各話者から発せられた音を適正レベルで収音し、話者位置ごとに所望のレベル差をもったステレオ出力信号を得ることができる。
[第6の実施形態]
図5は本発明の第6の実施形態の収音装置の要部のブロック図である。
本実施形態の収音装置は、第1〜5の実施形態のいずれかの収音装置に白色化部110を追加した構成である。白色化部110は、各共分散行列をLRチャネルフィルタ係数計算部107L,107Rの前段階で白色化する。これにより、マイクロホンで受音された信号の周波数特性に関与しないフィルタ係数が求められ、安定した動作が可能となる。
白色化は、共分散行列
Figure 2005136709
の対角成分のうち最もパワーの大きいRkk(ω)を平均化する白色化ゲイン
Figure 2005136709
を乗算するか、共分散行列の対角成分の平均パワーを平均化する白色化ゲイン
Figure 2005136709
を乗算することで行う。これらは、それぞれ式(49)または式(50)と、式(51)または式(52)により表される。
Figure 2005136709
ただし、βは白色化の度合いを調整する係数であり、1となれば完全な白色化となり、0となれば白色化は行われなくなる。
第5の実施形態の収音装置では、共分散行列の白色化により、音源の周波数特性に依存しないフィルタを求めることができる。これにより、音源の周波数特性が変化しても、フィルタ係数の変化がなく、本発明の処理による音色の変化を防ぐことができる。
これら以外の部分に関しては、第1〜5の実施形態のいずれかの収音装置と同じであるので、説明を省略する。
[第7〜9の実施形態]
図6〜図8はそれぞれ本発明の第7、第8、第9の実施形態の収音装置のブロック図である。
本実施形態の収音装置は、第1〜6の実施形態のいずれかの収音装置にFFT部4011〜401M、501L、501RとIFFT部402L、402Rを追加した構成である。FFT部4011〜401Mは、各マイクロホン受音信号をそれぞれFFTして、時間領域信号から周波数領域信号に変換する。FFT部501L、501Rは、LRチャネル受話信号をそれぞれFFTして、時間領域信号から周波数領域信号に変換する。IFFT部402L、402Rは、LRチャネル加算器103L、103Rの出力信号をそれぞれIFFTして周波数領域信号から時間領域信号に変換する。また、第1〜第6の実施形態の各処理部は全て周波数領域での計算とし、時間領域の演算に比べ低演算量を実現する。
これら以外の部分に関しては、第1〜6の実施形態のいずれかの収音装置と同じであるので、説明を省略する。
[第10の実施形態]
本発明の第10の実施形態について説明する。
本実施形態の収音装置は、第1〜9の実施形態のいずれかの収音装置の出力チャネル数を3チャネル以上のJチャネルとしたものである。LとRチャネルフィルタ係数計算部107L、107RとLとRチャネルフィルタ102L1〜102LM、301LL、301LR、102R1〜102RM、301RL、301RRとLとRチャネル加算器103L、103Rを、3チャネル以上の1〜Jチャネルフィルタ係数計算手段と、1〜Jチャネルフィルタ手段と、1〜Jチャネル加算手段に置き換えた構成である。
出力チャネルを増加させたことにより、3チャネル以上の多チャンネルでの収音が可能となる。
これら以外の部分に関しては、第1〜9の実施形態のいずれかの収音装置と同じであるので、説明を省略する。
なお、本発明は専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムを、コンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行するものであってもよい。コンピュータ読み取り可能な記録媒体とは、フロッピーディスク、光磁気ディスク、CD−ROM等の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記憶装置を指す。さらに、コンピュータ読み取り可能な記録媒体は、インターネットを介してプログラムを送信する場合のように、短時間の間、動的にプログラムを保持するもの(伝送媒体もしくは伝送波)、その場合のサーバとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含む。
本発明の第1および第2の実施形態の収音装置を示すブロック図である。 本発明の第3の実施形態の収音装置を示すブロック図である。 本発明の第4の実施形態の収音装置を示すブロック図である。 本発明の第5の実施形態の収音装置の要部を示すブロック図である。 本発明の第6の実施形態の収音装置の要部を示すブロック図である。 本発明の第7の実施形態の収音装置を示すブロック図である。 本発明の第8の実施形態の収音装置を示すブロック図である。 本発明の第9の実施形態の収音装置を示すブロック図である。 本発明により形成される指向性を示す図である。 従来の収音方法を説明する図である。
符号の説明
1011〜101M マイクロホン
102L1〜102LM、301LL、301LR Lチャネルフィルタ
102R1〜102RM、301RL、301RR Rチャネルフィルタ
103L Lチャネル加算器
103R Rチャネル加算器
104 共分散行列計算部
105 話者位置検出部
106 共分散行列記憶部
107L Lチャネルフィルタ係数計算部
107R Rチャネルフィルタ係数計算部
108 話者音声レベル推定部
109 ゲイン計算部
110 白色化部
201 送受話検出部
202L Lチャネルスピーカ
202R Rチャネルスピーカ
203L Lチャネルミキシング係数設定部
203R Rチャネルミキシング係数設定部
4011〜401M、501L、501R FFT
402L、402R IFFT
901L、901R 従来技術の指向性マイクロホン
902L、902R 本発明により形成される指向特性
903 本発明の処理

Claims (18)

  1. 収音方法であって、
    複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出段階と、
    複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算段階と、
    前記共分散行列を話者位置ごとに記憶する共分散行列記憶段階と、
    各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされる条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
    各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされる条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
    前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
    前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
    前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
    前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階と
    を有する収音方法。
  2. 収音方法であって、
    複数の収音手段の各々で受音された受音信号から話者位置と雑音区間を検出する話者位置検出段階と、
    複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算段階と、
    前記共分散行列を雑音区間と話者位置ごとに記憶する共分散行列記憶段階と、
    各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
    各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
    前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
    前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
    前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
    前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階と
    を有する収音方法。
  3. 収音方法であって、
    複数の収音手段の各々で受音された受音信号と、通信相手からのLチャネル受話信号とRチャネル受話信号から、送話区間、受話区間、雑音区間を検出する送受話検出段階と、
    複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出段階と、
    複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算段階と、
    前記共分散行列を受話区間と雑音区間と話者位置ごとに記憶する共分散行列記憶段階と、
    各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
    各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
    前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
    前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
    前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
    前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階と
    を有する収音方法。
  4. 収音方法であって、
    複数の収音手段の各々で受音された受音信号と、通信相手からのLチャネル受話信号とRチャネル受話信号から、送話区間、受話区間、雑音区間を検出する送受話検出段階と、
    複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出段階と、
    複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号から共分散行列を計算する共分散行列計算段階と、
    前記共分散行列を受話区間と雑音区間と話者位置ごとに記憶する共分散行列記憶段階と、
    各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定段階と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算段階と、
    あらかじめ各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定段階と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算段階と、
    前記複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ段階と、
    前記複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ段階と、
    前記Lチャネルフィルタ段階の出力信号を加算するLチャネル加算段階と、
    前記Rチャネルフィルタ段階の出力信号を加算するRチャネル加算段階と
    を有する収音方法。
  5. 前記記憶された各話者の共分散行列から各話者の音声レベルを推定する話者音声レベル推定段階と、
    前記各話者の音声レベルから、各話者音声が適正レベルで出力されるための各話者に対するゲインを各々算出するゲイン算出部とをさらに有し、
    前記Lチャネルフィルタ係数計算段階は、さらに前記各話者に対するゲインが乗算され、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出し、
    前記Rチャネルフィルタ係数計算段階は、さらに前記各話者に対するゲインが乗算され、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出する、
    請求項1から4のいずれかに記載の収音方法。
  6. 前記記憶された共分散行列のうち対角成分で最もパワーの大きい成分、または前記記憶された共分散行列の対角成分の加算値の周波数特性を平滑化するゲインを、前記記憶された共分散行列に乗算し、白色化された共分散行列を、前記Lチャネルフィルタ係数計算段階と前記Rチャネルフィルタ係数計算段階に入力する白色化段階をさらに有する、請求項1から5のいずれかに記載の収音方法。
  7. 前記複数の収音手段の各々で受音された信号および前記受話信号を時間領域信号から周波数領域信号に変換するFFT段階と、
    前記Lチャネル加算段階と前記Rチャネル加算段階の出力信号を周波数領域信号から時間領域信号に変換するIFFT段階をさらに有し、
    前記各段階は周波数領域で演算する、
    請求項1から6のいずれかに記載の収音方法。
  8. 前記LおよびRチャネルフィルタ係数計算段階と前記LおよびRチャネルフィルタ段階と前記LおよびRチャネル加算段階を、3チャネル以上の1〜Jチャネルフィルタ係数計算段階と1〜Jチャネルフィルタ段階と1〜Jチャネル加算段階に置き換えた、
    請求項1から7のいずれかに記載の収音方法。
  9. 収音装置であって、
    複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出手段と、
    複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算手段と、
    前記共分散行列を話者位置ごとに記憶する共分散行列記憶手段と、
    各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定手段と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされる条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算手段と、
    各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定手段と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされる条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算手段と、
    前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ手段と、
    前記Lチャネル複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ手段と、
    前記Lチャネルフィルタ手段の出力信号を加算するLチャネル加算手段と、
    前記Rチャネルフィルタ手段の出力信号を加算するRチャネル加算手段と
    を有する収音装置。
  10. 収音装置であって、
    複数の収音手段の各々で受音された受音信号から話者位置と雑音区間を検出する話者位置検出手段と、
    複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算手段と、
    前記共分散行列を雑音区間と話者位置ごとに記憶する共分散行列記憶手段と、
    各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定手段と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算手段と、
    各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定手段と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算手段と、
    前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ手段と、
    前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ手段と、
    前記Lチャネルフィルタ手段の出力信号を加算するLチャネル加算手段と、
    前記Rチャネルフィルタ手段の出力信号を加算するRチャネル加算手段と
    を有する収音装置。
  11. 収音装置であって、
    複数の収音手段の各々で受音された受音信号と、通信相手からのLチャネル受話信号とRチャネル受話信号から送話区間、受話区間、雑音区間を検出する送受話検出手段と、
    複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出手段と、
    複数の収音手段の各々で受音された受音信号から共分散行列を計算する共分散行列計算手段と、
    前記共分散行列を受話区間と雑音区間と話者位置ごとに記憶する共分散行列記憶手段と、
    各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定手段と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算手段と、
    各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定手段と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算手段と、
    前記複数の収音手段の各々で受音された受音信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ手段と、
    前記複数の収音手段の各々で受音された受音信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ手段と、
    前記Lチャネルフィルタ手段の出力信号を加算するLチャネル加算手段と、
    前記Rチャネルフィルタ手段の出力信号を加算するRチャネル加算手段とを有する収音装置。
  12. 収音装置であって、
    複数の収音手段の各々で受音された受音信号と、通信相手からのLチャネル受話信号とRチャネル受話信号から、送話区間、受話区間、雑音区間を検出する送受話検出手段と、
    複数の収音手段の各々で受音された受音信号から話者位置を検出する話者位置検出手段と、
    複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号から共分散行列を計算する共分散行列計算手段と、
    前記共分散行列を受話区間と雑音区間と話者位置ごとに記憶する共分散行列記憶手段と、
    各話者位置に対応するLチャネルミキシング係数をあらかじめ設定するLチャネルミキシング係数設定手段と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Lチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出するLチャネルフィルタ係数計算手段と、
    各話者位置に対応するRチャネルミキシング係数をあらかじめ設定するRチャネルミキシング係数設定手段と、
    複数の収音手段の各々で受音された各話者音声成分が各話者位置に対応する前記Rチャネルミキシング係数でミキシングされ、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出するRチャネルフィルタ係数計算手段と、
    前記複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号を、前記Lチャネルフィルタ係数で各々フィルタリングするLチャネルフィルタ手段と、
    前記複数の収音手段の各々で受音された受音信号とLチャネル受話信号とRチャネル受話信号を、前記Rチャネルフィルタ係数で各々フィルタリングするRチャネルフィルタ手段と、
    前記Lチャネルフィルタ手段の出力信号を加算するLチャネル加算手段と、
    前記Rチャネルフィルタ手段の出力信号を加算するRチャネル加算手段とを有する収音装置。
  13. 前記記憶された各話者の共分散行列から各話者の音声レベルを推定する話者音声レベル推定手段と、
    前記各話者の音声レベルから、各話者音声が適正レベルで出力されるための各話者に対するゲインを各々算出するゲイン算出部とをさらに有し、
    前記Lチャネルフィルタ係数計算手段は、さらに前記各話者に対するゲインが乗算され、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Lチャネルミキシング係数からLチャネルフィルタ係数を算出し、
    前記Rチャネルフィルタ係数計算手段は、さらに前記各話者に対するゲインが乗算され、受話信号成分が抑圧され、雑音成分が抑圧される条件で、前記記憶された共分散行列と前記Rチャネルミキシング係数からRチャネルフィルタ係数を算出する、
    請求項9から12のいずれかに記載の収音装置。
  14. 前記記憶された共分散行列のうち対角成分で最もパワーの大きい成分、または前記記憶された共分散行列の対角成分の加算値の周波数特性を平滑化するゲインを、前記記憶された共分散行列に乗算し、白色化された共分散行列を前記Lチャネルフィルタ係数計算手段と前記Rチャネルフィルタ係数計算手段に入力する白色化手段をさらに有する、
    請求項9から13のいずれかに記載の収音装置。
  15. 前記複数の収音手段の各々で受音された信号および前記受話信号を時間領域信号から周波数領域信号に変換するFFT手段と、
    前記Lチャネル加算手段と前記Rチャネル加算手段の出力信号を周波数領域信号から時間領域信号に変換するIFFT手段とをさらに有し、
    前記各手段は周波数領域で演算する、
    請求項9から14のいずれかに記載の収音装置。
  16. 前記LおよびRチャネルフィルタ係数計算手段と前記LおよびRチャネルフィルタ手段と前記LおよびRチャネル加算手段を、3チャネル以上の1〜Jチャネルフィルタ係数計算手段と1〜Jチャネルフィルタ手段と1〜Jチャネル加算手段に置き換えた、
    請求項9から15のいずれかに記載の収音装置。
  17. 請求項1から8のいずれかに記載の収音方法をコンピュータに実行させるための収音プログラム。
  18. 請求項17に記載の収音プログラムを記載した記録媒体。
JP2003370697A 2003-10-30 2003-10-30 収音方法、装置、プログラム、および記録媒体 Expired - Fee Related JP4298466B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003370697A JP4298466B2 (ja) 2003-10-30 2003-10-30 収音方法、装置、プログラム、および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003370697A JP4298466B2 (ja) 2003-10-30 2003-10-30 収音方法、装置、プログラム、および記録媒体

Publications (2)

Publication Number Publication Date
JP2005136709A true JP2005136709A (ja) 2005-05-26
JP4298466B2 JP4298466B2 (ja) 2009-07-22

Family

ID=34647631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003370697A Expired - Fee Related JP4298466B2 (ja) 2003-10-30 2003-10-30 収音方法、装置、プログラム、および記録媒体

Country Status (1)

Country Link
JP (1) JP4298466B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006340343A (ja) * 2005-05-09 2006-12-14 Sony Computer Entertainment Europe Ltd 音声処理
JP2009116245A (ja) * 2007-11-09 2009-05-28 Yamaha Corp 音声強調装置
JP2011182292A (ja) * 2010-03-03 2011-09-15 Nippon Telegr & Teleph Corp <Ntt> 収音装置、収音方法及び収音プログラム
KR20150053621A (ko) * 2013-11-08 2015-05-18 한국전자통신연구원 영상 회의 시스템에서의 음향 반향 제거 장치 및 방법
TWI489447B (zh) * 2011-08-17 2015-06-21 Fraunhofer Ges Forschung 用以產生音訊輸出信號之裝置與方法以及相關電腦程式

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07250397A (ja) * 1994-03-09 1995-09-26 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法およびこの方法を実施する装置
JPH1042396A (ja) * 1996-07-23 1998-02-13 Sanyo Electric Co Ltd 音像制御装置
JPH10257598A (ja) * 1997-03-14 1998-09-25 Nippon Telegr & Teleph Corp <Ntt> 仮想音像定位用音響信号合成装置
JPH1118194A (ja) * 1997-06-26 1999-01-22 Fujitsu Ltd マイクロホンアレイ装置
JPH11304906A (ja) * 1998-04-20 1999-11-05 Nippon Telegr & Teleph Corp <Ntt> 音源位置推定方法およびそのプログラムを記録した記録媒体
JP2004078021A (ja) * 2002-08-21 2004-03-11 Nippon Telegr & Teleph Corp <Ntt> 収音方法、収音装置、および収音プログラム
WO2004071130A1 (ja) * 2003-02-07 2004-08-19 Nippon Telegraph And Telephone Corporation 収音方法及び収音装置
JP2005064968A (ja) * 2003-08-15 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 収音方法、その装置、そのプログラム、およびその記録媒体。

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07250397A (ja) * 1994-03-09 1995-09-26 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法およびこの方法を実施する装置
JPH1042396A (ja) * 1996-07-23 1998-02-13 Sanyo Electric Co Ltd 音像制御装置
JPH10257598A (ja) * 1997-03-14 1998-09-25 Nippon Telegr & Teleph Corp <Ntt> 仮想音像定位用音響信号合成装置
JPH1118194A (ja) * 1997-06-26 1999-01-22 Fujitsu Ltd マイクロホンアレイ装置
JPH11304906A (ja) * 1998-04-20 1999-11-05 Nippon Telegr & Teleph Corp <Ntt> 音源位置推定方法およびそのプログラムを記録した記録媒体
JP2004078021A (ja) * 2002-08-21 2004-03-11 Nippon Telegr & Teleph Corp <Ntt> 収音方法、収音装置、および収音プログラム
WO2004071130A1 (ja) * 2003-02-07 2004-08-19 Nippon Telegraph And Telephone Corporation 収音方法及び収音装置
JP2005064968A (ja) * 2003-08-15 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 収音方法、その装置、そのプログラム、およびその記録媒体。

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006340343A (ja) * 2005-05-09 2006-12-14 Sony Computer Entertainment Europe Ltd 音声処理
JP2009116245A (ja) * 2007-11-09 2009-05-28 Yamaha Corp 音声強調装置
JP2011182292A (ja) * 2010-03-03 2011-09-15 Nippon Telegr & Teleph Corp <Ntt> 収音装置、収音方法及び収音プログラム
TWI489447B (zh) * 2011-08-17 2015-06-21 Fraunhofer Ges Forschung 用以產生音訊輸出信號之裝置與方法以及相關電腦程式
US10339908B2 (en) 2011-08-17 2019-07-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
US10748516B2 (en) 2011-08-17 2020-08-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
US11282485B2 (en) 2011-08-17 2022-03-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
KR20150053621A (ko) * 2013-11-08 2015-05-18 한국전자통신연구원 영상 회의 시스템에서의 음향 반향 제거 장치 및 방법
KR102112018B1 (ko) 2013-11-08 2020-05-18 한국전자통신연구원 영상 회의 시스템에서의 음향 반향 제거 장치 및 방법

Also Published As

Publication number Publication date
JP4298466B2 (ja) 2009-07-22

Similar Documents

Publication Publication Date Title
JP5654513B2 (ja) 音識別方法および装置
US9922663B2 (en) Voice signal processing method and apparatus
US9210504B2 (en) Processing audio signals
EP2749016B1 (en) Processing audio signals
JP4286637B2 (ja) マイクロホン装置および再生装置
CN104604254B (zh) 声音处理装置、方法
US9232309B2 (en) Microphone array processing system
KR101934999B1 (ko) 잡음을 제거하는 장치 및 이를 수행하는 방법
WO2004071130A1 (ja) 収音方法及び収音装置
JP4249729B2 (ja) 自動利得制御方法、自動利得制御装置、自動利得制御プログラム及びこれを記録した記録媒体
JP5611970B2 (ja) オーディオ信号を変換するためのコンバータ及び方法
CN1902901A (zh) 用于增强主观立体声音频的系统和方法
JP2001309483A (ja) 収音方法および収音装置
CN105284133A (zh) 基于信号下混比进行中心信号缩放和立体声增强的设备和方法
JP5034607B2 (ja) 音響エコーキャンセラシステム
JP5762479B2 (ja) 音声スイッチ装置、音声スイッチ方法、及びそのプログラム
JP4298466B2 (ja) 収音方法、装置、プログラム、および記録媒体
JP4116600B2 (ja) 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体
US20130253923A1 (en) Multichannel enhancement system for preserving spatial cues
JP2005064968A (ja) 収音方法、その装置、そのプログラム、およびその記録媒体。
JP5267808B2 (ja) 音響出力システム及び音響出力方法
JP5937451B2 (ja) エコー消去装置、エコー消去方法及びプログラム
JP4080987B2 (ja) エコー・雑音抑制方法および多チャネル拡声通話システム
JP2002062900A (ja) 収音装置及び受信装置
JP2005062096A (ja) 話者位置検出方法、装置、プログラム、および記録媒体

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050621

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090408

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090415

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120424

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130424

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees