JP2001309483A - 収音方法および収音装置 - Google Patents

収音方法および収音装置

Info

Publication number
JP2001309483A
JP2001309483A JP2000118069A JP2000118069A JP2001309483A JP 2001309483 A JP2001309483 A JP 2001309483A JP 2000118069 A JP2000118069 A JP 2000118069A JP 2000118069 A JP2000118069 A JP 2000118069A JP 2001309483 A JP2001309483 A JP 2001309483A
Authority
JP
Japan
Prior art keywords
filter
sound
signal
delay
estimating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000118069A
Other languages
English (en)
Other versions
JP3582712B2 (ja
Inventor
Kazunori Kobayashi
和則 小林
Kenji Kiyohara
健司 清原
Kenichi Furuya
賢一 古家
Yutaka Kaneda
豊 金田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000118069A priority Critical patent/JP3582712B2/ja
Publication of JP2001309483A publication Critical patent/JP2001309483A/ja
Application granted granted Critical
Publication of JP3582712B2 publication Critical patent/JP3582712B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

(57)【要約】 【課題】 収音装置において、装置規模を拡大せずに、
出力の目的音成分の歪を軽減する。 【解決手段】 マイクロホン111〜11Mで受音された
信号は話者位置推定部15Aに供給される。話者位置推
定部15Aは話者位置推定を行う。遅延制御部16は、
話者位置推定結果を受け推定話者位置に遅延和アレーの
焦点が向くような遅延を遅延器121〜12Mに設定す
る。信号対雑音比推定部18は各マイクロホン111
11Mで収録された音声信号について信号対雑音比(S
N比)を推定する。推定されたSN比はフィルタ係数の
決定に用いられる。最適フィルタ計算部17はアレーの
出力のSN比、目的音成分の歪が最適となるような最適
フィルタを計算し、フィルタ131〜13Mに設定する。
フィルタ131〜13Mを通過した、マイクロホン111
〜11Mで受音された信号は加算器14で加算され、出
力される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、通信会議、遠隔講
義、異常音監視等において、複数のマイクロホンにより
受音された音声信号をフィルタ処理して出力することに
より、雑音や歪を低減し、目的とする音源から発せられ
た音を高品質に収音する方法および装置に関するもので
ある。
【0002】
【従来の技術】マイクロホンにより受音された信号に
は、目的とする音源から発せられた音(目的音)の他
に、空調音、電気機器のファン音、マイクロホンアンプ
や信号ケーブル等で生じる電気的雑音等の雑音が含まれ
る。また、収音の過程で目的音成分に歪が生じる。目的
音成分の歪が小さいほど収音した音は目的音に近い波形
であるので、目的音成分の歪は小さいほど高品質であ
る。したがって、高品質な収音とは高SN比、かつ目的
音成分の歪が小さい収音のことである。
【0003】音波をモデル化する場合に、球面波をモデ
ルとする場合と平面波をモデルとする場合がある。音源
が点状と見なせる場合は球面波モデルを用いることがで
き、音源からマイクロホンまでの距離に比べ十分に狭い
範囲内に全てのマイクロホンがある場合には、平面波モ
デルを用いることができる。
【0004】複数のマイクロホンにより受音された信号
を処理して、目的とする音源(目的音源)から発せられ
た音を高品質に収音する方法の代表的なものとして遅延
和アレーがある。遅延和アレーは、焦点位置から複数の
マイクロホンへ到来する音を同位相化し加算すること
で、焦点位置に対する感度を高める方法であり、目的音
源位置に焦点を向けることにより、目的音源位置以外に
ある雑音を抑圧し、SN比を向上させることができる。
ただし、真の目的音源位置を知ることは不可能であるの
で、焦点は推定した目的音源位置(推定音源位置)に向
けられることになる。
【0005】次に、球面波モデルを仮定した遅延和アレ
ーについて詳細な説明をする。
【0006】まず、説明するのに必要な記号の定義を行
う。図8はマイクロホンが音波を受音する様子を説明す
る図であり、41は座標の原点、42は遅延和アレー焦
点位置(推定音源位置)、43は目的音源位置、441
〜44Mはマイクロホンを表している。次に、図中の記
号の意味を説明する。i(i=1,2,3,…,M)は
マイクロホンの番号、Pは目的音源位置43のベクト
ル、P’は遅延和アレーの焦点位置(推定音源位置4
2)のベクトル、Q(i)はi番目マイクロホン44i
の位置のベクトル、r(i)は目的音源とi番目マイク
ロホンの間の距離、r'(i)は焦点(推定音源位置)と
i番目マイクロホンの間の距離、x(i,t)は時刻t
におけるi番目マイクロホン44iの受音信号である。
また、位置ベクトルと距離の関係は式(1)、式(2)
で表される。
【0007】
【数1】
【0008】次に、マイクロホンで受音された信号を数
式で表す。マイクロホンで受音される信号には、目的音
源から発せられて直接マイクロホンに到達する音、目的
音源から発せられて壁、床、天井等に反射してからマイ
クロホンに到達する音、空調、電気機器のファン音等の
雑音、さらには、マイクロホンアンプ、信号ケーブル等
で生じる電気的雑音等がある。本明細書では、簡単のた
めに目的音源から発せられて直接マイクロホンに到達す
る音以外の信号をまとめて1つの雑音として扱うことと
し、この雑音は定常的な白色雑音、各マイクロホン間で
無相関、全てのマイクロホンで等パワーであると仮定す
る。また、目的音源の指向特性は無指向性と仮定する。
目的音源の信号をs(t)、i番目マイクロホンでの雑
音成分をn(i,t)、音速をcと表し、i番目マイク
ロホンの受音信号を数式で表すと、目的音源から発せら
れた音は1/r(i)の距離減衰と、r(i)/cの伝
播時間を持ってi番目マイクロホンに到達し、雑音はマ
イクロホンで加わるので、式(3)となる。
【0009】
【数2】
【0010】図9は、球面波モデルを仮定した遅延和ア
レーを説明する図であり、441〜44Mがマイクロホ
ン、451〜45Mが遅延器、461〜46Mがゲイン、4
7が加算器を表している。各マイクロホン441〜44M
で受音された信号は、遅延器451〜45M、ゲイン46
1〜46Mを通り加算器47で加算され出力y(P’,
t)となるので、出力y(P’,t)は式(4)のよう
に表すことができ、式(3)を代入することでさらに変
形される。
【0011】
【数3】
【0012】遅延和アレーは、焦点から直接マイクロホ
ンへ到来する信号を同位相化して加算することにより、
焦点位置の感度を上げ、焦点位置を推定音源位置に合わ
せることにより、目的音源から発せられる音を収音す
る。焦点位置(推定音源位置)から直接マイクロホンへ
到来する信号を同位相化する遅延は、焦点(推定音源位
置)から各マイクロホンまでの音の伝播時間r'(i)/
cを固定遅延Dより差し引けばよいので式(5)で表さ
れる。
【0013】
【数4】
【0014】ただし、固定遅延Dは、信号を進ませるこ
とができないという因果性を満足させるために、d
(i,P’)が必ず正となる定数でなければならない。
【0015】式(5)の遅延を式(4)に代入すると、
遅延和アレー出力y(P’,t)は式(6)で表され
る。
【0016】
【数5】
【0017】ただし、δ(i)は焦点が真の目的音源位
置ではなく推定音源位置に向いていることによる遅延誤
差であり、式(7)で表される。
【0018】
【数6】
【0019】目的音源位置と推定音源位置が十分に近く
遅延誤差が小さい場合(δ(i)=0と見なせる場合)
には、式(6)の目的音成分の遅延が一定値Dとなり、
同位相で加算される。一方、雑音成分は各マイクロホン
間で無相関であるので同位相となることはない。したが
って、同位相で加算される目的音成分のみが強調され、
SN比を改善することができる。
【0020】次に、遅延和アレー出力のSN比と目的音
成分の歪を求める。
【0021】まず、式(6)を遅延和アレーの特性を解
析するのに都合が良いように、フーリエ変換し周波数領
域で表すと、式(8)となる。
【0022】
【数7】
【0023】ただし、Y(P’,ω)はy(P’,t)
をフーリエ変換したもの、S(ω)はs(t)をフーリ
エ変換したもの、N(i,ω)はn(i,t)をフーリ
エ変換したもの、ωは角周波数を表している。
【0024】式(8)の右辺1項目は、遅延和アレー出
力の目的音成分の信号であり、式(8)の右辺2項目
は、遅延和アレー出力の雑音成分の信号であり、式
(8)より遅延和アレー出力の目的音成分のパワーW
s、雑音成分パワーWnを求めると、それぞれ式
(9)、式(10)となる。
【0025】
【数8】
【0026】ただし、a^bはaのb乗を表し、E
(a)はaの平均をとることを表す。また、W’sはS
(ω)のパワーでありW’s=E(|S(ω)|)で表
され、W’nはN(i,ω)のパワーであり、N(i,
ω)のパワーは各マイクロホンで一定であるという仮定
より|N(ω)|=|N(i,ω)|として、W’n=
E(|N(ω)|)で表される。
【0027】式(9)、式(10)より、遅延和アレー
の出力のSN比SNRは式(11)で表される。
【0028】
【数9】
【0029】次に、遅延和アレー出力の目的音成分の歪
ERRを式(8)より求める。目的音成分の歪は、遅延
和アレー出力の目的音成分(式(8)右辺1項目)と目
的音S(ω)との誤差を目的音で正規化し、二乗平均し
たもので表し、式(12)で表される。
【0030】
【数10】
【0031】ここで、ゲインg(i,P’)について議
論する。音源位置推定誤差のない場合、すなわち遅延誤
差δ(i)=0の場合に関してSN比を最大とするゲイ
ンg(i,P’)が求められている。これは、式(1
1)をg(i,P’)で偏微分し、式(11)の極大点
を求めることで値を決定でき、g(i,P')=const・1/r(i)
(constは定数)がその値である。この方法で遅延
和アレーの出力のSN比を最大とすることができるが、
音源位置推定誤差がある場合(遅延誤差δ(i)≠0)
には、式(12)に示すように遅延和アレーの出力に目
的音成分の歪が生じる。
【0032】この遅延和アレー出力の目的音成分の歪
は、焦点位置のメインビームが狭いほど、音源位置推定
誤差の影響を受けやすくなる。焦点位置のメインビーム
幅は、高周波成分ほど狭く、マイクロホンが広範囲に配
置されているほど狭くなる。したがって、遅延和アレー
出力の目的音成分の歪は高周波成分ほど大きく生じ、マ
イクロホンが広範囲に設置されているほど大きくなる。
【0033】以上まとめると、遅延和アレーは、焦点か
ら複数のマイクロホンへ到来する音を同位相化し加算す
ることで、その位置に対する感度を高める方法であり、
目的音源位置に焦点を向けることにより、目的音源位置
以外にある雑音を抑圧し、SN比を向上させることがで
きる。ただし、真の目的音源位置を知ることは不可能で
あるので、焦点は推定音源位置に向けられることにな
り、音源位置推定誤差により出力に目的音成分の歪を生
じる。この目的音成分の歪は高周波成分ほど大きく生
じ、マイクロホンが広範囲に配置されているほど大きく
なる。
【0034】次に、この遅延和アレー出力の目的音成分
の歪を軽減する従来の方法を説明する。
【0035】図10はこの従来方法を説明する図であ
り、51が音波到来方向、52が平面波の波面、531
〜53Mが等間隔Lで直線状に配置された無指向性マイ
クロホン、541〜54Mがディジタルフィルタ(Uタッ
プFIRフィルタ)、55が加算器を表している。h
(i,φ,u)はi番目のマイクロホン53iのディジ
タルフィルタ54iのuタップ目のフィルタ係数を表
し、φは遅延和アレーの焦点の方向を表し、kは周期T
でサンプリングされた離散時刻を表し整数値を取る。マ
イクロホン531〜53Mに到来した音波は式(13)、
式(14)で表される。ただし、時刻tは離散化したk
Tに置き換わる。
【0036】
【数11】
【0037】ただし、τ(θ)は、θ方向から到来する
音波を仮定したとき、隣り合うマイクロホン間での音波
到来時間差であり、cは音速である。
【0038】次に、マイクロホン531〜53Mで受音さ
れた信号はディジタルフィルタ54 1〜54Mを通り加算
されるので、出力y(θ,φ,k)は式(15)のよう
に表される。
【0039】
【数12】
【0040】次に、式(15)をフーリエ変換すれば、
式(16)となる。
【0041】
【数13】
【0042】この方法の伝達関数R(θ,φ,ω)は、
式(16)を変形して式(17)で表される。
【0043】
【数14】
【0044】式(17)は、2次元フーリエ変換の式と
等価な形となっており、所望の指向特性を伝達関数R
(θ,φ,ω)に代入し、2次元逆フーリエ変換するこ
とにより、所望の指向特性を持ったディジタルフィルタ
の係数h(i,φ,u)を求めることができる。この方
法を用いることで任意の指向特性を作り出すことがで
き、周波数に依存しないメインビームを持つ指向特性を
設計することが可能である。したがって、目的音成分の
高周波成分に大きな歪を生じることなく良好に目的音源
から到来する音を収音することができる。
【0045】しかし、この方法は平面波モデルを仮定し
た等間隔直線アレーを用いなければならないため、球面
波モデルや任意配置のマイクロホンには適用することが
できない。通信会議、遠隔講義、異常音監視等では、マ
イクロホンを設置できる位置が部屋の中に限定されるた
め、平面波モデルを使うにはアレーの大きさを小さくし
なくてはならない。アレーの大きさを小さくした場合、
マイクロホンは部屋の一部分に集中して配置されるた
め、マイクロホンが設置されている位置の周辺以外で
は、マイクロホンと音源の間の距離が離れてしまう。こ
のため、マイクロホンで受音される信号のSN比は低く
なり、音の品質が悪くなってしまう。
【0046】
【発明が解決しようとする課題】上述した従来技術は、
音源位置推定誤差により出力の目的音成分に歪が大きく
生じることを解決するために、各マイクロホンで収音さ
れた音声をディジタルフィルタを用いてフィルタリング
処理しており、平面波モデルを仮定したアレーにしか適
用できず、通信会議、遠隔講義、異常音監視等に用いる
のに不向きであるという問題がある。
【0047】本発明の目的は、球面波モデルを仮定した
任意配置のアレーにおいて、装置規模を拡大せず(マイ
クロホン数を増やすことなく)、出力の目的音成分の歪
を軽減することができる収音方法及び装置を提供するこ
とである。
【0048】
【課題を解決するための手段】上記目的を達成するため
に、本発明の収音方法は、任意配置の複数の収音手段の
各々で収録された音声信号を各々異なる遅延量で遅延さ
せ、各遅延出力を各々異なるフィルタ係数でフィルタリ
ングし、各フィルタリング出力を加算して加算出力を出
力する収音方法において、音源位置を推定し、前記音源
位置から発せられ、前記複数の収音手段で受音した信号
が同位相となるように遅延を制御し、各収録音声信号の
信号対雑音比を推定し、各音源位置から各収音手段まで
の距離と信号対雑音比とから加算出力の雑音対信号比を
推定し、各距離から加算出力の目的音成分歪を推定し、
加算出力の雑音対信号比と目的音成分歪とから求められ
る歪関数を最小とする各フィルタ係数を決定し、フィル
タ係数の決定において、各距離で減衰させた各フィルタ
係数の和を一定値とする。
【0049】また、本発明の収音装置は、任意配置の複
数の収音手段と、前記各収音手段で収録された音声信号
を各々異なる遅延量で遅延させる遅延手段と、遅延手段
からの遅延出力信号を各々異なるフィルタ係数でフィル
タリングするフィルタリング手段と、前記フィルタリン
グ手段からの各フィルタリング出力を加算して加算出力
を出力する加算手段とを有する収音装置において、音源
位置を推定する音源位置推定手段と、音源位置推定手段
で推定された音源位置から発せられ、前記複数の収音手
段で受音した信号が同位相となるように、遅延を制御す
る遅延制御手段と、各収録音声信号の信号対雑音比を推
定する信号対雑音比推定手段と、各音源位置から各収音
手段までの距離と信号対雑音比とから加算出力の雑音対
信号比を推定する加算雑音対信号比推定手段と、各距離
から加算出力の目的音成分歪を推定する目的音歪推定手
段と、加算出力の雑音対信号比と目的音成分歪とから求
められる歪関数を最小とする各フィルタ係数を決定する
フィルタ係数決定手段とを有し、フィルタ係数決定手段
は、各距離で減衰させた各フィルタ係数の和が一定値と
なるよう各フィルタ係数を決定する。
【0050】歪を最小とするようフィルタ係数を決定す
る際、SN比を一定値に保つことを条件とする。ただ
し、SN比が小さくなると指向性の幅が狭くなる傾向が
認められる。例えば、マイクロホンを直線上に等間隔で
配置したとき、SN比と指向性の幅(メインローブ幅)
の関係は次のように導出される。メインローブ幅Ψは焦
点方向φ=0の場合、式(18)のように表される。
【0051】
【数15】
【0052】ここで、Mはマイクロホン数、Lはマイク
ロホン間隔を表わす。
【0053】次に、信号成分の音波到来方向θで、雑音
は各マイクロホンで等パワー、無相関と仮定し、1番目
マイクロホンで観測される信号成分をS(ω)、雑音成
分をN(1,ω)とすれば、i番目マイクロホンで観測
される信号は、
【0054】
【数16】
【0055】となる。焦点方向φ=θ(焦点方向が音源
方向と一致する場合)を仮定し、遅延和アレーの出力を
求めると、
【0056】
【数17】
【0057】となる。右辺1項目が信号成分であり、2
項目が雑音成分であるので、信号成分のパワーと雑音成
分のパワーの比(SN比)を求めると、
【0058】
【数18】
【0059】雑音は、各マイクロホンで無相関、等パワ
ーを仮定しているので、|N(ω)|^2=|N(i,ω)|^2
として、
【0060】
【数19】
【0061】したがって、各マイクロホンでのSN比が (|S(ω)|^2)/(|N(ω)|^2) であるから、M本のマイクロホンを使った、遅延和アレ
ー処理により、SN比がM倍になったと言える。
【0062】したがって、SN比改善度をSNRimpと
すれば SNRimp=M となる。SNRimpとしてメインローブ幅の関係を導出
すると
【0063】
【数20】
【0064】という関係が成り立つ。
【0065】すなわち、適当なSN比を条件としてフィ
ルタ係数を決定すれば指向性幅の範囲内に音源位置の推
定誤差範囲を含めることができる。かかる条件をあらゆ
る周波数にわたり満足させれば、全周波数について指向
性幅の範囲に音源を位置されていることになる。よって
音源位置の推定誤差を認めたうえで目的音レベルの周波
数にわたる変動を最小限に抑えることができる。上記は
マイクロホンを直線上に配置させた場合を仮定したが、
その他の配置においても同様な効果が期待できる。
【0066】求められた最適なフィルタはSN比を大き
くし、目的音成分の歪を小さくするので、本方法は遅延
和アレー出力の目的音成分の歪を軽減することができ、
最適フィルタを求める際の係数αによりSN比と目的音
成分の歪のどちらに重点を置くかを調節することができ
る。また、球面波モデルを用いてフィルタを求めている
ので、平面波モデルを仮定したアレーに限定されること
なく、任意配置のアレーに適用でき、通信会議、遠隔講
義、異常音監視等に用いるのに都合の良いアレー配置に
用いることができる。さらに、マイクロホン数を増やす
必要がないので、装置規模が大きくなることもない。
【0067】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0068】図1は本発明の第1の実施形態の収音装置
の構成図である。本実施形態の収音装置はマイクロホン
111,112,…,11Mと、遅延器121,122
…,12Mと、フィルタ131,132,…,13Mと、加
算器14と、焦点位置制御部である話者位置推定部15
Aと、遅延制御部16と、最適フィルタ計算部17と、
信号対雑音比推定部18で構成されている。
【0069】本収音装置は話者自動追従型収音装置で、
焦点位置制御として話者位置推定を用いたものであり、
話者位置に自動的に焦点を向け、話者の音声を収音す
る。マイクロホン111〜11Mで受音された信号は話者
位置推定部15Aに供給される。話者位置推定部15A
は話者位置推定を行う。遅延制御部16は、話者位置推
定結果を受け推定話者位置に遅延和アレーの焦点が向く
ような遅延を遅延器12 1〜12Mに設定する。信号対雑
音比推定部18は各マイクロホン111〜11Mで収録さ
れた音声信号について信号対雑音比(SN比)を推定す
る。推定されたSN比はフィルタ係数の決定に用いられ
る。すなわち後述の、フィルタを求める式(25)の
(|N(ω)|)/(|S(ω)|)に値が使われる。
信号対雑音比を決定する最も簡単な方法は、音声信号を
高速フーリエ変換等により一定個数のサンプル毎に周波
数領域に変換し、各周波数ごとにレベルがある閾値以下
であるか否かを判定して閾値以下の場合に雑音とみなし
て時間平均をとる。閾値を越える場合には音声とみな
し、そのレベルを時間平均値で除算すればSN比が求め
られる。最適フィルタ計算部17はアレーの出力のSN
比、目的音成分の歪が最適となるような最適フィルタを
計算し、フィルタ131〜13Mに設定する。フィルタ1
1〜13Mを通過した、マイクロホン111〜11Mで受
音された信号は加算器14で加算され、出力される。
【0070】ここで、話者位置推定部15Aで各マイク
ロホン111〜11Mの信号から音源(話者)位置を推定
する過程を説明する。まず、初期設定として探索範囲θ
r、フィルタ長L、FFT(FFTポイント数)N、チ
ャネル数Mなどを設定する。次に、ビームフォーマが一
般化サイドロープキャンセラならばフィルタ変換を行
い、そうでなければFFTを行う。次に、探索範囲の中
のある一つの方向をθとすると、θ方向から到来する信
号に関する各チャネルの伝播位相遅れを表わす方向ベク
トルS(k,θ)を生成する。次に、FFTにより求め
たフィルタの周波数成分Weと方向ベクトルS(k,
θ)の内積の絶対値の2乗|S・W|2を求める。方向
ベクトルS(k,θ)と|S・W|2の算出を全ての周
波数、すなわちk=1からk=2/Nまでについて行
い、求めた内積の2乗和を方向θ毎に周波数kについて
加算し、全帯域についてまとめた方向毎の感度D(θ)
を求める。次に、求めた方向毎の感度が最小となる方向
θminをD(θ)から求め、これを信号(目的信号)
の到来方向とする。この方法は特開平10−20749
0号に記載されている。
【0071】本実施形態は球面波モデルを仮定した遅延
和アレー(図9)のゲイン46l〜46Mをフィルタ13
l〜13Mに置き換えたものであり、マイクロホン11l
〜11Mで受音される信号は、球面波モデルを仮定した
遅延和アレーと同じであり式(3)で表され、遅延和ア
レー出力をフーリエ変換した式は、式(8)のゲインg
(i,P’)をフィルタg(i,P’,ω)に置き換え
たものに等しく、式(19)で表される。ただし、記号
の意味、仮定等は球面波モデルを仮定した遅延和アレー
の説明で述べたとおりである。
【0072】
【数21】
【0073】同様に、本方法の出力のSN比SNRと目
的音成分の歪FRRは、式(11)、式(12)のゲイ
ンg(i,P’)をフィルタg(i,P’,ω)に置き
換えたものであり、それぞれ式(20)、式(21)で
表される。
【0074】
【数22】
【0075】ここから、SN比を大きくし、目的音成分
の歪を小さくする最適なフィルタg(i,P’,ω)を
求めていく。まず、各周波数成分のSN比SNR
(ω)、目的音成分の歪ERR(ω)は、式(20)、
式(21)の平均を取り去ることで求められ、式(2
2)、式(23)で表される。
【0076】
【数23】
【0077】また、フィルタには、焦点位置によらず、
一定のゲインで収音することが求められるので、式(2
4)の条件を満たす必要がある。
【0078】
【数24】
【0079】式(22)、式(23)、式(24)をそ
れぞれ最小化問題に置き換え、係数αと未定乗数βで結
合することにより、歪関数F(ω)の最小化問題に置き
換えると、式(25)となる。係数αは、SN比と目的
音成分の歪のどちらに重点を置くかを決める係数であ
り、αが大きければ目的音成分の歪に、αが小さければ
SN比に重点を置くこととなる。未定乗数βは、式(2
4)の条件をどの程度厳密に満足させるかを決める乗数
であり、十分に大きい値である必要がある。係数αはS
N比の関数として与えられ、一般に非線型である。明瞭
度を規模とした場合の係数αを求める方法は「聴覚と音
声」第4版389頁(社団法人「電子通信学会」、昭和
44年11月30日発行)に記載され、明瞭度係数を最
大とするように決定される。
【0080】
【数25】
【0081】式(25)において、δ(i)は音源位置
推定誤差の関数(式(1)、式(2)、式(7))であ
り、δ(i)の値は知ることができないので、何らかの
モデルとして扱わなければならない。本明細書では音源
位置推定誤差を確率密度関数(例えば正規分布、一様分
布、指数分布等)として扱い、平均を取ることでF
(ω)を求める。したがって、式(25)は式(26)
となる。
【0082】
【数26】
【0083】ただし、E(a)は音源位置推定誤差に関
してaの平均をとる意味である。
【0084】最適フィルタは、式(26)のF(ω)を
最小化するフィルタであるので、F(ω)の最小化問題
を何らかの方法で解く必要がある。式(26)はEXP
(−jωδ(i))という周期関数を含んでおり複数の
極小点を持っているので簡単には解くことができない。
【0085】本明細書では最小化問題を解き最適フィル
タを求める一つの例として逐次的に最適フィルタを求め
る手法を示す。この手法は、フィルタg(i,p’,
ω)でF(ω)を偏微分し、その勾配方向にフィルタを
修正することを繰り返し、極小点を求める手法で、修正
式は式(27)で表される。
【0086】
【数27】
【0087】ただし、nは修正回数、g(i,P’,
ω,n)はn回修正後g(i,P’,ω)、γは修正係
数、∂a/∂bはaをbで偏微分することを表してい
る。
【0088】しかし、F(ω)が複数の極小点を持って
いるため、式(27)で収束する極小点は初期値g
(i,P’,ω,0)に依存し、F(ω)を最小としな
い極小点に収束してしまうことも考えられる。このこと
を回避するために初期値の与え方を工夫する。
【0089】まず、ω=0の場合を考えるとEXP(−
jωδ(i))=1となり、F(ω)は一つの極小点し
か持たなくなる。この場合、F(ω)を最小とする極小
点は簡単に求めることができ、解析的に求めることがで
きる。これは、F(ω)をg(i,P’,0)で偏微分
して0と置くことで求められ、式(28)を満たすg
(i,P’,0)がF(ω)を最小とする最適フィルタ
となる。
【0090】
【数28】
【0091】次に、ω=Δωの場合の最適フィルタを求
める。F(ω)はωに対して連続関数であるので、Δω
が十分小さければ、式(28)のg(i,P’,0)の
近傍にF(ω)を最小とする極小点があり、式(28)
のg(i,P’,0)を初期値とすることにより、F
(ω)を最小とする極小点に収束させることができる。
同じ要領でω=2・Δωの場合は、ω=Δωの場合の最
適フィルタを初期値にして、F(ω)を最小とする極小
点に収束させる。これを繰り返していけば、全ての周波
数においてF(ω)を最小とする最適フィルタを見つけ
ることができる。この手順を分かり易くフローチャート
にしたものを図7に示す。ステップ31でω=0の場合
の最適フィルタを解析的に求め、ステップ32で繰り返
し回数ξ=0に設定し、ステップ33で繰り返し回数に
1を加算し、ステップ34でω=(ξ−1)・Δωの場
合の最適フィルタを初期値として、ω=ξ・Δωに対す
る最適フィルタを逐次近似により求め、ステップ33と
34を必要なωについて最適フィルタが全て求められる
まで繰り返す。以上の手順により、全てのωについて最
適フィルタが求められる。
【0092】最適フィルタを求める際の補足として、S
N比に対するδ(i)の関与は、目的音成分の歪が小さ
くなることによって小さくなるので、SN比を求める際
のδ(i)を取り去り、式(26)を式(29)に近似
して簡単化することもできる。さらに、(|N(ω)|
/|S(ω)|)を一定値として扱い式(30)とする
こともできる。
【0093】
【数29】
【0094】以上、最適なフィルタを求める方法を示し
た。
【0095】フィルタ係数g(i,P’,ω,n−1)
を時間領域に変換したうえで音声信号に作用(畳み込み
演算)する。
【0096】本話者自動追従型収音装置は、通信会議、
遠隔講義等の収音装置として利用することができ、話者
の音声だけを選択的に収音することが可能である。従来
の通信会議、遠隔講義等の収音形態は、マイクロホンを
机上に設置する形態や、話者がマイクロホンを受け取
り、手に持つという形態が主である。机上にマイクロホ
ンを設置した場合には、マイクロホンに近い位置で、マ
イクロホンの方向を向いて発話しなくてはならず、自然
な会話ができないことや、机上のスペースを有効に使え
ないこと、資料をめくる音、机に物を落とした音等の不
快な音が混入しやすいこと、マイクロホンのケーブルが
邪魔であり、机の並び替えも容易にできなくなること等
の不都合が点がある。話者がマイクロホンを受け取り、
手に持つという形態では、話者は発言することを挙手な
どで示し、マイクロホンを受け取ってから発言しなくて
はならず、スムーズな会話ができないことや、マイクロ
ホンを運ぶ人手が必要となる。また、多人数が同時に発
言することができず、活発な議論や討論の妨げになるこ
とも考えられる。
【0097】以上のように従来の収音形態では、不都合
な点が多くあるが、本話者自動追従型高品質収音装置を
用いることにより、これらの不都合な点が一挙に解決で
きる。マイクロホンを天井等の邪魔にならない場所に設
置し、話者自動追従型高品質収音を用いれば、机上にマ
イクロホンはなく、位置、方向が限定されることなく自
由に発言することができ、自然な会話が可能となる。
【0098】話者自動追従型収音装置においては、話者
位置推定部15Aでは雑音、残響等により必ず誤差が生
じるため、話者位置と高品質収音装置の焦点位置は一致
しない。このため遅延和アレーでは出力の目的音成分に
歪が生じるが、本実施形態によれば、装置規模を大きく
することなく、平面波モデルを仮定できるようなマイク
ロホン配置に限定されることなく、目的音成分の歪を軽
減し、より高品質な収音が可能となる。
【0099】図2は本発明の第2の実施形態の収音装置
の構成図である。本収音装置は、焦点位置制御部として
焦点位置ステアリング部15Bを用い、焦点位置を希望
位置にステアリングして、出力を異常音検出部19で解
析し、異常音を感知したら通報、警報等をする装置であ
る。焦点位置ステアリング部15Bから、遅延制御部1
6、最適フィルタ計算部17に、焦点位置を希望位置に
ステアリングする位置情報が送られる。その位置情報に
基づいて、遅延制御部16は、遅延和アレーの焦点が希
望位置に向くような遅延を遅延器121〜12Mに設定す
る。最適フィルタ計算部17は、遅延和アレーの出力の
SN比、目的音成分の歪が最適となるような最適フィル
タを計算しフィルタ131〜13Mに設定する。複数のマ
イクロホン111〜11Mで受音された信号は、それぞれ
遅延器121〜12M、フィルタ131〜13Mを通り、加
算器14で加算され、出力となる。出力は異常音検出部
19で解析され、異常音と判別された場合には、通報、
警報等の信号を出力する。
【0100】本異常音自動検出装置は、例えば工場等の
機械の故障、不調の監視に用いることができる。複数あ
る機械から出力される音は混合されているため、通常の
方法ではそれぞれの機械の異常音を検出することは難し
いが、本装置によれば、それぞれの機械から出力される
音を選択的に収音することができるので、それぞれの機
械の異常音を検出することができる。また、正常音と異
常音を正確に判別するためには、機械から出力される音
を高品質で収音する必要があるが、遅延和アレーでは音
源位置と焦点位置が一致しないと出力の目的音成分に歪
が生じる。本実施形態によれば、装置規模を大きくする
ことなく、平面波モデルを仮定できるようなマイクロホ
ン配置に限定されることなく、目的音成分の歪を軽減
し、より高品質な収音が可能となるので、異常音検出を
正確に行うことができる。
【0101】図3は本発明の第3の実施形態の収音装置
の構成図である。本実施形態は、第1または第2の実施
形態の収音装置の最適フィルタ計算部17を、仮想焦点
位置設定部20と信号対雑音比推測部24と最適フィル
タ計算部21と最適フィルタ記憶部22と最適フィルタ
選択部23に置き換えたものである。まず、収音を行う
前に、仮想焦点位置設定部20はあらかじめ複数の仮想
焦点位置を設定する。また、信号対雑音比推測部24
は、あらかじめ計測した雑音レベルと標準的な発声音の
大きさから信号対雑音比を推測する。最適フィルタ計算
部21は仮想焦点位置に対する最適フィルタを全て計算
し、最適フィルタ記憶部22は計算された最適フィルタ
を全て記憶しておく。収音を行っている間は、焦点位置
制御部15Cより送られる焦点位置に最も近い仮想焦点
位置の最適フィルタを、最適フィルタ選択部23が最適
フィルタ記憶部22から読み出し、フィルタ131〜1
Mに設定する。このようにすることにより、収音を行
っている間は、最適フィルタ選択部23が最適フィルタ
記憶部22からフィルタを読み出す処理のみが行われ、
最適フィルタの計算を行わなくてよい。したがって、収
音を行っている間の計算量が非常に少なくてすみ、第1
の実施形態、第2の実施形態に比べ、少ないハードウェ
アで実時間処理可能な装置を構成することができるとい
う利点がある。その他の構成については、第1の実施形
態、または第2の実施形態と同じであるので、説明を省
略する。
【0102】図4は本発明の第4の実施形態の収音装置
の構成図である。本実施形態は、第1の実施形態または
第2の実施形態または第3の実施形態の最適フィルタ計
算部23が、直流成分最適フィルタ計算部231と初期
値記憶部232と逐次近似計算部233と繰り返し制御
部234とフィルタ構成部235より構成されるもの
で、図7の最適フィルタを求める手順に従って最適フィ
ルタを計算するものである。直流成分最適フィルタ計算
部231は、直流成分における最適フィルタを式(2
8)により解析的に求め、初期値記憶部232に記憶
し、逐次近似計算部233は、初期値記憶部232に記
憶されている最適フィルタを初期値として、初期値の最
適フィルタの周波数成分より微小に高い周波数成分に対
する最適フィルタを式(27)および式(26)、また
は式(29)、または式(30)の修正式を用いて逐次
近似で求め、その最適フィルタを初期値記憶部232に
記憶する。繰り返し制御部234は、必要な周波数成分
に対する最適フィルタが全て求められるまで逐次近似計
算を繰り返すよう逐次近似計算部233を制御する。フ
ィルタ構成部235は、以上の処理により求められた各
周波数成分の最適フィルタを合成し、最適フィルタを構
成する。このようにして最適フィルタを求めることによ
り、式(26)、または式(29)、または式(30)
が複数の極小点を持っているために、収束する極小点は
初期値に依存し、式(26)、または式(29)、また
は式(30)を最小としない極小点に収束してしまうと
いう問題点を解決することができる。その他の構成につ
いては、第1の実施形態、第2の実施形態、第3の実施
形態と同じであるので、説明を省略する。
【0103】図5は本発明の第5の実施形態の収音装置
の構成図である。本実施形態は、第4の実施形態のフィ
ルタ構成部235が間引き部2351と離散逆フーリエ
変換部2352で構成される。間引き部2351は、直
流成分最適フィルタ計算部231と逐次近似部233に
より求められた各周波数成分の最適フィルタをフィルタ
の次数に合わせて間引きする。離散逆フーリエ変換部2
352は、間引きされた最適フィルタをFIRフィルタ
の係数とするために離散逆フーリエ変換する。このよう
に最適フィルタをFIRフィルタで構成することで、フ
ィルタ13はFIRフィルタ131で実現でき、簡単な
処理でフィルタ13の処理を行うことができる。その他
の構成については、第4の実施形態と同じであるので、
説明を省略する。
【0104】図6は本発明の第6の実施形態の収音装置
の構成図である。本実施形態は、第4の実施形態のフィ
ルタ構成部235が間引き部2351で構成されるもの
で、間引き部2351は、直流成分最適フィルタ計算部
231と逐次近似部233により求められた各周波数成
分の最適フィルタをフィルタの次数に合わせて間引きす
る。フィルタ13は、離散フーリエ変換部132と乗算
部133と離散逆フーリエ変換部134で構成され、周
波数領域で間引きされた最適フィルタを乗算することに
よりフィルタを実現する。このように、周波数領域でフ
ィルタを実現することにより乗算回数を減らすことがで
きるので、第5の実施形態に比べ、少ないハードウェア
で実時間処理可能な装置を構成することができるという
利点があり、フィルタ次数が大きい場合に特に有効であ
る。その他の構成については、第4の実施形態と同じで
あるので、説明を省略する。
【0105】次に、本発明のシミュレーション結果を示
す。
【0106】まず、遅延和アレーの焦点位置から音源が
ずれた場合、遅延和アレー出力がどの程度歪むかを示
す。図11は、焦点位置を固定し、音源位置を焦点位置
からx方向に0,5,10,20,50cmずらした場
合の音源−遅延和アレー出力間の周波数特性である。
【0107】図11(a)は、SN比を最大とするよう
な加算ゲインを乗じてから加算する遅延和アレー(従来
方法)のときの周波数特性である。音源位置が焦点位置
から離れるに従い、周波数特性の高域部分から劣化が生
じているのが見て取れる。特に20,50cmずれた場
合では、1kHz付近までかなりの劣化が認められる。
図11(b)は、本発明の周波数特性である。ただし、
このとき用いたフィルタは256tapのFIRフィル
タで、音源位置推定誤差モデルの標準偏差σ=1.0
m、係数α=2.0、未定乗数β=10.0の場合の最
適フィルタである。図11(b)の本発明と図11
(a)の従来方法を比べると、本発明では高域部分の劣
化がかなり改善されているのが分かる。以上の結果よ
り、音源位置推定誤差の影響による遅延和アレー出力の
歪を、本発明により改善できることが確認された。
【0108】次に、遅延和アレーの感度分布を図12に
示す。この図はマイクロホンアレーの下方1.1mの水
平面上の感度を300Hzから7kHzまで平均し等高
線表示したものである。また、図中の数値の単位はdB
であり、焦点位置(x=1.0m、y=2.0m)の感
度を基準(0dB)としている。図12(a)の従来方
法と図12(b)の本発明の方法の感度分布を比べる
と、従来方法では焦点位置のメインローブが鋭く、約3
0cm焦点から離れると10dB程度感度が落ちてい
る。したがって、音源から焦点がずれた場合、図11
(a)に示したように出力音には大きな歪みが生じる。
一方、本発明の方法ではメインローブが広く、音源から
焦点が数10cmずれても、図11(b)に示したよう
に出力音には大きな影響がない。しかし、SN比改善の
観点から本発明の方法の感度分布をみると、メインロー
ブが広がっているために、SN比改善を従来方法ほど望
めないことが予想される。
【0109】図13に従来方法と本発明の方法のSN比
SNRおよび目的音の歪ERRを示す。SNRを求める
際の目的音源には男声(7kHz帯域)、雑音には各マ
イクロホン間で無相関なホワイトノイズを使用した。ま
た、SNRは音源に最も近いマイクロホンでのSN比を
基準(0dB)として計算し、音源位置推定誤差のない
場合の値を示した。ERRは音源位置推定誤差が20c
mの場合の値を示した。その他の条件は全て前述の条件
と同じく設定した。この図より、従来方法に比べ、本発
明の方法はERRを約10dB改善しているが、SNR
は約6dB低下していることが分かる。このことより、
本発明の方法は目的音の歪を改善することができるが、
その分SN比を犠牲にしていると言える。
【0110】以上の結果より、本発明の方法は、音源位
置推定誤差による目的音の歪を軽減する有効な手段であ
ると言える。ただし、目的音の歪とSN比はトレードオ
フの関係にあり、目的音の歪を軽減することでSN比は
低下する。SN比と目的音の歪のどちらが重要であるか
は、実際の環境(部屋の騒音、マイクロホンの配置な
ど)により変わるが、本発明では、実際の環境に合わせ
て係数αを調整することで、その環境で最適な遅延和ア
レーを構成することが可能である。
【0111】
【発明の効果】以上説明したように、本発明によれば、
装置規模を大きくせずに出力の目的音成分の歪を軽減す
ることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態の収音装置の構成図で
ある。
【図2】本発明の第2の実施形態の収音装置の構成図で
ある。
【図3】本発明の第3の実施形態の収音装置の構成図で
ある。
【図4】本発明の第4の実施形態の収音装置の構成図で
ある。
【図5】本発明の第5の実施形態の収音装置の構成図で
ある。
【図6】本発明の第6の実施形態の収音装置の構成図で
ある。
【図7】最適フィルタを求める手順を示すフローチャー
トである。
【図8】マイクロホンが音波を受音する様子を説明する
図である。
【図9】球面波モデルを仮定した遅延和アレーを説明す
る図である。
【図10】目的音の歪を軽減する従来方法を説明する図
である。
【図11】遅延和アレーの焦点位置から音源がずれた場
合の音源−遅延和アレー出力間の周波数特性を従来方法
と本発明の方法の場合で示すグラフである。
【図12】従来方法と本発明の方法の遅延和アレーの感
度分布を示すグラフである。
【図13】従来方法と本発明の方法のSN比SNRおよ
び目的音の歪ERRを示すグラフである。
【符号の説明】
111〜11M マイクロホン 121〜12M 遅延器 131〜13M フィルタ 14 加算器 15 焦点位置制御部 15A 話者位置推定部 15B 焦点位置ステアリング部 16 遅延制御部 17 最適フィルタ計算部 18 信号対雑音比推定部 19 異常音検出部 20 仮想焦点位置設定部 21 最適フィルタ計算部 22 最適フィルタ記憶部 23 最適フィルタ選択部 24 信号対雑音比推測部 231 直流成分最適フィルタ計算部 232 初期値記憶部 233 逐次近似計算部 234 繰り返し制御部 235 フィルタ構成部 2351 間引き部 2352 離散逆フーリエ変換部 131 FIRフィルタ 132 離散フーリエ変換部 133 乗算部 134 離散逆フーリエ変換部 31〜35 ステップ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 古家 賢一 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 金田 豊 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5D015 DD01 DD02 5D020 BB01 BB04 BB07 5J023 DA05 DB03 DB07 DC08 DD07

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 任意配置の複数の収音手段の各々で収録
    された音声信号を各々異なる遅延量で遅延させ、各遅延
    出力を各々異なるフィルタ係数でフィルタリングし、各
    フィルタリング出力を加算して加算出力を出力する収音
    方法において、 音源位置を推定し、 前記音源位置から発せられ、前記複数の収音手段で受音
    した信号が同位相となるように、遅延を制御し、 前記各収録音声信号の信号対雑音比を推定し、 前記各音源位置から前記各収音手段までの距離と前記信
    号対雑音比とから前記加算出力の雑音対信号比を推定
    し、 前記各距離から前記加算出力の目的音成分歪を推定し、 前記加算出力の雑音対信号比と前記目的音成分歪とから
    求められる歪関数を最小とする前記各フィルタ係数を決
    定し、 前記フィルタ係数の決定において、前記各距離で減衰さ
    せた前記各フィルタ係数の和を一定値とすることを特徴
    とする収音方法。
  2. 【請求項2】 任意配置の複数の収音手段と、前記各収
    音手段で収録された音声信号を各々異なる遅延量で遅延
    させる遅延手段と、前記遅延手段からの各遅延出力信号
    を各々異なるフィルタ係数でフィルタリングするフィル
    タリング手段と、フィルタリング手段からの各フィルタ
    リング出力とを加算して加算出力を出力する加算手段を
    有する収音装置において、 音源位置を推定する音源位置推定手段と、 前記音源位置推定手段で推定された音源位置から発せら
    れ、前記複数の収音手段で受音した信号が同位相となる
    ように、遅延を制御する遅延制御手段と、 前記各収録音声信号の信号対雑音比を推定する信号対雑
    音比推定手段と、 各音源位置から前記各収音手段までの距離と前記信号対
    雑音比とから前記加算出力の雑音対信号比を推定する加
    算雑音対信号比推定手段と、 前記各距離から前記加算出力の目的音成分歪を推定する
    目的音歪推定手段と、 前記加算出力雑音対信号比と前記目的音成分歪とから求
    められる歪関数を最小とする前記各フィルタ係数を決定
    するフィルタ係数決定手段とを有し、 前記フィルタ係数決定手段は、前記各距離で減衰させた
    前記各フィルタ係数の和が一定値となるよう前記各フィ
    ルタ係数を決定することを特徴とする収音装置。
  3. 【請求項3】 任意配置の複数の収音手段と、前記収音
    手段で収録された音声信号を各々異なる遅延量で遅延さ
    せる遅延手段と、前記遅延手段からの各遅延出力信号を
    各々異なるフィルタ係数でフィルタリングするフィルタ
    リング手段と、前記フィルタリング手段からの各フィル
    タリング出力を加算して加算出力を出力する加算手段と
    を有する収音装置において、 焦点位置を制御する焦点位置制御手段と、 該焦点位置制御手段で決定された焦点位置から発せら
    れ、前記複数の収音手段で受音した信号が同位相となる
    ように、遅延を制御する遅延制御手段と、 各収音手段で収録された信号の信号対雑音比を推定する
    信号対雑音比推定手段と、 各音源位置から前記各収音手段までの距離と前記信号対
    雑音比とから前記加算出力の雑音対信号比を推定する雑
    音対信号比推定手段と、 前記各距離から前記加算出力の目的音成分歪を推定する
    目的音歪推定手段と、 前記加算出力の雑音対信号比と前記目的音成分歪から求
    められる歪関数を最小とする前記各フィルタ係数を決定
    するフィルタ係数決定手段とを有し、 前記フィルタ係数決定手段は、前記各距離で減衰させた
    前記各フィルタ係数の和が一定値となるよう前記各フィ
    ルタ係数を決定することを特徴とする収音装置。
  4. 【請求項4】 前記最適フィルタ計算手段が、あらかじ
    め複数の仮想焦点位置を設定する仮想焦点位置設定手段
    と、あらかじめ計測した雑音レベルと標準的な発生音の
    大きさから信号対雑音比を推測する信号対雑音比推測手
    段と、該仮想焦点位置設定手段により設定された複数の
    仮想焦点位置と前記信号対雑音比推測手段によって推測
    された信号対雑音比に対応する最適なフィルタを計算し
    ておく最適フィルタ計算手段と、該最適フィルタ計算手
    段の計算結果である最適フィルタを記憶しておく最適フ
    ィルタ記憶手段と、前記焦点位置制御手段で決定された
    焦点位置に最も近い仮想焦点位置の最適フィルタを前記
    最適フィルタ記憶手段から選択する最適フィルタ選択手
    段を含む、請求項3記載の収音装置。
  5. 【請求項5】 前記最適フィルタ計算手段が、直流成分
    における最適フィルタを解析的に求める直流成分最適フ
    ィルタ計算手段と、直前に求めた最適フィルタを初期値
    として記憶する初期値記憶手段と、該初期値記憶手段に
    記憶されている最適フィルタを初期値とし、直前に求め
    た最適フィルタの周波数成分より微小に高い周波数成分
    に対する最適フィルタを逐次近似で求める逐次近似計算
    手段と、必要な周波数成分に対する最適フィルタが全て
    求められるまで前記初期値記憶手段と前記逐次近似手段
    の処理を繰り返すようにこれらを制御する繰り返し制御
    手段と、前記直流成分最適フィルタ計算手段と前記逐次
    近似手段により求められた各周波数成分に対する最適フ
    ィルタを合成し、最適フィルタを構成するフィルタ構成
    手段とを含む、請求項3または4記載の収音装置。
  6. 【請求項6】 前記フィルタ構成手段が、前記直流成分
    最適フィルタ計算手段と前記逐次近似手段により求めら
    れた各周波数成分の最適フィルタをフィルタの次数に合
    わせて周波数領域で間引きする間引き手段と、間引きさ
    れた最適フィルタを離散逆フーリエ変換によりFIRフ
    ィルタの係数とする離散逆フーリエ変換手段とを含み、
    前記フィルタ手段をFIRフィルタとする、請求項5記
    載の収音装置。
  7. 【請求項7】 前記フィルタ構成手段が、前記直流成分
    最適フィルタ計算手段と前記逐次近似手段により求めら
    れた各周波数成分の最適フィルタをフィルタの次数に合
    わせて周波数領域で間引きする間引き手段で構成され、
    前記フィルタ手段が遅延器出力信号を周波数領域に変換
    する離散フーリエ変換手段と、間引きされた最適フィル
    タと周波数領域に変換された遅延手段出力信号を周波数
    領域で乗算する乗算手段と、乗算後の信号を時間領域に
    変換する離散逆フーリエ変換手段とで構成される、請求
    項5記載の収音装置。
JP2000118069A 2000-04-19 2000-04-19 収音方法および収音装置 Expired - Fee Related JP3582712B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000118069A JP3582712B2 (ja) 2000-04-19 2000-04-19 収音方法および収音装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000118069A JP3582712B2 (ja) 2000-04-19 2000-04-19 収音方法および収音装置

Publications (2)

Publication Number Publication Date
JP2001309483A true JP2001309483A (ja) 2001-11-02
JP3582712B2 JP3582712B2 (ja) 2004-10-27

Family

ID=18629277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000118069A Expired - Fee Related JP3582712B2 (ja) 2000-04-19 2000-04-19 収音方法および収音装置

Country Status (1)

Country Link
JP (1) JP3582712B2 (ja)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004064697A (ja) * 2002-07-31 2004-02-26 Nippon Telegr & Teleph Corp <Ntt> 音源受音位置推定方法、装置、およびプログラム
JP2006066988A (ja) * 2004-08-24 2006-03-09 Nippon Telegr & Teleph Corp <Ntt> 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体
WO2006064699A1 (ja) * 2004-12-17 2006-06-22 Waseda University 音源分離システムおよび音源分離方法、並びに音響信号取得装置
WO2007066570A1 (ja) * 2005-12-05 2007-06-14 Dimagic Co., Ltd. 収音・再生方法および装置
JP2007295104A (ja) * 2006-04-21 2007-11-08 Yamaha Corp 収音装置および音声会議装置
WO2008126343A1 (ja) * 2007-03-29 2008-10-23 Dimagic Co., Ltd. 収音方法および装置
US7478041B2 (en) 2002-03-14 2009-01-13 International Business Machines Corporation Speech recognition apparatus, speech recognition apparatus and program thereof
JP2009509362A (ja) * 2005-06-24 2009-03-05 ネイダーランゼ、オルガニザティー、ボー、トゥーゲパストナトゥールウェテンシャッペルーク、オンダーツォーク、ティーエヌオー 複数の音源によって放射される信号から音響信号を抽出するためのシステムおよび方法。
JP2009218663A (ja) * 2008-03-07 2009-09-24 Sanyo Electric Co Ltd 音響信号処理装置
JP2010513987A (ja) * 2006-12-22 2010-04-30 ステップ・ラブス・インク 近接場ベクトル信号増幅
KR101116013B1 (ko) * 2008-07-11 2012-02-10 후지쯔 가부시끼가이샤 잡음 억압 장치, 잡음 억압 방법 및 휴대 전화기
WO2012023268A1 (ja) * 2010-08-16 2012-02-23 日本電気株式会社 多マイクロホン話者分類装置、方法およびプログラム
US8385562B2 (en) 2007-12-03 2013-02-26 Samsung Electronics Co., Ltd Sound source signal filtering method based on calculated distances between microphone and sound source
US8532986B2 (en) 2009-03-26 2013-09-10 Fujitsu Limited Speech signal evaluation apparatus, storage medium storing speech signal evaluation program, and speech signal evaluation method
US8638955B2 (en) 2006-11-22 2014-01-28 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, method of producing the same, and information processing system
US8731693B2 (en) 2006-11-22 2014-05-20 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, method of producing the same, and information processing system
US9058821B2 (en) 2008-11-28 2015-06-16 Fujitsu Limited Computer-readable medium for recording audio signal processing estimating a selected frequency by comparison of voice and noise frame levels
JP2017059951A (ja) * 2015-09-15 2017-03-23 シャープ株式会社 マイクシステム、音声認識装置、音声処理方法、および音声処理プログラム
JP2018519679A (ja) * 2016-04-22 2018-07-19 北京小米移動軟件有限公司Beijing Xiaomi Mobile Software Co.,Ltd. ビデオ処理方法、装置、プログラム及び記録媒体
WO2019030898A1 (ja) * 2017-08-10 2019-02-14 三菱電機株式会社 雑音除去装置および雑音除去方法
CN111899749A (zh) * 2020-07-14 2020-11-06 上海建工集团股份有限公司 一种监听混凝土泵送管道作业声音的降噪方法
CN113708868A (zh) * 2021-08-27 2021-11-26 国网安徽省电力有限公司池州供电公司 一种多拾音设备的调度系统及其调度方法
CN115881151A (zh) * 2023-01-04 2023-03-31 广州市森锐科技股份有限公司 一种基于高拍仪的双向拾音消噪方法、装置、设备及介质

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7478041B2 (en) 2002-03-14 2009-01-13 International Business Machines Corporation Speech recognition apparatus, speech recognition apparatus and program thereof
US7720679B2 (en) 2002-03-14 2010-05-18 Nuance Communications, Inc. Speech recognition apparatus, speech recognition apparatus and program thereof
JP2004064697A (ja) * 2002-07-31 2004-02-26 Nippon Telegr & Teleph Corp <Ntt> 音源受音位置推定方法、装置、およびプログラム
JP2006066988A (ja) * 2004-08-24 2006-03-09 Nippon Telegr & Teleph Corp <Ntt> 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体
US8213633B2 (en) 2004-12-17 2012-07-03 Waseda University Sound source separation system, sound source separation method, and acoustic signal acquisition device
WO2006064699A1 (ja) * 2004-12-17 2006-06-22 Waseda University 音源分離システムおよび音源分離方法、並びに音響信号取得装置
JP2009509362A (ja) * 2005-06-24 2009-03-05 ネイダーランゼ、オルガニザティー、ボー、トゥーゲパストナトゥールウェテンシャッペルーク、オンダーツォーク、ティーエヌオー 複数の音源によって放射される信号から音響信号を抽出するためのシステムおよび方法。
WO2007066570A1 (ja) * 2005-12-05 2007-06-14 Dimagic Co., Ltd. 収音・再生方法および装置
JP2007295104A (ja) * 2006-04-21 2007-11-08 Yamaha Corp 収音装置および音声会議装置
US8731693B2 (en) 2006-11-22 2014-05-20 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, method of producing the same, and information processing system
US8638955B2 (en) 2006-11-22 2014-01-28 Funai Electric Advanced Applied Technology Research Institute Inc. Voice input device, method of producing the same, and information processing system
JP2010513987A (ja) * 2006-12-22 2010-04-30 ステップ・ラブス・インク 近接場ベクトル信号増幅
WO2008126343A1 (ja) * 2007-03-29 2008-10-23 Dimagic Co., Ltd. 収音方法および装置
US9182475B2 (en) 2007-12-03 2015-11-10 Samsung Electronics Co., Ltd. Sound source signal filtering apparatus based on calculated distance between microphone and sound source
US8385562B2 (en) 2007-12-03 2013-02-26 Samsung Electronics Co., Ltd Sound source signal filtering method based on calculated distances between microphone and sound source
KR101238362B1 (ko) 2007-12-03 2013-02-28 삼성전자주식회사 음원 거리에 따라 음원 신호를 여과하는 방법 및 장치
US8577055B2 (en) 2007-12-03 2013-11-05 Samsung Electronics Co., Ltd. Sound source signal filtering apparatus based on calculated distance between microphone and sound source
JP2009218663A (ja) * 2008-03-07 2009-09-24 Sanyo Electric Co Ltd 音響信号処理装置
KR101116013B1 (ko) * 2008-07-11 2012-02-10 후지쯔 가부시끼가이샤 잡음 억압 장치, 잡음 억압 방법 및 휴대 전화기
US9135924B2 (en) 2008-07-11 2015-09-15 Fujitsu Limited Noise suppressing device, noise suppressing method and mobile phone
US9058821B2 (en) 2008-11-28 2015-06-16 Fujitsu Limited Computer-readable medium for recording audio signal processing estimating a selected frequency by comparison of voice and noise frame levels
US8532986B2 (en) 2009-03-26 2013-09-10 Fujitsu Limited Speech signal evaluation apparatus, storage medium storing speech signal evaluation program, and speech signal evaluation method
WO2012023268A1 (ja) * 2010-08-16 2012-02-23 日本電気株式会社 多マイクロホン話者分類装置、方法およびプログラム
JP2017059951A (ja) * 2015-09-15 2017-03-23 シャープ株式会社 マイクシステム、音声認識装置、音声処理方法、および音声処理プログラム
JP2018519679A (ja) * 2016-04-22 2018-07-19 北京小米移動軟件有限公司Beijing Xiaomi Mobile Software Co.,Ltd. ビデオ処理方法、装置、プログラム及び記録媒体
WO2019030898A1 (ja) * 2017-08-10 2019-02-14 三菱電機株式会社 雑音除去装置および雑音除去方法
JPWO2019030898A1 (ja) * 2017-08-10 2019-12-26 三菱電機株式会社 雑音除去装置および雑音除去方法
CN110999317A (zh) * 2017-08-10 2020-04-10 三菱电机株式会社 杂音去除装置以及杂音去除方法
CN111899749A (zh) * 2020-07-14 2020-11-06 上海建工集团股份有限公司 一种监听混凝土泵送管道作业声音的降噪方法
CN111899749B (zh) * 2020-07-14 2023-08-29 上海建工集团股份有限公司 一种监听混凝土泵送管道作业声音的降噪方法
CN113708868A (zh) * 2021-08-27 2021-11-26 国网安徽省电力有限公司池州供电公司 一种多拾音设备的调度系统及其调度方法
CN113708868B (zh) * 2021-08-27 2023-06-27 国网安徽省电力有限公司池州供电公司 一种多拾音设备的调度系统及其调度方法
CN115881151A (zh) * 2023-01-04 2023-03-31 广州市森锐科技股份有限公司 一种基于高拍仪的双向拾音消噪方法、装置、设备及介质

Also Published As

Publication number Publication date
JP3582712B2 (ja) 2004-10-27

Similar Documents

Publication Publication Date Title
JP3582712B2 (ja) 収音方法および収音装置
US10079026B1 (en) Spatially-controlled noise reduction for headsets with variable microphone array orientation
US10331396B2 (en) Filter and method for informed spatial filtering using multiple instantaneous direction-of-arrival estimates
US8355510B2 (en) Reduced latency low frequency equalization system
KR101449433B1 (ko) 마이크로폰을 통해 입력된 사운드 신호로부터 잡음을제거하는 방법 및 장치
KR101456866B1 (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
JP4286637B2 (ja) マイクロホン装置および再生装置
US8238569B2 (en) Method, medium, and apparatus for extracting target sound from mixed sound
US7577262B2 (en) Microphone device and audio player
US7991167B2 (en) Forming beams with nulls directed at noise sources
JP4965707B2 (ja) 音識別方法および装置
JP3940662B2 (ja) 音響信号処理方法及び音響信号処理装置及び音声認識装置
TW201901662A (zh) 用於具有可變麥克風陣列定向之耳機之雙麥克風語音處理
US8615092B2 (en) Sound processing device, correcting device, correcting method and recording medium
KR20130084298A (ko) 원거리 다중 음원 추적 및 분리 시스템, 방법, 장치 및 컴퓨터-판독가능 매체
CN111078185A (zh) 录制声音的方法及设备
CN111354368B (zh) 补偿处理后的音频信号的方法
JP5738218B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
US20130253923A1 (en) Multichannel enhancement system for preserving spatial cues
JP4119328B2 (ja) 収音方法、その装置、そのプログラム、およびその記録媒体。
JP5635024B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
JP5143802B2 (ja) 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム
JP4116600B2 (ja) 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体
JP2001313992A (ja) 収音装置および収音方法
JP5683140B2 (ja) 耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040714

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040722

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040722

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040722

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080806

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080806

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090806

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090806

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100806

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100806

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110806

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees