JP2001100800A - 雑音成分抑圧処理装置および雑音成分抑圧処理方法 - Google Patents

雑音成分抑圧処理装置および雑音成分抑圧処理方法

Info

Publication number
JP2001100800A
JP2001100800A JP27330699A JP27330699A JP2001100800A JP 2001100800 A JP2001100800 A JP 2001100800A JP 27330699 A JP27330699 A JP 27330699A JP 27330699 A JP27330699 A JP 27330699A JP 2001100800 A JP2001100800 A JP 2001100800A
Authority
JP
Japan
Prior art keywords
noise
input
beamformer
target sound
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP27330699A
Other languages
English (en)
Other versions
JP3484112B2 (ja
Inventor
Hiroshi Kanazawa
博史 金澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP27330699A priority Critical patent/JP3484112B2/ja
Publication of JP2001100800A publication Critical patent/JP2001100800A/ja
Application granted granted Critical
Publication of JP3484112B2 publication Critical patent/JP3484112B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】 【課題】計算量が少なく、突発雑音除去も可能な雑音抑
圧処理を可能にする。 【解決手段】複数位置で音声検出し得た受音位置別音声
信号毎に周波数(f)分析しチャネル(ch)別f成分を得る手
段12、各chのf成分につき所望方向外を低感度化するフ
ィルタ(F)係数によるF処理にて話者方向の雑音(N)を抑
圧し目的音声(Oa)成分を得る第1ビームフォーマ処理手
段(B1)13、手段12での各chのf成分につき所望方向外を
低感度化するF処理で話者音声抑圧しN成分を得る第2
ビームフォーマ処理手段(B2)16、B1のF係数からN方向
を推定しB2のF係数からOa方向を推定する推定手段17,1
8、B1において入力対象(Oj)のOaの到来方向を推定手段
の推定Oa方向に応じ修正しB2においてOjのNの到来方向
を推定手段の推定雑音方向に応じ修正する手段14,15、B
1とB2の出力に基づきスペクトルサブトラクション(SS)
処理する手段30、手段12の出力から到来音の時間差と振
幅差に応じた方向性指標Dを得る手段40、Dと手段12のOa
方向とに基づきSS処理制御する手段50を持つ。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は複数のマイクロホン
を用いて雑音を抑圧し、目的の音声を取り出す雑音成分
抑圧装置および雑音成分抑圧方法に関する。
【0002】
【従来の技術】環境下には種々の雑音源があることか
ら、マイクロホンで音声信号を取り込む場合において
も、周囲から紛れ込む雑音を避けることは難しい。しか
し、雑音が混入した音声信号を再生すると、目的の音声
が聴き辛いものとなるから、雑音成分の低減処理が必要
となる。
【0003】ところで、音声に紛れる雑音の低減処理技
術として、従来より知られているものに、複数のマイク
ロホンを用いて雑音を抑圧する技術がある。そして、こ
のマイクロホン処理技術は、音声認識装置やテレビ会議
装置などの音声入力を目的として従来から多くの研究者
によって技術開発に力が注がれている。中でも、少ない
マイクロホン数で大きな効果が得られる適応ビームフォ
ーマ処理技術を利用したマイクロホンアレイに関して
は、文献1(電子情報通信学会編:音響システムとデジ
タル処理)あるいは文献2(Heykin著;Adaptive Filt
er Theory(Plentice Hall))に述べられているよう
に、一般化サイドロープキャンセラ(GSC)、フロス
ト型ビームフォーマ、参照信号法など、種々の方法が知
られている。
【0004】なお、適応ビームフォーマ処理と云うの
は、一般には、妨害雑音の到来方向に死角を形成したフ
ィルタにより雑音を抑圧する処理である。
【0005】しかしながら、この適応ビームフォーマ処
理技術においては、実際の目的信号の到来方向が、仮定
した到来方向と異なる場合、その目的信号が雑音と見做
されて除去されてしまうことから、性能が劣化するとい
う問題を抱えている。
【0006】そこで、これを改善すべく、例えば文献3
(宝珠山他:“ブロッキング行列にリーク適応フィルタ
を用いたロバスト一般化サイドローブキャンセラ”、電
子情報通信学会論文誌 A Vol.J79−A N
o.9 pp1516−1524(1996.9))に
開示されているように、仮定した到来方向と実際の到来
方向とのずれを許容するような技術が開発されている
が、この場合、目的信号の除去は軽減されても、実際の
到来方向と仮定した到来方向とのずれにより、目的信号
が歪むおそれがある。
【0007】これに対し、例えば、特開平9‐9794
号公報において、複数のビームフォーマを用いて、話者
方向を逐次検知してその方向にビームフォーマの入力方
向を修正することで、話者の方向を追尾し、目的信号の
歪みを小さくする方法も開示されている。
【0008】しかしながら、特開平9‐9794号公報
に開示されている方法は、時間領域の適応フィルタ処理
を行っているため、フィルタ係数から話者方向を推定す
る際、時間領域のフィルタ係数から周波数領域への変換
が必要であり、計算量が大きくなる。
【0009】
【発明が解決しようとする課題】音声の雑音を抑圧する
技術として、複数本のマイクロホンを用い、これらのマ
イクロホンで、話者の音声を取り込むと共に、妨害雑音
の到来方向に死角を形成したフィルタを通すことによ
り、雑音成分を抑圧する適応ビームフォーマ処理技術が
ある。
【0010】この適応ビームフォーマ処理技術において
は、実際の目的信号の到来方向、すなわち、話者のいる
方向が、予め仮定した到来方向と異なる場合、目的信号
が雑音と見做されて除去され、音声収集性能が劣化する
という問題を抱えている。
【0011】そこで、これを改善すべく、仮定した到来
方向と実際の到来方向とのずれを許容するような技術が
開発されているが、この場合、目的信号の除去は軽減さ
れても、実際の到来方向と仮定した到来方向とのずれに
より、目的信号が歪む心配があり、得られる音声の品質
の問題を残している。
【0012】また、複数のビームフォーマを用い、話者
方向を逐次検知してその方向にビームフォーマの入力方
向を修正することで、話者の方向を追尾し、目的信号の
歪みを小さくする方法も提案されている。しかしなが
ら、この方法は、時間領域の適応フィルタ処理を行って
いるため、フィルタ係数から話者方向を推定する際、時
間領域のフィルタ係数から周波数領域への変換が必要で
あり、計算量が大きくなるという問題があった。
【0013】故に、従来の技術はいずれも一長一短であ
り、高品位に目的信号を収集できると共に、処理時間も
短時間で済むようなビームフォーマ処理技術の開発が嘱
望されている。また、例えば、車両内や街頭あるいは駅
等に設置されている音声認識装置などを考えた場合、車
走行中などに遭遇する突発雑音や、高速で移動する対向
車などの雑音、通過する車両の音などがあり、また、テ
レビ会議などでは、部屋に設置された電話の突然の呼び
出し音、部屋に出入りする人のドア開閉音といった突発
雑音も考えられるので、これらのような継続時間がごく
短い雑音に関しても十分な雑音抑圧性能が欲しいところ
である。
【0014】そこで、この発明の目的とするところは、
周波数領域で動作するビームフォーマを用いることで、
計算量を大幅に削減することができると共に、継続時間
がごく短い雑音に対する雑音の抑圧性能や移動する音源
についての抑圧性能も十分期待できて突発性の雑音にも
対処できるようにした雑音成分抑圧処理装置および雑音
成分抑圧処理方法を提供することにある。
【0015】
【課題を解決するための手段】上記目的を達成するた
め、本発明は次のように構成する。
【0016】[1] 第1には、話者の音声を異なる2
箇所以上の位置で受音してそれぞれ音声信号として出力
する音声入力手段と、前記受音位置に対応する音声信号
のチャネル毎に周波数分析を行ってそれぞれチャネル別
の周波数成分を出力する周波数分析手段と、前記周波数
分析手段の出力する複数チャネルの周波数成分を用いて
適応フィルタ処理により目的の音声以外の到来雑音の抑
圧処理を行い、目的音声成分の信号を出力する第1のビ
ームフォーマ処理手段と、前記周波数分析手段の出力す
る複数チャネルの周波数成分を用いて適応フィルタ処理
により目的の音声の抑圧処理を行って雑音成分の信号を
出力する第2のビームフォーマ処理手段と、前記第1の
ビームフォーマ処理手段で計算されるフィルタ係数から
雑音方向を推定する雑音方向推定手段と、前記第2のビ
ームフォーマ処理手段で計算されるフィルタ係数から目
的音方向を推定する目的音方向推定手段と、前記第1の
ビームフォーマ処理手段において入力対象とする目的音
の到来方向である第1の入力方向を、前記目的音方向推
定手段で推定された目的音方向に基づいて逐次修正する
第1の入力方向修正手段と、前記第2のビームフォーマ
処理手段において入力対象とする雑音の到来方向である
第2の入力方向を、前記雑音方向推定手段で推定された
雑音方向に基づいて逐次修正する第2の入力方向修正手
段と、前記第1のビームフォーマ処理手段の出力と第2
のビームフォーマ処理手段の出力に基づいて非線形の雑
音抑圧処理であるスペクトルサブトラクション処理を行
うスペクトルサブトラクション手段と、前記周波数分析
手段から出力された周波数成分から到来音の時間差と振
幅の差に基づいた方向性の指標を計算する方向性検出手
段と、該方向性指標と前記目的音方向推定手段から出力
された目的音方向とに基づいて前記スペクトルサブトラ
クション手段のスペクトルサブトラクション処理を制御
するスペクトルサブトラクション制御手段とを具備して
構成する。
【0017】[2] 第2には、話者の音声を異なる2
箇所以上の位置で受音してそれぞれ音声信号として出力
する音声入力手段と、前記受音位置に対応する音声信号
のチャネル毎に周波数分析を行ってそれぞれチャネル別
の周波数成分を出力する周波数分析手段と、この周波数
分析手段にて得られる前記複数チャネルの周波数成分に
ついて、所望方向外の感度が低くなるように計算したフ
ィルタ係数を用いての適応フィルタ処理を施すことによ
り前記話者方向からの音声以外の音声を抑圧する到来雑
音抑圧処理を行い、目的音声成分を得る第1のビームフ
ォーマ処理手段と、前記周波数分析手段にて得られる前
記複数チャネルの周波数成分について、所望方向外の感
度が低くなるように計算したフィルタ係数を用いての適
応フィルタ処理を施すことにより前記話者方向からの音
声を抑圧し、第1の雑音成分を得る第2のビームフォー
マ処理手段と、前記周波数分析手段にて得られる前記複
数チャネルの周波数成分について、所望方向外の感度が
低くなるように計算したフィルタ係数を用いての適応フ
ィルタ処理を施すことにより前記話者方向からの音声を
抑圧し、第2の雑音成分を得る第2のビームフォーマ処
理手段と、前記第1のビームフォーマ処理手段で計算さ
れるフィルタ係数から雑音方向を推定する雑音方向推定
手段と、前記第2のビームフォーマ処理手段で計算され
るフィルタ係数から第1の目的音方向を推定する第1の
目的音方向推定手段と、前記第3の適応ビームフォーマ
処理手段で計算されるフィルタ係数から第2の目的音方
向を推定する第2の目的音方向推定手段と、前記第1の
ビームフォーマ処理手段において入力対象とする目的音
の到来方向である第1の入力方向を、前記第1の目的音
方向推定手段で推定された第1の目的音方向と、第2の
目的音方向推定手段で推定された第2の目的音方向のい
ずれか一方または両方に基づいて逐次修正する第1の入
力方向修正手段と、前記雑音方向修正手段で推定された
雑音方向が所定の第1の範囲にある場合に、前記第2の
ビームフォーマ処理手段において入力対象とする雑音の
到来方向である第2の入力方向を該雑音方向に基づいて
逐次修正する第2の入力方向修正手段と、前記雑音方向
修正手段で推定された雑音方向が所定の第2の範囲にあ
る場合に、前記第3のビームフォーマ処理手段において
入力対象とする雑音の到来方向である第3の入力方向を
該雑音方向に基づいて逐次修正する第3の入力方向修正
手段と、前記雑音方向推定手段で推定された雑音方向が
所定の第1の範囲から到来したか所定の第2の範囲から
到来したかに基づいて前記第1および第2の出力雑音の
いずれか一方を真の雑音出力と決定していずれか一方の
雑音を出力すると同時に、第1の音声方向推定手段と第
2の音声方向推定手段のいずれの推定結果が有効である
かを決定していずれか一方の音声方向推定結果を第1の
入力方向修正手段へ出力する有効雑音決定手段と、前記
第1のビームフォーマ処理手段の出力と第2のビームフ
ォーマ処理手段の出力に基づいて非線形の雑音抑圧処理
であるスペクトルサブトラクション処理を行うスペクト
ルサブトラクション手段と、前記周波数分析手段から出
力された周波数成分から到来音の時間差と振幅の差に基
づいた方向性の指標を計算する方向性検出手段と、該方
向性指標と前記目的音方向推定手段から出力された目的
音方向とに基づいて前記スペクトルサブトラクション手
段のスペクトルサブトラクション処理を制御するスペク
トルサブトラクション制御手段とを具備して構成する。
【0018】[3] また、第3には、前記スペクトル
サブトラクション手段は、得られた音声周波数を、周波
数帯域毎に分割して帯域毎の音声パワーを計算する音声
帯域パワー計算手段と、前記得られた雑音周波数成分
を、周波数帯域毎に分割して帯域毎の雑音パワーを計算
する雑音帯域パワー計算手段と、前記音声帯域パワー計
算手段と雑音帯域パワー計算手段とから得られる音声と
雑音の周波数帯域パワーおよび前記スペクトルサブトラ
クション制御手段の出力に基き、帯域重み係数を求める
帯域重み計算手段と、音声信号をその周波数帯域毎に前
記帯域重み係数をかけて背景雑音を抑圧するスペクトル
減算手段と、から構成することを特徴とする雑音成分抑
圧装置。
【0019】[4] また、第4には、前記スペクトル
サブトラクション手段は、前記得られた音声周波数を、
周波数帯域毎に分割して帯域毎の音声パワーを計算する
音声帯域パワー計算手段と、前記得られた雑音周波数成
分を、周波数帯域毎に分割して帯域毎の雑音パワーを計
算する雑音帯域パワー計算手段と、前記音声入力手段か
ら得られた入力信号を周波数分析した入力信号の周波数
成分を周波数帯域毎に分割し、帯域毎の入力パワーを計
算する入力帯域パワー計算手段と、前記音声帯域パワー
計算手段と雑音帯域パワー計算手段とから得られる音声
と雑音の周波数帯域パワーおよび前記入力帯域パワー計
算手段にて得られる帯域毎の入力パワー並びに前記スペ
クトルサブトラクション制御手段の出力に基き、帯域重
み係数を求める帯域重み計算手段と、音声信号の周波数
帯域毎に前記帯域重み係数をかけて背景雑音を抑圧する
修正スペクトル減算手段を具備することを特徴とする。
【0020】このような構成の本発明は、[1]の構成
の場合、話者の発声した音声を異なる2箇所以上の位置
で音声入力手段は受音し、周波数分析手段では、これを
前記受音位置に対応する音声信号のチャネル毎に周波数
分析して複数チャネルの周波数成分を出力する。そし
て、第1のビームフォーマ処理手段はこの周波数分析手
段にて得られる前記複数チャネルの周波数成分につい
て、所望方向外の感度が低くなるように計算したフィル
タ係数を用いての適応フィルタ処理を施すことにより前
記話者方向からの音声以外の音声を抑圧する到来雑音抑
圧処理を行い、目的音声成分を得、また、第2のビーム
フォーマ処理手段は、前記周波数分析手段にて得られる
前記複数チャネルの周波数成分について、所望方向外の
感度が低くなるように計算したフィルタ係数を用いての
適応フィルタ処理を施すことにより前記話者方向からの
音声を抑圧し、雑音成分を得る。そして、雑音方向推定
手段は、前記第1のビームフォーマ処理手段で計算され
るフィルタ係数から雑音方向を推定し、目的音方向推定
手段は、前記第2のビームフォーマ処理手段で計算され
るフィルタ係数から目的音方向を推定する。目的音方向
修正手段は、前記第1のビームフォーマにおいて入力対
象となる目的音の到来方向である第1の入力方向を、前
記目的音方向推定手段で推定された目的音方向に基づい
て逐次修正するので、第1のビームフォーマは第1の入
力方向以外から到来する雑音成分を抑圧して話者の音声
成分を低雑音で抽出することになる。また、雑音方向修
正手段は、前記第2のビームフォーマにおいて入力対象
とする雑音の到来方向である第2の入力方向を、前記雑
音方向推定手段で推定された雑音方向に基づいて逐次修
正するので、第2のビームフォーマは第2の入力方向以
外から到来する成分を抑圧して話者の音声成分を抑圧し
た残りの雑音成分を抽出することになる。
【0021】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点、そ
して、本発明では、突発性の雑音にも対処できるよう
に、短時間データを用いて到来音が目的方向から到来し
たかどうかを決めるための方向性の指標を高精度に求め
る方向性検出手段を組み入れ、方向性指標と従来処理に
おける話者方向とからスペクトルサブトラクションを制
御して突発性雑音を抑圧するようにした点にある。
【0022】これによると、上述した方向性指標とビー
ムフォーマのフィルタの指向性から求めた話者方向との
両方に基づいて目的音/雑音の判定を行うことにより、
設定した話者範囲以外からの音声を除去できるととも
に、突発雑音など、継続時間の短い信号も高精度で除去
できるようになるため、実環境における雑音抑圧処理を
極めて高精度に行うことが可能となる。
【0023】また、第1及び第2のビームフォーマとし
て、周波数領域で動作するビームフォーマを用いるよう
にしたことによって、計算量を大幅に削減することがで
きるようになる。
【0024】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
【0025】すなわち、従来技術では、ビームフォーマ
で抑圧できない拡散性雑音の抑圧処理のために、スペク
トルサブトラクション(以後、SSと略称する)処理
を、ビームフォーマ処理の後に行うようにしており、こ
のSSは周波数スペクトルを入力とするため、FFT
(高速フーリエ変換)などの周波数分析が従来必要であ
ったが、周波数領域で動作するビームフォーマを用いる
と当該ビームフォーマからは周波数スペクトルが出力さ
れるため、これをSSに流用できるので、特別にSSの
ためのFFTを実施する従来のFFT処理工程は省略す
ることができる。故に、全体の演算量を大幅に削減する
ことができる。
【0026】また、ビームフォーマのフィルタを用いた
方向推定の際に必要であった時間領域から周波数領域へ
の変換処理も不要となり、全体の演算量を大幅に削減す
ることができる。
【0027】また、[2]の構成の場合、話者の発声し
た音声を異なる2箇所以上の位置で音声入力手段は受音
し、周波数分析手段では、これを前記受音位置に対応す
る音声信号のチャネル毎に周波数分析して複数チャネル
の周波数成分を出力する。そして、第1のビームフォー
マ処理手段はこの周波数分析手段にて得られる前記複数
チャネルの周波数成分について、所望方向外の感度が低
くなるように計算したフィルタ係数を用いての適応フィ
ルタ処理を施すことにより前記話者方向からの音声以外
の音声を抑圧する到来雑音抑圧処理を行い、目的音声成
分を得、また、第2のビームフォーマ処理手段は、前記
周波数分析手段にて得られる前記複数チャネルの周波数
成分について、所望方向外の感度が低くなるように計算
したフィルタ係数を用いての適応フィルタ処理を施すこ
とにより前記話者方向からの音声を抑圧し、雑音成分を
得る。そして、雑音方向推定手段は、前記第1のビーム
フォーマ処理手段で計算されるフィルタ係数から雑音方
向を推定し、目的音方向推定手段は、前記第2のビーム
フォーマ処理手段で計算されるフィルタ係数から目的音
方向を推定する。
【0028】また、第1の目的音方向推定手段は前記第
2のビームフォーマ処理手段で計算されるフィルタ係数
から第1の目的音方向を推定し、第2の目的音方向推定
手段は、前記第3の適応ビームフォーマ処理手段で計算
されるフィルタ係数から第2の目的音方向を推定する。
【0029】第1の入力方向修正手段は、前記第1のビ
ームフォーマにおいて入力対象とする目的音の到来方向
である第1の入力方向を、前記第1の目的音方向推定手
段で推定された第1の目的音方向と、第2の目的音方向
推定手段で推定された第2の目的音方向のいずれか一方
または両方に基づいて逐次修正する。そして、第2の入
力方向修正手段は、前記雑音方向修正手段で推定された
雑音方向が所定の第1の範囲にある場合に、前記第2の
ビームフォーマにおいて入力対象とする雑音の到来方向
である第2の入力方向を該雑音方向に基づいて逐次修正
し、第3の入力方向修正手段は、前記雑音方向修正手段
で推定された雑音方向が所定の第2の範囲にある場合
に、前記第3のビームフォーマにおいて入力対象とする
雑音の到来方向である第3の入力方向を該雑音方向に基
づいて逐次修正する。
【0030】従って、第2の入力方向修正手段の出力に
より第2の入力方向を修正される第2のビームフォーマ
は第2の入力方向以外から到来する成分を抑圧して残り
の雑音成分を抽出することになり、また、第3の入力方
向修正手段の出力により第3の入力方向を修正される第
3のビームフォーマは第3の入力方向以外から到来する
成分を抑圧して残りの雑音成分を抽出することになる。
【0031】そして、有効雑音決定手段は、前記雑音方
向推定手段で推定された雑音方向が所定の第1の範囲か
ら到来したか所定の第2の範囲から到来したかに基づい
て前記第1の出力雑音と前記第2の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第1の音声方向推定手段と第2の音声
方向推定手段のいずれの推定結果が有効であるかを決定
して有効な方の音声方向推定結果を第1の入力方向修正
手段へ出力する。
【0032】この結果、目的音方向修正手段は、前記第
1のビームフォーマにおいて入力対象となる目的音の到
来方向である第1の入力方向を、前記決定した方の目的
音方向推定手段で得た目的音方向に基づいて逐次修正す
るので、第1のビームフォーマは第1の入力方向以外か
ら到来する雑音成分を抑圧して話者の音声成分を低雑音
で抽出することになる。
【0033】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点、そ
して、本発明では、突発性の雑音にも対処できるよう
に、短時間データを用いて到来音が目的方向から到来し
たかどうかを決めるための方向性の指標を高精度に求め
る方向性検出手段を組み入れ、方向性指標と従来処理に
おける話者方向とからスペクトルサブトラクションを制
御して突発性雑音を抑圧するようにした点にある。
【0034】これによると、上述した方向性指標とビー
ムフォーマのフィルタの指向性から求めた話者方向との
両方に基づいて目的音/雑音の判定を行うことにより、
設定した話者範囲以外からの音声を除去できるととも
に、突発雑音など、継続時間の短い信号も高精度で除去
できるようになるため、実環境における雑音抑圧処理を
極めて高精度に行うことが可能となる。
【0035】また、第1及び第2のビームフォーマとし
て、周波数領域で動作するビームフォーマを用いるよう
にしたことによって、計算量を大幅に削減することがで
きるようになる。
【0036】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
【0037】また、本発明では、雑音追尾に監視領域を
全く異ならせた雑音追尾用のビームフォーマを設けてあ
り、それぞれの出力からそれぞれ音声方向を推定させる
と共に、それぞれの推定結果からいずれが有効な雑音追
尾をしているかを判断して、有効と判断された方のビー
ムフォーマのフィルタ係数による音声方向の推定結果を
第1の目的音方向修正手段に与えることで第1の目的音
方向修正手段は、前記第1のビームフォーマにおいて入
力対象となる目的音の到来方向である第1の入力方向
を、前記目的音方向推定手段で推定された目的音方向に
基づいて逐次修正するので、第1のビームフォーマは第
1の入力方向以外から到来する雑音成分を抑圧して話者
の音声成分を低雑音で抽出することができ、雑音源が移
動してもこれを見失うことなく追尾して抑圧することが
できるようになるものである。
【0038】従来技術においては、2ch、すなわち、
2本のマイクロホンだけでも目的音源の追尾を可能とす
べく、雑音追尾用のビームフォーマを雑音抑圧のビーム
フォーマとは別に1個用いるが、例えば、雑音源が目的
音の方向を横切って移動したような場合、雑音の追尾精
度が低下することがあった。
【0039】しかし、本発明では、雑音を追尾するビー
ムフォーマを複数用いて各々別個の追尾範囲を受け持つ
ようにしたことにより、上記のような場合でも追尾精度
の低下を抑止できるようになる。
【0040】また、[3]項の構成の場合、音声帯域パ
ワー計算手段は、得られた音声周波数のスペクトル成分
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
し、雑音帯域パワー計算手段は、前記得られた雑音周波
数のスペクトル成分を、周波数帯域毎に分割して帯域毎
の雑音パワーを計算する。そして、帯域重み計算手段
は、前記音声帯域パワー計算手段と雑音帯域パワー計算
手段とから得られる音声と雑音の周波数帯域パワーとス
ペクトルサブトラクション制御手段の出力とに基き、帯
域毎の重み係数を求め、スペクトル減算手段は、音声信
号の周波数帯域毎にこの重み係数をかけて背景雑音を抑
圧する。
【0041】この構成によれば、ビームフォーマでは抑
圧できない方向性のない雑音(背景雑音)は、本発明シ
ステムのビームフォーマで得ることのできる目的音声成
分と雑音成分を利用し、これをスペクトルサブトラクシ
ョン処理することで抑圧する。すなわち、本システムで
は、ビームフォーマとして目的音声成分抽出用と雑音成
分抽出用の2つのビームフォーマを備えているが、これ
らのビームフォーマの出力である目的音声成分と雑音成
分を利用してスペクトルサブトラクション処理すること
により、方向性のない背景雑音成分の抑圧を行う。スペ
クトルサブトラクション(SS)処理は雑音抑圧処理と
して知られるが、一般的に行われるスペクトルサブトラ
クション(SS)処理は、1チャネルのマイクロホン
(つまり、1本のマイクロホン)を用い、このマイクロ
ホンの出力から音声のない区間において雑音のパワーを
推定するため、非定常な雑音が音声に重畳している場合
には対処できない。また、2チャネルのマイクロホン
(つまり、2本のマイクロホン)を用いて、一方を雑音
収集用、片方を雑音重畳音声収集用とする場合にも、両
マイクロホンの設置場所を離す必要があり、その結果、
音声に重畳する雑音と、雑音収集用マイクロホンで取り
込む雑音との位相がずれ、スペクトルサブトラクション
処理しても雑音抑圧の改善効果は大きく上がらない。
【0042】しかし、本発明では、雑音成分を取り出す
ビームフォーマを用意して、このビームフォーマの出力
を用いるようにしたため、位相のずれは補正されてお
り、従って、非定常雑音の場合でも高精度なスペクトル
サブトラクション処理を実現できる。さらに、周波数領
域のビームフォーマの出力を利用しているため、周波数
分析を省略してスペクトルサブトラクションが可能であ
り、従来より少ない演算量で非定常雑音を抑圧できる。
【0043】更に[4]項の発明は、上記[3]の発明
の雑音抑圧装置において、音声入力手段から得られた入
力信号を周波数分析した入力信号の周波数成分を周波数
帯域毎に分割し、帯域毎の入力パワーを計算する入力信
号帯域パワー計算手段を設けてあり、音声信号の周波数
帯域毎に重みをかけて背景雑音を抑圧する処理を実施さ
せるようにしており、この構成の場合、音声帯域パワー
計算手段は、得られた音声周波数のスペクトル成分を、
周波数帯域毎に分割して帯域毎の音声パワーを計算し、
雑音帯域パワー計算手段は、前記得られた雑音周波数の
スペクトル成分を、周波数帯域毎に分割して帯域毎の雑
音パワーを計算する。
【0044】また、入力帯域パワー計算手段があり、こ
の入力帯域パワー計算手段は、音声入力手段から得られ
た入力信号を周波数分析して得た入力音声の周波数スペ
クトル成分を受けて、これを周波数帯域毎に分割し、帯
域毎の入力パワーを計算する。
【0045】そして、帯域重み計算手段は、前記音声帯
域パワー計算手段と雑音帯域パワー計算手段と入力信号
帯域パワー計算手段とから得られる音声入力の周波数帯
域パワーと雑音入力の周波数帯域パワー、そして、音声
と雑音の混入した入力の周波数帯域パワーおよびスペク
トルサブトラクション制御手段の出力とに基き、帯域毎
の重み係数を求め、スペクトル減算手段は、音声信号の
周波数帯域毎にこの重み係数をかけて背景雑音を抑圧す
る。
【0046】この[4]項の発明においては、[3]項
の発明におけるスペクトルサブトラクション(SS)処
理において、更に雑音成分についてそのパワーを修正す
るようにしたことにより、一層高精度に雑音抑圧を行う
ことを可能とするものである。すなわち、[3]項の発
明では雑音源のパワ−Nが小さいという仮定をおいたた
め、スペクトルサブトラクション(SS)処理を行うと
雑音源の成分が音声に重畳している部分では歪みが大き
くなる可能性が残るが、ここでは入力信号のパワーを用
いて第3の発明でのスペクトルサブトラクション処理に
おける帯域重みの計算を修正するようにした。
【0047】これにより、方向を持つ雑音成分および方
向のない雑音成分を抑圧した歪みの少い音声成分のみの
抽出ができるようになる。
【0048】
【発明の実施の形態】以下、本発明の実施の形態につき
図面を参照して説明する。
【0049】(基本構成例)図1は、本発明による雑音
成分抑圧装置の基本構成図である。このシステムの特徴
は、音声入力部として指向性のある少なくとも2チャネ
ル分のマイクロホンを互いに指向性の軸方向を傾けて配
置し、これらのマイクロホンで得た音声信号をそれぞれ
チャネル別に周波数分析し、これを所望方向外の感度が
低くなるように計算したフィルタ係数を用いての適応ビ
ームフォーマ処理することで、話者方向からの音声を抑
圧して雑音成分を得、この雑音成分を抑圧する処理を施
して雑音の少ない話者音声成分を得ると云った雑音抑圧
処理装置を用いることにより、雑音抑制した話者音声成
分と雑音成分とを得るようにすると共に、この雑音抑圧
処理装置に、短時間周波数分析に基づく方向性検出部を
追加し、ビームフォーマ処理で抑圧できない突発性雑音
や高速移動音源等の到来をこの方向性検出部で検出し、
この検出結果と雑音抑圧処理装置にて求めた話者音声成
分と雑音成分とを用いて行うスペクトルサブトラクショ
ンを制御することにより、話者方向の許容範囲を高精度
に設定できる話者追尾機能を確保しつつ、しかも、突発
性雑音、高速移動音源等を抑圧することを可能としてい
る。
【0050】すなわち、図1において、10は音声入力
部と周波数分析部および雑音抑制処理装置とを備える話
者追尾マイクロホンアレイであり、30はスペクトルサ
ブトラクション処理部、40は方向検出部、50はスペ
クトルサブトラクション制御部である。
【0051】話者追尾マイクロホンアレイ10の構成要
素である音声入力部は話者者の発声した音声を少なくと
も異なる2箇所以上の位置で受音して音声信号を得るた
めのものであって、少なくとも指向性のある2個のマイ
クロホンを軸を互いに傾けて配置することにより、集音
方向がずれたものとなるようにしたものである。また、
話者追尾マイクロホンアレイ10の構成要素である周波
数分析部は、前記受音位置に対応する音声信号のチャネ
ル毎に周波数分析を行って複数チャネルの周波数成分を
出力するものである。
【0052】また、話者追尾マイクロホンアレイ10の
構成要素である雑音抑制処理装置は、例えば、周波数分
析部にて得られる前記複数チャネルの周波数成分につい
て、所望方向外の感度が低くなるように計算したフィル
タ係数を用いての適応フィルタ処理を施すことにより前
記話者方向からの音声以外の音声を抑圧する到来雑音抑
圧処理を行い、目的音声成分を得る第1のビームフォー
マ処理手段と、前記周波数分析部にて得られる前記複数
チャネルの周波数成分について、所望方向外の感度が低
くなるように計算したフィルタ係数を用いての適応フィ
ルタ処理を施すことにより前記話者方向からの音声を抑
圧し、雑音成分を得る第2のビームフォーマ処理手段
と、前記第1のビームフォーマ処理手段で計算されるフ
ィルタ係数から雑音方向を推定する雑音方向推定手段
と、前記第2のビームフォーマ処理手段で計算されるフ
ィルタ係数から目的音方向を推定する目的音方向推定手
段と、前記第1のビームフォーマにおいて入力対象とな
る目的音の到来方向である第1の入力方向を、前記目的
音方向推定手段で推定された目的音方向に基づいて逐次
修正する目的音方向修正手段と、前記第2のビームフォ
ーマにおいて入力対象とする雑音の到来方向である第2
の入力方向を、前記雑音方向推定手段で推定された雑音
方向に基づいて逐次修正する雑音方向修正手段とを具備
すると云った如きの構成である。
【0053】方向検出部40は、前記周波数分析部から
出力された周波数成分から到来音の時間差と振幅の差に
基づいた方向性の指標Dを計算するものであり、スペク
トルサブトラクション処理部30は、前記第1のビーム
フォーマ出力と第2のビームフォーマ出力に基づいて非
線形の雑音抑圧処理であるスペクトルサブトラクション
処理を行うためのものである。
【0054】また、スペクトルサブトラクション制御部
50は方向検出部40にて得られた方向性指標Dと前記
雑音抑制処理装置の目的音方向推定手段から出力された
目的音方向とに基づいて前記スペクトルサブトラクショ
ン手段の処理を制御するものである。
【0055】本雑音成分抑圧処理全体の流れを図2に示
す。
【0056】まず、基本的な雑音抑圧処理について説明
する。ここでは2チャネル、すなわち、マイクロホン2
本で捉えた2系統の音声信号を用いる例で説明するが、
3チャネル以上となった場合でも処理の方法は同様であ
る。
【0057】2つのマイクロホンを持つ話者追尾マイク
ロホンアレイ10の音声入力部から入力された音声は、
周波数分析部に送られ、例えば高速フーリエ変換(FF
T)等により周波数成分が計算される。次に、話者追尾
マイクロホンアレイ10の雑音抑圧処理装置における構
成要素の一つである第1のビームフォーマでは、2チャ
ネルの入力に対する周波数成分から、周波数領域の適応
フィルタにより雑音を抑圧し、目的音の方向の周波数成
分を出力する。ここでは、目的音の方向をマイクロホン
の正面とするように、目的音方向推定部からの出力を用
いて入力方向修正部1で位相を整える操作を行う。
【0058】また、話者追尾マイクロホンアレイ10の
雑音抑圧処理装置における構成要素の一つである第2の
ビームフォーマ16では、2チャネルの入力に対する周
波数成分から、周波数領域の適応フィルタにより目的音
を抑圧し、雑音の方向の周波数成分を出力する。ここで
は、雑音の方向をマイクロホンの正面と仮定し、2つの
マイクロホンに対して雑音が同時に到着したと見なせる
ように、雑音方向推定部からの出力を用いて第2の入力
方向修正部で位相を整える操作(整相)を行う。
【0059】ここで、話者追尾マイクロホンアレイ10
の雑音抑圧処理装置における構成要素の一つである雑音
方向推定部では、第1のビームフォーマの適応フィルタ
から雑音方向を推定し、目的音方向推定部、第2のビー
ムフォーマの適応フィルタから目的音方向を推定する。
なお、これらの処理は例えば8[msec]等の固定時
間毎に行われる。
【0060】次に、本発明の重要なポイントである方向
検出部40とスペクトルサブトラクション制御部50に
ついて説明する。方向検出部40では、その詳細は後述
するが、短時間FFTなどの周波数分析に基づき、2つ
のマイクロホンの位相差のみならず、各チャネルの入力
信号のパワー比を用いて、方向性指標を計算する。スペ
クトルサブトラクション制御部50は、話者追尾マイク
ロホンアレイ10の雑音抑圧処理装置における構成要素
の一つである目的音方向推定部で推定された目的音方向
(話者方向)と、方向性検出部40で計算された方向性
指標Dに基づいて、図2に示すように、方向性指標Dの
値に応じた3通りの信号のうちのいずれかをスペクトル
サブトラクション処理部30に送り、スペクトルサブト
ラクション処理部30では、その3種類の信号にしたが
って拡散性雑音の抑圧処理であるスペクトルサブトラク
ション処理を行う。
【0061】ここで、スペクトルサブトラクション制御
部50から出力される3種類の信号とは、“0”と
“1”と“2”の3通りの信号を指し、これらのうち、
信号“0”はほとんど雑音のみの区間であることを表
し、信号“1”は大きな突発性雑音が音声区間に重畳し
ている区間であることを表し、信号“2”はほぼ音声の
みの区間であることを表す。
【0062】まず、初期設定として、例えば、話者方向
の許容範囲を2つのマイクホンの中心から±20゜、方
向性指標Dのしきい値を“1.0”とする(図2のステ
ップS20)。このしきい値は一例であって、実際には
使用環境で実験より調整することが望ましい。
【0063】ここで、方向性検出部40から送られてく
る方向性指標Dが、しきい値(1.0)以下か否かを判
定し(図2のステップS21,S22,S23)、その
結果、しきい値以下であれば、つぎに目的音方向(話者
方向)が設定範囲内かどうかを判定し(図2のステップ
S24)、設定範囲内であれば、スペクトルサブトラク
ション処理部30に信号2”を送る(図2のステップS
25)。また、設定範囲外であれば、信号“0”を送る
(図2のステップS26)。
【0064】方向性指標Dがしきい値以上であり、目的
音方向が設定範囲内であれば(図2のステップS21,
S22,S23,S27)、話者方向から到来する音声
に突発性の雑音が重畳していると判定して信号“1”を
送り(図2のステップS28)、方向性指標Dがしきい
値以上であり、目的音方向が設定範囲外であれば(図2
のステップS21,S22,S23,S27)、信号
“0”を送る(図2のステップS226)。
【0065】スペクトルサブトラクション処理部30で
は、スペクトルサブトラクション制御部50からの信号
が“0”の時は、ほとんど雑音区間と見なせるので、最
小重みをかけて、出力信号をカットする。そして、これ
を最終的な音声周波数成分として出力する。
【0066】また、スペクトルサブトラクション制御部
50からの信号が“1”の時は、音声区間に突発性雑音
が重畳していると見なし、第2のビームフォーマからの
出力を雑音成分として扱う2チャネルのスペクトルサブ
トラクション処理を行う。そして、これを最終的な音声
周波数成分として出力する。
【0067】また、スペクトルサブトラクション処理部
30では、スペクトルサブトラクション制御部50から
の信号が“2”の時は、音声のみの区間と見なして、第
1のビームフォーマの出力に対し、1チャネルのスペク
トルサブトラクションを行う。そして、これを最終的な
音声周波数成分として出力する。
【0068】なお、別の制御方法として、信号“1”の
時は、大きな突発性雑音が音声に重畳しているため、雑
音区間と見なして信号“0”と同様の処理にしてもよ
い。
【0069】これにより、話者方向の許容範囲を高精度
に設定できる話者追尾機能を確保しつつ、しかも、突発
性雑音、高速移動音源等を抑圧することを可能とするシ
ステムが得られる。
【0070】以上は、本発明の概要であるが、このよう
なシステムを構築するに必要な各構成要素の詳細につい
てふれておく。
【0071】<話者追尾マイクロホンアレイ10の構成
例1>話者追尾マイクロホンアレイ10の構成例につい
て説明する。この例は請求項0A1の内容に相当する。
【0072】図3は話者追尾マイクロホンアレイ10の
構成例1としてのシステムの構成例を示すブロック図で
あって、本発明の一実施形態に係る雑音抑圧装置の基本
構成を示すブロック図である。本発明は、マイクロホン
数が2ch(ch;チャネル)すなわち、2本と云った
最小の場合でも話者追尾可能とするための技術であるた
め、ここでは2chで説明するが、3ch以上となった
場合でも処理の方法は同様である。
【0073】図3において、11は音声入力部、12は
周波数解析部、13は第1のビームフォーマ、14は第
1の入力方向修正部、15は第2の入力方向修正部、1
6は第2のビームフォーマ、17は雑音方向推定部、1
8は目的音方向推定部(音声方向推定部)である。
【0074】これらのうち、音声入力部11は、例え
ば、音声収集対象である話者の発声した音声(目的音
声)を異なる2箇所以上の位置で受音するためのもので
あり、具体的にはそれぞれ地点を異ならせて設置した2
本のマイクロホンを用いて音声を取り込み、電気信号に
変換するものである。また、周波数分析部12は、前記
マイクロホンの受音位置に対応する音声信号のチャネル
毎に周波数分析を行って複数チャネルの周波数成分を出
力するものであり、具体的にはここでは第1のマイクロ
ホンのとらえた音声信号(第1チャネルch1の音声信
号)および第2のマイクロホンのとらえた音声信号(第
2チャネルch2の音声信号)を、それぞれ別々に高速
フーリエ変換するなどして時間領域の信号成分から周波
数領域の成分のデータにに変換することにより、各チャ
ネル別に周波数スペクトルのデータに変換して出力する
ものである。
【0075】第1のビームフォーマ13は、この周波数
分析部12からの複数チャネルの周波数成分出力、この
場合、ch1,ch2の音声信号を用いて、これより目
的音声の周波数分を抽出するためのものであって、前記
ch1,ch2それぞれの周波数成分(周波数スペクト
ルデータ)を用いて適応フィルタ処理により目的の音声
以外の到来雑音の抑圧処理を行うことにより、目的とす
る音源方向からの周波数成分を抽出するといったことを
行う処理手段であり、第2のビームフォーマ16は、周
波数分析部12からの複数チャネルの周波数成分出力、
この場合、ch1,ch2の音声信号を用いて、これよ
り雑音源方向からの周波数成分を抽出するためのもので
あって、前記ch1,ch2それぞれの周波数成分(周
波数スペクトルデータ)を用いて適応フィルタ処理によ
り雑音音源方向からの音声以外の成分の抑圧処理を行う
ことにより、雑音源方向からの周波数スペクトル成分の
データを抽出するといったことを行う処理手段である。
【0076】また、雑音方向推定部17は、前記第1の
ビームフォーマ13で計算されるフィルタ係数から雑音
方向を推定すると云った処理を行うものであって、具体
的には前記第1のビームフォーマ13の適応フィルタか
ら得られるフィルタリング処理用のフィルタ係数などの
パラメータを用いて雑音方向を推定し、その推定量対応
のデータを出力し、また、目的音方向推定部(音声方向
推定部)18は、前記第2のビームフォーマ16で計算
されるフィルタ係数から目的音方向を推定すると云った
処理を行うものであって、具体的には前記第2のビーム
フォーマ16の適応フィルタで用いられているフィルタ
係数などのパラメータから雑音方向を推定し、その推定
量対応のデータを出力するものである。
【0077】また、第1の入力方向修正部14は、本来
の目的音方向にビームフォーマの入力方向を修正するた
めのものであって、前記第1のビームフォーマ13にお
いて、入力対象とする目的音の到来方向である第1の入
力方向を、前記目的音方向推定部18で推定された目的
音方向に基づいて逐次方向修正するための出力を発生
し、第1のビームフォーマ13に与えるものである。具
体的には、第1の入力方向修正部14は、目的音方向推
定部18の出力する推定量対応のデータを現在の目的と
する音源方向の角度情報αに変換して目標角度情報αと
して第1のビームフォーマ13に出力するものである。
【0078】第2の入力方向修正部15は第2のビーム
フォーマ16の入力方向を雑音方向に修正するためのも
のであって、前記第2のビームフォーマ16において、
入力対象とする雑音の到来方向である第2の入力方向
を、前記雑音方向推定部17で推定された雑音方向に基
づいて逐次方向修正するための出力を発生し、第2のビ
ームフォーマ14に与えるものである。具体的には、第
2の入力方向修正部15は、雑音方向推定部17の出力
する推定量対応のデータを現在の目的とする雑音源方向
の角度情報に変換して目標角度情報αとして第2のビー
ムフォーマ16に出力するものである。
【0079】ここでビームフォーマ13,16の構成例
を示しておく。
【0080】<ビームフォーマの構成例>本発明システ
ムで用いるビームフォーマ13,16は、図4(a)に
示すような構成となる。すなわち、本発明システムにお
いて用いられるビームフォーマ13,16は、入力音声
中から抽出したい対象となる信号成分を得ることができ
るようにするために、抽出したい対象となる信号成分の
到来方向に、ビームフォーマの入力方向を設定するため
の移相部100と、抽出したい対象となる信号成分の到
来方向以外の方向からの成分を抑圧するビームフォーマ
本体101とから構成される。
【0081】移相部100は補正ベクトル生成部100
aと乗算手段100b,100cとから構成され、ビー
ムフォーマ本体101は加算手段101a,101b,
101cと適応フィルタ101dとから構成される。
【0082】補正ベクトル生成部100aは入力方向修
正部14または15からの角度情報αを入力方向の情報
として受けて、これよりα対応の補正ベクトルを生成す
るものであり、乗算手段100bは周波数分析部12か
ら出力されるch1の周波数スペクトル成分のデータに
対して補正ベクトル分を乗算して出力するものであり、
乗算手段100cは周波数分析部12から出力されるc
h2の周波数スペクトル成分のデータに対して補正ベク
トル分を乗算して出力するものである。
【0083】また、加算手段101aは乗算手段100
bの出力と加算手段100cの出力を加算して出力する
ものであり、加算手段101bは乗算手段100bの出
力と加算手段100cの出力の差分を出力するものであ
り、加算手段101cは加算手段101aの出力に対す
る適応フィルタ101dの出力の差分をビームフォーマ
の出力として出力するものであり、適応フィルタ101
dは加算手段101bの出力に対してフィルタリング演
算処理して出力するためのデジタルフィルタであって、
加算手段101cの出力が最小となるようにフィルタ係
数(パラメータ)が逐次変更される構成である。
【0084】ここで、本例ではマイクロホン構成が2
本、すなわち、第1及び第2のマイクロホンm1,m2
を用いる収集音声2チャネル(ch1,ch2)構成の
システムとしており、この場合、ビームフォーマの入力
方向の設定とは、図4(b)に示すように、入力対象の
存在する方向からの音声信号が等価的に同時に両マイク
ロホンm1,m2に到着したと見做せるように、ch
1,ch2の2つの音声チャネルの周波数成分に対して
遅延を施し、位相を揃える(整相)ようにすることを指
す。これは、図4の構成の場合、入力方向修正部14,
15の出力する角度情報α対応に移相部100で移相調
整することによって実現している。
【0085】すなわち、図4の構成の場合、移相部10
0は補正したい入力方向(角度情報α)対応の補正ベク
トルを補正ベクトル生成部100aで生成するようにし
ており、この補正ベクトルを1ch,2chの各チャネ
ルの信号にそれぞれ乗算する乗算手段100b,100
cで乗算する構成とした移相部100により次のように
して位相を揃える。
【0086】例えば、図4(b)に符号m1,m2を付
して示すような無指向性マイクロホン配置であって、P
1点に居る目的音源である話者が、あたかもP2点に居
るかのように信号に位相補正することを考えてみる。こ
のような場合には、距離dだけ離れた第1のマイクロホ
ンm1で検出した話者音声信号(ch1)の位相と第2
のマイクロホンm2で検出した話者音声信号(ch2)
の位相が同じになるように、第1のマイクロホンm1の
話者音声信号(ch1)に伝搬時間差τ τ=r・c=r・sinα r=d・sinα に相当する複素数W1 W1=( cos jωτ,sin jωτ) の複素共役をかける。ここで、cは音速、dはマイクロ
ホン間距離、αはマイクロホンm1から見た目的音の音
源である話者の移動した角度、jは虚数、ωは角周波数
である。
【0087】つまり、W1の複素共役をかけたことによ
り、αなる角度に移動した目的音源の音声について注目
すれば、第1のマイクロホンm1でとらえた信号(ch
1)が、第2のマイクロホンm2でとらえた信号と同位
相となるように移相制御したことになる。
【0088】尚、第2のマイクロホンm2の信号(ch
2)には、複素数W2=(1,0)の複素共役をかける
ものとする。つまり、これは第2のマイクロホンm2の
信号(ch2)には、角度補正をしないことを意味す
る。
【0089】ここで、複素数W1と複素数W2を並べた
ベクトル{W1,W2}は、一般に方向ベクトルと呼ば
れ、この{W1,W2}における複素共役のベクトル共
役{W1*,W2*}を、補正ベクトルと呼ぶ。
【0090】角度情報α対応に補正ベクトルを生成さ
せ、ch1,ch2の周波数スペクトル成分に対してこ
の補正ベクトルを乗算すれば、第1のマイクロホンm1
の出力は、音源がP1よりP2に移動したにもかかわら
ず、第2のマイクロホンm2の位相と同じになるように
補正されたことになり、第1のマイクロホンm1に関す
る限り、第2のマイクロホンm1,m2のP2位置音源
に対する距離はあたかも等しいかたちになる。
【0091】本実施例では、ビームフォーマは2つある
が、これら2つあるビームフォーマのうち、第1のビー
ムフォーマ13はその移相部100により目的音の音源
方向を入力対象方向とするように、ch1(もしくはc
h2)の周波数成分に上述の手法で遅延を施し、第2の
ビームフォーマ16はその移相部100により雑音源方
向を入力対象方向とするように、ch1(もしくはch
2)の周波数成分に上述の手法で遅延を施してそれぞれ
両者の位相を揃える。ただし、目的音Sの到来方向以外
からの音成分、すなわち、雑音成分Nについては第1お
よび第2のマイクロホンm1,m2ともに位相は全く無
修正であるから、第1のマイクロホンm1と第2のマイ
クロホンm2で検出されるタイミングに時間差がある。
【0092】このように移相部100により、目的音方
向の音源からの検出される音声信号について位相修正し
た第1のマイクロホンm1の出力(目的音声成分Sと雑
音分Nからなるch1の周波数スペクトルデータ)およ
び修正の加えられない第2のマイクロホンm2の出力
(目的音声成分Sと雑音分N′からなるch2の周波数
スペクトルデータ)は、それぞれ加算手段101a,1
01bに入力される。そして、加算手段101aではc
h1の出力とch2の出力が加算されることによって目
的音声Sの2倍の信号と雑音成分N+N′についてのパ
ワー成分が求められ、加算手段101bではch1の出
力(S+N)とch2の出力(S+N′)の差分((S
+N)−(S+N′)=N−N′)、つまり、ノイズ分
のパワー成分が求められる。そして、加算手段101c
で加算手段101aの出力に対する適応フィルタ101
dの出力の差分を求め、これをビームフォーマの出力と
すると共に、適応フィルタ101dにフィードバックす
る。
【0093】適応フィルタ101dは加算手段101b
の出力に対して現在の探査方向対応の方向から到来した
音の成分の周波数スペクトルが抽出されるようフィルタ
リング演算処理して出力するためのデジタルフィルタで
あり、逐次、角度1°刻みに到来信号の探査角度を可変
していて、入力される信号方向に探査角度が一致したと
き最大の出力を出す。従って、到来信号の入射方向と探
査角度が一致すれば適応フィルタ101dの出力(N−
N′)は最大になる。そして、適応フィルタ101dの
出力(N−N′)は雑音成分のパワーであるから、それ
が最大のときの出力を加算手段101cに与え、加算手
段101aからの出力(2S+N+N′)から差し引け
ば、雑音成分Nが最大限キャンセルされて雑音抑圧が成
される。故に、この状態のときは、加算手段101cの
出力は最小である。
【0094】そのため、適応フィルタ101dは加算手
段101cの出力が最小となるように角度1°刻みの信
号到来方向探査角度(角度1°刻みの方向別感度)とフ
ィルタ係数(パラメータ)を逐次変更させることによ
り、到来信号の入射方向と探査角度(到来信号の入射方
向とその方向に対する感度)が一致することになるか
ら、適応フィルタ101dはこれらを制御しつつ、加算
手段101cの出力が最小となるようにする。
【0095】つまり、この制御の結果、目的方向からの
音声成分をビームフォーマは抽出できることになる。ま
た、雑音成分を目的音として抽出する場合には、上述の
目的音を雑音と見做すようにしたかたちで、上記制御を
施すようにすればよい。
【0096】なお、ビームフォーマ本体101に関して
は、一般化サイドローブキャンセラ(GSC)の他に、
フロスト型ビームフォーマなど種々のものが上述同様の
考え方で適用可能であり、従って、本発明では特に限定
はされない。
【0097】このような構成の本システムの作用を説明
する。本システムは、目的音の音声周波数成分と雑音周
波数成分とを別々に抽出出力する構成としていることを
特徴としている。
【0098】まず、複数のマイクロホンを持つ音声入力
部11、この例では第1及び第2の計2本のマイクロホ
ンm1,m2を持つ音声入力部11でch1,ch2の
音声を取り込む。そして、この音声入力部11から入力
された2チャネル分の音声の信号ch1,ch2(すな
わち、第1チャネルch1は第1のマイクロホンm1か
らの音声、第2チャネルch2は第2のマイクロホンm
2からの音声に該当する)は、周波数分析部12に送ら
れ、ここで例えば高速フーリエ変換(FFT)等の処理
を行うことによって、それぞれのチャネル別に周波数成
分(周波数スペクトル)が求められる。
【0099】周波数分析部12でそれぞれ求められたチ
ャネル別の周波数成分は、それぞれ第1及び第2のビー
ムフォーマ13,16に与えられる。
【0100】第1のビームフォーマ13では、2チャネ
ル分の周波数成分入力について、目的音の方向対応に位
相を合わせた上で、周波数領域の適応フィルタにより上
述のようにして処理することで雑音を抑圧し、目的音の
方向の周波数成分を出力する。
【0101】ここで、具体的に説明すると第1の入力方
向修正部14は第1のビームフォーマ13に対して次の
ような角度情報(α)を与える。つまり、第1の入力方
向修正部14は、与えられる音声方向推定部18からの
出力を用い、目的音の方向があたかもマイクロホンの正
面方向となるよう、上記2チャネルの周波数成分の入力
位相を整えるに必要な角度情報(α)を入力方向修正量
として第1のビームフォーマ13に対して与える。
【0102】この結果、第1のビームフォーマ13はこ
の修正量(α)対応に目的音方向を修正し、当該目的音
方向以外の方向から到来する音声を抑圧させるようにす
ることで、雑音成分を抑圧し、目的音を抽出する。
【0103】すなわち、目的音方向推定部18は雑音成
分を抽出するための第2のビームフォーマ16における
適応フィルタのパラメータを用いて雑音源方向を知り、
それを反映させた出力を出し、第1の入力方向修正部1
4ではこの目的音方向推定部18からの出力対応に入力
方向修正量(α)を発生してこの修正量(α)対応に第
1のビームフォーマ13における目的音方向を修正し、
これによって第1のビームフォーマ13に当該目的音方
向以外の方向から到来する音声を抑圧させるようにする
ことで、雑音成分を抑圧し、目的音を抽出する。
【0104】つまり、第2のビームフォーマ16の場
合、雑音が目的音であるから、雑音に位相を合わせてい
る。その結果、第2のビームフォーマ16では話者の音
源は雑音源として扱われ、ビームフォーマの内蔵する適
応フィルタは話者音源からの音を抽出する処理をするこ
とになるので、当該第2のビームフォーマ16の適応フ
ィルタのパラメータからは話者音源の方向を反映した出
力が得られる。従って、目的音方向推定部18により、
第2のビームフォーマ16における適応フィルタのパラ
メータを用いて雑音源方向を知れば、それは目的音であ
る話者音源の方向を反映させたものである。従って、目
的音方向推定部18により、第2のビームフォーマ16
における適応フィルタのパラメータを反映させた出力を
出し、第1の入力方向修正部14でこの目的音方向推定
部18からの出力対応に入力方向修正量(α)を発生
し、この修正量対応に第1のビームフォーマ13におけ
る目的音方向を修正すれば、第1のビームフォーマ13
に当該目的音方向以外の方向から到来する音声を抑圧さ
せることができる。
【0105】また、第2のビームフォーマ16では、2
チャネル分の周波数成分入力に対して、周波数領域の適
応フィルタにより目的音を抑圧し、雑音の方向の周波数
成分を出力する。ここでは、具体的には雑音の方向をマ
イクロホンの正面と仮定し、2つのマイクロホンに対し
て雑音が同時に到着したと見做せるように、雑音方向推
定部17からの出力を用いて第2の入力方向修正部5で
位相を整える操作(整相)を行う。
【0106】すなわち、雑音方向推定部17では、話者
音声成分を抽出するための第1のビームフォーマ13に
おける適応フィルタのパラメータを用いて雑音音源方向
を知り、それを反映させた出力を出し、第2の入力方向
修正部15では雑音方向推定部17からの出力対応に入
力方向修正量(α)を発生させて第2のビームフォーマ
16に与えることによって、当該第2のビームフォーマ
16に当該修正量対応に雑音方向を修正させるように
し、この方向以外の方向から到来する音声を抑圧するこ
とで雑音成分のみを抽出する。
【0107】ここで、雑音方向推定部17では、第1の
ビームフォーマ13の適応フィルタから雑音方向を推定
し、目的音方向推定部18では、第2のビームフォーマ
16の適応フィルタから目的音方向を推定する。
【0108】なお、これらの処理は、例えば、8[mse
c]等の短い固定時間毎に行われる。以降固定時間をフ
レームと呼ぶ。
【0109】このようにして、第1のビームフォーマ1
3により、目的音(話者)の音声成分を抽出することが
でき、また、第2のビームフォーマ16により、雑音成
分を抽出することができる。
【0110】本装置の設置環境が、静かな会議室であ
り、この会議室にテレビ会議システム設置して当該テレ
ビ会議システムの話者音声抽出のために使用していると
するならば、除去しなければならない雑音と云っても、
そう問題のある大きな妨害音ではないと考えられるの
で、このような場合、第1のビームフォーマ13によ
り、抽出された目的音(話者)の成分を逆フーリエ変換
して時間領域に戻すことで音声信号に戻し、これをスピ
ーカなどで音声として出力させたり、送信するなどすれ
ば、低雑音化された話者音声として利用できる。
【0111】ここで、方向推定部17,18の処理手順
について触れておく。
【0112】[方向推定部の処理手順]図5に方向推定
部17,18の処理手順を示す。
【0113】この処理はフレーム毎に行われる。まず、
初期設定をする(ステップS1)。この初期設定内容と
しては図5に点線枠で囲んで示してあるように、“目的
音の追尾範囲”を“0゜±θr(例えば、20゜)”と
し、それ以外の範囲を雑音の探索範囲として設定する。
【0114】初期設定が終わったならば、次にステップ
S2の処理に移る。このステップS2では方向ベクトル
を生成する処理を行う。そして、方向別感度計算を行っ
た後、方向別感度周波数累積を行う(ステップS3,S
4)。
【0115】そして、これを全ての周波数と方向につい
て、実施した後、最小値であるものを求めて、その最小
値となった累積値を持つものの方向を信号到来方向とす
る(ステップS5,S6)。
【0116】すなわち、具体的にはステップS2からS
4においては、フィルタ係数W(k)と方向べクトルS
(k,θ)との内積を各周波数成分毎に1゜刻みで所定
の範囲の方向について計算し、対応する方向への感度を
求め、次に、全周波数成分についてその感度を加算する
と云う処理を行う。そして、ステップS7,S8におい
ては、全周波数成分についてその感度を加算した結果と
して得られる各方向別の累積値のうち、その値が最小値
である方向を、信号到来方向とすると云う処理をする。
【0117】この図5に示した処理手順は、雑音方向推
定部17および目的音推定部18ともに同様のものとな
る。
【0118】このようにして、雑音方向推定部17は雑
音方向の推定を行い、また、目的音推定部18は目的音
方向の推定を行う。そして、この推定結果はそれぞれの
対応する入力方向修正部14,15に与える。
【0119】雑音方向の推定結果を受け取った第1の入
力方向修正部14は、前フレームまでの入力方向と現フ
レームの方向推定結果を平均化し、新たな入力方向を計
算してビームフォーマの移相部100へ出力し、また、
目的音推定結果を受け取った第2の入力方向修正部15
もまた、前フレームまでの入力方向と現フレームの方向
推定結果を平均化し、新たな入力方向を計算してビーム
フォーマの移相部100へ出力する。
【0120】平均化は例えば、係数βを用いて次式のよ
うに行う。
【0121】θ1(n)=θ1(n−1) ・(1−
α)+E(n)・β ここで、θ1は音の入力方向、nは処理フレームの番
号、Eは現フレームの方向推定結果である。なお、係数
βはビームフォーマの出力パワーに基づいて可変にして
もよい。
【0122】ビームフォーマがGSCである場合に、従
来、方向推定の際、時間領域のフィルタ係数から周波数
領域への変換が必要であったが、本発明ではGSCの適
応フィルタが周波数スペクトルに対して方向性感度を以
てフィルタ演算処理し、目的方向外の成分を抽出すると
云った処理をするものを用いており、フィルタ演算処理
に使用するフィルタ係数は、もともと周波数領域で得ら
れるため、従来のように、時間領域のフィルタ係数から
周波数領域への変換と云う処理は不要となる。従って、
本発明システムではGSCは使用していても、時間領域
のフィルタ係数から周波数領域への変換が不要である
分、処理の高速化が可能となる。
【0123】[全体の処理手順]図6にシステムの全体
の処理手順を示す。この処理はフレーム毎に行われる。
【0124】まず、初期設定する(ステップS11)。
初期設定内容としては、目的音方向の追尾範囲を0゜±
θr(例えばθr=20゜)とし、雑音方向推定部17
の探索範囲を θr < φ1 < 180゜−θr , −180゜+θr < φ1 <−θr とし、目的音方向推定部18の探索範囲を −θr < φ2 < θr とする。
【0125】そして、目的音の入力方向の初期値をθ1
=0゜、雑音の入力方向の初期値をθ2=90°とす
る。
【0126】初期設定が済んだならば、まず、第1のビ
ームフォーマ13の処理を行い(ステップS12)、雑
音方向を推定し(ステップS13)、雑音方向がφ2の
範囲内であれば、第2のビームフォーマ16の入力方向
を修正し(ステップS14,S15)、そうでなければ
修正しない(ステップS14)。
【0127】次に,第2のビームフォーマ16の処理に
進み(ステップS16)、目的音の方向を推定する(ス
テップS17)。そして、この推定した目的音の方向が
φ1の範囲内ならば、第1のビームフォーマ13の入力
方向を修正し(ステップS18,S19)、そうでなけ
れば何もせずに、次のフレームの処理に移る。
【0128】以上の例においては、ビームフォーマとし
て周波数領域で動作するビームフォーマを用いるように
したことを特徴としており、これによって計算量を大幅
に削減することができるようにしている。
【0129】すなわち、話者の発声した音声を少なくと
も異なる2箇所以上の位置で受音する音声入力手段と、
前記受音位置に対応する音声信号のチャネル毎に周波数
分析を行って複数チャネルの周波数成分を出力する周波
数分析手段と、この周波数分析手段にて得られる前記複
数チャネルの周波数成分について、所望方向外の感度が
低くなるように計算したフィルタ係数を用いての適応フ
ィルタ処理を施すことにより前記話者方向からの音声以
外の音声を抑圧する到来雑音抑圧処理を行い、目的音声
成分を得る第1のビームフォーマ処理手段と、前記周波
数分析手段にて得られる前記複数チャネルの周波数成分
について、所望方向外の感度が低くなるように計算した
フィルタ係数を用いての適応フィルタ処理を施すことに
より前記話者方向からの音声を抑圧し、雑音成分を得る
第2のビームフォーマ処理手段と、前記第1のビームフ
ォーマ処理手段で計算されるフィルタ係数から雑音方向
を推定する雑音方向推定手段と、前記第2のビームフォ
ーマ処理手段で計算されるフィルタ係数から目的音方向
を推定する目的音方向推定手段と、前記第1のビームフ
ォーマにおいて入力対象となる目的音の到来方向である
第1の入力方向を、前記目的音方向推定手段で推定され
た目的音方向に基づいて逐次修正する目的音方向修正手
段と、前記第2のビームフォーマにおいて入力対象とす
る雑音の到来方向である第2の入力方向を、前記雑音方
向推定手段で推定された雑音方向に基づいて逐次修正す
る雑音方向修正手段とを具備する。
【0130】そして、話者の発声した音声を異なる2箇
所以上の位置で音声入力手段は受音し、周波数分析手段
では、これを前記受音位置に対応する音声信号のチャネ
ル毎に周波数分析して複数チャネルの周波数成分を出力
する。そして、第1のビームフォーマ処理手段はこの周
波数分析手段にて得られる前記複数チャネルの周波数成
分について、所望方向外の感度が低くなるように計算し
たフィルタ係数を用いての適応フィルタ処理を施すこと
により前記話者方向からの音声以外の音声を抑圧する到
来雑音抑圧処理を行い、目的音声成分を得、また、第2
のビームフォーマ処理手段は、前記周波数分析手段にて
得られる前記複数チャネルの周波数成分について、所望
方向外の感度が低くなるように計算したフィルタ係数を
用いての適応フィルタ処理を施すことにより前記話者方
向からの音声を抑圧し、雑音成分を得る。そして、雑音
方向推定手段は、前記第1のビームフォーマ処理手段で
計算されるフィルタ係数から雑音方向を推定し、目的音
方向推定手段は、前記第2のビームフォーマ処理手段で
計算されるフィルタ係数から目的音方向を推定する。目
的音方向修正手段は、前記第1のビームフォーマにおい
て入力対象となる目的音の到来方向である第1の入力方
向を、前記目的音方向推定手段で推定された目的音方向
に基づいて逐次修正するので、第1のビームフォーマは
第1の入力方向以外から到来する雑音成分を抑圧して話
者の音声成分を低雑音で抽出することになる。また、雑
音方向修正手段は、前記第2のビームフォーマにおいて
入力対象とする雑音の到来方向である第2の入力方向
を、前記雑音方向推定手段で推定された雑音方向に基づ
いて逐次修正するので、第2のビームフォーマは第2の
入力方向以外から到来する成分を抑圧して話者の音声成
分を抑圧した残りの雑音成分を抽出することになる。
【0131】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。
【0132】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
【0133】すなわち、従来技術では、ビームフォーマ
で抑圧できない拡散性雑音の抑圧処理のために、スペク
トルサブトラクション(以後、SSと略称する)処理
を、ビームフォーマ処理の後に行うようにしており、こ
のSSは周波数スペクトルを入力とするため、FFT
(高速フーリエ変換)などの周波数分析が従来必要であ
ったが、周波数領域で動作するビームフォーマを用いる
と当該ビームフォーマからは周波数スペクトルが出力さ
れるため、これをSSに流用できるので、特別にSSの
ためのFFTを実施する従来のFFT処理工程は省略す
ることができる。故に、全体の演算量を大幅に削減する
ことができる。
【0134】また、ビームフォーマのフィルタを用いた
方向推定の際に必要であった時間領域から周波数領域へ
の変換処理も不要となり、全体の演算量を大幅に削減す
ることができる。
【0135】次に、雑音源が目的音方向の範囲を横切っ
て移動した場合にも追尾が高精度で行えるようにした例
を説明する。
【0136】<話者追尾マイクロホンアレイ10の構成
例2>話者追尾マイクロホンアレイ10の別の構成例に
ついて説明する。
【0137】本例では、雑音源が目的音方向の範囲を横
切って移動した場合にも追尾が高精度で行えるように、
雑音を追尾するビームフォーマを2つ用いる場合の例に
ついて説明する。
【0138】話者追尾マイクロホンアレイ10の構成例
2としての全体構成図を図7に示す。図7において、1
1は音声入力部、12は周波数解析部、13は第1のビ
ームフォーマ、14は第1の入力方向修正部、15は第
2の入力方向修正部、16は第2のビームフォーマ、1
7は雑音方向推定部、18は第1の音声方向推定部(目
的音方向推定部)、そして、21は第3の入力方向修正
部、22は第3のビームフォーマ、23は第2の音声方
向推定部、24は有効雑音決定部である。
【0139】これらのうち、第3の入力方向修正部21
は、第3のビームフォーマ22の入力方向を雑音方向に
修正するためのものであって、第3のビームフォーマ2
2において、入力対象とする雑音の到来方向である第3
の入力方向を、前記雑音方向推定部17で推定された雑
音方向に基づいて逐次方向修正するための出力を発生
し、第3のビームフォーマ22に与えるものである。具
体的には、第3の入力方向修正部21は、雑音方向推定
部17の出力する推定量対応のデータを現在の目的とす
る雑音源方向の角度情報に変換して目標角度情報αとし
て第3のビームフォーマ22に出力するものである。
【0140】第3のビームフォーマ22は、周波数分析
部12からの複数チャネルの周波数成分出力、この場
合、1ch,2chの音声信号の周波数スペクトルを用
いて、これより雑音源方向からの周波数スペクトル成分
を抽出するためのものであって、前記1ch,2chそ
れぞれの周波数成分(周波数スペクトルデータ)に対し
て方向別感度調整を施した適応フィルタ処理により雑音
音源方向以外の周波数スペクトル成分の抑圧処理を行う
ことで、雑音音源方向からの周波数スペクトル成分のデ
ータを抽出するといったことを行う処理手段である。こ
の第3のビームフォーマ22も第1及び第2のビームフ
ォーマ13,16同様、図4で説明した如きの構成を採
用している。
【0141】第2の音声方向推定部23は、目的音声推
定部(音声方向推定部)18と同様のものであって、前
記第3のビームフォーマ22で計算されるフィルタ係数
から目的音方向を推定すると云った処理を行うものであ
り、具体的には前記第3のビームフォーマ22の適応フ
ィルタから音声方向を推定し、その推定量対応のデータ
を出力するものである。
【0142】有効雑音決定部24は、音声方向推定部1
8,23および雑音方向推定部17の推定する音声方向
および雑音方向の情報に基づき、第2のビームフォーマ
16と第3のビームフォーマ22のいずれが雑音を有効
に追尾しているかを判断し、有効に追尾していると判断
した方のビームフォーマの出力を、雑音成分として出力
するものである。なお、その他、図3の構成と同一符号
を付したものは同一物を示しているので、詳細は先の説
明を参照することとし、ここでは改めて説明はしない。
【0143】図からわかるように当該構成例2の話者追
尾マイクロホンアレイ10と構成例1の話者追尾マイク
ロホンアレイ10との違いは、構成例1に対し、更に第
3の入力方向修正部21と、第3のビームフォーマ22
と、第2の音声方向推定部23、および有効雑音決定部
24を追加した点である。
【0144】そして、第2及び第3のビームフォーマ1
6,22の出力、及び、雑音方向推定部17の出力、及
び、第1及び第2の音声方向推定部18,23の出力を
有効雑音決定部24に渡し、有効雑音決定部24の出力
を第1の入力方向修正部14に渡す構成としてある。
【0145】このような構成の本システムの作用を説明
する。
【0146】まず、複数のマイクロホンを持つ音声入力
部11、この例では第1及び第2の計2本のマイクロホ
ンm1,m2を持つ音声入力部11でch1,ch2の
音声を取り込む。そして、この音声入力部11から入力
された2チャネル分の音声の信号ch1,ch2(すな
わち、第1チャネルch1は第1のマイクロホンm1か
らの音声、第2チャネルch2は第2のマイクロホンm
2からの音声に該当する)は、周波数分析部12に送ら
れ、ここで例えば高速フーリエ変換(FFT)等の処理
を行うことによって、それぞれのチャネル別に周波数成
分(周波数スペクトル)が求められる。
【0147】周波数分析部12でそれぞれ求められたチ
ャネル別の周波数成分は、それぞれ第1、第2及び第3
のビームフォーマ13,16,22に与えられる。
【0148】第1のビームフォーマ13では、2チャネ
ル分の周波数成分入力について、目的音の方向対応に位
相を合わせた上で、周波数領域の適応フィルタにより上
述のようにして処理することで雑音を抑圧し、目的音の
方向の周波数成分を出力する。ここで、具体的に説明す
ると第1の入力方向修正部14は第1のビームフォーマ
13に対して次のような角度情報(α)を与える。つま
り、第1の入力方向修正部14は、有効雑音決定部24
を介して与えられる音声方向推定部18若しくは音声方
向推定部23からの出力を用い、目的音の方向があたか
もマイクロホンの正面方向となるよう、上記2チャネル
の周波数成分の入力位相を整えるに必要な角度情報
(α)を入力方向修正量として第1のビームフォーマ1
3に対して与える。
【0149】この結果、第1のビームフォーマ13はこ
の修正量(α)対応に目的音方向を修正し、当該目的音
方向以外の方向から到来する音声を抑圧させるようにす
ることで、雑音成分を抑圧し、目的音を抽出する。
【0150】つまり、第2および第3のビームフォーマ
16,22の場合、雑音が目的音であるから、雑音に位
相を合わせている。その結果、第2,第3のビームフォ
ーマ16,22では話者の音源は雑音源として扱われ、
各ビームフォーマの内蔵する適応フィルタは話者音源か
らの音を抽出する処理をすることになるので、当該第
2,第3のビームフォーマ16,22の適応フィルタの
パラメータからは話者音源の方向を反映した情報が得ら
れることになる。
【0151】従って、第1または第2の音声方向推定部
18または23により、第2または第3のビームフォー
マ16または22における適応フィルタのパラメータを
用いて雑音源方向を知れば、それは目的音である話者音
源の方向を反映させたものである。従って、第1または
第2の音声方向推定部18または23により、第2また
は第3のビームフォーマ16または22における適応フ
ィルタのパラメータを反映させた出力を出し、第1の入
力方向修正部14でこの出力対応に入力方向修正量
(α)を発生し、この修正量対応に第1のビームフォー
マ13における目的音方向を修正すれば、第1のビーム
フォーマ13は当該目的音方向以外の方向から到来する
音声を抑圧するので、この場合、話者音源からの成分を
抽出できることになる。
【0152】一方、第1のビームフォーマ13の適応フ
ィルタでは雑音成分が抽出されるようにパラメータが制
御されているので、このパラメータから雑音方向推定部
17では、雑音方向を推定し、その情報を第2及び第3
の入力方向修正部15,21と有効雑音決定部24に与
えることになる。
【0153】そして、当該雑音方向推定部17からの出
力を受けた第2の入力方向修正部15では、当該雑音方
向推定部17からの出力対応に入力方向修正量(α)を
発生し、この修正量対応に第2のビームフォーマ16に
おける目的音方向を修正すれば、第2のビームフォーマ
16は当該目的音方向以外の方向から到来する音声を抑
圧するので、この場合、話者音源以外からの成分である
雑音成分を抽出できることになる。
【0154】このとき、第2のビームフォーマ16の適
応フィルタでは目的音である話者音声成分が抽出される
ようにパラメータが制御されているので、このパラメー
タから第1の音声方向推定部18では、話者音声方向を
推定することができる。そして、第1の音声方向推定部
18はその推定した情報を有効雑音決定部24に与え
る。
【0155】また、雑音方向推定部17からの出力が第
3の入力方向修正部21にも与えられているが、これを
受けた第3の入力方向修正部21では、当該雑音方向推
定部17からの出力対応に入力方向修正量(α)を発生
に、第3のビームフォーマ22に与える。これにより、
第3のビームフォーマ22はこの与えられた修正量対応
に、自己における目的音方向を修正する。
【0156】これにより、第3のビームフォーマ22は
当該目的音方向以外の方向から到来する音声を抑圧する
ので、この場合、話者音源以外からの成分、つまり、雑
音成分を抽出できることになる。
【0157】このとき、第3のビームフォーマ22の適
応フィルタでは目的音である話者音声成分が抽出される
ようにパラメータが制御されているので、このパラメー
タから第2の音声方向推定部23では、話者音声方向を
推定できる。そして、この推定した情報は有効雑音決定
部24に与えることになる。
【0158】有効雑音決定部24では、第1および第2
の音声方向推定部18,23から与えられた話者音声方
向の推定情報と、雑音方向推定部17から与えられた雑
音方向の推定情報とをもとに、第2のビームフォーマ1
6と第3のビームフォーマ22のいずれが雑音を有効に
追尾しているかを判断する。そして、この判断結果に基
づき、有効に追尾していると判断した方のビームフォー
マにおける適応フィルタのパラメータを第1の入力方向
修正部14に与える。
【0159】そのため、第1の入力方向修正部14で
は、当該パラメータを反映させた出力を出し、第1の入
力方向修正部14でこの出力対応に入力方向修正量
(α)を発生し、この修正量対応に第1のビームフォー
マ13における目的音方向を修正するので、第1のビー
ムフォーマ13は当該目的音方向以外の方向から到来す
る音声を抑圧することになって、この場合、話者音源か
らの成分を抽出でき、しかも、広く移動する雑音源から
の雑音を対象とする場合に、その移動する雑音源を見失
うことなく、確実にとらえて雑音除去することが可能と
なる。
【0160】すなわち、この実施例においては、話者の
音声周波数成分の抽出用として第1のビームフォーマ1
3が設けてあり、また、雑音周波数成分の抽出用として
第2および第3のビームフォーマ16,22が設けてあ
る。そして、観測点から見て図8に示すように、話者が
0°方向に位置していて0°±θの角度範囲で監視すれ
ば良いとすると、当該話者の音声周波数成分を抽出する
ために設けた第1のビームフォーマ13の変化範囲φ
1、すなわち、適応フィルタにおける感度を高くする方
向についての1°刻み変化範囲はせいぜい −θ < φ1 < θ に設定してこの範囲でフィルタリングに用いることにな
る。この場合、雑音周波数成分を抽出するために設けた
第2および第3のビームフォーマ16,22のうち、第
2のビームフォーマ16の変化範囲φ2は −180゜+θ < φ2 < −θ そして、第3のビームフォーマ22の変化範囲φ3は θ < φ3 < 180゜−θ に設定することになる。但し、180°は中心点を介し
て0°の対向位置、−は0°位置から見て図における反
時計方向回り、+は時計方向回りを示す。
【0161】故に、このようにすると、第2のビームフ
ォーマ16と第3のビームフォーマ22は、目的音到来
範囲φ1を挟んで各々別々の範囲から到来する雑音を追
尾することになる。そのため、φ2の範囲にあった雑音
源がφ1の範囲を横切ってφ3の範囲に急に移動した場
合でも、φ3の領域を持ち場とする第3のビームフォー
マ22が当該移動して来た雑音源を直ちに捕えることが
できるため、雑音方向を見失うことがなくなる。
【0162】この構成の場合、第2のビームフォーマ1
6の出力と、第3のビームフォーマビーム22の出力の
計2つの出力が、雑音の出力として得られるが、雑音方
向推定部17の結果に基づき、有効雑音決定部24にお
いて、第2のビームフォーマ16と第3のビームフォー
マ22のいずれが雑音を有効に追尾しているかを判断
し、この判断結果に基づき、有効に追尾して方の出力を
雑音成分として用いることになる。
【0163】[構成例2の話者追尾マイクロホンアレイ
10における全体の処理の流れ]以上の処理の全体の流
れを図9に示しておく。この処理はフレーム毎に行われ
る。各ビームフォーマの変化範囲および入力方向の初期
値を設定した後に(ステップS31)、第1のビームフ
ォーマ13の処理を行い(ステップS32)、雑音方向
を推定した後に(ステップS33)、該雑音方向を入力
として有効雑音決定部24において、雑音方向がφ2に
あるか、φ3にあるかの判定を実施し、第2のビームフ
ォーマ16と第3のビームフォーマ22のどちらを選択
するかを決定する(ステップS34)。
【0164】そして、推定された雑音方向が第2の入力
方向修正部15あるいは第3の入力方向修正部21のど
ちらかに送られ、雑音方向が修正され、選択されたビー
ムフォーマの処理が実行される。
【0165】すなわち、推定された雑音方向がφ2の領
域であれば雑音方向が第2の入力方向修正部15に送ら
れ、雑音方向が修正され、第2のビームフォーマ16の
処理が実行され、目的音方向が推定される(ステップS
34,S35,S36,S37)。
【0166】また、推定された雑音方向がφ3の領域で
あれば雑音方向が第3の入力方向修正部21に送られ、
雑音方向が修正され、第3のビームフォーマ22の処理
が実行され、目的音方向が推定される(ステップS3
4,S38,S39,S40,S41)。
【0167】次に、選択されたビームフォーマにより推
定された音声方向(目的音方向)がφ1の範囲内かどう
か判断され、範囲内の場合は、推定された音声方向が第
1のビームフォーマ13の第1の入力方向修正部14に
送られ、入力方向の修正が実行される(ステップS4
2,S43)。範囲外の場合は修正処理が実行されず、
次のフレームに対する処理に進む(ステップS42,S
31)。
【0168】この処理がフレーム毎に行われ、音声およ
び雑音方向を追尾しながら、雑音抑圧が行われる。
【0169】このように、この例では、話者の発声した
音声を少なくとも異なる2箇所以上の位置で受音する音
声入力手段と、前記受音位置に対応する音声信号のチャ
ネル毎に周波数分析を行って複数チャネルの周波数成分
を出力する周波数分析手段と、この周波数分析手段にて
得られる前記複数チャネルの周波数成分について、所望
方向外の感度が低くなるように計算したフィルタ係数を
用いての適応フィルタ処理を施すことにより前記話者方
向からの音声以外の音声を抑圧する到来雑音抑圧処理を
行い、目的音声成分を得る第1のビームフォーマ処理手
段と、前記周波数分析手段にて得られる前記複数チャネ
ルの周波数成分について、所望方向外の感度が低くなる
ように計算したフィルタ係数を用いての適応フィルタ処
理を施すことにより前記話者方向からの音声を抑圧し、
第1の雑音成分を得る第2のビームフォーマ処理手段
と、前記周波数分析手段にて得られる前記複数チャネル
の周波数成分について、所望方向外の感度が低くなるよ
うに計算したフィルタ係数を用いての適応フィルタ処理
を施すことにより前記話者方向からの音声を抑圧し、第
2の雑音成分を得る第2のビームフォーマ処理手段と、
前記第1のビームフォーマ処理手段で計算されるフィル
タ係数から雑音方向を推定する雑音方向推定手段と、前
記第2のビームフォーマ処理手段で計算されるフィルタ
係数から第1の目的音方向を推定する第1の目的音方向
推定手段と、前記第3の適応ビームフォーマ処理手段で
計算されるフィルタ係数から第2の目的音方向を推定す
る第2の目的音方向推定手段と、前記第1のビームフォ
ーマにおいて入力対象とする目的音の到来方向である第
1の入力方向を、前記第1の目的音方向推定手段で推定
された第1の目的音方向と、第2の目的音方向推定手段
で推定された第2の目的音方向のいずれか一方または両
方に基づいて逐次修正する第1の入力方向修正手段と、
前記雑音方向修正手段で推定された雑音方向が所定の第
1の範囲にある場合に、前記第2のビームフォーマにお
いて入力対象とする雑音の到来方向である第2の入力方
向を該雑音方向に基づいて逐次修正する第2の入力方向
修正手段と、前記雑音方向修正手段で推定された雑音方
向が所定の第2の範囲にある場合に、前記第3のビーム
フォーマにおいて入力対象とする雑音の到来方向である
第3の入力方向を該雑音方向に基づいて逐次修正する第
3の入力方向修正手段と、前記雑音方向推定手段で推定
された雑音方向が所定の第1の範囲から到来したか所定
の第2の範囲から到来したかに基づいて前記第1の出力
雑音と前記第2の出力雑音のいずれか一方を真の雑音出
力と決定していずれか一方の雑音を出力すると同時に、
第1の音声方向推定手段と第2の音声方向推定手段のい
ずれの推定結果が有効であるかを決定していずれか一方
の音声方向推定結果を第1の入力方向修正手段へ出力す
る有効雑音決定手段とを具備して構成したものである。
【0170】そして、このような構成の場合、話者の発
声した音声を異なる2箇所以上の位置で音声入力手段は
受音し、周波数分析手段では、これを前記受音位置に対
応する音声信号のチャネル毎に周波数分析して複数チャ
ネルの周波数成分を出力する。そして、第1のビームフ
ォーマ処理手段はこの周波数分析手段にて得られる前記
複数チャネルの周波数成分について、所望方向外の感度
が低くなるように計算したフィルタ係数を用いての適応
フィルタ処理を施すことにより前記話者方向からの音声
以外の音声を抑圧する到来雑音抑圧処理を行い、目的音
声成分を得、また、第2のビームフォーマ処理手段は、
前記周波数分析手段にて得られる前記複数チャネルの周
波数成分について、所望方向外の感度が低くなるように
計算したフィルタ係数を用いての適応フィルタ処理を施
すことにより前記話者方向からの音声を抑圧し、雑音成
分を得る。そして、雑音方向推定手段は、前記第1のビ
ームフォーマ処理手段で計算されるフィルタ係数から雑
音方向を推定し、目的音方向推定手段は、前記第2のビ
ームフォーマ処理手段で計算されるフィルタ係数から目
的音方向を推定する。また、第1の目的音方向推定手段
は前記第2のビームフォーマ処理手段で計算されるフィ
ルタ係数から第1の目的音方向を推定し、第2の目的音
方向推定手段は、前記第3の適応ビームフォーマ処理手
段で計算されるフィルタ係数から第2の目的音方向を推
定する。
【0171】また、第1の入力方向修正手段は、前記第
1のビームフォーマにおいて入力対象とする目的音の到
来方向である第1の入力方向を、前記第1の目的音方向
推定手段で推定された第1の目的音方向と、第2の目的
音方向推定手段で推定された第2の目的音方向のいずれ
か一方または両方に基づいて逐次修正する。そして、第
2の入力方向修正手段は、前記雑音方向修正手段で推定
された雑音方向が所定の第1の範囲にある場合に、前記
第2のビームフォーマにおいて入力対象とする雑音の到
来方向である第2の入力方向を該雑音方向に基づいて逐
次修正し、第3の入力方向修正手段は、前記雑音方向修
正手段で推定された雑音方向が所定の第2の範囲にある
場合に、前記第3のビームフォーマにおいて入力対象と
する雑音の到来方向である第3の入力方向を該雑音方向
に基づいて逐次修正する。
【0172】従って、第2の入力方向修正手段の出力に
より第2の入力方向を修正される第2のビームフォーマ
は第2の入力方向以外から到来する成分を抑圧して残り
の雑音成分を抽出することになり、また、第3の入力方
向修正手段の出力により第3の入力方向を修正される第
3のビームフォーマは第3の入力方向以外から到来する
成分を抑圧して残りの雑音成分を抽出することになる。
【0173】そして、有効雑音決定手段は、前記雑音方
向推定手段で推定された雑音方向が所定の第1の範囲か
ら到来したか所定の第2の範囲から到来したかに基づい
て前記第1の出力雑音と前記第2の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第1の音声方向推定手段と第2の音声
方向推定手段のいずれの推定結果が有効であるかを決定
して有効な方の音声方向推定結果を第1の入力方向修正
手段へ出力する。
【0174】この結果、目的音方向修正手段は、前記第
1のビームフォーマにおいて入力対象となる目的音の到
来方向である第1の入力方向を、前記決定した方の目的
音方向推定手段で得た目的音方向に基づいて逐次修正す
るので、第1のビームフォーマは第1の入力方向以外か
ら到来する雑音成分を抑圧して話者の音声成分を低雑音
で抽出することになる。
【0175】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1乃至第3のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点にあ
る。そして、このことによって、計算量を大幅に削減す
ることができるようにしている。
【0176】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
【0177】また、本発明では、雑音追尾に監視領域を
全く異ならせた雑音追尾用のビームフォーマを設けてあ
り、それぞれの出力からそれぞれ音声方向を推定させる
と共に、それぞれの推定結果からいずれが有効な雑音追
尾をしているかを判断して、有効と判断された方のビー
ムフォーマのフィルタ係数による音声方向の推定結果を
第1の目的音方向修正手段に与えることで第1の目的音
方向修正手段は、前記第1のビームフォーマにおいて入
力対象となる目的音の到来方向である第1の入力方向
を、前記目的音方向推定手段で推定された目的音方向に
基づいて逐次修正するので、第1のビームフォーマは第
1の入力方向以外から到来する雑音成分を抑圧して話者
の音声成分を低雑音で抽出することができ、雑音源が移
動してもこれを見失うことなく追尾して抑圧することが
できるようになるものである。
【0178】従来技術においては、2ch、すなわち、
2本のマイクロホンだけでも目的音源の追尾を可能とす
べく、雑音追尾用のビームフォーマを雑音抑圧のビーム
フォーマとは別に1個用いるが、例えば、雑音源が目的
音の方向を横切って移動したような場合、雑音の追尾精
度が低下することがあった。
【0179】しかし、本発明では、雑音を追尾するビー
ムフォーマを複数用いて各々別個の追尾範囲を受け持つ
ようにしたことにより、上記のような場合でも追尾精度
の低下を抑止できるようになる。
【0180】以上の構成例1及び構成例2の話者追尾マ
イクロホンアレイ10は、演算負荷の軽減を図りつつ、
主として方向を持つ雑音について抑圧できるようにする
例であった。そして、これらはテレビ会議システムなど
のように、話者音源の配置がわかっていて、しかも、環
境的に雑音が少ないような環境下での利用に適している
が、レベルも特性もまちまちで雑多な雑音の影響を受け
る屋外や、大勢の人の集まる店舗や駅と云った所で使用
するには十分でない可能性がある。
【0181】そこで、方向性の無い背景雑音も効果的に
抑制できるようにしたいところであるが、それには次に
説明するように、スペクトルサブトラクション(SS)
処理機能をさらに付加すればよい。
【0182】すなわち、方向性のある雑音はビームフォ
ーマにより抑圧し、方向性のない背景雑音はスペクトル
サブトラクション(SS)処理により、抑圧する。その
ためには、図3または図7の構成のシステムの後段に、
更に図10の構成のスペクトルサブトラクション(S
S)処理部30を接続した構成とする。
【0183】スペクトルサブトラクション(SS)処理
部30は図に示すように、音声帯域パワー計算部31、
雑音帯域パワー計算部32、帯域重み計算部33、スペ
クトル減算部34から構成されている。
【0184】これらのうち、音声帯域パワー計算部31
は、前記ビームフォーマ13により得られた音声周波数
を、周波数帯域毎に分割して帯域毎の音声パワーを計算
するものであり、雑音帯域パワー計算部32は、前記ビ
ームフォーマ16により得られた雑音周波数成分(また
はビームフォーマ16,22によりそれぞれ得られ、有
効雑音決定部24により選択されて出力された雑音周波
数成分)を、周波数帯域毎に分割して帯域毎の雑音パワ
ーを計算するものである。
【0185】帯域重み計算部33は、帯域k毎に、得ら
れた音声の平均帯域パワーPv(k)と雑音の平均帯域パ
ワーPn(k)を用い、帯域毎の帯域重み係数W(k)を
計算するものであり、修正スペクトル減算部34は、前
記入力帯域パワー計算部31にて計算された入力帯域パ
ワーと、音声帯域パワー計算部31で計算された音声帯
域パワーとに基き、音声信号の周波数帯域毎に重みをか
けて背景雑音を抑圧するものである。
【0186】音声帯域パワー計算部31で用いる音声周
波数成分と、雑音帯域パワー計算部32で用いる雑音周
波数成分は、いずれも実施例0A1あるいは実施例0A
2のビームフォーマの2つの出力である目的音声成分と
雑音成分を利用する。そして、一般に、スペクトルサブ
トラクション(SS)として知られる雑音抑圧処理によ
り、方向性のない背景雑音成分の抑圧を行う。
【0187】一般的に行われるスペクトルサブトラクシ
ョン(SS)は、1チャネルのマイクロホン(つまり、
1本のマイクロホン)を用い、このマイクロホンの出力
から音声のない区間において雑音のパワーを推定するた
め、非定常な雑音が音声に重畳している場合には対処で
きない。
【0188】また、2チャネルのマイクロホン(つま
り、2本のマイクロホン)を用いて、一方を雑音収集
用、片方を雑音重畳音声収集用とする場合にも、両マイ
クロホンの設置場所を離す必要があり、その結果、音声
に重畳する雑音と、雑音収集用マイクロホンで取り込む
雑音との位相がずれ、スペクトルサブトラクションして
も雑音抑圧の改善効果は大きく上がらなかった。
【0189】本実施例では、雑音成分を取り出すビーム
フォーマを用意して、このビームフォーマの出力を用い
るようにしたため、構成例1および構成例2で述べたよ
うに、位相のずれが補正され、非定常雑音の場合でも高
精度なスペクトルサブトラクション(SS)を実現でき
る。
【0190】さらに、周波数領域のビームフォーマの出
力を利用しているため、周波数分析を省略してスペクト
ルサブトラクションが可能であり、従来より少ない演算
量で非定常雑音を抑圧できる。
【0191】以下、具体的なスペクトルサブトラクショ
ン(SS)方法について述べる。
【0192】<スペクトルサブトラクション(SS)の
原理>まず、スペクトルサブトラクションの原理につい
て説明する。
【0193】目的音声用ビームフォーマ(第1のビーム
フォーマ13)の出力をPv、雑音用ビームフォーマ
(第2または第3のビームフォーマ16または22)の
出力をPnとすると、 Pv=V+B′ Pn=N+B″ と表すことができる。ここで、Vは音声成分のパワー、
B′は音声出力に含まれる背景雑音のパワーであり、N
は雑音源成分のパワー、B″は雑音出力に含まれる背景
雑音のパワーである。これらのうち、音声出力成分に含
まれる背景雑音成分を、スペクトルサブトラクション処
理により抑圧する。
【0194】音声出力成分中のB′は、雑音出力成分中
のB″と同等であり、雑音源成分のパワーNも音声成分
のパワーVに比べて小さいとすると、B′=Pnと考え
ることができ、スペクトルサブトラクション(SS)処
理用の重み係数Wは以下のように求めることができる。
すなわち、Wは W=(Pv−Pn)/Pv V/(V+B′) となり、 V Pv*W として音声成分を近似的に求めることができる。
【0195】このような処理は、スペクトルサブトラク
ション処理部30にて行わせるが、当該スペクトルサブ
トラクション処理部30の具体例を次に述べる。
【0196】<スペクトルサブトラクション処理部の構
成例>図10にスペクトルサブトラクション(SS)処
理に必要な構成を、また、図11にスペクトルサブトラ
クション処理手順を示す。
【0197】図10に示すように、スペクトルサブトラ
クション処理部30は、音声帯域パワー計算部31、雑
音帯域パワー計算部32、帯域重み計算部33、スペク
トル減算部34、制御部35とより構成されている。
【0198】これらのうち、音声帯域パワー計算部31
は、第1のビームフォーマ13からの出力である音声周
波数成分を用いて音声帯域パワーを計算すると共にこの
計算されたパワー値を時間方向に平均化し、帯域毎に平
均パワー(音声の平均帯域パワーPv(k))を求めて、
帯域重み計算部33に与えるものであり、雑音帯域パワ
ー計算部32は、第2のビームフォーマ16(または第
3のビームフォーマ22)からの出力である雑音周波数
成分を用いて雑音帯域パワーを計算すると共にこの計算
されたパワー値を時間方向に平均化し、帯域毎に平均パ
ワー(雑音の平均帯域パワーPn(k))を求めて帯域重
み計算部33に与えるものである。
【0199】また、帯域重み計算部33は、帯域k毎
に、得られた音声の平均帯域パワーPv(k)と雑音の平
均帯域パワーPn(k)を用い、帯域毎の帯域重み係数W
(k)を計算するものであり、スペクトル減算部34
は、帯域重み計算部33で計算された帯域毎の重み係数
W(k)を用い、第1のビームフォーマ13より入力さ
れる音声周波数成分Pv(k)に重みをかけることにより
雑音成分を抑圧した音声周波数成分Pv(k)′を求める
ものである。
【0200】制御部35は、スペクトルサブトラクショ
ン制御部50からの信号を受け、その信号種別対応に、
帯域重み計算部33を制御するものであって、スペクト
ルサブトラクション制御部50からの信号が“0”の時
は、帯域重み計算部33に最小重みを発生させるように
制御指令を与えて帯域重み計算部33の出力が最小重み
となるように制御し、また、スペクトルサブトラクショ
ン制御部50からの信号が“1”および“2”の時は、
制御部35は通常の重み係数を求めるように帯域重み計
算部33を制御するものである。
【0201】制御部35は、スペクトルサブトラクショ
ン制御部50からの信号を受けた場合に、帯域重み計算
部33とスペクトル減算部34をスペクトルサブトラク
ション制御部50からの信号種別対応に、所要の制御を
行うものであって、スペクトルサブトラクション制御部
50からの信号が“0”の時は、帯域重み計算部33に
最小重みを発生させるように制御指令を与えて帯域重み
計算部33の出力が最小重みとなるようにし、第1のビ
ームフォーマ13の出力する音声周波数成分にこの最小
重みをかける計算をスペクトル減算部34に実施させて
出力信号をカットするように制御し、また、スペクトル
サブトラクション制御部50からの信号が“1”の時
は、制御部35は音声区間に突発性雑音が重畳している
と見なし、第2のビームフォーマ16からの出力を雑音
成分として扱う2チャネルのスペクトルサブトラクショ
ン処理を行うようスペクトル減算部34を制御し、これ
により、スペクトル減算部34は第2のビームフォーマ
16からの出力を雑音成分として扱う2チャネルのスペ
クトルサブトラクション処理を行わせる制御をし、スペ
クトルサブトラクション制御部50からの信号が“2”
の時は、音声のみの区間と見なして、第1のビームフォ
ーマ13の出力に対し、1チャネルのスペクトルサブト
ラクションを行うよう制御部35がスペクトル減算部3
4を制御して、スペクトル減算部34に第1のビームフ
ォーマ13の出力に対し、1チャネルのスペクトルサブ
トラクションを行わせるように制御する。
【0202】尚、スペクトルサブトラクション制御部5
0からの信号が“1”の時と“2”の時は、帯域重み計
算部33には帯域k毎に、得られた音声の平均帯域パワ
ーPv(k)と雑音の平均帯域パワーPn(k)を用い、帯
域毎の帯域重み係数W(k)を計算する形態をとらせ、
スペクトルサブトラクション制御部50からの信号が
“0”の時のみ、帯域重み係数W(k)を最小にする形
態をとらせるべく制御部35は制御する構成としてあ
る。
【0203】2つのビームフォーマ13,15(または
22)からの出力として音声周波数成分と雑音周波数成
分が得られる。第1のビームフォーマ13からの出力で
ある音声周波数成分を用いて音声帯域パワー計算が実施
され(ステップS51)、ビームフォーマ15(または
22)からの出力である雑音周波数成分を用いて雑音帯
域パワー計算が実施される(ステップS52)。
【0204】ここでのパワー計算は、上述した本発明シ
ステムの音声周波数成分と雑音周波数成分を利用してお
り、これらはビームフォーマの処理を周波数領域で行っ
ていることから、周波数分析なしに、そのまま音声およ
び雑音の周波数成分の各帯域毎にパワーの計算を実行で
きる。
【0205】次に、計算されたパワー値を時間方向に平
均化し、帯域毎に平均パワーを求める(ステップS5
3)。帯域重み計算部33では、帯域k毎に、得られた
音声の平均帯域パワーPv(k)と雑音の平均帯域パワー
Pn(k)を用い、次式により、帯域毎の帯域重み係数W
(k)を計算する。
【0206】W(k)=(Pv(k)−Pn(k))/P
v(k)(Pv(k)>Pn(k)の時) W(k)=Wmin(Pv(k)<=Pn(k)の時) 帯域重みは最大値1.0と最小値Wminの間の値をと
り、Wminの値は例えば“0.01”等とする。
【0207】次にスペクトル減算部34では、帯域重み
計算部33で計算された帯域毎の重み係数W(k)を用
い、入力の音声周波数成分Pv(k)に重みをかけ、雑音
成分を抑圧した音声周波数成分Pv(k)′を求める(ス
テップS54)。
【0208】Pv(k)′=Pv(k)*W(k) こうして、方向のない背景雑音はスペクトルサブトラク
ション(SS)処理により、抑圧され、方向を持つ雑音
は前述のビームフォーマにより抑圧されて、結果的に高
精度の雑音抑圧が可能となる。
【0209】スペクトルサブトラクション処理部30で
は、話者追尾マイクロホンアレイ10の第1のビームフ
ォーマ13から与えられる音声周波数成分と第2のビー
ムフォーマ16(または、第3のビームフォーマ22)
から与えられる雑音周波数成分とを受け、基本的にはこ
のような処理により雑音圧縮を行うが、スペクトルサブ
トラクション制御部50から出力される3種類の信号に
したがって所要の雑音圧縮処理を行うことで、突発的な
雑音の抑圧も可能にしている。
【0210】すなわち、スペクトルサブトラクション処
理部30では、スペクトルサブトラクション制御部50
からの信号を受け取り、信号が“0”の時は、ほとんど
雑音区間と見なせるので、制御部35は帯域重み計算部
33に最小重み係数を出力させ、これを用いてスペクト
ル減算部34に音声周波数成分に対する計算処理をさせ
ることで、スペクトルサブトラクション処理部30から
の出力信号をカットする。
【0211】また、スペクトルサブトラクション制御部
50からの信号が“1”の時は、音声区間に突発性雑音
が重畳していると見なし、制御部35は帯域重み計算部
33に通常の重み係数計算をさせて、得られた重み係数
をスペクトル減算部34に与えるようにし、これを用い
てスペクトル減算部34に第2のビームフォーマ16か
らの出力を雑音成分として扱う2チャネルのスペクトル
サブトラクション処理を行わせる。
【0212】また、スペクトルサブトラクション処理部
30では、スペクトルサブトラクション制御部50から
の信号が“2”の時は、音声のみの区間と見なして、制
御部35は帯域重み計算部33に通常の重み係数計算を
させて、得られた重み係数をスペクトル減算部34に与
えるようにし、これを用いてスペクトル減算部34に第
1のビームフォーマ13の出力に対し、1チャネルのス
ペクトルサブトラクションを行うよう制御し、これによ
り、スペクトル減算部34は第1のビームフォーマ13
の出力に対し、1チャネルのスペクトルサブトラクショ
ンを行い、音声周波数成分の出力として出力する。
【0213】この構成の場合、音声帯域パワー計算手段
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。そして、スペクトル減算手段は、前記音声
帯域パワー計算手段と雑音帯域パワー計算手段とから得
られる音声と雑音の周波数帯域パワーに基き、音声信号
の周波数帯域毎に重みをかけて背景雑音を抑圧する。
【0214】この構成によれば、ビームフォーマでは抑
圧できない方向性のない雑音(背景雑音)は、本発明シ
ステムのビームフォーマで得ることのできる目的音声成
分と雑音成分を利用し、これをスペクトルサブトラクシ
ョン処理することで抑圧する。すなわち、本システムで
は、ビームフォーマとして目的音声成分抽出用と雑音成
分抽出用の2つのビームフォーマを備えているが、これ
らのビームフォーマの出力である目的音声成分と雑音成
分を利用してスペクトルサブトラクション処理すること
により、方向性のない背景雑音成分の抑圧を行う。スペ
クトルサブトラクション(SS)処理は雑音抑圧処理と
して知られるが、一般的に行われるスペクトルサブトラ
クション(SS)処理は、1チャネルのマイクロホン
(つまり、1本のマイクロホン)を用い、このマイクロ
ホンの出力から音声のない区間において雑音のパワーを
推定するため、非定常な雑音が音声に重畳している場合
には対処できない。また、2チャネルのマイクロホン
(つまり、2本のマイクロホン)を用いて、一方を雑音
収集用、片方を雑音重畳音声収集用とする場合にも、両
マイクロホンの設置場所を離す必要があり、その結果、
音声に重畳する雑音と、雑音収集用マイクロホンで取り
込む雑音との位相がずれ、スペクトルサブトラクション
処理しても雑音抑圧の改善効果は大きく上がらない。
【0215】しかし、本発明では、雑音成分を取り出す
ビームフォーマを用意して、このビームフォーマの出力
を用いるようにしたため、位相のずれは補正されてお
り、従って、非定常雑音の場合でも高精度なスペクトル
サブトラクション処理を実現できる。さらに、周波数領
域のビームフォーマの出力を利用しているため、周波数
分析を省略してスペクトルサブトラクションが可能であ
り、従来より少ない演算量で非定常雑音を抑圧できる。
【0216】<方向性検出部40の構成例>次に、ホン
システムにおける重要な構成要素である方向性検出部4
0の構成例について説明する。
【0217】図12は、方向性検出部40の基本構成を
示すブロック図である。図12において、1は対向指向
性マイクロホン、2は周波数分析部であり、これらは話
者追尾マイクロホンアレイ10の構成要素である。41
は位相差相当量計算部、42はチャネル間パワー比計算
部、43は方向性計算部であり、これら位相差相当量計
算部41、チャネル間パワー比計算部42、方向性計算
部43で方向性検出部40を構成している。
【0218】対向指向性マイクロホン1は、上述したよ
うに指向性のある2本のマイクロホンを互いに軸を傾け
て配置した2チャネル(2ch)マイクロホンであり、
周波数分析部12は、この対向指向性マイクロホン1か
らの音声信号2チャネル分を受け、各チャネル毎に例え
ば、高速フーリエ変換(FFT)等により、周波数成分
を計算するものであり、位相差相当量計算部41は、こ
の周波数分析部12の計算した各チャネルの周波数成分
から2チャネル間の位相差に対応する位相差相当量Tを
求めるものである。
【0219】チャネル間パワー比計算部42は、周波数
分析部12の計算した各チャネルの周波数成分のデータ
を各チャネル別に合計してチャネル毎の全周波数成分の
合計パワーの大きさを求め、求めたチャネル別合計パワ
ーの大きさの値を用いて、両チャネル間の値の比率二種
(一方対他方と、他方対一方の二種)を求め、求めたう
ちの大きい方をパワー比Rとするものである。
【0220】また、方向性計算部43は位相差相当量計
算部41で求めた位相差相当量Tとパワー比計算部42
で求めたパワー比Rを用いて両者を乗算し、その結果を
方向性指標Dとして求めるためのものである。
【0221】次に、上記構成の方向性検出部40の作用
を説明する。
【0222】本発明では、2チャネル以上のマイクロホ
ンを用いた雑音抑圧処理技術を実現するが、ここでは簡
単のため、最も基本的な構成である2チャネルマイクロ
ホンの場合を例にとって説明する。
【0223】図13に処理の流れを示す。図13に従っ
て説明すると、まず、2つの指向性マイクロホンを軸を
傾けて配置した対向指向性マイクロホンによる音声入力
部11を集音場所に設置することにより、この対向指向
性マイクロホンから入力された音声は、周波数分析部1
2に送られ、各チャネル毎に例えば高速フーリエ変換
(FFT)等により周波数成分が計算される。
【0224】方向性検出部40では、この求められた2
チャネル分(ch1,ch2)の周波数成分のデータを
受けると、分位相差相当量計算部41において、この受
け取った各チャネルの周波数成分のデータから2チャネ
ル間の位相差に対応する量Tを計算する。
【0225】位相差相当量Tの求め方は、例えば、まず
2チャネル(ch1,ch2)間のクロススペクトルW
xyを求め、Wxyの虚数成分についてはそれを絶対値表現
した値を式(1)に示すように、全周波数成分に関して
和をとる。
【0226】 S=Σ{Real(Wxy), |Imag(Wxy)|} …(1) 次に、式(2)に示すように、逆正接関数でSの位相T
を求め、これを位相差相当量とする。
【0227】 T=atan2(Imag(S), Real(S)) …(2) なお、ここでは全周波数成分を使うとしたが、それに限
る必要はなく、例えば、平均パワーよりも大きい周波数
成分のみを用いるようにしてもよい。
【0228】また一方、チャネル間パワー比計算部42
では、周波数分析部12で求められた周波数成分のデー
タを用いて、チャネル別に全周波数成分の合計パワーを
式(3)により求める。
【0229】Px=ΣX, Py=ΣY …(3) (X,Yは各チャネルの各周波数帯域のパワー成分)そ
して、Px/Pyと、Py/Pxのうち大きい方の値を
パワー比Rとして方向性計算部43に与える。
【0230】方向性計算部43では、例えば、位相差相
当量計算部41で計算した位相差相当量Tと、チャネル
間パワー比計算部42で計算したパワー比Rを用いて、
式(4)のように方向性指標Dを求める。
【0231】D=T* R …(4) また、式(4)のかわりに、式(5)のような重み付き
和により方向性指標Dを求めることも可能である。
【0232】 D=a* T+b* R (a,bは定数) …(5) 要するに、方向性検出部40は、周波数解析結果に基づ
き求めた位相差相当量Tの情報だけではなく、チャネル
間のパワー比Rも情報の一つとして用いて方向性指標D
を出す点が本発明のポイントである。
【0233】方向性指標Dを求めるに当たり、パワー比
Rを導入することにより、波形の振幅差を考慮すること
になり、正面から信号が到来し、2チャネル間で全く同
じ信号が出力された場合には方向性指標Dは値が“0”
となり、そうでない場合は大きな値となるので、この方
向性指標Dの値の大小により、到来方向が正面か否かを
判断できる訳である。
【0234】方向性検出部40ではこの処理を、例え
ば、8[msec]等の短い固定時間毎に行う。なお、以
降、当該固定時間をフレームと呼ぶ。
【0235】従って、例えば、8[msec]のフレーム
周期でこのような処理を繰り返すことで、時々刻々変化
する到来音声の方向性指標Dを得ることができる。
【0236】<方向性検出部40の別の実施例>方向性
検出部40はまた、図14の如き構成でも実現可能であ
る。図14において、11は前述同様の対向指向性マイ
クロホン、12は周波数分析部、44はスペクトル正規
化部、45はチャネル間スペクトル差計算部である。
【0237】これらのうち、対向指向性マイクロホン1
は前述同様のものであって、指向性のある2本のマイク
ロホンを互いに軸を傾けて配置した2チャネル(2c
h)マイクロホンである。また、周波数分析部2は、対
向指向性マイクロホン1からの音声信号2チャネル分を
受け、各チャネル毎に例えば、高速フーリエ変換(FF
T)等により、周波数成分を計算するものであり、ま
た、スペクトル正規化部44は、周波数分析部12から
の周波数成分のデータを受け、この周波数成分のデータ
を各チャネルそれぞれについて正規化するのもであり、
チャネル間スペクトル差計算部45はこの正規化した周
波数成分からチャネル間スペクトル差を計算するもので
ある。
【0238】つまり、スペクトル正規化部44、チャネ
ル間スペクトル差計算部45にて方向検出部40を構成
する例である。
【0239】本例では、演算量を削減するため、位相差
相当量Tを直接求めるのではなく、振幅差だけを用い
て、間接的に位相差を考慮した方向性指標Dを求める。
【0240】図15に処理の流れを示す。
【0241】まず、2つの指向性マイクロホンを軸を傾
けて配置した対向指向性マイクロホン11から入力され
た2ch分の音声は、周波数分析部12に送られ、各チ
ャネル毎に例えば高速フーリエ変換(FFT)等により
周波数成分が計算される。そして、この周波数分析部1
2にて求められた各チャネル別の周波数成分はスペクト
ル正規化部44入力される。
【0242】次に、スペクトル正規化部44では、これ
ら入力された各チャネル別の周波数成分のうち、一方の
チャネルの周波数成分についてその合計パワーの平方根
Rx(式(6))を求め、この求めたRxで両方のチャ
ネルの周波数成分を正規化する(式(7))。
【0243】 Rx=√(ΣX) …(6) X′(k)=X(k)/Rx Y′(k)=Y(k)/Rx …(7) 次に、この正規化されたチャネルの周波数成分はチャネ
ル間スペクトル差計算部22に入力され、このチャネル
間スペクトル差計算部45において、正規化されたスペ
クトル間の差のパワーを式(8)により計算し、これを
方向性指標Dとする。
【0244】 Σ|X′(k)−Y′(k)|**2 …(8) これにより、正面から信号が到来し、2チャネル間で全
く同じ信号が出力された場合は“0”となり、そうでな
い場合は大きな値となるので、この値の大小から到来方
向が正面か否かを判断できる。
【0245】なお、スペクトル正規化は、上述の例に限
ったものでなく、例えば、2チャネルのスペクトルの絶
対値の和を使っても良いし、2チャネルのスペクトルの
和の絶対値を使っても良く、また、2チャネルのうち、
大きい方の絶対値を使っても良い。また、周波数成分毎
に、2チャネルのうちの周波数成分の合計パワーの大き
い方の絶対値で正規化しても良い。
【0246】この処理を、例えば、8[msec]のフ
レーム周期で繰り返すことで、時々刻々変化する到来音
声の方向性指標Dを得ることができる。
【0247】(本発明雑音抑圧処理装置の具体的構成例
1)図1に示した基本構成例は、上述した如き構成の話
者追尾マイクロホンアレイ10、スペクトルサブトラク
ション処理部30、方向検出部40、スペクトルサブト
ラクション制御部50を用いて実現した一例としての本
発明の雑音抑圧処理装置である。
【0248】この雑音抑圧処理装置の作用を説明する。
図1に示した本発明による雑音抑圧装置の基本構成は、
話者追尾マイクロホンアレイ10として図3の構成を、
スペクトルサブトラクション処理部30として図10の
構成を、方向検出部40として図12もしくは図14の
構成を採用した場合、図16に示す如きとなる。
【0249】このシステムの特徴は、音声入力部として
指向性のある少なくとも2チャネル分のマイクロホンを
互いに軸方向を傾けて配置し、これらのマイクロホンで
得た音声信号をそれぞれチャネル別に周波数分析し、こ
れを所望方向外の感度が低くなるように計算したフィル
タ係数を用いての適応ビームフォーマ処理することで、
話者方向からの音声を抑圧して雑音成分を得、この雑音
成分を抑圧する処理を施して雑音の少ない話者音声成分
を得ると云った雑音抑圧処理装置を用いることにより、
雑音抑制した話者音声成分と雑音成分とを得る(図17
のステップS131)ようにすると共に、この雑音抑圧
処理装置に、短時間周波数分析に基づく方向性検出部を
追加し、ビームフォーマ処理で抑圧できない突発性雑音
や高速移動音源等の到来をこの方向性検出部で検出し
(図17のステップS132)、この検出結果と雑音抑
圧処理装置にて求めた話者音声成分と雑音成分とを用い
て行うスペクトルサブトラクションを制御する(図17
のステップS133,S134)ことにより、話者方向
の許容範囲を高精度に設定できる話者追尾機能を確保し
つつ、しかも、突発性雑音、高速移動音源等を抑圧する
ことを可能としている。
【0250】すなわち、図16の雑音抑圧処理装置は、
2つのマイクロホンを持つ音声入力部11から入力され
た音声は、周波数分析部12に送られ、例えば高速フー
リエ変換(FFT)等により周波数成分が計算される。
そして、これら求められた各チャネル別周波数成分のデ
ータは第1及び第2のビームフォーマ13,16および
方向性検出部40に与えられる。
【0251】第1のビームフォーマ13では、周波数分
析部12からの2チャネルの入力に対する周波数成分か
ら、周波数領域の適応フィルタにより雑音を抑圧し、目
的音の方向の周波数成分を出力する(音声周波数成分出
力)。ここでは、目的音の方向をマイクロホンの正面と
するように、目的音方向推定部18からの出力を用いて
第1の入力方向修正部14で位相を整える操作を行う。
【0252】また、第2のビームフォーマ16では、周
波数分析部12からの2チャネルの入力に対する周波数
成分から、周波数領域の適応フィルタにより目的音を抑
圧し、雑音の方向の周波数成分を出力する(雑音周波数
成分出力)。ここでは、雑音の方向をマイクロホンの正
面と仮定し、2つのマイクロホンに対して雑音が同時に
到着したと見なせるように、雑音方向推定部17からの
出力を用いて第2の入力方向修正部15で位相を整える
操作(整相)を行う。
【0253】ここで、雑音方向推定部17では、第1の
ビームフォーマ13の適応フィルタから雑音方向を推定
し、目的音方向推定部18では、第2のビームフォーマ
16の適応フィルタから目的音方向を推定する。これら
の処理は例えば8[msec]等の固定時間毎に行われ
る。
【0254】次に、本発明システムの重要な要素の一つ
である方向検出部40とスペクトルサブトラクション制
御部50について説明する。
【0255】方向検出部40では、上述したとおり、短
時間FFTなどの周波数分析に基づき、2つのマイクロ
ホンの位相差Tのみならず、各チャネルの入力信号のパ
ワー比Rを用いて、方向性指標Dを計算する。そして、
この求めた方向性指標Dをスペクトルサブトラクション
制御部50に与える。
【0256】スペクトルサブトラクション制御部50
は、この求めた方向性指標Dと目的音方向推定部18の
出力である目的音方向情報より目的音方向(話者方向)
とに基づいて、3通りの信号(“0”,“1”,
“2”)のいずれかを発生し、スペクトルサブトラクシ
ョン処理部30に送る。
【0257】ここで、3種類の信号のうち、信号“0”
はほとんど雑音のみの区間であることを表し、信号
“1”は大きな突発性雑音が音声区間に重畳している区
間であることを表し、信号“2”はほぼ音声のみの区間
であることを表している。
【0258】これは次のようにして求める。まず、話者
方向の許容範囲を2つのマイクホンの中心から何度、方
向性指標Dのしきい値を“いくつ”と設定する。例え
ば、話者方向の許容範囲を2つのマイクホンの中心から
±20゜、方向性指標Dのしきい値を“1.0”と設定
すると云った具合に使用環境対応に最適値を設定する。
【0259】そして、方向性検出部40から送られてく
る方向性指標Dが、しきい値(1.0)以下か否かを判
定し、その結果、しきい値以下であれば、つぎに目的音
方向推定部18からの出力である目的音方向情報より目
的音方向(話者方向)が設定範囲内かどうかを判定し、
設定範囲内であればそれはほぼ音声のみの区間であるこ
とを意味しているので信号“2”を発生してスペクトル
サブトラクション処理部30に送る。また、設定範囲外
であれば、ほとんど雑音のみの区間であることを意味し
ているので信号“0”を発生してスペクトルサブトラク
ション処理部30に送る。
【0260】方向性指標Dがしきい値以上であり、目的
音方向が設定範囲内であれば、それは大きな突発性雑音
が音声区間に重畳している区間であることを意味してお
り、従って、話者方向から到来する音声に突発性の雑音
が重畳していると判定して信号“1”を発生してスペク
トルサブトラクション処理部30に送り、方向性指標D
がしきい値以上であり、目的音方向が設定範囲外であれ
ば、それはほとんど雑音のみの区間であることを意味す
るので信号“0”を発生してスペクトルサブトラクショ
ン処理部30に送る。
【0261】このようにして、スペクトルサブトラクシ
ョン制御部50は、目的音方向推定部18で推定された
目的音方向(話者方向)と、方向性検出部40で計算さ
れた方向性指標Dに基づいて、3通りの信号(“0”,
“1”,“2”)のいずれかをスペクトルサブトラクシ
ョン処理部30に送る。
【0262】スペクトルサブトラクション処理部30で
は、話者追尾マイクロホンアレイ10の第1のビームフ
ォーマ13から与えられる音声周波数成分と第2のビー
ムフォーマ16(または、第3のビームフォーマ22)
から与えられる雑音周波数成分とを受け、スペクトルサ
ブトラクション制御部50から出力されるその3種類の
信号にしたがって所要の雑音圧縮処理を行う。
【0263】スペクトルサブトラクション処理部30で
は、このスペクトルサブトラクション制御部50からの
信号を受け取り、信号が“0”の時は、ほとんど雑音区
間と見なせるので、最小重みをかけて、出力信号をカッ
トする。また、スペクトルサブトラクション制御部50
からの信号が“1”の時は、音声区間に突発性雑音が重
畳していると見なし、第2のビームフォーマ16からの
出力を雑音成分として扱う2チャネルのスペクトルサブ
トラクション処理を行う。
【0264】すなわち、スペクトルサブトラクション制
御部50から受け取った信号が“0”の時は、ほとんど
雑音区間と見なせるので、スペクトルサブトラクション
処理部30では、制御部35が帯域重み計算部33に最
小重みを発生させるように制御指令を与え、これによ
り、帯域重み計算部33は最小重みを発生させてスペク
トル減算部34に与えるので、当該スペクトル減算部3
4は音声周波数成分の出力に当該最小重みをかける計算
をしてその結果を出力することで出力信号をカットす
る。
【0265】また、スペクトルサブトラクション制御部
50からの信号が“1”の時は、音声区間に突発性雑音
が重畳していると見なすことができるので、この信号を
受けた制御部35は帯域重み計算部33に通常の重み係
数を計算して出力させるように制御指令を与え、これに
より、帯域重み計算部33は音声帯域パワー計算部31
と雑音帯域パワー計算部32の出力を元に帯域重み係数
を求める。
【0266】そして、帯域重み計算部33はこの求めた
帯域重み係数をスペクトル減算部34に与えるので、当
該スペクトル減算部34は第1のビームフォーマ13か
らの音声周波数成分の出力に、当該重みをかける計算を
してその結果を出力することで、第2のビームフォーマ
16からの出力を雑音成分として扱う2チャネルのスペ
クトルサブトラクション処理が行われたことになり、当
該スペクトルサブトラクション処理結果を雑音抑圧処理
済みの音声周波数成分として出力できる。
【0267】また、スペクトルサブトラクション制御部
50からの信号が“2”の時は、音声のみの区間と見な
すことができるので、スペクトルサブトラクション処理
部30では、この信号を受けた制御部35は帯域重み計
算部33に通常の重み係数を計算して出力させるように
制御指令を与え、これにより、帯域重み計算部33は音
声帯域パワー計算部31と雑音帯域パワー計算部32の
出力を元に帯域重み係数を求める。
【0268】そして、帯域重み計算部33はこの求めた
帯域重み係数をスペクトル減算部34に与えるので、当
該スペクトル減算部34は第1のビームフォーマ13か
らの音声周波数成分の出力に、当該重みをかける計算を
してその結果を出力することで、第1のビームフォーマ
13の出力に対し、1チャネルのスペクトルサブトラク
ションを行った状態の結果を得、これを音声周波数成分
の出力として出力する。
【0269】なお、別の制御方法として、信号“1”の
時は、大きな突発性雑音が音声に重畳しているため、雑
音区間と見なして信号“0”と同様の処理にしてもよ
い。
【0270】本装置により、方向を持つ雑音成分および
方向のない雑音成分を抑圧したひずみの少ない音声成分
のみの抽出ができると共に、突発的な雑音に対しても、
雑音成分を抑圧したひずみの少ない音声成分の抽出がで
きる。
【0271】(本発明雑音抑圧処理装置の具体的構成例
2)この具体的構成例は図18に示す如きであって、こ
の場合、話者追尾マイクロホンアレイ10としては図7
の構成を用いると共に、スペクトルサブトラクション処
理部30としては図10の構成、そして、方向検出部4
0として図12もしくは図14の構成を採用した例であ
る。
【0272】このような構成の本システムの作用を説明
する。
【0273】まず、複数のマイクロホンを持つ音声入力
部11、この例では第1及び第2の計2本のマイクロホ
ンm1,m2を持つ音声入力部11でch1,ch2の
音声を取り込む。そして、この音声入力部11から入力
された2チャネル分の音声の信号ch1,ch2(すな
わち、第1チャネルch1は第1のマイクロホンm1か
らの音声、第2チャネルch2は第2のマイクロホンm
2からの音声に該当する)は、周波数分析部12に送ら
れ、ここで例えば高速フーリエ変換(FFT)等の処理
を行うことによって、それぞれのチャネル別に周波数成
分(周波数スペクトル)が求められる。
【0274】周波数分析部12でそれぞれ求められたチ
ャネル別の周波数成分は、それぞれ第1、第2及び第3
のビームフォーマ13,16,22に与えられる。
【0275】第1のビームフォーマ13では、2チャネ
ル分の周波数成分入力について、目的音の方向対応に位
相を合わせた上で、周波数領域の適応フィルタにより上
述のようにして処理することで雑音を抑圧し、目的音の
方向の周波数成分を出力する。
【0276】すなわち、第1の入力方向修正部14は第
1のビームフォーマ13に対して次のような角度情報
(α)を与える。つまり、第1の入力方向修正部14
は、有効雑音決定部24を介して与えられる音声方向推
定部18若しくは音声方向推定部23からの出力を用
い、目的音の方向があたかもマイクロホンの正面方向と
なるよう、上記2チャネルの周波数成分の入力位相を整
えるに必要な角度情報(α)を入力方向修正量として第
1のビームフォーマ13に対して与える。
【0277】この結果、第1のビームフォーマ13はこ
の修正量(α)対応に目的音方向を修正し、当該目的音
方向以外の方向から到来する音声を抑圧させるようにす
ることで、雑音成分を抑圧し、目的音を抽出する。
【0278】つまり、第2および第3のビームフォーマ
16,22の場合、雑音が目的音であるから、雑音に位
相を合わせている。その結果、第2,第3のビームフォ
ーマ16,22では話者の音源は雑音源として扱われ、
各ビームフォーマの内蔵する適応フィルタは話者音源か
らの音を抽出する処理をすることになるので、当該第
2,第3のビームフォーマ16,22の適応フィルタの
パラメータからは話者音源の方向を反映した情報が得ら
れることになる。
【0279】従って、第1または第2の音声方向推定部
18または23により、第2または第3のビームフォー
マ16または22における適応フィルタのパラメータを
用いて雑音源方向を知れば、それは目的音である話者音
源の方向を反映させたものである。従って、第1または
第2の音声方向推定部18または23により、第2また
は第3のビームフォーマ16または22における適応フ
ィルタのパラメータを反映させた出力を出し、第1の入
力方向修正部14でこの出力対応に入力方向修正量
(α)を発生し、この修正量対応に第1のビームフォー
マ13における目的音方向を修正すれば、第1のビーム
フォーマ13は当該目的音方向以外の方向から到来する
音声を抑圧するので、この場合、話者音源からの成分を
抽出できることになる。
【0280】一方、第1のビームフォーマ13の適応フ
ィルタでは雑音成分が抽出されるようにパラメータが制
御されているので、このパラメータから雑音方向推定部
17では、雑音方向を推定し、その情報を第2及び第3
の入力方向修正部15,21と有効雑音決定部24に与
えることになる。
【0281】そして、当該雑音方向推定部17からの出
力を受けた第2の入力方向修正部15では、当該雑音方
向推定部17からの出力対応に入力方向修正量(α)を
発生し、この修正量対応に第2のビームフォーマ16に
おける目的音方向を修正すれば、第2のビームフォーマ
16は当該目的音方向以外の方向から到来する音声を抑
圧するので、この場合、話者音源以外からの成分である
雑音成分を抽出できることになる。
【0282】このとき、第2のビームフォーマ16の適
応フィルタでは目的音である話者音声成分が抽出される
ようにパラメータが制御されているので、このパラメー
タから第1の音声方向推定部18では、話者音声方向を
推定することができる。そして、第1の音声方向推定部
18はその推定した情報を有効雑音決定部24に与え
る。
【0283】また、雑音方向推定部17からの出力が第
3の入力方向修正部21にも与えられているが、これを
受けた第3の入力方向修正部21では、当該雑音方向推
定部17からの出力対応に入力方向修正量(α)を発生
に、第3のビームフォーマ22に与える。これにより、
第3のビームフォーマ22はこの与えられた修正量対応
に、自己における目的音方向を修正する。
【0284】これにより、第3のビームフォーマ22は
当該目的音方向以外の方向から到来する音声を抑圧する
ので、この場合、話者音源以外からの成分、つまり、雑
音成分を抽出できることになる。
【0285】このとき、第3のビームフォーマ22の適
応フィルタでは目的音である話者音声成分が抽出される
ようにパラメータが制御されているので、このパラメー
タから第2の音声方向推定部23では、話者音声方向を
推定できる。そして、この推定した情報は有効雑音決定
部24に与えることになる。
【0286】有効雑音決定部24では、第1および第2
の音声方向推定部18,23から与えられた話者音声方
向の推定情報と、雑音方向推定部17から与えられた雑
音方向の推定情報とをもとに、第2のビームフォーマ1
6と第3のビームフォーマ22のいずれが雑音を有効に
追尾しているかを判断する。そして、この判断結果に基
づき、有効に追尾していると判断した方のビームフォー
マにおける適応フィルタのパラメータを第1の入力方向
修正部14に与える。
【0287】そのため、第1の入力方向修正部14で
は、当該パラメータを反映させた出力を出し、第1の入
力方向修正部14でこの出力対応に入力方向修正量
(α)を発生し、この修正量対応に第1のビームフォー
マ13における目的音方向を修正するので、第1のビー
ムフォーマ13は当該目的音方向以外の方向から到来す
る音声を抑圧することになって、この場合、話者音源か
らの成分を抽出でき、しかも、広く移動する雑音源から
の雑音を対象とする場合に、その移動する雑音源を見失
うことなく、確実にとらえて雑音除去することが可能と
なる。
【0288】ただし、突発的な雑音には対処できないの
で、ここでは、サブトラクション処理部30、方向性検
出部40、サブトラクション制御部50からなる構成に
より対処できるようにしている。
【0289】すなわち、短時間周波数分析に基づく方向
性検出部を追加し、ビームフォーマ処理で抑圧できない
突発性雑音や高速移動音源等の到来をこの方向性検出部
40で検出し、この検出結果と雑音抑圧処理装置にて求
めた話者音声成分と雑音成分とを用いて行うスペクトル
サブトラクション処理を制御することにより、話者方向
の許容範囲を高精度に設定できる話者追尾機能を確保し
つつ、しかも、突発性雑音、高速移動音源等を抑圧する
ことを可能としている。
【0290】すなわち、方向検出部40では、上述した
とおり、短時間FFTなどの周波数分析に基づき、2つ
のマイクロホンの位相差Tのみならず、各チャネルの入
力信号のパワー比Rを用いて、方向性指標Dを計算す
る。そして、この求めた方向性指標Dをスペクトルサブ
トラクション制御部50に与える。
【0291】スペクトルサブトラクション制御部50
は、この求めた方向性指標Dと目的音方向推定部18の
出力である目的音方向情報より目的音方向(話者方向)
とに基づいて、3通りの信号(“0”,“1”,
“2”)のいずれかを発生し、スペクトルサブトラクシ
ョン処理部30に送る。
【0292】ここで、3種類の信号のうち、信号“0”
はほとんど雑音のみの区間であることを表し、信号
“1”は大きな突発性雑音が音声区間に重畳している区
間であることを表し、信号“2”はほぼ音声のみの区間
であることを表している。
【0293】これは次のようにして求める。まず、話者
方向の許容範囲を2つのマイクホンの中心から何度、方
向性指標Dのしきい値を“いくつ”と設定する。例え
ば、話者方向の許容範囲を2つのマイクホンの中心から
±20゜、方向性指標Dのしきい値を“1.0”と設定
すると云った具合に使用環境対応に最適値を設定する。
【0294】そして、方向性検出部40から送られてく
る方向性指標Dが、しきい値(1.0)以下か否かを判
定し、その結果、しきい値以下であれば、つぎに目的音
方向推定部18からの出力である目的音方向情報より目
的音方向(話者方向)が設定範囲内かどうかを判定し、
設定範囲内であればそれはほぼ音声のみの区間であるこ
とを意味しているので信号“2”を発生してスペクトル
サブトラクション処理部30に送る。また、設定範囲外
であれば、ほとんど雑音のみの区間であることを意味し
ているので信号“0”を発生してスペクトルサブトラク
ション処理部30に送る。
【0295】方向性指標Dがしきい値以上であり、目的
音方向が設定範囲内であれば、それは大きな突発性雑音
が音声区間に重畳している区間であることを意味してお
り、従って、話者方向から到来する音声に突発性の雑音
が重畳していると判定して信号“1”を発生してスペク
トルサブトラクション処理部30に送り、方向性指標D
がしきい値以上であり、目的音方向が設定範囲外であれ
ば、それはほとんど雑音のみの区間であることを意味す
るので信号“0”を発生してスペクトルサブトラクショ
ン処理部30に送る。
【0296】このようにして、スペクトルサブトラクシ
ョン制御部50は、目的音方向推定部18で推定された
目的音方向(話者方向)と、方向性検出部40で計算さ
れた方向性指標Dに基づいて、3通りの信号(“0”,
“1”,“2”)のいずれかをスペクトルサブトラクシ
ョン処理部30に送る。
【0297】スペクトルサブトラクション処理部30で
は、話者追尾マイクロホンアレイ10の第1のビームフ
ォーマ13から与えられる音声周波数成分と第2のビー
ムフォーマ16(または、第3のビームフォーマ22)
から与えられる雑音周波数成分とを受け、スペクトルサ
ブトラクション制御部50から出力されるその3種類の
信号にしたがって所要の雑音圧縮処理を行う。
【0298】スペクトルサブトラクション処理部30で
は、このスペクトルサブトラクション制御部50からの
信号を受け取り、信号が“0”の時は、ほとんど雑音区
間と見なせるので、最小重みをかけて、出力信号をカッ
トする。また、スペクトルサブトラクション制御部50
からの信号が“1”の時は、音声区間に突発性雑音が重
畳していると見なし、第2のビームフォーマ16からの
出力を雑音成分として扱う2チャネルのスペクトルサブ
トラクション処理を行う。
【0299】すなわち、スペクトルサブトラクション制
御部50から受け取った信号が“0”の時は、ほとんど
雑音区間と見なせるので、スペクトルサブトラクション
処理部30では、制御部35が帯域重み計算部33に最
小重みを発生させるように制御指令を与え、これによ
り、帯域重み計算部33は最小重みを発生させてスペク
トル減算部34に与えるので、当該スペクトル減算部3
4は音声周波数成分の出力に当該最小重みをかける計算
をしてその結果を出力することで出力信号をカットす
る。
【0300】また、スペクトルサブトラクション制御部
50からの信号が“1”の時は、音声区間に突発性雑音
が重畳していると見なすことができるので、この信号を
受けた制御部35は帯域重み計算部33に通常の重み係
数を計算して出力させるように制御指令を与え、これに
より、帯域重み計算部33は音声帯域パワー計算部31
と雑音帯域パワー計算部32の出力を元に帯域重み係数
を求める。
【0301】そして、帯域重み計算部33はこの求めた
帯域重み係数をスペクトル減算部34に与えるので、当
該スペクトル減算部34は第1のビームフォーマ13か
らの音声周波数成分の出力に、当該重みをかける計算を
してその結果を出力することで、第2のビームフォーマ
16からの出力を雑音成分として扱う2チャネルのスペ
クトルサブトラクション処理が行われたことになり、当
該スペクトルサブトラクション処理結果を雑音抑圧処理
済みの音声周波数成分として出力できる。
【0302】また、スペクトルサブトラクション制御部
50からの信号が“2”の時は、音声のみの区間と見な
すことができるので、スペクトルサブトラクション処理
部30では、この信号を受けた制御部35は帯域重み計
算部33に通常の重み係数を計算して出力させるように
制御指令を与え、これにより、帯域重み計算部33は音
声帯域パワー計算部31と雑音帯域パワー計算部32の
出力を元に帯域重み係数を求める。
【0303】そして、帯域重み計算部33はこの求めた
帯域重み係数をスペクトル減算部34に与えるので、当
該スペクトル減算部34は第1のビームフォーマ13か
らの音声周波数成分の出力に、当該重みをかける計算を
してその結果を出力することで、第1のビームフォーマ
13の出力に対し、1チャネルのスペクトルサブトラク
ションを行った状態の結果を得、これを音声周波数成分
の出力として出力する。
【0304】なお、上述同様に別の制御方法として、信
号“1”の時は、大きな突発性雑音が音声に重畳してい
るため、雑音区間と見なして信号“0”と同様の処理に
してもよい。
【0305】本装置により、方向を持つ雑音成分および
方向のない雑音成分を抑圧したひずみの少ない音声成分
のみの抽出ができると共に、突発的な雑音に対しても、
雑音成分を抑圧したひずみの少ない音声成分の抽出がで
きる。
【0306】次に、具体的構成例1を更に高精度化する
ことができるようにした雑音抑圧処理装置の例を具体的
構成例2として次に説明する。
【0307】(スペクトルサブトラクション(SS)処
理の別の例)この具体的構成例は図18に示す如きであ
って、この場合、話者追尾マイクロホンアレイ10とし
ては図7の構成を用いると共に、スペクトルサブトラク
ション処理部30としては図19に示す如きの構成を適
用する。
【0308】本実施例は、スペクトルサブトラクション
(SS)処理において、雑音成分のパワーを修正するこ
とにより、さらに高精度に雑音抑圧を行うことを可能と
するものである。すなわち、上述した例では雑音源のパ
ワーNが小さいという仮定をおいている。そのため、ス
ペクトルサブトラクション(SS)処理を行うと雑音源
の成分が音声に重畳している部分では歪みが大きくなる
懸念が残る。
【0309】そこで、ここではスペクトルサブトラクシ
ョン処理における帯域重みの計算を、入力信号(周波数
分析部12の出力)のパワーを用いて修正するようにす
る。
【0310】まず、音声出力パワーをPv、音声成分の
パワーをV、音声出力に含まれる背景雑音パワーを
B′、雑音出力パワーをPn、雑音源成分のパワーを
N、雑音出力に含まれる背景雑音成分をB″、どの信号
も抑圧されていない入力信号のパワーをPxとすると、 Px=V+N+B Pv=V+B′ Pn=N+B″ ここで、ここで、B B′ B″と仮定する
と、真の背景雑音成分のパワーPbは、 Pb=Pv+Pn−Px =V+B′+N+B″−(V+N+B) =B′+B″−B =B となる。この雑音パワーを用いたスペクトルサブトラク
ション(SS)の重みは、 W=(Pv−Pb)/Pv =(Px−Pn)/Pv と計算でき、背景雑音が非定常でかつ、Nが大きい場合
でも歪みの少いSS処理を行うことができる。
【0311】本実施例で使用するスペクトルサブトラク
ション処理部30の構成例を図19に示し、処理の流れ
を図20に示す。図19中、31は音声帯域パワー計算
部、32は雑音帯域パワー計算部、34はスペクトル減
算部、35は制御部、37は入力信号帯域パワー計算部
である。
【0312】これらのうち、音声帯域パワー計算部31
は、前記第1のビームフォーマ13により得られた音声
周波数を、周波数帯域毎に分割して帯域毎の音声パワー
を計算すると共に、この計算されたパワー値を時間方向
に平均化し、帯域毎に平均パワー(音声の平均帯域パワ
ーPv(k))を求めて、帯域重み計算部33に与えるも
のであり、雑音帯域パワー計算部32は、前記第1のビ
ームフォーマ16または(第2のビームフォーマ22)
により得られ、有効雑音決定部24により選択されて出
力された雑音周波数成分を用いて雑音帯域パワーを計算
すると共に、この計算されたパワー値を時間方向に平均
化し、帯域毎に平均パワー(雑音の平均帯域パワーPn
(k))を求めて、帯域重み計算部33に与えるもので
ある。
【0313】また、入力信号帯域パワー計算部37は、
前記周波数分析部12から得られた入力信号(ch1ま
たはch2いずれか一方)の周波数スペクトル成分を周
波数帯域毎に分割し、帯域毎の入力パワーを計算すると
共に、この計算されたパワー値を時間方向に平均化し、
帯域毎に平均パワー(入力信号の平均帯域パワーP(
k))を求めて、帯域重み計算部33に与えるものであ
り、帯域重み計算部33に与えるものである。
【0314】また、帯域重み計算部33は、帯域k毎
に、得られた音声の平均帯域パワーPv(k)と雑音の平
均帯域パワーPn(k)と前記入力信号帯域パワー計算部
37にて計算された平均入力帯域パワーP( k)とに基
き、帯域毎の帯域重み係数W(k)を計算するものであ
り、スペクトル減算部34は、前記帯域重み計算部33
の求めた帯域毎の帯域重み係数W(k)を用い、音声信
号の周波数帯域ごとに当該重み係数をかけて背景雑音を
抑圧するものである。
【0315】また、制御部35は、スペクトルサブトラ
クション制御部50からの信号を受け、その信号種別対
応に、帯域重み計算部33を制御するものであって、ス
ペクトルサブトラクション制御部50からの信号が
“0”の時は、帯域重み計算部33に最小重みを発生さ
せるように制御指令を与えて帯域重み計算部33の出力
が最小重みとなるように制御し、また、スペクトルサブ
トラクション制御部50からの信号が“1”および
“2”の時は、制御部35は通常の重み係数を求めるよ
うに帯域重み計算部33を制御するものである。
【0316】スペクトル減算部34は帯域重み計算部3
3の出力する重み係数を用い、これを第2のビームフォ
ーマ16からの出力に乗算して雑音成分を抑圧した音声
周波数成分の信号として出力するためのものである。
【0317】図19に示すスペクトルサブトラクション
(SS)処理部30の構成が図10のスペクトルサブト
ラクション(SS)処理部30の構成と異なる点は、何
も抑圧されていない入力信号の周波数成分(周波数分析
部12の出力)を更に用いる点である。
【0318】周波数分析部12の出力はマイクロホンが
2本あるので、ch1,ch2の2系統あるが、いずれ
を用いてもよい。この周波数分析部12からの入力信号
周波数成分について、入力信号帯域パワー計算部37で
は、ビームフォーマからの音声周波数成分あるいは雑音
周波数成分と同様に、帯域毎にパワーを計算する(ステ
ップS61)。
【0319】また、図10と同様に、第1のビームフォ
ーマ13からの出力として音声周波数成分が、そして、
第2のビームフォーマ15(または第3のビームフォー
マ22)からの出力として雑音周波数成分が与えられる
ので、音声帯域パワー計算部31では第1のビームフォ
ーマ13からの出力である音声周波数成分を用いて音声
帯域パワー計算を実施し(ステップS62)、雑音帯域
パワー計算部32では第2のビームフォーマ15(また
は第3のビームフォーマ22)からの出力である雑音周
波数成分を用いて雑音帯域パワー計算を実施する(ステ
ップS63)。
【0320】そして、これらを用いて上述したように帯
域重み計算部33により重み係数を求める(ステップS
64)。
【0321】そして、スペクトル減算部34はこの求め
られた重み係数を用いて第1のビームフォーマ13から
の音声周波数成分の出力に、当該重みをかける計算を
し、その結果を出力することでスペクトルサブトラクシ
ョン処理した音声周波数成分を出力する(ステップS6
5)。
【0322】帯域重み計算部33による重み係数の計算
は、方向検出部40とスペクトルサブトラクション制御
部50にて前述同様の制御のもとに実施される。すなわ
ち、方向検出部40では、上述したとおり、短時間FF
Tなどの周波数分析に基づき、2つのマイクロホンの位
相差Tのみならず、各チャネルの入力信号のパワー比R
を用いて、方向性指標Dを計算する。そして、この求め
た方向性指標Dをスペクトルサブトラクション制御部5
0に与える。
【0323】スペクトルサブトラクション制御部50
は、この求めた方向性指標Dと目的音方向推定部18の
出力である目的音方向情報より目的音方向(話者方向)
とに基づいて、3通りの信号(“0”,“1”,
“2”)のいずれかを発生し、スペクトルサブトラクシ
ョン処理部30に送る。
【0324】ここで、3種類の信号のうち、信号“0”
はほとんど雑音のみの区間であることを表し、信号
“1”は大きな突発性雑音が音声区間に重畳している区
間であることを表し、信号“2”はほぼ音声のみの区間
であることを表している。
【0325】これは次のようにして求める。まず、話者
方向の許容範囲を2つのマイクホンの中心から何度、方
向性指標Dのしきい値を“いくつ”と設定する。例え
ば、話者方向の許容範囲を2つのマイクホンの中心から
±20゜、方向性指標Dのしきい値を“1.0”と設定
すると云った具合に使用環境対応に最適値を設定する。
【0326】そして、方向性検出部40から送られてく
る方向性指標Dが、しきい値(1.0)以下か否かを判
定し、その結果、しきい値以下であれば、つぎに目的音
方向推定部18からの出力である目的音方向情報より目
的音方向(話者方向)が設定範囲内かどうかを判定し、
設定範囲内であればそれはほぼ音声のみの区間であるこ
とを意味しているので信号“2”を発生してスペクトル
サブトラクション処理部30に送る。また、設定範囲外
であれば、ほとんど雑音のみの区間であることを意味し
ているので信号“0”を発生してスペクトルサブトラク
ション処理部30に送る。
【0327】方向性指標Dがしきい値以上であり、目的
音方向が設定範囲内であれば、それは大きな突発性雑音
が音声区間に重畳している区間であることを意味してお
り、従って、話者方向から到来する音声に突発性の雑音
が重畳していると判定して信号“1”を発生してスペク
トルサブトラクション処理部30に送り、方向性指標D
がしきい値以上であり、目的音方向が設定範囲外であれ
ば、それはほとんど雑音のみの区間であることを意味す
るので信号“0”を発生してスペクトルサブトラクショ
ン処理部30に送る。
【0328】このようにして、スペクトルサブトラクシ
ョン制御部50は、目的音方向推定部18で推定された
目的音方向(話者方向)と、方向性検出部40で計算さ
れた方向性指標Dに基づいて、3通りの信号(“0”,
“1”,“2”)のいずれかをスペクトルサブトラクシ
ョン処理部30に送る。
【0329】スペクトルサブトラクション処理部30で
は、話者追尾マイクロホンアレイ10の第1のビームフ
ォーマ13から与えられる音声周波数成分と第2のビー
ムフォーマ16(または、第3のビームフォーマ22)
から与えられる雑音周波数成分とを受け、スペクトルサ
ブトラクション制御部50から出力されるその3種類の
信号にしたがって所要の雑音圧縮処理を行う。
【0330】スペクトルサブトラクション処理部30で
は、このスペクトルサブトラクション制御部50からの
信号を受け取り、信号が“0”の時は、ほとんど雑音区
間と見なせるので、最小重みをかけて、出力信号をカッ
トする。また、スペクトルサブトラクション制御部50
からの信号が“1”の時は、音声区間に突発性雑音が重
畳していると見なし、第2のビームフォーマ16からの
出力を雑音成分として扱う2チャネルのスペクトルサブ
トラクション処理を行う。
【0331】すなわち、スペクトルサブトラクション制
御部50から受け取った信号が“0”の時は、ほとんど
雑音区間と見なせるので、スペクトルサブトラクション
処理部30では、制御部35が帯域重み計算部33に最
小重みを発生させるように制御指令を与え、これによ
り、帯域重み計算部33は最小重みを発生させてスペク
トル減算部34に与えるので、当該スペクトル減算部3
4は音声周波数成分の出力に当該最小重みをかける計算
をしてその結果を出力することで出力信号をカットす
る。
【0332】また、スペクトルサブトラクション制御部
50からの信号が“1”の時は、音声区間に突発性雑音
が重畳していると見なすことができるので、この信号を
受けた制御部35は帯域重み計算部33に通常の重み係
数を計算して出力させるように制御指令を与え、これに
より、帯域重み計算部33は音声帯域パワー計算部31
と雑音帯域パワー計算部32の出力を元に帯域重み係数
を求める。
【0333】そして、帯域重み計算部33はこの求めた
帯域重み係数をスペクトル減算部34に与えるので、当
該スペクトル減算部34は第1のビームフォーマ13か
らの音声周波数成分の出力に、当該重みをかける計算を
してその結果を出力することで、第2のビームフォーマ
16からの出力を雑音成分として扱う2チャネルのスペ
クトルサブトラクション処理が行われたことになり、当
該スペクトルサブトラクション処理結果を雑音抑圧処理
済みの音声周波数成分として出力できる。
【0334】また、スペクトルサブトラクション制御部
50からの信号が“2”の時は、音声のみの区間と見な
すことができるので、スペクトルサブトラクション処理
部30では、この信号を受けた制御部35は帯域重み計
算部33に通常の重み係数を計算して出力させるように
制御指令を与え、これにより、帯域重み計算部33は音
声帯域パワー計算部31と雑音帯域パワー計算部32の
出力を元に帯域重み係数を求める。
【0335】そして、帯域重み計算部33はこの求めた
帯域重み係数をスペクトル減算部34に与えるので、当
該スペクトル減算部34は第1のビームフォーマ13か
らの音声周波数成分の出力に、当該重みをかける計算を
してその結果を出力することで、第1のビームフォーマ
13の出力に対し、1チャネルのスペクトルサブトラク
ションを行った状態の結果を得、これを音声周波数成分
の出力として出力する。
【0336】なお、上述同様に別の制御方法として、信
号“1”の時は、大きな突発性雑音が音声に重畳してい
るため、雑音区間と見なして信号“0”と同様の処理に
してもよい。
【0337】本装置により、方向を持つ雑音成分および
方向のない雑音成分を抑圧したひずみの少ない音声成分
のみの抽出ができると共に、突発的な雑音に対しても、
雑音成分を抑圧したひずみの少ない音声成分の抽出がで
き、しかも、スペクトルサブトラクション(SS)処理
において、雑音成分のパワーを修正するようにしたこと
により、より高精度に雑音抑圧を行うことが可能となる
雑音抑圧処理装置を提供できる。
【0338】これにより、方向を持つ雑音成分および方
向のない雑音成分を抑圧した歪みの少い音声成分のみの
抽出ができるようになる。
【0339】このように、この例は雑音抑圧装置におい
て、音声入力手段から得られた入力信号を周波数分析し
た入力信号の周波数成分を周波数帯域毎に分割し、帯域
毎の入力パワーを計算する入力帯域パワー計算手段を設
けて、スペクトル減算手段には、入力帯域パワーと音声
帯域パワーと雑音帯域パワーとに基き、音声信号の周波
数帯域毎に重みをかけて背景雑音を抑圧する処理を実施
させるように構成したことを特徴とする。
【0340】この構成の場合、音声帯域パワー計算手段
は、得られた音声周波数のスペクトル成分を、周波数帯
域毎に分割して帯域毎の音声パワーを計算し、雑音帯域
パワー計算手段は、前記得られた雑音周波数のスペクト
ル成分を、周波数帯域毎に分割して帯域毎の雑音パワー
を計算する。また、入力帯域パワー計算手段があり、こ
の入力帯域パワー計算手段は、音声入力手段から得られ
た入力信号を周波数分析して得た入力音声の周波数スペ
クトル成分を受けて、これを周波数帯域毎に分割し、帯
域毎の入カパワーを計算する。そして、スペクトル減算
手段は、前記音声帯域パワー計算手段と雑音帯域パワー
計算手段とから得られる音声と雑音の周波数帯域パワー
に基き、音声信号の周波数帯域毎に重みをかけて背景雑
音を抑圧する。
【0341】この実施例においては、構成例1における
スペクトルサブトラクション処理において、更に雑音成
分についてそのパワーを修正するようにしたことによ
り、一層高精度に雑音抑圧を行うことを可能とするもの
である。すなわち、第3の発明では雑音源のパワ−Nが
小さいという仮定をおいたため、スペクトルサブトラク
ション処理を行うと雑音源の成分が音声に重畳している
部分では歪みが大きくなることが避けられない点を、こ
こでは入力信号のパワーを用いてスペクトルサブトラク
ション処理における帯域重み係数の計算の修正するよう
にした。
【0342】これにより、方向を持つ雑音成分および方
向のない雑音成分を抑圧した歪みの少い音声成分のみの
抽出ができるようになるものである。
【0343】以上、種々の実施例を説明したが、本発明
は第1には、話者の音声を異なる2箇所以上の位置で受
音してそれぞれ音声信号として出力する音声入力手段
と、前記受音位置に対応する音声信号のチャネル毎に周
波数分析を行ってそれぞれチャネル別の周波数成分を出
力する周波数分析手段と、前記周波数分析手段の出力す
る複数チャネルの周波数成分を用いて適応フィルタ処理
により目的の音声以外の到来雑音の抑圧処理を行い、目
的音声成分の信号を出力する第1のビームフォーマ処理
手段と、前記周波数分析手段の出力する複数チャネルの
周波数成分を用いて適応フィルタ処理により目的の音声
の抑圧処理を行って雑音成分の信号を出力する第2のビ
ームフォーマ処理手段と、前記第1のビームフォーマ処
理手段で計算されるフィルタ係数から雑音方向を推定す
る雑音方向推定手段と、前記第2のビームフォーマ処理
手段で計算されるフィルタ係数から目的音方向を推定す
る目的音方向推定手段と、前記第1のビームフォーマ処
理手段において入力対象とする目的音の到来方向である
第1の入力方向を、前記目的音方向推定手段で推定され
た目的音方向に基づいて逐次修正する第1の入力方向修
正手段と、前記第2のビームフォーマ処理手段において
入力対象とする雑音の到来方向である第2の入力方向
を、前記雑音方向推定手段で推定された雑音方向に基づ
いて逐次修正する第2の入力方向修正手段と、前記第1
のビームフォーマ処理手段の出力と第2のビームフォー
マ処理手段の出力に基づいて非線形の雑音抑圧処理であ
るスペクトルサブトラクション処理を行うスペクトルサ
ブトラクション手段と、前記周波数分析手段から出力さ
れた周波数成分から到来音の時間差と振幅の差に基づい
た方向性の指標を計算する方向性検出手段と、該方向性
指標と前記目的音方向推定手段から出力された目的音方
向とに基づいて前記スペクトルサブトラクション手段の
スペクトルサブトラクション処理を制御するスペクトル
サブトラクション制御手段とを具備して構成したもので
ある。
【0344】そして、このような構成の場合、話者の発
声した音声を異なる2箇所以上の位置で音声入力手段は
受音し、周波数分析手段では、これを前記受音位置に対
応する音声信号のチャネル毎に周波数分析して複数チャ
ネルの周波数成分を出力する。そして、第1のビームフ
ォーマ処理手段はこの周波数分析手段にて得られる前記
複数チャネルの周波数成分について、所望方向外の感度
が低くなるように計算したフィルタ係数を用いての適応
フィルタ処理を施すことにより前記話者方向からの音声
以外の音声を抑圧する到来雑音抑圧処理を行い、目的音
声成分を得、また、第2のビームフォーマ処理手段は、
前記周波数分析手段にて得られる前記複数チャネルの周
波数成分について、所望方向外の感度が低くなるように
計算したフィルタ係数を用いての適応フィルタ処理を施
すことにより前記話者方向からの音声を抑圧し、雑音成
分を得る。そして、雑音方向推定手段は、前記第1のビ
ームフォーマ処理手段で計算されるフィルタ係数から雑
音方向を推定し、目的音方向推定手段は、前記第2のビ
ームフォーマ処理手段で計算されるフィルタ係数から目
的音方向を推定する。目的音方向修正手段は、前記第1
のビームフォーマにおいて入力対象となる目的音の到来
方向である第1の入力方向を、前記目的音方向推定手段
で推定された目的音方向に基づいて逐次修正するので、
第1のビームフォーマは第1の入力方向以外から到来す
る雑音成分を抑圧して話者の音声成分を低雑音で抽出す
ることになる。また、雑音方向修正手段は、前記第2の
ビームフォーマにおいて入力対象とする雑音の到来方向
である第2の入力方向を、前記雑音方向推定手段で推定
された雑音方向に基づいて逐次修正するので、第2のビ
ームフォーマは第2の入力方向以外から到来する成分を
抑圧して話者の音声成分を抑圧した残りの雑音成分を抽
出することになる。
【0345】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点、そ
して、本発明では、突発性の雑音にも対処できるよう
に、短時間データを用いて到来音が目的方向から到来し
たかどうかを決めるための方向性の指標を高精度に求め
る方向性検出手段を組み入れ、方向性指標と従来処理に
おける話者方向とからスペクトルサブトラクションを制
御して突発性雑音を抑圧するようにした点にある。
【0346】これによると、上述した方向性指標とビー
ムフォーマのフィルタの指向性から求めた話者方向との
両方に基づいて目的音/雑音の判定を行うことにより、
設定した話者範囲以外からの音声を除去できるととも
に、突発雑音など、継続時間の短い信号も高精度で除去
できるようになるため、実環境における雑音抑圧処理を
極めて高精度に行うことが可能となる。
【0347】また、第1及び第2のビームフォーマとし
て、周波数領域で動作するビームフォーマを用いるよう
にしたことによって、計算量を大幅に削減することがで
きるようになる。
【0348】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
【0349】すなわち、従来技術では、ビームフォーマ
で抑圧できない拡散性雑音の抑圧処理のために、スペク
トルサブトラクション(以後、SSと略称する)処理
を、ビームフォーマ処理の後に行うようにしており、こ
のSSは周波数スペクトルを入力とするため、FFT
(高速フーリエ変換)などの周波数分析が従来必要であ
ったが、周波数領域で動作するビームフォーマを用いる
と当該ビームフォーマからは周波数スペクトルが出力さ
れるため、これをSSに流用できるので、特別にSSの
ためのFFTを実施する従来のFFT処理工程は省略す
ることができる。故に、全体の演算量を大幅に削減する
ことができる。
【0350】また、ビームフォーマのフィルタを用いた
方向推定の際に必要であった時間領域から周波数領域へ
の変換処理も不要となり、全体の演算量を大幅に削減す
ることができる。
【0351】また、本発明は第2には、話者の音声を異
なる2箇所以上の位置で受音してそれぞれ音声信号とし
て出力する音声入力手段と、前記受音位置に対応する音
声信号のチャネル毎に周波数分析を行ってそれぞれチャ
ネル別の周波数成分を出力する周波数分析手段と、この
周波数分析手段にて得られる前記複数チャネルの周波数
成分について、所望方向外の感度が低くなるように計算
したフィルタ係数を用いての適応フィルタ処理を施すこ
とにより前記話者方向からの音声以外の音声を抑圧する
到来雑音抑圧処理を行い、目的音声成分を得る第1のビ
ームフォーマ処理手段と、前記周波数分析手段にて得ら
れる前記複数チャネルの周波数成分について、所望方向
外の感度が低くなるように計算したフィルタ係数を用い
ての適応フィルタ処理を施すことにより前記話者方向か
らの音声を抑圧し、第1の雑音成分を得る第2のビーム
フォーマ処理手段と、前記周波数分析手段にて得られる
前記複数チャネルの周波数成分について、所望方向外の
感度が低くなるように計算したフィルタ係数を用いての
適応フィルタ処理を施すことにより前記話者方向からの
音声を抑圧し、第2の雑音成分を得る第2のビームフォ
ーマ処理手段と、前記第1のビームフォーマ処理手段で
計算されるフィルタ係数から雑音方向を推定する雑音方
向推定手段と、前記第2のビームフォーマ処理手段で計
算されるフィルタ係数から第1の目的音方向を推定する
第1の目的音方向推定手段と、前記第3の適応ビームフ
ォーマ処理手段で計算されるフィルタ係数から第2の目
的音方向を推定する第2の目的音方向推定手段と、前記
第1のビームフォーマ処理手段において入力対象とする
目的音の到来方向である第1の入力方向を、前記第1の
目的音方向推定手段で推定された第1の目的音方向と、
第2の目的音方向推定手段で推定された第2の目的音方
向のいずれか一方または両方に基づいて逐次修正する第
1の入力方向修正手段と、前記雑音方向修正手段で推定
された雑音方向が所定の第1の範囲にある場合に、前記
第2のビームフォーマ処理手段において入力対象とする
雑音の到来方向である第2の入力方向を該雑音方向に基
づいて逐次修正する第2の入力方向修正手段と、前記雑
音方向修正手段で推定された雑音方向が所定の第2の範
囲にある場合に、前記第3のビームフォーマ処理手段に
おいて入力対象とする雑音の到来方向である第3の入力
方向を該雑音方向に基づいて逐次修正する第3の入力方
向修正手段と、前記雑音方向推定手段で推定された雑音
方向が所定の第1の範囲から到来したか所定の第2の範
囲から到来したかに基づいて前記第1および第2の出力
雑音のいずれか一方を真の雑音出力と決定していずれか
一方の雑音を出力すると同時に、第1の音声方向推定手
段と第2の音声方向推定手段のいずれの推定結果が有効
であるかを決定していずれか一方の音声方向推定結果を
第1の入力方向修正手段へ出力する有効雑音決定手段
と、前記第1のビームフォーマ処理手段の出力と第2の
ビームフォーマ処理手段の出力に基づいて非線形の雑音
抑圧処理であるスペクトルサブトラクション処理を行う
スペクトルサブトラクション手段と、前記周波数分析手
段から出力された周波数成分から到来音の時間差と振幅
の差に基づいた方向性の指標を計算する方向性検出手段
と、該方向性指標と前記目的音方向推定手段から出力さ
れた目的音方向とに基づいて前記スペクトルサブトラク
ション手段のスペクトルサブトラクション処理を制御す
るスペクトルサブトラクション制御手段とを具備して構
成した。
【0352】この構成の場合、話者の発声した音声を異
なる2箇所以上の位置で音声入力手段は受音し、周波数
分析手段では、これを前記受音位置に対応する音声信号
のチャネル毎に周波数分析して複数チャネルの周波数成
分を出力する。そして、第1のビームフォーマ処理手段
はこの周波数分析手段にて得られる前記複数チャネルの
周波数成分について、所望方向外の感度が低くなるよう
に計算したフィルタ係数を用いての適応フィルタ処理を
施すことにより前記話者方向からの音声以外の音声を抑
圧する到来雑音抑圧処理を行い、目的音声成分を得、ま
た、第2のビームフォーマ処理手段は、前記周波数分析
手段にて得られる前記複数チャネルの周波数成分につい
て、所望方向外の感度が低くなるように計算したフィル
タ係数を用いての適応フィルタ処理を施すことにより前
記話者方向からの音声を抑圧し、雑音成分を得る。そし
て、雑音方向推定手段は、前記第1のビームフォーマ処
理手段で計算されるフィルタ係数から雑音方向を推定
し、目的音方向推定手段は、前記第2のビームフォーマ
処理手段で計算されるフィルタ係数から目的音方向を推
定する。
【0353】また、第1の目的音方向推定手段は前記第
2のビームフォーマ処理手段で計算されるフィルタ係数
から第1の目的音方向を推定し、第2の目的音方向推定
手段は、前記第3の適応ビームフォーマ処理手段で計算
されるフィルタ係数から第2の目的音方向を推定する。
【0354】第1の入力方向修正手段は、前記第1のビ
ームフォーマにおいて入力対象とする目的音の到来方向
である第1の入力方向を、前記第1の目的音方向推定手
段で推定された第1の目的音方向と、第2の目的音方向
推定手段で推定された第2の目的音方向のいずれか一方
または両方に基づいて逐次修正する。そして、第2の入
力方向修正手段は、前記雑音方向修正手段で推定された
雑音方向が所定の第1の範囲にある場合に、前記第2の
ビームフォーマにおいて入力対象とする雑音の到来方向
である第2の入力方向を該雑音方向に基づいて逐次修正
し、第3の入力方向修正手段は、前記雑音方向修正手段
で推定された雑音方向が所定の第2の範囲にある場合
に、前記第3のビームフォーマにおいて入力対象とする
雑音の到来方向である第3の入力方向を該雑音方向に基
づいて逐次修正する。
【0355】従って、第2の入力方向修正手段の出力に
より第2の入力方向を修正される第2のビームフォーマ
は第2の入力方向以外から到来する成分を抑圧して残り
の雑音成分を抽出することになり、また、第3の入力方
向修正手段の出力により第3の入力方向を修正される第
3のビームフォーマは第3の入力方向以外から到来する
成分を抑圧して残りの雑音成分を抽出することになる。
【0356】そして、有効雑音決定手段は、前記雑音方
向推定手段で推定された雑音方向が所定の第1の範囲か
ら到来したか所定の第2の範囲から到来したかに基づい
て前記第1の出力雑音と前記第2の出力雑音のいずれか
一方を真の雑音出力と決定していずれか一方の雑音を出
力すると同時に、第1の音声方向推定手段と第2の音声
方向推定手段のいずれの推定結果が有効であるかを決定
して有効な方の音声方向推定結果を第1の入力方向修正
手段へ出力する。
【0357】この結果、目的音方向修正手段は、前記第
1のビームフォーマにおいて入力対象となる目的音の到
来方向である第1の入力方向を、前記決定した方の目的
音方向推定手段で得た目的音方向に基づいて逐次修正す
るので、第1のビームフォーマは第1の入力方向以外か
ら到来する雑音成分を抑圧して話者の音声成分を低雑音
で抽出することになる。
【0358】このように本システムは雑音成分を抑圧し
た音声周波数成分と、音声成分を抑圧した雑音周波数成
分とを別々に得ることができるが、この発明の最大の特
徴は、第1及び第2のビームフォーマとして、周波数領
域で動作するビームフォーマを用いるようにした点、そ
して、本発明では、突発性の雑音にも対処できるよう
に、短時間データを用いて到来音が目的方向から到来し
たかどうかを決めるための方向性の指標を高精度に求め
る方向性検出手段を組み入れ、方向性指標と従来処理に
おける話者方向とからスペクトルサブトラクションを制
御して突発性雑音を抑圧するようにした点にある。
【0359】これによると、上述した方向性指標とビー
ムフォーマのフィルタの指向性から求めた話者方向との
両方に基づいて目的音/雑音の判定を行うことにより、
設定した話者範囲以外からの音声を除去できるととも
に、突発雑音など、継続時間の短い信号も高精度で除去
できるようになるため、実環境における雑音抑圧処理を
極めて高精度に行うことが可能となる。
【0360】また、第1及び第2のビームフォーマとし
て、周波数領域で動作するビームフォーマを用いるよう
にしたことによって、計算量を大幅に削減することがで
きるようになる。
【0361】そしてこの発明によると、適応フィルタの
処理量が大幅に低減されるのに加え、入力音声に対する
周波数分析以外の周波数分析処理を省略することがで
き、かつ、フィルタ演算時に必要であった時間領域から
周波数領域ヘの変換処理も不要となり、全体の演算量を
大幅に削減することができる。
【0362】また、本発明では、雑音追尾に監視領域を
全く異ならせた雑音追尾用のビームフォーマを設けてあ
り、それぞれの出力からそれぞれ音声方向を推定させる
と共に、それぞれの推定結果からいずれが有効な雑音追
尾をしているかを判断して、有効と判断された方のビー
ムフォーマのフィルタ係数による音声方向の推定結果を
第1の目的音方向修正手段に与えることで第1の目的音
方向修正手段は、前記第1のビームフォーマにおいて入
力対象となる目的音の到来方向である第1の入力方向
を、前記目的音方向推定手段で推定された目的音方向に
基づいて逐次修正するので、第1のビームフォーマは第
1の入力方向以外から到来する雑音成分を抑圧して話者
の音声成分を低雑音で抽出することができ、雑音源が移
動してもこれを見失うことなく追尾して抑圧することが
できるようになるものである。
【0363】従来技術においては、2ch、すなわち、
2本のマイクロホンだけでも目的音源の追尾を可能とす
べく、雑音追尾用のビームフォーマを雑音抑圧のビーム
フォーマとは別に1個用いるが、例えば、雑音源が目的
音の方向を横切って移動したような場合、雑音の追尾精
度が低下することがあった。
【0364】しかし、本発明では、雑音を追尾するビー
ムフォーマを複数用いて各々別個の追尾範囲を受け持つ
ようにしたことにより、上記のような場合でも追尾精度
の低下を抑止できるようになる。
【0365】尚、本発明は上述した実施例に限定される
ものではなく、種々変形して実施可能である。
【0366】
【発明の効果】以上、詳述したように、本発明によれ
ば、全体の演算量を大幅に削減することができ、また、
ビームフォーマのフィルタを用いた方向推定の際に必要
であった時間領域から周波数領域への変換処理も不要と
なり、全体の演算量を大幅に削減することができると云
う効果が得られる。
【0367】また、本発明では、雑音成分を取り出すビ
ームフォーマを用意して、このビームフォーマの出力を
用いるようにしたため、位相のずれは補正されており、
従って、非定常雑音の場合でも高精度なスペクトルサブ
トラクション処理を実現できる。さらに、周波数領域の
ビームフォーマの出力を利用しているため、周波数分析
を省略してスペクトルサブトラクションが可能であり、
従来より少ない演算量で非定常雑音を抑圧できて、方向
性のある雑音成分ばかりか、方向性のない雑音成分(背
景雑音)も抑圧できて歪みの少い音声成分の抽出ができ
るようになると云う効果が得られる。
【0368】特に本発明は方向性指標とビームフォーマ
のフィルタの指向性から求めた話者方向との両方に基づ
いて目的音/雑音の判定を行うようにしたことにより、
設定した話者範囲以外からの音声を除去できるととも
に、突発雑音など、継続時間の短い信号も高精度で除去
できるようになるため、実環境における雑音抑圧処理を
極めて高精度に行うことが可能となる。
【図面の簡単な説明】
【図1】本発明を説明するための図であって、本発明の
基本構成例を示す全体構成ブロック図である。
【図2】本発明を説明するための図であって、本発明シ
ステムで用いるスペクトルサブトラクション処理制御部
の処理の流れを示すフローチャートである。
【図3】本発明を説明するための図であって、本発明シ
ステムで用いる話者追尾マイクロホンアレイ10の構成
例の全体構成を示すブロック図である。
【図4】本発明を説明するための図であって、本発明シ
ステムで用いるビームフォーマの構成例と動作例を説明
する図である。
【図5】本発明を説明するための図であって、本発明シ
ステムで用いる方向推定部の作用を説明するためのフロ
ーチャートである。
【図6】本発明を説明するための図であって、本発明シ
ステムの作用を説明するためのフローチャートである。
【図7】本発明を説明するための図であって、本発明シ
ステムの別の構成例を示す全体構成ブロック図である。
【図8】本発明を説明するための図であって、本発明シ
ステムの構成例2におけるビームフォーマの追尾範囲を
説明するための図である。
【図9】本発明を説明するための図であって、本発明シ
ステムの構成例2におけるシステムの作用を説明するた
めのフローチャートである。
【図10】本発明を説明するための図であって、本発明
システムにて用いるスペクトルサブトラクション(S
S)処理部30の構成例を示すブロック図である。
【図11】本発明を説明するための図であって、本発明
システムにて用いるスペクトルサブトラクション(S
S)処理部30の作用を説明するためのフローチャート
である。
【図12】本発明を説明するための図であって、本発明
システムにて用いる方向性検出部の構成例を示すブロッ
ク図である。
【図13】本発明を説明するための図であって、本発明
システムにて用いる方向性指標検出部の処理の流れを示
す図である。
【図14】本発明を説明するための図であって、本発明
システムにて用いる方向性検出部の別の構成例を示すブ
ロック図である。
【図15】本発明を説明するための図であって、本発明
システムにて用いる方向性指標検出部の処理の流れを示
す図である。
【図16】本発明を説明するための図であって、本発明
システムの別の具体的構成例を示すブロック図である。
【図17】本発明を説明するための図であって、本発明
システムにて用いるマイクロホンアレイの全体処理の流
れを示す図である。
【図18】本発明を説明するための図であって、本発明
システムの別の具体的構成例を示すブロック図である。
【図19】本発明を説明するための図であって、本発明
システムにて用いるスペクトルサブトラクション(S
S)処理部30の別の構成例を示すブロック図である。
【図20】本発明を説明するための図であって、本発明
システムにて用いる図19の構成のスペクトルサブトラ
クション(SS)処理部30の作用を説明するためのフ
ローチャートである。
【符号の説明】
10…話者追尾マイクロホンアレイ 11…音声入力部 12…周波数解析部 13…第1のビームフォーマ 14…第1の入力方向修正部 15…第2の入力方向修正部 16…第2のビームフォーマ 17…雑音方向推定部 18…第1の音声方向推定部(目的音方向推定部) 21…第3の入力方向修正部 22…第3のビームフォーマ 23…第2の音声方向推定部 24…有効雑音決定部 30…スペクトルサブトラクション(SS)処理部 31…音声帯域パワー計算部 32…雑音帯域パワー計算部 33…帯域重み計算部 34…スペクトル減算部 35…入力信号帯域パワー計算部 40…方向検出部 50…スペクトルサブトラクション制御部。

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】話者の音声を異なる2箇所以上の位置で受
    音してそれぞれ音声信号として出力する音声入力手段
    と、 前記受音位置に対応する音声信号のチャネル毎に周波数
    分析を行ってそれぞれチャネル別の周波数成分を出力す
    る周波数分析手段と、 前記周波数分析手段の出力する複数チャネルの周波数成
    分を用いて適応フィルタ処理により目的の音声以外の到
    来雑音の抑圧処理を行い、目的音声成分の信号を出力す
    る第1のビームフォーマ処理手段と、 前記周波数分析手段の出力する複数チャネルの周波数成
    分を用いて適応フィルタ処理により目的の音声の抑圧処
    理を行って雑音成分の信号を出力する第2のビームフォ
    ーマ処理手段と、 前記第1のビームフォーマ処理手段で計算されるフィル
    タ係数から雑音方向を推定する雑音方向推定手段と、 前記第2のビームフォーマ処理手段で計算されるフィル
    タ係数から目的音方向を推定する目的音方向推定手段
    と、 前記第1のビームフォーマ処理手段において入力対象と
    する目的音の到来方向である第1の入力方向を、前記目
    的音方向推定手段で推定された目的音方向に基づいて逐
    次修正する第1の入力方向修正手段と、 前記第2のビームフォーマ処理手段において入力対象と
    する雑音の到来方向である第2の入力方向を、前記雑音
    方向推定手段で推定された雑音方向に基づいて逐次修正
    する第2の入力方向修正手段と、 前記第1のビームフォーマ処理手段の出力と第2のビー
    ムフォーマ処理手段の出力に基づいて非線形の雑音抑圧
    処理であるスペクトルサブトラクション処理を行うスペ
    クトルサブトラクション手段と、 前記周波数分析手段から出力された周波数成分から到来
    音の時間差と振幅の差に基づいた方向性の指標を計算す
    る方向性検出手段と、 該方向性指標と前記目的音方向推定手段から出力された
    目的音方向とに基づいて前記スペクトルサブトラクショ
    ン手段のスペクトルサブトラクション処理を制御するス
    ペクトルサブトラクション制御手段とを具備し、目的の
    音声周波数成分を出力することを特徴とする雑音抑圧装
    置。
  2. 【請求項2】それぞれ指向性を有する複数のマイクロホ
    ンを、その指向方向の軸を互いに傾けて配置してなり、
    話者の音声を音声信号として得る音声入力手段と、 この音声入力手段の前記各マイクロホン毎にその音声信
    号を周波数分析してチャネル別に周波数成分を出力する
    周波数分析手段と、 前記周波数分析手段の出力する複数チャネルの周波数成
    分を用いて適応フィルタ処理により目的の音声以外の到
    来雑音の抑圧処理を行い、目的音声成分の信号を出力す
    る第1のビームフォーマ処理手段と、 前記周波数分析手段の出力する複数チャネルの周波数成
    分を用いて適応フィルタ処理により目的の音声の抑圧処
    理を行って雑音成分の信号を出力する第2のビームフォ
    ーマ処理手段と、 前記第1のビームフォーマ処理手段で計算されるフィル
    タ係数から雑音方向を推定する雑音方向推定手段と、 前記第2のビームフォーマ処理手段で計算されるフィル
    タ係数から目的音方向を推定する目的音方向推定手段
    と、 前記第1のビームフォーマ処理手段において入力対象と
    する目的音の到来方向である第1の入力方向を、前記目
    的音方向推定手段で推定された目的音方向に基づいて逐
    次修正する第1の入力方向修正手段と、 前記第2のビームフォーマ処理手段において入力対象と
    する雑音の到来方向である第2の入力方向を、前記雑音
    方向推定手段で推定された雑音方向に基づいて逐次修正
    する第2の入力方向修正手段と、 前記第1のビームフォーマ処理手段の出力と第2のビー
    ムフォーマ処理手段の出力に基づいて非線形の雑音抑圧
    処理であるスペクトルサブトラクション処理を行うスペ
    クトルサブトラクション手段と、 前記周波数分析手段の出力する各チャネルの周波数成分
    のうち、2チャネル分の周波数成分の位相差に基づき、
    チャネル信号間の時間差に対応した量である位相差相当
    量を計算する位相差相当量計算手段、前記2チャネル分
    の周波数成分からチャネル間のパワー比を計算するチャ
    ネル間パワー比計算手段、前記位相差相当量計算手段で
    求めた位相相当量と前記チャネル間パワー比計算手段で
    求めたチャネル間パワー比とに基づいて方向性指標を計
    算する方向性計算手段とからなる方向性検出手段と、 この方向性検出手段の求めた方向性指標と前記目的音方
    向推定手段から出力された目的音方向とに基づいて前記
    スペクトルサブトラクション手段の処理を制御するスペ
    クトルサブトラクション制御手段とを具備し、目的の音
    声周波数成分を出力することを特徴とする雑音成分抑圧
    装置。
  3. 【請求項3】それぞれ指向性を有する複数のマイクロホ
    ンを、その指向方向の軸を互いに傾けて配置してなり、
    話者の音声を音声信号として得る音声入力手段と、 この音声入力手段の前記各マイクロホン毎にその音声信
    号を周波数分析してチャネル別に周波数成分を出力する
    周波数分析手段と、 前記周波数分析手段の出力する複数チャネルの周波数成
    分を用いて適応フィルタ処理により目的の音声以外の到
    来雑音の抑圧処理を行い、目的音声成分の信号を出力す
    る第1のビームフォーマ処理手段と、 前記周波数分析手段の出力する複数チャネルの周波数成
    分を用いて適応フィルタ処理により目的の音声の抑圧処
    理を行って雑音成分の信号を出力する第2のビームフォ
    ーマ処理手段と、 前記第1のビームフォーマ処理手段で計算されるフィル
    タ係数から雑音方向を推定する雑音方向推定手段と、 前記第2のビームフォーマ処理手段で計算されるフィル
    タ係数から目的音方向を推定する目的音方向推定手段
    と、 前記第1のビームフォーマ処理手段において入力対象と
    する目的音の到来方向である第1の入力方向を、前記目
    的音方向推定手段で推定された目的音方向に基づいて逐
    次修正する第1の入力方向修正手段と、 前記第2のビームフォーマ処理手段において入力対象と
    する雑音の到来方向である第2の入力方向を、前記雑音
    方向推定手段で推定された雑音方向に基づいて逐次修正
    する第2の入力方向修正手段と、 前記第1のビームフォーマ処理手段の出力と第2のビー
    ムフォーマ処理手段の出力に基づいて非線形の雑音抑圧
    処理であるスペクトルサブトラクション処理を行うスペ
    クトルサブトラクション手段と、 複数チャネルの周波数成分のうちの2チャネルの周波数
    成分から、それらの周波数成分の大きさを正規化するス
    ペクトル正規化手段および前記スペクトル正規化手段に
    おいて正規化した2チャネルの周波数成分からそれらの
    差の成分のパワーを計算して当該差スペクトルのパワー
    を方向性指標として得るチャネル間スペクトル差計算手
    段とからなる方向性検出手段と、 この方向性検出手段の求めた方向性指標と前記目的音方
    向推定手段から出力された目的音方向とに基づいて前記
    スペクトルサブトラクション手段の処理を制御するスペ
    クトルサブトラクション制御手段と、 を具備し、目的の音声周波数成分を出力することを特徴
    とする雑音成分抑圧装置。
  4. 【請求項4】話者の音声を異なる2箇所以上の位置で受
    音してそれぞれ音声信号として出力する音声入力手段
    と、 前記受音位置に対応する音声信号のチャネル毎に周波数
    分析を行ってそれぞれチャネル別の周波数成分を出力す
    る周波数分析手段と、 この周波数分析手段にて得られる前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声以外の音声を抑圧
    する到来雑音抑圧処理を行い、目的音声成分を得る第1
    のビームフォーマ処理手段と、 前記周波数分析手段にて得られる前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声を抑圧し、第1の
    雑音成分を得る第2のビームフォーマ処理手段と、 前記周波数分析手段にて得られる前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声を抑圧し、第2の
    雑音成分を得る第2のビームフォーマ処理手段と、 前記第1のビームフォーマ処理手段で計算されるフィル
    タ係数から雑音方向を推定する雑音方向推定手段と、 前記第2のビームフォーマ処理手段で計算されるフィル
    タ係数から第1の目的音方向を推定する第1の目的音方
    向推定手段と、 前記第3の適応ビームフォーマ処理手段で計算されるフ
    ィルタ係数から第2の目的音方向を推定する第2の目的
    音方向推定手段と、 前記第1のビームフォーマ処理手段において入力対象と
    する目的音の到来方向である第1の入力方向を、前記第
    1の目的音方向推定手段で推定された第1の目的音方向
    と、第2の目的音方向推定手段で推定された第2の目的
    音方向のいずれか一方または両方に基づいて逐次修正す
    る第1の入力方向修正手段と、 前記雑音方向修正手段で推定された雑音方向が所定の第
    1の範囲にある場合に、前記第2のビームフォーマ処理
    手段において入力対象とする雑音の到来方向である第2
    の入力方向を該雑音方向に基づいて逐次修正する第2の
    入力方向修正手段と、 前記雑音方向修正手段で推定された雑音方向が所定の第
    2の範囲にある場合に、前記第3のビームフォーマ処理
    手段において入力対象とする雑音の到来方向である第3
    の入力方向を該雑音方向に基づいて逐次修正する第3の
    入力方向修正手段と、 前記雑音方向推定手段で推定された雑音方向が所定の第
    1の範囲から到来したか所定の第2の範囲から到来した
    かに基づいて前記第1および第2の出力雑音のいずれか
    一方を真の雑音出力と決定していずれか一方の雑音を出
    力すると同時に、第1の音声方向推定手段と第2の音声
    方向推定手段のいずれの推定結果が有効であるかを決定
    していずれか一方の音声方向推定結果を第1の入力方向
    修正手段へ出力する有効雑音決定手段と、 前記第1のビームフォーマ処理手段の出力と第2のビー
    ムフォーマ処理手段の出力に基づいて非線形の雑音抑圧
    処理であるスペクトルサブトラクション処理を行うスペ
    クトルサブトラクション手段と、 前記周波数分析手段から出力された周波数成分から到来
    音の時間差と振幅の差に基づいた方向性の指標を計算す
    る方向性検出手段と、 該方向性指標と前記目的音方向推定手段から出力された
    目的音方向とに基づいて前記スペクトルサブトラクショ
    ン手段のスペクトルサブトラクション処理を制御するス
    ペクトルサブトラクション制御手段とを具備し、目的の
    音声周波数成分を出力することを特徴とする雑音成分抑
    圧装置。
  5. 【請求項5】それぞれ指向性を有する複数のマイクロホ
    ンを、その指向方向の軸を互いに傾けて配置してなり、
    話者の音声を音声信号として得る音声入力手段と、 この音声入力手段の前記各マイクロホン毎にその音声信
    号を周波数分析してチャネル別に周波数成分を出力する
    周波数分析手段と、 この周波数分析手段にて得られる前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声以外の音声を抑圧
    する到来雑音抑圧処理を行い、目的音声成分を得る第1
    のビームフォーマ処理手段と、 前記周波数分析手段にて得られる前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声を抑圧し、第1の
    雑音成分を得る第2のビームフォーマ処理手段と、 前記周波数分析手段にて得られる前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声を抑圧し、第2の
    雑音成分を得る第2のビームフォーマ処理手段と、 前記第1のビームフォーマ処理手段で計算されるフィル
    タ係数から雑音方向を推定する雑音方向推定手段と、 前記第2のビームフォーマ処理手段で計算されるフィル
    タ係数から第1の目的音方向を推定する第1の目的音方
    向推定手段と、 前記第3の適応ビームフォーマ処理手段で計算されるフ
    ィルタ係数から第2の目的音方向を推定する第2の目的
    音方向推定手段と、 前記第1のビームフォーマ処理手段において入力対象と
    する目的音の到来方向である第1の入力方向を、前記第
    1の目的音方向推定手段で推定された第1の目的音方向
    と、第2の目的音方向推定手段で推定された第2の目的
    音方向のいずれか一方または両方に基づいて逐次修正す
    る第1の入力方向修正手段と、 前記雑音方向修正手段で推定された雑音方向が所定の第
    1の範囲にある場合に、前記第2のビームフォーマ処理
    手段において入力対象とする雑音の到来方向である第2
    の入力方向を該雑音方向に基づいて逐次修正する第2の
    入力方向修正手段と、 前記雑音方向修正手段で推定された雑音方向が所定の第
    2の範囲にある場合に、前記第3のビームフォーマ処理
    手段において入力対象とする雑音の到来方向である第3
    の入力方向を該雑音方向に基づいて逐次修正する第3の
    入力方向修正手段と、 前記雑音方向推定手段で推定された雑音方向が所定の第
    1の範囲から到来したか所定の第2の範囲から到来した
    かに基づいて前記第1および第2の出力雑音のいずれか
    一方を真の雑音出力と決定していずれか一方の雑音を出
    力すると同時に、第1の音声方向推定手段と第2の音声
    方向推定手段のいずれの推定結果が有効であるかを決定
    していずれか一方の音声方向推定結果を第1の入力方向
    修正手段へ出力する有効雑音決定手段と、 前記第1のビームフォーマ処理手段の出力と第2のビー
    ムフォーマ処理手段の出力に基づいて非線形の雑音抑圧
    処理であるスペクトルサブトラクション処理を行うスペ
    クトルサブトラクション手段と、 前記周波数分析手段の出力する各チャネルの周波数成分
    のうち、2チャネル分の周波数成分の位相差に基づき、
    チャネル信号間の時間差に対応した量である位相差相当
    量を計算する位相差相当量計算手段、前記2チャネル分
    の周波数成分からチャネル間のパワー比を計算するチャ
    ネル間パワー比計算手段、前記位相差相当量計算手段で
    求めた位相相当量と前記チャネル間パワー比計算手段で
    求めたチャネル間パワー比とに基づいて方向性指標を計
    算する方向性計算手段とからなる方向性検出手段と、 この方向性検出手段の求めた方向性指標と前記目的音方
    向推定手段から出力された目的音方向とに基づいて前記
    スペクトルサブトラクション手段のスペクトルサブトラ
    クション処理を制御するスペクトルサブトラクション制
    御手段とを具備し、目的の音声周波数成分を出力するこ
    とを特徴とする雑音成分抑圧装置。
  6. 【請求項6】それぞれ指向性を有する複数のマイクロホ
    ンを、その指向方向の軸を互いに傾けて配置してなり、
    話者の音声を音声信号として得る音声入力手段と、 この音声入力手段の前記各マイクロホン毎にその音声信
    号を周波数分析してチャネル別に周波数成分を出力する
    周波数分析手段と、 この周波数分析手段にて得られる前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声以外の音声を抑圧
    する到来雑音抑圧処理を行い、目的音声成分を得る第1
    のビームフォーマ処理手段と、 前記周波数分析手段にて得られる前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声を抑圧し、第1の
    雑音成分を得る第2のビームフォーマ処理手段と、 前記周波数分析手段にて得られる前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声を抑圧し、第2の
    雑音成分を得る第2のビームフォーマ処理手段と、 前記第1のビームフォーマ処理手段で計算されるフィル
    タ係数から雑音方向を推定する雑音方向推定手段と、 前記第2のビームフォーマ処理手段で計算されるフィル
    タ係数から第1の目的音方向を推定する第1の目的音方
    向推定手段と、 前記第3の適応ビームフォーマ処理手段で計算されるフ
    ィルタ係数から第2の目的音方向を推定する第2の目的
    音方向推定手段と、 前記第1のビームフォーマ処理手段において入力対象と
    する目的音の到来方向である第1の入力方向を、前記第
    1の目的音方向推定手段で推定された第1の目的音方向
    と、第2の目的音方向推定手段で推定された第2の目的
    音方向のいずれか一方または両方に基づいて逐次修正す
    る第1の入力方向修正手段と、 前記雑音方向修正手段で推定された雑音方向が所定の第
    1の範囲にある場合に、前記第2のビームフォーマ処理
    手段において入力対象とする雑音の到来方向である第2
    の入力方向を該雑音方向に基づいて逐次修正する第2の
    入力方向修正手段と、 前記雑音方向修正手段で推定された雑音方向が所定の第
    2の範囲にある場合に、前記第3のビームフォーマ処理
    手段において入力対象とする雑音の到来方向である第3
    の入力方向を該雑音方向に基づいて逐次修正する第3の
    入力方向修正手段と、 前記雑音方向推定手段で推定された雑音方向が所定の第
    1の範囲から到来したか所定の第2の範囲から到来した
    かに基づいて前記第1および第2の出力雑音のいずれか
    一方を真の雑音出力と決定していずれか一方の雑音を出
    力すると同時に、第1の音声方向推定手段と第2の音声
    方向推定手段のいずれの推定結果が有効であるかを決定
    していずれか一方の音声方向推定結果を第1の入力方向
    修正手段へ出力する有効雑音決定手段と、 前記第1のビームフォーマ処理手段の出力と第2のビー
    ムフォーマ処理手段の出力に基づいて非線形の雑音抑圧
    処理であるスペクトルサブトラクション処理を行うスペ
    クトルサブトラクション手段と、 複数チャネルの周波数成分のうちの2チャネルの周波数
    成分から、それらの周波数成分の大きさを正規化するス
    ペクトル正規化手段および前記スペクトル正規化手段に
    おいて正規化した2チャネルの周波数成分からそれらの
    差の成分のパワーを計算して当該差スペクトルのパワー
    を方向性指標として得るチャネル間スペクトル差計算手
    段とからなる方向性検出手段と、 この方向性検出手段の求めた方向性指標と前記目的音方
    向推定手段から出力された目的音方向とに基づいて前記
    スペクトルサブトラクション手段のスペクトルサブトラ
    クション処理を制御するスペクトルサブトラクション制
    御手段と、を具備し、目的の音声周波数成分を出力する
    ことを特徴とする雑音成分抑圧装置。
  7. 【請求項7】話者の音声を音声信号として得る音声入力
    手段は、それぞれ指向性を有する複数のマイクロホン
    を、その指向方向の軸を互いに傾けて配置した構成であ
    り、 周波数分析手段はこの音声入力手段の前記各マイクロホ
    ン毎にその音声信号を周波数分析してチャネル別に周波
    数成分を出力するものであることを特徴とする請求項1
    ないし6いずれか一項記載の雑音成分抑圧装置。
  8. 【請求項8】請求項1ないし6いずれか1項に記載の雑
    音成分抑圧装置において、 前記スペクトルサブトラクション手段は、 得られた音声周波数を、周波数帯域毎に分割して帯域毎
    の音声パワーを計算する音声帯域パワー計算手段と、 前記得られた雑音周波数成分を、周波数帯域毎に分割し
    て帯域毎の雑音パワーを計算する雑音帯域パワー計算手
    段と、 前記音声帯域パワー計算手段と雑音帯域パワー計算手段
    とから得られる音声と雑音の周波数帯域パワーおよび前
    記スペクトルサブトラクション制御手段の出力に基き、
    帯域重み係数を求める帯域重み計算手段と、 音声信号をその周波数帯域毎に前記帯域重み係数をかけ
    て背景雑音を抑圧するスペクトル減算手段と、から構成
    することを特徴とする雑音成分抑圧装置。
  9. 【請求項9】請求項1ないし6いずれか1項に記載の雑
    音成分抑圧装置において、 前記スペクトルサブトラクション手段は、 前記得られた音声周波数を、周波数帯域毎に分割して帯
    域毎の音声パワーを計算する音声帯域パワー計算手段
    と、 前記得られた雑音周波数成分を、周波数帯域毎に分割し
    て帯域毎の雑音パワーを計算する雑音帯域パワー計算手
    段と、 前記音声入力手段から得られた入力信号を周波数分析し
    た入力信号の周波数成分を周波数帯域毎に分割し、帯域
    毎の入力パワーを計算する入力帯域パワー計算手段と、 前記音声帯域パワー計算手段と雑音帯域パワー計算手段
    とから得られる音声と雑音の周波数帯域パワーおよび前
    記入力帯域パワー計算手段にて得られる帯域毎の入力パ
    ワー並びに前記スペクトルサブトラクション制御手段の
    出力に基き、帯域重み係数を求める帯域重み計算手段
    と、 音声信号の周波数帯域毎に前記帯域重み係数をかけて背
    景雑音を抑圧する修正スペクトル減算手段を具備するこ
    とを特徴とする雑音成分抑圧装置。
  10. 【請求項10】話者の音声を異なる2箇所以上の位置で
    受音してそれぞれ音声信号を得るステップと、 前記受音位置に対応する音声信号のチャネル毎に周波数
    分析を行ってそれぞれチャネル別の周波数成分を出力す
    る周波数分析ステップと、 この周波数分析ステップにて得られた複数チャネルの周
    波数成分を用いて適応フィルタ処理により目的の音声以
    外の到来雑音の抑圧処理を行い、目的音声成分の信号を
    出力する第1のビームフォーマ処理ステップと、 前記周波数分析ステップにて得られた複数チャネルの周
    波数成分を用いて適応フィルタ処理により目的の音声の
    抑圧処理を行って雑音成分の信号を出力する第2のビー
    ムフォーマ処理ステップと、 前記第1のビームフォーマ処理ステップで計算されるフ
    ィルタ係数から雑音方向を推定する雑音方向推定ステッ
    プと、 前記第2のビームフォーマ処理ステップで計算されるフ
    ィルタ係数から目的音方向を推定する目的音方向推定ス
    テップと、 前記第1のビームフォーマ処理ステップにおいて入力対
    象とする目的音の到来方向である第1の入力方向を、前
    記目的音方向推定ステップで推定された目的音方向に基
    づいて逐次修正する第1の入力方向修正ステップと、 前記第2のビームフォーマ処理ステップにおいて入力対
    象とする雑音の到来方向である第2の入力方向を、前記
    雑音方向推定ステップで推定された雑音方向に基づいて
    逐次修正する第2の入力方向修正ステップと、 前記第1のビームフォーマ処理ステップで得た出力と第
    2のビームフォーマ処理ステップで得た出力に基づいて
    非線形の雑音抑圧処理であるスペクトルサブトラクショ
    ン処理を行うスペクトルサブトラクション処理ステップ
    と、 前記周波数分析ステップにて得られた周波数成分から到
    来音の時間差と振幅の差に基づいた方向性の指標を計算
    する方向性検出ステップと、 該方向性指標と前記目的音方向推定ステップにて得られ
    た目的音方向とに基づいて前記スペクトルサブトラクシ
    ョン処理ステップのスペクトルサブトラクション処理を
    制御するスペクトルサブトラクション制御ステップとを
    具備し、目的の音声周波数成分を出力することを特徴と
    する雑音成分抑圧方法。
  11. 【請求項11】話者の音声を異なる2箇所以上の位置で
    受音してそれぞれ音声信号として出力する音声入力ステ
    ップと、 前記受音位置に対応する音声信号のチャネル毎に周波数
    分析を行ってそれぞれチャネル別の周波数成分を出力す
    る周波数分析ステップと、 この周波数分析ステップにて得られる前記複数チャネル
    の周波数成分について、所望方向外の感度が低くなるよ
    うに計算したフィルタ係数を用いての適応フィルタ処理
    を施すことにより前記話者方向からの音声以外の音声を
    抑圧する到来雑音抑圧処理を行い、目的音声成分を得る
    第1のビームフォーマ処理ステップと、 前記周波数分析ステップにて得た前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声を抑圧し、第1の
    雑音成分を得る第2のビームフォーマ処理ステップと、 前記周波数分析ステップにて得た前記複数チャネルの周
    波数成分について、所望方向外の感度が低くなるように
    計算したフィルタ係数を用いての適応フィルタ処理を施
    すことにより前記話者方向からの音声を抑圧し、第2の
    雑音成分を得る第2のビームフォーマ処理ステップと、 前記第1のビームフォーマ処理ステップで計算されるフ
    ィルタ係数から雑音方向を推定する雑音方向推定ステッ
    プと、 前記第2のビームフォーマ処理ステップで計算されるフ
    ィルタ係数から第1の目的音方向を推定する第1の目的
    音方向推定ステップと、 前記第3の適応ビームフォーマ処理手段で計算されるフ
    ィルタ係数から第2の目的音方向を推定する第2の目的
    音方向推定ステップと、 前記第1のビームフォーマ処理ステップにおいて入力対
    象とする目的音の到来方向である第1の入力方向を、前
    記第1の目的音方向推定手段で推定された第1の目的音
    方向と、第2の目的音方向推定ステップで推定された第
    2の目的音方向のいずれか一方または両方に基づいて逐
    次修正する第1の入力方向修正ステップと、 前記雑音方向修正ステップで推定された雑音方向が所定
    の第1の範囲にある場合に、前記第2のビームフォーマ
    処理ステップにおいて入力対象とする雑音の到来方向で
    ある第2の入力方向を該雑音方向に基づいて逐次修正す
    る第2の入力方向修正ステップと、 前記雑音方向修正ステップで推定された雑音方向が所定
    の第2の範囲にある場合に、前記第3のビームフォーマ
    処理ステップにおいて入力対象とする雑音の到来方向で
    ある第3の入力方向を該雑音方向に基づいて逐次修正す
    る第3の入力方向修正ステップと、 前記雑音方向推定ステップで推定された雑音方向が所定
    の第1の範囲から到来したか所定の第2の範囲から到来
    したかに基づいて前記第1および第2の出力雑音のいず
    れか一方を真の雑音出力と決定していずれか一方の雑音
    を出力すると同時に、第1の音声方向推定ステップと第
    2の音声方向推定手段のいずれの推定結果が有効である
    かを決定していずれか一方の音声方向推定結果を第1の
    入力方向修正手段へ出力する有効雑音決定ステップと、 前記第1のビームフォーマ処理ステップの出力と第2の
    ビームフォーマ処理ステップの出力に基づいて非線形の
    雑音抑圧処理であるスペクトルサブトラクション処理を
    行うスペクトルサブトラクション処理ステップと、 前記周波数分析ステップにて得た周波数成分から到来音
    の時間差と振幅の差に基づいた方向性の指標を計算する
    方向性検出ステップと、 該方向性指標と前記目的音方向推定ステップから出力さ
    れた目的音方向とに基づいて前記スペクトルサブトラク
    ション処理ステップでのスペクトルサブトラクション処
    理を制御するスペクトルサブトラクション制御ステップ
    とを具備し、目的の音声周波数成分を出力することを特
    徴とする雑音成分抑圧方法。
JP27330699A 1999-09-27 1999-09-27 雑音成分抑圧処理装置および雑音成分抑圧処理方法 Expired - Fee Related JP3484112B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27330699A JP3484112B2 (ja) 1999-09-27 1999-09-27 雑音成分抑圧処理装置および雑音成分抑圧処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27330699A JP3484112B2 (ja) 1999-09-27 1999-09-27 雑音成分抑圧処理装置および雑音成分抑圧処理方法

Publications (2)

Publication Number Publication Date
JP2001100800A true JP2001100800A (ja) 2001-04-13
JP3484112B2 JP3484112B2 (ja) 2004-01-06

Family

ID=17526040

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27330699A Expired - Fee Related JP3484112B2 (ja) 1999-09-27 1999-09-27 雑音成分抑圧処理装置および雑音成分抑圧処理方法

Country Status (1)

Country Link
JP (1) JP3484112B2 (ja)

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008054071A (ja) * 2006-08-25 2008-03-06 Hitachi Communication Technologies Ltd 紙擦れ音除去装置
JP2008131183A (ja) * 2006-11-17 2008-06-05 Univ Waseda 音源分離装置、音源分離方法、音源分離プログラム及び記録媒体
WO2009001886A1 (ja) * 2007-06-27 2008-12-31 Nec Corporation 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
JPWO2007018293A1 (ja) * 2005-08-11 2009-02-19 旭化成株式会社 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
WO2009044509A1 (ja) * 2007-10-01 2009-04-09 Panasonic Corporation 音源方向検知装置
JP2009134102A (ja) * 2007-11-30 2009-06-18 Kobe Steel Ltd 目的音抽出装置,目的音抽出プログラム,目的音抽出方法
JP2010020165A (ja) * 2008-07-11 2010-01-28 Fujitsu Ltd 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム
US7680667B2 (en) 2004-12-24 2010-03-16 Kabuhsiki Kaisha Toshiba Interactive robot, speech recognition method and computer program product
JP2010071920A (ja) * 2008-09-22 2010-04-02 Institute Of Nuclear Safety System Inc 超音波探傷法、該方法に用いる超音波探傷プログラム、及び該プログラムを記録した記録媒体
JP2010124370A (ja) * 2008-11-21 2010-06-03 Fujitsu Ltd 信号処理装置、信号処理方法、および信号処理プログラム
JP2011007861A (ja) * 2009-06-23 2011-01-13 Fujitsu Ltd 信号処理装置、信号処理方法、および信号処理プログラム
JP2011099967A (ja) * 2009-11-05 2011-05-19 Fujitsu Ltd 音信号処理方法および音信号処理装置
JP2011124872A (ja) * 2009-12-11 2011-06-23 Oki Electric Industry Co Ltd 音源分離装置、方法及びプログラム
JP2011124873A (ja) * 2009-12-11 2011-06-23 Oki Electric Industry Co Ltd 音源分離装置、方法及びプログラム
JP2011139378A (ja) * 2009-12-28 2011-07-14 Fujitsu Ltd 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
JP2011244232A (ja) * 2010-05-19 2011-12-01 Fujitsu Ltd マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
WO2012015569A1 (en) * 2010-07-28 2012-02-02 Motorola Solutions, Inc. Formant aided noise cancellation using multiple microphones
WO2012026126A1 (ja) * 2010-08-25 2012-03-01 旭化成株式会社 音源分離装置、音源分離方法、及び、プログラム
JP2013546247A (ja) * 2010-10-29 2013-12-26 マイティワークス マルチビーム音響システム
JP2014157261A (ja) * 2013-02-15 2014-08-28 Nippon Telegr & Teleph Corp <Ntt> 音源分離装置、音源分離方法、およびプログラム
WO2016076123A1 (ja) * 2014-11-11 2016-05-19 ソニー株式会社 音声処理装置、音声処理方法、並びにプログラム
JP2016126022A (ja) * 2014-12-26 2016-07-11 アイシン精機株式会社 音声処理装置
US9842599B2 (en) 2013-09-20 2017-12-12 Fujitsu Limited Voice processing apparatus and voice processing method
JP2020041958A (ja) * 2018-09-13 2020-03-19 日本電気株式会社 音響特性計測装置、音響特性計測方法、およびプログラム
WO2020121590A1 (ja) * 2018-12-14 2020-06-18 日本電信電話株式会社 信号処理装置、信号処理方法、およびプログラム
JP2021505933A (ja) * 2017-12-06 2021-02-18 シナプティクス インコーポレイテッド 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調
EP3945519A1 (en) 2020-07-30 2022-02-02 Yamaha Corporation Filtering method, filtering device, and filtering program
US11694710B2 (en) 2018-12-06 2023-07-04 Synaptics Incorporated Multi-stream target-speech detection and channel fusion
US11823707B2 (en) 2022-01-10 2023-11-21 Synaptics Incorporated Sensitivity mode for an audio spotting system
US11937054B2 (en) 2020-01-10 2024-03-19 Synaptics Incorporated Multiple-source tracking and voice activity detections for planar microphone arrays

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5289128B2 (ja) * 2009-03-25 2013-09-11 株式会社東芝 信号処理方法、装置及びプログラム
JP2011191668A (ja) 2010-03-16 2011-09-29 Sony Corp 音声処理装置、音声処理方法およびプログラム
JP6182895B2 (ja) 2012-05-01 2017-08-23 株式会社リコー 処理装置、処理方法、プログラム及び処理システム
JP6197534B2 (ja) * 2013-09-26 2017-09-20 沖電気工業株式会社 音源分離装置、音源分離方法、及び音源分離プログラム
CN110999317A (zh) * 2017-08-10 2020-04-10 三菱电机株式会社 杂音去除装置以及杂音去除方法

Cited By (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680667B2 (en) 2004-12-24 2010-03-16 Kabuhsiki Kaisha Toshiba Interactive robot, speech recognition method and computer program product
JPWO2007018293A1 (ja) * 2005-08-11 2009-02-19 旭化成株式会社 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
US8112272B2 (en) 2005-08-11 2012-02-07 Asashi Kasei Kabushiki Kaisha Sound source separation device, speech recognition device, mobile telephone, sound source separation method, and program
JP2008054071A (ja) * 2006-08-25 2008-03-06 Hitachi Communication Technologies Ltd 紙擦れ音除去装置
JP2008131183A (ja) * 2006-11-17 2008-06-05 Univ Waseda 音源分離装置、音源分離方法、音源分離プログラム及び記録媒体
US9905242B2 (en) 2007-06-27 2018-02-27 Nec Corporation Signal analysis device, signal control device, its system, method, and program
WO2009001886A1 (ja) * 2007-06-27 2008-12-31 Nec Corporation 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
JP5556175B2 (ja) * 2007-06-27 2014-07-23 日本電気株式会社 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
WO2009044509A1 (ja) * 2007-10-01 2009-04-09 Panasonic Corporation 音源方向検知装置
US8155346B2 (en) 2007-10-01 2012-04-10 Panasonic Corpration Audio source direction detecting device
JP2009134102A (ja) * 2007-11-30 2009-06-18 Kobe Steel Ltd 目的音抽出装置,目的音抽出プログラム,目的音抽出方法
JP4493690B2 (ja) * 2007-11-30 2010-06-30 株式会社神戸製鋼所 目的音抽出装置,目的音抽出プログラム,目的音抽出方法
JP2010020165A (ja) * 2008-07-11 2010-01-28 Fujitsu Ltd 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム
US9135924B2 (en) 2008-07-11 2015-09-15 Fujitsu Limited Noise suppressing device, noise suppressing method and mobile phone
JP2010071920A (ja) * 2008-09-22 2010-04-02 Institute Of Nuclear Safety System Inc 超音波探傷法、該方法に用いる超音波探傷プログラム、及び該プログラムを記録した記録媒体
DE102009052539A1 (de) 2008-11-21 2010-07-01 Fujitsu Ltd., Kawasaki Signalverarbeitungseinheit, Signalverarbeitungsverfahren und Aufzeichnungsmedium
US8565445B2 (en) 2008-11-21 2013-10-22 Fujitsu Limited Combining audio signals based on ranges of phase difference
JP2010124370A (ja) * 2008-11-21 2010-06-03 Fujitsu Ltd 信号処理装置、信号処理方法、および信号処理プログラム
JP2011007861A (ja) * 2009-06-23 2011-01-13 Fujitsu Ltd 信号処理装置、信号処理方法、および信号処理プログラム
US8638952B2 (en) 2009-06-23 2014-01-28 Fujitsu Limited Signal processing apparatus and signal processing method
JP2011099967A (ja) * 2009-11-05 2011-05-19 Fujitsu Ltd 音信号処理方法および音信号処理装置
JP2011124873A (ja) * 2009-12-11 2011-06-23 Oki Electric Industry Co Ltd 音源分離装置、方法及びプログラム
JP2011124872A (ja) * 2009-12-11 2011-06-23 Oki Electric Industry Co Ltd 音源分離装置、方法及びプログラム
JP2011139378A (ja) * 2009-12-28 2011-07-14 Fujitsu Ltd 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
JP2011244232A (ja) * 2010-05-19 2011-12-01 Fujitsu Ltd マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
US8639499B2 (en) 2010-07-28 2014-01-28 Motorola Solutions, Inc. Formant aided noise cancellation using multiple microphones
WO2012015569A1 (en) * 2010-07-28 2012-02-02 Motorola Solutions, Inc. Formant aided noise cancellation using multiple microphones
WO2012026126A1 (ja) * 2010-08-25 2012-03-01 旭化成株式会社 音源分離装置、音源分離方法、及び、プログラム
JP2013546247A (ja) * 2010-10-29 2013-12-26 マイティワークス マルチビーム音響システム
JP2014157261A (ja) * 2013-02-15 2014-08-28 Nippon Telegr & Teleph Corp <Ntt> 音源分離装置、音源分離方法、およびプログラム
US9842599B2 (en) 2013-09-20 2017-12-12 Fujitsu Limited Voice processing apparatus and voice processing method
US10034088B2 (en) 2014-11-11 2018-07-24 Sony Corporation Sound processing device and sound processing method
WO2016076123A1 (ja) * 2014-11-11 2016-05-19 ソニー株式会社 音声処理装置、音声処理方法、並びにプログラム
JPWO2016076123A1 (ja) * 2014-11-11 2017-08-17 ソニー株式会社 音声処理装置、音声処理方法、並びにプログラム
JP2016126022A (ja) * 2014-12-26 2016-07-11 アイシン精機株式会社 音声処理装置
JP2021505933A (ja) * 2017-12-06 2021-02-18 シナプティクス インコーポレイテッド 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調
JP7324753B2 (ja) 2017-12-06 2023-08-10 シナプティクス インコーポレイテッド 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調
JP2020041958A (ja) * 2018-09-13 2020-03-19 日本電気株式会社 音響特性計測装置、音響特性計測方法、およびプログラム
JP7127448B2 (ja) 2018-09-13 2022-08-30 日本電気株式会社 音響特性計測装置、音響特性計測方法、およびプログラム
US11694710B2 (en) 2018-12-06 2023-07-04 Synaptics Incorporated Multi-stream target-speech detection and channel fusion
WO2020121590A1 (ja) * 2018-12-14 2020-06-18 日本電信電話株式会社 信号処理装置、信号処理方法、およびプログラム
JPWO2020121590A1 (ja) * 2018-12-14 2021-10-14 日本電信電話株式会社 信号処理装置、信号処理方法、およびプログラム
JP7115562B2 (ja) 2018-12-14 2022-08-09 日本電信電話株式会社 信号処理装置、信号処理方法、およびプログラム
US11937054B2 (en) 2020-01-10 2024-03-19 Synaptics Incorporated Multiple-source tracking and voice activity detections for planar microphone arrays
EP3945519A1 (en) 2020-07-30 2022-02-02 Yamaha Corporation Filtering method, filtering device, and filtering program
US11823707B2 (en) 2022-01-10 2023-11-21 Synaptics Incorporated Sensitivity mode for an audio spotting system

Also Published As

Publication number Publication date
JP3484112B2 (ja) 2004-01-06

Similar Documents

Publication Publication Date Title
JP2001100800A (ja) 雑音成分抑圧処理装置および雑音成分抑圧処理方法
JP4163294B2 (ja) 雑音抑圧処理装置および雑音抑圧処理方法
KR101610656B1 (ko) 널 프로세싱 노이즈 감산을 이용한 노이즈 억제 시스템 및 방법
US7613309B2 (en) Interference suppression techniques
US8660281B2 (en) Method and system for a multi-microphone noise reduction
US8965003B2 (en) Signal processing using spatial filter
CA2621940C (en) Method and device for binaural signal enhancement
US9002027B2 (en) Space-time noise reduction system for use in a vehicle and method of forming same
US8204252B1 (en) System and method for providing close microphone adaptive array processing
CN110140360B (zh) 使用波束形成的音频捕获的方法和装置
CN110249637B (zh) 使用波束形成的音频捕获装置和方法
Nakashima et al. Frequency domain binaural model based on interaural phase and level differences
Kamkar-Parsi et al. Instantaneous binaural target PSD estimation for hearing aid noise reduction in complex acoustic environments
EP1430472A2 (en) Selective sound enhancement
JPWO2007018293A1 (ja) 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
EP1131892A1 (en) Signal processing apparatus and method
GB2453118A (en) Generating a speech audio signal from multiple microphones with suppressed wind noise
WO2007123047A1 (ja) 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム
Kamkar-Parsi et al. Improved noise power spectrum density estimation for binaural hearing aids operating in a diffuse noise field environment
KR20070085193A (ko) 잡음제거 장치 및 방법
JP2019068133A (ja) 収音装置、プログラム及び方法
Van Compernolle et al. Beamforming with microphone arrays
Martın-Donas et al. A postfiltering approach for dual-microphone smartphones
JP2003044087A (ja) 騒音抑圧装置、騒音抑圧方法、音声識別装置、通信機器および補聴器
Freudenberger et al. Spectral combining for microphone diversity systems

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081017

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081017

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091017

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101017

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111017

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111017

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121017

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131017

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees