JP2003271191A - 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム - Google Patents

音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム

Info

Publication number
JP2003271191A
JP2003271191A JP2002072881A JP2002072881A JP2003271191A JP 2003271191 A JP2003271191 A JP 2003271191A JP 2002072881 A JP2002072881 A JP 2002072881A JP 2002072881 A JP2002072881 A JP 2002072881A JP 2003271191 A JP2003271191 A JP 2003271191A
Authority
JP
Japan
Prior art keywords
target sound
noise
spectrum information
unit
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002072881A
Other languages
English (en)
Inventor
Hiroshi Kanazawa
博史 金澤
Hitoshi Nagata
仁史 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002072881A priority Critical patent/JP2003271191A/ja
Priority to US10/387,580 priority patent/US20030177007A1/en
Publication of JP2003271191A publication Critical patent/JP2003271191A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

(57)【要約】 【課題】マイクロホンアレーを雑音の抑圧ではなく目的
音の抑圧に用いることにより、雑音の位置及び大きさを
確実に検出して、確実な雑音抑圧効果を得ると共に、高
精度の音声認識を可能にする。 【解決手段】目的音消去部13は、目的音を確実に消去
して、雑音成分のみを含む目的音消去信号を出力する。
目的音強調部14は、雑音成分をある程度除去した目的
音強調信号を出力する。雑音スペクトル情報抽出部15
は、目的音消去信号から雑音スペクトル情報を抽出し、
目的音スペクトル情報抽出部16は、目的音強調信号か
ら目的音スペクトル情報を抽出する。雑音重畳度推定部
17は、雑音スペクトル情報と目的音スペクトル情報と
から、雑音の重畳位置及び大きさを確実に検出して、雑
音重畳度を得る。スペクトル情報修正部は、正確に検出
された雑音の位置及び大きさを示す雑音重畳度の情報を
用いて、確実に目的音のスペクトル情報を修正する。こ
のスペクトル情報は雑音の影響が著しく低減されてお
り、音声認識の精度を向上させることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数のマイクロホ
ンを用いたマイクロホンアレーによって耐雑音性を向上
させた音声認識用雑音抑圧装置及び方法、音声認識装置
及び方法並びにプログラムに関する。
【0002】
【従来の技術】近年、音声認識技術の性能向上に伴い、
実環境における音声認識エンジンの実用化が活発になっ
てきている。特に、カーナビゲーションシステムやモバ
イル機器など入力装置が限定されるような状況におい
て、音声認識への期待は大きい。
【0003】音声認識処理は、マイクロホンから取込ん
だ入力音声を、認識対象語彙と比較することで音声認識
結果を得る。実環境下においては、種々の雑音源がある
ことから、マイクロホンで取込んだ音声信号には、環境
雑音が混入する。音声認識処理においては、耐雑音性が
認識精度に大きな影響を与える。
【0004】図16はこのような雑音抑圧技術としてス
ペクトルサブトラクション技術を採用して、入力1チャ
ネル信号に対して雑音を抑圧した音声出力を得る雑音抑
圧装置を示すブロック図である。
【0005】入力端子1,2には、夫々音声信号と雑音
信号とが入力される。入力された音声信号は入力音声ス
ペクトル情報抽出部3に与えられる。入力音声スペクト
ル情報抽出部3は、入力音声の特徴量(特徴ベクトル)
を入力信号スペクトルとして抽出する。
【0006】一方、入力された雑音信号は雑音スペクト
ル情報抽出部4に与えられる。雑音スペクトル情報抽出
部4は、雑音波形の特徴量(特徴ベクトル)を雑音信号
スペクトルとして抽出して、SN比推定部5に出力す
る。SN比推定部5は、入力信号スペクトルと雑音信号
スペクトルとから、SN比を推定してスペクトル情報修
正部6に出力する。
【0007】スペクトル情報修正部6には入力音声スペ
クトル情報抽出部から入力信号スペクトルも与えられて
おり、スペクトル情報修正部6は、入力信号スペクトル
から雑音重畳分を除去する。こうして、スペクトル情報
修正部6によって雑音が除去された入力信号スペクトル
が得られ、認識用スペクトル情報として図示しない音声
認識エンジンに出力される。
【0008】ところで、音声に紛れて混入する雑音の低
減処理技術としては、上述した入力2チャネル信号に対
するスペクトルサブトラクション技術だけでなく、複数
のマイクロホンを用いて雑音を抑圧する技術も知られて
いる。例えば、文献1(電子情報通信学会編:音響シス
テムとデジタル処理)あるいは文献2(Heykin著;Adap
tive Filter Theory(Plentice Hall))においては、
マイクロホンアレイによって、一般化サイドロープキャ
ンセラ(GSC)、フロスト型ビームフォーマ、参照信
号法等の方法を用いた適応ビームフォーマ処理技術が開
示されている。適応ビームフォーマは、妨害雑音の到来
方向に死角を形成したフィルタにより雑音を抑圧する処
理であり、少ないマイクロホン数で大きな雑音抑圧効果
を得ることができ、コスト面でも有利である。
【0009】しかし、適応ビームフォーマ処理技術にお
いては、実際の目的信号の到来方向が、仮定した到来方
向と異なる場合、その目的信号が雑音と見做されて除去
されてしまうことから、性能が劣化するという問題があ
る。
【0010】これに対し、例えば、特開平9‐9794
号公報の提案においては、複数のビームフォーマを用い
て、話者方向を逐次検知してその方向にビームフォーマ
の入力方向を修正することで、話者の方向を追尾し、目
的信号に対する歪みを抑圧する方法も開示されている。
【0011】
【発明が解決しようとする課題】しかしながら、適応ビ
ームフォーマは方向性が強い雑音に対する雑音抑圧効果
は大きいが、方向性が弱い雑音に対する抑圧効果は比較
的小さい。例えばカーナビゲーションシステム等の実環
境では、走行雑音、クラクション、他の車の走行音な
ど、さまざまな方向から音声認識エンジンに環境雑音が
入力される。このような自動車の走行中に発生する走行
雑音のような高レベルの拡散性雑音、高速で移動する車
からの放射音のように音響伝達系の変化が速い雑音につ
いても、適応ビームフォーマにおける雑音抑圧効果は低
い。更に、突発雑音など継続時間がごく短い雑音等に関
しても十分な抑圧性能は得られない。
【0012】本発明はかかる問題点に鑑みてなされたも
のであって、マイクロホンアレーを雑音抑圧処理ではな
く目的音抑圧処理に用いることで、実環境におけるノイ
ズの発生状況に拘わらず、確実且つ十分な雑音抑圧効果
を得ると共に、高精度の音声認識を実現することができ
る音声認識用雑音抑圧装置及び方法、音声認識装置及び
方法並びにプログラムを提供することを目的とする。
【0013】
【課題を解決するための手段】本発明の請求項1に係る
音声認識用雑音抑圧装置は、マイクロホンアレーの複数
チャネルの入力音声信号が与えられて、目的音を消去し
て目的音消去信号を出力する目的音消去部と、前記目的
音消去部により得られた目的音消去信号を周波数分析し
て雑音成分のスペクトル情報を計算する雑音スペクトル
情報抽出部と、前記複数チャネルの入力音声信号が与え
られて、前記目的音を強調して目的音強調信号を出力す
る目的音強調部と、前記目的音強調部により得られた目
的音強調信号を周波数分析して目的音のスペクトル情報
を計算する目的音スペクトル情報抽出部と、前記雑音ス
ペクトル情報抽出部により得られた雑音スペクトル情報
と前記目的音スペクトル情報抽出部により得られた目的
音スペクトル情報とに基づいて、目的音に対する周波数
帯域毎の雑音の重畳の度合いである雑音重畳度を所定の
単位時間毎に推定する雑音重畳度推定部とを具備したも
のであり、本発明の請求項1において、目的音消去部
は、複数チャネルの入力音声信号から目的音を消去し
て、目的音消去信号を得る。音声信号等の目的音は、強
度が比較的高く、マイクロホンアレーによって確実に消
去することができる。雑音スペクトル情報抽出部は、目
的音消去信号を周波数分析して雑音成分のスペクトル情
報を計算する。一方、目的音強調部は、入力音声信号か
ら雑音成分をある程度除去して目的音を強調し、目的音
強調信号を出力する。目的音強調信号は、目的音スペク
トル情報抽出部によって周波数分析されて、目的音のス
ペクトル情報が計算される。雑音重畳度推定部は、雑音
スペクトル情報と目的音スペクトル情報とに基づいて、
目的音に対する周波数帯域毎の雑音の重畳の度合いであ
る雑音重畳度を所定の単位時間毎に推定する。目的音消
去部によって、雑音スペクトル情報からは目的音スペク
トル情報が確実に除去されており、雑音重畳度推定部に
よって、雑音の位置及び大きさが確実に検出可能であ
る。
【0014】本発明の請求項2に係る音声認識装置は、
請求項1に記載の音声認識用雑音抑圧装置と、前記目的
音スペクトル情報を前記雑音重畳度推定部で推定した雑
音重畳度に基づいて雑音の影響を除くように修正して出
力するスペクトル情報修正部とを具備したものであり、
本発明の請求項2においては、請求項1に記載の音声認
識用雑音抑圧装置によって、雑音の位置及び大きさが確
実に検出されており、スペクトル情報修正部は、雑音の
影響を確実に抑制することができる。これにより、高精
度の音声認識を可能にする。
【0015】本発明の請求項3に係る音声認識用雑音抑
圧装置は、マイクロホンアレーの複数チャネルの入力音
声信号を各々のチャネル毎に周波数分析する周波数分析
部と、前記周波数分析部で得られた複数チャネルの入力
スペクトル情報が入力され、入力された前記入力スペク
トル情報中に含まれる目的音の成分を消去して雑音のス
ペクトル情報を計算する目的音消去部と、前記複数チャ
ネルの入力スペクトル情報が入力され、入力された前記
入力スペクトル情報中に含まれる目的音を強調して目的
音のスペクトル情報を計算する目的音強調部と、前記目
的音強調部により得られた目的音スペクトル情報と前記
目的音消去部により得られた雑音スペクトル情報とに基
づいて、目的音に対する周波数帯域毎の雑音の重畳の度
合いである雑音重畳度を所定の単位時間毎に推定する雑
音重畳度推定部とを具備したものであり、本発明の請求
項3において、目的音消去部は、周波数領域で動作し
て、目的音のスペクトル情報を含まない雑音スペクトル
情報を得る。また、目的音強調部も周波数領域で動作し
て、目的音のスペクトル情報を得る。これらのスペクト
ル情報を用いて、雑音重畳度推定部は雑音の位置及び大
きさを確実に検出する。
【0016】本発明の請求項4に係る音声認識装置は、
請求項3に記載の音声認識用雑音抑圧装置と、前記目的
音スペクトル情報を前記雑音重畳度推定部で推定した雑
音重畳度に基づいて雑音の影響を除くように修正して出
力するスペクトル情報修正部とを具備したものであり、
本発明の請求項4においては、請求項3に記載の音声認
識用雑音抑圧装置によって、雑音の位置及び大きさが確
実に検出されており、スペクトル情報修正部は、雑音の
影響を確実に抑制することができる。これにより、高精
度の音声認識を可能にする。
【0017】本発明の請求項9に係る音声認識用雑音抑
圧装置は、マイクロホンアレーの複数チャネルの入力音
声信号が与えられて、目的音を強調して目的音強調信号
を出力する目的音強調部と、前記目的音強調部により得
られた目的音強調信号を分析して音声認識の対象となる
目的音特徴ベクトルを計算する目的音特徴ベクトル抽出
部と、前記複数チャネルの入力音声信号が与えられて、
目的音を消去して目的音消去信号を出力する目的音消去
部と、前記目的音消去部により得られた目的音消去信号
を分析して雑音に関する特徴ベクトルを計算する雑音特
徴ベクトル抽出部と、前記雑音特徴ベクトル抽出部から
得られた雑音特徴ベクトルと前記目的音特徴ベクトル抽
出部から得られた目的音特徴ベクトルとに基づいて、雑
音の重畳の度合いである雑音重畳度を目的音の特徴ベク
トルの成分毎で所定の単位時間毎に推定する雑音重畳度
推定部とを具備したものであり、本発明の請求項9にお
いて、目的音消去部及び目的音強調部によって、目的音
が確実に消去された目的音消去信号と雑音がある程度除
去された目的音強調信号とが得られる。目的音特徴ベク
トル抽出部は、目的音強調信号から目的音特徴ベクトル
を計算し、雑音特徴ベクトル抽出部は、目的音消去信号
を分析して雑音に関する特徴ベクトルを計算する。これ
らの雑音特徴ベクトルと目的音特徴ベクトルとに基づい
て、雑音重畳度推定部は、雑音の重畳の度合いである雑
音重畳度を目的音の特徴ベクトルの成分毎で所定の単位
時間毎に推定する。
【0018】本発明の請求項10に係る音声認識装置
は、請求項9に記載の音声認識用雑音抑圧装置と、前記
目的音特徴ベクトル抽出部から得られた目的音特徴ベク
トルと認識辞書とを照合すると共に、前記雑音重畳度推
定部により得られた雑音重畳度に基づいて照合結果を調
整する目的音特徴ベクトル照合部とを具備したものであ
り、本発明の請求項10において、請求項9に記載の音
声認識用雑音抑圧装置によって、雑音の位置及び大きさ
が確実に検出されており、スペクトル情報修正部は、雑
音の影響を確実に抑制する。
【0019】本発明の請求項11に係る音声認識用雑音
抑圧装置は、マイクロホンアレーの複数チャネルの入力
音声信号を各々のチャネル毎に周波数分析する周波数分
析部と、前記複数チャネルの入力スペクトル情報が入力
され、入力された前記入力スペクトル情報中の目的音を
強調して目的音のスペクトル情報を計算する目的音強調
部と、前記目的音強調部により得られた目的音スペクト
ル情報を分析して音声認識の対象である目的音特徴ベク
トルを抽出する目的音特徴ベクトル抽出部と、前記周波
数分析部で得られた複数チャネルの入力スペクトル情報
に基づいてこの入力スペクトル情報中に含まれる目的音
の成分を消去し雑音のスペクトル情報を計算する目的音
消去部と、前記目的消去部から得られた雑音スペクトル
情報を分析して雑音に関する目的音特徴ベクトルを抽出
する雑音特徴ベクトル抽出部と、前記雑音特徴ベクトル
抽出部により得られた雑音特徴ベクトルと前記目的音特
徴ベクトル抽出部により得られた目的音特徴ベクトルと
に基づいて雑音の重畳の度合いである雑音重畳度を目的
音の特徴ベクトルの成分毎で単位時間毎に推定する雑音
重畳度推定部とを具備したものである。
【0020】本発明の請求項11において、目的音消去
部は、周波数領域で動作して、目的音のスペクトル情報
を含まない雑音スペクトル情報を得る。また、目的音強
調部も周波数領域で動作して、目的音のスペクトル情報
を得る。これらのスペクトル情報を用いて、雑音重畳度
推定部は雑音の位置及び大きさを確実に検出する。
【0021】本発明の請求項12に係る音声認識装置
は、請求項11に記載の音声認識用雑音抑圧装置と、前
記目的音特徴ベクトルと認識辞書とを照合すると共に、
前記雑音重畳度推定部から得られた雑音重畳度に基づい
て、照合結果を調整する特徴ベクトル照合部とを具備し
たものである。
【0022】本発明の請求項12において、請求項1に
記載の音声認識用雑音抑圧装置によって、雑音の位置及
び大きさが確実に検出されている。特徴ベクトル照合部
は、目的音特徴ベクトルと認識辞書とを照合すると共
に、雑音重畳度推定部から得られた雑音重畳度に基づい
て、照合結果を調整する。
【0023】なお、装置に係る本発明は方法に係る発明
としても成立する。
【0024】また、装置に係る本発明は、コンピュータ
に当該発明に相当する処理を実行させるためのプログラ
ムとしても成立する。
【0025】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について詳細に説明する。図1は本発明の第1
の実施の形態に係る音声認識用雑音抑圧装置を示すブロ
ック図である。
【0026】本実施の形態は適応ビームフォーマ等のマ
イクロホンアレー処理を利用することで、音声認識に際
して雑音を抑圧するようになっている。適応ビームフォ
ーマは、上述したように、突発性雑音等の雑音に対する
雑音抑圧効果は小さいが、人からの発声音声のように安
定した音源からの到来音については、十分な抑圧効果を
有する。
【0027】そこで、本実施の形態においては、マイク
ロホンアレー処理によって目的とする発声音声を抑圧し
て雑音のみの信号を得、この雑音のみの信号とマイクロ
ホン入力信号とを比較することによって、入力信号に対
する雑音の位置及び重畳量を推定するようになってい
る。
【0028】本実施の形態は、スペクトル情報の抽出修
正処理を時間領域において行うものである。図1におい
て、入力端子11,12には夫々所定の間隔だけ離間し
た位置に配置されたマイクロホンからの音声信号が直接
又は所定の通信路を介して入力される。
【0029】入力端子11,12を介して入力された音
声信号は目的音消去部13及び目的音強調部14に与え
られる。目的音消去部13は、公知の手法である時間領
域のJim-Griffthの適応ビームフォーマ等によって、目
的音を雑音と見なして消去する。
【0030】図2は図1中の目的音消去部13の具体的
な構成を示すブロック図である。図2は目的音消去のた
めに、時間領域のLMS適応フィルタを用いた適応ビー
ムフォーマであるGriffith-Jimのビームフォーマを採用
した例を示している。
【0031】図2では、マイクロホンアレーは、目的音
の到来方向に対して垂直に配列された2つのマイクロホ
ンM1 ,M2 を有している。マイクロホンM1 ,M2 は
相互に間隔dだけ離間しており、目的音の到来方向に垂
直な方向(図中A方向)からの到来音についての伝搬時
間差τは、τ=d/cである。ここで、cは音速であ
る。
【0032】マイクロホンアレーとしては、例えば12
cm離して配置した2つのマイクロホンM1 ,M2 を採
用し、マイクロホンM1 ,M2 の出力を例えばサンプリ
ングレート11kHzでサンプリングした信号を目的音
消去部13に出力する。なお、マイクロホン出力を所定
の通信路を介して伝送して目的音消去部13に供給する
ようにしてもよい。
【0033】マイクロホンM1 の出力は加算器25,2
6に与えられ、マイクロホンM2 の出力は遅延器24を
介して加算器25,26に与えられる。遅延器24は、
目的音到来方向と大幅にずれた方向、例えば、図2のA
方向からの到来音に対して各マイクロホンM1 ,M2 の
出力波形が一致する(同相となる)ようにマイクロホン
M2 (チャネル2)の出力を遅延させるようになってい
る。
【0034】例えば、図2に示すように、マイクロホン
M1 ,M2 の配列方向(A方向)に垂直な方向から目的
音が到来するものとする。この場合に、例えば、目的音
到来方向に対して90度ずれたA方向からの到来音に対
してマイクロホンM1 ,M2の出力を波形を一致させる
ものとすると、遅延器24の遅延時間はτに設定すれば
よい。なお、目的音到来方向に対してαラジアンずれた
方向からの到来音に対してマイクロホンM1 ,M2 の出
力を波形を一致させる場合には、遅延器24の遅延時間
τは、τ=(d・sinα)/cに設定すればよい。
【0035】これにより、A方向からの到来音が、等価
的に同時に、2チャネルのマイクロホンM1 ,M2 に到
着したものと見なすことができる。即ち、加算器25,
26には、A方向からの到来音が同相となって入力され
る。遅延器24によって、入力対象をA方向からの到来
音に設定しているのである。なお、図2の目的音は位相
が90度ずれた信号として加算器25,26に入力され
る。
【0036】加算器25は、2入力を加算することによ
り、入力対象の音(A方向からの到来音)の2倍の信号
とその他の音声信号のパワー成分とを算出する。また、
加算器26は、2入力同士の減算を行うことにより、入
力対象の音を相殺し、目的音のパワー成分を算出する。
【0037】LMS適応フィルタ27は、フィルタ28
及び加算器29によって構成されている。フィルタ28
は加算器26の出力をフィルタリングして加算器29に
出力する。加算器29は、加算器25の出力からフィル
タ28の出力を減算する。加算器29の出力はフィルタ
28にフィードバックされ、フィルタ28のフィルタ係
数は、加算器29の出力を最小にするように逐次変化す
る。
【0038】こうして、目的音消去部13からは、目的
音が確実に消去されて、雑音成分N′のみの目的音消去
信号が出力される。
【0039】なお、目的音消去部13を構成する適応ビ
ームフォーマとしては、一般化サイドローブキャンセラ
(GSC)の他に、フロスト型ビームフォーマ等、種々
のものを適用可能である。
【0040】一方、目的音強調部14は、目的音を強調
(抽出)して出力する。目的音強調部14としては、目
的音消去部13と同様のGriffith-Jimのビームフォーマ
を用いてもよい。
【0041】図3は図1中の目的音強調部14の具体的
な構成を示すブロック図であり、Griffith-Jimのビーム
フォーマを用いた例を示している。図3において図2と
同一の構成要素には同一符号を付して説明を省略する。
【0042】図3の目的音強調部14は、図2の目的音
消去部13から遅延器24を削除すると共に、スイッチ
30を付加した点が異なるのみである。即ち、目的音強
調部14は、入力対象が目的音方向の信号である。従っ
て、加算器25からは、目的音を2倍した信号とその他
の到来方向からの信号のパワー成分とが出力される。ま
た、加算器26から出力されるその他の到来方向からの
信号は、フィルタ28によってフィルタリングされて加
算器29に与えられる。
【0043】LMS適応フィルタ27は、出力が最小と
なるようにフィルタ係数を変化させる。即ち、加算器2
5の出力(目的音)からその他の到来方向の信号を減算
して、フィルタ28の出力(その他の到来方向からの信
号)を最大にする。こうして、LMS適応フィルタ27
からは雑音が最大にキャンセルされた目的音信号が出力
される。スイッチ30は、LMS適応フィルタ27から
の目的音と、マイクロホンM2 の出力を選択的に出力す
る。
【0044】こうして、目的音強調部14からは、ある
程度雑音が抑圧された目的音信号が雑音成分Nと共に出
力される。
【0045】なお、2つのマイクロホンM1 ,M2 のい
ずれかの一方の信号をそのまま目的音強調部14の出力
としてもよい。図3の例では、マイクロホンM2 の出力
(チャネル2)を出力可能に構成したが、マイクロホン
M1 からのチャネル1の出力を出力可能に構成してもよ
い。
【0046】目的音消去部13の出力及び目的音強調部
14の出力は、夫々雑音スペクトル情報抽出部15又は
目的音スペクトル情報抽出部16に供給される。雑音ス
ペクトル情報抽出部15は、入力された信号(雑音信
号)から雑音スペクトル情報を計算する。一方、目的音
スペクトル情報抽出部16は、入力された信号(目的音
信号)から目的音スペクトル情報を計算する。
【0047】例えば、目的音消去部13及び目的音強調
部14は、入力音声を予め定められた複数の周波数帯域
毎に周波数分析し、各周波数帯毎の分析結果を特徴量
(特徴ベクトル)であるスペクトル情報として得る。ス
ペクトル情報はフレームと呼ばれる固定の時間長を単位
に求められ、目的音消去部13及び目的音強調部14
は、音声区間のスペクトル情報の時系列(特徴量系列
(特徴ベクトルの時系列))を得る。目的音消去部13
及び目的音強調部14によって抽出された雑音スペクト
ル情報及び目的音スペクトル情報の時系列は、雑音重畳
度推定部17に与えられる。
【0048】これらの雑音スペクトル情報抽出部15及
び目的音スペクトル情報抽出部16は、FFTスペクト
ルからベクトル情報を抽出してもよく、また、帯域フィ
ルタパンクの出力を用いてもよい。FFTスペクトルを
用いる場合には、例えば、窓長は256点として、時間
窓はハミング窓とする。
【0049】雑音重畳度推定部17は、雑音スペクトル
情報と目的音スペクトル情報とを比較して雑音重畳度を
計算する。雑音重畳度推定部17は、例えば、雑音成分
が含まれていない場合の雑音重畳度を“1”とし、雑音
成分のみである場合の雑音重畳度を0とするように、雑
音重畳度を求める。
【0050】目的音消去部13及び目的音強調部14と
して適応ビームフォーマを採用した場合には、上述した
ように、目的音スペクトル情報の中には目的音成分Sと
雑音成分Nとが含まれており、雑音スペクトル情報の中
には雑音成分N′がある。
【0051】いま、目的音スペクトル情報及び雑音スペ
クトル情報のk番目の帯域のパワーを各々Pa(k) 、P
b(k) とすると、Pa(k) =S(k) +N(k) 、Pb(k)
=N′(k) である。
【0052】例えば、雑音重畳度推定部17は、k番目
の帯域についての雑音重畳度Z(k)を下記(1)式で定
義する。
【0053】 Z(k) =(Pa(k) −Pb(k) )/Pa(k) (1) 雑音成分NとN′のパワーは略等しいと見なすことがで
きるので、雑音重畳度Z(k) は、 Z(k) =(S+N−N′)/(S+N)≒S/(S+N) (2) となる。この場合には、0≦Z(k) ≦1である。
【0054】雑音重畳度推定部17は、フレーム毎に、
全ての帯域について、雑音重畳度Zを算出する。雑音重
畳度推定部17は算出した雑音重畳度Zをスペクトル情
報修正部18に出力する。
【0055】スペクトル情報修正部18は、目的音強調
部14の出力が与えられており、入力された雑音重畳度
に基づいて、目的音スペクトル情報のスペクトル成分を
雑音の影響が少なくなるように修正する。スペクトル情
報修正部18は、修正した目的音スペクトル情報を音声
認識用のスペクトル情報として図示しない音声認識エン
ジンに出力するようになっている。
【0056】次に、このように構成された実施の形態の
動作について図4のフローチャートを参照して説明す
る。図4は1フレーム期間の処理を示しており、図4の
フローが全てのフレームについて実行される。
【0057】先ず、図4のステップS1 において、信号
の入力が行われる。マイクロホンアレーを構成するマイ
クロホンM1 ,M2 に目的音及びその他の到来音が入力
される。なお、目的音はマイクロホンM1 ,M2 の配列
方向に対して直交した方向からマイクロホンM1 ,M2
に到来する。
【0058】本実施の形態においては、マイクロホンア
レー処理によって、雑音ではなく、目的音の抑圧を行
う。即ち、図4のステップS2 において、目的音消去部
13は、目的音を抑圧し、目的音を除去した雑音信号を
得て、雑音スペクトル情報抽出部15に出力する。
【0059】利用者の発声音声等の目的音は、一般的に
比較的強いレベルの信号であり、且つ方向性が高く、継
続長も比較的長い、従って、マイクロホンアレー処理に
よる目的音の抑圧効果は極めて高く、十分に目的音を抑
圧した出力、即ち、到来方向が目的音の方向と異なる雑
音成分を得ることができる。雑音スペクトル情報抽出部
15は、目的音消去部13の出力に対して、フレーム毎
に全ての帯域についてスペクトル情報(雑音スペクトル
情報)を求める(ステップS3 )。
【0060】一方、図4のステップS4 において、目的
音強調部14は、目的音到来方向以外の雑音成分を抑圧
し、雑音成分を除去した目的音を得て、目的音スペクト
ル情報抽出部16に出力する。この場合には、雑音成分
の到来方向が一定でなく、また、雑音成分のレベルも弱
いので、雑音成分についての十分な抑圧効果は得られ
ず、目的音強調部14の出力には、比較的多くの雑音成
分も含まれる。
【0061】次のステップS5 においては、目的音スペ
クトル情報抽出部16によって、目的音のスペクトル情
報が抽出される。抽出された雑音スペクトル情報と目的
音スペクトル情報とは雑音重畳度推定部17に与えられ
る。雑音重畳度推定部17は、ステップS6 において、
例えば上記(2)式の雑音重畳度を求める。
【0062】スペクトル情報修正部18は、入力された
雑音重畳度に基づいて、入力信号と目的音スペクトル情
報とから、目的音スペクトル情報を修正する(ステップ
S7)。修正した目的音スペクトル情報は音声認識用の
スペクトル情報として図示しない音声認識エンジンに出
力される。
【0063】このように本実施の形態においては、マイ
クロホンアレーによって目的音を消去し雑音のみの信号
を得るようになっている。そして、目的音の消去によっ
て得た雑音成分とマイクロホン入力信号とに基づいて、
S/Nの低い場所を特定し、これに基づいて認識特徴量
を修正している。即ち、十分な雑音抑圧効果が得られな
い雑音環境であっても、S/Nが低い部分がそのまま認
識エンジンに出力されることを防止して、高い耐雑音性
を有する音声認識処理を可能にしている。これにより、
雑音によって音声の特徴が失われた特徴量をそのまま認
識することによる誤認識の発生を抑え、耐雑音性の高い
音声認識を実現可能にする。
【0064】なお、雑音信号と目的音信号を別々のマイ
クロホンで収集し、本実施例と同様に音声信号中の雑音
の重畳の度合いを推定する方法も考えられるが、雑音の
みを収集するマイクロホンには目的音声が混入しないよ
うに距離を離すか、強い指向性に設定する等の処置が必
要である。
【0065】また、音声入力用のマイクロホン信号と雑
音入力用のマイクロホン信号とでは、同じように雑音が
含まれている必要があるため、2つのマイクロホン相互
間の距離を大きくすることはできない。従って、2つの
マイクを音声用と雑音用に分けて用いるのは得策でな
い。
【0066】また、本実施の形態においては、2つのマ
イクロホンからの2チャネルの信号を処理する例につい
て説明したが、3チャネル以上の信号を処理するものに
適用してもよいことは明らかである。
【0067】図5は目的音消去部の他の構成を示すブロ
ック図である。
【0068】目的音消去部としては、図5に示すよう
に、図2と同一構成の適応ビームフォーマ23と固定ビ
ームフォーマ31とを組み合わせた構成にしてもよい。
適応ビームフォーマ23は、マイクロホンから見た利用
者の位置が目的音の方向とずれていても良好に目的音を
消去することができるが、SN比が低い場合には消去効
果が低下する。
【0069】一方、固定ビームフォーマ31は、加算器
32によって構成されている。固定ビームフォーマ31
は、利用者の位置が目的音の方向とずれた場合には消去
効果が低下するが、ずれていなければSN比が低い場合
でも高い消去効果を得ることができる。そこで、適応ビ
ームフォーマ23と固定ビームフォーマ31とを並行に
用いて、各ビームフォーマ23,31からの出力を目的
音消去出力統合部33によって統合して出力することに
より、利用者の位置が目的音の方向とずれていても、ま
た、SN比が低い場合でも、高い消去効果を得る。
【0070】目的音消去出力統合部33による統合の仕
方としては、時間領域での処理の場合は予め定めた短時
間、例えば、全体の処理フレーム区間毎に出力のパワー
を両方の出力に対して計算し、比較して小さい方の波形
を目的音消去部から出力するようにしてもよい。
【0071】なお、周波数領域での処理の場合には、周
波数帯域毎に出力パワーを両方の出力に対して計算し、
比較して小さい方の帯域成分を目的音消去部から出力す
るようにしてもよい。
【0072】また、固定ビームフォーマ処理方法として
は種々のものが考えられるが、図5に示すように、単純
なチャネル間の差分でもよい。
【0073】また、目的音強調部14についても、適用
ビームフォーマと固定ビームフォーマとの組み合わせを
使用してもよいことは明らかである。
【0074】ところで、図1のスペクトル情報修正部1
8の目的音スペクトル情報の修正方法としては、種々の
ものが考えられる。例えば、目的音スペクトル情報をク
ラスタリングしてクリアな音声データに置換するクラス
タ方式が採用されることがある。
【0075】図6はこのようなクラスタ方式を採用した
スペクトル情報修正部34の構成を示すブロック図であ
る。
【0076】スペクトル情報修正部34は、図示しない
参照メモリに予め参照スペクトル情報を記憶している。
参照スペクトル情報は、クリアな音声データを目的音ス
ペクトル情報と同じ方法で処理して得た数多くのスペク
トル情報をクラスタリングして得られる複数の代表スペ
クトルである。なお、クラスタリング手法としては、一
般的なK-Mean等を利用することができる。
【0077】参照スペクトル情報選択部35には、目的
音スペクトル情報抽出部16からの目的音スペクトル情
報、雑音重畳度推定部17からの雑音重畳度及び参照メ
モリからの参照スペクトル情報が入力される。参照スペ
クトル情報選択部35は、参照スペクトル情報と目的音
スペクトル情報とを照合し、参照スペクトル中から最も
近いもの選択する。なお、選択の基準としては特徴ベク
トルのベクトル間距離を用いることができる。
【0078】参照スペクトル情報選択部35は、雑音重
畳度に基づいて、選択方法を切換える。例えば、参照ス
ペクトル情報選択部35は、所定フレームについての雑
音重畳度が所定の閾値以上低い場合には、入力された目
的音スペクトル情報の成分は照合の際に無視する。或い
は、参照スペクトル情報選択部35は、雑音重畳度に基
づいて、成分毎に照合の重みを調整するようにしてもよ
い。
【0079】例えば、k番目の帯域の参照スペクトル情
報をS(k) として、参照スペクトル情報選択部35は、
目的音スペクトル情報Pa(k) との間のベクトル間距離
Rを雑音重畳度Z(k) を用いて下記(3)式によって求
める。
【0080】 R=Σ(Pa(k) −S(k) )*Z(k) (3) スペクトル情報復元部36は、目的音スペクトル情報に
最も近い参照スペクトル情報を用いて目的音スペクトル
情報を修正する。例えば、スペクトル情報復元部36
は、下記(4)式によって、目的音スペクトル情報を更
新する。
【0081】 Pa(k) =Pa(k) *Z(k) −S(k) (1−Z(k) ) (4) このように、抽出された所定フレームの目的音スペクト
ル情報の雑音の重畳度を雑音重畳度Z(k) によって把握
することができることを利用して、例えば、雑音が比較
的小さい場合には、抽出された目的音スペクトル情報を
雑音が混入していない参照スペクトル情報に置き換える
ことにより、音声認識精度を著しく向上させることがで
きる。
【0082】図7は本発明の第2の実施の形態を示すブ
ロック図である。図7において図1と同一の構成要素に
は同一符号を付して説明を省略する。
【0083】第1の実施の形態においては、目的音の消
去及び強調を時間領域で行った例について説明した。こ
れに対し、本実施の形態は目的音の消去及び強調を周波
数領域で行うものである。
【0084】本実施の形態は周波数分析部41を付加す
ると共に、目的音消去部13及び目的音強調部14に夫
々代えて目的音消去部42及び目的音強調部43を採用
した点が第1の実施の形態と異なる。
【0085】周波数分析部41は入力端子11,12を
介して入力された入力信号を周波数分析し、分析結果を
目的音消去部42及び目的音強調部43に出力する。
【0086】目的音消去部42としては、例えば、公知
の周波数領域適応フィルタ(FLMS適応フィルタ)5
0を用いたJim-Griffthの適応ビームフォーマ等によっ
て構成することができる。目的音消去部42は、第1の
実施の形態における目的音消去部13と同様に、目的音
を雑音と見なして消去し、雑音スペクトル情報を出力す
る。また、目的音強調部43は、第1の実施の形態にお
ける目的音強調部14と同様に、雑音をある程度除去し
て目的音を抽出して、目的音スペクトル情報を出力す
る。
【0087】図8は図7中の周波数分析部41及び目的
音消去部42の具体的な構成を示すブロック図である。
【0088】図8の目的音消去部42は図2の目的音消
去部13を周波数領域で動作させた点が異なるのみであ
る。周波数分析部41には、マイクロホンアレーを構成
するマイクロホンM1 ,M2 から直接又はマイクロホン
アレーの信号が所定の通信路を通して伝送される。マイ
クロホンアレーの構成は図2と同様である。なお、図8
では入力が2チャネルの例を示しているが、3チャネル
以上の入力であっても、同様に適用することができるこ
とは明らかである。
【0089】周波数分析部41は、各チャネルの入力信
号をチャネル毎に周波数分析する。周波数分析部41と
しては、FFTを採用してもよく、また、帯域フィルタ
を採用してもよい。
【0090】周波数分析部41からのチャネル1の出力
は加算器46に供給され、チャネル2の出力は位相回転
器45に供給される。位相回転器45は、目的音到来方
向と大幅にずれた方向、例えば、図2のA方向からの到
来音に対して各マイクロホンM1 ,M2 の出力波形が一
致する(同相となる)ようにマイクロホンM2 (チャネ
ル2)の出力を位相回転させるようになっている。
【0091】例えば、図2に示すように、マイクロホン
M1 ,M2 の配列方向(A方向)に垂直な方向から目的
音が到来するものとする。この場合に、例えば、目的音
到来方向に対して90度ずれたA方向からの到来音に対
してマイクロホンM1 ,M2の出力を波形を一致させる
ものとすると、位相回転器45の位相回転量はマイクロ
ホンM1 ,M2 相互間の伝搬時間差τに相当するeの
(−jωτ乗)に設定すればよい。
【0092】これにより、A方向からの到来音が、等価
的に同時に、2チャネルのマイクロホンM1 ,M2 に到
着したものと見なすことができる。即ち、加算器46,
47には、A方向からの到来音が同相となって入力され
る。加算器46は、2入力を加算することにより、入力
対象の音(A方向からの到来音)の2倍の信号とその他
の音声信号のパワー成分とを算出する。また、加算器4
7は、2入力同士の減算を行うことにより、入力対象の
音を相殺し、目的音のパワー成分を算出する。
【0093】FLMS適応フィルタ50は、フィルタ4
8及び加算器49によって構成されている。フィルタ4
8は加算器47の出力をフィルタリングして加算器49
に出力する。加算器49は、加算器46の出力からフィ
ルタ48の出力を減算する。加算器49の出力はフィル
タ48にフィードバックされ、フィルタ48のフィルタ
係数は、加算器49の出力を最小にするように逐次変化
する。
【0094】即ち、図8の目的音消去部42は周波数領
域で動作する点が図2の目的音消去部13と異なるのみ
であり、目的音消去部42は、目的音を消去して、雑音
成分N′のみの目的音消去信号を出力する。
【0095】一方、目的音強調部43も目的音消去部4
2と同様にJim-Griffthの適応ビームフォーマ等によっ
て構成することができる。この場合には、位相回転器4
5を省略すると共に、図3のスイッチ30に相当するス
イッチを設けた点が目的音消去部42と異なるのみであ
る。こうして、目的音強調部43からは、ある程度雑音
が抑圧された目的音信号が雑音成分Nと共に出力され
る。
【0096】目的音消去部42の出力及び目的音強調部
43の出力は、既にスペクトル情報であり、目的音消去
部42の出力及び目的音強調部43の出力は、そのまま
雑音重畳度推定部17に供給される。
【0097】他の構成は図1の実施の形態と同様であ
る。
【0098】次に、このように構成された実施の形態の
動作について図9のフローチャートを参照して説明す
る。図9は1フレーム期間の処理を示しており、図9の
フローが全てのフレームについて実行される。
【0099】マイクロホンアレーを構成するマイクロホ
ンM1 ,M2 に目的音及びその他の到来音が入力され
る。なお、目的音はマイクロホンM1 ,M2 の配列方向
に対して直交した方向からマイクロホンM1 ,M2 に到
来する。
【0100】本実施の形態においては、周波数領域での
処理が行われる。即ち、マイクロホンM1 ,M2 を介し
て入力された信号は、図9のステップS11において、周
波数分析部41によって周波数分析される。
【0101】次に、目的音消去部42は、雑音ではな
く、目的音の抑圧を行う。即ち、図9のステップS12に
おいて、目的音消去部13は、目的音を抑圧し、目的音
を除去した雑音信号のスペクトル情報を得る。この場合
には、利用者の発声音声等の目的音が、一般的に比較的
強いレベルの信号であり、且つ方向性が高く、継続長も
比較的長いことから、マイクロホンアレーを利用した目
的音消去部42は、十分に目的音を抑圧した出力、即
ち、到来方向が目的音の方向と異なる雑音成分を得るこ
とができる。
【0102】一方、目的音強調部43は、周波数領域に
おいて、目的音到来方向以外の雑音成分を抑圧し、雑音
成分をある程度除去した目的音を得て、目的音スペクト
ル情報を出力する(ステップS13)。この場合には、雑
音成分の到来方向が一定でなく、また、雑音成分のレベ
ルも弱いので、雑音成分についての十分な抑圧効果は得
られず、目的音強調部43の出力には、比較的多くの雑
音成分も含まれる。
【0103】次のステップS14の雑音重畳度推定処理及
びステップS15のスペクトル情報修正処理は、夫々、図
4のステップS6 における雑音重畳度推定処理及びステ
ップS7 におけるスペクトル情報修正処理と同様であ
る。
【0104】このように本実施の形態においては、目的
音消去及び目的音強調処理を周波数領域で行うことがで
きる。これにより、第1の実施の形態と同様の効果が得
られると共に、ビームフォーマの性能面及び演算量の面
で有利であるという利点を有する。
【0105】図10は第2の実施の形態において採用さ
れる目的音消去部の他の構成を示すブロック図である。
【0106】目的音消去部としては、図10に示すよう
に、図8と同一構成の適応ビームフォーマ51と固定ビ
ームフォーマ52とを組み合わせた構成にしてもよい。
適応ビームフォーマ51は、マイクロホンから見た利用
者の位置が目的音の方向とずれていても良好に目的音を
消去することができるが、SN比が低い場合には消去効
果が低下する。
【0107】一方、固定ビームフォーマ52は、加算器
53によって構成されている。固定ビームフォーマ52
は、利用者の位置が目的音の方向とずれた場合には消去
効果が低下するが、ずれていなければSN比が低い場合
でも高い消去効果を得ることができる。そこで、適応ビ
ームフォーマ51と固定ビームフォーマ52とを並行に
用いて、各ビームフォーマ51,52からの出力を目的
音消去出力統合部54によって統合して出力することに
より、利用者の位置が目的音の方向とずれていても、ま
た、SN比が低い場合でも、高い消去効果を得る。
【0108】目的音消去出力統合部54による統合の仕
方としては、周波数帯域毎に出力パワーを両方の出力に
対して計算し、比較して小さい方の帯域成分を目的音消
去部から出力するようにしてもよい。
【0109】また、固定ビームフォーマ処理方法として
は種々のものが考えられるが、図10に示すように、単
純なチャネル間の差分でもよい。
【0110】また、目的音強調部14についても、適用
ビームフォーマと固定ビームフォーマとの組み合わせを
使用してもよいことは明らかである。
【0111】図11は本発明の第3の実施の形態を示す
ブロック図である。図11において図1と同一の構成要
素には同一符号を付して説明を省略する。
【0112】上記第1及び第2の実施の形態において
は、雑音重畳の度合いに応じて認識装置の入力となるス
ペクトル情報を修正したが、雑音の重畳の度合いが大き
く、また、長時間且つ広い帯域に亘って雑音が重畳され
ている場合には、Missing Feature 処理(下記文献1)
を適用するようにしたものである。
【0113】音声認識エンジンにおいては、音素モデル
を基に作成した認識対象語彙と入力音声からフレーム毎
に抽出した特徴量とを比較し、比較結果の数値(以下、
照合スコアという)が最も高い値の語彙を音声認識結果
として出力する。
【0114】しかし、S/Nが比較的大きい場合には、
照合スコアの信頼性が低い。そこで、雑音に強い音声認
識手法の1つとして、下記文献1で詳述されているMiss
ingFeature処理を採用して、S/Nが比較的低いフレー
ムについては、照合スコアを例えば一定値にして音素モ
デル相互間に差が生じないようにする。
【0115】文献1.Using missing feature theory to
actively select features for robust speech recogn
itionwith interruptions, filtering, and noiseProc.
Eurospeech '97 KN-37 従って、Missing Feature処理においては、音声信号上
のS/Nが低い部分の位置を把握することが必要であ
る。S/Nが低い部分の位置を知る方法としては、下記
文献2に詳述されているMAP等の方法がある。しか
し、この方法は、雑音環境に応じて学習が必要であり、
処理が複雑で、学習データによっては検出不能となる状
況もあり、十分な確実性は得られない。
【0116】文献2.Reconstruction of damaged spect
rographic features for robust speech recognitionPr
oc. ICSLP 2000 pp.357-360 これに対し、上述した第1及び第2の実施の形態におい
ては、マイクロホンアレーによって目的音を消去して、
雑音のみの信号を得ることにより、音声信号中のいずれ
の位置にどのレベルで雑音が重畳されているかを確実に
検出することができる。従って、上記第1及び第2の実
施の形態を適用することにより、Missing Feature処理
の確実性を著しく向上させることができる。
【0117】図11において、目的音消去部13からは
目的音が確実に消去された雑音波形が出力されて、雑音
特徴量ベクトル抽出部61に入力される。また、目的音
強調部14からは、雑音がある程度除去された目的音波
形が出力されて、目的音特徴ベクトル抽出部62に入力
される。
【0118】雑音特徴ベクトル抽出部61は、雑音波形
から雑音の特徴ベクトルを抽出する。また、目的音特徴
ベクトル抽出部62は、目的音波形から目的音の特徴ベ
クトルを抽出する。例えば、雑音雑音特徴ベクトル抽出
部61及び目的音特徴ベクトル抽出部62は、入力音声
を予め定められた複数の周波数帯域毎に周波数分析し、
各周波数帯毎の分析結果を特徴ベクトル(特徴パラメー
タ)として得る。特徴ベクトル(特徴パラメータ)は単
位時間であるフレーム毎に求められ、抽出部61,62
は音声区間の特徴ベクトル系列(特徴ベクトル時系列)
を得る。
【0119】なお、音声認識に使用される代表的な特徴
ベクトルとしては、バンドパスフィルタ又はフーリエ変
換によって得られるパワースペクトラムや、LPC(線
形予測)分析によって求められるケプストラム計数等が
良く知られている。ただし、本実施の形態では、使用す
る特徴ベクトルの種類は問わない。
【0120】雑音特徴ベクトル抽出部61からの雑音特
徴ベクトル及び目的音特徴ベクトル抽出部62からの目
的音特徴ベクトルは雑音重畳度推定部63に供給され
る。雑音重畳度推定部63は、雑音特徴ベクトルからベ
クトルの成分毎に雑音の重畳の度合いである雑音重畳度
を計算する。なお、雑音重畳度推定部63の計算方法
は、第1の実施の形態と同様である。算出された雑音重
畳度は特徴ベクトル照合部64に供給されるようになっ
ている。
【0121】特徴ベクトル照合部64には目的音特徴ベ
クトルも入力される。特徴ベクトル照合部64は、図示
しない認識辞書から認識対象語彙及び文法等を含む認識
辞書情報が与えられ、目的音特徴ベクトルのパターン照
合を行い、照合スコアに基づく認識結果を出力するよう
になっている。
【0122】本実施の形態においては、特徴ベクトル照
合部64は、入力された各フレーム毎の雑音重畳度に基
づいて照合スコアを調整し、これにより、認識精度を向
上させるようになっている。
【0123】次に、このように構成された実施の形態の
動作について図12のグラフを参照して説明する。図1
2は横軸に雑音重畳度をとり縦軸に重みをとって、照合
スコアに付与する重みを示している。
【0124】入力音声信号は目的音消去部13及び目的
音強調部14に与えられる。目的音消去部13によって
目的音が消去されて雑音波形が出力される。また、目的
音強調部14によって雑音がある程度除去されて、目的
音波形が出力される。雑音特徴ベクトル抽出部61は、
雑音特徴ベクトルを抽出し、目的音特徴ベクトル抽出部
62は目的音特徴ベクトルを抽出する。雑音重畳度推定
部63は、雑音特徴ベクトルと目的音特徴ベクトルとか
ら、フレーム毎の雑音重畳度を算出する。
【0125】特徴ベクトル照合部64には、目的音特徴
ベクトル抽出部62から目的音特徴ベクトルが入力され
る。特徴ベクトル照合部64は、認識辞書情報を用い
て、フレーム毎に目的音特徴ベクトルの照合スコアを求
める。この場合には、特徴ベクトル照合部64は、図1
2のグラフに従って、照合スコアを調整する。
【0126】即ち、いま、所定のフレームにおいてS/
Nが極めて良好で、雑音重畳度が所定値bよりも小さい
ものとする。この場合には、照合スコアの信頼性は極め
て高い。そこで、目的音特徴ベクトル照合部64は、照
合スコアをそのまま用いる(1.0の重み付けを付
す)。
【0127】次に、所定のフレームにおいてS/Nが極
めて悪く、雑音重畳度が所定値aよりも大きいものとす
る。この場合には、照合スコアの信頼性は極めて低い。
そこで、目的音特徴ベクトル照合部64は、照合スコア
を所定の一定値に設定する。この場合には特徴量と比較
対照の各音素モデルとの間の照合スコアに差が生じな
い。即ち、雑音重畳度が所定値aよりも大きいフレーム
は、音声認識に際して利用されないことと等価となる。
これにより、ノイズによる誤認識を防止することができ
る。
【0128】また、所定のフレームにおいてS/Nが若
干悪く、雑音重畳度が所定値bとaとの間にあるものと
する。この場合には、照合スコアの信頼性は、雑音重畳
度に応じて変化するものと考えることができる。そこ
で、目的音特徴ベクトル照合部64は、照合スコアに雑
音重畳度に応じた重み付けを付す。例えば、雑音重畳度
が所定値aに近い値の場合には、照合スコアの重み付け
を小さくし、この区間の照合スコアによる音声認識の認
識結果に与える影響を小さくする。逆に、雑音重畳度が
所定値bに近い値の場合には、照合スコアの重み付けを
1に近くし、この区間の照合スコアによる音声認識の認
識結果に与える影響を比較的大きくする。特徴ベクトル
照合部64は、雑音重畳度に応じて算出した照合スコア
に基づいて、音声認識結果を得る。
【0129】このように、本実施の形態においては、マ
イクロホンアレーを雑音抑圧処理として用いるのではな
く、目的音抑圧として用いることで、音声信号上のS/
Nの低い部分の位置を確実に検出することができる。雑
音の位置及び大きさを確実に検出することができるの
で、各種Missing Feature処理の確実性を向上させ、Mis
sing Featureの効果が最大限に発揮させて、音声認識の
耐雑音性を大幅に向上させることができる。
【0130】図13は本発明の第4の実施の形態を示す
ブロック図である。図13において図7及び図11と同
一の構成要素には同一符号を付して説明を省略する。
【0131】第3の実施の形態においては、目的音の消
去及び強調を時間領域に行った例について説明した。こ
れに対し、本実施の形態は目的音の消去及び強調を周波
数領域で行うものである。
【0132】本実施の形態は周波数分析部41を付加す
ると共に、目的音消去部13及び目的音強調部14に夫
々代えて目的音消去部42及び目的音強調部43を採用
した点が第1の実施の形態と異なる。
【0133】他の構成及び作用は7及び図11の実施の
形態と同様である。
【0134】なお、特徴ベクトルの算出に際して、バン
ドパスフィルタ又はフーリエ変換によって得られるパワ
ースペクトラムや、LPC(線形予測)分析によって求
められるケプストラム計数等、種々のものを採用可能で
あるが、時間波形に戻さず、波数スペクトルから直接求
められるパラメータの方が都合がよい。
【0135】本実施の形態においても、第3の実施の形
態と同様の効果が得られると共に、目的音消去と目的音
強調に要する演算量及び性能が時間領域で処理する場合
に比して有利であるという利点を有する。
【0136】図14は本発明の第5の実施の形態を示す
ブロック図である。図14において図11と同一の構成
要素には同一符号を付して説明を省略する。
【0137】本実施の形態はMissing Feature処理にお
いて、雑音の重畳度に応じて、特徴ベクトルの修正処理
及び音声認識エンジンにおけるパターン照合処理を制御
するようにしたものである。
【0138】本実施の形態はベクトル修正照合制御部7
1及び特徴ベクトル修正部72を付加した点が第4の実
施の形態と異なる。特徴ベクトル修正部72は、目的音
特徴ベクトル抽出部62から目的音特徴ベクトルが与え
られ、ベクトル修正照合制御部71からベクトル修正制
御情報が与えられて、目的音特徴ベクトルを修正して特
徴ベクトル照合部64に出力するようになっている。例
えば、ベクトル修正照合部62は、図6に示すクラスタ
方式等を用いて目的音特徴ベクトルを修正する。
【0139】本実施の形態においては、ベクトル修正照
合制御部71は、雑音重畳度に基づいて、特徴ベクトル
修正を制御すると共に、特徴ベクトル照合部64におけ
るパターン照合処理を制御するようになっている。
【0140】例えば、ベクトル修正照合制御部71は、
図12と同様の閾値a,bを設定して、特徴ベクトル照
合制御情報により特徴ベクトル照合部64の照合スコア
を調整する。また、ベクトル修正照合制御部71は、雑
音重畳度が閾値bよりも小さい所定の閾値c以下である
場合には、特徴ベクトル修正部72による特徴ベクトル
の修正が有効であるものと判断して、特徴ベクトル修正
を指示する特徴ベクトル修正制御情報を出力する。ベク
トル修正照合制御部71は、雑音重畳度が閾値cよりも
大きい場合には、特徴ベクトル修正部72による特徴ベ
クトルの修正が有効ではないものと判断して、特徴ベク
トル修正を禁止するようになっている。
【0141】次に、このように構成された実施の形態の
動作について図15のフローチャートを参照して説明す
る。図15はベクトル修正照合制御部71におけるベク
トル修正制御情報の生成方法の一例を示している。
【0142】ベクトル修正照合制御部71には、雑音重
畳度推定部63から雑音重畳度が入力される。ベクトル
修正照合制御部71は、図15のステップS31におい
て、各種初期設定を行う。例えば、ベクトル修正照合制
御部71は、特徴ベクトル次元数Nを雑音特徴ベクトル
抽出部61における次元数(帯域数)(図15の例では
112)に設定する。そして、雑音重畳度の閾値Tk を
設定する。図15の例では、閾値Tk =0(dB)であ
り、雑音パワーが信号パワーを越えるか否かが判定の閾
値となる。次に、成分数閾値Nt を設定する。図15の
例ではNt =0.4である。そして、次元数を示す次元
数カウンタkを0に初期化し、閾値Tk を越えた次元数
を示す成分数カウンタnを0に初期化する。
【0143】ベクトル修正照合制御部71には、各フレ
ーム毎に各次元(帯域)の雑音重畳度が入力される。ベ
クトル修正照合制御部71は、ステップS32において、
雑音重畳度Z(k) が閾値Tk を越えたか否かを判定す
る。越えた場合には成分数カウンタnを1つインクリメ
ントする(ステップS33)。ステップS34では、全ての
次元について判定が行われたか否かを判断する。
【0144】全ての次元について判定が行われていない
場合には、次元数カウンタkを1つインクリメントし
て、ステップS32に処理を戻す。全ての次元についての
判定が終了すると、処理をステップS35に移行して、雑
音重畳度が閾値Tk を越えた次元数が成分数閾値Nt を
越えているか否かを判定する。
【0145】ベクトル修正照合制御部71は、雑音重畳
度が閾値Tk を越えた次元数が全次元数の4割(Nt =
0.4)を越えない場合には、対象フレームの目的音ス
ペクトル情報は修正が有効であるものと判定し、4割を
越えた場合には目的音スペクトル情報の修正は無効であ
るものと判定する。
【0146】即ち、ベクトル修正照合制御部71は、特
徴ベクトルの修正の可能性を、特徴ベクトルに対する雑
音の重畳が強く、且つ、広範囲に亘っているか否かによ
って判定する。上述したように、雑音重畳度が閾値Tk
以上になる場合の成分の数が40%以下であれば、雑音
重畳は局所的であるとみなし、修正が可能であるものと
判定するのである。
【0147】ベクトル修正照合制御部71は、雑音重畳
度に基づいて、目的音特徴ベクトルが精度高く修正可能
であると判定した場合には、ベクトル修正制御情報とし
ては「修正処理を行う」ことを示す値を出力する。ま
た、この場合には、ベクトル修正照合制御部71は、ベ
クトル照合制御情報としては「照合の制御を行わない」
ことを示す値を出力する。
【0148】従って、この場合には、目的音特徴ベクト
ル抽出部62からの目的音特徴ベクトルは、特徴ベクト
ル修正部72において修正され、特徴ベクトル照合部6
4は、照合スコアをそのまま用いて音声認識結果を得
る。
【0149】また、ベクトル修正照合制御部71は、修
正が有効ではないと判定した場合には、ベクトル修正制
御情報として「修正処理を行わない」ことを示す値を出
力し、ベクトル照合制御情報としては例えば図12に示
す方法に従って「照合の制御を行う」ことを示す値を出
力する。
【0150】従って、この場合には、目的音特徴ベクト
ル抽出部62からの目的音特徴ベクトルは、特徴ベクト
ル修正部72において修正されることなくそのまま特徴
ベクトル照合部64に与えられ、特徴ベクトル照合部6
4は、照合スコアに対して、図12と同様の調整によっ
て所定の重み付けを付して、或いは一定値に変換して、
音声認識結果を得る。
【0151】このように本実施の形態においては、フレ
ーム毎に特徴ベクトルの各次元毎について求めた雑音重
畳度を用いて、スペクトル修正の有効性を判定してい
る。クラスタ方式におけるスペクトル修正は、クリアな
音声から作成したスペクトル情報の中から、入力のスペ
クトル情報に最も近いものを選択するものである。特徴
ベクトルの照合に用いるスペクトル情報に雑音成分が含
まれていないので、照合スコアの信頼性は高く高精度の
音声認識が可能である。つまり、雑音が特定のスペクト
ル成分や時間に偏っている場合には、精度よくクリア音
声のスペクトル情報を選択することができることから、
元の音声のスペクトル情報は十分に復元され、認識する
入力データに変更を加えることなく高い認識性能を得る
ことができる。しかし、雑音が重畳する領域(周波数及
び時間領域)が広い場合には、元の音声のスペクトル情
報が大幅に失われ、照合の精度が低下する可能性があ
る。本実施の形態においては、雑音が重畳されている領
域の広さと重畳の程度に基づいて、スペクトル修正方式
と認識の照合の制御とを切換えるようになっており、高
精度の音声認識が可能である。
【0152】
【発明の効果】以上説明したように本発明によれば、マ
イクロホンアレーを雑音抑圧処理ではなく目的音抑圧処
理に用いることで、実環境におけるノイズの発生状況に
拘わらず、確実且つ十分な雑音抑圧効果を得て、高精度
の音声認識を実現することができるという効果を有す
る。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る音声認識用雑
音抑圧装置を示すブロック図。
【図2】図1中の目的音消去部13の具体的な構成を示
すブロック図。
【図3】図1中の目的音強調部14の具体的な構成を示
すブロック図。
【図4】第1の実施の形態の動作を説明するためのフロ
ーチャート。
【図5】目的音消去部の他の構成を示すブロック図。
【図6】クラスタ方式を採用したスペクトル情報修正部
34の構成を示すブロック図。
【図7】本発明の第2の実施の形態を示すブロック図。
【図8】図7中の周波数分析部41及び目的音消去部4
2の具体的な構成を示すブロック図。
【図9】第2の実施の形態の動作を説明するためのフロ
ーチャート。
【図10】第2の実施の形態において採用される目的音
消去部の他の構成を示すブロック図。
【図11】本発明の第3の実施の形態を示すブロック
図。
【図12】第3の実施の形態の動作を説明するためのグ
ラフ。
【図13】本発明の第4の実施の形態を示すブロック
図。
【図14】本発明の第5の実施の形態を示すブロック
図。
【図15】第5の実施の形態の動作を説明するためのフ
ローチャート。
【図16】雑音抑圧技術としてスペクトルサブトラクシ
ョン技術を採用して、入力1チャネル信号に対して雑音
を抑圧した音声出力を得る雑音抑圧装置を示すブロック
図。
【符号の説明】
13…目的音消去部、14…目的音強調部、15…雑音
スペクトル情報抽出部、16…目的音スペクトル情報抽
出部、17…雑音重畳度推定部、18…スペクトル情報
修正部。

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 マイクロホンアレーの複数チャネルの入
    力音声信号が与えられて、目的音を消去して目的音消去
    信号を出力する目的音消去部と、 前記目的音消去部により得られた目的音消去信号を周波
    数分析して雑音成分のスペクトル情報を計算する雑音ス
    ペクトル情報抽出部と、 前記複数チャネルの入力音声信号が与えられて、前記目
    的音を強調して目的音強調信号を出力する目的音強調部
    と、 前記目的音強調部により得られた目的音強調信号を周波
    数分析して目的音のスペクトル情報を計算する目的音ス
    ペクトル情報抽出部と、 前記雑音スペクトル情報抽出部により得られた雑音スペ
    クトル情報と前記目的音スペクトル情報抽出部により得
    られた目的音スペクトル情報とに基づいて、目的音に対
    する周波数帯域毎の雑音の重畳の度合いである雑音重畳
    度を所定の単位時間毎に推定する雑音重畳度推定部とを
    具備したことを特徴とする音声認識用雑音抑圧装置。
  2. 【請求項2】 請求項1に記載の音声認識用雑音抑圧装
    置と、 前記目的音スペクトル情報を前記雑音重畳度推定部で推
    定した雑音重畳度に基づいて雑音の影響を除くように修
    正して出力するスペクトル情報修正部とを具備したこと
    を特徴とする音声認識装置。
  3. 【請求項3】 マイクロホンアレーの複数チャネルの入
    力音声信号を各々のチャネル毎に周波数分析する周波数
    分析部と、 前記周波数分析部で得られた複数チャネルの入力スペク
    トル情報が入力され、入力された前記入力スペクトル情
    報中に含まれる目的音の成分を消去して雑音のスペクト
    ル情報を計算する目的音消去部と、 前記複数チャネルの入力スペクトル情報が入力され、入
    力された前記入力スペクトル情報中に含まれる目的音を
    強調して目的音のスペクトル情報を計算する目的音強調
    部と、 前記目的音強調部により得られた目的音スペクトル情報
    と前記目的音消去部により得られた雑音スペクトル情報
    とに基づいて、目的音に対する周波数帯域毎の雑音の重
    畳の度合いである雑音重畳度を所定の単位時間毎に推定
    する雑音重畳度推定部とを具備したことを特徴とする音
    声認識用雑音抑圧装置。
  4. 【請求項4】 請求項3に記載の音声認識用雑音抑圧装
    置と、 前記目的音スペクトル情報を前記雑音重畳度推定部で推
    定した雑音重畳度に基づいて雑音の影響を除くように修
    正して出力するスペクトル情報修正部とを具備したこと
    を特徴とする音声認識装置。
  5. 【請求項5】 前記スペクトル情報修正部は、 雑音が含まれない音声データを用いて作成された複数の
    参照スペクトル情報のうちの1つを選択して前記目的音
    のスペクトル情報と置換または修正するものであって、
    前記雑音重畳度推定部から出力された前記雑音重畳度に
    基づいて置換または修正の可否を決定する参照スペクト
    ル情報選択部と、 選択された前記参照スペクトル情報に基づいて前記目的
    音のスペクトル情報を修正するスペクトル情報復元部と
    を具備したことを特徴とする請求項2又は4のいずれか
    一方に記載の音声認識装置。
  6. 【請求項6】 前記目的音消去部は、 適応ビームフォーマ及び固定ビームフォーマの少なくと
    も一方によって構成されることを特徴とする請求項1又
    は3のいずれか一方に記載の音声認識用雑音抑圧装置。
  7. 【請求項7】 前記目的音強調部は、 適応ビームフォーマ及び固定ビームフォーマの少なくと
    も一方によって構成されることを特徴とする請求項1又
    は3のいずれか一方に記載の音声認識用雑音抑圧装置。
  8. 【請求項8】 前記目的音強調部は、 前記複数チャネルの入力音声信号の1つを前記目的音強
    調信号として出力することを特徴とする請求項1又は3
    のいずれか一方に記載の音声認識用雑音抑圧装置。
  9. 【請求項9】 マイクロホンアレーの複数チャネルの入
    力音声信号が与えられて、目的音を強調して目的音強調
    信号を出力する目的音強調部と、 前記目的音強調部により得られた目的音強調信号を分析
    して音声認識の対象となる目的音特徴ベクトルを計算す
    る目的音特徴ベクトル抽出部と、 前記複数チャネルの入力音声信号が与えられて、目的音
    を消去して目的音消去信号を出力する目的音消去部と、 前記目的音消去部により得られた目的音消去信号を分析
    して雑音に関する特徴ベクトルを計算する雑音特徴ベク
    トル抽出部と、 前記雑音特徴ベクトル抽出部から得られた雑音特徴ベク
    トルと前記目的音特徴ベクトル抽出部から得られた目的
    音特徴ベクトルとに基づいて、雑音の重畳の度合いであ
    る雑音重畳度を目的音の特徴ベクトルの成分毎で所定の
    単位時間毎に推定する雑音重畳度推定部とを具備したこ
    とを特徴とする音声認識用雑音抑圧装置。
  10. 【請求項10】 請求項9に記載の音声認識用雑音抑圧
    装置と、 前記目的音特徴ベクトル抽出部から得られた目的音特徴
    ベクトルと認識辞書とを照合すると共に、前記雑音重畳
    度推定部により得られた雑音重畳度に基づいて照合結果
    を調整する目的音特徴ベクトル照合部とを具備したこと
    を特徴とする音声認識装置
  11. 【請求項11】 マイクロホンアレーの複数チャネルの
    入力音声信号を各々のチャネル毎に周波数分析する周波
    数分析部と、 前記複数チャネルの入力スペクトル情報が入力され、入
    力された前記入力スペクトル情報中の目的音を強調して
    目的音のスペクトル情報を計算する目的音強調部と、 前記目的音強調部により得られた目的音スペクトル情報
    を分析して音声認識の対象である目的音特徴ベクトルを
    抽出する目的音特徴ベクトル抽出部と、 前記周波数分析部で得られた複数チャネルの入力スペク
    トル情報に基づいてこの入力スペクトル情報中に含まれ
    る目的音の成分を消去し雑音のスペクトル情報を計算す
    る目的音消去部と、 前記目的消去部から得られた雑音スペクトル情報を分析
    して雑音に関する目的音特徴ベクトルを抽出する雑音特
    徴ベクトル抽出部と、 前記雑音特徴ベクトル抽出部により得られた雑音特徴ベ
    クトルと前記目的音特徴ベクトル抽出部により得られた
    目的音特徴ベクトルとに基づいて雑音の重畳の度合いで
    ある雑音重畳度を目的音の特徴ベクトルの成分毎で単位
    時間毎に推定する雑音重畳度推定部とを具備したことを
    特徴とする音声認識用雑音抑圧装置。
  12. 【請求項12】 請求項11に記載の音声認識用雑音抑
    圧装置と、 前記目的音特徴ベクトルと認識辞書とを照合すると共
    に、前記雑音重畳度推定部から得られた雑音重畳度に基
    づいて、照合結果を調整する特徴ベクトル照合部とを具
    備したことを特徴とする音声認識装置
  13. 【請求項13】 請求項9又は請求項10のいずれか一
    方に記載の音声認識用雑音抑圧装置と、 音声認識で認識する対象である目的音特徴ベクトルを雑
    音の影響の少ないパターンに修正する特徴ベクトル修正
    部と、 前記雑音重畳度推定部により得られた雑音重畳度に基づ
    いて特徴ベクトル修正部における修正処理と特徴ベクト
    ル照合部の照合処理とを制御するための信号を生成する
    ベクトル修正照合制御部とを具備したことを特徴とする
    音声認識装置。
  14. 【請求項14】 前記目的音消去部は、 適応ビームフォーマ及び固定ビームフォーマの少なくと
    も一方によって構成されることを特徴とする請求項9又
    は11のいずれか一方に記載の音声認識用雑音抑圧装
    置。
  15. 【請求項15】 前記目的音強調部は、 適応ビームフォーマ及び固定ビームフォーマの少なくと
    も一方によって構成されることを特徴とする請求項9又
    は11のいずれか一方に記載の音声認識用雑音抑圧装
    置。
  16. 【請求項16】 前記目的音強調部は、 前記複数チャネルの入力音声信号の1つを前記目的音強
    調信号として出力することを特徴とする請求項9又は1
    1のいずれか一方に記載の音声認識用雑音抑圧装置。
  17. 【請求項17】 マイクロホンアレーの複数チャネルの
    入力音声信号が与えられて、目的音を消去して目的音消
    去信号を出力するステップと、 前記目的音消去信号を周波数分析して雑音成分のスペク
    トル情報を計算する雑音スペクトル情報抽出ステップ
    と、 前記複数チャネルの入力音声信号が与えられて、前記目
    的音を強調して目的音強調信号を出力するステップと、 前記目的音強調信号を周波数分析して目的音のスペクト
    ル情報を計算する目的音スペクトル情報抽出ステップ
    と、 前記雑音成分のスペクトル情報と前記目的音のスペクト
    ル情報とに基づいて、目的音に対する周波数帯域毎の雑
    音の重畳の度合いである雑音重畳度を所定の単位時間毎
    に推定する雑音重畳度推定ステップとを具備したことを
    特徴とする音声認識用雑音抑圧方法。
  18. 【請求項18】 請求項17に記載の音声認識用雑音抑
    圧方法の各ステップと、 前記目的音スペクトル情報を前記雑音重畳推定ステップ
    において推定した雑音重畳度に基づいて雑音の影響を除
    くように修正して出力するスペクトル情報修正ステップ
    とを具備したことを特徴とする音声認識方法。
  19. 【請求項19】 コンピュータに、 マイクロホンアレーの複数チャネルの入力音声信号が与
    えられて、目的音を消去して目的音消去信号を出力する
    処理と、 前記目的音消去信号を周波数分析して雑音成分のスペク
    トル情報を計算する雑音スペクトル情報抽出処理と、 前記複数チャネルの入力音声信号が与えられて、前記目
    的音を強調して目的音強調信号を出力する処理と、 前記目的音強調信号を周波数分析して目的音のスペクト
    ル情報を計算する目的音スペクトル情報抽出処理と、 前記雑音成分のスペクトル情報と前記目的音のスペクト
    ル情報とに基づいて、目的音に対する周波数帯域毎の雑
    音の重畳の度合いである雑音重畳度を所定の単位時間毎
    に推定する雑音重畳度推定処理とを実行させるための音
    声認識用雑音抑圧プログラム。
  20. 【請求項20】 請求項19に記載の音声認識用雑音抑
    圧プログラムの各処理と、 前記目的音スペクトル情報を前記雑音重畳推定処理にお
    いて推定した雑音重畳度に基づいて雑音の影響を除くよ
    うに修正して出力するスペクトル情報修正処理とを具備
    したことを特徴とする音声認識プログラム。
  21. 【請求項21】 マイクロホンアレーの複数チャネルの
    入力音声信号を各々のチャネル毎に周波数分析する周波
    数分析ステップと、 前記複数チャネルの入力スペクトル情報が入力され、入
    力された前記入力スペクトル情報中の目的音を強調して
    目的音のスペクトル情報を計算する目的音強調ステップ
    と、 前記目的音スペクトル情報を分析して音声認識の対象で
    ある目的音特徴ベクトルを抽出する目的音特徴ベクトル
    抽出ステップと、 前記複数チャネルの入力スペクトル情報に基づいてこの
    入力スペクトル情報中に含まれる目的音の成分を消去し
    雑音のスペクトル情報を計算する目的音消去ステップ
    と、 前記目的消去ステップにより得られた雑音スペクトル情
    報を分析して雑音に関する目的音特徴ベクトルを抽出す
    る雑音特徴ベクトル抽出ステップと、 前記雑音特徴ベクトル抽出ステップにより得られた雑音
    特徴ベクトルと前記目的音特徴ベクトル抽出ステップに
    より得られた目的音特徴ベクトルとに基づいて雑音の重
    畳の度合いである雑音重畳度を目的音の特徴ベクトルの
    成分毎で単位時間毎に推定する雑音重畳度推定ステッ
    プ、 前記目的音の特徴ベクトルの全成分数のうち前記雑音重
    畳度が所定の閾値を越えた前記目的音の特徴ベクトルの
    成分数が所定の割合を超えたか否かによって、前記目的
    音の特徴ベクトルの修正の可否を判断する特徴ベクトル
    修正制御ステップとを具備したことを特徴とする音声認
    識方法。
JP2002072881A 2002-03-15 2002-03-15 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム Pending JP2003271191A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002072881A JP2003271191A (ja) 2002-03-15 2002-03-15 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム
US10/387,580 US20030177007A1 (en) 2002-03-15 2003-03-14 Noise suppression apparatus and method for speech recognition, and speech recognition apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002072881A JP2003271191A (ja) 2002-03-15 2002-03-15 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム

Publications (1)

Publication Number Publication Date
JP2003271191A true JP2003271191A (ja) 2003-09-25

Family

ID=28035198

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002072881A Pending JP2003271191A (ja) 2002-03-15 2002-03-15 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム

Country Status (2)

Country Link
US (1) US20030177007A1 (ja)
JP (1) JP2003271191A (ja)

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006094522A (ja) * 2004-09-23 2006-04-06 Harman Becker Automotive Systems Gmbh ノイズ低減による多重チャンネル適応の音声信号処理
WO2006077745A1 (ja) * 2005-01-20 2006-07-27 Nec Corporation 信号除去方法、信号除去システムおよび信号除去プログラム
WO2007123051A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及び適応アレイ処理装置、方法、プログラム
WO2007123048A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム
WO2007123052A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及び適応アレイ処理装置、方法、プログラム
WO2007123047A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム
JP2007336232A (ja) * 2006-06-15 2007-12-27 Nippon Telegr & Teleph Corp <Ntt> 特定方向収音装置、特定方向収音プログラム、記録媒体
JP2008304555A (ja) * 2007-06-05 2008-12-18 Panasonic Electric Works Co Ltd 音響入力装置
US7533015B2 (en) 2004-03-01 2009-05-12 International Business Machines Corporation Signal enhancement via noise reduction for speech recognition
JPWO2008004499A1 (ja) * 2006-07-03 2009-12-03 日本電気株式会社 雑音抑圧の方法、装置、及びプログラム
KR20100040664A (ko) * 2008-10-10 2010-04-20 삼성전자주식회사 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치
WO2010079526A1 (ja) * 2009-01-06 2010-07-15 三菱電機株式会社 雑音除去装置及び雑音除去プログラム
JP2010193323A (ja) * 2009-02-19 2010-09-02 Casio Hitachi Mobile Communications Co Ltd 録音装置、再生装置、録音方法、再生方法、及びコンピュータプログラム
JP2011522294A (ja) * 2008-05-29 2011-07-28 クゥアルコム・インコーポレイテッド スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品
JP2011527025A (ja) * 2008-06-30 2011-10-20 オーディエンス,インコーポレイテッド ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法
WO2012070671A1 (ja) * 2010-11-24 2012-05-31 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
EP2466581A2 (en) 2010-12-17 2012-06-20 Fujitsu Limited Sound processing apparatus and sound processing program
JP2012189907A (ja) * 2011-03-11 2012-10-04 Toshiba Corp 音声判別装置、音声判別方法および音声判別プログラム
JP2012189906A (ja) * 2011-03-11 2012-10-04 Toshiba Corp 音声判別装置、音声判別方法および音声判別プログラム
WO2013089536A1 (ko) * 2011-12-16 2013-06-20 서강대학교 산학협력단 관심음원 제거방법 및 그에 따른 음성인식방법 및 음성인식장치
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
WO2014160329A1 (en) * 2013-03-13 2014-10-02 Kopin Corporation Dual stage noise reduction architecture for desired signal extraction
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
JP2015127768A (ja) * 2013-12-27 2015-07-09 富士ゼロックス株式会社 信号解析装置、信号解析システムおよびプログラム
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
US9280985B2 (en) 2012-12-27 2016-03-08 Canon Kabushiki Kaisha Noise suppression apparatus and control method thereof
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
WO2017046888A1 (ja) * 2015-09-16 2017-03-23 株式会社東芝 集音装置、集音方法およびプログラム
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression
US9830899B1 (en) 2006-05-25 2017-11-28 Knowles Electronics, Llc Adaptive noise cancellation
WO2018016044A1 (ja) * 2016-07-21 2018-01-25 三菱電機株式会社 雑音除去装置、エコーキャンセリング装置、異音検出装置および雑音除去方法
JPWO2017002525A1 (ja) * 2015-06-30 2018-04-26 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
US10306389B2 (en) 2013-03-13 2019-05-28 Kopin Corporation Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods
US10339952B2 (en) 2013-03-13 2019-07-02 Kopin Corporation Apparatuses and systems for acoustic channel auto-balancing during multi-channel signal extraction
JPWO2022215199A1 (ja) * 2021-04-07 2022-10-13
US11631421B2 (en) 2015-10-18 2023-04-18 Solos Technology Limited Apparatuses and methods for enhanced speech recognition in variable environments
WO2024069964A1 (ja) * 2022-09-30 2024-04-04 Tdk株式会社 ノイズ処理回路、信号処理装置、ノイズ処理方法、および記録媒体

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4765461B2 (ja) * 2005-07-27 2011-09-07 日本電気株式会社 雑音抑圧システムと方法及びプログラム
KR20080111290A (ko) * 2007-06-18 2008-12-23 삼성전자주식회사 원거리 음성 인식을 위한 음성 성능을 평가하는 시스템 및방법
US8249867B2 (en) * 2007-12-11 2012-08-21 Electronics And Telecommunications Research Institute Microphone array based speech recognition system and target speech extracting method of the system
EP2081189B1 (en) * 2008-01-17 2010-09-22 Harman Becker Automotive Systems GmbH Post-filter for beamforming means
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
CN102044241B (zh) 2009-10-15 2012-04-04 华为技术有限公司 一种实现通信系统中背景噪声的跟踪的方法和装置
US8725506B2 (en) * 2010-06-30 2014-05-13 Intel Corporation Speech audio processing
US8929564B2 (en) 2011-03-03 2015-01-06 Microsoft Corporation Noise adaptive beamforming for microphone arrays
WO2019002831A1 (en) 2017-06-27 2019-01-03 Cirrus Logic International Semiconductor Limited REPRODUCTIVE ATTACK DETECTION
GB201713697D0 (en) 2017-06-28 2017-10-11 Cirrus Logic Int Semiconductor Ltd Magnetic detection of replay attack
GB2563953A (en) 2017-06-28 2019-01-02 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
CN109215640B (zh) * 2017-06-30 2021-06-01 深圳大森智能科技有限公司 语音识别方法、智能终端及计算机可读存储介质
GB201801532D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for audio playback
GB201801527D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Method, apparatus and systems for biometric processes
GB201801528D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Method, apparatus and systems for biometric processes
GB201801530D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for authentication
GB201801526D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for authentication
JP6644197B2 (ja) * 2017-09-07 2020-02-12 三菱電機株式会社 雑音除去装置および雑音除去方法
GB201801663D0 (en) 2017-10-13 2018-03-21 Cirrus Logic Int Semiconductor Ltd Detection of liveness
GB201804843D0 (en) * 2017-11-14 2018-05-09 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
GB201801874D0 (en) 2017-10-13 2018-03-21 Cirrus Logic Int Semiconductor Ltd Improving robustness of speech processing system against ultrasound and dolphin attacks
GB2567503A (en) 2017-10-13 2019-04-17 Cirrus Logic Int Semiconductor Ltd Analysing speech signals
GB201803570D0 (en) 2017-10-13 2018-04-18 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
GB201801664D0 (en) 2017-10-13 2018-03-21 Cirrus Logic Int Semiconductor Ltd Detection of liveness
GB201801659D0 (en) 2017-11-14 2018-03-21 Cirrus Logic Int Semiconductor Ltd Detection of loudspeaker playback
US11475899B2 (en) 2018-01-23 2022-10-18 Cirrus Logic, Inc. Speaker identification
US11264037B2 (en) 2018-01-23 2022-03-01 Cirrus Logic, Inc. Speaker identification
US11735189B2 (en) 2018-01-23 2023-08-22 Cirrus Logic, Inc. Speaker identification
WO2019220768A1 (ja) * 2018-05-18 2019-11-21 ソニー株式会社 信号処理装置、信号処理方法、プログラム
US10692490B2 (en) 2018-07-31 2020-06-23 Cirrus Logic, Inc. Detection of replay attack
US10915614B2 (en) 2018-08-31 2021-02-09 Cirrus Logic, Inc. Biometric authentication
US11037574B2 (en) 2018-09-05 2021-06-15 Cirrus Logic, Inc. Speaker recognition and speaker change detection
KR20200132613A (ko) 2019-05-16 2020-11-25 삼성전자주식회사 웨이크 언 보이스(Wake on Voice, WoV) 기술을 이용한 음성 인식 수행 방법 및 장치
TWI751866B (zh) * 2020-12-29 2022-01-01 仁寶電腦工業股份有限公司 影音通訊系統及其控制方法
US11404061B1 (en) * 2021-01-11 2022-08-02 Ford Global Technologies, Llc Speech filtering for masks

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4956867A (en) * 1989-04-20 1990-09-11 Massachusetts Institute Of Technology Adaptive beamforming for noise reduction
WO1997023068A2 (en) * 1995-12-15 1997-06-26 Philips Electronic N.V. An adaptive noise cancelling arrangement, a noise reduction system and a transceiver
JP4163294B2 (ja) * 1998-07-31 2008-10-08 株式会社東芝 雑音抑圧処理装置および雑音抑圧処理方法
US20030179888A1 (en) * 2002-03-05 2003-09-25 Burnett Gregory C. Voice activity detection (VAD) devices and methods for use with noise suppression systems
JP2002221988A (ja) * 2001-01-25 2002-08-09 Toshiba Corp 音声信号の雑音抑圧方法と装置及び音声認識装置
US6937980B2 (en) * 2001-10-02 2005-08-30 Telefonaktiebolaget Lm Ericsson (Publ) Speech recognition using microphone antenna array

Cited By (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7533015B2 (en) 2004-03-01 2009-05-12 International Business Machines Corporation Signal enhancement via noise reduction for speech recognition
US7895038B2 (en) 2004-03-01 2011-02-22 International Business Machines Corporation Signal enhancement via noise reduction for speech recognition
US8194872B2 (en) 2004-09-23 2012-06-05 Nuance Communications, Inc. Multi-channel adaptive speech signal processing system with noise reduction
JP2006094522A (ja) * 2004-09-23 2006-04-06 Harman Becker Automotive Systems Gmbh ノイズ低減による多重チャンネル適応の音声信号処理
WO2006077745A1 (ja) * 2005-01-20 2006-07-27 Nec Corporation 信号除去方法、信号除去システムおよび信号除去プログラム
JP4862656B2 (ja) * 2005-01-20 2012-01-25 日本電気株式会社 信号除去方法、信号除去システムおよび信号除去プログラム
US7925504B2 (en) 2005-01-20 2011-04-12 Nec Corporation System, method, device, and program for removing one or more signals incoming from one or more directions
WO2007123047A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム
WO2007123048A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及びこれを利用した適応アレイ処理装置、方法、プログラム
WO2007123051A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及び適応アレイ処理装置、方法、プログラム
US8174935B2 (en) 2006-04-20 2012-05-08 Nec Corporation Adaptive array control device, method and program, and adaptive array processing device, method and program using the same
US8014230B2 (en) 2006-04-20 2011-09-06 Nec Corporation Adaptive array control device, method and program, and adaptive array processing device, method and program using the same
WO2007123052A1 (ja) * 2006-04-20 2007-11-01 Nec Corporation 適応アレイ制御装置、方法、プログラム、及び適応アレイ処理装置、方法、プログラム
US8106827B2 (en) 2006-04-20 2012-01-31 Nec Corporation Adaptive array control device, method and program, and adaptive array processing device, method and program
US9830899B1 (en) 2006-05-25 2017-11-28 Knowles Electronics, Llc Adaptive noise cancellation
JP2007336232A (ja) * 2006-06-15 2007-12-27 Nippon Telegr & Teleph Corp <Ntt> 特定方向収音装置、特定方向収音プログラム、記録媒体
JP4724054B2 (ja) * 2006-06-15 2011-07-13 日本電信電話株式会社 特定方向収音装置、特定方向収音プログラム、記録媒体
JP5435204B2 (ja) * 2006-07-03 2014-03-05 日本電気株式会社 雑音抑圧の方法、装置、及びプログラム
US10811026B2 (en) 2006-07-03 2020-10-20 Nec Corporation Noise suppression method, device, and program
JPWO2008004499A1 (ja) * 2006-07-03 2009-12-03 日本電気株式会社 雑音抑圧の方法、装置、及びプログラム
JP2008304555A (ja) * 2007-06-05 2008-12-18 Panasonic Electric Works Co Ltd 音響入力装置
US8831936B2 (en) 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
JP2011522294A (ja) * 2008-05-29 2011-07-28 クゥアルコム・インコーポレイテッド スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品
JP2011527025A (ja) * 2008-06-30 2011-10-20 オーディエンス,インコーポレイテッド ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US9159335B2 (en) 2008-10-10 2015-10-13 Samsung Electronics Co., Ltd. Apparatus and method for noise estimation, and noise reduction apparatus employing the same
KR20100040664A (ko) * 2008-10-10 2010-04-20 삼성전자주식회사 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치
JP2010092054A (ja) * 2008-10-10 2010-04-22 Samsung Electronics Co Ltd ノイズ推定装置及び方法とそれを利用したノイズ減少装置
KR101597752B1 (ko) * 2008-10-10 2016-02-24 삼성전자주식회사 잡음 추정 장치 및 방법과, 이를 이용한 잡음 감소 장치
JP5377518B2 (ja) * 2009-01-06 2013-12-25 三菱電機株式会社 雑音除去装置及び雑音除去プログラム
WO2010079526A1 (ja) * 2009-01-06 2010-07-15 三菱電機株式会社 雑音除去装置及び雑音除去プログラム
JP2010193323A (ja) * 2009-02-19 2010-09-02 Casio Hitachi Mobile Communications Co Ltd 録音装置、再生装置、録音方法、再生方法、及びコンピュータプログラム
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US9030240B2 (en) 2010-11-24 2015-05-12 Nec Corporation Signal processing device, signal processing method and computer readable medium
WO2012070671A1 (ja) * 2010-11-24 2012-05-31 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
US9747919B2 (en) 2010-12-17 2017-08-29 Fujitsu Limited Sound processing apparatus and recording medium storing a sound processing program
EP2466581A2 (en) 2010-12-17 2012-06-20 Fujitsu Limited Sound processing apparatus and sound processing program
US9330682B2 (en) 2011-03-11 2016-05-03 Kabushiki Kaisha Toshiba Apparatus and method for discriminating speech, and computer readable medium
JP2012189906A (ja) * 2011-03-11 2012-10-04 Toshiba Corp 音声判別装置、音声判別方法および音声判別プログラム
US9330683B2 (en) 2011-03-11 2016-05-03 Kabushiki Kaisha Toshiba Apparatus and method for discriminating speech of acoustic signal with exclusion of disturbance sound, and non-transitory computer readable medium
JP2012189907A (ja) * 2011-03-11 2012-10-04 Toshiba Corp 音声判別装置、音声判別方法および音声判別プログラム
US9609431B2 (en) 2011-12-16 2017-03-28 Industry-University Cooperation Foundation Sogang University Interested audio source cancellation method and voice recognition method and voice recognition apparatus thereof
WO2013089536A1 (ko) * 2011-12-16 2013-06-20 서강대학교 산학협력단 관심음원 제거방법 및 그에 따른 음성인식방법 및 음성인식장치
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9280985B2 (en) 2012-12-27 2016-03-08 Canon Kabushiki Kaisha Noise suppression apparatus and control method thereof
US10306389B2 (en) 2013-03-13 2019-05-28 Kopin Corporation Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods
WO2014160329A1 (en) * 2013-03-13 2014-10-02 Kopin Corporation Dual stage noise reduction architecture for desired signal extraction
US10339952B2 (en) 2013-03-13 2019-07-02 Kopin Corporation Apparatuses and systems for acoustic channel auto-balancing during multi-channel signal extraction
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
JP2015127768A (ja) * 2013-12-27 2015-07-09 富士ゼロックス株式会社 信号解析装置、信号解析システムおよびプログラム
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression
JPWO2017002525A1 (ja) * 2015-06-30 2018-04-26 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
WO2017046888A1 (ja) * 2015-09-16 2017-03-23 株式会社東芝 集音装置、集音方法およびプログラム
US11631421B2 (en) 2015-10-18 2023-04-18 Solos Technology Limited Apparatuses and methods for enhanced speech recognition in variable environments
JPWO2018016044A1 (ja) * 2016-07-21 2019-01-17 三菱電機株式会社 雑音除去装置、エコーキャンセリング装置、異音検出装置および雑音除去方法
CN109417666A (zh) * 2016-07-21 2019-03-01 三菱电机株式会社 噪声去除装置、回声消除装置、异常音检测装置和噪声去除方法
JP6433630B2 (ja) * 2016-07-21 2018-12-05 三菱電機株式会社 雑音除去装置、エコーキャンセリング装置、異音検出装置および雑音除去方法
US10939198B2 (en) 2016-07-21 2021-03-02 Mitsubishi Electric Corporation Noise eliminating device, echo cancelling device, and abnormal sound detecting device
WO2018016044A1 (ja) * 2016-07-21 2018-01-25 三菱電機株式会社 雑音除去装置、エコーキャンセリング装置、異音検出装置および雑音除去方法
JPWO2022215199A1 (ja) * 2021-04-07 2022-10-13
WO2022215199A1 (ja) * 2021-04-07 2022-10-13 三菱電機株式会社 情報処理装置、出力方法、及び出力プログラム
JP7270869B2 (ja) 2021-04-07 2023-05-10 三菱電機株式会社 情報処理装置、出力方法、及び出力プログラム
WO2024069964A1 (ja) * 2022-09-30 2024-04-04 Tdk株式会社 ノイズ処理回路、信号処理装置、ノイズ処理方法、および記録媒体

Also Published As

Publication number Publication date
US20030177007A1 (en) 2003-09-18

Similar Documents

Publication Publication Date Title
JP2003271191A (ja) 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム
Parchami et al. Recent developments in speech enhancement in the short-time Fourier transform domain
KR101339592B1 (ko) 음원 분리 장치, 음원 분리 방법, 및 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
US9311928B1 (en) Method and system for noise reduction and speech enhancement
KR101228398B1 (ko) 향상된 명료도를 위한 시스템, 방법, 장치 및 컴퓨터 프로그램 제품
JP5738020B2 (ja) 音声認識装置及び音声認識方法
US9215527B1 (en) Multi-band integrated speech separating microphone array processor with adaptive beamforming
US20100082340A1 (en) Speech recognition system and method for generating a mask of the system
KR20080009211A (ko) 음원 분리 장치, 음성 인식 장치, 휴대 전화기, 음원 분리방법, 및, 프로그램
KR20010005674A (ko) 인식 시스템
JP6840302B2 (ja) 情報処理装置、プログラム及び情報処理方法
Schwarz et al. A two-channel reverberation suppression scheme based on blind signal separation and Wiener filtering
EP3847645B1 (en) Determining a room response of a desired source in a reverberant environment
Valin et al. Microphone array post-filter for separation of simultaneous non-stationary sources
Zhang et al. CSA-BF: A constrained switched adaptive beamformer for speech enhancement and recognition in real car environments
Kim Hearing aid speech enhancement using phase difference-controlled dual-microphone generalized sidelobe canceller
WO2006114101A1 (en) Detection of speech present in a noisy signal and speech enhancement making use thereof
Yamamoto et al. Design and implementation of a robot audition system for automatic speech recognition of simultaneous speech
Kim et al. Sound source separation using phase difference and reliable mask selection selection
CN111226278B (zh) 低复杂度的浊音语音检测和基音估计
Martın-Donas et al. A postfiltering approach for dual-microphone smartphones
Prasad et al. Two microphone technique to improve the speech intelligibility under noisy environment
Takada et al. Sound source separation using null-beamforming and spectral subtraction for mobile devices
Potamitis et al. Speech activity detection and enhancement of a moving speaker based on the wideband generalized likelihood ratio and microphone arrays
Pacheco et al. Spectral subtraction for reverberation reduction applied to automatic speech recognition

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070206

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070703