JP2002544552A - 音声認識のための非定常の干渉信号のキャンセル - Google Patents

音声認識のための非定常の干渉信号のキャンセル

Info

Publication number
JP2002544552A
JP2002544552A JP2000617442A JP2000617442A JP2002544552A JP 2002544552 A JP2002544552 A JP 2002544552A JP 2000617442 A JP2000617442 A JP 2000617442A JP 2000617442 A JP2000617442 A JP 2000617442A JP 2002544552 A JP2002544552 A JP 2002544552A
Authority
JP
Japan
Prior art keywords
channel
signal
acoustic
transfer function
interference signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000617442A
Other languages
English (en)
Inventor
ジョン カーレイ,マイケル
デイビット タッターサル,グラハム
Original Assignee
イマジネーション テクノロジーズ リミティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イマジネーション テクノロジーズ リミティド filed Critical イマジネーション テクノロジーズ リミティド
Publication of JP2002544552A publication Critical patent/JP2002544552A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

(57)【要約】 非定常の干渉信号をキャンセルするシステムであり、特に、音声認識アプリケーションのための車内環境(ECAD)機器によって生成される干渉を緩和するために使用される。このシステムは、車内音響チャネルを通過する前および後にECADによって出力される信号をスペクトル分析する。音響チャネルのモデルは、システムのアルゴリズムによって作られる。音声認識に対し、このモデルは、要望音声信号を受信するために、マイクロフォンで受信された信号からスペクトル減算される。音響チャネルのモデルは、ECADによって使われる各スピーカとマイクロフォンとの間の周波数領域の音響の伝達関数を推定することによって作成される。

Description

【発明の詳細な説明】
【0001】 本発明は、非定常の干渉信号(non-stationary interfering signal)をキャン
セルする機器および方法に関する。特に、本発明は、音声認識アプリケーション
に使用される要望音声信号を復元することを目的として、この干渉信号をキャン
セルすることに関する。本発明は、音声認識処理中に車内機器が干渉信号を発す
る自動車において使用されるのに特に適している。
【0002】 音声認識に関連する問題としては、干渉信号の存在時での性能を維持し、音声
認識処理が、暗雑音が存在するときでも満足に機能し続けることである。公知の
システムは、電話のチャネル雑音もしくは車の雑音のような擬似定常雑音(quasi
-stationary noise)の影響を軽減するように仕向けられている。擬似定常雑音に
ついて提案された解決策は、スペクトル減算、ウェイナーフィルタリング(Weine
r filtering)、および並列モデル結合を含み、そのそれぞれがスペクトル領域で
働く。
【0003】 しかし、音声認識アプリケーションの性能を悪化させる音響環境において、そ
の他の干渉ソースが存在する。自動車環境の例では、エンジン雑音に加えて、潜
在的に干渉する非定常音響信号の他のソースとして、車内で動作する電子機器に
よって発生する音を含んでいる。このような機器の例としては、ラジオ、コンパ
クトディスクプレイヤおよびテーププレイヤなどの車内エンターテイメントアク
セサリ、あるいは例えば電話の呼出し音もしくはナビゲーションシステムの警告
音などの音波信号を発生し得る他のタイプの機器がある。本明細書では、音響信
号を発し、かつ、乗り物内で動作することができる電子機器を、「電子車内音響
機器(Electronic in−car Acoustic Devices : ECAD)」として総称的に呼ぶこ
とにする。
【0004】 ECADにより生成される音は、ユーザがボイスコマンドを使う機器を制御し
ようとするときに存在し得る。例えば、ラジオは、ユーザがナビゲーションシス
テムもしくはラジオ自体のボイスコントロールを使おうとするときに車内でプレ
イされる。この場合では、ラジオによって生成されるオリジナルの干渉信号は、
知ることができかつアクセスできるものであるが、ラジオのスピーカと音声認識
システムのマイクロフォンとの間の未知の音響経路を通過するものと仮定する。
この音響経路は、乗員の人数および車の内部における荷物の存在などのような他
の要素と、車の内部にあるスピーカおよびマイクロフォンの位置とによって判定
することができる。
【0005】 非定常干渉の問題を克服することを試みる公知のシステムは、時間領域適応フ
ィルタに基づいている。しかし、適応フィルタリングが満足の行く結果をもたら
したとしても、この手法には、いくつかの欠点がある。この欠点は、高い計算機
的要件と適応フィルタアルゴリズムの低い収斂性を含んでいるのである。適応フ
ィルタリングの簡単な形状は、サンプル当り3Nのオーダーの計算が必要であろ
う。この高い計算機的要件は、必要なフィルタリングを実行するために複雑なハ
ードウェアが必要であろうことを意味するものであり、したがって、この技術を
消費者に対し導入する機器のコストが増加すること。
【0006】 本発明の第1の態様によれば、音声認識に対し1つもしくはそれより多い非定
常の干渉信号をキャンセルする機器が提供され、この機器は、 音響信号を受信する手段と、 非定常の干渉信号のスペクトルの大きさの推定値を生成する手段と、 受信した音響信号から推定値を減算して、要望音声スペクトルの大きさの表示
を生成する手段と、を備える。
【0007】 好適には、推定値を生成する手段は、非定常の干渉信号の各ソースと音響信号
を受信する手段との間の音響チャネルの伝達関数を推定するように構成された処
理手段を含む。
【0008】 好適には、上記処理手段は、左および右のステレオチャネル伝送によって生成
される非定常の干渉信号に対して伝達関数を推定するように構成される。
【0009】 好適には、上記伝達関数の推定は、連続する時間周期からなるフレームごとに
反復アルゴリズムを実行する上記処理手段によって達成される。
【0010】 好適には、上記処理手段は、上述の左および右のチャネルの干渉信号の大きさ
を推定するように構成され、 左のチャネルの干渉信号の大きさは、現時点の反復処理の間に受信された音響
信号から、前の反復処理の間に推定された右のチャネルの干渉信号の大きさを減
算することによって推定され、 右のチャネルの干渉信号の大きさは、現時点の反復処理の間に受信された音響
信号から、前の反復処理の間に推定された左のチャネルの干渉信号の大きさを減
算することによって推定される。
【0011】 好適には、右のステレオ音響チャネルに対する伝達関数の推定値は、右の音響
ステレオチャネルから伝送された干渉信号で右のチャネル干渉の大きさの推定値
を割り算することによって判定され、 左のステレオ音響チャネルに対する伝達関数の推定値は、左の音響ステレオチ
ャネルから伝送された干渉信号で左のチャネル干渉の大きさの推定値を割り算す
ることによって判定される。
【0012】 好適には、右の音響チャネルの伝達関数の推定は、右の音響ステレオチャネル
の干渉信号の全エネルギーの左の音響ステレオチャネルの干渉信号の全エネルギ
ーに対する比が所定のしきい値を越えた場合のみ、反復処理中に実行され、 左の音響チャネルの伝達関数の推定は、左の音響ステレオチャネルの干渉信号
の全エネルギーの右の音響ステレオチャネルの干渉信号の全エネルギーに対する
比が所定のしきい値を越えた場合のみ、反復処理中に実行される。
【0013】 好適には、上記比としきい値との比較は、信号スペクトルの個々の周波数要素
に適用される。
【0014】 好適には、η(k)を周波数インデックスkでの左および右の干渉信号のコヒ
ーレンスとしたとき、左および右のステレオ音響チャネルの伝達関数は(1−|
η(k)|)で掛け算される。
【0015】 好適には、右のステレオ音響チャネルに対する伝達関数の推定値は、次式を使
うことによって得られる。
【0016】
【数5】
【0017】 左のステレオ音響チャネルに対する伝達関数の推定値は、次式を使うことによ
って得られる。
【0018】
【数6】
【0019】 なお、ここで、左および右のステレオチャネルの信号の共通項をC(k)とし
、共通の左および右のステレオチャネル伝送と右のステレオチャネルと間の伝達
関数をHCR(k)としたとき、R”(k)=HCR(k)・C(k)であり、共通
の左および右のステレオチャネル伝送と左のステレオチャネル信号との間の伝達
関数がHCL(k)としたとき、L”(k)=L(k)−HCL(k)・C(k)で
ある。
【0020】 好適には、ここで、上記処理手段は、時間領域において推定された伝達関数を
平滑化する手段をさらに備える。
【0021】 好適には、ここで、時間領域で平滑化する上記手段は、1次の再帰フィルタを
備える。
【0022】 好適には、上記処理手段は、周波数領域において推定された伝達関数を平滑化
する手段をさらに備える。
【0023】 好適には、周波数領域で平滑化する上記手段は、有限インパルス応答フィルタ
を備える。
【0024】 好適には、上記処理手段は、フーリエ変換を実行する手段を含む。
【0025】 好適には、上記非定常の干渉信号は、乗り物内で動作する電子音響機器によっ
て生成される。
【0026】 好適には、音響信号を受信する手段は、マイクロフォンを備える。
【0027】 本発明の第2の態様によれば、音声認識に対して1つまたはそれより多い非定
常の干渉信号をキャンセルする方法が提供され、この方法は、 音響信号を受信するステップと、 非定常の干渉信号のスペクトルの大きさに対して推定値を生成するステップと
、 受信した音響信号から推定値を減算して、要望音声の大きさのスペクトルの表
現を生成するステップと、を備える。
【0028】 好適には、推定値を生成する上記ステップは、非定常の干渉信号の各ソースと
音響信号とを受信する手段との間の音響チャネルに対して伝達関数を推定するこ
とを備える。
【0029】 好適には、上述の伝達関数は、左および右のステレオチャネル伝送によって生
成された非定常の干渉信号に対して推定される。
【0030】 好適には、推定値を生成する上記ステップは、フレームごとに反復して実行さ
れる。
【0031】 好適には、伝達関数を推定するステップは、左のチャネルの干渉信号の大きさ
を、現時点の反復処理の間に受信された音響信号から、前の反復処理の間に推定
された右のチャネルの干渉信号の大きさを減算することによって推定することと
、 右のチャネルの干渉信号の大きさを、現時点の反復処理の間に受信された音声
信号から、前の反復処理の間に推定された左のチャネルの干渉信号の大きさを減
算することによって推定することと、を含む。
【0032】 本方法は、 右の音響ステレオチャネルから伝送された干渉信号で右のチャネル干渉の大き
さの推定値を割り算することと、 左の音響ステレオチャネルから伝送された干渉信号で左のチャネル干渉の大き
さの推定値を割り算することと、を備える。
【0033】 好適には、右の音響チャネルの伝達関数を推定する上記ステップは、右の音響
ステレオチャネルの干渉信号の全エネルギーの左の音響ステレオチャネルの干渉
信号の全エネルギーに対する比が所定のしきい値を越えた場合のみ、反復処理中
に実行され、 左の音響チャネルの伝達関数を推定する上記ステップは、右の音響ステレオチ
ャネルの干渉信号の全エネルギーの対左の音響ステレオチャネルの干渉信号の全
エネルギーに対する比が所定のしきい値を越えた場合のみ、反復処理中に実行さ
れる。
【0034】 好適には、上記比としきい値との比較は、信号スペクトルの個々の周波数要素
に適用される。
【0035】 好適には、η(k)を周波数インデックスkでの左および右の干渉信号のコヒ
ーレンスとしたとき、左および右のステレオ音響チャネルの伝達関数は(1−|
η(k)|)で掛け算される。
【0036】 好適には、右のステレオ音響チャネルに対する伝達関数の推定値は、式を使う
ことによって得られる。
【0037】 好適には、本態様は、時間領域において推定された伝達関数を平滑化するステ
ップを備えていてもよい。
【0038】 好適には、周波数領域において推定された伝達関数を平滑化するステップをさ
らに備えていてもよい。
【0039】 本発明の第3の態様によれば、本発明の第1の態様による機器を含む音声認識
システムが提供される。本発明の第4の態様によれば、本発明の第1の態様によ
る機器を含む電子音響機器が提供される。
【0040】 本発明は、(公知のシステムにおいて使われるような時間領域よりむしろ)周
波数領域に係る技術的解決策であり、これは、好適には、スペクトル減算が付随
するチャネル識別に基づく。本適用のシステムの実施例は、非定常干渉が存在す
るときにおける音響認識システムの性能を本質的に改善することができるが、公
知のシステムより計算機的要件が低いという利点を有する。
【0041】 本適用のシステムの実施例は、音声認識システムの性能を実質的に改善するの
に十分なレベルの非定常干渉のキャンセルを提供するが、典型的には、暗雑音が
ECADによって出力される場合において約10デシベルのキャンセルが可能で
ある。しかし、このようなレベルのキャンセルは、聞き手に満足を与えることは
できないであろう。音声認識アプリケーションのためのこのようなレベルのキャ
ンセルは、実質的にはシステムの性能を改善するであろう。聞き手は、要望信号
のレベルより40デシベル低い干渉レベルに対して敏感であるが、公知の音声認
識システムは、15デシベルの信号対雑音比でよく動作できる。
【0042】 ラジオのようなECADによって出力された干渉信号は、モノラルもしくはス
テレオにより伝送されるものであってもよく、典型的には、自動車内の別個の場
所に位置する2つのスピーカから出力される。ここで、説明のため、ケプストラ
ム(cepstra)のような認識特徴セットは位相情報を正常に含んでいるわ
けではないので干渉信号の位相が音声認識システムにおいて必要ではないと一般
的に仮定する。
【0043】 本発明は、種々のやり方で実行することができ、その特定の実施例は、添付の
図面を参照して、単なる例示として説明されるものである。
【0044】 図1は、別々のスピーカからステレオECAD信号が送信される単純な状況を
例示している。左のステレオ信号L(jω)は左のスピーカ101から送信され
、右のステレオ信号R(jω)は右のスピーカ102から送信される。
【0045】 スピーカ101および102は、典型的には、運転手および乗員のところのド
ア上の羽目板に配置される。さらに、スピーカもまた乗り物内に取り付けられて
もよく、例えば、車の後部のブーツ入れに位置することができる。2つのスピー
カで使われる目的でここで説明する特定の実施例は種々の数のスピーカで機能す
るように変更することもできるが、このスピーカは、車内にある他のスピーカか
ら出力される信号に相互に関係する信号を生成するように構成しても構成しなく
てもよいということは、当業者であれば理解できよう。
【0046】 図1は、機器を制御する音声認識システムによって使われる音響信号を受信す
るために、ラジオのような車内電子機器に好ましくは接続されるマイクロフォン
103を含んでいる。
【0047】 電子機器を制御する音声認識システムによって処理されるユーザのボイスコマ
ンドは、要望音声信号S(jω)104として表される。
【0048】 マイクロフォンで受信された音響信号のスペクトルは、Y(ω)で示され、要
望信号S(jω)と、車内環境によって画定される音響チャネルを通過するスピ
ーカによって生成される信号と、の組合せを含む成分を備える。
【0049】 要望していないECADのステレオ信号L(jω)およびR(jω)を完全に
キャンセルすることは、右スピーカ102とマイクロフォン103との間の音響
経路に関する音響の伝達関数HAR(jω)と、左スピーカ101とマイクロフォ
ン103との間の音響経路に関する音響の伝達関数HAL(jω)と、を知ること
によって、原理的には達成できる。伝達関数HAL(jω)およびHAR(jω)が
わかっている場合、モノラルのマイクロフォン103で受信された信号Y(jω
)から、HAL(jω)によって伝達された左のステレオソース信号L(jω)と
AR(jω)によって伝達された右のステレオソース信号R(jω)とを減算す
ることによって、ユーザによって話された要望音声コマンドに対応する信号を取
り出すことができる。しかし、実際はソース信号L(jω)およびR(jω)が
これらを発するラジオからアクセスできるにもかかわらず、音響の伝達関数HAR (jω)およびHAL(jω)は推定できるのみである。
【0050】 音響の伝達関数の推定値への簡単なアプローチは、マイクロフォン信号のスペ
クトルとソースステレオ信号のそれぞれとの長時間比(long term ratio)を見つ
けることである。ここで、次の式は、右の音響チャネルに対する処理を記述して
いる。当業者であれば、同様の式が左の音響チャネルに対しても導けることが理
解できよう。右の音響チャネルに対する基本的な伝達関数HARは、次のとおりで
ある。
【0051】
【数7】
【0052】 マイクロフォン信号で受信された信号Y(jω)のスペクトルは、次のとおり
である。
【0053】
【数8】
【0054】 式(1)においてY(jω)を代入すると次が得られる。
【0055】
【数9】
【0056】 以下の結論は、式(3)によって導き出せるものである。 ・ スピーカ101および102を通じて出力されるモノラル送信の場合、ユー
ザがボイスコマンドを発すると、信号L(jω)およびR(jω)は、相互に完
全に相関するが、S(jω)とは完全には相関するわけではない。この場合、個
々の左および右のチャネルの伝達関数はユニークには判定することができないが
、左および右の双方のチャネルに起因するタームを含む混成の推定値を得ること
ができる。マイクロフォンで受信された、2つのスピーカを通じて出力されたモ
ノラルのECAD信号を実際的にキャンセルするには十分である。 ・ L(jω)とR(jω)とS(jω)とが全て相関していない場合、式(3
)の第2および第3項の長時間平均は通常は0であるので、チャネル応答の正し
い推定値が得られる。 ・ L(jω)とR(jω)とが部分的に相関している場合、左および右の音響
チャネルを明白に推定できるというわけではない。しかし、L(jω)とR(j
ω)とが異なるスペクトル領域を占める場合、あるいは、対応する時間領域信号
l(t)とr(t)とが一方が低いエネルギーを有しもう一方が高いエネルギー
を有する期間を持つ場合、キャンセルを目的とした左および右のチャネルの有用
な推定値を作ることはまだ可能であろう。
【0057】 式(3)によって得られる右の音響チャネル応答の周波数領域の推定値、およ
び、左の音響チャネルの伝達関数HAL(Jω)についての同様の式は、要望音声
スペクトルS(jω)の大きさの推定値を得るのに使うことができる。要望音声
スペクトルの大きさの推定値は、マイクロフォンで受信された音響信号Y(jω
)からECAD信号の左および右の音響チャネルの推定値を減算することによっ
て得ることができる。
【0058】
【数10】
【0059】 右の音響チャネルについての音響チャネルパワーの伝達関数の推定値は、式(
3)を2乗することによって得られ、次のとおりである。
【0060】
【数11】
【0061】 左の音響チャネルについての音響チャネルパワーの伝達関数の同様の推定値は
、当業者であれば導き出せよう。
【0062】 時間および周波数のディメンジョンが結合された反復アプローチを使って、チ
ャネル応答の推定値を平滑化することを、上述の左および右の信号の相関により
生じる問題を克服するのに使うことができる。チャネル応答の位相情報が無視で
きることにより、解決する努力が必要となる別の問題が生じるが、干渉の位相が
、音声認識システムで通常は必要とされないからである。上記のように、音声認
識を目的とするキャンセルは、音声スペクトルの大きさの推定値に必要であるの
みであるが、これは、好適な実施例における音声認識システムによって使われる
メル周波数ケプストラル係数(Mel Frequency Cepstral Co−efficient:MFFC)
特徴ベクトルがスペクトルの大きさに基づくからである。MFCCは、種々の周
波数スロットでのパワーを得るために、周波数領域での音声スペクトルを高速フ
ーリエ変換することによって得られる。周波数領域でのパワーの値は、要素が直
交するケプストラムを得るために、log関数にされそしてコサイン変換される
【0063】 通常は、位相特性は、音響の伝達関数に関連する周波数依存遅延拡散をエンコ
ードする。車においては、典型的には、最小遅延が約3msである。遅延拡散は
、式(5)を使ってチャネル推定されたときに補償される。しかし、この補償は
、チャネル遅延よりも大きいブロック長でする高速フーリエ変換を使ってスペク
トル評価がなされた場合、不必要となろう。
【0064】 しかし、ECADによって生成されるもののような非定常の干渉信号をキャン
セルする実際の形式は、添付の図面の図2のステップによって例示されたアルゴ
リズム200を使って達成することができる。好適な実施例では、ステップ20
1〜205は、各単一フレーム(例えば、一定の時間期間でマイクロフォンで受
信された信号)に対して繰り返されるが、しかし、初期化ステップ201および
202は、1番目のフレームに対して実行されるのみである。ステップ201で
は、左および右のチャネルの伝達関数の大きさの推定値であるHAL(jω)およ
びHAR(jω)が初期化される(ゼロに設定される)。
【0065】
【数12】
【0066】 ステップ202では、左および右のチャネルの干渉の大きさの推定値であるC L およびCRが初期化される。
【0067】
【数13】
【0068】 ステップ203では、マイクロフォンにおける左および右の干渉信号の大きさ
の新しい推定値が計算される。これは、現時点の反復処理(n)の間において受
信したマイクロフォン信号から、右のチャネルの大きさのチャネル推定値(すぐ
前のフレームについてアルゴリズムの反復処理中に計算された)を減算すること
によって、左のマイクロフォン信号が得られる。右の干渉チャネルに対しては、
前の反復処理(n−1)中に導き出された左のチャネルに対する大きさの推定値
はマイクロフォン信号から減算される。
【0069】
【数14】
【0070】
【数15】
【0071】 ステップ204において、左および右の伝達関数の大雑把な推定値であるHAL (jω)およびHAR(jω)が作成される。ステップ203で計算された推定さ
れた左の干渉信号を、左のステレオ音響チャネルから送信された信号で割り算す
ることによって、左のチャネルの伝達関数が得られる。右の伝達関数については
、ステップ203で計算された右のチャネルの干渉信号の推定値は、右の音響ス
テレオチャネルから送信された信号によって割り算される。
【0072】
【数16】
【0073】
【数17】
【0074】 式(6)および(7)を式(8)および(9)の推定された干渉信号について
の項にそれぞれ代入すると、左および右のチャネルの伝達関数の大雑把な推定値
を得るのに使われる式が得られる。
【0075】
【数18】
【0076】 ステップ205では、ステップ204で得られたチャネルの伝達関数の大雑把
な推定値が、好適には時間および周波数の両方の領域において、平滑化される。
時間平滑化は、数百ミリ秒の時定数を使って1次の再帰フィルタで達成される。
例えば、右のチャネルに対する時間平滑化は、次のとおりである(同様の式もま
た得ることができる)。
【0077】
【数19】
【0078】 好適には、周波数平滑化は、約300ヘルツをカバーする三角インパルス応答
で、(次の式でf(ω)によって表される)有限インパルス応答フィルタを使っ
て達成される。右のチャネルの周波数平滑化は、次のとおりである(左のチャネ
ルに対しても同様の式を得ることができる)。
【0079】
【数20】
【0080】 上述のステップ201〜205で記述されたキャンセルアルゴリズム200を
、左および右のチャネルの信号の相関に関する式(3)によって強調された問題
を取り扱うことを試みるために、以下に記述される4つのやり方によって、洗練
させることができる。 1.平滑化されたチャネルの推定値を提供する再帰フィルタの更新によって、一
方のチャネルのエネルギーが他のチャネルのエネルギーを越えないように抑制す
ることができる。これは、それぞれ左のみまたは右のみのチャネルがアクティブ
であると仮定したときのみ、左および右のチャネル応答を更新することによって
好適には達成される。こうして、右のステレオ音響チャネルから送信された信号
の全エネルギーの左のステレオ音響チャネルから送信された信号の全エネルギー
による比が所定のしきい値を越えた場合、ステップ204において新しい音響チ
ャネルの伝達関数が推定され、そうでないければ、前のフレームの反復処理中に
伝達関数に対して計算された推定値が使われる。対応する推定はまた、左の伝達
関数に対しても実行される。
【0081】 左のステレオ音響チャネルのn番目のフレームにおける全エネルギーを表すE L と右のステレオ音響チャネルのn番目のフレームでの全エネルギーを表すER
を使う。すると、右のチャネルに対するチャネル応答推定アルゴリズムは、
【0082】
【数21】
【0083】 左のチャネルに対するチャネル応答推定アルゴリズムは、
【0084】
【数22】
【0085】 通常、右のチャネルを考えるとき、しきい値を越えたとき、Y(jω)は、主
として右のチャネルおよび要望音声信号に起因する項からなるべきである。Y(
jω)は、しきい値が高い値に設定された場合、左のチャネルに起因するエネル
ギーはほとんど含まないべきである。左のチャネルを考えるとき、通常その逆を
とる。ステップ205で実質的に記述されるような時間および領域の平滑化もま
た使われるであろう。 2.特定の周波数で再帰的に平滑化されたチャネルの推定値を更新することによ
って、一方のチャネルのその周波数でのエネルギーが他のチャネルのその周波数
でのエネルギーを越えないように抑制することができる。これは、左および右の
ステレオ音響信号の全エネルギー比がスペクトルにおける個々の周波数要素での
所定のしきい値を越えたとき、左および/または右の音響チャネルの伝達関数に
ついての新しい値を推定することによって、達成できる。好適には、しきい値は
、信号の離散フーリエ変換での高調波の次数を備える周波数を適応することがで
きる。
【0086】 上述の1と同様の技術を使って、右のチャネルに対するチャネル応答推定アル
ゴリズムは、
【0087】
【数23】
【0088】 左のチャネルに対するチャネル応答推定アルゴリズムは、
【0089】
【数24】
【0090】 この定義では、インデックスkは、信号のDFTの高調波の次数である。例え
ば、E(k)Rは、右のステレオソース信号のDFTにおけるk番目の高調波の
エネルギーである。音響チャネル応答は、これら周波数において、およびマイク
ロフォンでの信号が主として左もしくは右のチャネルからなる時間においてのみ
で更新されることを、このアルゴリズムは確実にするに違いない。 3.左および右のチャネル信号間でのコヒーレンス関数を評価し、さらに、チャ
ネル応答の推定値がその周波数で更新される量を重み付けするように各周波数で
のコヒーレンスの大きさの逆数を使用する。コヒーレンス関数は、特定の周波数
において測定された2つの異なる信号の位相の時間周期にわたる相関の測定を提
供する。コヒーレンス関数は、種々のやり方で使うことができるが、通常は、左
および右のステレオチャネルが特定の周波数で位相相関される場合、信頼できる
音響チャネルの更新が減少するであろうという思想に基づく。コヒーレンスが一
致に近づいた場合、信号は相関されるが、しかしそれは特定の周波数でのみであ
る。こうして、右のチャネルについてのチャネル応答の推定値は、次のアルゴリ
ズムから導き出すことができる(左のチャネルに対する伝達関数に対応する方法
も導き出すことができる。)。
【0091】
【数25】
【0092】 ここで、η(k)は周波数インデックスkにおける左および右のステレオソー
ス信号のコヒーレンスである。
【0093】
【数26】
【0094】 ここで、期待値はオーバータイムである。 4.非相関(直交)である左および右のECADソース信号の構成要素を抽出し
、それらを左および右のチャネル応答の推定値を作成するのに使う。このアプロ
ーチでは、左および右のECADソースにおける共通要素C(k)が適応フィル
タリングによって除去され、直交する信号の組であるL”(k)およびR”(k
)が生成される。
【0095】 R(k)=R”(k)+HCR(k)・C(k) L(k)=L”(k)+HCL(k)・C(k) ここで、HCL(k)は共通(結合された左および右ステレオ信号であり、レコ
ーディングスタジオに固定できる)ECAD信号ソースと、左のECAD信号ソ
ースとの間の伝達関数であり、HCR(k)は共通ECAD信号ソースと、右のE
CAD信号ソースとの間の伝達関数である。
【0096】 直交させられた信号は、音響チャネル応答の推定値を作るのに使われる。右の
ステレオチャネルの伝達関数に対し、次の式が使われる(左のステレオチャネル
の伝達関数に対応する表現も得ることができる。)。
【0097】
【数27】
【0098】 項のほとんどが長時間の非相関であるので、次が得られる。
【0099】
【数28】
【0100】 真の音響チャネル応答である。
【0101】
【数29】
【0102】 添付の図面の図3は、L”(jω)およびR”(jω)を形成するために使う
ことができる要素の例を概略的に示したものである。この要素は2つの適応フィ
ルタ303および304を含み、周波数領域で実現されても、(好適にはこれで
あるが)時間領域で実現されても、どちらでも良い。各FIR適応フィルタの係
数は、LMSもしくはそれに類するものを使って調節し、r”(n)およびl”
(n)における全エネルギーをそれぞれ最小にする。例えば、エコーキャンセル
におけるように標準のシステム識別モードにおいてフィルタを動作させる。
【0103】 右のステレオECAD信号r(n)301は、適応フィルタ303および結合
器305に供給される。左のステレオECAD信号1(n)302は、適応フィ
ルタ304および結合器306に供給される。適応フィルタ303の出力は、ま
た結合器305に供給される。結合フィルタ305に出力は、適応制御パスを介
して適応フィルタ304にフィードバックしてもよい。混合器306の出力は、
適応制御パスを介して適応フィルタ303にフィードバックしてもよい。結合器
305の出力は、直交右ステレオ信号r”(n)307を備える。結合器306
の出力は、左ステレオ直交信号l”(n)308を備える。
【0104】 添付の図面の図4は、本発明の特定の実施例を例示するブロック図である。図
4の処理要素は、音声認識システムが置かれている車内機器に集積的に取り付け
られた電子処理装置であっても、あるいは代わりに、音響信号を受信し、非定常
の干渉信号をキャンセルし、音声認識システムのマイクロフォンによって受信さ
れるフィルタされた音響信号を出力するようなスタンドアロン形の電子機器であ
ってもよい。
【0105】 (図1の信号出力スピーカ101および102のような)ECAD音声ソース
401は、車内音響チャネル403を通じて伝送される前にECADによって生
成された信号を分析できるように、スペクトル分析処理404によって直接受信
されてもよい。ECAD信号はまた、信号401が音響チャネル403を通じて
伝送する前および後に事実上同時にスペクトル分析されるように、音響チャネル
403を通じて伝送された後にスペクトル分析処理405によって受信される。
処理404および405のスペクトル分析は、256ポイントでの高速フーリエ
変換を使って16ミリ秒フレームレートで好適には実行される。(図1の要望音
声信号S(jω)104に対応する)ユーザ音声402がまた存在する場合、こ
の音響信号もまた音響チャネル403を通じて送信され、スペクトル分析処理4
05によって受信されるであろう。
【0106】 スペクトル分析処理404および405の出力は、好適には上述のアルゴリズ
ム200に従って機能する音響チャネルモデル推定処理406への入力として使
われる。音響チャネルモデル推定処理406は、チャネル403を通じて伝達さ
れる音響信号の受信もするスペクトル減算処理408への入力として使える音響
チャネルモデル407を生成する。
【0107】 音声認識システムが必要なときは、音響チャネルモデル407は、音声認識処
理期間中は凍結される。そして音響チャネルモデル407は、マイクロフォンで
受信された音響信号からモデル407に含まれるECAD干渉信号の推定スペク
トルを減算することによって音声信号をマイクロフォン信号から復元するのに使
われる。そして、復元した要望音声409を表すスペクトル減算された信号は、
復元した音声信号409を、システムによって認識されるコマンドにマッチさせ
るために、隠れマルコフモデル311のような認識特徴を使う(音声認識システ
ムの一部である)パターンマッチ装置処理410に渡される。そして、パターン
マッチ装置409は、ユーザの音声コマンドが機器で実行されるようにするため
に、トレースバックおよび決定処理412に出力信号を渡す。
【0108】 スペクトル減算アルゴリズムはサンプルベースドではなくフレームであるので
、計算的な複雑さは少ない。アルゴリズムのメインの計算は、高速フーリエ変換
が必要であり、各チャネルに対し、フレームごとにNlogNオーダーの計算が
必要である。これは、典型的には、毎秒約230kの計算であり、公知の適応フ
ィルタ技術の最も簡単な形式に必要なサンプルごとに3Nオーダーの計算よりも
十分に低い。32マイクロ秒、256サンプルのエコーテイル長に対し、これは
、毎秒1800万回の動作よりも多いものと同一とみなす。
【0109】 添付の図面の図5〜8は、種々の信号対雑音比において、ECADによって出
力される種々のタイプの音楽についての非定常の干渉信号キャンセルの前および
後のマイクロフォン信号のトレースを示している。音響チャネルを通過するキャ
ンセルされていない信号とキャンセルされた信号との比較ができるようにするた
めに、テストデータは、音声および干渉信号を同じ車環境で別々に記録すること
によって構築され、そして2つの信号は加算される。図5〜8に示される例では
、干渉する音楽はステレオ信号である。
【0110】 添付の図面の図5A〜5Dは、ECADが0デシベルの信号対雑音比でポップ
ミュージックを出力する場合の、キャンセル有りとキャンセル無しのマイクロフ
ォンのトレースを例示する。図5Aでは、キャンセル前にマイクロフォンで受信
された信号が示されている。この場合、ピークの断片の音声と干渉レベルとが同
じである。これは信号対雑音比を推定する悲観的なやり方である。なぜなら、音
声信号の振幅変化は、この例の相当の部分に対して音声より越えているECAD
音楽信号出力の振幅変化よりも大きいからである。図5Bは、スペクトル減算後
の図5Aの信号において逆変換から生じる信号を示している。図5Bに示す干渉
信号は、明らかに低減されている。図5Cは、キャンセルアルゴリズムの適用に
対し、正規化された平方ケプトラム距離を例示する信号である。図5Dは、スペ
クトル減算後の図5Cの正規化された平方ケプストラム距離に対する信号トレー
スを例示する。図5Cおよび5Dに示されたトレースを比較すると、復元した音
声ケプストラムは、干渉でゆがめられるほどではないことがわかる。
【0111】 添付の図面の図6A〜6Dは、ECADが10デシベルの信号対雑音比でポッ
プミュージックを出力する場合の、キャンセル有りとキャンセル無しのマイクロ
フォンのトレースを例示する。図6Aでは、キャンセル前にマイクロフォンで受
信された信号が示されている。図6Bは、スペクトル減算後の図6Aの信号にお
いて逆変換から生じる信号を示している。図6Bに示す干渉信号は、明らかに低
減されている。図6Cは、キャンセルアルゴリズムの適用に対し、正規化された
平方ケプストラム距離を例示する信号である。図6Dは、スペクトル減算後の図
6Cの正規化された平方ケプストラム距離に対する信号トレースを例示する。
【0112】 添付の図面の図7A〜7Dは、ECADが0デシベルの信号対雑音比でポップ
ミュージックを出力する場合の、キャンセル有りとキャンセル無しのマイクロフ
ォンのトレースを例示する。図7Aでは、キャンセル前にマイクロフォンで受信
された信号が示されている。図7Bは、スペクトル減算後の図7Aの信号におい
て逆変換から生じる信号を示している。図7Bに示す干渉信号は、明らかに低減
されている。図7Cは、キャンセルアルゴリズムの適用に対し、正規化された平
方ケプストラム距離を例示する信号である。図7Dは、スペクトル減算後の図7
Cの正規化された平方ケプストラム距離に対する信号トレースを例示する。
【0113】 添付の図面の図8A〜8Dは、ECADが10デシベルの信号対雑音比でポッ
プミュージックを出力する場合の、キャンセル有りとキャンセル無しのマイクロ
フォンのトレースを例示する。図8Aでは、キャンセル前にマイクロフォンで受
信された信号が示されている。図8Bは、スペクトル減算後の図8Aの信号にお
いて逆変換から生じる信号を示している。図8Bに示す干渉信号は、明らかに低
減されている。図8Cは、キャンセルアルゴリズムの適用に対し、正規化された
平方ケプストラム距離を例示する信号である。図8Dは、スペクトル減算後の図
8Cの正規化された平方ケプストラム距離に対する信号トレースを例示する。
【図面の簡単な説明】
【図1】 音声認識システムが車内機器を制御するのに使われるECADを有する自動車
環境の例を概略的に例示する図である。
【図2】 車内音響チャネルのモデルを表す伝達関数を推定するのに使うことができるス
テップを表すフローチャートである。
【図3】 図2のアルゴリズムの改良点を実現するのに使われる構成要素を概略的に例示
する図である。
【図4】 本発明の特定の実施例を例示するブロック図である。
【図5A】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図5B】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図5C】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図5D】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図6A】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図6B】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図6C】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図6D】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図7A】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図7B】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図7C】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図7D】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図8A】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図8B】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図8C】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
【図8D】 本発明を実験的に使用中のときに得られるマイクロフォン信号を例示する図で
ある。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AG,AL,AM,AT,AU, AZ,BA,BB,BG,BR,BY,CA,CH,C N,CR,CU,CZ,DE,DK,DM,DZ,EE ,ES,FI,GB,GD,GE,GH,GM,HR, HU,ID,IL,IN,IS,JP,KE,KG,K P,KR,KZ,LC,LK,LR,LS,LT,LU ,LV,MA,MD,MG,MK,MN,MW,MX, NO,NZ,PL,PT,RO,RU,SD,SE,S G,SI,SK,SL,TJ,TM,TR,TT,TZ ,UA,UG,US,UZ,VN,YU,ZA,ZW (72)発明者 タッターサル,グラハム デイビット イギリス国,サフォーク アイピー17 1 ピーエイチ,サクスマンダハム,フリスト ン,ニュー ハウス Fターム(参考) 5D015 EE05 GG03 KK01 5D020 CC06

Claims (31)

    【特許請求の範囲】
  1. 【請求項1】 音声認識について1つまたはそれより多い非定常の干渉信号
    をキャンセルする機器であって、 音響信号を受信する手段と、 前記非定常の干渉信号のスペクトルの大きさの推定値を生成する手段と、 受信した前記音響信号から前記推定値を減算して要望音声の大きさのスペクト
    ルの表示を生成する手段と、を含む、非定常の干渉信号をキャンセルする機器。
  2. 【請求項2】 前記推定値を生成する手段は、前記非定常の干渉信号の各ソ
    ースと前記音響信号を受信する手段との間の音響チャネルに対する伝達関数を推
    定するように構成される処理手段を含む請求項1に記載の機器。
  3. 【請求項3】 前記処理手段は、左および右のステレオチャネルの伝送によ
    って生成された前記非定常の干渉信号に対する伝達関数を推定するように構成さ
    れる請求項2に記載の機器。
  4. 【請求項4】 前記伝達関数の前記推定は、フレームごとに反復アルゴリズ
    ムを実行する前記処理手段によって達成され、前記フレームは、連続的な時間期
    間中に受信した前記音響信号によって構築される請求項2または3に記載の機器
  5. 【請求項5】 請求項3に従属するときの請求項4に記載の機器であって、 前記処理手段は、前記左および右のチャネルの干渉信号のそれぞれの大きさを
    推定するように構成され、 前記左のチャネルの干渉信号の大きさは、現時点の前記反復処理の間に受信さ
    れた前記音響信号から、前の前記反復処理の間に推定された前記右のチャネルの
    干渉信号の大きさを減算することによって推定され、 前記右のチャネルの干渉信号の大きさは、現時点の前記反復処理の間に受信さ
    れた前記音声信号から、前の前記反復処理の間に推定された前記左のチャネルの
    干渉信号の大きさを減算することによって推定される機器。
  6. 【請求項6】 前記右のステレオ音響チャネルに対する前記伝達関数の推定
    値は、前記右のチャネル干渉の大きさの推定値を、前記右の音響ステレオチャネ
    ルから伝送された前記干渉信号によって割り算することによって判定され、 前記左のステレオ音響チャネルに対する前記伝達関数の推定値は、前記左チャ
    ネル干渉の大きさの推定値を、前記左の音響ステレオチャネルから伝送された前
    記干渉信号によって割り算することによって判定される請求項5に記載の機器。
  7. 【請求項7】 前記右の音響チャネルの伝達関数の推定値は、前記右の音響
    ステレオチャネルの干渉信号の全エネルギーの前記左の音響ステレオチャネルの
    干渉信号の全エネルギーに対する比が所定のしきい値を越えた場合のみ、前記反
    復処理中に実行され、 前記左の音響チャネルの伝達関数の推定値は、前記左の音響ステレオチャネル
    の干渉信号の全エネルギーの前記右の音響ステレオチャネルの干渉信号の全エネ
    ルギーに対する比が所定のしきい値を越えた場合のみ、前記反復処理中に実行さ
    れる請求項6に記載の機器。
  8. 【請求項8】 前記比としきい値との比較は、前記信号のスペクトルの個々
    の周波数要素に適用される請求項7に記載の機器。
  9. 【請求項9】 η(k)を周波数インデックスkでの前記左および右の干渉
    信号のコヒーレンスとしたとき、前記左および右のステレオ音響チャネルの伝達
    関数は(1−|η(k)|)によって掛け算される請求項8に記載の機器。
  10. 【請求項10】 前記左および右のステレオチャネルの信号の共通項をC(
    k)とし、共通の前記左および右のステレオチャネル伝送と前記右のステレオチ
    ャネルと間の伝達関数がHCR(k)としたとき、R”(k)=HCR(k)・C(
    k)であり、共通の前記左および右のステレオチャネル伝送と前記左のステレオ
    チャネル信号との間の伝達関数をHCL(k)としたとき、L”(k)=L(k)
    −HCL(k)・C(k)であるとしたとき、 前記右のステレオ音響チャネルに対する伝達関数の推定値は、 【数1】 を使うことによって得られ、前記左のステレオ音響チャネルに対する伝達関数の
    推定値は、 【数2】 を使うことによって得られる請求項4に記載の機器。
  11. 【請求項11】 前記処理手段は、前記推定された伝達関数を時間領域にお
    いて平滑化する手段をさらに備える請求項2〜10のいずれか一項に記載の機器
  12. 【請求項12】 前記時間領域において平滑化する手段は、1次の再帰フィ
    ルタを備える請求項11に記載の機器。
  13. 【請求項13】 前記処理手段は、前記推定された伝達関数を周波数領域に
    おいて平滑化する手段をさらに備える請求項2〜12のいずれか一項に記載の機
    器。
  14. 【請求項14】 前記周波数領域において平滑化する手段は、有限インパル
    ス応答フィルタを備える請求項13に記載の機器。
  15. 【請求項15】 前記処理手段は、フーリエ変換を実行する手段を含む請求
    項2〜14のいずれか一項に記載の機器。
  16. 【請求項16】 前記非定常の干渉信号は、車内で動作する電気音響機器に
    よって生成される請求項1〜15のいずれか一項に記載の機器。
  17. 【請求項17】 前記音響信号を受信する手段は、マイクロフォンを備える
    請求項1〜16のいずれか一項に記載の機器。
  18. 【請求項18】 音声認識について1つまたはそれより多い非定常の干渉信
    号をキャンセルする方法であって、 音響信号を受信するステップと、 前記非定常の干渉信号のスペクトルの大きさの推定値を生成するステップと、 受信した前記音響信号から前記推定値を減算して要望音声の大きさのスペクト
    ルの表示を生成するステップと、を含む、非定常の干渉信号をキャンセルする方
    法。
  19. 【請求項19】 前記推定値を生成するステップは、前記非定常の干渉信号
    の各ソースと前記音響信号を受信する手段との間の音響チャネルに対して伝達関
    数を推定することを含む請求項18に記載の方法。
  20. 【請求項20】 前記伝達関数は、左および右のステレオチャネル伝送によ
    って生成された非定常の干渉信号に対し推定される請求項19に記載の方法。
  21. 【請求項21】 各前記ステップは、フレームごとに反復的に実行され、前
    記フレームは、連続的な時間期間中に受信した前記音響信号によって構築される
    請求項18〜20のいずれか一項に記載の方法。
  22. 【請求項22】 請求項20に従属するときの請求項21に記載の方法であ
    って、 前記左のチャネルの干渉信号の大きさを、現時点の前記反復処理の間に受信さ
    れた前記音響信号から、前の前記反復処理の間に推定された前記右のチャネルの
    干渉信号の大きさを減算することによって推定することと、 前記右のチャネルの干渉信号の大きさを、現時点の前記反復処理の間に受信さ
    れた前記音声信号から、前の前記反復処理の間に推定された前記左のチャネルの
    干渉信号の大きさを減算することによって推定することとを含む方法。
  23. 【請求項23】 前記右のチャネル干渉の大きさの推定値を、前記右の音響
    ステレオチャネルから伝送された前記干渉信号によって割り算するステップと、 前記左のチャネル干渉の大きさの推定値を、前記左の音響ステレオチャネルか
    ら伝送された前記干渉信号によって割り算するステップと、をさらに備える請求
    項22に記載の方法。
  24. 【請求項24】 前記右の音響チャネルの伝達関数を推定するステップは、
    前記右の音響ステレオチャネルの干渉信号の全エネルギーの前記左の音響ステレ
    オチャネルの干渉信号の全エネルギーに対する比が所定のしきい値を越えた場合
    のみ、前記反復処理中に実行され、 前記左の音響チャネルの伝達関数を推定するステップは、前記左の音響ステレ
    オチャネルの干渉信号の全エネルギーの前記右の音響ステレオチャネルの干渉信
    号の全エネルギーに対する比が所定のしきい値を越えた場合のみ、前記反復処理
    中に実行される請求項23に記載の方法。
  25. 【請求項25】 前記比としきい値との比較は、前記信号のスペクトルの個
    々の周波数要素に適用される請求項24に記載の方法。
  26. 【請求項26】 η(k)を周波数インデックスkでの前記左および右の干
    渉信号のコヒーレンスとしたとき、前記左および右のステレオ音響チャネルの伝
    達関数は(1−|η(k)|)によって掛け算される請求項25に記載の方法。
  27. 【請求項27】 前記左および右のステレオチャネルの信号の共通項をC(
    k)とし、共通の前記左および右のステレオチャネル伝送と前記右のステレオチ
    ャネルと間の伝達関数をHCR(k)としたとき、R”(k)=HCR(k)・C(
    k)であり、共通の前記左および右のステレオチャネル伝送と前記左のステレオ
    チャネル信号との間の伝達関数をHCL(k)としたとき、L”(k)=L(k)
    −HCL(k)・C(k)であるとしたとき、 前記右のステレオ音響チャネルに対する伝達関数の推定値は、 【数3】 を使うことによって得られ、前記左のステレオ音響チャネルに対する伝達関数の
    推定値は、 【数4】 を使うことによって得られる請求項21に記載の方法。
  28. 【請求項28】 前記推定された伝達関数を時間領域において平滑化するス
    テップをさらに備える請求項18〜27のいずれか一項に記載の方法。
  29. 【請求項29】 前記推定された伝達関数を周波数領域において平滑化する
    ステップをさらに備える請求項18〜28のいずれか一項に記載の方法。
  30. 【請求項30】 請求項1〜17のいずれか一項に記載の機器を含む音声認
    識システム。
  31. 【請求項31】 請求項1〜17のいずれか一項に記載の機器を含む電子音
    響機器。
JP2000617442A 1999-05-07 2000-05-05 音声認識のための非定常の干渉信号のキャンセル Pending JP2002544552A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB9910448.1A GB9910448D0 (en) 1999-05-07 1999-05-07 Cancellation of non-stationary interfering signals for speech recognition
GB9910448.1 1999-05-07
PCT/GB2000/001715 WO2000068936A1 (en) 1999-05-07 2000-05-05 Cancellation of non-stationary interfering signals for speech recognition

Publications (1)

Publication Number Publication Date
JP2002544552A true JP2002544552A (ja) 2002-12-24

Family

ID=10852897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000617442A Pending JP2002544552A (ja) 1999-05-07 2000-05-05 音声認識のための非定常の干渉信号のキャンセル

Country Status (5)

Country Link
EP (1) EP1190417A1 (ja)
JP (1) JP2002544552A (ja)
AU (1) AU4590400A (ja)
GB (1) GB9910448D0 (ja)
WO (1) WO2000068936A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004264816A (ja) * 2002-09-06 2004-09-24 Microsoft Corp 再帰的構成における反復ノイズ推定法

Families Citing this family (118)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
KR20020058116A (ko) * 2000-12-29 2002-07-12 조미화 음성 제어 텔레비젼 수상기 및 음성 제어 방법
KR100368289B1 (ko) * 2001-02-20 2003-01-24 (주)성우테크노 음성인식장치를 위한 음성명령식별기
US20030033144A1 (en) * 2001-08-08 2003-02-13 Apple Computer, Inc. Integrated sound input system
US7349849B2 (en) 2001-08-08 2008-03-25 Apple, Inc. Spacing for microphone elements
JP4333369B2 (ja) * 2004-01-07 2009-09-16 株式会社デンソー 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
DE112011100329T5 (de) 2010-01-25 2012-10-31 Andrew Peter Nelson Jerram Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
EP3809407A1 (en) 2013-02-07 2021-04-21 Apple Inc. Voice trigger for a digital assistant
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
DE112014002747T5 (de) 2013-06-09 2016-03-03 Apple Inc. Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
AU2014278595B2 (en) 2013-06-13 2017-04-06 Apple Inc. System and method for emergency calls initiated by voice command
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19521258A1 (de) * 1995-06-10 1996-12-12 Philips Patentverwaltung Spracherkennungssystem
JP2930101B2 (ja) * 1997-01-29 1999-08-03 日本電気株式会社 雑音消去装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004264816A (ja) * 2002-09-06 2004-09-24 Microsoft Corp 再帰的構成における反復ノイズ推定法
JP4491210B2 (ja) * 2002-09-06 2010-06-30 マイクロソフト コーポレーション 再帰的構成における反復ノイズ推定法

Also Published As

Publication number Publication date
WO2000068936A1 (en) 2000-11-16
EP1190417A1 (en) 2002-03-27
GB9910448D0 (en) 1999-07-07
AU4590400A (en) 2000-11-21

Similar Documents

Publication Publication Date Title
JP2002544552A (ja) 音声認識のための非定常の干渉信号のキャンセル
JP4283212B2 (ja) 雑音除去装置、雑音除去プログラム、及び雑音除去方法
US5400409A (en) Noise-reduction method for noise-affected voice channels
JP5049629B2 (ja) 時変拡声器−部屋−マイクロホンシステムにおけるエコー減少
US6549629B2 (en) DVE system with normalized selection
KR100316116B1 (ko) 잡음감소시스템및장치와,이동무선국
EP1855457B1 (en) Multi channel echo compensation using a decorrelation stage
US8594320B2 (en) Hybrid echo and noise suppression method and device in a multi-channel audio signal
US9992572B2 (en) Dereverberation system for use in a signal processing apparatus
US7315623B2 (en) Method for supressing surrounding noise in a hands-free device and hands-free device
US20020071573A1 (en) DVE system with customized equalization
US9002027B2 (en) Space-time noise reduction system for use in a vehicle and method of forming same
US8165310B2 (en) Dereverberation and feedback compensation system
CN102739886B (zh) 基于回声频谱估计和语音存在概率的立体声回声抵消方法
US20040264610A1 (en) Interference cancelling method and system for multisensor antenna
US9532149B2 (en) Method of signal processing in a hearing aid system and a hearing aid system
CN111213359B (zh) 回声消除器和用于回声消除器的方法
JP2003500936A (ja) エコー抑止システムにおけるニアエンド音声信号の改善
US8199928B2 (en) System for processing an acoustic input signal to provide an output signal with reduced noise
JP2006313997A (ja) 騒音量推定装置
KR100470523B1 (ko) 마이크로폰 신호로부터 스피커 간섭을 제거하기 위한 필터 시스템
US20060184361A1 (en) Method and apparatus for reducing an interference noise signal fraction in a microphone signal
JP2001005463A (ja) 音響装置
EP1261961B1 (en) Methods and systems for noise reduction for spatially displaced signal sources
JP2003218745A (ja) ノイズキャンセラ及び音声検出装置