JP3745227B2 - 両耳信号処理技術 - Google Patents

両耳信号処理技術 Download PDF

Info

Publication number
JP3745227B2
JP3745227B2 JP2000583297A JP2000583297A JP3745227B2 JP 3745227 B2 JP3745227 B2 JP 3745227B2 JP 2000583297 A JP2000583297 A JP 2000583297A JP 2000583297 A JP2000583297 A JP 2000583297A JP 3745227 B2 JP3745227 B2 JP 3745227B2
Authority
JP
Japan
Prior art keywords
signal
source
signals
frequency
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000583297A
Other languages
English (en)
Other versions
JP2002530966A (ja
Inventor
フェン,アルバート・エス
リウ,チェン
ビルガー,ロバート・シー
ジョーンズ,ダグラス・エル
ランシング,シャリッサ・アール
オブライエン,ウィリアム・ディー・ジュニア
ホイーラー,ブルース・シー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Illinois
Original Assignee
University of Illinois
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/193,058 external-priority patent/US6987856B1/en
Application filed by University of Illinois filed Critical University of Illinois
Publication of JP2002530966A publication Critical patent/JP2002530966A/ja
Application granted granted Critical
Publication of JP3745227B2 publication Critical patent/JP3745227B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/407Circuits for combining signals of a plurality of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/55Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception using an external connection, either wireless or wired
    • H04R25/552Binaural

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurosurgery (AREA)
  • Otolaryngology (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Stereophonic Arrangements (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【0001】
(関連出願に対する引用)
本願は、所有者を同じくする、BINAURAL SIGNAL PROCESSING SYSTEM AND METHOD(両耳信号処理システムおよび方法)と題し、1996年6月19日に出願されたFeng et al.の同時係属中の米国特許出願第08/666,757号の一部継続出願である。
(発明の背景)
本発明は、音響信号の処理に関し、更に特定すれば、異なる発生源から発する音響信号の定位(localization)および抽出に関する。
【0002】
干渉信号の存在の下で所望の信号を抽出することの難しさは、長年にわたって音響技術者に立ちはだかっている課題である。この問題は、音声認識およびインテリジェンス収集(gathering)のためのシステム等、多種類のデバイスの設計および構築に影響を与える。特に厄介なのは、補聴デバイスによる、所望サウンドの不要サウンドからの分離である。一般に、補聴デバイスは、近隣の発生源によって妨害された場合、特にノイズの方が強い場合、所望サウンドを選択的に増幅することができない。この問題は、所望のサウンドが言語信号であり、しかも近隣のノイズも多数の話者が生成する言語信号(例えば、おしゃべり)である場合には、一層厳しくなる。ここで用いる場合、「ノイズ」とは、ランダムなまたは非決定論的信号を意味し、あるいはまたは加えて、あらゆる望ましくない信号および/または所望の信号の知覚に干渉するあらゆる信号を意味することとする。
【0003】
この問題を解決しようとした試みの1つに、単一の指向性が高いマイクロフォンを応用して、補聴受信機の方向性を高めたことがあげられる。この手法は、非常に限定された能力を有するに過ぎない。その結果、スペクトル減算、櫛形フィルタリング、および言語生成モデリングを探求して、単一マイクロフォン性能を高めた。しかしながら、これらの手法は、特に、信号およびノイズ源が接近している場合には、一般に所望の言語信号の了解度を高めることが未だにできないでいる。
【0004】
別の手法として、選択した空間関係で多数のマイクロフォンを配置し、一種の方向性検出ビームを形成することがあげれられる。生憎、補聴の実用化にかなうサイズに限定されると、ビーム形成アレイも、互いに接近している信号を分離する能力に限界がある。特に、ノイズの方が所望の言語信号よりも強い場合に言える。加えて、残響が少ない環境におけるノイズ源の場合、ビーム形成器によって得られるノイズ・キャンセレーションは、ノイズ源のマイクロフォン・アレイに対する位置によって変化する。R.W.StadlerおよびW.M.RabinowitzのOn the Potential of Fixed Arrays for Hearing Aids(補聴用固定アレイの潜在的可能性について),94 Journal Acoustical Society of America 1332 (1993年9月)、およびW.Soede et al.のDevelopmentof a Directional Hearing Instrument Based On Array Technology(アレイ技術に基づく指向性補聴器の開発),94 Journal of Acoustical Society of America 785(1993年8月)を、ビーム形成手法に関する追加の背景として引用する。
【0005】
更に別の手法として、互いに変位した2つのマイクロフォンを応用して2つの信号を発生し、人間および多くの種類の動物に共通の両耳聴覚系のある面をエミュレートしたことがあげられる。生物両耳聴覚のある面は完全には理解されていないが、音源の位置を定位する能力は、両耳時間遅延の聴覚系による評価、および2つのサウンド信号の各々に関連する異なる周波数帯域全域におけるサウンド・レベルに基づくと考えられる。これら両耳時間および強度差に基づくシステムによる音源の定位は、W.LindermannのExtension of a Binaural Cross−Correlation Method by Contralateral Inhibition−I.Simulation of Lateralization for Stationar y Signals(対側性禁止による両耳相互相関モデルの拡張−定常信号に対する側性化のI.シミュレーション),80 Journal of the Acoustical Society of America 1608(1986年12月)において論じられている。
【0006】
2つのマイクロフォンからの入力に基づく多数の音響源の定位は、数個の重要な課題を提起し、一旦音源を定位してからの所望の信号の分離と同様である。例えば、Markus BoddenのModeling Human Sound−Source Localization and the Cocktail−Party−Effect(人の音源定位およびカクテル・パーティ効果のモデリング),1 Acta Acustica 43 (1993年2月/3月)は、一旦所望の信号の位置が確定した後に、両耳入力信号から所望の信号を得る試みにおいて、ウィンドウイング・プロセスを含むウィーナ・フィルタを用いている。生憎、この手法では、所望の言語忠実性に著しい劣化が生ずる。また、このシステムは、約30度の方位分離において所望の信号に等しい強度のノイズを抑制することが実証されたにすぎない。所望の発生源からの間隔が30度よりも狭い発生源から更に強いノイズが発する場合については、引き続き課題となっている。更に、提案されたBoddenシステムのアルゴリズムは、計算集約的であり、実際に補聴デバイスに具体化できるのか否か、重大な疑念が提示される。
【0007】
2マイクロフォン・システムの別の例が、D.BanksのLocalisation and Separation of Simultaneous Voices with Tow Microphones(2つのマイクロフォンを用いた同時音声の定位および分離),IEE Proceedings−I,140(1993)に見出される。このシステムは、ウィンドウイング技術を用いて、干渉ノイズのスペクトルと比較して、音源のスペクトルに重複しないギャップがある場合に、音源の位置を推定する。このシステムは、このようなギャップがない広帯域信号を伴う場合、定位を行なうことができない。加えて、Banksの論文は、所望の信号を再生するアルゴリズムの詳細を与えていない。二重マイクロフォン補聴システムに関する追加の背景の資料(source)として、Lindemann et al.の米国特許第5,479,522号、Soli et al.の米国特許第5,325,436号、Franklinの米国特許第5,289,544号、およびZwicker et al.の米国特許第4,773,095号を、引用する。
【0008】
また、効果的な定位は、入力マイクロフォンの間隔に関係するある周波数以上で生ずる曖昧な位置情報によって阻害される場合が多い。この問題は、Stern,R.M.、Zeiberg,A.S.、およびTrahiotis,Cの”Lateralization of complex binaural stimuli:A weighted−image model”(複雑な両耳刺激の側性化−加重画像モデル),J.Acoust.Soc.Am.84,156−165(1998)において認識された。
【0009】
したがって、特に両耳システムと共に用いるための、一層効果的な定位および抽出技術が相変わらず必要とされている。本発明は、これらの要望を満たし、更に別の重要な効果や利点をもたらすものである。
(発明の概要)
本発明は音響信号の処理に関する。本発明の種々の態様は、新規であり、非自明であり、種々の利点をもたらす。この明細書において網羅する本発明の実際の特性は、添付の特許請求の範囲を参照することによってのみ判断することができる。ここに開示する好適な実施形態から選択した形態および特徴について、以下に端的に説明する。
【0010】
本発明の一形態は、多数の別個に位置する音響源の各々を突き止め特徴付ける、独特な信号処理技術を含む。この形態は、発生源から音響出力を検出する2つの離間したセンサを含むとよい。選択された各発生源または1つの特定の選択された発生源を抽出しつつ、他方の発生源の出力を抑制することができる。種々の用途がこの技術を利用することができ、補聴器、サウンド位置マッピング、または追跡デバイス、および音声認識機器を含むが、これら以外にもいくつでもあげることができる。
【0011】
別の形態では、第1音響センサから第1信号を供給し、第1音響センサとは離間した第2音響センサから第2信号を供給する。第1および第2信号は、各々、2つ以上の音響源の複合体に対応し、一方音響源は、複数の干渉源および所望の発生源を含む。第1および第2信号の処理によって、対応する数干渉源信号を発生することによって、干渉源の位置を突き止める。これらの信号は、各々、多数の周波数成分を含む。1つ以上の周波数成分を、干渉源信号の各々に対して抑制する。この手法により、2つの入力センサを用いて、多数のノイズ源の各々について、異なる周波数成分を容易に消去することができる。
【0012】
本発明の別の形態は、1対のセンサと、センサからの1対の入力信号に応答して多数の遅延信号をこれらから発生する遅延作用素とを有する処理システムである。また、このシステムは、遅延信号に応答して、センサの位置に対して干渉源を定位し、各々、多数の周波数成分によって表される複数の干渉源信号を供給する、定位作用素も有する。本システムは、更に、干渉源信号の各々に対して選択した周波数成分を抑制し、所望の発生源に対応する所望の信号を抽出する抽出作用素も含む。所望の信号に応答する出力信号も含まれ、所望の発生源を表す出力信号を供給する。このシステムは、センサに結合された信号プロセッサに組み込めば、所望の信号を抽出するときに、多数のノイズ源の定位および抑制が簡単に行われる。
【0013】
更に別の形態では、音源の位置および周波数属性に応答する。これは、第1音響センサおよび第2音響センサを、複数の別々に位置する音響源を検出するように位置付けることを含む。音響源から刺激を受信した第1および第2センサによって、それぞれ、第1および第2信号を発生する。第1および第2信号から多数の遅延信号対を発生する。その各々は、第1および第2センサに対する多数の位置の1つに対応する。遅延信号対および多数の一致パターンの関数として、発生源を定位する。これらのパターンは、位置および周波数を特定し、真の発生源位置の各々にマップする位置データ推定値を認識し、対応して蓄積するために利用することができる。その結果、これらのパターンは、定位分解能を高め、スプリアス・データを排除するフィルタとして動作することができる。
【0014】
更に別の形態では、システムは、各々、対応する第1または第2入力信号を発生する2つのセンサと、これらの信号に応答し、各々、センサに対する多数の位置の1つに対応する多数の遅延信号を発生する遅延作用素とを含む。また、システムは、遅延信号に応答し、音源定位信号の数を判定する定位作用素も含む。これらの定位信号は、遅延信号と、各々前記位置の1つに対応する多数の一致パターンから決定する。パターンは、各々、曖昧位相倍数によって生ずる周波数変動音源場所情報を、対応する位置に関係付け、音響源定位を改善する。また、システムは、定位信号に応答し、発生源の少なくとも1つに対応する出力を供給する出力デバイスも有する。
【0015】
更に別の形態は、2つのセンサを利用して、対応する両耳信号を供給し、これらから、第1音響源の第2音響源からの相対的分離を時間の関数として確定し、第1発生源からの所望の音響信号のスペクトル内容を代表的に抽出することができる。所望の音響信号のスペクトル内容の定位および識別は、同時に行なうことができる。また、この形態は、近隣のノイズ源の方が大きな相対的強度を有する場合でも、所望の音響信号を適正に抽出することができる。
【0016】
本発明の別の形態は、異なる場所にあり、選択した発生源から発する所望の信号と数個の干渉源から発する干渉信号とを含む音響信号の両耳表現を供給する第1および第2センサを採用する。プロセッサが、離散第1スペクトル信号および離散第2スペクトル信号をセンサ信号から発生する。プロセッサは、第1および第2スペクトル信号を、多数の時間間隔だけ遅延させ、多数の遅延第1信号および多数の遅延第2信号を発生し、時間増分信号を供給する。時間増分信号は、選択した発生源のノイズ源からの分離に対応する。プロセッサは、出力信号を時間増分信号の関数として発生し、出力デバイスがこの出力信号に応答して、所望の信号を表す出力を供給する。
【0017】
追加の形態は、第1および第2センサを第1信号源に対して位置付けるステップを含み、第1および第2センサは互いから離間され、第2信号源は第1信号源から離間されている。第1センサから第1信号を供給し、第2センサから第2信号を供給する。第1および第2信号は、各々、第1信号源からの所望の信号と、他の音源からの不要の信号を含む複合音響信号を表す。第1および第2信号から、多数の周波数の関数として、多数のスペクトル信号を形成する。第2信号源の位置を表すスペクトル信号の1つ決定し、第1信号源を表す出力信号をこの決定されたスペクトル信号の1つから発生する。この機能は、干渉源の定位の一部として判定されるスペクトル信号からの所望の信号の抽出を容易にする。この手法は、多くの両耳システムでは必要な大量の定位後計算を回避し、所望の信号を抽出することを可能とする。
【0018】
したがって、本発明の目的の1つは、多数の音響源の定位を改善を図ることである。
本発明の別の目的は、多数の干渉源に起因するノイズ環境から所望の音響信号を抽出することである。
【0019】
追加の目的は、2つの別々に配置したセンサを用いて音響信号の組み合わせを検出することにより、これらの信号の定位および抽出を行なうシステムを提供することである。
【0020】
本発明の更に別の実施形態、目的、特徴、態様、効果、形態、および利点は、ここに提示する詳細な図面および説明から明白となろう。
(選択した実施形態の説明)
本発明の原理の理解を促進する目的のために、これより、図面に示す実施形態を参照し、具体的なことばを用いてこれを説明する。しかしながら、これによって本発明の範囲限定を意図する訳ではないことは理解されよう。記載する実施形態におけるあらゆる変形や更に別の変更、およびここに記載する発明の原理のいかなる別の応用も、本発明に関係する当業者には当然に想起するものと見なすこととする。
【0021】
図1は、本発明の一実施形態の音響信号処理システム10を示す。システム10は、近隣発生源14から発する干渉即ちノイズにも拘らず、発生源12から所望の信号を抽出するように構成されている。システム10は、発生源12、14からの信号を含む音響励起を検出するように構成されている1対の音響センサ22、24を含む。センサ22、24は、動作的にプロセッサ30に結合され、プロセッサ30は、センサから受信した信号を処理する。また、プロセッサ30は、出力デバイス90にも結合され、発生源12、14からセンサ22、24に提示される複合音響信号と比較して、発生源14からの干渉の方が少ない、発生源12からの所望の信号を表す信号を供給する。
【0022】
センサ22、24は、横軸Tに沿って距離Dだけ互いに離間している。中点Mは、センサ22からセンサ24までの距離Dに沿った中間点を表す。基準軸R1は、発生源12と一直線上にあり、中点Mを通過して垂直に軸Tと交差する。軸Nは発生源14と一線上にあり、中間点と交差する。軸Nは、基準軸R1と角度Aを形成するように位置付けられている。図1は、約20度の角度Aを示す。注記すべきは、基準軸R1は、発生源12、14、センサ22、24、および内包軸(containing axes)T、N、R1と交差する方位面において0度の基準方位位置を規定するように選択するとよいことである。その結果、発生源12は「軸上」となり、発生源14は、軸Nと一直線上にあるので、「軸外」となる。発生源14は、発生源12に対して約20度の方位に示されている。
【0023】
好ましくは、センサ22、24を互いに対して固定し、一緒に移動させて、所望の音響信号源に対して基準軸R1を選択的に位置付けるようにする。また、センサ22、24は、無指向性ダイナミック・マイクロフォンのように、従来からの種々のマイクロフォンとすることも好ましい。別の実施形態では、当業者に想起されるような、異なるセンサ種も利用可能である。
【0024】
更に、図2も参照すると、信号フロー図は、図1に示す実施形態の種々の処理段階を示す。センサ22、24は、左センサ22および右センサ24にそれぞれ対応するアナログ信号Lp(t)およびRp(t)を供給する。信号Lp(t)およびRp(t)は、最初にプロセッサ30に別々の処理チャネルLおよびRで入力される。各チャネルL、R毎に、それぞれ、段32a、32bにおいて信号Lp(t)およびRp(t)を調整し、濾波して、エイリアジング(aliasing)を低減する。フィルタ段32a、32bの後、調整された信号Lp(t)、Rp(t)は、対応するアナログ/ディジタル(A/D)変換器34a,34bに入力され、ディスクリート信号Lp(k)、Rp(k)を供給する。ここで、kは、離散・サンプリング・イベント(discrete sampling event)のインデックスである。一実施形態では、A/D段34a、34bは、音声周波数範囲の上端周波数の少なくとも2倍のレートで信号Lp(t)およびRp(t)をサンプルし、入力信号の高忠実性表現を確保する。
【0025】
ディスクリート信号Lp(k)およびRp(k)は、段36a、36bにおいて、短期離散フーリエ変換(DFT)アルゴリズムによって時間ドメインから周波数ドメインに変換され、複素値信号XLp(m)およびXRp(m)を得る。信号XLp(m)およびXRp(m)は、段36a、36bにおいて、離散周波数fmで数値化される。ここで、mは離散周波数に対するインデックス(m=1ないしm=M)であり、インデックスpは短期スペクトル分析時間フレームを示す。インデックスPは、逆時間順に配列され、最新の時間フレームがp=1となり、次に新しい時間フレームはp=2等となる。好ましくは、周波数Mは可聴周波数範囲を含み、短期分析において用いられるサンプル数は、処理速度の限界および得られる出力信号の所望の分解能間で最適なバランスを射止めるように選択する。一実施形態では、0.1ないし6kHzの音声範囲を、少なくとも12.5kHzのレートでA/D段34a、24bにおいてサンプルし、短期スペクトル分析時間フレーム当たり512フレームを得る。代替実施形態では、周波数ドメイン分析は、A/D段34a、34bの前に用いられるアナログ・フィルタ・バンクによって行なってもよい。尚、スペクトル信号XLp(m)およびXRp(m)は、各々、異なる周波数fmに対応する1×M次元を有するアレイとして表すとよいことを注記しておく。
【0026】
スペクトル信号XLp(m)およびXRp(m)は、二重遅延線40に入力される。これを図3に更に詳細に示す。図3は、2つの遅延線42、44を示し、各々、N個の遅延段を有する。各遅延線42、44は、対応する入力信号を、各遅延段毎に対向する方向に遅延させるように構成され、概略的に、自然両耳聴取プロセスと関連する二重聴取チャネルに対応する。遅延段D1、D2、D3、...、DN-2、DN-1、およびDNは、各々、対応する時間遅延刻みτ1、τ2、τ3、...τN-2、τN-1、およびτN(纏めてτiで示す)だけ、入力信号を遅延させる。ここで、インデックスiは、左から右に進む。遅延線42では、XLp(m)は代わりにXLp1(m)で示されている。XLp1(m)は、置換遅延刻みτ1、τ2、τ3、...τN-2、τN-1、およびτNだけ順次遅延され、遅延線42のタップに遅延出力を生成する。これらは、それぞれ、XLp2(m)、XLp3(m)、Xlp4(m)、...、XLpN-1(m)、XLpN(m)、およびXLpN+1(m)で示されている(纏めてXLpi(m)で示す)。遅延線44では、XRp(m)は、代わりに、XRpN+1(m)で示されている。XRpN+1(m)は、順次、時間遅延刻みτ1、τ2、τ3、...τN-2、τN-1、およびτNだけ遅延され、遅延線44のタップに遅延出力を生成する。これらは、それぞれ、XRpN(m)、XRpN-1(m)、XRpN-2(m)、...、XLp3(m)、XLp2(m)、およびXlp1(m)で示されている(纏めてXRpi(m)で示す)。入力スペクトル信号および遅延線43、44のタップからの信号は、演算アレイ46への入力対として構成されている。遅延線42、44からの1対のタップは、図3では、入力対Pとして示されている。
【0027】
演算アレイ46は、1からN+1まで付番した演算ユニット(OP)を有し、OP1、OP2、OP3、OP4、...、OPN−2、OPN−1、NPN+1として示し、纏めて演算OPiで示す。遅延線42、44のタップからの入力対は、次のように、アレイ46の演算に対応する。
【0028】
【数1】
OP1[XLp1(m), XRp1(m)], OP2[XLp2(m), XRp2(m)], OP3[XLp3(m), XRp3(m)], OP4[XLp4(m), XRp4(m)], …,OPN-2[XLpN-2(m), XRpN-2(m)], OPN-1[XLpN-1(m), XRpN-1(m)], OPN[XLpN(m), XRpN(m)], OPN+1[XLpN+1(m), XRpN+1(m)]
ここで、OPi[XLpi(m), XRpi(m)]は、OPiが出力対XLpi(m), XRpi(m)の関数として決定されることを示す。対応して、演算アレイ46の出力は、Xp1(m), Xp2(m), Xp3(m), Xp4(m),…, Xp(N-2)(m), Xp(N-1)(m), XpN(m), およびXp(N+1)(m)となる(纏めてXpi(m)で示す)。
【0029】
i=1からi≦N/2について、アレイ46の各OPiに対する動作は、複素式(CE1)にしたがって次のように決定される。
【0030】
【数2】
Figure 0003745227
【0031】
ここで、exp[引数]は、引数の冪に対する自然指数を表し、虚数jは−1の平方根である。i>(N/2)+1)からi=N+1に対して、演算アレイ46の演算は、複素式2(CE2)にしたがって次のように決定される。
【0032】
【数3】
Figure 0003745227
【0033】
ここで、ここで、exp[引数]は、引数の冪に対する自然指数を表し、虚数jは−1の平方根である。i=(N/2)+1に対して、CE1、CE2のいずれも実行しない。
【0034】
N=4(i=1からi=N+1まで)に対する演算の決定の例は次の通りである。
i=1では、CE1を次のように適用する。
【0035】
【数4】
Figure 0003745227
【0036】
i=2≦(N/2)では、CE1を次のように適用する。
【0037】
【数5】
Figure 0003745227
【0038】
i=3では、適用できない。(N/2)<i≦((N/2)+1)
i=4では、CE2を次のように適用する。
【0039】
【数6】
Figure 0003745227
【0040】
i=5では、CE2を次のように適用する。
【0041】
【数7】
Figure 0003745227
【0042】
図1ないし図3を参照すると、演算アレイ46の各OPiは、基準軸Rに対して異なる方位位置を表すように定義されている。「中央の」演算OPiは、基準軸および発生源12の位置を表す。ここでi=((N/2)+1)である。例えば、N=4の場合、この中心演算はi=3に対応する。この構成は、自然な両耳聴取系に伴う異なる両耳時間差と類似している。これら自然系では、所与の音源に対する最大「同相」ピークに対応する耳内部の各サウンド通路において、相対位置がある。したがって、アレイ46の各演算は、音源に対する潜在的な方位即ち角度位置範囲に対応する位置を表し、中心演算はゼロ方位、基準軸Rと一直線上にある発生源を表す。ノイズ即ち干渉がない単一発生源を有する環境の場合、最大強度を有する信号対を判定するには、追加の処理を殆ど伴わずに発生源を突き止めるだけで十分な場合もある。しかしながら、ノイズの多い環境または多発生源環境では、位置を適正に推定するには、更に処理が必要となる場合もある。
【0043】
尚、二重遅延線40は、二次元マトリクス出力を与え、N+1列がXpi(m)に対応し、M行はXpi(m)の各離散周波数fmに対応する。この(N+1)×Mマトリクスを、各短期スペクトル分析間隔p毎に決定する。更に、XLpi(m)からXRpi(m)を減算することによって、各式CE1、CE2の分母は、信号対が所与の周波数fmにおいて「同相」である場合、Xpi(m)の最大値を与えるように構成される。定位段70は式CE1、CE2のこの態様を用いて、発生源12に対する発生源14の位置を評価する。
【0044】
定位段(localization stage)70は、これらのマトリクスをP個蓄積し、発生源14の位置を表すXpi(m)を決定する。列i毎に、定位段70は、| Xpi(m)|の振幅の二乗の総和を周波数fm、m=1からm=Mにわたって演算する。次に、Mの逆数とこの総和を乗算し、平均スペクトル・エネルギを次のように求める。
【0045】
【数8】
Figure 0003745227
【0046】
得られた平均Xavgpiは、次に、以下の式にしたがって、pでインデックスされたP個の最新のスペクトル分析時間フレームにわたって時間で平均する。
【0047】
【数9】
Figure 0003745227
【0048】
ここでγpは経験的に決定した重み係数である。一実施形態では、γp係数は、0.85Pないし0.90Pの間であることが好ましい。ここで、pは短期スペクトル分析時間フレーム・インデックスである。Xiを分析し、最小値m(Xi)を決定する。m(Xi)のインデックスiを「I」で示す。これは、発生源12に対する発生源14の方位位置を表す列を推定する。
【0049】
発生源12からの所望の信号のスペクトル成分は、基準軸R1と近似的に一直線上にある場合、XpI(m)から推定できることが発見されている。言い換えると、「軸外」発生源14の相対位置に最も密接に対応するアレイ46によるスペクトル信号出力は、同時に、発生源12から発する信号のスペクトル表現も与える。その結果、二重遅延線40の信号処理は、発生源14の定位を容易にするだけでなく、定位後に最少の処理で代表的な出力を得て、所望の信号のスペクトル推定値も与える。
【0050】
定位後処理は、定位段70による指定信号の概念的「スイッチ」80への供給により、二重遅延線40の出力列XpI(m)を選択することを含む。XpI(m)は、スイッチ80によって、段階82における逆離散フーリエ変換アルゴリズム(逆DFT)に導かれ、周波数ドメイン信号表現から、s(k)として示す離散時間ドメイン信号表現への変換が行われる。次いで、信号推定値(signal estimate)s(k)は、ディジタル/アナログ(D/A)変換器84によって変換され、出力信号を出力デバイス90に供給する。
【0051】
出力デバイス90は、プロセッサ30からの出力信号を増幅器92によって増幅し、増幅した信号をスピーカ94に供給し、発生源12からの抽出信号を与える。
【0052】
軸上発生源からわずか2度だけ分離した軸外発生源からの干渉は、本発明によって、所望の信号が言語を含み干渉がおしゃべりを含んでいる場合でも、低減または排除できることがわかっている。更に、本発明は、干渉即ちノイズ信号が相対強度以上であっても、所望の信号の抽出が可能である。センサ22、24を合わせて移動させることにより、抽出するために選択した信号も対応して変化させることができる。更に、本発明は、発生源12、14に加えて多くの音源を有する環境においても採用可能である。一代替実施形態では、定位アルゴリズムは、自動化された学習技術を用いて、位置付けおよび相対強度に動的に応答するように構成されている。他の実施形態では、本発明は、指向性が強いマイクロフォン、同時に多数の信号を抽出するための2つよりも多いセンサ、ならびに当業者には公知の種々の適応増幅およびフィルタリング技術と共に用いるように適合化される。
【0053】
本発明は、従来のシステムに比較して、所望の信号を表すスペクトル信号を定位処理の一部として判断することによって、計算効率を大幅に改善する。その結果、発生源12からの所望の信号の出力信号特性は、発生源14からの発生源14の分離に対応する信号対XLpI(m)、XRpI (m)の関数として決定される。また、CE1、CE2の分母における指数は、発生源12の14からの分離から生ずる周波数fmの位相差に対応する。N=4の例を参照し、I=1と仮定すると、この位相差は(遅延線42については)−2π(τ1+τ2)fmとなり、(遅延線44については)2π(τ3+τ4)fmとなり、i=3において、軸上発生源12からの軸外発生源14の代表的位置の分離に対応する。同様に、時間増分τ1+τ2およびτ3+τ4は、この例では、発生源12からの発生源14の分離に対応する。このように、プロセッサ30は、二重遅延線40および対応する演算関係CE1、CE2を実装し、所望の信号の発生源に対する干渉信号源の位置を突き止めることによって、所望の信号を発生する手段を備える。
【0054】
τ1は、基準軸Rに対して概略的に等しい方位位置を与えるように選択することが好ましい。一実施形態では、この構成は、最小値から最大値まで約20%変化するτiの値に対応する。他の実施形態では、τiは総じて互いに等しく、アレイ46の動作が簡略化する。尚、発生源12および14の分離に対応するCE1、CE2の分母における1対の時間刻みは、全ての値τiがほぼ同一である場合、近似的に等しくなることを注記しておく。
【0055】
プロセッサ30は、機器の1つ以上のコンポーネント即ちピースで構成することもできる。プロセッサは、ディジタル回路、アナログ回路、またはこれらの回路形態の組み合わせを含むことができる。プロセッサ30は、プログラム可能、統合化状態機械、あるいはこれらの技術の組み合わせを利用することも可能である。好ましくは、プロセッサ30は、最少の外部コンポーネントおよび接続で本発明のプロセスを実行するようにカスタム化したソリッド・ステート集積ディジタル信号プロセッサ回路である。同様に、本発明の抽出プロセスは、様々に構成され、1つ以上のハードウエア・モジュール、ファームウエア・モジュール、ソフトウエア・モジュール、またはその組み合わせによって、対応する機能性を備えるように構成された処理機器上で実行可能とするとよい。更に、ここで用いる場合、「信号」とは、ソフトウエア、ハードウエア、プログラム変数、通信チャネル、およびメモリ・ロケーション表現を含み、しかもこれらに限定される訳ではない。
【0056】
図4Aを参照すると、本発明の一用途を、補聴システム110として図示している。システム110は、めがねGを含み、マイクロフォン122および124が眼鏡Gに固定され、互いに変位している。マイクロフォン122、124は、補聴プロセッサ130に動作的に結合されている。出力デバイス190が耳E内に位置付けされ、装着者に音声信号を供給する。
【0057】
マイクロフォン122、124は、図1ないし図3に示した実施形態のセンサ22、24と同様に利用される。同様に、プロセッサ130には、図1ないし図3に示した信号抽出プロセスが構成されている。プロセッサ130は、抽出信号を出力デバイス190に供給し、音声出力を装着者に供給する。システム110の装着者は、言語信号のような所望の音源と一直線上になるようにめがねGを位置付け、マイクロフォン122、124間の中点からの近隣の軸外ノイズ源からの干渉を低減するようにするとよい。更に、装着者は、所望の音源との位置合わせをし直すことによって異なる信号を選択し、ノイズ環境からの干渉を低減することも可能である。
【0058】
プロセッサ130および出力デバイス190は、別個のユニット(図示の通り)としてもよく、または耳の中に装着される共通ユニットに含ませてもよい。プロセッサ130および出力デバイス190間の結合は、電気ケーブルまたはワイヤレス伝送とすればよい。一代替実施形態では、センサ122、124およびプロセッサ130は、離れて位置しており、無線周波数伝送またはその他の従来からの電気通信方法によって、耳E内に位置する1つ以上の出力デバイス190に同報通信するように構成されている。
【0059】
図4Bは、本発明をフロント・エンド言語改善デバイスとして採用した音声認識システム210を示す。システム210は、パーソナル・コンピュータCを含み、2つのマイクロフォン222、224が所定の関係で互いから離間されている。マイクロフォン222、224は、コンピュータC内でプロセッサ230と動作可能に接続されている。プロセッサ230は、内部使用のための出力信号、あるいはスピーカ294a,294bまたはビジュアル・ディスプレイ296を介して応答回答(responsive reply)を供給する。オペレータは、コンピュータCのマイクロフォン222、224と所定の関係で位置合わせを行い、音声コマンドを送出する。コンピュータCは、これらの音声コマンドを受信するように構成されており、図1ないし図3のプロセス・システムにしたがって、ノイズ環境から所望の音声コマンドを抽出する。
【0060】
図10ないし図13を参照すると、本発明の別の実施形態の信号処理システム310が示されている。システム10と同じシステム310の参照番号は、同様の構造を示す。図10の信号フロー図は、システム310の種々の信号処理技術に対応する。図10は、システム310の信号プロセッサ330に対して、左「L」および右「R」入力チャネルを示す。チャネルL、Rは、各々音響センサ22、24を含み、それぞれ、入力信号xLn(t)、xRn(t)を供給する。入力信号xLn(t)、xRn(t)は、センサ22、24の検出範囲内に位置する多数の音響源からのサウンドの複合に対応する。システム10の図1に関して述べたように、センサ22、24は、互いから所定の距離Dだけ離間された標準的なマイクロフォンであることが好ましい。別の実施形態では、異なるセンサ種別または構成も、当業者に想起されるように、用いることができる。
【0061】
センサ22、24は、システム310のプロセッサ330に動作的に結合され、入力信号xLn(t)、xRn(t)をA/D変換器34a、34bに供給する。プロセッサ330のA/D変換器34a、34bは、入力信号xLn(t)、xRn(t)をアナログ形態から、それぞれxLn(k)、xRn(k)で表されるように、離散形態に変換する。ここで、「t」は周知の連続時間ドメイン変数であり、「k」は周知の離散サンプル・インデックス変数である。システム10に関して説明したように、対応する1対の予め調整済みのフィルタ(図示せず)をプロセッサ330に含ませることも可能である。
【0062】
ディジタル・フーリエ変換(DFT)段36a、36bは、変換器34a、34bから、それぞれ、ディジタル入力信号対xLn(k)、xRn(k)を受信する。段36a、36bは入力信号xLn(k)、xRn(k)を、短期離散フーリエ変換アルゴリズムを用いて、xLn(m)、xRn(m)で示すスペクトル信号に変換する。スペクトル信号、xLn(m)、xRn(m)は、整数mによってインデックスされた多数の離散周波数成分に関して表され、m=1、2、...、Mである。また、ここで用いる場合、下付き文字LおよびRは、それぞれ、左および右チャネルを示し、nは離散フーリエ変換文政のための時間フレームをインデックスする。
【0063】
遅延作用素340は、段36a、36bからそれぞれスペクトル信号、xLn(m)、xRn(m)を受信する。遅延作用素340は、多数の二重遅延線(DDL)を含み、各々が、mでインデックスされた成分周波数の異なる1つに対応する。したがって、M個の異なる二重遅延ライン342が利用される。しかしながら、明確性を維持するために、m=1およびm=Mに対応する二重遅延線342のみが図10には示されている。m=2ないしm=(M−1)に対応する残りの二重遅延線は、明確性を維持するために、楕円で示されている。あるいは、遅延作用素340は、システム10の二重遅延線30と同様に、M個の周波数上で同時に動作する単一の二重遅延線として記載することも可能である。
【0064】
mの所与の値に対応するDFT段36a、36bからの周波数成分対は、二重遅延線342の対応する1つに入力される。図10に示す例では、スペクトル信号成分対xLn(m=1)、xRn(m=1)が、m=1に対応する周波数に対する上位二重遅延線342に送られ、スペクトル信号成分対xLn(m=M)、xRn(m=M)がm=Mに対応する周波数に対する下位二重遅延線342に送られる。同様に、m=2ないしm=(M−1)に対応する周波数に対するxLn(m)、xRn(m)の共通周波数成分対は、各々、明確性を維持するために楕円で示された、対応の二重遅延線に送られる。
【0065】
補足的に図11を参照すると、二重遅延線342のある機能が更に詳しく示されている。各二重遅延線342は、DFT段36aからの対応周波数成分入力を受信する左チャネル遅延線342a、およびDFT段36bからの対応する周波数成分入力を受信する右チャネル遅延線342bを含む。遅延線342a、342bは、各々、i=1、2、...、Iでインデックスされた、奇数個Iの遅延段344を含む。I個の遅延信号対が遅延段344の出力345に供給され、対応して複素乗算器346に送られる。遅延線342a、342b毎の遅延段344毎に対応する乗算器346が1つある。乗算器346は、遅延段344の対応する出力に対して、等価重み付けを行なう。対応する出力345からの各遅延信号対は、左遅延線342aの遅延段344からのものおよび右遅延線342bの遅延段344からのものを有する。各二重遅延線342の複素乗算器346は、タップ347に沿ってI個の遅延信号対の対応する積を出力する。作用素340の各遅延線342毎のタップ347からのI個の信号対は、信号作用素350に入力される。
【0066】
各二重遅延線342毎に、I対の乗算器タップ347は、各々、作用素350の異なる演算アレイ(OA)352に入力される。タップ347の各対は、対応する演算アレイ352内部の異なる演算段354に供給される。図11では、遅延線342a、342bの端部および遅延線342a、342bの中間段のいずれかにおける2つの段に対応して、遅延段344、乗算器346、および演算段354の一部のみを示す。介在する段は、図示の段のパターンに従い、明確性を維持するために楕円で表されている。
【0067】
任意の周波数ωmに対して、遅延時間τiは、式(1)によって次のように与えられる。
【0068】
【数10】
Figure 0003745227
【0069】
ここで、iは範囲(i=1、...、I)における整数遅延段インデックスであり、ITDmax=D/cは最大マイクロフォン間時間差、Dはセンサ22、24間の距離、およびcは音速である。更に、遅延時間τiは、i=(I+1)/2に対応する遅延段の中点に対して対象であり、以下の式(2)において示される通りである。
【0070】
【数11】
Figure 0003745227
【0071】
方位面は、均一にI個のセクタに分割することができ、その結果得られる各セクタの方位位置は、式(3)によって以下のように与えられる。
【0072】
【数12】
Figure 0003745227
【0073】
音響空間における方位位置は、以下のように、式(4)にしたがって、各二重遅延線342に沿って、対応する遅延信号対にマップすることができる。
【0074】
【数13】
Figure 0003745227
【0075】
二重遅延線の構造は、mの各値毎に異なる二重遅延線が表されていること、および乗算器346が、対応する各遅延段344を等化係数αi(m)の適切な1つと乗算するように含まれていることを除いて、システム10の実施形態と同様である。ここで、iは前述の遅延段インデックスである。好ましくは、エレメントαi(m)は、方位および周波数双方の関数として、センサ22、24におけるノイズ強度の差を補償するように選択する。
【0076】
等化係数αi(m)を決定する好適な一実施形態は、振幅補償が周波数とは無関係であり、このモデルからの逸脱を全て無視し得ると見なす。この実施形態では、受信音圧|p|の振幅は、以下のように、式(A1)および(A2)にしたがって、発生源/受信機間距離rと共に変化する。
【0077】
【数14】
Figure 0003745227
【0078】
【数15】
Figure 0003745227
【0079】
ここで、|pL|および|pP|は、センサ22、24における音圧の振幅である。図12は、センサ22、24および入力信号xLn(t)およびxRn(t)を与える受信範囲以内における代表的な音響源S1を示す。図12に示す幾何学的形状によれば、発生源S1から左および右センサまでの各距離rLおよびrRは、以下のように、式(A3)および(A4)で与えられる。
【0080】
【数16】
Figure 0003745227
【0081】
【数17】
Figure 0003745227
【0082】
図11の二重遅延線342における所与の遅延信号対が、この手法の下で等化されるには、係数αi(m)およびαI-i+1(m)は、以下のように、式(A5)を満足しなければならない。
【0083】
【数18】
Figure 0003745227
【0084】
式(A2)を式(A5)に代入すると、式(A6)が以下のように得られる。
【0085】
【数19】
Figure 0003745227
【0086】
式(A7)にしたがってαi(m)を以下のように定義する。
【0087】
【数20】
Figure 0003745227
【0088】
ここで、Kは反転長(inverse length)の単位であり、都合のよい振幅レベルが得られるように選択され、αI-i+1(m)の値は、式(A8)によって次のように与えられる。
【0089】
【数21】
Figure 0003745227
【0090】
ここで、関係sinθI-i+1=sinθiは、I-i+1を式(3)のiに代入することによって、得ることができる。式(A7)および(A8)を式(A6)に代入することによって、式(A7)においてαi(m)に割り当てられた値が式(A6)によって確立された条件を満たすことを検証することができる。
【0091】
この実施形態にしたがって等化係数αi(m)を得た後、細かい調節を行なってセンサ構成における非対称性、および音響エネルギの媒体吸収、点源以外の音響源幾何学的形状、振幅傾斜の距離以外のパラメータに対する依存性に起因すると考えられるような、理想的な場合からのその他の逸脱を較正することが好ましい。
【0092】
乗算器346による係数αi(m)を用いた等化の後、同相の所望の信号成分は、概略的に、i=isignal=sに対応する遅延信号対に対する二重遅延線342の左および右チャネルにおいて同一であり、同相ノイズ信号成分は、単一の優勢な干渉ノイズ源の場合のi=inoise=gに対応する遅延信号対に対する二重遅延線342の左および右チャネルにおいて概略的に同一である。i=sにおける所望の信号は、Sn(m)=Asexp[jωmt+Φs)]として表すことができ、i=gにおける干渉信号は、Gn(m)==Agexp[jωmt+Φg)]として表すことができる。ここで、ΦsおよびΦgは初期位相を示す。これらのモデルに基づき、二重遅延線342に沿ったいずれの任意の点i(i=sを除く)における左チャネルの等化信号αi(m)XLn (i)(m)および右チャネルのαI-i+1(m)XRn (i)(m)も、式(5)および(6)において、以下のように表すことができる。
【0093】
【数22】
Figure 0003745227
【0094】
【数23】
Figure 0003745227
【0095】
ここで、式(7)および(8)は、更に、式(5)および(6)のある項を以下のように定義する。
【0096】
【数24】
Figure 0003745227
【0097】
【数25】
Figure 0003745227
【0098】
各信号対αi(m)XLn (i)(m)およびαI-i+1(m)XRn (i)(m)は、全てのmに対する演算アレイ352の対応する1つの対応する演算段354に入力される。ここで、各演算アレイ352は、二重遅延線342の場合におけるように、mの異なる値に対応する。所与の演算アレイ352に対して、Iの各値に対応する演算段354は、i=sを除いて、以下のように式(9)によって定義される演算を実行する。
【0099】
【数26】
Figure 0003745227
【0100】
式(9)の分母の値が小さ過ぎる場合、小さな正の定数εを分母に加算し、出力信号Xn (i)(m)の大きさを制限する。全てのmに対して(信号作用素350の演算アレイ352全て)i=sに対応する信号対に対する演算段354による演算は行われない。
【0101】
式(9)は、システム10の式CE1およびCE2に相当する。しかしながら、式(9)は等化エレメントαi(m)を含み、単一の式に編成されている。演算アレイ352からの出力を用いて、システム310によって、所望の信号のスペクトル・コンテンツの同時定位および識別を行なうことができる。システム310による定位および抽出について、図13の信号フロー図および以下の数学的モデルによって更に説明する。式(5)および(6)を式(9)に代入することにより、式(10)が以下のように得られる。
【0102】
【数27】
Figure 0003745227
【0103】
ここで、更に式(11)が次のように定義する。
【0104】
【数28】
Figure 0003745227
【0105】
式(2)を式(11)に適用することによって、式(12)が以下のように得られる。
【0106】
【数29】
Figure 0003745227
【0107】
信号Xn (i)(m)のエネルギは、以下のように式(13)において表される。
【0108】
【数30】
Figure 0003745227
【0109】
信号ベクトルは次のように定義することができる。
【0110】
【数31】
Figure 0003745227
【0111】
ここで、Tは転置を示す。ベクトルx(i)のエネルギ||x(i)||2 2は式(14)によって次のように与えられる。
Figure 0003745227
【0112】
【数32】
Figure 0003745227
【0113】
式(14)は、時間、および連続時間ドメイン表現における二重積分を近似する周波数に対する二重総和である。
更に、次のベクトルを定義する。
【0114】
【数33】
Figure 0003745227
【0115】
ここで、i=1、...、I。
ベクトルsおよびg(i)のエネルギは、式(15)および(16)によって以下のように定義される。
【0116】
【数34】
Figure 0003745227
【0117】
【数35】
Figure 0003745227
【0118】
干渉源とは無関係の所望の信号に対して、ベクトルsおよびg(i)は直交である。ピタゴラスの定理にしたがって、式(17)は以下のようになる。
【0119】
【数36】
Figure 0003745227
【0120】
||x(i)||2 2≧0であるので、式(18)は次のようになる。
【0121】
【数37】
Figure 0003745227
【0122】
式(18)における等価性は、||x(i)||2 2=0の場合にのみ満たされる。このようになるのは、以下の2つの条件にいずれかを満たす場合である。即ち、(a)Gn(m)=0、つまり、ノイズ源が無音のときであり、この場合ノイズ源の定位およびノイズ・キャンセレーションを行なう必要はない。そして、(b)vs,g (i)(m)=0の場合である。式(12)は、この第2条件は、i=g=inoiseの場合に得られることを示す。したがって、||x(i)||2 2はi=g=inoiseのときにその最小値を有する。それは、式(18)によれば、||s||2 2である。更に、式(19)はこの条件を以下のように記述する。
【0123】
【数38】
Figure 0003745227
【0124】
このように、定位手順は、||x(i)||2 2の最小値を生成する遅延線342の各々に対して、演算アレイ352に沿って位置inoiseを求めることを含む。一旦二重遅延ライン342に沿った場所inoiseを決定したなら、ノイズ源の方位位置を、式(3)によって決定することができる。推定ノイズ位置inoiseは、ノイズ・キャンセレーションまたは所望の信号の抽出に利用することができる。これについては以下で更に詳しく説明する。実際、i=inoiseに対応する全てのmに対する演算段354は、式(20)で与えられるように、所望の信号のスペクトル成分を与える。
【0125】
【数39】
Figure 0003745227
【0126】
定位作用素(localization operator)360は、システム310の定位技術を具体化する。図13は、更に、整数インデックスIの各値に対して、加算作用素362および364の結合対を有する作用素360も示す。ここで、i=1、...、Iである。要約すると、加算作用素362および364は、式(14)に対応する動作を行い、iの各値に対し||x(i)||2 2を発生する。各変換時間フレームm毎に、加算作用素362は各々Xn (i)(1)ないしXn (i ) (M)入力を、iのそれらの値に対応する演算段354から受信し、周波数m=1ないしm=M間の総和を求める。図示の例では、上位加算作用素362はi=1に対応し、信号Xn (1)(1)ないしXn (1) (M)を受信し、総和を求める。下位加算作用素はi=Iに対応し、信号Xn (1)(1)ないしXn (1) (M)を受信し総和を求める。
【0127】
各加算作用素364は、各変換時間フレームnに対する結果を、iの同じ値に対応する加算作用素362から受信し、n=1ないしn=N変換時間フレームに対応する時間にわたって結果の和を蓄積する。ここで、Nは定位に適するように経験的に決定された時間フレームの量である。図示の例では、上位加算作用素364はi=Iに対応し、上位加算作用素362からの結果をN個のサンプルについて加算する。下位加算作用素364はi=Iに対応し、下位加算作用素362からの結果をN個のサンプルについて加算する。
【0128】
I個の加算作用素364から得られた||x(i)||2 2のI個の値を段366が受信する。段366は、I個の||x(i)||2 2の値を比較し、最少の||x(i)||2 2に対応するiの値を決定する。このiの値は、段366によってi=g=inoiseとして出力される。
【0129】
再度図10を参照して、システム310による定位後処理について更に説明する。式(9)をi=gにおける遅延線342の対入力に適用すると、これは軸外ノイズ源の位置に対応し、式(20)は、それが所望の信号の近似S‘n(m)を与えることを示す。信号S‘n(m)を抽出するために、インデックス値i=gを定位ユニット360の段366によって抽出作用素(extraction operator)380に送る。gに応答して、抽出作用素380は、出力Xn (g)(1)ないしXn (g) (M)= S‘n(m)を、それに動作的に結合されている逆フーリエ変換(IFT)段82に導く。この目的のために、抽出作用素380は、I×M個の複素入力およびM個の複素出力を有するマルチプレクサまたはマトリクス・スイッチを含むことが好ましい。この場合、定位作用素360の段366からの出力に応答して、異なる組のM個の入力を、インデックスIの各異なる値毎に出力に導く。
【0130】
段82は、抽出ユニット380から受信したM個のスペクトル成分を変換し、所望の信号S‘n(m)のスペクトル近似を周波数ドメインから、信号S’n(k)によって表される時間ドメインに変換する。段82は、ディジタル/アナログ(D/A)変換器84に動作的に結合されている。D/A変換器は信号S‘n(k)を受信し、離散形態から、S’n(t)で表されるアナログ形態に変換する。S‘n(t)は出力デバイス90に入力され、所望の信号の音響表現、または当業者に想起される別の指標を与える。段82、変換器84、およびデバイス90について、図10と関連付けて更に説明する。
【0131】
式(9)の表現の別の形態が、式(21)によって次のように与えられる。
【0132】
【数40】
Figure 0003745227
【0133】
項wLnおよびwRnは、それぞれ、左および右チャネルのビーム形成重みと等価である。その結果、式(9)の演算は、優勢なノイズ源に対応する位置にヌルを置くビーム形成手順として等価的にモデル化しつつ、所望の出力信号S‘n(t)に向けて制御することができる。
【0134】
図14は、本発明の更に別の実施形態のシステム410を示す。システム410は、システム10および310と共に用いた参照番号と同じものを一部用いて図示されており、同様の機能を示すことを意図している。図14では、システム410の音響センサ22、24の受信範囲内に、多数の音響源412、414、416、418が示されている。また、発生源412、414、416、418の位置は、参照番号412a、414a、416a,418aで示される、軸AZに対する方位角によって表されている。図示のように、角度412a、414a、416a,418aは、約0°、+20°、+75°、および−75°にそれぞれ対応する。センサ22、24は、信号プロセッサ430に動作的に結合され、軸AZはその中間付近に延びている。プロセッサ430は、システム310に関して説明したように、左チャネルLおよび右チャネルRに対応するセンサ22、24から入力信号xLn(t)、xRn(t)を受信する。プロセッサ430は、信号xLn(t)、xRn(t)を処理し、対応する出力信号を、動作的にこれらに結合されている出力デバイス90、490に供給する。
【0135】
図15の信号フロー図も補足的に参照すると、システム410から選択された機能が示されている。システム410は、D/A変換器34a、34bおよびDFT段36a、36bを含み、システム310に関して説明したのと同じ左および右チャネル処理を行なう。システム410は、システム310について説明したように、遅延作用素340および信号作用素350を含む。しかしながら、等価係数αi(m) (i=1,...,I)は、システム410の定位作用素460に関連する定位プロセスに対しては1にセットすることが好ましい。更に、システム410の定位作用素460は、システム310とは異なり、信号作用素350の出力信号の代わりに、遅延作用素340の出力信号を直接受信する。
【0136】
作用素460において具体化する定位技術は、周波数対方位位置に関して、一致座(coincidence loci)の二次元(2−D)プロットを確定することから開始する。各座の一致点は、mでインデックスされる各周波数に対する、左および右チャネル間の最少差を表す。この最少差は、各離散周波数mにおける、周波数ドメイン表現XLp (i)(m)およびXLp (i)(m)間の最少の大小差δXn (i)(m)として表すことができ、M/2個の潜在的に異なる座が得られる。音響源が空間的にコヒーレントである場合、これらの座は全ての周波数にわたって同一となる。この演算は、式(22)ないし(25)において以下のように記述される。
【0137】
【数41】
Figure 0003745227
【0138】
【数42】
Figure 0003745227
【0139】
【数43】
Figure 0003745227
【0140】
【数44】
Figure 0003745227
【0141】
左および右チャネルの大きさが、iでインデックスされたシステム410の二重遅延ライン342に沿った所与の位置において概ね同一である場合、iの対応する値に対するδXn (i)(m)の値は、本質的に0でなくても、最少化される。尚、センサ間強度差にも拘らず、等価係数αi(m) (i=1, ..., I)は、一致検出の目的のために1近くに維持しなければならないことを注記しておく。その他の場合、最小のδXn (i)(m)は、同相(一致)の場所には対応しない。
【0142】
代わりの手法として、位相差から一致座を識別することに基づくことも可能である。この位相差手法では、iでインデックスされた、二重遅延線342に沿った位置における左および右チャネル信号間の位相差の最小値を、以下の式(26)および(27)によって記述されるように求める。
【0143】
【数45】
Figure 0003745227
【0144】
【数46】
Figure 0003745227
【0145】
ここで、Im[・]は、引数の虚部を示し、上付き記号†は複素共役を示す。位相差技術は、2つの複素ベクトル間の最小角度を検出するので、センサ間強度差を補償する必要もない。
【0146】
大きさまたは位相差手法のいずれも、単一の発生源を定位するために更なる処理を伴わず効果的であると考えられるが、多数の発生源がスペクトル的に重複信号を射出する場合が多く、存在しない発生源即ち疑似発生源(例えば、同じ周波数の2つの等しい強度の発生源間の中間点において)に対応する一致座が生ずるという場合がある。図17は、縦軸に沿ったヘルツ(Hz)単位の周波数および横軸に沿った度単位の方位位置に関する2−D一致プロット500を示す。プロット500は、約−20度において概略的に垂直に位置合わせした座512a、および約+40度において垂直に位置合わせした座512bに対応する2つの発生源を示す。また、プロット500は、2つの発生源が相当なエネルギを有する周波数に対応する別の方位位置における識別誤り即ち疑似発生源点514a、514b、514c、514d、514eも含む。競合する音響源が3つ以上別々に突き止められた場合、一般にその結果更に一層複雑なプロットとなる。
【0147】
2−D一致プロット・データにおける疑似情報の発生を低減するために、定位作用素460は時間および周波数で積分する。信号を各周波数で相関付けると、信号間の相互干渉は時間積分によって徐々に減衰させることができる。この手法は、一致の場所を平均化し、最小値を決定するための関数の値ではなく、クロネッカーのデルタ関数δ(i-in(m))ないしδXn (i)(m)を適用し、δ(i-in(m))を時間で平均することと等価である。一方、発生源の真の位置に対応する一致座は強調される。時間による積分は、忘却平均を所定の1組の変換時間フレームn=1,...,Nにおいて獲得した2−D一致プロットに適用し、式(28)の総和近似によって以下のように表される。
【0148】
【数47】
Figure 0003745227
【0149】
0<β<1は、以前の一致結果の効果を指数的にディエンファサイズ(または忘却)する重み係数であり、δ(・)はクロネッカーのδ関数であり、θiは空間方位θi[式(2)]に対応する二重遅延線342に沿った位置を表し、Nは現時間フレームを示す。音響源の瞬時的相互作用によるクラッタリング効果を低減するために、式(28)の結果を、式(29)によって定義される関係にしたがって、以下のように検査する。
【0150】
【数48】
Figure 0003745227
【0151】
Figure 0003745227
ここで、Γ≧0は経験的に決定したしきい値である。この手法は、センサ間遅延が周波数とは独立であることを仮定するが、この仮定からの逸脱は一般に無視できると見なせることがわかっている。
【0152】
一致プロットを周波数で積分することにより、一層ロバスト性が高く信頼性も高い、空間における発生源の場所の指示が得られる。周波数による積分Pni,m)は、方位の関数である定位パターンを生成する。音響源の真の位置を推定する2つの技術を用いることができる。第1の推定技術は、単に、異なる方位に対応する周波数における直線的垂直追跡(straight vertical trace)に基づくだけである。この技術では、θdは、積分が関連付けられる方位を示し、θd=θiとなるようにして、その結果式(30)の周波数範囲における総和が以下のように得られる。
【0153】
【数49】
Figure 0003745227
【0154】
ここで、式(30)は時間による積分を近似する。
HNd)におけるピークは、発生源方位位置を表す。Q個の発生源がある場合、HNd)におけるQ個のピークが一般には予測することができる。各周波数におけるパターンδ(i-in(m))と比較すると、音源が1つよりも多い場合に、定位の精度が高まるだけでなく、現フレームに対する多数の発生源の殆ど即座の定位が可能となる。更に、優勢な発生源は、大抵の場合、弱い発生源よりもHNd)において高いピークを有するが、HNd)におけるピークの高さは、音源のエネルギを間接的に反映するだけに過ぎない。むしろ、高さは、各周波数帯域毎の他の信号成分のエネルギに対するθdに対応する信号成分のエネルギ、周波数帯域数、信号が優勢な期間等の数個の要因による影響を受ける。実際、各周波数は式(28)において等しく重み付けされる。その結果、優勢な発生源による弱い発生源の隠蔽は減少する。対照的に、既存の時間ドメイン相互相関方法は、信号強度、より強いバイアス感度を優勢な発生源に組み込む。
【0155】
両耳時間差は、音響波長がセンサ22、24間の分離距離D未満である高周波サウンドに対しては曖昧であることは、注目すべきである。この曖昧さは、このセンサ間距離に関係する周波数よりも高い位相倍数の発生を生じ、特定の位相差ΔφをΔφ+2πから区別することができなくなる。その結果、ある周波数より上では、位置対周波数の1対1の関係がなくなる。したがって、θd=θiに対応する一次垂直追跡に加えて、位置の変動を曖昧な位相倍数毎に周波数で特徴付ける、二次関係もある。これら二次関係は、周波数で積分するための二次推定技術に対して考慮される。式(31)は、これら二次関係を考慮する、所与の方位に対する予測一致パターンを決定する手段を以下のように与える。
【0156】
【数50】
Figure 0003745227
【0157】
ここで、γm,dは整数であり、γm,dの各値は、パターンPNi,m)における輪郭(contour)を定義する。一次関係は、γm,d=0と関連付けられている。特定のθdに対して、有効なγm,dは式(32)によって以下のように与えられる。
【0158】
【数51】
Figure 0003745227
【0159】
図18のグラフ600は、式(31)および(32)にしたがって決定した多数の代表的な一致パターン612、614、616、618を示す。ここで、縦軸はHz単位の周波数を表し、横軸は度単位の方位位置を表す。パターン612は0°の方位位置に対応する。パターン612は、概略的に直線の実線垂直線612aに対応する一次関係、および曲線状の実線線分612bに対応する多数の二次関係を有する。同様に、パターン614、616、618は−75°、20°、および75°の方位位置に対応し、直線状の垂直線614a、616a、618aとして示す一次関係、および対応して異なる破線フォーマットの、曲線線分614b、616b、618bとして示す二次関係を有する。一般に、垂直線を一次輪郭と呼び、曲線線分を二次輪郭と呼ぶ。他の方位位置に対する一致パターンは、当業者には想起されようが、式(31)および(32)を用いて決定することができる。
【0160】
PNi,m)におけるこれら曖昧さの存在は、θd=θiに沿った積分の後に、HNd)におけるアーチファクト・ピークを生ずる可能性があることを注記しておく。数個の発生源に対応する曲線トレースを重ね合わせると、ノイズの多いHNd)項を誘発する場合がある。いずれの実際の発生源からでも、遠く離れている場合は、誤ってアーチファクト・ピークが、存在しない発生源の検出を示す場合がある。しかしながら、真の発生源に対応するピーク近くでは、HNd)における実際の発生源のピーク検出および定位双方に影響を及ぼす可能性がある。位相の曖昧さの悪影響を低減することが望ましい場合、定位は、所与の方位位置毎の一次関係に加えて、二次関係を考慮に入れるとよい。したがって、対象の方位方向θd(d=1,...,I)毎の一致パターンを決定し、プロットして、PNi,m)によって定義される形状を有する「ステンシル」ウインドウとして利用することができる(i=1,..., I; m=1,..., M)。言い換えると、各ステンシルは、一次輪郭の方位位置における音響源に帰する一致点の予測パターンであり、周波数のファクタとして、その他の方位位置に対応する疑似座を含む。ステンシル・パターンは、mの異なる値におけるデータを濾波する際に用いることができる。
【0161】
式(32)を用いることによって、以下の式(33)において反映されるように式(30)の積分近似を修正する。
【0162】
【数52】
Figure 0003745227
【0163】
ここで、A(θd)は、総和において用いられる点数を示す。式(30)は、γm,d=0に対応する、式(33)の特殊な場合であることを注記しておく。したがって、式(33)は、周波数での積分の第2技術が望ましい場合、式(30)の代わりに用いられる。
【0164】
式(2)に示したように、変数θiおよびτiは等価であり、二重遅延線における位置を表す。これらの変数間の差は、その対応する空間方位を用いることによって、θiが二重遅延線に沿った場所を示し、一方τiは、値τiの対応する時間遅延ユニットを用いることによって場所を示す。したがって、ステンシル・パターンは、ステンシル・フィルタ関数をτiで表すと、以下の式(34)に定義されるように、著しく簡単になる。
【0165】
【数53】
Figure 0003745227
【0166】
ここで、τdは式(4)によってθdに関係する。特定のτdに対して、有効なγm,dの範囲は、式(35)によって以下のように与えられる。
【0167】
【数54】
Figure 0003745227
【0168】
τdの値の変更は、一致パターンの形状を変更することなく、τi−軸に沿って一致パターン(即ち、ステンシル・パターン)を単にシフトすればよい。式(34)および(35)によって特徴付けられる手法は、対象の各方位位置毎にパターンを分離する代わりとして利用することができる。しかしながら、遅延ユニットτiのスケーリングは二重遅延線に沿って均一であるので、二重遅延線による方位区分は均一でなく、中央面に近い領域程方位分解能は高くなる。一方、方位において等価な分解能を得るためには、均一のτiを用いると、均一のθiを用いる場合よりも遥かに多い数Iの遅延ユニットが必要となる。
【0169】
図16の信号フロー図は、更に、定位作用素460に関して選択した詳細も示す。等価係数αi(m)を1にセットした場合、1対の遅延段344の遅延信号は、mにインデックスされた各周波数毎に一致検出作用素462に送られ、一致点を判定する。検出作用素462は、式(22)または(26)にしたがって、最小値を判定する。各一致検出作用素462は、結果in(m)を、所与のmに対して対応するパターン発生器464に送る。発生器464は、mにインデックスされた周波数毎に、2−D一致プロットを作成し、結果を対応する加算作用素466に渡し、当該所与の周波数に対して、式(28)で表される演算を実行する。加算作用素466は、時間積分を近似する。図16では、明確性を維持するために、m=1およびm=Mに対応する作用素462、464、および466のみを示し、m=2ないしm=M-1に対応する作用素は楕円で示されている。
【0170】
加算作用素466は、結果を加算作用素468に渡し、周波数積分を近似する。作用素468は、高周波数における二次関係によって生ずるアーチファクトが存在しないかまたは無視できる場合、式(30)にしたがって構成することができる。あるいは、二次関係を含む予測一致パターンによるステンシル・フィルタリングは、加算作用素468を用いて式(33)を適用することによっても行なうことができる。
【0171】
再度図15を参照すると、作用素468はHNd)を出力デバイス490に出力し、対応する音響源位置情報をマップする。デバイス490は、所定の方位位置に対する音響源の空間配置を表すマップを与えることができるディスプレイまたはプリンタを含むことが好ましい。加えて、音響源が空間内で移動する毎に、動的に突き止め追跡することも可能である。移動軌道は、各サンプル・ウインドウで計算する1組の場所δ(i-in(m))から推定することができる。補聴器のような小さい携帯ユニットにシステム410を組み込んだ他の実施形態では、出力デバイス490を含まない方が好ましい。更に別の実施形態では、出力デバイス90を含まなくてもよい。
【0172】
定位作用素460の定位技術は、似かよったった音圧レベルおよび周波数範囲の音響源を2つ以上突き止める場合に特に適しており、軸上の所望の発生源を指定する必要はない。したがって、システム410の定位技術は、センサ22、24に関して定義した多数の位置に対して2つよりも多い音響源を突き止めマップする独立した能力を備える。しかしながら、他の実施形態では、定位作用素460の定位能力は、指定の基準発生源と共に利用して、抽出およびノイズ抑制を行なうことも可能である。実際、図示の実施形態の抽出作用素480は、このような機能を組み込んでいる。これについて以下で更に詳しく説明する。
【0173】
2センサ検出構成に基づく既存のシステムは、一般に、ビーム形成によって最も優勢な干渉源に帰するノイズを抑制しようとするだけである。生憎、この手法は、隣接する場所に似通った干渉源が多数ある場合、その価値は限定される。
【0174】
定位の後複数の干渉源の各々において1つ以上の異なる周波数成分を抑制することにより、話者が多数いる場合のような、複雑な音響環境において、話者間で時間的の重複および周波数の重複があるにも拘らず、ノイズ源からの干渉を低減できることがわかった。所与の周波数成分または1組の成分は、所与の時間フレームの間干渉源の1つにおいて抑制され得るに過ぎないが、突き止めた干渉音響源間において各周波数の抑制を動的に割り当てることによって、全ての周波数において最も強い(offensive)発生源のみを単に解消するよりも、所望の信号の了解度が向上する。
【0175】
抽出作用素480は、この手法の一実施態様を備えるに当たり、定位作用素460からの定位情報を利用することにより、i=s以外の位置に対応するQ個のノイズ源を識別する。Q個のノイズ源の位置は、i=noise1, noise2, ..., noiseQによって表される。作用素480は、システム310に関して説明したように、信号作用素350の出力を受信する。これは、周波数m毎に、対応する信号Xn (i=noise1)(m), Xn (i=noise2)(m),..., Xn (i=noiseQ)(m)を表す。これらの信号は、周波数mにおける所望の信号の成分だけでなく、打ち消すべきもの以外の発生源からの成分も含む。抽出および抑制の目的のために、一旦定位を行なったならば、等価係数αi(m)を1にセットする必要はない。個々のノイズ源においてどの周波数成分または1組の成分を抑制するかを決定するために、Xn (i=noise1)(m), Xn (i=noise2)(m),..., Xn (i=noiseQ)(m)の振幅を算出し、比較する。以下の式(36)によって定義されるように、最小のXn (i=noise)(m)を出力S‘n(m)として取り込む。
【0176】
【数55】
Figure 0003745227
【0177】
ここで、Xn (i=noise)(m)は、mの各値に対して、以下のように式(37)によって表される条件を満たす。
【0178】
【数56】
Figure 0003745227
【0179】
尚、式(37)において、元の信号αs(m)XLN (s)(m)が含まれていることに注目すべきである。得られるビーム・パターンは、時々、他の弱いノイズ源を増幅する場合もある。ノイズ増幅量が最も強いノイズ源のキャンセレーション量よりも大きい場合、作用素480に更に多くの条件を含ませ、その時点における当該周波数に対する入力信号の変更を禁止するとよい。
【0180】
プロセッサ30、330、430は、当業者には公知の技術を利用して、対応するアルゴリズム、段、作用素、変換器、発生器、アレイ、手順、プロセス、ならびにそれぞれの数式および信号フロー図に記載されている技術を、ソフトウエア、ハードウエアまたは双方で具体化する1つ以上の構成要素を含む。プロセッサ30、330、430は、当業者に想起されるいずれの形式のものでもよい。しかしながら、プロセッサ30、330、430は各々、ソリッド・ステート集積ディジタル信号プロセッサを用いる専用ハードウエアが、他の構成要素を最小限に抑えて、必要な動作を実行することが好ましい。
【0181】
システム310、410は、図4Aに関して説明した種類の補聴器としての用途に合わせたサイズとし、それに適合化することができる。更に別の補聴器の実施形態では、センサの適用22、24は、聴取者の耳介内に納まるサイズおよび形状とし、プロセッサ・アルゴリズムを調節して、頭部および胴体によって生ずるシャドーイングに考慮する。この調節を行なうには、当業者には公知の聴取者に特定の、または母集団平均の頭部関連伝達関数(HRTF)を導出するとよい。次に、この関数を用いて、二重遅延段出力信号の適切な重みを得て、シャドーイングを補償する。
【0182】
更に別の実施形態では、システム310、410は、図4Bに関して説明した形式の音声認識システムに適合化される。更に別の実施形態では、システム310、410は、音源マッピングの用途、または当業者に想起するその他の用途に利用することもできる。
【0183】
種々の信号フロー作用素、変換器、機能ブロック、発生器、ユニット、段、プロセス、および技術は、本発明の精神から逸脱することなく、当業者に想起されるように、変形、再配置、交換、削除、二重化、結合、または追加が可能であることを念頭に入れている。別の一実施形態では、本発明による信号処理システムは、音響励起に対応する第1信号を供給するように構成されている第1センサを含み、この励起は、第1発生源からの第1音響信号と、第1発生源からは変位した第2発生源からの第2音響信号とを含む。また、システムは、第1センサから変位した第2センサも含み、励起に対応する第2信号を供給するように構成されている。更に、第1および第2信号に応答するプロセッサも含まれており、これは第1音響信号を表すスペクトルを有する所望の信号を発生する手段を含む。この手段は、多数の第1タップを有し多数の遅延第1信号を供給する第1遅延線と、多数の第2タップを有し多数の遅延第2信号を供給する第2点線を含む。また、このシステムは、所望の信号を表す感覚出力を発生する出力手段も含む。別の実施形態では、信号処理方法は、対応する第1信号を供給する第1の場所、および対応する第2信号を供給する第2の場所双方において音響励起を検出するステップを含む。励起は、第1発生源からの所望の音響信号と、第1発生源から離間した第2発生源からの干渉音響信号との複合体である。また、この方法は、第1および第2信号の関数として、第1発生源に対して第2発生源を空間的に定位するステップと、この定位実行の間、所望の音響信号を表す特性信号を発生するステップも含む。
(実験部)
以下の事件結果は、本発明の理解を高めるために単なる代表例として提示するのであり、本発明の範囲を減縮または限定するように解釈しないこととする。
(例1)
Sun Sparc-20ワークステーションを、本発明の信号抽出プロセスをエミュレートするようにプログラムした。半無音室において、1つのスピーカ(L1)を用いて言語信号を放出し、別のスピーカ(L2)を用いておしゃべりノイズを放出した。従来の形式のマイクロフォン2つを室内に配置し、ワークステーションと動作的に結合した。マイクロフォンは、約15センチメートルのマイクロフォン間距離を有し、L1から約3フィートの所に位置付けた。L1をマイクロフォン間の中点と一直線状とし、0度方位を規定した。L2は、L1およびL2間の中点に対してほぼ等距離に、L1に対して異なる方位で配置した。
【0184】
図5を参照すると、長さ約2秒の文章の明確な発話が示されており、L1から発せられ、L2からの干渉はない。図6は、L1およびL2からの複合信号を示す。複合信号は、図5に示した言語信号と結合した、L2からのおしゃべりノイズを含む。おしゃべりノイズおよび言語信号は、L2をL1に対して60度の方位に配置したときは、ほぼ等しい強度(0dB)である。図7は、図6の複合信号から復元した信号を示す。この信号は、図5の信号とほぼ同一である。
【0185】
図8は、おしゃべりノイズが図5の所望の信号よりも30dB強い場合の、別の複合信号を示す。更に、L2はL1に対して僅か2度の方位の所に配置されている。図9は、図8の複合信号から復元した信号を示し、L2からのおしゃべりノイズが強くしかも場所が近いにも拘らず、図5の信号の明確に了解できる表現が得られた。
(例2)
システム410に対応する実験を、各グループに4人ずつの話者(二人の男と二人の女)を有する2つのグループで行なった。5つの異なる試験を各グループ毎に行い、各検査毎に異なる発生源の空間構成を用いた。4人の話者を図14の発生源412、414、416、418に対応付けて配置し、各検査毎に、角度412a、414a、416a、および418aに異なる値を用いた。図14の例示は、角度418aが−75度、角度412aが0度、角度414aが+20度、および角度416aが+75度とした最初の検査に、最も密接に対応する。図18の一致パターン612、614、616、および618も、−75度、0度、+20度、および+75度の方位位置に対応する。
【0186】
この検査のための実験的設定では、2つのマイクロフォンをセンサ22、24に用い、マイクロフォン間距離を約144mmとした。2つのマイクロフォン間には、回折もシャドーイング効果も存在せず、マイクロフォン間強度差を、この検査では0にセットした。6kHzで信号をロー・パス・フィルタにかけ、12.8kHzレート、16ビット量子化でサンプルした。量子化信号を受信し、本発明に応じて処理し、以下に述べる検査結果を出力するように、Wintel系コンピュータをプログラムした。短期スペクトル分析において、信号の20−msセグメントに、ハミング・ウィンドウで重み付けし、次いでゼロを詰め込みDFTのために2048点とした。こうして、周波数分解能を約6Hzとした。時間遅延ユニットτi (i=1, ..., I)の値は、二重遅延線の方位分解能が均一に0.5°となるように決定した。即ち、I=361とした。検査に用いた二重遅延線は方位均一である。一致検出方法は、最少振幅差(minimum magnitude difference)を基にした。
【0187】
5回の検査の各々は、4つのサブセットから成り、その中で異なる話者を所望の発話源として発話させた。最も難しい実験的制約の下でシステム性能を検査するために、言語素材(4つの等しい強度の強強格単語(spondaic word)を故意に時間的に一致させた。言語素材を自由場に提示した。式(30)および式(33)双方の技術を用いて、話者の定位を行なった。
【0188】
システム性能を評価するにあたって、客観的了解度重み付け尺度を用いた。これは、Peterson,P.M.の”Adaptive array processing for multiple microphone hearing aids,”Ph.D.Dissertation(「多数のマイクロフォン補聴のための適応アレイ処理」博士学位論文),Dept. Elect. Eng.and Comp.Soci.,MIT;Res.Lab.Elect.Tech.Rept.541,MIT、Cambridge、MA(1989)に提案されており、Liu,C.およびSideman,S.の”Simulation of fixed microphone arrays for directional hearing aids”(指向性補聴器のための固定マイクロフォン・アレイのシミュレーション)、J.Acoust. Soc.Am.100,848〜856(1996)に詳細に記載されている。具体的には、了解度重み付け信号キャンセレーション、了解度重み付けノイズ・キャンセレーション、および正味了解度重み付け利得を用いた。
【0189】
実験結果を図19ないし図22の表I、II、III、およびIVにそれぞれ示す。図19の表Iに記載した5回の検査は、式(30)を利用することによって、周波数による積分を近似し、二人の男の話者M1、M2および女の話者F1、F2を含む。図20の表IIに記載した5回の検査は、周波数での積分を式(33)で近似したことを除いて、表Iと同じである。図21の表IIIに記載した5回の検査は、式(30)を利用して、周波数での積分を近似し、二人の異なる男の話者M3、M4、および二人の異なる女の話者F3、F4を含む。図33の表IVに記載した5回の検査は、周波数による積分を式(33)で近似したことを除いて、表IIIと同一である。
【0190】
検査毎に、データをマトリクス状に配列し、対角線上の数値は、所望の発生源(理想的には0dB)のノイズ・キャンセレーションの度合いをdBで表し、それ以外の数値は各ノイズ源に対するノイズ・キャンセレーションの度合いを表す。次の列から最後の列までは、全てのノイズ源を集中した場合のキャンセレーションの度合いを示し、最後の列は正味の了解度重み付けの改良(所望の信号におけるノイズ・キャンセレーションおよび損失双方を考慮する)を示す。
【0191】
総合的に、これらの結果は、約3ないし11dBの範囲で、了解度重み付け尺度におけるキャンセレーションを示し、一方所望の発生源の劣化は全体的に約0.1dB未満であった。総ノイズ・キャンセレーションは、約8ないし12dBの範囲であった。種々の表の比較から、検査に参加した話者や用いた言語素材に対する依存性は非常に低いことが示唆されている。同様の結果は、話者6人の実験からも得られた。総合的に、6つの異なるスピーカから発する6つの大きさが等しく、時間的に一致した言語サウンドの場合、了解度重み付け信号対ノイズ比において、7ないし10dBの改良が得られた。
【0192】
本明細書において引用した全ての刊行物および特許出願は、あたかも個々の刊行物または特許出願の各々が、具体的かつ個別に、その言及により本願に含まれているかのように、言及により本願にも含まれるものとし、本願と所有者が同じである、1996年6月19日出願の米国特許出願番号第08/666,757号、および1998年11月16日出願の米国特許出願第08/193,158号を含むが、これらに限定される訳ではない。更に、ここで述べたあらゆる定理、動作機構、証明、および研究結果は、本発明の理解を更に高めることを意図したのであり、本発明または特許請求の範囲に規定した発明の範囲をかかる定理、動作機構、証明、または研究結果に従属させる訳ではない。本発明は、図面および前述の説明において詳細に図示しかつ記載したが、これは性質上限定ではなく例示として見なすこととする。選択した実施形態のみを示しかつ説明したのであり、特許請求の範囲によって規定される本発明の範囲内に該当する変更物、修正物、および等価物全ての保護を望むことは理解されよう。
【図面の簡単な説明】
【図1】 本発明の一実施形態のシステムの概略図である。
【図2】 図1のシステムから選択した態様を詳しく示す信号フロー図である。
【図3】 図2の二重遅延線の概略図である。
【図4】 図4Aは補聴器への応用に対応する本発明の別の実施形態を示す図である。
図4Bはコンピュータ音声認識への応用に対応する本発明の別の実施形態を示す図である。
【図5】 長さが約2秒の文章の形態の言語信号のグラフである。
【図6】 おしゃべりノイズおよび図5の言語信号を0dBの信号対ノイズ比で含み、おしゃべりノイズ源が言語信号源に対して約60度の方位にある複合信号のグラフである。
【図7】 図6の復号信号から抽出した後の図5の音声信号を表す信号のグラフである。
【図8】 おしゃべりノイズおよび図5の言語信号を−30dBの信号対ノイズ比で含み、おしゃべりノイズ源が言語信号源に対して2度の方位にある複合信号のグラフである。
【図9】 図8の複合信号から抽出した後の図5のサンプル言語信号を表す信号を示すグラフである。
【図10】 本発明の別の実施形態の信号フロー図である。
【図11】 図10の二重遅延線の選択した態様を更に詳細に示す、部分的信号フロー図である。
【図12】 多数の音源の1つの代表例に対して、図10に示す実施形態の選択した幾何学的構造を示す図である。
【図13】 図10の定位作用素の選択した態様を更に詳細に示す信号フロー図である。
【図14】 本発明の更に別の実施形態を示す図である。
【図15】 図14の実施形態の選択した態様を更に示す信号フロー図である。
【図16】 図15の定位作用素の選択した態様を更に詳細に示す信号フロー図である。
【図17】 2つの発生源に対する一致座のプロットを示す図である。
【図18】 −75°、0°、20°、および75°に対応する方位位置に対して一致パターンを示すグラフである。
【図19】 本発明によって得られた実験的結果を示す表である。
【図20】 本発明によって得られた実験的結果を示す表である。
【図21】 本発明によって得られた実験的結果を示す表である。
【図22】 本発明によって得られた実験的結果を示す表である。

Claims (31)

  1. 第1音響センサから第1信号を供給し、および前記第1音響センサから離間した第2音響センサから第2信号を供給するステップであって、前記第1信号および第2信号が各々3つ以上の音響源に対応し、前記音響源が複数の干渉源および所望の発生源を含む、ステップと、
    前記第1および第2信号から前記干渉源を定位し、対応する数の干渉源信号を供給し、各干渉源信号が、前記干渉源の異なる1つに対応し、複数の周波数成分を有し、該成分の各々が異なる周波数に対応する、ステップと、
    該干渉源信号の各々に対して、該周波数成分の1つを抑制するステップであって、該干渉源信号の任意の一つに対して抑制された周波数成分の1つが、該干渉源信号の任意の他のものに対して抑制された周波数成分の1つと異る該ステップと、
    を備える方法。
  2. 請求項1記載の方法において、前記抑制するステップは、前記所望の発生源を表す所望の信号を抽出するステップを含む方法。
  3. 請求項2記載の方法において、前記抽出するステップは、最小値を前記干渉信号の関数として判定するステップを含む方法。
  4. 請求項1ないし3のいずれか1項記載の方法において、前記定位するステップは、各々前記第1および第2センサに対する多数の所定の空間位置の1つに対応する多数の一致パターンを用いて濾波するステップを含み、前記パターンは、各々、前記所定の空間位置の前記1つに対して、周波数と共に変動する疑似位置情報を与える、方法。
  5. 請求項1記載の方法であって、更に、前記第1および第2信号を、多数の周波数の各々に対して異なる二重遅延線を用いて遅延させ、対応する数の遅延信号を供給し、前記定位を行なうステップを含む方法。
  6. 請求項5記載の方法であって、更に、前記定位するステップの後に前記遅延信号を処理し、前記抑制を行なうステップを含む方法。
  7. 請求項6記載の方法であって、更に、
    前記遅延の前に、周波数に関して、前記第1および第2信号を時間ドメイン形態から周波数ドメイン形態に変換するステップと、
    前記所望の発生源を表す所望の信号を抽出するステップであって、前記抽出が前記抑制を含む、ステップと、
    前記所望の信号を周波数ドメイン形態から時間ドメイン形態に変換するステップと、
    前記所望の信号の時間ドメイン形態から、前記所望の発生源を表す音響出力を発生するステップと、
    を含む方法。
  8. 請求項5記載の方法において、前記干渉信号は、各々、前記遅延信号の一意の対から、当該遅延信号の一意の対の大きさの差と、前記遅延信号の一意の対のそれぞれに関連する遅延量の関数として決定された差との比率として判定される方法。
  9. 1対の離間された音響センサであって、各々が、3つ以上の別々に配置された所望の発生源と複数の干渉源とを含む音響源を検出し、対応して1対の入力信号を発生するように構成されている、該1対の離間された音響センサと、
    前記入力信号に応答して、それから多数の遅延信号を発生する遅延作用素と、
    前記遅延信号に応答し、前記センサの場所に対して前記干渉源を定位し、各々前記干渉源の対応する1つを表す複数の干渉源信号を供給する定位作用素であって、前記干渉源信号が、各々、複数の周波数成分に関して表現され、該成分が各々異なる周波数に対応する、該定位作用素と、
    前記干渉源信号に応答し、前記干渉源信号の各々の前記周波数成分の少なくとも1つを抑制し、前記所望の発生源に対応する所望の信号を抽出する抽出作用素であって、抑制されている前記周波数成分の前記少なくとも1つが前記干渉源信号の各々に対して異なる、該抽出作用素と、
    前記所望の信号に応答して、前記所望の発生源に対応する出力を供給する出力デバイスと、
    から成るシステム。
  10. 請求項9記載のシステムにおいて、前記定位作用素は、前記干渉源を多数の位置に対して定位するフィルタを含み、該フィルタは、前記位置の各々に対する周波数と共に変動する曖昧位置情報の異なる一致パターンに基づく、システム。
  11. 請求項9記載のシステムであって、更に、
    前記入力信号に応答して、前記入力信号の各々をアナログ形態からディジタル形態に変換するアナログ/ディジタル変換器と、
    前記入力信号の前記ディジタル形態に応答して、複数の離散周波数に関して前記入力信号を時間ドメイン形態から周波数ドメイン形態に変換する第1変換段であって、前記遅延作用素が前記周波数の各々に二重遅延線を含む、該第1変換段と、
    前記所望の信号に応答して、前記所望の信号を前記ディジタル周波数ドメイン形態からディジタル時間ドメイン形態に変換する第2変換段と、
    前記ディジタル時間ドメインに応答して、前記出力デバイスのために前記所望の信号をアナログ出力形態に変換するディジタル/アナログ変換器と
    を備えるシステム。
  12. 請求項9ないし11のいずれか1項記載のシステムにおいて、前記遅延作用素、前記定位作用素、および前記抽出作用素を、ソリッド・ステート信号処理デバイスによって備えるシステム。
  13. 請求項9ないし11のいずれか1項記載のシステムにおいて、前記所望の発生源信号を前記干渉信号の関数として判定するシステム。
  14. 請求項9ないし11のいずれか1項記載のシステムにおいて、前記干渉源信号を、各々、前記遅延信号の一意の対から判定するシステム。
  15. 請求項14記載のシステムにおいて、前記干渉信号は、各々、前記遅延信号の前記一意の対間における大きさの差と、当該遅延信号の一意の対のそれぞれに関連する遅延量の関数として判定される差との間の比率に対応するシステム。
  16. 請求項9ないし11のいずれか1項記載のシステムにおいて、前記出力デバイスは、前記所望の発生源を表す音響出力を供給するように構成されているシステム。
  17. 第1音響センサおよび第2音響センサを配置し、複数の別々に位置する音響源を検出するステップと、
    前記第1センサによって前記発生源に対応する第1信号を発生し、前記第2センサによって前記発生源に対応する第2信号を発生するステップと、
    前記第1および第2信号から多数の遅延信号対を供給するステップであって、前記遅延信号対が、各々、前記第1および第2センサに対する多数の位置の1つに対応する、ステップと、
    前記遅延信号対と多数の一致パターンとの関数として前記発生源を定位し、前記パターンの各々が前記位置の1つに対応し、前記位置の前記1つにおける発生源に帰せられる周波数を有する音響源位置情報の予測変動を確定するステップと、
    から成る方法。
  18. 請求項17記載の方法において、前記一致パターンは、各々、疑似音響源位置の変動を周波数で特徴付ける多数の関係に対応し、該関係が、各々、異なる曖昧位相倍数に対応する、方法。
  19. 請求項18記載の方法であって、更に、前記一致パターンの各々に対する関係を、前記第1および第2センサを分離する距離の関数として判定するステップを含む方法。
  20. 請求項18記載の方法において、前記関係は、各々、一次輪郭に対して曲線を描く二次輪郭に対応し、前記一次輪郭が、前記位置の前記1つに対応する遅延信号対から判定される周波数不変音響源位置情報を表す、方法。
  21. 請求項17ないし20のいずれか1項記載の方法において、前記定位するステップは、前記一致パターンを用いて濾波し、疑似位置情報を用いて真の位置情報を改良するステップを含む方法。
  22. 請求項21記載の方法において、前記定位するステップは、時間で積分するステップおよび周波数で積分するステップを含む方法。
  23. 請求項17ないし20のいずれか1項記載の方法において、前記第1および第2センサは補聴デバイスの一部であり、更に、頭部関連伝達関数を用いて前記遅延信号対を調節するステップを含む方法。
  24. 請求項17ないし20のいずれか1項記載の方法であって、更に、
    前記定位するステップの後に所望の信号を抽出するステップと、
    選択された数の前記発生源の各々に対して、異なる1組の周波数成分を抑制し、ノイズを低減するステップと、
    を含む方法。
  25. 請求項17ないし20のいずれか1項記載の方法において、前記位置は、各々、前記第1および第2センサに対して確定した方位に対応し、更に、前記発生源の各々の相対的な場所を示すマップを発生するステップを含む方法。
  26. 各々、1対の入力信号の内対応する1つを発生するように構成されている1対の離間された音響センサであって、前記信号が多数の別々に位置する音響源を表す、該音響センサと、
    前記入力信号に応答し、各々前記センサに対する多数の位置の1つに対応する多数の遅延信号を発生する遅延作用素と、
    前記遅延信号に応答して、前記遅延信号および多数の一致パターンから多数の音源定位信号を決定する定位作用素であって、前記パターンが、各々、前記位置の1つに対応し、曖昧位相倍数によって生ずる周波数変動音源位置情報を前記位置の前記1つに関係付け、音源定位を改善する、定位作用素と、
    前記定位信号に応答し、前記発生源の少なくとも1つに対応する出力を供給する出力デバイスと、
    から成るシステム。
  27. 請求項26記載のシステムであって、更に、
    前記入力信号に応答して、前記入力信号の各々をアナログ形態からディジタル形態に変換するアナログ/ディジタル変換器と、
    前記入力信号の前記ディジタル形態に応答して、複数の離散周波数に関して前記入力信号を時間ドメイン形態から周波数ドメイン形態に変換する第1変換段であって、前記遅延作用素が前記周波数の各々に対して二重遅延線を含む、第1変換段と、
    を備えるシステム。
  28. 請求項27記載のシステムであって、更に、
    前記定位信号に応答して所望の信号を抽出する抽出作用素と、
    前記所望の信号に応答して前記所望の信号をディジタル周波数ドメイン形態からディジタル時間ドメイン形態に変換する第2変換段と、
    前記ディジタル時間ドメイン形態に応答し、前記出力デバイスのために前記所望の信号をアナログ出力形態に変換するディジタル/アナログ変換器と、
    を備えるシステム。
  29. 請求項26ないし28のいずれか1項記載のシステムにおいて、前記出力デバイスは、音響源の場所のマップを供給するように構成されているシステム。
  30. 請求項26ないし28のいずれか1項記載のシステムにおいて、前記遅延作用素および前記定位作用素を、集積ソリッド・ステート信号プロセッサによって規定するシステム。
  31. 請求項26ないし28のいずれか1項記載のシステムにおいて、前記定位作用素は、前記遅延信号に応答して、前記発生源の1つに対して、前記位置の内最も近いものを、当該位置の最も近いものに対応する前記遅延信号の少なくとも1つと、前記位置の他のものに対応する前記遅延信号の少なくとも2つの関数として決定し、前記遅延信号の前記他の少なくとも2つを、前記一致パターンの対応する1つによって決定する、システム。
JP2000583297A 1998-11-16 1999-11-16 両耳信号処理技術 Expired - Fee Related JP3745227B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/193,058 1998-11-16
US09/193,058 US6987856B1 (en) 1996-06-19 1998-11-16 Binaural signal processing techniques
PCT/US1999/026965 WO2000030404A1 (en) 1998-11-16 1999-11-16 Binaural signal processing techniques

Publications (2)

Publication Number Publication Date
JP2002530966A JP2002530966A (ja) 2002-09-17
JP3745227B2 true JP3745227B2 (ja) 2006-02-15

Family

ID=22712122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000583297A Expired - Fee Related JP3745227B2 (ja) 1998-11-16 1999-11-16 両耳信号処理技術

Country Status (9)

Country Link
EP (1) EP1133899B1 (ja)
JP (1) JP3745227B2 (ja)
CN (1) CN1333994A (ja)
AT (1) ATE404028T1 (ja)
AU (1) AU748113B2 (ja)
CA (1) CA2348894C (ja)
DE (1) DE69939272D1 (ja)
DK (1) DK1133899T3 (ja)
WO (1) WO2000030404A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7206423B1 (en) 2000-05-10 2007-04-17 Board Of Trustees Of University Of Illinois Intrabody communication for a hearing aid
ITMI20020566A1 (it) * 2002-03-18 2003-09-18 Daniele Ramenzoni Dispositivo per captare movimenti anche piccoli nell'aria e nei fluidi adatto per applicazioni cibernetiche e di laboratorio come trasduttor
US7433821B2 (en) * 2003-12-18 2008-10-07 Honeywell International, Inc. Methods and systems for intelligibility measurement of audio announcement systems
JP4580210B2 (ja) 2004-10-19 2010-11-10 ソニー株式会社 音声信号処理装置および音声信号処理方法
EP2090895B1 (en) * 2006-11-09 2011-01-05 Panasonic Corporation Sound source position detector
JP4854533B2 (ja) * 2007-01-30 2012-01-18 富士通株式会社 音響判定方法、音響判定装置及びコンピュータプログラム
WO2009135532A1 (en) * 2008-05-09 2009-11-12 Nokia Corporation An apparatus
US20100074460A1 (en) * 2008-09-25 2010-03-25 Lucent Technologies Inc. Self-steering directional hearing aid and method of operation thereof
AU2009311276B2 (en) * 2008-11-05 2013-01-10 Noopl, Inc A system and method for producing a directional output signal
US20110096941A1 (en) * 2009-10-28 2011-04-28 Alcatel-Lucent Usa, Incorporated Self-steering directional loudspeakers and a method of operation thereof
DE102009052992B3 (de) * 2009-11-12 2011-03-17 Institut für Rundfunktechnik GmbH Verfahren zum Abmischen von Mikrofonsignalen einer Tonaufnahme mit mehreren Mikrofonen
CN102111697B (zh) 2009-12-28 2015-03-25 歌尔声学股份有限公司 一种麦克风阵列降噪控制方法及装置
DK2537353T3 (en) 2010-02-19 2018-06-14 Sivantos Pte Ltd Apparatus and method for directional spatial noise reduction
EP2709101B1 (en) * 2012-09-13 2015-03-18 Nxp B.V. Digital audio processing system and method
JP6107151B2 (ja) 2013-01-15 2017-04-05 富士通株式会社 雑音抑圧装置、方法、及びプログラム
CN105307095B (zh) * 2015-09-15 2019-09-10 中国电子科技集团公司第四十一研究所 一种基于fft的高分辨率音频频率测量方法
CN108727363B (zh) * 2017-04-19 2020-06-19 劲方医药科技(上海)有限公司 一种新型细胞周期蛋白依赖性激酶cdk9抑制剂
CN109493877B (zh) * 2017-09-12 2022-01-28 清华大学 一种助听装置的语音增强方法和装置
KR102491417B1 (ko) * 2017-12-07 2023-01-27 헤드 테크놀로지 에스아에르엘 음성인식 오디오 시스템 및 방법
CN111435598B (zh) * 2019-01-15 2023-08-18 北京地平线机器人技术研发有限公司 语音信号处理方法、装置、计算机可读介质及电子设备
CN114624652B (zh) * 2022-03-16 2022-09-30 浙江浙能技术研究院有限公司 一种强多径干扰条件下的声源定位方法
CN117031397B (zh) * 2023-10-07 2023-12-12 成都流体动力创新中心 一种运动物体噪声源定位和评估的快速计算方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6223300A (ja) * 1985-07-23 1987-01-31 Victor Co Of Japan Ltd 指向性マイクロホン装置
US5029216A (en) * 1989-06-09 1991-07-02 The United States Of America As Represented By The Administrator Of The National Aeronautics & Space Administration Visual aid for the hearing impaired
US5400409A (en) * 1992-12-23 1995-03-21 Daimler-Benz Ag Noise-reduction method for noise-affected voice channels
US5473701A (en) * 1993-11-05 1995-12-05 At&T Corp. Adaptive microphone array
US6130949A (en) * 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
CN1260087A (zh) * 1997-04-14 2000-07-12 拉马信号处理有限公司 双重处理干扰消除系统和方法

Also Published As

Publication number Publication date
CN1333994A (zh) 2002-01-30
DE69939272D1 (de) 2008-09-18
CA2348894C (en) 2007-09-25
WO2000030404A1 (en) 2000-05-25
EP1133899B1 (en) 2008-08-06
DK1133899T3 (da) 2009-01-12
EP1133899A1 (en) 2001-09-19
AU748113B2 (en) 2002-05-30
AU1624000A (en) 2000-06-05
ATE404028T1 (de) 2008-08-15
EP1133899A4 (en) 2003-09-03
JP2002530966A (ja) 2002-09-17
CA2348894A1 (en) 2000-05-22

Similar Documents

Publication Publication Date Title
JP3745227B2 (ja) 両耳信号処理技術
US6978159B2 (en) Binaural signal processing using multiple acoustic sensors and digital filtering
US6987856B1 (en) Binaural signal processing techniques
JP3521914B2 (ja) 超指向性マイクロホンアレイ
US9113247B2 (en) Device and method for direction dependent spatial noise reduction
CA2407855C (en) Interference suppression techniques
Lotter et al. Dual-channel speech enhancement by superdirective beamforming
JP4732706B2 (ja) 両耳信号増強システム
US6222927B1 (en) Binaural signal processing system and method
Lockwood et al. Performance of time-and frequency-domain binaural beamformers based on recorded signals from real rooms
Willert et al. A probabilistic model for binaural sound localization
US11134348B2 (en) Method of operating a hearing aid system and a hearing aid system
Jackson et al. Sound field planarity characterized by superdirective beamforming
Wittkop et al. Speech processing for hearing aids: Noise reduction motivated by models of binaural interaction
Lobato et al. Worst-Case-Optimization Robust-MVDR beamformer for stereo noise reduction in hearing aids
US11582562B2 (en) Hearing system comprising a personalized beamformer
WO2020035180A1 (en) Method of operating an ear level audio system and an ear level audio system
Maj et al. SVD-based optimal filtering for noise reduction in dual microphone hearing aids: a real time implementation and perceptual evaluation
Gößling et al. Performance analysis of the extended binaural MVDR beamformer with partial noise estimation
Rohdenburg et al. Objective perceptual quality assessment for self-steering binaural hearing aid microphone arrays
US11470429B2 (en) Method of operating an ear level audio system and an ear level audio system
Woodruff et al. Directionality-based speech enhancement for hearing aids
As' ad Acoustic Beamformers and Their Applications in Hearing Aids
Werner et al. Speech Dereverberation and Noise Reduction for both diffusive noise field and point noise source in Binaural Hearing Aids: Preliminary Version
Maillou et al. Measuring the Performance of the Hearing Aids Adaptive Directivity and Noise Reduction Algorithms through SNR Values

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040323

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040622

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040629

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20040924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040927

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050615

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051020

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051116

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091202

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees