JP2007529787A - 回路構造および信号処理装置 - Google Patents

回路構造および信号処理装置 Download PDF

Info

Publication number
JP2007529787A
JP2007529787A JP2007504243A JP2007504243A JP2007529787A JP 2007529787 A JP2007529787 A JP 2007529787A JP 2007504243 A JP2007504243 A JP 2007504243A JP 2007504243 A JP2007504243 A JP 2007504243A JP 2007529787 A JP2007529787 A JP 2007529787A
Authority
JP
Japan
Prior art keywords
circuit
resonator
filter
signal
circuit structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2007504243A
Other languages
English (en)
Inventor
へメアト,ヴェアナー
ホルムベルク,マルカス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Infineon Technologies AG
Original Assignee
Infineon Technologies AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Infineon Technologies AG filed Critical Infineon Technologies AG
Publication of JP2007529787A publication Critical patent/JP2007529787A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Networks Using Active Elements (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Control Of Motors That Do Not Use Commutators (AREA)
  • Filters And Equalizers (AREA)

Abstract

この回路構造は複数の共振器回路とともに、フィルタバンクの複数のフィルタ段を含んでいる。この回路構造はまた、共振器回路のQを制御あるいは調整するための共振器制御回路をも含んでいる。該共振器制御回路は、共振器回路の入力信号の振幅、および/または、共振器回路の出力信号の振幅に従って、少なくとも一つの共振器回路のQを制御あるいは調整するように構成されている。

Description

発明の詳細な説明
本発明は、回路構造および信号処理装置に関するものである。
自動的に音声を認識するために、入力音声信号のスペクトル分析を行うための高速フーリエ変換(FFT)をディジタル入力音声信号に応用することが、知られている。自動音声認識において用いられる特徴は、高速フーリエ変換によって形成されたパワースペクトルから導き出されたものである(参照:[1])。
このような高速フーリエ変換では、通常、所定の区間の時間窓が用いられる。各時間窓によって示される1つの信号エレメントを、高速フーリエ変換する。これにより、周波数分解能および時間分解能が制限される。
音声認識においては通常と同様に、パワースペクトルと、それゆえに各信号エレメントのマグニチュードスペクトルとのみが用いられる場合、時間分解能は、用いられた時間窓の区間によって制限されている。時間分解能に関するこの制限が、すでに知られている音声認識システムの性能を制限する要因である。音声処理システムにおいて、および、固定された所定の大きさのこのような時間窓を使用する際、パワースペクトルが変化する場合に、時間領域への逆変換の後で、時間窓の有限性に起因したエラーが形成されるということが問題である。
また、[2]、[3]、[4]に記載されているような、自動音声認識のための他の手法では、フィルタバンクが用いられる。該フィルタバンクは、人間の内耳の特性をシミュレートするために用いられる。
さらに、[5]は、内有毛細胞(IHC)および聴神経のモデルを記載している。ここで、基底膜は、様々なフィルタおよび圧縮ユニットを用いてシミュレートされる。さらに、[5]は、小胞プール(vesicle pool)モデルについて記載している。
さらに、[6]は、人間の聴力に関する信号処理のモデルについて記載している。ここで、音響音声信号が、このモデルの入力信号として用いられる。この入力信号は、内耳における周波数位置への変換と同様に、複数の周波数チャネルに細分される。ここで、各チャネルにおいて、半波を整流し、ローパスフィルタにかけ、適合させることにより、入力信号での急転換を増幅し、入力信号の時間的にほぼ一定の成分を減衰する。
[7]は、「補充」と呼ばれる現象と、補充現象を補うためのいわゆるダイナミック圧縮とについて記載している。このダイナミック圧縮によって、音響環境において生じる幅広い音声レベル値域が、人間によって感知される範囲に「圧縮」される。
[8]は、ウェーブディジタルフィルタ構造を用いて、人間の基底膜の一次元の長波モデルのディジタルシミュレーションについて記載している。
[9]は、成長関数について記載している。ここでは、実験動物の鼓膜の上流で測定された音圧に関する基底膜の振動が、記載されている。
さらに、[10]は、内有毛細胞の生物学的な構造について記載している。
[11]は、増幅回路について記載している。この増幅回路では、サウンドプロジェクションシステムの包含性を改善するために、増幅器が用いられる。[11]に記載された該電圧制御増幅器は、緩衝増幅器によって形成された利得制御信号によって制御されている。この利得制御信号は、フィルタバンクによって供給された、様々な周波数チャネルの信号エレメントから、組み合わせネットワークによって構成される。[11]に記載された電圧制御増幅器は、4つの異なる周波数チャネルにおいて4つの異なる信号を処理する。
上記回路構造の目的は、各電圧制御増幅器によって形成された出力信号を、ベースバンドチャネルにおける信号の振幅と同じレベルにかえることである。
本発明は、供給される信号を記述する特徴を提供するための、信号処理装置を初めとする回路構造を特定するという課題に鑑みてなされたものであり、上記特徴は、発生する任意の干渉雑音に対する耐性が向上したものである。
上記問題は、独立請求項に記載された特徴を有する回路構造によって、また、信号処理装置によって解決される。
本発明の好ましい形態は従属請求項に記載されている。
回路構造は、複数のフィルタ段を有するフィルタバンクと、入力信号が供給可能なフィルタバンク入力部とを備えている。さらに、上記回路構造は、上記入力信号のそれぞれから一つの出力信号エレメントを生成するための複数の共振器回路であって、各上記共振器回路が、それぞれ複数の上記フィルタ段の一つのフィルタ段に対応して設けられているとともに、対応するフィルタ段の一つの出力部に結合されている共振器回路を備えている。各共振器回路は、一つのキャパシタンス、一つのインダクタンス、および、一つの共振器出力部であって対応する上記出力信号エレメントが生成可能な共振器出力部を備えている。さらに、上記回路構造には、少なくとも一つの共振器回路のQ値の開ループ制御または閉ループ制御を行うための少なくとも一つの共振器制御回路が備えられており、上記共振器制御回路は、上記共振器回路のQ値のための開ループ制御あるいは閉ループ制御を、上記入力信号の信号振幅および上記共振器回路からの上記出力信号エレメントの信号振幅のいずれか一方または両方の時間プロファイルの関数として供給するように、構成されている。
信号処理装置は、上述した回路構造と、上記回路構造によって生成された信号のさらなる処理を行うための他処理ユニットとを備えている。
本発明によれば、フィルタバンク、好ましくは線形のフィルタバンクを、非線形圧縮段を構成していることが明らかな共振器回路と組み合わせることにより、哺乳類の内耳の非線形振動応答が非常にうまくシミュレートされる。
入力音声信号の特徴抽出プロセスにおける特徴は、各共振器回路の出力信号として生成される。その特徴は干渉雑音に対する耐性が向上しており、特に、音声認識システムを目的とする場合に、本発明に従って備えられる特徴抽出システム(上記回路構造によって構成される)におけるワード誤り率が改善されることになる。
特に、干渉雑音が増加するにつれて、ワード誤り率が、時間窓に基づいて分離されるパワースペクトルに適用される、高速フーリエ変換を用いる従来の初期処理におけるものよりも、ゆっくりと増加する。
本発明によって達成される他の利点は、一般に上記回路構造にアナログ入力信号で供給されて記録された音声信号の細かい時間構造が、大きくスケーリングされて保存されることである。一方、高速フーリエ変換を用いるときのパワースペクトルの場合には、得られる全てのものが、使用される窓の長さの範囲において特徴が時間分解されたものである。
従って、本発明によれば、生物学的構造、および、特に人間の聴覚システムの本質的特徴が、音声信号の特徴の抽出を行うためには、従来技術よりもより良くシミュレートされることが明らかである。これにより、音声認識システムの耐性が向上する。
本発明の特徴は、例えば音声認識のための、すなわち音声認識システムのための特徴の抽出に明瞭に表われる。特に、特徴は上記回路構造に供給される入力信号から生成され、その特徴により、従来技術によるよりも、干渉雑音に対するロバスト性が増す。
あるいは、本発明は、補聴器、例えば、特に中耳が原因で聴力を失った患者の場合の蝸牛のインプラントに対して使用すれば、高い有効性が得られる。
本発明によれば、それぞれの共振器回路のQ値は、入力信号または出力信号エレメントの振幅に基づいて調整される。上記信号の一つの振幅が非常に大きければ、共振器制御回路を用いて少なくとも一つの共振器回路のQ値を、上記信号が十分に減衰する程度にまで減少させることができる。逆に、振幅の小さい信号の場合には、Q値を、それぞれの共振器回路の出力部における信号振幅が増幅される程度にまで増加させることができる。
本発明によれば、ダイナミック圧縮を実行するために、共振器回路がその共振周波数(共振ピーク)に近いところで安定な増幅器として動作するということを利用する。
ここで使用される共振器回路のQ値は、共振器回路の共振周波数における出力信号の振幅の、対応する入力信号の振幅に対する比を意味するものと理解される。共振器回路のQ値はその抵抗値に依存するので、Q値は、例えば、共振器回路の上記抵抗値の開ループ制御または閉ループ制御によって調整することができる。
共振器回路のQ値が共振器回路に入力される入力信号の振幅に基づいて調整されるという想定においては、制御回路の機能としては「開ループ制御」と言うことができる。逆に、共振器回路のQ値が出力信号の振幅に基づいて調整されるならば、共振器回路は、Q値を適合させるフィードバックを用いるので、「閉ループ制御」機能を実行していることになる。
本発明による回路構造によれば、時間領域での信頼性のある効果的な入力信号のダイナミック圧縮が得られ、フーリエ変換の欠点が生じない。特に、これにより、従来技術によるフーリエ変換で生じる有限時間窓の問題を避けることができる。さらに、本発明によれば、例えば、対数フーリエスペクトルの逆変換を行ったものよりも、干渉信号歪みがかなり減少した、ダイナミック圧縮された出力信号が生成される。
本発明によれば、共振器回路のQ値を選択的に生成することにより、十分に強力で強度選択性のある(例えば非線形の)、入力信号の減衰を行うことが可能である。
上記回路構造はフィルタ回路を備えており、該フィルタ回路が信号を通過させる周波数範囲は、共振器回路のインダクタンスLおよびキャパシタンスCの値に基づいて定められる。L、Cの値を設定することにより、共振器回路の透過範囲の平均周波数を極めて簡単に調整することができる。特に、共振回路の共振曲線の幅は、そのQ値を調整することにより調整することができる。共振回路は非線形減衰特性を有するフィルタと見なすことができ、原理的には、任意の所望のレベルのダイナミック圧縮を得ることができる。その処理は十分に狭い帯域で実行されるので、過度の非線形の結果として起こり得る歪みを十分に小さく抑えることが可能である。
上記回路構造は、音声レベルが上昇するにつれ減衰が非線形に増す、2次の共振回路を含んでいてもよい。上記回路構造が受動的に実現される場合、すなわち、受動素子(コイルL、キャパシタC、抵抗R)を使用する場合には、(フィードバックを有する能動増幅器を必要とするシステムとは対照的に)安定な回路を作ることができる。
上記共振器回路は、共振器制御回路による開ループ制御(または閉ループ制御)が可能な抵抗を有していてもよい。このような、閉ループ制御または開ループ制御が可能な抵抗は、単純な回路素子であり、それによって、共振器回路のQ値の閉ループ制御の機能は複雑さをあまり伴うことなく、また正確で安定に実行することができる。
上記共振器制御回路は複数の共振器制御回路素子から構成されることに留意すべきであり、この場合に、各共振器制御回路素子はそれぞれ、割り当てられた共振器回路の各Q値に対する開ループ制御または閉ループ制御を与える。
入力信号は、例えば、抵抗の第1の端子とキャパシタンスの第1の端子との間に供給される。出力信号は、例えば、キャパシタンスの第1の端子と該キャパシタンスの第2の端子との間で生成される。抵抗の第2の端子は、例えば、インダクタンスの第1の端子に結合されており、インダクタンスの第2の端子は、例えば、キャパシタンスの第2の端子に結合されている。
上記共振器制御回路は、例えば、少なくとも一つの共振器回路のQ値を、出力信号の振幅がパラメータとして含まれるボルツマン関数に基づいて制御するように構成される。ボルツマン関数に含まれるパラメータが適切に選択されれば、ボルツマン関数は、人間の内耳における外有毛内部細胞の感度曲線を非常に適切に近似する。この生物学的関係の特に優れた記述は、2次のボルツマン関数によって得られる。これによって、人間の耳の感度曲線を近似することが可能になり、これは、上記回路構造を医療の分野に応用(例えば補聴器)することができるという利点となる。
上記共振器制御回路は、例えば、少なくとも一つの共振器回路のQ値を、人間の耳に対して定義された感度特性に基づいて、出力信号の振幅の関数として調整するように構成される。本発明の回路構造によって人間の内耳の感度特性を特に十分にシミュレートするために、人間の耳の(例えば、実験的にあるいは理論的に定められた)感度特性を、上記制御回路がアクセス可能なファイルまたはテーブルの形態で記憶することが挙げられる。この場合に、共振器制御回路は、少なくとも一つの共振器回路のQ値に対する開ループ制御または閉ループ制御を、共振器制御回路に記憶されている生物学的感度特性に近似されるように、与えることができる。
上記共振器制御回路は、例えば、少なくとも一つの共振器回路のQ値を、それぞれの共振回路についてそれぞれの出力信号エレメントの振幅が大きくなるほど小さくするように構成されている。
上記共振器制御回路は、例えば、少なくとも一つの共振器回路のQ値を、それぞれの出力信号エレメントの振幅の非線形関数として調整する。すなわち、大きな振幅の信号領域は、小さな振幅の信号領域と比較してより大きく減衰される。従って、たとえ、入力信号の音声レベルが極端に広くても、出力信号において十分に狭い範囲に押しとどめることが可能である。
上記共振器制御回路は、例えば、少なくとも一つの共振器回路のQ値を、それぞれの出力信号エレメントの振幅が予め定められた幅内に入るように調整する。特定のアプリケーションにとっては、出力信号エレメントの振幅を、いかなる場合においても、予め定められた幅内に維持するのがよい場合がある。一例として、これは、大きな強度ゆらぎを有する信号を、できるだけ少ない量子化レベルで検出しようとするときの、データ圧縮を目的とする場合に重要となる。この場合に、共振器制御回路は、例えば、それぞれの出力信号エレメントが予め定められた幅内に入るように共振器回路のQ値に対する開ループ制御または閉ループ制御を与えるように、構成される。
上記回路構造は、例えば、複数の直列接続された共振器回路を備えており、それぞれの上流側の共振器回路からの出力信号は、その下流側に接続された、対応する共振器回路の入力信号となるように生成される。
この特に有利な発展形態によれば、直列に接続された複数の共振器回路を有するフィルタバンクは、ダイナミック圧縮を、ダイナミックレンジがさらに広がるようにすることを可能にするように設けられる。原理的には、非常に大きなQ値Q(例えばQ=1000であって、高いレベルに対してはQ=1というQ値に減少する)を有する一つのフィルタ段だけで(すなわち、一つの共振器回路だけで)、高いダイナミック圧縮(例えば60dB)を得ることができる。しかし、このような回路構造は、帯域幅が非常に狭い(例えば共振器回路の共振周波数の0.1%)。本発明によれば、比較的小さなQ値Q(例えばQ=10、従ってQ=1000)を有する複数のフィルタ段を縦続接続することにより(例えば3つの直列接続されたフィルタ段)、十分に高いダイナミック圧縮を得ることができる。これらのフィルタのそれぞれのQ値が大きくはない結果、次のような有利な効果が得られる。Q値が比較的小さいことから個々のフィルタの帯域幅が増加するので、フィルタがより広い周波数範囲をカバーすることとなり、また、フィルタのインパルス応答が同時に改善される。すなわち、システムの投入時および遮断時の過渡時間がかなり短くなる。
直列接続された共振器回路は、上流側の共振器回路の出力電圧が、同時にその下流側に接続された共振器回路の入力電圧となるように、また、上流側の共振器回路の出力電流(一般には、動作中はゼロではない)が、同時にその下流側に接続された共振器回路の入力電流となるように、互いに直接に結合されている。このために、上記回路構造は、一般には、上流側の共振器回路と下流側の共振器回路との間に中間素子を備えていない。これは、回路構造において、上流側の共振器回路のコイルの第2の端子が、上記上流側の共振器回路の下流側に接続された共振器回路の抵抗の第1の端子に接続されるようにすることで、達成することができる。
あるいは、直列接続された共振器回路を直接結合しないようにすることもできる。すなわち、特に上流側の共振器回路と下流側の共振器回路との間に中間素子を配置するようなある方法で、それらを互いに分離する。これは好ましくは、上流側の共振器回路の出力電圧が、同時にその下流側に接続された共振器回路の入力電圧となるように、また、上流側の共振器回路の出力電流がゼロとなるようにして実現される。下流側の共振器回路の入力電流は、本質的にはこの共振器回路のインピーダンスによって決まる。このような回路構造の場合には、上流側の共振器回路とその下流側に接続された共振器回路との間の中間素子として、演算増幅器が(インピーダンス変換器として)設けられるのが好ましい。上記演算増幅器の第1の入力端子は、上流側の共振器回路のコイルの第2の端子に結合される。上記演算増幅器の第2の入力端子は、該演算増幅器の出力端子からフィードバックされており、上流側の共振器回路の下流側に接続された共振器回路の抵抗の第1の端子に結合されている。
計算電力を減少させるためには、全ての直列接続された共振器回路のQ値を等しく設定すればよい。この場合には、全ての共振器回路に対して共通のQ値が決定されて設定されるので、すなわち、全てのフィルタパラメータが等しくなるので、共振器制御回路に必要な計算電力は特に小さく保たれる。特に高い質が要求される回路構造が必要な場合には、上記に代えて、最適化の目的に合わせて、様々な直列された共振器回路のQ値を、異なるように設定すればよい。このような回路構造では、直列接続された共振器回路のそれぞれのQ値は個々に設定されることになる。
上記回路構造は、好ましくは、複数の並列接続された分岐を有していて、各分岐は一つの共振器回路を備えているか、複数の直列接続された共振器回路を備えている。この場合には、各共振器回路のQ値に、対応する共振器制御回路によって開ループ制御または閉ループ制御を与えることができる。
本発明の特に有利な発展形態によれば、複数の、共振器回路の並列接続された分岐が明瞭に設けられ、その場合に、各分岐において、複数の共振器回路が直列に接続される。
各分岐において少なくとも一つの共振器回路は、好ましくは、入力信号の対応する周波数範囲を通過域として、各分岐が合わさると、密に並んだ周波数間隔が通過域となるように、構成される。人間の耳が感度を有する周波数範囲は、20Hzから20kHzまでの間である。この聴覚周波数範囲をカバーするために、並列構造をなす共振器回路において、異なるチャネルを伝送される信号の周波数範囲は、一般に異なっている。ある共振器回路を伝送される信号の周波数範囲は、共振周波数の付近に特定の3−D幅を有する分布曲線をなす。上記共振周波数は、共振回路のL、Cの値を調整することにより調整され、各Q値の調整によって3dBの幅が調整可能である。共振器回路の異なる分岐の異なる周波数通過帯域が合わさると、好ましくも密に並んだ周波数間隔が得られ、それによって、人間の聴覚の感度範囲や、他の任意の有益な周波数範囲をカバーすることができる。
異なる分岐が通過させる周波数範囲は、少なくとも互いに部分的に重なっていることが好ましい。これにより、全ての周波数をカバーすること、および、個々の分岐の信号成分を結合させることが、確実になる。
各分岐が通過させる周波数範囲は、その分岐における少なくとも一つの共振器回路のキャパシタンスの値とインダクタンスの値との一方あるいは両方を調整することによって、予め決定されているのが好ましい。これは、共振器回路の共振周波数がインダクタンスおよびキャパシタンスの値に依存していることに基づいている。
本発明に係る回路構造は、入力信号として音声信号を処理するように構成されていることが好ましい。この場合には、本発明に係る回路構造は、音声処理システムに使用するのに適している。このようなシステムは、例えば、ダイナミックレンジを減少させるように教えられるパルスニューラルネットワークに基づくものとすることができる。他の応用分野としては、大きな振幅を有する信号をできるだけ少ない量子化レベルで記録しようとするときの、音声処理および(音声)データ圧縮を行うシステムがある。さらには、医療の分野での応用があり、特に、重度の聴覚障害を持った患者に対する補聴器としての応用がある。
本発明による回路構造は、ディジタル回路技術またはアナログ回路技術を用いて製造することができる。
上記回路構造の少なくとも一部、特にフィルタ、共振器制御回路の開ループ制御あるいは閉ループ制御の機能は、コンピュータプログラムの形態としてもよい。本発明は、コンピュータプログラムすなわちソフトウェアによって、また、一つあるいは複数の電気回路すなわちハードウェアによって、またあるいは、それらを所望に組み合わせて、すなわちソフトウェア要素およびハードウェア要素によって、実現することができる。
ソフトウェアの実現、特に制御回路のソフトウェアの実現は、例えば”C++”を用いて実行することができる。所望のプロセッサあるいはDSP(ディジタルシグナルプロセッサ)や、FPGAモジュールにより実現することができる。FPGA(”Field Programmable Gate Array”)は、一般にチップ上に多くのプログラム可能なセルを有した、集積されたプログラム可能な回路である。
本発明の他の好ましい発展形態では、線形のウェーブディジタルフィルタの形態をとる線形のフィルタバンクが設けられる。
さらに、複数のハイパスフィルタが設けられ、各フィルタ段は少なくとも一つの対応するハイパスフィルタを備え、それぞれのハイパスフィルタは対応する共振器回路の出力端子に結合されている。これらのハイパスフィルタは、内耳のセンサセルのヘアバンドル(hair bundles)の、基底膜の振動への液体結合(liquid coupling)をシミュレートする。
フィルタ段ごとに、対応する共振器回路の出力端子に結合された少なくとも一つのハイパスフィルタを使用することによって、ハイパスフィルタが無い場合の、フィルタバンクの比較的平坦になる高周波側のフィルタ側方部が先鋭化される。少なくとも幾つかのハイパスフィルタ、好ましくは全てのハイパスフィルタは、1次のハイパスフィルタの形態であることが好ましい。本発明の一つの発展形態によれば、少なくとも幾つかの1次のハイパスフィルタの遮断周波数は、哺乳類の内耳の基底膜振動の最大感度の周波数に一致していいる。
本発明の他の発展形態では、複数の整流回路が設けられる。各整流回路はそれぞれ、一つのフィルタ段および一つのハイパスフィルタに対応しており、対応するハイパスフィルタの一つの出力端子に結合されている。また、好ましくは複数のローパスフィルタも設けられている。各ローパスフィルタはそれぞれ、一つの整流回路に対応しており、対応する整流回路の一つの出力端子に結合されている。これらの発展形態により、人間の聴覚システムにおける受容体電位Uを非常によい近似で形成することができる。
さらに、複数の活性化回路が設けられてもよい。各活性化回路はそれぞれ、一つのフィルタ段に対応している。また、各活性化回路は、活性化回路に供給される信号の変化率を増幅し、また、活性化回路に供給される、成分が基本的に時間で一定の信号を減衰させるように構成されている。
さらに、各活性化回路は、多くの小胞回路を有する小胞プールを有しているのが好ましい。
本発明に係る信号処理装置は、本発明の回路構造を備えており、次に詳細に説明する。信号処理装置の発展形態は回路構造にも適用され、また逆に、回路構造の発展形態は信号処理装置にも適用される。
信号処理装置において、他処理ユニットは、例えば音声認識デバイスあるいは補聴器である。
他処理ユニットを補聴器の形態で実現することは、特に、聴覚障害を持った人の音量知覚が阻害されることを補償するためにダイナミック圧縮が行われる応用を意図したものである。聴覚障害を持った人においては、外有毛細胞に欠陥があることがあり、その場合には、低音レベルにおいて感度低下が大きい。これにより、聴覚閾値(非常に小音)と不快閾値(非常に大音)との間の使用可能な音声レベルの範囲が狭まる(補充(recruitment))。この現象を補償するために、本発明に係る信号処理装置の回路構造は、ダイナミック圧縮を実行するために使用され、音環境の広い音レベル範囲を、患者に知覚される範囲に圧縮する。
上記信号処理装置は、また、特にパルスニューラルネットワークアーキテクチャにおいて、音声認識システムの入力部を構成している。
上記信号処理装置は、アナログフィルタバンクあるいはディジタルフィルタバンクとして構成することができる。
次の事柄は、明らかに本発明の範囲内になければならない。
a)回路構造に供給される入力信号は、非線形ダイナミック圧縮された状態で周波数分析される。
b)閾値および飽和を伴って形成される周波数チャネルの「柔らかな」半波整流により、情報の減少がもたらされた。
c)音声関連の変調周波数は、哺乳類、特に人間の聴覚システムにおいて神経適応(neural adaptation)のシミュレーションによって強調される。
本発明の模範的な実施形態について、以下に詳述し、図に示す。
図1は、本発明の好ましい模範的な一実施形態に関する回路構造を示している。
図2は、本発明の模範的な一実施形態に関する共振器回路を示している。
図3は、図2に示した共振器回路を、ウェーブディジタルフィルタとして実現した図である。
図4および図5は、図1に示した回路構造の機能性を示す図である。
図6aは、本発明の模範的な他の実施形態に関する回路構造素子を示している。
図6bは、図6aに示した共振器回路を、ウェーブディジタルフィルタとして実現した図である。
図7aは、本発明の模範的な他の実施形態に関する回路構造素子を示している。
図7bは、図7a示した共振器回路を、ウェーブディジタルフィルタとして実現した図である。
図8は、本発明の模範的な一実施形態に関する音声認識システムを示すブロック図である。
図9は、本発明の模範的な一実施形態に関する、線形フィルタバンクと、該フィルタバンクの個々のフィルタ段に割り当てられた複数の共振器回路とを示す回路図である。
図10は、1kHz音の非線形基底膜モデルのための励起パターンを示す図である。
図11は、本発明の模範的な一実施形態に関する回路構造を構成するために各共振器回路に直接接続された回路素子を示す回路図である。
図12は、モデル化された神経活動電位を示す図である。
図13は、従来技術の音声認識システムとは異なる、本発明の模範的な一実施形態の音声認識システムの音声認識率を示す図である。
図8は、本発明の模範的な一実施形態に関する音声認識システム800を示している。
この音声認識システムでは、特徴抽出システム801が用いられる。該特徴抽出システム801は、供給されたアナログ音声信号から、実際の自動音声認識プロセス(図8の音声認識ブロック802)に用いられる特徴を抽出する。
該特徴抽出システム801は、特に、初期フィルタリングを行うための素子、フィルタバンク、および、非線形特徴を抽出するための素子を備えている。
明らかに、該特徴抽出システム801は、人間の聴覚システムの、信号処理ストラテジおよび信号処理構造をシミュレートする。この特徴抽出システム801は、人間の聴覚システムの信号処理システムと類似するように、複数の物理ユニットでスケーリングされている。
該特徴抽出システム801には、入力信号803が、アナログで、(パスカルで測定された)音圧信号として供給される。
特徴抽出システム801の第1素子804は、聴覚伝導路のモデルを構成している。しかし、このモデルを設けるか否かは任意であり、本発明の好ましい実施形態では用いられない。
聴覚伝導路804のモデルによって入力信号803から形成される信号805は、中耳モデル素子806に供給される。
図9に示したように、中耳モデル素子806は、互いに並列に接続された、理想的なばね素子901と、理想的な減衰素子902とを有している。(理想的なばねとしては、コイル、つまりインダクタンスの形態で実現されており、減衰素子としては抵抗の形態で実現されている。)中耳モデル素子906は、入力信号のスペクトルの音声関連領域が強調される(つまり、増幅される)ように設計されている。人間の聴覚システムから類推して、中耳モデル素子806によって形成された信号807は、内耳モデル素子808に供給される。
内耳モデル素子808によって形成される信号809を、抽出された音声認識特徴として音声認識に直接用いてもよいし、センサセルモデル素子810(これについては以下に詳述する)に供給してもよい。センサセルモデル素子810によって形成された信号811を、同様に、自動音声認識用の特徴成分として直接用いてもよいし、あるいは、さらに処理してもよく、この更なる処理の過程において、シナプスモデル素子812に供給してもよい。該シナプスモデル素子812は、人間の聴覚システムのシナプスメカニズムをシミュレートするものである。シナプスモデル素子812によって形成された信号813は、同様に、本発明では、自動音声認識のための特徴として用いられる。
これに関して、本発明の他の形態に基づいて、上記の特徴信号809、811、813のうちの1つ、2つ、または、3つを、音声認識のために任意に用いてもよいことに留意されたい。
人間の聴覚システム内では、鼓膜(該鼓膜の表面領域は、Aed=55×10−6である)に達する音圧は、中耳の骨格の機械的なゆがみに変換される(mで示されている)。
上記したように、中耳モデル素子806は、好ましくはローパスフィルタ遮断周波数が1kHzである、ローパスフィルタ(模範的な本実施形態では、1次ローパスフィルタ)を備えている。
インダクタンス901によってシミュレートされたばね定数は、約1500N/mであり、抵抗902として表された減衰素子は、0.25Ns/mになるように設計されている。
図9に詳しく示しているように、中耳モデル素子806によって生成された信号807は、内耳モデル素子808に供給される。内耳モデル素子808は、フィルタバンク903として(模範的な本実施形態では、線形波ディジタルフィルタモデルとして)形成されている。
フィルタバンク903は、多数のフィルタ段904、905、906、および、終端抵抗907を備えている。
各フィルタ段904、905、906は、インダクタンス904a、905a、906aと、抵抗904b、905b、906bと、キャパシタンス904c、905c、906cとを直列に接続することにより、形成されている。
人間の内耳における基底膜の振動速度は、フィルタ段904、905、906の電流に対応している。したがって、基底膜のゆがみを、速度を積分することによって計算できる。しかし、この積分プロセスの間に生じる数値の問題を回避するには、以下のような他の方法によってゆがみを計算したほうがよい。
コンデンサ904c、905c、906cによって示したようなばねの場合、ある瞬間のゆがみxを、ばね力とばね定数との積として計算できる。このゆがみxは、入力、つまり、ダイナミック圧縮段101(本発明の模範的な本実施形態では、直列接続された2つの共振器回路101)の入力信号を構成している。これについて、以下に詳述する。
共振器回路101は、明らかに、2次共振器を用いて圧縮段を構成している。これについて、以下に詳述する。
好ましい他の一実施形態では、4つの共振器回路101が、フィルタ段904、905、906に直列に接続されている。
同様に以下に詳述するように、共振器回路101のQ値を、(個人の内耳の位置に応じて)フィルタ段904、905、906のそれぞれからの出力信号の関数として、1から最大Q値Qmaxまでの範囲において変調する。
共振器回路101の設計について、図1を参照しながら以下に詳述する。
回路構造100は、複数の共振器回路101を含んでいる。各共振器回路101は、コンデンサと、インダクタンス(図1に示さず)と、入力信号が供給される入力部と、出力信号が生成される出力部とを有している。共振器回路101のうちの3つは、それぞれ、行列の形状をしたこの回路構造の各行に沿って直列に接続されている。したがって、上流の共振器回路101の各出力部は、その下流に接続された共振器回路101の各入力部に連結されている。1行における共振器回路101のインダクタンスおよびコンデンサの値は、各行が該行の共振器回路101の共振周波数の周辺範囲において同様の周波数間隔の信号を伝送できるように、選択される。共振器回路101は、行ごとにそれぞれ異なるL値、C値を有している。これにより、全体として、共振器回路101の個々の行または分枝部は、人間の聴力(約20Hz〜20kHz)の感度範囲に相当する密に並んだ周波数の間隔をカバーしている。
共振器の制御回路111が、共振器回路101全体に連結されて通信リンクを構成している。つまり、制御回路111は、共振器回路全体に連結されている。共振器回路101のQ値のための開ループ制御または閉ループ制御を行うために、個々の共振器回路101のQ値を制御回路111によって調整することができる。制御回路111は、各行において最後の共振器回路101の出力信号の振幅に応じて共振器回路101のQ値を調整するように、設計されている。例えば、共振器回路R11、R12、R13のQ値を、共振器回路R13の出力部の信号の振幅に基づいて、共振器制御回路111によって調整する。
図1はまた、グローバル入力信号102である音響信号を発する音源103を示している。この信号は、共振器回路101の第1の列において、共振器回路101(R11、R21、…、Rk1、…、Rn1)の入力部に供給される。
共振器回路の第1の行と第1の列とに配置された共振器回路101R11について、以下で細かく検討する。音源103からのグローバル入力信号102は、この共振器回路101の入力部に供給される。共振器回路101R11を、グローバル入力信号102の周波数成分が通過する。この周波数成分は、該共振器回路101に割り当てられた値LおよびCに依存しており、共振器回路R11の1つの出力部において、第1のローカル出力信号104として出力される。さらに、グローバル入力信号102の振幅は、共振器回路101R11の機能性に基づいて、該共振器回路101の(現在の)Q値Qに応じて変化する。共振器回路101R11のこのQ値Qを、共振器回路101R11の抵抗(図1に示さず)によって制御する。制御回路111は、この制御可能な抵抗に適切な制御信号を供給する。これにより、インピーダンスは、所定の値に設定される。こうして、共振器回路101のQ値を調整でき、続く処理サイクルにおいてこのQ値に応じて、入力信号を強く減衰したり、弱く減衰したりする。グローバル入力信号102を動的に圧縮するように回路構造100が設計されているので、明らかに、大きな振幅の信号範囲を、小さな振幅の信号範囲よりも強く減衰する。
第1のローカル出力信号104は、第1のローカル入力信号105として、共振器回路101R11の下流に接続された共振器回路101R12に供給される。第1のローカル入力信号105は、共振器回路101R12を通過する。第2のローカル出力信号106は、1つの出力部から出力される。第2のローカル出力信号106は、共振器回路101R12の下流に接続された共振器回路101R13の第2のローカル入力信号107として用いられる。第3のローカル出力信号108が、その出力部108から出力される。グローバル出力信号109を形成するために、この第3のローカル出力信号108を、行状に配置されたそれぞれ最後の共振器回路101(R13、R23、・・・、Rk3、…、Rn3)の(個々の周波数間隔に対応した)出力信号に集める(加える)。
共振器回路(Rk1、Rk2、Rk3)の各行における各共振器回路101では、行における共振器回路101全体のQ値は、(k番目の行の共振器回路Rk3において)それぞれ最後の共振器回路の出力部の出力信号の振幅に基づいて、共振器制御回路111によって制御される。
集められたグローバル出力信号109は、したがって、グローバル入力信号102に対して動的に圧縮される。
図1の共振器回路101について、図2を参照しながら以下に説明する。
入力信号200を、図2の電圧源Uとして示す。さらに、出力信号204を、電圧Uとして示す。入力信号200は、抵抗203の第1の端子とコンデンサ201の第1の端子との間で生成される。出力信号204は、コンデンサ201の第1の端子とコンデンサ201の第2の端子との間で生成される。さらに、制御可能な抵抗203の第2の端子は、インダクタンス202の第1の端子に結合されており、インダクタンス202の第2の端子は、コンデンサ201の第2の端子に結合されている。
抵抗R203の値を、制御回路111によって調整できる。したがって、図2の共振器回路101は、明らかに、減衰を制御できるフィルタである。
本発明の回路構造100では、3つの(または、通常はN個の)共振器回路101が、各行においてフィルタ素子としてフィードバックすることなく直列接続されている。上流のフィルタの時間に依存した出力信号U(t)(tは時間)は、上記上流のフィルタの下流に接続されたフィルタの入力信号U200を規定する。
抵抗R203を、出力電圧U(t)に対して非線形に変えることができる(閉ループ制御)。また、該抵抗R203を、各上流のフィルタのU(t)に応じて変えることができる(開ループ制御)。あるいは、該抵抗R203を、同時に、一行に並んだ全てのフィルタにおいて、最後のフィルタ段のU(t)に応じて変えることができる。
以下では、上記の模範的な実施形態において、各抵抗R203の値Rを調整するための基礎として用いられる演算規則について、説明する。
このために、初めに、設定されるQ値Qを計算する。
上記の模範的な実施形態では、ボルツマン関数
Figure 2007529787
にしたがってフィルタのQ値Qを減衰させる。
方程式(1)では、Q(t)は、Q値Qと時間tとに関係している。Qは、共振器回路101のあらかじめ決定可能な最大Q値である(例えば、Q=10)。Qminは、共振器回路のあらかじめ決定可能な最小Q値である(例えば、Qmin=1)。SATは、あらかじめ決定可能な飽和閾値、つまり、Q値の時間依存性を明瞭に調整できる(例えば、SAT=1)パラメータである。
ボルツマン関数(1)は、内耳における外有毛感知細胞の感度曲線を概算する。必要であれば、この関数を、2次ボルツマン関数に置き換えてもよい。該2次ボルツマン関数では、他のパラメータを用いることによってより正確な整合が可能である。方程式(1)では、単一の1次ボルツマン関数が用いられる。なぜなら、該ボルツマン関数が単一のフリーパラメータ(特に、SAT)を有しており、したがって、数値の処理があまり複雑ではないからである。
設定される非線形抵抗の値を、
Figure 2007529787
を用いて、フィルタのQ値Qから計算できる。
したがって、抵抗R(t)の時間に依存した値は、インダクタンスLの値と、コンデンサCの値と、時間に依存したQ値Q(t)とに依存している。
方程式(1)、(2)は、明らかに、制御回路111によって抵抗203の値Rを調整するための制御規則になっている。
図2に示した共振器回路101によって構成されるフィルタは、振幅U(t)が非常に小さい場合は線形である(U(t)→0のとき、Q→Q)。同様に、振幅U(t)が非常に大きい場合も、ほぼ線形である(U(t)→∞のとき、Q→Qmin)。ダイナミック圧縮Kは、飽和閾値(SAT)の範囲において行われ、K=Q/Qminである。N=4のフィルタ段(図1では、3つのフィルタ段のみが、3つの共振器回路によって1つの行に設けられているが)が直接接続されており、それらの値がQ=10およびQmin=1である場合、これにより、80dB(K=(Q/Qmin)という大きな圧縮を実現できる。
全ての人間の聴力範囲を含むために、ほぼ20Hz〜ほぼ20kHzの範囲の共振周波数を有するフィルタバンクが設けられている。このことは、通常、50〜100行からなる共振器回路101(つまり、n=50〜n=100)を用いることによって達成できる。上記の模範的な実施形態では、インダクタンスの値を、L=1Hに設定する。次に、共振器回路101の各行に関して、該行がカバーするフィルタ周波数fに基づいて、そのLC素子の共振器周波数から、各値Cを計算する。
C=(4πL)−1 (3)
各フィルタ周波数fに対して(つまり、共振器回路101の各行に対して)非線形のQ値を独立に計算する点に、留意すべきである。図1を参照すると、このことは、発振回路101の各行に、Q値Q(t)の値が計算されるフィルタ周波数fが割り当てられていることを意味している。
図2に示した共振器段101の一形態としてのウェーブディジタルフィルタ300について、図3を参照しながら以下に記載する。
ウェーブディジタルフィルタとは、特に有効な特性を有するディジタルフィルタの一分類のことである。ウェーブディジタルフィルタは、従来の情報技術の素子からモデル化された従来のフィルタであり、近年のディジタル集積回路によって動作する。明らかに、ウェーブディジタルフィルタの技術に基づいて、アナログモデルをディジタル的に(例えば、コンピュータを用いて)実現できる。
さらに明らかに、図3のウェーブディジタルフィルタ300の素子は、以下に記載するように、図2の共振器回路101の素子に対応しており、その変数が規定されている。
ウェーブディジタルフィルタ300の第1ブロック301は、インピーダンスR11、R13を備えた無反射直列結合器を含んでいる。R11は、明らかに、基準インピーダンスに対して制御可能な抵抗R203である。R21は、基本周波数に対する、コイルL202の修正されたインピーダンス(インピーダンス)である。第2ブロック302は、並列結合器を含んでいる。この結合器は、コンデンサ201を並列接続したものである。また、第2ブロックに、アドミタンスG21、G22、G23を示す。G21は、第2ブロック(G12=1/R13)302の入力アドミタンスである。G23は、第2ブロック302の出力アドミタンスである。アドミタンスG22は、コンデンサC201のインピーダンスをモデル化するために用いられる。第3ブロック303は、コンデンサ201の、記憶装置またはフィルタレジスタであり、第4ブロック304は、コイル202の、記憶装置またはフィルタレジスタである。
図3に示した変数を、以下において規定する。各フィルタ周波数に対するウェーブディジタルフィルタのパラメータは、
R11=R/R_B (4)
R12=2π (F_B L/(R_B tan[(π F_B/f_s)] (5)
R13=R11+R12 (6)
G21=R13−1 (7)
G22=2π(F_B C R_B/tan(π F_B/f_s) (8)
G23=G21+G22 (9)
である。
この場合、Rは、抵抗203であり、R_Bは、あらかじめ決定可能な基準インピーダンスである。F_Bは、あらかじめ決定可能な基準周波数である。値R_BおよびF_Bは、スケーリングに用いられる。上記の模範的な実施形態に基づいて、倍精度浮動変数を用いて実施されるので、整数演算を用いた場合には、この正規化は適切ではない。Lは、コイル202のインダクタンスである。値f_sは、サンプリングされた時間信号のサンプリング周波数である。変数R11、R12、R13は、抵抗である。これに対して、変数G21、G22、G23はアドミタンス(つまり、逆方向抵抗)である。
フィルタ係数g1、g2は、
g1=R11/R13 (10)
g2=G21/G23 (11)である。
フィルタレジスタZ1(第4ブロック304)およびZ2(第3ブロック303)の初めの値は、ゼロに初期化される。
また、個々のポートでの信号を、連続して計算できる。信号の「前進波」に関して、つまり、明らかに、図3の右向きの矢印の係数に関して、
b13=−(U+Z1) (12)
b20=−g2(Z2−b13) (13)
B23=b20+Z2 (14)である。
方程式(12)の変数Uは、入力信号200である。
「後進波」に関して、つまり明らかに、図3の左向きの矢印に関して、係数は、
b22=b20+b23 (15)
b21=b22+Z2−b13 (16)
a0=b21−b13 (17)
b11=U−g1 a0 (18)
b12=−(b11+b21)(19)である。
次に、出力信号U204を計算する。
=(b22+Z2[sec])/2 (20)
フィルタレジスタ(ブロック303、304)を以下のようにして更新する。
Z1=−b12 (21)
Z2=b22 (22)
出力信号U204を、入力信号U200として、考察してきたフィルタ段101の下流に接続されたフィルタ段101に供給する。直列接続されたフィルタ101の設定されるQ値を、ここでも、方程式(1)を用いて、フィルタ段101の1つの行における最後のフィルタ段101の出力信号U204に基づいて、確定する。このようにして確定されたQ値Qの値から、方程式(2)にしたがって、減衰を支配するインピーダンスRの値を計算する。フィルタインピーダンス(R11、R12、R13、G21、G22、G23)およびフィルタ係数(g1、g2)を、ここでも方程式(4)〜(11)にしたがって、抵抗R203の修正された値を用いて、計算する。このステップの後、次のタイムスライス用に出力信号を計算する。つまり、時間スペクトルを、数値的に連続して計算される複数のタイムスライスに分けることができる。
図4を参照しながら、ダイアグラム400について以下に説明する。図4では、本発明の回路構造の機能性について、本発明の好ましい模範的な一実施形態に基づいて示す。ダイアグラム400は、N=4の回路構造に直接接続された共振器回路に関するものである。最大Q値を、Q=10と仮定し、最小Q値をQmin=1と仮定する。
基準周波数fに対して正規化された信号の周波数が、ダイアグラム400の横座標401に沿って対数目盛で目盛られている。特定の強度の入力信号に対するシステムの反応について、縦座標402に沿って対数目盛で示す。第1曲線403〜第8曲線410は、本発明の回路構造の、(基準振幅としての)互いに異なる信号振幅に対する周波数応答(つまり、この場合は、フィルタ出力の最大振幅の各値)である。第1曲線403は、振幅1×10−9に相当し、第2曲線404は、振幅1×10−4に相当し、第3曲線405は、振幅1×10−3に相当し、第4曲線406は、振幅1×10−2に相当し、第5曲線407は、振幅1×10−1に相当し、第6曲線408は、振幅1×10に相当し、第7曲線409は、振幅1×10に相当し、第8曲線410は、振幅1×10に相当する。さらに、入力信号を、cos窓を用いて窓をつけられた正弦波振動であると仮定する。N=4の直列接続された、フィードバックを行わない共振器回路を含んだフィルタバンク全体に関して、曲線403〜410が得られる。
初めに、ダイアグラム400は、信号強度または信号振幅が大きければ大きいほど、入力信号の減衰が増すことを示している。振幅が非常に小さければ、フィルタは線形になり、共振ピークはほぼ80dBになる。フィルタバンクの応答は、周波数が高くなるにつれて急激に低減している。なぜなら、フィルタは、ローパスフィルタとして実現されているからである(参照:図2)。フィルタパラメータがfによってスケーリングされていることにより、フィルタの高周波数応答は、オクターブごとにほぼ6dB低下する。図4の曲線は、近似をよくするために、人間の聴覚の非対称性の高い周波数選択性をシミュレートしている。
本発明の回路構造における入力信号の振幅と出力信号の振幅との関係について、図5を参照しながら以下に記載する。
音圧レベルAinが、基準変数20μPaの音圧に対して、ダイアグラム500の横座標に沿って、対数目盛でdBで目盛られている。出力信号AOUTの強度が、縦座標502に沿って、任意のユニットにおいてdBで目盛られている。曲線503〜507は、共振周波数fで、4つの共振器回路(直列接続されたN=4のフィルタ)を含むフィルタカスケードの成長関数を(異なる想定例ごとに)示している。最小Q値を、Qmin=1と仮定する。
第1曲線501は、線形の成長関数を示している。第2曲線504は、内耳の成長関数(つまり、鼓膜の前で測定された音圧に対する基底膜の速度)を示している。第2曲線504のデータについては、[2]から得た。第3曲線505が、Q値Q=2の湾曲した形状を示し、第4曲線506が、Q=4の形状を示し、第5曲線507がQ=10の形状を示している。
図からわかるように、図5は、パラメータとしてのフィルタ変数Qを有する、f=fのフィルタ出力の成長関数を示している。成長関数は、非常に小さな振幅および非常に大きな振幅において、ほぼ線形である。(特に、Qが高い場合の)40を越えている広い圧縮範囲が目立つ。入力信号(100dB)の広いダイナミックレンジは、(Q=10に対して)40dBに圧縮される。静信号は、共振ピークで決まる特定の周波数で「増幅」される。成長関数は、現在の聴覚システムにおいて測定された振動応答を非常によくシミュレートしている(参照:曲線504)。したがって、本発明の回路構造は、内耳における非線形の前処理のおおよその技術モデルを示している。
本発明の他の好ましい模範的な実施形態の回路構造600について、図6aを参照しながら以下に説明する。
回路構造600は、第1の共振器回路601および第2の共振器回路602から構成されている。該共振器回路のそれぞれは、図2に示した共振器回路101と同様に設計されている。共振器回路602は、第1の共振器回路601の下流に接続されている。
図からわかるように、回路構造600を、直列接続される2つの(N=2)共振器回路601、602を直接結合したものと見なせる。
図6aに示したように、上流の共振器回路601のコイル202の第2の端子は、下流の第2の共振器回路602の抵抗203の第1の端子に結合されている。
図6aに示したように互いに直接結合された共振器回路の模範的な実施形態では、上流の共振器回路601の出力電圧UC1は、続く共振器回路602の入力電圧に等しい。さらに、第1の共振器回路601の出力電流は、第2の共振器回路602の入力電流に等しい。
共振器回路の、インピーダンスR1およびR2の値と、インダクタンスL1、L2の値と、コンデンサC1、C2の値とは、互いに異なっていてもよく、および/または、異なるように設定/制御されていてもよいということに、留意すべきである。
図6aに示した共振器回路をウェーブディジタルフィルタ650として実現することについて、図6bを参照しながら以下に説明する。
図からわかるように、ウェーブディジタルフィルタ650は、第1の共振器回路601である第1素子651と、第2の共振器回路602である第2素子652とから構成されている。これら2つの素子651、652は、図6bに示したように、互いに直接結合されている。この図は、図6aに示した共振器回路601、602が結合されている構成と同じである。各素子の内部設計は、基本的に、図3に示したウェーブディジタルフィルタ300の内部設計と同じである。
本発明のさらに他の模範的な実施形態の回路構造700について、図7aを参照しながら以下に説明する。
回路構造700は、直列接続された、第1の共振器回路701と、第2の共振器回路702とから構成されている。図からわかるように、共振器回路は、互いに切り離されている(つまり、中間素子が共振器回路701と共振器回路702とを接続している)ように構成されて、直列に接続されている。
共振器回路のそれぞれは、基本的に、図2に示した共振器回路101と同様に設計されている。さらに、演算増幅器703が、第1の共振器回路701と第2の共振器回路702との間に接続されている。演算増幅器703の非反転入力部703aが、上流の第1の共振器回路701におけるコイル202の第2の端子に結合されている。さらに、演算増幅器703の反転入力部703bが、該演算増幅器703の出力部からフィードバックされ、第2の共振器回路702において、抵抗203の第1の端子に結合されている。この第2の共振器回路702は、第1の共振器回路701の下流に接続されている。
この構成に基づいて、上流の共振器回路701UC1204の出力電圧は、第1の共振器回路701の下流に接続された第2の共振器回路702の入力電圧に等しい。各共振器回路の出力電流は、0である。上流の第1の共振器回路701の下流に接続された第2の共振器回路702への入力電流は、下流の第2の共振器回路702のインピーダンスによって抑制されている。図7aに示したように、これらのことを、上流の共振器回路701の出力電圧を下流の共振器回路702の入力部に印加するインピーダンス変換器によって、アナログ技術を用いて実施できる。
回路構造700を実現するウェーブディジタルフィルタ750について、図7bを参照しながら以下に説明する。
ウェーブディジタルフィルタ750は、第1素子751と第2素子752とに分けられている。第1素子751は、第1の共振器回路701を表しており、第2素子752は、第2の共振器回路702を表している。図からわかるように、これら2つの素子は、演算増幅器703の機能を利用することによって互いに結合されている。これら各素子の内部設計は、基本的に、図3に示した構成と同じである。第1素子751への入力信号は、Uであり、第2素子752への入力信号は、UC1である。
図5との関連で説明したように、線形フィルタバンク808と非線形圧縮段101との組み合わせは、本発明では、哺乳類の内耳の非線形振動応答を非常によくシミュレートする。
特に、音声レベルに関して、0dBSPL〜120dBSPLの範囲において、1nm〜100nm(これはほぼ40dBに相当する)において、高度のダイナミック圧縮が得られる(参照:図10)。このことは、特徴抽出および音声認識の過程で実行される他の処理において、重要である。
図10のダイアグラム1000は、横座標1001に沿って蝸牛の位置を示し、縦座標1002に沿って各蝸牛の位置において生じる基底膜のゆがみを示している。図からわかるように、ダイアグラム1000は、したがって、1kHz音の非線形基底膜モデルの励起パターン(RMS値)を示している。図示した曲線1003、1004、1005、1006、1007、1008、1009は、(図10に点線で示した)最も高い感度を有する点1010において、通常は、蝸牛のゼロ位置に対して21mmの位置において、非常に高く圧縮されている。さらに、図10は、励起閾値1011を示している。この励起閾値1011を越えると、人間の聴覚システムが信号のゆがみを感知する。
図11に示したように、各直列回路の端部において各共振器回路101によって形成された基底膜信号xBM1は、各フィルタ出力回路1100に供給される。
各フィルタ出力回路1100は、ハイパスフィルタ1101と、出力側において該ハイパスフィルタの下流に結合された整流回路1102と、その下流において信号が流れる方向に結合されたローパスフィルタ1103と、その下流において信号が流れる方向に結合された活性化回路1104と、小胞プール回路1105と、神経伝達物質回路1106とを備えている。
各基底膜信号xBM1、xBMi、…、xBMNは、コンデンサ1107と抵抗1108とを備えたハイパスフィルタ1101によってハイパスフィルタリングを施されてスケーリングされる。これにより、それぞれの、音声に関連したダイナミックレンジのみが、2次ボルツマン関数によって抽出される。内耳のフィルタ曲線の相対的により平坦な側方部は、図10に示したように、1次ハイパスフィルタ1101によっていくぶん鋭くなっている。
本発明の模範的な本実施形態では、ハイパスフィルタ1101の遮断周波数は、基底膜振動の最大感度の周波数に相当する。
本発明で用いられるボルツマン関数が非対称であることにより、信号を整流することができる。(この信号は、模範的な本実施形態にしたがって整流回路1102によって生成され、次の段においてローパスフィルタ1103によってローパスフィルタリングを施される。)これにより、受容体電位信号Uが、ローパスフィルタ1103の出力部から出力される。
本発明の模範的な本実施形態では、ローパスフィルタ1103の抵抗1109は、細胞膜とのアナロジーにより、アドミタンスg=60nSを有しており、ローパスフィルタ1103のコンデンサ1110は、細胞膜をシミュレートするキャパシタンスC=12pFを有している。
本発明では、小胞プール回路1105および神経伝達物質回路1106によってシミュレートされる各細胞の活性化は、ボルツマン関数によって受容体電位Uから計算される。
上記したように、ローパスフィルタにかけ、整流することにより、以下の効果が得られる。
a)低い信号周波数において、音響刺激のサイクルごとに、センサセルの1つのそして唯一の最大励起がある。
b)内有毛細胞の遮断周波数より高い周波数帯域の音響信号によって、該音響信号の包絡線に基づいた活性化がもたらされる。
c)ボルツマン関数の感度および飽和の結果、音の処理が音声関連情報に集中して行われる。
換言すると、音声信号(つまり、入力信号)の時間的変化が強調されるように設計された小胞プール回路1005および神経伝達物質回路1106によって、受容体電位信号Uの更なる処理が行われ、同じ状態を保っているほぼ時間的に一定の入力信号の信号成分は、無視される(適合される)。
これにより、定常信号(例えば、干渉雑音)を効果的に抑制できる。
本発明の模範的な本実施形態では、この適合は、小胞プール回路1105によってモデル化されている。シミュレートされた小胞プールが、その規定値に絶え間なく(しかしゆっくりと)満たされる。小胞プール回路1105から、ある瞬間の小胞プールサイズ、および、ボルツマン関数を用いて内有毛細胞の膜電位から生じる確率を基準として、神経伝達物質電流(本発明の模範的な本実施形態では、28000/sの割合で)が生成される。
音声信号の振幅が大きい場合、大部分の小胞プールは、分散され、その結果、続く信号成分が小さな信号(つまり、振幅が小さい信号)のみを生成する。
振幅の小さい、供給された入力信号を有する位相では、小胞プールが再び生成される。つまり、小胞プール回路1105が上記の機能性をシミュレートするということである。該小胞プール回路1105は、2つの時定数(つまり、第1の時定数τ=140msおよび第2の時定数τ=3ms)が実現されるように設計されている。
神経伝達物質電流は、「シナプスの間隔」へと流れる。ここで、該神経伝達物質電流は、時定数τ=1msで、本発明では神経伝達物質によってシミュレートされた神経伝達物質回路1106によって、分散される。
小胞プールからの小胞機能に加えて、内有毛細胞の膜電位にのみ依存した他の神経伝達物質電流が生成される。これは、選択されたモデルは、無限の小胞プールサイズおよび9000/sの割合に基づいているためである。
これら2つの神経伝達物質電流により、定常音声信号および過渡音声信号を適切に符号化できる(つまり、神経活動電位を適切に符号化できる)。
小胞プール1105は、連続的にモデル化されるだけではなく、ディスクリートの小胞をも含んでいる。ディスクリートにモデル化する場合、神経伝達物質電流は、確率過程として生じる。この手順は、スイッチング信号を個々の神経活動電位に符号化するために選択される。
神経活動電位を、図12に示した神経活動電位のダイアグラム1200に示す。この神経活動電位は、シナプスの間隔における各神経伝達物質の濃度が所定の閾値(模範的な本実施形態では1.0vesicles)を越える場合に引き起こされる。
図12は、合成音声「e」によって刺激する場合に生成された、モデル化された神経活動電位を示している。
該合成音声「e」の2つのフォルマント周波数では、励起が生じる。さらに、基本的な音声周波数(100Hzが10msに相当する)によって変調される時間構造において(特に、第2の形式では)、このことが得られる。
本発明の特徴抽出ユニット801の1つの極めて有効な特性は、該特徴抽出ユニット801を、自動音声認識システムにおける音声認識方法の過程における達成可能な認識性能に基づいて、評価および最適化できる点にある。
図13のダイアグラム1300は、(横座標に沿って作図された)干渉雑音が異なる場合の、本発明の様々な処理段(内耳モデル素子のみ)(ワード誤り率曲線1302、および、センサセルワード誤り率曲線1303)を有する高速フーリエ変換(ワード誤り率曲線1301)に基づいた従来の音声認識方法の音声認識性能を示している。
それぞれ得られたワード誤り率を、図13の縦座標1305に沿って示す。
図13に示したように、干渉雑音が存在せずに、高速フーリエ変換に基づいた従来の方法の認識性能の質は高い。このことは特に、数年以上かけて発展してきたアルゴリズムの完成度によるものであるが、しかし、干渉雑音が生じた場合の、本発明によって提示された特徴のロバスト性は明白である。
以下の出版物を本明細書において例証している。
[1]E.G. Schukat-Talamazzini, Automatische Spracherkennung(自動音声認識),Friedrich Vieweg & Sohn Verlagsgesellschaft, Braunschweig-Wiesbaden、ISBN 3-528-05492-1、第1章〜第3章,1995年
[2] S. Senneff, A Computational Model for the Perforal Auditory System: Application to Speech Recognition Research,Proceedings of IEEE ICASSP 1986,東京, 1983〜1986ページ、東京、1986年
[3] M. Hunke, T. Holton,Training Machine Classifiers to Match the performance of Human Listeners in a Natural Vowel Classification Task, ICSSLP,574〜577ページ、1996年
[4] S. Sandhu, O. Ghitza,A Comparative Study of MEL Cepstra and EIH for Phone Classification under Adverse Conditions,IEEE, 409〜412ページ、1995年
[5] C. Sumner他, A Revised Model of the Inner-Hair-Cell and Auditory Nerve Complex, Journal of Acoustic Society of America、111巻、2178〜2188ページ、2002年5月
[6] T. Dau, Modell der effektiven Signalverarbeitung im Gehor、Einblicke(聴力における効果的な信号処理のモデルに関する考察), 29号、16〜18ページ、1999年4月
[7] V. Hohmann, Signalverarbeitung in digitalen Horgeraten、Einblicke (ディジタル補聴器における信号処理に関する考察), 33号、24〜26ページ、2001年6月
[8] H. W. Strube, A Computationally Efficient Basilar-Membrane-Model, Acoustica, 58巻、207〜214ページ、1985年
[9] M. A. Ruggero他, Mechanical Basis of Frequency Tuning and Neural Excitation at the Base of the Cochlea: Comparison of Basilar-Membrane-Vibration and Auditory-Fiber-Responses in Chinchilla, Proceedings of National Academy of Science USA, 97巻、22号、11744〜11750ページ、2000年10月
[10] P. Dallos他, The Cochlea、ISBN 0387944494, Springer Verlag、第6章、318〜385ページ、1998年
[11] DE 691 31 095 T2
本発明の好ましい模範的な一実施形態に関する回路構造を示している。 本発明の模範的な一実施形態に関する共振器回路を示している。 図2に示した共振器回路を、ウェーブディジタルフィルタとして実現した図である。 図1に示した回路構造の機能性を示す図である。 図1に示した回路構造の機能性を示す図である。 本発明の模範的な他の実施形態に関する回路構造素子を示している。 図6aに示した共振器回路を、ウェーブディジタルフィルタとして実現した図である。 本発明の模範的な他の実施形態に関する回路構造素子を示している。 図7aに示した共振器回路を、ウェーブディジタルフィルタとして実現した図である。 本発明の模範的な一実施形態に関する音声認識システムを示すブロック図である。 本発明の模範的な一実施形態に関する、線形フィルタバンクと、該フィルタバンクの個々のフィルタ段に割り当てられた複数の共振器回路とを示す回路図である。 1kHz音の非線形基底膜モデルのための励起パターンを示す図である。 本発明の模範的な一実施形態に関する回路構造を構成するために各共振器回路に直接接続された回路素子を示す回路図である。 モデル化された神経活動電位を示す図である。 従来技術の音声認識システムとは異なる、本発明の模範的な一実施形態の音声認識システムの音声認識率を示す図である。
符号の説明
100 回路構造
101 共振器回路
102 グローバル入力信号
103(音声)信号源
104 第1のローカル出力信号
105 第1のローカル入力信号
106 第2のローカル入力信号
107 第2のローカル入力信号
108 第3のローカル出力信号
109 グローバル出力信号
111 制御回路
200 入力信号
201 コンデンサ
202 インダクタンス
203 制御可能な抵抗
204 出力信号
300 ウェーブディジタルフィルタ
301 第1ブロック(直列結合器)
302 第2ブロック(並列結合器)
303 第3ブロック(コンデンサの記憶素子)
304 第4ブロック(インダクタンスの記憶素子)
400 図
401 横座標
402 縦座標
403 第1曲線
404 第2曲線
405 第3曲線
406 第4曲線
407 第5曲線
408 第6曲線
409 第7曲線
410 第8曲線
500 図
501 横座標
502 縦座標
503 第1曲線
504 第2曲線
505 第3曲線
506 第4曲線
507 第5曲線
600 回路構造
601 第1の共振器回路
602 第2の共振器回路
650 ウェーブディジタルフィルタ
651 第1素子
652 第2素子
700 回路構造
701 第1の共振器回路
702 第2の共振器回路
703 演算増幅器
703a 非反転入力部
703b 反転入力部
703c 出力部
750 ウェーブディジタルフィルタ
751 第1素子
752 第2素子
800 音声認識システム
801 特徴抽出システム
802 音声認識デバイス
803 入力信号
804 聴力聴覚伝導路モデル素子
805 信号
806 中耳モデル素子
807 信号
808 内耳モデル素子
809 信号
810 センサセルモデル素子
811 信号
812 シナプスモデル素子
813 信号
901 インダクタンス
902 抵抗
903 フィルタバンク
904a フィルタ段インダクタンス
904b フィルタ段抵抗
904c フィルタ段コンデンサ
905 フィルタ段
905a フィルタ段インダクタンス
905b フィルタ段抵抗
905c フィルタ段コンデンサ
906a フィルタ段インダクタンス
906b フィルタ段抵抗
906c フィルタ段コンデンサ
907 終端インピーダンス
BM 基底膜信号
1000 図
1001 横座標
1002 縦座標
1003 励起曲線
1004 励起曲線
1005 励起曲線
1006 励起曲線
1007 励起曲線
1008 励起曲線
1009 励起曲線
1010 最も高い感度の点
1011 励起閾値
1100 フィルタ出力処理回路
1101 ハイパスフィルタ
1102 整流回路
1103 ローパスフィルタ
1104 活性化回路
1105 小胞回路
1106 神経伝達物質回路
1107 ハイパスフィルタコンデンサ
1108 ハイパスフィルタ抵抗
1109 ローパスフィルタ抵抗
1110 ローパスフィルタコンデンサ
1200 図
1300 図
1301 ワード誤り率曲線
1302 ワード誤り率曲線
1303 ワード誤り率曲線
1304 横座標
1305 縦座標

Claims (19)

  1. 回路構造であって、
    複数のフィルタ段、および、入力信号が供給されるフィルタバンク入力部を備えたフィルタバンクと、
    上記入力信号のそれぞれから一つの出力信号エレメントを生成するための複数の共振器回路であって、各上記共振器回路が、それぞれ複数の上記フィルタ段の一つのフィルタ段に対応して設けられているとともに、対応するフィルタ段の一つの出力部に結合されている、共振器回路と、
    を備えており、
    各上記共振器回路は、一つのキャパシタンス、一つのインダクタンス、および、一つの共振器出力部であって対応する上記出力信号エレメントが生成可能な共振器出力部を備えており、
    少なくとも一つの共振器回路のQ値の開ループ制御または閉ループ制御を行うための少なくとも一つの共振器制御回路を備えており、上記少なくとも一つの共振器制御回路は、上記共振器回路のQ値のための開ループ制御あるいは閉ループ制御を、上記入力信号の信号振幅および上記共振器回路からの上記出力信号エレメントの信号振幅のいずれか一方または両方の時間プロファイルの関数として供給するように、構成されている、回路構造。
  2. 各上記共振器回路は、互いに直列に結合された複数の共振器回路素子を有しており、
    上記共振器回路素子の少なくとも一つは、上記共振器回路の一つの出力部に結合されている、請求項1に記載の回路構造。
  3. 上記フィルタバンクは線形ウェーブディジタルフィルタの形態で設けられている、請求項1または2に記載の回路構造。
  4. 上記共振器回路の少なくとも一つは、上記共振器制御回路によって制御可能な抵抗を有している、請求項1ないし3のいずれか1項に記載の回路構造。
  5. 複数のハイパスフィルタを備えており、各上記フィルタ段はそれぞれに対応する少なくとも一つの上記ハイパスフィルタを有しているとともに、上記ハイパスフィルタのそれぞれは対応する上記共振器回路の出力部に結合されている、請求項1ないし4のいずれか1項に記載の回路構造。
  6. 上記ハイパスフィルタの少なくとも一つは1次のハイパスフィルタで構成されている、請求項5に記載の回路構造。
  7. 少なくとも一つの上記1次のハイパスフィルタの遮断周波数は、哺乳類の内耳の基底膜振動の最大感度の周波数に一致している、請求項6に記載の回路構造。
  8. 複数の整流回路を備えており、各整流回路はそれぞれ、一つの上記フィルタ段および一つの上記ハイパスフィルタに対応しているとともに、対応する上記ハイパスフィルタの一つの出力部に結合されている、請求項5ないし7のいずれか1項に記載の回路構造。
  9. 複数のローパスフィルタを備えており、各ローパスフィルタはそれぞれ、一つの上記整流回路に対応しているとともに、対応する上記整流回路の一つの出力部に結合されている、請求項8に記載の回路構造。
  10. 複数の活性化回路を備えており、各上記活性化回路はそれぞれ一つの上記フィルタ段に対応しており、各上記活性化回路は、上記活性化回路に供給される信号の変化率を増幅するように、および、上記活性化回路に供給される時間的にほぼ一定の信号の成分を減衰するように、構成されている、請求項9に記載の回路構造。
  11. 各上記活性化回路は、複数の小胞回路を有する小胞プールを備えている、請求項10に記載の回路構造。
  12. 上記共振器制御回路は、ボルツマン関数およびボルツマン関数の導関数の一方または両方に基づいて、少なくとも一つの上記共振器回路のQ値を制御するように構成されており、上記ボルツマン関数は、対応する上記出力信号エレメントの振幅をパラメータとして含んでいる、請求項1ないし11のいずれか1項に記載の回路構造。
  13. 上記共振器制御回路は、少なくとも一つの上記共振器回路のQ値を、人間の耳に対して定義されている感度特性に基づいて、対応する上記出力信号エレメントの振幅の関数として調整する、請求項1ないし12のいずれか1項に記載の回路構造。
  14. 上記共振器制御回路は、少なくとも一つの上記共振器回路に対して、対応する出力信号エレメントの振幅が大きくなるほど、該共振器回路のQ値を小さくするように構成されている、請求項1ないし13のいずれか1項に記載の回路構造。
  15. 上記共振器制御回路は、少なくとも一つの上記共振器回路のQ値を、対応する上記出力信号エレメントの振幅の非線形関数として調整するように構成されている、請求項14に記載の回路構造。
  16. 上記共振器制御回路は、少なくとも一つの上記共振器回路のQ値を、対応する上記出力信号エレメントの振幅が予め定められた幅内にあるように調整する、請求項1ないし15のいずれか1項に記載の回路構造。
  17. 音声信号を、上記フィルタバンクへの上記入力信号として処理する、請求項1ないし16のいずれか1項に記載の回路構造。
  18. 請求項1ないし17のいずれか1項に記載の回路構造と、
    上記回路構造によって生成された信号をさらに処理するための他処理ユニットとを備えている、信号処理装置。
  19. 上記他処理ユニットは、音声認識デバイスまたは補聴器である、請求項18に記載の信号処理装置。
JP2007504243A 2004-03-22 2005-02-01 回路構造および信号処理装置 Abandoned JP2007529787A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE200410013952 DE102004013952A1 (de) 2004-03-22 2004-03-22 Schaltkreis-Anordnung und Signalverarbeitungs-Vorrichtung
PCT/DE2005/000156 WO2005093950A1 (de) 2004-03-22 2005-02-01 Schaltkreis-anordnung und signalverarbeitungs-vorrichtung

Publications (1)

Publication Number Publication Date
JP2007529787A true JP2007529787A (ja) 2007-10-25

Family

ID=34961114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007504243A Abandoned JP2007529787A (ja) 2004-03-22 2005-02-01 回路構造および信号処理装置

Country Status (4)

Country Link
EP (1) EP1728322A1 (ja)
JP (1) JP2007529787A (ja)
DE (1) DE102004013952A1 (ja)
WO (1) WO2005093950A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020521402A (ja) * 2017-05-24 2020-07-16 アンロテック リミテッド 共振器を制御する装置及び方法
US11341973B2 (en) 2016-12-29 2022-05-24 Samsung Electronics Co., Ltd. Method and apparatus for recognizing speaker by using a resonator

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005030326B4 (de) * 2005-06-29 2016-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zur Analyse eines Audiosignals
DE102006007779B4 (de) * 2006-02-20 2008-07-10 Infineon Technologies Ag Filterbank-Anordnung und Signalverarbeitungs-Vorrichtung
DE102006046703A1 (de) 2006-10-02 2008-04-17 Siemens Audiologische Technik Gmbh Hörvorrichtung mit gesteuerten Eingangskanälen und entsprechendes Verfahren
KR102364853B1 (ko) * 2017-07-18 2022-02-18 삼성전자주식회사 음향 센싱 소자의 신호 처리 방법과 음향 센싱 시스템

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3808540A (en) * 1967-10-16 1974-04-30 Gates Radio Co Loudness control
US4536844A (en) * 1983-04-26 1985-08-20 Fairchild Camera And Instrument Corporation Method and apparatus for simulating aural response information
CA2056110C (en) * 1991-03-27 1997-02-04 Arnold I. Klayman Public address intelligibility system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11341973B2 (en) 2016-12-29 2022-05-24 Samsung Electronics Co., Ltd. Method and apparatus for recognizing speaker by using a resonator
US11887606B2 (en) 2016-12-29 2024-01-30 Samsung Electronics Co., Ltd. Method and apparatus for recognizing speaker by using a resonator
JP2020521402A (ja) * 2017-05-24 2020-07-16 アンロテック リミテッド 共振器を制御する装置及び方法
JP7265486B2 (ja) 2017-05-24 2023-04-26 アンロテック リミテッド 共振器を制御する装置及び方法

Also Published As

Publication number Publication date
EP1728322A1 (de) 2006-12-06
WO2005093950A1 (de) 2005-10-06
DE102004013952A1 (de) 2005-10-20

Similar Documents

Publication Publication Date Title
Liu et al. Asynchronous Binaural Spatial Audition Sensor With 2$\,\times\, $64$\,\times\, $4 Channel Output
Biesmans et al. Auditory-inspired speech envelope extraction methods for improved EEG-based auditory attention detection in a cocktail party scenario
CN110473567A (zh) 基于深度神经网络的音频处理方法、装置及存储介质
US11564048B2 (en) Signal processing in a hearing device
CN101755468B (zh) 包括初始化模块的用户可调节的助听器
US10154353B2 (en) Monaural speech intelligibility predictor unit, a hearing aid and a binaural hearing system
CN109121057A (zh) 一种智能助听的方法及其系统
CN105931649A (zh) 基于频谱分析的超低时延音频处理方法与系统
Vecchi et al. A comparative study of eight human auditory models of monaural processing
JP2007529787A (ja) 回路構造および信号処理装置
US20190215622A1 (en) Active suppression of occlusion effect in hearing aid
US6701291B2 (en) Automatic speech recognition with psychoacoustically-based feature extraction, using easily-tunable single-shape filters along logarithmic-frequency axis
Vicen-Bueno et al. Modified LMS-based feedback-reduction subsystems in digital hearing aids based on WOLA filter bank
US11445307B2 (en) Personal communication device as a hearing aid with real-time interactive user interface
Gandhiraj et al. Auditory-based wavelet packet filterbank for speech recognition using neural network
US7808335B2 (en) Circuit arrangement and signal processing device
CN111491245B (zh) 基于循环神经网络的数字助听器声场识别算法及实现方法
Fabry et al. Perceptual filter optimization for active acoustic equalization
US6791433B1 (en) Signal processing by means of resonators
Mugliette et al. FPGA active digital cochlea model
Qu Exploration of a New Active Noise Cancellation Headset Based on Spectral Contrast Enhancement Technique
Marracci et al. On the use of the Dual Resonance Non Linear filter for speech processing in a Hearing Aid Algorithm
Levitt Future directions in hearing aid research
Sokolova Applications of Open Source Software for Hearing Aid Amplification and Hearing Loss Simulation
GOH et al. DIGITAL HEARING AID SIGNAL PROCESSING SYSTEM USING ANDROID PHONE

Legal Events

Date Code Title Description
A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20080424