JP4767316B2 - 音声信号を分析する装置、方法、およびコンピュータ・プログラム - Google Patents

音声信号を分析する装置、方法、およびコンピュータ・プログラム Download PDF

Info

Publication number
JP4767316B2
JP4767316B2 JP2008519813A JP2008519813A JP4767316B2 JP 4767316 B2 JP4767316 B2 JP 4767316B2 JP 2008519813 A JP2008519813 A JP 2008519813A JP 2008519813 A JP2008519813 A JP 2008519813A JP 4767316 B2 JP4767316 B2 JP 4767316B2
Authority
JP
Japan
Prior art keywords
trajectory
audio signal
neural activity
activity pattern
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008519813A
Other languages
English (en)
Other versions
JP2008545170A (ja
Inventor
フランク クレフェンツ
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2008545170A publication Critical patent/JP2008545170A/ja
Application granted granted Critical
Publication of JP4767316B2 publication Critical patent/JP4767316B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/41Detecting, measuring or recording for evaluating the immune or lymphatic systems
    • A61B5/414Evaluating particular organs or parts of the immune or lymphatic systems
    • A61B5/415Evaluating particular organs or parts of the immune or lymphatic systems the glands, e.g. tonsils, adenoids or thymus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/12Audiometering
    • A61B5/121Audiometering evaluating hearing capacity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61NELECTROTHERAPY; MAGNETOTHERAPY; RADIATION THERAPY; ULTRASOUND THERAPY
    • A61N1/00Electrotherapy; Circuits therefor
    • A61N1/18Applying electric currents by contact electrodes
    • A61N1/32Applying electric currents by contact electrodes alternating or intermittent currents
    • A61N1/36Applying electric currents by contact electrodes alternating or intermittent currents for stimulation
    • A61N1/3605Implantable neurostimulators for stimulating central or peripheral nerve system
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61NELECTROTHERAPY; MAGNETOTHERAPY; RADIATION THERAPY; ULTRASOUND THERAPY
    • A61N1/00Electrotherapy; Circuits therefor
    • A61N1/18Applying electric currents by contact electrodes
    • A61N1/32Applying electric currents by contact electrodes alternating or intermittent currents
    • A61N1/36Applying electric currents by contact electrodes alternating or intermittent currents for stimulation
    • A61N1/36036Applying electric currents by contact electrodes alternating or intermittent currents for stimulation of the outer, middle or inner ear
    • A61N1/36038Cochlear stimulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Pathology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Molecular Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Surgery (AREA)
  • Biophysics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Vascular Medicine (AREA)
  • Computational Linguistics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Neurosurgery (AREA)
  • Neurology (AREA)
  • Endocrinology (AREA)
  • Radiology & Medical Imaging (AREA)
  • Otolaryngology (AREA)
  • Immunology (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Description

本発明は、一般的に音声信号の分析表示をするために音声信号を分析する装置、方法、およびコンピュータ・プログラムに関し、特に並行ハフ変換を用いて蝸牛における進行波を検波する装置、方法、およびコンピュータ・プログラムに関する。
人間の音声器官の分析およびモデリングは、長い間、音声信号の認識・分類および医療技術の主要分野を形成してきた。それに関して、特に人間の耳の構成については長い間研究されてきている。本発明の理解を促すために、聴覚の原理について基本的な成果を下記に何点か示す。
生理学:聴覚末梢および中枢聴覚
人間の聴覚末梢の生理学的環境は、一方ではこれまで十分に研究されてきており、複数の科学文書で調べることができる。したがって、ここでは後述の説明をさらに理解するために主要な基本的事実のみを示す。
人間の音声処理末梢器官(図20参照)は、外耳、中耳、内耳で構成されている。耳道を通して、音は鼓膜に到達し、耳小骨を経由し中耳内に伝えられる。内耳において次の段階では機械的振動から神経系の神経活動電位への周波数依存性変換が行われ、これが連結した聴覚神経線維に伝えられる。
外耳
外耳は到来音波を鼓膜に伝える漏斗状器官を形成する。耳介、耳管、および頭蓋骨と肩の形状が音声信号を変更する。
耳管(耳介を含む)は一方端で開放し、他方端で閉鎖しているので、身体的にはほぼ半開の管と考えられる。したがって、共鳴の場合、つまり、音の4分の1波長が有効な耳管の長さと一致する場合、音圧レベルのゲインが認められる。
最大約2,500Hzの共鳴において、増幅は最大で20dBである。第2共鳴(「耳甲介腔共鳴」)は耳介のみによって2000Hzから2500Hzの間で起きる。
音の到来する方向により、いわゆる「方向を決定する周波数帯」による外耳の形状のために、各狭周波数範囲はそれぞれ増幅されるか、または低減される。これにより、ある程度までは、両耳の時間および強度差が無くても特に垂直面(正中矢状面)で、到来する音の定位も可能である。
前記現象は、図21に図示されているように、外耳の伝達関数(あるいは「頭部伝達関数」HRTF)により要約できる。
中耳
中耳(MO)の主な役割は、内耳内にある空気および液体の音響特性インピーダンスを適合させることにある。もし、音響伝達の場合のように、この機能が欠けている場合、到来する音響エネルギーの最大98%の聴覚障害が引き起こされる。健全な中耳の場合、信号強度の約60%を内耳に伝えることができる。これに必要な音圧の増幅は、鼓膜、3点の小骨(槌骨、砧骨、鐙骨)、および内耳への接触位置である前庭窓が結合して揃うことにより、可能となる。(図22参照)
異なる3つのメカニズムが、このインピーダンス変換を担当する。
1. 鼓膜ATと鐙骨敷板ASの面積比:
Figure 0004767316
2. 槌骨1Hと砧骨1Aのレバーアーム比率
Figure 0004767316
3. 鼓膜の曲率と槌骨の非対称吊り下げによるレバーアーム
Figure 0004767316
全体の増幅は以下のように計算される。
Figure 0004767316
ここで、pT:鼓膜における音圧である。
中耳の伝達関数の重要性は注目すべきであり、広域の通過帯域を有する帯域通過フィルタのような働きをする。低周波数域では、これは鼓膜と前庭窓の機械特性によって限定される。高周波領域では、慣性モーメントと摩擦、そして小骨の曲げ損失が伝送を限定する。中耳伝達関数の経過を聴覚閾値の経過と比較した場合(図23参照)、聴覚感度曲線は、主に中耳と外耳の機械特性によって決定されるということがわかる。
更なる役割は中耳の筋肉によって実行される(鼓膜張筋および鐙骨筋、図20参照)。反射収縮により、中耳剛性を増加することができ、したがって、低周波の減衰を達成できる。その結果は、高水準に関する限定保護と自ら発生する音の知覚減少である。
内耳
内耳は二部構成である。前庭器官は平衡システムの構成要素を代表する一方、蝸牛の構成は聴覚末梢の最終部分を形成する(図22参照)。解剖学的には、蝸牛は2回半巻いているカタツムリの殻と同じであり、蝸牛仕切構造により、外リンパ液を含む「前庭階」(SV)と「鼓室階」(ST)の2室に分けられる(図22参照)。
渦巻管の動作もまた、2つのセクションで説明される。流体力学部は、巻きの内部のマクロおよび、マイクロ機械特性で決定される。入力信号を神経表現に変換するための実際の機能ユニットは、蝸牛仕切構造内に位置する。前庭階は、前庭窓(OW)を介して、中耳に接続している。前庭階は、鐙骨の動きと共に振動するため、非圧縮性リンパ液を強制的に回避させる。そして、回避運動は、蝸牛仕切構造に伝えられ、進行波を蝸牛孔(HC)、蝸牛スパイクの方向に形成する。その拡張部に沿って継続的に変化する機械特性(マス・カバー、剛性、幅など)のため、仕切構造は、特定の場所で周波数依存共鳴を形成する。この局所音の周波数選択性は、立地理論とも呼ばれる。
最大波振幅の位置は、仕切上の固有振動数と関係していてもよく、前庭窓(基底膜の基端)における高周波から蝸牛孔(それぞれ、基底膜の端または頂点)における低周波まで連続的に到達する。この分散特性を経て、入って来る音声信号の周波数内容は、ある程度まで分割することができる。
この機能は、蝸牛分割壁(図24参照)の特性で支持されている。これは、ライスナー膜(RM)によって、前庭階に向いて閉じている。鼓室階に対する接触面は、長手方向の上部に3列の外有毛細胞および1列の内有毛細胞が位置する搭載コルチ器官(CO)を含む基底膜(BM)から成る。これらの有毛細胞は、再び被蓋膜(TM)によって覆われている。
中間の領域に、中央階の内リンパ液が位置している。蝸牛仕切構造が移動する場合、被蓋膜およびコルチ器官は有毛細胞上に位置する感覚毛の偏位につながる相対的な運動を始める。しかし、これは直接接触によっても部分的に起こり、流体力学的結合によっても部分的に起きる。外有毛細胞は、現在、仕切構造振動に応じて非常に急速に、短くなるか、または長くなる能力を有する。これは、進行波振幅のうちの最高1000までの増幅につながり、急激で明瞭な振動最大を提供する。
外有毛細胞の感覚毛のように、内有毛細胞の感覚毛も、被蓋膜およびコルチ器官の相対的な動きによって偏位する。測定された蝸牛の三次元運動は、複雑であり、例えばZennerおよびGummertによりウルム大学で究明された。この動向の結果、生化学プロセスが始まり、機械的運動の神経系活動電位(図25参照)への変換の動機となった。
静止状態において、内有毛細胞は、約−40mVの静止膜電位および低いカリウム濃度を有する。しかし、中央階の周囲の液体は、極めて高い割合のカリウム・イオンを含み、プラスに帯電している。一方向への感覚毛の偏位があると、いわゆる変換イオンチャネルが開く。そして、それによって、有毛細胞への正帯電カリウム・イオンの流入が等電位化のため起こる。反対方向への感覚毛の偏位はそれらのチャンネルを閉じ、そして、基底横方向の細胞膜へのイオン化合物によって、本来の電位を回復することができる。チャンネルが開いている場合、交換センサ電位によって求心性伝達物質の放出がさらに生じる。
同じことは、聴神経の方向に、シナプス間隙を通じて広まる。シナプス間隙の伝達物質濃度に応じて、神経活動電位(NAP)を起こす確率は高くなる。
ちょうど約5000Hzの周波数まで、伝達物質の放出は、感覚毛の偏位後に、同時に起こる。したがって、線形周波数伝達は時間符号化を経て発生することができ、「位相固定」という用語で文献にまとめられている。
更に、図26も参照する。同図では再び聴覚末梢系の構造が示されている。ここで図26は、鼓膜および中耳から蝸牛までを経たノイズの、転換または伝達を示している。ここで蝸牛は、入って来るノイズのスペクトル分析および神経インパルスへの振動の転換を可能にする。蝸牛は神経インパルス(活動電位)を生成している神経細胞を更に備え、神経インパルスは脳に聴神経を経て伝えられる。
図27は、人間の耳における信号伝達の仕組みを図式的な形式で再び示している。蝸牛3210が異なる場所で異なる周波数を認識することが、図27からわかる(立地論)。例えば、高周波(例えば20kHzの周波数)は、蝸牛の入り口で神経信号に変換され、一方、低周波(例えば20Hzの周波数)は蝸牛の出口で神経信号に変換される。これによって、蝸牛で、ノイズまたは音声信号の両方のスペクトル分析を生じさせることができ、所定周波数に対して、それぞれの周波数の認知に最も適するようにそれらの神経細胞は最も刺激される。
図28は、聴覚器官の機構を示しており、基底膜の形状について参照している。ここで図解図3310は、基底膜3320の幅が蝸牛の基端から蝸牛の終端(頂点)に向かって10倍に増加することを示す。
更に、図解図3320は、前庭窓3330を介した蝸牛への音響波の結合を示す。前庭窓3330を介した結合は、蝸牛の基端3340から蝸牛の頂点3350まで進行する進行波を蝸牛内に発生させ、蝸牛の基底膜3360を偏位させる。蝸牛の基端3340により近く位置する神経細胞が、蝸牛の基端3340からより遠くに位置する神経細胞より早く刺激されていることに、ここで注意されたい。言い換えると、時間を関数とした進行波の位置は、進行波のトラジェクトリと考えてよい。もちろんトラジェクトリを別々の神経細胞に図示することもでき、そのため、トラジェクトリはまたいくつかの空間的に分離された神経細胞がどの時間系列において進行波に刺激されるかについて説明している。
図29は、典型的な電気交替モデルを示し、このモデルにより、内有毛細胞の刺激までの蝸牛を通じた音波の伝達をモデル化することができる。図示されたモデルは、「拡張ツウィッカーモデル」として公知である。そのモデルは、例えば内耳の流体力学および外有毛細胞の非線形フィードバックについて説明している。しかし、図示されたモデルは内有毛細胞の刺激を評価する多くの考えられるモデルのうちの1つにすぎないことを注記しておく。
図30は、概略的な図でコルチ器官を説明し、図31は2種類の異なる有毛細胞の機能を説明している。
図32は、2つの有毛細胞の詳細な概略図を示す。図32の概略図は、全体として3700により表わされる。図解図3700を参照して、ここでは、理解しやすくするために、内有毛細胞内での化学プロセスについて簡潔に概説する。
有毛細胞3710は、微細毛の形状を有する複数の不動毛3720を備えている。不動毛の刺激または偏位はそれぞれ、細胞膜へ透過率または伝導率を変化させ、その結果、正帯電したカリウム・イオン3730は有毛細胞に入ることができる。このことにより、有毛細胞の細胞内電位は変化し、しばしばV(t)によって表わされる。細胞内有毛細胞電位V(t)に応じて、カルシウムイオン3740の濃度が増加するように、正帯電したカルシウムイオン3740は細胞に入ることができる。それから、カルシウムイオンが作用して、有毛細胞3710と神経線維3770との間のシナプス間隙3760へ神経伝達物質分子3750が放出される。神経伝達物質分子3750の放出は、一般的に、数千もの分子の小胞において量子化されて行われる。
次に、シナプス間隙3760内の神経伝達物質の濃度は、シナプス間隙3760の電位を変える。シナプス間隙3760の電位が特定の閾値を越える場合、最終的に、神経線維3770の活動電位が発生する。
最後に明確な説明をするために、図33は、人間の蝸牛の感覚点における複数の有毛細胞の配置を示す。図33の図から、1つの独立した有毛細胞が一般的に複数の不動毛(毛髪)から成り、複数の神経線維に連結しているということがわかる。
人間の聴覚の処理に関して、音声信号を処理、あるいは確認するために、方法が既に幾つか存在する。例えば、Thorsten HeizおよびAndreas Brueckmannは、オランダ、アムステルダムでの114回オーディオ技術学会で2003年3月に発表された「自動メロディ転写および音源認識のための生理学的耳モデルを用いて」において、認知指向の従来の信号処理アルゴリズムの音声信号分析および変更という記事に記載した。
上述の論文は、内有毛細胞の隙間にある伝達物質の濃度に関する情報への機械的な振動の転換を含む内耳の機能のシミュレーションを記載している。基底膜は、ここでは同一の幅の251領域に分けられ、各部分は内有毛細胞に接続しており、内有毛細胞は、基底膜の対応する部分の振動に刺激されている。音程認識のために、251の記載されている有毛細胞の隙間において、伝達物質の濃度が分析される。
この目的で、音程トラジェクトリは、形成され、分割される。更に、前述の論文は、音質および旋律認識の再認識を簡潔に記載している。
更に、Toshio IrinoおよびRoy D.Pattersonが論文「時間領域聴覚器官モデルを用いた声道の大きさおよび形状に関する情報の分離:安定化ウェーブレット−メラン変換」(Elsevier Journal,2002年 音声通信36、181−203ページ)において、2次元メリン変換の聴覚像への応用について記載している。上記の論文によると、メリン変換は、聴覚イメージがその音声信号に基づく話者の声道の規模に関して不変である聴覚イメージから、メリンイメージを生成する。
上述の論文は、サイズ―形状―イメージから空間フーリエ変換によって得られるいわゆるメリンイメージを用いた音声認識を提案する。しかし、サイズ―形状―イメージは、T.IrinoおよびR.D.Pattersonによれば、複数の転換方法によって安定化聴覚イメージから得られる。
更に、A.Bruckmann、F.KlefenzおよびA.Wuenscheが論文「2次元―傾斜および正弦波形状検出のための神経網」(CIST International Scientific Journal of Computing,ISSN 1727―6209)において、パターン認識のための神経網について記載している。前記神経網は、異なる傾斜の直線または異なる周波数の一組の正弦波曲線を学習することができて、学習フェーズの後、対応するパターンを認識することができる。対応する神経網は、このようにハフ変換を実現して、二次元のパターンの認識を可能にする。
「自動メロディ転写および音源認識のための生理学的耳モデルを用いて」:Thorsten Heiz,Andreas Brueckmann、オランダ、アムステルダム、114回オーディオ技術学会、2003年3月 「時間領域聴覚器官モデルを用いた声道の大きさおよび形状に関する情報の分離:安定化ウェーブレット−メラン変換」:Toshio Irino,Roy D.Patterson(Elsevier Journal,2002年 音声通信36、181−203ページ) 「2次元―傾斜および正弦波形状検出のための神経網」:A.Bruckmann、F.Klefenz,A.Wuensche(CIST International Scientific Journal of Computing,ISSN 1727―6209)
本発明の目的は、音声信号の分析表示の効果的な生成のための概念を提供することであり、分析表示は少ないデータ量からなり、その上同時に音声認識に適している。
本発明の目的は、請求項1に記載の装置、請求項30に記載の方法、および請求項31に記載のコンピュータ・プログラムによって達成される。
この発明は、音声信号の分析表示を得るために、音声信号を分析するための装置であって、音声信号に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出する手段と、連続したトラジェクトリの時間的な位置を示す分析表示として一連の時間情報を得るために神経活動パターンを処理する手段とを含み、トラジェクトリは、音声信号における同一の事象に基づく異なる神経線維上の活動インパルスを含む、装置である。
神経活動パターンの続いて起きるトラジェクトリの時間的位置を示す時間情報は音声信号の分析に適しているというのが、本発明の中心的な考え方である。トラジェクトリは、音声信号内の事象の発生を正確に示し、人間の耳の基底膜上の音波の伝播を正確に示している。事後のトラジェクトリの時間的位置は、異なる音(母音または子音)またはノイズによって変化する。したがって、時間情報は、音声信号の音声信号成分の分析または音声認識に特に適している。
神経活動パターンにおけるトラジェクトリの測定は特に効率的な方法で行われ、それに対応して、事後のトラジェクトリの時間的位置を示す時間情報は処理費用を低減させることができることがわかる。
最後に、本発明は、神経活動パターンがトラジェクトリの抽出によく適した(時間的に)明確な活動インパルス(活動電位)を含むため、神経活動パターンはトラジェクトリの抽出に特に適しているという知見に基づくものである。
本発明は、音声信号の分析に対する従来のコンセプトに関して、最小限の利点がある。神経活動パターンを用いることにより、高精度を得ることができる。これとは別に、音声信号の分析は、人間の聴覚と相対的な方法で行うことができる。聴覚神経の神経線維における活動電位の発生による人間の聴覚システムに発生する現象は神経活動パターンにあると考えることができ、神経活動パターンは、音声信号によって人間の脳が受けることができる情報の一部を有している。
トラジェクトリはいくつかのパラメータで示され、トラジェクトリは多数の活動インパルスを神経線維に結合するため、トラジェクトリの抽出は特に有利である。これらのパラメータの中で、時間的位置が最も重要なパラメータである。特に、直後のトラジェクトリの評価において、トラジェクトリの時間的位置についての関連のある情報が得られ、音声信号に特徴のあるものである。トラジェクトリの時間的位置を示す時間情報により、音の時間の始点および音中の神経活動パターンの構成の両方が、少ないパラメータで示すことができる。
直後のトラジェクトリの時間定位置を示す時間情報の形での本発明の分析表示は、音声信号に含まれる母音の分析に特に信頼できるものであることが示された。さらに、トラジェクトリは、パターン認識の方法により、計算的に効果的な方法で抽出することができ、ハフ変換によって曲線状のトラジェクトリを容易に認識できるため、ハフ変換の適用などが特に有利であることが示された。
また、神経活動パターンは、聴覚モデルの一群の神経線維の活性または活性インパルスを示すことに注意されたい。時間情報は、好ましくは、トラジェクトリの発生の時点を特徴付けるものである。音声信号内の同じ事象によって測定される活性インパルスが、所定の最小値より大きい数の神経線維に与えられるとき、この発明の装置のトラジェクトリが認識されることに注意されたい。言い換えれば、神経線維の所定の数以上発生したとき、「十分に長い」トラジェクトリのみが認識される。これにより、拡張トラジェクトリを形成しないスプリアスパルスが誤ってトラジェクトリであるとみなすことを効果的に避けることができる。
音響事象は、たとえば、母音、子音、音の開始である。それとは別に、たとえば従来の蝸牛電気図に見られるように、それぞれのトラジェクトリは音響事象と関係があることに注意されたい。
さらに、神経活動パターンにおけるトラジェクトリは、典型的には、聴覚モデルの基底膜上に進行波を示すことに注意されたい。言い換えれば、トラジェクトリは、聴覚モデルの基底膜上の進行波と関係のある隣接する一群の神経細胞上の神経活動パターンを示す。言い換えれば、トラジェクトリは、一群の隣接する神経線維上の活性インパルスの発生を示し、隣接する神経線維上の活性インパルスは、時間的にわずかにずれる進行波によって刺激される。個々の神経線維は(たとえば、妨害により)刺激されず、トラジェクトリは、その全長の25%より長くない妨害を含むことは明らかである。トラジェクトリを測定する本発明の方法は妨害許容値を有し、たとえば短い妨害を含む望ましくないトラジェクトリが認識され特徴付けられることがわかった。
時間情報は、好ましくはトラジェクトリの時間の始点を含み、デフォルトのトラジェクトリの時間の始点は、デフォルトのトラジェクトリに属する第1の活性インパルスが神経線維から発生する時点である。しかしながら、時間情報は、トラジェクトリの中間時点や終時点などのように、トラジェクトリについての他の情報を持っていてもよい。
神経活動パターンを処理する方法は、時間とともに神経活動パターンを示す二次元表示において、トラジェクトリとして直線状または曲線状のパターンを認識し、トラジェクトリの時間的位置を認識し、音声信号の分析表示としてトラジェクトリに属する時間情報を提供するために実施されるパターン認識手段を含む。神経活動パターンの二次元表示の分析がトラジェクトリの特に効果的な認識を可能にすることがわかった。さらに、二次元分析方法は、直線状または曲線状の構成を効果的な方法で認識し、特徴付けることが可能である。トラジェクトリ、すなわち直線状または曲線状の構造は、正確に認識され、トラジェクトリの空間的な拡充により、(神経活動パターンで示される)複数の神経線維にわたる平均化が認識において行われる。
さらに、パターン認識手段は、トラジェクトリの形状に関する情報を提供するために実施されることが好ましい。トラジェクトリの形状は、音声信号の分析表示の処理をさらに促進させ、または音声信号の分析表示の処理をさらに表現することを可能にする情報を提供する。トラジェクトリの形状に関する情報は、好ましくは、トラジェクトリの湾曲に関する情報を含む。
神経活動パターンにおけるトラジェクトリは、典型的には双曲線状に湾曲していることが見出されたため、パターン認識手段は、直線状または双曲線状に湾曲したトラジェクトリの認識を最適化することが好ましい。
パターン認識手段がトラジェクトリの長さに関する情報を提供するように実施されるとき、さらに有利である。また、トラジェクトリの長さが、正確さを増やすために、分析表示の処理において用いられる。それとは別に、(たとえば、トラジェクトリと関連して活性電位が与えられる複数の神経線維によって表現される)頻度の範囲にわたってトラジェクトリが拡充する事実についてのステイトメントを含むパターン認識手段から情報が与えられる場合に有利である。したがって、トラジェクトリの存在だけでなく、たとえば刺激の頻度の範囲も測定される。
神経活動パターンを処理する手段は、トラジェクトリを認識し、トラジェクトリの時間的位置を示す時間情報を得るために、神経活動パターンを示す二次元表示と、少なくとも1つの比較パターンとを時間とともに比較するように実施されるパターン比較手段を含むことが好ましい。パターン比較は、たとえばトラジェクトリのように、二次元表示のパターンを認識する効果的な可能性がある。比較パターンとして、ここでは、好ましくは、直線または双曲線などが用いられる。
直線状または曲線状のトラジェクトリは、二次元の神経活動パターンの変形された表示を得るために、少しずつ神経活動パターンの二次元表示を変形させ、神経活動パターンの変形された二次元表示にほぼ直線状のラインが含まれるときを認識するように実施される神経細胞パターンを処理する手段により、特に有利な方法で実現されることがわかった。直線状のラインはトラジェクトリとして認識され、トラジェクトリの時間的位置は測定され、付随する時間情報は認識されたトラジェクトリに関係がある。直線状のラインの存在は容易に確認できるため、このような神経活動パターンを処理する手段は特に有利である。トラジェクトリの「直線状のライン」は、神経活動パターンを処理する手段の1つの処理段階において、複数の活性インパルスが同時に到着し、または少なくとも時間的に重なるという事実によって明確にされる。活性インパルスの同時または時間的に重なった到着は、1つの段階に到着した信号の和によって認識され、1つの段階における活性インパルスの同時の到着は、和の結果の明確なピークを引き起こす。
少しずつ行われる神経活動パターンの二次元表示の変形は、たとえば複数の湾曲手段によって行われ、神経活動パターンを示す信号または神経信号は、神経活動パターンを処理する手段の段階において、強い方法ではなく、変形される。
言い換えれば、神経活動パターンの二次元表示の変形は、徐々に変形されることによって、徐々に直線状にされ、曲線状のトラジェクトリを直線状にするのに必要な複数の変形ステップは、曲線状のトラジェクトリの湾曲に関する情報を含む。
神経活動パターンを処理する手段は、並行する複数の信号の形で時間とともに神経活動パターンを受け、信号を異なる速さで(または、互いに異なる遅延時間で)並行して信号を直列に接続された複数の段階に送るように実施される曲線認識手段を含み、所定の数の信号が選択された段階において同時に活性化されるときに、選択された段階は認識されるように実施される。
異なる速さで神経活動パターンを形成するいくつかの信号の通過は、元の神経活動パターンに存在するトラジェクトリの変形を可能にする。1つの段階において複数の信号が活性化されると、トラジェクトリが直線化され、またはほぼ直線化されることを示している。言い換えると、活性インパルスが同時に段階に入るか、少なくとも重なる状態になると、後の閾値決定を伴う合計に基づいて、段階が、たとえば(ほぼ)直線化されたトラジェクトリがその段階に与えられることを認識する。言い換えると、段階は、好ましくは、信号をその段階を通過させるとき、異なる程度にそれぞれの信号を遅らせるように実施される。
さらに、神経網として曲線認識手段を実施することが好ましい。そのような神経網は、複数のトラジェクトリ(または、トラジェクトリの形状)を確認し、実行オペレーションにおいて認識する。神経網は、理想の確認パターンによく似た非理想のトラジェクトリを認識することができることが、神経網の利点である。したがって、変動や妨害の影響を受けやすい非理想のパターンが認識されるため、神経網は、神経活動パターンにおけるトラジェクトリを認識するのによい実施となる。
最後に、曲線認識手段は、好ましくは、ハフ変換の評価に基づいてトラジェクトリを認識するように実施される。ハフ変換は、二次元表示において、どのような曲線であっても、曲線を分析的に示すのに効果的な方法である。ハフ変換の実施は、好ましくは並行して行われ、早い計算を行うことができる。
以下において、本発明の好ましい実施形態は、添付の図面を参照して更に詳細に記載されている。
図1は、本発明の第1実施形態に係る、音声信号に基づく音声信号の分析表示を算出する本発明の方法のフローチャートを示す。図1のフローチャートは、全体として100によって示される。
ここで、第一段階120の音声信号110について、神経伝達物質小胞の発生が、聴細胞と関連する神経線維との間のコラムにおいて測定される。一般的に100から数千もの神経伝達物質の分子を含む神経伝達物質小胞の発生は、ここでは複数の聴細胞について測定され、聴細胞が聴覚モデル全体に空間的に分布していると仮定される。例えば、神経伝達物質小胞発生の対応するシミュレーションにおいて考慮される聴細胞が聴覚モデルの蝸牛全体に等距離で、または、ほぼ等距離で、分布していると仮定することができる。音声信号による聴細胞の刺激により、関係する各聴細胞について、神経伝達物質小胞の発生を測定することができる。
神経伝達物質小胞の発生122に基づいて、関係する聴細胞の第2段階130において、神経線維上の活動電位AP1がそれぞれの聴細胞に連結して測定される。そして、示された処理がすべての聴細胞について繰り返され、それは神経伝達物質小胞の発生(ステップ132および134)の測定に関するものである。このように、神経伝達物質小胞発生の測定に貢献しているすべての聴細胞について、それぞれの聴細胞に関連した神経線維上の活動電位AP1、AP2、AP3は、それぞれの聴細胞に関連したそれぞれの神経伝達物質小胞発生122、124、126に基づいて算出される。
言い換えると、i聴細胞を考慮した場合、すべてのi聴細胞について、関連する神経伝達物質小胞発生122、124、126が算出される。神経伝達物質小胞発生に基づいて(各神経線維を別々に)、関連する活動電位AP1、AP2、AP3が算出される。したがって、算出を終えた後に、i活動電位は、共に神経活動パターンを形成する神経線維上に存在している。
したがって、神経活動パターンAP1、AP2、AP3は、更なる処理(例えば音声信号認識)に使用できる音声信号の分析表示を表している。
したがって、本発明の方法は、音声信号の特に正確かつ表現力豊かな分析表示を構成できるという効果をもたらす。神経線維上の活動電位AP1、AP2、AP3(共に神経活動パターンを形成する)は、音響現象の認識に人間の脳が用いる信号に非常に類似している。
神経線維上の活動電位AP1、AP2、P3が、伝達物質小胞発生122、124、126から得られる発明の方法において、次の音声信号分析を特に高精度に達成できる。
活動電位AP1、AP2、AP3が量子化されて発生すると、神経線維上の活動電位は、正確な時間的情報をもたらす。さらに、活動電位AP1、AP2、AP3の測定において、音声信号の分析表示を測定する従来の方法で考慮されない無駄時間(不応時間)が発生する。
さらに、活動電位AP1、AP2、AP3をその量子化により容易に表すことができ、活動電位の高さでなく活動電位の発生時点または連続的に発生している活動電位の割合が、情報を伝えるということに注意されたい。また、この点で、発明の方法は、例えば神経伝達物質の濃度がシナプス間隙において測定される周知の方法と実質的に異なり、濃度は、時間的に大幅に明確な変化がない連続曲線を示す。
それとは別に、複数の神経線維上のシミュレーションされた活動電位AP1、AP2、AP3を含む神経活動パターンは、例えば聴覚障害がある患者の聴神経の神経線維を刺激するために用いられることを指摘しておく。
図2は、本発明の第1実施形態に係る音声信号に基づく神経伝達物質小胞発生を算出する発明の方法のフローチャートを示す。図2のフローチャートは全体として200とみなされる。第1段階220での音声信号210について、関連する基底膜運動230が、算出される。言い換えると、音声信号210に基づいて、基底膜運動は、聴覚モデルを使用して算出される。例えば、この運動を基底膜の異なる点の速度および/または偏位によって説明することができる。それとは別に、図3を参照して基底膜運動の算出を更に詳細に説明できる点に注意されたい。
次に、基底膜運動230に基づき、第2段階240で、基底膜に連結する不動毛の偏位250が算出される。不動毛の偏位の算出は、図4を参照して更に詳細に説明される。
周知の不動毛偏位250に基づいて、第3のステップ260では、神経伝達物質小胞の発生が算出または決定される。それとは別に、神経伝達物質小胞の発生の算出は、図5を参照して更に詳細に説明される。したがって、図2に示される方法は、1個または数個の聴細胞の音声信号についての神経伝達物質小胞発生を提供する。好ましくは、関係する聴細胞が位置する場所において基底膜運動230が算出されることにここで注意されたい。しかし、(例えば、解析解を用いて)算出を有利にする場合に限り、基底膜の全体運動を算出することも可能である。
図3は、本発明の第1実施形態に係る音声信号に基づいて、基底膜運動を算出する本発明の方法のフローチャートを示す。図3の図解図は全体として300によって示される。
ここで、第1段階320における音声信号310について、内耳における機械的な音の変換が、聴覚モデルに基づいて算出される。聴覚モデルにおける鼓膜の刺激324が測定される。したがって、例えば、音声信号310は、鼓膜に影響を与える基となる。機械的または流体的な算出に基づいて、鼓膜の刺激を測定することができ、その際、鼓膜の振動が分かる。
そして、第2段階330において、聴覚モデルにおける中耳の小骨を経た音の伝達も算出される。ここでは、中耳の詳細な機械的分析が行われる。しかし、小骨の力または振幅の伝達比のみを考慮することも可能であり、結果として非常に単純な算出になる。さらに、小骨の慣性および/または減衰のような流体の影響について更に考慮することが可能である。さらに、最後に、小骨を経た音の伝達の算出について、中耳の転送特性が音響強度に応じて変化することができるとも考えられる。第2段階330における小骨を経て音の伝達を算出するために用いられるモデルの複雑さから独立して、前述の算出の結果、中耳および蝸牛の間の前庭窓の刺激334が測定される。
そして第3段階340で、中耳および蝸牛の間にある前庭窓の刺激334についての知識に基づいて、蝸牛の流体力学的な振動刺激が算出される。これは、適切な流体力学的シミュレーションにより、または簡易分析モデルの使用によって行うことができる。したがって、蝸牛分析の結果、蝸牛における流体の流れが分かるか、または測定することができる。
最後に、第4段階350で、蝸牛の振動刺激344についての知識に基づいて、基底膜の運動354が算出される。ここで、再度、線形または非線形の力学モデルを用いることができる。考慮された神経細胞が配置される選択位置における基底膜運動を算出するために、複数の可能性が存在することに注意されたい。
示された中間変数(すなわち鼓膜の刺激324、前庭窓の刺激334または蝸牛の振動刺激344)を明確に算出することは必要でない点に更に注意されたい。むしろ、音声信号310からおおよその基底膜運動354を直接に推定する方法も存在する。例えば、ここでは、線形または非線形フィルタが、基底膜の所定の点(好ましくは聴細胞が位置するところ)の運動を測定するために用いられる。次に、数箇所に位置する基底膜運動354の算出用に、様々に導入された複数のフィルタが使用される。ここで、フィルタは、蝸牛の位置の反応を音響信号に対する反応として表現される。
それとは別に、F.Baumgarteが蝸牛のモデリング用に特に有利な聴覚モデルを提案したことに注意されたい(F.Baumgarte:「Ein psychophysiologisches Gehoermodell zur Nachbildung von Wahrnehmungsschwellen fuer die Audiocodierung」(「音声符号化についての感覚の閾値を再生するための生理的聴覚モデル」)論文、ハノーファー大学、2000年)。Baumgarteのモデルは、特に有利な聴覚モデルの蝸牛のモデリングを可能にし、基本的な効果(例えば、蝸牛終端の信号反射)も考慮することができる。
図4は、基底膜運動に基づいて不動毛の偏差を算出する本発明の方法のフローチャートを示す。図4のフローチャートは、全体として400によって示される。
ここで、基底膜の運動が上述の1つの方法(または他のいかなる方法でも)に従って算出され、その結果、考慮されている神経細胞がある場所についての基底膜の運動速度が知られているものと仮定される。不動毛の偏位x(t)(時には、u(t)とも呼ばれる)は、基底膜運動に応じた運動方程式を解くことにより測定される。もちろんここでは、基底膜運動は、好ましくは相対速度v(t)によって説明されている相対運動と考えられる。
さらに、原子の衝撃運動によって生じる不動毛に関する確率論的な力fstoch(t)をさらに考慮することが好ましい。言い換えると、不動毛の刺激におけるブラウン運動も考慮することが好ましい。したがって、不動毛の運動方程式は、以下の形式の調和振動子の非同次運動方程式となる。
Figure 0004767316
ここで、mは考慮されている不動毛の有効質量であり、Dは不動毛の有効バネ剛性定数であり、そして、Kは不動毛の流体的減衰を示す不動毛の層流抵抗の定数である。外力Fextによって発現する不動毛の刺激は、基底膜運動の相対速度v(t)と比例しており、その結果、以下の数式が成り立つ。
Figure 0004767316
ここで、CBasは、基底膜運動に基づく不動毛の刺激に関する定数である。
前述のとおり、図示された運動方程式の評価は、時にはu(t)として参照される不動毛の偏位x(t)となる。
それとは別に、不動毛の偏位を算出する他の方法を用いることもできるいうことに注意されたい。たとえば、不動毛の低域通過動作をモデル化している一次運動方程式を使用することが可能である。言い換えると、別の定義では、不動毛が下記の形式の運動方程式によって説明できる低域通過システムを表すと仮定することができる。
Figure 0004767316
それとは別に、ブラウン運動によって生じる力Fstoch(t)の考察が選択できる点に注意されたい。
図5は、本発明の第1実施形態に係る不動毛の偏位に基づいて神経伝達物質小胞の発生を算出する本発明の方法のフローチャートを示す。図5において説明されるフローチャートは、全体として500によって示される。
たとえば、第1段階510において、不動毛の偏位u(t)に基づき、頂端伝導率G(u)が算出される。不動毛の偏位は、多くの開口イオンチャンネルを変え、それにより聴細胞の膜の伝導率が変わる。
したがって、第2段階520において、第1段階510から分かった頂端伝導率G(u)に基づいて、細胞内の有毛細胞電位V(t)が算出される。たとえば、細胞体のこの膜電位の算出において、受動電気回路のモデルを用いることができ、細胞容量の考察が可能となる。さらに、聴細胞の異なる膜の伝導率および異なるイオンを条件とした電位が考察される。
第2段階520での細胞内の有毛細胞電位V(t)の算出後、第3段階530において、カルシウム電流ICa(t)が算出される。シナプス間隙への神経伝達物質の放出は、カルシウムイオンによってもたらされる。たとえば、ここで細胞内有毛細胞電位V(t)に基づいて、開口カルシウムチャンネルの一部が測定される。カルシウム電流自体は、さらに開口カルシウムチャンネルの数、および細胞内の有毛細胞電位V(t)とカルシウムの対向電位との間の電位差に依存している。それとは別に、開口カルシウムチャンネルの数は、考慮される慣性に左右されることに注意されたい。
そして、カルシウム電流ICa(t)に基づいて、第4段階540で、カルシウム濃度[Ca2+](t)が測定される。ここでさらに、たとえば低域通過特性を考慮し、カルシウム濃度が平衡の状態で一定値を取ると推測できる。
カルシウム濃度[Ca2+](t)に基づいて、第5段階550で、伝達物質放出速度k(t)が測定される。ここで、好ましくは、貯蔵部、シナプス間隙、および処理メモリにおける伝達物質の貯蔵を考慮できる。伝達物質放出速度k(t)に基づいて、第5段階に連絡された第6段階560において、神経伝達物質小胞の発生または放出が測定される。ここで、好ましくは、量子化された、確率論的な神経伝達物質小胞の放出を仮定し、確率論的な伝達を関数N(n,p)によって説明することができる。ここで、たとえば、各n神経伝達物質の総量は、シミュレーション間隔において均等放出確率と等しいと仮定することができる。それとは別に、貯蔵部における神経伝達物質または神経伝達物質小胞のフィードバックがモデリングに含まれることに注意されたい。
有利に使用可能な内有毛細胞のモデルがC.J.Summer,E.A.Lopez−Poveda,L.P.O’MardおよびR.Meddisの論文「内有毛細胞および聴神経複合体の修正モデル」に記載されている点に更に注意されたい。(J.Acoust.Soc. Am., 第111巻、5番、パート1、2002年5月)。
しかし、不動毛の偏位u(t)に基づいた神経伝達物質小胞の発生の算出に他のモデルを用いることもできる点にさらに注意されたい。しかし、神経伝達物質小胞の確率論的な放出を考慮しているモデルを使用することが特に推奨されることが分かった。というのは、このような確率論的な放出は、算出される神経活動パターンは神経伝達物質小胞の連続的なまたは非量子化された放出に基づくモデルよりもかなり良いと説明されているからである。それとは別に、すでに前記で述べた様に、神経伝達物質小胞放出の評価によって、明確な時間的変化が起こらない連続放出モデルを用いる場合と比較して、音声信号に関するより正確な情報が得られる。
図6は、本発明の第1実施形態に係る神経伝達物質小胞の発生に基づく神経線維の活動電位を算出する本発明の方法のブロック図を示す。図6のフローチャートは、全体として600により示される。
神経伝達物質小胞の発生に基づいて活動電位を算出する図示された方法において、第1段階610において、神経細胞の電圧が神経伝達物質小胞の発生に基づいて算出される。たとえば、この電圧は、シナプス後電位またはシナプス後神経細胞の減極である。たとえば、神経細胞の電圧の算出について、神経伝達物質の拡散が考慮される。言い換えると、平均神経伝達物質濃度を畳み込み積分の評価によって測定し、畳み込み積分において、拡散型核を評価することができる。たとえば、このような拡散成果の考察は、Erwin NeherおよびTakeshi Sakabaによる論文「シナプス後電流の変動からの伝達物質放出の評価」に説明されている(The Journal of Neuroscience 2001年12月15日、21(24):9638−9654)。さらに、シナプス後電位の算出において、細胞膜の容量および膜イオン・チャンネルの膜電位依存伝導率が考慮される。したがって、神経細胞における電圧の算出に対応するモデルにおいて、細胞膜を通じたイオン交換および神経伝達物質による刺激は統合される。
次に、第1段階610において算出されるシナプス後電位に基づき、第2段階620では、活動電位の開放について決定ことができる。ここで、神経伝達物質の放出によって、シナプス後電位が高くなると仮定される。
要約すると、次のように言える。内有毛細胞は、基底膜と聴覚神経線維(ANF)間の接続であり、インパルスを脳の方向に送る。しかし、シナプス後端部にあるANFが、脳へ活動電位を送る前に、電圧は十分高くならなければならず、かつ閾値を越えなければならない。このため、シナプス前内有毛細胞の事象連鎖が必要であり、機械的振動を電気信号に変換する。
内有毛細胞の頂端において、毛束、つまり3列の不動毛が位置し、いわゆるチップリンクによって接続される。毛束は基底膜の振動運動に従い、その内部に毛束が存在する液体よって減衰され、その剛性によって元の位置に戻る。不動毛運動は、結合調和振動子のシステムとみなすことができる。簡潔に言うと、以下の方程式によって説明される。
Figure 0004767316
ここで、x(t)は不動毛の偏位を表し、v(t)は基底膜の速度を表す。τcは時定数であり、Cciliaは利得係数である。不動毛は、低周波において、基底膜速度に対して同相となるように動き、高周波において、位相シフトが起こるように動く。
内有毛細胞膜の内部においては、外部よりかなり低い電位が存在する。これは、基本的に(正帯電した)カリウムイオンの現在の濃度によって影響され、内側と外側との間にイオンが連続して流れている。静止状態において、[K+]=130mmol/l(内側)および[K+]=155mmol/l(外側)の平衡濃度が成立する。また、静止状態において、不動毛端にあるイオンチャンネルの約15%が開いていると推測される。今、不動毛が中間方向に入ってくる場合、追加のチャンネルを開くことになる。内有毛細胞の内部と外部との間の伝導率は上昇する。これにより、さらに正帯電したカリウムイオンが外側から内側へと流れ、内有毛細胞の内部の電圧は上昇する。反対に、逆(横)方向の不動毛偏位は、イオン流を阻止し、したがって膜電位の低下につながる。
不動毛は運動に極めて敏感に反応する。+/−0.003度の正弦関数偏位が、可聴信号としてすでに認識されている。しかし、基底膜を発振することによる外部刺激がなくても、不動毛は動く。不動毛はブラウン運動の基礎となり、到来する音波が全くなくても、神経線維の種類に応じて、1秒につき100を超えるまでの活動電位が発生する。
有毛細胞の減極は、いわゆる活動領域の付近に位置している細胞膜にある電圧依存カルシウムチャンネルを開く。これは、シナプス間隙の求心性神経端にある領域であり、そこに神経伝達物質が位置する。このように、外側から、より多くのCa++イオンが、内有毛細胞に入ることができる。このカルシウムイオン流入は、神経伝達物質の放出につながる。メッセンジャーは数千もの神経伝達物質分子とほぼ同数のいわゆる小胞に既に「詰め込まれ」、待機しているという事実によって、信号伝送での高速が保証される。これは、いわゆる利用可能な小胞のプールによってモデル化することができる。
シナプス間隙への伝達物質分子の放出は、小胞がこのために提供されたシナプス前膜の位置、つまり活動領域で拡散し、膜と組み合わさり、その中身である神経伝達物質へと放出するという事実によって起こる。利用可能な小胞のプールが空になれば、再び序々に補充される。更に、再処理プールの使用が推奨され、そこでは間隙からの伝達物質は一定の割合で再び詰め込まれて、小胞になり、そこから再びフリー・プールに直接到達する。伝達物質の一部は、シナプス間隙において失われる。
小胞のプールからの神経伝達物質の放出は、通常、二項分布として説明される。ここで放出確率は、活動領域付近の内有毛細胞膜内部でのカルシウム濃度に依存する。
神経細胞における電圧推移の最初のモデル化は、1952年のHodgkinおよびHuxleyにさかのぼる。ここで、基本的に、カリウム[K]およびナトリウムイオン[Na]の交換、および(基本的にCL-イオンの)特定の「リーク」[L]は重要であり、これらを異なる最大伝導率(gNa、gK、gL)および(u(t)に依存している変数m、h、nによってモデル化される)現在の電位に応じた膜透過性の経時変化とで区別する。膜電圧u(t)は次の式に従って機能する。
Figure 0004767316
Figure 0004767316
ここで、u´は、時間による微分を示す。VNa、VKおよびVLは、イオン交換の方向を決定するネルンスト平衡電位である。Ik(t)は細胞膜を通じたイオン交換を表すが、I(t)は、ここでは例えば、内有毛細胞によって放出される神経伝達物質を通じた外部電流であり、Cは細胞膜によって形成されるコンデンサである。外部電流が細胞内に流入する時に、コンデンサは充電され、膜イオンチャンネルを通じたリークが起こる。
膜電位に応じた伝導率の時間パフォーマンスは、3つの微分方程式の手順によって説明される。
Figure 0004767316
Figure 0004767316
Figure 0004767316
電圧uに応じた関数αi(u)およびβi(u)は、i={m、n、h}に関してHodgkinおよびHuxleyによって調整される。異なるイオン流の異なる高速反応は、膜における電圧推移を特徴づけている外部電圧の変化を引き起こす。今、小胞がシナプス前内有毛細胞から間隙に拡散する場合、小胞はシナプス後膜の受容体蛋白質に結合して放電する。小胞の分子によって、シナプス後電位は、このように指定された約0.5−1mV のmEPP(微小終板電位)によって増加する。
シナプス後電位によって説明されるシナプス後神経細胞の減極が特定の閾値νを越える場合、例えば、活動電位の放出が起こる。
活動電位が、例えば、常にほぼ同一の経時変化であることによって特徴付けられている。膜電圧は、まず、1ミリ秒未満の極めて短い間に非常に強力に減極し、それから過分極化し、活動電位がさらに発生しないしばらくの間は遮断される。
Figure 0004767316
Figure 0004767316
Figure 0004767316
言い換えると、シナプス後電位が所定の閾値を越える時、活動電位を引き起こす。この閾値は、時間的に変化することができる。それとは別に、活動電位の発生において、好ましくは絶対不応時間、すなわち活動電位がさらに起きるのがもはや不可能な無駄時間と、活動電位を引き起こす閾値が静止状態より高い相対不応時間について考慮できることに注意されたい。ここで、絶対不応時間を例えば非常に高い閾値νによってモデル化することができるが、他の方法で統合することもできる。相対不応時間は、活動電位を引き起こす時間変化の閾値νによって説明されるのが好ましい。
したがって、神経線維の無駄時間を活動電位の生成または神経活動パターンの生成において考慮し、複数の神経線維上の活動電位を説明することが保証される。これによって、神経活動パターンの情報量を減らすことができ、それにより神経活動パターンをさらに処理して神経活動パターンを蓄積することが可能になる。それとは別に、説明された処置によって、神経線維の自発的な活動を考慮することができる。
絶対不応時間の間に、時間的に重なり合う複数の神経伝達物質小胞の発生が、活動電位の誘発につながらないことに更に注意されたい。しかし、相対不応時間において、単一の神経伝達物質小胞の発生が活動電位を引き起こさないが、相対不応時間においていくつかの神経伝達物質小胞の発生が重なり合うと、結果として活動電位の誘発を引き起こす。
図1〜6を参照して説明される方法によれば、神経活動パターンを含み、特に表現に富む音声信号分析表示を生成することができる。本発明の方法において、神経活動パターンは、神経伝達物質小胞の発生に基づいて算出され、神経伝達物質小胞の発生の確率的性質が考慮される。さらに、神経線維上の活動電位の測定において、関連する全ての効果(例えば、神経線維上の活動電位の誘発におけるポテンシャル依存および神経伝達物質の拡散)を考慮することができる。この理由で、本発明の方法で算出される神経活動パターンは、表現に富む分析に必要な特に高い時間精度を有する。本発明によって測定される神経活動パターンを用いて、例えば、隣接する神経細胞の活動電位間の位相関係を評価できるが、モデル化が非常に不正確であるため、従来はほとんど表現にできない。
神経伝達物質小胞を1対1で1mVの規模の電気インパルスに変換することが有利である点に更に注意されたい。算出された神経伝達物質小胞の放出を、例えば蝸牛移植物制御装置において方形インパルスを発生させ、蝸牛移植物へ電気インパルスを供給するために使用することができる。そして、インパルスによって、聴覚神経線維を起動させることができる。ここで、例えば、251個の聴覚神経用の251個の神経信号は、蝸牛移植物において一般的に利用可能な22のチャンネルに調整される。
また、さらに有利な音声信号分析表示を得るために、更に神経活動パターンを処理することが好ましい。ここで、神経活動パターンの算出は、上記の方法に従って有利に行われ、神経活動パターンを提供する他の方法も、改良された分析表示を得るために用いることができる。
図7は、本発明の更なる実施形態に係る、音声信号の改良された分析表示を算出する発明の方法のフローチャートを示す。図7のフローチャートは、全体として700によって示される。ここで、第1段階720で、音声信号710に基づいて、神経活動パターン730が算出される。既に上記で詳細に説明されたように、第1段階720では神経活動パターン730の測定において、例えば聴覚モデルを用いることができる。したがって、神経活動パターン730の算出結果は、複数の神経線維NF1、NF2、NF3、NF4、NF5上の活動電位の経時変化である。
ここで、音声信号710に対する応答としての神経活動パターン730が、特性トラジェクトリ740、750を構成する点に注意されたい。言い換えれば、音響事象が音声信号710で起こる場合、この音響事象は結果として複数の神経線維NF1、NF2、NF3、NF4、NF5上に時間的にわずかにずれて、一連の活動電位AP1、AP2、AP3、AP4、AP5を引き起こす。このように、トラジェクトリ740、750は、いくつかの異なる神経線維NF1、NF2、NF3、NF4、NF5(「パルス・スパイキング列」)上にそれぞれ、複数の活動電位AP1、AP2、AP3、AP4、AP5またはスパイクを含む。
トラジェクトリ740、750は、時間とともに神経活動パターン730の二次元表示における線と認識することができるという事実をとりわけ特徴としている。トラジェクトリ740、750は、直線またはカーブのどちらであってもよく、異なる種類の湾曲(例えば放物線状または双曲線状)が起こることがある。それとは別に、正弦波関数からの部分によってトラジェクトリ740、750にアプローチすることも場合によっては可能である点に注意されたい。トラジェクトリ740、750が、定義により、最小限の長さを有することに更に注意されたい。したがって、活動電位AP1、AP2、AP3、AP4、AP5が最小数の神経線維上で発生する場合のみ、トラジェクトリ740、750が存在する。そして、ここで、活動電位は、時間の関数として神経活動パターンの二次元表示における線分を形成する。
さらに、ここで時間の関数としての神経活動パターン730の二次元表示は、活動電位が時間の関数としての数個の神経線維上に平行に示された図解図を示し、時間は横座標方向に示され、活動電位の経過は基本的に横座標と平行な連続線によって数個の神経線維上に示されることに注意されたい(図8も参照)。神経活動パターン730の2次元表示における最大または最小活動電位AP1、AP2、AP3、AP4、AP5の合致を直線または曲線で接続できる(滑らかである、または湾曲がないことが好ましい)場合、トラジェクトリ740、750が存在する。したがって、トラジェクトリは、隣接する神経線維の最小または最大活動電位を合致させる接続線と考えることができる。
フローチャート700で示される本発明の方法は、第2段階754で、第1段階720において形成される神経活動パターンの処理を含む。しかも、神経活動パターン730を、時間の関数として、かつ神経線維の位置の関数として、二次元の図解図において考慮することが好ましい。したがって、第2段階754において、神経活動パターン730は、分析表示として一連の時間情報t1、t2を得るために処理され、その後のトラジェクトリ740、750の時間的位置を示す。しかも、トラジェクトリ740、750は、音声信号における同じ事象に基づいた各神経線維NF1、NF2、NF3、NF4、NF5上の各活動インパルスAP1、AP2、AP3、AP4、AP5を含むか、または接続するものと仮定する。ここで、測定された時間情報t1、t2は、トラジェクトリ740、750の発生時点を示す。最小数の神経線維NF1、NF2、NF3、NF4、NF5が活動電位AP1、AP2、AP3、AP4、AP5を有する場合のみ、トラジェクトリ740、750が認識され、それによって神経活動パターンにおける個々の活動電位が、誤ってトラジェクトリとして識別される、または認定されることを防ぐ点に更に注意されたい。
それと共にトラジェクトリをもたらす音響事象は、例えば音の始まりでもよい。また、母音は、本発明の方法で認識することができ、続いて時間情報と結びついた少なくとも1つの特徴的なトラジェクトリを生成する。しかし、従来、音は、いくつかのトラジェクトリを含み、好ましくは連続したトラジェクトリの各々に関して、関連する時間情報を生成することができる。ここで、時間情報は、例えばトラジェクトリの開始時点、すなわちトラジェクトリ740、750に属する第1神経線維NF1、NF2、NF3、NF4、NF5が活動電位AP1、AP2、AP3、AP4、AP5を有する時点を示す。
例えば、神経活動パターンのこのようなパターンは、聴覚モデルの基底膜上の進行波と関連しているトラジェクトリとして認識されるように、神経活動パターン730の処理が実行される。言い換えれば、刺激パターンが進行波の伝播に基づく個々の神経線維に適用される時、トラジェクトリを認識することができる。ここで、進行波は、一般的に連続して、また極小でないが少し時間をずらして複数の神経線維上に活動電位を引き起こす。
更に、高周波を好ましく検波する神経線維と比較して、聴覚モデルに応じた低周波に好ましく反応する神経線維は、通常、後に活性化されるか、または活動電位を有すると上記のアプローチで考えられる。この理由は、高周波に応答する聴神経が蝸牛または基底膜の入口に配置されるが、低周波を認識する聴神経は蝸牛の出口に配置されるからである。
蝸牛、または基底膜にわたる音響事象の伝播があると、ここでは、周波数依存の遅延が起こり、その結果、高周波部分は低周波部分より早く関連する神経線維上に活動電位を生成する。
したがって、図7の図解図は、複数の神経線維NF1、NF2、NF3、NF4、NF5上の活動電位AP1、AP2、AP3、AP4、AP5を示す。ここで、第1神経線維NF1は高周波(例えば、20kHz)と関係しているが、第5神経線維(NF5)は低周波(例えば、20Hz)と関係していると仮定する。中間第2神経線維NF2、第3神経線維NF3および第4神経線維NF4は、中間周波数と関係している。
ここで理解を深めるために、時間軸tに注目する。第1神経線維NF1上の活動電位AP1が残りの神経線維NF2、NF3、NF4およびNF5上の活動電位より早く発生することが分かる。したがって、5つの神経線維上で合致している活動電位は、時間の考慮において、時間t1の始点に関連させることができる第1トラジェクトリ740を形成する。後続の第2音響事象は、神経線維NF1、NF2、NF3、NF4、NF5上に活動電位AP6、AP7、AP8、AP9、AP10を生成し、第2トラジェクトリ750を形成する。そして、第2トラジェクトリ715に関しては、時間t2の第2ポイントを関連させることができる。
今、第2段階730の神経活動パターンの処理作業は、第1トラジェクトリ740および第2トラジェクトリ750を認識し、トラジェクトリ740、750に関連した対応する時間情報(t1)(t2)を提供することである。したがって、時間情報(t1)および(t2)は、音声信号710の改良された分析表示を作成し、神経活動パターン自体より更に有利な処理を可能としている。改良された分析表示760は、とりわけ速度認識の目的にも使用することができる。それとは別に、改良された分析表示760は、信号のリズム認識にも、非常に適している。
より理解を深めるために、図8は、典型的な神経活動パターンの図を示す。第1図解図810は、基底膜820がどのように音波衝撃824(クリック音)により刺激されるかについて示す。音波衝撃824は、蝸牛の前庭窓を介して連結され、したがって、最初に基底膜820の基端830に達する。そして、音波衝撃は、基底膜820を越えてその頂端834まで伝わる。例えば、基底膜に沿って、5つの(聴)神経が配置され、そこでは図解図840は、基底膜の異なる場所での音波衝撃824による刺激を伴う基底膜820のパルス応答を示す。ここで、基底膜820の基端830付近では、短いインパルス応答が基本的に高周波部分を含んで発生し、しかし、その一方で、基底膜820の頂端834付近では、長いインパルス応答が基本的に低周波を含んで発生するということがわかる。
更に、図解図850は、基底膜に沿った複数の位置に関するインパルス応答を示す。ここで、横座標860は時間を表し、縦座標862が基底膜820に沿った位置を示す。図解図850から、基底膜820に沿った異なる位置におけるインパルス応答が、音波衝撃824による刺激において、複数のトラジェクトリを有するということがわかる。そのうち、2つのトラジェクトリ870、872が例として図解図850に示される。それとは別に、基底膜のインパルス応答の図解図850において示されるトラジェクトリを、同様の方法で、神経活動パターンでも識別することができるが、ここでは明示されない。
それとは別に、ここで、図解図850に示されるトラジェクトリ870、872が異なる湾曲機能を有する点に注意されたい。基底膜820の異なる位置で、異なる周波数が占める(例えば、基底膜の基端では高周波、および基底膜の頂端では低周波)ことから、湾曲機能が異なる。
更なる図解図880は、図解図810に似ており、884で示した一連の音波衝撃(クリック音)による基底膜882の刺激を示す。したがって、図解図890は、別の音波衝撃上へのインパルス応答の重ね合わせを示す。図解図892は、再び基底膜881上の多数の位置xに対応するインパルス応答を示す。
更なる説明として、図9は、基底膜上の異なる周波数の信号伝播における遅延の図解図を示す。ここで、第1図解図910は、固有振動数の関数として、聴覚神経線維の待ち時間を表す。
ここで、振動数は、0.1kHzから16kHzの範囲で横座標912に示される。914の縦座標は、0から12ミリ秒の範囲の聴覚神経線維の待ち時間を表す。曲線920は、振動数に関する、正弦波信号によるネコの聴覚神経の待ち時間の推移を表す。測定点924は、チンチラについての同様の推移を表す。各神経線維について固有振動数fiの関数としての聴覚神経線維上の待ち時間を、以下の方程式によって説明できることが判明した。
Figure 0004767316
関連背景技術が、例えば、グランサムでの聴覚に関する第11回国際シンポジウムで発表されたS.Greenberg、D.PoeppelおよびT.Robertsによる論文「蝸牛進行波遅延の皮質拡張に基づく音程と音色の空間−時間理論」の中で、詳細に説明されている。したがって、詳細については、該当する論文を参照されたい。
ここで、さらに、第2の図解図930が固有振動数に適した、ヒト蝸牛の基端からの聴覚細胞の距離を示すことに注意されたい。このことから、高振動数に属する聴覚細胞はヒト蝸牛の基端の近くに配置されるが、低振動数に属する聴覚細胞はヒト蝸牛の基端から遠く離れて配置されることがわかる。
しかし、第1図解図910および第2図解図930からなる図は、聴覚神経の待ち時間が低周波(約0.5kHz未満)について堅調に増加することを示す。このことから、基底膜の終端に近く(すなわち、蝸牛の基端から遠く)では伝播時間がかなり減少すると結論を下すことができる。
既に図8を参照して説明されているように、前述の聴覚神経線維の待ち時間は、聴細胞に連結する複数の神経線維上の活動電位を説明している神経活動パターンにおけるトラジェクトリの湾曲をもたらす。
更なる説明として、図10は、母音「i」と700Hz、900Hz、1100Hzの混合非和声音に関する蝸牛電気図の図解図を示す。ここで、横座標1010は時間を表し、縦座標1020は周波数を表す。該当する母音「i」の蝸牛電気図において、トラジェクトリを再び明らかに認識することができ、そのうち、いくつか選択したトラジェクトリを1050によって表示する。同様に、混合非和声音の蝸牛電気図は、1060によって示されるトラジェクトリを示す。
図11は、母音「A」に関する蝸牛電気図、伝達物質放出確率および伝達物質小胞放出の更なる図解図を示す。ここで、蝸牛電気図を第1図解図1110に示す。第2図解図1120は、蝸牛電気図に基づく伝達物質放出確率を示す。ここで、蝸牛電気図は時間と周波数に関して、基底膜の刺激を示すことに注意されたい。これに基づき、上記で説明されているように、神経伝達物質小胞の放出確率を、聴細胞の機械、化学、電気プロセスの分析によって算出することができる。放出確率を、例えばk(t)として示す。そして、放出確率k(t)に基づき、神経伝達物質小胞放出を、確率論的評価によって算出することができる。結果として生じる神経伝達物質小胞放出の例を、第3グラフ1130に示す。ここでまた、時間および周波数に関する小胞放出が特性トラジェクトリを有するということがわかる。そして、これらトラジェクトリは、シナプス間隙のモデル化により活動電位のトラジェクトリ(すなわち、神経活動パターン内のトラジェクトリ)上へと図表化する。
最後にここで、縦座標1140で示される周波数を関連聴細胞または神経線維(n)とそれぞれ関連させることができることに注意されたい。したがって、示したトラジェクトリは、神経活動パターンでも非常に類似した形で発生する。
図12は、本発明の第2実施形態に係る、音声信号の分析の処理チェーンの図解図を示す。図12の図解図を、全体として1200によって示す。
図12によれば、音声信号1210に基づいて、基底膜1220の運動が、複数の場所(または位置あるいは領域)で算出される。基底膜に沿った位置に応じた基底膜の刺激パターンが、トラジェクトリを認識する手段に直接供給されるか、または基底膜の刺激パターンに基づいて、今後の処理に使用される神経活動パターンが生成される。基底膜の刺激パターンは、同基底膜から生じる神経活動パターンと同じように、長時間にわたる観察において、音声信号に特徴的な複数のトラジェクトリを有する。ここで、図8および図9を参照して説明した高周波と低周波との実行時間差に基づいて、トラジェクトリは一般的に湾曲している。それとは別に、例えばトラジェクトリを中断することもできることに注意されたい。さらに、個々の周波数帯域または基底膜空間領域で、異なる刺激パターンおよびトラジェクトリが発生可能である。中断されたトラジェクトリまたは一部のトラジェクトリは、特定の周波数帯域において刺激されるだけであるが、例えば音声信号について特徴的である。
示された神経活動パターン1230または神経活動パターンに類似している基底膜刺激パターンは、音響コア1240に供給される。音響コアは、2つのピーク間の時間を検出するように実施される。それとは別に、音響コアの作業は神経活動パターン(または基底膜刺激パターン)におけるトラジェクトリを識別することであることに注意されたい。音響コアは、全周波数帯域、すなわち神経活動パターンを形成する全ての神経線維、または選択された部分範囲を分析するために実行できる。更に、様々な組み合わせの部分範囲および全周波数帯域両方を並行して分析することが可能である。
関係する最小数の神経線維が活動パターン1230を有する場合、トラジェクトリを認識するために音響コア1240は実行され、活動パターン1230は時間に関する神経線維数の表示において、一般的に曲線形の過程に相当する。そして、音響コア1240は、出力信号として、トラジェクトリの時間的位置を表す一連の時間情報を提供する。例えば、これは、トラジェクトリの開始時点であっても、トラジェクトリ内の中間時点であってもよい。それとは別に、今後の処理(例えば音声認識)用に複数の周波数帯について部分的な情報を利用できるように、複数の周波数帯または複数の神経線維群に関し、評価を並行して実行することが好ましい点に注意されたい。音響コア1240の典型的な出力信号を、図解図1250に示す。ここで、音響コア1240の出力信号は、神経活動パターン1230に関するデータ量がかなり減少する、向上した分析信号を表している。音響コアの出力信号1250は、トラジェクトリと関連した1または幾つかの周波数帯についての離散時点のみを表す。ここで、離散時点を1260によって示す。それとは別に、トラジェクトリの時間的位置を表す周波数帯に従って分離した情報は、特に音声認識に適している。
図13は、神経活動パターンの発明プロセスの装置のブロック図を示す。図13に示される装置を、全体として1300によって示す。示されている装置1300は、複数の段階1310、1312、1314を有し、第1段階1310は、神経細胞から信号1320、1322、1324を並行して受信する。信号1320、1322、1324は、好ましくは対応する神経細胞に連結した神経線維上の活動電位を表し、したがって、神経活動パターンを表す。
そして、例えば、第1段階1310において、第1遅延手段1330における第1神経信号1320は遅延を受け、遅延神経信号1332として第2段階1312まで進められる。同様の方法にて、第2神経信号1322は、第1段階1310において遅延し、遅延神経信号として第2段階1312まで進められる。同様の方法で、残りの神経信号(すなわち例えば、第n番目の神経信号1324)も、第1段階1310において処理される。
第2段階1312が第1段階1310と並行して実行され、したがってさらに遅延神経信号1332、1334、1336の遅延進行を可能にし、2回遅延された神経信号が生じる。ここで、神経活動パターンの本発明の処理装置は、第1段階1310または第2段階1312というように組み合わされた、直列接続された複数の段階を含む。したがって、神経信号1320、1322、1324は複数の段階1310、1312、1314を通じて並行に前進し、各段階は、設定可能な遅延を神経信号に付加する。
更に、各段階1310、1312、1314を実行して、同時に入力または出力神経信号の和(または、それぞれ、m回遅延神経信号)を生み出す。更に、段階1310、1312、1314を実行して、ある決められた時点で少なくとも所定数の神経信号または遅延神経信号それぞれ(すなわち、入力または出力神経信号)が活動的かどうか(または活動電位を有するかどうか)を決定する目的で、この和を設定可能な閾値と比較することが好ましい。
段階1310、1312、1314に存在する遅延手段の遅延を異なって設定し、例えば、第1神経信号1320は、段階1310、1312、1314を通過する際、第2神経信号1322とは異なる遅延を受けることが更に好ましい。例えば、神経信号1320、1322、1324に関し、段階1310、1312、1314を通過する際、異なる全遅延が起きるように遅延を設定することができる(例えば、2つの神経信号が同様に遅れることは、もちろん認められる)。言い換えれば、手段1300は、全ての神経信号について同じ遅延が起こらないように実行されることが好ましい。それとは別に、1段階に含まれる遅延手段が複数の神経信号について同じ遅延を有さないように、j段階1310、1312、1314の存在下では、少なくとも(j−1)段階1310、1312を実行することが有利である。このことにより、本発明の手段1300に入って来る神経活動パターンは、上述の手段を通過する際、時間的にゆがめられること、すなわち個々の神経信号が他の神経信号に対して時間的にずれることを達成することができる。そして、このゆがみにより、時間図解図において、曲線状のパターン、すなわちトラジェクトリを神経活動パターンにおいて直線にすることができる。
ある段階内の和の生成により、元々曲がっていたトラジェクトリが、神経活動パターンにおいていつ直線に曲げられたかが分かることに更に注意されたい(このことは、一定数の遅延神経信号が、略同時にまたは時間的に重なって活動電位を有するという事実によって説明される)。
手段1300の機能を、図14を参照して説明する。図14は、神経活動パターンの本発明の処理装置1300における信号の典型となる図解図を示す。図14の図解図を、全体として1400によって示す。
ここで、第1図解図1410は、装置1300の入力における典型的な神経活動パターンを表す。ここで、例として、4つの神経細胞(またはそれぞれ4つの神経線維上)の信号を、時間的経過において示す。それとは別に、活動電位1412がトラジェクトリ1314を形成することに注意されたい。図示の通り、時間的図解図におけるトラジェクトリ1414は強い湾曲を有しており、これは第1段階1310の入力において異なる神経線維の活動電位1412が時間的にかなりずれているからである。したがって、第1段階1310において、決まった各時点では活動電位が1つだけ存在し、第1段階に付加される活動電位の和の閾値(例えば2に設定)を超えない。従って、第1段階は、閾値出力において出力信号を提供しない。
第2の図解図1420は、第1段階1310の出力での状態を表す。ここで、第1段階1310において、第1神経細胞NZ1から提供される神経信号は、他の段階によって提供される神経信号より大きく遅れることを仮定する。それとは別に、ある例では、第4神経細胞NZ4から提供される神経信号の遅れは最も小さいが、第3神経細胞NZ3からの神経信号はそれより多少遅れ、神経細胞NZ2およびNZ1からの神経信号の遅延は更に大きい。一般に、低周波に応答する神経細胞に属する信号は、高周波を検出する神経細胞からの神経信号と比較して、遅れは小さい。
したがって、更に第2の図解図は、時間の関数としての活動電位1424を示し、活動電位1422は、トラジェクトリ1424を形成する。第2図解図1420から分かるように、第1段階の出力でのトラジェクトリ1424の湾曲は、第1段階の入力でのトラジセェクトリ1414の(それぞれ、時間―場所または時間―周波数)湾曲より小さい。これは、第1段階の遅延手段(例:1330)における異なる神経細胞と関連した神経信号の異なる遅延から生じている。これにより、曲がったトラジェクトリは、いわばまっすぐになる。第2図解図1420から分かるように、第2トラジェクトリ1424には、依然として湾曲が残っているが、その結果、異なる神経細胞または神経線維から発生する活動電位1422が、第1段階1310の出力、または第2段階の入力に全て付加されるわけではない。
また、第2段階1312は更に遅延を引き起こし、ここでもやはり低周波に関して敏感な神経細胞の信号は、高周波に関して敏感な神経細胞の信号より遅れが小さい。第3図解図1430は、第2段階出力で第2段階1312において再び遅れる神経信号を示す。第3の図解図1430から、この例において、数個の神経細胞の活動電位1432が同時に第2段階の出力に付加されるように、第2段階出力における神経信号がそれぞれ遅れるということが分かる。言い換えれば、活動電位1432によって表されるトラジェクトリ1434は、少なくとも略まっすぐになる。したがって、活動電位1432は同時、または略同時に(但し、少なくとも時間的に重複して)発生し、その結果、第2段階の出力(または、第3段階の入力)に付加される信号の加算による同時発生には、所定の閾値(例えば、2または3)を超すほど高く目立ったピークがある。
言い換えれば、適切な加算手段(あるいは、別の適切な手段)によって、曲がったトラジェクトリがいつまっすぐになったかを認識することができる。関連した情報によって、トラジェクトリの開始時点およびトラジェクトリの形状にさかのぼった結論が可能となる。トラジェクトリがまっすぐになるまでにどれだけ多くの段階を通過したかを、正確に決定することができる。これにより、手段1300の段階における個々の神経信号に関する遅延が分かる場合、トラジェクトリの原形を判断することもできる。更に、段階の通過時間を知ることが好ましく、その結果、トラジェクトリが手段1300に入り始める時点を決定できる。したがって、分析表示には、トラジェクトリの特性時間情報およびトラジェクトリの形状または湾曲に関する情報を含めることができる。
そして、トラジェクトリの形状についてのさらなる情報は、分析表示のさらなる処理において、例えば、音声認識を容易にするために、または、音声認識の認識品質を改善するために、有利に用いることができる。
それとは別に、理解を改善するための第4の図解図1440は、第3段階の出力での出力信号を示すことにも注意されたい。しかしながら、活動電位1442は、トラジェクトリのさらなる変形によって再び曲げられるトラジェクトリ1444を示している。
段階1310、1312、1314における遅延は、異なる方法で達成できることに注意されたい。遅延手段(例えば1330)は、例えば計時されてもよく、および/または、連続的にまたは別々に設定可能な遅延手段であってもよい。それとは別に、1つまたはいくつかの遅延手段は、1つまたはいくつかの神経信号に対して所定の段階で非活性化されることも可能であり、その結果、いくつかの神経信号は、できるだけ低い遅延を有する1つの段階を通して送られる。それとは別に、手段1300は、全体がアナログまたはデジタル回路として実施できることに注意されたい。
図15は、本発明の第2実施形態による音声信号の分析表示の本発明の算出のための典型的なヒューベル・ウィーゼル・ネットワークの回路図を示す。図15の回路図は、その全体が1500によって示される。第1の回路ブロック1510は、入力信号1520、1522、1524を受信し、それらは、例えば基底膜の神経活動パターンまたは刺激パターンを表すことができる。そして、入力信号1520、1522、1524は、複数の段階1530、1532、1534を通して送られる。このように、入力信号1520は、複数の段階1530、1532、1534を通過し、1つの段階1530、1532、1534における入力信号1520は、遅延手段を通過するか、または、後段に直接送られる。言い換えれば、遅延手段は、架橋することもできる。
言い換えれば、各段階は、信号ごとに、切換可能な遅延手段を含み、遅延手段は、切り換えることができ、または、入力信号が通り抜ける信号路において架橋することができる。各段階の入力部における信号は、合算器1540、1542、1544に分岐されまたは入力され、段階の入力部に入力されるそれぞれの信号は、合計される。このように、第1の回路ブロック1510は、遅延素子のグリッドと示された方法で接続される加算器とを形成する。
ヒューベル・ウィーゼル・ネットワーク1500は、閾値手段1550をさらに含み、閾値レジスタ1560、1562、1564からの各1つの値と合算器1540、1543、1544の出力とは、比較器1570、1572、1574に供給される。ここで、比較器1570、1572、1574の出力信号1580、1582、1584は、所定の段階1530、1532、1534の入力で多数の信号が同時に活性化されているかどうかについての表示を提供し、活性化されている出力信号1580、1582、1584が出力される最小数は、閾値レジスタ1560、1562、1564によって決定される。言い換えれば、それは、第1のブロック1510の入力1520、1522、1524を介して読み込まれたトラジェクトリが直線状にされた場合(またはいくつかの段階1530、1532、1534を通過した後)に、合算器1540、1542、1544と閾値レジスタ1560、1562、1564とに接続される比較器1570、1572、1574によって決定できる。
ここで、個々の段階1530、1532、1534の遅延は、多数のトラジェクトリ(またはトラジェクトリ形状のそれぞれ)の認識を可能にするために適切に与えられる。
図16は、本発明の第2実施形態による音声信号の分析表示の本発明の算出のためのヒューベル・ウィーゼル・ネットワークのブロック図を示す。示されたヒューベル・ウィーゼル・ネットワークは、その全体が1600によって示される。
入力ニューロン1610は、聴覚モデルの基底膜の神経活動パターンまたは刺激パターンを受信するために、並行して提供される時間信号の形式で配置される。神経活動パターン(または基底膜の刺激パターンのそれぞれ)は、神経網のいくつかの段階を通して遅延ニューロンの最適統合によって送られる。遅延ニューロン1620は、段階において入力ニューロン1610から提供される信号が遅延しないように、架橋できることにも注意されたい。神経網は、出力ニューロン1630をさらに含む。ここで、神経網1600の接続は、図16から取ることができる。示された神経網は、それぞれ、神経活動パターン(または基底膜刺激パターンのそれぞれ)において、神経網1600の入力ニューロン1610を介して入力される、曲げられた曲線またはトラジェクトリを認識することが可能であることに注意されたい。ここで、神経網は、入力ニューロン1610を介して入力される神経活動パターンにおいてトラジェクトリの時点および形状の双方を決定することが(トレーニング後に)可能であり、活性化されている出力ニューロンは、この情報を示す。この結果、トラジェクトリの形状および時間についてのその情報は、出力ニューロンが活性化されている場合にその事実によって符号化される。
図17は、最終的に、神経網1600をトレーニングするために用いられる例示的なトレーニングパターンの図解図を示す。その結果、トレーニング後、神経網1600は、対応して直線状にされまたは曲げられたコースを、トラジェクトリとみなすことが可能である。
このように、ヒューベル・ウィーゼル・ネットワーク1600が神経活動パターンにおいてトラジェクトリを認識するために非常に適切であることに注意されたい。このために、神経活動パターンは、ヒューベル・ウィーゼル・ネットワークの入力部1520、1522、1524に入力されるだけである。それから、比較器1570、1572、1574の出力部1580、1582、1584において、信号は、トラジェクトリの形状および時間的位置についての表示を含んで利用可能である。出力信号1580、1582、1584は、もちろん、必要に応じて、それから例えばトラジェクトリについての時間情報を直接見ることができるように、解釈しやすい形式でもたらすことができる。そして、時間情報は、有利な分析表示を形成する。
それとは別に、神経活動パターンにおけるトラジェクトリの認識に非常によく適している図17に示される神経網1700は、A.Brueckmann、S.KlefenzおよびA.Wuenscheの論文「2次元−傾斜および正弦波形状検出のための神経網」(CIST International Scientific Journal of Computing,ISSN 1727―6209)に、詳細に記載されている。
神経活動パターンの処理がいわゆるハフ変換(米国特許第3,069,654号参照)の適用によって好ましくは実行されることにさらに注意されたい。ハフ変換は、スペース/時間パターンにおいて連続したトラジェクトリを効果的な方法で認識することができる。このように、ハフ変換は、本発明の範囲内のように、音声信号から分析表示を抽出するために特に適しており、聴覚モデルの神経活動パターンにおけるトラジェクトリは、さらなる分析のために有利に用いることができる音声信号の特性情報を表すことが見出されている。
また、他の周知の方法が、神経活動パターンにおけるトラジェクトリを認識するためにパターン認識に用いることができることにさらに注意されたい。ここで、特に有利なそのような方法は、それが見出されているように、曲線の認識を可能にするように用いることができ、神経活動パターンのトラジェクトリが典型的に双曲線形状を含む。ここで、複数の神経のための神経活動パターンが時間とともに結果として二次元パターンになることが考慮され、いくつかの神経線維上の第1の方向に沿って、信号は、例えば強度分布または数値によって、それぞれ表されるが、第2の方向において、時間的展開が示される。このように、神経活動パターンの時間経過のための説明の典型的な方法は、例えば、示された蝸牛図(蝸牛電気図)に類似させることができる。
このように、曲線を認識することができるどのようなパターン認識アルゴリズムも使用することができる。しかしながら、ハフ変換の適用は、ハフ変換が曲線の認識に特に適しているので、特に有利であることが見出されている。それとは別に、出力ニューロン(または比較器それぞれ)の閾値または応答感度が、それぞれ、最適に設定されてさえいれば、配列1600または1700におけるハフ変換を実行する場合、さらに、いくつかの密接に隣接されたトラジェクトリが存在する場合に、良好な認識結果を達成できることに注意されたい。
ハフ変換(または他のパターン認識オペレーション)に従って、トラジェクトリの長さを認識することがさらに可能であり、トラジェクトリの時点および形状についての情報とは別にさらに次の分析のための情報が利用できる。
それとは別に、神経活動パターンの時間説明上の二次元パターン比較は、連続したトラジェクトリの時間的位置を表す一連の時間情報を得るために実行できることに注意されたい。
音声信号の分析表示に基づいてパターン認識を実行することが有利であることにさらに注意されたい。本発明によれば、2つの特に有利な分析表示が存在する。正確には、神経活動パターンが音声信号の分析に特に有利に用いることができることが見出されている。さらに、神経活動パターンに含まれるトラジェクトリについての時間情報を含んでいる表示も、音声信号の分析に特に適している。神経活動パターンと神経活動パターンに含まれるトラジェクトリについての情報を含んでいる時間表示との双方は、以下において音声信号表現と呼ばれる。
図18は、音声信号を識別する手段の概略図を示す。図18に示される手段は、全体が1800によって示される。この手段は、音声信号データベース1820に結合される比較手段1810を含む。さらに、比較手段1810には、音声信号表現1830が供給される。音声信号表現1830と音声信号データベースに含まれる比較音声信号表現とに基づいて、比較手段1810は、音声信号表現1830が音声信号データベースに記憶される少なくとも1つの比較音声信号表現1840に対する類似性を含むかどうかについてのステートメントを含んでいる比較結果1850を生成する。比較結果1850は、もちろん、比較音声信号表現1840に対して音声信号表現1830が最も大きな類似性を有するという事実についてのステートメントを含むことができる。
比較手段1810は、2つの音声信号表現を比較するためのどのような装置も含むことができる。例えば、数理的方法に基づいて音声信号表現および比較音声信号表現の間の数理的距離を決定できる手段を用いることが可能である。さらに、神経網は、音声信号表現1830と比較音声信号表現1840とを比較するために用いることができる。神経網は、例えば、複数の音声信号表現によりトレーニングできる。
音声信号データベース1820が例えば音楽を示す複数の比較音声信号表現を含むことができることに注意されたい。音声信号データベースが、個々の音、例えば母音または子音を示すだけの比較音声信号表現を含むことも、さらに同様に可能である。このように、音声信号を識別する示された手段1800は、音声認識のために効果的に用いることもでき、選択された音声信号表現は、そのような応用に特に適している。
図19は、音声信号表現から音声信号フィンガープリントを抽出する手段の概略図を示す。音声信号フィンガープリントを抽出する図19に示される手段は、全体が1900によって示される。ここで、音声信号表現1910は、特徴抽出のための手段1920に供給される。特徴抽出のための手段1920は、音声信号表現1910に基づいて、音声信号フィンガープリント1930を生成する。そして、音声信号フィンガープリント1930は、音声信号データベース1940に好ましくは供給される。
特徴抽出のための手段1920は、例えば、音声信号表現1910から音程および/またはリズムを抽出するために実施することができる。音声信号表現が神経活動パターンである場合、例えば、音程は、神経活動パターンに最大活動を含んでいるそれらの神経線維を識別することによって抽出できる。神経活動パターンにおいて最も高い活動を含んでいる神経線維は、神経線維が典型的に好ましい周波数を含むように、実際に音程のための正しい尺度である。さらに、変化(または対応する変化時点それぞれ)は、音声信号のリズムを決定するために、神経活動パターンに用いることができる。神経活動パターンにおける変化の認識は、神経活動パターンの連続した瞬時値の間で、距離尺度、例えば数学的ノルムを形成することによって、比較的に簡単に可能である。このように、重要な変化は、距離尺度が所定値を超える場合に認識できる。
また、パターン認識のための方法は、音声信号フィンガープリントを生成するために、音声信号表現1910に適用することができる。このように、音声信号フィンガープリントは、例えば、音声信号の音程および/またはリズムについての混合情報を含むことができる。
このように、音声信号表現1910が、さらに、神経活動パターンに含まれるトラジェクトリに関する時間情報を含んでいる表現である場合、特徴抽出は、特に簡単な方法で可能である。例えば、連続したトラジェクトリの間の時間距離が算出され、そして、それは音声信号のための特性である。
さらに、トラジェクトリの形状が特に重要な特徴であることが見出されている。このように、音声信号フィンガープリントにおいて特別な形状のトラジェクトリに関する情報を記憶することが可能であり、それによって、音声信号フィンガープリント1930のデータ量は、低減できる。これは、再び、データベースに音声信号フィンガープリントの効率的な記憶を可能にする。
いくつかのトラジェクトリが特徴形状および特徴距離を含む音声事象に典型的に関連していることが発見されている。このように、例えば、特徴抽出1920において、一群の複数のトラジェクトリが評価され、そこで、1つのシンボルが一群のトラジェクトリにそれぞれ関連付けられる。それから、連続した群のトラジェクトリに属する一連のシンボルは、音声信号フィンガープリントを形成し、データベースに記憶されることができる。一群のトラジェクトリの分析に基づいて、さらに、音声認識は、母音および子音がそれぞれ(トラジェクトリの距離および形状に関して)特性トラジェクトリパターンを含み認識できるように実現できる。
結果として、本発明は聴覚系の第1段階の神経生理学的初期化モデルを提供すると言うことができる。このモデルは、蝸牛モデリング、不動毛運動方程式の調和振動モデルおよび内有毛細胞の神経伝達物質小胞放出(IHC neurotransmitter vesicle release)のためのモデルからなる。さらに、本発明のモデルは、シナプス後活動電位の生成のためのスペシフィケーションを含む。好ましくは、バネ剛性定数値がラスターフォース電子顕微鏡を用いて決定される不動毛の説明のために用いられることに注意されたい。本発明のモデルは、例えば、蝸牛移植が聴覚神経を刺激するように、蝸牛移植のシミュレーションを最適化するために役立つ。
装置が神経生理学方法で適合されることは、本発明の主な利点である。さらに、有利な方法において、神経伝達物質小胞の確率論的な放出が考慮される。基底膜速度を不動毛運動に結合するために、本発明の振動子モデルが用いられ、不動毛運動のための運動方程式が最適化される。不動毛振動のための力の方程式または運動の方程式は、それぞれ、次式で示される。
Figure 0004767316
Figure 0004767316
活動電位のシナプス後生成は、同様にモデル化される(E.NeherおよびT.Sakabaの「ノイズから推定される量子的放出パラメータ」、J.Neuroscience、2001年12月15日、21(24):9638−9654参照)。
言い換えれば、本発明は、音声信号の分析のための装置を示し、内耳における音の機械的な転換から、小骨を通しての伝達、蝸牛の流体力学的な振動刺激、内有毛細胞における機械・電気変換、聴覚神経の螺旋神経節細胞のパルススパイクの生成までの、聴覚系の第1段階が、モデル化される。
本発明の特別な効果は、基底膜刺激のために採用されるモデルの使用である。更に、本発明において、内有毛細胞の特に有利なモデリングが使用される。本発明によるシナプス間隙の神経伝達物質の放出は、小胞において詰め込まれて行われる。本発明は、基底膜および不動毛の動きの間の結合の特に有利なモデルを更に含み、調和振動子のモデルが使用された。本発明の更なる効果は、神経生理学的なイニシャライズにもある。バネ剛性定数のために、IHCテーブル値は、マウスに対して仮定された。シナプス後スパイク生成は、拡散/不応モデルを用いている本発明によって生じる。したがって、本発明は、極めて現実的に聴覚処理を再生して、すなわち、これを生成して、分析することが可能である。
これとは別に、本発明は蝸牛進行波の拡大のための装置を提供する点に留意する必要がある。対応する装置は、基底膜に沿って遅延トラジェクトリのための周波数依存性算定式に基づく。同式は、グリーンバーグの研究に基づく。トラジェクトリの遅延は、結果として、聴覚モデルの基底膜上のインパルスの伝達の波群の速さになる。低周波が、基底膜の終端で記録されるため、低周波は、結果として、基底膜上の時間―遅延応答になる。したがって、低周波に対して、基底膜のランタイム遅れは、効果的である。
曲線状の足跡またはトラジェクトリは、それぞれ、ハフ変換を用いて、有利に決定される。したがって、ハフ変換は、円、楕円または線を認識するために、非常に適しており、さらに、他の線形の曲線は、ハフ変換を用いて認識される。これとは別に、ヒューベル・ウィーゼル理論によるタイミング・フィード・フォワード・ネットワークが、異なる周波数の棒状の、または正弦曲線の音声信号のようなパターンを学習することに注意されたい。言い換えると、ヒューベル・ウィーゼル・ネットワークは、記載されている遅延線方法により、自動構造化および自己編成型方法のハフ変換を学習することができる。
本発明の特別な発見は、ハフ変換が、並行パルス・スパイク列から情報を得るための聴覚モデルの聴覚神経と直接結合されるということである。言い換えれば、ハフ変換は、並行パルス・スパイク列を処理するために、聴覚神経に直接的に接続される。ここで、ハフ変換は、遅延トラジェクトリを直線化し、信号形状(湾曲)更にはトラジェクトリの発生時点を検出する。ハフ変換において、データは、いくつかの段階を通して連続的に伝えられる。他の分析法とは対照的に、時間ウィンドウ機能は、ここでは必要ではない。
言い換えると、本発明は、内耳における機械的な音の変換、小骨を通じての伝送、蝸牛の流体力学的な振動刺激、聴覚神経の螺旋神経節細胞におけるパルス・スパイクの生成までの内有毛細胞の機械・電気変換から、聴覚系の第一段階をモデル化する。あらゆる音声信号は、時間とともに示される二次元の基底膜速度プロファイルを生成し、基底膜は、好ましくは、n個のセクションに分けられる。ここで、クリック・インパルスは、基底膜上の進行波運動を生成する。正弦波刺激信号の聴覚神経線維の時間遅れ(AN線維時間遅れ)の遅延トラジェクトリは、周波数依存性であって、グリーンバーグの同式(da=1000/fi+2ms)に従って算出される。例えば、母音を含んでいる音声信号は、遅延トラジェクトリの束によって与えられ、遅延トラジェクトリは、それぞれ周波数性依存の形状を含む。
この結果、本発明は、遅延トラジェクトリを検出することを可能にする。ここで、好ましくは、正弦波パターン、または直線の検出をそれ自身で学習することができる独創的なヒューベル・ウィーゼル神経シミュレータが用いられる。対応するヒューベル・ウィーゼル神経シミュレータは、好ましくは、音声信号に基づいて分析信号を生成するための発明の装置において有利に使用できる並行ハフ変換を学習することができる。
発明の方法において、遅延トラジェクトリは、並行ハフ変換によって決定され、トラジェクトリが、これによって、現在の信号形状を確認するために認識されるのがどの時かを指し示される。直接神経活動パターンからのハフ変換の発明の使用において、サイズ―形状―イメージは、一段階において生成される。発明の方法において、音声信号のさらなる分析は、ハフ―スペースにおいて生じさせることができる。
発明の装置は、発明の方法を明確にする点にも更に注意されたい。該方法は、いかなる形であれ実行され、電子算出手段は、特に発明の方法を実行することに適している。
換言すれば、本発明の方法および本発明の装置は、ハードウェアまたはソフトウエアで実施することができる。この実施は、対応する方法が実行されるように、プログラム可能なコンピュータシステムと協働する、電子的に読み取り可能な制御信号を有する、例えばフロッピー(登録商標)ディスク、CD、DVDまたはフラシュメモリーなどのデジタル記憶媒体上で実行することができる。一般に、本発明は、コンピュータプログラム製品がコンピュータ上で実行されるときに、機械で読み取り可能なキャリアに記憶された本発明の方法を実行するためのプログラムコードを有するコンピュータプログラム製品にも存在する。したがって、換言すると、本発明は、コンピュータプログラムがコンピュータ上で実行されるときに、この方法を実行するためのプログラムコードを有するコンピュータプログラムとして実現することができる。
このように、本発明は、ハフ変換を用いて基底膜振動パターンの処理を示す。
本発明の第1実施形態に従い、音声信号に基づいて音声信号の分析表示を評価するための本発明の方法のフローチャートを示す。 本発明の第1実施形態に従い、音声信号に基づいて神経伝達物質小胞発生を評価する発明の本方法のフローチャートを示す。 本発明の第1実施形態に従い、音声信号に基づいて基底膜運動を評価する本発明の方法のフローチャートを示す。 本発明の第1実施形態に従い、基底膜運動に基づいて不動毛の偏位を評価するための本発明の方法のフローチャートを示す。 本発明の第1実施形態に従い、不動毛の偏位に基づいて神経伝達物質小胞発生を評価するための本発明の方法のフローチャートを示す。 本発明の第1実施形態に従い、神経伝達物質小胞発生に基づいて神経線維の活動電位を評価する本発明の方法のブロック図を示す。 本発明の第2実施形態に従い、音声信号の分析表示を評価する本発明の方法のフローチャートを示す。 典型的な神経活性パターンの図解図を示す。 基底膜上にある差周波数の音声信号の伝播遅延の図解図を示す。 母音「i」の蝸牛電気図の図解図を示す。 母音「A」の蝸牛電気図、伝達物質の放出確率および伝達物質の小胞放出の図解図を示す。 本発明の第2実施形態に従い、音声信号の本発明の分析のための処理チェーンのグラフを示す。 本発明の第2実施形態に従い、神経活動パターンの本発明の処理装置のブロック図を示す。 本発明の第2の実施形態に従い、神経活動パターンの本発明の処理装置の信号の図解図を示す。 本発明の第2実施形態に従い、音声信号の分析表示の本発明の評価のためのヒューベル−ウィーゼル・ネットワークのブロック図を示す。 本発明の第2実施形態に従い、音声信号の分析表示の本発明の評価のためのヒューベル−ウィーゼル・ネットワークの概略図を示す。 ヒューベル−ウィーゼル・ネットワークをトレーニングするトレーニングパターンのグラフ表示を示す。 音声信号を識別する手段の概略図である。 音声信号成分を抽出する手段の概略図である。 聴覚末梢系の図解図である。 外耳の透過関数の図解図である。 中耳および展開された蝸牛の図解図である。 聴覚野の図解図である。 蝸牛断面の図解図である。 有毛細胞の概略図である。 聴覚末梢系の組織の図解図である。 人間の耳における信号伝達のメカニズムの図解図である。 人間の耳の基底膜の形状および刺激に対する基底膜の反応の図解図である。 内耳を説明するための拡張ツビッカーモデルの図解図である。 コルチ器官の図解図である。 有毛細胞の組織の図解図である。 有毛細胞における化学プロセスの図解図である。 間隔ピットの図解図である。

Claims (33)

  1. 音声信号の分析表示(760)を得るために、前記音声信号を分析するための装置(700)であって、
    前記音声信号(710)に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出する手段(720)と、
    連続したトラジェクトリ(740,750)の時間的な位置を示す分析表示(760)として一連の時間情報(t1,t2)を得るために神経活動パターンを処理する手段(730)とを含み、
    トラジェクトリ(740,750)は、音声信号(710)における同一の事象に基づく異なる神経線維(NF1,NF2,NF3,NF4,NF5)上の活動インパルスを含み、
    前記神経活動パターンを処理する手段(730)は、時間とともに前記神経活動パターンの変形された二次元表示を得るために時間とともに前記神経活動パターンの二次元表示を徐々に変形させ、前記神経活動パターンを処理する手段(730)が、時間とともに前記神経活動パターンの二次元表示を徐々に変形させるように実施されることにより、前記神経活動パターンにおける曲線状のトラジェクトリが徐々の変形により徐々に直線状にされ、ほぼ直線状のラインが時間とともに前記神経活動パターンの変形された二次元表示に含まれるときを認識し、ほぼ直線状のラインを前記トラジェクトリと認識し、トラジェクトリの時間的な位置を測定し、音声信号の分析表示として前記トラジェクトリに属する時間情報を提供するように実施され
    前記神経活動パターンを処理する手段(730)は、前記神経活動パターンを複数の信号(1320,1322,1324;1520,1522,1524)の形で並行して受信し、前記信号(1320,1322,1324;1520,1522,1524)を直列に接続された複数の段階(1310,1312,1314;1530,1532,1534)を通って異なる速さで並行して送るために実施される曲線認識手段(1300,1500,1600)を含み、少なくとも1つの所定の段階(1310,1312,1314;1530,1532,1534)は、直線状またはほぼ直線状のラインの存在を示す、少なくとも所定の数の信号が所定の段階において同時に活性化されるときを認識するために実施される閾値認識手段(1560,1570,1562,1572,1564,1575)を含む、装置。
  2. 神経活動パターン(730)は、聴覚モデルの一群の神経線維の活動を示す、請求項1に記載の装置。
  3. 時間情報(t1,t2)は、トラジェクトリ(740,750)の発生時点を示す、請求項1または請求項2に記載の装置。
  4. 前記音声信号における同様の事象により条件付けられた活動インパルスが所定の最低数より大きい数の神経線維に与えられたときに、トラジェクトリ(740,750)を認識するように実行される、請求項1ないし請求項3のいずれかに記載の装置。
  5. 音響事象として音声信号の中の母音、子音または音の始点を認識するために実施される、請求項1ないし請求項4のいずれかに記載の装置。
  6. 前記聴覚モデルの基底膜上の進行波を示す神経活動パターンにおけるトラジェクトリを認識するために行われる、請求項1ないし請求項5のいずれかに記載の装置。
  7. トラジェクトリは、前記聴覚モデルの前記基底膜上の進行波に関連した一群の隣接する神経線維における神経活動パターンと定義される、請求項1ないし請求項6のいずれかに記載の装置。
  8. トラジェクトリは、一群の隣接する神経線維上の活動インパルスの発生によって定義され、前記活動インパルスは、進行波による隣接する神経線維の刺激を示す、請求項1ないし請求項7のいずれかに記載の装置。
  9. 前記時間情報は、前記トラジェクトリの時間的な始点を示す、請求項1ないし請求項8のいずれかに記載の装置。
  10. 所定のトラジェクトリの時間的な始点は、所定のトラジェクトリに関連する最初の活動インパルスが神経線維に影響を与える時点である、請求項9に記載の装置。
  11. 神経活動パターンを処理するための手段(730)は、トラジェクトリ(740,750)の時間的な位置を定義し、前記音声信号の分析表示としてトラジェクトリ(740,750)に属する時間情報(t1,t2)を提供するために、時間とともに神経活動パターンによって形成される二次元表示において、トラジェクトリ(740,750)として直線状または曲線状のパターンを認識するように実施されるパターン認識手段を含む、請求項1ないし請求項10のいずれかに記載の装置。
  12. パターン認識手段は、前記分析表示の部分として前記トラジェクトリの形状に関する情報を提供するように実施される、請求項11に記載の装置。
  13. 前記トラジェクトリの形状に関する情報は、前記トラジェクトリの湾曲についての情報を含む、請求項12に記載の装置。
  14. パターン認識手段は、直線状または双曲線状のトラジェクトリを認識するように定義される、請求項11ないし請求項13のいずれかに記載の装置。
  15. パターン認識手段は、前記分析表示の部分として前記トラジェクトリの長さに関する情報を提供するように実施される、請求項11ないし請求項14のいずれかに記載の装置。
  16. 前記神経活動パターンを処理する手段(730)は、トラジェクトリを認識し、トラジェクトリの時間的な位置を示す時間情報を得るために、時間とともに神経活動パターンを示す二次元表示と、少なくとも1つの比較パターンとを比較するように実施されるパターン比較手段を含む、請求項1ないし請求項15のいずれかに記載の装置。
  17. 前記比較パターンは、直線または双曲線状の曲線である、請求項16に記載の装置。
  18. 記曲線状のトラジェクトリを直線状にするために必要な複数の湾曲工程は、前記曲線状のトラジェクトリの湾曲に依存し、前記曲線状のトラジェクトリを直線状にするために必要な複数の工程は、前記トラジェクトリのオリジナルの形状のステイトメントを含む、請求項1ないし請求項17のいずれかに記載の装置。
  19. 少なくとも1つの段階(1310,1312,1314;1530,1532,1534)は、段階を通して信号を進めるときにそれぞれの信号を異なる程度に遅延させるように実施される、請求項1ないし請求項18のいずれかに記載の装置。
  20. 前記曲線認識手段(1300;1500;1600)は、神経網である、請求項1ないし請求項19のいずれかに記載の装置。
  21. 前記神経活動パターンを処理する手段は、ハフ変換の評価に基づいてトラジェクトリを認識するために実施される、請求項1ないし請求項20のいずれかに記載の装置。
  22. 前記神経活動パターンを処理する手段は、並列ハフ変換を行う手段を含む、請求項1ないし請求項21のいずれかに記載の装置。
  23. さらに、時間情報(t1,t2)に基づいて、音声信号成分を分析する手段(1800)を含む、請求項1ないし請求項22のいずれかに記載の装置。
  24. 前記音声信号成分を分析する手段は、比較結果としての音声信号成分に関する情報(1850)を提供するために、時間情報(t1,t2)とデータベース(1820)に存在する参照時間情報(1840)とを比較するように実施される比較手段(1810)を含む、請求項23に記載の装置。
  25. 音声信号成分を分析する手段は、それぞれの連続的なトラジェクトリに属する時間情報に基づいて、母音または子音を認識するために実施される、請求項23または請求項24に記載の装置。
  26. 音声信号成分を分析する手段は、さらに、前記トラジェクトリの形状および/または湾曲に関する情報を用いるように実施される、請求項23ないし請求項25のいずれかに記載の装置。
  27. 音声信号成分を分析する手段は、前記時間情報に基づいて、前記音声信号のリズムに関する情報を測定するように実施され、前記音声信号のリズムに関する情報は、前記音声信号の成分についての表示を示す、請求項23ないし請求項26のいずれかに記載の装置。
  28. 音声信号の分析表示(760)を得るために、前記音声信号を分析するための装置(700)であって、
    前記音声信号(710)に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出する手段(720)と、
    連続したトラジェクトリ(740,750)の時間的な位置を示す分析表示(760)として一連の時間情報(t1,t2)を得るために神経活動パターンを処理する手段(730)とを含み、
    トラジェクトリ(740,750)は、音声信号(710)における同一の事象に基づく異なる神経線維(NF1,NF2,NF3,NF4,NF5)上の活動インパルスを含み、
    前記神経活動パターンを処理する手段(730)は、前記神経活動パターンを複数の信号(1320,1322,1324;1520,1522,1524)の形で並行して受信し、前記信号(1320,1322,1324;1520,1522,1524)を直列に接続された複数の段階(1310,1312,1314;1530,1532,1534)を通って異なる速さで並行して送るために実施される曲線認識手段(1300,1500,1600)を含み、少なくとも1つの所定の段階(1310,1312,1314;1530,1532,1534)は、少なくとも所定の数の信号が所定の段階において同時に活性化されるときを認識するために実施される閾値認識手段(1560,1570,1562,1572,1564,1575)を含む、装置。
  29. 音声信号の分析表示を得るために、前記音声信号を分析するための方法であって、
    前記音声信号に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出するステップと、
    連続したトラジェクトリの時間的な位置を示す分析表示として一連の時間情報を得るために神経活動パターンを処理するステップとを含み、
    トラジェクトリは、音声信号における同一の事象に基づく異なる神経線維上の活動インパルスを含み、
    前記神経活動パターンを処理するステップは、
    時間とともに前記神経活動パターンの変形された二次元表示を得るために時間とともに前記神経活動パターンの二次元表示を徐々に変形させるステップであって、時間とともに前記神経活動パターンの二次元表示が徐々に変形して、前記神経活動パターンにおける曲線状のトラジェクトリが徐々の変形により徐々に直線状にされるステップと、
    ほぼ直線状のラインが時間とともに前記神経活動パターンの変形された二次元表示に含まれるときを認識するステップとを含み、
    前記神経活動パターンは複数の信号(1320,1322,1324;1520,1522,1524)の形で並行して受信され、
    前記信号(1320,1322,1324;1520,1522,1524)は直列に接続された複数の段階(1310,1312,1314;1530,1532,1534)を通って異なる速さで並行して送られ、
    直線状またはほぼ直線状のラインの存在を示す、少なくとも所定の数の信号が所定の段階において同時に活性化されるときが認識され、さらに
    ほぼ直線状のラインをトラジェクトリと認識するステップと、
    前記トラジェクトリの時間的な位置を測定するステップと、
    音声信号の分析表示として前記トラジェクトリに属する時間情報を供給するステップとを含む、方法。
  30. 音声信号の分析表示を得るために、前記音声信号を分析するための方法であって、
    前記音声信号に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出するステップと、
    連続したトラジェクトリの時間的な位置を示す分析表示として一連の時間情報を得るために神経活動パターンを処理するステップとを含み、
    トラジェクトリは、音声信号における同一の事象に基づく異なる神経線維上の活動インパルスを含み、
    前記神経活動パターンを処理するステップは、
    前記神経活動パターンを複数の信号(1320,1322,1324;1520,1522,1524)の形で並行して受信するステップと、
    直列に接続された複数の段階(1310,1312,1314;1530,15332,1534)を通して前記信号(1320,1322,1324;1520,1522,1524)を異なる速さで送るステップと、
    少なくとも所定の数の信号が所定の段階で同時に活性化されるときを認識するステップとを含む、方法。
  31. 音声信号成分上の情報を得るために、前記音声信号を分析するための装置(700)であって、
    前記音声信号(710)に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出する手段(720)と、
    連続したトラジェクトリ(740,750)の時間的な位置を示す分析表示(760)として一連の時間情報(t1,t2)を得るために神経活動パターンを処理する手段(730)とを含み、
    トラジェクトリ(740,750)は、音声信号(710)における同一の事象に基づく異なる神経線維(NF1,NF2,NF3,NF4,NF5)上の活動インパルスを含み、
    装置(700)は、時間情報(t1,t2)に基づいて、音声信号成分を分析する手段(1800)を含み、
    前記音声信号成分を分析する手段は、比較結果としての音声信号成分に関する情報(1850)を提供するために、時間情報(t1,t2)とデータベース(1820)に存在する参照時間情報(1840)とを比較するように実施される比較手段(1810)を含み、
    前記神経活動パターンを処理する手段(730)は、前記分析表示の部分として前記トラジェクトリの形状に関する情報を提供するように実施され、
    前記トラジェクトリの形状に関する情報は、前記トラジェクトリの湾曲についての情報を含み、
    音声信号成分を分析する手段は、前記トラジェクトリの湾曲に関する情報を用いるように実施される、装置。
  32. 音声信号成分上の情報を得るために、音声信号を分析する方法であって、
    前記音声信号に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出するステップと、
    連続したトラジェクトリの時間的な位置を示す分析表示として一連の時間情報を得るために神経活動パターンを処理するステップとを含み、
    トラジェクトリは、音声信号における同一の事象に基づく異なる神経線維上の活動インパルスを含み、
    さらに、時間情報に基づいて、音声信号成分を分析するステップを含み、
    前記音声信号成分を分析するステップは、比較結果としての音声信号成分に関する情報(1850)を提供するために、時間情報(t1,t2)とデータベース(1820)に存在する参照時間情報(1840)とを比較するステップを含み、
    前記トラジェクトリの形状に関する情報は、前記分析表示の部分として提供され、
    前記トラジェクトリの形状に関する情報は、前記トラジェクトリの湾曲に関する情報を含み、
    前記トラジェクトリの湾曲に関する情報は、音声信号成分を分析するときに用いられる、方法。
  33. コンピュータ上で実行される際に、請求項29、請求項30または請求項32の方法を実行するためのプログラムコードを有する、コンピュータプログラム。
JP2008519813A 2005-06-29 2006-06-09 音声信号を分析する装置、方法、およびコンピュータ・プログラム Expired - Fee Related JP4767316B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
DE102005030327A DE102005030327A1 (de) 2005-06-29 2005-06-29 Vorrichtung, Verfahren und Computerprogramm zur Analyse eine Audiosignals
DE102005030327.7 2005-06-29
US11/172,605 US7996212B2 (en) 2005-06-29 2005-06-29 Device, method and computer program for analyzing an audio signal
US11/172,605 2005-06-29
PCT/EP2006/005560 WO2007000231A1 (de) 2005-06-29 2006-06-09 Vorrichtung, verfahren und computerprogramm zur analyse eines audiosignals

Publications (2)

Publication Number Publication Date
JP2008545170A JP2008545170A (ja) 2008-12-11
JP4767316B2 true JP4767316B2 (ja) 2011-09-07

Family

ID=36972689

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008519813A Expired - Fee Related JP4767316B2 (ja) 2005-06-29 2006-06-09 音声信号を分析する装置、方法、およびコンピュータ・プログラム

Country Status (6)

Country Link
US (1) US7996212B2 (ja)
EP (1) EP1896124B1 (ja)
JP (1) JP4767316B2 (ja)
AU (1) AU2006264029B2 (ja)
DE (1) DE102005030327A1 (ja)
WO (1) WO2007000231A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8535236B2 (en) * 2004-03-19 2013-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for analyzing a sound signal using a physiological ear model
DE102006030276A1 (de) * 2006-06-30 2008-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines gefilterten Aktivitätsmusters, Quellentrenner, Verfahren zum Erzeugen eines bereinigten Audiosignals und Computerprogramm
US20080306098A1 (en) * 2006-11-06 2008-12-11 Mutz Mitchell W Pharmacokinetics of protease inhibitors and other drugs
US20090054334A1 (en) * 2007-05-23 2009-02-26 Mutz Mitchell W Combinatorial improvement of bifunctional drug properties
US20100284993A1 (en) * 2007-10-24 2010-11-11 Mutz Mitchell W Enhancing the Efficacy of Anti-Infective Therapeutics
EP2329399A4 (en) * 2008-09-19 2011-12-21 Newsouth Innovations Pty Ltd METHOD FOR ANALYZING A TONE SIGNAL
US10368785B2 (en) 2008-10-24 2019-08-06 East Carolina University In-ear hearing test probe devices and methods and systems using same
US8507781B2 (en) * 2009-06-11 2013-08-13 Harman International Industries Canada Limited Rhythm recognition from an audio signal
WO2011094611A2 (en) * 2010-01-29 2011-08-04 Circular Logic, LLC Learning and auditory scene analysis in gradient frequency nonlinear oscillator networks
WO2012002467A1 (ja) * 2010-06-29 2012-01-05 Kitazawa Shigeyoshi 音楽情報処理装置、方法、プログラム、人工内耳用音楽情報処理システム、人工内耳用音楽情報製造方法及び媒体
WO2014107213A2 (en) * 2012-10-16 2014-07-10 The Florida International University Board Of Trustees Neural interface activity simulator
WO2015057661A1 (en) * 2013-10-14 2015-04-23 The Penn State Research Foundation System and method for automated speech recognition
JP6908243B2 (ja) * 2016-02-01 2021-07-21 国立大学法人徳島大学 生体音響抽出装置、生体音響解析装置、生体音響抽出プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器
US11099075B2 (en) 2017-11-02 2021-08-24 Fluke Corporation Focus and/or parallax adjustment in acoustic imaging using distance information
US11209306B2 (en) 2017-11-02 2021-12-28 Fluke Corporation Portable acoustic imaging tool with scanning and analysis capability
CN109753971B (zh) * 2017-11-06 2023-04-28 阿里巴巴集团控股有限公司 扭曲文字行的矫正方法及装置、字符识别方法及装置
EP3827227A1 (en) 2018-07-24 2021-06-02 Fluke Corporation Systems and methods for projecting and displaying acoustic data
US11800301B2 (en) 2019-06-09 2023-10-24 Universiteit Gent Neural network model for cochlear mechanics and processing

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6011899A (ja) * 1983-04-26 1985-01-22 フエアチアイルド・カメラ・アンド・インストルメント・コ−ポレ−シヨン 聴覚応答情報を模倣する方法及び装置
JPS63259695A (ja) * 1987-04-03 1988-10-26 アメリカン テレフォン アンド テレグラフ カムパニー 知覚分析方法
US5381512A (en) * 1992-06-24 1995-01-10 Moscom Corporation Method and apparatus for speech feature recognition based on models of auditory signal processing
JP2004500788A (ja) * 2000-06-19 2004-01-08 コックレア リミティド 移植蝸牛刺激装置のための音声処理装置
WO2005013870A1 (ja) * 2003-08-07 2005-02-17 Hamamatsu Foundation For Science And Technology Promotion 人工内耳の音声変換方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4980918A (en) 1985-05-09 1990-12-25 International Business Machines Corporation Speech recognition system with efficient storage and rapid assembly of phonological graphs
GB8720387D0 (en) * 1987-08-28 1987-10-07 British Telecomm Matching vectors
US5388182A (en) 1993-02-16 1995-02-07 Prometheus, Inc. Nonlinear method and apparatus for coding and decoding acoustic signals with data compression and noise suppression using cochlear filters, wavelet analysis, and irregular sampling reconstruction
EP0902999A1 (en) 1996-06-04 1999-03-24 Murphy, Timothy M. A device for transferring electromagnetic energy between primary and secondary coils
US6064913A (en) 1997-04-16 2000-05-16 The University Of Melbourne Multiple pulse stimulation
ATE248459T1 (de) 1997-05-01 2003-09-15 Med El Elektromed Geraete Gmbh Verfahren und gerät für eine digitale filterbank mit geringem stromverbrauch
US6535153B1 (en) 1999-02-04 2003-03-18 Med-El Electromedizinische Gerate Ges.M.B.H. Adaptive sigma-delta modulation with one-bit quantization
CA2382039C (en) 1999-07-21 2009-12-15 Med-El Elektromedizinische Gerate Gmbh Multichannel cochlear implant with neural response telemetry
WO2001013991A1 (en) 1999-08-26 2001-03-01 Med-El Elektromedizinische Geräte GmbH Electrical nerve stimulation based on channel specific sampling sequences
AU782132B2 (en) 2000-01-31 2005-07-07 Med-El Elektromedizinische Geraete Gmbh Cochlear implant system partially insertable in the external ear
DE10117871C1 (de) * 2001-04-10 2002-07-04 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Extrahieren einer Signalkennung, Verfahren und Vorrichtung zum Erzeugen einer Datenbank aus Signalkennungen und Verfahren und Vorrichtung zum Referenzieren eines Such-Zeitsignals
CA2476967C (en) 2002-03-28 2011-10-11 Clemens M. Zierhofer A system and method for adaptive sigma-delta modulation
CA2452945C (en) 2003-09-23 2016-05-10 Mcmaster University Binaural adaptive hearing system
US8535236B2 (en) 2004-03-19 2013-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for analyzing a sound signal using a physiological ear model

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6011899A (ja) * 1983-04-26 1985-01-22 フエアチアイルド・カメラ・アンド・インストルメント・コ−ポレ−シヨン 聴覚応答情報を模倣する方法及び装置
JPS63259695A (ja) * 1987-04-03 1988-10-26 アメリカン テレフォン アンド テレグラフ カムパニー 知覚分析方法
US5381512A (en) * 1992-06-24 1995-01-10 Moscom Corporation Method and apparatus for speech feature recognition based on models of auditory signal processing
JP2004500788A (ja) * 2000-06-19 2004-01-08 コックレア リミティド 移植蝸牛刺激装置のための音声処理装置
WO2005013870A1 (ja) * 2003-08-07 2005-02-17 Hamamatsu Foundation For Science And Technology Promotion 人工内耳の音声変換方法

Also Published As

Publication number Publication date
DE102005030327A1 (de) 2007-01-04
AU2006264029A1 (en) 2007-01-04
JP2008545170A (ja) 2008-12-11
US20070005348A1 (en) 2007-01-04
EP1896124B1 (de) 2017-08-16
AU2006264029B2 (en) 2010-08-19
US7996212B2 (en) 2011-08-09
WO2007000231A1 (de) 2007-01-04
EP1896124A1 (de) 2008-03-12

Similar Documents

Publication Publication Date Title
JP4767316B2 (ja) 音声信号を分析する装置、方法、およびコンピュータ・プログラム
US11043210B2 (en) Sound processing apparatus utilizing an electroencephalography (EEG) signal
AU2006264080C1 (en) System, method and computer program for analysing an audio signal
US11800301B2 (en) Neural network model for cochlear mechanics and processing
US7366656B2 (en) Method apparatus and system for processing acoustic signals
Zaar et al. Predicting speech intelligibility in hearing-impaired listeners using a physiologically inspired auditory model
US20230156413A1 (en) Closed-loop method to individualize neural-network-based audio signal processing
JP4876133B2 (ja) 音声信号に基づく蝸牛インプラントのための制御信号を生成するための方法、装置およびコンピュータ・プログラム
Shamma Encoding sound timbre in the auditory system
Essaid et al. Advanced Artificial Intelligence Algorithms in Cochlear Implants: Review of Healthcare Strategies, Challenges, and Perspectives
JP4240878B2 (ja) 音声認識方法及び音声認識装置
Esposito et al. Some notes on nonlinearities of speech
JP4927166B2 (ja) フィルタ処理された活性パターンを生成するためのデバイスおよび方法、音源分割器、デバッグされた音声信号を生成するための方法およびコンピュータ・プログラム
Deepak et al. A convolutional neural-network model of human cochlear mechanics and filter tuning for real-time applications
Rattay et al. Speech sound representation in the auditory nerve: computer simulation studies on inner ear mechanisms
Leyla Neural response based speaker identification under noisy condition/Leyla Roohisefat
Yegnanarayanan A NEW MODEL OF HEARING AND ITS PERFORMANCE IN PITCH PERCEPTION (COCHLEAR MODELING, AUDITORY)
Roohisefat Neural Response Based Speaker Identification Under Noisy Condition
Finley Accounting for the phonetic value of nonspeech sounds
Froehlich Hearing Device with a Visualized Psychoacoustic Variable and Corresponding Method
Sewell A parametric framework for computational modelling of the auditory periphery
Lammert Austin Aguirre–Computer Science Hunter Lassard–Biomedical Engineering Aidan Pereira–Biomedical Engineering Jack Brazer–Biomedical Engineering
Vibrations et al. The Peripheral Auditory System: Transduction and Coding 125 Auditory Nerve 128 Central Auditory Nervous System 130
Henery et al. From Auditory Model to Perceptogram to Vowel Map

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101005

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110105

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110614

R150 Certificate of patent or registration of utility model

Ref document number: 4767316

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees