JP4767316B2 - 音声信号を分析する装置、方法、およびコンピュータ・プログラム - Google Patents
音声信号を分析する装置、方法、およびコンピュータ・プログラム Download PDFInfo
- Publication number
- JP4767316B2 JP4767316B2 JP2008519813A JP2008519813A JP4767316B2 JP 4767316 B2 JP4767316 B2 JP 4767316B2 JP 2008519813 A JP2008519813 A JP 2008519813A JP 2008519813 A JP2008519813 A JP 2008519813A JP 4767316 B2 JP4767316 B2 JP 4767316B2
- Authority
- JP
- Japan
- Prior art keywords
- trajectory
- audio signal
- neural activity
- activity pattern
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims description 141
- 238000000034 method Methods 0.000 title claims description 72
- 238000004590 computer program Methods 0.000 title claims description 9
- 230000001537 neural effect Effects 0.000 claims description 201
- 210000004126 nerve fiber Anatomy 0.000 claims description 103
- 210000002469 basement membrane Anatomy 0.000 claims description 92
- 238000004458 analytical method Methods 0.000 claims description 56
- 238000012545 processing Methods 0.000 claims description 50
- 230000002123 temporal effect Effects 0.000 claims description 38
- 230000000638 stimulation Effects 0.000 claims description 35
- 230000000694 effects Effects 0.000 claims description 24
- 238000013528 artificial neural network Methods 0.000 claims description 22
- 238000003909 pattern recognition Methods 0.000 claims description 15
- 238000011156 evaluation Methods 0.000 claims description 9
- 230000033764 rhythmic process Effects 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims 2
- 230000001143 conditioned effect Effects 0.000 claims 1
- 230000036982 action potential Effects 0.000 description 75
- 239000002858 neurotransmitter agent Substances 0.000 description 60
- 230000033001 locomotion Effects 0.000 description 47
- 210000004209 hair Anatomy 0.000 description 43
- 210000003477 cochlea Anatomy 0.000 description 42
- 210000004027 cell Anatomy 0.000 description 29
- 230000006870 function Effects 0.000 description 29
- 210000002569 neuron Anatomy 0.000 description 27
- 210000002768 hair cell Anatomy 0.000 description 25
- 210000000067 inner hair cell Anatomy 0.000 description 25
- 210000000860 cochlear nerve Anatomy 0.000 description 23
- 238000010586 diagram Methods 0.000 description 23
- 230000003111 delayed effect Effects 0.000 description 21
- 210000004379 membrane Anatomy 0.000 description 20
- 239000012528 membrane Substances 0.000 description 20
- 238000004364 calculation method Methods 0.000 description 18
- 210000000959 ear middle Anatomy 0.000 description 17
- 230000004044 response Effects 0.000 description 15
- 230000001242 postsynaptic effect Effects 0.000 description 14
- 230000000946 synaptic effect Effects 0.000 description 14
- 210000003027 ear inner Anatomy 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 12
- 210000003454 tympanic membrane Anatomy 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 11
- 239000011575 calcium Substances 0.000 description 11
- 230000001720 vestibular Effects 0.000 description 11
- 238000006073 displacement reaction Methods 0.000 description 10
- 239000000835 fiber Substances 0.000 description 9
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 8
- 229910052791 calcium Inorganic materials 0.000 description 8
- 210000000170 cell membrane Anatomy 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 238000005259 measurement Methods 0.000 description 8
- 230000000052 comparative effect Effects 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 210000000056 organ Anatomy 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000001953 sensory effect Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 210000000883 ear external Anatomy 0.000 description 6
- 230000003834 intracellular effect Effects 0.000 description 6
- 210000005036 nerve Anatomy 0.000 description 6
- 210000002985 organ of corti Anatomy 0.000 description 6
- 238000005192 partition Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 5
- 108090000862 Ion Channels Proteins 0.000 description 5
- 102000004310 Ion Channels Human genes 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 210000004556 brain Anatomy 0.000 description 5
- 229910001424 calcium ion Inorganic materials 0.000 description 5
- 230000001934 delay Effects 0.000 description 5
- 238000009792 diffusion process Methods 0.000 description 5
- 239000007943 implant Substances 0.000 description 5
- 150000002500 ions Chemical class 0.000 description 5
- 210000003061 neural cell Anatomy 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 229910001414 potassium ion Inorganic materials 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 108090000312 Calcium Channels Proteins 0.000 description 4
- 102000003922 Calcium Channels Human genes 0.000 description 4
- 108091006146 Channels Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 238000005452 bending Methods 0.000 description 4
- 210000000988 bone and bone Anatomy 0.000 description 4
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 210000002364 input neuron Anatomy 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000025350 membrane depolarization involved in regulation of action potential Effects 0.000 description 4
- 230000008035 nerve activity Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 210000004205 output neuron Anatomy 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000035939 shock Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000005653 Brownian motion process Effects 0.000 description 3
- 238000005537 brownian motion Methods 0.000 description 3
- 210000000613 ear canal Anatomy 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 238000005342 ion exchange Methods 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000028161 membrane depolarization Effects 0.000 description 3
- 230000003518 presynaptic effect Effects 0.000 description 3
- 230000008054 signal transmission Effects 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000003990 capacitor Substances 0.000 description 2
- 238000001311 chemical methods and process Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 210000000624 ear auricle Anatomy 0.000 description 2
- 208000016354 hearing loss disease Diseases 0.000 description 2
- 210000000653 nervous system Anatomy 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000035699 permeability Effects 0.000 description 2
- 239000011591 potassium Substances 0.000 description 2
- 229910052700 potassium Inorganic materials 0.000 description 2
- 230000000284 resting effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 210000001323 spiral ganglion Anatomy 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000700112 Chinchilla Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000237858 Gastropoda Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000003851 biochemical process Effects 0.000 description 1
- 210000005056 cell body Anatomy 0.000 description 1
- 210000004081 cilia Anatomy 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001054 cortical effect Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000004141 dimensional analysis Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 210000003094 ear ossicle Anatomy 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 210000003060 endolymph Anatomy 0.000 description 1
- 210000002388 eustachian tube Anatomy 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000036540 impulse transmission Effects 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 150000008040 ionic compounds Chemical class 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000003957 neurotransmitter release Effects 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000012567 pattern recognition method Methods 0.000 description 1
- 210000004049 perilymph Anatomy 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 230000036390 resting membrane potential Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 210000002832 shoulder Anatomy 0.000 description 1
- 210000003625 skull Anatomy 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910001415 sodium ion Inorganic materials 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012421 spiking Methods 0.000 description 1
- 230000008925 spontaneous activity Effects 0.000 description 1
- 210000001050 stape Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/41—Detecting, measuring or recording for evaluating the immune or lymphatic systems
- A61B5/414—Evaluating particular organs or parts of the immune or lymphatic systems
- A61B5/415—Evaluating particular organs or parts of the immune or lymphatic systems the glands, e.g. tonsils, adenoids or thymus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/12—Audiometering
- A61B5/121—Audiometering evaluating hearing capacity
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61N—ELECTROTHERAPY; MAGNETOTHERAPY; RADIATION THERAPY; ULTRASOUND THERAPY
- A61N1/00—Electrotherapy; Circuits therefor
- A61N1/18—Applying electric currents by contact electrodes
- A61N1/32—Applying electric currents by contact electrodes alternating or intermittent currents
- A61N1/36—Applying electric currents by contact electrodes alternating or intermittent currents for stimulation
- A61N1/3605—Implantable neurostimulators for stimulating central or peripheral nerve system
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61N—ELECTROTHERAPY; MAGNETOTHERAPY; RADIATION THERAPY; ULTRASOUND THERAPY
- A61N1/00—Electrotherapy; Circuits therefor
- A61N1/18—Applying electric currents by contact electrodes
- A61N1/32—Applying electric currents by contact electrodes alternating or intermittent currents
- A61N1/36—Applying electric currents by contact electrodes alternating or intermittent currents for stimulation
- A61N1/36036—Applying electric currents by contact electrodes alternating or intermittent currents for stimulation of the outer, middle or inner ear
- A61N1/36038—Cochlear stimulation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Pathology (AREA)
- Heart & Thoracic Surgery (AREA)
- Molecular Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Surgery (AREA)
- Biophysics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Vascular Medicine (AREA)
- Computational Linguistics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Neurosurgery (AREA)
- Neurology (AREA)
- Endocrinology (AREA)
- Radiology & Medical Imaging (AREA)
- Otolaryngology (AREA)
- Immunology (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Description
人間の聴覚末梢の生理学的環境は、一方ではこれまで十分に研究されてきており、複数の科学文書で調べることができる。したがって、ここでは後述の説明をさらに理解するために主要な基本的事実のみを示す。
外耳は到来音波を鼓膜に伝える漏斗状器官を形成する。耳介、耳管、および頭蓋骨と肩の形状が音声信号を変更する。
中耳(MO)の主な役割は、内耳内にある空気および液体の音響特性インピーダンスを適合させることにある。もし、音響伝達の場合のように、この機能が欠けている場合、到来する音響エネルギーの最大98%の聴覚障害が引き起こされる。健全な中耳の場合、信号強度の約60%を内耳に伝えることができる。これに必要な音圧の増幅は、鼓膜、3点の小骨(槌骨、砧骨、鐙骨)、および内耳への接触位置である前庭窓が結合して揃うことにより、可能となる。(図22参照)
1. 鼓膜ATと鐙骨敷板ASの面積比:
内耳は二部構成である。前庭器官は平衡システムの構成要素を代表する一方、蝸牛の構成は聴覚末梢の最終部分を形成する(図22参照)。解剖学的には、蝸牛は2回半巻いているカタツムリの殻と同じであり、蝸牛仕切構造により、外リンパ液を含む「前庭階」(SV)と「鼓室階」(ST)の2室に分けられる(図22参照)。
活動電位AP1、AP2、AP3が量子化されて発生すると、神経線維上の活動電位は、正確な時間的情報をもたらす。さらに、活動電位AP1、AP2、AP3の測定において、音声信号の分析表示を測定する従来の方法で考慮されない無駄時間(不応時間)が発生する。
さらに、原子の衝撃運動によって生じる不動毛に関する確率論的な力fstoch(t)をさらに考慮することが好ましい。言い換えると、不動毛の刺激におけるブラウン運動も考慮することが好ましい。したがって、不動毛の運動方程式は、以下の形式の調和振動子の非同次運動方程式となる。
前述のとおり、図示された運動方程式の評価は、時にはu(t)として参照される不動毛の偏位x(t)となる。
膜電位に応じた伝導率の時間パフォーマンスは、3つの微分方程式の手順によって説明される。
Claims (33)
- 音声信号の分析表示(760)を得るために、前記音声信号を分析するための装置(700)であって、
前記音声信号(710)に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出する手段(720)と、
連続したトラジェクトリ(740,750)の時間的な位置を示す分析表示(760)として一連の時間情報(t1,t2)を得るために神経活動パターンを処理する手段(730)とを含み、
トラジェクトリ(740,750)は、音声信号(710)における同一の事象に基づく異なる神経線維(NF1,NF2,NF3,NF4,NF5)上の活動インパルスを含み、
前記神経活動パターンを処理する手段(730)は、時間とともに前記神経活動パターンの変形された二次元表示を得るために時間とともに前記神経活動パターンの二次元表示を徐々に変形させ、前記神経活動パターンを処理する手段(730)が、時間とともに前記神経活動パターンの二次元表示を徐々に変形させるように実施されることにより、前記神経活動パターンにおける曲線状のトラジェクトリが徐々の変形により徐々に直線状にされ、ほぼ直線状のラインが時間とともに前記神経活動パターンの変形された二次元表示に含まれるときを認識し、ほぼ直線状のラインを前記トラジェクトリと認識し、トラジェクトリの時間的な位置を測定し、音声信号の分析表示として前記トラジェクトリに属する時間情報を提供するように実施され、
前記神経活動パターンを処理する手段(730)は、前記神経活動パターンを複数の信号(1320,1322,1324;1520,1522,1524)の形で並行して受信し、前記信号(1320,1322,1324;1520,1522,1524)を直列に接続された複数の段階(1310,1312,1314;1530,1532,1534)を通って異なる速さで並行して送るために実施される曲線認識手段(1300,1500,1600)を含み、少なくとも1つの所定の段階(1310,1312,1314;1530,1532,1534)は、直線状またはほぼ直線状のラインの存在を示す、少なくとも所定の数の信号が所定の段階において同時に活性化されるときを認識するために実施される閾値認識手段(1560,1570,1562,1572,1564,1575)を含む、装置。 - 神経活動パターン(730)は、聴覚モデルの一群の神経線維の活動を示す、請求項1に記載の装置。
- 時間情報(t1,t2)は、トラジェクトリ(740,750)の発生時点を示す、請求項1または請求項2に記載の装置。
- 前記音声信号における同様の事象により条件付けられた活動インパルスが所定の最低数より大きい数の神経線維に与えられたときに、トラジェクトリ(740,750)を認識するように実行される、請求項1ないし請求項3のいずれかに記載の装置。
- 音響事象として音声信号の中の母音、子音または音の始点を認識するために実施される、請求項1ないし請求項4のいずれかに記載の装置。
- 前記聴覚モデルの基底膜上の進行波を示す神経活動パターンにおけるトラジェクトリを認識するために行われる、請求項1ないし請求項5のいずれかに記載の装置。
- トラジェクトリは、前記聴覚モデルの前記基底膜上の進行波に関連した一群の隣接する神経線維における神経活動パターンと定義される、請求項1ないし請求項6のいずれかに記載の装置。
- トラジェクトリは、一群の隣接する神経線維上の活動インパルスの発生によって定義され、前記活動インパルスは、進行波による隣接する神経線維の刺激を示す、請求項1ないし請求項7のいずれかに記載の装置。
- 前記時間情報は、前記トラジェクトリの時間的な始点を示す、請求項1ないし請求項8のいずれかに記載の装置。
- 所定のトラジェクトリの時間的な始点は、所定のトラジェクトリに関連する最初の活動インパルスが神経線維に影響を与える時点である、請求項9に記載の装置。
- 神経活動パターンを処理するための手段(730)は、トラジェクトリ(740,750)の時間的な位置を定義し、前記音声信号の分析表示としてトラジェクトリ(740,750)に属する時間情報(t1,t2)を提供するために、時間とともに神経活動パターンによって形成される二次元表示において、トラジェクトリ(740,750)として直線状または曲線状のパターンを認識するように実施されるパターン認識手段を含む、請求項1ないし請求項10のいずれかに記載の装置。
- パターン認識手段は、前記分析表示の部分として前記トラジェクトリの形状に関する情報を提供するように実施される、請求項11に記載の装置。
- 前記トラジェクトリの形状に関する情報は、前記トラジェクトリの湾曲についての情報を含む、請求項12に記載の装置。
- パターン認識手段は、直線状または双曲線状のトラジェクトリを認識するように定義される、請求項11ないし請求項13のいずれかに記載の装置。
- パターン認識手段は、前記分析表示の部分として前記トラジェクトリの長さに関する情報を提供するように実施される、請求項11ないし請求項14のいずれかに記載の装置。
- 前記神経活動パターンを処理する手段(730)は、トラジェクトリを認識し、トラジェクトリの時間的な位置を示す時間情報を得るために、時間とともに神経活動パターンを示す二次元表示と、少なくとも1つの比較パターンとを比較するように実施されるパターン比較手段を含む、請求項1ないし請求項15のいずれかに記載の装置。
- 前記比較パターンは、直線または双曲線状の曲線である、請求項16に記載の装置。
- 前記曲線状のトラジェクトリを直線状にするために必要な複数の湾曲工程は、前記曲線状のトラジェクトリの湾曲に依存し、前記曲線状のトラジェクトリを直線状にするために必要な複数の工程は、前記トラジェクトリのオリジナルの形状のステイトメントを含む、請求項1ないし請求項17のいずれかに記載の装置。
- 少なくとも1つの段階(1310,1312,1314;1530,1532,1534)は、段階を通して信号を進めるときにそれぞれの信号を異なる程度に遅延させるように実施される、請求項1ないし請求項18のいずれかに記載の装置。
- 前記曲線認識手段(1300;1500;1600)は、神経網である、請求項1ないし請求項19のいずれかに記載の装置。
- 前記神経活動パターンを処理する手段は、ハフ変換の評価に基づいてトラジェクトリを認識するために実施される、請求項1ないし請求項20のいずれかに記載の装置。
- 前記神経活動パターンを処理する手段は、並列ハフ変換を行う手段を含む、請求項1ないし請求項21のいずれかに記載の装置。
- さらに、時間情報(t1,t2)に基づいて、音声信号成分を分析する手段(1800)を含む、請求項1ないし請求項22のいずれかに記載の装置。
- 前記音声信号成分を分析する手段は、比較結果としての音声信号成分に関する情報(1850)を提供するために、時間情報(t1,t2)とデータベース(1820)に存在する参照時間情報(1840)とを比較するように実施される比較手段(1810)を含む、請求項23に記載の装置。
- 音声信号成分を分析する手段は、それぞれの連続的なトラジェクトリに属する時間情報に基づいて、母音または子音を認識するために実施される、請求項23または請求項24に記載の装置。
- 音声信号成分を分析する手段は、さらに、前記トラジェクトリの形状および/または湾曲に関する情報を用いるように実施される、請求項23ないし請求項25のいずれかに記載の装置。
- 音声信号成分を分析する手段は、前記時間情報に基づいて、前記音声信号のリズムに関する情報を測定するように実施され、前記音声信号のリズムに関する情報は、前記音声信号の成分についての表示を示す、請求項23ないし請求項26のいずれかに記載の装置。
- 音声信号の分析表示(760)を得るために、前記音声信号を分析するための装置(700)であって、
前記音声信号(710)に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出する手段(720)と、
連続したトラジェクトリ(740,750)の時間的な位置を示す分析表示(760)として一連の時間情報(t1,t2)を得るために神経活動パターンを処理する手段(730)とを含み、
トラジェクトリ(740,750)は、音声信号(710)における同一の事象に基づく異なる神経線維(NF1,NF2,NF3,NF4,NF5)上の活動インパルスを含み、
前記神経活動パターンを処理する手段(730)は、前記神経活動パターンを複数の信号(1320,1322,1324;1520,1522,1524)の形で並行して受信し、前記信号(1320,1322,1324;1520,1522,1524)を直列に接続された複数の段階(1310,1312,1314;1530,1532,1534)を通って異なる速さで並行して送るために実施される曲線認識手段(1300,1500,1600)を含み、少なくとも1つの所定の段階(1310,1312,1314;1530,1532,1534)は、少なくとも所定の数の信号が所定の段階において同時に活性化されるときを認識するために実施される閾値認識手段(1560,1570,1562,1572,1564,1575)を含む、装置。 - 音声信号の分析表示を得るために、前記音声信号を分析するための方法であって、
前記音声信号に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出するステップと、
連続したトラジェクトリの時間的な位置を示す分析表示として一連の時間情報を得るために神経活動パターンを処理するステップとを含み、
トラジェクトリは、音声信号における同一の事象に基づく異なる神経線維上の活動インパルスを含み、
前記神経活動パターンを処理するステップは、
時間とともに前記神経活動パターンの変形された二次元表示を得るために時間とともに前記神経活動パターンの二次元表示を徐々に変形させるステップであって、時間とともに前記神経活動パターンの二次元表示が徐々に変形して、前記神経活動パターンにおける曲線状のトラジェクトリが徐々の変形により徐々に直線状にされるステップと、
ほぼ直線状のラインが時間とともに前記神経活動パターンの変形された二次元表示に含まれるときを認識するステップとを含み、
前記神経活動パターンは複数の信号(1320,1322,1324;1520,1522,1524)の形で並行して受信され、
前記信号(1320,1322,1324;1520,1522,1524)は直列に接続された複数の段階(1310,1312,1314;1530,1532,1534)を通って異なる速さで並行して送られ、
直線状またはほぼ直線状のラインの存在を示す、少なくとも所定の数の信号が所定の段階において同時に活性化されるときが認識され、さらに
ほぼ直線状のラインをトラジェクトリと認識するステップと、
前記トラジェクトリの時間的な位置を測定するステップと、
音声信号の分析表示として前記トラジェクトリに属する時間情報を供給するステップとを含む、方法。 - 音声信号の分析表示を得るために、前記音声信号を分析するための方法であって、
前記音声信号に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出するステップと、
連続したトラジェクトリの時間的な位置を示す分析表示として一連の時間情報を得るために神経活動パターンを処理するステップとを含み、
トラジェクトリは、音声信号における同一の事象に基づく異なる神経線維上の活動インパルスを含み、
前記神経活動パターンを処理するステップは、
前記神経活動パターンを複数の信号(1320,1322,1324;1520,1522,1524)の形で並行して受信するステップと、
直列に接続された複数の段階(1310,1312,1314;1530,15332,1534)を通して前記信号(1320,1322,1324;1520,1522,1524)を異なる速さで送るステップと、
少なくとも所定の数の信号が所定の段階で同時に活性化されるときを認識するステップとを含む、方法。 - 音声信号成分上の情報を得るために、前記音声信号を分析するための装置(700)であって、
前記音声信号(710)に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出する手段(720)と、
連続したトラジェクトリ(740,750)の時間的な位置を示す分析表示(760)として一連の時間情報(t1,t2)を得るために神経活動パターンを処理する手段(730)とを含み、
トラジェクトリ(740,750)は、音声信号(710)における同一の事象に基づく異なる神経線維(NF1,NF2,NF3,NF4,NF5)上の活動インパルスを含み、
装置(700)は、時間情報(t1,t2)に基づいて、音声信号成分を分析する手段(1800)を含み、
前記音声信号成分を分析する手段は、比較結果としての音声信号成分に関する情報(1850)を提供するために、時間情報(t1,t2)とデータベース(1820)に存在する参照時間情報(1840)とを比較するように実施される比較手段(1810)を含み、
前記神経活動パターンを処理する手段(730)は、前記分析表示の部分として前記トラジェクトリの形状に関する情報を提供するように実施され、
前記トラジェクトリの形状に関する情報は、前記トラジェクトリの湾曲についての情報を含み、
音声信号成分を分析する手段は、前記トラジェクトリの湾曲に関する情報を用いるように実施される、装置。 - 音声信号成分上の情報を得るために、音声信号を分析する方法であって、
前記音声信号に基づいて聴覚モデルの神経線維に現われた神経活動パターンを時間とともに算出するステップと、
連続したトラジェクトリの時間的な位置を示す分析表示として一連の時間情報を得るために神経活動パターンを処理するステップとを含み、
トラジェクトリは、音声信号における同一の事象に基づく異なる神経線維上の活動インパルスを含み、
さらに、時間情報に基づいて、音声信号成分を分析するステップを含み、
前記音声信号成分を分析するステップは、比較結果としての音声信号成分に関する情報(1850)を提供するために、時間情報(t1,t2)とデータベース(1820)に存在する参照時間情報(1840)とを比較するステップを含み、
前記トラジェクトリの形状に関する情報は、前記分析表示の部分として提供され、
前記トラジェクトリの形状に関する情報は、前記トラジェクトリの湾曲に関する情報を含み、
前記トラジェクトリの湾曲に関する情報は、音声信号成分を分析するときに用いられる、方法。 - コンピュータ上で実行される際に、請求項29、請求項30または請求項32の方法を実行するためのプログラムコードを有する、コンピュータプログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102005030327A DE102005030327A1 (de) | 2005-06-29 | 2005-06-29 | Vorrichtung, Verfahren und Computerprogramm zur Analyse eine Audiosignals |
DE102005030327.7 | 2005-06-29 | ||
US11/172,605 US7996212B2 (en) | 2005-06-29 | 2005-06-29 | Device, method and computer program for analyzing an audio signal |
US11/172,605 | 2005-06-29 | ||
PCT/EP2006/005560 WO2007000231A1 (de) | 2005-06-29 | 2006-06-09 | Vorrichtung, verfahren und computerprogramm zur analyse eines audiosignals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008545170A JP2008545170A (ja) | 2008-12-11 |
JP4767316B2 true JP4767316B2 (ja) | 2011-09-07 |
Family
ID=36972689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008519813A Expired - Fee Related JP4767316B2 (ja) | 2005-06-29 | 2006-06-09 | 音声信号を分析する装置、方法、およびコンピュータ・プログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US7996212B2 (ja) |
EP (1) | EP1896124B1 (ja) |
JP (1) | JP4767316B2 (ja) |
AU (1) | AU2006264029B2 (ja) |
DE (1) | DE102005030327A1 (ja) |
WO (1) | WO2007000231A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8535236B2 (en) * | 2004-03-19 | 2013-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for analyzing a sound signal using a physiological ear model |
DE102006030276A1 (de) * | 2006-06-30 | 2008-01-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines gefilterten Aktivitätsmusters, Quellentrenner, Verfahren zum Erzeugen eines bereinigten Audiosignals und Computerprogramm |
US20080306098A1 (en) * | 2006-11-06 | 2008-12-11 | Mutz Mitchell W | Pharmacokinetics of protease inhibitors and other drugs |
US20090054334A1 (en) * | 2007-05-23 | 2009-02-26 | Mutz Mitchell W | Combinatorial improvement of bifunctional drug properties |
US20100284993A1 (en) * | 2007-10-24 | 2010-11-11 | Mutz Mitchell W | Enhancing the Efficacy of Anti-Infective Therapeutics |
EP2329399A4 (en) * | 2008-09-19 | 2011-12-21 | Newsouth Innovations Pty Ltd | METHOD FOR ANALYZING A TONE SIGNAL |
US10368785B2 (en) | 2008-10-24 | 2019-08-06 | East Carolina University | In-ear hearing test probe devices and methods and systems using same |
US8507781B2 (en) * | 2009-06-11 | 2013-08-13 | Harman International Industries Canada Limited | Rhythm recognition from an audio signal |
WO2011094611A2 (en) * | 2010-01-29 | 2011-08-04 | Circular Logic, LLC | Learning and auditory scene analysis in gradient frequency nonlinear oscillator networks |
WO2012002467A1 (ja) * | 2010-06-29 | 2012-01-05 | Kitazawa Shigeyoshi | 音楽情報処理装置、方法、プログラム、人工内耳用音楽情報処理システム、人工内耳用音楽情報製造方法及び媒体 |
WO2014107213A2 (en) * | 2012-10-16 | 2014-07-10 | The Florida International University Board Of Trustees | Neural interface activity simulator |
WO2015057661A1 (en) * | 2013-10-14 | 2015-04-23 | The Penn State Research Foundation | System and method for automated speech recognition |
JP6908243B2 (ja) * | 2016-02-01 | 2021-07-21 | 国立大学法人徳島大学 | 生体音響抽出装置、生体音響解析装置、生体音響抽出プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器 |
US11099075B2 (en) | 2017-11-02 | 2021-08-24 | Fluke Corporation | Focus and/or parallax adjustment in acoustic imaging using distance information |
US11209306B2 (en) | 2017-11-02 | 2021-12-28 | Fluke Corporation | Portable acoustic imaging tool with scanning and analysis capability |
CN109753971B (zh) * | 2017-11-06 | 2023-04-28 | 阿里巴巴集团控股有限公司 | 扭曲文字行的矫正方法及装置、字符识别方法及装置 |
EP3827227A1 (en) | 2018-07-24 | 2021-06-02 | Fluke Corporation | Systems and methods for projecting and displaying acoustic data |
US11800301B2 (en) | 2019-06-09 | 2023-10-24 | Universiteit Gent | Neural network model for cochlear mechanics and processing |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6011899A (ja) * | 1983-04-26 | 1985-01-22 | フエアチアイルド・カメラ・アンド・インストルメント・コ−ポレ−シヨン | 聴覚応答情報を模倣する方法及び装置 |
JPS63259695A (ja) * | 1987-04-03 | 1988-10-26 | アメリカン テレフォン アンド テレグラフ カムパニー | 知覚分析方法 |
US5381512A (en) * | 1992-06-24 | 1995-01-10 | Moscom Corporation | Method and apparatus for speech feature recognition based on models of auditory signal processing |
JP2004500788A (ja) * | 2000-06-19 | 2004-01-08 | コックレア リミティド | 移植蝸牛刺激装置のための音声処理装置 |
WO2005013870A1 (ja) * | 2003-08-07 | 2005-02-17 | Hamamatsu Foundation For Science And Technology Promotion | 人工内耳の音声変換方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4980918A (en) | 1985-05-09 | 1990-12-25 | International Business Machines Corporation | Speech recognition system with efficient storage and rapid assembly of phonological graphs |
GB8720387D0 (en) * | 1987-08-28 | 1987-10-07 | British Telecomm | Matching vectors |
US5388182A (en) | 1993-02-16 | 1995-02-07 | Prometheus, Inc. | Nonlinear method and apparatus for coding and decoding acoustic signals with data compression and noise suppression using cochlear filters, wavelet analysis, and irregular sampling reconstruction |
EP0902999A1 (en) | 1996-06-04 | 1999-03-24 | Murphy, Timothy M. | A device for transferring electromagnetic energy between primary and secondary coils |
US6064913A (en) | 1997-04-16 | 2000-05-16 | The University Of Melbourne | Multiple pulse stimulation |
ATE248459T1 (de) | 1997-05-01 | 2003-09-15 | Med El Elektromed Geraete Gmbh | Verfahren und gerät für eine digitale filterbank mit geringem stromverbrauch |
US6535153B1 (en) | 1999-02-04 | 2003-03-18 | Med-El Electromedizinische Gerate Ges.M.B.H. | Adaptive sigma-delta modulation with one-bit quantization |
CA2382039C (en) | 1999-07-21 | 2009-12-15 | Med-El Elektromedizinische Gerate Gmbh | Multichannel cochlear implant with neural response telemetry |
WO2001013991A1 (en) | 1999-08-26 | 2001-03-01 | Med-El Elektromedizinische Geräte GmbH | Electrical nerve stimulation based on channel specific sampling sequences |
AU782132B2 (en) | 2000-01-31 | 2005-07-07 | Med-El Elektromedizinische Geraete Gmbh | Cochlear implant system partially insertable in the external ear |
DE10117871C1 (de) * | 2001-04-10 | 2002-07-04 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Extrahieren einer Signalkennung, Verfahren und Vorrichtung zum Erzeugen einer Datenbank aus Signalkennungen und Verfahren und Vorrichtung zum Referenzieren eines Such-Zeitsignals |
CA2476967C (en) | 2002-03-28 | 2011-10-11 | Clemens M. Zierhofer | A system and method for adaptive sigma-delta modulation |
CA2452945C (en) | 2003-09-23 | 2016-05-10 | Mcmaster University | Binaural adaptive hearing system |
US8535236B2 (en) | 2004-03-19 | 2013-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for analyzing a sound signal using a physiological ear model |
-
2005
- 2005-06-29 US US11/172,605 patent/US7996212B2/en not_active Expired - Fee Related
- 2005-06-29 DE DE102005030327A patent/DE102005030327A1/de not_active Ceased
-
2006
- 2006-06-09 JP JP2008519813A patent/JP4767316B2/ja not_active Expired - Fee Related
- 2006-06-09 EP EP06743146.0A patent/EP1896124B1/de not_active Not-in-force
- 2006-06-09 WO PCT/EP2006/005560 patent/WO2007000231A1/de active Application Filing
- 2006-06-09 AU AU2006264029A patent/AU2006264029B2/en not_active Ceased
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6011899A (ja) * | 1983-04-26 | 1985-01-22 | フエアチアイルド・カメラ・アンド・インストルメント・コ−ポレ−シヨン | 聴覚応答情報を模倣する方法及び装置 |
JPS63259695A (ja) * | 1987-04-03 | 1988-10-26 | アメリカン テレフォン アンド テレグラフ カムパニー | 知覚分析方法 |
US5381512A (en) * | 1992-06-24 | 1995-01-10 | Moscom Corporation | Method and apparatus for speech feature recognition based on models of auditory signal processing |
JP2004500788A (ja) * | 2000-06-19 | 2004-01-08 | コックレア リミティド | 移植蝸牛刺激装置のための音声処理装置 |
WO2005013870A1 (ja) * | 2003-08-07 | 2005-02-17 | Hamamatsu Foundation For Science And Technology Promotion | 人工内耳の音声変換方法 |
Also Published As
Publication number | Publication date |
---|---|
DE102005030327A1 (de) | 2007-01-04 |
AU2006264029A1 (en) | 2007-01-04 |
JP2008545170A (ja) | 2008-12-11 |
US20070005348A1 (en) | 2007-01-04 |
EP1896124B1 (de) | 2017-08-16 |
AU2006264029B2 (en) | 2010-08-19 |
US7996212B2 (en) | 2011-08-09 |
WO2007000231A1 (de) | 2007-01-04 |
EP1896124A1 (de) | 2008-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4767316B2 (ja) | 音声信号を分析する装置、方法、およびコンピュータ・プログラム | |
US11043210B2 (en) | Sound processing apparatus utilizing an electroencephalography (EEG) signal | |
AU2006264080C1 (en) | System, method and computer program for analysing an audio signal | |
US11800301B2 (en) | Neural network model for cochlear mechanics and processing | |
US7366656B2 (en) | Method apparatus and system for processing acoustic signals | |
Zaar et al. | Predicting speech intelligibility in hearing-impaired listeners using a physiologically inspired auditory model | |
US20230156413A1 (en) | Closed-loop method to individualize neural-network-based audio signal processing | |
JP4876133B2 (ja) | 音声信号に基づく蝸牛インプラントのための制御信号を生成するための方法、装置およびコンピュータ・プログラム | |
Shamma | Encoding sound timbre in the auditory system | |
Essaid et al. | Advanced Artificial Intelligence Algorithms in Cochlear Implants: Review of Healthcare Strategies, Challenges, and Perspectives | |
JP4240878B2 (ja) | 音声認識方法及び音声認識装置 | |
Esposito et al. | Some notes on nonlinearities of speech | |
JP4927166B2 (ja) | フィルタ処理された活性パターンを生成するためのデバイスおよび方法、音源分割器、デバッグされた音声信号を生成するための方法およびコンピュータ・プログラム | |
Deepak et al. | A convolutional neural-network model of human cochlear mechanics and filter tuning for real-time applications | |
Rattay et al. | Speech sound representation in the auditory nerve: computer simulation studies on inner ear mechanisms | |
Leyla | Neural response based speaker identification under noisy condition/Leyla Roohisefat | |
Yegnanarayanan | A NEW MODEL OF HEARING AND ITS PERFORMANCE IN PITCH PERCEPTION (COCHLEAR MODELING, AUDITORY) | |
Roohisefat | Neural Response Based Speaker Identification Under Noisy Condition | |
Finley | Accounting for the phonetic value of nonspeech sounds | |
Froehlich | Hearing Device with a Visualized Psychoacoustic Variable and Corresponding Method | |
Sewell | A parametric framework for computational modelling of the auditory periphery | |
Lammert | Austin Aguirre–Computer Science Hunter Lassard–Biomedical Engineering Aidan Pereira–Biomedical Engineering Jack Brazer–Biomedical Engineering | |
Vibrations et al. | The Peripheral Auditory System: Transduction and Coding 125 Auditory Nerve 128 Central Auditory Nervous System 130 | |
Henery et al. | From Auditory Model to Perceptogram to Vowel Map |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101005 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110105 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110614 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4767316 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140624 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |