CN110136710A - 人工耳蜗控制方法 - Google Patents
人工耳蜗控制方法 Download PDFInfo
- Publication number
- CN110136710A CN110136710A CN201910352855.3A CN201910352855A CN110136710A CN 110136710 A CN110136710 A CN 110136710A CN 201910352855 A CN201910352855 A CN 201910352855A CN 110136710 A CN110136710 A CN 110136710A
- Authority
- CN
- China
- Prior art keywords
- artificial cochlea
- characteristic parameter
- command signal
- signal
- control method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 210000003477 cochlea Anatomy 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 9
- 230000001755 vocal effect Effects 0.000 claims abstract description 9
- 230000005236 sound signal Effects 0.000 claims abstract description 4
- 238000009432 framing Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 241000237858 Gastropoda Species 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61N—ELECTROTHERAPY; MAGNETOTHERAPY; RADIATION THERAPY; ULTRASOUND THERAPY
- A61N1/00—Electrotherapy; Circuits therefor
- A61N1/02—Details
- A61N1/08—Arrangements or circuits for monitoring, protecting, controlling or indicating
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61N—ELECTROTHERAPY; MAGNETOTHERAPY; RADIATION THERAPY; ULTRASOUND THERAPY
- A61N1/00—Electrotherapy; Circuits therefor
- A61N1/18—Applying electric currents by contact electrodes
- A61N1/32—Applying electric currents by contact electrodes alternating or intermittent currents
- A61N1/36—Applying electric currents by contact electrodes alternating or intermittent currents for stimulation
- A61N1/36036—Applying electric currents by contact electrodes alternating or intermittent currents for stimulation of the outer, middle or inner ear
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
本发明公开了一种人工耳蜗控制方法,其包括如下步骤:(A)采集声音信号;(B)将声音信号进行预处理;(C)将预处理后的声音信号进行特征参数提取;(D)将特征提取后的特征参数与预设的特征参数进行声纹对比,判断声音是否来自于预设用户;(E)将特征提取后的特征参数转化为命令信号;(F)将语义识别后的命令信号与预设的命令信号进行匹配;(G)处理命令信号,调节对应的工作参数。该人工耳蜗控制方法通过设置语音控制模组,解放了双手,使得使用者能声控人工耳蜗,实时调节人工耳蜗的工作参数,达到较佳的听觉效果,也提高了控制的准确性,避免了误操作,同时,不会影响人工耳蜗正常的声音处理工作。
Description
技术领域
本发明涉及一种控制方法,尤其涉及一种人工耳蜗控制方法。
背景技术
人工耳蜗由于使用场景的复杂性,为了达到较佳的使用效果,有时需要对人工耳蜗的工作参数(音量大小、场景选择、关机等)进行实时调节。但在特定场景下,比如开车、骑车等,使用者的双手会被占用,无法方便地手动调节人工耳蜗的工作参数,如强行操作则会造成安全隐患。同时,手动调节时通常不会将人工耳蜗摘下,只能凭经验进行盲操作,容易导致误操作。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种人工耳蜗控制方法,其能通过声音控制人工耳蜗。
为实现上述目的,本发明提供了一种人工耳蜗控制方法,其包括如下步骤:(A)拾音单元采集声音信号;(B)预处理程序模块将声音信号进行分帧、加窗及预加重;(C)特征提取程序模块将预处理后的声音信号进行特征参数提取;(D)声纹对比程序模块将特征提取后的特征参数与预设的特征参数进行声纹对比,判断声音是否来自于预设用户,若是来自于预设用户,则进入下一步,若不是来自于预设用户,则忽略此段声音信号;(E)语义识别程序模块将特征提取后的特征参数转化为命令信号;(F)命令匹配程序模块将语义识别后的命令信号与预设的命令信号进行匹配,若匹配成功,则进入下一步,若匹配不成功,则忽略此段声音信号;(G)人工耳蜗策略处理单元处理命令信号,调节对应的工作参数。
在步骤B中,该加窗使用Hamming窗或Hanning窗。
在步骤C中,该特征参数提取采用LPCC或MFCC。
本发明人工耳蜗控制方法通过设置语音控制模组,解放了双手,使得使用者能声控人工耳蜗,实时调节人工耳蜗的工作参数,达到较佳的听觉效果,也提高了控制的准确性,避免了误操作,同时,不会影响人工耳蜗正常的声音处理工作。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明人工耳蜗控制方法的流程示意图。
图2是本发明人工耳蜗的模块工作示意图。
具体实施方式
本发明提供了一种人工耳蜗控制方法,用于控制人工耳蜗,以达到能实时调节人工耳蜗工作参数的目的。
如图1所示,该人工耳蜗控制方法包括声音采集,预处理,特征提取,声纹对比,语义识别,命令匹配,命令执行七个步骤。
声音采集:拾音单元(比如麦克风)采集声音信号。
预处理:预处理程序模块将声音信号进行分帧、加窗及预加重,其中,该加窗使用Hamming窗或Hanning窗。
特征提取:特征提取程序模块将预处理后的声音信号进行特征参数提取,其中,该特征参数提取采用LPCC(LinearPredictionCepstrumCoefficient,线性预测倒谱系数)或MFCC(Mel-FrequencyCepstrumCoefficient,梅尔频率倒谱系数)。
声纹对比:声纹对比程序模块将特征提取后的特征参数与预设的特征参数进行声纹对比,判断声音是否来自于预设用户,若是来自于预设用户(通常为使用者本人),则进入下一步,若不是来自于预设用户,则忽略此段声音信号。
语义识别:语义识别程序模块将特征提取后的特征参数转化为命令信号。
命令匹配:命令匹配程序模块将语义识别后的命令信号与预设的命令信号进行匹配,若匹配成功,则进入下一步,若匹配不成功,则忽略此段声音信号。
命令执行:人工耳蜗策略处理单元处理命令信号,调节对应的工作参数。
如图2所示,值得提醒的是,该拾音单元、该预处理程序模块及该人工耳蜗策略处理单元均为人工耳蜗现有的功能单元,该特征提取程序模块、该声纹对比程序模块、该语义识别程序模块及该命令匹配程序模块均为新设置的语音控制模组,即,只需对现有的人工耳蜗进行一定的改进就可实现该人工耳蜗控制方法,实现成本较低。同时,声音采集及预处理两个步骤可与人工耳蜗正常的声音处理共用,即,预处理后的声音信号可同时输送至该人工耳蜗策略处理单元以进行声音处理,使得该人工耳蜗控制方法与人工耳蜗正常的声音处理能相互兼容、同时进行。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (3)
1.一种人工耳蜗控制方法,其包括如下步骤:(A)拾音单元采集声音信号;(B)预处理程序模块将声音信号进行分帧、加窗及预加重;(C)特征提取程序模块将预处理后的声音信号进行特征参数提取;(D)声纹对比程序模块将特征提取后的特征参数与预设的特征参数进行声纹对比,判断声音是否来自于预设用户,若是来自于预设用户,则进入下一步,若不是来自于预设用户,则忽略此段声音信号;(E)语义识别程序模块将特征提取后的特征参数转化为命令信号;(F)命令匹配程序模块将语义识别后的命令信号与预设的命令信号进行匹配,若匹配成功,则进入下一步,若匹配不成功,则忽略此段声音信号;(G)人工耳蜗策略处理单元处理命令信号,调节对应的工作参数。
2.如权利要求1所述的人工耳蜗控制方法,其特征在于:在步骤B中,该加窗使用Hamming窗或Hanning窗。
3.如权利要求1所述的人工耳蜗控制方法,其特征在于:在步骤C中,该特征参数提取采用LPCC或MFCC。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910352855.3A CN110136710A (zh) | 2019-04-29 | 2019-04-29 | 人工耳蜗控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910352855.3A CN110136710A (zh) | 2019-04-29 | 2019-04-29 | 人工耳蜗控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110136710A true CN110136710A (zh) | 2019-08-16 |
Family
ID=67575523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910352855.3A Withdrawn CN110136710A (zh) | 2019-04-29 | 2019-04-29 | 人工耳蜗控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110136710A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111383639A (zh) * | 2020-03-06 | 2020-07-07 | 湖南快乐车行露营地投资发展有限公司 | 水电桩解锁控制方法、装置、计算机设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2381702A2 (en) * | 2010-04-22 | 2011-10-26 | Siemens Corporation | Systems and methods for own voice recognition with adaptations for noise robustness |
CN106060235A (zh) * | 2016-05-05 | 2016-10-26 | 广东小天才科技有限公司 | 一种应用于移动设备的开关机控制方法及装置、移动设备 |
CN107785013A (zh) * | 2016-08-24 | 2018-03-09 | 中兴通讯股份有限公司 | 语音控制方法及装置 |
CN107801138A (zh) * | 2016-08-29 | 2018-03-13 | 奥迪康有限公司 | 具有语音控制功能的助听器装置 |
CN109545221A (zh) * | 2019-01-23 | 2019-03-29 | 努比亚技术有限公司 | 参数调整方法、移动终端及计算机可读存储介质 |
-
2019
- 2019-04-29 CN CN201910352855.3A patent/CN110136710A/zh not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2381702A2 (en) * | 2010-04-22 | 2011-10-26 | Siemens Corporation | Systems and methods for own voice recognition with adaptations for noise robustness |
CN106060235A (zh) * | 2016-05-05 | 2016-10-26 | 广东小天才科技有限公司 | 一种应用于移动设备的开关机控制方法及装置、移动设备 |
CN107785013A (zh) * | 2016-08-24 | 2018-03-09 | 中兴通讯股份有限公司 | 语音控制方法及装置 |
CN107801138A (zh) * | 2016-08-29 | 2018-03-13 | 奥迪康有限公司 | 具有语音控制功能的助听器装置 |
CN109545221A (zh) * | 2019-01-23 | 2019-03-29 | 努比亚技术有限公司 | 参数调整方法、移动终端及计算机可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111383639A (zh) * | 2020-03-06 | 2020-07-07 | 湖南快乐车行露营地投资发展有限公司 | 水电桩解锁控制方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108564942B (zh) | 一种基于敏感度可调的语音情感识别方法及系统 | |
CN110310623B (zh) | 样本生成方法、模型训练方法、装置、介质及电子设备 | |
CN105009204B (zh) | 语音识别功率管理 | |
CN107767861B (zh) | 语音唤醒方法、系统及智能终端 | |
CN111341325A (zh) | 声纹识别方法、装置、存储介质、电子装置 | |
CN110570873B (zh) | 声纹唤醒方法、装置、计算机设备以及存储介质 | |
CN110364143A (zh) | 语音唤醒方法、装置及其智能电子设备 | |
CN102543073B (zh) | 一种沪语语音识别信息处理方法 | |
CN104575504A (zh) | 采用声纹和语音识别进行个性化电视语音唤醒的方法 | |
KR20160098771A (ko) | 음성 기능 운용 방법 및 이를 지원하는 전자 장치 | |
CN109564759A (zh) | 说话人识别 | |
CN108766441A (zh) | 一种基于离线声纹识别和语音识别的语音控制方法及装置 | |
CN106157956A (zh) | 语音识别的方法及装置 | |
CN1856820A (zh) | 语音识别方法和通信设备 | |
CN113129867B (zh) | 语音识别模型的训练方法、语音识别方法、装置和设备 | |
CN110097875A (zh) | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 | |
CN110525379A (zh) | 一种纯电动汽车语音解锁系统及方法 | |
CN113192535B (zh) | 一种语音关键词检索方法、系统和电子装置 | |
CN109215634A (zh) | 一种多词语音控制通断装置的方法及其系统 | |
CN111833878A (zh) | 基于树莓派边缘计算的中文语音交互无感控制系统和方法 | |
CN109065026B (zh) | 一种录音控制方法及装置 | |
CN116343797A (zh) | 语音唤醒方法及相应装置 | |
CN110136710A (zh) | 人工耳蜗控制方法 | |
CN111613223B (zh) | 语音识别方法、系统、移动终端及存储介质 | |
CN113330513A (zh) | 语音信息处理方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20190816 |
|
WW01 | Invention patent application withdrawn after publication |