CN105916090B - 一种基于智能化语音识别技术的助听器系统 - Google Patents
一种基于智能化语音识别技术的助听器系统 Download PDFInfo
- Publication number
- CN105916090B CN105916090B CN201610376244.9A CN201610376244A CN105916090B CN 105916090 B CN105916090 B CN 105916090B CN 201610376244 A CN201610376244 A CN 201610376244A CN 105916090 B CN105916090 B CN 105916090B
- Authority
- CN
- China
- Prior art keywords
- signal
- sent
- cloud
- speech recognition
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002708 enhancing effect Effects 0.000 claims abstract description 27
- 230000005540 biological transmission Effects 0.000 claims abstract description 22
- 238000004458 analytical method Methods 0.000 claims abstract description 18
- 239000002131 composite material Substances 0.000 claims abstract description 16
- 238000012546 transfer Methods 0.000 claims abstract description 13
- 238000000034 method Methods 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 20
- 238000004422 calculation algorithm Methods 0.000 claims description 18
- 230000005236 sound signal Effects 0.000 claims description 14
- 230000006835 compression Effects 0.000 claims description 12
- 238000007906 compression Methods 0.000 claims description 12
- 238000000354 decomposition reaction Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 150000001875 compounds Chemical class 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims description 4
- 238000012423 maintenance Methods 0.000 abstract description 6
- 230000008901 benefit Effects 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 206010011878 Deafness Diseases 0.000 description 5
- 238000007405 data analysis Methods 0.000 description 4
- 208000033748 Device issues Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 210000003477 cochlea Anatomy 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
- H04R25/505—Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/43—Signal processing in hearing aids to enhance the speech intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Neurosurgery (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供了一种基于智能化语音识别技术的助听器系统,涉及医疗设备领域,其特征在于,所述系统包括:识别端、移动端和云端;所述识别端包括:声音采集装置、信号转换装置、分解滤波器、增强系统、预处理计算装置、判决系统、合成滤波器、数据发送装置、本地数据库和数据接收装置;所述移动端包括:控制器、处理器、显示器、语音识别装置和移动数据传输装置;所述云端包括:云端数据传输装置、云端数据库和云端分析处理器。该系统具有中文语音识别准确、具备自我学习能力、识别算法领先、后期维护好等优点。
Description
技术领域
本发明涉及医疗领域,特别是涉及一种基于智能化语音识别技术的助听器系统。
背景技术
目前国外对助听器研究发展的一个热点则是集中在中国,确切地讲是基于对汉语语言和语音研究,开发相关的语音识别技术和产品。听觉科学是一门发展迅速、知识更新很快的一门学科,它所研究的对象以人的听觉为中心,现在我们将介绍和讨论科学家和听力学家更关心的是怎样将听觉科学运用到中国人的听觉和言语实际中去。
汉语是具有特征化的音调性语言,与其他以拼音字母为主的语系,如斯拉夫语系等具有很明显的语音学差别。这种差别不仅仅在语言特征上非常明确,在具体使用时,区别也很大。是否不同语系的不同语音特征会影响听觉受损患者对言语的理解,尤其是在使用基于不同语系研究成果制作成的助听器时,这种语音的差异是否起到重要作用,最近已成为学术和科研的一个热门课题。比如国内研制的人工耳蜗的一个特点便是在设计其算法时考虑到中文语音特点。国外助听器厂商将在近期推出以中文语音为特征算法的助听器。加拿大在中国的一语音实验室通过多年的研究和实验,早在 2000 年运用领先的数字信号处理 (DSP) 技术,在其数字助听器中加入中文语音算法,并同时申请了相关专利。目前他们率先推出的以中文语音处理技术为核心的全新数字助听器 —Intelligia ,在临床试验中得到受试者的认可,初步证明这种新型助听器对说以中文为母语的患者有益处。
而现有的数字助听器具有如下缺点:
1、中文语音识别较差:现有的数字助听器对于中文语音识别效果较差,除了缺乏对于噪声的处理外,对于中文语音的语言特性研究不细致。导致识别效果较差。
2、不具备学习能力:现有的数字助听器,大都是单独的产品,没有基于云端和云端的智能化处理系统。对于一个识别空白区或识别误区,将一直都存在问题,无法再使用过程中进行自我改进。
3、识别算法落后:现有的中文语音识别算法,大都针对是单一环境或者直接将英语识别的方法应用过来,缺少独立的中文语音识别算法。在某些特定噪声较大的环境中,无法做到很好的识别。
4、没有后期维护:单一的设备,出售之后缺乏后期维护。没有针对智能化的措施对整个产品进行跟进,在维护过程中发现产品的不足,进而不断提升产品性能。
发明内容
针对上述反外挂技术方法的缺陷,本发明提供了一种基于智能化语音识别技术的助听器系统,该系统具有中文语音识别准确、具备自我学习能力、识别算法领先、后期维护好等优点。
本发明采用的技术方案如下:
一种基于语音识别技术的助听器系统,其特征在于,所述系统包括:识别端、移动端和云端;所述识别端包括:声音采集装置、信号转换装置、分解滤波器、增强系统、预处理计算装置、判决系统、合成滤波器、数据发送装置、本地数据库和数据接收装置;所述移动端包括:控制器、处理器、显示器、语音识别装置和移动数据传输装置;所述云端包括:云端数据传输装置、云端数据库和云端分析处理器;
所述声音采集装置信号连接于信号转换装置;所述信号转换装置信号连接于分解滤波器;所述分解滤波器信号连接于增强系统;所述增强系统信号连接于预处理计算装置、所述预处理计算装置信号连接于判决系统;所述判决系统分别信号连接于合成滤波器和本地数据库;所述合成滤波器信号连接于数据发送装置;所述本地数据库信号连接于数据接收装置;所述数据发送装置信号连接于移动数据传输装置;所述移动数据传输装置分别信号连接于处理器和云端数据传输装置;所述处理器分别信号连接于控制器、语音识别装置和显示器;所述云端数据传输装置分别信号连接于数据接收装置数据接收装置和云端数据库;所述云端数据库信号连接于云端分析处理器。
所述声音采集装置包括:可转向式麦克风和强度识别系统;所述强度识别装置信号连接于可转向式麦克风,用于识别出可转向式麦克风接收到声音信号强度最强的方向,控制麦克风转向该方向;所述可转向式麦克风,信号连接于信号转换装置,用于采集外部声音信号,根据声音采集装置发出的控制命令调整采集声音信号的方向,以及将采集到的声音信号发送至信号转换装置。
所述信号转换装置,用于将采集到的声音信号从模拟信号转换为数字信号;所述分解滤波器包括:分解器、侦测器;所述分解器,用于将接收到的信号分解成16 个波段,进行滤波处理后,再将16个波段的信号组成 10 组通道;所述侦测器包括多个侦测器组,每个侦测器组监测一个通道的信号变化,每个侦测器组包含一个快速时间侦测器和慢速时间侦测器。
所述快速时间侦测器用于监测变化较快的通道信号,而慢速时间侦测器则侦测信号变化较慢的通道信号,根据监测结果,选用与通道信号变化相匹配的压缩时间常数对信号进行压缩处理,或者选用与该通道信号变化相匹配的释放时间常数,对信号进行释放处理;将压缩或释放后的通道信号发送至增强系统;所述增强系统,用于增强所获取的通道信号的强度,将增强后的通道信号发送至预处理计算装置;所述预处理计算装置包括:能量统计单元和增益计算单元;所述能量统计单元,用于统计接收到的通道信号的能量数据,将统计到的能量数据和接收到的通道信号都发送至增益计算单元;所述增益计算单元,用于根据预设的增益计算方法,通过能量数据计算出用于信号识别分类的数据信息,将接收到的通道信号和用于信号识别分类的数据信息发送至判决系统。
所述判决系统,包括分类器、复合器、辅音判决器、声调判决器和重音判决器;所述分类器,用于根据预处理计算装置发送过来的用于信号识别分类的数据信息,将接收到的通道信号进行分类处理,将辅音类通道信号发送至辅音判决器,将声调类信号发送至声调判决器,将重音类通道信号发送至重音判决器;所述辅音判决器,用于将接收到的辅音类信号和本地数据库中的标准信号进行比对,得出准确的辅音,将该辅音发送至复合器;所述声调判决器,用于将接收到的声调类信号和本地数据库中的标准信号进行比对,得出准确的声调,将该声调发送至复合器;所述重音判决器,用于将接收到的重音类信号和本地数据库中的标准信号进行比对,得出准确的重音,将该重音发送至复合器;所述复合器,用于将接收到的辅音、声调和重音进行复合,生成完整的声音信号,将该声音信号发送至合成滤波器。
所述合成滤波器,用于对接收到的声音信号进行平滑处理,和去除声音信号中显著的噪音信号,将处理后的声音信号发送至听筒和数据发送装置;所述数据发送装置,用于将处理后的声音信号发送至移动端数据传输装置。
所述数据传输装置将接收到的声音信号经处理器处理后发送至语音识别装置,所述语音识别装置用于将接收到的声音信号进行识别,转换为文字,在显示器中显示出来;所述控制器,用于人为根据文字信息和接收到的声音信息,判断识别端识别的声音信号是否准确,将判断结果经处理器处理后发送至云端。
所述云端分析处理器,用于将云端数据传输装置接收到的数据信息进行分析处理,统计分析出移动端发送过来的识别不准确的声音信号发送至本地数据库,覆盖原有的标准信号。
所述增益计算方法包括以下步骤:
步骤1:设定获取的信号能量数据为E(n);
步骤2:设定不同信号能量数据之间的关系为:E (n)= a E(n-1),其中: a 是时间常数 ;
步骤3:使用倒谱算法提取基频;其中,倒谱算法中,采用512 个点 的快速傅里叶变换和窗移为10ms的40ms的汉明窗;
步骤4: 用一个简单的滑动平均算法对每个音节测到的基频进行平滑处理,剔除那些平滑段内偏离均值过大的值;
步骤5:将音高和音长分别进行归一化处理;
步骤6:采用一个二次曲线在最小均方误差的意义下逼近基音轨迹。并计算曲线的一次斜率、二次斜率、谷点和平坦度。
采用上述技术方案,本发明产生了以下有益效果:
1、中文语音识别准确:该系统提供独特的方向控制方法,准确控制话筒方向,使得搜集到的语音信号更加清晰和准确;同时,将中文语音进行分解、滤波、能量增强等处理。将中文语音分解为辅音、重音和声调后进行处理。可以最大程度上增强中文语音是别的准确性。
2、具备学习能力:本系统采用的移动端判断语音和云端大数据分析等手段,可以针对识别结果进行自主判断,进而进行大数据统计分析处理,发现是被过程中误判率较高的音调和声调,再将本地数据库中的标准信号进行替换,使得下一次遇到该声调和音调后不再出现误判。
3、识别算法先进:自主研发的中文语音识别算法,能够适应复杂情景的语音识别,将信号能量作为语音识别中的重要要素,可以刨除其他因素的影响。
4、后期维护强:产品出售后,针对用户的反馈,可以进行大数据分析,针对分析结果,可以不断调整算法和处理方法,优化产品,提供产品升级等处理方案。
附图说明
图1是本发明实施例以一种基于智能化语音识别技术的助听器系统。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
本发明实施例1中提供了一种基于智能化语音识别技术的助听器系统,流程图如图1所示,具体步骤如下:
一种基于语音识别技术的助听器系统,其特征在于,所述系统包括:识别端、移动端和云端;所述识别端包括:声音采集装置、信号转换装置、分解滤波器、增强系统、预处理计算装置、判决系统、合成滤波器、数据发送装置、本地数据库和数据接收装置;所述移动端包括:控制器、处理器、显示器、语音识别装置和移动数据传输装置;所述云端包括:云端数据传输装置、云端数据库和云端分析处理器;
所述声音采集装置信号连接于信号转换装置;所述信号转换装置信号连接于分解滤波器;所述分解滤波器信号连接于增强系统;所述增强系统信号连接于预处理计算装置、所述预处理计算装置信号连接于判决系统;所述判决系统分别信号连接于合成滤波器和本地数据库;所述合成滤波器信号连接于数据发送装置;所述本地数据库信号连接于数据接收装置;所述数据发送装置信号连接于移动数据传输装置;所述移动数据传输装置分别信号连接于处理器和云端数据传输装置;所述处理器分别信号连接于控制器、语音识别装置和显示器;所述云端数据传输装置分别信号连接于数据接收装置数据接收装置和云端数据库;所述云端数据库信号连接于云端分析处理器。
所述声音采集装置包括:可转向式麦克风和强度识别系统;所述强度识别装置信号连接于可转向式麦克风,用于识别出可转向式麦克风接收到声音信号强度最强的方向,控制麦克风转向该方向;所述可转向式麦克风,信号连接于信号转换装置,用于采集外部声音信号,根据声音采集装置发出的控制命令调整采集声音信号的方向,以及将采集到的声音信号发送至信号转换装置。
所述信号转换装置,用于将采集到的声音信号从模拟信号转换为数字信号;所述分解滤波器包括:分解器、侦测器;所述分解器,用于将接收到的信号分解成16 个波段,进行滤波处理后,再将16个波段的信号组成 10 组通道;所述侦测器包括多个侦测器组,每个侦测器组监测一个通道的信号变化,每个侦测器组包含一个快速时间侦测器和慢速时间侦测器。
所述快速时间侦测器用于监测变化较快的通道信号,而慢速时间侦测器则侦测信号变化较慢的通道信号,根据监测结果,选用与通道信号变化相匹配的压缩时间常数对信号进行压缩处理,或者选用与该通道信号变化相匹配的释放时间常数,对信号进行释放处理;将压缩或释放后的通道信号发送至增强系统;所述增强系统,用于增强所获取的通道信号的强度,将增强后的通道信号发送至预处理计算装置;所述预处理计算装置包括:能量统计单元和增益计算单元;所述能量统计单元,用于统计接收到的通道信号的能量数据,将统计到的能量数据和接收到的通道信号都发送至增益计算单元;所述增益计算单元,用于根据预设的增益计算方法,通过能量数据计算出用于信号识别分类的数据信息,将接收到的通道信号和用于信号识别分类的数据信息发送至判决系统。
所述判决系统,包括分类器、复合器、辅音判决器、声调判决器和重音判决器;所述分类器,用于根据预处理计算装置发送过来的用于信号识别分类的数据信息,将接收到的通道信号进行分类处理,将辅音类通道信号发送至辅音判决器,将声调类信号发送至声调判决器,将重音类通道信号发送至重音判决器;所述辅音判决器,用于将接收到的辅音类信号和本地数据库中的标准信号进行比对,得出准确的辅音,将该辅音发送至复合器;所述声调判决器,用于将接收到的声调类信号和本地数据库中的标准信号进行比对,得出准确的声调,将该声调发送至复合器;所述重音判决器,用于将接收到的重音类信号和本地数据库中的标准信号进行比对,得出准确的重音,将该重音发送至复合器;所述复合器,用于将接收到的辅音、声调和重音进行复合,生成完整的声音信号,将该声音信号发送至合成滤波器。
所述合成滤波器,用于对接收到的声音信号进行平滑处理,和去除声音信号中显著的噪音信号,将处理后的声音信号发送至听筒和数据发送装置;所述数据发送装置,用于将处理后的声音信号发送至移动端数据传输装置。
所述数据传输装置将接收到的声音信号经处理器处理后发送至语音识别装置,所述语音识别装置用于将接收到的声音信号进行识别,转换为文字,在显示器中显示出来;所述控制器,用于人为根据文字信息和接收到的声音信息,判断识别端识别的声音信号是否准确,将判断结果经处理器处理后发送至云端。
所述云端分析处理器,用于将云端数据传输装置接收到的数据信息进行分析处理,统计分析出移动端发送过来的识别不准确的声音信号发送至本地数据库,覆盖原有的标准信号。
本发明实施例2中提供了一种基于智能化语音识别技术的助听器系统,系统结构图如图1所示:
一种基于语音识别技术的助听器系统,其特征在于,所述系统包括:识别端、移动端和云端;所述识别端包括:声音采集装置、信号转换装置、分解滤波器、增强系统、预处理计算装置、判决系统、合成滤波器、数据发送装置、本地数据库和数据接收装置;所述移动端包括:控制器、处理器、显示器、语音识别装置和移动数据传输装置;所述云端包括:云端数据传输装置、云端数据库和云端分析处理器;
所述声音采集装置信号连接于信号转换装置;所述信号转换装置信号连接于分解滤波器;所述分解滤波器信号连接于增强系统;所述增强系统信号连接于预处理计算装置、所述预处理计算装置信号连接于判决系统;所述判决系统分别信号连接于合成滤波器和本地数据库;所述合成滤波器信号连接于数据发送装置;所述本地数据库信号连接于数据接收装置;所述数据发送装置信号连接于移动数据传输装置;所述移动数据传输装置分别信号连接于处理器和云端数据传输装置;所述处理器分别信号连接于控制器、语音识别装置和显示器;所述云端数据传输装置分别信号连接于数据接收装置数据接收装置和云端数据库;所述云端数据库信号连接于云端分析处理器。
所述声音采集装置包括:可转向式麦克风和强度识别系统;所述强度识别装置信号连接于可转向式麦克风,用于识别出可转向式麦克风接收到声音信号强度最强的方向,控制麦克风转向该方向;所述可转向式麦克风,信号连接于信号转换装置,用于采集外部声音信号,根据声音采集装置发出的控制命令调整采集声音信号的方向,以及将采集到的声音信号发送至信号转换装置。
所述信号转换装置,用于将采集到的声音信号从模拟信号转换为数字信号;所述分解滤波器包括:分解器、侦测器;所述分解器,用于将接收到的信号分解成16 个波段,进行滤波处理后,再将16个波段的信号组成 10 组通道;所述侦测器包括多个侦测器组,每个侦测器组监测一个通道的信号变化,每个侦测器组包含一个快速时间侦测器和慢速时间侦测器。
所述快速时间侦测器用于监测变化较快的通道信号,而慢速时间侦测器则侦测信号变化较慢的通道信号,根据监测结果,选用与通道信号变化相匹配的压缩时间常数对信号进行压缩处理,或者选用与该通道信号变化相匹配的释放时间常数,对信号进行释放处理;将压缩或释放后的通道信号发送至增强系统;所述增强系统,用于增强所获取的通道信号的强度,将增强后的通道信号发送至预处理计算装置;所述预处理计算装置包括:能量统计单元和增益计算单元;所述能量统计单元,用于统计接收到的通道信号的能量数据,将统计到的能量数据和接收到的通道信号都发送至增益计算单元;所述增益计算单元,用于根据预设的增益计算方法,通过能量数据计算出用于信号识别分类的数据信息,将接收到的通道信号和用于信号识别分类的数据信息发送至判决系统。
所述判决系统,包括分类器、复合器、辅音判决器、声调判决器和重音判决器;所述分类器,用于根据预处理计算装置发送过来的用于信号识别分类的数据信息,将接收到的通道信号进行分类处理,将辅音类通道信号发送至辅音判决器,将声调类信号发送至声调判决器,将重音类通道信号发送至重音判决器;所述辅音判决器,用于将接收到的辅音类信号和本地数据库中的标准信号进行比对,得出准确的辅音,将该辅音发送至复合器;所述声调判决器,用于将接收到的声调类信号和本地数据库中的标准信号进行比对,得出准确的声调,将该声调发送至复合器;所述重音判决器,用于将接收到的重音类信号和本地数据库中的标准信号进行比对,得出准确的重音,将该重音发送至复合器;所述复合器,用于将接收到的辅音、声调和重音进行复合,生成完整的声音信号,将该声音信号发送至合成滤波器。
所述合成滤波器,用于对接收到的声音信号进行平滑处理,和去除声音信号中显著的噪音信号,将处理后的声音信号发送至听筒和数据发送装置;所述数据发送装置,用于将处理后的声音信号发送至移动端数据传输装置。
所述数据传输装置将接收到的声音信号经处理器处理后发送至语音识别装置,所述语音识别装置用于将接收到的声音信号进行识别,转换为文字,在显示器中显示出来;所述控制器,用于人为根据文字信息和接收到的声音信息,判断识别端识别的声音信号是否准确,将判断结果经处理器处理后发送至云端。
所述云端分析处理器,用于将云端数据传输装置接收到的数据信息进行分析处理,统计分析出移动端发送过来的识别不准确的声音信号发送至本地数据库,覆盖原有的标准信号。
所述增益计算方法包括以下步骤:
步骤1:设定获取的信号能量数据为E(n);
步骤2:设定不同信号能量数据之间的关系为:E (n)= a E(n-1),其中: a 是时间常数 ;
步骤3:使用倒谱算法提取基频;其中,倒谱算法中,采用512 个点 的快速傅里叶变换和窗移为10ms的40ms的汉明窗;
步骤4: 用一个简单的滑动平均算法对每个音节测到的基频进行平滑处理,剔除那些平滑段内偏离均值过大的值;
步骤5:将音高和音长分别进行归一化处理;
步骤6:采用一个二次曲线在最小均方误差的意义下逼近基音轨迹。并计算曲线的一次斜率、二次斜率、谷点和平坦度。
该系统提供独特的方向控制方法,准确控制话筒方向,使得搜集到的语音信号更加清晰和准确;同时,将中文语音进行分解、滤波、能量增强等处理。将中文语音分解为辅音、重音和声调后进行处理。可以最大程度上增强中文语音是别的准确性。
本系统采用的移动端判断语音和云端大数据分析等手段,可以针对识别结果进行自主判断,进而进行大数据统计分析处理,发现是被过程中误判率较高的音调和声调,再将本地数据库中的标准信号进行替换,使得下一次遇到该声调和音调后不再出现误判。
自主研发的中文语音识别算法,能够适应复杂情景的语音识别,将信号能量作为语音识别中的重要要素,可以刨除其他因素的影响。
产品出售后,针对用户的反馈,可以进行大数据分析,针对分析结果,可以不断调整算法和处理方法,优化产品,提供产品升级等处理方案。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。
Claims (6)
1.一种基于语音识别技术的助听器系统,其特征在于,所述系统包括:识别端、移动端和云端;所述识别端包括:声音采集装置、信号转换装置、包含分解器与侦测器的分解滤波器、对信号能量进行增强的增强系统,包含能量统计单元和增益计算单元的预处理计算装置、包含分类器、复合器、辅声判决器、声调判决器和重音判决器的判决系统、合成滤波器、数据发送装置、本地数据库和数据接收装置;所述移动端包括:控制器、处理器、显示器、语音识别装置和移动数据传输装置;所述云端包括:云端数据传输装置、云端数据库和云端分析处理器;所述声音采集装置信号连接于信号转换装置;所述信号转换装置信号连接于分解滤波器;所述分解滤波器信号连接于增强系统;所述增强系统信号连接于预处理计算装置、所述预处理计算装置信号连接于判决系统;所述判决系统分别信号连接于合成滤波器和本地数据库;所述合成滤波器信号连接于数据发送装置;所述本地数据库信号连接于数据接收装置;所述数据发送装置信号连接于移动数据传输装置;所述移动数据传输装置分别信号连接于处理器和云端数据传输装置;所述处理器分别信号连接于控制器、语音识别装置和显示器;所述云端数据传输装置分别信号连接于数据接收装置和云端数据库;所述云端数据库信号连接于云端分析处理器;
所述信号转换装置,用于将采集到的声音信号从模拟信号转换为数字信号;所述分解器,用于将接收到的信号分解成16个波段,进行滤波处理后,再将16个波段的信号组成10组通道;所述侦测器包括多个侦测器组,每个侦测器组监测一个通道的信号变化,每个侦测器组包含一个快速时间侦测器和慢速时间侦测器,快速时间侦测器用于监测变化较快的通道信号,而慢速时间侦测器则侦测信号变化较慢的通道信号,根据监测结果,选用与通道信号变化相匹配的压缩时间常数对信号进行压缩处理,或者选用与该通道信号变化相匹配的释放时间常数,对信号进行释放处理;将压缩或释放后的通道信号发送至增强系统;所述增强系统,用于增强所获取的通道信号的强度,将增强后的通道信号发送至预处理计算装置;所述能量统计单元,用于统计接收到的通道信号的能量数据,将统计到的能量数据和接收到的通道信号都发送至增益计算单元;所述增益计算单元,用于根据预设的增益计算方法,通过能量数据计算出用于信号识别分类的数据信息,将接收到的通道信号和用于信号识别分类的数据信息发送至判决系统;
所述分类器,用于根据预处理计算装置发送过来的用于信号识别分类的数据信息,将接收到的通道信号进行分类处理,将辅音类通道信号发送至辅音判决器,将声调类信号发送至声调判决器,将重音类通道信号发送至重音判决器;所述辅音判决器,用于将接收到的辅音类信号和本地数据库中的标准信号进行比对,得出准确的辅音,将该辅音发送至复合器;所述声调判决器,用于将接收到的声调类信号和本地数据库中的标准信号进行比对,得出准确的声调,将该声调发送至复合器;所述重音判决器,用于将接收到的重音类信号和本地数据库中的标准信号进行比对,得出准确的重音,将该重音发送至复合器;所述复合器,用于将接收到的辅音、声调和重音进行复合,生成完整的声音信号,将该声音信号发送至合成滤波器。
2.如权利要求1所述的基于语音识别技术的助听器系统,其特征在于,所述声音采集装置包括:可转向式麦克风和强度识别系统;所述强度识别装置信号连接于可转向式麦克风,用于识别出可转向式麦克风接收到声音信号强度最强的方向,控制麦克风转向该方向;所述可转向式麦克风,信号连接于信号转换装置,用于采集外部声音信号,根据声音采集装置发出的控制命令调整采集声音信号的方向,以及将采集到的声音信号发送至信号转换装置。
3.如权利要求1所述的基于语音识别技术的助听器系统,其特征在于,所述合成滤波器,用于对接收到的声音信号进行平滑处理,和去除声音信号中显著的噪音信号,将处理后的声音信号发送至听筒和数据发送装置;所述数据发送装置,用于将处理后的声音信号发送至移动端数据传输装置。
4.如权利要求3所述的基于语音识别技术的助听器系统,其特征在于,所述数据传输装置将接收到的声音信号经处理器处理后发送至语音识别装置,所述语音识别装置用于将接收到的声音信号进行识别,转换为文字,在显示器中显示出来;所述控制器,用于人为根据文字信息和接收到的声音信息,判断识别端识别的声音信号是否准确,将判断结果经处理器处理后发送至云端。
5.如权利要求4所述的基于语音识别技术的助听器系统,其特征在于,所述云端分析处理器,用于将云端数据传输装置接收到的数据信息进行分析处理,统计分析出移动端发送过来的识别不准确的声音信号发送至本地数据库,覆盖原有的标准信号。
6.如权利要求1所述的基于语音识别技术的助听器系统,其特征在于,所述增益计算方法包括以下步骤:
步骤1:设定获取的信号能量数据为E(n);
步骤2:设定不同信号能量数据之间的关系为:E(n)=a E(n-1),其中:a是时间常数;
步骤3:使用倒谱算法提取基频;其中,倒谱算法中,采用512个点的快速傅里叶变换和窗移为10ms的40ms的汉明窗;
步骤4:用一个简单的滑动平均算法对每个音节测到的基频进行平滑处理,剔除那些平滑段内偏离均值过大的值;
步骤5:将音高和音长分别进行归一化处理;
步骤6:采用一个二次曲线在最小均方误差的意义下逼近基音轨迹;并计算曲线的一次斜率、二次斜率、谷点和平坦度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610376244.9A CN105916090B (zh) | 2016-05-31 | 2016-05-31 | 一种基于智能化语音识别技术的助听器系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610376244.9A CN105916090B (zh) | 2016-05-31 | 2016-05-31 | 一种基于智能化语音识别技术的助听器系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105916090A CN105916090A (zh) | 2016-08-31 |
CN105916090B true CN105916090B (zh) | 2019-05-07 |
Family
ID=56742889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610376244.9A Active CN105916090B (zh) | 2016-05-31 | 2016-05-31 | 一种基于智能化语音识别技术的助听器系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105916090B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3561643B1 (en) | 2017-01-20 | 2023-07-19 | Huawei Technologies Co., Ltd. | Method and terminal for implementing voice control |
EP3396978B1 (de) * | 2017-04-26 | 2020-03-11 | Sivantos Pte. Ltd. | Verfahren zum betrieb einer hörvorrichtung und hörvorrichtung |
CN109121057B (zh) * | 2018-08-30 | 2020-11-06 | 北京聆通科技有限公司 | 一种智能助听的方法及其系统 |
TWI767696B (zh) * | 2020-09-08 | 2022-06-11 | 英屬開曼群島商意騰科技股份有限公司 | 自我語音抑制裝置及方法 |
CN114242072A (zh) * | 2021-12-21 | 2022-03-25 | 上海帝图信息科技有限公司 | 一种用于智能机器人的语音识别系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5749066A (en) * | 1995-04-24 | 1998-05-05 | Ericsson Messaging Systems Inc. | Method and apparatus for developing a neural network for phoneme recognition |
CN103035252A (zh) * | 2011-09-30 | 2013-04-10 | 西门子公司 | 中文语音信号处理方法、装置及助听设备 |
CN203233539U (zh) * | 2013-04-19 | 2013-10-09 | 北京亮耳听力技术有限公司 | 一种助听器上的无线动态接收显示系统 |
CN103561643A (zh) * | 2012-04-24 | 2014-02-05 | 松下电器产业株式会社 | 语音辨别能力判定装置、语音辨别能力判定系统、助听器增益决定装置、语音辨别能力判定方法及其程序 |
CN204216964U (zh) * | 2014-08-22 | 2015-03-18 | 郑州迅迈通讯设备股份有限公司 | 一种具有助听器功能的手机 |
CN105007557A (zh) * | 2014-04-16 | 2015-10-28 | 上海柏润工贸有限公司 | 一种具有语音识别和字幕显示功能的智能助听器 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8145483B2 (en) * | 2009-08-05 | 2012-03-27 | Tze Fen Li | Speech recognition method for all languages without using samples |
-
2016
- 2016-05-31 CN CN201610376244.9A patent/CN105916090B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5749066A (en) * | 1995-04-24 | 1998-05-05 | Ericsson Messaging Systems Inc. | Method and apparatus for developing a neural network for phoneme recognition |
CN103035252A (zh) * | 2011-09-30 | 2013-04-10 | 西门子公司 | 中文语音信号处理方法、装置及助听设备 |
CN103561643A (zh) * | 2012-04-24 | 2014-02-05 | 松下电器产业株式会社 | 语音辨别能力判定装置、语音辨别能力判定系统、助听器增益决定装置、语音辨别能力判定方法及其程序 |
CN203233539U (zh) * | 2013-04-19 | 2013-10-09 | 北京亮耳听力技术有限公司 | 一种助听器上的无线动态接收显示系统 |
CN105007557A (zh) * | 2014-04-16 | 2015-10-28 | 上海柏润工贸有限公司 | 一种具有语音识别和字幕显示功能的智能助听器 |
CN204216964U (zh) * | 2014-08-22 | 2015-03-18 | 郑州迅迈通讯设备股份有限公司 | 一种具有助听器功能的手机 |
Also Published As
Publication number | Publication date |
---|---|
CN105916090A (zh) | 2016-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105916090B (zh) | 一种基于智能化语音识别技术的助听器系统 | |
CN102163427B (zh) | 一种基于环境模型的音频异常事件检测方法 | |
CN109034046B (zh) | 一种基于声学检测的电能表内异物自动识别方法 | |
CN105976809B (zh) | 基于语音和面部表情的双模态情感融合的识别方法及系统 | |
CN106601230B (zh) | 基于连续混合高斯hmm模型的物流分拣地名语音识别方法、系统及物流分拣系统 | |
Cheng et al. | Speech emotion recognition using gaussian mixture model | |
CN108305615A (zh) | 一种对象识别方法及其设备、存储介质、终端 | |
CN102543073B (zh) | 一种沪语语音识别信息处理方法 | |
CN110299142B (zh) | 一种基于网络融合的声纹识别方法及装置 | |
CN108896878A (zh) | 一种基于超声波的局部放电检测方法 | |
CN103646649A (zh) | 一种高效的语音检测方法 | |
CN106128477B (zh) | 一种口语识别校正系统 | |
CN104078039A (zh) | 基于隐马尔科夫模型的家用服务机器人语音识别系统 | |
CN102723078A (zh) | 基于自然言语理解的语音情感识别方法 | |
CN108922541A (zh) | 基于dtw和gmm模型的多维特征参数声纹识别方法 | |
CN105448291A (zh) | 基于语音的帕金森症检测方法及检测系统 | |
CN106023986B (zh) | 一种基于声效模式检测的语音识别方法 | |
CN108615533A (zh) | 一种基于深度学习的高性能语音增强方法 | |
CN103035252B (zh) | 中文语音信号处理方法、装置及助听设备 | |
CN104157288B (zh) | 用多个话筒的语音识别 | |
CN106340310B (zh) | 语音检测方法及装置 | |
CN110415707B (zh) | 一种基于语音特征融合和gmm的说话人识别方法 | |
Michalevsky et al. | Speaker identification using diffusion maps | |
CN116230018A (zh) | 一种用于语音合成系统的合成语音质量评估方法 | |
CN111210845B (zh) | 一种基于改进自相关特征的病理语音检测装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231129 Address after: No. 366, North Section of Hupan Road, Tianfu New Area, China (Sichuan) Pilot Free Trade Zone, Chengdu City, Sichuan Province, 610213, China Patentee after: SICHUAN ZHIGE TECHNOLOGY Co.,Ltd. Address before: 610000 Wuhou District Wuhou new town administrative committee, Chengdu, Sichuan, 2 Wuyi East Road 15, 1 units, 2 level 231. Patentee before: CHENGDU JIUSHIDU INDUSTRIAL PRODUCTS DESIGN Co.,Ltd. |