CN105916090B

CN105916090B - 一种基于智能化语音识别技术的助听器系统

Info

Publication number: CN105916090B
Application number: CN201610376244.9A
Authority: CN
Inventors: 曾丽
Original assignee: Chengdu Jiushidu Industrial Product Design Co Ltd
Current assignee: Sichuan Zhige Technology Co ltd
Priority date: 2016-05-31
Filing date: 2016-05-31
Publication date: 2019-05-07
Anticipated expiration: 2036-05-31
Also published as: CN105916090A

Abstract

本发明提供了一种基于智能化语音识别技术的助听器系统，涉及医疗设备领域，其特征在于，所述系统包括：识别端、移动端和云端；所述识别端包括：声音采集装置、信号转换装置、分解滤波器、增强系统、预处理计算装置、判决系统、合成滤波器、数据发送装置、本地数据库和数据接收装置；所述移动端包括：控制器、处理器、显示器、语音识别装置和移动数据传输装置；所述云端包括：云端数据传输装置、云端数据库和云端分析处理器。该系统具有中文语音识别准确、具备自我学习能力、识别算法领先、后期维护好等优点。

Description

一种基于智能化语音识别技术的助听器系统

技术领域

本发明涉及医疗领域，特别是涉及一种基于智能化语音识别技术的助听器系统。

背景技术

目前国外对助听器研究发展的一个热点则是集中在中国，确切地讲是基于对汉语语言和语音研究，开发相关的语音识别技术和产品。听觉科学是一门发展迅速、知识更新很快的一门学科，它所研究的对象以人的听觉为中心，现在我们将介绍和讨论科学家和听力学家更关心的是怎样将听觉科学运用到中国人的听觉和言语实际中去。

汉语是具有特征化的音调性语言，与其他以拼音字母为主的语系，如斯拉夫语系等具有很明显的语音学差别。这种差别不仅仅在语言特征上非常明确，在具体使用时，区别也很大。是否不同语系的不同语音特征会影响听觉受损患者对言语的理解，尤其是在使用基于不同语系研究成果制作成的助听器时，这种语音的差异是否起到重要作用，最近已成为学术和科研的一个热门课题。比如国内研制的人工耳蜗的一个特点便是在设计其算法时考虑到中文语音特点。国外助听器厂商将在近期推出以中文语音为特征算法的助听器。加拿大在中国的一语音实验室通过多年的研究和实验，早在 2000 年运用领先的数字信号处理 (DSP) 技术，在其数字助听器中加入中文语音算法，并同时申请了相关专利。目前他们率先推出的以中文语音处理技术为核心的全新数字助听器 —Intelligia ，在临床试验中得到受试者的认可，初步证明这种新型助听器对说以中文为母语的患者有益处。

而现有的数字助听器具有如下缺点：

1、中文语音识别较差：现有的数字助听器对于中文语音识别效果较差，除了缺乏对于噪声的处理外，对于中文语音的语言特性研究不细致。导致识别效果较差。

2、不具备学习能力：现有的数字助听器，大都是单独的产品，没有基于云端和云端的智能化处理系统。对于一个识别空白区或识别误区，将一直都存在问题，无法再使用过程中进行自我改进。

3、识别算法落后：现有的中文语音识别算法，大都针对是单一环境或者直接将英语识别的方法应用过来，缺少独立的中文语音识别算法。在某些特定噪声较大的环境中，无法做到很好的识别。

4、没有后期维护：单一的设备，出售之后缺乏后期维护。没有针对智能化的措施对整个产品进行跟进，在维护过程中发现产品的不足，进而不断提升产品性能。

发明内容

针对上述反外挂技术方法的缺陷，本发明提供了一种基于智能化语音识别技术的助听器系统，该系统具有中文语音识别准确、具备自我学习能力、识别算法领先、后期维护好等优点。

本发明采用的技术方案如下：

一种基于语音识别技术的助听器系统，其特征在于，所述系统包括：识别端、移动端和云端；所述识别端包括：声音采集装置、信号转换装置、分解滤波器、增强系统、预处理计算装置、判决系统、合成滤波器、数据发送装置、本地数据库和数据接收装置；所述移动端包括：控制器、处理器、显示器、语音识别装置和移动数据传输装置；所述云端包括：云端数据传输装置、云端数据库和云端分析处理器；

所述声音采集装置信号连接于信号转换装置；所述信号转换装置信号连接于分解滤波器；所述分解滤波器信号连接于增强系统；所述增强系统信号连接于预处理计算装置、所述预处理计算装置信号连接于判决系统；所述判决系统分别信号连接于合成滤波器和本地数据库；所述合成滤波器信号连接于数据发送装置；所述本地数据库信号连接于数据接收装置；所述数据发送装置信号连接于移动数据传输装置；所述移动数据传输装置分别信号连接于处理器和云端数据传输装置；所述处理器分别信号连接于控制器、语音识别装置和显示器；所述云端数据传输装置分别信号连接于数据接收装置数据接收装置和云端数据库；所述云端数据库信号连接于云端分析处理器。

所述声音采集装置包括：可转向式麦克风和强度识别系统；所述强度识别装置信号连接于可转向式麦克风，用于识别出可转向式麦克风接收到声音信号强度最强的方向，控制麦克风转向该方向；所述可转向式麦克风，信号连接于信号转换装置，用于采集外部声音信号，根据声音采集装置发出的控制命令调整采集声音信号的方向，以及将采集到的声音信号发送至信号转换装置。

所述信号转换装置，用于将采集到的声音信号从模拟信号转换为数字信号；所述分解滤波器包括：分解器、侦测器；所述分解器，用于将接收到的信号分解成16 个波段，进行滤波处理后，再将16个波段的信号组成 10 组通道；所述侦测器包括多个侦测器组，每个侦测器组监测一个通道的信号变化，每个侦测器组包含一个快速时间侦测器和慢速时间侦测器。

所述快速时间侦测器用于监测变化较快的通道信号，而慢速时间侦测器则侦测信号变化较慢的通道信号，根据监测结果，选用与通道信号变化相匹配的压缩时间常数对信号进行压缩处理，或者选用与该通道信号变化相匹配的释放时间常数，对信号进行释放处理；将压缩或释放后的通道信号发送至增强系统；所述增强系统，用于增强所获取的通道信号的强度，将增强后的通道信号发送至预处理计算装置；所述预处理计算装置包括：能量统计单元和增益计算单元；所述能量统计单元，用于统计接收到的通道信号的能量数据，将统计到的能量数据和接收到的通道信号都发送至增益计算单元；所述增益计算单元，用于根据预设的增益计算方法，通过能量数据计算出用于信号识别分类的数据信息，将接收到的通道信号和用于信号识别分类的数据信息发送至判决系统。

所述判决系统，包括分类器、复合器、辅音判决器、声调判决器和重音判决器；所述分类器，用于根据预处理计算装置发送过来的用于信号识别分类的数据信息，将接收到的通道信号进行分类处理，将辅音类通道信号发送至辅音判决器，将声调类信号发送至声调判决器，将重音类通道信号发送至重音判决器；所述辅音判决器，用于将接收到的辅音类信号和本地数据库中的标准信号进行比对，得出准确的辅音，将该辅音发送至复合器；所述声调判决器，用于将接收到的声调类信号和本地数据库中的标准信号进行比对，得出准确的声调，将该声调发送至复合器；所述重音判决器，用于将接收到的重音类信号和本地数据库中的标准信号进行比对，得出准确的重音，将该重音发送至复合器；所述复合器，用于将接收到的辅音、声调和重音进行复合，生成完整的声音信号，将该声音信号发送至合成滤波器。

所述合成滤波器，用于对接收到的声音信号进行平滑处理，和去除声音信号中显著的噪音信号，将处理后的声音信号发送至听筒和数据发送装置；所述数据发送装置，用于将处理后的声音信号发送至移动端数据传输装置。

所述数据传输装置将接收到的声音信号经处理器处理后发送至语音识别装置，所述语音识别装置用于将接收到的声音信号进行识别，转换为文字，在显示器中显示出来；所述控制器，用于人为根据文字信息和接收到的声音信息，判断识别端识别的声音信号是否准确，将判断结果经处理器处理后发送至云端。

所述云端分析处理器，用于将云端数据传输装置接收到的数据信息进行分析处理，统计分析出移动端发送过来的识别不准确的声音信号发送至本地数据库，覆盖原有的标准信号。

所述增益计算方法包括以下步骤：

步骤1：设定获取的信号能量数据为E（n）;

步骤2：设定不同信号能量数据之间的关系为：E (n)= a E(n-1)，其中： a 是时间常数；

步骤3：使用倒谱算法提取基频；其中，倒谱算法中，采用512 个点的快速傅里叶变换和窗移为10ms的40ms的汉明窗；

步骤4：用一个简单的滑动平均算法对每个音节测到的基频进行平滑处理，剔除那些平滑段内偏离均值过大的值；

步骤5：将音高和音长分别进行归一化处理；

步骤6：采用一个二次曲线在最小均方误差的意义下逼近基音轨迹。并计算曲线的一次斜率、二次斜率、谷点和平坦度。

采用上述技术方案，本发明产生了以下有益效果：

1、中文语音识别准确：该系统提供独特的方向控制方法，准确控制话筒方向，使得搜集到的语音信号更加清晰和准确；同时，将中文语音进行分解、滤波、能量增强等处理。将中文语音分解为辅音、重音和声调后进行处理。可以最大程度上增强中文语音是别的准确性。

2、具备学习能力：本系统采用的移动端判断语音和云端大数据分析等手段，可以针对识别结果进行自主判断，进而进行大数据统计分析处理，发现是被过程中误判率较高的音调和声调，再将本地数据库中的标准信号进行替换，使得下一次遇到该声调和音调后不再出现误判。

3、识别算法先进：自主研发的中文语音识别算法，能够适应复杂情景的语音识别，将信号能量作为语音识别中的重要要素，可以刨除其他因素的影响。

4、后期维护强：产品出售后，针对用户的反馈，可以进行大数据分析，针对分析结果，可以不断调整算法和处理方法，优化产品，提供产品升级等处理方案。

附图说明

图1是本发明实施例以一种基于智能化语音识别技术的助听器系统。

具体实施方式

本说明书中公开的所有特征，或公开的所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以以任何方式组合。

本说明书（包括任何附加权利要求、摘要）中公开的任一特征，除非特别叙述，均可被其他等效或具有类似目的的替代特征加以替换。即，除非特别叙述，每个特征只是一系列等效或类似特征中的一个例子而已。

本发明实施例1中提供了一种基于智能化语音识别技术的助听器系统，流程图如图1所示，具体步骤如下：

本发明实施例2中提供了一种基于智能化语音识别技术的助听器系统，系统结构图如图1所示：

所述增益计算方法包括以下步骤：

步骤1：设定获取的信号能量数据为E（n）;

步骤5：将音高和音长分别进行归一化处理；

该系统提供独特的方向控制方法，准确控制话筒方向，使得搜集到的语音信号更加清晰和准确；同时，将中文语音进行分解、滤波、能量增强等处理。将中文语音分解为辅音、重音和声调后进行处理。可以最大程度上增强中文语音是别的准确性。

本系统采用的移动端判断语音和云端大数据分析等手段，可以针对识别结果进行自主判断，进而进行大数据统计分析处理，发现是被过程中误判率较高的音调和声调，再将本地数据库中的标准信号进行替换，使得下一次遇到该声调和音调后不再出现误判。

自主研发的中文语音识别算法，能够适应复杂情景的语音识别，将信号能量作为语音识别中的重要要素，可以刨除其他因素的影响。

产品出售后，针对用户的反馈，可以进行大数据分析，针对分析结果，可以不断调整算法和处理方法，优化产品，提供产品升级等处理方案。

本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合，以及披露的任一新的方法或过程的步骤或任何新的组合。

Claims

1.一种基于语音识别技术的助听器系统，其特征在于，所述系统包括：识别端、移动端和云端；所述识别端包括：声音采集装置、信号转换装置、包含分解器与侦测器的分解滤波器、对信号能量进行增强的增强系统，包含能量统计单元和增益计算单元的预处理计算装置、包含分类器、复合器、辅声判决器、声调判决器和重音判决器的判决系统、合成滤波器、数据发送装置、本地数据库和数据接收装置；所述移动端包括：控制器、处理器、显示器、语音识别装置和移动数据传输装置；所述云端包括：云端数据传输装置、云端数据库和云端分析处理器；所述声音采集装置信号连接于信号转换装置；所述信号转换装置信号连接于分解滤波器；所述分解滤波器信号连接于增强系统；所述增强系统信号连接于预处理计算装置、所述预处理计算装置信号连接于判决系统；所述判决系统分别信号连接于合成滤波器和本地数据库；所述合成滤波器信号连接于数据发送装置；所述本地数据库信号连接于数据接收装置；所述数据发送装置信号连接于移动数据传输装置；所述移动数据传输装置分别信号连接于处理器和云端数据传输装置；所述处理器分别信号连接于控制器、语音识别装置和显示器；所述云端数据传输装置分别信号连接于数据接收装置和云端数据库；所述云端数据库信号连接于云端分析处理器；

所述信号转换装置，用于将采集到的声音信号从模拟信号转换为数字信号；所述分解器，用于将接收到的信号分解成16个波段，进行滤波处理后，再将16个波段的信号组成10组通道；所述侦测器包括多个侦测器组，每个侦测器组监测一个通道的信号变化，每个侦测器组包含一个快速时间侦测器和慢速时间侦测器，快速时间侦测器用于监测变化较快的通道信号，而慢速时间侦测器则侦测信号变化较慢的通道信号，根据监测结果，选用与通道信号变化相匹配的压缩时间常数对信号进行压缩处理，或者选用与该通道信号变化相匹配的释放时间常数，对信号进行释放处理；将压缩或释放后的通道信号发送至增强系统；所述增强系统，用于增强所获取的通道信号的强度，将增强后的通道信号发送至预处理计算装置；所述能量统计单元，用于统计接收到的通道信号的能量数据，将统计到的能量数据和接收到的通道信号都发送至增益计算单元；所述增益计算单元，用于根据预设的增益计算方法，通过能量数据计算出用于信号识别分类的数据信息，将接收到的通道信号和用于信号识别分类的数据信息发送至判决系统；

所述分类器，用于根据预处理计算装置发送过来的用于信号识别分类的数据信息，将接收到的通道信号进行分类处理，将辅音类通道信号发送至辅音判决器，将声调类信号发送至声调判决器，将重音类通道信号发送至重音判决器；所述辅音判决器，用于将接收到的辅音类信号和本地数据库中的标准信号进行比对，得出准确的辅音，将该辅音发送至复合器；所述声调判决器，用于将接收到的声调类信号和本地数据库中的标准信号进行比对，得出准确的声调，将该声调发送至复合器；所述重音判决器，用于将接收到的重音类信号和本地数据库中的标准信号进行比对，得出准确的重音，将该重音发送至复合器；所述复合器，用于将接收到的辅音、声调和重音进行复合，生成完整的声音信号，将该声音信号发送至合成滤波器。

2.如权利要求1所述的基于语音识别技术的助听器系统，其特征在于，所述声音采集装置包括：可转向式麦克风和强度识别系统；所述强度识别装置信号连接于可转向式麦克风，用于识别出可转向式麦克风接收到声音信号强度最强的方向，控制麦克风转向该方向；所述可转向式麦克风，信号连接于信号转换装置，用于采集外部声音信号，根据声音采集装置发出的控制命令调整采集声音信号的方向，以及将采集到的声音信号发送至信号转换装置。

3.如权利要求1所述的基于语音识别技术的助听器系统，其特征在于，所述合成滤波器，用于对接收到的声音信号进行平滑处理，和去除声音信号中显著的噪音信号，将处理后的声音信号发送至听筒和数据发送装置；所述数据发送装置，用于将处理后的声音信号发送至移动端数据传输装置。

4.如权利要求3所述的基于语音识别技术的助听器系统，其特征在于，所述数据传输装置将接收到的声音信号经处理器处理后发送至语音识别装置，所述语音识别装置用于将接收到的声音信号进行识别，转换为文字，在显示器中显示出来；所述控制器，用于人为根据文字信息和接收到的声音信息，判断识别端识别的声音信号是否准确，将判断结果经处理器处理后发送至云端。

5.如权利要求4所述的基于语音识别技术的助听器系统，其特征在于，所述云端分析处理器，用于将云端数据传输装置接收到的数据信息进行分析处理，统计分析出移动端发送过来的识别不准确的声音信号发送至本地数据库，覆盖原有的标准信号。

6.如权利要求1所述的基于语音识别技术的助听器系统，其特征在于，所述增益计算方法包括以下步骤：

步骤1：设定获取的信号能量数据为E(n)；

步骤2：设定不同信号能量数据之间的关系为：E(n)＝a E(n-1)，其中：a是时间常数；

步骤3：使用倒谱算法提取基频；其中，倒谱算法中，采用512个点的快速傅里叶变换和窗移为10ms的40ms的汉明窗；

步骤5：将音高和音长分别进行归一化处理；

步骤6：采用一个二次曲线在最小均方误差的意义下逼近基音轨迹；并计算曲线的一次斜率、二次斜率、谷点和平坦度。