CN107274886B

CN107274886B - 一种语音识别方法和装置

Info

Publication number: CN107274886B
Application number: CN201610211607.3A
Authority: CN
Inventors: 潘春岭
Original assignee: ZTE Corp
Current assignee: ZTE Corp
Priority date: 2016-04-06
Filing date: 2016-04-06
Publication date: 2021-10-15
Anticipated expiration: 2036-04-06
Also published as: CN107274886A; WO2017173721A1

Abstract

本发明公开了一种语音识别方法和装置，包括：建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库，接收语音障碍者的语音，根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作，通过建立语音障碍者语音与标准语音的对应关系，能够准确识别语言障碍者的语音，为他们思想意图的真实表达提供了便利，更加有利于患者语言表达的恢复，树立他们对生活的信心。

Description

一种语音识别方法和装置

技术领域

本发明涉及语音识别技术领域，尤指一种语音识别方法和装置。

背景技术

目前，随着语音识别技术的不断发展，越来愈多的设备(比如手机、电视机、空调器等家用电器)都可以通过语音控制来执行相应的功能，例如：受控设备检测到语音控制指令时，可以根据检测到的控制指令来执行相应的操作，因此，语音交互给用户的日常生活带来了很多便利。

现有技术中，对于来自不同国家或者不同地区的人们，受控设备可以通过很多语音翻译系统对不同国家的语言或者不同地区的方言来进行翻译，根据翻译后的控制指令来执行相应的操作。

但是，采用现有的技术，对于由于后期疾病造成的语音障碍者，例如：中风等导致的语音障碍的患者，他们可以朗读简单的文字，有强烈的会话欲望，却无法准确识别他们的语音进行语音交互，使得不利于患者的病情恢复，丧失了生活的信心。

发明内容

为了解决上述技术问题，本发明提供了一种语音识别方法和装置，能够准确识别语言障碍者的语音，为他们思想意图的真实表达提供了便利，更加有利于患者语言表达的恢复，树立他们对生活的信心。

为了达到本发明目的，第一方面，本发明提供了一种语音识别方法，该方法包括：

建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库；

接收语音障碍者的语音，根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作。

与现有技术相比，本发明实施例提供的一种语音识别方法，包括：建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库，接收语音障碍者的语音，根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作，通过建立语音障碍者语音与标准语音的对应关系，能够准确识别语言障碍者的语音，为他们思想意图的真实表达提供了便利，更加有利于患者语言表达的恢复，树立他们对生活的信心。

在一个实施例中，建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库，包括：

提取所述语音障碍者的常用生活用语语音中出的词组或者文字的语音，与标准语音中的词组或者文字的语音建立一一对应关系的数据库。

通过语音智能处理模块将语音障碍者的常用生活用语语音中的词组或者文字进行提取、拆分，从而便于与标准语音的词组或者文字建立一一对应的关系，提高了数据库的精准性。

在一个实施例中，建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后，还包括：

存储建立后数据库，并上传到云服务器进行备份。

通过对建立后的数据库进行存储并上传到云服务器进行备份，可以方便用户使用，随时随地可以调用数据库。

复核所述数据库中语音障碍者的语音与标准语音的对应关系，修正所述数据库中复核错误的对应关系。

通过对数据库的复核和修正，可以保证数据库中语音障碍者的语音与标准语音的对应关系，从而可以更准确地识别语音障碍者的真实意图。

定期统计所述语音障碍者的语音与标准语音的对应关系的使用频率，根据使用频率更新所述数据库。

通过定期统计语音障碍者的语音与标准语音的对应关系的使用频率，根据使用频率更新所述数据库，可以更好地帮助语音障碍者进行的语音康复训练，便于实现语音障碍者语言的真实意图。

在一个实施例中，在建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之前，还包括：

录入语音障碍者朗读常用生活用语的语音。

通过提前录入语音障碍者常用的生活用语的语音，便于后续数据库的建立，更有利于快速识别语音障碍者发出的语音来表达他们真实的思想意图。

第二方面，本发明实施例提供的一种语音识别装置，该装置包括：语音智能处理模块和语音识别模块；

所述语音智能处理模块，设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库；

所述语音识别模块，设置为接收语音障碍者的语音，根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作。

与现有技术相比，本发明提供的语音识别装置，包括：语音智能处理模块和语音识别模块；所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库，所述语音识别模块，设置为接收语音障碍者的语音，根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作。通过建立语音障碍者语音与标准语音的对应关系，能够准确识别语言障碍者的语音，为他们思想意图的真实表达提供了便利，更加有利于患者语言表达的恢复，树立他们对生活的信心。

在一个实施例中，所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库，是指：

所述语音智能处理模块设置为提取所述语音障碍者的常用生活用语语音中出的词组或者文字的语音，与标准语音中的词组或者文字的语音建立一一对应关系的数据库。

在一个实施例中，所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后，还包括：

所述语音智能处理模块设置为存储建立后数据库，并上传到云服务器进行备份。

所述语音智能处理模块设置为复核所述数据库中语音障碍者的语音与标准语音的对应关系，修正所述数据库中复核错误的对应关系。

所述语音智能处理模块设置为定期统计所述语音障碍者的语音与标准语音的对应关系的使用频率，根据使用频率更新所述数据库。

在一个实施例中，该装置还包括：语音录入模块；

所述语音录入模块设置为录入语音障碍者朗读常用生活用语的语音。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本发明的技术方案，并不构成对本发明技术方案的限制。

图1为本发明提供的一种语音识别方法实施例一的流程示意图；

图2为本发明提供的一种语音识别装置实施例一的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本发明实施例涉及的方法可以应用于语音障碍者，该语音障碍者是由于后期疾病造成的语音障碍者，他们可以朗读简单的文字，有强烈的会话欲望，却无法准确识别他们的语音进行语音交互，例如：中风等导致的语音障碍的患者等，他们可以通过装有语音识别装置的智能设备，例如：手机、平板电脑、智能机器人等，能准备识别他们的语音所表达的真实意图，帮助他们执行相应的操作，但并不限于此。

本发明实施例涉及的方法，旨在解决现有技术中无法准确识别语音障碍者的语音，使得无法表达出真实的思想意图，不利于患者的病情恢复的技术问题。

下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图1为本发明提供的一种语音识别方法实施例一的流程示意图。本实施例涉及的是实现准确识别语音障碍者的语音方法的具体过程。如图1所示，该方法包括：

S101、建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库。

具体的，通过语音智能处理模块对接收的语音障碍者的常用生活用语语音中的词组发音或单个文字的发音进行分离与提取，将语音障碍者的语音与标准语音建立一对一的对应关系，并形成数据库，但并不以此为限。

S102、接收语音障碍者的语音，根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作。

具体的，语音智能处理模块建立完数据库后，就可以通过语音识别模块接收语音障碍者的语音，通过对所接收的语音进行分离、甄别，与数据库的语音对比，识别出对应的标准语音，可以真实表达语音障碍者的思想意图，进行播放，从而方便和家人进行交流，也可以识别出语音障碍者所要进行的语音动作，完成受控设备的操作。。

本发明实施例提供的一种语音识别方法，包括：建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库，接收语音障碍者的语音，根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作，通过建立语音障碍者语音与标准语音的对应关系，能够准确识别语言障碍者的语音，为他们思想意图的真实表达提供了便利，更加有利于患者语言表达的恢复，树立他们对生活的信心。

进一步地，在上述实施例的基础上，在建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之前，还包括：

录入语音障碍者朗读常用生活用语的语音。

具体的，对于语音障碍者，该语音障碍者是由于后期疾病造成的语音障碍者，他们可以朗读简单的文字，有强烈的会话欲望，例如：中风等导致的语音障碍的患者等，录入语音障碍者的常用生活用语语音，该常用生活用语可以提前准备的5000字的文章或者短句或者词组等，这5000字的内容是通过筛选和语音障碍者的生活息息相关的生活常用语，同时还可以根据《现代汉语常用字表》中的常用字(2500字)和次常用字(1000字)两个部分来遴选文章，通过计算机抽样检测，这些常用字在语言中的覆盖率达到99.48％，通过筛选出常用字以便满足语音障碍者的沟通交流，但并不限于此。

进一步地，在上述实施例的基础上，在上述S101步骤中建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库，包括：

具体的，语音智能处理模块要实现语音障碍者语音的语音分拆、断句、断词，提取出语音障碍者语音中的词组或者文字与标准语音中的词组或者文字的语音的一一对应关系，其中，对于断句、断词的分拆方法，可以加入人为的条件设置，如：词与词的间隔在几毫秒之间等，从而来保证分拆的准确性，将建立的一一对应关系形成数据库，但并不限于此。

进一步地，在上述实施例的基础上，在上述S101步骤建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后，还包括：

存储建立后数据库，并上传到云服务器进行备份。

具体的，可以将建立后的数据库在设备内进行存储，并上传到云服务器进行备份，例如：可以将建立好的数据库存储在手机上，并通过手机上传到云服务器上，这样方便调用数据库，也可以避免更换设备后导致数据库的丢失。

具体的，由于语音障碍者的语音发音是一个非正常发音的过程，但却有规律可循，发音并不是随意的，发音的方式基本也是固定的，其中，对于数据库的采集并不可能一次成功，需要有个修正和完善的过程，因此需要语音障碍者自己或是家人对于数据库进行复核，可以通过所述语音智能处理模块对语音障碍者语音进行分拆提取，同时找出对应的标准语音，然后进行合成，并通过语音输出模块予以播放进行复读监听，确定对应关系是否正确，复核语音障碍者的语音与标准语音的对应关系不正确，可以通过修正对应关系来确保数据库的正确性，其中，对于一直出现错误的对应关系，还可以通过强制建立某种词组语音的对应关系，完成数据库的建立。

具体的，所述语音智能处理模块可以根据语音和的语音能力的恢复过程，定期统计所述语音障碍者的语音与标准语音的对应关系的使用频率，根据使用频率来更新所述数据库，这样便于语音障碍者对于自己习惯性的语音进行重新构建，有利于语音障碍者的语音康复，便于实现语音障碍者语言的真实意图。

图2为本发明提供的一种语音识别装置实施例一的结构示意图，如图2所示，一种语音识别装置，包括语音智能处理模块10和语音识别模块20；

所述语音智能处理模块10，设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库；

所述语音识别模块20，设置为接收语音障碍者的语音，根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作。

本发明实施例提供的一种语音识别装置，包括：语音智能处理模块和语音识别模块，语音智能处理模块建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库，接收语音障碍者的语音，语音识别模块根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作，通过建立语音障碍者语音与标准语音的对应关系，能够准确识别语言障碍者的语音，为他们思想意图的真实表达提供了便利，更加有利于患者语言表达的恢复，树立他们对生活的信心。

进一步地，在上述实施例的基础上，该装置还包括：语音录入模块30；

所述语音录入模块30设置为录入语音障碍者朗读常用生活用语的语音。

本发明实施例提供的装置，可以执行上述方法实施例，其实现原理和技术效果类似，在此不再赘述。

进一步地，在上述实施例的基础上，所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库，是指：

进一步地，在上述实施例的基础上，所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后，还包括：

虽然本发明所揭露的实施方式如上，但所述的内容仅为便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式及细节上进行任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种语音识别方法，其特征在于，包括：

建立语音障碍者的常用生活用语语音与标准语音的对应关系的数据库；

接收语音障碍者的语音，根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作;

其中，建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库，包括：

提取所述语音障碍者的常用生活用语语音中出的词组或者文字的语音，与标准语音中的词组或者文字的语音建立一一对应关系的数据库；

2.根据权利要求1所述的方法，其特征在于，建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后，还包括：

存储建立后数据库，并上传到云服务器进行备份。

3.根据权利要求1所述的方法，其特征在于，建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后，还包括：

4.根据权利要求1所述的方法，其特征在于，在建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之前，还包括：

录入语音障碍者朗读常用生活用语的语音。

5.一种语音识别装置，其特征在于，包括语音智能处理模块和语音识别模块；

所述语音智能处理模块，设置为建立语音障碍者的常用生活用语语音与标准语音的对应关系的数据库；

所述语音识别模块，设置为接收语音障碍者的语音，根据所述数据库识别出对应的标准语音执行所述标准语音相应的操作；

其中，所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库，是指：

所述语音智能处理模块设置为提取所述语音障碍者的常用生活用语语音中出的词组或者文字的语音，与标准语音中的词组或者文字的语音建立一一对应关系的数据库，以及，定期统计所述语音障碍者的语音与标准语音的对应关系的使用频率，根据使用频率更新所述数据库。

6.根据权利要求5所述的装置，其特征在于，所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后，还包括：

7.根据权利要求5所述的装置，其特征在于，所述语音智能处理模块设置为建立所述语音障碍者的常用生活用语语音与标准语音的对应关系的数据库之后，还包括：

8.根据权利要求5所述的装置，其特征在于，该装置还包括：语音录入模块；