CN112735441A

CN112735441A - 智能生态语音识别系统

Info

Publication number: CN112735441A
Application number: CN202011415696.6A
Authority: CN
Inventors: 白保成
Original assignee: Zhejiang Hozon New Energy Automobile Co Ltd
Current assignee: Zhejiang Hozon New Energy Automobile Co Ltd
Priority date: 2020-12-07
Filing date: 2020-12-07
Publication date: 2021-04-30

Abstract

智能生态语音识别系统，包括：创建单元，用于根据常规日常生活用语形成预存的唤醒词查找树；接收单元，用于接收语音字符串；分解单元，用于将相邻语音字符进行分解，并记录；唤醒单元，用于判断所述分解后的语音字符串是否存在预存的唤醒词；执行单元，根据唤醒词执行相对应的功能，并执行分解后剩余的语音字符所对应的功能或人物；与现有技术相比，通过预先设置唤醒词查找树，当接收到语音字符串时对语音字符串进行分解，并根据实际情况对车载模块进行唤醒和执行，且接收单元实时处于后台工作状态，及时待命，具有更好的用户体验，同时本申请的唤醒功能与执行功能同步工作，减少了语音识别指令工作的步骤。

Description

智能生态语音识别系统

技术领域

本发明属于语音识别技术领域，尤其是一种智能生态语音识别系统。

背景技术

语音识别是一门交叉学科。近二十年来，语音识别技术取得显著进步，开始从实验室走向市场。人们预计，未来10年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

在目前的新能源汽车中，语音识别功能在智能化交互方面的体验不太好，主要存在以下问题点：

1、命令词模糊识别程度太低，说法稍微不一样就不能识别；如语音输入“打开车窗”可以执行打开天窗的动作，但语音输入“请帮我打开天窗”就不能识别，智能化程度太低；

2、无法根据语境实现多次交互的场景，唤醒后执行一个命令后，必须输入唤醒词，才能继续执行下一个命令。

发明内容

本发明是为了克服上述现有技术中的缺陷，提供一种用户体验好，行驶安全，节约时间的智能生态语音识别系统。

为了达到以上目的，本发明所采用的技术方案是：智能生态语音识别系统，包括：

创建单元，用于根据常规日常生活用语形成预存的唤醒词查找树；

接收单元，用于接收语音字符串；

分解单元，用于将相邻语音字符进行分解，并记录；

唤醒单元，用于判断所述分解后的语音字符串是否存在预存的唤醒词；

执行单元，根据唤醒词执行相对应的功能，并执行分解后剩余的语音字符所对应的功能或人物；

提示单元，用于将所需执行的操作进行语音播放。

作为本发明的一种优选方案，所述唤醒词查找树包括一类单词查找树和至少一个二类单词查找树，一类单词查找树优先级大于二类单词查找树。

作为本发明的一种优选方案，所述一类单词查找树对应车载功能，二类单词查找树为储存的人物或地点或时间。

作为本发明的一种优选方案，所述唤醒词满足一类单词查找树时才传送至二类单词查找树中。

作为本发明的一种优选方案，所述分解单元在获取语音字符串后，创建至少一个语音字符词。

作为本发明的一种优选方案，所述分解单元包括选择模块和划分模块，选择模块用于选择最接近语音字符词作为最优语音字符词，划分模块用于最优语音字符词的划分顺序将语音字符串划分为至少一个语音字符词。

作为本发明的一种优选方案，所述划分后的至少一个语音字符词依次传送至唤醒单元上。

作为本发明的一种优选方案，所述接收单元还创建至少一个与语音字符串相对应的混淆音字符串。

作为本发明的一种优选方案，所述分解单元根据分解后的语音字符词创建至少一个与分解后的语音字符词相对应的混淆音字符串。

作为本发明的一种优选方案，所述接收单元与后台服务系统相连。

本发明的有益效果是，与现有技术相比：通过预先设置唤醒词查找树，当接收到语音字符串时对语音字符串进行分解，并根据实际情况对车载模块进行唤醒和执行，且接收单元实时处于后台工作状态，及时待命，具有更好的用户体验，同时本申请的唤醒功能与执行功能同步工作，减少了语音识别指令工作的步骤。

附图说明

图1是本发明的流程图。

具体实施方式

下面结合附图对本发明实施例作详细说明。

如图1所示，智能生态语音识别系统，包括：

接收单元，用于接收语音字符串；

分解单元，用于将相邻语音字符进行分解，并记录；

提示单元，用于将所需执行的操作进行语音播放。

创建单元通过预先设置的存储模块进行设置，唤醒词查找树根据日常生活用语可分为功能性单词、名词、人物名称、地点等，功能性单词和名词根据车载模块进行设置，一个车载模块对应至少一个功能性单词和名词。

创建单元形成一个数据库，且创建单元内包含有多个语音字符串，不同的语音字符串对应不同的车载模块，每个语音字符串至少对应连接一个车载模块，创建单元与接收单元、分解单元和唤醒单元电性连接，唤醒单元将分解后的语音字符串与创建单元所形成的数据库中的语音字符串对比，当具有一样的语音字符串时，激活语音字符串相对应的车载模块。

接收单元用于接收语音字符串，并将语音字符串转换成对应的文字字符串，且接收单元还创建至少一个与语音字符串相对应的混淆音字符串，混淆音字符串中根据拼音的变化量和常用语对不同的混淆音字符串优先级进行排序，拼音的变化量最少且常用语的为默认混淆音字符串，同时使用者也可手动或语音对混淆音字符串进行选择或操作。

执行单元对应所有的车载模块，执行单元将语音字符串传动之对应的车载模块，驱动对应的车载模块工作。

唤醒词查找树包括一类单词查找树和至少一个二类单词查找树，一类单词查找树优先级大于二类单词查找树，至少一个二类单词查找树并列设置，且二类单词查找树可根据不同种类划分为人物或地点或时间等类别。

一类单词查找树对应车载功能，二类单词查找树为储存的人物或地点或时间，唤醒词满足一类单词查找树时才传送至二类单词查找树中，当分解单元分解后的单词在一类单词查找树找不到对应项时，系统结束，当分解单元分解后的单词在一类单词查找树找得到对应项时，将分解后剩下的单词传送至二类单词查找树中进行查找。

分解单元在获取语音字符串后，创建至少一个语音字符词，分解单元包括选择模块和划分模块，选择模块用于选择最接近语音字符词作为最优语音字符词，划分模块用于最优语音字符词的划分顺序将语音字符串划分为至少一个语音字符词，划分后的至少一个语音字符词依次传送至唤醒单元上，

分解单元根据分解后的语音字符词创建至少一个与分解后的语音字符词相对应的混淆音字符串。

通过创建基于混淆音字符串，可以提高语音识别效率和丰富的语音识别结果，具体地，以汉语发音为例，当语音设备获取用户的语音指令为“zhang”，会生成“zhang”的全部混淆音字符串，例如“zang”、“zhan”和“zan”等，对“zang”、“zhan”和“zan”进行字符划分后，生成包括“zang”、“zhan”和“zan”的单词查找树，并将单词查找树的生成结果提示给用户，这种识别方式降低了对用户的发音准确度和语速的要求，提升了用户的使用体验。

接收单元与后台服务系统相连，接收单元始终处于后台工作状态。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现；因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.智能生态语音识别系统，其特征在于，包括：

接收单元，用于接收语音字符串；

分解单元，用于将相邻语音字符进行分解，并记录；

提示单元，用于将所需执行的操作进行语音播放。

2.根据权利要求1所述的智能生态语音识别系统，其特征在于，所述唤醒词查找树包括一类单词查找树和至少一个二类单词查找树，一类单词查找树优先级大于二类单词查找树。

3.根据权利要求2所述的智能生态语音识别系统，其特征在于，所述一类单词查找树对应车载功能，二类单词查找树为储存的人物或地点或时间。

4.根据权利要求2所述的智能生态语音识别系统，其特征在于，所述唤醒词满足一类单词查找树时才传送至二类单词查找树中。

5.根据权利要求1所述的智能生态语音识别系统，其特征在于，所述分解单元在获取语音字符串后，创建至少一个语音字符词。

6.根据权利要求5所述的智能生态语音识别系统，其特征在于，所述分解单元包括选择模块和划分模块，选择模块用于选择最接近语音字符词作为最优语音字符词，划分模块用于最优语音字符词的划分顺序将语音字符串划分为至少一个语音字符词。

7.根据权利要求6所述的智能生态语音识别系统，其特征在于，所述划分后的至少一个语音字符词依次传送至唤醒单元上。

8.根据权利要求1所述的智能生态语音识别系统，其特征在于，所述接收单元还创建至少一个与语音字符串相对应的混淆音字符串。

9.根据权利要求5所述的智能生态语音识别系统，其特征在于，所述分解单元根据分解后的语音字符词创建至少一个与分解后的语音字符词相对应的混淆音字符串。

10.根据权利要求1所述的智能生态语音识别系统，其特征在于，所述接收单元与后台服务系统相连。