CN208284230U

CN208284230U - 一种语音识别装置、语音识别系统及智能设备

Info

Publication number: CN208284230U
Application number: CN201820585602.1U
Authority: CN
Inventors: 晏正腾; 周永吉; 丁甲辰; 陈贤; 袁锐
Original assignee: Guizhou Little Love Robot Technology Co Ltd
Current assignee: Guizhou Little Love Robot Technology Co Ltd
Priority date: 2018-04-20
Filing date: 2018-04-20
Publication date: 2018-12-25
Anticipated expiration: 2028-04-20

Abstract

本实用新型提出了一种语音识别装置，包括：所述语音识别引擎器件，用于对采集到的语音元数据进行语音识别，得到语音识别数据，并将所述语音识别数据发送至所述语义识别器件；所述语义识别器件，用于生成每一所述语音识别数据的置信度；所述信息处理器件，用于读取所述语义识别器件中的每一携带置信度的语音识别数据，并对所有所述语音识别数据的置信度进行比较，输出置信度最高的语音识别数据。本实用新型还公开了一种语音识别系统及智能设备，通过实施上述方案，能够克服现有技术中语音识别装置仅通过一个语音识别引擎器对语音识别准确率低的缺陷，有效地提高了语言识别的准确率和可靠性。

Description

一种语音识别装置、语音识别系统及智能设备

技术领域

本实用新型涉及语音识别技术领域，尤其涉及一种语音识别装置、语音识别系统及智能设备。

背景技术

随着语音识别技术的快速发展，越来越多的语音识别装置安装在智能终端、家电设备、公共设施设备和工业设备上，以使各种终端设备能够实现语音识别，消除了人机交互的障碍。但现有的语音识别装置通常由于使用一种语音识别引擎器件对采集到的语音源数据进行识别，导致个别语音词语识别率偏低，或者个别语音词语信息的语音识别时间过长。

实用新型内容

本实用新型提出了一种语音识别装置、语音识别系统及电子设备，用以解决现有技术中语音识别装置对语音元数据识别率低的问题。

本实用新型采用的技术方案是提供一种语音识别装置，包括：语义识别器件，信息处理器件，及两个或两个以上的语音识别引擎器件；所述语义识别器件分别与每一所述语音识别引擎器件，及所述信息处理器件连接；

所述语音识别引擎器件，用于对采集到的语音元数据进行语音识别，得到语音识别数据，并将所述语音识别数据发送至所述语义识别器件；

所述语义识别器件，用于生成每一所述语音识别数据的置信度；

所述信息处理器件，用于读取所述语义识别器件中的每一携带置信度的语音识别数据，并对所有所述语音识别数据的置信度进行比较，输出置信度最高的语音识别数据。

可选地，所述装置还包括：麦克风；所述麦克风分别与每一所述语音识别引擎器件连接；

所述麦克风，用于将采集到的语音元数据分别发送至每一所述语音识别引擎器件。

可选地，所述装置还包括：文字转换器件；所述文字转换器件与所述信息处理器件连接；

所述文字转换器件，用于将置信度最高的语音识别数据转换为文字信息。

可选地，所述语音识别引擎器件的数量为三个至五个。

本实用新型还提供一种语音识别系统，包括：客户终端和服务器；其中，所述客户终端包括：信息处理器件，第一通信器件，及两个或两个以上的语音识别引擎器件；所述服务器包括：语义识别器件和第二通信器件；

所述语音识别引擎器件，用于对采集到的语音元数据进行语音识别，得到语音识别数据，并将所述语音识别数据发送至所述第一通信器件；

所述第一通信器件，用于将接收到的每一所述语音识别数据发送至第二通信器件；将接收到的所有所述携带置信度的语音识别数据发送至所述信息处理器件；

所述第二通信器件，用于将接收到的每一所述语音识别数据发送至所述语义识别器件；将读取到的所述语义识别器件中所有携带置信度的语音识别数据发送至所述第一通信器件；

所述语义识别器件，用于生成接收到的每一所述语音识别数据的置信度；

所述信息处理器件，用于对接收到的所有所述语音识别数据的置信度进行比较，输出置信度最高的语音识别数据。

可选地，所述客户终端还包括：文字转换器件；所述文字转换器件与所述信息处理器件连接；

本实用新型还提供一种语音识别系统，包括：客户终端和服务器；其中，所述客户终端包括：信息处理器件和第一通信器件；所述服务器包括：第二通信器件，语义识别器件，及两个或两个以上的语音识别引擎器件；

所述第一通信器件，用于将采集到的语音元数据发送至所述第二通信器件；将接收到的所有携带置信度的语音识别数据发送至所述信息处理器件；

所述第二通信器件，用于将接收到的所述语音元数据发送至每一所述语音识别引擎器件；将读取到的所述语义识别器件中所有携带置信度的语音识别数据发送至所述第一通信器件；

所述语音识别引擎器件，用于对接收到的所述语音元数据进行语音识别，得到语音识别数据，并将所述语音识别数据发送至所述语义识别器件；

本实用新型还提供一种智能设备，包括：数据处理器件，控制器件，及上述的语音识别装置；

所述语音识别装置，用于将输出的语音识别数据发送至所述数据处理器件；

所述数据处理器件，用于对接收到的所述语音识别数据进行数据处理，得到控制指令，并将所述控制指令发送至所述控制器件；

所述控制器件，用于根据接收到的所述控制指令，执行控制操作。

可选地，所述智能设备包括：超级柜员机STM、智能机器人、智能玩具、移动终端、智能穿戴设备、智能家居设备、智能医疗设备、智能法务设备、智能办公设备和智能政务设备。

采用上述技术方案，本实用新型至少具有下列优点：

本实用新型所述一种语音识别装置、语音识别系统及智能设备，能够克服现有技术中语音识别装置仅通过一个语音识别引擎器件对语音识别准确率低的缺陷，有效地提高了语言识别的准确率和可靠性。

附图说明

图1为本实用新型第一实施例的语音识别装置组成结构示意图；

图2为本实用新型第二实施例的语音识别装置组成结构示意图；

图3为本实用新型第三实施例的语音识别装置组成结构示意图；

图4为本实用新型第四实施例的语音识别系统组成结构示意图；

图5为本实用新型第五实施例的语音识别系统组成结构示意图；

图6为本实用新型第六实施例的语音识别系统组成结构示意图；

图7为本实用新型第七实施例的语音识别系统组成结构示意图；

图8为本实用新型第八实施例的智能设备组成结构示意图。

具体实施方式

为更进一步阐述本实用新型为达成预定目的所采取的技术手段及功效，以下结合附图及较佳实施例，对本实用新型进行详细说明如后。

本实用新型第一实施例，一种语音识别装置，如图1所示，包括以下具组成部分：

语义识别器件10，信息处理器件20，及两个或两个以上的语音识别引擎器件30；

其中，语义识别器件10分别与每一语音识别引擎器件30，及信息处理器件20连接。

语音识别引擎器件30，用于对采集到的语音元数据进行语音识别，得到语音识别数据，并将语音识别数据发送至语义识别器件10。

语义识别器件10，用于生成每一语音识别数据的置信度。

信息处理器件20，用于读取语义识别器件10中的每一携带置信度的语音识别数据，并对所有语音识别数据的置信度进行比较，输出置信度最高的语音识别数据。

可选地，语义识别器件10，具体用于：

将每一语音识别数据与预置的相应领域知识库的知识点中的问题进行语义相似度计算，将得到的每一语音识别数据对应的语义相似度值设置为置信度；

其中，语义识别器件10在每一预置的应用领域设置对应的领域知识库；其中，每一领域知识库包括多个知识点；每个知识点包括多个问题。

在本实施例中，对语音识别引擎器件30不做具体限定，语音识别引擎器件30可以是使用不同语音识别引擎模型的语音识别引擎器件，也可以是使用同一语音识别引擎模型的不同语音识别参数的语音识别引擎器件。

当任一语音识别引擎器件30故障时，该语音识别引擎器件30将无法正常输出语音识别数据，语义识别器件10生成该语音识别引擎器件30输出的语音识别数据的置信度为最低值；同时，语义识别器件10生成其他语音识别引擎器件30输出的语音识别数据的置信度，信息处理器件20读取语义识别器件10中的每一携带置信度的语音识别数据，并对所有语音识别数据的置信度进行比较，输出置信度最高的语音识别数据，有效降低了现有技术中语音识别装置仅通过一个语音识别引擎器件对语音识别故障率，有效地提高了语音识别装置可靠性和安全性。

本实用新型第一实施例所述的语音识别装置，能够克服现有技术中语音识别装置仅通过一个语音识别引擎器件对语音识别准确率低的缺陷，有效地提高了语言识别的准确率和可靠性。

本实用新型第二实施例，一种语音识别装置，如图2所示，包括以下组成部分：

语义识别器件10，信息处理器件20，麦克风40，文字转换器件50，及两个或两个以上的语音识别引擎器件30。

其中，语义识别器件10分别与每一语音识别引擎器件30，及信息处理器件20连接；

麦克风40分别与每一语音识别引擎器件30连接；

文字转换器件50与信息处理器件20连接。

麦克风40，用于将采集到的语音元数据分别发送至每一语音识别引擎器件30。

语义识别器件10，用于生成每一语音识别数据的置信度。

文字转换器件50，用于将置信度最高的语音识别数据转换为文字信息。

优选地，语音识别引擎器件30的数量为三个至五个。

可选地，语义识别器件10，具体用于：

当任一语音识别引擎器件30故障时，该语音识别引擎器件30将无法正常输出语音识别数据，语义识别器件10生成该语音识别引擎器件30输出的语音识别数据的置信度为最低值；同时，语义识别器件10生成其他语音识别引擎器件30输出的语音识别数据的置信度，信息处理器件20读取语义识别器件10中的每一携带置信度的语音识别数据，并对所有语音识别数据的置信度进行比较，输出置信度最高的语音识别数据，有效降低了现有技术中语音识别装置仅通过一个语音识别引擎器件30对语音识别故障率，有效地提高了语音识别装置可靠性和安全性。

本实用新型第二实施例的语音识别装置，能够克服现有技术中语音识别装置仅通过一个语音识别引擎器件对语音识别准确率低的缺陷，有效地提高了语言识别的准确率和可靠性。

本实用新型第三实施例，一种语音识别装置，如图3所示，包括以下组成部分：

语义识别器件10，信息处理器件20，麦克风40，文字转换器件50，及三个不同的语音识别引擎器件30。

麦克风40分别与每一语音识别引擎器件30连接；

文字转换器件50与信息处理器件20连接。

语义识别器件10，用于生成每一语音识别数据的置信度。

本实用新型第三实施例的语音识别装置，能够克服现有技术中语音识别装置仅通过一个语音识别引擎器件对语音识别准确率低的缺陷，有效地提高了语言识别的准确率和可靠性。

本实用新型第四实施例，一种语音识别系统，如图4所示，包括以下具组成部分：

客户终端100和服务器200；

其中，客户终端100包括：信息处理器件101，第一通信器件102，及两个或两个以上的语音识别引擎器件103；

服务器200包括：语义识别器件201和第二通信器件202。

语音识别引擎器件103，用于对采集到的语音元数据进行语音识别，得到语音识别数据，并将语音识别数据发送至第一通信器件102；

第一通信器件102，用于将接收到的每一语音识别数据发送至第二通信器件202；将接收到的所有携带置信度的语音识别数据发送至信息处理器件101。

第二通信器件202，用于将接收到的每一语音识别数据发送至语义识别器件201；将读取到的语义识别器件201中所有携带置信度的语音识别数据发送至第一通信器件102。

语义识别器件201，用于生成接收到的每一语音识别数据的置信度。

信息处理器件101，用于对接收到的所有语音识别数据的置信度进行比较，输出置信度最高的语音识别数据。

可选地，语义识别器件201，具体用于：

其中，语义识别器件201在每一预置的应用领域设置对应的领域知识库；其中，每一领域知识库包括多个知识点；每个知识点包括多个问题。

在本实施例中，对语音识别引擎器件103不做具体限定，语音识别引擎器件103可以是使用不同语音识别引擎模型的语音识别引擎器件，也可以是使用同一语音识别引擎模型的不同语音识别参数的语音识别引擎器件。

当任一语音识别引擎器件103故障时，该语音识别引擎器件103将无法正常输出语音识别数据，语义识别器件201生成该语音识别引擎器件103输出的语音识别数据的置信度为最低值；同时，语义识别器件201生成其他语音识别引擎器件103输出的语音识别数据的置信度，信息处理器件101对语义识别器件201生成的每一携带置信度的语音识别数据的置信度进行比较，输出置信度最高的语音识别数据，有效降低了现有技术中语音识别装置仅通过一个语音识别引擎器件对语音识别故障率，有效地提高了语音识别装置可靠性和安全性。

本实用新型第四实施例所述的语音识别系统，能够克服现有技术中语音识别装置仅通过一个语音识别引擎器件对语音识别准确率低的缺陷，有效地提高了语言识别的准确率和可靠性。

本实用新型第五实施例，一种语音识别系统，如图5所示，包括以下具组成部分：

客户终端100和服务器200；

其中，客户终端100包括：信息处理器件101，第一通信器件102，文字转换器件104，及两个或两个以上的语音识别引擎器件103；

服务器200包括：语义识别器件201和第二通信器件202。

语音识别引擎器件103，用于对采集到的语音元数据进行语音识别，得到语音识别数据，并将语音识别数据发送至第一通信器件102。

文字转换器件104，用于将置信度最高的语音识别数据转换为文字信息。

优选地，语音识别引擎器件103的数量为三个至五个。

可选地，语义识别器件201，具体用于：

本实用新型第五实施例的语音识别系统，能够克服现有技术中语音识别装置仅通过一个语音识别引擎器件对语音识别准确率低的缺陷，有效地提高了语言识别的准确率和可靠性。

本实用新型第六实施例，一种语音识别系统，如图6所示，包括以下具组成部分：

客户终端300和服务器400；

其中，客户终端300包括：信息处理器件301和第一通信器件303；

服务器400包括：第二通信器件401，语义识别器件402，及两个或两个以上的语音识别引擎器件403。

第一通信器件303，用于将采集到的语音元数据发送至第二通信器件401；将接收到的所有携带置信度的语音识别数据发送至信息处理器件301。

第二通信器件401，用于将接收到的语音元数据发送至每一语音识别引擎器件403；将读取到的语义识别器件402中所有携带置信度的语音识别数据发送至第一通信器件303。

语音识别引擎器件403，用于对接收到的语音元数据进行语音识别，得到语音识别数据，并将语音识别数据发送至语义识别器件402。

语义识别器件402，用于生成接收到的每一语音识别数据的置信度。

信息处理器件301，用于对接收到的所有语音识别数据的置信度进行比较，输出置信度最高的语音识别数据。

可选地，语义识别器件402，具体用于：

其中，语义识别器件402在每一预置的应用领域设置对应的领域知识库；其中，每一领域知识库包括多个知识点；每个知识点包括多个问题。

在本实施例中，对语音识别引擎器件403不做具体限定，语音识别引擎器件403可以是使用不同语音识别引擎模型的语音识别引擎器件，也可以是使用同一语音识别引擎模型的不同语音识别参数的语音识别引擎器件。

当任一语音识别引擎器件403故障时，该语音识别引擎器件403将无法正常输出语音识别数据，语义识别器件402生成该语音识别引擎器件403输出的语音识别数据的置信度为最低值；同时，语义识别器件402生成其他语音识别引擎器件403输出的语音识别数据的置信度，信息处理器件301对语义识别器件402生成的每一携带置信度的语音识别数据的置信度进行比较，输出置信度最高的语音识别数据，有效降低了现有技术中语音识别装置仅通过一个语音识别引擎器件对语音识别故障率，有效地提高了语音识别装置可靠性和安全性。

本实用新型第六实施例的语音识别系统，能够克服现有技术中语音识别装置仅通过一个语音识别引擎器件对语音识别准确率低的缺陷，有效地提高了语言识别的准确率和可靠性。

本实用新型第七实施例，一种语音识别系统，如图7所示，包括以下具组成部分：

客户终端300和服务器400；

其中，客户终端300包括：信息处理器件301，文字转换器件302，及第一通信器件303；

文字转换器件302与信息处理器件301连接。

文字转换器件302，用于将置信度最高的语音识别数据转换为文字信息。

优选地，语音识别引擎器件403的数量为三个至五个。

可选地，语义识别器件402，具体用于：

本实用新型第七实施例的语音识别系统，能够克服现有技术中语音识别装置仅通过一个语音识别引擎器件对语音识别准确率低的缺陷，有效地提高了语言识别的准确率和可靠性。

本实用新型第八实施例，一种智能终端，如图8所示，包括以下具组成部分：

数据处理器件500，控制器件600，及本实用新型第一实施例至本实用新型第三实施例中任一实施例中所述的语音识别装置700。

语音识别装置700，用于将输出的语音识别数据发送至数据处理器件500。

数据处理器件500，用于对接收到的语音识别数据进行数据处理，得到控制指令，并将控制指令发送至控制器件600。

控制器件600，用于根据接收到的控制指令，执行控制操作。

其中，智能终端包括但不限于：STM(Super Teller Machine，超级柜员机)、智能机器人、智能玩具、移动终端、智能穿戴设备、智能家居设备、智能医疗设备、智能法务设备、智能办公设备和智能政务设备。

本实用新型第八实施例的智能终端，能够克服现有技术中仅通过一个语音识别引擎器件对语音识别准确率低的缺陷，有效地提高了语言识别的准确率和可靠性，进而有效地提高了智能终端的语音控制精度。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本实用新型实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本实用新型的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本实用新型各个实施例所述的方法。

上面结合附图对本实用新型的实施例进行了描述，但是本实用新型并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本实用新型的启示下，在不脱离本实用新型宗旨和权利要求所保护的范围情况下，还可做出很多形式，这些均属于本实用新型的保护之内。

Claims

1.一种语音识别装置，其特征在于，包括：语义识别器件，信息处理器件，及两个或两个以上的语音识别引擎器件；所述语义识别器件分别与每一所述语音识别引擎器件，及所述信息处理器件连接；

2.根据权利要求1所述的装置，其特征在于，所述装置还包括：麦克风；所述麦克风分别与每一所述语音识别引擎器件连接；

3.根据权利要求1所述的装置，其特征在于，所述装置还包括：文字转换器件；所述文字转换器件与所述信息处理器件连接；

4.根据权利要求1至3中任一项所述的装置，其特征在于，所述语音识别引擎器件的数量为三个至五个。

5.一种语音识别系统，其特征在于，包括：客户终端和服务器；其中，所述客户终端包括：信息处理器件，第一通信器件，及两个或两个以上的语音识别引擎器件；所述服务器包括：语义识别器件和第二通信器件；

所述第一通信器件，用于将接收到的每一所述语音识别数据发送至第二通信器件；将接收到的所有携带置信度的语音识别数据发送至所述信息处理器件；

6.根据权利要求5所述的系统，其特征在于，所述客户终端还包括：文字转换器件；所述文字转换器件与所述信息处理器件连接；

7.一种语音识别系统，其特征在于，包括：客户终端和服务器；其中，所述客户终端包括：信息处理器件和第一通信器件；所述服务器包括：第二通信器件，语义识别器件，及两个或两个以上的语音识别引擎器件；

8.根据权利要求7所述的系统，其特征在于，所述客户终端还包括：文字转换器件；所述文字转换器件与所述信息处理器件连接；

9.一种智能设备，其特征在于，包括：数据处理器件，控制器件，及如权利要求1至4中任一项所述的语音识别装置；

10.根据权利要求9所述的智能设备，其特征在于，所述智能设备包括：超级柜员机STM、智能机器人、智能玩具、移动终端、智能穿戴设备、智能家居设备、智能医疗设备、智能法务设备、智能办公设备和智能政务设备。