WO2020029503A1

WO2020029503A1 - 语音控制装置及方法

Info

Publication number: WO2020029503A1
Application number: PCT/CN2018/121398
Authority: WO
Inventors: 王子; 梁博; 郑文成
Original assignee: 珠海格力电器股份有限公司
Priority date: 2018-08-09
Filing date: 2018-12-17
Publication date: 2020-02-13
Also published as: CN108877799A

Abstract

本申请公开了一种语音控制装置及方法。该装置包括语音模块、通信模块和智能终端，其中，语音模块与智能终端之间通过通信模块传输数据；语音模块用于对语音进行采集和播报，并对语音进行本地语音识别；智能终端上安装有语音云平台。本申请是一种低成本的语音控制解决方案，不仅能支持本地语音识别控制，同时当与智能终端(比如手机、电视、路由器等)连接时又能实现在线控制。

Description

语音控制装置及方法

相关申请

本申请要求2018年08月09日申请的，申请号为201810900340.8，名称为“一种语音控制装置及方法”的中国专利申请的优先权，在此将其全文引入作为参考。

技术领域

本申请涉及一种语音控制装置及方法，属于语音控制技术领域。

背景技术

利用语音识别技术控制智能终端，能方便地实现人机交互，使人们的工作和生活更加便捷。

当前语音控制技术主要有本地和在线两种方式：纯本地的方式功能简单、实用性强；而在线方式功能强大，能提供更多服务，这两者各有优劣。另外也有本地和在线混合的方式，联网时采用在线识别，离线时切换到本地识别；或者终端或服务器对本地和在线同时识别的结果打分，高分者执行。

但是，不管采用以上哪种方式，都会存在因支持的功能、场景过多，导致识别结果和意图理解错误，从而进入另外一个场景服务的风险。并且，离在线混合方案的实施成本高。

发明内容

为了解决上述问题，本申请的目的在于提供一种语音控制装置及方法。

本申请的装置采用的技术方案如下：

一种语音控制装置，包括语音模块、通信模块和智能终端，其特征在于，语音模块与智能终端之间通过通信模块传输数据；所述语音模块用于对语音进行采集和播报，并对语音进行本地语音识别；所述智能终端上安装有语音云平台。

在其中一个实施例中，所述语音控制装置还包括麦克风，麦克风与所述语音模块连接。

在其中一个实施例中，所述语音控制装置还包括扬声器，扬声器与所述语音模块连接。

在其中一个实施例中，所述语音模块包括语音采集单元、音频处理单元、本地语音识别单元、本地语音数据单元和语音播报单元；语音采集单元与音频处理单元连接，音频处理单元分别与本地语音识别单元和语音播报单元连接，本地语音识别单元与本地语音数据单元连接，本地语音数据单元与所述语音播报单元连接。

在其中一个实施例中，所述语音采集单元与麦克风相连。

在其中一个实施例中，所述语音播报单元与扬声器相连。

本申请的方法采用的技术方案如下：

一种语音控制方法，包括如下步骤：语音模块采集声音信号后，先识别声音信号中是否有本地唤醒词或命令词，如果有本地唤醒词或命令词，则语音模块调用预先存储的对应的语音播报数据进行播报；如果没有本地唤醒词或命令词，则语音模块通过通信模块将所述声音信号发给智能终端进行处理。

在其中一个实施例中，所述智能终端处理后再将数据发送给语音云平台处理，语音云平台将语音播报数据通过通信模块发送给语音模块进行播报。

在其中一个实施例中，所述通信模块为蓝牙或WiFi。

在其中一个实施例中，所述语音模块通过麦克风采集声音信号，通过扬声器进行语音播报。

本申请提出了一种低成本的语音控制解决方案，不仅能支持本地语音识别控制，同时当与智能终端(比如手机、电视、路由器等)连接时又能实现在线控制。解决了在线方式无法精准识别场景，导致语音识别或意图理解错误的技术缺陷。

附图说明

图1是本申请语音控制装置的结构框图。

图2是本申请语音模块的结构框图。

图3是本申请实施方式的流程图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方法作进一步地详细描述。

本实施例采用本地语音识别技术、无线音频传输技术，利用手机等智能终端作为计算平台，实现了一种本地在线混合语音识别的低成本解决方案。如图1所示，该语音装置配置有麦克风、扬声器、语音模块和通信模块。麦克风和扬声器接入语音模块，语音模块负责对语音进行采集和播报，并对语音进行本地语音识别。通信模块负责通过无线通信蓝牙或WiFi连接智能终端，语音模块采集的音频可通过通信模块将语音数据发送给智能终端，同时智能终端也可将语音播报数据通过通信模块发送给语音模块进行播报。

如图2所示，语音模块包括语音采集单元、音频处理单元、本地语音识别单元、本地语音数据单元和语音播报单元；语音采集单元与音频处理单元连接，音频处理单元分别与本地语音识别单元和语音播报单元连接，本地语音识别单元与本地语音数据单元连接，本地语音数据单元与语音播报单元连接。麦克风接入语音采集单元，扬声器接入语音播报单元。

具体地，语音模块通过麦克风采集声音模拟信号，然后将模拟信号通过音频处理单元转换成数字音频数据，然后通过蓝牙或WiFi等方式发给智能终端，同时将数字音频数据经本地语音识别单元得出匹配的本地唤醒词或命令词。对于语音模块本地识别的唤醒词和命令词，其语音模块预先存储有多条语音播报音频数据，当有本地唤醒词或命令词被识别时，语音模块将调用存储的对应的播报数据转换成模拟信号进行播报。音频处理单元也接收来自智能终端发过来的音频数据流，并将数据流转换成模拟信号发送给语音播报单元驱动扬声器的喇叭进行语音播报。

如图3所示，语音装置具有本地唤醒词，比如“你好语音”，当用户说出“你好语音”时，语音装置一旦检测为本地唤醒词，将进入本地语音命令词识别模式，此时用户说本地命令次，比如“开机”、“关机”，将执行对应命令动作。当语音装置通过通信模块连接智能终端后，若用户所说语音中若无本地唤醒词，则直接将语音转给智能终端进行处理，智能终端上运行各语音平台的APP应用，比如百度地图、天猫精灵等，此时用户若说“天猫精灵”，将唤醒对应APP应用，并提供该平台的语音在线服务。

Claims

一种语音控制装置，包括语音模块、通信模块和智能终端，其特征在于，所述语音模块与所述智能终端之间通过所述通信模块传输数据；所述语音模块用于对语音进行采集和播报，并对语音进行本地语音识别；所述智能终端上安装有语音云平台。
根据权利要求1所述的一种语音控制装置，其特征在于，所述语音控制装置还包括麦克风，所述麦克风与所述语音模块连接。
根据权利要求1或2所述的一种语音控制装置，其特征在于，所述语音控制装置还包括扬声器，所述扬声器与所述语音模块连接。
根据权利要求1所述的一种语音控制装置，其特征在于，所述语音模块包括语音采集单元、音频处理单元、本地语音识别单元、本地语音数据单元和语音播报单元；所述语音采集单元与所述音频处理单元连接，所述音频处理单元分别与所述本地语音识别单元和所述语音播报单元连接，所述本地语音识别单元与所述本地语音数据单元连接，所述本地语音数据单元与所述语音播报单元连接。
根据权利要求4所述的一种语音控制装置，其特征在于，所述语音采集单元与麦克风相连。
根据权利要求4或5所述的一种语音控制装置，其特征在于，所述语音播报单元与扬声器相连。
一种语音控制方法，其特征在于，包括如下步骤：

语音模块采集声音信号后，先识别所述声音信号中是否有本地唤醒词或命令词，如果有所述本地唤醒词或命令词，则所述语音模块调用预先存储的对应的语音播报数据进行播报；如果没有所述本地唤醒词或命令词，则所述语音模块通过通信模块将所述声音信号发给智能终端进行处理。
根据权利要求7所述的一种语音控制方法，其特征在于，所述智能终端处理后再将数据发送给语音云平台处理，所述语音云平台将语音播报数据通过所述通信模块发送给所述语音模块进行播报。
根据权利要求7所述的一种语音控制方法，其特征在于，所述通信模块为蓝牙或WiFi。
根据根据权利要求7至9之一所述的一种语音控制方法，其特征在于，所述语音模块通过麦克风采集声音信号，通过扬声器进行语音播报。