WO2015180430A1

WO2015180430A1 - 语音控制方法和系统

Info

Publication number: WO2015180430A1
Application number: PCT/CN2014/091948
Authority: WO
Inventors: 程德凯; 吕艳红
Original assignee: 广东美的制冷设备有限公司
Priority date: 2014-05-29
Filing date: 2014-11-21
Publication date: 2015-12-03
Also published as: CN105280184A

Abstract

一种语音控制方法和系统，该方法包括：被控终端实时或定时侦测噪音设备发送的语音数据，并获取侦测到的语音数据的播放时间点（S10）；在侦测到第一音频信号时，所述被控终端确定与当前时间点匹配的播放时间点所对应的语音数据，并将确定的语音数据转换为第二音频信号（S20）；所述被控终端剔除所述第一音频信号中与第二音频信号匹配的部分，以生成语音控制指令（S30）；所述被控终端响应该生成的语音控制指令（S40）。通过将接收到第一音频信号中的噪音设备产生的第二音频信号剔除，提高语音控制的准确性。

Description

语音控制方法和系统

技术领域

本发明涉及语音控制技术领域，尤其涉及一种语音控制方法和系统。

背景技术

随着语音识别技术的发展，越来越多的设备采用语音来控制，目前主要采用被控设备内置语音拾取装置，该语音拾取装置拾取用户发送的语音控制指令并识别，在识别过程中根据预设的语音控制指令与控制代码之间的映射关系，确定该接收到的语音控制指令所对应的控制代码，响应该控制代码实现被控终端的语音控制。

现有技术中，一般被控终端所处的环境中可能存在有声设备（如电视机以及收音机灯），则在用户向被控终端发送语音控制指令时，被控终端接收到的语音控制指令中可能包括有声设备播放的噪音数据，使得语音控制指令的识别出现错误，导致语音控制准确率低。

发明内容

本发明的主要目的是提供一种语音控制方法和系统，旨在提高语音控制的准确性。

本发明提出一种语音控制方法，包括：

被控终端实时或定时侦测噪音设备发送的语音数据，并获取侦测到的语音数据的播放时间点；

在侦测到第一音频信号时，所述被控终端确定与当前时间点匹配的播放时间点所对应的语音数据，并将确定的语音数据转换为第二音频信号；

所述被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成语音控制指令；

所述被控终端响应该生成的语音控制指令。

优选地，所述被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成语音控制指令的步骤包括：

所述被控终端根据预设的衰减信息调节所述第二音频信号；

所述被控终端将调节后的第二音频信号与所述第一音频信号进行比对；

所述被控终端剔除所述第一音频信号中与调节后的所述第二音频信号匹配的部分，并生成所述语音控制指令。

优选地，所述被控终端根据预设的衰减信息调节所述第二音频信号的步骤包括：

所述被控终端根据接收到的语音数据确定对应的噪音设备标识；

所述被控终端根据预设的衰减信息与噪音设备标识之间的映射关系，获取确定者噪音设备标识所对应的衰减信息；

所述被控终端根据获取到的衰减信息调节对应的所述第二音频信号。

优选地，所述被控终端实时或定时侦测噪音设备发送的语音数据，并获取侦测到的语音数据的播放时间的步骤之前，该方法还包括：

在侦测到噪音设备发送的音频播放指令时，所述被控终端基于接收到的音频播放指令确定待播放第三音频信号的播放时间以及强度信息；

在接收到噪音设备播放的第三音频信号时，获取接收到的第三音频信号的强度信息、该第三音频信号的接收时间以及噪音设备的标识或者接收所述第三音频信号的环境噪音拾取装置的标识；

基于该接收到的第三音频信号的强度信息以及该第三音频信号的接收时间，以及确定的待播放第三音频信号的播放时间以及强度信息，生成对应的衰减信息；

将生成的衰减信息与所述噪音设备的标识或者环境噪音拾取装置的标识关联保存。

优选地，所述被控终端实时或定时侦测噪音设备发送的语音数据，并获取侦测到的语音数据的播放时间的步骤之后，该方法包括：

在侦测到第一音频信号，且接收到语音数据所对应的播放时间点均与当前时间点不匹配时，所述被控终端响应所述第一音频信号。

优选地，所述在侦测到第一音频信号，且接收到语音数据所对应的播放时间点均与当前时间点不匹配时，所述被控终端响应所述第一音频信号的步骤包括：

在侦测到第一音频信号，且接收到语音数据所对应的播放时间点均与当前时间点不匹配时，提取第一音频信号的声纹特征，并将提取的声纹特征与预设的声纹特征进行比对；

在提取的声纹特征与预设的声纹特征匹配时，响应该接收到的第一音频信号。

此外，为实现上述目的，本发明还提出一种语音控制方法，包括：

在侦测到第一音频信号时，被控终端向噪音设备发送语音数据获取请求，以供噪音设备在接收语音数据时，将播放时间点与当前时间点匹配的语音数据反馈给被控终端；

在接收到噪音设备反馈的语音数据时，所述被控终端将所述语音数据转换为第二音频信号；

所述被控终端响应该生成的语音控制指令。

所述被控终端根据预设的衰减信息调节所述第二音频信号；

所述被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，并生成所述语音控制指令。

优选地，所述在侦测到第一音频信号时，被控终端向噪音设备发送语音数据获取请求，以供噪音设备在接收语音数据时，将播放时间点与当前时间点匹配的语音数据反馈给被控终端的步骤之前，该方法包括：

在接收到噪音设备播放的第三音频信号时，获取接收到的第三音频信号的强度信息、该第三音频信号的接收时间以及噪音设备的标识或者接收该噪音设备第三音频信号的环境噪音拾取装置的标识；

优选地，所述在侦测到第一音频信号时，被控终端向噪音设备发送语音数据获取请求，以供噪音设备在接收语音数据时，将播放时间点与当前时间点匹配的语音数据反馈给被控终端的步骤之后，该方法包括：

在未接收到噪音设备反馈的语音数据时，响应所述第一音频信号。

优选地，所述在未接收到噪音设备反馈的语音数据时，响应所述第一音频信号的步骤包括：

在未接收到噪音设备反馈的语音数据时，提取第一音频信号的声纹特征，并将提取的声纹特征与预设的声纹特征进行比对；

此外，为实现上述目的，本发明还提出一种语音控制系统，包括：

侦测模块，用于实时或定时侦测噪音设备发送的语音数据；

获取模块，用于获取侦测到的语音数据的播放时间点；

确定模块，用于在侦测到第一音频信号时，确定与当前时间点匹配的播放时间点所对应的语音数据；

转换模块，用于将确定的语音数据转换为第二音频信号；

处理模块，用于剔除所述第一音频信号中与调节后的所述第二音频信号匹配的部分，以生成语音控制指令；

响应模块，用于响应该生成的语音控制指令。

优选地，所述处理模块包括：

调节单元，用于根据预设的衰减信息调节所述第二音频信号；

比对单元，用于将调节后的第二音频信号与所述第一音频信号进行比对；

处理单元，用于剔除所述第一音频信号中与所述第二音频信号匹配的部分，并生成所述语音控制指令。

优选地，所述调节单元包括：

确定子单元，用于根据接收到的语音数据确定对应的噪音设备标识；

获取子单元，用于根据预设的衰减信息与噪音设备标识之间的映射关系，获取确定者噪音设备标识所对应的衰减信息；

调节子单元，用于根据获取到的衰减信息调节对应的所述第二音频信号。

优选地，所述确定模块还用于在侦测到噪音设备发送的音频播放指令时，所述被控终端基于接收到的音频播放指令确定待播放第三音频信号的播放时间以及强度信息；所述获取模块还用于在接收到噪音设备播放的第三音频信号时，获取接收到的第三音频信号的强度信息、该第三音频信号的接收时间以及噪音设备的标识或者接收该噪音设备第三音频信号的环境噪音拾取装置的标识；该系统还包括生成模块和存储模块，所述生成模块还用于基于该接收到的第三音频信号的强度信息以及该第三音频信号的接收时间，以及确定的待播放第三音频信号的播放时间以及强度信息，生成对应的衰减信息；所述存储模块还用于将生成的衰减信息与所述噪音设备的标识或者环境噪音拾取装置的标识关联保存。

优选地，所述响应模块还用于在侦测到第一音频信号，且接收到语音数据所对应的播放时间点均与当前时间点不匹配，响应所述第一音频信号。

优选地，所述响应模块还用于提取第一音频信号的声纹特征，并将提取的声纹特征与预设的声纹特征进行比对，在提取的声纹特征与预设的声纹特征匹配时，响应该接收到的第一音频信号。

本发明提出的语音控制方法和系统，该方法中通过噪音设备实时或定时向被控终端发送语音数据，并在语音数据中添加播放时间点，使得被控终端在侦测到第一音频信号时，确定与当前时间点匹配的播放时间点所对应的语音数据，并将确定的语音数据转换为第二音频信号，所述被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成新的语音控制指令并响应该生成的语音控制指令，通过将接收到第一音频信号中的噪音设备产生的第二音频信号剔除，提高语音控制的准确性。

附图说明

图1为本发明实现语音控制的被控终端的较佳实施例的硬件结构示意图；

图2为图1中语音控制系统较佳实施例的功能模块示意图；

图3为本发明语音控制方法第一实施例的流程示意图；

图4为本发明语音控制方法第二实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

下面结合附图及具体实施例就本发明的技术方案做进一步的说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实现语音控制的被控终端的较佳实施例的硬件结构示意图。

该被控终端1包括处理单元11、存储单元12、接发单元13、语音拾取装置14及语音控制系统15。该被控终端1可为空调器以及电视机等可实现语音控制的终端。

语音拾取装置14，用于在接收到声波的震动时，将震动产生的电信号转换为音频信号。

存储单元12，用于存储该语音控制系统15及其运行数据，以及语音控制指令以及控制代码之间的映射关系。需要强调的是，该存储单元12既可以是一个单独的存储装置，也可以是多个不同存储装置的统称，在此不作赘述。

接发单元13，用于在处理单元11的控制下，接收噪音设备发送的音频数据，该接发单元13可以为WIFI模块、红外信号发送单元、蓝牙模块、带发射天线的无线信号发射器或者其他任意适用的无线信号接发单元13（本实施例优选WIFI模块）。

该处理单元11，用于调用并执行该语音控制系统15，控制接发单元13实时或定时侦测噪音设备发送的语音数据，并在接发单元13侦测到语音数据时，并获取侦测到的语音数据的播放时间点，同时在接发单元13侦测到第一音频信号时，确定与当前时间点匹配的播放时间点所对应的语音数据，并将确定的语音数据转换为第二音频信号，并剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成新的语音控制指令，调用存储单元12中存储的语音控制指令与控制代码之间的映射关系，确定生成的语音控制指令所对应的控制代码，执行该控制代码。该处理单元11与存储单元12既可以分别是单独的单元，也可以集成在一起，构成一个控制器，在此不作赘述。

参照图2，图2为图1中语音控制系统较佳实施例的功能模块示意图。

需要强调的是，对本领域的技术人员来说，图2所示功能模块图仅仅是一个较佳实施例的示例图，本领域的技术人员围绕图2所示的语音控制系统15的功能模块，可轻易进行新的功能模块的补充；各功能模块的名称是自定义名称，仅用于辅助理解该语音控制系统15的各个程序功能块，不用于限定本发明的技术方案，本发明技术方案的核心是，各自定义名称的功能模块所要达成的功能。

本实施例提出一种语音控制系统15，包括：

侦测模块151，用于实时或定时侦测噪音设备发送的语音数据；

在本实施例中，噪音设备可在播放第二音频信号之前或者播放第二音频信号时，对待播放的第二音频信号或者当前播放的第二音频信号按照预设的通信协议进行编码生成对应的语音数据，编码时在语音数据中添加播放时间，并将编码生成的语音数据发送至被控设备。例如，噪音设备与被控终端之间的通信方式为WIFI通信时，所对应的通信协议为WIFI通信协议，则采用WIFI通信协议对拾取到的第二音频信号进行编码。

获取模块152，用于获取侦测到的语音数据的播放时间点；

同理，被控设备在接收到的噪音设备发送的语音数据时，可直接按照预设的通信协议对将语音数据解码以获取对应的播放时间点，也可由语音数据的报文头中获取对应的播放时间点。

确定模块153，用于在侦测到第一音频信号时，确定与当前时间点匹配的播放时间点所对应的语音数据；

在本实施例中，由于被控终端与噪音设备之间有一定的距离，故侦测模块151侦测到的噪音设备播放的第二音频信号的时间点，与噪音设备播放的第二音频信号的时间点有一定的时间差，故，当前时间点与播放时间点匹配是指当前时间点与播放时间点之间的差值小于等于预设的阀值。

转换模块154，用于将确定的语音数据转换为第二音频信号；

本领域技术人员可以理解的是，可在被控终端中设置多种侦测模块151如WIFI模块以及红外模块等无线侦测模块，或者RS425接口以及串行接口等有线接口接收环境噪音拾取装置发送的语音数据，转换模块154可在侦测模块151接收到语音数据时，确定接收到语音数据的接口或者模块，采用该确定的接口或者模块所对应的通信协议对接收到的语音数据进行解码，以将接收到的语音数据转换为第二音频信号。

处理模块155，用于剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成语音控制指令；

被控终端中的语音拾取装置接收到的第一音频信号包括用户发送的语音控制指令以及环境噪音（如第二音频信号）。在本实施例中，处理模块155剔除所述第一音频信号中与所述第二音频信号匹配的部分时可通过波形比对的方式实现，如比对第一音频信号以及转换后的第二音频信号的波形走向，根据语音控制信号所对应的波形的幅度对第一音频信号所对应的波形进行调节。

响应模块156，用于响应该生成的语音控制指令。

在本实施例中，响应模块156在响应该生成的语音控制指令时，可将预存的语音控制指令与控制代码之间的映射关系中的语音控制指令与该生成的语音控制指令进行比对，确定与该生成的语音控制指令匹配的语音控制指令与控制代码之间的映射关系，根据该匹配的语音控制指令与控制代码之间的映射关系，确定该生成的语音控制指令所对应的控制代码，执行该控制代码。在生成的语音控制指令与预存的语音控制指令进行比对时，若关键音匹配或者匹配的关键音的数量大于预设的阀值，则认为生成的语音控制指令与预存的语音控制指令匹配。

本实施例提出的语音控制系统，该系统通过噪音设备实时或定时向被控终端发送语音数据，并在语音数据中添加播放时间点，使得侦测模块在侦测到第一音频信号时，确定模块确定与当前时间点匹配的播放时间点所对应的语音数据，转换模块将确定的语音数据转换为第二音频信号，处理模块剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成语音控制指令，响应模块响应该生成的语音控制指令，通过将接收到第一音频信号中的噪音设备产生的第二音频信号剔除，提高语音控制的准确性。

进一步地，为提高语音控制的准确性，所述处理模块155包括：

调节单元1551，用于根据预设的衰减信息调节所述第二音频信号；

比对单元1552，用于将调节后的第二音频信号与所述第一音频信号进行比对；

处理单元1553，用于剔除所述第一音频信号中与所述第二音频信号匹配的部分，并生成语音控制指令。

由于第二音频信号由噪音设备发送至被控终端的过程中会出现衰减，该衰减信息包括第二音频信号的衰减幅度以及延时时长，由于噪音设备所处的位置不变，故衰减幅度以及延时时长不变，故预设衰减幅度以及延时时长，并根据预设的衰减幅度以及延时时长对第二音频信号的波形进行调整，并将调整后的波形与接收到的第一音频信号的波形进行比对。

进一步地，为提高语音控制的准确性，所述调节单元1551包括：

在本实施例中，被控设备所处的环境中可能存在多个噪音设备，例如在被控设备为空调器时，室内的电视机以及收音机等均作为噪音设备会对空调器的语音控制造成干扰，故需要在被控终端中保存预设的衰减信息与环境噪音拾取装置标识或噪音设备标识之间的映射关系。

本领域技术人员可以理解的是，在设置有多个噪音设备时，侦测模块151可能同时接收到多个噪音设备发送的语音数据，故，为识别不同的噪音设备发送的语音数据，噪音设备在发送语音数据时，可在语音数据中添加噪音设备标识，确定子单元根据侦测模块151接收到的语音数据确定对应的噪音设备标识，获取子单元根据预设的衰减信息与噪音设备标识之间的映射关系，获取确定的噪音设备标识所对应的衰减信息，调节子单元根据获取到的衰减信息调节对应的第二音频信号，保证对第二音频信号进行衰减调节的准确性，即提高语音控制的准确性。

进一步地，为提高语音控制的准确性，所述确定模块153还用于在侦测到噪音设备发送的音频播放指令时，所述被控终端基于接收到的音频播放指令确定待播放第三音频信号的播放时间以及强度信息；所述获取模块152还用于在接收到噪音设备播放的第三音频信号时，获取接收到的第三音频信号的强度信息、该第三音频信号的接收时间以及噪音设备的标识或者接收该噪音设备第三音频信号的环境噪音拾取装置的标识；该系统还包括生成模块和存储模块，所述生成模块还用于基于该接收到的第三音频信号的强度信息以及该第三音频信号的接收时间，以及确定的待播放第三音频信号的播放时间以及强度信息，生成对应的衰减信息；所述存储模块还用于将生成的衰减信息与所述噪音设备的标识或者环境噪音拾取装置的标识关联保存

在本实施例中，可在被控终端仅接收到噪音设备播放的第三音频信号时，确定第三音频信号的衰减信息。噪音设备可通过在播放第三音频信号之前向被控终端发送第三音频信号播放时间以及强度信息，以供被控终端确定接收到的第三音频信号的播放时间和强度信息，该播放时间可为一个时间点如8:00播放，也可为一个时间间隔，如5min之后播放，在接收到的播放时间为时间间隔时，被控终端基于接收到该播放时间间隔的时间点以及时间间隔，确定第三音频信号的播放时间。

本领域技术人员可以理解的是，噪音设备也可在播放第三音频信号后，向被控终端发送播放时间以及强度信息，生成模块基于该接收到的第三音频信号的强度信息以及该第三音频信号的接收时间，以及确定的待播放第三音频信号的播放时间以及强度信息，生成对应的衰减信息，存储模块将生成的衰减信息与所述噪音设备的标识或者环境噪音拾取装置的标识关联保存。

进一步地，为提高语音控制效率，所述响应模块156还用于在侦测到第一音频信号，且接收到语音数据所对应的播放时间点均与当前时间点不匹配时，响应所述第一音频信号。

本领域技术人员可以理解的是，在侦测到第一音频信号，且接收到语音数据所对应的播放时间点均与当前时间点不匹配时，说明侦测到的第一音频信号中不包括噪音设备播放的第二音频信号，为提高语音控制效率，可提取第一音频信号的声纹特征，并将提取的声纹特征与预设的声纹特征进行比对，在提取的声纹特征与预设的声纹特征匹配时，响应该接收到的第一音频信号。

参照图3，图3为本发明语音控制方法第一实施例的流程示意图。

本实施例提出一种语音控制方法，包括：

步骤S10，被控终端实时或定时侦测噪音设备发送的语音数据，并获取侦测到的语音数据的播放时间点；

步骤S20，在侦测到第一音频信号时，所述被控终端确定与当前时间点匹配的播放时间点所对应的语音数据，并将确定的语音数据转换为第二音频信号；

同理，被控设备在接收到的噪音设备发送的语音数据时，可直接按照预设的通信协议对将语音数据解码以获取对应的播放时间点，也可由语音数据的报文头中获取对应的播放时间点。在本实施例中，由于被控终端与噪音设备之间有一定的距离，被控终端侦测到的噪音设备播放的第二音频信号的时间点，与噪音设备播放的第二音频信号的时间点有一定的时间差，故，当前时间点与播放时间点匹配是指当前时间点与播放时间点之间的差值小于等于预设的阀值。

本领域技术人员可以理解的是，可在被控终端中设置多种接收模块如WIFI模块以及红外模块等无线侦测模块，或者RS425接口以及串行接口等有线接口接收环境噪音拾取装置发送的语音数据，被控终端可在接收到语音数据时，确定接收到语音数据的接口或者模块，采用该确定的接口或者模块所对应的通信协议对接收到的语音数据进行解码，以将接收到的语音数据转换为第二音频信号。

步骤S30，所述被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成语音控制指令；

被控终端中的语音拾取装置接收到的第一音频信号包括用户发送的语音控制指令以及环境噪音（如第二音频信号）。在本实施例中，被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分时可通过波形比对的方式实现，如比对第一音频信号以及转换后的第二音频信号的波形走向，根据语音控制信号所对应的波形的幅度对第一音频信号所对应的波形进行调节。

步骤S40，所述被控终端响应该生成的语音控制指令。

在本实施例中，被控终端在响应该生成的语音控制指令时，可将预存的语音控制指令与控制代码之间的映射关系中的语音控制指令与该生成的语音控制指令进行比对，确定与该生成的语音控制指令匹配的语音控制指令与控制代码之间的映射关系，根据该匹配的语音控制指令与控制代码之间的映射关系，确定该生成的语音控制指令所对应的控制代码，执行该控制代码。在生成的语音控制指令与预存的语音控制指令进行比对时，若关键音匹配或者匹配的关键音的数量大于预设的阀值，则认为生成的语音控制指令与预存的语音控制指令匹配。

本实施例提出的语音控制方法，该系统通过噪音设备实时或定时向被控终端发送语音数据，并在语音数据中添加播放时间点，使得被控终端在侦测到第一音频信号时，确定与当前时间点匹配的播放时间点所对应的语音数据，并将确定的语音数据转换为第二音频信号；被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成语音控制指令，并响应模块响应该生成的语音控制指令，通过将接收到第一音频信号中的噪音设备产生的第二音频信号剔除，提高语音控制的准确性。

进一步地，为提高语音控制的准确性，所述步骤S30包括：

步骤S31，所述被控终端根据预设的衰减信息调节所述第二音频信号；

步骤S32，所述被控终端将调节后的第二音频信号与所述第一音频信号进行比对；

步骤S33，所述被控终端剔除所述第一音频信号中与调节后的所述第二音频信号匹配的部分，并生成语音控制指令。

进一步地，为提高语音控制的准确性，所述步骤S31包括：

本领域技术人员可以理解的是，在设置有多个噪音设备时，被控终端可能同时接收到多个噪音设备发送的语音数据，故，为识别不同的噪音设备发送的语音数据，噪音设备在发送语音数据时，可在语音数据中添加噪音设备标识，被控终端根据接收到的语音数据确定对应的噪音设备标识，并根据预设的衰减信息与噪音设备标识之间的映射关系，获取确定的噪音设备标识所对应的衰减信息，被控终端根据获取到的衰减信息调节对应的第二音频信号，保证对第二音频信号进行衰减调节的准确性，即提高语音控制的准确性。

进一步地，为提高语音控制的准确性，步骤S10之前，该方法包括：

进一步地，为提高语音控制效率，步骤S10之后，该方法包括步骤：

在接收到语音数据所对应的播放时间点均与当前时间点不匹配时，所述被控终端响应所述第一音频信号。

参照图4，图4为本发明语音控制方法第二实施例的流程示意图。

本发明提出一种语音控制方法，包括：

步骤S50，在侦测到第一音频信号时，被控终端向噪音设备发送语音数据获取请求，以供噪音设备在接收语音数据时，将播放时间点与当前时间点匹配的语音数据反馈给被控终端；

在本实施例中，噪音设备可在播放第二音频信号之前或者播放第二音频信号时，将待播放的第二音频信号或者当前播放的第二音频信号与播放时间点关联保存，噪音设备在接收到被控终端发送的语音数据获取请求时，获取接收到该语音数据获取请求的接收时间点，并将预存的待播放的第二音频信号或者当前播放的第二音频信号与播放时间点之间的关联关系，与数据获取请求的接收时间点进行比对，在预存的待播放的第二音频信号或者当前播放的第二音频信号与播放时间点之间的关联关系中，有播放时间点与数据获取请求的接收时间点匹配时，可将该匹配的播放时间点所对应的第二音频信号编码为语音数据，并将该生成的语音数据发送给被控终端。噪音设备对第二音频信号进行编码时，可按照预设的通信协议进行编码生成对应的语音数据，编码时在语音数据中添加播放时间，并将编码生成的语音数据发送至被控设备。例如，噪音设备与被控终端之间的通信方式为WIFI通信时，所对应的通信协议为WIFI通信协议，则采用WIFI通信协议对拾取到的第二音频信号进行编码。

由于被控终端与噪音设备之间有一定的距离，故被控终端侦测到的噪音设备播放的第二音频信号的时间点，与噪音设备播放的第二音频信号的时间点有一定的时间差。即噪音设备接收到被控设备发送的语音数据获取请求的时间点有一定的时间差，则数据获取请求的接收时间点与播放时间点匹配是指，数据获取请求的接收时间点与播放时间点之间的差值小于等于预设的阀值。

步骤S60，在接收到噪音设备反馈的语音数据时，所述被控终端将所述语音数据转换为第二音频信号；

本领域技术人员可以理解的是，可在被控终端中设置多种接收模块，如WIFI模块以及红外模块等无线侦测模块，或者RS425接口以及串行接口等有线接口接收环境噪音拾取装置发送的语音数据，被控终端可在接收到语音数据时，确定接收到语音数据的接口或者模块，采用该确定的接口或者模块所对应的通信协议对接收到的语音数据进行解码，以将接收到的语音数据转换为第二音频信号。

步骤S70，所述被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成语音控制指令；

步骤S80，所述被控终端响应该生成的语音控制指令。

在本实施例中，被控终端在响应该生成的第一音频信号时，可将预存的第一音频信号与控制代码之间的映射关系中的第一音频信号与该生成的第一音频信号进行比对，确定与该生成的第一音频信号匹配的第一音频信号与控制代码之间的映射关系，根据该匹配的第一音频信号与控制代码之间的映射关系，确定该生成的第一音频信号所对应的控制代码，执行该控制代码。在生成的第一音频信号与预存的第一音频信号进行比对时，若关键音匹配或者匹配的关键音的数量大于预设的阀值，则认为生成的第一音频信号与预存的第一音频信号匹配。

本实施例提出的语音控制方法，该方法中在侦测到第一音频信号时，被控终端向噪音设备发送语音数据获取请求，以供噪音设备在接收语音数据时，将播放时间点与当前时间点匹配的语音数据发送给被控终端，在接收到噪音设备发送的语音数据时，被控终端将所述语音数据转换为第二音频信号，处理模块剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成语音控制指令，被控终端响应该生成的语音控制指令，通过将接收到第一音频信号中的噪音设备产生的第二音频信号剔除，提高语音控制的准确性。

进一步地，为提高语音控制的准确性，所述步骤S70包括：

步骤S71，所述被控终端根据预设的衰减信息调节所述第二音频信号；

步骤S72，所述被控终端将调节后的第二音频信号与所述第一音频信号进行比对；

步骤S73，所述被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，并生成所述语音控制指令。

进一步地，为提高语音控制的准确性，步骤S71包括：

进一步地，为提高语音控制的准确性，步骤S50之前还包括：

本领域技术人员可以理解的是，噪音设备也可在播放第三音频信号后，向被控终端发送播放时间以及强度信息，被控终端基于该接收到的第三音频信号的强度信息以及该第三音频信号的接收时间，以及确定的待播放第三音频信号的播放时间以及强度信息，生成对应的衰减信息，被控终端将生成的衰减信息与所述噪音设备的标识关联保存。

进一步地，为提高语音控制效率，步骤S50之后还包括：

步骤S60，在接收到噪音设备反馈的语音数据时，响应所述第一音频信号。

本领域技术人员可以理解的是，在未接收到噪音设备反馈的语音数据时，说明侦测到的第一音频信号中不包括噪音设备播放的第二音频信号，为提高语音控制效率，可提取第一音频信号的声纹特征，并将提取的声纹特征与预设的声纹特征进行比对，在提取的声纹特征与预设的声纹特征匹配时，响应该接收到的第一音频信号。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质（如ROM/RAM、磁碟、光盘）中，包括若干指令用以使得一台终端设备（可以是手机，计算机，服务器，或者网络设备等）执行本发明各个实施例所述的方法。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

一种语音控制方法，其特征在于，包括：

被控终端实时或定时侦测噪音设备发送的语音数据，并获取侦测到的语音数据的播放时间点；

在侦测到第一音频信号时，所述被控终端确定与当前时间点匹配的播放时间点所对应的语音数据，并将确定的语音数据转换为第二音频信号；

所述被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成语音控制指令；

所述被控终端响应该生成的语音控制指令。
根据权利要求1所述的方法，其特征在于，所述被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成语音控制指令的步骤包括：

所述被控终端根据预设的衰减信息调节所述第二音频信号；

所述被控终端将调节后的第二音频信号与所述第一音频信号进行比对；

所述被控终端剔除所述第一音频信号中与调节后的所述第二音频信号匹配的部分，并生成所述语音控制指令。
根据权利要求2所述的方法，其特征在于，所述被控终端根据预设的衰减信息调节所述第二音频信号的步骤包括：

所述被控终端根据接收到的语音数据确定对应的噪音设备标识；

所述被控终端根据预设的衰减信息与噪音设备标识之间的映射关系，获取确定者噪音设备标识所对应的衰减信息；

所述被控终端根据获取到的衰减信息调节对应的所述第二音频信号。
根据权利要求1所述的方法，其特征在于，所述被控终端实时或定时侦测噪音设备发送的语音数据，并获取侦测到的语音数据的播放时间的步骤之前，该方法还包括：

在侦测到噪音设备发送的音频播放指令时，所述被控终端基于接收到的音频播放指令确定待播放第三音频信号的播放时间以及强度信息；

在接收到噪音设备播放的第三音频信号时，获取接收到的第三音频信号的强度信息、该第三音频信号的接收时间以及噪音设备的标识或者接收所述第三音频信号的环境噪音拾取装置的标识；

基于该接收到的第三音频信号的强度信息以及该第三音频信号的接收时间，以及确定的待播放第三音频信号的播放时间以及强度信息，生成对应的衰减信息；

将生成的衰减信息与所述噪音设备的标识或者环境噪音拾取装置的标识关联保存。
根据权利要求1所述的方法，其特征在于，所述被控终端实时或定时侦测噪音设备发送的语音数据，并获取侦测到的语音数据的播放时间的步骤之后，该方法包括：

在侦测到第一音频信号，且接收到语音数据所对应的播放时间点均与当前时间点不匹配时，所述被控终端响应所述第一音频信号。
根据权利要求5所述的方法，其特征在于，所述在侦测到第一音频信号，且接收到语音数据所对应的播放时间点均与当前时间点不匹配时，所述被控终端响应所述第一音频信号的步骤包括：

在侦测到第一音频信号，且接收到语音数据所对应的播放时间点均与当前时间点不匹配时，提取第一音频信号的声纹特征，并将提取的声纹特征与预设的声纹特征进行比对；

在提取的声纹特征与预设的声纹特征匹配时，响应该接收到的第一音频信号。
一种语音控制方法，其特征在于，包括：

在侦测到第一音频信号时，被控终端向噪音设备发送语音数据获取请求，以供噪音设备在接收语音数据时，将播放时间点与当前时间点匹配的语音数据反馈给被控终端；

在接收到噪音设备反馈的语音数据时，所述被控终端将所述语音数据转换为第二音频信号；

所述被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成语音控制指令；

所述被控终端响应该生成的语音控制指令。
根据权利要求7所述的方法，其特征在于，所述被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，以生成语音控制指令的步骤包括：

所述被控终端根据预设的衰减信息调节所述第二音频信号；

所述被控终端将调节后的第二音频信号与所述第一音频信号进行比对；

所述被控终端剔除所述第一音频信号中与所述第二音频信号匹配的部分，并生成所述语音控制指令。
根据权利要求8所述的方法，其特征在于，所述被控终端根据预设的衰减信息调节所述第二音频信号的步骤包括：

所述被控终端根据接收到的语音数据确定对应的噪音设备标识；

所述被控终端根据预设的衰减信息与噪音设备标识之间的映射关系，获取确定者噪音设备标识所对应的衰减信息；

所述被控终端根据获取到的衰减信息调节对应的所述第二音频信号。
根据权利要求7所述的方法，其特征在于，所述在侦测到第一音频信号时，被控终端向噪音设备发送语音数据获取请求，以供噪音设备在接收语音数据时，将播放时间点与当前时间点匹配的语音数据反馈给被控终端的步骤之前，该方法包括：

在侦测到噪音设备发送的音频播放指令时，所述被控终端基于接收到的音频播放指令确定待播放第三音频信号的播放时间以及强度信息；

在接收到噪音设备播放的第三音频信号时，获取接收到的第三音频信号的强度信息、该第三音频信号的接收时间以及噪音设备的标识或者接收该噪音设备第三音频信号的环境噪音拾取装置的标识；

基于该接收到的第三音频信号的强度信息以及该第三音频信号的接收时间，以及确定的待播放第三音频信号的播放时间以及强度信息，生成对应的衰减信息；

将生成的衰减信息与所述噪音设备的标识或者环境噪音拾取装置的标识关联保存。
根据权利要求7所述的方法，其特征在于，所述在侦测到第一音频信号时，被控终端向噪音设备发送语音数据获取请求，以供噪音设备在接收语音数据时，将播放时间点与当前时间点匹配的语音数据反馈给被控终端的步骤之后，该方法包括：

在未接收到噪音设备反馈的语音数据时，响应所述第一音频信号。
根据权利要求11所述的方法，其特征在于，所述在未接收到噪音设备反馈的语音数据时，响应所述第一音频信号的步骤包括：

在未接收到噪音设备反馈的语音数据时，提取第一音频信号的声纹特征，并将提取的声纹特征与预设的声纹特征进行比对；

在提取的声纹特征与预设的声纹特征匹配时，响应该接收到的第一音频信号。
一种语音控制系统，其特征在于，包括：

侦测模块，用于实时或定时侦测噪音设备发送的语音数据；

获取模块，用于获取侦测到的语音数据的播放时间点；

确定模块，用于在侦测到第一音频信号时，确定与当前时间点匹配的播放时间点所对应的语音数据；

转换模块，用于将确定的语音数据转换为第二音频信号；

处理模块，用于剔除所述第一音频信号中与调节后的所述第二音频信号匹配的部分，以生成语音控制指令；

响应模块，用于响应该生成的语音控制指令。
根据权利要求13所述的系统，其特征在于，所述处理模块包括：

调节单元，用于根据预设的衰减信息调节所述第二音频信号；

比对单元，用于将调节后的第二音频信号与所述第一音频信号进行比对；

处理单元，用于剔除所述第一音频信号中与所述第二音频信号匹配的部分，并生成所述语音控制指令。
根据权利要求14所述的系统，其特征在于，所述调节单元包括：

确定子单元，用于根据接收到的语音数据确定对应的噪音设备标识；

获取子单元，用于根据预设的衰减信息与噪音设备标识之间的映射关系，获取确定者噪音设备标识所对应的衰减信息；

调节子单元，用于根据获取到的衰减信息调节对应的所述第二音频信号。
根据权利要求13所述的系统，其特征在于，所述确定模块还用于在侦测到噪音设备发送的音频播放指令时，所述被控终端基于接收到的音频播放指令确定待播放第三音频信号的播放时间以及强度信息；所述获取模块还用于在接收到噪音设备播放的第三音频信号时，获取接收到的第三音频信号的强度信息、该第三音频信号的接收时间以及噪音设备的标识或者接收该噪音设备第三音频信号的环境噪音拾取装置的标识；该系统还包括生成模块和存储模块，所述生成模块还用于基于该接收到的第三音频信号的强度信息以及该第三音频信号的接收时间，以及确定的待播放第三音频信号的播放时间以及强度信息，生成对应的衰减信息；所述存储模块还用于将生成的衰减信息与所述噪音设备的标识或者环境噪音拾取装置的标识关联保存。
根据权利要求13所述的系统，其特征在于，所述响应模块还用于在侦测到第一音频信号，且接收到语音数据所对应的播放时间点均与当前时间点不匹配，响应所述第一音频信号。
根据权利要求17所述的系统，其特征在于，所述响应模块还用于提取第一音频信号的声纹特征，并将提取的声纹特征与预设的声纹特征进行比对，在提取的声纹特征与预设的声纹特征匹配时，响应该接收到的第一音频信号。