CN104202694A

CN104202694A - 语音拾取装置的定向方法和系统

Info

Publication number: CN104202694A
Application number: CN201410373810.1A
Authority: CN
Inventors: 程德凯; 吕艳红
Original assignee: Midea Group Co Ltd; Guangdong Midea Refrigeration Equipment Co Ltd
Current assignee: Midea Group Co Ltd; GD Midea Air Conditioning Equipment Co Ltd
Priority date: 2014-07-31
Filing date: 2014-07-31
Publication date: 2014-12-10
Anticipated expiration: 2034-07-31
Also published as: CN104202694B

Abstract

本发明公开了一种语音拾取装置的定向方法，终端实时或定时获取图像采集装置采集到的图像，并由所述图像中提取人形轮廓；在提取到人形轮廓时，所述终端确定该提取到人形轮廓的图像所对应的方向；所述终端控制语音拾取装置指向确定的方向。本发明还公开了一种语音拾取装置的定向系统。本发明在用户发送语音控制指令之前，直接控制语音拾取装置指向用户所在方向，以提高语音控制的准确性。

Description

语音拾取装置的定向方法和系统

技术领域

本发明涉及语音控制领域，尤其涉及语音拾取装置的定向方法和系统。

背景技术

随着语音识别技术的发展，越来越多的终端采用语音来控制，现有的语音终端在侦测到语音控制指令时，可基于预存的语音控制指令与控制代码之间的映射关系，响应侦测到的语音控制指令所对应的控制代码。

但由于终端运行环境中有电视、音响、收音机等人为声源的存在，导致接收到的语音控制指令可能由上述电视、音响、收音机等声源发出，可能误触发错误的控制代码，导致终端的语音控制准确率低。

发明内容

本发明的主要目的在于解决语音控制准确率低的技术问题。

为实现上述目的，本发明提供的一种语音拾取装置的定向方法，所述语音拾取装置的定向方法包括以下步骤：

终端实时或定时获取图像采集装置采集到的图像，并由所述图像中提取人形轮廓；

在提取到人形轮廓时，所述终端确定该提取到人形轮廓的图像所对应的方向；

所述终端控制语音拾取装置指向确定的方向。

优选地，所述终端控制语音拾取装置指向确定的方向步骤包括：

在确定的方向为多个时，所述终端控制语音拾取装置按照预设的转动方向，在确定的多个方向之间转动。

优选地，所述在提取到人形轮廓时，所述终端确定该提取到人形轮廓的图像所对应的方向的步骤包括：

在提取到人形轮廓时，确定提取到的人形轮廓的数量；

在提取到的人形轮廓的数量为多个时，所述终端获取提取出的各个人形轮廓所对应的图像中存在预设类型轮廓的图像；

所述终端确定该获取的图像所对应的方向。

优选地，在提取到人形轮廓时，所述终端确定该提取到人形轮廓的图像所对应的方向的步骤包括：

在提取到人形轮廓时，确定提取到的人形轮廓的数量；

在提取到的人形轮廓的数量为多个时，所述终端基于提取到的人形轮廓，获取提取到的各个人形轮廓所对应的图像中唇形轮廓发生变化的图像；

所述终端确定获取的图像所对应的方向。

优选地，所述终端控制语音拾取装置指向确定的方向的步骤包括：

所述终端控制红外检测装置指向该确定的方向；

在所述红外检测装置检测到预设频率的红外信号时，所述终端控制语音拾取装置指向确定的方向。

所述终端确定提取到人形轮廓所对应的方向在预设时间间隔内是否改变过；

在确定提取到人形轮廓所对应的方向在预设时间间隔内改变过，所述终端控制语音拾取装置指向确定的方向。

此外，为实现上述目的，本发明还提出一种语音拾取装置的定向系统，所述语音拾取装置的定向系统包括：

提取模块，用于实时或定时获取图像采集装置采集到的图像，并由所述图像中提取人形轮廓；

确定模块，用于在提取到人形轮廓时，确定该提取到人形轮廓的图像所对应的方向；

处理模块，用于控制语音拾取装置指向确定的方向。

优选地，所述处理模块还用于在确定的方向为多个时，控制语音拾取装置按照预设的转动方向，在确定的多个方向之间转动。

优选地，所述确定模块包括：

确定单元，用于在提取到人形轮廓时，确定提取到的人形轮廓的数量；

获取单元，用于在提取到的人形轮廓的数量为多个时，获取提取出的各个人形轮廓所对应的图像中存在预设类型轮廓的图像；

所述确定单元还用于确定该获取的图像所对应的方向。

优选地，所述确定模块包括：

获取单元，用于在提取到的人形轮廓的数量为多个时，基于提取到的人形轮廓，获取提取到的各个人形轮廓所对应的图像中唇形轮廓发生变化的图像；

所述确定单元还用于确定获取的图像所对应的方向。

优选地，所述处理模还用于控制红外检测装置指向该确定的方向；以及在所述红外检测装置检测到预设频率的红外信号时，控制语音拾取装置指向确定的方向。

优选地，所述处理模包括：

确定单元，用于确定提取到人形轮廓所对应的方向在预设时间间隔内是否改变过；

处理单元，用于在确定提取到人形轮廓所对应的方向在预设时间间隔内改变过，控制语音拾取装置指向确定的方向。

本发明提出的语音拾取装置的定向方法和系统，终端实时或定时获取图像采集装置采集到的图像，并由所述图像中提取人形轮廓，在提取到人形轮廓时，所述终端控制语音拾取装置指向该提取到人形轮廓的图像所对应的方向，使得用户在发送语音控制指令之前，直接控制语音拾取装置指向用户所在方向，以提高语音控制的准确性。

附图说明

图1为本发明实现语音拾取装置的定向的终端的较佳实施例的硬件结构示意图；

图2为图1中语音拾取装置的定向系统较佳实施例的功能模块示意图；

图3为本发明语音拾取装置的定向方法较佳实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实现语音拾取装置的定向的终端的较佳实施例的硬件结构示意图。

该终端1包括处理单元11、存储单元12、语音拾取单元13、图像采集单元14以及语音拾取装置的定向系统15。

语音拾取单元13，用于在接收到声波的震动时，将震动产生的电信号转换为音频信号。

图像采集单元14，用于在处理单元11的控制下实时或定时进行图像采集。

存储单元12，用于存储语音拾取装置的定向系统15及其运行数据。需要强调的是，该存储单元12既可以是一个单独的存储装置，也可以是多个不同存储装置的统称，在此不作赘述。

该处理单元11，用于调用并执行该语音拾取装置的定向系统15，调用图像采集单元实时或者定时进行图像采集，并由所述图像中提取人形轮廓，在提取到人形轮廓时，确定该提取到人形轮廓的图像所对应的方向，控制语音拾取装置指向确定的方向。该处理单元11与存储单元12既可以分别是单独的单元，也可以集成在一起，构成一个控制器，在此不作赘述。

本发明提供一种语音拾取装置的定向系统。

参照图2，图2为图1中语音拾取装置的定向系统较佳实施例的功能模块示意图。

需要强调的是，对本领域的技术人员来说，图2所示功能模块图仅仅是一个较佳实施例的示例图，本领域的技术人员围绕图2所示的语音拾取装置的定向系统15的功能模块，可轻易进行新的功能模块的补充；各功能模块的名称是自定义名称，仅用于辅助理解该语音拾取装置的定向系统15的各个程序功能块，不用于限定本发明的技术方案，本发明技术方案的核心是，各自定义名称的功能模块所要达成的功能。

本实施例提出的语音拾取装置的定向系统15，包括：

提取模块151，用于实时或定时获取图像采集装置采集到的图像，并由所述图像中提取人形轮廓；

在本实施例中，可获取采集到的图像的色彩变化，并将采集到的图像的色彩变化的边缘与预设人形轮廓进行比对，以由采集到的图像中提取人形轮廓。

在本实施例中，该图像采集装置可设置于提取模块151所在的终端内，或者也可设置于室内的其他位置处，并且与终端建立通信连接。

确定模块152，用于在提取到人形轮廓时，确定该提取到人形轮廓的图像所对应的方向；

在本实施例中，确定该提取到人形轮廓的图像所对应的方向可通过多种方式实现：

1)在终端中设置多个窄角图像采集装置，直接确定采集到提取到人形轮廓所对应的图像采集装置，该图像采集装置的方向即为该提取到人形轮廓的图像所对应的方向；

2)在终端中设置一个窄角图像采集装置，并控制该窄角图像采集装置按照预设的方向转动(如先顺时针方向转动，再逆时针方向转动)，在提取到人形轮廓时，图像采集装置当前的方向即为该提取到人形轮廓的图像所对应的方向；

3)在终端中设置一个广角图像采集装置，基于提取到的人形轮廓在图像采集装置采集到的图像中的位置确定该提取到人形轮廓的图像所对应的方向。

以上所列举出的三种确定该提取到人形轮廓的图像所对应的方向的方式仅仅为示例性的，本领域技术人员利用本发明的技术思想，根据其具体需求所提出的其他确定该提取到人形轮廓的图像所对应的方向的方式均在本发明的保护范围内，在此不进行一一穷举。

处理模块153，用于控制语音拾取装置指向确定的方向。

在本实施例中，该语音拾取装置可为麦克风阵列或者定向麦克风。

本领域技术人员可以理解的是，处理模块153在控制语音拾取装置指向确定的方向后，在侦测到语音控制指令时，处理模块153可直接响应该语音控制指令；或者，为进一步提高语音控制的准确性，在侦测到语音控制指令时，控制红外检测装置侦测该语音拾取装置对应方向的预设频率红外信号，在红外检测装置侦测到预设频率红外信号时，处理模块153响应该语音控制指令。

本发明提出的语音拾取装置的定向系统，提取模块151实时或定时获取图像采集装置采集到的图像，并由所述图像中提取人形轮廓，在提取到人形轮廓时，处理模块153控制语音拾取装置指向该提取到人形轮廓的图像所对应的方向，使得用户在发送语音控制指令之前，直接控制语音拾取装置指向用户所在方向，以提高语音控制的准确性。

进一步地，为提高语音拾取装置定向的准确性，所述处理模块153还用于在确定的方向为多个时，控制语音拾取装置按照预设的转动方向，在确定的多个方向之间转动。

在本实施例中，在终端的运行环境中可能存在多个用户，此时可控制语音拾取装置在多个确定大方向之间转动，以保证可侦测到所有用户发送的语音控制指令。

进一步地，为提高语音拾取装置定向的准确性，所述确定模块152包括：

所述确定单元还用于确定该获取的图像所对应的方向。

在本实施例中，该预设类型的轮廓优选为人脸轮廓，由于用户在发送语音控制指令时，一般会将脸部朝向终端，则在提取到的人形轮廓的数量为多个时，获取单元获取提取出的各个人形轮廓所对应的图像中存在预设类型轮廓的图像，处理模块153控制语音拾取装置指向该获取的图像所对应的方向。

本领域技术人员可以理解的是，由于可能存在多个用户同时面对终端的情况，如终端为电视机，多个用户同时均在观看电视机，则存在预设类型轮廓的图像可能为多个，此时，获取单元基于提取到的人形轮廓，获取提取到的各个人形轮廓所对应的图像中唇形轮廓发生变化的图像；所述确定单元确定获取的图像所对应的方向，以保证语音拾取装置指向发送语音控制指令的用户，以提高语音控制的准确度。

所述确定单元还用于确定获取的图像所对应的方向。

在本实施例中，控制模块153控制语音拾取装置指向唇形轮廓发生变化的图像所对应的方向，以保证语音拾取装置指向发送语音控制指令的用户，以提高语音控制的准确度。

进一步地，为提高语音拾取装置定向的准确性，所述处理模快153还用于控制红外检测装置指向该确定的方向；以及在所述红外检测装置检测到预设频率的红外信号时，控制语音拾取装置指向确定的方向。

由于在检测到的人形轮廓可能为显示终端(如电视机)显示的图像，则需要通过红外检测装置确定提取到人形轮廓的方向是否有人。

在本实施例中，红外检测装置优选为红外传感器，由于人为恒温动物，检测到的红外信号的频率是一定的，当红外传感器检测到红外信号时，获取检测到的红外信号的频率，当红外信号的频率在预设(人体红外线频率)的范围内时，则可说明检测到的红外线为人体散发出的，则认为该终端的运行环境内有人，或者将红外传感器设置为仅接收某一频率范围的红外信号的传感器，该频率范围属于人体红外线频率的范围，当接收到红外信号时，则认为该终端的运行环境内有人。本实施例中，红外检测装置优选为为单向红外传感器，并且可转动。

进一步地，为提高语音拾取装置定向的准确性，所述处理模153包括：

处理单元，用于在确定提取到人形轮廓所对应的方向在预设时间间隔内改变过时，控制语音拾取装置指向确定的方向。

在本实施例中，由于显示终端显示的人形轮廓不会再不同方向移动，则提取到人形轮廓所对应的方向在预设时间间隔内改变过时，说明该检测到的人形轮廓所对应的图像不是显示终端显示的，则控制语音拾取装置指向确定的方向。

本实施例进提出一种语音拾取装置的定向方法。

参照图3，图3为本发明语音拾取装置的定向方法较佳实施例的流程示意图。

本实施例提出的语音拾取装置的定向方法，包括以下步骤：

步骤S10，终端实时或定时获取图像采集装置采集到的图像，并由所述图像中提取人形轮廓；

在本实施例中，该图像采集装置可设置于终端内，或者也可设置于室内的其他位置处，并且与终端建立通信连接。

步骤S20，在提取到人形轮廓时，所述终端确定该提取到人形轮廓的图像所对应的方向；

步骤S30，所述终端控制语音拾取装置指向确定的方向。

本领域技术人员可以理解的是，在控制语音拾取装置指向确定的方向后，在侦测到语音控制指令时，终端可直接响应该语音控制指令；或者，为进一步提高语音控制的准确性，在侦测到语音控制指令时，所述终端控制红外检测装置侦测该语音拾取装置对应方向的预设频率红外信号，在红外检测装置侦测到预设频率红外信号时，所述终端响应该语音控制指令。

本发明提出的语音拾取装置的定向系统，所述终端实时或定时获取图像采集装置采集到的图像，并由所述图像中提取人形轮廓，在提取到人形轮廓时，所述终端控制语音拾取装置指向该提取到人形轮廓的图像所对应的方向，使得用户在发送语音控制指令之前，直接控制语音拾取装置指向用户所在方向，以提高语音控制的准确性。

进一步地，为提高语音拾取装置定向的准确性，所述步骤S30包括：

进一步地，为提高语音拾取装置定向的准确性，所述步骤S20包括：

在提取到人形轮廓时，确定提取到的人形轮廓的数量；

所述终端确定该获取的图像所对应的方向

在本实施例中，该预设类型的轮廓优选为人脸轮廓，由于用户在发送语音控制指令时，一般会将脸部朝向终端，则在提取到的人形轮廓的数量为多个时，所述终端获取提取出的各个人形轮廓所对应的图像中存在预设类型轮廓的图像，所述终端控制语音拾取装置指向该获取的图像所对应的方向。

本领域技术人员可以理解的是，由于可能存在多个用户同时面对终端的情况，如终端为电视机，多个用户同时均在观看电视机，则存在预设类型轮廓的图像可能为多个，此时，所述终端基于提取到的人形轮廓，获取提取到的各个人形轮廓所对应的图像中唇形轮廓发生变化的图像；所述终端确定获取的图像所对应的方向，以保证语音拾取装置指向发送语音控制指令的用户，以提高语音控制的准确度。

在提取到人形轮廓时，确定提取到的人形轮廓的数量；

所述终端确定获取的图像所对应的方向。

在本实施例中，所述终端控制语音拾取装置指向唇形轮廓发生变化的图像所对应的方向，以保证语音拾取装置指向发送语音控制指令的用户，以提高语音控制的准确度。

所述终端控制红外检测装置指向该确定的方向；

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种语音拾取装置的定向方法，其特征在于，所述语音拾取装置的定向方法包括以下步骤：

所述终端控制语音拾取装置指向确定的方向。

2.如权利要求1所述的语音拾取装置的定向方法，其特征在于，所述终端控制语音拾取装置指向确定的方向步骤包括：

3.如权利要求1或2所述的语音拾取装置的定向方法，其特征在于，所述在提取到人形轮廓时，所述终端确定该提取到人形轮廓的图像所对应的方向的步骤包括：

在提取到人形轮廓时，确定提取到的人形轮廓的数量；

所述终端确定该获取的图像所对应的方向。

4.如权利要求1或2所述的语音拾取装置的定向方法，其特征在于，在提取到人形轮廓时，所述终端确定该提取到人形轮廓的图像所对应的方向的步骤包括：

在提取到人形轮廓时，确定提取到的人形轮廓的数量；

所述终端确定获取的图像所对应的方向。

5.如权利要求1所述的语音拾取装置的定向方法，其特征在于，所述终端控制语音拾取装置指向确定的方向的步骤包括：

所述终端控制红外检测装置指向该确定的方向；

6.如权利要求1所述的语音拾取装置的定向方法，其特征在于，所述终端控制语音拾取装置指向确定的方向的步骤包括：

7.一种语音拾取装置的定向系统，其特征在于，所述语音拾取装置的定向系统包括：

处理模块，用于控制语音拾取装置指向确定的方向。

8.如权利要求7所述的语音拾取装置的定向系统，其特征在于，所述处理模块还用于在确定的方向为多个时，控制语音拾取装置按照预设的转动方向，在确定的多个方向之间转动。

9.如权利要求7或8所述的语音拾取装置的定向系统，其特征在于，所述确定模块包括：

所述确定单元还用于确定该获取的图像所对应的方向。

10.如权利要求7或8所述的语音拾取装置的定向系统，其特征在于，所述确定模块包括：

所述确定单元还用于确定获取的图像所对应的方向。

11.如权利要求7所述的语音拾取装置的定向系统，其特征在于，所述处理模快还用于控制红外检测装置指向该确定的方向；以及在所述红外检测装置检测到预设频率的红外信号时，控制语音拾取装置指向确定的方向。

12.如权利要求7所述的语音拾取装置的定向系统，其特征在于，所述处理模包括：