CN104202694A - 语音拾取装置的定向方法和系统 - Google Patents

语音拾取装置的定向方法和系统 Download PDF

Info

Publication number
CN104202694A
CN104202694A CN201410373810.1A CN201410373810A CN104202694A CN 104202694 A CN104202694 A CN 104202694A CN 201410373810 A CN201410373810 A CN 201410373810A CN 104202694 A CN104202694 A CN 104202694A
Authority
CN
China
Prior art keywords
extracting
image
humanoid profile
voice pick
pick device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410373810.1A
Other languages
English (en)
Other versions
CN104202694B (zh
Inventor
程德凯
吕艳红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Midea Group Co Ltd
GD Midea Air Conditioning Equipment Co Ltd
Original Assignee
Midea Group Co Ltd
Guangdong Midea Refrigeration Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Midea Group Co Ltd, Guangdong Midea Refrigeration Equipment Co Ltd filed Critical Midea Group Co Ltd
Priority to CN201410373810.1A priority Critical patent/CN104202694B/zh
Publication of CN104202694A publication Critical patent/CN104202694A/zh
Application granted granted Critical
Publication of CN104202694B publication Critical patent/CN104202694B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种语音拾取装置的定向方法,终端实时或定时获取图像采集装置采集到的图像,并由所述图像中提取人形轮廓;在提取到人形轮廓时,所述终端确定该提取到人形轮廓的图像所对应的方向;所述终端控制语音拾取装置指向确定的方向。本发明还公开了一种语音拾取装置的定向系统。本发明在用户发送语音控制指令之前,直接控制语音拾取装置指向用户所在方向,以提高语音控制的准确性。

Description

语音拾取装置的定向方法和系统
技术领域
本发明涉及语音控制领域,尤其涉及语音拾取装置的定向方法和系统。
背景技术
随着语音识别技术的发展,越来越多的终端采用语音来控制,现有的语音终端在侦测到语音控制指令时,可基于预存的语音控制指令与控制代码之间的映射关系,响应侦测到的语音控制指令所对应的控制代码。
但由于终端运行环境中有电视、音响、收音机等人为声源的存在,导致接收到的语音控制指令可能由上述电视、音响、收音机等声源发出,可能误触发错误的控制代码,导致终端的语音控制准确率低。
发明内容
本发明的主要目的在于解决语音控制准确率低的技术问题。
为实现上述目的,本发明提供的一种语音拾取装置的定向方法,所述语音拾取装置的定向方法包括以下步骤:
终端实时或定时获取图像采集装置采集到的图像,并由所述图像中提取人形轮廓;
在提取到人形轮廓时,所述终端确定该提取到人形轮廓的图像所对应的方向;
所述终端控制语音拾取装置指向确定的方向。
优选地,所述终端控制语音拾取装置指向确定的方向步骤包括:
在确定的方向为多个时,所述终端控制语音拾取装置按照预设的转动方向,在确定的多个方向之间转动。
优选地,所述在提取到人形轮廓时,所述终端确定该提取到人形轮廓的图像所对应的方向的步骤包括:
在提取到人形轮廓时,确定提取到的人形轮廓的数量;
在提取到的人形轮廓的数量为多个时,所述终端获取提取出的各个人形轮廓所对应的图像中存在预设类型轮廓的图像;
所述终端确定该获取的图像所对应的方向。
优选地,在提取到人形轮廓时,所述终端确定该提取到人形轮廓的图像所对应的方向的步骤包括:
在提取到人形轮廓时,确定提取到的人形轮廓的数量;
在提取到的人形轮廓的数量为多个时,所述终端基于提取到的人形轮廓,获取提取到的各个人形轮廓所对应的图像中唇形轮廓发生变化的图像;
所述终端确定获取的图像所对应的方向。
优选地,所述终端控制语音拾取装置指向确定的方向的步骤包括:
所述终端控制红外检测装置指向该确定的方向;
在所述红外检测装置检测到预设频率的红外信号时,所述终端控制语音拾取装置指向确定的方向。
优选地,所述终端控制语音拾取装置指向确定的方向的步骤包括:
所述终端确定提取到人形轮廓所对应的方向在预设时间间隔内是否改变过;
在确定提取到人形轮廓所对应的方向在预设时间间隔内改变过,所述终端控制语音拾取装置指向确定的方向。
此外,为实现上述目的,本发明还提出一种语音拾取装置的定向系统,所述语音拾取装置的定向系统包括:
提取模块,用于实时或定时获取图像采集装置采集到的图像,并由所述图像中提取人形轮廓;
确定模块,用于在提取到人形轮廓时,确定该提取到人形轮廓的图像所对应的方向;
处理模块,用于控制语音拾取装置指向确定的方向。
优选地,所述处理模块还用于在确定的方向为多个时,控制语音拾取装置按照预设的转动方向,在确定的多个方向之间转动。
优选地,所述确定模块包括:
确定单元,用于在提取到人形轮廓时,确定提取到的人形轮廓的数量;
获取单元,用于在提取到的人形轮廓的数量为多个时,获取提取出的各个人形轮廓所对应的图像中存在预设类型轮廓的图像;
所述确定单元还用于确定该获取的图像所对应的方向。
优选地,所述确定模块包括:
确定单元,用于在提取到人形轮廓时,确定提取到的人形轮廓的数量;
获取单元,用于在提取到的人形轮廓的数量为多个时,基于提取到的人形轮廓,获取提取到的各个人形轮廓所对应的图像中唇形轮廓发生变化的图像;
所述确定单元还用于确定获取的图像所对应的方向。
优选地,所述处理模还用于控制红外检测装置指向该确定的方向;以及在所述红外检测装置检测到预设频率的红外信号时,控制语音拾取装置指向确定的方向。
优选地,所述处理模包括:
确定单元,用于确定提取到人形轮廓所对应的方向在预设时间间隔内是否改变过;
处理单元,用于在确定提取到人形轮廓所对应的方向在预设时间间隔内改变过,控制语音拾取装置指向确定的方向。
本发明提出的语音拾取装置的定向方法和系统,终端实时或定时获取图像采集装置采集到的图像,并由所述图像中提取人形轮廓,在提取到人形轮廓时,所述终端控制语音拾取装置指向该提取到人形轮廓的图像所对应的方向,使得用户在发送语音控制指令之前,直接控制语音拾取装置指向用户所在方向,以提高语音控制的准确性。
附图说明
图1为本发明实现语音拾取装置的定向的终端的较佳实施例的硬件结构示意图;
图2为图1中语音拾取装置的定向系统较佳实施例的功能模块示意图;
图3为本发明语音拾取装置的定向方法较佳实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实现语音拾取装置的定向的终端的较佳实施例的硬件结构示意图。
该终端1包括处理单元11、存储单元12、语音拾取单元13、图像采集单元14以及语音拾取装置的定向系统15。
语音拾取单元13,用于在接收到声波的震动时,将震动产生的电信号转换为音频信号。
图像采集单元14,用于在处理单元11的控制下实时或定时进行图像采集。
存储单元12,用于存储语音拾取装置的定向系统15及其运行数据。需要强调的是,该存储单元12既可以是一个单独的存储装置,也可以是多个不同存储装置的统称,在此不作赘述。
该处理单元11,用于调用并执行该语音拾取装置的定向系统15,调用图像采集单元实时或者定时进行图像采集,并由所述图像中提取人形轮廓,在提取到人形轮廓时,确定该提取到人形轮廓的图像所对应的方向,控制语音拾取装置指向确定的方向。该处理单元11与存储单元12既可以分别是单独的单元,也可以集成在一起,构成一个控制器,在此不作赘述。
本发明提供一种语音拾取装置的定向系统。
参照图2,图2为图1中语音拾取装置的定向系统较佳实施例的功能模块示意图。
需要强调的是,对本领域的技术人员来说,图2所示功能模块图仅仅是一个较佳实施例的示例图,本领域的技术人员围绕图2所示的语音拾取装置的定向系统15的功能模块,可轻易进行新的功能模块的补充;各功能模块的名称是自定义名称,仅用于辅助理解该语音拾取装置的定向系统15的各个程序功能块,不用于限定本发明的技术方案,本发明技术方案的核心是,各自定义名称的功能模块所要达成的功能。
本实施例提出的语音拾取装置的定向系统15,包括:
提取模块151,用于实时或定时获取图像采集装置采集到的图像,并由所述图像中提取人形轮廓;
在本实施例中,可获取采集到的图像的色彩变化,并将采集到的图像的色彩变化的边缘与预设人形轮廓进行比对,以由采集到的图像中提取人形轮廓。
在本实施例中,该图像采集装置可设置于提取模块151所在的终端内,或者也可设置于室内的其他位置处,并且与终端建立通信连接。
确定模块152,用于在提取到人形轮廓时,确定该提取到人形轮廓的图像所对应的方向;
在本实施例中,确定该提取到人形轮廓的图像所对应的方向可通过多种方式实现:
1)在终端中设置多个窄角图像采集装置,直接确定采集到提取到人形轮廓所对应的图像采集装置,该图像采集装置的方向即为该提取到人形轮廓的图像所对应的方向;
2)在终端中设置一个窄角图像采集装置,并控制该窄角图像采集装置按照预设的方向转动(如先顺时针方向转动,再逆时针方向转动),在提取到人形轮廓时,图像采集装置当前的方向即为该提取到人形轮廓的图像所对应的方向;
3)在终端中设置一个广角图像采集装置,基于提取到的人形轮廓在图像采集装置采集到的图像中的位置确定该提取到人形轮廓的图像所对应的方向。
以上所列举出的三种确定该提取到人形轮廓的图像所对应的方向的方式仅仅为示例性的,本领域技术人员利用本发明的技术思想,根据其具体需求所提出的其他确定该提取到人形轮廓的图像所对应的方向的方式均在本发明的保护范围内,在此不进行一一穷举。
处理模块153,用于控制语音拾取装置指向确定的方向。
在本实施例中,该语音拾取装置可为麦克风阵列或者定向麦克风。
本领域技术人员可以理解的是,处理模块153在控制语音拾取装置指向确定的方向后,在侦测到语音控制指令时,处理模块153可直接响应该语音控制指令;或者,为进一步提高语音控制的准确性,在侦测到语音控制指令时,控制红外检测装置侦测该语音拾取装置对应方向的预设频率红外信号,在红外检测装置侦测到预设频率红外信号时,处理模块153响应该语音控制指令。
本发明提出的语音拾取装置的定向系统,提取模块151实时或定时获取图像采集装置采集到的图像,并由所述图像中提取人形轮廓,在提取到人形轮廓时,处理模块153控制语音拾取装置指向该提取到人形轮廓的图像所对应的方向,使得用户在发送语音控制指令之前,直接控制语音拾取装置指向用户所在方向,以提高语音控制的准确性。
进一步地,为提高语音拾取装置定向的准确性,所述处理模块153还用于在确定的方向为多个时,控制语音拾取装置按照预设的转动方向,在确定的多个方向之间转动。
在本实施例中,在终端的运行环境中可能存在多个用户,此时可控制语音拾取装置在多个确定大方向之间转动,以保证可侦测到所有用户发送的语音控制指令。
进一步地,为提高语音拾取装置定向的准确性,所述确定模块152包括:
确定单元,用于在提取到人形轮廓时,确定提取到的人形轮廓的数量;
获取单元,用于在提取到的人形轮廓的数量为多个时,获取提取出的各个人形轮廓所对应的图像中存在预设类型轮廓的图像;
所述确定单元还用于确定该获取的图像所对应的方向。
在本实施例中,该预设类型的轮廓优选为人脸轮廓,由于用户在发送语音控制指令时,一般会将脸部朝向终端,则在提取到的人形轮廓的数量为多个时,获取单元获取提取出的各个人形轮廓所对应的图像中存在预设类型轮廓的图像,处理模块153控制语音拾取装置指向该获取的图像所对应的方向。
本领域技术人员可以理解的是,由于可能存在多个用户同时面对终端的情况,如终端为电视机,多个用户同时均在观看电视机,则存在预设类型轮廓的图像可能为多个,此时,获取单元基于提取到的人形轮廓,获取提取到的各个人形轮廓所对应的图像中唇形轮廓发生变化的图像;所述确定单元确定获取的图像所对应的方向,以保证语音拾取装置指向发送语音控制指令的用户,以提高语音控制的准确度。
进一步地,为提高语音拾取装置定向的准确性,所述确定模块152包括:
确定单元,用于在提取到人形轮廓时,确定提取到的人形轮廓的数量;
获取单元,用于在提取到的人形轮廓的数量为多个时,基于提取到的人形轮廓,获取提取到的各个人形轮廓所对应的图像中唇形轮廓发生变化的图像;
所述确定单元还用于确定获取的图像所对应的方向。
在本实施例中,控制模块153控制语音拾取装置指向唇形轮廓发生变化的图像所对应的方向,以保证语音拾取装置指向发送语音控制指令的用户,以提高语音控制的准确度。
进一步地,为提高语音拾取装置定向的准确性,所述处理模快153还用于控制红外检测装置指向该确定的方向;以及在所述红外检测装置检测到预设频率的红外信号时,控制语音拾取装置指向确定的方向。
由于在检测到的人形轮廓可能为显示终端(如电视机)显示的图像,则需要通过红外检测装置确定提取到人形轮廓的方向是否有人。
在本实施例中,红外检测装置优选为红外传感器,由于人为恒温动物,检测到的红外信号的频率是一定的,当红外传感器检测到红外信号时,获取检测到的红外信号的频率,当红外信号的频率在预设(人体红外线频率)的范围内时,则可说明检测到的红外线为人体散发出的,则认为该终端的运行环境内有人,或者将红外传感器设置为仅接收某一频率范围的红外信号的传感器,该频率范围属于人体红外线频率的范围,当接收到红外信号时,则认为该终端的运行环境内有人。本实施例中,红外检测装置优选为为单向红外传感器,并且可转动。
进一步地,为提高语音拾取装置定向的准确性,所述处理模153包括:
确定单元,用于确定提取到人形轮廓所对应的方向在预设时间间隔内是否改变过;
处理单元,用于在确定提取到人形轮廓所对应的方向在预设时间间隔内改变过时,控制语音拾取装置指向确定的方向。
在本实施例中,由于显示终端显示的人形轮廓不会再不同方向移动,则提取到人形轮廓所对应的方向在预设时间间隔内改变过时,说明该检测到的人形轮廓所对应的图像不是显示终端显示的,则控制语音拾取装置指向确定的方向。
本实施例进提出一种语音拾取装置的定向方法。
参照图3,图3为本发明语音拾取装置的定向方法较佳实施例的流程示意图。
本实施例提出的语音拾取装置的定向方法,包括以下步骤:
步骤S10,终端实时或定时获取图像采集装置采集到的图像,并由所述图像中提取人形轮廓;
在本实施例中,可获取采集到的图像的色彩变化,并将采集到的图像的色彩变化的边缘与预设人形轮廓进行比对,以由采集到的图像中提取人形轮廓。
在本实施例中,该图像采集装置可设置于终端内,或者也可设置于室内的其他位置处,并且与终端建立通信连接。
步骤S20,在提取到人形轮廓时,所述终端确定该提取到人形轮廓的图像所对应的方向;
在本实施例中,确定该提取到人形轮廓的图像所对应的方向可通过多种方式实现:
1)在终端中设置多个窄角图像采集装置,直接确定采集到提取到人形轮廓所对应的图像采集装置,该图像采集装置的方向即为该提取到人形轮廓的图像所对应的方向;
2)在终端中设置一个窄角图像采集装置,并控制该窄角图像采集装置按照预设的方向转动(如先顺时针方向转动,再逆时针方向转动),在提取到人形轮廓时,图像采集装置当前的方向即为该提取到人形轮廓的图像所对应的方向;
3)在终端中设置一个广角图像采集装置,基于提取到的人形轮廓在图像采集装置采集到的图像中的位置确定该提取到人形轮廓的图像所对应的方向。
以上所列举出的三种确定该提取到人形轮廓的图像所对应的方向的方式仅仅为示例性的,本领域技术人员利用本发明的技术思想,根据其具体需求所提出的其他确定该提取到人形轮廓的图像所对应的方向的方式均在本发明的保护范围内,在此不进行一一穷举。
步骤S30,所述终端控制语音拾取装置指向确定的方向。
在本实施例中,该语音拾取装置可为麦克风阵列或者定向麦克风。
本领域技术人员可以理解的是,在控制语音拾取装置指向确定的方向后,在侦测到语音控制指令时,终端可直接响应该语音控制指令;或者,为进一步提高语音控制的准确性,在侦测到语音控制指令时,所述终端控制红外检测装置侦测该语音拾取装置对应方向的预设频率红外信号,在红外检测装置侦测到预设频率红外信号时,所述终端响应该语音控制指令。
本发明提出的语音拾取装置的定向系统,所述终端实时或定时获取图像采集装置采集到的图像,并由所述图像中提取人形轮廓,在提取到人形轮廓时,所述终端控制语音拾取装置指向该提取到人形轮廓的图像所对应的方向,使得用户在发送语音控制指令之前,直接控制语音拾取装置指向用户所在方向,以提高语音控制的准确性。
进一步地,为提高语音拾取装置定向的准确性,所述步骤S30包括:
在确定的方向为多个时,所述终端控制语音拾取装置按照预设的转动方向,在确定的多个方向之间转动。
在本实施例中,在终端的运行环境中可能存在多个用户,此时可控制语音拾取装置在多个确定大方向之间转动,以保证可侦测到所有用户发送的语音控制指令。
进一步地,为提高语音拾取装置定向的准确性,所述步骤S20包括:
在提取到人形轮廓时,确定提取到的人形轮廓的数量;
在提取到的人形轮廓的数量为多个时,所述终端获取提取出的各个人形轮廓所对应的图像中存在预设类型轮廓的图像;
所述终端确定该获取的图像所对应的方向
在本实施例中,该预设类型的轮廓优选为人脸轮廓,由于用户在发送语音控制指令时,一般会将脸部朝向终端,则在提取到的人形轮廓的数量为多个时,所述终端获取提取出的各个人形轮廓所对应的图像中存在预设类型轮廓的图像,所述终端控制语音拾取装置指向该获取的图像所对应的方向。
本领域技术人员可以理解的是,由于可能存在多个用户同时面对终端的情况,如终端为电视机,多个用户同时均在观看电视机,则存在预设类型轮廓的图像可能为多个,此时,所述终端基于提取到的人形轮廓,获取提取到的各个人形轮廓所对应的图像中唇形轮廓发生变化的图像;所述终端确定获取的图像所对应的方向,以保证语音拾取装置指向发送语音控制指令的用户,以提高语音控制的准确度。
进一步地,为提高语音拾取装置定向的准确性,所述步骤S20包括:
在提取到人形轮廓时,确定提取到的人形轮廓的数量;
在提取到的人形轮廓的数量为多个时,所述终端基于提取到的人形轮廓,获取提取到的各个人形轮廓所对应的图像中唇形轮廓发生变化的图像;
所述终端确定获取的图像所对应的方向。
在本实施例中,所述终端控制语音拾取装置指向唇形轮廓发生变化的图像所对应的方向,以保证语音拾取装置指向发送语音控制指令的用户,以提高语音控制的准确度。
进一步地,为提高语音拾取装置定向的准确性,所述步骤S30包括:
所述终端控制红外检测装置指向该确定的方向;
在所述红外检测装置检测到预设频率的红外信号时,所述终端控制语音拾取装置指向确定的方向。
由于在检测到的人形轮廓可能为显示终端(如电视机)显示的图像,则需要通过红外检测装置确定提取到人形轮廓的方向是否有人。
在本实施例中,红外检测装置优选为红外传感器,由于人为恒温动物,检测到的红外信号的频率是一定的,当红外传感器检测到红外信号时,获取检测到的红外信号的频率,当红外信号的频率在预设(人体红外线频率)的范围内时,则可说明检测到的红外线为人体散发出的,则认为该终端的运行环境内有人,或者将红外传感器设置为仅接收某一频率范围的红外信号的传感器,该频率范围属于人体红外线频率的范围,当接收到红外信号时,则认为该终端的运行环境内有人。本实施例中,红外检测装置优选为为单向红外传感器,并且可转动。
进一步地,为提高语音拾取装置定向的准确性,所述步骤S30包括:
所述终端确定提取到人形轮廓所对应的方向在预设时间间隔内是否改变过;
在确定提取到人形轮廓所对应的方向在预设时间间隔内改变过,所述终端控制语音拾取装置指向确定的方向。
在本实施例中,由于显示终端显示的人形轮廓不会再不同方向移动,则提取到人形轮廓所对应的方向在预设时间间隔内改变过时,说明该检测到的人形轮廓所对应的图像不是显示终端显示的,则控制语音拾取装置指向确定的方向。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (12)

1.一种语音拾取装置的定向方法,其特征在于,所述语音拾取装置的定向方法包括以下步骤:
终端实时或定时获取图像采集装置采集到的图像,并由所述图像中提取人形轮廓;
在提取到人形轮廓时,所述终端确定该提取到人形轮廓的图像所对应的方向;
所述终端控制语音拾取装置指向确定的方向。
2.如权利要求1所述的语音拾取装置的定向方法,其特征在于,所述终端控制语音拾取装置指向确定的方向步骤包括:
在确定的方向为多个时,所述终端控制语音拾取装置按照预设的转动方向,在确定的多个方向之间转动。
3.如权利要求1或2所述的语音拾取装置的定向方法,其特征在于,所述在提取到人形轮廓时,所述终端确定该提取到人形轮廓的图像所对应的方向的步骤包括:
在提取到人形轮廓时,确定提取到的人形轮廓的数量;
在提取到的人形轮廓的数量为多个时,所述终端获取提取出的各个人形轮廓所对应的图像中存在预设类型轮廓的图像;
所述终端确定该获取的图像所对应的方向。
4.如权利要求1或2所述的语音拾取装置的定向方法,其特征在于,在提取到人形轮廓时,所述终端确定该提取到人形轮廓的图像所对应的方向的步骤包括:
在提取到人形轮廓时,确定提取到的人形轮廓的数量;
在提取到的人形轮廓的数量为多个时,所述终端基于提取到的人形轮廓,获取提取到的各个人形轮廓所对应的图像中唇形轮廓发生变化的图像;
所述终端确定获取的图像所对应的方向。
5.如权利要求1所述的语音拾取装置的定向方法,其特征在于,所述终端控制语音拾取装置指向确定的方向的步骤包括:
所述终端控制红外检测装置指向该确定的方向;
在所述红外检测装置检测到预设频率的红外信号时,所述终端控制语音拾取装置指向确定的方向。
6.如权利要求1所述的语音拾取装置的定向方法,其特征在于,所述终端控制语音拾取装置指向确定的方向的步骤包括:
所述终端确定提取到人形轮廓所对应的方向在预设时间间隔内是否改变过;
在确定提取到人形轮廓所对应的方向在预设时间间隔内改变过,所述终端控制语音拾取装置指向确定的方向。
7.一种语音拾取装置的定向系统,其特征在于,所述语音拾取装置的定向系统包括:
提取模块,用于实时或定时获取图像采集装置采集到的图像,并由所述图像中提取人形轮廓;
确定模块,用于在提取到人形轮廓时,确定该提取到人形轮廓的图像所对应的方向;
处理模块,用于控制语音拾取装置指向确定的方向。
8.如权利要求7所述的语音拾取装置的定向系统,其特征在于,所述处理模块还用于在确定的方向为多个时,控制语音拾取装置按照预设的转动方向,在确定的多个方向之间转动。
9.如权利要求7或8所述的语音拾取装置的定向系统,其特征在于,所述确定模块包括:
确定单元,用于在提取到人形轮廓时,确定提取到的人形轮廓的数量;
获取单元,用于在提取到的人形轮廓的数量为多个时,获取提取出的各个人形轮廓所对应的图像中存在预设类型轮廓的图像;
所述确定单元还用于确定该获取的图像所对应的方向。
10.如权利要求7或8所述的语音拾取装置的定向系统,其特征在于,所述确定模块包括:
确定单元,用于在提取到人形轮廓时,确定提取到的人形轮廓的数量;
获取单元,用于在提取到的人形轮廓的数量为多个时,基于提取到的人形轮廓,获取提取到的各个人形轮廓所对应的图像中唇形轮廓发生变化的图像;
所述确定单元还用于确定获取的图像所对应的方向。
11.如权利要求7所述的语音拾取装置的定向系统,其特征在于,所述处理模快还用于控制红外检测装置指向该确定的方向;以及在所述红外检测装置检测到预设频率的红外信号时,控制语音拾取装置指向确定的方向。
12.如权利要求7所述的语音拾取装置的定向系统,其特征在于,所述处理模包括:
确定单元,用于确定提取到人形轮廓所对应的方向在预设时间间隔内是否改变过;
处理单元,用于在确定提取到人形轮廓所对应的方向在预设时间间隔内改变过,控制语音拾取装置指向确定的方向。
CN201410373810.1A 2014-07-31 2014-07-31 语音拾取装置的定向方法和系统 Active CN104202694B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410373810.1A CN104202694B (zh) 2014-07-31 2014-07-31 语音拾取装置的定向方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410373810.1A CN104202694B (zh) 2014-07-31 2014-07-31 语音拾取装置的定向方法和系统

Publications (2)

Publication Number Publication Date
CN104202694A true CN104202694A (zh) 2014-12-10
CN104202694B CN104202694B (zh) 2018-03-13

Family

ID=52087908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410373810.1A Active CN104202694B (zh) 2014-07-31 2014-07-31 语音拾取装置的定向方法和系统

Country Status (1)

Country Link
CN (1) CN104202694B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105895073A (zh) * 2016-03-31 2016-08-24 宇龙计算机通信科技(深圳)有限公司 一种通知信息的发送方法及装置
CN106338711A (zh) * 2016-08-30 2017-01-18 康佳集团股份有限公司 一种基于智能设备的语音定向方法及系统
CN107123423A (zh) * 2017-06-07 2017-09-01 微鲸科技有限公司 语音拾取装置及多媒体设备
WO2019080705A1 (zh) * 2017-10-23 2019-05-02 京东方科技集团股份有限公司 采集设备、声音采集方法、声源跟踪系统及其方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1748387A1 (en) * 2004-05-21 2007-01-31 Asahi Kasei Kabushiki Kaisha Operation content judgment device
CN102271241A (zh) * 2011-09-02 2011-12-07 北京邮电大学 一种基于面部表情/动作识别的图像通信方法及系统
CN202110564U (zh) * 2011-06-24 2012-01-11 华南理工大学 结合视频通道的智能家居语音控制系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1748387A1 (en) * 2004-05-21 2007-01-31 Asahi Kasei Kabushiki Kaisha Operation content judgment device
CN202110564U (zh) * 2011-06-24 2012-01-11 华南理工大学 结合视频通道的智能家居语音控制系统
CN102271241A (zh) * 2011-09-02 2011-12-07 北京邮电大学 一种基于面部表情/动作识别的图像通信方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105895073A (zh) * 2016-03-31 2016-08-24 宇龙计算机通信科技(深圳)有限公司 一种通知信息的发送方法及装置
CN105895073B (zh) * 2016-03-31 2020-01-10 宇龙计算机通信科技(深圳)有限公司 一种通知信息的发送方法及装置
CN106338711A (zh) * 2016-08-30 2017-01-18 康佳集团股份有限公司 一种基于智能设备的语音定向方法及系统
CN107123423A (zh) * 2017-06-07 2017-09-01 微鲸科技有限公司 语音拾取装置及多媒体设备
WO2019080705A1 (zh) * 2017-10-23 2019-05-02 京东方科技集团股份有限公司 采集设备、声音采集方法、声源跟踪系统及其方法
US11525883B2 (en) 2017-10-23 2022-12-13 Beijing Boe Technology Development Co., Ltd. Acquisition equipment, sound acquisition method, and sound source tracking system and method

Also Published As

Publication number Publication date
CN104202694B (zh) 2018-03-13

Similar Documents

Publication Publication Date Title
US10453457B2 (en) Method for performing voice control on device with microphone array, and device thereof
CN104269172A (zh) 基于视频定位的语音控制方法和系统
CN106898348B (zh) 一种出声设备的去混响控制方法和装置
CN110223690A (zh) 基于图像与语音融合的人机交互方法及装置
CN109032039B (zh) 一种语音控制的方法及装置
CN106440192A (zh) 一种家电控制方法、装置、系统及智能空调
CN109982228B (zh) 一种麦克风故障检测方法及移动终端
CN108156497B (zh) 一种控制方法、控制设备及控制系统
CN104202694A (zh) 语音拾取装置的定向方法和系统
CN104424073A (zh) 一种信息处理的方法及电子设备
CN104165438A (zh) 空调器控制方法和系统
CN206559550U (zh) 一种内置麦克风阵列的遥控器及电视系统
CN111930336A (zh) 音频设备的音量调节方法、设备及存储介质
CN107395873B (zh) 音量调节方法、装置、存储介质及终端
CN104267618B (zh) 基于红外定位的语音控制方法和系统
CN113486690A (zh) 一种用户身份识别方法、电子设备及介质
CN111182408B (zh) 一种信息播放方法、音箱设备及存储介质
CN105091208B (zh) 空调器风速控制方法和系统
CN113934307B (zh) 一种根据手势和场景开启电子设备的方法
CN107247923A (zh) 一种指令识别方法、装置、存储设备、移动终端及电器
CN111291671A (zh) 手势控制方法及相关设备
CN106559293B (zh) 与网络接入设备通信、网络接入设备通信的方法、装置和系统
CN111081275A (zh) 基于声音分析的终端处理方法、装置、存储介质及终端
CN106409306A (zh) 一种获取人声的智能系统及基于该系统的获取方法
CN104200817B (zh) 语音控制方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant