CN105278380B - 智能设备的控制方法和装置 - Google Patents

智能设备的控制方法和装置 Download PDF

Info

Publication number
CN105278380B
CN105278380B CN201510728232.3A CN201510728232A CN105278380B CN 105278380 B CN105278380 B CN 105278380B CN 201510728232 A CN201510728232 A CN 201510728232A CN 105278380 B CN105278380 B CN 105278380B
Authority
CN
China
Prior art keywords
voice data
smart machine
control
sound
itself
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510728232.3A
Other languages
English (en)
Other versions
CN105278380A (zh
Inventor
李飞云
傅强
侯恩星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510728232.3A priority Critical patent/CN105278380B/zh
Publication of CN105278380A publication Critical patent/CN105278380A/zh
Application granted granted Critical
Publication of CN105278380B publication Critical patent/CN105278380B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开是关于一种智能设备控制的方法和装置,属于电子设备技术领域。本公开通过采集声音数据,并分析该声音数据,得到声音数据的来源方位,根据声音数据的来源方位,控制自身摄像装置进行转动,使得摄像装置朝向声音数据的来源,控制指定提示组件进行指定无声操作。智能设备可以在采集到声音数据后,确定声音数据的来源实际方位,从而控制自身摄像装置转动至用户能够清晰看到的角度,采用无需发出任何声响的方式响应用户的声音数据,在不会对用户造成打扰的情况下,实现了告知用户自身已经接收到用户指令的目的,解决了语音提示不适用于安静场所的问题,扩展了使用场景,达到了提高智能设备利用率的技术效果。

Description

智能设备的控制方法和装置
技术领域
本公开涉及电子设备技术领域,特别涉及一种智能设备控制方法和装置。
背景技术
随着电子设备技术的快速发展,电子设备的智能化程度越来越高,如,一些智能设备不仅能够进行自身基本功能,还可以基于用户的语音指示,为用户提供信息查询服务、抓拍服务等。
在提供信息查询服务或抓拍服务的过程中,每当用户发出呼叫指示时,在智能设备接收到该语音指令后,可以采用语音提示的方式响应用户。例如,在用户呼喊智能设备名字后,智能设备通常会有相应的语音提示“有什么可以帮您”,或,在用户发出路线查询指示后,智能设备会有相应的语音提示“正在为您规划路线”。
发明内容
本公开实施例提供了一种智能设备的控制方法和装置。所述技术方案如下:
根据本公开实施例的第一方面,提供了一种智能设备的控制方法,所述方法包括:
采集声音数据;
分析所述声音数据,得到所述声音数据的来源方位;
根据所述声音数据的来源方位,控制自身摄像装置进行转动,使得所述摄像装置朝向所述声音数据的来源;
控制指定提示组件进行指定无声操作。
在本公开实施例的第一方面的第一种可能实现方式中,所述控制指定提示组件进行指定无声操作,包括:
控制所述自身摄像装置执行在预设方向上的晃动操作;或,
控制自身指示灯执行颜色变化;或,
控制自身指示灯以预设频率闪动。
在本公开实施例的第一方面的第二种可能实现方式中,所述控制指定提示组件进行指定无声操作之前,所述方法还包括:
对所述声音数据的发出者进行人脸识别;
若通过人脸识别确定所述声音数据由指定用户发出,则控制指定提示组件进行指定无声操作。
在本公开实施例的第一方面的第三种可能实现方式中,所述分析所述声音数据,得到所述声音数据的来源方位之前,所述方法还包括:
若采集到多个声音数据,则根据所述多个声音数据的强度,选择强度最大的声音数据;
所述分析所述声音数据,得到所述声音数据的来源方位,包括:
分析所述强度最大的声音数据,得到声音数据的来源方位。
在本公开实施例的第一方面的第四种可能实现方式中,所述采集声音数据包括:通过配置于智能设备不同位置上的两个以上的麦克风采集声音数据。
在本公开实施例的第一方面的第五种可能实现方式中,所述声音数据包括智能设备的名称或对所述智能设备发出的操作指令。
根据本公开实施例的第二方面,提供了一种智能设备的控制装置,所述装置包括:
采集模块,用于采集声音数据;
分析模块,用于分析所述采集模块采集的所述声音数据,得到所述声音数据的来源方位;
摄像装置控制模块,用于根据所述分析模块得到的所述声音数据的来源方位,控制自身摄像装置进行转动,使得所述摄像装置朝向所述声音数据的来源;
组件控制模块,用于控制指定提示组件进行指定无声操作。
在本公开实施例的第二方面的第一种可能实现方式中,所述组件控制模块包括:
第一控制子模块,用于控制所述自身摄像装置执行在预设方向上的晃动操作;
第二控制子模块,用于控制自身指示灯执行颜色变化;
第三控制子模块,用于控制自身指示灯以预设频率闪动。
在本公开实施例的第二方面的第二种可能实现方式中,所述装置还包括:
识别模块,用于对所述声音数据的发出者进行人脸识别;
触发模块,用于在所述识别模块通过人脸识别确定所述声音数据由指定用户发出时,触发所述组件控制模块执行控制指定提示组件进行指定无声操作。
在本公开实施例的第二方面的第三种可能实现方式中,所述装置还包括:
选择模块,用于在所述采集模块采集到多个声音数据时,根据所述多个声音数据的强度,选择强度最大的声音数据;
所述分析模块还用于分析所述选择模块选择的所述强度最大的声音数据,得到声音数据的来源方位。
在本公开实施例的第二方面的第四种可能实现方式中,所述采集模块包括采集子模块;
所述采集子模块,用于通过配置于智能设备不同位置上的两个以上的麦克风采集声音数据。
在本公开实施例的第二方面的第五种可能实现方式中,所述采集模块采集的所述声音数据包括智能设备的名称或对所述智能设备发出的操作指令。
本公开实施例提供的技术方案可以包括以下有益效果:
通过采集声音数据,并分析该声音数据,得到声音数据的来源方位,根据声音数据的来源方位,控制自身摄像装置进行转动,使得摄像装置朝向声音数据的来源,控制指定提示组件进行指定无声操作。智能设备可以在采集到声音数据后,确定声音数据的来源实际方位,从而控制自身摄像装置转动至用户能够清晰看到的角度,采用无需发出任何声响的方式响应用户的声音数据,在不会对用户造成打扰的情况下,实现了告知用户自身已经接收到用户指令的目的,解决了语音提示不适用于安静场所的问题,扩展了使用场景,达到了提高智能设备利用率的技术效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种智能设备的控制方法流程图。
图2是根据另一示例性实施例示出的一种智能设备的控制方法流程图。
图3是根据一示例性实施例示出的一种智能设备的控制装置框图。
图4是根据一示例性实施例示出的一种组件控制模块316的装置框图。
图5是根据另一示例性实施例示出的一种智能设备的控制装置框图。
图6是根据又一示例性实施例示出的一种智能设备的控制装置框图。
图7是根据一示例性实施例示出的一种采集模块310的装置框图。
图8是根据一示例性实施例示出的一种智能设备的控制装置800的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种智能设备的控制方法流程图,本实施例以该智能设备的控制方法由智能设备执行来举例说明。该智能设备的控制方法可以包括如下几个步骤:
在步骤101中,采集声音数据。
在步骤102中,分析声音数据,得到声音数据的来源方位。
在步骤103中,根据声音数据的来源方位,控制自身摄像装置进行转动,使得摄像装置朝向声音数据的来源。
在步骤104中,控制指定提示组件进行指定无声操作。
综上所述,上述提供的方法实施例,通过采集声音数据,并分析该声音数据,得到声音数据的来源方位,根据声音数据的来源方位,控制自身摄像装置进行转动,使得摄像装置朝向声音数据的来源,控制指定提示组件进行指定无声操作。智能设备可以在采集到声音数据后,确定声音数据的来源实际方位,从而控制自身摄像装置转动至用户能够清晰看到的角度,采用无需发出任何声响的方式响应用户的声音数据,在不会对用户造成打扰的情况下,实现了告知用户自身已经接收到用户指令的目的,解决了语音提示不适用于安静场所的问题,扩展了使用场景,达到了提高智能设备利用率的技术效果。
基于上述提供的方法实施例,在本公开实施例的第一种可能实现方式中,所述控制指定提示组件进行指定无声操作,包括:
控制所述自身摄像装置执行在预设方向上的晃动操作;或,
控制自身指示灯执行颜色变化;或,
控制自身指示灯以预设频率闪动。
在本公开实施例的第二种可能实现方式中,所述控制指定提示组件进行指定无声操作之前,所述方法还包括:
对所述声音数据的发出者进行人脸识别;
若通过人脸识别确定所述声音数据由指定用户发出,则控制指定提示组件进行指定无声操作。
在本公开实施例的第三种可能实现方式中,所述分析所述声音数据,得到所述声音数据的来源方位之前,所述方法还包括:
若采集到多个声音数据,则根据所述多个声音数据的强度,选择强度最大的声音数据;
所述分析所述声音数据,得到所述声音数据的来源方位,包括:
分析所述强度最大的声音数据,得到声音数据的来源方位。
在本公开实施例的第四种可能实现方式中,所述采集声音数据包括:通过配置于智能设备不同位置上的两个以上的麦克风采集声音数据。
在本公开实施例的第五种可能实现方式中,所述声音数据包括智能设备的名称或对所述智能设备发出的操作指令。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图2是根据另一示例性实施例示出的一种智能设备的控制方法流程图,本实施例以该智能设备的控制方法由智能设备执行来举例说明。该智能设备的控制方法可以包括如下几个步骤:
在步骤201中,采集声音数据。
本公开实施例所提供的智能设备不仅能够提供其自身基本功能,还可以基于用户的语音指示,提供信息查询功能、抓拍功能等其它功能。本实施例提供的智能设备的控制方法,在提供信息查询的过程中,基于用户的每一次语音指示,智能设备通过确定声音数据的来源方位,控制智能设备朝向该声音数据的来源,并以静默的形式响应用户,使得用户获知该智能设备已经接收到了语音指示,正在等待下一步指示或正在执行该语音指示。
智能设备中可以提供有选择项,该选择项可以是设置于智能设备上的硬件按钮,也可以是由智能设备的显示界面提供的软件按键,用户可以通过触发该选择项,来选择开启该智能设备的控制功能。当检测到用户对该选择项按钮的触发操作时,即可启动该智能设备的控制功能。本公开以预先已经启动该智能设备的控制功能进行说明。
智能设备利用自身携带的麦克风采集声音数据,该声音数据包括该智能设备的名称或对智能设备发出的操作指令。智能设备可以利用两个麦克风对声音数据进行采集,并基于两个麦克风所采集的数据进行后续分析。当然,为了提高定位精度,智能设备上还可以配置有两个以上的麦克风,从而通过两个以上的麦克风进行采集。
其中,智能设备的名称用于唯一标识智能设备。该智能设备的名称可以为设备出厂名称,或用户为该智能设备设置的昵称等,本公开对此不作具体限定。
对智能设备发出的操作指令可以包括但不限于天气查询指令、路线查询指令、抓拍指令、启动摄像指令或删除指定图像指令等。
在步骤202中,分析声音数据,得到声音数据的来源方位。
在对声音数据进行分析的过程中,可以包括如下几种可能的实施方式:
在第一种可能的实施方式中,为了确定用户当前与智能设备的相对方位,需要对声音数据进行分析。其中,声音数据的来源方位可以是声音数据的来源相对于智能设备的偏离方向,例如,声音数据的来源在智能设备的左后方等等。
这里以智能设备通过两个麦克风采集声音数据为例进行说明,智能设备获取每个麦克风接收到声音数据时的时间点,计算两个麦克风接收声音数据时的时间差,并分析每个麦克风所接收的声音数据的强度。根据该时间差和声音强度,可以唯一确定声音数据的来源方位。其中,声音数据的强度可以由声音数据的分贝大小表示,也可以由声音数据的振幅大小表示,或者通过声音数据的功率大小来表示。
当然,智能设备也可以通过配置于智能设备不同位置上的两个以上的麦克风采集声音数据,声音数据分析方法与上述方法相同。在分析过程,用于采集声音数据的麦克风越多,智能设备对声音数据的来源方位的确定越精确。
需要说明的是,上述仅是对一种确定方位方法的举例说明,在其它实施例中,也可以采用其它方法确定声音数据的来源方位,本公开对此不作限定。
另外,若采集到多个声音数据,则根据多个声音数据的强度,选择强度最大的声音数据,并分析该强度最大的声音数据,得到声音数据的来源方位。
若有多个用户发出语音指示,则智能设备可以采集到多个声音数据,通常情况下可以认为,声音强度最大的声音数据是该智能设备的实际控制者的可能性最大,而声音强度较小的声音是背景声音。因此,选择强度最大的声音数据,对其进行分析,以便得到声音数据的来源方位。其中,分析声音数据的方法与上述方法相同,这里不再赘述。
在第二种可能的实施方式中,智能设备通过分析声音数据,得出语音指令的具体内容,并在后续的步骤中,根据该内容执行相应的显示或其它操作。例如,当用户对智能设备发出呼叫:“当地天气查询”。智能设备通过对该声音数据分析,得到语音指定是:当地天气查询。
在第三种可能的实施方式中,在实际应用过程中,声音数据并不一定是智能设备的合法用户发出,例如,也可以是该用户附近的其它客户发出,或者,在声音数据为多个的情况下,由于该合法用户声音较小,而其它非合法用户的声音较大,就会导致智能设备将非合法用户发出的声音确定为声音数据。因此,为了保证对智能设备控制的安全性,可以对声音数据的发出者进行声音识别。
智能设备分析声音数据,并通过语音识别,判断当前声音数据是否由指定用户发出。当智能设备确定当前声音数据是由指定用户发出时,则执行步骤203中相对应的响应操作,若当前声音数据不是由指定用户发出,则对该语音指令不执行任何响应操作。
其中,指定用户可以是一个用户,也可以包括多个用户,用户可以在智能设备中预先设置指定用户,智能设备可以预先录制指定用户的声音,提取声纹信息,并以该声纹信息作为匹配对象。
上述判断是否为指定用户的过程可以包括:当智能设备接收到声音数据时,提取该声音数据的声纹信息,将该声纹与上述匹配对象进行匹配。当相似度大于第二预设阈值时,则确定该用户为指定用户,相反的,当相似度小于第二预设阈值时,则确定该用户为非指定用户。其中,第二预设阈值可以由系统默认设置,也可以由技术人员根据实际情况自定义设置。
进一步地,结合上述第二种和第三种的不同识别,智能设备对声音进行识别后,当确定该声音不是指定用户的声音时,则可以不分析语音指令的具体内容。如此,可以避免智能设备进行不必要的分析工作,从而,减小了智能设备的工作量。
在步骤203中,根据声音数据的来源方位,控制自身摄像装置进行转动,使得摄像装置朝向声音数据的来源。
智能设备首先根据声音数据的来源相对于智能设备的偏离方向,确定声音数据的来源与智能设备之间的角度差,并根据该偏离方向和角度差,控制自身摄像装置向声音数据的来源方向,转动与该角度差相对应的度数。
例如,声音数据的来源相对于智能设备的镜头的偏离方向为东北方向,并确定角度差为45度,则智能设备根据该相对偏离方向,控制自身摄像装置向声音数据的来源方向(即东北方向)转动45度角。
在步骤204中,对声音数据的发出者进行人脸识别。
用户可以在智能设备中将合法用户设置为指定用户。该指定用户可以是一个用户,也可以包括多个用户,智能设备中可以预先保存指定用户的脸部特征信息。智能设备预先拍摄指定用户的脸部图像,提取该图像中人脸的特征信息,并以该特征信息作为匹配对象。当智能设备朝向声音数据的发出者时,对人脸进行拍摄,得到脸部图像。摄像设备智能设备通过拍摄该用户的脸部图像,来提取该脸部的特征信息,并根据该特征信息,对人脸进行识别。
对人脸进行识别的过程可以包括,智能设备将获取到的脸部轮廓特征信息与上述匹配对象进行匹配。当相似度大于第二预设阈值时,则确定该用户为指定用户,相反的,当相似度小于预设阈值时,则确定该用户为非指定用户。其中,第二预设阈值可以由系统默认设置,也可以由技术人员根据实际情况自定义设置。
在一种可能的实施方式中,如果智能设备对声音已经进行了识别,在这里可以不进行人脸识别。当然,为了安全性,在对声音进行识别的基础上,也可以继续对人脸进行识别。固然,可以理解的是,在非必要的情况下,智能设备也可以既不进行声音识别,也不进行人脸识别。本公开对此不作限定。
在步骤205中,若通过人脸识别确定声音数据由指定用户发出,则控制指定提示组件进行指定无声操作。
智能设备可以通过指定无声操作,对声音数据的来源进行静默提示。其中,控制指定提示组件进行指定无声操作,可以包括如下几种可能的实现方式:
在第一种可能的实施方式中,智能设备控制自身摄像装置执行在预设方向上的晃动操作。其中,预设方向可以由智能设备预先默认设置,也可以由用户根据实际需求自主设置。例如,用户将预设方向设置为纵向,相应的,当通过人脸识别确定声音数据由指定用户发出时,智能设备控制自身摄像装置上下运动。
在第二种可能的实施方式中,智能设备控制自身指示灯执行颜色变化。其中,颜色变化可以由智能设备预先默认设置,也可以由用户根据实际需求自主设置。例如,用户可以将颜色变化设置为,由当前颜色变化为与当前颜色不同的任一颜色。如,当确定声音数据由指定用户发出时,智能设备控制自身指示灯由当前的红色变化为绿色,当再次接收该指定用户的语音指令时,智能设备控制自身指示灯由当前的绿色变化为蓝色。
在第三种可能的实施方式中,智能设备控制自身指示灯执行以预设频率闪动。其中,预设频率可以由系统默认设置,也可以由用户根据实际应用自主设置。例如,若预设频率设置为5次/秒,则确定声音数据由指定用户发出时,智能设备控制其自身指示灯每秒闪动5次。
智能设备自身指示灯可以由一个或多个显示单元组成,当指示灯包括一个显示单元时,可以控制该显示单元以预设频率闪动,当指示灯包括多个显示单元时,可以控制该多个显示单元以预设顺序依次闪动,以体现当前设备状态。例如,在用户发出的操作指令为查询路线时,可以在查询等待过程中,以上述多个显示单元像进度条一样的闪动方式,提示用户当前智能设备正在执行其操作指令,提升了用户体验。
当然,智能设备可以只控制自身摄像装置或指示灯,执行上述提供的三种可能实现方式中的其中一种对应的操作,也可以控制上述自身摄像装置和指示灯同时执行对应的操作,即智能设备控制镜头晃动的同时,也控制自身指示灯执行颜色变化或以预设频率闪动。本公开对此不作限定。
上述通过人脸识别,确定声音数据是否由指定用户发出,并可以在确定了声音数据的来源是合法用户的情况下,控制指定提示组件进行指定无声操作,避免了其它非法用户对智能设备的控制操作,提高了智能设备控制的安全性。
综上所述,上述提供的方法实施例,通过采集声音数据,并分析该声音数据,得到声音数据的来源方位,根据声音数据的来源方位,控制自身摄像装置进行转动,使得摄像装置朝向声音数据的来源,控制指定提示组件进行指定无声操作。智能设备可以在采集到声音数据后,确定声音数据的来源实际方位,从而控制自身摄像装置转动至用户能够清晰看到的角度,采用无需发出任何声响的方式响应用户的声音数据,在不会对用户造成打扰的情况下,实现了告知用户自身已经接收到用户指令的目的,解决了语音提示不适用于安静场所的问题,扩展了使用场景,达到了提高智能设备利用率的技术效果。另外,上述提供的实施例中,智能设备通过人脸识别和声音识别,确定声音数据是否由合法用户发出,可以在确定声音数据是由合法用户发出时,采用无需发出任何声响的方式响应用户的声音数据,避免了其它非法用户对智能设备的控制操作,从而,提高了智能设备控制的安全性。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图3是根据一示例性实施例示出的一种智能设备的控制装置框图,本实施例以该智能设备的控制装置由智能设备执行来举例说明。该智能设备的控制装置可以包括:
采集模块310,用于采集声音数据;
分析模块312,用于分析所述采集模块310采集的所述声音数据,得到所述声音数据的来源方位;
摄像装置控制模块314,用于根据所述分析模块312得到的所述声音数据的来源方位,控制自身摄像装置进行转动,使得所述摄像装置朝向所述声音数据的来源;
组件控制模块316,用于控制指定提示组件进行指定无声操作。
综上所述,上述提供的装置实施例,通过采集声音数据,并分析该声音数据,得到声音数据的来源方位,根据声音数据的来源方位,控制自身摄像装置进行转动,使得摄像装置朝向声音数据的来源,控制指定提示组件进行指定无声操作。智能设备可以在采集到声音数据后,确定声音数据的来源实际方位,从而控制自身摄像装置转动至用户能够清晰看到的角度,采用无需发出任何声响的方式响应用户的声音数据,在不会对用户造成打扰的情况下,实现了告知用户自身已经接收到用户指令的目的,解决了语音提示不适用于安静场所的问题,扩展了使用场景,达到了提高智能设备利用率的技术效果。
基于上述提供的装置实施例,请参考图4至图7,在本公开的一个实施例中,所述组件控制模块316包括:
第一控制子模块316a,用于控制所述自身摄像装置执行在预设方向上的晃动操作;
第二控制子模块316b,用于控制自身指示灯执行颜色变化;
第三控制子模块316c,用于控制自身指示灯以预设频率闪动。
在本公开的一个实施例中,所述装置还包括:
识别模块318,用于对所述声音数据的发出者进行人脸识别;
触发模块320,在所述识别模块318通过人脸识别确定所述声音数据由指定用户发出时,触发所述组件控制模块316执行控制指定提示组件进行指定无声操作。
在本公开的一个实施例中,所述装置还包括:
选择模块322,用于在所述采集模块310采集到多个声音数据时,根据所述多个声音数据的强度,选择强度最大的声音数据;
所述分析模块312还用于分析所述选择模块322选择的所述强度最大的声音数,得到声音数据的来源的方位。
在本公开的一个实施例中,所述采集模块310包括采集子模块310a;
所述采集子模块310a,用于通过配置于智能设备不同位置上的两个以上的麦克风采集声音数据。
在本公开的一个实施例中,所述采集模块310采集的所述声音数据包括智能设备的名称或对所述智能设备发出的操作指令。
上述对声音数据的采集可以利用两个麦克风对声音数据进行采集,并基于两个麦克风所采集的数据进行后续分析,也可以配置有两个以上的麦克风,从而通过两个以上的麦克风进行采集。
上述智能设备的名称用于唯一标识智能设备,智能设备的名称可以为设备出厂名称,或用户为该智能设备设置的昵称。
上述对智能设备发出的操作指令可以包括但不限于天气查询指令、路线查询指令、抓拍指令、启动摄像指令或删除指定图像指令等。
上述声音数据的来源方位可以是声音数据的来源相对于智能设备的偏离方向。
上述声音数据的强度可以由声音数据的分贝大小表示,也可以由声音数据的振幅大小表示,或者通过声音数据的功率大小来表示。
上述分析声音数据,智能设备可以从中得出语音指令的具体内容,并根据该内容执行相应的显示或其它操作。
上述分析声音数据,智能设备还可以通过语音识别,判断当前声音数据是否由指定用户发出。其过程可以包括:当智能设备接收到声音数据时,提取该声音数据的声纹信息,将该声纹与上述匹配对象进行匹配。当相似度大于第二预设阈值时,则确定该用户为指定用户。
上述指定用户可以是一个用户,也可以包括多个用户,用户可以在智能设备中预先设置指定用户。
上述对声音数据的发出者进行人脸识别过程可以包括:智能设备将获取到的脸部轮廓特征信息与上述匹配对象进行匹配。当相似度大于第二预设阈值时,则确定该用户为指定用户,相反的,当相似度小于预设阈值时,则确定该用户为非指定用户。
智能设备自身指示灯可以由一个或多个显示单元组成,当指示灯包括一个显示单元时,可以控制该显示单元以预设频率闪动,当指示灯包括多个显示单元时,可以控制该多个显示单元以预设顺序依次闪动,以体现当前设备状态。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开一示例性实施例还提供了一种智能设备的控制装置,能够实现本公开提供的智能设备的控制方法。该装置包括:处理器,以及用于存储处理器的可执行指令的存储器。其中,处理器用于:
采集声音数据;
分析所述声音数据,得到所述声音数据的来源方位;
根据所述声音数据的来源方位,控制自身摄像装置进行转动,使得所述摄像装置朝向所述声音数据的来源;
控制指定提示组件进行指定无声操作。
在本公开的一个实施例中,处理器用于:
控制所述自身摄像装置执行在预设方向上的晃动操作;或,
控制自身指示灯执行颜色变化;或,
控制自身指示灯以预设频率闪动。
在本公开的一个实施例中,处理器用于:
对所述声音数据的发出者进行人脸识别;
若通过人脸识别确定所述声音数据由指定用户发出,则控制指定提示组件进行指定无声操作。
在本公开的一个实施例中,处理器用于:
若采集到多个声音数据,则根据所述多个声音数据的强度,选择强度最大的声音数据;
所述分析所述声音数据,得到所述声音数据的来源方位,包括:
分析所述强度最大的声音数据,得到声音数据的来源方位。
在本公开的一个实施例中,处理器用于:
通过配置于智能设备不同位置上的两个以上的麦克风采集声音数据。
在本公开的一个实施例中,所述声音数据包括智能设备的名称或对所述智能设备发出的操作指令。
图8是根据一示例性实施例示出的一种用于智能设备的控制装置800的框图。例如,装置800可以是智能电灯,智能摄像机,游戏控制台,医疗设备,健身设备,个人数字助理等。
参照图8,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其它组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其它与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个或多个位于机身不同位置的摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,摄像头可以接收外部的多媒体数据。每个摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其它设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其它技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其它电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置800的处理器执行时,使得装置800能够执行如上述图1或图2所示实施例提供的智能设备的控制方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (9)

1.一种智能设备的控制方法,其特征在于,所述方法包括:
通过配置于智能设备不同位置上的两个以上的麦克风采集声音数据;
分析所述声音数据,得到所述声音数据的来源方位;
根据所述声音数据的来源方位,控制自身摄像装置进行转动,使得所述摄像装置朝向所述声音数据的来源;
控制指定提示组件进行指定无声操作;
其中,所述分析所述声音数据,得到所述声音数据的来源方位,包括:
获取每个麦克风采集到所述声音数据时的时间点,计算所述两个以上的麦克风采集到所述声音数据时的时间差;
确定所述每个麦克风所采集的所述声音数据的声音强度;
根据所述时间差和所述声音强度,确定所述声音数据的来源方位;
其中,所述控制指定提示组件进行指定无声操作,包括:
控制所述自身摄像装置执行在预设方向上的晃动操作,同时执行下列至少一项操作:控制自身指示灯执行颜色变化;当自身指示灯包括一个显示单元时,控制所述一个显示单元以预设频率闪动;当自身指示灯包括多个显示单元时,控制所述多个显示单元以预设顺序依次闪动,
所述方法还包括:
在所述通过配置于智能设备不同位置上的两个以上的麦克风采集声音数据之前,通过触发选择项开启所述智能设备的控制功能,所述选择项或者是设置于所述智能设备上的硬件按钮,或者是由所述智能设备的显示界面提供的软件按键。
2.根据权利要求1所述的方法,其特征在于,所述控制指定提示组件进行指定无声操作之前,所述方法还包括:
对所述声音数据的发出者进行人脸识别;
若通过人脸识别确定所述声音数据由指定用户发出,则控制指定提示组件进行指定无声操作。
3.根据权利要求1所述的方法,其特征在于,所述分析所述声音数据,得到所述声音数据的来源方位之前,所述方法还包括:
若采集到多个声音数据,则根据所述多个声音数据的强度,选择强度最大的声音数据作为所要分析的声音数据。
4.根据权利要求1所述的方法,其特征在于,所述声音数据包括智能设备的名称或对所述智能设备发出的操作指令。
5.一种智能设备的控制装置,其特征在于,所述装置包括:
采集模块,用于采集声音数据;
分析模块,用于分析所述采集模块采集的所述声音数据,得到所述声音数据的来源方位;
摄像装置控制模块,用于根据所述分析模块得到的所述声音数据的来源方位,控制自身摄像装置进行转动,使得所述摄像装置朝向所述声音数据的来源;
组件控制模块,用于控制指定提示组件进行指定无声操作;
其中,所述采集模块包括采集子模块;
所述采集子模块,用于通过配置于智能设备不同位置上的两个以上的麦克风采集声音数据;
其中,所述分析模块还用于:
获取每个麦克风采集到所述声音数据时的时间点,计算所述两个以上的麦克风采集到所述声音数据时的时间差;
确定所述每个麦克风所采集的所述声音数据的声音强度;
根据所述时间差和所述声音强度,确定所述声音数据的来源方位;
其中,所述组件控制模块包括:
第一控制子模块,用于控制所述自身摄像装置执行在预设方向上的晃动操作,和下列至少一个子模块:第二控制子模块,用于控制自身指示灯执行颜色变化;第三控制子模块,用于当自身指示灯包括一个显示单元时,控制所述一个显示单元以预设频率闪动;当自身指示灯包括多个显示单元时,控制所述多个显示单元以预设顺序依次闪动,
所述装置还包括:
配置模块,用于在所述通过配置于智能设备不同位置上的两个以上的麦克风采集声音数据之前,通过触发选择项开启所述智能设备的控制功能,所述选择项或者是设置于所述智能设备上的硬件按钮,或者是由所述智能设备的显示界面提供的软件按键。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
识别模块,用于对所述声音数据的发出者进行人脸识别;
触发模块,用于在所述识别模块通过人脸识别确定所述声音数据由指定用户发出时,触发所述组件控制模块执行控制指定提示组件进行指定无声操作。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
选择模块,用于在所述采集模块采集到多个声音数据时,根据所述多个声音数据的强度,选择强度最大的声音数据作为所要分析的声音数据。
8.根据权利要求5所述的装置,其特征在于,所述采集模块采集的所述声音数据包括智能设备的名称或对所述智能设备发出的操作指令。
9.一种智能设备的控制装置,其特征在于,包括:
处理器;
用于存储所述处理器的可执行指令的存储器;
其中,所述处理器用于:
通过配置于智能设备不同位置上的两个以上的麦克风采集声音数据;
分析所述声音数据,得到所述声音数据的来源方位;
根据所述声音数据的来源方位,控制自身摄像装置进行转动,使得所述摄像装置朝向所述声音数据的来源;
控制指定提示组件进行指定无声操作;
其中,所述分析所述声音数据,得到所述声音数据的来源方位,包括:
获取每个麦克风采集到所述声音数据时的时间点,计算所述两个以上的麦克风采集到所述声音数据时的时间差;
确定所述每个麦克风所采集的所述声音数据的声音强度;
根据所述时间差和所述声音强度,确定所述声音数据的来源方位;
其中,所述控制指定提示组件进行指定无声操作,包括:
控制所述自身摄像装置执行在预设方向上的晃动操作,同时执行下列至少一项操作:控制自身指示灯执行颜色变化;当自身指示灯包括一个显示单元时,控制所述一个显示单元以预设频率闪动;当自身指示灯包括多个显示单元时,控制所述多个显示单元以预设顺序依次闪动,
所述处理器还用于:
在通过配置于智能设备不同位置上的两个以上的麦克风采集声音数据之前,通过触发选择项开启所述智能设备的控制功能,所述选择项或者是设置于所述智能设备上的硬件按钮,或者是由所述智能设备的显示界面提供的软件按键。
CN201510728232.3A 2015-10-30 2015-10-30 智能设备的控制方法和装置 Active CN105278380B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510728232.3A CN105278380B (zh) 2015-10-30 2015-10-30 智能设备的控制方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510728232.3A CN105278380B (zh) 2015-10-30 2015-10-30 智能设备的控制方法和装置

Publications (2)

Publication Number Publication Date
CN105278380A CN105278380A (zh) 2016-01-27
CN105278380B true CN105278380B (zh) 2019-10-01

Family

ID=55147584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510728232.3A Active CN105278380B (zh) 2015-10-30 2015-10-30 智能设备的控制方法和装置

Country Status (1)

Country Link
CN (1) CN105278380B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106210511A (zh) * 2016-06-30 2016-12-07 纳恩博(北京)科技有限公司 一种定位用户的方法和装置
CN107734213A (zh) * 2016-08-11 2018-02-23 漳州立达信光电子科技有限公司 智能家用电子装置与系统
CN108172221A (zh) * 2016-12-07 2018-06-15 广州亿航智能技术有限公司 基于智能终端的操控飞行器的方法和装置
CN106875512B (zh) * 2017-03-29 2022-11-29 桂林电子科技大学 一种基于声音方位识别的车载智能监控系统
CN107507312B (zh) * 2017-08-29 2020-12-18 北京小米移动软件有限公司 执行门锁操作的方法、装置和系统
CN107835298B (zh) * 2017-10-19 2020-08-28 维沃移动通信有限公司 一种移动终端的控制方法及移动终端
CN109246306B (zh) * 2018-10-09 2021-03-26 Oppo广东移动通信有限公司 来电处理方法、来电处理装置、移动终端及计算机可读存储介质
CN109903843A (zh) * 2019-01-24 2019-06-18 上海联影医疗科技有限公司 医疗扫描设备的声源定位及语音采集系统和语音采集方法
CN111722186B (zh) * 2020-06-30 2024-04-05 中国平安人寿保险股份有限公司 基于声源定位的拍摄方法、装置、电子设备及存储介质
WO2022001406A1 (zh) * 2020-07-01 2022-01-06 海信视像科技股份有限公司 一种显示方法及显示设备
CN112866772B (zh) * 2020-08-21 2022-08-12 海信视像科技股份有限公司 一种显示设备及声像人物定位追踪方法
CN111708383A (zh) * 2020-07-01 2020-09-25 海信视像科技股份有限公司 一种摄像头拍摄角度的调整方法及显示设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002237991A (ja) * 2001-02-09 2002-08-23 Sony Corp ビデオカメラ
CN1713717A (zh) * 2004-06-25 2005-12-28 北京中星微电子有限公司 摄像机拍摄方位数字声控定向方法
CN1917623A (zh) * 2005-08-17 2007-02-21 索尼株式会社 摄像机控制器和远程会议系统
CN101164339A (zh) * 2005-04-21 2008-04-16 酒井弥吉郎 视频会议系统
CN101297587A (zh) * 2006-04-21 2008-10-29 雅马哈株式会社 拾音装置和语音会议设备
CN201426153Y (zh) * 2009-05-27 2010-03-17 中山佳时光电科技有限公司 用于视频会议智能摄像头控制系统
CN101715102A (zh) * 2008-10-02 2010-05-26 宝利通公司 在点对点和多点音频/视频会议期间显示动态呼叫者身份
CN102647577A (zh) * 2011-02-16 2012-08-22 鸿富锦精密工业(深圳)有限公司 远程会议管理系统及管理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4687936B2 (ja) * 2001-03-22 2011-05-25 ソニー株式会社 音声出力装置および音声出力方法、並びにプログラムおよび記録媒体
JP2009302717A (ja) * 2008-06-11 2009-12-24 Panasonic Corp 映像監視システム
CN201928320U (zh) * 2010-12-13 2011-08-10 上海华勤通讯技术有限公司 不倒翁移动终端
CN102186051A (zh) * 2011-03-10 2011-09-14 弭强 基于声音定位的视频监控系统
CN204275676U (zh) * 2014-09-22 2015-04-22 胡忠梁 一种不倒翁式空气净化器

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002237991A (ja) * 2001-02-09 2002-08-23 Sony Corp ビデオカメラ
CN1713717A (zh) * 2004-06-25 2005-12-28 北京中星微电子有限公司 摄像机拍摄方位数字声控定向方法
CN101164339A (zh) * 2005-04-21 2008-04-16 酒井弥吉郎 视频会议系统
CN1917623A (zh) * 2005-08-17 2007-02-21 索尼株式会社 摄像机控制器和远程会议系统
CN101297587A (zh) * 2006-04-21 2008-10-29 雅马哈株式会社 拾音装置和语音会议设备
CN101715102A (zh) * 2008-10-02 2010-05-26 宝利通公司 在点对点和多点音频/视频会议期间显示动态呼叫者身份
CN201426153Y (zh) * 2009-05-27 2010-03-17 中山佳时光电科技有限公司 用于视频会议智能摄像头控制系统
CN102647577A (zh) * 2011-02-16 2012-08-22 鸿富锦精密工业(深圳)有限公司 远程会议管理系统及管理方法

Also Published As

Publication number Publication date
CN105278380A (zh) 2016-01-27

Similar Documents

Publication Publication Date Title
CN105278380B (zh) 智能设备的控制方法和装置
CN105204742B (zh) 电子设备的控制方法、装置及终端
CN104302048B (zh) 灯具控制方法及装置
CN105282345B (zh) 通话音量的调节方法和装置
CN104092936B (zh) 自动对焦方法及装置
CN104394312B (zh) 拍摄控制方法及装置
CN106572299A (zh) 摄像头开启方法及装置
CN104731880B (zh) 图片排序方法和装置
CN104615359B (zh) 对应用软件进行语音操作的方法及装置
JP6229656B2 (ja) 制御装置および記憶媒体
CN106292320B (zh) 控制被控设备运行的方法及装置
CN109284149A (zh) 启动应用程序的方法及装置
CN105049807B (zh) 监控画面声音采集方法及装置
CN106375782A (zh) 视频播放方法及装置
CN109033991A (zh) 一种图像识别方法及装置
CN106356060A (zh) 语音通信方法及装置
CN106534785A (zh) 监控方法及装置
CN108803444A (zh) 智能设备的控制方法、装置及存储介质
CN108154878A (zh) 控制监控设备的方法及装置
CN103955275A (zh) 应用控制方法和装置
CN105301183B (zh) 空气质量检测方法和装置
CN106354266A (zh) 终端的控制方法、装置及终端
CN109544716A (zh) 学生签到方法及装置、电子设备和存储介质
CN107666536A (zh) 一种寻找终端的方法和装置、一种用于寻找终端的装置
CN108294590A (zh) 控制窗帘的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant