CN117056895A - 目标设备选择的识别方法、终端设备、系统和存储介质 - Google Patents

目标设备选择的识别方法、终端设备、系统和存储介质 Download PDF

Info

Publication number
CN117056895A
CN117056895A CN202210495392.8A CN202210495392A CN117056895A CN 117056895 A CN117056895 A CN 117056895A CN 202210495392 A CN202210495392 A CN 202210495392A CN 117056895 A CN117056895 A CN 117056895A
Authority
CN
China
Prior art keywords
portable device
audio
action
audio signal
controllable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210495392.8A
Other languages
English (en)
Inventor
孟姝彤
魏野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202210495392.8A priority Critical patent/CN117056895A/zh
Priority to PCT/CN2023/091573 priority patent/WO2023216922A1/zh
Publication of CN117056895A publication Critical patent/CN117056895A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/44Program or device authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Abstract

本申请实施例提供一种目标设备选择的识别方法、终端设备、系统和存储介质,该方法包括:检测到用户的第一动作;响应于第一动作,发送音频信号并且向多个可操控设备发送录音请求消息;以及计算可操控设备采集到的音频信号对应的多普勒频移量,并确定具有特定多普勒频移量的可操控设备为目标设备。通过为便携设备的播放音频操作和可操控设备的采集音频操作设定开始动作的相应触发条件,可以降低便携设备和可操控设备的功耗,并且在满足触发条件时开始音频采集还可以降低用户隐私泄漏的风险,提高用户隐私的安全性。

Description

目标设备选择的识别方法、终端设备、系统和存储介质
技术领域
本申请涉及多终端交互技术领域,尤其涉及一种目标设备选择的识别方法、终端设备、系统和存储介质。
背景技术
随着智能设备的发展,为了使用户能够更加便捷地操控某一设备,可以通过非触控的自然交互行为识别用户对某个设备的选择意图。
在家庭环境内,若用户想要通过非触控的自然交互行为选择一台设备进行操控,用户的便携设备扬声器连续发出例如19khz的高频(超声波)正弦波信号,家庭环境内其他设备的麦克风持续采集。当用户通过便携设备做出特定手势,使便携设备向目标设备做出相对运动,目标设备则会识别出用户的特定手势,进而实现便携设备在家庭环境内其他设备中确定用户选择的目标设备,其中,具有特定多普勒频移的设备即为用户选择的目标设备。
然而在上述方式中,用户便携设备需要连续发声,且家庭环境内其他设备需要持续录音来识别用户做出的手势,该方式功耗大且存在用户隐私泄露的隐患。
发明内容
本申请实施例提供一种目标设备选择的识别方法、终端设备、系统和存储介质,通过该目标设备选择的识别方法至少可以解决上述功耗大且存在用户隐私泄露的隐患的问题。
第一方面,本申请实施例提供一种目标设备选择的识别方法,应用于便携设备,便携设备与多个可操控设备无线连接,检测到用户的第一动作;响应于第一动作,发送音频信号并且向可操控设备发送录音请求消息;获取可操控设备采集到的音频信号;以及计算可操控设备采集到的音频信号对应的多普勒频移量,并确定具有特定多普勒频移量的可操控设备为目标设备。通过便携设备检测用户的第一动作,从而在检测到用户的第一动作后触发便携设备开始发送音频信号并且控制场景中的可操控设备开始采集便携设备发送的音频信号。通过为便携设备的播放音频操作和可操控设备的采集音频操作设定开始动作的相应触发条件,可以降低便携设备和可操控设备的功耗,并且在满足触发条件时开始音频采集还可以降低用户隐私泄漏的风险,提高用户隐私的安全性。
进一步地,便携设备与多个可操控设备无线连接包括:便携设备与多个可操控设备之间建立近场通信连接,近场通信连接包括蓝牙通信连接或者Wi-Fi连接。
进一步地,便携设备和多个可操控设备登录相同的账号。在分布式场景中,可以利用分布式场景的一些特性进行设备发现、设备间连接状态的检测以及场景中其他设备所支持功能的检测等操作,提高设备之间交互前信息共享的便捷性。
进一步地,在检测到用户的第一动作之前,还包括:检测与便携设备处于连接状态的可操控设备;其中,可操控设备至少具有音频采集功能。在执行检测用户第一动作之前,通过检测与便携设备处于连接状态的可操控设备,在识别用户选择的目标设备阶段便携设备可以针对性地与场景中可操控设备进行相应交互从而识别出用户选择的目标设备,该针对性交互可以降低设备功耗。
进一步地,计算可操控设备采集到的音频信号对应的多普勒频移量,并确定具有特定多普勒频移量的可操控设备为目标设备之前,还包括:满足设定条件,则停止发送音频信号并且向可操控设备发送停止录音请求消息。在满足设定条件后停止上述音频播放和音频采集的操作。通过为便携设备的播放音频操作和可操控设备的采集音频操作设定开始动作和停止动作的相应触发条件,可以降低便携设备和可操控设备的功耗,并且在满足触发条件时开始音频采集还可以降低用户隐私泄漏的风险,提高用户隐私的安全性。
进一步地,满足设定条件,则停止发送音频信号并且向可操控设备发送停止录音请求消息包括:检测到用户的第二动作;以及响应于第二动作,停止发送音频信号并且向可操控设备发送停止录音请求消息。通过检测便携设备是否满足设定条件,在满足设定条件时,触发便携设备停止发送音频信号(即停止播放音频)并且向可操控设备发送停止录音请求消息,以使可操控设备停止采集音频信号。通过该控制方式可以控制便携设备和可操控设备仅在一定的时间内进行音频播放和采集动作,能够降低设备的功耗,并且控制可操控设备在一定的时间内进行音频采集,能够降低用户隐私泄漏的风险,提高用户隐私安全性。
进一步地,第一动作为特定手势中的一个动作,第二动作包括第一动作;其中,特定手势包括第二动作或者特定手势为第二动作。
进一步地,满足设定条件,则停止发送音频信号并且向可操控设备发送停止录音请求消息包括:自检测到用户的第一动作起,并经过设定时间后,则停止发送音频信号并且向可操控设备发送停止录音请求消息。在一些实施方式中,该设定条件还可以为便携设备检测到用户的第一动作起,并经过设定时间,通过该自动计时的方式控制便携设备的音频发送动作的停止以及可操控设备采集音频动作的停止。同样的,通过该控制方式可以控制便携设备和可操控设备仅在一定的时间内进行音频播放和采集动作,能够降低设备的功耗,并且控制可操控设备在一定的时间内进行音频采集,能够降低用户隐私泄漏的风险,提高用户隐私安全性。
进一步地,确定具有特定多普勒频移量的可操控设备为目标设备包括:基于可操控设备采集到的音频信号对应的多普勒频移量,确定具有最大多普勒频移量的可操控设备为目标设备。由于用户在使用便携设备作特定手势时,便携设备的麦克风切向速度水平分量指向目标设备,因此,目标设备处采集到的音频信号的对应的多普勒频移量相比于其他可操控设备采集打开的音频信号的对应的多普勒频移量最大,从而可以将具有最大多普勒频移量的可操控设备识别作为目标设备。
进一步地,确定具有特定多普勒频移量的可操控设备为目标设备包括:基于便携设备的麦克风切向速度水平分量产生的频率变化模拟出第一波形;基于可操控设备采集到的音频信号对应的多普勒频移量,模拟出每个可操控设备对应的用于反应频移变化的第二波形;以及在多个第二波形中筛选出与第一波形相似度最高的目标第二波形,确定目标第二波形对应的可操控设备为目标设备。由于用户在使用便携设备作特定手势时,便携设备的麦克风切向速度水平分量指向目标设备,因此,在目标设备处采集到的音频信号后,基于采集到的音频信号对应的多普勒频移量的变化情况模拟出相应的波形(第二波形),还可以基于其他可操控设备集到的音频信号对应的多普勒频移量的变化情况模拟出相应的波形(第二波形)。便携设备基于麦克风切向速度水平分量产生的频率变化模拟出第一波形,通过波形的相似度比较,目标设备的第二波性与第一波性的相似度相比于其他可操控设备最高,从而可以将第二波形与第一波形相似度最高的对应可操控设备识别为目标设备。
第二方面,本申请实施例还提供一种目标设备选择的识别方法,应用于便携设备,便携设备与多个可操控设备无线连接,方法包括:检测到用户的第一动作;响应于第一动作,采集音频信号并且向多个可操控设备发送播放音频请求消息;计算采集到的音频信号对应的多普勒频移量,并确定具有特定多普勒频移量的可操控设备为目标设备。在一些实施例中,便携设备作为发声端发送音频信号,可操控设备作为采集端采集便携设备发送的音频信号,然而,采集端的设备需要支持高频采样收声的功能,音频采样频率至少要在40khz以上,然而一些设备由于硬件限制无法支持高频采样收声。第二方面提供的该目标设备选择的识别方法可以在第一方面提供的目标设备选择的识别方法的基础上,将发声端和收声端进行互换调整,即可操控设备作为发声端发送音频信号,便携设备作为采集端采集便携设备发送的音频信号。通过该方式能够克服硬件限制无法支持高频采样收声的问题,无需升级可操控设备的硬件功能,降低设备成本。
进一步地,便携设备与多个可操控设备无线连接包括:便携设备与多个可操控设备之间建立近场通信连接,近场通信连接包括蓝牙通信连接或者Wi-Fi连接。
进一步地,便携设备和多个可操控设备登录相同的账号。在分布式场景中,可以利用分布式场景的一些特性进行设备发现、设备间连接状态的检测以及场景中其他设备所支持功能的检测等操作,提高设备之间交互前信息共享的便捷性。
进一步地,在检测到用户的第一动作之前,还包括:检测与便携设备处于连接状态的可操控设备;其中,可操控设备至少具有音频发声功能。在执行检测用户第一动作之前,通过检测与便携设备处于连接状态的可操控设备,在识别用户选择的目标设备阶段便携设备可以针对性地与场景中可操控设备进行相应交互从而识别出用户选择的目标设备,该针对性交互可以降低设备功耗。
进一步地,响应于第一动作,采集音频信号并且向多可操控设备发送播放音频请求消息包括:响应于第一动作,向可操控设备发送播放音频请求消息,以使可操控设备分别按照约定频率播放音频;响应于第一动作,控制便携设备的麦克风按照约定频率采集可操控设备播放的音频。为提高用户的目标设备识别的即时性,可以控制可操控设备同时播放音频,为了可操控设备同时播放音频时采集到每个可操控设备播放的音频,可以预先约定好各个可操控设备播放音频的频率,进而便携设备可以以及预定频率采集到每个可操控设备播放的音频。
进一步地,可操控设备分别按照约定频率播放音频包括:可操控设备按照一定频率差分配频段,并按照自身分配到的频率播放相应频率的音频。
进一步地,计算采集到的音频信号对应的多普勒频移量,并确定具有特定多普勒频移量的可操控设备为目标设备之前,还包括:满足设定条件,则停止采集音频信号并且向可操控设备发送停止播放音频请求消息。
进一步地,满足设定条件,则停止采集音频信号并且向可操控设备发送停止播放音频请求消息包括:检测到用户的第二动作;以及响应于第二动作,停止采集音频信号并且向可操控设备发送停止播放音频请求消息。通过检测便携设备是否满足设定条件,在满足设定条件时,触发便携设备停止发送音频信号(即停止播放音频)并且向可操控设备发送停止录音请求消息,以使可操控设备停止采集音频信号。通过该控制方式可以控制便携设备和可操控设备仅在一定的时间内进行音频播放和采集动作,能够降低设备的功耗,并且控制可操控设备在一定的时间内进行音频采集,能够降低用户隐私泄漏的风险,提高用户隐私安全性。
进一步地,第一动作为特定手势中的一个动作,第二动作包括第一动作;其中,特定手势包括第二动作或者特定手势为第二动作。
进一步地,满足设定条件,则停止采集音频信号并且向可操控设备发送停止播放音频请求消息包括:自检测到用户的第一动作起,并经过设定时间后,则停止采集音频信号并且向可操控设备发送停止播放音频请求消息。在一些实施方式中,该设定条件还可以为便携设备检测到用户的第一动作起,并经过设定时间,通过该自动计时的方式控制便携设备的音频发送动作的停止以及可操控设备采集音频动作的停止。同样的,通过该控制方式可以控制便携设备和可操控设备仅在一定的时间内进行音频播放和采集动作,能够降低设备的功耗,并且控制可操控设备在一定的时间内进行音频采集,能够降低用户隐私泄漏的风险,提高用户隐私安全性。
进一步地,确定具有特定多普勒频移量的可操控设备为目标设备包括:基于可操控设备采集到的音频信号对应的多普勒频移量,确定具有最大多普勒频移量的可操控设备为目标设备。由于用户在使用便携设备作特定手势时,便携设备的麦克风切向速度水平分量指向目标设备,因此,目标设备处采集到的音频信号的对应的多普勒频移量相比于其他可操控设备采集打开的音频信号的对应的多普勒频移量最大,从而可以将具有最大多普勒频移量的可操控设备识别作为目标设备。
进一步地,确定具有特定多普勒频移量的可操控设备为目标设备包括:基于便携设备的麦克风切向速度水平分量产生的频率变化模拟出第一波形;基于可操控设备采集到的音频信号对应的多普勒频移量,模拟出每个可操控设备对应的用于反应频移变化的第二波形;以及在多个第二波形中筛选出与第一波形相似度最高的目标第二波形,确定目标第二波形对应的可操控设备为目标设备。由于用户在使用便携设备作特定手势时,便携设备的麦克风切向速度水平分量指向目标设备,因此,在目标设备处采集到的音频信号后,基于采集到的音频信号对应的多普勒频移量的变化情况模拟出相应的波形(第二波形),还可以基于其他可操控设备集到的音频信号对应的多普勒频移量的变化情况模拟出相应的波形(第二波形)。便携设备基于麦克风切向速度水平分量产生的频率变化模拟出第一波形,通过波形的相似度比较,目标设备的第二波性与第一波性的相似度相比于其他可操控设备最高,从而可以将第二波形与第一波形相似度最高的对应可操控设备识别为目标设备。
第三方面,本申请实施例还提供一种目标设备选择的识别方法,应用于可操控设备,可操控设备与便携设备无线连接,方法包括:接收录音请求消息,并根据录音请求消息开始音频信号采集;将采集到的音频信号提供给便携设备。
进一步地,将采集到的音频信号提供给便携设备包括:将采集到的音频信号通过与便携设备之间的无线连接发送给便携设备。
进一步地,将采集到的音频信号提供给便携设备包括:将采集到的音频信号存储至分布式数据库。
第四方面,本申请实施例还提供一种目标设备选择的识别方法,应用于可操控设备,可操控设备与便携设备无线连接,方法包括:接收播放音频请求消息,基于播放音频请求消息发送音频信号。
进一步地,基于播放音频请求消息发送音频信号包括:按照约定频率播放音频。
第五方面,本申请实施例提供一种交互系统,包括:便携设备和多个可操控设备;其中,便携设备与多个可操控设备无线连接;便携设备用于执行以下步骤:检测到用户的第一动作;响应于第一动作,发送音频信号并且向可操控设备发送录音请求消息;获取可操控设备采集到的音频信号;以及计算可操控设备采集到的音频信号对应的多普勒频移量,并确定具有特定多普勒频移量的可操控设备为目标设备;可操控设备用于执行以下步骤:接收录音请求消息,并根据录音请求消息开始音频信号采集;以及将采集到的音频信号提供给便携设备。
第六方面,本申请实施例提供一种便携设备,包括:处理器和存储器,存储器用于存储至少一条指令,指令由处理器加载并执行时以实现第一方面或者第二方面提供的目标设备选择的识别方法。
第七方面,本申请实施例提供一种交互系统,包括:第六方面提供的便携设备和多个远端设备;其中,便携设备与多个远端设备无线连接。
第八方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现第一方面或者第二方面提供的目标设备选择的识别方法。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例适用的应用场景的示意图;
图2为本申请实施例适用的一种具体场景的示意图;
图3为相关技术中在多设备中选择目标设备的流程图;
图4a为本申请实施例提供的便携设备的硬件结构示意图;
图4b是本申请实施例的便携设备100的软件结构框图;
图5为本申请一个实施例提供的便携设备与远端设备连接示意图;
图6为本申请实施例提供的便携设备的硬件的功能关联示意图;
图7为本申请实施例提供的便携设备与远端设备的功能示意图;
图8a为本申请一个实施例提供的目标设备选择的识别方法的流程图;
图8b为本申请一个实施例提供的便携设备发送音频信号的频率示意图;
图9为本申请一个实施例提供的一种具体应用场景示意图;
图10a为本申请一个实施例提供的特定手势示意图;
图10b为本申请一个实施例提供的特定手势带来的水平速度分量示意图;
图11为本申请一个实施例提供的便携设备的加速度与角速度的监测数据示意图;
图12为本申请一个实施例提供的手机麦克风切向速度水平分量产生的频率变化的波形图;
图13为本申请一个实施例提供的电视机采集到的音频信号对应的频移变化的波形图;
图14为本申请一个实施例提供的音箱采集到的音频信号对应的频移变化的波形图;
图15为本申请另一个实施例提供的目标设备选择的识别方法的流程图;
图16为本申请一个实施例提供的可操控设备发送音频信号的频率示意图;
图17为本申请再一个实施例提供的可操控设备发送音频信号的频率示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为清楚地描述本申请实施例,以下对本申请涉及到的概念进行相应解释:
多普勒效应:指观察者与波源之间存在相对运动时,与波源频率相比观察者接收到波的频率是不同的。举例来说,救护车警报声的声调在救护车接近观察者时会升高而在救护车远离观察者时声调较低,对应的,若救护车静止不动发出警报声,观察者相对于静止的救护车做相对运动,那么观察者听到的警报声的声调会产生变化。
多普勒频移:多普勒效应造成的发射和接收的频率之差称之为多普勒频移。其中,观察者接近声源时,接收到声波的波长缩短,可以理解为声波被压缩,进而导致在一定时间间隔内传播的波数增加了,频率变得较高。反之,当观察者远离声源时,波长变得较长,频率变得较低。
在当前设备智能化的不断发展中,用户对智能设备的操控性要求不断提高,在放置有多个智能设备的环境中,用户想要能够更加便捷操控多个智能设备中的目标设备或者与目标设备进行交互,用户可以通过操作便携设备做出具有指向性的自然手势,进而选择目标设备从而可以实现与该目标设备进行交互或者操控该目标设备。
图1为本申请实施例适用的应用场景的示意图。参照图1所示,该场景中可以包括便携设备100和多个远端设备200。图2为本申请实施例适用的一种具体场景的示意图。示例性的,参照图2所示,便携设备100为手机,多个远端设备包括第一大屏设备以及第二大屏设备。手机、第一大屏设备以及第二大屏设备处于同一分布式场景中。
参照图1所示,用户可以通过便携设备100与多个远端设备200中的目标设备进行指向性交互,或者通过便携设备100操控多个远端设备200中的目标设备。示例性的,参照图2所示,用户可以通过手机面向第一大屏设备以及第二大屏设备中的目标设备做出具有指向性的自然手势,选择出用户的目标设备,进而用户可以通过手机向目标设备分享图片并在该目标设备上显示该图片。或者,用户可以通过手机面向第一大屏设备以及第二大屏设备中的目标设备做出具有指向性的自然手势,选择出用户的目标设备,进而用户可以通过手机调整目标设备的音量大小、显示画面大小、播放倍速等可调节因素。
图1所示的便携设备100与目标设备进行交互或者便携设备100操控该目标设备之前,需要识别出用户选择的目标设备。为实现用户通过便携设备100能够更加自然、更加便捷地选择多个远端设备200中的目标设备,用户可以操作便携设备100做出特定手势,并且便携设备100可以发出超声波信号,多个远端设备200可以接收便携设备100发出的超声波信号。用户可以通过便携设备100做特定手势过程中,便携设备100与目标设备之间存在相对运动,远端设备200接收到的超声波信号的频率发生变化,即出现多普勒频移。可以确定具有特定多普勒频移量的远端设备200为目标设备。
图3为相关技术中在多设备中选择目标设备的流程图。基于图2所示场景,结合图3所示的流程,第一大屏设备和第二大屏设备的屏幕处于工作状态时,第一大屏设备以及第二大屏设备的麦克风均持续采集音频信号从而可以在手机发出超声波信号时,接收到该超声波信号。用户若想要通过手机操控第一大屏设备以及第二大屏设备中的目标设备,例如,通过手机向目标设备进行投屏,用户可以向手机发送相应指令控制手机持续发送超声波。用户操作手机朝向目标设备做出特定手势,第一大屏设备以及第二大屏设备采集到手机发出的超声波信号后进行分析,并计算得出大屏设备接收该超声波信号过程中的多普勒频移量。手机获取第一大屏设备和第二大屏设备计算得到的多普勒频移量,进而手机确定具有特定多普勒频移量的大屏设备为目标设备。在一种可能的实现示例中,手机进而获取目标设备的控制权。
在图3所示的相关技术方案中,第一大屏设备和第二大屏设备在各自设备屏幕处于工作状态时,第一大屏设备和第二大屏设备的麦克风持续采集音频信号,不仅增加大屏设备的功耗而且持续采集音频信号的操作还存在用户隐私泄露的隐患。
图4a为本申请实施例提供的便携设备的硬件结构示意图。参照图4a所示,便携设备100可以包括处理器110,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,传感器模块180,按键190,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括陀螺仪传感器180B和加速度传感器180E等。
可以理解的是,本申请实施例示意的结构并不构成对便携设备100的具体限定。在本申请另一些实施例中,便携设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现便携设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现便携设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为便携设备100充电,也可以用于便携设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对便携设备100的结构限定。在本申请另一些实施例中,便携设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过便携设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
便携设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。便携设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在便携设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在便携设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,便携设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得便携设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
便携设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,便携设备100可以包括1个或N个显示屏194,N为大于1的正整数。
便携设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,便携设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当便携设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。便携设备100可以支持一种或多种视频编解码器。这样,便携设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现便携设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储便携设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行便携设备100的各种功能应用以及数据处理。
便携设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。便携设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当便携设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。便携设备100可以设置至少一个麦克风170C。在另一些实施例中,便携设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,便携设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
陀螺仪传感器180B可以用于确定便携设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定便携设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测便携设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消便携设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
加速度传感器180E可检测便携设备100在各个方向上(一般为三轴)加速度的大小。当便携设备100静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。便携设备100可以接收按键输入,产生与便携设备100的用户设置以及功能控制有关的键信号输入。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和便携设备100的接触和分离。便携设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。便携设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,便携设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在便携设备100中,不能和便携设备100分离。
便携设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android系统为例,示例性说明便携设备100的软件结构。
图4b是本申请实施例的便携设备100的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。
如图4b所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图4b所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供便携设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
下面结合捕获拍照场景,示例性说明便携设备100软件以及硬件的工作流程。
基于触摸操作,相应的硬件中断被发给内核层。内核层将触摸操作加工成原始输入事件(包括触摸坐标,触摸操作的时间戳等信息)。原始输入事件被存储在内核层。应用程序框架层从内核层获取原始输入事件,识别该输入事件所对应的控件。以该触摸操作是触摸单击操作,该单击操作所对应的控件为相机应用图标的控件为例,相机应用调用应用框架层的接口,启动相机应用,进而通过调用内核层启动摄像头驱动,通过摄像头193捕获静态图像或视频。
本申请实施例提供的便携设备100包括但不限于:手机、
基于图4a所示的便携设备100的硬件结构,相应硬件(物理单元)可以通过以下相应操作适用在本申请技术方案:
在一种可实现的实施方式中,便携设备100可以根据加速度传感器180E采集到的加速度和陀螺仪传感器180B的采集到的角速度来监测用户的手势,示例性的,当便携设备100的加速度传感器180E采集到的加速度大于第一阈值,且便携设备100的陀螺仪传感器180B采集到的角速度大于第二阈值时,便携设备100确定用户在进行特定手势的操作。
在一种可实现的实施方式中,该便携设备100的扬声器170A可以发送音频信号,示例性的,可以发送超声波信号,便携设备100的麦克风170C可以采集音频信号,示例性的,可以采集用户的语音指令或者采集远端设备200发送的音频信号。
在一种可实现的实施方式中,便携设备100与远端设备200之间建立无线通信连接,具体可以为便携设备100与远端设备200之间建立近场通信连接,其中,该进场通信连接可以包括NFC通信连接、蓝牙通信连接或者Wi-Fi通信连接。图5为本申请一个实施例提供的便携设备与远端设备连接示意图。示例性的,参照图5所示,便携设备100可以通过无线通信模块160接入家庭网关,示例性的,家庭网关可以为如图5所示的路由器300,便携设备100可以通过无线通信模块160连接路由器300提供的Wi-Fi热点接入Wi-Fi网络,远端设备200与便携设备100接入同一Wi-Fi网络,并且便携设备100可以与多个远端设备200构建分布式场景,从而实现各设备间快速地交互。
在本申请实施例中,便携设备100可以发现该分布式场景中当前可操控的远端设备200a(以下简称可操控设备200a)。示例性的,便携设备100可以为用户的手机、平板电脑、智能手表、增强现实(Augmented Reality,AR)设备或者虚拟现实(Virtual Reality,VR)设备等,或者便携设备100可以为其他类型或结构的电子设备,本申请不做限定。一方面,远端设备200可以为智能家居设备,具体地可以包括:用于安防的报警器、监控摄像头、智能门锁等设备;用于照明的智能台灯、智能顶灯等设备;用于娱乐的电视机、音响等设备;用于厨电的洗碗机、烤箱等设备;用于家装的电动窗帘等设备;或者用于清洁的扫地机器人、洗衣机等设备。在其他实施例中,还可以其他智能家居设备,在此不一一列举。另一方面,远端设备200还可以为智能办公设备,具体地可以包括:大屏设备、打印机、投影仪等设备。其中,当前可操控的远端设备200a为至少具有音频采集功能或者音频发声功能的远端设备200。
在一种可实现的实施方式中,便携设备100的处理器110可以通过与远端设备200之间无线通信连接在第一设定时机向可操控设备200a发送录音请求消息或者发声请求消息。其中,便携设备100可以与远端设备200进行预先约定哪一侧设备为发声设备。其中,该第一设定时机可以为便携设备100在检测到用户使用便携设备100做出特定动作时,示例性的,用户使用手机做出特定手势的起始动作。
在一种实施方式中。可以预先约定便携设备100为发声设备,则远端设备200为收声设备,在此情况下,便携设备100的处理器110可以在第一设定时机控制便携设备100的扬声器170A发送音频信号,并且便携设备100的处理器110可以通过与远端设备200之间无线通信连接,在该第一设定时机向可操控设备200a发送录音请求消息,可操控设备200a基于该录音请求消息通过可操控设备200a的麦克风进行录音从而采集到便携设备100发送的音频信号。
在另一种实施方式中,可以预先约定远端设备200为发声设备,则便携设备100为收声设备,在此情况下,便携设备100的处理器110可以在第一设定时机控制便携设备100的麦克风170C开始采集音频信号,并且便携设备100的处理器110可以通过与远端设备200之间无线通信连接,在该第一设定时机向可操控设备200a发送发声请求消息,可操控设备200a基于该发声请求消息通过可操控设备200a的扬声器发送音频信号。
便携设备100的处理器110可以通过与远端设备200之间无线通信连接在第二设定时机向可操控设备200a发送停止录音请求消息或者停止发声请求消息。其中,该第二设定时机可以为便携设备100在检测到用户使用便携设备100做出相应动作后,示例性的,用户使用手机做出特定手势后,或者用户使用手机完成该特定手势一段时间,该一段时间包括但不限于200ms。
该便携设备100的处理器110可以根据设定算法对便携设备100的麦克风采集到的音频信号进行分析,计算出相应的多普勒频移量,并根据计算出的多普勒频移量确定用户选定的目标设备,该目标设备为可操控设备200a中具有特定多普勒频移量的设备。
在一些实施例中,该便携设备100的处理器110还可以获取可操控设备200a采集到的音频信号,并根据设定算法对该音频信号进行分析。示例性的,可操控设备200a可以将采集到音频信号存储在分布式数据库中,便携设备100可以从分布式数据库中读取出可操控设备200a存储的音频数据,并根据设定算法对该音频信号进行分析。
在一种可实现的实施方式中,便携设备100的无线通信模块160可以在便携设备100的显示屏194被唤醒后执行一次可操控设备200a的识别步骤。示例性的,便携设备100的无线通信模块160可以在显示屏194(响应于用户对屏幕的触控动作或者响应于用户按压电源键)亮起后,筛选出该分布式场景中可以操控的远端设备200。触发无线通信模块160执行可操控设备200a的识别步骤的时机包括但不限于上述情形,例如,还可以在便携设备100完成(通过指纹、密码或者面部识别等方式)解锁后,确定该可操控设备200a。
图6为本申请实施例提供的便携设备的硬件的功能关联示意图。图7为本申请实施例提供的便携设备与远端设备的功能示意图。结合图6和图7所示,便携设备100的显示屏194和处理器110可以相互配合实现场景识别功能,具体地,便携设备100的无线通信模块160可以在显示屏194点亮后,筛选出该分布式场景中可以操控的远端设备200。
结合图6和图7所示,便携设备100的无线通信模块160可以用于便携设备100与可操控设备200a之间的交互或者便携设备100操控可操控设备200a中的目标设备,即实现设备通信功能。
参照图6所示,便携设备100的加速度传感器180E、陀螺仪传感器180B和处理器110可以相互配合实现手势识别感知的功能。具体地,处理器110可以获取加速度传感器180E采集得到的加速度信息以及陀螺仪传感器180B采集到的角速度信息。处理器110通过分析获取到的便携设备100的加速度信息和角速度信息来识别用户做出的手势。示例性的,当便携设备100的处理器110通过分析确定加速度传感器180E采集到的加速度大于第一阈值,且便携设备100的陀螺仪传感器180B采集到的角速度大于第二阈值时,则可以确定用户在进行特定手势的操作。在另一种示例中,便携设备100的处理器110可以获取加速度传感器180E采集到的加速度以及陀螺仪传感器180B采集到的角速度进行分析,根据分析结果若确定加速度和角速度的数据特征符合特定手势数据特征,则确定用户进行特定手势的操作。其中,该数据特征可以为数据变化轨迹形成的波形。其中,特定手势操作识别的具体步骤在后续描述中具体说明。
结合图6和图7所示,便携设备100的扬声器170A、麦克风170C和处理器110可以相互配合实现信号特征识别的功能。示例性的,在用户移动便携设备100做出特定手势选择目标设备的场景中,便携设备100的扬声器170A可以发送特定频率的音频信号(超声波信号),便携设备100相对于可操控设备200a的运动会引起多普勒频移,可操控设备200a的麦克风可以采集便携设备100发送的音频信号,便携设备100可以获取每个可操控设备200a采集到的音频信号,便携设备100的处理器110可以基于音频信号处理技术计算每个音频信号的多普勒频移量,并基于多个音频信号对应的多普勒频移量筛选出具有特定多普勒频移量的可操控设备200a,进而选择具有特定多普勒频移量的可操控设备200a作为目标设备。其中,基于可操控设备200a采集到的音频信号的多普勒频移量确定目标设备的确定方法在后续描述中具体说明。
在其他实施方式中,在用户移动便携设备100做出特定手势选择目标设备的场景中,多个可操控设备200a的麦克风可以发送特定频率的音频信号(超声波信号),便携设备100相对于可操控设备200a的运动会引起多普勒频移,便携设备100的麦克风170C可以采集多个可操控设备200a发送的音频信号,便携设备100的处理器110可以基于音频信号处理技术计算每个音频信号的多普勒频移量,并基于多个音频信号对应的多普勒频移量筛选出具有特定多普勒频移量的可操控设备200a,进而选择具有特定多普勒频移量的可操控设备200a作为目标设备。
结合图6和图7所示,远端设备200也具有录音分析功能。在一些实施例中,远端设备200可以在采集到便携设备100的扬声器170A发送的音频信号后,基于音频信号处理技术计算采集到的音频信号的多普勒频移量,并将计算得到的多普勒频移量存储至分布式数据库中,便携设备100可以获取每个可操控设备200a存储在分布式数据库中的多普勒频移量,并基于多个音频信号对应的多普勒频移量筛选出具有特定多普勒频移量的可操控设备200a,进而选择具有特定多普勒频移量的可操控设备200a作为目标设备。
图8a为本申请一个实施例提供的目标设备选择的识别方法的流程图。基于图5所示结构的便携设备100,并结合图8a所示流程,对本申请实施例提供的目标设备选择的识别方法进行如下详细说明。如图8a所示,该方法可以包括如下步骤:
步骤801:便携设备100发现检测当前场景中与自身处于连接状态的可操控设备200a。
其中,在本申请的技术方案中为了降低设备功耗,用户可以通过便携设备100控制场景中的可操控设备200a在特定时间段内进行音频信号采集。进而执行可操控设备200a在特定时间段内进行音频信号采集步骤之前,便携设备100可以预先检测当前场景中的与便携设备100处于连接状态的可操控设备200a。示例性的,便携设备100可以与多个远端设备200构建分布式场景,便携设备100可以利用分布式场景的设备发现特性发现场景中的可操控设备200a。图9为本申请一个实施例提供的一种具体应用场景示意图。便携设备100可以为如图9所示的手机S1,手机S1与音箱D1、电视机D2、监控摄像头D3以及智能顶灯(图中未示出)构建分布式场景,其中,音箱D1、电视机D2、监控摄像头D3均具有音频采集功能、音频发声功能以及音频信号分析功能,其中,该音频信号分析功能至少为计算音频信号的多普勒频移量的功能。然而,该智能顶灯并不具有音频采集功能或者音频发声功能。手机S1可以基于分布式场景的设备发现特性确定其发现的各个设备中,该智能顶灯不具有音频采集功能或者音频发声功能,进而可以确定该智能顶灯并非为可操控设备200a,基于相同原理,手机S1可以发现可操控设备音箱D1、电视机D2以及监控摄像头D3。
步骤802:便携设备100检测到用户的第一动作。
其中,为了实现通过非触控的自然交互行为选择目标设备,用户可以操作便携设备100向着目标设备做出特定手势,使便携设备100与目标设备之间出现相对运动。图10a为本申请一个实施例提供的特定手势示意图。示例性的,结合图9和图10a所示,用户可以使用手机S1向着目标设备做出特定手势,该特定手势可以为“招一招”手势,其中,该“招一招”手势具体为用户使用手机S1向着目标设备前后挥动,使手机S1与目标设备之间出现相对运动。如图10a所示,该“招一招”手势至少包括动作“0”、动作“1”和动作“2”。其中,手机S1的麦克风设置在手机顶部,用户通过移动手机S1做出动作“0”时,手机S1的麦克风远离目标设备,在做出动作“1”时,手机S1的麦克风靠近目标设备,并在做出动作“2”时,手机S1的麦克风再次远离目标设备。
便携设备100执行步骤802时,即,便携设备100检测用户的第一动作,其中该第一动作可以为图10所示的动作“0”。图10b为本申请一个实施例提供的特定手势带来的水平速度分量示意图,参照图10b所示,用户在做“招一招”手势过程中,随着用户依次做出动作“0”、动作“1”和动作“2”,用户移动手机S1带来的切向水平速度使手机S1相对于目标设备(电视机D2)发生水平位移,水平位移的方向包括靠近电视机D2或者远离电视机D2。便携设备100的处理器110可以基于便携设备100的加速度传感器180E检测到的加速度信息和陀螺仪传感器180B检测到的角速度信息确定用户是否操作便携设备100做出第一动作。示例性的,当便携设备100的处理器110通过分析确定加速度传感器180E采集到的加速度大于第一阈值,且便携设备100的陀螺仪传感器180B采集到的角速度大于第二阈值时,则可以确定用户使用便携设备100做出第一动作。图11为本申请一个实施例提供的便携设备的加速度与角速度的监测数据示意图,如图11所示,可以基于加速度传感器180E采集到的加速度和陀螺仪传感器180B采集到的角速度确定,在图11所示的“0”位置处检测到了用户使用便携设备100做出了图10所示的动作“0”(即,第一动作),“1”位置处检测到了用户使用便携设备100做出了图10所示的动作“1”,以及在图11所述的“2”位置处检测到了用户使用便携设备100做出了图10所述的动作“2”。
步骤803:响应于第一动作,便携设备100控制扬声器170A发送音频信号并且向可操控设备200a发送录音请求消息。
其中,便携设备100在检测到用户做出第一动作后,响应于该第一动作,便携设备100控制自身的扬声器170A发送音频信号并且向可操控设备200a发送录音请求消息,从而请求可操控设备200a进行音频采集操作。
响应于该第一动作,便携设备100需要执行步骤803a,步骤803a包括:便携设备100控制扬声器170A持续播放特定频率的音频信号。为避免干扰他人,可以使用人耳不能听到的高频声波信号,如超声波信号。基于一些试验,人耳听不到17KHz以上的声音,在一种实施方式中,参照图8b所示,便携设备100控制扬声器170A持续播放特定频率的音频信号,具体可以控制便携设备100的扬声器170A发送20KHz的高频声波信号(超声波信号),这个频率段的声源既有较强的适应性,可以被大多设备接收到,且不造成噪声污染,不影响当前环境。本申请实施例中并不对音频信号的频率进行具体限定,可以在一定范围内选择高频声波信号的约定频率,示例性的,在17KHz至20KHz范围内的一种固定频率作为发送音频信号的约定频率。
其中需要说明的是,为了避免应用场景中存在的其他音源对可操控设备200a的采集工作造成干扰,便携设备100可以与每个可操控设备200预先约定发送音频信号的频率,进而可以使可操控设备200在采集音频信号时进行针对性的采集,具体地,可操控设备200a可以对采集到的音频信号进行过滤,从而可以针对性地采集到便携设备发送的高频声波信号。
响应于该第一动作,便携设备100需要执行步骤803b,步骤803b包括:便携设备100向已发现的可操控设备200a发送录音请求消息。
在一种实施方式中,响应于第一动作,便携设备100可以同时执行步骤803a和步骤803b,即,便携设备100控制扬声器170A持续播放特定频率的音频信号和向已发现的可操控设备200a发送录音请求消息这两个步骤可以同时执行。
在其他实施方式中,响应于第一动作,便携设备100可以先执行步骤803a和步骤803b中的任意一个步骤,再执行剩余的另一步骤,即,便携设备100可以先控制扬声器170A持续播放特定频率的音频信号,或者,便携设备100先向已发现的可操控设备200a发送录音请求消息,并在一定时间后执行另一步骤。
其中,需要说明的是,上述一定时间的时间长度至少不影响可操控设备200a采集到用户在做动作“1”和动作“2”过程中便携设备100的扬声器170A持续播放的音频信号,换言之,可操控设备200a至少在用户做动作“1”之前接收到便携设备发送的录音请求消息并开始录音。示例性的,响应于第一动作,便携设备100先向已发现的可操控设备200a发送录音请求消息,可操控设备200a在接收到该录音请求信息后开始录音,自便携设备100先向已发现的可操控设备200a发送录音请求消息起,经过50ms后,便携设备100再控制扬声器170A持续播放20KHz的高频声波信号,相应的,可操控设备200a通过自身麦克风采集便携设备100发送的高频声波信号。
步骤804:满足设定条件,则停止发送所述音频信号并且向所述可操控设备发送停止录音请求消息。
在一种实施方式中,步骤804可以包括步骤804a和步骤804b,具体如下:
步骤804a:便携设备100检测到用户的第二动作。
其中,该第二动作至少包括图10所示的顺序连贯执行的动作“0”(即,第一动作)、动作“1”和动作“2”。特定手势(如“招一招”手势)包括该第二动作,或者特定手势即为该第二动作。
便携设备100的处理器110可以基于便携设备100的加速度传感器180E检测到的加速度信息和陀螺仪传感器180B检测到的角速度信息确定用户是否操作便携设备100做出第二动作。示例性的,第二动作为顺序连贯执行动作“0”、动作“1”和动作“2”,便携设备100的处理器110可以基于便携设备100的加速度传感器180E检测到的加速度信息和陀螺仪传感器180B检测到的角速度信息确定用户操作便携设备100顺序连贯的执行动作“0”、动作“1”和动作“2”后,确定用户做出了第二动作。
步骤804b:响应于第二动作,便携设备100控制扬声器170A停止发送音频信号并且向可操控设备200a发送停止录音请求消息。
其中,便携设备100在检测到用户做出第二动作后,响应于该第二动作,便携设备100控制自身的扬声器170A停止发送音频信号并且向可操控设备200a发送停止录音请求消息,从而请求可操控设备200a结束音频采集操作,进一步地,可操控设备200a可以将采集到的音频信号存储在相应存储器中,示例性的,可以存储在分布式数据库中。
在另一种实施方式中,步骤804包括步骤804s,具体如下:
步骤804s:检测到用户的第一动作时起,便携设备100在经过设定时间后控制扬声器170A停止发送音频信号并且向可操控设备200a发送停止录音请求消息。其中,该设定时间为预估或者采集到的用户完成特定手势所需要的时间。
示例性的,便携设备100可以在出厂前预设一个时长作为预估用户完成特定手势所需要的时间,该时长的选取方式可以为多个试验人员做出特定手势,采集每个试验人员做出特定手势所花费的时间。进而可以基于采集到的时间确定上述设定时间的时长,确定方式包括但不限于:以采集到的多个时长的平均值为设点时间段的时长,或者以采集到的多个时长中的最大值作为设点时间段的时长。
在其他示例中,便携设备100可以用户使用便携设备100阶段(如用户激活便携设备100过程中或者用户开启通过手势选择目标设备功能时)引导用户做特设手势(如“招一招”手势),并采集用户完成该特定手势所需要的时间,并将采集到的用户所用时间作为上述特定时间段。
其中,便携设备100在检测到用户做出第一动作后开始计时,并在经过设定时间后控制自身的扬声器170A停止发送音频信号并且向可操控设备200a发送停止录音请求消息,从而请求可操控设备200a结束音频采集操作,进一步地,可操控设备200a可以将采集到的音频信号存储在相应存储器中,示例性的,可以存储在分布式数据库中。
步骤805:便携设备100获取每个可操控设备200a采集到的音频信号。
其中,便携设备100可以通过对可操控设备200a采集到的音频信号进行分析以确定用户所选择的目标设备。便携设备100需要现获取到每个可操控设备200a采集到的音频信号。在一种实施方式中,可操控设备200a在采集到音频信号后,可以通过与便携设备之间的无线通信连接将本次采集到的音频信号发送给便携设备100。在另一种实施方式中,
可操控设备200a在采集到音频信号后,可以将采集到的音频信号存储至分布式数据库中,便携设备100可以响应于第二动作从分布式数据库中读取可操控设备200a本次存储的音频信号,其中,便携设备100可以基于可操控设备200a存储的音频信号的标识信息确定,需要读取的目标音频信号,示例性的,可以基于音频信号的名称信息以及时间戳确定是否为本次需要读取的目标音频信号。具体地,可以基于分布式数据库中设定存储区域内存储的音频信号的名称信息识别出该音频为可操控设备200a存储的用于分析用户选择目标设备的音频,在此基础上,进一步筛选出存储时间戳在检测到第二动作时间之后的音频,则可以筛选出本次需要读取的目标音频信号。在一些实施例中,还可以定期删除分布式数据库中设定存储区域内设定满足一定条件的音频数据,示例性地,可以每隔1h删除一次存储时间已满1min的音频数据。通过定期删除过期音频数据,可以降低筛选需要读取的目标音频信号的工作量,从而可以提高筛选速度。
步骤806:便携设备100计算每个音频信号对应的多普勒频移量,选择具有特定频移量的可操控设备200a作为目标设备。
用户手持便携设备100朝向目标设备做出特定手势,该特定手势包括在朝向目标设备的方向上运动。便携设备100在该特定手势过程中发送持续播放特定频率的音频信号,场景内的可操控设备200a可以通过自身麦克风采集到该特定频率的音频信号。由于该特定手势的运动,可操控设备200a采集到的音频的频率相对于便携设备100播放的特定频率的音频信号的原始频率出现多普勒频移。以图9所示场景为例,结合图10b所示,用户使用手机S1朝向电视机D2做出“招一招”手势,用户使用手机S1做该“招一招”手势带动机运动时,其水平切向位移朝向电视机D2。且在用户做“招一招”手势过程中,手机S1持续发送20KHz的超声波信号,音箱D1、电视机D2以及监控摄像头D3均可以通过麦克风采集到手机S1播放的音频,进而可以基于音箱D1、电视机D2以及监控摄像头D3采集到的音频的多普勒频移情况确定特定手势过程中手机朝向的设备,即确定目标设备。
在一种实施方式中,便携设备100在获取到可操控设备200a采集到的音频信号(即上述目标音频信号)后,可以基于音频信号处理技术计算每个目标音频信号的多普勒频移量,并基于多个目标音频信号对应的多普勒频移量筛选出具有最大频移量的可操控设备200a,进而选择具有最大频移量的可操控设备200a作为目标设备。
其中,用户在使用便携设备100做特定手势(如“招一招”手势)过程中,持续发送恒定频率f0的高频声波信号(如20KHz的超声波信号),当前场景中的可操控设备200a可以通过自身麦克风采集到便携设备100发送的高频声波信号。在一种实施方式中,根据多普勒效应,所接收的高频声波信号的频率fA可以通过以下公式一进行计算:
其中,c表示声速,vs表示用户手势的速度,va表示可操控设备200a的速度。一般地,可操控设备200a处于静止状态,即,va=0。在其他实施方式中,还可以通过其他计算方式计算频率fA,在此不做限定。
在用户使用便携设备100做出特定手势时,用户手持便携设备100水平切向位移朝向目标设备,因此,相比于该场景的其余可操控设备200a,目标设备位置处能够检测到最大的多普勒频移,因此,可以通过比较各个可操控设备200a位置处的频移峰值,筛选出具有最大频移量的可操控设备200a,则可以确定用户选择的目标设备,其中,目标设备采集到的音频信号的具有最大频移量。
在另一种实施方式中,便携设备100还可以基于其他方式确定用户选择的目标设备。示例性的,便携设备100在获取到可操控设备200a采集到的音频信号(即上述目标音频信号)后,可以基于信号特征提取技术进行信号特征提取并模拟出采集到的目标音频信号的频移变化的波形(第二波形)图。进一步地,便携设备100还可以获取便携设备100的陀螺仪传感器180B在用户做特定手势过程中的检测数据,并基于该检测数据模拟出便携设备100水平切向分速度产生的频率变化的波形(第一波形)图。为确定用户选择的目标设备,可以将每个目标音频信号的频移变化的波形图分别与便携设备100水平切向分速度产生的频率变化的波形图进行比对,并且确定二者之间的波形相似度,其中,确定与便携设备100水平切向分速度产生的频率变化的波形图相似度最高的目标音频信号的频移变化的波形图对应的可操控设备为用户选择的目标设备。示例性的,基于图9所示应用场景,用户使用手机S1朝向目标设备(电视机D2)做出“招一招”手势后,音箱D1、电视机D2以及监控摄像头D3均采集到手机S1发送的20KHz的超声波信号,手机S1获取音箱D1、电视机D2以及监控摄像头D3采集到的超声波信号,并对每个超声波信号进行分析得到上述音频信号的频移变化的波形图。另一方面,手机S1可以根据手机S1陀螺仪在用户做“招一招”手势过程中的检测数据模拟出手机S1水平切向分速度产生的频率变化的波形图。其中,图12为本申请一个实施例提供的手机水平切向分速度产生的频率变化的波形图,手机S1可以根据手机S1陀螺仪在用户做“招一招”手势过程中的检测数据模拟出如图12所示的波形。图13为本申请一个实施例提供的电视机采集到的音频信号对应的频移变化的波形图,如图13所示,o点至a点对应图10所示的动作“0”,即,在做动作“0”时,在电视机D2位置处采集手机S1发送的20KHz的超声波信号的频率出现下降,由于本申请的技术方案中为降低设备功耗,手机S1响应于第一动作(如动作“0”),进行音频信号发送、音频信号采集以及音频信号的分析的操作,基于本申请的方案并不能查看到o点至a点的频移变化,图13所示o点之前的20KHz的恒定频率以及o点至a点的频移变化仅作为比对参考的频移变化轨迹。基于本申请的技术方案可以查看到a点之后音频信号的频移变化情况。
a点至b点对应图10所示的动作“1”,用户在做动作“1”的过程中,手机S1向电视机D2靠近,根据多普勒效应,电视机D2在此过程中采集到的超声波信号的频率逐渐增大,由a点的19.91KHz逐渐增长并在动作“1”完成时达到峰值,即达到b点对应的21.21KHz。b点至c点对应图10所示的动作“2”,用户在做动作“2”的过程中,手机S1逐渐远离电视机D2,根据多普勒效应,电视机D2在此过程中采集到的超声波信号的频率逐渐减小,由b点的21.21KHz逐渐减小,并在用户完成“招一招”手势后手机S1相对于电视机D2的运动状态趋于稳定,一段时间内手机S1相对于电视机D2保持静止,则电视机D2处采集到的超声波信号的频率保持稳定。其中需要说明的是,在本申请的部分实施例中,响应于第二动作(例如动作“2”),停止音频信号发送、音频信号采集以及音频信号的分析的操作,c点之后的频移变化作为比对参考的频移变化轨迹。
图14为本申请一个实施例提供的音箱采集到的音频信号对应的频移变化的波形图,如图14所示,在音箱D1位置处采集手机S1发送的超声波信号,该超声波信号的频率较为杂乱。监控摄像头D3采集到的音频信号对应的频移变化的波形图未示出,与图14类似,只能观察到杂乱的信号。
手机S1可以判断图13所示波形图与图12所示波形图的相似度,以及图14所示波形图与图12所示波形图的相似度,通过相似度比较可以确定图13所示波形图与图12所示波形图的相似度高于图14所示波形图与图12所示波形图的相似度,从而可以得出用户通过手机S1选择的目标设备为图13所示波形图对应的电视机D1。
上述实施例中,便携设备100作为发声端发送音频信号,可操控设备200a作为采集端采集便携设备100发送的音频信号,然而,采集端的设备需要支持高频采样收声的功能,音频采样频率至少要在40khz以上,然而一些设备由于硬件限制无法支持高频采样收声。
为进一步解决存在的上述由于硬件限制无法支持高频采样收声的问题,本申请实施例还提供另一种目标设备选择的识别方法。图15为本申请另一个实施例提供的目标设备选择的识别方法的流程图。基于图5所示结构的便携设备100,并结合图15所示流程,对本申请实施例提供的目标设备选择的识别方法进行如下详细说明。如图15所示,该方法可以包括如下步骤:
步骤901:便携设备100检测当前场景中与自身处于连接状态的可操控设备200a。
具体实现方式可以与图8a所示的步骤801相同或类似,在此不再赘述。
步骤902:便携设备100检测到用户的第一动作。
具体实现方式可以与图8a所示的步骤802相同或类似,在此不再赘述。
步骤903:响应于第一动作,便携设备100控制麦克风170C采集音频信号并且向可操控设备200a发送播放音频请求消息。
其中,响应于该第一动作,便携设备100需要执行步骤903a,步骤903a包括:便携设备100向可操控设备200a发送播放音频请求消息。操控设备200a接收到便携设备100发送的播放音频请求消息后,开始持续播放特定频率的音频信号。本申请实施例中并不对音频信号的频率进行具体限定,示例性的,可以在17KHz至20KHz范围内选择高频声波信号作为约定频率。在一种实施方式中,参照图16,每个可操控设备200a可以发送相同频率f(例如f=20KHz)的高频声波信号(超声波信号),这个频率段的声源既有较强的适应性,可以被大多设备接收到,且不造成噪声污染,不影响当前环境。在每个可操控设备200a发送相同频率的高频声波信号的实施例中,需要可操控设备200a串行发送20KHz的高频声波信号,相对应的,便携设备100需要串行接收可操控设备200a发送20KHz的高频声波信号,示例性的,按照图16所示的顺序①、②、③串行发送和串行接收。进行直至采集到全部可操控设备200a发送20KHz的高频声波信号,然而此种方式会造成较长时间,影响用户体验。为克服上述时延问题,可以是每个可操控设备200a发送不同频率的高频声波信号。参照图17,可操控设备200a可以按照一定频率差(如±0.5KHz)分配频段,并且每个可操控设备200a预先与便携设备100约定好自身发送的高频声波信号的频率。示例性的,场景中有三个远端设备200,且该三个远端设备200均为可操控设备200a,该三个可操控设备200a向便携设备100发送的高频声波信号分别为频率f、频率f-0.5k以及频率f+0.5k。进而便携设备100在采集音频过程中,可以按照约定频率(频率f、频率f-0.5k以及频率f+0.5k)进行针对性采集,从而采集到三个可操控设备200a向便携设备100发送的高频声波信号。
响应于该第一动作,便携设备100需要执行步骤903b,步骤903b包括:便携设备100控制麦克风170C采集音频信号。
其中需要说明的是,为了避免应用场景中存在的其他音源对便携设备100的采集工作造成干扰,便携设备100可以与每个可操控设备200预先约定发送音频信号的频率,进而可以使便携设备100在采集音频信号时进行针对性的采集,具体地,便携设备100可以对采集到的音频信号进行过滤,从而可以针对性地采集到可操控设备200发送的高频声波信号。
在一种实施方式中,响应于第一动作,便携设备100可以同时执行步骤903a和步骤903b。即,便携设备100控制麦克风170C采集音频信号和向可操控设备200a发送播放音频请求消息这两个步骤可以同时执行。
在其他实施方式中,响应于第一动作,便携设备100可以先执行步骤903a和步骤903b中的任意一个步骤,再执行剩余的另一步骤,即,便携设备100可以先控制麦克风170C采集音频信号,或者便携设备100先向可操控设备200a发送播放音频请求消息,并在一定时间后执行另一步骤。
其中,需要说明的是,上述一定时间的时间长度至少不影响便携设备100采集到用户在做动作“1”和动作“2”过程中可操控设备200a持续播放的音频信号,换言之,可操控设备200a至少在用户做动作“1”之前接收到便携设备100发送的播放音频请求消息并开始播放相应的音频信号。
步骤904:满足设定条件,则停止采集音频信号并且向所述可操控设备发送停止播放音频请求消息。
在一种实施方式中,步骤904可以包括步骤904a和步骤904b,具体如下:
步骤904a:便携设备100检测到用户的第二动作。
具体实现方式可以与图8a所示的步骤804a相同或类似,在此不再赘述。
步骤904b:响应于第二动作,便携设备100控制麦克风170C停止采集音频信号并且向可操控设备200a发送停止播放音频请求消息。
其中,便携设备100在检测到用户做出第二动作后,响应于该第二动作,便携设备100控制自身的麦克风停止采集音频信号,进而可以获取到每个可操控设备200a发送的音频信号。响应于第二动作,便携设备100还向可操控设备200a发送停止播放音频请求消息,从而使可操控设备200a基于停止播放音频请求消息停止播放音频信号,通过上述控制方式可以避免便携设备100以及可操控设备200a持续进行音频信号的发送以及采集的动作,进而可以降低便携设备100以及可操控设备200a的功耗。
在另一种实施方式中,步骤904包括步骤904s,具体如下:
步骤904s:检测到用户的第一动作时起,便携设备100在经过设定时间后控制麦克风170C停止采集音频信号并且向可操控设备200a发送停止播放音频请求消息。其中,该设定时间为预估或者采集到的用户完成特定手势所需要的时间。
该设定时长的设定方式与步骤804s中描述的相同或类似,在此不再赘述。
其中,便携设备100在检测到用户做出第一动作后开始计时,并在经过设定时间后麦克风170C停止采集音频信号并且向可操控设备200a发送停止播放音频请求消息,从而请求可操控设备200a结束音频播放操作。
步骤905:便携设备100计算每个音频信号对应的多普勒频移量,选择具有特定频移量的可操控设备200a作为目标设备。
具体实现方式可以与图8a所示的步骤806相同或类似,在此不再赘述。
通过本申请实施例提供的方法,便携设备100可以想要操控其所在场景中的任一可操控设备200a时,用户可以通过操作便携设备100朝向目标设备做出特定手势,从而进行目标设备的切换,可以解决现有技术中设备控制过程中繁琐,花费时间长的问题,不仅如此,还可以解决现有技术中远端设备200持续采集音频存在泄漏用户隐私的问题。
本申请实施例还提供一种目标设备选择的识别方法,应用于远端设备,远端设备与便携设备无线连接,所述方法包括:接收录音请求消息,并根据录音请求消息开始音频信号采集;将采集到的音频信号提供给便携设备。
在一种实施方案中,将采集到的音频信号提供给便携设备可以为将采集到的音频信号通过与便携设备之间的无线连接发送给便携设备。
在另一种实施方式中,将采集到的音频信号提供给便携设备可以为将采集到的音频信号存储至分布式数据库。便携设备可以在分布式数据库读取相应音频信号。
本申请实施例还提供一种目标设备选择的识别方法,应用于远端设备,远端设备与便携设备无线连接,所述方法包括:接收播放音频请求消息,基于播放音频请求消息发送音频信号。
在一种实施方式中,基于播放音频请求消息发送音频信号的方式可以为按照约定频率播放音频。可操控设备200a可以按照一定频率差(如±0.5KHz)分配频段,并且每个可操控设备200a预先与便携设备100约定好自身发送的高频声波信号的频率。示例性的,场景中有三个远端设备200,且该三个远端设备200均为可操控设备200a,该三个可操控设备200a向便携设备100发送的高频声波信号分别为频率f、频率f-0.5k以及频率f+0.5k。进而便携设备100在采集音频过程中,可以按照约定频率(频率f、频率f-0.5k以及频率f+0.5k)进行针对性采集,从而采集到三个可操控设备200a向便携设备100发送的高频声波信号。
本申请实施例还提供一种交互系统,包括:便携设备和多个可操控设备;其中,便携设备与多个远端设备无线连接;便携设备用于执行以下步骤:检测到用户的第一动作;响应于第一动作,发送音频信号并且向可操控设备发送录音请求消息;获取可操控设备采集到的音频信号;以及计算可操控设备采集到的音频信号对应的多普勒频移量,并确定具有特定多普勒频移量的可操控设备为目标设备;可操控设备用于执行以下步骤:接收录音请求消息,并根据录音请求消息开始音频信号采集;以及将采集到的音频信号提供给便携设备。
本申请实施例还提供一种便携设备包括:处理器和存储器,所述存储器用于存储至少一条指令,所述指令由所述处理器加载并执行时以实现本申请相应实施例提供的目标设备选择的识别方法。其中,本申请实施例通过的便携设备100的硬件结构可以如图4a所示,其软件结构可以如图4b所示。
本申请实施例还提供一种交互系统,包括上述便携设备和多个上述远端设备,便携设备与多个所述远端设备无线连接。
在一种实施方式中,便携设备与多个所述远端设备构建分布式场景,且便携设备与多个所述远端设备登录同一账号。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请任一实施例提供的目标设备选择的识别方法。
可以理解的是,所述应用可以是安装在终端上的应用程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本申请实施例对此不进行限定。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (17)

1.一种目标设备选择的识别方法,其特征在于,应用于便携设备,所述便携设备与多个可操控设备无线连接,所述方法包括:
检测到用户的第一动作;
响应于所述第一动作,发送音频信号并且向所述可操控设备发送录音请求消息;
获取所述可操控设备采集到的音频信号;以及
计算所述可操控设备采集到的音频信号对应的多普勒频移量,并确定具有特定多普勒频移量的可操控设备为目标设备。
2.根据权利要求1所述的方法,其特征在于,所述便携设备与多个可操控设备无线连接包括:所述便携设备与多个所述可操控设备之间建立近场通信连接,所述近场通信连接包括蓝牙通信连接或者Wi-Fi连接。
3.根据权利要求1或2所述的方法,其特征在于,所述便携设备和所述多个可操控设备登录相同的账号。
4.根据权利要求1所述的方法,其特征在于,在所述检测到用户的第一动作之前,还包括:检测与所述便携设备处于连接状态的所述可操控设备;
其中,所述可操控设备至少具有音频采集功能。
5.根据权利要求1所述的方法,其特征在于,所述计算所述可操控设备采集到的音频信号对应的多普勒频移量,并确定具有特定多普勒频移量的可操控设备为目标设备之前,还包括:
满足设定条件,则停止发送所述音频信号并且向所述可操控设备发送停止录音请求消息。
6.根据权利要求5所述的方法,其特征在于,所述满足设定条件,则停止发送所述音频信号并且向所述可操控设备发送停止录音请求消息包括:
检测到用户的第二动作;以及
响应于所述第二动作,停止发送所述音频信号并且向所述可操控设备发送停止录音请求消息。
7.根据权利要求6所述的方法,其特征在于,所述第一动作为特定手势中的一个动作,所述第二动作包括所述第一动作;
其中,所述特定手势包括所述第二动作或者所述特定手势为所述第二动作。
8.根据权利要求1所述的方法,其特征在于,所述满足设定条件,则停止发送所述音频信号并且向所述可操控设备发送停止录音请求消息包括:
自所述检测到用户的第一动作起,并经过设定时间后,则停止发送所述音频信号并且向所述可操控设备发送停止录音请求消息。
9.根据权利要求1所述的方法,其特征在于,所述确定具有特定多普勒频移量的可操控设备为目标设备包括:
基于所述可操控设备采集到的音频信号对应的多普勒频移量,确定具有最大多普勒频移量的所述可操控设备为所述目标设备。
10.根据权利要求1所述的方法,其特征在于,所述确定具有特定多普勒频移量的可操控设备为目标设备包括:
基于所述便携设备的麦克风切向速度水平分量产生的频率变化模拟出第一波形;
基于所述可操控设备采集到的音频信号对应的多普勒频移量,模拟出每个所述可操控设备对应的用于反应频移变化的第二波形;以及
在多个所述第二波形中筛选出与所述第一波形相似度最高的目标第二波形,确定所述目标第二波形对应的可操控设备为所述目标设备。
11.一种目标设备选择的识别方法,其特征在于,应用于便携设备,所述便携设备与多个可操控设备无线连接,所述方法包括:
检测到用户的第一动作;
响应于所述第一动作,采集音频信号并且向所述多个可操控设备发送播放音频请求消息;
计算采集到的音频信号对应的多普勒频移量,并确定具有特定多普勒频移量的可操控设备为目标设备。
12.根据权利要求11所述的方法,其特征在于,所述响应于所述第一动作,采集音频信号并且向所述多个可操控设备发送播放音频请求消息包括:
响应于所述第一动作,向所述可操控设备发送播放音频请求消息,以使所述可操控设备分别按照约定频率播放音频;
响应于所述第一动作,控制所述便携设备的麦克风按照所述约定频率采集所述可操控设备播放的音频。
13.根据权利要求12所述的方法,其特征在于,所述可操控设备分别按照约定频率播放音频包括:
所述可操控设备按照一定频率差分配频段,并按照自身分配到的频率播放相应频率的音频。
14.根据权利要求11所述的方法,其特征在于,所述计算采集到的音频信号对应的多普勒频移量,并确定具有特定多普勒频移量的可操控设备为目标设备之前,还包括:
满足设定条件,则停止采集音频信号并且向所述可操控设备发送停止播放音频请求消息。
15.一种交互系统,其特征在于,所述系统包括:便携设备和多个可操控设备;
其中,所述便携设备与多个所述可操控设备无线连接;
所述便携设备用于执行以下步骤:
检测到用户的第一动作;
响应于所述第一动作,发送音频信号并且向所述可操控设备发送录音请求消息;
获取所述可操控设备采集到的音频信号;以及
计算所述可操控设备采集到的音频信号对应的多普勒频移量,并确定具有特定多普勒频移量的可操控设备为目标设备;
所述可操控设备用于执行以下步骤:
接收录音请求消息,并根据录音请求消息开始音频信号采集;以及
将采集到的音频信号提供给便携设备。
16.一种便携设备,其特征在于,所述设备包括:
处理器和存储器,所述存储器用于存储至少一条指令,所述指令由所述处理器加载并执行时以实现如权利要求1-14中任意一项所述的目标设备选择的识别方法。
17.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-14中任意一项所述的目标设备选择的识别方法。
CN202210495392.8A 2022-05-07 2022-05-07 目标设备选择的识别方法、终端设备、系统和存储介质 Pending CN117056895A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210495392.8A CN117056895A (zh) 2022-05-07 2022-05-07 目标设备选择的识别方法、终端设备、系统和存储介质
PCT/CN2023/091573 WO2023216922A1 (zh) 2022-05-07 2023-04-28 目标设备选择的识别方法、终端设备、系统和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210495392.8A CN117056895A (zh) 2022-05-07 2022-05-07 目标设备选择的识别方法、终端设备、系统和存储介质

Publications (1)

Publication Number Publication Date
CN117056895A true CN117056895A (zh) 2023-11-14

Family

ID=88666807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210495392.8A Pending CN117056895A (zh) 2022-05-07 2022-05-07 目标设备选择的识别方法、终端设备、系统和存储介质

Country Status (2)

Country Link
CN (1) CN117056895A (zh)
WO (1) WO2023216922A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101344586B (zh) * 2008-08-29 2011-07-20 华南理工大学 利用多频声波进行三维多运动目标定位的方法与装置
KR20160097821A (ko) * 2015-02-10 2016-08-18 한국전자통신연구원 제스처 인식 방법 및 장치
WO2017096193A1 (en) * 2015-12-04 2017-06-08 Board Of Regents, The University Of Texas System Accurately tracking a mobile device to effectively enable mobile device to control another device
CN109976625B (zh) * 2017-12-28 2022-10-18 中兴通讯股份有限公司 一种终端控制方法、终端及计算机可读存储介质
US10890653B2 (en) * 2018-08-22 2021-01-12 Google Llc Radar-based gesture enhancement for voice interfaces

Also Published As

Publication number Publication date
WO2023216922A1 (zh) 2023-11-16

Similar Documents

Publication Publication Date Title
CN110134316B (zh) 模型训练方法、情绪识别方法及相关装置和设备
CN115866121B (zh) 应用界面交互方法、电子设备和计算机可读存储介质
CN113691842B (zh) 一种跨设备的内容投射方法及电子设备
WO2019072178A1 (zh) 一种通知处理方法及电子设备
CN110531864A (zh) 一种手势交互方法、装置及终端设备
CN114040242B (zh) 投屏方法、电子设备和存储介质
CN112740152B (zh) 手写笔检测方法、系统及相关装置
WO2021052139A1 (zh) 手势输入方法及电子设备
CN113805487B (zh) 控制指令的生成方法、装置、终端设备及可读存储介质
US20210377642A1 (en) Method and Apparatus for Implementing Automatic Translation by Using a Plurality of TWS Headsets Connected in Forwarding Mode
WO2022028537A1 (zh) 一种设备识别方法及相关装置
CN111031492B (zh) 呼叫需求响应方法、装置及电子设备
WO2022007707A1 (zh) 家居设备控制方法、终端设备及计算机可读存储介质
CN115016697A (zh) 投屏方法、计算机设备、可读存储介质和程序产品
CN115914461B (zh) 位置关系识别方法和电子设备
CN114079691B (zh) 一种设备识别方法及相关装置
CN115730091A (zh) 批注展示方法、装置、终端设备及可读存储介质
WO2023216922A1 (zh) 目标设备选择的识别方法、终端设备、系统和存储介质
CN115373957A (zh) 杀应用的方法及设备
CN118056197A (zh) 目标设备选择的识别方法、终端设备、系统和存储介质
CN114911400A (zh) 分享图片的方法和电子设备
CN116450026B (zh) 用于识别触控操作的方法和系统
CN113050864B (zh) 一种截屏方法及相关设备
CN114584817B (zh) 投屏方法及系统
CN117785312A (zh) 音频播放方法、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination