CN117389415A - 操作方法、装置、电子设备及可读存储介质 - Google Patents
操作方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN117389415A CN117389415A CN202311344413.7A CN202311344413A CN117389415A CN 117389415 A CN117389415 A CN 117389415A CN 202311344413 A CN202311344413 A CN 202311344413A CN 117389415 A CN117389415 A CN 117389415A
- Authority
- CN
- China
- Prior art keywords
- sound
- sound signals
- display screen
- instruction
- electronic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000005236 sound signal Effects 0.000 claims abstract description 132
- 230000009471 action Effects 0.000 claims description 12
- 238000002955 isolation Methods 0.000 claims description 5
- 230000004807 localization Effects 0.000 claims description 5
- 238000011022 operating instruction Methods 0.000 claims description 2
- 238000011017 operating method Methods 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 239000004033 plastic Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000011521 glass Substances 0.000 description 3
- 230000006386 memory function Effects 0.000 description 3
- 241000209140 Triticum Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
本申请公开了一种操作方法、装置、电子设备及可读存储介质,属于计算机处理技术领域,其中,所述方法包括:通过所述多个麦克风获取第一隔空操作产生的多个第一声音信号;根据所述多个第一声音信号,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置;根据所述多个第一声音信号的声音特征,得到第一操作指令;根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作。
Description
技术领域
本申请属于计算机处理技术领域,具体涉及一种操作方法、装置、电子设备及可读存储介质。
背景技术
随着电子设备的普及,电子设备的应用越来越广泛,电子设备的功能也越来越齐全,越来越方便用户的生活。为了方便用户操作,随之而来的隔空操作也逐渐兴起。
目前隔空操作主要是通过摄像头或者传感器检测用户动作来实现对电子设备操作,这种实现方式容易受外界干扰,对用户的隔空操作识别精准度低,容易对电子设备误操作。
发明内容
本申请实施例的目的是提供一种操作方法、装置、电子设备及可读存储介质,能够提高隔空操作识别精准度,减少对电子设备的误操作。
第一方面,本申请实施例提供了一种操作方法,应用于第一电子设备,所述第一电子设备包括多个麦克风,所述方法包括:
通过所述多个麦克风获取第一隔空操作产生的多个第一声音信号;
根据所述多个第一声音信号,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置;
根据所述多个第一声音信号的声音特征,得到第一操作指令;
根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作。
第二方面,本申请实施例提供了一种操作装置,应用于第一电子设备,所述第一电子设备包括多个麦克风,所述装置包括:
第一获取模块,用于通过所述多个麦克风获取第一隔空操作产生的多个第一声音信号;
第二获取模块,用于根据所述多个第一声音信号,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置;
第三获取模块,用于根据所述多个第一声音信号的声音特征,得到第一操作指令;
操作模块,用于根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
第六方面,本申请实施例提供一种程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所述的方法。
在本申请一实施例中,通过所述多个麦克风获取第一隔空操作产生的多个第一声音信号;根据所述多个第一声音信号,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置;根据所述多个第一声音信号的声音特征,得到第一操作指令;根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作。上述中,通过多个麦克风来获取第一隔空操作产生的声音信号,并基于声音信号确定操作位置,以及基于声音特征来确定操作指令,可以提高对隔空操作的识别精准度,避免对电子设备的误操作。
附图说明
图1是本申请实施例提供的操作方法的流程图;
图2是本申请实施例提供的第一电子设备实现隔空操作的场景示意图;
图3a是本申请实施例提供的单击的声音信号波形示意图;
图3b是本申请实施例提供的双击的声音信号波形示意图;
图3c是本申请实施例提供的滑动的声音信号波形示意图;
图4是本申请实施例提供的操作装置的结构图;
图5是本申请实施例提供的电子设备的结构图之一;
图6是本申请实施例提供的电子设备的结构图之二。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的操作方法进行详细地说明。
图1是本申请实施例提供的操作方法的流程图,本实施例中的操作方法,应用于第一电子设备,所述第一电子设备包括多个麦克风,所述方法包括如下步骤:
步骤101,通过所述多个麦克风获取第一隔空操作产生的多个第一声音信号。
多个麦克风的数量可以为3个或大于3个,在此不做限定。麦克风可采用高灵敏度麦克风,能够较好地捕捉一定距离的声音信号。多个麦克风的所在位置不能位于同一条直线上。每个麦克风采集得到一个第一声音信号。
第一隔空操作本身可以发出声音,例如,第一隔空操作为敲击桌面、拍手或打响指等操作。第一隔空操作也可以不发出声音,例如,第一电子设备可以包括发射超声信号的发射模块,超声信号经过实施第一隔空操作的对象反射,反射信号被麦克风获取,此种情况下,麦克风获取的反射信号可以认为是第一隔空操作产生的第一声音信号。
第一隔空操作可以理解为在不接触第二电子设备的情况下,对第二电子设备进行操作。第一隔空操作可以是用户通过手指进行的操作,也可以是用户通过其他物体进行的操作,例如,用户拿着笔进行隔空操作,在此不做限定。
步骤102,根据所述多个第一声音信号,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置。
每个麦克风采集得到一个第一声音信号,麦克风的位置不同,第一隔空操作产生的第一声音信号到达不同麦克风的信号大小,例如幅值、频率会有所变化,根据每个麦克风采集到的信号,可以得到一个坐标信息,例如,若麦克风的数量有3个,根据每个麦克风采集到的信号进行计算,可以得到三个数值,这三个数值构成一个三维坐标,该三维坐标即为声源位置。例如,第一隔空操作为在桌面上点击的操作,则点击位置就是声源位置。
根据多个第一声音信号可以得到第一隔空操作在三维空间的操作位置,将该操作位置进行转换,可以得到在第二电子设备的显示屏上对应的第一操作位置。
可以基于多麦定向技术,将第一电子设备前方预设角度的区域作为信号区,其他区域设置为无效区,其他区的信号被有效抑制,进而形成一个相对稳定低噪的环境,信号区的信号可以被各麦克风有效地摄取。
需要说明的是,第一电子设备和第二电子设备可以为同一电子设备,也可以为不同的电子设备。
步骤103,根据所述多个第一声音信号的声音特征,得到第一操作指令。
不同声音信号,具有不同的声音特征,可以根据声音特征来确定第一操作指令。在根据多个第一声音信号确定声音特征时,可以从多个第一声音信号中任意选择一个声音信号来确定声音特征,或者,对多个第一声音信号进行比对,从多个第一声音信号中选择噪声最小的声音信号来确定声音特征,或者,从多个第一声音信号中选择信号强度最大的声音信号来确定声音特征,在此不做限定。
例如,手指单击时,手指与桌面之间作用的声音在通过麦克风录入后,得到的第一声音信号呈现一个瞬间的峰值,如图3a中圆圈标识所示,以此可以识别第一操作指令为单击操作,除此之外,单次拍手或者单次打响指等声音亦可识别为单击操作;
手指双击时,手指与桌面之间作用的声音在通过麦克风录入后,得到的第一声音信号呈现两个瞬间的峰值,如图3b中圆圈标识所示,以此可以识别第一操作指令为双击操作,除此之外,两次拍手或者两次打响指等声音亦可识别为双击操作。
手指滑动时,手指与桌面之间作用的声音在通过麦克风录入后,得到的第一声音信号呈现一定时间内信号从大到小变化,或者从小到大变化,如图3c中圆圈标识所示,以此可以识别第一操作指令为滑动操作。
除此之外,拍手或打响指等可作为滑动启动或停止指令,通过多麦定位技术,启动和停止声音的位置变化,确认其滑动方向。
步骤104,根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作。
第一电子设备对第二电子设备显示屏的操作,可以是直接操作,也可以是间接操作。在第一电子设备和第二电子设备为同一电子设备的情况下,第一电子设备直接对显示屏上显示的对象进行操作;在第一电子设备和第二电子设备为不同电子设备的情况下,第一电子设备将第一操作指令和第一操作位置发送给第二电子设备,由第二电子设备根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作。例如,在所述第一操作指令为滑动指令的情况下,将所述显示屏上显示的光标移动至所述第一操作位置处,或者,在所述第一操作指令为点击指令的情况下,对所述显示屏上在所述第一操作位置处显示的对象进行操作,第一操作位置处显示的对象可以是文本、输入框、应用图标、功能键、图像或音频等等。
所述第一电子设备和所述第二电子设备之间具有数据通信通道,第一电子设备和第二电子设备为不同电子设备时,第一电子设备和第二电子设备可以通过无线通信方式进行数据交互;第一电子设备和第二电子设备为同一电子设备时,第一电子设备和第二电子设备可以通过数据线进行数据交互。
本实施例中,通过所述多个麦克风获取第一隔空操作产生的多个第一声音信号;根据所述多个第一声音信号,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置;根据所述多个第一声音信号的声音特征,得到第一操作指令;根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作。上述中,通过多个麦克风来获取第一隔空操作产生的声音信号,并基于声音信号确定操作位置,以及基于声音特征来确定操作指令,可以提高对隔空操作的识别精准度,避免对电子设备的误操作。
在本申请一实施例中,所述第一电子设备还包括用于发射超声信号的发射模块;
通过所述多个麦克风获取第一隔空操作产生的多个第一声音信号,包括:
通过所述发射模块发射超声信号;
通过所述多个麦克风接收多个第一声音信号,其中,每个所述第一声音信号均为所述超声信号经实施所述第一隔空操作的对象反射后的信号。
具体地,发射模块发送超声信号,超声信号经过实施所述第一隔空操作的对象反射后得到第一声音信号,第一声音信号由麦克风接收。每个麦克风由于位置不同,接收的第一声音信号也不同。实施第一隔空操作的对象可以是手指,或者笔等等,在此不做限定。
发射模块可以与第一隔空操作的实施对象相对设置,发射模块朝着实施对象所在方向发射超声信号。
在本实施例中,第一隔空操作本身可以不发出声音,例如,第一隔空操作可以是在空间中移动的操作,由发射模块和麦克风相互配合,对第一隔空操作在三维空间中的操作位置进行识别,从而根据识别出的位置进行转换,得到在第二电子设备的显示屏上的第一操作位置。
为进一步提高识别精度,避免误操作,可以设置一个超声信号发射的起始操作,例如,连续两次单击操作为起始操作,可触发发射模块发射超声信号,开始对第一隔空操作进行识别,连续两次单击可以是连续两次打响指的操作。
本实施例中,由发射模块和麦克风相互配合,对第一隔空操作在三维空间中的操作位置进行识别,第一隔空操作本身可以不产生声音,例如,不与桌面触碰,可以扩充第一隔空操作的使用场景,满足用户的多样化需求。
在本申请又一实施例中,所述根据所述多个第一声音信号的声音特征,得到第一操作指令,包括:
对所述多个第一声音信号进行音色分析,得到所述第一隔空操作对应的动作,所述动作包括至少一次敲击桌面、拍手、鼓掌、打响指或者滑动;
基于所述动作,确定所述第一操作指令。
具体地,不同声音信号,具有不同的声音特征,可以根据声音特征来确定第一操作指令。在根据多个第一声音信号确定声音特征时,可以从多个第一声音信号中任意选择一个声音信号来确定声音特征,或者,对多个第一声音信号进行比对,从多个第一声音信号中选择噪声最小的声音信号来确定声音特征,或者,从多个第一声音信号中选择信号强度最大的声音信号来确定声音特征,在此不做限定。
例如,可以从多个第一声音信号中选择信号强度最大的声音信号,对其进行音色分析,音色不同,波形不同。通过对波形进行分析,可以确定所述第一隔空操作对应的动作。
例如,手指单击时,手指与桌面之间作用的声音在通过麦克风录入后,得到的第一声音信号呈现一个瞬间的峰值,如图3a中圆圈标识所示,以此可以识别动作为单次拍手或单次打响指,确定第一操作指令为单击操作;
手指双击时,手指与桌面之间作用的声音在通过麦克风录入后,得到的第一声音信号呈现两个瞬间的峰值,如图3b中圆圈标识所示,以此可以识别动作为两次拍手或者两次打响指,确定第一操作指令为双击操作。
手指滑动时,手指与桌面之间作用的声音在通过麦克风录入后,得到的第一声音信号呈现一定时间内信号从大到小变化,或者从小到大变化,如图3c中圆圈标识所示,以此可以识别动作为滑动,确定第一操作指令为滑动操作。
上述中,通过对所述多个第一声音信号进行音色分析,得到所述第一隔空操作对应的动作,可以提高对动作确定的准确性,从而确保第一操作指令的准确性。
在本申请又一实施例中,根据所述多个第一声音信号,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置,包括:
根据所述多个第一声音信号对所述第一隔空操作进行声源定位,确定第一声源位置;
根据所述第一声源位置与预获取的第一参照位置之间的位置关系,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置。
具体地,每个麦克风采集得到一个第一声音信号,麦克风的位置不同,第一隔空操作产生的第一声音信号到达不同麦克风的信号大小,例如幅值、频率会有所变化,根据每个麦克风采集到的信号,可以得到一个坐标信息,例如,若麦克风的数量有3个,根据每个麦克风采集到的信号进行计算,可以得到三个数值,这三个数值构成一个三维坐标,该三维坐标即为第一声源位置。例如,第一隔空操作为在桌面上点击的操作,则点击位置就是第一声源位置。
第一参照位置是预先设置的空间位置,在确定第一声源位置之后,可以以第一参照位置为基准,确定第一声源位置相对于第一参照位置的位置关系,从而确定第一隔空操作在第二电子设备的显示屏上的第一操作位置。
第一参照位置与显示屏的预设位置之间具有对应关系,具体地,在所述根据所述第一声源位置与预获取的第一参照位置之间的位置关系,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置之前,所述方法还包括:
通过所述多个麦克风获取第二隔空操作产生的多个第二声音信号;
根据所述多个第二声音信号进行初始位置校准,确定所述第一参照位置;
建立所述第一参照位置与所述显示屏上的预设位置之间的对应关系。
在本实施例中,对初始位置进行校准,以建立第一参照位置与显示屏的预设位置之间的对应关系,预设位置可以是显示屏的中间位置,或者其他位置,具体可根据实际情况进行设置,在此不做限定。
通过第二隔空操作启动初始位置校准,第二隔空操作可以是特殊手势,例如,双击桌面的操作。第二隔空操作可以根据实际情况进行灵活设置,在此不做限定。
具体地,所述根据所述多个第二声音信号进行初始位置校准,确定所述第一参照位置,包括:
根据所述多个第二声音信号对所述第二隔空操作进行声源定位,确定第二声源位置;
根据所述多个第二声音信号的声音特征,得到第二操作指令;
在所述第二操作指令为预设指令的情况下,将所述第二声源位置作为所述第一参照位置。
第一电子设备通过麦克风获取到第二隔空操作产生的多个第二声音信号,每个麦克风获取到一个第二声音信号。与上述中根据多个第一声音信号确定第一声源位置的方式相同,根据多个第二声音信号可以得到第二声源位置,具体可参见上述中的相关记载,在此不做赘述。
在根据多个第二声音信号确定声音特征时,可以从多个第二声音信号中任意选择一个声音信号来确定声音特征,或者,对多个第二声音信号进行比对,从多个第二声音信号中选择噪声最小的声音信号来确定声音特征,或者,从多个第二声音信号中选择信号强度最大的声音信号来确定声音特征,在此不做限定。
通过对多个第二声音信号的声音特征进行分析,可以确定第二隔空操作是单击、双击还是滑动,从而确定对应的第二操作指令。例如,若第二隔空操作是双击,则第二操作指令是双击指令。预设指令根据实际情况设置,例如,预设指令是在双击。在第二操作指令与预设指令相同的情况下,则将所述第二声源位置作为第一参照位置,在第二电子设备的显示屏的预设位置显示光标,便于用户查看第一参照位置所对应的预设位置。
上述中,通过多个麦克风来获取第二隔空操作产生的声音信号,并基于声音信号确定操作位置,以及基于声音特征来确定第二操作指令,可以提高对隔空操作的识别精准度,从而提高初始位置校准的精准度,避免对电子设备的误操作。
以下对本申请提供的操作方法进行如下举例说明。
在一种实施例中,第一电子设备配有电源供电模块,无线通信传输模块、多麦矩阵模块、供电模块,信号处理器。
第一电子设备通过无线通信传输模块与智能设备连接,进行相关的数据传输和控制,例如,声音信号传输、操作指令传输等。
多麦矩阵模块至少包含3个及以上的高灵敏度麦克风,能够较好地捕捉一定距离的声音信号。例如,多麦矩阵模块包括四个麦克风,分别设置在第一电子设备四个角部位置。
多麦定位技术实现:麦克风的位置不同,物体发出的声音到达不同麦克风的信号大小(幅值、频率)会有所变化,多个信号可以转换成坐标信息,进而确认物体的位置。
基于多麦定向技术,将第一电子设备前方预设角度的区域作为信号区,其他区域设置为无效区,其他区的信号被有效抑制,进而形成一个相对稳定低噪的环境,信号区的信号可以被各麦克风有效地摄取。
第一电子设备具有一定存储功能,可以存在关于隔空操作的一些常见指令和数据:比如识别手指(手写笔或者塑料笔)与木质桌面、塑料桌面、玻璃桌面的声音特征,如单击、双击、滑动的声音特征,根据不同特征转换为相应的操作指令。
单击:手指单击时,手指与桌面的声音在麦克风录入信号是呈现一个瞬间的峰值,以此可以识别为单击操作。
双击:手指双击时,手指与桌面的声音在麦克风录入信号是呈现两个瞬间的峰值,以此可以识别为双击操作。
滑动:手指滑动时,手指与桌面的声音在麦克风录入信号是呈现一定时间内信号自大而小变化,以此可以识别为滑动操作。结合信号的信号变化,确认滑动方向。
参考图2,通过第一电子设备实现隔空操作的方法:
第一电子设备与第二电子设备进行无线连接,通过无线模块相互发送控制和反馈指令;
将第一电子设备置于相对平整桌面,桌面材质可以为木质,塑胶或者玻璃,通过手指摩擦可以发生相应的声音;
第一电子设备具有一定存储功能,可以存在关于隔空操作的一些常见指令和数据:比如识别手指(手写笔或者塑料笔)与木质桌面、塑料桌面、玻璃桌面的声音,可以快速地通过声音转换为相应的操作指令。
校准定位:第一电子设备在距离移动物体(如手指,但不局限手指)一定距离,设备识别手指特殊操作进行光标定位(如双击桌面产生声音,该声音被多麦矩阵接收,通过多麦定位技术确认发生源相对位置),此位置通过无线发送到第二电子设备中,一个可移动的光标会出现在第二电子设备显示屏的特定位置(如居于屏幕中间),此为初始位置;
出现初始位置后,手指滑动过程中会与桌面摩擦产生声音,该声音被多麦矩阵给接收识别为滑动指令,同时多麦矩阵通过多麦技术识别并分析手指滑动时的声音位置变化,进而识别滑动方向(如向上、向下、向左或向右等),滑动指令通过无线模块传输至第二电子设备,光标跟指令进行移动。光标经过应用图标时,图标会有一些特殊变化,如悬空,放大,或者亮显,以突出光标落在对应的应用上。
当滑动到某个位置或者图标时,单击桌面,该声音通过第一电子设备转换为对显示屏的单击操作,此时显示屏会弹出提醒操作,提醒用户进行相关的操作选择,例如,拖动图标,进入应用,卸载应用等,用户可以根据自己需求,滑动到对应位置,进行双击确认。
上述过程中,结合多麦定位技术,精准定位隔空操作的声源位置以及移动轨迹,转化为对第二电子设备的操作,实现精准操作,提升用户隔空操作体验。
在本申请另一实施例中,第一电子设备配有电源供电模块,无线通信传输模块、多麦矩阵模块、超声发射模块、供电模块和信号处理器。
第一电子设备通过无线通信传输模块与智能设备连接,进行相关的数据传输和控制,例如,声音信号传输、操作指令传输等。
超声发射模块:发出超声信号,遇到障碍物可以反射回信号。
多麦矩阵模块至少包含3个及以上的高灵敏度麦克风,能够较好地捕捉一定距离的声音信号,多个麦克风的位置不同,可以精确定位声源的空间位置坐标,进而识别声源的移动轨迹。
多麦定位技术实现:麦克风的位置不同,物体发出的声音到达不同麦克风的信号大小(幅值、频率)会有所变化,多个信号可以转换成坐标信息,进而确认物体的位置。
第一电子设备实现隔空操作的方法:
第一电子设备与智能第一电子设备进行无线连接,相互发送控制和反馈指令;
将第一电子设备置于相对平整桌面;
第一电子设备具有一定存储功能,可以存在关于隔空操作的一些常见指令和数据:比如识别手指:双指撞击一次(单击指令),双指撞击两次(双击指令),响指一次(长按启动指令或者停止),响指两次(滑动启动或者停止指令)等,可以快速地通过声音转换为相应的操作指令。
校准定位:第一电子设备在距离移动物体(如手指,但不局限手指)一定距离,设备连接启动时,手指通过特殊指令执行定位(如双指撞击一次),经过信号处理器加工后转化为操作指令,使操作第二电子设备的图标位于特定位置(如居于屏幕中间),此为初始位置。
出现初始位置后,通过连续响指两次来启动滑动指令,超声发射模块会向前方持续发射超声信号,遇到前方的移动物体(如手指)会将超声信号返回,此声音可以被多麦矩阵给接收,从而定位操控的相对位置,超声信号随着物体移动幅值和时间也会相应变化,经过处理器进行数据处理后转换为滑动距离,进而转换为转化为滑动操作指令;
当滑动到某个位置或者图标时,特殊指令声音(如双指撞击)产生声音,该声音通过第一电子设备转换,得到对第二电子设备的单击操作,此时第二电子设备的显示屏会弹出提醒操作,提醒用户进行相关的操作选择,如拖动图标,进入应用,卸载应用等,用户可以根据自己需求,滑动到对应位置,进行双击确认。
上述中,采用超声技术和多麦定位技术相结合,精准定位声源位置以及移动轨迹,将隔空操作转化为对第二电子设备的操作,加强了手势操控能力,减少对额外物体的依赖(如桌子),实现精准操作,提升用户隔空操作体验。
在本申请又一实施例中,第一电子设备可以集成在蓝牙耳机、电子戒指、电子手表等等。以下以第一电子设备集成在电子手表为例进行说明。
用户敲击桌面一次,第一电子设备的麦克风采集到敲击的声音信号,并对声音信号进行分析,确定敲击的位置所对应的是电子手表的显示屏上的第一操作位置,并确定声音信号的声音特征是单次敲击桌面,由此确定第一操作指令为单击操作,进一步地,若第一操作位置为日历图标,则对显示屏上显示的日历进行查看。
本申请实施例提供的操作方法,执行主体可以为操作装置。本申请实施例中以操作装置执行操作方法为例,说明本申请实施例提供的操作装置。
本申请实施例还提供一种操作装置,如图4所示,操作装置300应用于第一电子设备,所述第一电子设备包括多个麦克风,操作装置300包括:
第一获取模块301,用于通过所述多个麦克风获取第一隔空操作产生的多个第一声音信号;
第二获取模块302,用于根据所述多个第一声音信号,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置;
第三获取模块303,用于根据所述多个第一声音信号的声音特征,得到第一操作指令;
操作模块304,用于根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作。
在本申请一实施例中,所述第一电子设备还包括用于发射超声信号的发射模块;
第一获取模块,包括:
发射子模块,用于通过所述发射模块发射超声信号;
接收子模块,用于通过所述多个麦克风接收多个第一声音信号,其中,每个所述第一声音信号均为所述超声信号经实施所述第一隔空操作的对象反射后的信号。
在本申请一实施例中,所述操作模块304,用于在所述第一操作指令为滑动指令的情况下,将所述显示屏上显示的光标移动至所述第一操作位置处。
在本申请一实施例中,所述操作模块304,用于在所述第一操作指令为点击指令的情况下,对所述显示屏上在所述第一操作位置处显示的对象进行操作。
在本申请一实施例中,所述第二获取模块302,包括:
第一获取子模块,用于根据所述多个第一声音信号对所述第一隔空操作进行声源定位,确定第一声源位置;
第二获取子模块,用于根据所述第一声源位置与预获取的第一参照位置之间的位置关系,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置。
在本申请一实施例中,所述装置300还包括:
第四获取模块,用于通过所述多个麦克风获取第二隔空操作产生的多个第二声音信号;
第五获取模块,用于根据所述多个第二声音信号进行初始位置校准,确定所述第一参照位置;
构建模块,用于建立所述第一参照位置与所述显示屏上的预设位置之间的对应关系。
在本申请一实施例中,所述第五获取模块,包括:
第一确定子模块,用于根据所述多个第二声音信号对所述第二隔空操作进行声源定位,确定第二声源位置;
第二确定子模块,用于根据所述多个第二声音信号的声音特征,得到第二操作指令;
第三确定子模块,用于在所述第二操作指令为预设指令的情况下,将所述第二声源位置作为所述第一参照位置。
本申请实施例提供的操作装置300能够实现前述方法实施例实现的各个过程,为避免重复,这里不再赘述。
本申请实施例中的操作装置300可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性的,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(Mobile Internet Device,MID)、增强现实(augmented reality,AR)/虚拟现实(virtualreality,VR)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobile personalcomputer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,还可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personalcomputer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的操作装置300可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
可选地,如图5所示,本申请实施例还提供一种电子设备400,包括处理器401和存储器402,存储器402上存储有可在所述处理器401上运行的程序或指令,该程序或指令被处理器401执行时实现上述操作方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图6为实现本申请实施例的一种电子设备的硬件结构图。
该电子设备500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、以及处理器510等部件。
本领域技术人员可以理解,电子设备500还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图6中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器510,用于通过多个麦克风获取第一隔空操作产生的多个第一声音信号;
根据所述多个第一声音信号,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置;
根据所述多个第一声音信号的声音特征,得到第一操作指令;
根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作。
在本申请一实施例中,所述电子设备还包括用于发射超声信号的发射模块;
处理器510,用于通过所述发射模块发射超声信号;
通过所述多个麦克风接收多个第一声音信号,其中,每个所述第一声音信号均为所述超声信号经实施所述第一隔空操作的对象反射后的信号。
在本申请一实施例中,处理器510,用于在所述第一操作指令为滑动指令的情况下,将所述显示屏上显示的光标移动至所述第一操作位置处。
在本申请一实施例中,处理器510,用于在所述第一操作指令为点击指令的情况下,对所述显示屏上在所述第一操作位置处显示的对象进行操作。
在本申请一实施例中,处理器510,用于根据所述多个第一声音信号对所述第一隔空操作进行声源定位,确定第一声源位置;
根据所述第一声源位置与预获取的第一参照位置之间的位置关系,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置。
在本申请一实施例中,处理器510,用于通过所述多个麦克风获取第二隔空操作产生的多个第二声音信号;
根据所述多个第二声音信号进行初始位置校准,确定所述第一参照位置;
建立所述第一参照位置与所述显示屏上的预设位置之间的对应关系。
在本申请一实施例中,处理器510,用于根据所述多个第二声音信号对所述第二隔空操作进行声源定位,确定第二声源位置;
根据所述多个第二声音信号的声音特征,得到第二操作指令;
在所述第二操作指令为预设指令的情况下,将所述第二声源位置作为所述第一参照位置。
本申请实施例提供的电子设备能够实现前述方法实施例实现的各个过程,为避免重复,这里不再赘述。
应理解的是,本申请实施例中,输入单元504可以包括图形处理器(GraphicsProcessing Unit,GPU)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元506可包括显示面板5061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板5061。用户输入单元507包括触控面板5071以及其他输入设备5072中的至少一种。触控面板5071,也称为触摸屏。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器509可以包括易失性存储器或非易失性存储器,或者,存储器509可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch linkDRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本申请实施例中的存储器509包括但不限于这些和任意其它适合类型的存储器。
处理器510可包括一个或多个处理单元;可选地,处理器510集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述操作方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述操作方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述操作方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (11)
1.一种操作方法,其特征在于,应用于第一电子设备,所述第一电子设备包括多个麦克风,所述方法包括:
通过所述多个麦克风获取第一隔空操作产生的多个第一声音信号;
根据所述多个第一声音信号,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置;
根据所述多个第一声音信号的声音特征,得到第一操作指令;
根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作。
2.根据权利要求1所述的方法,其特征在于,所述第一电子设备还包括用于发射超声信号的发射模块;
通过所述多个麦克风获取第一隔空操作产生的多个第一声音信号,包括:
通过所述发射模块发射超声信号;
通过所述多个麦克风接收多个第一声音信号,其中,每个所述第一声音信号均为所述超声信号经实施所述第一隔空操作的对象反射后的信号。
3.根据权利要求1所述的方法,其特征在于,根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作,包括:
在所述第一操作指令为滑动指令的情况下,将所述显示屏上显示的光标移动至所述第一操作位置处。
4.根据权利要求1所述的方法,其特征在于,根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作,包括:
在所述第一操作指令为点击指令的情况下,对所述显示屏上在所述第一操作位置处显示的对象进行操作。
5.根据权利要求1所述的方法,其特征在于,根据所述多个第一声音信号,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置,包括:
根据所述多个第一声音信号对所述第一隔空操作进行声源定位,确定第一声源位置;
根据所述第一声源位置与预获取的第一参照位置之间的位置关系,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置。
6.根据权利要求5所述的方法,其特征在于,在所述根据所述第一声源位置与预获取的第一参照位置之间的位置关系,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置之前,所述方法还包括:
通过所述多个麦克风获取第二隔空操作产生的多个第二声音信号;
根据所述多个第二声音信号进行初始位置校准,确定所述第一参照位置;
建立所述第一参照位置与所述显示屏上的预设位置之间的对应关系。
7.根据权利要求6所述的方法,其特征在于,所述根据所述多个第二声音信号进行初始位置校准,确定所述第一参照位置,包括:
根据所述多个第二声音信号对所述第二隔空操作进行声源定位,确定第二声源位置;
根据所述多个第二声音信号的声音特征,得到第二操作指令;
在所述第二操作指令为预设指令的情况下,将所述第二声源位置作为所述第一参照位置。
8.根据权利要求1所述的方法,其特征在于,所述根据所述多个第一声音信号的声音特征,得到第一操作指令,包括:
对所述多个第一声音信号进行音色分析,得到所述第一隔空操作对应的动作,所述动作包括至少一次敲击桌面、拍手、鼓掌、打响指或滑动;
基于所述动作,确定所述第一操作指令。
9.一种操作装置,其特征在于,应用于第一电子设备,所述第一电子设备包括多个麦克风,所述装置包括:
第一获取模块,用于通过所述多个麦克风获取第一隔空操作产生的多个第一声音信号;
第二获取模块,用于根据所述多个第一声音信号,确定所述第一隔空操作在第二电子设备的显示屏上对应的第一操作位置;
第三获取模块,用于根据所述多个第一声音信号的声音特征,得到第一操作指令;
操作模块,用于根据所述第一操作指令和第一操作位置,对所述显示屏上显示的对象进行操作。
10.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至8中任一项所述的操作方法的步骤。
11.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至8中任一项所述的操作方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311344413.7A CN117389415A (zh) | 2023-10-17 | 2023-10-17 | 操作方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311344413.7A CN117389415A (zh) | 2023-10-17 | 2023-10-17 | 操作方法、装置、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117389415A true CN117389415A (zh) | 2024-01-12 |
Family
ID=89466084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311344413.7A Pending CN117389415A (zh) | 2023-10-17 | 2023-10-17 | 操作方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117389415A (zh) |
-
2023
- 2023-10-17 CN CN202311344413.7A patent/CN117389415A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11189288B2 (en) | System and method for continuous multimodal speech and gesture interaction | |
US11409390B2 (en) | Method, apparatus and computer-readable media for touch and speech interface with audio location | |
KR100783552B1 (ko) | 휴대 단말기의 입력 제어 방법 및 장치 | |
JP6270982B2 (ja) | バックグラウンドタスク用の対話式入力 | |
CN102119376B (zh) | 触敏显示器的多维导航 | |
US20090167882A1 (en) | Electronic device and operation method thereof | |
KR20140114913A (ko) | 사용자 기기의 센서 운용 방법 및 장치 | |
Kang et al. | Minuet: Multimodal interaction with an internet of things | |
MX2008014057A (es) | Tecla de multiples funciones con desplazamiento. | |
CN109558000B (zh) | 一种人机交互方法及电子设备 | |
CN106909256A (zh) | 屏幕控制方法及装置 | |
CN101869484A (zh) | 具有触摸屏的医疗诊断装置及其操控方法 | |
WO2023016372A1 (zh) | 控制方法、装置、电子设备和存储介质 | |
CN113826060A (zh) | 在增强现实(ar)和虚拟现实(vr)中在有形对象上建立和使用虚拟资产 | |
KR102511456B1 (ko) | 문자 입력 방법 및 단말 | |
KR20150020865A (ko) | 전자 장치의 입력 처리 방법 및 장치 | |
CN117389415A (zh) | 操作方法、装置、电子设备及可读存储介质 | |
JP4053903B2 (ja) | ポインティング方法、装置、およびプログラム | |
AT&T | Your Title | |
CN110928539B (zh) | 代码工程生成方法、装置、电子设备及可读存储介质 | |
CN114327726A (zh) | 显示控制方法、装置、电子设备及存储介质 | |
KR101443964B1 (ko) | 휴대 단말기 및 휴대 단말기의 정보입력방법 | |
CN114690977B (zh) | 一种基于弹性波的交互唤起方法及装置 | |
KR101491648B1 (ko) | 촬영부를 이용한 원격 제어 시스템 및 방법 | |
CN112732214B (zh) | 控制方法、电子设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |