CN114040235A - 交互控制方法、装置、激光电视机及存储介质 - Google Patents
交互控制方法、装置、激光电视机及存储介质 Download PDFInfo
- Publication number
- CN114040235A CN114040235A CN202111322467.4A CN202111322467A CN114040235A CN 114040235 A CN114040235 A CN 114040235A CN 202111322467 A CN202111322467 A CN 202111322467A CN 114040235 A CN114040235 A CN 114040235A
- Authority
- CN
- China
- Prior art keywords
- ultrasonic signal
- operation action
- laser television
- signal
- ultrasonic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种交互控制方法、装置、激光电视机及存储介质,所述方法应用于激光电视机,所述激光电视机包括扬声器和麦克风,所述方法包括:响应于开启指令,通过所述扬声器发射第一超声波信号,并通过所述麦克风采集外部环境反射操作动作所述第一超声波信号所生成的第二超声波信号;识别所述第二超声波信号对应的操作动作;根据所述第二超声波信号对应的操作动作,控制所述激光电视机工作。本申请通过激光电视机中基于超声波信号识别操作动作,控制激光电视机工作,提升用户使用体验。
Description
技术领域
本申请涉及激光投影技术领域,尤其涉及一种交互控制方法、装置、激光电视机及存储介质。
背景技术
激光电视机中红、绿、蓝三色激光可利用数字信号分别调制,色谱纯净,彩色效果理想,并且激光晶体管的室温寿命一般可达10万小时,是一种使用寿命长和可靠性高的产品,受到消费者欢迎。
对于相关激光电视机产品,用户可以使用红外遥控器遥控或者利用远场语音控制的方式于激光电视机进行交互。
发明内容
本申请的实施例提供了一种交互控制方法、装置、激光电视机及存储介质。本申请通过激光电视机中基于超声波信号识别操作动作,控制激光电视机工作,提升用户使用体验。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的第一方面,提供了一种交互控制方法,应用于激光电视机,所述激光电视机包括扬声器和麦克风,所述方法包括:
响应于开启指令,通过所述扬声器发射第一超声波信号,并通过所述麦克风采集外部环境反射操作动作所述第一超声波信号所生成的第二超声波信号;
识别所述第二超声波信号对应的操作动作;
根据所述第二超声波信号对应的操作动作,控制所述激光电视机工作。
在本申请的一些实施例中,基于前述方案,所述识别所述第二超声波信号对应的操作动作,包括:
获取所述第一超声波信号对应的回采信号;
根据所述回采信号和所述第二超声波信号,获取操作动作特征;
利用预先训练完成的操作动作分类模型,确定所述操作动作特征对应的操作动作概率向量;
确定所述操作动作概率向量中最大概率对应操作动作为所述第二超声波信号对应的操作动作。
在本申请的一些实施例中,基于前述方案,所述操作动作分类模型是卷积神经网络,所述卷积神经网络包括:卷积层和长短期存储器。
在本申请的一些实施例中,基于前述方案,所述根据所述回采信号和所述第二超声波信号,获取操作动作特征,包括:
根据所述回采信号和所述第二超声波信号,滤除所述第二超声波中的噪声;
对滤除噪声后的第二超声波进行特征提取,获取所述操作动作特征。
在本申请的一些实施例中,基于前述方案,所述通过所述扬声器发射第一超声波信号,包括:
获取所述第一超声波信号;
对所述第一超声波信号进行调制解码,得到IIS形式的第一超声波信号;
对所述IIS形式的第一超声波信号进行放大,并驱动所述扬声器发射放大后的所述IIS形式的第一超声波信号。
在本申请的一些实施例中,基于前述方案,所述获取所述第一超声波信号对应的回采信号,包括:
对所述IIS形式的第一超声波信号进行模数转换,得到所述回采信号。
在本申请的一些实施例中,基于前述方案,所述操作动作包括但不限于左滑、右滑、上滑、下滑、点击、双击。
根据本申请实施例的第二方面,提供了一种交互控制装置,应用于激光电视机包括扬声器和麦克风,所述装置包括:
第一控制单元,用于响应于开启指令,通过所述扬声器发射第一超声波信号并通过所述麦克风采集操作动作反射的第二超声波信号;
操作动作识别单元,用于识别所述第二超声波信号对应的操作动作;
第二控制单元,用于根据所述第二超声波信号对应的操作动作,控制所述激光电视机工作。
根据本申请实施例的第三方面,提供了一种激光电视机,所述激光电视机包括:
扬声器,用于发射第一超声波信号;
麦克风,用于采集外部环境反射所述第一超声波信号所生成的第二超声波信号;以及
如上述第二方面所述的交互控制装置。
根据本申请实施例的第四方面,提供了一种计算机可读存储介质,包括程序或指令,当所述程序或指令被执行时,用以执行如上述第一方面所述的交互控制方法。
本申请实施例通过激光电视机中的扬声器和麦克风发射和接收超声波信号,并基于超声波信号识别操作动作,进而控制激光电视机工作,提升用户体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本申请实施例提供的一种交互控制方法的流程示意图。
图2为本申请实施例提供的一种操作动作识别方法的流程示意图。
图3为本申请实施例提供的一种第二超声波信号处理过程的示意图。
图4为本申请实施例提供的一种发射第一超声波信号方法的流程示意图。
图5为本申请实施例提供的一种第一超声波信号处理过程的示意图。
图6为本申请实施例提供的一种超声波信号处理过程的示意图。
图7为本申请实施例提供的一种交互控制装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
在本申请的描述中,需要理解的是,术语“第二”、“第一”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第二”、“第一”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
激光电视机包括扬声器,利用扬声器发出用户可以听见的声音。具有远场语音控制功能激光电视机还包括麦克风,例说:用户发出语音命令“开机”,远场语音麦克风采集语音命令,激光电视根据语音命令完成激光电视的开机过程。麦克风可以是由多个已知位置关系的麦克风组成的麦克风阵列。
图1为本申请实施例提供的一种交互控制方法的流程示意图。如图1所示,该方法至少包括以下步骤。
步骤110:响应于开启指令,通过扬声器发射第一超声波信号,并通过麦克风采集外部环境反射操作动作第一超声波信号所生成的第二超声波信号。
在具体实施中,可以在激光电视机上设置手势识别模式的开启页面,若用户选择启用手势识别模式,则可以确定该激光电视机开启了手势识别模式,若用户没有开启手势识别模式,则可以确定该激光电视机关闭了手势识别模式。用户可通过触控、红外遥控以及远场语音等方式向激光电视机发送开启指令,使激光电视机进入超声波传感器开启模式。当激光电视机处于超声波传感器开启模式时,扬声器连续扇形发射第一超声波信号,第一超声波信号会扇形传播,当超声波遇到障碍物比如肢体时,第一超声波会发生反射生成第二超声波信号,第二超声波信号会被远场语音麦克风采集到。超声波的波长短,方向性好,频率在人耳可接触范围之外,且不会干扰正常的电视信号音视频的播放(人耳可听到的声音频率范围是20~20000Hz)。例如,第一超声波信号可以采用22KHZ的超声波信号,该信号与电视音频信号频率不同,不存在相互影响情况。
步骤120:识别第二超声波信号对应的操作动作。
肢体运动生成不同的操作动作时,由于超声波多普勒效应,不同的操作动作将导致第二超声波信号不同的时间频率分布,因此可以通过第二超声波信号提取操作动作特征,识别操作动作。
在具体实施中可以使用波束形成技术从第二超声波信号生成针对线性调频的声学图像,然后基于声学图像提取特征生成特征图像,以识别例如从麦克风到障碍物比如肢体的距离或深度,再通过深度学习模型特征图像对操作动作进行分类。
步骤130:根据第二超声波信号对应的操作动作,控制激光电视机工作。
操作动作包括但不限于左滑、右滑、上滑、下滑、点击、双击等动态手势动作和静态手势(例如,OK手势)。用户可以使用不同操作动作对激光电视机进行控制,例如,左滑动作控制激光电视机亮度降低、右滑动作控制激光电视机亮度增加;上滑动作控制激光电视机音量增加;下滑动作控制激光电视机音量减少;点击动作控制激光电视机打开某应用等等。
值得注意的是,激光电视机在响应于第二超声波信号对应的操作动作后,在预设时间内不响应与该操作动作相反的动作。例如当用户在浏览推荐页面时会进行翻页,用户手掌从右向左移动,此时,电视机识别为一次有效手势,电视机会向左翻页;紧接着,用户的手会快速从左方回到右方,然后去进行第二次向左翻页的手势。在这个过程中,用户的手从快速从左方回归到右方的动作,相对于向左翻页就是一个多余的动作,其动作与向左翻页的手势相反。因此在预设时间范围内,不响应与上一有效手势相反的手势,预设时间范围后,再接收用户操作动作反射的超声波并响应用户的操作动作。例如,在浏览推荐页面的应用场景下,用户手掌从右向左移动,此时,系统识别一次有效手势,电子书会向左翻页。在接下来的1秒内,用户的手从快速从左方回归到右方的动作,也即与有效手势相反的这个多余动作,浏览推荐页面就不会进行识别,可以很好的过滤掉多余的手势,从而屏蔽了由此带来的误操作。
本申请实施例复用激光电视机的扬声器和麦克风,基于超声波识别操作动作,进而控制激光电视机工作,实现用户与激光电视机的非接触式交互,该交互方式对光照不敏感、耗费资源少、感应范围广、提升用户使用体验。
图2为本申请实施例提供的一种操作动作识别方法的流程示意图。如图2所示,该方法至少包括以下步骤。
步骤210:获取第一超声波信号对应的回采信号。
在第一超声波信号通过扬声器发射出去之前,重新对第一超声波信号进行采集得到回采信号,作为第二超声波信号的参考信号。
步骤220:根据回采信号和第二超声波信号,获取操作动作特征。
在具体实施中,可以先根据回采信号和第二超声波信号,滤除第二超声波中的噪声;再对滤除噪声后的第二超声波进行特征提取,获取操作动作特征。
麦克风采集第二超声波信号包括第一超声波反射的信号和环境中的噪声,可以通过第二超声波信号与回采信号进行对比,以过滤掉环境中的噪声信号,以及对滤波后第二超声波信号进行放大后提取放大后的信号中对应的特征图像,即操作动作特征。
在一实施例中,在对第二超声波信号进行滤波的过程中,还可以根据第二超声波信号的频率与预设频率的匹配关系,剔除第二超声波信号中的多余部分。在具体实施中,可以在激光电视机主板的存储模块中预先存储频率的范围,将获取的第二超声波波形的所有频率均与预设频率进行比较。剔除掉超出预设频率的波形的频率。根据剔除频率后的剩余频率生成新的操作动作特征。
由于肢体操作动作反射生成的第二超声波信号的波形理论上具有连续性,因此,在一实施例中,可以根据波形的连续性,剔除掉频率不连续的波。根据剔除频率后的剩余频率生成新的操作动作特征。
通过以上方式可以对第二超声波信号进行滤波优化,从而提高后续操作动作识别的精确度。
需要说明的是,麦克风采集的第二超声波信号是模拟信号,在进行滤波处理之前需要进行模数转换,即以采样间隔对麦克风阵列进行采样来接收第一超声信号的反射信号,从而收集时域反射信号,即第二超声波信号对应的时域信号。进一步,可以通过波束形成技术,将麦克风阵列中各个麦克风对应的频域信号进行组合生成波束形成的频域反射信号。
图3为本申请实施例提供的一种第二超声波信号处理过程的示意图。如图3所示,麦克风采集到第二超声波信号后,激光电视机内部的DSP芯片对第二超声波信号进行模数转换,模数转换后的第二超声波信号传输至激光电视机主板SOC芯片中进行分析处理。
主板SOC芯片将时域反射信号转换为波束形成的频域反射信号,并生成声学图像,该声学图像包括多个方向中的每个方向的波束形成的频域信号。从声学图像生成具有每个方向的特征值的特征图像的特征(例如深度,即声源到反射点的距离)或从各个方向的波束形成的频域反射信号导出的强度。
步骤230:利用预先训练完成的操作动作分类模型,确定操作动作特征对应的操作动作概率向量。
操作动作分类模型可以将特征图像分类成不同的操作动作。在一实施中,操作动作分类模型可以选择卷积神经网络(CNN),CNN是一种已经被开发用于处理图像的神经网络。CNN输入图像并且输出图像的分类。卷积神经网络可以包括:卷积层和长短期存储器(LSTM),还可以包括完全连接层(FC层)。其中卷积层又可以包括卷积子层、整流线性单元(ReLU)子层和最大池化子层。在另一实施例中,操作动作分类模型可以包括串联连接的多个卷积层,与卷积层连接的FC层、LSTM层、softmax层和平均池化层。
由于肢体运动产生操作动作是动态的过程,那么麦克风采集的为持续若干时间的超声信号序列,因此提取过滤后第二超声波信号特征得到特征图像序列。当表示操作动作的特征图像序列被输入到操作动作分类模型后,LSTM层计算LSTM层的每个节点的激活值。节点的激活值是基于当前特征图像和先前特征图像的激活值来计算的。模型连续地处理序列的特征图像,将序列的每个特征图像的分类考虑在内。通过操作动作分类模型可以得到第二超声波信号对应各种操作动作的概率。
在操作动作分类模型的训练过程中,可以先通过激光电视机的扬声器和麦克风获取样本数据,再对样本数据进行标注,最后通过标注后样本数据对模型进行训练优化。
步骤240:确定操作动作概率向量中最大概率对应操作动作为第二超声波信号对应的操作动作。
例如,第二超声波信号对应左滑动作的概率最大,那么可以确定第二超声波信号对应的左滑动作。
本申请通过神经网络模型对超声波信号进行分类,识别操作动作,提高人体肢体动作的识别精度。
值得一提的是,本申请操作动作识别的方式不局限于基于神经网络的方式识别操作动作,还可以结合激光电视机中扬声器和麦克风的空间关系(位置和数量关系),利用第二超声波信号在不同空间关系的时间频率分布识别操作动作,即先确定激光电视机的扬声器和麦克风的空间关系是否形成单一参考线、单一参考面、或三维坐标系统,然后再观测第二超声波信号在该空间关系下的时间频率分布的特征识别操作动作,最后通过操作来实现激光电视机上缩放、选定、确认、移动、关闭、开启等功能。
若激光电视机仅设置一个扬声器和一个麦克风,并且一个扬声器和一个麦克风的位置关系形成单一参考线,则可以根据第二超声波信号在该空间关系下的时间频率分布确定对应于在参考线上物体移动的投影轨迹的操作动作,如上滑、下滑等手势。
若激光电视机设置两个扬声器和一个麦克风、或一个扬声器和两个麦克风、或一个扬声器和一个定向麦克风,并且(多个)扬声器和(多个)麦克风被配置为形成单一参考面,则可以根据第二超声波信号在该空间关系下的时间频率分布确定对应于在参考面(两条参考线)上物体移动的投影轨迹的操作动作,如画圈、画正方形、画三角形等手势。
例如,激光电视机设置一个扬声器和两个麦克风,通过扬声器和一个麦克风的实线被称为第一参考线,而通过扬声器和另一个麦克风的实线被称为第二参考线,这两条参考线彼此不平行和共线,并且这两条参考线进一步形成一个参考面。即,构成二维(2D)坐标系统。用户的肢体如手的移动可以被视为参考面上的投影轨迹。也就是说,参考面的投影轨迹可被分解为两条参考线的投影轨迹,并且通过跟踪这两条参考线上的投影轨迹,可以清楚地确定操作动作。
若激光电视机设置三个扬声器和一个麦克风、或两个扬声器和两个麦克风、或一个扬声器和三个麦克风、或两个扬声器和一个定向麦克风、或一个扬声器、一个麦克风和一个定向麦克风,并且(多个)扬声器和(多个)麦克风被配置为形成三维坐标系统,则可以根据第二超声波信号在该空间关系下的时间频率分布确定对应于在三维坐标系统(三条参考线)上物体移动的投影轨迹的操作动作,如抓取、抚摸、翻转、握拳、鼓掌等手势。
需要说明的是,在根据第二超声波信号在某空间关系下的时间频率分布确定操作动作时,可以通过实践的形式多次观测不同操作动作对应的第二超声波信号在某空间关系下的时间频率分布的特征,获取不同操作动作在不同空间关系下的时间频率分布特征,建立时间频率分布模型,从而确定接收到的第二超声波信号对应的操作动作。
值得一提的是,由于不同的激光电视机机型(如麦克风与扬声器的空间关系不同)对用户操作动作反射到的波形数据存在差异,为了提升操作动作的匹配准确度,在一实施例中可以建立基于不同型号激光电视机的操作动作波形模板库。例如为了解决激光电视机的计算能力不足问题,还可以建立基于云端服务器的操作动作波形模板库。用户录制了指定操作动作的波形数据,云端服务器就可以建立操作动作波形模板库,采用机器学习的方法进行操作动作识别,提升操作动作匹配的准确度。云端服务器可以包括两个组成部分:一部分是离线操作动作波形模板库训练,一部分是在线操作动作识别。激光电视机可以将采集到的第二超声波信号进行过滤放大模数转换等处理,然后将第二超声波信号发送给云端服务器,该云端服务器可以采用在线云端识别的方式通过操作动作波形模板库获取到操作动作识别结果,然后云端服务器将该操作动作识别结果发送给激光电视机,使得不同激光电视机机型都可以获取到适用于该电视机类型的操作动作识别结果,例如,通过激光电视机的配置文件可以获取到激光电视机的类型信息和激光电视机的配置信息,例如激光电视机的系统类型、操作系统版本、激光电视机采用的处理器个数、内容空间大小、扬声器和麦克风的空间关系,从而根据激光电视机的类型信息和激光电视机的配置信息进入为这种激光电视机所设置的操作动作波形模板库,从而提高操作动作匹配的准确度。
图4为本申请实施例提供的一种发射第一超声波信号方法的流程示意图。如图4所示,该方法至少包括以下步骤。
步骤410:获取第一超声波信号。
图5为本申请实施例提供的一种第一超声波信号处理过程的示意图。如图5所示,通过激光电视机主板的外部信号接口获取第一超声波信号。
值得注意的是,扬声器的数量越多,操作动作的识别更精确,因此,优选的,扬声器的数量可以多于一个,当激光电视机设置多个扬声器,例如两个扬声器,那么两个发射器被配置为以不同的频率或以不同的频率模式发射超声波信号,以使得麦克风可以将一个扬声器发射的反射超声波和另一个扬声器发射的反射超声波区分开。举例来说,一个扬声器被配置为发射频率为40KHz的超声波信号,而另一个扬声器被配置为发射频率为42KHz的超声波信号。可选地,一个扬声器被配置为发射频率为40KHz至41KHz(即,特定频率模式),而另一个扬声器被配置为发射频率为42KHz至43KHz。
相应的,麦克风接收到第二超声波信号包含两种发射频率的超声波,在后续对第二超声波信号的处理中,可以分别提取两种频率的信号的特征,建立基于神经网络的可以并行处理两路声学图像序列的操作动作分类模型或者时间频率分布模型,提高操作动作识别的准确性。
步骤420:对第一超声波信号进行调制解码,得到IIS形式的第一超声波信号。
IIS为数字音频传输标准的接口协议,用于数字音频数据在系统内器件之间传输,例如编解码器CODEC、DSP、数字输入/输出接口、ADC、DAC和数字滤波器等。
如图5所示,第一超声波信号传递至激光电视机主板SOC(片上系统)芯片中进行音频处理,即对音频信号进行解压调制解码以后,生成激光电视机功放模块可以识别的IIS信号。在具体实施中,需要根据第一超声波信号的频率设置IIS信号的频率。
步骤430:对IIS形式的第一超声波信号进行放大,并驱动扬声器发射放大后的IIS形式的第一超声波信号。
如图5所示,功放模块会对IIS形式的第一超声波信号进一步放大后,驱动激光电视机扬声器将放大后的超声波信号传播出去。
值得注意的是,在获取第一超声波信号对应的回采信号时,可以通过对IIS形式的第一超声波信号进行模数转换,得到回采信号。如图5所示,激光电视机的功放模块输出一路回采信号至激光电视机主板SOC芯片。回采信号为激光电视机主板SOC芯片可以识别的PDM信号。
图6为本申请实施例提供的一种超声波信号处理过程的示意图。如图6所示,第一超声波信号传递至激光电视机主板SOC芯片中进行音频处理,对音频信号进行解压调制解码以后,生成激光电视机功放模块可以识别的IIS信号。功放模块会对IIS形式的第一超声波信号进一步放大后,驱动激光电视机扬声器将放大后的超声波信号传播出去,同时功放模块输出一路回采信号至激光电视机主板SOC芯片。
麦克风采集到第二超声波信号后,激光电视机内部的DSP芯片对第二超声波信号进行模数转换,模数转换后的第二超声波信号传输至激光电视机主板SOC芯片中进行分析处理,以识别第二超声波信号对应的操作动作。
本申请实施例复用激光电视机的远场语音模组(麦克风、模数转换新芯片),以及扬声器、功放模块、SOC芯片等硬件,只需要在激光电视机中部署交互控制方法即可实现基于超声波的操作动作识别。
以下介绍本申请的交互控制装置实施例,可以用于执行本申请上述实施例中的交互控制方法。对于本申请翻译实施例中未披露的细节,请参照本申请上述的交互控制方法的实施例。
图7为本申请实施例提供的一种交互控制装置的结构示意图。如图7所示,交互控制装置700至少包括以下部分。
第一控制单元710,用于响应于开启指令,通过扬声器发射第一超声波信号,并通过麦克风采集操作动作反射的第二超声波信号。
操作动作识别单元720,用于识别第二超声波信号对应的操作动作。
第二控制单元730,用于根据第二超声波信号对应的操作动作,控制激光电视机工作。
在本申请的一些实施例中,基于上述方案,第一控制单元可以包括:
信号获取单元,用于获取第一超声波信号。
信号变换单元,用于对第一超声波信号进行调制解码,得到IIS形式的第一超声波信号。
信号放大单元,用于对IIS形式的第一超声波信号进行放大,并驱动扬声器发射放大后的IIS形式的第一超声波信号。
在本申请的一些实施例中,基于上述方案,操作动作识别单元可以包括:
回采信号获取单元,用于获取第一超声波信号对应的回采信号。
在第一超声波信号通过扬声器发射出去之前,重新对第一超声波信号进行采集得到回采信号,作为第二超声波信号的参考信号。
特征提取单元,用于根据回采信号和第二超声波信号,获取操作动作特征。
动作分类单元,用于利用预先训练完成的操作动作分类模型,确定操作动作特征对应的操作动作概率向量。本申请实施例提供的交互控制装置可应用于激光电视机或者其他包括扬声器和麦克风且需要与用户交互功能的电器设备中,使其可以基于超声波识别操作者动作,进而控制设备工作,提升用户交互体验。
本申请实施例还提供了一种激光电视机,激光电视机包括:
扬声器,用于发射第一超声波信号;
麦克风,用于采集外部环境反射第一超声波信号所生成的第二超声波信号;以及如上述交互控制装置。
本申请实施例还提供一种存储介质,包括程序或指令,当所述程序或指令被执行时,用以执行本申请实施例提供的一种交互控制方法及任一可选方法。
最后应说明的是:本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
以上仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种交互控制方法,其特征在于,应用于激光电视机,所述激光电视机包括扬声器和麦克风,所述方法包括:
响应于开启指令,通过所述扬声器发射第一超声波信号,并通过所述麦克风采集外部环境反射操作动作所述第一超声波信号所生成的第二超声波信号;
识别所述第二超声波信号对应的操作动作;
根据所述第二超声波信号对应的操作动作,控制所述激光电视机工作。
2.如权利要求1所述的交互控制方法,其特征在于,所述识别所述第二超声波信号对应的操作动作,包括:
获取所述第一超声波信号对应的回采信号;
根据所述回采信号和所述第二超声波信号,获取操作动作特征;
利用预先训练完成的操作动作分类模型,确定所述操作动作特征对应的操作动作概率向量;
确定所述操作动作概率向量中最大概率对应操作动作为所述第二超声波信号对应的操作动作。
3.如权利要求2所述的交互控制方法,其特征在于,所述操作动作分类模型是卷积神经网络,所述卷积神经网络包括:卷积层和长短期存储器。
4.如权利要求2所述的交互控制方法,其特征在于,所述根据所述回采信号和所述第二超声波信号,获取操作动作特征,包括:
根据所述回采信号和所述第二超声波信号,滤除所述第二超声波中的噪声;
对滤除噪声后的第二超声波进行特征提取,获取所述操作动作特征。
5.如权利要求2所述的交互控制方法,其特征在于,所述通过所述扬声器发射第一超声波信号,包括:
获取所述第一超声波信号;
对所述第一超声波信号进行调制解码,得到IIS形式的第一超声波信号;
对所述IIS形式的第一超声波信号进行放大,并驱动所述扬声器发射放大后的所述IIS形式的第一超声波信号。
6.如权利要求5所述的交互控制方法,其特征在于,所述获取所述第一超声波信号对应的回采信号,包括:
对所述IIS形式的第一超声波信号进行模数转换,得到所述回采信号。
7.如权利要求1所述的交互控制方法,其特征在于,所述操作动作包括但不限于左滑、右滑、上滑、下滑、点击、双击。
8.一种交互控制装置,其特征在于,应用于激光电视机包括扬声器和麦克风,所述装置包括:
第一控制单元,用于响应于开启指令,通过所述扬声器发射第一超声波信号,并通过所述麦克风采集操作动作反射的第二超声波信号;
操作动作识别单元,用于识别所述第二超声波信号对应的操作动作;
第二控制单元,用于根据所述第二超声波信号对应的操作动作,控制所述激光电视机工作。
9.一种激光电视机,其特征在于,所述激光电视机包括:
扬声器,用于发射第一超声波信号;
麦克风,用于采集外部环境反射所述第一超声波信号所生成的第二超声波信号;以及
如权利要求8所述的交互控制装置。
10.一种计算机可读存储介质,其特征在于,包括程序或指令,当所述程序或指令被执行时,用以执行如权利要求1至7中任一项所述的交互控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111322467.4A CN114040235A (zh) | 2021-11-09 | 2021-11-09 | 交互控制方法、装置、激光电视机及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111322467.4A CN114040235A (zh) | 2021-11-09 | 2021-11-09 | 交互控制方法、装置、激光电视机及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114040235A true CN114040235A (zh) | 2022-02-11 |
Family
ID=80137020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111322467.4A Pending CN114040235A (zh) | 2021-11-09 | 2021-11-09 | 交互控制方法、装置、激光电视机及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114040235A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114783439A (zh) * | 2022-06-20 | 2022-07-22 | 清华大学 | 一种基于智能语音控制系统的命令注入方法及系统 |
-
2021
- 2021-11-09 CN CN202111322467.4A patent/CN114040235A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114783439A (zh) * | 2022-06-20 | 2022-07-22 | 清华大学 | 一种基于智能语音控制系统的命令注入方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11561519B2 (en) | Systems and methods of gestural interaction in a pervasive computing environment | |
US11412108B1 (en) | Object recognition techniques | |
JP6713034B2 (ja) | スマートテレビの音声インタラクティブフィードバック方法、システム及びコンピュータプログラム | |
Christensen et al. | Batvision: Learning to see 3d spatial layout with two ears | |
CN102903362B (zh) | 集成的本地和基于云的语音识别 | |
KR101801073B1 (ko) | 비접촉 제스쳐 제어 방법 및 전자 단말 장치 | |
Zhang et al. | Soundlip: Enabling word and sentence-level lip interaction for smart devices | |
WO2015017583A1 (en) | Motion detection of audio sources to facilitate reproduction of spatial audio spaces | |
JP2019159306A (ja) | ファーフィールド音声制御デバイス及びファーフィールド音声制御システム | |
CN110444206A (zh) | 语音交互方法及装置、计算机设备与可读介质 | |
US9874977B1 (en) | Gesture based virtual devices | |
JPWO2005057549A1 (ja) | 情報処理システム、情報処理方法および情報処理用プログラム | |
CN107004426A (zh) | 录取录像对象的声音的方法和移动终端 | |
CN104754466A (zh) | 使用扬声器的用户接口装置及其方法 | |
JP7214798B2 (ja) | 音声信号処理方法、音声信号処理装置、電子機器及び記憶媒体 | |
CN108737934B (zh) | 一种智能音箱及其控制方法 | |
CN111966212A (zh) | 基于多模态的交互方法、装置、存储介质及智能屏设备 | |
Zhang et al. | Ambiear: mmwave based voice recognition in nlos scenarios | |
Gardecki et al. | The Pepper humanoid robot in front desk application | |
CN114040235A (zh) | 交互控制方法、装置、激光电视机及存储介质 | |
JP2004198656A (ja) | ロボット視聴覚システム | |
WO2016206647A1 (zh) | 用于控制机器装置产生动作的系统 | |
CN112202655B (zh) | 智能电器、图像识别方法、电子设备以及存储介质 | |
CN113989828A (zh) | 基于便携式智能设备和超声信号的手势识别方法及系统 | |
WO2019187549A1 (ja) | 情報処理装置および情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |