CN114253397A - 一种基于耳戴式惯性传感器的智能设备交互系统 - Google Patents

一种基于耳戴式惯性传感器的智能设备交互系统 Download PDF

Info

Publication number
CN114253397A
CN114253397A CN202111368066.2A CN202111368066A CN114253397A CN 114253397 A CN114253397 A CN 114253397A CN 202111368066 A CN202111368066 A CN 202111368066A CN 114253397 A CN114253397 A CN 114253397A
Authority
CN
China
Prior art keywords
head
ear
signal
interaction
sliding window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111368066.2A
Other languages
English (en)
Inventor
邹永攀
朱培钊
黎文源
伍楷舜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN202111368066.2A priority Critical patent/CN114253397A/zh
Publication of CN114253397A publication Critical patent/CN114253397A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/015Input arrangements based on nervous system activity detection, e.g. brain waves [EEG] detection, electromyograms [EMG] detection, electrodermal response detection

Abstract

本发明公开了一种基于耳戴式惯性传感器的智能设备交互系统。该系统包括耳戴式设备和智能设备,其中所述耳戴式设备设有陀螺仪,用于采集包含用户头部动作的角速度信号,所述智能设备用于对接收的角速度信号进行处理,获得头部动作信号特征输入至经训练的循环神经网络模型,以识别出头部动作类型;并通过设定的头部动作类型与应用软件交互方式之间的对应关系,控制应用软件实现交互。本发明提供的系统硬件成本低,携带及使用方便,能够实现解放用户双手的人机交互,具有广阔的应用前景。

Description

一种基于耳戴式惯性传感器的智能设备交互系统
技术领域
本发明涉及移动计算和人机交互技术领域,更具体地,涉及一种基于耳戴式惯性传感器的智能设备交互系统。
背景技术
随着移动计算与人机交互领域的不断发展,触摸屏交互、键盘交互等传统交互方式已经普遍应用。然而,传统交互方式会给人们带来不便,例如键盘、触摸屏交互需要使用手和眼睛。随着可穿戴设备的普及,用户渴望与智能可穿戴设备进行更加自然的人机交互,以提高使用体验。因此,以解放用户双手的方式进行人机交互就显得十分重要。
为了实现解放双手的人机交互,计算机需要识别用户的“意图”。现有识别技术主要有以下几种:1)基于音频信号的语音识别。该方法需要麦克风不断采集用户的语音信号,通过对音频进行分析得到语义。这种方式存在隐私问题,必须在安静的环境下使用并且容易打扰他人,应用场景受限。2)基于计算机视觉的面部表情识别。该方法需要摄像头不断跟踪用户的面部,识别用户的表情,同样存在隐私问题,应用场景受限,并且设备的价格昂贵。3)基于生物技术的生理信号识别。该方法需要检测用户的脑电信号(EEG)、肌电信号(EMG)等,通过对生理信号进行分析得到用户的意图。因为个体当前的状态会影响生理信号,人与人之间的生理信号也存在特殊性,所以识别的准确率难以保证。4)基于多模态的识别。该方法综合以上技术的两种及以上的不同信号,虽然准确率更高,但是同时兼具了他们的缺点,设备通常较为笨重,不方便携带。
综上,目前解放双手的人机交互方式还存在许多弊端,如成本较高、应用场景受限、准确率低、存在隐私问题等。
发明内容
本发明的目的是克服上述现有技术的缺陷,提供一种基于耳戴式惯性传感器的智能设备交互系统。该系统包括耳戴式设备和智能设备,其中所述耳戴式设备设有陀螺仪,用于采集包含用户头部动作的角速度信号,所述智能设备用于对接收的角速度信号进行处理,获得头部动作信号特征输入至经训练的循环神经网络模型,以识别出头部动作类型;并通过设定的头部动作类型与应用软件交互方式之间的对应关系,控制应用软件实现交互,其中所述头部动作类型根据转动的方向和次数进行划分。
相应地,本发明还提供一种基于耳戴式惯性传感器的智能设备交互方法。该方法包括:利用设有陀螺仪的耳戴式设备采集包含用户头部动作的角速度信号;从所述角速度信号中分割出头部动作对应的角速度信号特征;将所述角速度信号特征输入到经训练的循环神经网络模型,获得头部动作类型,其中每种类型的头部动作根据转动的方向和次数进行划分;根据设定的头部动作类型与应用软件交互方式之间的对应关系,控制智能设备上应用软件实现与用户的交互。
与现有技术相比,本发明的优点在于,仅使用陀螺仪作为传感器,成本低廉,结构简单,能够在解放用户双手的情况下,实时检测与识别用户的头部动作,从而实现自然的人机交互。利用本发明,用户仅需要像往常一样戴上耳机,便能使用头部动作控制移动终端的应用软件,例如调节音量、切换歌曲、地图导航等,携带及使用方便,适合日常使用。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是根据本发明一个实施例的基于耳戴式惯性传感器的智能设备交互系统的示意图;
图2是根据本发明一个实施例的基于耳戴式惯性传感器的智能设备交互方法的流程图;
图3是根据本发明一个实施例的基于耳戴式惯性传感器的智能设备交互方法的过程示意图;
图4是根据本发明一个实施例的移动终端的处理过程示意图;
图5是根据本发明一个实施例的18种头部动作的混淆矩阵图;
图6是根据本发明一个实施例的动作检测结果示意图;
图7是根据本发明一个实施例的滑动窗口机制示意图;
图8是根据本发明一个实施例的不同类型头部动作示意图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本发明提供一种基于耳戴式惯性传感器(IMU)的智能设备交互系统。该系统整体上包括耳戴式设备和智能设备。耳戴式设备设有惯性传感器,如陀螺仪,用于采集包含用户头部动作的角速度信号。智能设备用于对接收的角速度信号进行处理,提取头部动作信号特征输入至经训练的循环神经网络模型,以识别出头部动作类型;并通过设定的头部动作类型与应用软件交互方式之间的对应关系,控制应用软件实现交互。
为清楚起见,在下文的描述中,耳戴式设备以半入耳式耳机为例,智能设备以移动终端或手机为例进行说明。
参见图1所示,半入耳式耳机本体包括耳塞和用于播放声音的扬声器1、用于采集角速度信号的陀螺仪2、耳机控制处理器3(或称主控芯片)、用于通话的麦克风4和电源模块5等。应理解的是,为支持数据传输,耳机通常还设有蓝牙控制器、通用异步收发传输器(UART)等。
结合图2和图3所示,利用本发明提供的系统实现智能设备交互的方法包括以下步骤。
步骤S1,启动耳戴式设备中的陀螺仪,采集用户头部动作的角速度信号。
例如,通过耳戴式设备中的陀螺仪(或称角运动检测装置)采集用户头部动作信号。利用陀螺仪可以感测头部水平、垂直、俯仰、方向以及角速度等。
在一个实施例中,将角速度数据的采样率设置为100Hz,这种设置在保证动作识别准确率的情况下可以降低功耗。
步骤S2,对采集的角速度信号进行卡尔曼滤波、编码等预处理。
为提高动作识别的准确性,对原始的角速度信号进行滤波处理,以滤除背景噪声或无效干扰等,并且进行编码处理,以将信号数据传输给移动终端。
步骤S3,利用蓝牙协议将预处理后的信号传输到移动终端的APP。
在该步骤中,利用耳戴式设备上的蓝牙接口或其他无线接口将经处理后的数据传输至移动终端
步骤S4,移动终端接收到信号后,对信号进行解码、分割处理,并进行头部动作识别,根据所识别出的头部动作控制移动终端的应用软件执行相应的交互,进而将响应结果反馈给用户。
具体地,参见图4所示,步骤S4中包括:
S41,对接收的角速度信号根据编码规则进行解码,分别得到X、Y、Z三轴的角速度信号。
S42,使用滑动窗口对角速度信号进行滤波,再使用动作检测算法判断每个窗口是否存在头部动作信息,若存在,则使用动作分割算法截取相应的头部动作信号;若不存在,则判断下一帧。
S43,利用深度学习中的循环神经网络模型识别头部动作类型。
为了更好地捕捉头部动作时间序列中时间步距离较大的依赖关系,选择的深度学习模型是门控循环神经网络中的长短时记忆(LSTM)网络。考虑到采集到的头部动作信号为未知不定长的三轴的角速度信号,在一个实施例中,设置模型输入时间步为不定长、输入通道数为3、设置隐藏层数为4,隐藏单元个数为256。利用数据集训练模型,调节参数,从而实现更好的头部动作识别效果。在训练阶段,可使用k折交叉验证法来评估、选择模型,其中k为训练样本中被试者的个数,训练得到的模型的评估均为跨用户识别的结果,即可以用于不同用户的头部动作识别。应理解的是,也可采用门控循环单元(GRU)替代LSTM,且本发明不限制隐藏层的数目、隐藏单元的数目等具体的网络结构。
为了提高模型的识别精度和泛化能力,根据用户头部转动的方向和次数来细分头部动作类型,并且用于训练模型的数据集涵盖不同用户处于静止和移动等多种场景。例如,根据以下步骤构建数据集:
用户佩戴携带陀螺仪的耳戴式设备,该耳戴式设备通过蓝牙与移动设备连接,此时移动设备的应用软件能够实时显示陀螺仪的数据波形,用户能够保存头部动作的数据。
针对用于在身体静止、步行、跑步等不同的场景,重复采集以下18个不同的头部动作信号:左转、左转两次、右转、右转两次、左右转、右左转、正中间抬头、左上角抬头、右上角抬头、正中间低头、左下角低头、右下角低头、抬头两次、低头两次、顺时针旋转、逆时针旋转、左倾、右倾,最终构建不同用户在不同场景下的18种头部动作的数据集。
S44,移动终端根据识别出的头部动作类型来控制应用软件完成人机交互。
例如,控制音乐播放器的播放、暂停、切换歌曲、调节音量等(即步骤S44-1)。又如,控制地图应用软件中地图视角的移动(上、下、左、右移动)或地图视角的缩放(放大、缩小)等(即步骤S44-2)。
应理解的是,通过预先设定的头部动作类型与应用软件交互方式之间的对应关系,也可以实现其他各种应用软件的交互。
S45,将交互应用的响应结果实时反馈给用户,从而完成整个自然交互的过程。
用户可以根据交互结果进行下一步的操作,实现最终的控制需求。
在一个实施例中,步骤S42中的滤波算法使用计算量较小的卡尔曼滤波器,以在最大化保留数据信息的前提下过滤背景噪声。例如,设置卡尔曼滤波器的观测协方差矩阵和转移协方差矩阵为三阶单位矩阵。
在一个实施例中,步骤S42中的动作检测算法,能够实现不同场景下(如正坐、步行、跑步等)准确的动作信号的检测与分割。例如,参见图7所示,动作检测和分割过程使用三个滑动窗口,滑动窗口1用来检测动作信号的结束点,滑动窗口2用来检测动作信号的起始点,滑动窗口3用来捕捉动作信号的上下文信息,也就是背景噪声。三个滑动窗口的步长均为0.1s,目的是在保证动作检测准确率的情况下降低功耗。
具体地,对于动作信号的结束点的检测,使用滑动窗口1对源源不断数据流进行分帧,对每一帧的信号计算其短时能量。由于头部动作如抬头,低头,顺时针旋转头部等动作均在3s内完成,因此将滑动窗口1的大小设置为3s(在100Hz采样率下即为300个数据点),略大于所有的头部动作信号。对于存在动作信号的数据流,上下文具有相同的背景噪声,因此计算得到的短时能量会先增大,接着保持不变,最后降低,在短时能量保持不变的帧数中,整个动作信号存在于滑动窗口1中。无论在哪种场景下,动作信号上文的背景噪声与下文的背景噪声的能量相近,因此在滑动窗口1包含动作信号的滑动过程中,短时能量基本保持不变,根据上述原理,该算法能够实现不同场景下的结束点检测。在短时能量保持不变的起始点,便是动作信号刚开始完全存在于滑动窗口1的时间点,因此可以得到动作信号的结束点。
对于动作信号的起始点的检测,使用滑动窗口3紧跟在滑动窗口1后面,对源源不断数据流进行分帧,对每一帧的信号计算其短时能量,以得到信号的上下文信息En(背景噪声),并将kEn设置为动态阈值,该阈值将会根据背景噪声动态变化,在身体静止如正坐,站立等场景下,动态阈值偏小,在身体运动如走路,跑步等场景下,动态阈值偏大。根据上述原理,本发明算法能够实现不同场景下的起始点检测。例如,滑动窗口3的大小设置为0.5s,k为信噪比阈值,根据经验设置为10。同时,使用滑动窗口2,对已检测到结束点的滑动窗口1进行分帧,对每一帧的信号计算其短时能量E,当E大于动态阈值kEn时,即为动作信号的起始点。例如,滑动窗口2大小设置为0.5s,与滑动窗口3相同。
为进一步理解本发明,仍结合图3进行说明。所提供的系统工作流程包括训练过程和应用过程。训练过程包括:实验人员佩戴耳戴式设备进行头部动作,头部动作被智能设备感知后,主控芯片ESP32读取IMU采集到的信号,并通过蓝牙发送到移动终端。移动终端上的Android应用软件接收到蓝牙发送的数据后,进行数据可视化和数据保存,在数据库中建立模型训练所需的数据集。PC端通过读取数据集,进行数据预处理并训练模型,然后导出深度学习模型,最后将经训练的深度学习模型部署到Android应用软件上。应用过程包括:在用户实际使用耳戴式智能设备时,数据同样传输到移动终端,此时,Android应用软件实时进行头部动作检测,并对头部动作进行识别。交互应用会根据不同的头部动作执行相应的操作(如地图视角移动和缩放等),进而将交互应用的响应结果实时反馈给用户,从而完成整个自然交互的过程。
图5是18种头部动作的混淆矩阵图,对应的动作类型结合图8所示。经验证,动作识别准确率为96.8%。动作编号分别是:A-左上角抬头,B-右上角抬头,C-右倾,D-右转两次,E-左右转,F-左倾,G-右下角低头,H-右转,I-抬头,J-左下角低头,K-顺时针旋转,L-正中间低头,M-低头两次,N-左转,O-逆时针旋转,P-抬头两次,Q-左转两次,R-右左转。
图6是动作检测结果示意图,其中图6(a)是用户身体静止场景下进行头部动作的动作检测结果,图6(b)是用户步行场景下进行头部动作的动作检测结果,竖线为分割线,信号为三通道的角速度信号。可以看出,无论用户在身体静止或者步行的场景下,动作检测算法均能准确切分头部动作产生的信号。经验证,利用本发明能够准确地分割出不同用户、不同场景以及不同动作类型。
综上所述,本发明利用目前耳戴式设备中的已有硬件,设计头部动作识别方案,并根据头部动作类型控制智能设备实现快速、准确的交互。此外,本发明根据头部动作的特征设计动作检测和分割方法,并利用角速度信号呈现的特征选用门控循环神经网络捕获上下文特征和时序上的依赖关系,从而能够准确识别细分的头部动作类型,扩展了交互应用的范围。总之,本发明提供的系统硬件成本低,携带及使用方便,能够实现解放用户双手的人机交互,具有广阔的应用前景。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++、Python等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

Claims (10)

1.一种基于耳戴式惯性传感器的智能设备交互系统,包括耳戴式设备和智能设备,其中所述耳戴式设备设有陀螺仪,用于采集包含用户头部动作的角速度信号,所述智能设备用于对接收的角速度信号进行处理,获得头部动作信号特征输入至经训练的循环神经网络模型,以识别出头部动作类型;并通过设定的头部动作类型与应用软件交互方式之间的对应关系,控制应用软件实现交互,其中所述头部动作类型根据转动的方向和次数进行划分。
2.根据权利要求1所述的系统,其特征在于,所述智能设备执行以下步骤:
步骤S21:接收来自于耳戴式设备的角速度信号,并根据编码规则进行解码,分别得到X、Y、Z三轴的角速度信号;
步骤S22:使用滑动窗口对角度度信号进行分帧,进而进行滤波,并判断各窗口内是否存在头部动作,若存在,则使用动作分割算法截取相应的头部动作信号特征;若不存在,则判断下一帧;
步骤S23:将截取的头部动作信号特征输入经训练的循环神经网络模型,获得头部动作类型,其中训练所述循环神经网络模型的数据集表征不同用户在多种场景下的头部动作类型和角速度信号特征之间的对应关系;
步骤S24:根据获得的头部动作类型来控制智能设备上的应用软件实现人机交互,并将交互结果实时反馈给用户。
3.根据权利要求2所述的系统,其特征在于,所述智能设备上的应用软件实现人机交互包括:
控制音乐播放器的播放、暂停、切换歌曲、调节音量;
控制地图应用软件中地图视角的上、下、左、右移动,或控制地图视角的缩放。
4.根据权利要求2所述的系统,其特征在于,步骤S22包括以下子步骤:
对于头部动作信号的结束点的检测包括:使用第一滑动窗口对数据流进行分帧,对每一帧的信号计算其短时能量,其中第一滑动窗口的大小根据头部动作的完成时间设置;
对于头部动作信号的起始点的检测包括:使用第三滑动窗口紧跟在第一滑动窗口后,对数据流进行分帧,对每一帧的信号计算其短时能量,以得到信号的上下文信息En,并将kEn设置为动态阈值,该阈值在不同的场景下动态变化;并且使用第二滑动窗口对已检测到结束点的第一滑动窗口进行分帧,对每一帧的信号计算其短时能量E,当E大于动态阈值kEn时,确定动作信号的起始点。
5.根据权利要求4所述的系统,其特征在于,第一滑动窗口、第二滑动窗口和第三滑动窗口的步长均设置为0.1s,第一滑动窗口的大小设置为3s,第二滑动窗口和第三滑动窗口的大小均设置为0.5s,并且在运动场景下,相对于静止场景,将所述阈值设置为较大值。
6.根据权利要求1所述的系统,其特征在于,所述循环神经网络模型是长短时记忆网络,其输入时间步设置为不定长,输入通道数设置为3。
7.根据权利要求1所述的系统,其特征在于,所述角速度信号的采样率设置为100Hz。
8.根据权利要求1所述的系统,其特征在于,根据以下步骤构建训练所述循环神经网络模型的数据集:
用户佩戴携带设有陀螺仪的耳戴式设备,该耳戴式设备通过蓝牙与智能设备连接,且智能设备的应用软件实时显示陀螺仪的数据波形;
针对用户在身体静止、步行、跑步不同的场景,重复采集多种类型头部动作对应的角速度信号,包括左转、左转两次、右转、右转两次、左右转、右左转、正中间抬头、左上角抬头、右上角抬头、正中间低头、左下角低头、右下角低头、抬头两次、低头两次、顺时针旋转、逆时针旋转、左倾、右倾;
以包含头部动作的角速度信号作为输入,以对应的头部动作类型作为标签构建数据集。
9.一种基于耳戴式惯性传感器的智能设备交互方法,包括以下步骤:
利用设有陀螺仪的耳戴式设备采集包含用户头部动作的角速度信号;
从所述角速度信号中分割出头部动作对应的角速度信号特征;
将所述角速度信号特征输入到经训练的循环神经网络模型,获得头部动作类型,其中每种类型的头部动作根据转动的方向和次数进行划分;
根据设定的头部动作类型与应用软件交互方式之间的对应关系,控制智能设备上应用软件实现与用户的交互。
10.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现根据权利要求9所述的方法的步骤。
CN202111368066.2A 2021-11-18 2021-11-18 一种基于耳戴式惯性传感器的智能设备交互系统 Pending CN114253397A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111368066.2A CN114253397A (zh) 2021-11-18 2021-11-18 一种基于耳戴式惯性传感器的智能设备交互系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111368066.2A CN114253397A (zh) 2021-11-18 2021-11-18 一种基于耳戴式惯性传感器的智能设备交互系统

Publications (1)

Publication Number Publication Date
CN114253397A true CN114253397A (zh) 2022-03-29

Family

ID=80792718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111368066.2A Pending CN114253397A (zh) 2021-11-18 2021-11-18 一种基于耳戴式惯性传感器的智能设备交互系统

Country Status (1)

Country Link
CN (1) CN114253397A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345627A (zh) * 2013-07-23 2013-10-09 清华大学 动作识别方法和装置
CN111258429A (zh) * 2020-01-20 2020-06-09 黎捷 一种用来控制电子设备的人机交互方法、系统和装置
CN111914709A (zh) * 2020-07-23 2020-11-10 河南大学 针对WiFi信号行为识别的基于深度学习的动作分割框架构建方法
US10921882B1 (en) * 2019-12-26 2021-02-16 Jie Li Human-machine interaction method, system and apparatus for controlling an electronic device
CN113138669A (zh) * 2021-04-27 2021-07-20 Oppo广东移动通信有限公司 电子设备的图像获取方法、装置、系统及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345627A (zh) * 2013-07-23 2013-10-09 清华大学 动作识别方法和装置
US10921882B1 (en) * 2019-12-26 2021-02-16 Jie Li Human-machine interaction method, system and apparatus for controlling an electronic device
CN111258429A (zh) * 2020-01-20 2020-06-09 黎捷 一种用来控制电子设备的人机交互方法、系统和装置
CN111914709A (zh) * 2020-07-23 2020-11-10 河南大学 针对WiFi信号行为识别的基于深度学习的动作分割框架构建方法
CN113138669A (zh) * 2021-04-27 2021-07-20 Oppo广东移动通信有限公司 电子设备的图像获取方法、装置、系统及电子设备

Similar Documents

Publication Publication Date Title
EP3616050B1 (en) Apparatus and method for voice command context
JP5323770B2 (ja) ユーザ指示取得装置、ユーザ指示取得プログラムおよびテレビ受像機
CN109637518A (zh) 虚拟主播实现方法及装置
EP3693966B1 (en) System and method for continuous privacy-preserved audio collection
US8793134B2 (en) System and method for integrating gesture and sound for controlling device
CN110326300B (zh) 信息处理设备、信息处理方法及计算机可读存储介质
JPWO2016103988A1 (ja) 情報処理装置、情報処理方法およびプログラム
WO2022142212A1 (zh) 一种手写识别方法、装置、电子设备及介质
KR20190074011A (ko) 음성 인식 장치 및 방법
CN107092882B (zh) 一种基于子动作感知的行为识别系统及其工作方法
CN108073572A (zh) 信息处理方法及其装置、同声翻译系统
WO2022095674A1 (zh) 用于操作移动设备的方法和装置
Yang et al. Proxitalk: Activate speech input by bringing smartphone to the mouth
CN111432245B (zh) 多媒体信息的播放控制方法、装置、设备及存储介质
EP4098182A1 (en) Machine-learning based gesture recognition with framework for adding user-customized gestures
KR20160133305A (ko) 제스쳐 인식 방법, 컴퓨팅 장치 및 제어 장치
CN111158487A (zh) 使用无线耳机与智能终端进行交互的人机交互方法
WO2022001791A1 (zh) 一种基于ppg信息的智能设备交互方法
CN113497912A (zh) 通过语音和视频定位的自动取景
CN114253397A (zh) 一种基于耳戴式惯性传感器的智能设备交互系统
KR20160011302A (ko) 글라스형 웨어러블 디바이스의 영상 또는 이미지 처리시스템 및 처리방법
NL2029031B1 (en) Nose-operated head-mounted device
CN115344111A (zh) 手势交互方法、系统和装置
Zhang et al. Lipwatch: Enabling Silent Speech Recognition on Smartwatches using Acoustic Sensing
CN111985252A (zh) 对话翻译方法及装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination