CN110110580B - 一种面向Wi-Fi信号的手语孤立词识别网络构建及分类方法 - Google Patents
一种面向Wi-Fi信号的手语孤立词识别网络构建及分类方法 Download PDFInfo
- Publication number
- CN110110580B CN110110580B CN201910185152.6A CN201910185152A CN110110580B CN 110110580 B CN110110580 B CN 110110580B CN 201910185152 A CN201910185152 A CN 201910185152A CN 110110580 B CN110110580 B CN 110110580B
- Authority
- CN
- China
- Prior art keywords
- amplitude information
- sign language
- isolated word
- window
- csi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000010276 construction Methods 0.000 title description 3
- 230000009471 action Effects 0.000 claims abstract description 202
- 230000007613 environmental effect Effects 0.000 claims abstract description 77
- 238000012545 processing Methods 0.000 claims abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 79
- 230000033001 locomotion Effects 0.000 claims description 38
- 238000013507 mapping Methods 0.000 claims description 31
- 230000009467 reduction Effects 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 24
- 238000000354 decomposition reaction Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 230000017105 transposition Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 abstract description 13
- 238000005516 engineering process Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Abstract
本发明提供了一种面向Wi‑Fi信号的手语孤立词识别网络构建及分类方法,公开了一种面向Wi‑Fi信号的手语孤立词识别网络的构建方法,包括:采集并处理CSI信号,得到去除环境影响的手语孤立词动作对应的振幅信息和图像;将去除环境影响的手语孤立词动作对应的振幅信息和图像输入到手语孤立词识别网络进行训练,得到训练好的手语孤立词识别网络;还公开了一种面向Wi‑Fi信号的手语孤立词分类方法,包括:采集处理CSI信号,并采用训练好的手语孤立词网络进行识别,得到待识别的手语孤立词动作的类别;本发明使用LSTM层网络提取时序特征;采用卷积神经网络提取图像特征,使用全连接层网络进行手语孤立词识别分类,能够有效提高手语孤立词识别的准确性和鲁棒性。
Description
技术领域
本发明属于手语识别技术领域,涉及一种手语孤立词识别技术,尤其涉及一种面向Wi-Fi信号的手语孤立词识别网络构建及分类方法。
背景技术
手语作为聋哑人之间交流的语言,其主要通过手部、手臂、以及身体的动作传递信息。手语孤立词识别作为一种特殊的手势识别问题,其相较于一般的手势识别问题,特殊性在于其类别众多且包含了多种肢体动作。就常用的手语词汇就达好几百种,且每一个词汇都是手臂、手指等多种肢体动作的混合,这就对分类识别技术提出了更高的要求。
目前手语孤立词识别技术,主要包括基于视频图像技术和基于穿戴式传感器技术,但是这些技术均存在一些局限性。基于视频图像技术的手语识别方法需要用户在光线充足且在摄像头的视野内,这就使得用户无法在熄灯等光线较暗的情况下使用,且摄像头的使用也容易侵犯用户的隐私。基于穿戴式传感器技术的手语识别方法则需要用户随时佩戴设备,给用户的日常生活会有不同程度的影响。而基于Wi-Fi的手语孤立词识别技术,可以有效地克服这些局限性。
近年来,基于Wi-Fi进行动作感知领域中,多使用传统的手工特征(如均值,方差,频域特征等)和传统的机器学习分类算法(如支持矢量机,SVM等)。虽然这些方法在简单的十几类的手势分类问题上已经达到了96%以上的成绩,但是在上百类的手语孤立词识别上识别率不高。
发明内容
针对现有技术中存在的基于Wi-Fi的手语孤立词识别率不高的缺点,本申请的目的在于,提供了一种面向Wi-Fi信号的手语孤立词识别网络构建及分类方法。
为了实现上述目的,本发明采取以下技术方案予以实现:
一种面向Wi-Fi信号的手语孤立词识别网络的构建方法,具体包括以下步骤:
步骤1、采集获取CSI信号,并对获取的CSI信号进行处理,得到降噪后的振幅信息,所述CSI表示信道状态信息;
其特征在于,还包括以下步骤:
步骤2、将降噪后的振幅信息按照窗口的大小进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;根据窗口的振幅信息序列中多个窗口的振幅信息,计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,根据窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值;由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成得到窗口的振幅信息方差的平均值序列;根据窗口的振幅信息方差的平均值序列中多个窗口的振幅信息方差的平均值的大小,判断得到手语孤立词片段对应的振幅信息;由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息;
步骤3、对得到的手语孤立词动作对应的振幅信息进行奇异值分解,得到去除环境影响的手语孤立词动作对应的振幅信息;对得到的去除环境影响的手语孤立词动作对应的的振幅信息进行映射处理,得到图像;
步骤4、由删除全连接层的VGG16网络、LSTM层网络和全连接层网络构成得到手语孤立词识别网络;采用手语孤立词识别网络对得到的图像和去除环境影响的手语孤立词动作对应的的振幅信息进行处理,得到一维输出向量;根据一维输出向量,采用交叉熵损失函数计算得到损失值;将得到的损失值输入到手语孤立词识别网络中,采用梯度下降算法对手语孤立词识别网络进行训练,得到训练好的手语孤立词识别网络。
进一步的,所述步骤2具体操作如下:
步骤2.1、采用0.2s的时间长度作为窗口大小,对降噪后的振幅信息进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;采用公式(2)计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值;
根据得到的窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,采用公式(3)计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值,由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成窗口的振幅信息方差的平均值序列;
其中,Var(i)表示第i个窗口的振幅信息方差的平均值,Var(i)≥0;N表示CSI流的总条数,k∈[1,K],n∈[1,N],N为正整数;Mean(i)n表示的第i个窗口的第n条CSI流振幅信息的均值,Mean(i)n>0;表示第i个窗口的第n条CSI流的第k个振幅信息,K表示一个窗口中的振幅信息总长度,K为正整数;
步骤2.2、设置方差阈值θ和动作停顿缓冲区最大时间长度Tp,其中θ和Tp均为正数;将窗口的振幅信息序列中的第一个窗口的振幅信息作为当前窗口的振幅信息;将窗口的振幅信息方差的平均值序列中第一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值;
步骤2.3、当当前窗口的振幅信息方差的平均值大于θ时,表示手语孤立词动作开始,将当前窗口的振幅信息作为手语孤立词片段对应的振幅信息,并设置动作停顿缓存区缓存区;并将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,执行步骤2.4;
当当前窗口的振幅信息方差的平均值小于θ时,并将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.3相同的操作;
步骤2.4、当当前窗口的振幅信息方差的平均值大于θ时,若动作停顿缓冲区为空时,将当前窗口的振幅信息作为手语孤立词片段对应的振幅信息;若动作停顿缓冲区不为空时,将动作停顿缓冲区中的振幅信息作为手语孤立片段对应的振幅信息,并将当前窗口的振幅信息作为手语孤立片段对应的振幅信息;将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.4相同的操作,直至最后一个窗口的振幅信息方差的平均值操作完成时结束;
当当前窗口的振幅信息方差的平均值小于θ时,则将当前窗口的振幅信息加入到动作停顿缓存区,当动作停顿缓冲区的时间长度小于Tp时,将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.4相同的操作,直至最后一个窗口的振幅信息方差的平均值操作完成时结束;当动作停顿缓冲区的时间长度大于Tp时,表示手语孤立词动作结束,删掉动作停顿缓冲区的振幅信息,执行步骤2.5;
步骤2.5、由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息。
进一步的,所述步骤3具体操作如下:
步骤3.1、采用公式(4)对得到的手语孤立词动作对应的振幅信息进行奇异值分解,得到矩阵S;将矩阵S中的最大奇异值设置为0,得到矩阵S’;根据矩阵S’,采用公式(5)计算得到去除环境影响的手语孤立词动作对应的振幅信息;
s=USVT (4)
其中,s表示手语孤立词动作对应的振幅信息,为信号流总数N×手语孤立词动作的长度L的矩阵;U为N*N的矩阵;S表示N*L的矩阵;V为L*L的矩阵;VT为V的转置;N和L均为正整数;
s'=US'VT (5)
其中,s’表示去除环境影响的手语孤立词动作对应的振幅信息,为信号流总数N×手语孤立词动作的长度L的矩阵;U为N*N的矩阵;S’为N*L的矩阵,N和L均为正整数;
步骤3.2、采用公式(6)将去除环境影响的手语孤立词动作对应的振幅信息映射为0-255之间的整数,得到多个映射整数,并按照采集CSI信号的天线对的顺序将多个映射整数对应到RGB三通道中,得到图像;
其中,gnl表示第n条CSI流的第i个振幅值经过映射后的值,gnl为正整数;s’nl表示第n条CSI流的第i个振幅值映射前的值,s’nl为正数;max(s')表示去除环境影响的手语孤立词动作对应的振幅信息中的最大振幅值,且max(s')为正数;min(s')表示去除环境影响的手语孤立词动作对应的振幅信息中的最小振幅值,且min(s')为正数;
进一步的,所述步骤4中由删除全连接层的VGG16网络、LSTM层网络和全连接层网络构成得到手语孤立词识别网络;采用手语孤立词识别网络对得到的图像和去除环境影响的手语孤立词动作对应的的振幅信息进行处理,得到一维输出向量,具体操作如下:
所述删除全连接层的VGG16网络为采用已知的ImageNet数据集预训练过的VGG16网络模型参数进行更新的网络;所述全连接层网络包括批正则化层和3个全连接层,所述3个全连接层之间分别设有Dropout层,所述批正则化层用于加快手语孤立词识别网络收敛;所述Dropout层用于避免手语孤立词识别网络产生过拟合;
采用所述删除全连接层的VGG16网络对图像进行计算,得到图像特征;采用所述LSTM层网络对去除环境影响的手语孤立词动作对应的振幅信息进行计算,得到时序特征;采用全连接层网络对得到的图像特征与时序特征整体进行融合,得到一维输出向量。
进一步的,所述步骤1具体操作如下:
步骤1.1、将Wi-Fi发送设备作为Wi-Fi发送端,将Wi-Fi接收设备作为Wi-Fi接收端,当用户在Wi-Fi发送端和Wi-Fi接收端之间做出已知手语孤立词动作时,Wi-Fi接收端按照Wi-Fi发送端与Wi-Fi接收端之间的天线对的顺序采集获取CSI信号;所述CSI信号为与手语孤立词相对应的CSI信号和不做手语孤立词动作时相对应的CSI信号;所述CSI信号包括3条天线对的信号,每条天线对有30个CSI流,总计90条CSI流;
步骤1.2、采用公式(1)计算得到CSI信号的振幅信息;采用巴特沃斯滤波器对得到的CSI信号的振幅信息进行降噪处理,得到降噪后的振幅信息;
A'=||H|| (1)
其中,A'表示CSI信号的振幅信息,为一个CSI流总数*采集CSI信号总长度的正数矩阵;H表示CSI信号,为CSI流总数*采集CSI信号总长度的复数矩阵。
一种面向Wi-Fi信号的手语孤立词分类方法,具体包括以下步骤:
步骤1、采集获取CSI信号,并对获取的CSI信号进行处理,得到降噪后的振幅信息;
还包括以下步骤:
步骤2、将降噪后的振幅信息按照窗口的大小进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;根据窗口的振幅信息序列中多个窗口的振幅信息,计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,根据窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值;由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成得到窗口的振幅信息方差的平均值序列;根据窗口的振幅信息方差的平均值序列中多个窗口的振幅信息方差的平均值的大小,判断得到手语孤立词片段对应的振幅信息;由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息;
步骤3、对得到的手语孤立词动作对应的振幅信息进行奇异值分解,得到去除环境影响的手语孤立词动作对应的振幅信息;对得到的去除环境影响的手语孤立词动作对应的振幅信息进行映射处理,得到图像;
步骤4、采用训练好的手语孤立词识别网络对得到的图像和去除环境影响的手语孤立词动作对应的振幅信息进行分类,得到待识别的手语孤立词动作的类别。
进一步的,所述步骤2具体操作如下:
步骤2.1、采用0.2s的时间长度作为窗口大小,对降噪后的振幅信息进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;采用公式(9)计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值;
根据得到的窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,采用公式(10)计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值;由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成窗口的振幅信息方差的平均值序列;
其中,Var(i)表示第i个窗口的振幅信息方差的平均值,Var(i)≥0;N表示CSI流的总条数,k∈[1,K],n∈[1,N],N为正整数;Mean(i)n表示的第i个窗口的第n条CSI流振幅信息的均值,Mean(i)n>0;表示第i个窗口的第n条CSI流的第k个振幅信息,K表示一个窗口中的振幅信息总长度,K为正整数;
步骤2.2、设置方差阈值θ和动作停顿缓冲区最大时间长度Tp,其中θ和Tp均为正数;将窗口的振幅信息序列中的第一个窗口的振幅信息作为当前窗口的振幅信息;将窗口的振幅信息方差的平均值序列中第一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值;
步骤2.3、当当前窗口的振幅信息方差的平均值大于θ时,表示手语孤立词动作开始,将当前窗口的振幅信息作为手语孤立词片段对应的振幅信息,并设置动作停顿缓存区缓存区;并将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,执行步骤2.4;
当当前窗口的振幅信息方差的平均值小于θ时,并将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复与执行步骤2.3相同的操作;
步骤2.4、当当前窗口的振幅信息方差的平均值大于θ时,若动作停顿缓冲区为空时,将当前窗口的振幅信息作为手语孤立词片段对应的振幅信息;若动作停顿缓冲区不为空时,将动作停顿缓冲区中的振幅信息作为手语孤立片段对应的振幅信息,并将当前窗口的振幅信息作为手语孤立片段对应的振幅信息;将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.4相同的操作,直至最后一个窗口的振幅信息方差的平均值操作完成时结束;
当当前窗口的振幅信息方差的平均值小于θ时,则将当前窗口的振幅信息加入到动作停顿缓存区,当动作停顿缓冲区的时间长度小于Tp时,将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.4相同的操作,直至最后一个窗口的振幅信息方差的平均值操作完成时结束;当动作停顿缓冲区的时间长度大于Tp时,表示手语孤立词动作结束,删掉动作停顿缓冲区的振幅信息,执行步骤2.5;
步骤2.5、由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息。
进一步的,所述步骤3具体操作如下:
步骤3.1、采用公式(11)对手语孤立词动作对应的振幅信息进行奇异值分解,得到矩阵S;将矩阵S中的最大奇异值设置为0,得到矩阵S’;根据矩阵S’,采用公式(12)计算得到去除环境影响的手语孤立词动作对应的振幅信息;
s=USVT (11)
其中,s表示手语孤立词动作对应的振幅信息,为信号流总数N×手语孤立词动作的长度L的矩阵;U为N*N的矩阵;S表示N*L的矩阵;V为L*L的矩阵;VT为V的转置;N和L均为正整数;
s'=US'VT (12)
其中,s’表示去除环境影响的手语孤立词动作对应的振幅信息,为信号流总数N×手语孤立词动作的长度L的矩阵;U为N*N的矩阵;S’为N*L的矩阵,N和L均为正整数;
步骤3.2、采用公式(13)将去除环境影响的手语孤立词动作对应的振幅信息映射为0-255之间的整数,得到多个映射整数,并按照采集CSI信号的天线对的顺序将多个映射整数对应到RGB三通道中,得到图像;
其中,gnl表示第n条CSI流的第i个振幅值经过映射后的值,gnl为正整数;s’nl表示第n条CSI流的第i个振幅值映射前的值,s’nl为正数;max(s')表示去除环境影响的手语孤立词动作对应的振幅信息中的最大振幅值,且max(s')为正数;min(s')表示去除环境影响的手语孤立词动作对应的振幅信息中的最小振幅值,且min(s')为正数。
进一步的,所述步骤4具体操作如下:
将得到的图像和去除环境影响的手语孤立词动作对应的振幅信息输入到训练好的手语孤立词识别网络,采用训练好的手语孤立词识别网络中的删除全连接层的VGG16网络对图像进行计算,得到图像特征;采用训练好的手语孤立词识别网络中的LSTM层网络对去除环境影响的手语孤立词动作对应的振幅信息进行计算,得到时序特征;采用训练好的手语孤立词识别网络中全连接层网络对得到的图像特征与时序特征进行融合,得到一维输出向量,所述一维输出向量中最大值所在的列数表示待识别的手语孤立词动作的类别,得到待识别的手语孤立词动作的类别。
进一步的,所述步骤1具体操作如下:
步骤1.1、将Wi-Fi发送设备作为Wi-Fi发送端,将Wi-Fi接收设备作为Wi-Fi接收端,当用户在Wi-Fi发送端和Wi-Fi接收端之间做出待识别的手语孤立词动作时,Wi-Fi接收端按照Wi-Fi发送端与Wi-Fi接收端之间的天线对的顺序采集获取CSI信号;所述CSI信号为与手语孤立词相对应的CSI信号和不做手语孤立词动作时相对应的CSI信号;所述CSI信号包括3条天线对的信号,每条天线对有30个CSI流,总计90条CSI流;
步骤1.2、采用公式(8)计算得到CSI信号的振幅信息;采用巴特沃斯滤波器对得到的CSI信号的振幅信息进行降噪处理,得到降噪后的振幅信息;
A'=||H|| (8)
其中,A'表示CSI信号的振幅信息,为一个CSI流总数*采集CSI信号总长度的正数矩阵;H表示CSI信号,为CSI流总数*采集CSI信号总长度的复数矩阵。
与现有技术相比,本发明的有益效果如下:
1、本发明提供了一种面向Wi-Fi信号的手语孤立词识别网络的构建方法,使用卷积神经网络提取图像特征,使用LSTM层网络提取时序特征;最终将卷积神经网络的图像特征和时序特征进行融合,使用全连接层网络进行手语孤立词识别分类,并通过对手语孤立词识别网络进行训练,得到手语孤立词识别网络,能够有效提高手语孤立词识别的准确性和鲁棒性。
2、本发明提供了一种面向Wi-Fi信号的手语孤立词分类方法,基于Wi-Fi信号,克服了随时佩戴设备与易侵犯隐私的局限性;采用训练好的手语孤立词识别网络,使用卷积神经网络提取图像特征,使用LSTM层网络提取时序特征;最终将卷积神经网络的图像特征和时序特征进行融合,使用全连接层网络进行手语孤立词识别分类,有效提高了手语孤立词识别的准确性和鲁棒性。
附图说明
图1是本发明的流程图;
图2是CSI信号的振幅信息的示意图;
图3是降噪后的振幅信息的示意图;
图4是划分窗口的示意图;
图5是分割手语孤立词动作的示意图;其中图a为窗口振幅信息方差平均值序列的示意图;图b为手语孤立词动作的示意图;
图6是去除环境影响的手语孤立词动作对应的振幅信息转换为图像的示意图;
图7是手语孤立词识别网络的结构图;
图8是采用5折交叉法的结果对比图。
具体实施方式
如图1-7所示,本发明一种面向Wi-Fi信号的手语孤立词识别深度网络构建方法,具体包含以下步骤:
步骤1、采集获取CSI信号;并对获取的CSI信号进行处理,得到降噪后的振幅信息;所述CSI表示信道状态信息;
步骤2、将降噪后的振幅信息按照窗口的大小进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;根据窗口的振幅信息序列中多个窗口的振幅信息,计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,根据窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值;由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成得到窗口的振幅信息方差的平均值序列;根据窗口的振幅信息方差的平均值序列中多个窗口的振幅信息方差的平均值的大小,判断得到手语孤立词片段对应的振幅信息;由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息;
步骤3、对得到的手语孤立词动作对应的振幅信息进行奇异值分解,得到去除环境影响的手语孤立词动作对应的振幅信息;对得到的去除环境影响的手语孤立词动作对应的振幅信息进行映射处理,得到图像;
步骤4、由删除全连接层的VGG16网络、LSTM层网络和全连接层网络构成得到手语孤立词识别网络;采用手语孤立词识别网络对得到的图像和去除环境影响的手语孤立词动作对应的的振幅信息进行处理,得到一维输出向量;根据一维输出向量,采用交叉熵损失函数计算得到损失值;将得到的损失值输入到手语孤立词识别网络中,采用梯度下降算法对手语孤立词识别网络进行训练,得到训练好的手语孤立词识别网络。
本发明在构建手语孤立词识别网络时,使用卷积神经网络提取图像特征,使用LSTM层网络提取时序特征;最终将卷积神经网络的图像特征和时序特征进行融合,使用全连接层网络进行手语孤立词识别分类,并通过对手语孤立词识别网络进行训练,得到训练好的手语孤立词识别网络,有效提高手语孤立词动作识别的准确性和鲁棒性。
具体的,步骤1的具体操作如下:
步骤1.1、将Wi-Fi发送设备作为Wi-Fi发送端,将Wi-Fi接收设备作为Wi-Fi接收端,当用户在Wi-Fi发送端和Wi-Fi接收端之间做出已知手语孤立词动作时,Wi-Fi接收端按照Wi-Fi发送端与Wi-Fi接收端之间的天线对的顺序采集获取CSI信号;所述CSI信号为与手语孤立词相对应的CSI信号和不做手语孤立词动作时相对应的CSI信号;所述CSI信号包括3条天线对的信号,每条天线对有30个CSI流,总计90条CSI流;
步骤1.2、采用公式(1)计算得到CSI信号的振幅信息A';采用巴特沃斯滤波器对得到的CSI信号的振幅信息A'进行降噪处理,得到降噪后的振幅信息A;
A'=||H|| (1)
其中,A'表示CSI信号的振幅信息,为一个CSI流总数*采集CSI信号总长度的正数矩阵;H表示CSI信号,为CSI流总数*采集CSI信号总长度的复数矩阵;
该方式中由于CSI信号中包含很多高频噪声,需要对CSI信号的振幅信息进行降噪处理,得到降噪后的振幅信息。
具体的,步骤2的具体操作如下:
步骤2.1,采用0.2s的时间长度作为窗口大小,对降噪后的振幅信息A进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;采用公式(2)计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值;由于采集的CSI信号长度大多数情况下不能被窗口大小整除,所以最后一个窗口会和之前窗口的长度不同,但这并不影响分割算法的效果。
根据得到的窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,采用公式(3)计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值;由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成窗口的振幅信息方差的平均值序列;
其中,Var(i)表示第i个窗口的振幅信息方差的平均值,Var(i)≥0;N表示CSI流的总条数,k∈[1,K],n∈[1,N],N为正整数;Mean(i)n表示的第i个窗口的第n条CSI流振幅信息的均值,Mean(i)n>0;表示第i个窗口的第n条CSI流的第k个振幅信息,K表示一个窗口中的振幅信息总长度,K为正整数;
步骤2.2,设置方差阈值θ和动作停顿缓冲区最大时间长度Tp,其中θ和Tp均为正数;将窗口的振幅信息序列中的第一个窗口的振幅信息作为当前窗口的振幅信息;将窗口的振幅信息方差的平均值序列中第一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值;
步骤2.3,当当前窗口的振幅信息方差的平均值大于θ时,表示手语孤立词动作开始,将当前窗口的振幅信息作为手语孤立词片段对应的振幅信息,并设置动作停顿缓存区缓存区;并将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,执行步骤2.4;
当当前窗口的振幅信息方差的平均值小于θ时,并将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.3相同的操作;
步骤2.4,当当前窗口的振幅信息方差的平均值大于θ时,若动作停顿缓冲区为空时,将当前窗口的振幅信息作为手语孤立词片段对应的振幅信息;若动作停顿缓冲区不为空时,将动作停顿缓冲区中的振幅信息作为手语孤立片段对应的振幅信息,并将当前窗口的振幅信息作为手语孤立片段对应的振幅信息;将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.4相同的操作,直至最后一个窗口的振幅信息方差的平均值操作完成时结束;
当当前窗口的振幅信息方差的平均值小于θ时,则将当前窗口的振幅信息加入到动作停顿缓存区,当动作停顿缓冲区的时间长度小于Tp时,将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.4相同的操作,直至最后一个窗口的振幅信息方差的平均值操作完成时结束;当动作停顿缓冲区的时间长度大于Tp时,表示手语孤立词动作结束,删掉动作停顿缓冲区的振幅信息,执行步骤2.5;
步骤2.5,由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息。
实际采集时,无法精确获取手语孤立词动作,因此获取的CSI信号包括与手语孤立词相对应的CSI信号和不做手语孤立词动作时相对应的CSI信号,通过分割算法得到手语孤立词动作对应的振幅信息;
由于用户在做手语孤立词动作的时会出现短暂停顿,这些停顿会使振幅方差变小而小于阈值,当直接使用方差阈值分割动作时便会得到不完整的手语孤立词动作片段,因此本发明引入动作停顿缓冲区机制解决此问题。
具体的,步骤3的具体操作如下:
步骤3.1、采用公式(4)对手语孤立词动作对应的振幅信息进行奇异值分解,得到矩阵S;将矩阵S中最大奇异值设置为0,得到的矩阵S’;根据矩阵S’,采用公式(5)计算得到去除环境影响的手语孤立词动作对应的振幅信息;
s=USVT (4)
其中,s表示手语孤立词动作对应的振幅信息,为信号流总数N×手语孤立词动作的长度L的矩阵;U为N*N的矩阵;S表示N*L的矩阵;V为L*L的矩阵;VT为V的转置;N和L均为正整数;
s'=US'VT (5)
其中,s’表示去除环境影响的手语孤立词动作对应的振幅信息,为信号流总数N×手语孤立词动作的长度L的矩阵;U为N*N的矩阵;S’为N*L的矩阵,N和L均为正整数;
步骤3.2、采用公式(6)将去除环境影响的手语孤立词动作对应的振幅信息映射为0-255之间的整数,得到多个映射整数,按照采集CSI信号的天线对的顺序将多个映射整数对应到RGB三通道中,得到图像;所述RGB表示代表红、绿和蓝三个通道的颜色;
其中,gnl表示第n条CSI流的第i个振幅值经过映射后的值,gnl为正整数;s’nl表示第n条CSI流的第i个振幅值映射前的值,s’nl为正数;max(s')表示去除环境影响的手语孤立词动作对应的振幅信息中的最大振幅值,且max(s')为正数;min(s')表示去除环境影响的手语孤立词动作对应的振幅信息中的最小振幅值,且min(s')为正数;
步骤3.3、重复执行与步骤1-3.2相同的操作多次,得到多个CSI信号对应的图像和除环境影响的手语孤立词动作对应的的振幅信息;将得到的多个CSI信号进行划分,得到多批CSI信号;根据多批CSI信号,将得到的多个CSI信号对应的图像和除环境影响的手语孤立词动作对应的的振幅信息进行划分并编号,得到多批CSI信号对应的图像和去除环境影响的手语孤立词动作对应的的振幅信息;将第一批CSI信号对应的图像和去除环境影响的手语孤立词动作对应的的振幅信息作为当前输入数据。
由于本发明中的卷积神经网络输入格式需为RGB图片格式,且手语孤立词动作是一个浮点数矩阵,需要将去出环境影响的手语孤立词动作对应的振幅信息映射为0-255之间的整数,并转化为RGB图片格式。
具体的,步骤4的具体操作如下:
将当前输入数据输入到手语孤立词识别网络中,所述的手语孤立词识别网络包括删除全连接层的VGG16网络、LSTM层网络与全连接层网络,所述删除全连接层的VGG16网络为采用已知的ImageNet数据集预训练过的VGG16网络模型参数进行更新的网络;所述全连接层网络包括批正则化层和3个全连接层,所述3个全连接层之间分别设有Dropout层;所述批正则化层用于加快手语孤立词识别网络收敛;所述Dropout层用于避免手语孤立词识别网络产生过拟合;
所述VGG16网络为2014年牛津大学视觉几何组提出的一种卷积神经网络;所述LSTM层网络表示长短期记忆层网络;
采用所述删除全连接层的VGG16网络分别对当前输入数据的多个图像进行计算,得到多个图像特征;采用所述LSTM层网络分别对当前输入数据的多个去除环境影响的手语孤立词动作对应的振幅信息进行计算,得到多个时序特征;采用全连接层网络分别对得到的多个图像特征与多个时序特征中每个图像特征和时序特征整体进行融合,得到多个一维输出向量;
采用公式(7)即交叉熵损失函数计算损失值:
其中,L表示损失值,且L>0;i表示包含当前输入数据信息的第i个CSI信号;且1≤i≤M,M表示包含当前输入数据信息的CSI信号的数量,且为正整数;K表示待识别的类别个数,且为正整数;yi表示包含当前输入数据信息的CSI信号中第i个CSI信号的one-hot编码的类别标签,且为一个长度为K的一维向量;表示yi向量中的第k个值,为0或1;表示包含当前输入信息信息的第i个CSI信号的一维输出向量,且长度为K;表示向量的第k维值,且
步骤4.2、将得到的损失值输入到手语孤立词识别网络中,采用梯度下降算法对手语孤立词识别网络进行调整,得到新的手语孤立词识别网络;将新的手语孤立词识别网络作为手语孤立词识别网络,按照编号的顺序依次将当前输入数据的下一批CSI信号对应的图像和去除环境影响的手语孤立词动作对应的的振幅信息作为当前输入数据,重复执行与步骤4.1-4.2相同的操作多次,得到多个损失值和新的手语孤立词识别网络,直至得到的多个损失值收敛时操作结束;将新的手语孤立词识别网络作为训练好的手语孤立词识别网络。
在实际应用中,为了防止梯度爆炸和过拟合现象,需要全连接层网络中的全连接层前加入批正则化层,并在全连接层中的各层之间分别加入Dropout层。在训练手语孤立词识别深度网络时,为了在少量样本的情况下可以使用深度网络提取特征且不出现严重的过拟合现象,需要对手语孤立词识别深度网络进行训练,得到训练好的手语孤立词识别深度网络。
本发明提供了一种面向Wi-Fi信号的深度网络手语孤立词识别方法,具体包括以下步骤:
步骤1、采集获取CSI信号,并对获取的CSI信号进行处理,得到降噪后的振幅信息;
步骤2、将降噪后的振幅信息按照窗口的大小进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;根据窗口的振幅信息序列中多个窗口的振幅信息,计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,根据窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值;由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成得到窗口的振幅信息方差的平均值序列;根据窗口的振幅信息方差的平均值序列中多个窗口的振幅信息方差的平均值的大小,判断得到手语孤立词片段对应的振幅信息;由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息;
步骤3、对得到的手语孤立词动作对应的振幅信息进行奇异值分解,得到去除环境影响的手语孤立词动作对应的振幅信息;对得到的去除环境影响的手语孤立词动作对应的振幅信息进行映射处理,得到图像;
步骤4、采用训练好的手语孤立词识别网络对得到的图像和去除环境影响的手语孤立词动作对应的振幅信息进行分类,得到待识别的手语孤立词动作的类别。
本发明基于Wi-Fi信号,克服了随时佩戴设备与易侵犯隐私的局限性,采用训练好的手语孤立词识别网络,使用卷积神经网络提取图像特征,使用LSTM层网络提取时序特征;最终将卷积神经网络的图像特征和时序特征进行融合,使用全连接层网络进行手语孤立词识别分类,有效提高手语孤立词识别的准确性和鲁棒性。
具体的,步骤1的具体操作如下:
步骤1.1、将Wi-Fi发送设备作为Wi-Fi发送端,将Wi-Fi接收设备作为Wi-Fi接收端,当用户在Wi-Fi发送端和Wi-Fi接收端之间做出待识别的手语孤立词动作时,Wi-Fi接收端按照Wi-Fi发送端与Wi-Fi接收端之间的天线对的顺序采集获取CSI信号;所述CSI信号为与手语孤立词相对应的CSI信号和不做手语孤立词动作时相对应的CSI信号;所述CSI信号包括3条天线对的信号,每条天线对有30个CSI流,总计90条CSI流;
步骤1.2、采用公式(8)计算得到CSI信号的振幅信息A';采用巴特沃斯滤波器对得到的CSI信号的振幅信息A'进行降噪处理,得到降噪后的振幅信息A;
A'=||H|| (8)
其中,A'表示CSI信号的振幅信息,为一个CSI流总数*采集CSI信号总长度的正数矩阵;H表示CSI信号,为CSI流总数*采集CSI信号总长度的复数矩阵;
该方式中由于CSI信号中包含很多高频噪声,需要对CSI信号的振幅信息进行降噪处理,得到降噪后的振幅信息。
具体的,步骤2的具体操作如下:
步骤2.1,采用0.2s的时间长度作为窗口大小,对降噪后的振幅信息A进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;采用公式(9)计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值;由于采集的CSI信号长度大多数情况下不能被窗口大小整除,所以最后一个窗口会和之前窗口的长度不同,但这并不影响分割算法的效果。
根据得到的窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,采用公式(10)计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值;由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成窗口的振幅信息方差的平均值序列;
其中,Var(i)表示第i个窗口的振幅信息方差的平均值,Var(i)≥0;N表示CSI流的总条数,k∈[1,K],n∈[1,N],N为正整数;Mean(i)n表示的第i个窗口的第n条CSI流振幅信息的均值,Mean(i)n>0;表示第i个窗口的第n条CSI流的第k个振幅信息,K表示一个窗口中的振幅信息总长度,K为正整数;
步骤2.2,设置方差阈值θ和动作停顿缓冲区最大时间长度Tp,其中θ和Tp均为正数;将窗口的振幅信息序列中的第一个窗口的振幅信息作为当前窗口的振幅信息;将窗口的振幅信息方差的平均值序列中第一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值;
步骤2.3,当当前窗口的振幅信息方差的平均值大于θ时,表示手语孤立词动作开始,将当前窗口的振幅信息作为手语孤立词片段对应的振幅信息,并设置动作停顿缓存区缓存区;并将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,执行步骤2.4;
当当前窗口的振幅信息方差的平均值小于θ时,并将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.3相同的操作;
步骤2.4,当当前窗口的振幅信息方差的平均值大于θ时,若动作停顿缓冲区为空时,将当前窗口的振幅信息作为手语孤立词片段对应的振幅信息;若动作停顿缓冲区不为空时,将动作停顿缓冲区中的振幅信息作为手语孤立片段对应的振幅信息,并将当前窗口的振幅信息作为手语孤立片段对应的振幅信息;将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.4相同的操作,直至最后一个窗口的振幅信息方差的平均值操作完成时结束;
当当前窗口的振幅信息方差的平均值小于θ时,则将当前窗口的振幅信息加入到动作停顿缓存区,当动作停顿缓冲区的时间长度小于Tp时,将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.4相同的操作,直至最后一个窗口的振幅信息方差的平均值操作完成时结束;当动作停顿缓冲区的时间长度大于Tp时,表示手语孤立词动作结束,删掉动作停顿缓冲区的振幅信息,执行步骤2.5;
步骤2.5,由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息。
实际采集时,无法精确获取手语孤立词动作,因此获取的CSI信号包括与手语孤立词动作相对应的CSI信号和不做手语孤立词动作时相对应的CSI信号,通过分割方法得到手语孤立词动作对应的振幅信息;
由于用户在做手语孤立词动作的时会出现短暂停顿,这些停顿会使振幅方差变小而小于阈值,当直接使用方差阈值分割手语孤立词动作时便会得到不完整的手语孤立词动作,因此本发明引入动作停顿缓冲区机制解决此问题。
具体的,步骤3的具体操作如下:
步骤3.1、采用公式(11)对手语孤立词动作对应的振幅信息进行奇异值分解,得到矩阵S;将矩阵S中最大奇异值设置为0,得到的矩阵S’;根据矩阵S’,采用公式(12)计算得到去除环境影响的手语孤立词动作对应的振幅信息;
s=USVT (11)
其中,s表示手语孤立词动作对应的振幅信息,为信号流总数N×手语孤立词动作的长度L的矩阵;U为N*N的矩阵;S表示N*L的矩阵;V为L*L的矩阵;VT为V的转置;N和L均为正整数;
s'=US'VT (12)
其中,s’表示去除环境影响的手语孤立词动作对应的振幅信息,为信号流总数N×手语孤立词动作的长度L的矩阵;U为N*N的矩阵;S’为N*L的矩阵,N和L均为正整数;
步骤3.2、采用公式(13)将去除环境影响的手语孤立词动作对应的振幅信息映射为0-255之间的整数,得到多个映射整数,并按照采集CSI信号的天线对的顺序将多个映射整数对应到RGB三通道中,得到图像;所述RGB表示代表红、绿和蓝三个通道的颜色;
其中,gnl表示第n条CSI流的第i个振幅值经过映射后的值,gnl为正整数;s’nl表示第n条CSI流的第i个振幅值映射前的值,s’nl为正数;max(s')表示去除环境影响的手语孤立词动作对应的振幅信息中的最大振幅值,且max(s')为正数;min(s')表示去除环境影响的手语孤立词动作对应的振幅信息中的最小振幅值,且min(s')为正数;
由于本发明中的卷积神经网络输入格式需为RGB图片格式,且手语孤立词动作是一个浮点数矩阵,需要将去出环境影响的手语孤立词动作对应的振幅信息映射为0-255之间的整数,并转化为RGB图片格式。
具体的,步骤4的具体操作如下:
将得到的图像和去除环境影响的手语孤立词动作对应的振幅信息输入到训练好的手语孤立词识别网络,采用训练好的手语孤立词识别网络中的删除全连接层的VGG16网络对图像进行计算,得到图像特征;采用训练好的手语孤立词识别网络中的LSTM层网络对去除环境影响的手语孤立词动作对应的振幅信息进行计算,得到时序特征;采用训练好的手语孤立词识别网络中全连接层网络对得到的图像特征与时序特征进行融合,得到一维输出向量,所述一维输出向量中最大值所在的列数表示待识别的手语孤立词动作的类别,得到待识别的手语孤立词动作的类别。
由于手语孤立词本身具有时序性,相同的肢体动作不同的顺序可能代表不同的含义,因此时序信息在识别过程中也是相当重要的,为了获取这些时序上的信息,本发明使用LSTM层网络提取时序特征;最终将卷积神经网络的图像特征和时序特征进行融合,使用全连接层网络进行手语孤立词识别分类,实现手语孤立词动作的识别;本发明基于Wi-Fi信号,克服了随时佩戴设备与易侵犯隐私的局限性,并对少量样本能够很好的进行手语孤立词动作的识别,能够有效提高手语孤立词识别的准确性和鲁棒性。
实施例
本实验中,在场景复杂的会议室中架设CSI信号采集设备,使用商用Wi-Fi路由器作为发送端,携带iwl5300的电脑作为接收端,且接收端需要安装特定的网卡驱动(linux-80211n-csitool-supplementary)以便获取CSI信号,当用户在Wi-Fi发送端和Wi-Fi接收端之间做出手语孤立词动作时,Wi-Fi接收端的电脑便可获取CSI信号;设置信号的采样率为100Hz。根据信号的采样率决定划分窗口的大小,一般设置为采样率*0.2,即窗口的时间长度为0.2秒;根据得到的窗口方差序列,一般情况下手语孤立词片段的方差会大于方差最大值的0.3倍,因此取方差阈值为方差峰值的0.3倍;实验中采集的数据包含100个常用手语动作,每类采集10个样本,总计1000个样本;实验中每批输入到手语孤立词识别网络中的样本的数量为64;
具体操作如下:
步骤1、当用户在Wi-Fi发送端和Wi-Fi接收端之间做出手语孤立词动作时,Wi-Fi接收端按照Wi-Fi发送端与Wi-Fi接收端之间的天线对的顺序采集获取CSI信号;并对获取的CSI信号进行降噪处理,得到降噪后的振幅信息A;
步骤2、将降噪后的振幅信息按照窗口的大小进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;根据得到的窗口的振幅信息序列中多个窗口的振幅信息,计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,根据窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值;由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成得到窗口的振幅信息方差的平均值序列;根据窗口的振幅信息方差的平均值序列中多个窗口的振幅信息方差的平均值的大小,判断得到手语孤立词片段对应的振幅信息;由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息;
步骤3、根据得到的手语孤立词动作对应的振幅信息,得到去除环境影响的手语孤立词动作对应的的振幅信息,并将去除环境影响的手语孤立词动作对应的的振幅信息进行映射处理,在RGB三通道中得到图像;重复执行与步骤1-3相同的操作多次,得到多个CSI信号、图像和除环境影响的手语孤立词动作对应的的振幅信息;将获取的CSI信号进行划分并编号,得到多批CSI信号对应的图像和去除环境影响的手语孤立词动作对应的的振幅信息;将第一批CSI信号对应的图像和去除环境影响的手语孤立词动作对应的的振幅信息作为当前输入数据;
步骤4、采用由删除全连接层的VGG16网络、LSTM层网络与全连接层网络构成的手语孤立词识别网络对当前输入数据进行处理,得到多个一维输出向量;根据多个一维输出向量,采用交叉熵损失函数计算得到损失值,将损失值输入到手语孤立词识别网络中,采用梯度下降算法对手语孤立词识别网络进行调整,得到新的手语孤立词网络;按照编号的顺序依次将当前输入数据的下一批CSI信号对应的图像和去除环境影响的手语孤立词动作对应的的振幅信息作为当前输入数据,将得到新的手语孤立词识别网络作为手语孤立词识别网络,重复执行与步骤4相同的操作多次,得到多个损失值和新的手语孤立词识别网络,直至得到的多个损失值收敛时操作结束;将新的手语孤立词识别网络作为训练好的手语孤立词识别网络,得到训练好的手语孤立词识别网络。
步骤5、采集并处理待识别的CSI信号,得到图像和去除环境影响的手语孤立词动作对应的振幅信息,将得到的图像和去除环境影响的手语孤立词动作对应的振幅信息输入到训练好的手语孤立词识别深度网络中进行融合,得到待识别的手语孤立词动作的类别。
本发明使用5折交叉法在所述采集的数据集上进行实验,实验结果如图8所示,其中第1折、第2折、第3折、第4折的识别准确率与5折的平均识别准确率均高于2018年提出的SignFi方法,平均识别准确率达到了98.6%,平均识别错误率仅为1.4%,相比于SignFi方法,错误率降低了53%。
Claims (9)
1.一种面向Wi-Fi信号的手语孤立词识别网络的构建方法,具体包括以下步骤:
步骤1、采集获取CSI信号,并对获取的CSI信号进行处理,得到降噪后的振幅信息,所述CSI表示信道状态信息;
其特征在于,还包括以下步骤:
步骤2、将降噪后的振幅信息按照窗口的大小进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;根据窗口的振幅信息序列中多个窗口的振幅信息,计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,根据窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值;由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成得到窗口的振幅信息方差的平均值序列;根据窗口的振幅信息方差的平均值序列中多个窗口的振幅信息方差的平均值的大小,判断得到手语孤立词片段对应的振幅信息;由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息;
步骤3、对得到的手语孤立词动作对应的振幅信息进行奇异值分解,得到去除环境影响的手语孤立词动作对应的振幅信息;对得到的去除环境影响的手语孤立词动作对应的的振幅信息进行映射处理,得到图像;
步骤4、由删除全连接层的VGG16网络、LSTM层网络和全连接层网络构成得到手语孤立词识别网络;采用手语孤立词识别网络对得到的图像和去除环境影响的手语孤立词动作对应的的振幅信息进行处理,得到一维输出向量;根据一维输出向量,采用交叉熵损失函数计算得到损失值;将得到的损失值输入到手语孤立词识别网络中,采用梯度下降算法对手语孤立词识别网络进行训练,得到训练好的手语孤立词识别网络。
2.如权利要求1所述的面向Wi-Fi信号的手语孤立词识别网络的构建方法,其特征在于,所述步骤2具体操作如下:
步骤2.1、采用0.2s的时间长度作为窗口大小,对降噪后的振幅信息进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;采用公式(2)计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值;
其中,Mean(i)n表示的第i个窗口的第n条CSI流振幅信息的均值,Mean(i)n>0;表示第i个窗口的第n条CSI流的第k个振幅信息,K表示一个窗口中的振幅信息总长度,K为正整数;
根据得到的窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,采用公式(3)计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值,由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成窗口的振幅信息方差的平均值序列;
其中,Var(i)表示第i个窗口的振幅信息方差的平均值,Var(i)≥0;N表示CSI流的总条数,k∈[1,K],n∈[1,N],N为正整数;Mean(i)n表示的第i个窗口的第n条CSI流振幅信息的均值,Mean(i)n>0;表示第i个窗口的第n条CSI流的第k个振幅信息,K表示一个窗口中的振幅信息总长度,K为正整数;
步骤2.2、设置方差阈值θ和动作停顿缓冲区最大时间长度Tp,其中θ和Tp均为正数;将窗口的振幅信息序列中的第一个窗口的振幅信息作为当前窗口的振幅信息;将窗口的振幅信息方差的平均值序列中第一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值;
步骤2.3、当当前窗口的振幅信息方差的平均值大于θ时,表示手语孤立词动作开始,将当前窗口的振幅信息作为手语孤立词片段对应的振幅信息,并设置动作停顿缓存区缓存区;并将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,执行步骤2.4;
当当前窗口的振幅信息方差的平均值小于θ时,并将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.3相同的操作;
步骤2.4、当当前窗口的振幅信息方差的平均值大于θ时,若动作停顿缓冲区为空时,将当前窗口的振幅信息作为手语孤立词片段对应的振幅信息;若动作停顿缓冲区不为空时,将动作停顿缓冲区中的振幅信息作为手语孤立片段对应的振幅信息,并将当前窗口的振幅信息作为手语孤立片段对应的振幅信息;将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.4相同的操作,直至最后一个窗口的振幅信息方差的平均值操作完成时结束;
当当前窗口的振幅信息方差的平均值小于θ时,则将当前窗口的振幅信息加入到动作停顿缓存区,当动作停顿缓冲区的时间长度小于Tp时,将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.4相同的操作,直至最后一个窗口的振幅信息方差的平均值操作完成时结束;当动作停顿缓冲区的时间长度大于Tp时,表示手语孤立词动作结束,删掉动作停顿缓冲区的振幅信息,执行步骤2.5;
步骤2.5、由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息。
3.如权利要求1所述的面向Wi-Fi信号的手语孤立词识别网络的构建方法,其特征在于,所述步骤3具体操作如下:
步骤3.1、采用公式(4)对得到的手语孤立词动作对应的振幅信息进行奇异值分解,得到矩阵S;将矩阵S中的最大奇异值设置为0,得到矩阵S’;根据矩阵S’,采用公式(5)计算得到去除环境影响的手语孤立词动作对应的振幅信息;
s=USVT (4)
其中,s表示手语孤立词动作对应的振幅信息,为信号流总数N×手语孤立词动作的长度L的矩阵;U为N*N的矩阵;S表示N*L的矩阵;V为L*L的矩阵;VT为V的转置;N和L均为正整数;
s'=US'VT (5)
其中,s’表示去除环境影响的手语孤立词动作对应的振幅信息,为信号流总数N×手语孤立词动作的长度L的矩阵;U为N*N的矩阵;S’为N*L的矩阵,N和L均为正整数;
步骤3.2、采用公式(6)将去除环境影响的手语孤立词动作对应的振幅信息映射为0-255之间的整数,得到多个映射整数,并按照采集CSI信号的天线对的顺序将多个映射整数对应到RGB三通道中,得到图像;
其中,gnl表示第n条CSI流的第i个振幅值经过映射后的值,gnl为正整数;s′nl表示第n条CSI流的第i个振幅值映射前的值,s′nl为正数;max(s')表示去除环境影响的手语孤立词动作对应的振幅信息中的最大振幅值,且max(s')为正数;min(s')表示去除环境影响的手语孤立词动作对应的振幅信息中的最小振幅值,且min(s')为正数。
4.如权利要求1所述的面向Wi-Fi信号的手语孤立词识别网络的构建方法,其特征在于,所述步骤4中由删除全连接层的VGG16网络、LSTM层网络和全连接层网络构成得到手语孤立词识别网络;采用手语孤立词识别网络对得到的图像和去除环境影响的手语孤立词动作对应的的振幅信息进行处理,得到一维输出向量,具体操作如下:
所述删除全连接层的VGG16网络为采用已知的ImageNet数据集预训练过的VGG16网络模型参数进行更新的网络;所述全连接层网络包括批正则化层和3个全连接层,所述3个全连接层之间分别设有Dropout层,所述批正则化层用于加快手语孤立词识别网络收敛;所述Dropout层用于避免手语孤立词识别网络产生过拟合;
采用所述删除全连接层的VGG16网络对图像进行计算,得到图像特征;采用所述LSTM层网络对去除环境影响的手语孤立词动作对应的振幅信息进行计算,得到时序特征;采用全连接层网络对得到的图像特征与时序特征整体进行融合,得到一维输出向量。
5.如权利要求1所述的面向Wi-Fi信号的手语孤立词识别网络的构建方法,其特征在于,所述步骤1具体操作如下:
步骤1.1、将Wi-Fi发送设备作为Wi-Fi发送端,将Wi-Fi接收设备作为Wi-Fi接收端,当用户在Wi-Fi发送端和Wi-Fi接收端之间做出已知手语孤立词动作时,Wi-Fi接收端按照Wi-Fi发送端与Wi-Fi接收端之间的天线对的顺序采集获取CSI信号;所述CSI信号为与手语孤立词相对应的CSI信号和不做手语孤立词动作时相对应的CSI信号;所述CSI信号包括3条天线对的信号,每条天线对有30个CSI流,总计90条CSI流;
步骤1.2、采用公式(1)计算得到CSI信号的振幅信息;采用巴特沃斯滤波器对得到的CSI信号的振幅信息进行降噪处理,得到降噪后的振幅信息;
A'=||H|| (1)
其中,A'表示CSI信号的振幅信息,为一个CSI流总数*采集CSI信号总长度的正数矩阵;H表示CSI信号,为CSI流总数*采集CSI信号总长度的复数矩阵。
6.一种面向Wi-Fi信号的手语孤立词分类方法,具体包括以下步骤:
步骤1、采集获取CSI信号,并对获取的CSI信号进行处理,得到降噪后的振幅信息;
其特征在于,还包括以下步骤:
步骤2、将降噪后的振幅信息按照窗口的大小进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;根据窗口的振幅信息序列中多个窗口的振幅信息,计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,根据窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值;由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成得到窗口的振幅信息方差的平均值序列;根据窗口的振幅信息方差的平均值序列中多个窗口的振幅信息方差的平均值的大小,判断得到手语孤立词片段对应的振幅信息;由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息;
步骤3、对得到的手语孤立词动作对应的振幅信息进行奇异值分解,得到去除环境影响的手语孤立词动作对应的振幅信息;对得到的去除环境影响的手语孤立词动作对应的振幅信息进行映射处理,得到图像;
步骤4、采用训练好的手语孤立词识别网络对得到的图像和去除环境影响的手语孤立词动作对应的振幅信息进行分类,得到待识别的手语孤立词动作的类别,具体操作如下:将得到的图像和去除环境影响的手语孤立词动作对应的振幅信息输入到训练好的手语孤立词识别网络,采用训练好的手语孤立词识别网络中的删除全连接层的VGG16网络对图像进行计算,得到图像特征;采用训练好的手语孤立词识别网络中的LSTM层网络对去除环境影响的手语孤立词动作对应的振幅信息进行计算,得到时序特征;采用训练好的手语孤立词识别网络中全连接层网络对得到的图像特征与时序特征进行融合,得到一维输出向量,所述一维输出向量中最大值所在的列数表示待识别的手语孤立词动作的类别,得到待识别的手语孤立词动作的类别。
7.如权利要求6所述的面向Wi-Fi信号的手语孤立词分类方法,其特征在于,所述步骤2具体操作如下:
步骤2.1、采用0.2s的时间长度作为窗口大小,对降噪后的振幅信息进行划分,得到多个窗口的振幅信息;并对多个窗口的振幅信息进行编号,得到窗口的振幅信息序列;采用公式(9)计算得到窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值;
其中,Mean(i)n表示的第i个窗口的第n条CSI流振幅信息的均值,Mean(i)n>0;表示第i个窗口的第n条CSI流的第k个振幅信息,K表示一个窗口中的振幅信息总长度,K为正整数;
根据得到的窗口的振幅信息序列中多个窗口每条CSI流的振幅信息的均值,采用公式(10)计算得到窗口的振幅信息序列中多个窗口的振幅信息方差的平均值;由窗口的振幅信息序列中多个窗口的振幅信息方差的平均值构成窗口的振幅信息方差的平均值序列;
其中,Var(i)表示第i个窗口的振幅信息方差的平均值,Var(i)≥0;N表示CSI流的总条数,k∈[1,K],n∈[1,N],N为正整数;Mean(i)n表示的第i个窗口的第n条CSI流振幅信息的均值,Mean(i)n>0;表示第i个窗口的第n条CSI流的第k个振幅信息,K表示一个窗口中的振幅信息总长度,K为正整数;
步骤2.2、设置方差阈值θ和动作停顿缓冲区最大时间长度Tp,其中θ和Tp均为正数;将窗口的振幅信息序列中的第一个窗口的振幅信息作为当前窗口的振幅信息;将窗口的振幅信息方差的平均值序列中第一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值;
步骤2.3、当当前窗口的振幅信息方差的平均值大于θ时,表示手语孤立词动作开始,将当前窗口的振幅信息作为手语孤立词片段对应的振幅信息,并设置动作停顿缓存区缓存区;并将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,执行步骤2.4;
当当前窗口的振幅信息方差的平均值小于θ时,并将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复与执行步骤2.3相同的操作;
步骤2.4、当当前窗口的振幅信息方差的平均值大于θ时,若动作停顿缓冲区为空时,将当前窗口的振幅信息作为手语孤立词片段对应的振幅信息;若动作停顿缓冲区不为空时,将动作停顿缓冲区中的振幅信息作为手语孤立片段对应的振幅信息,并将当前窗口的振幅信息作为手语孤立片段对应的振幅信息;将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.4相同的操作,直至最后一个窗口的振幅信息方差的平均值操作完成时结束;
当当前窗口的振幅信息方差的平均值小于θ时,则将当前窗口的振幅信息加入到动作停顿缓存区,当动作停顿缓冲区的时间长度小于Tp时,将当前窗口的振幅信息方差的平均值的下一个窗口的振幅信息方差的平均值作为当前窗口的振幅信息方差的平均值,重复执行与步骤2.4相同的操作,直至最后一个窗口的振幅信息方差的平均值操作完成时结束;当动作停顿缓冲区的时间长度大于Tp时,表示手语孤立词动作结束,删掉动作停顿缓冲区的振幅信息,执行步骤2.5;
步骤2.5、由手语孤立词片段对应的振幅信息构成得到手语孤立词动作对应的振幅信息。
8.如权利要求6所述的面向Wi-Fi信号的手语孤立词分类方法,其特征在于,所述步骤3具体操作如下:
步骤3.1、采用公式(11)对手语孤立词动作对应的振幅信息进行奇异值分解,得到矩阵S;将矩阵S中的最大奇异值设置为0,得到矩阵S’;根据矩阵S’,采用公式(12)计算得到去除环境影响的手语孤立词动作对应的振幅信息;
s=USVT (11)
其中,s表示手语孤立词动作对应的振幅信息,为信号流总数N×手语孤立词动作的长度L的矩阵;U为N*N的矩阵;S表示N*L的矩阵;V为L*L的矩阵;VT为V的转置;N和L均为正整数;
s'=US'VT (12)
其中,s’表示去除环境影响的手语孤立词动作对应的振幅信息,为信号流总数N×手语孤立词动作的长度L的矩阵;U为N*N的矩阵;S’为N*L的矩阵,N和L均为正整数;
步骤3.2、采用公式(13)将去除环境影响的手语孤立词动作对应的振幅信息映射为0-255之间的整数,得到多个映射整数,并按照采集CSI信号的天线对的顺序将多个映射整数对应到RGB三通道中,得到图像;
其中,gnl表示第n条CSI流的第i个振幅值经过映射后的值,gnl为正整数;s′nl表示第n条CSI流的第i个振幅值映射前的值,s′nl为正数;max(s')表示去除环境影响的手语孤立词动作对应的振幅信息中的最大振幅值,且max(s')为正数;min(s')表示去除环境影响的手语孤立词动作对应的振幅信息中的最小振幅值,且min(s')为正数。
9.如权利要求6所述的面向Wi-Fi信号的手语孤立词分类方法,其特征在于,所述步骤1具体操作如下:
步骤1.1、将Wi-Fi发送设备作为Wi-Fi发送端,将Wi-Fi接收设备作为Wi-Fi接收端,当用户在Wi-Fi发送端和Wi-Fi接收端之间做出待识别的手语孤立词动作时,Wi-Fi接收端按照Wi-Fi发送端与Wi-Fi接收端之间的天线对的顺序采集获取CSI信号;所述CSI信号为与手语孤立词相对应的CSI信号和不做手语孤立词动作时相对应的CSI信号;所述CSI信号包括3条天线对的信号,每条天线对有30个CSI流,总计90条CSI流;
步骤1.2、采用公式(8)计算得到CSI信号的振幅信息;采用巴特沃斯滤波器对得到的CSI信号的振幅信息进行降噪处理,得到降噪后的振幅信息;
A'=||H|| (8)
其中,A'表示CSI信号的振幅信息,为一个CSI流总数*采集CSI信号总长度的正数矩阵;H表示CSI信号,为CSI流总数*采集CSI信号总长度的复数矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910185152.6A CN110110580B (zh) | 2019-03-12 | 2019-03-12 | 一种面向Wi-Fi信号的手语孤立词识别网络构建及分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910185152.6A CN110110580B (zh) | 2019-03-12 | 2019-03-12 | 一种面向Wi-Fi信号的手语孤立词识别网络构建及分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110110580A CN110110580A (zh) | 2019-08-09 |
CN110110580B true CN110110580B (zh) | 2023-04-07 |
Family
ID=67484276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910185152.6A Active CN110110580B (zh) | 2019-03-12 | 2019-03-12 | 一种面向Wi-Fi信号的手语孤立词识别网络构建及分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110110580B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110458118B (zh) * | 2019-08-14 | 2022-08-12 | 南京邮电大学 | 基于信道状态信息的简单手语识别方法 |
CN111027416B (zh) * | 2019-11-21 | 2022-03-15 | 电子科技大学 | 一种基于商用WiFi的位置自适应动作识别方法 |
CN112435655B (zh) * | 2020-10-16 | 2023-11-07 | 北京紫光青藤微系统有限公司 | 一种孤立词语音识别的数据采集及模型训练方法及装置 |
CN112765550B (zh) * | 2021-01-20 | 2024-05-07 | 济南杰睿信息科技有限公司 | 一种基于Wi-Fi信道状态信息的目标行为分割方法 |
CN116823572B (zh) * | 2023-06-16 | 2023-12-19 | 中国联合网络通信有限公司深圳市分公司 | 人口流动数据的获取方法、装置及计算机可读存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679491A (zh) * | 2017-09-29 | 2018-02-09 | 华中师范大学 | 一种融合多模态数据的3d卷积神经网络手语识别方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105573498B (zh) * | 2015-12-15 | 2018-05-08 | 西北大学 | 一种基于Wi-Fi信号的手势识别方法 |
US10685219B2 (en) * | 2016-01-27 | 2020-06-16 | University Industry Foundation, Yonsei University Wonju Campus | Sign language recognition system and method |
CN105869624B (zh) * | 2016-03-29 | 2019-05-10 | 腾讯科技(深圳)有限公司 | 数字语音识别中语音解码网络的构建方法及装置 |
-
2019
- 2019-03-12 CN CN201910185152.6A patent/CN110110580B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679491A (zh) * | 2017-09-29 | 2018-02-09 | 华中师范大学 | 一种融合多模态数据的3d卷积神经网络手语识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110110580A (zh) | 2019-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110110580B (zh) | 一种面向Wi-Fi信号的手语孤立词识别网络构建及分类方法 | |
CN108710865B (zh) | 一种基于神经网络的司机异常行为检测方法 | |
CN109543667B (zh) | 一种基于注意力机制的文本识别方法 | |
Akmeliawati et al. | Real-time Malaysian sign language translation using colour segmentation and neural network | |
CN105550699B (zh) | 一种基于cnn融合时空显著信息的视频识别分类方法 | |
CN109919977B (zh) | 一种基于时间特征的视频运动人物跟踪与身份识别方法 | |
CN107862295B (zh) | 一种基于WiFi信道状态信息识别面部表情的方法 | |
CN109978034B (zh) | 一种基于数据增强的声场景辨识方法 | |
Daroya et al. | Alphabet sign language image classification using deep learning | |
CN112084927B (zh) | 一种融合多种视觉信息的唇语识别方法 | |
CN108564066A (zh) | 一种人物识别模型训练方法以及人物识别方法 | |
CN115393396B (zh) | 一种基于掩码预训练的无人机目标跟踪方法 | |
CN103020992A (zh) | 一种基于运动颜色关联的视频图像显著性检测方法 | |
CN112766218B (zh) | 基于非对称联合教学网络的跨域行人重识别方法和装置 | |
JP2006053920A (ja) | 文字認識プログラム、文字認識方法および文字認識装置 | |
CN108021869A (zh) | 一种结合高斯核函数的卷积神经网络跟踪方法 | |
CN111666845B (zh) | 基于关键帧采样的小样本深度学习多模态手语识别方法 | |
CN115410119A (zh) | 一种基于训练样本自适应生成的剧烈运动检测方法及系统 | |
CN108537109A (zh) | 基于OpenPose的单目相机手语识别方法 | |
Al-Obodi et al. | A Saudi Sign Language recognition system based on convolutional neural networks | |
Tariq et al. | Sign language localization: Learning to eliminate language dialects | |
CN110163142B (zh) | 实时手势识别方法及系统 | |
CN114676739B (zh) | 一种基于Faster-RCNN的无线信号的时序动作检测和识别方法 | |
CN114882590B (zh) | 一种基于事件相机的多粒度时空特征感知的唇读方法 | |
CN116630369A (zh) | 基于时空记忆网络的无人机目标跟踪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240313 Address after: 12 / F, building a, Gaoke Shangdu one Shangcheng, No.43 zhangbawu Road, zhangbajie office, high tech Zone, Xi'an City, Shaanxi Province, 710000 Patentee after: XI'AN PREPAID METER TECHNOLOGY Co.,Ltd. Country or region after: China Address before: 710069 No. 229 Taibai North Road, Shaanxi, Xi'an Patentee before: NORTHWEST University Country or region before: China |
|
TR01 | Transfer of patent right |