CN114511928A - 一种基于持续监控的动作预测方法 - Google Patents

一种基于持续监控的动作预测方法 Download PDF

Info

Publication number
CN114511928A
CN114511928A CN202210099728.9A CN202210099728A CN114511928A CN 114511928 A CN114511928 A CN 114511928A CN 202210099728 A CN202210099728 A CN 202210099728A CN 114511928 A CN114511928 A CN 114511928A
Authority
CN
China
Prior art keywords
level
sequence
layer
module
motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210099728.9A
Other languages
English (en)
Inventor
杨剑宇
邢慧琴
黄瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN202210099728.9A priority Critical patent/CN114511928A/zh
Publication of CN114511928A publication Critical patent/CN114511928A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于持续监控的动作预测方法,包括:将预设的人体动作序列样本划分为历史序列、待预测序列和未来序列,并将历史序列和未来序列输入预设的运动特征提取模块,提取历史运动特征和未来运动特征;将历史运动特征和未来运动特征相加后,输入预设的动作预测模块进行训练,构造双流动作预测网络;将历史序列和未来序列输入双流动作预测网络,训练双流动作预测网络和训练分类模块至收敛;将双流动作预测网络和分类模块加入字典模块,构建双流信息储存网络;将运动特征提取模块、分类模块、动作预测模块和字典模块相结合,构造自更新动作预测模型;将人体动作序列样本划分的历史序列输入自更新动作预测模型,确定动作预测结果。

Description

一种基于持续监控的动作预测方法
技术领域
本发明涉及大数据中心、动作预测技术领域,特别涉及一种基于持续监控的动作预测方法。
背景技术
目前,人体动作预测是计算机视觉领域的一个重要课题。它在人机交互、智能视频监控等领域有着广泛的应用。随着微软Kinect等电子设备的迅猛发展以及各种硬件的迅速更新,基于人体骨架的人体动作预测方法得到越来越多学者的关注。相比于基于视频的人体动作预测方法,基于人体骨架的人体动作预测方法鲁棒性强,不受光照和背景颜色混入等影响。
现有方法大都通过提取人体动作序列初始的历史运动特征,分析人体的惯性运动,进行人体动作预测。这些方法忽略了对人体动作意图的研究,因此在短期动作预测中效果较好,而在长期动作预测中效果较差。并且,这些方法更适合在有限长视频监控中进行动作预测,而在持续视频监控中并不适用。
因此,针对上述动作预测算法问题,提出一种持续监控中的动作预测方法。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于持续监控的动作预测方法流程图;
图2为本发明实施例中一种基于持续监控的动作预测方法的提取未来运动特征的流程流程图;
图3为本发明实施例中一种基于持续监控的动作预测方法的动作预测模块流程图;
图4为本发明实施例中一种基于持续监控的动作预测方法的双流动作预测网络流程图;
图5为本发明实施例中一种基于持续监控的动作预测方法的分类模块图;
图6为本发明实施例中一种基于持续监控的动作预测方法的双流信息储存网络流程图;
图7为本发明实施例中一种基于持续监控的动作预测方法的字典模块流程图;
图8为本发明实施例中一种基于持续监控的动作预测方法的自更新动作预测模型流程图;
图9为本发明实施例中一种基于持续监控的动作预测方法的20个关键点的人体骨架流程图;
图10为本发明实施例中一种基于持续监控的动作预测方法的中级别人体骨架流程图;
图11为本发明实施例中一种基于持续监控的动作预测方法的高级别人体骨架流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
需说明的是,当部件被称为“固定于”或“设置于”另一个部件,它可以直接在另一个部件上或者间接在该另一个部件上。当一个部件被称为是“连接于”另一个部件,它可以是直接或者间接连接至该另一个部件上。
需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,“多个”的含义是两个或两个以上,除非另有明确具体的限定。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
作为本技术方案的一种实施例,一个人体动作序列样本包含100帧人体骨架,以任意人体动作序列样本V为例:
V=[X1,...,Xt,...,X100],t∈[1,100],
其中,t表示时间索引,人体动作序列样本V共有100帧。
Figure BDA0003492035490000041
Figure BDA0003492035490000042
为人体动作序列样本V的第t帧人体骨架的矩阵表示,该帧人体骨架的矩阵表示的行数和列数分别为20和60,R表示矩阵为实数矩阵,该帧人体骨架由20个关键点表示,每个关键点由1个60维的向量表示,该帧人体骨架如图9所示。
将人体动作序列样本V划分为历史序列、待预测序列和未来序列,其中,历史序列有50帧,待预测序列有25帧,未来序列有25帧,此时,人体动作序列样本可以表示为由历史序列、待预测序列和未来序列组成的集合,用公式表达如下:
V={Vhistory,Vpredict,Vfuture},
其中,Vhistory表示历史序列,Vpredict表示待预测序列,Vfuture表示未来序列,历史序列Vhistory的公式表达如下:
Vhistory=[X1,...,Xh,...,X50],h∈[1,50],
其中,h表示时间索引,历史序列共有50帧。历史序列由人体动作序列样本V的第1帧人体骨架到第50帧人体骨架构成。
Figure BDA0003492035490000043
Figure BDA0003492035490000044
为历史序列Vhistory的第h帧人体骨架的矩阵表示;待预测序列Vpredict的公式表达如下:
Vpredict=[X51,...,Xp,...,X75],p∈[51,75],
其中,p表示时间索引,待预测序列共有25帧,待预测序列由人体动作序列样本V的第51帧人体骨架到第75帧人体骨架构成,
Figure BDA0003492035490000051
为待预测序列Vpredict的第p帧人体骨架的矩阵表示。
未来序列Vfuture的公式表达如下:
Vfuture=[X76,…,Xf,…,X100],f∈[76,100],
其中,f表示时间索引,未来序列共有25帧。未来序列由人体动作序列样本V的第76帧人体骨架到第100帧人体骨架构成。
Figure BDA0003492035490000052
Figure BDA0003492035490000053
为待预测序列Vpredict的第f帧人体骨架的矩阵表示。
作为本技术方案的一种实施例,将人体动作序列样本划分的历史序列输入运动特征提取模块提取历史运动特征,人体动作序列样本划分的未来序列输入运动特征提取模块提取未来运动特征。运动特征提取模块包括:速度计算模块,加速度计算模块,级别划分模块,融合模块1,融合模块2,低级别时空卷积模块1,低级别时空卷积模块2,低级别时空卷积模块3,低级别时空卷积模块4,中级别时空卷积模块1,中级别时空卷积模块2,中级别时空卷积模块3,中级别时空卷积模块4,高级别时空卷积模块1,高级别时空卷积模块2,高级别时空卷积模块3,高级别时空卷积模块4,特征融合模块和特征级联模块。
作为本技术方案的一种实施例,人体动作序列样本划分的历史序列输入运动特征提取模块提取历史运动特征的流程如图1所示,速度计算模块的输入为人体动作序列样本划分的历史序列Vhistory,输出为历史速度序列Vhistory_v。Vhistory_v的公式表达如下:
Vhistory_v=[vel1,...,velh,...,vel50],h∈[1,50],其中,
Figure BDA0003492035490000061
为历史速度序列Vhistory_v中第h帧骨架的矩阵表达。velh的计算方式如下:
Figure BDA0003492035490000062
加速度计算模块的输入为历史速度序列Vhistory_v,输出为历史加速度序列Vhistory_a。Vhistory_a的公式表达如下:
Vhistory_a=[acl1,...,aclh,...,acl50],h∈[1,50],其中,
Figure BDA0003492035490000063
为历史加速度序列Vhistory_a中第h帧骨架的矩阵表达。aclh的计算方式如下:
Figure BDA0003492035490000064
如图1最左侧一列所示,级别划分模块1的输入为Vhistory,其有三个输出,分别为Vhp_1、Vhp_2和Vhp_3。Vhp_1代表低级别人体骨架的历史序列、Vhp_2代表中级别人体骨架的历史序列,Vhp_3代表高级别人体骨架的历史序列。级别划分模块由池化层1和池化层2组成。池化层1由10个池化尺寸为2的平均池化层组成。池化层2由5个池化尺寸为4的平均池化层构成。Vhp_1=Vhistory,表示将历史序列看作低级别人体骨架的历史序列。历史序列Vhistory输入至池化层1中,得到中级别人体骨架的历史序列Vhp_2。Vhp_2的表达式如下所示:
Vhp_2=[mid1,...,midh,...,mid50],h∈[1,50],
其中,
Figure BDA0003492035490000065
为中级别人体骨架的历史序列中第h帧骨架的矩阵表示。该帧人体骨架如图10所示。历史序列Vhistory输入至池化层2,得到高级别人体骨架的历史序列Vhp_3。Vhp_3的表达式如下所示:
Vhp_3=[high1,...,highh,...,high50],h∈[1,50],其中,
Figure BDA0003492035490000071
为高级别人体骨架的历史序列中第h帧骨架的矩阵表示,该帧人体骨架如图11所示。
低级别时空卷积模块1的输入为Vhp_1,输出为Fhp_11。低级别时空卷积模块1包含1个空间图卷积层和1个时间卷积层。空间图卷积层有64个卷积核,每个卷积核大小为1×1。时间卷积层有32个卷积核,每个卷积核的大小为5×1。中级别时空卷积模块1的结构与低级别时空卷积模块1的结构一致,其输入为Vhp_2,输出为Fhp_12。高级别时空卷积模块1的结构与低级别时空卷积模块1的结构一致,其输入为Vhp_3,输出为Fhp_13
融合模块1包含低级别卷积层1,低级别线性层1,低级别聚集相关特征层1,低级别更新特征层1,低级别特征融合层1,中级别卷积层1,中级别线性层1,中级别聚集相关特征层1,中级别更新特征层1,中级别特征融合层1,高级别卷积层1,高级别线性层1,高级别聚集相关特征层1,高级别更新特征层1和高级别特征融合层1。
低级别卷积层1包含32个卷积核,每个卷积核大小为5×1,低级别卷积层1的输入为Fhp_11,输出为G11。低级别线性层1由3层全连接层构成,其输入为G11,输出为F11
Figure BDA0003492035490000072
F11表示提取的低级别人体骨架中所有关键点的特征。
Figure BDA0003492035490000073
表示提取的低级别人体骨架中第i个关键点的特征,
Figure BDA0003492035490000081
表示提取的低级别人体骨架中第j个关键点的特征。针对低级别人体骨架中的第i个关键点,低级别聚集相关特征层1把剩余19个关键点的特征聚合到第i个关键点上,然后经过3层全连接层,其公式表达如下:
Figure BDA0003492035490000082
其中,[·,·]表示按照通道连接,f11(·)表示3层全连接层,r11_i为1个列向量。对低级别人体骨架中所有关键点都执行上述操作后,得到R11。R11的公式表达如下:
R11=(r11_1,...,r11_i,...,r11_20),i∈[1,20],
该公式表示R11是由20个列向量组成的二维张量。低级别更新特征层1的输入为R11,输出为H11。低级别更新特征层1用来更新特征,其由3层全连接层构成,特征更新的公式表达如下:
H11=g11([F11,R11]),
其中,[·,·]表示按照通道连接,g11(·)表示3层全连接层,H11为更新后的低级别人体骨架中所有关键点的特征。
中级别卷积层1的结构与低级别卷积层1的结构一致,其输入为Fhp_12,输出为G12。中级别线性层1的结构与低级别线性层1的结构一致,其输入为G12,输出为F12。中级别聚集相关特征层1的结构与低级别聚集相关特征层1的结构一致,其输入为F12,输出为R12。中级别更新特征层1的结构与低级别更新特征层1的结构一致,其输入为R12,输出为H12。H12为更新后的中级别人体骨架中所有关键点的特征。
高级别卷积层1的结构与低级别卷积层1的结构一致,其输入为Fhp_13,输出为G13。高级别线性层1的结构与低级别线性层1的结构一致,其输入为G13,输出为F13。高级别聚集相关特征层1的结构与低级别聚集相关特征层1的结构一致,其输入为F13,输出为R13。高级别更新特征层1的结构与低级别更新特征层1的结构一致,其输入为R13,输出为H13。H13为更新后的中级别人体骨架中所有关键点的特征。
低级别特征融合层1的输入为H11和H12,输出为Shp_11。在低级别特征融合层1中,H11和H12先经过1个softmax函数,其公式表达如下:
Figure BDA0003492035490000091
其中,T表示转置,A12表示连接权重矩阵。softmax函数用来将输入向量的每一个元素的值归一化至(0,1)之间,每一个元素的计算公式如下:
Figure BDA0003492035490000092
其中,e表示自然底数,K表示输入向量包含的元素数目,al表示输入向量的第l个元素,ak表示输入向量的第k个元素,Sl表示输入向量的第l个元素的值归一化后的结果。接着,将H12融合至H11中,其公式表达如下:
Shp_11=A12·H12*0.3+H11
其中,Shp_11表示H12和H11融合后的特征,也是低级别特征融合层1的输出,0.3表示权重。
中级别特征融合层1的输入为H11、H12和H13,输出为Shp_12。在中级别特征融合层1中,H11和H12先经过1个softmax函数,其公式表达如下:
Figure BDA0003492035490000101
其中,T表示转置,A21表示连接权重。接着,H13和H12经过1个softmax函数,其公式表达如下:
Figure BDA0003492035490000102
其中,T表示转置,A23表示连接权重。接着,将H11和H13融合至H12中,其公式表达如下:
Shp_12=(A21·H11+A23·H13)*0.3+H12,其中,Shp_12表示H11、H12和H13融合后的特征,也是中级别特征融合层1的输出,0.3表示权重。
高级别特征融合层1的输入为H13和H12,输出为Shp_13。在高级别特征融合层1中,H13和H12先经过1个softmax函数,其公式表达如下:
Figure BDA0003492035490000103
其中,T表示转置,A32表示连接权重矩阵。接着,将H12融合至H13中,其公式表达如下:
Shp_13=A32·H12*0.3+H13
其中,Shp_13表示H12和H13融合后的特征,也是高级别特征融合层1的输出,0.3表示权重。
低级别时空卷积模块2的输入为Shp_11,输出为Fhp_21。低级别时空卷积模块2包含1个空间图卷积层和1个时间卷积层。空间图卷积层有128个卷积核,每个卷积核大小为1×1。时间卷积层有64个卷积核,每个卷积核的大小为5×1。中级别时空卷积模块2的输入为Shp_12,输出为Fhp_22。中级别时空卷积模块2的结构与低级别时空卷积模块2的结构一致,其输入为Shp_12,输出为Fhp_22。高级别时空卷积模块2的结构与低级别时空卷积模块2的结构一致,其输入为Shp_13,输出为Fhp_23
融合模块2的结构与融合模块1的结构一致,融合模块2共有3个输出,分别为Shp_21、Shp_22和Shp_23
低级别时空卷积模块3的输入为Shp_21,输出为Shp_31。低级别时空卷积模块3包含1个空间图卷积层和1个时间卷积层。空间图卷积层有256个卷积核,每个卷积核大小为1×1。时间卷积层有128个卷积核,每个卷积核的大小为5×1。输入为Shp_22,输出为Shp_32中级别时空卷积模块3结构与低级别时空卷积模块3的结构一致,其输入为Shp_22,输出为Shp_32。高级别时空卷积模块3的结构与低级别时空卷积模块3的结构一致,其输入为Shp_23,输出为Shp_33
低级别时空卷积模块4的输入为Shp_31,输出为Shp_41。低级别时空卷积模块4包含1个空间图卷积层和1个时间卷积层。空间图卷积层有512个卷积核,每个卷积核大小为1×1。时间卷积层有256个卷积核,每个卷积核的大小为5×1。中级别时空卷积模块4的结构与低级别时空卷积模块4的结构一致,其输入为Shp_32,输出为Shp_42。高级别时空卷积模块4的结构与低级别时空卷积模块4的结构一致,其输入为Shp_33,输出为Shp_43
特征融合模块的输入为Shp_41、Shp_42和Shp_43,输出为Shp。为了使Shp_41、Shp_42和Shp_43三者的张量尺寸大小一致。特征融合模块对Shp_42进行10次上采样,得到
Figure BDA0003492035490000121
并对
Figure BDA0003492035490000122
赋予权重0.6得到
Figure BDA0003492035490000123
对Shp_43进行5次上采样,得到
Figure BDA0003492035490000124
并对
Figure BDA0003492035490000125
赋予权重0.6得到
Figure BDA0003492035490000126
接着将Shp_41
Figure BDA0003492035490000127
Figure BDA0003492035490000128
相加。Shp的表达式如下:
Figure BDA0003492035490000129
其中,
Figure BDA00034920354900001210
Figure BDA00034920354900001211
的权重均为0.6。
如图1中间一列所示,其结构与图1最左侧一列的结构一致。图1中间一列的输入为历史速度序列Vhistory_v,输出为Shv。如图1最右侧一列所示,其结构与图1最左侧一列的结构一致。图1最右侧一列的输入为历史加速度序列Vhistory_a,输出为Sha
特征级联模块的输入为Shp、Shv和Sha,输出为Hhistory。Hhistory由Shp、Shv和Sha按通道拼接所得。Hhistory代表历史运动特征。
人体动作序列样本划分的未来序列Vfuture输入运动特征提取模块提取未来运动特征的流程与人体动作序列样本划分的历史序列Vhistory输入运动特征提取模块提取历史特征的流程一致,如图2所示,Hfuture代表未来运动特征。
作为本技术方案的一种实施例,将历史运动特征和未来运动特征相加,输入动作预测模块。历史运动特征和未来运动特征相加得到联合运动特征,用公式表达如下:
H=Hfuture+Hhistory
其中,H表示联合运动特征。
动作预测模块由循环神经网络构成,该循环神经网络共有25个循环,其结构如图3所示,包括速度计算模块、加速度计算模块、门控循环单元GRU和线性层。动作预测模块有4个输入,分别为联合运动特征H、人体动作序列样本V中的第48帧人体骨架X48、第49帧人体骨架X49、和第50帧人体骨架X50
如图3最左侧一列所示,它表示第1个循环。速度计算模块的输入为人体动作序列样本V的第49帧人体骨架X49和第50帧人体骨架XT50,其输出为S0,S0的计算方法如下:
Figure BDA0003492035490000131
其中,S0表示人体动作序列样本V的第50帧人体骨架的速度。
加速度计算模块的输入为人体动作序列样本V中的第48帧人体骨架X48、第49帧人体骨架X49、和第50帧人体骨架X50,其输出为C0,C0的计算方法如下:
Figure BDA0003492035490000132
其中,C0表示人体动作序列样本V的第50帧人体骨架的加速度。
接着,将S0、C0和X50按照通道连接,得到I0。门控循环单元GRU模块的输入为I0和H,输出为B0和H1。线性层的输入为B0,输出为F0。F0的计算方式如下:
F0=W0·B00,
其中,W0是线性层的权重,θ0是线性层的偏置向量。
将线性层的输出F0和人体动作序列样本V中第50帧人体骨架X50相加,得到人体动作序列样本V的第51帧人体骨架的预测结果
Figure BDA0003492035490000141
如图3第2列所示,它表示第2个循环,其结构与第1个循环的结构一致。第2个循环的输入为人体动作序列样本V的第51帧人体骨架的预测结果
Figure BDA0003492035490000142
人体动作序列样本V的第50帧人体骨架X50、第49帧人体骨架X49和第1个循环中GRU的其中一个输出H0。第2个循环的输出为人体动作序列样本V的第52帧人体骨架的预测结果
Figure BDA0003492035490000143
如图3最右侧一列所示,它表示第25个循环,其结构与第1个循环的结构一致。第25个循环的输入为人体动作序列样本V的第74帧人体骨架的预测结果
Figure BDA0003492035490000144
第73帧人体骨架的预测结果
Figure BDA0003492035490000145
第72帧人体骨架的预测结果
Figure BDA0003492035490000146
和第24个循环中GRU的其中一个输出H24。第25个循环的输出为人体动作序列样本V的第75帧人体骨架的预测结果
Figure BDA0003492035490000147
动作预测模块的输出为计算所得的待预测序列
Figure BDA0003492035490000148
的表达式如下所示:
Figure BDA0003492035490000149
其中,
Figure BDA00034920354900001410
为计算所得的待预测序列的第p帧骨架的矩阵表示。
作为本技术方案的一种实施例,构造双流动作预测网络,如图4所示,该网络的输入为人体动作序列样本划分的历史序列和未来序列,输出为计算所得的待预测序列,即动作预测模块的输出
Figure BDA00034920354900001411
动作预测模块输出的第n个预测序列样本为
Figure BDA00034920354900001412
且一共有32个样本。网络的损失函数L1为:
Figure BDA0003492035490000151
其中,||·||1表示1范数,
Figure BDA0003492035490000152
是第n个预测序列的真实值。
作为本技术方案的一种实施例,将用来训练的人体动作序列样本划分的历史序列和未来序列输入双流动作预测网络,训练网络至收敛。其中,用来训练的人体动作序列样本取自于持续监控领域。
作为本技术方案的一种实施例,将训练好的运动特征提取模块提取的历史运动特征输入分类模块,进行动作分类,训练分类模块至收敛。分类模块的结构如图5所示,线性层1的输入为训练好的运动特征提取模块提取的历史运动特征Hhistory,线性层1包含的神经元数目为2560,线性层1的输出Q1的计算方式如下:
Figure BDA0003492035490000153
其中,W1是线性层1的权重,θ1是线性层1的偏置向量,
Figure BDA0003492035490000154
是relu激活函数,其公式如下:
Figure BDA0003492035490000155
x是relu激活函数的输入,当x大于等于0时,relu激活函数的输出为x,当x小于0时,relu激活函数的输出为0。
线性层2的输入为Q1,线性层2包含神经元的数目为1280,线性层2的输出Q2的计算方式如下:
Figure BDA0003492035490000156
其中,
Figure BDA0003492035490000161
是relu激活函数,W2是线性层2的权重,θ2是线性层2的偏置向量。
线性层3的输入为Q2,线性层3包含神经元的数目为15,线性层3的输出Q3的计算方式如下:
Figure BDA0003492035490000162
其中,W3是线性层3的权重,θ3是线性层3的偏置向量,
Figure BDA0003492035490000163
是softmax激活函数。Q3的输出表示输入的历史运动特征属于各个动作类别的概率。动作类别的总数与线性层3包含神经元的数目一致,为15。选择Q3中最大的概率值对应的动作类别作为分类模块的输出。
将用来训练的人体动作序列样本划分的历史序列输入训练好的运动特征提取模块,得到历史运动特征样本。再将历史运动特征样本输入至分类模块,训练分类模块至收敛。训练分类模块使用的损失函数L2为:
Figure BDA0003492035490000164
其中,动作类别的总数为15,输入的历史运动特征样本的总数为32,
Figure BDA0003492035490000165
是第a个历史运动特征样本的网络输出,Ia是第a个历史运动特征样本的期望输出,其中Ia的第g维数据定义为:
Figure BDA0003492035490000166
其中,ia是第a个历史运动特征样本的标签值。
作为本技术方案的一种实施例,将训练好的双流动作预测网络和训练好的分类模块相结合,并加入储存信息的空的字典模块,构建双流信息储存网络,如图6所示。图6第1行中的运动特征提取模块的输入为用来训练的人体动作序列样本划分的历史序列,输出为历史运动特征Hhistory。图6第2行中的运动特征提取模块的输入为用来训练的人体动作序列样本划分的未来序列,输出为未来运动特征Hfuture。分类模块的输入为历史运动特征Hhistory,输出为该历史运动特征属于的动作类别。字典模块的输入为分类模块输出的动作类别、历史运动特征Hhistory和未来运动特征Hfuture。历史运动特征和未来运动特征相加,输入动作预测模块,得到动作预测结果。
作为本技术方案的一种实施例,将用来训练的人体动作序列样本划分的历史序列和未来序列输入双流信息储存网络,在字典模块储存每一种动作的历史运动特征和未来运动特征的对应关系。字典模块的结构如图7所示,字典模块中的键用来表示动作类别:key1表示第1个动作类别,key15用来表示第15个动作类别。字典模块中每一个键对应的值为一个子字典:value1表示第1个子字典,value15表示第15个子字典。第1个子字典value1的键用来存储第1个动作类别的历史运动特征,第1个子字典value1的值用来存储第1个动作类别的未来运动特征:键
Figure BDA0003492035490000171
用来存储第1个动作类别的第1个历史运动特征
Figure BDA0003492035490000172
Figure BDA0003492035490000173
用来存储第1个动作类别的第1个未来运动特征
Figure BDA0003492035490000174
Figure BDA0003492035490000175
用来存储第1个动作类别的第2000个历史运动特征
Figure BDA0003492035490000176
Figure BDA0003492035490000177
用来存储第1个动作类别的第2000个未来运动特征
Figure BDA0003492035490000178
第15个子字典value15的键用来存储第15个动作类别的历史运动特征,值用来存储第15个动作类别的未来运动特征。键
Figure BDA0003492035490000179
用来存储第15个动作类别的第1个历史运动特征
Figure BDA00034920354900001710
Figure BDA00034920354900001711
用来存储第15个动作类别的第1个未来运动特征
Figure BDA0003492035490000181
Figure BDA0003492035490000182
用来存储第15个动作类别的第2000个历史运动特征
Figure BDA0003492035490000183
Figure BDA0003492035490000184
用来存储第15个动作类别的第2000个未来运动特征
Figure BDA0003492035490000185
作为本技术方案的一种实施例,将训练好的运动特征提取模块、训练好的分类模块、训练好的动作预测模块和储存完信息的字典模块相结合,构造自更新动作预测模型,自更新动作预测模型如图8所示。自更新动作预测模型共进行25次动作预测,其输入为测试的人体动作序列样本的历史序列
Figure BDA0003492035490000186
输出为最终的动作预测结果
Figure BDA0003492035490000187
其中,测试的人体动作序列样本取自于持续监控领域。
如图8第1列所示,它包括运动特征提取模块、分类模块、字典模块和动作预测模块,它表示第1个迭代过程,用来进行第1次动作预测。运动特征提取模块的输入为测试的人体动作序列样本划分的历史序列
Figure BDA0003492035490000188
输出为测试的人体动作序列样本的历史运动特征
Figure BDA0003492035490000189
分类模块的输入为测试的人体动作序列样本的历史运动特征
Figure BDA00034920354900001810
输出为动作类别g1。字典模块的输入为动作类别g1和测试的人体动作序列样本的历史运动特征
Figure BDA00034920354900001811
输出为查找得到的未来运动特征
Figure BDA00034920354900001812
查找未来运动特征的方法如下:
(1)将测试的人体动作序列样本的历史运动特征
Figure BDA00034920354900001813
向量化,即将
Figure BDA00034920354900001814
的所有行向量连接成新的行向量
Figure BDA00034920354900001815
为维度为2560的向量。
(2)在字典模块中选择动作类别g1对应的子字典
Figure BDA00034920354900001816
对子字典
Figure BDA00034920354900001817
的第i个键存储的历史运动特征
Figure BDA00034920354900001818
向量化,即将
Figure BDA0003492035490000191
的所有行向量连接成新的行向量
Figure BDA0003492035490000192
为维度为2560的向量。
(3)计算测试的人体动作序列样本的历史运动特征与动作类别g1存储的第i个历史运动特征间的余弦相似度,计算方法如下:
Figure BDA0003492035490000193
其中,·表示点积运算,
Figure BDA0003492035490000194
表示
Figure BDA0003492035490000195
的2范数,
Figure BDA0003492035490000196
表示
Figure BDA0003492035490000197
的2范数,simi代表测试的人体动作序列样本的历史运动特征与动作类别g1存储的第i个历史运动特征间的余弦相似度。
(4)计算动作类别g1存储的所有历史运动特征与测试的人体动作序列样本的历史运动特征间的相似度,得到{sim1,...,simi,...,sim2000}。
(5)查找余弦相似度的最大值simj,simj=max{sim1,...,simi,...,sim2000}。
(6)在动作类别g1对应的子字典中查找第j个键
Figure BDA0003492035490000198
并找到第j个键对应的值
Figure BDA0003492035490000199
Figure BDA00034920354900001910
存储的未来运动特征
Figure BDA00034920354900001911
作为查找得到的未来运动特征
Figure BDA00034920354900001912
接着,将测试的人体动作序列样本的历史运动特征
Figure BDA00034920354900001913
和查找得到的未来运动特征
Figure BDA00034920354900001914
相加,输入动作预测模块,得到第1次动作预测结果
Figure BDA00034920354900001915
其公式表达如下:
Figure BDA00034920354900001916
其中,
Figure BDA00034920354900001917
为第1次动作预测结果的第p帧骨架的矩阵表达,
Figure BDA00034920354900001918
为测试的人体动作序列样本V的第51帧人体骨架的预测结果。
如图8第2列所示,它表示第1次更新过程,用来进行第2次动作预测,其结构与图8第1列的结构一致。运动特征提取模块的输入为第1次重构的历史序列
Figure BDA0003492035490000201
输出为第1次更新后的历史运动特征
Figure BDA0003492035490000202
第1次重构的历史序列
Figure BDA0003492035490000203
由测试的人体动作序列样本划分的历史序列
Figure BDA0003492035490000204
的第2帧人体骨架X2到第50帧人体骨架X50和第1次动作预测结果中的首帧人体骨架
Figure BDA0003492035490000205
构成,公式表达如下:
Figure BDA0003492035490000206
分类模块的输入为第1次更新后的历史运动特征
Figure BDA0003492035490000207
输出为第1次更新后的动作类别g2。字典模块的输入为第1次更新后的历史运动特征
Figure BDA0003492035490000208
和第1次更新后的动作类别g2,输出为第1次更新后查询得到的未来运动特征
Figure BDA0003492035490000209
将第1次更新后的历史运动特征
Figure BDA00034920354900002010
和第1次更新后查询得到的未来运动特征
Figure BDA00034920354900002011
相加,输入动作预测模块,得到第2次动作预测结果
Figure BDA00034920354900002012
第2次动作预测结果
Figure BDA00034920354900002013
的公式表达如下:
Figure BDA00034920354900002014
其中,
Figure BDA00034920354900002015
为第2次动作预测结果的第p帧骨架的矩阵表达,
Figure BDA00034920354900002016
为测试的人体动作序列样本V的第52帧人体骨架的预测结果。
如图8第3列所示,它表示第2次更新过程,用来进行第3次动作预测,其结构与图8第1列的结构一致。运动特征提取模块的输入为第2次重构的历史序列
Figure BDA00034920354900002017
输出为第2次更新后的历史运动特征
Figure BDA00034920354900002018
第2次重构的历史序列
Figure BDA00034920354900002019
由测试的人体动作序列样本划分的历史序列
Figure BDA0003492035490000211
的第3帧人体骨架X3到第50帧人体骨架X50、第1次动作预测结果中的首帧人体骨架
Figure BDA0003492035490000212
和第2次动作预测结果中的首帧人体骨架
Figure BDA0003492035490000213
构成,其公式表达如下:
Figure BDA0003492035490000214
分类模块的输入为第2次更新后的历史运动特征
Figure BDA0003492035490000215
输出为第2次更新后的动作类别g3。字典模块的输入为第2次更新后的历史运动特征
Figure BDA0003492035490000216
和第2次更新后的动作类别g3,输出为第2次更新后查询得到的未来运动特征
Figure BDA0003492035490000217
将第2次更新后的历史运动特征
Figure BDA0003492035490000218
和第2次更新后查询得到的未来运动特征
Figure BDA0003492035490000219
相加,输入动作预测模块,得到第3次动作预测结果
Figure BDA00034920354900002110
第3次动作预测结果
Figure BDA00034920354900002111
的公式表达如下:
Figure BDA00034920354900002112
其中,
Figure BDA00034920354900002113
为第3次动作预测结果的第p帧骨架的矩阵表达,
Figure BDA00034920354900002114
为测试的人体动作序列样本V的第53帧人体骨架的预测结果。
图8最后1列为第24次更新过程,用来进行第25次动作预测,其结构与图8第1列的结构一致,其最终的输出为第25次动作预测结果
Figure BDA00034920354900002115
的公式表达如下:
Figure BDA00034920354900002116
其中,
Figure BDA00034920354900002117
为第25次动作预测结果的第p帧骨架的矩阵表达,
Figure BDA00034920354900002118
为测试的人体动作序列样本V的第75帧人体骨架的预测结果。
最终的动作预测结果
Figure BDA00034920354900002119
由上述每次动作预测结果中的首帧人体骨架组合而成,其公式表达如下:
Figure BDA0003492035490000221
其中,
Figure BDA0003492035490000222
表示第1次动作预测结果的首帧人体骨架,
Figure BDA0003492035490000223
表示第q次动作预测结果的首帧人体骨架,
Figure BDA0003492035490000224
表示第25次动作预测结果的首帧人体骨架。
作为本技术方案的一种实施例,将用来测试的人体动作序列样本划分的历史序列输入自更新的动作预测模型,实现动作预测。
本技术方案的有益效果在于:提出的自更新动作预测模型能够更新人体动作序列样本的历史运动特征,使得人体动作意图更加明确,有助于提高长期动作预测的准确率。并且,自更新动作预测模型更适用于持续视频监控中的动作预测。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于持续监控的动作预测方法,其特征在于,包括:
步骤1:将预设的人体动作序列样本划分为历史序列、待预测序列和未来序列,并将历史序列和未来序列输入预设的运动特征提取模块,提取历史运动特征和未来运动特征;其中,
所述运动特征提取模块中包括速度计算模块,加速度计算模块,级别划分模块,融合模块,时空卷积模块,特征融合模块和特征级联模块;
步骤2:将历史运动特征和未来运动特征相加后,并输入预设的动作预测模块进行训练,构造双流动作预测网络;
步骤3:将历史序列和未来序列输入双流动作预测网络,训练双流动作预测网络至收敛;
步骤4:通过经过训练的运动特征提取模块,提取历史运动特征输入预设的分类模块进行动作分类,训练分类模块至收敛;
步骤5:将经过训练的双流动作预测网络和分类模块结合并加入预设的字典模块,构建双流信息储存网络;其中,
所述双流信息储存网络的字典模块储存每一种动作的历史运动特征和未来运动特征的对应关系;
步骤6:将训练好的运动特征提取模块、训练好的分类模块、训练好的动作预测模块和储存完信息的字典模块相结合,构造自更新动作预测模型;
步骤7:将用来测试的人体动作序列样本划分的历史序列输入自更新动作预测模型,确定动作预测结果。
2.如权利要求1所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤1,包括:
步骤11:通过预设的若干帧人体骨架样本,构建人体动作序列样本:
V=[X1,…,Xt,…,XN]
其中,V代表人体动作序列样本,t代表人体动作序列样本的第t个帧数,t∈[1,N],N代表人体动作序列样本的总帧数,Xt∈RM×D,RM×D代表人体动作序列样本V的第t帧人体骨架的矩阵,M代表第t帧人体骨架包含的关键点个数;D代表第t帧人体骨架中每个关键点的向量表示的维数;
步骤12:将人体动作序列样本V划分为历史序列Vhistory、待预测序列Vpredict和未来序列Vfuture;其中,
V={Vhistory,Vpredict,Vfuture},
Figure FDA0003492035480000021
其中,Vhistory代表历史序列,h代表关于历史序列的时间索引,h∈[1,Thistory],Thistory∈[1,Tpredict],Thistory代表历史序列的总帧数;Xh∈RM×D,Xh代表历史序列的第h帧人体骨架的矩阵,X1代表历史序列的第1帧人体骨架的矩阵,
Figure FDA0003492035480000024
代表历史序列的最后1帧人体骨架的矩阵;Vpredict代表待预测序列,p代表关于待预测序列的时间索引,p∈[Thistory+1,Thistory+Tpredict],Tpredict代表待预测序列的总帧数,Tpredict∈[Tpredict,Tfuture];Xp∈RM×D,Xp代表待预测序列的第p帧人体骨架的矩阵;
Figure FDA0003492035480000022
代表历史序列的第1帧人体骨架的矩阵;
Figure FDA0003492035480000023
代表历史序列的最后1帧人体骨架的矩阵;Vfuture代表未来序列,f代表关于历史序列的时间索引,f∈[Thistory+Tpredict+1,Thistory+Tpredict+Tfuture],Tfuture代表未来序列的总帧数,Tfuture∈[Tfuture,N];Xf∈RM×D,Xf代表未来序列的第f帧人体骨架的矩阵;
Figure FDA0003492035480000031
代表未来序列的第1帧人体骨架的矩阵,
Figure FDA0003492035480000032
代表未来序列的最后1帧人体骨架的矩阵,N=Thistory+Tpredict+Tfuture
步骤13:通过速度计算模块,对历史序列进行速度特征提取,确定历史速度序列;
Figure FDA00034920354800000310
其中,Vhistory_v代表历史速度序列,vel1代表历史速度序列中的第1帧骨架的矩阵,
Figure FDA0003492035480000033
代表未来速度序列中的第1帧骨架的矩阵,
Figure FDA0003492035480000034
为历史速度序列Vhistory_v中第h帧骨架的矩阵表示,
Figure FDA0003492035480000035
h代表关于历史序列的时间索引,Xh代表历史序列的第h帧人体骨架的矩阵,Xh-1代表历史序列的第h-1帧人体骨架的矩阵,
Figure FDA0003492035480000036
代表历史速度序列中的第Thistory帧骨架的矩阵,Thistory代表历史序列的总帧数;
步骤14:通过加速度计算模块,对所述历史速度序列进行计算,确定历史加速度序列:
Figure FDA0003492035480000037
其中,Vhistory_a代表历史加速度序列,acl1代表历史加速度序列中的第1帧骨架的矩阵,aclh代表历史加速度序列中的第h帧骨架的矩阵,
Figure FDA0003492035480000038
Figure FDA0003492035480000039
代表历史加速度序列中的第Thistory帧骨架的矩阵;
步骤15:通过级别划分模块,分别将所述历史序列进行级别划分,划分为低级历史序列,中级历史序列和高级历史序列;
Figure FDA0003492035480000041
其中,Vhp_1代表低级历史序列,Vhistory代表历史序列,Vhp_2代表历史序列输入第一池化层得到的关于人体骨架的中级历史序列,midh∈RW×D,RW×D代表关于人体骨架的中级历史序列的第h帧人体骨架的矩阵,W和D代表中级历史序列中第h帧骨架的矩阵的行数和列数,Vhp_3代表高级历史序列,Vhp_3是通过历史序列输入第二池化层得到的关于人体骨架的高级历史序列,highh∈RU×D,U和D分别对应高级历史序列中第h帧骨架的矩阵的行数和列数;
步骤16:将低级历史序列,中级历史序列和高级历史序列依次传输至对应的时空卷积模块1、融合模块1、时空卷积模块2、融合模块2、时空卷积模块3和时空卷积模块4,生成对应的历史融合特征;
步骤17:将未来序列传输到步骤13-步骤15,生成对应的未来融合特征;所述步骤17包括:
步骤170:将未来序列传输至速度计算模块,获取对应的未来速度序列;
步骤171:将所述未来速度序列传输至加速度计算模块,计算对应的未来加速度序列;
步骤172:将所述未来加速度序列传输至级别划分模块,确定低级未来序列,中级未来序列和高级未来序列;
步骤173:将低级未来序列,中级未来序列和高级未来序列依次传输至对应的时空卷积模块1、融合模块1、时空卷积模块2、融合模块2、时空卷积模块3和时空卷积模块4,生成对应的未来融合特征;其中,
所述融合模块1包含低级别卷积层1,低级别线性层1,低级别聚集相关特征层1,低级别更新特征层1,低级别特征融合层1,中级别卷积层1,中级别线性层1,中级别聚集相关特征层1,中级别更新特征层1,中级别特征融合层1,高级别卷积层1,高级别线性层1,高级别聚集相关特征层1,高级别更新特征层1和高级别特征融合层1;
步骤18:通过所述历史融合特征和未来融合特征,生成历史运动特征和未来运动特征。
3.如权利要求2所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤16,包括:
步骤160:将低级历史序列Vhp_1输入低级别时空卷积模块1,输出Fhp_11;Fhp_11代表和低级历史序列Vhp_1对应的低级别时空卷积模块1的输出结果;
步骤161:将中级历史序列Vhp_2输入中级别时空卷积模块1,输出Fhp_12;Fhp_12代表和中级历史序列Vhp_2对应的中级别时空卷积模块1的输出结果;
步骤162:将高级历史序列Vhp_3输入高级别时空卷积模块1,输出Fhp_13;Fhp_13代表和高级历史序列Vhp_3对应的高级别时空卷积模块1的输出结果;
步骤163:将Fhp_11、Fhp_12、Fhp_13输入融合模块1,输出更新后的低级别人体骨架中所有关键点的特征、更新后的中级别人体骨架中所有关键点的特征、更新后的高级别人体骨架中所有关键点的特征;
步骤164:通过H11、H12和H13,确定生成对应的历史融合特征。
4.如权利要求3所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤163,还包括:
步骤A1:将Fhp_11输入低级别卷积层1,输出G11;G11代表和低级历史序列Vhp_1对应的低级别卷积层1的输出结果;
步骤A2:将G11输入低级别线性层1,输出为F11
Figure FDA0003492035480000061
F11表示提取的低级别人体骨架中所有关键点的特征;
Figure FDA0003492035480000062
表示提取的低级别人体骨架中第i个关键点的特征,
Figure FDA0003492035480000063
表示提取的低级别人体骨架中第j个关键点的特征;
步骤A3:针对低级别人体骨架中的第i个关键点,低级别聚集相关特征层1把剩余M-1个关键点的特征聚合到第i个关键点上,然后经过低级别聚集相关特征层1的3层全连接层,确定对应的关键点列向量;
Figure FDA0003492035480000064
其中,[,]表示按照通道连接函数,f11()表示低级别聚集相关特征层1的3层全连接层函数,r11_i为1个关于第i个关键点的列向量,i=1,2,…,M,M代表关键点的总个数;
步骤A4:对低级别人体骨架中所有关键点都执行步骤A3,获取关于关键点的二维张量,R11的公式表达如下:
R11=(r11_1,...,r11_i,...,r11_M),i∈[1,M],其中,R11是由M个列向量组成的二维张量;
步骤A5:将R11输入低级别更新特征层1,输出关键点的特征H11,低级别更新特征层1用来更新特征,低级别更新特征层1由3层全连接层构成,更新特征的公式表达如下:
H11=g11([F11,R11])
其中,[,]表示按照通道连接函数,g11()表示关于低级别更新特征层得到3层全连接层函数,H11为更新后的低级别人体骨架中所有关键点的特征;
步骤A6:将Fhp_12输入中级别卷积层1,输出G12;G12代表和中级历史序列Vhp_2对应的中级别卷积层1的输出结果;
步骤A7:将G12输入中级别线性层1,输出为F12
Figure FDA0003492035480000071
F12表示提取的中级别人体骨架中所有关键点的特征;
Figure FDA0003492035480000072
表示提取的中级别人体骨架中第i个关键点的特征,
Figure FDA0003492035480000073
表示提取的中级别人体骨架中第j个关键点的特征;
步骤A8:针对中级别人体骨架中的第i个关键点,中级别聚集相关特征层1把剩余M-1个关键点的特征聚合到第i个关键点上,然后经过中级别聚集相关特征层1的3层全连接层,确定对应的关键点列向量;
Figure FDA0003492035480000074
其中,[,]表示按照通道连接函数,f12()表示中级别聚集相关特征层1的3层全连接层函数,r12_i为1个关于第i个关键点的列向量,i=1,2,…,M,M代表关键点的总个数;
步骤A9:对中级别人体骨架中所有关键点都执行步骤A8,获取关于中级别人体骨架关键点的二维张量,R12的公式表达如下:
R12=(r12_1,...,r12_i,...,r12_M),i∈[1,M],其中,R12是由M个列向量组成的二维张量;
步骤A10:将R12输入中级别更新特征层1,输出关键点的特征H12,中级别更新特征层1用来更新特征,中级别更新特征层1由3层全连接层构成,更新特征的公式表达如下:
H12=g12([F12,R12])
其中,[,]表示按照通道连接函数,g12()表示关于低级别更新特征层得到3层全连接层函数,H12为更新后的低级别人体骨架中所有关键点的特征;
步骤A11:将Fhp_12输入中级别卷积层1,输出G12;G12代表和中级历史序列Vhp_2对应的中级别卷积层1的输出结果;
步骤A12:将G12输入中级别线性层1,输出为F12
Figure FDA0003492035480000081
F12表示提取的中级别人体骨架中所有关键点的特征;
Figure FDA0003492035480000082
表示提取的中级别人体骨架中第i个关键点的特征,
Figure FDA0003492035480000083
表示提取的中级别人体骨架中第j个关键点的特征;
步骤A13:针对中级别人体骨架中的第i个关键点,中级别聚集相关特征层1把剩余M-1个关键点的特征聚合到第i个关键点上,然后经过中级别聚集相关特征层1的3层全连接层,确定对应的关键点列向量;
Figure FDA0003492035480000084
其中,[,]表示按照通道连接函数,f12()表示中级别聚集相关特征层1的3层全连接层函数,r12_i为1个关于第i个关键点的列向量,i=1,2,…,M,M代表关键点的总个数;
步骤A14:对中级别人体骨架中所有关键点都执行步骤A8,获取关于中级别人体骨架关键点的二维张量,R12的公式表达如下:
R12=(r12_1,...,r12_i,...,r12_M),i∈[1,M],
其中,R12是由M个列向量组成的二维张量;
步骤A15:将R12输入中级别更新特征层1,输出关键点的特征H12,中级别更新特征层1用来更新特征,中级别更新特征层1由3层全连接层构成,更新特征的公式表达如下:
H12=g12([F12,R12])
其中,[,]表示按照通道连接函数,g12()表示关于中级别更新特征层得到3层全连接层函数,H12为更新后的中级别人体骨架中所有关键点的特征;
步骤A16:将Fhp_13输入高级别卷积层1,输出G13;G13代表和高级历史序列Vhp_3对应的高级别卷积层1的输出结果;
步骤A17:将G13输入高级别线性层1,输出为F13
Figure FDA0003492035480000091
F13表示提取的高级别人体骨架中所有关键点的特征;
Figure FDA0003492035480000092
表示提取的高级别人体骨架中第i个关键点的特征,
Figure FDA0003492035480000093
表示提取的高级别人体骨架中第j个关键点的特征;
步骤A18:针对高级别人体骨架中的第i个关键点,高级别聚集相关特征层1把剩余M-1个关键点的特征聚合到第i个关键点上,然后经过高级别聚集相关特征层1的3层全连接层,确定对应的关键点列向量;
Figure FDA0003492035480000094
其中,[,]表示按照通道连接函数,f13()表示高级别聚集相关特征层1的3层全连接层函数,r13_i为1个关于第i个关键点的列向量,i=1,2,…,M,M代表关键点的总个数;
步骤A19:对高级别人体骨架中所有关键点都执行步骤A8,获取关于高级别人体骨架关键点的二维张量,R13的公式表达如下:
R13=(r13_1,...,r13_i,...,r13_M),i∈[1,M],
其中,R13是由M个列向量组成的二维张量;
步骤A15:将R13输入高级别更新特征层1,输出关键点的特征H13,高级别更新特征层1用来更新特征,高级别更新特征层1由3层全连接层构成,更新特征的公式表达如下:
H13=g13([F13,R13])
其中,[,]表示按照通道连接函数,g13()表示关于高级别更新特征层得到3层全连接层函数,H13为更新后的中级别人体骨架中所有关键点的特征。
5.如权利要求3所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤164,包括:
步骤S10:将H11和H12输入低级别特征融合层1,输出Shp_11;所述步骤S10包括:
在所述低级别特征融合层1中,H11和H12先经过1个softmax函数,其公式表达如下:
Figure FDA0003492035480000101
其中,T表示转置,A12表示连接权重矩阵,H11为更新后的低级别人体骨架中所有关键点的特征,H12为更新后的中级别人体骨架中所有关键点的特征,softmax函数用来将输入向量的每一个元素的值归一化至(0,1)之间,每一个元素的计算公式如下:
Figure FDA0003492035480000102
其中,e表示自然底数,K表示输入向量包含的元素数目,al表示输入向量的第l个元素,ak表示输入向量的第k个元素,k=1,2,…,K,Sl表示输入向量的第l个元素的值归一化后的结;
步骤S11:将H12融合至H11中,其公式表达如下:
Shp_11=A12·H12*ω+H11
其中,Shp_11表示H12和H11融合后的特征,也是低级别特征融合层1的输出,ω表示权重;
步骤S12:将所述H11、H12和H13输入中级别特征融合层1,输出为Shp_12;其中,在中级别特征融合层1中,H11和H12先经过1个softmax函数,其公式表达如下:
Figure FDA0003492035480000111
其中,T表示转置,A21表示连接权重;
接着,H13和H12经过一个softmax函数,其公式表达如下:
Figure FDA0003492035480000112
其中,T表示转置,A23表示连接权重,H13为更新后的高级别人体骨架中所有关键点的特征;
接着,将H11和H13融合至H12中,其公式表达如下:
Shp_12=(A21·H11+A23·H13)*θ+H12
其中,Shp_12表示H11、H12和H13融合后的特征,也是中级别特征融合层1的输出,θ表示权重;
步骤S13:将H13和H12输入高级别特征融合层1,输出为Shp_13;其中,在高级别特征融合层1中,H13和H12先经过1个softmax函数,其公式表达如下:
Figure FDA0003492035480000121
其中,T表示转置,A32表示连接权重矩阵,
接着,将H12融合至H13中,其公式表达如下:
Shp_13=A32·H12*γ+H13
其中,Shp_13表示H12和H13融合后的特征,也是高级别特征融合层1的输出,γ表示权重;
步骤S14:将所述Shp_11输入低级别时空卷积模块2,输出Fhp_21;其中,所述低级别时空卷积模块2包含1个空间图卷积层和1个时间卷积层;所述空间图卷积层有128个卷积核,每个卷积核大小为1×1;所述时间卷积层有64个卷积核,每个卷积核的大小为5×1;
步骤S15:将所述Shp_12输入中级别时空卷积模块2,输出Fhp_22;其中,所述中级别时空卷积模块2的结构与低级别时空卷积模块2的结构一致,其输入为Shp_12,输出为Fhp_22;高级别时空卷积模块2的结构与低级别时空卷积模块2的结构一致,其输入为Shp_13,输出为Fhp_23
步骤S16:将Shp_21输入低级别时空卷积模块3,输出Shp_31;其中,所述低级别时空卷积模块3包含1个空间图卷积层和1个时间卷积层;所述空间图卷积层有256个卷积核,每个卷积核大小为1×1;所述时间卷积层有128个卷积核,每个卷积核的大小为5×1;
步骤S17:将Shp_22输入中级别时空卷积模块3,输出Shp_32;其中,所述中级别时空卷积模块3的结构与低级别时空卷积模块3的结构一致;
步骤S18:将Shp_23输入中级别时空卷积模块3,输出Shp_33;其中,所述高级别时空卷积模块3的结构与低级别时空卷积模块3的结构一致;
步骤S19:将Shp_31输入低级别时空卷积模块4,输出Shp_41;其中,所述低级别时空卷积模块4包含1个空间图卷积层和1个时间卷积层。空间图卷积层有512个卷积核,每个卷积核大小为1×1;时间卷积层有256个卷积核,每个卷积核的大小为5×1;
步骤S20:将Shp_32输入中级别时空卷积模块4,输出Shp_42;其中,所述中级别时空卷积模块4的结构与低级别时空卷积模块4的结构一致;
步骤S21:将Shp_33输入高级别时空卷积模块4,输出Shp_43;其中,所述高级别时空卷积模块4的结构与低级别时空卷积模块3的结构一致;
步骤S22:将Shp_41、Shp_42和Shp_43输入预设的特征融合模块,输出Shp
步骤S23:特征融合模块对Shp_42进行采样,获取
Figure FDA0003492035480000131
并对
Figure FDA0003492035480000132
赋予权重β1;对Shp_43进行5次上采样,得到
Figure FDA0003492035480000133
并对
Figure FDA0003492035480000134
赋予权重β2;将Shp_41
Figure FDA0003492035480000135
Figure FDA0003492035480000136
相加,Shp的表达式如下:
Figure FDA0003492035480000137
其中,β1和β2分别对应
Figure FDA0003492035480000138
Figure FDA0003492035480000139
的权重;
步骤S24:将Shp、Shv和Sha输入特征级联模块的输入,输出为Hhistory;其中,Hhistory由Shp、Shv和Sha按通道拼接所得,Hhistory代表历史运动特征;
步骤S25:将未来序列Vfuture输入运动特征提取模块,获取未来运动特征Hfuture
6.如权利要求1所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤2,包括:
步骤21:将历史运动特征和未来运动特征相加,获取联合运动特征;
H=Hfuture+Hhistory
其中,H表示联合运动特征;
步骤22:将联合运动特征H、人体动作序列样本V中的第Thistory-2帧人体骨架
Figure FDA0003492035480000141
第Thistory-1帧人体骨架
Figure FDA0003492035480000142
和第Thistory帧人体骨架
Figure FDA0003492035480000143
输入预设的循环神经网络,计算待预测序列;其中,
所述步骤22还包括:
步骤220:将人体动作序列样本V的第Thistory-1帧人体骨架
Figure FDA0003492035480000144
和第Thistory帧人体骨架
Figure FDA0003492035480000145
输入预设的循环神经网络,计算人体骨架的速度S0
Figure FDA0003492035480000146
其中,S0表示人体动作序列样本V的第Thistory帧人体骨架的速度;
步骤221:将人体动作序列样本V中的第Thistory-2帧人体骨架
Figure FDA0003492035480000147
第Thistory-1帧人体骨架
Figure FDA0003492035480000148
和第Thistory帧人体骨架
Figure FDA0003492035480000149
传输至加速度计算模块,计算人体骨架的加速度:
Figure FDA00034920354800001410
其中,C0表示人体动作序列样本V的第Thistory帧人体骨架的加速度;
步骤222:将人体骨架的速度S0、加速度C0和第Thistory帧人体骨架
Figure FDA0003492035480000151
按照通道连接,确定连接结果I0,并将连接结果I0和联合运动特征H传输至门控循环单元GRU模块,输出B0和H0
步骤223:将B0传输至线性层,输出F0,F0的计算方式如下:
Figure FDA00034920354800001510
其中,W0是线性层的权重,
Figure FDA00034920354800001511
是线性层的偏置向量;
步骤224:将线性层的输出F0和人体动作序列样本V中第Thistory帧人体骨架
Figure FDA0003492035480000152
相加,得到人体动作序列样本V的第Thistory+1帧人体骨架的预测结果
Figure FDA0003492035480000153
步骤225:将人体动作序列样本V的第Thistory+1帧人体骨架的预测结果
Figure FDA0003492035480000154
人体动作序列样本V的第Thistory帧人体骨架
Figure FDA0003492035480000155
第Thistory-1帧人体骨架
Figure FDA0003492035480000156
和第1个循环中GRU的其中一个输出H0输入第二个循环,输出为人体动作序列样本V的第Thistory+2帧人体骨架的预测结果
Figure FDA0003492035480000157
步骤23:对人体动作序列样本V的人体骨架进行递增并重复步骤22,确定待预测序列:
Figure FDA0003492035480000158
p∈[Thistory+1,Thistory+Tpredict],
其中,
Figure FDA0003492035480000159
为计算所得的待预测序列的第p帧骨架的矩阵表示;
步骤24:通过人体动作序列样本、运动特征提取模块和动作预测模块,构造双流动作预测网络;其中,
所述双流动作预测网络的损失函数L1为:
Figure FDA0003492035480000161
其中,|| ||1表示1范数,
Figure FDA0003492035480000162
是第n个预测序列的真实值,
Figure FDA0003492035480000163
是动作预测模块的输出,
Figure FDA0003492035480000164
Figure FDA0003492035480000165
Figure FDA0003492035480000166
代表动作预测模块输出的第n个预测序列样本。
7.如权利要求1所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤4,包括:
步骤40:提取经过训练的运动特征提取模块的历史运动特征Hhistory,将所述历史运动特征Hhistory传输至分类模块的线性层1,输出结果Q1
Figure FDA0003492035480000167
其中,W1是线性层1的权重,
Figure FDA00034920354800001614
是线性层1的偏置向量,
Figure FDA0003492035480000168
是relu激活函数,relu代表线性整流函数,
Figure FDA0003492035480000169
x是relu激活函数的输入,当x大于等于0时,relu激活函数的输出为x,当x小于0时,relu激活函数的输出为0,Q1代表线性层1的输出结果;
步骤41:将线性层1的输出结果Q1输入线性层2,输出结果Q2
Figure FDA00034920354800001610
其中,
Figure FDA00034920354800001611
是relu激活函数,W2是线性层2的权重,
Figure FDA00034920354800001615
是线性层2的偏置向量;
步骤42:将线性层1的输出结果Q1输入线性层2,输出结果Q2
Figure FDA00034920354800001612
其中,W3是线性层3的权重,
Figure FDA00034920354800001616
是线性层3的偏置向量,
Figure FDA00034920354800001613
表示softmax激活函数,Q3表示输入的历史运动特征属于各个动作类别的概率;
步骤43:选择Q3中最大的概率值对应的动作类别,将所述动作类别作为分类模块的输出;
步骤44:将历史序列输入训练好的运动特征提取模块,确定历史运动特征样本;
步骤45:将历史运动特征样本输入至分类模块,基于分类模块中预设的损失函数L2,训练分类模块至收敛;其中,训练分类模块使用的损失函数L2为:
Figure FDA0003492035480000171
其中,G是动作类别的总数,A是输入的历史运动特征样本的总数,
Figure FDA0003492035480000172
是第a个历史运动特征样本的各个动作类别的概率,
Figure FDA0003492035480000173
代表第g维数据第a个历史运动特征样本的网络输出,Ia是第a个历史运动特征样本的期望输出,其中,Ia的第g维数据定义为:
Figure FDA0003492035480000174
其中,ia是第a个历史运动特征样本的标签值。
8.如权利要求1所述的一种基于持续监控的人体动作预测方法,其特征在于,所述自更新动作预测模型,包括运动特征提取模块、分类模块、字典模块和动作预测模块;其中,
所述运动特征提取模块的输入为测试的人体动作序列样本划分的历史序列
Figure FDA0003492035480000175
输出为测试的人体动作序列样本的历史运动特征
Figure FDA0003492035480000176
所述分类模块的输入为测试的人体动作序列样本的历史运动特征
Figure FDA0003492035480000181
输出为动作类别g1
所述字典模块的输入为动作类别g1和测试的人体动作序列样本的历史运动特征
Figure FDA0003492035480000182
查找未来运动特征
Figure FDA0003492035480000183
所述查找未来运动特征
Figure FDA0003492035480000184
包括以下步骤:
步骤81:将测试的人体动作序列样本的历史运动特征
Figure FDA0003492035480000185
向量化,确定新行向量
Figure FDA0003492035480000186
其中,
所述
Figure FDA0003492035480000187
为维度为2560的向量;
步骤82:在字典模块中选择动作类别g1对应的子字典
Figure FDA0003492035480000188
对子字典
Figure FDA0003492035480000189
的第i个键存储的历史运动特征
Figure FDA00034920354800001810
向量化,将所述历史运动特征
Figure FDA00034920354800001811
中的所有行向量进行连接,确定新行向量
Figure FDA00034920354800001812
其中,
所述
Figure FDA00034920354800001813
为维度为2560的向量;
步骤83:计算人体动作序列样本的历史运动特征与动作类别g1存储的第i个历史运动特征间的余弦相似度:
Figure FDA00034920354800001814
其中,·表示点积运算,
Figure FDA00034920354800001815
表示
Figure FDA00034920354800001816
的2范数,
Figure FDA00034920354800001817
表示
Figure FDA00034920354800001818
的2范数,simi代表测试的人体动作序列样本的历史运动特征与动作类别g1存储的第i个历史运动特征间的余弦相似度;
步骤84:计算动作类别g1存储的所有历史运动特征与测试的人体动作序列样本的历史运动特征间的相似度,得到{sim1,...,simi,...,sim2000};
步骤85:查找余弦相似度的最大值simj,simj=max{sim1,...,simi,...,sim2000};其中,
所述simj为余弦相似度最大值;
步骤86:在动作类别g1对应的子字典中查找第j个键
Figure FDA0003492035480000191
并找到第j个键对应的值
Figure FDA0003492035480000192
Figure FDA0003492035480000193
存储的未来运动特征
Figure FDA0003492035480000194
作为查找得到的未来运动特征
Figure FDA0003492035480000195
9.如权利要求5所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤S15和S步骤16之间还包括:
将低级历史序列,中级历史序列和高级历史序列依次传输至对应的时空卷积模块1、融合模块1和时空卷积模块2,输出低级卷积结果Fhp_21、中级卷积结果Fhp_22和高级卷积结果Fhp_23
步骤S151:将低级卷积结果Fhp_21输入融合模块2的低级别卷积层2,输出结果G21,将结果G21输入低级别线性层2,输出结果F21,将结果F21输入低级别聚集相关特征层2,输出结果H21,将结果H21输入低级别特征融合层2,确定结果Shp_21
步骤S152:将中级卷积结果Fhp_22输入融合模块2的中级别卷积层2,输出结果G22,将结果G22输入中级别线性层2,输出结果F22,将结果F22输入中级别聚集相关特征层2,输出结果H22,将结果H22输入中级别特征融合层2,确定结果Shp_22
步骤S153:将高级卷积结果Fhp_23输入融合模块2的高级别卷积层2,输出结果G23,将结果G23输入高级别线性层2,输出结果F23,将结果F23输入高级别聚集相关特征层2,输出结果H23,将结果H23输入高级别特征融合层2,确定结果Shp_23
10.如权利要求1所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤6,包括:
步骤A1:将测试的人体动作序列样本的历史运动特征
Figure FDA0003492035480000201
和查找得到的未来运动特征
Figure FDA0003492035480000202
相加,输入动作预测模块,得到第1次动作预测结果
Figure FDA0003492035480000203
其公式表达如下:
Figure FDA0003492035480000204
其中,
Figure FDA0003492035480000205
为第1次动作预测结果的第p帧骨架的矩阵表达,
Figure FDA0003492035480000206
为测试的人体动作序列样本V的第51帧人体骨架的预测结果,
Figure FDA0003492035480000207
为测试的人体动作序列样本V的第p帧人体骨架的预测结果,
Figure FDA0003492035480000208
为测试的人体动作序列样本V的第75帧人体骨架的预测结果;
步骤A2:获取第1帧人体骨架矩阵中的第1帧人体骨架
Figure FDA0003492035480000209
通过第1次动作预测结果
Figure FDA00034920354800002010
中的第1帧人体骨架
Figure FDA00034920354800002011
与人体动作序列样本中第2帧人体骨架至第Thistory帧人体骨架,组成第1次重构的历史序列
Figure FDA00034920354800002012
将第1次重构的历史序列
Figure FDA00034920354800002013
输入运动特征提取模块,输出为第1次更新后的历史运动特征
Figure FDA00034920354800002014
步骤A3:将第1次更新后的历史运动特征
Figure FDA00034920354800002015
输入分类模块,输出动作类别g2
步骤A4:将动作类别g2和第1次更新后的历史运动特征
Figure FDA00034920354800002016
输入所述字典模块,返回自更新动作预测模型的字典模块,重复步骤81-86,查找未来运动特征
Figure FDA00034920354800002017
步骤A5:重复步骤A1,得到第2次动作预测结果
Figure FDA00034920354800002018
步骤A6:通过第1次动作预测结果
Figure FDA0003492035480000211
中的第1帧人体骨架,第2次动作预测结果
Figure FDA0003492035480000212
中的第1帧人体骨架与人体动作序列样本中第3帧人体骨架至第Thistory帧人体骨架,组成第2次重构的历史序列
Figure FDA0003492035480000213
将所述历史序列
Figure FDA0003492035480000214
输入运动特征提取模块,重复步骤A2-A5至预设的重复次数,基于所述重复次数,确定最终的动作预测结果。
CN202210099728.9A 2022-01-27 2022-01-27 一种基于持续监控的动作预测方法 Pending CN114511928A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210099728.9A CN114511928A (zh) 2022-01-27 2022-01-27 一种基于持续监控的动作预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210099728.9A CN114511928A (zh) 2022-01-27 2022-01-27 一种基于持续监控的动作预测方法

Publications (1)

Publication Number Publication Date
CN114511928A true CN114511928A (zh) 2022-05-17

Family

ID=81549926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210099728.9A Pending CN114511928A (zh) 2022-01-27 2022-01-27 一种基于持续监控的动作预测方法

Country Status (1)

Country Link
CN (1) CN114511928A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023142552A1 (zh) * 2022-01-27 2023-08-03 苏州大学 一种面向未知类别的动作预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023142552A1 (zh) * 2022-01-27 2023-08-03 苏州大学 一种面向未知类别的动作预测方法

Similar Documents

Publication Publication Date Title
Chen et al. Localizing natural language in videos
Zheng et al. Dynamic sampling networks for efficient action recognition in videos
US20230274420A1 (en) Method and system for automated generation of text captions from medical images
JP2021524099A (ja) 異なるデータモダリティの統計モデルを統合するためのシステムおよび方法
CN111798921A (zh) 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置
CN111243682A (zh) 药物的毒性预测方法及装置、介质和设备
WO2023142552A1 (zh) 一种面向未知类别的动作预测方法
CN112420125A (zh) 分子属性预测方法、装置、智能设备和终端
AU2022392233A1 (en) Method and system for analysing medical images to generate a medical report
CN113948157A (zh) 化学反应分类方法、装置、电子设备及存储介质
Hu et al. Saliency-based YOLO for single target detection
CN114511928A (zh) 一种基于持续监控的动作预测方法
Ghosh et al. Leukox: leukocyte classification using least entropy combiner (lec) for ensemble learning
CN114495277A (zh) 一种人体动作预测方法
CN112183580B (zh) 一种基于动态知识路径学习的小样本分类方法
Wezeman et al. Distance-based classifier on the Quantum Inspire
Gong et al. KDCTime: Knowledge distillation with calibration on InceptionTime for time-series classification
CN116959605A (zh) 分子性质预测方法、分子性质预测模型的训练方法及装置
CN116109449A (zh) 一种数据处理方法及相关设备
CN115795025A (zh) 一种摘要生成方法及其相关设备
CN113010687B (zh) 一种习题标签预测方法、装置、存储介质以及计算机设备
Divyavarshini et al. Vehicle Recognition Using CNN
CN114707070A (zh) 一种用户行为预测方法及其相关设备
Kumar et al. A weakly supervised cnn model for spatial localization of human activities in unconstraint environment
Park et al. [Regular Paper] Interpretable Prediction of Vascular Diseases from Electronic Health Records via Deep Attention Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination