CN114511928A - 一种基于持续监控的动作预测方法 - Google Patents
一种基于持续监控的动作预测方法 Download PDFInfo
- Publication number
- CN114511928A CN114511928A CN202210099728.9A CN202210099728A CN114511928A CN 114511928 A CN114511928 A CN 114511928A CN 202210099728 A CN202210099728 A CN 202210099728A CN 114511928 A CN114511928 A CN 114511928A
- Authority
- CN
- China
- Prior art keywords
- level
- sequence
- layer
- module
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于持续监控的动作预测方法,包括:将预设的人体动作序列样本划分为历史序列、待预测序列和未来序列,并将历史序列和未来序列输入预设的运动特征提取模块,提取历史运动特征和未来运动特征;将历史运动特征和未来运动特征相加后,输入预设的动作预测模块进行训练,构造双流动作预测网络;将历史序列和未来序列输入双流动作预测网络,训练双流动作预测网络和训练分类模块至收敛;将双流动作预测网络和分类模块加入字典模块,构建双流信息储存网络;将运动特征提取模块、分类模块、动作预测模块和字典模块相结合,构造自更新动作预测模型;将人体动作序列样本划分的历史序列输入自更新动作预测模型,确定动作预测结果。
Description
技术领域
本发明涉及大数据中心、动作预测技术领域,特别涉及一种基于持续监控的动作预测方法。
背景技术
目前,人体动作预测是计算机视觉领域的一个重要课题。它在人机交互、智能视频监控等领域有着广泛的应用。随着微软Kinect等电子设备的迅猛发展以及各种硬件的迅速更新,基于人体骨架的人体动作预测方法得到越来越多学者的关注。相比于基于视频的人体动作预测方法,基于人体骨架的人体动作预测方法鲁棒性强,不受光照和背景颜色混入等影响。
现有方法大都通过提取人体动作序列初始的历史运动特征,分析人体的惯性运动,进行人体动作预测。这些方法忽略了对人体动作意图的研究,因此在短期动作预测中效果较好,而在长期动作预测中效果较差。并且,这些方法更适合在有限长视频监控中进行动作预测,而在持续视频监控中并不适用。
因此,针对上述动作预测算法问题,提出一种持续监控中的动作预测方法。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于持续监控的动作预测方法流程图;
图2为本发明实施例中一种基于持续监控的动作预测方法的提取未来运动特征的流程流程图;
图3为本发明实施例中一种基于持续监控的动作预测方法的动作预测模块流程图;
图4为本发明实施例中一种基于持续监控的动作预测方法的双流动作预测网络流程图;
图5为本发明实施例中一种基于持续监控的动作预测方法的分类模块图;
图6为本发明实施例中一种基于持续监控的动作预测方法的双流信息储存网络流程图;
图7为本发明实施例中一种基于持续监控的动作预测方法的字典模块流程图;
图8为本发明实施例中一种基于持续监控的动作预测方法的自更新动作预测模型流程图;
图9为本发明实施例中一种基于持续监控的动作预测方法的20个关键点的人体骨架流程图;
图10为本发明实施例中一种基于持续监控的动作预测方法的中级别人体骨架流程图;
图11为本发明实施例中一种基于持续监控的动作预测方法的高级别人体骨架流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
需说明的是,当部件被称为“固定于”或“设置于”另一个部件,它可以直接在另一个部件上或者间接在该另一个部件上。当一个部件被称为是“连接于”另一个部件,它可以是直接或者间接连接至该另一个部件上。
需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,“多个”的含义是两个或两个以上,除非另有明确具体的限定。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
作为本技术方案的一种实施例,一个人体动作序列样本包含100帧人体骨架,以任意人体动作序列样本V为例:
V=[X1,...,Xt,...,X100],t∈[1,100],
其中,t表示时间索引,人体动作序列样本V共有100帧。 为人体动作序列样本V的第t帧人体骨架的矩阵表示,该帧人体骨架的矩阵表示的行数和列数分别为20和60,R表示矩阵为实数矩阵,该帧人体骨架由20个关键点表示,每个关键点由1个60维的向量表示,该帧人体骨架如图9所示。
将人体动作序列样本V划分为历史序列、待预测序列和未来序列,其中,历史序列有50帧,待预测序列有25帧,未来序列有25帧,此时,人体动作序列样本可以表示为由历史序列、待预测序列和未来序列组成的集合,用公式表达如下:
V={Vhistory,Vpredict,Vfuture},
其中,Vhistory表示历史序列,Vpredict表示待预测序列,Vfuture表示未来序列,历史序列Vhistory的公式表达如下:
Vhistory=[X1,...,Xh,...,X50],h∈[1,50],
其中,h表示时间索引,历史序列共有50帧。历史序列由人体动作序列样本V的第1帧人体骨架到第50帧人体骨架构成。 为历史序列Vhistory的第h帧人体骨架的矩阵表示;待预测序列Vpredict的公式表达如下:
Vpredict=[X51,...,Xp,...,X75],p∈[51,75],
未来序列Vfuture的公式表达如下:
Vfuture=[X76,…,Xf,…,X100],f∈[76,100],
作为本技术方案的一种实施例,将人体动作序列样本划分的历史序列输入运动特征提取模块提取历史运动特征,人体动作序列样本划分的未来序列输入运动特征提取模块提取未来运动特征。运动特征提取模块包括:速度计算模块,加速度计算模块,级别划分模块,融合模块1,融合模块2,低级别时空卷积模块1,低级别时空卷积模块2,低级别时空卷积模块3,低级别时空卷积模块4,中级别时空卷积模块1,中级别时空卷积模块2,中级别时空卷积模块3,中级别时空卷积模块4,高级别时空卷积模块1,高级别时空卷积模块2,高级别时空卷积模块3,高级别时空卷积模块4,特征融合模块和特征级联模块。
作为本技术方案的一种实施例,人体动作序列样本划分的历史序列输入运动特征提取模块提取历史运动特征的流程如图1所示,速度计算模块的输入为人体动作序列样本划分的历史序列Vhistory,输出为历史速度序列Vhistory_v。Vhistory_v的公式表达如下:
加速度计算模块的输入为历史速度序列Vhistory_v,输出为历史加速度序列Vhistory_a。Vhistory_a的公式表达如下:
如图1最左侧一列所示,级别划分模块1的输入为Vhistory,其有三个输出,分别为Vhp_1、Vhp_2和Vhp_3。Vhp_1代表低级别人体骨架的历史序列、Vhp_2代表中级别人体骨架的历史序列,Vhp_3代表高级别人体骨架的历史序列。级别划分模块由池化层1和池化层2组成。池化层1由10个池化尺寸为2的平均池化层组成。池化层2由5个池化尺寸为4的平均池化层构成。Vhp_1=Vhistory,表示将历史序列看作低级别人体骨架的历史序列。历史序列Vhistory输入至池化层1中,得到中级别人体骨架的历史序列Vhp_2。Vhp_2的表达式如下所示:
Vhp_2=[mid1,...,midh,...,mid50],h∈[1,50],
低级别时空卷积模块1的输入为Vhp_1,输出为Fhp_11。低级别时空卷积模块1包含1个空间图卷积层和1个时间卷积层。空间图卷积层有64个卷积核,每个卷积核大小为1×1。时间卷积层有32个卷积核,每个卷积核的大小为5×1。中级别时空卷积模块1的结构与低级别时空卷积模块1的结构一致,其输入为Vhp_2,输出为Fhp_12。高级别时空卷积模块1的结构与低级别时空卷积模块1的结构一致,其输入为Vhp_3,输出为Fhp_13。
融合模块1包含低级别卷积层1,低级别线性层1,低级别聚集相关特征层1,低级别更新特征层1,低级别特征融合层1,中级别卷积层1,中级别线性层1,中级别聚集相关特征层1,中级别更新特征层1,中级别特征融合层1,高级别卷积层1,高级别线性层1,高级别聚集相关特征层1,高级别更新特征层1和高级别特征融合层1。
低级别卷积层1包含32个卷积核,每个卷积核大小为5×1,低级别卷积层1的输入为Fhp_11,输出为G11。低级别线性层1由3层全连接层构成,其输入为G11,输出为F11。F11表示提取的低级别人体骨架中所有关键点的特征。表示提取的低级别人体骨架中第i个关键点的特征,表示提取的低级别人体骨架中第j个关键点的特征。针对低级别人体骨架中的第i个关键点,低级别聚集相关特征层1把剩余19个关键点的特征聚合到第i个关键点上,然后经过3层全连接层,其公式表达如下:
其中,[·,·]表示按照通道连接,f11(·)表示3层全连接层,r11_i为1个列向量。对低级别人体骨架中所有关键点都执行上述操作后,得到R11。R11的公式表达如下:
R11=(r11_1,...,r11_i,...,r11_20),i∈[1,20],
该公式表示R11是由20个列向量组成的二维张量。低级别更新特征层1的输入为R11,输出为H11。低级别更新特征层1用来更新特征,其由3层全连接层构成,特征更新的公式表达如下:
H11=g11([F11,R11]),
其中,[·,·]表示按照通道连接,g11(·)表示3层全连接层,H11为更新后的低级别人体骨架中所有关键点的特征。
中级别卷积层1的结构与低级别卷积层1的结构一致,其输入为Fhp_12,输出为G12。中级别线性层1的结构与低级别线性层1的结构一致,其输入为G12,输出为F12。中级别聚集相关特征层1的结构与低级别聚集相关特征层1的结构一致,其输入为F12,输出为R12。中级别更新特征层1的结构与低级别更新特征层1的结构一致,其输入为R12,输出为H12。H12为更新后的中级别人体骨架中所有关键点的特征。
高级别卷积层1的结构与低级别卷积层1的结构一致,其输入为Fhp_13,输出为G13。高级别线性层1的结构与低级别线性层1的结构一致,其输入为G13,输出为F13。高级别聚集相关特征层1的结构与低级别聚集相关特征层1的结构一致,其输入为F13,输出为R13。高级别更新特征层1的结构与低级别更新特征层1的结构一致,其输入为R13,输出为H13。H13为更新后的中级别人体骨架中所有关键点的特征。
低级别特征融合层1的输入为H11和H12,输出为Shp_11。在低级别特征融合层1中,H11和H12先经过1个softmax函数,其公式表达如下:
其中,T表示转置,A12表示连接权重矩阵。softmax函数用来将输入向量的每一个元素的值归一化至(0,1)之间,每一个元素的计算公式如下:
其中,e表示自然底数,K表示输入向量包含的元素数目,al表示输入向量的第l个元素,ak表示输入向量的第k个元素,Sl表示输入向量的第l个元素的值归一化后的结果。接着,将H12融合至H11中,其公式表达如下:
Shp_11=A12·H12*0.3+H11,
其中,Shp_11表示H12和H11融合后的特征,也是低级别特征融合层1的输出,0.3表示权重。
中级别特征融合层1的输入为H11、H12和H13,输出为Shp_12。在中级别特征融合层1中,H11和H12先经过1个softmax函数,其公式表达如下:
其中,T表示转置,A21表示连接权重。接着,H13和H12经过1个softmax函数,其公式表达如下:
其中,T表示转置,A23表示连接权重。接着,将H11和H13融合至H12中,其公式表达如下:
Shp_12=(A21·H11+A23·H13)*0.3+H12,其中,Shp_12表示H11、H12和H13融合后的特征,也是中级别特征融合层1的输出,0.3表示权重。
高级别特征融合层1的输入为H13和H12,输出为Shp_13。在高级别特征融合层1中,H13和H12先经过1个softmax函数,其公式表达如下:
其中,T表示转置,A32表示连接权重矩阵。接着,将H12融合至H13中,其公式表达如下:
Shp_13=A32·H12*0.3+H13,
其中,Shp_13表示H12和H13融合后的特征,也是高级别特征融合层1的输出,0.3表示权重。
低级别时空卷积模块2的输入为Shp_11,输出为Fhp_21。低级别时空卷积模块2包含1个空间图卷积层和1个时间卷积层。空间图卷积层有128个卷积核,每个卷积核大小为1×1。时间卷积层有64个卷积核,每个卷积核的大小为5×1。中级别时空卷积模块2的输入为Shp_12,输出为Fhp_22。中级别时空卷积模块2的结构与低级别时空卷积模块2的结构一致,其输入为Shp_12,输出为Fhp_22。高级别时空卷积模块2的结构与低级别时空卷积模块2的结构一致,其输入为Shp_13,输出为Fhp_23。
融合模块2的结构与融合模块1的结构一致,融合模块2共有3个输出,分别为Shp_21、Shp_22和Shp_23。
低级别时空卷积模块3的输入为Shp_21,输出为Shp_31。低级别时空卷积模块3包含1个空间图卷积层和1个时间卷积层。空间图卷积层有256个卷积核,每个卷积核大小为1×1。时间卷积层有128个卷积核,每个卷积核的大小为5×1。输入为Shp_22,输出为Shp_32中级别时空卷积模块3结构与低级别时空卷积模块3的结构一致,其输入为Shp_22,输出为Shp_32。高级别时空卷积模块3的结构与低级别时空卷积模块3的结构一致,其输入为Shp_23,输出为Shp_33。
低级别时空卷积模块4的输入为Shp_31,输出为Shp_41。低级别时空卷积模块4包含1个空间图卷积层和1个时间卷积层。空间图卷积层有512个卷积核,每个卷积核大小为1×1。时间卷积层有256个卷积核,每个卷积核的大小为5×1。中级别时空卷积模块4的结构与低级别时空卷积模块4的结构一致,其输入为Shp_32,输出为Shp_42。高级别时空卷积模块4的结构与低级别时空卷积模块4的结构一致,其输入为Shp_33,输出为Shp_43。
特征融合模块的输入为Shp_41、Shp_42和Shp_43,输出为Shp。为了使Shp_41、Shp_42和Shp_43三者的张量尺寸大小一致。特征融合模块对Shp_42进行10次上采样,得到并对赋予权重0.6得到对Shp_43进行5次上采样,得到并对赋予权重0.6得到接着将Shp_41、和相加。Shp的表达式如下:
如图1中间一列所示,其结构与图1最左侧一列的结构一致。图1中间一列的输入为历史速度序列Vhistory_v,输出为Shv。如图1最右侧一列所示,其结构与图1最左侧一列的结构一致。图1最右侧一列的输入为历史加速度序列Vhistory_a,输出为Sha。
特征级联模块的输入为Shp、Shv和Sha,输出为Hhistory。Hhistory由Shp、Shv和Sha按通道拼接所得。Hhistory代表历史运动特征。
人体动作序列样本划分的未来序列Vfuture输入运动特征提取模块提取未来运动特征的流程与人体动作序列样本划分的历史序列Vhistory输入运动特征提取模块提取历史特征的流程一致,如图2所示,Hfuture代表未来运动特征。
作为本技术方案的一种实施例,将历史运动特征和未来运动特征相加,输入动作预测模块。历史运动特征和未来运动特征相加得到联合运动特征,用公式表达如下:
H=Hfuture+Hhistory,
其中,H表示联合运动特征。
动作预测模块由循环神经网络构成,该循环神经网络共有25个循环,其结构如图3所示,包括速度计算模块、加速度计算模块、门控循环单元GRU和线性层。动作预测模块有4个输入,分别为联合运动特征H、人体动作序列样本V中的第48帧人体骨架X48、第49帧人体骨架X49、和第50帧人体骨架X50。
如图3最左侧一列所示,它表示第1个循环。速度计算模块的输入为人体动作序列样本V的第49帧人体骨架X49和第50帧人体骨架XT50,其输出为S0,S0的计算方法如下:
其中,S0表示人体动作序列样本V的第50帧人体骨架的速度。
加速度计算模块的输入为人体动作序列样本V中的第48帧人体骨架X48、第49帧人体骨架X49、和第50帧人体骨架X50,其输出为C0,C0的计算方法如下:
其中,C0表示人体动作序列样本V的第50帧人体骨架的加速度。
接着,将S0、C0和X50按照通道连接,得到I0。门控循环单元GRU模块的输入为I0和H,输出为B0和H1。线性层的输入为B0,输出为F0。F0的计算方式如下:
F0=W0·B0+θ0,
其中,W0是线性层的权重,θ0是线性层的偏置向量。
如图3第2列所示,它表示第2个循环,其结构与第1个循环的结构一致。第2个循环的输入为人体动作序列样本V的第51帧人体骨架的预测结果人体动作序列样本V的第50帧人体骨架X50、第49帧人体骨架X49和第1个循环中GRU的其中一个输出H0。第2个循环的输出为人体动作序列样本V的第52帧人体骨架的预测结果
如图3最右侧一列所示,它表示第25个循环,其结构与第1个循环的结构一致。第25个循环的输入为人体动作序列样本V的第74帧人体骨架的预测结果第73帧人体骨架的预测结果第72帧人体骨架的预测结果和第24个循环中GRU的其中一个输出H24。第25个循环的输出为人体动作序列样本V的第75帧人体骨架的预测结果
作为本技术方案的一种实施例,构造双流动作预测网络,如图4所示,该网络的输入为人体动作序列样本划分的历史序列和未来序列,输出为计算所得的待预测序列,即动作预测模块的输出动作预测模块输出的第n个预测序列样本为且一共有32个样本。网络的损失函数L1为:
作为本技术方案的一种实施例,将用来训练的人体动作序列样本划分的历史序列和未来序列输入双流动作预测网络,训练网络至收敛。其中,用来训练的人体动作序列样本取自于持续监控领域。
作为本技术方案的一种实施例,将训练好的运动特征提取模块提取的历史运动特征输入分类模块,进行动作分类,训练分类模块至收敛。分类模块的结构如图5所示,线性层1的输入为训练好的运动特征提取模块提取的历史运动特征Hhistory,线性层1包含的神经元数目为2560,线性层1的输出Q1的计算方式如下:
x是relu激活函数的输入,当x大于等于0时,relu激活函数的输出为x,当x小于0时,relu激活函数的输出为0。
线性层2的输入为Q1,线性层2包含神经元的数目为1280,线性层2的输出Q2的计算方式如下:
线性层3的输入为Q2,线性层3包含神经元的数目为15,线性层3的输出Q3的计算方式如下:
其中,W3是线性层3的权重,θ3是线性层3的偏置向量,是softmax激活函数。Q3的输出表示输入的历史运动特征属于各个动作类别的概率。动作类别的总数与线性层3包含神经元的数目一致,为15。选择Q3中最大的概率值对应的动作类别作为分类模块的输出。
将用来训练的人体动作序列样本划分的历史序列输入训练好的运动特征提取模块,得到历史运动特征样本。再将历史运动特征样本输入至分类模块,训练分类模块至收敛。训练分类模块使用的损失函数L2为:
其中,ia是第a个历史运动特征样本的标签值。
作为本技术方案的一种实施例,将训练好的双流动作预测网络和训练好的分类模块相结合,并加入储存信息的空的字典模块,构建双流信息储存网络,如图6所示。图6第1行中的运动特征提取模块的输入为用来训练的人体动作序列样本划分的历史序列,输出为历史运动特征Hhistory。图6第2行中的运动特征提取模块的输入为用来训练的人体动作序列样本划分的未来序列,输出为未来运动特征Hfuture。分类模块的输入为历史运动特征Hhistory,输出为该历史运动特征属于的动作类别。字典模块的输入为分类模块输出的动作类别、历史运动特征Hhistory和未来运动特征Hfuture。历史运动特征和未来运动特征相加,输入动作预测模块,得到动作预测结果。
作为本技术方案的一种实施例,将用来训练的人体动作序列样本划分的历史序列和未来序列输入双流信息储存网络,在字典模块储存每一种动作的历史运动特征和未来运动特征的对应关系。字典模块的结构如图7所示,字典模块中的键用来表示动作类别:key1表示第1个动作类别,key15用来表示第15个动作类别。字典模块中每一个键对应的值为一个子字典:value1表示第1个子字典,value15表示第15个子字典。第1个子字典value1的键用来存储第1个动作类别的历史运动特征,第1个子字典value1的值用来存储第1个动作类别的未来运动特征:键用来存储第1个动作类别的第1个历史运动特征值用来存储第1个动作类别的第1个未来运动特征键用来存储第1个动作类别的第2000个历史运动特征值用来存储第1个动作类别的第2000个未来运动特征第15个子字典value15的键用来存储第15个动作类别的历史运动特征,值用来存储第15个动作类别的未来运动特征。键用来存储第15个动作类别的第1个历史运动特征值用来存储第15个动作类别的第1个未来运动特征键用来存储第15个动作类别的第2000个历史运动特征值用来存储第15个动作类别的第2000个未来运动特征
作为本技术方案的一种实施例,将训练好的运动特征提取模块、训练好的分类模块、训练好的动作预测模块和储存完信息的字典模块相结合,构造自更新动作预测模型,自更新动作预测模型如图8所示。自更新动作预测模型共进行25次动作预测,其输入为测试的人体动作序列样本的历史序列输出为最终的动作预测结果其中,测试的人体动作序列样本取自于持续监控领域。
如图8第1列所示,它包括运动特征提取模块、分类模块、字典模块和动作预测模块,它表示第1个迭代过程,用来进行第1次动作预测。运动特征提取模块的输入为测试的人体动作序列样本划分的历史序列输出为测试的人体动作序列样本的历史运动特征分类模块的输入为测试的人体动作序列样本的历史运动特征输出为动作类别g1。字典模块的输入为动作类别g1和测试的人体动作序列样本的历史运动特征输出为查找得到的未来运动特征查找未来运动特征的方法如下:
(3)计算测试的人体动作序列样本的历史运动特征与动作类别g1存储的第i个历史运动特征间的余弦相似度,计算方法如下:
(4)计算动作类别g1存储的所有历史运动特征与测试的人体动作序列样本的历史运动特征间的相似度,得到{sim1,...,simi,...,sim2000}。
(5)查找余弦相似度的最大值simj,simj=max{sim1,...,simi,...,sim2000}。
如图8第2列所示,它表示第1次更新过程,用来进行第2次动作预测,其结构与图8第1列的结构一致。运动特征提取模块的输入为第1次重构的历史序列输出为第1次更新后的历史运动特征第1次重构的历史序列由测试的人体动作序列样本划分的历史序列的第2帧人体骨架X2到第50帧人体骨架X50和第1次动作预测结果中的首帧人体骨架构成,公式表达如下:
分类模块的输入为第1次更新后的历史运动特征输出为第1次更新后的动作类别g2。字典模块的输入为第1次更新后的历史运动特征和第1次更新后的动作类别g2,输出为第1次更新后查询得到的未来运动特征将第1次更新后的历史运动特征和第1次更新后查询得到的未来运动特征相加,输入动作预测模块,得到第2次动作预测结果第2次动作预测结果的公式表达如下:
如图8第3列所示,它表示第2次更新过程,用来进行第3次动作预测,其结构与图8第1列的结构一致。运动特征提取模块的输入为第2次重构的历史序列输出为第2次更新后的历史运动特征第2次重构的历史序列由测试的人体动作序列样本划分的历史序列的第3帧人体骨架X3到第50帧人体骨架X50、第1次动作预测结果中的首帧人体骨架和第2次动作预测结果中的首帧人体骨架构成,其公式表达如下:
分类模块的输入为第2次更新后的历史运动特征输出为第2次更新后的动作类别g3。字典模块的输入为第2次更新后的历史运动特征和第2次更新后的动作类别g3,输出为第2次更新后查询得到的未来运动特征将第2次更新后的历史运动特征和第2次更新后查询得到的未来运动特征相加,输入动作预测模块,得到第3次动作预测结果第3次动作预测结果的公式表达如下:
作为本技术方案的一种实施例,将用来测试的人体动作序列样本划分的历史序列输入自更新的动作预测模型,实现动作预测。
本技术方案的有益效果在于:提出的自更新动作预测模型能够更新人体动作序列样本的历史运动特征,使得人体动作意图更加明确,有助于提高长期动作预测的准确率。并且,自更新动作预测模型更适用于持续视频监控中的动作预测。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种基于持续监控的动作预测方法,其特征在于,包括:
步骤1:将预设的人体动作序列样本划分为历史序列、待预测序列和未来序列,并将历史序列和未来序列输入预设的运动特征提取模块,提取历史运动特征和未来运动特征;其中,
所述运动特征提取模块中包括速度计算模块,加速度计算模块,级别划分模块,融合模块,时空卷积模块,特征融合模块和特征级联模块;
步骤2:将历史运动特征和未来运动特征相加后,并输入预设的动作预测模块进行训练,构造双流动作预测网络;
步骤3:将历史序列和未来序列输入双流动作预测网络,训练双流动作预测网络至收敛;
步骤4:通过经过训练的运动特征提取模块,提取历史运动特征输入预设的分类模块进行动作分类,训练分类模块至收敛;
步骤5:将经过训练的双流动作预测网络和分类模块结合并加入预设的字典模块,构建双流信息储存网络;其中,
所述双流信息储存网络的字典模块储存每一种动作的历史运动特征和未来运动特征的对应关系;
步骤6:将训练好的运动特征提取模块、训练好的分类模块、训练好的动作预测模块和储存完信息的字典模块相结合,构造自更新动作预测模型;
步骤7:将用来测试的人体动作序列样本划分的历史序列输入自更新动作预测模型,确定动作预测结果。
2.如权利要求1所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤1,包括:
步骤11:通过预设的若干帧人体骨架样本,构建人体动作序列样本:
V=[X1,…,Xt,…,XN]
其中,V代表人体动作序列样本,t代表人体动作序列样本的第t个帧数,t∈[1,N],N代表人体动作序列样本的总帧数,Xt∈RM×D,RM×D代表人体动作序列样本V的第t帧人体骨架的矩阵,M代表第t帧人体骨架包含的关键点个数;D代表第t帧人体骨架中每个关键点的向量表示的维数;
步骤12:将人体动作序列样本V划分为历史序列Vhistory、待预测序列Vpredict和未来序列Vfuture;其中,
V={Vhistory,Vpredict,Vfuture},
其中,Vhistory代表历史序列,h代表关于历史序列的时间索引,h∈[1,Thistory],Thistory∈[1,Tpredict],Thistory代表历史序列的总帧数;Xh∈RM×D,Xh代表历史序列的第h帧人体骨架的矩阵,X1代表历史序列的第1帧人体骨架的矩阵,代表历史序列的最后1帧人体骨架的矩阵;Vpredict代表待预测序列,p代表关于待预测序列的时间索引,p∈[Thistory+1,Thistory+Tpredict],Tpredict代表待预测序列的总帧数,Tpredict∈[Tpredict,Tfuture];Xp∈RM×D,Xp代表待预测序列的第p帧人体骨架的矩阵;代表历史序列的第1帧人体骨架的矩阵;代表历史序列的最后1帧人体骨架的矩阵;Vfuture代表未来序列,f代表关于历史序列的时间索引,f∈[Thistory+Tpredict+1,Thistory+Tpredict+Tfuture],Tfuture代表未来序列的总帧数,Tfuture∈[Tfuture,N];Xf∈RM×D,Xf代表未来序列的第f帧人体骨架的矩阵;代表未来序列的第1帧人体骨架的矩阵,代表未来序列的最后1帧人体骨架的矩阵,N=Thistory+Tpredict+Tfuture;
步骤13:通过速度计算模块,对历史序列进行速度特征提取,确定历史速度序列;
其中,Vhistory_v代表历史速度序列,vel1代表历史速度序列中的第1帧骨架的矩阵,代表未来速度序列中的第1帧骨架的矩阵,为历史速度序列Vhistory_v中第h帧骨架的矩阵表示,h代表关于历史序列的时间索引,Xh代表历史序列的第h帧人体骨架的矩阵,Xh-1代表历史序列的第h-1帧人体骨架的矩阵,代表历史速度序列中的第Thistory帧骨架的矩阵,Thistory代表历史序列的总帧数;
步骤14:通过加速度计算模块,对所述历史速度序列进行计算,确定历史加速度序列:
步骤15:通过级别划分模块,分别将所述历史序列进行级别划分,划分为低级历史序列,中级历史序列和高级历史序列;
其中,Vhp_1代表低级历史序列,Vhistory代表历史序列,Vhp_2代表历史序列输入第一池化层得到的关于人体骨架的中级历史序列,midh∈RW×D,RW×D代表关于人体骨架的中级历史序列的第h帧人体骨架的矩阵,W和D代表中级历史序列中第h帧骨架的矩阵的行数和列数,Vhp_3代表高级历史序列,Vhp_3是通过历史序列输入第二池化层得到的关于人体骨架的高级历史序列,highh∈RU×D,U和D分别对应高级历史序列中第h帧骨架的矩阵的行数和列数;
步骤16:将低级历史序列,中级历史序列和高级历史序列依次传输至对应的时空卷积模块1、融合模块1、时空卷积模块2、融合模块2、时空卷积模块3和时空卷积模块4,生成对应的历史融合特征;
步骤17:将未来序列传输到步骤13-步骤15,生成对应的未来融合特征;所述步骤17包括:
步骤170:将未来序列传输至速度计算模块,获取对应的未来速度序列;
步骤171:将所述未来速度序列传输至加速度计算模块,计算对应的未来加速度序列;
步骤172:将所述未来加速度序列传输至级别划分模块,确定低级未来序列,中级未来序列和高级未来序列;
步骤173:将低级未来序列,中级未来序列和高级未来序列依次传输至对应的时空卷积模块1、融合模块1、时空卷积模块2、融合模块2、时空卷积模块3和时空卷积模块4,生成对应的未来融合特征;其中,
所述融合模块1包含低级别卷积层1,低级别线性层1,低级别聚集相关特征层1,低级别更新特征层1,低级别特征融合层1,中级别卷积层1,中级别线性层1,中级别聚集相关特征层1,中级别更新特征层1,中级别特征融合层1,高级别卷积层1,高级别线性层1,高级别聚集相关特征层1,高级别更新特征层1和高级别特征融合层1;
步骤18:通过所述历史融合特征和未来融合特征,生成历史运动特征和未来运动特征。
3.如权利要求2所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤16,包括:
步骤160:将低级历史序列Vhp_1输入低级别时空卷积模块1,输出Fhp_11;Fhp_11代表和低级历史序列Vhp_1对应的低级别时空卷积模块1的输出结果;
步骤161:将中级历史序列Vhp_2输入中级别时空卷积模块1,输出Fhp_12;Fhp_12代表和中级历史序列Vhp_2对应的中级别时空卷积模块1的输出结果;
步骤162:将高级历史序列Vhp_3输入高级别时空卷积模块1,输出Fhp_13;Fhp_13代表和高级历史序列Vhp_3对应的高级别时空卷积模块1的输出结果;
步骤163:将Fhp_11、Fhp_12、Fhp_13输入融合模块1,输出更新后的低级别人体骨架中所有关键点的特征、更新后的中级别人体骨架中所有关键点的特征、更新后的高级别人体骨架中所有关键点的特征;
步骤164:通过H11、H12和H13,确定生成对应的历史融合特征。
4.如权利要求3所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤163,还包括:
步骤A1:将Fhp_11输入低级别卷积层1,输出G11;G11代表和低级历史序列Vhp_1对应的低级别卷积层1的输出结果;
步骤A3:针对低级别人体骨架中的第i个关键点,低级别聚集相关特征层1把剩余M-1个关键点的特征聚合到第i个关键点上,然后经过低级别聚集相关特征层1的3层全连接层,确定对应的关键点列向量;
其中,[,]表示按照通道连接函数,f11()表示低级别聚集相关特征层1的3层全连接层函数,r11_i为1个关于第i个关键点的列向量,i=1,2,…,M,M代表关键点的总个数;
步骤A4:对低级别人体骨架中所有关键点都执行步骤A3,获取关于关键点的二维张量,R11的公式表达如下:
R11=(r11_1,...,r11_i,...,r11_M),i∈[1,M],其中,R11是由M个列向量组成的二维张量;
步骤A5:将R11输入低级别更新特征层1,输出关键点的特征H11,低级别更新特征层1用来更新特征,低级别更新特征层1由3层全连接层构成,更新特征的公式表达如下:
H11=g11([F11,R11])
其中,[,]表示按照通道连接函数,g11()表示关于低级别更新特征层得到3层全连接层函数,H11为更新后的低级别人体骨架中所有关键点的特征;
步骤A6:将Fhp_12输入中级别卷积层1,输出G12;G12代表和中级历史序列Vhp_2对应的中级别卷积层1的输出结果;
步骤A8:针对中级别人体骨架中的第i个关键点,中级别聚集相关特征层1把剩余M-1个关键点的特征聚合到第i个关键点上,然后经过中级别聚集相关特征层1的3层全连接层,确定对应的关键点列向量;
其中,[,]表示按照通道连接函数,f12()表示中级别聚集相关特征层1的3层全连接层函数,r12_i为1个关于第i个关键点的列向量,i=1,2,…,M,M代表关键点的总个数;
步骤A9:对中级别人体骨架中所有关键点都执行步骤A8,获取关于中级别人体骨架关键点的二维张量,R12的公式表达如下:
R12=(r12_1,...,r12_i,...,r12_M),i∈[1,M],其中,R12是由M个列向量组成的二维张量;
步骤A10:将R12输入中级别更新特征层1,输出关键点的特征H12,中级别更新特征层1用来更新特征,中级别更新特征层1由3层全连接层构成,更新特征的公式表达如下:
H12=g12([F12,R12])
其中,[,]表示按照通道连接函数,g12()表示关于低级别更新特征层得到3层全连接层函数,H12为更新后的低级别人体骨架中所有关键点的特征;
步骤A11:将Fhp_12输入中级别卷积层1,输出G12;G12代表和中级历史序列Vhp_2对应的中级别卷积层1的输出结果;
步骤A13:针对中级别人体骨架中的第i个关键点,中级别聚集相关特征层1把剩余M-1个关键点的特征聚合到第i个关键点上,然后经过中级别聚集相关特征层1的3层全连接层,确定对应的关键点列向量;
其中,[,]表示按照通道连接函数,f12()表示中级别聚集相关特征层1的3层全连接层函数,r12_i为1个关于第i个关键点的列向量,i=1,2,…,M,M代表关键点的总个数;
步骤A14:对中级别人体骨架中所有关键点都执行步骤A8,获取关于中级别人体骨架关键点的二维张量,R12的公式表达如下:
R12=(r12_1,...,r12_i,...,r12_M),i∈[1,M],
其中,R12是由M个列向量组成的二维张量;
步骤A15:将R12输入中级别更新特征层1,输出关键点的特征H12,中级别更新特征层1用来更新特征,中级别更新特征层1由3层全连接层构成,更新特征的公式表达如下:
H12=g12([F12,R12])
其中,[,]表示按照通道连接函数,g12()表示关于中级别更新特征层得到3层全连接层函数,H12为更新后的中级别人体骨架中所有关键点的特征;
步骤A16:将Fhp_13输入高级别卷积层1,输出G13;G13代表和高级历史序列Vhp_3对应的高级别卷积层1的输出结果;
步骤A18:针对高级别人体骨架中的第i个关键点,高级别聚集相关特征层1把剩余M-1个关键点的特征聚合到第i个关键点上,然后经过高级别聚集相关特征层1的3层全连接层,确定对应的关键点列向量;
其中,[,]表示按照通道连接函数,f13()表示高级别聚集相关特征层1的3层全连接层函数,r13_i为1个关于第i个关键点的列向量,i=1,2,…,M,M代表关键点的总个数;
步骤A19:对高级别人体骨架中所有关键点都执行步骤A8,获取关于高级别人体骨架关键点的二维张量,R13的公式表达如下:
R13=(r13_1,...,r13_i,...,r13_M),i∈[1,M],
其中,R13是由M个列向量组成的二维张量;
步骤A15:将R13输入高级别更新特征层1,输出关键点的特征H13,高级别更新特征层1用来更新特征,高级别更新特征层1由3层全连接层构成,更新特征的公式表达如下:
H13=g13([F13,R13])
其中,[,]表示按照通道连接函数,g13()表示关于高级别更新特征层得到3层全连接层函数,H13为更新后的中级别人体骨架中所有关键点的特征。
5.如权利要求3所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤164,包括:
步骤S10:将H11和H12输入低级别特征融合层1,输出Shp_11;所述步骤S10包括:
在所述低级别特征融合层1中,H11和H12先经过1个softmax函数,其公式表达如下:
其中,T表示转置,A12表示连接权重矩阵,H11为更新后的低级别人体骨架中所有关键点的特征,H12为更新后的中级别人体骨架中所有关键点的特征,softmax函数用来将输入向量的每一个元素的值归一化至(0,1)之间,每一个元素的计算公式如下:
其中,e表示自然底数,K表示输入向量包含的元素数目,al表示输入向量的第l个元素,ak表示输入向量的第k个元素,k=1,2,…,K,Sl表示输入向量的第l个元素的值归一化后的结;
步骤S11:将H12融合至H11中,其公式表达如下:
Shp_11=A12·H12*ω+H11
其中,Shp_11表示H12和H11融合后的特征,也是低级别特征融合层1的输出,ω表示权重;
步骤S12:将所述H11、H12和H13输入中级别特征融合层1,输出为Shp_12;其中,在中级别特征融合层1中,H11和H12先经过1个softmax函数,其公式表达如下:
其中,T表示转置,A21表示连接权重;
接着,H13和H12经过一个softmax函数,其公式表达如下:
其中,T表示转置,A23表示连接权重,H13为更新后的高级别人体骨架中所有关键点的特征;
接着,将H11和H13融合至H12中,其公式表达如下:
Shp_12=(A21·H11+A23·H13)*θ+H12,
其中,Shp_12表示H11、H12和H13融合后的特征,也是中级别特征融合层1的输出,θ表示权重;
步骤S13:将H13和H12输入高级别特征融合层1,输出为Shp_13;其中,在高级别特征融合层1中,H13和H12先经过1个softmax函数,其公式表达如下:
其中,T表示转置,A32表示连接权重矩阵,
接着,将H12融合至H13中,其公式表达如下:
Shp_13=A32·H12*γ+H13,
其中,Shp_13表示H12和H13融合后的特征,也是高级别特征融合层1的输出,γ表示权重;
步骤S14:将所述Shp_11输入低级别时空卷积模块2,输出Fhp_21;其中,所述低级别时空卷积模块2包含1个空间图卷积层和1个时间卷积层;所述空间图卷积层有128个卷积核,每个卷积核大小为1×1;所述时间卷积层有64个卷积核,每个卷积核的大小为5×1;
步骤S15:将所述Shp_12输入中级别时空卷积模块2,输出Fhp_22;其中,所述中级别时空卷积模块2的结构与低级别时空卷积模块2的结构一致,其输入为Shp_12,输出为Fhp_22;高级别时空卷积模块2的结构与低级别时空卷积模块2的结构一致,其输入为Shp_13,输出为Fhp_23;
步骤S16:将Shp_21输入低级别时空卷积模块3,输出Shp_31;其中,所述低级别时空卷积模块3包含1个空间图卷积层和1个时间卷积层;所述空间图卷积层有256个卷积核,每个卷积核大小为1×1;所述时间卷积层有128个卷积核,每个卷积核的大小为5×1;
步骤S17:将Shp_22输入中级别时空卷积模块3,输出Shp_32;其中,所述中级别时空卷积模块3的结构与低级别时空卷积模块3的结构一致;
步骤S18:将Shp_23输入中级别时空卷积模块3,输出Shp_33;其中,所述高级别时空卷积模块3的结构与低级别时空卷积模块3的结构一致;
步骤S19:将Shp_31输入低级别时空卷积模块4,输出Shp_41;其中,所述低级别时空卷积模块4包含1个空间图卷积层和1个时间卷积层。空间图卷积层有512个卷积核,每个卷积核大小为1×1;时间卷积层有256个卷积核,每个卷积核的大小为5×1;
步骤S20:将Shp_32输入中级别时空卷积模块4,输出Shp_42;其中,所述中级别时空卷积模块4的结构与低级别时空卷积模块4的结构一致;
步骤S21:将Shp_33输入高级别时空卷积模块4,输出Shp_43;其中,所述高级别时空卷积模块4的结构与低级别时空卷积模块3的结构一致;
步骤S22:将Shp_41、Shp_42和Shp_43输入预设的特征融合模块,输出Shp;
步骤S24:将Shp、Shv和Sha输入特征级联模块的输入,输出为Hhistory;其中,Hhistory由Shp、Shv和Sha按通道拼接所得,Hhistory代表历史运动特征;
步骤S25:将未来序列Vfuture输入运动特征提取模块,获取未来运动特征Hfuture。
6.如权利要求1所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤2,包括:
步骤21:将历史运动特征和未来运动特征相加,获取联合运动特征;
H=Hfuture+Hhistory
其中,H表示联合运动特征;
所述步骤22还包括:
其中,S0表示人体动作序列样本V的第Thistory帧人体骨架的速度;
其中,C0表示人体动作序列样本V的第Thistory帧人体骨架的加速度;
步骤223:将B0传输至线性层,输出F0,F0的计算方式如下:
步骤225:将人体动作序列样本V的第Thistory+1帧人体骨架的预测结果人体动作序列样本V的第Thistory帧人体骨架第Thistory-1帧人体骨架和第1个循环中GRU的其中一个输出H0输入第二个循环,输出为人体动作序列样本V的第Thistory+2帧人体骨架的预测结果
步骤23:对人体动作序列样本V的人体骨架进行递增并重复步骤22,确定待预测序列:
p∈[Thistory+1,Thistory+Tpredict],
步骤24:通过人体动作序列样本、运动特征提取模块和动作预测模块,构造双流动作预测网络;其中,
所述双流动作预测网络的损失函数L1为:
7.如权利要求1所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤4,包括:
步骤40:提取经过训练的运动特征提取模块的历史运动特征Hhistory,将所述历史运动特征Hhistory传输至分类模块的线性层1,输出结果Q1;
其中,W1是线性层1的权重,是线性层1的偏置向量,是relu激活函数,relu代表线性整流函数,x是relu激活函数的输入,当x大于等于0时,relu激活函数的输出为x,当x小于0时,relu激活函数的输出为0,Q1代表线性层1的输出结果;
步骤41:将线性层1的输出结果Q1输入线性层2,输出结果Q2;
步骤42:将线性层1的输出结果Q1输入线性层2,输出结果Q2;
步骤43:选择Q3中最大的概率值对应的动作类别,将所述动作类别作为分类模块的输出;
步骤44:将历史序列输入训练好的运动特征提取模块,确定历史运动特征样本;
步骤45:将历史运动特征样本输入至分类模块,基于分类模块中预设的损失函数L2,训练分类模块至收敛;其中,训练分类模块使用的损失函数L2为:
其中,G是动作类别的总数,A是输入的历史运动特征样本的总数,是第a个历史运动特征样本的各个动作类别的概率,代表第g维数据第a个历史运动特征样本的网络输出,Ia是第a个历史运动特征样本的期望输出,其中,Ia的第g维数据定义为:
其中,ia是第a个历史运动特征样本的标签值。
8.如权利要求1所述的一种基于持续监控的人体动作预测方法,其特征在于,所述自更新动作预测模型,包括运动特征提取模块、分类模块、字典模块和动作预测模块;其中,
步骤83:计算人体动作序列样本的历史运动特征与动作类别g1存储的第i个历史运动特征间的余弦相似度:
步骤84:计算动作类别g1存储的所有历史运动特征与测试的人体动作序列样本的历史运动特征间的相似度,得到{sim1,...,simi,...,sim2000};
步骤85:查找余弦相似度的最大值simj,simj=max{sim1,...,simi,...,sim2000};其中,
所述simj为余弦相似度最大值;
9.如权利要求5所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤S15和S步骤16之间还包括:
将低级历史序列,中级历史序列和高级历史序列依次传输至对应的时空卷积模块1、融合模块1和时空卷积模块2,输出低级卷积结果Fhp_21、中级卷积结果Fhp_22和高级卷积结果Fhp_23;
步骤S151:将低级卷积结果Fhp_21输入融合模块2的低级别卷积层2,输出结果G21,将结果G21输入低级别线性层2,输出结果F21,将结果F21输入低级别聚集相关特征层2,输出结果H21,将结果H21输入低级别特征融合层2,确定结果Shp_21;
步骤S152:将中级卷积结果Fhp_22输入融合模块2的中级别卷积层2,输出结果G22,将结果G22输入中级别线性层2,输出结果F22,将结果F22输入中级别聚集相关特征层2,输出结果H22,将结果H22输入中级别特征融合层2,确定结果Shp_22;
步骤S153:将高级卷积结果Fhp_23输入融合模块2的高级别卷积层2,输出结果G23,将结果G23输入高级别线性层2,输出结果F23,将结果F23输入高级别聚集相关特征层2,输出结果H23,将结果H23输入高级别特征融合层2,确定结果Shp_23。
10.如权利要求1所述的一种基于持续监控的人体动作预测方法,其特征在于,所述步骤6,包括:
其中,为第1次动作预测结果的第p帧骨架的矩阵表达,为测试的人体动作序列样本V的第51帧人体骨架的预测结果,为测试的人体动作序列样本V的第p帧人体骨架的预测结果,为测试的人体动作序列样本V的第75帧人体骨架的预测结果;
步骤A2:获取第1帧人体骨架矩阵中的第1帧人体骨架通过第1次动作预测结果中的第1帧人体骨架与人体动作序列样本中第2帧人体骨架至第Thistory帧人体骨架,组成第1次重构的历史序列将第1次重构的历史序列输入运动特征提取模块,输出为第1次更新后的历史运动特征
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210099728.9A CN114511928A (zh) | 2022-01-27 | 2022-01-27 | 一种基于持续监控的动作预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210099728.9A CN114511928A (zh) | 2022-01-27 | 2022-01-27 | 一种基于持续监控的动作预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114511928A true CN114511928A (zh) | 2022-05-17 |
Family
ID=81549926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210099728.9A Pending CN114511928A (zh) | 2022-01-27 | 2022-01-27 | 一种基于持续监控的动作预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114511928A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023142552A1 (zh) * | 2022-01-27 | 2023-08-03 | 苏州大学 | 一种面向未知类别的动作预测方法 |
-
2022
- 2022-01-27 CN CN202210099728.9A patent/CN114511928A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023142552A1 (zh) * | 2022-01-27 | 2023-08-03 | 苏州大学 | 一种面向未知类别的动作预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Localizing natural language in videos | |
Zheng et al. | Dynamic sampling networks for efficient action recognition in videos | |
US20230274420A1 (en) | Method and system for automated generation of text captions from medical images | |
JP2021524099A (ja) | 異なるデータモダリティの統計モデルを統合するためのシステムおよび方法 | |
CN111798921A (zh) | 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置 | |
CN111243682A (zh) | 药物的毒性预测方法及装置、介质和设备 | |
WO2023142552A1 (zh) | 一种面向未知类别的动作预测方法 | |
CN112420125A (zh) | 分子属性预测方法、装置、智能设备和终端 | |
AU2022392233A1 (en) | Method and system for analysing medical images to generate a medical report | |
CN113948157A (zh) | 化学反应分类方法、装置、电子设备及存储介质 | |
Hu et al. | Saliency-based YOLO for single target detection | |
CN114511928A (zh) | 一种基于持续监控的动作预测方法 | |
Ghosh et al. | Leukox: leukocyte classification using least entropy combiner (lec) for ensemble learning | |
CN114495277A (zh) | 一种人体动作预测方法 | |
CN112183580B (zh) | 一种基于动态知识路径学习的小样本分类方法 | |
Wezeman et al. | Distance-based classifier on the Quantum Inspire | |
Gong et al. | KDCTime: Knowledge distillation with calibration on InceptionTime for time-series classification | |
CN116959605A (zh) | 分子性质预测方法、分子性质预测模型的训练方法及装置 | |
CN116109449A (zh) | 一种数据处理方法及相关设备 | |
CN115795025A (zh) | 一种摘要生成方法及其相关设备 | |
CN113010687B (zh) | 一种习题标签预测方法、装置、存储介质以及计算机设备 | |
Divyavarshini et al. | Vehicle Recognition Using CNN | |
CN114707070A (zh) | 一种用户行为预测方法及其相关设备 | |
Kumar et al. | A weakly supervised cnn model for spatial localization of human activities in unconstraint environment | |
Park et al. | [Regular Paper] Interpretable Prediction of Vascular Diseases from Electronic Health Records via Deep Attention Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |