CN112949460B - 一种基于视频的人体行为网络模型及识别方法 - Google Patents
一种基于视频的人体行为网络模型及识别方法 Download PDFInfo
- Publication number
- CN112949460B CN112949460B CN202110219219.0A CN202110219219A CN112949460B CN 112949460 B CN112949460 B CN 112949460B CN 202110219219 A CN202110219219 A CN 202110219219A CN 112949460 B CN112949460 B CN 112949460B
- Authority
- CN
- China
- Prior art keywords
- layer
- network model
- block
- activation function
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241000282414 Homo sapiens Species 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000004913 activation Effects 0.000 claims abstract description 46
- 238000011176 pooling Methods 0.000 claims abstract description 24
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims abstract description 16
- 230000006399 behavior Effects 0.000 claims description 52
- 230000006870 function Effects 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 27
- 238000012360 testing method Methods 0.000 claims description 12
- 206010000117 Abnormal behaviour Diseases 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 claims description 8
- 230000001902 propagating effect Effects 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 238000010009 beating Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 230000000391 smoking effect Effects 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 230000015556 catabolic process Effects 0.000 claims description 2
- 238000006731 degradation reaction Methods 0.000 claims description 2
- 238000004880 explosion Methods 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- 238000005070 sampling Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Psychiatry (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Social Psychology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于视频的人体行为网络模型及识别方法,包括:3D卷积层、四层Block模块、全局平均池化层以及Softmax激活层。首先,所述3D卷积层,将输入的连续视频帧进行3D卷积操作,然后进入Block模块;所述Block模块主要由改进的3D残差块和SE模块构成,首先利用3D残差块对视频帧进行特征提取,然后经过SE模块,让网络自动获取每个特征通道的重要程度,从而增加重要通道的利用率;最后,将通过全局平均池化层的特征输入到Softmax激活层,输出人体行为类别。本发明的优点是:简单、快捷,且识别精度高,提高了提取时空特征的能力,解决了网络模型的参数较多以及准确率较低的问题。
Description
技术领域
本发明涉及计算机视觉技术领域,特别涉及一种基于视频的人体行为网络模型及识别方法。
背景技术
当今社会,计算机技术已经飞速发展起来,具有非常强大的功能,可以协助人类解决很多问题。基于视频序列的人体行为识别,作为多学科交叉的研究课题,是计算机视觉中的一个非常重要的子任务,应用非常广泛。
随着硬件技术的发展和物联网技术的推广,监控摄像头已经无处不在,但它只能起到实时记录的作用,并不具备智能分析功能,需要人工监视视频内容,容易造成误判,不能及时地做出适当有效的判断,无法满足视频监控的要求。基于视频的人体行为识别,可以对视频中的人体行为进行有效地识别,从而节省大量的人力物力,因此具有很重要的研究意义和研究价值。但是传统行为识别方法需要通过人工提取特征来对动作进行表述,容易受到摄像机不同视角、背景杂乱的影响,导致提取过程复杂且特征的表征能力较弱,局限性大,因此需要设计一种非常高效的人体行为识别方法。
中国发明专利CN 109784418 A《一种基于特征重组的人体行为识别及系统》公开了一种基于特征重组的人体行为识别方法。该方法选用过滤式和嵌入式特征等方法选择特征,并组合成一个初始化特征集,然后按特征出现频率将特征集划分为高频特征和低频特征,并对低频特征进行随机选择与高频特征重组成新的特征集,最后采用分类算法对新的特征集进行人体行为识别,计算每个行为类别的识别率。该方法虽然在一定程度上能够提高识别精度,但它不能进行端对端的训练,导致效率低下。
中国发明专利CN 102811343 B《一个基于行为分析的智能视频监控系统的原型》公开了一种基于行为识别的智能视频监控系统,从而对目标进行分类。该系统首先进行视频采集,然后将其进行处理,接着采用贝叶斯分类算法对视频行为进行分类,最后输送到报警模块,进行预警。该专利虽然提高了精度,但其只是对视频数据进行了有效地预处理,算法属于传统行为识别方法,并未对其创新,使得特征提取过程复杂,泛化能力差。
发明内容
本发明针对现有技术的缺陷,提供了一种基于视频的人体行为网络模型及识别方法。
为了实现以上发明目的,本发明采取的技术方案如下:
一种基于视频的人体行为网络模型,其特征在于,包括:3D卷积层、Block网络块、全局均值池化层和softmax激活函数层;其中,3D卷积层对输入的连续视频帧进行卷积以及提高维度;Block网络模块一共有四个且结构相同,都是由改进的残差块以及SE模块构成;改进残差块由BN层-Relu激活函数-卷积层(3×3×3)-BN层-Relu激活函数-卷积层(3×3×3)-Shortcut连接构成;改进的SE模块由:全局平均池化层-逐点卷积层(1×1×1)-Relu激活函数-逐点卷积层(1×1×1)-Sigmoid激活函数层构成;
在单个Block网络模块里,连续的视频帧先经过残差块,可以解决模型退化以及梯度爆炸的问题,从而提取出有效地特征,然后改进的SE模块对残差块输出的通过进行重要度判别,从而提高重要通道的利用率,加强有用特征的提取,压缩无用特征的使用;四个模块依次叠加,可以加深网络,使提取有效特征的能力最大化,从而提高识别精度;全局平均池化层不仅可以起到全连接层的作用,还可以有效地减少网络模型参数,同时在结构上做正则化防止过拟合;Softmax激活层用于输出行为类别。
本发明还公开了一种基于视频的人体行为识别方法,包括以下步骤:
S1、对网络模型进行训练;
S2、将经过预处理后的连续视频帧输入到第一个3×3×3的卷积层中进行卷积操作,之后进入BN层进行归一化操作,最后进入Relu激活函数层,进行非线性变换;其中,BN层用于将每层的输出规范为标准正态分布,即将均值归一化为0,将方差归一化为1;
S3、将Relu激活函数层的输出输入到第一层Block网络模块、第二层Block网络模块、第三层Block网络模块和第四层Block网络模块进行特征提取后输入到全局平均池化层;其中,每一层Block网络模块都是按照BN层-Relu激活函数-卷积层(3×3×3)-BN层-Relu激活函数-卷积层(3×3×3)-全局平均池化层-逐点卷积层(1×1×1)-Relu激活函数-逐点卷积层(1×1×1)-Sigmoid激活函数层-shortcut连接构成;
S4、所述全局均值池化层对输入数据做正则化防止过拟合后输出到Softmax激活函数层,最后输出行为类别。
进一步地,S1的子步骤如下:
S11、采集人体行为数据并对其标注类别后制作成有效的视频数据集;最后,通过图像预处理的后,将视频数据集按照7:3的比列划分为训练集和测试集;
S12、通过网络模型提取图像的特征并对其进行向前传播得到训练类别,再由损失函数反向传播更新梯度参数;
S13、训练好网络模型后,选取测试集输入到上述完成训练的网络模型中,通过前向传播得到行为类别,从而获得识别准确率;
S14、结束网络模型的训练与测试。
进一步地,视频数据集制作为:首先,对校园的异常行为进行定义,异常行为包括:打架、脚踢、跑步、吸烟和摔倒;然后将该数据集输入到网络模型中进行预测,然后,通过视频监控的方式进行视频拍摄,从而获取视频数据集。
进一步地,在训练开始之前,将网络模型随机初始化,并使用SGD作为优化器,其中出示学习设置为0.01,然后每隔10个epochs除以10,mini-batch设置为16,总的epochs设置为100,使用交叉熵损失函数。
本发明还公开了基于上述网络模型的人体行为识别方法,包括以下步骤:
S1、对网络模型进行训练;
S2、将经过预处理后的连续视频帧输入到第一个3×3×3的卷积层中进行卷积操作,之后进入BN层进行归一化操作,最后进入Relu激活函数层,进行非线性变换。其中,BN层用于将每层的输出规范为标准正态分布,即将均值归一化为0,将方差归一化为1。
S3、将Relu激活函数层的输出输入到第一层Block网络模块、第二层Block网络模块、第三层Block网络模块和第四层Block网络模块进行特征提取后输入到全局平均池化层。其中,每一层Block网络模块都是按照BN层-Relu激活函数-卷积层(3×3×3)-BN层-Relu激活函数-卷积层(3×3×3)-全局平均池化层-逐点卷积层(1×1×1)-Relu激活函数-逐点卷积层(1×1×1)-Sigmoid激活函数层-shortcut连接构成。
S4、所述全局均值池化层对输入数据做正则化防止过拟合后输出到Softmax激活函数层,最后输出行为类别。
进一步地,S1的子步骤如下:
S11、采集人体行为数据并对其标注类别后制作成有效的视频数据集;最后,通过图像预处理的后,将视频数据集按照7:3的比列划分为训练集和测试集。
S12、通过网络模型提取图像的特征并对其进行向前传播得到训练类别,再由损失函数反向传播更新梯度参数。
S13、训练好网络模型后,选取测试集输入到上述完成训练的网络模型中,通过前向传播得到行为类别,从而获得识别准确率。
S14、结束网络模型的训练与测试。
进一步地,视频数据集制作为:首先,对校园的异常行为进行定义,异常行为包括:打架、脚踢、跑步、吸烟和摔倒;然后将该数据集输入到网络模型中进行预测,然后,通过视频监控的方式进行视频拍摄,从而获取视频数据集;
进一步地,在训练开始之前,将网络模型随机初始化,并使用SGD作为优化器,其中出示学习设置为0.01,然后每隔10个epochs除以10,mini-batch设置为16,总的epochs设置为100,使用交叉熵损失函数。
与现有技术相比,本发明的优点在于:
通过端对端的方式对网络模型进行快速训练,并通过将残差块与SE模块的有效结合,提高了提取时空特征的能力,本发明简单、快捷,且识别精度高。解决了网络模型的参数较多以及准确率较低的问题。
附图说明
图1是本发明实施例人体行为识别网络模型结构示意图;
图2是本发明实施例Relu函数示意图;
图3是本发明实施例单个Block网络模块示意图;
图4是本发明实施例改进的残差块模块示意图;
图5是本发明实施例改进的SE模块示意图;
图6是本发明实施例人体行为识别方法流程图;
图7是本发明实施例网络模型训练流程图;
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下根据附图并列举实施例,对本发明做进一步详细说明。
如图1所示,为发明实施例提供的一种人体行为识别网络模型,其主要结构为3D卷积层、Block网络模块、全局均值池化层和softmax激活函数层。
其中,在图像预处理阶段,针对相邻视频帧存在大量冗余信息问题,本发明采用二次稀疏采样的方法对视频进行图像帧提取。首先,采用间隔设置为2帧,对原始视频进行采样,得到序列的视频帧;在一次采样的基础上,对视频帧进行二次稀疏采样,从而得到最终的视频帧数据集。二次稀疏采样不仅剔除了相邻视频帧的冗余信息,还能以较少的帧数代表视频全局信息,有效地提高了识别精度。
将两次稀疏采样后的视频帧先进行随机裁剪,把图像尺寸缩减为128×171,然后再通过中心裁剪,将图像尺寸进一步缩减到112×112,为后续做准备;再通过水平翻转、去噪等操作对图像进行数据增强。
将处理好的连续视频帧输入到第一个3D卷积层中,用3×7×7的卷积核对图像进行时空卷积操作,扩大感受野,得到更多的行为特征,然后输入到Block网络模块中进一步地提取特征;最后通过全局平均池化层进行处理后输入到所述softmax激活函数层进行行为类别输出。
进一步地,BN层(Batch Normalization)用于将每层的输出规范为标准正态分布,即将均值归一化为0,将方差归一化为1,从而使得下层网络能够更好地学习,并使训练速度加快,提高网络模型的泛化能力。
进一步地,如图2所示,Relu激活函数如式(1)
Relu激活函数其实是分段函数,把所有的负值都变为0,而正值不变,可以进行非线性变换,因此是网络模型具有稀疏性,并且减少了参数的相互依存关系,缓解了过拟合问题的发生,更利于行为识别网络模型的训练。
进一步地,如图3所示,一共有4个Block网络模块,每个Block网络模块主要由图4的改进残差块以及图5的改进SE模块由上到下依次组成。
首先,传统残差块采用的是卷积层在前,然后连接BN层和Relu激活函数层。由于BN层作为Pre-activation不仅符合反向传播假设,信息传递无阻碍而且还能起到正则化的作用,故本发明将BN层、Relu激活函数层放在卷积层之前。如图4所示,改进残差块由BN层-Relu激活函数-卷积层(3×3×3)-BN层-Relu激活函数-卷积层(3×3×3)-Shortcut连接构成。
原来的SE模块采用的是在全局平均池化层后面连接两层全连接层,这样就导致网络模型参数增多,影响网络模型的运行速度。由于逐点卷积的作用等价于全连接层,还可以权值共享,故如图5所示,与原来的SE模块不同,本发明为了减少网络模型参数,采用了逐点卷积代替全连接层的方法。改进的SE模块主要由全局平均池化层-3D逐点卷积层(1×1×1)-Relu激活函数-3D逐点卷积层(1×1×1)-Sigmoid激活函数层等构成。
因此将第一层3D卷积层的输出结果输入到Block网络模块里,先经过残差块对特征提取,然后将其结果在输入到SE模块里进行通道重标定操作,使得网络可以多学习一些重要的行为特征,依次类推,经过4个Block网络模块后,将Block输出的结果输入到全局平均池化层中进行下一步操作。
如图6和图7所示,本发明还公开了一种基于视频的人体行为识别方法,所述方法包括:
S1、对实施例1中所建立的网络模型进行训练,其主要步骤如下所示:
S11、采集了大量的人体行为数据并对其标注类别后制作成有效的数据集;然后将该数据集输入到网络模型中进行预测。其中,本发明所用到的数据集为自制数据集。首先,对校园的异常行为进行定义,如:打架、脚踢、跑步、吸烟和摔倒等五类异常行为;然后,通过视频监控的方式进行视频拍摄,从而获取视频数据集;最后,通过图像预处理的后,将数据集按照7:3的比列将数据集划分为训练集和测试集。在训练开始之前,将网络模型随机初始化,并使用SGD作为优化器,其中出示学习设置为0.01,然后每隔10个epochs除以10,mini-batch设置为16,总的epochs设置为100,使用交叉熵损失函数。
S12、通过网络模型提取图像的特征并对其进行向前传播得到训练类别,再由损失函数反向传播更新梯度参数。
S13、训练好网络模型后,选取一定数量人体行为数据作为测试集输入到上述完成训练的网络模型中,通过前向传播得到行为类别,从而获得识别准确率。
S14、结束网络模型的训练与测试。
S2、将经过预处理后的连续视频帧输入到第一个3×3×3的卷积层中进行卷积操作,之后进入BN层进行归一化操作,最后进入Relu激活函数层,进行非线性变换。其中,BN层(Batch Normalization)用于将每层的输出规范为标准正态分布,即将均值归一化为0,将方差归一化为1。
S3、将所述Relu激活函数层的输出输入到第一层Block网络模块、第二层Block网络模块、第三层Block网络模块和第四层Block网络模块进行特征提取后输入到全局平均池化层。其中,每个Block网络模块都是按照BN层-Relu激活函数-卷积层(3×3×3)-BN层-Relu激活函数-卷积层(3×3×3)-全局平均池化层-逐点卷积层(1×1×1)-Relu激活函数-逐点卷积层(1×1×1)-Sigmoid激活函数层-shortcut连接等构成。
S4、所述全局均值池化层对输入数据做正则化防止过拟合后输出到Softmax激活函数层,最后输出行为类别。通过全局平均池化层对上一层所输入的数据进行展平以及正则化处理,从而防止网络模型的过拟合问题,同时直接实现了降维,更重要的是极大地减少了网络的参数,提高了网络模型数据的计算速度和识别效率。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的实施方法,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (4)
1.一种基于人体行为网络模型的人体行为识别方法,其特征在于:所述人体行为网络模型,包括:3D卷积层、Block网络块、全局均值池化层和softmax激活函数层;其中,3D卷积层对输入的连续视频帧进行卷积以及提高维度;Block网络模块一共有四个且结构相同,都是由改进的残差块以及SE模块构成;改进残差块由BN层-Relu激活函数-卷积层(3×3×3)-BN层-Relu激活函数-卷积层(3×3×3)-Shortcut连接构成;改进的SE模块由:全局平均池化层-逐点卷积层(1×1×1)-Relu激活函数-逐点卷积层(1×1×1)-Sigmoid激活函数层构成;
在单个Block网络模块里,连续的视频帧先经过残差块,解决了模型退化以及梯度爆炸的问题,从而提取出有效地特征,然后改进的SE模块对残差块输出的通过进行重要度判别,从而提高重要通道的利用率,加强有用特征的提取,压缩无用特征的使用;四个模块依次叠加,加深网络,使提取有效特征的能力最大化,从而提高识别精度;全局平均池化层起到全连接层的作用,还可以有效地减少网络模型参数,同时在结构上做正则化防止过拟合;Softmax激活层用于输出行为类别;
所述人体行为识别方法,包括以下步骤:
S1、对网络模型进行训练;
S2、将经过预处理后的连续视频帧输入到第一个3×3×3的卷积层中进行卷积操作,之后进入BN层进行归一化操作,最后进入Relu激活函数层,进行非线性变换;其中,BN层用于将每层的输出规范为标准正态分布,即将均值归一化为0,将方差归一化为1;
S3、将Relu激活函数层的输出输入到第一层Block网络模块、第二层Block网络模块、第三层Block网络模块和第四层Block网络模块进行特征提取后输入到全局平均池化层;其中,每一层Block网络模块都是按照BN层-Relu激活函数-卷积层(3×3×3)-BN层-Relu激活函数-卷积层(3×3×3)-全局平均池化层-逐点卷积层(1×1×1)-Relu激活函数-逐点卷积层(1×1×1)-Sigmoid激活函数层-shortcut连接构成;
S4、所述全局均值池化层对输入数据做正则化防止过拟合后输出到Softmax激活函数层,最后输出行为类别。
2.根据权利要求1所述的人体行为识别方法,其特征在于,S1的子步骤如下:
S11、采集人体行为数据并对其标注类别后制作成有效的视频数据集;最后,通过图像预处理的后,将视频数据集按照7:3的比列划分为训练集和测试集;
S12、通过网络模型提取图像的特征并对其进行向前传播得到训练类别,再由损失函数反向传播更新梯度参数;
S13、训练好网络模型后,选取测试集输入到完成训练的网络模型中,通过前向传播得到行为类别,从而获得识别准确率;
S14、结束网络模型的训练与测试。
3.根据权利要求1所述的人体行为识别方法,其特征在于:视频数据集制作为:首先,对校园的异常行为进行定义,异常行为包括:打架、脚踢、跑步、吸烟和摔倒;然后将该数据集输入到网络模型中进行预测,然后,通过视频监控的方式进行视频拍摄,从而获取视频数据集。
4.根据权利要求1所述的人体行为识别方法,其特征在于:在训练开始之前,将网络模型随机初始化,并使用SGD作为优化器,其中出示学习设置为0.01,然后每隔10个epochs除以10,mini-batch设置为16,总的epochs设置为100,使用交叉熵损失函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110219219.0A CN112949460B (zh) | 2021-02-26 | 2021-02-26 | 一种基于视频的人体行为网络模型及识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110219219.0A CN112949460B (zh) | 2021-02-26 | 2021-02-26 | 一种基于视频的人体行为网络模型及识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112949460A CN112949460A (zh) | 2021-06-11 |
CN112949460B true CN112949460B (zh) | 2024-02-13 |
Family
ID=76246570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110219219.0A Active CN112949460B (zh) | 2021-02-26 | 2021-02-26 | 一种基于视频的人体行为网络模型及识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112949460B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114973362A (zh) * | 2022-05-20 | 2022-08-30 | 厦门大学 | 一种应用于社交机器人的动态延长编码微表情识别方法 |
CN116703867B (zh) * | 2023-06-09 | 2023-12-08 | 太原理工大学 | 残差网络与通道注意力协同驱动下的基因突变预测方法 |
CN117523672A (zh) * | 2023-11-23 | 2024-02-06 | 广东技术师范大学 | 一种基于残差收缩网络的人体活动识别方法 |
CN117812552A (zh) * | 2023-12-27 | 2024-04-02 | 韶关学院 | 一种基于数据包压缩网络的WiFi信号人体行为识别方法及系统 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108550118A (zh) * | 2018-03-22 | 2018-09-18 | 深圳大学 | 运动模糊图像的模糊处理方法、装置、设备及存储介质 |
CN108985348A (zh) * | 2018-06-25 | 2018-12-11 | 西安理工大学 | 基于卷积神经网络的书法风格识别方法 |
CN109784418A (zh) * | 2019-01-28 | 2019-05-21 | 东莞理工学院 | 一种基于特征重组的人体行为识别方法及系统 |
CN110070067A (zh) * | 2019-04-29 | 2019-07-30 | 北京金山云网络技术有限公司 | 视频分类方法及其模型的训练方法、装置和电子设备 |
CN110070002A (zh) * | 2019-03-29 | 2019-07-30 | 上海理工大学 | 一种基于3d卷积神经网络的行为识别方法 |
CN110826462A (zh) * | 2019-10-31 | 2020-02-21 | 上海海事大学 | 一种非局部双流卷积神经网络模型的人体行为识别方法 |
CN111027454A (zh) * | 2019-12-06 | 2020-04-17 | 西安电子科技大学 | 基于深度密集连接和度量学习的sar舰船目标分类方法 |
CN111091045A (zh) * | 2019-10-25 | 2020-05-01 | 重庆邮电大学 | 一种基于时空注意力机制的手语识别方法 |
CN111178319A (zh) * | 2020-01-06 | 2020-05-19 | 山西大学 | 基于压缩奖惩机制的视频行为识别方法 |
CN111507884A (zh) * | 2020-04-19 | 2020-08-07 | 衡阳师范学院 | 一种基于深层卷积神经网络的自适应图像隐写分析方法及系统 |
CN111626197A (zh) * | 2020-05-27 | 2020-09-04 | 陕西理工大学 | 一种人体行为识别网络模型及识别方法 |
CN111639544A (zh) * | 2020-05-07 | 2020-09-08 | 齐齐哈尔大学 | 基于多分支跨连接卷积神经网络的表情识别方法 |
CN112016639A (zh) * | 2020-11-02 | 2020-12-01 | 四川大学 | 灵活可分离卷积框架和特征提取方法及其在VGG和ResNet中应用 |
CN112052829A (zh) * | 2020-09-25 | 2020-12-08 | 中国直升机设计研究所 | 一种基于深度学习的飞行员行为监控方法 |
-
2021
- 2021-02-26 CN CN202110219219.0A patent/CN112949460B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108550118A (zh) * | 2018-03-22 | 2018-09-18 | 深圳大学 | 运动模糊图像的模糊处理方法、装置、设备及存储介质 |
CN108985348A (zh) * | 2018-06-25 | 2018-12-11 | 西安理工大学 | 基于卷积神经网络的书法风格识别方法 |
CN109784418A (zh) * | 2019-01-28 | 2019-05-21 | 东莞理工学院 | 一种基于特征重组的人体行为识别方法及系统 |
CN110070002A (zh) * | 2019-03-29 | 2019-07-30 | 上海理工大学 | 一种基于3d卷积神经网络的行为识别方法 |
WO2020221278A1 (zh) * | 2019-04-29 | 2020-11-05 | 北京金山云网络技术有限公司 | 视频分类方法及其模型的训练方法、装置和电子设备 |
CN110070067A (zh) * | 2019-04-29 | 2019-07-30 | 北京金山云网络技术有限公司 | 视频分类方法及其模型的训练方法、装置和电子设备 |
CN111091045A (zh) * | 2019-10-25 | 2020-05-01 | 重庆邮电大学 | 一种基于时空注意力机制的手语识别方法 |
CN110826462A (zh) * | 2019-10-31 | 2020-02-21 | 上海海事大学 | 一种非局部双流卷积神经网络模型的人体行为识别方法 |
CN111027454A (zh) * | 2019-12-06 | 2020-04-17 | 西安电子科技大学 | 基于深度密集连接和度量学习的sar舰船目标分类方法 |
CN111178319A (zh) * | 2020-01-06 | 2020-05-19 | 山西大学 | 基于压缩奖惩机制的视频行为识别方法 |
CN111507884A (zh) * | 2020-04-19 | 2020-08-07 | 衡阳师范学院 | 一种基于深层卷积神经网络的自适应图像隐写分析方法及系统 |
CN111639544A (zh) * | 2020-05-07 | 2020-09-08 | 齐齐哈尔大学 | 基于多分支跨连接卷积神经网络的表情识别方法 |
CN111626197A (zh) * | 2020-05-27 | 2020-09-04 | 陕西理工大学 | 一种人体行为识别网络模型及识别方法 |
CN112052829A (zh) * | 2020-09-25 | 2020-12-08 | 中国直升机设计研究所 | 一种基于深度学习的飞行员行为监控方法 |
CN112016639A (zh) * | 2020-11-02 | 2020-12-01 | 四川大学 | 灵活可分离卷积框架和特征提取方法及其在VGG和ResNet中应用 |
Non-Patent Citations (1)
Title |
---|
一种基于R3D网络的人体行为识别算法;吴进;安怡媛;代巍;;电讯技术(第08期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112949460A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112949460B (zh) | 一种基于视频的人体行为网络模型及识别方法 | |
CN110348357B (zh) | 一种基于深度卷积神经网络的快速目标检测方法 | |
US20200082165A1 (en) | Collaborative deep network model method for pedestrian detection | |
CN107967456A (zh) | 一种基于人脸关键点的多神经网络级联识别人脸方法 | |
CN111400536B (zh) | 一种基于轻量化深度神经网络的低成本番茄叶片病害识别方法 | |
CN108960141A (zh) | 基于增强型深度卷积神经网络的行人再识别方法 | |
CN112862849B (zh) | 一种基于图像分割和全卷积神经网络的田间稻穗计数方法 | |
CN111488805B (zh) | 一种基于显著性特征提取的视频行为识别方法 | |
CN111199212B (zh) | 基于注意力模型的行人属性识别方法 | |
CN111276240A (zh) | 一种基于图卷积网络的多标签多模态全息脉象识别方法 | |
CN112183240A (zh) | 一种基于3d时间流和并行空间流的双流卷积行为识别方法 | |
CN108416795B (zh) | 基于排序池化融合空间特征的视频动作识别方法 | |
CN115984937A (zh) | 一种基于优化ResNet算法的人脸表情识别方法 | |
CN113628297A (zh) | 一种基于注意力机制和迁移学习的covid-19深度学习诊断系统 | |
Luan et al. | Sunflower seed sorting based on convolutional neural network | |
Li et al. | Application of semi-supervised learning in image classification: Research on fusion of labeled and unlabeled data | |
CN114782997A (zh) | 基于多损失注意力自适应网络的行人重识别方法及系统 | |
CN114359578A (zh) | 病虫害识别智能终端应用方法及系统 | |
Huo et al. | 3DVSD: An end-to-end 3D convolutional object detection network for video smoke detection | |
CN107341456B (zh) | 一种基于单幅户外彩色图像的天气晴阴分类方法 | |
Yu et al. | Gender classification of full body images based on the convolutional neural network | |
CN113343770B (zh) | 一种基于特征筛选的人脸防伪方法 | |
CN113192076B (zh) | 联合分类预测和多尺度特征提取的mri脑肿瘤图像分割方法 | |
CN115311491A (zh) | 一种基于课程学习及空间注意力的骨折假阳性筛除方法 | |
Wang et al. | Fusion of infrared and visible images based on improved generative adversarial networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |