CN107506740B - 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 - Google Patents
一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 Download PDFInfo
- Publication number
- CN107506740B CN107506740B CN201710785550.2A CN201710785550A CN107506740B CN 107506740 B CN107506740 B CN 107506740B CN 201710785550 A CN201710785550 A CN 201710785550A CN 107506740 B CN107506740 B CN 107506740B
- Authority
- CN
- China
- Prior art keywords
- classification
- neural network
- dimensional
- convolutional neural
- dimensional convolutional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明涉及一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,包括:对视频进行逐帧采样,在得到的多个连续的单帧图像上,在时间维度上堆叠为一定大小的图像立方体,作为三维神经网络的输入。在实现时,先训练基础的多分类三维神经网络模型,再从测试结果中挑选出部分类别的输入样本构建子数据集,然后在此子数据集基础上训练多个二分类模型,挑选出二分类结果最好的数个模型。最后,将这些模型学到的知识,利用迁移学习迁移到原多分类模型上,再重新训练迁移后的多分类模型,提高多分类识别准确率,实现高准确率的人体行为识别。
Description
技术领域
本发明涉及视频中的图像处理技术,特别是涉及一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法。
背景技术
当今社会,在存储设备,互联网技术和社交网络的飞速发展下,产生了大规模的视频数据。如何利用这些视频数据,进行目标识别与行为分析,已成为日益增长的需求。无论是智能安全监控、顾客购物行为分析、智能家居系统、体感游戏,还是无人驾驶时对路上行人的动作识别,都依赖于高效率高精度的人体行为识别系统。而人体行为识别,目的就是在视频中对一个或者多个人的行为或者动作进行分类识别研究,其研究对象往往是一连串的视频序列,而不再局限于单帧的图像分析。因此,设计一套完善的行为识别系统,就依赖于对视频序列中的时间--空间特征进行有效的特征提取与分类。
然而,如何去设计并构建一个高精度并且鲁棒性强的人体行为识别模型是一项非常具有挑战性的工作。就行为识别问题本身而言,存在多方面的难题:(1)相同行为个体差异明显。考虑到行为在时间和空间维度上的分布,针对同一种或者同一类动作,不同的个体可能会有不同的表现,这些差异往往是由于不同个体对同一种或者同一类动作的个人理解不同导致,因此往往造成同一动作在完整性、运动轨迹、运动幅度以及运动速度存在较大差异,造成区分上的困难;(2)动态视频信息中往往存在诸多干扰信息,而这些信息很多在静态图像处理过程中是没有出现过的。比如个体与个体之间,个体与背景环境之间的遮挡、遮挡过程中发生的个体与个体之间或个体与背景环境之间发生的相对运动、视频序列中的光照强度和对比度等的变化,视频拍摄过程中镜头的移动与缩放,以及一段视频序列中动作可能不完整等等。种种这些难点均给视频序列中行为识别研究带来了极大的挑战性。
发明内容
有鉴于此,本发明的主要目的在于提供一种检测精度高、鲁棒性强的基于三维卷积神经网络和迁移学习模型的人体行为识别方法,大大提高了检测精度,同时,能应对多种场景下的人体行为识别,鲁棒性很强。
为了达到上述目的,本发明提出的技术方案为:一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,具体实现步骤如下:
步骤1、读取视频,将视频分解成诸多连续的单帧图像,然后将单帧图像进行堆叠,得到神经网络所需要的立方体结构,同时为每个立方体结构确定对应的行为分类标签;
步骤2、根据人体行为分类数N,设计N分类三维卷积神经网络结构。用所得到立方体结构作为单元,输入到该三维卷积神经网络中,通过多层结构计算得到最终的M维向量输出,M=N;
步骤3、结合三维卷积神经网络的N维向量输出和输入样本对应的标签,构建损失函数,通过最小化损失函数,训练三维卷积神经网络;
步骤4、训练好三维卷积神经网络后,从测试结果中挑选出部分类别对应的输入样本,构建总类别数为N′的子数据集,N′<N,并在此子数据集基础上,利用步骤2中N分类三维卷积神经网络结构,构建多个二分类模型,进行训练;
步骤5、训练完这些二分类模型后,挑选出分类效果最好的部分模型,利用迁移学习将二分类模型学到的知识迁移到N分类模型上,重新训练N分类模型。
步骤6、训练好最终的结合了迁移学习的N分类三维卷积神经网络后,即可用于人体行为识别。
所述步骤1中立方体结构的获取方法如下:
从原始视频数据中通过逐帧采样将视频拆解为一系列连续帧的图像,把它们在时间维度上进行堆叠,得到诸多能完整呈现一个动作的大小为w×h×d的立方体结构,其中w代表图像的宽度,h代表图像的高度,d代表时间轴上的长度,也就是堆叠图片的帧数。同时,用one-hot编码为每个立方体结构确定对应的行为分类标签。
所述步骤2使用的三维卷积神经网络结构为:
三维卷积神经网络的整体结构为数层嵌套的三维卷积层和三维池化层,和最后的数层全连接层构成。
其中,三维卷积层中利用三维卷积来提取输入样本中的时间—空间特征信息,用于行为识别。具体来讲,利用多个三维卷积核与输入立方体进行三维卷积操作,得到多个特征图。在输出的特征图中,位于空间坐标(x,y,z)处的响应的数值可由以下公式计算得出:
上式中,wijk为卷积核在位置(i,j,k)处的权值,k(x+i)(y+j)(z+k)为输入立方体单元中位置(x+i,y+j,z+k)处的图像灰度值,f为激活函数,b为偏置项。
三维卷积层计算得到特征图后,经过一层激活函数进行非线性变换处理,再输出给池化层。池化层用于对得到的特征图进行降采样。而经过最后一层节点数位N的全连接层后,借助Softmax函数,可得到最终的M维向量,M=N,对应为输入样本对于N分类的对应归属概率:
上式中,zi代表Softmax前的输出值,p(zi)代表输入样本属于第i类行为的概率。
所述步骤3构建损失函数的具体过程为:
选择平均交叉熵作为损失函数,即:
上式中,K代表输入样本总量,N代表总分类类别数,P(xij)代表神经网络预测出的第i个样本属于第j类的概率,Q(xij)代表真实的第i个样本属于第j类的概率。
所述步骤4构建子数据集和二分类模型的具体过程为:
在训练好基础的N分类三维神经网络后,在测试集上进行评估,找出分类结果最好的几个类别对应的输入样本,构建总类别数为N′(N′<N)的子数据集。并在此子数据集上,利用原分类网络,设计个二分类器,单独训练这些二分类器。
所述步骤5将二分类模型学到的知识迁移到原N分类模型的具体过程为:
在步骤4中个二分类器训练完毕后,利用测试阶段的测试结果,挑选出分类结果最好的个子模型,然后将这些子模型中前面部分结构的权重载入原N分类模型中,再修改最后几层的结构,最后重新训练这n个N分类模型,挑选出分类结果最佳的作为最终的N分类模型。
综上所述,本发明所述的一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,包括:对视频进行逐帧采样,在得到的多个连续的单帧图像上,在时间维度上堆叠为一定大小的图像立方体,作为三维神经网络的输入。在实现时,先训练基础的多分类三维神经网络模型,再从测试结果中挑选出部分类别的输入样本构建子数据集,然后在此子数据集基础上训练多个二分类模型,挑选出二分类结果最好的数个模型。最后,将这些模型学到的知识,利用迁移学习迁移到原多分类模型上,再重新训练迁移后的多分类模型,提高多分类识别准确率,实现高准确率的人体行为识别。
本发明与现有技术相比的优点在于:本发明具有检测精度高、鲁棒性强等特点,可广泛应用于医院、银行等公共场景的安全保护。通过使用三维卷积神经网络自动提取视频序列中的时间—空间信息特征,再结合迁移学习,具有准确率高,鲁棒性强的特点,而且识别速度很快。
附图说明
图1为本发明实现流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明作进一步地详细描述。
如图1所示,本发明具体实现如下步骤:
步骤1、读取视频,将视频分解成诸多连续的单帧图像,然后将单帧图像进行堆叠,得到神经网络所需要的立方体结构,同时为每个立方体结构确定对应的行为分类标签。即从原始视频数据中通过逐帧采样将视频拆解为一系列连续帧的图像,把它们在时间维度上进行堆叠,得到诸多能完整呈现一个动作的大小为w×h×d的立方体结构,其中w代表图像的宽度,h代表图像的高度,d代表时间轴上的长度,也就是堆叠图片的帧数。同时,用one-hot编码为每个立方体结构确定对应的行为分类标签。所谓one-hot编码就是使用N位状态寄存器来对N个状态进行编码,每个状态都有独立的寄存器为且在任意时候只有1位有效,如3类行为利用one-hot编码可得到100,010,001三种编码。
步骤2、根据人体行为分类数N,设计N分类三维卷积神经网络结构。用所得到立方体结构作为单元,输入到该三维卷积神经网络中,通过多层结构计算得到最终的M维向量输出,M=N。具体来讲,三维卷积神经网络的整体结构为数层嵌套的三维卷积层和三维池化层,和最后的数层全连接层构成其中。如图一所示,C代表三维卷积层,S代表三维池化层,FC代表全连接层。其中,三维卷积层中利用三维卷积来提取输入样本中的时间—空间特征信息,用于行为识别。利用多个三维卷积核与输入立方体进行三维卷积操作,可得到多个特征图。在输出的特征图中,位于空间坐标(x,y,z)处的响应的数值可由以下公式计算得出:
上式中,wijk为卷积核在位置(i,j,k)处的权值,k(x+i)(y+j)(z+k)为输入立方体单元中位置(x+i,y+j,z+k)处的图像灰度值,f为激活函数,b为偏置项。
三维卷积层计算得到特征图后,经过一层激活函数进行非线性变换处理,再输出给池化层。池化层用于对得到的特征图进行降采样。而经过最后一层节点数位N的全连接层后,借助Softmax函数,可得到最终的M维向量,M=N,对应为输入样本对于N分类的对应归属概率:
上式中,zi代表Softmax前的输出值,p(zi)代表输入样本属于第i类行为的概率。
步骤3、结合三维卷积神经网络的N维向量输出和输入样本对应的标签,构建损失函数,通过最小化损失函数,训练三维卷积神经网络。可选择平均交叉熵作为损失函数,即:
上式中,K代表输入样本总量,N代表总分类类别数,P(xij)代表神经网络预测出的第i个样本属于第j类的概率,Q(xij)代表真实的第i个样本属于第j类的概率。
步骤4、训练好三维卷积神经网络后,从测试结果中挑选出部分类别对应的输入样本,构建总类别数为N′的子数据集,N′<N,并在此子数据集基础上,利用步骤2中N分类三维卷积神经网络结构,构建多个二分类模型,进行训练。其中,构建总类别数为N′的子数据集和二分类模型的具体过程为:
在训练好基础的N分类三维神经网络后,在测试集上进行评估,找出分类结果最好的几个类别对应的输入样本,构建总类别数为N′(N′<N)的子数据集。并在此子数据集上,利用原N分类三维卷积神经网络,更改图一中最后输出层节点数为2,由此设计个二分类器,单独训练这些二分类器。
步骤5、训练完这些二分类模型后,挑选出分类效果最好的部分模型,利用迁移学习将二分类模型学到的知识迁移到N分类模型上,重新训练N分类模型。具体来讲,在步骤4中个二分类器训练完毕后,利用测试阶段的测试结果,挑选出分类结果最好的个子模型,然后将这些子模型中前面部分结构的权重载入原N分类模型中,再修改最后几层的结构(如图一中,删除节点数为n1和n2的几个全连接层,更改为节点数为n′1,n′2,n′3的几个新的全连接层),最后重新训练这n个N分类模型,挑选出分类结果最佳的作为最终的N分类模型。
步骤6、训练好最终的结合了迁移学习的N分类三维卷积神经网络后,即可用于人体行为识别。
总之,本发明以视频中人体行为的识别为主,针对原始视频数据,使用深度学习中的三维神经网络模型提取特征,进行训练和检测。由于三维卷积神经网络能自动提取有效的时间—空间特征信息,同时具有尺度和空间变换不变的鲁棒性,因此提取的特征往往由于人工设计的特征提取器。最后结合迁移学习模型,将子数据集中的二分类模型中学到的知识迁移到原多分类模型中,能显著提高模型行为识别分类能力,具有极高的识别准确率。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,其特征在于实现步骤如下:
步骤1、读取视频,将视频分解成诸多连续的单帧图像,然后将单帧图像进行堆叠,得到神经网络所需要的立方体结构,同时为每个立方体结构确定对应的行为分类标签;
步骤2、根据人体行为分类数N,设计N分类三维卷积神经网络结构,用所得到立方体结构作为单元,输入到该三维卷积神经网络中,通过多层结构计算得到最终的M维向量输出,M=N;
步骤3、结合三维卷积神经网络的N维向量输出和输入样本对应的标签,构建损失函数,通过最小化损失函数,训练三维卷积神经网络;
步骤4、训练好三维卷积神经网络后,从测试结果中挑选出部分类别对应的输入样本,构建总类别数为N′的子数据集,N′<N,并在此子数据集基础上,利用步骤2中N分类三维卷积神经网络结构构建多个二分类模型,进行训练;
步骤5、训练完这些二分类模型后,挑选出分类效果最好的部分模型,利用迁移学习将二分类模型学到的知识迁移到N分类模型上,重新训练N分类模型;
步骤6、训练好最终的结合了迁移学习的N分类三维卷积神经网络后,即可用于人体行为识别。
2.根据权利要求1所述的一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,其特征在于:所述步骤1中立方体结构的获取方法如下:
从原始视频数据中通过逐帧采样将视频拆解为一系列连续帧的图像,把它们在时间维度上进行堆叠,得到诸多能完整呈现一个动作的大小为w×h×d的立方体结构,其中w代表图像的宽度,h代表图像的高度,d代表时间轴上的长度,也就是堆叠图片的帧数,同时,用one-hot编码为每个立方体结构确定对应的行为分类标签。
3.根据权利要求1所述的一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法,其特征在于:所述步骤2使用的三维卷积神经网络结构为:
三维卷积神经网络的整体结构为数层嵌套的三维卷积层和三维池化层,和最后的数层全连接层构成;
其中,三维卷积层中利用三维卷积来提取输入样本中的时间—空间特征信息,用于行为识别,利用多个三维卷积核与输入立方体进行三维卷积操作,得到多个特征图;在输出的特征图中,位于空间坐标(x,y,z)处的响应的数值由以下公式计算得出:
上式中,wijk为卷积核在位置(i,j,k)处的权值,k(x+i)(y+j)(z+k)为输入立方体单元中位置(x+i,y+j,z+k)处的图像灰度值,f为激活函数,b为偏置项;
三维卷积层计算得到特征图后,经过一层激活函数进行非线性变换处理,再输出给池化层,池化层用于对得到的特征图进行降采样,经过最后一层节点数位N的全连接层后,借助Softmax函数,得到最终的M维向量,M=N,对应为输入样本对于N分类的对应归属概率:
上式中,zi代表Softmax前的输出值,p(zi)代表输入样本属于第i类行为的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710785550.2A CN107506740B (zh) | 2017-09-04 | 2017-09-04 | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710785550.2A CN107506740B (zh) | 2017-09-04 | 2017-09-04 | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107506740A CN107506740A (zh) | 2017-12-22 |
CN107506740B true CN107506740B (zh) | 2020-03-17 |
Family
ID=60695764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710785550.2A Active CN107506740B (zh) | 2017-09-04 | 2017-09-04 | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107506740B (zh) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108287162B (zh) * | 2018-01-09 | 2021-04-23 | 温州大学 | 一种食品安全智能检测的方法 |
CN109416743B (zh) * | 2018-01-15 | 2022-05-24 | 深圳鲲云信息科技有限公司 | 一种用于识别人为动作的三维卷积装置 |
CN108281183A (zh) * | 2018-01-30 | 2018-07-13 | 重庆大学 | 基于卷积神经网络和迁移学习的宫颈涂片图像诊断系统 |
CN108399380A (zh) * | 2018-02-12 | 2018-08-14 | 北京工业大学 | 一种基于三维卷积和Faster RCNN的视频动作检测方法 |
CN108416288A (zh) * | 2018-03-04 | 2018-08-17 | 南京理工大学 | 基于全局与局部网络融合的第一视角交互动作识别方法 |
CN108492873B (zh) * | 2018-03-13 | 2021-03-16 | 山东大学 | 一种用于辅助诊断阿兹海默症的知识迁移学习方法 |
CN108664878A (zh) * | 2018-03-14 | 2018-10-16 | 广州影子控股股份有限公司 | 基于卷积神经网络的猪只身份识别方法 |
EP3767338A4 (en) * | 2018-03-15 | 2021-12-01 | Koito Manufacturing Co., Ltd. | OBJECT IDENTIFICATION SYSTEM, AUTOMOTIVE, VEHICLE LAMP ACCESSORY AND OBJECT TYPE IDENTIFICATION METHOD |
CN108549841A (zh) * | 2018-03-21 | 2018-09-18 | 南京邮电大学 | 一种基于深度学习的老人跌倒行为的识别方法 |
CN108664998A (zh) * | 2018-04-27 | 2018-10-16 | 上海爱优威软件开发有限公司 | 一种释义加强的图片训练方法及系统 |
CN108596138A (zh) * | 2018-05-03 | 2018-09-28 | 南京大学 | 一种基于迁移层次网络的人脸识别方法 |
CN108830295B (zh) * | 2018-05-10 | 2020-09-22 | 华南理工大学 | 基于多时间尺度回声状态网络的多变量时间序列分类方法 |
CN108647718B (zh) * | 2018-05-10 | 2020-11-20 | 江苏大学 | 一种不同材料金相组织自动分类评级的方法 |
CN108647723B (zh) * | 2018-05-11 | 2020-10-13 | 湖北工业大学 | 一种基于深度学习网络的图像分类方法 |
CN108717568B (zh) * | 2018-05-16 | 2019-10-22 | 陕西师范大学 | 一种基于三维卷积神经网络的图像特征提取与训练方法 |
CN108764142A (zh) * | 2018-05-25 | 2018-11-06 | 北京工业大学 | 基于3dcnn的无人机影像森林烟雾检测和分类方法 |
CN108921032B (zh) * | 2018-06-04 | 2022-04-29 | 创意信息技术股份有限公司 | 一种新的基于深度学习模型的视频语义提取方法 |
CN108985173B (zh) * | 2018-06-19 | 2022-04-05 | 奕通信息科技(上海)股份有限公司 | 面向有标记噪声表观年龄数据库的深度网络迁移学习方法 |
CN109255284B (zh) * | 2018-07-10 | 2021-02-12 | 西安理工大学 | 一种基于运动轨迹的3d卷积神经网络的行为识别方法 |
CN108961317A (zh) * | 2018-07-27 | 2018-12-07 | 阿依瓦(北京)技术有限公司 | 一种视频深度分析的方法与系统 |
CN109086723B (zh) * | 2018-08-07 | 2022-03-25 | 广东工业大学 | 一种基于迁移学习的人脸检测的方法、装置以及设备 |
CN109035242B (zh) * | 2018-08-09 | 2022-03-01 | 长安大学 | 一种基于深度学习的hf-erw焊接状态检测方法及装置 |
CN109344891A (zh) * | 2018-09-21 | 2019-02-15 | 北京航空航天大学 | 一种基于深度神经网络的高光谱遥感数据分类方法 |
CN109300128B (zh) * | 2018-09-29 | 2022-08-26 | 聚时科技(上海)有限公司 | 基于卷积神经网隐含结构的迁移学习图像处理方法 |
CN109409256A (zh) * | 2018-10-10 | 2019-03-01 | 东南大学 | 一种基于3d卷积神经网络的森林烟火检测方法 |
CN110163234B (zh) * | 2018-10-10 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 一种模型训练方法、装置和存储介质 |
CN109446970B (zh) * | 2018-10-24 | 2021-04-27 | 西南交通大学 | 一种基于深度学习的变电站巡检机器人道路场景识别方法 |
CN111259919B (zh) * | 2018-11-30 | 2024-01-23 | 杭州海康威视数字技术股份有限公司 | 一种视频分类方法、装置及设备、存储介质 |
CN109657793B (zh) * | 2018-12-26 | 2020-09-22 | 广州小狗机器人技术有限公司 | 模型训练方法及装置、存储介质及电子设备 |
CN109829398B (zh) * | 2019-01-16 | 2020-03-31 | 北京航空航天大学 | 一种基于三维卷积网络的视频中的目标检测方法 |
CN109919162B (zh) * | 2019-01-25 | 2021-08-10 | 武汉纺织大学 | 用于输出mr图像特征点描述向量符的模型及其建立方法 |
CN109919011A (zh) * | 2019-01-28 | 2019-06-21 | 浙江工业大学 | 一种基于多时长信息的动作视频识别方法 |
CN109947990A (zh) * | 2019-03-29 | 2019-06-28 | 北京奇艺世纪科技有限公司 | 一种精彩片段检测方法及系统 |
CN110046568B (zh) * | 2019-04-11 | 2022-12-06 | 中山大学 | 一种基于时间感知结构的视频动作识别方法 |
CN110046707B (zh) * | 2019-04-15 | 2021-08-06 | 清华大学深圳研究生院 | 一种神经网络模型的评估优化方法和系统 |
CN111858291B (zh) * | 2019-04-30 | 2022-04-22 | 华为技术有限公司 | 计费系统迁移测试中数据异常的根因确定方法、设备及系统 |
CN110135306B (zh) * | 2019-04-30 | 2022-07-26 | 电子科技大学 | 基于角度损失函数的行为识别方法 |
CN111860064B (zh) * | 2019-04-30 | 2023-10-20 | 杭州海康威视数字技术股份有限公司 | 基于视频的目标检测方法、装置、设备及存储介质 |
CN110334589B (zh) * | 2019-05-23 | 2021-05-14 | 中国地质大学(武汉) | 一种基于空洞卷积的高时序3d神经网络的动作识别方法 |
CN110309720A (zh) * | 2019-05-27 | 2019-10-08 | 北京奇艺世纪科技有限公司 | 视频检测方法、装置、电子设备和计算机可读介质 |
CN110298264B (zh) * | 2019-06-10 | 2023-05-30 | 上海师范大学 | 基于堆叠降噪自编码器的人体日常行为活动识别优化方法 |
CN110425005B (zh) * | 2019-06-21 | 2020-06-30 | 中国矿业大学 | 矿井下皮带运输人员人机交互行为安全监控与预警方法 |
CN110348494A (zh) * | 2019-06-27 | 2019-10-18 | 中南大学 | 一种基于双通道残差神经网络的人体动作识别方法 |
CN110659665B (zh) * | 2019-08-02 | 2023-09-29 | 深圳力维智联技术有限公司 | 一种异维特征的模型构建方法及图像识别方法、装置 |
CN110705367A (zh) * | 2019-09-05 | 2020-01-17 | 西安理工大学 | 一种基于三维卷积神经网络的人体平衡能力分类方法 |
CN110705599B (zh) * | 2019-09-06 | 2021-10-19 | 北京理工大学 | 一种基于在线迁移学习的人体动作识别方法 |
CN110909760B (zh) * | 2019-10-12 | 2021-03-16 | 中国人民解放军国防科技大学 | 一种基于卷积神经网络的图像开放集识别方法 |
CN111063389B (zh) * | 2019-12-04 | 2021-10-29 | 浙江工业大学 | 一种基于深度卷积神经网络的配体绑定残基预测方法 |
CN111738044B (zh) * | 2020-01-06 | 2024-01-19 | 西北大学 | 一种基于深度学习行为识别的校园暴力评估方法 |
JP7403340B2 (ja) * | 2020-02-17 | 2023-12-22 | 株式会社日立製作所 | 物体認識モデルの流用可否を判定するシステム。 |
CN111291699B (zh) * | 2020-02-19 | 2022-06-03 | 山东大学 | 基于监控视频时序动作定位和异常检测的变电站人员行为识别方法 |
CN111556453A (zh) * | 2020-04-27 | 2020-08-18 | 南京邮电大学 | 一种基于信道状态信息和BiLSTM的多场景室内动作识别方法 |
CN111652066B (zh) * | 2020-04-30 | 2022-07-26 | 北京航空航天大学 | 基于多自注意力机制深度学习的医疗行为识别方法 |
CN112001345B (zh) * | 2020-08-31 | 2022-09-20 | 中国科学院自动化研究所 | 基于特征变换度量网络的少样本人体行为识别方法及系统 |
CN111932561A (zh) * | 2020-09-21 | 2020-11-13 | 深圳大学 | 基于集成知识蒸馏的实时肠镜影像分割方法及装置 |
CN111932035B (zh) * | 2020-09-22 | 2021-01-08 | 南京福佑在线电子商务有限公司 | 基于多模型的数据处理方法、装置及分类建模的方法 |
CN112396637A (zh) * | 2021-01-19 | 2021-02-23 | 南京野果信息技术有限公司 | 一种基于3d神经网络的动态行为识别方法及系统 |
CN113362324B (zh) * | 2021-07-21 | 2023-02-24 | 上海脊合医疗科技有限公司 | 一种基于视频图像的骨骼健康检测方法及系统 |
CN113721276B (zh) * | 2021-08-31 | 2022-08-16 | 中国人民解放军国防科技大学 | 基于多颗卫星的目标定位方法、装置、电子设备及介质 |
CN114677632B (zh) * | 2022-05-26 | 2022-10-18 | 之江实验室 | 一种基于三维垂直阻变存储器的视频动作识别方法和装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8345984B2 (en) * | 2010-01-28 | 2013-01-01 | Nec Laboratories America, Inc. | 3D convolutional neural networks for automatic human action recognition |
CN103295016A (zh) * | 2013-06-26 | 2013-09-11 | 天津理工大学 | 基于深度与rgb信息和多尺度多方向等级层次特征的行为识别方法 |
CN104217214A (zh) * | 2014-08-21 | 2014-12-17 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于可配置卷积神经网络的rgb-d人物行为识别方法 |
CN104732208A (zh) * | 2015-03-16 | 2015-06-24 | 电子科技大学 | 基于稀疏子空间聚类的视频人体行为识别方法 |
CN104966104A (zh) * | 2015-06-30 | 2015-10-07 | 孙建德 | 一种基于三维卷积神经网络的视频分类方法 |
CN105160310A (zh) * | 2015-08-25 | 2015-12-16 | 西安电子科技大学 | 基于3d卷积神经网络的人体行为识别方法 |
CN105512640A (zh) * | 2015-12-30 | 2016-04-20 | 重庆邮电大学 | 一种基于视频序列的人流量统计方法 |
CN105825511A (zh) * | 2016-03-18 | 2016-08-03 | 南京邮电大学 | 一种基于深度学习的图片背景清晰度检测方法 |
CN106203283A (zh) * | 2016-06-30 | 2016-12-07 | 重庆理工大学 | 基于三维卷积深度神经网络和深度视频的动作识别方法 |
CN106203318A (zh) * | 2016-06-29 | 2016-12-07 | 浙江工商大学 | 基于多层次深度特征融合的摄像机网络行人识别方法 |
-
2017
- 2017-09-04 CN CN201710785550.2A patent/CN107506740B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8345984B2 (en) * | 2010-01-28 | 2013-01-01 | Nec Laboratories America, Inc. | 3D convolutional neural networks for automatic human action recognition |
CN103295016A (zh) * | 2013-06-26 | 2013-09-11 | 天津理工大学 | 基于深度与rgb信息和多尺度多方向等级层次特征的行为识别方法 |
CN104217214A (zh) * | 2014-08-21 | 2014-12-17 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于可配置卷积神经网络的rgb-d人物行为识别方法 |
CN104732208A (zh) * | 2015-03-16 | 2015-06-24 | 电子科技大学 | 基于稀疏子空间聚类的视频人体行为识别方法 |
CN104966104A (zh) * | 2015-06-30 | 2015-10-07 | 孙建德 | 一种基于三维卷积神经网络的视频分类方法 |
CN105160310A (zh) * | 2015-08-25 | 2015-12-16 | 西安电子科技大学 | 基于3d卷积神经网络的人体行为识别方法 |
CN105512640A (zh) * | 2015-12-30 | 2016-04-20 | 重庆邮电大学 | 一种基于视频序列的人流量统计方法 |
CN105825511A (zh) * | 2016-03-18 | 2016-08-03 | 南京邮电大学 | 一种基于深度学习的图片背景清晰度检测方法 |
CN106203318A (zh) * | 2016-06-29 | 2016-12-07 | 浙江工商大学 | 基于多层次深度特征融合的摄像机网络行人识别方法 |
CN106203283A (zh) * | 2016-06-30 | 2016-12-07 | 重庆理工大学 | 基于三维卷积深度神经网络和深度视频的动作识别方法 |
Non-Patent Citations (5)
Title |
---|
《END-TO-END LEARNING OF DEEP CONVOLUTIONAL NEURAL NETWORK FOR 3D HUMAN ACTION RECOGNITION》;Chao Li等;《Proceedings of the IEEE International Conference on Multimedia and Expo Workshops (ICMEW) 2017》;20170714;第609-612页 * |
《PLANKTON CLASSIFICATION ON IMBALANCED LARGE SCALE DATABASE VIA CONVOLUTIONAL NEURAL NETWORKS WITH TRANSFER LEARNING》;Hansang Lee等;《2016 IEEE International Conference on Image Processing (ICIP)》;20161231;第3713-3717页 * |
《基于深度学习混合模型迁移学习的图像分类》;石祥滨等;《系统仿真学报》;20160131;第28卷(第1期);第167-173,182页 * |
《基于计算机视觉的人体动作识别技术研究》;李拟珺;《万方学位论文全文数据库》;20160503;第1-138页 * |
《深度学习及其在图像物体分类与检测中的应用综述》;刘栋等;《计算机科学》;20161231;第43卷(第12期);第13-23页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107506740A (zh) | 2017-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107506740B (zh) | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 | |
CN110414432B (zh) | 对象识别模型的训练方法、对象识别方法及相应的装置 | |
CN111126360B (zh) | 基于无监督联合多损失模型的跨域行人重识别方法 | |
CN111814661B (zh) | 基于残差-循环神经网络的人体行为识别方法 | |
CN105678284B (zh) | 一种固定位人体行为分析方法 | |
CN107871014A (zh) | 一种基于深度融合哈希的大数据跨模态检索方法及系统 | |
CN109858390A (zh) | 基于端到端时空图学习神经网络的人体骨架的行为识别方法 | |
CN106845341B (zh) | 一种基于虚拟号牌的无牌车辆识别方法 | |
CN111652066A (zh) | 基于多自注意力机制深度学习的医疗行为识别方法 | |
CN110929080B (zh) | 基于注意力和生成对抗网络的光学遥感图像检索方法 | |
CN109743642B (zh) | 基于分层循环神经网络的视频摘要生成方法 | |
CN112949647B (zh) | 三维场景描述方法、装置、电子设备和存储介质 | |
CN106909938B (zh) | 基于深度学习网络的视角无关性行为识别方法 | |
CN111008618B (zh) | 一种自注意力深度学习端到端的行人再识别方法 | |
CN111709311A (zh) | 一种基于多尺度卷积特征融合的行人重识别方法 | |
CN112906720A (zh) | 基于图注意力网络的多标签图像识别方法 | |
CN106650617A (zh) | 一种基于概率潜在语义分析的行人异常识别方法 | |
CN109598220A (zh) | 一种基于多元输入多尺度卷积的人数统计方法 | |
CN112766283B (zh) | 一种基于多尺度卷积网络的两相流流型识别方法 | |
CN112801063B (zh) | 神经网络系统和基于神经网络系统的图像人群计数方法 | |
CN109446897B (zh) | 基于图像上下文信息的场景识别方法及装置 | |
CN113379771A (zh) | 带有边缘约束的层次化人体解析语义分割方法 | |
CN111738074B (zh) | 基于弱监督学习的行人属性识别方法、系统及装置 | |
Fan | Research and realization of video target detection system based on deep learning | |
CN110598746A (zh) | 一种基于ode求解器自适应的场景分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |