CN108647639A - 实时人体骨骼关节点检测方法 - Google Patents
实时人体骨骼关节点检测方法 Download PDFInfo
- Publication number
- CN108647639A CN108647639A CN201810441934.7A CN201810441934A CN108647639A CN 108647639 A CN108647639 A CN 108647639A CN 201810441934 A CN201810441934 A CN 201810441934A CN 108647639 A CN108647639 A CN 108647639A
- Authority
- CN
- China
- Prior art keywords
- network
- image
- thermodynamic chart
- real
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种实时人体骨骼关节点检测方法,属于图像处理领域。本发明设计了一种层次上下文姿态检测网络,采用数字图像处理技术以及深度学习实现对不同姿态,不同光照,不同尺度大小的人体实时的检测出骨骼关节点的坐标,在保证精度的同时下实现了实时的检测方法,能够显著降低模型的计算量,保证了模型训练和部署使用的效率。
Description
技术领域
本发明属于图像处理领域,特别涉及一种实时人体骨骼关节点检测方法。
背景技术
近年来,随着计算机处理器,计算机图像并行处理器等硬件性能的飞速提升,以及深度学习在计算机视觉领域的研究发展迅速和算法的应用落地迅速,视频监控技术也得到了快速的发展。视频监控技术的智能化、平台化、信息联动化得到了进一步的发展,可以说是安防领域中不可缺失的一环。视频监控涉及图像处理、传统机器学习、深度学习、人工智能、大数据、云计算等多个领域,既是一个多学科融合的问题,也是一个不断发展和具有巨大现实意义的课题。虽然技术发展的过程出现许多新的问题和挑战,但同样这些问题和挑战不断推进了技术的发展和革新,有利于科技的进步。
人体骨骼关节点对于描述人体姿态、预测人体行为至关重要,相较于传统的动作视频分类,通过骨骼关节点可以获得更精准的动作检测,且对某一动作进行骨骼关节点序列定义。因此人体骨骼关节点检测是诸多计算机视觉任务的基础,例如动作分类、异常行为检测、以及自动驾驶。
现有技术中,有一种人体骨骼关节点检查方法,首先通过RGB摄像头采集数据,提取帧图像;然后对帧图像上面人体进行标注,包括人体的中心坐标,人体框的坐标,人体各个骨骼关节点的坐标,生成标注文件;然后包括对裁剪后的输入图像随机旋转、缩放、颜色偏移的数据扩展层,增强算法的鲁棒性、泛化能力,并将输入的图片大小固定为256*256;然后预处理后的图片首先会经过64个步长为2的7*7卷积来提取图片的特征,并继续通过一个窗口大小为2*2、步长为2的最大池化层来继续缩小特征尺度,然后通过了8个相同结构的“沙漏”模块,每个“沙漏”模块会对输入的特征先下采样再上采样,在上采样的过程中会融合下采样的特征,“沙漏”模块中全部应用残差模块来对特征进行提取,在8个“沙漏”模块的最后会应用关节点个数的1*1卷积,用来产生预测的热力图,用来与真实的热力图计算损失,通过随机梯度下降来优化网络中的参数;然后在训练完成之后,将需要检测的图片输入网络,计算出一组热力图,选择计算热力图的最大值的位置作为关节点的坐标。
虽然“沙漏”网络是一个融合多个尺度特征学习的网络模型,能够更加精确的学习热力图,产生更精确的坐标,但因为网络在输入尺寸为256*256的RGB图片后预测前传的平均时间约为130ms,FPS大概为7.6,在实时性上还不能达到要求。且在12GB NVIDIA TitanXGPU上需要训练5天才能达到拟合,实际部署较为困难。
现有技术中,还有另一种人体关键点检测框架,首先用彩色摄像机,用于捕捉人体姿态图像,形成输入图像;然后将输入的视频图像提取为帧图像,并人工进行图片标注,并对彩色图像进行人工标注获得采样数据,具体标注出人体关节坐标,人体检测框,人体中心坐标;然后在训练阶段使用深度卷积神经网络方法进行采样数据的特征提取和网络参数学习,通过一个全卷积的框架回归各个关节对应的热力图,设计了一个由多个卷积层和池化层组成的多阶段网络,在第一个阶段用来提取出全局的特征,输出的特征通道个数为所要学习关节种类个数加1;第二个阶段及其以后的阶段会将由原图经过一个共享权重的模块的输出和上一个阶段的输出融合得到一个新的特征来继续回归出热力图,该热力图会与真实的热力图计算损失,并采用随机梯度下降法优化网络参数,网络的总共阶段为6个,每个阶段会加入中继监督,防止梯度过小或者消失;然后根据训练阶段训练好的权重,提取需要检测关键点坐标的图片输入网络后输出的特征;最后根据特征提取模块得到的热力图通过立方插值将预测出的热力图方法到输入图片大小,并为了防止有些坐标点错误的响应过大的值,采样高斯滤波的方法,将热力图的值的分布变得平滑,并计算最大值的位置,这个坐标被认为关节点的坐标。
虽然该方法在关节的精度上取得了较好的效果,但因网络参数数量过大,导致关节点预测耗时,实时性很大达到。且网络训练过程较慢,不利于实际应用中特定数据(例如监控数据等)训练。
发明内容
为了解决现有技术中只集中于如何提升模型的精确度,却没有关注如何降低模型的计算量,使结果生成更快速的问题,本发明提供了一种实时人体骨骼关节点检测方法,设计了一种层次上下文姿态检测网络,该网络能够显著降低模型的计算量,保证了模型训练和部署使用的效率。
一种实时人体骨骼关节点检测方法,包括以下步骤:
步骤1,获取检测数据集;
步骤2,构建检测网络,并对所述检测网络进行训练,得到网络模型;
步骤3,基于所述网络模型,对输入的图像进行处理后得到人体骨骼关节点的坐标。
进一步地,所述步骤1包括以下步骤:
步骤11,获取检测数据集D,所述检测数据集中样本(X,Y)∈D,其中,X为输入的人体图像,Y为对应的表征人体姿态关节点坐标集合{y1,y2,…,yJ}∈Y,J为关节点个数;
步骤12,对坐标集合Y进行处理,设定热力图hj的宽和高分别为Wh和Hh,其中,{h1,h2,…,hJ}∈h,h为热力图集合,
式中,为关节点的坐标,(a,b)表示热力图中的任意位置,a∈[1,Wh],b∈[1,Hh],通过上式遍历热力图的每个位置生成热力图hj。
进一步地,所述步骤2包括以下步骤:
步骤21,对输入的图像进行裁剪,并对图像进行扩增处理,根据图像中人体关节点的坐标生成热力图;
步骤22,构建检测网络;
步骤23,使用RMSProp优化算法对网络进行训练;
步骤24,得到网络模型。
进一步地,所述步骤21中包括以下流程:
步骤211,随机生成一个范围在[0,1]之间的第一随机数P1,若P1大于0.5,则随机生成一个范围在[-40°,40°]之间的随机角度r,r为正数时表示将图像围绕人体中心顺时针旋转对应角度,r为负数表示将图像围绕人体中心逆时针旋转对应角度;
步骤212,随机生成一个范围在[0,1]之间的第二随机数P2,若P2大于0.5,则随机生成一个范围在[0.8,1.2]之间的随机缩放比率,将图像以所述缩放比率进行缩放;
步骤213,设定(vr,vg,vb)∈X,其中(vr,vg,vb)表示图像X中的任意一个位置的像素值,所述像素值经过归一化后范围在[0,1]之间,随机生成一个范围在[0,1]之间的第三随机数P3,若P3大于0.5,则随机生成一个范围在[0.8,1.5]之间的扰动,将所述扰动与所述像素值相乘,并对超出所述像素值范围的进行截断。
进一步地,所述步骤22中包括以下流程:
所述检测网络分为S阶段,所述检测网络包括特征提取模块、回归网络模块、上下文融合模块及中间上下文学习模块;
所述特征提取模块为Fshare(·),输入为经过扩增处理的图像Xpreprocess,输出为M={m1,m2,…,mS},M=Fshare(Xpreprocess),用于提取输入图像的低层特征并输入至所述回归网络模块;
所述回归网络模块包含每个阶段的子网络,第一阶段的子网络为R1(·),输出为所预测的热力图p1和高层特征q1,q1=R1(m1);
所述上下文融合模块为Bs(·),输入为所述特征提取模块提取的特征ms和所述中间上下文学习模块输出的特征vs-1,该模块中的s=2,..,S,ts=Bs(ms,vs),用于将所述特征提取模块提取的特征ms和所述中间上下文学习模块输出的特征vs-1两个特征进行线性变换,再将变换的特征使用元素间相加进行融合;
第s阶段的所述子网络为Rs(·),输入为所述上下文融合模块的输出ts,输出为所得到的高层特征qs,该模块中的s=2,..,S,qs=Rs(ts);
除了最后一个阶段,每个阶段子网络都包含一个中间上下文学习模块L(·),输入为每个子网络提取的高层特征,输出为特征vs和损失函数的值losss-1,该模块中的s=2,..,S,有vs,ps-1=L(qs-1),所述中间上下文学习模块用于将输入的前一阶段高层特征qs-1使用两个1×1卷积分别进行变换,再对第二个卷积的特征得到预测的热力图,再使用1×1卷积对热力图进行线性变换,将经过变换的热力图和第一个卷积提取的特征使用各个元素相加的方式进行融合,融合后的特征为vs;
最后一个阶段中,所述子网络包含姿态预测学习模块,用于计算最后一个阶段的损失函数值lossS。
进一步地,所述步骤23中包括以下流程:
每个阶段的子网络的损失函数为losss=(ps-h)2,整个所述检测网络的损失函数为对所述检测网络使用RMSProp优化器进行训练,训练过程所使用的学习率为0.00025,数据的大小为4,训练的epoch为150,计算所述检测网络的损失函数,循环迭代更新网络参数,直到达到设定的训练的epoch的次数,得到网络模型。
进一步地,所述步骤3中包括以下流程:
步骤31,对输入的图像进行预处理;
步骤32,加载所述网络模型,将经过预处理的图像输入至所述网络模型,得到所述网络模型输出的热力图;
步骤33,对所述网络模型输出的热力图进行后处理,得到每个关节点的坐标。
进一步地,所述步骤31中对图像进行的预处理包括以下流程:
根据图像中人的中心对图像进行裁剪,使图像中只包含单人且使人在裁剪后的图像中心,将经过裁剪后的图像再进行左右翻转,并将未经翻转的图像和经过翻转的图像共同作为所述网络模型的输入。
本发明的有益效果:本发明提供了一种实时人体骨骼关节点检测方法,设计了一种层次上下文姿态检测网络,采用数字图像处理技术以及深度学习实现对不同姿态,不同光照,不同尺度大小的人体实时的检测出骨骼关节点的坐标,在保证精度的同时下实现了实时的检测方法,能够显著降低模型的计算量,保证了模型训练和部署使用的效率。
附图说明
图1为本发明的流程图。
图2为图1中步骤2的流程图。
图3为图2中步骤21的流程图。
图4为图2中步骤22构建的检测网络框图。
图5为上下文融合模块的结构示意图。
图6为中间上下文学习模块的结构示意图。
图7为图1中步骤3的流程图。
图中:100-特征提取模块;200-回归网络模块;300-上下文融合模块;400-中间上下文学习模块。
具体实施方式
下面结合附图对本发明的实施例做进一步的说明。
本发明提供一种实时人体骨骼关节点检测方法,请参阅图1,通过以下步骤实现:
步骤1,获取检测数据集。
本实施例中,步骤1通过以下流程实现:
步骤11,获取检测数据集D,所述检测数据集中样本(X,Y)∈D,其中,X为输入的包含单个人的人体图像,Y为对应的表征人体姿态关节点坐标集合{y1,y2,…,yJ}∈Y,J为关节点个数。
步骤12,为了生成对坐标集合网络训练所需要的类标,即热力图的集合{h1,h2,…,hJ}∈h,需要对坐标集合Y进行处理。设定热力图hj的宽和高分别为Wh和Hh。
式中,为关节点的坐标,(a,b)表示热力图中的任意位置,a∈[1,Wh],b∈[1,Hh],通过上式遍历热力图的每个位置生成热力图hj。
步骤2,构建检测网络,并对所述检测网络进行训练,得到网络模型。
请参阅图2,步骤2通过以下流程实现:
步骤21,对输入的图像进行裁剪,并对图像进行扩增处理,根据图像中人体关节点的坐标生成热力图。
本实施例中,为了应对网络检测中样本不充分的问题,需要对数据集进行扩增,本发明通过对输入图像进行旋转、缩放、颜色偏移的方式来对样本进行扩增。请参阅图3,具体实施如下:
步骤211,随机生成一个范围在[0,1]之间的第一随机数P1,若P1大于0.5,则随机生成一个范围在[-40°,40°]之间的随机角度r,r为正数时表示将图像围绕人体中心顺时针旋转对应角度,r为负数表示将图像围绕人体中心逆时针旋转对应角度;
步骤212,随机生成一个范围在[0,1]之间的第二随机数P2,若P2大于0.5,则随机生成一个范围在[0.8,1.2]之间的随机缩放比率,将图像以所述缩放比率进行缩放;
步骤213,设定(vr,vg,vb)∈X,其中(vr,vg,vb)表示图像X中的任意一个位置的像素值,所述像素值经过归一化后范围在[0,1]之间,随机生成一个范围在[0,1]之间的第三随机数P3,若P3大于0.5,则随机生成一个范围在[0.8,1.5]之间的扰动,将所述扰动与所述像素值相乘,并对超出所述像素值范围的进行截断。
本实施例中,根据随机生成的随机数P,以一定概率对图像进行扩增处理,增加数据集中的样本。
步骤22,构建检测网络。
请参阅图4,本发明实施例构建的检测网络如图,具体如下:
所述检测网络分为S阶段,所述检测网络包括特征提取模块100、回归网络模块200、上下文融合模块300及中间上下文学习模块400。
所述特征提取模块100为Fshare(·),输入为经过扩增处理的图像Xpreprocess,输出为M={m1,m2,…,mS},M=Fshare(Xpreprocess),其中S为阶段的个数,用于提取输入图像的低层特征并输入至所述回归网络模块200。
所述回归网络模块200包含每个阶段的子网络,第一阶段的子网络为R1(·),输出为所预测的热力图p1和高层特征q1,q1=R1(m1)。
所述上下文融合模块300为Bs(·),输入为所述特征提取模块100提取的特征ms和所述中间上下文学习模块400输出的特征vs-1,该模块中的s=2,..,S,ts=Bs(ms,vs)。请参阅图5,上下文融合模块300包含两个1×1卷积,对输入的两个特征(特征提取模块100提取的特征ms和所述中间上下文学习模块400输出的特征vs-1)进行线性变换,再将变换的特征使用元素间相加进行融合。
第s阶段的所述子网络为Rs(·),输入为所述上下文融合模块300的输出ts,输出为所得到的高层特征qs,该模块中的s=2,..,S,qs=Rs(ts)。
除了最后一个阶段,每个阶段子网络都包含一个中间上下文学习模块400L(·),输入为每个子网络提取的高层特征,输出为特征vs和损失函数的值losss-1,该模块中的s=2,..,S,有vs,ps-1=L(qs-1)。请参阅图6,中间上下文学习模块400用于将输入的前一阶段高层特征qs-1使用两个1×1卷积分别进行变换,再对第二个卷积的特征得到预测的热力图,再使用1×1卷积对热力图进行线性变换,将经过变换的热力图和第一个卷积提取的特征使用各个元素相加的方式进行融合,融合后的特征为vs;
最后一个阶段中,所述子网络包含姿态预测学习模块,用于计算最后一个阶段的损失函数值lossS。
步骤23,使用RMSProp优化算法对网络进行训练。
本实施例中,由于每个阶段子网络都有损失函数losss,每个阶段的子网络的损失函数为
losss=(ps-h)2
整个所述检测网络的损失函数为
整个检测网络使用RMSProp优化器进行训练,训练过程所使用的学习率为0.00025,数据的大小为4,训练的epoch为150,计算所述检测网络的损失函数,循环迭代更新网络参数,直到达到设定的训练的epoch的次数,得到网络模型。
步骤24,得到网络模型。
步骤3,基于所述网络模型,对输入的图像进行处理后得到人体骨骼关节点的坐标。
请参阅图7,步骤3通过以下流程实现:
步骤31,对输入的图像进行预处理。
本实施例中,在测试过程中,不需要对数据进行扩增,只需要对图像进行预处理即可。预处理的过程如下:
根据图像中人的中心对图像进行裁剪,使图像中只包含单人且使人在裁剪后的图像中心,将经过裁剪后的图像再进行左右翻转,并将未经翻转的图像和经过翻转的图像共同作为所述网络模型的输入。
步骤32,加载所述网络模型,将经过预处理的图像输入至所述网络模型,得到所述网络模型输出的热力图。
本实施例中,加载步骤2中训练后得到的网络模型,将经过预处理的图像作为网络模型的输入,得到网络模型的输出结果。
步骤33,对所述网络模型输出的热力图进行后处理,得到每个关节点的坐标。
本实施例中,因为网络模型的输入包括经过翻转和未经翻转的两种图像,所以网络模型的输出的热力图也包括这两种图像得到的热力图。后处理主要是将这两种图像得到的两种热力图进行融合。将经过翻转图像的热力图与未经过翻转图像的热力图的格式调整为一致,并将经过调整的热力图和未经过翻转的图像的热力图中每个元素都相加,然后求平均就得到了最终的热力图,最后找出最终热力图中最大值的坐标作为关节点的预测位置,得到人体骨骼关节点的坐标。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (8)
1.一种实时人体骨骼关节点检测方法,其特征在于,包括以下步骤:
步骤1,获取检测数据集;
步骤2,构建检测网络,并对所述检测网络进行训练,得到网络模型;
步骤3,基于所述网络模型,对输入的图像进行处理后得到人体骨骼关节点的坐标。
2.如权利要求1所述的实时人体骨骼关节点检测方法,其特征在于,所述步骤1包括以下步骤:
步骤11,获取检测数据集D,所述检测数据集中样本(X,Y)∈D,其中,X为输入的人体图像,Y为对应的表征人体姿态关节点坐标集合{y1,y2,…,yJ}∈Y,J为关节点个数;
步骤12,对坐标集合Y进行处理,设定热力图hj的宽和高分别为Wh和Hh,其中,{h1,h2,…,hJ}∈h,h为热力图集合,
式中,为关节点的坐标,(a,b)表示热力图中的任意位置,a∈[1,Wh],b∈[1,Hh],通过上式遍历热力图的每个位置生成热力图hj。
3.如权利要求2所述的实时人体骨骼关节点检测方法,其特征在于,所述步骤2包括以下步骤:
步骤21,对输入的图像进行裁剪,并对图像进行扩增处理,根据图像中人体关节点的坐标生成热力图;
步骤22,构建检测网络;
步骤23,使用RMSProp优化算法对网络进行训练;
步骤24,得到网络模型。
4.如权利要求3所述的实时人体骨骼关节点检测方法,其特征在于,所述步骤21中包括以下流程:
步骤211,随机生成一个范围在[0,1]之间的第一随机数P1,若P1大于0.5,则随机生成一个范围在[-40°,40°]之间的随机角度r,r为正数时表示将图像围绕人体中心顺时针旋转对应角度,r为负数表示将图像围绕人体中心逆时针旋转对应角度;
步骤212,随机生成一个范围在[0,1]之间的第二随机数P2,若P2大于0.5,则随机生成一个范围在[0.8,1.2]之间的随机缩放比率,将图像以所述缩放比率进行缩放;
步骤213,设定(vr,vg,vb)∈X,其中(vr,vg,vb)表示图像X中的任意一个位置的像素值,所述像素值经过归一化后范围在[0,1]之间,随机生成一个范围在[0,1]之间的第三随机数P3,若P3大于0.5,则随机生成一个范围在[0.8,1.5]之间的扰动,将所述扰动与所述像素值相乘,并对超出所述像素值范围的进行截断。
5.如权利要求3所述的实时人体骨骼关节点检测方法,其特征在于,所述步骤22中包括以下流程:
所述检测网络分为S阶段,所述检测网络包括特征提取模块、回归网络模块、上下文融合模块及中间上下文学习模块;
所述特征提取模块为Fshare(·),输入为经过扩增处理的图像Xpreprocess,输出为M={m1,m2,…,mS},M=Fshare(Xpreprocess),用于提取输入图像的低层特征并输入至所述回归网络模块;
所述回归网络模块包含每个阶段的子网络,第一阶段的子网络为R1(·),输出为所预测的热力图p1和高层特征q1,q1=R1(m1);
所述上下文融合模块为Bs(·),输入为所述特征提取模块提取的特征ms和所述中间上下文学习模块输出的特征vs-1,该模块中的s=2,..,S,ts=Bs(ms,vs),用于将所述特征提取模块提取的特征ms和所述中间上下文学习模块输出的特征vs-1两个特征进行线性变换,再将变换的特征使用元素间相加进行融合;
第s阶段的所述子网络为Rs(·),输入为所述上下文融合模块的输出ts,输出为所得到的高层特征qs,该模块中的s=2,..,S,qs=Rs(ts);
除了最后一个阶段,每个阶段子网络都包含一个中间上下文学习模块L(·),输入为每个子网络提取的高层特征,输出为特征vs和损失函数的值losss-1,该模块中的s=2,..,S,有vs,ps-1=L(qs-1),所述中间上下文学习模块用于将输入的前一阶段高层特征qs-1使用两个1×1卷积分别进行变换,再对第二个卷积的特征得到预测的热力图,再使用1×1卷积对热力图进行线性变换,将经过变换的热力图和第一个卷积提取的特征使用各个元素相加的方式进行融合,融合后的特征为vs;
最后一个阶段中,所述子网络包含姿态预测学习模块,用于计算最后一个阶段的损失函数值lossS。
6.如权利要求5所述的实时人体骨骼关节点检测方法,其特征在于,所述步骤23中包括以下流程:
每个阶段的子网络的损失函数为losss=(ps-h)2,整个所述检测网络的损失函数为对所述检测网络使用RMSProp优化器进行训练,训练过程所使用的学习率为0.00025,数据的大小为4,训练的epoch为150,计算所述检测网络的损失函数,循环迭代更新网络参数,直到达到设定的训练的epoch的次数,得到网络模型。
7.如权利要求2所述的实时人体骨骼关节点检测方法,其特征在于,所述步骤3中包括以下流程:
步骤31,对输入的图像进行预处理;
步骤32,加载所述网络模型,将经过预处理的图像输入至所述网络模型,得到所述网络模型输出的热力图;
步骤33,对所述网络模型输出的热力图进行后处理,得到每个关节点的坐标。
8.如权利要求7所述的实时人体骨骼关节点检测方法,其特征在于,所述步骤31中对图像进行的预处理包括以下流程:
根据图像中人的中心对图像进行裁剪,使图像中只包含单人且使人在裁剪后的图像中心,将经过裁剪后的图像再进行左右翻转,并将未经翻转的图像和经过翻转的图像共同作为所述网络模型的输入。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810441934.7A CN108647639B (zh) | 2018-05-10 | 2018-05-10 | 实时人体骨骼关节点检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810441934.7A CN108647639B (zh) | 2018-05-10 | 2018-05-10 | 实时人体骨骼关节点检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108647639A true CN108647639A (zh) | 2018-10-12 |
CN108647639B CN108647639B (zh) | 2020-07-28 |
Family
ID=63754066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810441934.7A Active CN108647639B (zh) | 2018-05-10 | 2018-05-10 | 实时人体骨骼关节点检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108647639B (zh) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109255783A (zh) * | 2018-10-19 | 2019-01-22 | 上海摩象网络科技有限公司 | 一种多人图像上的人体骨骼关键点的位置排布检测方法 |
CN109657631A (zh) * | 2018-12-25 | 2019-04-19 | 上海智臻智能网络科技股份有限公司 | 人体姿态识别方法及装置 |
CN109711329A (zh) * | 2018-12-25 | 2019-05-03 | 北京迈格威科技有限公司 | 姿态估计及网络训练方法、装置和系统及存储介质 |
CN109711374A (zh) * | 2018-12-29 | 2019-05-03 | 深圳美图创新科技有限公司 | 人体骨骼点识别方法及装置 |
CN109710802A (zh) * | 2018-12-20 | 2019-05-03 | 百度在线网络技术(北京)有限公司 | 视频分类方法及其装置 |
CN109784149A (zh) * | 2018-12-06 | 2019-05-21 | 北京飞搜科技有限公司 | 一种人体骨骼关键点的检测方法及系统 |
CN109801335A (zh) * | 2019-01-08 | 2019-05-24 | 北京旷视科技有限公司 | 图像处理方法、装置、电子设备和计算机存储介质 |
CN109858333A (zh) * | 2018-12-20 | 2019-06-07 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备及计算机可读介质 |
CN109934111A (zh) * | 2019-02-12 | 2019-06-25 | 清华大学深圳研究生院 | 一种基于关键点的健身姿态估计方法及系统 |
CN110443148A (zh) * | 2019-07-10 | 2019-11-12 | 广州市讯码通讯科技有限公司 | 一种动作识别方法、系统和存储介质 |
CN110443170A (zh) * | 2019-07-24 | 2019-11-12 | 北京奇艺世纪科技有限公司 | 一种人体关键点确定方法、装置及电子设备 |
CN110503063A (zh) * | 2019-08-28 | 2019-11-26 | 东北大学秦皇岛分校 | 基于沙漏卷积自动编码神经网络的跌倒检测方法 |
CN110619316A (zh) * | 2019-09-26 | 2019-12-27 | 联想(北京)有限公司 | 人体关键点检测方法、装置和电子设备 |
CN110929687A (zh) * | 2019-12-10 | 2020-03-27 | 山东大学 | 一种基于关键点检测的多人行为识别系统及工作方法 |
CN110969124A (zh) * | 2019-12-02 | 2020-04-07 | 重庆邮电大学 | 基于轻量级多分支网络的二维人体姿态估计方法及系统 |
CN111178251A (zh) * | 2019-12-27 | 2020-05-19 | 汇纳科技股份有限公司 | 一种行人属性识别方法及系统、存储介质及终端 |
CN111291593A (zh) * | 2018-12-06 | 2020-06-16 | 成都品果科技有限公司 | 一种检测人体姿态的方法 |
CN111428675A (zh) * | 2020-04-02 | 2020-07-17 | 南开大学 | 一种融入行人体态姿态特征的行人重识别方法 |
CN111444896A (zh) * | 2020-05-09 | 2020-07-24 | 北京碧拓科技有限公司 | 一种远红外热成像人体经络关键点定位方法 |
CN111507182A (zh) * | 2020-03-11 | 2020-08-07 | 杭州电子科技大学 | 基于骨骼点融合循环空洞卷积的乱丢垃圾行为检测方法 |
CN111723776A (zh) * | 2020-07-03 | 2020-09-29 | 厦门美图之家科技有限公司 | 人体外轮廓点检测方法、装置、电子设备和可读存储介质 |
CN111914639A (zh) * | 2020-06-30 | 2020-11-10 | 吴�荣 | 轻量级卷积时空简单循环单元模型的驾驶动作识别方法 |
CN111967406A (zh) * | 2020-08-20 | 2020-11-20 | 高新兴科技集团股份有限公司 | 人体关键点检测模型生成方法、系统、设备和存储介质 |
CN113609993A (zh) * | 2021-08-06 | 2021-11-05 | 烟台艾睿光电科技有限公司 | 一种姿态估计方法、装置、设备及计算机可读存储介质 |
CN114022480A (zh) * | 2022-01-06 | 2022-02-08 | 杭州健培科技有限公司 | 基于统计与形状拓扑图的医学图像关键点检测方法和装置 |
CN115620016A (zh) * | 2022-12-13 | 2023-01-17 | 乐歌人体工学科技股份有限公司 | 一种骨架检测模型的构建方法、图像数据识别方法 |
CN118470612A (zh) * | 2024-07-10 | 2024-08-09 | 杭州电子科技大学 | 基于多模态信息融合的安全生产作业人员行为识别方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650827A (zh) * | 2016-12-30 | 2017-05-10 | 南京大学 | 基于结构指导深度学习的人体姿态估计方法和系统 |
CN107392097A (zh) * | 2017-06-15 | 2017-11-24 | 中山大学 | 一种单目彩色视频的三维人体关节点定位方法 |
CN107451568A (zh) * | 2017-08-03 | 2017-12-08 | 重庆邮电大学 | 使用深度卷积神经网络的姿态检测方法及设备 |
-
2018
- 2018-05-10 CN CN201810441934.7A patent/CN108647639B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650827A (zh) * | 2016-12-30 | 2017-05-10 | 南京大学 | 基于结构指导深度学习的人体姿态估计方法和系统 |
CN107392097A (zh) * | 2017-06-15 | 2017-11-24 | 中山大学 | 一种单目彩色视频的三维人体关节点定位方法 |
CN107451568A (zh) * | 2017-08-03 | 2017-12-08 | 重庆邮电大学 | 使用深度卷积神经网络的姿态检测方法及设备 |
Non-Patent Citations (2)
Title |
---|
JONATHAN TOMPSON等: "Efficient Object Localization Using Convolutional Networks", 《2015 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
吴文军: "基于关节点特征融合的人体行为识别", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109255783B (zh) * | 2018-10-19 | 2020-09-25 | 上海摩象网络科技有限公司 | 一种多人图像上的人体骨骼关键点的位置排布检测方法 |
CN109255783A (zh) * | 2018-10-19 | 2019-01-22 | 上海摩象网络科技有限公司 | 一种多人图像上的人体骨骼关键点的位置排布检测方法 |
CN111291593A (zh) * | 2018-12-06 | 2020-06-16 | 成都品果科技有限公司 | 一种检测人体姿态的方法 |
CN111291593B (zh) * | 2018-12-06 | 2023-04-18 | 成都品果科技有限公司 | 一种检测人体姿态的方法 |
CN109784149B (zh) * | 2018-12-06 | 2021-08-20 | 苏州飞搜科技有限公司 | 一种人体骨骼关键点的检测方法及系统 |
CN109784149A (zh) * | 2018-12-06 | 2019-05-21 | 北京飞搜科技有限公司 | 一种人体骨骼关键点的检测方法及系统 |
CN109710802A (zh) * | 2018-12-20 | 2019-05-03 | 百度在线网络技术(北京)有限公司 | 视频分类方法及其装置 |
CN109858333A (zh) * | 2018-12-20 | 2019-06-07 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备及计算机可读介质 |
CN109858333B (zh) * | 2018-12-20 | 2023-01-17 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备及计算机可读介质 |
CN109711329B (zh) * | 2018-12-25 | 2021-02-09 | 北京迈格威科技有限公司 | 姿态估计及网络训练方法、装置和系统及存储介质 |
CN109711329A (zh) * | 2018-12-25 | 2019-05-03 | 北京迈格威科技有限公司 | 姿态估计及网络训练方法、装置和系统及存储介质 |
CN109657631A (zh) * | 2018-12-25 | 2019-04-19 | 上海智臻智能网络科技股份有限公司 | 人体姿态识别方法及装置 |
CN109711374A (zh) * | 2018-12-29 | 2019-05-03 | 深圳美图创新科技有限公司 | 人体骨骼点识别方法及装置 |
CN109711374B (zh) * | 2018-12-29 | 2021-06-04 | 深圳美图创新科技有限公司 | 人体骨骼点识别方法及装置 |
CN109801335A (zh) * | 2019-01-08 | 2019-05-24 | 北京旷视科技有限公司 | 图像处理方法、装置、电子设备和计算机存储介质 |
CN109934111A (zh) * | 2019-02-12 | 2019-06-25 | 清华大学深圳研究生院 | 一种基于关键点的健身姿态估计方法及系统 |
CN109934111B (zh) * | 2019-02-12 | 2020-11-24 | 清华大学深圳研究生院 | 一种基于关键点的健身姿态估计方法及系统 |
CN110443148B (zh) * | 2019-07-10 | 2021-10-22 | 广州市讯码通讯科技有限公司 | 一种动作识别方法、系统和存储介质 |
CN110443148A (zh) * | 2019-07-10 | 2019-11-12 | 广州市讯码通讯科技有限公司 | 一种动作识别方法、系统和存储介质 |
CN110443170B (zh) * | 2019-07-24 | 2022-03-04 | 北京奇艺世纪科技有限公司 | 一种人体关键点确定方法、装置及电子设备 |
CN110443170A (zh) * | 2019-07-24 | 2019-11-12 | 北京奇艺世纪科技有限公司 | 一种人体关键点确定方法、装置及电子设备 |
CN110503063A (zh) * | 2019-08-28 | 2019-11-26 | 东北大学秦皇岛分校 | 基于沙漏卷积自动编码神经网络的跌倒检测方法 |
CN110503063B (zh) * | 2019-08-28 | 2021-12-17 | 东北大学秦皇岛分校 | 基于沙漏卷积自动编码神经网络的跌倒检测方法 |
CN110619316A (zh) * | 2019-09-26 | 2019-12-27 | 联想(北京)有限公司 | 人体关键点检测方法、装置和电子设备 |
CN110969124A (zh) * | 2019-12-02 | 2020-04-07 | 重庆邮电大学 | 基于轻量级多分支网络的二维人体姿态估计方法及系统 |
CN110969124B (zh) * | 2019-12-02 | 2022-09-27 | 重庆邮电大学 | 基于轻量级多分支网络的二维人体姿态估计方法及系统 |
CN110929687B (zh) * | 2019-12-10 | 2023-04-18 | 山东大学 | 一种基于关键点检测的多人行为识别系统及工作方法 |
CN110929687A (zh) * | 2019-12-10 | 2020-03-27 | 山东大学 | 一种基于关键点检测的多人行为识别系统及工作方法 |
CN111178251B (zh) * | 2019-12-27 | 2023-07-28 | 汇纳科技股份有限公司 | 一种行人属性识别方法及系统、存储介质及终端 |
CN111178251A (zh) * | 2019-12-27 | 2020-05-19 | 汇纳科技股份有限公司 | 一种行人属性识别方法及系统、存储介质及终端 |
CN111507182A (zh) * | 2020-03-11 | 2020-08-07 | 杭州电子科技大学 | 基于骨骼点融合循环空洞卷积的乱丢垃圾行为检测方法 |
CN111507182B (zh) * | 2020-03-11 | 2021-03-16 | 杭州电子科技大学 | 基于骨骼点融合循环空洞卷积的乱丢垃圾行为检测方法 |
CN111428675A (zh) * | 2020-04-02 | 2020-07-17 | 南开大学 | 一种融入行人体态姿态特征的行人重识别方法 |
CN111444896B (zh) * | 2020-05-09 | 2023-06-30 | 北京碧拓科技有限公司 | 一种远红外热成像人体经络关键点定位方法 |
CN111444896A (zh) * | 2020-05-09 | 2020-07-24 | 北京碧拓科技有限公司 | 一种远红外热成像人体经络关键点定位方法 |
CN111914639A (zh) * | 2020-06-30 | 2020-11-10 | 吴�荣 | 轻量级卷积时空简单循环单元模型的驾驶动作识别方法 |
CN111723776A (zh) * | 2020-07-03 | 2020-09-29 | 厦门美图之家科技有限公司 | 人体外轮廓点检测方法、装置、电子设备和可读存储介质 |
CN111967406A (zh) * | 2020-08-20 | 2020-11-20 | 高新兴科技集团股份有限公司 | 人体关键点检测模型生成方法、系统、设备和存储介质 |
CN113609993A (zh) * | 2021-08-06 | 2021-11-05 | 烟台艾睿光电科技有限公司 | 一种姿态估计方法、装置、设备及计算机可读存储介质 |
CN113609993B (zh) * | 2021-08-06 | 2024-10-18 | 烟台艾睿光电科技有限公司 | 一种姿态估计方法、装置、设备及计算机可读存储介质 |
CN114022480B (zh) * | 2022-01-06 | 2022-04-22 | 杭州健培科技有限公司 | 基于统计与形状拓扑图的医学图像关键点检测方法和装置 |
CN114022480A (zh) * | 2022-01-06 | 2022-02-08 | 杭州健培科技有限公司 | 基于统计与形状拓扑图的医学图像关键点检测方法和装置 |
CN115620016B (zh) * | 2022-12-13 | 2023-03-28 | 乐歌人体工学科技股份有限公司 | 一种骨架检测模型的构建方法、图像数据识别方法 |
CN115620016A (zh) * | 2022-12-13 | 2023-01-17 | 乐歌人体工学科技股份有限公司 | 一种骨架检测模型的构建方法、图像数据识别方法 |
CN118470612A (zh) * | 2024-07-10 | 2024-08-09 | 杭州电子科技大学 | 基于多模态信息融合的安全生产作业人员行为识别方法及系统 |
CN118470612B (zh) * | 2024-07-10 | 2024-10-18 | 杭州电子科技大学 | 基于多模态信息融合的安全生产作业人员行为识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108647639B (zh) | 2020-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647639A (zh) | 实时人体骨骼关节点检测方法 | |
CN109543606B (zh) | 一种加入注意力机制的人脸识别方法 | |
CN107358257B (zh) | 一种大数据场景下可增量学习的图像分类训练方法 | |
CN106780543B (zh) | 一种基于卷积神经网络的双框架估计深度和运动方法 | |
CN110378844A (zh) | 基于循环多尺度生成对抗网络的图像盲去运动模糊方法 | |
CN109360171A (zh) | 一种基于神经网络的视频图像实时去模糊方法 | |
CN109035149A (zh) | 一种基于深度学习的车牌图像去运动模糊方法 | |
CN109886225A (zh) | 一种基于深度学习的图像手势动作在线检测与识别方法 | |
CN108596108B (zh) | 基于三元组语义关系学习的航拍遥感图像变化检测方法 | |
CN109035260A (zh) | 一种天空区域分割方法、装置和卷积神经网络 | |
CN114429491B (zh) | 一种基于事件相机的脉冲神经网络目标跟踪方法和系统 | |
CN108961245A (zh) | 基于双通道深度并行卷积网络的图像质量分类方法 | |
CN107103613A (zh) | 一种三维手势姿态估计方法 | |
CN110889343A (zh) | 基于注意力型深度神经网络的人群密度估计方法及装置 | |
CN106981080A (zh) | 基于红外图像和雷达数据的夜间无人车场景深度估计方法 | |
CN113205595B (zh) | 一种3d人体姿态估计模型的构建方法及其应用 | |
CN110163836A (zh) | 基于深度学习用于高空巡检下的挖掘机检测方法 | |
CN109086663A (zh) | 基于卷积神经网络的尺度自适应的自然场景文本检测方法 | |
CN110705340B (zh) | 一种基于注意力神经网络场的人群计数方法 | |
CN111062310B (zh) | 一种基于虚拟样本生成的少样本无人机图像识别方法 | |
CN109493300A (zh) | 基于fpga卷积神经网络的航拍图像实时去雾方法及无人机 | |
CN109492618A (zh) | 基于分组扩张卷积神经网络模型的目标检测方法及装置 | |
CN112507904B (zh) | 一种基于多尺度特征的教室人体姿态实时检测方法 | |
CN109766873A (zh) | 一种混合可变形卷积的行人再识别方法 | |
CN107767416A (zh) | 一种低分辨率图像中行人朝向的识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |