CN109583341B - 对包含人像的图像的多人骨骼关键点检测方法及装置 - Google Patents
对包含人像的图像的多人骨骼关键点检测方法及装置 Download PDFInfo
- Publication number
- CN109583341B CN109583341B CN201811376208.8A CN201811376208A CN109583341B CN 109583341 B CN109583341 B CN 109583341B CN 201811376208 A CN201811376208 A CN 201811376208A CN 109583341 B CN109583341 B CN 109583341B
- Authority
- CN
- China
- Prior art keywords
- image
- significance
- detection result
- key point
- key points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000001514 detection method Methods 0.000 claims abstract description 61
- 238000009826 distribution Methods 0.000 claims abstract description 21
- 210000000988 bone and bone Anatomy 0.000 claims abstract description 19
- 238000005520 cutting process Methods 0.000 claims abstract description 13
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明公开了一种对包含人像的图像的多人骨骼关键点检测方法及装置,该方法包括:对原始含人像的RGB图像进行显著性检测,得到图像中各位置的显著性值;根据显著性值对所述RGB图像进行裁剪;对所述裁剪后的图像进行骨骼关键点检测,得到各类关键点位置的分布热图;对所述分布热图根据显著性值进行加权,并根据加权后的分布热图计算出裁剪后图像的骨骼关键点检测结果;最后计算所述原始RGB图像中每个人的骨骼关键点的最终检测结果。本发明的方法和装置能得到高精度的人体骨骼关键点检测结果。
Description
技术领域
本发明涉及计算机视觉与数字图像处理领域,尤其是涉及对包含人像的图像进行多人骨骼关键点检测的方法及装置。
背景技术
对包含人像的图像(如RGB图像)进行人体骨骼关键点检测,是当前计算机视觉领域一个热点研究方向。所检测出的人体骨骼关键点结果可为行为识别、人机交互、电影特效制作等多个领域提供关键信息,具有重要的实用价值。
目前主流的人体骨骼关键点检测方法主要分为两种:单人骨骼关键点检测方法和多人骨骼关键点检测方法。
单人骨骼关键点检测方法,是指首先对包含人像的图像进行物体检测,得到图像中每个人的矩形边框位置,然后对每个边框内的信息进行独立关键点检测,最后进行整合,以获取图像中全部人的骨骼关键点信息。这种方法严重依赖于物体检测的精度,边框位置及大小的微小变化可能对结果精度有较大影响,并且物体检测阶段效率低,难以达到实时性的要求。
多人骨骼关键点检测方法,是指直接在图像中检测出所有可能的人体骨骼关键点,然后利用全局信息对图像中属于同一个人的骨骼关键点进行连接。这种方法可以在不依赖人体边框位置信息的情况下较有效地检测出全部人体骨骼关键点,具有较高的检测速度。
但是,目前常见的多人骨骼关键点检测方法通常是直接利用卷积神经网络对原始RGB图像缩放到固定大小后进行特征提取,对所提取特征进行组合后得到关键点位置分布热图,然后输出检测结果。这一流程没有考虑到图像中人体位置分布情况。当人体面积在图像中占据较小比例时,直接对原始图像缩放到固定大小后进行特征提取和特征组合将难以得到准确结果。
以上背景技术内容的公开仅用于辅助理解本发明的发明构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日前已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
发明内容
本发明的主要目的在于在现有多人骨骼关键点检测方法的基础上,提出一种对包含人像的图像的多人骨骼关键点检测方法及装置,得到高精度的人体骨骼关键点检测结果。
本发明为达上述目的提出以下技术方案:
一种对包含人像的图像的多人骨骼关键点检测方法,包括:对一含人像的原始RGB图像进行图像显著性检测,得到所述原始RGB图像中各位置的显著性值;根据显著性值对所述原始RGB图像进行裁剪,得到裁剪后的图像及裁剪后图像各位置的显著性值;对所述裁剪后的图像进行人体骨骼关键点检测,得到N个关键点位置分布热图;其中,N≥1;对所述分布热图根据所述裁剪后图像各位置的显著性值进行加权,根据加权后的分布热图计算出所述裁剪后图像的骨骼关键点检测结果;计算所述原始RGB图像的骨骼关键点的最终检测结果;最终检测结果包括所述原始RGB图像中的人数及检测到的每个人的骨骼关键点坐标集合。
所述装置包含有计算机程序,用于执行以实现如上方法。
与现有技术相比,本发明的有益效果在于:本发明添加图像显著性信息,以对图像主体部分进行裁剪,并修正关键点位置分布热图。由于本发明将图像显著性信息与现有基于卷积神经网络的多人骨骼关键点检测进行结合,提出的这种新的方法,增加了卷积神经网络所处理信息中主体信息的数量,提高了特征提取和特征组合的效果,有利于得到更高精度的多人骨骼关键点检测结果。
附图说明
图1是本发明实施例的流程示意图;
图2A是本发明实施例的一种原始RGB图像的显示示意图;
图2B是本发明实施例的一种所述原始图像对应显著性图像、对应裁剪框的显示示意图;
图2C是本发明实施例的一种所述原始图像多人骨骼关键点检测结果的显示示意图;
图2D是本发明实施例的一种所述裁剪后图像多人骨骼关键点检测结果的显示示意图。
具体实施方式
下面结合附图和具体的实施方式对本发明作进一步说明。
本发明的具体实施方式提出对包含人像的图像的多人骨骼关键点检测方法,用于在现有基于卷积神经网络的多人骨骼关键点检测方法的基础上增加图像显著性信息,以实现对原始图像的裁剪和关键点分布图的修正,提高检测准确率。
参考图1,该检测方法包括:对含人像的RGB图像(即初始图像,参考图2A;在变通实施例中也可以是其他格式的图像)进行显著性检测,根据显著性值所述初始图像进行裁剪,对裁剪后的图像进行关键点检测并修正关键点分布热图,计算所述初始图像中的骨骼关键点检测结果。其中:
对所述初始图像进行显著性检测包括:采用上下文感知方法进行显著性检测。首先,将所述RGB图像I0(x,y)转化为Lab颜色空间中的图像I1(x,y);其次,将图像I1(x,y)切分成N块,分别表示为p1,p2,…,pN,分别计算N个小块两两之间的差异性(N取整数,N≥4);然后对每个小块pi,取前K个与其差异性最小的块,计算单尺度显著性值(K取整数,N≥K≥1);最后,计算多尺度下显著性平均值,得到所述显著性检测结果S(x,y)。
RGB颜色空间是最通用的显示系统,它使用R、G、B三个分量分别表示红、绿、蓝三种颜色在图像中的强度。Lab颜色空间与RGB颜色空间不同,它采用L、a、b三个分量分别表示图像中的像素亮度、红绿范围、黄蓝范围,更接近人的视觉感应。RGB颜色空间中的图像需要首先转换到XYZ空间
再将XYZ空间中的像素值转化为Lab颜色空间中的像素值
其中,
根据上述公式#(1)#(2)#(3)即可得到所述原始图像I0(x,y)在Lab颜色空间中的图像I1(x,y)。
对上述得到的图像I1(x,y)首先在水平方向上和竖直方向上每M个像素进行切分(令Lmin表示图像I1(x,y)的短边长度,M取整数,Lmin/2≥M≥2),得到p1,p2,…,pN共N个小块。分别计算每个小块两两之间在Lab空间中的欧几里得颜色距离dcolor(pi,pj)和空间距离dposition(pi,pj),得到每个小块两两之间的差异性
本实施例中选取前60个差异性最小的图像块对每个小块pi内所有位置进行显著性度量,采用如下公式
根据上述公式#(4)#(5)可以得到对图像I1(x,y)每M个像素进行切分后,I1(x,y)中所有位置的单尺度显著性值SM(x,y)。
为进一步提高显著区域与非显著区域的对比度,对图像I1(x,y)在M取不同值的情况下,分别计算单尺度显著性值SM(x,y)。然后计算不同尺度下显著性值的平均值,作为所述最终显著性检测结果S(x,y)。例如取M分别为10、20、30,则
根据显著性值对所述初始图像进行裁剪包括:参考图2B,从显著性检测结果S(x,y)中提取出显著性阈值w大于0.5的所有坐标集合J,J=[(x1,y1)(x2,y2)…(xn,yn)]。分别确定其中横纵坐标的最大值和最小值,即
确定矩形裁剪框的左上角坐标为(xmin,ymin),右下角坐标为(xmax,ymax),在所述原始图像I0(x,y)上进行裁剪,得到裁剪后的图像I2(x,y)。并取得所述最终显著性检测结果S(x,y)在所述裁剪后图像I2(x,y)中对应的裁剪后显著性检测结果S2(x,y)。
对裁剪后的图像进行关键点检测并修正关键点分布热图包括:将所述裁剪后的图像I2(x,y)输入现有卡内基梅隆大学开发的多人骨架关键点检测框架OpenPose中,输出检测出18类骨骼关键点分布热图H1,H2,H3,…,H18。Hi图像大小与所述裁剪后显著性检测结果图像S2(x,y)大小相同,其中不同的坐标值(x,y)∈Hi表示该位置检测出骨骼关键点i的概率。将S2(x,y)中显著性值与18类骨骼关键点分布热图H1,H2,H3,…,H18中的对应位置相乘,得到修正后的关键点分布热图H′1,H′2,H′3,…,H′18。
计算所述初始图像中的骨骼关键点检测结果包括:将所述修正后的关键点分布热图H′1,H′2,H′3,…,H′18再次输入OpenPose框架中,计算检测结果,如图2D所示。检测结果包括检测到的所述裁剪后的图像I2(x,y)中含有的人数O以及O个人的骨骼关键点坐标集合JH=(J1,J2,…,JO),集合JH中的元素Ji表示第i个人的骨骼关键点坐标集合,k=18,表示第i个人的第j个骨骼关键点的坐标。将集合JH中所有横坐标加上矩形裁剪框左上角横坐标xmin,所有纵坐标加上矩形裁剪框左上角纵坐标ymin,得到所述初始图像中的骨骼关键点检测结果J′H。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。
Claims (9)
1.一种对包含人像的图像的多人骨骼关键点检测方法,其特征在于包括如下步骤:
S1、对一含人像的原始RGB图像进行图像显著性检测,得到所述原始RGB图像中各位置的显著性值;
S2、根据显著性值对所述原始RGB图像进行裁剪,得到裁剪后的图像及裁剪后图像各位置的显著性值;
S3、对所述裁剪后的图像进行人体骨骼关键点检测,得到N个关键点位置分布热图;其中,N≥1;
S4、对所述分布热图根据所述裁剪后图像各位置的显著性值进行加权,根据加权后的分布热图计算出所述裁剪后的图像的骨骼关键点检测结果;
S5、计算所述原始RGB图像的骨骼关键点的最终检测结果;最终检测结果包括所述原始RGB图像中的人数及检测到的每个人的骨骼关键点坐标集合;
步骤S3具体包括:将所述裁剪后的图像I2(x,y)输入多人骨架关键点检测框架OpenPose中,输出检测出18类骨骼关键点分布热图H1,H2,H3,…,H18;Hi图像大小与所述裁剪后的图像的显著性检测结果图像S2(x,y)大小相同,其中不同的坐标值(x,y)∈Hi表示该位置检测出骨骼关键点i的概率;
步骤S4具体包括:将S2(x,y)中显著性值与18类骨骼关键点分布热图H1,H2,H3,…,H18中的对应位置相乘,得到修正后的关键点分布热图H′1,H′2,H′3,…,H′18。
4.如权利要求2所述的对包含人像的图像的多人骨骼关键点检测方法,其特征在于,步骤S22具体包括:对所述图像I1(x,y)首先在水平方向上和竖直方向上每M个像素进行切分,其中令Lmin表示图像I1(x,y)的短边长度,M取整数,Lmin/2≥M≥2,得到p1,p2,…,pN共N个小块,分别计算每个小块两两之间在Lab空间中的欧几里得颜色距离dcolor(pi,pj)和空间距离dposition(pi,pj),得到每个小块两两之间的差异性
步骤S23具体包括:选取前一定个数的差异性最小的图像块对每个小块pi内所有位置进行显著性度量,采用如下公式
根据上述公式#(4)、#(5)可以得到对图像I1(x,y)每M个像素进行切分后,I1(x,y)中所有位置的单尺度显著性值SM(x,y)。
5.如权利要求4所述的对包含人像的图像的多人骨骼关键点检测方法,其特征在于,还包括:对图像I1(x,y)在M取不同值的情况下,分别计算单尺度显著性值SM(x,y);然后计算不同尺度下显著性值的平均值,作为最终显著性检测结果S(x,y);所述根据显著性值对原始RGB图像进行裁剪包括:从显著性检测结果S(x,y)中提取出显著性阈值w大于0.5的所有坐标集合J,J=[(x1,y1)(x2,y2)…(xn,yn)],分别确定其中横纵坐标的最大值和最小值,即
确定矩形裁剪框的左上角坐标为(xmin,ymin),右下角坐标为(xmax,ymax),在所述原始RGB图像I0(x,y)上进行裁剪,得到裁剪后的图像I2(x,y)。
6.如权利要求5所述的对包含人像的图像的多人骨骼关键点检测方法,其特征在于,取得所述最终显著性检测结果S(x,y)在所述裁剪后的图像I2(x,y)中对应的裁剪后显著性检测结果S2(x,y)。
8.一种对包含人像的图像的多人骨骼关键点检测装置,其特征在于,采用如权利要求1-7中所述的方法。
9.一种计算机存储介质,其特征在于,存储有计算机程序,所述计算机程序可以被计算机执行以实现如权利要求1-7所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811376208.8A CN109583341B (zh) | 2018-11-19 | 2018-11-19 | 对包含人像的图像的多人骨骼关键点检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811376208.8A CN109583341B (zh) | 2018-11-19 | 2018-11-19 | 对包含人像的图像的多人骨骼关键点检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109583341A CN109583341A (zh) | 2019-04-05 |
CN109583341B true CN109583341B (zh) | 2021-02-05 |
Family
ID=65923202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811376208.8A Active CN109583341B (zh) | 2018-11-19 | 2018-11-19 | 对包含人像的图像的多人骨骼关键点检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109583341B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110400316A (zh) * | 2019-04-19 | 2019-11-01 | 杭州健培科技有限公司 | 一种基于深度学习的骨科影像测量方法及装置 |
CN111294518B (zh) * | 2020-03-09 | 2021-04-27 | Oppo广东移动通信有限公司 | 人像构图肢体截断检测方法、装置、终端及存储介质 |
CN111914698B (zh) * | 2020-07-16 | 2023-06-27 | 北京紫光展锐通信技术有限公司 | 图像中人体的分割方法、分割系统、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104834933A (zh) * | 2014-02-10 | 2015-08-12 | 华为技术有限公司 | 一种图像显著性区域的检测方法和装置 |
CN104850836A (zh) * | 2015-05-15 | 2015-08-19 | 浙江大学 | 基于深度卷积神经网络的害虫图像自动识别方法 |
WO2017214414A1 (en) * | 2016-06-09 | 2017-12-14 | The Penn State Research Foundation | Systems and methods for detection of significant and attractive components in digital images |
CN108510491A (zh) * | 2018-04-04 | 2018-09-07 | 深圳市未来媒体技术研究院 | 虚化背景下人体骨骼关键点检测结果的过滤方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105550678B (zh) * | 2016-02-03 | 2019-01-18 | 武汉大学 | 基于全局显著边缘区域的人体动作特征提取方法 |
CN106778634B (zh) * | 2016-12-19 | 2020-07-14 | 江苏慧眼数据科技股份有限公司 | 一种基于区域融合的显著性人体区域检测方法 |
CN107767419A (zh) * | 2017-11-07 | 2018-03-06 | 广州深域信息科技有限公司 | 一种人体骨骼关键点检测方法及装置 |
CN107886069A (zh) * | 2017-11-10 | 2018-04-06 | 东北大学 | 一种多目标人体2d姿态实时检测系统及检测方法 |
-
2018
- 2018-11-19 CN CN201811376208.8A patent/CN109583341B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104834933A (zh) * | 2014-02-10 | 2015-08-12 | 华为技术有限公司 | 一种图像显著性区域的检测方法和装置 |
CN104850836A (zh) * | 2015-05-15 | 2015-08-19 | 浙江大学 | 基于深度卷积神经网络的害虫图像自动识别方法 |
WO2017214414A1 (en) * | 2016-06-09 | 2017-12-14 | The Penn State Research Foundation | Systems and methods for detection of significant and attractive components in digital images |
CN108510491A (zh) * | 2018-04-04 | 2018-09-07 | 深圳市未来媒体技术研究院 | 虚化背景下人体骨骼关键点检测结果的过滤方法 |
Non-Patent Citations (1)
Title |
---|
基于区域的图像分割及视觉显著性检测算法研究;肖小龙;《中国优秀硕士学位论文全文数据库 信息科技辑》;20140615(第6期);第33-36页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109583341A (zh) | 2019-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304820B (zh) | 一种人脸检测方法、装置及终端设备 | |
CN109583483B (zh) | 一种基于卷积神经网络的目标检测方法和系统 | |
EP3101594A1 (en) | Saliency information acquisition device and saliency information acquisition method | |
CN109903331B (zh) | 一种基于rgb-d相机的卷积神经网络目标检测方法 | |
CN107103277B (zh) | 一种基于深度相机和3d卷积神经网络的步态识别方法 | |
CN108446694B (zh) | 一种目标检测方法及装置 | |
CN109583341B (zh) | 对包含人像的图像的多人骨骼关键点检测方法及装置 | |
CN109034017A (zh) | 头部姿态估计方法及机器可读存储介质 | |
CN103914699A (zh) | 一种基于色彩空间的自动唇彩的图像增强的方法 | |
CN111612024B (zh) | 特征提取方法、装置、电子设备及计算机可读存储介质 | |
CN110827312B (zh) | 一种基于协同视觉注意力神经网络的学习方法 | |
CN107122787A (zh) | 一种基于特征融合的图像缩放质量评价方法 | |
CN111640116B (zh) | 基于深层卷积残差网络的航拍图建筑物分割方法及装置 | |
CN107944437B (zh) | 一种基于神经网络和积分图像的人脸定位方法 | |
CN113592839B (zh) | 基于改进Faster RCNN的配网线路典型缺陷诊断方法及系统 | |
CN107392211B (zh) | 基于视觉稀疏认知的显著目标检测方法 | |
CN111582278B (zh) | 人像分割方法、装置及电子设备 | |
CN116229235A (zh) | 一种基于热成像的人体姿态估计网络模型及估计方法 | |
CN115222652A (zh) | 一种成捆钢筋端面的识别计数及中心定位方法与其存储器 | |
CN114693951A (zh) | 一种基于全局上下文信息探索的rgb-d显著性目标检测方法 | |
CN111950586A (zh) | 一种引入双向注意力的目标检测方法 | |
JP2004258752A (ja) | 画像分割方法および装置 | |
JP2016040731A (ja) | 画像検索装置、画像検索方法及びプログラム | |
CN109993690A (zh) | 一种基于结构相似性的彩色图像高精度灰度化方法 | |
JP5836728B2 (ja) | 画像検索装置、画像検索方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |