CN110969105A - 一种人体姿态估计方法 - Google Patents

一种人体姿态估计方法 Download PDF

Info

Publication number
CN110969105A
CN110969105A CN201911159199.1A CN201911159199A CN110969105A CN 110969105 A CN110969105 A CN 110969105A CN 201911159199 A CN201911159199 A CN 201911159199A CN 110969105 A CN110969105 A CN 110969105A
Authority
CN
China
Prior art keywords
human body
image
graph
network
distribution heat
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911159199.1A
Other languages
English (en)
Other versions
CN110969105B (zh
Inventor
王好谦
高艺华
张永兵
杨芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen International Graduate School of Tsinghua University
Original Assignee
Shenzhen International Graduate School of Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen International Graduate School of Tsinghua University filed Critical Shenzhen International Graduate School of Tsinghua University
Priority to CN201911159199.1A priority Critical patent/CN110969105B/zh
Publication of CN110969105A publication Critical patent/CN110969105A/zh
Application granted granted Critical
Publication of CN110969105B publication Critical patent/CN110969105B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种人体姿态估计方法,包括:采用人体检测网络从原始图形中获取单人图像,原始图形中包括至少一个单人图像;采用人体姿态估计网络对每个单人图像进行关键点检测,得到各个关键点的位置的分布热图;获取每个单人图像的边框与原始图形中其他单人图像的边框的重叠程度,判断单人图像是否存在遮挡问题;若单人图像不存在遮挡问题,则由分布热图得到单人图像中关键点的最终坐标;若单人图像存在遮挡问题则将单人图像中全部分布热图构成图的形式,并通过图神经网络对每个分布热图进行优化,然后由优化后的分布热图得到单人图像中关键点的最终坐标。用图神经网络充分提取图的整体结构信息,以实现对关键点位置的校正效果,提高检测准确率。

Description

一种人体姿态估计方法
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种人体姿态估计方法。
背景技术
对包含人像的二维图像进行人体关键点检测从而进行人体姿态估计,是计算 机视觉领域一个非常有价值的研究方向。人体关键点有许多用途,特别是在视频 方面,其检测结果可进一步服务于人机交互、行人追踪、行为识别等多个领域, 已经应用于许多产品。
目前主流的人体关键点检测方法主要分为两种:自顶向下的人体姿态估计方 法和自底向上的人体姿态估计方法。
自顶向下的人体姿态估计方法,指的是采用人体检测网络从包含一个或多个 人的原始图像中得到单人图像,然后采用单人姿态估计的检测方法得到单人关键 点的分布热图,最后由分布热图计算出单人关键点的最终坐标,并将结果返回原 始图像。检测到的单人矩形边框的准确性对单人关键点检测的结果影响较大,且 速度与图像中人体个数相关。这种方法的优点是准确性较高,缺点是实时性较差。
自底向上的人体姿态估计方法,指的是在原始含多人的图像中直接检测出所 有人的各类人体关键点,然后结合全局信息选用对应的匹配方法将其中属于同一 个人的关键点相连接。关键点的检测速度不受图像中人物数量的影响,匹配过程 挑战较大。这种方法的优点是检测速度较快,缺点是精度较低。
当一张图像中有多人时通常会出现遮挡情况,而对于有遮挡的情况,自顶向 下的检测方法更容易出错。主要错误体现为易检测到他人的关键点,或由于遮挡 关键点位置出现较大偏差,而且这种错误在后续步骤中无法被修正。因此对于有 遮挡的人体,在原有的“人体检测——单人姿态估计”的两步检测的基础上加入一 个关键点位置校正模块,是十分有效且必要的。当前的关键点校正方法仍多采用 常规的卷积神经网络,对所有检测结果进行统一修正,对检测准确度有一定提升, 但缺乏对困难样本的选择性,也未充分利用人体的结构信息。
以上背景技术内容的公开仅用于辅助理解本发明的发明构思及技术方案,其 并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利 申请的申请日前已经公开的情况下,上述背景技术不应当用于评价本申请的新颖 性和创造性。
发明内容
本发明为了解决现有的问题,提供一种人体姿态估计方法。
为了解决上述问题,本发明采用的技术方案如下所述:
一种人体姿态估计方法,包括如下步骤:S1:采用人体检测网络从原始图形 中获取单人图像,所述原始图形中包括至少一个单人图像;S2:采用人体姿态 估计网络对每个所述单人图像进行关键点检测,得到各个所述关键点的位置的分 布热图;S3:获取每个所述单人图像的边框与所述原始图形中其他所述单人图像 的边框的重叠程度,判断所述单人图像是否存在遮挡问题;S4:若所述单人图像 不存在遮挡问题,则由所述分布热图得到所述单人图像中关键点的最终坐标;若 所述单人图像存在遮挡问题则将所述单人图像中全部所述分布热图构成图的形 式,并通过图神经网络对每个所述分布热图进行优化,然后由优化后的所述分布 热图得到所述单人图像中关键点的最终坐标。
优选地,所述重叠程度包括获取所述单人图像的边框与所述原始图形中其他 所述单人图像的边框的交并比,具体如下:
Figure BDA0002285607040000021
其中,IoU表示交并比。
优选地,所述单人图像的边框与所述原始图形中其他所述单人图像的边框的 交并比中至少一个大于0.6,则判断所述单人图像存在遮挡问题。
优选地,所述单人图像中全部所述关键点构成的所述图包括节点和边,表示 为G={K,E},其中,K为节点的集合,对于任意k∈K,节点k表示为每所述单 人图像中的关键点,总数为N,其特征属性hk表示为所述节点对应的分布热图, 是一个大小固定的二维数组;E是边的集合,由各个所述节点的连接关系决定。 优选地,在没有方向和权重的条件下,所述E由一个对称的二维矩阵A表示,称 为邻接矩阵,大小为N×N,D为顶点的度矩阵,对角线上的元素依次为各个顶 点的度:Dii=∑jAij;将所述图G的Laplacian矩阵表示为:
Figure BDA0002285607040000031
其中,Λ为矩阵的特征值对角矩阵,U为特征值 对应的特征列向量组成的矩阵,将节点的特征集合h在所述图G={K,E}中的傅 里叶变换定义为:
Figure BDA0002285607040000032
傅里叶逆变换定义为:
Figure BDA0002285607040000033
若将卷积核定义 为由参数θ构造的对角矩阵gθ=diag(θ),那么gθ(Λ)=UTgθ为卷积核的傅里叶 变换,则对特征h进行一次卷积运算表示为:
(gθ*h)G=U((UTgθ)⊙(UTh))=Ugθ(Λ)UTh
定义
Figure BDA0002285607040000035
所示的频域卷积核,并简化式如上的卷积运 算:
Figure BDA0002285607040000036
其中,
Figure BDA0002285607040000037
Figure BDA0002285607040000038
T0(x)=1
T1(x)=x
θ=θ0=-θ1
其中,卷积核的定义用到了以递归形式定义的切比雪夫多项式,阶数选择为 1,将感受野约束为一阶近邻;
结合上式,每一层的迭代过程记为:
Figure BDA0002285607040000039
Figure BDA0002285607040000041
Figure BDA0002285607040000042
其中,Θ为本层的卷积核参数,其维度由本次迭代前后特征的维度决定,σ为 激活函数。
优选地,所述激活函数为ReLU。
优选地,所述人体检测网络采用YOLOv3或Mask RCNN。
优选地,所述人体姿态估计网络在网络训练阶段选用的数据集是COCO数 据集或MPII数据集。
优选地,所述人体姿态估计网络是ResNet或Hourglass网络。
本发明再提供一种计算机可读存储介质,所述计算机可读存储介质存储有计 算机程序,所述计算机程序被处理器执行时实现如上任一所述方法的步骤。
本发明的有益效果为:提供一种人体姿态估计方法,通过单人姿态估计流程 得到单人关键点的检测结果,然后评估单人图像边框的重叠程度,将存在遮挡问 题的单人图片构成图的形式,用图神经网络充分提取图的整体结构信息,以实现 对关键点位置的校正效果,提高检测准确率。
更进一步的,本发明充分利用了人体骨骼动作的结构特征,能够达到校正遮 挡情况下关键点位置误差的目的。
具有很强的灵活性,具有校正作用的网络模块可与不同的人体姿态估计网络 相结合,均可提升原网络结果的准确性。
附图说明
图1是本发明实施例中一种人体姿态估计方法的示意图。
图2是本发明实施例中人体姿态估计网络得到的关键点的位置的分布热图 的示意图。
图3是本发明实施例中人体关键点构成的图形式示意图。
图4(a)是本发明实施例中现有技术的方法人体姿态估计的示意图。
图4(b)是本发明实施例中采用本发明的方法的人体姿态估计示意图。
具体实施方式
为了使本发明实施例所要解决的技术问题、技术方案及有益效果更加清楚明 白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所 描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
需要说明的是,当元件被称为“固定于”或“设置于”另一个元件,它可以直 接在另一个元件上或者间接在该另一个元件上。当一个元件被称为是“连接于” 另一个元件,它可以是直接连接到另一个元件或间接连接至该另一个元件上。另 外,连接既可以是用于固定作用也可以是用于电路连通作用。
需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、 “竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所 示的方位或位置关系,仅是为了便于描述本发明实施例和简化描述,而不是指示 或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此 不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相 对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二” 的特征可以明示或者隐含地包括一个或者更多该特征。在本发明实施例的描述 中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
实施例1
人体各关节点之间有非常密切的联系,各关节点间的距离和相对方位都有规 律可循,人体的常见姿态也为关键点的检测提供了大量的信息,因此人体关节点 间的结构关系应当被充分利用。而在传统的姿态估计方法中,关键点的检测更多 依赖于局部的纹理及形状等特征信息,在卷积神经网络提取特征的过程中没有充 分地利用关键点之间的相对位置关系以及整体动作的结构连贯性。针对检测中可 能会出现关键点缺失、对称关键点干扰,他人关键点干扰、关键点位置偏差过大 等问题,人体骨架的结构信息会提供非常有效的指导作用。因此,对关键点的检 测结果加入全局结构信息进行修正是一个行之有效的提升检测准确性的方法。
人体骨架是一种典型的图(Graph)的形式,由关节点及关节点之间的连接 关系构成。对于这种非规则的数据结构,图神经网络(Graph Neural Network) 是一种有效的大数据处理方式。图神经网络是将深度学习的方法应用于非规则数 据构建得到的网络结构,在知识图谱、社交网络、计算机视觉等方向均有广泛的 实践应用。人体姿态估计中,关键点的数目及连接关系是固定不变的,对于结构 不变的小型图,谱图卷积神经网络是一种高效的处理方法。
如图1所示,本发明提供一种人体姿态估计方法,包括如下步骤:
S1:采用人体检测网络从原始图形中获取单人图像,所述原始图形中包括至 少一个单人图像;
S2:采用人体姿态估计网络对每个所述单人图像进行关键点检测,得到各个 所述关键点的位置的分布热图;
S3:获取每个所述单人图像的边框与所述原始图形中其他所述单人图像的边 框的重叠程度,判断所述单人图像是否存在遮挡问题;
S4:若所述单人图像不存在遮挡问题,则由所述分布热图得到所述单人图像 中关键点的最终坐标;
若所述单人图像存在遮挡问题则将所述单人图像中全部所述分布热图构成 图的形式,并通过图神经网络对每个所述分布热图进行优化,然后由优化后的所 述分布热图得到所述单人图像中关键点的最终坐标。
在网络的训练阶段,可直接使用数据集标注图形中的单人位置信息,提取单 人图像;在网络测试阶段及实际应用中,采用现有的检测网络从包含人像的原始 图像中得到一个或多个单人图像,人体检测网络可采用YOLOv3或Mask RCNN 等性能较好的网络;对每个单人图像应用单人姿态估计的检测方法,得到各个关 键点位置的分布热图,关键点数量N是一个确定值,与训练阶段选用的数据集 有关,如在COCO数据集下,N=17,在MPII数据集下,N=14,单人姿态估计 网络可根据需求选用ResNet、Hourglass等网络及其变体。
如图2所示,人体姿态估计网络得到的关键点的位置的分布热图的示意图。
在本发明的一种实施例中,重叠程度包括获取单人图像的边框与原始图形中 其他单人图像的边框的交并比,具体如下:
Figure BDA0002285607040000061
其中,IoU表示交并比,用于表示单人图像的边框的重叠程度。
若两个单人图像的边框的IoU较大,那么可以认为这两个单人图像的人体部 分有重叠,即存在人物遮挡情况。计算每一个单人图像的边框与所在原始图像中 所有其他单人边框的IoU,若出现一个或多个IoU>0.6(该阈值为经验值,可根 据实验结果调整)的情况,则可认为此单人图像存在遮挡问题。对于有遮挡的单 人图像,需要进一步用图神经网络的方式对关键点的位置进行校正;无遮挡图像 则不需要进行校正环节。
用人体检测网络和人体姿态估计网络得到单人图像各个关键点位置的分布 热图共N张,分别表示N个关键点的位置概率分布图像,以分布热图形式表示。
图(Graph)由节点和边构成,可以表示为G={K,E}。其中K为节点的集 合,对于任意k∈K,都有一组隐藏的特征属性hk,该特征随着网络的迭代进行 更新,第t次迭代后的节点k的特征属性表示为
Figure BDA0002285607040000071
节点总数为N。E是图G中 边的集合,在没有方向和权重的条件下,E可由一个对称的二维矩阵A表示,称 为邻接矩阵,大小为N×N。若两节点之间有连接关系,则对应位置的元素为1, 否则为0。在由人体关键点构成的图中,节点k表示为每个人的关键点,总数为 N,其特征属性hk表示为该节点对应的分布热图,是一个大小固定的二维数组,E由各关节点的连接关系决定。
如图3所示,人体关键点构成的图形式示意图,节点的特征属性未显示。
参考卷积的概念,可以通过特殊的卷积操作将空域中的图G的结构信息及其 包含的节点特征信息hk转换到频域中,通过在频域中的信息融合完成节点特征信 息的更新,而后经逆变换返回空域,从而实现了全局信息对每个节点的特征更新。 通过卷积核形式的设计,可以实现卷积神经网络的局部连接、权值共享等优势, 而多层网络的叠加可以实现感受野的逐步扩大。具体实现方式如下:
在包含N个关键点的单人姿态估计任务中,图G={K,E}的节点个数固定为 N,节点间的连接关系为固定的人体骨骼结构,因此邻接矩阵A可表示为一个 确定的对称矩阵,大小为N×N。D为顶点的度矩阵,对角线上的元素依次为各 个顶点的度
Dii=∑jAij (1)
在此基础上可将图G的Laplacian矩阵表示为
Figure BDA0002285607040000072
这是一个半正定对称矩阵,其中Λ为矩阵的特征值对角矩阵,U为特征值对 应的特征列向量组成的矩阵。
参考传统傅里叶变换的形式,将节点的特征集合h在图G={K,E}中的傅里 叶变换定义为
Figure BDA0002285607040000081
傅里叶逆变换定义为
Figure BDA0002285607040000082
若将卷积核定义为由参数θ构造的对角矩阵gθ=diag(θ),那么 gθ(Λ)=UTgθ为卷积核的傅里叶变换,则对特征h进行一次卷积运算可表示为 (gθ*h)G=U((UTgθ)⊙(UTh))=Ugθ(Λ)UTh (5)
考虑运算复杂度、感受野范围等因素,可以定义式(6)所示的频域卷积核, 并简化式(5)的卷积运算:
Figure BDA0002285607040000084
Figure BDA0002285607040000085
其中,
Figure BDA0002285607040000086
这里卷积核的定义用到了以递归形式定义的切比雪夫多项式,阶数选择为 1,是为了将感受野约束为一阶近邻。
结合上式,每一层的迭代过程可写作:
Figure BDA0002285607040000091
Figure BDA0002285607040000092
其中,Θ为本层的卷积核参数,其维度由本次迭代前后特征的维度决定,σ为 激活函数,通常采用ReLU等。
由于在关键点优化的任务中,构成的图体量较小(节点数小于20),因此 网络并不要求大的深度。网络的宽度可根据训练使用的数据集的大小来适当调 整,以避免出现欠拟合或过拟合的情况。叠加多次式(9)所示的特征提取运算, 便构成了一个完整的图卷积神经网络,输出的特征维度与初始输入相同,为表示 关键点位置的分布热图。经过图卷积网络模块的修正,可以结合整体结构信息优 化关键点位置,从而实现了检测准确性的提高。
如图4(a)和图4(b),分别是采用现有技术的人体姿态估计方法得到的人体姿 态和采用本发明的方法得到的人体姿态估计,对有遮挡的单人图像做进一步校正 处理,从而提高遮挡情况下关键点检测结果的准确率。
本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来 指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中, 该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所 述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对 象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能 够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁 碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取 存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发 介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内 立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专 利实践,计算机可读介质不包括电载波信号和电信信号。
以上内容是结合具体的优选实施方式对本发明所做的进一步详细说明,不能 认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员 来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而 且性能或用途相同,都应当视为属于本发明的保护范围。

Claims (10)

1.一种人体姿态估计方法,其特征在于,包括如下步骤:
S1:采用人体检测网络从原始图形中获取单人图像,所述原始图形中包括至少一个单人图像;
S2:采用人体姿态估计网络对每个所述单人图像进行关键点检测,得到各个所述关键点的位置的分布热图;
S3:获取每个所述单人图像的边框与所述原始图形中其他所述单人图像的边框的重叠程度,判断所述单人图像是否存在遮挡问题;
S4:若所述单人图像不存在遮挡问题,则由所述分布热图得到所述单人图像中关键点的最终坐标;
若所述单人图像存在遮挡问题则将所述单人图像中全部所述分布热图构成图的形式,并通过图神经网络对每个所述分布热图进行优化,然后由优化后的所述分布热图得到所述单人图像中关键点的最终坐标。
2.如权利要求1所述的人体姿态估计方法,其特征在于,所述重叠程度包括获取所述单人图像的边框与所述原始图形中其他所述单人图像的边框的交并比,具体如下:
Figure FDA0002285607030000011
其中,IoU表示交并比。
3.如权利要求2所述的人体姿态估计方法,其特征在于,所述单人图像的边框与所述原始图形中其他所述单人图像的边框的交并比中至少一个大于0.6,则判断所述单人图像存在遮挡问题。
4.如权利要求1所述的人体姿态估计方法,其特征在于,所述单人图像中全部所述关键点构成的所述图包括节点和边,表示为G={K,E},其中,K为节点的集合,对于任意k∈K,节点k表示为每所述单人图像中的关键点,总数为N,其特征属性hk表示为所述节点对应的分布热图,是一个大小固定的二维数组;E是边的集合,由各个所述节点的连接关系决定。
5.如权利要求4所述的人体姿态估计方法,其特征在于,在没有方向和权重的条件下,所述E由一个对称的二维矩阵A表示,称为邻接矩阵,大小为N×N,D为顶点的度矩阵,对角线上的元素依次为各个顶点的度
Dii=∑jAij
将所述图G的Laplacian矩阵表示为
Figure RE-FDA0002378354380000021
其中,Λ为矩阵的特征值对角矩阵,U为特征值对应的特征列向量组成的矩阵;
将节点的特征集合h在所述图G={K,E}中的傅里叶变换定义为:
Figure RE-FDA0002378354380000022
傅里叶逆变换定义为
Figure RE-FDA0002378354380000023
若将卷积核定义为由参数θ构造的对角矩阵gθ=diag(θ),那么gθ(Λ)=UTgθ为卷积核的傅里叶变换,则对特征h进行一次卷积运算表示为
(gθ*h)G=U((UTgθ)⊙(UTh))=Ugθ(Λ)UTh
定义
Figure RE-FDA0002378354380000024
所示的频域卷积核,并简化式如上的卷积运算:
Figure RE-FDA0002378354380000025
其中,
Figure RE-FDA0002378354380000031
Figure RE-FDA0002378354380000032
T0(x)=1
T1(x)=x
θ=θ0=-θ1
其中,卷积核的定义用到了以递归形式定义的切比雪夫多项式,阶数选择为1,将感受野约束为一阶近邻;
结合上式,每一层的迭代过程记为:
Figure RE-FDA0002378354380000033
Figure RE-FDA0002378354380000034
Figure RE-FDA0002378354380000035
其中,Θ为本层的卷积核参数,其维度由本次迭代前后特征的维度决定,σ为激活函数。
6.如权利要求5所述的人体姿态估计方法,其特征在于,所述激活函数为ReLU。
7.如权利要求1-6任一所述的人体姿态估计方法,其特征在于,所述人体检测网络采用YOLOv3或Mask RCNN。
8.如权利要求1-6任一所述的人体姿态估计方法,其特征在于,所述人体姿态估计网络在网络训练阶段选用的数据集是COCO数据集或MPII数据集。
9.如权利要求1-6任一所述的人体姿态估计方法,其特征在于,所述人体姿态估计网络是ResNet或Hourglass网络。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-9任一所述方法的步骤。
CN201911159199.1A 2019-11-22 2019-11-22 一种人体姿态估计方法 Active CN110969105B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911159199.1A CN110969105B (zh) 2019-11-22 2019-11-22 一种人体姿态估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911159199.1A CN110969105B (zh) 2019-11-22 2019-11-22 一种人体姿态估计方法

Publications (2)

Publication Number Publication Date
CN110969105A true CN110969105A (zh) 2020-04-07
CN110969105B CN110969105B (zh) 2023-07-14

Family

ID=70031320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911159199.1A Active CN110969105B (zh) 2019-11-22 2019-11-22 一种人体姿态估计方法

Country Status (1)

Country Link
CN (1) CN110969105B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626105A (zh) * 2020-04-15 2020-09-04 南京旷云科技有限公司 姿态估计方法、装置及电子设备
CN112418263A (zh) * 2020-10-10 2021-02-26 上海鹰瞳医疗科技有限公司 一种医学图像病灶分割标注方法及系统
CN113095254A (zh) * 2021-04-20 2021-07-09 清华大学深圳国际研究生院 一种人体部位关键点的定位方法及系统
CN113221626A (zh) * 2021-03-04 2021-08-06 北京联合大学 一种基于Non-local高分辨率网络的人体姿态估计方法
WO2024078037A1 (zh) * 2022-10-12 2024-04-18 华人运通(上海)云计算科技有限公司 人体姿态检测方法和基于视觉感知的安全人机交互方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107451568A (zh) * 2017-08-03 2017-12-08 重庆邮电大学 使用深度卷积神经网络的姿态检测方法及设备
CN108062526A (zh) * 2017-12-15 2018-05-22 厦门美图之家科技有限公司 一种人体姿态估计方法及移动终端
CN108537156A (zh) * 2018-03-30 2018-09-14 广州幻境科技有限公司 一种抗遮挡的手部关键节点追踪方法
CN109033946A (zh) * 2018-06-08 2018-12-18 东南大学 融合方向图的人体姿态估计方法
CN110175575A (zh) * 2019-05-29 2019-08-27 南京邮电大学 一种基于新型高分辨率网络模型的单人姿态估计方法
US20190278983A1 (en) * 2018-03-12 2019-09-12 Nvidia Corporation Three-dimensional (3d) pose estimation from a monocular camera

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107451568A (zh) * 2017-08-03 2017-12-08 重庆邮电大学 使用深度卷积神经网络的姿态检测方法及设备
CN108062526A (zh) * 2017-12-15 2018-05-22 厦门美图之家科技有限公司 一种人体姿态估计方法及移动终端
US20190278983A1 (en) * 2018-03-12 2019-09-12 Nvidia Corporation Three-dimensional (3d) pose estimation from a monocular camera
CN108537156A (zh) * 2018-03-30 2018-09-14 广州幻境科技有限公司 一种抗遮挡的手部关键节点追踪方法
CN109033946A (zh) * 2018-06-08 2018-12-18 东南大学 融合方向图的人体姿态估计方法
CN110175575A (zh) * 2019-05-29 2019-08-27 南京邮电大学 一种基于新型高分辨率网络模型的单人姿态估计方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111626105A (zh) * 2020-04-15 2020-09-04 南京旷云科技有限公司 姿态估计方法、装置及电子设备
CN111626105B (zh) * 2020-04-15 2024-02-20 南京旷云科技有限公司 姿态估计方法、装置及电子设备
CN112418263A (zh) * 2020-10-10 2021-02-26 上海鹰瞳医疗科技有限公司 一种医学图像病灶分割标注方法及系统
CN113221626A (zh) * 2021-03-04 2021-08-06 北京联合大学 一种基于Non-local高分辨率网络的人体姿态估计方法
CN113221626B (zh) * 2021-03-04 2023-10-20 北京联合大学 一种基于Non-local高分辨率网络的人体姿态估计方法
CN113095254A (zh) * 2021-04-20 2021-07-09 清华大学深圳国际研究生院 一种人体部位关键点的定位方法及系统
CN113095254B (zh) * 2021-04-20 2022-05-24 清华大学深圳国际研究生院 一种人体部位关键点的定位方法及系统
WO2024078037A1 (zh) * 2022-10-12 2024-04-18 华人运通(上海)云计算科技有限公司 人体姿态检测方法和基于视觉感知的安全人机交互方法

Also Published As

Publication number Publication date
CN110969105B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
CN110969105B (zh) 一种人体姿态估计方法
Liu et al. Learning affinity via spatial propagation networks
CN108710830B (zh) 一种结合密集连接注意力金字塔残差网络和等距限制的人体3d姿势估计方法
CN108229490B (zh) 关键点检测方法、神经网络训练方法、装置和电子设备
CN110852349B (zh) 一种图像处理方法、检测方法、相关设备及存储介质
CN109858487B (zh) 基于分水岭算法和图像类别标签的弱监督语义分割方法
CN107392865B (zh) 一种人脸图像的复原方法
Bai et al. Adaptive correction procedure for TVL1 image deblurring under impulse noise
US20220351413A1 (en) Target detection method, computer device and non-transitory readable storage medium
CN108550126A (zh) 一种自适应相关滤波器目标跟踪方法及系统
CN110930411A (zh) 一种基于深度相机的人体分割方法及系统
CN112184547B (zh) 红外图像的超分辨率方法及计算机可读存储介质
CN114419275A (zh) 基于对偶图神经网络对三角网格进行去噪的方法
CN113935925B (zh) 气动光学效应空变模糊图像复原方法及系统
Sarkar et al. Finding a largest rectangle inside a digital object and rectangularization
Feng et al. Guided filter‐based multi‐scale super‐resolution reconstruction
CN116977187A (zh) 一种基于梯度场的深度点集重采样方法
CN115115724A (zh) 图像处理方法、装置、计算机设备及存储介质
CN114581411A (zh) 一种卷积核生成方法和装置、电子设备
CN112435211B (zh) 一种内窥镜图像序列中轮廓稠密特征点描述和匹配的方法
Xie et al. GAGCN: Generative adversarial graph convolutional network for non‐homogeneous texture extension synthesis
Liu et al. Target tracker with masked discriminative correlation filter
CN116703768A (zh) 盲点去噪网络模型的训练方法、装置、介质和设备
US10776923B2 (en) Segmenting irregular shapes in images using deep region growing
Park et al. Improvement of optical flow estimation by using the hampel filter for low-end embedded systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant