CN111768485A - 三维图像的关键点标注方法、装置、电子设备及存储介质 - Google Patents

三维图像的关键点标注方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111768485A
CN111768485A CN202010600185.5A CN202010600185A CN111768485A CN 111768485 A CN111768485 A CN 111768485A CN 202010600185 A CN202010600185 A CN 202010600185A CN 111768485 A CN111768485 A CN 111768485A
Authority
CN
China
Prior art keywords
dimensional image
dimensional
determining
vertex
cut
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010600185.5A
Other languages
English (en)
Other versions
CN111768485B (zh
Inventor
彭昊天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010600185.5A priority Critical patent/CN111768485B/zh
Publication of CN111768485A publication Critical patent/CN111768485A/zh
Application granted granted Critical
Publication of CN111768485B publication Critical patent/CN111768485B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/005General purpose rendering architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10012Stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请公开了三维图像的关键点标注方法、装置、电子设备及存储介质,涉及计算机视觉、深度学习及神经网络领域。具体为:针对待标注三维图像中的各个顶点,确定顶点所在三角面片的法向量与视线方向的夹角,将夹角大于预设阈值的三角面片对应的顶点删除,得到切割后的三维图像;视线方向为与所述三维图像的底部平面垂直、并且指向所述三维图像的方向;将切割后的三维图像进行裁剪,将切割后的三维图像的下部区域作为裁剪后的三维图像;将裁剪后的三维图像进行渲染,得到对应的二维图像;确定二维图像中拐点程度最大的二维关键点,将二维关键点透视至待标注三维图像上,得到待标注三维图像的三维关键点。本申请能标注特征明确且独立的三维关键点。

Description

三维图像的关键点标注方法、装置、电子设备及存储介质
技术领域
本申请涉及人工智能领域,尤其涉及计算机视觉、深度学习及神经网络领域。
背景技术
关键点检测是计算机视觉中一种物体检测的常用方法。为获取效果良好的关键点检测模型,需要标注信息具有良好的质量和数量。为了满足训练需求,通常需要标注人员进行大量的关键点的手工标注,成本极高,同时需要反复筛查和校验才能正确投入使用。并且对于不同人员的标注和同一人在不同时间下的标注存在理解差异、无法对齐,同时更多的关键点在不同形状的目标物体中存在定义不明确的问题。针对三维图像的关键点标注的难度远在二维图像标注之上,标注人员需要对三维图像进行平移和旋转,具有更复杂的操作步骤,观察视角的不同会导致对关键点的判断不准确,标注质量难以保证。
现有技术中对于通用的三维物体图像,存在以下几种关键点标注的方式:第一种,生成包围盒,使用包围盒顶点作为关键点;第二种,对三维模型进行随机采样,取随机点作为关键点;第三种,利用三维滑动窗口对三维模型进行均匀采样,将均匀采样得到的点作为关键点;第四种,最远点采样,每次挑选距离点集最远的点作为关键点;第五种,人工标注。
上述几种标注方式都不理想,特别是对于形状不规则的物体,难以标注出特征明确且彼此独立的关键点,不利于后续神经网络的学习及特征提取。
发明内容
本申请提供了一种三维图像的关键点标注方法、装置、电子设备及存储介质。
根据本申请的一方面,提供了一种三维图像的关键点标注方法,包括:
针对待标注三维图像中的各个顶点,确定所述顶点所在三角面片的法向量与视线方向的夹角,将所述夹角大于预设阈值的三角面片对应的顶点删除,得到切割后的三维图像;所述视线方向为与所述三维图像的底部平面垂直、并且指向所述三维图像的方向;
将所述切割后的三维图像进行裁剪,将所述切割后的三维图像的下部区域作为裁剪后的三维图像;
将所述裁剪后的三维图像进行渲染,得到对应的二维图像;
确定所述二维图像中拐点程度最大的二维关键点,将所述二维关键点透视至所述待标注三维图像上,得到所述待标注三维图像上的三维关键点。
根据本申请的另一方面,提供了一种三维图像的关键点标注装置,包括:
切割模块,用于针对待标注三维图像中的各个顶点,确定所述顶点所在三角面片的法向量与视线方向的夹角,将所述夹角大于预设阈值的三角面片对应的顶点删除,得到切割后的三维图像;所述视线方向为与所述三维图像的底部平面垂直、并且指向所述三维图像的方向;
裁剪模块,用于将所述切割后的三维图像进行裁剪,将所述切割后的三维图像的下部区域作为裁剪后的三维图像;
渲染模块,用于将所述裁剪后的三维图像进行渲染,得到对应的二维图像;
标注模块,用于确定所述二维图像中拐点程度最大的二维关键点,将所述二维关键点透视至所述待标注三维图像上,得到所述待标注三维图像上的三维关键点。
根据本申请的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一项所述的方法。
根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行上述任一项所述的方法。
本申请实施例通过将三维图像进行切割和裁剪处理,将处理之后的三维图像渲染为二维图像,再利用二维图像中拐点程度最大的二维关键点确定出三维图像上的三维关键点,从而能够确定出特征明确且彼此独立的关键点。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例的一种三维图像的关键点标注方法实现流程图;
图2A为本申请实施例的一种三维鞋子图像的局部图像中的三角面片示意图;
图2B为本申请实施例的一种切割后的三维图像示意图;
图2C为本申请实施例的一种裁剪框示意图;
图2D为本申请实施例的一种裁剪后的三维图像示意图;
图2E为本申请实施例的一种渲染后得到的二维图像示意图;
图2F为本申请实施例的一个二维图像示意图;
图2G为本申请实施例的一种二维图像片段及其中的中心位置拐点程度示意图;
图2H为本申请实施例的一种三维图像上标注的三维关键点示意图;
图3为本申请实施例的一种三维图像的关键点标注方法中,步骤S104中的确定拐点程度最大的二维关键点的实现流程图;
图4为本申请实施例的一种三维图像的关键点标注方法中,步骤S301的实现流程图;
图5为本申请实施例的一种三维图像的关键点标注装置结构示意图;
图6为本申请实施例的另一种三维图像的关键点标注装置结构示意图;
图7是用来实现本申请实施例的三维图像的关键点标注方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本申请实施例提出一种三维图像的关键点标注方法,本申请实施例可以基于投影实现,并采用离线处理方式。可选地,为标注三维图像上的关键点,本申请实施例首先将所有三维图像数据采用有向包围盒(OBB,Oriented Bounding Box)提取三维图像中目标物体的径向主轴,并将所有目标图像的径向主轴进行统一,以使所有三维图像中的目标物体的方向基本一致。调整方向之后,可以采用图1所示的方式对各个三维图像进行关键点标注。
图1为本申请实施例的一种三维图像的关键点标注方法实现流程图,包括:
步骤S101:针对待标注三维图像中的各个顶点,确定顶点所在三角面片的法向量与视线方向的夹角,将夹角大于预设阈值的三角面片对应的顶点删除,得到切割后的三维图像;其中,视线方向为与三维图像的底部平面垂直、并且指向三维图像的方向;
步骤S102:将切割后的三维图像进行裁剪,将切割后的三维图像的下部区域作为裁剪后的三维图像;
步骤S103:将裁剪后的三维图像进行渲染,得到对应的二维图像;
步骤S104:确定该二维图像中拐点程度最大的二维关键点,将二维关键点透视至待标注三维图像上,得到待标注三维图像上的三维关键点。
在一些实施方式中,上述三维图像包括鞋体的三维图像。
在以下实施例中,以三维图像为鞋体的三维图像为例进行举例。需要说的是,本申请实施例提出的关键点标注方法不限于针对鞋体的三维图像,还可以针对其他物体的三维图像。
图2A为本申请实施例的一种三维鞋子图像的局部图像中的三角面片示意图。在图2A中,三维鞋子图像上相邻的3个顶点构成一个三角面片。
如某三角面片的三个顶点包括A、B、C,将点A和B构成向量1,将点A和C构成向量1;计算向量1和向量2的向量积,其结果则为该三角面片的法向量,该法向量的方向与该三角面片的平面垂直。将视角定位于鞋子下方,视线看向鞋子。在上述步骤S101中,计算该法向量与视线方向的夹角,将夹角大于预设阈值(如预设阈值接近90度)的三角面片对应的顶点删除,即可得到切割后的三维图像。根据立体几何原理可知,前述操作将三维鞋子图像的底部位置删除掉,保留了三维鞋子图像中除鞋底以外的部分。图2B为本申请实施例的一种切割后的三维图像示意图,在图2中,箭头方向为上述视线方向。视线方向为与三维图像的底部平面垂直、并且指向三维图像的方向。如果三维图像为鞋子图像,则该三维图像的底部平面即为鞋底所在的平面。如图2B所示,上述步骤S101实现了对鞋底部分的切割。
在一些实施方式中,上述步骤S102的具体方式包括:(1)根据三维鞋子模型的有向包围盒(OBB,Oriented Bounding Box),设置一个裁剪框。由于一些鞋子的脚尖部分存在抬起,部分鞋底只有在行走过程中才能接触地面,因此裁剪框可以多留出一部分空间,例如裁剪框占有向包围盒底部28%的区域,如图2C所示,图2C为本申请实施例的一种裁剪框示意图。
采用上述裁剪框对图2B所示的切割后的三维图像进行裁剪,保留裁剪框所以内的区域(即切割后的三维图像的下部区域),将裁剪框以外的区域去掉。如图2D所示,图2D为本申请实施例的一种裁剪后的三维图像示意图。由图2D可见,裁剪后的三维图像保留了鞋帮的区域。之后,对裁剪后的三维图像进行渲染,渲染生成一张二维图像,该二维图像的每个坐标记录一个深度信息,即执行上述步骤S103。
在一些实施方式中,上述步骤S103包括:
针对二维图像的各个像素,在该像素具有对应顶点的情况下,确定与上述视线方向对应的摄像头距离最近的第一顶点,将该第一顶点与该摄像头的距离设置为像素的值;
在该像素不具有对应顶点的情况下,将所述像素的值设置为0。
图2E为本申请实施例的一种渲染后得到的二维图像示意图。图2E中显示了8种渲染后得到的二维图像,由图2E可见,该二维图像基本示出了鞋底的轮廓。
在一些实施方式中,在得到上述二维图像之后,进一步包括对该二维图像进行平滑处理和/或去噪处理。可选地,本申请实施例通过高斯卷积使二维图像平滑化,防止局部极值点对后续关键位置提取造成的影响。并且,本申请实施例可以将二维图像中一些不连贯的点删除,例如将与相邻点的距离超过预设阈值的点删除,从而实现去噪处理。图2F为本申请实施例的一个二维图像示意图,如图2F所示,圆圈内存在一些噪声点,可以通过去噪处理将这些噪声点删除。
针对平滑处理和/或去噪处理之后的二维图像,本申请实施例可以采用上述步骤S104,确定该二维图像中拐点程度最大的二维关键点。
图3为本申请实施例的一种三维图像的关键点标注方法中,步骤S104中的确定拐点程度最大的二维关键点的实现流程图,包括:
步骤S301:将平滑处理和/或去噪处理之后的二维图像划分为M段,得到M个二维图像片段;M为正整数;
步骤S302:分别确定M个二维图像片段中包含的像素的中心位置;该中心位置的横坐标为二维图像片段中包含的像素的横坐标的均值,该中心位置的纵坐标为二维图像片段中包含的像素的纵坐标的均值;
步骤S303:根据M个中心位置(每个二维图像片段中包含一个中心位置),确定拐点程度最大的N个中心位置;N为不大于M的正整数;
步骤S304:分别确定上述N个中心位置所在的二维图像片段中、与该中心位置最接近的点;将确定出的N个点作为平滑处理和/或去噪处理之后的二维图像中拐点程度最大的二维关键点。
可选地,上述步骤S303中,确定中心位置的拐点程度的方式为:对于中心位置Si,可以根据相邻的2个中心位置Si+1和Si-1,计算中心位置Si的二阶导数,该二阶导数即代表中心位置Si的拐点程度。
图2G为本申请实施例的一种二维图像片段及其中的中心位置拐点程度示意图。图2G的左侧图像为一个二维图像,该二维图像被多个线段划分为多个二维图像片段,每个二维图像片段中可以确定出一个中心位置。图2G的右侧图像为计算中心位置拐点程度的方式示意图,图2G右侧图像中示出了3个中心位置,显然,中间的中心位置的拐点程度最大。可见,拐点程度越大的中心位置,与该中心位置最接近的二维图像上的点更能够代表鞋底的轮廓,因此相比其他点的重要性更高。
在选取了拐点程度最大的多个二维关键点之后,执行上述步骤S104,将各个二维关键点透视至上述待标注三维图像上,即可得到待标注三维图像上的三维关键点。图2H为本申请实施例的一种三维图像上标注的三维关键点示意图。
另外,在一些实施方式中,如图4所示,上述步骤S301包括:
步骤S401:确定平滑处理和/或去噪处理之后的二维图像的外轮廓和内轮廓;
步骤S402:将外轮廓和内轮廓分别划分为M段,得到M个外轮廓段和M个内轮廓段;M为正整数;
步骤S403:确定每个外轮廓段的中点及对应的内轮廓段的中点;
步骤S404:计算外轮廓段的中点和对应的内轮廓段的中点的中心位置;
步骤S405:将二维图像中的点以这些中心位置进行聚类,根据聚类结果将该二维图像划分为M段。
如图2G的左侧图像即显示了划分后的结果。
综上可见,本申请实施例主要关注点在鞋底轮廓上,并由此生成关键点。鞋子底部相对鞋子表面点更加稳定,由于鞋子底部决定模型在真实世界中的位置,因而三维模型与二维图像贴合时,底部贴合是最优先的,而且任何鞋子都有充分与地面接触的区域。在渲染鞋底关键点时不存在超出图像鞋子范围,将模型渲染到背景上的情况。
此外,其他一些关键点采样类算法得到的部分关键点可能过于近似,如均匀采样中鞋面上存在多数外观相似点,又如随机采样中少数点近乎重合。这些点在关键点网络训练中容易难以区分。而本申请实施例生成的关键点既可以满足关键点之间不会过分贴合,同时每个关键点又具有充分的外形特征,便于网络学习和理解。最终能够提供姿态检测的良好效果。本申请实施例同样可用于其他角度投影以及其他类型的关键点采样。可用于三维物体外观分析。
本申请实施例还提出一种三维图像的关键点标注装置,图5为本申请实施例的一种三维图像的关键点标注装置结构示意图,包括:
切割模块510,用于针对待标注三维图像中的各个顶点,确定所述顶点所在三角面片的法向量与视线方向的夹角,将所述夹角大于预设阈值的三角面片对应的顶点删除,得到切割后的三维图像;所述视线方向为与所述三维图像的底部平面垂直、并且指向所述三维图像的方向;
裁剪模块520,用于将所述切割后的三维图像进行裁剪,将所述切割后的三维图像的下部区域作为裁剪后的三维图像;
渲染模块530,用于将所述裁剪后的三维图像进行渲染,得到对应的二维图像;
标注模块540,用于确定所述二维图像中拐点程度最大的二维关键点,将所述二维关键点透视至所述待标注三维图像上,得到所述待标注三维图像上的三维关键点。
在一些实施方式中,三维图像包括鞋体的三维图像。
在一些实施方式中,渲染模块530,用于针对二维图像的各个像素,在所述像素具有对应顶点的情况下,确定与所述视线方向对应的摄像头距离最近的第一顶点,将所述第一顶点与所述摄像头的距离设置为所述像素的值;在所述像素不具有对应顶点的情况下,将所述像素的值设置为0。
在一些实施方式中,如图6所示,上述装置还包括:处理模块650,用于对所述二维图像平滑处理和/或去噪处理。
在一些实施方式中,标注模块540包括:
划分子模块541,用于将所述平滑处理和/或去噪处理之后的二维图像划分为M段,得到M个二维图像片段;所述M为正整数;
中心位置确定子模块542,用于分别确定所述M个二维图像片段中包含的像素的中心位置;所述中心位置的横坐标为所述二维图像片段中包含的像素的横坐标的均值,所述中心位置的纵坐标为所述二维图像片段中包含的像素的纵坐标的均值;
筛选子模块543,用于根据M个所述中心位置,确定拐点程度最大的N个中心位置;所述N为不大于所述M的正整数;
二维关键点确定子模块544,用于分别确定所述N个中心位置所在的二维图像片段中、与所述中心位置最接近的点;将确定出的N个点作为所述平滑处理和/或去噪处理之后的二维图像中拐点程度最大的二维关键点。
在一些实施方式中,划分子模块541,用于确定所述平滑处理和/或去噪处理之后的二维图像的外轮廓和内轮廓;将所述外轮廓和内轮廓分别划分为M段,得到M个外轮廓段和M个内轮廓段;所述M为正整数;确定每个外轮廓段的中点及对应的内轮廓段的中点;计算所述外轮廓段的中点和对应的内轮廓段的中点的中心位置;将所述二维图像中的点以所述中心位置进行聚类,根据聚类结果将所述二维图像划分为M段。
本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的三维图像的关键点标注方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的三维图像的关键点标注方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的三维图像的关键点标注方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的三维图像的关键点标注方法对应的程序指令/模块(例如,附图5所示的切割模块510、裁剪模块520、渲染模块530和标注模块540)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的三维图像的关键点标注方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据三维图像的关键点标注的电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至三维图像的关键点标注的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
三维图像的关键点标注方法的电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与三维图像的关键点标注的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与虚拟专用服务器(VPS)服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (14)

1.一种三维图像的关键点标注方法,包括:
针对待标注三维图像中的各个顶点,确定所述顶点所在三角面片的法向量与视线方向的夹角,将所述夹角大于预设阈值的三角面片对应的顶点删除,得到切割后的三维图像;所述视线方向为与所述三维图像的底部平面垂直、并且指向所述三维图像的方向;
将所述切割后的三维图像进行裁剪,将所述切割后的三维图像的下部区域作为裁剪后的三维图像;
将所述裁剪后的三维图像进行渲染,得到对应的二维图像;
确定所述二维图像中拐点程度最大的二维关键点,将所述二维关键点透视至所述待标注三维图像上,得到所述待标注三维图像上的三维关键点。
2.根据权利要求1所述的方法,其中,所述三维图像包括鞋体的三维图像。
3.根据权利要求1或2所述的方法,所述将所述裁剪后的图像进行渲染,得到对应的二维图像,包括:
针对二维图像的各个像素,在所述像素具有对应顶点的情况下,确定与所述视线方向对应的摄像头距离最近的第一顶点,将所述第一顶点与所述摄像头的距离设置为所述像素的值;
在所述像素不具有对应顶点的情况下,将所述像素的值设置为0。
4.根据权利要求1或2所述的方法,所述将裁剪后的图像进行渲染,得到对应的二维图像之后,还包括:对所述二维图像平滑处理和/或去噪处理;
所述确定所述二维图像中拐点程度最大的二维关键点,包括:确定平滑处理和/或去噪处理之后的二维图像中拐点程度最大的二维关键点。
5.根据权利要求4所述的方法,其中,所述确定平滑处理和/或去噪处理之后的二维图像中拐点程度最大的二维关键点,包括:
将所述平滑处理和/或去噪处理之后的二维图像划分为M段,得到M个二维图像片段;所述M为正整数;
分别确定所述M个二维图像片段中包含的像素的中心位置;所述中心位置的横坐标为所述二维图像片段中包含的像素的横坐标的均值,所述中心位置的纵坐标为所述二维图像片段中包含的像素的纵坐标的均值;
根据M个所述中心位置,确定拐点程度最大的N个中心位置;所述N为不大于所述M的正整数;
分别确定所述N个中心位置所在的二维图像片段中、与所述中心位置最接近的点;将确定出的N个点作为所述平滑处理和/或去噪处理之后的二维图像中拐点程度最大的二维关键点。
6.根据权利要求5所述的方法,其中,所述将所述平滑处理和/或去噪处理之后的二维图像划分为M段,包括:
确定所述平滑处理和/或去噪处理之后的二维图像的外轮廓和内轮廓;
将所述外轮廓和内轮廓分别划分为M段,得到M个外轮廓段和M个内轮廓段;所述M为正整数;
确定每个外轮廓段的中点及对应的内轮廓段的中点;
计算所述外轮廓段的中点和对应的内轮廓段的中点的中心位置;
将所述二维图像中的点以所述中心位置进行聚类,根据聚类结果将所述二维图像划分为M段。
7.一种三维图像的关键点标注装置,包括:
切割模块,用于针对待标注三维图像中的各个顶点,确定所述顶点所在三角面片的法向量与视线方向的夹角,将所述夹角大于预设阈值的三角面片对应的顶点删除,得到切割后的三维图像;所述视线方向为与所述三维图像的底部平面垂直、并且指向所述三维图像的方向;
裁剪模块,用于将所述切割后的三维图像进行裁剪,将所述切割后的三维图像的下部区域作为裁剪后的三维图像;
渲染模块,用于将所述裁剪后的三维图像进行渲染,得到对应的二维图像;
标注模块,用于确定所述二维图像中拐点程度最大的二维关键点,将所述二维关键点透视至所述待标注三维图像上,得到所述待标注三维图像上的三维关键点。
8.根据权利要求7所述的装置,其中,所述三维图像包括鞋体的三维图像。
9.根据权利要求7或8所述的装置,所述渲染模块,用于针对二维图像的各个像素,在所述像素具有对应顶点的情况下,确定与所述视线方向对应的摄像头距离最近的第一顶点,将所述第一顶点与所述摄像头的距离设置为所述像素的值;在所述像素不具有对应顶点的情况下,将所述像素的值设置为0。
10.根据权利要求7或8所述的装置,所述装置还包括:处理模块,用于对所述二维图像平滑处理和/或去噪处理。
11.根据权利要求10所述的装置,其中,所述标注模块包括:
划分子模块,用于将所述平滑处理和/或去噪处理之后的二维图像划分为M段,得到M个二维图像片段;所述M为正整数;
中心位置确定子模块,用于分别确定所述M个二维图像片段中包含的像素的中心位置;所述中心位置的横坐标为所述二维图像片段中包含的像素的横坐标的均值,所述中心位置的纵坐标为所述二维图像片段中包含的像素的纵坐标的均值;
筛选子模块,用于根据M个所述中心位置,确定拐点程度最大的N个中心位置;所述N为不大于所述M的正整数;
二维关键点确定子模块,用于分别确定所述N个中心位置所在的二维图像片段中、与所述中心位置最接近的点;将确定出的N个点作为所述平滑处理和/或去噪处理之后的二维图像中拐点程度最大的二维关键点。
12.根据权利要求11所述的装置,其中,所述划分子模块,用于确定所述平滑处理和/或去噪处理之后的二维图像的外轮廓和内轮廓;将所述外轮廓和内轮廓分别划分为M段,得到M个外轮廓段和M个内轮廓段;所述M为正整数;确定每个外轮廓段的中点及对应的内轮廓段的中点;计算所述外轮廓段的中点和对应的内轮廓段的中点的中心位置;将所述二维图像中的点以所述中心位置进行聚类,根据聚类结果将所述二维图像划分为M段。
13.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的方法。
CN202010600185.5A 2020-06-28 2020-06-28 三维图像的关键点标注方法、装置、电子设备及存储介质 Active CN111768485B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010600185.5A CN111768485B (zh) 2020-06-28 2020-06-28 三维图像的关键点标注方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010600185.5A CN111768485B (zh) 2020-06-28 2020-06-28 三维图像的关键点标注方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111768485A true CN111768485A (zh) 2020-10-13
CN111768485B CN111768485B (zh) 2024-01-12

Family

ID=72722505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010600185.5A Active CN111768485B (zh) 2020-06-28 2020-06-28 三维图像的关键点标注方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111768485B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113362436A (zh) * 2021-05-31 2021-09-07 上海米哈游璃月科技有限公司 一种对象渲染方法、装置、设备及存储介质
CN115100255A (zh) * 2022-06-16 2022-09-23 赛维森(广州)医疗科技服务有限公司 图像对齐方法、装置、计算机设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268804A (ja) * 2005-03-19 2006-10-05 Koji Miyake 2値画像の細線化方式
KR101349375B1 (ko) * 2013-02-01 2014-01-13 주식회사 한국에스지티 3차원 지리정보시스템용 건물의 자동 3차원 공간영상 자동도화방법
WO2019080488A1 (zh) * 2017-10-27 2019-05-02 东南大学 一种基于多尺度协方差描述子与局部敏感黎曼核稀疏分类的三维人脸识别方法
CN109816704A (zh) * 2019-01-28 2019-05-28 北京百度网讯科技有限公司 物体的三维信息获取方法和装置
CN109960986A (zh) * 2017-12-25 2019-07-02 北京市商汤科技开发有限公司 人脸姿态分析方法、装置、设备、存储介质以及程序
CN110135497A (zh) * 2019-05-16 2019-08-16 腾讯科技(深圳)有限公司 模型训练的方法、面部动作单元强度估计的方法及装置
CN111027427A (zh) * 2019-11-29 2020-04-17 大连理工大学 一种用于小型无人机竞速比赛的目标门检测方法
CN111243011A (zh) * 2018-11-29 2020-06-05 北京市商汤科技开发有限公司 关键点检测方法及装置、电子设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006268804A (ja) * 2005-03-19 2006-10-05 Koji Miyake 2値画像の細線化方式
KR101349375B1 (ko) * 2013-02-01 2014-01-13 주식회사 한국에스지티 3차원 지리정보시스템용 건물의 자동 3차원 공간영상 자동도화방법
WO2019080488A1 (zh) * 2017-10-27 2019-05-02 东南大学 一种基于多尺度协方差描述子与局部敏感黎曼核稀疏分类的三维人脸识别方法
CN109960986A (zh) * 2017-12-25 2019-07-02 北京市商汤科技开发有限公司 人脸姿态分析方法、装置、设备、存储介质以及程序
CN111243011A (zh) * 2018-11-29 2020-06-05 北京市商汤科技开发有限公司 关键点检测方法及装置、电子设备和存储介质
CN109816704A (zh) * 2019-01-28 2019-05-28 北京百度网讯科技有限公司 物体的三维信息获取方法和装置
CN110135497A (zh) * 2019-05-16 2019-08-16 腾讯科技(深圳)有限公司 模型训练的方法、面部动作单元强度估计的方法及装置
CN111027427A (zh) * 2019-11-29 2020-04-17 大连理工大学 一种用于小型无人机竞速比赛的目标门检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王含宇;韩冲;张碧超;: "结构光焊缝跟踪传感器设计的关键问题", 电焊机, no. 08, pages 6 - 12 *
赵青;余元辉;蔡?榕;: "融合表观与曲率特征的三维点云眉毛提取", 集美大学学报(自然科学版), no. 03, pages 73 - 80 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113362436A (zh) * 2021-05-31 2021-09-07 上海米哈游璃月科技有限公司 一种对象渲染方法、装置、设备及存储介质
CN113362436B (zh) * 2021-05-31 2023-09-12 上海米哈游璃月科技有限公司 一种对象渲染方法、装置、设备及存储介质
CN115100255A (zh) * 2022-06-16 2022-09-23 赛维森(广州)医疗科技服务有限公司 图像对齐方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN111768485B (zh) 2024-01-12

Similar Documents

Publication Publication Date Title
CN111914628B (zh) 人脸识别模型的训练方法和装置
CN110659600B (zh) 物体检测方法、装置及设备
CN111695628B (zh) 关键点标注方法、装置、电子设备及存储介质
CN111722245B (zh) 定位方法、定位装置和电子设备
CN112529073A (zh) 模型训练方法、姿态估计方法、装置及电子设备
CN112528786B (zh) 车辆跟踪方法、装置及电子设备
CN114140867A (zh) 使用眼睛特征的眼睛姿态识别
CN111783647A (zh) 人脸融合模型的训练方法、人脸融合方法、装置及设备
CN111914629A (zh) 为人脸识别生成训练数据的方法、装置、设备和存储介质
CN111739167B (zh) 3d人头重建方法、装置、设备和介质
CN112492388A (zh) 视频处理方法、装置、设备以及存储介质
KR102432561B1 (ko) 에지를 기반으로 하는 증강현실 3차원 추적 등록 방법, 장치 및 전자 기기
CN111768485B (zh) 三维图像的关键点标注方法、装置、电子设备及存储介质
CN111768356A (zh) 一种人脸图像融合方法、装置、电子设备及存储介质
CN112241716B (zh) 训练样本的生成方法和装置
CN111968203A (zh) 动画驱动方法、装置、电子设备及存储介质
CN112270745A (zh) 一种图像生成方法、装置、设备以及存储介质
CN112102154A (zh) 图像处理方法、装置、电子设备和存储介质
CN111462179B (zh) 三维物体跟踪方法、装置及电子设备
CN111539347A (zh) 用于检测目标的方法和装置
CN111914630A (zh) 为人脸识别生成训练数据的方法、装置、设备和存储介质
CN111191619A (zh) 车道线虚线段的检测方法、装置、设备和可读存储介质
CN111369571B (zh) 三维物体位姿准确性判断方法、装置及电子设备
CN111951214A (zh) 图像中可读区域的分割方法、装置、电子设备及存储介质
CN112488126A (zh) 特征图处理方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant