CN110263797A - 骨架的关键点估计方法、装置、设备及可读存储介质 - Google Patents
骨架的关键点估计方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN110263797A CN110263797A CN201910543687.6A CN201910543687A CN110263797A CN 110263797 A CN110263797 A CN 110263797A CN 201910543687 A CN201910543687 A CN 201910543687A CN 110263797 A CN110263797 A CN 110263797A
- Authority
- CN
- China
- Prior art keywords
- information
- stage
- skeleton
- key point
- target object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本公开实施例提供了一种骨架的关键点估计方法、装置、设备及计算机可读存储介质,该方法包括:将目标对象的图像输入至预设的网络,以获得目标对象的整体轮廓信息,预设的网络包括多个卷积阶段Stage,多个Stage包括第一Stage、第二Stage、第三Stage、第四Stage和第五Stage;根据整体轮廓信息及第四Stage输出的信息,确定目标对象的骨架各个部位躯干信息;根据骨架各个部位躯干信息和第三Stage输出的信息,确定骨架关键点坐标信息;根据骨架关键点坐标信息和第二Stage输出的信息,确定目标对象的骨架的关键点。该方法实现由粗到细对骨架的关键点的估计,提升了估计骨架的关键点的准确度。
Description
技术领域
本公开涉及计算机技术领域,具体而言,本公开涉及一种骨架的关键点估计方法、装置、设备及计算机可读存储介质。
背景技术
现有技术中通过一个网络直接去预测人体骨架的关键点信息,每个关键点之间没有联系;具体地,对一副图像提取特征,提取之后进行卷积,得到每个关键点的位置,但是神经网络结构信息没有用进来,从而导致对人体骨架的关键点的估计准确度低。
发明内容
本公开针对现有的方式的缺点,提出一种骨架的关键点估计方法、装置、设备及计算机可读存储介质,用以解决如何提高估计骨架的关键点的准确度的问题。
第一方面,本公开提供了一种骨架的关键点估计方法,包括:
将目标对象的图像输入至预设的网络,以获得目标对象的整体轮廓信息,预设的网络包括多个卷积阶段Stage,多个Stage包括第一Stage、第二Stage、第三Stage、第四Stage和第五Stage;
根据整体轮廓信息及第四Stage输出的信息,确定目标对象的骨架各个部位躯干信息;
根据骨架各个部位躯干信息和第三Stage输出的信息,确定骨架关键点坐标信息;
根据骨架关键点坐标信息和第二Stage输出的信息,确定目标对象的骨架的关键点。
第二方面,本公开提供了一种骨架的关键点估计装置,包括:
整体轮廓信息获得模块,用于将目标对象的图像输入至预设的网络,以获得目标对象的整体轮廓信息,预设的网络包括多个卷积阶段Stage,多个Stage包括第一Stage、第二Stage、第三Stage、第四Stage和第五Stage;
躯干信息确定模块,用于根据整体轮廓信息及第四Stage输出的信息,确定目标对象的骨架各个部位躯干信息;
坐标信息确定模块,用于根据骨架各个部位躯干信息和第三Stage输出的信息,确定骨架关键点坐标信息;
关键点确定模块,用于根据骨架关键点坐标信息和第二Stage输出的信息,确定目标对象的骨架的关键点。
第三方面,本公开提供了一种电子设备,包括:处理器、存储器和总线;
总线,用于连接处理器和存储器;
存储器,用于存储操作指令;
处理器,用于通过调用操作指令,执行本公开第一方面的骨架的关键点估计方法。
第四方面,本公开提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被用于执行本公开第一方面的骨架的关键点估计方法。
本公开实施例提供的技术方案,至少具有如下有益效果:
将目标对象的图像输入至预设的网络,以获得目标对象的整体轮廓信息,预设的网络包括多个卷积阶段Stage,多个Stage包括第一Stage、第二Stage、第三Stage、第四Stage和第五Stage;根据整体轮廓信息及第四Stage输出的信息,确定目标对象的骨架各个部位躯干信息;根据骨架各个部位躯干信息和第三Stage输出的信息,确定骨架关键点坐标信息;根据骨架关键点坐标信息和第二Stage输出的信息,确定目标对象的骨架的关键点。如此,通过预设的网络的卷积阶段Stage的输出的信息与该卷积阶段Stage的上一层Stage的输出的信息,得到估计结果,实现由粗到细对骨架的关键点的估计,提升了估计骨架的关键点的准确度。
本公开附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍。
图1为本公开实施例提供的一种骨架的关键点估计方法的流程示意图;
图2为本公开实施例提供的另一种骨架的关键点估计方法的流程示意图;
图3为本公开实施例提供的一种骨架的关键点估计装置的结构示意图;
图4为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本公开,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本公开的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。
实施例一
本公开实施例中提供了一种骨架的关键点估计方法,该方法的流程示意图如图1所示,该方法包括:
S101,将目标对象的图像输入至预设的网络,以获得目标对象的整体轮廓信息,预设的网络包括多个卷积阶段Stage,多个Stage包括第一Stage、第二Stage、第三Stage、第四Stage和第五Stage。
S102,根据整体轮廓信息及第四Stage输出的信息,确定目标对象的骨架各个部位躯干信息。
S103,根据骨架各个部位躯干信息和第三Stage输出的信息,确定骨架关键点坐标信息。
S104,根据骨架关键点坐标信息和第二Stage输出的信息,确定目标对象的骨架的关键点。
本公开实施例中,将目标对象的图像输入至预设的网络,以获得目标对象的整体轮廓信息,预设的网络包括多个卷积阶段Stage,多个Stage包括第一Stage、第二Stage、第三Stage、第四Stage和第五Stage;根据整体轮廓信息及第四Stage输出的信息,确定目标对象的骨架各个部位躯干信息;根据骨架各个部位躯干信息和第三Stage输出的信息,确定骨架关键点坐标信息;根据骨架关键点坐标信息和第二Stage输出的信息,确定目标对象的骨架的关键点。如此,通过预设的网络的卷积阶段Stage的输出的信息与该卷积阶段Stage的上一层Stage的输出的信息,得到估计结果,实现由粗到细对骨架的关键点的估计,提升了估计骨架的关键点的准确度。
可选地,将目标对象的图像输入到预设的网络,以获得目标对象的整体轮廓信息,包括:
将目标对象的图像输入至所述第一Stage,以获得第一Stage输出的信息;
根据第一Stage输出的信息,确定第二Stage输出的信息;
根据第二Stage输出的信息,确定第三Stage输出的信息;
根据第三Stage输出的信息,确定第四Stage输出的信息;
将第四Stage输出的信息输入至第五Stage,以获得目标对象的整体轮廓信息,预设的网络为残差网络ResNet。
可选地,根据整体轮廓信息及第四Stage输出的信息,确定目标对象的骨架各个部位躯干信息,包括:
根据整体轮廓信息,确定整体轮廓信息对应的特征图;
对整体轮廓信息对应的特征图进行上采样,得到上采样后的特征图;
将上采样后的特征图和第四Stage输出的信息输入至第一卷积层,得到目标对象的骨架各个部位躯干信息。
可选地,根据骨架各个部位躯干信息和第三Stage输出的信息,确定骨架关键点坐标信息,包括:
将骨架各个部位躯干信息进行上采样,得到上采样后的关键点的信息;
将上采样后的关键点的信息和第三Stage输出的信息输入至第二卷积层,得到骨架关键点坐标信息。
可选地,根据骨架关键点坐标信息和第二Stage输出的信息,确定目标对象的骨架的关键点,包括:
将骨架关键点坐标信息进行上采样,得到上采样后的坐标信息;
将上采样后的坐标信息和第二Stage输出的信息输入至第三卷积层,得到目标对象的骨架的关键点。
本公开实施例中提供了另一种骨架的关键点估计方法,该方法的流程示意图如图2所示,该方法包括:
S201,将人体的图像输入到预设的神经网络ResNet50,以获得人体的整体轮廓信息。
可选地,神经网络ResNet50为残差网络ResNet中的一种。将人体的图像输入至ResNet50的第一Stage,得到第一Stage输出的信息;根据第一Stage输出的信息,得到第二Stage输出的信息;根据第二Stage输出的信息,得到第三Stage输出的信息;根据第三Stage输出的信息,得到第四Stage输出的信息;将第四Stage输出的信息输入至第五Stage,得到人体的整体轮廓信息,即人体的骨骼连线信息,其中,人体的轮廓部分高亮显示。
S202,根据人体的整体轮廓信息及ResNet50的第四Stage输出的信息,确定人体骨架各个部位躯干信息。
可选地,根据人体的整体轮廓信息,确定人体的整体轮廓信息对应的特征图feature maps;对人体的整体轮廓信息对应的特征图进行上采样,得到上采样后的特征图;将上采样后的特征图和第四Stage输出的信息输入至第一卷积层,得到人体的骨架各个部位躯干信息。人体骨架包含10多个关键点的信息,例如,头部3个,手部3个,腿部3个;人体的骨架各个部位躯干信息作为一个整体,可以把人体分为几个部位,比如左手右手,左脚右脚头部等,其中人体的各个部位高亮显示。
S203,根据人体骨架各个部位躯干信息和ResNet50的第三Stage输出的信息,确定人体骨架关键点坐标信息。
可选地,将人体骨架各个部位躯干信息进行上采样,得到上采样后的关键点的信息;将上采样后的关键点的信息和第三Stage输出的信息输入至第二卷积层,得到人体骨架关键点坐标信息。
S204,根据人体骨架关键点坐标信息和ResNet50的第二Stage输出的信息,确定人体骨架的关键点。
可选地,将人体骨架关键点坐标信息进行上采样,得到上采样后的坐标信息;将上采样后的坐标信息和第二Stage输出的信息输入至第三卷积层,得到人体骨架的关键点。
可选地,第一卷积层、第二卷积层和第三卷积层为预设的卷积层。
应用本公开实施例,至少具有如下有益效果:
通过预设的神经网络的卷积阶段Stage的输出的信息与该卷积阶段Stage的上一层Stage的输出的信息,得到估计结果,实现由粗到细对人体骨架的关键点的估计,提升了估计人体骨架的关键点的准确度。
实施例二
基于相同的发明构思,本公开实施例还提供了一种骨架的关键点估计装置,该装置的结构示意图如图3所示,骨架的关键点估计装置30,包括整体轮廓信息获得模块301、躯干信息确定模块302、坐标信息确定模块303和关键点确定模块304。
整体轮廓信息获得模块301,用于将目标对象的图像输入至预设的网络,以获得目标对象的整体轮廓信息,预设的网络包括多个卷积阶段Stage,多个Stage包括第一Stage、第二Stage、第三Stage、第四Stage和第五Stage;
躯干信息确定模块302,用于根据整体轮廓信息及第四Stage输出的信息,确定目标对象的骨架各个部位躯干信息;
坐标信息确定模块303,用于根据骨架各个部位躯干信息和第三Stage输出的信息,确定骨架关键点坐标信息;
关键点确定模块304,用于根据骨架关键点坐标信息和第二Stage输出的信息,确定目标对象的骨架的关键点。
可选地,整体轮廓信息获得模块301,具体用于将目标对象的图像输入至所述第一Stage,以获得第一Stage输出的信息;根据第一Stage输出的信息,确定第二Stage输出的信息;根据第二Stage输出的信息,确定第三Stage输出的信息;根据第三Stage输出的信息,确定第四Stage输出的信息;将第四Stage输出的信息输入至第五Stage,以获得目标对象的整体轮廓信息,预设的网络为残差网络ResNet。
可选地,躯干信息确定模块302,具体用于根据整体轮廓信息,确定整体轮廓信息对应的特征图;对整体轮廓信息对应的特征图进行上采样,得到上采样后的特征图;将上采样后的特征图和第四Stage输出的信息输入至第一卷积层,得到目标对象的骨架各个部位躯干信息。
可选地,坐标信息确定模块303,具体用于将骨架各个部位躯干信息进行上采样,得到上采样后的关键点的信息;将上采样后的关键点的信息和第三Stage输出的信息输入至第二卷积层,得到骨架关键点坐标信息。
可选地,关键点确定模块304,具体用于将骨架关键点坐标信息进行上采样,得到上采样后的坐标信息;将上采样后的坐标信息和第二Stage输出的信息输入至第三卷积层,得到目标对象的骨架的关键点。
应用本公开实施例,至少具有如下有益效果:
将目标对象的图像输入至预设的网络,以获得目标对象的整体轮廓信息,预设的网络包括多个卷积阶段Stage,多个Stage包括第一Stage、第二Stage、第三Stage、第四Stage和第五Stage;根据整体轮廓信息及第四Stage输出的信息,确定目标对象的骨架各个部位躯干信息;根据骨架各个部位躯干信息和第三Stage输出的信息,确定骨架关键点坐标信息;根据骨架关键点坐标信息和第二Stage输出的信息,确定目标对象的骨架的关键点。如此,通过预设的网络的卷积阶段Stage的输出的信息与该卷积阶段Stage的上一层Stage的输出的信息,得到估计结果,实现由粗到细对骨架的关键点的估计,提升了估计骨架的关键点的准确度。
本公开实施例提供的骨架的关键点估计装置中未详述的内容,可参照上述实施例一提供的骨架的关键点估计方法,本公开实施例提供的骨架的关键点估计装置能够达到的有益效果与上述实施例一提供的骨架的关键点估计方法相同,在此不再赘述。
实施例三
基于与本公开的实施例中的骨架的关键点估计方法相同的原理,本公开提供了一种电子设备,该电子设备包括处理器和存储器;存储器,用于存储操作指令;处理器,用于通过调用操作指令,执行如本公开的骨架的关键点估计方法中的任一实施例中所示的方法。
基于与本公开的实施例中的骨架的关键点估计方法相同的原理,本公开提供了一种计算机可读存储介质,存储介质存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如本公开的骨架的关键点估计方法中的任一实施例中所示的方法。
在一示例中,如图4所示,其示出了适于用来实现本公开实施例的电子设备800的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备800可以包括处理装置(例如中央处理器、图形处理器等)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储装置808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有电子设备800操作所需的各种程序和数据。处理装置801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
通常,以下装置可以连接至I/O接口805:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置806;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置807;包括例如磁带、硬盘等的存储装置808;以及通信装置809。通信装置809可以允许电子设备800与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备800,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置809从网络上被下载和安装,或者从存储装置808被安装,或者从ROM 802被安装。在该计算机程序被处理装置801执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述方法实施例所示的方法;或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述方法实施例所示的方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种骨架的关键点估计方法,其特征在于,包括:
将目标对象的图像输入至预设的网络,以获得所述目标对象的整体轮廓信息,所述预设的网络包括多个卷积阶段Stage,所述多个Stage包括第一Stage、第二Stage、第三Stage、第四Stage和第五Stage;
根据所述整体轮廓信息及所述第四Stage输出的信息,确定所述目标对象的骨架各个部位躯干信息;
根据所述骨架各个部位躯干信息和所述第三Stage输出的信息,确定所述骨架关键点坐标信息;
根据所述骨架关键点坐标信息和所述第二Stage输出的信息,确定所述目标对象的骨架的关键点。
2.根据权利要求1所述的方法,其特征在于,所述将目标对象的图像输入到预设的网络,以获得所述目标对象的整体轮廓信息,包括:
将目标对象的图像输入至所述第一Stage,以获得所述第一Stage输出的信息;
根据所述第一Stage输出的信息,确定所述第二Stage输出的信息;
根据所述第二Stage输出的信息,确定所述第三Stage输出的信息;
根据所述第三Stage输出的信息,确定所述第四Stage输出的信息;
将所述第四Stage输出的信息输入至所述第五Stage,以获得所述目标对象的整体轮廓信息,所述预设的网络为残差网络ResNet。
3.根据权利要求1所述的方法,其特征在于,所述根据所述整体轮廓信息及所述第四Stage输出的信息,确定所述目标对象的骨架各个部位躯干信息,包括:
根据所述整体轮廓信息,确定所述整体轮廓信息对应的特征图;
对所述整体轮廓信息对应的特征图进行上采样,得到上采样后的特征图;
将所述上采样后的特征图和所述第四Stage输出的信息输入至第一卷积层,得到所述目标对象的骨架各个部位躯干信息。
4.根据权利要求1所述的方法,其特征在于,所述根据所述骨架各个部位躯干信息和所述第三Stage输出的信息,确定所述骨架关键点坐标信息,包括:
将所述骨架各个部位躯干信息进行上采样,得到上采样后的关键点的信息;
将所述上采样后的关键点的信息和所述第三Stage输出的信息输入至第二卷积层,得到所述骨架关键点坐标信息。
5.根据权利要求1所述的方法,其特征在于,所述根据所述骨架关键点坐标信息和所述第二Stage输出的信息,确定所述目标对象的骨架的关键点,包括:
将所述骨架关键点坐标信息进行上采样,得到上采样后的坐标信息;
将所述上采样后的坐标信息和所述第二Stage输出的信息输入至第三卷积层,得到所述目标对象的骨架的关键点。
6.一种骨架的关键点估计装置,其特征在于,包括:
整体轮廓信息获得模块,用于将目标对象的图像输入至预设的网络,以获得所述目标对象的整体轮廓信息,所述预设的网络包括多个卷积阶段Stage,所述多个Stage包括第一Stage、第二Stage、第三Stage、第四Stage和第五Stage;
躯干信息确定模块,用于根据所述整体轮廓信息及所述第四Stage输出的信息,确定所述目标对象的骨架各个部位躯干信息;
坐标信息确定模块,用于根据所述骨架各个部位躯干信息和所述第三Stage输出的信息,确定所述骨架关键点坐标信息;
关键点确定模块,用于根据所述骨架关键点坐标信息和所述第二Stage输出的信息,确定所述目标对象的骨架的关键点。
7.根据权利要求6所述的装置,其特征在于,包括:
所述坐标信息确定模块,用于将所述骨架各个部位躯干信息进行上采样,得到上采样后的关键点的信息;将所述上采样后的关键点的信息和所述第三Stage输出的信息输入至第二卷积层,得到所述骨架关键点坐标信息。
8.根据权利要求6所述的装置,其特征在于,包括:
所述关键点确定模块,用于将所述骨架关键点坐标信息进行上采样,得到上采样后的坐标信息;将所述上采样后的坐标信息和所述第二Stage输出的信息输入至第三卷积层,得到所述目标对象的骨架的关键点。
9.一种电子设备,其特征在于,包括:处理器、存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于通过调用所述计算机程序,执行上述权利要求1-5中任一项所述的骨架的关键点估计方法。
10.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序用于被处理器执行时实现如权利要求1-5中任一项所述的骨架的关键点估计方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910543687.6A CN110263797B (zh) | 2019-06-21 | 2019-06-21 | 骨架的关键点估计方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910543687.6A CN110263797B (zh) | 2019-06-21 | 2019-06-21 | 骨架的关键点估计方法、装置、设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110263797A true CN110263797A (zh) | 2019-09-20 |
CN110263797B CN110263797B (zh) | 2022-07-12 |
Family
ID=67920297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910543687.6A Active CN110263797B (zh) | 2019-06-21 | 2019-06-21 | 骨架的关键点估计方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110263797B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107767419A (zh) * | 2017-11-07 | 2018-03-06 | 广州深域信息科技有限公司 | 一种人体骨骼关键点检测方法及装置 |
CN108229455A (zh) * | 2017-02-23 | 2018-06-29 | 北京市商汤科技开发有限公司 | 物体检测方法、神经网络的训练方法、装置和电子设备 |
CN108764039A (zh) * | 2018-04-24 | 2018-11-06 | 中国科学院遥感与数字地球研究所 | 神经网络、遥感影像的建筑物提取方法、介质及计算设备 |
CN109034215A (zh) * | 2018-07-09 | 2018-12-18 | 东北大学 | 一种基于深度卷积神经网络的安全帽佩戴检测方法 |
CN109886066A (zh) * | 2018-12-17 | 2019-06-14 | 南京理工大学 | 基于多尺度和多层特征融合的快速目标检测方法 |
CN109886986A (zh) * | 2019-01-23 | 2019-06-14 | 北京航空航天大学 | 一种基于多分支卷积神经网络的皮肤镜图像分割方法 |
-
2019
- 2019-06-21 CN CN201910543687.6A patent/CN110263797B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229455A (zh) * | 2017-02-23 | 2018-06-29 | 北京市商汤科技开发有限公司 | 物体检测方法、神经网络的训练方法、装置和电子设备 |
CN107767419A (zh) * | 2017-11-07 | 2018-03-06 | 广州深域信息科技有限公司 | 一种人体骨骼关键点检测方法及装置 |
CN108764039A (zh) * | 2018-04-24 | 2018-11-06 | 中国科学院遥感与数字地球研究所 | 神经网络、遥感影像的建筑物提取方法、介质及计算设备 |
CN109034215A (zh) * | 2018-07-09 | 2018-12-18 | 东北大学 | 一种基于深度卷积神经网络的安全帽佩戴检测方法 |
CN109886066A (zh) * | 2018-12-17 | 2019-06-14 | 南京理工大学 | 基于多尺度和多层特征融合的快速目标检测方法 |
CN109886986A (zh) * | 2019-01-23 | 2019-06-14 | 北京航空航天大学 | 一种基于多分支卷积神经网络的皮肤镜图像分割方法 |
Non-Patent Citations (2)
Title |
---|
AI深度视线专栏: "堆叠沙漏网络结构详解", 《CSDN博客HTTPS://BLOG.CSDN.NET/U013841196/ARTICLE/DETAILS/81048237》 * |
ALEJANDRO NEWELL等: "Stacked Hourglass Networks for Human Pose Estimation", 《ECCV 2016》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110263797B (zh) | 2022-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109375918A (zh) | 小程序的界面渲染方法、装置、电子设备和存储介质 | |
CN107919520B (zh) | 具有环形天线的电子装置 | |
US11012070B2 (en) | Electronic device and method thereof for grip recognition | |
CN109727301A (zh) | 生成动态壁纸的方法、装置、电子设备及存储介质 | |
CN109491742A (zh) | 页面表格渲染方法及装置 | |
CN110427150A (zh) | 应用程序的显示方法、装置、电子设备及计算机可读介质 | |
CN109684188A (zh) | 测试方法和装置 | |
CN109992732A (zh) | 信息分享方法、装置、电子设备及存储介质 | |
CN110209315A (zh) | 用户界面中字符的显示方法、装置、电子设备及存储介质 | |
CN109857971A (zh) | 页面渲染方法和装置 | |
CN110298851A (zh) | 人体分割神经网络的训练方法及设备 | |
CN110210501A (zh) | 虚拟对象生成方法、电子设备及计算机可读存储介质 | |
CN111324376B (zh) | 功能配置方法、装置、电子设备及计算机可读介质 | |
CN113052942B (zh) | 图表生成方法、装置、存储介质及电子设备 | |
CN109829431A (zh) | 用于生成信息的方法和装置 | |
CN109165723A (zh) | 用于处理数据的方法和装置 | |
CN110263797A (zh) | 骨架的关键点估计方法、装置、设备及可读存储介质 | |
CN113391860A (zh) | 服务请求处理方法、装置、电子设备及计算机存储介质 | |
CN109992733A (zh) | 信息分享的方法、装置、电子设备及存储介质 | |
CN109408387A (zh) | 页面测试方法及装置 | |
CN110162239A (zh) | 思维导图中的卡片折叠方法、装置、电子设备和存储介质 | |
CN110097471A (zh) | 用户信息处理方法、装置、电子设备及计算机存储介质 | |
CN109857503A (zh) | 页面交互效果自适应方法、装置与电子设备 | |
CN113343259B (zh) | 基于sm2的联合签名实现方法、装置、电子设备及存储介质 | |
CN109656659A (zh) | 行为事件的处理方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |