CN110827259A

CN110827259A - 一种用于目标关键点检测的样本增广的方法与设备

Info

Publication number: CN110827259A
Application number: CN201911066831.8A
Authority: CN
Inventors: 黄骏杰; 朱政; 黄冠
Original assignee: Shanghai Xinyi Intelligent Technology Co Ltd
Current assignee: Shanghai Xinyi Intelligent Technology Co Ltd
Priority date: 2019-11-04
Filing date: 2019-11-04
Publication date: 2020-02-21
Anticipated expiration: 2039-11-04
Also published as: CN110827259B

Abstract

本申请通过一种用于目标关键点检测的样本增广的方法，首先获取目标关键点检测的原始样本，所述原始样本由图像和与图像对应的目标关键点的标注信息构成，接着基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数，确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。通过该方法增广样本的图像与原始样本的图像可实现语义对齐，实现高精度样本增广。尤其适用于对于增广精度极其敏感的目标关键点检测类的算法。

Description

一种用于目标关键点检测的样本增广的方法与设备

技术领域

本申请涉及计算机图像处理技术领域，尤其涉及一种用于目标关键点检测的样本增广的技术。

背景技术

在计算机图像处理技术领域，通过样本增广操作，即通过对获取的样本做随机改变，来得到一系列相似但又不同的训练样本，从而扩大训练数据集的多样性。特别是对于基于深度学习的神经网络模型来说，增广操作可以降低神经网络模型对某些属性的依赖，从而提高神经网络模型模型的泛化能力。

现有的样本增广方法在操作过程中，由于算法设计的不合理性导致增广后样本和原有样本在语义层面上不对齐。这种样本增广所带来的误差会影响神经网络模型训练过程的收敛速度，同时也会影响神经网络模型在测试过程中的性能表现，尤其是对增广精度极其敏感的目标关键点检测算法的神经网络模型。

发明内容

为了解决上述问题，实现语义对齐的样本增广，本申请的目的是提供一种用于目标关键点检测的样本增广的方法与设备。

根据本申请的一个方面，提供了一种用于目标关键点检测的样本增广的方法，其中，所述方法包括：

获取目标关键点检测的原始样本，所述原始样本由图像和与图像对应的目标关键点的标注信息构成，其中，所述标注信息包括目标关键点相对于图像原点的单元值坐标；

基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数，确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。

优选地，所述所述单元值坐标是以单元为单位度量的坐标，其中，所述单元是两个相邻的图像像素之间的距离。

优选地，所述增广操作的参数至少包括以下各项：

对所述原始样本的图像增广操作获得的增广样本的图像的像素值尺寸；

所述增广样本的图像在原始样本的图像中对应区域的信息；

在所述增广操作中对所述原始样本的图像中对应区域进行旋转的角度。

优选地，所述增广样本的图像在原始样本的图像中对应区域的信息包括：

增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标；

以及增广样本的图像在原始样本的图像中对应区域的单元值尺寸。

优选地，所述增广样本的图像中像素点的灰度值和原始样本的图像中对应点的灰度值相同，所述增广样本的图像中像素点的灰度值的计算公式如下：

其中，(x_t，y_t)为增广样本的图像中像素点的单元值坐标；I_t(x_t，y_t)为增广样本的图像中的像素点(x_t，y_t)的灰度值；(x_o，y_o)为增广样本的图像中的像素点(x_t，y_t)在原始样本的图像中对应点的单元值坐标；I_o(x，y)为原始样本的图像中像素点(x，y)处的灰度值；(x_of，y_of)为增广样本的图像中的像素点(x_t，y_t)在原始样本的图像中对应点坐标(x_o，y_o)向下取整后获得的单元值坐标。

优选地，所述增广样本的图像中的像素点在原始样本的图像中对应点的单元值坐标计算公式如下：

其中，(x_t，y_t)为增广样本的图像中的像素点的单元值坐标；(x_o，y_o)为增广样本的图像中的像素点(x_t，y_t)在原始样本的图像中对应点的单元值坐标；(w_b，h_b)为增广样本的图像在原始样本的图像中对应区域的单元值尺寸；(x_b，y_b)为增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标；(w_t，h_t)为增广样本的图像的像素值尺寸；θ为在增广操作中对所述原始样本的图像中对应区域进行旋转的角度。

优选地，所述原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标计算公式如下：

其中，(X_tk，Y_tk)为原始样本的图像中已标注的目标关键点在增广样本的图像中对应关键点的单元值坐标；(w_b，h_b)为增广样本的图像在原始样本的图像中对应区域的单元值尺寸；(x_b，y_b)为增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标；(w_t，h_t)为增广样本的图像的像素值尺寸；θ为在增广操作中对所述原始样本的图像中对应区域进行旋转的角度；(X_ok，Y_ok)为原始样本的图像中已标注的目标关键点的单元值坐标。

优选地，所述一种用于目标关键点检测的样本增广的方法还包括：

由所述目标关键点检测原始样本和对所述原始样本增广获得的增广样本组成训练样本集，用于训练目标关键点检测算法的神经网络模型。

与现有技术相比，本申请通过一种用于目标关键点检测的样本增广的方法，首先获取目标关键点检测的原始样本，所述原始样本由图像和与图像对应的目标关键点的标注信息构成，其中，所述标注信息包括目标关键点相对于图像原点的单元值坐标，接着基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数，确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。通过该方法增广样本的图像与原始样本的图像可实现语义对齐，实现高精度样本增广。尤其适用于对于增广精度极其敏感的目标关键点检测类的神经网络模型，获得的训练样本可大大加快相关神经网络模型的训练过程的收敛速度，同时基于此方法也可提升测试过程中算法的性能表现。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1示出根据本申请一个方面的一种用于目标关键点检测的样本增广的方法流程图；

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

在本申请一个典型的配置中，系统各模块和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

为更进一步阐述本申请所采取的技术手段及取得的效果，下面结合附图及优选实施例，对本申请的技术方案，进行清楚和完整的描述。

图1示出本申请一个方面的一种用于目标关键点检测的样本增广的方法流程图，其中，一个实施例的方法包括：

S11获取目标关键点检测的原始样本，所述原始样本由图像和与图像对应的目标关键点的标注信息构成，其中，所述标注信息包括目标关键点相对于图像原点的单元值坐标；

S12基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数，确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。

在本申请中，所述方法通过设备1执行，所述设备1为计算机设备和/或云，所述计算机设备包括但不限于个人计算机、笔记本电脑、工业计算机、网络主机、单个网络服务器、多个网络服务器集；所述云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个虚拟超级计算机。

在此，所述计算机设备和/或云仅为举例，其他现有的或者今后可能出现的设备和/或资源共享平台如适用于本申请也应包含在本申请的保护范围内，在此，以引用的方式包含于此。

在该实施例中，在所述步骤S11中，所述获取目标关键点检测的原始样本，所述原始样本由图像和与图像对应的目标关键点的标注信息构成，其中，所述标注信息包括目标关键点相对于图像原点的单元值坐标。

其中，当设备1获取到原始样本的图像，标识其中的目标关键点，结合目标关键点的像素坐标，标注目标关键点的单元值坐标。设备1获取到原始样本的方式可以是通过扫描、拍摄或网络，在此，其它获取方法如适用于本申请也应包含在本申请的保护范围内，本申请中不做限制。

在连续的空间上，图像大小所占的空间可以用单元值尺寸来表示。图像在连续空间中每个维度上的单元数比像素数少1。

在该实施例中，在所述步骤S12中，所述基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数，确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。

优选地，所述增广操作的参数至少包括以下各项：

对所述原始样本的图像增广操作获得的增广样本的图像的像素值尺寸；所述增广样本的图像在原始样本的图像中对应区域的信息；在所述增广操作中对所述原始样本的图像中对应区域进行旋转的角度。

其中，所述增广操作可以是对原始样本的图像做裁剪、缩放、旋转等，其它增广方式也适用于本申请也应包含在本申请的保护范围内，本申请中不做限制。

例如，获取增广样本的图像的像素值尺寸(w_t，h_t)，获取在所述增广操作中对所述原始样本的图像中对应区域进行旋转的角度θ。

优选地，所述增广样本的图像在原始样本的图像中对应区域的信息包括：增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标；以及增广样本的图像在原始样本的图像中对应区域的单元值尺寸。

例如，获取增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标(x_b，y_b)，获取增广样本的图像在原始样本的图像中对应区域的单元值尺寸(w_b，h_b)。

其中，增广样本的图像中的像素点(x_t，y_t)在原始样本的图像中对应点(x_o，y_o)有可能不是原始样本的图像像素点，此种情况下，无法直接获取到I_o(x_o，y_o)，本申请采用上述双线性插值法来获取I_t(x_t，y_t)。在此，其它获取I_t(x_t，y_t)的方法如适用于本申请也应包含在本申请的保护范围内，本申请中不做限制。

优选地，所述增广样本的图像中的像素点在原始样本的图像中对应点的

单元值坐标计算公式如下：

其中，所述增广样本的图像中的像素点(x_t，y_t)在原始样本的图像中对应点(x_o，y_o)有可能不是原始样本的图像像素点，其单元值坐标有可能不是整数值。

其中，所述已标注的目标关键点可能不止一个，对于标注多个目标关键点，每一个原始样本的图像中已标注的目标关键点在增广样本的图像中对应关键点的单元值坐标都可以利用上述公式计算获得。

其中，所述目标关键点检测算法的神经网络模型可以是现有的以HRNet神经网络作为主干的人体姿态估计网络模型，采用高斯分布的热图作为编码和解码的媒介，训练时将关键点坐标编码为热图，测试时将热图解码为关键点坐标，使用神经网络学习输入图像与热图之间的映射关系。在此，其它用于目标关键点检测算法的神经网络模型和关键点编码解码的媒介如适用于本申请也应包含在本申请的保护范围内，本申请中不做限制。

根据本申请的又一方面，还提供了一种计算机可读介质，所述计算机可读介质存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现前述方法。

根据本申请的又一方面，还提供了一种用于目标关键点检测的样本增广的设备，其中，该设备包括：

一个或多个处理器；以及存储有计算机可读指令的存储器，所述计算机可读指令在被执行时使所述处理器执行如前述方法的操作。

例如，计算机可读指令在被执行时使所述一个或多个处理器：获取目标关键点检测的原始样本，所述原始样本由图像和与图像对应的目标关键点的标注信息构成，其中，所述标注信息包括目标关键点相对于图像原点的单元值坐标；基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数，确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

1.一种用于目标关键点检测的样本增广的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述单元值坐标是以单元为单位度量的坐标，其中，所述单元是两个相邻的图像像素之间的距离。

3.根据权利要求1所述的方法，其特征在于，所述增广操作的参数至少包括以下各项：

所述增广样本的图像在原始样本的图像中对应区域的信息；

4.根据权利要求3所述的方法，其特征在于，所述增广样本的图像在原始样本的图像中对应区域的信息包括：

5.根据权利要求1至4中任一项所述的方法，其特征在于，所述增广样本的图像中像素点的灰度值和原始样本的图像中对应点的灰度值相同，所述增广样本的图像中像素点的灰度值的计算公式如下：

6.根据权利要求5所述的方法，其特征在于，所述增广样本的图像中的像素点在原始样本的图像中对应点的单元值坐标计算公式如下：

7.根据权利要求1至6中任一项所述的方法，其特征在于，所述原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标计算公式如下：

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

9.一种计算机可读介质，其中，

其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现如权利要求1至8中任一项所述的方法。

10.一种用于目标关键点检测样本增广的设备，其中，该设备包括：

一个或多个处理器；以及

存储有计算机可读指令的存储器，所述计算机可读指令在被执行时使所述处理器执行如权利要求1至8中任一项所述方法的操作。