CN110827259A - 一种用于目标关键点检测的样本增广的方法与设备 - Google Patents

一种用于目标关键点检测的样本增广的方法与设备 Download PDF

Info

Publication number
CN110827259A
CN110827259A CN201911066831.8A CN201911066831A CN110827259A CN 110827259 A CN110827259 A CN 110827259A CN 201911066831 A CN201911066831 A CN 201911066831A CN 110827259 A CN110827259 A CN 110827259A
Authority
CN
China
Prior art keywords
image
sample
augmented
original sample
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911066831.8A
Other languages
English (en)
Other versions
CN110827259B (zh
Inventor
黄骏杰
朱政
黄冠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xinyi Intelligent Technology Co Ltd
Original Assignee
Shanghai Xinyi Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Xinyi Intelligent Technology Co Ltd filed Critical Shanghai Xinyi Intelligent Technology Co Ltd
Priority to CN201911066831.8A priority Critical patent/CN110827259B/zh
Publication of CN110827259A publication Critical patent/CN110827259A/zh
Application granted granted Critical
Publication of CN110827259B publication Critical patent/CN110827259B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请通过一种用于目标关键点检测的样本增广的方法,首先获取目标关键点检测的原始样本,所述原始样本由图像和与图像对应的目标关键点的标注信息构成,接着基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数,确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。通过该方法增广样本的图像与原始样本的图像可实现语义对齐,实现高精度样本增广。尤其适用于对于增广精度极其敏感的目标关键点检测类的算法。

Description

一种用于目标关键点检测的样本增广的方法与设备
技术领域
本申请涉及计算机图像处理技术领域,尤其涉及一种用于目标关键点检测的样本增广的技术。
背景技术
在计算机图像处理技术领域,通过样本增广操作,即通过对获取的样本做随机改变,来得到一系列相似但又不同的训练样本,从而扩大训练数据集的多样性。特别是对于基于深度学习的神经网络模型来说,增广操作可以降低神经网络模型对某些属性的依赖,从而提高神经网络模型模型的泛化能力。
现有的样本增广方法在操作过程中,由于算法设计的不合理性导致增广后样本和原有样本在语义层面上不对齐。这种样本增广所带来的误差会影响神经网络模型训练过程的收敛速度,同时也会影响神经网络模型在测试过程中的性能表现,尤其是对增广精度极其敏感的目标关键点检测算法的神经网络模型。
发明内容
为了解决上述问题,实现语义对齐的样本增广,本申请的目的是提供一种用于目标关键点检测的样本增广的方法与设备。
根据本申请的一个方面,提供了一种用于目标关键点检测的样本增广的方法,其中,所述方法包括:
获取目标关键点检测的原始样本,所述原始样本由图像和与图像对应的目标关键点的标注信息构成,其中,所述标注信息包括目标关键点相对于图像原点的单元值坐标;
基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数,确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。
优选地,所述所述单元值坐标是以单元为单位度量的坐标,其中,所述单元是两个相邻的图像像素之间的距离。
优选地,所述增广操作的参数至少包括以下各项:
对所述原始样本的图像增广操作获得的增广样本的图像的像素值尺寸;
所述增广样本的图像在原始样本的图像中对应区域的信息;
在所述增广操作中对所述原始样本的图像中对应区域进行旋转的角度。
优选地,所述增广样本的图像在原始样本的图像中对应区域的信息包括:
增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标;
以及增广样本的图像在原始样本的图像中对应区域的单元值尺寸。
优选地,所述增广样本的图像中像素点的灰度值和原始样本的图像中对应点的灰度值相同,所述增广样本的图像中像素点的灰度值的计算公式如下:
Figure BDA0002259636670000021
其中,(xt,yt)为增广样本的图像中像素点的单元值坐标;It(xt,yt)为增广样本的图像中的像素点(xt,yt)的灰度值;(xo,yo)为增广样本的图像中的像素点(xt,yt)在原始样本的图像中对应点的单元值坐标;Io(x,y)为原始样本的图像中像素点(x,y)处的灰度值;(xof,yof)为增广样本的图像中的像素点(xt,yt)在原始样本的图像中对应点坐标(xo,yo)向下取整后获得的单元值坐标。
优选地,所述增广样本的图像中的像素点在原始样本的图像中对应点的单元值坐标计算公式如下:
Figure BDA0002259636670000022
其中,(xt,yt)为增广样本的图像中的像素点的单元值坐标;(xo,yo)为增广样本的图像中的像素点(xt,yt)在原始样本的图像中对应点的单元值坐标;(wb,hb)为增广样本的图像在原始样本的图像中对应区域的单元值尺寸;(xb,yb)为增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标;(wt,ht)为增广样本的图像的像素值尺寸;θ为在增广操作中对所述原始样本的图像中对应区域进行旋转的角度。
优选地,所述原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标计算公式如下:
其中,(Xtk,Ytk)为原始样本的图像中已标注的目标关键点在增广样本的图像中对应关键点的单元值坐标;(wb,hb)为增广样本的图像在原始样本的图像中对应区域的单元值尺寸;(xb,yb)为增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标;(wt,ht)为增广样本的图像的像素值尺寸;θ为在增广操作中对所述原始样本的图像中对应区域进行旋转的角度;(Xok,Yok)为原始样本的图像中已标注的目标关键点的单元值坐标。
优选地,所述一种用于目标关键点检测的样本增广的方法还包括:
由所述目标关键点检测原始样本和对所述原始样本增广获得的增广样本组成训练样本集,用于训练目标关键点检测算法的神经网络模型。
与现有技术相比,本申请通过一种用于目标关键点检测的样本增广的方法,首先获取目标关键点检测的原始样本,所述原始样本由图像和与图像对应的目标关键点的标注信息构成,其中,所述标注信息包括目标关键点相对于图像原点的单元值坐标,接着基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数,确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。通过该方法增广样本的图像与原始样本的图像可实现语义对齐,实现高精度样本增广。尤其适用于对于增广精度极其敏感的目标关键点检测类的神经网络模型,获得的训练样本可大大加快相关神经网络模型的训练过程的收敛速度,同时基于此方法也可提升测试过程中算法的性能表现。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本申请一个方面的一种用于目标关键点检测的样本增广的方法流程图;
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
在本申请一个典型的配置中,系统各模块和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为更进一步阐述本申请所采取的技术手段及取得的效果,下面结合附图及优选实施例,对本申请的技术方案,进行清楚和完整的描述。
图1示出本申请一个方面的一种用于目标关键点检测的样本增广的方法流程图,其中,一个实施例的方法包括:
S11获取目标关键点检测的原始样本,所述原始样本由图像和与图像对应的目标关键点的标注信息构成,其中,所述标注信息包括目标关键点相对于图像原点的单元值坐标;
S12基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数,确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。
在本申请中,所述方法通过设备1执行,所述设备1为计算机设备和/或云,所述计算机设备包括但不限于个人计算机、笔记本电脑、工业计算机、网络主机、单个网络服务器、多个网络服务器集;所述云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。
在此,所述计算机设备和/或云仅为举例,其他现有的或者今后可能出现的设备和/或资源共享平台如适用于本申请也应包含在本申请的保护范围内,在此,以引用的方式包含于此。
在该实施例中,在所述步骤S11中,所述获取目标关键点检测的原始样本,所述原始样本由图像和与图像对应的目标关键点的标注信息构成,其中,所述标注信息包括目标关键点相对于图像原点的单元值坐标。
其中,当设备1获取到原始样本的图像,标识其中的目标关键点,结合目标关键点的像素坐标,标注目标关键点的单元值坐标。设备1获取到原始样本的方式可以是通过扫描、拍摄或网络,在此,其它获取方法如适用于本申请也应包含在本申请的保护范围内,本申请中不做限制。
优选地,所述所述单元值坐标是以单元为单位度量的坐标,其中,所述单元是两个相邻的图像像素之间的距离。
在连续的空间上,图像大小所占的空间可以用单元值尺寸来表示。图像在连续空间中每个维度上的单元数比像素数少1。
在该实施例中,在所述步骤S12中,所述基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数,确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。
优选地,所述增广操作的参数至少包括以下各项:
对所述原始样本的图像增广操作获得的增广样本的图像的像素值尺寸;所述增广样本的图像在原始样本的图像中对应区域的信息;在所述增广操作中对所述原始样本的图像中对应区域进行旋转的角度。
其中,所述增广操作可以是对原始样本的图像做裁剪、缩放、旋转等,其它增广方式也适用于本申请也应包含在本申请的保护范围内,本申请中不做限制。
例如,获取增广样本的图像的像素值尺寸(wt,ht),获取在所述增广操作中对所述原始样本的图像中对应区域进行旋转的角度θ。
优选地,所述增广样本的图像在原始样本的图像中对应区域的信息包括:增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标;以及增广样本的图像在原始样本的图像中对应区域的单元值尺寸。
例如,获取增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标(xb,yb),获取增广样本的图像在原始样本的图像中对应区域的单元值尺寸(wb,hb)。
优选地,所述增广样本的图像中像素点的灰度值和原始样本的图像中对应点的灰度值相同,所述增广样本的图像中像素点的灰度值的计算公式如下:
Figure BDA0002259636670000061
其中,(xt,yt)为增广样本的图像中像素点的单元值坐标;It(xt,yt)为增广样本的图像中的像素点(xt,yt)的灰度值;(xo,yo)为增广样本的图像中的像素点(xt,yt)在原始样本的图像中对应点的单元值坐标;Io(x,y)为原始样本的图像中像素点(x,y)处的灰度值;(xof,yof)为增广样本的图像中的像素点(xt,yt)在原始样本的图像中对应点坐标(xo,yo)向下取整后获得的单元值坐标。
其中,增广样本的图像中的像素点(xt,yt)在原始样本的图像中对应点(xo,yo)有可能不是原始样本的图像像素点,此种情况下,无法直接获取到Io(xo,yo),本申请采用上述双线性插值法来获取It(xt,yt)。在此,其它获取It(xt,yt)的方法如适用于本申请也应包含在本申请的保护范围内,本申请中不做限制。
优选地,所述增广样本的图像中的像素点在原始样本的图像中对应点的
Figure BDA0002259636670000071
单元值坐标计算公式如下:
其中,(xt,yt)为增广样本的图像中的像素点的单元值坐标;(xo,yo)为增广样本的图像中的像素点(xt,yt)在原始样本的图像中对应点的单元值坐标;(wb,hb)为增广样本的图像在原始样本的图像中对应区域的单元值尺寸;(xb,yb)为增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标;(wt,ht)为增广样本的图像的像素值尺寸;θ为在增广操作中对所述原始样本的图像中对应区域进行旋转的角度。
其中,所述增广样本的图像中的像素点(xt,yt)在原始样本的图像中对应点(xo,yo)有可能不是原始样本的图像像素点,其单元值坐标有可能不是整数值。
优选地,所述原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标计算公式如下:
Figure BDA0002259636670000072
其中,(Xtk,Ytk)为原始样本的图像中已标注的目标关键点在增广样本的图像中对应关键点的单元值坐标;(wb,hb)为增广样本的图像在原始样本的图像中对应区域的单元值尺寸;(xb,yb)为增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标;(wt,ht)为增广样本的图像的像素值尺寸;θ为在增广操作中对所述原始样本的图像中对应区域进行旋转的角度;(Xok,Yok)为原始样本的图像中已标注的目标关键点的单元值坐标。
其中,所述已标注的目标关键点可能不止一个,对于标注多个目标关键点,每一个原始样本的图像中已标注的目标关键点在增广样本的图像中对应关键点的单元值坐标都可以利用上述公式计算获得。
优选地,所述一种用于目标关键点检测的样本增广的方法还包括:
由所述目标关键点检测原始样本和对所述原始样本增广获得的增广样本组成训练样本集,用于训练目标关键点检测算法的神经网络模型。
其中,所述目标关键点检测算法的神经网络模型可以是现有的以HRNet神经网络作为主干的人体姿态估计网络模型,采用高斯分布的热图作为编码和解码的媒介,训练时将关键点坐标编码为热图,测试时将热图解码为关键点坐标,使用神经网络学习输入图像与热图之间的映射关系。在此,其它用于目标关键点检测算法的神经网络模型和关键点编码解码的媒介如适用于本申请也应包含在本申请的保护范围内,本申请中不做限制。
根据本申请的又一方面,还提供了一种计算机可读介质,所述计算机可读介质存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现前述方法。
根据本申请的又一方面,还提供了一种用于目标关键点检测的样本增广的设备,其中,该设备包括:
一个或多个处理器;以及存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如前述方法的操作。
例如,计算机可读指令在被执行时使所述一个或多个处理器:获取目标关键点检测的原始样本,所述原始样本由图像和与图像对应的目标关键点的标注信息构成,其中,所述标注信息包括目标关键点相对于图像原点的单元值坐标;基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数,确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (10)

1.一种用于目标关键点检测的样本增广的方法,其特征在于,所述方法包括:
获取目标关键点检测的原始样本,所述原始样本由图像和与图像对应的目标关键点的标注信息构成,其中,所述标注信息包括目标关键点相对于图像原点的单元值坐标;
基于所述原始样本的图像和目标关键点标注信息以及增广操作的参数,确定所述增广样本的图像的像素点的灰度值以及原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标。
2.根据权利要求1所述的方法,其特征在于,所述单元值坐标是以单元为单位度量的坐标,其中,所述单元是两个相邻的图像像素之间的距离。
3.根据权利要求1所述的方法,其特征在于,所述增广操作的参数至少包括以下各项:
对所述原始样本的图像增广操作获得的增广样本的图像的像素值尺寸;
所述增广样本的图像在原始样本的图像中对应区域的信息;
在所述增广操作中对所述原始样本的图像中对应区域进行旋转的角度。
4.根据权利要求3所述的方法,其特征在于,所述增广样本的图像在原始样本的图像中对应区域的信息包括:
增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标;
以及增广样本的图像在原始样本的图像中对应区域的单元值尺寸。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述增广样本的图像中像素点的灰度值和原始样本的图像中对应点的灰度值相同,所述增广样本的图像中像素点的灰度值的计算公式如下:
Figure FDA0002259636660000011
其中,(xt,yt)为增广样本的图像中像素点的单元值坐标;It(xt,yt)为增广样本的图像中的像素点(xt,yt)的灰度值;(xo,yo)为增广样本的图像中的像素点(xt,yt)在原始样本的图像中对应点的单元值坐标;Io(x,y)为原始样本的图像中像素点(x,y)处的灰度值;(xof,yof)为增广样本的图像中的像素点(xt,yt)在原始样本的图像中对应点坐标(xo,yo)向下取整后获得的单元值坐标。
6.根据权利要求5所述的方法,其特征在于,所述增广样本的图像中的像素点在原始样本的图像中对应点的单元值坐标计算公式如下:
Figure FDA0002259636660000021
其中,(xt,yt)为增广样本的图像中的像素点的单元值坐标;(xo,yo)为增广样本的图像中的像素点(xt,yt)在原始样本的图像中对应点的单元值坐标;(wb,hb)为增广样本的图像在原始样本的图像中对应区域的单元值尺寸;(xb,yb)为增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标;(wt,ht)为增广样本的图像的像素值尺寸;θ为在增广操作中对所述原始样本的图像中对应区域进行旋转的角度。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述原始样本的图像中已标注的目标关键点在增广样本的图像中对应的单元值坐标计算公式如下:
Figure FDA0002259636660000022
其中,(Xtk,Ytk)为原始样本的图像中已标注的目标关键点在增广样本的图像中对应关键点的单元值坐标;(wb,hb)为增广样本的图像在原始样本的图像中对应区域的单元值尺寸;(xb,yb)为增广样本的图像在原始样本的图像中对应区域的中心点的单元值坐标;(wt,ht)为增广样本的图像的像素值尺寸;θ为在增广操作中对所述原始样本的图像中对应区域进行旋转的角度;(Xok,Yok)为原始样本的图像中已标注的目标关键点的单元值坐标。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
由所述目标关键点检测原始样本和对所述原始样本增广获得的增广样本组成训练样本集,用于训练目标关键点检测算法的神经网络模型。
9.一种计算机可读介质,其中,
其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至8中任一项所述的方法。
10.一种用于目标关键点检测样本增广的设备,其中,该设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如权利要求1至8中任一项所述方法的操作。
CN201911066831.8A 2019-11-04 2019-11-04 一种用于目标关键点检测的样本增广的方法与设备 Active CN110827259B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911066831.8A CN110827259B (zh) 2019-11-04 2019-11-04 一种用于目标关键点检测的样本增广的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911066831.8A CN110827259B (zh) 2019-11-04 2019-11-04 一种用于目标关键点检测的样本增广的方法与设备

Publications (2)

Publication Number Publication Date
CN110827259A true CN110827259A (zh) 2020-02-21
CN110827259B CN110827259B (zh) 2021-05-14

Family

ID=69552787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911066831.8A Active CN110827259B (zh) 2019-11-04 2019-11-04 一种用于目标关键点检测的样本增广的方法与设备

Country Status (1)

Country Link
CN (1) CN110827259B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507389A (zh) * 2020-04-10 2020-08-07 上海眼控科技股份有限公司 一种用于天空云量探测的UNet分割网络的训练方法与设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130235079A1 (en) * 2011-08-26 2013-09-12 Reincloud Corporation Coherent presentation of multiple reality and interaction models
WO2014116412A1 (en) * 2013-01-28 2014-07-31 Cohen Gary M A system and method for providing augmented content
CN106127747A (zh) * 2016-06-17 2016-11-16 史方 基于深度学习的汽车表面损伤分类方法及装置
CN107153816A (zh) * 2017-04-16 2017-09-12 五邑大学 一种用于鲁棒人脸识别的数据增强方法
CN107977682A (zh) * 2017-12-19 2018-05-01 南京大学 基于极坐标变换数据增强的淋巴类细胞分类方法及其装置
CN108268860A (zh) * 2018-02-09 2018-07-10 重庆科技学院 一种基于卷积神经网络的天然气集输站设备图像分类方法
CN109166133A (zh) * 2018-07-14 2019-01-08 西北大学 基于关键点检测和深度学习的软组织器官图像分割方法
CN109685152A (zh) * 2018-12-29 2019-04-26 北京化工大学 一种基于dc-spp-yolo的图像目标检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130235079A1 (en) * 2011-08-26 2013-09-12 Reincloud Corporation Coherent presentation of multiple reality and interaction models
WO2014116412A1 (en) * 2013-01-28 2014-07-31 Cohen Gary M A system and method for providing augmented content
CN106127747A (zh) * 2016-06-17 2016-11-16 史方 基于深度学习的汽车表面损伤分类方法及装置
CN107153816A (zh) * 2017-04-16 2017-09-12 五邑大学 一种用于鲁棒人脸识别的数据增强方法
CN107977682A (zh) * 2017-12-19 2018-05-01 南京大学 基于极坐标变换数据增强的淋巴类细胞分类方法及其装置
CN108268860A (zh) * 2018-02-09 2018-07-10 重庆科技学院 一种基于卷积神经网络的天然气集输站设备图像分类方法
CN109166133A (zh) * 2018-07-14 2019-01-08 西北大学 基于关键点检测和深度学习的软组织器官图像分割方法
CN109685152A (zh) * 2018-12-29 2019-04-26 北京化工大学 一种基于dc-spp-yolo的图像目标检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MIN BEOM LEE等: "Conditional Generative Adversarial Network- Based Data Augmentation for Enhancement of Iris Recognition Accuracy", 《IEEE ACCESS》 *
王冉: "基于深度卷积神经网络的人体姿势估计研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111507389A (zh) * 2020-04-10 2020-08-07 上海眼控科技股份有限公司 一种用于天空云量探测的UNet分割网络的训练方法与设备

Also Published As

Publication number Publication date
CN110827259B (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
JP5261501B2 (ja) 不変の視覚場面及び物体の認識
CN111191649A (zh) 一种识别弯曲多行文本图像的方法与设备
CN113112509B (zh) 图像分割模型训练方法、装置、计算机设备和存储介质
WO2023035531A1 (zh) 文本图像超分辨率重建方法及其相关设备
CN112396640A (zh) 图像配准方法、装置、电子设备及存储介质
WO2022142550A1 (zh) 图像识别方法、装置和存储介质
CN111507406A (zh) 一种用于优化神经网络文本识别模型的方法与设备
CN114677596A (zh) 一种基于注意力模型的遥感图像船舶检测方法和装置
CN110827259B (zh) 一种用于目标关键点检测的样本增广的方法与设备
CN109190662A (zh) 一种基于关键点回归的车辆三维检测方法、系统、终端和存储介质
CN110209863B (zh) 用于相似图片检索的方法与设备
CN111950370A (zh) 动态环境下线拓展视觉里程计方法
US20230298374A1 (en) Method and device for determining picture with texts
CN112102404B (zh) 物体检测追踪方法、装置及头戴显示设备
CN113516697A (zh) 图像配准的方法、装置、电子设备及计算机可读存储介质
CN110956131B (zh) 单目标追踪方法、装置及系统
CN111898742A (zh) 一种用于监控神经网络模型训练状态的方法与设备
CN111898619A (zh) 图片特征提取方法、装置、计算机设备和可读存储介质
CN111062385A (zh) 一种用于图像文本信息检测的网络模型构建方法与系统
CN114494398B (zh) 倾斜目标的处理方法、装置、存储介质与处理器
WO2019024723A1 (zh) 特征点匹配结果处理方法和装置
CN108734164A (zh) 卡片、识别卡片的方法、绘本阅读机器人及存储设备
CN113392371A (zh) 一种椭圆范围框标注方式
KR102085334B1 (ko) 회전된 사물 인식 방법 및 장치
CN112102145A (zh) 图像处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 200331 room e176, 1f, 406 Gulang Road, Putuo District, Shanghai

Patentee after: Shanghai Xinyi Intelligent Technology Co.,Ltd.

Address before: 201800 7th floor, 137 Haining Road, Hongkou District, Shanghai

Patentee before: Shanghai Xinyi Intelligent Technology Co.,Ltd.