CN108021901A - 图像处理的方法、装置及计算机可读存储介质 - Google Patents

图像处理的方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN108021901A
CN108021901A CN201711368804.7A CN201711368804A CN108021901A CN 108021901 A CN108021901 A CN 108021901A CN 201711368804 A CN201711368804 A CN 201711368804A CN 108021901 A CN108021901 A CN 108021901A
Authority
CN
China
Prior art keywords
image
target point
detected
bounding box
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711368804.7A
Other languages
English (en)
Inventor
张水发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201711368804.7A priority Critical patent/CN108021901A/zh
Publication of CN108021901A publication Critical patent/CN108021901A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本公开涉及一种图像处理的方法、装置及计算机可读存储介质,以解决相关技术中难以精准地获取图像中物体位置的技术问题。该方法包括:标记样本图像中目标点的位置,所述目标点的位置至少包括回归角度、包围所述目标点的包围盒的宽度、高度及所述包围盒中心点的坐标,所述回归角度为所述包围盒的长边与坐标系中各个坐标轴的角度中的最小角度;将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,得到图像目标点定位模型;将待检测图像输入所述图像目标点定位模型进行检测,以获取所述待检测图像的目标点的位置。

Description

图像处理的方法、装置及计算机可读存储介质
技术领域
本公开涉及通信领域,具体地,涉及一种图像处理的方法、装置及计算机可读存储介质。
背景技术
相关技术中,对于图像中物体的检测一般包含两类回归:类别回归和位置回归,所述类别回归是指预测物体的类别,所述位置回归是指预测物体所处的位置。其中,所述位置回归只给出了横平竖直的矩形框,即包围物体的包围盒,但是位置回归难以很精准地获取图像中物体的位置。
发明内容
为克服相关技术中存在的问题,本公开提供一种图像处理的方法、装置及计算机可读存储介质。
根据本公开实施例的第一方面,提供一种图像处理的方法,所述方法包括:
标记样本图像中目标点的位置,所述目标点的位置至少包括回归角度、包围所述目标点的包围盒的宽度、高度及所述包围盒中心点的坐标,所述回归角度为所述包围盒的长边与坐标系中各个坐标轴的角度中的最小角度;
将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,得到图像目标点定位模型;
将待检测图像输入所述图像目标点定位模型进行检测,以获取所述待检测图像的目标点的位置。
采用上述图像处理的方法,本公开可以在类别回归和位置回归的基础上,通过增加角度的回归训练,即在标记样本图像中目标点的位置时,增加了回归角度的因素,因此获得的图像目标点定位模型能够得到更加准确的目标点的角度,进而能够减少包围盒包围的无关区域,当待检测图像输入所述图像目标点定位模型进行检测时,可以更加精准地获取所述待检测图像的目标点的位置,解决了相关技术中难以精准地获取图像中物体位置的技术问题。
结合第一方面,在第一方面的第一种可能的实现方式中,在获取所述待检测图像的目标点的位置后,所述方法还包括:根据所述待检测图像的目标点的位置,对所述待检测图像的目标点进行美化处理。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述对所述待检测图像的目标点进行美化处理,包括:根据所述待检测图像的目标点的位置,确定包围该目标点的包围盒所在的区域图像;计算所述区域图像的像素在HSV(Hue,Saturation,Value;色调,饱和度,明度)空间中的色调分量、饱和度分量和明度分量的均值;获取包含所述区域图像但面积大于所述区域图像的对比区域图像;计算所述对比区域图像的像素在HSV空间中的色调分量、饱和度分量和明度分量的均值;调整所述区域图像的像素的色调分量、饱和度分量和明度分量,以使所述区域图像的像素的色调分量、饱和度分量和明度分量的均值与所述对比区域图像的均值一致。
结合第一方面的第一种可能的实现方式,在第一方面的第三种可能的实现方式中,所述调整所述区域图像的像素的色调分量、饱和度分量和明度分量之后,还包括:对所述脸部图像进行平滑处理。
结合第一方面的第一种可能的实现方式,在第一方面的第四种可能的实现方式中,所述将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,包括:将所述样本图像输入区域建议网络中,以输出带有回归角度的包围盒;将所述带有回归角度的包围盒输入Faster R-CNN中的roi-pooling层以进行池化;将池化后的包围盒输入Faster R-CNN中的全连接层,以使Faster R-CNN进行回归训练,得到图像目标点定位模型。
结合第一方面的第一种可能的实现方式,在第一方面的第五种可能的实现方式中,所述样本图像和所述待检测图像包括人脸图像或者文字图像,所述目标点包括疤痕、痣、皱纹、胎记或倾斜文字。
根据本公开实施例的第二方面,提供一种图像处理的装置,所述装置包括:
标记模块,被配置为标记样本图像中目标点的位置,所述目标点的位置至少包括回归角度、包围所述目标点的包围盒的宽度、高度及所述包围盒中心点的坐标,所述回归角度为所述包围盒的长边与坐标系中各个坐标轴的角度中的最小角度;
获取模块,被配置为将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,得到图像目标点定位模型;以及
检测模块,被配置为将待检测图像输入所述图像目标点定位模型进行检测,以获取所述待检测图像的目标点的位置。
结合第二方面,在第二方面的第一种可能的实现方式中,还包括:
美化模块,被配置为在获取所述待检测图像的目标点的位置后,根据所述待检测图像的目标点的位置,对所述待检测图像的目标点进行美化处理。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述美化模块还包括:确定子模块,被配置为根据所述待检测图像的目标点的位置,确定包围该目标点的包围盒所在的区域图像;第一计算子模块,被配置为计算所述区域图像的像素在HSV空间中的色调分量、饱和度分量和明度分量的均值;获取子模块,被配置为获取包含所述区域图像但面积大于所述区域图像的对比区域图像;第二计算子模块,被配置为计算所述对比区域图像的像素在HSV空间中的色调分量、饱和度分量和明度分量的均值;以及调整子模块,被配置为调整所述区域图像的像素的色调分量、饱和度分量和明度分量,以使所述区域图像的像素的色调分量、饱和度分量和明度分量的均值与所述对比区域图像的均值一致。
结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式中,所述美化模块还包括:处理子模块,被配置为在调整所述区域图像的像素的色调分量、饱和度分量和明度分量之后,对所述脸部图像进行平滑处理。
结合第二方面,在第二方面的第四种可能的实现方式中,所述获取模块包括:第一输入子模块,被配置为将所述样本图像输入区域建议网络中,以输出带有回归角度的包围盒;第二输入子模块,被配置为将所述带有回归角度的包围盒输入Faster R-CNN中的roi-pooling层以进行池化;以及获得子模块,被配置为将池化后的包围盒输入Faster R-CNN中的全连接层,以使Faster R-CNN进行回归训练,得到图像目标点定位模型。
结合第二方面,在第二方面的第五种可能的实现方式中,所述样本图像和所述待检测图像包括人脸图像或者文字图像,所述目标点包括疤痕、痣、皱纹、胎记或倾斜文字。
根据本公开实施例的第三方面,提供一种图像处理的装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
标记样本图像中目标点的位置,所述目标点的位置至少包括回归角度、包围所述目标点的包围盒的宽度、高度及所述包围盒中心点的坐标,所述回归角度为所述包围盒的长边与坐标系中各个坐标轴的角度中的最小角度;
将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,得到图像目标点定位模型;
将待检测图像输入所述图像目标点定位模型进行检测,以获取所述待检测图像的目标点的位置。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的图像处理的方法的步骤。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据一示例性实施例示出的一种图像处理的方法的流程图。
图2是本公开根据一示例性实施例示出的一种带有疤痕的人脸图像的示意图。
图3是图2中包围盒在坐标系中的示意图。
图4是根据一示例性实施例示出的一种图像处理的方法包括的步骤中进行回归训练的流程图。
图5是根据另一示例性实施例示出的一种图像处理的方法的流程图。
图6是图5中包括的步骤中对待检测图像的目标点进行美化处理的流程图。
图7是根据一示例性实施例示出的一种图像处理的装置的获取模块的框图。
图8是图7中获取模块的框图。
图9是根据另一示例性实施例示出的一种图像处理的装置的框图。
图10是图9中美化模块的框图。
图11是根据一示例性实施例示出的一种图像处理的装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种图像处理的方法的流程图,以解决相关技术中难以精准地获取图像中物体位置的技术问题。如图1所示,该方法可以包括以下步骤。
步骤S11,标记样本图像中目标点的位置,所述目标点的位置至少包括回归角度、包围所述目标点的包围盒的宽度、高度及所述包围盒中心点的坐标,所述回归角度为所述包围盒的长边与坐标系中各个坐标轴的角度中的最小角度。
所述样本图像可以是预先搜集的大量的样本图像,所述目标点可以为所述样本图像中呈现的物体或物体中的局部特征。比如,所述样本图像可以是道路实时图像,所述目标点可以是所述道路实时图像中的车辆或行人;所述样本图像也可以是人脸图像,所述目标点可以是所述人脸图像中人脸上的疤痕、痣、皱纹和胎记中的至少一种;所述样本图像也可以是文字图像,所述目标点可以是所述文字图像中的倾斜文字。
在搜集所述样本图像后,对所述样本图像中目标点的位置进行标记,在标记时,需要先将包围盒包围目标点;在包围盒包围目标点后,标记所述包围盒的位置。所述位置不仅包括包围盒在坐标系中的宽度和高度以及所述包围盒中心点在坐标系中的坐标,还包括回归角度。其中,所述回归角度为所述包围盒的长边与坐标系中各个坐标轴的角度中的最小角度。
所述样本图像中目标点的位置标记后,执行步骤S12。
步骤S12,将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,得到图像目标点定位模型。
其中,所述训练模型可以是根据随机梯度下降法设计的训练模型。将所述样本图像输入训练模型后,所述训练模型可以根据所述目标点对所述样本图像的目标点位置进行回归训练,得到图像目标点定位模型。
获取所述图像目标点定位模型后,执行步骤S13。
步骤S13,将待检测图像输入所述图像目标点定位模型进行检测,以获取所述待检测图像的目标点的位置。
相关技术中,当目标点为不规则形状时,包围该目标点的包围盒会包围很多与目标点无关的无关区域,进而难以很精准地获取图像中目标点的位置。而本公开可以在类别回归和位置回归的基础上,通过增加角度的回归训练,即在标记样本图像中目标点的位置时,增加了回归角度的因素,因此获得的图像目标点定位模型能够得到更加准确的目标点的角度,进而能够减少包围盒包围的无关区域,当待检测图像输入所述图像目标点定位模型进行检测时,可以更加精准地获取所述待检测图像的目标点的位置,解决了相关技术中难以精准地获取图像中物体位置的技术问题。
举例来讲,如图2和图3所示,以人脸图像为样本图像,人脸上的疤痕10为目标点。在搜集到人脸图像后,将包围盒11包围疤痕10。然后,对疤痕10的位置进行标记,即标记包围盒11的五元组(x,y,w,h,angle)。其中,x为包围盒11的中心点110在坐标系中的横坐标,y为包围盒11的中心点110在坐标系中的纵坐标,w为包围盒11的宽度,h为包围盒11的高度,angle为回归角度,即包围盒11的长边与坐标系中各个坐标轴的角度中的最小角度。在图3中,包围盒11的长边与坐标系中的X轴的角度为L1,包围盒11的长边与坐标系中的Y轴的角度为L2,假设L1小于L2,则angle为L1。接着,将人脸图像输入训练模型,所述训练模型根据包围盒11的五元组(x,y,w,h,angle)进行回归训练,得到疤痕定位模型。然后,将待检测人脸图像输入疤痕定位模型,所述疤痕定位模型对所述待检测人脸图像检测后,输出检测人脸图像中的疤痕位置。
在图像美颜中,对于疤痕的美化,需要先检测出疤痕的位置,但是疤痕通常是不规则的图形,常用的物体检测得到的包围盒除了包围疤痕外,还包围了许多无关区域。而在本公开中,在对疤痕的位置进行标记时,加入了回归角度的因素,因此获得的疤痕定位模型可以得到更加准确的疤痕的角度,即可以得到更加准确的疤痕位置。
当目标点是图像中的不规则形状时,比如,对于所述目标点是文字图像中的倾斜文字,同一张文字图像中,可能同时存在角度相差很大的倾斜文字,此时,在进行回归训练时,一次角度回归的训练得到的角度可能存在偏差。为了解决回归训练得到的角度可能存在偏差的问题,可以通过级联区域建议网络进行回归训练,如图4所示,所述将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,可以包括以下步骤。
步骤S121,将所述样本图像输入区域建议网络中,以输出带有回归角度的包围盒。
步骤S122,将所述带有回归角度的包围盒输入Faster R-CNN中的roi-pooling层以进行池化。
步骤S123,将池化后的包围盒输入Faster R-CNN中的全连接层,以使Faster R-CNN进行回归训练,得到图像目标点定位模型。
本公开基于Faster R-CNN(区域的卷积神经网络)检测框架,首先,在RPN(RegionProposal Network;区域建议网络)中加入角度回归,即将标记有回归角度的样本图像输入RPN中进行第一次回归训练;接着,RPN回归训练后,输出带有回归角度的包围盒;RPN会将带有回归角度的包围盒输入到Faster R-CNN中的roi-pooling(兴趣区域池化)层,roi-pooling层对到带角度的包围盒进行池化后,得到带角度的区域建议(即池化后的包围盒);然后,将池化后的包围盒输入Faster R-CNN中的全连接层,Faster R-CNN进行回归训练后,得到图像目标点定位模型。
通过级联区域建议网络进行回归训练,可以使得图像目标点定位模型能够对图像中的不规则形状的角度进行检测,特别是文字图像中的不同倾斜文字的角度相差很大时,也可以进行检测。
图5是根据另一示例性实施例示出的一种图像处理的方法的流程图。如图5所示,该方法可以包括以下步骤。
步骤S41,标记样本图像中目标点的位置,所述目标点的位置至少包括回归角度、包围所述目标点的包围盒的宽度、高度及所述包围盒中心点的坐标,所述回归角度为所述包围盒的长边与坐标系中各个坐标轴的角度中的最小角度。
步骤S42,将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,得到图像目标点定位模型。
步骤S43,将待检测图像输入所述图像目标点定位模型进行检测,以获取所述待检测图像的目标点的位置。
步骤S44,根据所述待检测图像的目标点的位置,对所述待检测图像的目标点进行美化处理。
当所述图像目标点定位模型输出所述待检测图像的目标点的位置后,可以对所述待检测图像进行美化,比如,可以消除所述待检测图像的目标点,也可以对所述待检测图像的目标点进行颜色填充等处理。对此,本公开不作具体限定。
接下来,当美化处理是消除待检测图像的目标点时,可以参照图6,图6是图5中包括的步骤中对待检测图像的目标点进行美化处理的流程图。如图6所示,所述对所述待检测图像的目标点进行美化处理,可以包括以下步骤。
步骤S441,根据所述待检测图像的目标点的位置,确定包围该目标点的包围盒所在的区域图像。
步骤S442,计算所述区域图像的像素在HSV空间中的色调分量、饱和度分量和明度分量的均值。
步骤S443,获取包含所述区域图像但面积大于所述区域图像的对比区域图像。
其中,所述对比区域图像可以是包围该目标点的包围盒在按照预设比例向外扩张得到的区域图像。
步骤S444,计算所述对比区域图像的像素在HSV空间中的色调分量、饱和度分量和明度分量的均值。
步骤S445,调整所述区域图像的像素的色调分量、饱和度分量和明度分量,以使所述区域图像的像素的色调分量、饱和度分量和明度分量的均值与所述对比区域图像的均值一致。
步骤S446,对所述脸部图像进行平滑滤波处理,以消除美化的痕迹。
采用上述图像处理的方法,本公开可以在类别回归和位置回归的基础上,通过增加角度的回归训练,即在标记样本图像中目标点的位置时,增加了回归角度的因素,当待检测图像输入图像目标点定位模型进行检测时,可以更加精准地获取所述待检测图像的目标点的位置,减少了包围盒包围的无关区域,进而能够针对目标点进行美化,并在美化时减少对无关区域的影响。
举例来讲,如图2和图3所示,以人脸图像为待检测图像,人脸上的疤痕为目标点。为了对图2中待检测人脸图像的疤痕10进行美化,将大量作为样本的人脸图像输入训练模型,所述训练模型根据包围盒的五元组(x,y,w,h,angle)进行回归训练,得到图像疤痕定位模型后,将待检测人脸图像输入图像疤痕定位模型,所述图像疤痕定位模型对所述待检测人脸图像检测后,输出检测人脸图像中的疤痕10的位置(x,y,w,h,angle)。接着,根据疤痕10的位置(x,y,w,h,angle),确定包围疤痕10的包围盒11所在的区域图像;然后,计算包围盒11所在的区域图像在HSV空间中的色调分量、饱和度分量和明度分量的均值;接着,将包围盒11按照预设比例向外扩张得到对比包围盒12;然后,计算对比包围盒12所在的对比区域图像在HSV空间中的色调分量、饱和度分量和明度分量的均值;接着,调整包围盒11所在的区域图像像素的色调分量、饱和度分量和明度分量,进而使得包围盒11所在的区域图像像素的色调分量、饱和度分量和明度分量的均值与对比包围盒11所在的对比区域图像像素的色调分量、饱和度分量和明度分量的均值一致。最后,为了消除美化的痕迹,可以对所述脸部图像进行平滑处理。
采用上述对疤痕美化的方法,在对疤痕的位置进行标记时,加入了回归角度的因素,因此,当待检测人脸图像输入疤痕定位模型进行检测时,可以得到更加准确的疤痕的角度,即可以得到更加准确的疤痕位置,进而能够针对疤痕进行美化,并在美化时减少对无关区域的影响。
图7是根据一示例性实施例示出的一种图像处理的装置的框图。如图7所示,所述图像处理的装置600可以包括:
标记模块610,被配置为标记样本图像中目标点的位置,所述目标点的位置至少包括回归角度、包围所述目标点的包围盒的宽度、高度及所述包围盒中心点的坐标,所述回归角度为所述包围盒的长边与坐标系中各个坐标轴的角度中的最小角度;
获取模块620,被配置为将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,得到图像目标点定位模型;以及
检测模块630,被配置为将待检测图像输入所述图像目标点定位模型进行检测,以获取所述待检测图像的目标点的位置。
可选地,如图8所示,所述获取模块620可以包括:
第一输入子模块621,被配置为将所述样本图像输入区域建议网络中,以输出带有回归角度的包围盒;
第二输入子模块622,被配置为将所述带有回归角度的包围盒输入Faster R-CNN中的roi-pooling层以进行池化;以及
获得子模块623,被配置为将池化后的包围盒输入Faster R-CNN中的全连接层,以使Faster R-CNN进行回归训练,得到图像目标点定位模型。
可选地,如图9所示,所述图像处理的装置600还可以包括:
美化模块640,被配置为在获取所述待检测图像的目标点的位置后,根据所述待检测图像的目标点的位置,对所述待检测图像的目标点进行美化处理。
可选地,如图10所示,所述美化模块640可以包括:
确定子模块641,被配置为根据所述待检测图像的目标点的位置,确定包围该目标点的包围盒所在的区域图像;
第一计算子模块642,被配置为计算所述区域图像的像素在HSV空间中的色调分量、饱和度分量和明度分量的均值;
获取子模块643,被配置为获取包含所述区域图像但面积大于所述区域图像的对比区域图像;
第二计算子模块644,被配置为计算所述对比区域图像的像素在HSV空间中的色调分量、饱和度分量和明度分量的均值;以及
调整子模块645,被配置为调整所述区域图像的像素的色调分量、饱和度分量和明度分量,以使所述区域图像的像素的色调分量、饱和度分量和明度分量的均值与所述对比区域图像的均值一致。
可选地,如图10所示,所述美化模块640还可以包括:
处理子模块646,被配置为在调整所述区域图像的像素的色调分量、饱和度分量和明度分量之后,对所述脸部图像进行平滑处理。
可选地,所述样本图像和所述待检测图像为人脸图像或者文字图像,所述目标点包括疤痕、痣、皱纹、胎记或倾斜文字。
值得说明的是,以上对图像处理的装置的模块划分是一种逻辑功能划分,实际实现时可以有另外的划分方式。并且,上述各功能模块的物理实现也可能有多种实现方式。
并且,关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图11是根据一示例性实施例示出的另一种图像处理的装置800的框图。例如,装置800可以是移动电话,计算机,平板设备等。
参照图11,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述图像处理的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图像处理的方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述图像处理的方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (14)

1.一种图像处理的方法,其特征在于,所述方法包括:
标记样本图像中目标点的位置,所述目标点的位置至少包括回归角度、包围所述目标点的包围盒的宽度、高度及所述包围盒中心点的坐标,所述回归角度为所述包围盒的长边与坐标系中各个坐标轴的角度中的最小角度;
将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,得到图像目标点定位模型;
将待检测图像输入所述图像目标点定位模型进行检测,以获取所述待检测图像的目标点的位置。
2.根据权利要求1所述的方法,其特征在于,在获取所述待检测图像的目标点的位置后,所述方法还包括:
根据所述待检测图像的目标点的位置,对所述待检测图像的目标点进行美化处理。
3.根据权利要求2所述的方法,其特征在于,所述对所述待检测图像的目标点进行美化处理,包括:
根据所述待检测图像的目标点的位置,确定包围该目标点的包围盒所在的区域图像;
计算所述区域图像的像素在HSV空间中的色调分量、饱和度分量和明度分量的均值;
获取包含所述区域图像但面积大于所述区域图像的对比区域图像;
计算所述对比区域图像的像素在HSV空间中的色调分量、饱和度分量和明度分量的均值;
调整所述区域图像的像素的色调分量、饱和度分量和明度分量,以使所述区域图像的像素的色调分量、饱和度分量和明度分量的均值与所述对比区域图像的均值一致。
4.根据权利要求3所述的方法,其特征在于,所述调整所述区域图像的像素的色调分量、饱和度分量和明度分量之后,还包括:
对所述脸部图像进行平滑处理。
5.根据权利要求1所述的方法,其特征在于,所述将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,包括:
将所述样本图像输入区域建议网络中,以输出带有回归角度的包围盒;
将所述带有回归角度的包围盒输入Faster R-CNN中的roi-pooling层以进行池化;
将池化后的包围盒输入Faster R-CNN中的全连接层,以使Faster R-CNN进行回归训练,得到图像目标点定位模型。
6.根据权利要求1所述的方法,其特征在于,所述样本图像和所述待检测图像包括人脸图像或者文字图像,所述目标点包括疤痕、痣、皱纹、胎记或倾斜文字。
7.一种图像处理的装置,其特征在于,所述装置包括:
标记模块,被配置为标记样本图像中目标点的位置,所述目标点的位置至少包括回归角度、包围所述目标点的包围盒的宽度、高度及所述包围盒中心点的坐标,所述回归角度为所述包围盒的长边与坐标系中各个坐标轴的角度中的最小角度;
获取模块,被配置为将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,得到图像目标点定位模型;以及
检测模块,被配置为将待检测图像输入所述图像目标点定位模型进行检测,以获取所述待检测图像的目标点的位置。
8.根据权利要求7所述的装置,其特征在于,还包括:
美化模块,被配置为在获取所述待检测图像的目标点的位置,对所述待检测图像的目标点进行美化处理。
9.根据权利要求8所述的装置,其特征在于,所述美化模块包括:
确定子模块,被配置为根据所述待检测图像的目标点的位置,确定包围该目标点的包围盒所在的区域图像;
第一计算子模块,被配置为计算所述区域图像的像素在HSV空间中的色调分量、饱和度分量和明度分量的均值;
获取子模块,被配置为获取包含所述区域图像但面积大于所述区域图像的对比区域图像;
第二计算子模块,被配置为计算所述对比区域图像的像素在HSV空间中的色调分量、饱和度分量和明度分量的均值;以及
调整子模块,被配置为调整所述区域图像的像素的色调分量、饱和度分量和明度分量,以使所述区域图像的像素的色调分量、饱和度分量和明度分量的均值与所述对比区域图像的均值一致。
10.根据权利要求9所述的装置,其特征在于,所述美化模块还包括:
处理子模块,被配置为在调整所述区域图像的像素的色调分量、饱和度分量和明度分量之后,对所述脸部图像进行平滑处理。
11.根据权利要求7所述的装置,其特征在于,所述获取模块包括:
第一输入子模块,被配置为将所述样本图像输入区域建议网络中,以输出带有回归角度的包围盒;
第二输入子模块,被配置为将所述带有回归角度的包围盒输入Faster R-CNN中的roi-pooling层以进行池化;以及
获得子模块,被配置为将池化后的包围盒输入Faster R-CNN中的全连接层,以使Faster R-CNN进行回归训练,得到图像目标点定位模型。
12.根据权利要求7所述的装置,其特征在于,所述样本图像和所述待检测图像为人脸图像或者文字图像,所述目标点包括疤痕、痣、皱纹、胎记或倾斜文字。
13.一种图像处理的装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
标记样本图像中目标点的位置,所述目标点的位置至少包括回归角度、包围所述目标点的包围盒的宽度、高度及所述包围盒中心点的坐标,所述回归角度为所述包围盒的长边与坐标系中各个坐标轴的角度中的最小角度;
将所述样本图像输入训练模型以根据所述目标点对所述样本图像的目标点位置进行回归训练,得到图像目标点定位模型;
将待检测图像输入所述图像目标点定位模型进行检测,以获取所述待检测图像的目标点的位置。
14.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1~6中任一项所述方法的步骤。
CN201711368804.7A 2017-12-18 2017-12-18 图像处理的方法、装置及计算机可读存储介质 Pending CN108021901A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711368804.7A CN108021901A (zh) 2017-12-18 2017-12-18 图像处理的方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711368804.7A CN108021901A (zh) 2017-12-18 2017-12-18 图像处理的方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN108021901A true CN108021901A (zh) 2018-05-11

Family

ID=62074033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711368804.7A Pending CN108021901A (zh) 2017-12-18 2017-12-18 图像处理的方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN108021901A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583449A (zh) * 2018-10-29 2019-04-05 深圳市华尊科技股份有限公司 字符识别方法及相关产品
CN110502655A (zh) * 2019-07-31 2019-11-26 武汉大学 一种嵌入场景文字信息的图像自然描述语句生成方法
CN112101342A (zh) * 2019-06-17 2020-12-18 顺丰科技有限公司 箱体关键点检测方法和装置、计算设备、计算机可读存储介质
CN113763287A (zh) * 2021-09-27 2021-12-07 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130135689A1 (en) * 2011-11-30 2013-05-30 Omri Shacham Automatic detection of corners of a scanned document
CN104881853A (zh) * 2015-05-28 2015-09-02 厦门美图之家科技有限公司 一种基于色彩概念化的肤色矫正方法和系统
CN105310652A (zh) * 2014-06-09 2016-02-10 松下知识产权经营株式会社 皱纹检测装置和皱纹检测方法
CN106127204A (zh) * 2016-06-30 2016-11-16 华南理工大学 一种全卷积神经网络的多方向水表读数区域检测算法
CN106874850A (zh) * 2017-01-10 2017-06-20 广东工业大学 一种基于三维人脸点云特征点定位方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130135689A1 (en) * 2011-11-30 2013-05-30 Omri Shacham Automatic detection of corners of a scanned document
CN105310652A (zh) * 2014-06-09 2016-02-10 松下知识产权经营株式会社 皱纹检测装置和皱纹检测方法
CN104881853A (zh) * 2015-05-28 2015-09-02 厦门美图之家科技有限公司 一种基于色彩概念化的肤色矫正方法和系统
CN106127204A (zh) * 2016-06-30 2016-11-16 华南理工大学 一种全卷积神经网络的多方向水表读数区域检测算法
CN106874850A (zh) * 2017-01-10 2017-06-20 广东工业大学 一种基于三维人脸点云特征点定位方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIANQI MA ETC.: ""Arbitrary-Oriented Scene Text Detection via Rotation Proposals"", 《ARXIV:1703.01086V1[CS.CV]》 *
韩凯等: ""一种基于Faster R-CNN的车辆检测算法"", 《一种基于FASTER R-CNN的车辆检测算法》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583449A (zh) * 2018-10-29 2019-04-05 深圳市华尊科技股份有限公司 字符识别方法及相关产品
CN112101342A (zh) * 2019-06-17 2020-12-18 顺丰科技有限公司 箱体关键点检测方法和装置、计算设备、计算机可读存储介质
CN110502655A (zh) * 2019-07-31 2019-11-26 武汉大学 一种嵌入场景文字信息的图像自然描述语句生成方法
CN110502655B (zh) * 2019-07-31 2022-04-01 武汉大学 一种嵌入场景文字信息的图像自然描述语句生成方法
CN113763287A (zh) * 2021-09-27 2021-12-07 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN108021901A (zh) 图像处理的方法、装置及计算机可读存储介质
EP3133527A1 (en) Human face recognition method, apparatus and terminal
CN107515715A (zh) 屏幕截图方法、装置及存储介质
CN107155060A (zh) 图像处理方法及装置
CN104182967B (zh) 图像处理方法、装置及终端
US10248855B2 (en) Method and apparatus for identifying gesture
CN107967459A (zh) 卷积处理方法、装置及存储介质
CN108124102A (zh) 图像处理方法、装置及计算机可读存储介质
CN106778773A (zh) 图片中目标物的定位方法及装置
CN106778531A (zh) 人脸定位方法及装置
CN108062547A (zh) 文字检测方法及装置
CN107742120A (zh) 银行卡卡号的识别方法及装置
EP3968626A1 (en) Photography method, photography apparatus, electronic device, and storage medium
CN107729880A (zh) 人脸检测方法及装置
CN107944367A (zh) 人脸关键点检测方法及装置
CN107992848A (zh) 获取深度图像的方法、装置及计算机可读存储介质
CN107315792A (zh) 页面更新方法、装置、电子设备和计算机可读存储介质
CN108040171A (zh) 语音操作方法、装置及计算机可读存储介质
CN107911576A (zh) 图像处理方法、装置和存储介质
CN106598429A (zh) 移动终端的窗口调整方法及装置
CN107347136A (zh) 拍照方法、装置和终端设备
CN107730448A (zh) 基于图像处理的美颜方法及装置
CN108009990A (zh) 倾斜对象处理方法及装置
CN107958223A (zh) 人脸识别方法及装置、移动设备、计算机可读存储介质
CN107977895A (zh) 车辆损毁信息的确定方法、装置及用户设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180511