CN109325489B - 图像的识别方法及装置、存储介质、电子装置 - Google Patents

图像的识别方法及装置、存储介质、电子装置 Download PDF

Info

Publication number
CN109325489B
CN109325489B CN201811075410.7A CN201811075410A CN109325489B CN 109325489 B CN109325489 B CN 109325489B CN 201811075410 A CN201811075410 A CN 201811075410A CN 109325489 B CN109325489 B CN 109325489B
Authority
CN
China
Prior art keywords
image
determining
target area
density
element node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811075410.7A
Other languages
English (en)
Other versions
CN109325489A (zh
Inventor
贺三元
黄建锋
罗晗璐
张桀宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Koubei Network Technology Co Ltd
Original Assignee
Zhejiang Koubei Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Koubei Network Technology Co Ltd filed Critical Zhejiang Koubei Network Technology Co Ltd
Priority to CN201811075410.7A priority Critical patent/CN109325489B/zh
Publication of CN109325489A publication Critical patent/CN109325489A/zh
Application granted granted Critical
Publication of CN109325489B publication Critical patent/CN109325489B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种图像的识别方法及装置、存储介质、电子装置,其中,该方法包括:确定待识别的第一图像;提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域;在所述元素节点不包含文字时,识别所述元素节点中的第二图像。通过本发明,解决了相关技术中无法自动识别图像中的子图像的技术问题。

Description

图像的识别方法及装置、存储介质、电子装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种图像的识别方法及装置、存储介质、电子装置。
背景技术
图像识别应用在广泛的领域,如,机器学习,分析竞品产品,在机器分析图片过程中,提取图片中的子图片,又是关键的一项。如何准确、快速地识别图像中的内容,在图像的应用广度和深度上,意义都非常重大。
相关技术中,主要是靠人工来识别和选择图像,或者仅能识别图像本身,如申请号为CN107944501A的申请文件,公开了一种根据图像特征及尺寸信息识别待识别物体的方案,在图像中还包括子图像时,相关技术根本无法识别出来,需要使用子图片时,只能通过人工来编辑,将图像中的子图片抠出来,然后进行下一步的处理,这导致图像的处理效率非常低下,自动化低,无法快速自动提出图像中所包含的子图像。
针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
发明内容
本发明实施例提供了一种图像的识别方法及装置、存储介质、电子装置。
根据本发明的一个实施例,提供了一种图像的识别方法,包括:确定待识别的第一图像;提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域;在所述元素节点不包含文字时,识别所述元素节点中的第二图像。
可选的,识别所述元素节点中的第二图像包括:获取所述元素节点中的特征点密度;在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像。
可选的,获取所述元素节点中的特征点密度包括:利用加速鲁棒特征SURF算法提取所述元素节点中的特征点;计算所述元素节点中单位面积的特征点密度。
可选的,获取所述元素节点中的特征点密度包括:利用尺度不变特征变换SIFT算法提取所述元素节点中的特征点;计算所述元素节点中单位面积的特征点密度。
可选的,识别所述元素节点中的第二图像包括:检测所述元素节点中是否包含指定形状的目标区域;在检测到所述目标区域时,确定所述目标区域为所述第二图像。
可选的,检测所述元素节点中是否包含指定形状的目标区域包括以下至少之一:检测所述元素节点中是否包含圆角形状的目标区域;检测所述元素节点中是否包含圆形的目标区域。
可选的,检测所述元素节点中是否包含圆角形状的目标区域包括:通过所述元素节点的宽和高确定最大检测半径和最小检测半径;使用所述最大检测半径按照预设步长递减依次遍历检测所述元素节点的四个角,得到所述元素节点的四个角的半径值;在所述四个角的半径值均小于第一临界值时,确定所述元素节点中不包含圆角形状的目标区域;在所述四个角的半径值存在大于或等于所述第一临界值的半径值时,取落在所述元素节点的顶点与圆心为对角线的矩阵框内的像素点分别计算四个角的标准差,分别以标准差最小的半径为四个角的圆角半径;在所述四个圆角半径中的最大值和最小值之差大于第二临界值时,将圆角半径最小的角确定为圆角形状的目标区域;在所述四个圆角半径中的最大值与所述最大检测半径之差小于第三临界值时,将所述最大检测半径对应的圆形区域确定为圆角形状的目标区域;在所述四个圆角半径中的最大值和最小值之差小于或等于所述第二临界值,且所述四个圆角半径中的最大值与所述最大检测半径之差大于或等于第三临界值时,将圆角半径最大的角确定为圆角形状的目标区域。
可选的,识别所述元素节点中的第二图像包括:获取所述元素节点中的特征点密度;在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像;在所述特征点密度小于或等于所述预设阈值时,检测所述元素节点中是否包含指定形状的目标区域;在检测到所述目标区域时,确定所述目标区域为所述第二图像。
可选的,识别所述元素节点中的第二图像包括:采用第一算法获取所述元素节点中的第一特征点密度;在所述第一特征点密度大于第一预设阈值时,确定所述第一特征点组成的区域为所述第二图像;或,在所述第一特征点密度小于或等于所述第一预设阈值时,采用第二算法获取所述元素节点中的第二特征点密度;在所述第二特征点密度大于第二预设阈值时,确定所述第二特征点组成的区域为所述第二图像。
可选的,提取所述第一图像中的一个或多个元素节点包括:识别所述第一图像中各个图像区域的轮廓;提取轮廓符合预定形状的一个或多个元素节点。
可选的,在提取所述第一图像中的一个或多个元素节点之后,所述方法还包括:确定所述第一图像所包含的所有媒体类型,判断所述元素节点的媒体类型中是否包含文字,其中,所述媒体类型包括以下至少之一:文字、图片。
可选的,在识别所述元素节点中的第二图像之后,所述方法还包括:建立所述第一图像与所述第二图像之间的关联关系。
根据本发明的另一个实施例,提供了一种图像的识别装置,包括:确定模块,用于确定待识别的第一图像;提取模块,用于提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域;识别模块,用于在所述元素节点不包含文字时,识别所述元素节点中的第二图像。
可选的,所述识别模块包括:第一获取单元,用于获取所述元素节点中的特征点密度;第一确定单元,用于在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像。
可选的,第一获取单元还用于:利用加速鲁棒特征SURF算法提取所述元素节点中的特征点;计算所述元素节点中单位面积的特征点密度。
可选的,第一获取单元还用于:利用尺度不变特征变换SIFT算法提取所述元素节点中的特征点;计算所述元素节点中单位面积的特征点密度。
可选的,所述识别模块包括:检测单元,用于检测所述元素节点中是否包含指定形状的目标区域;第二确定单元,用于在检测到所述目标区域时,确定所述目标区域为所述第二图像。
可选的,所述检测单元还用于以下至少之一:检测所述元素节点中是否包含圆角形状的目标区域;检测所述元素节点中是否包含圆形的目标区域。
可选的,所述检测单元检测所述元素节点中是否包含指定形状的目标区域包括以下至少之一:检测所述元素节点中是否包含圆角形状的目标区域;检测所述元素节点中是否包含圆形的目标区域。
可选的,所述检测单元检测检测所述元素节点中是否包含圆角形状的目标区域包括:通过所述元素节点的宽和高确定最大检测半径和最小检测半径;使用所述最大检测半径按照预设步长递减依次遍历检测所述元素节点的四个角,得到所述元素节点的四个角的半径值;在所述四个角的半径值均小于第一临界值时,确定所述元素节点中不包含圆角形状的目标区域;在所述四个角的半径值存在大于或等于所述第一临界值的半径值时,取落在所述元素节点的顶点与圆心为对角线的矩阵框内的像素点分别计算四个角的标准差,分别以标准差最小的半径为四个角的圆角半径;在所述四个圆角半径中的最大值和最小值之差大于第二临界值时,将圆角半径最小的角确定为圆角形状的目标区域;在所述四个圆角半径中的最大值与所述最大检测半径之差小于第三临界值时,将所述最大检测半径对应的圆形区域确定为圆角形状的目标区域;在所述四个圆角半径中的最大值和最小值之差小于或等于所述第二临界值,且所述四个圆角半径中的最大值与所述最大检测半径之差大于或等于第三临界值时,将圆角半径最大的角确定为圆角形状的目标区域。
可选的,所述识别模块包括:第二获取单元,用于获取所述元素节点中的特征点密度;第一处理单元,用于在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像;在在所述特征点密度小于或等于所述预设阈值时,检测所述元素节点中是否包含指定形状的目标区域;第三确定单元,用于在检测到所述目标区域时,确定所述目标区域为所述第二图像。
可选的,所述识别模块包括:第三获取单元,用于采用第一算法获取所述元素节点中的第一特征点密度;第二处理单元,用于在所述第一特征点密度大于第一预设阈值时,确定所述第一特征点组成的区域为所述第二图像;或,在所述第一特征点密度小于或等于所述第一预设阈值时,采用第二算法获取所述元素节点中的第二特征点密度;第四确定单元,用于在所述第二特征点密度大于第二预设阈值时,确定所述第二特征点组成的区域为所述第二图像。
可选的,所述提取模块包括:识别单元,用于识别所述第一图像中各个元素节点的轮廓;提取单元,用于提取轮廓符合预定形状的一个或多个元素节点。
可选的,所述装置还包括,处理模块,用于在所述提取模块提取所述第一图像中的一个或多个元素节点之后,确定所述第一图像所包含的所有媒体类型,判断所述元素节点的媒体类型中是否包含文字,其中,所述媒体类型包括以下至少之一:文字、图片。
可选的,所述装置还包括,建立模块,用于在所述识别模块识别所述元素节点中的第二图像之后,建立所述第一图像与所述第二图像之间的关联关系。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,通过确定待识别的第一图像,然后提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域,在所述元素节点不包含文字时,识别所述元素节点中的第二图像,通过提取第一图像中的元素节点,将元素节点作为组成第一图像的基本单位,然后将元素节点作为图像识别的对象,解决了相关技术中无法自动识别图像中的子图像的技术问题,提高了图像识别的效率,实现了快速、准确识别图像的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种图像的识别移动终端的硬件结构框图;
图2是根据本发明实施例的图像的识别方法的流程图;
图3是本发明实施中第一图片的示意图;
图4是本发明实施例中提取第一图像中元素节点的示意图;
图5是本发明实施例中元素节点中包含圆角形状和圆形的示意图;
图6是根据本发明实施例的图像的识别终端的结构框图;
图7是根据本发明实施例的服务器的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
实施例1
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种图像的识别移动终端的硬件结构框图。如图1所示,移动终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的图像的识别方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种运行于终端或服务器的图像的识别方法,图2是根据本发明实施例的图像的识别方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,确定待识别的第一图像;
步骤S204,提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域;
步骤S206,在所述元素节点不包含文字时,识别所述元素节点中的第二图像。
使用上述方法,通过确定待识别的第一图像,然后提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域,在所述元素节点不包含文字时,识别所述元素节点中的第二图像,通过提取第一图像中的元素节点,将元素节点作为组成第一图像的基本单位,然后将元素节点作为图像识别的对象,解决了相关技术中无法自动识别图像中的子图像的技术问题,提高了图像识别的效率,实现了快速、准确识别图像的技术效果。
在本实施例中,待识别的第一图像可以认为是一张母图,母图包含的所有媒体类型可以是子图,文字等,第一图像可以是界面图,照片等,是处理终端或服务器获取的原始的图片,图像识别的应用领域广泛,如图标,logo识别等,图3是本发明实施中第一图片的示意图,是一个餐饮类软件的界面图,图中包括了logo,文字,链接,图标等。用户或者机器输入第一图像,通过识别后,得到识别后的第二图像。
由于相关技术中,机器只能识别整张图片(母图)是图片还是文字,并不能识别母图中是否还有子图,本实施例通过将第一图像拆分为元素节点,可以解决上述问题,由于元素节点为所述第一图像中的图像区域,实际上是第一图像的一部分,将第一图像的区域按照类型来拆分,将文字组成的区域和图像组成的区域提取出来,再进行识别,可以识别母图中的子图。
在本实施例中,提取所述第一图像中的一个或多个元素节点包括:
S11,识别所述第一图像中各个图像区域的轮廓;通常,图像的各个区域会呈一定规律排列和布局,形成一个多个预定形状的轮廓,图矩形,圆形中,如图3中,“麦当劳”的logo所在的区域是一个矩形;
S12,提取轮廓符合预定形状的一个或多个元素节点。
图4是本发明实施例中提取第一图像中元素节点的示意图,图4中,虚拟组成的框为一个元素节点,仅示意了图3中的部分,可以看出,第一图像中包括了多个元素节点,元素节点的类型包括了文字,图像,链接等。
可选的,在提取所述第一图像中的一个或多个元素节点之后,还包括:确定所述第一图像所包含的所有媒体类型,判断所述元素节点的媒体类型中是否包含文字,其中,所述媒体类型包括以下至少之一:文字、图片。由于在提取元素节点时,可以区别图像类型的元素节点和文字类型的元素节点,因此,在元素节点中包含文字时,该元素节点不是图像,即该元素节点不是母图中包含的子图,可以将其排除,将其判定为容器,去识别不包含文字的元素节点,由于后续在识别元素节点中的第二图像(子图)时,会采用图像的识别算法,而图像识别算法一般不用于识别文字,因此,这样既可以避免用图像识别算法识别文字是导致的错误,还可以提高识别第二图像的效率,因为,已经剔除了部分格式的元素节点。
在本实施例中,第二图像是第一图像的子图,识别第二图像可以得到第二图像的形状,面积等,如图4中第一元素节点中的第二图像为一个“拱门”形状的logo,通过简单比对,可以得到其实麦当劳的注册商标。
在本实施例中,在识别所述元素节点中的第二图像时,可以采用多种识别算法,不同的算法在识别不同的图像时,有一定的优劣之分,如,采用特征点密度算法特别适用于识别小图,但在检测圆时,效率较低,因为有些圆形图标就密度很小,但是圆形其实可以算一个比较强的特征了,霍夫检测是一个适用于识别圆的算法。可以将多个识别算法结合起来使用,当然,也可以单独使用。下面进行说明:
在本实施例中,在采用特征点密度来识别第二图像时,识别所述元素节点中的第二图像包括:
S21,获取所述元素节点中的特征点密度;图像的特征点是指图像中具有鲜明特性并能够有效反映图像本质特征,能够标识图像中目标物体的点,也是图像灰度值发生明显变化的点或者在图像边缘上曲率较大的点,还是以图4中的第一元素节点为例进行说明,其中的“拱门”的像素点为特征点。
可选的,获取所述元素节点中的特征点密度包括以下实施方式:利用加速鲁棒特征(Speeded Up Robust Features,SURF)算法提取所述元素节点中的特征点;计算所述元素节点中单位面积的特征点密度。利用尺度不变特征变换(Scale-invariant featuretransform,SIFT)算法提取所述元素节点中的特征点;计算所述元素节点中单位面积的特征点密度。
如在SURF算法中,设置Hessian矩阵的大小为2*2、3*3等,对于图像中某点X=(x,y),下面的公式H(X,σ)代表在X点的σ尺度下的Hessian矩阵,其中Hessian矩阵的四项分别代表高斯二阶微分Lxx,Lyy,Lxy与图像I的对应点进行卷积得到的结果,σ代表尺度系数,一个点会有多个σ值下的Hessian矩阵。
Figure BDA0001800640230000091
SIFT算法包括如下步骤:
尺度空间极值检测,搜索所有尺度上的图像位置。通过高斯微分函数来识别潜在的对于尺度和旋转不变的兴趣点。
关键点定位,在每个候选的位置上,通过一个拟合精细的模型来确定位置和尺度。关键点的选择依据于它们的稳定程度。
方向确定,基于图像局部的梯度方向,分配给每个关键点位置一个或多个方向。所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置进行变换,从而提供对于这些变换的不变性。
关键点描述,在每个关键点周围的邻域内,在选定的尺度上测量图像局部的梯度。这些梯度被变换成一种表示,这种表示允许比较大的局部形状的变形和光照变化。
SIFT算法是在不同的尺度空间上查找关键点(即特征点),而尺度空间的获取需要使用高斯模糊来实现,高斯模糊是一种图像滤波器,它使用正态分布(高斯函数)计算模糊模板,并使用该模板与原图像做卷积运算,达到模糊图像的目的。N维空间正态分布方程为:
Figure BDA0001800640230000101
其中,是正态分布的标准差,值越大,图像越模糊(平滑)。r为模糊半径,模糊半径是指模板元素到模板中心的距离。如二维模板大小为m*n,则模板上的元素(x,y)对应的高斯计算公式为:
Figure BDA0001800640230000102
S22,在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像。预设阈值是一个密度阈值,在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像,第二图像在第一图像中的位置即特征点集合的位置,反之,在所述特征点密度小于或等于预设阈值时,确定所述特征点组成的区域不是图像区域。
在另外一个实施方式中,识别所述元素节点中的第二图像包括:
S31,检测所述元素节点中是否包含指定形状的目标区域;检测所述元素节点中是否包含指定形状的目标区域包括以下至少之一:检测所述元素节点中是否包含圆角形状的目标区域;检测所述元素节点中是否包含圆形的目标区域,检测所述元素节点中是否包含扇形形状的目标区域,检测所述元素节点中是否包含弧形的目标区域,检测所述元素节点中是否包含椭圆形状的目标区域。
图5是本发明实施例中元素节点中包含圆角形状和圆形的示意图,其中,左边为圆角形状,右边为圆形。
S32,在检测到所述目标区域时,确定所述目标区域为所述第二图像。
在此,以霍夫变换检测算法为例,说明本实施例中检测元素节点中圆形区域的方案,其中,检测所述元素节点中是否包含圆角形状的目标区域包括:
S41,通过所述元素节点的宽和高确定最大检测半径和最小检测半径;
S42,使用所述最大检测半径按照预设步长递减依次遍历检测所述元素节点的四个角,得到所述元素节点的四个角的半径值;
S43,在所述四个角的半径值均小于第一临界值时,确定所述元素节点中不包含圆角形状的目标区域;在所述四个角的半径值存在大于或等于所述第一临界值的半径值时,取落在所述元素节点的顶点与圆心为对角线的矩阵框内的像素点分别计算四个角的标准差,分别以标准差最小的半径为四个角的圆角半径;
S44,在所述四个圆角半径中的最大值和最小值之差大于第二临界值时,将圆角半径最小的角确定为圆角形状的目标区域;在所述四个圆角半径中的最大值与所述最大检测半径之差小于第三临界值时,将所述最大检测半径对应的圆形区域确定为圆角形状的目标区域;在所述四个圆角半径中的最大值和最小值之差小于或等于所述第二临界值,且所述四个圆角半径中的最大值与所述最大检测半径之差大于或等于第三临界值时,将圆角半径最大的角确定为圆角形状的目标区域。
在此进行进一步说明,利用霍夫变换检测第一图像中的圆,霍夫检测的最大检测半径(max radius)=min(width,height),最小检测半径(min radius)=max(3,1/8maxradius),其中width,height为元素节点的宽和高,在圆角识别过程,使用最大检测半径,对于元素节点的四个角,遍历半径,从最大半径递减到3(单位为像素(pixel)),步长为0.5,但阈值半径为4,即半径小于4时则不设置圆角,对于每个半径,取落在顶点与圆心为对角线的矩阵框内的像素点计算标准差,例如左上角,标准差公式为:
Figure BDA0001800640230000121
(xi,yi)为像素点(i,y)到元素节点边界的最小垂直距离,r为半径值,n为像素点的个数,标准差中最小的r(半径值)为该角的圆角半径口若为直角,标准差呈递减趋势,则会遍历到r=3时,标准差最小,此时r=4,则不设置圆角,在计算得到4个r后,计算4个r中的最大值和最小值,通过条件判断确定圆角半径:若最大值和最小值两者差异过大,则取最小值为圆角半径;若最大值与max Radius相差不多,则设max Radius为圆角半径;若上述两个条件都不满足,则设最大值为圆角半径。
本实施例中,各个图像识别算法可以结合使用,在此举例说明几种示例,在检测特征点密度和检测元素节点中是否包含指定形状的目标区域结合时,识别所述元素节点中的第二图像包括:
S51,获取所述元素节点中的特征点密度;
在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像;在所述特征点密度小于或等于所述预设阈值时,检测所述元素节点中是否包含指定形状的目标区域;
S52,在检测到所述目标区域时,确定所述目标区域为所述第二图像。
在本实施例的一个实施方式中,即使是检测特征点密度,也可以两种算法(如,SURF算法和SIFT算法)结合使用,识别所述元素节点中的第二图像包括:
采用第一算法获取所述元素节点中的第一特征点密度;第一算法可以是SURF算法;
在所述第一特征点密度大于第一预设阈值时,确定所述第一特征点组成的区域为所述第二图像;或,在所述第一特征点密度小于或等于所述第一预设阈值时,采用第二算法获取所述元素节点中的第二特征点密度;第二算法可以是SIFT算法;其中,第一预设阈值和第二预设阈值可以相同或者不同,在相同时,可以设置为0.1%,在不相同时,第一预设阈值大于第二预设阈值;
在所述第二特征点密度大于第二预设阈值时,确定所述第二特征点组成的区域为所述第二图像。
在上述实施方式中,如果采用SURF算法和SIFT算法还是无法识别出第二图像,则可以进一步采用识别元素节点中是否包含指定形状的目标区域,若还是检测不到指定形状(如圆形等)的目标区域,则确定该元素节点中不包含第二图像,进行下一个元素节点的识别。
可选的,在识别所述元素节点中的第二图像之后,还包括:建立所述第一图像与所述第二图像之间的关联关系。即建立第一图像与第二图像之间的母子关系。
在识别出第二图像后,还可以将第二图像提取出来,进行下一步的处理,如作为机器学习的标签数据等。在只需要第一图像中的子图时,可以删除第一图像,输出第二图像。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
在本实施例中还提供了一种图像的识别装置,该装置用于实现上述实施例及优选实施方式,包括终端、服务器等,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图6是根据本发明实施例的图像的识别终端的结构框图,如图6所示,该装置包括:
确定模块60,用于确定待识别的第一图像;
提取模块62,用于提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域;
识别模块64,用于在所述元素节点不包含文字时,识别所述元素节点中的第二图像。
在一个示例中,识别模块设置有根据特征点密度来识别第二图像的算法,所述识别模块包括:第一获取单元,用于获取所述元素节点中的特征点密度;第一确定单元,用于在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像。
在另一个示例中,识别模块设置有根据指定形状的目标区域来识别第二图像的算法,所述识别模块包括:检测单元,用于检测所述元素节点中是否包含指定形状的目标区域;第二确定单元,用于在检测到所述目标区域时,确定所述目标区域为所述第二图像。检测单元和第二确定单元在结构上可以独立于第一获取单元和第一确定单元。
可选的,所述识别模块包括:第二获取单元,用于获取所述元素节点中的特征点密度;第一处理单元,用于在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像;在在所述特征点密度小于或等于所述预设阈值时,检测所述元素节点中是否包含指定形状的目标区域;第三确定单元,用于在检测到所述目标区域时,确定所述目标区域为所述第二图像。
可选的,所述识别模块包括:第三获取单元,用于采用第一算法获取所述元素节点中的第一特征点密度;第二处理单元,用于在所述第一特征点密度大于第一预设阈值时,确定所述第一特征点组成的区域为所述第二图像;或,在所述第一特征点密度小于或等于所述第一预设阈值时,采用第二算法获取所述元素节点中的第二特征点密度;第四确定单元,用于在所述第二特征点密度大于第二预设阈值时,确定所述第二特征点组成的区域为所述第二图像。
可选的,所述提取模块包括:识别单元,用于识别所述第一图像中各个元素节点的轮廓;提取单元,用于提取轮廓符合预定形状的一个或多个元素节点。
图7是根据本发明实施例的服务器的结构框图,如图7所示,该装置包括:
确定模块70,用于确定待识别的第一图像;
提取模块72,用于提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域;
识别模块74,用于在所述元素节点不包含文字时,识别所述元素节点中的第二图像。
在一个示例中,识别模块设置有根据特征点密度来识别第二图像的算法,所述识别模块包括:第一获取单元,用于获取所述元素节点中的特征点密度;第一确定单元,用于在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像。
在另一个示例中,识别模块设置有根据指定形状的目标区域来识别第二图像的算法,所述识别模块包括:检测单元,用于检测所述元素节点中是否包含指定形状的目标区域;第二确定单元,用于在检测到所述目标区域时,确定所述目标区域为所述第二图像。检测单元和第二确定单元在结构上可以独立于第一获取单元和第一确定单元。
可选的,所述识别模块包括:第二获取单元,用于获取所述元素节点中的特征点密度;第一处理单元,用于在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像;在在所述特征点密度小于或等于所述预设阈值时,检测所述元素节点中是否包含指定形状的目标区域;第三确定单元,用于在检测到所述目标区域时,确定所述目标区域为所述第二图像。
可选的,所述识别模块包括:第三获取单元,用于采用第一算法获取所述元素节点中的第一特征点密度;第二处理单元,用于在所述第一特征点密度大于第一预设阈值时,确定所述第一特征点组成的区域为所述第二图像;或,在所述第一特征点密度小于或等于所述第一预设阈值时,采用第二算法获取所述元素节点中的第二特征点密度;第四确定单元,用于在所述第二特征点密度大于第二预设阈值时,确定所述第二特征点组成的区域为所述第二图像。
可选的,所述提取模块包括:识别单元,用于识别所述第一图像中各个元素节点的轮廓;提取单元,用于提取轮廓符合预定形状的一个或多个元素节点。
需要说明的是,终端和服务器仅是方案在执行主体上的差异,上述识别终端中的各个示例和可选方案同样适应在服务器中,并产生相同的技术效果。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
实施例3
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,确定待识别的第一图像;
S2,提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域;
S3,在所述元素节点不包含文字时,识别所述元素节点中的第二图像。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,确定待识别的第一图像;
S2,提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域;
S3,在所述元素节点不包含文字时,识别所述元素节点中的第二图像。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (21)

1.一种图像的识别方法,其特征在于,包括:
确定待识别的第一图像;
提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域;
在所述元素节点不包含文字时,识别所述元素节点中的第二图像;
所述识别所述元素节点中的第二图像包括:在所述元素节点的四个角的圆角半径中的最大值和最小值之差大于第二临界值时,将圆角半径最小的角确定为圆角形状的目标区域;
在检测到所述目标区域时,确定所述目标区域为所述第二图像。
2.根据权利要求1所述的方法,其特征在于,识别所述元素节点中的第二图像包括:
获取所述元素节点中的特征点密度;
在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像。
3.根据权利要求2所述的方法,其特征在于,获取所述元素节点中的特征点密度包括:
利用加速鲁棒特征SURF算法提取所述元素节点中的特征点;
计算所述元素节点中单位面积的特征点密度。
4.根据权利要求2所述的方法,其特征在于,获取所述元素节点中的特征点密度包括:
利用尺度不变特征变换SIFT算法提取所述元素节点中的特征点;
计算所述元素节点中单位面积的特征点密度。
5.根据权利要求1所述的方法,其特征在于,识别所述元素节点中的第二图像包括:
检测所述元素节点中是否包含指定形状的目标区域;
在检测到所述目标区域时,确定所述目标区域为所述第二图像。
6.根据权利要求5所述的方法,其特征在于,检测所述元素节点中是否包含指定形状的目标区域包括以下至少之一:
检测所述元素节点中是否包含圆角形状的目标区域;
检测所述元素节点中是否包含圆形的目标区域。
7.根据权利要求6所述的方法,其特征在于,检测所述元素节点中是否包含圆角形状的目标区域包括:
通过所述元素节点的宽和高确定最大检测半径和最小检测半径;
使用所述最大检测半径按照预设步长递减依次遍历检测所述元素节点的四个角,得到所述元素节点的四个角的半径值;
在所述四个角的半径值均小于第一临界值时,确定所述元素节点中不包含圆角形状的目标区域;在所述四个角的半径值存在大于或等于所述第一临界值的半径值时,取落在所述元素节点的顶点与圆心为对角线的矩阵框内的像素点分别计算四个角的标准差,分别以标准差最小的半径为四个角的圆角半径;
在所述四个圆角半径中的最大值与所述最大检测半径之差小于第三临界值时,将所述最大检测半径对应的圆形区域确定为圆角形状的目标区域;在所述四个圆角半径中的最大值和最小值之差小于或等于所述第二临界值,且所述四个圆角半径中的最大值与所述最大检测半径之差大于或等于第三临界值时,将圆角半径最大的角确定为圆角形状的目标区域。
8.根据权利要求1所述的方法,其特征在于,识别所述元素节点中的第二图像包括:
获取所述元素节点中的特征点密度;
在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像;在所述特征点密度小于或等于所述预设阈值时,检测所述元素节点中是否包含指定形状的目标区域;
在检测到所述目标区域时,确定所述目标区域为所述第二图像。
9.根据权利要求1所述的方法,其特征在于,识别所述元素节点中的第二图像包括:
采用第一算法获取所述元素节点中的第一特征点密度;
在所述第一特征点密度大于第一预设阈值时,确定所述第一特征点组成的区域为第二图片;或,在所述第一特征点密度小于或等于所述第一预设阈值时,采用第二算法获取所述元素节点中的第二特征点密度;
在所述第二特征点密度大于第二预设阈值时,确定所述第二特征点组成的区域为所述第二图片。
10.根据权利要求1所述的方法,其特征在于,提取所述第一图像中的一个或多个元素节点包括:
识别所述第一图像中各个图像区域的轮廓;
提取轮廓符合预定形状的一个或多个元素节点。
11.根据权利要求1所述的方法,其特征在于,在提取所述第一图像中的一个或多个元素节点之后,所述方法还包括:
确定所述第一图像所包含的所有媒体类型,判断所述元素节点的媒体类型中是否包含文字,其中,所述媒体类型包括以下至少之一:文字、图片。
12.根据权利要求1所述的方法,其特征在于,在识别所述元素节点中的第二图像之后,所述方法还包括:
建立所述第一图像与所述第二图像之间的关联关系。
13.一种图像的识别终端,其特征在于,包括:
确定模块,用于确定待识别的第一图像;
提取模块,用于提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域;
识别模块,用于在所述元素节点不包含文字时,识别所述元素节点中的第二图像;
所述识别模块,具体用于在所述元素节点的四个角的圆角半径中的最大值和最小值之差大于第二临界值时,将圆角半径最小的角确定为圆角形状的目标区域;
在检测到所述目标区域时,确定所述目标区域为所述第二图像。
14.根据权利要求13所述的终端,其特征在于,所述识别模块包括:
第一获取单元,用于获取所述元素节点中的特征点密度;
第一确定单元,用于在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像。
15.根据权利要求13所述的终端,其特征在于,所述识别模块包括:
检测单元,用于检测所述元素节点中是否包含指定形状的目标区域;
第二确定单元,用于在检测到所述目标区域时,确定所述目标区域为所述第二图像。
16.根据权利要求13所述的终端,其特征在于,所述识别模块包括:
第二获取单元,用于获取所述元素节点中的特征点密度;
第一处理单元,用于在所述特征点密度大于预设阈值时,确定所述特征点组成的区域为所述第二图像;在在所述特征点密度小于或等于所述预设阈值时,检测所述元素节点中是否包含指定形状的目标区域;
第三确定单元,用于在检测到所述目标区域时,确定所述目标区域为所述第二图像。
17.根据权利要求13所述的终端,其特征在于,所述识别模块包括:
第三获取单元,用于采用第一算法获取所述元素节点中的第一特征点密度;
第二处理单元,用于在所述第一特征点密度大于第一预设阈值时,确定所述第一特征点组成的区域为第二图片;或,在所述第一特征点密度小于或等于所述第一预设阈值时,采用第二算法获取所述元素节点中的第二特征点密度;
第四确定单元,用于在所述第二特征点密度大于第二预设阈值时,确定所述第二特征点组成的区域为所述第二图片。
18.根据权利要求13所述的终端,其特征在于,所述提取模块包括:
识别单元,用于识别所述第一图像中各个元素节点的轮廓;
提取单元,用于提取轮廓符合预定形状的一个或多个元素节点。
19.一种服务器,其特征在于,包括:
确定模块,用于确定待识别的第一图像;
提取模块,用于提取所述第一图像中的一个或多个元素节点,其中,所述元素节点为所述第一图像中的图像区域;
识别模块,用于在所述元素节点不包含文字时,识别所述元素节点中的第二图像;
所述识别模块,具体用于在所述元素节点的四个角的圆角半径中的最大值和最小值之差大于第二临界值时,将圆角半径最小的角确定为圆角形状的目标区域;
在检测到所述目标区域时,确定所述目标区域为所述第二图像。
20.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1至12任一项中所述的方法。
21.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至12任一项中所述的方法。
CN201811075410.7A 2018-09-14 2018-09-14 图像的识别方法及装置、存储介质、电子装置 Active CN109325489B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811075410.7A CN109325489B (zh) 2018-09-14 2018-09-14 图像的识别方法及装置、存储介质、电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811075410.7A CN109325489B (zh) 2018-09-14 2018-09-14 图像的识别方法及装置、存储介质、电子装置

Publications (2)

Publication Number Publication Date
CN109325489A CN109325489A (zh) 2019-02-12
CN109325489B true CN109325489B (zh) 2021-05-28

Family

ID=65265438

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811075410.7A Active CN109325489B (zh) 2018-09-14 2018-09-14 图像的识别方法及装置、存储介质、电子装置

Country Status (1)

Country Link
CN (1) CN109325489B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188769B (zh) * 2019-05-14 2023-09-05 广州虎牙信息科技有限公司 关键点标注的审核方法、装置、设备及存储介质
CN111598096A (zh) * 2020-04-03 2020-08-28 维沃移动通信有限公司 一种图像处理方法及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0665433A1 (en) * 1994-01-27 1995-08-02 Wyatt Technology Corporation Precision determination for molecular weights
CN103456006A (zh) * 2013-08-06 2013-12-18 北京航空航天大学 一种sar图像的油库目标定位方法
CN108108746A (zh) * 2017-09-13 2018-06-01 湖南理工学院 基于Caffe深度学习框架的车牌字符识别方法
CN108508916A (zh) * 2018-04-02 2018-09-07 南方科技大学 一种无人机编队的控制方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0665433A1 (en) * 1994-01-27 1995-08-02 Wyatt Technology Corporation Precision determination for molecular weights
CN103456006A (zh) * 2013-08-06 2013-12-18 北京航空航天大学 一种sar图像的油库目标定位方法
CN108108746A (zh) * 2017-09-13 2018-06-01 湖南理工学院 基于Caffe深度学习框架的车牌字符识别方法
CN108508916A (zh) * 2018-04-02 2018-09-07 南方科技大学 一种无人机编队的控制方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Computer-Assisted Planning and Navigation for Corrective Distal Radius Osteotomy, Based on Pre- and Intraoperative Imaging;J. G. G. Dobbe等;《IEEE》;20101007;第182-190页 *
图像和视频中的文字获取技术;王勇等;《中国图象图形学报》;20040531;第9卷(第5期);第532-538页 *

Also Published As

Publication number Publication date
CN109325489A (zh) 2019-02-12

Similar Documents

Publication Publication Date Title
US9367766B2 (en) Text line detection in images
US9767604B2 (en) Image analysis method by analyzing point cloud using hierarchical search tree
EP2833288B1 (en) Face calibration method and system, and computer storage medium
CN105528614B (zh) 一种漫画图像版面的识别方法和自动识别系统
US8811751B1 (en) Method and system for correcting projective distortions with elimination steps on multiple levels
TWI590197B (zh) 影像物體特徵描述方法及影像處理裝置
US8897600B1 (en) Method and system for determining vanishing point candidates for projective correction
US20110194772A1 (en) Efficient scale-space extraction and description of interest points
CN109409377B (zh) 图像中文字的检测方法及装置
CN109559344B (zh) 边框检测方法、装置及存储介质
CN110807110B (zh) 结合局部和全局特征的图片搜索方法、装置及电子设备
CN112101386B (zh) 文本检测方法、装置、计算机设备和存储介质
CN109325489B (zh) 图像的识别方法及装置、存储介质、电子装置
CN108256520B (zh) 一种识别硬币年份的方法、终端设备及计算机可读存储介质
CN108960247B (zh) 图像显著性检测方法、装置以及电子设备
CN114049499A (zh) 用于连续轮廓的目标对象检测方法、设备及存储介质
CN108875500B (zh) 行人再识别方法、装置、系统及存储介质
JP6542230B2 (ja) 投影ひずみを補正するための方法及びシステム
CN111382638A (zh) 一种图像检测方法、装置、设备和存储介质
CN110070490B (zh) 图像拼接方法和装置
JP6517652B2 (ja) 物体顕著性マップ算出装置、方法、及びプログラム
CN109213515B (zh) 多平台下埋点归一方法及装置和电子设备
CN116434071A (zh) 一种规整化建筑掩膜的确定方法、确定装置、设备及介质
Dosil et al. A new radial symmetry measure applied to photogrammetry
CN115205113A (zh) 一种图像拼接方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant