CN110188622A - 一种文字定位方法、装置及电子设备 - Google Patents
一种文字定位方法、装置及电子设备 Download PDFInfo
- Publication number
- CN110188622A CN110188622A CN201910385742.3A CN201910385742A CN110188622A CN 110188622 A CN110188622 A CN 110188622A CN 201910385742 A CN201910385742 A CN 201910385742A CN 110188622 A CN110188622 A CN 110188622A
- Authority
- CN
- China
- Prior art keywords
- edge point
- edge
- positioning result
- point
- stroke width
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000003708 edge detection Methods 0.000 claims abstract description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005094 fruit set Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
本发明实施例提供了一种文字定位方法、装置及电子设备。其中,方法包括:对待处理图像进行边缘检测,得到所述待处理图像中的初始边缘点集;针对所述初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度,所述笔画宽度用于表示该边缘点所属笔画在该边缘点处的宽度;如果所述初始边缘点集中的该边缘点存在对应的笔画宽度,则将该边缘点记录于定位结果集;并重复执行如下步骤,直至剩余边缘点集中不存在满足预设条件的边缘点:针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件,如果满足,则将该边缘点记录于所述定位结果集;根据所述定位结果集,确定文字定位结果。可以使得得到的文字定位结果更加准确。
Description
技术领域
本发明涉及图像识别技术领域,特别是涉及一种文字定位方法、装置及电子设备。
背景技术
在一些应用场景中,可能需要对图像中的文字进行识别,而文字定位是文字识别过程中重要的一个环节,如果无法准确进行文字定位,可能导致文字识别出现较大误差。因此如何提高文字定位的准确性成为亟待解决的技术问题。
相关技术中,可以利用文字中同一笔画的两个边缘近似平行的特点,通过笔画宽度变换(Stroke Width Transform,SWT)算法对文字的笔画进行定位,以实现文字定位。但是CJK(Chinese Japanese Korean Unified Ideographs,中日韩统一表意文字)类型的文字中可能包含一些特殊笔画,如中文中的“撇”、“捺”等,这些特殊笔画的两个边缘并不近似平行,因此相关技术中的笔画宽度变换算法可能无法定位出这些笔画,导致文字定位结果不准确。
发明内容
本发明实施例的目的在于提供一种文字定位方法、装置及电子设备,以实现提高文字定位的准确性。具体技术方案如下:
在本发明的第一方面,提供了一种文字定位方法,所述方法包括:
对待处理图像进行边缘检测,得到所述待处理图像中的初始边缘点集;
针对所述初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度,所述笔画宽度用于表示该边缘点所属笔画在该边缘点处的宽度;
如果所述初始边缘点集中的该边缘点存在对应的笔画宽度,则将该边缘点记录于定位结果集;并
重复执行如下步骤,直至剩余边缘点集中不存在满足预设条件的边缘点:
针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件,
如果满足,则将该边缘点记录于所述定位结果集;其中,所述剩余边缘点
集为所述初始边缘点集中未记录于所述定位结果集的边缘点组成的集合,
所述预设条件为所述定位结果集中存在与该边缘点相邻的边缘点;
根据所述定位结果集,确定文字定位结果。
在一种实施例中,所述针对所述初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度,包括:
针对所述初始边缘点集中的每个边缘点,沿该边缘点的梯度方向引出射线;
如果所述射线与所述初始边缘点集中的其他边缘点相交,并且交点的梯度方向的反方向,与该边缘点的梯度方向的夹角小于预设角度阈值,并且所述交点与该边缘点之间的距离小于预设距离阈值,则确定该边缘点存在对应的笔画宽度;
如果所述射线与初始边缘点集中的其他边缘点不相交,或者交点的梯度方向的反方向,与该边缘点的梯度方向的夹角不小于预设角度阈值,或者交点与该边缘点之间的距离不小于所述预设距离阈值,则确定该边缘点不存在对应的笔画宽度。
在一种实施例中,在所述针对所述初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度之后,所述方法还包括:
如果所述初始点集中的该边缘点存在对应的笔画宽度,将该边缘点对应的笔画宽度记录于所述定位结果集;
在所述针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件之后,所述方法还包括:
如果所述剩余边缘点集中的该边缘点满足所述预设条件,则确定沿该边缘点的梯度方向引出的射线上是否存在所述初始边缘点集中的其他边缘点,并且该边缘点与该其他边缘点之间的距离小于所述预设距离阈值;
如果存在,并且该边缘点与该其他边缘点之间的距离小于所述预设距离阈值,则将该边缘点与该其他边缘点之间的距离作为该边缘点对应的笔画宽度,记录于所述定位结果集;
所述根据所述定位结果集,确定文字定位结果,包括:
将所述定位结果集作为文字定位结果。
在一种实施例中,所述方法还包括:
如果沿所述剩余边缘点集中的该边缘点的梯度方向引出的射线上不存在所述初始边缘点集中的其他边缘点,或者,该边缘点与该其他边缘点之间的距离不小于所述预设距离阈值,则
将记录于所述定位结果集中的边缘点对应的笔画宽度的中值作为所述剩余边缘点集中的该边缘点的笔画宽度,并记录于所述定位结果集;或者,
将预设的笔画宽度作为所述剩余边缘点集中的该边缘点的笔画宽度,并记录于所述定位结果集。
在一种实施例中,在所述将所述笔画定位结果集作为文字定位结果之前,所述方法还包括:
计算所述定位结果集中所记录的笔画宽度的中值;
将所述定位结果集中记录的边缘点中,笔画宽度大于所述中值的边缘点对应的笔画宽度更改为所述中值。
在本发明实施例的第二方面,提供了一种文字定位装置,所述装置包括:
边缘检测模块,用于对待处理图像进行边缘检测,得到所述待处理图像中的初始边缘点集;
第一确定模块,针对所述初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度,所述笔画宽度用于表示该边缘点所属笔画在该边缘点处的宽度;
结果记录模块,用于如果所述初始边缘点集中的该边缘点存在对应的笔画宽度,则将该边缘点记录于定位结果集;并
第二确定模块,用于重复执行如下步骤,直至剩余边缘点集中不存在满足预设条件的边缘点:
针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件
如果满足,则将该边缘点记录于所述定位结果集;其中,所述剩余边缘点
集为所述初始边缘点集中未记录于所述定位结果集的边缘点组成的集合,
所述预设条件为所述定位结果集中存在与该边缘点相邻的边缘点;
文字定位模块,用于根据所述定位结果集,确定文字定位结果。
在一种实施例中,所述第一确定模块,具体用于:
针对所述初始边缘点集中的每个边缘点,沿该边缘点的梯度方向引出射线;
如果所述射线与所述初始边缘点集中的其他边缘点相交,并且交点的梯度方向的反方向,与该边缘点的梯度方向的夹角小于预设角度阈值,并且所述交点与该边缘点之间的距离小于预设距离阈值,则确定该边缘点存在对应的笔画宽度;
如果所述射线与初始边缘点集中的其他边缘点不相交,或者交点的梯度方向的反方向,与该边缘点的梯度方向的夹角不小于预设角度阈值,或者交点与该边缘点之间的距离不小于所述预设距离阈值,则确定该边缘点不存在对应的笔画宽度。
在一种实施例中,所述结果记录模块,还用于:
在所述针对所述初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度之后,如果所述初始点集中的该边缘点存在对应的笔画宽度,将该边缘点对应的笔画宽度记录于所述定位结果集;
所述第二确定模块,还用于在所述针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件之后,如果所述剩余边缘点集中的该边缘点满足所述预设条件,则确定沿该边缘点的梯度方向引出的射线上是否存在所述初始边缘点集中的其他边缘点,并且该边缘点与该其他边缘点之间的距离小于所述预设距离阈值;
如果存在,并且该边缘点与该其他边缘点之间的距离小于所述预设距离阈值,则所述结果记录模块将该边缘点与该其他边缘点之间的距离作为该边缘点对应的笔画宽度,记录于所述定位结果集;
所述文字定位模块,具体用于:
将所述定位结果集作为文字定位结果。
在一种实施例中,所述结果记录模块,还用于:
如果沿所述剩余边缘点集中的该边缘点的梯度方向引出的射线上不存在所述初始边缘点集中的其他边缘点,或者,该边缘点与该其他边缘点之间的距离不小于所述预设距离阈值,则
将记录于所述定位结果集中的边缘点对应的笔画宽度的中值作为所述剩余边缘点集中的该边缘点的笔画宽度,并记录于所述定位结果集;或者,
将预设的笔画宽度作为所述剩余边缘点集中的该边缘点的笔画宽度,并记录于所述定位结果集。
在一种实施例中,所述结果记录模块,还用于:
在所述将所述笔画定位结果集作为文字定位结果之前,计算所述定位结果集中所记录的笔画宽度的中值;
将所述定位结果集中记录的边缘点中,笔画宽度大于所述中值的边缘点对应的笔画宽度更改为所述中值。
在本发明实施例的第三方面,提供了一种电子设备,包括:
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面任一所述的文字定位方法。
在本发明实施例的第四方面,提供了一种计算机刻度存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的文字定位方法。
本发明实施例提供的文字定位方法、装置及电子设备,可以基于SWT利用笔画两个边缘近似平行的特点,对图像中的笔画进行定位的基础上,利用文字区域的连通特性,对文字的特殊笔画进行准确定位,因此得到的文字定位结果更加准确。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的文字定位方法的一种流程示意图;
图2为本发明实施例提供的文字定位方法的另一种流程示意图;
图3为本发明实施例提供的文字定位装置的一种结构示意图;
图4为本发明实施例提供的电子设备的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1所示为本发明实施例提供的文字定位方法的一种流程示意图,可以包括:
S101,对待处理图像进行边缘检测,得到待处理图像中的初始边缘点集。
可以理解的是,待处理图像中除了文字区域以外,还可能存在噪声区域,因此在对待处理图像进行边缘检测时,得到的初始边缘点集中可能同时包括文字区域的边缘点,以及噪声区域的边缘点。因此进行边缘检测得到的初始边缘点集无法直接作为文字定位结果。
S102,针对多个边缘点中的每个边缘点,确定该边缘带你是否存在对应的笔画宽度。
其中,笔画宽度用于表示该边缘点所属笔画在该边缘点处的宽度。
在一种可能的实施例中,以待处理图像中文字区域亮度低于背景区域亮度的情况为例(如白底黑字的图像中),可以是针对初始边缘点集中的每个边缘点,沿该边缘点的梯度方向引出射线,在该应用场景中,梯度方向即为该边缘点指向文字区域内部的方向。如果该射线与其他边缘点相交,并且交点的梯度方向的反方向,与该边缘点的梯度方向的夹角小于预设角度阈值(例如30°),并且该交点与该边缘点之间的距离小于预设距离阈值,则可以确定该边缘点存在对应的笔画宽度,并且笔画宽度为该边缘点与该交点之间的距离。如果对于该边缘点所引出的射线,存在多个满足上述条件的交点,则可以是将这多个交点中距离该边缘点最近的交点,与该边缘点之间的距离作为该边缘点对应的笔画宽度。
对于待处理图像中文字区域亮度高于背景区域亮度的情况(如黑底白字的图像中),可以是沿边缘点的梯度方向的反方向引出射线,由于原理是相同的,并且可以通过对图像进行滤镜处理,使得文字区域亮度高于背景区域亮度的图像转变为文字区域亮度低于背景区域亮度的图像,因此对于这种情况不做过多描述。
可以理解的是,如果一个边缘点为文字区域的边缘点,则该边缘点至少属于一个笔画,在不考虑一些特殊笔画的情况下,可以认为一个笔画的两个边缘近似平行,因此文字区域的边缘点沿梯度方向引出的射线在一定距离内(笔画的宽度是有限的)将与所属笔画的另一个边缘存在一个交点,并且该交点的梯度方向与该边缘点的梯度方向大致相反。而噪声区域往往是不规则的,因此噪声区域的边缘点沿梯度方向引出的射线,可能不存在满足上述条件的交点。故而可以认为初始边缘点集中存在对应笔画宽度的边缘点为文字区域的边缘点,而不存在对应笔画宽度的边缘点可能为噪声区域的边缘点。
S103,如果初始边缘点集中的该边缘点存在对应的笔画宽度,则将该边缘点记录于定位结果集。
如前述分析,定位结果集中记录的边缘点,可以视为文字区域的边缘点。
S104,重置执行以下步骤,直至剩余边缘点集中不存在满足预设条件的边缘点:针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件,如果满足,则将该边缘点记录于定位结果集。
其中,剩余边缘点集为初始边缘点中未记录于定位结果集的边缘点组成的集合。示例性的,假设初始边缘点集中包括边缘点1、边缘点2、边缘点3,定位结果集中包括边缘点1、边缘点3,则剩余边缘点集中包括边缘点2。预设条件为定位结果集中存在与该边缘点相邻的边缘点。
如前述分析,在不考虑特殊笔画的情况下,可以认为记录于笔画宽度结果中的边缘点为文字区域的边缘点,未记录于笔画宽度结果中的边缘点为噪声区域的边缘点。但是,在考虑到如撇、捺等特殊笔画的情况下,由于这些笔画中两个边缘并不满足近似平行的条件,因此这些笔画的边缘点可能未记录于定位结果集中。因此在这些情况下,剩余边缘点集中也可能包括文字区域的边缘点。
而文字区域往往具有连通性,即可以认为如果一个边缘点与文字区域的边缘点相邻,则该边缘点也为文字区域的边缘点。因此,如果剩余边缘点集中的一个边缘点,与定位结果集中的一个边缘点相邻,则可以认为剩余边缘点集中的该边缘点是文字区域的边缘点,应当记录于定位结果集中。
可以理解的是,如果剩余边缘点集中存在边缘点,与定位结果集中的边缘点相邻,则在执行S104的过程中,剩余边缘点集中的该边缘点会被记录于定位结果集。而当定位结果集中记录有新的边缘点后,剩余边缘点集中原先不与定位结果集中的边缘点相邻的边缘点,可能变得与定位结果集中的边缘点相邻。因此需要重复执行S104,直至剩余边缘点集中不存在满足预设条件的边缘点。可以认为此时,定位结果集中已经记录有文字区域所有(或近乎所有)的边缘点,因此可以根据定位结果集,确定文字定位结果。
S105,根据定位结果集,确定文字定位结果。
根据文字定位结果的表示方式不同,确定文字定位结果的方式也可以不同。示例性的,如果文字定位结果是以文字区域的边缘点的形式表示的,则可以是将定位结果集中记录的边缘点,作为文字定位结果。如果文字定位结果是以属于文字联连通区域的像素点的形式表示的,则可以是将定位结果集中记录的边缘点,以及这些边缘点对应的笔画宽度,作为文字定位结果。
选用该实施例,可以基于SWT利用笔画两个边缘近似平行的特点,对图像中的笔画进行定位的基础上,利用文字区域的连通特性,对文字的特殊笔画进行准确定位,因此得到的文字定位结果更加准确。
为描述方便,下面将结合具体的应用场景的对本发明提供的文字定位方法进行说明。可以参见图2,包括:
S201,对输入图像进行灰度化处理,得到待处理图像。
对于文字区域的亮度高于背景区域的亮度的图像,可以额外进行滤镜处理,以使得得到的待处理图像中文字区域的亮度低于背景区域的亮度。
S202,对待处理图像进行边缘检测,得到初始边缘点集M{Pc},并构建剩余边缘点集M{Pr}。
其中,初始的M{Pr}=M{Pc},即初始的剩余边缘点集中所包括的边缘点与初始边缘点集相同。
S203,针对M{Pc}中的每个边缘点,沿该边缘点的梯度方向引出射线,,并设置最大寻找宽度width。
width的取值可以根据实际需求或者用户经验进行设置。
S204,确定M{Pc}中的该边缘点引出的射线是否与M{Pc}中的其他边缘点存在满足判定条件的交点,如果该边缘点引出的射线与其他边缘点存在满足判定条件的交点,执行S205,如果不满足判定条件,执行S206。
判定条件为M{Pc}中的该边缘点与该交点的梯度方向大致相反,并且该边缘点与该交点的距离小于width。其中,大致相反是指该边缘点的梯度方向,与该交点的梯度方向的反方向之间的夹角,小于预设角度阈值(也可以是指该边缘点的梯度方向的反方向,与该交点的梯度方向之间的夹角,小于预设角度阈值)。
S205,在定位结果集M{P,W}中记录M{Pc}中的该边缘点,以及该边缘点与该交点之间的距离作为该边缘点对应的笔画宽度,并在M{Pr}中删除M{Pc}中的该边缘点。
其中,M{P,W}中的P表示记录于定位结果集中的边缘点,W表示该边缘点对应的笔画宽度。如果M{Pc}中的该边缘点引出的射线与M{Pc}中的其他边缘点存在多个满足判定条件的交点,则将这些交点中距离M{Pc}中的该边缘点最近的交点,与M{Pc}中的该边缘点之间的距离作为M{Pc}中的该边缘点对应的笔画宽度。
S206,不在M{P,W}中记录该边缘点。
S207,计算M{P,W}中记录的笔画宽度的中值,并将M{P,W}中大于该中值的笔画宽度修改为该中值。
示例性的,假设M{P,W}一共记录有5个笔画宽度,分别为3、3、7、3、3,则可以是将这五个笔画宽度按照从小到大的顺序排列,得到序列{3,3,3,3,7},并将其中第三个值(即3)作为笔画宽度的中值。
可以理解的是,在一些笔画交叉处可能导致计算得到的笔画宽度,比实际的笔画宽度更大,可以认为一个字的不同笔画的宽度应当相近,因此可以用笔画宽度的中值对这些计算错误的笔画宽度进行校正。
S208,重复执行以下步骤,直至M{P,W}不再增加新的边缘点:遍历M{Pr}中剩余的边缘点,如果该边缘点与M{P,W}中的边缘点相邻,则将该边缘点,以及该边缘点对应的笔画宽度记录于M{P,W}中,并在M{Pr}中删除该边缘点。
可以是沿该边缘点的梯度方向引出射线,如果该射线与M{Pc}中的另一个边缘点(可以理解的是,如果一个边缘点属于M{Pr},则该边缘点属于M{Pc})相交,并且该边缘点与该另一个边缘点的距离小于width,则将该边缘点与该另一个边缘点之间的距离作为该边缘点对应的笔画宽度。
如果该射线没有与M{Pc}中的另一个边缘点相交,或者,该边缘点与该另一个边缘点之间的距离不小于width,则可以是将预设值(如1、width等)作为该边缘点对应的笔画宽度,也可以是将W{P,W}中笔画宽度的中值作为该边缘点对应的笔画宽度,本实施例对此不做限制。
S209,将M{P,W}作为文字定位结果。
参见图3,图3所示为本发明实施例提供的文字定位装置的一种结构示意图,可以包括:
边缘检测模块301,用于对待处理图像进行边缘检测,得到待处理图像中的初始边缘点集;
第一确定模块302,针对初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度,笔画宽度用于表示该边缘点所属笔画在该边缘点处的宽度;
结果记录模块303,用于如果初始边缘点集中的该边缘点存在对应的笔画宽度,则将该边缘点记录于定位结果集;并
第二确定模块304,用于重复执行如下步骤,直至剩余边缘点集中不存在满足预设条件的边缘点:
针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件,
如果满足,则结果记录模块303将该边缘点记录于定位结果集;其中,剩
余边缘点集为初始边缘点集中未记录于定位结果集的边缘点组成的集合,
预设条件为定位结果集中存在与该边缘点相邻的边缘点;
文字定位模块305,用于根据定位结果集,确定文字定位结果。
在一种可能的实施例中,第一确定模块302,具体用于:
针对初始边缘点集中的每个边缘点,沿该边缘点的梯度方向引出射线;
如果射线与初始边缘点集中的其他边缘点相交,并且交点的梯度方向的反方向,与该边缘点的梯度方向的夹角小于预设角度阈值,并且交点与该边缘点之间的距离小于预设距离阈值,则确定该边缘点存在对应的笔画宽度;
如果射线与初始边缘点集中的其他边缘点不相交,或者交点的梯度方向的反方向,与该边缘点的梯度方向的夹角不小于预设角度阈值,或者交点与该边缘点之间的距离不小于预设距离阈值,则确定该边缘点不存在对应的笔画宽度。
在一种可能的实施例中,结果记录模块303,还用于:
在初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度之后,如果初始点集中的该边缘点存在对应的笔画宽度,将该边缘点对应的笔画宽度记录于定位结果集;
第二确定模块304,还用于在针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件之后,如果剩余边缘点集中的该边缘点满足预设条件,则确定沿该边缘点的梯度方向引出的射线上是否存在初始边缘点集中的其他边缘点,并且该边缘点与该其他边缘点之间的距离小于预设距离阈值;
如果存在,并且该边缘点与该其他边缘点之间的距离小于预设距离阈值,则结果记录模块303将该边缘点与该其他边缘点之间的距离作为该边缘点对应的笔画宽度,记录于定位结果集;
文字定位模块305,具体用于:
将定位结果集作为文字定位结果。
在一种可能的实施例中,结果记录模块303,还用于:
如果沿剩余边缘点集中的该边缘点的梯度方向引出的射线上不存在初始边缘点集中的其他边缘点,或者,该边缘点与该其他边缘点之间的距离不小于预设距离阈值,则
将记录于定位结果集中的边缘点对应的笔画宽度的中值作为剩余边缘点集中的该边缘点的笔画宽度,并记录于定位结果集;或者,
将预设的笔画宽度作为剩余边缘点集中的该边缘点的笔画宽度,并记录于定位结果集。
在一种可能的实施例中,结果记录模块303,还用于:
在将笔画定位结果集作为文字定位结果之前,计算定位结果集中所记录的笔画宽度的中值;
将定位结果集中记录的边缘点中,笔画宽度大于中值的边缘点对应的笔画宽度更改为中值。
本发明实施例还提供了一种电子设备,如图4所示,包括:
存储器401,用于存放计算机程序;
处理器402,用于执行存储器401上所存放的程序时,实现如下步骤:
对待处理图像进行边缘检测,得到待处理图像中的初始边缘点集;
针对初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度,笔画宽度用于表示该边缘点所属笔画在该边缘点处的宽度;
如果初始边缘点集中的该边缘点存在对应的笔画宽度,则将该边缘点记录于定位结果集;并
重复执行如下步骤,直至剩余边缘点集中不存在满足预设条件的边缘点:
针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件,
如果满足,则将该边缘点记录于定位结果集;其中,剩余边缘点集为初始
边缘点集中未记录于定位结果集的边缘点组成的集合,预设条件为定位结
果集中存在与该边缘点相邻的边缘点;
根据定位结果集,确定文字定位结果。
在一种可能的实施例中,针对初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度,包括:
针对初始边缘点集中的每个边缘点,沿该边缘点的梯度方向引出射线;
如果射线与初始边缘点集中的其他边缘点相交,并且交点的梯度方向的反方向,与该边缘点的梯度方向的夹角小于预设角度阈值,并且交点与该边缘点之间的距离小于预设距离阈值,则确定该边缘点存在对应的笔画宽度;
如果射线与初始边缘点集中的其他边缘点不相交,或者交点的梯度方向的反方向,与该边缘点的梯度方向的夹角不小于预设角度阈值,或者交点与该边缘点之间的距离不小于预设距离阈值,则确定该边缘点不存在对应的笔画宽度。
在一种可能的实施例中,在针对初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度之后,方法还包括:
如果初始点集中的该边缘点存在对应的笔画宽度,将该边缘点对应的笔画宽度记录于定位结果集;
在针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件之后,方法还包括:
如果剩余边缘点集中的该边缘点满足预设条件,则确定沿该边缘点的梯度方向引出的射线上是否存在初始边缘点集中的其他边缘点,并且该边缘点与该其他边缘点之间的距离小于预设距离阈值;
如果存在,并且该边缘点与该其他边缘点之间的距离小于预设距离阈值,则将该边缘点与该其他边缘点之间的距离作为该边缘点对应的笔画宽度,记录于定位结果集;
根据定位结果集,确定文字定位结果,包括:
将定位结果集作为文字定位结果。
在一种可能的实施例中,方法还包括:
如果沿剩余边缘点集中的该边缘点的梯度方向引出的射线上不存在初始边缘点集中的其他边缘点,或者,该边缘点与该其他边缘点之间的距离不小于预设距离阈值,则
将记录于定位结果集中的边缘点对应的笔画宽度的中值作为剩余边缘点集中的该边缘点的笔画宽度,并记录于定位结果集;或者,
将预设的笔画宽度作为剩余边缘点集中的该边缘点的笔画宽度,并记录于定位结果集。
在一种可能的实施例中,在将笔画定位结果集作为文字定位结果之前,方法还包括:
计算定位结果集中所记录的笔画宽度的中值;
将定位结果集中记录的边缘点中,笔画宽度大于中值的边缘点对应的笔画宽度更改为中值。
上述电子设备提到的存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可能的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一文字定位方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一文字定位方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质以及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (12)
1.一种文字定位方法,其特征在于,所述方法包括:
对待处理图像进行边缘检测,得到所述待处理图像中的初始边缘点集;
针对所述初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度,所述笔画宽度用于表示该边缘点所属笔画在该边缘点处的宽度;
如果所述初始边缘点集中的该边缘点存在对应的笔画宽度,则将该边缘点记录于定位结果集;并
重复执行如下步骤,直至剩余边缘点集中不存在满足预设条件的边缘点:
针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件,如果满足,则将该边缘点记录于所述定位结果集;其中,所述剩余边缘点集为所述初始边缘点集中未记录于所述定位结果集的边缘点组成的集合,所述预设条件为所述定位结果集中存在与该边缘点相邻的边缘点;
根据所述定位结果集,确定文字定位结果。
2.根据权利要求1所述的方法,其特征在于,所述针对所述初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度,包括:
针对所述初始边缘点集中的每个边缘点,沿该边缘点的梯度方向引出射线;
如果所述射线与所述初始边缘点集中的其他边缘点相交,并且交点的梯度方向的反方向,与该边缘点的梯度方向的夹角小于预设角度阈值,并且所述交点与该边缘点之间的距离小于预设距离阈值,则确定该边缘点存在对应的笔画宽度;
如果所述射线与初始边缘点集中的其他边缘点不相交,或者交点的梯度方向的反方向,与该边缘点的梯度方向的夹角不小于预设角度阈值,或者交点与该边缘点之间的距离不小于所述预设距离阈值,则确定该边缘点不存在对应的笔画宽度。
3.根据权利要求1或2所述的方法,其特征在于,在所述针对所述初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度之后,所述方法还包括:
如果所述初始点集中的该边缘点存在对应的笔画宽度,将该边缘点对应的笔画宽度记录于所述定位结果集;
在所述针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件之后,所述方法还包括:
如果所述剩余边缘点集中的该边缘点满足所述预设条件,则确定沿该边缘点的梯度方向引出的射线上是否存在所述初始边缘点集中的其他边缘点,并且该边缘点与该其他边缘点之间的距离小于所述预设距离阈值;
如果存在,并且该边缘点与该其他边缘点之间的距离小于所述预设距离阈值,则将该边缘点与该其他边缘点之间的距离作为该边缘点对应的笔画宽度,记录于所述定位结果集;
所述根据所述定位结果集,确定文字定位结果,包括:
将所述定位结果集作为文字定位结果。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
如果沿所述剩余边缘点集中的该边缘点的梯度方向引出的射线上不存在所述初始边缘点集中的其他边缘点,或者,该边缘点与该其他边缘点之间的距离不小于所述预设距离阈值,则
将记录于所述定位结果集中的边缘点对应的笔画宽度的中值作为所述剩余边缘点集中的该边缘点的笔画宽度,并记录于所述定位结果集;或者,
将预设的笔画宽度作为所述剩余边缘点集中的该边缘点的笔画宽度,并记录于所述定位结果集。
5.根据权利要求3所述的方法,其特征在于,在所述将所述笔画定位结果集作为文字定位结果之前,所述方法还包括:
计算所述定位结果集中所记录的笔画宽度的中值;
将所述定位结果集中记录的边缘点中,笔画宽度大于所述中值的边缘点对应的笔画宽度更改为所述中值。
6.一种文字定位装置,其特征在于,所述装置包括:
边缘检测模块,用于对待处理图像进行边缘检测,得到所述待处理图像中的初始边缘点集;
第一确定模块,针对所述初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度,所述笔画宽度用于表示该边缘点所属笔画在该边缘点处的宽度;
结果记录模块,用于如果所述初始边缘点集中的该边缘点存在对应的笔画宽度,则将该边缘点记录于定位结果集;并
第二确定模块,用于重复执行如下步骤,直至剩余边缘点集中不存在满足预设条件的边缘点:
针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件,如果满足,则所述结果记录模块将该边缘点记录于所述定位结果集;其中,所述剩余边缘点集为所述初始边缘点集中未记录于所述定位结果集的边缘点组成的集合,所述预设条件为所述定位结果集中存在与该边缘点相邻的边缘点;
文字定位模块,用于根据所述定位结果集,确定文字定位结果。
7.根据权利要求6所述的装置,其特征在于,所述第一确定模块,具体用于:
针对所述初始边缘点集中的每个边缘点,沿该边缘点的梯度方向引出射线;
如果所述射线与所述初始边缘点集中的其他边缘点相交,并且交点的梯度方向的反方向,与该边缘点的梯度方向的夹角小于预设角度阈值,并且所述交点与该边缘点之间的距离小于预设距离阈值,则确定该边缘点存在对应的笔画宽度;
如果所述射线与初始边缘点集中的其他边缘点不相交,或者交点的梯度方向的反方向,与该边缘点的梯度方向的夹角不小于预设角度阈值,或者交点与该边缘点之间的距离不小于所述预设距离阈值,则确定该边缘点不存在对应的笔画宽度。
8.根据权利要求6或7所述的装置,其特征在于,所述结果记录模块,还用于:
在所述针对所述初始边缘点集中的每个边缘点,确定该边缘点是否存在对应的笔画宽度之后,如果所述初始点集中的该边缘点存在对应的笔画宽度,将该边缘点对应的笔画宽度记录于所述定位结果集;
所述第二确定模块,还用于在所述针对剩余边缘点集中的每个边缘点,确定该边缘点是否满足预设条件之后,如果所述剩余边缘点集中的该边缘点满足所述预设条件,则确定沿该边缘点的梯度方向引出的射线上是否存在所述初始边缘点集中的其他边缘点,并且该边缘点与该其他边缘点之间的距离小于所述预设距离阈值;
如果存在,并且该边缘点与该其他边缘点之间的距离小于所述预设距离阈值,则所述结果记录模块将该边缘点与该其他边缘点之间的距离作为该边缘点对应的笔画宽度,记录于所述定位结果集;
所述文字定位模块,具体用于:
将所述定位结果集作为文字定位结果。
9.根据权利要求8所述的装置,其特征在于,所述结果记录模块,还用于:
如果沿所述剩余边缘点集中的该边缘点的梯度方向引出的射线上不存在所述初始边缘点集中的其他边缘点,或者,该边缘点与该其他边缘点之间的距离不小于所述预设距离阈值,则
将记录于所述定位结果集中的边缘点对应的笔画宽度的中值作为所述剩余边缘点集中的该边缘点的笔画宽度,并记录于所述定位结果集;或者,
将预设的笔画宽度作为所述剩余边缘点集中的该边缘点的笔画宽度,并记录于所述定位结果集。
10.根据权利要求8所述的装置,其特征在于,所述结果记录模块,还用于:
在所述将所述笔画定位结果集作为文字定位结果之前,计算所述定位结果集中所记录的笔画宽度的中值;
将所述定位结果集中记录的边缘点中,笔画宽度大于所述中值的边缘点对应的笔画宽度更改为所述中值。
11.一种电子设备,其特征在于,包括:
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910385742.3A CN110188622B (zh) | 2019-05-09 | 2019-05-09 | 一种文字定位方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910385742.3A CN110188622B (zh) | 2019-05-09 | 2019-05-09 | 一种文字定位方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110188622A true CN110188622A (zh) | 2019-08-30 |
CN110188622B CN110188622B (zh) | 2021-08-06 |
Family
ID=67715920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910385742.3A Active CN110188622B (zh) | 2019-05-09 | 2019-05-09 | 一种文字定位方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110188622B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103093228A (zh) * | 2013-01-17 | 2013-05-08 | 上海交通大学 | 一种在自然场景图像中基于连通域的中文检测方法 |
CN107038409A (zh) * | 2016-02-03 | 2017-08-11 | 斯特拉德视觉公司 | 检测图像中所含文本的方法、装置和计算机可读记录介质 |
CN107545223A (zh) * | 2016-06-29 | 2018-01-05 | 腾讯科技(深圳)有限公司 | 图像识别方法及电子设备 |
CN108038486A (zh) * | 2017-12-05 | 2018-05-15 | 河海大学 | 一种文字检测方法 |
CN108256518A (zh) * | 2017-11-30 | 2018-07-06 | 北京元心科技有限公司 | 文字区域检测方法及装置 |
US20180307942A1 (en) * | 2015-06-05 | 2018-10-25 | Gracenote, Inc. | Logo Recognition in Images and Videos |
CN109460763A (zh) * | 2018-10-29 | 2019-03-12 | 南京大学 | 一种基于多层次文本组件定位与生长的文本区域提取方法 |
-
2019
- 2019-05-09 CN CN201910385742.3A patent/CN110188622B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103093228A (zh) * | 2013-01-17 | 2013-05-08 | 上海交通大学 | 一种在自然场景图像中基于连通域的中文检测方法 |
US20180307942A1 (en) * | 2015-06-05 | 2018-10-25 | Gracenote, Inc. | Logo Recognition in Images and Videos |
CN107038409A (zh) * | 2016-02-03 | 2017-08-11 | 斯特拉德视觉公司 | 检测图像中所含文本的方法、装置和计算机可读记录介质 |
CN107545223A (zh) * | 2016-06-29 | 2018-01-05 | 腾讯科技(深圳)有限公司 | 图像识别方法及电子设备 |
CN108256518A (zh) * | 2017-11-30 | 2018-07-06 | 北京元心科技有限公司 | 文字区域检测方法及装置 |
CN108038486A (zh) * | 2017-12-05 | 2018-05-15 | 河海大学 | 一种文字检测方法 |
CN109460763A (zh) * | 2018-10-29 | 2019-03-12 | 南京大学 | 一种基于多层次文本组件定位与生长的文本区域提取方法 |
Non-Patent Citations (1)
Title |
---|
BORIS EPSHTEIN ET AL.: "detecting text in natural scenes with stroke width transform", 《2010 IEEE COMPUTER SOCIETY CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110188622B (zh) | 2021-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110765770A (zh) | 一种合同自动生成方法及装置 | |
CN109697414B (zh) | 一种文本定位方法及装置 | |
CN112560862B (zh) | 文本识别方法、装置及电子设备 | |
CN110083475B (zh) | 一种异常数据的检测方法及装置 | |
CN108170806B (zh) | 敏感词检测过滤方法、装置和计算机设备 | |
CN111178147A (zh) | 屏幕破碎分级方法、装置、设备及计算机可读存储介质 | |
US10067926B2 (en) | Image processing system and methods for identifying table captions for an electronic fillable form | |
CN113297409A (zh) | 一种图像搜索方法、装置、电子设备及存储介质 | |
CN113420848A (zh) | 神经网络模型的训练方法及装置、手势识别的方法及装置 | |
CN115357155A (zh) | 窗口识别方法、装置、设备及计算机可读存储介质 | |
CN110287361B (zh) | 一种人物图片筛选方法及装置 | |
CN107992495B (zh) | 高维数据集的数据可视化分析方法及装置 | |
CN112329409B (zh) | 一种单元格颜色转换方法、装置及电子设备 | |
CN110188622B (zh) | 一种文字定位方法、装置及电子设备 | |
CN107909054A (zh) | 图片文本的相似度评价方法及装置 | |
CN111768345A (zh) | 身份证背面图像的校正方法、装置、设备及存储介质 | |
CN110647595B (zh) | 一种新增兴趣点的确定方法、装置、设备和介质 | |
CN110688995A (zh) | 地图查询的处理方法,计算机可读存储介质和移动终端 | |
CN115797955A (zh) | 基于单元格约束的表格结构识别方法及其应用 | |
CN115237355A (zh) | 一种基于闪存数据类识别的定向交换方法及系统 | |
CN111310442B (zh) | 形近字纠错语料挖掘方法、纠错方法、设备及存储介质 | |
CN111522570B (zh) | 目标库更新方法、装置、电子设备及机器可读存储介质 | |
CN109992749A (zh) | 一种文字显示方法、装置、电子设备及可读存储介质 | |
CN114037912A (zh) | 遥感图像的变化检测方法、装置及计算机可读存储介质 | |
CN113762292A (zh) | 一种训练数据获取方法、装置及模型训练方法、装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |