CN110717492B - 基于联合特征的图纸中字符串方向校正方法 - Google Patents

基于联合特征的图纸中字符串方向校正方法 Download PDF

Info

Publication number
CN110717492B
CN110717492B CN201910983293.2A CN201910983293A CN110717492B CN 110717492 B CN110717492 B CN 110717492B CN 201910983293 A CN201910983293 A CN 201910983293A CN 110717492 B CN110717492 B CN 110717492B
Authority
CN
China
Prior art keywords
character
characters
character string
angle
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910983293.2A
Other languages
English (en)
Other versions
CN110717492A (zh
Inventor
伍瑞卿
杨继豪
张琳琳
陈伟
顾庆水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201910983293.2A priority Critical patent/CN110717492B/zh
Publication of CN110717492A publication Critical patent/CN110717492A/zh
Application granted granted Critical
Publication of CN110717492B publication Critical patent/CN110717492B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种基于联合特征的图纸中字符串方向校正方法,其包括提取字符串图像中字符的最小外接矩形;选取字符的最小外接矩形的长边方向作为主方向,并在长边上任意选取两个不相同的点,计算每个字符的方向角度;根据字符的最小外接矩形的长边和短边,计算字符的边长比,并将边长比大于等于预设阈值的字符标记为第一类字符;基于字符Hu不变矩,提取第一类字符的矩特征,并根据矩特征,采用已训练的SVM分类器对每个字符进行分类;根据分类结果更新其方向角度;根据字符串中字符数量与预设数量时,采用K均值聚类算法或算术平均值的方式得到字符串的主方向旋转角度,之后采用主方向旋转角度对字符串的主方向进行校正。

Description

基于联合特征的图纸中字符串方向校正方法
技术领域
本发明涉及图像处理技术,具体涉及一种基于联合特征的图纸中字符串方向校正方法。
背景技术
常见的图纸有工程图纸和机械图纸两大类。工程图纸是工程设计、施工和验收等环节中的重要依据。机械图纸是机械零部件的设计、加工和质量检查的重要依据。每一类图纸中的字符标注是图纸中一种关键数据。图纸中的图像前景复杂,但背景较为简单,没有丰富的色彩信息;标注串分布不均,方向各异,穿插在图像的各个位置。自动提取和识别字符标注串可以帮助人们快速识别、理解、管理图纸,以及利用图纸进行质量检测和质量控制,解决人工长时间阅读图纸带来的疲劳、注意力容易不集中、效率低等问题。图纸的字符识别步骤一般分为以下几步:
(1)字符检测,基于字符特征和检测算法,获得图纸中字符的位置,即定位标注串中的字符。常见的字符检测方法是基于笔画宽度、极值稳定性、DCT或者小波频域系数等特征检测字符。近年来,有人借助针对自然场景中的深度学习方法检测字符。还有人利用字符形态特征,将字符与图纸线条分离,从而实现字符检测。
(2)标注串分割,通过形态滤波、旋转投影、字符切割等处理,分离字符与背景粘连的点线,剔除干扰线元素,将字符与背景分离,保留标注串的字符;并对字符进行重组,从而分理出一个完整的标出串图像。字符检测和字符串分割的操作容易引起字符的形态失真和扭曲字符原本的方向。
(3)标注串的字符校正,为了紧凑安排图纸中的布局和便于用户理解,图纸中标注串的字符方向非常灵活,各个方向的字符串都可能存在,这给计算机自动提取和识别标出字符串造成了困难。
(4)标注串的字符识别;采用OCR技术,识别标注串中的字符。
在整个图纸的标注串的识别过程中,无论是利用传统算法识别图纸文字,还是利用深度学习进行识别,面对那些复杂的倾斜角度不一的标注串,都需要进行校正处理,否则会增加识别过程的计算量和算法复杂度。
目前常规的字符倾斜旋转校正方法主要有以下几类:基于文本行直线检测的倾斜校正方法、基于角点和投影的倾斜校正方法,还有基于深度学习的畸变矫正方法,虽然这三类方法能够在一定程度上校正字符倾斜,但仍存在如下缺陷:
基于文本行直线检测的倾斜校正方法缺点是对于工程图纸中较为复杂的排列杂乱未能形成文本行的图片,其效果不佳;基于角点和投影的倾斜校正方法缺点是于工程图纸中字符排列可能存在多行错位的情况,不能保有良好的鲁棒性;现有基于深度学习的畸变矫正方法缺点是对于工程图纸中,字符存在自由方向的旋转,而非扭曲畸变,因此该方法可行性不高,而且深度学习训练时间长,需要大量的资源开销,不够经济适用。
发明内容
针对现有技术中的上述不足,本发明提供了一种校准精度高的基于联合特征的图纸中字符串方向校正方法。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种基于联合特征的图纸中字符串方向校正方法,其包括:
S1、获取待校正的字符串图像,并提取字符串中每个字符的连通域的最小外接矩形;
S2、选取字符的最小外接矩形的长边方向作为主方向,并在长边上任意选取两个不相同的点,基于两个点的坐标计算出每个字符的方向角度;
S3、根据字符的最小外接矩形的长边和短边,计算字符的边长比,并将边长比大于或者等于预设阈值的字符标记为第一类字符;
S4、基于字符Hu不变矩,提取第一类字符的矩特征,并根据每个第一类字符的矩特征,采用已训练的SVM分类器对第一类字符进行分类;
S5、根据分类结果查找对应字符的补偿角度,更新其方向角度=方向角度+补偿角度;
S6、当字符串中字符数量大于预设数量时,采用K均值聚类算法从所有的字符方向角度中选取字符串的主方向旋转角度;
S7、当字符串中字符数量小于或者等于预设数量时,采用所有字符的方向角度的算术平均值作为字符串的主方向旋转角度;
S8、根据主方向旋转角度,对字符串图像中字符串的主方向进行校正。
本发明的有益效果为:本方案针对图纸中字符的方向特点,用于已经定位了字符所在的区域并且分割出来的字符串,提取每个字符的连通域最小外接矩形,并以长边方向作为字符的主方向,经过分类补偿和聚类提取主方向角度作为字符串的主方向旋转角度,最后进行旋转校正。
本方案通过Hu高阶不变矩作为特征矩和SVM分类器相结合进行角度补偿,可以对最小外接矩形方向不是字符主方向的情况进行校正,有效弥补了直接利用字符连通域外接矩形进行方向校正可能会引入的误差,使结果更加的精确,也没有造成过多的资源开销。
利用K均值(K-means)算法对字符主方向特征进行聚类,进一步达到精确提取字符串中各个字符的方向角,从而来获取需要校正的角度。本方法直观有效,计算速度快,能够较好较快地实现图纸上字符串的方向校正
附图说明
图1为基于联合特征的图纸中字符串方向校正方法的流程图。
图2为输入的倾斜字符串的图像。
图3为字符的最小外接矩形和主方向dv
图4为主方向聚类校正条件不满足的图片。
图5为获得主方向RA后旋转结果,其中(a)为原始图片,(b)旋转后的图片。
图6为实施例中输入的部分样图示例。
图7为实施例中输入的部分样图校正后的示例。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
参考图1,图1示出了基于联合特征的图纸中字符串方向校正方法的流程图;如图1所示,该方法S包括步骤S1至步骤S8。
在步骤S1中,获取待校正的字符串图像,并提取字符串中每个字符的连通域的最小外接矩形;本方案获取的字符串图像是已经经过字符检测和分割后获得的倾斜标注串,本方案输入字符串图像示例可以参见图2。
实施时,本方案优选所述提取字符串中每个字符的连通域的最小外接矩形进一步包括:
采用连通域检测方法提取字符串图像中每个字符包含的所有像素点;
根据凸包理论,计算出完全包含点集的最小的凸多边形凸包;
采用旋转卡壳算法计算出凸包的最小外接矩形。
在步骤S2中,选取字符的最小外接矩形的长边方向作为主方向,并在长边上任意选取两个不相同的点,基于两个点的坐标计算出每个字符的方向角度;
标注串字符包含了两个方向,一种是平行于标注字符串的文本行所在的方向dh,另外一种是垂直于标注字符串的文本行方向的单个字符方向dv。本发明选择dv来描述字符的主方向,dv普遍为字符的长边方向,dv与图纸图像垂直方向的y轴(高度方向)的夹角RA称为标注串的旋转角,以图3为示例。
实施时,本方案优选基于两个点的坐标计算出每个字符的方向角度进一步包括:根据两个点坐标,计算字符长边的斜率;根据斜率和反正切函数,计算出每个字符主方向的方向角度。
在步骤S3中,根据字符的最小外接矩形的长边和短边,计算字符的边长比,并将边长比大于或者等于预设阈值的字符标记为第一类字符;边长比的计算公式为:Re=(V-H)/H,Re为边长比,V为字符的长边,H为字符的短边。
第一类字符指代具有显著方向的字符,将边长比小于预设阈值的字符标记为不具有显著方向的字符。
根据边长比和预设阈值的关系,可以将全部字符分为具有显著方向的和非显著方向的两大类字符。非显著方向的字符通常是具有多对称轴的字符,比如角度数(°)、圆圈(○)等。而具有显著方向的字符中还可以进一步分为两类。第一类字符是提取的方向角度δ就是字符的真实主方向dv与坐标轴的夹角,对于这类字符,不需要作额外的方向角度补偿。另外一类字符是提取的方向角θ并不是字符真实的主方向角度,比如字符4、7、Φ符号,示例如图4所示,对于这类字符,必须需要作额外的方向角度补偿,才能获得真实的字符方向。本方案对字符的完全分类如表1所示。
表1标注串中字符的分类
Figure BDA0002235904600000061
在步骤S4中,基于字符Hu不变矩,提取第一类字符的矩特征,并根据每个第一类字符的矩特征,采用已训练的SVM分类器对第一类字符进行分类,SVM分类器将字符划分为C1-C5类中的某一类。
在本发明的一个实施例中,基于字符Hu不变矩,提取第一类字符图像的矩特征进一步包括:
分别构建每个字符图像的(p+q)阶矩mpq和中心矩μpq
Figure BDA0002235904600000062
Figure BDA0002235904600000063
其中,p为x分量的阶数;q为y分量的阶数;p,q=0,1,2…;f(x,y)为字符图像中坐标(x,y)的像素值;N为字符图像高度;M为字符图像宽度;
Figure BDA0002235904600000071
Figure BDA0002235904600000072
代表字符图像的重心;μpq的归一化中心矩ηpq为:
Figure BDA0002235904600000073
其中,平均阶数ρ=(p+q)/2+1,且p+q=2,3,…;
采用二阶和三阶归一化中心矩构造4个不变矩M1、M2、M3、M4:
M1=η2002,M2=(η2002)2+4η11 2
M3=(η30-3η12)2+(3η2103)2,M4=(η3012)2+(η2103)2
对构造的4个不变矩M1、M2、M3、M4按预设比例放大得到每个第一类字符最终的矩特征。
对构造的4个不变矩M1、M2、M3、M4按预设比例放大得到每个第一类字符最终的矩特征,部分字符样本放大后的Hu不变矩参考表2。
表2部分字符样本放大后的Hu不变矩
Figure BDA0002235904600000074
对4个不变矩的数值进行放大,可以使过小的Hu不变矩能够直观呈现进行比较,以保证后续的精确分类。本发明选取4个不变矩用于步骤S5中的聚类,可以在减少提取矩特征计算的复杂度,同时还可以保证足够的精确度。
在对SVM分类器进行训练时,将每个字符的M1,M2,M3,M4,将其作为数据集SM中一个特征向量x=[M1,M2,M3,M4]T;根据其是否需要进行角度补充,可以将x的类别y设定为1或者-1;将数据集输入SVM分类中训练,识别其需要添加补偿与不需要添加补偿的字符,保存好训练的权重参数。
然后再后续的角度补偿过程中,读取权重参数,利用SVM分类模型识别出当前字符的类别,根据提前训练得出的需要添加补偿的夹角δi,在字符的最小外接矩形长边的方向角度的基础上做出补偿。
在步骤S5中,根据分类结果查找对应字符的补偿角度,更新其方向角度=方向角度+补偿角度。
在步骤S6中,当字符串中字符数量大于预设数量时,采用K均值聚类算法从所有的字符方向角度中选取字符串的主方向旋转角度。
采用K均值聚类算法从所有的字符方向角度中选取字符串的主方向旋转角度进一步为:以预设数量作为聚类中心个数,采用K均值聚类算法对所有字符的方向角度进行聚类,并选取聚类后字符最多的簇的聚类中心的方向角度作为字符串的主方向旋转角度。
在本发明的一个实施例中,采用K均值聚类算法对所有字符的方向角度进行聚类进一步包括:
S61、从采用所有字符的方向角度构成的样本集中随机选取预设数量个聚类中心,并将距离每个聚类中心最近的方向角度划分至同一簇中;
S62、计算任意两个聚类中心之间的距离,并判断所述距离是否小于预设距离,若是,则进入步骤S63,否则进入步骤S64;
S63、判断两个聚类中心对应的两簇的方向角度总个数是否大于预设总数,若是,则将两个聚类中心对应的簇合并为一个簇,之后进入步骤S64;否则直接进入步骤S64;
通过步骤S62和步骤S63中聚类中心间距离的判断,能够将部分较近的方向角度进行合并,以减少后续判断的复杂度和计算量。
S64、计算每个簇中所有方向角的平均欧式距离,并根据平均欧式距离更新各簇的聚类中心;
S65、计算误差平方和函数J:
Figure BDA0002235904600000091
其中,Aj为第j簇的聚类中心,k为聚类中心的数量;Ai为第j簇的第i个方向角,Nj为Aj所在簇的方向角总数量;||Ai-Aj||2为Ai和Aj的平均欧式距离;
S66、判断误差平方和函数J是否小于函数阈值,若是,完成K均值聚类,否则,返回步骤S61。
图文分离和字符串分割阶段所采用的旋转插值、形态学操作等可能引起字符方向偏差,使得提取的最小外接矩形存在误差。本方案通过采用K均值聚类算法进行主方向旋转角度的选取,能够获得绝大多数字符的相似主方向,以克服该问题,以保证最终旋转校正的准确性。
由于一个字符标注串中的字符方向的个数有限,而K均值算法需要先设定K的值,本方案优选将K均值聚类的初始K值设定为3,在获得的标注串的字符主方向数据中随机选取3个角度数据作为起始点,然后进入后续的聚类迭代的过程。
在步骤S7中,当字符串中字符数量小于或者等于预设数量时,采用所有字符的方向角度的算术平均值作为字符串的主方向旋转角度;
在步骤S8中,根据主方向旋转角度,对字符串图像中字符串的主方向进行校正。聚类后选取类别中样本较多的类的类中心
Figure BDA0002235904600000101
作为标注串主房向角度RA,旋转后示例如图5所示。
下面结合具体的实例,对本方案提供的校正方法的效果进行说明:
本实例使用的实验平台为:硬件环境:CPU Intel(R)Core(TM)i7-6700HQ CPU@2.60GHz 2.59GHz 8核;内存16G;显卡NVIDIA GeForce GTX 1060;软件环境:操作系统64位Windows10;OpenCV 2.4.9;编程语言为C++。
实验样图为已经定位后消除了绝大部分的外部干扰的干净标注串图片,数量为800张,字符总数约为7000个,取自若干图纸,部分样图示例如图6。
采用本方案提供的校正方法的部分样图参考图7,校正的字符串样本图总共800张图,其中正确旋转786图,旋转成功率为98.25%,总计耗时时间23秒,平均每张所需时间29毫秒。综上所述,本方案的校正方法具有较好的准确率和较快的处理速度。

Claims (7)

1.基于联合特征的图纸中字符串方向校正方法,其特征在于,包括:
S1、获取待校正的字符串图像,并提取字符串中每个字符的连通域的最小外接矩形;
S2、选取字符的最小外接矩形的长边方向作为主方向,并在长边上任意选取两个不相同的点,基于两个点的坐标计算出每个字符的方向角度;
S3、根据字符的最小外接矩形的长边和短边,计算字符的边长比,并将边长比大于或者等于预设阈值的字符标记为第一类字符;
S4、基于字符Hu不变矩,提取第一类字符的矩特征,并根据每个第一类字符的矩特征,采用已训练的SVM分类器对第一类字符进行分类;
S5、根据分类结果查找对应字符的补偿角度,更新其方向角度=方向角度+补偿角度;
S6、当字符串中字符数量大于预设数量时,采用K均值聚类算法从所有的字符方向角度中选取字符串的主方向旋转角度;
S7、当字符串中字符数量小于或者等于预设数量时,采用所有字符的方向角度的算术平均值作为字符串的主方向旋转角度;
S8、根据主方向旋转角度,对字符串图像中字符串的主方向进行校正。
2.根据权利要求1所述的基于联合特征的图纸中字符串方向校正方法,其特征在于,采用K均值聚类算法从所有的字符方向角度中选取字符串的主方向旋转角度进一步为:
以预设数量作为聚类中心个数,采用K均值聚类算法对所有字符的方向角度进行聚类,并选取聚类后字符最多的簇的聚类中心的方向角度作为字符串的主方向旋转角度。
3.根据权利要求2所述的基于联合特征的图纸中字符串方向校正方法,其特征在于,采用K均值聚类算法对所有字符的方向角度进行聚类进一步包括:
S61、从采用所有字符的方向角度构成的样本集中随机选取预设数量个聚类中心,并将距离每个聚类中心最近的方向角度划分至同一簇中;
S62、计算任意两个聚类中心之间的距离,并判断所述距离是否小于预设距离,若是,则进入步骤S63,否则进入步骤S64;
S63、判断两个聚类中心对应的两簇的方向角度总个数是否大于预设总数,若是,则将两个聚类中心对应的簇合并为一个簇,之后进入步骤S64;否则直接进入步骤S64;
S64、计算每个簇中所有方向角的平均欧式距离,并根据平均欧式距离更新各簇的聚类中心;
S65、计算误差平方和函数J:
Figure FDA0002235904590000021
其中,Aj为第j簇的聚类中心,k为聚类中心的数量;Ai为第j簇的第i个方向角,Nj为Aj所在簇的方向角总数量;||Ai-Aj||2为Ai和Aj的平均欧式距离;
S66、判断误差平方和函数J是否小于函数阈值,若是,完成K均值聚类,否则,返回步骤S61。
4.根据权利要求1所述的基于联合特征的图纸中字符串方向校正方法,其特征在于,所述提取字符串中每个字符的连通域的最小外接矩形进一步包括:
采用连通域检测方法提取字符串图像中每个字符包含的所有像素点;
根据凸包理论,计算出完全包含点集的最小的凸多边形凸包;
采用旋转卡壳算法计算出凸包的最小外接矩形。
5.根据权利要求1所述的基于联合特征的图纸中字符串方向校正方法,其特征在于,所述基于两个点的坐标计算出每个字符的方向角度进一步包括:
根据两个点坐标,计算字符长边的斜率;
根据斜率和反正切函数,计算出每个字符主方向的方向角度。
6.根据权利要求1所述的基于联合特征的图纸中字符串方向校正方法,其特征在于,所述基于字符Hu不变矩,提取第一类字符图像的矩特征进一步包括:
分别构建每个字符图像的(p+q)阶矩mpq和中心矩μpq
Figure FDA0002235904590000031
Figure FDA0002235904590000032
其中,p为x分量的阶数;q为y分量的阶数;p,q=0,1,2...;f(x,y)为字符图像中坐标(x,y)的像素值;N为字符图像高度;M为字符图像宽度;
Figure FDA0002235904590000033
Figure FDA0002235904590000034
代表字符图像的重心,μpq的归一化中心矩ηpq为:
Figure FDA0002235904590000035
其中,平均阶数ρ=(p+q)/2+1,且p+q=2,3,...;
采用二阶和三阶归一化中心矩构造4个不变矩M1、M2、M3、M4:
M1=η2002,M2=(η2002)2+4η11 2
M3=(η30-3η12)2+(3η2103)2,M4=(η3012)2+(η2103)2
对构造的4个不变矩M1、M2、M3、M4按预设比例放大得到每个第一类字符最终的矩特征。
7.根据权利要求1所述的基于联合特征的图纸中字符串方向校正方法,其特征在于,边长比的计算公式为:Re=(V-H)/H,Re为边长比,V为字符的长边,H为字符的短边。
CN201910983293.2A 2019-10-16 2019-10-16 基于联合特征的图纸中字符串方向校正方法 Active CN110717492B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910983293.2A CN110717492B (zh) 2019-10-16 2019-10-16 基于联合特征的图纸中字符串方向校正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910983293.2A CN110717492B (zh) 2019-10-16 2019-10-16 基于联合特征的图纸中字符串方向校正方法

Publications (2)

Publication Number Publication Date
CN110717492A CN110717492A (zh) 2020-01-21
CN110717492B true CN110717492B (zh) 2022-06-21

Family

ID=69211740

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910983293.2A Active CN110717492B (zh) 2019-10-16 2019-10-16 基于联合特征的图纸中字符串方向校正方法

Country Status (1)

Country Link
CN (1) CN110717492B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113554558A (zh) * 2020-04-26 2021-10-26 北京金山数字娱乐科技有限公司 一种图像处理的方法和装置
CN112383670B (zh) * 2020-11-10 2022-09-16 武汉天有科技有限公司 一种试卷扫描自动扶正方法及装置
CN112580507B (zh) * 2020-12-18 2024-05-31 合肥高维数据技术有限公司 一种基于图像矩矫正的深度学习文本字符检测方法
CN112686128B (zh) * 2020-12-28 2022-10-14 南京览众智能科技有限公司 基于机器学习的教室课桌检测方法
CN112966318B (zh) * 2021-04-12 2022-06-10 青矩技术股份有限公司 一种显示cad文件中字符的方法及终端设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2171773A1 (en) * 1995-04-28 1996-10-29 Philip Andrew Chou Automatic Training of Character Templates Using a Transcription and a Two-Dimensional Image Source Model
CN1137657A (zh) * 1995-03-08 1996-12-11 佳能株式会社 一种图像处理方法和一种图像处理装置
JPH11282959A (ja) * 1998-03-27 1999-10-15 Nec Corp 文字列照合装置、方法及び記録媒体、並びに文書分類装置、文字読み取り装置及び真贋判定装置
JP2000003407A (ja) * 1998-06-11 2000-01-07 Seiko Epson Corp 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体
CN101777124A (zh) * 2010-01-29 2010-07-14 北京新岸线网络技术有限公司 一种提取视频文本信息的方法及装置
CN102346847A (zh) * 2011-09-26 2012-02-08 青岛海信网络科技股份有限公司 一种支持向量机的车牌字符识别方法
CN103077389A (zh) * 2013-01-07 2013-05-01 华中科技大学 一种结合字符级分类和字符串级分类的文本检测和识别方法
CN105512657A (zh) * 2015-08-20 2016-04-20 北京旷视科技有限公司 字符识别方法和设备
CN108681729A (zh) * 2018-05-08 2018-10-19 腾讯科技(深圳)有限公司 文本图像矫正方法、装置、存储介质及设备
CN108780572A (zh) * 2017-02-22 2018-11-09 华为技术有限公司 图像校正的方法及装置
CN109447067A (zh) * 2018-10-24 2019-03-08 北方民族大学 一种票据方向检测矫正方法及自动检票系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1137657A (zh) * 1995-03-08 1996-12-11 佳能株式会社 一种图像处理方法和一种图像处理装置
CA2171773A1 (en) * 1995-04-28 1996-10-29 Philip Andrew Chou Automatic Training of Character Templates Using a Transcription and a Two-Dimensional Image Source Model
JPH11282959A (ja) * 1998-03-27 1999-10-15 Nec Corp 文字列照合装置、方法及び記録媒体、並びに文書分類装置、文字読み取り装置及び真贋判定装置
JP2000003407A (ja) * 1998-06-11 2000-01-07 Seiko Epson Corp 手書き文字正規化方法及び手書き文字正規化装置並びに手書き文字正規化処理プログラムを記録した記録媒体
CN101777124A (zh) * 2010-01-29 2010-07-14 北京新岸线网络技术有限公司 一种提取视频文本信息的方法及装置
CN102346847A (zh) * 2011-09-26 2012-02-08 青岛海信网络科技股份有限公司 一种支持向量机的车牌字符识别方法
CN103077389A (zh) * 2013-01-07 2013-05-01 华中科技大学 一种结合字符级分类和字符串级分类的文本检测和识别方法
CN105512657A (zh) * 2015-08-20 2016-04-20 北京旷视科技有限公司 字符识别方法和设备
CN108780572A (zh) * 2017-02-22 2018-11-09 华为技术有限公司 图像校正的方法及装置
CN108681729A (zh) * 2018-05-08 2018-10-19 腾讯科技(深圳)有限公司 文本图像矫正方法、装置、存储介质及设备
CN109447067A (zh) * 2018-10-24 2019-03-08 北方民族大学 一种票据方向检测矫正方法及自动检票系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
工程图中字符分离和标注字符串生成技术;胡友兰;黄树槐;常明;《华中理工大学学报》;19970330;第25卷(第3期);第30-33页 *
工程图纸字符串及标注信息提取;范帆;关佶红;《计算机工程与应用》;20120301;第7卷(第48期);第161-164页 *

Also Published As

Publication number Publication date
CN110717492A (zh) 2020-01-21

Similar Documents

Publication Publication Date Title
CN110717492B (zh) 基于联合特征的图纸中字符串方向校正方法
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
Yi et al. Localizing text in scene images by boundary clustering, stroke segmentation, and string fragment classification
Shahab et al. ICDAR 2011 robust reading competition challenge 2: Reading text in scene images
JP4594372B2 (ja) ドキュメント画像からのパラメータ化された形状の認識方法
CN112686812B (zh) 银行卡倾斜矫正检测方法、装置、可读存储介质和终端
JP4414401B2 (ja) 顔特徴点検出方法および装置並びにプログラム
WO2010092952A1 (ja) パターン認識装置
CN110458158B (zh) 一种针对盲人辅助阅读的文本检测与识别方法
RU2619712C1 (ru) Оптическое распознавание символов серии изображений
JP2008171411A (ja) 動的なコネクタ解析のための方法及び装置
CN108805076A (zh) 环境影响评估报告书表格文字的提取方法及系统
JP2005309608A (ja) 文字認識結果出力装置、文字認識装置、その方法及びプログラム
CN111401099A (zh) 文本识别方法、装置以及存储介质
RU2673016C1 (ru) Способы и системы оптического распознавания символов серии изображений
CN114463767A (zh) 信用证识别方法、装置、计算机设备和存储介质
CN107368826B (zh) 用于文本检测的方法和装置
CN111832497B (zh) 一种基于几何特征的文本检测后处理方法
RU2453919C1 (ru) Способ выявления спама в растровом изображении
CN111814801B (zh) 一种机械图中标注串的提取方法
CN111144469B (zh) 基于多维关联时序分类神经网络的端到端多序列文本识别方法
CN113076916A (zh) 基于几何特征加权融合的动态人脸表情识别方法及系统
CN111062393B (zh) 一种基于谱聚类的自然场景汉字分割方法
Elnabawy et al. Image based hieroglyphic character recognition
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant