CN113642573B - 一种基于栅格的图片分离方法 - Google Patents
一种基于栅格的图片分离方法 Download PDFInfo
- Publication number
- CN113642573B CN113642573B CN202110818411.1A CN202110818411A CN113642573B CN 113642573 B CN113642573 B CN 113642573B CN 202110818411 A CN202110818411 A CN 202110818411A CN 113642573 B CN113642573 B CN 113642573B
- Authority
- CN
- China
- Prior art keywords
- image
- handwriting
- grid
- point
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Character Input (AREA)
Abstract
本发明涉及一种基于栅格的图片分离方法,具体包括以下步骤:S1:利用ORB算法提取出空白图像和包含手写字的图像的特征向量;S2:利用图像特征配准所述空白图像和包含手写字的图像,使所述空白图像和包含手写字的图像中打印体的相对位置一致,获得新图像NP;S3:利用像素的栅格覆盖住所述空白图像,计算每个栅格内部像素的灰度的平均值h;取阈值p,当h<p时标记该栅格为待删除状态;S4:获得步骤S3中所有待删除栅格的位置,将步骤S2中新图像NP中相同位置的栅格全部涂成白色,从而获得原始的手写体文字。能从原图像中完全分离出干净的手写字体字符,且能够保证其灰度值不变同时实现分离出结果更加可靠性的手写体字符图像。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于栅格的图片分离方法。
背景技术
伴随着人工智能和大数据技术在实际应用中的发展,智能化教育从互联网终端发起,开始逐渐被人们所熟知,正悄无声息地改变着人们的生活观念和生活方式。智能化教育的背后,离不开庞大的数据做支撑,其中在线教育平台和考试的自动化批阅平台都需要大数据的题库。
随着人工智能的广泛应用,智能OCR变的愈发火热。而与OCR相关的图像处理技术领域更是离不开人工智能和传统技术相结合的身影。
在当今较为流行的OCR识别方面,如:手写字符的提取涉及到复杂的手印分离技术,而传统的手印分离技术虽然有着很多优势,但也存在诸多弊端,如:分离结果存在其他干扰且不够理想,分离图丢失了原始的手写像素灰度信息等。
因此,本发明为了解决传统手印分离技术存在的弊端问题,针对印刷和手写分离不干净的情形,以及二值化导致手写字符信息的丢失情况。提出了一种图像栅格化的处理方式,它可从原图像中完全分离出干净的手写字体字符,且能够保证其灰度值不变的条件下,分离出结果更加可靠性的手写体字符图像。
发明内容
本发明要解决的技术问题是,提供一种基于栅格的图片分离方法,提供一种基于栅格的手写字体图像分离方法,旨在使用空白的图像和包含手写字符图像的基础上,利用栅格做进一步处理,最后分离出原始的、干净的手写字,以便识别;且能够保证其灰度值不变的条件下,分离出结果更加可靠性的手写体字符图像。
为了解决上述技术问题,本发明采用的技术方案是:该基于栅格的图片分离方法,具体包括以下步骤:
S1:利用ORB算法提取出空白图像和包含手写字的图像的特征向量;
S2:利用图像特征配准所述空白图像和包含手写字的图像,使所述空白图像和包含手写字的图像中打印体的相对位置一致,并获得新图像NP;
S3:利用n*n(3<n<10)像素的栅格覆盖住所述空白图像,计算每个栅格内部像素的灰度平均值h;取阈值p,当h<p时标记该栅格为待删除状态;
S4:获得步骤S3中所有待删除栅格的位置,将步骤S2中新图像NP中相同位置的栅格全部涂成白色,从而获得原始的手写体文字。
采用上述技术方案,针对印刷和手写分离不干净的情形,以及二值化导致手写字符信息的丢失情况;利用ORB算法提取出空白的图像和包含手写字符图像,再利用栅格作进一步处理,最后分离出原始的、干净的手写字,以便识别;可从原图像中完全分离出干净的手写字体字符,且能够保证其灰度值不变的条件下,分离出结果更加可靠性的手写体字符图像。
作为本发明的优选技术方案,所述步骤S1的所述ORB算法是基于FAST算法与BRIEF算法的算法组合,具体步骤为:
S11利用FAST算法寻找图像的关键点:设定一个像素点P,将像素点P与多个距离该像素点P的像素为2的像素点相比较,如果至少有一对连续像素点的亮度高于或低于像素点P,则将像素点P选作关键点,从而获取若干对关键点;
S12使用BRIEF算法将关键点转换为特征向量:根据步骤S11获取的若干对关键点创建特征向量。
作为本发明的优选技术方案,所述步骤S12的具体步骤为:
S121:以关键点P为圆心,以D为半径做圆A;
S122:在圆A内随机选择N对像素点,
S123:设(X,Y)是其中的任意一对像素点,X表示像素点1,Y表示像素点2;对该对像素点采用公式(1)进行转换,公式(1)为:
其中P′(X),P′(Y)分别是像素点X,Y的灰度值;
S124:重复N次步骤S123,从而获得一个长度为N的向量,该向量即为特征向量。
作为本发明的优选技术方案,所述步骤S2的具体步骤为:
S21:采用仿射变换矩阵描述手写字的图像中打印体的字迹和空白图像中字迹的偏差;
S22:仿射变换矩阵拥有6个自由度:a、b、c、d、e、f,利用公式(2)作用到某一个点上,公式(2)为:
其中(x,y)是旧的坐标点,即为包含手写字的图像上的坐标点;(x’,y’)是新的坐标点即为空白图像的坐标点;要计算出该仿射变换矩阵的6个自由度,至少需要3组对应的坐标点;
S23:根据步骤S1中获得两张图像的所有特征向量之后,再计算特征向量之间的汉明距离,如果该距离小于阈值N’,那么就认定两张图像上的特征点能配成一对,再使用通用的最小二乘法计算仿射变换矩阵,最小二乘法是一种数学优化技术;通过最小化误差的平方和寻找数据的最佳函数匹配;
S24:在得到相应仿射变换矩阵之后,将该矩阵作用到包含手写字的图像就能得到一张消除误差后的新图像NP。
与现有技术相比,本发明具有的有益效果是:该基于栅格的图片分离方法可从原图像中完全分离出干净的手写字体字符,且能够保证其灰度值不变的条件下,分离出结果更加可靠性的手写体字符图像。
附图说明
下面结合附图进一步描述本发明的技术方案:
图1是本发明的基于栅格的图片分离方法的流程图;
图2是本发明的基于栅格的图片分离方法的原包含手写字的图像;
图3是采用本发明的基于栅格的图片分离方法对图2进行分离后的效果图。
具体实施方式
为了加深对本发明的理解,下面将结合附图和实施例对本发明做进一步详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。
实施例:如图1所示,该基于栅格的图片分离方法,具体包括以下步骤:
S1:利用ORB算法提取出空白图像和包含手写字的图像的特征向量;
所述步骤S1的所述ORB算法是基于FAST算法与BRIEF算法的算法组合,具体步骤为:
S11利用FAST算法寻找图像的关键点:设定一个像素点P,将像素点P与多个距离该像素点P的像素为2的像素点相比较,如果至少有一对连续像素点的亮度高于或低于像素点P,则将像素点P选作关键点,从而获取若干对关键点;FAST是Features from AcceleratedSegments Test的简称;
S12使用BRIEF算法将关键点转换为特征向量:根据步骤S11获取的若干对关键点创建特征向量;BRIEF是Binary Robust Independent Elementary Features的简称,它的作用是根据一组关键点创建特征向量;
所述步骤S12的具体步骤为:
S121:以关键点P为圆心,以D为半径做圆A;
S122:在圆A内随机选择N对像素点,
S123:设(X,Y)是其中的任意一对像素点,X表示像素点1,Y表示像素点2;对该对像素点采用公式(1)进行转换,公式(1)为:
其中P′(X),P′(Y)分别是像素点X,Y的灰度值;
S124:重复N次步骤S123,从而获得一个长度为N的向量,该向量即为特征向量;
S2:利用图像特征配准所述空白图像和包含手写字的图像,使所述空白图像和包含手写字的图像中打印体的相对位置一致,并获得新图像NP;
包含手写字的图像中打印体的字迹是和空白图像一模一样的;但是由于扫描/打印的问题,会使打印体的相对位置出现偏差;这种偏差可以是“平移”、“旋转”、“缩放”,“剪切”等等原因或者他们的组合造成的;“配准”就是消除这种偏差,使两种图像中打印体的相对位置一致;数学上可以使用仿射变换矩阵矩阵描述这种偏差;
所述步骤S2的具体步骤为:
S21:采用仿射变换矩阵描述手写字的图像中打印体的字迹和空白图像中字迹的偏差;
S22:仿射变换矩阵拥有6个自由度:a、b、c、d、e、f,利用公式(2)作用到某一个点上,公式(2)为:
其中(x,y)是旧的坐标点,即为包含手写字的图像上的坐标点;(x’,y’)是新的坐标点即为空白图像的坐标点;要计算出该仿射变换矩阵的6个自由度,至少需要3组对应的坐标点;
S23:根据步骤S1中获得两张图像的所有特征向量之后,再计算特征向量之间的汉明距离,如果该距离小于阈值N’,那么就认定两张图像上的特征点能配成一对,再使用通用的最小二乘法计算仿射变换矩阵,最小二乘法是一种数学优化技术;通过最小化误差的平方和寻找数据的最佳函数匹配;
S24:在得到相应仿射变换矩阵之后,将该矩阵作用到包含手写字的图像就能得到一张消除误差后的新图像NP;
S3:利用n*n(3<n<10)像素的栅格覆盖住所述空白图像,计算每个栅格内部像素的灰度平均值h;取阈值p,当h<p时标记该栅格为待删除状态;此实施例中具体是利用5*5像素的栅格覆盖住所述空白图像,计算每个栅格内部共25个像素的灰度的平均值h;取阈值n,当h<n时标记该栅格为待删除状态;
S4:获得步骤S3中所有待删除栅格的位置,将步骤S2中新图像NP中相同位置的栅格全部涂成白色,从而获得原始的手写体文字。如图2~图3所示,图2为原包含手写字的图像,图3为采用本发明的基于栅格的图片分离方法对图2进行分离后的效果图。
对于本领域的普通技术人员而言,具体实施例只是对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。
Claims (3)
1.一种基于栅格的图片分离方法,其特征在于,具体包括以下步骤:
S1:利用ORB算法提取出空白图像和包含手写字的图像的特征向量,包含手写字的图像中打印体的字迹是和空白图像一模一样的;
S2:利用图像特征配准所述空白图像和包含手写字的图像,使所述空白图像和包含手写字的图像中打印体的相对位置一致,并获得新图像NP;
S3:利用n*n像素的栅格覆盖住所述空白图像,3<n<10,计算每个栅格内部像素的灰度平均值h;取阈值p,当h<p时标记该栅格为待删除状态;
S4:获得步骤S3中所有待删除栅格的位置,将步骤S2中新图像NP中相同位置的栅格全部涂成白色,从而获得原始的手写体文字;
所述步骤S2的具体步骤为:
S21:采用仿射变换矩阵描述手写字的图像中打印体的字迹和空白图像中字迹的偏差;
S22:仿射变换矩阵拥有6个自由度:a、b、c、d、e、f,利用公式(2)作用到某一个点上,公式(2)为:
其中(x,y)是旧的坐标点,即为包含手写字的图像上的坐标点;(x’,y’)是新的坐标点即为空白图像的坐标点;要计算出该仿射变换矩阵的6个自由度,至少需要3组对应的坐标点;
S23:根据步骤S1中获得两张图像的所有特征向量之后,再计算特征向量之间的汉明距离,如果该距离小于阈值N’,那么就认定两张图像上的特征点能配成一对,再使用最小二乘法计算仿射变换矩阵,通过最小化误差的平方和寻找数据的最佳函数匹配;
S24:在得到相应仿射变换矩阵之后,将该矩阵作用到包含手写字的图像就能得到一张消除误差后的新图像NP。
2.根据权利要求1所述的基于栅格的图片分离方法,其特征在于,所述步骤S1中的所述ORB算法是基于FAST算法与BRIEF算法的算法组合,具体步骤为:
S11利用FAST算法寻找图像的关键点:设定一个像素点P,将像素点P与多个距离该像素点P的像素为2的像素点相比较,如果至少有一对连续像素点的亮度高于或低于像素点P,则将像素点P选作关键点,从而获取若干对关键点;
S12使用BRIEF算法将关键点转换为特征向量:根据步骤S11获取的若干对关键点创建特征向量。
3.根据权利要求2所述的基于栅格的图片分离方法,其特征在于,所述步骤S12的具体步骤为:
S121:以关键点P为圆心,以D为半径做圆A;
S122:在圆A内随机选择N对像素点,
S123:设(X,Y)是其中的任意一对像素点,X表示像素点1,Y表示像素点2;对该对像素点采用公式(1)进行转换,公式(1)为:
其中P′(x),P′(Y)分别是像素点X,Y的灰度值;
S124:重复N次步骤S123,从而获得一个长度为N的向量,该向量即为特征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110818411.1A CN113642573B (zh) | 2021-07-20 | 2021-07-20 | 一种基于栅格的图片分离方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110818411.1A CN113642573B (zh) | 2021-07-20 | 2021-07-20 | 一种基于栅格的图片分离方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113642573A CN113642573A (zh) | 2021-11-12 |
CN113642573B true CN113642573B (zh) | 2023-10-13 |
Family
ID=78417809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110818411.1A Active CN113642573B (zh) | 2021-07-20 | 2021-07-20 | 一种基于栅格的图片分离方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113642573B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005276188A (ja) * | 2004-02-26 | 2005-10-06 | Yokohama Tlo Co Ltd | 手書き文字除去画像処理装置、及び手書き文字除去画像処理方法 |
CN106612397A (zh) * | 2016-11-25 | 2017-05-03 | 努比亚技术有限公司 | 一种图像处理方法及终端 |
CN107609558A (zh) * | 2017-09-13 | 2018-01-19 | 北京元心科技有限公司 | 文字图像处理方法及装置 |
CN108010045A (zh) * | 2017-12-08 | 2018-05-08 | 福州大学 | 基于orb的视觉图像特征点误匹配提纯方法 |
CN108399408A (zh) * | 2018-03-06 | 2018-08-14 | 李子衿 | 一种基于深度空间变换网络的变形字符矫正方法 |
CN110020692A (zh) * | 2019-04-13 | 2019-07-16 | 南京红松信息技术有限公司 | 一种基于印刷体模板的手写体分离与定位方法 |
CN111461030A (zh) * | 2020-04-03 | 2020-07-28 | 南京红松信息技术有限公司 | 一种基于仿射迭代变换的模板匹配对齐方法 |
CN111597517A (zh) * | 2020-04-28 | 2020-08-28 | 南京新智客信息科技有限公司 | 一种基于图像置乱的文档防复制方法及系统 |
CN112434699A (zh) * | 2020-11-25 | 2021-03-02 | 杭州六品文化创意有限公司 | 手写汉字或偏旁、笔划的自动提取及智能评分系统 |
CN112446262A (zh) * | 2019-09-02 | 2021-03-05 | 深圳中兴网信科技有限公司 | 文本分析方法、装置、终端和计算机可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7724403B2 (en) * | 2006-10-26 | 2010-05-25 | Pitney Bowes Inc. | Method of registering a scanning grid of a scanner with a printing grid of a printer |
-
2021
- 2021-07-20 CN CN202110818411.1A patent/CN113642573B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005276188A (ja) * | 2004-02-26 | 2005-10-06 | Yokohama Tlo Co Ltd | 手書き文字除去画像処理装置、及び手書き文字除去画像処理方法 |
CN106612397A (zh) * | 2016-11-25 | 2017-05-03 | 努比亚技术有限公司 | 一种图像处理方法及终端 |
CN107609558A (zh) * | 2017-09-13 | 2018-01-19 | 北京元心科技有限公司 | 文字图像处理方法及装置 |
CN108010045A (zh) * | 2017-12-08 | 2018-05-08 | 福州大学 | 基于orb的视觉图像特征点误匹配提纯方法 |
CN108399408A (zh) * | 2018-03-06 | 2018-08-14 | 李子衿 | 一种基于深度空间变换网络的变形字符矫正方法 |
CN110020692A (zh) * | 2019-04-13 | 2019-07-16 | 南京红松信息技术有限公司 | 一种基于印刷体模板的手写体分离与定位方法 |
CN112446262A (zh) * | 2019-09-02 | 2021-03-05 | 深圳中兴网信科技有限公司 | 文本分析方法、装置、终端和计算机可读存储介质 |
CN111461030A (zh) * | 2020-04-03 | 2020-07-28 | 南京红松信息技术有限公司 | 一种基于仿射迭代变换的模板匹配对齐方法 |
CN111597517A (zh) * | 2020-04-28 | 2020-08-28 | 南京新智客信息科技有限公司 | 一种基于图像置乱的文档防复制方法及系统 |
CN112434699A (zh) * | 2020-11-25 | 2021-03-02 | 杭州六品文化创意有限公司 | 手写汉字或偏旁、笔划的自动提取及智能评分系统 |
Non-Patent Citations (2)
Title |
---|
一种具有广义特征反馈的智能脱机手写体汉字识别系统的研究;邱瑾;《中国优秀硕士学位论文全文数据库(电子期刊)》(第06期);全文 * |
基于图像处理的自动阅卷系统相关技术研究;邵凤莹;《中国优秀硕士学位论文全文数据库 信息科技辑》(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113642573A (zh) | 2021-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111401384B (zh) | 一种变电设备缺陷图像匹配方法 | |
Mohammad et al. | Optical character recognition implementation using pattern matching | |
CN101770582B (zh) | 图像匹配系统及方法 | |
CN110020692B (zh) | 一种基于印刷体模板的手写体分离与定位方法 | |
CN109766850B (zh) | 基于特征融合的指纹图像匹配方法 | |
CN103985136A (zh) | 一种基于局部特征点特征流型的目标跟踪方法 | |
CN111275049A (zh) | 一种文字图像骨架特征描述符获取的方法及装置 | |
CN113642573B (zh) | 一种基于栅格的图片分离方法 | |
Arnia et al. | Moment invariant-based features for Jawi character recognition | |
Herwanto et al. | Zoning feature extraction for handwritten Javanese character recognition | |
Xu et al. | Application of Neural Network in Handwriting Recognition | |
Gezerlis et al. | Optical character recognition of the Orthodox Hellenic Byzantine Music notation | |
CN106780637B (zh) | 一种基于脉冲神经膜系统的快速并行图像细化方法 | |
CN107067009B (zh) | 一种实时杆号识别方法 | |
CN113362380B (zh) | 一种图像特征点检测模型训练方法、装置及其电子设备 | |
CN114926345A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
Ouadid et al. | Handwritten tifinagh character recognition using simple geometric shapes and graphs | |
Hemalatha et al. | Handwritten Text Recognition Using Machine Learning | |
Vasin et al. | An intelligent information technology for symbol-extraction from weakly formalized graphic documents | |
Lu et al. | Exam Digitization for Online Grading | |
Mahasukhon et al. | Hand-printed English character recognition based on fuzzy theory | |
CN115995080B (zh) | 基于ocr识别的档案智能管理系统 | |
CN115861663B (zh) | 一种基于自监督学习模型的文档图像内容比对方法 | |
Shine et al. | An approach for improving Optical Character Recognition using Contrast enhancement technique | |
AU2021104831A4 (en) | A Novel Deep Convolutional Neural Network for Tattoo Text Detection in Images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |