CN111507356A - 一种金融票据小写金额手写字符的分割方法 - Google Patents
一种金融票据小写金额手写字符的分割方法 Download PDFInfo
- Publication number
- CN111507356A CN111507356A CN202010310170.5A CN202010310170A CN111507356A CN 111507356 A CN111507356 A CN 111507356A CN 202010310170 A CN202010310170 A CN 202010310170A CN 111507356 A CN111507356 A CN 111507356A
- Authority
- CN
- China
- Prior art keywords
- character
- segmentation
- characters
- optimal
- handwritten
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/273—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion removing elements interfering with the pattern to be recognised
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
本发明公开了一种金融票据小写金额手写字符的分割方法,其特征在于,包括如下步骤:步骤01,利用K‑means算法,对输入的灰度图像寻找最优的分割阈值;步骤02,利用直方图法对待识别字符样本进行横、纵投影分割,获得初步字符分割序列;步骤03,将上个步骤切割后的字符序列,经过CRAFT算法计算两个字符之间的中心概率即关联系数,数字金额字符之间关联系数较大,而栅格竖线与它手写字符的关联系数较小,据此可将栅格线排除,利用CRAFT算法筛选出最优字符分割序列,输出结果。
Description
技术领域
本发明涉及薄片类纸质介质处理领域,特别是涉及一种金融票据处的小写金额处手写字符的分割方法。
背景技术
目前市面上各个人工智能公司的字符处理软件产品种类繁多,尤其在字符分割、识别技术已经相当成熟。但在金融票据上小写金额处、大写金额处等特定识别场景下的应用效果并不理想。
字符的种类分为印刷体数字(0~9)、手写体数字、印刷体大小写英文字母(a~w)、手写体大小写英文字符、印刷体特殊符号及手写体特殊符号(如¥、$) 等。印刷体字符识别一般采用较为简单的三层全连接神经网络算法,即可获得较好的识别结果。而手写体字符识别则需要更深层的卷积神经网络算法。无论采用哪种算法,在识别之前,都需要对每块字符依次分割出单个字符,而字符切割的字体规范性是识别正确的前提,因此字符的分割对算法识别结果产生较大影响。
一般印刷体字符的字体、形状、大小较为规范,字符之间的间距也非常均匀,使用传统的横向投影、纵向投影分割方法,结合动态阈值等处理技术,即可获得较好的分割效果。而手写体字符形状、大小等特征往往因个人笔法而异,字符的连笔、粘连等情况非常普遍,尤其是在票据上小写金额处的手写体数字,每个数字分割的难度不仅在于手写字符的不规范,还在于外侧的货币数字栅格,以及字迹经长时间保存变得模糊、墨迹暗淡也会带来一定的困难。
针对此类字符的分割,传统的横、纵向投影算法,以及深度学习神经网络分割方法均难以达到良好效果,金额处的栅格极易误识别为其它字符(例如数字1),而一些手写体票据的数字会超出栅格范围,这都会给字符的有效分割带来很大挑战。
发明内容
为了解决上述技术问题,本发明提出一种票据小写金额手写字符分割方法,提出三步识别机制,首先采用K-means聚类算法,对输入的灰度图像寻找最优的分割阈值。
获得最优阈值后,再使用直方图法对待识别字符样本进行横、纵投影分割,获得初步的字符分割序列,最后将上个步骤切割后的字符序列,经过CRAFT算法计算两个字符之间的中心概率即关联系数,数字金额字符之间关联系数较大,而栅格竖线与它手写字符的关联系数较小,据此可将栅格线排除,此方法最大程度上排除栅格线对字符分割的干扰,提高字符分割的效率。
为实现本发明的目的所采用的技术方案是:
一种金融票据小写金额手写字符的分割方法,其特征在于,包括如下步骤:
步骤01,利用K-means算法,对输入的灰度图像寻找最优的分割阈值;
步骤02,利用直方图法对待识别字符样本进行横、纵投影分割,获得初步字符分割序列;
步骤03,将上个步骤切割后的字符序列,经过CRAFT算法计算两个字符之间的中心概率即关联系数,数字金额字符之间关联系数较大,而栅格竖线与它手写字符的关联系数较小,据此可将栅格线排除,利用CRAFT算法筛选出最优字符分割序列,输出结果。
更进一步地,所述步骤01包括如下步骤:
步骤011,采用距离作为相似性指标,从C个数据对象任意选择k个对象作为初始聚类中心;
步骤012,对于剩下的其它对象,则根据它们与初始聚类中心的相似度(距离),分别将它们分配给与其相似的聚类;
步骤013,计算每个所获新聚类的聚类中心,不断重复这一过程直到聚类中心k个对象不再更换为止,此时获得的为最优分割阈值。
更进一步地,所述步骤013中最优分割阈值是当E取最小值时,x的值,计算公式为:
其中μi是数据对象Ci的均值向量,表达式为:
更进一步地,所述步骤02包括如下步骤:
步骤021,使用步骤01中获得的最优分割阈值,对待识别的票据小写金额处的字符图像进行二值化去背景处理;
步骤022,把字符图像进行水平投影,得到的字符在垂直方向上的像素分布,再对字符图像进行水平投影,得到水平方向的像素分布;
步骤023,综合垂直方向和水平方向的投影的区域位置,通过遍历黑白像素矩阵,获得初步的字符区的精确分割。
更进一步地,所述步骤03包括如下步骤:
步骤031,基于VGG16神经网络结构,采用U-Net作为解码器,输入为步骤 02分割后的初步字符分割序列;
步骤032,输出分为两个通道,一个通道的输出结果为Region Score,表示对应每个字符处于文字中心的概率,即字符区域置信度,用于定位图像中的独立字符区域,另一个通道的输出结果为Affinity Score,认为对应每个字符是两个字之间的中心概率,即关联系数;
步骤033,分割出的栅格线等干扰成分的字符区域置信度及关联系数明显低于手写数字字符,剔除干扰成分后,即可获得最优字符分割序列。
本发明的有益效果是:
本发明提供了一种金融票据小写金额手写字符分割方法,并且测试结果也验证了方法的正确性,使用K-means算法获得最优分割阈值,直方图法完成初级分割序列,再经过CRAFT算法筛选出最优字符分割序列,可以满足票据小写金额处字符分割准确率的要求。
附图说明
图1为字符分割处理过程;
图2为CRAFT网络结构图;
图3为K-means方法和直方图法完成字符初级分割结果;
图4为CRAFT算法筛选出的最优字符分割序列。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
一种金融票据小写金额手写字符分割方法,分为三个步骤:
第一步:利用K-means算法,对输入的灰度图像寻找最优的分割阈值;
步骤011,采用距离作为相似性指标,从C个数据对象任意选择k个对象作为初始聚类中心;
步骤012,对于剩下的其它对象,则根据它们与初始聚类中心的相似度(距离),分别将它们分配给与其相似的聚类;
步骤013,计算每个所获新聚类的聚类中心,不断重复这一过程直到聚类中心k个对象不再更换为止,此时获得的为最优分割阈值。
所述步骤013中最优分割阈值是当E取最小值时,x的值,计算公式为:
其中μi是数据对象Ci的均值向量,表达式为:
初始聚类中心的来源:K-means算法分割最优阈值实现,选取票据彩色图像的小写金额ROI区域,计算OSTU阈值并进行二值化阈值分割,获得满足条件像素点阵,进一步计算得到k个像素簇的粗中心。
第二步:利用直方图法对待识别字符样本进行横、纵投影分割,获得初步字符分割序列;
步骤021,使用步骤01中获得的最优分割阈值,对待识别的票据小写金额处的字符图像进行二值化去背景处理
步骤022,把字符图像进行水平投影,得到的字符在垂直方向上的像素分布,再对字符图像进行水平投影,得到水平方向的像素分布;
步骤023,综合垂直方向和水平方向的投影的区域位置,通过遍历黑白像素矩阵,获得初步的字符区的精确分割。
第三步:CRAFT算法筛选出最优字符分割序列:将上个步骤切割后的字符序列,经过CRAFT算法计算两个字符之间的中心概率即关联系数,数字金额字符之间关联系数较大,而栅格竖线与它手写字符的关联系数较小,据此可将栅格线排除,利用CRAFT算法筛选出最优字符分割序列,输出结果。
在第二步步骤的初级分割序列中,并非都是有效的字符,可能包含一些栅格线等非有效数字字符,需要CRAFT算法进一步筛选。
步骤031,基于VGG16神经网络结构,采用U-Net作为解码器,输入为步骤 02分割后的初步字符分割序列;
步骤032,输出分为两个通道,一个通道的输出结果为Region Score,表示对应每个字符处于文字中心的概率,即字符区域置信度,用于定位图像中的独立字符区域,另一个通道的输出结果为Affinity Score,认为对应每个字符处于两个字之间的中心概率,即关联系数;
步骤033,分割出的栅格线等干扰成分的字符区域置信度及关联系数明显低于手写数字字符,剔除干扰成分后,即可获得最优字符分割序列。
下面对几种常用的算法以及本发明记载的算法进行准确率比对分析,结果如下:
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (5)
1.一种金融票据小写金额手写字符的分割方法,其特征在于,包括如下步骤:
步骤01,利用K-means算法,对输入的灰度图像寻找最优的分割阈值;
步骤02,利用直方图法对待识别字符样本进行横、纵投影分割,获得初步字符分割序列;
步骤03,将上个步骤切割后的字符序列,经过CRAFT算法计算两个字符之间的中心概率即关联系数,数字金额字符之间关联系数较大,而栅格竖线与它手写字符的关联系数较小,据此可将栅格线排除,利用CRAFT算法筛选出最优字符分割序列,输出结果。
2.根据权利要求1所述的一种金融票据小写金额手写字符的分割方法,其特征在于,所述步骤01包括如下步骤:
步骤011,采用距离作为相似性指标,从C个数据对象任意选择k个对象作为初始聚类中心;
步骤012,对于剩下的其它对象,则根据它们与初始聚类中心的相似度(距离),分别将它们分配给与其相似的聚类;
步骤013,计算每个所获新聚类的聚类中心,不断重复这一过程直到聚类中心k个对象不再更换为止,此时获得的为最优分割阈值。
4.根据权利要求1所述的一种金融票据小写金融手写字符的分割方法,其特征在于,所述步骤02包括如下步骤:
步骤021,使用步骤01中获得的最优分割阈值,对待识别的票据小写金额处的字符图像进行二值化去背景处理;
步骤022,把字符图像进行水平投影,得到的字符在垂直方向上的像素分布,再对字符图像进行水平投影,得到水平方向的像素分布;
步骤023,综合垂直方向和水平方向的投影的区域位置,通过遍历黑白像素矩阵,获得初步的字符区的精确分割。
5.根据权利要求1所述的一种金融票据小写金融手写字符的分割方法,其特征在于,所述步骤03包括如下步骤:
步骤031,基于VGG16神经网络结构,采用U-Net作为解码器,输入为步骤02分割后的初步字符分割序列;
步骤032,输出分为两个通道,一个通道的输出结果为Region Score,表示对应每个字符处于文字中心的概率,即字符区域置信度,用于定位图像中的独立字符区域,另一个通道的输出结果为Affinity Score,认为对应每个字符是两个字之间的中心概率,即关联系数;
步骤033,分割出的栅格线等干扰成分的字符区域置信度及关联系数明显低于手写数字字符,剔除干扰成分后,即可获得最优字符分割序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010310170.5A CN111507356A (zh) | 2020-04-20 | 2020-04-20 | 一种金融票据小写金额手写字符的分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010310170.5A CN111507356A (zh) | 2020-04-20 | 2020-04-20 | 一种金融票据小写金额手写字符的分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111507356A true CN111507356A (zh) | 2020-08-07 |
Family
ID=71871077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010310170.5A Pending CN111507356A (zh) | 2020-04-20 | 2020-04-20 | 一种金融票据小写金额手写字符的分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111507356A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115588204A (zh) * | 2022-09-23 | 2023-01-10 | 神州数码系统集成服务有限公司 | 一种基于ds证据理论的单一字符图像匹配识别方法 |
CN115859908A (zh) * | 2023-02-22 | 2023-03-28 | 江苏曼荼罗软件股份有限公司 | 一种基于栅格处理的电子病例显示方法及系统 |
CN115953785A (zh) * | 2023-03-15 | 2023-04-11 | 山东薪火书业有限公司 | 基于教辅图书内容增强的数字化编辑系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102945368A (zh) * | 2012-10-17 | 2013-02-27 | 西安理工大学 | 啤酒瓶盖激光字符的定位识别方法 |
US20180157927A1 (en) * | 2015-08-04 | 2018-06-07 | Alibaba Group Holding Limited | Character Segmentation Method, Apparatus and Electronic Device |
CN108734168A (zh) * | 2018-05-18 | 2018-11-02 | 天津科技大学 | 一种手写数字的识别方法 |
WO2019174130A1 (zh) * | 2018-03-14 | 2019-09-19 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN110516592A (zh) * | 2019-08-26 | 2019-11-29 | 广东世纪晟科技有限公司 | 一种基于手写数字字符的识别方法 |
CN110647829A (zh) * | 2019-09-12 | 2020-01-03 | 全球能源互联网研究院有限公司 | 一种票据的文本识别方法及系统 |
CN111027546A (zh) * | 2019-12-05 | 2020-04-17 | 北京嘉楠捷思信息技术有限公司 | 一种字符分割方法、装置以及计算机可读存储介质 |
-
2020
- 2020-04-20 CN CN202010310170.5A patent/CN111507356A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102945368A (zh) * | 2012-10-17 | 2013-02-27 | 西安理工大学 | 啤酒瓶盖激光字符的定位识别方法 |
US20180157927A1 (en) * | 2015-08-04 | 2018-06-07 | Alibaba Group Holding Limited | Character Segmentation Method, Apparatus and Electronic Device |
WO2019174130A1 (zh) * | 2018-03-14 | 2019-09-19 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN108734168A (zh) * | 2018-05-18 | 2018-11-02 | 天津科技大学 | 一种手写数字的识别方法 |
CN110516592A (zh) * | 2019-08-26 | 2019-11-29 | 广东世纪晟科技有限公司 | 一种基于手写数字字符的识别方法 |
CN110647829A (zh) * | 2019-09-12 | 2020-01-03 | 全球能源互联网研究院有限公司 | 一种票据的文本识别方法及系统 |
CN111027546A (zh) * | 2019-12-05 | 2020-04-17 | 北京嘉楠捷思信息技术有限公司 | 一种字符分割方法、装置以及计算机可读存储介质 |
Non-Patent Citations (3)
Title |
---|
Y.BAEK ET.AL: "《Character Region Awareness for Text Detection》", 《2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION(CVPR)》 * |
李晨: "《基于机器视觉的手写体区域检测和字符分割的研究》", 《中国优秀博硕士学位论文全文数据库(硕士),信息科技辑》 * |
眭臻: "《基于K-means聚类的灰度图像分割》", 《计算机光盘软件与应用》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115588204A (zh) * | 2022-09-23 | 2023-01-10 | 神州数码系统集成服务有限公司 | 一种基于ds证据理论的单一字符图像匹配识别方法 |
CN115588204B (zh) * | 2022-09-23 | 2023-06-13 | 神州数码系统集成服务有限公司 | 一种基于ds证据理论的单一字符图像匹配识别方法 |
CN115859908A (zh) * | 2023-02-22 | 2023-03-28 | 江苏曼荼罗软件股份有限公司 | 一种基于栅格处理的电子病例显示方法及系统 |
CN115953785A (zh) * | 2023-03-15 | 2023-04-11 | 山东薪火书业有限公司 | 基于教辅图书内容增强的数字化编辑系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111325203B (zh) | 一种基于图像校正的美式车牌识别方法及系统 | |
CN110807465B (zh) | 一种基于通道损失函数的细粒度图像识别方法 | |
CN104463195B (zh) | 基于模板匹配的印刷体数字识别方法 | |
JP5379085B2 (ja) | スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム | |
CN111507356A (zh) | 一种金融票据小写金额手写字符的分割方法 | |
CN107609549A (zh) | 一种自然场景下证件图像的文本检测方法 | |
CN109871851B (zh) | 一种基于卷积神经网络算法的汉字书写规范性判定方法 | |
CN108596166A (zh) | 一种基于卷积神经网络分类的集装箱箱号识别方法 | |
CN110210413A (zh) | 一种基于深度学习的多学科试卷内容检测与识别系统及方法 | |
Fujinaga | Adaptive optical music recognition | |
CN111523622B (zh) | 基于特征图像自学习的机械臂模拟手写笔迹方法 | |
CN115171124B (zh) | 用于手写汉字识别的文本分割方法 | |
CN108681735A (zh) | 基于卷积神经网络深度学习模型的光学字符识别方法 | |
CN101615244A (zh) | 手写板坯号自动识别方法及识别装置 | |
CN106503694A (zh) | 基于八邻域特征的数字识别方法 | |
CN113159014A (zh) | 基于手写题号的客观题批阅方法、装置、设备及存储介质 | |
CN110689003A (zh) | 低照度成像车牌识别方法、系统、计算机设备及存储介质 | |
CN112580502A (zh) | 基于sicnn的低质量视频人脸识别方法 | |
CN115862045A (zh) | 基于图文识别技术的病例自动识别方法、系统、设备及存储介质 | |
CN111340032A (zh) | 一种基于金融领域应用场景的字符识别方法 | |
CN109446997A (zh) | 文档编号自动识别方法 | |
CN115880704A (zh) | 一种病例的自动编目方法、系统、设备及存储介质 | |
CN113033345B (zh) | 基于公共特征子空间的v2v视频人脸识别方法 | |
Gillies et al. | Arabic text recognition system | |
CN115393861B (zh) | 一种手写体文本精准分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200807 |
|
WD01 | Invention patent application deemed withdrawn after publication |