CN109727363B - 一种在票据中识别大写金额的方法 - Google Patents
一种在票据中识别大写金额的方法 Download PDFInfo
- Publication number
- CN109727363B CN109727363B CN201811366005.0A CN201811366005A CN109727363B CN 109727363 B CN109727363 B CN 109727363B CN 201811366005 A CN201811366005 A CN 201811366005A CN 109727363 B CN109727363 B CN 109727363B
- Authority
- CN
- China
- Prior art keywords
- characters
- segmentation
- character
- gradient
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本发明公开在票据中识别大写金额的方法,包括采用弹性形变的方法生对给定的包含多个数字大写形式的汉字字符的图像,生成多种不同风格的仿手写体的数字大写字符的图像;对多种图像投影初次分割,选择通过求连通区域的方法将字符分开:或利用区域梯度图像,与卷积核卷积运算,利用像素点梯度,通过形成的分割路径将该子区域内的字符分开,最终形成字符分割算法;识别时,利用该字符分割算法对票据中的数字大写图像分割,形成单个字符然后输入到神经网识别模型中进行字符识别。本发明实现了对手写体大写金额的快速分割。
Description
技术领域
本发明涉及图像识别技术领域,特别是涉及一种在票据中识别大写金额的方法。
背景技术
在票据鉴伪和识别中,针对票据图像,需要识别其中手写体的大写金额,如"零、壹、贰、叁、肆、伍、陆、柒、捌、玖、拾"等。识别过程一般分为三步:1.在图像中裁剪出包含手写体金额的大致范围。2.将手写体金额分割为单个的字符。3.用神经网络识别每个字符。
第一步较为简单,因为手写体金额在票据中的相对位置是固定的。第二步的难点在于,由于不同人的手写风格十分迥异,且存在连笔的情形,因此字符分割很难做到百分百精确。比如在连笔字的情形前一个汉字的某些笔画可能与后一个汉字合并在一起,或者两个十分接近的汉字被合并为一个汉字。在票据识别这种对识别率要求非常高的场景,寻找更准确的汉字字符分割算法是非常必要的。第三步的难点在于获取包含足够样本量的训练数据。目前开源的汉字手写体数据集(如模式识别国家重点实验室发表的HWDB数据集)都是针对大多数常用汉字的,其中大写数字的样本量较小。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种在票据中识别大写金额的方法。
为实现本发明的目的所采用的技术方案是:
一种在票据中识别大写金额的方法,包括步骤:
采用弹性形变的方法生对给定的包含多个数字大写形式的汉字字符的图像,生成多种不同风格的仿手写体的数字大写字符的图像;
对多种所述图像进行投影实现初次分割,若初次分割后形成的子区域中两个字符投影相连,但字符不相连,通过求连通区域的方法将此两个字符分开:若初次分割后形成的子区域中两个字符投影相连且字符相连,则采用以下步骤分割:
计算该子区域的梯度图像,然后将该梯度图像与八个方向均布的八个卷积核进行卷积运算,计算出每个像素点的梯度方向,将该梯度方向看作是该像素点的笔画方向;
从该子区域顶部的一个梯度为零的初始像素点开始,选择向下方梯度最小的像素点而向下移动以避开笔画方向,直到移动该子区域的底部为止,从而形成一条近似曲线的将该子区域内的字符分开的分割路径,将该分割路径用一条逐段线性的折线拟合,得到分割折线;最终形成字符分割算法;
识别时,利用该字符分割算法对票据中的数字大写图像进行分割,形成单个字符然后输入到神经网识别模型中进行字符识别。
所述卷积核采用7x7卷积核。
本发明从已有小的样本集出发,用程序生成样本量较大且随机性较好的样本图像,然后对这些样本图像进行分割,形成字符分割算法,实现对手写体大写金额的字符分割,从而实现了对手写体大写金额快速分割,为字符识别奠定的基础。
附图说明
图1所示为本发明的在票据中识别大写金额的方法的流程图;
图2所示为生成的变形手写体的图像;
图3所示为具有连通区域的子区域图像;
图4所示为不具有连通区域的子区域图像;
图5所示为图像分割后形成分割折线的示意图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1-5所示,本发明的在票据中识别大写金额的方法,包括步骤:
S1,采用弹性形变的方法生对给定的包含多个数字大写形式的汉字字符的图像,生成多种不同风格的仿手写体的数字大写字符的图像;
即对给定的包含单个数字大写形式的汉字字符的图像,用弹性形变方法生成更多风格类似图像,如图1所示,为生成的图像。
具体是,对每个像素点(x,y),生成两个随机数Δx和Δy,它们分别表示该像素点在水平和垂直方向的位移。生成一个均值为0,方差为σ的高斯核KN×N,将Δx和Δy与KN×N作卷积,并将得到的结果作用于原图像。当σ取值较大时,高斯核值会很小,变换后的结果看上去是原图的一个随机的平移;σ取值较小时变换后的结果类似与随机噪声。只有σ大小合适时变换后的图像,才是原始图像经过弹性变换的图像。本申请取σ=4。
S2,对多种所述图像进行投影实现初次分割,若初次分割后形成的子区域中两个字符投影相连,但字符不相连,通过求连通区域的方法将此两个字符分开:若初次分割后形成的子区域中两个字符投影相连且字符相连,则采用以下步骤分割:计算该子区域的梯度图像,然后将该梯度图像与八个方向均布的八个卷积核进行卷积运算,计算出每个像素点的梯度方向,将该梯度方向看作是该像素点的笔画方向;从该子区域顶部的一个梯度为零的初始像素点开始,选择向下方梯度最小的像素点而向下移动以避开笔画方向,直到移动该子区域的底部为止,从而形成一条近似曲线的将该子区域内的字符分开的分割路径,将该分割路径用一条逐段线性的折线拟合,得到分割折线;最终形成字符分割算法;
其中,字符分割最直接的方式是投影法,即把灰度图像的每一列投影到下方直线上,根据投影的结果来分割字符,但是若两个汉字相连,或者虽然不相连但是它们的投影相连,则这种方法就会有问题。
为此,本发明采用下方法:
首先用投影法获得一个粗略分割,初次分割下两个接近或者相连的汉字可能被分在一起;在第一步粗分割的基础上进行二次细分。这时对一个子区域,考虑两种情形:1)两个字符投影相连但是它们本身不相连。如图2所示:这种情形可以通过求连通区域的方法将它们分开。2)如果不存在连通区域,这说明可能出现两个字符的笔画连在一起的情形。
如图3所示:对这种不存在连通区域情形,按照如下方式,求出一条近似的分割折线来把它们分开,这可通过解一个最优化问题来实现。
首先求出此区域的梯度图像D以及8个7x7的卷积核,这8个卷积核是均匀分布的8个方向。将梯度图像与这8个方向分别作卷积运算,对每个像素点,其得到的结果中最大的一个即为此点的梯度方向。该点的梯度方向可以近似理解为该点的笔画方向。然后在粗分割的基础上,从一个上方的梯度为0的初始点开始,每次移动到其下方三个相邻的像素点中梯度最小者(有多个相同的最小者时选择正下方的像素点),直到移动到区域底部为止。这时wfc得到一条近似曲线的分割路径C={(x1,y1),(x2,y2),…,(xn,yn)}。
最后对上面的分割路径,用一条逐段线性的折线拟合之。这是一个最小二乘逼近问题,最终得到折线P,最终的效果图4所示。
S3,识别时,利用该字符分割算法对票据中的数字大写图像进行分割,形成单个字符然后输入到神经网识别模型中进行字符识别。
本发明采用从已有的小的样本集出发,用程序生成样本量较大且随机性较好的数据集,然后用这个数据集中的数据去训练,形成字符分割算法,进行手写体大写金额的字符分割,这样在识别前,实现了对手写体大写金额的快速分割,为进一步的识别奠定的基础。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (2)
1.一种在票据中识别大写金额的方法,其特征在于,包括步骤:
采用弹性形变的方法针对给定的包含多个数字大写形式的汉字字符的图像,生成多种不同风格的仿手写体的数字大写字符的形变图像;
对多种所述形变图像进行投影实现初次分割,若初次分割后形成的子区域中两个字符投影相连,但字符不相连,通过求连通区域的方法将此两个字符分开:若初次分割后形成的子区域中两个字符投影相连且字符相连,则采用以下步骤分割:
计算该子区域的梯度图像,然后将该梯度图像与八个方向均布的八个卷积核进行卷积运算,计算出每个像素点的梯度方向,将该梯度方向看作是该像素点的笔画方向;
从该子区域顶部的一个梯度为零的初始像素点开始,选择向下方梯度最小的像素点而向下移动以避开笔画方向,直到移动该子区域的底部为止,从而形成一条近似曲线的将该子区域内的字符分开的分割路径,将该分割路径用一条逐段线性的折线拟合,得到分割折线;最终形成字符分割算法;
识别时,利用该字符分割算法对票据中的数字大写图像进行分割,形成单个字符然后输入到神经网识别模型中进行字符识别。
2.如权利要求1所述在票据中识别大写金额的方法,其特征在于,所述卷积核采用7x7卷积核。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811366005.0A CN109727363B (zh) | 2018-11-16 | 2018-11-16 | 一种在票据中识别大写金额的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811366005.0A CN109727363B (zh) | 2018-11-16 | 2018-11-16 | 一种在票据中识别大写金额的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109727363A CN109727363A (zh) | 2019-05-07 |
CN109727363B true CN109727363B (zh) | 2022-03-29 |
Family
ID=66295504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811366005.0A Active CN109727363B (zh) | 2018-11-16 | 2018-11-16 | 一种在票据中识别大写金额的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109727363B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110942004A (zh) * | 2019-11-20 | 2020-03-31 | 深圳追一科技有限公司 | 基于神经网络模型的手写识别方法、装置及电子设备 |
CN111027532A (zh) * | 2019-12-11 | 2020-04-17 | 上海眼控科技股份有限公司 | 一种交强险保单车船税金额识别系统和方法 |
CN113128614B (zh) * | 2021-04-29 | 2023-06-16 | 西安微电子技术研究所 | 基于图像梯度的卷积方法、基于方向卷积的神经网络及分类方法 |
CN115393861B (zh) * | 2022-10-31 | 2023-01-31 | 蓝舰信息科技南京有限公司 | 一种手写体文本精准分割方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101398894A (zh) * | 2008-06-17 | 2009-04-01 | 浙江师范大学 | 机动车车牌自动识别方法及其实现装置 |
CN101408933A (zh) * | 2008-05-21 | 2009-04-15 | 浙江师范大学 | 基于粗网格特征提取和bp神经网络的车牌字符识别方法 |
CN102426649A (zh) * | 2011-10-13 | 2012-04-25 | 石家庄开发区冀科双实科技有限公司 | 一种简单的高准确率的钢印数字自动识别方法 |
CN102496013A (zh) * | 2011-11-11 | 2012-06-13 | 苏州大学 | 用于脱机手写汉字识别的汉字字符切分方法 |
CN106408039A (zh) * | 2016-09-14 | 2017-02-15 | 华南理工大学 | 一种基于形变方法进行数据扩展的脱机手写汉字识别方法 |
CN106503694A (zh) * | 2016-12-01 | 2017-03-15 | 重庆大学 | 基于八邻域特征的数字识别方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101030256B (zh) * | 2006-02-28 | 2010-05-12 | 东软集团股份有限公司 | 车辆图像分割方法和装置 |
CN100533466C (zh) * | 2006-06-29 | 2009-08-26 | 北大方正集团有限公司 | 一种字体识别方法及系统 |
CN101383003B (zh) * | 2008-10-31 | 2010-09-15 | 江西赣粤高速公路股份有限公司 | 车辆号牌实时精确识别方法 |
CN101447022A (zh) * | 2008-12-24 | 2009-06-03 | 华南理工大学 | 一种手写汉字图像的特征提取方法 |
US9122953B2 (en) * | 2013-04-15 | 2015-09-01 | Xerox Corporation | Methods and systems for character segmentation in automated license plate recognition applications |
CN107103317A (zh) * | 2017-04-12 | 2017-08-29 | 湖南源信光电科技股份有限公司 | 基于图像融合和盲反卷积的模糊车牌图像识别算法 |
-
2018
- 2018-11-16 CN CN201811366005.0A patent/CN109727363B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408933A (zh) * | 2008-05-21 | 2009-04-15 | 浙江师范大学 | 基于粗网格特征提取和bp神经网络的车牌字符识别方法 |
CN101398894A (zh) * | 2008-06-17 | 2009-04-01 | 浙江师范大学 | 机动车车牌自动识别方法及其实现装置 |
CN102426649A (zh) * | 2011-10-13 | 2012-04-25 | 石家庄开发区冀科双实科技有限公司 | 一种简单的高准确率的钢印数字自动识别方法 |
CN102496013A (zh) * | 2011-11-11 | 2012-06-13 | 苏州大学 | 用于脱机手写汉字识别的汉字字符切分方法 |
CN106408039A (zh) * | 2016-09-14 | 2017-02-15 | 华南理工大学 | 一种基于形变方法进行数据扩展的脱机手写汉字识别方法 |
CN106503694A (zh) * | 2016-12-01 | 2017-03-15 | 重庆大学 | 基于八邻域特征的数字识别方法 |
Non-Patent Citations (3)
Title |
---|
Automatic recognition of square notation symbols in western plainchant manuscripts;Ramirez C, Ohya J.;《Journal of New Music Research》;20140710;第390-399页 * |
一种用于脱机手写体女书字符切分的方法;刘赛等;《计算机应用研究》;20110331(第03期);第1188-1190页 * |
基于CNN和随机弹性形变的相似手写汉字识别;高学、王有旺;《华南理工大学学报 (自 然科学版)》;20140131;第72-76页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109727363A (zh) | 2019-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109727363B (zh) | 一种在票据中识别大写金额的方法 | |
CN106446896B (zh) | 一种字符分割方法、装置及电子设备 | |
CN110276342B (zh) | 车牌辨识方法以及其系统 | |
CN107305630B (zh) | 文本序列识别方法和装置 | |
CN102663377B (zh) | 一种基于模板匹配的字符识别方法 | |
CN108427946B (zh) | 复杂场景下基于内特征和文本域布局的驾驶证检测识别方法 | |
US11836969B2 (en) | Preprocessing images for OCR using character pixel height estimation and cycle generative adversarial networks for better character recognition | |
CN107944451B (zh) | 一种藏文古籍文档的行切分方法及系统 | |
CN109064522A (zh) | 基于条件生成对抗网络的汉字字体生成方法 | |
CN113159045A (zh) | 一种结合图像预处理与卷积神经网络的验证码识别方法 | |
JP6671613B2 (ja) | 文字認識方法及びコンピュータプログラム | |
JP2008251029A (ja) | 文字認識装置、ナンバープレート認識システム | |
Roy et al. | A new quad tree based feature set for recognition of handwritten bangla numerals | |
Sheshadri et al. | An OCR system for Printed Kannada using k-means clustering | |
Boulid et al. | Detection of text lines of handwritten Arabic manuscripts using Markov decision processes | |
Herwanto et al. | Zoning feature extraction for handwritten Javanese character recognition | |
Li | An effective approach to offline arabic handwriting recognition | |
CN104408454B (zh) | 基于弹性模板匹配算法的车牌字符分割方法 | |
Jindal et al. | Structural features for recognizing degraded printed Gurmukhi script | |
Naz et al. | Challenges in baseline detection of cursive script languages | |
Jia et al. | Grayscale-projection based optimal character segmentation for camera-captured faint text recognition | |
KR101937859B1 (ko) | 360도 이미지에서의 공통 객체 탐색 시스템 및 방법 | |
KR20030052126A (ko) | 한글문자 인식 방법 | |
KR101991461B1 (ko) | 특징점의 벡터화를 이용한 문자인식 시스템 및 방법 | |
Dash et al. | Gestalt configural superiority effect: a complexity paradigm for handwritten numeral recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |