CN115082934B - 一种金融票据中手写汉字分割识别方法 - Google Patents
一种金融票据中手写汉字分割识别方法 Download PDFInfo
- Publication number
- CN115082934B CN115082934B CN202210776221.2A CN202210776221A CN115082934B CN 115082934 B CN115082934 B CN 115082934B CN 202210776221 A CN202210776221 A CN 202210776221A CN 115082934 B CN115082934 B CN 115082934B
- Authority
- CN
- China
- Prior art keywords
- character
- width
- characters
- handwritten chinese
- segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000011218 segmentation Effects 0.000 claims abstract description 96
- 238000013528 artificial neural network Methods 0.000 claims abstract description 8
- 238000010606 normalization Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
Abstract
本发明涉及图像识别技术领域,具体涉及一种金融票据中手写汉字分割识别方法,该方法通过获取金融票据的手写汉字区域,利用垂直投影法对手写汉字区域进行粗划分,根据单个字符的宽度对初始划分的字符进行字符合并,并确认合并后的字符是粘连字符或非粘连字符,基于分割字符之间的字符间距内的像素点分布概率特征和粘连字符中每个手写字符的位置特征对标准Otsu算法进行改进,利用改进后的Otsu算法对每个粘连字符的垂直投影直方图进行分割,以实现粘连字符的细分割,使得金融票据上的手写汉字区域的手写汉字分割更准确,提高神经网络识别手写汉字的准确率。
Description
技术领域
本发明涉及图像识别技术领域,具体涉及一种金融票据中手写汉字分割识别方法。
背景技术
在字符处理领域内,手写体汉字分割和识别技术发展迅猛,其识别准确率正在逐步提升,应用场景日益不断拓展,其相关产品也日渐趋于成熟。但在金融票据上手写汉字主要识别手写金额区域,不同于其他汉字手写体应用场景,由于手写区域长度的限制,汉字相互贴近、粘连的情况很普遍,且汉字手写时字体风格因人而异,字号大小不一致,连笔、乱笔等现象频繁出现,这使得精确分割出字符变得十分困难。因此,手写汉字的正确切分成为提高手写汉字识别率的关键,尤其是金融票据中手写汉字间存在大量的粘连,使得汉字分割的不准确成为识别率不高的一个瓶颈。
目前,对于汉字切分的方法主要有基于汉字整体认识的切分方法、像素跟踪法、基于汉字笔划结构切分,这些方法容易将不粘连的汉字部件切分开,然而对于字符间发生严重粘连或交叠的情况,这些方法由于找不到准确的切分位置,容易造成粘连字符的错误合并。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种金融票据中手写汉字分割识别方法,所采用的技术方案具体如下:
采集金融票据的正面图像,获取所述正面图像中的手写汉字区域;
基于金融票据上的小写金额得到对应大写金额在所述手写汉字区域中的实际手写汉字和实际手写汉字总数量;计算所述手写汉字区域的宽度和所述实际手写汉字总数量之间的比值,得到单个实际手写汉字的理想宽度;使用垂直投影法对所述手写汉字区域进行粗分割,得到M个初始分割字符,M为正整数,基于初始分割字符的字符宽度和所述理想宽度对初始分割字符进行合并,得到N个分割字符,N为正整数且M不小于N,基于分割字符的字符宽度确认粘连字符和非粘连字符;
基于所述手写汉字区域中实际手写汉字的位置,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径,基于所述最优分割路径完成所述手写汉字区域中各个手写汉字的最终分割,利用神经网络对最终分割后的所述手写汉字区域进行手写汉字识别。
进一步的,所述基于初始分割字符的字符宽度和所述理想宽度对初始分割字符进行合并的方法,包括:
根据所述理想宽度设置单字符宽度阈值,对初始分割字符从左向右进行依次遍历,将初始分割字符的字符宽度小于单字符宽度阈值的两个相邻初始分割字符合并为一个分割字符,或者将初始分割字符的字符宽度小于单字符宽度阈值的单个初始分割字符与其右侧的初始分割字符合并为一个分割字符;将初始分割字符的字符宽度大于或等于单字符宽度阈值的初始分割字符作为一个分割字符。
进一步的,所述基于分割字符的字符宽度确认粘连字符和非粘连字符的方法,包括:
统计每个分割字符的字符宽度,构成一个字符宽度集合,取所述字符宽度集合中最小字符宽度,利用最小字符宽度对所述字符宽度集合中的每个字符宽度进行归一化处理,得到归一化字符宽度集合,其中,令归一化处理的公式为:K′i为第i个字符宽度的归一化字符宽度,Ki为字符宽度集合中第i个字符宽度,Kmin为最小字符宽度;
设定粘连字符宽度阈值,当归一化字符宽度大于或等于粘连字符宽度阈值时,确认对应的分割字符为粘连字符,当归一化字符宽度小于粘连字符宽度阈值时,确认对应的分割字符为非粘连字符。
进一步的,所述基于所述手写汉字区域中实际手写汉字的位置,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径的方法,包括:
基于历史分割识别数据,统计金融票据上的大写金额对应每种手写汉字的手写字符宽度集合,分别计算每个手写字符宽度集合对应的平均手写字符宽度,将所述平均手写字符宽度作为手写汉字的标准书写宽度;
统计每个粘连字符对应的汉字数量,根据所述手写汉字区域上每个实际手写汉字的位置定位粘连字符对应的实际手写汉字,以得到粘连字符中从左至右每个手写汉字对应的标准书写宽度;
根据当前粘连字符的所述汉字数量和每个手写汉字对应的标准书写宽度对标准书写宽度进行累加得到当前粘连字符对应的标准书写宽度总和;根据当前粘连字符中每个手写汉字对应的标准书写宽度和所述标准书写宽度总和,分别计算当前粘连字符中每个手写汉字的分割线位置;
统计所述手写汉字区域中相邻两个分割字符之间的字符间距,得到平均字符间距;根据所述平均字符间距内的像素点分布概率和所述分割线位置对标准Otsu算法进行改进,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径。
进一步的,所述改进的Otsu算法为:
其中,Fx j为第j个粘连字符的垂直投影直方图上横坐标值x对应的分割阈值;Kj为第j个粘连字符的字符宽度;wji为第j个粘连字符中第i个手写汉字对应的标准书写宽度;wand为所述标准书写宽度总和;为第j个粘连字符中第i个手写汉字对应分割线位置;表示横坐标值x到第i个手写汉字对应分割线位置的距离;P(x)为垂直投影直方图上横坐标值x上的像素点的分布概率;Qavg为所述平均字符间距;/>表示垂直投影直方图的横轴上横坐标值范围为[0,Qavg]内所有像素点的分布概率总和;ICV表示标准Otsu算法。
进一步的,所述利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径的方法,包括:
利用改进的Otsu算法得到当前粘连字符对应的垂直投影直方图上每个横坐标值对应的分割阈值,取最大的分割阈值作为当前粘连字符中对应手写汉字的最优分割路径。
本发明实施例至少具有如下有益效果:通过获取金融票据的手写汉字区域,利用垂直投影法对手写汉字区域进行粗划分,根据单个字符的宽度对初始划分的字符进行字符合并,并确认合并后的字符是粘连字符或非粘连字符,基于分割字符之间的字符间距内的像素点分布概率特征和粘连字符中每个手写字符的位置特征对标准Otsu算法进行改进,利用改进后的Otsu算法对每个粘连字符的垂直投影直方图进行分割,以实现粘连字符的细分割,使得金融票据上的手写汉字区域的手写汉字分割更准确,提高神经网络识别手写汉字的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例提供的一种金融票据中手写汉字分割识别方法的步骤流程图;
图2为本发明实施例所提供的一种叁佰的书写结果示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种金融票据中手写汉字分割识别方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种金融票据中手写汉字分割识别方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种金融票据中手写汉字分割识别方法的步骤流程图,该方法包括以下步骤:
步骤S001,采集金融票据的正面图像,获取所述正面图像中的手写汉字区域。
具体的,通过相机采集金融票据的正面图像,由于采集图像过程中角度问题,使得获取到的正面图像可能存在倾斜,倾斜的图像对后续定位工作的实现有着很大影响,因此必须对正面图像进行歪斜检测,对倾斜的金融票据进行矫正使其处于水平状态,具体方法为:通过霍夫直线变换找出正面图像中的直线,并通过这些直线求得近似真实值的旋转角度,根据旋转角度使用旋转函数对正面图像进行角度旋转,获得矫正后的正面图像。
已知同种金融票据上的手写金额区域的大小和位置固定,以此自动框选出手写汉字区域,其具体方法为:利用大津算法获得最佳阈值,以区分正面图像中的手写汉字和背景,然后进行二值化处理,手写汉字区域的像素值为0,背景区域的像素值为1;然后对手写汉字区域对应的二值图像进行滤波去噪,以及闭运算后再开运算的处理,消除毛刺和噪音,填补轮廓中断裂部分,同时又能保持手写汉字区域中的细节信息,使字符轮廓变得更加光滑。
需要说明的是,由于手写字体不会完全填充手写汉字区域,因此字体的边缘会有许多冗余信息,获取手写汉字区域的行和列的起始位置和终止位置,从而得到手写汉字区域的最小外接矩形,将最小外接矩形作为精准的手写汉字区域。
步骤S002,基于金融票据上的小写金额得到对应大写金额在手写汉字区域中的实际手写汉字和实际手写汉字总数量;计算手写汉字区域的宽度和实际手写汉字总数量之间的比值,得到单个实际手写汉字的理想宽度;使用垂直投影法对手写汉字区域进行粗分割,得到M个初始分割字符,M为正整数,基于初始分割字符的字符宽度和理想宽度对初始分割字符进行合并,得到N个分割字符,N为正整数且M不小于N,基于分割字符的字符宽度确认粘连字符和非粘连字符。
具体的,汉字由偏旁部首组成,分为上下、左右、包围结构,使用垂直投影法对手写汉字区域中的各个手写汉字进行粗略分割,得到M个初始分割字符,M为正整数,对于左右结构的汉字,若书写间距过大,偏旁部首会被划分为两个字符,导致粗分割存在分割误差,因此根据单个字符的标准宽度,区分初始分割字符是否为偏旁部首字符,进而以对初始分割字符进行合并,得到手写汉字区域的最终粗分割结果,则具体过程为:
已知金融票据上的磁码信息是由前台系统打印在票据上的,也就是本张金融票据的实际金额,则根据磁码信息获得实际金额;若无磁码信息,则根据金融票据上小写金额获得实际金额,由于小写金额为阿拉伯数字且有间隔划分故易于识别。由于小写金额与大写金额的信息一致性,则根据金融票据上识别到的实际金额,得到手写汉字区域上对应的实际手写汉字,且根据实际金额能够得到手写汉字区域的实际手写汉字总数量。
手写汉字具有每个汉字单独成块的特点,根据人们的书写习惯,同一个人书写的多个汉字大小相似,故单个手写汉字的宽度相差不大,因此计算手写汉字区域的宽度和实际手写汉字总数量之间的比值,则该比值为单个实际手写汉字的理想宽度A,也即是理想状态下单个实际手写汉字的宽度。
对手写汉字区域的二值图像使用垂直投影法进行粗略分割,即对二值图像左到右逐列遍历,统计每一列上汉字区域的像素点数量,以遍历方向为横轴,以像素点数量为纵轴,获得垂直投影直方图,其中手写汉字的点阵区域在垂直投影直方图上呈现出波峰状,而相邻汉字的字符间距在垂直投影直方图上呈现出波谷状,因此,可以利用两个波谷,对手写汉字区域中手写汉字进行切分,得到M个初始分割字符,M为正整数。
参照附图2,其示出了叁佰的书写结果示意图,因此根据个人书写的方式,书写结果存在正常(a)、粘连(b)、重叠(c)、过分(d)和重叠且粘连(e)的现象,进而导致粗分割结果会出现单个汉字的字符、偏旁部首独立的字符、多个汉字粘连的字符。
若汉字书写的偏旁部首间距过大,则会被划分为两个字符,因此根据单个手写汉字的理想宽度A,设置单字符宽度阈值0.6A,当初始分割字符的字符宽度小于单字符宽度阈值0.6A时,确认该初始分割字符为一个偏旁或部首,反之,当初始分割字符的字符宽度大于或等于单字符宽度阈值0.6A时,确认该初始分割字符为单个字符,也即是单个汉字对应的字符。根据汉字的构成,汉字左侧为偏旁,宽度相对较小,右侧为部首,宽度相对较大,因此对粗分割的初始分割字符从左向右依次遍历,将相邻两个确认为偏旁或部首对应的初始分割字符合并为一个分割字符,若只有一个单独的确认为偏旁或部首的初始分割字符,则该初始分割字符与其右侧的初始分割字符进行合并,进而通过对初始分割字符进行合并,得到N个分割字符,N为正整数且M不小于N。
统计每个分割字符的字符宽度,构成一个字符宽度集合K={K1,K2,…,KN},其中,K1为第1个分割字符的字符宽度,K2为第2个分割字符的字符宽度,KN为第N个分割字符的字符宽度,取字符宽度集合中最小字符宽度,利用最小字符宽度对字符宽度集合中的每个字符宽度进行归一化处理,即归一化字符宽度集合其中,Kmin为最小字符宽度,K′1为第1个分割字符的归一化字符宽度,K′2为第2个分割字符的归一化字符宽度,K′N为第N个分割字符的归一化字符宽度。
理想状态下,粘连字符在归一化字符宽度集合K′中的归一化字符宽度应不小于2,本发明实施例设定粘连字符宽度阈值,对归一化字符宽度集合K′中的每个归一化字符宽度进行遍历,当归一化字符宽度大于或等于粘连字符宽度阈值时,确认对应的分割字符为粘连字符,反之,当归一化字符宽度小于粘连字符宽度阈值时,确认对应的分割字符为非粘连字符,其中粘连字符是指多个手写汉字构成的字符,非粘连字符为单个手写汉字。
优选的,本发明实施例中粘连字符宽度阈值取经验值,且设置为1.7。
步骤S003,基于手写汉字区域中实际手写汉字的位置,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径,基于最优分割路径完成手写汉字区域中各个手写汉字的最终分割,利用神经网络对最终分割后的手写汉字区域进行手写汉字识别。
具体的,基于步骤S002的方法,得到手写汉字区域的最终粗分割结果,统计相邻两个分割字符之间的字符间距,得到手写汉字区域对应的平均字符间距Qavg。
统计每个粘连字符对应的汉字数量:当粘连字符对应的归一化字符宽度小于或等于第一数量宽度阈值时,认为该粘连字符为两个手写汉字的粘连,当粘连字符对应的归一化字符宽度大或等于第一数量宽度阈值,且小于第二数量宽度阈值时,认为该粘连字符为三个手写汉字的粘连,然后对数量宽度阈值同时加一处理,以此类推,获得所有粘连字符对应的汉字数量。
金融票据上的大写金额主要有零、壹、贰、叁、肆、伍、陆、柒、捌、玖、拾、佰、仟、万、亿、元、角、分、整、正,共20种汉字。由于汉字的左右偏旁部首的构造不同,书写的字体无法做到如印刷字体一般的同高同宽,如“万”字在书写上一般会比“捌”字窄,则基于历史分割识别数据,统计已经分割识别出的20种手写汉字中每种手写汉字的手写字符宽度集合,分别计算每个手写字符宽度集合对应的平均手写字符宽度,以平均手写字符宽度表示对应手写汉字的标准书写宽度,进而获得20种汉字的标准书写宽度集合w={w1,w2,…,w20},w1为第1个汉字的标准书写宽度,w2为第2个汉字的标准书写宽度,w20为第20个汉字的标准书写宽度。
基于大写金额对应20种汉字的标准书写宽度集合、手写汉字区域对应的平均字符间距Qavg和获得所有粘连字符对应的汉字数量分别对每个粘连字符进行细分割,其细分割步骤为:
(1)根据手写汉字区域上对应的实际手写汉字和每个实际手写汉字的位置,得到每个粘连字符中从左至右每个手写汉字对应的标准书写宽度,然后根据粘连字符对应的汉字数量和每个手写汉字对应的标准书写宽度对标准书写宽度进行累加得到粘连字符对应的标准书写宽度总和。
作为一个示例,根据手写汉字区域上每个实时手写汉字的位置能够定位当前粘连字符对应的实际手写汉字,进而根据20种汉字的标准书写宽度集合得到当前粘连字符对应的实际手写汉字的标准书写宽度。
(2)根据粘连字符中每个手写汉字对应的标准书写宽度和对应的标准书写宽度总和,利用改进的Otsu算法获取每个粘连字符中每个字符的最优分割路径,基于最优分割路径完成手写汉字区域中的字符分割。
具体的,以第j个粘连字符为例,由步骤(1)可知该粘连字符包括m个手写汉字,则每个手写汉字对应的标准书写宽度分别为wj1、wj2、…、wjm,其中,wj1为第j个粘连字符中第1个手写汉字对应的标准书写宽度,wj2为第j个粘连字符中第2个手写汉字对应的标准书写宽度,wjm为第j个粘连字符中第m个手写汉字对应的标准书写宽度,进而第j个粘连字符对应标准书写宽度总和为wand。
根据汉字的标准书写宽度可知,第i个手写汉字的分割路径越接近划分该粘连字符左侧的第i个手写汉字越准确;获取第j个粘连字符的垂直投影直方图,在垂直投影直方图上两个汉字的字符间距呈现出波谷状,则这两个汉字的字符间距区域内对应的手写汉字像素点的分布概率最小,因此基于这两种特征为权重,利用改进的Otsu算法对第j个粘连字符的垂直投影直方图进行分割,得到第i个手写汉字的最优分割路径,则最优分割路径的步骤为:
a.基于手写汉字的位置权重和像素点的分布概率对标准Otsu算法进行改进,则改进的Otsu算法为:
其中,Fx j为第j个粘连字符的垂直投影直方图上横坐标值x对应的分割阈值;Kj为第j个粘连字符的字符宽度;为第j个粘连字符中第i个手写汉字对应分割线位置;表示横坐标值x到第i个手写汉字对应分割线位置的距离;P(*)为垂直投影直方图上的横坐标值上的像素点的分布概率,*取横坐标值/>x-1、x、x+1和表示垂直投影直方图的横轴上横坐标值范围为[0,Qavg]内所有像素点的分布概率总和;ICV表示标准Otsu算法。
b.以第j个粘连字符的左侧的第一个手写汉字为例进行分割,将第j个粘连字符中第1个手写汉字的分割线位置代入步骤a中改进的Otsu算法,得到第j个粘连字符中第1个手写汉字对应的改进的Otsu算法/>对第j个粘连字符的垂直投影直方图上的每个横坐标值进行遍历,利用第j个粘连字符中第1个手写汉字对应的改进的Otsu算法得到每个横坐标值对应的分割阈值Fj,取最大的分割阈值Fmax j作为第j个粘连字符中第1个手写汉字的最优分割路径。
基于上述第一个手写汉字的最优分割路径的获取方法,根据第j个粘连字符中剩余手写汉字对应的标准书写宽度继续进行分割,直至将第j个粘连字符中的m个手写汉字分割出来。
根据第j个粘连字符的分割过程,能够将所有粘连字符都细分割出来,进而通过对粘连字符的细分割实现手写汉字区域的最终分割。
进一步的,创建一个手写汉字的字符模板库,通过神经网络训练字符模板库中的字符,利用训练好的神经网络对最终分割后的手写汉字区域进行字符识别,若汉字字符识别成功,且大写金额等于实际金额,则判断此金融票据有效,若大写金额不为实际金额,则判断此金融票据有错;若汉字字符识别失败,则判断大写金额书写不规范或大写金额与小写金额不同,需要人工检验。
综上所述,本发明实施例提供了一种金融票据中手写汉字分割识别方法,该方法通过获取金融票据的手写汉字区域,利用垂直投影法对手写汉字区域进行粗划分,根据单个字符的宽度对初始划分的字符进行字符合并,并确认合并后的字符是粘连字符或非粘连字符,基于分割字符之间的字符间距内的像素点分布概率特征和粘连字符中每个手写字符的位置特征对标准Otsu算法进行改进,利用改进后的Otsu算法对每个粘连字符的垂直投影直方图进行分割,以实现粘连字符的细分割,使得金融票据上的手写汉字区域的手写汉字分割更准确,提高神经网络识别手写汉字的准确率。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (2)
1.一种金融票据中手写汉字分割识别方法,其特征在于,该方法包括以下步骤:
采集金融票据的正面图像,获取所述正面图像中的手写汉字区域;
基于金融票据上的小写金额得到对应大写金额在所述手写汉字区域中的实际手写汉字和实际手写汉字总数量;计算所述手写汉字区域的宽度和所述实际手写汉字总数量之间的比值,得到单个实际手写汉字的理想宽度;使用垂直投影法对所述手写汉字区域进行粗分割,得到M个初始分割字符,M为正整数,基于初始分割字符的字符宽度和所述理想宽度对初始分割字符进行合并,得到N个分割字符,N为正整数且M不小于N,基于分割字符的字符宽度确认粘连字符和非粘连字符;
基于所述手写汉字区域中实际手写汉字的位置,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径,基于所述最优分割路径完成所述手写汉字区域中各个手写汉字的最终分割,利用神经网络对最终分割后的所述手写汉字区域进行手写汉字识别;
其中,基于初始分割字符的字符宽度和所述理想宽度对初始分割字符进行合并的方法为:根据所述理想宽度设置单字符宽度阈值,对初始分割字符从左向右进行依次遍历,将初始分割字符的字符宽度小于单字符宽度阈值的两个相邻初始分割字符合并为一个分割字符,或者将初始分割字符的字符宽度小于单字符宽度阈值的单个初始分割字符与其右侧的初始分割字符合并为一个分割字符;将初始分割字符的字符宽度大于或等于单字符宽度阈值的初始分割字符作为一个分割字符;
其中,基于分割字符的字符宽度确认粘连字符和非粘连字符的方法为:统计每个分割字符的字符宽度,构成一个字符宽度集合,取所述字符宽度集合中最小字符宽度,利用最小字符宽度对所述字符宽度集合中的每个字符宽度进行归一化处理,得到归一化字符宽度集合,其中,令归一化处理的公式为:,/>为第/>个字符宽度的归一化字符宽度,/>为字符宽度集合中第/>个字符宽度,/>为最小字符宽度;设定粘连字符宽度阈值,当归一化字符宽度大于或等于粘连字符宽度阈值时,确认对应的分割字符为粘连字符,当归一化字符宽度小于粘连字符宽度阈值时,确认对应的分割字符为非粘连字符;
其中,基于所述手写汉字区域中实际手写汉字的位置,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径的方法为:基于历史分割识别数据,统计金融票据上的大写金额对应每种手写汉字的手写字符宽度集合,分别计算每个手写字符宽度集合对应的平均手写字符宽度,将所述平均手写字符宽度作为手写汉字的标准书写宽度;统计每个粘连字符对应的汉字数量,根据所述手写汉字区域上每个实际手写汉字的位置定位粘连字符对应的实际手写汉字,以得到粘连字符中从左至右每个手写汉字对应的标准书写宽度;根据当前粘连字符的所述汉字数量和每个手写汉字对应的标准书写宽度对标准书写宽度进行累加得到当前粘连字符对应的标准书写宽度总和;根据当前粘连字符中每个手写汉字对应的标准书写宽度和所述标准书写宽度总和,分别计算当前粘连字符中每个手写汉字的分割线位置;统计所述手写汉字区域中相邻两个分割字符之间的字符间距,得到平均字符间距;根据所述平均字符间距内的像素点分布概率和所述分割线位置对标准Otsu算法进行改进,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径;
其中,所述改进的Otsu算法为:
其中,为第/>个粘连字符的垂直投影直方图上横坐标值/>对应的分割阈值;/>为第/>个粘连字符的字符宽度;/>为第/>个粘连字符中第/>个手写汉字对应的标准书写宽度;/>为所述标准书写宽度总和;/>为第/>个粘连字符中第/>个手写汉字对应分割线位置;表示横坐标值/>到第/>个手写汉字对应分割线位置的距离;/>为垂直投影直方图上横坐标值/>上的像素点的分布概率;/>为所述平均字符间距;/>表示垂直投影直方图的横轴上横坐标值范围为/>内所有像素点的分布概率总和;ICV表示标准Otsu算法。
2.如权利要求1所述的一种金融票据中手写汉字分割识别方法,其特征在于,所述利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径的方法,包括:
利用改进的Otsu算法得到当前粘连字符对应的垂直投影直方图上每个横坐标值对应的分割阈值,取最大的分割阈值作为当前粘连字符中对应手写汉字的最优分割路径。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210776221.2A CN115082934B (zh) | 2022-07-04 | 2022-07-04 | 一种金融票据中手写汉字分割识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210776221.2A CN115082934B (zh) | 2022-07-04 | 2022-07-04 | 一种金融票据中手写汉字分割识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115082934A CN115082934A (zh) | 2022-09-20 |
CN115082934B true CN115082934B (zh) | 2023-12-29 |
Family
ID=83258092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210776221.2A Active CN115082934B (zh) | 2022-07-04 | 2022-07-04 | 一种金融票据中手写汉字分割识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115082934B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115273088B (zh) * | 2022-09-30 | 2022-12-13 | 南通慕派商贸有限公司 | 基于机器视觉的汉字印刷质量检测方法 |
CN115410209B (zh) * | 2022-10-31 | 2023-01-31 | 山东济矿鲁能煤电股份有限公司阳城煤矿 | 一种基于图像处理的煤矿工单识别方法 |
CN115953785B (zh) * | 2023-03-15 | 2023-05-16 | 山东薪火书业有限公司 | 基于教辅图书内容增强的数字化编辑系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000207492A (ja) * | 1999-01-13 | 2000-07-28 | Internatl Business Mach Corp <Ibm> | 手書き漢字を自動的にセグメント分割し、認識するための方法およびシステム |
CN102567725A (zh) * | 2011-12-23 | 2012-07-11 | 国网电力科学研究院 | 一种金融ocr系统手写体数字串的软切分方法 |
CN111340032A (zh) * | 2020-03-16 | 2020-06-26 | 天津得迈科技有限公司 | 一种基于金融领域应用场景的字符识别方法 |
CN112257715A (zh) * | 2020-11-18 | 2021-01-22 | 西南交通大学 | 一种粘连字符识别方法及系统 |
-
2022
- 2022-07-04 CN CN202210776221.2A patent/CN115082934B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000207492A (ja) * | 1999-01-13 | 2000-07-28 | Internatl Business Mach Corp <Ibm> | 手書き漢字を自動的にセグメント分割し、認識するための方法およびシステム |
CN102567725A (zh) * | 2011-12-23 | 2012-07-11 | 国网电力科学研究院 | 一种金融ocr系统手写体数字串的软切分方法 |
CN111340032A (zh) * | 2020-03-16 | 2020-06-26 | 天津得迈科技有限公司 | 一种基于金融领域应用场景的字符识别方法 |
CN112257715A (zh) * | 2020-11-18 | 2021-01-22 | 西南交通大学 | 一种粘连字符识别方法及系统 |
Non-Patent Citations (1)
Title |
---|
陈湘 ; 孙章 ; 丁雪凇 ; .复杂背景下的票据字符类型识别方法.现代电子技术.2020,(08),第52-56页. * |
Also Published As
Publication number | Publication date |
---|---|
CN115082934A (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115082934B (zh) | 一种金融票据中手写汉字分割识别方法 | |
CN108710866B (zh) | 汉字模型训练方法、汉字识别方法、装置、设备及介质 | |
CN109389121B (zh) | 一种基于深度学习的铭牌识别方法及系统 | |
Farooq et al. | Pre-processing methods for handwritten Arabic documents | |
WO2019232873A1 (zh) | 文字模型训练方法、文字识别方法、装置、设备及介质 | |
Saba et al. | Annotated comparisons of proposed preprocessing techniques for script recognition | |
WO2019232872A1 (zh) | 手写字模型训练方法、汉字识别方法、装置、设备及介质 | |
CN112200117B (zh) | 表格识别方法及装置 | |
CN110210297B (zh) | 报关单图像中文字定位与提取的方法 | |
CN115171124B (zh) | 用于手写汉字识别的文本分割方法 | |
CN102496013A (zh) | 用于脱机手写汉字识别的汉字字符切分方法 | |
CN111914698A (zh) | 图像中人体的分割方法、分割系统、电子设备及存储介质 | |
CN111368632A (zh) | 一种签名识别方法及设备 | |
CN110516674B (zh) | 一种文本图像的手写汉字分割方法及系统 | |
CN111340032A (zh) | 一种基于金融领域应用场景的字符识别方法 | |
CN114387592B (zh) | 一种复杂背景下字符定位和识别方法 | |
Saeed et al. | Region growing based segmentation algorithm for typewritten and handwritten text recognition | |
CN115461792A (zh) | 手写文本识别方法、装置和系统,手写文本搜索方法和系统,以及计算机可读存储介质 | |
CN115862045A (zh) | 基于图文识别技术的病例自动识别方法、系统、设备及存储介质 | |
WO2022121021A1 (zh) | 一种身份证号码检测方法、装置、可读存储介质和终端 | |
US6671417B1 (en) | Character recognition system | |
CN112418210B (zh) | 一种杆塔巡检信息智能分类方法 | |
CN112364863A (zh) | 证照文档的文字定位方法及系统 | |
Bhattacharya et al. | Overwriting repetition and crossing-out detection in online handwritten text | |
Shi et al. | Handwritten Chinese character recognition based on morphology and transfer learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230320 Address after: Floor 5, Yindu Jinchuang Square, No. 2, Shuiximen Street, Qinhuai District, Nanjing City, Jiangsu Province, 210001 Applicant after: Jiang Feng Address before: Room 1062-18, No. 300 Jianning Road, Gulou District, Nanjing City, Jiangsu Province, 210000 Applicant before: Nanjing Chenhaotai Electronic Commerce Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |