CN115082934A - 一种金融票据中手写汉字分割识别方法 - Google Patents

一种金融票据中手写汉字分割识别方法 Download PDF

Info

Publication number
CN115082934A
CN115082934A CN202210776221.2A CN202210776221A CN115082934A CN 115082934 A CN115082934 A CN 115082934A CN 202210776221 A CN202210776221 A CN 202210776221A CN 115082934 A CN115082934 A CN 115082934A
Authority
CN
China
Prior art keywords
character
width
handwritten chinese
characters
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210776221.2A
Other languages
English (en)
Other versions
CN115082934B (zh
Inventor
陈晨
李蒙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiang Feng
Original Assignee
Nanjing Chenhaotai Electronic Commerce Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Chenhaotai Electronic Commerce Co ltd filed Critical Nanjing Chenhaotai Electronic Commerce Co ltd
Priority to CN202210776221.2A priority Critical patent/CN115082934B/zh
Publication of CN115082934A publication Critical patent/CN115082934A/zh
Application granted granted Critical
Publication of CN115082934B publication Critical patent/CN115082934B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

本发明涉及图像识别技术领域,具体涉及一种金融票据中手写汉字分割识别方法,该方法通过获取金融票据的手写汉字区域,利用垂直投影法对手写汉字区域进行粗划分,根据单个字符的宽度对初始划分的字符进行字符合并,并确认合并后的字符是粘连字符或非粘连字符,基于分割字符之间的字符间距内的像素点分布概率特征和粘连字符中每个手写字符的位置特征对标准Otsu算法进行改进,利用改进后的Otsu算法对每个粘连字符的垂直投影直方图进行分割,以实现粘连字符的细分割,使得金融票据上的手写汉字区域的手写汉字分割更准确,提高神经网络识别手写汉字的准确率。

Description

一种金融票据中手写汉字分割识别方法
技术领域
本发明涉及图像识别技术领域,具体涉及一种金融票据中手写汉字分割识别方法。
背景技术
在字符处理领域内,手写体汉字分割和识别技术发展迅猛,其识别准确率正在逐步提升,应用场景日益不断拓展,其相关产品也日渐趋于成熟。但在金融票据上手写汉字主要识别手写金额区域,不同于其他汉字手写体应用场景,由于手写区域长度的限制,汉字相互贴近、粘连的情况很普遍,且汉字手写时字体风格因人而异,字号大小不一致,连笔、乱笔等现象频繁出现,这使得精确分割出字符变得十分困难。因此,手写汉字的正确切分成为提高手写汉字识别率的关键,尤其是金融票据中手写汉字间存在大量的粘连,使得汉字分割的不准确成为识别率不高的一个瓶颈。
目前,对于汉字切分的方法主要有基于汉字整体认识的切分方法、像素跟踪法、基于汉字笔划结构切分,这些方法容易将不粘连的汉字部件切分开,然而对于字符间发生严重粘连或交叠的情况,这些方法由于找不到准确的切分位置,容易造成粘连字符的错误合并。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种金融票据中手写汉字分割识别方法,所采用的技术方案具体如下:
采集金融票据的正面图像,获取所述正面图像中的手写汉字区域;
基于金融票据上的小写金额得到对应大写金额在所述手写汉字区域中的实际手写汉字和实际手写汉字总数量;计算所述手写汉字区域的宽度和所述实际手写汉字总数量之间的比值,得到单个实际手写汉字的理想宽度;使用垂直投影法对所述手写汉字区域进行粗分割,得到M个初始分割字符,M为正整数,基于初始分割字符的字符宽度和所述理想宽度对初始分割字符进行合并,得到N个分割字符,N为正整数且M不小于N,基于分割字符的字符宽度确认粘连字符和非粘连字符;
基于所述手写汉字区域中实际手写汉字的位置,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径,基于所述最优分割路径完成所述手写汉字区域中各个手写汉字的最终分割,利用神经网络对最终分割后的所述手写汉字区域进行手写汉字识别。
进一步的,所述基于初始分割字符的字符宽度和所述理想宽度对初始分割字符进行合并的方法,包括:
根据所述理想宽度设置单字符宽度阈值,对初始分割字符从左向右进行依次遍历,将初始分割字符的字符宽度小于单字符宽度阈值的两个相邻初始分割字符合并为一个分割字符,或者将初始分割字符的字符宽度小于单字符宽度阈值的单个初始分割字符与其右侧的初始分割字符合并为一个分割字符;将初始分割字符的字符宽度大于或等于单字符宽度阈值的初始分割字符作为一个分割字符。
进一步的,所述基于分割字符的字符宽度确认粘连字符和非粘连字符的方法,包括:
统计每个分割字符的字符宽度,构成一个字符宽度集合,取所述字符宽度集合中最小字符宽度,利用最小字符宽度对所述字符宽度集合中的每个字符宽度进行归一化处理,得到归一化字符宽度集合,其中,令归一化处理的公式为:
Figure BDA0003727431210000021
K′i为第i个字符宽度的归一化字符宽度,Ki为字符宽度集合中第i个字符宽度,Kmin为最小字符宽度;
设定粘连字符宽度阈值,当归一化字符宽度大于或等于粘连字符宽度阈值时,确认对应的分割字符为粘连字符,当归一化字符宽度小于粘连字符宽度阈值时,确认对应的分割字符为非粘连字符。
进一步的,所述基于所述手写汉字区域中实际手写汉字的位置,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径的方法,包括:
基于历史分割识别数据,统计金融票据上的大写金额对应每种手写汉字的手写字符宽度集合,分别计算每个手写字符宽度集合对应的平均手写字符宽度,将所述平均手写字符宽度作为手写汉字的标准书写宽度;
统计每个粘连字符对应的汉字数量,根据所述手写汉字区域上每个实际手写汉字的位置定位粘连字符对应的实际手写汉字,以得到粘连字符中从左至右每个手写汉字对应的标准书写宽度;
根据当前粘连字符的所述汉字数量和每个手写汉字对应的标准书写宽度对标准书写宽度进行累加得到当前粘连字符对应的标准书写宽度总和;根据当前粘连字符中每个手写汉字对应的标准书写宽度和所述标准书写宽度总和,分别计算当前粘连字符中每个手写汉字的分割线位置;
统计所述手写汉字区域中相邻两个分割字符之间的字符间距,得到平均字符间距;根据所述平均字符间距内的像素点分布概率和所述分割线位置对标准Otsu算法进行改进,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径。
进一步的,所述改进的Otsu算法为:
Figure BDA0003727431210000022
Figure BDA0003727431210000031
其中,Fx j为第j个粘连字符的垂直投影直方图上横坐标值x对应的分割阈值;Kj为第j个粘连字符的字符宽度;wji为第j个粘连字符中第i个手写汉字对应的标准书写宽度;wand为所述标准书写宽度总和;
Figure BDA0003727431210000032
为第j个粘连字符中第i个手写汉字对应分割线位置;
Figure BDA0003727431210000033
表示横坐标值x到第i个手写汉字对应分割线位置的距离;P(x)为垂直投影直方图上横坐标值x上的像素点的分布概率;Qavg为所述平均字符间距;
Figure BDA0003727431210000034
表示垂直投影直方图的横轴上横坐标值范围为[0,Qavg]内所有像素点的分布概率总和;ICV表示标准Otsu算法。
进一步的,所述利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径的方法,包括:
利用改进的Otsu算法得到当前粘连字符对应的垂直投影直方图上每个横坐标值对应的分割阈值,取最大的分割阈值作为当前粘连字符中对应手写汉字的最优分割路径。
本发明实施例至少具有如下有益效果:通过获取金融票据的手写汉字区域,利用垂直投影法对手写汉字区域进行粗划分,根据单个字符的宽度对初始划分的字符进行字符合并,并确认合并后的字符是粘连字符或非粘连字符,基于分割字符之间的字符间距内的像素点分布概率特征和粘连字符中每个手写字符的位置特征对标准Otsu算法进行改进,利用改进后的Otsu算法对每个粘连字符的垂直投影直方图进行分割,以实现粘连字符的细分割,使得金融票据上的手写汉字区域的手写汉字分割更准确,提高神经网络识别手写汉字的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例提供的一种金融票据中手写汉字分割识别方法的步骤流程图;
图2为本发明实施例所提供的一种叁佰的书写结果示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种金融票据中手写汉字分割识别方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种金融票据中手写汉字分割识别方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种金融票据中手写汉字分割识别方法的步骤流程图,该方法包括以下步骤:
步骤S001,采集金融票据的正面图像,获取所述正面图像中的手写汉字区域。
具体的,通过相机采集金融票据的正面图像,由于采集图像过程中角度问题,使得获取到的正面图像可能存在倾斜,倾斜的图像对后续定位工作的实现有着很大影响,因此必须对正面图像进行歪斜检测,对倾斜的金融票据进行矫正使其处于水平状态,具体方法为:通过霍夫直线变换找出正面图像中的直线,并通过这些直线求得近似真实值的旋转角度,根据旋转角度使用旋转函数对正面图像进行角度旋转,获得矫正后的正面图像。
已知同种金融票据上的手写金额区域的大小和位置固定,以此自动框选出手写汉字区域,其具体方法为:利用大津算法获得最佳阈值,以区分正面图像中的手写汉字和背景,然后进行二值化处理,手写汉字区域的像素值为0,背景区域的像素值为1;然后对手写汉字区域对应的二值图像进行滤波去噪,以及闭运算后再开运算的处理,消除毛刺和噪音,填补轮廓中断裂部分,同时又能保持手写汉字区域中的细节信息,使字符轮廓变得更加光滑。
需要说明的是,由于手写字体不会完全填充手写汉字区域,因此字体的边缘会有许多冗余信息,获取手写汉字区域的行和列的起始位置和终止位置,从而得到手写汉字区域的最小外接矩形,将最小外接矩形作为精准的手写汉字区域。
步骤S002,基于金融票据上的小写金额得到对应大写金额在手写汉字区域中的实际手写汉字和实际手写汉字总数量;计算手写汉字区域的宽度和实际手写汉字总数量之间的比值,得到单个实际手写汉字的理想宽度;使用垂直投影法对手写汉字区域进行粗分割,得到M个初始分割字符,M为正整数,基于初始分割字符的字符宽度和理想宽度对初始分割字符进行合并,得到N个分割字符,N为正整数且M不小于N,基于分割字符的字符宽度确认粘连字符和非粘连字符。
具体的,汉字由偏旁部首组成,分为上下、左右、包围结构,使用垂直投影法对手写汉字区域中的各个手写汉字进行粗略分割,得到M个初始分割字符,M为正整数,对于左右结构的汉字,若书写间距过大,偏旁部首会被划分为两个字符,导致粗分割存在分割误差,因此根据单个字符的标准宽度,区分初始分割字符是否为偏旁部首字符,进而以对初始分割字符进行合并,得到手写汉字区域的最终粗分割结果,则具体过程为:
已知金融票据上的磁码信息是由前台系统打印在票据上的,也就是本张金融票据的实际金额,则根据磁码信息获得实际金额;若无磁码信息,则根据金融票据上小写金额获得实际金额,由于小写金额为阿拉伯数字且有间隔划分故易于识别。由于小写金额与大写金额的信息一致性,则根据金融票据上识别到的实际金额,得到手写汉字区域上对应的实际手写汉字,且根据实际金额能够得到手写汉字区域的实际手写汉字总数量。
手写汉字具有每个汉字单独成块的特点,根据人们的书写习惯,同一个人书写的多个汉字大小相似,故单个手写汉字的宽度相差不大,因此计算手写汉字区域的宽度和实际手写汉字总数量之间的比值,则该比值为单个实际手写汉字的理想宽度A,也即是理想状态下单个实际手写汉字的宽度。
对手写汉字区域的二值图像使用垂直投影法进行粗略分割,即对二值图像左到右逐列遍历,统计每一列上汉字区域的像素点数量,以遍历方向为横轴,以像素点数量为纵轴,获得垂直投影直方图,其中手写汉字的点阵区域在垂直投影直方图上呈现出波峰状,而相邻汉字的字符间距在垂直投影直方图上呈现出波谷状,因此,可以利用两个波谷,对手写汉字区域中手写汉字进行切分,得到M个初始分割字符,M为正整数。
参照附图2,其示出了叁佰的书写结果示意图,因此根据个人书写的方式,书写结果存在正常(a)、粘连(b)、重叠(c)、过分(d)和重叠且粘连(e)的现象,进而导致粗分割结果会出现单个汉字的字符、偏旁部首独立的字符、多个汉字粘连的字符。
若汉字书写的偏旁部首间距过大,则会被划分为两个字符,因此根据单个手写汉字的理想宽度A,设置单字符宽度阈值0.6A,当初始分割字符的字符宽度小于单字符宽度阈值0.6A时,确认该初始分割字符为一个偏旁或部首,反之,当初始分割字符的字符宽度大于或等于单字符宽度阈值0.6A时,确认该初始分割字符为单个字符,也即是单个汉字对应的字符。根据汉字的构成,汉字左侧为偏旁,宽度相对较小,右侧为部首,宽度相对较大,因此对粗分割的初始分割字符从左向右依次遍历,将相邻两个确认为偏旁或部首对应的初始分割字符合并为一个分割字符,若只有一个单独的确认为偏旁或部首的初始分割字符,则该初始分割字符与其右侧的初始分割字符进行合并,进而通过对初始分割字符进行合并,得到N个分割字符,N为正整数且M不小于N。
统计每个分割字符的字符宽度,构成一个字符宽度集合K={K1,K2,…,KN},其中,K1为第1个分割字符的字符宽度,K2为第2个分割字符的字符宽度,KN为第N个分割字符的字符宽度,取字符宽度集合中最小字符宽度,利用最小字符宽度对字符宽度集合中的每个字符宽度进行归一化处理,即归一化字符宽度集合
Figure BDA0003727431210000061
其中,Kmin为最小字符宽度,K′1为第1个分割字符的归一化字符宽度,K′2为第2个分割字符的归一化字符宽度,K′N为第N个分割字符的归一化字符宽度。
理想状态下,粘连字符在归一化字符宽度集合K′中的归一化字符宽度应不小于2,本发明实施例设定粘连字符宽度阈值,对归一化字符宽度集合K′中的每个归一化字符宽度进行遍历,当归一化字符宽度大于或等于粘连字符宽度阈值时,确认对应的分割字符为粘连字符,反之,当归一化字符宽度小于粘连字符宽度阈值时,确认对应的分割字符为非粘连字符,其中粘连字符是指多个手写汉字构成的字符,非粘连字符为单个手写汉字。
优选的,本发明实施例中粘连字符宽度阈值取经验值,且设置为1.7。
步骤S003,基于手写汉字区域中实际手写汉字的位置,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径,基于最优分割路径完成手写汉字区域中各个手写汉字的最终分割,利用神经网络对最终分割后的手写汉字区域进行手写汉字识别。
具体的,基于步骤S002的方法,得到手写汉字区域的最终粗分割结果,统计相邻两个分割字符之间的字符间距,得到手写汉字区域对应的平均字符间距Qavg
统计每个粘连字符对应的汉字数量:当粘连字符对应的归一化字符宽度小于或等于第一数量宽度阈值时,认为该粘连字符为两个手写汉字的粘连,当粘连字符对应的归一化字符宽度大或等于第一数量宽度阈值,且小于第二数量宽度阈值时,认为该粘连字符为三个手写汉字的粘连,然后对数量宽度阈值同时加一处理,以此类推,获得所有粘连字符对应的汉字数量。
金融票据上的大写金额主要有零、壹、贰、叁、肆、伍、陆、柒、捌、玖、拾、佰、仟、万、亿、元、角、分、整、正,共20种汉字。由于汉字的左右偏旁部首的构造不同,书写的字体无法做到如印刷字体一般的同高同宽,如“万”字在书写上一般会比“捌”字窄,则基于历史分割识别数据,统计已经分割识别出的20种手写汉字中每种手写汉字的手写字符宽度集合,分别计算每个手写字符宽度集合对应的平均手写字符宽度,以平均手写字符宽度表示对应手写汉字的标准书写宽度,进而获得20种汉字的标准书写宽度集合w={w1,w2,…,w20},w1为第1个汉字的标准书写宽度,w2为第2个汉字的标准书写宽度,w20为第20个汉字的标准书写宽度。
基于大写金额对应20种汉字的标准书写宽度集合、手写汉字区域对应的平均字符间距Qavg和获得所有粘连字符对应的汉字数量分别对每个粘连字符进行细分割,其细分割步骤为:
(1)根据手写汉字区域上对应的实际手写汉字和每个实际手写汉字的位置,得到每个粘连字符中从左至右每个手写汉字对应的标准书写宽度,然后根据粘连字符对应的汉字数量和每个手写汉字对应的标准书写宽度对标准书写宽度进行累加得到粘连字符对应的标准书写宽度总和。
作为一个示例,根据手写汉字区域上每个实时手写汉字的位置能够定位当前粘连字符对应的实际手写汉字,进而根据20种汉字的标准书写宽度集合得到当前粘连字符对应的实际手写汉字的标准书写宽度。
(2)根据粘连字符中每个手写汉字对应的标准书写宽度和对应的标准书写宽度总和,利用改进的Otsu算法获取每个粘连字符中每个字符的最优分割路径,基于最优分割路径完成手写汉字区域中的字符分割。
具体的,以第j个粘连字符为例,由步骤(1)可知该粘连字符包括m个手写汉字,则每个手写汉字对应的标准书写宽度分别为wj1、wj2、…、wjm,其中,wj1为第j个粘连字符中第1个手写汉字对应的标准书写宽度,wj2为第j个粘连字符中第2个手写汉字对应的标准书写宽度,wjm为第j个粘连字符中第m个手写汉字对应的标准书写宽度,进而第j个粘连字符对应标准书写宽度总和为wand
根据汉字的标准书写宽度可知,第i个手写汉字的分割路径越接近
Figure BDA0003727431210000071
划分该粘连字符左侧的第i个手写汉字越准确;获取第j个粘连字符的垂直投影直方图,在垂直投影直方图上两个汉字的字符间距呈现出波谷状,则这两个汉字的字符间距区域内对应的手写汉字像素点的分布概率最小,因此基于这两种特征为权重,利用改进的Otsu算法对第j个粘连字符的垂直投影直方图进行分割,得到第i个手写汉字的最优分割路径,则最优分割路径的步骤为:
a.基于手写汉字的位置权重和像素点的分布概率对标准Otsu算法进行改进,则改进的Otsu算法为:
Figure BDA0003727431210000072
Figure BDA0003727431210000073
其中,Fx j为第j个粘连字符的垂直投影直方图上横坐标值x对应的分割阈值;Kj为第j个粘连字符的字符宽度;
Figure BDA0003727431210000074
为第j个粘连字符中第i个手写汉字对应分割线位置;
Figure BDA0003727431210000075
表示横坐标值x到第i个手写汉字对应分割线位置的距离;P(*)为垂直投影直方图上的横坐标值上的像素点的分布概率,*取横坐标值
Figure BDA0003727431210000081
x-1、x、x+1和
Figure BDA0003727431210000082
表示垂直投影直方图的横轴上横坐标值范围为[0,Qavg]内所有像素点的分布概率总和;ICV表示标准Otsu算法。
b.以第j个粘连字符的左侧的第一个手写汉字为例进行分割,将第j个粘连字符中第1个手写汉字的分割线位置
Figure BDA0003727431210000083
代入步骤a中改进的Otsu算法,得到第j个粘连字符中第1个手写汉字对应的改进的Otsu算法
Figure BDA0003727431210000084
对第j个粘连字符的垂直投影直方图上的每个横坐标值进行遍历,利用第j个粘连字符中第1个手写汉字对应的改进的Otsu算法得到每个横坐标值对应的分割阈值Fj,取最大的分割阈值Fmax j作为第j个粘连字符中第1个手写汉字的最优分割路径。
基于上述第一个手写汉字的最优分割路径的获取方法,根据第j个粘连字符中剩余手写汉字对应的标准书写宽度继续进行分割,直至将第j个粘连字符中的m个手写汉字分割出来。
根据第j个粘连字符的分割过程,能够将所有粘连字符都细分割出来,进而通过对粘连字符的细分割实现手写汉字区域的最终分割。
进一步的,创建一个手写汉字的字符模板库,通过神经网络训练字符模板库中的字符,利用训练好的神经网络对最终分割后的手写汉字区域进行字符识别,若汉字字符识别成功,且大写金额等于实际金额,则判断此金融票据有效,若大写金额不为实际金额,则判断此金融票据有错;若汉字字符识别失败,则判断大写金额书写不规范或大写金额与小写金额不同,需要人工检验。
综上所述,本发明实施例提供了一种金融票据中手写汉字分割识别方法,该方法通过获取金融票据的手写汉字区域,利用垂直投影法对手写汉字区域进行粗划分,根据单个字符的宽度对初始划分的字符进行字符合并,并确认合并后的字符是粘连字符或非粘连字符,基于分割字符之间的字符间距内的像素点分布概率特征和粘连字符中每个手写字符的位置特征对标准Otsu算法进行改进,利用改进后的Otsu算法对每个粘连字符的垂直投影直方图进行分割,以实现粘连字符的细分割,使得金融票据上的手写汉字区域的手写汉字分割更准确,提高神经网络识别手写汉字的准确率。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种金融票据中手写汉字分割识别方法,其特征在于,该方法包括以下步骤:
采集金融票据的正面图像,获取所述正面图像中的手写汉字区域;
基于金融票据上的小写金额得到对应大写金额在所述手写汉字区域中的实际手写汉字和实际手写汉字总数量;计算所述手写汉字区域的宽度和所述实际手写汉字总数量之间的比值,得到单个实际手写汉字的理想宽度;使用垂直投影法对所述手写汉字区域进行粗分割,得到M个初始分割字符,M为正整数,基于初始分割字符的字符宽度和所述理想宽度对初始分割字符进行合并,得到N个分割字符,N为正整数且M不小于N,基于分割字符的字符宽度确认粘连字符和非粘连字符;
基于所述手写汉字区域中实际手写汉字的位置,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径,基于所述最优分割路径完成所述手写汉字区域中各个手写汉字的最终分割,利用神经网络对最终分割后的所述手写汉字区域进行手写汉字识别。
2.如权利要求1所述的一种金融票据中手写汉字分割识别方法,其特征在于,所述基于初始分割字符的字符宽度和所述理想宽度对初始分割字符进行合并的方法,包括:
根据所述理想宽度设置单字符宽度阈值,对初始分割字符从左向右进行依次遍历,将初始分割字符的字符宽度小于单字符宽度阈值的两个相邻初始分割字符合并为一个分割字符,或者将初始分割字符的字符宽度小于单字符宽度阈值的单个初始分割字符与其右侧的初始分割字符合并为一个分割字符;将初始分割字符的字符宽度大于或等于单字符宽度阈值的初始分割字符作为一个分割字符。
3.如权利要求1所述的一种金融票据中手写汉字分割识别方法,其特征在于,所述基于分割字符的字符宽度确认粘连字符和非粘连字符的方法,包括:
统计每个分割字符的字符宽度,构成一个字符宽度集合,取所述字符宽度集合中最小字符宽度,利用最小字符宽度对所述字符宽度集合中的每个字符宽度进行归一化处理,得到归一化字符宽度集合,其中,令归一化处理的公式为:
Figure FDA0003727431200000011
K′i为第i个字符宽度的归一化字符宽度,Ki为字符宽度集合中第i个字符宽度,Kmin为最小字符宽度;
设定粘连字符宽度阈值,当归一化字符宽度大于或等于粘连字符宽度阈值时,确认对应的分割字符为粘连字符,当归一化字符宽度小于粘连字符宽度阈值时,确认对应的分割字符为非粘连字符。
4.如权利要求1所述的一种金融票据中手写汉字分割识别方法,其特征在于,所述基于所述手写汉字区域中实际手写汉字的位置,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径的方法,包括:
基于历史分割识别数据,统计金融票据上的大写金额对应每种手写汉字的手写字符宽度集合,分别计算每个手写字符宽度集合对应的平均手写字符宽度,将所述平均手写字符宽度作为手写汉字的标准书写宽度;
统计每个粘连字符对应的汉字数量,根据所述手写汉字区域上每个实际手写汉字的位置定位粘连字符对应的实际手写汉字,以得到粘连字符中从左至右每个手写汉字对应的标准书写宽度;
根据当前粘连字符的所述汉字数量和每个手写汉字对应的标准书写宽度对标准书写宽度进行累加得到当前粘连字符对应的标准书写宽度总和;根据当前粘连字符中每个手写汉字对应的标准书写宽度和所述标准书写宽度总和,分别计算当前粘连字符中每个手写汉字的分割线位置;
统计所述手写汉字区域中相邻两个分割字符之间的字符间距,得到平均字符间距;根据所述平均字符间距内的像素点分布概率和所述分割线位置对标准Otsu算法进行改进,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径。
5.如权利要求4所述的一种金融票据中手写汉字分割识别方法,其特征在于,所述改进的Otsu算法为:
Figure FDA0003727431200000021
Figure FDA0003727431200000022
其中,Fx j为第j个粘连字符的垂直投影直方图上横坐标值x对应的分割阈值;Kj为第j个粘连字符的字符宽度;wji为第j个粘连字符中第i个手写汉字对应的标准书写宽度;wand为所述标准书写宽度总和;
Figure FDA0003727431200000023
为第j个粘连字符中第i个手写汉字对应分割线位置;
Figure FDA0003727431200000024
表示横坐标值x到第i个手写汉字对应分割线位置的距离;P(x)为垂直投影直方图上横坐标值x上的像素点的分布概率;Qavg为所述平均字符间距;
Figure FDA0003727431200000025
表示垂直投影直方图的横轴上横坐标值范围为[0,Qavg]内所有像素点的分布概率总和;ICV表示标准Otsu算法。
6.如权利要求5所述的一种金融票据中手写汉字分割识别方法,其特征在于,所述利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径的方法,包括:
利用改进的Otsu算法得到当前粘连字符对应的垂直投影直方图上每个横坐标值对应的分割阈值,取最大的分割阈值作为当前粘连字符中对应手写汉字的最优分割路径。
CN202210776221.2A 2022-07-04 2022-07-04 一种金融票据中手写汉字分割识别方法 Active CN115082934B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210776221.2A CN115082934B (zh) 2022-07-04 2022-07-04 一种金融票据中手写汉字分割识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210776221.2A CN115082934B (zh) 2022-07-04 2022-07-04 一种金融票据中手写汉字分割识别方法

Publications (2)

Publication Number Publication Date
CN115082934A true CN115082934A (zh) 2022-09-20
CN115082934B CN115082934B (zh) 2023-12-29

Family

ID=83258092

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210776221.2A Active CN115082934B (zh) 2022-07-04 2022-07-04 一种金融票据中手写汉字分割识别方法

Country Status (1)

Country Link
CN (1) CN115082934B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115273088A (zh) * 2022-09-30 2022-11-01 南通慕派商贸有限公司 基于机器视觉的汉字印刷质量检测方法
CN115410209A (zh) * 2022-10-31 2022-11-29 山东济矿鲁能煤电股份有限公司阳城煤矿 一种基于图像处理的煤矿工单识别方法
CN115953785A (zh) * 2023-03-15 2023-04-11 山东薪火书业有限公司 基于教辅图书内容增强的数字化编辑系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000207492A (ja) * 1999-01-13 2000-07-28 Internatl Business Mach Corp <Ibm> 手書き漢字を自動的にセグメント分割し、認識するための方法およびシステム
CN102567725A (zh) * 2011-12-23 2012-07-11 国网电力科学研究院 一种金融ocr系统手写体数字串的软切分方法
CN111340032A (zh) * 2020-03-16 2020-06-26 天津得迈科技有限公司 一种基于金融领域应用场景的字符识别方法
CN112257715A (zh) * 2020-11-18 2021-01-22 西南交通大学 一种粘连字符识别方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000207492A (ja) * 1999-01-13 2000-07-28 Internatl Business Mach Corp <Ibm> 手書き漢字を自動的にセグメント分割し、認識するための方法およびシステム
CN102567725A (zh) * 2011-12-23 2012-07-11 国网电力科学研究院 一种金融ocr系统手写体数字串的软切分方法
CN111340032A (zh) * 2020-03-16 2020-06-26 天津得迈科技有限公司 一种基于金融领域应用场景的字符识别方法
CN112257715A (zh) * 2020-11-18 2021-01-22 西南交通大学 一种粘连字符识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈湘;孙章;丁雪凇;: "复杂背景下的票据字符类型识别方法" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115273088A (zh) * 2022-09-30 2022-11-01 南通慕派商贸有限公司 基于机器视觉的汉字印刷质量检测方法
CN115410209A (zh) * 2022-10-31 2022-11-29 山东济矿鲁能煤电股份有限公司阳城煤矿 一种基于图像处理的煤矿工单识别方法
CN115953785A (zh) * 2023-03-15 2023-04-11 山东薪火书业有限公司 基于教辅图书内容增强的数字化编辑系统

Also Published As

Publication number Publication date
CN115082934B (zh) 2023-12-29

Similar Documents

Publication Publication Date Title
CN115082934A (zh) 一种金融票据中手写汉字分割识别方法
Louloudis et al. Text line and word segmentation of handwritten documents
Blumenstein et al. A novel feature extraction technique for the recognition of segmented handwritten characters
Lee et al. Binary segmentation algorithm for English cursive handwriting recognition
CN107103317A (zh) 基于图像融合和盲反卷积的模糊车牌图像识别算法
Wang et al. LPR-Net: Recognizing Chinese license plate in complex environments
CN106529532A (zh) 一种基于积分特征通道与灰度投影的车牌识别系统
CN115171124B (zh) 用于手写汉字识别的文本分割方法
CN112200117A (zh) 表格识别方法及装置
CN105426890A (zh) 一种字符扭曲粘连的图形验证码识别方法
Boussellaa et al. Unsupervised block covering analysis for text-line segmentation of Arabic ancient handwritten document images
CN111259893A (zh) 一种基于深度学习的智能工具管理方法
Saeed et al. Region growing based segmentation algorithm for typewritten and handwritten text recognition
Richarz et al. Towards semi-supervised transcription of handwritten historical weather reports
CN115862045A (zh) 基于图文识别技术的病例自动识别方法、系统、设备及存储介质
CN111340032A (zh) 一种基于金融领域应用场景的字符识别方法
CN110516674B (zh) 一种文本图像的手写汉字分割方法及系统
Bhattacharya et al. Overwriting repetition and crossing-out detection in online handwritten text
CN114387592B (zh) 一种复杂背景下字符定位和识别方法
CN113936305B (zh) 一种手掌识别过程中的中指位置确认方法及特征提取方法
Yu et al. Skeleton-based recognition of chinese calligraphic character image
CN112950636B (zh) 基于R3Det的女性阴道病原体的旋转框目标检测方法
CN102332088B (zh) 一种基于游程特征的选票符号机器视觉识别方法
CN107301429B (zh) 一种基于局部位置值得分的车牌相似字符识别方法
Lv et al. Off-line Signature Verification based on deformable grid partition and Hidden Markov Models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230320

Address after: Floor 5, Yindu Jinchuang Square, No. 2, Shuiximen Street, Qinhuai District, Nanjing City, Jiangsu Province, 210001

Applicant after: Jiang Feng

Address before: Room 1062-18, No. 300 Jianning Road, Gulou District, Nanjing City, Jiangsu Province, 210000

Applicant before: Nanjing Chenhaotai Electronic Commerce Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant