CN112016566A - 一种金融票据大写金额处手写汉字的分割方法 - Google Patents

一种金融票据大写金额处手写汉字的分割方法 Download PDF

Info

Publication number
CN112016566A
CN112016566A CN202011160188.8A CN202011160188A CN112016566A CN 112016566 A CN112016566 A CN 112016566A CN 202011160188 A CN202011160188 A CN 202011160188A CN 112016566 A CN112016566 A CN 112016566A
Authority
CN
China
Prior art keywords
chinese characters
image
threshold value
background
foreground
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011160188.8A
Other languages
English (en)
Other versions
CN112016566B (zh
Inventor
张振彬
刘贯伟
王伟
张云峰
安增花
武艳红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cashway Technology Co Ltd
Original Assignee
Cashway Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cashway Technology Co Ltd filed Critical Cashway Technology Co Ltd
Priority to CN202011160188.8A priority Critical patent/CN112016566B/zh
Publication of CN112016566A publication Critical patent/CN112016566A/zh
Application granted granted Critical
Publication of CN112016566B publication Critical patent/CN112016566B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种金融票据大写金额处手写汉字的分割方法,其特征在于,包括以下步骤:选取大写金额处手写汉字区域;利用大律法计算图像最佳分割阈值:遍历图像灰度值并求和取平均值,得到初步分割的阈值,遍历阈值从0到255,每次遍历需计算前景和背景的方差值,当方差值取得最大时,判定前景和背景的差异最大,此时得到的阈值为最佳分割阈值;利用最佳分割阈值对图像进行二值化,得到手写体汉字和背景分割的二值化图像;横向投影计算汉字平均高度;纵向投影确定最优宽度序列;利用平均高度及最优宽度序列分割大写金额处手写汉字。

Description

一种金融票据大写金额处手写汉字的分割方法
技术领域
本发明涉及薄片类纸质介质处理领域,特别是涉及一种金融票据处的大写金额处手写体汉字的分割方法。
背景技术
目前,在字符处理领域内,手写体汉字分割和识别技术发展迅猛,其识别准确率正在逐步提升,应用场景日益不断拓展,其相关产品也日渐趋于成熟,但在金融票据上大写金额处的特定识别场景下的应用效果并不理想。
不同于其他汉字手写体应用场景,金融票据上大写金额汉字种类较少,有壹 、贰、叁、肆、伍、陆、柒等共约20个,由于手写区域长度的限制,汉字相互贴近、粘连的情况很普遍,且汉字手写时字体风格因人而异,字号大小不一致,连笔、乱笔等现象频繁出现,这使得精确分割出字符变得十分困难。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种金融票据大写金额处手写汉字的分割方法,
为实现本发明的目的所采用的技术方案是:
一种金融票据大写金额处手写汉字的分割方法,其特征在于,包括以下步骤:
选取大写金额处手写汉字区域;
利用大律法计算图像最佳分割阈值:遍历图像灰度值并求和取平均值,得到初步分割的阈值,遍历阈值从0到255,每次遍历需计算前景和背景图象的方差值,当方差值取得最大时,判定前景和背景的差异最大,此时得到的阈值为最佳分割阈值;
利用最佳分割阈值对图像进行二值化,得到手写体汉字和背景分割的二值化图像;
横向投影计算汉字平均高度;
纵向投影确定最优宽度序列;
利用平均高度及最优宽度序列分割大写金额处手写汉字。
作为优选的,得到初步分割的阈值后,分别计算前景和背景的点数、质量矩、平均灰度,得到前景和背景图象的方差值。
作为优选的,前景和背景图象的方差值计算公式如下:
g=w0*(u0-u)*(u0-u)+w1*(u1-u)*(u1-u)=w0*w1*(u0-u1)*(u0-u1) 公式1
其中:g是前景和背景的方差值;w0是前景像素点数占图像总像素数的比例值;u0是前景中的平均灰度;w1是背景像素点数占图像总像素数的比例值,u1是背景中的平均灰度;u是图像的总平均灰度。
作为优选的,图像的总平均灰度的计算公式如下:
u=w0*u0+w1*u1 公式2。
作为优选的,对二值化图像进行横向投影,计算每行汉字区所占像素点个数,以行像素点数作为限定条件,排除干扰点,得到有效连续的行数,即为汉字平均高度。
作为优选的,使用汉字平均高度值截取横向投影图像,再对其进行纵向投影,得到垂直方向上各列有效像素点个数,即初步的宽度序列。
作为优选的,针对初步的宽度序列,采用近似间隔的方法来确定汉字的最优宽度序列,包括如下步骤:
假设汉字边界处的最大像素点个数为s,小于s个像素点数即被认为是近似间隔b,每行手写体汉字可得到b1,b2,b3......bn约n个近似间隔;
对n个近似间隔取平均值Mn,Mn=(b1+b2+b3+......+bn)/n;
依据判定条件:Mn-5< b 且 b< Mn+5,得到有效的间隔:b1’,b2’,b3’......bm’;
由有效间隔点对应的坐标位置计算得到最优宽度序列。
本发明的有益效果在于:
本发明在研究了多种经典分割算法的基础上,采用了横向投影计算汉字平均高度和纵向投影确定最优宽度序列的字符分割方法。该方法从根本上克服了已有算法需要细化、路径搜索等复杂处理的弊端,从而大大提高分割率,缩短分割时间。最重要的是极大提升了大写金额字符的分割正确率,为进一步提高字符识别准确率打好基础。
附图说明
图1是某一种票据样例图片的部分截图。
图2是票据中大写手写金额处的放大图。
图3是分割成功的图像。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
一种金融票据大写金额处手写汉字的分割方法,包括以下步骤:
1.获取精确的大写金额处手写汉字区域;
截取大写金额的ROI图像,使用连通域分割方法,得到其最小外接矩形,用其截取原图像,即可获得精确的汉字区域图像。
2.利用大律法计算图像最佳分割阈值:遍历图像灰度值并求和取平均值,得到初步分割的阈值,遍历阈值从0到255,每次遍历需计算前景和背景图象的方差值,当方差值取得最大时,判定前景和背景的差异最大,此时得到的阈值为最佳分割阈值。
其中得到初步分割的阈值后,分别计算前景和背景的点数、质量矩、平均灰度,得到前景和背景图象的方差值。
前景和背景图象的方差值计算公式如下:
g=w0*(u0-u)*(u0-u)+w1*(u1-u)*(u1-u)=w0*w1*(u0-u1)*(u0-u1) 公式1
其中:g是前景和背景的方差值;w0是前景像素点数占图像总像素数的比例值;u0是前景中的平均灰度;w1是背景像素点数占图像总像素数的比例值,u1是背景中的平均灰度;u是图像的总平均灰度。
图像的总平均灰度的计算公式如下:
u=w0*u0+w1*u1 公式2。
3.利用最佳分割阈值对图像进行二值化,得到手写体汉字的二值化图像。
4.横向投影计算汉字平均高度;对二值化图像进行横向投影,计算每行汉字区所占像素点个数,以行像素点数作为限定条件,排除干扰点,得到有效连续的行数,即为汉字平均高度。
5.纵向投影确定最优宽度序列;使用汉字平均高度值截取横向投影图像,再对其进行纵向投影,得到垂直方向上各列有效像素点个数,即初步的宽度序列。
针对初步的宽度序列,采用近似间隔的方法来确定汉字的最优宽度序列,包括如下步骤:
假设汉字边界处的最大像素点个数为s,小于s个像素点数即被认为是近似间隔b,每行手写体汉字可得到b1,b2,b3......bn约n个近似间隔;
对n个近似间隔取平均值Mn,Mn=(b1+b2+b3+......+bn)/n;
依据判定条件:Mn-5< b 且 b< Mn+5,得到有效的间隔:b1’,b2’,b3’......bm’;
由有效间隔点对应的坐标位置计算得到最优宽度序列。
6.利用平均高度及最优宽度序列分割大写金额处手写汉字。
由最优宽度序列的坐标值,及对应的宽度和平均高度,计算得到一组分割矩形,再用其依次分割出单个字符图像。
针对本发明的技术方案与现有技术中的连通域分割法和投影分割法,分别进行了分割统计,结果如下表,从表中可以看出,本发明的技术方案分割准确率高。
分割算法 样本总数 分割成功数 分割失败数 分割准确率
本发明分割算法 10000 9458 542 94.58%
连通域分割法 10000 5547 4453 55.47%
投影分割法 10000 7898 2102 78.98%
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种金融票据大写金额处手写汉字的分割方法,其特征在于,包括以下步骤:
选取大写金额处手写汉字区域;
计算图像最佳分割阈值;
利用最佳分割阈值对图像进行二值化,得到手写体汉字和背景分割的二值化图像;
横向投影计算汉字平均高度;
纵向投影确定最优宽度序列;
利用平均高度及最优宽度序列分割大写金额处手写汉字。
2.根据权利要求1所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,利用大律法计算图像最佳分割阈值:遍历图像灰度值并求和取平均值,得到初步分割的阈值,遍历阈值从0到255,每次遍历需计算前景和背景的方差值,当方差值取得最大时,判定前景和背景的差异最大,此时得到的阈值为最佳分割阈值。
3.根据权利要求2所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,得到初步分割的阈值后,分别计算前景和背景的点数、质量矩、平均灰度,得到前景和背景的方差值。
4.根据权利要求3所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,前景和背景图象的方差值计算公式如下:
g=w0*(u0-u)*(u0-u)+w1*(u1-u)*(u1-u)=w0*w1*(u0-u1)*(u0-u1) 公式1
其中:g是前景和背景的方差值;w0是前景像素点数占图像总像素数的比例值;u0是前景中的平均灰度;w1是背景像素点数占图像总像素数的比例值,u1是背景中的平均灰度;u是图像的总平均灰度。
5.根据权利要求4所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,图像的总平均灰度的计算公式如下:
u=w0*u0+w1*u1 公式2。
6.根据权利要求1 所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,对二值化图像进行横向投影,计算每行汉字区所占像素点个数,以行像素点数作为限定条件,排除干扰点,得到有效连续的行数,即为汉字平均高度。
7.根据权利要求1 所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,使用汉字平均高度值截取横向投影图像,再对其进行纵向投影,得到垂直方向上各列有效像素点个数,即初步的宽度序列。
8.根据权利要求7 所述的一种金融票据大写金额处手写汉字的分割方法,其特征在于,针对初步的宽度序列,采用近似间隔的方法来确定汉字的最优宽度序列,包括如下步骤:
假设汉字边界处的最大像素点个数为s,小于s个像素点数即被认为是近似间隔b,每行手写体汉字可得到b1,b2,b3......bn约n个近似间隔;
对n个近似间隔取平均值Mn,Mn=(b1+b2+b3+......+bn)/n;
依据判定条件:Mn-5< b 且 b< Mn+5,得到有效的间隔:b1’,b2’,b3’......bm’;
由有效间隔点对应的坐标位置计算得到最优宽度序列。
CN202011160188.8A 2020-10-27 2020-10-27 一种金融票据大写金额处手写汉字的分割方法 Active CN112016566B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011160188.8A CN112016566B (zh) 2020-10-27 2020-10-27 一种金融票据大写金额处手写汉字的分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011160188.8A CN112016566B (zh) 2020-10-27 2020-10-27 一种金融票据大写金额处手写汉字的分割方法

Publications (2)

Publication Number Publication Date
CN112016566A true CN112016566A (zh) 2020-12-01
CN112016566B CN112016566B (zh) 2021-03-16

Family

ID=73527713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011160188.8A Active CN112016566B (zh) 2020-10-27 2020-10-27 一种金融票据大写金额处手写汉字的分割方法

Country Status (1)

Country Link
CN (1) CN112016566B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528895A (zh) * 2020-12-17 2021-03-19 恒银金融科技股份有限公司 一种金融票据图像票号处变造检测的计算方法
CN115050015A (zh) * 2022-08-15 2022-09-13 恒银金融科技股份有限公司 金融票据账号字符区的精确分割方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251892B (zh) * 2008-03-07 2010-06-09 北大方正集团有限公司 一种字符切分方法和装置
CN102496013B (zh) * 2011-11-11 2013-08-21 苏州大学 用于脱机手写汉字识别的汉字字符切分方法
CN109948620A (zh) * 2019-03-19 2019-06-28 厦门商集网络科技有限责任公司 一种字符分割方法及终端

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528895A (zh) * 2020-12-17 2021-03-19 恒银金融科技股份有限公司 一种金融票据图像票号处变造检测的计算方法
CN112528895B (zh) * 2020-12-17 2023-09-12 恒银金融科技股份有限公司 一种金融票据图像票号处变造检测的计算方法
CN115050015A (zh) * 2022-08-15 2022-09-13 恒银金融科技股份有限公司 金融票据账号字符区的精确分割方法
CN115050015B (zh) * 2022-08-15 2023-09-12 恒银金融科技股份有限公司 金融票据账号字符区的精确分割方法

Also Published As

Publication number Publication date
CN112016566B (zh) 2021-03-16

Similar Documents

Publication Publication Date Title
CN111814722B (zh) 一种图像中的表格识别方法、装置、电子设备及存储介质
CN109409366B (zh) 基于角点检测的畸变图像校正方法及装置
CN107066933B (zh) 一种道路标牌识别方法及系统
CN107045634B (zh) 一种基于最大稳定极值区域与笔画宽度的文本定位方法
CN109784344A (zh) 一种用于地平面标识识别的图像非目标滤除方法
CN103810474A (zh) 一种基于多特征低秩矩阵表示的车牌检测方法
CN112016566B (zh) 一种金融票据大写金额处手写汉字的分割方法
CN107563379B (zh) 用于对自然场景图像中文本的定位方法
CN108921813B (zh) 一种基于机器视觉的无人机检测桥梁结构裂缝识别方法
CN106682629A (zh) 一种复杂背景下身份证号识别算法
CN105913396A (zh) 一种噪声估计的图像边缘保持混合去噪方法
CN109409356B (zh) 一种基于swt的多方向中文印刷体文字检测方法
CN109376740A (zh) 一种基于视频的水尺读数检测方法
CN105205488A (zh) 基于Harris角点和笔画宽度的文字区域检测方法
WO2023279966A1 (zh) 一种多车道线检测方法、装置及检测设备
CN107944451B (zh) 一种藏文古籍文档的行切分方法及系统
CN105894487A (zh) 钢材图像编号的提取与分割方法
CN112446262A (zh) 文本分析方法、装置、终端和计算机可读存储介质
CN112016565B (zh) 一种金融票据的账号处模糊数字的分割方法
CN108205678A (zh) 一种含有亮斑干扰的铭牌文字识别处理方法
CN114445814B (zh) 一种字符区域提取方法、计算机可读存储介质
CN116309780A (zh) 一种基于目标检测的水尺水位识别方法
CN112528895A (zh) 一种金融票据图像票号处变造检测的计算方法
CN115588208A (zh) 一种基于数字图像处理技术的全线表结构识别方法
CN110490885B (zh) 改进的自适应阈值二值化方法及vin码字符分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant