CN112016565B - 一种金融票据的账号处模糊数字的分割方法 - Google Patents

一种金融票据的账号处模糊数字的分割方法 Download PDF

Info

Publication number
CN112016565B
CN112016565B CN202011159519.6A CN202011159519A CN112016565B CN 112016565 B CN112016565 B CN 112016565B CN 202011159519 A CN202011159519 A CN 202011159519A CN 112016565 B CN112016565 B CN 112016565B
Authority
CN
China
Prior art keywords
boundary
account
character
image
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011159519.6A
Other languages
English (en)
Other versions
CN112016565A (zh
Inventor
张振彬
刘贯伟
王伟
张云峰
安增花
武艳红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cashway Technology Co Ltd
Original Assignee
Cashway Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cashway Technology Co Ltd filed Critical Cashway Technology Co Ltd
Priority to CN202011159519.6A priority Critical patent/CN112016565B/zh
Publication of CN112016565A publication Critical patent/CN112016565A/zh
Application granted granted Critical
Publication of CN112016565B publication Critical patent/CN112016565B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种金融票据的账号处模糊数字的分割方法,其特征在于,包括以下步骤:第一步,截取整体图像中的账号区域图像,计算账号区域图像的灰度均值,利用均值对账号区域图像二值化;第二步,对账号区域二值化图像进行垂直投影;垂直投影后得到宽度像素点列,依次对账号区域图像每个像素宽度上垂直方向的像素数,进行零值判定,得到初步分割字符边界序列;第三步,依次以上个步骤得到的每个边界点为中心,分别对距离其相邻位置的前、后边界所占像素数进行累加计算,以对初步分割字符边界序列进行判断,判定是字符边界,还是发生断裂,去除断裂处的边界点,获得有效边界序列,利用有效边界序列进行账号区域图像的数字分割。

Description

一种金融票据的账号处模糊数字的分割方法
技术领域
本发明涉及薄片类纸质介质字符处理技术领域,特别是涉及一种金融票据的账号处模糊数字的分割方法。
背景技术
在目前的字符处理技术中,打印体数字的分割与识别技术已经十分成熟,一般情况下,数字字符在二值化后,进行水平、垂直投影,就能获得较好的分割效果,经神经网络算法训练、识别后,得到较高的准确率。但是对金融票据账号特定场景处的数字分割很不理想。
由于票据在长时间保存后,票据账号处的数字墨迹变得十分模糊,二值化处理后,一些字符中间常常出现像素断裂、缺失的情况,使得投影分割的方法难以奏效,分割的失败直接影响后续的识别准确率。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种金融票据的账号处模糊数字的分割方法。
为实现本发明的目的所采用的技术方案是:
一种金融票据的账号处模糊数字的分割方法,其特征在于,包括以下步骤:
第一步,截取整体图像中的账号区域图像,对账号区域图像二值化;
第二步,得到账号区域二值化图像后,对其进行垂直投影,得到宽度像素点列,依次对投影后的宽度像素点列进行边界判定,求得初步分割字符边界序列;
第三步,依次以第二步得到的每个初步分割字符边界点为中心,分别对距离其相邻位置的前、后边界所占像素数进行累加计算,以对初步分割字符边界序列进行判断,判定是字符边界或发生断裂中的任意一种,去除发生断裂处的边界点,获得有效边界序列,利用有效边界序列进行账号区域图像的数字分割。
作为优选的,第一步中,截取整体图像中的账号区域图像,计算账号区域图像的灰度均值,利用灰度均值对账号区域图像二值化。
作为优选的,账号区域图像的灰度均值通过以下公式计算:
Figure 356991DEST_PATH_IMAGE001
公式1
其中:Gh为账号区域图像的第h个灰度值,M为账号区域图像的宽,N为账号区域图像的高,Gav为灰度均值,以灰度均值作为二值化的阈值,故Gav即为二值化的阈值。
作为优选的,第一步中,采用物理坐标截取到整体图像中的账号区域图像。
作为优选的,第三步中,每个边界点相邻位置的前、后边界所占像素数的累加计算公式如下:
Figure 726661DEST_PATH_IMAGE002
公式2
Figure 709661DEST_PATH_IMAGE003
公式3
其中:AFr为边界点r处前n个像素宽度的总像素数,ABr为边界点r处后n个像素宽度的总像素数,Nk为账号区域图像k点处垂直方向的像素个数。
作为优选的,当AFr>X且ABr<X,此处的初步分割字符边界点为字符右边界;
当AFr<X且ABr>X,此处的初步分割字符边界点为字符左边界;
当AFr>X且ABr>X,此处的初步分割字符边界点为字符断裂点;
其中,X为断裂面积比较阈值。
作为优选的,初步分割字符边界序列分为左边界数组和右边界数组,两边界数组相减取绝对值,得到账号处字符的宽度值数组,对宽度值数组求和,计算平均值,得到平均宽度W,以W的五分之一作为判别半径,n取值为W/5。
作为优选的,计算账号区域二值化图像所有有效像素点数,求得总像素点数S,已知账号处字符个数为m,S/m为每个字符的平均像素数Ap,取Ap/10为断裂面积比较阈值X。
作为优选的,所述有效像素点数是指黑色像素点点数。
作为优选的,第二步中,垂直投影后得到宽度像素点列,依次对账号区域图像每个像素宽度上垂直方向的像素数,进行零值判定,若该宽度点垂直方向的像素数为0,认定为边界,得到初步分割字符边界序列。
本发明的有益效果在于:
本发明设计的分割方法,在常规分割的基础上新增了边界点的判断方法,能够进一步区分是真正边界点还是仅是字符断裂处,增加了分割的准确性,更进一步地为下一步的识别提高了准确率。
附图说明
图1是票据整体视图中的部分截图。
图2是账号区域图像视图。
图3是账号区域图像二值化后的视图。
图4是账号区域图像完成分割后的视图。
具体实施方式
以下以具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
一种金融票据的账号处模糊数字的分割方法,包括以下步骤:
第一步,截取整体图像中的账号区域图像,方法为采用物理坐标截取到整体图像中的账号区域图像,计算账号区域图像的灰度均值,利用灰度均值对账号区域图像二值化,得到二值化后的图像,如图3所示,本方案中的图像二值化方法为:让账号区域图像中的每一个像素点与灰度均值一一比较,小于等于灰度均值的像素点置为0(黑色),大于灰度均值的像素点置为255(白色)。
账号区域图像的灰度均值通过以下公式计算,遍历并累加,再除以图像总像素数,得到灰度均值,以灰度均值作为二值化的阈值,故Gav即为二值化的阈值。
Figure 573712DEST_PATH_IMAGE004
公式1
其中:Gh为账号区域图像的第h个灰度值,M为账号区域图像的宽(图像宽为像素值),N为账号区域图像的高(图像高为像素值),Gav为灰度均值。
一般票据的账号存在于图像某个固定位置,使用图像物理坐标即可截取到其账号区域图像。
第二步,得到账号区域二值化图像后,对账号区域二值化图像进行垂直投影,也叫纵向投影,指二维图象按行向y轴方向投影,投影的结果看成是一维图像,本方案中采用matlab对1行若干个字符进行垂直投影,垂直投影图显示了若干个起伏不一的波峰,波峰的上升点和下降点即为字符宽度像素点列,也是后续进行初步分割字符边界序列判定的基础数据。
垂直投影后得到宽度像素点列,依次对账号区域图像每个像素宽度上垂直方向的像素数,进行零值判定,若该宽度点垂直方向的像素数为0,可认定为边界,得到初步分割字符边界序列;
由于图像较模糊,二值化后一些数字中间发生断裂,初步分割字符边界序列内的字符边界值和断裂边界值混在一起,如果直接用来识别,那么一个发生断裂的字符会被识别成两个独立的字符。因此,需要进行进一步判定,排除断裂边界,筛选出有效边界值。
第三步,依次以上个步骤得到的每个边界点为中心,分别对距离其相邻位置的前、后边界所占像素数进行累加计算,以对初步分割字符边界序列进行判断,判定是字符边界,还是发生断裂,去除断裂处的边界点,获得有效边界序列,利用有效边界序列进行账号区域图像的数字分割。
每个边界点相邻位置的前、后边界所占像素数的累加计算公式如下:
Figure 106193DEST_PATH_IMAGE005
公式2
Figure 833715DEST_PATH_IMAGE006
公式3
其中:AFr为边界点r处前n个像素宽度的总像素数,ABr为边界点r处后n个像素宽度的总像素数,Nk为账号区域图像k点处垂直像素个数。
当边界点为字符右边界时,AFr>X且ABr<X;
当边界点为字符左边界时,AFr<X且ABr>X;
当边界点为字符断裂点时,AFr>X且ABr>X;
其中,X为断裂面积比较阈值;
一般每个字符之间都有一定的间隔,两个字符之间有效像素点数几乎为零;
当边界点为字符右边界时,往后n个像素宽度上是间隔,那么连续n个点的累加像素总数肯定小于X;
当边界点为字符左边界,往前n个像素宽度上也是间隔,那么连续n个点的累加像素总数肯定也小于X;
当边界点为字符的断裂处时,往前n个像素宽度是字符有效区域,往后n个像素宽度也是字符有效区域,那么两者各自累加的像素总数都大于X;以此来判定其有效间隔。
需要进一步说明的是,n的计算方式为:初步分割字符边界序列分为左边界数组和右边界数组,两边界数组相减取绝对值,得到账号处字符的宽度值数组,对宽度值数组求和,计算平均值,得到平均宽度W,以W的五分之一作为判别半径,n取值为W/5。
X的计算方式为:计算账号区域二值化图像所有有效像素点数,所述有效像素点数是指黑色像素点点数,求得总像素点数S,已知账号处字符个数为m,S/m为每个字符的平均像素数Ap,取Ap/10为断裂面积比较阈值。
通过此方法有效地排除断裂点字符边界序列的影响,可最终获得有效边界序列,显著地提升对模糊数字分割的成功率。
算法对比结果:
阈值计算方法 样本总数 分割准确数 分割错误数 分割准确率
本发明计算方法 10000 9467 533 94.67%
投影分割法 10000 7255 2745 72.55%
对同一票据,采用本方法和投影分割法分别进行分割,在样本数量是10000的情况下,本方法的准确率达到94.67%,远优于投影分割法的72.55%。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种金融票据的账号处模糊数字的分割方法,其特征在于,包括以下步骤:
第一步,截取整体图像中的账号区域图像,对账号区域图像二值化;
第二步,得到账号区域二值化图像后,对其进行垂直投影,得到宽度像素点列,依次对投影后的宽度像素点列进行边界判定,求得初步分割字符边界序列;
第三步,依次以第二步得到的每个初步分割字符边界点为中心,分别对距离其相邻位置的前、后边界所占像素数进行累加计算,以对初步分割字符边界序列进行判断,判定是字符边界或发生断裂中的任意一种,去除发生断裂处的边界点,获得有效边界序列,利用有效边界序列进行账号区域图像的数字分割;
其中,当AFr>X且ABr<X,此处的初步分割字符边界点为字符右边界;
当AFr<X且ABr>X,此处的初步分割字符边界点为字符左边界;
当AFr>X且ABr>X,此处的初步分割字符边界点为字符断裂点;
其中,AFr为边界点r处前n个像素宽度的总像素数,ABr为边界点r处后n个像素宽度的总像素数,X为断裂面积比较阈值;计算账号区域二值化图像所有有效像素点数,求得总像素点数S,已知账号处字符个数为m,S/m为每个字符的平均像素数Ap,取Ap/10为断裂面积比较阈值X。
2.根据权利要求1所述的一种金融票据的账号处模糊数字的分割方法,其特征在于,第一步中,截取整体图像中的账号区域图像,计算账号区域图像的灰度均值,利用灰度均值对账号区域图像二值化。
3.根据权利要求2所述的一种金融票据的账号处模糊数字的分割方法,其特征在于,账号区域图像的灰度均值通过以下公式计算:
Figure 521782DEST_PATH_IMAGE002
公式1
其中:Gh为账号区域图像的第h个灰度值,M为账号区域图像的宽,N为账号区域图像的高,Gav为灰度均值,以灰度均值作为二值化的阈值,故Gav即为二值化的阈值。
4.根据权利要求1所述的一种金融票据的账号处模糊数字的分割方法,其特征在于,第一步中,采用物理坐标截取到整体图像中的账号区域图像。
5.根据权利要求1所述的一种金融票据的账号处模糊数字的分割方法,其特征在于,第三步中,每个边界点相邻位置的前、后边界所占像素数的累加计算公式如下:
Figure DEST_PATH_IMAGE003
公式2
Figure 160573DEST_PATH_IMAGE004
公式3
其中:AFr为边界点r处前n个像素宽度的总像素数,ABr为边界点r处后n个像素宽度的总像素数,Nk为账号区域图像k点处垂直方向的像素个数。
6.根据权利要求5所述的一种金融票据的账号处模糊数字的分割方法,其特征在于,初步分割字符边界序列分为左边界数组和右边界数组,两边界数组相减取绝对值,得到账号处字符的宽度值数组,对宽度值数组求和,计算平均值,得到平均宽度W,以W的五分之一作为判别半径,n取值为W/5。
7.根据权利要求1所述的一种金融票据的账号处模糊数字的分割方法,其特征在于,所述有效像素点数是指黑色像素点点数。
8.根据权利要求1所述的一种金融票据的账号处模糊数字的分割方法,其特征在于,第二步中,垂直投影后得到宽度像素点列,依次对账号区域图像每个像素宽度上垂直方向的像素数,进行零值判定,若该宽度点垂直方向的像素数为0,认定为边界,得到初步分割字符边界序列。
CN202011159519.6A 2020-10-27 2020-10-27 一种金融票据的账号处模糊数字的分割方法 Active CN112016565B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011159519.6A CN112016565B (zh) 2020-10-27 2020-10-27 一种金融票据的账号处模糊数字的分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011159519.6A CN112016565B (zh) 2020-10-27 2020-10-27 一种金融票据的账号处模糊数字的分割方法

Publications (2)

Publication Number Publication Date
CN112016565A CN112016565A (zh) 2020-12-01
CN112016565B true CN112016565B (zh) 2021-06-04

Family

ID=73527761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011159519.6A Active CN112016565B (zh) 2020-10-27 2020-10-27 一种金融票据的账号处模糊数字的分割方法

Country Status (1)

Country Link
CN (1) CN112016565B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528895B (zh) * 2020-12-17 2023-09-12 恒银金融科技股份有限公司 一种金融票据图像票号处变造检测的计算方法
CN115050015B (zh) * 2022-08-15 2023-09-12 恒银金融科技股份有限公司 金融票据账号字符区的精确分割方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116751B (zh) * 2013-01-24 2016-07-06 河海大学 一种车牌字符自动识别方法
CN106874909B (zh) * 2017-01-18 2019-10-11 深圳怡化电脑股份有限公司 一种图像字符的识别方法及其装置

Also Published As

Publication number Publication date
CN112016565A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN112016565B (zh) 一种金融票据的账号处模糊数字的分割方法
CN108133216B (zh) 基于机器视觉的可实现小数点读取的数码管读数识别方法
WO2023279966A1 (zh) 一种多车道线检测方法、装置及检测设备
CN115131351B (zh) 基于红外图像的机油散热器检测方法
CN112419298B (zh) 一种螺栓节点板锈蚀检测方法、装置、设备及存储介质
CN107730521B (zh) 一种图像中屋脊型边缘的快速检测方法
CN108830133A (zh) 合同影像图片的识别方法、电子装置及可读存储介质
CN112016566B (zh) 一种金融票据大写金额处手写汉字的分割方法
CN111814673A (zh) 一种修正文本检测边界框的方法、装置、设备及存储介质
CN102750773A (zh) 纸币冠字号图像区域的定位方法
CN107358718B (zh) 一种冠字号识别方法、装置、设备及存储介质
CN112990150A (zh) 一种基于投影双向累和测定冠字号上下边界的方法
CN112232344A (zh) 一种数字式万用表读数识别方法
JPH09311905A (ja) 行検出方法および文字認識装置
CN110059695B (zh) 一种基于垂直投影的字符分割方法及终端
JP4224328B2 (ja) 車番認識装置
CN112528895A (zh) 一种金融票据图像票号处变造检测的计算方法
CN111814780B (zh) 一种票据图像处理方法、装置、设备及存储介质
CN105354566A (zh) 用于冠字号识别的字符污染去除方法
CN112446912B (zh) 一种金融票据宽度计算方法
CN112923852B (zh) 基于动态角点定位的sd卡位姿检测方法
CN111583156B (zh) 文档图像底纹去除方法及系统
CN114581901A (zh) 一种古建墙壁受污题记文字图像边缘提取方法
CN111695557B (zh) 一种图像处理方法及装置
CN110490885B (zh) 改进的自适应阈值二值化方法及vin码字符分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant