CN112016565B - 一种金融票据的账号处模糊数字的分割方法 - Google Patents
一种金融票据的账号处模糊数字的分割方法 Download PDFInfo
- Publication number
- CN112016565B CN112016565B CN202011159519.6A CN202011159519A CN112016565B CN 112016565 B CN112016565 B CN 112016565B CN 202011159519 A CN202011159519 A CN 202011159519A CN 112016565 B CN112016565 B CN 112016565B
- Authority
- CN
- China
- Prior art keywords
- boundary
- account
- character
- image
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种金融票据的账号处模糊数字的分割方法,其特征在于,包括以下步骤:第一步,截取整体图像中的账号区域图像,计算账号区域图像的灰度均值,利用均值对账号区域图像二值化;第二步,对账号区域二值化图像进行垂直投影;垂直投影后得到宽度像素点列,依次对账号区域图像每个像素宽度上垂直方向的像素数,进行零值判定,得到初步分割字符边界序列;第三步,依次以上个步骤得到的每个边界点为中心,分别对距离其相邻位置的前、后边界所占像素数进行累加计算,以对初步分割字符边界序列进行判断,判定是字符边界,还是发生断裂,去除断裂处的边界点,获得有效边界序列,利用有效边界序列进行账号区域图像的数字分割。
Description
技术领域
本发明涉及薄片类纸质介质字符处理技术领域,特别是涉及一种金融票据的账号处模糊数字的分割方法。
背景技术
在目前的字符处理技术中,打印体数字的分割与识别技术已经十分成熟,一般情况下,数字字符在二值化后,进行水平、垂直投影,就能获得较好的分割效果,经神经网络算法训练、识别后,得到较高的准确率。但是对金融票据账号特定场景处的数字分割很不理想。
由于票据在长时间保存后,票据账号处的数字墨迹变得十分模糊,二值化处理后,一些字符中间常常出现像素断裂、缺失的情况,使得投影分割的方法难以奏效,分割的失败直接影响后续的识别准确率。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种金融票据的账号处模糊数字的分割方法。
为实现本发明的目的所采用的技术方案是:
一种金融票据的账号处模糊数字的分割方法,其特征在于,包括以下步骤:
第一步,截取整体图像中的账号区域图像,对账号区域图像二值化;
第二步,得到账号区域二值化图像后,对其进行垂直投影,得到宽度像素点列,依次对投影后的宽度像素点列进行边界判定,求得初步分割字符边界序列;
第三步,依次以第二步得到的每个初步分割字符边界点为中心,分别对距离其相邻位置的前、后边界所占像素数进行累加计算,以对初步分割字符边界序列进行判断,判定是字符边界或发生断裂中的任意一种,去除发生断裂处的边界点,获得有效边界序列,利用有效边界序列进行账号区域图像的数字分割。
作为优选的,第一步中,截取整体图像中的账号区域图像,计算账号区域图像的灰度均值,利用灰度均值对账号区域图像二值化。
作为优选的,账号区域图像的灰度均值通过以下公式计算:
其中:Gh为账号区域图像的第h个灰度值,M为账号区域图像的宽,N为账号区域图像的高,Gav为灰度均值,以灰度均值作为二值化的阈值,故Gav即为二值化的阈值。
作为优选的,第一步中,采用物理坐标截取到整体图像中的账号区域图像。
作为优选的,第三步中,每个边界点相邻位置的前、后边界所占像素数的累加计算公式如下:
其中:AFr为边界点r处前n个像素宽度的总像素数,ABr为边界点r处后n个像素宽度的总像素数,Nk为账号区域图像k点处垂直方向的像素个数。
作为优选的,当AFr>X且ABr<X,此处的初步分割字符边界点为字符右边界;
当AFr<X且ABr>X,此处的初步分割字符边界点为字符左边界;
当AFr>X且ABr>X,此处的初步分割字符边界点为字符断裂点;
其中,X为断裂面积比较阈值。
作为优选的,初步分割字符边界序列分为左边界数组和右边界数组,两边界数组相减取绝对值,得到账号处字符的宽度值数组,对宽度值数组求和,计算平均值,得到平均宽度W,以W的五分之一作为判别半径,n取值为W/5。
作为优选的,计算账号区域二值化图像所有有效像素点数,求得总像素点数S,已知账号处字符个数为m,S/m为每个字符的平均像素数Ap,取Ap/10为断裂面积比较阈值X。
作为优选的,所述有效像素点数是指黑色像素点点数。
作为优选的,第二步中,垂直投影后得到宽度像素点列,依次对账号区域图像每个像素宽度上垂直方向的像素数,进行零值判定,若该宽度点垂直方向的像素数为0,认定为边界,得到初步分割字符边界序列。
本发明的有益效果在于:
本发明设计的分割方法,在常规分割的基础上新增了边界点的判断方法,能够进一步区分是真正边界点还是仅是字符断裂处,增加了分割的准确性,更进一步地为下一步的识别提高了准确率。
附图说明
图1是票据整体视图中的部分截图。
图2是账号区域图像视图。
图3是账号区域图像二值化后的视图。
图4是账号区域图像完成分割后的视图。
具体实施方式
以下以具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
一种金融票据的账号处模糊数字的分割方法,包括以下步骤:
第一步,截取整体图像中的账号区域图像,方法为采用物理坐标截取到整体图像中的账号区域图像,计算账号区域图像的灰度均值,利用灰度均值对账号区域图像二值化,得到二值化后的图像,如图3所示,本方案中的图像二值化方法为:让账号区域图像中的每一个像素点与灰度均值一一比较,小于等于灰度均值的像素点置为0(黑色),大于灰度均值的像素点置为255(白色)。
账号区域图像的灰度均值通过以下公式计算,遍历并累加,再除以图像总像素数,得到灰度均值,以灰度均值作为二值化的阈值,故Gav即为二值化的阈值。
公式1
其中:Gh为账号区域图像的第h个灰度值,M为账号区域图像的宽(图像宽为像素值),N为账号区域图像的高(图像高为像素值),Gav为灰度均值。
一般票据的账号存在于图像某个固定位置,使用图像物理坐标即可截取到其账号区域图像。
第二步,得到账号区域二值化图像后,对账号区域二值化图像进行垂直投影,也叫纵向投影,指二维图象按行向y轴方向投影,投影的结果看成是一维图像,本方案中采用matlab对1行若干个字符进行垂直投影,垂直投影图显示了若干个起伏不一的波峰,波峰的上升点和下降点即为字符宽度像素点列,也是后续进行初步分割字符边界序列判定的基础数据。
垂直投影后得到宽度像素点列,依次对账号区域图像每个像素宽度上垂直方向的像素数,进行零值判定,若该宽度点垂直方向的像素数为0,可认定为边界,得到初步分割字符边界序列;
由于图像较模糊,二值化后一些数字中间发生断裂,初步分割字符边界序列内的字符边界值和断裂边界值混在一起,如果直接用来识别,那么一个发生断裂的字符会被识别成两个独立的字符。因此,需要进行进一步判定,排除断裂边界,筛选出有效边界值。
第三步,依次以上个步骤得到的每个边界点为中心,分别对距离其相邻位置的前、后边界所占像素数进行累加计算,以对初步分割字符边界序列进行判断,判定是字符边界,还是发生断裂,去除断裂处的边界点,获得有效边界序列,利用有效边界序列进行账号区域图像的数字分割。
每个边界点相邻位置的前、后边界所占像素数的累加计算公式如下:
其中:AFr为边界点r处前n个像素宽度的总像素数,ABr为边界点r处后n个像素宽度的总像素数,Nk为账号区域图像k点处垂直像素个数。
当边界点为字符右边界时,AFr>X且ABr<X;
当边界点为字符左边界时,AFr<X且ABr>X;
当边界点为字符断裂点时,AFr>X且ABr>X;
其中,X为断裂面积比较阈值;
一般每个字符之间都有一定的间隔,两个字符之间有效像素点数几乎为零;
当边界点为字符右边界时,往后n个像素宽度上是间隔,那么连续n个点的累加像素总数肯定小于X;
当边界点为字符左边界,往前n个像素宽度上也是间隔,那么连续n个点的累加像素总数肯定也小于X;
当边界点为字符的断裂处时,往前n个像素宽度是字符有效区域,往后n个像素宽度也是字符有效区域,那么两者各自累加的像素总数都大于X;以此来判定其有效间隔。
需要进一步说明的是,n的计算方式为:初步分割字符边界序列分为左边界数组和右边界数组,两边界数组相减取绝对值,得到账号处字符的宽度值数组,对宽度值数组求和,计算平均值,得到平均宽度W,以W的五分之一作为判别半径,n取值为W/5。
X的计算方式为:计算账号区域二值化图像所有有效像素点数,所述有效像素点数是指黑色像素点点数,求得总像素点数S,已知账号处字符个数为m,S/m为每个字符的平均像素数Ap,取Ap/10为断裂面积比较阈值。
通过此方法有效地排除断裂点字符边界序列的影响,可最终获得有效边界序列,显著地提升对模糊数字分割的成功率。
算法对比结果:
阈值计算方法 | 样本总数 | 分割准确数 | 分割错误数 | 分割准确率 |
本发明计算方法 | 10000 | 9467 | 533 | 94.67% |
投影分割法 | 10000 | 7255 | 2745 | 72.55% |
对同一票据,采用本方法和投影分割法分别进行分割,在样本数量是10000的情况下,本方法的准确率达到94.67%,远优于投影分割法的72.55%。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (8)
1.一种金融票据的账号处模糊数字的分割方法,其特征在于,包括以下步骤:
第一步,截取整体图像中的账号区域图像,对账号区域图像二值化;
第二步,得到账号区域二值化图像后,对其进行垂直投影,得到宽度像素点列,依次对投影后的宽度像素点列进行边界判定,求得初步分割字符边界序列;
第三步,依次以第二步得到的每个初步分割字符边界点为中心,分别对距离其相邻位置的前、后边界所占像素数进行累加计算,以对初步分割字符边界序列进行判断,判定是字符边界或发生断裂中的任意一种,去除发生断裂处的边界点,获得有效边界序列,利用有效边界序列进行账号区域图像的数字分割;
其中,当AFr>X且ABr<X,此处的初步分割字符边界点为字符右边界;
当AFr<X且ABr>X,此处的初步分割字符边界点为字符左边界;
当AFr>X且ABr>X,此处的初步分割字符边界点为字符断裂点;
其中,AFr为边界点r处前n个像素宽度的总像素数,ABr为边界点r处后n个像素宽度的总像素数,X为断裂面积比较阈值;计算账号区域二值化图像所有有效像素点数,求得总像素点数S,已知账号处字符个数为m,S/m为每个字符的平均像素数Ap,取Ap/10为断裂面积比较阈值X。
2.根据权利要求1所述的一种金融票据的账号处模糊数字的分割方法,其特征在于,第一步中,截取整体图像中的账号区域图像,计算账号区域图像的灰度均值,利用灰度均值对账号区域图像二值化。
4.根据权利要求1所述的一种金融票据的账号处模糊数字的分割方法,其特征在于,第一步中,采用物理坐标截取到整体图像中的账号区域图像。
6.根据权利要求5所述的一种金融票据的账号处模糊数字的分割方法,其特征在于,初步分割字符边界序列分为左边界数组和右边界数组,两边界数组相减取绝对值,得到账号处字符的宽度值数组,对宽度值数组求和,计算平均值,得到平均宽度W,以W的五分之一作为判别半径,n取值为W/5。
7.根据权利要求1所述的一种金融票据的账号处模糊数字的分割方法,其特征在于,所述有效像素点数是指黑色像素点点数。
8.根据权利要求1所述的一种金融票据的账号处模糊数字的分割方法,其特征在于,第二步中,垂直投影后得到宽度像素点列,依次对账号区域图像每个像素宽度上垂直方向的像素数,进行零值判定,若该宽度点垂直方向的像素数为0,认定为边界,得到初步分割字符边界序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011159519.6A CN112016565B (zh) | 2020-10-27 | 2020-10-27 | 一种金融票据的账号处模糊数字的分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011159519.6A CN112016565B (zh) | 2020-10-27 | 2020-10-27 | 一种金融票据的账号处模糊数字的分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112016565A CN112016565A (zh) | 2020-12-01 |
CN112016565B true CN112016565B (zh) | 2021-06-04 |
Family
ID=73527761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011159519.6A Active CN112016565B (zh) | 2020-10-27 | 2020-10-27 | 一种金融票据的账号处模糊数字的分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112016565B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112528895B (zh) * | 2020-12-17 | 2023-09-12 | 恒银金融科技股份有限公司 | 一种金融票据图像票号处变造检测的计算方法 |
CN115050015B (zh) * | 2022-08-15 | 2023-09-12 | 恒银金融科技股份有限公司 | 金融票据账号字符区的精确分割方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116751B (zh) * | 2013-01-24 | 2016-07-06 | 河海大学 | 一种车牌字符自动识别方法 |
CN106874909B (zh) * | 2017-01-18 | 2019-10-11 | 深圳怡化电脑股份有限公司 | 一种图像字符的识别方法及其装置 |
-
2020
- 2020-10-27 CN CN202011159519.6A patent/CN112016565B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112016565A (zh) | 2020-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112016565B (zh) | 一种金融票据的账号处模糊数字的分割方法 | |
CN108133216B (zh) | 基于机器视觉的可实现小数点读取的数码管读数识别方法 | |
WO2023279966A1 (zh) | 一种多车道线检测方法、装置及检测设备 | |
CN115131351B (zh) | 基于红外图像的机油散热器检测方法 | |
CN112419298B (zh) | 一种螺栓节点板锈蚀检测方法、装置、设备及存储介质 | |
CN107730521B (zh) | 一种图像中屋脊型边缘的快速检测方法 | |
CN108830133A (zh) | 合同影像图片的识别方法、电子装置及可读存储介质 | |
CN112016566B (zh) | 一种金融票据大写金额处手写汉字的分割方法 | |
CN111814673A (zh) | 一种修正文本检测边界框的方法、装置、设备及存储介质 | |
CN102750773A (zh) | 纸币冠字号图像区域的定位方法 | |
CN107358718B (zh) | 一种冠字号识别方法、装置、设备及存储介质 | |
CN112990150A (zh) | 一种基于投影双向累和测定冠字号上下边界的方法 | |
CN112232344A (zh) | 一种数字式万用表读数识别方法 | |
JPH09311905A (ja) | 行検出方法および文字認識装置 | |
CN110059695B (zh) | 一种基于垂直投影的字符分割方法及终端 | |
JP4224328B2 (ja) | 車番認識装置 | |
CN112528895A (zh) | 一种金融票据图像票号处变造检测的计算方法 | |
CN111814780B (zh) | 一种票据图像处理方法、装置、设备及存储介质 | |
CN105354566A (zh) | 用于冠字号识别的字符污染去除方法 | |
CN112446912B (zh) | 一种金融票据宽度计算方法 | |
CN112923852B (zh) | 基于动态角点定位的sd卡位姿检测方法 | |
CN111583156B (zh) | 文档图像底纹去除方法及系统 | |
CN114581901A (zh) | 一种古建墙壁受污题记文字图像边缘提取方法 | |
CN111695557B (zh) | 一种图像处理方法及装置 | |
CN110490885B (zh) | 改进的自适应阈值二值化方法及vin码字符分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |