CN112990150A - 一种基于投影双向累和测定冠字号上下边界的方法 - Google Patents
一种基于投影双向累和测定冠字号上下边界的方法 Download PDFInfo
- Publication number
- CN112990150A CN112990150A CN202110502797.5A CN202110502797A CN112990150A CN 112990150 A CN112990150 A CN 112990150A CN 202110502797 A CN202110502797 A CN 202110502797A CN 112990150 A CN112990150 A CN 112990150A
- Authority
- CN
- China
- Prior art keywords
- crown word
- image
- word number
- accumulation
- lower boundaries
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000009825 accumulation Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000002457 bidirectional effect Effects 0.000 title claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000001186 cumulative effect Effects 0.000 claims description 4
- 238000005520 cutting process Methods 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种基于投影双向累和测定冠字号上下边界的方法,第一步,针对纸币整体图像,得到冠字号区域图像,再通过冠字号上下边界的确定得到冠字号精确图像,对冠字号精确图像进行二值化处理;第二步,对冠字号精确图像进行水平投影,分割得到单个字符,再对所有单个字符分别做竖向投影;第三步,确定冠字号精确图像中冠字号的最高位置和最低位置,并根据最高位置和最低位置,对所有单个字符的竖向投影结果分别进行正向累和和逆向累和,分别取两者的最大值即为冠字号单个字符的上下边界。本发明解决了冠字号各字符大小不一问题,通过采取双向累加最大值的方式,可以有效的避免该问题的发生,并能够保证字符边界的准确及字符完整性。
Description
技术领域
本发明属于货币冠字号识别技术领域,尤其涉及一种基于投影双向累和测定冠字号上下边界的方法。
背景技术
货币均含有冠字号,由冠字与号码共同构成货币的冠字号码。“冠字”是印在货币上用来标记印刷批次的两个或三个英文字母,由印钞厂按一定规律编排和印刷;“号码”则是印在冠字后面的阿拉伯数字流水号,用来标明每张钞票在同冠字批次中的排列顺序。冠字号的产生极大的提高了金融监管部门的监管能力,并有利于追踪与定位货币的使用情况,冠字号的正确识别与存储可以为货币的安全流通保驾护航。货币在金融领域扮演着重要角色,在货币高速流通的今天,如何快速的追踪与定位货币的使用情况,是一个尤为重要的研究内容。
国内货币冠字号均为普通等大字体,采用传统方式可判别冠字号的字符边界,即采用从字符串中心点判别冠字号字符边界差的方式确定字符边界。
而针对国外货币情况复杂,如冠字号中字符不等大,成大小梯队排列的时候,采用该方法,会导致字体大的字符被切割或丢弃的情况。当金融自助设备在国外使用时,必须要解决可能面临的这项问题。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种基于投影双向累和测定冠字号上下边界的方法,解决冠字号各字符大小不一问题,通过采取双向累加最大值的方式,可以有效的避免该问题的发生,并能够保证字符边界的准确及字符完整性。
为实现本发明的目的所采用的技术方案是:
一种基于投影双向累和测定冠字号上下边界的方法,其特征在于,包括如下步骤:
第一步,针对纸币整体图像,通过寻找坐标的方法得到冠字号区域图像,再通过冠字号上下边界的确定得到冠字号精确图像,对冠字号精确图像进行二值化处理;
第二步,对冠字号精确图像进行水平投影,分割得到单个字符,再对所有单个字符分别做竖向投影;
第三步,确定冠字号精确图像中冠字号的最高位置和最低位置,并根据最高位置和最低位置,对所有单个字符的竖向投影结果分别进行正向累和和逆向累和,分别取两者的最大值即为冠字号单个字符的上下边界。
作为优选的,对冠字号精确图像进行二值化处理时,前景图像像素值设为0,背景图像像素值设为255,所述前景图像为冠字号的图像。
作为优选的,第三步中,依次按行读取单个字符的像素值信息,并统计每行像素值为0的个数,记录为一个数组,如公式1:
作为优选的,对数组分别进行正向累加确定单个字符的下边界,逆向累加确定单个字符的上边界,计算公式如下:
本发明的有益效果在于:
1.针对冠字号中各字符大小不一的情况,首先进行了水平投影进行单个字符的分割,然后再分别对单个字符进行竖向投影,来确定冠字号的最高位置和最低位置,防止出现丢失字符部分内容的情况。
2.在单个字符竖向投影的基础上,采用了一种全新的计算方法,确定单个字符中冠字号的上下边界,该方法高效、可行,并且能有效避免噪点的干扰。
具体实施方式
以下结合具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
第一步,针对纸币整体图像,通过寻找坐标的方法得到冠字号区域图像,再通过冠字号上下边界的确定得到冠字号精确图像,对冠字号精确图像进行二值化处理;
选取可见光图像进行实验,根据纸币整体图像在视场的位置,确定纸币整体图像四个顶点在视场中的坐标位置。以冠字号相对于顶点的相对坐标来确定冠字号区域,以固定大小的粗选框框取得到冠字号区域图像。
接下来,对冠字号区域图像进行精确框选,利用矩形窗口扫描,采用阈值比较法将冠字号区域图像中的冠字号像素值设为0,其中阈值选择可以采用经验所得,之后以矩形窗口高的二分之一为起始点,分别往上以及往下扫描,直到扫描到冠字号的上下边界,关于如何确定冠字号的上下边界,可以采用现有技术来确定,比如:筛选到的边界点周边若干个点要满足像素值的要求,比如某些点像素值为0某些点像素值为255,以此来确定上下边界,从而精细化确定冠字号区域。
通常来说,冠字号周围会有背景干扰,包括与冠字号重叠的花纹背景、点状背景、以及离冠字号区域很近的钱币花纹等。因此需要对冠字号区域进行精确确定,减小噪声对后续单个字符切割过程的干扰。同时,在实际工作中,发现上下边界的确定会受冠字号中字符以及数字的形状影响,导致上下边界不准,从而影响字符拾取。
这里采用阈值比较法得到冠字号初步区域的前景图像,即利用二值化处理过的冠字号初步区域前景图像像素值较低,背景图像像素值较高的特征,选取合适的阈值将背景图像分离。然后将前景图像(即冠字号)的像素值设定为0,背景像素值设置为255。
所述矩形窗口为宏定义区域。
第二步,对冠字号精确图像进行水平投影,分割得到单个字符,再对所有单个字符分别做竖向投影;
对冠字号精确图像,进行单字符切割:首先将冠字号进行水平投影,确定单个字符的左右边界,进行切割。接下来对单个字符分别做竖向投影。
原始方法是利用冠字号的高度的一半以及单个字符宽度的一半作为种子点,之后进行单字符上下边界的准确确定。在冠字号拥有大小不等字符的情况下,由于字符太小,种子点落在字符外面,无法判断字符的上下边界,由此会丢失该字符。在这里我们针对单个字符,并利用竖向投影,解决此问题。
第三步,确定冠字号精确图像中冠字号的最高位置和最低位置,并根据最高位置和最低位置,对所有单个字符的竖向投影结果分别进行正向累和和逆向累和,分别取两者的最大值即为冠字号单个字符的上下边界。
确定冠字号精确图像中冠字号的最高位置和最低位置,最高最低位置是根据冠字号确定的,与分割后的最大字符的上下边界是一样的(但是不绝对,有的最大号字符附近有噪声,因此最高最低位置可能大于最大字符的上下边界),但对于小字符来说就是包含噪声的单字符的上下边界。此时确定的最高最低位置是作为单字符投影数组的起始和末尾位置,在这个范围内,进行累和判断,最终确定单字符的上下边界。
需要进一步说明的是,关于冠字号的最高和最低位置,是需要在字符分割前就记录好的,因此需要在冠字号精确图像的基础上确定最高和最低位置。最高和最低位置的确定好处在于,保证不丢失任意一个字符的内容前提下,能够降低下一步累和计算时的计算次数。
根据冠字号的最高位置和最低位置,尤其冠字号拥有大小不等字符时,冠字号的最高位置和最低位置将是最大字符的最高位置和最低位置,不会丢失最大字符的部分内容,再进行正向和逆向累和时,分别以最高位置和最低位置为出发点开始计算所有单个字符的累和。
竖向投影前,我们已经完成冠字号的二值化处理,前景字符的灰度值为0,背景灰度值为255。由此,我们来依次读取单个字符的像素值信息,如公式1:
再对i维数组复制得到两个数组,对两个数组分别进行正向累加确定单个字符的下边界,逆向累加确定单个字符的上边界。具体计算公式如下:
下面通过举例说明。
首先明确边界是累加后最大数位置,假设height等于15,即单个字符共有15行,则第i行像素值为0的个数统计得到一个15个数的数组 [0,1,2,0,4,5,6,7,8,9,12,0,34,1,0] ,对应图像的第一行到第十五行的像素值为0的统计和,在进行累加的时候,从第一个位置向后累加定义为正向累加,从最后一个位置向前累加定义为逆向累加。
再次要明确分割后的单个字符中,冠字号的占比不会特别小,比如15行中冠字号的下边界不会出现在第4行,否则上边界就要出现在第1-3行之间,无论出现在哪行,冠字号都会只有一两行的占比,比例太小,不符合常规设计。
然后再对累加结果进行判断,进行正向累加时,第一个数加第二个数,依次向后加,直到加到第11个数,因为第12个数为0,再加第12个数,累加和也不再增加,此时累加的和最大,出现在第十一个数,也就是图像的第11行,由此确定为冠字号的下边界的位置 。
同理进行逆向累加时,倒数第一个数加倒数第二个数,依次向前加,直至加到倒数第11个数,因为倒数第12个数为0,再加倒数第12个数,累加和也不再增加,此时累加的和最大,出现在倒数第十一个数,也就是图像的第4行,由此确定为冠字号的上边界的位置。
进行累和计算时,由于噪声的存在,i维数组中存在0的元素有可能是噪声点,但是对照实际情况,整个冠字号水平投影区域不会有空白,即i维数组的中间元素部分不会有0存在,因此,在累和计算过程前,还要完成噪声以及冠字号信息的判断,并及时补充有用信息,即将在冠字号中间断点的地方补充为非零即可。
为了验证本方法得到的单个字符,上下边界的精确度高,再进行同一化处理后,获得提取后的字符图像。对两个实例进行处理,获得对比结果如表格1与表格2所示。
表1-竖向冠字号
表2 -横向冠字号
从表格可以看出,字符切割效果有明显的提升,并且保证了字符边界的准确性与切割的完整性。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (5)
1.一种基于投影双向累和测定冠字号上下边界的方法,其特征在于,包括如下步骤:
第一步,针对纸币整体图像,得到冠字号区域图像,再通过冠字号上下边界的确定得到冠字号精确图像,对冠字号精确图像进行二值化处理;
第二步,对冠字号精确图像进行水平投影,分割得到单个字符,再对所有单个字符分别做竖向投影;
第三步,确定冠字号精确图像中冠字号的最高位置和最低位置,并根据最高位置和最低位置,对所有单个字符的竖向投影结果分别进行正向累和和逆向累和,分别取两者的最大值即为冠字号单个字符的上下边界。
2.根据权利要求1所述的一种基于投影双向累和测定冠字号上下边界的方法,其特征在于,对冠字号精确图像进行二值化处理时,前景图像像素值设为0,背景图像像素值设为255,所述前景图像为冠字号的图像。
5.根据权利要求1所述的一种基于投影双向累和测定冠字号上下边界的方法,其特征在于,第一步,针对纸币整体图像,通过寻找坐标的方法得到冠字号区域图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110502797.5A CN112990150A (zh) | 2021-05-10 | 2021-05-10 | 一种基于投影双向累和测定冠字号上下边界的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110502797.5A CN112990150A (zh) | 2021-05-10 | 2021-05-10 | 一种基于投影双向累和测定冠字号上下边界的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112990150A true CN112990150A (zh) | 2021-06-18 |
Family
ID=76337299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110502797.5A Pending CN112990150A (zh) | 2021-05-10 | 2021-05-10 | 一种基于投影双向累和测定冠字号上下边界的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112990150A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220005163A1 (en) * | 2020-07-02 | 2022-01-06 | Hangzhou Glority Software Limited | Image processing method, image processing device, electronic device and storage medium |
CN116468742A (zh) * | 2023-06-12 | 2023-07-21 | 恒银金融科技股份有限公司 | 含有分数形式的冠字号的分割方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102222384A (zh) * | 2011-05-27 | 2011-10-19 | 尤新革 | 纸币多光谱图像分析方法 |
CN102750773A (zh) * | 2012-06-15 | 2012-10-24 | 杭州九聚科技有限公司 | 纸币冠字号图像区域的定位方法 |
CN102779275A (zh) * | 2012-07-04 | 2012-11-14 | 广州广电运通金融电子股份有限公司 | 一种纸类字符识别方法及相关装置 |
CN103136845A (zh) * | 2013-01-23 | 2013-06-05 | 浙江大学 | 一种基于冠字号图像特征的人民币鉴伪方法 |
CN105957238A (zh) * | 2016-05-20 | 2016-09-21 | 聚龙股份有限公司 | 一种纸币管理方法及其系统 |
CN110895849A (zh) * | 2018-09-13 | 2020-03-20 | 深圳怡化电脑股份有限公司 | 冠字号切割定位方法、装置、计算机设备及存储介质 |
-
2021
- 2021-05-10 CN CN202110502797.5A patent/CN112990150A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102222384A (zh) * | 2011-05-27 | 2011-10-19 | 尤新革 | 纸币多光谱图像分析方法 |
CN102750773A (zh) * | 2012-06-15 | 2012-10-24 | 杭州九聚科技有限公司 | 纸币冠字号图像区域的定位方法 |
CN102779275A (zh) * | 2012-07-04 | 2012-11-14 | 广州广电运通金融电子股份有限公司 | 一种纸类字符识别方法及相关装置 |
CN103136845A (zh) * | 2013-01-23 | 2013-06-05 | 浙江大学 | 一种基于冠字号图像特征的人民币鉴伪方法 |
CN105957238A (zh) * | 2016-05-20 | 2016-09-21 | 聚龙股份有限公司 | 一种纸币管理方法及其系统 |
CN110895849A (zh) * | 2018-09-13 | 2020-03-20 | 深圳怡化电脑股份有限公司 | 冠字号切割定位方法、装置、计算机设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
郑飞: "人民币冠字号识别算法研究及系统实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220005163A1 (en) * | 2020-07-02 | 2022-01-06 | Hangzhou Glority Software Limited | Image processing method, image processing device, electronic device and storage medium |
US11610291B2 (en) * | 2020-07-02 | 2023-03-21 | Hangzhou Glority Software Limited | Image processing method, image processing device, electronic device and storage medium |
CN116468742A (zh) * | 2023-06-12 | 2023-07-21 | 恒银金融科技股份有限公司 | 含有分数形式的冠字号的分割方法和装置 |
CN116468742B (zh) * | 2023-06-12 | 2023-10-03 | 恒银金融科技股份有限公司 | 含有分数形式的冠字号的分割方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112990150A (zh) | 一种基于投影双向累和测定冠字号上下边界的方法 | |
CN105243730B (zh) | 纸币识别方法及系统 | |
CN112200117B (zh) | 表格识别方法及装置 | |
CN103914680A (zh) | 一种喷印字符图像识别与校验系统及方法 | |
CN103034848A (zh) | 一种表单类型的识别方法 | |
CN112906695B (zh) | 适配多类ocr识别接口的表格识别方法及相关设备 | |
CN107464335B (zh) | 一种纸币冠字号定位方法 | |
CN112329641A (zh) | 一种表格识别方法、装置、设备及可读存储介质 | |
CN107622562A (zh) | 纸币图像的提取方法、装置、设备及存储介质 | |
CN111598104A (zh) | 一种车牌字符识别方法及其系统 | |
CN112016565B (zh) | 一种金融票据的账号处模糊数字的分割方法 | |
CN110516674B (zh) | 一种文本图像的手写汉字分割方法及系统 | |
CN111666864A (zh) | 一种基于计算机视觉的自动阅卷方法 | |
CN112016566B (zh) | 一种金融票据大写金额处手写汉字的分割方法 | |
CN106780953B (zh) | 一种基于双冠字号的纸币鉴伪方法和系统 | |
CN107798355B (zh) | 一种基于文档图像版式自动分析与判断的方法 | |
CN111914847B (zh) | 一种基于模板匹配的ocr识别方法及其系统 | |
Suwa | Segmentation of connected handwritten numerals by graph representation | |
CN117058805A (zh) | 纸币图像处理方法及系统 | |
CN109086766B (zh) | 一种基于积分图的多阈值融合冠字号提取方法 | |
CN110276353B (zh) | 冠字号字符切分方法、装置、可读存储介质及终端设备 | |
CN108074321B (zh) | 一种纸币的图像边界提取方法及装置 | |
CN112528895A (zh) | 一种金融票据图像票号处变造检测的计算方法 | |
CN108154596B (zh) | 一种基于图像匹配的双冠号纸币鉴伪方法 | |
CN108564078B (zh) | 提取满文单词图像中轴线的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210618 |