CN116468742B - 含有分数形式的冠字号的分割方法和装置 - Google Patents
含有分数形式的冠字号的分割方法和装置 Download PDFInfo
- Publication number
- CN116468742B CN116468742B CN202310684394.6A CN202310684394A CN116468742B CN 116468742 B CN116468742 B CN 116468742B CN 202310684394 A CN202310684394 A CN 202310684394A CN 116468742 B CN116468742 B CN 116468742B
- Authority
- CN
- China
- Prior art keywords
- image
- character
- fractional
- crown word
- projection matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000011218 segmentation Effects 0.000 title claims abstract description 30
- 239000011159 matrix material Substances 0.000 claims abstract description 56
- 238000010586 diagram Methods 0.000 description 9
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07D—HANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
- G07D7/00—Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
- G07D7/20—Testing patterns thereon
- G07D7/2008—Testing patterns thereon using pre-processing, e.g. de-blurring, averaging, normalisation or rotation
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07D—HANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
- G07D7/00—Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
- G07D7/20—Testing patterns thereon
- G07D7/202—Testing patterns thereon using pattern matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Character Input (AREA)
Abstract
本发明提供一种含有分数形式的冠字号的分割方法和装置;上述方法包括:采用阈值法计算冠字号区域的粗裁剪图像A的二值化图像B;根据冠字号区域的二值化图像B的水平投影矩阵Bhp和垂直投影矩阵Bvp,得到冠字号区域的精确裁剪图像C;根据精确裁剪图像C的垂直投影矩阵Cvp,得到多个单个字符图像E;逐个判断单个字符图像E是否为分数字符;如果是分数字符,则确认单个字符图像E的中间分数线的位置,并基于中间分数线的位置分割得到分子区域和分母区域。本申请通过多次投影、切割图像以及通过像素值判断中间分数线的位置,能更好识别带有分数形式的冠字号。
Description
技术领域
本发明涉及纸币处理技术领域,尤其是涉及一种含有分数形式的冠字号的分割方法和装置。
背景技术
冠字号作为纸币上重要的身份信息,有着类似钞票"身份证"的作用。近年来,各国对钞票的流通监控需求日益增多,因此衍生出较多的基于冠字号的识别、跟踪的管理需求。
每个国家的纸币的冠字号特征是不一样的,例如人民币冠字号有十个字符,前两位是大写英文字符,后八位为大小不同的阿拉伯数字;美元冠字号有十一个字符,前两位和最后一位是大写英文字符,中间八位为大小相同的阿拉伯数字;也门纸币冠字号有八位,第一位为分数形式,后七位为大小相同的阿拉伯数字。
目前常见的文献集中解决的都是像人民币、美元这样单个字符的冠字号识别,而对于像类似也门纸币这种含有分数形式的冠字号识别方面公开文献较少、难以准确识别。
发明内容
基于此,本发明的目的在于提供一种含有分数形式的冠字号的分割方法和装置,以精确分割分数冠字号,从而进一步提高分数形式的冠字号识别的准确率。
第一方面,本发明实施例提供一种含有分数形式的冠字号的分割方法,所述分割方法包括:S1:采用阈值法计算冠字号区域的粗裁剪图像A的二值化图像B;S2:根据冠字号区域的二值化图像B的水平投影矩阵Bhp和垂直投影矩阵Bvp,得到冠字号区域的精确裁剪图像C;S3:根据精确裁剪图像C的垂直投影矩阵Cvp,得到多个单个字符图像E;S4:逐个判断单个字符图像E是否为分数字符;S5:如果是分数字符,则确认单个字符图像E的中间分数线的位置,并基于中间分数线的位置分割得到分子区域和分母区域;S6:如果不是分数字符,则将S3得到的单个字符图像E作为最终分割结果。
进一步地,步骤S1包括:1-1:计算预先获取的粗裁剪图像A的像素均值Mean;计算过程见公式(1):(1);其中,W为粗裁剪图像A的宽,H为粗裁剪图像A的高,FA(x,y)为粗裁剪图像A的第x行y列的像素值;1-2:基于像素均值Mean对粗裁剪图像A进行二值化处理,得到冠字号区域的二值化图像B;计算过程见公式(2):(2);其中,FA(x,y)为粗裁剪图像A的第x行y列的像素值,FB(x,y)为二值化图像B在第x行y列的像素值,thresh2为预设的粗裁剪图像A的像素均值Mean的均值系数。
进一步地,步骤S2包括:2-1:对二值化图像B进行水平投影,得到水平投影矩阵Bhp;该步骤通过公式(3)实现:(3);其中,F(x,y)为二值化图像B的每个点的像素值,W为二值化图像B的宽,y=1,2,3....H-1,H为二值化图像B的高,Bhp(y)为二值化图像B在y行的投影和;2-2:逐行扫描水平投影矩阵Bhp,并基于扫描结果确定精确裁剪图像C的冠字号字符的上边界Bu和下边界Bd;2-3:对二值化图像B进行垂直投影,得到垂直投影矩阵Bvp;该步骤根据公式(4)计算得到:/>(4);其中,H为二值化图像B的高,y=1,2,3....W-1,W为二值化图像B的宽,Bvp(x)为二值化图像B在x列的投影和;2-4:逐列扫描垂直投影矩阵Bvp,并基于扫描结果确定精确裁剪图像C的冠字号字符的左边界Bl和右边界Br;2-5:根据上边界Bu、下边界Bd、左边界Bl、右边界Br,对二值化图像B进行裁剪得到精确裁剪图像C。
进一步地,步骤2-2包括:扫描水平投影矩阵Bhp,得到第一个大于0的位置X和最后一个大于0的位置Y,即分别对应精确裁剪图像C的冠字号字符的上边界Bu和下边界Bd。
进一步地,步骤S3包括:3-1:对精确裁剪图像C进行垂直投影,得到垂直投影矩阵Cvp;3-2:逐列扫描垂直投影矩阵Cvp,并基于垂直投影矩阵Cvp确定N组单个字符的左右边界值Cln、Crn;3-3:根据N组单个字符的左右边界值Cln、Crn对精确裁剪图像C进行分割,得到N个单个冠字号粗略图像D1-Dn;3-4:分别对N个单个冠字号粗略图像D1-Dn进行水平投影,得到N个水平投影矩阵Dhp1-Dhpn;3-5:分别扫描N个水平投影矩阵Dhp1-Dhpn,并基于扫描结果确定N组单个字符的上下边界值Dun、Ddn;3-6:分别根据N组单个字符的上下边界值Dun、Ddn对N个单个冠字号粗略图像D1-Dn进行分割,得到N个单个字符图像E1-En。
进一步地,步骤S4包括:4-1:分别对单个字符图像E1-En进行水平投影,得到水平投影矩阵Ehp1-Ehpn;4-2:分别扫描水平投影矩阵Ehp1-Ehpn,并基于扫描结果确定单个字符图像E1-En的上下边界Eun、Edn;4-3:根据上下边界Eun、Edn判断每个单个字符图像E是否为分数字符,具体判断根据公式(5),如果满足公式(5),则该字符为分数字符,反之则不是分数字符;(5);其中,thresh1是预设的高度阈值。
进一步地,步骤S5包括:5-1:对单个字符图像En进行水平投影,得到水平投影矩阵Ehpn;其中,n表示第n张单个字符图像;
5-2:逐行扫描水平投影矩阵Ehpn,得到每一行的黑像素的个数;5-3:黑像素的个数大于预设的阈值thresh3的行q为中间分数线的位置;5-3:从q行处向上遍历Ehpn的像素值,当遍历到第一个大于0的值时,该行则为分数形式的冠字号的分子的下边界K1;5-4:从q行处向下遍历Ehpn的像素值,当遍历到第一个大于0的值时,该行则为分数形式的冠字号的分母的上边界K2;5-5:基于下边界K1和上边界Eun得到分子区域,基于上边界K2和下边界Edn得到分母区域。
第二方面,本发明实施例提供一种含有分数形式的冠字号的分割装置,所述分割装置包括:二值化模块,用于采用阈值法计算冠字号区域的粗裁剪图像A的二值化图像B;第一裁剪模块,用于根据冠字号区域的二值化图像B的水平投影矩阵Bhp和垂直投影矩阵Bvp,得到冠字号区域的精确裁剪图像C;第二裁剪模块,用于根据精确裁剪图像C的垂直投影矩阵Cvp,得到多个单个字符图像E;判断模块,用于逐个判断单个字符图像E是否为分数字符;第一切割模块,用于如果是分数字符,则确认单个字符图像E的中间分数线的位置,并基于中间分数线的位置分割得到分子区域和分母区域;第二切割模块,用于如果不是分数字符,则将S3得到的单个字符图像E作为最终分割结果。
本发明实施例的有益效果如下:
本申请通过多次投影、切割图像以及通过像素值判断中间分数线的位置,能更好识别带有分数形式的冠字号。
本发明的其他特征和优点将在随后的说明书中阐述,或者,部分特征和优点可以从说明书推知或毫无疑义地确定,或者通过实施本发明的上述技术即可得知。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施方式,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种含有分数形式的冠字号的分割方法的流程图;
图2为本发明实施例提供的粗裁剪图像A的示例图;
图3为本发明实施例提供的二值化图像B的示例图;
图4为本发明实施例提供的精确裁剪图像C的示例图;
图5为本发明实施例提供的八个单个字符图像E的示例图;
图6为本发明实施例提供的分数形式的纸币冠字号的水平投影矩阵Ehpn的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如图1所示,本发明提供一种含有分数形式的冠字号的分割方法,该分割方法包括:
S1:采用阈值法计算冠字号区域的粗裁剪图像A的二值化图像B。
1-1:计算预先获取的粗裁剪图像A的像素均值Mean。
具体地,像素均值Mean的计算过程如公式(1)。
(1);
其中,W为粗裁剪图像A的宽,H为粗裁剪图像A的高,FA(x,y)为粗裁剪图像A的第x行y列的像素值。
1-2:基于像素均值Mean对粗裁剪图像A进行二值化处理,得到冠字号区域的二值化图像B。
具体地,计算过程如公式(2)。
(2)。
其中,FA(x,y)为粗裁剪图像A的第x行y列的像素值,FB(x,y)为二值化图像B在第x行y列的像素值,thresh2为预设的粗裁剪图像A的像素均值Mean的均值系数,是根据经验得出、在操作过程中可根据实际情况调整以得到质量最好的冠字号图像的。
图2为粗裁剪图像A的示例图,图3则为粗裁剪冠字号区域二值化图像B示例图。
S2:根据冠字号区域的二值化图像B的水平投影矩阵Bhp和垂直投影矩阵Bvp,得到冠字号区域的精确裁剪图像C。
S2包括:
2-1:对二值化图像B进行水平投影,得到水平投影矩阵Bhp。
该步骤通过公式(3)实现。
(3)。
其中,F(x,y)为二值化图像B的每个点的像素值,W为二值化图像B的宽,y=1,2,3....H-1,H为二值化图像B的高,Bhp(y)为二值化图像B在y行的投影和。
具体地,粗裁剪图像A和二值化图像B的宽W是相同的,粗裁剪图像A和二值化图像B的高H是相同的。
2-2:逐行扫描水平投影矩阵Bhp,并基于扫描结果确定精确裁剪图像C的冠字号字符的上边界Bu和下边界Bd。
具体地,由于没有冠字号字符的位置背景为白色,即投影值为0;有字符的位置为黑色,投影值大于0,所以扫描矩阵Bhp,得到第一个大于0的位置X和最后一个大于0的位置Y,即分别对应精确裁剪图像C的冠字号字符的上边界Bu和下边界Bd。
2-3:对二值化图像B进行垂直投影,得到垂直投影矩阵Bvp。
该步骤根据公式(4)计算得到: (4)。
其中,H为二值化图像B的高,y=1,2,3....W-1,W为二值化图像B的宽,Bvp(x)为二值化图像B在x列的投影和。
2-4:逐列扫描垂直投影矩阵Bvp,并基于扫描结果确定精确裁剪图像C的冠字号字符的左边界Bl和右边界Br。
原理同2-2。
2-5:根据上边界Bu、下边界Bd、左边界Bl、右边界Br,对二值化图像B进行裁剪得到精确裁剪图像C。
精确裁剪图像C如图4所示。
S3:根据精确裁剪图像C的垂直投影矩阵Cvp,得到多个单个字符图像E。
具体地,得到的冠字号精确图像E与冠字号的位数相同,若按照图3,则可以得到8个冠字号精确图像E,即N=8。
3-1:对精确裁剪图像C进行垂直投影,得到垂直投影矩阵Cvp。
该步骤原理同步骤2-3。
3-2:逐列扫描垂直投影矩阵Cvp,并基于垂直投影矩阵Cvp确定N组单个字符的左右边界值Cln、Crn。
具体地,由于相隔两个字符之间为白色,那么两个字符之间的投影值应该为0,所以扫描矩阵Cvp,找到得到第一个大于0的位置,即对应第一个单个字符的左边界Cl1,从Cl1处开始继续扫描矩阵,找到第一个等于0的位置,即第一个单个字符的右边界Cr1。重复上述操作,直至扫描完矩阵Cvp,得到八组单个字符的左右边界值Cln、Crn,其中n为字符数,即为8,以下同。
3-3:根据N组单个字符的左右边界值Cln、Crn对精确裁剪图像C进行分割,得到N个单个冠字号粗略图像D1-Dn。
3-4:分别对N个单个冠字号粗略图像D1-Dn进行水平投影,得到N个水平投影矩阵Dhp1-Dhpn。
具体地,该步骤同公式(3)。
3-5:分别扫描N个水平投影矩阵Dhp1-Dhpn,并基于扫描结果确定N组单个字符的上下边界值Dun、Ddn。
原理如2-2所示。
3-6:分别根据N组单个字符的上下边界值Dun、Ddn对N个单个冠字号粗略图像D1-Dn进行分割,得到N个单个字符图像E1-En。
具体地,图5为N个单个字符图像E1-E8的示意图。
S4:逐个判断单个字符图像E是否为分数字符。
4-1:分别对单个字符图像E1-En进行水平投影,得到水平投影矩阵Ehp1-Ehpn。
具体地,本步骤根据公式(3)得到。
4-2:分别扫描水平投影矩阵Ehp1-Ehpn,并基于扫描结果确定单个字符图像E1-En的上下边界Eun、Edn。
原理如2-2所示。
4-3:根据上下边界Eun、Edn判断每个单个字符图像E是否为分数字符,具体判断根据公式(5),如果满足公式(5),则该字符为分数字符,反之则不是分数字符。(5)。
其中,thresh1是预设的高度阈值。
在此,thresh1是对大量数据进行统计所得。
S5:如果是分数字符,则确认单个字符图像E的中间分数线的位置,并基于中间分数线的位置分割得到分子区域和分母区域。
5-1:对单个字符图像En进行水平投影,得到水平投影矩阵Ehpn。
5-2:逐行扫描水平投影矩阵Ehpn,得到每一行的黑像素的个数。
5-3:黑像素的个数大于预设的阈值thresh3的行q为中间分数线的位置。
5-3:从q行处向上遍历Ehpn的像素值,当遍历到第一个大于0的值时,该行则为分数形式的冠字号的分子的下边界K1。
5-4:从q行处向下遍历Ehpn的像素值,当遍历到第一个大于0的值时,该行则为分数形式的冠字号的分母的上边界K2。
5-5:基于下边界K1和上边界Eun得到分子区域,基于上边界K2和下边界Edn得到分母区域。
图6为本发明实施例提供的分数形式的纸币冠字号的水平投影矩阵Ehpn的示意图,横坐标为黑点个数,纵坐标是行数。
S6:如果不是分数字符,则将S3得到的单个字符图像E作为最终分割结果。
具体地,为步骤S3-6中计算得到的结果。
本实施例通过多次投影、切割图像以及通过像素值判断中间分数线的位置,能更好识别带有分数形式的冠字号。
实施例
本发明实施例提供一种含有分数形式的冠字号的分割装置,商述分割装置包括:
二值化模块,用于采用阈值法计算冠字号区域的粗裁剪图像A的二值化图像B。
第一裁剪模块,用于根据冠字号区域的二值化图像B的水平投影矩阵Bhp和垂直投影矩阵Bvp,得到冠字号区域的精确裁剪图像C。
第二裁剪模块,用于根据精确裁剪图像C的垂直投影矩阵Cvp,得到多个单个字符图像E。
判断模块,用于逐个判断单个字符图像E是否为分数字符。
第一切割模块,用于如果是分数字符,则确认单个字符图像E的中间分数线的位置,并基于中间分数线的位置分割得到分子区域和分母区域。
第二切割模块,用于如果不是分数字符,则将S3得到的单个字符图像E作为最终分割结果。
本发明实施例所提供的含有分数形式的冠字号的分割装置,其实现原理及产生的技术效果和前述的含有分数形式的冠字号的分割方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (8)
1.一种含有分数形式的冠字号的分割方法,其特征在于,所述分割方法包括:
S1:采用阈值法计算冠字号区域的粗裁剪图像A的二值化图像B;
S2:根据冠字号区域的二值化图像B的水平投影矩阵Bhp和垂直投影矩阵Bvp,得到冠字号区域的精确裁剪图像C;
S3:根据精确裁剪图像C的垂直投影矩阵Cvp,得到多个单个字符图像E;
S4:逐个判断单个字符图像E是否为分数字符;
S5:如果是分数字符,则确认单个字符图像E的中间分数线的位置,并基于中间分数线的位置分割得到分子区域和分母区域;
S6:如果不是分数字符,则将S3得到的单个字符图像E作为最终分割结果。
2.根据权利要求1所述的含有分数形式的冠字号的分割方法,其特征在于,步骤S1包括:
1-1:计算预先获取的粗裁剪图像A的像素均值Mean;
计算过程见公式(1):
(1);
其中,W为粗裁剪图像A的宽,H为粗裁剪图像A的高,FA(x,y)为粗裁剪图像A的第x行y列的像素值;
1-2:基于像素均值Mean对粗裁剪图像A进行二值化处理,得到冠字号区域的二值化图像B;
计算过程见公式(2):
(2);
其中,FB(x,y)为二值化图像B在第x行y列的像素值,thresh2为预设的粗裁剪图像A的像素均值Mean的均值系数。
3.根据权利要求2所述的含有分数形式的冠字号的分割方法,其特征在于,步骤S2包括:
2-1:对二值化图像B进行水平投影,得到水平投影矩阵Bhp;
该步骤通过公式(3)实现:
(3);
其中,F(x,y)为二值化图像B的每个点的像素值,W为二值化图像B的宽,y=1,2,3....H-1,H为二值化图像B的高,Bhp(y)为二值化图像B在y行的投影和;
2-2:逐行扫描水平投影矩阵Bhp,并基于扫描结果确定精确裁剪图像C的冠字号字符的上边界Bu和下边界Bd;
2-3:对二值化图像B进行垂直投影,得到垂直投影矩阵Bvp;
该步骤根据公式(4)计算得到:
(4);
其中,x=1,2,3....W-1,Bvp(x)为二值化图像B在x列的投影和;
2-4:逐列扫描垂直投影矩阵Bvp,并基于扫描结果确定精确裁剪图像C的冠字号字符的左边界Bl和右边界Br;
2-5:根据上边界Bu、下边界Bd、左边界Bl、右边界Br,对二值化图像B进行裁剪得到精确裁剪图像C。
4.根据权利要求3所述的含有分数形式的冠字号的分割方法,其特征在于,步骤2-2包括:
扫描水平投影矩阵Bhp,得到第一个大于0的位置X和最后一个大于0的位置Y,即分别对应精确裁剪图像C的冠字号字符的上边界Bu和下边界Bd。
5.根据权利要求4所述的含有分数形式的冠字号的分割方法,其特征在于,步骤S3包括:
3-1:对精确裁剪图像C进行垂直投影,得到垂直投影矩阵Cvp;
3-2:逐列扫描垂直投影矩阵Cvp,并基于垂直投影矩阵Cvp确定N组单个字符的左右边界值Cln、Crn;
3-3:根据N组单个字符的左右边界值Cln、Crn对精确裁剪图像C进行分割,得到N个单个冠字号粗略图像D1-Dn;
3-4:分别对N个单个冠字号粗略图像D1-Dn进行水平投影,得到N个水平投影矩阵Dhp1-Dhpn;
3-5:分别扫描N个水平投影矩阵Dhp1-Dhpn,并基于扫描结果确定N组单个字符的上下边界值Dun、Ddn;
3-6:分别根据N组单个字符的上下边界值Dun、Ddn对N个单个冠字号粗略图像D1-Dn进行分割,得到N个单个字符图像E1-En。
6.根据权利要求5所述的含有分数形式的冠字号的分割方法,其特征在于,步骤S4包括:
4-1:分别对单个字符图像E1-En进行水平投影,得到水平投影矩阵Ehp1-Ehpn;
4-2:分别扫描水平投影矩阵Ehp1-Ehpn,并基于扫描结果确定单个字符图像E1-En的上下边界Eun、Edn;
4-3:根据上下边界Eun、Edn判断每个单个字符图像E是否为分数字符,具体判断根据公式(5),如果满足公式(5),则该字符为分数字符,反之则不是分数字符;
(5);
其中,thresh1是预设的高度阈值。
7.根据权利要求6所述的含有分数形式的冠字号的分割方法,其特征在于,步骤S5包括:
5-1:对单个字符图像En进行水平投影,得到水平投影矩阵Ehpn;其中,n表示第n张单个字符图像;
5-2:逐行扫描水平投影矩阵Ehpn,得到每一行的黑像素的个数;
5-3:黑像素的个数大于预设的阈值thresh3的行q为中间分数线的位置;
5-3:从q行处向上遍历Ehpn的像素值,当遍历到第一个大于0的值时,该行则为分数形式的冠字号的分子的下边界K1;
5-4:从q行处向下遍历Ehpn的像素值,当遍历到第一个大于0的值时,该行则为分数形式的冠字号的分母的上边界K2;
5-5:基于下边界K1和上边界Eun得到分子区域,基于上边界K2和下边界Edn得到分母区域。
8.一种含有分数形式的冠字号的分割装置,其特征在于,所述分割装置包括:
二值化模块,用于采用阈值法计算冠字号区域的粗裁剪图像A的二值化图像B;
第一裁剪模块,用于根据冠字号区域的二值化图像B的水平投影矩阵Bhp和垂直投影矩阵Bvp,得到冠字号区域的精确裁剪图像C;
第二裁剪模块,用于根据精确裁剪图像C的垂直投影矩阵Cvp,得到多个单个字符图像E;
判断模块,用于逐个判断单个字符图像E是否为分数字符;
第一切割模块,用于如果是分数字符,则确认单个字符图像E的中间分数线的位置,并基于中间分数线的位置分割得到分子区域和分母区域;
第二切割模块,用于如果不是分数字符,则将S3得到的单个字符图像E作为最终分割结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310684394.6A CN116468742B (zh) | 2023-06-12 | 2023-06-12 | 含有分数形式的冠字号的分割方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310684394.6A CN116468742B (zh) | 2023-06-12 | 2023-06-12 | 含有分数形式的冠字号的分割方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116468742A CN116468742A (zh) | 2023-07-21 |
CN116468742B true CN116468742B (zh) | 2023-10-03 |
Family
ID=87175700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310684394.6A Active CN116468742B (zh) | 2023-06-12 | 2023-06-12 | 含有分数形式的冠字号的分割方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116468742B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810493A (zh) * | 2012-11-06 | 2014-05-21 | 夏普株式会社 | 识别数学公式的方法和设备 |
KR101399396B1 (ko) * | 2012-12-26 | 2014-05-27 | 주식회사 씨텍 | 위폐감별유닛을 갖는 지폐 선별기 |
CN104361045A (zh) * | 2014-10-29 | 2015-02-18 | 中国建设银行股份有限公司 | 一种冠字号信息处理方法及设备 |
CN105989655A (zh) * | 2015-03-18 | 2016-10-05 | 光荣株式会社 | 识别号检索系统以及识别号检索方法 |
CN106296969A (zh) * | 2016-08-18 | 2017-01-04 | 深圳怡化电脑股份有限公司 | 纸币的识别方法和系统 |
KR20190119470A (ko) * | 2018-04-12 | 2019-10-22 | 주식회사 푸른기술 | 지폐 일련번호 인식 장치 및 방법 |
CN112990150A (zh) * | 2021-05-10 | 2021-06-18 | 恒银金融科技股份有限公司 | 一种基于投影双向累和测定冠字号上下边界的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014132414A1 (ja) * | 2013-02-28 | 2014-09-04 | グローリー株式会社 | 文字認識方法及び文字認識システム |
-
2023
- 2023-06-12 CN CN202310684394.6A patent/CN116468742B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810493A (zh) * | 2012-11-06 | 2014-05-21 | 夏普株式会社 | 识别数学公式的方法和设备 |
KR101399396B1 (ko) * | 2012-12-26 | 2014-05-27 | 주식회사 씨텍 | 위폐감별유닛을 갖는 지폐 선별기 |
CN104361045A (zh) * | 2014-10-29 | 2015-02-18 | 中国建设银行股份有限公司 | 一种冠字号信息处理方法及设备 |
CN105989655A (zh) * | 2015-03-18 | 2016-10-05 | 光荣株式会社 | 识别号检索系统以及识别号检索方法 |
CN106296969A (zh) * | 2016-08-18 | 2017-01-04 | 深圳怡化电脑股份有限公司 | 纸币的识别方法和系统 |
KR20190119470A (ko) * | 2018-04-12 | 2019-10-22 | 주식회사 푸른기술 | 지폐 일련번호 인식 장치 및 방법 |
CN112990150A (zh) * | 2021-05-10 | 2021-06-18 | 恒银金融科技股份有限公司 | 一种基于投影双向累和测定冠字号上下边界的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116468742A (zh) | 2023-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103914858B (zh) | 文档图像压缩方法及其在文档认证中的应用 | |
US4903312A (en) | Character recognition with variable subdivisions of a character region | |
EP0543593B1 (en) | Method for determining boundaries of words in text | |
US4926492A (en) | Optical character reading apparatus and method | |
JP5591578B2 (ja) | 文字列認識装置および文字列認識方法 | |
US4556985A (en) | Pattern recognition apparatus | |
JPH0587871B2 (zh) | ||
JPH05233873A (ja) | 領域分割方法 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN112507782A (zh) | 文本图像的识别方法及装置 | |
CN111814673A (zh) | 一种修正文本检测边界框的方法、装置、设备及存储介质 | |
JPH06501801A (ja) | 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置 | |
US8200016B2 (en) | Method and apparatus for character string recognition | |
JP5630689B2 (ja) | 文字認識方法及び文字認識装置 | |
CN116468742B (zh) | 含有分数形式的冠字号的分割方法和装置 | |
CN116469090A (zh) | 喷码图案的检测方法、装置、电子设备和存储介质 | |
JP2985893B2 (ja) | パターン認識装置 | |
JPH06501803A (ja) | 抽出されたデータから特定の部分を分離して抽出することを含む文字認識方法 | |
CN112183574A (zh) | 文件鉴伪比对方法及装置、终端和存储介质 | |
CN112163581B (zh) | 一种车牌字母识别方法、系统、装置及存储介质 | |
CN109697443B (zh) | 一种纸币冠字号分割方法及分割设备 | |
CN116486418B (zh) | 钞票冠字号图像的生成方法和装置 | |
JP3710164B2 (ja) | 画像処理装置及び方法 | |
JP2007226328A (ja) | バーコード認識装置,及び,バーコード認識方法 | |
JP2747136B2 (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |