CN113191360A - 票据的字符轮廓定位方法和装置 - Google Patents

票据的字符轮廓定位方法和装置 Download PDF

Info

Publication number
CN113191360A
CN113191360A CN202010039096.8A CN202010039096A CN113191360A CN 113191360 A CN113191360 A CN 113191360A CN 202010039096 A CN202010039096 A CN 202010039096A CN 113191360 A CN113191360 A CN 113191360A
Authority
CN
China
Prior art keywords
character
outline
information
screening
contour
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010039096.8A
Other languages
English (en)
Inventor
曹川�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yihua Computer Co Ltd
Shenzhen Yihua Time Technology Co Ltd
Shenzhen Yihua Financial Intelligent Research Institute
Original Assignee
Shenzhen Yihua Computer Co Ltd
Shenzhen Yihua Time Technology Co Ltd
Shenzhen Yihua Financial Intelligent Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yihua Computer Co Ltd, Shenzhen Yihua Time Technology Co Ltd, Shenzhen Yihua Financial Intelligent Research Institute filed Critical Shenzhen Yihua Computer Co Ltd
Priority to CN202010039096.8A priority Critical patent/CN113191360A/zh
Publication of CN113191360A publication Critical patent/CN113191360A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明提供了一种票据的字符轮廓定位方法及装置,涉及票据检测技术领域。所述方法通过获取待检验票据的图像信息,以及与票号字符对应的字符筛选信息,并根据字符筛选信息,从图像信息中筛选出满足字符筛选信息的多个初始字符轮廓。每个初始字符轮廓包括轮廓特征信息,接着可以根据轮廓特征信息,从多个初始字符轮廓中定位出待检验票据的票号字符的票号字符轮廓,由于票号字符的轮廓特征信息相差不大,则依次根据各个轮廓特征信息对字符进行筛选,可以排除初始字符轮廓中的干扰轮廓,最终找出票号字符的轮廓,然后进行字符识别,不仅可以快速、准确地定位到票据的票号字符轮廓,还可以适用于不同种类的票据,扩展性强。

Description

票据的字符轮廓定位方法和装置
技术领域
本发明涉及票据检测技术领域,特别是涉及一种票据的字符轮廓定位方法和一种票据的字符轮廓定位装置。
背景技术
票据是指出票人依法签发的由自己或指示他人无条件支付一定金额给收款人或持票人的有价证券,即某些可以代替现金流通的有价证券。票号则是伴随着票据的大量使用和批量印制而产生的,为会计资料的区分提供了证据。票据的编号具有唯一性或相同期间唯一性,通过票号可以方便查阅与审核。然而,当前对票据的票号识别,容易受到票号周围的非票号因素的影响,进而导致票号识别失败,或识别出错,影响对票据的识别。
发明内容
鉴于上述问题,提出了本发明实施例提供一种票据的字符轮廓定位方法,以解决现有技术中票号识别容易出错,识别准确率低的问题。
相应的,本发明实施例还提供了一种票据的字符轮廓定位装置,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种票据的字符轮廓定位方法,包括:
获取待检验票据的图像信息,以及与票号字符对应的字符筛选信息;
根据所述字符筛选信息,从所述图像信息中,确定与所述待检验票据对应的多个初始字符轮廓,所述初始字符轮廓包括轮廓特征信息;
根据所述轮廓特征信息,从多个所述初始字符轮廓中定位所述票号字符的票号字符轮廓。
可选地,所述轮廓特征信息包括表征相邻两个字符之间轮廓间距的轮廓距离信息,以及所述初始字符轮廓在所述图像信息中的高度信息与轮廓宽度信息,所述根据所述轮廓特征信息,从多个所述初始字符轮廓中定位所述票号字符的票号字符轮廓,包括:
根据所述高度信息,对所述初始字符轮廓进行筛选,获得第一字符轮廓;
根据所述轮廓宽度信息,对所述第一字符轮廓进行筛选,获得第二字符轮廓;
根据所述轮廓距离信息,对所述第二字符轮廓进行筛选,获得所述票号字符轮廓。
可选地,所述高度信息包括所述初始字符轮廓在所述图像信息中的纵坐标值,所述根据所述高度信息,对所述初始字符轮廓进行筛选,获得第一字符轮廓,包括:
统计相同纵坐标值的个数,并将个数最多的纵坐标值作为第一筛选阈值;
采用所述第一筛选阈值,生成针对所述初始字符轮廓的第一筛选条件;
将纵坐标值不满足所述第一筛选条件的初始字符轮廓,作为所述第一字符轮廓。
可选地,所述轮廓宽度信息包括所述第一字符轮廓的起始坐标值与结束坐标值,所述根据所述轮廓宽度信息,对所述第一字符轮廓进行筛选,获得第二字符轮廓,包括:
采用所述起始坐标值与所述结束坐标值,计算所述第一字符轮廓的宽度值;
统计相同宽度值的个数,并将个数最多的宽度值作为第二筛选阈值;
采用所述第二筛选阈值,生成针对所述第一字符轮廓的第二筛选条件;
将宽度值不满足所述第二筛选条件的第一字符轮廓,作为所述第二字符轮廓。
可选地,所述轮廓距离信息为相邻两个第二字符轮廓之间所述起始坐标值的坐标差值,所述根据所述轮廓距离信息,对所述第二字符轮廓进行筛选,获得所述票号字符,包括:
统计相同坐标差值的个数,并将个数最多的坐标差值作为第三筛选阈值;
采用所述第三筛选阈值,生成针对所述第二字符轮廓的第三筛选条件;
提取坐标差值满足所述第三筛选条件的第二字符轮廓作为所述票号字符的票号字符轮廓。
可选地,所述字符筛选信息包括宽度筛选信息以及高度筛选信息,所述图像信息包括多个票据字符,所述根据所述字符筛选信息,从所述图像信息中,确定与所述待检验票据对应的多个初始字符轮廓,包括:
从所述图像信息中,将同时满足所述宽度筛选信息与所述高度筛选信息的票据字符,作为所述初始字符轮廓。
本发明实施例还公开了一种票据的字符轮廓定位装置,包括:
图像与信息获取模块,用于获取待检验票据的图像信息,以及与票号字符对应的字符筛选信息;
字符轮廓筛选模块,用于根据所述字符筛选信息,从所述图像信息中,确定与所述待检验票据对应的多个初始字符轮廓,所述初始字符轮廓包括轮廓特征信息;
轮廓定位模块,用于根据所述轮廓特征信息,从多个所述初始字符轮廓中定位所述票号字符的票号字符轮廓。
可选地,所述轮廓特征信息包括表征相邻两个字符之间轮廓间距的轮廓距离信息,以及所述初始字符轮廓在所述图像信息中的高度信息与轮廓宽度信息,所述轮廓定位模块包括:
第一字符轮廓筛选子模块,用于根据所述高度信息,对所述初始字符轮廓进行筛选,获得第一字符轮廓;
第二字符轮廓筛选子模块,用于根据所述轮廓宽度信息,对所述第一字符轮廓进行筛选,获得第二字符轮廓;
字符轮廓定位子模块,用于根据所述轮廓距离信息,对所述第二字符轮廓进行筛选,获得所述票号字符轮廓。
可选地,所述高度信息包括所述初始字符轮廓在所述图像信息中的纵坐标值,所述第一字符轮廓筛选子模块具体用于:
统计相同纵坐标值的个数,并将个数最多的纵坐标值作为第一筛选阈值;
采用所述第一筛选阈值,生成针对所述初始字符轮廓的第一筛选条件;
将纵坐标值不满足所述第一筛选条件的初始字符轮廓,作为所述第一字符轮廓。
可选地,所述轮廓宽度信息包括所述第一字符轮廓的起始坐标值与结束坐标值,所述第二字符轮廓筛选子模块具体用于:
采用所述起始坐标值与所述结束坐标值,计算所述第一字符轮廓的宽度值;
统计相同宽度值的个数,并将个数最多的宽度值作为第二筛选阈值;
采用所述第二筛选阈值,生成针对所述第一字符轮廓的第二筛选条件;
将宽度值不满足所述第二筛选条件的第一字符轮廓,作为所述第二字符轮廓。
可选地,所述轮廓距离信息为相邻两个第二字符轮廓之间所述起始坐标值的坐标差值,所述字符轮廓定位子模块具体用于:
统计相同坐标差值的个数,并将个数最多的坐标差值作为第三筛选阈值;
采用所述第三筛选阈值,生成针对所述第二字符轮廓的第三筛选条件;
提取坐标差值满足所述第三筛选条件的第二字符轮廓作为所述票号字符的票号字符轮廓。
可选地,所述字符筛选信息包括宽度筛选信息以及高度筛选信息,所述图像信息包括多个票据字符,所述字符轮廓筛选模块具体用于:
从所述图像信息中,将同时满足所述宽度筛选信息与所述高度筛选信息的票据字符,作为所述初始字符轮廓。
本发明实施例还公开了一种计算机设备,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述计算机设备执行如上所述的一个或多个的方法。
本发明实施例还公开了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如上所述的一个或多个的方法。
本发明包括以下优点:
在本发明中,通过获取待检验票据的图像信息,以及与票号字符对应的字符筛选信息,接着根据字符筛选信息,从图像信息中,筛选出满足字符筛选信息的多个初始字符轮廓,实现对待检验票据中字符的初筛选。其中,每个初始字符轮廓包括轮廓特征信息,接着可以根据轮廓特征信息,从多个初始字符轮廓中定位出待检验票据的票号字符的票号字符轮廓,由于票号字符的轮廓特征信息相差不大,则依次根据各个轮廓特征信息对字符进行筛选,可以排除初始字符轮廓中的干扰轮廓,最终找出票号字符的轮廓,然后进行字符识别,不仅可以快速、准确地定位到票据的票号字符轮廓,还可以适用于不同种类的票据,扩展性强。
附图说明
图1是本发明的一种票据的字符轮廓定位方法实施例一的步骤流程图;
图2是本发明实施例中票据的局部图像信息示意图;
图3是本发明的一种票据的字符轮廓定位方法实施例二的步骤流程图;
图4是本发明实施例中初始字符轮廓的轮廓示意图;
图5是本发明实施例中第一字符轮廓的筛选示意图;
图6是本发明实施例中第二字符轮廓的筛选示意图;
图7是本发明实施例中票号字符轮廓的筛选示意图;
图8是本发明的一种票据的字符轮廓定位装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
票据可以为各个银行的存单、支票等,则票据的图像信息可以为票据票面的整体图像信息,也可以为票据票面的局部图像信息,如票据设备中摄像头对票据的拍照图的裁剪图,裁剪图可以为包括票据票号字符的图像,从而可以进一步从图像中识别票据整个票号的轮廓信息。
在票据检验识别的过程中,可以通过查找图像连通域的轮廓以确定票号的位置,确定了票号位置即相当于确定了各个票号字符的位置。对于票据票号字符,若干个票号字符几乎位于同一水平方向,每个字符的宽度也相差不大,且每相邻两个字符之间的轮廓距离也相差不大。本发明实施例的核心构思之一在于通过先获取待检验票据的图像信息,接着依据字符轮廓在图像中的像素信息,对图像信息中的字符进行初步的轮廓筛选,然后根据多个轮廓特征信息逐步进行筛选,并最终识别出待检验票据的票号字符,从而快速、准确地识别出票据的票号字符,还可以适用于不同种类的票据,扩展性强。
参照图1,示出了本发明的一种票据的字符轮廓定位方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤101,获取待检验票据的图像信息,以及与票号字符对应的字符筛选信息;
对于一张票据,票据的编号(即票号)具有唯一性或相同期间唯一性,通过票号可以方便查阅与审核。则银行工作人员可以通过票据设备对票据进行检验。在具体实现中,可以通过票据设备采集待检验票据的图像信息,进一步可以对整体的图像信息进行裁剪,以便获取包含票号的局部图像信息。
步骤102,根据所述字符筛选信息,从所述图像信息中,确定与所述待检验票据对应的多个初始字符轮廓,所述初始字符轮廓包括轮廓特征信息;
如图2所示,示出了本发明实施例中票据的局部图像信息示意图,在图像信息中除了包括票号字符外,还包括了多种不同字符,这些非票号的字符容易对票号字符定位造成干扰,进而导致票号识别失败,或准确度下降。
在具体实现中,可以通过字符筛选信息对图像信息中的各种字符进行初步的轮廓筛选,从而初步找到每个疑似票号字符的初始字符轮廓,进而确定票号字符轮廓,一方面可以减少干扰项,另一方面可以辅助快速找到票号字符。
步骤103,根据所述轮廓特征信息,从多个所述初始字符轮廓中定位所述票号字符的票号字符轮廓。
对于初始字符轮廓,其可以对应多个轮廓特征信息,一个初始字符轮廓的轮廓特征信息可以构成与其他字符之间的相同或相异之处,则根据不同的轮廓特征信息,可以从多个初始字符轮廓中进行逐步筛选,并最终从多个初始字符轮廓中找到票据中票号字符的票号字符轮廓。
在本发明中,通过获取待检验票据的图像信息,以及与票号字符对应的字符筛选信息,并根据字符筛选信息,从图像信息中筛选出满足字符筛选信息的多个初始字符轮廓。每个初始字符轮廓包括轮廓特征信息,接着可以根据轮廓特征信息,从多个初始字符轮廓中定位出待检验票据的票号字符的票号字符轮廓,由于票号字符的轮廓特征信息相差不大,则依次根据各个轮廓特征信息对字符进行筛选,可以排除初始字符轮廓中的干扰轮廓,最终找出票号字符的轮廓,然后进行字符识别,不仅可以快速、准确地定位到票据的票号字符轮廓,还可以适用于不同种类的票据,扩展性强。
参照图3,示出了本发明的一种票据的字符轮廓定位方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤301,获取待检验票据的图像信息,以及与票号字符对应的字符筛选信息,所述图像信息包括多个票据字符,所述字符筛选信息包括宽度筛选信息以及高度筛选信息;
在具体实现中,可以通过票据设备采集待检验票据的彩色图像,然后将彩色图形转化为灰度图像,并通过高斯滤波进行平滑降噪,接着对灰度图像进行二值化处理,通过中值滤波消除孤立白点,最后通过膨胀以适当加粗字符,从而得到待检验票据的图像信息。进一步的,可以进行裁剪,以得到包含票号字符的局部图像信息。
其中,局部图像信息中包括多种不同的字符,则为了找到疑似票号字符的初始字符轮廓,可以通过字符筛选信息进行初筛。字符筛选信息可以包括宽度筛选信息以及高度筛选信息,通过宽度筛选信息以及高度筛选信息可以对图像信息中的字符进行初步筛选,从而实现对局部图像信息中的字符进行初步筛选。
步骤302,从所述图像信息中,将同时满足所述宽度筛选信息与所述高度筛选信息的票据字符,作为所述初始字符轮廓,所述初始字符轮廓包括轮廓特征信息;
在票号识别过程中,票据设备可以从图像信息中,将同时满足宽度筛选信息与高度筛选信息的票据字符,作为初始字符轮廓,并获取每个初始字符轮廓的轮廓特征信息。
在一种示例中,字符筛选信息可以为像素值的筛选信息,宽度筛选信息可以为字符轮廓的宽度像素值,如10<宽度像素值<50;高度筛选信息可以为字符轮廓的高度像素值,如30<高度像素值<100,即当图像信息中的字符的外接矩形轮廓同时满足宽度像素值与高度像素值时,将该字符作为初始字符轮廓,并获取其轮廓对应的轮廓特征信息。如图4所示,为本发明实施例中初始字符轮廓的轮廓示意图,依据宽度筛选信息与高度筛选信息对图像中的各个字符进行筛选,可以得到如图所示的疑似轮廓,接着获取轮廓对应的轮廓特征信息。
需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,在本发明实施例的思想指导下,本领域技术人员可以根据实际票据类别,进行字符筛选信息的设置,本发明对此不作限制。
步骤303,根据所述轮廓特征信息,从多个所述初始字符轮廓中定位所述票号字符的票号字符轮廓。
在本发明的一种可选实施例中,轮廓特征信息可以包括表征相邻两个字符之间轮廓间距的轮廓距离信息,以及所述初始字符轮廓在所述图像信息中的高度信息与轮廓宽度信息,则可以先根据初始字符轮廓所在图像的高度信息,对初始字符轮廓进行筛选,获得第一字符轮廓,接着根据轮廓宽度信息,对第一字符轮廓进行筛选,获得第二字符轮廓,然后根据相邻字符轮廓之间的距离信息,对第二字符轮廓进行筛选,获得票号字符的票号字符轮廓,然后可以进行字符识别,确定待检验票据的票号字符。
在具体实现中,高度信息可以包括初始字符轮廓在图像信息中的纵坐标值,则可以先统计相同纵坐标值的个数,并将个数最多的纵坐标值作为第一筛选阈值,并采用第一筛选阈值,生成针对初始字符轮廓的第一筛选条件,然后将纵坐标值不满足第一筛选条件的初始字符轮廓,作为第一字符轮廓,从而通过轮廓所在图像的高度信息,可以排除票号字符所在图像中的同一水平高度轮廓数量较少的轮廓,使得第一字符轮廓基本位于同一水平高度。
当得到基本位于同一水平高度的第一字符轮廓时,可以根据各个第一字符轮廓的轮廓宽度信息,排除票号字符统计宽度以外的干扰轮廓。轮廓宽度信息可以包括第一字符轮廓的起始坐标值与结束坐标值,则可以采用起始坐标值与结束坐标值,计算第一字符轮廓的宽度值,接着统计相同宽度值的个数,并将个数最多的宽度值作为第二筛选阈值,并采用第二筛选阈值,生成针对第一字符轮廓的第二筛选条件,然后将宽度值不满足第二筛选条件的第一字符轮廓,作为第二字符轮廓,从而排除宽度过小或过大的轮廓,得到轮廓宽度基本相同的字符轮廓,实现对字符轮廓的进一步筛选。
当得到轮廓宽度基本相同的第二字符轮廓后,可以根据各个第二字符轮廓之间的轮廓距离信息,排除票号字符中相邻字符统计间距以外的干扰轮廓,从而得到票号字符的轮廓,进而准确找到票号的各个字符。具体的,轮廓距离信息为相邻两个第二字符轮廓之间起始坐标值的坐标差值,则可以统计相同坐标差值的个数,并将个数最多的坐标差值作为第三筛选阈值,并采用第三筛选阈值,生成针对第二字符轮廓的第三筛选条件,然后提取坐标差值满足第三筛选条件的第二字符轮廓作为票号字符轮廓,并识别票号字符轮廓中的字符,得到票据的票号字符。
在一种示例中,如图5所示,为本发明实施例中第一字符轮廓的筛选示意图。若以图像左上角为原点,建立坐标系(纵向为y轴,横向为x轴),则每个初始字符轮廓可以分别对应四个顶点,取每个初始字符轮廓的左上顶点的纵坐标,作为每个初始字符轮廓的纵坐标值。接着可以统计相同纵坐标值的个数,并确定纵坐标值集中在哪个值,将该值记为y’,然后基于y’生成针对初始字符轮廓的第一筛选条件,如第一筛选条件可以为|a-y’|>y’*0.3,即假设初始字符轮廓的左上顶点的纵坐标值为a,将满足第一筛选条件的初始字符轮廓进行排除,并保留不满足第一筛选条件的初始字符轮廓,作为第一字符轮廓,从而通过轮廓高度信息,可以排除票号字符所在图像中的同一水平高度轮廓数量较少的轮廓,使得排除后的第一字符轮廓基本位于同一水平高度。
如图6所示,为本发明实施例中第二字符轮廓的筛选示意图,可以获取各个第一字符轮廓左上顶点与右上顶点(或,左下顶点与右下顶点)对应的横坐标x1与x2,并取x1与x2之间差值的绝对值,得到各个第一字符轮廓的宽度值。再统计相同宽度值的个数,并确定宽度值集中在哪个值,将该值记为w,然后基于w生成针对第一字符轮廓的第二筛选条件,如第二筛选条件可以为|b-w|>w*0.8与b<w*0.7,即假设第一字符轮廓的宽度值为b,将满足|b-w|>w*0.8或b<w*0.7的第一字符轮廓进行排除,并保留不满足第二筛选条件的第一字符轮廓,作为第二字符轮廓,排除宽度过小或过大的轮廓,得到轮廓宽度基本相同的字符轮廓,实现对字符轮廓的进一步筛选。
如图7所示,为本发明实施例中票号字符轮廓的筛选示意图,可以获取各个第二字符轮廓的左上顶点的横坐标x3,并将相邻两个第二字符轮廓的横坐标x3进行作差,取绝对值,得到相邻两个第二字符轮廓的坐标差值。接着统计相同坐标差值的个数,并确定坐标差值集中在哪个值,将该值记为d,然后基于d生成针对第二字符轮廓的第三筛选条件,如|c-d|<d*0.3,即假设相邻两个第二字符轮廓之间的坐标差值为c,将不满足第三筛选条件的第二字符轮廓进行排除,并保留满足第三筛选条件的第二字符作为目标字符轮廓,从而若连续多个第二字符轮廓相邻间距满足第三筛选条件,则保留这些第二字符轮廓以及相邻的最后一个轮廓(如相邻9个字符轮廓相邻间距满足第三筛选条件,则保留这9个字符轮廓和第10个字符轮廓),进而可以排除与轮廓间距相差过大的字符轮廓,排除了票号前后的干扰轮廓,实现票号字符轮廓的确定,以便对票号字符进行识别。通过依次根据各个轮廓特征信息对字符进行筛选,可以排除初始字符轮廓中的干扰轮廓,最终找到出票号字符的票号字符轮廓,不仅可以快速、准确地找出票据的票号字符轮廓,进而实现票号识别,还可以适用于不同种类的票据,扩展性强。
需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,在本发明实施例的思想指导下,本领域技术人员可以根据实际情况进行设置,本发明对此不作限制。
在本发明中,通过获取待检验票据的图像信息,以及与票号字符对应的字符筛选信息,并根据字符筛选信息,从图像信息中筛选出满足字符筛选信息的多个初始字符轮廓。每个初始字符轮廓包括轮廓特征信息,接着可以根据轮廓特征信息,从多个初始字符轮廓中定位出待检验票据的票号字符的票号字符轮廓,由于票号字符的轮廓特征信息相差不大,则依次根据各个轮廓特征信息对字符进行筛选,可以排除初始字符轮廓中的干扰轮廓,最终找出票号字符的轮廓,然后进行字符识别,不仅可以快速、准确地定位到票据的票号字符轮廓,还可以适用于不同种类的票据,扩展性强。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图8,示出了本发明的一种票据的字符轮廓定位装置实施例的结构框图,具体可以包括如下模块:
图像与信息获取模块801,用于获取待检验票据的图像信息,以及与票号字符对应的字符筛选信息;
字符轮廓筛选模块802,用于根据所述字符筛选信息,从所述图像信息中,确定与所述待检验票据对应的多个初始字符轮廓,所述初始字符轮廓包括轮廓特征信息;
轮廓定位模块803,用于根据所述轮廓特征信息,从多个所述初始字符轮廓中定位所述票号字符的票号字符轮廓。
在本发明实施例的一种可选实施例中,所述轮廓特征信息包括表征相邻两个字符之间轮廓间距的轮廓距离信息,以及所述初始字符轮廓在所述图像信息中的高度信息与轮廓宽度信息,所述轮廓定位模块803包括:
第一字符轮廓筛选子模块,用于根据所述高度信息,对所述初始字符轮廓进行筛选,获得第一字符轮廓;
第二字符轮廓筛选子模块,用于根据所述轮廓宽度信息,对所述第一字符轮廓进行筛选,获得第二字符轮廓;
字符轮廓定位子模块,用于根据所述轮廓距离信息,对所述第二字符轮廓进行筛选,获得所述票号字符轮廓。
在本发明实施例的一种可选实施例中,所述高度信息包括所述初始字符轮廓在所述图像信息中的纵坐标值,所述第一字符轮廓筛选子模块具体用于:
统计相同纵坐标值的个数,并将个数最多的纵坐标值作为第一筛选阈值;
采用所述第一筛选阈值,生成针对所述初始字符轮廓的第一筛选条件;
将纵坐标值不满足所述第一筛选条件的初始字符轮廓,作为所述第一字符轮廓。
在本发明实施例的一种可选实施例中,所述轮廓宽度信息包括所述第一字符轮廓的起始坐标值与结束坐标值,所述第二字符轮廓筛选子模块具体用于:
采用所述起始坐标值与所述结束坐标值,计算所述第一字符轮廓的宽度值;
统计相同宽度值的个数,并将个数最多的宽度值作为第二筛选阈值;
采用所述第二筛选阈值,生成针对所述第一字符轮廓的第二筛选条件;
将宽度值不满足所述第二筛选条件的第一字符轮廓,作为所述第二字符轮廓。
在本发明实施例的一种可选实施例中,所述轮廓距离信息为相邻两个第二字符轮廓之间所述起始坐标值的坐标差值,所述字符轮廓定位子模块具体用于:
统计相同坐标差值的个数,并将个数最多的坐标差值作为第三筛选阈值;
采用所述第三筛选阈值,生成针对所述第二字符轮廓的第三筛选条件;
提取坐标差值满足所述第三筛选条件的第二字符轮廓作为所述票号字符的票号字符轮廓。
在本发明实施例的一种可选实施例中,所述字符筛选信息包括宽度筛选信息以及高度筛选信息,所述图像信息包括多个票据字符,所述字符轮廓筛选模块802具体用于:
从所述图像信息中,将同时满足所述宽度筛选信息与所述高度筛选信息的票据字符,作为所述初始字符轮廓。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种计算机设备,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述计算机设备执行本发明实施例所述的方法。
本发明实施例还提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行本发明实施例所述的方法。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器、EEPROM、Flash以及eMMC等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种票据的字符轮廓定位方法和一种票据的字符轮廓定位装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种票据的字符轮廓定位方法,其特征在于,包括:
获取待检验票据的图像信息,以及与票号字符对应的字符筛选信息;
根据所述字符筛选信息,从所述图像信息中,确定与所述待检验票据对应的多个初始字符轮廓,所述初始字符轮廓包括轮廓特征信息;
根据所述轮廓特征信息,从多个所述初始字符轮廓中定位所述票号字符的票号字符轮廓。
2.根据权利要求1所述的方法,其特征在于,所述轮廓特征信息包括表征相邻两个字符之间轮廓间距的轮廓距离信息,以及所述初始字符轮廓在所述图像信息中的高度信息与轮廓宽度信息,所述根据所述轮廓特征信息,从多个所述初始字符轮廓中定位所述票号字符的票号字符轮廓,包括:
根据所述高度信息,对所述初始字符轮廓进行筛选,获得第一字符轮廓;
根据所述轮廓宽度信息,对所述第一字符轮廓进行筛选,获得第二字符轮廓;
根据所述轮廓距离信息,对所述第二字符轮廓进行筛选,获得所述票号字符轮廓。
3.根据权利要求2所述的方法,其特征在于,所述高度信息包括所述初始字符轮廓在所述图像信息中的纵坐标值,所述根据所述高度信息,对所述初始字符轮廓进行筛选,获得第一字符轮廓,包括:
统计相同纵坐标值的个数,并将个数最多的纵坐标值作为第一筛选阈值;
采用所述第一筛选阈值,生成针对所述初始字符轮廓的第一筛选条件;
将纵坐标值不满足所述第一筛选条件的初始字符轮廓,作为所述第一字符轮廓。
4.根据权利要求2所述的方法,其特征在于,所述轮廓宽度信息包括所述第一字符轮廓的起始坐标值与结束坐标值,所述根据所述轮廓宽度信息,对所述第一字符轮廓进行筛选,获得第二字符轮廓,包括:
采用所述起始坐标值与所述结束坐标值,计算所述第一字符轮廓的宽度值;
统计相同宽度值的个数,并将个数最多的宽度值作为第二筛选阈值;
采用所述第二筛选阈值,生成针对所述第一字符轮廓的第二筛选条件;
将宽度值不满足所述第二筛选条件的第一字符轮廓,作为所述第二字符轮廓。
5.根据权利要求3所述的方法,其特征在于,所述轮廓距离信息为相邻两个第二字符轮廓之间所述起始坐标值的坐标差值,所述根据所述轮廓距离信息,对所述第二字符轮廓进行筛选,获得所述票号字符轮廓,包括:
统计相同坐标差值的个数,并将个数最多的坐标差值作为第三筛选阈值;
采用所述第三筛选阈值,生成针对所述第二字符轮廓的第三筛选条件;
提取坐标差值满足所述第三筛选条件的第二字符轮廓作为所述票号字符的票号字符轮廓。
6.根据权利要求1所述的方法,其特征在于,所述字符筛选信息包括宽度筛选信息以及高度筛选信息,所述图像信息包括多个票据字符,所述根据所述字符筛选信息,从所述图像信息中,确定与所述待检验票据对应的多个初始字符轮廓,包括:
从所述图像信息中,将同时满足所述宽度筛选信息与所述高度筛选信息的票据字符,作为所述初始字符轮廓。
7.一种票据的字符轮廓定位装置,其特征在于,包括:
图像与信息获取模块,用于获取待检验票据的图像信息,以及与票号字符对应的字符筛选信息;
字符轮廓筛选模块,用于根据所述字符筛选信息,从所述图像信息中,确定与所述待检验票据对应的多个初始字符轮廓,所述初始字符轮廓包括轮廓特征信息;
轮廓定位模块,用于根据所述轮廓特征信息,从多个所述初始字符轮廓中定位所述票号字符的票号字符轮廓。
8.根据权利要求7所述的装置,其特征在于,所述轮廓特征信息包括表征相邻两个字符之间轮廓间距的轮廓距离信息,以及所述初始字符轮廓在所述图像信息中的高度信息与轮廓宽度信息,所述轮廓定位模块包括:
第一字符轮廓筛选子模块,用于根据所述高度信息,对所述初始字符轮廓进行筛选,获得第一字符轮廓;
第二字符轮廓筛选子模块,用于根据所述轮廓宽度信息,对所述第一字符轮廓进行筛选,获得第二字符轮廓;
字符轮廓定位子模块,用于根据所述轮廓距离信息,对所述第二字符轮廓进行筛选,获得所述票号字符轮廓。
9.一种计算机设备,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述计算机设备执行如权利要求1-6所述的一个或多个的方法。
10.一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如权利要求1-6所述的一个或多个的方法。
CN202010039096.8A 2020-01-14 2020-01-14 票据的字符轮廓定位方法和装置 Pending CN113191360A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010039096.8A CN113191360A (zh) 2020-01-14 2020-01-14 票据的字符轮廓定位方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010039096.8A CN113191360A (zh) 2020-01-14 2020-01-14 票据的字符轮廓定位方法和装置

Publications (1)

Publication Number Publication Date
CN113191360A true CN113191360A (zh) 2021-07-30

Family

ID=76972456

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010039096.8A Pending CN113191360A (zh) 2020-01-14 2020-01-14 票据的字符轮廓定位方法和装置

Country Status (1)

Country Link
CN (1) CN113191360A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239909A (zh) * 2014-08-11 2014-12-24 北京捷通华声语音技术有限公司 一种图像的识别方法和装置
CN106096601A (zh) * 2016-06-06 2016-11-09 深圳辰通智能股份有限公司 一种自动检测票据中字符类型的方法和系统
CN107967479A (zh) * 2016-10-19 2018-04-27 深圳怡化电脑股份有限公司 一种带污损票据的字符识别方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239909A (zh) * 2014-08-11 2014-12-24 北京捷通华声语音技术有限公司 一种图像的识别方法和装置
CN106096601A (zh) * 2016-06-06 2016-11-09 深圳辰通智能股份有限公司 一种自动检测票据中字符类型的方法和系统
CN107967479A (zh) * 2016-10-19 2018-04-27 深圳怡化电脑股份有限公司 一种带污损票据的字符识别方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王天昊: "基于OCR的发票真伪自动鉴别方法研究", 万方数据库, pages 1 - 61 *
薛圣利等: "基于 OpenCV 的火车票识别算法", 广西科技大学学报, vol. 27, no. 2, pages 46 - 51 *

Similar Documents

Publication Publication Date Title
CN110909732B (zh) 一种图中数据的自动提取方法
CN109658584B (zh) 一种票据信息识别方法及装置
CN105069900B (zh) 一种处理纸币信息的方法及装置
WO2018019041A1 (zh) 一种粘贴钞检测方法和装置
CN104680161A (zh) 一种身份证数字识别方法
US20080013803A1 (en) Method and apparatus for determining print image quality
CN108197644A (zh) 一种图像识别方法和装置
CN112823352B (zh) 碱基识别方法、系统和测序系统
CN110110325B (zh) 一种重复案件查找方法和装置、计算机可读存储介质
CN112052813B (zh) 染色体间易位识别方法、装置、电子设备及可读存储介质
CN108154132A (zh) 一种身份证文字提取方法、系统及设备和存储介质
CN111369801B (zh) 车辆识别方法、装置、设备和存储介质
CN108073925B (zh) 一种车牌识别方法及装置
CN111652145B (zh) 一种公式检测的方法、装置、电子设备和存储介质
CN107436906A (zh) 一种信息检测方法及装置
CN108510639B (zh) 一种纸币鉴伪方法、装置、验钞机和存储介质
Chu et al. Selecting valid correlation areas for automated bullet identification system based on striation detection
CN106204616B (zh) 一种伊朗纸币币值的识别方法及装置
CN111753642B (zh) 一种确定关键帧的方法及装置
JP2003109007A (ja) 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置
CN113191360A (zh) 票据的字符轮廓定位方法和装置
KR20160061528A (ko) 위변조 여권 검사 방법 및 그 기록매체
KR102094234B1 (ko) 지폐 일련번호 인식 장치 및 방법
JP5385372B2 (ja) 文字認識装置及び文字認識方法
CN117058805A (zh) 纸币图像处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination