CN107808154B - 提取收银票据信息的方法和装置 - Google Patents
提取收银票据信息的方法和装置 Download PDFInfo
- Publication number
- CN107808154B CN107808154B CN201711292314.3A CN201711292314A CN107808154B CN 107808154 B CN107808154 B CN 107808154B CN 201711292314 A CN201711292314 A CN 201711292314A CN 107808154 B CN107808154 B CN 107808154B
- Authority
- CN
- China
- Prior art keywords
- field
- cash register
- bill
- numerical value
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及图像处理技术领域,尤其涉及一种提取收银票据信息的方法和装置。所述提取收银票据指定信息的方法,包括如下步骤:对第一收银票据进行布局分析;从所述第一收银票据中选择第一数值域;计算与所述第一数值域对应的关键字域;生成模板;根据所述模板从待识别的收银票据中获取目标关键字域,并计算目标数值域;对所述目标数值区域进行文本识别。本发明可以根据用户要获取的数据类型建立特定模板,精简了参数的输入,减少了计算量,缩短了数据提取时间,满足了数据提取实时性的要求;同时,提高了识别效率和精准度。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种提取收银票据信息的方法和装置。
背景技术
随着科学技术的持续发展和人们生活水平的不断提高,商场、超市、餐饮店面等各种消费场所都开始使用收银系统对消费者购买的商品进行结算,实现了自动化商业的管理。由于收银系统可以提高收银、结算效率,避免计算错误,精简人手、节约人力资源,且能够保留结算证据、实现有据可查,因此,收银系统在人们的日常生活中越来越普遍的被使用。一般来说,收银系统包括收银机和打印机。其中,收银机负责收银、结算等,并将收银信息以收银票据的形式发送给打印机,打印机再将收银票据信息以纸件的形式打印出来。
收银票据中包含了单次交易的详细信息,因而用户可以通过提取收银票据中的相关信息,来了解商户的单笔消费金额、营收、客单价、绘制交易时间曲线等信息,以对商户的经营状况进行评估。但是,由于收银票据从收银机的打印驱动输出到打印机的过程中,需要采用一种信息载体来传输收银票据信息,而这种信息载体通常为图片。现有技术中,从图片格式的收银票据中提取信息的操作较为繁琐。
附图1是现有技术中获取收银票据信息的方法流程图。如图1所示,现有技术从图片格式的收银票据中提取信息的方法包括如下步骤:步骤S11,将图片格式的完整收银票据识别成文本信息;步骤S12,对所述文本信息进行分析,并提取关键数据。但是,该种获取收银票据信息的方法具有以下几方面的缺陷:第一,校准精度成本高、识别精准度不高导致关键数据错误;第二,只能针对收银票据进行整体识别,不能指定识别信息,针对性较差;第三,识别整个图片格式的收银票据涉及大量计算,耗时长,无法满足实时性要求高的应用场景;第四,通用字库识别模块对计算机配置要求高,成本高。
因此,如何提高收银票据指定信息识别的精准度、简化识别计算量、提高识别效率、并降低识别成本,是目前亟待解决的技术问题。
发明内容
本发明提供一种提取收银票据信息的方法和装置,用以解决现有技术中图片格式的收银票据信息识别精准度较低的问题,从而实现收银票据中指定信息的快速提取,并降低提取成本。
为了解决上述问题,本发明提供了一种提取收银票据信息的方法,包括如下步骤:
对第一收银票据进行布局分析,以将所述第一收银票据按照文本间隔阈值划分为多个第一矩形区域,所述第一收银票据与待识别的收银票据具有相同的布局;
从所述第一收银票据中选择一区域作为第一数值域;
从多个所述第一矩形区域中计算得到与所述第一数值域对应的一第一矩形区域作为关键字域;
根据所述第一数值域、所述关键字域生成模板;
根据所述模板中所述关键字域的像素值从所述待识别的收银票据中获取目标关键字域,并根据所述目标关键字域计算出目标数值域;
对所述目标数值区域进行文本识别,以实现信息提取。
优选的,对第一收银票据进行布局分析的具体步骤包括:
对第一收银票据进行灰度化、二值化的预处理;
在经过预处理的所述第一收银票据所在的平面内建立相互垂直的横轴和纵轴,通过横轴和纵轴的像素投影计算、以像素投影的谷底作为文本边界,并将位于同一行、相邻文本之间的间隔小于间隔阈值的文本划分为一矩形区域,且所述矩形区域的边界与文本边界相同。
优选的,从多个所述矩形区域中计算得到与所述第一数值域对应的一第一矩形区域作为关键字域的具体步骤包括:
将每一第一矩形区域与所述第一数值域进行位置向量差计算,得到第一结果;
提供第二收银票据,并进行与所述第一收银票据相同的布局分析,得到多个第二矩形区域;
从所述第二收银票据中选择与所述第一数值域相同的区域作为第二数值域;
将每一第二矩形区域与所述第二数值域进行位置向量差计算,得到第二结果;
对所述第一结果与所述第二结果进行相似性匹配,对通过匹配的第一矩形区域按与所述第一数值域的距离排序;
选取距离小于一预设值的多个第一矩形区域按照可能性规则进行打分,并选择得分最高的第一矩形区域在第一收银票据中的坐标作为关键字域。
优选的,根据所述模板中所述关键字域的像素值从所述待识别的收银票据中获取目标关键字域的具体步骤包括:
提取所述模板中所述关键字域的像素值;
根据所述像素值、采用开源计算机视觉库的相关性算法从所述待识别的收银票据中获取目标关键字域。
优选的,根据所述目标关键字域计算出目标数值域的具体步骤包括:
计算所述模板中所述关键字域与所述第一数值域之间的向量差;
根据所述向量差与所述目标关键字域计算目标数值域。
为了解决上述问题,本发明还提供了一种提取收银票定信息的装置,包括:
布局分析模块,用于对第一收银票据进行布局分析,以将所述第一收银票据按照文本间隔阈值划分为多个第一矩形区域,所述第一收银票据与待识别的收银票据具有相同的布局;
选择模块,用于从所述第一收银票据中选择一区域作为第一数值域;
关键字域模块,连接所述布局分析模块、所述选择模块,用于从多个所述第一矩形区域中计算得到与所述第一数值域对应的一第一矩形区域作为关键字域;
模板生成模块,用于根据所述第一数值域、所述关键字域生成模板;
第一处理模块,连接所述模板生成模块,用于根据所述模板中所述关键字域的像素值从所述待识别的收银票据中获取目标关键字域,并根据所述目标关键字域计算出目标数值域;
第二处理模块,连接所述第一处理模块,用于对所述目标数值区域进行文本识别,以实现信息提取。
优选的,所述布局分析模块包括预处理单元和划分单元;所述预处理单元,用于对第一收银票据进行灰度化、二值化的预处理;所述划分单元,连接所述预处理单元,用于在经过预处理的所述第一收银票据所在的平面内建立相互垂直的横轴和纵轴,通过横轴和纵轴的像素投影计算、以像素投影的谷底作为文本边界,并将位于同一行、相邻文本之间的间隔小于间隔阈值的文本划分为一矩形区域,且所述矩形区域的边界与文本边界相同。
优选的,所述关键字域模块包括计算单元、匹配单元和打分单元;所述计算单元,用于将每一第一矩形区域与所述第一数值域进行位置向量差计算,得到第一结果;所述布局分析模块还用于对一第二收银票据进行与所述第一收银票据相同的布局分析,得到多个第二矩形区域;所述选择模块还用于从所述第二收银票据中选择与所述第一数值域相同的区域作为第二数值域;所述计算单元还用于将每一第二矩形区域与所述第二数值域进行位置向量差计算,得到第二结果;所述匹配单元,连接所述计算单元,用于对所述第一结果与所述第二结果进行相似性匹配,对通过匹配的第一矩形区域按与所述第一数值域的距离排序;所述打分单元,连接所述匹配单元,用于选取距离小于一预设值的多个第一矩形区域按照可能性规则进行打分,并选择得分最高的第一矩形区域在第一收银票据中的坐标作为关键字域。
优选的,所述第一处理模块包括第一获取单元和第二获取单元;所述第一获取单元,用于提取所述模板中所述关键字域的像素值;所述第二获取单元,连接所述第一获取单元,用于根据所述像素值、采用开源计算机视觉库的相关性算法从所述待识别的收银票据中获取目标关键字域。
优选的,所述第二处理模块包括第一分析单元和第二分析单元;所述第一分析单元,用于计算所述模板中所述关键字域与所述第一数值域之间的向量差;所述第二分析单元,连接所述第一分析单元,用于根据所述向量差与所述目标关键字域计算目标数值域。
本发明提供的提取收银票据信息的方法和装置,基于同类收银票据具有相同布局的原理,可以根据用户要获取的数据类型建立特定模板,精简了参数的输入,减少了计算量,缩短了数据提取时间,满足了数据提取实时性的要求;同时,由于模板精简、计算过程简单直接,最后需要进行文本识别的模板数值域被锁定,识别所需要的字库针对性较强,采用针对数字和字母的字库即可,识别效率和精准度都有了较大提升。
附图说明
附图1是现有技术中获取收银票据信息的方法流程图;
附图2是本发明具体实施方式的提取收银票据信息的方法流程图;
附图3是本发明具体实施方式的提取收银票据信息的装置的结构示意图;
附图4是本发明具体实施方式的布局分析模块的结构示意图;
附图5是本发明具体实施方式的关键字域模块的结构示意图;
附图6是本发明具体实施方式中一收银票据原件结构示意图;
附图7是本发明具体实施方式中经过布局分析的收银票据结构示意图;
附图8是本发明具体实施方式中收银票据中关键字域和数值域的结构示意图。
具体实施方式
下面结合附图对本发明提供的提取收银票据信息的方法和装置的具体实施方式做详细说明。
本具体实施方式提供了一种提取收银票据信息的方法,附图2是本发明具体实施方式的提取收银票据信息的方法流程图。如图2所示,本具体实施方式提供的提取收银票据信息的方法,包括如下步骤:
步骤S21,对第一收银票据进行布局分析,以将所述第一收银票据按照文本间隔阈值划分为多个第一矩形区域,所述第一收银票据与待识别的收银票据具有相同的布局。由于同一收银台的同类收银票据具有相同的布局,本具体实施方式基于这一规律,先对与待识别的收银票据具有相同布局的第一收银票据进行布局分析,以了解收银票据的整体布局,为后续提取票据中的指定信息奠定基础。本具体实施方式中的第一收银票据、待识别的收银票据均是指从收银系统的打印驱动传输到打印机的过程中截获的图片格式的收银票据。举例来说,附图6是本发明具体实施方式中一收银票据原件结构示意图,附图7是本发明具体实施方式中经过布局分析的收银票据结构示意图。
步骤S22,从所述第一收银票据中选择一区域作为第一数值域。用户从所述第一收银票据中选择第一数值域的方式,可以是通过一矩形选择区域在所述收银票据中框定来选取。所述第一数值域所在的区域即为用户选择的指定信息区域,用于构建后续模板,以提取待识别收银票据中相应区域的信息。在本具体实施方式中,所述第一数值域中的内容为数字和字母。
步骤S23,从多个所述第一矩形区域中计算得到与所述第一数值域对应的一第一矩形区域作为关键字域。本具体实施方式中的关键字域,是指与所述第一数值域中的内容对应的项目的名称,例如第一数值域中的内容为时间、则与其对应的关键字域为“结账时间”或“收银时间”,再例如第一数值域中的内容为总价金额、则与其对应的关键字域为“合计”或“总价”。举例来说,附图8是本发明具体实施方式中收银票据中关键字域和数值域的结构示意图,图8中的矩形方框内的“24.00”即为第一数值域,“合计:”即为关键字域。
步骤S24,根据所述第一数值域、所述关键字域生成模板。所述模板用于后续对待识别的收银票据进行指定信息的提取。由上述过程可以看出,本具体实施方式在构建模板的过程中,依赖于对算法的创新,精简了参数输入,同时把比较、核对、修正等人力工作转变为了自动计算,大幅度减少了对人力的依赖。用户在构建模板的过程中,人工操作的步骤只是选定要提取的指定信息区域,即第一数值域,降低了对上岗人员专业和知识的要求。而且,通过算法自动生成的模板,过程科学,结果准确,大幅度降低了模板修正的发生率;同时,精简的模板,也提高了后续指定信息提取、识别的准确度。
步骤S25,根据所述模板中所述关键字域的像素值从所述待识别的收银票据中获取目标关键字域,并根据所述目标关键字域计算出目标数值域。
步骤S26,对所述目标数值区域进行文本识别,以实现信息提取。由于所述目标数值区域的内容仅仅为数字和字母,因此,在对所述目标数值区域的内容进行识别时,只需要采用针对数字和字母的字库即可,相较于现有技术中采用的通用字库,字库的针对性大大增强,制作字库和识别目标数值区域的效率提高,识别结果的精准度也大大增强。
为了实现对第一收银票据布局的准确、快速分析,优选的,本具体实施方式中对第一收银票据进行布局分析的具体步骤包括:
步骤S211,对第一收银票据进行灰度化、二值化的预处理。经过预处理,第一收银票据会转化为一张黑白两色的图片:文本为白色,背景色为黑色。
步骤S212,在经过预处理的所述第一收银票据所在的平面内建立相互垂直的横轴和纵轴,通过横轴和纵轴的像素投影计算、以像素投影的谷底作为文本边界,并将位于同一行、相邻文本之间的间隔小于间隔阈值的文本划分为一矩形区域,且所述矩形区域的边界与文本边界相同。通过采用上述方法,实现了对所述第一收银票据中的干扰图像,例如直线、虚线、竖线、表格线进行了过滤,并对文本内容进行了分区划块,量化了第一收银票据中有效数据的布局,为后续通过计算找到数据区域提供了可行性。
为了实现自动、准确的获取与所述第一数值域对应的关键字域,优选的,本具体实施方式中从多个所述矩形区域中计算得到与所述第一数值域对应的一第一矩形区域作为关键字域的具体步骤包括:
步骤S231,将每一第一矩形区域与所述第一数值域进行位置向量差计算,得到第一结果。
步骤S232,提供第二收银票据,并进行与所述第一收银票据相同的布局分析,得到多个第二矩形区域。其中,所述第二收银票据与所述待识别的收银票据也具有相同的布局。所述第二收银票据也是从收银系统的打印驱动传输到打印机的过程中截获的图片格式的收银票据。
步骤S233,从所述第二收银票据中选择与所述第一数值域相同的区域作为第二数值域。即对所述第二收银票据也进行与所述第一收银票据相同的步骤S21、S22的操作。
步骤S234,将每一第二矩形区域与所述第二数值域进行位置向量差计算,得到第二结果。
步骤S235,对所述第一结果与所述第二结果进行相似性匹配,对通过匹配的第一矩形区域按与所述第一数值域的距离排序。
步骤S236,选取距离小于一预设值的多个第一矩形区域按照可能性规则进行打分,并选择得分最高的第一矩形区域在第一收银票据中的坐标作为关键字域。
为了实现自动提取待识别的收银票据中的指定信息,并提高指定信息提取、识别的精准度,优选的,根据所述模板中所述关键字域的像素值从所述待识别的收银票据中获取目标关键字域的具体步骤包括:
步骤S251,提取所述模板中所述关键字域的像素值;
步骤S252,根据所述像素值、采用开源计算机视觉库(OpenCV)的相关性算法从所述待识别的收银票据中获取目标关键字域。开源计算机视觉库是一个机遇BSD(BerklySoftware Distribution)许可(开源)发行的跨平台计算机视觉库,实现了图像处理和计算机视觉方面的很多通用算法。开源计算机视觉库的相关性算法是由OpenCV提供的,能在一个图像内找到目标图像的算法。
优选的,根据所述目标关键字域计算出目标数值域的具体步骤包括:
步骤S253,计算所述模板中所述关键字域与所述第一数值域之间的向量差。即第一数值域―关键字域=向量差。
步骤S254,根据所述向量差与所述目标关键字域计算目标数值域。本具体实施方式利用同类收银票据布局相似的原理,在查找到待识别的收银票据中的目标关键字域之后,通过计算即可得到目标数值域,即目标数值域=目标关键字域+向量差,即量化了同类收银票据布局的相似性,并把这种布局相似性注入到模板中,实现了收银票据中指定信息提取的高自动化程度、高效率和高准确度,大幅度降低了人工成本。
不仅如此,本具体实施方式还提供了一种提取收银票据信息的装置,附图3是本发明具体实施方式的提取收银票据指定信息的装置的结构示意图。如图3所示,本具体实施方式提供的提取收银票据指定信息的装置,包括布局分析模块31、选择模块32、关键字域模块33、模板生成模块34、第一处理模块35和第二处理模块36。
所述布局分析模块31,用于对第一收银票据进行布局分析,以将所述第一收银票据按照文本间隔阈值划分为多个第一矩形区域,所述第一收银票据与待识别的收银票据具有相同的布局。由于同一收银台的同类收银票据具有相同的布局,本具体实施方式基于这一规律,采用布局分析模块31先对与待识别的收银票据具有相同布局的第一收银票据进行布局分析,以了解收银票据的整体布局,为后续提取票据中的指定信息奠定基础。本具体实施方式中的第一收银票据、待识别的收银票据均是指从收银系统的打印驱动传输到打印机的过程中截获的图片格式的收银票据。举例来说,附图6是本发明具体实施方式中一收银票据原件结构示意图,附图7是本发明具体实施方式中经过布局分析的收银票据结构示意图。
所述选择模块32,用于从所述第一收银票据中选择一区域作为第一数值域。用户通过所述选择模块32从所述第一收银票据中选择第一数值域的方式,可以是通过一矩形选择区域在所述收银票据中框定来选取。所述第一数值域所在的区域即为用户选择的指定信息区域,用于构建后续模板,以提取待识别收银票据中相应区域的信息。在本具体实施方式中,所述第一数值域中的内容为数字和字母。
所述关键字域模块33,连接所述布局分析模块31、所述选择模块32,用于从多个所述第一矩形区域中计算得到与所述第一数值域对应的一第一矩形区域作为关键字域。本具体实施方式中的关键字域,是指与所述第一数值域中的内容对应的项目的名称,例如第一数值域中的内容为时间、则与其对应的关键字域为“结账时间”或“收银时间”,再例如第一数值域中的内容为总价金额、则与其对应的关键字域为“合计”或“总价”。举例来说,附图8是本发明具体实施方式中收银票据中关键字域和数值域的结构示意图,图8中的矩形方框内的“24.00”即为第一数值域,“合计:”即为关键字域。
所述模板生成模块34,用于根据所述第一数值域、所述关键字域生成模板。所述模板用于后续对待识别的收银票据进行指定信息的提取。由上述过程可以看出,本具体实施方式在构建模板的过程中,依赖于对算法的创新,精简了参数输入,同时把比较、核对、修正等人力工作转变为了自动计算,大幅度减少了对人力的依赖。用户在构建模板的过程中,人工操作的步骤只是选定要提取的指定信息区域,即第一数值域,降低了对上岗人员专业和知识的要求。而且,通过算法自动生成的模板,过程科学,结果准确,大幅度降低了模板修正的发生率;同时,精简的模板,也提高了后续指定信息提取、识别的准确度。
所述第一处理模块35,连接所述模板生成模块34,用于根据所述模板中所述关键字域的像素值从所述待识别的收银票据中获取目标关键字域,并根据所述目标关键字域计算出目标数值域。
所述第二处理模块36,连接所述第一处理模块35,用于对所述目标数值区域进行文本识别,以实现信息提取。由于所述目标数值区域的内容仅仅为数字和字母,因此,在对所述目标数值区域的内容进行识别时,只需要采用针对数字和字母的字库即可,相较于现有技术中采用的通用字库,字库的针对性大大增强,制作字库和识别目标数值区域的效率提高,识别结果的精准度也大大增强。
附图4是本发明具体实施方式的布局分析模块的结构示意图。为了实现对第一收银票据布局的准确、快速分析,优选的,如图4所示,所述布局分析模块31包括预处理单元311和划分单元312;所述预处理单元311,用于对第一收银票据进行灰度化、二值化的预处理。经过预处理,第一收银票据会转化为一张黑白两色的图片:文本为白色,背景色为黑色。所述划分单元312,连接所述预处理单元311,用于在经过预处理的所述第一收银票据所在的平面内建立相互垂直的横轴和纵轴,通过横轴和纵轴的像素投影计算、以像素投影的谷底作为文本边界,并将位于同一行、相邻文本之间的间隔小于间隔阈值的文本划分为一矩形区域,且所述矩形区域的边界与文本边界相同。通过上述处理,实现了对所述第一收银票据中的干扰图像,例如直线、虚线、竖线、表格线进行了过滤,并对文本内容进行了分区划块,量化了第一收银票据中有效数据的布局,为后续通过计算找到数据区域提供了可行性。
附图5是本发明具体实施方式的关键字域模块的结构示意图。为了实现自动、准确的获取与所述第一数值域对应的关键字域,优选的,如图5所示,所述关键字域模块33包括计算单元331、匹配单元332和打分单元333。所述计算单元331,用于将每一第一矩形区域与所述第一数值域进行位置向量差计算,得到第一结果。所述布局分析模块31还用于对一第二收银票据进行与所述第一收银票据相同的布局分析,得到多个第二矩形区域。其中,所述第二收银票据与所述待识别的收银票据也具有相同的布局。所述第二收银票据也是从收银系统的打印驱动传输到打印机的过程中截获的图片格式的收银票据。所述选择模块32还用于从所述第二收银票据中选择与所述第一数值域相同的区域作为第二数值域。所述计算单元331还用于将每一第二矩形区域与所述第二数值域进行位置向量差计算,得到第二结果;所述匹配单元332,连接所述计算单元331,用于对所述第一结果与所述第二结果进行相似性匹配,对通过匹配的第一矩形区域按与所述第一数值域的距离排序;所述打分单元333,连接所述匹配单元332,用于选取距离小于一预设值的多个第一矩形区域按照可能性规则进行打分,并选择得分最高的第一矩形区域在第一收银票据中的坐标作为关键字域。
为了实现自动提取待识别的收银票据中的指定信息,并提高指定信息提取、识别的精准度,优选的,所述第一处理模块35包括第一获取单元和第二获取单元;所述第一获取单元,用于提取所述模板中所述关键字域的像素值;所述第二获取单元,连接所述第一获取单元,用于根据所述像素值、采用开源计算机视觉库(OpenCV)的相关性算法从所述待识别的收银票据中获取目标关键字域。开源计算机视觉库是一个机遇BSD(Berkly SoftwareDistribution)许可(开源)发行的跨平台计算机视觉库,实现了图像处理和计算机视觉方面的很多通用算法。开源计算机视觉库的相关性算法是由OpenCV提供的,能在一个图像内找到目标图像的算法。
优选的,所述第二处理模块36包括第一分析单元和第二分析单元;所述第一分析单元,用于计算所述模板中所述关键字域与所述第一数值域之间的向量差,即第一数值域―关键字域=向量差;所述第二分析单元,连接所述第一分析单元,用于根据所述向量差与所述目标关键字域计算目标数值域。本具体实施方式利用同类收银票据布局相似的原理,在查找到待识别的收银票据中的目标关键字域之后,通过计算即可得到目标数值域,即目标数值域=目标关键字域+向量差,即量化了同类收银票据布局的相似性,并把这种布局相似性注入到模板中,实现了收银票据中指定信息提取的高自动化程度、高效率和高准确度,大幅度降低了人工成本。
本具体实施方式提供的提取收银票据指定信息的方法和装置,基于同类收银票据具有相同布局的原理,可以根据用户要获取的数据类型建立特定模板,精简了参数的输入,减少了计算量,缩短了数据提取时间,满足了数据提取实时性的要求;同时,由于模板精简、计算过程简单直接,最后需要进行文本识别的模板数值域被锁定,识别所需要的字库针对性较强,采用针对数字和字母的字库即可,识别效率和精准度都有了较大提升。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (8)
1.一种提取收银票据信息的方法,其特征在于,包括如下步骤:
对第一收银票据进行布局分析,以将所述第一收银票据按照文本间隔阈值划分为多个第一矩形区域,所述第一收银票据与待识别的收银票据具有相同的布局;
从所述第一收银票据中选择一区域作为第一数值域;
将每一第一矩形区域与所述第一数值域进行位置向量差计算,得到第一结果;
提供第二收银票据,并进行与所述第一收银票据相同的布局分析,得到多个第二矩形区域;
从所述第二收银票据中选择与所述第一数值域相同的区域作为第二数值域;
将每一第二矩形区域与所述第二数值域进行位置向量差计算,得到第二结果;
对所述第一结果与所述第二结果进行相似性匹配,对通过匹配的第一矩形区域按与所述第一数值域的距离排序;
选取距离小于一预设值的多个第一矩形区域按照可能性规则进行打分,并选择得分最高的第一矩形区域在第一收银票据中的坐标作为关键字域;
根据所述第一数值域、所述关键字域生成模板;
根据所述模板中所述关键字域的像素值从所述待识别的收银票据中获取目标关键字域,并根据所述目标关键字域计算出目标数值域;
对所述目标数值域进行文本识别,以实现信息提取。
2.根据权利要求1所述的提取收银票据信息的方法,其特征在于,对第一收银票据进行布局分析的具体步骤包括:
对第一收银票据进行灰度化、二值化的预处理;
在经过预处理的所述第一收银票据所在的平面内建立相互垂直的横轴和纵轴,通过横轴和纵轴的像素投影计算、以像素投影的谷底作为文本边界,并将位于同一行、相邻文本之间的间隔小于间隔阈值的文本划分为一第一矩形区域,且所述第一矩形区域的边界与文本边界相同。
3.根据权利要求1所述的提取收银票据信息的方法,其特征在于,根据所述模板中所述关键字域的像素值从所述待识别的收银票据中获取目标关键字域的具体步骤包括:
提取所述模板中所述关键字域的像素值;
根据所述像素值、采用开源计算机视觉库的相关性算法从所述待识别的收银票据中获取目标关键字域。
4.根据权利要求1所述的提取收银票据信息的方法,其特征在于,根据所述目标关键字域计算出目标数值域的具体步骤包括:
计算所述模板中所述关键字域与所述第一数值域之间的向量差;
根据所述向量差与所述目标关键字域计算目标数值域。
5.一种提取收银票据信息的装置,其特征在于,包括:
布局分析模块,用于对第一收银票据进行布局分析,以将所述第一收银票据按照文本间隔阈值划分为多个第一矩形区域,所述第一收银票据与待识别的收银票据具有相同的布局;
选择模块,用于从所述第一收银票据中选择一区域作为第一数值域;
关键字域模块,连接所述布局分析模块、所述选择模块,所述关键字域模块包括计算单元、匹配单元和打分单元;所述计算单元,用于将每一第一矩形区域与所述第一数值域进行位置向量差计算,得到第一结果;所述布局分析模块还用于对一第二收银票据进行与所述第一收银票据相同的布局分析,得到多个第二矩形区域;所述选择模块还用于从所述第二收银票据中选择与所述第一数值域相同的区域作为第二数值域;所述计算单元还用于将每一第二矩形区域与所述第二数值域进行位置向量差计算,得到第二结果;所述匹配单元,连接所述计算单元,用于对所述第一结果与所述第二结果进行相似性匹配,对通过匹配的第一矩形区域按与所述第一数值域的距离排序;所述打分单元,连接所述匹配单元,用于选取距离小于一预设值的多个第一矩形区域按照可能性规则进行打分,并选择得分最高的第一矩形区域在第一收银票据中的坐标作为关键字域;
模板生成模块,用于根据所述第一数值域、所述关键字域生成模板;
第一处理模块,连接所述模板生成模块,用于根据所述模板中所述关键字域的像素值从所述待识别的收银票据中获取目标关键字域,并根据所述目标关键字域计算出目标数值域;
第二处理模块,连接所述第一处理模块,用于对所述目标数值区域进行文本识别,以实现信息提取。
6.根据权利要求5所述的提取收银票据信息的装置,其特征在于,所述布局分析模块包括预处理单元和划分单元;所述预处理单元,用于对第一收银票据进行灰度化、二值化的预处理;所述划分单元,连接所述预处理单元,用于在经过预处理的所述第一收银票据所在的平面内建立相互垂直的横轴和纵轴,通过横轴和纵轴的像素投影计算、以像素投影的谷底作为文本边界,并将位于同一行、相邻文本之间的间隔小于间隔阈值的文本划分为一矩形区域,且所述矩形区域的边界与文本边界相同。
7.根据权利要求5所述的提取收银票据信息的装置,其特征在于,所述第一处理模块包括第一获取单元和第二获取单元;所述第一获取单元,用于提取所述模板中所述关键字域的像素值;所述第二获取单元,连接所述第一获取单元,用于根据所述像素值、采用开源计算机视觉库的相关性算法从所述待识别的收银票据中获取目标关键字域。
8.根据权利要求5所述的提取收银票据信息的装置,其特征在于,所述第二处理模块包括第一分析单元和第二分析单元;所述第一分析单元,用于计算所述模板中所述关键字域与所述第一数值域之间的向量差;所述第二分析单元,连接所述第一分析单元,用于根据所述向量差与所述目标关键字域计算目标数值域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711292314.3A CN107808154B (zh) | 2017-12-08 | 2017-12-08 | 提取收银票据信息的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711292314.3A CN107808154B (zh) | 2017-12-08 | 2017-12-08 | 提取收银票据信息的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107808154A CN107808154A (zh) | 2018-03-16 |
CN107808154B true CN107808154B (zh) | 2021-03-30 |
Family
ID=61579319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711292314.3A Active CN107808154B (zh) | 2017-12-08 | 2017-12-08 | 提取收银票据信息的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107808154B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107808154B (zh) * | 2017-12-08 | 2021-03-30 | 上海慧银信息科技有限公司 | 提取收银票据信息的方法和装置 |
CN109255300B (zh) * | 2018-08-14 | 2023-12-01 | 中国平安财产保险股份有限公司 | 票据信息提取方法、装置、计算机设备及存储介质 |
CN109271980A (zh) * | 2018-08-28 | 2019-01-25 | 上海萃舟智能科技有限公司 | 一种车辆铭牌全信息识别方法、系统、终端及介质 |
CN109829461A (zh) * | 2019-01-04 | 2019-05-31 | 北京城市网邻信息技术有限公司 | 一种检测图像中内容字段的方法、装置、设备及存储介质 |
CN110956739A (zh) | 2019-05-09 | 2020-04-03 | 杭州睿琪软件有限公司 | 一种票据识别方法及装置 |
CN110413659B (zh) * | 2019-07-29 | 2023-06-02 | 南京沁恒微电子股份有限公司 | 通用购物小票数据精准提取方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101447017A (zh) * | 2008-11-27 | 2009-06-03 | 浙江工业大学 | 一种基于版面分析的选票快速识别统计方法及系统 |
CN101464951A (zh) * | 2007-12-21 | 2009-06-24 | 北大方正集团有限公司 | 图像识别方法及系统 |
CN101520783A (zh) * | 2008-02-29 | 2009-09-02 | 富士通株式会社 | 基于图像内容的关键词搜索方法和装置 |
CN101685498A (zh) * | 2008-06-20 | 2010-03-31 | 富士通先端科技株式会社 | 帐票识别装置、方法、数据库生成装置、方法以及程序 |
CN102737242A (zh) * | 2012-06-12 | 2012-10-17 | 丰豪盈彩(北京)科技有限公司 | 应用于移动终端的票据自动识别方法和系统 |
CN102968638A (zh) * | 2011-08-31 | 2013-03-13 | 上海夏尔软件有限公司 | 基于关键字光学字符识别的影像清晰度判断的方法 |
CN103034848A (zh) * | 2012-12-19 | 2013-04-10 | 方正国际软件有限公司 | 一种表单类型的识别方法 |
CN105654072A (zh) * | 2016-03-24 | 2016-06-08 | 哈尔滨工业大学 | 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法 |
CN107808154A (zh) * | 2017-12-08 | 2018-03-16 | 上海慧银信息科技有限公司 | 提取收银票据信息的方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100306080A1 (en) * | 2008-10-08 | 2010-12-02 | Trandal David S | Methods and systems for receipt management and price comparison |
US20150161704A1 (en) * | 2013-12-10 | 2015-06-11 | Yahoo!Inc. | Crowdsourcing retail price and location method and system |
-
2017
- 2017-12-08 CN CN201711292314.3A patent/CN107808154B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101464951A (zh) * | 2007-12-21 | 2009-06-24 | 北大方正集团有限公司 | 图像识别方法及系统 |
CN101520783A (zh) * | 2008-02-29 | 2009-09-02 | 富士通株式会社 | 基于图像内容的关键词搜索方法和装置 |
CN101685498A (zh) * | 2008-06-20 | 2010-03-31 | 富士通先端科技株式会社 | 帐票识别装置、方法、数据库生成装置、方法以及程序 |
CN101447017A (zh) * | 2008-11-27 | 2009-06-03 | 浙江工业大学 | 一种基于版面分析的选票快速识别统计方法及系统 |
CN102968638A (zh) * | 2011-08-31 | 2013-03-13 | 上海夏尔软件有限公司 | 基于关键字光学字符识别的影像清晰度判断的方法 |
CN102737242A (zh) * | 2012-06-12 | 2012-10-17 | 丰豪盈彩(北京)科技有限公司 | 应用于移动终端的票据自动识别方法和系统 |
CN103034848A (zh) * | 2012-12-19 | 2013-04-10 | 方正国际软件有限公司 | 一种表单类型的识别方法 |
CN105654072A (zh) * | 2016-03-24 | 2016-06-08 | 哈尔滨工业大学 | 一种低分辨率医疗票据图像的文字自动提取和识别系统与方法 |
CN107808154A (zh) * | 2017-12-08 | 2018-03-16 | 上海慧银信息科技有限公司 | 提取收银票据信息的方法和装置 |
Non-Patent Citations (1)
Title |
---|
"基于投影的文本图像版面分割算法研究";魏传义等;《图形图像》;20160430;第33-38页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107808154A (zh) | 2018-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107808154B (zh) | 提取收银票据信息的方法和装置 | |
WO2019238063A1 (zh) | 文本检测分析方法、装置及设备 | |
CN111489487B (zh) | 票据识别方法、装置、设备和存储介质 | |
JP2017084336A (ja) | 画像化された文書からテキストを抽出する方法及び装置 | |
JP2014232533A (ja) | Ocr出力検証システム及び方法 | |
JP2005242579A (ja) | 文書処理装置、文書処理方法、および文書処理プログラム | |
CN110070081A (zh) | 自动信息录入方法、装置、存储介质及电子设备 | |
CN106874901B (zh) | 一种行驶证识别方法及装置 | |
CN109740417B (zh) | 发票类型识别方法、装置、存储介质和计算机设备 | |
JP2016048444A (ja) | 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法 | |
US20220292861A1 (en) | Docket Analysis Methods and Systems | |
CN110569856A (zh) | 样本标注方法及装置、损伤类别的识别方法及装置 | |
CN113569863B (zh) | 一种单据稽查的方法、系统、电子设备及存储介质 | |
CN114359553B (zh) | 一种基于物联网的签章定位方法、系统及存储介质 | |
CN109388935A (zh) | 单证验证方法及装置、电子设备及可读存储介质 | |
CN112395995A (zh) | 一种根据移动财务票据自动填单及审核的方法及系统 | |
CN113887484A (zh) | 一种卡片式文件图像识别方法和装置 | |
CN108921006B (zh) | 手写签名图像真伪鉴别模型建立方法及真伪鉴别方法 | |
CN108090728B (zh) | 一种基于智能终端的快递信息录入方法及录入系统 | |
CN104899551B (zh) | 一种表单图像分类方法 | |
CN113673528A (zh) | 文本处理方法、装置、电子设备和可读存储介质 | |
CN111199240A (zh) | 银行卡识别模型的训练方法、银行卡识别方法以及装置 | |
CN109544134B (zh) | 便捷支付服务方法和系统 | |
CN110764721A (zh) | 模板生成方法、装置、电子设备和计算机可读介质 | |
CN116110066A (zh) | 票据文本的信息提取方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |