CN108734849A - 一种自动化发票验真方法及系统 - Google Patents

一种自动化发票验真方法及系统 Download PDF

Info

Publication number
CN108734849A
CN108734849A CN201810375901.7A CN201810375901A CN108734849A CN 108734849 A CN108734849 A CN 108734849A CN 201810375901 A CN201810375901 A CN 201810375901A CN 108734849 A CN108734849 A CN 108734849A
Authority
CN
China
Prior art keywords
invoice
picture
original image
subgraph
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810375901.7A
Other languages
English (en)
Other versions
CN108734849B (zh
Inventor
郝双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sina Technology China Co Ltd
Original Assignee
Sina Technology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sina Technology China Co Ltd filed Critical Sina Technology China Co Ltd
Priority to CN201810375901.7A priority Critical patent/CN108734849B/zh
Publication of CN108734849A publication Critical patent/CN108734849A/zh
Application granted granted Critical
Publication of CN108734849B publication Critical patent/CN108734849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D7/00Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
    • G07D7/20Testing patterns thereon
    • G07D7/2016Testing patterns thereon using feature extraction, e.g. segmentation, edge detection or Hough-transformation
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07DHANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
    • G07D7/00Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
    • G07D7/20Testing patterns thereon

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明实施例提供一种自动化发票验真方法及系统,包括获取待验证发票的原始图像;提取原始图像上具有固定位置的特定标识的参数信息;根据参数信息,对原始图像进行粗分割,得到右上子图和右下子图;通过版面分析,得到发票四要素的区域坐标;根据区域坐标,从原始图像上截取四要素子图;调用OCR引擎,通过OCR引擎分别对四要素子图进行光学字符识别,得到四要素信息;将四要素信息发送至税务接口,对所述待验证发票进行真假验证。本发明通过以原始图像上具有固定位置的特定标识为基准,可准确确定四要素子图;进而通过OCR引擎分别对四要素子图进行OCR识别,从而可得到对应的四要素信息,则识别信息与类型匹配,进而可验证待验证发票的真假。

Description

一种自动化发票验真方法及系统
技术领域
本发明涉及发票识别技术领域,特别是涉及一种自动化发票验真方法及系统。
背景技术
在财务人员进行财务报销的过程中,发票验真是一项重要环节,通过发票验真,可以有效识别真假发票,避免因假发票造成财务损失。对于发票验真,需要向税务机构提供“发票代码”,“发票号码”,“税前金额”,“开票日期”这4个要素内容(以下简称四要素),这4项内容在发票票面上均有提供。
原始的验真方法就是财务人员手动输入相应的内容到税务机构提供的验真接口(简称税务接口)中进行核验,这种方法效率低,手工输入容易出错,耗时费力,随着国家三网合一政策的推进,很难满足当前大量发票的验真需求。
为了解决手动输入效率低的问题,有的技术人员提出了对票面进行OCR(OpticalCharacter Recognition,光学字符识别)方法代替人工输入,但是仅通过OCR技术并不能很好的解决发票验真的实际问题。
发票的票面上,最多的是数字信息,比如图2所示,左上角的“1100172320”,应用OCR技术只能知道数字是什么,但是无法判定该数字究竟是发票代码还是发票号码。另外,观察票面,还可以发现,除了四要素之外还有其他位置也有文字/数字信息,使用哪些信息,不使用哪些信息也是仅靠OCR解析无法做到的。
现有技术对发票进行全票面OCR识别,识别结果以文字串形式给出,只有识别内容,没有该内容对应的位置信息,导致无法判定识别结果属于什么类别(是发票代码还是发票号码?是开票日期还是其他项目?)。如“3571”这4个数字,既有可能是发票号码,也有可能是税前金额。
如果只有识别结果,但是无法判定该结果属于什么内容的话,则不能将识别结果按照正确的应有类别输入给税务接口。
如果仍然希望能够将识别结果按照其正确的应有类别提供给税务接口,则需要引入人工比对工作。引入人工则带来一个新的问题,就是人工比对效率不能像机器一样始终保持高效稳定,受人工主观因素影响较大,并且人力成本也是不可忽视的一项开销。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有的OCR技术无法准确确定识别信息的类型,类型的确定需要人工干预,导致验证效率比较低。
发明内容
本发明实施例提供一种自动化发票验真方法及系统,可准确确定待验证发票上的四要素信息。
一方面,本发明实施例提供了一种自动化发票验真方法,包括:
一种自动化发票验真方法,包括:
获取待验证发票的原始图像;
提取所述原始图像上具有固定位置的特定标识的参数信息;所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度;
根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图;所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额;
分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,所述四要素包括发票代码、发票号码、开票日期及税前金额;
根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图;
调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息;
将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
可选的,所述提取所述原始图像上具有固定位置的特定标识的参数信息,具体包括:
对所述原始图像进行R、G、B三通道分离,得到对应的R通道图片、G通道图片及B通道图片;
根据所述R通道图片、G通道图片及B通道图片,从原始图像中提取图片红色信息,得到红色信息图;
按照设定比例,分别对所述红色信息图、R通道图片、G通道图片及B通道图片进行截取,获得对应的部分红色信息图、部分R通道图片、部分G通道图片及部分B通道图片;
根据所述部分R通道图片、部分G通道图片及部分B通道图片,在所述部分红色信息图中确定特定标识区域;
根据所述特定标识区域,确定所述特定标识的位置边界点坐标、宽度及高度。
可选的,所述根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图,具体包括:
根据所述特定标识的位置边界点坐标、宽度及高度,分别确定所述右上子图和右下子图的边界点坐标;
根据所述右上子图的边界点坐标,对所述原始图像进行截取,得到右上子图;以及根据所述右下子图的边界点坐标,对所述原始图像进行截取,得到右下子图。
可选的,所述分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,具体包括:
对所述右上子图做蓝色二值化处理,得到第一蓝色二值化图像;
对所述第一蓝色二值化图像进行行投影,得到第一行投影图;其中,第一分割线位于所述第一行投影图中第一行与第二行之间,第二分割线位于所述第一行投影图像中第二行与第三行之间;
对所述第一蓝色二值化图像进行列投影,得到第一列投影图;第三分割线位于所述第一列投影图中最宽波谷处的中心;
根据所述第一分割线、第二分割线及第三分割线,对所述第一蓝色二值化图像进行分割,得到一个发票代码、两个发票号码及一个开票日期的区域坐标;
对所述右下子图做蓝色二值化处理,得到第二蓝色二值化图像;
对所述第二蓝色二值化图像进行行投影,得到第二行投影图,从所述第二行投影图中选择最宽的一行;
对所述第二蓝色二值化图像进行列投影,得到第二列投影图;其中,第四分割线位于所述第二列投影图中最宽波谷处的中心;
根据选择的最宽的一行及第四分割线,对所述第二蓝色二值化图像进行分割,得到税前金额的区域坐标。
另一方面,本发明实施例提供了一种自动化发票验真系统,包括:
获取单元,用于获取待验证发票的原始图像;
提取单元,用于提取所述原始图像上具有固定位置的特定标识的参数信息;所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度;
分割单元,用于根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图;所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额;
分析单元,用于分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,所述四要素包括发票代码、发票号码、开票日期及税前金额;
截取单元,用于根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图;
识别单元,用于调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息;
验证单元,用于将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
可选的,所述提取单元包括:
通道分离模块,用于对所述原始图像进行R、G、B三通道分离,得到对应的R通道图片、G通道图片及B通道图片;
信息提取模块,用于根据所述R通道图片、G通道图片及B通道图片,从原始图像中提取图片红色信息,得到红色信息图;
部分截取模块,用于按照设定比例,分别对所述红色信息图、R通道图片、G通道图片及B通道图片进行截取,获得对应的部分红色信息图、部分R通道图片、部分G通道图片及部分B通道图片;
区域确定模块,用于根据所述部分R通道图片、部分G通道图片及部分B通道图片,在所述部分红色信息图中确定特定标识区域;
参数确定模块,用于根据所述特定标识区域,确定所述特定标识的位置边界点坐标、宽度及高度。
可选的,所述分割单元包括:
坐标确定模块,用于根据所述特定标识的位置边界点坐标、宽度及高度,分别确定所述右上子图和右下子图的边界点坐标;
子图截图模块,用于根据所述右上子图的边界点坐标,对所述原始图像进行截取,得到右上子图;以及根据所述右下子图的边界点坐标,对所述原始图像进行截取,得到右下子图。
可选的,所述分析单元包括:
第一处理模块,用于对所述右上子图做蓝色二值化处理,得到第一蓝色二值化图像;
第一行投影模块,用于对所述第一蓝色二值化图像进行行投影,得到第一行投影图;其中,第一分割线位于所述第一行投影图中第一行与第二行之间,第二分割线位于所述第一行投影图像中第二行与第三行之间;
第一列投影模块,用于对所述第一蓝色二值化图像进行列投影,得到第一列投影图;第三分割线位于所述第一列投影图中最宽波谷处的中心;
第一分割模块,用于根据所述第一分割线、第二分割线及第三分割线,对所述第一蓝色二值化图像进行分割,得到一个发票代码、两个发票号码及一个开票日期的区域坐标;
第二处理模块,用于对所述右下子图做蓝色二值化处理,得到第二蓝色二值化图像;
第二行投影模块,用于对所述第二蓝色二值化图像进行行投影,得到第二行投影图,从所述第二行投影图中选择最宽的一行;
第二列投影模块,用于对所述第二蓝色二值化图像进行列投影,得到第二列投影图;其中,第四分割线位于所述第二列投影图中最宽波谷处的中心;
第二分割模块,用于根据选择的最宽的一行及第四分割线,对所述第二蓝色二值化图像进行分割,得到税前金额的区域坐标。
另一方面,本发明实施例提供了一种自动化发票验真系统,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取待验证发票的原始图像;
提取所述原始图像上具有固定位置的特定标识的参数信息;所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度;
根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图;所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额;
分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,所述四要素包括发票代码、发票号码、开票日期及税前金额;
根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图;
调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息;
将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
另一方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取待验证发票的原始图像;
提取所述原始图像上具有固定位置的特定标识的参数信息;所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度;
根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图;所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额;
分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,所述四要素包括发票代码、发票号码、开票日期及税前金额;
根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图;
调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息;
将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
上述技术方案具有如下有益效果:
本发明通过以原始图像上具有固定位置的特定标识为基准,可准确确定关于发票代码、发票号码及开票日期及税前金额的四要素子图;进而通过OCR引擎分别对四要素子图进行OCR识别,从而可得到对应的四要素信息,将识别信息与类型匹配,进而可通过税务接口验证待验证发票的真假,准确可靠;避免人工干预,提高自动化、智能化程度,提高识别效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明自动化发票验真方法的流程图;
图2为发票的扫描图;
图3为在图2中所示的扫描图中固定红章的标记图;
图4为固定红章图像区域示意图;
图5为右上子图;
图6为右下子图;
图7为行投影指示图;
图8为第一分割线示意图;
图9为第二分割线示意图;
图10为第三分割线示意图;
图11为四要素在发票中的区域指示图;
图12为OCR引擎识别示意图;
图13为本发明自动化发票验真系统的模块结构示意图。
符号说明:
获取单元—1,提取单元—2,分割单元—3,分析单元—4,截取单元—5,识别单元—6,验证单元—7。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种自动化发票验真方法,通过以原始图像上具有固定位置的特定标识为基准,可准确确定关于发票代码、发票号码及开票日期及税前金额的四要素子图;进而通过OCR引擎分别对四要素子图进行OCR识别,从而可得到对应的四要素信息,将识别信息与类型匹配,进而可通过税务接口验证待验证发票的真假,准确可靠;避免人工干预,提高自动化、智能化程度,提高识别效率。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明自动化发票验真方法包括:
步骤100:获取待验证发票的原始图像。
步骤200:提取所述原始图像上具有固定位置的特定标识的参数信息。
所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度。
步骤300:根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图。
所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额。
步骤400:分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标。
其中,所述四要素包括发票代码、发票号码、开票日期及税前金额。
步骤500:根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图。
步骤600:调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息。
步骤700:将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
其中,在步骤100中,所述待验证发票的原始图像可为电子发票,或者通过对待验证发票扫描、拍照等获得的发票图片。
在本实施例中,所述特定标识为固定红章,所述固定红章为由政府机关扣盖在发票上的红章,且固定红章在发票上的位置固定。则所述固定红章的参数信息包括所述固定红章的位置边界点坐标、宽度及高度。
其中,在增值税普通发票上,通常有两种红章,第一种是固定红章,在发票上的位置固定,在发票上方居中,可通过印刷在纸质票面上,或者直接生成在电子发票上。第二种是不固定红章,盖章位置在发票上不确定,可能出现在票面的任意位置,一般由开票单位盖章(如图3所示)。
在步骤200中,所述提取所述原始图像上具有固定位置的特定标识的参数信息,具体包括:
步骤201:对所述原始图像进行R、G、B三通道分离,得到对应的R通道图片、G通道图片及B通道图片;
步骤202:根据所述R通道图片、G通道图片及B通道图片,从原始图像中提取图片红色信息,得到红色信息图;
步骤203:按照设定比例,分别对所述红色信息图、R通道图片、G通道图片及B通道图片进行截取,获得对应的部分红色信息图、部分R通道图片、部分G通道图片及部分B通道图片;
步骤204:根据所述部分R通道图片、部分G通道图片及部分B通道图片,在所述部分红色信息图中确定特定标识区域;
步骤205:根据所述特定标识区域,确定所述特定标识的位置边界点坐标、宽度及高度。
以固定红章为例,在步骤202中,根据所述R通道图片、G通道图片及B通道图片,从原始图像中提取图片红色信息,得到红色信息图,具体包括:
步骤202a:根据R通道图片、G通道图片及B通道图片,确定红色分量同时大于蓝色分量和绿色分量的像素点,多个像素点构成第一红色蒙版mask:
imgRi>imgBi&imgRi>imgGi (公式1);
其中,i表示像素点序号,i=1,2,...,I,I表示像素点的数量,imgRi表示R通道图片imgR中第i像素点的红色分量,imgBi表示B通道图片imgB中第i像素点的蓝色分量,imgGi表示G通道图片imgG中第i像素点的绿色分量。
步骤202b:蒙版运算,即在原始图像上,将不属于红色蒙版的像素点置为(0,0,0),对属于第一红色蒙版的像素点按原始像素值保留,得到红色信息图。
在步骤203中:设定比例为三分之一,按照设定比例,分别对所述红色信息图IMGR、R通道图片imgR、G通道图片imgG及B通道图片imgB进行截取,获得对应的部分红色信息图IMGR_3、部分R通道图片imgR_3、部分G通道图片imgG_3及部分B通道图片imgB_3。
在步骤204中,根据所述部分R通道图片、部分G通道图片及部分B通道图片,在所述部分红色信息图中确定特定标识区域,具体包括:
步骤204a:根据所述部分R通道图片、部分G通道图片及部分B通道图片,确定红色分量大于蓝色分量与绿色分量之和的设定倍数的像素点,多个像素点构成第二红色蒙版maskstamp。
设定倍数以0.8倍为例,imgRi_3>(imgBi_3+imgGi_3)*0.8 (公式2);
其中,imgRi_3表示部分R通道图片imgR_3中第i像素点的红色分量,imgBi_3表示部分B通道图片imgB_3中第i像素点的蓝色分量,imgGi_3表示部分G通道图片imgG_3中第i像素点的绿色分量。
步骤204b:蒙版运算,即在部分红色信息图IMGR_3上,将不属于第二红色蒙版的像素点置为(0,0,0),对属于第二红色蒙版的像素点置为(1,1,1)。
步骤204c:对蒙版运算后的图像进行连通域标记,选择面积第二大的区域为特定标识区域,即固定红章图像区域stamp_only(如图4所示)。
在步骤205中,根据所述特定标识区域,确定所述特定标识的位置边界点坐标、宽度及高度,具体包括:
步骤205a:根据公式3至公式6,确定所述特定标识的位置边界点坐标:
左点位置stamp_left:stamp_left=min(stamp_only[1]) (公式3);
其中,[1]表示X轴方向,min(stamp_only[1])表示stamp_only中最左侧点坐标,X轴方向的最小值。
右点位置stamp_right:stamp_right=max(stamp_only[1]) (公式4);
其中,max(stamp_only[1])表示stamp_only中最右侧点坐标,X轴方向的最大值。
上点位置stamp_top:stamp_top=min(stamp_only[0]) (公式5);
其中,[0]表示Y轴方向,min(stamp_only[0])表示stamp_only中最上边点坐标,Y轴方向的最小值。
下点位置stamp_bottom:stamp_bottom=max(stamp_only[0]) (公式6);
其中,max(stamp_only[0])表示stamp_only中最下边点坐标,Y轴方向的最大值。
步骤205b:根据公式7,确定所述特定标识的宽度stamp_width:
stamp_width=stamp_right-stamp_left (公式7)。
步骤205c:根据公式8,确定所述特定标识的宽度stamp_height:
stamp_height=stamp_bottom-stamp_top (公式8)。
在步骤300中,所述根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图,具体包括:
步骤301:根据所述特定标识的位置边界点坐标、宽度及高度,分别确定所述右上子图和右下子图的边界点坐标。
步骤302:根据所述右上子图的边界点坐标,对所述原始图像进行截取,得到右上子图;以及根据所述右下子图的边界点坐标,对所述原始图像进行截取,得到右下子图。
在步骤301中,根据公式9至公式12确定所述右上子图的边界点坐标:
1=stamp_width/ratio11+stamp_right, (公式9);
1=stamp_width/ratio12+stamp_right (公式10);
1=0 (公式11);
1:stamp_height/ratio13+stamp_bottom (公式12);
其中,ratio11、ratio12、ratio13分别表示比例。在本实施例中,ratio11=1.15,ratio12=0.33,ratio13=7。
根据公式13至公式16确定所述右下子图的边界点坐标:
2=stamp_width/2+stamp_right (公式13);
2=stamp_width/ratio21+stamp_right (公式14);
2=stamp_width/2 (公式15);
2=stamp_height/ratio22+stamp_bottom (公式16);
其中,ratio21、ratio22分别表示比例。在本实施例中,ratio21=0.33,ratio22=0.28。
在步骤302中,根据(左1,右1,上1,下1),对所述原始图像进行截取,得到右上子图(如图5所示);根据(左2,右2,上2,下2),对所述原始图像进行截取,得到右下子图(如图6所示)。
在步骤400,所述分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,具体包括:
步骤401:对所述右上子图做蓝色二值化处理,得到第一蓝色二值化图像。
其中,对所述右上子图做蓝色二值化处理,具体包括:
步骤401a:对所述右上子图做白平衡处理,可解决光照不均色温干扰问题;
步骤401b:对白平衡后图像做局部均值二值化处理(sauvola算法),去掉背景;
步骤401c:对去背景后图片提取蓝色信息,置蓝色分量同时大于绿色和红色分量的像素值为1,其余像素值为0,得到第一蓝色二值化图像。
步骤402:对所述第一蓝色二值化图像进行行投影(按照如图7中箭头所示方向投影),得到第一行投影图;其中,第一分割线位于所述第一行投影图中第一行与第二行之间(如图8中所示的白色线条),第二分割线位于所述第一行投影图像中第二行与第三行之间(如图9中所示的白色线条)。
步骤403:对所述第一蓝色二值化图像进行列投影,得到第一列投影图;第三分割线位于所述第一列投影图中最宽波谷处的中心(如图10中所示的白色线条)。
步骤404:根据所述第一分割线、第二分割线及第三分割线,对所述第一蓝色二值化图像进行分割,得到一个发票代码、两个发票号码及一个开票日期的区域坐标。
步骤405:对所述右下子图做蓝色二值化处理,得到第二蓝色二值化图像。其中,蓝色二值化处理的具体步骤与步骤401相同,在此不再赘述。
步骤406:对所述第二蓝色二值化图像进行行投影,得到第二行投影图,从所述第二行投影图中选择最宽的一行。
步骤407:对所述第二蓝色二值化图像进行列投影,得到第二列投影图;其中,第四分割线位于所述第二列投影图中最宽波谷处的中心。
步骤408:根据选择的最宽的一行及第四分割线,对所述第二蓝色二值化图像进行分割,得到税前金额的区域坐标(如图11所示)。
此外,由于发票左上角的发票代码是直接印刷在票面上的,所以其与固定红章的相对位置和相对大小为固定值,随固定红章的各项数据等比例变化,不需要截取子图可直接计算。具体可通过公式17至公式20,确定左上角的发票代码的位置区域(如图11所示):
3=stamp_left-stamp_width/ratio31 (公式17);
3=stamp_left-stamp_width/ratio32 (公式18);
3=stamp_x-stamp_height/2 (公式19);
3=stamp_x (公式20);
其中,ratio31、ratio32分别表示比例,在本实施例中,ratio31=1.15,ratio32=0.45。
如图12所示,通过OCR识别引擎,分别对四要素子图进行光学字符识别,得到对应的四要素信息,进而将四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
本发明以发票上方固定红章为基准,对票面进行粗分割(右上子图和右下字图)和细分割(四要素子图)两步分析,能够准确定位四要素位置,在得到四要素位置的前提下,执行OCR识别,可以将识别结果与其所属类别对应,并且完全自动化处理,不需要人工干预,大大提高识别效率,降低人力成本。
此外,本发明还提供一种自动化发票验真系统,如图13所示,本发明自动化发票验真系统包括获取单元1、提取单元2、分割单元3、分析单元4、截取单元5、识别单元6及验证单元7。
所述获取单元1用于获取待验证发票的原始图像。
所述提取单元2用于提取所述原始图像上具有固定位置的特定标识的参数信息。所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度。
所述分割单元3用于根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图。所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额。
所述分析单元4用于分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标。所述四要素包括发票代码、发票号码、开票日期及税前金额。
所述截取单元5用于根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图。
所述识别单元6用于调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息。
所述验证单元7用于将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
进一步地,所述提取单元2包括通道分离模块、信息提取模块、部分截取模块、区域确定模块及参数确定模块。
所述通道分离模块用于对所述原始图像进行R、G、B三通道分离,得到对应的R通道图片、G通道图片及B通道图片。
所述信息提取模块用于根据所述R通道图片、G通道图片及B通道图片,从原始图像中提取图片红色信息,得到红色信息图。
所述部分截取模块用于按照设定比例,分别对所述红色信息图、R通道图片、G通道图片及B通道图片进行截取,获得对应的部分红色信息图、部分R通道图片、部分G通道图片及部分B通道图片。
所述区域确定模块用于根据所述部分R通道图片、部分G通道图片及部分B通道图片,在所述部分红色信息图中确定特定标识区域。
所述参数确定模块用于根据所述特定标识区域,确定所述特定标识的位置边界点坐标、宽度及高度。
所述分割单元3包括坐标确定模块、子图截图模块。
所述坐标确定模块用于根据所述特定标识的位置边界点坐标、宽度及高度,分别确定所述右上子图和右下子图的边界点坐标。
所述子图截图模块用于根据所述右上子图的边界点坐标,对所述原始图像进行截取,得到右上子图;以及根据所述右下子图的边界点坐标,对所述原始图像进行截取,得到右下子图。
所述分析单元4包括第一处理模块、第一行投影模块、第一列投影模块、第一分割模块、第二处理模块、第二行投影模块、第二列投影模块及第二分割模块。
所述第一处理模块用于对所述右上子图做蓝色二值化处理,得到第一蓝色二值化图像。
所述第一行投影模块用于对所述第一蓝色二值化图像进行行投影,得到第一行投影图;其中,第一分割线位于所述第一行投影图中第一行与第二行之间,第二分割线位于所述第一行投影图像中第二行与第三行之间。
所述第一列投影模块用于对所述第一蓝色二值化图像进行列投影,得到第一列投影图;第三分割线位于所述第一列投影图中最宽波谷处的中心。
所述第一分割模块用于根据所述第一分割线、第二分割线及第三分割线,对所述第一蓝色二值化图像进行分割,得到一个发票代码、两个发票号码及一个开票日期的区域坐标。
所述第二处理模块用于对所述右下子图做蓝色二值化处理,得到第二蓝色二值化图像;
所述第二行投影模块用于对所述第二蓝色二值化图像进行行投影,得到第二行投影图,从所述第二行投影图中选择最宽的一行。
所述第二列投影模块用于对所述第二蓝色二值化图像进行列投影,得到第二列投影图;其中,第四分割线位于所述第二列投影图中最宽波谷处的中心。
所述第二分割模块用于根据选择的最宽的一行及第四分割线,对所述第二蓝色二值化图像进行分割,得到税前金额的区域坐标。
此外,本发明还提供一种自动化发票验真系统,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取待验证发票的原始图像;
提取所述原始图像上具有固定位置的特定标识的参数信息;所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度;
根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图;所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额;
分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,所述四要素包括发票代码、发票号码、开票日期及税前金额;
根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图;
调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息;
将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取待验证发票的原始图像;
提取所述原始图像上具有固定位置的特定标识的参数信息;所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度;
根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图;所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额;
分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,所述四要素包括发票代码、发票号码、开票日期及税前金额;
根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图;
调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息;
将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
相对于现有技术,本发明自动化发票验真系统、计算机可读存储介质与上述自动化发票验真方法的有益效果相同,在此不再赘述。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要比清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
为使本领域内的任何技术人员能够实现或者使用本发明,上面对所公开实施例进行了描述。对于本领域技术人员来说;这些实施例的各种修改方式都是显而易见的,并且本文定义的一般原理也可以在不脱离本公开的精神和保护范围的基础上适用于其它实施例。因此,本公开并不限于本文给出的实施例,而是与本申请公开的原理和新颖性特征的最广范围相一致。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block),单元,和步骤可以通过电子硬件、电脑软件,或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability),上述的各种说明性部件(illustrative components),单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用,可以使用各种方法实现所述的功能,但这种实现不应被理解为超出本发明实施例保护的范围。
本发明实施例中所描述的各种说明性的逻辑块,或单元都可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于用户终端中。可选地,处理器和存储媒介也可以设置于用户终端中的不同的部件中。
在一个或多个示例性的设计中,本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现,这些功能可以存储与电脑可读的媒介上,或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如,这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置,或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外,任何连接都可以被适当地定义为电脑可读媒介,例如,如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘,磁盘通常以磁性复制数据,而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种自动化发票验真方法,其特征在于,包括:
获取待验证发票的原始图像;
提取所述原始图像上具有固定位置的特定标识的参数信息;所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度;
根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图;所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额;
分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,所述四要素包括发票代码、发票号码、开票日期及税前金额;
根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图;
调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息;
将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
2.根据权利要求1所述的自动化发票验真方法,其特征在于,所述提取所述原始图像上具有固定位置的特定标识的参数信息,具体包括:
对所述原始图像进行R、G、B三通道分离,得到对应的R通道图片、G通道图片及B通道图片;
根据所述R通道图片、G通道图片及B通道图片,从原始图像中提取图片红色信息,得到红色信息图;
按照设定比例,分别对所述红色信息图、R通道图片、G通道图片及B通道图片进行截取,获得对应的部分红色信息图、部分R通道图片、部分G通道图片及部分B通道图片;
根据所述部分R通道图片、部分G通道图片及部分B通道图片,在所述部分红色信息图中确定特定标识区域;
根据所述特定标识区域,确定所述特定标识的位置边界点坐标、宽度及高度。
3.根据权利要求1所述的自动化发票验真方法,其特征在于,所述根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图,具体包括:
根据所述特定标识的位置边界点坐标、宽度及高度,分别确定所述右上子图和右下子图的边界点坐标;
根据所述右上子图的边界点坐标,对所述原始图像进行截取,得到右上子图;以及根据所述右下子图的边界点坐标,对所述原始图像进行截取,得到右下子图。
4.根据权利要求1所述的自动化发票验真方法,其特征在于,所述分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,具体包括:
对所述右上子图做蓝色二值化处理,得到第一蓝色二值化图像;
对所述第一蓝色二值化图像进行行投影,得到第一行投影图;其中,第一分割线位于所述第一行投影图中第一行与第二行之间,第二分割线位于所述第一行投影图像中第二行与第三行之间;
对所述第一蓝色二值化图像进行列投影,得到第一列投影图;第三分割线位于所述第一列投影图中最宽波谷处的中心;
根据所述第一分割线、第二分割线及第三分割线,对所述第一蓝色二值化图像进行分割,得到一个发票代码、两个发票号码及一个开票日期的区域坐标;
对所述右下子图做蓝色二值化处理,得到第二蓝色二值化图像;
对所述第二蓝色二值化图像进行行投影,得到第二行投影图,从所述第二行投影图中选择最宽的一行;
对所述第二蓝色二值化图像进行列投影,得到第二列投影图;其中,第四分割线位于所述第二列投影图中最宽波谷处的中心;
根据选择的最宽的一行及第四分割线,对所述第二蓝色二值化图像进行分割,得到税前金额的区域坐标。
5.一种自动化发票验真系统,其特征在于,包括:
获取单元,用于获取待验证发票的原始图像;
提取单元,用于提取所述原始图像上具有固定位置的特定标识的参数信息;所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度;
分割单元,用于根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图;所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额;
分析单元,用于分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,所述四要素包括发票代码、发票号码、开票日期及税前金额;
截取单元,用于根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图;
识别单元,用于调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息;
验证单元,用于将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
6.根据权利要求5所述的自动化发票验真系统,其特征在于,所述提取单元包括:
通道分离模块,用于对所述原始图像进行R、G、B三通道分离,得到对应的R通道图片、G通道图片及B通道图片;
信息提取模块,用于根据所述R通道图片、G通道图片及B通道图片,从原始图像中提取图片红色信息,得到红色信息图;
部分截取模块,用于按照设定比例,分别对所述红色信息图、R通道图片、G通道图片及B通道图片进行截取,获得对应的部分红色信息图、部分R通道图片、部分G通道图片及部分B通道图片;
区域确定模块,用于根据所述部分R通道图片、部分G通道图片及部分B通道图片,在所述部分红色信息图中确定特定标识区域;
参数确定模块,用于根据所述特定标识区域,确定所述特定标识的位置边界点坐标、宽度及高度。
7.根据权利要求5所述的自动化发票验真系统,其特征在于,所述分割单元包括:
坐标确定模块,用于根据所述特定标识的位置边界点坐标、宽度及高度,分别确定所述右上子图和右下子图的边界点坐标;
子图截图模块,用于根据所述右上子图的边界点坐标,对所述原始图像进行截取,得到右上子图;以及根据所述右下子图的边界点坐标,对所述原始图像进行截取,得到右下子图。
8.根据权利要求5所述的自动化发票验真系统,其特征在于,所述分析单元包括:
第一处理模块,用于对所述右上子图做蓝色二值化处理,得到第一蓝色二值化图像;
第一行投影模块,用于对所述第一蓝色二值化图像进行行投影,得到第一行投影图;其中,第一分割线位于所述第一行投影图中第一行与第二行之间,第二分割线位于所述第一行投影图像中第二行与第三行之间;
第一列投影模块,用于对所述第一蓝色二值化图像进行列投影,得到第一列投影图;第三分割线位于所述第一列投影图中最宽波谷处的中心;
第一分割模块,用于根据所述第一分割线、第二分割线及第三分割线,对所述第一蓝色二值化图像进行分割,得到一个发票代码、两个发票号码及一个开票日期的区域坐标;
第二处理模块,用于对所述右下子图做蓝色二值化处理,得到第二蓝色二值化图像;
第二行投影模块,用于对所述第二蓝色二值化图像进行行投影,得到第二行投影图,从所述第二行投影图中选择最宽的一行;
第二列投影模块,用于对所述第二蓝色二值化图像进行列投影,得到第二列投影图;其中,第四分割线位于所述第二列投影图中最宽波谷处的中心;
第二分割模块,用于根据选择的最宽的一行及第四分割线,对所述第二蓝色二值化图像进行分割,得到税前金额的区域坐标。
9.一种自动化发票验真系统,其特征在于,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取待验证发票的原始图像;
提取所述原始图像上具有固定位置的特定标识的参数信息;所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度;
根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图;所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额;
分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,所述四要素包括发票代码、发票号码、开票日期及税前金额;
根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图;
调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息;
将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取待验证发票的原始图像;
提取所述原始图像上具有固定位置的特定标识的参数信息;所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度;
根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图;所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额;
分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,所述四要素包括发票代码、发票号码、开票日期及税前金额;
根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图;
调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息;
将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证。
CN201810375901.7A 2018-04-25 2018-04-25 一种自动化发票验真方法及系统 Active CN108734849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810375901.7A CN108734849B (zh) 2018-04-25 2018-04-25 一种自动化发票验真方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810375901.7A CN108734849B (zh) 2018-04-25 2018-04-25 一种自动化发票验真方法及系统

Publications (2)

Publication Number Publication Date
CN108734849A true CN108734849A (zh) 2018-11-02
CN108734849B CN108734849B (zh) 2020-11-13

Family

ID=63939284

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810375901.7A Active CN108734849B (zh) 2018-04-25 2018-04-25 一种自动化发票验真方法及系统

Country Status (1)

Country Link
CN (1) CN108734849B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726783A (zh) * 2018-12-28 2019-05-07 大象慧云信息技术有限公司 一种基于ocr图像识别技术的发票采集管理系统及方法
CN109871744A (zh) * 2018-12-29 2019-06-11 新浪网技术(中国)有限公司 一种增值税发票图像配准方法及系统
CN110751088A (zh) * 2019-10-17 2020-02-04 深圳金蝶账无忧网络科技有限公司 一种数据处理方法及相关设备
CN113128512A (zh) * 2021-04-14 2021-07-16 浪潮天元通信信息系统有限公司 一种基于颜色通道去红章的方法及工具

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101425143A (zh) * 2008-11-07 2009-05-06 东莞市微模式软件有限公司 一种图像定位的方法及装置
CN105528604A (zh) * 2016-01-31 2016-04-27 华南理工大学 一种基于ocr的票据自动识别与处理系统
CN105701905A (zh) * 2014-11-28 2016-06-22 航天信息股份有限公司 一种发票识别方法和系统
CN106934632A (zh) * 2015-12-30 2017-07-07 远光软件股份有限公司 发票验真方法及发票验真系统
CN107256558A (zh) * 2017-05-18 2017-10-17 深思考人工智能机器人科技(北京)有限公司 一种无监督式的宫颈细胞图像自动分割方法及系统
CN107545473A (zh) * 2016-11-23 2018-01-05 卢安迪 一种预防电子发票重复报销的方法
CN107590490A (zh) * 2017-09-30 2018-01-16 谷健 发票的全票面信息获取方法、装置及计算机可读存储介质
CN206975668U (zh) * 2017-05-31 2018-02-06 北京空间飞行器总体设计部 一种财务报销全票据智能审核系统
CN107833229A (zh) * 2017-11-02 2018-03-23 上海联影医疗科技有限公司 信息处理方法、装置及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101425143A (zh) * 2008-11-07 2009-05-06 东莞市微模式软件有限公司 一种图像定位的方法及装置
CN105701905A (zh) * 2014-11-28 2016-06-22 航天信息股份有限公司 一种发票识别方法和系统
CN106934632A (zh) * 2015-12-30 2017-07-07 远光软件股份有限公司 发票验真方法及发票验真系统
CN105528604A (zh) * 2016-01-31 2016-04-27 华南理工大学 一种基于ocr的票据自动识别与处理系统
CN107545473A (zh) * 2016-11-23 2018-01-05 卢安迪 一种预防电子发票重复报销的方法
CN107256558A (zh) * 2017-05-18 2017-10-17 深思考人工智能机器人科技(北京)有限公司 一种无监督式的宫颈细胞图像自动分割方法及系统
CN206975668U (zh) * 2017-05-31 2018-02-06 北京空间飞行器总体设计部 一种财务报销全票据智能审核系统
CN107590490A (zh) * 2017-09-30 2018-01-16 谷健 发票的全票面信息获取方法、装置及计算机可读存储介质
CN107833229A (zh) * 2017-11-02 2018-03-23 上海联影医疗科技有限公司 信息处理方法、装置及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726783A (zh) * 2018-12-28 2019-05-07 大象慧云信息技术有限公司 一种基于ocr图像识别技术的发票采集管理系统及方法
CN109871744A (zh) * 2018-12-29 2019-06-11 新浪网技术(中国)有限公司 一种增值税发票图像配准方法及系统
CN110751088A (zh) * 2019-10-17 2020-02-04 深圳金蝶账无忧网络科技有限公司 一种数据处理方法及相关设备
CN113128512A (zh) * 2021-04-14 2021-07-16 浪潮天元通信信息系统有限公司 一种基于颜色通道去红章的方法及工具

Also Published As

Publication number Publication date
CN108734849B (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
CN108734849A (zh) 一种自动化发票验真方法及系统
US10733434B2 (en) Method and system for accurately detecting, extracting and representing redacted text blocks in a document
CN103975342B (zh) 用于移动图像捕获和处理的系统和方法
CN101201903B (zh) 图像处理装置及其控制方法
CN104281830B (zh) 二维码的识别方法及装置
CN110427949A (zh) 表单校验的方法、装置、计算设备和介质
CN109816118A (zh) 一种基于深度学习模型的创建结构化文档的方法及终端
CN109255356A (zh) 一种文字识别方法、装置及计算机可读存储介质
CN109636825A (zh) 印章图形分割方法、装置及计算机可读存储介质
CN110516672A (zh) 卡证信息识别方法、装置及终端
CN109255300A (zh) 票据信息提取方法、装置、计算机设备及存储介质
CN109903210A (zh) 水印的去除方法、装置和服务器
CN110516663A (zh) Ocr识别准确率的测试方法、装置、计算机设备及存储介质
CN110245573A (zh) 一种基于人脸识别的签到方法、装置及终端设备
CN106991303A (zh) 一种手势验证码的识别方法及装置
CN107682685A (zh) 白平衡处理方法及装置、电子装置和计算机可读存储介质
CN109671132A (zh) 一种基于色域特征的曲线数据采集方法、装置及系统
CN110378351A (zh) 印章鉴别方法及装置
CN109410295A (zh) 颜色设置方法、装置、设备及计算机可读存储介质
CN109977832A (zh) 一种图像处理方法、装置及存储介质
CN106507130A (zh) 在yuv帧上叠加水印的方法及水印叠加装置
CN104408403B (zh) 一种二次录入不一致的仲裁方法及装置
CN108961533B (zh) 纸币识别方法及装置
CN108805115A (zh) 一种图片中文字的识别方法、装置、设备及存储介质
CN104093010B (zh) 一种图像处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230427

Address after: Room 501-502, 5/F, Sina Headquarters Scientific Research Building, Block N-1 and N-2, Zhongguancun Software Park, Dongbei Wangxi Road, Haidian District, Beijing, 100193

Patentee after: Sina Technology (China) Co.,Ltd.

Address before: 100193 7th floor, scientific research building, Sina headquarters, plot n-1, n-2, Zhongguancun Software Park, Dongbei Wangxi Road, Haidian District, Beijing, 100193

Patentee before: Sina.com Technology (China) Co.,Ltd.