CN110619056A - 发票录入方法、装置、设备及计算机存储介质 - Google Patents
发票录入方法、装置、设备及计算机存储介质 Download PDFInfo
- Publication number
- CN110619056A CN110619056A CN201910548140.5A CN201910548140A CN110619056A CN 110619056 A CN110619056 A CN 110619056A CN 201910548140 A CN201910548140 A CN 201910548140A CN 110619056 A CN110619056 A CN 110619056A
- Authority
- CN
- China
- Prior art keywords
- invoice
- current
- format
- image
- image information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000005516 engineering process Methods 0.000 claims description 10
- 238000012015 optical character recognition Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Library & Information Science (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Character Input (AREA)
Abstract
本发明涉及人工智能领域,公开了一种发票录入方法、装置、设备及计算机存储介质,本发明首先采集当前发票的图像信息,从所述图像信息中识别出所述当前发票的当前发票格式;再根据所述当前发票格式对图片库中预存的发票格式图像进行比较,并获取与所述发票格式图像相匹配的目标发票格式图像;然后根据目标发票格式图像确定当前发票对应的当前发票类别;最后将当前发票的图像信息录入与当前发票类别对应的存储区域,即本发明能够自动将发票的信息进行分类然后存储到计算机系统中,进而能够代替人工式地对发票分类,提高了工作者的效率。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种发票录入方法、装置、设备及计算机存储介质。
背景技术
目前,国家税务机构会对各种类型的发票进行统计,国家税务机构的工作者在整理包括各种不同种类的发票时,需要手动将这些不同种类的发票进行分类,然后将它们录入到计算机系统中,如果发票数量很多、种类也很多,有些发票甚至具有区域性,工作者需要按照发票种类对发票进行分类,这样对工作者来说更加费时费力。
发明内容
本发明的主要目的在于提供了一种发票录入方法、装置、设备及计算机存储介质,旨在解决工作人员在手工统计发票时,由于数量多、种类多,工作人员手工操作起来费时费力的问题。
为实现上述目的,本发明提供了一种发票录入方法,所述方法包括以下步骤:
采集当前发票的图像信息;
从所述图像信息中识别出所述当前发票的当前发票格式;
根据所述当前发票格式对图片库中预存的发票格式图像进行比较,并获取与所述发票格式图像相匹配的目标发票格式图像;
根据所述目标发票格式图像确定所述当前发票对应的当前发票类别;
将所述当前发票的图像信息录入与所述当前发票类别对应的存储区域。
优选地,所述从所述图像信息中识别出所述当前发票的当前发票格式的步骤,包括:
从所述图像信息中识别出所述当前发票的当前发票格式的特征点集合A;
所述根据所述当前发票格式对图片库中预存的发票格式图像进行比较,并获取与所述发票格式图像相匹配的目标发票格式图像的步骤,包括:
对图像库中的发票格式图像遍历,对遍历到的发票格式图像进行特征点采集,得到遍历到的发票格式图像的特征点集合X;
将所述特征点集合A中的特征点与所述特征点集合X中的特征点进行比对,若比对结果相同,则将所述特征点集合X对应的发票格式图像作为与所述当前发票格式相匹配的目标发票格式图像。
优选地,所述采集当前发票的图像信息的步骤之后,包括:
通过光学字符识别技术从所述图像信息中识别出所述当前发票的发票内容信息;
所述将所述当前发票的图像信息录入与所述当前发票类别对应的存储区域的步骤,包括:
将所述当前发票的图像信息和所述发票内容信息录入与所述当前发票类别对应的存储区域。
优选地,所述采集当前发票的图像信息的步骤之后,包括:
从所述当前发票的图像信息中读取图章图像,将所述图章图像与预设图章进行比较,在所述图章图像与所述预设图章相同时,判断所述当前发票为合格发票。
优选地,所述通过光学字符识别技术从所述图像信息中识别出所述当前发票的当前发票格式和发票内容信息的步骤之后,包括:
对本地网络与国家税务局服务器的连接状态进行检测,在检测结果为通讯状态时,从所述发票内容信息中读取当前发票编号;
根据所述当前发票编号对所述国家税务局服务器的数据库进行遍历,在成功遍历到与所述当前发票编号相同的发票编号时,判断所述当前发票为合格发票。
优选地,不同的发票格式图像对应不同的发票类别和发票所属地区;
所述根据所述目标发票格式图像确定所述当前发票对应的当前发票类别的步骤,包括:
根据所述目标发票格式图像确定所述当前发票对应的当前发票类别和当前发票所属地区;
所述将所述当前发票的图像信息录入与所述当前发票类别对应的存储区域的步骤,包括:
将所述当前发票的图像信息录入与所述当前发票类别以及所述当前发票所属地区对应的存储区域。
可选地,所述发票内容信息至少包括发票编号、开票日期和交易信息。
此外,为实现上述目的,本发明还提出一种发票录入装置,所述装置包括:
采集模块,用于采集当前发票的图像信息;
识别模块,用于从所述图像信息中识别出所述当前发票的当前发票格式;
比较模块,用于根据所述当前发票格式对图片库中预存的发票格式图像进行比较,并获取与所述发票格式图像相匹配的目标发票格式图像;
获取模块,用于根据所述目标发票格式图像确定所述当前发票对应的当前发票类别;
存储模块,用于将所述当前发票的图像信息录入与所述当前发票类别对应的存储区域。
此外,为实现上述目的,本发明还提出一种用于发票录入的设备,所述设备包括:摄像头、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的发票录入程序,所述发票录入程序配置为实现如上所述发票录入方法的步骤。
此外,为实现上述目的,本发明还提出一种计算机存储介质,所述计算机存储介质上存储有发票录入程序,所述发票录入程序被处理器执行时实现如上所述发票录入方法的步骤。
本发明首先采集当前发票的图像信息,从所述图像信息中识别出所述当前发票的当前发票格式;再根据所述当前发票格式对图片库中预存的发票格式图像进行比较,并获取与所述发票格式图像相匹配的目标发票格式图像;然后根据目标发票格式图像确定当前发票对应的当前发票类别;最后将当前发票的图像信息录入与当前发票类别对应的存储区域,即本发明能够自动将发票的信息进行分类然后存储到计算机系统中,进而能够代替人工式地对发票分类,提高了工作者的效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的设备的结构示意图;
图2为本发明一种发票录入方法第一实施例的流程示意图;
图3为本发明一实施例中的数据库的各个数据表的示意图
图4为本发明一种发票录入方法第二实施例的流程示意图;
图5为本发明一种发票录入方法第三实施例的流程示意图;
图6为本发明一种发票录入方法第四实施例的流程示意图;
图7为本发明又一实施例中的数据库的各个数据表的示意图;
图8为本发明一种发票录入装置的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
如图1所示,该设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005,摄像头1006。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。摄像头1006用于对发票的图像信息进行采集。
本领域技术人员可以理解,图1中示出的设备结构并不构成对本发明所述的设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及发票录入程序。
本发明所述设备通过处理器1001调用存储器1005中存储的发票录入程序,并执行发票录入方法的步骤。
基于上述硬件结构,提出本发明一种发票录入方法实施例。
参照图2,图2为本发明一种发票录入方法第一实施例的流程示意图。
本实施例中,所述方法包括以下步骤:
步骤S10:采集当前发票的图像信息,从所述图像信息中识别出所述当前发票的当前发票格式;
具体地,本实施例的执行主体为发票录入设备,所述发票录入设备可以包括一摄像头,用于对当前发票的图像信息进行采集,工作者使用该设备对当前发票进行图像采集,从所述图像信息中识别出所述当前发票的当前发票格式的特征点集合A;
本实施例可以通过基于OpenCV(Open Source Computer Vision Library,开源计算机视觉库)函数对采集到的图像进行灰度处理,在经过二值化处理后得到表格线,
具体地,首先对采集到的图像进行灰度处理,调用OpenCV函数的Canny边缘检测算法在灰度图的基础上进行二值化处理,达成自动阈值的二值化,然后使用霍夫变换,检测出其中的直线,并在直线中,确认出围成一个矩形的区域,然后将这块区域提取出来;然后由获得的表格线得到单元格交点坐标,按坐标对表格图片进行分割,分割成多个单元格图片,交点坐标,这些交点就是当前发票格式的特征点,采集到当前发票格式的特征点集合A即确定当前发票格式的具体形状a。
步骤S20:根据所述当前发票格式对图片库中预存的发票格式图像进行比较,并获取与所述发票格式图像相匹配的目标发票格式图像。
具体地,本实施例会预先对不同类型发票的发票格式进行归纳统计,举个例子,增值税发票的格式和机动车销售发票的表格格式差别很大,我们分别为这两种发票类型建立黑底背景,白色线条的图像(或者白底背景,黑色线条的图像),将其称之为表格线条图像,将建好的表格线条图像作为发票格式图像存储到图像库中。
在具体实现中,本实施例的图像库可以是关系型数据库,如MySQL数据库、SqlServer数据库。
对图像库中的发票格式图像遍历,对遍历到的发票格式图像进行特征点采集,得到遍历到的发票格式图像的特征点集合X;
将所述特征点集合A中的特征点与所述特征点集合X中的特征点进行比对,若比对结果相同,则将所述特征点集合X对应的发票格式图像作为与所述当前发票格式相匹配的目标发票格式图像。
步骤S30:根据所述目标发票格式图像确定所述当前发票对应的当前发票类别。
可理解的是,本实施例的发票格式图像比对方式属于二维图片与二维图片的比对,由于不同类型的发票格式都是表格形状,因此不同类型的发票图像的相似度会很高。本实施例采用特征点匹配的方式,即在处理“根据所述当前发票格式对图片库中预存的发票格式图像进行比较”的步骤时,对图像库中的发票格式图像遍历,并对遍历到的发票格式图像进行发票格式的特征点集合X的采集,将采集到当前发票格式的特征点集合A与发票格式图像的特征点集合X进行比对,具体地比对方式为:首先确定特征点集合A对应的当前发票格式的具体形状a,然后确定特征点集合X对应的发票格式图像的具体形状x,获取形状a的各个端点,同时获取形状x的各个端点,将形状a的端点和形状b的端点相连,例如形状a和形状x都是矩形,那么可将两个矩形的四个端点按照上、下、左、右的顺序对应连接。
紧接着,将所述特征点集合A与所述特征点集合B中对应的特征点相连,以获取各对应特征点之间的连线,计算各对应特征点之间的连线的长度,如果每条连线的长度近乎相等,则判定形状a和形状b形状相同,也即当前发票格式与图片库中遍历到的发票格式图像相同。
其中,具体地连线方式为:以已经连接的端点为基准,依照从左向右、从上到下的顺序进行特征点连接。
步骤S40:将所述当前发票的图像信息录入与所述当前发票类别对应的存储区域。
可理解的是,本实施例的数据库系统为关系型数据库,参考图3,图3为本实施例的数据库的各个数据表的示意图,本实施例的数据库会包括一用于存储发票格式图像的数据表(发票格式图像表A)、一用于存储发票种类名称的数据表(发票类别表B),以及按照发票类别划分的多各用于存储发票图像信息的数据表(发票信息表C),如图所示,各数据表之间会存在相同的字段属性,相同的字段属性之间为主键与外键映射关系。
其中,所述发票类别表B的属性包括:发票类别ID(主键)和发票类别名称;
所述发票格式图像表A的属性包括:发票格式ID(主键)、发票格式图像和发票类别ID(外键);
所述发票信息表C的属性包括:发票的图像信息(具体发票内容信息字段)和发票类别ID(外键)。
具体地,当发票录入设备识别出所述当前发票的当前类别时,会将所述当前发票的图像信息录入与所述当前发票类别对应的存储区域,即将所述当前发票的图像信息录入与所述当前发票类别对应的发票信息表C中。进而能够代替人工对发票进行分类后手工式地将发票信息输入到电脑中,工作者可以使用本方案的发票录入设备扫描发票图像信息后,能够自动将该发票的信息分类并存储到录计算机系统中,提高了工作者的效率。
本实施例首先采集当前发票的图像信息,从所述图像信息中识别出所述当前发票的当前发票格式;根据所述当前发票格式对图片库中预存的发票格式图像进行比较,并获取与所述发票格式图像相匹配的目标发票格式图像;根据目标发票格式图像确定当前发票对应的当前发票类别;最后将当前发票的图像信息录入与当前发票类别对应的存储区域,即本实施例能够自动将发票的信息进行分类然后存储到计算机系统中,进而能够代替人工式地对发票分类,提高了工作者的效率。
进一步地,参考图4,基于上述发票录入方法的第一实施例流程示意图,提出本发明一种发票录入方法的第二实施。
本实施例中,所述步骤S10具体包括:
步骤S101:采集当前发票的图像信息,从所述图像信息中识别出所述当前发票的当前发票格式,并通过光学字符识别技术从所述图像信息中识别出所述当前发票的发票内容信息。
具体地,本实施例可采用光学字符识别技术(OCR,Optical CharacterRecognition)从所述图像信息中识别出所述当前发票的发票内容信息;即利用光学技术和计算机技术把印在或写在所述当前发票纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字识别是计算机视觉研究领域的比较成熟的技术,并且在商业中已经有很多落地项目了。其中,所述发票内容信息,至少包括发票编号、开票日期和交易信息,交易信息可以包括是购买方信息和卖方信息。
所述步骤S40具体包括:
步骤S401:将所述当前发票的图像信息和所述发票内容信息录入与所述当前发票类别对应的存储区域。
具体地,本实施例的所述发票信息表C的属性包括:发票的图像信息(具体发票内容信息字段)、发票类别ID(外键)以及发票编号、开票日期和交易信息等字段信息。
本实施例的当发票录入设备识别出所述当前发票的当前类别以及发票内容信息之后,会将所述当前发票的图像信息和所述发票内容信息录入与所述当前发票类别对应的存储区域,即将所述当前发票的图像信息和所述发票内容信息录入与所述当前发票类别对应的发票信息表C中。
进一步地,参考图5,基于上述发票录入方法的第二实施例,提出本发明一种发票录入方法的第三实施例。
本实施例中,所述步骤S101之后,包括:
步骤S102:从所述当前发票的图像信息中读取图章图像,将所述图章图像与预设图章进行比较,在所述图章图像与所述预设图章相同时,判断所述当前发票为合格发票。
可理解的是,本实施例在采集当前发票的图像信息的过程中,可以根据识别出当前发票的发票信息来对发票的真伪进行鉴定,例如根据采集到的图像信息判断发票票据上方中间有无椭圆形的红章,章的上方标有“全国统一发票监制章”,章下方标有“地方税务局监制”或者“国家税务局监制”的字样,判断该红章是否符合规范。
进一步地,本实施例中,所述步骤S101之后,也可以包括:
步骤:对本地网络与国家税务局服务器的连接状态进行检测,在检测结果为通讯状态时,从所述发票内容信息中读取当前发票编号;
步骤:根据所述当前发票编号对所述国家税务局服务器的数据库进行遍历,在成功遍历到与所述当前发票编号相同的发票编号时,判断所述当前发票为合格发票。
可理解的是,本实施例的发票录入设备与国家税务局数据库连接保持同步,发票录入设备扫描到当前发票的发票编码,根据扫描到的发票编号对国家税务局数据库进行查询,如果查询到相应的内容,则说明当前发票是有效的,否则是无效的。
此外,工作者在整理众多发票的过程中,难免会碰到“空白”发票,即没有盖章的无效发票,本方案会在采集当前发票的图像信息过程中,对图像中的盖章进行扫码,如果扫码结果发现当前发票没有印章,则说明书此为无效发票,并语音提示工作者。
本实施例能够及时对当前发票进行检测,判断当前发票是否为正规合格发票。
进一步地,参考图6,基于上述发票录入方法的第一实施例流程示意图,提出本发明一种发票录入方法的第四实施。
由于少数地区的同种类发票格式与相同种类常规的发票格式不同,因此我们在按照类型对发票分类的基础上,还会按照不同地区对相同类型的发票进行发票格式进行归纳统计;如果地区不同但是类型相同的发票的格式一模一样,则归纳为一种发票格式图像。
相应地,所述步骤S30,包括:
步骤S31,根据所述目标发票格式图像确定所述当前发票对应的当前发票类别和当前发票所属地区。
所述步骤S40,包括:
步骤S41,将所述当前发票的图像信息录入与所述当前发票类别以及所述当前发票所属地区对应的存储区域。
本实施例,本实施例的数据库系统为关系型数据库,参考图7,图7为本实施例的数据库的各个数据表的示意图,本实施例的数据库会包括一用于存储发票格式图像的数据表(发票格式图像表A)、一用于存储发票种类名称的数据表(发票类别表B)、一用于存储发票地区数据的数据表(发票地区表D)以及按照发票类别划分的多各用于存储发票图像信息的数据表(发票信息表C),如图所示,各数据表之间会存在相同的字段属性,相同的字段属性之间为主键与外键映射关系。
其中,所述发票类别表B的属性包括:发票类别ID(主键)和发票类别名称;
所述发票格式图像表A的属性包括:发票格式图像、发票格式ID=发票类别ID+发票地区ID;
所述发票信息表C的属性包括:发票的图像信息(具体发票内容信息字段)和发票类别ID(外键);
所述发票格式图像表D的属性包括:发票地区和发票地区ID(主键)。
具体地,当发票录入设备识别出所述当前发票的当前类别时,会将所述当前发票的图像信息录入与所述当前发票类别对应的存储区域,即将所述当前发票的图像信息录入与所述当前发票类别对应的发票信息表C中。进而能够代替人工对发票进行分类后手工式地将发票信息输入到电脑中,工作者可以使用本方案的发票录入设备扫描发票图像信息后,能够自动将该发票的信息分类并存储到录计算机系统中,提高了工作者的效率。
可理解的是,目前可能存在的现象是发票具有区域性,同种类不同地区的发票的格式可能存在差异,工作者还需要按照区域对发票进行分类,这样对应工作者来说更加费时费力。而本实施例不同的发票格式图像对应不同的发票类别和发票所属地区,即本实施例能够针对相同发票类别,不同地区的发票进行识别,按照将当前发票的图像信息录入与当前发票类别以及当前发票所属地区对应的存储区域。
此外,本发明还提供一种发票录入装置,参照图8,图8为本发明一种发票录入装置第一实施例的结构框图,所述装置包括:
采集模块10,用于采集当前发票的图像信息;
识别模块10,用于从所述图像信息中识别出所述当前发票的当前发票格式;
比较模块30,用于根据所述当前发票格式对图片库中预存的发票格式图像进行比较,并获取与所述发票格式图像相匹配的目标发票格式图像;
获取模块40,用于根据所述目标发票格式图像确定所述当前发票对应的当前发票类别;
存储模块50,用于将所述当前发票的图像信息录入与所述当前发票类别对应的存储区域。
可理解的是,本实施例的一种发票录入装置可以是一种用于支持发票录入的程序,并装载于所述发票录入设备中,本实施例的发票录入装置能够自动将发票的信息进行分类然后存储到计算机系统中,进而能够代替人工式地对发票分类,提高了工作者的效率。
本实施例的发票录入装置的具体实施方式请参照上述发票录入方法实施例,本实施例在此不予赘述。
基于本发明上述发票录入装置第一实施例,提出本发明发票录入装置的第二实施例。
本实施例中,所述采集模块10还用于采集当前发票的图像信息,通过光学字符识别技术从所述图像信息中识别出所述当前发票的当前发票格式和发票内容信息。所述存储模块50还用于将所述当前发票的图像信息和所述发票内容信息录入与所述当前发票类别对应的存储区域。
基于本发明上述发票录入装置第一实施例,提出本发明发票录入装置的第三实施例。
所述获取模块40,还用于根据所述目标发票格式图像确定所述当前发票对应的当前发票类别和当前发票所属地区。
所述存储模块50,还用于将所述当前发票的图像信息录入与所述当前发票类别以及所述当前发票所属地区对应的存储区域。
本实施例能够针对相同发票类别,不同地区的发票进行识别,按照将当前发票的图像信息录入与当前发票类别以及当前发票所属地区对应的存储区域。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种发票录入方法,其特征在于,所述方法包括:
采集当前发票的图像信息;
从所述图像信息中识别出所述当前发票的当前发票格式;
根据所述当前发票格式对图片库中预存的发票格式图像进行比较,并获取与所述发票格式图像相匹配的目标发票格式图像;
根据所述目标发票格式图像确定所述当前发票对应的当前发票类别;
将所述当前发票的图像信息录入与所述当前发票类别对应的存储区域。
2.如权利要求1所述的方法,其特征在于,所述从所述图像信息中识别出所述当前发票的当前发票格式的步骤,包括:
从所述图像信息中识别出所述当前发票的当前发票格式的特征点集合A;
所述根据所述当前发票格式对图片库中预存的发票格式图像进行比较,并获取与所述发票格式图像相匹配的目标发票格式图像的步骤,包括:
对图像库中的发票格式图像遍历,对遍历到的发票格式图像进行特征点采集,得到遍历到的发票格式图像的特征点集合X;
将所述特征点集合A中的特征点与所述特征点集合X中的特征点进行比对,若比对结果相同,则将所述特征点集合X对应的发票格式图像作为与所述当前发票格式相匹配的目标发票格式图像。
3.如权利要求1或2所述的方法,其特征在于,所述采集当前发票的图像信息的步骤之后,包括:
通过光学字符识别技术从所述图像信息中识别出所述当前发票的发票内容信息;
所述将所述当前发票的图像信息录入与所述当前发票类别对应的存储区域的步骤,包括:
将所述当前发票的图像信息和所述发票内容信息录入与所述当前发票类别对应的存储区域。
4.如权利要求3所述的方法,其特征在于,所述采集当前发票的图像信息的步骤之后,包括:
从所述当前发票的图像信息中读取图章图像,将所述图章图像与预设图章进行比较,在所述图章图像与所述预设图章相同时,判断所述当前发票为合格发票。
5.如权利要求3所述的方法,其特征在于,所述通过光学字符识别技术从所述图像信息中识别出所述当前发票的当前发票格式和发票内容信息的步骤之后,包括:
对本地网络与国家税务局服务器的连接状态进行检测,在检测结果为通讯状态时,从所述发票内容信息中读取当前发票编号;
根据所述当前发票编号对所述国家税务局服务器的数据库进行遍历,在成功遍历到与所述当前发票编号相同的发票编号时,判断所述当前发票为合格发票。
6.如权利要求1或2所述的方法,其特征在于,不同的发票格式图像对应不同的发票类别和发票所属地区;
所述根据所述目标发票格式图像确定所述当前发票对应的当前发票类别的步骤,包括:
根据所述目标发票格式图像确定所述当前发票对应的当前发票类别和当前发票所属地区;
所述将所述当前发票的图像信息录入与所述当前发票类别对应的存储区域的步骤,包括:
将所述当前发票的图像信息录入与所述当前发票类别以及所述当前发票所属地区对应的存储区域。
7.如权利要求1或2所述的方法,其特征在于,所述发票内容信息至少包括发票编号、开票日期和交易信息。
8.一种发票录入装置,其特征在于,所述装置包括:
采集模块,用于采集当前发票的图像信息;
识别模块,用于从所述图像信息中识别出所述当前发票的当前发票格式;
比较模块,用于根据所述当前发票格式对图片库中预存的发票格式图像进行比较,并获取与所述发票格式图像相匹配的目标发票格式图像;
获取模块,用于根据所述目标发票格式图像确定所述当前发票对应的当前发票类别;
存储模块,用于将所述当前发票的图像信息录入与所述当前发票类别对应的存储区域。
9.一种用于发票录入的设备,其特征在于,所述设备包括:摄像头、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的发票录入程序,所述发票录入程序配置为实现如权利要求1至7中任一项所述发票录入方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有发票录入程序,所述发票录入程序被处理器执行时实现如权利要求1至7中任一项所述发票录入方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910548140.5A CN110619056A (zh) | 2019-06-19 | 2019-06-19 | 发票录入方法、装置、设备及计算机存储介质 |
PCT/CN2019/120910 WO2020253113A1 (zh) | 2019-06-19 | 2019-11-26 | 发票录入方法、装置、设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910548140.5A CN110619056A (zh) | 2019-06-19 | 2019-06-19 | 发票录入方法、装置、设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110619056A true CN110619056A (zh) | 2019-12-27 |
Family
ID=68921635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910548140.5A Pending CN110619056A (zh) | 2019-06-19 | 2019-06-19 | 发票录入方法、装置、设备及计算机存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110619056A (zh) |
WO (1) | WO2020253113A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580640A (zh) * | 2020-06-30 | 2021-03-30 | 北京来也网络科技有限公司 | 一种结合rpa和ai的发票信息的处理方法与装置 |
CN113205349A (zh) * | 2021-04-26 | 2021-08-03 | 临沂职业学院 | 用于发票管理的装置及方法、电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060251338A1 (en) * | 2005-05-09 | 2006-11-09 | Gokturk Salih B | System and method for providing objectified image renderings using recognition information from images |
CN103208004A (zh) * | 2013-03-15 | 2013-07-17 | 北京英迈杰科技有限公司 | 票据信息区域自动识别和提取方法及设备 |
CN105045780A (zh) * | 2015-07-15 | 2015-11-11 | 广州敦和信息技术有限公司 | 一种发票字条语义信息的识别方法及装置 |
CN107633239A (zh) * | 2017-10-18 | 2018-01-26 | 江苏鸿信系统集成有限公司 | 基于深度学习和ocr的票据分类及票据字段提取方法 |
CN109635633A (zh) * | 2018-10-26 | 2019-04-16 | 平安科技(深圳)有限公司 | 电子装置、票据识别方法及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103996239B (zh) * | 2014-06-13 | 2016-08-24 | 广州广电运通金融电子股份有限公司 | 一种基于多线索融合的票据定位识别方法及系统 |
CN204576535U (zh) * | 2014-12-22 | 2015-08-19 | 深圳中兴网信科技有限公司 | 一种票据识别装置 |
CN108717545B (zh) * | 2018-05-18 | 2020-12-18 | 北京大账房网络科技股份有限公司 | 一种基于手机拍照的票据识别方法及系统 |
CN108921240A (zh) * | 2018-06-12 | 2018-11-30 | 新乡学院 | 一种发票编码识别分拣系统 |
CN109726783A (zh) * | 2018-12-28 | 2019-05-07 | 大象慧云信息技术有限公司 | 一种基于ocr图像识别技术的发票采集管理系统及方法 |
-
2019
- 2019-06-19 CN CN201910548140.5A patent/CN110619056A/zh active Pending
- 2019-11-26 WO PCT/CN2019/120910 patent/WO2020253113A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060251338A1 (en) * | 2005-05-09 | 2006-11-09 | Gokturk Salih B | System and method for providing objectified image renderings using recognition information from images |
CN103208004A (zh) * | 2013-03-15 | 2013-07-17 | 北京英迈杰科技有限公司 | 票据信息区域自动识别和提取方法及设备 |
CN105045780A (zh) * | 2015-07-15 | 2015-11-11 | 广州敦和信息技术有限公司 | 一种发票字条语义信息的识别方法及装置 |
CN107633239A (zh) * | 2017-10-18 | 2018-01-26 | 江苏鸿信系统集成有限公司 | 基于深度学习和ocr的票据分类及票据字段提取方法 |
CN109635633A (zh) * | 2018-10-26 | 2019-04-16 | 平安科技(深圳)有限公司 | 电子装置、票据识别方法及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112580640A (zh) * | 2020-06-30 | 2021-03-30 | 北京来也网络科技有限公司 | 一种结合rpa和ai的发票信息的处理方法与装置 |
CN113205349A (zh) * | 2021-04-26 | 2021-08-03 | 临沂职业学院 | 用于发票管理的装置及方法、电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2020253113A1 (zh) | 2020-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109657738B (zh) | 字符识别方法、装置、设备及存储介质 | |
US10679089B2 (en) | Systems and methods for optical character recognition | |
CN109784146B (zh) | 一种字体种类识别方法、电子设备、存储介质 | |
US10740638B1 (en) | Data element profiles and overrides for dynamic optical character recognition based data extraction | |
CN108427959A (zh) | 基于图像识别的机台状态采集方法及系统 | |
US7370059B2 (en) | Model of documents and method for automatically classifying a document | |
CN110619056A (zh) | 发票录入方法、装置、设备及计算机存储介质 | |
CN111507324A (zh) | 卡片边框识别方法、装置、设备和计算机存储介质 | |
CN114648776B (zh) | 一种财务报销数据处理方法和处理系统 | |
CN111582134A (zh) | 证件边沿检测方法、装置、设备和介质 | |
CN110647824B (zh) | 基于计算机视觉技术的增值税发票版面提取方法 | |
JP2008204184A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
CN113569859A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN111079709B (zh) | 一种电子单据的生成方法、装置、计算机设备和存储介质 | |
CN110363092B (zh) | 柱状图识别方法、装置、设备及计算机可读存储介质 | |
CN101609453B (zh) | 一种分隔页、以及利用该分隔页的文件分类的方法和装置 | |
CN115797292A (zh) | 图像质量检测方法、表面缺陷检测方法、设备及存储介质 | |
CN114758384A (zh) | 人脸检测方法、装置、设备及存储介质 | |
JP3735313B2 (ja) | イメージ管理システム、イメージ管理方法及びイメージ管理プログラム | |
CN115265620B (zh) | 一种仪器显示数据的获取录入方法、装置和存储介质 | |
CN114202761B (zh) | 一种基于图片信息聚类的信息批量提取方法 | |
CN112507999B (zh) | 基于视觉特征的非侵入式用户界面输入项识别方法 | |
CN111488752A (zh) | 二维码识别方法、装置、电子设备及存储介质 | |
JP5402417B2 (ja) | 画像処理装置 | |
CN113920513B (zh) | 基于自定义通用模板的文本识别方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20240126 |
|
AD01 | Patent right deemed abandoned |