CN109726710A - 发票信息采集方法、电子装置及可读存储介质 - Google Patents
发票信息采集方法、电子装置及可读存储介质 Download PDFInfo
- Publication number
- CN109726710A CN109726710A CN201811611674.XA CN201811611674A CN109726710A CN 109726710 A CN109726710 A CN 109726710A CN 201811611674 A CN201811611674 A CN 201811611674A CN 109726710 A CN109726710 A CN 109726710A
- Authority
- CN
- China
- Prior art keywords
- invoice
- image
- information
- invoice information
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000015654 memory Effects 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 16
- 230000006835 compression Effects 0.000 claims description 13
- 238000007906 compression Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 11
- 230000000717 retained effect Effects 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 7
- 238000003709 image segmentation Methods 0.000 claims description 4
- 230000029058 respiratory gaseous exchange Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 15
- 238000012015 optical character recognition Methods 0.000 description 48
- 230000006870 function Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
本发明涉及数据采集技术领域,具体提供了基于OCR识别的发票信息采集方法、电子装置及可读存储介质,本发明通过OCR识别技术识别并获取发票图像中的发票信息,然后将识别的发票信息与数据库中的发票信息进行对比;经对比后,无误的发票信息归档存储至数据库;信息有误时,对发票信息和对应的发票图像进行标记,并发出采集错误信号。需要说明的是,发票分为存根联、发票联和副联,逐一通过OCR识别各联内信息,当各联识别的信息与数据库一致时,可认定发票识别无误。因此,通过基于OCR识别的发票信息采集方法、电子装置及可读存储介质识别发票的发票信息,能够减少识别错误。
Description
技术领域
本发明涉及数据采集技术领域,具体涉及利用OCR识别技术(Optical CharacterRecognition,光学字符识别)采集发票信息,更具体的,涉及基于OCR识别的发票信息采集方法、电子装置及可读存储介质。
背景技术
现代社会的各种商业活动,广泛使用各种发票。尽管电子支付、电子发票等发展日益增多,传统纸质发票仍然被广泛使用,如各类纸质发票、金融发票等。
目前,财务部门平均每天有大量的发票影像,每一条发票还分为存根联、发票联和副联,进一步增大了发票影像的数量。财务部门工作中,多岗位员工需要对同一条发票的存根联、发票联和副联进行重复稽核,不仅耗费人力,而且降低了发票信息提取效率。通过OCR识别技术能够实现发票信息的提取,然后将OCR识别技术提取的发票信息存入数据库中,能够大大降低发票信息提取效率,也大大降低了财务人员工作量。
但是,通过OCR识别技术识别发票信息时,也会出现提取信息错误的状况发生,如提取的发票信息在发票库中并不存在,或则提取的发票信息中发票序列号不符合发票规范,再或则提取发票信息时因发票上有污渍导致提取的发票信息与发票本身信息不符等。
发明内容
为了解决现有技术中通过OCR识别技术实现发票信息的提取时,提取信息可能出现错误的问题,本发明提供一种基于OCR识别的发票信息采集方法、电子装置及可读存储介质,以降低发票信息提取的错误概率。
一方面,本发明提供一种基于OCR识别的发票信息采集方法,应用于电子装置,包括如下步骤:
第一步:通过摄像头采集发票图像,将采集到的所述发票图像保存至服务器。该第一步用于完成发票图像的采集和存储。
第二步:对所述发票图像进行预处理与OCR识别处理,通过所述预处理提取所述发票图像中的文本区;通过所述OCR识别处理识别所述预处理提取的所述文本区内文字,获取发票信息。上述预处理的目的是提取发票图像中文本区,然后通过OCR识别技术识别处理文本区内的文字,获取发票的发票信息。
第三步:将所述发票图像压缩保存,将压缩保存的所述发票图像与获取的所述发票信息相关联。将压缩保存的所述发票图像与获取的所述发票信息相关联,便于财务人员随时查看识别的发票信息和与之对应的发票图像,追溯识别的发票信息的原始信息。
第四步:获取数据库存储的发票信息,将上述第二步获取的所述发票信息与数据库中的发票信息进行对比,根据对比结果进行如下操作:
当第二步获取的所述发票信息与数据库中的所述发票信息一致时,将关联后的所述发票图像与所述发票信息存储至数据库。
当第二步获取的所述发票信息与数据库中的所述发票信息不一致时,在关联后的所述发票图像与所述发票信息内添加标记,并发出采集错误信号。
通过识别的发票信息与数据库中的发票信息进行对比,可判断识别的发票信息是否有误,当识别的发票信息和数据库中的发票信息不同时,财务人员可根据标记查看该发票信息及对应的发票图像,然后人工核对发票信息。
优选的,在所述服务器内设置有图像采集触发程序,所述图像采集触发程序根据连续帧图像发出触发信号。所述摄像头处于录像状态,并将录制的视频传输至所述服务器,所述图像采集触发程序读取所述视频;在将发票放置至所述摄像头下方时,所述摄像头录制的所述视频包含所述发票移动的所述连续帧图像,所述图像采集触发程序根据读取到的所述连续帧图像发出所述触发信号,所述摄像头根据所述触发信号进行图片拍摄,通过图片拍摄获取发票图像。
再优选的,上述图像采集触发程序通过以下方式确认连续帧图像:上述图像采集触发程序获取摄像头录制的视频,对视频中的图像序列的帧间图像差进行计算,当相邻帧间图像差小于预设的阈值,且图像的前景像素点数所占比例大于预设的预定值,确认视频包含连续帧图像。
优选的,在第二步中,所述预处理包括如下步骤:设置发票模板框,调整所述发票图像的方向和位置,使所述发票图像位于所述发票模板框内;根据所述发票模板框将所述发票图像分割为文本区和非文本区,提取所述文本区。
优选的,在关联后的所述发票图像与所述发票信息内添加标记后,将关联后的所述发票图像与所述发票信息添加至缓存区域,然后发出采集错误信号。
另一方面,本发明还提供一种电子装置,该电子装置包括:存储器、处理器以及摄像装置,所述存储器中包括预处理程序、OCR识别程序、关联程序和校验程序,所述预处理程序、OCR识别程序、关联程序和校验程序被所述处理器执行时实现如下操作:
所述摄像装置用于拍摄发票,获取发票图像,然后将发票图像保存至服务器。
所述预处理程序用于获取摄像装置拍摄的发票图像,然后提取所述发票图像中的文本区。
所述OCR识别程序用于识别所述文本区内的文字,获取所述文本区内记录的发票信息。
所述关联程序用于将所述发票图像压缩保存,然后将压缩保存的所述发票图像与获取的所述发票信息相关联。
所述校验程序用于对比OCR识别程序识别的所述发票信息和数据库留存的发票信息,当OCR识别程序识别的所述发票信息和数据库留存的发票信息一致时,将关联后的所述发票图像与所述发票信息存储至数据库;当OCR识别程序识别的所述发票信息和数据库留存的发票信息不一致时,在关联后的所述发票图像与所述发票信息内添加标记,并发出采集错误信号。
优选的,所述摄像装置包括拍摄器、触发器和存储器,所述触发器根据连续帧图像发出触发信号,所述触发器和存储器位于服务器内;
所述拍摄器包括摄像头,所述摄像头处于录像状态,并将录制的视频传输至服务器,所述触发器读取所述视频;
在将发票放置至所述摄像头下方时,所述摄像头录制的所述视频包含所述发票移动的所述连续帧图像,所述触发器根据读取的所述连续帧图像发出触发信号,所述摄像头根据所述触发信号进行图片拍摄,通过图片拍摄获取发票图像;
所述存储器与所述摄像头相关联,通过所述摄像头获取发票图像后,存储器将获取到的发票图像保存至服务器。
优选的,所述预处理程序包括与发票对应的发票模板框,所述预处理程序工作时:根据所述发票模板框将所述发票图像分割为文本区和非文本区,提取所述文本区。
优选的,所述校验程序还用于:在关联后的所述发票图像与所述发票信息内添加标记后,将关联后的所述发票图像与所述发票信息添加至缓存区域,然后发出采集错误信号。
再一方面,本发明提供一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现上述的基于OCR识别的发票信息采集方法。
本发明提供的基于OCR识别的发票信息采集方法、电子装置及可读存储介质,通过OCR识别技术获取发票信息,然后将识别的发票信息与数据库中的发票信息进行比对,查找识别的发票信息和数据库内发票信息不同的地方,当识别的发票信息和数据库内发票信息一致时,认为识别的发票信息无误,将关联后的所述发票图像与所述发票信息存储至数据库;当识别的发票信息与数据库中的发票信息不一致时,此时认为识别的发票信息或数据库内存储的发票信息出现错误,在关联后的所述发票图像与所述发票信息内添加标记,并发出采集错误信号,便于财务人员查找发票信息及对应的发票图像,解决该识别的发票信息与数据库中的发票信息不一致的问题。通过上述方式,能够自动核对识别的发票信息是否有误,防止将识别错误的发票信息存储至数据库。
需要说明的是,发票一般分为存根联、发票联和副联,通过OCR识别技术逐一识别各联内信息,提高数据库内发票信息的准确度,当各联识别的信息均与数据库内信息一致时,即可认为发票识别无误。因此,通过本发明的基于OCR识别的发票信息采集方法、电子装置及可读存储介质,能够极大的保证识别的发票信息无误,防止识别错误。
附图说明
通过参考以下流程附图的说明及权利要求书的内容,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:
图1是根据本发明实施例的基于OCR识别的发票信息采集方法的流程示意图。
图2是根据本发明实施例的电子装置中各程序配合工作时信息传输流程图。
图3是根据本发明实施例的电子装置的逻辑结构示意图。
附图中有如下标记:1电子装置;2处理器;3存储器;4计算机程序;101摄像模块、102预处理模块、103OCR识别模块、104关联模块;105校验模块。
在所有附图中相同的标号指示相似或相应的特征或功能。
具体实施方式
在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。在其它例子中,为了便于描述一个或多个实施例,公知的结构和设备以方框图的形式示出。以下将结合附图对本发明的具体实施例进行详细描述。
实施例1
图1提供了根据本发明实施例1的基于OCR识别的发票信息采集方法的流程示意图,如图1所示,本实施例提供的基于OCR识别的发票信息采集方法,应用于电子装置,该基于OCR识别的发票信息采集方法包括如下步骤:
S110:在将发票放置在摄像头下部后,首先通过摄像头采集该发票的发票图像,然后将采集到的该发票图像保存至服务器。该第一步用于完成发票图像的采集和存储,为后期OCR识别提供原始资料,该原始资料即发票图像。该发票的放置,可以通过人工配合放置,也可以通过现有的设备依次放入发票,如该步骤S110,也可以利用现有技术中的自动连续扫描仪实现。
S120:对在步骤S110获取的发票图像进行预处理与OCR识别处理,具体通过预处理提取该发票图像中的文本区;通过OCR识别处理识别上述预处理提取的文本区内文字,该识别的文字是发票的发票信息。上述预处理的目的是提取发票图像中文本区,然后通过OCR识别技术识别处理文本区内的文字,获取发票的发票信息。
S130:在获取发票的发票信息后,将上述发票图像压缩保存,然后将压缩保存的发票图像与获取的与该发票图像对应的发票信息相关联。该步骤S130中将压缩保存的发票图像与获取的发票信息相关联,便于财务人员随时查看识别的发票信息和与之对应的发票图像,追溯识别的发票信息的原始信息,该原始信息即发票图像。
S140:获取数据库存储的发票信息,该据库存储的发票信息可以是发票的原始信息;当需要逐一采集发票的存根联、发票联和副联内的发票信息时,该据库存储的发票信息也可以是之前存储的发票的其它联的发票信息,该其它联的发票信息可以是之前通过OCR识别的发票信息采集方法获取的发票信息。将上述步骤S120获取的发票信息与数据库中的发票信息进行对比,根据对比结果进行如下操作:
当步骤S120中获取的发票信息与数据库中的发票信息一致时,则认为未发现错误,将关联后的所述发票图像与所述发票信息存储至数据库。
当步骤S120中获取的发票信息与数据库中的发票信息不一致时,在关联后的发票图像与发票信息内添加标记,并发出采集错误信号;该步骤添加的标记便于财务人员查找,该采集错误信号便于提醒财务人员出现错误。
上述步骤S110中,摄像头应与服务器相连接,发票图像的采集和存储可以通过以下方式实现:在服务器内设置有图像采集触发程序,该图像采集触发程序根据连续帧图像发出触发信号。具体操作中,摄像头处于录像状态,并将录制的视频传输至服务器,服务器内的图像采集触发程序读取该视频。在将发票放置至所述摄像头下方时发票处于移动状态,该摄像头采集视频,该视频内含有发票移动的连续帧图像,摄像头将采集到的视频发送至服务器后,该图像采集触发程序读取到发票移动的连续帧图像时发出触发信号,摄像头根据该触发信号进行图片拍摄,通过图片拍摄获取发票图像。
上述图像采集触发程序可以通过以下方式确认连续帧图像:上述图像采集触发程序获取摄像头录制的视频,对视频中的图像序列的帧间图像差进行计算,当相邻帧间图像差小于预设的阈值,且图像的前景像素点数所占比例大于预设的预定值,确认视频包含连续帧图像;在确认视频包含连续帧图像后,该图像采集触发程序发出触发信号。
上述步骤S120中,预处理可以通过以下方式实现:首先应预先设置发票模板框,调整步骤S110获取的发票图像的方向和位置,使该发票图像位于发票模板框内;然后根据发票模板框将发票分割为文本区和非文本区;最后提取文本区。由于发票板式固定,只需设置发票模板框,即可直接确认发票图像的文本区,提取该确认的文本区即可实现发票图像的预处理。
上述步骤S140中,在关联后的发票图像与发票信息内添加标记后,还可以有如下操作:将关联后的发票图像与发票信息添加至缓存区域。在将关联后的发票图像与发票信息添加至缓存区域后,再发出采集错误信号。本实施例中,将关联后的发票图像与发票信息添加至缓存区域,便于财务人员快速调取并处理该关联后的发票图像与发票信息。
实施例2
图2提供基于本发明实施例的电子装置中各程序配合工作时信息传输流程图,图3提供基于本发明实施例的电子装置的逻辑结构示意图,如图2和图3所示,本实施例提供一种电子装置,该电子装置1包括:存储器3、处理器4以及摄像装置。在存储器3中含有计算机程序4,计算机程序4包括预处理程序102、OCR识别程序103、关联程序104和校验程序105。上述预处理程序102、OCR识别程序103、关联程序104和校验程序105被处理器执行时实现如下操作:
该摄像装置101用于拍摄发票,获取发票图像,然后将发票图像保存至服务器。为了实现上述目的,可直接得出,摄像安置101应与服务器相连接。在摄像装置101通过图片拍摄获取发票图像后,将发票图像保存至服务器,最终实现发票图像的获取工作。
该预处理程序102用于获取摄像装置拍摄的发票图像,然后提取所述发票图像中的文本区。发票图像中,应包括文本区和非文本区,该预处理程序102的作用是提取发票图像中的文本区,为下一步识别文本区内的文字做准备。该文本区的提取,可通过现有技术中文字区域识别实现。由于发票文本区位置固定,也可通过发票的模板框直接截取固定位置的图像,该固定位置的图像即文本区,此时,该预处理程序包括与发票对应的发票模板框,在预处理程序工作时:根据该发票模板框将发票分割为文本区和非文本区,直接提取所述文本区即可实现预处理程序102的目的。
该OCR识别程序103用于识别所述文本区内的文字,获取所述文本区内记录的发票信息。该OCR识别程序103识别文本区文字的功能,可通过现有技术的OCR识别技术(OpticalCharacter Recognition,光学字符识别)实现。
该关联程序104用于将发票图像压缩保存,然后将压缩保存的发票图像与获取的发票信息相关联。该关联处理,能够便于根据发票图像查找发票信息,便于根据发票信息查找发票图像,便于财务人员查找识别的发票信息及对应的发票图像。
该校验程序105用于对比OCR识别程序识别的发票信息和数据库内留存的发票信息,当OCR识别程序识别的发票信息和数据库留存的发票信息一致时,将关联后的所述发票图像与所述发票信息存储至数据库。当OCR识别程序识别的所述发票信息和数据库留存的发票信息不一致时,则认为数据库内的发票信息和OCR识别程序识别的发票信息至少有一种是错误的;在关联后的发票图像与发票信息内添加标记,便于财务人员查找,同时并发出采集错误信号,提醒财务人员对该识别的发票信息及对应的发票图像进行处理;当然,为了便于财务人员快速处理该识别的发票信息与数据库内发票不一致的问题,在添加标记后,可以将将关联后的所述发票图像与所述发票信息添加至缓存区域,然后再发出采集错误信号。
为了达到采集发票图像的目的,该摄像装置101应至少包括能够录制视频和图像拍摄的拍摄器,该拍摄器可以包括摄像头,为了便于放置发票,该摄像装置也可以包括发票放置台;摄像头用于拍摄发票放置台上的发票,当然,该发票放置台并非本实施例电子装置的必要部件。
同时,该摄像装置101也可以包括触发器和存储器,该触发器根据连续帧图像发出触发信号,触发器和存储器均位于服务器内。上述摄像头处于录像状态,并将录制的视频传输至服务器,触发器读取该录制的视频。在将发票放置至摄像头下方时(当有发票放置台时,将发票放置在摄像头下方的发票放置台上),摄像头录制的视频中包含发票移动的连续帧图像,上述触发器根据读取的连续帧图像发出触发信号,摄像头根据该触发信号进行图片拍摄,通过图片拍摄获取发票图像。通过图片拍摄获取发票图像后,启动与摄像头相关联的存储器,通过存储器将获取到的发票图像保存至服务器。
上述触发器可以通过以下方式确认连续帧图像:上述触发器获取摄像头录制的视频,对视频中的图像序列的帧间图像差进行计算,当相邻帧间图像差小于预设的阈值,且图像的前景像素点数所占比例大于预设的预定值,确认视频包含连续帧图像,此时该触发器发出触发信号。
其中,一个或多个程序可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在电子装置1中的执行过程。
电子装置1可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。电子装置1可包括,但不仅限于,处理器2、存储器3。本领域技术人员可以理解,并不构成对电子装置1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如电子装置1还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是控制器、微控制器、微处理器,或者该处理器也可以是任何常规的处理器等。用于执行测试任务输入程序、测试人员输入程序、测试任务分配程序和测试任务触发程序。
存储器3可以是电子装置1的内部存储单元,例如电子装置1的硬盘或内存。存储器3也可以是电子装置1的外部存储设备,例如电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、多媒体卡、卡型存储器、磁性存储器、磁盘和光盘等。进一步地,存储器还可以既包括终端设备的内部存储单元也包括外部存储设备。存储器用于存储计算机程序以及电子设备所需的其他程序和数据。存储器还可以用于暂时地存储已经输出或者将要输出的数据。
实施例3
本发明还提供一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如实施例1的基于OCR识别的发票信息采集方法的步骤。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块和程序的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块和程序完成,即将装置的内部结构划分成不同的功能单元、模块或程序,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块和程序可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块和程序的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。电子装置中单元、模块和程序的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
上述基于OCR识别的发票信息采集方法、电子装置及可读存储介质,通过OCR识别技术获取发票信息,将识别的发票信息与数据库中的发票信息进行比对,查找识别的发票信息和数据库内发票信息不同的地方,当识别的发票信息和数据库内发票信息一致时,认为识别的发票信息无误,将关联后的所述发票图像与所述发票信息存储至数据库;当识别的发票信息与数据库中的发票信息不一致时,此时认为识别的发票信息或数据库内存储的发票信息出现错误,在关联后的所述发票图像与所述发票信息内添加标记,并发出采集错误信号,便于财务人员查找发票信息及对应的发票图像,解决该识别的发票信息与数据库中的发票信息不一致的问题。通过上述方式,能够自动核对识别的发票信息是否有误,防止将识别错误的发票信息存储至数据库。
需要说明的是,发票一般分为存根联、发票联和副联,通过OCR识别技术逐一识别各联内信息,能够提高数据库内发票信息的准确度,当各联识别的信息均与数据库内信息一致时,即可认为发票识别无误。因此,通过本发明的基于OCR识别的发票信息采集方法、电子装置及可读存储介质,能够极大的保证识别的发票信息无误,防止识别错误。
如上参照附图以示例的方式描述了根据本发明的基于OCR识别的发票信息采集方法、电子装置及可读存储介质。但是,本领域技术人员应当理解,对于上述本发明所提出的基于OCR识别的发票信息采集方法、电子装置及可读存储介质,还可以在不脱离本发明内容的基础上做出各种改进。因此,本发明的保护范围应当由所附的权利要求书的内容确定。
Claims (10)
1.一种基于OCR识别的发票信息采集方法,应用于电子装置,其特征在于,包括如下步骤:
第一步:通过摄像头采集发票图像,将采集到的所述发票图像保存至服务器;
第二步:对所述发票图像进行预处理与OCR识别处理,通过所述预处理提取所述发票图像中的文本区;通过所述OCR识别处理识别所述预处理提取的所述文本区内文字,获取发票信息;
第三步:将所述发票图像压缩保存,将压缩保存的所述发票图像与获取的所述发票信息相关联;
第四步:获取数据库存储的发票信息,将第二步获取的所述发票信息与所述数据库中的所述发票信息进行对比,根据对比结果进行如下操作:
当第二步获取的所述发票信息与数据库中的所述发票信息一致时,将关联后的所述发票图像与所述发票信息存储至数据库;
当第二步获取的所述发票信息与数据库中的所述发票信息不一致时,在关联后的所述发票图像与所述发票信息内添加标记,并发出采集错误信号。
2.如权利要求1所述的基于OCR识别的发票信息采集方法,其特征在于,在所述服务器内设置有图像采集触发程序,所述图像采集触发程序根据连续帧图像发出触发信号;
所述摄像头处于录像状态,并将录制的视频传输至所述服务器,所述图像采集触发程序读取所述视频;
在将发票放置至所述摄像头下方时,所述摄像头录制的所述视频包含所述发票移动的所述连续帧图像,所述图像采集触发程序根据读取到的所述连续帧图像发出所述触发信号,所述摄像头根据所述触发信号进行图片拍摄,通过图片拍摄获取发票图像。
3.如权利要求2所述的基于OCR识别的发票信息采集方法,其特征在于,所述图像采集触发程序通过以下方式确认连续帧图像:所述图像采集触发程序获取所述摄像头录制的视频,对所述视频中的图像序列的帧间图像差进行计算,当相邻帧间图像差小于预设的阈值,且图像的前景像素点数所占比例大于预设的预定值,确认所述视频包含连续帧图像。
4.如权利要求1所述的基于OCR识别的发票信息采集方法,其特征在于,第二步中,所述预处理包括如下步骤:
设置发票模板框,调整所述发票图像的方向和位置,使所述发票图像位于所述发票模板框内;
根据所述发票模板框将所述发票图像分割为文本区和非文本区,提取所述文本区。
5.如权利要求1所述的基于OCR识别的发票信息采集方法,其特征在于,在关联后的所述发票图像与所述发票信息内添加标记后,将关联后的所述发票图像与所述发票信息添加至缓存区域,然后发出采集错误信号。
6.一种电子装置,该电子装置包括:存储器、处理器以及摄像装置,其特征在于,所述存储器中包括预处理程序、OCR识别程序、关联程序和校验程序,所述预处理程序、OCR识别程序、关联程序和校验程序被所述处理器执行时实现如下操作:
所述摄像装置用于拍摄发票,获取发票图像,然后将发票图像保存至服务器;
所述预处理程序用于获取摄像装置拍摄的发票图像,然后提取所述发票图像中的文本区;
所述OCR识别程序用于识别所述文本区内的文字,获取所述文本区内记录的发票信息;
所述关联程序用于将所述发票图像压缩保存,然后将压缩保存的所述发票图像与获取的所述发票信息相关联;
所述校验程序用于对比OCR识别程序识别的所述发票信息和数据库留存的发票信息,当OCR识别程序识别的所述发票信息和数据库留存的发票信息一致时,将关联后的所述发票图像与所述发票信息存储至数据库;当OCR识别程序识别的所述发票信息和数据库留存的发票信息不一致时,在关联后的所述发票图像与所述发票信息内添加标记,并发出采集错误信号。
7.如权利要求6所述的电子装置,其特征在于,所述摄像装置包括拍摄器、触发器和存储器,所述触发器根据连续帧图像发出触发信号,所述触发器和存储器位于服务器内;
所述拍摄器包括摄像头,所述摄像头处于录像状态,并将录制的视频传输至服务器,所述触发器读取所述视频;
在将发票放置至所述摄像头下方时,所述摄像头录制的所述视频包含所述发票移动的所述连续帧图像,所述触发器根据读取的所述连续帧图像发出触发信号,所述摄像头根据所述触发信号进行图片拍摄,通过图片拍摄获取发票图像;
所述存储器与所述摄像头相关联,通过所述摄像头获取发票图像后,存储器将获取到的发票图像保存至服务器。
8.如权利要求6所述的电子装置,其特征在于,所述预处理程序包括与发票对应的发票模板框,所述预处理程序工作时:根据所述发票模板框将所述发票图像分割为文本区和非文本区,提取所述文本区。
9.如权利要求6所述的电子装置,其特征在于,所述校验程序还用于:在关联后的所述发票图像与所述发票信息内添加标记后,将关联后的所述发票图像与所述发票信息添加至缓存区域,然后发出采集错误信号。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任意一项所述的基于OCR识别的发票信息采集方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811611674.XA CN109726710A (zh) | 2018-12-27 | 2018-12-27 | 发票信息采集方法、电子装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811611674.XA CN109726710A (zh) | 2018-12-27 | 2018-12-27 | 发票信息采集方法、电子装置及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109726710A true CN109726710A (zh) | 2019-05-07 |
Family
ID=66296548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811611674.XA Pending CN109726710A (zh) | 2018-12-27 | 2018-12-27 | 发票信息采集方法、电子装置及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109726710A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415424A (zh) * | 2019-06-17 | 2019-11-05 | 众安信息技术服务有限公司 | 一种防伪鉴定方法、装置、计算机设备和存储介质 |
CN110659607A (zh) * | 2019-09-23 | 2020-01-07 | 天津车之家数据信息技术有限公司 | 数据核对方法、装置、系统及计算设备 |
CN111683115A (zh) * | 2020-04-28 | 2020-09-18 | 中国平安财产保险股份有限公司 | 基于图像识别的票据信息云存储方法、系统及计算机设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737242A (zh) * | 2012-06-12 | 2012-10-17 | 丰豪盈彩(北京)科技有限公司 | 应用于移动终端的票据自动识别方法和系统 |
CN105528604A (zh) * | 2016-01-31 | 2016-04-27 | 华南理工大学 | 一种基于ocr的票据自动识别与处理系统 |
CN105608452A (zh) * | 2014-11-11 | 2016-05-25 | 金蝶软件(中国)有限公司 | 单据录入的方法和系统 |
CN109087155A (zh) * | 2018-06-19 | 2018-12-25 | 优识云创(北京)科技有限公司 | 一种发票管理的方法和设备 |
-
2018
- 2018-12-27 CN CN201811611674.XA patent/CN109726710A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102737242A (zh) * | 2012-06-12 | 2012-10-17 | 丰豪盈彩(北京)科技有限公司 | 应用于移动终端的票据自动识别方法和系统 |
CN105608452A (zh) * | 2014-11-11 | 2016-05-25 | 金蝶软件(中国)有限公司 | 单据录入的方法和系统 |
CN105528604A (zh) * | 2016-01-31 | 2016-04-27 | 华南理工大学 | 一种基于ocr的票据自动识别与处理系统 |
CN109087155A (zh) * | 2018-06-19 | 2018-12-25 | 优识云创(北京)科技有限公司 | 一种发票管理的方法和设备 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415424A (zh) * | 2019-06-17 | 2019-11-05 | 众安信息技术服务有限公司 | 一种防伪鉴定方法、装置、计算机设备和存储介质 |
CN110415424B (zh) * | 2019-06-17 | 2022-02-11 | 众安信息技术服务有限公司 | 一种防伪鉴定方法、装置、计算机设备和存储介质 |
CN110659607A (zh) * | 2019-09-23 | 2020-01-07 | 天津车之家数据信息技术有限公司 | 数据核对方法、装置、系统及计算设备 |
CN111683115A (zh) * | 2020-04-28 | 2020-09-18 | 中国平安财产保险股份有限公司 | 基于图像识别的票据信息云存储方法、系统及计算机设备 |
CN111683115B (zh) * | 2020-04-28 | 2024-04-12 | 中国平安财产保险股份有限公司 | 基于图像识别的票据信息云存储方法、系统及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105528604B (zh) | 一种基于ocr的票据自动识别与处理系统 | |
CN110348441B (zh) | 增值税发票识别方法、装置、计算机设备及存储介质 | |
CN108717543B (zh) | 一种发票识别方法及装置、计算机存储介质 | |
CN109726710A (zh) | 发票信息采集方法、电子装置及可读存储介质 | |
CN103295034B (zh) | 一种基于dsp的嵌入式图书乱架清点系统及方法 | |
CN109741517A (zh) | 一种发票查验方法、装置和系统 | |
CN105787466B (zh) | 一种车辆类型的精细识别方法及系统 | |
CN107679997A (zh) | 医疗理赔拒付方法、装置、终端设备及存储介质 | |
CN105677728A (zh) | 物体图像识别分类管理方法 | |
CN106056083B (zh) | 一种信息处理方法及终端 | |
CN111428599A (zh) | 票据识别方法、装置和设备 | |
CN110490238A (zh) | 一种图像处理方法、装置及存储介质 | |
CN109446689A (zh) | 直流换流站二次系统图纸识别方法及系统 | |
CN110634223A (zh) | 票据校验方法及装置 | |
CN111784675A (zh) | 物品纹理信息处理的方法、装置、存储介质及电子设备 | |
CN113379526A (zh) | 智能发票报销方法、装置、电子设备及计算机存储介质 | |
CN113408465A (zh) | 身份识别方法、装置及相关设备 | |
CN108090982A (zh) | 一种签到方法、系统及终端设备 | |
CN104574087A (zh) | 一种食堂定向小额支付方法及系统 | |
CN110443653A (zh) | 订单处理方法、装置及电子设备 | |
CN109448193A (zh) | 身份信息识别方法及装置 | |
CN112434049A (zh) | 表格数据存储方法、装置、存储介质及电子装置 | |
CN106557450B (zh) | 一种快递提取设备身份认证方法及快递提取设备 | |
CN116798061A (zh) | 一种票据审核识别方法、装置、终端和存储介质 | |
CN105718972B (zh) | 一种信息智能采集方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |