CN109766778A - 基于ocr技术的发票信息录入方法、装置、设备及存储介质 - Google Patents
基于ocr技术的发票信息录入方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN109766778A CN109766778A CN201811555100.5A CN201811555100A CN109766778A CN 109766778 A CN109766778 A CN 109766778A CN 201811555100 A CN201811555100 A CN 201811555100A CN 109766778 A CN109766778 A CN 109766778A
- Authority
- CN
- China
- Prior art keywords
- invoice
- image
- original
- field value
- information input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
本发明公开了一种基于OCR技术的发票信息录入方法,所述发票信息录入方法包括:获取终端设备发送的原始发票图像;对所述原始发票图像进行版面分析;若版面分析的结果满足预设条件时,对所述原始发票图像进行预处理,获取待识别发票数据;通过OCR模型对所述待识别发票数据进行文字识别,获取发票上的字段值;对所获取到的字段值进行后处理优化;将后处理优化后的字段值发送至开票系统。本发明解决了现有发票信息录入开票系统的过程繁琐、效率低下的问题,节省了手动输入发票信息的时间、也避免发票信息输入错误的问题,有效地提高了开具发票的效率。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种基于光学字符识别(Optical CharacterRecognition,OCR)技术的发票信息录入方法、装置、设备及存储介质。
背景技术
在外消费需要开具发票时,一般是由消费者提供发票信息给开票单位,开票单位通过人工录入的方式将所述发票信息录入开票系统,或者通过授权后由消费者通过人工录入的方式将所述发票信息录入开票系统。所述发票信息,不仅包括发票抬头,还包括开户行及账号、纳税人识别号、地址信息、电话号码等,内容多且繁琐,开票过程效率低下,且容易出现录入错误的问题。
因此,寻找一种实现发票信息自动录入开票系统的方法成为本领域技术人员亟需解决的问题。
发明内容
本发明实施例提供了一种基于OCR技术的发票信息录入方法、装置、设备及存储介质,以解决现有发票信息录入开票系统的过程繁琐、效率低下的问题。
一种基于OCR技术的发票信息录入方法,包括:
获取终端设备发送的原始发票图像;
对所述原始发票图像进行版面分析;
若版面分析的结果满足预设条件时,对所述原始发票图像进行预处理,获取待识别发票数据;
通过OCR模型对所述待识别发票数据进行文字识别,获取发票上的字段值;
对所获取到的字段值进行后处理优化;
将后处理优化后的字段值发送至开票系统。
进一步地,所述对所述原始发票图像进行版面分析包括:
通过Laplacian梯度函数获取所述原始发票图像的清晰度,并判断所述清晰度是否大于或等于第一预设阈值;
通过霍夫变换获取所述原始发票图像的倾斜角度,并判断所述倾斜角度是否小于或等于第二预设阈值。
进一步地,所述若版面分析的结果满足预设条件时,对所述原始发票图像进行预处理,获取待识别发票数据包括:
若所述清晰度大于或等于第一预设阈值且倾斜角度小于或等于第二预设阈值,对所述原始发票图像进行灰度化处理;
对灰度化后的原始发票图像进行二值化处理;
对二值化后的原始发票图像进行降噪处理;
对降噪处理后的原始发票图像进行倾斜校正;
对倾斜校正后的原始发票图像进行文字切分,得到原始发票图像上的字符信息,以所述字符信息作为待识别发票数据。
进一步地,所述对所获取到的字段值进行后处理优化包括:
对所获取到的字段值进行分词;
将每一分词与词库中的词组进行比较,以修正所述字段值。
进一步地,在对所获取到的字段值进行后处理优化之后,还包括:
将后处理优化后的字段值发送至所述终端设备;
接收所述终端设备发送的确认消息,根据所述确认消息将后处理优化后的字段值发送至开票系统。
进一步地,所述方法还包括:
若所述清晰度小于所述第一预设阈值或者所述倾斜角度大于所述第二预设阈值,生成重拍提示消息;
将所述重拍提示消息发送至所述终端设备。
一种基于OCR技术的发票信息录入装置,包括:
图像获取模块,用于获取终端设备发送的原始发票图像;
版面分析模块,用于对所述原始发票图像进行版面分析;
预处理模块,用于若版面分析的结果满足预设条件时,对所述原始发票图像进行预处理,获取待识别发票数据;
OCR识别模块,用于通过OCR模型对所述待识别发票数据进行文字识别,获取发票上的字段值;
后处理模块,用于对所获取到的字段值进行后处理优化;
第一发送模块,用于将后处理优化后的字段值发送至开票系统。
进一步地,所述版面分析模块包括:
清晰度分析单元,用于通过laplacian梯度函数获取所述原始发票图像的清晰度,并判断所述清晰度是否大于或等于第一预设阈值;
倾斜角度分析单元,用于通过霍夫变换获取所述原始发票图像的倾斜角度,并判断所述倾斜角度是否小于或等于第二预设阈值。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于OCR技术的发票信息录入方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于OCR技术的发票信息录入方法。
本发明实施例通过获取终端设备发送的原始发票图像;对所述原始发票图像进行版面分析;若版面分析的结果满足预设条件时,对所述原始发票图像进行预处理,获取待识别发票数据;通过OCR模型对所述待识别发票数据进行文字识别,获取发票上的字段值;对所获取到的字段值进行后处理优化;将后处理优化后的字段值发送至开票系统执行开票操作,从而节省了手动输入发票信息的时间、也避免发票信息输入错误的问题,解决了现有发票信息录入开票系统的过程繁琐、效率低下的问题,有效地提高了开具发票的效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于OCR技术的发票信息录入方法的一应用环境示意图;
图2是本发明一实施例中基于OCR技术的发票信息录入方法的一流程图;
图3是本发明一实施例中基于OCR技术的发票信息录入方法中步骤202的一流程图;
图4是本发明一实施例中基于OCR技术的发票信息录入方法中步骤S202的一流程图;
图5是本发明一实施例中基于OCR技术的发票信息录入方法中步骤S203的一流程图;
图6是本发明一实施例提供的发票信息画框定位示意图;
图7是本发明一实施例中基于OCR技术的发票信息录入方法的一流程图;
图8是本发明一实施例中基于OCR技术的发票信息录入装置的一原理框图;
图9是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于OCR技术的发票信息录入方法,可应用在如图1的应用环境中,包括终端设备、服务器和开票系统,两两之间可以通过网络进行通信。所述服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。其中,所述终端设备为开票请求方,用于发起基于OCR技术的发票录入流程。在这里,所述终端设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。所述服务器为OCR识别服务提供方,用于执行对发票信息的识别及录入操作。所述开票系统为开票服务提供方。
在一实施例中,如图2所示,提供一种基于OCR技术的发票信息录方法,以该方法应用在图1中服务器为例进行说明,包括如下步骤:
在步骤S201中,获取终端设备发送的原始发票图像。
在这里,本发明实施例预先在开票系统的开票页面上提供了信息采集功能。用户在终端设备上进行发票信息录入时,可通过启动开票系统提供的信息采集功能获取原始发票图像,然后将所述原始发票图像发送至服务器。服务器获取终端设备发送的原始发票图像。其中,所述信息采集功能包括但不限于相机的拍摄功能或相册的本地上传功能。所述原始发票图像为包含目标发票信息的图像,所述目标发票信息在图像中可以通过手写文本、印刷体文本的方式呈现。所述用户可以是商户或者消费者任意一方,具体根据开票情景决定,此处不作限制。
在步骤S202中,对所述原始发票图像进行版面分析。
从终端设备获取到的原始发票图像,可能存在模糊、损坏等各种影响识别的问题。鉴于此,本发明实施例在通过OCR识别技术进行文字识别获取发票信息之前,先通过预设的版面分析模块对所述原始发票图像进行初步分析。
在这里,版面分析是指对原始发票图像的清晰度、倾斜角度进行分析,以便筛选出清晰的图像进行后续的OCR识别。其中,清晰度是指图像层次对景物质点的分辨率或细微层次质感的精细程度;倾斜角度是指可以从不同方向观察屏幕上所有内容的角度。当且仅当所述原始发票图像的清晰度、倾斜角度均满足对应的预设条件时,对所述发票图像进行预处理,获取待识别发票数据,以提高所获取的待识别发票数据的质量。
可选地,作为本发明的一个优选示例,如图3所示,所述步骤S202对所述原始发票图像进行版面分析可以包括:
在步骤S301中,通过Laplacian梯度函数获取所述原始发票图像的清晰度。
在这里,本发明实施例使用Laplacian梯度函数来计算原始发票图像的清晰度。Laplacian梯度函数译为拉普拉斯梯度函数,其采用Laplacian算子分别提取水平和垂直方向的梯度。基于Laplacian梯度函数的图像清晰度的定义如下:
D(f)=∑y∑x|G(x,y)|G(x,y)>T
其中,T为给定的边缘检测阈值,G(x,y)是像素点(x,y)处Laplacian算子的卷积,Laplacian算子定义如下:
在步骤S302中,判断所述清晰度是否大于或等于第一预设阈值。
在这里,Laplacian梯度函数衡量的指标是经过Laplacian算子处理后的图像的平均灰度值,值越大,代表原始发票图像越清晰。本发明实施例预先根据经验设置了第一预设阈值,所述第一预设阈值作为判断所述原始发票图像的清晰度是否满足要求的标准。若所述原始发票图像的清晰度大于或等于所述第一预设阈值时,所述原始发票图像的清晰度满足要求的标准,否则,所述原始发票图像的清晰度不满足要求的标准。
可选地,作为本发明的另一个优选示例,如图4,所述步骤S202对所述原始发票图像进行版面分析还可以包括:
在步骤401中,通过霍夫变换获取所述原始发票图像的倾斜角度。
在这里,本发明实施例使用霍夫变换(hough变换)来计算原始发票图像的倾斜角度。根据hough变换,在变量空间N个点分布在同一直线上,各个点在参数空间中按照倾斜角度均匀提取M条直线,则M*N条直线会在参数空间中有一个重叠数目达到M的点,该点对应的变量空间的直线的倾斜角度便是原始发票图像的倾斜角度。
在步骤S402中,判断所述倾斜角度是否小于或等于第二预设阈值。
由于图像的不可控性,总会存在一定的角度倾斜,倾斜角度越大,代表原始发票图像越容易产生误判。本发明实施例预先根据经验设置了第二预设阈值,所述第二预设阈值作为判断所述原始发票图像的倾斜角度是否满足要求的标准。若所述原始发票图像的倾斜角度小于或等于所述第二预设阈值时,即所述原始发票图像的倾斜角度在可接受的第二预设阈值范围内,所述原始发票图像的倾斜角度满足要求的标准,否则,所述原始发票图像的倾斜角度不满足要求的标准。可选地,根据经验判断,所述第二预设阈值优选为2度。
在步骤S203中,若版面分析的结果满足预设条件时,对所述原始发票图像进行预处理,获取待识别发票数据。
如前所述,版面分析的结果包括对清晰度的分析结果和对倾斜角度的分析结果。若所述清晰度大于或等于第一预设阈值且倾斜角度小于或等于第二预设阈值,判定所述原始发票图像的版面分析满足预设条件,对所述原始发票图像进行预处理。
在这里,本发明实施例在对原始发票图像进行文字识别之前,先对所述原始发票图像进行预处理,以减少图像中的无用信息,方便后续进行特征提取、学习。可选地,在本发明实施例中,所述预处理主要使用黑白二值法,逐步将所有文字区域部分进行画框定位并存储相应的区域块坐标。其原理主要是对版面划分、更改划分,即对版面的理解、自切化、归一化等,告知OCR模型将同一版面的中英文字体、图像、表格、横版竖版方式等分开,以便于区分处理,以及告知OCR模型按照指定的顺序进行识别。可选地,如图5所示,所述步骤S203对所述原始发票图像进行预处理,获取待识别发票数据包括:
在步骤S501中,对所述原始发票图像进行灰度化处理。
在这里,本发明实施例通过对原始发票图像进行灰度化处理,获取灰度图,可以有效排除色彩干扰,降低图像的复杂度和信息处理量,以提高发票信息识别的效率,进而提高开票的效率。
在步骤S502中,对灰度化后的原始发票图像进行二值化处理。
通过二值化处理,原始发票图像只剩下两种颜色,即黑和白,其中一种颜色为图像背景,另一种颜色为待识别的文字。可选地,在本发明实施例中,所述二值化处理的方法包括但不限于双峰法、P参数法、迭代法和OTSU法。
在步骤S503中,对二值化后的原始发票图像进行降噪处理。
由于图像采集、传输、压缩等各个环节都会使得图像产生噪声,比如图像信号受到突如起来的强烈干扰、类比数位转换器或位元传输错误产生的椒盐噪声。图像中的噪声会极大地干扰到对图像的切割和识别,因此需要对原始发票图像进行降噪处理。可选地,在本发明实施例中,对原始发票图像降噪的方法包括但不限于均值滤波器、自适应维纳滤波器、中值滤波器、形态学噪声滤波器、小波去噪。本发明实施例通过降噪处理,有利于改善后续OCR识别过程中的特征提取的效果。
在步骤S504中,对降噪处理后的原始发票图像进行倾斜校正。
本发明实施例基于霍夫变换获取到的倾斜角度对降噪处理后的原始发票图像执行校正,即对原始发票图像做旋转处理找到最合适的水平位置,以矫正倾斜的文字行,为文字切分做准备。
在步骤S505中,对倾斜校正后的原始发票图像进行文字切分,得到原始发票图像上的字符信息,以所述字符信息作为待识别发票数据。
发票票面上通常具有多行文本,需要进行文字切分。文字切分包括行切分与字符切分两个步骤。本发明实施例首先将倾斜校正后的文字投影到Y轴,将所有值累加,得到一个在Y轴上的直方图。其中,直方图的谷底是背景,峰值为前景所在的区域,即文字,从而将每行文字的位置识别出来,并进行画框定位,并获取相应的区域块坐标进行存储。然后再将每行文字投影到X轴,对每行文字进行字符切分。
图6为本发明实施例提供的发票信息画框定位示意图。如图6所示,地址“沈阳XXXX信息系统有限公司”、纳税人识别号“2101*******2188”、地址信息“沈阳市AA新区BB街C号DD软件园A6024”、电话号码“83****1”以及开户行“招商银行YY支行”、账号“1249******0101”进行了画框定位。
在步骤S204中,通过OCR模型对所述待识别发票数据进行文字识别,获取发票上的字段值。
在通过所述版面分析模块对所述原始发票图像进行版面分析及预处理,得到待识别发票数据后,本发明实施例通过调用接口的方式,将所述待识别发票数据输入预先训练好的OCR模型进行字符识别。所述OCR模型是预先以大量的印刷体或者手写版的发票信息作为训练样本进行训练所得的字符识别模型。
在这里,本发明实施例通过OCR模型主要获取原始发票图像上的字段对应的字段值,所述字段值包含文字和/或标点符号。其中,所述字段包括但不限于购买方的名称、纳税人识别号、地址、电话、开户行及账号、销售方的名称、纳税人识别号、地址、电话、开户行及账号、货物、应税劳务、服务。
在步骤S205中,对所获取到的字段值进行后处理优化。
在这里,后处理是指对识别出来的字段值采用词组方式进行上下匹配,即将字段值进行分词,与词库中的词组进行比较,进一步修正识别出来的字段值,以提高系统的识别率,减少误识率。可选地,在本发明实施例中,所述后处理包括对字段值中的形近字的后处理和对文字排版的后处理。
在步骤S206中,将后处理优化后的字段值发送至开票系统。
在得到原始发票图像上的字段值后,将所述字段值发送至开票系统,以使得所述开票系统根据所述字段值启动开票流程,生成发票代码和发票号码,完成开票操作。
综上所述,本发明实施例通过在开票系统的开票页面上增加信息采集功能,在用户使用开票系统录入发票信息时,通过所述信息采集功能对发票样品或样例进行图像采集;然后基于所采集到的图像信息,采用OCR识别技术获取所需的字段值,并将字段值反馈至开票系统执行开票操作,从而有效地节省了手动输入发票信息的时间、也避免发票信息输入错误的问题,极大地提高了开具发票的效率。
可选地,在本发明的另一个实施例中,如图7所示,所述基于OCR技术的发票信息录入方法包括:
步骤S701至步骤S705,其中步骤S701至步骤S705与图2实施例中所述的步骤S201至步骤S205相同,具体请参见上述示例的叙述,此处不再赘述。在步骤S705对所获取到的字段值进行后处理优化之后,所述方法还包括:
在步骤S706中,将后处理优化后的字段值发送至所述终端设备;
在得到原始发票图像上的字段值后,本发明实施例还可以将所述字段值返回至终端设备,以使得所述终端设备将所获取的字段值填充至开票页面的相应输入框中,供用户查看确认,有效地避免了发票信息识别出错的概率。
在步骤S707中,接收所述终端设备发送的确认消息,根据所述确认消息将后处理优化后的字段值发送至开票系统。
在这里,开票系统的开票页面上还提供了“确认”的功能标识。若用户对终端设备展示的字段值确认无误后,即通过OCR识别得到的发票信息准确无误,可以通过触发所述“确认”功能标识输入确认消息。终端设备将所述确认消息发送至服务器,服务器根据所述确认消息认定所述字段值有效,则将所述字段值发送至开票系统完成开票操作,不仅有效地节省了手动输入发票信息的时间、提高了开具发票的效率,而且进一步地保证了发票的准确度。
如前所述,版面分析的结果包括对清晰度的分析结果和对倾斜角度的分析结果。若所述清晰度大于或等于第一预设阈值且倾斜角度小于或等于第二预设阈值,判定所述原始发票图像的版面分析满足预设条件,对所述原始发票图像进行预处理。在本发明的另一个实施例中,若所述清晰度小于所述第一预设阈值或者所述倾斜角度大于所述第二预设阈值,判定所述原始发票图像的版面分析未满足预设条件,所述方法还包括:
生成重拍提示消息;
将所述重拍提示消息发送至所述终端设备。
在这里,若所述原始发票图像经过版面分析后,由于清晰度小于所述第一预设阈值或者倾斜角度大于所述第二预设阈值时,表明所述原始发票图像过于模糊,则提示重新拍摄,直至获得较清晰的原始发票图像。其中,所述重拍提示消息中还可以包括清晰度未满足要求或者倾斜角度未满足要求的指示信息,以使得终端设备接收并展示该指示信息,协助用户获取满足预设条件的原始发票图像,提高开票的效率以及提高后续对原始发票图像进行识别的准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种基于OCR技术的发票信息录入装置,该基于OCR技术的发票信息录入装置与上述实施例中基于OCR技术的发票信息录入方法一一对应。如图8所示,该基于OCR技术的发票信息录入装置包括图像获取模块、版面分析模块、预处理模块、OCR识别模块、后处理模块、第一发送模块。各功能模块详细说明如下:
图像获取模块81,用于获取终端设备发送的原始发票图像;
版面分析模块82,用于对所述原始发票图像进行版面分析;
预处理模块83,用于若版面分析的结果满足预设条件时,对所述原始发票图像进行预处理,获取待识别发票数据;
OCR识别模块84,用于通过OCR模型对所述待识别发票数据进行文字识别,获取发票上的字段值;
后处理模块85,用于对所获取到的字段值进行后处理优化;
第一发送模块86,用于将后处理优化后的字段值发送至开票系统。
可选地,所述版面分析模块包括:
清晰度分析单元,用于通过laplacian梯度函数获取所述原始发票图像的清晰度,并判断所述清晰度是否大于或等于第一预设阈值;
倾斜角度分析单元,用于通过霍夫变换获取所述原始发票图像的倾斜角度,并判断所述倾斜角度是否小于或等于第二预设阈值。
可选地,所述预处理模块包括:
灰度化单元,用于若所述清晰度大于或等于第一预设阈值且倾斜角度小于或等于第二预设阈值,对所述原始发票图像进行灰度化处理;
二值化单元,用于对灰度化后的原始发票图像进行二值化处理;
降噪单元,用于对二值化后的原始发票图像进行降噪处理;
倾斜校正单元,用于对降噪处理后的原始发票图像进行倾斜校正;
文字切分单元,用于对倾斜校正后的原始发票图像进行文字切分,得到原始发票图像上的字符信息,以所述字符信息作为待识别发票数据。
可选地,所述装置还包括:
第二发送模块,用于将后处理优化后的字段值发送至所述终端设备;
所述第一发送模块还用于,接收所述终端设备发送的确认消息,根据所述确认消息将后处理优化后的字段值发送至开票系统。
可选地,所述装置还包括:
生成模块,用于若所述清晰度小于所述第一预设阈值或者所述倾斜角度大于所述第二预设阈值,生成重拍提示消息;
所述第二发送模块还用于,将所述重拍提示消息返回发送至所述终端设备。
可选地,所述后处理模块包括:
分词单元,用于对所获取到的字段值进行分词;
修正单元,用于将每一分词与词库中的词组进行比较,以修正所述字段值。
关于基于OCR技术的发票信息录入装置的具体限定可以参见上文中对于基于OCR技术的发票信息录入方法的限定,在此不再赘述。上述基于OCR技术的发票信息录入装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于OCR技术的发票信息录入方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
获取终端设备发送的原始发票图像;
对所述原始发票图像进行版面分析;
若版面分析的结果满足预设条件时,对所述原始发票图像进行预处理,获取待识别发票数据;
通过OCR模型对所述待识别发票数据进行文字识别,获取发票上的字段值;
对所获取到的字段值进行后处理优化;
将后处理优化后的字段值发送至开票系统。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取终端设备发送的原始发票图像;
对所述原始发票图像进行版面分析;
若版面分析的结果满足预设条件时,对所述原始发票图像进行预处理,获取待识别发票数据;
通过OCR模型对所述待识别发票数据进行文字识别,获取发票上的字段值;
对所获取到的字段值进行后处理优化;
将后处理优化后的字段值发送至开票系统。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于光学字符识别OCR技术的发票信息录入方法,其特征在于,包括:
获取终端设备发送的原始发票图像;
对所述原始发票图像进行版面分析;
若版面分析的结果满足预设条件时,对所述原始发票图像进行预处理,获取待识别发票数据;
通过OCR模型对所述待识别发票数据进行文字识别,获取发票上的字段值;
对所获取到的字段值进行后处理优化;
将后处理优化后的字段值发送至开票系统。
2.如权利要求1所述的基于OCR技术的发票信息录入方法,其特征在于,所述对所述原始发票图像进行版面分析包括:
通过Laplacian梯度函数获取所述原始发票图像的清晰度,并判断所述清晰度是否大于或等于第一预设阈值;
通过霍夫变换获取所述原始发票图像的倾斜角度,并判断所述倾斜角度是否小于或等于第二预设阈值。
3.如权利要求2所述的基于OCR技术的发票信息录入方法,其特征在于,所述若版面分析的结果满足预设条件时,对所述原始发票图像进行预处理,获取待识别发票数据包括:
若所述清晰度大于或等于第一预设阈值且倾斜角度小于或等于第二预设阈值,对所述原始发票图像进行灰度化处理;
对灰度化后的原始发票图像进行二值化处理;
对二值化后的原始发票图像进行降噪处理;
对降噪处理后的原始发票图像进行倾斜校正;
对倾斜校正后的原始发票图像进行文字切分,得到原始发票图像上的字符信息,以所述字符信息作为待识别发票数据。
4.如权利要求1所述的基于OCR技术的发票信息录入方法,其特征在于,所述对所获取到的字段值进行后处理优化包括:
对所获取到的字段值进行分词;
将每一分词与词库中的词组进行比较,以修正所述字段值。
5.如权利要求1至4任一项所述的基于OCR技术的发票信息录入方法,其特征在于,在对所获取到的字段值进行后处理优化之后,还包括:
将后处理优化后的字段值发送至所述终端设备;
接收所述终端设备发送的确认消息,根据所述确认消息将后处理优化后的字段值发送至开票系统。
6.如权利要求2所述的基于OCR技术的发票信息录入方法,其特征在于,所述方法还包括:
若所述清晰度小于所述第一预设阈值或者所述倾斜角度大于所述第二预设阈值,生成重拍提示消息;
将所述重拍提示消息发送至所述终端设备。
7.一种基于OCR技术的发票信息录入装置,其特征在于,包括:
图像获取模块,用于获取终端设备发送的原始发票图像;
版面分析模块,用于对所述原始发票图像进行版面分析;
预处理模块,用于若版面分析的结果满足预设条件时,对所述原始发票图像进行预处理,获取待识别发票数据;
OCR识别模块,用于通过OCR模型对所述待识别发票数据进行文字识别,获取发票上的字段值;
后处理模块,用于对所获取到的字段值进行后处理优化;
第一发送模块,用于将后处理优化后的字段值发送至开票系统。
8.如权利要求7所述的基于OCR技术的发票信息录入装置,其特征在于,所述版面分析模块包括:
清晰度分析单元,用于通过laplacian梯度函数获取所述原始发票图像的清晰度,并判断所述清晰度是否大于或等于第一预设阈值;
倾斜角度分析单元,用于通过霍夫变换获取所述原始发票图像的倾斜角度,并判断所述倾斜角度是否小于或等于第二预设阈值。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的基于OCR技术的发票信息录入方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的基于OCR技术的发票信息录入方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811555100.5A CN109766778A (zh) | 2018-12-19 | 2018-12-19 | 基于ocr技术的发票信息录入方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811555100.5A CN109766778A (zh) | 2018-12-19 | 2018-12-19 | 基于ocr技术的发票信息录入方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109766778A true CN109766778A (zh) | 2019-05-17 |
Family
ID=66450258
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811555100.5A Pending CN109766778A (zh) | 2018-12-19 | 2018-12-19 | 基于ocr技术的发票信息录入方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109766778A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109979547A (zh) * | 2019-04-08 | 2019-07-05 | 皮敏 | 一种新型临床病例数据采集系统及采集方法 |
CN110826569A (zh) * | 2019-11-05 | 2020-02-21 | 泰康保险集团股份有限公司 | 票据图像的预处理方法、装置、介质及电子设备 |
CN111008559A (zh) * | 2019-10-31 | 2020-04-14 | 浙江数链科技有限公司 | 一种面单识别结果的排版方法、系统及计算机设备 |
CN111126151A (zh) * | 2019-11-25 | 2020-05-08 | 泰康保险集团股份有限公司 | 识别票据图像中的字段的方法、装置、设备和介质 |
CN111445616A (zh) * | 2020-02-27 | 2020-07-24 | 平安医疗健康管理股份有限公司 | 发票验证方法、装置、计算机设备和存储介质 |
CN111683202A (zh) * | 2020-06-01 | 2020-09-18 | 北京惠朗时代科技有限公司 | 一种票据盖章方法、装置、设备及存储介质 |
WO2021017458A1 (zh) * | 2019-07-31 | 2021-02-04 | 浙江口碑网络技术有限公司 | 图像识别的辅助处理方法、装置及系统 |
CN112465525A (zh) * | 2020-12-02 | 2021-03-09 | 无锡朝阳供应链科技股份有限公司 | 一种农贸市场商品进货溯源方法、装置及系统 |
CN112507909A (zh) * | 2020-12-15 | 2021-03-16 | 信号旗智能科技(上海)有限公司 | 基于ocr识别的单证数据提取方法、装置、设备及介质 |
CN113066223A (zh) * | 2021-04-22 | 2021-07-02 | 中国工商银行股份有限公司 | 发票自动验证方法及装置 |
CN116362816A (zh) * | 2023-05-30 | 2023-06-30 | 浙江爱信诺航天信息技术有限公司 | 凭证信息遗漏识别及处理方法、系统与介质 |
CN116561602A (zh) * | 2023-07-10 | 2023-08-08 | 三峡高科信息技术有限责任公司 | 一种用于销售成本结转的销采物资自动匹配的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130163823A1 (en) * | 2006-04-04 | 2013-06-27 | Cyclops Technologies, Inc. | Image Capture and Recognition System Having Real-Time Secure Communication |
US20140012742A1 (en) * | 2012-07-06 | 2014-01-09 | Bank Of America Corporation | Electronic processing of paper invoices |
CN103617415A (zh) * | 2013-11-19 | 2014-03-05 | 北京京东尚科信息技术有限公司 | 一种自动识别发票的装置和方法 |
CN104699663A (zh) * | 2013-12-05 | 2015-06-10 | 中兴通讯股份有限公司 | 一种信息输入方法及装置 |
CN108513034A (zh) * | 2017-12-28 | 2018-09-07 | 平安科技(深圳)有限公司 | 远程拍摄图片的方法、电子装置及计算机可读存储介质 |
-
2018
- 2018-12-19 CN CN201811555100.5A patent/CN109766778A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130163823A1 (en) * | 2006-04-04 | 2013-06-27 | Cyclops Technologies, Inc. | Image Capture and Recognition System Having Real-Time Secure Communication |
US20140012742A1 (en) * | 2012-07-06 | 2014-01-09 | Bank Of America Corporation | Electronic processing of paper invoices |
CN103617415A (zh) * | 2013-11-19 | 2014-03-05 | 北京京东尚科信息技术有限公司 | 一种自动识别发票的装置和方法 |
CN104699663A (zh) * | 2013-12-05 | 2015-06-10 | 中兴通讯股份有限公司 | 一种信息输入方法及装置 |
CN108513034A (zh) * | 2017-12-28 | 2018-09-07 | 平安科技(深圳)有限公司 | 远程拍摄图片的方法、电子装置及计算机可读存储介质 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109979547A (zh) * | 2019-04-08 | 2019-07-05 | 皮敏 | 一种新型临床病例数据采集系统及采集方法 |
WO2021017458A1 (zh) * | 2019-07-31 | 2021-02-04 | 浙江口碑网络技术有限公司 | 图像识别的辅助处理方法、装置及系统 |
CN111008559A (zh) * | 2019-10-31 | 2020-04-14 | 浙江数链科技有限公司 | 一种面单识别结果的排版方法、系统及计算机设备 |
CN111008559B (zh) * | 2019-10-31 | 2023-08-11 | 浙江数链科技有限公司 | 一种面单识别结果的排版方法、系统及计算机设备 |
CN110826569B (zh) * | 2019-11-05 | 2022-07-19 | 泰康保险集团股份有限公司 | 票据图像的预处理方法、装置、介质及电子设备 |
CN110826569A (zh) * | 2019-11-05 | 2020-02-21 | 泰康保险集团股份有限公司 | 票据图像的预处理方法、装置、介质及电子设备 |
CN111126151A (zh) * | 2019-11-25 | 2020-05-08 | 泰康保险集团股份有限公司 | 识别票据图像中的字段的方法、装置、设备和介质 |
CN111445616A (zh) * | 2020-02-27 | 2020-07-24 | 平安医疗健康管理股份有限公司 | 发票验证方法、装置、计算机设备和存储介质 |
CN111683202A (zh) * | 2020-06-01 | 2020-09-18 | 北京惠朗时代科技有限公司 | 一种票据盖章方法、装置、设备及存储介质 |
CN112465525A (zh) * | 2020-12-02 | 2021-03-09 | 无锡朝阳供应链科技股份有限公司 | 一种农贸市场商品进货溯源方法、装置及系统 |
CN112507909A (zh) * | 2020-12-15 | 2021-03-16 | 信号旗智能科技(上海)有限公司 | 基于ocr识别的单证数据提取方法、装置、设备及介质 |
CN113066223A (zh) * | 2021-04-22 | 2021-07-02 | 中国工商银行股份有限公司 | 发票自动验证方法及装置 |
CN116362816A (zh) * | 2023-05-30 | 2023-06-30 | 浙江爱信诺航天信息技术有限公司 | 凭证信息遗漏识别及处理方法、系统与介质 |
CN116362816B (zh) * | 2023-05-30 | 2023-09-26 | 浙江爱信诺航天信息技术有限公司 | 凭证信息遗漏识别及处理方法、系统与介质 |
CN116561602A (zh) * | 2023-07-10 | 2023-08-08 | 三峡高科信息技术有限责任公司 | 一种用于销售成本结转的销采物资自动匹配的方法 |
CN116561602B (zh) * | 2023-07-10 | 2023-09-19 | 三峡高科信息技术有限责任公司 | 一种用于销售成本结转的销采物资自动匹配的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109766778A (zh) | 基于ocr技术的发票信息录入方法、装置、设备及存储介质 | |
CN109492643B (zh) | 基于ocr的证件识别方法、装置、计算机设备及存储介质 | |
CN109816011B (zh) | 视频关键帧提取方法 | |
JP4516778B2 (ja) | データ処理システム | |
CN110569341B (zh) | 配置聊天机器人的方法、装置、计算机设备和存储介质 | |
CN110569769A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN109214385B (zh) | 数据采集方法、数据采集装置及存储介质 | |
CN107688772A (zh) | 保单信息录入的方法、装置、计算机设备及存储介质 | |
WO2020143325A1 (zh) | 一种电子文档的生成方法及设备 | |
CN111353497A (zh) | 一种身份证信息的识别方法和装置 | |
JP2023523152A (ja) | テキスト画像中の手書き内容を除去する方法および装置、ならびに記憶媒体 | |
CN108830275B (zh) | 点阵字符、点阵数字的识别方法及装置 | |
CN114283156B (zh) | 一种用于去除文档图像颜色及手写笔迹的方法及装置 | |
CN114038004A (zh) | 一种证件信息提取方法、装置、设备及存储介质 | |
KR20180092455A (ko) | 딥 러닝을 이용한 카드번호 인식방법 | |
CN114170608A (zh) | 超分辨文本图像识别方法、装置、设备及存储介质 | |
CN113158895A (zh) | 票据识别方法、装置、电子设备及存储介质 | |
CN112949455A (zh) | 一种增值税发票识别系统及方法 | |
CN112668640A (zh) | 一种文本图像质量评估方法、装置、设备及介质 | |
CN115082941A (zh) | 表格文档影像的表格信息获取方法及装置 | |
RU2633182C1 (ru) | Определение направления строк текста | |
CN115100660A (zh) | 文档图像的倾斜校正方法及装置 | |
CN110210467B (zh) | 一种文本图像的公式定位方法、图像处理装置、存储介质 | |
WO2021159843A1 (zh) | 对象识别方法和装置、电子设备、存储介质 | |
Anvari et al. | A survey on deep learning based document image enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |