CN111582115B - 一种财务票据处理方法、装置、设备和可读存储介质 - Google Patents

一种财务票据处理方法、装置、设备和可读存储介质 Download PDF

Info

Publication number
CN111582115B
CN111582115B CN202010354764.6A CN202010354764A CN111582115B CN 111582115 B CN111582115 B CN 111582115B CN 202010354764 A CN202010354764 A CN 202010354764A CN 111582115 B CN111582115 B CN 111582115B
Authority
CN
China
Prior art keywords
financial
image
processed
target
bill
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010354764.6A
Other languages
English (en)
Other versions
CN111582115A (zh
Inventor
伍斯龙
王泽涌
臧笑宇
徐培瑶
吴赟
佟忠正
王哲
洪雨天
黄杰韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Electric Power Information Technology Co Ltd
Original Assignee
Guangdong Electric Power Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Electric Power Information Technology Co Ltd filed Critical Guangdong Electric Power Information Technology Co Ltd
Priority to CN202010354764.6A priority Critical patent/CN111582115B/zh
Publication of CN111582115A publication Critical patent/CN111582115A/zh
Application granted granted Critical
Publication of CN111582115B publication Critical patent/CN111582115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0861Generation of secret information including derivation or calculation of cryptographic keys or passwords
    • H04L9/0869Generation of secret information including derivation or calculation of cryptographic keys or passwords involving random numbers or seeds

Abstract

本申请公开了一种财务票据处理方法、装置、设备和可读存储介质,通过对待处理财务票据图像进行图像处理、提取目标财务信息和财务票据分类,生成相应的财务审批单据,并在财务审批单据审批通过之后将待处理财务票据图像和财务审批单据存储在与分类结果对应的财务数据库中,实现了财务票据的自动审核、录入与存储,避免了现有技术采用人工处理财务票据存在的缺陷,解决了现有的票据录入工作均由财务人员进行人工填报,存在处理效率低和准确性低的技术问题。

Description

一种财务票据处理方法、装置、设备和可读存储介质
技术领域
本申请涉及票据管理技术领域,尤其涉及一种财务票据处理方法、装置、设备和可读存储介质。
背景技术
票据管理是企业财务工作的重要部分,在日常报销及物资报销的过程中,所有的票据录入工作均由财务人员进行人工填报,财务人员面临的发票种类、数量繁多,核查检验票据费时费力,而且对业务单据以及发票附件中核对、累加金额容易出错,存在审计检查风险。因此,为提高财务票据处理的效率和准确性,有必要对现有的人工录入票据信息进行财务管理的方式进行改善。
发明内容
本申请提供了一种财务票据处理方法、装置、设备和可读存储介质,用于解决现有的票据录入工作均由财务人员进行人工填报,存在处理效率低和准确性低的技术问题。
有鉴于此,本申请第一方面提供了一种财务票据处理方法,包括:
接收待处理财务票据图像;
对所述待处理财务票据图像进行预处理,得到待识别财务票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理;
提取所述待识别财务票据图像中的目标财务信息;
根据所述目标财务信息对所述待识别财务票据图像进行分类;
根据所述目标财务信息和所述待识别财务票据的分类结果,生成与所述分类结果对应的财务审批单据;
在所述财务审批单据审批通过之后,将所述待处理财务票据图像和所述财务审批单据存储在与所述分类结果对应的财务数据库中。
可选地,所述对所述待处理财务票据图像进行预处理,包括:
对所述待处理财务票据图像的合法性进行验证,若所述待处理财务票据图像合法,则对所述待处理财务票据图像进行预处理,得到待识别财务票据图像。
可选地,所述对所述待处理财务票据图像进行预处理,得到待识别财务票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理,包括:
将所述待处理财务票据图像转化为HSI颜色模型图像,将所述HSI颜色模型图像中的红色和蓝色去除;
将去除红色和蓝色的所述待处理财务票据图像转化为灰度等级为0至255的灰度图像;
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景,得到待识别财务票据图像。
可选地,所述对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景,得到待识别财务票据图像,包括:
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景;
采用直方图均衡化方法改变分割后的所述灰度图像的对比度,以对所述灰度图像进行图像增强;
采用高斯离散逼近函数对增强后的所述灰度图像进行平滑去噪,得到待识别财务票据图像,其中,σ为高斯离散逼近函数的标准差,x为灰度图像中某像素的位置。
可选地,还包括:
对平滑去噪后的图像进行倾斜校正。
可选地,所述提取所述待识别财务票据图像中的目标财务信息,包括:
定位所述待识别财务票据图像的目标区域;
采用轮廓提取方法从所述目标区域提取包含字符的字符图像;
对每个所述字符图像进行模板匹配,识别出所述目标区域中的字符,得到目标财务信息。
可选地,所述对每个所述字符图像进行模板匹配,识别出所述目标区域中的字符,得到目标财务信息,包括:
将所有所述字符图像按x轴坐标大小排序,从x轴坐标最小的所述字符图像开始,依次进行模板匹配;
当前一个字符图像匹配结束时,后一个字符图像根据与所述前一个字符图像的间隔关系,向x轴的正向偏移预置个像素单位的位置开始匹配,所述预置个像素单位为模板图像的宽度;
当匹配到的字符图像中的字符为*时,计算*前面识别的字符图像的数量;
若*前面识别的字符图像的数量未达到所述第一目标数量,则以所述x轴坐标最小的所述字符图像为基准,向x轴的负向偏移所述预置个像素单位的位置开始匹配,直至*前面识别到的字符图像的数量达到所述第一目标数量;
若数量达到第一目标数量,则根据*的位置,依次对*后面的第二目标数量个字符图像进行模板匹配,识别出对应的字符,得到目标财务信息。
可选地,所述目标财务信息包括目标日期信息;
在提取目标日期信息时采用漫水填充算法提取目标日期。
可选地,所述对所述待处理财务票据图像的合法性进行验证,包括:
向所述待处理财务票据图像的发送方发起合法性验证会话;
接收所述发送方响应于所述合法性验证会话发送的验证信息,所述验证信息为<IDA,RA,XA,TA,eA,zA>,其中,IDA为所述发送方的身份标识,TA为第一当前时戳,eA为哈希值,eA=H2(TA,XA,IDA,RA,YA),zA为TA和XA的签名,zA=yA+eA(dA+sA),XA=xAP,YA=xAP,RA=sAP+rAP,rA为PKG系统为所述发送方随机算则的秘密数,sA为所述发送方自身随机选择的秘密数,dA为所述发送方的部分私钥,,xA和yA是随机数, 为q阶的点群,P为q阶循环加法群G的生成元;
检测TA与当前时间信息的时间差,若所述时间差在预置范围内,则计算hA和YA',hA=H1(IDA,RA),YA'=zAP-eA(RA+hAPpub),并验证eA=H2(TA,XA,IDA,RA,YA')是否成立,若成立,则通过验证,其中,Ppub为PKG系统的公钥。
可选地,还包括:
获取随机数xB和yB,计算YB和XB,其中,YB=yBP,XB=xBP;
获取第二当前时戳TB,计算哈希值eB=H2(TB,XB,IDB,RB,YB)和对TB和XB的签名zB=yB+eB+eB(dB+sB),其中,IDB为所述待处理财务票据图像的接收方的身份标识,RB=sBP+rBP,sB为所述待处理财务票据图像的接收方自身随机选择的秘密数,dB为接收方的部分私钥,,rB为PKG系统为所述待处理财务票据图像的接收方随机选择的秘密数;
发送<IDB,RB,XB,TB,eB,zB>给所述发送方,并将kAB=H3(xB,XA)作为第一会话秘钥,使得所述发送方对所述待处理财务票据图像的接收方进行认证并生成第二会话秘钥,根据所述第二会话秘钥对所述待处理财务票据图像进行加密,生成密文;
相应地,所述接收待处理财务票据图像,包括:
接收所述密文,采用所述第一会话秘钥对所述密文进行解密,得到所述待处理财务票据图像。
本申请第二方面提供了一种财务票据处理装置,包括:
接收模块,用于接收待处理财务票据图像;
预处理模块,用于对所述待处理财务票据图像进行预处理,得到待识别财务票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理;
目标信息提取模块,用于提取所述待识别财务票据图像中的目标财务信息;
分类模块,用于根据所述目标财务信息对所述待识别财务票据图像进行分类;
审批单据生成模块,用于根据所述目标财务信息和所述待识别财务票据的分类结果,生成与所述分类结果对应的财务审批单据;
存储模块,用于在所述财务审批单据审批通过之后,将所述待处理财务票据图像和所述财务审批单据存储在与所述分类结果对应的财务数据库中。
可选地,所述预处理模块具体用于:
对所述待处理财务票据图像的合法性进行验证,若所述待处理财务票据图像合法,则对所述待处理财务票据图像进行预处理,得到待识别财务票据图像。
可选地,所述预处理模块包括:
去干扰子模块,用于将所述待处理财务票据图像转化为HSI颜色模型图像,将所述HSI颜色模图像中的红色和蓝色去除;
灰度化子模块,用于将去除红色和蓝色的所述待处理财务票据图像转化为灰度等级为0至255的灰度图像;
二值化子模块,用于对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景,得到待识别财务票据图像。
可选的,所述二值化子模块具体用于:
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景;
采用直方图均衡化方法改变分割后的所述灰度图像的对比度,以对所述灰度图像进行图像增强;
采用高斯离散逼近函数对增强后的所述灰度图像进行平滑去噪,得到待识别财务票据图像,其中,σ为高斯离散逼近函数的标准差,x为灰度图像中某像素的位置。
可选地,所述二值化子模块具体还用于:
对平滑去噪后的图像进行倾斜校正。
可选地,所述目标信息提取模块,包括:
区域定位子模块,用于定位所述待识别财务票据图像的目标区域;
字符图像提取子模块,用于采用轮廓提取方法从所述目标区域提取包含字符的字符图像;
模板匹配子模块,用于对每个所述字符图像进行模板匹配,识别出所述目标区域中的字符,得到目标财务信息。
可选地,所述模板匹配子模块具体用于:
将所有所述字符图像按x轴坐标大小排序,从x轴坐标最小的所述字符图像开始,依次进行模板匹配;
当前一个字符图像匹配结束时,后一个字符图像根据与所述前一个字符图像的间隔关系,向x轴的正向偏移预置个像素单位的位置开始匹配,所述预置个像素单位为模板图像的宽度;
当匹配到的字符图像中的字符为*时,计算*前面识别的字符图像的数量;
若*前面识别的字符图像的数量未达到所述第一目标数量,则以所述x轴坐标最小的所述字符图像为基准,向x轴的负向偏移所述预置个像素单位的位置开始匹配,直至*前面识别到的字符图像的数量达到所述第一目标数量;
若数量达到第一目标数量,则根据*的位置,依次对*后面的第二目标数量个字符图像进行模板匹配,识别出对应的字符,得到目标财务信息。
可选地,所述目标财务信息包括目标日期信息;
在提取目标日期信息时采用漫水填充算法提取目标日期。
可选地,所述对所述待处理财务票据图像的合法性进行验证,包括:
向所述待处理财务票据图像的发送方发起合法性验证会话;
接收所述发送方响应于所述合法性验证会话发送的验证信息,所述验证信息为<IDA,RA,XA,TA,eA,zA>,其中,IDA为所述发送方的身份标识,TA为第一当前时戳,eA为哈希值,eA=H2(TA,XA,IDA,RA,YA),zA为TA和XA的签名,zA=yA+eA(dA+sA),XA=xAP,YA=xAP,RA=sAP+rAP,rA为PKG系统为所述发送方随机算则的秘密数,sA为所述发送方自身随机选择的秘密数,dA为所述发送方的部分私钥,xA和yA是随机数, 为q阶的点群,P为q阶循环加法群G的生成元;
检测TA与当前时间信息的时间差,若所述时间差在预置范围内,则计算hA和YA',hA=H1(IDA,RA),YA'=zAP-eA(RA+hAPpub),并验证eA=H2(TA,XA,IDA,RA,YA')是否成立,若成立,则通过验证,其中,Ppub为PKG系统的公钥。
可选地,还包括:
获取随机数xB和yB,计算YB和XB,其中,YB=yBP,XB=xBP;
获取第二当前时戳TB,计算哈希值eB=H2(TB,XB,IDB,RB,YB)和对TB和XB的签名zB=yB+eB+eB(dB+sB),其中,IDB为所述待处理财务票据图像的接收方的身份标识,RB=sBP+rBP,sB为所述待处理财务票据图像的接收方自身随机选择的秘密数,dB为接收方的部分私钥,rB为PKG系统为所述待处理财务票据图像的接收方随机选择的秘密数;
发送<IDB,RB,XB,TB,eB,zB>给所述发送方,并将kAB=H3(xB,XA)作为第一会话秘钥,使得所述发送方对所述待处理财务票据图像的接收方进行认证并生成第二会话秘钥,根据所述第二会话秘钥对所述待处理财务票据图像进行加密,生成密文;
相应地,所述接收模块用于:
接收所述密文,采用所述第一会话秘钥对所述密文进行解密,得到所述待处理财务票据图像。
本申请第三方面提供了一种财务票据处理设备,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的财务票据处理方法。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面任一种所述的财务票据处理方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中提供了一种财务票据处理方法,包括:接收待处理财务票据图像;对待处理财务票据图像进行预处理,得到待识别财务票据图像,预处理包括去干扰处理、灰度化处理和二值化处理;提取待识别财务票据图像中的目标财务信息;根据目标财务信息对待识别财务票据图像进行分类;根据目标财务信息和待识别财务票据的分类结果,生成与分类结果对应的财务审批单据;在财务审批单据审批通过之后,将待处理财务票据图像和财务审批单据存储在与分类结果对应的财务数据库中。本申请中提供的财务票据处理方法,通过对待处理财务票据图像进行图像处理、提取目标财务信息和财务票据分类,生成相应的财务审批单据,并在财务审批单据审批通过之后将待处理财务票据图像和财务审批单据存储在与分类结果对应的财务数据库中,实现了财务票据的自动审核、录入与存储,避免了现有技术采用人工处理财务票据存在的缺陷,解决了现有的票据录入工作均由财务人员进行人工填报,存在处理效率低和准确性低的技术问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本申请实施例中提供的一种财务票据处理方法的一个流程示意图;
图2为本申请实施例中提供的一种财务票据处理装置的一个结构示意图;
图3为本申请实施例中提供的一种财务票据处理设备的一个结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请提供了一种财务票据处理方法的实施例,包括:
步骤101、接收待处理财务票据图像。
需要说明的是,在一个实施例中,待处理财务票据图像可以是原财务票据凭证图像,可以通过摄像机拍摄原财务票据凭证的图像。可以理解的是,原财务票据凭证可以是发票、购物小票、车票或合同文件等。
步骤102、对待处理财务票据图像进行预处理,得到待识别财务票据图像,预处理包括去干扰处理、灰度化处理和二值化处理。
需要说明的是,由于直接获取到的待处理财务票据图像存在例如噪声干扰和颜色干扰等干扰情况,因此,在获取到待处理财务票据图像之后,需要对该待处理财务票据图像进行去干扰处理、灰度化处理和二值化处理,得到待识别财务票据图像。
在一个实施例中,对待处理财务票据图像进行去干扰处理、灰度化处理和二值化处理的具体过程可以是:
首先,将待处理财务票据图像转化为HSI颜色模型的图像,将转换为HSI颜色模型的图像后的待处理财务票据图像中的红色和蓝色去除。
需要说明的是,直接获取到的待处理财务票据图像属于RGB颜色模型,而待处理财务票据图像中可能存在红色和/或蓝色的印章,这些印章颜色的存在会对待处理财务票据的处理结果产生干扰。因此,可以将RGB颜色模型转化为HSI颜色模型,找到红色和蓝色在HSI颜色模型中的范围,将红色和蓝色的干扰色去掉。HSI颜色模型是基于色调(Hue)、饱和度(Saturation)和亮度(Intensity)的颜色模型,并且符合人类观察和感受颜色的视觉和心理学特点,所以只要找到红色和蓝色在HSI颜色模型中的范围/位置,就可以将红色和蓝色的干扰色去掉,而且对其他的字符信息没有影响。将图像由RGB颜色模型转化为HSI颜色模型的转换公式为:
红色和蓝色在HSI模型的范围不能只依靠色调H来决定,需要H和S共同确定。当0≤H≤10或者350≤H≤360且S≥0.3时,为红色的范围;当170≤H≤190且S≥0.3时,为蓝色的范围。利用这两个范围可以将图像中红色或者蓝色的印章去除掉。
然后,将去除红色和蓝色的待处理财务票据图像转化为灰度等级为0至255的灰度图像。
最后,对灰度图像进行二值化处理,将灰度图像分割成前景和背景,得到待识别财务票据图像。
需要说明的是,将灰度图像经过二值化处理后能够得到更清晰的几何特征,同时能够缩减图像的数据量,简化图像后续的处理和分析。实际上,对灰度图像的二值化的处理过程即是将灰度图像分割成前景和背景。选取一个阈值,灰度图像中大于该阈值的为前景像素,小于该阈值的为背景像素。通常该阀值可以根据具体应用场景来设定,比如背景色为黑色底板,而票据为亮色纸,阀值可以设定较低的值,比如30(灰度值的取值范围0-255)。
在一个实施例中,在得到待识别财务票据图像之后,还可以通过直方图均衡化方法改变灰度图像的全部或局部对比度来进行图像增强,采用高斯离散逼近函数对增强后的灰度图像进行平滑去噪,其中,σ为高斯离散逼近函数的标准差,x为灰度图像中某像素的位置。通过直方图均衡化,当一幅图像的像素占据了所有的灰度级并且呈均匀分布时,则该图像具有比较高的对比度和多变的灰度色调,因此,图像增强之后,可以更加突出感兴趣的字符区域。直接获取的待处理财务票据图像常会受到一些随机误差而退化,或者在图像获取的过程中因环境条件、成像设备自身质量的影响,在图像的传输过程中因所用传输信道的干扰污染等,会产生噪声,在此实施例中,通过高斯滤波对整体图像进行加权平均,每一个像素的值都由其本身和邻域内的其他像素经过加权平均后得到,具体地,可以用一个模板扫描灰度图像中的每一个像素,用模板确定邻域内像素的加权平均灰度值去替代模板中心像素点的值。
在一个实施例中,还可以对平滑去噪后的图像进行倾斜校正。
需要说明的是,由于在拍摄待处理财务票据图像时,由于待处理财务票据摆放的任意性,拍摄图像的设备获取的待处理财务票据图像会存在一定的角度,对于一些发票类的待处理财务票据可能还会有二维码,二维码为方形,可以借助方形二维码的几个角度点来计算倾斜角,并通过倾斜角来校正整个待处理财务票据图像。下面以存在方形二维码的发票作为待处理财务票据为例来说明倾斜校正的过程:
从二维码左下角开始按顺时针顺序依次标记二维码的3个方形角点的中心点坐标,得到{C1(x,y),C2(x,y),C3(x,y)};
在提取到的3个方形角点中,根据C2(x,y)和C3(x,y)的x轴距离dx和y轴的距离dy可计算出图像的倾斜角度θ,倾斜角度θ计算公式为:
在计算得到倾斜角度θ后,将图像旋转-θ即可得到校正后的图像。
需要说明的是,在接收待处理财务票据图像时,由于财务资料的放置角度不正或者获取时经人为移动,可能造成采集的待处理财务票据图像的倾斜,通过此实施例中对倾斜图像进行校正,便于后续的图像信息识别,有助于提高识别准确率。
在一个实施例中,在接收待处理财务票据图像之后,可以对待处理财务票据图像的合法性进行验证,若待处理财务票据图像合法,对待处理财务票据图像进行后续处理操作,若待处理财务票据图像不合法,则流程中止。
为从源头保证待处理财务票据图像的合法性,需要对待处理财务票据图像的合法性进行验证,对于待处理财务票据图像的发送方进行身份验证,若验证通过,则待处理财务票据图像是合法的,可进行后续的对待处理财务票据图像进行图像处理、识别、审批和存储等流程,若验证不通过,则待处理财务票据图像是不合法的,应停止流程。
需要说明的是,在具体的实施过程中,在接收待处理财务票据图像时向待处理财务票据图像的发送方发起合法性验证会话;接收发送方响应于合法性验证会话发送的验证信息,验证信息为<IDA,RA,XA,TA,eA,zA>,其中,IDA为发送方的身份标识,TA为第一当前时戳,eA为哈希值,eA=H2(TA,XA,IDA,RA,YA),zA为TA和XA的签名,zA=yA+eA(dA+sA),XA=xAP,YA=xAP,RA=sAP+rAP,rA为PKG系统为发送方随机算则的秘密数,dA为发送方的部分私钥,sA为发送方自身随机选择的秘密数,xA和yA是随机数, 为q阶的点群,P为q阶循环加法群G的生成元;检测TA与当前时间信息的时间差,若时间差在预置范围内,则计算hA和YA',hA=H1(IDA,RA),YA'=zAP-eA(RA+hAPpub),并验证eA=H2(TA,XA,IDA,RA,YA')是否成立,若成立,则通过验证,其中,Ppub为PKG系统的公钥。
在一个实施例中,时间差的预置范围设为1小时。检测时戳是用于确保密钥协商在较短时间内完成,本实施例中可以将接收的时戳与自身显示的时间信息进行比对,如果两者的时间差超过1个小时,则结束后续密钥协商流程,如果在1个小时之内,则继续后续密钥协商流程,从而防止密钥协商周期较长而导致产生的会话密钥安全系数较低的问题。
PKG(Private Key Generate)系统是一个离线的私钥生成中心,通过PKG为发送方和接收方生成基于身份的公私钥对,在进行身份认证和密钥协商之前,需要对系统进行初始化设置,具体包括:
(1)给定安全参数k,PKG选择椭圆曲线E(FP)上的q阶循环加法群G,G的生成元为P。随机选择作为系统主密钥,系统公钥为Ppub=sP∈G。定义以下安全哈希函数:
H3:G→{0,1}*
PKG妥善保管s,公开系统参数(G,q,P,Ppub,H1,H2,H3)。
(2)假设每个发送方拥有唯一的身份标识IDi∈{0,1}n,发送方IDi随机选择作为秘密数,计算R1=siP,然后将R1和IDi发送给PKG,PKG可以通过零知识证明方法确认IDi具有R1对应的秘密数si
PKG对发送方身份和R1鉴定后,按照如下步骤计算发送方IDi的部分私钥:
①随机选择计算R2=riP,Ri=R1+R2
②令h=H1(IDi,Ri),计算部分私钥di=ri+sh。
PKG将Ri和di发送给发送方IDi,发送方IDi通过检验(di+si)P=Ri+H1(IDi,Ri)Ppub是否成立来验证部分私钥的正确性。
在本实施例中,发送方和接收方每次都会生成不同的会话密钥,并且每次协商密钥都选择了新的密钥协商参数xA和xB,因此,会话密钥之间是独立的,一个密钥的泄露不会影响另一个密钥的安全性。PKG只为发送方生成了部分私钥,只有获得发送方选择的秘密数才能得到完整的签名私钥,因此,当PKG被恶意实体攻破,主密钥被恶意实体获得后,恶意实体因没有发送方秘密值而无法得到发送方的签名密钥,从而无法假冒合法的发送方身份。
在一个实施例中,待处理财务票据图像的接收方选择随机数xB和yB,计算YB和XB,其中,YB=yBP,XB=xBP;
获取第二当前时戳TB,计算哈希值eB=H2(TB,XB,IDB,RB,YB)和对TB和XB的签名zB=yB+eB+eB(dB+sB),其中,IDB为待处理财务票据图像的接收方的身份标识,RB=sBP+rBP,sB为待处理财务票据图像的接收方自身随机选择的秘密数,dB为接收方的部分私钥,rB为PKG系统为待处理财务票据图像的接收方随机选择的秘密数;
发送<IDB,RB,XB,TB,eB,zB>给发送方,并将kAB=H3(xB,XA)作为第一会话秘钥;发送方接收到<IDB,RB,XB,TB,eB,zB>后,检测时戳TB与当前时间信息之间的时差,若时差在预设的阈值范围内,则计算哈希值hB=H1(IDB,RB),YB'=zBP-eB(RB+hBPpub),并验证eB=H2(TB,XB,IDB,RB,YB')是否成立,若成立,则通过对待处理财务票据图像的接收方的认证,然后生成第二会话秘钥kAB=H3(xA,XB)。
发送方根据第二会话秘钥对待处理财务票据图像进行加密,生成密文;
接收方接收密文,采用第一会话秘钥对密文进行解密,得到待处理财务票据图像,其中,kAB=H3(xA,XB)=H3(xB,XA)。
步骤103、提取待识别财务票据图像中的目标财务信息。
需要说明的是,得到待识别财务票据图像后,需要从待识别财务票据图像中提取有价值的财务信息,即目标财务信息,可以利用现有的字符特征提取方法从待识别财务票据图像中提取字符,得到目标财务信息。
在一个实施例中,从待识别财务票据图像中提取目标财务信息的方法可以是:
定位待识别财务票据图像的目标区域;目标区域可以是待识别财务票据图像中有价值信息的区域,比如票据中的单价、金额、购买方、销售方等区域。
采用轮廓提取方法从目标区域提取包含字符的字符图像;
对每个字符图像进行模板匹配,识别出目标区域中的字符,得到目标财务信息。
需要说明的是,对图像中的字符进行识别的字符识别方法可以采用现有技术中的任意一种,可不进行具体限定,本领域技术人员可以采取任意一种从包含字符的字符图像中识别出字符的方法。具体地一种方式可以是将提取的每一个字符图像与多个模板图像进行匹配,根据相似度计算公式计算匹配相似度,并选取相似度最高的模板图像所代表的字符作为识别结果,其中,相似度计算公式为:
其中,m为模板标号,S(i,j)为字符图像在坐标(i,j)处的像素值,Tm(i,j)为第m个模板图像在坐标(i,j)处的像素值。
各个模板图像可以预先放置在模板数据库中,当需要进行字符识别时,可以将提取的字符图像与各个模板图像进行匹配,例如:对于字符“6”图像,可以将字符“6”图像分别与模板图像“0”、“1”…“9”进行匹配。若最终匹配的结果为字符“4”图像与模板图像“4”相似度最高,即可完成对字符“4”图像的识别。
在一个实施例中,目标财务信息可以通过敏感字检测来锁定,敏感字可以是:金额、日期、单位等。对于增值税发票之类的财务票据而言,其各类信息栏的位置一般是固定的,比如发票号码在发票的右上角位置,购买方信息在发票的左上角位置,销售方信息在发票的左下角位置,金额在发票的右下角位置等。
在一个实施例中,对每个字符图像进行模板匹配,识别出目标区域中的字符,得到目标财务信息,具体可以是:
将所有字符图像按x轴坐标大小排序,从x轴坐标最小的字符图像开始,依次进行模板匹配;
当前一个字符图像匹配结束时,后一个字符图像根据与前一个字符图像的间隔关系,向x轴的正向偏移预置个像素单位的位置开始匹配,预置个像素单位为模板图像的宽度;
当匹配到的字符图像为*时,计算*前面识别的字符图像的数量,若数量达到第一目标数量,则根据*的位置,依次对*后面的第二目标数量个字符图像进行模板匹配,识别出对应的字符,得到目标财务信息,若*前面识别的字符图像的数量未达到第一目标数量,则以x轴坐标最小的字符图像为基准,向x轴的负向偏移预置个像素单位的位置开始匹配,直至*前面识别到的字符图像的数量达到第一目标数量。
需要说明的是,在此实施例中,x轴为以待识别财务票据图像建立的像素坐标系对应的横坐标。将分割得到的所有字符图像按x轴坐标大小排序,从x轴最小的字符图像开始依次进行模板图像匹配,当前一个字符图像匹配结束时,下一个字符图像与前一个字符图像的间隔关系,向x轴的正向偏移n个像素单位的位置开始匹配,n的大小取模板图像的宽度(其中,n的取值大小可以根据实际需求来调整,比如有点票据的字符较大,则n的取值也应适当变大,有的票据的字符较小,则n的取值也应适当变小),重复以上步骤,直到匹配到的字符图像为“*”,计算“*”前面识别到的字符图像数量,如果没有达到k个,则以识别到的第一个字符图像为基准,向x轴的负向偏移n个像素单位的位置开始匹配,直至“*”前面识别到的字符图像数量达到k(可取值k=8)个为止。根据“*”的位置,依次对其后面g(可取值g=4)个字符图像进行模板图像匹配,并识别出对应的字符。
由于票据的打印机器存在机械误差,导致有些字符之间的间隔很小,甚至是粘连在一起的,影响字符分割,无法使票据上的18个身份证数字全部独立地分割出来,也无法判断分割后的第1个字符是否为身份证号码的第1个数字。在一些车票或购物票上,为了保护个人隐私,通常采用“*”字符来隐藏标识身份证号码、电话号码的局部中的字符信息,此实施例中,利用“*”字符特征,有效解决字符分割不全以及字符排序的问题。
在一个实施例中,提取的待识别财务票据图像中的目标财务信息包括提取目标日期信息。
需要说明的是,在此实施例中,采用漫水填充算法提取目标日期,再利用目标日期外接矩形的长、宽特征关系,过滤掉不符合要求的干扰目标,将过滤干扰目标后剩余的目标按x轴坐标从小到大排序,根据日期的排序规则,依次识别年、月、日、时、分模块。在具体的实施过程中,可以遍历待识别财务票据图像的目标日期区域,检测每个像素点的颜色,若检测到该点为白色,则将其标记为种子点,否则,重复不进行种子点标记,直至遍历所有像素点;采用自定义填充色替换种子点像素,并记下种子点坐标,检测种子点坐标相邻的四连通领域或八连通邻域,记录各邻域内存在的所有白色像素点为新的种子点。
步骤104、根据目标财务信息对待识别财务票据图像进行分类。
需要说明的是,在得到目标财务信息之后,结合预先划分的财务类别对待识别财务票据图像进行分类,得到分类结果信息。
步骤105、根据目标财务信息和待识别财务票据的分类结果,生成财务审批单据。
需要说明的是,不同类别的财务票据对应不同的财务审批单据,因此,在得到待处理财务票据图像的目标财务信息和分类结果信息之后,可以生成包含目标财务信息的对应类别的财务审批单据。
在一个实施例中,可以对多个报销金额信息进行累计,得到报销总金额信息,根据报销总金额信息生成财务审批单据。
步骤106、在财务审批单据审批通过之后,将待处理财务票据图像和财务审批单据存储在与分类结果对应的财务数据库中。
相比于现有技术,本申请实施例中提供的财务票据处理方法,具备以下优点:
(1)将图像识别技术引入到财务管理中,以实现对财务信息自动录入,替代了传统人工录入的方式,节省了人力成本,并有效提升了财务信息的录入效率和精度,推进了财务管理的智能化发展。具体地,通过对待处理财务票据图像进行图像处理、提取目标财务信息和财务票据分类,生成相应的财务审批单据,并在财务审批单据审批通过之后将待处理财务票据图像和财务审批单据存储在与分类结果对应的财务数据库中,实现了财务票据的自动审核、录入与存储,避免了现有技术采用人工处理财务票据存在的缺陷,解决了现有的票据录入工作均由财务人员进行人工填报,存在处理效率低和准确性低的技术问题;
(2)通过对待处理财务票据图像发送方的身份进行认证,从源头确保才处理财务票据图像的合法性,进一步提升了财务管理的安全系数。
为了便于理解,请参阅图2,本申请中提供了一种财务票据处理装置的实施例,包括:
接收模块,用于接收待处理财务票据图像;
预处理模块,用于对所述待处理财务票据图像进行预处理,得到待识别财务票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理;
目标信息提取模块,用于提取所述待识别财务票据图像中的目标财务信息;
分类模块,用于根据所述目标财务信息对所述待识别财务票据图像进行分类;
审批单据生成模块,用于根据所述目标财务信息和所述待识别财务票据的分类结果,生成与分类结果对应的财务审批单据;
存储模块,用于在所述财务审批单据审批通过之后,将所述待处理财务票据图像和所述财务审批单据存储在与所述分类结果对应的财务数据库中。
作为进一步改进,所述预处理模块具体用于:
对待处理财务票据图像的合法性进行验证,若待处理财务票据图像合法,则对待处理财务票据图像进行预处理,得到待识别财务票据图像。
作为进一步改进,所述预处理模块包括:
去干扰子模块,用于将所述待处理财务票据图像转化为HSI颜色模型图像,将所述HSI颜色模型图像中的红色和蓝色去除;
灰度化子模块,用于将去除红色和蓝色的所述待处理财务票据图像转化为灰度等级为0至255的灰度图像;
二值化子模块,用于对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景,得到待识别财务票据图像。
作为进一步改进,所述二值化子模块具体用于:
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景;
采用直方图均衡化方法改变分割后的所述灰度图像的对比度,以对所述灰度图像进行图像增强;
采用高斯离散逼近函数对增强后的所述灰度图像进行平滑去噪,得到待识别财务票据图像,其中,σ为高斯离散逼近函数的标准差,x为灰度图像中某像素的位置。
作为进一步改进,所述二值化子模块具体还用于:
对平滑去噪后的图像进行倾斜校正。
作为进一步改进,所述目标信息提取模块,包括:
区域定位子模块,用于定位所述待识别财务票据图像的目标区域;
字符图像提取子模块,用于采用轮廓提取方法从所述目标区域提取包含字符的字符图像;
模板匹配子模块,用于对每个所述字符图像进行模板匹配,识别出所述目标区域中的字符,得到目标财务信息。
作为进一步改进,所述模板匹配子模块具体用于:
将所有所述字符图像按x轴坐标大小排序,从x轴坐标最小的所述字符图像开始,依次进行模板匹配;
当前一个字符图像匹配结束时,后一个字符图像根据与所述前一个字符图像的间隔关系,向x轴的正向偏移预置个像素单位的位置开始匹配,所述预置个像素单位为模板图像的宽度;
当匹配到的字符图像中的字符为*时,计算*前面识别的字符图像的数量;
若*前面识别的字符图像的数量未达到所述第一目标数量,则以所述x轴坐标最小的所述字符图像为基准,向x轴的负向偏移所述预置个像素单位的位置开始匹配,直至*前面识别到的字符图像的数量达到所述第一目标数量;
若数量达到第一目标数量,则根据*的位置,依次对*后面的第二目标数量个字符图像进行模板匹配,识别出对应的字符,得到目标财务信息。
作为进一步改进,所述目标财务信息包括目标日期信息;
在提取目标日期信息时采用漫水填充算法提取目标日期。
可选地,所述对所述待处理财务票据图像的合法性进行验证,包括:
向所述待处理财务票据图像的发送方发起合法性验证会话;
接收所述发送方响应于所述合法性验证会话发送的验证信息,所述验证信息为<IDA,RA,XA,TA,eA,zA>,其中,IDA为所述发送方的身份标识,TA为第一当前时戳,eA为哈希值,eA=H2(TA,XA,IDA,RA,YA),zA为TA和XA的签名,zA=yA+eA(dA+sA),XA=xAP,YA=xAP,RA=sAP+rAP,rA为PKG系统为所述发送方随机算则的秘密数,sA为所述发送方自身随机选择的秘密数,dA为所述发送方的部分私钥,xA和yA是随机数, 为q阶的点群,P为q阶循环加法群G的生成元;
检测TA与当前时间信息的时间差,若所述时间差在预置范围内,则计算hA和YA',hA=H1(IDA,RA),YA'=zAP-eA(RA+hAPpub),并验证eA=H2(TA,XA,IDA,RA,YA')是否成立,若成立,则通过验证,其中,Ppub为PKG系统的公钥。
作为进一步改进,还包括:
获取随机数xB和yB,计算YB和XB,其中,YB=yBP,XB=xBP;
获取第二当前时戳TB,计算哈希值eB=H2(TB,XB,IDB,RB,YB)和对TB和XB的签名zB=yB+eB+eB(dB+sB),其中,IDB为所述待处理财务票据图像的接收方的身份标识,RB=sBP+rBP,sB为所述待处理财务票据图像的接收方自身随机选择的秘密数,dB为接收方的部分私钥,rB为PKG系统为所述待处理财务票据图像的接收方随机选择的秘密数;
发送<IDB,RB,XB,TB,eB,zB>给所述发送方,并将kAB=H3(xB,XA)作为第一会话秘钥,使得所述发送方对所述待处理财务票据图像的接收方进行认证并生成第二会话秘钥,根据所述第二会话秘钥对所述待处理财务票据图像进行加密,生成密文;
相应地,所述接收模块用于:
接收所述密文,采用所述第一会话秘钥对所述密文进行解密,得到所述待处理财务票据图像。
为了便于理解,请参阅图3,本申请还提供了一种财务票据处理设备的实施例,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行前述的财务票据处理方法实施例中的任一种财务票据处理方法。
本申请还提供了计算机可读存储介质的实施例,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行前述的财务票据处理方法实施例中的任一种财务票据处理方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (16)

1.一种财务票据处理方法,其特征在于,包括:
接收待处理财务票据图像;
对所述待处理财务票据图像的合法性进行验证,若所述待处理财务票据图像合法,则对所述待处理财务票据图像进行预处理,得到待识别财务票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理;其中,所述对所述待处理财务票据图像的合法性进行验证,包括:
向所述待处理财务票据图像的发送方发起合法性验证会话;
接收所述发送方响应于所述合法性验证会话发送的验证信息,所述验证信息为<IDA,RA,XA,TA,eA,zA>,其中,IDA为所述发送方的身份标识,TA为第一当前时戳,eA为哈希值,eA=H2(TA,XA,IDA,RA,YA),zA为TA和XA的签名,zA=yA+eA(dA+sA),XA=xAP,YA=xAP,RA=sAP+rAP,rA为PKG系统为所述发送方随机算则的秘密数,sA为所述发送方自身随机选择的秘密数,dA为所述发送方的部分私钥,xA和yA是随机数,为q阶的点群,P为q阶循环加法群G的生成元;
检测TA与当前时间信息的时间差,若所述时间差在预置范围内,则计算hA和Y′A,hA=H1(IDA,RA),Y′A=zAP-eA(RA+hAPpub),并验证eA=H2(TA,XA,IDA,RA,Y′A)是否成立,若成立,则通过验证,其中,Ppub为PKG系统的公钥;
获取随机数xB和yB,计算YB和XB,其中,YB=yBP,XB=xBP;
获取第二当前时戳TB,计算哈希值eB=H2(TB,XB,IDB,RB,YB)和对TB和XB的签名zB=yB+eB+eB(dB+sB),其中,IDB为所述待处理财务票据图像的接收方的身份标识,RB=sBP+rBP,sB为所述待处理财务票据图像的接收方自身随机选择的秘密数,dB为接收方的部分私钥,rB为PKG系统为所述待处理财务票据图像的接收方随机选择的秘密数;
发送<IDB,RB,XB,TB,eB,zB>给所述发送方,并将kAB=H3(xB,XA)作为第一会话秘钥,使得所述发送方对所述待处理财务票据图像的接收方进行认证并生成第二会话秘钥,根据所述第二会话秘钥对所述待处理财务票据图像进行加密,生成密文;
相应地,所述接收待处理财务票据图像,包括:
接收所述密文,采用所述第一会话秘钥对所述密文进行解密,得到所述待处理财务票据图像;
提取所述待识别财务票据图像中的目标财务信息;
根据所述目标财务信息对所述待识别财务票据图像进行分类;
根据所述目标财务信息和所述待识别财务票据的分类结果,生成与所述分类结果对应的财务审批单据;
在所述财务审批单据审批通过之后,将所述待处理财务票据图像和所述财务审批单据存储在与所述分类结果对应的财务数据库中。
2.根据权利要求1所述的财务票据处理方法,其特征在于,所述对所述待处理财务票据图像进行预处理,得到待识别财务票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理,包括:
将所述待处理财务票据图像转化为HSI颜色模型图像,将所述HSI颜色模型图像中的红色和蓝色去除;
将去除红色和蓝色的所述待处理财务票据图像转化为灰度等级为0至255的灰度图像;
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景,得到待识别财务票据图像。
3.根据权利要求2所述的财务票据处理方法,其特征在于,所述对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景,得到待识别财务票据图像,包括:
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景;
采用直方图均衡化方法改变分割后的所述灰度图像的对比度,以对所述灰度图像进行图像增强;
采用高斯离散逼近函数对增强后的所述灰度图像进行平滑去噪,得到待识别财务票据图像,其中,σ为高斯离散逼近函数的标准差,x为灰度图像中某像素的位置。
4.根据权利要求3所述的财务票据处理方法,其特征在于,还包括:
对平滑去噪后的图像进行倾斜校正。
5.根据权利要求1所述的财务票据处理方法,其特征在于,所述提取所述待识别财务票据图像中的目标财务信息,包括:
定位所述待识别财务票据图像的目标区域;
采用轮廓提取方法从所述目标区域提取包含有字符的字符图像;
对每个所述字符图像进行模板匹配,识别出所述目标区域中的字符,得到目标财务信息。
6.根据权利要求5所述的财务票据处理方法,其特征在于,所述对每个所述字符图像进行模板匹配,识别出所述目标区域中的字符,得到目标财务信息,包括:
将所有所述字符图像按x轴坐标大小排序,从x轴坐标最小的所述字符图像开始,依次进行模板匹配;
当前一个字符图像匹配结束时,后一个字符图像根据与所述前一个字符图像的间隔关系,向x轴的正向偏移预置个像素单位的位置开始匹配,所述预置个像素单位为模板图像的宽度;
当匹配到的字符图像中的字符为*时,计算*前面识别的字符图像的数量;
若*前面识别的字符图像的数量未达到第一目标数量,则以所述x轴坐标最小的所述字符图像为基准,向x轴的负向偏移所述预置个像素单位的位置开始匹配,直至*前面识别到的字符图像的数量达到所述第一目标数量;
若数量达到第一目标数量,则根据*的位置,依次对*后面的第二目标数量个字符图像进行模板匹配,识别出对应的字符,得到目标财务信息。
7.根据权利要求5所述的财务票据处理方法,其特征在于,所述目标财务信息包括目标日期信息;
在提取目标日期信息时采用漫水填充算法提取目标日期。
8.一种财务票据处理装置,其特征在于,包括:
接收模块,用于接收待处理财务票据图像;
预处理模块,用于对所述待处理财务票据图像的合法性进行验证,若所述待处理财务票据图像合法,则对所述待处理财务票据图像进行预处理,得到待识别财务票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理;其中,所述对所述待处理财务票据图像的合法性进行验证,包括:
向所述待处理财务票据图像的发送方发起合法性验证会话;
接收所述发送方响应于所述合法性验证会话发送的验证信息,所述验证信息为<IDA,RA,XA,TA,eA,zA>,其中,IDA为所述发送方的身份标识,TA为第一当前时戳,eA为哈希值,eA=H2(TA,XA,IDA,RA,YA),zA为TA和XA的签名,zA=yA+eA(dA+sA),XA=xAP,YA=xAP,RA=sAP+rAP,rA为PKG系统为所述发送方随机算则的秘密数,sA为所述发送方自身随机选择的秘密数,dA为所述发送方的部分私钥,xA和yA是随机数,为q阶的点群,P为q阶循环加法群G的生成元;
检测TA与当前时间信息的时间差,若所述时间差在预置范围内,则计算hA和Y′A,hA=H1(IDA,RA),Y′A=zAP-eA(RA+hAPpub),并验证eA=H2(TA,XA,IDA,RA,Y′A)是否成立,若成立,则通过验证,其中,Ppub为PKG系统的公钥;
获取随机数xB和yB,计算YB和XB,其中,YB=yBP,XB=xBP;
获取第二当前时戳TB,计算哈希值eB=H2(TB,XB,IDB,RB,YB)和对TB和XB的签名zB=yB+eB+eB(dB+sB),其中,IDB为所述待处理财务票据图像的接收方的身份标识,RB=sBP+rBP,sB为所述待处理财务票据图像的接收方自身随机选择的秘密数,dB为接收方的部分私钥,rB为PKG系统为所述待处理财务票据图像的接收方随机选择的秘密数;
发送<IDB,RB,XB,TB,eB,zB>给所述发送方,并将kAB=H3(xB,XA)作为第一会话秘钥,使得所述发送方对所述待处理财务票据图像的接收方进行认证并生成第二会话秘钥,根据所述第二会话秘钥对所述待处理财务票据图像进行加密,生成密文;
相应地,所述接收模块用于:
接收所述密文,采用所述第一会话秘钥对所述密文进行解密,得到所述待处理财务票据图像;
目标信息提取模块,用于提取所述待识别财务票据图像中的目标财务信息;
分类模块,用于根据所述目标财务信息对所述待识别财务票据图像进行分类;
审批单据生成模块,用于根据所述目标财务信息和所述待识别财务票据的分类结果,生成与所述分类结果对应的财务审批单据;
存储模块,用于在所述财务审批单据审批通过之后,将所述待处理财务票据图像和所述财务审批单据存储在与所述分类结果对应的财务数据库中。
9.根据权利要求8所述的财务票据处理装置,其特征在于,所述预处理模块包括:
去干扰子模块,用于将所述待处理财务票据图像转化为HSI颜色模型图像,将所述HSI颜色模型图像中的红色和蓝色去除;
灰度化子模块,用于将去除红色和蓝色的所述待处理财务票据图像转化为灰度等级为0至255的灰度图像;
二值化子模块,用于对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景,得到待识别财务票据图像。
10.根据权利要求9所述的财务票据处理装置,其特征在于,所述二值化子模块具体用于:
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景;
采用直方图均衡化方法改变分割后的所述灰度图像的对比度,以对所述灰度图像进行图像增强;
采用高斯离散逼近函数对增强后的所述灰度图像进行平滑去噪,得到待识别财务票据图像,其中,σ为高斯离散逼近函数的标准差,x为灰度图像中某像素的位置。
11.根据权利要求10所述的财务票据处理装置,其特征在于,所述二值化子模块具体还用于:
对平滑去噪后的图像进行倾斜校正。
12.根据权利要求8所述的财务票据处理装置,其特征在于,所述目标信息提取模块,包括:
区域定位子模块,用于定位所述待识别财务票据图像的目标区域;
字符图像提取子模块,用于采用轮廓提取方法从所述目标区域提取包含有字符的字符图像;
模板匹配子模块,用于对每个所述字符图像进行模板匹配,识别出所述目标区域中的字符,得到目标财务信息。
13.根据权利要求12所述的财务票据处理装置,其特征在于,所述模板匹配子模块具体用于:
将所有所述字符图像按x轴坐标大小排序,从x轴坐标最小的所述字符图像开始,依次进行模板匹配;
当前一个字符图像匹配结束时,后一个字符图像根据与所述前一个字符图像的间隔关系,向x轴的正向偏移预置个像素单位的位置开始匹配,所述预置个像素单位为模板图像的宽度;
当匹配到的字符图像中的字符为*时,计算*前面识别的字符图像的数量;
若*前面识别的字符图像的数量未达到第一目标数量,则以所述x轴坐标最小的所述字符图像为基准,向x轴的负向偏移所述预置个像素单位的位置开始匹配,直至*前面识别到的字符图像的数量达到所述第一目标数量;
若数量达到第一目标数量,则根据*的位置,依次对*后面的第二目标数量个字符图像进行模板匹配,识别出对应的字符,得到目标财务信息。
14.根据权利要求12所述的财务票据处理装置,其特征在于,所述目标财务信息包括目标日期信息;
在提取目标日期信息时采用漫水填充算法提取目标日期。
15.一种财务票据处理设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-7任一项所述的财务票据处理方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-7任一项所述的财务票据处理方法。
CN202010354764.6A 2020-04-29 2020-04-29 一种财务票据处理方法、装置、设备和可读存储介质 Active CN111582115B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010354764.6A CN111582115B (zh) 2020-04-29 2020-04-29 一种财务票据处理方法、装置、设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010354764.6A CN111582115B (zh) 2020-04-29 2020-04-29 一种财务票据处理方法、装置、设备和可读存储介质

Publications (2)

Publication Number Publication Date
CN111582115A CN111582115A (zh) 2020-08-25
CN111582115B true CN111582115B (zh) 2024-02-02

Family

ID=72123475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010354764.6A Active CN111582115B (zh) 2020-04-29 2020-04-29 一种财务票据处理方法、装置、设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN111582115B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112884662A (zh) * 2021-01-05 2021-06-01 杭州国测测绘技术有限公司 基于飞行器航拍图像的三维数字地图图像处理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982343A (zh) * 2012-11-12 2013-03-20 信阳师范学院 手写数字识别的增量式模糊支持向量机方法
CN104751194A (zh) * 2015-04-27 2015-07-01 陈包容 一种财务费用报销的处理方法及装置
CN107194400A (zh) * 2017-05-31 2017-09-22 北京天宇星空科技有限公司 一种财务报销全票据图片识别处理方法
CN107633239A (zh) * 2017-10-18 2018-01-26 江苏鸿信系统集成有限公司 基于深度学习和ocr的票据分类及票据字段提取方法
CN109584978A (zh) * 2018-10-26 2019-04-05 西安邮电大学 基于签名聚合医疗健康监控网络模型信息处理方法及系统
CN110647824A (zh) * 2019-09-03 2020-01-03 四川大学 基于计算机视觉技术的增值税发票版面提取方法
CN111062262A (zh) * 2019-11-26 2020-04-24 爱信诺征信有限公司 发票识别方法以及发票识别装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982343A (zh) * 2012-11-12 2013-03-20 信阳师范学院 手写数字识别的增量式模糊支持向量机方法
CN104751194A (zh) * 2015-04-27 2015-07-01 陈包容 一种财务费用报销的处理方法及装置
CN107194400A (zh) * 2017-05-31 2017-09-22 北京天宇星空科技有限公司 一种财务报销全票据图片识别处理方法
CN107633239A (zh) * 2017-10-18 2018-01-26 江苏鸿信系统集成有限公司 基于深度学习和ocr的票据分类及票据字段提取方法
CN109584978A (zh) * 2018-10-26 2019-04-05 西安邮电大学 基于签名聚合医疗健康监控网络模型信息处理方法及系统
CN110647824A (zh) * 2019-09-03 2020-01-03 四川大学 基于计算机视觉技术的增值税发票版面提取方法
CN111062262A (zh) * 2019-11-26 2020-04-24 爱信诺征信有限公司 发票识别方法以及发票识别装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘刚 ; 黄襄念 ; 符清芳 ; 饶伟 ; .购物小票图像识别预处理算法的研究.计算机时代.2016,(04),第21-24页. *
单家凌.一种无证书签名方案在数据验证中的应用研究.软件.2017,第38卷(第7期),第28-31页. *
薛圣利等.基于OpenCV的火车票识别算法.广西科技大学学报.2016,第27卷(第2期),第46-50页. *
邵健等.基于身份的强指定验证者签名方案.计算机工程.2010,第36卷(第8期),第167-169页. *

Also Published As

Publication number Publication date
CN111582115A (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
US11062163B2 (en) Iterative recognition-guided thresholding and data extraction
US11030752B1 (en) System, computing device, and method for document detection
CN110598699B (zh) 一种基于多光谱图像的防伪票据鉴伪系统和方法
US8879846B2 (en) Systems, methods and computer program products for processing financial documents
US10248954B2 (en) Method and system for verifying user identity using card features
EP2897082B1 (en) Methods and systems for improved license plate signature matching
EP2937819B1 (en) System which uses information code
JP2016517587A (ja) モバイル装置を用いて取込まれたデジタル画像におけるオブジェクトの分類
JP4362538B2 (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
CN111784498A (zh) 身份认证方法、装置、电子设备及存储介质
JP4362537B2 (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
CN111931783A (zh) 一种训练样本生成方法、机读码识别方法及装置
CN108197624A (zh) 证书图像校正识别方法及装置、计算机存储介质
CN111582115B (zh) 一种财务票据处理方法、装置、设备和可读存储介质
CN111445058A (zh) 数据分析方法、装置、设备及计算机可读存储介质
CN111462388A (zh) 一种票据检验方法、装置、终端设备及存储介质
CN108615218B (zh) 伪随机信息空域调制的印刷量子点水印检测方法
Mayer et al. Fundamentals and applications of hardcopy communication
Hu et al. Document recapture detection based on a unified distortion model of halftone cells
JP2008228211A (ja) 画像出力方法、画像処理装置、画像形成装置、画像読取装置、コンピュータプログラム及び記録媒体
CN110415424B (zh) 一种防伪鉴定方法、装置、计算机设备和存储介质
CN113077355A (zh) 保险理赔方法、装置、电子设备及存储介质
CN108537945B (zh) 票据水印检测方法、系统及自助设备
CN112597810A (zh) 身份证明文件认证方法和系统
US11900755B1 (en) System, computing device, and method for document detection and deposit processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant