CN111582115A - 一种财务票据处理方法、装置、设备和可读存储介质 - Google Patents

一种财务票据处理方法、装置、设备和可读存储介质 Download PDF

Info

Publication number
CN111582115A
CN111582115A CN202010354764.6A CN202010354764A CN111582115A CN 111582115 A CN111582115 A CN 111582115A CN 202010354764 A CN202010354764 A CN 202010354764A CN 111582115 A CN111582115 A CN 111582115A
Authority
CN
China
Prior art keywords
financial
image
processed
target
financial bill
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010354764.6A
Other languages
English (en)
Other versions
CN111582115B (zh
Inventor
伍斯龙
王泽涌
臧笑宇
徐培瑶
吴赟
佟忠正
王哲
洪雨天
黄杰韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Electric Power Information Technology Co Ltd
Original Assignee
Guangdong Electric Power Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Electric Power Information Technology Co Ltd filed Critical Guangdong Electric Power Information Technology Co Ltd
Priority to CN202010354764.6A priority Critical patent/CN111582115B/zh
Publication of CN111582115A publication Critical patent/CN111582115A/zh
Application granted granted Critical
Publication of CN111582115B publication Critical patent/CN111582115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0861Generation of secret information including derivation or calculation of cryptographic keys or passwords
    • H04L9/0869Generation of secret information including derivation or calculation of cryptographic keys or passwords involving random numbers or seeds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • Bioethics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请公开了一种财务票据处理方法、装置、设备和可读存储介质,通过对待处理财务票据图像进行图像处理、提取目标财务信息和财务票据分类,生成相应的财务审批单据,并在财务审批单据审批通过之后将待处理财务票据图像和财务审批单据存储在与分类结果对应的财务数据库中,实现了财务票据的自动审核、录入与存储,避免了现有技术采用人工处理财务票据存在的缺陷,解决了现有的票据录入工作均由财务人员进行人工填报,存在处理效率低和准确性低的技术问题。

Description

一种财务票据处理方法、装置、设备和可读存储介质
技术领域
本申请涉及票据管理技术领域,尤其涉及一种财务票据处理方法、装置、 设备和可读存储介质。
背景技术
票据管理是企业财务工作的重要部分,在日常报销及物资报销的过程中, 所有的票据录入工作均由财务人员进行人工填报,财务人员面临的发票种类、 数量繁多,核查检验票据费时费力,而且对业务单据以及发票附件中核对、 累加金额容易出错,存在审计检查风险。因此,为提高财务票据处理的效率 和准确性,有必要对现有的人工录入票据信息进行财务管理的方式进行改善。
发明内容
本申请提供了一种财务票据处理方法、装置、设备和可读存储介质,用 于解决现有的票据录入工作均由财务人员进行人工填报,存在处理效率低和 准确性低的技术问题。
有鉴于此,本申请第一方面提供了一种财务票据处理方法,包括:
接收待处理财务票据图像;
对所述待处理财务票据图像进行预处理,得到待识别财务票据图像,所 述预处理包括去干扰处理、灰度化处理和二值化处理;
提取所述待识别财务票据图像中的目标财务信息;
根据所述目标财务信息对所述待识别财务票据图像进行分类;
根据所述目标财务信息和所述待识别财务票据的分类结果,生成与所述 分类结果对应的财务审批单据;
在所述财务审批单据审批通过之后,将所述待处理财务票据图像和所述 财务审批单据存储在与所述分类结果对应的财务数据库中。
可选地,所述对所述待处理财务票据图像进行预处理,包括:
对所述待处理财务票据图像的合法性进行验证,若所述待处理财务票据 图像合法,则对所述待处理财务票据图像进行预处理,得到待识别财务票据 图像。
可选地,所述对所述待处理财务票据图像进行预处理,得到待识别财务 票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理,包括:
将所述待处理财务票据图像转化为HSI颜色模型图像,将所述HIS颜色 模型图像中的红色和蓝色去除;
将去除红色和蓝色的所述待处理财务票据图像转化为灰度等级为0至255 的灰度图像;
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景, 得到待识别财务票据图像。
可选地,所述对所述灰度图像进行二值化处理,将所述灰度图像分割成 前景和背景,得到待识别财务票据图像,包括:
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景;
采用直方图均衡化方法改变分割后的所述灰度图像的对比度,以对所述 灰度图像进行图像增强;
采用高斯离散逼近函数
Figure BDA0002473075930000021
对增强后的所述灰度图像进 行平滑去噪,得到待识别财务票据图像,其中,σ为高斯离散逼近函数的标准 差,x为灰度图像中某像素的位置。
可选地,还包括:
对平滑去噪后的图像进行倾斜校正。
可选地,所述提取所述待识别财务票据图像中的目标财务信息,包括:
定位所述待识别财务票据图像的目标区域;
采用轮廓提取方法从所述目标区域提取包含字符的字符图像;
对每个所述字符图像进行模板匹配,识别出所述目标区域中的字符,得 到目标财务信息。
可选地,所述对每个所述字符图像进行模板匹配,识别出所述目标区域 中的字符,得到目标财务信息,包括:
将所有所述字符图像按x轴坐标大小排序,从x轴坐标最小的所述字符图 像开始,依次进行模板匹配;
当前一个字符图像匹配结束时,后一个字符图像根据与所述前一个字符 图像的间隔关系,向x轴的正向偏移预置个像素单位的位置开始匹配,所述 预置个像素单位为模板图像的宽度;
当匹配到的字符图像中的字符为*时,计算*前面识别的字符图像的数量;
若*前面识别的字符图像的数量未达到所述第一目标数量,则以所述x轴 坐标最小的所述字符图像为基准,向x轴的负向偏移所述预置个像素单位的 位置开始匹配,直至*前面识别到的字符图像的数量达到所述第一目标数量;
若数量达到第一目标数量,则根据*的位置,依次对*后面的第二目标数 量个字符图像进行模板匹配,识别出对应的字符,得到目标财务信息。
可选地,所述目标财务信息包括目标日期信息;
在提取目标日期信息时采用漫水填充算法提取目标日期。
可选地,所述对所述待处理财务票据图像的合法性进行验证,包括:
向所述待处理财务票据图像的发送方发起合法性验证会话;
接收所述发送方响应于所述合法性验证会话发送的验证信息,所述验证 信息为IDA,RA,XA,TA,eA,zA,其中,IDA为所述发送方的身份标识,TA为第一当 前时戳,eA为哈希值,eA=H2(TA,XA,IDA,RA,YA),zA为TA和XA的签名, zA=yA+eA(dA+sA),XA=xAP,YA=xAP,RA=sAP+rAP,rA为PKG系统为所述 发送方随机算则的秘密数,sA为所述发送方自身随机选择的秘密数,dA为所 述发送方的部分私钥,,xA和xB是随机数,
Figure BDA0002473075930000032
Figure BDA0002473075930000033
为q阶的点群,P为 q阶循环加法群G的生成元;
检测TA与当前时间信息的时间差,若所述时间差在预置范围内,则计算hA和Y′A,hA=H1(IDA,RA),Y′A=zAP-eA(RA+hAPpub),并验证eA=H2(TA,XA,IDA,RA,Y′A) 是否成立,若成立,则通过验证,其中,Ppub为PKG系统的公钥。
可选地,还包括:
获取随机数xB和yB,计算YB和XB,其中,
Figure BDA0002473075930000031
YB=yBP,XB=xBP;
获取第二当前时戳TB,计算哈希值eB=H2(TB,XB,IDB,RB,YB)和对TB和XB的 签名zB=yB+eB+eB(dB+sB),其中,IDB为所述待处理财务票据图像的接收方的 身份标识,RB=sBP+rBP,sB为所述待处理财务票据图像的接收方自身随机选 择的秘密数,dB为接收方的部分私钥,,rB为PKG系统为所述待处理财务票 据图像的接收方随机选择的秘密数;
发送IDB,RB,XB,TB,eB,zB给所述发送方,并将kAB=H3(xB,XA)作为第一会话 秘钥,使得所述发送方对所述待处理财务票据图像的接收方进行认证并生成 第二会话秘钥,根据所述第二会话秘钥对所述待处理财务票据图像进行加密, 生成密文;
相应地,所述接收待处理财务票据图像,包括:
接收所述密文,采用所述第一会话秘钥对所述密文进行解密,得到所述 待处理财务票据图像。
本申请第二方面提供了一种财务票据处理装置,包括:
接收模块,用于接收待处理财务票据图像;
预处理模块,用于对所述待处理财务票据图像进行预处理,得到待识别 财务票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理;
目标信息提取模块,用于提取所述待识别财务票据图像中的目标财务信 息;
分类模块,用于根据所述目标财务信息对所述待识别财务票据图像进行 分类;
审批单据生成模块,用于根据所述目标财务信息和所述待识别财务票据 的分类结果,生成与所述分类结果对应的财务审批单据;
存储模块,用于在所述财务审批单据审批通过之后,将所述待处理财务 票据图像和所述财务审批单据存储在与所述分类结果对应的财务数据库中。
可选地,所述预处理模块具体用于:
对所述待处理财务票据图像的合法性进行验证,若所述待处理财务票据 图像合法,则对所述待处理财务票据图像进行预处理,得到待识别财务票据 图像。
可选地,所述预处理模块包括:
去干扰子模块,用于将所述待处理财务票据图像转化为HSI颜色模型图 像,将所述HIS颜色模图像中的红色和蓝色去除;
灰度化子模块,用于将去除红色和蓝色的所述待处理财务票据图像转化 为灰度等级为0至255的灰度图像;
二值化子模块,用于对所述灰度图像进行二值化处理,将所述灰度图像 分割成前景和背景,得到待识别财务票据图像。
可选的,所述二值化子模块具体用于:
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景;
采用直方图均衡化方法改变分割后的所述灰度图像的对比度,以对所述 灰度图像进行图像增强;
采用高斯离散逼近函数
Figure BDA0002473075930000051
对增强后的所述灰度图像进 行平滑去噪,得到待识别财务票据图像,其中,σ为高斯离散逼近函数的标准 差,x为灰度图像中某像素的位置。
可选地,所述二值化子模块具体还用于:
对平滑去噪后的图像进行倾斜校正。
可选地,所述目标信息提取模块,包括:
区域定位子模块,用于定位所述待识别财务票据图像的目标区域;
字符图像提取子模块,用于采用轮廓提取方法从所述目标区域提取包含 字符的字符图像;
模板匹配子模块,用于对每个所述字符图像进行模板匹配,识别出所述 目标区域中的字符,得到目标财务信息。
可选地,所述模板匹配子模块具体用于:
将所有所述字符图像按x轴坐标大小排序,从x轴坐标最小的所述字符图 像开始,依次进行模板匹配;
当前一个字符图像匹配结束时,后一个字符图像根据与所述前一个字符 图像的间隔关系,向x轴的正向偏移预置个像素单位的位置开始匹配,所述 预置个像素单位为模板图像的宽度;
当匹配到的字符图像中的字符为*时,计算*前面识别的字符图像的数量;
若*前面识别的字符图像的数量未达到所述第一目标数量,则以所述x轴 坐标最小的所述字符图像为基准,向x轴的负向偏移所述预置个像素单位的 位置开始匹配,直至*前面识别到的字符图像的数量达到所述第一目标数量;
若数量达到第一目标数量,则根据*的位置,依次对*后面的第二目标数 量个字符图像进行模板匹配,识别出对应的字符,得到目标财务信息。
可选地,所述目标财务信息包括目标日期信息;
在提取目标日期信息时采用漫水填充算法提取目标日期。
可选地,所述对所述待处理财务票据图像的合法性进行验证,包括:
向所述待处理财务票据图像的发送方发起合法性验证会话;
接收所述发送方响应于所述合法性验证会话发送的验证信息,所述验证 信息为<IDA,RA,XA,TA,eA,zA>,其中,IDA为所述发送方的身份标识,TA为第一当 前时戳,eA为哈希值,eA=H2(TA,XA,IDA,RA,YA),zA为TA和XA的签名, zA=yA+eA(dA+sA),XA=xAP,YA=xAP,RA=sAP+rAP,rA为PKG系统为所述 发送方随机算则的秘密数,sA为所述发送方自身随机选择的秘密数,dA为所 述发送方的部分私钥,xA和xB是随机数,
Figure BDA0002473075930000061
Figure BDA0002473075930000062
为q阶的点群,P为 q阶循环加法群G的生成元;
检测TA与当前时间信息的时间差,若所述时间差在预置范围内,则计算hA和Y′A,hA=H1(IDA,RA),Y′A=zAP-eA(RA+hAPpub),并验证eA=H2(TA,XA,IDA,RA,Y′A) 是否成立,若成立,则通过验证,其中,Ppub为PKG系统的公钥。
可选地,还包括:
获取随机数xB和yB,计算YB和XB,其中,
Figure BDA0002473075930000063
YB=yBP,XB=xBP;
获取第二当前时戳TB,计算哈希值eB=H2(TB,XB,IDB,RB,YB)和对TB和XB的 签名zB=yB+eB+eB(dB+sB),其中,IDB为所述待处理财务票据图像的接收方的 身份标识,RB=sBP+rBP,sB为所述待处理财务票据图像的接收方自身随机选 择的秘密数,dB为接收方的部分私钥,rB为PKG系统为所述待处理财务票据 图像的接收方随机选择的秘密数;
发送IDB,RB,XB,TB,eB,zB给所述发送方,并将kAB=H3(xB,XA)作为第一会话 秘钥,使得所述发送方对所述待处理财务票据图像的接收方进行认证并生成 第二会话秘钥,根据所述第二会话秘钥对所述待处理财务票据图像进行加密, 生成密文;
相应地,所述接收模块用于:
接收所述密文,采用所述第一会话秘钥对所述密文进行解密,得到所述 待处理财务票据图像。
本申请第三方面提供了一种财务票据处理设备,所述设备包括处理器以 及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的 财务票据处理方法。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储 介质用于存储程序代码,所述程序代码用于执行第一方面任一种所述的财务 票据处理方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中提供了一种财务票据处理方法,包括:接收待处理财务票据图 像;对待处理财务票据图像进行预处理,得到待识别财务票据图像,预处理 包括去干扰处理、灰度化处理和二值化处理;提取待识别财务票据图像中的 目标财务信息;根据目标财务信息对待识别财务票据图像进行分类;根据目 标财务信息和待识别财务票据的分类结果,生成与分类结果对应的财务审批 单据;在财务审批单据审批通过之后,将待处理财务票据图像和财务审批单 据存储在与分类结果对应的财务数据库中。本申请中提供的财务票据处理方法,通过对待处理财务票据图像进行图像处理、提取目标财务信息和财务票 据分类,生成相应的财务审批单据,并在财务审批单据审批通过之后将待处 理财务票据图像和财务审批单据存储在与分类结果对应的财务数据库中,实 现了财务票据的自动审核、录入与存储,避免了现有技术采用人工处理财务 票据存在的缺陷,解决了现有的票据录入工作均由财务人员进行人工填报, 存在处理效率低和准确性低的技术问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中 所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些 附图获得其他的附图。
图1为本申请实施例中提供的一种财务票据处理方法的一个流程示意图;
图2为本申请实施例中提供的一种财务票据处理装置的一个结构示意图;
图3为本申请实施例中提供的一种财务票据处理设备的一个结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实 施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然, 所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申 请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的 所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请提供了一种财务票据处理方法的实 施例,包括:
步骤101、接收待处理财务票据图像。
需要说明的是,在一个实施例中,待处理财务票据图像可以是原财务票 据凭证图像,可以通过摄像机拍摄原财务票据凭证的图像。可以理解的是, 原财务票据凭证可以是发票、购物小票、车票或合同文件等。
步骤102、对待处理财务票据图像进行预处理,得到待识别财务票据图像, 预处理包括去干扰处理、灰度化处理和二值化处理。
需要说明的是,由于直接获取到的待处理财务票据图像存在例如噪声干 扰和颜色干扰等干扰情况,因此,在获取到待处理财务票据图像之后,需要 对该待处理财务票据图像进行去干扰处理、灰度化处理和二值化处理,得到 待识别财务票据图像。
在一个实施例中,对待处理财务票据图像进行去干扰处理、灰度化处理 和二值化处理的具体过程可以是:
首先,将待处理财务票据图像转化为HSI颜色模型的图像,将转换为HIS 颜色模型的图像后的待处理财务票据图像中的红色和蓝色去除。
需要说明的是,直接获取到的待处理财务票据图像属于RGB颜色模型, 而待处理财务票据图像中可能存在红色和/或蓝色的印章,这些印章颜色的存 在会对待处理财务票据的处理结果产生干扰。因此,可以将RGB颜色模型转 化为HIS颜色模型,找到红色和蓝色在HIS颜色模型中的范围,将红色和蓝 色的干扰色去掉。HIS颜色模型是基于色调(Hue)、饱和度(Saturation)和 亮度(Intensity)的颜色模型,并且符合人类观察和感受颜色的视觉和心理学 特点,所以只要找到红色和蓝色在HIS颜色模型中的范围/位置,就可以将红 色和蓝色的干扰色去掉,而且对其他的字符信息没有影响。将图像由RGB颜 色模型转化为HIS颜色模型的转换公式为:
Figure BDA0002473075930000091
Figure BDA0002473075930000092
Figure BDA0002473075930000093
红色和蓝色在HIS模型的范围不能只依靠色调H来决定,需要H和S共 同确定。当0≤H≤10或者350≤H≤360且S≥0.3时,为红色的范围;当 170≤H≤190且S≥0.3时,为蓝色的范围。利用这两个范围可以将图像中红 色或者蓝色的印章去除掉。
然后,将去除红色和蓝色的待处理财务票据图像转化为灰度等级为0至 255的灰度图像。
最后,对灰度图像进行二值化处理,将灰度图像分割成前景和背景,得 到待识别财务票据图像。
需要说明的是,将灰度图像经过二值化处理后能够得到更清晰的几何特 征,同时能够缩减图像的数据量,简化图像后续的处理和分析。实际上,对 灰度图像的二值化的处理过程即是将灰度图像分割成前景和背景。选取一个 阈值,灰度图像中大于该阈值的为前景像素,小于该阈值的为背景像素。通 常该阀值可以根据具体应用场景来设定,比如背景色为黑色底板,而票据为 亮色纸,阀值可以设定较低的值,比如30(灰度值的取值范围0-255)。
在一个实施例中,在得到待识别财务票据图像之后,还可以通过直方图 均衡化方法改变灰度图像的全部或局部对比度来进行图像增强,采用高斯离 散逼近函数
Figure BDA0002473075930000094
对增强后的灰度图像进行平滑去噪,其中,σ 为高斯离散逼近函数的标准差,x为灰度图像中某像素的位置。通过直方图均 衡化,当一幅图像的像素占据了所有的灰度级并且呈均匀分布时,则该图像 具有比较高的对比度和多变的灰度色调,因此,图像增强之后,可以更加突 出感兴趣的字符区域。直接获取的待处理财务票据图像常会受到一些随机误 差而退化,或者在图像获取的过程中因环境条件、成像设备自身质量的影响, 在图像的传输过程中因所用传输信道的干扰污染等,会产生噪声,在此实施 例中,通过高斯滤波对整体图像进行加权平均,每一个像素的值都由其本身 和邻域内的其他像素经过加权平均后得到,具体地,可以用一个模板扫描灰 度图像中的每一个像素,用模板确定邻域内像素的加权平均灰度值去替代模 板中心像素点的值。
在一个实施例中,还可以对平滑去噪后的图像进行倾斜校正。
需要说明的是,由于在拍摄待处理财务票据图像时,由于待处理财务票 据摆放的任意性,拍摄图像的设备获取的待处理财务票据图像会存在一定的 角度,对于一些发票类的待处理财务票据可能还会有二维码,二维码为方形, 可以借助方形二维码的几个角度点来计算倾斜角,并通过倾斜角来校正整个 待处理财务票据图像。下面以存在方形二维码的发票作为待处理财务票据为 例来说明倾斜校正的过程:
从二维码左下角开始按顺时针顺序依次标记二维码的3个方形角点的中 心点坐标,得到{C1(x,y),C2(x,y),C3(x,y)};
在提取到的3个方形角点中,根据C2(x,y)和C3(x,y)的x轴距离dx和y轴的距 离dy可计算出图像的倾斜角度θ,倾斜角度θ计算公式为:
Figure BDA0002473075930000101
在计算得到倾斜角度θ后,将图像旋转-θ即可得到校正后的图像。
需要说明的是,在接收待处理财务票据图像时,由于财务资料的放置角 度不正或者获取时经人为移动,可能造成采集的待处理财务票据图像的倾斜, 通过此实施例中对倾斜图像进行校正,便于后续的图像信息识别,有助于提 高识别准确率。
在一个实施例中,在接收待处理财务票据图像之后,可以对待处理财务 票据图像的合法性进行验证,若待处理财务票据图像合法,对待处理财务票 据图像进行后续处理操作,若待处理财务票据图像不合法,则流程中止。
为从源头保证待处理财务票据图像的合法性,需要对待处理财务票据图 像的合法性进行验证,对于待处理财务票据图像的发送方进行身份验证,若 验证通过,则待处理财务票据图像是合法的,可进行后续的对待处理财务票 据图像进行图像处理、识别、审批和存储等流程,若验证不通过,则待处理 财务票据图像是不合法的,应停止流程。
需要说明的是,在具体的实施过程中,在接收待处理财务票据图像时向 待处理财务票据图像的发送方发起合法性验证会话;接收发送方响应于合法 性验证会话发送的验证信息,验证信息为<IDA,RA,XA,TA,eA,zA>,其中,IDA为发 送方的身份标识,TA为第一当前时戳,eA为哈希值,eA=H2(TA,XA,IDA,RA,YA), zA为TA和XA的签名,zA=yA+eA(dA+sA),XA=xAP,YA=xAP,RA=sAP+rAP,rA为PKG系统为发送方随机算则的秘密数,dA为发送方的部分私钥,sA为发送 方自身随机选择的秘密数,xA和xB是随机数,
Figure BDA0002473075930000111
Figure BDA0002473075930000112
为q阶的点群, P为q阶循环加法群G的生成元;检测TA与当前时间信息的时间差,若时间 差在预置范围内,则计算hA和Y′A,hA=H1(IDA,RA),Y′A=zAP-eA(RA+hAPpub),并 验证eA=H2(TA,XA,IDA,RA,Y′A)是否成立,若成立,则通过验证,其中,Ppub为PKG 系统的公钥。
在一个实施例中,时间差的预置范围设为1小时。检测时戳是用于确保 密钥协商在较短时间内完成,本实施例中可以将接收的时戳与自身显示的时 间信息进行比对,如果两者的时间差超过1个小时,则结束后续密钥协商流 程,如果在1个小时之内,则继续后续密钥协商流程,从而防止密钥协商周 期较长而导致产生的会话密钥安全系数较低的问题。
PKG(Private Key Generate)系统是一个离线的私钥生成中心,通过PKG 为发送方和接收方生成基于身份的公私钥对,在进行身份认证和密钥协商之 前,需要对系统进行初始化设置,具体包括:
(1)给定安全参数k,PKG选择椭圆曲线E(FP)上的q阶循环加法群G, G的生成元为P。随机选择
Figure BDA0002473075930000113
作为系统主密钥,系统公钥为Ppub=sP∈G。 定义以下安全哈希函数:
Figure BDA0002473075930000114
H3:G→{0,1}*
PKG妥善保管s,公开系统参数(G,q,P,Ppub,H1,H2,H3)。
(2)假设每个发送方拥有唯一的身份标识IDi∈{0,1}n,发送方IDi随机选 择
Figure BDA0002473075930000121
作为秘密数,计算R1=siP,然后将R1和IDi发送给PKG,PKG可以通 过零知识证明方法确认IDi具有R1对应的秘密数si
PKG对发送方身份和R1鉴定后,按照如下步骤计算发送方IDi的部分私钥:
①随机选择
Figure BDA0002473075930000124
计算R2=riP,Ri=R1+R2
②令h=H1(IDi,Ri),计算部分私钥di=ri+sh。
PKG将Ri和di发送给发送方IDi,发送方IDi通过检验 (di+si)P=Ri+H1(IDi,Ri)Ppub是否成立来验证部分私钥的正确性。
在本实施例中,发送方和接收方每次都会生成不同的会话密钥,并且每 次协商密钥都选择了新的密钥协商参数xA和xB,因此,会话密钥之间是独立 的,一个密钥的泄露不会影响另一个密钥的安全性。PKG只为发送方生成了 部分私钥,只有获得发送方选择的秘密数才能得到完整的签名私钥,因此, 当PKG被恶意实体攻破,主密钥被恶意实体获得后,恶意实体因没有发送方 秘密值而无法得到发送方的签名密钥,从而无法假冒合法的发送方身份。
在一个实施例中,待处理财务票据图像的接收方选择随机数xB和yB,计 算YB和XB,其中,
Figure BDA0002473075930000122
YB=yBP,XB=xBP;
获取第二当前时戳TB,计算哈希值eB=H2(TB,XB,IDB,RB,YB)和对TB和XB的 签名zB=yB+eB+eB(dB+sB),其中,IDB为待处理财务票据图像的接收方的身份 标识,RB=sBP+rBP,sB为待处理财务票据图像的接收方自身随机选择的秘密 数,dB为接收方的部分私钥,rB为PKG系统为待处理财务票据图像的接收方 随机选择的秘密数;
发送<IDB,RB,XB,TB,eB,zB>给发送方,并将kAB=H3(xB,XA)作为第一会话秘 钥;发送方接收到<IDB,RB,XB,TB,eB,zB>后,检测时戳TB与当前时间信息之间的 时差,若时差在预设的阈值范围内,则计算哈希值hB=H1(IDB,RB), Y′B=zBP-eB(RB+hBPpub),并验证eB=H2(TB,XB,IDB,RB,Y′B)是否成立,若成立,则 通过对待处理财务票据图像的接收方的认证,然后生成第二会话秘钥 kAB=H3(xA,XB)。
发送方根据第二会话秘钥对待处理财务票据图像进行加密,生成密文;
接收方接收密文,采用第一会话秘钥对密文进行解密,得到待处理财务 票据图像,其中,kAB=H3(xA,XB)=H3(xB,XA)。
步骤103、提取待识别财务票据图像中的目标财务信息。
需要说明的是,得到待识别财务票据图像后,需要从待识别财务票据图 像中提取有价值的财务信息,即目标财务信息,可以利用现有的字符特征提 取方法从待识别财务票据图像中提取字符,得到目标财务信息。
在一个实施例中,从待识别财务票据图像中提取目标财务信息的方法可 以是:
定位待识别财务票据图像的目标区域;目标区域可以是待识别财务票据 图像中有价值信息的区域,比如票据中的单价、金额、购买方、销售方等区 域。
采用轮廓提取方法从目标区域提取包含字符的字符图像;
对每个字符图像进行模板匹配,识别出目标区域中的字符,得到目标财 务信息。
需要说明的是,对图像中的字符进行识别的字符识别方法可以采用现有 技术中的任意一种,可不进行具体限定,本领域技术人员可以采取任意一种 从包含字符的字符图像中识别出字符的方法。具体地一种方式可以是将提取 的每一个字符图像与多个模板图像进行匹配,根据相似度计算公式计算匹配 相似度,并选取相似度最高的模板图像所代表的字符作为识别结果,其中, 相似度计算公式为:
Figure BDA0002473075930000131
其中,m为模板标号,S(i,j)为字符图像在坐标(i,j)处的像素值,Tm(i,j)为 第m个模板图像在坐标(i,j)处的像素值。
各个模板图像可以预先放置在模板数据库中,当需要进行字符识别时, 可以将提取的字符图像与各个模板图像进行匹配,例如:对于字符“6”图像, 可以将字符“6”图像分别与模板图像“0”、“1”…“9”进行匹配。若最终匹配 的结果为字符“4”图像与模板图像“4”相似度最高,即可完成对字符“4” 图像的识别。
在一个实施例中,目标财务信息可以通过敏感字检测来锁定,敏感字可 以是:金额、日期、单位等。对于增值税发票之类的财务票据而言,其各类 信息栏的位置一般是固定的,比如发票号码在发票的右上角位置,购买方信 息在发票的左上角位置,销售方信息在发票的左下角位置,金额在发票的右 下角位置等。
在一个实施例中,对每个字符图像进行模板匹配,识别出目标区域中的 字符,得到目标财务信息,具体可以是:
将所有字符图像按x轴坐标大小排序,从x轴坐标最小的字符图像开始, 依次进行模板匹配;
当前一个字符图像匹配结束时,后一个字符图像根据与前一个字符图像 的间隔关系,向x轴的正向偏移预置个像素单位的位置开始匹配,预置个像 素单位为模板图像的宽度;
当匹配到的字符图像为*时,计算*前面识别的字符图像的数量,若数量 达到第一目标数量,则根据*的位置,依次对*后面的第二目标数量个字符图 像进行模板匹配,识别出对应的字符,得到目标财务信息,若*前面识别的字 符图像的数量未达到第一目标数量,则以x轴坐标最小的字符图像为基准, 向x轴的负向偏移预置个像素单位的位置开始匹配,直至*前面识别到的字符 图像的数量达到第一目标数量。
需要说明的是,在此实施例中,x轴为以待识别财务票据图像建立的像素 坐标系对应的横坐标。将分割得到的所有字符图像按x轴坐标大小排序,从x 轴最小的字符图像开始依次进行模板图像匹配,当前一个字符图像匹配结束 时,下一个字符图像与前一个字符图像的间隔关系,向x轴的正向偏移n个 像素单位的位置开始匹配,n的大小取模板图像的宽度(其中,n的取值大小 可以根据实际需求来调整,比如有点票据的字符较大,则n的取值也应适当 变大,有的票据的字符较小,则n的取值也应适当变小),重复以上步骤,直 到匹配到的字符图像为“*”,计算“*”前面识别到的字符图像数量,如果没 有达到k个,则以识别到的第一个字符图像为基准,向x轴的负向偏移n个 像素单位的位置开始匹配,直至“*”前面识别到的字符图像数量达到k(可 取值k=8)个为止。根据“*”的位置,依次对其后面g(可取值g=4)个字符 图像进行模板图像匹配,并识别出对应的字符。
由于票据的打印机器存在机械误差,导致有些字符之间的间隔很小,甚 至是粘连在一起的,影响字符分割,无法使票据上的18个身份证数字全部独 立地分割出来,也无法判断分割后的第1个字符是否为身份证号码的第1个 数字。在一些车票或购物票上,为了保护个人隐私,通常采用“*”字符来隐 藏标识身份证号码、电话号码的局部中的字符信息,此实施例中,利用“*” 字符特征,有效解决字符分割不全以及字符排序的问题。
在一个实施例中,提取的待识别财务票据图像中的目标财务信息包括提 取目标日期信息。
需要说明的是,在此实施例中,采用漫水填充算法提取目标日期,再利 用目标日期外接矩形的长、宽特征关系,过滤掉不符合要求的干扰目标,将 过滤干扰目标后剩余的目标按x轴坐标从小到大排序,根据日期的排序规则, 依次识别年、月、日、时、分模块。在具体的实施过程中,可以遍历待识别 财务票据图像的目标日期区域,检测每个像素点的颜色,若检测到该点为白 色,则将其标记为种子点,否则,重复不进行种子点标记,直至遍历所有像 素点;采用自定义填充色替换种子点像素,并记下种子点坐标,检测种子点 坐标相邻的四连通领域或八连通邻域,记录各邻域内存在的所有白色像素点 为新的种子点。
步骤104、根据目标财务信息对待识别财务票据图像进行分类。
需要说明的是,在得到目标财务信息之后,结合预先划分的财务类别对 待识别财务票据图像进行分类,得到分类结果信息。
步骤105、根据目标财务信息和待识别财务票据的分类结果,生成财务审 批单据。
需要说明的是,不同类别的财务票据对应不同的财务审批单据,因此, 在得到待处理财务票据图像的目标财务信息和分类结果信息之后,可以生成 包含目标财务信息的对应类别的财务审批单据。
在一个实施例中,可以对多个报销金额信息进行累计,得到报销总金额 信息,根据报销总金额信息生成财务审批单据。
步骤106、在财务审批单据审批通过之后,将待处理财务票据图像和财务 审批单据存储在与分类结果对应的财务数据库中。
相比于现有技术,本申请实施例中提供的财务票据处理方法,具备以下 优点:
(1)将图像识别技术引入到财务管理中,以实现对财务信息自动录入, 替代了传统人工录入的方式,节省了人力成本,并有效提升了财务信息的录 入效率和精度,推进了财务管理的智能化发展。具体地,通过对待处理财务 票据图像进行图像处理、提取目标财务信息和财务票据分类,生成相应的财 务审批单据,并在财务审批单据审批通过之后将待处理财务票据图像和财务 审批单据存储在与分类结果对应的财务数据库中,实现了财务票据的自动审 核、录入与存储,避免了现有技术采用人工处理财务票据存在的缺陷,解决了现有的票据录入工作均由财务人员进行人工填报,存在处理效率低和准确 性低的技术问题;
(2)通过对待处理财务票据图像发送方的身份进行认证,从源头确保才 处理财务票据图像的合法性,进一步提升了财务管理的安全系数。
为了便于理解,请参阅图2,本申请中提供了一种财务票据处理装置的实 施例,包括:
接收模块,用于接收待处理财务票据图像;
预处理模块,用于对所述待处理财务票据图像进行预处理,得到待识别 财务票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理;
目标信息提取模块,用于提取所述待识别财务票据图像中的目标财务信 息;
分类模块,用于根据所述目标财务信息对所述待识别财务票据图像进行 分类;
审批单据生成模块,用于根据所述目标财务信息和所述待识别财务票据 的分类结果,生成与分类结果对应的财务审批单据;
存储模块,用于在所述财务审批单据审批通过之后,将所述待处理财务 票据图像和所述财务审批单据存储在与所述分类结果对应的财务数据库中。
作为进一步改进,所述预处理模块具体用于:
对待处理财务票据图像的合法性进行验证,若待处理财务票据图像合法, 则对待处理财务票据图像进行预处理,得到待识别财务票据图像。
作为进一步改进,所述预处理模块包括:
去干扰子模块,用于将所述待处理财务票据图像转化为HSI颜色模型图 像,将所述HIS颜色模型图像中的红色和蓝色去除;
灰度化子模块,用于将去除红色和蓝色的所述待处理财务票据图像转化 为灰度等级为0至255的灰度图像;
二值化子模块,用于对所述灰度图像进行二值化处理,将所述灰度图像 分割成前景和背景,得到待识别财务票据图像。
作为进一步改进,所述二值化子模块具体用于:
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景;
采用直方图均衡化方法改变分割后的所述灰度图像的对比度,以对所述 灰度图像进行图像增强;
采用高斯离散逼近函数
Figure BDA0002473075930000171
对增强后的所述灰度图像进 行平滑去噪,得到待识别财务票据图像,其中,σ为高斯离散逼近函数的标准 差,x为灰度图像中某像素的位置。
作为进一步改进,所述二值化子模块具体还用于:
对平滑去噪后的图像进行倾斜校正。
作为进一步改进,所述目标信息提取模块,包括:
区域定位子模块,用于定位所述待识别财务票据图像的目标区域;
字符图像提取子模块,用于采用轮廓提取方法从所述目标区域提取包含 字符的字符图像;
模板匹配子模块,用于对每个所述字符图像进行模板匹配,识别出所述 目标区域中的字符,得到目标财务信息。
作为进一步改进,所述模板匹配子模块具体用于:
将所有所述字符图像按x轴坐标大小排序,从x轴坐标最小的所述字符图 像开始,依次进行模板匹配;
当前一个字符图像匹配结束时,后一个字符图像根据与所述前一个字符 图像的间隔关系,向x轴的正向偏移预置个像素单位的位置开始匹配,所述 预置个像素单位为模板图像的宽度;
当匹配到的字符图像中的字符为*时,计算*前面识别的字符图像的数量;
若*前面识别的字符图像的数量未达到所述第一目标数量,则以所述x轴 坐标最小的所述字符图像为基准,向x轴的负向偏移所述预置个像素单位的 位置开始匹配,直至*前面识别到的字符图像的数量达到所述第一目标数量;
若数量达到第一目标数量,则根据*的位置,依次对*后面的第二目标数 量个字符图像进行模板匹配,识别出对应的字符,得到目标财务信息。
作为进一步改进,所述目标财务信息包括目标日期信息;
在提取目标日期信息时采用漫水填充算法提取目标日期。
可选地,所述对所述待处理财务票据图像的合法性进行验证,包括:
向所述待处理财务票据图像的发送方发起合法性验证会话;
接收所述发送方响应于所述合法性验证会话发送的验证信息,所述验证 信息为IDA,RA,XA,TA,eA,zA,其中,IDA为所述发送方的身份标识,TA为第一当 前时戳,eA为哈希值,eA=H2(TA,XA,IDA,RA,YA),zA为TA和XA的签名, zA=yA+eA(dA+sA),XA=xAP,YA=xAP,RA=sAP+rAP,rA为PKG系统为所述 发送方随机算则的秘密数,sA为所述发送方自身随机选择的秘密数,dA为所 述发送方的部分私钥,xA和xB是随机数,
Figure BDA0002473075930000181
Figure BDA0002473075930000182
为q阶的点群,P为 q阶循环加法群G的生成元;
检测TA与当前时间信息的时间差,若所述时间差在预置范围内,则计算hA和Y′A,hA=H1(IDA,RA),Y′A=zAP-eA(RA+hAPpub),并验证eA=H2(TA,XA,IDA,RA,Y′A) 是否成立,若成立,则通过验证,其中,Ppub为PKG系统的公钥。
作为进一步改进,还包括:
获取随机数xB和yB,计算YB和XB,其中,
Figure BDA0002473075930000183
YB=yBP,XB=xBP;
获取第二当前时戳TB,计算哈希值eB=H2(TB,XB,IDB,RB,YB)和对TB和XB的 签名zB=yB+eB+eB(dB+sB),其中,IDB为所述待处理财务票据图像的接收方的 身份标识,RB=sBP+rBP,sB为所述待处理财务票据图像的接收方自身随机选 择的秘密数,dB为接收方的部分私钥,rB为PKG系统为所述待处理财务票据 图像的接收方随机选择的秘密数;
发送IDB,RB,XB,TB,eB,zB给所述发送方,并将kAB=H3(xB,XA)作为第一会话 秘钥,使得所述发送方对所述待处理财务票据图像的接收方进行认证并生成 第二会话秘钥,根据所述第二会话秘钥对所述待处理财务票据图像进行加密, 生成密文;
相应地,所述接收模块用于:
接收所述密文,采用所述第一会话秘钥对所述密文进行解密,得到所述 待处理财务票据图像。
为了便于理解,请参阅图3,本申请还提供了一种财务票据处理设备的实 施例,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行前述的财务票据处理方 法实施例中的任一种财务票据处理方法。
本申请还提供了计算机可读存储介质的实施例,所述计算机可读存储介 质用于存储程序代码,所述程序代码用于执行前述的财务票据处理方法实施 例中的任一种财务票据处理方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描 述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应 过程,在此不再赘述。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四” 等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后 次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本 申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此 外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包 含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必 限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这 些过程、方法、产品或设备固有的其它步骤或单元。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和 方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示 意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可 以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个 系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间 的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合 或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作 为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方, 或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或 者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元 中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一 个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功 能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售 或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本 申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的 全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个 存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机, 服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步 骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称: Read-Only Memory,英文缩写:ROM)、随机存取存储器(英文全称: Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储 程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制; 尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应 当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其 中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案 的本质脱离本申请各实施例技术方案的精神和范围。

Claims (22)

1.一种财务票据处理方法,其特征在于,包括:
接收待处理财务票据图像;
对所述待处理财务票据图像进行预处理,得到待识别财务票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理;
提取所述待识别财务票据图像中的目标财务信息;
根据所述目标财务信息对所述待识别财务票据图像进行分类;
根据所述目标财务信息和所述待识别财务票据的分类结果,生成与所述分类结果对应的财务审批单据;
在所述财务审批单据审批通过之后,将所述待处理财务票据图像和所述财务审批单据存储在与所述分类结果对应的财务数据库中。
2.根据权利要求1所述的财务票据处理方法,其特征在于,所述对所述待处理财务票据图像进行预处理,包括:
对所述待处理财务票据图像的合法性进行验证,若所述待处理财务票据图像合法,则对所述待处理财务票据图像进行预处理,得到待识别财务票据图像。
3.根据权利要求1所述的财务票据处理方法,其特征在于,所述对所述待处理财务票据图像进行预处理,得到待识别财务票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理,包括:
将所述待处理财务票据图像转化为HSI颜色模型图像,将所述HIS颜色模型图像中的红色和蓝色去除;
将去除红色和蓝色的所述待处理财务票据图像转化为灰度等级为0至255的灰度图像;
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景,得到待识别财务票据图像。
4.根据权利要求3所述的财务票据处理方法,其特征在于,所述对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景,得到待识别财务票据图像,包括:
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景;
采用直方图均衡化方法改变分割后的所述灰度图像的对比度,以对所述灰度图像进行图像增强;
采用高斯离散逼近函数
Figure FDA0002473075920000021
对增强后的所述灰度图像进行平滑去噪,得到待识别财务票据图像,其中,σ为高斯离散逼近函数的标准差,x为灰度图像中某像素的位置。
5.根据权利要求4所述的财务票据处理方法,其特征在于,还包括:
对平滑去噪后的图像进行倾斜校正。
6.根据权利要求1所述的财务票据处理方法,其特征在于,所述提取所述待识别财务票据图像中的目标财务信息,包括:
定位所述待识别财务票据图像的目标区域;
采用轮廓提取方法从所述目标区域提取包含有字符的字符图像;
对每个所述字符图像进行模板匹配,识别出所述目标区域中的字符,得到目标财务信息。
7.根据权利要求6所述的财务票据处理方法,其特征在于,所述对每个所述字符图像进行模板匹配,识别出所述目标区域中的字符,得到目标财务信息,包括:
将所有所述字符图像按x轴坐标大小排序,从x轴坐标最小的所述字符图像开始,依次进行模板匹配;
当前一个字符图像匹配结束时,后一个字符图像根据与所述前一个字符图像的间隔关系,向x轴的正向偏移预置个像素单位的位置开始匹配,所述预置个像素单位为模板图像的宽度;
当匹配到的字符图像中的字符为*时,计算*前面识别的字符图像的数量;
若*前面识别的字符图像的数量未达到所述第一目标数量,则以所述x轴坐标最小的所述字符图像为基准,向x轴的负向偏移所述预置个像素单位的位置开始匹配,直至*前面识别到的字符图像的数量达到所述第一目标数量;
若数量达到第一目标数量,则根据*的位置,依次对*后面的第二目标数量个字符图像进行模板匹配,识别出对应的字符,得到目标财务信息。
8.根据权利要求6所述的财务票据处理方法,其特征在于,所述目标财务信息包括目标日期信息;
在提取目标日期信息时采用漫水填充算法提取目标日期。
9.根据权利要求2所述的财务票据处理方法,其特征在于,所述对所述待处理财务票据图像的合法性进行验证,包括:
向所述待处理财务票据图像的发送方发起合法性验证会话;
接收所述发送方响应于所述合法性验证会话发送的验证信息,所述验证信息为<IDA,RA,XA,TA,eA,zA>,其中,IDA为所述发送方的身份标识,TA为第一当前时戳,eA为哈希值,eA=H2(TA,XA,IDA,RA,YA),zA为TA和XA的签名,zA=yA+eA(dA+sA),XA=xAP,YA=xAP,RA=sAP+rAP,rA为PKG系统为所述发送方随机算则的秘密数,sA为所述发送方自身随机选择的秘密数,dA为所述发送方的部分私钥,xA和xB是随机数,
Figure FDA0002473075920000033
Figure FDA0002473075920000032
为q阶的点群,P为q阶循环加法群G的生成元;
检测TA与当前时间信息的时间差,若所述时间差在预置范围内,则计算hA和Y′A,hA=H1(IDA,RA),Y′A=zAP-eA(RA+hAPpub),并验证eA=H2(TA,XA,IDA,RA,Y′A)是否成立,若成立,则通过验证,其中,Ppub为PKG系统的公钥。
10.根据权利要求9所述的财务票据处理方法,其特征在于,还包括:
获取随机数xB和yB,计算YB和XB,其中,
Figure FDA0002473075920000031
YB=yBP,XB=xBP;
获取第二当前时戳TB,计算哈希值eB=H2(TB,XB,IDB,RB,YB)和对TB和XB的签名zB=yB+eB+eB(dB+sB),其中,IDB为所述待处理财务票据图像的接收方的身份标识,RB=sBP+rBP,sB为所述待处理财务票据图像的接收方自身随机选择的秘密数,dB为接收方的部分私钥,rB为PKG系统为所述待处理财务票据图像的接收方随机选择的秘密数;
发送<IDB,RB,XB,TB,eB,zB>给所述发送方,并将kAB=H3(xB,XA)作为第一会话秘钥,使得所述发送方对所述待处理财务票据图像的接收方进行认证并生成第二会话秘钥,根据所述第二会话秘钥对所述待处理财务票据图像进行加密,生成密文;
相应地,所述接收待处理财务票据图像,包括:
接收所述密文,采用所述第一会话秘钥对所述密文进行解密,得到所述待处理财务票据图像。
11.一种财务票据处理装置,其特征在于,包括:
接收模块,用于接收待处理财务票据图像;
预处理模块,用于对所述待处理财务票据图像进行预处理,得到待识别财务票据图像,所述预处理包括去干扰处理、灰度化处理和二值化处理;
目标信息提取模块,用于提取所述待识别财务票据图像中的目标财务信息;
分类模块,用于根据所述目标财务信息对所述待识别财务票据图像进行分类;
审批单据生成模块,用于根据所述目标财务信息和所述待识别财务票据的分类结果,生成与所述分类结果对应的财务审批单据;
存储模块,用于在所述财务审批单据审批通过之后,将所述待处理财务票据图像和所述财务审批单据存储在与所述分类结果对应的财务数据库中。
12.根据权利要求11所述的财务票据处理装置,其特征在于,所述预处理模块具体用于:
对所述待处理财务票据图像的合法性进行验证,若所述待处理财务票据图像合法,则对所述待处理财务票据图像进行预处理,得到待识别财务票据图像。
13.根据权利要求11所述的财务票据处理装置,其特征在于,所述预处理模块包括:
去干扰子模块,用于将所述待处理财务票据图像转化为HSI颜色模型图像,将所述HIS颜色模型图像中的红色和蓝色去除;
灰度化子模块,用于将去除红色和蓝色的所述待处理财务票据图像转化为灰度等级为0至255的灰度图像;
二值化子模块,用于对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景,得到待识别财务票据图像。
14.根据权利要求13所述的财务票据处理装置,其特征在于,所述二值化子模块具体用于:
对所述灰度图像进行二值化处理,将所述灰度图像分割成前景和背景;
采用直方图均衡化方法改变分割后的所述灰度图像的对比度,以对所述灰度图像进行图像增强;
采用高斯离散逼近函数
Figure FDA0002473075920000041
对增强后的所述灰度图像进行平滑去噪,得到待识别财务票据图像,其中,σ为高斯离散逼近函数的标准差,x为灰度图像中某像素的位置。
15.根据权利要求14所述的财务票据处理装置,其特征在于,所述二值化子模块具体还用于:
对平滑去噪后的图像进行倾斜校正。
16.根据权利要求11所述的财务票据处理装置,其特征在于,所述目标信息提取模块,包括:
区域定位子模块,用于定位所述待识别财务票据图像的目标区域;
字符图像提取子模块,用于采用轮廓提取方法从所述目标区域提取包含有字符的字符图像;
模板匹配子模块,用于对每个所述字符图像进行模板匹配,识别出所述目标区域中的字符,得到目标财务信息。
17.根据权利要求16所述的财务票据处理装置,其特征在于,所述模板匹配子模块具体用于:
将所有所述字符图像按x轴坐标大小排序,从x轴坐标最小的所述字符图像开始,依次进行模板匹配;
当前一个字符图像匹配结束时,后一个字符图像根据与所述前一个字符图像的间隔关系,向x轴的正向偏移预置个像素单位的位置开始匹配,所述预置个像素单位为模板图像的宽度;
当匹配到的字符图像中的字符为*时,计算*前面识别的字符图像的数量;
若*前面识别的字符图像的数量未达到所述第一目标数量,则以所述x轴坐标最小的所述字符图像为基准,向x轴的负向偏移所述预置个像素单位的位置开始匹配,直至*前面识别到的字符图像的数量达到所述第一目标数量;
若数量达到第一目标数量,则根据*的位置,依次对*后面的第二目标数量个字符图像进行模板匹配,识别出对应的字符,得到目标财务信息。
18.根据权利要求16所述的财务票据处理装置,其特征在于,所述目标财务信息包括目标日期信息;
在提取目标日期信息时采用漫水填充算法提取目标日期。
19.根据权利要求12所述的财务票据处理装置,其特征在于,所述对所述待处理财务票据图像的合法性进行验证,包括:
向所述待处理财务票据图像的发送方发起合法性验证会话;
接收所述发送方响应于所述合法性验证会话发送的验证信息,所述验证信息为<IDA,RA,XA,TA,eA,zA>,其中,IDA为所述发送方的身份标识,TA为第一当前时戳,eA为哈希值,eA=H2(TA,XA,IDA,RA,YA),zA为TA和XA的签名,zA=yA+eA(dA+sA),XA=xAP,YA=xAP,RA=sAP+rAP,rA为PKG系统为所述发送方随机算则的秘密数,sA为所述发送方自身随机选择的秘密数,dA为所述发送方的部分私钥,xA和xB是随机数,
Figure FDA0002473075920000061
Figure FDA0002473075920000062
为q阶的点群,P为q阶循环加法群G的生成元;
检测TA与当前时间信息的时间差,若所述时间差在预置范围内,则计算hA和Y′A,hA=H1(IDA,RA),Y′A=zAP-eA(RA+hAPpub),并验证eA=H2(TA,XA,IDA,RA,Y′A)是否成立,若成立,则通过验证,其中,Ppub为PKG系统的公钥。
20.根据权利要求19所述的财务票据处理装置,其特征在于,还包括:
获取随机数xB和yB,计算YB和XB,其中,
Figure FDA0002473075920000063
YB=yBP,XB=xBP;
获取第二当前时戳TB,计算哈希值eB=H2(TB,XB,IDB,RB,YB)和对TB和XB的签名zB=yB+eB+eB(dB+sB),其中,IDB为所述待处理财务票据图像的接收方的身份标识,RB=sBP+rBP,sB为所述待处理财务票据图像的接收方自身随机选择的秘密数,dB为接收方的部分私钥,rB为PKG系统为所述待处理财务票据图像的接收方随机选择的秘密数;
发送<IDB,RB,XB,TB,eB,zB>给所述发送方,并将kAB=H3(xB,XA)作为第一会话秘钥,使得所述发送方对所述待处理财务票据图像的接收方进行认证并生成第二会话秘钥,根据所述第二会话秘钥对所述待处理财务票据图像进行加密,生成密文;
相应地,所述接收模块用于:
接收所述密文,采用所述第一会话秘钥对所述密文进行解密,得到所述待处理财务票据图像。
21.一种财务票据处理设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-10任一项所述的财务票据处理方法。
22.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-10任一项所述的财务票据处理方法。
CN202010354764.6A 2020-04-29 2020-04-29 一种财务票据处理方法、装置、设备和可读存储介质 Active CN111582115B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010354764.6A CN111582115B (zh) 2020-04-29 2020-04-29 一种财务票据处理方法、装置、设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010354764.6A CN111582115B (zh) 2020-04-29 2020-04-29 一种财务票据处理方法、装置、设备和可读存储介质

Publications (2)

Publication Number Publication Date
CN111582115A true CN111582115A (zh) 2020-08-25
CN111582115B CN111582115B (zh) 2024-02-02

Family

ID=72123475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010354764.6A Active CN111582115B (zh) 2020-04-29 2020-04-29 一种财务票据处理方法、装置、设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN111582115B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112884662A (zh) * 2021-01-05 2021-06-01 杭州国测测绘技术有限公司 基于飞行器航拍图像的三维数字地图图像处理方法
CN116563048A (zh) * 2023-07-05 2023-08-08 江西科技学院 一种财务报销方法、系统及计算机

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982343A (zh) * 2012-11-12 2013-03-20 信阳师范学院 手写数字识别的增量式模糊支持向量机方法
CN104751194A (zh) * 2015-04-27 2015-07-01 陈包容 一种财务费用报销的处理方法及装置
CN107194400A (zh) * 2017-05-31 2017-09-22 北京天宇星空科技有限公司 一种财务报销全票据图片识别处理方法
CN107633239A (zh) * 2017-10-18 2018-01-26 江苏鸿信系统集成有限公司 基于深度学习和ocr的票据分类及票据字段提取方法
CN109584978A (zh) * 2018-10-26 2019-04-05 西安邮电大学 基于签名聚合医疗健康监控网络模型信息处理方法及系统
CN110647824A (zh) * 2019-09-03 2020-01-03 四川大学 基于计算机视觉技术的增值税发票版面提取方法
CN111062262A (zh) * 2019-11-26 2020-04-24 爱信诺征信有限公司 发票识别方法以及发票识别装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982343A (zh) * 2012-11-12 2013-03-20 信阳师范学院 手写数字识别的增量式模糊支持向量机方法
CN104751194A (zh) * 2015-04-27 2015-07-01 陈包容 一种财务费用报销的处理方法及装置
CN107194400A (zh) * 2017-05-31 2017-09-22 北京天宇星空科技有限公司 一种财务报销全票据图片识别处理方法
CN107633239A (zh) * 2017-10-18 2018-01-26 江苏鸿信系统集成有限公司 基于深度学习和ocr的票据分类及票据字段提取方法
CN109584978A (zh) * 2018-10-26 2019-04-05 西安邮电大学 基于签名聚合医疗健康监控网络模型信息处理方法及系统
CN110647824A (zh) * 2019-09-03 2020-01-03 四川大学 基于计算机视觉技术的增值税发票版面提取方法
CN111062262A (zh) * 2019-11-26 2020-04-24 爱信诺征信有限公司 发票识别方法以及发票识别装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘刚;黄襄念;符清芳;饶伟;: "购物小票图像识别预处理算法的研究" *
单家凌: "一种无证书签名方案在数据验证中的应用研究" *
薛圣利等: "基于OpenCV的火车票识别算法" *
邵健等: "基于身份的强指定验证者签名方案" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112884662A (zh) * 2021-01-05 2021-06-01 杭州国测测绘技术有限公司 基于飞行器航拍图像的三维数字地图图像处理方法
CN116563048A (zh) * 2023-07-05 2023-08-08 江西科技学院 一种财务报销方法、系统及计算机
CN116563048B (zh) * 2023-07-05 2024-05-03 江西科技学院 一种财务报销方法、系统及计算机

Also Published As

Publication number Publication date
CN111582115B (zh) 2024-02-02

Similar Documents

Publication Publication Date Title
CN110598699B (zh) 一种基于多光谱图像的防伪票据鉴伪系统和方法
CN108717545B (zh) 一种基于手机拍照的票据识别方法及系统
CN110399851B (zh) 一种图像处理装置、方法、设备及可读存储介质
US8879846B2 (en) Systems, methods and computer program products for processing financial documents
US10248954B2 (en) Method and system for verifying user identity using card features
CN101894260B (zh) 基于匹配特征点随机生成特征线的伪造印章识别方法
EP2897082B1 (en) Methods and systems for improved license plate signature matching
US9230383B2 (en) Document image compression method and its application in document authentication
CN106709866B (zh) 证件照去除网格水印的方法及装置、人脸验证方法及装置
CN111582115B (zh) 一种财务票据处理方法、装置、设备和可读存储介质
CN108197624A (zh) 证书图像校正识别方法及装置、计算机存储介质
CN110378351B (zh) 印章鉴别方法及装置
CN104899965A (zh) 一种基于清分机的多国纸币序列号识别方法
CN111462388A (zh) 一种票据检验方法、装置、终端设备及存储介质
Kim et al. Color laser printer identification using photographed halftone images
Suresh et al. Indian currency recognition and verification using image processing
Ponishjino et al. Bogus currency authorization using HSV techniques
CN112215225B (zh) 一种基于计算机视觉技术的kyc证件核验方法
Chhabra et al. Detecting fraudulent bank checks
CN117058805A (zh) 纸币图像处理方法及系统
CN108537945B (zh) 票据水印检测方法、系统及自助设备
Hu et al. Document recapture detection based on a unified distortion model of halftone cells
CN113077355B (zh) 保险理赔方法、装置、电子设备及存储介质
US11900755B1 (en) System, computing device, and method for document detection and deposit processing
Su et al. Automatic seal imprint verification systems using edge difference

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant