CN113569863A - 一种单据稽查的方法、系统、电子设备及存储介质 - Google Patents
一种单据稽查的方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113569863A CN113569863A CN202111125812.5A CN202111125812A CN113569863A CN 113569863 A CN113569863 A CN 113569863A CN 202111125812 A CN202111125812 A CN 202111125812A CN 113569863 A CN113569863 A CN 113569863A
- Authority
- CN
- China
- Prior art keywords
- inspection
- area
- template
- document
- inspected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明公开了一种单据稽查的方法、系统、电子设备及存储介质,其方法通过获取待稽查单据的待稽查图像后,确定待稽查图像中的目标抬头区域,对目标抬头区域进行文字识别,根据文字识别结果确定待稽查单据的单据类型,并通过单据类型匹配到相应的单据模板图像,根据单据模板图像的所述模板稽查区域的坐标位置确定待稽查图像中的待稽查区域,根据稽查内容类型,提取待稽查区域与模板稽查区域的稽查特征,从而将待稽查区域与模板稽查区域的稽查特征进行对比,得到对比结果,以确定稽查验证是否通过。从而实现了单据的自动稽查,相比于人工稽查,减小了工作量,提高了工作效率和准确率。
Description
技术领域
本发明涉及数据识别技术领域,尤其涉及一种单据稽查的方法、系统、电子设备及存储介质。
背景技术
在现场的电力营销数据稽查中,大部分单据需要进行稽查是否符合规范,其中,主要核对的问题是其单据是否有盖章或签字。
在传统技术中,是通过稽查人员人工查阅单据,通过人工挑选出不符合规范的单据。而这种方式不仅工作量大,而且工作效率低下,准确率较低。
发明内容
本发明提供了一种单据稽查的方法、系统、电子设备及存储介质,用于解决上述人工稽查工作量大,而且工作效率低下,准确率较低的技术问题。
有鉴于此,本发明第一方面提供了一种单据稽查的方法,包括以下步骤:
获取待稽查单据的待稽查图像;
根据预设的参考定位点确定所述待稽查图像中的目标抬头区域的相对坐标位置,从而得到所述目标抬头区域,对所述目标抬头区域进行文字识别,从而得到文字识别结果;
根据所述文字识别结果确定所述待稽查单据的单据类型,根据所述单据类型在参考单据库中匹配到相应的单据模板图像;
在所述单据模板图像中识别出模板稽查区域及其坐标位置、稽查内容类型,所述稽查内容类型包括盖章类型和签字类型;
根据所述单据模板图像的所述模板稽查区域的坐标位置确定所述待稽查图像中的待稽查区域的相对坐标位置,从而确定所述待稽查图像中的待稽查区域;
根据所述稽查内容类型,提取所述待稽查区域与所述模板稽查区域的稽查特征,将所述待稽查区域与所述模板稽查区域之间的稽查特征进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过。
可选地,所述获取待稽查单据的待稽查图像的步骤之后包括:
对所述待稽查图像进行预处理,所述预处理的方式包括锐化和调整大小,其中,所述调整大小为调整所述待稽查图像的尺寸,以使得所述待稽查图像的尺寸与所述参考单据库中的单据模板图像的尺寸相一致。
可选地,所述根据所述文字识别结果确定所述待稽查单据的单据类型,根据所述单据类型在参考单据库中匹配到相应的单据模板图像的步骤之前包括:
获取历史稽查单据,将所述历史稽查单据导入所述参考单据库中进行存储;
对所述历史稽查单据中的稽查信息进行提取,得到所述历史稽查单据中的单据模板图像,所述稽查信息包括抬头、盖章和签字;
识别所述单据模板图像中的模板稽查区域和模板抬头区域,并确实所述模板稽查区域和模板抬头区域分别对应的参考坐标位置,并添加所述模板稽查区域和所述模板抬头区域分别对应的区域框;
判断所述模板稽查区域内是否有盖章或签字,根据判断结果识别所述模板稽查区域的稽查内容类型,若判断所述模板稽查区域内有盖章,则所述稽查内容类型为盖章类型,并提取相应的盖章形状轮廓,若判断所述模板稽查区域内有签字,则所述稽查内容类型为签字类型,并提取相应的签字文本。
可选地,所述识别所述单据模板图像中的模板稽查区域和模板抬头区域,并确实所述模板稽查区域和模板抬头区域分别对应的参考坐标位置,并添加所述模板稽查区域和所述模板抬头区域分别对应的区域框的步骤具体包括:对所述单据模板图像中的文本信息进行OCR识别,从而识别出所述单据模板图像中的关键文本,将所述关键文本与预设的参考文本进行比对,所述预设的参考文本包括抬头参考文本和稽查参考文本,其中,所述稽查参考文本包括签字和盖章;
若所述关键文本与所述抬头参考文本比对一致,则确定相应的所述关键文本在所述单据模板图像中的参考坐标位置为所述模板抬头区域,若所述关键文本与所述稽查参考文本比对一致,则确定相应的所述关键文本在所述单据模板图像中的参考坐标位置为所述模板稽查区域;
在所述模板稽查区域和所述模板抬头区域在所述单据模板图像中的参考坐标位置上添加对应的区域框。
可选地,所述判断所述模板稽查区域内是否有盖章或签字,根据判断结果识别所述模板稽查区域的稽查内容类型,若判断所述模板稽查区域内有盖章,则所述稽查内容类型为盖章类型,并提取相应的盖章形状轮廓,若判断所述模板稽查区域内有签字,则所述稽查内容类型为签字类型,并提取相应的签字文本的步骤具体包括:
遍历所述模板稽查区域的所有像素点以及所有像素点的像素值,所述像素值包括RGB颜色数值/和灰度值;
当识别到像素点的像素值满足预设的盖章像素阈值时,则判断所述模板稽查区域内有盖章,所述稽查内容类型为盖章类型,并获取相应的像素点的参考坐标位置,通过轮廓识提取算法提取相应的像素点的轮廓,以作为盖章形状轮廓;
当识别到像素点的像素值满足预设的签字像素阈值时,则判断所述模板稽查区域内有签字,所述稽查内容类型为签字类型,并获取相应的像素点的参考坐标位置,对相应的像素点进行解析,以得到分割后的签名文本中的每个单字符数据,将各个单字符数据转成对应的静态图像,以识别得到签名文字的各个单字符的对应文字,将每个对应文字进行组合得到完整的签名文本。
可选地,所述根据所述稽查内容类型,提取所述待稽查区域与所述模板稽查区域的稽查特征,将所述待稽查区域与所述模板稽查区域之间的稽查特征进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过的步骤具体包括:
若所述稽查内容类型为盖章类型,则提取所述待稽查区域中的盖章形状轮廓,将所述待稽查区域中的盖章形状轮廓与所述模板稽查区域中的盖章形状轮廓进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过;
若所述稽查内容类型为签字类型,则提取所述待稽查区域中的签字文本,将所述待稽查区域中的签字文本与所述模板稽查区域中的签字文本进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过。
可选地,所述根据所述稽查内容类型,提取所述待稽查区域与所述模板稽查区域的稽查特征,将所述待稽查区域与所述模板稽查区域之间的稽查特征进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过的步骤之后包括:
若稽查验证不通过,则输出相应的待稽查单据及其单据信息和稽查结果,所述单据信息包括所述待稽查单据的单据编号,所述稽查结果包括稽查内容及其比对结果。
第二方面,本发明还提供了一种单据稽查的系统,包括:
图像获取模块,用于获取待稽查单据的待稽查图像;
文字识别模块,用于根据预设的参考定位点确定所述待稽查图像中的目标抬头区域的相对坐标位置,从而得到所述目标抬头区域,对所述目标抬头区域进行文字识别,从而得到文字识别结果;
单据匹配模块,用于根据所述文字识别结果确定所述待稽查单据的单据类型,根据所述单据类型在参考单据库中匹配到相应的单据模板图像;
稽查区域识别模块,在所述单据模板图像中识别出模板稽查区域及其坐标位置、稽查内容类型,所述稽查内容类型包括盖章类型和签字类型;
稽查位置确定模块,用于根据所述单据模板图像的所述模板稽查区域的坐标位置确定所述待稽查图像中的待稽查区域的相对坐标位置,从而确定所述待稽查图像中的待稽查区域;
稽查比对模块,用于根据所述稽查内容类型,提取所述待稽查区域与所述模板稽查区域的稽查特征,将所述待稽查区域与所述模板稽查区域之间的稽查特征进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过。
第三方面,本发明还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述的单据稽查的方法。
第四方面,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述的单据稽查的方法。
从以上技术方案可以看出,本发明具有以下优点:
本发明通过获取待稽查单据的待稽查图像后,确定待稽查图像中的目标抬头区域,对目标抬头区域进行文字识别,根据文字识别结果确定待稽查单据的单据类型,并通过单据类型匹配到相应的单据模板图像,根据单据模板图像的所述模板稽查区域的坐标位置确定待稽查图像中的待稽查区域,根据稽查内容类型,提取待稽查区域与模板稽查区域的稽查特征,从而将待稽查区域与模板稽查区域的稽查特征进行对比,得到对比结果,以确定稽查验证是否通过。从而实现了单据的自动稽查,相比于人工稽查,减小了工作量,提高了工作效率和准确率。
附图说明
图1为本发明实施例提供的一种单据稽查的方法的流程图;
图2为本发明实施例提供的一种单据稽查的系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在传统技术中,是通过稽查人员人工查阅单据,通过人工挑选出不符合规范的单据。而这种方式不仅工作量大,而且工作效率低下,准确率较低。
为此,本发明提供了一种单据稽查的方法,请参阅图1,本方法包括以下步骤:
S1、获取待稽查单据的待稽查图像;
在本实施例中,获取待稽查单据的待稽查图像的方式可以为图像拍摄。
S2、根据预设的参考定位点确定所述待稽查图像中的目标抬头区域的相对坐标位置,从而得到所述目标抬头区域,对所述目标抬头区域进行文字识别,从而得到文字识别结果;
需要说明的是,在待稽查图像中设定统一的参考定位点,而待稽查图像的目标抬头区域相对该参考定位点的相对坐标距离是相对固定的,因此,可以根据预设的参考定位点确定所述待稽查图像中的目标抬头区域的相对坐标位置,而该相对坐标位置构成目标抬头区域。
S3、根据所述文字识别结果确定所述待稽查单据的单据类型,根据所述单据类型在参考单据库中匹配到相应的单据模板图像;
需要说明的是,每个单据类型的抬头是不同的,如电力维护类型的单据,其抬头为电力维护单,因此,可以通过抬头的文字信息确定相应的单据类型,并通过单据类型在本地存储的参考单据库中匹配到相应的单据模板图像,其中,参考单据库为预先建立的,其存储有各个单据类型及其对应的单据模板图像。
S4、在所述单据模板图像中识别出模板稽查区域及其坐标位置、稽查内容类型,所述稽查内容类型包括盖章类型和签字类型;
S5、根据所述单据模板图像的所述模板稽查区域的坐标位置确定所述待稽查图像中的待稽查区域的相对坐标位置,从而确定所述待稽查图像中的待稽查区域;
需要说明的是,由于单据模板图像为待稽查图像对应的模板图像,其单据模板图像的所述模板稽查区域的坐标位置是具有参考性的,也即单据模板图像的所述模板稽查区域的坐标位置和待稽查图像中的待稽查区域的坐标位置是相对一致的,从而可以确定所述待稽查图像中的待稽查区域的相对坐标位置,以得到待稽查图像中的待稽查区域。
S6、根据所述稽查内容类型,提取所述待稽查区域与所述模板稽查区域的稽查特征,将所述待稽查区域与所述模板稽查区域之间的稽查特征进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过。
需要说明的是,稽查内容类型包括盖章类型和签字类型,在一个具体实施例中,当稽查内容类型为盖章,则以模板稽查区域的盖章作为比对对象,对待稽查区域的盖章进行比对,当稽查内容类型为签字,则以模板稽查区域的签字作为比对对象,对待稽查区域的签字进行比对。
在本实施例中,本发明提供的单据稽查的方法,通过获取待稽查单据的待稽查图像后,确定待稽查图像中的目标抬头区域,对目标抬头区域进行文字识别,根据文字识别结果确定待稽查单据的单据类型,并通过单据类型匹配到相应的单据模板图像,根据单据模板图像的所述模板稽查区域的坐标位置确定待稽查图像中的待稽查区域,根据稽查内容类型,提取待稽查区域与模板稽查区域的稽查特征,从而将待稽查区域与模板稽查区域的稽查特征进行对比,得到对比结果,以确定稽查验证是否通过。从而实现了单据的自动稽查,相比于人工稽查,减小了工作量,提高了工作效率和准确率。
以下本发明提供的一种单据稽查的方法的实施例的具体描述。
具体来说,本发明提供的一种单据稽查的方法,包括以下步骤:
S100、获取待稽查单据的待稽查图像;
在本实施例中,获取待稽查单据的待稽查图像的方式可以为图像拍摄。
S200、对所述待稽查图像进行预处理,所述预处理的方式包括锐化和调整大小,其中,所述调整大小为调整所述待稽查图像的尺寸,以使得所述待稽查图像的尺寸与所述参考单据库中的单据模板图像的尺寸相一致。
可以理解的是,调整所述待稽查图像的尺寸,以使得所述待稽查图像的尺寸与所述参考单据库中的单据模板图像的尺寸相一致,可以便于匹配定位点和坐标位置。
S300、根据预设的参考定位点确定所述待稽查图像中的目标抬头区域的相对坐标位置,从而得到所述目标抬头区域,对所述目标抬头区域进行文字识别,从而得到文字识别结果;
需要说明的是,在待稽查图像中设定统一的参考定位点,而待稽查图像的目标抬头区域相对该参考定位点的相对坐标距离是相对固定的,因此,可以根据预设的参考定位点确定所述待稽查图像中的目标抬头区域的相对坐标位置,而该相对坐标位置构成目标抬头区域。
S400、根据所述文字识别结果确定所述待稽查单据的单据类型,根据所述单据类型在参考单据库中匹配到相应的单据模板图像;
需要说明的是,每个单据类型的抬头是不同的,如电力维护类型的单据,其抬头为电力维护单,因此,可以通过抬头的文字信息确定相应的单据类型,并通过单据类型在本地存储的参考单据库中匹配到相应的单据模板图像,其中,参考单据库为预先建立的,其存储有各个单据类型及其对应的单据模板图像。
在本实施例中,步骤S400之前包括:
S401、获取历史稽查单据,将所述历史稽查单据导入所述参考单据库中进行存储;
其中,历史稽查单据上记载有标准的盖章或签字,历史稽查单据的格式可以是图像或文档,若是文档,则先将其转换为图像格式。
S402、对所述历史稽查单据中的稽查信息进行提取,得到所述历史稽查单据中的单据模板图像,所述稽查信息包括抬头、盖章和签字;
S403、识别所述单据模板图像中的模板稽查区域和模板抬头区域,并确实所述模板稽查区域和模板抬头区域分别对应的参考坐标位置,并添加所述模板稽查区域和所述模板抬头区域分别对应的区域框;
在本实施例中,步骤S403具体包括:
S4031、对所述单据模板图像中的文本信息进行OCR识别,从而识别出所述单据模板图像中的关键文本,将所述关键文本与预设的参考文本进行比对,所述预设的参考文本包括抬头参考文本和稽查参考文本,其中,所述稽查参考文本包括签字和盖章;
需要说明的是,单据模板图像中的关键文本可以为抬头文本、“盖章”和“签字”,而抬头参考文本可以和稽查参考文本为相应的参考文本,其包含相应的关键词汇。
S4032、若所述关键文本与所述抬头参考文本比对一致,则确定相应的所述关键文本在所述单据模板图像中的参考坐标位置为所述模板抬头区域,若所述关键文本与所述稽查参考文本比对一致,则确定相应的所述关键文本在所述单据模板图像中的参考坐标位置为所述模板稽查区域;
S4033、在所述模板稽查区域和所述模板抬头区域在所述单据模板图像中的参考坐标位置上添加对应的区域框。
需要说明的是,根据关键文本识别出关键文本周边的区域为待稽查区域后,可以通过红框的样式呈现,其范围可通过设定红框的大小或位置进行调整。
在另一实施例中,通过手动框选的方式划分模板稽查区域和所述模板抬头区域。
同时,记录模板稽查区域和所述模板抬头区域在单据模板图像的坐标位置,保存在本地存储中,以备后续稽查单据时调出匹配。
S404、判断所述模板稽查区域内是否有盖章或签字,根据判断结果识别所述模板稽查区域的稽查内容类型,若判断所述模板稽查区域内有盖章,则所述稽查内容类型为盖章类型,并提取相应的盖章形状轮廓,若判断所述模板稽查区域内有签字,则所述稽查内容类型为签字类型,并提取相应的签字文本。
在本实施例中,步骤S404具体包括:
S4041、遍历所述模板稽查区域的所有像素点以及所有像素点的像素值,所述像素值包括RGB颜色数值/和灰度值;
S4042、当识别到像素点的像素值满足预设的盖章像素阈值时,则判断所述模板稽查区域内有盖章,所述稽查内容类型为盖章类型,并获取相应的像素点的参考坐标位置,通过轮廓识提取算法提取相应的像素点的轮廓,以作为盖章形状轮廓;
在另一实施例中,通过手动框选识别盖章区域。
S4043、当识别到像素点的像素值满足预设的签字像素阈值时,则判断所述模板稽查区域内有签字,所述稽查内容类型为签字类型,并获取相应的像素点的参考坐标位置,对相应的像素点进行解析,以得到分割后的签名文本中的每个单字符数据,将各个单字符数据转成对应的静态图像,以识别得到签名文字的各个单字符的对应文字,将每个对应文字进行组合得到完整的签名文本。
需要说明的是,在识别是否有签字的过程中,可预先设置有签字笔或钢笔等颜色的灰度/颜色,其与打印的字体灰度/U不同,为避免将手写的其他区域的文字识别为签字,还计算识别为签字的图像的像素大小,如果大于所设定的阈值,则不识别为签字。
S500、在所述单据模板图像中识别出模板稽查区域及其坐标位置、稽查内容类型,所述稽查内容类型包括盖章类型和签字类型;
需要说明的是,为了预留人工签字的范围误差,可将原坐标位置扩大一定范围后的坐标位置作为存储的签字区域的坐标位置。
S600、根据所述单据模板图像的所述模板稽查区域的坐标位置确定所述待稽查图像中的待稽查区域的相对坐标位置,从而确定所述待稽查图像中的待稽查区域;
需要说明的是,由于单据模板图像为待稽查图像对应的模板图像,其单据模板图像的所述模板稽查区域的坐标位置是具有参考性的,也即单据模板图像的所述模板稽查区域的坐标位置和待稽查图像中的待稽查区域的坐标位置是相对一致的,从而可以确定所述待稽查图像中的待稽查区域的相对坐标位置,以得到待稽查图像中的待稽查区域。
S700、根据所述稽查内容类型,提取所述待稽查区域与所述模板稽查区域的稽查特征,将所述待稽查区域与所述模板稽查区域之间的稽查特征进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过。
需要说明的是,稽查内容类型包括盖章类型和签字类型,在一个具体实施例中,当稽查内容类型为盖章,则以模板稽查区域的盖章作为比对对象,对待稽查区域的盖章进行比对,当稽查内容类型为签字,则以模板稽查区域的签字作为比对对象,对待稽查区域的签字进行比对。
在本实施例中,步骤S700具体包括:
S701、若所述稽查内容类型为盖章类型,则提取所述待稽查区域中的盖章形状轮廓,将所述待稽查区域中的盖章形状轮廓与所述模板稽查区域中的盖章形状轮廓进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过;
S702、若所述稽查内容类型为签字类型,则提取所述待稽查区域中的签字文本,将所述待稽查区域中的签字文本与所述模板稽查区域中的签字文本进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过。
S800、若稽查验证不通过,则输出相应的待稽查单据及其单据信息和稽查结果,所述单据信息包括所述待稽查单据的单据编号,所述稽查结果包括稽查内容及其比对结果。
需要说明的是,若稽查验证通过,则说明单据稽查无误,无需做处理,而若稽查验证不通过,则需要对相应的待稽查单据进行记录,其记录结果包含待稽查单据及其单据信息和稽查结果,其中,稽查结果为不通过的具体待稽查区域和不通过的具体问题。如:单号XXXX,盖章区域未盖章;单号XXXX,盖章区域盖章错误;单号XXXX,签字区域未签字等。从而输出稽查验证不通过的单号的编号和具体问题,方便稽查人员进一步核实。
以上为本发明提供的一种单据稽查的方法的实施例的详细描述,以下为本发明提供的一种单据稽查的系统的实施例的详细描述。
为了便于理解,请参阅图2,本发明提供了一种单据稽查的系统,包括:
图像获取模块100,用于获取待稽查单据的待稽查图像;
文字识别模块200,用于根据预设的参考定位点确定所述待稽查图像中的目标抬头区域的相对坐标位置,从而得到所述目标抬头区域,对所述目标抬头区域进行文字识别,从而得到文字识别结果;
单据匹配模块300,用于根据所述文字识别结果确定所述待稽查单据的单据类型,根据所述单据类型在参考单据库中匹配到相应的单据模板图像;
稽查区域识别模块400,在所述单据模板图像中识别出模板稽查区域及其坐标位置、稽查内容类型,所述稽查内容类型包括盖章类型和签字类型;
稽查位置确定模块500,用于根据所述单据模板图像的所述模板稽查区域的坐标位置确定所述待稽查图像中的待稽查区域的相对坐标位置,从而确定所述待稽查图像中的待稽查区域;
稽查比对模块600,用于根据所述稽查内容类型,提取所述待稽查区域与所述模板稽查区域的稽查特征,将所述待稽查区域与所述模板稽查区域之间的稽查特征进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过。
需要说明的是,本实施例提供的一种单据稽查的系统的工作过程与上述实施例中的一种单据稽查的方法的流程一致,在此不再赘述。
本发明提供的单据稽查的系统,通过获取待稽查单据的待稽查图像后,确定待稽查图像中的目标抬头区域,对目标抬头区域进行文字识别,根据文字识别结果确定待稽查单据的单据类型,并通过单据类型匹配到相应的单据模板图像,根据单据模板图像的所述模板稽查区域的坐标位置确定待稽查图像中的待稽查区域,根据稽查内容类型,提取待稽查区域与模板稽查区域的稽查特征,从而将待稽查区域与模板稽查区域的稽查特征进行对比,得到对比结果,以确定稽查验证是否通过。从而实现了单据的自动稽查,相比于人工稽查,减小了工作量,提高了工作效率和准确率。
本发明还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述的单据稽查的方法。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述的单据稽查的方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种单据稽查的方法,其特征在于,包括以下步骤:
获取待稽查单据的待稽查图像;
根据预设的参考定位点确定所述待稽查图像中的目标抬头区域的相对坐标位置,从而得到所述目标抬头区域,对所述目标抬头区域进行文字识别,从而得到文字识别结果;
根据所述文字识别结果确定所述待稽查单据的单据类型,根据所述单据类型在参考单据库中匹配到相应的单据模板图像;
在所述单据模板图像中识别出模板稽查区域及其坐标位置、稽查内容类型,所述稽查内容类型包括盖章类型和签字类型;
根据所述单据模板图像的所述模板稽查区域的坐标位置确定所述待稽查图像中的待稽查区域的相对坐标位置,从而确定所述待稽查图像中的待稽查区域;
根据所述稽查内容类型,提取所述待稽查区域与所述模板稽查区域的稽查特征,将所述待稽查区域与所述模板稽查区域之间的稽查特征进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过。
2.根据权利要求1所述的单据稽查的方法,其特征在于,所述获取待稽查单据的待稽查图像的步骤之后包括:
对所述待稽查图像进行预处理,所述预处理的方式包括锐化和调整大小,其中,所述调整大小为调整所述待稽查图像的尺寸,以使得所述待稽查图像的尺寸与所述参考单据库中的单据模板图像的尺寸相一致。
3.根据权利要求1所述的单据稽查的方法,其特征在于,所述根据所述文字识别结果确定所述待稽查单据的单据类型,根据所述单据类型在参考单据库中匹配到相应的单据模板图像的步骤之前包括:
获取历史稽查单据,将所述历史稽查单据导入所述参考单据库中进行存储;
对所述历史稽查单据中的稽查信息进行提取,得到所述历史稽查单据中的单据模板图像,所述稽查信息包括抬头、盖章和签字;
识别所述单据模板图像中的模板稽查区域和模板抬头区域,并确实所述模板稽查区域和模板抬头区域分别对应的参考坐标位置,并添加所述模板稽查区域和所述模板抬头区域分别对应的区域框;
判断所述模板稽查区域内是否有盖章或签字,根据判断结果识别所述模板稽查区域的稽查内容类型,若判断所述模板稽查区域内有盖章,则所述稽查内容类型为盖章类型,并提取相应的盖章形状轮廓,若判断所述模板稽查区域内有签字,则所述稽查内容类型为签字类型,并提取相应的签字文本。
4.根据权利要求3所述的单据稽查的方法,其特征在于,所述识别所述单据模板图像中的模板稽查区域和模板抬头区域,并确实所述模板稽查区域和模板抬头区域分别对应的参考坐标位置,并添加所述模板稽查区域和所述模板抬头区域分别对应的区域框的步骤具体包括:
对所述单据模板图像中的文本信息进行OCR识别,从而识别出所述单据模板图像中的关键文本,将所述关键文本与预设的参考文本进行比对,所述预设的参考文本包括抬头参考文本和稽查参考文本,其中,所述稽查参考文本包括签字和盖章;
若所述关键文本与所述抬头参考文本比对一致,则确定相应的所述关键文本在所述单据模板图像中的参考坐标位置为所述模板抬头区域,若所述关键文本与所述稽查参考文本比对一致,则确定相应的所述关键文本在所述单据模板图像中的参考坐标位置为所述模板稽查区域;
在所述模板稽查区域和所述模板抬头区域在所述单据模板图像中的参考坐标位置上添加对应的区域框。
5.根据权利要求3所述的单据稽查的方法,其特征在于,所述判断所述模板稽查区域内是否有盖章或签字,根据判断结果识别所述模板稽查区域的稽查内容类型,若判断所述模板稽查区域内有盖章,则所述稽查内容类型为盖章类型,并提取相应的盖章形状轮廓,若判断所述模板稽查区域内有签字,则所述稽查内容类型为签字类型,并提取相应的签字文本的步骤具体包括:
遍历所述模板稽查区域的所有像素点以及所有像素点的像素值,所述像素值包括RGB颜色数值/和灰度值;
当识别到像素点的像素值满足预设的盖章像素阈值时,则判断所述模板稽查区域内有盖章,所述稽查内容类型为盖章类型,并获取相应的像素点的参考坐标位置,通过轮廓识提取算法提取相应的像素点的轮廓,以作为盖章形状轮廓;
当识别到像素点的像素值满足预设的签字像素阈值时,则判断所述模板稽查区域内有签字,所述稽查内容类型为签字类型,并获取相应的像素点的参考坐标位置,对相应的像素点进行解析,以得到分割后的签名文本中的每个单字符数据,将各个单字符数据转成对应的静态图像,以识别得到签名文字的各个单字符的对应文字,将每个对应文字进行组合得到完整的签名文本。
6.根据权利要求3所述的单据稽查的方法,其特征在于,所述根据所述稽查内容类型,提取所述待稽查区域与所述模板稽查区域的稽查特征,将所述待稽查区域与所述模板稽查区域之间的稽查特征进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过的步骤具体包括:
若所述稽查内容类型为盖章类型,则提取所述待稽查区域中的盖章形状轮廓,将所述待稽查区域中的盖章形状轮廓与所述模板稽查区域中的盖章形状轮廓进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过;
若所述稽查内容类型为签字类型,则提取所述待稽查区域中的签字文本,将所述待稽查区域中的签字文本与所述模板稽查区域中的签字文本进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过。
7.根据权利要求3所述的单据稽查的方法,其特征在于,所述根据所述稽查内容类型,提取所述待稽查区域与所述模板稽查区域的稽查特征,将所述待稽查区域与所述模板稽查区域之间的稽查特征进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过的步骤之后包括:
若稽查验证不通过,则输出相应的待稽查单据及其单据信息和稽查结果,所述单据信息包括所述待稽查单据的单据编号,所述稽查结果包括稽查内容及其比对结果。
8.一种单据稽查的系统,其特征在于,包括:
图像获取模块,用于获取待稽查单据的待稽查图像;
文字识别模块,用于根据预设的参考定位点确定所述待稽查图像中的目标抬头区域的相对坐标位置,从而得到所述目标抬头区域,对所述目标抬头区域进行文字识别,从而得到文字识别结果;
单据匹配模块,用于根据所述文字识别结果确定所述待稽查单据的单据类型,根据所述单据类型在参考单据库中匹配到相应的单据模板图像;
稽查区域识别模块,在所述单据模板图像中识别出模板稽查区域及其坐标位置、稽查内容类型,所述稽查内容类型包括盖章类型和签字类型;
稽查位置确定模块,用于根据所述单据模板图像的所述模板稽查区域的坐标位置确定所述待稽查图像中的待稽查区域的相对坐标位置,从而确定所述待稽查图像中的待稽查区域;
稽查比对模块,用于根据所述稽查内容类型,提取所述待稽查区域与所述模板稽查区域的稽查特征,将所述待稽查区域与所述模板稽查区域之间的稽查特征进行比对,若比对一致,则稽查验证通过,若比对不一致,则稽查验证不通过。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1~7任一项所述的单据稽查的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该计算机程序被处理器执行时实现如权利要求1~7任一项所述的单据稽查的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111125812.5A CN113569863B (zh) | 2021-09-26 | 2021-09-26 | 一种单据稽查的方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111125812.5A CN113569863B (zh) | 2021-09-26 | 2021-09-26 | 一种单据稽查的方法、系统、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113569863A true CN113569863A (zh) | 2021-10-29 |
CN113569863B CN113569863B (zh) | 2022-01-25 |
Family
ID=78174477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111125812.5A Active CN113569863B (zh) | 2021-09-26 | 2021-09-26 | 一种单据稽查的方法、系统、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113569863B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114639173A (zh) * | 2022-05-18 | 2022-06-17 | 国网浙江省电力有限公司 | 基于ocr技术的稽查佐证材料智能审核方法及装置 |
CN114708582A (zh) * | 2022-05-31 | 2022-07-05 | 国网浙江省电力有限公司 | 基于ai和rpa的电力数据智慧稽查方法及装置 |
CN114971932A (zh) * | 2022-07-29 | 2022-08-30 | 深圳慢云智能科技有限公司 | 一种基于公寓住宅智慧空间的人工智能社交方法及系统 |
CN116469120A (zh) * | 2023-05-31 | 2023-07-21 | 国网浙江省电力有限公司营销服务中心 | 电费单据自动数据处理方法、装置及存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030142855A1 (en) * | 2002-01-31 | 2003-07-31 | You-Ti Kuo | System of central signature verifications and electronic receipt transmissions |
US20070136283A1 (en) * | 1999-05-25 | 2007-06-14 | Silverbrook Research Pty Ltd | Method of providing information via context searching from a printed substrate |
CN105279525A (zh) * | 2015-11-19 | 2016-01-27 | 浪潮软件集团有限公司 | 一种图像处理的方法及装置 |
CN107463868A (zh) * | 2016-06-02 | 2017-12-12 | 阿里巴巴集团控股有限公司 | 一种电子表单核验方法及装置 |
CN109934213A (zh) * | 2019-01-23 | 2019-06-25 | 深圳壹账通智能科技有限公司 | 票据影像识别方法、装置、计算机设备和存储介质 |
AU2019100775A4 (en) * | 2019-07-17 | 2019-08-22 | Sadler, Hamish MR | Secure Receipt Transfer Protocol: Cryptosystem, Communication Protocol, Systems, Methods and Smartphone Applications for End-To-End Encrypted Transfer of Tamper-Resistant Receipts as an Enabler for Anonymously-Individualized Marketing and Loyalty Management with Preservation of Buyers’ Anonymity and Privacy |
CN110490181A (zh) * | 2019-08-14 | 2019-11-22 | 北京思图场景数据科技服务有限公司 | 一种基于ocr识别技术的表单填写审核方法、装置、设备以及计算机存储介质 |
CN110766014A (zh) * | 2018-09-06 | 2020-02-07 | 邬国锐 | 票据信息定位方法、系统及计算机可读存储介质 |
CN111582085A (zh) * | 2020-04-26 | 2020-08-25 | 中国工商银行股份有限公司 | 单据拍摄图像识别方法及装置 |
CN111914835A (zh) * | 2020-07-04 | 2020-11-10 | 中信银行股份有限公司 | 票据要素提取方法、装置、电子设备及可读存储介质 |
CN111950380A (zh) * | 2020-07-19 | 2020-11-17 | 中国建设银行股份有限公司 | 票据的稽核方法、装置、电子设备及计算机可读存储介质 |
CN112308141A (zh) * | 2020-10-30 | 2021-02-02 | 湖南长城信息金融设备有限责任公司 | 一种扫描票据分类方法、系统及可读存储介质 |
-
2021
- 2021-09-26 CN CN202111125812.5A patent/CN113569863B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070136283A1 (en) * | 1999-05-25 | 2007-06-14 | Silverbrook Research Pty Ltd | Method of providing information via context searching from a printed substrate |
US20030142855A1 (en) * | 2002-01-31 | 2003-07-31 | You-Ti Kuo | System of central signature verifications and electronic receipt transmissions |
CN105279525A (zh) * | 2015-11-19 | 2016-01-27 | 浪潮软件集团有限公司 | 一种图像处理的方法及装置 |
CN107463868A (zh) * | 2016-06-02 | 2017-12-12 | 阿里巴巴集团控股有限公司 | 一种电子表单核验方法及装置 |
CN110766014A (zh) * | 2018-09-06 | 2020-02-07 | 邬国锐 | 票据信息定位方法、系统及计算机可读存储介质 |
CN109934213A (zh) * | 2019-01-23 | 2019-06-25 | 深圳壹账通智能科技有限公司 | 票据影像识别方法、装置、计算机设备和存储介质 |
AU2019100775A4 (en) * | 2019-07-17 | 2019-08-22 | Sadler, Hamish MR | Secure Receipt Transfer Protocol: Cryptosystem, Communication Protocol, Systems, Methods and Smartphone Applications for End-To-End Encrypted Transfer of Tamper-Resistant Receipts as an Enabler for Anonymously-Individualized Marketing and Loyalty Management with Preservation of Buyers’ Anonymity and Privacy |
CN110490181A (zh) * | 2019-08-14 | 2019-11-22 | 北京思图场景数据科技服务有限公司 | 一种基于ocr识别技术的表单填写审核方法、装置、设备以及计算机存储介质 |
CN111582085A (zh) * | 2020-04-26 | 2020-08-25 | 中国工商银行股份有限公司 | 单据拍摄图像识别方法及装置 |
CN111914835A (zh) * | 2020-07-04 | 2020-11-10 | 中信银行股份有限公司 | 票据要素提取方法、装置、电子设备及可读存储介质 |
CN111950380A (zh) * | 2020-07-19 | 2020-11-17 | 中国建设银行股份有限公司 | 票据的稽核方法、装置、电子设备及计算机可读存储介质 |
CN112308141A (zh) * | 2020-10-30 | 2021-02-02 | 湖南长城信息金融设备有限责任公司 | 一种扫描票据分类方法、系统及可读存储介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114639173A (zh) * | 2022-05-18 | 2022-06-17 | 国网浙江省电力有限公司 | 基于ocr技术的稽查佐证材料智能审核方法及装置 |
CN114639173B (zh) * | 2022-05-18 | 2022-08-09 | 国网浙江省电力有限公司 | 基于ocr技术的稽查佐证材料智能审核方法及装置 |
CN114708582A (zh) * | 2022-05-31 | 2022-07-05 | 国网浙江省电力有限公司 | 基于ai和rpa的电力数据智慧稽查方法及装置 |
CN114708582B (zh) * | 2022-05-31 | 2022-08-26 | 国网浙江省电力有限公司 | 基于ai和rpa的电力数据智慧稽查方法及装置 |
CN114971932A (zh) * | 2022-07-29 | 2022-08-30 | 深圳慢云智能科技有限公司 | 一种基于公寓住宅智慧空间的人工智能社交方法及系统 |
CN116469120A (zh) * | 2023-05-31 | 2023-07-21 | 国网浙江省电力有限公司营销服务中心 | 电费单据自动数据处理方法、装置及存储介质 |
CN116469120B (zh) * | 2023-05-31 | 2023-09-05 | 国网浙江省电力有限公司营销服务中心 | 电费单据自动数据处理方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113569863B (zh) | 2022-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113569863B (zh) | 一种单据稽查的方法、系统、电子设备及存储介质 | |
CN110766014B (zh) | 票据信息定位方法、系统及计算机可读存储介质 | |
CN110503054B (zh) | 文本图像的处理方法及装置 | |
CN109740417B (zh) | 发票类型识别方法、装置、存储介质和计算机设备 | |
CN111639629B (zh) | 一种基于图像处理的猪只体重测量方法、装置及存储介质 | |
CN110705952A (zh) | 一种合同审核方法及装置 | |
CN110490190B (zh) | 一种结构化图像文字识别方法及系统 | |
CN108830275B (zh) | 点阵字符、点阵数字的识别方法及装置 | |
CN114359553B (zh) | 一种基于物联网的签章定位方法、系统及存储介质 | |
CN111259891B (zh) | 一种自然场景下身份证识别方法、装置、设备和介质 | |
CN112016481A (zh) | 基于ocr的财务报表信息检测和识别方法 | |
CN111738979A (zh) | 证件图像质量自动检查方法及系统 | |
CN114694161A (zh) | 一种特定版式证件的文本识别方法、设备及存储介质 | |
CN111652117B (zh) | 一种对多文档图像分割的方法及介质 | |
CN112200789A (zh) | 一种图像识别的方法及装置、电子设备和存储介质 | |
CN116798061A (zh) | 一种票据审核识别方法、装置、终端和存储介质 | |
KR20160061528A (ko) | 위변조 여권 검사 방법 및 그 기록매체 | |
JP2003109007A (ja) | 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置 | |
CN111414889A (zh) | 基于文字识别的财务报表识别方法及装置 | |
CN113569864B (zh) | 一种识别签字和印章的方法及系统 | |
CN114663899A (zh) | 金融票据的处理方法、装置、设备及介质 | |
CN112380957A (zh) | 他项权证信息识别方法、装置、计算机设备和存储介质 | |
CN115471846B (zh) | 一种图像矫正方法、装置、电子设备及可读存储介质 | |
CN116306576B (zh) | 一种书刊印刷检错系统及其方法 | |
CN115795079A (zh) | 一种工程造价分析数据采集与处理方法、系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |