CN112651913B - 一种发票印章淡化方法、系统、装置及计算机存储介质 - Google Patents

一种发票印章淡化方法、系统、装置及计算机存储介质 Download PDF

Info

Publication number
CN112651913B
CN112651913B CN202011494869.8A CN202011494869A CN112651913B CN 112651913 B CN112651913 B CN 112651913B CN 202011494869 A CN202011494869 A CN 202011494869A CN 112651913 B CN112651913 B CN 112651913B
Authority
CN
China
Prior art keywords
image
channel
seal
invoice
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011494869.8A
Other languages
English (en)
Other versions
CN112651913A (zh
Inventor
音松
朱汝维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Sendi Computer System Co ltd
Original Assignee
Guangzhou Sendi Computer System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Sendi Computer System Co ltd filed Critical Guangzhou Sendi Computer System Co ltd
Priority to CN202011494869.8A priority Critical patent/CN112651913B/zh
Publication of CN112651913A publication Critical patent/CN112651913A/zh
Application granted granted Critical
Publication of CN112651913B publication Critical patent/CN112651913B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种发票印章淡化方法、系统、装置及计算机存储介质,其中所述方法包括获取第一图像,将第一图像输入检测模型,得到第二图像以及第三图像;根据第二图像获得第一通道第二通道及第三通道,并确定重建后的第二通道及重建后的第三通道,将第一通道、重建后的第二通道以及重建后的第三通道融合,获得第四图像;最后将第三图像与第四图像融合,获得第五图像,第五图像为印章淡化后的发票图像。本申请通过检测模型实现对发票印章区域的定位,并只对包含发票印章区域的第二图像进行淡化处理,降低印章对关键字段的覆盖影响。

Description

一种发票印章淡化方法、系统、装置及计算机存储介质
技术领域
本申请涉及计算机视觉图像处理领域,尤其涉及一种发票印章淡化方法、系统、装置及计算机存储介质。
背景技术
生活中,各种类型的发票给财务报销的工作带来严重负担,近年来随着计算机视觉和人工智能技术的发展,各种各样的发票自动识别系统被引入人们日常工作中,以减轻人们工作负担。然而,发票上存在的印章严重影响了识别系统的准确性。相关技术中提出几种淡化或去除发票印章的方法,包括基于颜色通道去除、基于区域背景融合去除以及基于特征通道反卷积去除;基于颜色通道去除的方法容易对发票其他区域的关键字段造成丢失和模糊;基于区域背景融合的方法只对发票中印章区域进行处理,但会造成印章覆盖下的区域信息丢失,影响后续识别准确性;基于特征通道反卷积的方法对神经网络训练的要求很高,且难以拟合生活中各种类型的发票,难以完整复原整张发票章各个关键字段的细节信息,通用性较低。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请提出一种发票印章淡化方法、系统、装置及计算机存储介质。
第一方面,本申请实施例提供一种发票印章淡化方法,包括:获取第一图像;所述第一图像为带有印章的发票图像;根据所述第一图像和训练好的检测模型,确定第二图像和第三图像;所述第二图像为发票的印章区域,所述第三图像为发票中除印章区域以外的其他区域获取所述第二图像的第一通道、第二通道和第三通道;根据所述第一通道和所述第二通道,确定重建后的第二通道;并根据所述第一通道和所述第三通道,确定重建后的第三通道;将所述第一通道、所述重建后的第二通道以及所述重建后的第三通道进行组合,确定第四图像;所述第四图像为淡化后的印章区域;将所述第三图像和所述第四图像融合,确定第五图像,所述第五图像为印章淡化后的发票图像。
可选地,所述根据所述第一通道和所述第二通道,确定重建后的第二通道,包括:获取所述第一通道的灰度平均值;根据所述第一通道中任意像素点的灰度值和所述灰度平均值,确定替换坐标集;根据所述替换坐标集和所述第二通道,确定重建后的第二通道。
可选地,所述替换坐标集包括所述第一通道中灰度值小于所述灰度平均值的像素点的坐标。
可选地,所述根据所述替换坐标集和所述第二通道,确定重建后的第二通道,包括:根据所述替换坐标集,将所述第一通道中对应像素点的灰度值替换为所述第二通道中对应像素点的灰度值,确定重建后的第二通道。
可选地,所述检测模型的具体训练步骤包括:获取数据集,所述数据集包括若干带有印章的发票图像;对所述发票图像的印章区域进行标定,确定若干标定框信息;对所述标定信息进行聚类,确定若干聚类标定框信息;根据若干聚类标定框信息,训练获得检测模型。
可选地,所述根据所述第一图像和训练好的检测模型,确定第二图像,包括:对所述第一图像进行尺寸归一化处理,得到指定尺寸的第一图像;根据所述检测模型对所述指定尺寸的第一图像进行裁剪,确定所述第二图像和所述第三图像。
可选地,所述对所述标定框信息进行聚类,确定若干聚类标定框信息,包括:根据所述标定框的宽和高,对所述标定框信息分组并聚类,确定若干聚类标定框信息。
第二方面,本申请实施例提供一种发票印章淡化系统,所述系统包括:获取模块,用于获取第一图像;所述第一图像为带有印章的发票图像;区域检测模块,用于根据所述第一图像和训练好的检测模型,确定第二图像和第三图像;所述第二图像为发票的印章区域,所述第三图像为发票中除印章区域以外的其他区域;通道分离模块,用于获取所述第二图像的第一通道、第二通道和第三通道;通道重建模块,用于根据所述第一通道和所述第二通道,确定重建后的第二通道;并根据所述第一通道和所述第三通道,确定重建后的第三通道;淡化模块,用于将所述第一通道、所述重建后的第二通道以及所述重建后的第三通道进行组合,确定第四图像;所述第四图像为淡化后的印章区域;图像重建模块,用于将所述第三图像和所述第四图像融合,确定第五图像,所述第五图像为印章淡化后的发票图像。
第三方面,本申请实施例提供一种装置,包括:至少一个处理器;至少一个存储器,用于存储至少一个程序;当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如第一方面所述的发票印章淡化方法。
第四方面,本申请实施例提供一种计算机存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由所述处理器执行时用于实现如第一方面所述的发票印章淡化方法。
本申请实施例的有益效果如下:获取带有印章的发票图像作为第一图像,将第一图像输入训练好的检测模型,得到包含印章区域的第二图像以及包含除印章区域以外其他区域的第三图像;在RGB空间对第二图像进行颜色通道分离,获得R空间的第一通道、G空间的第二通道以及B空间的第三通道。根据第一通道和第二通道确定重建后的第二通道,并根据第一通道和第三通道确定重建后的第三通道,将第一通道、重建后的第二通道以及重建后的第三通道融合,获得第四图像,第四图像为淡化后的印章区域;最后将第三图像与第四图像融合,获得第五图像,第五图像为印章淡化后的发票图像。本申请实施例通过检测模型实现对发票印章区域的准确定位,在不影响整张发票其他信息的前提下,只对包含发票印章区域的第二图像进行淡化处理,对第三图像不作淡化处理,尽可能保持发票图像的细节完整;比起相关技术中直接消除印章的方案,本申请实施例对印章进行淡化,降低印章对关键字段的覆盖影响,以减少印章覆盖下区域的信息丢失。
附图说明
附图用来提供对本申请技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1是本申请一些实施例提供的一种发票印章淡化方法的流程图;
图2为本申请一些实施例提供的检测模型的训练步骤图;
图3为本申请一些实施例提供的确定重建后的第二通道的流程图;
图4为本申请一些实施例提供的发票印章淡化系统;
图5为本申请一些实施例提供的一种装置。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,虽然在系统示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于系统中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
生活中,各种类型的发票给财务报销的工作带来严重负担,近年来随着计算机视觉和人工智能技术的发展,各种各样的发票自动识别系统被引入人们日常工作中,以减轻人们工作负担。然而,发票上存在的印章严重影响了识别系统的准确性。相关技术中提出几种淡化或去除发票印章的方法,包括基于颜色通道去除、基于区域背景融合去除以及基于特征通道反卷积去除,下面简单介绍一下这三种相关技术。
(1)基于颜色通道去除:本方法对发票图片进行颜色通道拆分并计算红色通道灰度值图片的统计直方图确定最佳阈值,根据阈值进行二值化,再利用膨胀算法对其进行处理得到去除印章的图片。基于颜色通道的印章去除技术研究目前已经很成熟,但是在实际的应用中,对印章通道颜色灰度值进行统计直方图确定阈值再二值化的方法,容易对发票整体其它区域的关键字段造成严重的丢失和模糊。
(2)基于区域背景融合去除:本方法利用训练好的检测模型提取发票图片的印章图像区域以及印章图样的颜色,依据印章颜色对印章图样进行消除再与提取印章后的图像进行融合,得到印章消除的目标发票图像。基于区域背景融合的印章去除方法避免了去除印章操作对发票中其它区域的影响,但是该方法对印章区域颜色的操作会造成印章覆盖下的区域信息丢失,影响后续的识别准确性。
(3)基于特征通道反卷积去除:本方法将发票图像输入二分支多任务网络模型中,通过对目标通道部分和发票完整部分分别进行卷积得到不同的全局特征图再进行融合,并对新的融合特征图进行反卷积从而得出消除印章后的发票图像。基于特征通道反卷积的方法对整张图片进行反卷积达到去除印章的目的,一方面对整个网络训练的要求非常高,并且很难拟合生活中常见的各类发票,难以完整复原整张发票章各个关键字段的细节信息,并且该种方法对网络训练的数据集要求非常高。
根据以上提到的三种相关技术可以得知,相关技术中的印章去除方法虽然可以一定程度上去除票据印章,但是也会造成整张票据或者印章区域中的关键信息丢失、变形或模糊,基于此,本申请提出一种发票印章淡化方法、系统、装置及计算机存储介质,本申请实施例通过检测模型实现对发票印章区域的准确定位,在不影响整张发票其他信息的前提下,只对发票的印章区域进行淡化处理,尽可能保持发票图像的细节完整;比起相关技术中直接消除印章的方案,本申请能够减少印章覆盖下区域的信息丢失。
下面结合附图,对本申请实施例作进一步阐述。
参考图1,图1是本申请一些实施例提供的一种发票印章淡化方法的流程图,该方法包括但不限于步骤S100至步骤S150。
步骤S100,获取第一图像;第一图像为带有印章的发票图像。
具体地,获取需要进行印章淡化的发票图像。
步骤S110,根据第一图像和训练好的检测模型,确定第二图像和第三图像;第二图像为发票的印章区域,第三图像为发票中除印章区域以外的其他区域。
具体地,参照图2,图2为本申请一些实施例提供的检测模型的训练步骤图,该训练包括但不限于步骤S200至步骤S230。
步骤S200,获取数据集,数据集包括若干带有印章的发票图像。
具体地,通过在互联网上爬取或者是拍摄的方式,获取大量含有印章的不同发票图像,这些图像组成数据集。
步骤S210,对发票图像的印章区域进行标定,确定若干标定框信息。
具体地,本申请实施例利用LabelImg软件对数据集中发票图像图片的印章区域进行标定,具体是利用标定框框选出印章区域,并生成若干标定框信息,将标定好的信息处理成对应网络训练的格式。
步骤S220,对标定信息进行聚类,确定若干聚类标定框信息。
具体地,利用K-means(k-means clustering algorith,k均值聚类算法)对步骤S210中生成的若干标定框信息进行聚类。在本申请实施例中,依照标定框的宽和高,将标定框信息分为9组进行聚类,并以YOLO V3模型的候选框尺寸为标准,重新生成聚类后的标准框信息,本步骤使得后续使用YOLO V3模型进行印章检测时,模型能够更好地拟合印章大小。
步骤S230,根据若干聚类标定框信息,训练获得检测模型。
具体地,使用经过标定、聚类后的数据集对YOLO V3模型进行训练,训练完毕后得到检测模型,该检测模型用于检测出发票图像中印章区域的位置。
通过步骤S200至步骤S230,利用LabelImg软件对发票图像的印章区域进行标定,并对标定框信息进行K-means聚类使模型能更好地你和印章大小,利用使用经过标定、聚类后的数据集对YOLO V3模型进行训练,获得能检测出发票图像中印章区域的位置的检测模型。
参照图1,步骤S110中所提到的检测模型的训练步骤已在图2的方法步骤中阐述清楚。步骤S110中还需要对第一图像进行归一化处理,以得到指定尺寸的第一图像,指定尺寸的具体大小可以根据实际情况进行调整,例如指定尺寸可以为416像素*416像素。将指定尺寸的第一图像输入检测模型,检测模型检测到第一图像中的印章位置,并第一图像进行裁剪,获得第二图像和第三图像,第二图像为发票的印章区域,第三图像为发票中除印章区域以外的其他区域。在本步骤中就利用检测模型将发票图像中的印章部分和其他部分分离开来,后续步骤则针对印章部分进行处理,这样可以减少发票其他区域的字段丢失、模糊等情况。
步骤S120,获取第二图像的第一通道、第二通道和第三通道。
具体地,利用OpenCV(Open Source Computer Vision Library,开放源代码的计算机视觉库)中的split函数对第二图像进行颜色通道分离,获得R(Red)空间的第一通道,G(Green)空间的第二通道,B(Blue)空间的第三通道。
步骤S130,根据第一通道和第二通道,确定重建后的第二通道;并根据第一通道和第三通道,确定重建后的第三通道。
具体地,参照图3,图3为本申请一些实施例提供的确定重建后的第二通道的流程图,该方法包括但不限于步骤S300至步骤S320。
步骤S300,获取第一通道的灰度平均值。
具体地,根据第一通道图像中每个像素点的灰度值,计算获得第一通道的灰度平均值。
步骤S310,根据第一通道中任意像素点的灰度值和灰度平均值,确定替换坐标集。
具体地,遍历第一通道中的每个像素点,将每个像素点的灰度值与步骤S300中计算得到的灰度平均值进行比较,确定出第一通道中灰度值小于灰度平均值的像素点,并将这些像素点的坐标记录在替换坐标集中。当第一通道中所有的像素点都比较完毕,替换坐标集完成。
步骤S320,根据替换坐标集和第二通道,确定重建后的第二通道。
具体地,替换坐标集中包含第一通道中灰度值小于灰度平均值的像素点坐标,由于第一通道和第二通道之间像素点位置一一对应,因此可以根据替换坐标集,在第二通道中确定需要进行灰度值替换的像素点的坐标,并将第一通道中对应像素点的灰度值替换为第二通道中对应像素点的灰度值。例如,在第一通道中,坐标为(1,1)的像素点A灰度值小于第一通道的灰度平均值,则将第二通道中坐标为(1,1)的像素点的B的灰度值替换为像素点A的灰度值。
需要说明的是,确定重建后的第三通道的步骤与确定重建后的第二通道的步骤相同,同样是根据替换坐标集,在第三通道中确定需要进行灰度值替换的像素点的坐标,并将第一通道中对应像素点的灰度值替换为第三通道中对应像素点的灰度值。
第二图像包含印章区域,印章区域可能包括印章周边一些空白的地方,以及印章中间一些空白的地方,将印章区域细分为印章覆盖区域和印章未覆盖区域,由于发票上所使用的的印章一般都是红色的,因此下面以红色印章举例:在图1的步骤S120中对第二图像进行颜色通道分离,在印章覆盖区域,由于印章是红色的,那么印章覆盖区域部分第一通道(R空间)的灰度值就要比第二通道(G空间)的灰度值以及第三通道(B空间)的灰度值都要大;而对于整个第二图像的第一通道来说,印章覆盖的区域颜色更深,那么在第一通道中,印章覆盖区域的灰度值要比印章未覆盖区域的灰度值要小。因此在图3的步骤S310中遍历第二图像的第一通道每个像素点的灰度值,灰度值小于平均值的像素点则是属于印章覆盖区域的像素点。将印章覆盖区域准确找出来以后,将印章覆盖区域中第二通道的像素点灰度值替换为印章覆盖区域中第一通道的像素点灰度值,因此印章覆盖区域中第二通道的像素点灰度值会变大,得到重建后的第二通道。同理,对印章覆盖区域中第三通道作相同处理:将印章覆盖区域中第三通道的像素点灰度值替换为印章覆盖区域中第一通道的像素点灰度值,因此印章覆盖区域中第三通道的像素点灰度值会变大,得到重建后的第三通道。
通过图3中的方法步骤,得到重建后的第二通道以及重建后的第三通道,图1中的步骤S130已经阐述清楚,下面开始阐述步骤S140。
步骤S140,将第一通道、重建后的第二通道以及重建后的第三通道进行组合,确定第四图像;第四图像为淡化后的印章区域。
具体地,首先需要说明的是,在RGB空间中,灰度值越大,图像颜色越接近白色(颜色越浅)。经过图3中的步骤320对印章覆盖区域的第二通道及第三通道的灰度值进行替换后,将第一通道、重建后得第二通道以及重建后的第三通道进行组合,得到新的三通道图片作为第四图片。在第四图片中,由于印章覆盖区域的第二通道以及第三通道的灰度值都变大,因此印章覆盖区域的颜色变浅,印章未覆盖区域的颜色则保持不变,达到了准确对印章覆盖区域进行淡化的效果。
根据图3中的方法步骤以及图1中的步骤S140可以得知,由于实际生活中发票印章的颜色一般是红色,因此本申请实施例将第一通道(R空间)中灰度值较小的像素点找出来就可以确定印章区域,并将对应位置的第二通道(G空间)像素点灰度值以及对应位置的第三通道(B空间)像素点灰度值进行替换就可以达到淡化红色印章的效果。但本申请提出的印章淡化方法还可以应用在其他票据上,例如生活中也有一些带有蓝色印章的票据,那么步骤S310就变为将第三通道(B空间)中灰度值较小的像素点找出来,就可以确定蓝色印章的区域,并将对应位置的第一通道(R空间)像素点灰度值以及对应位置的第二通道(G空间)像素点灰度值进行替换就可以达到淡化蓝色印章的效果。
步骤S150,将第三图像和第四图像融合,确定第五图像,第五图像为印章淡化后的发票图像。
具体地,将从步骤S110中裁剪出来的第三图像与第四图像融合,即将没有经过淡化处理的发票其他区域与经过淡化处理的印章区域进行融合,得到第五图像,第五图像为完整的、印章淡化后的发票图像。
通过步骤S100与步骤S150,本申请实施例获取带有印章的发票图像作为第一图像,利用检测模型检测出第一图像中印章的位置,并将印章区域裁剪出来作为第二图像,发票其他区域作为第三图像,对第二图像进行颜色通道分离,找出第一通道(R空间)的图像中灰度值小于第一通道灰度平均值的点,确定一个替换坐标集,并根据该坐标集,将第二通道(G空间)对应位置的像素点灰度值替换为第一通道(R空间)对应位置的像素点灰度值,将第三通道(B空间)对应位置的像素点灰度值替换为第一通道(R空间)对应位置的像素点灰度值,并将第一通道、重建后的第二通道以及重建后的第三通道进行融合,得到第四图像;将第三图像和第四图像融合,得到第五图像,第五图像为完整的、印章淡化后的发票图像。本申请实施例通过检测模型实现对发票印章区域的准确定位,在不影响整张发票其他信息的前提下,只对包含发票印章区域的第二图像进行淡化处理,对第三图像不作淡化处理,尽可能保持发票图像的细节完整;比起相关技术中直接消除印章的方案,本申请实施例对印章进行淡化,降低印章对关键字段的覆盖影响,以减少印章覆盖下区域的信息丢失。
参照图4,图4为本申请一些实施例提供的发票印章淡化系统,该系统400包括:获取模块410、区域监测模块420、通道分离模块430、通道重建模块440、淡化模块450以及图像重建模块460;获取模块用于获取第一图像;第一图像为带有印章的发票图像;区域检测模块用于根据第一图像和训练好的检测模型,确定第二图像和第三图像;第二图像为发票的印章区域,第三图像为发票中除印章区域以外的其他区域;通道分离模块用于获取第二图像的第一通道、第二通道和第三通道;通道重建模块用于根据第一通道和第二通道,确定重建后的第二通道;并根据第一通道和第三通道,确定重建后的第三通道;淡化模块用于将第一通道、重建后的第二通道以及重建后的第三通道进行组合,确定第四图像;第四图像为淡化后的印章区域;图像重建模块用于将第三图像和第四图像融合,确定第五图像,第五图像为印章淡化后的发票图像。
参考图5,图5为本申请一些实施例提供的一种装置,该装置500包括至少一个处理器510,还包括至少一个存储器520,用于存储至少一个程序;图5中以一个处理器及一个存储器为例。
处理器和存储器可以通过总线或者其他方式连接,图5中以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请的另一个实施例还提供了一种装置,该装置可用于执行如上任意实施例中的控制方法,例如,执行以上描述的图1中的方法步骤。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本申请实施例还公开了一种计算机存储介质,其中存储有处理器可执行的程序,其特征在于,处理器可执行的程序在由处理器执行时用于实现本申请提出的合成语音与原始视频匹配方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本申请的较佳实施进行了具体说明,但本申请并不局限于上述实施方式,熟悉本领域的技术人员在不违背本申请精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (7)

1.一种发票印章淡化方法,其特征在于,包括:
获取第一图像;所述第一图像为带有印章的发票图像;
根据所述第一图像和训练好的检测模型,确定第二图像和第三图像;所述第二图像为发票的印章区域,所述第三图像为发票中除印章区域以外的其他区域;
获取所述第二图像的第一通道、第二通道和第三通道;
根据所述第一通道和所述第二通道,确定重建后的第二通道;并根据所述第一通道和所述第三通道,确定重建后的第三通道;
将所述第一通道、所述重建后的第二通道以及所述重建后的第三通道进行组合,确定第四图像;所述第四图像为淡化后的印章区域;
将所述第三图像和所述第四图像融合,确定第五图像,所述第五图像为印章淡化后的发票图像;
所述根据所述第一通道和所述第二通道,确定重建后的第二通道,包括:
获取所述第一通道的灰度平均值;
根据所述第一通道中任意像素点的灰度值和所述灰度平均值,确定替换坐标集;
根据所述替换坐标集和所述第二通道,确定重建后的第二通道;
所述替换坐标集包括所述第一通道中灰度值小于所述灰度平均值的像素点的坐标;
所述根据所述替换坐标集和所述第二通道,确定重建后的第二通道,包括:
根据所述替换坐标集,将所述第一通道中对应像素点的灰度值替换为所述第二通道中对应像素点的灰度值,确定重建后的第二通道。
2.根据权利要求1所述的发票印章淡化方法,其特征在于,所述检测模型的具体训练步骤包括:
获取数据集,所述数据集包括若干带有印章的发票图像;
对所述发票图像的印章区域进行标定,确定若干标定框信息;
对所述标定信息进行聚类,确定若干聚类标定框信息;
根据若干聚类标定框信息,训练获得检测模型。
3.根据权利要求1所述的发票印章淡化方法,其特征在于,所述根据所述第一图像和训练好的检测模型,确定第二图像,包括:
对所述第一图像进行尺寸归一化处理,得到指定尺寸的第一图像;
根据所述检测模型对所述指定尺寸的第一图像进行裁剪,确定所述第二图像和所述第三图像。
4.根据权利要求2所述的发票印章淡化方法,其特征在于,所述对所述标定框信息进行聚类,确定若干聚类标定框信息,包括:
根据所述标定框的宽和高,对所述标定框信息分组并聚类,确定若干聚类标定框信息。
5.一种应用如权利要求1-4中任一项所述的发票印章淡化方法的系统,其特征在于,所述系统包括:
获取模块,用于获取第一图像;所述第一图像为带有印章的发票图像;
区域检测模块,用于根据所述第一图像和训练好的检测模型,确定第二图像和第三图像;所述第二图像为发票的印章区域,所述第三图像为发票中除印章区域以外的其他区域;
通道分离模块,用于获取所述第二图像的第一通道、第二通道和第三通道;
通道重建模块,用于根据所述第一通道和所述第二通道,确定重建后的第二通道;并根据所述第一通道和所述第三通道,确定重建后的第三通道;
淡化模块,用于将所述第一通道、所述重建后的第二通道以及所述重建后的第三通道进行组合,确定第四图像;所述第四图像为淡化后的印章区域;
图像重建模块,用于将所述第三图像和所述第四图像融合,确定第五图像,所述第五图像为印章淡化后的发票图像。
6.一种装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-4中任一项所述的发票印章淡化方法。
7.一种计算机存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由所述处理器执行时用于实现如权利要求1-4任一项所述的发票印章淡化方法。
CN202011494869.8A 2020-12-17 2020-12-17 一种发票印章淡化方法、系统、装置及计算机存储介质 Active CN112651913B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011494869.8A CN112651913B (zh) 2020-12-17 2020-12-17 一种发票印章淡化方法、系统、装置及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011494869.8A CN112651913B (zh) 2020-12-17 2020-12-17 一种发票印章淡化方法、系统、装置及计算机存储介质

Publications (2)

Publication Number Publication Date
CN112651913A CN112651913A (zh) 2021-04-13
CN112651913B true CN112651913B (zh) 2024-03-29

Family

ID=75354596

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011494869.8A Active CN112651913B (zh) 2020-12-17 2020-12-17 一种发票印章淡化方法、系统、装置及计算机存储介质

Country Status (1)

Country Link
CN (1) CN112651913B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128512A (zh) * 2021-04-14 2021-07-16 浪潮天元通信信息系统有限公司 一种基于颜色通道去红章的方法及工具
CN114565044B (zh) * 2022-03-01 2022-08-16 北京九章云极科技有限公司 印章识别方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109284758A (zh) * 2018-09-29 2019-01-29 武汉工程大学 一种发票印章消除方法、装置和计算机存储介质
CN109961020A (zh) * 2019-03-05 2019-07-02 南京邮电大学 一种发票印章去除方法
WO2019174130A1 (zh) * 2018-03-14 2019-09-19 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
CN110517186A (zh) * 2019-07-30 2019-11-29 金蝶软件(中国)有限公司 消除发票印章的方法、装置、存储介质和计算机设备
CN110619642A (zh) * 2019-09-05 2019-12-27 四川大学 一种票据图像中印章与背景文字分离方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019174130A1 (zh) * 2018-03-14 2019-09-19 平安科技(深圳)有限公司 票据识别方法、服务器及计算机可读存储介质
CN109284758A (zh) * 2018-09-29 2019-01-29 武汉工程大学 一种发票印章消除方法、装置和计算机存储介质
CN109961020A (zh) * 2019-03-05 2019-07-02 南京邮电大学 一种发票印章去除方法
CN110517186A (zh) * 2019-07-30 2019-11-29 金蝶软件(中国)有限公司 消除发票印章的方法、装置、存储介质和计算机设备
CN110619642A (zh) * 2019-09-05 2019-12-27 四川大学 一种票据图像中印章与背景文字分离方法

Also Published As

Publication number Publication date
CN112651913A (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
CN110705583B (zh) 细胞检测模型训练方法、装置、计算机设备及存储介质
CN109753913B (zh) 计算高效的多模式视频语义分割方法
CN112651913B (zh) 一种发票印章淡化方法、系统、装置及计算机存储介质
EP0932114A2 (en) A method of and apparatus for detecting a face-like region and observer tracking display
CN103093203B (zh) 一种人体再识别方法以及人体再识别系统
CN108154149B (zh) 基于深度学习网络共享的车牌识别方法
CN110956081B (zh) 车辆与交通标线位置关系的识别方法、装置及存储介质
CN112364740B (zh) 一种基于计算机视觉的无人机房监控方法及系统
CN112364898B (zh) 图像识别自动标注方法、装置、设备及存储介质
CN110163109B (zh) 一种车道线标注方法及装置
AU2013248207A1 (en) Method for superpixel life cycle management
CN109740553B (zh) 一种基于识别的图像语义分割数据筛选方法及系统
WO2023123981A1 (zh) 一种视频处理方法、装置、计算机设备和存储介质
CN112580383A (zh) 二维码识别方法、装置、电子设备及存储介质
CN111723805B (zh) 一种信号灯的前景区域识别方法及相关装置
CN115512238A (zh) 病害区域的确定方法、装置、存储介质及电子装置
CN108877030B (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN113792600B (zh) 一种基于深度学习的视频抽帧方法和系统
CN114359333A (zh) 运动目标提取方法、装置、计算机设备和存储介质
CN114359669A (zh) 图片分析模型调整方法、装置以及计算机可读存储介质
CN110969176A (zh) 一种车牌样本扩增方法、装置和计算机设备
CN112580629A (zh) 一种基于深度学习的车牌字符识别方法以及相关装置
CN112581481A (zh) 图像处理方法和装置、电子设备、计算机可读存储介质
CN112052859B (zh) 一种自由场景下的车牌精准定位方法及装置
CN113822818A (zh) 散斑提取方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant