CN113591856A - 票据图片处理方法及装置 - Google Patents
票据图片处理方法及装置 Download PDFInfo
- Publication number
- CN113591856A CN113591856A CN202110968927.4A CN202110968927A CN113591856A CN 113591856 A CN113591856 A CN 113591856A CN 202110968927 A CN202110968927 A CN 202110968927A CN 113591856 A CN113591856 A CN 113591856A
- Authority
- CN
- China
- Prior art keywords
- discriminator
- watermark
- bill
- optimized
- loss value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 14
- 238000012360 testing method Methods 0.000 claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 20
- 230000006870 function Effects 0.000 claims description 44
- 238000004590 computer program Methods 0.000 claims description 16
- 238000005457 optimization Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种票据图片处理方法及装置,涉及人工智能技术领域,该方法包括:获取多张无水印的票据图片,加盖水印后建立训练集和测试集;将训练集中的带水印票据图片输入生成器,输出对应的去除水印票据图片;分别将带水印票据图片和去除水印票据图片标记为负样本、将带水印票据图片和无水印票据图片标记为正样本,输入判别器;采用损失函数计算判别器的损失值,更新判别器参数得到优化的判别器;将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用损失函数计算判别器的损失值,更新生成器参数得到优化的生成器;利用通过测试集测试的生成对抗网络去除票据图片的水印,可以提高票据图片识别的准确率,降低票据图片识别成本。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种票据图片处理方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
目前,由于银行业务种类多,业务数量大,每天会产生大量票据材料,例如:汇票、本票、支票等。大型银行的单证处理中心通常采用OCR(Optical Character Recognition,光学字符识别)技术对这些票据进行识别处理,但是当票据存在水印遮挡时,OCR技术的准确率则会大大降低,从而影响到数万张票据的识别,这些错误识别的异常票据需要花费大量的人力物力进行处理,提高了相应成本。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供一种票据图片处理方法,用以去除票据图片的水印,提高票据图片识别的准确率,降低票据图片识别的成本,该方法包括:
获取多张无水印的票据图片,加盖水印后建立训练集和测试集,所述训练集和测试集包含带水印票据图片和对应的无水印票据图片;
将训练集中的带水印票据图片输入生成对抗网络中的生成器,输出对应的去除水印票据图片;
分别将带水印票据图片和对应的去除水印票据图片标记为负样本、将带水印票据图片和对应的无水印票据图片标记为正样本,输入生成对抗网络中的判别器,分别输出负样本对应的判别结果和正样本对应的判别结果;
根据负样本对应的判别结果和正样本对应的判别结果,采用损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器;
将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器;
根据测试集对训练好的生成对抗网络进行测试,利用通过测试的生成对抗网络去除票据图片的水印。
本发明实施例还提供一种票据图片处理装置,用以去除票据图片的水印,提高票据图片识别的准确率,降低票据图片识别的成本,该装置包括:
建立模块,用于获取多张无水印的票据图片,加盖水印后建立训练集和测试集,所述训练集和测试集包含带水印票据图片和对应的无水印票据图片;
生成模块,用于将训练集中的带水印票据图片输入生成对抗网络中的生成器,输出对应的去除水印票据图片;
判别模块,用于分别将带水印票据图片和对应的去除水印票据图片标记为负样本、将带水印票据图片和对应的无水印票据图片标记为正样本,输入生成对抗网络中的判别器,分别输出负样本对应的判别结果和正样本对应的判别结果;
判别器优化模块,用于根据负样本对应的判别结果和正样本对应的判别结果,采用损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器;
生成器优化模块,用于将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器;
测试与去除水印模块,用于根据测试集对训练好的生成对抗网络进行测试,利用通过测试的生成对抗网络去除票据图片的水印。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述票据图片处理方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述票据图片处理方法的计算机程序。
本发明实施例中,获取多张无水印的票据图片,加盖水印后建立训练集和测试集,所述训练集和测试集包含带水印票据图片和对应的无水印票据图片;将训练集中的带水印票据图片输入生成对抗网络中的生成器,输出对应的去除水印票据图片;分别将带水印票据图片和对应的去除水印票据图片标记为负样本、将带水印票据图片和对应的无水印票据图片标记为正样本,输入生成对抗网络中的判别器,分别输出负样本对应的判别结果和正样本对应的判别结果;根据负样本对应的判别结果和正样本对应的判别结果,采用损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器;将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器,可以去除票据图片的水印,提高票据图片识别的准确率,降低票据图片识别的成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中票据图片处理方法的处理流程图;
图2为本发明实施例中将负样本输入生成对抗网络的具体实例示意图;
图3为本发明实施例中将正样本输入生成对抗网络的具体实例示意图;
图4为本发明实施例中票据图片处理装置的结构示意图;
图5为本发明一实施例的计算机设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
首先,对本发明实施例中的技术名词进行介绍:
生成式对抗网络(GAN,Generative Adversarial Networks)是一种深度学习模型,模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出。原始GAN理论中,并不要求G和D都是神经网络,只需要是能拟合相应生成和判别的函数即可,但实用中一般均使用深度神经网络作为G和D。
下面以生成图片为例说明GAN的基本原理,假设有两个网络,G(Generator)和D(Discriminator),它们的功能分别是:G是一个生成图片的网络,它接收一个随机的噪声z,通过这个噪声生成图片,记做G(z);D是一个判别网络,判别一张图片是不是“真实的”。例如它的输入参数是a,a代表一张图片,输出D(a)代表a为真实图片的概率,如果为1,就代表100%是真实的图片,而输出为0,就代表不可能是真实的图片;在训练过程中,生成网络G的目标就是尽量生成真实的图片去欺骗判别网络D。而D的目标就是尽量把G生成的图片和真实的图片分别开来。这样,G和D构成了一个动态的“博弈过程”。
如前所述,目前的票据识别技术较差,当票据存在水印遮挡时,OCR技术的准确率则会大大降低,从而影响到数万张票据的识别,为了去除票据图片的水印,提高票据图片识别的准确率,降低票据图片识别的成本,本发明实施例提供了一种票据图片处理方法。
图1为本发明实施例中票据图片处理方法的处理流程图。如图1所示,本发明实施例中票据图片处理方法可以包括:
步骤101、获取多张无水印的票据图片,加盖水印后建立训练集和测试集,所述训练集和测试集包含带水印票据图片和对应的无水印票据图片;
步骤102、将训练集中的带水印票据图片输入生成对抗网络中的生成器,输出对应的去除水印票据图片;
步骤103、分别将带水印票据图片和对应的去除水印票据图片标记为负样本、将带水印票据图片和对应的无水印票据图片标记为正样本,输入生成对抗网络中的判别器分别输出负样本对应的判别结果和正样本对应的判别结果;
步骤104、根据负样本对应的判别结果和正样本对应的判别结果,采用损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器;
步骤105、将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器;
步骤106、根据测试集对训练好的生成对抗网络进行测试,利用通过测试的生成对抗网络去除票据图片的水印。
具体实施时,首先可以获取多张无水印的票据图片,对无水印的票据图片加盖水印获得对应带水印的票据图片,根据无水印票据图片及其对应带水印票据图片建立训练集和测试集。
在一个实施例中,获取多张无水印的票据图片,加盖水印后建立训练集和测试集,可以包括:对加盖水印的票据图片进行数据增强,得到训练集和测试集的数据。
在一个实施例中,对加盖水印的票据图片进行数据增强,得到训练集和测试集的数据,可以包括:移动水印到票据图片的不同位置;在移动过程中,随机改变水印的透明度、对比度、模糊度中任一项或几项参数;改变水印参数后,获得各种不同水印的票据图片,得到训练集和测试集的数据。
具体实施时,在样本数据较少的情况下,随着神经网络的加深,可以通过数据增强防止过拟合,提高模型的泛化能力。可以利用几何变换、颜色变换等对样本数据本身进行操作,在本发明实施例中,可以对加盖水印的票据图片进行几何变换,包括翻转,旋转,裁剪,变形,缩放等各类操作;还可以改变加盖水印的票据图片的颜色,以及对应水印的透明度、对比度、模糊度等,从而获得各种不同水印的票据图片,得到训练集和测试集的数据。
对加盖水印的票据图片进行数据增强,得到训练集和测试集的数据之后,可以将训练集中的带水印票据图片输入生成对抗网络中的生成器,生成器对带水印票据图片进行去水印处理,输出对应的去除水印票据图片;然后,可以分别将带水印票据图片和对应的去除水印票据图片标记为负样本、将带水印票据图片和对应的无水印票据图片标记为正样本,输入生成对抗网络中的判别器,分别输出负样本对应的判别结果和正样本对应的判别结果。
具体实施时,例如可以以G代表生成器,以D代表判别器,x代表带水印票据图片,则G(x)代表生成器输出的去除水印票据图片,y代表带水印票据图片对应的无水印票据图片;
图2为本发明实施例中将负样本输入生成对抗网络的具体实例示意图,如图2所示,将训练集中的带水印票据图片x输入生成对抗网络GAN中的生成器G,生成器G可以对带水印票据图片x进行去水印处理,输出对应的去除水印票据图片G(x);然后,可以将带水印票据图片x和对应的去除水印票据图片G(x)标记为负样本,再将负样本(x,G(x))输入生成对抗网络GAN中的判别器,输出负样本对应的判别结果D(x,G(x));
图3为本发明实施例中将正样本输入生成对抗网络的具体实例示意图,如图3所示,将带水印票据图片x和对应的无水印票据图片y标记为正样本,再将正样本(x,y)输入生成对抗网络GAN中的判别器,输出正样本对应的判别结果D(x,y)。
本发明实施例中将带水印票据图片x作为判别器D输入样本的一部分,目的在于,输入的带水印票据图片x和最终的去水印票据图片G(x)之间存在非常强的关联关系,前者相对于后者只是在某些位置多了一些噪声干扰,即输入的带水印票据图片x中包含大量最终结果的特征,若单独将去水印票据图片G(x)和无水印票据图片y输入判别器D,可能导致大量有效信息的遗失,进而影响到模型判断能力。
虽然将带水印票据图片x作为判别器D输入样本的一部分,但是带水印票据图片x目的在于为结果提供原始带水印票据图片和最终无水印票据图片之间的相同特征,并不对样本标签产生影响,样本标签的正负由去除水印票据图片G(x),和无水印票据图片y决定,G(x)为生成器生成的图片,不是真实图片,所以(x,G(x))对应样本标签为负;y为原始无水印票据图片,是真实图片,所以(x,y)对应样本标签为正。
在一个实施例中,将训练集中的带水印票据图片输入生成对抗网络中的生成器,输出对应的去除水印票据图片,可以包括:采用图像语义分割网络U-Net作为生成对抗网络中的生成器,在特征提取时滤除带水印票据图片中的水印信息,输出对应的去除水印票据图片。
在一个实施例中,分别将带水印票据图片和对应的去除水印票据图片标记为负样本、将带水印票据图片和对应的无水印票据图片标记为正样本,输入生成对抗网络中的判别器,分别输出负样本对应的判别结果和正样本对应的判别结果,可以包括:
采用Sigmoid函数作为生成对抗网络中的判别器的激活函数,将判别器分别输出负样本对应的判别结果和正样本对应的判别结果,映射到0,1之间进行二分类。
具体实施时,仍以上述内容为例,在本发明实施例中,判别器D输出的负样本对应的判别结果为D(x,G(x)),输出正样本对应的判别结果为D(x,y),其中,判别结果可以为(0,1)之间的一个数值,若输出值为1,代表输入判别器D的图片为100%是真实的图片,在实施例中D(x,G(x))的对应值为0;若输出值为0,代表输入判别器D的图片不可能是真实的图片,在实施例中D(x,y)的对应值为1;若输出值为0.5,则代表判别器D难以判定输入判别器D的图片是否为真实的图片,即达到了票据图片处理最终目的,生成去除水印的图片,要实现此目的可以通过对生成对抗网络GAN中的生成器G和判别器D进行训练,得到优化后的生成器G和判别器D。
在一个实施例中根据负样本对应的判别结果和正样本对应的判别结果,采用损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器,可以包括:
根据负样本对应的判别结果和正样本对应的判别结果,采用Cross Entropy损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器;
将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器,可以包括:
将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用CrossEntropy损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器。
具体实施时,对生成对抗网络GAN进行优化,首先可以优化判别器D,由于判别器D的好坏与生成器G的关系不大,有正负样本的存在就可以对判别器D进行优化,所以可以将上述步骤获得的正负样本(x,G(x))、(x,y)输入判别器D,得到对应的判别结果为D(x,G(x))、D(x,y),由前述内容可知D(x,G(x))的对应值应该为0,D(x,y)的对应值应该为1,可以采用例如Cross Entropy损失函数计算判别器的损失值,即判别器D真实输出的判别结果D(x,G(x))和D(x,y),分别与0,1之间的差距值,可以根据根据损失值更新判别器D的参数,利用更新的判别器D继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器D的损失值小于预设阈值,最终可以得到优化的判别器D;
在对生成器G进行优化时,由于优化生成对抗网络GAN的目的是生成尽可能真实的图片,所以判断生成器G是否优化成功,需要结合判别器D对生成器G生成的图片进行判别,因此可以在得到优化的判别器D之后再对生成器G进行优化;由于前述正负样本是为训练判别器D建立的,与训练生成器G并无直接关系,所以可以利用判别器D反向更新生成器G的参数,此时可以固定判别器D的参数,将生成器G输出的本应为负样本的去除水印票据图片G(x),标记为正样本,输入优化后判别器D,从而产生误差,同样可以采用Cross Entropy损失函数计算判别器的损失值,根据损失值更新生成器参数,使得生成器G生成的负样本逐渐接近正样本,利用更新的生成器G继续输出去除水印票据图片,标记为正样本,输入优化后固定器参数的判别器D,直到计算出判别器D的损失值小于预设阈值,最终可以得到优化的生成器G。
在一个实施例中,可以根据测试集对训练好的生成对抗网络进行测试,利用通过测试的生成对抗网络去除票据图片的水印。
本发明实施例中还提供了一种票据图片处理装置,如下面的实施例所述。由于该装置解决问题的原理与票据图片处理方法相似,因此该装置的实施可以参见票据图片处理方法的实施,重复之处不再赘述。
图4为本发明实施例中票据图片处理装置的结构示意图。如图4所示,本发明实施例中票据图片处理装置具体可以包括:
建立模块401,用于获取多张无水印的票据图片,加盖水印后建立训练集和测试集,所述训练集和测试集包含带水印票据图片和对应的无水印票据图片;
生成模块402,用于将训练集中的带水印票据图片输入生成对抗网络中的生成器,输出对应的去除水印票据图片;
判别模块403,用于分别将带水印票据图片和对应的去除水印票据图片标记为负样本、将带水印票据图片和对应的无水印票据图片标记为正样本,输入生成对抗网络中的判别器分别输出负样本对应的判别结果和正样本对应的判别结果;
判别器优化模块404,用于根据负样本对应的判别结果和正样本对应的判别结果,采用损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器;
生成器优化模块405,用于将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器;
测试与去除水印模块406,用于根据测试集对训练好的生成对抗网络进行测试,利用通过测试的生成对抗网络去除票据图片的水印。
在一个实施例中,建立模块401具体用于:
对加盖水印的票据图片进行数据增强,得到训练集和测试集的数据。
在一个实施例中,建立模块401具体用于:
移动水印到票据图片的不同位置;
在移动过程中,随机改变水印的透明度、对比度、模糊度中任一项或几项参数;
改变水印参数后,获得各种不同水印的票据图片,得到训练集和测试集的数据。
在一个实施例中,生成模块402具体用于:
采用图像语义分割网络U-Net作为生成对抗网络中的生成器,在特征提取时滤除带水印票据图片中的水印信息,输出对应的去除水印票据图片。
在一个实施例中,判别模块403具体用于:
采用Sigmoid函数作为生成对抗网络中的判别器的激活函数,将判别器分别输出负样本对应的判别结果和正样本对应的判别结果,映射到0,1之间进行二分类。
在一个实施例中,判别器优化模块404具体用于:
根据负样本对应的判别结果和正样本对应的判别结果,采用Cross Entropy损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器;
生成器优化模块405具体用于:
将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用CrossEntropy损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器。
基于前述发明构思,如图5所示,本发明还提出了一种计算机设备500,包括存储器510、处理器520及存储在存储器510上并可在处理器520上运行的计算机程序530,所述处理器520执行所述计算机程序530时实现前述票据图片处理方法。
基于前述发明构思,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述票据图片处理方法的计算机程序。
综上所述,本发明实施例中,获取多张无水印的票据图片,加盖水印后建立训练集和测试集,所述训练集和测试集包含带水印票据图片和对应的无水印票据图片;将训练集中的带水印票据图片输入生成对抗网络中的生成器,输出对应的去除水印票据图片;分别将带水印票据图片和对应的去除水印票据图片标记为负样本、将带水印票据图片和对应的无水印票据图片标记为正样本,输入生成对抗网络中的判别器,分别输出负样本对应的判别结果和正样本对应的判别结果;根据负样本对应的判别结果和正样本对应的判别结果,采用损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器;将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器,可以去除票据图片的水印,提高票据图片识别的准确率,降低票据图片识别的成本。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (14)
1.一种票据图片处理方法,其特征在于,包括:
获取多张无水印的票据图片,加盖水印后建立训练集和测试集,所述训练集和测试集包含带水印票据图片和对应的无水印票据图片;
将训练集中的带水印票据图片输入生成对抗网络中的生成器,输出对应的去除水印票据图片;
分别将带水印票据图片和对应的去除水印票据图片标记为负样本、将带水印票据图片和对应的无水印票据图片标记为正样本,输入生成对抗网络中的判别器,分别输出负样本对应的判别结果和正样本对应的判别结果;
根据负样本对应的判别结果和正样本对应的判别结果,采用损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器;
将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器;
根据测试集对训练好的生成对抗网络进行测试,利用通过测试的生成对抗网络去除票据图片的水印。
2.如权利要求1所述的方法,其特征在于,获取多张无水印的票据图片,加盖水印后建立训练集和测试集,包括:
对加盖水印的票据图片进行数据增强,得到训练集和测试集的数据。
3.如权利要求2所述的方法,其特征在于,对加盖水印的票据图片进行数据增强,得到训练集和测试集的数据,包括:
移动水印到票据图片的不同位置;
在移动过程中,随机改变水印的透明度、对比度、模糊度中任一项或几项参数;
改变水印参数后,获得各种不同水印的票据图片,得到训练集和测试集的数据。
4.如权利要求1所述的方法,其特征在于,将训练集中的带水印票据图片输入生成对抗网络中的生成器,输出对应的去除水印票据图片,包括:
采用图像语义分割网络U-Net作为生成对抗网络中的生成器,在特征提取时滤除带水印票据图片中的水印信息,输出对应的去除水印票据图片。
5.如权利要求1所述的方法,其特征在于,分别将带水印票据图片和对应的去除水印票据图片标记为负样本、将带水印票据图片和对应的无水印票据图片标记为正样本,输入生成对抗网络中的判别器,分别输出负样本对应的判别结果和正样本对应的判别结果,包括:
采用Sigmoid函数作为生成对抗网络中的判别器的激活函数,将判别器分别输出负样本对应的判别结果和正样本对应的判别结果,映射到0,1之间进行二分类。
6.如权利要求1所述的方法,其特征在于,根据负样本对应的判别结果和正样本对应的判别结果,采用损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器,包括:
根据负样本对应的判别结果和正样本对应的判别结果,采用Cross Entropy损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器;
将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器,包括:
将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用CrossEntropy损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器。
7.一种票据图片处理装置,其特征在于,包括:
建立模块,用于获取多张无水印的票据图片,加盖水印后建立训练集和测试集,所述训练集和测试集包含带水印票据图片和对应的无水印票据图片;
生成模块,用于将训练集中的带水印票据图片输入生成对抗网络中的生成器,输出对应的去除水印票据图片;
判别模块,用于分别将带水印票据图片和对应的去除水印票据图片标记为负样本、将带水印票据图片和对应的无水印票据图片标记为正样本,输入生成对抗网络中的判别器,分别输出负样本对应的判别结果和正样本对应的判别结果;
判别器优化模块,用于根据负样本对应的判别结果和正样本对应的判别结果,采用损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器;
生成器优化模块,用于将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器;
测试与去除水印模块,用于根据测试集对训练好的生成对抗网络进行测试,利用通过测试的生成对抗网络去除票据图片的水印。
8.如权利要求7所述的装置,其特征在于,建立模块具体用于:
对加盖水印的票据图片进行数据增强,得到训练集和测试集的数据。
9.如权利要求8所述的装置,其特征在于,建立模块具体用于:
移动水印到票据图片的不同位置;
在移动过程中,随机改变水印的透明度、对比度、模糊度中任一项或几项参数;
改变水印参数后,获得各种不同水印的票据图片,得到训练集和测试集的数据。
10.如权利要求7所述的装置,其特征在于,生成模块具体用于:
采用图像语义分割网络U-Net作为生成对抗网络中的生成器,在特征提取时滤除带水印票据图片中的水印信息,输出对应的去除水印票据图片。
11.如权利要求7所述的装置,其特征在于,判别模块具体用于:
采用Sigmoid函数作为生成对抗网络中的判别器的激活函数,将判别器分别输出负样本对应的判别结果和正样本对应的判别结果,映射到0,1之间进行二分类。
12.如权利要求7所述的装置,其特征在于,判别器优化模块具体用于:
根据负样本对应的判别结果和正样本对应的判别结果,采用Cross Entropy损失函数计算判别器的损失值,根据损失值更新判别器参数,在判别器的损失值不小于预设阈值时,利用更新的判别器继续输出负样本对应的判别结果和正样本对应的判别结果,直到计算出判别器的损失值小于预设阈值,得到优化的判别器;
生成器优化模块具体用于:
将生成器输出的去除水印票据图片标记为正样本,输入优化的判别器,采用CrossEntropy损失函数计算优化的判别器的损失值,根据损失值更新生成器参数,在优化的判别器的损失值不小于预设阈值时,利用更新的生成器继续输出去除水印票据图片,标记为正样本,输入优化的判别器,直到计算出优化的判别器的损失值小于预设阈值,得到优化的生成器。
13.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一所述方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至6任一所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110968927.4A CN113591856A (zh) | 2021-08-23 | 2021-08-23 | 票据图片处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110968927.4A CN113591856A (zh) | 2021-08-23 | 2021-08-23 | 票据图片处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113591856A true CN113591856A (zh) | 2021-11-02 |
Family
ID=78238947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110968927.4A Pending CN113591856A (zh) | 2021-08-23 | 2021-08-23 | 票据图片处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113591856A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110599387A (zh) * | 2019-08-08 | 2019-12-20 | 北京邮电大学 | 一种自动去除图片水印的方法及装置 |
CN111105336A (zh) * | 2019-12-04 | 2020-05-05 | 山东浪潮人工智能研究院有限公司 | 一种基于对抗网络的图像去水印的方法 |
CN112215276A (zh) * | 2020-09-30 | 2021-01-12 | 深圳壹账通智能科技有限公司 | 一种对抗网络的训练方法、装置、电子设备和存储介质 |
CN112330522A (zh) * | 2020-11-09 | 2021-02-05 | 深圳市威富视界有限公司 | 水印去除模型训练方法、装置、计算机设备和存储介质 |
CN113222800A (zh) * | 2021-04-12 | 2021-08-06 | 国网江苏省电力有限公司营销服务中心 | 一种基于深度学习的鲁棒图像水印嵌入与提取方法及系统 |
-
2021
- 2021-08-23 CN CN202110968927.4A patent/CN113591856A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110599387A (zh) * | 2019-08-08 | 2019-12-20 | 北京邮电大学 | 一种自动去除图片水印的方法及装置 |
CN111105336A (zh) * | 2019-12-04 | 2020-05-05 | 山东浪潮人工智能研究院有限公司 | 一种基于对抗网络的图像去水印的方法 |
CN112215276A (zh) * | 2020-09-30 | 2021-01-12 | 深圳壹账通智能科技有限公司 | 一种对抗网络的训练方法、装置、电子设备和存储介质 |
CN112330522A (zh) * | 2020-11-09 | 2021-02-05 | 深圳市威富视界有限公司 | 水印去除模型训练方法、装置、计算机设备和存储介质 |
CN113222800A (zh) * | 2021-04-12 | 2021-08-06 | 国网江苏省电力有限公司营销服务中心 | 一种基于深度学习的鲁棒图像水印嵌入与提取方法及系统 |
Non-Patent Citations (2)
Title |
---|
双锴: "计算机视觉", 31 January 2020, 北京:北京邮电大学出版社, pages: 152 - 153 * |
吴剑: "深度学习与深度合成", 31 October 2020, 北京:中国纺织出版社有限公司, pages: 128 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110852316B (zh) | 一种采用密集结构卷积网络的图像篡改检测和定位方法 | |
CN111783505A (zh) | 伪造人脸的识别方法、装置和计算机可读存储介质 | |
CN110287125A (zh) | 基于图像识别的软件例行化测试方法及装置 | |
Mazumdar et al. | Universal image manipulation detection using deep siamese convolutional neural network | |
CN113191358A (zh) | 金属零件表面文本检测方法和系统 | |
CN112508000B (zh) | 一种用于ocr图像识别模型训练数据生成的方法及设备 | |
CN113591856A (zh) | 票据图片处理方法及装置 | |
CN111325207A (zh) | 基于预处理的票据识别方法及装置 | |
CN111639718B (zh) | 分类器应用方法及装置 | |
CN114663731A (zh) | 车牌检测模型的训练方法及系统、车牌检测方法及系统 | |
CN114512052A (zh) | 融合遥感影像和轨迹数据的分歧合流路口生成方法及装置 | |
CN117495711B (zh) | 图像标记去除方法、装置、设备及存储介质 | |
Jin et al. | Cutout as augmentation in contrastive learning for detecting burn marks in plastic granules | |
CN117593648B (zh) | 基于弱监督学习的遥感目标建筑物提取方法 | |
CN112652059B (zh) | 基于Mesh R-CNN模型改进的目标检测与三维重构方法 | |
Fenton et al. | Enhanced computer vision using automated optimized neural network image pre-processing | |
CN109190627A (zh) | 一种基于稀疏表示的车牌识别方法 | |
Semwal et al. | Copy move image forgery detection using machine learning | |
CN117953206A (zh) | 一种基于点标注指引的混合监督目标检测方法及装置 | |
CN117556884A (zh) | 基于数据增强和特征增强的自监督对比学习方法及系统 | |
CN114511032A (zh) | 银行后台系统的图片亮度增强方法及装置 | |
CN118014941A (zh) | 织物图像无监督缺陷检测方法及装置 | |
CN116580462A (zh) | 基于聚类决策的深度伪造图像检测方法及相关设备 | |
CN115984290A (zh) | 一种视频目标分割的方法、装置、系统及存储介质 | |
CN115661849A (zh) | 一种报告类型匹配方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |