CN112861906A - 一种图片异常检测的方法及装置 - Google Patents

一种图片异常检测的方法及装置 Download PDF

Info

Publication number
CN112861906A
CN112861906A CN202011634118.1A CN202011634118A CN112861906A CN 112861906 A CN112861906 A CN 112861906A CN 202011634118 A CN202011634118 A CN 202011634118A CN 112861906 A CN112861906 A CN 112861906A
Authority
CN
China
Prior art keywords
picture
detected
neural network
error loss
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011634118.1A
Other languages
English (en)
Inventor
梁新乐
张潮宇
陈天健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202011634118.1A priority Critical patent/CN112861906A/zh
Publication of CN112861906A publication Critical patent/CN112861906A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图片异常检测的方法及装置,该方法包括获取待检测图片,将待检测图片输入到训练好的神经网络模型中,生成第一图片,确定第一图片与所述待检测图片的误差损失是否大于误差损失阈值,若是,则确定待检测图片存在异常。通过使用训练好的神经网络模型和标记有图片正负样本的训练集确定的误差损失阈值来确定待检测图片是否存在异常,相比现有技术中先通过深度学习模型筛选出大概率异常的图片,再经过人工甄别的检测方式,可以实现无需人工参与,降低人工成本,同时由于误差损失阈值是依据训练好的神经网络模型和标记有图片正负样本的训练集确定的,是一个动态值,可以提高图片异常检测的效率和精度。

Description

一种图片异常检测的方法及装置
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种图片异常检测的方法及装置。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技转变,但由于金融行业的安全性、实时性要求,也对技术提出的更高的要求。在金融领域的图片检测技术中,印章真假鉴别是图片检测技术中一个重要的问题。
印章,亦称图章,用作印于文件上表示鉴定或签署的文具。公章使一种法律象征,作为对文件法律效率认可的承诺。公章存在的意义是一种证据。随着市场经济的发展,在与他人或其他组织进行合约或协议的签订时,部分不法分子为了获取更多的利益,从而铤而走险,采用不具有法律效力的印章进行签署。当前情况下,印章的鉴别需要一定的印章知识和经验,并且需要一定量的人力去鉴别。在有些场景中(例如银行借贷中心),每天需要处理较大量的有公章的文件。一般情况下,此类场景需要耗费大量的人力去进行类似的鉴别工作。在满足一定精度的情况下,可以使用深度学习技术对印章进行异常检测,以对印章进行初步的处理并选取存在较大造假风险的印章,进而由人工进行检测。一般来说,基于深度学习的印章造假鉴别可以节省80%的印章鉴别人力,但是还是需要人工参与进行印章造假的检测。
发明内容
本发明实施例提供一种图片异常检测的方法及装置,用以实现自动检测图片异常,无需人工参与,提高图片异常检测的效率和精度。
第一方面,本发明实施例提供一种图片异常检测的方法,包括:
获取待检测图片;
将所述待检测图片输入到训练好的神经网络模型中,生成第一图片;
确定所述第一图片与所述待检测图片的误差损失是否大于误差损失阈值,若是,则确定所述待检测图片存在异常;
其中,所述误差损失阈值是根据所述训练好的神经网络模型和标记有图片正负样本的训练集确定的。
上述技术方案中,通过使用训练好的神经网络模型和标记有图片正负样本的训练集确定的误差损失阈值来确定待检测图片是否存在异常,相比现有技术中先通过深度学习模型筛选出大概率异常的图片,再经过人工甄别的检测方式,可以实现无需人工参与,降低人工成本,同时由于误差损失阈值是依据训练好的神经网络模型和标记有图片正负样本的训练集确定的,是一个动态值,进而可以提高图片异常检测的效率和精度。
可选的,所述将所述待检测图片输入到训练好的神经网络模型中,生成第一图片,包括:
使用所述训练好的神经网络模型中编码器将所述待检测图片编码为一维向量;
使用所述训练好的神经网络模型中解码器对所述一维向量进行解码,生成所述第一图片。
上述技术方案中,通过使用训练好的神经网络模型中编码器和解码器对待检测图片进行编码和解码后,能够得到重建图片,通过重建图片与待检测图片之间的误差损失来判断待检测图片是否为异常图片,可以提高图片异常检测的精度。
可选的,所述训练好的神经网络模型是使用标记有图片正负样本的图片训练集对预设的神经网络模型进行训练学习得到的,所述方法还包括:
将所述标记有图片正负样本的训练集中的图片正样本输入到所述预设的神经网络模型中,生成第二图片;
确定所述第二图片和所述第二图片对应的图片正样本之间的误差损失以及所述误差损失对所述预设的神经网络模型的权重的梯度;
根据所述误差损失对所述预设的神经网络模型的权重的梯度更新所述预设的神经网络模型,直到所述预设的神经网络模型收敛,得到所述训练好的神经网络模型。
上述技术方案中,通过使用图片正样本来训练预设的神经网络模型,可以实现快速的生成新的图片,提高检测图片差异的效率。使用误差损失和梯度下降算法进行反向传播,能够加快神经网络模型的收敛,提高神经网络模型的训练效率。
可选的,所述将所述标记有图片正负样本的训练集中的图片正样本输入到所述预设的神经网络模型中,生成第二图片,包括:
使用所述预设的神经网络模型中编码器将所述图片正样本编码为一维向量;
使用所述预设的神经网络模型中解码器对所述一维向量进行解码,生成所述第二图片。
上述技术方案中,通过使用预设的神经网络模型中编码器和解码器对待检测图片进行编码和解码后,能够得到重建图片,通过重建图片与待检测图片之间的误差损失和误差损失对预设的神经网络模型的权重的梯度,可以更新预设的神经网络模型中编码器和解码器中的参数,从而实现对预设的神经网络模型进行训练。
可选的,所述确定所述第二图片和所述第二图片对应的图片正样本之间的误差损失,包括:
将所述第二图片和所述第二图片对应的图片正样本输入到预设的损失函数中,计算出所述第二图片和所述第二图片对应的图片正样本之间的误差损失。
上述技术方案中,通过计算两个图片之间的误差损失,能够快速获知两个图片之间的误差,从而能够提高图片异常检测效率。
可选的,所述根据所述训练好的神经网络模型和标记有图片正负样本的训练集确定所述误差损失阈值,包括:
将所述标记有图片正负样本的训练集中的图片正样本输入到所述训练好的神经网络模型中,生成第三图片;将所述标记有图片正负样本的训练集的图片负样本输入到所述训练好的神经网络模型中,生成第四图片;
确定所述图片正样本与所述图片正样本对应的第三图片的误差损失以及所述图片负样本与所述图片负样本对应的第四图片的误差损失;
根据所述图片正样本与所述图片正样本对应的第三图片的误差损失以及所述图片负样本与所述图片负样本对应的第四图片的误差损失的分布,确定所述误差损失阈值。
上述技术方案中,通过计算图片正负样本与图片正负样本各自对应的新生的图片的误差损失,来确定最终的误差损失阈值,可以提高在检测图片是否存在异常时的检测精度。
可选的,所述方法还包括:
若所述第一图片与所述待检测图片的误差损失不大于所述误差损失阈值,则确定所述待检测图片为正常图片。
上述技术方案中,由于是对比的误差损失与误差损失阈值,若待检测图片存在异常,误差损失与误差损失阈值差距会比较大,也就比较容易检测出存在异常的图片,相比现有技术中通过深度学习模型来粗略的检测异常图片的方式,能够提高异常检测的效率和精度。
可选的,所述待检测图片为待检测印章图片;所述训练好的神经网络模型为印章鉴别模型,所述将所述待检测图片输入到训练好的神经网络模型中,生成第一图片包括:
将所述待检测印章图片输入到所述印章鉴别模型中,生成印章鉴别参考图像,所述印章鉴别参考图像是所述印章鉴别模型对印章特征编码向量进行解码生成的,所述印章特征编码向量是所述印章鉴别模型对所述待检测印章图片进行特征编码得到的;
所述确定所述第一图片与所述待检测图片的误差损失是否大于误差损失阈值,若是,则确定所述待检测图片存在异常,包括:
确定所述印章鉴别参考图像与所述待检测印章图片的误差损失是否大于误差损失阈值,若是,则确定所述待检测印章图片中的印章为异常印章。
上述技术方案中,通过印章鉴别模型对待检测印章图片进行编码和解码后得到的印章鉴别参考图像,然后使用印章鉴别参考图像与待检测印章图片的误差损失与误差损失阈值进行对比,来确定待检测印章图片中的印章是否为异常印章。可以实现鉴别印章图片无需人工参与,降低人工成本,同时由于误差损失阈值是依据印章鉴别模型和标记有图片正负样本的训练集确定的,是一个动态值,进而可以提高图片异常检测的效率和精度。
第二方面,本发明实施例提供一种图片异常检测的装置,包括:
获取单元,用于获取待检测图片;
处理单元,用于将所述待检测图片输入到训练好的神经网络模型中,生成第一图片;确定所述第一图片与所述待检测图片的误差损失是否大于误差损失阈值,若是,则确定所述待检测图片存在异常;其中,所述误差损失阈值是根据所述训练好的神经网络模型和标记有图片正负样本的训练集确定的。
可选的,所述处理单元具体用于:
使用所述训练好的神经网络模型中编码器将所述待检测图片编码为一维向量;
使用所述训练好的神经网络模型中解码器对所述一维向量进行解码,生成所述第一图片。
可选的,所述处理单元还用于:
将所述标记有图片正负样本的训练集中的图片正样本输入到所述预设的神经网络模型中,生成第二图片;
确定所述第二图片和所述第二图片对应的图片正样本之间的误差损失以及所述误差损失对所述预设的神经网络模型的权重的梯度;
根据所述误差损失对所述预设的神经网络模型的权重的梯度更新所述预设的神经网络模型,直到所述预设的神经网络模型收敛,得到所述训练好的神经网络模型。
可选的,所述处理单元具体用于:
使用所述预设的神经网络模型中编码器将所述图片正样本编码为一维向量;
使用所述预设的神经网络模型中解码器对所述一维向量进行解码,生成所述第二图片。
可选的,所述处理单元具体用于:
将所述第二图片和所述第二图片对应的图片正样本输入到预设的损失函数中,计算出所述第二图片和所述第二图片对应的图片正样本之间的误差损失。
可选的,所述处理单元具体用于:
将所述标记有图片正负样本的训练集中的图片正样本输入到所述训练好的神经网络模型中,生成第三图片;将所述标记有图片正负样本的训练集的图片负样本输入到所述训练好的神经网络模型中,生成第四图片;
确定所述图片正样本与所述图片正样本对应的第三图片的误差损失以及所述图片负样本与所述图片负样本对应的第四图片的误差损失;
根据所述图片正样本与所述图片正样本对应的第三图片的误差损失以及所述图片负样本与所述图片负样本对应的第四图片的误差损失的分布,确定所述误差损失阈值。
可选的,所述处理单元还用于:
若所述第一图片与所述待检测图片的误差损失不大于所述误差损失阈值,则确定所述待检测图片为正常图片。
可选的,所述待检测图片为待检测印章图片;所述训练好的神经网络模型为印章鉴别模型;
所述处理单元具体用于:
将所述待检测印章图片输入到所述印章鉴别模型中,生成印章鉴别参考图像,所述印章鉴别参考图像是所述印章鉴别模型对印章特征编码向量进行解码生成的,所述印章特征编码向量是所述印章鉴别模型对所述待检测印章图片进行特征编码得到的;
确定所述印章鉴别参考图像与所述待检测印章图片的误差损失是否大于误差损失阈值,若是,则确定所述待检测印章图片中的印章为异常印章。
第三方面,本发明实施例还提供一种计算机程序产品,包括计算机程序指令,当计算机读取并执行所述计算机程序指令时,使得计算机执行上述图片异常检测的方法。
第四方面,本发明实施例还提供一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述图片异常检测的方法。
第五方面,本发明实施例还提供一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述图片异常检测的方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种系统架构的示意图;
图2为本发明实施例提供的一种图片异常检测的方法的流程示意图;
图3为本发明实施例提供的一种神经网络模型的训练的示意图;
图4为本发明实施例提供的一种异常检测的示意图;
图5为本发明实施例提供的一种图片异常检测的装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种系统架构。如图1所示,该系统架构可以为服务器100,该服务器100可以包括处理器110、通信接口120和存储器130。
其中,通信接口120用于与终端设备进行通信,收发该终端设备传输的信息,实现通信。
处理器110是服务器100的控制中心,利用各种接口和线路连接整个服务器100的各个部分,通过运行或执行存储在存储器130内的软件程序/或模块,以及调用存储在存储器130内的数据,执行服务器100的各种功能和处理数据。可选地,处理器110可以包括一个或多个处理单元。
存储器130可用于存储软件程序以及模块,处理器110通过运行存储在存储器130的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器130可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据业务处理所创建的数据等。此外,存储器130可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
需要说明的是,上述图1所示的结构仅是一种示例,本发明实施例对此不做限定。
基于上述描述,图2详细的示出了本发明实施例提供的一种图片异常检测的方法的流程,该流程可以由图片异常检测的方法的装置执行,该装置可以为上述服务器或位于上述服务器内。
如图2所示,该流程具体包括:
步骤201,获取待检测图片。
在本发明实施例中,该待检测图片可以是印章图片,或者是其它需要检测异常或能够进行图片造假的异常检测。
步骤202,将所述待检测图片输入到训练好的神经网络模型中,生成第一图片。
该训练好的神经网络模型是使用标记有图片正负样本的训练集对预设的神经网络模型进行训练学习得到的,具体的,首先将标记有图片正负样本的训练集中的图片正样本输入到预设的神经网络模型中,生成第二图片。然后确定第二图片和第二图片对应的图片正样本之间的误差损失以及误差损失对预设的神经网络模型的权重的梯度。最后根据误差损失对预设的神经网络模型的权重的梯度更新预设的神经网络模型,直到预设的神经网络模型收敛,得到训练好的神经网络模型。
其中,可以使用误差损失对该第二图片求偏导的方式来得到误差损失对预设的神经网络模型的权重的梯度。
该图片的正负样本中的正样本可以是正确的印章图片,例如可以包括3000张正确的印章图片。该图片的正负样本中的负样本可以是存在异常的图片,例如可以包括2000张印章造假的图片。正样本的数量和负样本的数量可以不同。
得到正负样本后,就可以将图片正样本依次输入到预设的神经网络模型中,该神经网络模型可以是VAE(Variational Auto-Encoder,变分自编码器)模型。图片正样本输入到VAE模型后经过编码和解码,可以得到输入的图片正样本对应的新生成的图片,即上述第二图片。具体的过程是先使用编码器将图片正样本编码为一维向量,再将该一维向量使用解码器进行解码,得到新生成的图片,即第二图片。该新生成的图片为重建图片。该第二图片为使用VAE模型将图片正样本进行编码和解码后,生成的图片,该第二图片与输入到VAE模型中图片正样本一一对应。例如,图片正样本1对应第二图片1,图片正样本2对应第二图片2,图片正样本3对应第二图片3,依次类推。
编码器在将图片正样本编码为一维向量时,通过提取图片正样本的特征将图片正样本编码为一维向量,该一维向量需要服从先验分布,如正态分布或均匀分布等,然后再使用解码器将该一维向量映射为新生成的图片,即为重建图片,目的是使得重建图片与原始的图片尽量保持一致。
通过使用训练好的神经网络模型中编码器和解码器对待检测图片进行编码和解码后,能够得到重建图片,通过重建图片与待检测图片之间的误差损失来判断待检测图片是否为异常图片,可以提高图片异常检测的精度。
然后再计算该新生成的图片与原始的图片正样本之间的误差损失,并得到误差损失对应VAE模型中各权重参数的更新梯度。最后依据该更新梯度使用梯度下降算法来更新预设的VAE模型,继续下一轮的训练,直到该VAE模型收敛后,就能得到训练好的VAE模型。
VAE模型是自编码模型的一种扩展,其假设编码器输出的一维变量服从一种先验分布,如高斯分布。这样,在训练完VAE模型后,可以通过采样这种先验分布得到一维变量,这个一维变量可能是训练过程中没有出现过的,但是依然能在解码器中通过这个一维变量获得新生成的图片,从而得到一些符合原始图片分布的新样本,从而实现具有生成新样本的能力。
在计算确定第二图片和第二图片对应的图片正样本之间的误差损失时,需要将述第二图片和所述第二图片对应的图片正样本输入到预设的损失函数中,计算出第二图片和第二图片对应的图片正样本之间的误差损失。该预设的损失函数可以依据经验设置。通过计算两个图片之间的误差损失,能够快速获知两个图片之间的误差,从而能够提高图片异常检测效率。
通过上述方法训练得到的VAE模型,能够实现快速的生成原始图片对应的新的图片。
在具体实施过程中,如图3所示的训练过程,其中,Encoder(VAE编码器)是指将原始印章图片编码为一维向量Z的编码器。Decoder(VAE解码器)是指将一维向量Z解码为生成的图片的解码器。mse(Mean Square Error,均方误差)损失是指原始印章图片与Decoder生成的图片的均方误差损失。
具体训练过程如下:
①、将原始印章图片按照设定的批次大小输入VAE模型中,并得到VAE模型生成的图片(VAE的训练过程中只包括正常印章图片)。
②、计算VAE模型生成的图片与原始印章图片之间的均方误差损失,进而得到均方误差损失对VAE模型的权重的梯度,并根据得到的均方误差损失对VAE模型的权重的梯度,使用梯度下降算法对VAE模型中编码器和解码器中的权重进行更新;直到VAE模型收敛,得到训练好的VAE模型。
当得到训练好的神经网络模型之后,还可以计算误差损失阈值,具体可以包括先将标记有图片正负样本的训练集中的图片正样本输入到训练好的神经网络模型中,生成第三图片。将标记有图片正负样本的训练集的图片负样本输入到训练好的神经网络模型中,生成第四图片。然后确定图片正样本与图片正样本对应的第三图片的误差损失以及图片负样本与图片负样本对应的第四图片的误差损失。最后根据图片正样本与图片正样本对应的第三图片的误差损失以及图片负样本与图片负样本对应的第四图片的误差损失的分布,确定误差损失阈值。该误差损失可以是均方误差损失。本发明实施例中的误差损失的计算可以是现有的常规计算方式,不再赘述。当然在实际应用的过程中,也不一定只使用误差损失,也可以考虑其他损失,如合页损失,交叉熵损失、对数损失、指数损失、平方损失、绝对值损失、逻辑回归损失等等,可以在具体实施过程中依据经验来选择。
上述第三图片为图片正样本输入到训练好的神经网络模型中生成的图片,该第三图片与输入到训练好的神经网络模型中的图片正样本一一对应。该第四图片为图片负样本输入到训练好的神经网络模型中生成的图片,该第四图片与输入到训练好的神经网络模型中的图片负样本一一对应。
为了能够精确到的检测出异常的图片,需要计算误差损失阈值,此时需要使用图片负样本。
将训练集中的图片正样本和图片负样本依次输入到上述训练好的VAE模型中,也就是分别将图片正样本和图片负样本进行编码和解码,得到各自新生成的图片。例如,输入3000个正常印章图片和200个异常印章图片,就可以得到3200个新生成的图片。
然后计算各图片正样本和图片负样本与其对应的新生成的图片之间的误差损失,该误差损失可以使用误差损失函数来计算,将两个图片输入到误差损失函数中,主要是计算两个图片上各像素点的误差。通过3200个新生成的图片与3000个正常印章图片和200个异常印章图片的误差损失计算,能够得到3200个误差损失。
最后依据该3200个误差损失的分布情况,来计算误差损失阈值。
也就是说,如图3所示,可以在VAE模型得到充分训练后,进行下述步骤:
③将正常印章图片和异常印章图片输入VAE模型中,并得到各自相应生成的印章图片。
④然后根据输入的图片和相应生成的印章图片,得到所有的均方误差损失(例如3000个正常印章图片和200个异常印章图片计算可以得到3200个均方误差损失)。
⑤最后根据正常印章图片和异常印章图片的均方误差损失分布,计算mse损失阈值。
当得到上述训练好的神经网络模型之后,就可以将待检测图片输入到训练好的神经网络模型中,使用训练好的神经网络模型中编码器将待检测图片编码为一维向量,并使用训练好的神经网络模型中解码器对一维向量进行解码,生成第一图片。具体的编解码过程已在上述实施例中描述,不再赘述。该第一图片为使用训练好的神经网络模型对待检测图片进行编码和解码后生成的图片,该第一图片与待检测图片一一对应。
步骤203,确定所述第一图片与所述待检测图片的误差损失是否大于误差损失阈值,若是,则确定所述待检测图片存在异常。
当得到第一图片之后就可以与待检测图片进行误差损失计算,然后确定误差损失是否大于误差损失阈值,如果大于误差损失阈值,则可以确定该待检测图片存在异常,否则可以确定该待检测图片是正常的图片。
具体的,可以将第一图片和待检测图片输入到上述误差损失函数中进行计算,从而得到第一图片与待检测图片之间的误差损失。
通过对比待检测图片和该待检测图片新生成的图片的误差损失与误差损失阈值之间的差别可以检测出待检测图片是否存在异常。由于是对比的误差损失与误差损失阈值,若待检测图片存在异常,误差损失与误差损失阈值差距会比较大,也就比较容易检测出存在异常的图片,相比现有技术中通过深度学习模型来粗略的检测异常图片的方式,能够提高异常检测的效率和精度。
举例来说,如图4所示的识别过程,具体步骤如下:
①将待检测印章图片输入到VAE网络,并得到相应生成的图片;
②将生成的图片与待检测印章图片输入到均方误差损失函数中,计算得到均方误差损失;
③将得到的均方误差损失与训练过程中得到的mse阈值进行比较;
④如果待检测印章图片的均方误差大于mse阈值,那么就认为该待检测印章图片中的印章存在造假的可能,否则认为该待检测印章图片中印章是正常的。
为了更好的解释本发明实施例,下面将以检测印章图片为例来描述上述图片异常检测的流程。
在本发明实施例中,印章也称为图章,用作印于文件上表示鉴定或签署的文件。随着市场经济的发展,在与他人或其他组织进行合约或协议的签订时,部分不法分子为了获取更多的利益,从而铤而走险,采用不具有法律效力的印章进行签署。此时需要对印章图片中的印章进行鉴定,来确认是否伪造的印章。其中印章图片为加盖有印章的文件的扫描图像。
首先,需要先训练印章鉴别模型,具体的,可以如图3所示的流程:
①、将原始印章图片集中的正常印章图片按照设定的批次大小输入预设的VAE模型中,并得到预设的VAE模型生成的图片。
②、计算预设的VAE模型生成的图片与原始印章图片集中的正常印章图片之间的均方误差损失。再根据均方误差损失对该预设的VAE模型生成的图片求偏导,得到均方误差损失对预设的VAE模型的权重的梯度。并根据得到的均方误差损失对预设的VAE模型的权重的梯度,使用梯度下降算法对预设的VAE模型中编码器和解码器中的权重进行更新;直到预设的VAE模型收敛,得到印章鉴别模型。
其中,将训练集中的原始印章图片中的正常印章图片输入预设的VAE模型中,并得到预设的VAE模型生成的图片时,是使用预设的VAE模型中的编码器对正常印章图片提取印章特征后编码为印章特征编码向量,然后再使用解码器对印章特征编码向量进行解码,得到该预设的VAE模型生成的图片。
在本发明实施例中,该印章特征可以包括印章字体、印章颜色、印章形状、印章角度和印章位置等特征。
其中,对于印章字体,由于当前的法律法规的规定下,印章需采用宋体字,如果印章字体为非宋体字,那么该印章则为伪造的。
对于印章颜色,在实际印章盖戳的过程中,由于印泥不均或用力不稳等原因,印章的颜色是分布不均匀的,如果出现整个印章的颜色是非常整齐的,那么可以认为该印章可能是伪造的。
对于印章形状,印章的字的形状是规规矩矩的长方形,不能出现扭曲,或者其他不规则的形状。其次是印章周围圆圈的形状,一般情况下,由于油墨或印泥不均匀或者用例不问的情况的存在,印章周围经常有一些小缺口,小棱角或者小空白。而如果采用电脑生成印章,就不会有此类现象发生,可以认为是伪造的。
对于印章角度,人为盖章时,大部分的印章是有一部分倾斜的,而电脑制作的印章是非常规整的,由此可以认为非常规整的印章可能是伪造的。
对于印章位置,公章需要盖在有字的地方,且公章压着字才是有效的。如果出现公章盖在空白位置,那么该公章很可能是伪造的。
基于上述印章特征,预设的VAE模型的编码器可以对正常印章图片提取印章特征,并编码为印章特征编码向量。
当经过训练,得到印章鉴别模型后,可以继续确定误差损失阈值,如图3所示,具体包括:
③将原始印章图片集中的正常印章图片和异常印章图片输入VAE模型中,并得到各自相应生成的印章图片。
④然后根据输入的图片正常印章图片和异常印章图片和各自相应生成的印章图片,得到所有正常印章图片的均方误差损失和异常印章图片的均方误差损失。
⑤最后根据正常印章图片和异常印章图片的均方误差损失分布,计算mse损失阈值。
当得到上述印章鉴别模型和上述误差损失阈值后,可以将待检测印章图片输入到该印章鉴别模型中,生成印章鉴别参考图像。其中,该印章鉴别参考图像是印章鉴别模型对印章特征编码向量进行解码生成的,即印章鉴别模型中的解码器对印章特征编码向量进行解码生成的。该印章特征编码向量是印章鉴别模型对待检测印章图片进行特征编码得到的,即印章鉴别模型中的编码器对待检测印章图片进行特征提取和编码,得到该印章特征编码向量。
然后将印章鉴别参考图像与待检测印章图片输入到预设的误差损失函数中,得到印章鉴别参考图像与待检测印章图片的误差损失,确定印章鉴别参考图像与待检测印章图片的误差损失是否大于上述误差损失阈值,若是,则确定待检测印章图片中的印章为异常印章,即为伪造的印章。否则确定待检测印章图片中的印章为正常印章。
本发明实施例中的印章鉴别模型能够直接对原始印章图片进行检测,并给出印章检测的结论,是完全端到端的神经网络模型,不需要其他前后图片处理过程和人为参与。该印章鉴别模型在实际应用的过程中的准确率应该到达70%以上,召回率达到99%以上。其具有如下优势:
1、能够快速对原始印章图片进行检测,完全端到端。
2、在保证一定准确率的同时能够提供极高的召回率,使错误印章不能轻易漏过,节省大量的人力物力。
在本发明实施例中,获取待检测图片;将待检测图片输入到训练好的神经网络模型中,生成第一图片;确定第一图片与待检测图片的误差损失是否大于误差损失阈值,若是,则确定待检测图片存在异常;其中,误差损失阈值是根据训练好的神经网络模型和标记有图片正负样本的训练集确定的。通过使用训练好的神经网络模型和标记有图片正负样本的训练集确定的误差损失阈值来确定待检测图片是否存在异常,相比现有技术中先通过深度学习模型筛选出大概率异常的图片,再经过人工甄别的检测方式,可以实现无需人工参与,降低人工成本,同时由于误差损失阈值是依据训练好的神经网络模型和标记有图片正负样本的训练集确定的,是一个动态值,进而可以提高图片异常检测的效率和精度。
基于相同的技术构思,图5示例性的示出了本发明实施例提供的一种图片异常检测的装置的结构,该装置可以执行图片异常检测的流程。
如图5所示,该装置具体包括:
获取单元501,用于获取待检测图片;
处理单元502,用于将所述待检测图片输入到训练好的神经网络模型中,生成第一图片;确定所述第一图片与所述待检测图片的误差损失是否大于误差损失阈值,若是,则确定所述待检测图片存在异常;其中,所述误差损失阈值是根据所述训练好的神经网络模型和标记有图片正负样本的训练集确定的。
可选的,所述处理单元502具体用于:
使用所述训练好的神经网络模型中编码器将所述待检测图片编码为一维向量;
使用所述训练好的神经网络模型中解码器对所述一维向量进行解码,生成所述第一图片。
可选的,所述处理单元502还用于:
将所述标记有图片正负样本的训练集中的图片正样本输入到所述预设的神经网络模型中,生成第二图片;
确定所述第二图片和所述第二图片对应的图片正样本之间的误差损失以及所述误差损失对所述预设的神经网络模型的权重的梯度;
根据所述误差损失对所述预设的神经网络模型的权重的梯度更新所述预设的神经网络模型,直到所述预设的神经网络模型收敛,得到所述训练好的神经网络模型。
可选的,所述处理单元502具体用于:
使用所述预设的神经网络模型中编码器将所述图片正样本编码为一维向量;
使用所述预设的神经网络模型中解码器对所述一维向量进行解码,生成所述第二图片。
可选的,所述处理单元502具体用于:
将所述第二图片和所述第二图片对应的图片正样本输入到预设的损失函数中,计算出所述第二图片和所述第二图片对应的图片正样本之间的误差损失。
可选的,所述处理单元502具体用于:
将所述标记有图片正负样本的训练集中的图片正样本和图片负样本分别输入到所述训练好的神经网络模型中,生成第三图片;将所述标记有图片正负样本的训练集的图片负样本输入到所述训练好的神经网络模型中,生成第四图片;
确定所述图片正样本与所述图片正样本对应的第三图片的误差损失以及所述图片负样本与所述图片负样本对应的第四图片的误差损失;
根据所述图片正样本与所述图片正样本对应的第三图片的误差损失以及所述图片负样本与所述图片负样本对应的第四图片的误差损失的分布,确定所述误差损失阈值。
可选的,所述处理单元502还用于:
若所述第一图片与所述待检测图片的误差损失不大于所述误差损失阈值,则确定所述待检测图片为正常图片。
可选的,所述待检测图片为待检测印章图片;所述训练好的神经网络模型为印章鉴别模型;
所述处理单元502具体用于:
将所述待检测印章图片输入到所述印章鉴别模型中,生成印章鉴别参考图像,所述印章鉴别参考图像是所述印章鉴别模型对印章特征编码向量进行解码生成的,所述印章特征编码向量是所述印章鉴别模型对所述待检测印章图片进行特征编码得到的;
确定所述印章鉴别参考图像与所述待检测印章图片的误差损失是否大于误差损失阈值,若是,则确定所述待检测印章图片中的印章为异常印章。
基于相同的技术构思,本发明实施例还提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用存储器中存储的程序指令,按照获得的程序执行上述图片异常检测的方法。
基于相同的技术构思,本发明实施例还提供一种计算机程序产品,包括计算机程序指令,当计算机读取并执行所述计算机程序指令时,使得计算机执行上述图片异常检测的方法。
基于相同的技术构思,本发明实施例还提供了一种计算机可读非易失性存储介质,包括计算机可读指令,当计算机读取并执行计算机可读指令时,使得计算机执行上述图片异常检测的方法。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种图片异常检测的方法,其特征在于,包括:
获取待检测图片;
将所述待检测图片输入到训练好的神经网络模型中,生成第一图片;
确定所述第一图片与所述待检测图片的误差损失是否大于误差损失阈值,若是,则确定所述待检测图片存在异常;
其中,所述误差损失阈值是根据所述训练好的神经网络模型和标记有图片正负样本的训练集确定的。
2.如权利要求1所述的方法,其特征在于,所述将所述待检测图片输入到训练好的神经网络模型中,生成第一图片,包括:
使用所述训练好的神经网络模型中编码器将所述待检测图片编码为一维向量;
使用所述训练好的神经网络模型中解码器对所述一维向量进行解码,生成所述第一图片。
3.如权利要求1所述的方法,其特征在于,所述训练好的神经网络模型是使用标记有图片正负样本的训练集对预设的神经网络模型进行训练学习得到的,所述方法还包括:
将所述标记有图片正负样本的训练集中的图片正样本输入到所述预设的神经网络模型中,生成第二图片;
确定所述第二图片和所述第二图片对应的图片正样本之间的误差损失以及所述误差损失对所述预设的神经网络模型的权重的梯度;
根据所述误差损失对所述预设的神经网络模型的权重的梯度更新所述预设的神经网络模型,直到所述预设的神经网络模型收敛,得到所述训练好的神经网络模型。
4.如权利要求3所述的方法,其特征在于,所述将所述标记有图片正负样本的训练集中的图片正样本输入到所述预设的神经网络模型中,生成第二图片,包括:
使用所述预设的神经网络模型中编码器将所述图片正样本编码为一维向量;
使用所述预设的神经网络模型中解码器对所述一维向量进行解码,生成所述第二图片。
5.如权利要求3所述的方法,其特征在于,所述确定所述第二图片和所述第二图片对应的图片正样本之间的误差损失,包括:
将所述第二图片和所述第二图片对应的图片正样本输入到预设的损失函数中,计算出所述第二图片和所述第二图片对应的图片正样本之间的误差损失。
6.如权利要求1所述的方法,其特征在于,所述根据所述训练好的神经网络模型和标记有图片正负样本的训练集确定所述误差损失阈值,包括:
将所述标记有图片正负样本的训练集中的图片正样本输入到所述训练好的神经网络模型中,生成第三图片;将所述标记有图片正负样本的训练集的图片负样本输入到所述训练好的神经网络模型中,生成第四图片;
确定所述图片正样本与所述图片正样本对应的第三图片的误差损失以及所述图片负样本与所述图片负样本对应的第四图片的误差损失;
根据所述图片正样本与所述图片正样本对应的第三图片的误差损失以及所述图片负样本与所述图片负样本对应的第四图片的误差损失的分布,确定所述误差损失阈值。
7.如权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:
若所述第一图片与所述待检测图片的误差损失不大于所述误差损失阈值,则确定所述待检测图片为正常图片。
8.如权利要求1至6任一项所述的方法,其特征在于,所述待检测图片为待检测印章图片;所述训练好的神经网络模型为印章鉴别模型,所述将所述待检测图片输入到训练好的神经网络模型中,生成第一图片,包括:
将所述待检测印章图片输入到所述印章鉴别模型中,生成印章鉴别参考图像,所述印章鉴别参考图像是所述印章鉴别模型对印章特征编码向量进行解码生成的,所述印章特征编码向量是所述印章鉴别模型对所述待检测印章图片进行特征编码得到的;
所述确定所述第一图片与所述待检测图片的误差损失是否大于误差损失阈值,若是,则确定所述待检测图片存在异常,包括:
确定所述印章鉴别参考图像与所述待检测印章图片的误差损失是否大于误差损失阈值,若是,则确定所述待检测印章图片中的印章为异常印章。
9.一种图片异常检测的装置,其特征在于,包括:
获取单元,用于获取待检测图片;
处理单元,用于将所述待检测图片输入到训练好的神经网络模型中,生成第一图片;确定所述第一图片与所述待检测图片的误差损失是否大于误差损失阈值,若是,则确定所述待检测图片存在异常;其中,所述误差损失阈值是根据所述训练好的神经网络模型和标记有图片正负样本的训练集确定的。
10.一种计算机程序产品,其特征在于,包括计算机程序指令,当计算机读取并执行所述计算机程序指令时,使得计算机执行如权利要求1至8任一项所述的方法。
11.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1至8任一项所述的方法。
12.一种计算机可读非易失性存储介质,其特征在于,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行如权利要求1至8任一项所述的方法。
CN202011634118.1A 2020-12-31 2020-12-31 一种图片异常检测的方法及装置 Pending CN112861906A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011634118.1A CN112861906A (zh) 2020-12-31 2020-12-31 一种图片异常检测的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011634118.1A CN112861906A (zh) 2020-12-31 2020-12-31 一种图片异常检测的方法及装置

Publications (1)

Publication Number Publication Date
CN112861906A true CN112861906A (zh) 2021-05-28

Family

ID=76000094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011634118.1A Pending CN112861906A (zh) 2020-12-31 2020-12-31 一种图片异常检测的方法及装置

Country Status (1)

Country Link
CN (1) CN112861906A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505841A (zh) * 2021-07-21 2021-10-15 福建博思软件股份有限公司 一种公章正负样本生成方法、公章验真方法及终端
CN113688889A (zh) * 2021-08-13 2021-11-23 上海商汤智能科技有限公司 异常检测方法、装置、电子设备及计算机可读存储介质
CN113837316A (zh) * 2021-10-13 2021-12-24 山东德普检测技术有限公司 一种基于农产品的异常区域检测方法、装置、设备及介质
CN114549817A (zh) * 2022-02-23 2022-05-27 中国平安人寿保险股份有限公司 一种印章检测方法、装置、计算机设备及存储介质
CN116245666A (zh) * 2023-01-16 2023-06-09 广州尼森网络科技有限公司 一种基于数据处理的费用核算方法及系统
CN116797882A (zh) * 2023-07-04 2023-09-22 上海任意门科技有限公司 一种模型预训练权重获取方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110619618A (zh) * 2018-06-04 2019-12-27 杭州海康威视数字技术股份有限公司 一种表面缺陷检测方法、装置及电子设备
US20200394526A1 (en) * 2019-06-11 2020-12-17 Samsung Electronics Co., Ltd. Method and apparatus for performing anomaly detection using neural network
CN112149757A (zh) * 2020-10-23 2020-12-29 新华三大数据技术有限公司 一种异常检测方法、装置、电子设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110619618A (zh) * 2018-06-04 2019-12-27 杭州海康威视数字技术股份有限公司 一种表面缺陷检测方法、装置及电子设备
US20200394526A1 (en) * 2019-06-11 2020-12-17 Samsung Electronics Co., Ltd. Method and apparatus for performing anomaly detection using neural network
CN112149757A (zh) * 2020-10-23 2020-12-29 新华三大数据技术有限公司 一种异常检测方法、装置、电子设备及存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505841A (zh) * 2021-07-21 2021-10-15 福建博思软件股份有限公司 一种公章正负样本生成方法、公章验真方法及终端
CN113688889A (zh) * 2021-08-13 2021-11-23 上海商汤智能科技有限公司 异常检测方法、装置、电子设备及计算机可读存储介质
CN113837316A (zh) * 2021-10-13 2021-12-24 山东德普检测技术有限公司 一种基于农产品的异常区域检测方法、装置、设备及介质
CN113837316B (zh) * 2021-10-13 2023-12-26 山东德普检测技术有限公司 一种基于农产品的异常区域检测方法、装置、设备及介质
CN114549817A (zh) * 2022-02-23 2022-05-27 中国平安人寿保险股份有限公司 一种印章检测方法、装置、计算机设备及存储介质
CN116245666A (zh) * 2023-01-16 2023-06-09 广州尼森网络科技有限公司 一种基于数据处理的费用核算方法及系统
CN116245666B (zh) * 2023-01-16 2023-09-19 广州尼森网络科技有限公司 一种基于数据处理的费用核算方法及系统
CN116797882A (zh) * 2023-07-04 2023-09-22 上海任意门科技有限公司 一种模型预训练权重获取方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN112861906A (zh) 一种图片异常检测的方法及装置
CN108256591B (zh) 用于输出信息的方法和装置
CN111680690B (zh) 一种文字识别方法及装置
CN112418813B (zh) 基于智能解析识别的aeo资质智能评级管理系统、方法及存储介质
CN115302963B (zh) 一种基于机器视觉的条形码印刷控制方法、系统及介质
CN114387451A (zh) 异常图像检测模型的训练方法、装置及介质
CN110348025A (zh) 一种基于字形的翻译方法、装置、存储介质及电子设备
CN112232336A (zh) 一种证件识别方法、装置、设备及存储介质
CN112508849A (zh) 数字图像拼接检测方法及装置
CN110197140B (zh) 基于文字识别的材料审核方法及设备
CN114241463A (zh) 签名验证方法、装置、计算机设备和存储介质
CN114005019A (zh) 一种翻拍图像识别方法及其相关设备
CN112053343A (zh) 用户图片数据的处理方法、装置、计算机设备及存储介质
CN112883953A (zh) 基于联合学习的卡片识别装置及方法
CN113127863B (zh) 恶意代码的检测方法、装置、计算机设备和存储介质
CN115063405A (zh) 钢材表面缺陷检测的方法、系统、电子设备和存储介质
CN113298102B (zh) 一种目标分类模型的训练方法及装置
CN116416486A (zh) 图像识别方法及系统
CN113744158A (zh) 图像生成方法、装置、电子设备和存储介质
CN112712550A (zh) 一种图像质量评价方法及装置
CN113497781B (zh) 钓鱼网站识别方法、装置和计算机可读存储介质
CN116894843B (zh) 基于感知哈希算法和区块链的普洱茶信息溯源方法
CN117495711B (zh) 图像标记去除方法、装置、设备及存储介质
CN113255683B (zh) 一种基于神经网络的图像分割方法、系统及存储介质
CN113034337B (zh) 图像检测方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination