CN112927219B - 一种图像的检测方法、装置及设备 - Google Patents

一种图像的检测方法、装置及设备 Download PDF

Info

Publication number
CN112927219B
CN112927219B CN202110318767.9A CN202110318767A CN112927219B CN 112927219 B CN112927219 B CN 112927219B CN 202110318767 A CN202110318767 A CN 202110318767A CN 112927219 B CN112927219 B CN 112927219B
Authority
CN
China
Prior art keywords
image
noise
sample
model
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110318767.9A
Other languages
English (en)
Other versions
CN112927219A (zh
Inventor
李昂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202110318767.9A priority Critical patent/CN112927219B/zh
Publication of CN112927219A publication Critical patent/CN112927219A/zh
Application granted granted Critical
Publication of CN112927219B publication Critical patent/CN112927219B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Abstract

本说明书实施例公开了一种图像的检测方法、装置及设备,该方法包括:获取待检测的目标图像;对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差;分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征;将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像。

Description

一种图像的检测方法、装置及设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种图像的检测方法、装置及设备。
背景技术
近年来,基于深度学习的图像补全技术得到了快速发展,与常用的图像补全技术相比,其优势在于:通过大规模数据训练后,能够准确理解图像内容语义,即使面对复杂的图像内容结构或者大面积的图像缺失,也能确保生成的图像补全内容不仅语义结构和周围内容保持一致,而且具有清晰的细节。然而,该类图像补全技术同样会对社会带来潜在的风险和危害。
基于上述内容,图像伪造检测成为当前的研究热点,而目前仍缺少针对基于深度学习的图像补全规则(或图像补全机制)进行图像伪造的检测方法或检测技术,为此,需要提供一种基于深度学习的图像补全的通用检测技术,从而有效识别不同种类的图像补全规则(或图像补全机制)生成的伪造图像。
发明内容
本说明书实施例的目的是提供一种基于深度学习的图像补全的通用检测技术,从而有效识别不同种类的图像补全规则(或图像补全机制)生成的伪造图像。
为了实现上述技术方案,本说明书实施例是这样实现的:
本说明书实施例提供的一种图像的检测方法,所述方法包括:获取待检测的目标图像。对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差。分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征。将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像。
本说明书实施例提供的一种图像的检测装置,所述装置包括:图像获取模块,获取待检测的目标图像。噪声提取模块,对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差。特征提取模块,分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征。补全检测模块,将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像。
本说明书实施例提供的一种图像的检测设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:获取待检测的目标图像。对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差。分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征。将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像。
本说明书实施例还提供了一种存储介质,其中,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:获取待检测的目标图像。对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差。分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征。将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一种图像的检测方法实施例;
图2为本说明书一种待检测图像上传的页面结构示意图;
图3为本说明书另一种图像的检测方法实施例;
图4为本说明书一种第一图像和图像掩模的示意图;
图5为本说明书一种样本图像生成的过程示意图;
图6为本说明书一种图像补全检测模型的内部架构示意图;
图7为本说明书一种图像检测过程的示意图;
图8为本说明书一种图像的检测装置实施例;
图9为本说明书一种图像的检测设备实施例。
具体实施方式
本说明书实施例提供一种图像的检测方法、装置及设备。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
实施例一
如图1所示,本说明书实施例提供一种图像的检测方法,该方法的执行主体可以为服务器或终端设备,其中,该终端设备可以如笔记本电脑或台式电脑等计算机设备,还可以如手机或平板电脑等移动终端设备。该服务器可以是为某项业务(如进行交易的业务或金融业务等)或需要进行风险防控(如基于人脸图像、指纹或虹膜等用户隐私数据的检测、识别或比对等风险防控)的服务器,具体如,该服务器可以是支付业务的服务器,也可以是与金融或即时通讯等相关业务的服务器等。本实施例中的执行主体以服务器为例进行说明,对于执行主体为终端设备的情况,可以参见下述相关内容,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S102中,获取待检测的目标图像。
其中,目标图像可以是任意图像,例如某人的面部图像、指纹图像、虹膜图像,或者,可以是某建筑物的图像,或者,在某时间点时某区域的图像,或者,包括任何动物和/或植物在内的图像等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,最近几年,基于深度学习的图像补全技术得到了快速发展,与常用的图像补全技术相比,其优势在于:通过大规模数据训练后,能够准确理解图像内容语义,即使面对复杂的图像内容结构或者大面积的图像缺失,也能确保生成的图像补全内容不仅语义结构和周围内容保持一致,而且具有清晰的细节。然而,该类图像补全技术同样会对社会带来潜在的风险和危害。例如,对一张完整的人的面部图像中的部分五官进行遮挡,然后使用上述图像补全技术对应的图像补全规则(或图像补全机制)生成替代的图像内容,从而得到一张局部伪造的面部图像,该伪造图像可能被用于攻击人脸识别系统或者制造虚假网络新闻等。
基于上述内容,图像伪造检测成为当前的研究热点,而目前仍缺少针对基于深度学习的图像补全规则(或图像补全机制)进行图像伪造的检测方法或检测技术,通常,上述检测方法往往采用某种特定的图像补全规则(或图像补全机制)生成的图像进行训练,然而目前的基于深度学习的图像补全规则(或图像补全机制)种类多样,对于通过其他种类的图像补全规则(或图像补全机制)生成的图像,在进行图像检测时会导致检测性能严重下降。在实际应用中,图像检测系统通常无法知晓输入的图像究竟包含了使用何种图像补全规则(或图像补全机制)而补全的图像,图像检测系统的泛化性显得尤其重要。
目前专门针对基于深度学习的图像补全技术的识别研究非常缺乏,且面临一个非常突出的挑战,即如何有效提升检测模型的泛化性能。本说明书实施例旨在提出一种基于深度学习的图像补全的通用检测技术,从而有效识别不同种类的图像补全规则(或图像补全机制)生成的伪造图像,具体可以参见下述相关内容:
可以通过多种不同的方式获取待检测的目标图像,具体如,如图2所示,可以预先设定用于上传图像的应用程序,并可以在该应用程序中设置图像上传入口,当用户需要上传待检测的目标图像时,可以启动上述应用程序,并可以查找到上述图像上传入口,通过该图像上传入口可以上传该目标图像,上传完成后,用户的终端设备可以获取目标图像和用户的相关信息,并可以基于目标图像和用户的相关信息生成图像检测请求,将该图像检测请求发送给服务器,从而服务器可以获取到待检测的目标图像。
或者,也可以由用户的终端设备直接将待检测的目标图像发送给服务器进行图像检测,从而服务器可以获取到待检测的目标图像。获取待检测的目标图像的处理具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S104中,对目标图像进行噪声提取处理,得到目标图像对应的噪声残差。
其中,噪声残差可以是图像中除了可显示的图像等主成分之外的图像噪声等。
在实施中,考虑到真实完整的图像与通过图像补全规则进行补全的图像,在图像噪声的分布上存在着本质的区别,通常,当前各种基于深度学习的图像补全规则难以模仿真实完整的图像中硬件(如相机等)留下的噪声,为此,可以利用上述噪声分布的不同来实现图像中是否包含通过图像补全规则而补全的图像的检测。具体地,可以通过多种不同的方式对目标图像进行噪声提取处理,例如,可以设置相应的滤波器(例如可以使用小波基设计一个高通滤波器等),通过该滤波器可以将目标图像中包含的主成分和图像噪声进行分离,从而可以得到目标图像中的图像噪声,进而可以得到目标图像对应的噪声残差。
在实际应用中,除了可以通过上述方式确定目标图像对应的噪声残差外,还可以通过其它多种方式确定目标对象对应的噪声残差,例如,可以预先获取多种不同的样本图像,并可以预先选取适当的算法(如ResNet(Residual Neural Network)网络算法等)构建用于提取图像噪声的模型的架构,然后,可以使用获取的样本图像对上述模型进行训练,最终可以得到训练后的模型。可以使用训练后的模型对目标图像中包含的图像噪声进行提取,得到目标图像对应的噪声残差。除了可以通过上述方式确定目标图像对应的噪声残差外,还可以通过其它多种方式实现,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S106中,分别对目标图像和上述噪声残差进行特征提取,得到目标图像对应的图像特征和上述噪声残差对应的噪声特征。
在实施中,考虑到图像和噪声对应的特征往往不同,为此,可以分别获取图像对应的图像特征和噪声对应的噪声特征,基于此,可以预先设定相应的特征提取算法,其中,针对图像的特征提取算法与针对噪声的特征提取算法可以不同。可以使用预选设定的针对图像的特征提取算法对目标图像进行特征提取,得到目标图像对应的图像特征,并可以使用预选设定的针对噪声的特征提取算法对上述噪声残差进行特征提取,得到上述噪声残差对应的噪声特征。
在步骤S108中,将上述图像特征和上述噪声特征输入到图像补全检测模型中,得到目标图像中是否包含通过图像补全规则而补全的图像。
其中,图像补全检测模型可以是用于对图像中是否包含通过图像补全规则而补全的图像的模型,图像补全检测模型可以基于多种不同的算法构建,例如特征融合算法、特征拼接算法和卷积算法等算法中的一种或多种的组合,具体可以根据实际情况设定,本说明书实施例对此不做限定。图像补全规则可以是任意能够对图像进行补全以得到完整图像的规则,该图像补全规则可以由多种不同的算法所构建,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,考虑到常用的图像补全规则或图像补全技术(即使是基于深度学习的图像补全技术)均难以模仿实际完整图像(或真实图像)中拍摄该图像时使用的硬件所留下的噪声,因此,可以利用图像中的噪声分布是否一致来实现针对图像补全规则的检测。具体地,可以获取多种不同的样本图像,其中可以包括通过多种不同的摄像组件拍摄的图像,以及通过多种不同的图像补全规则分别对某一张或多张图像进行截取,并对截取的部分进行补全处理得到完整的图像等。然后,可以分别对上述样本图像进行噪声提取处理,得到每个样本图像对应的样本噪声残差。针对其中的任一样本图像,可以对该样本图像进行特征提取,得到该样本图像对应的样本图像特征,同时,还可以对该样本图像对应的样本噪声残差进行特征提取,得到该样本噪声残差对应的样本噪声特征。对于剩余的样本图像可以分别执行上述处理,得到剩余的每个样本图像对应的样本图像特征,以及相应的样本噪声残差对应的样本噪声特征。可以基于预先设定的算法构建图像补全检测模型的模型架构,然后,可以基于上述得到的样本图像特征和相应的样本噪声特征对上述构建的图像补全检测模型进行训练,得到训练后的图像补全检测模型。
通过上述步骤S106的处理得到目标图像的图像特征和相应的噪声特征后,可以将上述得到的图像特征和相应的噪声特征输入到上述训练后的图像补全检测模型中,通过训练后的图像补全检测模型的计算,可以得到相应的输出结果,通过该输出结果可以确定目标图像中是否包含通过图像补全规则而补全的图像。
本说明书实施例提供一种图像的检测方法,考虑到通过对待检测的目标图像进行噪声提取处理,得到目标图像对应的噪声残差,然后,分别对目标图像和该噪声残差进行特征提取,得到目标图像对应的图像特征和该噪声残差对应的噪声特征,将该图像特征和该噪声特征输入到图像补全检测模型中,得到目标图像中是否包含通过图像补全规则而补全的图像,由于考虑到常用的图像补全规则或图像补全技术(即使是基于深度学习的图像补全技术)均难以模仿实际完整图像(或真实图像)中拍摄该图像时使用的硬件所留下的噪声,因此,通过上述方式以利用图像中的噪声分布是否一致来实现针对图像补全规则的检测,从而能够有效提升图像补全检测机制的泛化性能,不仅提出了一种基于深度学习的图像补全的通用检测技术,而且能够有效识别不同种类的补全技术生成的伪造图像。
实施例二
如图3所示,本说明书实施例提供一种图像的检测方法,该方法的执行主体可以为服务器或终端设备,其中,该终端设备可以如笔记本电脑或台式电脑等计算机设备,还可以如手机或平板电脑等移动终端设备。该服务器可以是为某项业务(如进行交易的业务或金融业务等)或需要进行风险防控(如基于人脸图像、指纹或虹膜等用户隐私数据的检测、识别或比对等风险防控)的服务器,具体如,该服务器可以是支付业务的服务器,也可以是与金融或即时通讯等相关业务的服务器等。本实施例中的执行主体以服务器为例进行说明,对于执行主体为终端设备的情况,可以参见下述相关内容,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S302中,获取第一图像和用于表征缺失图像区域的图像掩模,第一图像中未包含通过图像补全规则而补全的图像。
其中,第一图像可以是任意图像,具体如用户通过相机或手机等设备中的摄像组件拍摄的图像,或者,也可以是用户从其他用户处获取的图像,且该图像中未包含通过图像补全规则而补全的图像。图像掩模可以包括多种,在实际应用中,图像掩模可以如MASK等,具体可以根据实际情况设定,本说明书实施例对此不做定,具体地,可以基于第一图像的尺寸(如像素尺寸、图像的显示尺寸等),选取相同尺寸的待处理图像掩模,然后,可以确定第一图像中哪个区域或哪些区域的图像需要被去除或被遮挡,例如第一图像为半径为5厘米的圆形图像,如果确定第一图像中以第一图像的圆心为圆心,并以2厘米为半径的圆形区域为图像掩模,即第一图像中以第一图像的圆心为圆心,并以2厘米为半径的圆形区域为缺失图像的区域(即MASK),第一图像中的剩余区域的图像保持不变,如图4所示,其中示出了一个第一图像和一个图像掩模MASK,其中,图像掩模MASK的中心区域A表示第一图像中应该缺失的部分,外侧的环形区域B表示第一图像中保持不变的部分。
在实施中,在实际应用中,可以通过相机等带有摄像组件的设备拍摄一张或多张图像,拍摄的图像即可以作为第一图像,第一图像中仅包含。然后,可以根据实际情况选取或制作符合预设要求的图像掩模,可以基于上述第一图像和图像掩模生成一张经过图形补全规则补全的图像。
在步骤S304中,将第一图像输入到预先训练的生成式对抗网络模型中,得到第一输出图像。
其中,生成式对抗网络模型(Generative Adversarial Network,GAN)是将生成问题视作判别器和生成器这两个网络的对抗和博弈,其中,生成器用于从给定噪声中产生合成数据,判别器用于分辨生成器的输出和真实数据。生成器试图产生更接近真实的数据,相应地,判别器试图更完美地分辨真实数据与生成数据。由此,两个网络在对抗中进步,在进步后继续对抗,由生成式网络得的数据也就越来越完美,逼近真实数据,从而可以生成想要得到的数据(如图像、序列、视频等),本实施例中的生成式对抗网络模型可以为Equal GAN,该Equal GAN的目的可以是使得输出的图像尽可能地和输入图像相似,但用户通过眼睛观察两张图像却无法分辨出两者的不同,但是Equal GAN仍然难以模拟出摄像组件拍摄的真实图像中的噪声分布。
在实施中,可以获取多种不同的样本图像,其中可以包括通过多种不同的摄像组件拍摄的图像等。然后,可以基于预先设定的生成式多抗网络算法构建生成式多抗网络模型的模型架构,然后,可以基于上述得到的样本图像对上述构建的生成式多抗网络模型进行训练,进而对生成式多抗网络中的生成器和判别器中的参数进行训练,最终可以得到训练后的生成式对抗网络模型,其中,训练后的生成式对抗网络模型能够实现目输出的图像尽可能地和输入图像相似,但用户通过眼睛观察两张图像却无法分辨出两者的不同。
通过上述方式训练生成式对抗网络模型后,可以将上述获取的第一图像输入到上述训练后的生成式对抗网络模型中,通过训练后的生成式对抗网络模型中的生成器和判别器对上述第一图像进行处理,最终可以得到处理后的图像,并可以将该图像作为生成式对抗网络模型的输出图像(即第一输出图像),其中,对于第一输出图像和第一图像,用户通过眼睛观察两张图像却无法分辨出两者的不同。
在步骤S306中,基于第一图像、图像掩模和第一输出图像,生成样本图像。
在实施中,对于第一图像,可以使用图像掩模将第一图像中的指定区域去除、删除或遮挡,从而使得第一图像成为具有缺失的图像,具体可以如图5所示,可以将第一图像与上述构建的图像掩模MASK进行指定的逻辑运算(例如如图5所示,可以通过同或运算对第一图像和上述图像掩模MASK进行逻辑运算等),最终得到存在缺失图像。
通过上述方式得到第一输出图像后,可以基于上述的图像掩模构建第一输出图像需要使用的图像掩模,其中,考虑到最终需要合成一张完整的图像,上述得到了第一图像中存在缺失部位的图像,通过第一输出图像需要得到缺失的部分的图像,为此,可以基于图像掩模MASK生成一个与图像掩模MASK所遮挡的区域相反的图像掩模,例如图像掩模MASK的中心区域A表示第一图像中应该缺失的部分,外侧的环形区域B表示第一图像中保持不变的部分,则第一输出图像对应的图形掩模可以为中心区域A表示第一输出图像中保持不变的部分,外侧的环形区域B表示第一输出图像中应该缺失的部分等。
对于第一输出图像,可以使用上述确定的第一输出图像对应的图像掩模将第一输出图像中的指定区域去除、删除或遮挡,从而使得第一输出图像成为具有缺失的图像,具体可以如图5所示,可以将第一输出图像与上述构建的图像掩模进行指定的逻辑运算(例如如图5所示,可以通过同或运算对第一输出图像和上述第一输出图像对应的图像掩模进行逻辑运算等),最终得到存在缺失图像。
上述对第一图像和第一输出图像的处理后,分别得到了相应的缺失图像,由于两个缺失的图像可以拼凑为一张完整的图像,因此,可以采用图像融合算法对上述两个缺失图像进行融合或拼接处理,最终可以得到一张完整的图像,得到的图像即为通过图像补全规则而补全的图像,上述图像可以作为样本数据,以便后续对相应的模型进行训练。
上述步骤S306的具体处理可以包括多种可实现方式,以下再提供一种可选地处理方式,具体可以包括以下步骤A2~步骤A6的处理。
在步骤A2中,基于第一图像和图像掩模,在第一图像中去除该图像掩模所表征的图像区域的图像,得到第二图像。
在步骤A4中,基于第一输出图像和图像掩模,在第一输出图像中去除图像掩模所表征的图像区域之外的图像,得到第三图像。
在步骤A6中,将第二图像和第三图像进行融合处理,生成样本图像。
上述步骤A2~步骤A6的具体处理过程可以参见上述相关内容,在此不再赘述。
通过上述处理可以得到样本图像,可以重复上述处理过程,从而得到多个不同的样本图像,可以通过得到的样本图像对图像补全检测模型进行训练,具体可以参见下述相关内容。
在步骤S308中,获取多个不同的样本图像,每个样本图像中包含经过补全的图像。
在实施中,通过上述方式可以得到多种不同的样本图像,可以根据实际情况从上述生成的样本图像中选取预设数量的样本图像,例如,图像补全检测模型的训练需要10万个样本图像,并需要5000个样本图像作为模型验证的图像,则可以从上述生成的样本图像中随机选取10万个样本图像,同时,还可以从生成的样本图像中随机选取5000个样本图像,最终可以得到105000个样本图像,且每个样本图像中包含经过补全的图像。
在步骤S310中,对每个样本图像进行噪声提取处理,得到每个样本图像对应的样本噪声残差。
在步骤S312中,分别对每个样本图像和样本噪声残差进行特征提取,得到每个样本图像对应的样本图像特征和每个样本噪声残差对应的样本噪声特征。
上述步骤S310和步骤S312的具体处理过程可以参见上述实施例一中的相关内容,在此不再赘述。
在步骤S314中,构建图像补全检测模型的模型架构,并基于样本图像特征和样本噪声特征对图像补全检测模型进行模型训练,得到训练后的图像补全检测模型,该模型架构中包括数据拼接子模型架构、卷积子模型架构和特征交叉融合子模型架构。
其中,数据拼接子模型架构可以通过数据拼接算法构建,数据拼接子模型可以是用于对数据进行拼接或融合处理的模型。卷积子模型架构可以通过预设的卷积算法构建,卷积子模型可以是用于对数据进行卷积运算的模型。特征交叉融合子模型架构可以通过预设的融合算法构建,特征交叉融合子模型可以用于在不同尺度上进行交换信息从而丰富特征和增强空间敏感性。
在实施中,可以根据实际需要预先设定进行图像补全检测的算法,本实施例中,选用数据拼接算法、卷积算法和融合算法进行图像补全检测,可以根据实际情况预选设定具体的数据拼接算法、卷积算法和融合算法,然后,可以基于每种算法分别构建相应的子模型的模型架构,即可以通过预选设定的具体数据拼接算法构建数据拼接子模型架构,可以通过预选设定的具体卷积算法构建卷积子模型架构,可以通过预选设定的具体融合算法构建特征交叉融合子模型架构等。通过上述方式构建各个子模型后,可以将构建的子模型进行拼接或融合,从而构建图像补全检测模型的模型架构。
通过上述方式得到样本图像的样本图像特征和样本噪声特征后,可以通过样本图像特征和样本噪声特征对上述构建的图像补全检测模型进行模型训练,从而分别对拼接子模型、卷积子模型和特征交叉融合子模型进行模型训练,最终可以得到训练后的拼接子模型、卷积子模型和特征交叉融合子模型,进而得到训练后的图像补全检测模型。
需要说明的是,上述拼接子模型、卷积子模型和特征交叉融合子模型中的每个子模型可以是一个,也可以是多个,而且不同子模型所处的位置可以不同,例如,可以包括1个拼接子模型、4个卷积子模型和2个特征交叉融合子模型,其相对位置从左向右依次为拼接子模型-卷积子模型-卷积子模型-特征交叉融合子模型-卷积子模型-卷积子模型-特征交叉融合子模型等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实际应用中,图像补全检测模型的模型架构可以如图6所示,拼接子模型-卷积子模型-卷积子模型-特征交叉融合子模型-拼接子模型-卷积子模型-卷积子模型-softmax等,其中特征交叉融合子模型的具体处理可以包括:可以根据样本图像特征组的尺度大小,对样本图像对应的样本图像特征组进行排序,然后,对于某一个样本图像特征组,将尺度大于该样本图像特征组对应的尺度的样本图像特征组进行上采样处理,将尺度小于该样本图像特征组对应的尺度的样本图像特征组进行strided处理,之后,处理后的样本图像特征组再与该样本图像特征组进行融合处理,得到交叉融合后的样本图像特征。
如图6中,样本图像特征组1的尺度>样本图像特征组2的尺度>样本图像特征组3的尺度,对于样本图像特征组1,样本图像特征组2和样本图像特征组3分别进行上采样处理,之后与样本图像特征组1进行融合处理,得到交叉融合后的样本图像特征1;对于样本图像特征组2,样本图像特征组1进行strided处理,样本图像特征组3进行上采样处理,之后与样本图像特征组2进行融合处理,得到交叉融合后的样本图像特征2;对于样本图像特征组3,样本图像特征组1进行strided处理,样本图像特征组2进行strided处理,之后与样本图像特征组3进行融合处理,得到交叉融合后的样本图像特征3。
通过上述方式得到训练后的图像补全检测模型后,可以使用训练后的图像补全检测模型对待检测的图像进行补全检测,具体可以参见下述步骤S316~步骤S330的处理。
在步骤S316中,获取待检测的目标图像。
在步骤S318中,通过预设的滤波器对目标图像中包含的噪声数据进行滤波处理,得到滤波后的图像。
其中,滤波器可以是去噪滤波器,滤波器去噪可以包括低通滤波器去噪、移动平均滤波去噪、中值滤波去噪、小波去噪等,选用哪种滤波器进行哪种形式的滤波去噪可以根据实际情况设定,本说明书实施例对此不做限定。
在步骤S320中,基于目标图像和滤波后的图像,确定目标图像对应的噪声残差。
在实施中,通过上述处理得到目标图像和滤波后的图像后,可以使用目标图像与滤波后的图像进行数据的相减计算,从而将目标图像中包含的滤波后的图像的数据删除,而只保留目标图像中包含的噪声图像,从而得到目标图像对应的噪声残差。
在步骤S322中,基于预先训练的第一特征提取模型对目标图像进行特征提取,得到目标图像对应的图像特征。
其中,第一特征提取模型可以是任意能够对图像进行特征提取的模型,具体可以根据实际情况选取或设定,本说明书实施例对此不做限定。
在实施中,可以预先获取一定数量的样本图像,并可以基于预先设定的特征提取算法,可以通过预先设定的特征提取算法构建第一特征提取模型,然后,可以使用上述选取的样本图像对构建的第一特征提取模型进行训练,得到训练后的第一特征提取模型。可以将目标图像输入到第一特征提取模型中,通过第一特征提取模型可以输出目标图像对应的图像特征。
在步骤S324中,基于预先训练的第二特征提取模型对噪声残差进行特征提取,得到该噪声残差对应的噪声特征。
其中,第二特征提取模型可以是任意能够对噪声数据进行特征提取的模型,具体可以根据实际情况选取或设定,本说明书实施例对此不做限定。
在实施中,可以预先获取一定数量的样本图像,以及该样本图像对应的噪声等。并可以基于预先设定的特征提取算法,可以通过预先设定的特征提取算法构建第二特征提取模型,然后,可以使用上述选取的样本图像对应的噪声对构建的第二特征提取模型进行训练,得到训练后的第二特征提取模型。可以将噪声残差输入到第二特征提取模型中,通过第二特征提取模型可以输出该噪声残差对应的噪声特征。
需要说明的是,第一特征提取模型的模型架构与第二特征提取模型的模型架构可以相同。基于此,第一特征提取模型可以是由预设的第一残差网络模型构建,第二特征提取模型可以是由预设的第二残差网络模型构建。
基于上述内容,第一残差网络模型和第二残差网络模型可以是均由残差网络算法构建,其中模型中包含的各种参数可以不同。
在实际应用中,可以基于包含有两个平行分支的ResNet网络模型提取图像以及噪声残差的特征,如图7所示,设置两个平行分支的ResNet网络模型,其中,每个ResNet网络模型中可以包括一个或多个不同的ResNet模块(如图7中包括3个ResNet模块)。每经过一个ResNet模块,可以得到一组图像特征,相应的,对于噪声残差来说,每经过一个ResNet模块,也可以得到一组噪声特征,从而可以得到多组不同的图像特征和多组不同的噪声特征。
对于上述得到的多个图像特征和多个噪声特征,两个分支网络可以各自进行多尺度交叉融合,从而使得在不同尺度上进行信息交换,以丰富特征向量以及增强空间敏感性,具体可以参见下述步骤S326和步骤S328的处理。
在步骤S326中,对多个图像特征进行交叉融合处理,得到交叉融合后的图像特征。
在实施中,如图7所示,可以根据经过ResNet模块处理后得到的图像特征组的尺度大小,对目标图像对应的图像特征组进行排序,然后,对于某一个图像特征组,将尺度大于该图像特征组对应的尺度的图像特征组进行上采样处理,将尺度小于该图像特征组对应的尺度的图像特征组进行strided处理,之后,处理后的图像特征组再与该图像特征组进行融合处理,得到交叉融合后的图像特征。如图7中,图像特征组1的尺度>图像特征组2的尺度>图像特征组3的尺度,对于图像特征组1,图像特征组2和图像特征组3分别进行上采样处理,之后与图像特征组1进行融合处理,得到交叉融合后的图像特征1;对于图像特征组2,图像特征组1进行strided处理,图像特征组3进行上采样处理,之后与图像特征组2进行融合处理,得到交叉融合后的图像特征2;对于图像特征组3,图像特征组1进行strided处理,图像特征组2进行strided处理,之后与图像特征组3进行融合处理,得到交叉融合后的图像特征3。
在步骤S328中,对多个噪声特征进行交叉融合处理,得到交叉融合后的噪声特征。
在实施中,如图7所示,可以根据经过ResNet模块处理后得到的噪声特征组的尺度大小,对噪声残差对应的噪声特征组进行排序,然后,对于某一个噪声特征组,将尺度大于该噪声特征组对应的尺度的噪声特征组进行上采样处理,将尺度小于该噪声特征组对应的尺度的噪声特征组进行strided处理,之后,处理后的噪声特征组再与该噪声特征组进行融合处理,得到交叉融合后的噪声特征。如图7中,噪声特征组1的尺度>噪声特征组2的尺度>噪声特征组3的尺度,对于噪声特征组1,噪声特征组2和噪声特征组3分别进行上采样处理,之后与噪声特征组1进行融合处理,得到交叉融合后的噪声特征1;对于噪声特征组2,噪声特征组1进行strided处理,噪声特征组3进行上采样处理,之后与噪声特征组2进行融合处理,得到交叉融合后的噪声特征2;对于噪声特征组3,噪声特征组1进行strided处理,噪声特征组2进行strided处理,之后与噪声特征组3进行融合处理,得到交叉融合后的噪声特征3。
在步骤S330中,将交叉融合后的图像特征和交叉融合后的噪声特征输入到图像补全检测模型中,得到目标图像中是否包含通过图像补全规则而补全的图像。
本说明书实施例提供一种图像的检测方法,考虑到通过对待检测的目标图像进行噪声提取处理,得到目标图像对应的噪声残差,然后,分别对目标图像和该噪声残差进行特征提取,得到目标图像对应的图像特征和该噪声残差对应的噪声特征,将该图像特征和该噪声特征输入到图像补全检测模型中,得到目标图像中是否包含通过图像补全规则而补全的图像,由于考虑到常用的图像补全规则或图像补全技术(即使是基于深度学习的图像补全技术)均难以模仿实际完整图像(或真实图像)中拍摄该图像时使用的硬件所留下的噪声,因此,通过上述方式以利用图像中的噪声分布是否一致来实现针对图像补全规则的检测,从而能够有效提升图像补全检测机制的泛化性能,不仅提出了一种基于深度学习的图像补全的通用检测技术,而且能够有效识别不同种类的补全技术生成的伪造图像。
实施例三
以上为本说明书实施例提供的图像的检测方法,基于同样的思路,本说明书实施例还提供一种图像的检测装置,如图8所示。
该图像的检测装置包括:图像获取模块801、噪声提取模块802、特征提取模块803和补全检测模块804,其中:
图像获取模块801,获取待检测的目标图像;
噪声提取模块802,对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差;
特征提取模块803,分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征;
补全检测模块804,将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像。
本说明书实施例中,所述噪声提取模块802,包括:
噪声过滤单元,通过预设的滤波器对所述目标图像中包含的噪声数据进行滤波处理,得到滤波后的图像;
噪声提取单元,基于所述目标图像和所述滤波后的图像,确定所述目标图像对应的噪声残差。
本说明书实施例中,所述特征提取模块803,包括:
图像特征提取单元,基于预先训练的第一特征提取模型对所述目标图像进行特征提取,得到所述目标图像对应的图像特征;
噪声特征提取单元,基于预先训练的第二特征提取模型对所述噪声残差进行特征提取,得到所述噪声残差对应的噪声特征。
本说明书实施例中,所述第一特征提取模型的模型架构与所述第二特征提取模型的模型架构相同。
本说明书实施例中,所述第一特征提取模型是由预设的第一残差网络模型构建,所述第二特征提取模型是由预设的第二残差网络模型构建。
本说明书实施例中,所述图像特征包括多个,所述噪声特征包括多个,所述装置还包括:
第一交叉融合单元,对多个所述图像特征进行交叉融合处理,得到交叉融合后的所述图像特征;
第二交叉融合单元,对多个所述噪声特征进行交叉融合处理,得到交叉融合后的所述噪声特征;
所述补全检测模块804,将交叉融合后的所述图像特征和交叉融合后的所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像。
本说明书实施例中,所述装置还包括:
样本获取模块,获取多个不同的样本图像,每个所述样本图像中包含经过补全的图像;
样本噪声提取模块,对每个所述样本图像进行噪声提取处理,得到每个所述样本图像对应的样本噪声残差;
样本特征提取模块,分别对每个所述样本图像和所述样本噪声残差进行特征提取,得到每个所述样本图像对应的样本图像特征和每个所述样本噪声残差对应的样本噪声特征;
模型训练模块,构建所述图像补全检测模型的模型架构,并基于所述样本图像特征和所述样本噪声特征对所述图像补全检测模型进行模型训练,得到训练后的图像补全检测模型,所述模型架构中包括数据拼接子模型架构、卷积子模型架构和特征交叉融合子模型架构。
本说明书实施例中,所述装置还包括:
数据获取模块,获取第一图像和用于表征缺失图像区域的图像掩模,所述第一图像中未包含通过图像补全规则而补全的图像;
图像处理模块,将所述第一图像输入到预先训练的生成式对抗网络模型中,得到第一输出图像;
样本图像生成模块,基于所述第一图像、所述图像掩模和所述第一输出图像,生成所述样本图像。
本说明书实施例中,所述样本图像生成模块,包括:
第一图像处理单元,基于所述第一图像和所述图像掩模,在所述第一图像中去除所述图像掩模所表征的图像区域的图像,得到第二图像;
第二图像处理单元,基于所述第一输出图像和所述图像掩模,在所述第一输出图像中去除所述图像掩模所表征的图像区域之外的图像,得到第三图像;
图像融合单元,将所述第二图像和所述第三图像进行融合处理,生成所述样本图像。
本说明书实施例提供一种图像的检测装置,考虑到通过对待检测的目标图像进行噪声提取处理,得到目标图像对应的噪声残差,然后,分别对目标图像和该噪声残差进行特征提取,得到目标图像对应的图像特征和该噪声残差对应的噪声特征,将该图像特征和该噪声特征输入到图像补全检测模型中,得到目标图像中是否包含通过图像补全规则而补全的图像,由于考虑到常用的图像补全规则或图像补全技术(即使是基于深度学习的图像补全技术)均难以模仿实际完整图像(或真实图像)中拍摄该图像时使用的硬件所留下的噪声,因此,通过上述方式以利用图像中的噪声分布是否一致来实现针对图像补全规则的检测,从而能够有效提升图像补全检测机制的泛化性能,不仅提出了一种基于深度学习的图像补全的通用检测技术,而且能够有效识别不同种类的补全技术生成的伪造图像。
实施例四
以上为本说明书实施例提供的图像的检测装置,基于同样的思路,本说明书实施例还提供一种图像的检测设备,如图9所示。
所述图像的检测设备可以为上述实施例提供的终端设备或服务器等。
图像的检测设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器901和存储器902,存储器902中可以存储有一个或一个以上存储应用程序或数据。其中,存储器902可以是短暂存储或持久存储。存储在存储器902的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对图像的检测设备中的一系列计算机可执行指令。更进一步地,处理器901可以设置为与存储器902通信,在图像的检测设备上执行存储器902中的一系列计算机可执行指令。图像的检测设备还可以包括一个或一个以上电源903,一个或一个以上有线或无线网络接口904,一个或一个以上输入输出接口905,一个或一个以上键盘906。
具体在本实施例中,图像的检测设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对图像的检测设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取待检测的目标图像;
对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差;
分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征;
将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像。
本说明书实施例中,所述分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征,包括:
基于预先训练的第一特征提取模型对所述目标图像进行特征提取,得到所述目标图像对应的图像特征;
基于预先训练的第二特征提取模型对所述噪声残差进行特征提取,得到所述噪声残差对应的噪声特征。
本说明书实施例中,所述图像特征包括多个,所述噪声特征包括多个,
所述将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像之前,所述方法还包括:
对多个所述图像特征进行交叉融合处理,得到交叉融合后的所述图像特征;
对多个所述噪声特征进行交叉融合处理,得到交叉融合后的所述噪声特征;
所述将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像,包括:
将交叉融合后的所述图像特征和交叉融合后的所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像。
本说明书实施例中,还包括:
获取多个不同的样本图像,每个所述样本图像中包含经过补全的图像;
对每个所述样本图像进行噪声提取处理,得到每个所述样本图像对应的样本噪声残差;
分别对每个所述样本图像和所述样本噪声残差进行特征提取,得到每个所述样本图像对应的样本图像特征和每个所述样本噪声残差对应的样本噪声特征;
构建所述图像补全检测模型的模型架构,并基于所述样本图像特征和所述样本噪声特征对所述图像补全检测模型进行模型训练,得到训练后的图像补全检测模型,所述模型架构中包括数据拼接子模型架构、卷积子模型架构和特征交叉融合子模型架构。
本说明书实施例中,还包括:
获取第一图像和用于表征缺失图像区域的图像掩模,所述第一图像中未包含通过图像补全规则而补全的图像;
将所述第一图像输入到预先训练的生成式对抗网络模型中,得到第一输出图像;
基于所述第一图像、所述图像掩模和所述第一输出图像,生成所述样本图像。
本说明书实施例中,所述基于所述第一图像、所述图像掩模和所述第一输出图像,生成所述样本图像,包括:
基于所述第一图像和所述图像掩模,在所述第一图像中去除所述图像掩模所表征的图像区域的图像,得到第二图像;
基于所述第一输出图像和所述图像掩模,在所述第一输出图像中去除所述图像掩模所表征的图像区域之外的图像,得到第三图像;
将所述第二图像和所述第三图像进行融合处理,生成所述样本图像。
本说明书实施例提供一种图像的检测设备,考虑到通过对待检测的目标图像进行噪声提取处理,得到目标图像对应的噪声残差,然后,分别对目标图像和该噪声残差进行特征提取,得到目标图像对应的图像特征和该噪声残差对应的噪声特征,将该图像特征和该噪声特征输入到图像补全检测模型中,得到目标图像中是否包含通过图像补全规则而补全的图像,由于考虑到常用的图像补全规则或图像补全技术(即使是基于深度学习的图像补全技术)均难以模仿实际完整图像(或真实图像)中拍摄该图像时使用的硬件所留下的噪声,因此,通过上述方式以利用图像中的噪声分布是否一致来实现针对图像补全规则的检测,从而能够有效提升图像补全检测机制的泛化性能,不仅提出了一种基于深度学习的图像补全的通用检测技术,而且能够有效识别不同种类的补全技术生成的伪造图像。
实施例五
进一步地,基于上述图1至图7所示的方法,本说明书一个或多个实施例还提供了一种存储介质,用于存储计算机可执行指令信息,一种具体的实施例中,该存储介质可以包括永久性存储介质和非永久性存储介质、可移动存储介质和非可移动存储介质,具体可以包括但不限于PRAM、静态随机存取存储器、动态随机存取存储器、其他类型的随机存取存储器、只读存储器、电可擦除可编程只读存储器、快闪记忆体或其他内存技术、只读光盘只读存储器、数字多功能光盘或其他光学存储、磁盒式磁带,磁带、磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。该存储介质存储的计算机可执行指令信息在被处理器执行时,能实现以下流程:
获取待检测的目标图像;
对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差;
分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征;
将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像。
本说明书实施例中,所述分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征,包括:
基于预先训练的第一特征提取模型对所述目标图像进行特征提取,得到所述目标图像对应的图像特征;
基于预先训练的第二特征提取模型对所述噪声残差进行特征提取,得到所述噪声残差对应的噪声特征。
本说明书实施例中,所述图像特征包括多个,所述噪声特征包括多个,
所述将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像之前,所述方法还包括:
对多个所述图像特征进行交叉融合处理,得到交叉融合后的所述图像特征;
对多个所述噪声特征进行交叉融合处理,得到交叉融合后的所述噪声特征;
所述将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像,包括:
将交叉融合后的所述图像特征和交叉融合后的所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像。
本说明书实施例中,还包括:
获取多个不同的样本图像,每个所述样本图像中包含经过补全的图像;
对每个所述样本图像进行噪声提取处理,得到每个所述样本图像对应的样本噪声残差;
分别对每个所述样本图像和所述样本噪声残差进行特征提取,得到每个所述样本图像对应的样本图像特征和每个所述样本噪声残差对应的样本噪声特征;
构建所述图像补全检测模型的模型架构,并基于所述样本图像特征和所述样本噪声特征对所述图像补全检测模型进行模型训练,得到训练后的图像补全检测模型,所述模型架构中包括数据拼接子模型架构、卷积子模型架构和特征交叉融合子模型架构。
本说明书实施例中,还包括:
获取第一图像和用于表征缺失图像区域的图像掩模,所述第一图像中未包含通过图像补全规则而补全的图像;
将所述第一图像输入到预先训练的生成式对抗网络模型中,得到第一输出图像;
基于所述第一图像、所述图像掩模和所述第一输出图像,生成所述样本图像。
本说明书实施例中,所述基于所述第一图像、所述图像掩模和所述第一输出图像,生成所述样本图像,包括:
基于所述第一图像和所述图像掩模,在所述第一图像中去除所述图像掩模所表征的图像区域的图像,得到第二图像;
基于所述第一输出图像和所述图像掩模,在所述第一输出图像中去除所述图像掩模所表征的图像区域之外的图像,得到第三图像;
将所述第二图像和所述第三图像进行融合处理,生成所述样本图像。
本说明书实施例提供一种存储介质,考虑到通过对待检测的目标图像进行噪声提取处理,得到目标图像对应的噪声残差,然后,分别对目标图像和该噪声残差进行特征提取,得到目标图像对应的图像特征和该噪声残差对应的噪声特征,将该图像特征和该噪声特征输入到图像补全检测模型中,得到目标图像中是否包含通过图像补全规则而补全的图像,由于考虑到常用的图像补全规则或图像补全技术(即使是基于深度学习的图像补全技术)均难以模仿实际完整图像(或真实图像)中拍摄该图像时使用的硬件所留下的噪声,因此,通过上述方式以利用图像中的噪声分布是否一致来实现针对图像补全规则的检测,从而能够有效提升图像补全检测机制的泛化性能,不仅提出了一种基于深度学习的图像补全的通用检测技术,而且能够有效识别不同种类的补全技术生成的伪造图像。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。
例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable Gate Array,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(AlteraHardware Description Language)、Confluence、CUPL(Cornell University ProgrammingLanguage)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等,目前最普遍使用的是VHDL(Very-High-Speed Integrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。
而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。
可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程欺诈案例的串并设备的处理器以产生一个机器,使得通过计算机或其他可编程欺诈案例的串并设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程欺诈案例的串并设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程欺诈案例的串并设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。
计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (16)

1.一种图像的检测方法,所述方法包括:
获取待检测的目标图像;
对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差;
分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征;
将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像;其中,所述图像补全检测模型是通过构建所述图像补全检测模型的模型架构,并基于样本图像特征和样本噪声特征对所述图像补全检测模型进行模型训练,得到训练后的图像补全检测模型,所述模型架构中包括数据拼接子模型架构、卷积子模型架构和特征交叉融合子模型架构。
2.根据权利要求1所述的方法,所述对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差,包括:
通过预设的滤波器对所述目标图像中包含的噪声数据进行滤波处理,得到滤波后的图像;
基于所述目标图像和所述滤波后的图像,确定所述目标图像对应的噪声残差。
3.根据权利要求1所述的方法,所述分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征,包括:
基于预先训练的第一特征提取模型对所述目标图像进行特征提取,得到所述目标图像对应的图像特征;
基于预先训练的第二特征提取模型对所述噪声残差进行特征提取,得到所述噪声残差对应的噪声特征。
4.根据权利要求3所述的方法,所述第一特征提取模型的模型架构与所述第二特征提取模型的模型架构相同。
5.根据权利要求4所述的方法,所述第一特征提取模型是由预设的第一残差网络模型构建,所述第二特征提取模型是由预设的第二残差网络模型构建。
6.根据权利要求1所述的方法,所述图像特征包括多个,所述噪声特征包括多个,
所述将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像之前,所述方法还包括:
对多个所述图像特征进行交叉融合处理,得到交叉融合后的所述图像特征;
对多个所述噪声特征进行交叉融合处理,得到交叉融合后的所述噪声特征;
所述将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像,包括:
将交叉融合后的所述图像特征和交叉融合后的所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像。
7.根据权利要求1所述的方法,所述方法还包括:
获取多个不同的样本图像,每个所述样本图像中包含经过补全的图像;
对每个所述样本图像进行噪声提取处理,得到每个所述样本图像对应的样本噪声残差;
分别对每个所述样本图像和所述样本噪声残差进行特征提取,得到每个所述样本图像对应的样本图像特征和每个所述样本噪声残差对应的样本噪声特征;
构建所述图像补全检测模型的模型架构,并基于所述样本图像特征和所述样本噪声特征对所述图像补全检测模型进行模型训练,得到训练后的图像补全检测模型,所述模型架构中包括数据拼接子模型架构、卷积子模型架构和特征交叉融合子模型架构。
8.根据权利要求7所述的方法,所述方法还包括:
获取第一图像和用于表征缺失图像区域的图像掩模,所述第一图像中未包含通过图像补全规则而补全的图像;
将所述第一图像输入到预先训练的生成式对抗网络模型中,得到第一输出图像;
基于所述第一图像、所述图像掩模和所述第一输出图像,生成所述样本图像。
9.根据权利要求8所述的方法,所述基于所述第一图像、所述图像掩模和所述第一输出图像,生成所述样本图像,包括:
基于所述第一图像和所述图像掩模,在所述第一图像中去除所述图像掩模所表征的图像区域的图像,得到第二图像;
基于所述第一输出图像和所述图像掩模,在所述第一输出图像中去除所述图像掩模所表征的图像区域之外的图像,得到第三图像;
将所述第二图像和所述第三图像进行融合处理,生成所述样本图像。
10.一种图像的检测装置,所述装置包括:
图像获取模块,获取待检测的目标图像;
噪声提取模块,对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差;
特征提取模块,分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征;
补全检测模块,将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像;其中,所述图像补全检测模型是通过构建所述图像补全检测模型的模型架构,并基于样本图像特征和样本噪声特征对所述图像补全检测模型进行模型训练,得到训练后的图像补全检测模型,所述模型架构中包括数据拼接子模型架构、卷积子模型架构和特征交叉融合子模型架构。
11.根据权利要求10所述的装置,所述噪声提取模块,包括:
噪声过滤单元,通过预设的滤波器对所述目标图像中包含的噪声数据进行滤波处理,得到滤波后的图像;
噪声提取单元,基于所述目标图像和所述滤波后的图像,确定所述目标图像对应的噪声残差。
12.根据权利要求10所述的装置,所述装置还包括:
样本获取模块,获取多个不同的样本图像,每个所述样本图像中包含经过补全的图像;
样本噪声提取模块,对每个所述样本图像进行噪声提取处理,得到每个所述样本图像对应的样本噪声残差;
样本特征提取模块,分别对每个所述样本图像和所述样本噪声残差进行特征提取,得到每个所述样本图像对应的样本图像特征和每个所述样本噪声残差对应的样本噪声特征;
模型训练模块,构建所述图像补全检测模型的模型架构,并基于所述样本图像特征和所述样本噪声特征对所述图像补全检测模型进行模型训练,得到训练后的图像补全检测模型,所述模型架构中包括数据拼接子模型架构、卷积子模型架构和特征交叉融合子模型架构。
13.根据权利要求12所述的装置,所述装置还包括:
数据获取模块,获取第一图像和用于表征缺失图像区域的图像掩模,所述第一图像中未包含通过图像补全规则而补全的图像;
图像处理模块,将所述第一图像输入到预先训练的生成式对抗网络模型中,得到第一输出图像;
样本图像生成模块,基于所述第一图像、所述图像掩模和所述第一输出图像,生成所述样本图像。
14.根据权利要求13所述的装置,所述样本图像生成模块,包括:
第一图像处理单元,基于所述第一图像和所述图像掩模,在所述第一图像中去除所述图像掩模所表征的图像区域的图像,得到第二图像;
第二图像处理单元,基于所述第一输出图像和所述图像掩模,在所述第一输出图像中去除所述图像掩模所表征的图像区域之外的图像,得到第三图像;
图像融合单元,将所述第二图像和所述第三图像进行融合处理,生成所述样本图像。
15.一种图像的检测设备,所述图像的检测设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
获取待检测的目标图像;
对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差;
分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征;
将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像;其中,所述图像补全检测模型是通过构建所述图像补全检测模型的模型架构,并基于样本图像特征和样本噪声特征对所述图像补全检测模型进行模型训练,得到训练后的图像补全检测模型,所述模型架构中包括数据拼接子模型架构、卷积子模型架构和特征交叉融合子模型架构。
16.一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
获取待检测的目标图像;
对所述目标图像进行噪声提取处理,得到所述目标图像对应的噪声残差;
分别对所述目标图像和所述噪声残差进行特征提取,得到所述目标图像对应的图像特征和所述噪声残差对应的噪声特征;
将所述图像特征和所述噪声特征输入到图像补全检测模型中,得到所述目标图像中是否包含通过图像补全规则而补全的图像;其中,所述图像补全检测模型是通过构建所述图像补全检测模型的模型架构,并基于样本图像特征和样本噪声特征对所述图像补全检测模型进行模型训练,得到训练后的图像补全检测模型,所述模型架构中包括数据拼接子模型架构、卷积子模型架构和特征交叉融合子模型架构。
CN202110318767.9A 2021-03-25 2021-03-25 一种图像的检测方法、装置及设备 Active CN112927219B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110318767.9A CN112927219B (zh) 2021-03-25 2021-03-25 一种图像的检测方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110318767.9A CN112927219B (zh) 2021-03-25 2021-03-25 一种图像的检测方法、装置及设备

Publications (2)

Publication Number Publication Date
CN112927219A CN112927219A (zh) 2021-06-08
CN112927219B true CN112927219B (zh) 2022-05-13

Family

ID=76175929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110318767.9A Active CN112927219B (zh) 2021-03-25 2021-03-25 一种图像的检测方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112927219B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516575A (zh) * 2019-08-19 2019-11-29 上海交通大学 基于残差域富模型的gan生成图片检测方法及系统
CN111899251A (zh) * 2020-08-06 2020-11-06 中国科学院深圳先进技术研究院 一种区分伪造来源和目标区域的copy-move型伪造图像检测方法
CN112150450A (zh) * 2020-09-29 2020-12-29 武汉大学 一种基于双通道U-Net模型的图像篡改检测方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10839575B2 (en) * 2018-03-15 2020-11-17 Adobe Inc. User-guided image completion with image completion neural networks
US20200242771A1 (en) * 2019-01-25 2020-07-30 Nvidia Corporation Semantic image synthesis for generating substantially photorealistic images using neural networks

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516575A (zh) * 2019-08-19 2019-11-29 上海交通大学 基于残差域富模型的gan生成图片检测方法及系统
CN111899251A (zh) * 2020-08-06 2020-11-06 中国科学院深圳先进技术研究院 一种区分伪造来源和目标区域的copy-move型伪造图像检测方法
CN112150450A (zh) * 2020-09-29 2020-12-29 武汉大学 一种基于双通道U-Net模型的图像篡改检测方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《Learning Rich Features for Image Manipulation Detection》;Peng Zhou,et al;《Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition》;20181231;第1054页附图2 *
《基于检测-分割的图像拼接篡改盲取证算法》;杨超,等;《电子设计工程》;20200731;第28卷(第13期);第169-174页 *
《非可控环境行人再识别综述》;冯展祥,等;《中山大学学报(自然科学版)》;20200530;第59卷(第3期);第1-11页 *

Also Published As

Publication number Publication date
CN112927219A (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
CN111553333B (zh) 人脸图像识别模型训练方法、识别方法、装置和电子设备
CN111340014B (zh) 活体检测方法、装置、设备和存储介质
CN111523431B (zh) 一种面部识别的方法、装置及设备
CN111538869B (zh) 一种交易异常群组的检测方法、装置及设备
CN114238904B (zh) 身份识别方法、双通道超分模型的训练方法及装置
CN112800468B (zh) 一种基于隐私保护的数据处理方法、装置及设备
CN113223101B (zh) 基于隐私保护的图像处理方法、装置及设备
CN112052834A (zh) 一种基于隐私保护的面部识别方法、装置及设备
CN113343295B (zh) 基于隐私保护的图像处理方法、装置、设备和存储介质
CN112927219B (zh) 一种图像的检测方法、装置及设备
CN115546908A (zh) 一种活体检测方法、装置及设备
CN115810073A (zh) 虚拟形象生成方法及装置
CN115358777A (zh) 虚拟世界的广告投放处理方法及装置
CN115578796A (zh) 一种活体检测模型的训练方法、装置、设备及介质
CN112487903B (zh) 基于对抗网络的步态数据生成方法及设备
CN110705439A (zh) 一种信息的处理方法、装置及设备
Daryani et al. IRL-Net: Inpainted Region Localization Network via Spatial Attention
CN110309859A (zh) 一种图像真伪检测方法、装置及电子设备
CN113569873B (zh) 一种图像的处理方法、装置及设备
CN117197781B (zh) 一种交通标志识别的方法、装置、存储介质及电子设备
CN117593799A (zh) 一种生物攻击检测方法、装置及设备
CN117576748A (zh) 一种伪造检测模型训练方法、装置、存储介质及电子设备
CN117095240A (zh) 一种基于细粒度特征的叶片分类方法和系统
CN114897700A (zh) 图像优化方法、校正模型的训练方法及装置
CN112766208A (zh) 一种模型训练的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant