CN116363490A - 伪造对象检测方法、相关装置及存储介质 - Google Patents

伪造对象检测方法、相关装置及存储介质 Download PDF

Info

Publication number
CN116363490A
CN116363490A CN202310343733.4A CN202310343733A CN116363490A CN 116363490 A CN116363490 A CN 116363490A CN 202310343733 A CN202310343733 A CN 202310343733A CN 116363490 A CN116363490 A CN 116363490A
Authority
CN
China
Prior art keywords
feature
sample
prototype
preset
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310343733.4A
Other languages
English (en)
Inventor
请求不公布姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Real AI Technology Co Ltd
Original Assignee
Beijing Real AI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Real AI Technology Co Ltd filed Critical Beijing Real AI Technology Co Ltd
Priority to CN202310343733.4A priority Critical patent/CN116363490A/zh
Publication of CN116363490A publication Critical patent/CN116363490A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/95Pattern authentication; Markers therefor; Forgery detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例公开了一种伪造对象检测方法、相关装置及存储介质。所述方法包括获取待检测数据中目标对象的目标对象特征;确定第一特征距离集合以及第二特征距离集合,所述第一特征距离集合包括所述目标对象特征与至少一个真实类型的真实原型中各所述真实原型的特征距离,所述第二特征距离集合包括所述目标对象特征与至少一个虚假类型的虚假原型中各所述虚假原型的特征距离;基于所述第一特征距离集合确定平均特征距离,以及基于所述第二特征距离集合确定最小特征距离;根据所述平均特征距离以及所述最小特征距离确定所述目标对象是否符合预设伪造条件。通过实施本申请实施例的方法可以提高伪造对象检测的准确率。

Description

伪造对象检测方法、相关装置及存储介质
技术领域
本申请实施例涉及数据传输技术领域,尤其涉及一种伪造对象检测方法、相关装置及存储介质。
背景技术
深度合成技术,是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术。深度合成技术能够合成或编辑数字图片,得到虚假的图片,例如人脸图像,并达到人眼难辨真伪的程度。这些虚假的人脸可能被恶意使用,从而造成巨大的社会危害和经济损失,例如制作虚假新闻或攻击人脸识别系统等。深度合成技术制作的虚假人脸包含多种类型,如人脸重演、人脸替换、人脸编辑和人脸合成等。每种类型的虚假人脸都可以由不同的算法生成,导致图片中所遗留的伪造痕迹也有所不同。
为了能够支持多种类型的虚假人脸检测,目前主流的虚假人脸检测方法一般采用基于数据驱动的深度学习技术,即采集大规模且类型多样的虚假人脸和真实人脸数据,然后训练一个基于神经网络的分类模型。该模型一般包括一个特征编码器、一个全连接分类器和softmax函数,并通过交叉熵损失进行训练。然而,基于softmax损失的分类模型不能充分学习到区分性更强的特征。因此,现有技术提出基于三元组损失训练二分类模型作为图像真伪检测模型,使得虚假数据和真实数据内部更加紧凑而不同类别数据更加离散,以提取更具区分性的特征。
在对现有技术的研究和实践过程中,本申请实施例的发明人发现,现有技术存在两点不足:1)没有考虑不同类型伪造对象的差异,简单地让伪造对象数据内部更加紧凑,会导致模型丢弃部分伪造特征;2)真实对象数据和伪造对象数据都分别只学习单一原型,对种类多样的伪造对象建模不足,不能充分学习多种伪造特征。因此,伪造对象检测的准确率还有待提高。
发明内容
本申请实施例提供了一种伪造对象检测方法、相关装置及存储介质,可以提高伪造对象检测的准确率。
第一方面,本申请实施例提供了一种伪造对象检测方法,包括:
获取待检测数据中目标对象的目标对象特征;
确定第一特征距离集合以及第二特征距离集合,所述第一特征距离集合包括所述目标对象特征与至少一个真实类型的真实原型中各所述真实原型的特征距离,所述第二特征距离集合包括所述目标对象特征与至少一个虚假类型的虚假原型中各所述虚假原型的特征距离;
基于所述第一特征距离集合确定平均特征距离,以及基于所述第二特征距离集合确定最小特征距离;
根据所述平均特征距离以及所述最小特征距离确定所述目标对象是否符合预设伪造条件。
在一些实施例中,所述获取待检测数据中目标对象的目标对象特征,包括:
获取待检测数据;
对所述待检测数据进行目标对象检测,在所述待检测数据中确定目标对象对应的数据;
对所述目标对象对应的数据进行特征编码,得到所述目标对象特征。
第二方面,本申请实施例还提供了一种伪造对象检测装置,包括:
收发模块,用于获取待检测数据中目标对象的目标对象特征;
处理模块,用于确定第一特征距离集合以及第二特征距离集合,所述第一特征距离集合包括所述目标对象特征与至少一个真实类型的真实原型中各所述真实原型的特征距离,所述第二特征距离集合包括所述目标对象特征与至少一个虚假类型的虚假原型中各所述虚假原型的特征距离;基于所述第一特征距离集合确定平均特征距离,以及基于所述第二特征距离集合确定最小特征距离;根据所述平均特征距离以及所述最小特征距离确定所述目标对象是否符合预设伪造条件。
在一些实施例中,所述处理模块在执行所述根据所述平均特征距离以及所述最小特征距离确定所述目标对象是否符合预设伪造条件步骤时,具体用于:
根据所述平均特征距离的相反数以及预设的分类函数确定所述目标对象为真实对象的第一概率;
根据所述最小特征距离的相反数以及所述分类函数确定所述目标对象为伪造对象的第二概率;
若所述第一概率大于所述第二概率,则确定所述目标对象不符合所述预设伪造条件;
若所述第一概率小于或等于所述第二概率,则确定所述目标对象符合所述预设伪造条件。
在一些实施例中,在所述收发模块执行所述获取待检测数据中目标对象的目标对象特征步骤之前,所述处理模块还用于:
通过所述收发模块获取初始样本集合,所述初始样本集合包括预设原型集合中各预设原型分别对应的多个样本,所述预设原型集合包括至少一个真实类型的预设真实原型以及至少一个虚假类型的预设虚假原型;
从所述初始样本集合中确定目标样本特征;
确定第一样本特征距离集合以及第二样本特征距离集合,所述第一样本特征距离集合包括所述目标样本特征与各所述预设真实原型的特征距离,所述第二样本特征距离集合包括所述目标样本特征与各所述预设虚假原型的特征距离;
基于所述第一样本特征距离集合确定平均样本特征距离,以及基于所述第二样本特征距离集合确定最小样本特征距离;
根据所述平均样本特征距离、所述最小样本特征距离以及所述目标样本特征对应的样本类型标签确定所述预设原型集合的损失函数;
若确定所述预设原型集合未收敛,则根据所述损失函数对所述预设原型集合进行训练,并根据所述初始样本集合更新所述目标样本特征,返回执行所述确定第一样本特征距离集合以及第二样本特征距离集合步骤;
若确定所述预设原型集合收敛,则将所述预设原型集合确定为目标原型集合,所述目标原型集合包括至少一个所述真实原型以及至少一个所述虚假原型。
在一些实施例中,所述处理模块在执行所述根据所述平均样本特征距离、所述最小样本特征距离以及所述目标样本特征对应的样本类型标签确定所述预设原型集合的损失函数步骤时,具体用于:
根据所述平均样本特征距离的相反数以及预设的分类函数确定所述目标样本特征为真实对象的第三概率;
根据所述最小样本特征距离的相反数以及所述分类函数确定所述目标样本特征为伪造对象的第四概率;
若所述样本类型标签为真实对象对应的标签,则根据所述第三概率确定所述损失函数;
若所述样本标签为伪造对象对应的标签,则根据所述第四概率确定所述损失函数。
在一些实施例中,所述损失函数包括基于距离度量的损失函数以及原型中心损失函数;所述处理模块在执行所述若所述样本类型标签为真实对象对应的标签,则根据所述第三概率确定所述损失函数;若所述样本标签为伪造对象对应的标签,则根据所述第四概率确定所述损失函数步骤时,具体用于:
若所述样本类型标签为真实对象对应的标签,则根据所述第三概率确定所述基于距离度量的损失函数,并根据所述目标样本特征与目标预设原型间的目标特征距离确定所述原型中心损失函数,所述目标预设原型为所述预设原型集合中与所述样本类型标签对应的预设原型;
若所述样本类型标签为伪造对象对应的标签,则根据所述第四概率确定所述基于距离度量的损失函数,并根据所述目标样本特征与目标预设原型间的目标特征距离确定所述原型中心损失函数。
在一些实施例中,所述处理模块在执行所述从所述初始样本集合中确定目标样本特征步骤时,具体用于:
从所述初始样本集合中确定目标样本;
将所述目标样本输入预设特征编码器,对所述目标样本进行特征编码,得到所述目标样本特征。
在一些实施例中,所述处理模块在执行所述根据所述损失函数对所述预设原型集合进行训练步骤时,具体用于:
根据所述损失函数对所述预设原型集合以及所述预设特征编码器进行联合训练。
在一些实施例中,所述收发模块在执行所述获取待检测数据中目标对象的目标对象特征步骤时,具体用于:
获取待检测数据;
通过所述处理模块对所述待检测数据进行目标对象检测,在所述待检测数据中确定目标对象对应的数据;对所述目标对象对应的数据进行特征编码,得到所述目标对象特征。
第三方面,本申请实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现上述方法。
第五方面,本申请实施例提供了一种芯片,该芯片中包括与终端设备的收发器耦合,用于执行本申请实施例第一方面提供的技术方案。
第六方面,本申请实施例提供了一种芯片系统,该芯片系统包括通信接口以及处理器,通信接口,用于输入和/或输出信息;处理器,用于执行计算机可执行程序,支持终端设备实现上述第一方面中所涉及的功能,例如,生成或者处理上述第一方面提供的伪造对象检测方法中所涉及的信息。在一种可能的设计中,上述芯片系统还包括存储器,该存储器用于保存终端必需的程序指令和数据。该芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
第七方面,本申请实施例提供了一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述第一方面提供的伪造对象检测方法,也能实现第一方面提供的伪造对象检测方法所具备的有益效果。
相较于现有技术,本申请实施例提供的方案中,一方面,由于本方案为不同的真实类型以及不同的虚假类型的对象分别设置有对应的原型,故本方案可以充分学习到不同的类型的对象特征,能够充分捕捉到各种类型对象的特征,避免特征丢失,从而提高伪造对象检测的准确率;另一方面,由于本方案针对真实原型以及虚假原型分别设置有不同的特征距离计算方式,故本方案对于伪造对象的真伪检测不受真实原型以及虚假原型数量的影响。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的伪造对象检测方法的应用场景示意图;
图2为本申请实施例提供的伪造对象检测方法中的原型集合训练流程示意图;
图3为本申请实施例提供的伪造对象检测方法的流程示意图;
图4为本申请实施例提供的样本特征空间可视化示意图;
图5为本申请实施例提供的伪造对象检测装置的示意性框图;
图6为本申请实施例中服务器的一种结构示意图;
图7为本申请实施例中终端设备的一种结构示意图;
图8为本申请实施例中服务器的一种结构示意图。
具体实施方式
本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请实施例中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本申请实施例中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分布到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本申请实施例方案的目的。
本申请实施例供了一种伪造对象检测方法、相关装置及存储介质,该伪造对象检测方法的执行主体可以是本申请实施例提供的伪造对象检测装置,或者集成了伪造对象检测装置的计算机设备,其中,该伪造对象检测装置可以采用硬件或者软件的方式实现,该计算机设备可以为终端或服务器。
当该计算机设备为服务器时,该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
当该计算机设备为终端时,该终端可以包括:智能手机、平板电脑、笔记本电脑、桌上型电脑、智能电视、智能音箱、个人数字助理(英文全称:Personal Digital Assistant,英文简称:PDA)、台式计算机、智能手表等携带多媒体数据处理功能(例如,视频数据播放功能、音乐数据播放功能)的智能终端,但并不局限于此。
本申请实施例的方案可基于人工智能技术实现,具体来说涉及人工智能技术中的计算机视觉技术技术领域和云技术中的云计算、云存储和数据库等领域,下面将分别进行介绍。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、模型鲁棒性检测、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的模型鲁棒性检测、指纹识别等生物特征识别技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例的方案可基于云技术实现,具体来说涉及云技术中的云计算、云存储和数据库等技术领域,下面将分别进行介绍。
云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术(Cloudtechnology)基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图像类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。本申请实施例可通过云技术对识别结果进行保存。
云存储(cloud storage)是在云计算概念上延伸和发展出来的一个新的概念,分布式云存储系统(以下简称存储系统)是指通过集群应用、网格技术以及分布存储文件系统等功能,将网络中大量各种不同类型的存储设备(存储设备也称之为存储节点)通过应用软件或应用接口集合起来协同工作,共同对外提供数据存储和业务访问功能的一个存储系统。在本申请实施例中,可将网络配置等信息均保存在该存储系统中,便于服务器调取。
目前,存储系统的存储方法为:创建逻辑卷,在创建逻辑卷时,就为每个逻辑卷分配物理存储空间,该物理存储空间可能是某个存储设备或者某几个存储设备的磁盘组成。客户端在某一逻辑卷上存储数据,也就是将数据存储在文件系统上,文件系统将数据分成许多部分,每一部分是一个对象,对象不仅包含数据而且还包含数据标识(ID,ID entity)等额外的信息,文件系统将每个对象分别写入该逻辑卷的物理存储空间,且文件系统会记录每个对象的存储位置信息,从而当客户端请求访问数据时,文件系统能够根据每个对象的存储位置信息让客户端对数据进行访问。
存储系统为逻辑卷分配物理存储空间的过程,具体为:按照对存储于逻辑卷的对象的容量估量(该估量往往相对于实际要存储的对象的容量有很大余量)和独立冗余磁盘阵列(RAID,Redundant Array of Independent Disk)的组别,预先将物理存储空间划分成分条,一个逻辑卷可以理解为一个分条,从而为逻辑卷分配了物理存储空间。
数据库(Database),简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、查询、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。
数据库管理系统(英语:Database Management System,简称DBMS)是为管理数据库而设计的电脑软件系统,一般具有存储、截取、安全保障、备份等基础功能。数据库管理系统可以依据它所支持的数据库模型来作分类,例如关系式、XML(Extensible MarkupLanguage,即可扩展标记语言);或依据所支持的计算机类型来作分类,例如服务器群集、移动电话;或依据所用查询语言来作分类,例如SQL(结构化查询语言,Structured QueryLanguage)、XQuery;或依据性能冲量重点来作分类,例如最小规模、最高运行速度;亦或其他的分类方式。不论使用哪种分类方式,一些DBMS能够跨类别,例如,同时支持多种查询语言。在本申请实施例中,可将识别结果存储在该数据库管理系统中,便于服务器调取。
其中,需要特别说明的是,本申请实施例涉及的服务终端,可以是指向服务终端提供语音和/或数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。例如移动电话(或称为“蜂窝”电话)和具有移动终端的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语音和/或数据。例如,个人通信业务(英文全称:Personal Communication Service,英文简称:PCS)电话、无绳电话、会话发起协议(SIP)话机、无线本地环路(Wireless LocalLoop,英文简称:WLL)站、个人数字助理(英文全称:Personal Digital Assistant,英文简称:PDA)等设备。
请参阅图1,图1为本申请实施例提供的伪造对象检测方法的应用场景示意图。该伪造对象检测方法应用于图1中的计算机设备10中,在一些实施例中,该计算机设备10中设有目标对象检测器、特征编码器以及原型集合,该原型集合包括至少一个真实类型的真实原型以及至少一个虚假类型的虚假原型。通过本实施例提供的伪造对象检测方法可以检测待检测数据中目标对象的真伪情况。
在一具体的实施例中,该待检测数据可以为一张图像,目标对象可以为人脸,此时,需要通过目标对象检测器从图像中检测并裁剪出人脸图像,然后将人脸图像输入特征编码器中,通过特征编码器获取人脸图像对应的目标对象特征,然后计算该目标对象特征与原型集合中各原型之间的特征距离,得到第一特征距离集合以及第二特征距离集合,其中,所述第一特征距离集合包括所述目标对象特征与至少一个真实类型的真实原型中各所述真实原型的特征距离,所述第二特征距离集合包括所述目标对象特征与至少一个虚假类型的虚假原型中各所述虚假原型的特征距离;然后基于所述第一特征距离集合确定平均特征距离,以及基于所述第二特征距离集合确定最小特征距离;最后根据所述平均特征距离以及所述最小特征距离确定人脸图像的是否符合预设伪造条件,若符合预设伪造条件,则说明该人脸图像为伪造图像,否则,该人脸图像为真实图像。
需要说明的是,待检测数据可以为图像,也可以为视频或音频等,具体数据类型此处不作限定。目标对象可以为人脸,也可以为其他对象,例如印章等,具体对象类型此处不作限定。
为了方便理解,以下具体步骤以待检测数据的数据类型为图像,目标对象为对象类型为人脸进行举例说明。
需要说明的是,在使用本申请提供的伪造对象检测方法进行伪造对象检测之前,首先需要进行对预设原型集合中对的各预设原型进行训练,得到训练后的至少一个真实类型的真实原型以及至少一个虚假类型的虚假原型的训练,其中,请参阅图2,图2为本申请提供的伪造对象检测方法中的原型集合的训练流程示意图。
如图2所示,该伪造对象检测方法中各原型的训练方法包括以下步骤S110-S180。
S110、获取初始样本集合。
其中,本实施例在计算机设备中存有预设原型集合,所述预设原型集合包括至少一个真实类型的预设真实原型以及至少一个虚假类型的预设虚假原型,所述初始样本集合包括预设原型集合中各预设原型分别对应的多个样本。
例如,给定N个真实类型的数据源
Figure BDA0004158858410000091
K个伪造类型的数据源Μ={Mi|i=1,…,K},其中N和K不一定相等。其中,每个数据源表示一个类型的样本,每个数据源对应多个样本。本实施例使用X表示输入空间,Y表示输出空间。对于/>
Figure BDA0004158858410000092
其二分类标签(类别标签)yb=0,多分类标签(类型标签)ym=0,或为具体的真实类型标签,对于x∈M,其二分类标签yb=1,多分类标签ym∈{1,…,K}。
在一些实施例中,伪造对象检测的任务要求为,给定一张人脸图片x,预测其二分类标签
Figure BDA0004158858410000101
其中0表示真类,1表示假类。
在一些实施例中,使用{mij}表示原型集合,其中i∈{0,1}表示真假类别索引,i=0代表真实类别,i=1表示虚假类别,j表示不同类别的原型索引(真实类型或虚假类型的具体索引,类型标签),真实类别和虚假类别的原型数量分别为N(N个真实类型分别对应的原型)和K(K个虚假类型分别对应的原型),且N和K不一定相等。
此时,当N为5,K为7时,5个真实原型可以分别使用{m01}、{m02}、{m03}、{m04}以及{m05}表示,7个虚假原型可以分别使用{m11}、{m12}、{m13}、{m14}、{m15}、{m16}以及{m17}表示,本申请需要为每个类型的原型分别设置多个样本。
其中,每种类型的虚假人脸都可以由不同的算法生成,由于不同的伪造算法生成的人脸图像所遗留的伪造痕迹也有所不同,故本实施例可以根据不同的伪造算法设置不同的原型,一种伪造算法对应一个虚假原型,例如人脸重演伪造算法对应一个虚假原型,人脸合成伪造算法对应另一个虚假原型等等。此外,对于真实原型,可以根据环境类型设置,例如为阴天环境下采集到的真实人脸图像训练一个真实原型、为晴天环境下采集到的真实人脸图像训练一个真实原型等等。
S120、从所述初始样本集合中确定目标样本特征。
具体地,本实施例中,初始样本集合中包含有多个样本特征,此时从初始样本集合中随机选取一个样本特征作为目标样本特征。
在一些实施例中,为了提高原型的训练速度,初始样本集合中的样本可以为对应图像的样本特征,不需要进一步从图像中提取样本特征,进而提高原型训练的速度。
在另一些实施例中,为了使得特征编码器与原型集合进行联合训练,提高训练精度,初始样本集合中样本为进行特征提取前的样本,例如为样本图像,此时,需要从所述初始样本集合中先确定目标样本(如目标样本图像);然后将所述目标样本输入预设特征编码器,对所述目标样本进行特征编码,得到所述目标样本特征。由于训练时对样本的处理同时涉及了特征编码器以及原型集合,故此时可以根据损失函数实现特征编码器与原型集合的联合训练。
S130、确定第一样本特征距离集合以及第二样本特征距离集合。
当确定了目标样本特征之后,需要计算目标样本特征与预设原型集合中各预设原型之间的特征距离,其中,该特征距离可以为余弦距离或欧氏距离等。
此时,本实施例中的所述第一样本特征距离集合包括所述目标样本特征与各所述预设真实原型的特征距离,所述第二样本特征距离集合包括所述目标样本特征与各所述预设虚假原型的特征距离。
即,将目标样本特征与预设原型集合中各预设的真实原型之间的特征距离归为第一样本特征距离集合,将目标样本特征与预设原型集合中各预设的真实原型之间的特征距离归为第二样本特征距离集合。
以下以特征距离为欧式距离进行距离说明。
本实施例中,目标样本特征为f(x),本步骤需要计算f(x)与原型集合{mij}中各原型的欧式距离,其中计算公式如下:
Figure BDA0004158858410000111
欧氏距离用来度量目标样本x和原型之间的相似度,因此,目标样本x属于原型mi的概率可以用公式(2)近似表示:
p(x∈mi|x)∝-d(f(x),mi);(2)
S140、基于所述第一样本特征距离集合确定平均样本特征距离,以及基于所述第二样本特征距离集合确定最小样本特征距离。
本实施例中,当确定了第一样本特征集合以及第二样本特征集合之后,计算第一样本特征集合中各特征距离的平均样本特征距离,以及确定第二样本特征集合中的最小样本特征距离。
具体地,当确定了第一样本特征距离集合之后,根据公式(3)确定第一样本特征距离集合中各样本特征的平均样本特征距离;
Figure BDA0004158858410000112
根据公式(4)确定第二样本特征距离集合中的最小样本特征距离:
d(f(x),mi)=mind(f(x),mij),i=1,j∈{1,…,K}; (4)
S150、根据所述平均样本特征距离、所述最小样本特征距离以及所述目标样本特征对应的样本类型标签确定所述预设原型集合的损失函数。
本实施例中,样本x属于原型mi的概率可以进一步由公式(5)表示:
Figure BDA0004158858410000113
其中,当i为0时,原型mi为真实原型,当i为1时,原型mi为虚假原型,式(5)中γ用来控制学习任务难度,取值可以为1,也可以为根据实际训练需要设为其他值,具体此处不作限定。
由于yb为二分类标签,原型mi为真实原型或虚假原型,故为给定样本(x,yb),样本x属于yb的概率即样本x属于原型mi的概率,此时,样本x的二分类概率由公式(6)表示:
Figure BDA0004158858410000121
当损失函数为基于距离度量的损失函数时,此时,通过公式(7)计算损失函数:
Lb=-log p(yb|x); (7)
在一些实施例中,步骤S150具体包括:
a.根据所述平均样本特征距离的相反数以及预设的分类函数确定所述目标样本特征为真实对象的第三概率。
具体地,将根据公式(3)得到的平均样本特征距离的相反数代入公式(6)中的-d(f(x),mi),即可确定目标样本特征为真实对象的第三概率。
b.根据所述最小样本特征距离的相反数以及所述分类函数确定所述目标样本特征为伪造对象的第四概率。
具体地,将根据公式(4)得到的平均样本特征距离的相反数代入公式(6)中的-d(f(x),mi),即可确定目标样本特征为伪造对象的第三概率。
c.若所述样本类型标签为真实对象对应的标签,则根据所述第三概率确定所述损失函数。
具体地,若样本类型标签为真实对象对应的标签,即yb=0时,将步骤a计算得到的第三概率代入公式(7)中,得到损失函数Lb
d.若所述样本标签为伪造对象对应的标签,则根据所述第四概率确定所述损失函数。
具体地,若样本类型标签为伪造对象对应的标签,即yb=1时,将步骤b计算得到的第四概率代入公式(7)中,得到损失函数Lb。
在一些实施例中,为了让不同类型原型在特征空间更加紧凑,且同时保持不同类型原型之间的多样性,设计了原型中心损失,让样本特征f(x)跟其真值标签(yb,ym)对应的原型
Figure BDA0004158858410000122
之间的欧氏距离尽可能的小。
此时,本实施例中的损失函数包括基于距离度量的损失函数以及原型中心损失函数,其中,原型中心损失函数由公式(8)定义:
Figure BDA0004158858410000123
最终的损失函数由基于距离度量的损失函数和原型中心损失函数两部分组成,由公式(9)定义:
L=Lb+λLc; (9)
其中,λ是Lc的权重。
此时,通过以下步骤计算损失函数:
若所述样本类型标签为真实对象对应的标签,则根据所述第三概率确定所述基于距离度量的损失函数,并根据所述目标样本特征与目标预设原型间的目标特征距离确定所述原型中心损失函数,所述目标预设原型为所述预设原型集合中与所述样本类型标签对应的预设原型;若所述样本类型标签为伪造对象对应的标签,则根据所述第四概率确定所述基于距离度量的损失函数,并根据所述目标样本特征与目标预设原型间的目标特征距离确定所述原型中心损失函数。
S160、确定所述预设原型集合是否收敛,若是,则执行步骤S180,若否,则执行步骤S170。
具体地,判断当前训练是否符合预设的收敛条件,该收敛条件可以为训练次数达到预设次数,或者损失函数的值符合预设条件,例如计算出来的损失函数小于预设损失函数值。
S170、根据所述损失函数对所述预设原型集合进行训练,并根据所述初始样本集合更新所述目标样本特征,返回执行步骤S130。
本实施例中,如果预设原型集合未收敛,则需要根据初始样本集合更新目标样本特征,例如,从初始样本集合中随机选取另一个样本作为目标样本,然后获取该目标样本的目标样本特征,然后返回执行步骤S130,直至预设原型集合收敛。
S180、将所述预设原型集合确定为目标原型集合。
其中,所述目标原型集合包括至少一个所述真实原型以及至少一个所述虚假原型。
本实施例中,若确定预设原型集合收敛,则确定该预设原型集合训练完毕,将该预设原型集合确定为目标原型集合,此时目标原型集合包括至少一个所述真实原型以及至少一个所述虚假原型,该真实原型根据预设原型集合中对应的预设真实原型训练得到,该虚假原型根据预设原型集合中对应的预设虚假原型训练得到。
综上所述,第一方面,本实施例对于不同类别和类型的目标对象分别学习不同的原型,能够充分不做到更多样的伪造特征;第二方面,本实施例对于不同原型使用中心损失函数参与训练,让属于该原型的样本在特征空间中更加紧凑,从而学习到区分性更强的特征;第三方面,本实施例原型集合中真实原型与虚假原型的数量可以相同也可以不同,数量是否对称不影响伪造对象检测的准确性。
当训练好各原型之后,给定一张人脸图片,通过本申请提供的伪造对象检测方法即可预测其二分类标签,其中0表示真实类别,1表示虚假类别。
以下对本申请提供的伪造对象检测方法进行详细说明,请参阅图3,图3是本申请实施例提供的伪造对象检测方法的流程示意图。如图3所示,该方法包括以下步骤S210-S240。
以下具体步骤以待检测数据的数据类型为图像,目标对象为对象类型为人脸进行举例说明。
S210、获取待检测数据中目标对象的目标对象特征。
具体地,在一些实施例中,首先获取待检测数据;然后对所述待检测数据进行目标对象检测,在所述待检测数据中确定目标对象对应的数据;对所述目标对象对应的数据进行特征编码,得到所述目标对象特征。在另一些实施例中,该待检测数据可以从另一终端获取得到,也可以从云端下载获取得到,待检测数据的获取方式以及路径此处不做限定。
例如,获取包含人脸图像的待检测图像,然后使用预设的目标对象检测器检测待检测图像中的人脸图像,并将检测到的人脸图像裁剪下来,作为特征编码器的输入,然后特征编码器对输入的人脸图像进行特征编码,将得到的人脸特征作为目标对象特征。
在另一些实施例中,可以直接获取目标对象特征。
S220、确定第一特征距离集合以及第二特征距离集合。
其中,所述第一特征距离集合包括所述目标对象特征与至少一个真实类型的真实原型中各所述真实原型的特征距离,所述第二特征距离集合包括所述目标对象特征与至少一个虚假类型的虚假原型中各所述虚假原型的特征距离。
具体地,将目标对象特征设为f(x),此时,可通过公式(1)确定目标对象特征与原型集合中各原型的特征距离,并将与各真实原型间的特征距离归为第一特征距离集合,将与各虚假原型间的特征距离归为第二特征距离集合。
S230、基于所述第一特征距离集合确定平均特征距离,以及基于所述第二特征距离集合确定最小特征距离。
具体地,可根据公式(3)确定第一特征距离集合的平均特征距离,以及根据公式(4)确定第二特征距离集合中的最小特征距离。
S240、根据所述平均特征距离以及所述最小特征距离确定所述目标对象是否符合预设伪造条件。
具体地,在一些实施例中,根据以下步骤确定目标对象是否符合预设伪造条件:
根据所述平均特征距离的相反数以及预设的分类函数确定所述目标对象为真实对象的第一概率;根据所述最小特征距离的相反数以及所述分类函数确定所述目标对象为伪造对象的第二概率;若所述第一概率大于所述第二概率,则确定所述目标对象不符合所述预设伪造条件;若所述第一概率小于或等于所述第二概率,则确定所述目标对象符合所述预设伪造条件。
其中,第一概率的计算方式可参考图2对应实施例中第三概率的计算方式,具体此处不作赘述,第二概率的计算方式可参考图2对应实施例中第四概率的计算方式,具体此处也不作赘述。
具体地,本实施例中的预设伪造条件可以为:平均特征距离小于或等于最小特征距离,或者平均特征距离对应的第一概率小于或等于最小特征距离对应的第二概率,或者其他预设条件,若符合预设条件,则说明目标对象为伪造对象,否则为真实对象。
在一些实施例中,计算出第一概率和第二概率之后,选择概率最大的类别作为目标对象的类别,例如,若第一概率较大,则将第一概率对应的真实对象确定为目标对象的类别,若第二概率较大,则将第二概率对应的伪造对象确定为目标对象的类别。
具体可由公式(10)定义:
Figure BDA0004158858410000151
综上所述,一方面,由于本方案为不同的真实类型以及不同的虚假类型的对象分别设置有对应的原型,故本方案可以充分学习到不同的类型的对象特征,能够充分捕捉到各种类型对象的特征,避免特征丢失,从而提高伪造对象检测的准确率;另一方面,由于本方案针对真实原型以及虚假原型分别设置有不同的特征距离计算方式,故本方案对于伪造对象的真伪检测不受真实原型以及虚假原型数量的影响。
为了验证本申请的有效性,发明人使用伪造人脸数据集ForgeryNet(一个非常大的人脸伪造数据集)进行了虚假人脸二分类实验。ForgeryNet包含4种不同类型的真实人脸数据和15种伪造方法合成的虚假人脸数据。本实验使用ResNet50网络作为基线模型,并与基于中心损失训练的模型ResNet50_Center和本申请方法AProNet(包含原型集合)进行比较。评估指标选择曲线面积(Area under Curve,AUC)(处于ROC曲线下方的面积的大小)和TPR(召回率)@FPR(误报率),TPR@FPR为固定误报率下的召回率。
在实际应用场景中,伪造人脸出现的比率极低,大量的数据都是真实人脸,因此,需要考虑真实样本识别成伪造样本的误报率,此处,分别比较TPR@FPR=0.01%和TPR@FPR=0.1%两种情况。其中,不同模型在ForgeryNet数据上的虚假人脸性能检测结果如表1所示:
表1
模型 AUC TPR@FPR=0.01% TPR@FPR=0.1%
ResNet50 0.9949 77.13% 84.89%
ResNet50_Center 0.9936 72.72% 84.90%
AProNet 0.9945 81.53% 88.88%
实验结果如表1所示,本申请的方法AProNet在TPR@FPR=0.01%和TPR@FPR=0.1%指标下分别超过基线方法4.4%和3.99%,充分证明了本申请方法的优越性。
此外,为了可视化展示所学习到特征,使用t-SNE(t-Distributed StochasticNeighbor Embedding)可视化ForgeryNet数据集中的部分样本,结果如图4所示。从图4中的(a)和(b)中可以观察到,不同伪造数据(通过颜色的深浅区分不同类型的数据)会自然的有所不同,只简单地使用度量损失让真假类别数据各自紧凑,并不能达到更好的效果。从(a)和(c)中可以观察到,本申请方法AProNet相较于ResNet50,在特征空间中不同伪造方法数据的特征更加紧凑,真假类型数据也更加离散。
图1至图4中任一项所对应的实施例中所提及的任一技术特征也同样适用于本申请实施例中的图5至图8所对应的实施例,后续类似之处不再赘述。
以上对本申请实施例中一种伪造对象检测方法进行说明,以下对执行上述伪造对象检测方法的伪造对象检测装置(例如服务器、用户终端)进行介绍。
参阅图5,如图5所示的一种伪造对象检测装置500的结构示意图,其可应用于伪造对象真伪检测场景。本申请实施例中的伪造对象检测装置500能够实现对应于上述图1-图4中任一所对应的实施例中所执行的伪造对象检测方法的步骤。伪造对象检测装置500实现的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块,所述模块可以是软件和/或硬件。所述伪造对象检测装置500可包括收发模块501、处理模块502和显示单元(图5中未标识出),具体地,请参阅图5,该伪造对象检测装置500包括收发模块501和处理模块502,其中:
收发模块501,用于获取待检测数据中目标对象的目标对象特征;
处理模块502,用于确定第一特征距离集合以及第二特征距离集合,所述第一特征距离集合包括所述目标对象特征与至少一个真实类型的真实原型中各所述真实原型的特征距离,所述第二特征距离集合包括所述目标对象特征与至少一个虚假类型的虚假原型中各所述虚假原型的特征距离;基于所述第一特征距离集合确定平均特征距离,以及基于所述第二特征距离集合确定最小特征距离;根据所述平均特征距离以及所述最小特征距离确定所述目标对象是否符合预设伪造条件。
在一些实施例中,所述处理模块502在执行所述根据所述平均特征距离以及所述最小特征距离确定所述目标对象是否符合预设伪造条件步骤时,具体用于:
根据所述平均特征距离的相反数以及预设的分类函数确定所述目标对象为真实对象的第一概率;
根据所述最小特征距离的相反数以及所述分类函数确定所述目标对象为伪造对象的第二概率;
若所述第一概率大于所述第二概率,则确定所述目标对象不符合所述预设伪造条件;
若所述第一概率小于或等于所述第二概率,则确定所述目标对象符合所述预设伪造条件。
在一些实施例中,在所述收发模块501执行所述获取待检测数据中目标对象的目标对象特征步骤之前,所述处理模块502还用于:
通过所述收发模块501获取初始样本集合,所述初始样本集合包括预设原型集合中各预设原型分别对应的多个样本,所述预设原型集合包括至少一个真实类型的预设真实原型以及至少一个虚假类型的预设虚假原型;
从所述初始样本集合中确定目标样本特征;
确定第一样本特征距离集合以及第二样本特征距离集合,所述第一样本特征距离集合包括所述目标样本特征与各所述预设真实原型的特征距离,所述第二样本特征距离集合包括所述目标样本特征与各所述预设虚假原型的特征距离;
基于所述第一样本特征距离集合确定平均样本特征距离,以及基于所述第二样本特征距离集合确定最小样本特征距离;
根据所述平均样本特征距离、所述最小样本特征距离以及所述目标样本特征对应的样本类型标签确定所述预设原型集合的损失函数;
若确定所述预设原型集合未收敛,则根据所述损失函数对所述预设原型集合进行训练,并根据所述初始样本集合更新所述目标样本特征,返回执行所述确定第一样本特征距离集合以及第二样本特征距离集合步骤;
若确定所述预设原型集合收敛,则将所述预设原型集合确定为目标原型集合,所述目标原型集合包括至少一个所述真实原型以及至少一个所述虚假原型。
在一些实施例中,所述处理模块502在执行所述根据所述平均样本特征距离、所述最小样本特征距离以及所述目标样本特征对应的样本类型标签确定所述预设原型集合的损失函数步骤时,具体用于:
根据所述平均样本特征距离的相反数以及预设的分类函数确定所述目标样本特征为真实对象的第三概率;
根据所述最小样本特征距离的相反数以及所述分类函数确定所述目标样本特征为伪造对象的第四概率;
若所述样本类型标签为真实对象对应的标签,则根据所述第三概率确定所述损失函数;
若所述样本标签为伪造对象对应的标签,则根据所述第四概率确定所述损失函数。
在一些实施例中,所述损失函数包括基于距离度量的损失函数以及原型中心损失函数;所述处理模块502在执行所述若所述样本类型标签为真实对象对应的标签,则根据所述第三概率确定所述损失函数;若所述样本标签为伪造对象对应的标签,则根据所述第四概率确定所述损失函数步骤时,具体用于:
若所述样本类型标签为真实对象对应的标签,则根据所述第三概率确定所述基于距离度量的损失函数,并根据所述目标样本特征与目标预设原型间的目标特征距离确定所述原型中心损失函数,所述目标预设原型为所述预设原型集合中与所述样本类型标签对应的预设原型;
若所述样本类型标签为伪造对象对应的标签,则根据所述第四概率确定所述基于距离度量的损失函数,并根据所述目标样本特征与目标预设原型间的目标特征距离确定所述原型中心损失函数。
在一些实施例中,所述处理模块502在执行所述从所述初始样本集合中确定目标样本特征步骤时,具体用于:
从所述初始样本集合中确定目标样本;
将所述目标样本输入预设特征编码器,对所述目标样本进行特征编码,得到所述目标样本特征。
在一些实施例中,所述处理模块502在执行所述根据所述损失函数对所述预设原型集合进行训练步骤时,具体用于:
根据所述损失函数对所述预设原型集合以及所述预设特征编码器进行联合训练。
在一些实施例中,所述收发模块501在执行所述获取待检测数据中目标对象的目标对象特征步骤时,具体用于:
获取待检测数据;
通过所述处理模块502对所述待检测数据进行目标对象检测,在所述待检测数据中确定目标对象对应的数据;对所述目标对象对应的数据进行特征编码,得到所述目标对象特征。
本申请实施例中,一方面,由于本方案为不同的真实类型以及不同的虚假类型的对象分别设置有对应的原型,故处理模块502可以充分学习到不同的类型的对象特征,能够充分捕捉到各种类型对象的特征,避免特征丢失,从而提高伪造对象检测的准确率;另一方面,由于本方案针对真实原型以及虚假原型分别设置有不同的特征距离计算方式,故处理模块502对于伪造对象的真伪检测不受真实原型以及虚假原型数量的影响。
上面从模块化功能实体的角度对本申请实施例中的伪造对象检测装置进行了描述,下面从硬件处理的角度分别对本申请实施例中的伪造对象检测装置进行描述。
需要说明的是,在本申请实施例各实施例(包括图5所示的各实施例)中所有的收发模块对应的实体设备可以为收发器,所有的处理模块对应的实体设备可以为处理器。当其中一种装置具有如图5所示的结构时,处理器、收发器和存储器实现前述对应该装置的装置实施例提供的所述收发模块和所述处理模块相同或相似的功能,图6中的存储器存储处理器执行上述伪造对象检测方法时需要调用的计算机程序。
图5所示的装置可以具有如图6所示的结构,当图5所示的装置具有如图6所示的结构时,图6中的处理器能够实现前述对应该装置的装置实施例提供的所述处理模块相同或相似的功能,图6中的收发器能够实现前述对应该装置的装置实施例提供的所述收发模块相同或相似的功能,图6中的存储器存储处理器执行上述伪造对象检测方法时需要调用的计算机程序。在本申请实施例图5所示的实施例中的所述收发模块所对应的实体设备可以为输入输出接口,所述处理模块对应的实体设备可以为处理器。
本申请实施例还提供了一种终端设备,如图7所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端设备可以为包括手机、平板电脑、个人数字助理(英文全称:Personal Digital Assistant,英文简称:PDA)、销售终端(英文全称:Point of Sales,英文简称:POS)、车载电脑等任意终端设备,以终端为手机为例:
图7示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图7,手机包括:射频(英文全称:Radio Frequency,英文简称:RF)电路55、存储器520、输入单元530、显示单元540、传感器550、音频电路560、无线保真(英文全称:wirelessfidelity,英文简称:Wi-Fi)模块570、处理器580、以及电源590等部件。本领域技术人员可以理解,图7中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图7对手机的各个构成部件进行具体的介绍:
RF电路55可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器580处理;另外,将设计上行的数据发送给基站。通常,RF电路55包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(英文全称:Low NoiseAmplifier,英文简称:LNA)、双工器等。此外,RF电路55还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(英文全称:Global System of Mobile communication,英文简称:GSM)、通用分组无线服务(英文全称:General Packet Radio Service,英文简称:GPRS)、码分多址(英文全称:Code Division Multiple Access,英文简称:CDMA)、宽带码分多址(英文全称:WidebandCode Division Multiple Access,英文简称:WCDMA)、长期演进(英文全称:Long TermEvolution,英文简称:LTE)、电子邮件、短消息服务(英文全称:Short Messaging Service,英文简称:SMS)等。
存储器520可用于存储软件程序以及模块,处理器580通过运行存储在存储器520的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器520可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元530可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元530可包括触控面板531以及其他输入设备532。触控面板531,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板531上或在触控面板531附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板531可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器580,并能接收处理器580发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板531。除了触控面板531,输入单元530还可以包括其他输入设备532。具体地,其他输入设备532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元540可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元540可包括显示面板541,可选的,可以采用液晶显示器(英文全称:LiquidCrystal Display,英文简称:LCD)、有机发光二极管(英文全称:Organic Light-EmittingDiode,英文简称:OLED)等形式来配置显示面板541。进一步的,触控面板531可覆盖显示面板541,当触控面板531检测到在其上或附近的触摸操作后,传送给处理器580以确定触摸事件的类型,随后处理器580根据触摸事件的类型在显示面板541上提供相应的视觉输出。虽然在图7中,触控面板531与显示面板541是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板531与显示面板541集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器550,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板541的亮度,接近传感器可在手机移动到耳边时,关闭显示面板541和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路560、扬声器561,传声器562可提供用户与手机之间的音频接口。音频电路560可将接收到的音频数据转换后的电信号,传输到扬声器561,由扬声器561转换为声音信号输出;另一方面,传声器562将收集的声音信号转换为电信号,由音频电路560接收后转换为音频数据,再将音频数据输出处理器580处理后,经RF电路55以发送给比如另一手机,或者将音频数据输出至存储器520以便进一步处理。
Wi-Fi属于短特征距离无线传输技术,手机通过Wi-Fi模块570可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图7示出了Wi-Fi模块570,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变申请的本质的范围内而省略。
处理器580是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器520内的软件程序和/或模块,以及调用存储在存储器520内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器580可包括一个或多个处理单元;优选的,处理器580可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器580中。
手机还包括给各个部件供电的电源590(比如电池),电源可以通过电源管理系统与处理器580逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该手机所包括的处理器580还具有控制执行以上由图2和图3所示的伪造对象检测方法的流程图。
图8是本申请实施例提供的一种服务器结构示意图,该服务器620可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(英文全称:centralprocessing units,英文简称:CPU)622(例如,一个或一个以上处理器)和存储器632,一个或一个以上存储应用程序642或数据644的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器622可以设置为与存储介质630通信,在服务器620上执行存储介质630中的一系列指令操作。
服务器620还可以包括一个或一个以上电源626,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口658,和/或,一个或一个以上操作系统641,例如Windows Server,Mac OS X,Unix,Linux,FreeBSD等等。
上述实施例中由服务器所执行的步骤可以基于该图8所示的服务器620的结构。例如上述实施例中由图2及图3所示的服务器的步骤可以基于该图8所示的服务器结构。例如,所述处理器622通过调用存储器632中的指令,执行以下操作:
获取待检测数据中目标对象的目标对象特征;
确定第一特征距离集合以及第二特征距离集合,所述第一特征距离集合包括所述目标对象特征与至少一个真实类型的真实原型中各所述真实原型的特征距离,所述第二特征距离集合包括所述目标对象特征与至少一个虚假类型的虚假原型中各所述虚假原型的特征距离;
基于所述第一特征距离集合确定平均特征距离,以及基于所述第二特征距离集合确定最小特征距离;
根据所述平均特征距离以及所述最小特征距离确定所述目标对象是否符合预设伪造条件。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请实施例所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请实施例各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机计算机程序时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
以上对本申请实施例所提供的技术方案进行了详细介绍,本申请实施例中应用了具体个例对本申请实施例的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请实施例的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请实施例的限制。

Claims (10)

1.一种伪造对象检测方法,其特征在于,包括:
获取待检测数据中目标对象的目标对象特征;
确定第一特征距离集合以及第二特征距离集合,所述第一特征距离集合包括所述目标对象特征与至少一个真实类型的真实原型中各所述真实原型的特征距离,所述第二特征距离集合包括所述目标对象特征与至少一个虚假类型的虚假原型中各所述虚假原型的特征距离;
基于所述第一特征距离集合确定平均特征距离,以及基于所述第二特征距离集合确定最小特征距离;
根据所述平均特征距离以及所述最小特征距离确定所述目标对象是否符合预设伪造条件。
2.根据权利要求1所述的方法,其特征在于,所述根据所述平均特征距离以及所述最小特征距离确定所述目标对象是否符合预设伪造条件,包括:
根据所述平均特征距离的相反数以及预设的分类函数确定所述目标对象为真实对象的第一概率;
根据所述最小特征距离的相反数以及所述分类函数确定所述目标对象为伪造对象的第二概率;
若所述第一概率大于所述第二概率,则确定所述目标对象不符合所述预设伪造条件;
若所述第一概率小于或等于所述第二概率,则确定所述目标对象符合所述预设伪造条件。
3.根据权利要求1所述的方法,其特征在于,所述获取待检测数据中目标对象的目标对象特征之前,所述方法还包括:
获取初始样本集合,所述初始样本集合包括预设原型集合中各预设原型分别对应的多个样本,所述预设原型集合包括至少一个真实类型的预设真实原型以及至少一个虚假类型的预设虚假原型;
从所述初始样本集合中确定目标样本特征;
确定第一样本特征距离集合以及第二样本特征距离集合,所述第一样本特征距离集合包括所述目标样本特征与各所述预设真实原型的特征距离,所述第二样本特征距离集合包括所述目标样本特征与各所述预设虚假原型的特征距离;
基于所述第一样本特征距离集合确定平均样本特征距离,以及基于所述第二样本特征距离集合确定最小样本特征距离;
根据所述平均样本特征距离、所述最小样本特征距离以及所述目标样本特征对应的样本类型标签确定所述预设原型集合的损失函数;
若确定所述预设原型集合未收敛,则根据所述损失函数对所述预设原型集合进行训练,并根据所述初始样本集合更新所述目标样本特征,返回执行所述确定第一样本特征距离集合以及第二样本特征距离集合步骤;
若确定所述预设原型集合收敛,则将所述预设原型集合确定为目标原型集合,所述目标原型集合包括至少一个所述真实原型以及至少一个所述虚假原型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述平均样本特征距离、所述最小样本特征距离以及所述目标样本特征对应的样本类型标签确定所述预设原型集合的损失函数,包括:
根据所述平均样本特征距离的相反数以及预设的分类函数确定所述目标样本特征为真实对象的第三概率;
根据所述最小样本特征距离的相反数以及所述分类函数确定所述目标样本特征为伪造对象的第四概率;
若所述样本类型标签为真实对象对应的标签,则根据所述第三概率确定所述损失函数;
若所述样本标签为伪造对象对应的标签,则根据所述第四概率确定所述损失函数。
5.根据权利要求4所述的方法,其特征在于,所述损失函数包括基于距离度量的损失函数以及原型中心损失函数;所述若所述样本类型标签为真实对象对应的标签,则根据所述第三概率确定所述损失函数;若所述样本标签为伪造对象对应的标签,则根据所述第四概率确定所述损失函数,包括:
若所述样本类型标签为真实对象对应的标签,则根据所述第三概率确定所述基于距离度量的损失函数,并根据所述目标样本特征与目标预设原型间的目标特征距离确定所述原型中心损失函数,所述目标预设原型为所述预设原型集合中与所述样本类型标签对应的预设原型;
若所述样本类型标签为伪造对象对应的标签,则根据所述第四概率确定所述基于距离度量的损失函数,并根据所述目标样本特征与目标预设原型间的目标特征距离确定所述原型中心损失函数。
6.根据权利要求3至5中任一项所述的方法,其特征在于,所述从所述初始样本集合中确定目标样本特征,包括:
从所述初始样本集合中确定目标样本;
将所述目标样本输入预设特征编码器,对所述目标样本进行特征编码,得到所述目标样本特征。
7.根据权利要求6所述的方法,其特征在于,所述根据所述损失函数对所述预设原型集合进行训练,包括:
根据所述损失函数对所述预设原型集合以及所述预设特征编码器进行联合训练。
8.一种伪造对象检测装置,其特征在于,包括:
收发模块,用于获取待检测数据中目标对象的目标对象特征;
处理模块,用于确定第一特征距离集合以及第二特征距离集合,所述第一特征距离集合包括所述目标对象特征与至少一个真实类型的真实原型中各所述真实原型的特征距离,所述第二特征距离集合包括所述目标对象特征与至少一个虚假类型的虚假原型中各所述虚假原型的特征距离;基于所述第一特征距离集合确定平均特征距离,以及基于所述第二特征距离集合确定最小特征距离;根据所述平均特征距离以及所述最小特征距离确定所述目标对象是否符合预设伪造条件。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时可实现如权利要求1-7中任一项所述的方法。
CN202310343733.4A 2023-03-31 2023-03-31 伪造对象检测方法、相关装置及存储介质 Pending CN116363490A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310343733.4A CN116363490A (zh) 2023-03-31 2023-03-31 伪造对象检测方法、相关装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310343733.4A CN116363490A (zh) 2023-03-31 2023-03-31 伪造对象检测方法、相关装置及存储介质

Publications (1)

Publication Number Publication Date
CN116363490A true CN116363490A (zh) 2023-06-30

Family

ID=86907115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310343733.4A Pending CN116363490A (zh) 2023-03-31 2023-03-31 伪造对象检测方法、相关装置及存储介质

Country Status (1)

Country Link
CN (1) CN116363490A (zh)

Similar Documents

Publication Publication Date Title
CN110704661B (zh) 一种图像分类方法和装置
CN111914113A (zh) 一种图像检索的方法以及相关装置
CN114973351B (zh) 人脸识别方法、装置、设备及存储介质
CN110674112A (zh) 一种数据查询的方法、装置及电子设备
CN115588131B (zh) 模型鲁棒性检测方法、相关装置及存储介质
CN111159338A (zh) 一种恶意文本的检测方法、装置、电子设备及存储介质
CN114722937A (zh) 一种异常数据检测方法、装置、电子设备和存储介质
CN115022098A (zh) 人工智能安全靶场内容推荐方法、装置及存储介质
CN116778306A (zh) 伪造对象检测方法、相关装置及存储介质
CN114281936A (zh) 分类方法、装置、计算机设备及存储介质
CN116758362A (zh) 图像处理方法、装置、计算机设备及存储介质
CN115376192B (zh) 用户异常行为确定方法、装置、计算机设备及存储介质
CN116071614A (zh) 样本数据处理方法、相关设备及存储介质
CN112995757B (zh) 视频剪裁方法及装置
CN116363490A (zh) 伪造对象检测方法、相关装置及存储介质
CN115412726B (zh) 视频真伪检测方法、装置及存储介质
CN113569043A (zh) 一种文本类别确定方法和相关装置
CN116386647B (zh) 音频验证方法、相关装置、存储介质及程序产品
CN115525554B (zh) 模型的自动化测试方法、系统及存储介质
CN115565215B (zh) 一种人脸识别算法切换方法、装置及存储介质
CN115050079B (zh) 人脸识别方法、装置及存储介质
CN116580268B (zh) 图像目标定位模型的训练方法、图像处理方法及相关产品
CN115909186B (zh) 图像信息识别方法、装置、计算机设备及存储介质
CN117011649B (zh) 一种模型训练方法和相关装置
CN117252983A (zh) 一种对象重建方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination