CN116721330A - 基于生成对抗网络的异类检测方法、装置、设备及介质 - Google Patents
基于生成对抗网络的异类检测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116721330A CN116721330A CN202310722527.4A CN202310722527A CN116721330A CN 116721330 A CN116721330 A CN 116721330A CN 202310722527 A CN202310722527 A CN 202310722527A CN 116721330 A CN116721330 A CN 116721330A
- Authority
- CN
- China
- Prior art keywords
- data
- image data
- detected
- network
- discrimination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 46
- 230000002159 abnormal effect Effects 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 27
- 230000006870 function Effects 0.000 claims description 67
- 238000012549 training Methods 0.000 claims description 33
- 238000013507 mapping Methods 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 18
- 238000003556 assay Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 230000008485 antagonism Effects 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 12
- 238000005516 engineering process Methods 0.000 abstract description 11
- 238000013473 artificial intelligence Methods 0.000 abstract description 7
- 239000013598 vector Substances 0.000 description 37
- 238000010586 diagram Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 210000004205 output neuron Anatomy 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/094—Adversarial learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及人工智能技术领域,尤其涉及一种基于生成对抗网络的异类检测方法、装置、设备及介质。上述方法应用于医疗领域,通过使用生成网络生成待检测图像数据对应的虚拟图像数据,通过判别网络判别虚拟图像数据,确定源数据,使用预设判定函数,计算得到待检测图像数据与源数据之间的判定分数,当判定分数大于第二预设阈值时,确定待检测图像数据为异常数据。本发明中,通过生成网络生成虚拟数据,通过判别网络判别虚拟数据,从虚拟数据中确定源数据,根据源数据与待检测数据之间的距离判定待检测数据是否为异常数据,在无源数据的情况下,检测出异常数据,解决了异常数据检测过程中,无源数据的问题,保护了用户数据的隐私。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于生成对抗网络的异类检测方法、装置、设备及介质。
背景技术
在医疗领域,由于图像类别的多样性,为了快速检测出医疗图像的类别,对医疗图像进行检测时,一般使用医疗图像作为训练数据对图像类别检测模型进行训练,得到训练好的图像类别检测模型,通过使用训练好的图像类别检测模型执行医疗图像检测分类任务,但当目标样本医疗图像为新的类别时,使用训练好的图像类别检测模型无法检测出待检测医疗图像的类别,所以首先需要判断出目标样本医疗图像是否属于模型已知类别,需要对目标样本医疗图像执行新异类检测任务,新异类检测任务是判断一个目标样本属于模型已知类别还是模型未知类别。如果该目标样本不属于模型已知类别的任何一个类别,那么这个样本就是新异类样本。常用的新异类检测检测方法一般包括基于概率统计的检测方法与基于距离的检测方法,但基于基于概率统计的检测方法与基于距离的检测方法都需要访问源数据,源数据往往属于隐私数据,无法获得,因此在无源数据的情况下,如何检测目标样本中的异常数据成为亟待解决的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种基于生成对抗网络的异类检测方法、装置、设备及介质,以解决在在无源数据的情况下,如何检测目标样本中的异常数据的问题。
本申请实施例的第一方面提供了一种基于生成对抗网络的异类检测方法,所述异类检测方法包括:
使用生成网络针对待检测图像数据,生成所述待检测图像数据对应的虚拟图像数据;
获取基于已知类别和样本数据训练得到的判别网络,通过所述判别网络判别所述虚拟图像数据,得到判别结果,当所述判别结果大于第一预设阈值时,将所述判别结果对应的虚拟图像数据确定为源数据;
使用预设判定函数,计算得到所述待检测图像数据与所述源数据之间的判定分数,当所述判定分数大于第二预设阈值时,确定所述待检测图像数据为异常数据。
本申请实施例的第二方面提供了一种基于生成对抗网络的异类检测装置,所述异类检测装置包括:
生成模块,用于使用生成网络针对待检测图像数据,生成所述待检测图像数据对应的虚拟图像数据;
判别模块,用于获取基于已知类别和样本数据训练得到的判别网络,通过所述判别网络判别所述虚拟图像数据,得到判别结果,当所述判别结果大于第一预设阈值时,将所述判别结果对应的虚拟图像数据确定为源数据;
异常数据确定模块,用于使用预设判定函数,计算得到所述待检测图像数据与所述源数据之间的判定分数,当所述判定分数大于第二预设阈值时,确定所述待检测图像数据为异常数据。
第三方面,本发明实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的异类检测方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的异类检测方法。
本发明与现有技术相比存在的有益效果是:
使用生成网络针对待检测图像数据,生成待检测图像数据对应的虚拟图像数据,获取基于已知类别和样本数据训练得到的判别网络,通过判别网络判别虚拟图像数据,得到判别结果,当判别结果大于第一预设阈值时,将判别结果对应的虚拟图像数据确定为源数据,使用预设判定函数,计算得到待检测图像数据与源数据之间的判定分数,当判定分数大于第二预设阈值时,确定待检测图像数据为异常数据。本发明中,通过生成网络生成虚拟数据,通过判别网络判别虚拟数据,从虚拟数据中确定源数据,根据源数据与待检测数据之间的距离判定待检测数据是否为异常数据,在无源数据的情况下,检测出异常数据,解决了异常数据检测过程中,无源数据的问题,保护了用户数据的隐私。当在疾病诊断的过程中,一般根据拍摄的医疗图像的类别判断疾病类别,当需要判断医疗图像的类别是否为新的类别时,使用本申请方法对用户医疗图像进行新异类检测时,无需使用大量用户的医疗图像,可以在保护用户数据隐私的情况下,确定出医疗图像是否为新的类别图像,从而判断出用户是否为新的疾病类别。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种基于生成对抗网络的异类检测方法的一应用环境示意图;
图2是本发明一实施例提供的一种基于生成对抗网络的异类检测方法的流程示意图;
图3是本发明一实施例提供的一种基于生成对抗网络的异类检测装置的结构示意图;
图4是本发明一实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本发明说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本发明说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本发明说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本发明说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本发明的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
应理解,以下实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
本发明一实施例提供的一种基于生成对抗网络的异类检测方法,可应用在如图1的应用环境中,其中,客户端与服务端进行通信。其中,客户端包括但不限于掌上电脑、桌上型计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等计算机设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
参见图2,是本发明一实施例提供的基于生成对抗网络的异类检测方法的流程示意图,上述基于生成对抗网络的异类检测方法可以应用于图1中的服务端,上述服务端连接相应的客户端,如图2所示,该基于生成对抗网络的异类检测方法可以包括以下步骤。
S201:使用生成网络针对待检测图像数据,生成待检测图像数据对应的虚拟图像数据。
在步骤S201中,生成网络针对待检测图像数据,生成待检测图像数据对应的虚拟图像数据,在图像生成网络生成图像的过程中,利用属性编辑参数进行属性编辑操作,使得图像生成网络生成的虚拟图像数据携带属性编辑参数对应的属性。
本实施例中,根据受测机体组织的超声视频获取多张超声图像,从动态的超声视频中提取多帧图像作为超声图像,将超声图像作为待检测图像数据,其中受测机体组织包括乳腺和甲状腺。针对待检测图像数据,使用生成网络生成待检测图像数据对应的虚拟图像数据,生成网络可采用通用的图像生成模型,例如GAN(GenerativeAdversarialNetwork,生成对抗网络)模型,具体可以是StyleGAN的预训练模型、StyleGAN2的预训练模型、ProgressGAN的预训练模型,等等。
可选地,使用生成网络针对待检测图像数据,生成待检测图像数据对应的虚拟图像数据,包括:
提取待检测图像数据的特征数据;
获取随机噪音数据,生成网络根据特征数据与随机噪音数据,生成待检测图像数据对应的虚拟图像数据。
需要说明的是,在使用生成网络生成待检测图像数据对应的虚拟图像数据时,首先训练生成网络,使生成网络可以提取出待检测图像数据的特征数据,待检测图像数据用于生成网络生成图像的向量,例如符合均匀分布、正态分布或者标准正态分布的向量。向量是以数值的方式表示数据。待检测图像数据的特征数据是对待检测图像数据进行特征提取所得到的、用于描述待检测图像数据特征的向量。
通过生成网络,将用于生成虚拟图像数据的待检测图像数据映射为隐编码向量,包括:初始化隐向量空间;从隐向量空间中的隐向量随机采样,获得用于生成图像的原始隐向量;将原始隐向量输入生成网络中的特征映射网络;通过特征映射网络将原始隐向量映射为隐编码向量。
其中,隐向量空间是待检测图像数据所在的向量空间。从隐向量空间随机采样,获得用于生成图像的原始隐向量,将原始隐向量作为待检测图像数据。将原始隐向量输入生成网络中的特征映射网络,通过特征映射网络将原始隐向量映射为隐编码向量。
需要说明的是,生成网络可包括特征映射网络和特征合成网络,通过生成网络生成虚拟图像数据,可以通过特征映射网络将待检测图像数据映射为隐编码向量,通过特征合成网络输出隐编码向量对应的虚拟图像数据,
当需要生成网络生成多种类别的图像属性时,可以在隐编码向量空间中对隐编码向量进行属性编辑操作,隐编码向量空间是隐编码向量所在的向量空间。基于当前的属性编辑参数将隐编码向量朝目标属性的方向进行转换,其中,目标属性为针对待检测图像数据对应的属性,获得携带目标属性的目标隐编码向量后,通过生成网络,生成与目标隐编码向量对应的虚拟图像数据。
其中,属性编辑参数用于对隐编码向量进行属性编辑操作,通过特征映射网络将待检测图像数据映射为隐编码向量,通过属性编辑参数在隐编码向量空间中对隐编码向量进行属性编辑操作,获得携带目标属性的目标隐编码向量后,将目标隐编码向量输入生成网络中的特征合成网络,通过特征合成网络输出与目标隐编码向量对应的虚拟图像数据。
需要说明的是,在对生成网络进行训练时,首先针对待检测图像数据,获取训练样本数据,对训练样本数据对应的图像数据进行预处理,训练样本数据由于不同的相机设备、成像条件以及采集人员业务水平等因素的影响,获取到的图像往往会有不一样的图像分辨率、明亮程度和对比度。这些各异的图像参数往往会对标准化的生成网络产生干扰。可以通过估计图像中的视场大小来对图像的尺度进行大致的归一化,然后利用高斯滤波器来估计图像的背景亮度,再通过背景减除的方式完成整体图像的亮度均衡和对比度增强。为了使所有图像具有一致的长宽,提取后的图像四周还需要进行填充处理,利用图像长宽比进行归一化处理的方式,该方法可以更好地保留原始图像中的几何结构信息,防止其发生扭曲导致眼底结构的信息失真。
需要说明的是,获取随机噪音数据,生成网络根据特征数据与随机噪音数据,生成待检测图像数据对应的虚拟图像数据,其中,随机噪声(Random Noise)又称背景噪声,由时间上随机产生的大量起伏骚扰积累而造成的,其值在给定瞬间内不能预测的噪声,随机噪音数据用于丰富生成图像的细节特征信息。
需要说明的是。本实施例中,可以根据待检测图像数据的类别来确定所添加的噪声的种类,以使添加的噪声更加符合生成网络的生成的规律。例如,当待检测图像数据为人脸图像时,考虑到现实场景中大量人脸图像的噪声符合或近似符合高斯分布,因此,添加的噪声可以为高斯噪声,这样,添加的噪声更具有合理性。
S202:获取基于已知类别和样本数据训练得到的判别网络,通过判别网络判别虚拟图像数据,得到判别结果,当判别结果大于第一预设阈值时,将判别结果对应的虚拟图像数据确定为源数据。
在步骤S202中,获取基于已知类别和样本数据训练得到的判别网络,判别网络可以对生成网络生成的虚拟图像数据进行判别,判别出是否与已知类别相同,若虚拟图像数据通过判别网络得到与之相似的类别相似度,类别相似度作为判别网络的判别结果,当判别结果大于第一预设阈值时,将判别结果对应的虚拟图像数据确定为源数据,其中,判别结果为判别网络输出的判别类别与对应的判别值,源数据为针对待检测图像的真实数据。
本实施例中,通过样本数据与样本数据对应的类别标签对初始判别网络进行训练,得到对应的判别网络,设置的判别网络的目的是为了判别生成网络所生成的虚拟图像数据与样本数据即设置的真实图像的区别。即判别网络的输入有两个,一个是虚拟图像数据,另一个是样本数据,通过将使用生成网络生成的虚拟图像数据与样本数据输入初始判别网络中进行判别处理,得到图像判别值。所设置的判别网络的目的是,为了判别生成网络所生成的虚拟图像数据与样本数据即设置的真实图像的区别。
其中,判别网络包括多个编码器,与生成网络不同的是,生成网络的输出为图像,而判别网络的输出为一个值即虚拟图像数据的判别值,图像判别值代表着虚拟图像数据与样本数据之间的真实度。即本申请实施例的判别网络对应的是所生成的虚拟图像数据和已知类别的样本数据,其目的是为了判别所生成的虚拟图像数据的真实性,使其更好地指导生成网络生成更加理想的虚拟图像数据。需要说明的是,虚拟图像数据对应于一个图像判别值,图像判别值越大,代表生成的虚拟图像数据越好,图像更加真实。示例性地,图像判别值的数值范围为[0,1]。
本实施例中,判别网络采用五层卷积层,卷积层输出通道数分别为32、64、64、32和16,每层卷积网络采用3×3的卷积核对于图像中的特征进行提取,随着通道数的下降,卷积网络对提取的特征进行融合与筛选;在每层卷积中包含批归一化以及ReLU激活函数,保证网络的非线性及拟合能力;并且在每层卷积层后连接下采样层,对获取的特征筛选;在通过卷积,批归一化与激活函数操作后得到的输出神经元是稀疏的,许多神经元值为零,所以通过进行步长为2的最大值下采样,将相邻2×2神经元中最大值保留下来作为输出,输出神经元数目变为输入的四分之一,对图像特征进行降维处理;在五层卷积层与下采样层的输出端,加入全连接层对降维后的图像特征进行加权处理,全连接层采用sigmoid作为激活函数。全连接层的输出为一个0至1的值,代表输入图片是真实图片的概率,用以衡量虚拟图像数据与已知类别的样本数据的相似程度。
对于判别网络,还可以通过对Transformer的解码器进行设计来实现。具体地,通过引入一个类别特征(即图像判别值)来作为判别网络的输出,这个类别特征和BERT模型的类别特征类似,其作用是为了给生成的虚拟图像数据的真实程度进行打分,以便获取判别网络对生成的虚拟图像数据的真实度分数。
可选地,获取基于已知类别和样本数据训练得到的判别网络,包括:
通过判别网络,确定虚拟图像数据的交叉熵损失、信息熵损失与正则化损失;
根据交叉熵损失、信息熵损失与正则化损失,构建预训练损失函数,将预训练损失函数作为判别网络中对应的损失函数。
本实施例中,为了提高生成网络生成虚拟图像数据的真实性,在判别网络训练结束后,即可进行对抗训练。在对抗训练中,采用固定判别网络,对生成网络进行训练,使生成网络训练出判别网络难以判别的图像。再固定生成网络,从而优化判别网络的判别能力。在网络的对抗过程中,生成网络与判别网络分别得到了优化。在网络的对抗训练中,将每批图像进行一次生成网络训练,两次判别网络训练,从而确保判别网络得到充分的更新。
在进行对抗训练过程中,通过判别网络,确定虚拟图像数据的交叉熵损失、信息熵损失与正则化损失,根据交叉熵损失、信息熵损失与正则化损失,构建预训练损失函数,将预训练损失函数作为判别网络中对应的损失函数。其中预训练损失函数公式如下:
L=LCE(f(G(z));θ)+Lfeat(f(G(z));θ)+Linfo(f(G(z));θ)
其中,G(·)表示表示生成网络的映射函数,θ是生成网络G的参数;f(·)表示判别网络的映射函数;LCE(·)交叉熵,Lfeat(·)表示正则化损失,Linfo(·)表示信息熵。其中交叉熵LCE(·)让生成的虚拟图像数据逼近已知样本的输出,Lfeat(·)让虚拟图数据的特征值分布更聚焦,Linfo(·)让标签分布更均匀。
通过预训练损失函数作为本申请实施例的判别网络中的损失函数,利用预预训练损失函数、判别值对初始网络模型进行训练处理。具体地,通过预训练损失函数来生成网络与判别网络对应的参数进行更新,待预预训练损失函数趋于收敛,即可完成训练,即根据预设损失函数,更新生成网络和判别网络对应的参数,以得到更新后的图像判别值,当更新后的图像判别值大于阈值,将对应的虚拟图像数据作为源数据。
另一实施例中,当判别网络中的已知类别数为多个类别时,判别网络输出虚拟图像数据的类别与对应类别的判别值。例如,已知类别样本的的判别网络中包括对应的3个类别的样本数据,分别为第一类别的样本数据,第一类别的样本数据与第三样本的类别数据,当使用判别网络判别虚拟图像数据时,判别网络输出的虚拟图像数据为第一类别的样本数据,判别值为0.9时,当设置第一预设阈值为0.8时,判别值大于第一预设阈值,对应的虚拟图像数据作为第一样本数据对应的源数据。当使用判别网络判别虚拟图像数据时,判别网络输出的虚拟图像数据为第一类别的样本数据,判别值为0.7时,当设置第一预设阈值为0.8时,判别值大于第一预设阈值,对应的虚拟图像数据不能作为对应的源数据。
需要说明的是,当判别网络中的已知类别数为多个类别时,判别网络输出虚拟图像数据的类别与对应类别的判别值。例如,已知类别样本的的判别网络中包括对应的3个类别的样本数据,分别为第一类别的样本数据,第一类别的样本数据与第三样本的类别数据,当多个类别中的特征相似时,生成网络生成虚拟图像数据时,通过判别网络对虚拟图像数据进行判别时,判别网络输出的判别结果为第一类别的样本数据对应的判别值为0.9,第二类别的样本数据对应的判别值为0.85,设置第一预设阈值为0.8时,第一类别的样本数据对应的判别值与第二类别的样本数据对应的判别值都大于第一预设阈值时,选取判别值最大的类别为虚拟图像数据对应的类别,将虚拟图像数据作为该类别的源数据,因此将虚拟图像数据作为第一列别样本对应的源数据。
S203:使用预设判定函数,计算得到待检测图像数据与源数据之间的判定分数,当判定分数大于第二预设阈值时,确定待检测图像数据为异常数据。
在步骤S203中,获取到对应的源数据后,计算源数据与待检测图像数据之间的相似性,根据源数据与待检测图像数据之间的相似性确定待检测图像数据是否为异常数据。
本实施例中,通过使用预设判定函数,计算得到待检测图像数据与源数据之间的判定分数,当判定分数大于第二预设阈值时,确定待检测图像数据为异常数据。
当源数据中包括多种类别的源数据时,进行判断判定分数是否大于第二预设阈值时,首先将源数据划分为不同的了别,得到不同类别的源数据,使用预设判定函数,计算得到待检测图像数据与不同类别源数据之间的判定分数,从待检测图像数据与不同类别源数据之间的判定分数中选取判定分数的最小值,当判定分数的最小值大于第二预设阈值时,确定待检测图像数据为异常数据。当判定分数的最小值小于或等于第二预设阈值时,将判定分数的最小值对应的源数据的类别确定为待检测图像数据的类别。
可选地,使用预设判定函数,计算得到待检测图像数据与源数据之间的判定分数,当判定分数大于第二预设阈值时,确定待检测图像数据为异常数据之前,还包括:
通过判别网络中的映射函数,计算源数据的统计信息;
根据源数据的统计信息与预设的判别规则,构建预设判定函数。
本实施例中,通过判别网络中的映射函数,计算源数据的统计信息,根据源数据的统计信息与预设的判别规则,构建预设判定函数。其中,本市似乎离中,预设的判别规则为基于距离进行判别,计算待检测图像数据与源数据之间的距离,将待检测图像数据与源数据之间的距离作为判定分数。
可选地,通过判别网络中的映射函数,计算源数据的统计信息,包括:
使用判别网络中的映射函数,计算源数据对应的均值与协方差,将均值与协方差作为源数据对应的统计信息。
本实施例中,使用判别网络中的映射函数,计算源数据对应的均值与协方差,将均值与协方差作为源数据对应的统计信息。源数据的均值与协方差的计算公式如下所示:
其中,Nc表示源数据属于c类别的数量,f(·)表示判别网络中的映射函数,μc为源数据为c类别时对应的均值,Σ为源数据为c类别时对应的协方差。
本实施例中,获取到对应的源数据后,通过判别网络获取源数据对应所属类别的概率值,例如,当源数据中存在三个已知类别中对应的类别,获取每个类别对应的源数据的数量,然后针对每个类别中的源数据,计算每个类别中的均值与协方差,通过判别网络获取源数据对应所属类别的概率值,计算同一类别中的源数据对应的概率值的均值,根据对应的均值计算对应类别中的协方差。
可选地,使用预设判定函数,计算得到待检测图像数据与源数据之间的判定分数,包括:
将待检测图像数据输入至判别网络中,输出待检测图像对应的类别概率值;
基于类别概率值与预设判定函数,计算得到待检测图像数据与源数据之间的判定分数。
本实施例中,根据判别网络中的映射函数,计算待检测图像对应的类别概率值,基于类别概率值,基于类别概率值与预设判定函数,计算得到待检测图像数据与源数据之间的判定分数,预设判定函数的公式如下:
其中,f(·)表示判别网络中的映射函数,μc为源数据为c类别时对应的均值,Σ为源数据为c类别时对应的协方差,为待检测图像对应的类别概率值,计算得到待检测图像数据与源数据对应类别的最小距离,将对应的最小距离作为判定分数,当判定分数大于第二预设阈值时,将待检测图像数据作为异常数据。
例如,当源数据中存在三个已知类别中对应的类别,获取每个类别对应的源数据的数量,然后针对每个类别中的源数据,计算每个类别中的均值与协方差,通过判别网络获取源数据对应所属类别的概率值,计算同一类别中的源数据对应的概率值的均值,根据对应的均值计算对应类别中的协方差,使用源数据对应的均值与协方差,计算待检测图像数据与源数据之间的距离。
使用生成网络针对待检测图像数据,生成待检测图像数据对应的虚拟图像数据,获取基于已知类别和样本数据训练得到的判别网络,通过判别网络判别虚拟图像数据,得到判别结果,当判别结果大于第一预设阈值时,将判别结果对应的虚拟图像数据确定为源数据,使用预设判定函数,计算得到待检测图像数据与源数据之间的判定分数,当判定分数大于第二预设阈值时,确定待检测图像数据为异常数据。本发明中,通过生成网络生成虚拟数据,通过判别网络判别虚拟数据,从虚拟数据中确定源数据,根据源数据与待检测数据之间的距离判定待检测数据是否为异常数据,在无源数据的情况下,检测出异常数据,解决了异常数据检测过程中,无源数据的问题,保护了用户数据的隐私。
请参阅图3,图3是本发明实施例提供的一种基于生成对抗网络的异类检测装置的结构示意图。本实施例中该终端包括的各单元用于执行图2对应的实施例中的各步骤。具体请参阅图2以及图2所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图3,异类检测装置30包括:生成模块31,判别模块32,异常数据确定模块33。
生成模块31,用于使用生成网络针对待检测图像数据,生成待检测图像数据对应的虚拟图像数据。
判别模块32,用于获取基于已知类别和样本数据训练得到的判别网络,通过判别网络判别虚拟图像数据,得到判别结果,当判别结果大于第一预设阈值时,将判别结果对应的虚拟图像数据确定为源数据。
异常数据确定模块33,用于使用预设判定函数,计算得到待检测图像数据与源数据之间的判定分数,当判定分数大于第二预设阈值时,确定待检测图像数据为异常数据。
可选地,上述生成模块31包括:
特征提取单元,用于提取待检测图像数据的特征数据。
虚拟图像数据生成单元,用于获取随机噪音数据,生成网络根据特征数据与随机噪音数据,生成待检测图像数据对应的虚拟图像数据。
可选地,上述判别模块32包括:
损失确定单元,用于通过判别网络,确定虚拟图像数据的交叉熵损失、信息熵损失与正则化损失。
损失函数构建单元,用于根据交叉熵损失、信息熵损失与正则化损失,构建预训练损失函数,将预训练损失函数作为判别网络中对应的损失函数。
可选地,上述异类检测装置30还包括:
统计信息确定模块,用于通过判别网络中的映射函数,计算源数据的统计信息。
构建模块,用于根据源数据的统计信息与预设的判别规则,构建预设判定函数。
可选地,上述统计信息确定模块包括:
计算单元,用于使用判别网络中的映射函数,计算源数据对应的均值与协方差,将均值与协方差作为源数据对应的统计信息。
可选地,上述异常数据确定模块33包括:
待检测图像类别概率值确定单元,用于将待检测图像数据输入至判别网络中,输出待检测图像对应的类别概率值;
判定单元,用于基于类别概率值与预设判定函数,计算得到待检测图像数据与源数据之间的判定分数。
需要说明的是,上述单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
图4是本发明实施例提供的一种计算机设备的结构示意图。如图4所示,该实施例的计算机设备包括:至少一个处理器(图4中仅示出一个)、存储器以及存储在存储器中并可在至少一个处理器上运行的计算机程序,处理器执行计算机程序时实现上述任意各个基于生成对抗网络的异类检测方法实施例中的步骤。
该计算机设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,图4仅仅是计算机设备的举例,并不构成对计算机设备的限定,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括网络接口、显示屏和输入装置等。
所称处理器可以是CPU,该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器包括可读存储介质、内存储器等,其中,内存储器可以是计算机设备的内存,内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。可读存储介质可以是计算机设备的硬盘,在另一些实施例中也可以是计算机设备的外部存储设备,例如,计算机设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器还可以既包括计算机设备的内部存储单元也包括外部存储设备。存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,该其他程序如计算机程序的程序代码等。存储器还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质至少可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
本发明实现上述实施例方法中的全部或部分流程,也可以通过一种计算机程序产品来完成,当计算机程序产品在计算机设备上运行时,使得计算机设备执行时实现可实现上述方法实施例中的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/计算机设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算机设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于生成对抗网络的异类检测方法,其特征在于,所述异类检测方法包括:
使用生成网络针对待检测图像数据,生成所述待检测图像数据对应的虚拟图像数据;
获取基于已知类别和样本数据训练得到的判别网络,通过所述判别网络判别所述虚拟图像数据,得到判别结果,当所述判别结果大于第一预设阈值时,将所述判别结果对应的虚拟图像数据确定为源数据;
使用预设判定函数,计算得到所述待检测图像数据与所述源数据之间的判定分数,当所述判定分数大于第二预设阈值时,确定所述待检测图像数据为异常数据。
2.如权利要求1所述的异类检测方法,其特征在于,所述使用生成网络针对待检测图像数据,生成所述待检测图像数据对应的虚拟图像数据,包括:
提取所述待检测图像数据的特征数据;
获取随机噪音数据,所述生成网络根据所述特征数据与所述随机噪音数据,生成所述待检测图像数据对应的虚拟图像数据。
3.如权利要求1所述的异类检测方法,其特征在于,所述获取基于已知类别和样本数据训练得到的判别网络,包括:
通过所述判别网络,确定所述虚拟图像数据的交叉熵损失、信息熵损失与正则化损失;
根据所述交叉熵损失、信息熵损失与正则化损失,构建预训练损失函数,将所述预训练损失函数作为判别网络中对应的损失函数。
4.如权利要求1所述的异类检测方法,其特征在于,所述使用预设判定函数,计算得到所述待检测图像数据与所述源数据之间的判定分数,当所述判定分数大于第二预设阈值时,确定所述待检测图像数据为异常数据之前,还包括:
通过所述判别网络中的映射函数,计算所述源数据的统计信息;
根据所述源数据的统计信息与预设的判别规则,构建预设判定函数。
5.如权利要求4所述的异类检测方法,其特征在于,所述通过所述判别网络中的映射函数,计算所述源数据的统计信息,包括:
使用所述判别网络中的映射函数,计算所述源数据对应的均值与协方差,将所述均值与协方差作为所述源数据对应的统计信息。
6.如权利要求1所述的异类检测方法,其特征在于,所述使用预设判定函数,计算得到所述待检测图像数据与所述源数据之间的判定分数,包括:
将所述待检测图像数据输入至所述判别网络中,输出所述待检测图像对应的类别概率值;
基于所述类别概率值与所述预设判定函数,计算得到所述待检测图像数据与所述源数据之间的判定分数。
7.一种基于生成对抗网络的异类检测装置,其特征在于,所述异类检测装置包括:
生成模块,用于使用生成网络针对待检测图像数据,生成所述待检测图像数据对应的虚拟图像数据;
获取模块,用于获取基于已知类别和样本数据训练得到的判别网络,所述判别网络用于判别所述虚拟图像数据;
判别模块,用于通过所述判别网络判别所述虚拟图像数据,得到判别结果,当所述判别结果大于第一预设阈值时,将所述判别结果对应的虚拟图像数据确定为源数据;
异常数据确定模块,用于使用预设判定函数,计算得到所述待检测图像数据与所述源数据之间的判定分数,当所述判定分数大于第二预设阈值时,确定所述待检测图像数据为异常数据。
8.如权利要求7所述的异类检测装置,其特征在于,所述异类检测装置还包括:
统计信息确定模块,用于通过所述判别网络中的映射函数,计算所述源数据的统计信息;
构建模块,用于根据源数据的统计信息与预设的判别规则,构建预设判定函数。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的异类检测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的异类检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310722527.4A CN116721330A (zh) | 2023-06-16 | 2023-06-16 | 基于生成对抗网络的异类检测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310722527.4A CN116721330A (zh) | 2023-06-16 | 2023-06-16 | 基于生成对抗网络的异类检测方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116721330A true CN116721330A (zh) | 2023-09-08 |
Family
ID=87873048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310722527.4A Pending CN116721330A (zh) | 2023-06-16 | 2023-06-16 | 基于生成对抗网络的异类检测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116721330A (zh) |
-
2023
- 2023-06-16 CN CN202310722527.4A patent/CN116721330A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111429464B (zh) | 医学图像分割方法、医学图像分割装置及终端设备 | |
CN113159147B (zh) | 基于神经网络的图像识别方法、装置、电子设备 | |
CN110796199B (zh) | 一种图像处理方法、装置以及电子医疗设备 | |
CN110765860A (zh) | 摔倒判定方法、装置、计算机设备及存储介质 | |
CN111062389A (zh) | 文字识别方法、装置、计算机可读介质及电子设备 | |
Xiang et al. | Towards interpretable skin lesion classification with deep learning models | |
CN111027576A (zh) | 基于协同显著性生成式对抗网络的协同显著性检测方法 | |
CN116910752B (zh) | 一种基于大数据的恶意代码检测方法 | |
CN111694954B (zh) | 图像分类方法、装置和电子设备 | |
JP2019153092A (ja) | 位置特定装置、位置特定方法及びコンピュータプログラム | |
CN115034315A (zh) | 基于人工智能的业务处理方法、装置、计算机设备及介质 | |
CN113033305B (zh) | 活体检测方法、装置、终端设备和存储介质 | |
EP4160477A1 (en) | Modal information complementation method, apparatus and device | |
CN113592769B (zh) | 异常图像的检测、模型的训练方法、装置、设备及介质 | |
CN112818774A (zh) | 一种活体检测方法及装置 | |
CN116580702A (zh) | 基于人工智能的语音识别方法、装置、计算机设备及介质 | |
CN116452812A (zh) | 一种伪装物体识别及语义分割方法 | |
CN113836297B (zh) | 文本情感分析模型的训练方法及装置 | |
CN112699907A (zh) | 数据融合的方法、装置和设备 | |
CN116721330A (zh) | 基于生成对抗网络的异类检测方法、装置、设备及介质 | |
CN111582404B (zh) | 内容分类方法、装置及可读存储介质 | |
CN111476775B (zh) | Dr征象识别装置和方法 | |
CN111651626B (zh) | 图像分类方法、装置及可读存储介质 | |
CN113192085A (zh) | 三维器官图像分割方法、装置及计算机设备 | |
CN112991266A (zh) | 用于小样本医疗影像的语义分割方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |