CN112686289A - 图片分类方法和装置 - Google Patents
图片分类方法和装置 Download PDFInfo
- Publication number
- CN112686289A CN112686289A CN202011551991.4A CN202011551991A CN112686289A CN 112686289 A CN112686289 A CN 112686289A CN 202011551991 A CN202011551991 A CN 202011551991A CN 112686289 A CN112686289 A CN 112686289A
- Authority
- CN
- China
- Prior art keywords
- picture
- designated
- target
- designated picture
- specified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000008569 process Effects 0.000 claims description 22
- 238000011176 pooling Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 6
- 238000013135 deep learning Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 238000013145 classification model Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图片分类方法和装置,涉及数据处理领域,用以解决现有的图片判断模型存在的盲点问题。所述方法包括:获取待分类的目标图片;获取预先训练的用于判定图片类别的目标判定模型;其中,如果第一图片和第二图片的相似度大于设定的相似度阈值,则所述目标判定模型将第一图片和第二图片判定为同一类别;利用所述目标判定模型,对所述目标图片进行分类。本申请用于图片分类。
Description
技术领域
本申请涉及数据处理领域,尤其涉及一种图片分类方法和装置。
背景技术
随着信息时代的到来,各种各样的图片信息爆炸式增长。一些非法分子,通过在原始色情图片中加入敏感噪声,使得加入了敏感噪声之后的色情图片,常规的网络监管模型无法正确识别加入敏感噪声之后的色情图片。但是加入了敏感噪声之后的色情图片,在视觉体验上和原始色情图片完全相同。从而使得这些色情图片逃离了常规的网络监管,在互联网上横行泛滥。
在相关技术中,常规的网络监管模型,通常使用图片判断模型,对大量的网络图片进行分类,从而判定非法图片的类别,进而达到监管的目的。而常规的图片判断模型会对某些敏感噪声较为敏感,色情图片在加入了敏感噪声之后,图片判断模型却将色情图片分类为正常图片,从而无法将色情图片正确分类,这就是常规的图片判断模型存在的盲点问题。
由此可见,目前亟需一种图片分类方法,以解决现有的图片判断模型存在的盲点问题。
发明内容
本申请实施例提供了一种图片分类方法和装置,用以解决现有的图片判断模型存在的盲点问题。
本申请实施例采用下述技术方案:
第一方面,提供一种图片分类方法,包括:
获取待分类的目标图片;
获取预先训练的用于判定图片类别的目标判定模型;其中,如果第一图片和第二图片的相似度大于设定的相似度阈值,则所述目标判定模型将第一图片和第二图片判定为同一类别;
利用所述目标判定模型,对所述目标图片进行分类。
第二方面,提供一种图片分类装置,包括:
获取模块,用于获取待分类的目标图片;
确定模块,用于获取预先训练的用于判定图片类别的目标判定模型;其中,如果第一图片和第二图片的相似度大于设定的相似度阈值,则所述目标判定模型将第一图片和第二图片判定为同一类别;
分类模块,用于利用所述目标判定模型,对所述目标图片进行分类。
第三方面,一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器存储计算机程序,当所述计算机程序被所述处理器执行时,实施以下过程:
获取待分类的目标图片;
获取预先训练的用于判定图片类别的目标判定模型;其中,如果第一图片和第二图片的相似度大于设定的相似度阈值,则所述目标判定模型将第一图片和第二图片判定为同一类别;
利用所述目标判定模型,对所述目标图片进行分类。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
在本申请实施例中,获取待分类的目标图片;获取预先训练的用于判定图片类别的目标判定模型;其中,如果第一图片和第二图片的相似度大于设定的相似度阈值,则所述目标判定模型将第一图片和第二图片判定为同一类别;利用所述目标判定模型,对所述目标图片进行分类。如此,可以提高目标判定模型的抗敏感噪声能力,降低判别一些类型的图片失效的风险,从而解决现有的图片判断模型存在的盲点问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种图片分类方法的流程图;
图2是本申请实施例提供的一种图片分类方法的流程图;
图3是本申请实施例提供的一种图片分类方法的流程图;
图4是本申请实施例提供的一种图片分类方法的流程图;
图5是本申请实施例提供的一种图片分类方法的流程图;
图6是本申请实施例提供的一种示例的图片判断模型的判定过程示意图;
图7是本申请实施例提供的一种示例的第二指定图片的生成过程示意图;
图8是本申请实施例提供的一种图片分类装置的结构框图。
具体实施方式
本申请实施例提供一种图片分类方法和装置。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
图1是本申请实施例提供的一种图片分类方法的流程图。如图1所示,本申请实施例提供的一种图片分类方法可以包括:步骤11、步骤12、步骤13。下面针对步骤11、步骤12、步骤13依次进行阐述。
步骤11,获取待分类的目标图片。
在本申请实施例中,所述目标图片是需要进行类别判定的图片,可以是预先选取的特定图片,也可以是随机选取的图片,所述目标图片可以根据需要而选取。
步骤12,获取预先训练的用于判定图片类别的目标判定模型;其中,如果第一图片X1和第二图片X2的相似度大于设定的相似度阈值,则所述目标判定模型H将第一图片和第二图片判定为同一类别;
其中,所述第二图片X2是在所述第一图片X1的基础上加入噪声而得到的图片。
其中,所述目标判定模型具体可以用于判定图片的类型,图片的类型可以包括合法的、非法的、常规图片、色情图片等等,图片类型的分类标准并不构成对本申请的限定。
其中,所述相似度是指图片与图片之间的相似程度,所述阈值可以是指相似度阈值,所述相似度阈值可以根据预先确定的相似度指标进行确定。
在本申请实施例中,在步骤12之前,可参见图2,本申请实施例提供的一种图片分类方法还可以包括:步骤21、步骤22。下面针对步骤21、步骤22依次进行阐述。
步骤21;获取目标训练集;
在本申请实施例中,可参见图3,步骤21还可以包括:获取多组指定图片对;将获取的所述多组指定图片对作为所述目标训练集;其中,可以通过步骤31、步骤32、步骤33、步骤34、步骤35获取所述多组指定图片对中的目标组指定图片对,所述目标组指定图片对为所述多组指定图片对中的任一组指定图片对。
下面对步骤31、步骤32、步骤33、步骤34、步骤35,这几个步骤进行阐释。
步骤31:获取多组指定图片对;其中,每一组指定图片对包括相似度大于设定的相似度阈值的第一指定图片和第二指定图片,所述第二指定图片是在所述第一指定图片的基础上加入噪声而得到的图片。
其中,所述第一指定图片X1和所述第二指定图片X2是用于加入目标训练集的图片。可利用所述目标训练集中的图片生成目标判定模型。所述噪声可以是常见的图片分类模型较为敏感的噪声、随机噪声等等,所述噪声的实际类型并不构成对本申请的限定。
其中,所述第一指定图片X1的像素,例如可以表示成224×224×3矩阵维度的像素值矩阵,可以理解的是,所述第一指定图片可以具有红(R)、绿(G)、蓝(B)三个色值通道,每个通道内的像素值可以由一个二维数组表示,二维数组的数值代表0-255之间的像素值。例如,若设定色值通道的数目为3,对于一张224×224像素值的图片,其像素可以用224×224×3的图片像素值矩阵表示。在本申请实施例中,所述第一指定图片X1的像素值矩阵的具体数值既可以是224×224×3,也可以是255×225×3的等等,第一指定图片X1的像素值矩阵的具体数值并不构成对本申请的限定。
可以理解的是,通过在所述第一指定图片X1中加入所述噪声,进而得到所述第二指定图片X2。若所述第一指定图片X1为色情图片,那么当色情图片中加入了敏感噪声之后,常规的图片判断模型反而会将色情图片分类判定为正常图片,从而导致常规的图片分类模型无法将色情图片正确分类。可以理解的是,上述步骤31,成功模拟出不法分子在色情图片中加入随机噪声,逃避网络监管的过程。
在本申请实施例中,可参见图4,在步骤31中,获取第二指定图片,还可以包括步骤41、步骤42。下面对这几个步骤进行阐释。
步骤41:对所述第一指定图片X1进行卷积处理、池化处理、全连接层处理,以生成图片编码。
其中,所述卷积处理(Convolution,Conv)可以将第一指定图片X1进行降维和特征抽取。具体的,可参见图7,所述第一指定图片X1像素的矩阵维度若是224×224×3,第一指定图片X1经过卷积处理后得到的第一中间图片X11,矩阵维度可以降低,例如为112×112×64。因此,通过对第一指定图片X1进行卷积处理后将第一指定图片X1进行降维和特征提取得到第一中间图片X11。
其中,所述池化处理(Pooling),具体的,可参见图7,是在对第一指定图片X1进行卷积处理完成了对第一指定图片X1降维和特征提取得到第一中间图片X11后,第一中间图片X11的维度还是很高,维度高不仅计算耗时,而且容易导致过拟合。因此,引入下采样技术,也称为池化处理(pooling),池化处理(pooling)的具体实现是在进行卷积操作之后对得到的第一中间图片X11进行分块,第一中间图片X11被划分成的不相交块,计算这些块内的最大值或最小值,得到池化后的第二中间图片X12。具体的,可参见图7,所述第一指定图片X1经过卷积处理后的第一中间图片X11矩阵维度若为112×112×64,再经过池化处理后得到第二中间图片X12的矩阵维度可以降低,例如为56×56×64。
其中,所述全连接层处理(Fully connected,FC),具体的,可参见图7,是在对第一指定图片X1进行卷积处理和池化处理之后得到图片编码X的过程。如果说卷积处理和池化处理是将第一指定图片X1的原始数据映射到隐层特征空间的话,全连接层操作则起到将学到的“分布式特征表示”映射到样本标记空间的作用。
可以理解的是,通过对所述第一指定图片X1进行卷积处理、池化处理、全连接层处理后,可以将第一指定图片X1压缩到隐层得到图片编码X。
步骤42:对所述图片编码进行全连接层处理、上采样处理、反卷积处理以得到所述第二指定图片X2。
其中,所述上采样处理(uppooling),可参见图7,是在所述图片编码X进行全连接层处理之后得到第三中间图片X21,经过上采样处理后,得到第四中间图片X22。第四中间图片X22的矩阵维度在第三中间图片X21的基础上还可以进一步升高,例如从56×56×64变成112×112×64。
其中,所述反卷积处理(deconv),可参见图7,是在第三中间图片X21进行上采样处理之后得到第四中间图片X22之后,第四中间图片X22经过反卷积处理后,得到所述第二指定图片X2。第二指定图片X2的矩阵维度在第四中间图片的基础上,还可以进一步升高,例如,第二指定图片X2的矩阵维度可以为224×224×3。
其中,所述第一指定图片的矩阵维度可以与所述第二指定图片的矩阵维度相同。
可以理解的是,将第一指定图片X1作为输入图片通过上述步骤41、步骤42,对第一指定图片X1实现了自编码的过程,相当于第一指定图片X1实现了自我复制,但是经过上述步骤41和42自编码的步骤,在第一指定图片X1的基础上,引进了敏感噪声,生成了第二指定图片X2。进而初步保证了第一指定图片X1和第二指定图片X2相似度,第二指定图片X2在第一指定图片X1的基础上,引进了随机噪声。
步骤32:根据图片判断模型对所述第一指定图片的分类结果,确定所述第一指定图片X1的分类标签Y1,所述第一指定图片的分类标签Y1指示所述第一指定图片的类别;
可以理解的是,可参见图6,利用所述图片判断模型D对所述第一指定图片X1进行判定,以得到第一目标类别,并获取所述第一指定图片X1的分类标签Y1,所述第一指定图片X1的分类标签Y1指示所述第一目标类别。可以理解的是,若第一指定图片X1是色情图片,则所述图片判断模型D对所述第一指定图片X1进行判定,可以将第一指定图片X1的分类标签Y1指示所述第一目标类别确定为非法图片。
步骤33:根据图片判断模型对所述第二指定图片的分类结果,确定所述第二指定图片的分类标签,所述第二指定图片的分类标签指示所述第二指定图片的类别。
可以理解的是,可参见图7,利用所述图片判断模型D对所述第二指定图片X2进行判定,以得到第二目标类别,并获取所述第二指定图片的分类标签Y2,所述第二指定图片X2的分类标签Y2指示所述第二目标类别。可以理解的是,若第一指定图片X1是色情图片,则第二指定图片X2是在第一指定图片X1的基础上加入敏感噪声之后得到的,因此常规的图片判断模型D对所述第二指定图片X2进行判定时,会将第二指定图片X2的分类标签Y2指示所述第二目标类别确定为合法图片。
可以理解的是,参见图7,所述第二目标类别和所述第一目标类别不同,可以用第一约束条件来进行表征,所述第一约束条件可以记为Loss1,所述Loss1的数学表达式可以为:
其中,yi表示第i个样本的标签,正类为1,负类为0;pi表示第i个样本预测为正类的概率;N代表样本的实际数量。
步骤34:在所述第二指定图片的分类标签和第一指定图片的分类标签相同的情况下,将当前组指定图片对丢弃;在所述第二指定图片的分类标签和第一指定图片的分类标签不同的情况下,将所述第二指定图片的分类标签修改为第一指定图片的分类标签;
可以理解的是,将所述第二指定图片X2的分类标签Y2修改为指定标签Y1,所述指定标签Y1指示所述第一目标类别。
步骤35:将所述第一指定图片X1、所述第一指定图片X1的分类标签Y1、所述第二指定图片X2以及修改后的所述第二指定图片的分类标签Y1作为所述目标组指定图片对。
步骤22:基于所述目标训练集,对基于深度学习的图片判断模型进行训练,直至所述图片判断模型将相似度大于设定的相似度阈值的两张图片判定为同一类别后训练完成,得到所述目标判定模型。
其中,所述目标训练集中包括多组目标指定图片对,每一组目标指定图片对包括第一指定图片和第一指定图片的分类标签、第二指定图片和第二指定图片的分类标签,所述第一指定图片和所述第二指定图片的相似度大于设定的相似度阈值,所述第一指定图片的分类标签和所述第二指定图片的分类标签指示相同的类别对所述图片判断模型训练完成后,得到所述目标判定模型。
其中,所述图片判断模型为基于深度学习的图片判断模型。
其中,所述图片判断模型D可以是基于残差网络(例如,Resnet-50)的图片分类网络、也可以是基于卷积神经网络的图片分类模型等等,图片判断模型D的采用的图片分类网络并不构成对本申请的限定。
可以理解的是,初始的图片判断模型D会将加入敏感噪声之后的第二指定图片X2误判为合法图片,但是通过常规的人眼观察,难以分辨第一指定图片X1和第二指定图片X2之间的细微差别,甚至可以说第一指定图片X1和第二指定图片X2给人带来的视觉体验是完全相同的,这就是常规的图片判断模型D存在的盲点问题。
可以理解的是,基于所述目标训练集,对图片判断模型D进行训练后,得到目标判定模型,可以有效提高图片判断模型D的泛化能力。使得目标判定模型会将加入敏感噪声之后的第二指定图片X2判定为非法图片。进而通过目标判定模型可以对加入噪声之后的非法图片进行高效识别,可以有效避免非法图片在互联网上横行泛滥。
可选地,所述目标判定模型可以为色情图片判断模型,所述第一指定图片和所述第二指定图片的相似度是基于结构相似性算法(Structural Similarity Index,SSIM)而确定。
其中,所述结构相似性算法是一种衡量两幅图片相似度的指标。
具体的,若给定两张图片x1和x2,两张图片的结构相似性SSIM可按照以下方式求出:
上式中,μx1代表图片x1的像素平均值,μx2代表图片x2的像素平均值;
σx1x2代表图片x1和图片x2像素的协方差;σx1代表图片x1的像素的标准差,σx2代表图片x2的像素的标准差;c1和c2分别是常数,避免分母为0带来的系统错误。
可以理解的是,SIMM指标可以作为第二约束条件,若SIMM指标作为第二约束条件,可将SIMM指标记为Loss2。
可以理解的是,参见图7,上述所述第一约束条件Loss1和第二约束条件Loss2可以结合,组成系统的损失函数,损失函数的数学表达式可以表示为:
Loss=aLoss1+(1-a)Loss2
其中,a是常数,且用来调节Loss1和Loss2的权重。例如,a可以设置为0.5。
步骤13,利用所述目标判定模型,对所述目标图片进行分类。
如此,通过本申请提供的一种图片分类方法方法,模拟不法分子在色情图片中加入敏感噪声的过程,将传统的图片判断模型进行有效训练后,得到训练后的目标判定模型,可以大幅提高目标判定模型的抗敏感噪声能力,从而降低网络监管模型判别色情图片失效的风险,进而有效提高网络监管的治理效能。
图5是本申请实施例提供的一种图片分类方法的流程图。参照图5,本申请实施例提供的一种图片分类方法可以包括以下步骤:
步骤50:获取目标图片。
步骤51:获取第一指定图片。
步骤52:对所述第一指定图片进行卷积处理、池化处理、全连接层处理,以生成图片编码。
步骤53:对所述图片编码进行全连接层处理、上采样处理、反卷积处理以得到所述第二指定图片。
步骤54:利用所述图片判断模型对所述第一指定图片进行判定,以得到第一目标类别,并获取所述第一指定图片的分类标签,所述第一指定图片的分类标签指示所述第一目标类别。
步骤55:利用所述图片判断模型对所述第二指定图片进行判定,以得到第二目标类别,并获取所述第二指定图片的分类标签,所述第二指定图片的分类标签指示所述第二目标类别;其中,所述第二目标类别和所述第一目标类别不同。
步骤56:将所述第二指定图片的分类标签修改为指定标签,所述指定标签指示所述第一目标类别。
步骤57:将所述第一指定图片、所述第一指定图片的分类标签、所述第二指定图片以及所述第二指定图片的指定标签加入所述目标训练集中。
步骤58:基于所述目标训练集,对图片判断模型D进行训练,以得到目标判定模型。
步骤59:利用所述目标判定模型,对所述目标图片进行分类。
需要指出的是,上述步骤50未必是在步骤51之前执行,上述步骤50也可以在步骤58之后执行,上述步骤的具体执行顺序并不构成对本申请的限定。
本申请实施例提供的一种图片分类方法,获取待分类的目标图片;确定目标判定模型;其中,所述目标判定模型为将第一图片和第二图片判定为同一类别的判定模型,所述第一图片和所述第二图片的相似度大于阈值,所述第二图片是在所述第一图片的基础上加入噪声而得到的图片;利用所述目标判定模型,对所述目标图片进行分类。如此,通过本申请提供的一种图片分类方法方法,可以提高目标判定模型的抗敏感噪声能力,从而降低网络监管模型判别色情图片失效的风险,进而有效提高网络监管的治理效能。
图8是本申请实施例提供的一种图片分类装置的结构框图。参照图8,本申请实施例提供的一种图片分类装置可包括:
获取模块802,用于获取待分类的目标图片;
确定模块804,用于获取预先训练的用于判定图片类别的目标判定模型;其中,如果第一图片和第二图片的相似度大于设定的相似度阈值,则所述目标判定模型将第一图片和第二图片判定为同一类别;
其中,所述第二图片是在所述第一图片的基础上加入噪声而得到的图片;
分类模块806,用于利用所述目标判定模型,对所述目标图片进行分类。
可选地,在所述确定模块804获取预先训练的目标判定模型之前,所述获取模块802还可以用于:
获取目标训练集;
所述图片分类装置还包括训练模块,所述训练模块用于:基于所述目标训练集,对基于深度学习的图片判断模型进行训练,直至所述图片判断模型将相似度大于设定的相似度阈值的两张图片判定为同一类别后训练完成,得到所述目标判定模型;
其中,所述目标训练集中包括多组指定图片对,每一组指定图片对包括第一指定图片和第一指定图片的分类标签、第二指定图片和第二指定图片的分类标签,所述第一指定图片和所述第二指定图片的相似度大于设定的相似度阈值,所述第一指定图片的分类标签和所述第二指定图片的分类标签指示相同的类别。
可选地,在所述目标训练集的获取过程中,所述获取模块802具体可以用于:
获取多组指定图片对;其中,每一组指定图片对包括相似度大于设定的相似度阈值的第一指定图片和第二指定图片,所述第二指定图片是在所述第一指定图片的基础上加入噪声而得到的图片;
针对任一组指定图片对:
根据图片判断模型对所述第一指定图片的分类结果,确定所述第一指定图片的分类标签,所述第一指定图片的分类标签指示所述第一指定图片的类别;
根据图片判断模型对所述第二指定图片的分类结果,确定所述第二指定图片的分类标签,所述第二指定图片的分类标签指示所述第二指定图片的类别;
在所述第二指定图片的分类标签和第一指定图片的分类标签相同的情况下,将当前组指定图片对丢弃;
在所述第二指定图片的分类标签和第一指定图片的分类标签不同的情况下,将所述第二指定图片的分类标签修改为第一指定图片的分类标签;
将所述第一指定图片、所述第一指定图片的分类标签、所述第二指定图片以及修改后的所述第二指定图片的分类标签作为所述目标指定图片对。
可选地,所述目标判定模型为色情图片判断模型,在获取第二指定图片的过程中,所述获取模块802具体还可以用于:
对所述第一指定图片进行卷积处理、池化处理、全连接层处理,以生成图片编码;
对所述图片编码进行全连接层处理、上采样处理、反卷积处理以得到所述第二指定图片。
可选地,所述目标判定模型为色情图片判断模型,所述第一指定图片和所述第二指定图片的相似度是基于结构相似性算法而确定。
其中,所述图片分类装置与图片分类方法相对应,以上各个步骤的具体实施过程可参照上文描述,在此不再赘述。
此外,本申请实施例还提供了一种电子设备,所述电子设备可以包括处理器和存储器,所述存储器可以存储计算机程序,当所述计算机程序被所述处理器执行时,可以实施以下过程:
获取待分类的目标图片;
获取预先训练的用于判定图片类别的目标判定模型;其中,如果第一图片和第二图片的相似度大于设定的相似度阈值,则所述目标判定模型将第一图片和第二图片判定为同一类别,所述第二图片是在所述第一图片的基础上加入噪声而得到的图片;
利用所述目标判定模型,对所述目标图片进行分类。
其中,以上各个步骤的具体实施过程可参照上文图片分类方法,在此不再赘述。
本申请实施例提供的一种电子设备,获取待分类的目标图片;获取预先训练的用于判定图片类别的目标判定模型;其中,如果第一图片和第二图片的相似度大于设定的相似度阈值,则所述目标判定模型将第一图片和第二图片判定为同一类别;利用所述目标判定模型,对所述目标图片进行分类。如此,通过本申请提供的一种图片分类方法方法,可以提高目标判定模型的抗敏感噪声能力,从而降低网络监管模型判别色情图片失效的风险,进而有效提高网络监管的治理效能。
本领域内的技术人员应明白,本发明的实施例可提供为方法或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
Claims (10)
1.一种图片分类方法,其特征在于,所述方法包括:
获取待分类的目标图片;
获取预先训练的用于判定图片类别的目标判定模型;其中,如果第一图片和第二图片的相似度大于设定的相似度阈值,则所述目标判定模型将第一图片和第二图片判定为同一类别;
利用所述目标判定模型,对所述目标图片进行分类。
2.根据权利要求1所述的图片分类方法,其特征在于,所述目标判定模型的训练过程,包括:
获取目标训练集;
基于所述目标训练集,对基于深度学习的图片判断模型进行训练,直至所述图片判断模型将相似度大于设定的相似度阈值的两张图片判定为同一类别后训练完成,得到所述目标判定模型;
其中,所述目标训练集中包括多组目标指定图片对,每一组目标指定图片对包括第一指定图片和第一指定图片的分类标签、第二指定图片和第二指定图片的分类标签,所述第一指定图片和所述第二指定图片的相似度大于设定的相似度阈值,所述第一指定图片的分类标签和所述第二指定图片的分类标签指示相同的类别。
3.根据权利要求2所述的图片分类方法,其特征在于,所述目标训练集的获取过程,包括:
获取多组指定图片对;其中,每一组指定图片对包括相似度大于设定的相似度阈值的第一指定图片和第二指定图片,所述第二指定图片是在所述第一指定图片的基础上加入噪声而得到的图片;
针对任一组指定图片对:
根据图片判断模型对所述第一指定图片的分类结果,确定所述第一指定图片的分类标签,所述第一指定图片的分类标签指示所述第一指定图片的类别;
根据图片判断模型对所述第二指定图片的分类结果,确定所述第二指定图片的分类标签,所述第二指定图片的分类标签指示所述第二指定图片的类别;
在所述第二指定图片的分类标签和第一指定图片的分类标签相同的情况下,将当前组指定图片对丢弃;
在所述第二指定图片的分类标签和第一指定图片的分类标签不同的情况下,将所述第二指定图片的分类标签修改为第一指定图片的分类标签;
将所述第一指定图片、所述第一指定图片的分类标签、所述第二指定图片以及修改后的所述第二指定图片的分类标签作为所述目标指定图片对。
4.根据权利要求3所述的图片分类方法,其特征在于,所述第二指定图片通过如下方式得到,包括:
对所述第一指定图片进行卷积处理、池化处理、全连接层处理,生成图片编码;
对所述图片编码进行全连接层处理、上采样处理、反卷积处理得到所述第二指定图片。
5.根据权利要求2所述的图片分类方法,其特征在于,所述目标判定模型为色情图片判断模型,所述第一指定图片和所述第二指定图片的相似度是基于结构相似性算法而确定。
6.一种图片分类装置,其特征在于,所述装置包括:
获取模块,用于获取待分类的目标图片;
确定模块,用于获取预先训练的用于判定图片类别的目标判定模型;其中,如果第一图片和第二图片的相似度大于设定的相似度阈值,则所述目标判定模型将第一图片和第二图片判定为同一类别;
分类模块,用于利用所述目标判定模型,对所述目标图片进行分类。
7.根据权利要求6所述的图片分类装置,其特征在于,在所述确定模块获取预先训练的目标判定模型之前,所述获取模块还用于:获取目标训练集;
所述图片分类装置还包括训练模块,所述训练模块用于:基于所述目标训练集,对基于深度学习的图片判断模型进行训练,直至所述图片判断模型将相似度大于设定的相似度阈值的两张图片判定为同一类别后训练完成,得到所述目标判定模型;
其中,所述目标训练集中包括多组指定图片对,每一组指定图片对包括第一指定图片和第一指定图片的分类标签、第二指定图片和第二指定图片的分类标签,所述第一指定图片和所述第二指定图片的相似度大于设定的相似度阈值,所述第一指定图片的分类标签和所述第二指定图片的分类标签指示相同的类别。
8.根据权利要求7所述的图片分类方法,其特征在于,在所述目标训练集的获取过程中,所述获取模块具体用于:
获取多组指定图片对;其中,每一组指定图片对包括相似度大于设定的相似度阈值的第一指定图片和第二指定图片,所述第二指定图片是在所述第一指定图片的基础上加入噪声而得到的图片;
针对任一组指定图片对:
根据图片判断模型对所述第一指定图片的分类结果,确定所述第一指定图片的分类标签,所述第一指定图片的分类标签指示所述第一指定图片的类别;
根据图片判断模型对所述第二指定图片的分类结果,确定所述第二指定图片的分类标签,所述第二指定图片的分类标签指示所述第二指定图片的类别;
在所述第二指定图片的分类标签和第一指定图片的分类标签相同的情况下,将当前组指定图片对丢弃;
在所述第二指定图片的分类标签和第一指定图片的分类标签不同的情况下,将所述第二指定图片的分类标签修改为第一指定图片的分类标签;
将所述第一指定图片、所述第一指定图片的分类标签、所述第二指定图片以及修改后的所述第二指定图片的分类标签作为所述目标指定图片对。
9.根据权利要求8所述的图片分类装置,其特征在于,所述目标判定模型为色情图片判断模型,在获取第二指定图片的过程中,所述获取模块具体用于:
对所述第一指定图片进行卷积处理、池化处理、全连接层处理,以生成图片编码;
对所述图片编码进行全连接层处理、上采样处理、反卷积处理以得到所述第二指定图片。
10.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器存储计算机程序,当所述计算机程序被所述处理器执行时实施如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011551991.4A CN112686289A (zh) | 2020-12-24 | 2020-12-24 | 图片分类方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011551991.4A CN112686289A (zh) | 2020-12-24 | 2020-12-24 | 图片分类方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112686289A true CN112686289A (zh) | 2021-04-20 |
Family
ID=75452873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011551991.4A Pending CN112686289A (zh) | 2020-12-24 | 2020-12-24 | 图片分类方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112686289A (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101901346A (zh) * | 2010-05-06 | 2010-12-01 | 复旦大学 | 一种对彩色数字图像进行不良内容识别的方法 |
US7912246B1 (en) * | 2002-10-28 | 2011-03-22 | Videomining Corporation | Method and system for determining the age category of people based on facial images |
CN104680178A (zh) * | 2015-03-06 | 2015-06-03 | 西安电子科技大学 | 基于迁移学习多吸引子细胞自动机的图像分类方法 |
CN107092914A (zh) * | 2017-03-23 | 2017-08-25 | 广东数相智能科技有限公司 | 基于图像识别的垃圾分类方法、装置和系统 |
CN108921806A (zh) * | 2018-08-07 | 2018-11-30 | Oppo广东移动通信有限公司 | 一种图像处理方法、图像处理装置及终端设备 |
JP2018194346A (ja) * | 2017-05-15 | 2018-12-06 | 日本電気株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
CN109034218A (zh) * | 2018-07-11 | 2018-12-18 | 东软集团股份有限公司 | 模型训练方法、装置、设备及存储介质 |
CN109508643A (zh) * | 2018-10-19 | 2019-03-22 | 北京陌上花科技有限公司 | 用于色情图片的图像数据处理方法及装置 |
CN109583501A (zh) * | 2018-11-30 | 2019-04-05 | 广州市百果园信息技术有限公司 | 图片分类、分类识别模型的生成方法、装置、设备及介质 |
CN109902617A (zh) * | 2019-02-25 | 2019-06-18 | 百度在线网络技术(北京)有限公司 | 一种图片识别方法、装置、计算机设备和介质 |
CN110110749A (zh) * | 2019-03-29 | 2019-08-09 | 广州思德医疗科技有限公司 | 一种训练集中的图片处理方法及装置 |
CN110516745A (zh) * | 2019-08-28 | 2019-11-29 | 北京达佳互联信息技术有限公司 | 图像识别模型的训练方法、装置及电子设备 |
WO2019232723A1 (en) * | 2018-06-06 | 2019-12-12 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for cleaning data |
CN110751191A (zh) * | 2019-09-27 | 2020-02-04 | 广东浪潮大数据研究有限公司 | 一种图像的分类方法及系统 |
CN111008643A (zh) * | 2019-10-29 | 2020-04-14 | 平安科技(深圳)有限公司 | 基于半监督学习的图片分类方法、装置和计算机设备 |
CN111340188A (zh) * | 2020-02-21 | 2020-06-26 | 北京集创北方科技股份有限公司 | 图像处理方法及装置、电子设备和可读存储介质 |
CN111860178A (zh) * | 2020-06-22 | 2020-10-30 | 中国科学院空天信息创新研究院 | 一种基于权重字典学习的小样本遥感目标检测方法及系统 |
-
2020
- 2020-12-24 CN CN202011551991.4A patent/CN112686289A/zh active Pending
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7912246B1 (en) * | 2002-10-28 | 2011-03-22 | Videomining Corporation | Method and system for determining the age category of people based on facial images |
CN101901346A (zh) * | 2010-05-06 | 2010-12-01 | 复旦大学 | 一种对彩色数字图像进行不良内容识别的方法 |
CN104680178A (zh) * | 2015-03-06 | 2015-06-03 | 西安电子科技大学 | 基于迁移学习多吸引子细胞自动机的图像分类方法 |
CN107092914A (zh) * | 2017-03-23 | 2017-08-25 | 广东数相智能科技有限公司 | 基于图像识别的垃圾分类方法、装置和系统 |
JP2018194346A (ja) * | 2017-05-15 | 2018-12-06 | 日本電気株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
WO2019232723A1 (en) * | 2018-06-06 | 2019-12-12 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for cleaning data |
CN109034218A (zh) * | 2018-07-11 | 2018-12-18 | 东软集团股份有限公司 | 模型训练方法、装置、设备及存储介质 |
CN108921806A (zh) * | 2018-08-07 | 2018-11-30 | Oppo广东移动通信有限公司 | 一种图像处理方法、图像处理装置及终端设备 |
CN109508643A (zh) * | 2018-10-19 | 2019-03-22 | 北京陌上花科技有限公司 | 用于色情图片的图像数据处理方法及装置 |
CN109583501A (zh) * | 2018-11-30 | 2019-04-05 | 广州市百果园信息技术有限公司 | 图片分类、分类识别模型的生成方法、装置、设备及介质 |
CN109902617A (zh) * | 2019-02-25 | 2019-06-18 | 百度在线网络技术(北京)有限公司 | 一种图片识别方法、装置、计算机设备和介质 |
CN110110749A (zh) * | 2019-03-29 | 2019-08-09 | 广州思德医疗科技有限公司 | 一种训练集中的图片处理方法及装置 |
CN110516745A (zh) * | 2019-08-28 | 2019-11-29 | 北京达佳互联信息技术有限公司 | 图像识别模型的训练方法、装置及电子设备 |
CN110751191A (zh) * | 2019-09-27 | 2020-02-04 | 广东浪潮大数据研究有限公司 | 一种图像的分类方法及系统 |
CN111008643A (zh) * | 2019-10-29 | 2020-04-14 | 平安科技(深圳)有限公司 | 基于半监督学习的图片分类方法、装置和计算机设备 |
CN111340188A (zh) * | 2020-02-21 | 2020-06-26 | 北京集创北方科技股份有限公司 | 图像处理方法及装置、电子设备和可读存储介质 |
CN111860178A (zh) * | 2020-06-22 | 2020-10-30 | 中国科学院空天信息创新研究院 | 一种基于权重字典学习的小样本遥感目标检测方法及系统 |
Non-Patent Citations (2)
Title |
---|
CHANG, ZY (CHANG, ZHANYUAN) 等: "A novel image segmentation approach for wood plate surface defect classification through convex optimization", 《JOURNAL OF FORESTRY RESEARCH》, no. 29, 30 November 2018 (2018-11-30), pages 1789 - 1795 * |
许开炜: "基于卷积神经网络的SAR图像分类", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 05, 15 May 2020 (2020-05-15), pages 136 - 131 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109584221B (zh) | 一种基于监督式生成对抗网络的异常图像检测方法 | |
US10628705B2 (en) | Combining convolution and deconvolution for object detection | |
US10423852B1 (en) | Text image processing using word spacing equalization for ICR system employing artificial neural network | |
CN111709883B (zh) | 一种图像检测方法、装置及设备 | |
CN112561910A (zh) | 一种基于多尺度特征融合的工业表面缺陷检测方法 | |
KR20200094622A (ko) | 뉴럴 네트워크 학습에 이용될 오토 라벨링된 이미지 중에서 라벨 검수를 위한 샘플 이미지를 획득하는 방법 및 이를 이용한 샘플 이미지 획득 장치 | |
JPWO2019026104A1 (ja) | 情報処理装置、情報処理プログラム及び情報処理方法 | |
CN115937655B (zh) | 多阶特征交互的目标检测模型及其构建方法、装置及应用 | |
JP2012058787A (ja) | 情報処理装置、およびその処理方法 | |
CN116910752B (zh) | 一种基于大数据的恶意代码检测方法 | |
Breiki et al. | Self-supervised learning for fine-grained image classification | |
CN117557872B (zh) | 一种优化存储模式的无监督异常检测方法及装置 | |
CN112818774A (zh) | 一种活体检测方法及装置 | |
CN115984671B (zh) | 模型在线更新方法、装置、电子设备及可读存储介质 | |
CN112686289A (zh) | 图片分类方法和装置 | |
CN116488874A (zh) | 基于自监督掩码上下文重构的网络入侵检测方法和系统 | |
CN114119970B (zh) | 目标跟踪方法及装置 | |
CN113627538B (zh) | 训练非对称生成对抗网络产生图像的方法及电子装置 | |
CN115512203A (zh) | 信息检测方法、装置、设备及存储介质 | |
CN107644251B (zh) | 对象分类方法、装置和系统 | |
CN117523218A (zh) | 标签生成、图像分类模型的训练、图像分类方法及装置 | |
CN116152542A (zh) | 图像分类模型的训练方法、装置、设备及存储介质 | |
CN112613521B (zh) | 基于数据转换的多层次数据分析系统及方法 | |
CN109978863B (zh) | 基于x射线图像的目标检测方法及计算机设备 | |
KR102513580B1 (ko) | 웨이퍼분류모델 학습을 위한 웨이퍼 이미지를 생성하는 방법 및 그 장치와, 이를 이용하여 웨이퍼분류모델을 생성하는 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |