CN113435233B - 色情图像识别方法、系统及电子设备 - Google Patents

色情图像识别方法、系统及电子设备 Download PDF

Info

Publication number
CN113435233B
CN113435233B CN202010210476.3A CN202010210476A CN113435233B CN 113435233 B CN113435233 B CN 113435233B CN 202010210476 A CN202010210476 A CN 202010210476A CN 113435233 B CN113435233 B CN 113435233B
Authority
CN
China
Prior art keywords
image
pornography
images
pornographic
saliency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010210476.3A
Other languages
English (en)
Other versions
CN113435233A (zh
Inventor
成超
蔡媛
樊鸿飞
汪贤
鲁方波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Cloud Network Technology Co Ltd
Original Assignee
Beijing Kingsoft Cloud Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Cloud Network Technology Co Ltd filed Critical Beijing Kingsoft Cloud Network Technology Co Ltd
Priority to CN202010210476.3A priority Critical patent/CN113435233B/zh
Publication of CN113435233A publication Critical patent/CN113435233A/zh
Application granted granted Critical
Publication of CN113435233B publication Critical patent/CN113435233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种色情图像识别方法、系统及电子设备,涉及模式识别技术领域,该色情图像识别方法包括:将待测图像输入色情图像识别模型;利用所述色情图像识别模型输出多个显著性特征图,每个所述显著性特征图分别用于标示预设的多个敏感部位之一;任一所述显著性特征图标示出对应的敏感部位时,确定所述待测图像为色情图像。上述方法通过对人体性器官进行显著性特征识别,更加关注性器官的裸露程度,更加具有针对性,有利于减少模型所需的样本数量,提升色情图像的识别精度。

Description

色情图像识别方法、系统及电子设备
技术领域
本发明涉及模式识别技术领域,尤其是涉及一种色情图像识别方法、系统及电子设备。
背景技术
对于互联网中对于色情信息的防范已成为行业内的热点问题,由于互联网中的信息传播快,导致色情信息极易快速传播,严重影响互联网用户的心理健康,因此对于互联网企业而言如何快速识别色情信息数据对于企业口碑以及发展过程而言至关重要。现有技术中对于色情信息的识别通常采用预先完成训练的相关深度学习模型来实现,模型在训练过程中需要人工标注大量的图像样本来实现,但色情图像的获取较为困难,导致模型性能不佳,使得色情图像的识别精度较低。
发明内容
有鉴于此,本发明的目的在于提供一种色情图像识别方法、系统及电子设备,根据对人体性器官进行显著性特征识别,实现了人体性器官裸露程度的精确表征,提高了色情图像的识别精度。
第一方面,本发明实施例提供了一种色情图像识别方法,该方法包括:
将待测图像输入色情图像识别模型;
利用所述色情图像识别模型输出多个显著性特征图,每个所述显著性特征图分别用于标示预设的多个敏感部位之一;
任一所述显著性特征图标示出对应的敏感部位时,确定所述待测图像为色情图像。
在一些实施方式中,所述任一所述显著性特征图标示出对应的敏感部位时,确定所述待测图像为色情图像的步骤,包括:
将每个所述显著性特征图转换为热力图,计算每个所述热力图的最大响应值;
如果任一所述热力图的最大响应值超过对应的阈值,则判断所述待测图像为色情图像。
在一些实施方式中,上述多个敏感部位包括左乳、右乳和性器官。
在一些实施方式中,在所述将待测图像输入色情图像识别模型的步骤之前,还包括:
获取图像训练集;其中,图像训练集包括若干带有标定的色情图像;
将图像训练集输入初始识别模型,输出多个显著性特征图,每个显著性特征图分别用于标示预设的多个敏感部位之一;
对初始识别模型的参数进行调整,直到输出的显著性特征图与带有标定的色情图像满足预设的一致度,形成色情图像识别模型。
在一些实施方式中,上述获取图像训练集的步骤,包括:
获取若干非色情图像和若干色情图像;
对每个色情图像中的预设的多个敏感部位进行标定;
采用若干非色情图像和经标定的若干色情图像组成图像训练集。
在一些实施方式中,上述初始识别模型为显著性检测模型。
第二方面,本发明实施例提供了一种色情图像识别系统,该系统包括:
图像输入模块,用于将待测图像输入色情图像识别模型;
显著性特征获取模块,用于利用所述色情图像识别模型输出多个显著性特征图,每个所述显著性特征图分别用于标示预设的多个敏感部位之一;
确定模块,用于任一所述显著性特征图标示出对应的敏感部位时,确定所述待测图像为色情图像。
在一些实施方式中,该系统还包括:
训练集获取模块,用于获取图像训练集;其中,图像训练集包括若干带有标定的色情图像;
模型训练模块,用于将图像训练集输入初始识别模型,输出多个显著性特征图,每个显著性特征图分别用于标示预设的多个敏感部位之一;
模型获取模块,用于对初始识别模型的参数进行调整,直到输出的显著性特征图与带有标定的色情图像满足预设的一致度,形成色情图像识别模型。
第三方面,本发明实施例提供了一种电子设备,该电子设备包括:处理器和存储装置;存储装置上存储有计算机程序,计算机程序在被处理器运行时执行上述第一方面提供的方法步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述第一方面提供的方法步骤。
本发明实施例带来了以下有益效果:本发明实施例提供了一种色情图像识别方法和系统,在色情图像识别方法中,首先将待测图像输入色情图像识别模型,利用色情图像识别模型输出多个显著性特征图,每个显著性特征图分别用于标示预设的多个敏感部位之一,然后基于多个显著性特征图,判断待测图像是否为色情图像,如果任一显著性特征图标示出对应的敏感部位,就确定该待测图像为色情图像。上述方法通过对人体性器官进行显著性特征识别,更加关注性器官及敏感部位的裸露程度,具有更强的针对性,有利于减少模型所需的样本数量,降低样本标注的人工成本和时间成本,有利于提升色情图像的识别精度。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的色情图像识别方法的流程图;
图2为本发明实施例提供的色情图像识别方法中步骤S103的流程图;
图3为本发明实施例提供的色情图像识别方法的另一流程图;
图4为本发明实施例提供的色情图像识别方法中步骤S301的流程图;
图5为本发明实施例提供的色情图像识别系统的结构示意图;
图6为本发明实施例提供的色情图像识别系统的另一结构示意图;
图7为本发明实施例提供的一种电子设备的结构示意图。
图标:
501-图像输入模块;502-显著性特征获取模块;503-确定模块;601-训练集获取模块;602-模型训练模块;603-模型获取模块;700-电子设备;701-处理器;702-存储器;703-总线;704-通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
互联网的快速发展使得信息获取更加简单快捷,信息传播的速度也极速提升,社交应用的兴起以及其它新型信息资讯传播的方式使得互联网用户获取资讯的方式也愈发丰富。与此同时,色情信息由于其本身特有的刺激性和吸引性使其在互联网中具有更高的传播速度,对互联网用户的身心健康造成损害。尤其对于青少年用户,其心智发育不够成熟,三观也不健全,极易被这类敏感且不健康的信息所诱惑,严重影响青少年的身心健康。正因如此,国家对于色情信息管制非常严格。而对于互联网企业而言,如何防范色情信息的传播已成为企业发展的重要问题,一旦出现色情信息,对于互联网企业而言带来的不仅仅是口碑的下降,同时对企业的发展也具有较大的负面影响,甚至还会触犯法律直接影响互联网企业的生存。因此,对于色情信息的识别已成为互联网企业的研究重点。
色情信息的展现形式众多,例如:视频、图像、文字、声音等,其中的视频最为直观,危害性也最高,但视频文件的数据量较大,传播较慢;文字以及声音虽然数据量小,传播较快,但相对于视频而言其刺激程度较低。而色情图像兼顾了直观性以及传播速度快的特性,而且色情视频可以理解为色情图像的集合,因此对色情图像识别的研究已成为行业主流。
现有技术中,对于色情图像的识别采用机器学习的方式进行分类识别,随着机器学习中的深度学习技术的发展,通过深度学习的相关神经网络模型进行训练,来达到识别色情图像的目的。
在使用深度学习技术来进行色情图像识别时,一般需要人工标注大量的色情图像作为样本,标注的阶段需要人工来对图像是否为色情图像进行界定。在准备好大量训练样本后,通过使用深度学习相关模型来对这些经过标定的样本进行学习。通过在大规模样本上进行学习,使得深度学习模型能够学习到色情与非色情图形的模式差别以及分类边界。学习的效果与样本数量有直接关系,样本越多则学习到的特征就越充分,识别效果也就越好。
由于认知的差异性,对样本图像进行色情标定的结果可能是不同的,这是不同人对于色情图像的认知是不同的。因为对色情图像的判定本身是一个相对主观的过程,判定标准在行业中并没有严格意义上的规定,因此常常会出现将一些正常图像判断为色情图像的情况,例如穿着相对暴露的比基尼女性。
导致上述误判主要包含以下原因:由于内容敏感性,导致色情图像的获取较为困难,难以收集大量样本数据对模型进行充分训练;分类思想的方法并没有提供色情图像所具备的显著特性的标定,具体的说就是性器官的裸露程度,而模型在训练期间对于图像重点区域的关注程度在上述方法中是不可控的。因此在样本不充分时,模型常常会将穿着较少的人物判断为色情图像,出现误判的情况。
考虑到现有色情图像识别中存在的上述问题,本发明的目的在于提供一种色情图像识别方法、系统及电子设备,该技术可以应用于色情图像识别的过程中,可以采用相关的软件或硬件实现,下面通过实施例进行描述。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种色情图像识别方法进行详细介绍,该方法的流程图如图1所示,包括:
步骤S101,将待测图像输入色情图像识别模型。
待测图像是指互联网中相关平台传播的图像,对于社交平台而言,待测图像可以是社交用户上传的拍摄照片或其它图片;对于资讯平台而言,待测图像可以是资讯平台发布的新闻资讯中所包含的图像;对于聊天类平台而言,待测图像可以是聊天用户中相互发送的图像;对于直播平台而言,待测图像可以是视频直播中截取的图像。
不同类型的待测图像,其获取过程也各不相同,获取的过程在本实施例中不进行过多描述,但获得待测图像均为数字图像。
待测图像在输入至色情图像识别模型之前,可首先进行预处理操作,将过于简单的图像进行忽略,例如摒弃空白图像、二值化图像以及像素过低的图像等没有过多细节的数字图像,可有效提升识别效率。
色情图像识别模型采用深度学习网络中相关的神经网络模型进行训练,例如可选用CNN(Convolutional Neural Networks,卷积神经网络)、AlexNet(埃里克斯网络)、ZFNet(ZF网络)、VGGNet(Visual Geometry GroupNetworks,视觉几何组网络)、GoogLeNet(谷歌网络)、ResNet(Residual Neural Network,残留神经网络)、Unet(分割网络)以及SRCNN(Super-Resolution Convolutional Neural Networks,超分辨率卷积神经网络)等上述任意一种,还可以使用上述不同神经网络模型的结合。
色情图像识别模型已预先完成训练,训练所用的图像训练集中包含色情图像,也包含非色情图像。对于图像的色情判断已预先通过人工进行了标定,色情图像的获取可通过色情图像识别模型的识别结果直接获得。通过色情图像识别模型得到的结果,再结合人工标定,确定出色情图像,可减少色情图像获取困难的问题。
步骤S102,利用色情图像识别模型输出多个显著性特征图,每个显著性特征图分别用于标示预设的多个敏感部位之一。
显著性特征是衡量图像是否包含色情区域的关键数据,由于色情区域的种类可根据敏感部位的不同而划分为多个种类,因此不同的显著性特征之间也互不相同,所表征的区域也不同。
显著性特征的设定是根据具体敏感部位而预先完成的,例如将裸露的乳房以及性器官作为敏感部位,具体的可将人物的左乳、右乳、男性性器官以及女性性器官作为显著性特征。在模型进行训练的过程,通过收集包含上述敏感部位图片作为样本,分别进行训练,使得将待测图像输入至色情图像识别模型后,输出与显著性特征对应的显著性特征图。例如,显著性特征图为4个,分别对应了左乳、右乳、男性性器官以及女性性器官的特征图。
显著性特征可通过在待识别图像中进行标记得以实现,也可以通过图像区域的相关位置数据进行保存。不同敏感部位对应着不同的模型训练方式,最终输出的结果也各不相同。显著性特征的输出结果可通过相关数值进行衡量,例如通过相关算法对待识别区域中的左乳位置进行显著性计算,最终得到一个矩阵,而该矩阵中一定存在着最大计算结果,根据该结果的坐标以及区域大小来获得左乳最有可能出现的位置。
应当注意的是,上述位置中并不一定存在左乳,而只是最有可能出现,具体需要结合图像来设置阈值进行判断。
步骤S103,任一所述显著性特征图标示出对应的敏感部位时,确定所述待测图像为色情图像。
在获取到待测图像的多个显著性特征图后,即获得图像中最有可能出现的色情区域,通过对这些区域进行判定来确定待测图像是否为色情图像。
显著性特征的计算结果中不仅仅包含位置信息,还可以包含色情程度数据,色情程度的大小通过相关算法得以实现,例如数值越高代表越有可能是对应的敏感部位;数值越低则代表越不可能是对应的敏感部位。由于色情程度实现了量化,因此可直接通过设置阈值的方式进行判断。当显著性特征的计算结果大于等于阈值时则表明该显著性特征中具有对应的敏感区域,待测图像为色情图像;当显著性特征的计算结果小于阈值时则表明该显著性特征中不具有对应的敏感区域,待测图像为正常图像。
在设置裸露性器官种类时,可不限于上述提到的种类,而且还可以将男女器官种类区分开进行检测,也可以按照种类归并到一起,只需要在标注阶段按照规定类型标注即可。例如对于左乳的检测,如果不区分男女,则在同一副特征图中对男女左乳进行响应检测;如果区分男女则拆成两张特征图,一张用于检测男性,另一张用于检测女性。
可见,在对多个显著性特征图进行判断的过程中,通过对人体性器官进行显著性特征识别,更加关注性器官的裸露程度,具有较强的针对性,有利于减少模型所需的样本数量,降低样本标注的人工成本和时间成本,有利于提升色情图像的识别精度。
在一些实施方式中,上述基于多个显著性特征图,判断待测图像是否为色情图像的步骤S103,可通过计算不同显著性特征的响应值来实现,具体步骤如图2所示,包括:
步骤S201,将每个显著性特征图转换为热力图,计算每个热力图的最大响应值。
最大响应值表征了待测图像中的色情程度值,不同的敏感部位对应着不同类型的响应值,例如在具体实施过程中,敏感部位包括左乳、右乳和性器官。上述三个敏感部位对应三个显著性特征图,每一个显著性特征图中均包含一个对应的响应值。
显著性特征图可转换为热力图的形式进行展示,通过局部高亮的形式对敏感部位进行特殊标记,以此实现了对敏感部位的获取。热力图的实质是一个数字矩阵,最大响应值所在的位置就是特征点所在的位置,如下式所示:
Ressponsei=MAX(heatmapi)
其中,Ressponse为显著性特征图中的最大响应值;heatmap为热力图矩阵;i为显著性事件,具体的i=1表征左乳;i=2表征右乳;i=3表征性器官。例如,heatmap1即为标示左乳的显著性特征图转化而成的热力图矩阵,Ressponse1即为热力图矩阵heatmap1中数值最大的数字,也就是左乳的显著性特征图最大响应值,也就是,he atmapi表示显著性事件i对应的显著性特征图转化而成的热力图矩阵,Max(he atmapi)表示显著性事件i对应的显著性特征图转化而成的热力图矩阵中的最大值,最大值所在的位置就是特征点所在的位置,同样,最大值也就是特征点的响应值,Responsei表示显著性事件i对应的显著性特征图的最大响应值。
步骤S202,如果任一热力图的最大响应值超过对应的阈值,则判断待测图像为色情图像。
上述三个敏感部位对应三个显著性特征图转换而成的热力图,通过上一步的计算得到每个热力图中的最大响应值,对于判断该待测图像是否为色情图像而言,仅需设定相关的阈值,对上述三个特征图中的最大响应值进行判断,即可得到结果。当最大响应值大于等于对应的阈值时即可说明该图像为色情图像;当最大响应值小于阈值时即可说明该图像为正常图像。不同部位的显著性特征图可对应不同的阈值,具体设置根据实际情况而定。
具体的,对于i=1时的左乳判断,该阈值可设置为0.5,Ressponse1的最大响应值如果大于等于0.5时,则表明该区域中具有裸露的左乳,该图像即可判断为色情图像。同理,对于i=2时的右乳判断,该阈值可设置为相同的0.5。而对于生殖器而言,相对于左乳、右乳而言对于用户的刺激程度更高,需要更加严格进行的过滤,因此该阈值的设置一般要低于左乳和右乳,例如该阈值可设置为0.4,当Ressponse3的最大响应值如果大于等于0.4时,则表明该区域中具有裸露的生殖器。
色情图像的判断过程中,只要多个显著性特征图对应的最大响应值有一个超过阈值,则认为该图像为色情图像。为了增加执行效率,当出现有一个超过阈值的显著性特征时即可停止后续其它部位的计算,直接得到判断结果。
在一些特殊情况下也需要将所有的显著性特征图进行计算,在检测到某个显著性特征图标示出了敏感部位时,表明该待测图像为色情图像,通常情况下图像中包含多个显著性特征对应的敏感区域,因此有必要将该敏感区域全部进行标记,以作为后续的样本用于相关色情图像识别模型的训练所用。通过将色情图像中的所有敏感区域进行判定,后续将该图片对应不同敏感区域进行逐一处理,作为样本集,缓解了相关色情图像识别模型样本数据采集困难的问题。
本发明实施例提供了上述色情图像识别方法中使用的色情图像识别模型的训练方法,如图3所示,该方法包括:
步骤S301,获取图像训练集;其中,图像训练集包括若干带有标定的色情图像。
标定的色情图像可由上述实施例中提到的已判定为色情图像的待识别图像,而且待识别图像中已自动完成了相关标记,因此将识别结果用于模型的再训练,可使得模型性能进一步提升。
带有标定的色情图像还可以通过其它途径得以实现,例如通过相关成人网站中进行下载;还可通过相关医学资料中进行获取,如人体的裸体照片以及相关生殖器以及乳房的照片。标定的过程通过人工进行标定,对从相关成人网站中获取的图像进行标注;也可通过相关医学图片直接作为样本,而并不需要标注。
步骤S302,将图像训练集输入初始识别模型,输出多个显著性特征图,每个显著性特征图分别用于标示预设的多个敏感部位之一。
初始模型为已完成初始化的相关机器学习模型,在一些实施方式中,上述初始识别模型为显著性检测模型。该显著性检验模型可选用相关神经网络模型,例如可采用CNN、AlexNet、ZFNet、VGGNet、GoogLeNet、ResNet、UNet以及SRCNN中的任意一种。该初始识别模型可将图像训练姐中的图像进行识别,输出多个显著性特征图,不同显著性特征图对应不同的敏感部位,每个显著性特征图分别用于标示预设的敏感部位。
例如,图像训练集中的待识别图像为色情图像,包含左乳、右乳、生殖器共三个敏感部位,将该待识别图像输入至初始识别模型进行相关识别后,得到三个识别图像,这三个识别图像分别对应了左乳、右乳以及生殖器的识别结果,因此训练过程中该图像训练集可作为正向训练的数据。
如果图像训练集中的待识别图像并不包含色情区域,而对于左乳、右乳、生殖器三个部位的识别过程中,同样会标记出出现几率最大的区域,但该区域实际上并不存在色情区域,因此可将该图像训练集作为反向训练的数据。通过选择合适的正向训练数据以及反向训练数据,对于模型的训练过程至关重要。
步骤S303,对初始识别模型的参数进行调整,直到输出的显著性特征图与带有标定的色情图像满足预设的一致度,形成色情图像识别模型。
通过对输出的多个显著性特征图结果进行判断,根据输出的结果调整初始识别模型的相关参数,使得输出的显著性特征图中所标记的色情区域,与带有标定的色情图像中的色情区域尽可能的一致,最终形成色情图像识别模型。
预设的一致度可根据输出的显著性特征图中所标记的色情区域与带有标定的色情图像中所标定的区域之间的重叠度进行判断,例如对于色情区域通过采用圆进行标定,一致度就可通过二者的圆心位置进行判定,也可通过圆形区域的重叠程度进行判定。一致度判定是通过数字图像中的相关运算得以实现,因此可通过数字图像中的相关算法对重叠区域直接计算。
具体的说,可将显著性特征图中所标记的色情区域与带有标定的色情图像中所标定的区域,二者重叠区域的80%作为预设的一致度,当二者重叠区域大于等于80%时则表明模型的识别结果与带有标记的色情图像相一致;当二则重叠区域小于80%时则表明模型的识别结果与带有标记的色情图像并不一致。
在一些实施方式中,上述获取图像训练集的步骤S301,如图4所示,包括以下步骤:
步骤S401,获取若干非色情图像和若干色情图像。
图像训练集中包含多个图像,根据内容的不同划分为色情图像和非色情图像。划分的过程可通过人工标定完成,也可通过初始识别模型的识别结果再结合人工标定来实现。
在对图像进行标定完成后,可对该图像增加有关色情图像标签来进行划分,例如该标签的数值为1时则为色情图像;数值为0时则为非色情图像。该标签可直接保存在图像的exif(Exchangeable image file format,可交换图像文件格式)中,也可保存在数字图像的属性中,最终用于初始识别模型的训练。
步骤S402,对每个色情图像中的预设的多个敏感部位进行标定。
对于色情图像而言,其中必定包含至少一个敏感部位,多数情况下会包含多个敏感部位,这些敏感部位包含多种,例如:左乳、右乳、男性器官、女性器官等。针对于上述敏感部位,通过圆形或矩形进行标定。
标定的过程可通过人工标定来实现,也可通过初始识别模型训练的结果进行标定,标定的数据以数字图像的结果来衡量。例如对于左乳或右乳而言,该敏感部位通常以某像素点位置作为圆心,半径为某像素长度的圆形,圆形区域的大小以覆盖左乳或右乳部位作为原则;对于性器官而言,该敏感部位通常以某像素点位置为矩形左上角(也可为其它三个角的坐标),长和宽分别为某像素长度的矩形,矩形区域的大小以覆盖性器官部位作为原则。标定的结果同样可保存与Exif中,也可保存在该数字图像的属性中。
步骤S403,采用若干非色情图像和经标定的若干色情图像组成图像训练集。
在对色情图像进行标定后,将该色情图像与非色情图像进行组合,形成初始识别模型的训练集。对于图像训练集而言,其中的图像数量越多,相对而言模型的训练效果就越好,因此需尽可能的收集色情图像,但由于合法的色情图像本身获取困难,因此需要将识别出的色情图像尽可能的利用,也可以对该色情图像进行相关的改造。例如对于一张同时包含有左乳、右乳以及性器官的色情图像而言,可对该图像进行处理,在每张色情图像中只保留一个敏感区域,而对其它两个敏感区域进行模糊处理,最终可将一张色情图像扩展为三张图像,增加了样本数量,有利于提升模型的性能。
在设置裸露性器官的种类时,可不限于上述的左乳、右乳以及性器官三个类别,而且可将男女性器官种类加以区分以进行检测,也可以按照种类合并在一起,只需要在标注阶段按照规定类型进行标注即可。例如对于左乳的检测,如果不区分男女,则在同一特征图中对男女左乳进行检测;而如果区分男女,则将该特征图拆分为两个特征图,分别对男性左乳以及女性左乳进行检测。
对应于上述色情图像识别方法的实施例,本实施例还提供一种色情图像识别系统,如图5所示,该系统包括:
图像输入模块501,用于将待测图像输入色情图像识别模型;
显著性特征获取模块502,用于利用色情图像识别模型输出多个显著性特征图,每个显著性特征图分别用于标示预设的多个敏感部位之一;
确定模块503,用于任一显著性特征图标示出对应的敏感部位时,确定待测图像为色情图像。
本发明实施例所提供的色情图像识别系统,其实现原理及产生的技术效果和前述色情图像识别方法的实施例相同,为简要描述,实施例部分未提及之处,可参考前述方法实施例中相应内容。
本发明实施例提供的上述色情图像识别系统中,还用于对其中使用的色情图像识别模型进行训练,如图6所示,该系统还包括:
训练集获取模块601,用于获取图像训练集;其中,图像训练集包括若干带有标定的色情图像;
模型训练模块602,用于将图像训练集输入初始识别模型,输出多个显著性特征图,每个显著性特征图分别用于标示预设的多个敏感部位之一;
模型获取模块603,用于对初始识别模型的参数进行调整,直到输出的显著性特征图与带有标定的色情图像满足预设的一致度,形成色情图像识别模型。
本发明实施例所提供的色情图像识别模型的训练系统,其实现原理及产生的技术效果和前述色情图像识别模型的训练方法的实施例相同,为简要描述,实施例部分未提及之处,可参考前述方法实施例中相应内容。
本实施例还提供一种电子设备,为该电子设备的结构示意图如图7所示,该电子设备700包括处理器701和存储器702;其中,存储器702用于存储一条或多条计算机指令,一条或多条计算机指令被处理器执行,以实现上述色情图像识别方法以及色情图像识别模型的训练方法。
图7所示的电子设备还包括总线703和通信接口704,处理器701、通信接口704和存储器702通过总线703连接。
其中,存储器702可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。总线703可以是ISA总线、PCI总线或EISA总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
通信接口704用于通过网络接口与至少一个用户终端及其它网络单元连接,将封装好的IPv4报文或IPv4报文通过网络接口发送至用户终端。
处理器701可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器701中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器701可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processor,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本公开实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本公开实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器702,处理器701读取存储器702中的信息,结合其硬件完成前述实施例的方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行前述实施例的方法的步骤。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、设备和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,设备或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以用软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种色情图像识别方法,其特征在于,所述方法包括:
将待测图像输入色情图像识别模型;
利用所述色情图像识别模型输出多个显著性特征图,每个所述显著性特征图分别用于标示预设的多个敏感部位之一;其中,每个所述显著性特征图中的显著性特征均包括位置信息和色情程度数据,所述色情程度数据是通过相关算法计算得到的;
任一所述显著性特征图标示出对应的敏感部位时,确定所述待测图像为色情图像;
所述任一所述显著性特征图标示出对应的敏感部位时,确定所述待测图像为色情图像的步骤,包括:
将每个所述显著性特征图转换为热力图,计算每个所述热力图的最大响应值;
如果任一所述热力图的最大响应值超过对应的阈值,则判断所述待测图像为色情图像。
2.根据权利要求1所述的方法,其特征在于,所述多个敏感部位包括左乳、右乳和性器官。
3.根据权利要求1所述的方法,其特征在于,在所述将待测图像输入色情图像识别模型的步骤之前,还包括:
获取图像训练集;其中,所述图像训练集包括若干带有标定的色情图像;
将所述图像训练集输入初始识别模型,输出多个显著性特征图,每个所述显著性特征图分别用于标示预设的多个敏感部位之一;
对所述初始识别模型的参数进行调整,直到输出的显著性特征图与所述带有标定的色情图像满足预设的一致度,形成色情图像识别模型。
4.根据权利要求3所述的方法,其特征在于,所述获取图像训练集的步骤,包括:
获取若干非色情图像和若干色情图像;
对每个所述色情图像中的预设的多个敏感部位进行标定;
采用所述若干非色情图像和经标定的所述若干色情图像组成图像训练集。
5.根据权利要求3所述的方法,其特征在于,所述初始识别模型为显著性检测模型。
6.一种色情图像识别系统,其特征在于,所述系统包括:
图像输入模块,用于将待测图像输入色情图像识别模型;
显著性特征获取模块,用于利用所述色情图像识别模型输出多个显著性特征图,每个所述显著性特征图分别用于标示预设的多个敏感部位之一;其中,每个所述显著性特征图中的显著性特征均包括位置信息和色情程度数据,所述色情程度数据是通过相关算法计算得到的;
确定模块,用于任一所述显著性特征图标示出对应的敏感部位时,确定所述待测图像为色情图像;
所述确定模块具体用于:将每个所述显著性特征图转换为热力图,计算每个所述热力图的最大响应值;如果任一所述热力图的最大响应值超过对应的阈值,则判断所述待测图像为色情图像。
7.根据权利要求6所述的系统,其特征在于,所述系统还包括:
训练集获取模块,用于获取图像训练集;其中,所述图像训练集包括若干带有标定的色情图像;
模型训练模块,用于将所述图像训练集输入初始识别模型,输出多个显著性特征图,每个所述显著性特征图分别用于标示预设的多个敏感部位之一;
模型获取模块,用于对所述初始识别模型的参数进行调整,直到输出的显著性特征图与所述带有标定的色情图像满足预设的一致度,形成色情图像识别模型。
8.一种电子设备,其特征在于,包括:处理器和存储装置;所述存储装置上存储有计算机程序,所述计算机程序在被所述处理器运行时执行如权利要求1至5任一项所述的方法。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1至5任一项所述的方法的步骤。
CN202010210476.3A 2020-03-23 2020-03-23 色情图像识别方法、系统及电子设备 Active CN113435233B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010210476.3A CN113435233B (zh) 2020-03-23 2020-03-23 色情图像识别方法、系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010210476.3A CN113435233B (zh) 2020-03-23 2020-03-23 色情图像识别方法、系统及电子设备

Publications (2)

Publication Number Publication Date
CN113435233A CN113435233A (zh) 2021-09-24
CN113435233B true CN113435233B (zh) 2024-03-05

Family

ID=77752801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010210476.3A Active CN113435233B (zh) 2020-03-23 2020-03-23 色情图像识别方法、系统及电子设备

Country Status (1)

Country Link
CN (1) CN113435233B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116033222A (zh) * 2022-12-22 2023-04-28 深圳创维-Rgb电子有限公司 视频播放方法、装置、显示设备及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484683A (zh) * 2014-12-31 2015-04-01 小米科技有限责任公司 黄色图片检测方法及装置
JP2015130616A (ja) * 2014-01-08 2015-07-16 沖電気工業株式会社 画像符号化装置及びプログラム、画像復号装置及びプログラム、並びに、画像符号化システム
CN110491480A (zh) * 2019-05-22 2019-11-22 腾讯科技(深圳)有限公司 一种医疗图像处理方法、装置、电子医疗设备和存储介质
CN110504029A (zh) * 2019-08-29 2019-11-26 腾讯医疗健康(深圳)有限公司 一种医学图像处理方法、医学图像识别方法及装置
CN110555482A (zh) * 2019-09-06 2019-12-10 腾讯科技(深圳)有限公司 基于人工智能的低俗图片识别方法、装置及电子设备
CN110796115A (zh) * 2019-11-08 2020-02-14 厦门美图之家科技有限公司 图像检测方法、装置、电子设备及可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL231862A (en) * 2014-04-01 2015-04-30 Superfish Ltd Image representation using a neural network

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015130616A (ja) * 2014-01-08 2015-07-16 沖電気工業株式会社 画像符号化装置及びプログラム、画像復号装置及びプログラム、並びに、画像符号化システム
CN104484683A (zh) * 2014-12-31 2015-04-01 小米科技有限责任公司 黄色图片检测方法及装置
CN110491480A (zh) * 2019-05-22 2019-11-22 腾讯科技(深圳)有限公司 一种医疗图像处理方法、装置、电子医疗设备和存储介质
CN110504029A (zh) * 2019-08-29 2019-11-26 腾讯医疗健康(深圳)有限公司 一种医学图像处理方法、医学图像识别方法及装置
CN110555482A (zh) * 2019-09-06 2019-12-10 腾讯科技(深圳)有限公司 基于人工智能的低俗图片识别方法、装置及电子设备
CN110796115A (zh) * 2019-11-08 2020-02-14 厦门美图之家科技有限公司 图像检测方法、装置、电子设备及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Visual Attention Consistency Under Image Transforms for Multi-Label Image;Hao Guo等;《Bing》;全文 *
基于类别先验与深度神经网络特征的显著性检测;邓凝旖;《计算机工程》;第43卷(第6期);全文 *

Also Published As

Publication number Publication date
CN113435233A (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN107122806B (zh) 一种敏感图像识别方法及装置
WO2021057848A1 (zh) 网络的训练方法、图像处理方法、网络、终端设备及介质
CN109948497B (zh) 一种物体检测方法、装置及电子设备
CN107808358B (zh) 图像水印自动检测方法
CN108776819A (zh) 一种目标识别方法、移动终端及计算机可读存储介质
CN112434562B (zh) 口罩佩戴状态的检测方法、设备、电子装置和存储介质
CN110570390B (zh) 一种图像检测方法及装置
CN108765407A (zh) 一种人像图片质量判定方法及装置
CN110781770B (zh) 基于人脸识别的活体检测方法、装置及设备
CN110287862B (zh) 基于深度学习的防偷拍检测方法
CN112116556B (zh) 一种客流量统计方法、装置和计算机设备
CN112613471B (zh) 人脸活体检测方法、装置及计算机可读存储介质
CN109902759B (zh) 图片集描述方法及装置
CN113436175B (zh) 车图像分割质量的评估方法、装置、设备及存储介质
CN113435233B (zh) 色情图像识别方法、系统及电子设备
CN113642466B (zh) 活体检测和模型训练方法、设备及介质
CN111325107A (zh) 检测模型训练方法、装置、电子设备和可读存储介质
CN113947795A (zh) 口罩佩戴检测方法、装置、设备及存储介质
CN112949516A (zh) 踢被子行为的识别方法和装置
CN111079624B (zh) 一种样本信息采集的方法、装置、电子设备以及介质
CN112990009A (zh) 基于端到端的车道线检测方法、装置、设备及存储介质
CN110210425B (zh) 人脸识别方法、装置、电子设备及存储介质
CN111967383A (zh) 年龄估计方法、年龄估计模型的训练方法和装置
CN111461971B (zh) 图像处理方法、装置、设备及计算机可读存储介质
CN108171149B (zh) 一种人脸识别方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant