CN113962324A - 图片检测方法、装置、存储介质及电子设备 - Google Patents

图片检测方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN113962324A
CN113962324A CN202111300201.XA CN202111300201A CN113962324A CN 113962324 A CN113962324 A CN 113962324A CN 202111300201 A CN202111300201 A CN 202111300201A CN 113962324 A CN113962324 A CN 113962324A
Authority
CN
China
Prior art keywords
picture
clustering
neural network
type
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111300201.XA
Other languages
English (en)
Inventor
林嗣鹏
范渊
杨勃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DBAPPSecurity Co Ltd
Original Assignee
DBAPPSecurity Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DBAPPSecurity Co Ltd filed Critical DBAPPSecurity Co Ltd
Priority to CN202111300201.XA priority Critical patent/CN113962324A/zh
Publication of CN113962324A publication Critical patent/CN113962324A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种图片检测方法、装置、存储介质及电子设备,该方法包括:获取图片和所述图片的文本信息;通过聚类模型对所述文本信息进行聚类,根据聚类结果确定所述图片所属的聚类簇;根据所述聚类簇的安全性标签确定所述图片是否属于疑似预设类型的图片,所述安全性标签用于记录所述聚类簇是否为疑似预设类型图片的信息;若是,将所述图片输入至神经网络模型中,以通过所述神经网络模型对所述图片进行图片类型分类;根据所述神经网络模型输出的分类结果确定所述图片是否为预设类型的图片。本发明通过聚类方法进行图片的初步筛选,以节省计算资源,再利用神经模型进行精确判断,提高了检测准确率。

Description

图片检测方法、装置、存储介质及电子设备
技术领域
本申请涉及图片识别技术领域,特别是涉及一种图片检测方法、装置、存储介质及电子设备。
背景技术
互联网大数据时代,数据日益膨胀增长,面对海量的大数据资源,对网络数据的安全监控要求也越来越严格。其中非法图片检测是网络数据安全监控的主要内容。
传统的图片检测方案下,对图片数据归类时,主要依靠图片的文本信息,因为图片的文本近似描述了图片的含义,通过对图片的文本信息的分析,达到对图片的分类,以确定非法图片。比如预先设计非法图片描述黑名单词典,如果图片文本中包含黑名单中的单词,则表示命中,确定为非法图片。
目前这种基于文本对图片进行分类的方法,一方面很容易被非法人员利用,人为避免出现非安全性的词汇,导致无法准确的检测出非法图,另一方面,该检测方法依赖于文本分析,其准确率低,且容易出现误判的现象。
发明内容
在本实施例中提供了一种图片检测方法、装置、存储介质及电子设备,以解决相关技术中网站图片的安全性检测准确率低的问题。
一种图片检测方法,包括:
获取图片和所述图片的文本信息;
通过聚类模型对所述文本信息进行聚类,根据聚类结果确定所述图片所属的聚类簇;
根据所述聚类簇的安全性标签确定所述图片是否属于疑似预设类型的图片,所述安全性标签用于记录所述聚类簇是否为疑似预设类型图片的信息;
若是,将所述图片输入至神经网络模型中,以通过所述神经网络模型对所述图片进行图片类型分类;
根据所述神经网络模型输出的分类结果确定所述图片是否为预设类型的图片。
进一步的,上述图片检测方法,其中,所述神经网络模型采用VGG16神经网络模型,所述将所述图片输入至神经网络模型中,以通过所述神经网络模型对所述图片进行图片类型分类的步骤包括:
将所述图片输入至神经网络模型中,并通过神经网络模型计算得到多维的特征向量;
通过神经网络模型中的softmax函数将所述多维的特征向量回归归类到对应的图片类型下,并获取属于每个所述图片类型的预测概率;
将概率值最大的图片类型确定为所述图片的当前图片类型。
进一步的,上述图片检测方法,其中,所述图片类型包括安全类型和非安全类型;
所述根据所述神经网络模型输出的分类结果确定所述图片是否为预设类型的图片的步骤包括:
当所述图片类型为非安全类型时,确定所述图片为预设类型的图片。
进一步的,上述图片检测方法,还包括:
当所述图片为安全类型时,且对应的预测概率大于阈值时,确定所述图片为非预设类型的图片;
当所述图片为安全类型,且对应的预测概率小于或等于所述阈值时,确定所述图片为预设类型的图片。
进一步的,上述图片检测方法,其中,所述通过聚类模型对所述文本信息进行聚类的步骤之前还包括:
对所述文本信息进行分词处理,以得到对应的分词文本,并将所述分词文本转换为词频向量;
所述通过聚类模型对所述文本信息进行聚类的步骤包括:
将所述词频向量输入至聚类模型中,以使所述聚类模型根据所述词频向量与各个聚类簇的中心点的夹角余弦值对所述词频向量进行聚类。
进一步的,上述图片检测方法,其中,所述聚类模型为K-means模型,所述通过聚类模型对所述文本信息进行聚类的步骤之前还包括:
提取多个历史图片的历史文本信息,并对所述历史文本信息进行分词处理后,转换为向量,得到对应的历史词频向量;
随机抽取k个所述历史词频向量作为K-means模型的中心点,k为经过多次实验调优得到最优的聚类簇数量;
计算剩余历史词频向量分别与各个所述中心点的夹角余弦,所述剩余历史词频向量为除所述中心点外的历史词频向量;
将所述剩余历史词频向量与计算出夹角余弦值最大的所述中心点确定为相似词频向量,并分配到的同一聚类簇中;
对所述聚类簇进行均值计算,并根据计算后的值更新所述中心点,并记录更新后的所述聚类簇与原聚类簇之间中心点的位移距离;
判断所述位移距离是否小于阈值距离,若否,返回执行算剩余历史词频向量分别与各个所述中心点的夹角余弦的步骤,直到所述聚类簇的中心点的位移距离小于阈值距离或者迭代次数达到阈值次数时,确定所述K-means模型中k个聚类簇的中心点。
本发明还公开了一种图片检测装置,包括:
获取模块,用于获取图片和所述图片的文本信息;
聚类模块,用于通过聚类模型对所述文本信息进行聚类,根据聚类结果确定所述图片所属的聚类簇;
第一确定模块,用于根据所述聚类簇的安全性标签确定所述图片是否属于疑似预设类型的图片,所述安全性标签用于记录所述聚类簇是否为疑似预设类型图片的信息;
分类模块,用于将所述图片输入至神经网络模型中,以通过所述神经网络模型对所述图片进行图片类型分类;
第二确定模块,用于根据所述神经网络模型输出的分类结果确定所述图片是否为预设类型的图片。
进一步的,上述图片检测装置,其中,所述神经网络模型采用VGG16神经网络模型,所述分类模块用于:
将所述图片输入至神经网络模型中,并通过神经网络模型计算得到多维的特征向量;
通过神经网络模型中的softmax函数将所述多维的特征向量回归归类到对应的图片类型下,并获取属于每个所述图片类型的预测概率;
将概率值最大的图片类型确定为所述图片的当前图片类型。
进一步的,上述图片检测装置,其中,所述图片类型包括安全类型和非安全类型;所述第二确定模块用于:
当所述图片类型为非安全类型时,确定所述图片为预设类型的图片。
进一步的,上述图片检测装置,还包括:
第三确定模块,用于当所述图片为安全类型时,且对应的预测概率大于阈值时,确定所述图片为非预设类型的图片;
第三确定模块,用于当所述图片为安全类型,且对应的预测概率小于或等于所述阈值时,确定所述图片为预设类型的图片。
进一步的,上述图片检测装置,还包括模型训练模块,用于:
提取多个历史图片的历史文本信息,并对所述历史文本信息进行分词处理后,转换为向量,得到对应的历史词频向量;
随机抽取k个所述历史词频向量作为K-means模型的中心点,k为经过多次实验调优得到最优的聚类簇数量;
计算剩余历史词频向量分别与各个所述中心点的夹角余弦,所述剩余历史词频向量为除所述中心点外的历史词频向量;
将所述剩余历史词频向量与计算出夹角余弦值最大的所述中心点确定为相似词频向量,并分配到的同一聚类簇中;
对所述聚类簇进行均值计算,并根据计算后的值更新所述中心点,并记录更新后的所述聚类簇与原聚类簇之间中心点的位移距离;
判断所述位移距离是否小于阈值距离,若否,返回执行算剩余历史词频向量分别与各个所述中心点的夹角余弦的步骤,直到所述聚类簇的中心点的位移距离小于阈值距离或者迭代次数达到阈值次数时,确定所述K-means模型中k个聚类簇的中心点。
本发明还公开了一种计算机可读存储介质,其上存储有程序,所述程序被处理器执行时实现上述任一所述的方法。
本发明还公开了一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现上述任意一项所述的方法。
本发明中的图片检测方法采用K-Means聚类与神经网络模型相结合的手段,首先通过K-means方法图片的文本信息进行聚类预判断图片是否属于疑似预设类型,若是,则利用神经网络模型进行进一步检测,输出图片的分类结果,根据神经网络模型的分类结果确定该图片是否为非法。本发明中,通过K-means方法进行图片的初步筛选,以节省计算资源,再利用神经模型进行精确判断,提高了检测准确率。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明第一实施例中的图片检测方法的流程图;
图2为本发明第二实施例中的图片检测方法的流程图;
图3为本发明第三实施例中的图片检测装置的结构框图;
图4为本发明第四实施例中电子设备的结构示意图。
具体实施方式
为更清楚地理解本申请的目的、技术方案和优点,下面结合附图和实施例,对本申请进行了描述和说明。
除另作定义外,本申请所涉及的技术术语或者科学术语应具有本申请所属技术领域具备一般技能的人所理解的一般含义。在本申请中的“一”、“一个”、“一种”、“该”、“这些”等类似的词并不表示数量上的限制,它们可以是单数或者复数。在本申请中所涉及的术语“包括”、“包含”、“具有”及其任何变体,其目的是涵盖不排他的包含;例如,包含一系列步骤或模块(单元)的过程、方法和系统、产品或设备并未限定于列出的步骤或模块(单元),而可包括未列出的步骤或模块(单元),或者可包括这些过程、方法、产品或设备固有的其他步骤或模块(单元)。在本申请中所涉及的“连接”、“相连”、“耦接”等类似的词语并不限定于物理的或机械连接,而可以包括电气连接,无论是直接连接还是间接连接。在本申请中所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。通常情况下,字符“/”表示前后关联的对象是一种“或”的关系。在本申请中所涉及的术语“第一”、“第二”、“第三”等,只是对相似对象进行区分,并不代表针对对象的特定排序。
本实施例中的方法主要用于有效检测网站的图片资源,识别网站图片的类型,减少网站上的非法图片对网络用户的损害。
请参阅图1,为本发明第一实施例中的图片检测方法,包括步骤S11~S15。
步骤S11,获取图片和所述图片的文本信息。
本实施例中可通过网站爬虫技术收集网站上的图片和相应图片的文本信息,以对网站上的图片进行安全性检测。利用爬虫技术收集基于网站域名的数据集,并对每个域名地址深度递归挖掘网页链,获取所有网页链接中的图片和对应的文本信息。该文本信息中一般为对图片的内容的描述信息。
步骤S12,通过聚类模型对所述文本信息进行聚类,根据聚类结果确定所述图片所属的聚类簇。
步骤S13,根据所述聚类簇的安全性标签确定所述图片是否属于疑似预设类型的图片,若是,执行步骤S14。其中,所述安全性标签用于记录所述聚类簇是否为疑似预设类型图片的信息。
该聚类模型可以采用K-means模型,K-means模型为根据K-means对数据进行聚类分析的模型。K-means聚类的目标是将n个数据点按照相似度划分到k个聚类簇中。每一个聚类簇有一个中心点,一般中心点是对聚类簇中所有点的位置求平均值得到的点,每个数据点点属于距离它最近的中心点所代表的聚类簇。
本实施例中,该K-means模型为预先训练过的模型,其k个聚类簇设置有对应的安全性标签,该安全性标签用于标记图片的类型信息,可以以标签值例如为0,1,-1表示,其中-1表示该聚簇类中的图片均为预设类型的图片;0表示该聚簇类中的图片疑似预设类型,该聚簇类中非预设类型的图片和预设类型的图片类型共存;1表示该聚簇类中的图片均为非预设类型。可以理解的,该预设类型的图片为存在安全问题或限制性的图片。
K-means模型的输入为图片的文本信息,输出为该图片的文本信息所属的聚类簇的id。将图片的文本信息输入至K-means模型后,根据该文本信息确定各个中点最接近的中心簇,继而确定对应的聚类簇。当该K-means模型确定的该图片所属的聚类簇对应的安全性标签为0,表示,该图片属于疑似预设类型,则转到一下阶段由神经网络精确判断。
可以理解的,根据该安全性标签还可以识别出合法和非法的图片,对于识别到的合法的图片则不予处理,对于识别到的非法的图片,则可进一步进行预警。
步骤S14,将所述图片输入至神经网络模型中,以通过所述神经网络模型对所述图片进行图片类型分类。
步骤S15,根据所述神经网络模型输出的分类结果确定所述图片是否为预设类型的图片。
通过K-means算法目的是利用向量计算的低时间复杂度,对输入图片的文本信息预分类;筛选过滤明确不属于非法属性的图片集合。但是仅使用该方法筛选近似非法属性的图片有局限性,得到也仅是近似结果,最终判断是否安全,还需要交给更准确的神经网络模型。
神经网络模型的输入为聚类模型输出的疑似预设类型的图片,输出为该图片精确分类的图片类型。具体的,该神经网络模型输出的图片类型设置有两种,即安全类型和非安全类型。当该神经网络模型输出的图片类型为非安全类型时,则确定该图片为预设类型的图片。
本实施例提出的基于K-Means聚类与神经网络模型相结合的图片安全检测方法,通过K-means方法图片的文本信息进行聚类预判断当前图片是否为疑似预设类型的图片,若是,则利用神经网络模型进行进一步检测,输出图片的精确分类结果,如果神经网络模型输出结果也是非安全,则可以表示该图片为非法。通过K-means方法进行图片的初步筛选,以节省计算资源,再利用神经模型进行精确判断,提高检测准确率。
请参阅图2,为本发明第二实施例中的图片检测方法,包括步骤S21~S30。
步骤S21,获取图片和所述图片的文本信息。
步骤S22,对所述文本信息进行分词处理,以得到对应的分词文本,并将所述分词文本转换为词频向量。
步骤S23,将所述词频向量输入至K-means模型中,以使K-means模型根据所述词频向量与各个聚类簇的中心点的夹角余弦值对所述词频向量进行聚类,并根据聚类结果确定所述图片所属的聚类簇。
步骤S24,根据所述聚类簇的安全性标签确定所述图片是否属于疑似预设类型的图片,若是,执行步骤S25。其中,所述安全性标签用于记录所述聚类簇是否为疑似预设类型图片的信息。
具体实施时,将获取的图片的文本描述信息转化为数学表示的向量,例如可以选择word2vec模型将文本信息转换为词频向量。具体转化时,可使用中文分词工具如Jieba,将图片的文本信息进行分词处理,以得到对应的分词文本。可以理解的,该分词文本为去除了停用词,标点符号,特殊符合后的文本。举例来说,图片1的文本信息:这是我的家乡杭州;图片2的文本信息:中国杭州&西湖。分词后得到的分词文本分别为:
图片1:这是(1)我的(1)家乡(1)杭州(1)中国(0)西湖(0);
图片2:这是(0)我的(0)家乡(0)杭州(1)中国(1)西湖(1)。
将得到对应的分词文本转化为词频向量后,输入至K-means模型中进行聚类,以输出该图片所属的聚类簇。
可以理解的,该K-means模型为预先训练过的模型,该K-means模型训练过程包括如下步骤:
S011,提取多个历史图片的历史文本信息,并对所述历史文本信息进行分词处理后,转换为对应的历史词频向量;
S012,随机抽取k个所述历史词频向量作为K-means模型的中心点,k为经过多次实验调优得到最优的聚类簇数量;
S013,计算剩余历史词频向量分别与各个所述中心点的夹角余弦,所述剩余历史词频向量为除所述中心点外的历史词频向量;
S014,将所述剩余历史词频向量与计算出的夹角余弦值最大的所述中心点确定为相似词频向量,并分配到的同一聚类簇中;
S015,对所述聚类簇进行均值计算,并根据计算后的值更新所述中心点,并记录更新后的聚类簇与原聚类簇之间中心点的位移距离;
S016,判断所述位移距离是否小于阈值距离,若否,返回执行算剩余历史词频向量分别与各个所述中心点的夹角余弦的步骤,直到聚类簇的中心点的位移距离小于阈值距离或者迭代次数达到阈值次数时,确定所述K-means模型中k个聚类簇的中心点。
本实施例中,k为经过多次实验调优得到最优的聚类簇数量,其取值可以为16384。
该历史文本信息可以是网站上爬取的图片或用户在本地存储的图片的文本信息,将该历史图片的文本信息进行分词处理,并转换为对应的历史词频向量。得到了历史文本信息的历史词频向量后,以词频向量之间的余弦夹角衡量两个向量之间相似度的依据,用K-means聚类算法对相似文本聚合。其中,步骤S013中,夹角余弦公式如下:
Figure BDA0003338088010000081
其中,θ变量表示两个词频向量a和b之间的夹角。cosθ值越大表示两个向量之间的夹角越小,两个词频向量也越近似,xi,yi分别表示两个n维向量第i维度值。
根据剩余历史词频向量分别与各个中心点的夹角余弦判断当前历史文本向量与哪个中心点最接近。选择最大的cosθ值对应的中心点作为当前词频向量相似的向量,并将被其分到的同一聚类簇中。
同一个聚类簇集合,使用均值更新该聚类簇的中心点,并用变量distance记录新的聚类簇与旧的聚类簇之间的位移距离;重复步骤S013,直到聚类簇中心位移距离distance小于阈值距离(如0.1)或者迭代次数达到最大阈值次数(如500)。对确定好的k=16384个聚类中心标记安全性标签,标记可能出现预设类型的图片的文本信息的标签集合,从而完成K-means模型的训练。
将当前需要检测的图片对应的词频向量输入至该K-means模型后,输出该图片所属的聚类簇的id,该id为识别聚类簇的标识。根据K-means模型输出的聚类簇的id查找对应的安全性标签,根据安全性标签的内容确定该图片是否为疑似预设类型,若是进入下一步神经网络的检测。
可以理解的,在本发明的其中一种实施方式中,该安全性标签可以用于标识图片为非预设类型和疑似预设类型两种情况,对于非预设类型的图片则不予处理,对于疑似预设类型的图片进行下一步神经网络的检测。
在本发明的另一种实施方式中,该安全性标签可以标识出非预设类型、预设类型以及疑似预设类型三种情况,对于识别到的非预设类型的图片则不予处理,对于识别到的预设类型的图片,则可进一步进行预警,对于疑似预设类型的图片进行下一步神经网络的检测。
步骤S25,将所述图片输入至神经网络模型中,并通过神经网络模型计算得到多维的特征向量。
步骤S26,通过神经网络模型中的softmax函数将所述多维的特征向量回归归类到对应的图片类型下,并获取属于每个所述图片类型的预测概率,所述图片类型包括安全类型和非安全类型。
步骤S27,将概率值最大的图片类型确定为所述图片的当前图片类型。
步骤S28,当所述当前图片类型为非安全类型时,确定所述当前图片为预设类型的图片。
步骤S29,当所述当前图片为安全类型时,且对应的预测概率大于阈值时,确定所述当前图片为非预设类型的图片。
步骤S30,当所述图片为安全类型,且对应的预测概率小于或等于所述阈值时,确定所述图片为预设类型的图片。
该神经网络模型预先进行训练,以准确的对图片进行分类。神经网络训练时,对训练样本图片进行预处理图片,即随机移动旋转图片,增加训练图片样本多样性。具体的,在平衡计算复杂度和计算准确性后,该神经网络模型采用VGG16神经网络模型。
输入至神经网络模型中的图片的尺寸大小一致,可设置为尺寸224*224。按照VGG16神经网络模型结构,经过5次卷积层与池化层计算得到7*7*512反应图片特征的矩阵,在通过3次全连接层得到1000维的向量。通过softmax函数将1000维向量回归归类到各个图片类型下;同时得到属于每个图片类型的预测概率,将概率值最大的类别对应最后的分类结果。该图片类型分为安全类型和非安全类型。如果神经网络模型输出的图片类型为非安全类型时,则确定该图片非法,则可进一步进行预警。如果神经网络模型输出结果为非安全类型,且预测概率值大于阈值时,则认为图片合法。当图片为安全类型时,且对应的预测概率小于或等于所述阈值时,确定图片为预设类型的图片。该阈值为经验值,例如为0.23。
本实施例首先通过K-means方法对图片文本向量粗糙聚类,依据每个中心簇的安全性标签,将有风险的文本所代表的图片输入到VGG16神经网络模型中,其中VGG神经网络模型,通过多次卷积、池化、全连接计算,得到1000维向量图片特征参数,最后基于softmax回归模型分类得到最后图片分类结果。该算法通过第一步的K-means的粗糙聚类,筛选出没有安全风险的图片,提高了检测效率,并且通过VGG-16模型对图片的安全精确分类,提高云网站图片安全性检测准确率。
请参阅图3,为本发明第三实施中的图片检测装置,包括:
获取模块31,用于获取图片和所述图片的文本信息;
聚类模块32,用于通过聚类模型对所述文本信息进行聚类,根据聚类结果确定所述图片所属的聚类簇;
第一确定模块33,用于根据所述聚类簇的安全性标签确定所述图片是否属于疑似预设类型的图片,所述安全性标签用于记录所述聚类簇是否为疑似预设类型图片的信息;
分类模块34,用于将所述图片输入至神经网络模型中,以通过所述神经网络模型对所述图片进行图片类型分类;
第二确定模块35,用于根据所述神经网络模型输出的分类结果确定所述图片是否为预设类型的图片。
进一步的,上述图片检测装置,其中,所述神经网络模型采用VGG16神经网络模型,所述分类模块34用于:
将所述图片输入至神经网络模型中,并通过神经网络模型计算得到多维的特征向量;
通过神经网络模型中的softmax函数将所述多维的特征向量回归归类到对应的图片类型下,并获取属于每个所述图片类型的预测概率;
将概率值最大的图片类型确定为所述图片的当前图片类型。
进一步的,上述图片检测装置,其中,所述图片类型包括安全类型和非安全类型;所述第二确定模块35用于:
当所述图片类型为非安全类型时,确定所述图片为预设类型的图片。
进一步的,上述图片检测装置,还包括:
第三确定模块,用于当所述图片为安全类型时,且对应的预测概率大于阈值时,确定所述图片为非预设类型的图片;
第三确定模块,用于当所述图片为安全类型,且对应的预测概率小于或等于所述阈值时,确定所述图片为预设类型的图片。
进一步的,上述图片检测装置,还包括模型训练模块,用于:
提取多个历史图片的历史文本信息,并对所述历史文本信息进行分词处理后,转换为向量,得到对应的历史词频向量;
随机抽取k个所述历史词频向量作为K-means模型的中心点,k为经过多次实验调优得到最优的聚类簇数量;
计算剩余历史词频向量分别与各个所述中心点的夹角余弦,所述剩余历史词频向量为除所述中心点外的历史词频向量;
将所述剩余历史词频向量与计算出夹角余弦值最大的所述中心点确定为相似词频向量,并分配到的同一聚类簇中;
对所述聚类簇进行均值计算,并根据计算后的值更新所述中心点,并记录更新后的所述聚类簇与原聚类簇之间中心点的位移距离;
判断所述位移距离是否小于阈值距离,若否,返回执行算剩余历史词频向量分别与各个所述中心点的夹角余弦的步骤,直到所述聚类簇的中心点的位移距离小于阈值距离或者迭代次数达到阈值次数时,确定所述K-means模型中k个聚类簇的中心点。
本发明实施例所提供的图片检测装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
另外,结合图1至图2描述的本申请实施例中的图片检测方法主要由电子设备来实现。该电子设备例如为计算机、服务器等。
图4为根据本申请实施例的电子设备的硬件结构示意图。该电子设备可以包括处理器81以及存储有计算机程序指令的存储器82。
具体地,上述处理器81可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器82可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器82可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器82可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器82可在数据处理装置的内部或外部。在特定实施例中,存储器82是非易失性(Non-Volatile)存储器。在特定实施例中,存储器82包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(RandomAccess Memory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(Erasable ProgrammableRead-Only Memory,简称为EPROM)、电可擦除PROM(Electrically Erasable ProgrammableRead-Only Memory,简称为EEPROM)、电可改写ROM(Electrically Alterable Read-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-Access Memory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode Dynamic Random Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(Extended Date Out Dynamic RandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器82可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器81所执行的可能的计算机程序指令。
处理器81通过读取并执行存储器82中存储的计算机程序指令,以实现上述实施例中的图片检测方法。
在其中一些实施例中,该数据提供终端和平台还可包括通信接口83和总线80。其中,如图4所示,处理器81、存储器82、通信接口83通过总线80连接并完成相互间的通信。
通信接口83用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。通信接口83还可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线80包括硬件、软件或两者,将对应设备的部件彼此耦接在一起。总线80包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(ControlBus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线80可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(FrontSide Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Low Pin Count,简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA)总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线80可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
另外,结合上述实施例中的图片检测方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种图片检测方法。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种图片检测方法,其特征在于,包括:
获取图片和所述图片的文本信息;
通过聚类模型对所述文本信息进行聚类,根据聚类结果确定所述图片所属的聚类簇;
根据所述聚类簇的安全性标签确定所述图片是否属于疑似预设类型的图片,所述安全性标签用于记录所述聚类簇是否为疑似预设类型图片的信息;
若是,将所述图片输入至神经网络模型中,以通过所述神经网络模型对所述图片进行图片类型分类;
根据所述神经网络模型输出的分类结果确定所述图片是否为预设类型的图片。
2.如权利要求1所述的图片检测方法,其特征在于,所述神经网络模型采用VGG16神经网络模型,所述将所述图片输入至神经网络模型中,以通过所述神经网络模型对所述图片进行图片类型分类的步骤包括:
将所述图片输入至神经网络模型中,并通过神经网络模型计算得到多维的特征向量;
通过神经网络模型中的softmax函数将所述多维的特征向量回归归类到对应的图片类型下,并获取属于每个所述图片类型的预测概率;
将概率值最大的图片类型确定为所述图片的当前图片类型。
3.如权利要求2所述的图片检测方法,其特征在于,所述图片类型包括安全类型和非安全类型;
所述根据所述神经网络模型输出的分类结果确定所述图片是否为预设类型的图片的步骤包括:
当所述图片类型为非安全类型时,确定所述图片为预设类型的图片。
4.如权利要求3所述的图片检测方法,其特征在于,还包括:
当所述图片为安全类型时,且对应的预测概率大于阈值时,确定所述图片为非预设类型的图片;
当所述图片为安全类型,且对应的预测概率小于或等于所述阈值时,确定所述图片为预设类型的图片。
5.如权利要求1所述的图片检测方法,其特征在于,所述通过聚类模型对所述文本信息进行聚类的步骤之前还包括:
对所述文本信息进行分词处理,以得到对应的分词文本,并将所述分词文本转换为词频向量;
所述通过聚类模型对所述文本信息进行聚类的步骤包括:
将所述词频向量输入至聚类模型中,以使所述聚类模型根据所述词频向量与各个聚类簇的中心点的夹角余弦值对所述词频向量进行聚类。
6.如权利要求1所述的图片检测方法,其特征在于,所述聚类模型为K-means模型,所述通过聚类模型对所述文本信息进行聚类的步骤之前还包括:
提取多个历史图片的历史文本信息,并对所述历史文本信息进行分词处理后,转换为向量,得到对应的历史词频向量;
随机抽取k个所述历史词频向量作为K-means模型的中心点,k为经过多次实验调优得到最优的聚类簇数量;
计算剩余历史词频向量分别与各个所述中心点的夹角余弦,所述剩余历史词频向量为除所述中心点外的历史词频向量;
将所述剩余历史词频向量与计算出夹角余弦值最大的所述中心点确定为相似词频向量,并分配到的同一聚类簇中;
对所述聚类簇进行均值计算,并根据计算后的值更新所述中心点,并记录更新后的所述聚类簇与原聚类簇之间中心点的位移距离;
判断所述位移距离是否小于阈值距离,若否,返回执行算剩余历史词频向量分别与各个所述中心点的夹角余弦的步骤,直到所述聚类簇的中心点的位移距离小于阈值距离或者迭代次数达到阈值次数时,确定所述K-means模型中k个聚类簇的中心点。
7.一种图片检测装置,其特征在于,包括:
获取模块,用于获取图片和所述图片的文本信息;
聚类模块,用于通过聚类模型对所述文本信息进行聚类,根据聚类结果确定所述图片所属的聚类簇;
第一确定模块,用于根据所述聚类簇的安全性标签确定所述图片是否属于疑似预设类型的图片,所述安全性标签用于记录所述聚类簇是否为疑似预设类型图片的信息;
分类模块,用于将所述图片输入至神经网络模型中,以通过所述神经网络模型对所述图片进行图片类型分类;
第二确定模块,用于根据所述神经网络模型输出的分类结果确定所述图片是否为预设类型的图片。
8.如权利要求7所述的图片检测装置,其特征在于,所述神经网络模型采用VGG16神经网络模型,所述分类模块用于:
将所述图片输入至神经网络模型中,并通过神经网络模型计算得到多维的特征向量;
通过神经网络模型中的softmax函数将所述多维的特征向量回归归类到对应的图片类型下,并获取属于每个所述图片类型的预测概率;
将概率值最大的图片类型确定为所述图片的当前图片类型。
9.一种计算机可读存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6任一所述的方法。
10.一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6任意一项所述的方法。
CN202111300201.XA 2021-11-04 2021-11-04 图片检测方法、装置、存储介质及电子设备 Pending CN113962324A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111300201.XA CN113962324A (zh) 2021-11-04 2021-11-04 图片检测方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111300201.XA CN113962324A (zh) 2021-11-04 2021-11-04 图片检测方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN113962324A true CN113962324A (zh) 2022-01-21

Family

ID=79469258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111300201.XA Pending CN113962324A (zh) 2021-11-04 2021-11-04 图片检测方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN113962324A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114637263A (zh) * 2022-03-15 2022-06-17 中国石油大学(北京) 一种异常工况实时监测方法、装置、设备及存储介质
CN115422556A (zh) * 2022-11-07 2022-12-02 中国科学技术大学 漏洞利用概率预测方法、系统、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114637263A (zh) * 2022-03-15 2022-06-17 中国石油大学(北京) 一种异常工况实时监测方法、装置、设备及存储介质
CN114637263B (zh) * 2022-03-15 2024-01-12 中国石油大学(北京) 一种异常工况实时监测方法、装置、设备及存储介质
CN115422556A (zh) * 2022-11-07 2022-12-02 中国科学技术大学 漏洞利用概率预测方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN112347244B (zh) 基于混合特征分析的涉黄、涉赌网站检测方法
WO2019200782A1 (zh) 样本数据分类方法、模型训练方法、电子设备及存储介质
CN107622489B (zh) 一种图像篡改检测方法及装置
CN109902223B (zh) 一种基于多模态信息特征的不良内容过滤方法
CN105279277A (zh) 知识数据的处理方法和装置
CN111475603A (zh) 企业标识识别方法、装置、计算机设备及存储介质
CN113962324A (zh) 图片检测方法、装置、存储介质及电子设备
US9977950B2 (en) Decoy-based matching system for facial recognition
CN107292349A (zh) 基于百科知识语义增强的零样本分类方法、装置
CN108881947A (zh) 一种直播流的侵权检测方法及装置
US20190205589A1 (en) Latent fingerprint ridge flow map improvement
CN111353491A (zh) 一种文字方向确定方法、装置、设备及存储介质
CN113486664A (zh) 文本数据可视化分析方法、装置、设备及存储介质
CN115600194A (zh) 一种基于XGBoost和LGBM的入侵检测方法、存储介质及设备
CN111460803B (zh) 基于工业物联网设备Web管理页面的设备识别方法
CN113904861A (zh) 一种加密流量安全检测方法及装置
CN116841779A (zh) 异常日志检测方法、装置、电子设备和可读存储介质
CN113449816A (zh) 网址分类模型训练、网址分类方法、装置、设备及介质
CN112241470A (zh) 一种视频分类方法及系统
CN116109874A (zh) 一种检测方法、装置、电子设备和存储介质
CN113657378B (zh) 车辆跟踪方法、车辆跟踪系统和计算设备
CN111860661B (zh) 基于用户行为的数据分析方法、装置、电子设备及介质
CN114417860A (zh) 一种信息检测方法、装置及设备
CN113836297A (zh) 文本情感分析模型的训练方法及装置
CN114448664A (zh) 钓鱼网页的识别方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination