CN107403200A - 改进图像分割算法结合深度学习的多重不良图片分类方法 - Google Patents
改进图像分割算法结合深度学习的多重不良图片分类方法 Download PDFInfo
- Publication number
- CN107403200A CN107403200A CN201710680276.2A CN201710680276A CN107403200A CN 107403200 A CN107403200 A CN 107403200A CN 201710680276 A CN201710680276 A CN 201710680276A CN 107403200 A CN107403200 A CN 107403200A
- Authority
- CN
- China
- Prior art keywords
- image
- picture
- skin
- porny
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 60
- 238000013135 deep learning Methods 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000003709 image segmentation Methods 0.000 title claims abstract description 13
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 31
- 238000001514 detection method Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 14
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 230000000694 effects Effects 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 48
- 241000270295 Serpentes Species 0.000 claims description 45
- 239000013598 vector Substances 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 16
- 210000000481 breast Anatomy 0.000 claims description 12
- 230000013016 learning Effects 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 9
- 230000001235 sensitizing effect Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000006872 improvement Effects 0.000 claims description 6
- 238000007477 logistic regression Methods 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 238000011176 pooling Methods 0.000 claims description 5
- 230000007812 deficiency Effects 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 206010070834 Sensitisation Diseases 0.000 claims description 3
- 238000004380 ashing Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 230000008676 import Effects 0.000 claims description 3
- 230000001788 irregular Effects 0.000 claims description 3
- 230000008447 perception Effects 0.000 claims description 3
- 238000005498 polishing Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000008313 sensitization Effects 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000008901 benefit Effects 0.000 abstract description 2
- 238000012216 screening Methods 0.000 abstract 1
- 238000000638 solvent extraction Methods 0.000 abstract 1
- 238000010801 machine learning Methods 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000012152 algorithmic method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000000746 body region Anatomy 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
改进图像分割算法结合深度学习的多重不良图片分类方法涉及信息技术领域尤其是图像识别技术领域,其特征在于包含:肤色识别,肤色区域的主要成分分析,深度学习,基于卷积神经网络的色情图片识别四个主要步骤;首先通过基于YCbCr理论的肤色像素检测与皮肤区域划分算法筛除掉非色情图片,未确定类别的图片将在特征提取以后进入基于LeNet5的卷积神经网络模型进行判别。与传统的基于肤色和特征的识别相比,本发明能较好地排除非人体部位图片的噪声影响,不受光线遮挡和人体姿势的约束的优势,可以大幅度提高传统色情图片分类的准确率;与一般的基于卷积神经网络的深度学习比较,不需要海量的标注图片,其次深度残差网络的特点决定了模型能更好地分析出色情图片的特点,只需十小时左右的训练,就可达到90%以上的识别效果。
Description
技术领域
本发明涉及信息技术领域,尤其是图像处理的技术领域。
背景技术
目前多数不良图片识别方法依据它们的识别对象,大致可以将其分为三类:传统的基于肤色检测、特征部位检测和新兴的基于神经网络的色情图片识别。
传统的色情图片识别算法,计算肤色在图片中的占比,以此来计算裸露程度,受限制于其理论基础,图片环境和光线的多样化、人种的多样性等使得很难建立完善的肤色模型及提高检测的准确率,申请号200410042877.3 的“一种色情图像检测方法”,通过将人脸区域面积与肤色区域面积的比值作为色情图片的判决依据;申请号200510048577.0 的“基于内容的网络色情图像和不良图像检测系统”,采用肤色检测以及基于肤色检测的姿态检测来识别色情图片。以上系统无法实现对很多边缘图片,例如对如泳装照,婴儿照,沙漠地理照片,医学临床照片进行准确分析。
同样的,特征部位检测同样受限于人体姿态多样性、光线遮挡,角度多样化等因素使得检测的准确率一直无法提升,如专利申请号201010237982.8的“一种基于肤色和特征部位联合检测的色情图片识别方法”。
而基于深度学习的色情图片识别算法需要海量的图片样本,尤其是需要提供数目十分庞大的标注的色情和非色情样本,而且对未曾在训练集中出现的类型图片分辨能力较差,无法适应网络图片格式图片内容多样化和差异化的特点,容易将未出现在非色情样本中的误判为色情图片,极大降低了系统的泛化能力和鲁棒性。
本发明用到的现有技术名词解释:
深度学习
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。同机器学习方法一样,深度机器学习方法也有监督学习与无监督学习之分.不同的学习框架下建立的学习模型很是不同.例如,卷积神经网络(Convolutional neural networks,简称CNNs)就是一种深度的监督学习下的机器学习模型,而深度置信网(Deep Belief Nets,简称DBNs)就是一种无监督学习下的机器学习模型。
图像分割
图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。1998年以来,研究人员不断改进原有的图像分割方法并把其它学科的一些新理论和新方法用于图像分割,提出了不少新的分割方法。图像分割后提取出的目标可以用于图像语义识别,图像搜索等等领域。
Snake模型
Snake模型称为动态轮廓模型(Active Contour Model)是Kass与1987年提出的,它对于在噪声和对比度不敏感,能将目标从复杂背景中分割出来,并能有效的跟踪目标的形变和非刚体的复杂运动而被广泛用于图像分割和物体跟踪等图像处理领域。Snake模型主要原理是先提供待分割图像的一个初始轮廓的位置,并对其定义个能量函数,是轮廓沿能量降低的方向靠近。当能量函数达到最小的时候,提供的初始轮廓收敛到图形中目标的真实轮廓。 Snake模型能量函数是有内部能量函数和外部能量函数组成,内部能量控制轮廓的平滑性和连续性,外部能量由图像能量和约束能量组成,控制轮廓向着实际轮廓收敛,其中约束能量可根据具体的对象形态定义,使得snake具有很大的灵活性。 Snake模型发展10多年来,许多学者对于经典的snake模型做了改进,提出各种改进的snake模型,其中梯度矢量流(Gradient Vector Flow,GVF)模型扩大了经典snake的外力作用范围,加强了对目标凹轮廓边缘的吸引力,提高了传统的snake模型。
Snake算法
Snake算法需要给出初始的轮廓,然后进行迭代,使轮廓沿能量降低的方向靠近,最后得到一个优化的边界。能量函数包括内外力两方面,如边界曲率和梯度。由于用户无法估计迭代的最后结果,应用Snake 算法往往需要进行多次的交互工作。特别当目标比较复杂时,或与其它物体靠得较近时,初始的轮廓不易确定,而迭代的结果往往不能达到要求。主要公式为曲线能量Esnake=Vs+Vss+Eext;可以认为当Esnake的能量达到最小时snake曲线和物体的边缘一致。在图像边缘取一定个数的点来离散化snake线,那么这时就可以求这条snake线与原始图像间的曲线能量Esnake了;Vs对应的是一阶的平滑性,可转化为snake线中相邻像素之间的坐标差;差值越大能量越大平滑性也就越差;Vss对应的是二阶的刚性;可转化为snake线中某点和它相邻的线上点间的法线方向的增长度量;Eext是梯度场能量,是由原本的灰度图决定的,可转化为snake中某点在灰度图中的邻域梯度。求出了这三个;再以一定的方式进行循环逼近那个使Esnake最小的snake线就找到了轮廓。
OpenCV
OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上。它轻量级而且高效--由一系列 C 函数和少量 C++类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。OpenCV用C++语言编写,它的主要接口也是C++语言,但是依然保留了大量的C语言接口。该库也有大量的Python, Java and MATLAB/OCTAVE (版本2.5)的接口。这些语言的API接口函数可以通过在线文档获得。如今也提供对于C#,Ch, Ruby的支持。
ICA算法
ICA算法的研究可分为基于信息论准则的迭代估计方法和基于统计学的代数方法两大类,从原理上来说,它们都是利用了源信号的独立性和非高斯性。基于信息论的方法研究中,各国学者从最大熵、最小互信息、最大似然和负熵最大化等角度提出了一系列估计算法。如FastICA算法, Infomax算法,最大似然估计算法等。基于统计学的方法主要有二阶累积量、四阶累积量等高阶累积量方法。
SVM
SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题.简单地说,就是升维和线性化.升维,就是把样本向高维空间做映射,一般情况下这会增加计算的复杂性,甚至会引起"维数灾难",因而人们很少问津.但是作为分类、回归等问题来说,很可能在低维样本空间无法线性处理的样本集,在高维特征空间中却可以通过一个线性超平面实现线性划分(或回归).一般的升维都会带来计算的复杂化,SVM方法巧妙地解决了这个难题:应用核函数的展开定理,就不需要知道非线性映射的显式表达式;由于是在高维特征空间中建立线性学习机,所以与线性模型相比,不但几乎不增加计算的复杂性,而且在某种程度上避免了"维数灾难".这一切要归功于核函数的展开和计算理论。选择不同的核函数,可以生成不同的SVM,常用的核函数有以下4种:⑴线性核函数K(x,y)=x·y;⑵多项式核函数K(x,y)=[(x·y)+1]^d;
⑶径向基函数K(x,y)=exp(-|x-y|^2/d^2);⑷二层神经网络核函数K(x,y)=tanh(a(x·y)+b)。
卷积神经网络 Convolutional Neural Networks (LeNet)
卷积神经网络 Convolutional Neural Networks (LeNet)简称CNN,CNN(卷积神经网络)是传统神经网络的变种,CNN在传统神经网络的基础上,引入了卷积和pooling。与传统的神经网络相比,CNN更适合用于图像中,卷积和图像的局部特征相对应,pooling使得通过卷积获得的feature具有空间不变性。
现有技术中主要存在的问题有以下两点:
第一点,传统的色情图片识别算法,计算肤色在图片中的占比,以此来计算裸露程度,受限制于其理论基础,图片环境和光线的多样化、人种的多样性等使得很难建立完善的肤色模型及提高检测的准确率;
第二点,基于深度学习的色情图片识别算法需要海量的图片样本,无法适应网络图片格式图片内容多样化和差异化的特点,容易将未出现在非色情样本中的误判为色情图片,极大降低了系统的泛化能力和鲁棒性。
发明内容
基于现有技术的不足,本发明给出一种改进图像分割算法结合深度学习的多重不良图片分类方法,通过对图片的多重分析和过滤,可以极大地提高现有色情图片分类查准和查全率,降低图片因为光线和角度等各种原因的误判和遗漏率,同时可大幅度降低正负样本的需求数量,提高系统的可实现性。
改进图像分割算法结合深度学习的多重不良图片分类方法,其特征在于包含:肤色识别,肤色区域的主要成分分析,深度学习,基于卷积神经网络的色情图片识别四个主要步骤;
1).肤色识别
(1)将图像转化到YCbCr颜色空间:肤色检测主要是根据肤色在颜色空间上的分布特征来检测图像中的肤色区域,由于YCbCr空间可以将亮度和色度分离,而其中CgCr色度受亮度变化的影响较少,且是二维独立分布,因此肤色模型选用YCbCr色度空间来构建;
(2)使用表达式(Cb > 77 And Cb < 127) And (Cr > 133 And Cr < 173)遍历图片的每个像素,检测像素颜色是否为肤色,属于表达式范围内的确定为肤色;
(3) 将相邻的肤色像素归为一个皮肤区域,得到若干个皮肤区域,剔除像素数量极少的皮肤区域;
(4) 我们定义非色情图片的判定规则是:皮肤区域的个数小于 2个为非色情图片,皮肤区域的像素与图像所有像素的比值小于 15%为非色情图片,皮肤区域数量超过60个为非色情图片;
2).肤色区域的主要成分分析
(1)图像色彩降维处理即灰化处理:本方法所采用的测试图像均统一使用 JPG 格式图像,JPG 格式图像的颜色空间是RGB 颜色空间,即使用红、绿、蓝三原色组合来表示像素的颜色值,二进制值范围为0~255;由于彩色图像采用颜色空间,在对图像不做任何降维处理的情况下,算法系统所要处理的数据量将严重影响算法系统的处理效率,为提高处理效率对所有的图像库图片进行降维处理,具体的做法是调用 OpenCV 的库函数 cvCvtColor 来对图像进行处理,该函数的原型为:cvCvtColor(src, dest, CV_CONVERT_TYPE);该函数接受三个参数,第一个参数为需要处理的源图像数据结构指针,第二个参数为处理后的输出图像数据结构指针,第三个参数为转换类型,即从哪种颜色空间转换为哪种颜色空间,本系统将图像从 RGB 空间转换为 GRAY 灰度空间,经过转换后,输出图像将采用单一的灰度值来表示像素点颜色值;
(2)图像尺寸归一化:把输入图片大小归一化,需要对图片进行下一步预处理,将图像大小压缩至长度小于320,宽度小于240的比例。本模块的具体实现可以采用 OpenCV 的库函数结合自己设计的算法实现,具体的做法是首先判断图像相比标准规格(256X256)是偏长还是偏宽;如果是偏长的话,则把图像的宽缩放成 256,因为图片偏长,所以图像的长缩放后比256要长,截取中间的长度为256的部分;如果图像为偏宽,则把图像的长缩放成256,截取中间的宽度为256的部分;如果图片本身规格小于256X256,则放大至该规格;由于大部分的图片的关键信息都集中于图像的中部,图像尺寸归一化,既降低了图片的数据量,又能把图片进行规格的归一化,而且提取了图片的关键信息;
(3)图像向量化处理:向量化处理把图片的灰度值矩阵拉伸为一个256X256维即65536维的列向量,矩阵不足位置的补齐0;
(4)基于改进后的Snake的图像分割:一般应用Snake算法时候,默认能量函数曲线的初始化位置就是整副图像的边界,然后让曲线上的蛇点收缩到该物体图像的真正边缘,因此该曲线就需要某种作用力来推动其贴近物体真正边缘上;弹性能量的收缩力作用在沿弹性能量函数曲线的切线方向上,本质就是最小化周长来抵达物体的真正边缘,可是对于凹陷物体的收敛效果不是很好;本算法中检测的乳房正是不规则的凹陷物体,可见乳房凹陷的部位,是无法收敛到乳房的真正的边缘,因此根据情况改进Snake算法中的内部能量函数;使用在二维空间中封闭曲线所围面积为内部能量替换基本 Snake 算法中的内部能量,从而得到了一个改进的 Snake 模型即面积Snake 模型;
初始化蛇点,根据边缘的图像分割检测出来的边缘,平均间隔 10 个像素点,取做初始迭代的控制点;选择改进后的能量函数,最小化(4-17),进行迭代收缩,直到能量函数最小的时候停止收缩,分割出目标区域:
;
(5)特征提取:图像向量化处理后,样本库图片组成了特征处理模块的输入,即 ICA 算法的输入,一个待解混的图片灰度值向量矩阵;ICA 算法接受的输入是一组待解混的混合信号,输出是一组经过解混后的输入向量的独立成分矩阵,该组独立信号包含了组成不良图片的独立信号以及组成正常图片的独立成分;本算法系统采用的 ICA 算法是 ICA 算法中性能优越FAST ICA 算法,通过调用 OPENCV 的库函数实现;
(6)特征分类:通过特征提取出图像的特征向量将作为 SVM算法的输入数据,特征分类的作用就是要利用 SVM 算法,通过图像特征向量进行训练,得出不良图片和正常图片的分割面;通过特征提取得到的特征向量个数,即样本图片的个数为 M,则 SVM 输出的分割面形式为:Y = a1*x1+ a2*x2+……+am*xm,a1至am 为 SVM 输出的分割面系数;把图像的特征向量代入上式,根据判断得出的结果,与敏感图片训练集中分割出的向量比较,便可知道图像的特征向量聚集在哪个区间,是靠近不良图像的特征值区间还是靠近正常图片的特征值区间,从而可以判断图像包含的区域是正常区域还是敏感区域,敏感区域包括图片上乳房和生殖器的裸露;
3).深度学习
(1)使用Convolutional Neural Networks (LeNet),构建LeNet5:导入基本模块;定义LeNetConvPoolLayer即定义卷积加采样层;定义隐含层HiddenLayer;卷积神经网络CNN的基本结构就是输入层、卷积层conv、子采样层pooling、全连接层、输出层即分类器;使用两个卷积加采样层即LeNetConvPoolLayer;全连接层相当于MLP多层感知机中的隐含层HiddenLayer;输出层即分类器直接用LogisticRegression表示;
(2)定义分类器LogisticRegression,即Softmax回归 ,实现LeNet5 ,设置LeNet5包括两个卷积层,第一个卷积层有20个卷积核,第二个卷积层有50个卷积核;
(3)设置优化算法:优化算法采用批量随机梯度下降算法MSGD,先定义MSGD的一些要素,主要包括:代价函数,训练、验证、测试model、参数更新规则即梯度下降规则;
(4)训练模型和调整参数:程序中可以设置的参数包括:学习速率learning_rate、batch_size、n_epochs、nkerns、poolsize,根据具体训练的数据进行尝试调整和优化;
(5)提供一定量包含人体的非色情样本,如泳装、男性裸上身照片带入LeNet5让其深度学习,然后标注定量的未直接暴露敏感区域的色情样本包括各种体态的人体带入LeNet5让其深度学习,并根据系统结果调整参数,完成让LeNet5深度学习任务;
4).基于卷积神经网络的色情图片识别
使用经过深度学习的LeNet5对完成肤色区域的主要成分分析步骤的图片进行自动识别,将非色情图片与色情图片自动分类。
有益效果
与传统的基于肤色和特征的识别相比,基于改进的snake算法方法能较好地排除非人体部位图片的噪声影响,不受光线遮挡和人体姿势的约束的优势,可以大幅度提高传统色情图片分类的准确率;与一般的基于卷积神经网络的深度学习比较,不需要海量的标注图片,其次深度残差网络的特点决定了模型能更好地分析出色情图片的特点,只需十小时左右的训练,就可达到90%以上的识别效果。
附图说明
图1是本发明的总体流程图。
具体实施方式
参考图1改进图像分割算法结合深度学习的多重不良图片分类方法包含四个主要步骤:肤色识别S1,肤色区域的主要成分分析S2,深度学习S3,基于卷积神经网络的色情图片识别S4;
步骤S1肤色识别:
(1)将图像转化到YCbCr颜色空间:肤色检测主要是根据肤色在颜色空间上的分布特征来检测图像中的肤色区域,由于YCbCr空间可以将亮度和色度分离,而其中CgCr色度受亮度变化的影响较少,且是二维独立分布,因此肤色模型选用YCbCr色度空间来构建;
(2)使用表达式(Cb > 77 And Cb < 127) And (Cr > 133 And Cr < 173)遍历图片的每个像素,检测像素颜色是否为肤色,属于表达式范围内的确定为肤色;
(3) 将相邻的肤色像素归为一个皮肤区域,得到若干个皮肤区域,剔除像素数量极少的皮肤区域;
(4) 我们定义非色情图片的判定规则是:皮肤区域的个数小于 2个为非色情图片,皮肤区域的像素与图像所有像素的比值小于 15%为非色情图片,皮肤区域数量超过60个为非色情图片;
步骤S2肤色区域的主要成分分析:
(1)图像色彩降维处理即灰化处理:本方法所采用的测试图像均统一使用 JPG 格式图像,JPG 格式图像的颜色空间是RGB 颜色空间,即使用红、绿、蓝三原色组合来表示像素的颜色值,二进制值范围为0~255;由于彩色图像采用颜色空间,在对图像不做任何降维处理的情况下,算法系统所要处理的数据量将严重影响算法系统的处理效率,为提高处理效率对所有的图像库图片进行降维处理,具体的做法是调用 OpenCV 的库函数 cvCvtColor 来对图像进行处理,该函数的原型为:cvCvtColor(src, dest, CV_CONVERT_TYPE);该函数接受三个参数,第一个参数为需要处理的源图像数据结构指针,第二个参数为处理后的输出图像数据结构指针,第三个参数为转换类型,即从哪种颜色空间转换为哪种颜色空间,本系统将图像从 RGB 空间转换为 GRAY 灰度空间,经过转换后,输出图像将采用单一的灰度值来表示像素点颜色值;
(2)图像尺寸归一化:把输入图片大小归一化,需要对图片进行下一步预处理,将图像大小压缩至长度小于320,宽度小于240的比例。本模块的具体实现可以采用 OpenCV 的库函数结合自己设计的算法实现,具体的做法是首先判断图像相比标准规格(256X256)是偏长还是偏宽;如果是偏长的话,则把图像的宽缩放成 256,因为图片偏长,所以图像的长缩放后比256要长,截取中间的长度为256的部分;如果图像为偏宽,则把图像的长缩放成256,截取中间的宽度为256的部分;如果图片本身规格小于256X256,则放大至该规格;由于大部分的图片的关键信息都集中于图像的中部,图像尺寸归一化,既降低了图片的数据量,又能把图片进行规格的归一化,而且提取了图片的关键信息;
(3)图像向量化处理:向量化处理把图片的灰度值矩阵拉伸为一个256X256维即65536维的列向量,矩阵不足位置的补齐0;
(4)基于改进后的Snake的图像分割:一般应用Snake算法时候,默认能量函数曲线的初始化位置就是整副图像的边界,然后让曲线上的蛇点收缩到该物体图像的真正边缘,因此该曲线就需要某种作用力来推动其贴近物体真正边缘上;弹性能量的收缩力作用在沿弹性能量函数曲线的切线方向上,本质就是最小化周长来抵达物体的真正边缘,可是对于凹陷物体的收敛效果不是很好;本算法中检测的乳房正是不规则的凹陷物体,可见乳房凹陷的部位,是无法收敛到乳房的真正的边缘,因此根据情况改进Snake算法中的内部能量函数;使用在二维空间中封闭曲线所围面积为内部能量替换基本 Snake 算法中的内部能量,从而得到了一个改进的 Snake 模型即面积Snake 模型;
初始化蛇点,根据边缘的图像分割检测出来的边缘,平均间隔 10 个像素点,取做初始迭代的控制点;选择改进后的能量函数 ,最小化(4-17),进行迭代收缩,直到能量函数最小的时候停止收缩,分割出目标区域:
;
(5)特征提取:图像向量化处理后,样本库图片组成了特征处理模块的输入,即 ICA 算法的输入,一个待解混的图片灰度值向量矩阵;ICA 算法接受的输入是一组待解混的混合信号,输出是一组经过解混后的输入向量的独立成分矩阵,该组独立信号包含了组成不良图片的独立信号以及组成正常图片的独立成分;本算法系统采用的 ICA 算法是 ICA 算法中性能优越FAST ICA 算法,通过调用 OPENCV 的库函数实现;
(6)特征分类:通过特征提取出图像的特征向量将作为 SVM算法的输入数据,特征分类的作用就是要利用 SVM 算法,通过图像特征向量进行训练,得出不良图片和正常图片的分割面;通过特征提取得到的特征向量个数,即样本图片的个数为 M,则 SVM 输出的分割面形式为:Y = a1*x1+ a2*x2+……+am*xm,a1至am 为 SVM 输出的分割面系数;把图像的特征向量代入上式,根据判断得出的结果,与敏感图片训练集中分割出的向量比较,便可知道图像的特征向量聚集在哪个区间,是靠近不良图像的特征值区间还是靠近正常图片的特征值区间,从而可以判断图像包含的区域是正常区域还是敏感区域,敏感区域包括图片上乳房和生殖器的裸露;
步骤S3深度学习:
(1)使用Convolutional Neural Networks (LeNet),构建LeNet5:导入基本模块;定义LeNetConvPoolLayer即定义卷积加采样层;定义隐含层HiddenLayer;卷积神经网络CNN的基本结构就是输入层、卷积层conv、子采样层pooling、全连接层、输出层即分类器;使用两个卷积加采样层即LeNetConvPoolLayer;全连接层相当于MLP多层感知机中的隐含层HiddenLayer;输出层即分类器直接用LogisticRegression表示;
(2)定义分类器LogisticRegression,即Softmax回归 ,实现LeNet5 ,设置LeNet5包括两个卷积层,第一个卷积层有20个卷积核,第二个卷积层有50个卷积核;
(3)设置优化算法:优化算法采用批量随机梯度下降算法MSGD,先定义MSGD的一些要素,主要包括:代价函数,训练、验证、测试model、参数更新规则即梯度下降规则;
(4)训练模型和调整参数:程序中可以设置的参数包括:学习速率learning_rate、batch_size、n_epochs、nkerns、poolsize,根据具体训练的数据进行尝试调整和优化;
(5)提供一定量包含人体的非色情样本,如泳装、男性裸上身照片带入LeNet5让其深度学习,然后标注定量的未直接暴露敏感区域的色情样本包括各种体态的人体带入LeNet5让其深度学习,并根据系统结果调整参数,完成让LeNet5深度学习任务;
步骤S4基于卷积神经网络的色情图片识别:
使用经过深度学习的LeNet5对完成肤色区域的主要成分分析步骤的图片进行自动识别,将非色情图片与色情图片自动分类。
Claims (2)
1.改进图像分割算法结合深度学习的多重不良图片分类方法,其特征在于包含:肤色识别,肤色区域的主要成分分析,深度学习,基于卷积神经网络的色情图片识别四个主要步骤;
1).肤色识别
(1)将图像转化到YCbCr颜色空间:肤色检测主要是根据肤色在颜色空间上的分布特征来检测图像中的肤色区域,由于YCbCr空间可以将亮度和色度分离,而其中CgCr色度受亮度变化的影响较少,且是二维独立分布,因此肤色模型选用YCbCr色度空间来构建;
(2)使用表达式(Cb > 77 And Cb < 127) And (Cr > 133 And Cr < 173)遍历图片的每个像素,检测像素颜色是否为肤色,属于表达式范围内的确定为肤色;
(3) 将相邻的肤色像素归为一个皮肤区域,得到若干个皮肤区域,剔除像素数量极少的皮肤区域;
(4) 我们定义非色情图片的判定规则是:皮肤区域的个数小于 2个为非色情图片,皮肤区域的像素与图像所有像素的比值小于 15%为非色情图片,皮肤区域数量超过60个为非色情图片;
2).肤色区域的主要成分分析
(1)图像色彩降维处理即灰化处理:本方法所采用的测试图像均统一使用 JPG 格式图像,JPG 格式图像的颜色空间是RGB 颜色空间,即使用红、绿、蓝三原色组合来表示像素的颜色值,二进制值范围为0~255;由于彩色图像采用颜色空间,在对图像不做任何降维处理的情况下,算法系统所要处理的数据量将严重影响算法系统的处理效率,为提高处理效率对所有的图像库图片进行降维处理,具体的做法是调用 OpenCV 的库函数 cvCvtColor 来对图像进行处理,该函数的原型为:cvCvtColor(src, dest, CV_CONVERT_TYPE);该函数接受三个参数,第一个参数为需要处理的源图像数据结构指针,第二个参数为处理后的输出图像数据结构指针,第三个参数为转换类型,即从哪种颜色空间转换为哪种颜色空间,本系统将图像从 RGB 空间转换为 GRAY 灰度空间,经过转换后,输出图像将采用单一的灰度值来表示像素点颜色值;
(2)图像尺寸归一化:把输入图片大小归一化,需要对图片进行下一步预处理,将图像大小压缩至长度小于320,宽度小于240的比例。
2.本模块的具体实现可以采用 OpenCV 的库函数结合自己设计的算法实现,具体的做法是首先判断图像相比标准规格(256X256)是偏长还是偏宽;如果是偏长的话,则把图像的宽缩放成 256,因为图片偏长,所以图像的长缩放后比256要长,截取中间的长度为256的部分;如果图像为偏宽,则把图像的长缩放成 256,截取中间的宽度为256的部分;如果图片本身规格小于256X256,则放大至该规格;由于大部分的图片的关键信息都集中于图像的中部,图像尺寸归一化,既降低了图片的数据量,又能把图片进行规格的归一化,而且提取了图片的关键信息;
(3)图像向量化处理:向量化处理把图片的灰度值矩阵拉伸为一个256X256维即65536维的列向量,矩阵不足位置的补齐0;
(4)基于改进后的Snake的图像分割:一般应用Snake算法时候,默认能量函数曲线的初始化位置就是整副图像的边界,然后让曲线上的蛇点收缩到该物体图像的真正边缘,因此该曲线就需要某种作用力来推动其贴近物体真正边缘上;弹性能量的收缩力作用在沿弹性能量函数曲线的切线方向上,本质就是最小化周长来抵达物体的真正边缘,可是对于凹陷物体的收敛效果不是很好;本算法中检测的乳房正是不规则的凹陷物体,可见乳房凹陷的部位,是无法收敛到乳房的真正的边缘,因此根据情况改进Snake算法中的内部能量函数;使用在二维空间中封闭曲线所围面积为内部能量替换基本 Snake 算法中的内部能量,从而得到了一个改进的 Snake 模型即面积Snake 模型;
初始化蛇点,根据边缘的图像分割检测出来的边缘,平均间隔 10 个像素点,取做初始迭代的控制点;选择改进后的能量函数,最小化(4-17),进行迭代收缩,直到能量函数最小的时候停止收缩,分割出目标区域:
;
(5)特征提取:图像向量化处理后,样本库图片组成了特征处理模块的输入,即 ICA 算法的输入,一个待解混的图片灰度值向量矩阵;ICA 算法接受的输入是一组待解混的混合信号,输出是一组经过解混后的输入向量的独立成分矩阵,该组独立信号包含了组成不良图片的独立信号以及组成正常图片的独立成分;本算法系统采用的 ICA 算法是 ICA 算法中性能优越FAST ICA 算法,通过调用 OPENCV 的库函数实现;
(6)特征分类:通过特征提取出图像的特征向量将作为 SVM算法的输入数据,特征分类的作用就是要利用 SVM 算法,通过图像特征向量进行训练,得出不良图片和正常图片的分割面;通过特征提取得到的特征向量个数,即样本图片的个数为 M,则 SVM 输出的分割面形式为:Y = a1*x1+ a2*x2+……+am*xm,a1至am 为 SVM 输出的分割面系数;把图像的特征向量代入上式,根据判断得出的结果,与敏感图片训练集中分割出的向量比较,便可知道图像的特征向量聚集在哪个区间,是靠近不良图像的特征值区间还是靠近正常图片的特征值区间,从而可以判断图像包含的区域是正常区域还是敏感区域,敏感区域包括图片上乳房和生殖器的裸露;
3).深度学习
(1)使用Convolutional Neural Networks (LeNet),构建LeNet5:导入基本模块;定义LeNetConvPoolLayer即定义卷积加采样层;定义隐含层HiddenLayer;卷积神经网络CNN的基本结构就是输入层、卷积层conv、子采样层pooling、全连接层、输出层即分类器;使用两个卷积加采样层即LeNetConvPoolLayer;全连接层相当于MLP多层感知机中的隐含层HiddenLayer;输出层即分类器直接用LogisticRegression表示;
(2)定义分类器LogisticRegression,即Softmax回归 ,实现LeNet5 ,设置LeNet5包括两个卷积层,第一个卷积层有20个卷积核,第二个卷积层有50个卷积核;
(3)设置优化算法:优化算法采用批量随机梯度下降算法MSGD,先定义MSGD的一些要素,主要包括:代价函数,训练、验证、测试model、参数更新规则即梯度下降规则;
(4)训练模型和调整参数:程序中可以设置的参数包括:学习速率learning_rate、batch_size、n_epochs、nkerns、poolsize,根据具体训练的数据进行尝试调整和优化;
(5)提供一定量包含人体的非色情样本,如泳装、男性裸上身照片带入LeNet5让其深度学习,然后标注定量的未直接暴露敏感区域的色情样本包括各种体态的人体带入LeNet5让其深度学习,并根据系统结果调整参数,完成让LeNet5深度学习任务;
4).基于卷积神经网络的色情图片识别
使用经过深度学习的LeNet5对完成肤色区域的主要成分分析步骤的图片进行自动识别,将非色情图片与色情图片自动分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710680276.2A CN107403200A (zh) | 2017-08-10 | 2017-08-10 | 改进图像分割算法结合深度学习的多重不良图片分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710680276.2A CN107403200A (zh) | 2017-08-10 | 2017-08-10 | 改进图像分割算法结合深度学习的多重不良图片分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107403200A true CN107403200A (zh) | 2017-11-28 |
Family
ID=60397800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710680276.2A Pending CN107403200A (zh) | 2017-08-10 | 2017-08-10 | 改进图像分割算法结合深度学习的多重不良图片分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107403200A (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108053402A (zh) * | 2018-01-04 | 2018-05-18 | 深圳信息职业技术学院 | 一种缺陷图像分割方法 |
CN109359551A (zh) * | 2018-09-21 | 2019-02-19 | 深圳市璇玑实验室有限公司 | 一种基于机器学习的敏感图像识别方法与系统 |
CN109376778A (zh) * | 2018-10-09 | 2019-02-22 | 宁波大学 | 一种基于特征变量加权的故障分类诊断方法 |
CN109583331A (zh) * | 2018-11-15 | 2019-04-05 | 复旦大学 | 基于深度学习的人手腕脉口位置精准定位方法 |
CN109670423A (zh) * | 2018-12-05 | 2019-04-23 | 依通(北京)科技有限公司 | 一种基于深度学习的图像识别系统、方法及介质 |
CN109727210A (zh) * | 2018-12-20 | 2019-05-07 | 中国地质大学(武汉) | 基于近似l0改造的深度信念网络的遥感图像解混方法及系统 |
CN109741231A (zh) * | 2018-12-27 | 2019-05-10 | 浙江大学 | 一种基于摩尔纹的摄屏图片溯源方法 |
CN109949323A (zh) * | 2019-03-19 | 2019-06-28 | 广东省农业科学院农业生物基因研究中心 | 一种基于深度学习卷积神经网络的作物种子净度判断方法 |
CN110097117A (zh) * | 2019-04-30 | 2019-08-06 | 哈尔滨工程大学 | 基于线性判别分析与多元自适应样条的数据分类方法 |
CN110275958A (zh) * | 2019-06-26 | 2019-09-24 | 北京市博汇科技股份有限公司 | 网站信息识别方法、装置和电子设备 |
CN110334228A (zh) * | 2019-07-09 | 2019-10-15 | 广西壮族自治区基础地理信息中心 | 一种基于深度学习的互联网问题地图筛查方法 |
CN110689057A (zh) * | 2019-09-11 | 2020-01-14 | 哈尔滨工程大学 | 基于图像分割的降低神经网络训练样本量的方法 |
CN110807139A (zh) * | 2019-10-23 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 图片识别方法、装置、计算机可读存储介质和计算机设备 |
CN111027603A (zh) * | 2019-11-27 | 2020-04-17 | 湖北工业大学 | 一种改进gan模型的图像生成方法 |
WO2019229524A3 (zh) * | 2018-05-31 | 2020-05-22 | 赛灵思公司 | 神经网络计算方法和系统及相应的双神经网络实现 |
CN111639659A (zh) * | 2019-03-01 | 2020-09-08 | 中国科学院声学研究所 | 一种水下沉底小目标融合分类方法 |
CN112508013A (zh) * | 2020-12-02 | 2021-03-16 | 哈尔滨市科佳通用机电股份有限公司 | 一种锁扣丢失故障检测方法、系统及装置 |
CN112633313A (zh) * | 2020-10-13 | 2021-04-09 | 北京匠数科技有限公司 | 一种网络终端的不良信息识别方法及局域网终端设备 |
CN113129306A (zh) * | 2021-05-10 | 2021-07-16 | 电子科技大学成都学院 | 一种基于深度学习的遮挡物体分割求解方法 |
CN113984077A (zh) * | 2021-10-26 | 2022-01-28 | 武汉大学 | 一种电力巡检导航路径的获取方法和系统 |
CN114155555A (zh) * | 2021-12-02 | 2022-03-08 | 北京中科智易科技有限公司 | 人体行为人工智能判断系统和方法 |
CN116452413A (zh) * | 2023-04-24 | 2023-07-18 | 广州番禺职业技术学院 | 一种基于视频人脸自动匹配粤剧化妆的系统及其方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101923652A (zh) * | 2010-07-23 | 2010-12-22 | 华中师范大学 | 一种基于肤色和特征部位联合检测的色情图片识别方法 |
KR20110080224A (ko) * | 2010-01-05 | 2011-07-13 | (주)필링크 | 유해 동영상 검출장치 및 그 방법 |
CN102184419A (zh) * | 2011-04-13 | 2011-09-14 | 深圳市迈科龙影像技术有限公司 | 基于敏感部位检测的色情图像识别方法 |
CN102842032A (zh) * | 2012-07-18 | 2012-12-26 | 郑州金惠计算机系统工程有限公司 | 基于多模式组合策略的移动互联网色情图像识别方法 |
CN103093180A (zh) * | 2011-10-28 | 2013-05-08 | 阿里巴巴集团控股有限公司 | 一种色情图像侦测的方法和系统 |
CN103366160A (zh) * | 2013-06-28 | 2013-10-23 | 西安交通大学 | 融合肤色、人脸和敏感部位检测的不良图像判别方法 |
CN104992177A (zh) * | 2015-06-12 | 2015-10-21 | 安徽大学 | 基于深层卷积神经网络的网络色情图像检测方法 |
-
2017
- 2017-08-10 CN CN201710680276.2A patent/CN107403200A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110080224A (ko) * | 2010-01-05 | 2011-07-13 | (주)필링크 | 유해 동영상 검출장치 및 그 방법 |
CN101923652A (zh) * | 2010-07-23 | 2010-12-22 | 华中师范大学 | 一种基于肤色和特征部位联合检测的色情图片识别方法 |
CN102184419A (zh) * | 2011-04-13 | 2011-09-14 | 深圳市迈科龙影像技术有限公司 | 基于敏感部位检测的色情图像识别方法 |
CN103093180A (zh) * | 2011-10-28 | 2013-05-08 | 阿里巴巴集团控股有限公司 | 一种色情图像侦测的方法和系统 |
CN102842032A (zh) * | 2012-07-18 | 2012-12-26 | 郑州金惠计算机系统工程有限公司 | 基于多模式组合策略的移动互联网色情图像识别方法 |
CN103366160A (zh) * | 2013-06-28 | 2013-10-23 | 西安交通大学 | 融合肤色、人脸和敏感部位检测的不良图像判别方法 |
CN104992177A (zh) * | 2015-06-12 | 2015-10-21 | 安徽大学 | 基于深层卷积神经网络的网络色情图像检测方法 |
Non-Patent Citations (6)
Title |
---|
JIANG Z ET AL.: "Skin Detection on Images with Color Deviation", 《CONGRESS ON SERVICES》 * |
丁宣浩: "基于内容的敏感图像特殊部位识别算法研究", 《万方数据库》 * |
周达和: "独立成分分析算法与支持向量机在不良图片识别中的应用", 《中国优秀硕士学位论文全文数据库_信息科技辑I辑》 * |
实验楼: "Python3 色情图片识别", 《微信公众号》 * |
王嘉鑫等: "基于卷积神经网络的人脸识别", 《电脑知识与技术》 * |
陈超: "基于新特征的AdaBoost算法的色情图片检测", 《中国优秀硕士学位论文全文数据库_信息科技辑I辑》 * |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108053402B (zh) * | 2018-01-04 | 2021-08-10 | 深圳信息职业技术学院 | 一种缺陷图像分割方法 |
CN108053402A (zh) * | 2018-01-04 | 2018-05-18 | 深圳信息职业技术学院 | 一种缺陷图像分割方法 |
WO2019229524A3 (zh) * | 2018-05-31 | 2020-05-22 | 赛灵思公司 | 神经网络计算方法和系统及相应的双神经网络实现 |
CN109359551A (zh) * | 2018-09-21 | 2019-02-19 | 深圳市璇玑实验室有限公司 | 一种基于机器学习的敏感图像识别方法与系统 |
CN109376778A (zh) * | 2018-10-09 | 2019-02-22 | 宁波大学 | 一种基于特征变量加权的故障分类诊断方法 |
CN109376778B (zh) * | 2018-10-09 | 2021-06-15 | 宁波大学 | 一种基于特征变量加权的故障分类诊断方法 |
CN109583331A (zh) * | 2018-11-15 | 2019-04-05 | 复旦大学 | 基于深度学习的人手腕脉口位置精准定位方法 |
CN109583331B (zh) * | 2018-11-15 | 2023-05-02 | 复旦大学 | 基于深度学习的人手腕脉口位置精准定位方法 |
CN109670423A (zh) * | 2018-12-05 | 2019-04-23 | 依通(北京)科技有限公司 | 一种基于深度学习的图像识别系统、方法及介质 |
CN109727210A (zh) * | 2018-12-20 | 2019-05-07 | 中国地质大学(武汉) | 基于近似l0改造的深度信念网络的遥感图像解混方法及系统 |
CN109727210B (zh) * | 2018-12-20 | 2021-03-30 | 中国地质大学(武汉) | 基于近似l0改造的深度信念网络的遥感图像解混方法及系统 |
CN109741231A (zh) * | 2018-12-27 | 2019-05-10 | 浙江大学 | 一种基于摩尔纹的摄屏图片溯源方法 |
CN111639659B (zh) * | 2019-03-01 | 2023-11-14 | 中国科学院声学研究所 | 一种水下沉底小目标融合分类方法 |
CN111639659A (zh) * | 2019-03-01 | 2020-09-08 | 中国科学院声学研究所 | 一种水下沉底小目标融合分类方法 |
CN109949323B (zh) * | 2019-03-19 | 2022-12-20 | 广东省农业科学院农业生物基因研究中心 | 一种基于深度学习卷积神经网络的作物种子净度判断方法 |
CN109949323A (zh) * | 2019-03-19 | 2019-06-28 | 广东省农业科学院农业生物基因研究中心 | 一种基于深度学习卷积神经网络的作物种子净度判断方法 |
CN110097117B (zh) * | 2019-04-30 | 2023-12-12 | 哈尔滨工程大学 | 基于线性判别分析与多元自适应样条的数据分类方法 |
CN110097117A (zh) * | 2019-04-30 | 2019-08-06 | 哈尔滨工程大学 | 基于线性判别分析与多元自适应样条的数据分类方法 |
CN110275958B (zh) * | 2019-06-26 | 2021-07-27 | 北京市博汇科技股份有限公司 | 网站信息识别方法、装置和电子设备 |
CN110275958A (zh) * | 2019-06-26 | 2019-09-24 | 北京市博汇科技股份有限公司 | 网站信息识别方法、装置和电子设备 |
CN110334228A (zh) * | 2019-07-09 | 2019-10-15 | 广西壮族自治区基础地理信息中心 | 一种基于深度学习的互联网问题地图筛查方法 |
CN110689057A (zh) * | 2019-09-11 | 2020-01-14 | 哈尔滨工程大学 | 基于图像分割的降低神经网络训练样本量的方法 |
CN110689057B (zh) * | 2019-09-11 | 2022-07-15 | 哈尔滨工程大学 | 基于图像分割的降低神经网络训练样本量的方法 |
CN110807139A (zh) * | 2019-10-23 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 图片识别方法、装置、计算机可读存储介质和计算机设备 |
CN110807139B (zh) * | 2019-10-23 | 2023-09-01 | 腾讯科技(深圳)有限公司 | 图片识别方法、装置、计算机可读存储介质和计算机设备 |
CN111027603B (zh) * | 2019-11-27 | 2022-07-05 | 湖北工业大学 | 一种改进gan模型的图像生成方法 |
CN111027603A (zh) * | 2019-11-27 | 2020-04-17 | 湖北工业大学 | 一种改进gan模型的图像生成方法 |
CN112633313B (zh) * | 2020-10-13 | 2021-12-03 | 北京匠数科技有限公司 | 一种网络终端的不良信息识别方法及局域网终端设备 |
CN112633313A (zh) * | 2020-10-13 | 2021-04-09 | 北京匠数科技有限公司 | 一种网络终端的不良信息识别方法及局域网终端设备 |
CN112508013A (zh) * | 2020-12-02 | 2021-03-16 | 哈尔滨市科佳通用机电股份有限公司 | 一种锁扣丢失故障检测方法、系统及装置 |
CN113129306B (zh) * | 2021-05-10 | 2022-12-02 | 电子科技大学成都学院 | 一种基于深度学习的遮挡物体分割求解方法 |
CN113129306A (zh) * | 2021-05-10 | 2021-07-16 | 电子科技大学成都学院 | 一种基于深度学习的遮挡物体分割求解方法 |
CN113984077A (zh) * | 2021-10-26 | 2022-01-28 | 武汉大学 | 一种电力巡检导航路径的获取方法和系统 |
CN114155555B (zh) * | 2021-12-02 | 2022-06-10 | 北京中科智易科技有限公司 | 人体行为人工智能判断系统和方法 |
CN114155555A (zh) * | 2021-12-02 | 2022-03-08 | 北京中科智易科技有限公司 | 人体行为人工智能判断系统和方法 |
CN116452413A (zh) * | 2023-04-24 | 2023-07-18 | 广州番禺职业技术学院 | 一种基于视频人脸自动匹配粤剧化妆的系统及其方法 |
CN116452413B (zh) * | 2023-04-24 | 2024-03-29 | 广州番禺职业技术学院 | 一种基于视频人脸自动匹配粤剧化妆的系统及其方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107403200A (zh) | 改进图像分割算法结合深度学习的多重不良图片分类方法 | |
CN106682598B (zh) | 一种基于级联回归的多姿态的人脸特征点检测方法 | |
CN108491835B (zh) | 面向面部表情识别的双通道卷积神经网络 | |
CN110443143B (zh) | 多分支卷积神经网络融合的遥感图像场景分类方法 | |
CN108549891B (zh) | 基于背景与目标先验的多尺度扩散显著目标检测方法 | |
WO2021244079A1 (zh) | 智能家居环境中图像目标检测方法 | |
CN108052896B (zh) | 基于卷积神经网络与支持向量机的人体行为识别方法 | |
Fan et al. | Combining local appearance and holistic view: Dual-source deep neural networks for human pose estimation | |
CN112633350B (zh) | 一种基于图卷积的多尺度点云分类实现方法 | |
Ali et al. | Boosted NNE collections for multicultural facial expression recognition | |
CN112464865A (zh) | 一种基于像素和几何混合特征的人脸表情识别方法 | |
Lei et al. | A skin segmentation algorithm based on stacked autoencoders | |
CN108960404B (zh) | 一种基于图像的人群计数方法及设备 | |
CN111191583A (zh) | 基于卷积神经网络的空间目标识别系统及方法 | |
Li et al. | A complex junction recognition method based on GoogLeNet model | |
Zheng et al. | Static Hand Gesture Recognition Based on Gaussian Mixture Model and Partial Differential Equation. | |
CN112364974B (zh) | 一种基于激活函数改进的YOLOv3算法 | |
CN107301643A (zh) | 基于鲁棒稀疏表示与拉普拉斯正则项的显著目标检测方法 | |
CN113011243A (zh) | 基于胶囊网络的面部表情分析方法 | |
CN111652836A (zh) | 一种基于聚类算法和神经网络的多尺度目标检测方法 | |
CN111967537A (zh) | 一种基于双路胶囊网络的sar目标分类方法 | |
Zhang et al. | Fine segmentation on faces with masks based on a multistep iterative segmentation algorithm | |
Yang et al. | An improved algorithm for the detection of fastening targets based on machine vision | |
CN109902692A (zh) | 一种基于局部区域深度特征编码的图像分类方法 | |
Xu et al. | Multi-task learning for object keypoints detection and classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20171128 |
|
WD01 | Invention patent application deemed withdrawn after publication |