CN105512681A - 一种目标类别图片的获取方法及系统 - Google Patents

一种目标类别图片的获取方法及系统 Download PDF

Info

Publication number
CN105512681A
CN105512681A CN201510889219.6A CN201510889219A CN105512681A CN 105512681 A CN105512681 A CN 105512681A CN 201510889219 A CN201510889219 A CN 201510889219A CN 105512681 A CN105512681 A CN 105512681A
Authority
CN
China
Prior art keywords
picture
feature
pictures
sorted
obtains
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510889219.6A
Other languages
English (en)
Inventor
刘琼
李宗贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Information Science and Technology University
Original Assignee
Beijing Information Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Information Science and Technology University filed Critical Beijing Information Science and Technology University
Priority to CN201510889219.6A priority Critical patent/CN105512681A/zh
Publication of CN105512681A publication Critical patent/CN105512681A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0463Neocognitrons

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种目标类别图片的获取方法及系统,该方法包括:获取待分类样本图片集,并获取目标类别;根据所述目标类别从样本图片库中查找属于所述目标类别的样本图片;对查找到的样本图片进行稀疏自编码特征提取,以获得所述样本图片的特征基集;将特征基集应用到神经网络中,以获取所述待分类图片集中属于所述目标类别的图片。本发明通过提取属于目标类别的样本图片的特征基集,作为先验知识,并将特征基集作为滤波器,对图片进行滤波操作,获取待分类图片集中属于所述目标类别的图片,与现有技术中使用随机初始化或者采用Gabor滤波器作为神经网络滤波器的方法相比,具有准确率高、时耗低的优点。

Description

一种目标类别图片的获取方法及系统
技术领域
本发明涉及模式识别技术领域,具体涉及一种目标类别图片的获取方法及系统。
背景技术
近年来,以卷积神经网络为代表的深度学习技术呈现出井喷式发展。在模式识别领域,卷积神经网络在物体分类研究等问题上得到了很广泛的应用,较之前模板匹配、图像纹理分析、浅层神经网络等物体识别的方法无论在识别率还是识别速度上都得到了较大的提升。
传统大规模卷积神经网络例如LeNet-5模型通常采用随机初始化方法或者采用Gabor滤波器作为卷积核,导致高准确率往往以高时耗为代价,并经常会出现特征提取过多导致过拟合现象的缺点。
发明内容
针对现有技术中的缺陷,本发明提出了一种目标类别图片的获取方法及系统,该方法以目标类别所属的样本图片的特征基集作为卷积核对待分类图片集进行分类,具有准确率高、耗时低的优点。
本发明提出了一种目标类别图片的获取分类方法,包括:
获取待分类图片集,并获取目标类别;
根据所述目标类别从样本图片库中查找属于所述目标类别的样本图片;
对样本图片进行稀疏自编码特征提取,以获得所述样本图片的特征基集;
将所述特征基集作为神经网络的滤波器对图片进行滤波处理,以获取所述待分类图片集中属于所述目标类别的图片。
可选的,所述对样本图片进行特征提取,包括:
对样本图片进行采样,获取图片碎片,并根据所述图片碎片建立特征样本集;
采用稀疏自编码对特征样本集进行特征提取。
可选的,还包括:
采用BP神经网络中的反向传播算法对所述特征基集进行优化。
可选的,所述根据所述特征基集,获取所述待分类图片集中属于所述目标类别的图片,包括:
采用以所述特征基集为卷积核的卷积神经网络对所述待分类图片集中的每个待分类图片进行卷积滤波,获取每个待分类图片的高维卷积特征;
对所述高维卷积特征进行池化处理,并根据池化处理后的卷积特征,获取所述待分类图片集中属于所述目标类别的图片。
可选的,所述根据池化处理后的卷积特征,获取所述待分类图片集中属于所述目标类别的图片,包括:
采用softamx分类算法,对所述池化处理后的卷积特征进行分类,并根据分类结果,获取属于所述目标类别的图片。
本发明还提供了一种目标类别图片的获取系统,其特征在于,包括:
第一获取模块,用于获取待分类图片集,并获取目标类别;
查找模块,用于根据所述目标类别从样本图片库中查找属于所述目标类别的样本图片;
特征提取模块,用于对样本图片进行特征提取,以获得所述样本图片的特征基集;
第二获取模块,用于将所述特征基集作为神经网络的滤波器对图片进行滤波处理,以获取所述待分类图片集中属于所述目标类别的图片。
可选的,所述特征提取模块还用于:
对样本图片进行采样,获取图片碎片,并根据所述图片碎片建立特征样本集;
采用稀疏自编码对特征样本集进行特征提取。
可选的,还包括:
优化模块,用于采用BP神经网络中的反向传播算法对所述特征基集进行优化。
可选的,所述第二获取模块还用于:
采用以所述特征基集为卷积核的卷积神经网络对所述待分类图片集中的每个待分类图片进行卷积滤波,获取每个待分类图片的高维卷积特征;
对所述高维卷积特征进行池化处理,并根据池化处理后的卷积特征,获取所述待分类图片集中属于所述目标类别的图片。
可选的,所述第二获取模块还用于:
采用softamx分类算法,对所述池化处理后的卷积特征进行分类,并根据分类结果,获取属于所述目标类别的图片。
由上述技术方案可知,本发明通过提取属于目标类别的样本图片的特征基集,作为先验知识,并根据特征基集获取待分类图片集中属于所述目标类别的图片,与现有技术中使用随机初始化方法或者采用Gabor滤波器作为卷积核相比,具有准确率高、耗时低的优点
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1示出了本发明一实施例提供的目标类别图片的获取方法的流程示意图;
图2示出了本发明另一实施例提供的目标类别图片的获取方法的流程示意图;
图3示出了本发明一实施例提供的目标类别图片的获取方法中利用自编码器学习得到的100个特征基图片;
图4示出了本发明一实施例提供的图片目标类别图片的获取中特征提取步骤的网络结构图简图;
图5示出了本发明一实施例提供的目标类别图片的获取方法的池化流程示意图;
图6示出了本发明另一实施例提供的目标类别图片的获取方法的流程示意图;
图7示出了本发明一实施例提供的目标类别图片的获取方法中样本图片集的示例图;
图8示出了本发明一实施例提供的目标类别图片的获取统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一实施例提供的目标类别图片的获取方法的流程示意图,参照图1,该图片分类方法,包括:
101、获取待分类图片集,并获取目标类别;
可理解的是,目标类别例如:车,人,水果等等
102、根据所述目标类别从样本图片库中查找属于所述目标类别的样本图片;
可理解的是,样本图片的数量为多个,具体数量可视精度要求而定。
103、对样本图片进行特征提取,以获得所述样本图片的特征基集;
104、根据所述特征基集作为滤波器对图片进行滤波特征提取,获取待分类图片的高维特征,获取所述待分类图片集中属于所述目标类别的图片。
本发明提出的图片分类方法通过提取与待分类目标相同属性的样本集的特征基集,并将特征基集作为卷积核对待分类图片集进行分类,与现有技术中使用随机初始化方法或者采用Gabor滤波器作为卷积核相比,具有准确率高、耗时低的优点。
图2为本发明另一实施例提供的目标类别图片的获取方法的流程示意图,下面参照图2对本发明进行详细说明:
步骤201、202与上述步骤101、102相对应,在查找到属于目标类别的样本图片后,本发明还包括:
203、对样本图片进行采样,获取图片碎片,并根据所述图片碎片建立特征样本集;
需要说明的是,采集图片碎片集主要是通过预设大小的模板对各样本图片进行非跳跃式的采样,得到各样本图片在这个模板下的所有图片碎片,并构成各样本图片的局部图片区域集。例如:采用m×m的模板对大小为n×n的样本图片进行采样,每张样本图片可以得到(n-m+1)×(n-m+1)个图片碎片,然后从中随机抽取k个以构建特征样本集。
204、采用稀疏自编码对特征样本集进行特征提取,以获得所述样本图片的特征基集。
图3为本发明一实施例提供的目标类别图片的获取方法中利用自编码器学习得到的100个特征基图片,参照图3,对步骤204进行详细说明,在步骤203获得特征样本集后,即可计算特征样本集中的每个维度对应的平均值,然后在对去均值后的样本集进行白化(ZCA)处理,并将数据集每个维度的方差标准化,最后对白化后的特征样本集使用稀疏自编码网络进行特征提取,得到特征基集。
为了获得最优的特征基集,本发明还采用BP神经网络中的反向传播算法对所述特征基集进行优化;
需要说明的是,在自编码神经网络中,采用BP神经网络中的反向传播算法对权值和偏置进行逐步优化,待得到最好的收敛效果或者达到最高迭代次数的时候,就学习到了相对来说的最好的特征基集。
图4为本发明一实施例提供的目标类别图片的获取方法中特征提取步骤的网络结构图简图,下面参照图4对本发明中的特征提取步骤进行详细说明:
给定多组不含标签的数据,通过稀疏自编码的方式捕捉高层次的特征并将其表示为基础的函数。作为一种无监督学习方法,稀疏自编码神经网络的最终目的是为了从所给数据中学习到一组“超完备”的基向量φi,去尽可能准确地表示样本数据,并能有效找出输入数据内部隐含的结构或模式。
在不考虑偏置项的情况下,规定X表示输入层的m维向量,Y表示输出层的n维向量,Z表示隐层的k维向量,表示l+1层的第j个神经元与l层第i个神经元之间的连接权值,b(l)表示第l层的偏置。由于是自编码网络,显然有m=n。自编码神经网络尝试学习一个hW,b(X)≈X的函数,其中,hW,b(.)为网络的输出函数,w为权值,b为偏置,于是对隐层和输出层的神经元,激活度计算分别为:
Z j = f ( Σ i = 1 m W i j ( l ) X j + b ( l ) ) , l = 1 , j = 1 ... k - - - ( 1 )
Y j = f ( Σ i = 1 k W i j ( l ) Z i + b ( l ) ) , l = 2 , j = 1 ... n - - - ( 2 )
其中,Zj为隐层第j个神经元的激活度,Yj为输出层第j个神经元的激活度,激活函数f(·)选用sigmoid函数。很显然,在满足hW,b(X)≈X的前提下,当k<n时,意味着用低维数据表示高维数据,降维的隐层类似于主成分分析(PCA)提取主成分;而当k>n时,则由低维升到高维,此时,通过对隐层加入稀疏性的限制抑制多数神经元的响应,得到超完备基,从而更好地学习到输入数据的内部结构与数据模式,并将其称之为稀疏自编码器,本发明把有m个输入变量的稀疏编码代价函数定义如下:
Minimize a i ( j ) , φ i Σ j = 1 m || x ( j ) - Σ i = 1 k a i ( j ) φ i || 2 + λ Σ i = 1 k S ( a i ( j ) ) - - - ( 3 )
其中,Minimize为对后式取最小值,可简写为Min,为第j层第i个单元的激活值,x(j)为第j个输入样本,λ为惩罚系数亦可称为平衡系数,S(.)为稀疏代价函数,普遍选择的是L1范式代价函数 S ( a i ( j ) ) = | a i | 1 即对数代价函数 S ( a i ( j ) ) = l o g ( 1 + a i 2 ) .
无监督学习稀疏自编码已经在图片识别等很多领域得到了广泛的应用。以2D图像(以20×20图像为例)作为稀疏自编码器的输入为例,每个隐层单元Zj对如下关于输入的函数进行计算:
Z j = f ( Σ i = 1 400 W i j ( 1 ) X j + b ( 1 ) ) , j = 1 ... k - - - ( 4 )
假设输入有范数约束,则令隐层单元Zj得到最大激励的输入Xi由下列公式计算得出。
X i = W i j ( 1 ) Σ i = 1 400 ( W i j ( 1 ) ) 2 , j = 1 , 2 ... k , i = 1 , 2 ... 400 - - - ( 5 )
依据(5)式计算出输入层每个像素的值,并将其按原来顺序组成一幅20×20的图像,即构成了所需的基图像,反映了隐层单元所学习到的深层特征,即为特征基集。
图5为本发明一实施例提供的目标类别图片的获取方法的池化流程示意图,参照图5,在获取到特征基集后,本发明还包括:
205、采用以所述特征基集为卷积核的卷积神经网络对所述待分类图片集中的每个待分类图片进行卷积滤波,获取每个待分类图片的高维卷积特征;
需要说明的是,在获得特征基集后,将特征基集代替传统卷积神经网络LeNet-5模型中随机得到的随机化卷积核。使用某个特征基对待分类图片落在窗口内的区域进行卷积滤波,得到该特征基所对应的一幅特征映射图。假设输入的数据集有1000张大小为Di×Di的.彩色图片,特征基集是400个大小为Dp×Dp的特征基。每个特征基对图片进行卷积操作后,假定卷积运算步长为1,会产生400个(Di-Dp+1)×(Di-Dp+1)的特征映射图,总共产生400000个特征映射图。
206、对所述高维卷积特征进行池化处理以达到降维的目的,并根据池化处理后的卷积特征,获取所述待分类图片集中属于所述目标类别的图片。
需要说明的是,本发明的池化处理是为了对高维卷积特征降维,以获取卷积特征,并根据卷积特征获取所述待分类图片集中属于所述目标类别的图片。
在完成步骤205的卷积处理后,网络训练参数个数大大降低,但由此产生的卷积后输出向量维度过大的问题也随之出现。如果设定神经网络的隐层神经元个数为m,那么得到的卷积图像的维度为(Di-Dp+1)×(Di-Dp+1)×m。这种多维度的输出向量会增大后续分类的难度,而以实现图像降维的卷积池化就显得尤为重要。
对于给定的池化区域宽度w和高度h,将卷积后得到的特征映射图片划分为多个相同大小的区域,通过最大化处理后作为池化的每一个1×1区域的输出。得到最终特征集,作为分类的训练数据,并根据分类的训练数据获取分类结果。
图6为本发明另一实施例提供的目标类别图片的获取方法的流程示意图,下面参照图6对本发明的工作原理进行详细说明:
本算法将稀疏编码得到的“超完备”基向量引入到卷积神经网络中,替代传统LeNet-5结构中随机得到的卷积核,得到了一种结合稀疏自编码的高效的卷积神经网络算法。
先从待训练样本中选取部分类别属性相同的部分数据集,采用固定大小的模板对数据采样,之后从中随机抽取一定数量的图片碎片,即采样的数据样本集;再经稀疏自编码对图片碎片集进行特征提取,得到一组特定的特征基集,将此特征基集运用的卷积神经网络中并将其作为卷积核,对原始图片进行卷积运算与特征提取与匹配,再将卷积后的特征图片进行池化,最终得到更高层的图片表征用于分类器的输入。其主要步骤如下。
(1)图片碎片采集:通过固定大小的模板对图片进行非跳跃式的采样,得到图片在该模板下的所有局部图片碎片集;
(2)无监督特征提取:对第(1)步提取到的图片碎片集经处理后进行稀疏自编码特征提取,通过自编码神经网络算法,能够有效发现这组有联系数据中的相关性,并能够在输出层重构输出数据;
(3)特征卷积与特征池化:将(2)中得到的特征基集作为卷积核对输入图像进行卷积滤波得到图片的高维特征,并对得到的特征图进行池化处理以降低特征维数;
(4)特征分类:将前几步得到的高层特征输入到设计好的分类器中,得到分类结果。本发明采用softamx分类算法对各待分类图片进行分类,其实现方式为:将获得的分类训练数据输入到设计好的softmax分类器中,以获得分类结果;其中,softmax分类器的设计难度与输出向量的维度的数量有关系。
下面对本发明的分类方法与传统的LeNet-5算法进行比较:
为了比较本文改进的卷积神经网络算法的性能,分别采用本发明算法与传统LeNet-5算法,在训练时耗与分类准确率上进行比较。测试使用的计算机处理器是Inter(R)Core(TM)i5-3210,主频为2.5GHz,以Matlab2014a作为运行平台。两种算法的主要参数设置如表1和表2所示。
表1本文算法主要参数设置
表2LeNet-5算法主要参数设置
图7为本发明一实施例提供的目标类别图片的获取方法中样本图片集的示例图,参照图7,本发明考虑到实际的运行环境,实验的数据集为包含1200张有标签的分辨率为100x100的彩色图片,均来自于互联网公用数据库。包含两个类别,分别是车和人,其中车有600张图片,人有600张图片。每个类别中随机抽取100张图片进行图片碎片采样,作为特征基的数据来源。每个类别各随机抽取400张作为训练数据,剩余100张作为测试数据。
本发明对算法进行了纵横对比。表3为本发明算法与LeNet-5算法在卷积核数和迭代次数相等情况下的四组实验结果。每组中的第一行为LeNet-5算法结果,第二行为本文算法结果。其中,LeNet-5采用了两层中间层(卷积-下采样),第一层卷积层采用6个卷积核,第二层卷积层采用12个卷积核。
从表3中可以看出,在迭代10次和50次时,LeNet-5不收敛,本发明算法能达到75%左右的分类准确率。随着迭代次数的增加,本发明算法在和LeNet-5第一层卷积核和迭代次数相等的情况下,相对LeNet-5的准确率平均能提升10%,时耗缩短约94%。
由此可知,将稀疏自编码得到的特征基作为卷积核,相比随机初始化,能使得网络误差更快地接近极小值,从而减少网络训练所需要的时间。与此同时,在卷积核数相等的情况下,随着迭代次数的增加,两种算法的分类准确率均有所提升。
表3
表4为本发明算法在特征核保持为400条件下的实验结果,由表4可知,随着迭代次数增加,分类准确率提升,但时耗也相应增长。当迭代次数达到500时,分类准确率能达到95%。
表4
表5为在迭代次数保持为100次不变的前提下,由表5可知,随着特征核数从6变到400,分类准确率逐渐提升,时耗也相应增长。但是特征核从200变到400时,特征学习过强,存在过拟合现象,导致分类准确率反而稍微有所下降。
从上述实验结果可以得出,卷积神经网络的分类精度与神经元的构成数量以及迭代次数有很大的关系。网络性能随着神经元数目的增加而得到相应的提高,但盲目构造一个大规模的神经网络,不仅会导致网络训练时间过长,还可能存在分类精度提高不明显甚至出现过拟合等问题。
表5
图8为本发明一实施例提供的目标类别图片的获取系统的结构示意图,参照图8,该图片分类系统,包括:
第一获取模块81,用于获取待分类图片集,并获取目标类别;
查找模块82,用于根据所述目标类别从样本图片库中查找属于所述目标类别的样本图片;
特征提取模块83,用于对样本图片进行特征提取,以获得所述样本图片的特征基集;
第二获取模块84,用于根据所述特征基集,获取所述待分类图片集中属于所述目标类别的图片。
该系统通过提出与待分类图片集相同属性的样本集的特征基集,并将特征基集作为卷积核对待分类图片集进行分类,与现有技术中使用随机初始化方法或者采用Gabor滤波器作为卷积核相比,具有准确率高、耗时低的优点
下面对本系统中的模块进行详细说明:
特征提取模块83还用于:
对样本图片进行采样,获取图片碎片,并根据所述图片碎片建立特征样本集;
采用稀疏自编码对特征样本集进行特征提取。
第二获取模块84还用于:
采用以所述特征基集为卷积核的卷积神经网络对所述待分类图片集中的每个待分类图片进行卷积滤波,获取每个待分类图片的卷积特征;
对所述卷积特征进行池化处理,并根据池化处理后的卷积特征,获取所述待分类图片集中属于所述目标类别的图片。
本发明优选地采用softamx分类算法对各待分类图片进行分类。
为了获取最优的特征基集,本系统还包括:
优化模块85,用于采用BP神经网络中的反向传播算法对所述特征基集进行优化。
虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种目标类别图片的获取方法,其特征在于,包括:
获取待分类图片集,并获取目标类别;
根据所述目标类别从样本图片库中查找属于所述目标类别的样本图片;
对样本图片进行特征提取,以获得所述样本图片的特征基集;
将所述特征基集作为神经网络的滤波器对图片进行滤波处理,以获取所述待分类图片集中属于所述目标类别的图片。
2.根据权利要求1所述的方法,其特征在于,所述对样本图片进行特征提取,包括:
对样本图片进行采样,获取图片碎片,并根据所述图片碎片建立特征样本集;
采用稀疏自编码对特征样本集进行特征提取。
3.根据权利要求1或2所述的方法,其特征在于,还包括:
采用BP神经网络的反向传播算法对所述特征基集进行优化。
4.根据权利要求1所述的方法,其特征在于,所述根据所述特征基集,获取所述待分类图片集中属于所述目标类别的图片,包括:
采用以所述特征基集为卷积核的卷积神经网络对所述待分类图片集中的每个待分类图片进行卷积滤波,获取每个待分类图片的高维卷积特征;
对所述高维卷积特征进行池化处理,并根据池化处理后的卷积特征,获取所述待分类图片集中属于所述目标类别的图片。
5.根据权利要求4所述的方法,其特征在于,所述根据池化处理后的卷积特征,获取所述待分类图片集中属于所述目标类别的图片,包括:
采用softamx分类算法,对所述池化处理后的卷积特征进行分类,并根据分类结果,获取属于所述目标类别的图片。
6.一种目标类别图片的获取系统,其特征在于,包括:
第一获取模块,用于获取待分类图片集,并获取目标类别;
查找模块,用于根据所述目标类别从样本图片库中查找属于所述目标类别的样本图片;
特征提取模块,用于对样本图片进行特征提取,以获得所述样本图片的特征基集;
第二获取模块,用于将所述特征基集作为神经网络的滤波器对图片进行滤波处理,以获取所述待分类图片集中属于所述目标类别的图片。
7.根据权利要求6所述的系统,其特征在于,所述特征提取模块还用于:
对样本图片进行采样,获取图片碎片,并根据所述图片碎片建立特征样本集;
采用稀疏自编码对特征样本集进行特征提取。
8.根据权利要求6所述的系统,其特征在于,还包括:
优化模块,采用BP神经网络中的反向传播算法对所述特征基集进行优化。
9.根据权利要求6所述的系统,其特征在于,所述第二获取模块还用于:
采用以所述特征基集为卷积核的卷积神经网络对所述待分类图片集中的每个待分类图片进行卷积滤波,获取每个待分类图片的高维卷积特征;
对所述高维卷积特征进行池化处理,并根据池化处理后的卷积特征,获取所述待分类图片集中属于所述目标类别的图片。
10.根据权利要求9所述的系统,其特征在于,所述第二获取模块还用于:
采用softamx分类算法,对所述池化处理后的卷积特征进行分类,并根据分类结果,获取属于所述目标类别的图片。
CN201510889219.6A 2015-12-07 2015-12-07 一种目标类别图片的获取方法及系统 Pending CN105512681A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510889219.6A CN105512681A (zh) 2015-12-07 2015-12-07 一种目标类别图片的获取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510889219.6A CN105512681A (zh) 2015-12-07 2015-12-07 一种目标类别图片的获取方法及系统

Publications (1)

Publication Number Publication Date
CN105512681A true CN105512681A (zh) 2016-04-20

Family

ID=55720647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510889219.6A Pending CN105512681A (zh) 2015-12-07 2015-12-07 一种目标类别图片的获取方法及系统

Country Status (1)

Country Link
CN (1) CN105512681A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106203490A (zh) * 2016-06-30 2016-12-07 江苏大学 一种安卓平台下基于属性学习和交互反馈的图像在线识别、检索方法
CN106484777A (zh) * 2016-09-12 2017-03-08 腾讯科技(深圳)有限公司 一种多媒体数据处理方法以及装置
CN106650919A (zh) * 2016-12-23 2017-05-10 国家电网公司信息通信分公司 一种基于卷积神经网络的信息系统故障诊断方法及装置
CN106926247A (zh) * 2017-01-16 2017-07-07 深圳前海勇艺达机器人有限公司 具有自动家中寻物的机器人
CN107133650A (zh) * 2017-05-10 2017-09-05 合肥华凌股份有限公司 冰箱的食物识别方法、装置及冰箱
CN107679543A (zh) * 2017-02-22 2018-02-09 天津大学 稀疏自动编码器与极限学习机立体图像质量评价方法
CN108229556A (zh) * 2017-12-29 2018-06-29 北京市商汤科技开发有限公司 对象分类及模型训练方法、装置、介质和系统
CN108509961A (zh) * 2017-02-27 2018-09-07 北京旷视科技有限公司 图像处理方法和装置
CN109214407A (zh) * 2018-07-06 2019-01-15 阿里巴巴集团控股有限公司 事件检测模型、方法、装置、计算设备及存储介质
CN109344884A (zh) * 2018-09-14 2019-02-15 腾讯科技(深圳)有限公司 媒体信息分类方法、训练图片分类模型的方法及装置
CN110738217A (zh) * 2019-10-14 2020-01-31 电子科技大学 一种基于多尺度卷积稀疏编码的藏医尿液特征分类方法
CN111338482A (zh) * 2020-03-04 2020-06-26 太原理工大学 一种基于监督自编码的脑控字符拼写识别方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100094787A1 (en) * 2008-10-14 2010-04-15 Xerox Corporation Clustering and classification employing softmax function including efficient bounds
CN103544506A (zh) * 2013-10-12 2014-01-29 Tcl集团股份有限公司 一种基于卷积神经网络的图像分类方法和装置
CN104102919A (zh) * 2014-07-14 2014-10-15 同济大学 一种有效防止卷积神经网络过拟合的图像分类方法
CN104408479A (zh) * 2014-11-28 2015-03-11 电子科技大学 一种基于深度局部特征描述符的海量图像分类方法
CN104537647A (zh) * 2014-12-12 2015-04-22 中安消技术有限公司 一种目标检测方法及装置
CN104751173A (zh) * 2015-03-12 2015-07-01 西安电子科技大学 基于协同表示和深度学习的极化sar图像分类方法
CN104850864A (zh) * 2015-06-01 2015-08-19 深圳英智源智能系统有限公司 一种基于卷积神经网络的非监督图像识别方法
CN104866810A (zh) * 2015-04-10 2015-08-26 北京工业大学 一种深度卷积神经网络的人脸识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100094787A1 (en) * 2008-10-14 2010-04-15 Xerox Corporation Clustering and classification employing softmax function including efficient bounds
CN103544506A (zh) * 2013-10-12 2014-01-29 Tcl集团股份有限公司 一种基于卷积神经网络的图像分类方法和装置
CN104102919A (zh) * 2014-07-14 2014-10-15 同济大学 一种有效防止卷积神经网络过拟合的图像分类方法
CN104408479A (zh) * 2014-11-28 2015-03-11 电子科技大学 一种基于深度局部特征描述符的海量图像分类方法
CN104537647A (zh) * 2014-12-12 2015-04-22 中安消技术有限公司 一种目标检测方法及装置
CN104751173A (zh) * 2015-03-12 2015-07-01 西安电子科技大学 基于协同表示和深度学习的极化sar图像分类方法
CN104866810A (zh) * 2015-04-10 2015-08-26 北京工业大学 一种深度卷积神经网络的人脸识别方法
CN104850864A (zh) * 2015-06-01 2015-08-19 深圳英智源智能系统有限公司 一种基于卷积神经网络的非监督图像识别方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106203490A (zh) * 2016-06-30 2016-12-07 江苏大学 一种安卓平台下基于属性学习和交互反馈的图像在线识别、检索方法
CN106484777A (zh) * 2016-09-12 2017-03-08 腾讯科技(深圳)有限公司 一种多媒体数据处理方法以及装置
CN106650919A (zh) * 2016-12-23 2017-05-10 国家电网公司信息通信分公司 一种基于卷积神经网络的信息系统故障诊断方法及装置
CN106926247A (zh) * 2017-01-16 2017-07-07 深圳前海勇艺达机器人有限公司 具有自动家中寻物的机器人
CN107679543A (zh) * 2017-02-22 2018-02-09 天津大学 稀疏自动编码器与极限学习机立体图像质量评价方法
CN108509961A (zh) * 2017-02-27 2018-09-07 北京旷视科技有限公司 图像处理方法和装置
CN107133650A (zh) * 2017-05-10 2017-09-05 合肥华凌股份有限公司 冰箱的食物识别方法、装置及冰箱
CN108229556A (zh) * 2017-12-29 2018-06-29 北京市商汤科技开发有限公司 对象分类及模型训练方法、装置、介质和系统
CN109214407A (zh) * 2018-07-06 2019-01-15 阿里巴巴集团控股有限公司 事件检测模型、方法、装置、计算设备及存储介质
CN109214407B (zh) * 2018-07-06 2022-04-19 创新先进技术有限公司 事件检测模型、方法、装置、计算设备及存储介质
CN109344884A (zh) * 2018-09-14 2019-02-15 腾讯科技(深圳)有限公司 媒体信息分类方法、训练图片分类模型的方法及装置
CN109344884B (zh) * 2018-09-14 2023-09-12 深圳市雅阅科技有限公司 媒体信息分类方法、训练图片分类模型的方法及装置
CN110738217A (zh) * 2019-10-14 2020-01-31 电子科技大学 一种基于多尺度卷积稀疏编码的藏医尿液特征分类方法
CN111338482A (zh) * 2020-03-04 2020-06-26 太原理工大学 一种基于监督自编码的脑控字符拼写识别方法及系统
CN111338482B (zh) * 2020-03-04 2023-04-25 太原理工大学 一种基于监督自编码的脑控字符拼写识别方法及系统

Similar Documents

Publication Publication Date Title
CN105512681A (zh) 一种目标类别图片的获取方法及系统
CN109685115B (zh) 一种双线性特征融合的细粒度概念模型及学习方法
US20190228268A1 (en) Method and system for cell image segmentation using multi-stage convolutional neural networks
CN110348399B (zh) 基于原型学习机制和多维残差网络的高光谱智能分类方法
Montazer et al. An improved radial basis function neural network for object image retrieval
CN111753828B (zh) 一种基于深度卷积神经网络的自然场景水平文字检测方法
CN103927531B (zh) 一种基于局部二值和粒子群优化bp神经网络的人脸识别方法
CN105844285A (zh) 基于图像信息的黄瓜病害识别方法及装置
CN106407986A (zh) 一种基于深度模型的合成孔径雷达图像目标识别方法
CN108171318B (zh) 一种基于模拟退火—高斯函数的卷积神经网络集成方法
CN110197205A (zh) 一种多特征来源残差网络的图像识别方法
CN106845510A (zh) 基于深度层级特征融合的中国传统视觉文化符号识别方法
CN111914728B (zh) 高光谱遥感影像半监督分类方法、装置及存储介质
CN108805167A (zh) 一种基于Laplace函数约束的稀疏深度置信网络图像分类方法
CN110309811A (zh) 一种基于胶囊网络的高光谱图像分类方法
CN109582782A (zh) 一种基于用弱监督深度学习的文本聚类方法
CN105718889A (zh) 基于GB(2D)2PCANet深度卷积模型的人脸身份识别方法
CN104732244A (zh) 基于小波变换、多策略pso和svm集成的遥感图像分类方法
CN111783841A (zh) 基于迁移学习和模型融合的垃圾分类方法、系统及介质
CN105913081A (zh) 基于改进的PCAnet的SAR图像分类方法
CN112418261B (zh) 一种基于先验原型注意力机制的人体图像多属性分类方法
CN110569725A (zh) 一种基于自注意力机制的深度学习的步态识别系统与方法
Yang et al. Down image recognition based on deep convolutional neural network
CN110991554B (zh) 一种基于改进pca的深度网络图像分类方法
CN109816030A (zh) 一种基于受限玻尔兹曼机的图像分类方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160420