CN104598920A - 基于Gist特征与极限学习机的场景分类方法 - Google Patents

基于Gist特征与极限学习机的场景分类方法 Download PDF

Info

Publication number
CN104598920A
CN104598920A CN201410840024.8A CN201410840024A CN104598920A CN 104598920 A CN104598920 A CN 104598920A CN 201410840024 A CN201410840024 A CN 201410840024A CN 104598920 A CN104598920 A CN 104598920A
Authority
CN
China
Prior art keywords
msub
mrow
mtd
mtr
msubsup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410840024.8A
Other languages
English (en)
Other versions
CN104598920B (zh
Inventor
高颖慧
王鲁平
李飚
王平
梁楹
张路平
赵明
范明喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN201410840024.8A priority Critical patent/CN104598920B/zh
Publication of CN104598920A publication Critical patent/CN104598920A/zh
Application granted granted Critical
Publication of CN104598920B publication Critical patent/CN104598920B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于Gist特征与极限学习机的场景分类方法,先提取图像的Gist特征,采用Gabor小波对场景图像进行卷积操作,然后提取Gist向量作为场景图像的特征描述,将此特征描述用于场景分类当中。本发明利用Gist特征对图像产生一个综合的认知、综合描述了自然度,开放度,粗略度,展开度和崎岖度五种自然属性,相比较传统的场景分类方法可以避免根据各种实际情况设置不同的参数和门限。解决了传统分类中在变化情况较多条件下必须不断调整分类门限的技术难题,运算速度快且具有很好的泛化能力,扩展性很好,随着分类情况复杂度提高、规模的扩大表现出来的优越性越好。

Description

基于Gist特征与极限学习机的场景分类方法
技术领域
本发明涉及场景图像特征提取方法以及极限学习机分类方法。具体的说,就是利用提取图像的Gist全局特征,然后利用经过样本训练的极限学习机对图像分类的方法。
背景技术
场景分类是计算机视觉图片分类的重要分支。场景描述与理解的概念,在2006年的MIT场景理解研讨会上得到了进一步明确,同时会议上还指出,场景分类是一个新的有前途的研究方向,其主要应用在四个主要方面:图像/视频检索,计算机视觉任务,移动机器人以及图像增强。
基于视觉的场景分类方法大致可以划分为3类:基于对象的场景分类、基于区域的对象分类以及基于上下文的场景分类。基于视觉的场景分类方法大部分都是以对象为单位的,典型的基于对象的场景分类方法有分割、特征重组和对象识别等步骤。这种方法的弊端是底层的错误会随着处理的深入而被放大。另一种比较常见的场景分类方法则是基于区域的。该类方法的关键在于如何将图片可靠的分割成区域,并且要求每个区域都有其本身的特征。此类方法面对分割时并不那么灵活,这在非约束的环境下尤为突出,因此,很少有完全基于区域的场景分类方法。基于上下文的场景分类是另一种主流的场景分类方法,这种方法的特点在于忽略了传统的场景分类处理步骤,将输入图片作为一个特征,并提取可以概括图像统计或语义的低维特征。该类方法的目的即为提高场景分类的鲁棒性。因为自然图片中很容易掺杂一些随机噪声,这类噪声会对局部处理造成灾难性的影响,而对于全局图像却可以通过平均数来降低这种影响。基于上下文的方法,通过识别全局对象,而非场景中的小对象集合或者准确的 区域边界,因此不需要处理小的孤立区域的噪声和低级图片的变化,其解决了分割和目标识别分类方法遇到的问题。
Gist特征是一种生物启发特征,该特征模拟人的视觉提取图像中粗略但简明扼要的上下文信息。场景Gist(GG)特征是通过多尺度多方向的Gabor滤波器组对场景图像滤波后得到的轮廓信息。
极限学习机是对单隐层前馈神经网络研究中提出的一种新的单隐含层前馈神经网络。该神经网络对于输入层与隐含层间的连接权值及隐含层神经元的偏置没有任何要求,且在训练过程中这两种参数无需调整,只需要设置隐含层神经元的个数,便可以获得唯一的最优解。
发明内容
本发明所要解决的问题是面向场景分类应用需要,设计一种高性能、高可扩展的自主场景分类方法,为计算机视觉的进一步研究和应用提供基础。
本发明中的场景分类算法包括场景特征提取和根据特征学习分类两个过程。具体的设计方案如下:
A图像Gist特征提取
Gist特征是一种全局特征,包括了自然度,开放度,粗略度,展开度和崎岖度五种自然属性。可以用来对图像产生一个综合的认知,避免了设置各种参数和门限。而且图像的Gist特征是基于Gabor小波提取的,研究发现Gabor小波可以很好的模拟人的视觉神经细胞,在提取图像信息时能发挥重要的作用。本发明采用Gabor小波对场景图像进行卷积操作,然后提取Gist向量作为场景图像的特征描述,将此特征描述用于接下来的场景分类当中,具体过程为:
一幅大小为r×c的灰度图像f(x,y)用m尺度n方向的Gabor滤波器组进行滤 波,即分别同nc个通道的滤波器进行卷积,其中nc=m×n,再级联卷积的结果,即为图像Gist(IG)特征,将一副大小为r×c的灰度图像f(x,y)划分成np×np的规则网格,各网格块按行依次记作Pi,其中i=1,...,ng;每个网格块大小为r'×c',分别用nc个通道的滤波器对图像进行卷积滤波,则每个网格块各通道滤波后,级联的结果称为块Gist(PG)特征,对GP(GP表示每个网格块的Gist(PG)特征)块各通道滤波结果取均值后按行组合的结果称为全局Gist(GG)特征,即(GG是全局Gist(GG)特征)
G G = { G 1 P ‾ , G 2 P ‾ , . . . , G n g P ‾ } - - - ( 1 )
式中, G i P ‾ = 1 r ′ × c ′ Σ ( x , y ) ∈ P i G i P ( x , y ) , GG的维数为nc×ng
B极限学习机(ELM)对Gist特征进行学习完成图像分类
极限学习机是一种新型的神经网络学习算法,极限学习机具有以下的一些优点。一是极限学习机的参数设置简单。二是极限学习机的计算复杂度很低,运算速度很快。三是极限学习机不会像BP网络那样容易陷入局部最优。四是它采用了神经网络的框架因而可以很容易的处理多分类问题。本发明利用极限学习机的以上优点对样本场景的进行学习,最终生成可以对场景正确的分类的网络。
设P(P的含义就是样本的数目)个不同的训练样本为(xi,ti),其中xi=[xi1,xi2,…,xin]T∈Rn且ti=[ti1,ti2,…,tim]T∈Rm,i=1,2,…,N,学习网络建模为:
Σ j = 1 M β j g j ( x i ) = Σ j = 1 M β j g ( w j · x i + b j ) = o i , i = 1,2 , . . . , N - - - ( 2 )
其中,M是隐藏节点的个数,g(·)为激励函数,选用hardlim或hardlims,wj=[wj1,wj2,…,wjn]T∈Rn是输入节点与第j个隐藏节点的连接权重,bj∈R是第j个隐藏节点的偏置,βj=[βj1j2,…,βjm]T∈Rm是输出节点与第j个隐藏节 点的连接权重,wj·xi表示wj和xi的内积。
输入连接权重和隐层节点偏置(w,b)可随机选择,通过学习找到特定的βj,j=1,2,…,M使得分类总误差最小:
min||ε||2,s.t.εi=ti-oi,i=1,2,…,N   (3)其中,εi=[εi1i2,…,εin]T是第i个样本输出值与真实值间的差值。(3)式中,oi是输出值,是Gist特征输入后网络输出的值,ti是真实值,是类别的值,比如属于自然类,就等于自然类的ti
假设合理训练的隐层前馈神经网络SLFN能够无误差地逼近N个训练样本,式(3)改写为:
Hβ=T或||Hβ-T||=0   (4)
其中,
H = g ( w 1 · x 1 + b 1 ) . . . g ( w M · x 1 + b M ) g ( w 1 · x 2 + b 1 ) . . . g ( w M · x 2 + b M ) . . . . . . . . . g ( w 1 · x N + b 1 ) . . . g ( w M · x N + b M ) N × M - - - ( 5 )
β = β 1 T . . . β M T M × m , T = t 1 T . . . t N T N × m
H称为神经网络的隐层输出矩阵,H的第i行对应于所有隐藏节点对第i个训练输入xi的输出向量,而H中的第j列是第j个隐层节点对应于输入样本xk,k=1,2,…,N的输出向量。
求解如下线性方程组的广义最小二乘获得
| | H β ^ - T | | = min β | | Hβ - T | | - - - ( 6 )
上述线性方程组的广义最小二乘解为
β ^ = arg min β | | Hβ - T | | = H + T - - - ( 7 )
其中H+=(HTH)-1HT为隐层输出矩阵H的Moore-Penrose广义逆。
得到了后,测试网络就形成了,然后输入测试图片的Gist特征,进行测试分类,代入Hβ=O,求o(输出值),与类别的标签(在具体步骤中给各类设置了标签)对比进行归类,确定所属类别。
采用本发明可以达到以下效果:
1、利用Gist特征对图像产生一个综合的认知、综合描述了自然度,开放度,粗略度,展开度和崎岖度五种自然属性,相比较传统的场景分类方法可以避免根据各种实际情况设置不同的参数和门限。
2、本发明利用极限学习机(ELM)对Gist特征学习完成场景分类的方法能够综合所有样本的情况进行分类,解决了传统分类中在变化情况较多条件下必须不断调整分类门限的技术难题。
3、与传统的基于迭代的隐层前馈神经网络SLFN相比,极限学习机ELM只需要设定隐藏节点的数目,运算速度快且具有很好的泛化能力。
4、本发明的扩展性很好,随着分类情况复杂度提高、规模的扩大表现出来的优越性越好。
附图说明
图1为两类分类单张测试图片分类效果示意图;其中a、b为自然场景,c为人造场景,d为自然场景;
图2为多类分类单张测试图片分类效果示意图;其中a为森林,b为高速公路,c为高楼,d为山脉;
图3为图像Gist特征提取示意图;其中a为原图像,b为把图像分成小块, 并进行Gabor滤波,c为场景的全局Gist特征;
图4为实现ELM分类场景流程图。
具体实施方式
为本发明测试采用的是MIT的OT图像库,该图像场景库共分为八类场景:海滩360张,森林328张,山脉374张,户外410张,高速公路260张,城区308张,街道292张,高楼356张,共计2688张。
图1为本发明两类分类过程单张测试图片分类显示结果,图1中包含自然场景与人造场景,图片抬头的文字表述为划归的场景,其中4幅图片中前3幅划分正确,右下角一幅划分错误。两类分类过程是指将八类场景图像合并为自然场景与人造场景两类,其中自然场景包括:海滩、森林、山脉和户外;人造场景包括:高速公路、城区、街道和高楼。
两类分类算法实现步骤:
1、根据Gist特征提取方法,提取八类场景中每一类场景样本的Gist特征,对于前四类样本(海滩、森林、山脉、户外)统一标定标签为0,后四类样本(高速公路、城区、街道、高楼)统一标定标签为1;
2、从每一小类别分别随机选择100幅作为训练样本库,这样自然类和人造类就各有400幅图像作为训练样本,将每一类余下的部分作为测试样本,组建测试样本库,这样测试样本库就有1888幅测试样本;
3、将2中得到的训练样本库作为训练数据,经过ELM学习得到ELM分类模型,其中设置隐藏神经节点数为5000,激励函数选择hardlim;
4、将3中得到的ELM模型作为分类器模型,使用2中的测试样本库进行分类测试,得到分类结果及各种参数,具体结果可见表1;
5、将分类中标签的数字结果转化为图像场景的语义文字表述,输出结果。
所得到的测试结果如表1所示,测试结果中各类样本测试分类正确划分及错误划分情况如表2所示,其中的数据为每一小类别划分进入自然场景和人造场景的数据,正确率为正确划分如该小类所属大类的正确率。正确率对比可以表示如下:以两类分类为例
方法 正确率
本方法 93%
空域包络 78%
视觉词包 85%
图3为本发明多类分类过程单张测试图片分类显示结果。图3中每类测试划归为相应类别,上两幅划归正确,下两幅划分错误。多类分类即将八类各自划归为一类进行训练和测试,统计测试正确率。场景的特征提取及分类过程与两类分类基本类似,所不同的是:在ELM进行分类和测试的时候,不再仅仅只标记两类0和1了,而是将8类各自分开进行标记,用阿拉伯数字1~8分别代表海滩、森林、山脉、户外、高速公路、城区、街道和高楼。
多类分类算法实现步骤:
1、根据Gist提取方法提取各类场景图像的Gist特征,用1~8分别标定海滩、森林、山脉、户外、高速公路、城区、街道和高楼;
2、从每一类别中选取100幅作为训练样本组建训练库,余下的组建测试样本库;
3、使用训练样本进行ELM训练,得到ELM分类器模型,其中隐藏神经节点数为5000,激励函数选择hardlim;
4、使用测试样本库进行分类测试,得到测试结果及参数;
所得到的测试结果如表3所示,测试结果中各类样本分类正确率及错分类别 情况如表4所示,为每一类划分正确率及其错误划分至其他类别中的数量,表格中的百分比为该类图片正确划分至该类别的正确率。
图4为图像Gist特征提取示意图,一幅大小为r×c的灰度图像f(x,y)用m尺度n方向的Gabor滤波器组进行滤波,即分别同nc个通道的滤波器进行卷积,其中nc=m×n,再级联卷积的结果,即为图像Gist(IG)特征,将一副大小为r×c的灰度图像f(x,y)划分成np×np的规则网格,各网格块按行依次记作Pi,其中i=1,...,ng。网格块大小为r'×c',分别用nc个通道的滤波器对图像进行卷积滤波,则每个网格块各通道滤波后,级联的结果称为块Gist(PG)特征,对GP各通道滤波结果取均值后按行组合的结果称为全局Gist(GG)特征,即
G G = { G 1 P ‾ , G 2 P ‾ , . . . , G n g P ‾ } - - - ( 1 )
式中, G i P ‾ = 1 r ′ × c ′ Σ ( x , y ) ∈ P i G i P ( x , y ) , GG的维数为nc×ng。本发明将场景图像划分为4×4的规则网格,用4个尺度8个方向共32个Gabor滤波器处理每一小块图像,再将经过处理过后的每一小块图像所得到的块图像Gist(IG)特征进行级联就可以得到全局Gist(GG)特征,这样就可以得到一个32×16大小的特征向量组,此一维特征向量组即为所需要求取的全局Gist(GG)特征向量。将整个图像的所有图像块的Gist向量级联得到的整幅场景图像的Gist特征是共计512维的特征向量组。
设本发明中100个不同的训练样本为(xi,ti),其中xi=[xi1,xi2,…,xin]T∈Rn且ti=[ti1,ti2,…,tim]T∈Rm,i=1,2,…,N,学习网络建模为:
Σ j = 1 M β j g j ( x i ) = Σ j = 1 M β j g ( w j · x i + b j ) = o i , i = 1,2 , . . . , N - - - ( 2 )
其中,M是隐藏节点的个数,g(·)为激励函数,wj=[wj1,wj2,…,wjn]T∈Rn是输入节点与第j个隐藏节点的连接权重,bj∈R是第j个隐藏节点的偏置, βj=[βj1j2,…,βjm]T∈Rm是输出节点与第j个隐藏节点的连接权重,wj·xi表示wj和xi的内积。
输入连接权重和隐层节点偏置(w,b)可随机选择,通过学习找到特定的βj,j=1,2,…,M使得分类总误差最小:
min||ε||2,s.t.εi=ti-oi,i=1,2,…,N   (3)其中,εi=[εi1i2,…,εin]T是第i个样本输出值与真实值间的差值。
假设合理训练的隐层前馈神经网络SLFN能够无误差地逼近N个训练样本,式(3)改写为:
Hβ=T或||Hβ-T||=0   (4)
其中,
H = g ( w 1 · x 1 + b 1 ) . . . g ( w M · x 1 + b M ) g ( w 1 · x 2 + b 1 ) . . . g ( w M · x 2 + b M ) . . . . . . . . . g ( w 1 · x N + b 1 ) . . . g ( w M · x N + b M ) N × M - - - ( 5 )
β = β 1 T . . . β M T M × m , T = t 1 T . . . t N T N × m
H称为神经网络的隐层输出矩阵,H的第i行对应于所有隐藏节点对第i个训练输入xi的输出向量,而H中的第j列是第j个隐层节点对应于输入样本xk,k=1,2,…,N的输出向量。
求解如下线性方程组的广义最小二乘获得
| | H β ^ - T | | = min β | | Hβ - T | | - - - ( 6 )
上述线性方程组的广义最小二乘解为
β ^ = arg min β | | Hβ - T | | = H + T - - - ( 7 )
其中H+=(HTH)-1HT为隐层输出矩阵H的Moore-Penrose广义逆。
表1两类分类测试正确率
表2各类样本两类划分情况
  自然场景 人造场景 正确率
海滩(260) 242 18 93%
森林(228) 220 8 96%
山脉(274) 260 14 94%
户外(310) 292 18 94%
高速(160) 36 124 77%
城区(208) 5 203 97%
街道(192) 9 183 95%
高楼(256) 11 245 95%
表3多类分类测试正确率
训练样本数 训练正确率 训练时间 测试样本数 测试正确率 测试时间
800 1 11.5129 1888 75.58% 3.042
表4各类样本多类分类划分情况

Claims (1)

1.基于Gist特征与极限学习机的场景分类方法,其特征在于包括
以下步骤:A图像Gist特征提取:
采用Gabor小波对场景图像进行卷积操作,然后提取Gist向量作为场景图像的特征描述,将此特征描述用于接下来的场景分类当中,具体过程为:
一幅大小为r×c的灰度图像f(x,y)用m尺度n方向的Gabor滤波器组进行滤波,即分别同nc个通道的滤波器进行卷积,其中nc=m×n,再级联卷积的结果,即为图像Gist特征,将一副大小为r×c的灰度图像f(x,y)划分成np×np的规则网格,各网格块按行依次记作Pi,其中i=1,...,ng;每个网格块大小为r'×c',分别用nc个通道的滤波器对图像进行卷积滤波,则每个网格块各通道滤波后,级联的结果称为块Gist特征,用GP表示每个网格块的Gist特征,对GP块各通道滤波结果取均值后按行组合的结果为全局Gist特征,用GG表示全局Gist特征:
G G = { G 1 P ‾ , G 2 P ‾ , · · · , G n g P ‾ } - - - ( 1 )
式中, G i P ‾ = 1 r ′ × c ′ Σ ( x , y ) ∈ P i G i P ( x , y ) , GG的维数为nc×ng
B极限学习机对Gist特征进行学习完成图像分类:
设P个不同的训练样本为(xi,ti),其中xi=[xi1,xi2,...,xin]T∈Rn且ti=[ti1,ti2,...,tim]T∈Rm,i=1,2,...,N,学习网络建模为:
Σ j = 1 M β j g j ( x i ) = Σ j = 1 M β j g ( w j · x i + b j ) = o i , i = 1,2 , . . . , N - - - ( 2 )
其中,M是隐藏节点的个数,g(·)为激励函数,选用hardlim或hardlims,wj=[wj1,wj2,...,wjn]T∈Rn是输入节点与第j个隐藏节点的连接权重,bj∈R是第j个隐藏节点的偏置,βj=[βj1j2,...,βjm]T∈Rm是输出节点与第j个隐藏节点的连接权重,wj·xi表示wj和xi的内积;
输入连接权重和隐层节点偏置(w,b)可随机选择,通过学习找到特定的βj,j=1,2,...,M使得分类总误差最小:
min||ε||2,s.t.εi=ti-oi,i=1,2,...,N            (3)其中,εi=[εi1i2,...,εin]T是第i个样本输出值与真实值间的差值;(3)式中,oi是输出值,是Gist特征输入后网络输出的值,ti是真实值,是类别的值;
假设合理训练的隐层前馈神经网络SLFN能够无误差地逼近N个训练样本,式(3)改写为:
Hβ=T或||Hβ-T||=0                 (4)
其中,
H = g ( w 1 · x 1 + b 1 ) . . . g ( w M · x 1 + b M ) g ( w 1 · x 2 + b 1 ) . . . g ( w M · x 2 + b M ) . . . . . . . . . g ( w 1 · x N + b 1 ) . . . g ( w M · x N + b N ) N × M - - - ( 5 )
β = β 1 t . . . β M T M × m , T = t 1 T . . . t N T N × m
H称为神经网络的隐层输出矩阵,H的第i行对应于所有隐藏节点对第i个训练输入xi的输出向量,而H中的第j列是第j个隐层节点对应于输入样本xk,k=1,2,...,N的输出向量;
求解如下线性方程组的广义最小二乘获得
| | H β ^ - T | | = min β | | Hβ - T | | - - - ( 6 )
上述线性方程组的广义最小二乘解为
β ^ = arg min β | | Hβ - T | | = H + T - - - ( 7 )
其中H+=(HTH)-1HT为隐层输出矩阵H的Moore-Penrose广义逆;
得到了后,测试网络就形成了,然后输入测试图片的Gist特征,进行测试分类,代入Hβ=O,求输出值o,与各类设置的类别的标签对比进行归类,确定所属类别。
CN201410840024.8A 2014-12-30 2014-12-30 基于Gist特征与极限学习机的场景分类方法 Expired - Fee Related CN104598920B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410840024.8A CN104598920B (zh) 2014-12-30 2014-12-30 基于Gist特征与极限学习机的场景分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410840024.8A CN104598920B (zh) 2014-12-30 2014-12-30 基于Gist特征与极限学习机的场景分类方法

Publications (2)

Publication Number Publication Date
CN104598920A true CN104598920A (zh) 2015-05-06
CN104598920B CN104598920B (zh) 2016-05-18

Family

ID=53124692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410840024.8A Expired - Fee Related CN104598920B (zh) 2014-12-30 2014-12-30 基于Gist特征与极限学习机的场景分类方法

Country Status (1)

Country Link
CN (1) CN104598920B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104799852A (zh) * 2015-05-19 2015-07-29 北京工业大学 基于超限学习机自编码的运动想象脑电信号特征的提取方法
CN105205491A (zh) * 2015-08-19 2015-12-30 西安电子科技大学 基于极限学习机的极化sar图像分类方法
CN106874961A (zh) * 2017-03-03 2017-06-20 北京奥开信息科技有限公司 一种采用基于局部感受野的极速学习机的室内场景识别方法
CN107154021A (zh) * 2017-05-03 2017-09-12 西安电子科技大学 基于深层门限卷积神经网络的图像超分辨方法
CN107194437A (zh) * 2017-06-22 2017-09-22 重庆大学 基于Gist特征提取与概念机递归神经网络的图像分类方法
CN109782091A (zh) * 2019-01-30 2019-05-21 西华大学 基于深度小波极限学习机的多电平逆变器故障诊断方法
CN110334234A (zh) * 2019-07-15 2019-10-15 深圳市祈锦通信技术有限公司 一种风景图片分类方法及其装置
CN111144325A (zh) * 2019-12-28 2020-05-12 广东电网有限责任公司 变电站电力设备的故障识别定位方法、装置及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814147A (zh) * 2010-04-12 2010-08-25 中国科学院自动化研究所 一种实现场景图像的分类方法
CN103646255A (zh) * 2013-11-13 2014-03-19 扬州西岐自动化科技有限公司 一种基于Gabor特征和极限学习机的人脸检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101814147A (zh) * 2010-04-12 2010-08-25 中国科学院自动化研究所 一种实现场景图像的分类方法
CN103646255A (zh) * 2013-11-13 2014-03-19 扬州西岐自动化科技有限公司 一种基于Gabor特征和极限学习机的人脸检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
杨昭等: "局部Gist特征匹配核的场景分类", 《中国图象图形学报》 *
杨晶晶: "在线极限学习机及其在图像识别中的应用", 《电子产品世界》 *
陈海挺: "改进蝙蝠算法优化极限学习机的图像分类", 《激光杂志》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104799852A (zh) * 2015-05-19 2015-07-29 北京工业大学 基于超限学习机自编码的运动想象脑电信号特征的提取方法
CN105205491A (zh) * 2015-08-19 2015-12-30 西安电子科技大学 基于极限学习机的极化sar图像分类方法
CN106874961A (zh) * 2017-03-03 2017-06-20 北京奥开信息科技有限公司 一种采用基于局部感受野的极速学习机的室内场景识别方法
CN107154021A (zh) * 2017-05-03 2017-09-12 西安电子科技大学 基于深层门限卷积神经网络的图像超分辨方法
CN107154021B (zh) * 2017-05-03 2019-08-13 西安电子科技大学 基于深层门限卷积神经网络的图像超分辨方法
CN107194437A (zh) * 2017-06-22 2017-09-22 重庆大学 基于Gist特征提取与概念机递归神经网络的图像分类方法
CN107194437B (zh) * 2017-06-22 2020-04-07 重庆大学 基于Gist特征提取与概念机递归神经网络的图像分类方法
CN109782091A (zh) * 2019-01-30 2019-05-21 西华大学 基于深度小波极限学习机的多电平逆变器故障诊断方法
CN110334234A (zh) * 2019-07-15 2019-10-15 深圳市祈锦通信技术有限公司 一种风景图片分类方法及其装置
CN110334234B (zh) * 2019-07-15 2022-03-18 深圳市祈锦通信技术有限公司 一种风景图片分类方法及其装置
CN111144325A (zh) * 2019-12-28 2020-05-12 广东电网有限责任公司 变电站电力设备的故障识别定位方法、装置及设备

Also Published As

Publication number Publication date
CN104598920B (zh) 2016-05-18

Similar Documents

Publication Publication Date Title
CN104598920B (zh) 基于Gist特征与极限学习机的场景分类方法
CN108647742B (zh) 基于轻量级神经网络的快速目标检测方法
CN110210486B (zh) 一种基于素描标注信息的生成对抗迁移学习方法
CN109740686A (zh) 一种基于区域池化和特征融合的深度学习图像多标记分类方法
CN108108699A (zh) 融合深度神经网络模型和二进制哈希的人体动作识别方法
CN110533024B (zh) 基于多尺度roi特征的双二次池化细粒度图像分类方法
CN104778476B (zh) 一种图像分类方法
CN105205475A (zh) 一种动态手势识别方法
CN112016601B (zh) 基于知识图谱增强小样本视觉分类的网络模型构建方法
CN106408030A (zh) 基于中层语义属性和卷积神经网络的sar图像分类方法
CN102915448B (zh) 一种基于AdaBoost的三维模型自动分类方法
CN103390046A (zh) 潜在狄利克雷模型的多尺度字典自然场景图像分类方法
CN107767416A (zh) 一种低分辨率图像中行人朝向的识别方法
CN102122353A (zh) 利用增量字典学习与稀疏表示进行图像分割的方法
CN104820702B (zh) 一种基于决策树的属性加权方法及文本分类方法
CN107316059A (zh) 学习者姿态识别方法
CN111241933A (zh) 一种基于通用对抗扰动的养猪场目标识别方法
CN104978569A (zh) 一种基于稀疏表示的增量人脸识别方法
CN107220656A (zh) 一种基于自适应特征降维的多标记数据分类方法
CN110517270A (zh) 一种基于超像素深度网络的室内场景语义分割方法
CN104021395B (zh) 一种基于高阶偏最小二乘法的目标跟踪算法
CN104376312B (zh) 基于词袋压缩感知特征提取的人脸识别方法
CN111739037A (zh) 一种针对室内场景rgb-d图像的语义分割方法
CN114119669A (zh) 一种基于Shuffle注意力的图匹配目标跟踪方法与系统
CN104200220B (zh) 一种基于静态纹理模型聚集的动态纹理识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160518

Termination date: 20181230

CF01 Termination of patent right due to non-payment of annual fee