CN108427967B - 一种实时影像聚类方法 - Google Patents

一种实时影像聚类方法 Download PDF

Info

Publication number
CN108427967B
CN108427967B CN201810206731.XA CN201810206731A CN108427967B CN 108427967 B CN108427967 B CN 108427967B CN 201810206731 A CN201810206731 A CN 201810206731A CN 108427967 B CN108427967 B CN 108427967B
Authority
CN
China
Prior art keywords
image
neuron
activated
descriptor
local feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810206731.XA
Other languages
English (en)
Other versions
CN108427967A (zh
Inventor
范大昭
董杨
纪松
欧阳欢
雷蓉
古林玉
李东子
苏亚龙
申二华
李奇峻
孙晓昱
贺蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information Engineering University of PLA Strategic Support Force
Original Assignee
Information Engineering University of PLA Strategic Support Force
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information Engineering University of PLA Strategic Support Force filed Critical Information Engineering University of PLA Strategic Support Force
Priority to CN201810206731.XA priority Critical patent/CN108427967B/zh
Publication of CN108427967A publication Critical patent/CN108427967A/zh
Application granted granted Critical
Publication of CN108427967B publication Critical patent/CN108427967B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种实时影像聚类方法,包括以下步骤:A、批量输入影像,通过边缘特征提取获得影像全局描述符;B、通过低分辨率影像特征提取获得影像局部特征描述符;C、输入影像全局描述符和影像局部特征描述符;D、创建三层自组织映射神经网络,利用影像全局描述符选取前N个竞争层神经元进入激活状态;E、计算影像局部特征描述符与每个激活神经元下的各个神经末梢间的距离,获得整体响应成功的激活神经元;F、根据整体响应成功的激活神经元的个数进行影像的聚类以及激活神经元的学习或合并,或者利用影像全局描述符和影像局部特征描述符创建新的竞争层神经元。本发明从整体上提高影像聚类结果的准确性与聚类过程的实时性和稳定性。

Description

一种实时影像聚类方法
技术领域
本发明涉及摄影测量与遥感测绘技术领域,尤其涉及一种实时影像聚类方法。
背景技术
近年来,信息网络技术的广泛应用不断推动生活方式发生变化,互联网、物联网、知识服务、智能服务已成为人们生活必不可少的一部分,由此也组成了一个庞大的微型传感器网络,产生了难以计量的非结构化影像数据。这些影像数据类型复杂、体量巨大、时效性较强,具有明显的大数据表象,已成为一个重要的研究对象。处理这些不精确、非结构化的影像大数据的首要一步是进行影像间的自主聚类,找出同一目标区域具有相似内容的影像集合。进行影像间的聚类可大致分为两个步骤:一是生成影像全局描述符,二是利用相应聚类方法进行影像描述符的聚类。
关于影像的全局描述符,一般是通过影像的局部描述符聚合整理得到,有不少学者进行了相关研究。Csurka等人提出利用视觉词袋模型(Bag ofwords,BoW)生成全局描述符,其简单、有效近年来得到了广泛应用;Lazebnik等人提出利用空间金字塔匹配(Spatialpyramid matching,SPM)进行局部描述符聚合,有效的补充了视觉词袋模型中的空间信息,使描述子的描述能力得到增强;Yang等人将稀疏编码(Sparse coding)用于影像全局描述,使整体算法的训练复杂度得到大幅降低;Wang等人提出了局部约束线性编码(Localityconstrained linear encoding,LLC)进行影像描述,进一步降低了算法时间复杂度,其整体性能也有所提升;Perronnin等人将Fisher编码(Fisher coding)运用在了影像检索与聚类领域,并进行了一些改进;Russakovsky等人则提出以目标物体为中心的空间聚合编码方法,突出了目标区域的编码表达;Alex等人提出了一种通过卷积神经网络进行海量影像编码与分类的算法,并在超大数据集上取得了较好的试验结果。关于影像的聚类方法,按照聚类特性可分为不同的种类,主要包括以下几种类型:基于划分的聚类算法,如k-means算法等;基于层次的聚类算法,如CURE(Clustering Using Representatives)算法等;基于密度的聚类算法,如DBSCAN(Density-Based Spatial Clustering ofApplications withNoise)算法等;基于网格的聚类算法,如STING(Statistical Information Grid)算法等;基于模型的聚类算法,如SOM(Self-organizing feature map)算法等。现行的影像全局描述方式虽在一定程度上能够较好的表征原始影像,但仍缺乏原始影像的语义信息。因此,如何生成具有优良性质的影像全局描述符,使影像编码包含一定的语义信息,且具有明显的类间特征和较好的类内描述,仍是当今研究的热点。另外,当前聚类算法的计算正确率与实时性仍有待提高,如何将神经网络更好的引入当前算法之中,以提升聚类的正确率与实时性是值得研究的问题。
发明内容
本发明的目的在于提供一种实时影像聚类方法,能够提高影像整体聚类结果的准确性,同时提高聚类过程的实时性和稳定性。
为实现上述目的,本发明采用的技术方案是:
一种实时影像聚类方法,包括以下步骤:
A、对影像进行SIFT特征提取,得到特征点集合T1,对集合T1中的特征点进行边缘点检测,得到边缘点描述符集合Q1,利用VLAD算法对集合Q1进行聚合,得到聚合描述符u1
B、对影像进行空间金字塔降采样,然后进行SIFT特征提取,得到降采样影像描述符集合Q2,利用VLAD算法对降采样影像描述符集合Q2进行聚合,得到聚合描述符u2
C、将聚合描述符u1作为影像全局描述符x={x1,x2,……,xm},其中x为单个矢量,m为其维度,将聚合描述符u2作为影像局部特征描述符Y={y1,y2,……,yn},其中Y为矢量集合,n为影像局部特征点的个数,yi={γ12,……,γh}为第i个影像局部特征的描述符,维度为h,i=1,2,……,n;
D、将影像全局描述符和影像局部特征描述符输入自组织映射神经网络,并创建自组织映射神经网络的竞争层神经元,分别对每个竞争层神经元创建响应层神经末梢,然后计算影像全局描述符与每个竞争层神经元连接权重间的距离,将得到的距离最近的前N个竞争层神经元作为激活神经元;
E、采用激活神经元对集合Y中的各个影像局部特征描述符进行响应,对于任意一个影像局部特征描述符yi,分别计算其与每个激活神经元下的各个神经末梢权值间的距离,即
Figure BDA0001595592370000031
li,jk为影像局部特征描述符yi与第j个激活神经元下的第k个神经末梢的权值间的距离,
Figure BDA0001595592370000041
为第j个激活神经元下的第k个神经末梢的权值,当距离li,jk小于阈值α时,判定第j个激活神经元下的第k个神经末梢对影像局部特征描述符yi响应成功,则第j个激活神经元下的其余神经末梢不再对影像局部特征描述符yi进行响应,当所有激活神经元的神经末梢分别对集合Y中的各个影像局部特征描述符进行响应后,分别统计同一激活神经元下的神经末梢响应成功的次数,当一个激活神经元下的神经末梢响应成功的次数大于阈值β时,判定该激活神经元整体响应成功;
F、若有一个激活神经元整体响应成功,则将影像划为该激活神经元对应的聚类,并且该激活神经元及其下的神经末梢利用一定学习效率进行学习,然后返回步骤A对其他影像进行聚类;若有多个激活神经元整体响应成功,则将影像划为神经末梢响应成功次数最多的激活神经元对应的聚类,同时将所有整体响应成功的激活神经元标记为待合并神经元,并将影像标记为连接影像,将标记的待合并神经元进行合并,然后返回步骤A对其他影像进行聚类;若没有激活神经元整体响应成功,则利用影像全局描述符和影像局部特征描述符创建新的竞争层神经元及该竞争层神经元下的神经末梢,然后返回步骤A对其他影像进行聚类。
所述的步骤F中,一个激活神经元及其下的神经末梢利用一定学习效率进行学习时,利用影像全局描述符更新该激活神经元的连接权重,利用获得神经末梢响应的影像局部特征描述符更新该激活神经元相应的神经末梢的权值,即
Figure BDA0001595592370000051
Figure BDA0001595592370000052
其中,t为学习次数,t=1,2,3,……,χ为学习效率,Δωj(t)为第j个激活神经元进行第t次学习时的连接权重变量,χj(t)为第j个激活神经元进行第t次学习时的学习效率,ωj为第j个激活神经元的连接权重,
Figure BDA0001595592370000055
为第j个激活神经元下的第k个神经末梢进行第t次学习时的权值变量,χjk(t)为第j个激活神经元下的第k个神经末梢进行第t次学习时的学习效率,yg为获得神经末梢响应的影像局部特征描述符,ωj(t+1)为第j个激活神经元进行第t次学习后的连接权重,ωj(1)=ωj
Figure BDA0001595592370000057
为第j个激活神经元下的第k个神经末梢进行第t次学习后的权值,
Figure BDA0001595592370000056
每次学习后该激活神经元及其下的神经末梢的学习效率χ以一定的步长δ下降,即
Figure BDA0001595592370000053
Figure BDA0001595592370000054
其中,δ为每次学习效率递减的步长,m为学习效率下降次数上限,且应满足m≤χj(1)/δ,E为终止学习效率;
若有影像局部特征描述符未能获得该激活神经元下的神经末梢响应,则利用所述影像局部特征描述符生成该激活神经元下新的神经末梢,即
Figure BDA0001595592370000062
式中
Figure BDA0001595592370000063
为生成的第j个激活神经元下的第p个神经末梢的权值,χjp为生成第j个激活神经元下的第p个神经末梢的学习效率,yd为未能获得神经末梢响应的影像局部特征描述符。
所述的步骤F中,利用影像全局描述符和影像局部特征描述符创建新的竞争层神经元及该竞争层神经元下的神经末梢,即
Figure BDA0001595592370000061
式中ωr为创建的第r个竞争层神经元的连接权重,χr为创建第r个竞争层神经元的学习效率,
Figure BDA0001595592370000064
为创建的第r个竞争层神经元下的第q个神经末梢的权值,χrq为创建第r个竞争层神经元下的第q个神经末梢的学习效率。
所述的步骤F中,对标记的待合并神经元进行合并时,将所有待合并神经元的连接权重的平均值作为合并后的神经元的连接权重,将所有待合并神经元的神经末梢作为合并后的神经元的神经末梢。
还包括步骤G,在对影像进行聚类的过程中,每隔一段时间统计各个激活神经元对应的聚类中包含影像的个数,若某个激活神经元对应的聚类中包含影像的个数小于设定阈值ρ,则将该激活神经元从自组织映射神经网络中剔除。
本发明首先对影像进行边缘提取,利用边缘点特征描述符生成影像全局描述符,使得到的描述符包含较强的语义与细节描述信息,同时利用影像金字塔的低分辨率生成影像全局描述符,使得到的描述符包含整体场景信息;然后对两个描述符进行组合,从而得到既具有影像整体场景信息又具有较强细节信息的综合描述符;最后由于得到的综合描述符为高维数据,因此对自组织映射神经网络进行改进,引入响应层神经末梢,得到一种三层的实时自组织特征映射神经网络聚类算法,从而完成大数据影像的快速聚类;
本发明在影像综合描述符生成期间考虑了影像中包含的语义信息,使影像具有较好的类内描述能力与类间鉴别能力,从而提高了后续影像聚类结果的准确性;在描述符聚类期间,引入了响应层,简化了输入参数,去掉了预先训练过程,从而提高了整体聚类结果的准确性与聚类过程的实时性和稳定性。
附图说明
图1为本发明的流程图。
具体实施方式
如图1所示,本发明所述的一种实时影像聚类方法,包括以下步骤:
A、对影像进行SIFT(Scale Invariant Feature Transform,尺度不变特征变换)特征提取,得到特征点集合T1,对集合T1中的特征点进行边缘点检测,得到边缘点描述符集合Q1,利用VLAD(Vector of LocallyAggregated Descriptors,局部聚合描述符向量)算法对集合Q1进行聚合,得到聚合描述符u1
由于聚合描述符u1利用影像的边缘点特征生成,包含了较强的语义信息与细节描述信息,具有较好的类内描述能力和类间鉴别能力,有利于提高后续影像聚类的准确性。
B、对影像进行空间金字塔降采样,然后进行SIFT特征提取,得到降采样影像描述符集合Q2,利用VLAD算法对降采样影像描述符集合Q2进行聚合,得到聚合描述符u2。聚合描述符u2利用影像金字塔的低分辨率影像生成,包含整体场景信息。
C、将聚合描述符u1作为影像全局描述符x={x1,x2,……,xm},其中x为单个矢量,m为其维度,将聚合描述符u2作为影像局部特征描述符Y={y1,y2,……,yn},其中Y为矢量集合,n为影像局部特征点的个数,yi={γ12,……,γh}为第i个影像局部特征的描述符,维度为h,i=1,2,……,n。
D、将影像全局描述符和影像局部特征描述符输入自组织映射神经网络,并创建自组织映射神经网络的竞争层神经元,分别对每个竞争层神经元创建响应层神经末梢,然后计算影像全局描述符与每个竞争层神经元连接权重间的距离,将得到的距离最近的前N个竞争层神经元作为激活神经元。
E、采用激活神经元对集合Y中的各个影像局部特征描述符进行响应,对于任意一个影像局部特征描述符yi,分别计算其与每个激活神经元下的各个神经末梢权值间的距离,即
Figure BDA0001595592370000081
li,jk为影像局部特征描述符yi与第j个激活神经元下的第k个神经末梢的权值间的距离,
Figure BDA0001595592370000082
为第j个激活神经元下的第k个神经末梢的权值,当距离li,jk小于阈值α时,判定第j个激活神经元下的第k个神经末梢对影像局部特征描述符yi响应成功,则第j个激活神经元下的其余神经末梢不再对影像局部特征描述符yi进行响应,即一个激活神经元下的各个神经末梢最多对一个影像局部特征描述符响应成功一次。
以上为判定某个激活神经元下的神经末梢对某个影像局部特征描述符响应成功的方式,当所有激活神经元的神经末梢分别对集合Y中的各个影像局部特征描述符进行响应后,分别统计同一激活神经元下的神经末梢响应成功的次数,也就是集合Y中获得某个激活神经元下的神经末梢响应成功的影像局部特征描述符的个数。当一个激活神经元下的神经末梢响应成功的次数大于阈值β时,判定该激活神经元整体响应成功。
F、若有一个激活神经元整体响应成功,则将影像划为该激活神经元对应的聚类,并且该激活神经元及其下的神经末梢利用一定学习效率进行学习,然后返回步骤A对其他影像进行聚类;
若有多个激活神经元整体响应成功,则将影像划为神经末梢响应成功次数最多的激活神经元对应的聚类,同时将所有整体响应成功的激活神经元标记为待合并神经元,并将影像标记为连接影像,将标记的待合并神经元进行合并后,即将所有待合并神经元的连接权重的平均值作为合并后的神经元的连接权重,将所有待合并神经元的神经末梢作为合并后的神经元的神经末梢,然后返回步骤A对其他影像进行聚类;
若没有激活神经元整体响应成功,则利用影像全局描述符和影像局部特征描述符创建新的竞争层神经元及该竞争层神经元下的神经末梢,即
Figure BDA0001595592370000101
式中ωr为创建的第r个竞争层神经元的连接权重,χr为创建第r个竞争层神经元的学习效率,
Figure BDA0001595592370000102
为创建的第r个竞争层神经元下的第q个神经末梢的权值,χrq为创建第r个竞争层神经元下的第q个神经末梢的学习效率,然后返回步骤A对其他影像进行聚类。
其中,一个激活神经元及其下的神经末梢利用一定学习效率进行学习时,利用影像全局描述符更新该激活神经元的连接权重,利用获得神经末梢响应的影像局部特征描述符更新该激活神经元相应的神经末梢的权值,即
Figure BDA0001595592370000103
Figure BDA0001595592370000104
其中,t为学习次数,t=1,2,3,……,χ为学习效率,Δωj(t)为第j个激活神经元进行第t次学习时的连接权重变量,χj(t)为第j个激活神经元进行第t次学习时的学习效率,ωj为第j个激活神经元的连接权重,
Figure BDA0001595592370000105
为第j个激活神经元下的第k个神经末梢进行第t次学习时的权值变量,χjk(t)为第j个激活神经元下的第k个神经末梢进行第t次学习时的学习效率,yg为获得神经末梢响应的影像局部特征描述符,ωj(t+1)为第j个激活神经元进行第t次学习后的连接权重,ωj(1)=ωj
Figure BDA0001595592370000106
为第j个激活神经元下的第k个神经末梢进行第t次学习后的权值,
Figure BDA0001595592370000107
每次学习后该激活神经元及其下的神经末梢的学习效率χ以一定的步长δ下降,即
Figure BDA0001595592370000111
Figure BDA0001595592370000112
其中,δ为每次学习效率递减的步长,m为学习效率下降次数上限,且应满足m≤χj(1)/δ,E为终止学习效率。
若有影像局部特征描述符未能获得该激活神经元下的神经末梢响应,则利用所述影像局部特征描述符生成该激活神经元下新的神经末梢,即
Figure BDA0001595592370000113
式中
Figure BDA0001595592370000114
为生成的第j个激活神经元下的第p个神经末梢的权值,χjp为生成第j个激活神经元下的第p个神经末梢的学习效率,yd为未能获得神经末梢响应的影像局部特征描述符。
本发明在进行影像聚类时,可以一次载入批量影像,并对各个影像按照上述方法同步进行聚类处理,最后返回载入下批影像进行处理。在上述循环对影像进行聚类的过程中,每隔一段时间统计各个激活神经元对应的聚类中包含影像的个数,若某个激活神经元对应的聚类中包含影像的个数小于设定阈值ρ,则将该激活神经元从自组织映射神经网络中剔除,直至全部数据处理完毕。

Claims (5)

1.一种实时影像聚类方法,其特征在于,包括以下步骤:
A、对影像进行SIFT特征提取,得到特征点集合T1,对集合T1中的特征点进行边缘点检测,得到边缘点描述符集合Q1,利用VLAD算法对集合Q1进行聚合,得到聚合描述符u1
B、对影像进行空间金字塔降采样,然后进行SIFT特征提取,得到降采样影像描述符集合Q2,利用VLAD算法对降采样影像描述符集合Q2进行聚合,得到聚合描述符u2
C、将聚合描述符u1作为影像全局描述符x={x1,x2,……,xm},其中x为单个矢量,m为其维度,将聚合描述符u2作为影像局部特征描述符Y={y1,y2,……,yn},其中Y为矢量集合,n为影像局部特征点的个数,yi={γ12,……,γh}为第i个影像局部特征的描述符,维度为h,i=1,2,……,n;
D、将影像全局描述符和影像局部特征描述符输入自组织映射神经网络,并创建自组织映射神经网络的竞争层神经元,分别对每个竞争层神经元创建响应层神经末梢,然后计算影像全局描述符与每个竞争层神经元连接权重间的距离,将得到的距离最近的前N个竞争层神经元作为激活神经元;
E、采用激活神经元对集合Y中的各个影像局部特征描述符进行响应,对于任意一个影像局部特征描述符yi,分别计算其与每个激活神经元下的各个神经末梢权值间的距离,即
Figure FDA0001595592360000011
li,jk为影像局部特征描述符yi与第j个激活神经元下的第k个神经末梢的权值间的距离,
Figure FDA0001595592360000021
为第j个激活神经元下的第k个神经末梢的权值,当距离li,jk小于阈值α时,判定第j个激活神经元下的第k个神经末梢对影像局部特征描述符yi响应成功,则第j个激活神经元下的其余神经末梢不再对影像局部特征描述符yi进行响应,当所有激活神经元的神经末梢分别对集合Y中的各个影像局部特征描述符进行响应后,分别统计同一激活神经元下的神经末梢响应成功的次数,当一个激活神经元下的神经末梢响应成功的次数大于阈值β时,判定该激活神经元整体响应成功;
F、若有一个激活神经元整体响应成功,则将影像划为该激活神经元对应的聚类,并且该激活神经元及其下的神经末梢利用一定学习效率进行学习,然后返回步骤A对其他影像进行聚类;若有多个激活神经元整体响应成功,则将影像划为神经末梢响应成功次数最多的激活神经元对应的聚类,同时将所有整体响应成功的激活神经元标记为待合并神经元,并将影像标记为连接影像,将标记的待合并神经元进行合并,然后返回步骤A对其他影像进行聚类;若没有激活神经元整体响应成功,则利用影像全局描述符和影像局部特征描述符创建新的竞争层神经元及该竞争层神经元下的神经末梢,然后返回步骤A对其他影像进行聚类。
2.如权利要求1所述的一种实时影像聚类方法,其特征在于:所述的步骤F中,一个激活神经元及其下的神经末梢利用一定学习效率进行学习时,利用影像全局描述符更新该激活神经元的连接权重,利用获得神经末梢响应的影像局部特征描述符更新该激活神经元相应的神经末梢的权值,即
Figure FDA0001595592360000031
Figure FDA0001595592360000032
其中,t为学习次数,t=1,2,3,……,χ为学习效率,Δωj(t)为第j个激活神经元进行第t次学习时的连接权重变量,χj(t)为第j个激活神经元进行第t次学习时的学习效率,ωj为第j个激活神经元的连接权重,
Figure FDA0001595592360000033
为第j个激活神经元下的第k个神经末梢进行第t次学习时的权值变量,χjk(t)为第j个激活神经元下的第k个神经末梢进行第t次学习时的学习效率,yg为获得神经末梢响应的影像局部特征描述符,ωj(t+1)为第j个激活神经元进行第t次学习后的连接权重,ωj(1)=ωj
Figure FDA0001595592360000034
为第j个激活神经元下的第k个神经末梢进行第t次学习后的权值,
Figure FDA0001595592360000035
每次学习后该激活神经元及其下的神经末梢的学习效率χ以一定的步长δ下降,即
Figure FDA0001595592360000036
Figure FDA0001595592360000037
其中,δ为每次学习效率递减的步长,m为学习效率下降次数上限,且应满足m≤χj(1)/δ,E为终止学习效率;
若有影像局部特征描述符未能获得该激活神经元下的神经末梢响应,则利用所述影像局部特征描述符生成该激活神经元下新的神经末梢,即
Figure FDA0001595592360000041
式中
Figure FDA0001595592360000042
为生成的第j个激活神经元下的第p个神经末梢的权值,χjp为生成第j个激活神经元下的第p个神经末梢的学习效率,yd为未能获得神经末梢响应的影像局部特征描述符。
3.如权利要求1所述的一种实时影像聚类方法,其特征在于:所述的步骤F中,
利用影像全局描述符和影像局部特征描述符创建新的竞争层神经元及该竞争层神经元下的神经末梢,即
Figure FDA0001595592360000043
式中ωr为创建的第r个竞争层神经元的连接权重,χr为创建第r个竞争层神经元的学习效率,
Figure FDA0001595592360000044
为创建的第r个竞争层神经元下的第q个神经末梢的权值,χrq为创建第r个竞争层神经元下的第q个神经末梢的学习效率。
4.如权利要求1所述的一种实时影像聚类方法,其特征在于:所述的步骤F中,对标记的待合并神经元进行合并时,将所有待合并神经元的连接权重的平均值作为合并后的神经元的连接权重,将所有待合并神经元的神经末梢作为合并后的神经元的神经末梢。
5.如权利要求1所述的一种实时影像聚类方法,其特征在于:还包括步骤G,在对影像进行聚类的过程中,每隔一段时间统计各个激活神经元对应的聚类中包含影像的个数,若某个激活神经元对应的聚类中包含影像的个数小于设定阈值ρ,则将该激活神经元从自组织映射神经网络中剔除。
CN201810206731.XA 2018-03-13 2018-03-13 一种实时影像聚类方法 Active CN108427967B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810206731.XA CN108427967B (zh) 2018-03-13 2018-03-13 一种实时影像聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810206731.XA CN108427967B (zh) 2018-03-13 2018-03-13 一种实时影像聚类方法

Publications (2)

Publication Number Publication Date
CN108427967A CN108427967A (zh) 2018-08-21
CN108427967B true CN108427967B (zh) 2021-08-27

Family

ID=63157950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810206731.XA Active CN108427967B (zh) 2018-03-13 2018-03-13 一种实时影像聚类方法

Country Status (1)

Country Link
CN (1) CN108427967B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919744B (zh) * 2018-11-23 2023-01-10 创新先进技术有限公司 基于神经网络的检测方法以及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1808474A (zh) * 2006-03-02 2006-07-26 哈尔滨工业大学 基于自组织映射网络的文档聚类方法
CN101576913A (zh) * 2009-06-12 2009-11-11 中国科学技术大学 基于自组织映射神经网络的舌象自动聚类、可视化和检索系统
CN102789593A (zh) * 2012-06-18 2012-11-21 北京大学 基于增量式ghsom神经网络的入侵检测方法
CN103488662A (zh) * 2013-04-01 2014-01-01 哈尔滨工业大学深圳研究生院 基于图形处理单元的自组织映射神经网络聚类方法及系统
CN104298974A (zh) * 2014-10-10 2015-01-21 北京工业大学 一种基于深度视频序列的人体行为识别方法
CN105117488A (zh) * 2015-09-19 2015-12-02 大连理工大学 一种基于混合层次聚类的rdf数据平衡分割算法
CN105117407A (zh) * 2015-07-27 2015-12-02 电子科技大学 一种基于聚类的距离方向直方图的图像检索方法
CN105719285A (zh) * 2016-01-19 2016-06-29 东南大学 一种基于方向倒角距离特征的行人检测方法
CN105737805A (zh) * 2016-01-29 2016-07-06 范大昭 卫星立体影像自适应制作方法
CN107392887A (zh) * 2017-06-16 2017-11-24 西北工业大学 一种基于同质像素点转化的异质遥感图像变化检测方法
CN107657266A (zh) * 2017-08-03 2018-02-02 华北电力大学(保定) 一种基于改进谱多流形聚类的负荷曲线聚类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7840076B2 (en) * 2006-11-22 2010-11-23 Intel Corporation Methods and apparatus for retrieving images from a large collection of images

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1808474A (zh) * 2006-03-02 2006-07-26 哈尔滨工业大学 基于自组织映射网络的文档聚类方法
CN101576913A (zh) * 2009-06-12 2009-11-11 中国科学技术大学 基于自组织映射神经网络的舌象自动聚类、可视化和检索系统
CN102789593A (zh) * 2012-06-18 2012-11-21 北京大学 基于增量式ghsom神经网络的入侵检测方法
CN103488662A (zh) * 2013-04-01 2014-01-01 哈尔滨工业大学深圳研究生院 基于图形处理单元的自组织映射神经网络聚类方法及系统
CN104298974A (zh) * 2014-10-10 2015-01-21 北京工业大学 一种基于深度视频序列的人体行为识别方法
CN105117407A (zh) * 2015-07-27 2015-12-02 电子科技大学 一种基于聚类的距离方向直方图的图像检索方法
CN105117488A (zh) * 2015-09-19 2015-12-02 大连理工大学 一种基于混合层次聚类的rdf数据平衡分割算法
CN105719285A (zh) * 2016-01-19 2016-06-29 东南大学 一种基于方向倒角距离特征的行人检测方法
CN105737805A (zh) * 2016-01-29 2016-07-06 范大昭 卫星立体影像自适应制作方法
CN107392887A (zh) * 2017-06-16 2017-11-24 西北工业大学 一种基于同质像素点转化的异质遥感图像变化检测方法
CN107657266A (zh) * 2017-08-03 2018-02-02 华北电力大学(保定) 一种基于改进谱多流形聚类的负荷曲线聚类方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Locality-constrained linear coding for image classification;Jinjun Wang et al;《IEEE》;20101231;第3360-3367页 *
Self-organization in communication networks:principles and design paradigms;Christian Prehofer et al;《IEEE》;20050731;第78-85页 *
一种基于自组织特征映射网络的聚类方法;陈泯融 等;《系统工程与电子技术》;20041231;第26卷(第12期);第1864-1866页 *
基于深度卷积特征的图像实例检索方法;李振东 等;《吉林大学学报(工学版)》;20180312;第42卷(第1期);第1-8页 *
基于自组织特征映射神经网络的聚类分析的应用;徐小华 等;《新余学院学报》;20140831;第19卷(第4期);第11-13页 *

Also Published As

Publication number Publication date
CN108427967A (zh) 2018-08-21

Similar Documents

Publication Publication Date Title
Yu et al. Spatial pyramid-enhanced NetVLAD with weighted triplet loss for place recognition
Tao et al. Principal component 2-D long short-term memory for font recognition on single Chinese characters
CN109063565B (zh) 一种低分辨率人脸识别方法及装置
Zhan et al. Face detection using representation learning
CN103605972B (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
EP4002161A1 (en) Image retrieval method and apparatus, storage medium, and device
CN106599797A (zh) 一种基于局部并行神经网络的红外人脸识别方法
CN109241995B (zh) 一种基于改进型ArcFace损失函数的图像识别方法
CN111985581B (zh) 一种基于样本级注意力网络的少样本学习方法
CN104866810A (zh) 一种深度卷积神经网络的人脸识别方法
CN109273054B (zh) 基于关系图谱的蛋白质亚细胞区间预测方法
CN107169117B (zh) 一种基于自动编码器和dtw的手绘图人体运动检索方法
CN110084211B (zh) 一种动作识别方法
CN109635140B (zh) 一种基于深度学习和密度峰值聚类的图像检索方法
CN111898703B (zh) 多标签视频分类方法、模型训练方法、装置及介质
CN110751027B (zh) 一种基于深度多示例学习的行人重识别方法
CN103065158A (zh) 基于相对梯度的isa模型的行为识别方法
CN112529638B (zh) 基于用户分类和深度学习的服务需求动态预测方法及系统
CN113032613B (zh) 一种基于交互注意力卷积神经网络的三维模型检索方法
CN111460881A (zh) 基于近邻判别的交通标志对抗样本检测方法和分类装置
CN112115806B (zh) 基于Dual-ResNet小样本学习的遥感影像场景精确分类方法
Wang et al. A deep clustering via automatic feature embedded learning for human activity recognition
CN114419732A (zh) 基于注意力机制优化的HRNet人体姿态识别方法
CN116110089A (zh) 一种基于深度自适应度量学习的面部表情识别方法
Wang et al. A novel multiface recognition method with short training time and lightweight based on ABASNet and H-softmax

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201023

Address after: 450001 No. 62 science Avenue, hi tech Zone, Henan, Zhengzhou

Applicant after: Information Engineering University of the Chinese People's Liberation Army Strategic Support Force

Address before: 450001 Information Engineering University, 62 science Avenue, Zhengzhou, Henan

Applicant before: Fan Dazhao

GR01 Patent grant
GR01 Patent grant