CN108427967A - 一种实时影像聚类方法 - Google Patents
一种实时影像聚类方法 Download PDFInfo
- Publication number
- CN108427967A CN108427967A CN201810206731.XA CN201810206731A CN108427967A CN 108427967 A CN108427967 A CN 108427967A CN 201810206731 A CN201810206731 A CN 201810206731A CN 108427967 A CN108427967 A CN 108427967A
- Authority
- CN
- China
- Prior art keywords
- neuron
- image
- nerve endings
- activation
- local feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000003384 imaging method Methods 0.000 title claims abstract description 12
- 210000002569 neuron Anatomy 0.000 claims abstract description 164
- 230000004913 activation Effects 0.000 claims abstract description 89
- 210000001640 nerve ending Anatomy 0.000 claims abstract description 88
- 230000004044 response Effects 0.000 claims abstract description 36
- 238000013528 artificial neural network Methods 0.000 claims abstract description 13
- 230000002776 aggregation Effects 0.000 claims description 13
- 238000004220 aggregation Methods 0.000 claims description 13
- 230000003213 activating effect Effects 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 8
- 210000005036 nerve Anatomy 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000007689 inspection Methods 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 5
- 238000006116 polymerization reaction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种实时影像聚类方法,包括以下步骤:A、批量输入影像,通过边缘特征提取获得影像全局描述符;B、通过低分辨率影像特征提取获得影像局部特征描述符;C、输入影像全局描述符和影像局部特征描述符;D、创建三层自组织映射神经网络,利用影像全局描述符选取前N个竞争层神经元进入激活状态;E、计算影像局部特征描述符与每个激活神经元下的各个神经末梢间的距离,获得整体响应成功的激活神经元;F、根据整体响应成功的激活神经元的个数进行影像的聚类以及激活神经元的学习或合并,或者利用影像全局描述符和影像局部特征描述符创建新的竞争层神经元。本发明从整体上提高影像聚类结果的准确性与聚类过程的实时性和稳定性。
Description
技术领域
本发明涉及摄影测量与遥感测绘技术领域,尤其涉及一种实时影像聚类方法。
背景技术
近年来,信息网络技术的广泛应用不断推动生活方式发生变化,互联网、物联网、知识服务、智能服务已成为人们生活必不可少的一部分,由此也组成了一个庞大的微型传感器网络,产生了难以计量的非结构化影像数据。这些影像数据类型复杂、体量巨大、时效性较强,具有明显的大数据表象,已成为一个重要的研究对象。处理这些不精确、非结构化的影像大数据的首要一步是进行影像间的自主聚类,找出同一目标区域具有相似内容的影像集合。进行影像间的聚类可大致分为两个步骤:一是生成影像全局描述符,二是利用相应聚类方法进行影像描述符的聚类。
关于影像的全局描述符,一般是通过影像的局部描述符聚合整理得到,有不少学者进行了相关研究。Csurka等人提出利用视觉词袋模型(Bag ofwords,BoW)生成全局描述符,其简单、有效近年来得到了广泛应用;Lazebnik等人提出利用空间金字塔匹配(Spatialpyramid matching,SPM)进行局部描述符聚合,有效的补充了视觉词袋模型中的空间信息,使描述子的描述能力得到增强;Yang等人将稀疏编码(Sparse coding)用于影像全局描述,使整体算法的训练复杂度得到大幅降低;Wang等人提出了局部约束线性编码(Localityconstrained linear encoding,LLC)进行影像描述,进一步降低了算法时间复杂度,其整体性能也有所提升;Perronnin等人将Fisher编码(Fisher coding)运用在了影像检索与聚类领域,并进行了一些改进;Russakovsky等人则提出以目标物体为中心的空间聚合编码方法,突出了目标区域的编码表达;Alex等人提出了一种通过卷积神经网络进行海量影像编码与分类的算法,并在超大数据集上取得了较好的试验结果。关于影像的聚类方法,按照聚类特性可分为不同的种类,主要包括以下几种类型:基于划分的聚类算法,如k-means算法等;基于层次的聚类算法,如CURE(Clustering Using Representatives)算法等;基于密度的聚类算法,如DBSCAN(Density-Based Spatial Clustering ofApplications withNoise)算法等;基于网格的聚类算法,如STING(Statistical Information Grid)算法等;基于模型的聚类算法,如SOM(Self-organizing feature map)算法等。现行的影像全局描述方式虽在一定程度上能够较好的表征原始影像,但仍缺乏原始影像的语义信息。因此,如何生成具有优良性质的影像全局描述符,使影像编码包含一定的语义信息,且具有明显的类间特征和较好的类内描述,仍是当今研究的热点。另外,当前聚类算法的计算正确率与实时性仍有待提高,如何将神经网络更好的引入当前算法之中,以提升聚类的正确率与实时性是值得研究的问题。
发明内容
本发明的目的在于提供一种实时影像聚类方法,能够提高影像整体聚类结果的准确性,同时提高聚类过程的实时性和稳定性。
为实现上述目的,本发明采用的技术方案是:
一种实时影像聚类方法,包括以下步骤:
A、对影像进行SIFT特征提取,得到特征点集合T1,对集合T1中的特征点进行边缘点检测,得到边缘点描述符集合Q1,利用VLAD算法对集合Q1进行聚合,得到聚合描述符u1;
B、对影像进行空间金字塔降采样,然后进行SIFT特征提取,得到降采样影像描述符集合Q2,利用VLAD算法对降采样影像描述符集合Q2进行聚合,得到聚合描述符u2;
C、将聚合描述符u1作为影像全局描述符x={x1,x2,……,xm},其中x为单个矢量,m为其维度,将聚合描述符u2作为影像局部特征描述符Y={y1,y2,……,yn},其中Y为矢量集合,n为影像局部特征点的个数,yi={γ1,γ2,……,γh}为第i个影像局部特征的描述符,维度为h,i=1,2,……,n;
D、将影像全局描述符和影像局部特征描述符输入自组织映射神经网络,并创建自组织映射神经网络的竞争层神经元,分别对每个竞争层神经元创建响应层神经末梢,然后计算影像全局描述符与每个竞争层神经元连接权重间的距离,将得到的距离最近的前N个竞争层神经元作为激活神经元;
E、采用激活神经元对集合Y中的各个影像局部特征描述符进行响应,对于任意一个影像局部特征描述符yi,分别计算其与每个激活神经元下的各个神经末梢权值间的距离,即
li,jk为影像局部特征描述符yi与第j个激活神经元下的第k个神经末梢的权值间的距离,为第j个激活神经元下的第k个神经末梢的权值,当距离li,jk小于阈值α时,判定第j个激活神经元下的第k个神经末梢对影像局部特征描述符yi响应成功,则第j个激活神经元下的其余神经末梢不再对影像局部特征描述符yi进行响应,当所有激活神经元的神经末梢分别对集合Y中的各个影像局部特征描述符进行响应后,分别统计同一激活神经元下的神经末梢响应成功的次数,当一个激活神经元下的神经末梢响应成功的次数大于阈值β时,判定该激活神经元整体响应成功;
F、若有一个激活神经元整体响应成功,则将影像划为该激活神经元对应的聚类,并且该激活神经元及其下的神经末梢利用一定学习效率进行学习,然后返回步骤A对其他影像进行聚类;若有多个激活神经元整体响应成功,则将影像划为神经末梢响应成功次数最多的激活神经元对应的聚类,同时将所有整体响应成功的激活神经元标记为待合并神经元,并将影像标记为连接影像,将标记的待合并神经元进行合并,然后返回步骤A对其他影像进行聚类;若没有激活神经元整体响应成功,则利用影像全局描述符和影像局部特征描述符创建新的竞争层神经元及该竞争层神经元下的神经末梢,然后返回步骤A对其他影像进行聚类。
所述的步骤F中,一个激活神经元及其下的神经末梢利用一定学习效率进行学习时,利用影像全局描述符更新该激活神经元的连接权重,利用获得神经末梢响应的影像局部特征描述符更新该激活神经元相应的神经末梢的权值,即
其中,t为学习次数,t=1,2,3,……,χ为学习效率,Δωj(t)为第j个激活神经元进行第t次学习时的连接权重变量,χj(t)为第j个激活神经元进行第t次学习时的学习效率,ωj为第j个激活神经元的连接权重,为第j个激活神经元下的第k个神经末梢进行第t次学习时的权值变量,χjk(t)为第j个激活神经元下的第k个神经末梢进行第t次学习时的学习效率,yg为获得神经末梢响应的影像局部特征描述符,ωj(t+1)为第j个激活神经元进行第t次学习后的连接权重,ωj(1)=ωj,为第j个激活神经元下的第k个神经末梢进行第t次学习后的权值,
每次学习后该激活神经元及其下的神经末梢的学习效率χ以一定的步长δ下降,即
其中,δ为每次学习效率递减的步长,m为学习效率下降次数上限,且应满足m≤χj(1)/δ,E为终止学习效率;
若有影像局部特征描述符未能获得该激活神经元下的神经末梢响应,则利用所述影像局部特征描述符生成该激活神经元下新的神经末梢,即
式中为生成的第j个激活神经元下的第p个神经末梢的权值,χjp为生成第j个激活神经元下的第p个神经末梢的学习效率,yd为未能获得神经末梢响应的影像局部特征描述符。
所述的步骤F中,利用影像全局描述符和影像局部特征描述符创建新的竞争层神经元及该竞争层神经元下的神经末梢,即
式中ωr为创建的第r个竞争层神经元的连接权重,χr为创建第r个竞争层神经元的学习效率,为创建的第r个竞争层神经元下的第q个神经末梢的权值,χrq为创建第r个竞争层神经元下的第q个神经末梢的学习效率。
所述的步骤F中,对标记的待合并神经元进行合并时,将所有待合并神经元的连接权重的平均值作为合并后的神经元的连接权重,将所有待合并神经元的神经末梢作为合并后的神经元的神经末梢。
还包括步骤G,在对影像进行聚类的过程中,每隔一段时间统计各个激活神经元对应的聚类中包含影像的个数,若某个激活神经元对应的聚类中包含影像的个数小于设定阈值ρ,则将该激活神经元从自组织映射神经网络中剔除。
本发明首先对影像进行边缘提取,利用边缘点特征描述符生成影像全局描述符,使得到的描述符包含较强的语义与细节描述信息,同时利用影像金字塔的低分辨率生成影像全局描述符,使得到的描述符包含整体场景信息;然后对两个描述符进行组合,从而得到既具有影像整体场景信息又具有较强细节信息的综合描述符;最后由于得到的综合描述符为高维数据,因此对自组织映射神经网络进行改进,引入响应层神经末梢,得到一种三层的实时自组织特征映射神经网络聚类算法,从而完成大数据影像的快速聚类;
本发明在影像综合描述符生成期间考虑了影像中包含的语义信息,使影像具有较好的类内描述能力与类间鉴别能力,从而提高了后续影像聚类结果的准确性;在描述符聚类期间,引入了响应层,简化了输入参数,去掉了预先训练过程,从而提高了整体聚类结果的准确性与聚类过程的实时性和稳定性。
附图说明
图1为本发明的流程图。
具体实施方式
如图1所示,本发明所述的一种实时影像聚类方法,包括以下步骤:
A、对影像进行SIFT(Scale Invariant Feature Transform,尺度不变特征变换)特征提取,得到特征点集合T1,对集合T1中的特征点进行边缘点检测,得到边缘点描述符集合Q1,利用VLAD(Vector of LocallyAggregated Descriptors,局部聚合描述符向量)算法对集合Q1进行聚合,得到聚合描述符u1。
由于聚合描述符u1利用影像的边缘点特征生成,包含了较强的语义信息与细节描述信息,具有较好的类内描述能力和类间鉴别能力,有利于提高后续影像聚类的准确性。
B、对影像进行空间金字塔降采样,然后进行SIFT特征提取,得到降采样影像描述符集合Q2,利用VLAD算法对降采样影像描述符集合Q2进行聚合,得到聚合描述符u2。聚合描述符u2利用影像金字塔的低分辨率影像生成,包含整体场景信息。
C、将聚合描述符u1作为影像全局描述符x={x1,x2,……,xm},其中x为单个矢量,m为其维度,将聚合描述符u2作为影像局部特征描述符Y={y1,y2,……,yn},其中Y为矢量集合,n为影像局部特征点的个数,yi={γ1,γ2,……,γh}为第i个影像局部特征的描述符,维度为h,i=1,2,……,n。
D、将影像全局描述符和影像局部特征描述符输入自组织映射神经网络,并创建自组织映射神经网络的竞争层神经元,分别对每个竞争层神经元创建响应层神经末梢,然后计算影像全局描述符与每个竞争层神经元连接权重间的距离,将得到的距离最近的前N个竞争层神经元作为激活神经元。
E、采用激活神经元对集合Y中的各个影像局部特征描述符进行响应,对于任意一个影像局部特征描述符yi,分别计算其与每个激活神经元下的各个神经末梢权值间的距离,即
li,jk为影像局部特征描述符yi与第j个激活神经元下的第k个神经末梢的权值间的距离,为第j个激活神经元下的第k个神经末梢的权值,当距离li,jk小于阈值α时,判定第j个激活神经元下的第k个神经末梢对影像局部特征描述符yi响应成功,则第j个激活神经元下的其余神经末梢不再对影像局部特征描述符yi进行响应,即一个激活神经元下的各个神经末梢最多对一个影像局部特征描述符响应成功一次。
以上为判定某个激活神经元下的神经末梢对某个影像局部特征描述符响应成功的方式,当所有激活神经元的神经末梢分别对集合Y中的各个影像局部特征描述符进行响应后,分别统计同一激活神经元下的神经末梢响应成功的次数,也就是集合Y中获得某个激活神经元下的神经末梢响应成功的影像局部特征描述符的个数。当一个激活神经元下的神经末梢响应成功的次数大于阈值β时,判定该激活神经元整体响应成功。
F、若有一个激活神经元整体响应成功,则将影像划为该激活神经元对应的聚类,并且该激活神经元及其下的神经末梢利用一定学习效率进行学习,然后返回步骤A对其他影像进行聚类;
若有多个激活神经元整体响应成功,则将影像划为神经末梢响应成功次数最多的激活神经元对应的聚类,同时将所有整体响应成功的激活神经元标记为待合并神经元,并将影像标记为连接影像,将标记的待合并神经元进行合并后,即将所有待合并神经元的连接权重的平均值作为合并后的神经元的连接权重,将所有待合并神经元的神经末梢作为合并后的神经元的神经末梢,然后返回步骤A对其他影像进行聚类;
若没有激活神经元整体响应成功,则利用影像全局描述符和影像局部特征描述符创建新的竞争层神经元及该竞争层神经元下的神经末梢,即
式中ωr为创建的第r个竞争层神经元的连接权重,χr为创建第r个竞争层神经元的学习效率,为创建的第r个竞争层神经元下的第q个神经末梢的权值,χrq为创建第r个竞争层神经元下的第q个神经末梢的学习效率,然后返回步骤A对其他影像进行聚类。
其中,一个激活神经元及其下的神经末梢利用一定学习效率进行学习时,利用影像全局描述符更新该激活神经元的连接权重,利用获得神经末梢响应的影像局部特征描述符更新该激活神经元相应的神经末梢的权值,即
其中,t为学习次数,t=1,2,3,……,χ为学习效率,Δωj(t)为第j个激活神经元进行第t次学习时的连接权重变量,χj(t)为第j个激活神经元进行第t次学习时的学习效率,ωj为第j个激活神经元的连接权重,为第j个激活神经元下的第k个神经末梢进行第t次学习时的权值变量,χjk(t)为第j个激活神经元下的第k个神经末梢进行第t次学习时的学习效率,yg为获得神经末梢响应的影像局部特征描述符,ωj(t+1)为第j个激活神经元进行第t次学习后的连接权重,ωj(1)=ωj,为第j个激活神经元下的第k个神经末梢进行第t次学习后的权值,
每次学习后该激活神经元及其下的神经末梢的学习效率χ以一定的步长δ下降,即
其中,δ为每次学习效率递减的步长,m为学习效率下降次数上限,且应满足m≤χj(1)/δ,E为终止学习效率。
若有影像局部特征描述符未能获得该激活神经元下的神经末梢响应,则利用所述影像局部特征描述符生成该激活神经元下新的神经末梢,即
式中为生成的第j个激活神经元下的第p个神经末梢的权值,χjp为生成第j个激活神经元下的第p个神经末梢的学习效率,yd为未能获得神经末梢响应的影像局部特征描述符。
本发明在进行影像聚类时,可以一次载入批量影像,并对各个影像按照上述方法同步进行聚类处理,最后返回载入下批影像进行处理。在上述循环对影像进行聚类的过程中,每隔一段时间统计各个激活神经元对应的聚类中包含影像的个数,若某个激活神经元对应的聚类中包含影像的个数小于设定阈值ρ,则将该激活神经元从自组织映射神经网络中剔除,直至全部数据处理完毕。
Claims (5)
1.一种实时影像聚类方法,其特征在于,包括以下步骤:
A、对影像进行SIFT特征提取,得到特征点集合T1,对集合T1中的特征点进行边缘点检测,得到边缘点描述符集合Q1,利用VLAD算法对集合Q1进行聚合,得到聚合描述符u1;
B、对影像进行空间金字塔降采样,然后进行SIFT特征提取,得到降采样影像描述符集合Q2,利用VLAD算法对降采样影像描述符集合Q2进行聚合,得到聚合描述符u2;
C、将聚合描述符u1作为影像全局描述符x={x1,x2,……,xm},其中x为单个矢量,m为其维度,将聚合描述符u2作为影像局部特征描述符Y={y1,y2,……,yn},其中Y为矢量集合,n为影像局部特征点的个数,yi={γ1,γ2,……,γh}为第i个影像局部特征的描述符,维度为h,i=1,2,……,n;
D、将影像全局描述符和影像局部特征描述符输入自组织映射神经网络,并创建自组织映射神经网络的竞争层神经元,分别对每个竞争层神经元创建响应层神经末梢,然后计算影像全局描述符与每个竞争层神经元连接权重间的距离,将得到的距离最近的前N个竞争层神经元作为激活神经元;
E、采用激活神经元对集合Y中的各个影像局部特征描述符进行响应,对于任意一个影像局部特征描述符yi,分别计算其与每个激活神经元下的各个神经末梢权值间的距离,即
li,jk为影像局部特征描述符yi与第j个激活神经元下的第k个神经末梢的权值间的距离,为第j个激活神经元下的第k个神经末梢的权值,当距离li,jk小于阈值α时,判定第j个激活神经元下的第k个神经末梢对影像局部特征描述符yi响应成功,则第j个激活神经元下的其余神经末梢不再对影像局部特征描述符yi进行响应,当所有激活神经元的神经末梢分别对集合Y中的各个影像局部特征描述符进行响应后,分别统计同一激活神经元下的神经末梢响应成功的次数,当一个激活神经元下的神经末梢响应成功的次数大于阈值β时,判定该激活神经元整体响应成功;
F、若有一个激活神经元整体响应成功,则将影像划为该激活神经元对应的聚类,并且该激活神经元及其下的神经末梢利用一定学习效率进行学习,然后返回步骤A对其他影像进行聚类;若有多个激活神经元整体响应成功,则将影像划为神经末梢响应成功次数最多的激活神经元对应的聚类,同时将所有整体响应成功的激活神经元标记为待合并神经元,并将影像标记为连接影像,将标记的待合并神经元进行合并,然后返回步骤A对其他影像进行聚类;若没有激活神经元整体响应成功,则利用影像全局描述符和影像局部特征描述符创建新的竞争层神经元及该竞争层神经元下的神经末梢,然后返回步骤A对其他影像进行聚类。
2.如权利要求1所述的一种实时影像聚类方法,其特征在于:所述的步骤F中,一个激活神经元及其下的神经末梢利用一定学习效率进行学习时,利用影像全局描述符更新该激活神经元的连接权重,利用获得神经末梢响应的影像局部特征描述符更新该激活神经元相应的神经末梢的权值,即
其中,t为学习次数,t=1,2,3,……,χ为学习效率,Δωj(t)为第j个激活神经元进行第t次学习时的连接权重变量,χj(t)为第j个激活神经元进行第t次学习时的学习效率,ωj为第j个激活神经元的连接权重,为第j个激活神经元下的第k个神经末梢进行第t次学习时的权值变量,χjk(t)为第j个激活神经元下的第k个神经末梢进行第t次学习时的学习效率,yg为获得神经末梢响应的影像局部特征描述符,ωj(t+1)为第j个激活神经元进行第t次学习后的连接权重,ωj(1)=ωj,为第j个激活神经元下的第k个神经末梢进行第t次学习后的权值,
每次学习后该激活神经元及其下的神经末梢的学习效率χ以一定的步长δ下降,即
其中,δ为每次学习效率递减的步长,m为学习效率下降次数上限,且应满足m≤χj(1)/δ,E为终止学习效率;
若有影像局部特征描述符未能获得该激活神经元下的神经末梢响应,则利用所述影像局部特征描述符生成该激活神经元下新的神经末梢,即
式中为生成的第j个激活神经元下的第p个神经末梢的权值,χjp为生成第j个激活神经元下的第p个神经末梢的学习效率,yd为未能获得神经末梢响应的影像局部特征描述符。
3.如权利要求1所述的一种实时影像聚类方法,其特征在于:所述的步骤F中,
利用影像全局描述符和影像局部特征描述符创建新的竞争层神经元及该竞争层神经元下的神经末梢,即
式中ωr为创建的第r个竞争层神经元的连接权重,χr为创建第r个竞争层神经元的学习效率,为创建的第r个竞争层神经元下的第q个神经末梢的权值,χrq为创建第r个竞争层神经元下的第q个神经末梢的学习效率。
4.如权利要求1所述的一种实时影像聚类方法,其特征在于:所述的步骤F中,对标记的待合并神经元进行合并时,将所有待合并神经元的连接权重的平均值作为合并后的神经元的连接权重,将所有待合并神经元的神经末梢作为合并后的神经元的神经末梢。
5.如权利要求1所述的一种实时影像聚类方法,其特征在于:还包括步骤G,在对影像进行聚类的过程中,每隔一段时间统计各个激活神经元对应的聚类中包含影像的个数,若某个激活神经元对应的聚类中包含影像的个数小于设定阈值ρ,则将该激活神经元从自组织映射神经网络中剔除。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810206731.XA CN108427967B (zh) | 2018-03-13 | 2018-03-13 | 一种实时影像聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810206731.XA CN108427967B (zh) | 2018-03-13 | 2018-03-13 | 一种实时影像聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108427967A true CN108427967A (zh) | 2018-08-21 |
CN108427967B CN108427967B (zh) | 2021-08-27 |
Family
ID=63157950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810206731.XA Active CN108427967B (zh) | 2018-03-13 | 2018-03-13 | 一种实时影像聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108427967B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109919744A (zh) * | 2018-11-23 | 2019-06-21 | 阿里巴巴集团控股有限公司 | 基于神经网络的检测方法以及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1808474A (zh) * | 2006-03-02 | 2006-07-26 | 哈尔滨工业大学 | 基于自组织映射网络的文档聚类方法 |
US20080118151A1 (en) * | 2006-11-22 | 2008-05-22 | Jean-Yves Bouguet | Methods and apparatus for retrieving images from a large collection of images |
CN101576913A (zh) * | 2009-06-12 | 2009-11-11 | 中国科学技术大学 | 基于自组织映射神经网络的舌象自动聚类、可视化和检索系统 |
CN102789593A (zh) * | 2012-06-18 | 2012-11-21 | 北京大学 | 基于增量式ghsom神经网络的入侵检测方法 |
CN103488662A (zh) * | 2013-04-01 | 2014-01-01 | 哈尔滨工业大学深圳研究生院 | 基于图形处理单元的自组织映射神经网络聚类方法及系统 |
CN104298974A (zh) * | 2014-10-10 | 2015-01-21 | 北京工业大学 | 一种基于深度视频序列的人体行为识别方法 |
CN105117407A (zh) * | 2015-07-27 | 2015-12-02 | 电子科技大学 | 一种基于聚类的距离方向直方图的图像检索方法 |
CN105117488A (zh) * | 2015-09-19 | 2015-12-02 | 大连理工大学 | 一种基于混合层次聚类的rdf数据平衡分割算法 |
CN105719285A (zh) * | 2016-01-19 | 2016-06-29 | 东南大学 | 一种基于方向倒角距离特征的行人检测方法 |
CN105737805A (zh) * | 2016-01-29 | 2016-07-06 | 范大昭 | 卫星立体影像自适应制作方法 |
CN107392887A (zh) * | 2017-06-16 | 2017-11-24 | 西北工业大学 | 一种基于同质像素点转化的异质遥感图像变化检测方法 |
CN107657266A (zh) * | 2017-08-03 | 2018-02-02 | 华北电力大学(保定) | 一种基于改进谱多流形聚类的负荷曲线聚类方法 |
-
2018
- 2018-03-13 CN CN201810206731.XA patent/CN108427967B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1808474A (zh) * | 2006-03-02 | 2006-07-26 | 哈尔滨工业大学 | 基于自组织映射网络的文档聚类方法 |
US20080118151A1 (en) * | 2006-11-22 | 2008-05-22 | Jean-Yves Bouguet | Methods and apparatus for retrieving images from a large collection of images |
CN101576913A (zh) * | 2009-06-12 | 2009-11-11 | 中国科学技术大学 | 基于自组织映射神经网络的舌象自动聚类、可视化和检索系统 |
CN102789593A (zh) * | 2012-06-18 | 2012-11-21 | 北京大学 | 基于增量式ghsom神经网络的入侵检测方法 |
CN103488662A (zh) * | 2013-04-01 | 2014-01-01 | 哈尔滨工业大学深圳研究生院 | 基于图形处理单元的自组织映射神经网络聚类方法及系统 |
CN104298974A (zh) * | 2014-10-10 | 2015-01-21 | 北京工业大学 | 一种基于深度视频序列的人体行为识别方法 |
CN105117407A (zh) * | 2015-07-27 | 2015-12-02 | 电子科技大学 | 一种基于聚类的距离方向直方图的图像检索方法 |
CN105117488A (zh) * | 2015-09-19 | 2015-12-02 | 大连理工大学 | 一种基于混合层次聚类的rdf数据平衡分割算法 |
CN105719285A (zh) * | 2016-01-19 | 2016-06-29 | 东南大学 | 一种基于方向倒角距离特征的行人检测方法 |
CN105737805A (zh) * | 2016-01-29 | 2016-07-06 | 范大昭 | 卫星立体影像自适应制作方法 |
CN107392887A (zh) * | 2017-06-16 | 2017-11-24 | 西北工业大学 | 一种基于同质像素点转化的异质遥感图像变化检测方法 |
CN107657266A (zh) * | 2017-08-03 | 2018-02-02 | 华北电力大学(保定) | 一种基于改进谱多流形聚类的负荷曲线聚类方法 |
Non-Patent Citations (5)
Title |
---|
CHRISTIAN PREHOFER ET AL: "Self-organization in communication networks:principles and design paradigms", 《IEEE》 * |
JINJUN WANG ET AL: "Locality-constrained linear coding for image classification", 《IEEE》 * |
徐小华 等: "基于自组织特征映射神经网络的聚类分析的应用", 《新余学院学报》 * |
李振东 等: "基于深度卷积特征的图像实例检索方法", 《吉林大学学报(工学版)》 * |
陈泯融 等: "一种基于自组织特征映射网络的聚类方法", 《系统工程与电子技术》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109919744A (zh) * | 2018-11-23 | 2019-06-21 | 阿里巴巴集团控股有限公司 | 基于神经网络的检测方法以及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108427967B (zh) | 2021-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112308158B (zh) | 一种基于部分特征对齐的多源领域自适应模型及方法 | |
CN111353542B (zh) | 图像分类模型的训练方法、装置、计算机设备和存储介质 | |
Liu et al. | Recognizing human actions by attributes | |
WO2019237240A1 (zh) | 一种增强型生成式对抗网络以及目标样本识别方法 | |
CN109389037B (zh) | 一种基于深度森林和迁移学习的情感分类方法 | |
CN109815785A (zh) | 一种基于双流卷积神经网络的人脸情绪识别方法 | |
CN109101938B (zh) | 一种基于卷积神经网络的多标签年龄估计方法 | |
Yao et al. | Robust CNN-based gait verification and identification using skeleton gait energy image | |
CN109711422A (zh) | 图像数据处理、模型的建立方法、装置、计算机设备和存储介质 | |
CN107301380A (zh) | 一种用于视频监控场景中行人重识别的方法 | |
CN109241317A (zh) | 基于深度学习网络中度量损失的行人哈希检索方法 | |
Bu | Human motion gesture recognition algorithm in video based on convolutional neural features of training images | |
CN110084211B (zh) | 一种动作识别方法 | |
CN113032613B (zh) | 一种基于交互注意力卷积神经网络的三维模型检索方法 | |
CN110751027B (zh) | 一种基于深度多示例学习的行人重识别方法 | |
CN107871107A (zh) | 人脸认证方法和装置 | |
CN109213853A (zh) | 一种基于cca算法的中文社区问答跨模态检索方法 | |
CN112052771B (zh) | 一种对象重识别方法及装置 | |
CN106777090A (zh) | 基于视觉词汇表与多特征匹配的Skyline的医学大数据检索方法 | |
CN113435335A (zh) | 微观表情识别方法、装置、电子设备及存储介质 | |
CN110287985A (zh) | 一种基于带变异粒子群算法的可变拓扑结构的深度神经网络图像识别方法 | |
Xiao et al. | Overview: Video recognition from handcrafted method to deep learning method | |
CN110163130B (zh) | 一种用于手势识别的特征预对齐的随机森林分类系统及方法 | |
CN110197200B (zh) | 一种基于机器视觉的服装电子标签生成方法 | |
Özbay et al. | 3D Human Activity Classification with 3D Zernike Moment Based Convolutional, LSTM-Deep Neural Networks. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20201023 Address after: 450001 No. 62 science Avenue, hi tech Zone, Henan, Zhengzhou Applicant after: Information Engineering University of the Chinese People's Liberation Army Strategic Support Force Address before: 450001 Information Engineering University, 62 science Avenue, Zhengzhou, Henan Applicant before: Fan Dazhao |
|
GR01 | Patent grant | ||
GR01 | Patent grant |