CN104392247B - 一种用于数据聚类的相似性网络融合快速方法 - Google Patents
一种用于数据聚类的相似性网络融合快速方法 Download PDFInfo
- Publication number
- CN104392247B CN104392247B CN201410625530.5A CN201410625530A CN104392247B CN 104392247 B CN104392247 B CN 104392247B CN 201410625530 A CN201410625530 A CN 201410625530A CN 104392247 B CN104392247 B CN 104392247B
- Authority
- CN
- China
- Prior art keywords
- mrow
- mtd
- matrix
- mtr
- similitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种用于数据聚类的相似性网络融合快速方法,所述方法包括:相似性网络提前训练存储,相似性网络的快速融合;其中:所述相似性网络提前训练存储是指利用样本间的距离计算样本的不同特征的相似性网络,对于这一过程中得到的网络进行存储,用来做之后对新样本所进行的相似性网络的快速融合。本发明通过构建相似性网络为不同类型的数据相似性网络,有效地将这些网络进行融合,根据融合后的网络和部分标定的样本,有效地快速地预测新目标的类别;通过矩阵划分与预处理,有效地减少了在线预测中的时间复杂度,同时精确率只受到少量的损失;可以应用于视频,以较快的速度与较高的准确率实现在线目标分类。
Description
技术领域
本发明涉及的是一种数据融合方法,具体地说,涉及的是一种用于数据聚类的相似性网络融合快速方法。
背景技术
目前,智能监控视频由于其广阔的应用范围吸引了大量的关注。在智能视频技术中,自动目标检测与分类已经成为智能监控系统的一项主要任务。由于运动的复杂性,交错的背景,物体位置与视角的变化等原因,监控视频目标分类成为一个具有挑战性的任务。同时,实际监控系统常常需要进行实时在线目标分类。
现有的目标分类方法之中,一些方法使用形状与运动信息进行分类,这类方法的速度相对较快,但是,其鲁棒性也受到限制,因为目标在视频中的形状会随着视角而发生变化。另一类方法考虑得标定的数据与大量未标定的数据,半监督学习法在目标分类领域有着更大广泛的使用。
现有研究中,王波博士等在论文《Similarity network fusion for aggregatingdata types on a genomic scale》提出一种新的基于图的数据融合方法,相似性网络融合。相似性网络融合方法计算并融合从不同特征数据中获得到相似性网络,充分发挥不同特征之间的互补性,用于半监督学习。该相似性网络融合方法具有以下优点:1.基于较少量的标定样本;2.在不同尺度、噪声的情况下都有良好的表现;3.可充分发挥不同类型特征数据之间的互补性。
尽管相似性网络融合方法有诸多优点,但由于其对于单一新样本的分类速度相当缓慢,因而不适用于目标在线分类。考虑到相似性融合方法的这些限制,本发明提出一种基于相似性网络融合的快速方法。
发明内容
本发明针对现有技术中存在的上述技术问题,提供一种用于数据聚类的相似性网络融合快速方法,在上述王波博士提出的方法上做了改进,大大提升了原方法对单一新样本的相似性网络融合速度,能够适用于实时在线目标检测。
本发明提供一种用于数据聚类的相似性网络融合快速方法,用于视频中目标的在线分类。通过构建相似性网络,为不同类型数据基于相似性进行聚类,有效地将这些网络进行融合。根据融合后的网络和部分标定的样本,可以有效地快速地预测新目标的类别。该方法是一种相似性网络融合快速方法,通过矩阵划分与预处理,有效地减少了在线预测中的时间复杂度,同时精确率只受到少量的损失。
为实现上述目的,本发明所述的用于数据聚类的相似性网络融合快速方法包括两个部分:相似性网络提前训练存储,相似性网络的快速融合。其中:
所述相似性网络提前训练存储是指:利用样本间的距离计算样本的不同特征的相似性网络,对于这一过程中得到的网络进行存储,用来之后对新样本所进行的相似性网络的快速融合。
所述相似性网络的快速融合是指:对于特征网络进行有效的划分存储,在分类时进行快速分类。
以下对两个部分进行详细说明:
1、相似性网络提前训练存储
本发明中,所述相似性网络提前训练存储,使用相似性网络融合方法中的训练算法,对于训练样本集进行训练,并对于训练中间计算得到的矩阵进行存储。上述王波博士提出的方法提到:相似性网络被表示成为一张图G=(V,E),其中节点V表示样本,边E的权重则是两个样本的相似程度。因而边的权重被表示成为一个n×n的矩阵。其中的W(i,j)表示两个样本xi与xj之间的相似度,ρ(xi,xj)表示样本xi与xj之的欧氏距离,μ是一个经验参数,通常取值[0.3,0.8]。计算公式如下:
其中
Ni表示xi的K个近邻(K的取值依据是具体数据集规模,优选[5,20]),K个近邻中的K值是一个经验值,随样本集的大小适当选取,表征计算相似矩阵S时,对任意样本,取K个近邻计算相似性。mean(ρ(xi,Ni))是样本xi与它的近邻Ni的平均欧氏距离;
从而,矩阵P可以按下式计算:
P(i,j)代表样本xi与xj的相似情况,与W不同的是P矩阵进行了矩阵标准化处理,矩阵P存有所有样本之间的相似信息,接下来再计算S矩阵,公式如下。
S矩阵仅保留xi与其近邻的相似信息,而与xi相距较远的样本间相似信息则丢弃。
以上,则完成对某一特征数据的初始化处理,将初始化得到的矩阵储存在文件中。接下来进行相似性网络提前训练存储。
上述王波博士提出的方法中,对于两个维度的特征,第t+1次迭代过程的矩阵计算方法如下(括号中1,2表示第1类与第2类特征数据对应矩阵):
当维度超过两个时,给出统一的计算公式如下,v表示第v类特征,k也是相同含义,即第k类特征,总共有m类特征:
本发明不同于现有技术之处在于,记录下迭代过程中各个矩阵信息,以文件形式存储,用于之后利用融合的网络对新样本进行相似性网络的快速融合。
2、相似性网络的快速融合
本发明中,对添加新样本到原训练样本集中从而构成新的数据集,在对新数据集进行相似性网络融合时,通过利用训练过程中储存下来的矩阵信息,大大减小融合计算的复杂度,实现数据聚类的快速运算。详细如下:
对于一个新样本,同样需要计算矩阵W,S,P等(上述王波博士提出的方法中的W(i,j),S(i,j),P(i,j)等),其中有很大一部分与训练阶段计算结果十分相似,将该部分计算用训练阶段存储的矩阵信息进行替换,即可大大减小计算复杂度。
图1给出一种特定的矩阵划分方法,能充分利用之前相似性网络提前训练存储阶段存储的矩阵,进行该阶段的相似性网络的融合。划分方法对一个(n+1)*(n+1)的矩阵划分出左上角n*n的矩阵作为PartI,划分出右侧(n+1)*1的矩阵作为Part II,划分出左下方1*n的矩阵作为PartIII。其中Part I的部分都可以用训练阶段的矩阵替换,在线分类阶段实际需要计算的是Part II和Part III.测试阶段的S矩阵可以用下式计算,其中1≤i≤n+1;j=n+1:
W(i,j)表示两个样本xi与xj之间的相似度,数值越小,两个样本越相似。上述图1的矩阵划分方法同时适用于S,P矩阵。矩阵P的第一个初始矩阵也可类似计算。
按照图1的划分用于矩阵初始化计算完成之后,依据图2的划分用于迭代融合计算。
继续对快速分类时的迭代融合计算进行说明。
将矩阵按以图2方法分为四个部分(S,P矩阵都按该方法进行划分,图2给出一种特定的矩阵划分方法,能充分利用之前相似性网络提前训练存储阶段存储的矩阵,进行该阶段的相似性网络的融合。划分方法对一个(n+1)*(n+1)的矩阵划分出左上角n*n的矩阵作为第1部分,划分出右上方n*1的矩阵作为第2部分,划分出左下方1*n的矩阵作为第3部分,划分出右下方1*1的矩阵作为第4部分)。
当已知第t-1次迭代的情况时,根据前面的公式 可以先计算部分如下
其中S矩阵按图2说明的划分方法得到S1,S2,S3,S4,定义为矩阵P,那么P1,P2,P3,P4即为按图2所说明的划分方法得到的矩阵块。等式的右边是一个临时矩阵,记为Temp,是Temp1,Temp2,Temp3,Temp4即为按图2所说明的划分方法得到的Temp的矩阵块。
事实上,S1×P1近似于训练过程中的S×P,(S,P分别对应在上述王波博士提出的方法中的S矩阵与P矩阵),因而有训练过程中中间存储得到的S×P进行替换Temp1,虽然使用了近似,但节省了大量的时间。按下面的公式计算Temp2,Temp4,并用Temp2的转置近似代替Temp 3。
最后,计算公式中的×(S(v))T部分(公式前半部分的结果存在临时矩阵Temp中,P(v)按图2说明的划分方法得到P(v)是第v类特征下一次迭代过程中标准化的相似性矩阵),可得
同理可以计算出只是数学计算的中间步骤,因而可以得到整个P(v)(第v类特征下一次迭代过程中标准化的相似性矩阵)。又对称地,可以得到对于任意i类特征在下一次迭代过程中的标准化的相似性矩阵P(i),至此,根据当前的迭代情况,完全计算得到下一次的迭代情况。又已知初始情况,由数学归纳法易得,可以计算得到迭代完成的情况。根据迭代得到最后的P矩阵(最后的标准化的相似性矩阵),从而实现了相似性网络融合的快速方法。结合部分标定的数据,采用半监督学习标签传递的方法,即可以对新样本进行聚类或分类。本发明所述方法至此结束。
本发明存储了相似性网络融合计算过程中的中间网络,这些网络用于最后进行快速相似性网络融合;同时,使用存储下来的中间网络,使用本发明设计的算法进行相似性网络融合模型快速计算,用于聚类时,能达到较高的聚类精度与较快的聚类速度。
本发明通过为目标数据构建基于某一个特征的相似性网络,并将不同特征的相似性网络进行融合,得到融合后的相似性网络;利用融合后的网络,既可以对数据进行聚类分析,也可以用来对新的未知类别属性的数据,进行分类识别。本发明在相似性网络融合方法的基础上,提出了一种该方法的快速方法:通过对相似性网络矩阵的模块化划分与近似处理,利用离线训练阶段得到的相似性矩阵,来代替因新样本加入而重新进行相似性融合时对应的矩阵模块,从而大幅降低相似性矩阵的计算工作量,有效地提升相似性网络融合的速度。该方法以较少的分类准确率下降,换来相似性网络的快速融合聚类,从而使之能够应用于视频目标在线分类等实时性要求较强的聚类、分类等应用。
与现有技术相比,本发明具有如下的有益效果:
本发明提供一种用于数据聚类的相似性网络融合快速方法,可用于视频目标的在线分类,有以下新的特点:基于半监督学习技术,基于相似性网络融合的快速方法,对于一个新样本数据,可以快速融合得到一个新的相似性网络,用于在线聚类分类等应用领域,使用更加方便广泛。例如在线学习聚类分类应用中,新的样本可以在线被快速且准确到进行聚类或分类。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明相似似网络融合模型快速方法矩阵划分方法一的示意图。
图2为本发明相似似网络融合模型快速方法矩阵划分方法二的示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
本实施例提供一种用于数据聚类的相似性网络融合快速方法包括三个部分:相似性网络提前训练存储,相似性网络的快速融合,其中,利用样本间的距离计算样本的不同特征的相似性网络,继而对相似性网络进行融合,对于这一过程中的中间计算得到的网络进行存储,用来做之后对新样本所进行的聚类。
进一步的,在本发明具体实施中,可以按照以下阶段进行:
样本训练阶段,使用相似性网络融合方法中的训练算法,对于训练样本集进行训练,并对于训练中间计算得到的各相似性矩阵进行存储;
新样本聚类阶段,在对新加入样本后构成的新的数据集进行相似性网络融合时,利用训练阶段保存的矩阵,替代新的相似性网络中对应的参数矩阵块,实现相似性网络的快速融合;
新样本分类阶段,利用融合后的相似性网络,采用半监督学习标签传递的方法,对新样本数据进行别聚类和属性判别。
在样本训练阶段,是指对已有样本数据进行相似性网络的离线融合,并将得到的融合后的相似性网络矩阵作为中间结果进行存储,这些存储的训练阶段得到的相似性矩阵,可用于新样本加入后进行快速的相似性网络融合。同时,使用存储下来的中间网络,使用本专利设计的算法进行相似性网络融合模型快速计算,用于聚类时,能达到较高的聚类精度与较快的聚类速度。
图1所示相似性网络融合模型快速方法矩阵划分方法一说明:对一个(n+1)*(n+1)的矩阵划分出左上角n*n的矩阵作为PartI,划分出右侧(n+1)*1的矩阵作为Part II,划分出左下方1*n的矩阵作为PartIII。
图2所示相似性网络融合模型快速方法矩阵划分方法二说明:对一个(n+1)*(n+1)的矩阵划分出左上角n*n的矩阵作为第1部分,划分出右上方n*1的矩阵作为第2部分,划分出左下方1*n的矩阵作为第3部分,划分出右下方1*1的矩阵作为第4部分。
图1与图2所示划分方法在本发明中先后采用。在矩阵初始化计算过程中,采用图1所示划分方法对矩阵进行划分计算,在迭代融合计算过程中采用图2所示划分方法进行计算。
本发明中,所述相似性网络提前训练存储,使用相似性网络融合方法中的训练算法,进于训练样本集进行训练,并对于训练的中间计算得到的矩阵进行存储。具体如下:相似性网络被表示成为一张图G=(V,E).其中节点V表示样本,边E的权重则是两个样本的相似程度。因而边的权重被表示成为一个n×n的矩阵。其中的W(i,j)表示两个样本xi与xj之间的相似度,计算公式如下:
其中
从而,矩阵P可以按下式计算:
矩阵P存有所有与其它样本的相似信息,接下来再计算S矩阵,公式如下。
Ni表示Xi的K个近邻与Xi的相似情况,而与Xi相距较远的样本间相似信息则丢弃。
以上,则完成对某一特征数据的初始化处理,将初始化得到的矩阵储存在文件中。接下来是进行训练过程中的融合迭代步骤。
以两个维度的特征情况为例,第t+1次迭代过程的矩阵计算方法如下(括号中1,2表示第1类与第2类特征数据对应矩阵):
当维度超过两个时,给出统一的计算公式如下:
同时,记录下迭代过程中各个矩阵信息,用于之后对新样本进行快速分类计算。
本发明中对新样本进行相似性网络融合,利用训练过程中储存下来的矩阵信息,大大减小计算复杂度,实现分类的快速进行。详细如下:
对于一个新样本,同样需要计算矩阵W,S,P等,其中有很大一部分与训练阶段计算结果十分相似,将该部分计算用训练阶段存储的矩阵信息进行替换,即可大大减小计算复杂度。如矩阵按如图1方法分为三个部分.
其中Part I的部分都可以用训练阶段的矩阵替换,在线分类阶段实际需要计算的是Part II和Part III.测试阶段的S矩阵可以用下式计算,其中1≤i≤n+1;j=n+1:
矩阵P的第一个初始矩阵也可类似计算。继续对快速分类时的迭代融合计算进行说明,同样以两维特征为例进行说明。将矩阵按以图2方法分为四个部分(S,P矩阵都按该方法进行划分)。
当已知第t-1次迭代的情况时,根据前面的公式,可以得到以下公式
事实上,近似于训练过程中的S×P,因而有训练过程中中间计算得到的S×P进行替换Temp1,虽然使用了近似,但节省了大量的时间。按下面的公式计算Temp2,Temp4,并用Temp2的转置近似代替Temp 3。
最后,计算
同理可以计算出因而可以得到整个P(1)。又对称地,可以得到对于第二种特征的矩阵P(2),至此,根据处t-1次的迭代情况,完全计算得到第t次的迭代情况。又已知初始情况,由数学归纳法易得,可以计算得到迭代完成的情况。根据迭代完成的P矩阵,从而实现了相似性网络融合的快速方法。结合部分标定的数据,采用半监督学习标签传递的方法,即可以对新样本进行聚类或分类。本发明所述方法至此结束。
本发明通过代替计算中矩阵的主要部分,相似性网络融合快速方法可以有效减少计算负担,同时,保留相似性网络融合方法的绝大部分优点。基于相似性网络融合的快速方法有以下新的特点:1.基于半监督学习技术,基于相似性网络融合的快速方法可以获取得到一个分类器,用于在线分类等应用领域,使用更加方便广泛。2.对于一个新样本,进行相似性网络融合的速度大大加快。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
Claims (4)
1.一种用于数据聚类的相似性网络融合快速方法,其特征在于包括:相似性网络提前训练存储,相似性网络的快速融合;其中:
所述相似性网络提前训练存储是指利用样本间的距离计算样本的不同特征的相似性网络,对于这一过程中得到的网络进行存储,用来做之后对新样本所进行的相似性网络的快速融合;
所述相似性网络的快速融合是指:对于不同特征的相似性网络进行有效的划分存储,然后进行迭代融合计算,实现快速分类;
所述对于不同特征的相似性网络进行有效的划分存储,是指:利用相似性网络提前训练存储阶段存储的矩阵,矩阵划分方法为:
对一个(n+1)*(n+1)的矩阵划分出左上角n*n的矩阵作为PartI,划分出右侧(n+1)*1的矩阵作为Part II,划分出左下方1*n的矩阵作为PartIII,其中Part I的部分都可以用训练阶段的矩阵替换,在线分类阶段实际需要计算的是Part II和Part III,测试阶段的S矩阵用下式计算,其中1≤i≤n+1;j=n+1,Ni表示xi的K个近邻,K的取值依据是具体数据集规模:
<mrow>
<msubsup>
<mi>S</mi>
<mrow>
<mi>t</mi>
<mi>e</mi>
<mi>s</mi>
<mi>t</mi>
</mrow>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</msubsup>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mfrac>
<mrow>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>&Sigma;</mi>
<mrow>
<mi>k</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>i</mi>
</msub>
</mrow>
</msub>
<mi>W</mi>
<mrow>
<mo>(</mo>
<mi>i</mi>
<mo>,</mo>
<mi>k</mi>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>,</mo>
<mi>j</mi>
<mo>&Element;</mo>
<msub>
<mi>N</mi>
<mi>i</mi>
</msub>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mn>0</mn>
<mo>,</mo>
<mi>o</mi>
<mi>t</mi>
<mi>h</mi>
<mi>e</mi>
<mi>r</mi>
<mi>w</mi>
<mi>i</mi>
<mi>s</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
上述矩阵划分方法同时适用于S,P矩阵,矩阵P的第一个初始矩阵也类似计算;在用于矩阵初始化计算完成之后,进行迭代融合计算。
2.根据权利要求1所述的一种用于数据聚类的相似性网络融合快速方法,其特征在于:所述相似性网络提前训练存储,存储了相似性网络融合计算过程中的中间网络,这些网络用于最后进行快速相似性网络融合;同时,使用存储下来的中间网络,进行相似性网络融合模型快速计算。
3.根据权利要求1或2所述的一种用于数据聚类的相似性网络融合快速方法,其特征在于:所述相似性网络的快速融合,是对添加新样本到原训练样本集中进行相似性网络的快速融合,对于一个新样本,同样需要计算矩阵W,S,P,其中有很大一部分与训练阶段计算结果十分相似,将该部分计算用训练阶段存储的矩阵信息进行替换。
4.根据权利要求1或2所述的一种用于数据聚类的相似性网络融合快速方法,其特征在于:所述的迭代融合计算,具体为:
利用之前相似性网络提前训练存储阶段存储的矩阵,进行该阶段的相似性网络的融合,将S,P矩阵都分为四个部分,划分方法为:
对一个(n+1)*(n+1)的矩阵划分出左上角n*n的矩阵作为第1部分,划分出右上方n*1的矩阵作为第2部分,划分出左下方1*n的矩阵作为第3部分,划分出右下方1*1的矩阵作为第4部分;
当已知第t-1次迭代的情况时,根据公式先计算部分如下
<mrow>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>S</mi>
<mn>1</mn>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>S</mi>
<mn>2</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>S</mi>
<mn>3</mn>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>S</mi>
<mn>4</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>&times;</mo>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>P</mi>
<mn>1</mn>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>P</mi>
<mn>2</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>P</mi>
<mn>3</mn>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>P</mi>
<mn>4</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>=</mo>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>T</mi>
<mi>e</mi>
<mi>m</mi>
<mi>p</mi>
<mn>1</mn>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>T</mi>
<mi>e</mi>
<mi>m</mi>
<mi>p</mi>
<mn>2</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>T</mi>
<mi>e</mi>
<mi>m</mi>
<mi>p</mi>
<mn>3</mn>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>T</mi>
<mi>e</mi>
<mi>m</mi>
<mi>p</mi>
<mn>4</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
1
其中S矩阵本权利要求中所述划分方法得到S1,S2,S3,S4,定义为矩阵P,那么P1,P2,P3,P4即为该划分方法得到的矩阵块;等式的右边是一个临时矩阵,记为Temp,是Temp1,Temp2,Temp3,Temp4即为该划分方法得到的Temp的矩阵块;
事实上,S1×P1近似于训练过程中的S×P,S、P分别为S矩阵与P矩阵,因而有训练过程中中间存储得到的S×P进行替换Temp1,按下面的公式计算Temp2,Temp4,并用Temp2的转置近似代替Temp 3:
<mrow>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mi>T</mi>
<mi>e</mi>
<mi>m</mi>
<mi>p</mi>
<mn>2</mn>
</mtd>
</mtr>
<mtr>
<mtd>
<mi>T</mi>
<mi>e</mi>
<mi>m</mi>
<mi>p</mi>
<mn>4</mn>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>=</mo>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>S</mi>
<mn>1</mn>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>S</mi>
<mn>2</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>S</mi>
<mn>3</mn>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>S</mi>
<mn>4</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>&times;</mo>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mi>P</mi>
<mn>2</mn>
</mtd>
</mtr>
<mtr>
<mtd>
<mi>P</mi>
<mn>4</mn>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
最后,计算公式中的×(S(v))T部分,公式前半部分的结果存在临时矩阵Temp中,P(v)按权利要求中所述划分方法得到P(v)是第v类特征下一次迭代过程中标准化的相似性矩阵,可得
<mrow>
<msubsup>
<mi>P</mi>
<mn>2</mn>
<mrow>
<mo>(</mo>
<mi>v</mi>
<mo>)</mo>
</mrow>
</msubsup>
<mo>=</mo>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>T</mi>
<mi>e</mi>
<mi>m</mi>
<mi>p</mi>
<mn>1</mn>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>T</mi>
<mi>e</mi>
<mi>m</mi>
<mi>p</mi>
<mn>2</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>&times;</mo>
<mfenced open = "[" close = "]">
<mtable>
<mtr>
<mtd>
<mi>S</mi>
<mn>2</mn>
</mtd>
</mtr>
<mtr>
<mtd>
<mi>S</mi>
<mn>4</mn>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
同理计算出只是数学计算的中间步骤,因而得到整个P(v),又对称地,得到对于任意i类特征在下一次迭代过程中的标准化的相似性矩阵P(i),至此,根据当前的迭代情况,完全计算得到下一次的迭代情况;又已知初始情况,由数学归纳法易得,可以计算得到迭代完成的情况;根据迭代得到最后的P矩阵即最后的标准化的相似性矩阵,从而实现了相似性网络融合的快速方法;
结合部分标定的数据,采用半监督学习标签传递的方法,即可以对新样本进行聚类或分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410625530.5A CN104392247B (zh) | 2014-11-07 | 2014-11-07 | 一种用于数据聚类的相似性网络融合快速方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410625530.5A CN104392247B (zh) | 2014-11-07 | 2014-11-07 | 一种用于数据聚类的相似性网络融合快速方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104392247A CN104392247A (zh) | 2015-03-04 |
CN104392247B true CN104392247B (zh) | 2017-09-08 |
Family
ID=52610148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410625530.5A Active CN104392247B (zh) | 2014-11-07 | 2014-11-07 | 一种用于数据聚类的相似性网络融合快速方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104392247B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106933901B (zh) * | 2015-12-31 | 2020-07-17 | 北京大学 | 数据集成方法及系统 |
CN109344405B (zh) * | 2018-09-25 | 2023-04-14 | 艾凯克斯(嘉兴)信息科技有限公司 | 一种基于tf-idf思想及神经网络的相似性处理方法 |
CN111009285A (zh) * | 2019-05-28 | 2020-04-14 | 江南大学 | 一种基于相似性网络融合算法的生物数据网络处理方法 |
CN113409897A (zh) * | 2021-05-25 | 2021-09-17 | 电子科技大学长三角研究院(衢州) | 药物-靶标相互作用的预测方法、装置、设备和存储介质 |
CN114266512A (zh) * | 2022-02-28 | 2022-04-01 | 成都数之联科技股份有限公司 | 一种用户用能行为分析方法及系统及装置及介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102522045A (zh) * | 2011-12-21 | 2012-06-27 | 中国科学院计算技术研究所 | 一种基于社会信息的网络视频在线地理定位系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009139161A1 (ja) * | 2008-05-15 | 2009-11-19 | 株式会社ニコン | 画像処理装置、画像処理方法、処理装置、処理方法およびプログラム |
-
2014
- 2014-11-07 CN CN201410625530.5A patent/CN104392247B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102522045A (zh) * | 2011-12-21 | 2012-06-27 | 中国科学院计算技术研究所 | 一种基于社会信息的网络视频在线地理定位系统 |
Non-Patent Citations (1)
Title |
---|
similarity network fusion for aggregating data types on a genomic scale;bo wang;《nature methods》;20140126;期刊全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN104392247A (zh) | 2015-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104392247B (zh) | 一种用于数据聚类的相似性网络融合快速方法 | |
Liu et al. | A computer vision system for early stage grape yield estimation based on shoot detection | |
CN106874688B (zh) | 基于卷积神经网络的智能化先导化合物发现方法 | |
CN107564025A (zh) | 一种基于深度神经网络的电力设备红外图像语义分割方法 | |
CN102376079A (zh) | 图像识别信息添加装置和图像识别信息添加方法 | |
CN111680701B (zh) | 图像识别模型的训练方法、装置及图像识别方法、装置 | |
CN109614973A (zh) | 水稻秧苗及苗期杂草图像语义分割方法、系统、设备和介质 | |
CN107784322A (zh) | 异常数据检测方法、装置、存储介质以及程序产品 | |
CN113807412B (zh) | 一种多标签图像分类方法、装置、设备及存储介质 | |
CN105469376A (zh) | 确定图片相似度的方法和装置 | |
Alkhudaydi et al. | Spikeletfcn: Counting spikelets from infield wheat crop images using fully convolutional networks | |
CN113310514A (zh) | 一种农作物生长状况检测方法、系统、装置及存储介质 | |
KR20190139539A (ko) | 저사양 임베디드 환경에서의 합성곱 신경망 연산을 위한 역 잔여 블록의 채널 확장 매개변수 설정 시스템 및 방법 | |
Kanjalkar et al. | Detection and classification of plant leaf diseases using ANN | |
Narejo et al. | Meteonowcasting using deep learning architecture | |
CN104102922A (zh) | 一种基于上下文感知字典学习的害虫图像分类方法 | |
Silver et al. | In vino veritas: Estimating vineyard grape yield from images using deep learning | |
CN113869098A (zh) | 植物病害识别方法、装置、电子设备及存储介质 | |
CN110188661B (zh) | 边界识别方法及装置 | |
CN109034218A (zh) | 模型训练方法、装置、设备及存储介质 | |
Veeragandham et al. | Effectiveness of convolutional layers in pre-trained models for classifying common weeds in groundnut and corn crops | |
Ullah et al. | Adaptive data balancing method using stacking ensemble model and its application to non-technical loss detection in smart grids | |
Li et al. | Automatic counting of rapeseed inflorescences using deep learning method and UAV RGB imagery | |
CN107463994A (zh) | 基于协同训练极限学习机模型的半监督软测量方法 | |
CN110222772A (zh) | 一种基于块级别主动学习的医疗图像标注推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20190603 Address after: 201416 No. 689 Zhelin Town Zhengong Road, Fengxian District, Shanghai Patentee after: Shanghai Haiwei Industry Control Co., Ltd. Address before: 200240 No. 800, Dongchuan Road, Shanghai, Minhang District Patentee before: Shanghai Jiao Tong University |