CN105095266A - 一种基于Canopy算法的聚类优化方法及系统 - Google Patents

一种基于Canopy算法的聚类优化方法及系统 Download PDF

Info

Publication number
CN105095266A
CN105095266A CN201410194172.7A CN201410194172A CN105095266A CN 105095266 A CN105095266 A CN 105095266A CN 201410194172 A CN201410194172 A CN 201410194172A CN 105095266 A CN105095266 A CN 105095266A
Authority
CN
China
Prior art keywords
canopy
raw data
center point
initial center
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410194172.7A
Other languages
English (en)
Inventor
韩锐
崔创雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN201410194172.7A priority Critical patent/CN105095266A/zh
Publication of CN105095266A publication Critical patent/CN105095266A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于Canopy算法的聚类优化方法,所述方法包含:步骤101)基于Canopy算法对所有的原始数据进行分组处理,进而得到N个Canopy集合及各个Canopy集合的中心;步骤102)将Canopy集合的数量N作为K均值聚类算法的要构建的划分的数目k;将各个Canopy集合的中心作为划分的k个簇的簇中心;基于上述确定的簇数k和簇中心对所有原始数据采用K均值聚类算法进行聚类优化处理,输出聚类优化结果。本发明中Canopy聚类算法用于K均值聚类算法的预处理,用来找合适的k值和簇中心。大大降低整个聚类的运行时间,提高了算法的计算效率,增加了算法的容错性。

Description

一种基于Canopy算法的聚类优化方法及系统
技术领域
本发明涉及一种聚类方法,属于数据挖掘领域,具体涉及一种基于Canopy算法的聚类优化方法及系统。
背景技术
随着计算机技术的快速发展,数据量呈现指数型增长,如何从大量的数据中找出隐含的、先前未知的并有潜在价值的信息成为了人们越来越关心的问题,数据挖掘由此产生。聚类分析就是其中相当重要的一部分。聚类就是将一组数据划分到各个类中的一个过程,从而使得类内距离最小化,类间距离最大化,即同一类中的数据尽可能的相似,而不同类中的数据尽可能的不同。
K均值聚类是典型的基于距离的排他的划分方法:给定一个n个对象的数据集,它可以构建数据的k个划分,每个划分就是一个聚类,并且k<=n,同时还需要满足两个要求:每个组至少包含一个对象;每个对象必须属于且仅属于一个组。K均值聚类的基本原理是:给定k(即要构建的划分的数目),首先创建一个初始划分,随机地选择k个对象,每个对象初始地代表了一个簇中心。对于其他的对象,根据其与各个簇中心的距离,将它们赋给最近的簇;然后采用一种迭代的重定位技术,尝试通过对象在划分间移动来改进划分。所谓重定位技术,就是当有新的对象加入簇或者已有对象离开簇的时候,重新计算簇的平均值,然后对对象进行重新分配。这个过程不断重复,直到没有簇中对象的变化。
K均值聚类最大的优点是:原理简单,实现起来也相对简单,同时执行效率和对于大数据量的可伸缩性还是较强的。但是缺点是:K均值聚类要求用户必须事先给出聚类个数,k的选择一般都基于一些经验值和多次实验结果,对于不同的数据集,k的取值没有可借鉴性。另外,K均值对“噪音”和孤立点数据是敏感的,少量这类的数据就能对平均值造成极大的影响。
发明内容
本发明目的:针对上述现有方法存在的问题和不足,本发明的目的是提供一种基于Canopy算法的聚类优化方法及系统。
为实现上述目的,本发明提供了一种基于Canopy算法的聚类优化方法,所述方法包含:
步骤101)基于Canopy算法对所有的原始数据进行分组处理,进而得到N个Canopy集合及各个Canopy集合的中心;
步骤102)将Canopy集合的数量N作为K均值聚类算法的要构建的划分的数目k;
将各个Canopy集合的中心作为划分的k个簇的簇中心;
基于上述确定的簇数k和簇中心对所有原始数据采用K均值聚类算法进行聚类优化处理,输出聚类优化结果。
本发明还提供了一种基于Canopy算法的聚类优化系统,所述系统包含:
预处理模块,用于基于Canopy算法对所有的原始数据进行分组处理,进而得到N个Canopy集合及各个Canopy集合的中心;
聚类模块,用于:将Canopy集合的数量N作为K均值聚类算法的要构建的划分的数目k;将各个Canopy集合的中心作为划分的k个簇的簇中心;基于上述确定的簇数k和簇中心对所有原始数据采用K均值聚类算法进行聚类优化处理,输出聚类优化结果。
综上所述,本发明采用的技术方案为一种基于Canopy的聚类优化方法,本方法的主要思想是:针对某一数据集合,设置Canopy初始中心点与区域半径,将数据集合高效地划分成若干重叠的子集(即Canopy),使得所有对象均落在Canopy覆盖的范围内;对落在同一区域内的对象,重新计算出新中心点并根据对象与新中心点之间的距离重新划分对象所属区域;循环执行“划分Canopy-计算中心点”的过程,直到k中心点的位置不再发生变化,即达到一种稳定的分类状态为止。Canopy聚类算法用于K均值聚类算法的预处理,用来找合适的k值和簇中心。
与现有技术相比,本发明的优点和积极效果:
1)传统的K均值算法对初始聚类中心敏感,针对K均值算法存在的问题,利用Canopy聚类划分来优化初始聚类中心。
2)由于先将所有的数据点进行Canopy划分,在计算数据点离哪个K-center最近时,不必计算其到所有K-centers的距离,只计算和它在同一个Canopy下的K-centers距离,避免了传统聚类算法中对所有数据点进行精确计算,通过减少比较次数大大降低整个聚类的运行时间,提高了算法的计算效率。
3)Canopy聚类允许有重叠子集,增加了算法的容错性,有利于消除孤立点的影响。
附图说明
图1是本发明所述方法的总体流程图;
图2-a和2-b是本发明所述方法中Canopy算法的示意图及完成后的仿真图;
图3是本发明所述方法中生成Canopy流程图。
具体实施方式
下面结合附图对本发明作进一步详细描述。
本发明提供了一种基于Canopy算法的聚类优化方法,所述方法包含:
步骤101)基于Canopy算法对所有的原始数据进行分组处理,进而得到N个Canopy集合及各个Canopy集合的中心。
为了实现上述步骤101)本发明提供了一种具体的方法,具体步骤包含:
步骤101-1)从原始数据任意选取m个数据点作为初始中心点集合,并设置第一区域半径T1和第二区域半径T2,且T1>T2,m为大于等于一的自然数;
步骤101-2)将所有原始数据组成一个列表,并将上述选择的m个数据从列表中删除;
步骤101-3)从列表中取出第一个原始数据,并计算第一个原始数据与m个初始中心点的距离,并对所有初始中心点均进行如下处理:
当初始中心点i与第一个原始数据的距离小于第一区域半径T1时,将第一个原始数据划分到初始中心点i所在的Canopy集合中,然后重新计算Canopy集合的中心,并对初始中心点进行更新;
当初始中心点i与第一个原始数据的距离同时小于第二区域半径T2时,将第一个原始数据从列表中删除;
当第一个原始数据与所有m个初始中心点的距离均大于等于第一区域半径T1时,将该原始数据作为一个新的Canopy集合的初始中心点并从列表中删除,进而构建一个新的Canopy集合;
步骤101-4)从列表中取出第二个原始数据,并计算第二个原始数据与上步骤更新后得到的各个新的初始中心点的距离,并对所有初始中心点均进行如下处理;
当初始中心点u与第二个原始数据的距离小于第一区域半径T1时,将第二个原始数据归到初始中心点u所在的Canopy集合中,然后重新计算Canopy集合的中心,对初始中心点进行再次更新;
当初始中心点u与第二个原始数据的距离同时小于第二区域半径T2时,将第二个原始数据从列表中删除;;
当第二个原始数据与初始中心点的距离均大于等于第一区域半径T1时,将该原始数据作为一个新的Canopy集合的初始中心点并在列表中删除该原始数据,进而构建一个新的Canopy集合;
步骤101-5)依次取出列表中剩余的各个原始数据重复步骤101-3)或步骤101-4)的处理过程,直至Canopy集合的数目及各个Canopy集合的中心点位置均不再发生变化,即达到了稳定状态,输出最终的簇的数目k和每个簇的中心。
进一步可选的,所述的列表存放在内存中。
步骤102)将Canopy集合的数量N作为K均值聚类算法的要构建的划分的数目k;
将各个Canopy集合的中心分别和k个簇的簇中心;
基于上述确定的簇数k和簇中心对所有原始数据采用K均值聚类算法进行聚类优化处理,输出聚类优化结果。具体为:在达到稳定态的各个Canopy集合内使用K均值聚类算法进行聚类优化。
此外,本发明还提供了一种基于Canopy算法的聚类优化系统,所述系统包含:
预处理模块,用于基于Canopy算法对所有的原始数据进行分组处理,进而得到N个Canopy集合及各个Canopy集合的中心。
可选的,上述所述预处理模块进一步包含:
设置模块,用于从原始数据任意选取m个作为初始中心点集合,并设置第一区域半径T1和第二区域半径T2,且T1>T2,m为大于等于一的自然数;
列表生成及列表更新模块,用于将所有原始数据组成一个列表,并将选作初始中心点的数据从列表中删除;
处理模块,用于:从列表中取出第一个原始数据,并计算第一个原始数据与m个初始中心点的距离,并对所有初始中心点均进行如下处理:当初始中心点i与第一个原始数据的距离小于第一区域半径T1时,将第一个原始数据划分到初始中心点i所在的Canopy集合中,然后重新计算Canopy集合的中心,并对初始中心点进行更新;当初始中心点i与第一个原始数据的距离同时小于第二区域半径T2时,将第一个原始数据从列表中删除;当第一个原始数据与所有m个初始中心点的距离均大于等于第一区域半径T1时,将该原始数据作为一个新的Canopy集合的初始中心点并从列表中删除;
用于:从列表中取出第二个原始数据,并计算第二个原始数据与上步骤更新后得到的各个新的初始中心点的距离,并对所有初始中心点均进行如下处理;当初始中心点u与第二个原始数据的距离小于第一区域半径T1时,将第二个原始数据归到初始中心点u所在的Canopy集合中,然后重新计算Canopy集合的中心,对初始中心点进行再次更新;当初始中心点u与第二个原始数据的距离同时小于第二区域半径T2时,将第二个原始数据从列表中删除;当第二个原始数据与初始中心点的距离均大于等于第一区域半径T1时,将该原始数据作为一个新的Canopy集合的初始中心点并在列表中删除该原始数据;
用于:依次取出列表中剩余的各个原始数据重复上述的处理过程将各原始数据划分至某个Canopy集合,直至Canopy集合的数目及各个Canopy集合的中心点位置均不再发生变化,即达到了稳定状态,输出最终的簇的数目k和每个簇的中心。
进一步可选的,上述所述处理模块进一步包含:
距离计算及判决模块,用于计算原始数据与一个初始中心点之间的距离;当得到的距离小于第一区域半径时把该原始数据划分至初始中心点所在的Canopy集合,当该距离同时还小于第二区域半径时将该原始数据从列表中删除;当得到的距离大于等于第一区域半径时,将该原始数据作为新的初始中心点,进而构建一个新的Canopy集合;
判决输出模块,用于判断列表中的原始数据是否取完,如果列表中的数据全部被取出后且当各个Canopy集合的中心不再变化且Canopy集合的数量不再变化时,获得最终的N个Canopy集合及各个Canopy集合的中心。
聚类模块,用于:将Canopy集合的数量N作为K均值聚类算法的要构建的划分的数目k;将各个Canopy集合的中心分别和k个簇的簇中心;基于上述确定的簇数k和簇中心对所有原始数据采用K均值聚类算法进行聚类优化处理,输出聚类优化结果。
实施例:
图1是本发明所述方法的总体流程图,主要分为2个步骤:
1)选择简单、计算代价较低的Canopy聚类方法计算对象相似性,将相似的对象放在一个子集中,这个子集被叫做Canopy,通过一系列计算得到若干Canopy,Canopy之间可以是重叠的,但不会存在某个对象不属于任何Canopy的情况,可以把这一阶段看做数据预处理;数据集的Canopy聚类完成后,类似于图2:
2)在各个Canopy内使用K均值聚类算法,不属于同一Canopy的对象之间不进行相似性计算。
生成Canopy的主要思想:初始,假设我们有一组点集S,并且预设了两个距离阈值,T1,T2(T1>T2);然后选择一个点,计算它与S中其他点的距离(这里采用成本很低的计算方法),将距离在T1以内的放入一个Canopy中,同时从S中去掉那些与此点距离在T2以内的点(这里是为了保证和中心距离在T2以内的点不能再作为其他Canopy的中心),重复整个过程直到S为空为止。
图2和图3是本发明所述方法中生成Canopy的流程图,生成Canopy包括以下
步骤:
3)将数据集向量化得到一个list后放入内存,选择两个距离阈值:T1和T2,其中T1>T2,T1和T2的值可以用交叉校验来确定;
4)从list中任取一点P,用低计算成本方法快速计算点P与所有Canopy之间的距离(如果当前不存在Canopy,则把点P作为一个Canopy),如果点P与某个Canopy距离在T1以内,则将点P加入到这个Canopy;
5)如果点P与某个Canopy的距离在T2以内,则需要把点P从list中删除,此时认为点P与这个Canopy已经很近,因此它不可以再做其它Canopy的中心;
6)重复步骤4)、步骤5),直到list为空结束。
时间复杂度分析:
K均值聚类随机选择K个数据作为初始的聚类中心,按照算法的迭代执行,整个算法的结束条件是类的重心不再改变。传统的K均值聚类时间复杂度是O(n*k*t),其中,n为对象个数,k为类别数,t为迭代次数。在运用Canopy算法对K均值聚类进行优化的情况下,由于划分Canopy是可覆盖划分,即某一点有可能同时属于多个Canopy,时间复杂度为O(n*k*t*f2/c),其中n为对象个数,k为类别数,t为迭代次数,f为平均每个数据对象对应的Canopy个数,c为Canopy的总个数。
总之,本发明提供了一种基于Canopy的聚类优化方法,本方法的主要思想是:针对某一数据集合,设置Canopy初始中心点与区域半径,将数据集合高效地划分成若干重叠的子集(即Canopy),使得所有对象均落在Canopy覆盖的范围内;对落在同一区域内的对象,重新计算出新中心点并根据对象与新中心点之间的距离重新划分对象所属区域;循环执行“划分Canopy-计算中心点”的过程,直到k中心点的位置不再发生变化,即达到一种稳定的分类状态为止。本发明中Canopy聚类算法用于K均值聚类算法的预处理,用来找合适的k值和簇中心。大大降低整个聚类的运行时间,提高了算法的计算效率,增加了算法的容错性。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (8)

1.一种基于Canopy算法的聚类优化方法,所述方法包含:
步骤101)基于Canopy算法对所有的原始数据进行分组处理,进而得到N个Canopy集合及各个Canopy集合的中心;
步骤102)将Canopy集合的数量N作为K均值聚类算法要构建的划分数目k;
将各个Canopy集合的中心作为划分的k个簇的簇中心;
基于上述确定的簇数k和簇中心对所有原始数据采用K均值聚类算法进行聚类优化处理,输出聚类优化结果。
2.根据权利要求1所述的基于Canopy算法的聚类优化方法,其特征在于,所述步骤101)进一步包含:
步骤101-1)从原始数据任意选取m个数据点作为初始中心点集合,并设置第一区域半径T1和第二区域半径T2,且T1>T2,m为大于等于一的自然数;
步骤101-2)将所有原始数据组成一个列表,并将上述选择的m个数据从列表中删除;
步骤101-3)从列表中取出第一个原始数据,并计算第一个原始数据与m个初始中心点的距离,并对所有初始中心点均进行如下处理:
当初始中心点i与第一个原始数据的距离小于第一区域半径T1时,将第一个原始数据划分到初始中心点i所在的Canopy集合中,然后重新计算Canopy集合的中心,并对初始中心点进行更新;
当初始中心点i与第一个原始数据的距离同时小于第二区域半径T2时,将第一个原始数据从列表中删除;
当第一个原始数据与所有m个初始中心点的距离均大于等于第一区域半径T1时,将该原始数据作为一个新的Canopy集合的初始中心点并从列表中删除,进而构建一个新的Canopy集合;
步骤101-4)从列表中取出第二个原始数据,并计算第二个原始数据与上步骤更新后得到的各个新的初始中心点的距离,并对所有初始中心点均进行如下处理;
当初始中心点u与第二个原始数据的距离小于第一区域半径T1时,将第二个原始数据归到初始中心点u所在的Canopy集合中,然后重新计算Canopy集合的中心,对初始中心点进行再次更新;
当初始中心点u与第二个原始数据的距离同时小于第二区域半径T2时,将第二个原始数据从列表中删除;
当第二个原始数据与初始中心点的距离均大于等于第一区域半径T1时,将该原始数据作为一个新的Canopy集合的初始中心点并在列表中删除该原始数据,进而构建一个新的Canopy集合;
步骤101-5)依次取出列表中剩余的各个原始数据重复步骤101-3)或步骤101-4)的处理过程,直至Canopy集合的数目及各个Canopy集合的中心点位置均不再发生变化,即达到了稳定状态,输出最终的簇的数目k和每个簇的中心。
3.根据权利要求2所述的基于Canopy算法的聚类优化方法,其特征在于,所述的列表存放在内存中。
4.根据权利要求2所述的基于Canopy算法的聚类优化方法,其特征在于,步骤102)在达到稳定态的各个Canopy集合内使用K均值聚类算法进行聚类优化。
5.一种基于Canopy算法的聚类优化系统,其特征在于,所述系统包含:
预处理模块,用于基于Canopy算法对所有的原始数据进行分组处理,进而得到N个Canopy集合及各个Canopy集合的中心;
聚类模块,用于:将Canopy集合的数量N作为K均值聚类算法要构建的划分数目k;将各个Canopy集合的中心作为k个簇的簇中心;基于上述确定的簇数k和簇中心对所有原始数据采用K均值聚类算法进行聚类优化处理,输出聚类优化结果。
6.根据权利要求5所述的基于Canopy算法的聚类优化系统,其特征在于,所述预处理模块进一步包含:
设置模块,用于从原始数据任意选取m个作为初始中心点集合,并设置第一区域半径T1和第二区域半径T2,且T1>T2,m为大于等于一的自然数;
列表生成及列表更新模块,用于将所有原始数据组成一个列表,并将选作初始中心点的数据从列表中删除;
处理模块,用于:
从列表中取出第一个原始数据,并计算第一个原始数据与m个初始中心点的距离,并对所有初始中心点均进行如下处理:
当初始中心点i与第一个原始数据的距离小于第一区域半径T1时,将第一个原始数据划分到初始中心点i所在的Canopy集合中,然后重新计算Canopy集合的中心,并对初始中心点进行更新;
当初始中心点i与第一个原始数据的距离同时小于第二区域半径T2时,将第一个原始数据从列表中删除;
当第一个原始数据与所有m个初始中心点的距离均大于等于第一区域半径T1时,将该原始数据作为一个新的Canopy集合的初始中心点并从列表中删除;
从列表中取出第二个原始数据,并计算第二个原始数据与上步骤更新后得到的各个新的初始中心点的距离,并对所有初始中心点均进行如下处理;
当初始中心点u与第二个原始数据的距离小于第一区域半径T1时,将第二个原始数据归到初始中心点u所在的Canopy集合中,然后重新计算Canopy集合的中心,对初始中心点进行再次更新;
当初始中心点u与第二个原始数据的距离同时小于第二区域半径T2时,将第二个原始数据从列表中删除;;
当第二个原始数据与初始中心点的距离均大于等于第一区域半径T1时,将该原始数据作为一个新的Canopy集合的初始中心点并在列表中删除该原始数据;
依次取出列表中剩余的各个原始数据重复上述的处理过程将各原始数据划分至某个Canopy集合,直至Canopy集合的数目及各个Canopy集合的中心点位置均不再发生变化,即达到了稳定状态,输出最终的簇的数目k和每个簇的中心。
7.根据权利要求6所述的基于Canopy算法的聚类优化系统,其特征在于,所述的预处理模块将所有原始数据存放在内存中。
8.根据权利要求6所述的基于Canopy算法的聚类优化系统,其特征在于,所述处理模块进一步包含:
距离计算及判决模块,用于计算原始数据与一个初始中心点之间的距离;当得到的距离小于第一区域半径时把该原始数据划分至初始中心点所在的Canopy集合,当该距离同时还小于第二区域半径时将该原始数据从列表中删除;当得到的距离大于等于第一区域半径时,将该原始数据作为新的初始中心点,进而构建一个新的Canopy集合;
判决输出模块,用于判断列表中的原始数据是否取完,如果列表中的数据全部被取出后且当各个Canopy集合的中心不再变化且Canopy集合的数量不再变化时,获得最终的N个Canopy集合及各个Canopy集合的中心。
CN201410194172.7A 2014-05-08 2014-05-08 一种基于Canopy算法的聚类优化方法及系统 Pending CN105095266A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410194172.7A CN105095266A (zh) 2014-05-08 2014-05-08 一种基于Canopy算法的聚类优化方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410194172.7A CN105095266A (zh) 2014-05-08 2014-05-08 一种基于Canopy算法的聚类优化方法及系统

Publications (1)

Publication Number Publication Date
CN105095266A true CN105095266A (zh) 2015-11-25

Family

ID=54575720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410194172.7A Pending CN105095266A (zh) 2014-05-08 2014-05-08 一种基于Canopy算法的聚类优化方法及系统

Country Status (1)

Country Link
CN (1) CN105095266A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787509A (zh) * 2016-02-25 2016-07-20 中南大学 一种铁矿混匀过程的预配料方法
CN106162529A (zh) * 2016-07-08 2016-11-23 北京邮电大学 室内定位方法与装置
CN106484838A (zh) * 2016-09-30 2017-03-08 中国南方电网有限责任公司 基于数据挖掘的安全检查标准库动态更新方法
CN107193867A (zh) * 2017-04-07 2017-09-22 广东精点数据科技股份有限公司 基于大数据的热点话题分析方法
CN107392239A (zh) * 2017-07-11 2017-11-24 南京邮电大学 一种基于Spark计算模型的K‑Means算法优化方法
CN108764555A (zh) * 2018-05-22 2018-11-06 浙江大学城市学院 一种基于Hadoop的共享单车停放点选址方法
CN109241320A (zh) * 2018-09-30 2019-01-18 电子科技大学 基于时间序列聚类的未成年犯罪地区簇的划分方法
CN109363614A (zh) * 2018-08-29 2019-02-22 合肥德易电子有限公司 具有高清视像增强处理功能的智能一体化机器人腔镜系统
CN109511555A (zh) * 2018-11-08 2019-03-26 苏州科技大学 一种改进的婴幼儿智能喂养工具及智能喂养方法
CN109801175A (zh) * 2019-01-21 2019-05-24 北京邮电大学 一种医保诈骗行为检测方法和装置
CN109828695A (zh) * 2018-12-29 2019-05-31 合肥金诺数码科技股份有限公司 一种基于激光雷达定位的大屏幕交互系统
CN109961851A (zh) * 2019-02-25 2019-07-02 南京理工大学 一种基于改进k均值聚类的疾病危险因素提取方法
CN110232398A (zh) * 2019-04-24 2019-09-13 广东交通职业技术学院 一种基于Canopy+Kmeans聚类的路网子区划分及其评估方法
CN110796186A (zh) * 2019-10-22 2020-02-14 华中科技大学无锡研究院 基于改进的YOLOv3网络的干湿垃圾识别分类方法
CN111062425A (zh) * 2019-12-10 2020-04-24 中国人民解放军海军工程大学 基于c-k-smote算法的不平衡数据集处理方法
CN111581274A (zh) * 2020-05-08 2020-08-25 深圳市甲易科技有限公司 一种实现信息可视化的轨迹规律分析方法
CN112035454A (zh) * 2020-08-28 2020-12-04 江苏徐工信息技术股份有限公司 一种基于聚类集成的黑工地检测算法
CN112911605A (zh) * 2021-01-12 2021-06-04 中国联合网络通信集团有限公司 基站规划方法和装置
CN113011460A (zh) * 2021-02-19 2021-06-22 建信金融科技有限责任公司 一种基于局部搜索聚类算法的用户画像方法和装置
CN114720878A (zh) * 2022-03-24 2022-07-08 长安大学 一种退役电池的状态检测方法
CN117542536A (zh) * 2024-01-10 2024-02-09 中国人民解放军海军青岛特勤疗养中心 一种基于体检数据的智能护理方法及系统

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105787509B (zh) * 2016-02-25 2018-12-14 中南大学 一种铁矿混匀过程的预配料方法
CN105787509A (zh) * 2016-02-25 2016-07-20 中南大学 一种铁矿混匀过程的预配料方法
CN106162529A (zh) * 2016-07-08 2016-11-23 北京邮电大学 室内定位方法与装置
CN106484838A (zh) * 2016-09-30 2017-03-08 中国南方电网有限责任公司 基于数据挖掘的安全检查标准库动态更新方法
CN107193867A (zh) * 2017-04-07 2017-09-22 广东精点数据科技股份有限公司 基于大数据的热点话题分析方法
CN107392239A (zh) * 2017-07-11 2017-11-24 南京邮电大学 一种基于Spark计算模型的K‑Means算法优化方法
CN108764555A (zh) * 2018-05-22 2018-11-06 浙江大学城市学院 一种基于Hadoop的共享单车停放点选址方法
CN108764555B (zh) * 2018-05-22 2021-08-31 浙江大学城市学院 一种基于Hadoop的共享单车停放点选址方法
CN109363614B (zh) * 2018-08-29 2020-09-01 合肥德易电子有限公司 具有高清视像增强处理功能的智能一体化机器人腔镜系统
CN109363614A (zh) * 2018-08-29 2019-02-22 合肥德易电子有限公司 具有高清视像增强处理功能的智能一体化机器人腔镜系统
CN109241320A (zh) * 2018-09-30 2019-01-18 电子科技大学 基于时间序列聚类的未成年犯罪地区簇的划分方法
CN109511555A (zh) * 2018-11-08 2019-03-26 苏州科技大学 一种改进的婴幼儿智能喂养工具及智能喂养方法
CN109511555B (zh) * 2018-11-08 2021-12-17 苏州科技大学 一种改进的婴幼儿智能喂养工具及智能喂养方法
CN109828695A (zh) * 2018-12-29 2019-05-31 合肥金诺数码科技股份有限公司 一种基于激光雷达定位的大屏幕交互系统
CN109828695B (zh) * 2018-12-29 2022-02-18 合肥金诺数码科技股份有限公司 一种基于激光雷达定位的大屏幕交互系统
CN109801175A (zh) * 2019-01-21 2019-05-24 北京邮电大学 一种医保诈骗行为检测方法和装置
CN109961851A (zh) * 2019-02-25 2019-07-02 南京理工大学 一种基于改进k均值聚类的疾病危险因素提取方法
CN110232398A (zh) * 2019-04-24 2019-09-13 广东交通职业技术学院 一种基于Canopy+Kmeans聚类的路网子区划分及其评估方法
CN110796186A (zh) * 2019-10-22 2020-02-14 华中科技大学无锡研究院 基于改进的YOLOv3网络的干湿垃圾识别分类方法
CN111062425A (zh) * 2019-12-10 2020-04-24 中国人民解放军海军工程大学 基于c-k-smote算法的不平衡数据集处理方法
CN111062425B (zh) * 2019-12-10 2022-10-28 中国人民解放军海军工程大学 基于c-k-smote算法的不平衡数据集处理方法
CN111581274A (zh) * 2020-05-08 2020-08-25 深圳市甲易科技有限公司 一种实现信息可视化的轨迹规律分析方法
CN112035454A (zh) * 2020-08-28 2020-12-04 江苏徐工信息技术股份有限公司 一种基于聚类集成的黑工地检测算法
CN112911605A (zh) * 2021-01-12 2021-06-04 中国联合网络通信集团有限公司 基站规划方法和装置
CN113011460A (zh) * 2021-02-19 2021-06-22 建信金融科技有限责任公司 一种基于局部搜索聚类算法的用户画像方法和装置
CN114720878A (zh) * 2022-03-24 2022-07-08 长安大学 一种退役电池的状态检测方法
CN117542536A (zh) * 2024-01-10 2024-02-09 中国人民解放军海军青岛特勤疗养中心 一种基于体检数据的智能护理方法及系统
CN117542536B (zh) * 2024-01-10 2024-04-12 中国人民解放军海军青岛特勤疗养中心 一种基于体检数据的智能护理方法及系统

Similar Documents

Publication Publication Date Title
CN105095266A (zh) 一种基于Canopy算法的聚类优化方法及系统
US20190095818A1 (en) Gradient-based auto-tuning for machine learning and deep learning models
Kazakovtsev et al. Genetic algorithm with fast greedy heuristic for clustering and location problems
JP2018533153A (ja) 機械学習に基づくネットワークモデル構築方法及び装置
Hung et al. Candidate groups search for K-harmonic means data clustering
CN104657418B (zh) 一种基于隶属度传播的复杂网络模糊社团挖掘方法
Whang et al. Scalable and memory-efficient clustering of large-scale social networks
CN109815541B (zh) 轨道交通车辆产品零部件模块划分方法、装置与电子设备
CN103886396A (zh) 一种人工鱼群与粒子群混合优化的确定方法
CN104978498A (zh) 生物分子网络拓扑结构比对的自适应方法
CN105205052A (zh) 一种数据挖掘方法及装置
CN113128618A (zh) 基于kd树和混沌蜉蝣优化算法的并行谱聚类方法
CN105069290A (zh) 一种面向寄递数据的并行化关键节点发现方法
CN103957537B (zh) 基于信道聚类的频谱感知方法及装置
Hu et al. Parallel clustering of big data of spatio-temporal trajectory
CN106022359A (zh) 基于有序信息熵的模糊熵空间聚类分析方法
CN107590225A (zh) 一种基于分布式数据挖掘算法的可视化管理系统
CN104573331A (zh) 一种基于MapReduce的K近邻数据预测方法
CN104318306A (zh) 基于非负矩阵分解和进化算法优化参数的自适应交叠社区检测方法
CN104050189B (zh) 页面共享处理方法及装置
Adi et al. Parallel evolutionary algorithms for feature selection in high dimensional datasets
CN108717444A (zh) 一种基于分布式结构的大数据聚类方法和装置
CN103207936A (zh) 一种基于空间缩减策略的序列采样算法
CN102254040A (zh) 一种基于支撑向量机的Web划分方法
CN105354243B (zh) 基于归并聚类的并行化频繁概率子图搜索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151125

RJ01 Rejection of invention patent application after publication