CN111291822A - 基于模糊聚类最优k值选择算法的设备运行状态判断方法 - Google Patents

基于模糊聚类最优k值选择算法的设备运行状态判断方法 Download PDF

Info

Publication number
CN111291822A
CN111291822A CN202010110361.7A CN202010110361A CN111291822A CN 111291822 A CN111291822 A CN 111291822A CN 202010110361 A CN202010110361 A CN 202010110361A CN 111291822 A CN111291822 A CN 111291822A
Authority
CN
China
Prior art keywords
cluster
data
clustering
optimal
fuzzy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010110361.7A
Other languages
English (en)
Other versions
CN111291822B (zh
Inventor
崔国楠
王立松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202010110361.7A priority Critical patent/CN111291822B/zh
Publication of CN111291822A publication Critical patent/CN111291822A/zh
Application granted granted Critical
Publication of CN111291822B publication Critical patent/CN111291822B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Evolutionary Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Biophysics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于模糊聚类最优k值选择算法的设备运行状态判断方法,包括:根据待测试设备的运行情况采集测试数据,并对数据进行预处理;根据处理后的测试数据,建立双目标模型;使用CDG优化算法对双目标模型进行优求解;使用DB指数对优化求解后的结果进行转换,计算得到最优聚类个数k;根据得到的最优聚类个数k,使用模糊聚算法FCM对经预处理的测试数据进行分析,将其划分为k个聚类;统计每一个聚类的数据中心、每个聚类中数据的特征、每个聚类所包括的范围,并根据这些聚类的特征情况判断当前设备的运行状态。本发明缩小了聚类算法中因为确定最优聚类个数k而导致的结果误差,能够更为准确地用于判断设备运行状态。

Description

基于模糊聚类最优k值选择算法的设备运行状态判断方法
技术领域
本发明属于数据挖掘领域,具体涉及基于模糊聚类最优k值选择算法的设备运行状态判断方法。
背景技术
随着现代工业及科学技术的快速发展,工业设备的结构日趋复杂,为了有效避免设备出现故障,需要对设备的运行状态进行实时监测。而由于设备的复杂性,判断其运行状态所涉及的参数较多,传统的监测方法效率低下,需要采用合适的算法来进行有效的分类和判断。
随着互联网技术的发展,聚类分析在众多领域中发挥着重要的作用。聚类是一种无监督学习方法,它可以主动的对数据点进行分组,使得同一个集群的数据点具有极高的相似性,属于不同集群的数据点有着较大的差异性。目前的聚类算法可以大致分为两大类,第一类为硬聚类算法例如k-means、k-means++、intelligent k-means等,即硬聚类算法将一个数据集划分为多个簇,并且每一个对象只属于一个簇。第二类为模糊聚类算法,模糊聚类算法例如fuzzy c-means、MAFC允许每一个对象可以根据隶属度不同属于多个簇。
但是无论是硬聚类算法或者是模糊聚类算法在算法开始前都需要认为的确定聚类个数k。由于现实世界中真实数据的复杂习性,在没有先验知识的情况下,再加上在处理数据前不了解数据的具体结构,导致不能准确的在算法开始前确定聚类数目k。目前,一些研究提出了聚类有效性指标解决聚类k值问题。聚类有效性指标可以根据数据的特征值以及聚类后得到的特征值来进行判断,根据特征值前后的比值大小来判断k值的合理性。通过聚类的有效性指标,可以从数据集的信息中更好的分析数据集的结构,从而得到数据集的最优分类数。聚类有效性指标分为两类:外部有效性指标和内部有效性指标。外部有效性指标可以通过将分区与假定的正确分区结果比较来进行评估分区。内部有效性指标则通过检查结果来评估分区,通常衡量集群内部的紧密度和分离度来评估聚类分区的好坏。在过去的几十年里,人们提出许多聚类内部有效性指标来对聚类进行验证。然而当簇数趋向于数据点中的数据数量时,这些指标会趋于单调下降,并且计算有效性指标需要提供正确的聚类中心。在没有正确聚类中心,k值取值范围过大的情况下找到最优k值一直是一个难题。
发明内容
针对上述问题,本发明提出了基于模糊聚类最优k值选择算法的设备运行状态判断方法,涉及基于多目标优化算法的聚类最优k值选择的方法,由于一些模糊聚类指标随着聚类个数k的增加而减小,设计一个关于模糊聚类指标与聚类个数k之间的双目标模型,使用多目标优化算法(MOEA)对双目标进行优化得到最优k值。
为实现上述目的,本发明采用以下技术方案:
基于模糊聚类最优k值选择算法的设备运行状态判断方法,其特征在于,包括如下步骤:
步骤1:根据待测试设备的运行情况采集测试数据,并对数据进行数据清洗及数据归一化的预处理;
步骤2:根据处理后的测试数据,建立双目标模型;
步骤3:使用CDG优化算法对双目标模型进行优求解;
步骤4:使用DB指数对优化求解后的结果进行转换,计算得到最优聚类个数k;
步骤5:根据得到的最优聚类个数k,使用模糊聚算法FCM对经预处理的测试数据进行分析,将其划分为k个聚类;
步骤6:统计每一个聚类的数据中心、每个聚类中数据的特征、每个聚类所包括的范围,并根据这些聚类的特征情况判断当前设备的运行状态。
为优化上述技术方案,采取的具体措施还包括:
进一步地,步骤2中,首先通过分析模糊聚类的紧凑度和分离度建立模糊聚类指标:
设X={x1,x2,x3,...,xn}为聚类分析的测试数据集,xi={xi1,xi2,xi3,...,xin}表示测试数据xi的n个特征,MSD为形态相似距离,紧凑度函数如下所示:
Figure BDA0002388664700000021
其中k为聚类中心个数,C={c1,c2,...,ck}为聚类中心的集合,U为隶属度矩阵,uij∈U为第j个数据在第i个聚类的隶属度系数,MSD(xj,ci)表示第j个数据在第i个聚类的偏差;
设Fp和Fq是属于一个模糊分区(k,U)的两个模糊聚类,分离度函数如下所示:
Figure BDA0002388664700000022
Figure BDA0002388664700000023
S(xj:Fp,Fq)=min(Fp(xj),Fq(xj))
Figure BDA0002388664700000024
其中S(Fp,Fq),p,q∈C为在数据集X中,模糊聚类Fp,Fq的相似性;Fp(xj)为xj在第p个聚类的协方差矩阵,h(xj)表示一种权值;
定义FDCS为紧密度Comp和分离度Sep之和,FDCS的值越小,则表示模糊聚类重叠程度更小,聚类内部更紧凑;
FDCS(k,U)=Comp(k,U)+Sep(k,U)
将FDCS进行如下的转换,保证了在非正确的聚类中心下目标函数f1和f2仍然是冲突的;
min F(x)={f1(x)=1-exp-FDCS(k,U)-k,f2(x)=k}
其中f2代表聚类个数k,f1代表根据f2取值进行聚类划分的度量指标。
进一步地,h(xj)根据模糊聚类之间重叠数据点的共享程度来调整对重叠数据点的强调程度,如下所示:
Figure BDA0002388664700000031
其中upj(xj)表示数据xj在模糊分区p中的隶属度,uqj(xj)表示数据xj在迷糊分区q中的隶属度。
进一步地,步骤3具体包括以下步骤:
步骤3.1:初始化网格系统GS的网格邻居数以及网格距离、理想点、最低点;在建立GS之后对进行种群P随机初始化,并且基于P确定理想点和最低点;
步骤3.2:N个子代从P中生产,同时一个空集合Q被定义用于子代的排序;对于每一个解x={f1,f2},其匹配解都是通过邻居选择NS来获取的;
步骤3.3:从NS随机选择两个解xi,xj,xi,xj产生一个它们的子代y,之后将y添加到集合Q中;
步骤3.4:利用组合种群P=P∪Q更新理想和最低点,使其更加接近真实值;
步骤3.5:使用新的种群P更新GS;
步骤3.6:选择每个k值对应的非支配解;
步骤3.7:通过MOEA得到范围内所有k值的帕累托最优,并组成帕累托前沿。
进一步地,步骤4中,通过聚类内散射与聚类间分离之和的比值得到最优的k值,DB指数越小则所划分的聚类个数k越好,当DB在规定范围内得到的最小值即为最优k值;
Figure BDA0002388664700000032
Figure BDA0002388664700000033
其中
Figure BDA0002388664700000041
为第i个聚类内的散射值,Vi为该聚类的数据点数量,c为该聚类的聚类中心,dij=MSD(ci,cj)两个聚类中心的形态相似距离。
本发明的有益效果是:将基于多目标算法的模糊聚类最优k值选择方法(FuzzyMOEA-K)运用于设备运行状态判断中,通过建立模糊聚类指标与聚类个数k之间的双目标模型,将聚类k值问题转换为多目标优化问题并通过多目标优化算法解决。通过该方法,解决了模糊聚类有效性指标依赖正确聚类中心、随k值增加而单调递减的问题,同时缩小了聚类算法中因为确定最优聚类个数k而导致的结果误差,能够更为准确地对表示运行情况的测试数据进行分类,从而进行更好的设备运行状态判断。
附图说明
图1为模糊聚类最优k值选择算法的执行示意图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。
如图1所示,本方法的核心步骤如下:
1、建立待测数据集的聚类个数k值与模糊聚类指标的双目标模型。
2、设置优化算法的最大迭代次数,并随机产生父类解,通过父类解的杂交变异操作产生子代解。之后将子代解和父类解相结合,并对该集合执行环境选择操作,得到当前的帕累托非支配解,并使迭代次数加一。当迭代次数达到最大迭代次数的时候则得到该双目标模型的帕累托前沿根据所得到的聚类k值。
3、结合每一个k值对应的帕累托前沿,使用DB指数进行转换得到最优居累个数k值,并使用模糊聚算法FCM对预处理的数据进行分析,将其划分为k个聚类。
具体流程如下:
步骤1:根据待测试设备每个部分运行情况采集测试数据,并对数据进行数据清洗,数据归一化的预处理。
步骤2:建立双目标模型,首先通过分析模糊聚类的紧凑度和分离度建立模糊聚类指标:
设X={x1,x2,x3,...,xn}为聚类分析的数据集,xi={xi1,xi2,xi3,...,xin}表示xi的n个特征,MSD为形态相似距离。
Figure BDA0002388664700000042
其中k为聚类中心个数,C={c1,c2,...,ck}为聚类中心的集合,U为隶属度矩阵,uij∈U为第j个数据在第i个聚类的隶属度系数,MSD(xj,ci)则表示了第j数据在第i个聚类的偏差。由紧凑度函数可知Comp的值越小,则聚类越紧凑。
分离度函数检验的是不同聚类之间的关系,利用模糊聚类之间的距离测度可以得到分离度,其思想是将每个模糊聚类表示为一个模糊集合。为了得到模糊集之间的距离,我们使用相似度量。设Fp和Fq是属于一个模糊分区(k,U)的两个模糊聚类,分离度函数如下所示:
Figure BDA0002388664700000051
Figure BDA0002388664700000052
S(xj:Fp,Fq)=min(Fp(xj),Fq(xj))
Figure BDA0002388664700000053
其中S(Fp,Fq)且p,q∈C为在数据集X中,模糊聚类Fp,Fq的相似性。Fp(xj)为xj在第p个聚类的协方差矩阵,h(xj)表示一种权值,它可以根据模糊聚类之间重叠数据点的共享程度来调整对重叠数据点的强调程度,如下所示:
Figure BDA0002388664700000054
upj(xj)表示数据xj在模糊分区p中的隶属度,FDCS定义为紧密度Comp和分离度Sep之和,FDCS的值越小,则表示模糊聚类重叠程度更小,聚类内部更紧凑。
FDCS(k,U)=Comp(k,U)+Sep(k,U)
随着聚类个数k的增多,FDCS的值会越小,然后FDCS不能直接作为双目标中的目标函数。这是因为只有在正确的聚类中心的情况下FDCS的值才会随着聚类k值的增大而减小。如果在非正确的聚类中心下使用FDCS作为目标函数,可能导致原本正确的k值非支配解被控制,从而陷入局部最优。
为了保证目标函数总是冲突的,可以将FDCS进行如下的转换,保证了在非正确的聚类中心下目标函数f1和f2仍然是冲突的,f2代表聚类个数k,f1代表根据f2取值进行聚类划分的度量指标。
min F(x)={f1(x)=1-exp-FDCS(k,U)-k,f2(x)=k}
步骤3:使用CDG优化算法对双目标模型进行优化求解:
步骤3.1:初始化网格系统(GS)的网格邻居数以及网格距离、理想点、最低点。在建立GS之后对种群P随机初始化,并且一个ideal和nadir点基于P被确定;
步骤3.2:N个子代从P中生产,同时一个空集合Q被定义用于子代的排序。对于每一个解x={f1,f2},其匹配解都是通过邻居选择NS(neighbor select)来获取的;
步骤3.3:从NS随机选择两个解xi,xj,xi,xj产生一个它们的子代y,之后将y添加到集合Q中;
步骤3.4:利用组合种群P=P∪Q更新ideal和nadir点,使其更加接近真实值;
步骤3.5:使用新的种群P更新GS;
步骤3.6:选择每个k对应的非支配解;
步骤3.7:通过MOEA得到范围内所有k值的帕累托最优,并组成帕累托前沿。
步骤4:使用Davies-Bouldin(DB)指数对优化后的结果进行转换。通过聚类内散射与聚类间分离之和的比值得到最优的k值,既DB指数越小则所划分的聚类个数k越好,当DB在规定范围内得到的最小值即为最优k值。
Figure BDA0002388664700000061
Figure BDA0002388664700000062
其中
Figure BDA0002388664700000063
为第i个聚类内的散射值,Vi为该聚类的数据点数量,c为该聚类的聚类中心。dij=MSD(ci,cj)两个聚类中心的形态相似距离。
步骤5:根据得到的最优聚类个数k,使用模糊聚算法FCM对经预处理的数据进行分析,将其划分为k个聚类。
步骤6:统计每一个聚类的数据中心、每个聚类中数据的特征、每个聚类所包括的范围,并根据聚类的特征情况结合业务人员的运行经验判断当前设备的运行状态。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (5)

1.基于模糊聚类最优k值选择算法的设备运行状态判断方法,其特征在于,包括如下步骤:
步骤1:根据待测试设备的运行情况采集测试数据,并对数据进行数据清洗及数据归一化的预处理;
步骤2:根据处理后的测试数据,建立双目标模型;
步骤3:使用CDG优化算法对双目标模型进行优求解;
步骤4:使用DB指数对优化求解后的结果进行转换,计算得到最优聚类个数k;
步骤5:根据得到的最优聚类个数k,使用模糊聚算法FCM对经预处理的测试数据进行分析,将其划分为k个聚类;
步骤6:统计每一个聚类的数据中心、每个聚类中数据的特征、每个聚类所包括的范围,并根据这些聚类的特征情况判断当前设备的运行状态。
2.如权利要求1所述的基于模糊聚类最优k值选择算法的设备运行状态判断方法,其特征在于:步骤2中,首先通过分析模糊聚类的紧凑度和分离度建立模糊聚类指标:
设X={x1,x2,x3,…,xn}为聚类分析的测试数据集,xi={xi1,xi2,xi3,…,xin}表示测试数据xi的n个特征,MSD为形态相似距离,紧凑度函数如下所示:
Figure FDA0002388664690000011
其中k为聚类中心个数,C={c1,c2,…,ck}为聚类中心的集合,U为隶属度矩阵,uij∈U为第j个数据在第i个聚类的隶属度系数,MSD(xj,ci)表示第j个数据在第i个聚类的偏差;设Fp和Fq是属于一个模糊分区(k,U)的两个模糊聚类,分离度函数如下所示:
Figure FDA0002388664690000012
Figure FDA0002388664690000013
S(xj∶Fp,Fq)=min(Fp(xj),Fq(xj))
Figure FDA0002388664690000014
其中S(Fp,Fq),p,q∈C为在数据集X中,模糊聚类Fp,Fq的相似性;Fp(xj)为xj在第p个聚类的协方差矩阵,h(xj)表示一种权值;
定义FDCS为紧密度Comp和分离度Sep之和,FDCS的值越小,则表示模糊聚类重叠程度更小,聚类内部更紧凑;
FDCS(k,U)=Comp(k,U)+Sep(k,U)
将FDCS进行如下的转换,保证了在非正确的聚类中心下目标函数f1和f2仍然是冲突的;
min F(x)={f1(x)=1-exp-FDCS(k,U)-k,f2(x)=k}
其中f2代表聚类个数k,f1代表根据f2取值进行聚类划分的度量指标。
3.如权利要求2所述的基于模糊聚类最优k值选择算法的设备运行状态判断方法,其特征在于:h(xj)根据模糊聚类之间重叠数据点的共享程度来调整对重叠数据点的强调程度,如下所示:
Figure FDA0002388664690000021
其中upj(xj)表示数据xj在模糊分区p中的隶属度,uqj(xj)表示数据xj在迷糊分区q中的隶属度。
4.如权利要求2所述的基于模糊聚类最优k值选择算法的设备运行状态判断方法,其特征在于:步骤3具体包括以下步骤:
步骤3.1:初始化网格系统GS的网格邻居数以及网格距离、理想点、最低点;在建立GS之后对进行种群P随机初始化,并且基于P确定理想点和最低点;
步骤3.2:N个子代从P中生产,同时一个空集合Q被定义用于子代的排序;对于每一个解x={f1,f2},其匹配解都是通过邻居选择NS来获取的;
步骤3.3:从NS随机选择两个解xi,xj,xi,xj产生一个它们的子代y,之后将y添加到集合Q中;
步骤3.4:利用组合种群P=P∪Q更新理想和最低点,使其更加接近真实值;
步骤3.5:使用新的种群P更新GS;
步骤3.6:选择每个k值对应的非支配解;
步骤3.7:通过MOEA得到范围内所有k值的帕累托最优,并组成帕累托前沿。
5.如权利要求2所述的基于模糊聚类最优k值选择算法的设备运行状态判断方法,其特征在于:步骤4中,通过聚类内散射与聚类间分离之和的比值得到最优的k值,DB指数越小则所划分的聚类个数k越好,当DB在规定范围内得到的最小值即为最优k值;
Figure FDA0002388664690000022
Figure FDA0002388664690000031
其中
Figure FDA0002388664690000032
为第i个聚类内的散射值,Vi为该聚类的数据点数量,c为该聚类的聚类中心,dij=MSD(ci,cj)两个聚类中心的形态相似距离。
CN202010110361.7A 2020-02-21 2020-02-21 基于模糊聚类最优k值选择算法的设备运行状态判断方法 Active CN111291822B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010110361.7A CN111291822B (zh) 2020-02-21 2020-02-21 基于模糊聚类最优k值选择算法的设备运行状态判断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010110361.7A CN111291822B (zh) 2020-02-21 2020-02-21 基于模糊聚类最优k值选择算法的设备运行状态判断方法

Publications (2)

Publication Number Publication Date
CN111291822A true CN111291822A (zh) 2020-06-16
CN111291822B CN111291822B (zh) 2023-05-05

Family

ID=71023133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010110361.7A Active CN111291822B (zh) 2020-02-21 2020-02-21 基于模糊聚类最优k值选择算法的设备运行状态判断方法

Country Status (1)

Country Link
CN (1) CN111291822B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113243804A (zh) * 2021-06-03 2021-08-13 山东中新优境智能科技有限公司 自动取纸方法、装置、可读存储介质及计算机设备
CN113254432A (zh) * 2021-05-25 2021-08-13 中国民航大学 一种基于模糊聚类的ads-b飞行轨迹数据清洗方法
CN113919694A (zh) * 2021-10-11 2022-01-11 国网山西省电力公司信息通信分公司 一种电力通信光缆关键业务承载状态分析方法及系统
CN114167335A (zh) * 2020-09-10 2022-03-11 长鑫存储技术有限公司 新增检测工具的合格检验方法和检验系统
CN115982633A (zh) * 2023-03-21 2023-04-18 北京百度网讯科技有限公司 目标对象分类方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107153846A (zh) * 2017-05-26 2017-09-12 南京邮电大学 一种基于模糊c均值聚类算法的道路交通状态建模方法
CN107239800A (zh) * 2017-06-06 2017-10-10 常州工学院 松弛模糊c均值聚类算法
CN110096630A (zh) * 2019-05-06 2019-08-06 吉林农业大学 一类基于聚类分析的大数据处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107153846A (zh) * 2017-05-26 2017-09-12 南京邮电大学 一种基于模糊c均值聚类算法的道路交通状态建模方法
CN107239800A (zh) * 2017-06-06 2017-10-10 常州工学院 松弛模糊c均值聚类算法
CN110096630A (zh) * 2019-05-06 2019-08-06 吉林农业大学 一类基于聚类分析的大数据处理方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114167335A (zh) * 2020-09-10 2022-03-11 长鑫存储技术有限公司 新增检测工具的合格检验方法和检验系统
CN114167335B (zh) * 2020-09-10 2022-10-18 长鑫存储技术有限公司 新增检测工具的合格检验方法和检验系统
CN113254432A (zh) * 2021-05-25 2021-08-13 中国民航大学 一种基于模糊聚类的ads-b飞行轨迹数据清洗方法
CN113254432B (zh) * 2021-05-25 2022-04-29 中国民航大学 一种基于模糊聚类的ads-b飞行轨迹数据清洗方法
CN113243804A (zh) * 2021-06-03 2021-08-13 山东中新优境智能科技有限公司 自动取纸方法、装置、可读存储介质及计算机设备
CN113243804B (zh) * 2021-06-03 2022-11-22 山东优境传媒科技有限公司 自动取纸方法、装置、可读存储介质及计算机设备
CN113919694A (zh) * 2021-10-11 2022-01-11 国网山西省电力公司信息通信分公司 一种电力通信光缆关键业务承载状态分析方法及系统
CN115982633A (zh) * 2023-03-21 2023-04-18 北京百度网讯科技有限公司 目标对象分类方法、装置、电子设备及存储介质
CN115982633B (zh) * 2023-03-21 2023-06-20 北京百度网讯科技有限公司 目标对象分类方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111291822B (zh) 2023-05-05

Similar Documents

Publication Publication Date Title
CN111291822A (zh) 基于模糊聚类最优k值选择算法的设备运行状态判断方法
CN109816031B (zh) 一种基于数据不均衡度量的变压器状态评估聚类分析方法
CN111105104A (zh) 一种基于相似日和rbf神经网络的短期电力负荷预测方法
CN111160750A (zh) 一种基于关联规则挖掘的配网分析和投资决策方法
CN108446568A (zh) 一种去趋势分析差分隐私保护的直方图数据发布方法
CN111401785A (zh) 一种基于模糊关联规则的电力系统设备故障预警方法
CN114861788A (zh) 一种基于dbscan聚类的负荷异常检测方法及系统
WO2018006631A1 (zh) 一种用户等级自动划分方法及系统
CN111338950A (zh) 一种基于谱聚类的软件缺陷特征选择方法
CN111046977A (zh) 基于em算法和knn算法的数据预处理方法
CN110968618A (zh) 一种挖掘焊接参数量化关联规则的方法及应用
CN114881429B (zh) 基于数据驱动的台区线损量化方法及系统
CN106469318A (zh) 一种基于L2稀疏限制的特征加权k‑means聚类方法
CN111932081A (zh) 一种电力信息系统运行状态评估方法及系统
Khanali et al. An improved approach to fuzzy clustering based on FCM algorithm and extended VIKOR method
CN108537249B (zh) 一种密度峰值聚类的工业过程数据聚类方法
Zhang et al. A new outlier detection algorithm based on fast density peak clustering outlier factor.
Devanta Optimization of the K-Means Clustering Algorithm Using Davies Bouldin Index in Iris Data Classification
CN111488903A (zh) 基于特征权重的决策树特征选择方法
CN116502887A (zh) 基于无监督聚类和极限学习机的大米加工链风险评价方法
CN115392375A (zh) 一种多源数据融合度智能评估方法及其系统
CN112365168A (zh) 一种基于主分量分析评价环境空气质量的方法
CN118154375B (zh) 改进型knn算法模型的工商管理专业教学管理方法
CN112884167B (zh) 一种基于机器学习的多指标异常检测方法及其应用系统
CN115099322A (zh) 一种面向交通状态的时变性扇区动态分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant