CN110569915A - 基于直觉模糊c均值的汽车数据聚类方法及系统 - Google Patents

基于直觉模糊c均值的汽车数据聚类方法及系统 Download PDF

Info

Publication number
CN110569915A
CN110569915A CN201910865982.3A CN201910865982A CN110569915A CN 110569915 A CN110569915 A CN 110569915A CN 201910865982 A CN201910865982 A CN 201910865982A CN 110569915 A CN110569915 A CN 110569915A
Authority
CN
China
Prior art keywords
matrix
membership
center
clustering
cluster center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910865982.3A
Other languages
English (en)
Other versions
CN110569915B (zh
Inventor
耿玉水
王菲
张焕颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu University of Technology
Original Assignee
Qilu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology filed Critical Qilu University of Technology
Priority to CN201910865982.3A priority Critical patent/CN110569915B/zh
Publication of CN110569915A publication Critical patent/CN110569915A/zh
Application granted granted Critical
Publication of CN110569915B publication Critical patent/CN110569915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开公开了基于直觉模糊C均值的汽车数据聚类方法及系统,输入设定参数和汽车数据集特征值矩阵;利用改进的直觉模糊熵,对汽车数据集特征值矩阵进行加权计算,获得加权后的特征值矩阵;定义密度参数,确定初始聚类中心;判断迭代次数是否小于设定迭代阈值,如果是,则进入隶属度矩阵计算步骤,否则进入输出步骤;隶属度矩阵计算步骤:计算隶属度矩阵;利用隶属度矩阵更新聚类中心;判断上一时刻数据集对于聚类中心的欧氏距离平方和,与当前时刻数据集对于聚类中心的欧氏距离平方和的差值是否小于设定阈值;如果是,则进入输出步骤,如果否,则返回隶属度矩阵计算步骤;输出步骤:输出隶属度矩阵和聚类中心,求得汽车数据聚类结果。

Description

基于直觉模糊C均值的汽车数据聚类方法及系统
技术领域
本公开涉及汽车数据聚类技术领域,特别是涉及基于直觉模糊C均值的汽车数据聚类方法及系统。
背景技术
本部分的陈述仅仅是提到了与本公开相关的背景技术,并不必然构成现有技术。
在实现本公开的过程中,发明人发现现有技术中存在以下技术问题:
随着智能设备的普及,互联网和物联网的繁荣,数据呈爆炸式的增长,汽车行业的发展越来越受人瞩目。汽车在使用和运行过程中产生了大量的数据,例如电池和电机的状态等。而如何利用汽车产生的大量数据进行知识挖掘、机器错误检索等任务则成为行业内的难点之一。
发明内容
为了解决现有技术的不足,本公开提供了基于直觉模糊C均值的汽车数据聚类方法及系统;利用直觉模糊熵对模糊C均值算法FCM进行改进,引入密度参数选取初始聚类中心,是解决模糊C均值算法易陷入局部最优的问题的重要手段;
第一方面,本公开提供了基于直觉模糊C均值的汽车数据聚类方法;
基于直觉模糊C均值的汽车数据聚类方法,包括:
输入设定参数和汽车数据集特征值矩阵;
利用改进的直觉模糊熵,对汽车数据集特征值矩阵进行加权计算,获得加权后的特征值矩阵;
定义密度参数,确定初始聚类中心;
判断迭代次数是否小于设定迭代阈值,如果是,则进入隶属度矩阵计算步骤,否则进入输出步骤;
隶属度矩阵计算步骤:计算隶属度矩阵;
利用隶属度矩阵更新聚类中心;
判断上一时刻数据集对于聚类中心的欧氏距离平方和,与当前时刻数据集对于聚类中心的欧氏距离平方和的差值是否小于设定阈值;如果是,则进入输出步骤,如果否,则返回隶属度矩阵计算步骤;
输出步骤:输出隶属度矩阵和聚类中心,根据最大隶属度原则求得汽车数据聚类结果。
第二方面,本公开还提供了基于直觉模糊C均值的汽车数据聚类系统;
基于直觉模糊C均值的汽车数据聚类系统,包括:
输入模块,其被配置为:输入设定参数和汽车数据集特征值矩阵;
加权模块,其被配置为:利用改进的直觉模糊熵,对汽车数据集特征值矩阵进行加权计算,获得加权后的特征值矩阵;
初始聚类中心确定模块,其被配置为:定义密度参数,确定初始聚类中心;
第一判断模块,其被配置为:判断迭代次数是否小于设定迭代阈值,如果是,则进入隶属度矩阵计算模块,否则进入输出模块;
隶属度矩阵计算模块,其被配置为:计算隶属度矩阵;
更新模块,其被配置为:利用隶属度矩阵更新聚类中心;
第二判断模块,其被配置为:判断上一时刻数据集对于聚类中心的欧氏距离平方和,与当前时刻数据集对于聚类中心的欧氏距离平方和的差值是否小于设定阈值;如果是,则进入输出模块,如果否,则返回隶属度矩阵计算模块;
输出模块,其被配置为:输出隶属度矩阵和聚类中心,根据最大隶属度原则求得汽车数据聚类结果。
第三方面,本公开还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述方法的步骤。
第四方面,本公开还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述方法的步骤。
与现有技术相比,本公开的有益效果是:
针对传统算法对初始聚类中心的选取敏感的问题,划分密度区域,在高密度区域选择初始聚类中心,避开低密度区域的噪点。引入直觉模糊熵计算数据集的特征权重,对特征值加权,考虑特征权重对聚类结果的影响。
本公开提供的一种基于直觉模糊集的模糊C均值的聚类方法,对传统的FCM算法进行了直觉模糊环境下的改进,通过定义区域密度参数选取初始聚类中心,可以避开数据集中的噪声;利用模糊熵去特征权重加权,更准确的反映了模糊集的模糊程度,提高了算法的聚类效果和时间复杂度。汽车根据不同特征被划分为3类,购买汽车的时候可作为参考之一,结合聚类分析结果可以较为准确判断汽车数据间的关联程度,有助于操作者和生产者及时发现汽车在能耗、故障分析等方面的问题。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为第一个实施例的方法流程图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一,本实施例提供了基于直觉模糊C均值的汽车数据聚类方法;
如图1所示,基于直觉模糊C均值的汽车数据聚类方法,包括:
S1:输入设定参数和汽车数据集特征值矩阵;
S2:利用改进的直觉模糊熵,对汽车数据集特征值矩阵进行加权计算,获得加权后的特征值矩阵;
S3:定义密度参数,确定初始聚类中心;
S4:判断迭代次数是否小于设定迭代阈值,如果是,则进入S5,否则进入步骤S8;
S5:计算隶属度矩阵;
S6:利用隶属度矩阵更新聚类中心;
S7:判断上一时刻数据集对于聚类中心的欧氏距离平方和,与当前时刻数据集对于聚类中心的欧氏距离平方和的差值是否小于设定阈值;如果是,则进入S8,如果否,则返回S5;
S8:输出隶属度矩阵和聚类中心,根据最大隶属度原则求得汽车数据聚类结果。
作为一个或多个实施例,所述S1中,所述设定参数,包括:聚类数目c、模糊度参数m、停止迭代的阈值ε和迭代次数t;所述汽车数据集特征值矩阵G,包括:每一款汽车的油耗、汽车轮胎的摩擦系数、汽车的价格、汽车的舒适度和汽车的安全系数。
应理解的,所述S1中,汽车数据集特征值矩阵G,见表1;对五款型号的汽车Xi(i=1,2,...,5)进行分类,每款汽车包含6个属性Q={q1,q2,...,q6},其中q1为汽车的油耗,q2为汽车轮胎的摩擦系数,q3为汽车价格,q4为舒适度,q5为美观度,q6为安全系数。所述汽车数据集特征值矩阵G即包括五款汽车分别对应的6个属性值组成的5×6的矩阵。
应理解的,所述获得加权后的特征值矩阵见表2;
作为一个或多个实施例,所述S2中,所述利用改进的直觉模糊熵,对汽车数据集特征值矩阵G进行加权计算,获得加权后的特征值矩阵,具体步骤为:
设汽车集合X={x1,x2,…xn},A={<xiA(xi),vA(xi)>|xi∈X}是X上的直觉模糊集,
其中,fA(x)=1-|μA(x)-vA(x)|,πA(x)=1-μA(x)-vA(x),A表示有关汽车参数的直觉模糊集,表示第j列的直觉模糊熵。E(A)是A的直觉模糊熵,fA(xi)是汽车参数指标xi在A中的模糊度,πA(xi)是xi在A中的犹豫度,δA(x)是区间数的模糊程度,ωj是汽车数据集特征值矩阵G的权重计算公式,μA(x)是隶属度,vA(x)是聚类中心;
计算加权后的特征值矩阵G′:
g′ij=ωjgij=<1-(1-μij)ωj,(vij)ωj>;
其中,加权后的特征值矩阵G′=(g′ij)n×s;gij是矩阵的特征值,μij是隶属度,vij是聚类中心。
利用新的直觉模糊熵为特征权重加权,模糊熵E(A)值越大,集合的模糊程度和不确定程度越高,该特征的权重就越小;反之,模糊熵E(A)值越小,该特征的权重越大。
应理解的,所述S3:定义密度参数,确定初始聚类中心见表3;
作为一个或多个实施例,所述定义密度函数,确定初始聚类中心;具体步骤包括:
令t=0,确定初始聚类中心V(t)
计算特征矢量G′i所处区域的密度,定义区域密度参数ρi,以Gi′为中心,计算n个欧氏距离d(G′i,G′1),d(G′i,G′2),…,d(G′i,G′n)并将它们重新排序,令
d(G′i,G′1)≤d(G′i,G′2)≤…≤d(G′i,G′n)
其中,d(G′i,G′1)是第一个区域G′1与特征矢量G′i所处区域的欧式距离度量;d(G′i,G′2)是第二个区域G′2与特征矢量G′i所处区域的欧式距离度量;d(G′i,G′n)是第n个区域G′n与特征矢量G′i所处区域的欧式距离度量。
由于d(G′i,G′i)为0,所以重新排序后,将包含G′i在内的N个特征矢量的最小欧氏距离,记为R(G′i);
R(G′i)=d(G′i,G′(N))
其中,G′i是所处区域密度的特征矢量;G′(N)是G′i所处区域的第N个特征矢量;0<N<n且为整数。
G′i所处的区域G′(1),G′(2),…,G′(N)共N个特征矢量,G′i的区域密度参数ρi
其中,R(G′i)是包含G′i在内的N个特征矢量的最小欧氏距离。
利用R(G′i)和ρi的公式计算特征矢量的区域密度参数,比较后选出区域密度最大的G′i作为第一个聚类中心V1,得到一个高密度区域的特征矢量集合P={G′(1),G′(2),…,G′(N)},在P中取得距离V1最远的特征矢量作为第二个聚类中心V2,再计算P中所有特征矢量到V1的距离,再计算P中所有特征矢量到V2的距离,由P得到满足以下条件的第三个聚类中心V3
max(min(d(G′(r),V1),d(G′(r),V2))),r=1,2,…,N
即取距离第一个聚类中心V1和第二个聚类中心V2距离均最远的特征矢量作为第三个聚类中心;
最后,计算P中所有特征矢量到V1,V2,…,Vk-1的距离,在P中取出满足
max(min(d(G′(r),V1),d(G′(r),V2),…,d(G′(r),Vk-1))),r=1,2,…,N
的特征矢量,作为第k个聚类中心Vk(k=1,2,…,c),依次求得聚类中心集合V={V1,V2,…,Vc}。
在直觉模糊的大环境下,可以将初始聚类中心的选择区域进行密度细分,避开低密度区域中的噪点,只在高密度区域中选取初始聚类中心,有效避免初始值的选择不当可能对聚类结果造成的影响。
作为一个或多个实施例,所述S4具体步骤包括:
判断t是否小于迭代阈值δ,如果是,继续S5;如果不是,跳转到步骤S8。
作为一个或多个实施例,S5:计算隶属度矩阵见表4和表6;
作为一个或多个实施例,所述S5具体步骤包括:
计算隶属度矩阵U(t),U(t)=(uik)c×l
当1≤l≤c,令d(G′i,Vl)=0,则
当对任意l=1,2,…,c,都有d(G′i,Vl)>0;
m为模糊度参数。
其中:uik为样本属于聚类中心的程度;u为uik构成的隶属度矩阵;d为模糊度矩阵;G为样本方差;V是k个聚类中心构成的聚类中心矩阵;d(G′i,Vl)是特征矢量G′和聚类中心Vl之间的欧氏距离,G′是特征值矩阵,Vl是第l个聚类中心。
应理解的,S6:利用隶属度矩阵更新聚类中心见表5和表7;
作为一个或多个实施例,所述S6具体步骤包括:
利用隶属度矩阵更新聚类中心V(t),其中第k个聚类中心记为Vk
Vk={vk1,vk2,…,vks}
式中,vkj=<αkjkj>,
其中,vks是特征值矩阵中的特征值向量,αkj和βkj均为聚类中心的直觉模糊数,uik是隶属度矩阵,μij是ui相当于vj的隶属度,vij是ui相当于vj的聚类中心,m为模糊度参数。
作为一个或多个实施例,所述S7具体步骤包括:
数据集对于聚类中心的欧氏距离平方和为判断J(U(t-1),V(t-1))-J(U(t),V(t))<ε是否成立,成立进入S8,否则跳转到S5;
其中,U(t-1)是迭代次数为t-1时的隶属度,V(t-1)是隶属度为U(t-1)时的聚类中心,U(t)是迭代次数为t时的隶属度,V(t)是隶属度为U(t)时的聚类中心,d(G′i,Vk)是特征矢量G′i和聚类中心Vk之间的欧氏距离,G′是特征值矩阵,Vl是第l个聚类中心,ε是迭代阈值。
应理解的,S8:输出隶属度矩阵和聚类中心,根据最大隶属度原则求得聚类结果见表9。
作为一个或多个实施例,所述S8具体步骤包括:
输出隶属度矩阵U和聚类中心V,根据最大隶属度原则求得聚类结果,x1,x2,x3三种型号的车分属同一集群或拥有相同的几个集群,另外两种型号的车分别属于其他集群。
在实际生活应用中,一个实例共享多个集群的一些共同点是有意义的。例如,沃尔沃汽车常常以其安全性能高而闻名,但同时,它的价格也相对较高,因此,沃尔沃汽车可以同时归为安全车和豪车的集群中。这一结果对于客户对汽车购买的需求有指导意义。
表1汽车样本数据集G
表2计算特征权重得到加权后的样本特征值矩阵
表3初始聚类中心
表4初始聚类中心对应的隶属度矩阵
表5t=1时的聚类中心
表6t=1时的隶属度矩阵
表7t=2时的聚类中心
表8t=2时的隶属度矩阵
表9本公开对汽车数据集的聚类结果
实施例二,本实施例提供了基于直觉模糊C均值的汽车数据聚类系统;
基于直觉模糊C均值的汽车数据聚类系统,包括:
输入模块,其被配置为:输入设定参数和汽车数据集特征值矩阵;
加权模块,其被配置为:利用改进的直觉模糊熵,对汽车数据集特征值矩阵进行加权计算,获得加权后的特征值矩阵;
初始聚类中心确定模块,其被配置为:定义密度参数,确定初始聚类中心;
第一判断模块,其被配置为:判断迭代次数是否小于设定迭代阈值,如果是,则进入隶属度矩阵计算模块,否则进入输出模块;
隶属度矩阵计算模块,其被配置为:计算隶属度矩阵;
更新模块,其被配置为:利用隶属度矩阵更新聚类中心;
第二判断模块,其被配置为:判断上一时刻数据集对于聚类中心的欧氏距离平方和,与当前时刻数据集对于聚类中心的欧氏距离平方和的差值是否小于设定阈值;如果是,则进入输出模块,如果否,则返回隶属度矩阵计算模块;
输出模块,其被配置为:输出隶属度矩阵和聚类中心,根据最大隶属度原则求得汽车数据聚类结果。
本公开还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成方法中的各个操作,为了简洁,在此不再赘述。
所述电子设备可以是移动终端以及非移动终端,非移动终端包括台式计算机,移动终端包括智能手机(Smart Phone,如Android手机、IOS手机等)、智能眼镜、智能手表、智能手环、平板电脑、笔记本电脑、个人数字助理等可以进行无线通信的移动互联网设备。
应理解,在本公开中,该处理器可以是中央处理单元CPU,该处理器还算可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本公开所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能的划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外一点,所显示或讨论的相互之间的耦合或者直接耦合或者通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.基于直觉模糊C均值的汽车数据聚类方法,其特征是,包括:
输入设定参数和汽车数据集特征值矩阵;
利用改进的直觉模糊熵,对汽车数据集特征值矩阵进行加权计算,获得加权后的特征值矩阵;
定义密度参数,确定初始聚类中心;
判断迭代次数是否小于设定迭代阈值,如果是,则进入隶属度矩阵计算步骤,否则进入输出步骤;
隶属度矩阵计算步骤:计算隶属度矩阵;
利用隶属度矩阵更新聚类中心;
判断上一时刻数据集对于聚类中心的欧氏距离平方和,与当前时刻数据集对于聚类中心的欧氏距离平方和的差值是否小于设定阈值;如果是,则进入输出步骤,如果否,则返回隶属度矩阵计算步骤;
输出步骤:输出隶属度矩阵和聚类中心,根据最大隶属度原则求得汽车数据聚类结果。
2.如权利要求1所述的方法,其特征是,所述设定参数,包括:聚类数目c、模糊度参数m、停止迭代的阈值ε和迭代次数t;所述汽车数据集特征值矩阵G,包括:每一款汽车的油耗、汽车轮胎的摩擦系数、汽车的价格、汽车的舒适度和汽车的安全系数。
3.如权利要求1所述的方法,其特征是,所述利用改进的直觉模糊熵,对汽车数据集特征值矩阵G进行加权计算,获得加权后的特征值矩阵,具体步骤为:
设汽车集合X={x1,x2,…xn},A={<xiA(xi),vA(xi)>|xi∈X}是X上的直觉模糊集,
其中,fA(x)=1-|μA(x)-vA(x)|,πA(x)=1-μA(x)-vA(x),A表示有关汽车参数的直觉模糊集,表示第j列的直觉模糊熵;E(A)是A的直觉模糊熵,fA(xi)是汽车参数指标xi在A中的模糊度,πA(xi)是xi在A中的犹豫度,δA(x)是区间数的模糊程度,ωj是汽车数据集特征值矩阵G的权重计算公式,μA(x)是隶属度,vA(x)是聚类中心;
计算加权后的特征值矩阵G′:
g′ij=ωjgij=<1-(1-μij)ωj,(vij)ωj>;
其中,加权后的特征值矩阵G′=(g′ij)n×s;gij是矩阵的特征值,μij是隶属度,vij是聚类中心。
4.如权利要求1所述的方法,其特征是,所述定义密度函数,确定初始聚类中心;具体步骤包括:
令t=0,确定初始聚类中心V(t)
计算特征矢量Gi′所处区域的密度,定义区域密度参数ρi,以Gi′为中心,计算n个欧氏距离d(Gi′,G1′),d(Gi′,G2′),…,d(Gi′,Gn′)并将它们重新排序,令
d(Gi′,G1′)≤d(Gi′,G2′)≤…≤d(Gi′,Gn′)
其中,d(Gi′,G1′)是第一个区域G1′与特征矢量Gi′所处区域的欧式距离度量;d(Gi′,G2′)是第二个区域G2′与特征矢量Gi′所处区域的欧式距离度量;d(Gi′,Gn′)是第n个区域Gn′与特征矢量Gi′所处区域的欧式距离度量;
由于d(Gi′,Gi′)为0,所以重新排序后,将包含Gi′在内的N个特征矢量的最小欧氏距离,记为R(Gi′);
R(Gi′)=d(Gi′,G′(N))
其中,Gi′是所处区域密度的特征矢量;G′(N)是Gi′所处区域的第N个特征矢量;0<N<n且为整数;
Gi′所处的区域G′(1),G′(2),…,G′(N)共N个特征矢量,Gi′的区域密度参数ρi
其中,R(Gi′)是包含Gi′在内的N个特征矢量的最小欧氏距离;
利用R(Gi′)和ρi的公式计算特征矢量的区域密度参数,比较后选出区域密度最大的Gi′作为第一个聚类中心V1,得到一个高密度区域的特征矢量集合P={G′(1),G′(2),…,G′(N)},在P中取得距离V1最远的特征矢量作为第二个聚类中心V2,再计算P中所有特征矢量到V1的距离,再计算P中所有特征矢量到V2的距离,由P得到满足以下条件的第三个聚类中心V3
max(min(d(G′(r),V1),d(G′(r),V2))),r=1,2,…,N
即取距离第一个聚类中心V1和第二个聚类中心V2距离均最远的特征矢量作为第三个聚类中心;
最后,计算P中所有特征矢量到V1,V2,…,Vk-1的距离,在P中取出满足
max(min(d(G′(r),V1),d(G′(r),V2),…,d(G′(r),Vk-1))),r=1,2,…,N
的特征矢量,作为第k个聚类中心Vk(k=1,2,…,c),依次求得聚类中心集合V={V1,V2,…,Vc}。
5.如权利要求1所述的方法,其特征是,所述隶属度矩阵计算步骤具体步骤包括:
计算隶属度矩阵U(t),U(t)=(uik)c×l
当1≤l≤c,令d(G′i,Vl)=0,则
当对任意l=1,2,…,c,都有d(G′i,Vl)>0;
m为模糊度参数;
其中:uik为样本属于聚类中心的程度;u为uik构成的隶属度矩阵;d为模糊度矩阵;G为样本方差;V是k个聚类中心构成的聚类中心矩阵;d(G′i,Vl)是特征矢量G′和聚类中心Vl之间的欧氏距离,G′是特征值矩阵,Vl是第l个聚类中心。
6.如权利要求1所述的方法,其特征是,利用隶属度矩阵更新聚类中心具体步骤包括:
利用隶属度矩阵更新聚类中心V(t),其中第k个聚类中心记为Vk
Vk={vk1,vk2,…,vks}
式中,vkj=<αkjkj>,
其中,vks是特征值矩阵中的特征值向量,αkj和βkj均为聚类中心的直觉模糊数,uik是隶属度矩阵,μij是ui相当于vj的隶属度,vij是ui相当于vj的聚类中心,m为模糊度参数。
7.如权利要求1所述的方法,其特征是,所述判断上一时刻数据集对于聚类中心的欧氏距离平方和,与当前时刻数据集对于聚类中心的欧氏距离平方和的差值是否小于设定阈值具体步骤包括:
数据集对于聚类中心的欧氏距离平方和为判断J(U(t-1),V(t-1))-J(U(t),V(t))<ε是否成立,成立进入输出步骤,否则跳转到隶属度矩阵计算步骤;
其中,U(t-1)是迭代次数为t-1时的隶属度,V(t-1)是隶属度为U(t-1)时的聚类中心,U(t)是迭代次数为t时的隶属度,V(t)是隶属度为U(t)时的聚类中心,d(Gi′,Vk)是特征矢量Gi′和聚类中心Vk之间的欧氏距离,G′是特征值矩阵,Vl是第l个聚类中心,ε是迭代阈值。
8.基于直觉模糊C均值的汽车数据聚类系统,其特征是,包括:
输入模块,其被配置为:输入设定参数和汽车数据集特征值矩阵;
加权模块,其被配置为:利用改进的直觉模糊熵,对汽车数据集特征值矩阵进行加权计算,获得加权后的特征值矩阵;
初始聚类中心确定模块,其被配置为:定义密度参数,确定初始聚类中心;
第一判断模块,其被配置为:判断迭代次数是否小于设定迭代阈值,如果是,则进入隶属度矩阵计算模块,否则进入输出模块;
隶属度矩阵计算模块,其被配置为:计算隶属度矩阵;
更新模块,其被配置为:利用隶属度矩阵更新聚类中心;
第二判断模块,其被配置为:判断上一时刻数据集对于聚类中心的欧氏距离平方和,与当前时刻数据集对于聚类中心的欧氏距离平方和的差值是否小于设定阈值;如果是,则进入输出模块,如果否,则返回隶属度矩阵计算模块;
输出模块,其被配置为:输出隶属度矩阵和聚类中心,根据最大隶属度原则求得汽车数据聚类结果。
9.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项方法所述的步骤。
10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项方法所述的步骤。
CN201910865982.3A 2019-09-12 2019-09-12 基于直觉模糊c均值的汽车数据聚类方法及系统 Active CN110569915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910865982.3A CN110569915B (zh) 2019-09-12 2019-09-12 基于直觉模糊c均值的汽车数据聚类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910865982.3A CN110569915B (zh) 2019-09-12 2019-09-12 基于直觉模糊c均值的汽车数据聚类方法及系统

Publications (2)

Publication Number Publication Date
CN110569915A true CN110569915A (zh) 2019-12-13
CN110569915B CN110569915B (zh) 2022-04-01

Family

ID=68779773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910865982.3A Active CN110569915B (zh) 2019-09-12 2019-09-12 基于直觉模糊c均值的汽车数据聚类方法及系统

Country Status (1)

Country Link
CN (1) CN110569915B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324676A (zh) * 2020-02-18 2020-06-23 南京华剑兵科智能装备有限公司 基于模糊c均值聚类算法的机械设备润滑油在线监测系统
CN113688926A (zh) * 2021-08-31 2021-11-23 济南大学 一种网站行为分类方法、系统、存储介质及设备
CN115034611A (zh) * 2022-06-09 2022-09-09 武汉理工大学 大型海上旅游浮式综合体舒适度评估方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2128818A1 (en) * 2007-01-25 2009-12-02 Shanghai Yaowei Industry Co, Ltd. Method of moving target tracking and number accounting
CN109145921A (zh) * 2018-08-29 2019-01-04 江南大学 一种基于改进的直觉模糊c均值聚类的图像分割方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2128818A1 (en) * 2007-01-25 2009-12-02 Shanghai Yaowei Industry Co, Ltd. Method of moving target tracking and number accounting
CN109145921A (zh) * 2018-08-29 2019-01-04 江南大学 一种基于改进的直觉模糊c均值聚类的图像分割方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李婧等: "基于直觉模糊集的模糊C均值聚类改进算法", 《上海大学学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324676A (zh) * 2020-02-18 2020-06-23 南京华剑兵科智能装备有限公司 基于模糊c均值聚类算法的机械设备润滑油在线监测系统
CN113688926A (zh) * 2021-08-31 2021-11-23 济南大学 一种网站行为分类方法、系统、存储介质及设备
CN113688926B (zh) * 2021-08-31 2024-03-08 济南大学 一种网站行为分类方法、系统、存储介质及设备
CN115034611A (zh) * 2022-06-09 2022-09-09 武汉理工大学 大型海上旅游浮式综合体舒适度评估方法

Also Published As

Publication number Publication date
CN110569915B (zh) 2022-04-01

Similar Documents

Publication Publication Date Title
CN110569915B (zh) 基于直觉模糊c均值的汽车数据聚类方法及系统
WO2021189976A1 (zh) 一种产品信息推送方法、装置、设备及存储介质
US10338565B1 (en) Methods and apparatus for machine learning predictions and multi-objective optimization of manufacturing processes
CN112529115B (zh) 一种对象聚类方法和系统
WO2002003256A1 (en) Method and system for the dynamic analysis of data
CN111105265A (zh) 基于客户信息的预测方法、装置、计算机设备及存储介质
Tomani et al. Parameterized temperature scaling for boosting the expressive power in post-hoc uncertainty calibration
CN111611390B (zh) 一种数据处理方法及装置
CN111309975A (zh) 一种增强图模型抗攻击能力的方法和系统
CN113407854A (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
CN110245700B (zh) 分类模型构建方法、分类模型及物体识别方法
US20180150754A1 (en) Data analysis method, system and non-transitory computer readable medium
CN115169809A (zh) 智慧城市评价方法和装置
CN111159481A (zh) 图数据的边预测方法、装置及终端设备
CN109063120B (zh) 一种基于聚类的协同过滤推荐方法和装置
US10726349B2 (en) Calculating posterior probability of classes
Dizaji et al. PARTICLE SWARM OPTIMIZATION AND CHAOS THEORY BASED APPROACH FOR SOFTWARE COST ESTIMATION.
CN114363004B (zh) 风险评估方法、装置、计算机设备和存储介质
CN105643944A (zh) 一种3d打印机稳定控制方法及控制系统
CN113554307B (zh) 一种基于rfm模型的用户分组方法、装置及可读介质
CN113159893B (zh) 基于门控图神经网络的消息推送方法、装置及计算机设备
CN112561569B (zh) 基于双模型的到店预测方法、系统、电子设备及存储介质
CN110211638B (zh) 一种考虑基因相关度的基因选择方法与装置
CN104809098A (zh) 基于期望最大确定统计模型参数的方法和装置
Hwang et al. A multi‐objective optimization using distribution characteristics of reference data for reverse engineering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant