CN108537249B - 一种密度峰值聚类的工业过程数据聚类方法 - Google Patents

一种密度峰值聚类的工业过程数据聚类方法 Download PDF

Info

Publication number
CN108537249B
CN108537249B CN201810217551.1A CN201810217551A CN108537249B CN 108537249 B CN108537249 B CN 108537249B CN 201810217551 A CN201810217551 A CN 201810217551A CN 108537249 B CN108537249 B CN 108537249B
Authority
CN
China
Prior art keywords
data
distance
clustering
industrial process
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810217551.1A
Other languages
English (en)
Other versions
CN108537249A (zh
Inventor
郑英
陈斌
汪上晓
张洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201810217551.1A priority Critical patent/CN108537249B/zh
Publication of CN108537249A publication Critical patent/CN108537249A/zh
Application granted granted Critical
Publication of CN108537249B publication Critical patent/CN108537249B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种密度峰值聚类的工业过程数据聚类方法,包括:获取工业过程数据组成数据集;将数据集中数据之间的欧氏距离与时间因数相结合,得到数据之间的距离;根据数据之间的距离和调节参数得到截断距离,进而得到每个数据的局部密度,计算每个数据与比它的局部密度大的数据之间的最小距离;对数据集中每个数据的局部密度与最小距离的乘积排序,取乘积较大的前H个数据为聚类中心,比聚类中心的局部密度大的数据中距离聚类中心最近的数据与聚类中心属于同一类;对于数据集中没有类属性的数据按照局部密度从大到小的顺序判断其类属性,进而得到工业过程数据的聚类结果。本发明的聚类中心更合理、自动确定聚类中心个数并且时间复杂度较小。

Description

一种密度峰值聚类的工业过程数据聚类方法
技术领域
本发明属于工业过程的正常数据与故障数据、不同模态分类技术领域,更具体地,涉及一种密度峰值聚类的工业过程数据聚类方法。
背景技术
对于一个大型工业系统,由于生产策略和生产环境的改变,工业过程往往呈现出多模态、多故障的特点。对于不同的模态我们需要分别建立不同的子模型,这样才能得整个模型有更好的性能去进行监控工业过程和预测质量指标等。因此在建模之前对多模态工业过程进行模态辨识和故障分类具有重要的意义。
目前使用最广泛的模态辨识和故障分类方法是基于数据驱动的方法。其主要方法有两种,一种是使用基于纯数学的各种聚类算法,一种是基于PCA(Principal ComponentAnalysis)或PLS(Partial Least Square)模型之间的相似度进行模态辨识或者故障数据分类。
传统的聚类算法主要分为基于划分的聚类算法、基于密度的聚类算法、基于网格的聚类算法和层次聚类算法等。其中基于划分的聚类算法以k-means聚类算法以及k-means的衍生算法为代表。基于k-means的聚类方法是一种有监督的聚类算法,需要预设聚类数目并初始化聚类中心,而初始化的聚类中心是根据数据的均值计算的,所以k-means聚类对异常数据比较敏感,聚类结果往往不够精确。而其中的基于密度的聚类算法典型的是以DBSCAN算法为代表,DBSCAN算法是通过引入核心对象、密度可达、密度相连等基本概念,寻找数据点密度相连的最大集合来完成聚类过程,它是一种基于高密度联通区域的聚类算法,它将类簇定义为高密度相连点的最大集合。它的缺点是:1、当空间聚类的密度不均匀、聚类间距差相差很大时,聚类质量较差(有些簇内距离较小,有些簇内距离很大,但是Eps(最小半径)是确定的,所以,大的点可能被误判断为离群点或者边界点,如果Eps太大,那么小距离的簇内,可能会包含一些离群点或者边界点)。2、有两个初始参数E(邻域半径)和minPts(E邻域最小点数)需要用户手动设置输入,并且聚类的类簇结果对这两个参数的取值非常敏感,不同的取值将产生不同的聚类结果。
基于PCA或PLS模型之间的相似度进行模态辨识的方法,需要先对每一个样本建立模型,计算模型之间的相似度,再采用聚类算法聚类,然后将每一个簇的样本组合起来再建模,步骤繁杂,且依然需要聚类算法的介入。
在上述的方法都存在着一定的缺陷,需要人为设定参数,而且聚类的结果比较依赖参数的设定好坏,计算繁杂,聚类结果不够精确。在实际的工业过程中,我们往往不能预先知道工业过程有几种不同类的数据,更不能知道最佳的聚类中心是哪个样本点,但是聚类中心选取的好坏对于聚类精度影响很大;并且当一个新的样本出现时,我们需要以较短的时间来判断它所属的运行状态。所以我们急需设计一个能找到更合理的聚类中心、自动确定聚类中心个数并且时间复杂度较小的聚类算法。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种密度峰值聚类的工业过程数据聚类方法,由此解决现有技术存在聚类结果准确率低、无法确定最佳聚类中心、无法自动确定聚类中心个数、时间复杂度大的技术问题。
为实现上述目的,本发明提供了一种密度峰值聚类的工业过程数据聚类方法,包括:
(1)获取工业过程数据,包括正常数据、故障数据和不同模态的数据,组成数据集;将数据集中数据之间的欧氏距离与时间因数相结合,得到数据之间的距离;
(2)根据数据之间的距离和调节参数,得到截断距离,根据截断距离和数据之间的距离,得到每个数据的局部密度,计算每个数据与比它的局部密度大的数据之间的最小距离;
(3)对数据集中每个数据的局部密度与最小距离的乘积排序,取乘积较大的前H个数据为聚类中心,比聚类中心的局部密度大的数据中距离聚类中心最近的数据与聚类中心属于同一类;
(4)对于数据集中没有类属性的数据按照局部密度从大到小的顺序判断其类属性,对于没有类属性的数据中的任意一个数据,该数据与比它的局部密度大的数据中距离它最近的数据属于同一类,进而得到工业过程数据的聚类结果。
进一步地,步骤(1)中数据之间的距离为:d’ij=dij+tij,其中,d’ij为数据i与数据j之间的距离,dij为数据i与数据j之间的欧氏距离,tij为数据i与数据j之间时间因数,
Figure GDA0002358441620000031
tij=λ(i-j)a,其中,sk是第k个变量的标准差,1≤k≤n,n为数据的变量总数,xik-xjk为数据i与数据j之间对应的变量之差,λ为时间因数调节参数。
进一步地,时间因数调节参数λ的范围为0.2至5。
进一步地,步骤(2)还包括:
将数据之间的距离按照降序排列成序列sda(d’1,d’2,…,d’M),其中,
Figure GDA0002358441620000032
N表示数据总数,d’M为序列中第M个数据之间的距离。
进一步地,截断距离为:
dc=sda[round(N×(N-1)×p)]
其中,dc为截断距离,sda[round(N×(N-1)×p)]表示序列中第round(N×(N-1)×p)个数据之间的距离,round表示四舍五入,p为调节参数。
进一步地,调节参数为0.1%至5%。
进一步地,局部密度为:ρi=∑jχ(d’ij-dc),其中,ρi为数据i的局部密度,
Figure GDA0002358441620000041
进一步地,最小距离为:
Figure GDA0002358441620000042
其中,δi为数据i与比它的局部密度大的数据之间的最小距离。
进一步地,工业过程数据聚类方法还包括:
(5)对于新的工业过程数据,计算新的工业过程数据与数据集中每个数据之间的欧氏距离与时间因数相结合,得到新的数据之间的距离;根据新的数据之间的距离和调节参数,得到新的截断距离,根据新的截断距离和新的数据之间的距离,得到新的数据的局部密度,计算新的数据与比它的局部密度大的数据之间的新的最小距离;新的工业过程数据与数据集中比新的数据的局部密度大且与新的数据的最小距离相等的数据属于同一类。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
(1)本发明通过将数据集中数据之间的欧氏距离与时间因数相结合,得到数据之间的距离,本发明在对工业过程数据聚类时,将时间因数考虑进来,相比于传统的DPC聚类方法可以找到更佳合理的聚类中心,因此其具有更高的分类精度。
(2)本发明提出比聚类中心的局部密度大的数据中距离聚类中心最近的数据与聚类中心属于同一类。本发明采用基于密度的聚类方法寻找同一类中的其他数据,不需要事先预设聚类数目,不再利用基于划分的聚类方法寻找同一类中的其他数据,这种方法更适合工业过程数据。同时该方法不但聚类结果更较准确,而且大大降低了计算量,对于多模态工业过程具有很好的适用性。
(3)如果数据的局部密度大,则表示其周围存在大量的数据,最小距离大表示该数据至少存在一个比它更密集的数据并且它们之间的距离也大,而局部密度小且最小距离大的数据意味着它比较孤立,且远离聚类中心,所以这样的数据被视为离群点。所以本发明对数据集中每个数据的局部密度与最小距离的乘积排序,取乘积较大的前H个数据为聚类中心,这样得到的聚类中心密度足够大且距离其他密度大的点距离也足够远。使得本发明得到聚类中心准确率高。
(4)调节参数越小则分类的结果越精确,类的数目越多,同时为了使得每个数据的邻居数为所有数据的1%-5%,本发明中调节参数为0.1%至5%。当聚类方法的结果与由实际工程经验的结果不符合时,可以通过调节时间因数调节参数λ的大小,时间因数调节参数λ越大则分类的结果越精确,类的数目越多,反之,同理;当时间因数调节参数λ的取值在0.2至5之间即可得到较好的结果。
(5)本发明中对于新的工业过程数据,利用已经得到的得到工业过程数据的聚类结果进行分类,使得本发明也可以应用于在线检测,同时在线检测的效率高、准确率高。
附图说明
图1是本发明实施例提供的一种密度峰值聚类的工业过程数据聚类方法的流程图;
图2(a)是普通的k-means方法对半导体的所有模态进行分类的结果示意图;
图2(b)是利用本发明对选取聚类中心作改进的k-means方法对半导体的所有模态进行分类的结果示意图;
图3(a)是普通的模糊聚类方法对半导体的所有模态进行分类的结果示意图;
图3(b)是利用本发明对选取聚类中心作改进的模糊聚类方法对半导体的所有模态进行分类的结果示意图;
图4是传统的基于密度峰值聚类算法对半导体工业过程各个模态的分类结果示意图;
图5(a)是利用本发明密度峰值聚类的工业过程数据聚类方法在第一种参数下的对半导体的所有模态进行分类的结果示意图;
图5(b)是利用本发明密度峰值聚类的工业过程数据聚类方法在第二种参数下的对半导体的所有模态进行分类的结果示意图;
图6是本发明密度峰值聚类的工业过程数据聚类方法在较优参数下对半导体工业过程各个模态的分类结果示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,一种密度峰值聚类的工业过程数据聚类方法,包括:
(1)获取工业过程数据,包括正常数据、故障数据和不同模态的数据,组成数据集;将数据集中数据之间的欧氏距离与时间因数相结合,得到数据之间的距离:d’ij=dij+tij,其中,d’ij为数据i与数据j之间的距离,dij为数据i与数据j之间的欧氏距离,tij为数据i与数据j之间时间因数,
Figure GDA0002358441620000071
tij=λ(i-j)a,其中,sk是第k个变量的标准差,1≤k≤n,n为数据的变量总数,xik-xjk为数据i与数据j之间对应的变量之差,λ为时间因数调节参数,λ的范围为0.2至5。
(2)将数据之间的距离按照降序排列成序列sda(d’1,d’2,…,d’M),其中,
Figure GDA0002358441620000072
N表示数据总数,d’M为序列中第M个数据之间的距离。根据数据之间的距离和调节参数,得到截断距离:
dc=sda[round(N×(N-1)×p)]
其中,dc为截断距离,sda[round(N×(N-1)×p)]表示序列中第round(N×(N-1)×p)个数据之间的距离,round表示四舍五入,p为调节参数,调节参数为0.1%至5%。根据截断距离和数据之间的距离,得到每个数据的局部密度:ρi=∑jχ(d’ij-dc),其中,ρi为数据i的局部密度,
Figure GDA0002358441620000073
计算每个数据与比它的局部密度大的数据之间的最小距离:
Figure GDA0002358441620000074
其中,δi为数据i与比它的局部密度大的数据之间的最小距离。
(3)对数据集中每个数据的局部密度与最小距离的乘积排序,取乘积较大的前H个数据为聚类中心,比聚类中心的局部密度大的数据中距离聚类中心最近的数据与聚类中心属于同一类;
(4)对于数据集中没有类属性的数据按照局部密度从大到小的顺序判断其类属性,对于没有类属性的数据中的任意一个数据,该数据与比它的局部密度大的数据中距离它最近的数据属于同一类,进而得到工业过程数据的聚类结果。
(5)对于新的工业过程数据,计算新的工业过程数据与数据集中每个数据之间的欧氏距离与时间因数相结合,得到新的数据之间的距离;根据新的数据之间的距离和调节参数,得到新的截断距离,根据新的截断距离和新的数据之间的距离,得到新的数据的局部密度,计算新的数据与比它的局部密度大的数据之间的新的最小距离;新的工业过程数据与数据集中比新的数据的局部密度大且与新的数据的最小距离相等的数据属于同一类。
实施例1
实施例1采用本发明提供的基于改进的密度峰值聚类(DPC:Density PeaksClustering)的工业过程数据聚类方法,通过半导体的工业过程进行验证,表1为半导体工业过程的16个不同模态与工业过程数据的对应表。
表1
模态 对应模态的数据点
1 1-24
2 25-49
3 50-73
4 74-82
5 83-107
6 108-132
7 133-153
8 154-178
9 179-203
10 204-223
11 224-248
12 249-269
13 270-294
14 295-318
15 319-340
16 341-364
本发明实施例1利用的验证数据来自于半导体工业过程的数据,现代半导体生产线是由数百个连续的批处理阶段组成的。每一个阶段都包括由昂贵的工具进行的许多步骤,这些工具由许多能够在几秒钟内取样的传感器监控。该工业过程数据的特征是:具有时间序列特征(该工业过程数据的各个模态是严格按照时间的前后顺序排列的,即不存在一个时间段内有两个不同模态的数据),该工业过程总共有16个模态,按照时间顺序依次发生,该过程的模态划分是由有经验的工人依据工程经验划分的。
图2(a)是普通的k-means方法对半导体的所有模态进行分类的结果示意图;图2(b)是利用本发明对选取聚类中心作改进的k-means方法对半导体的所有模态进行分类的结果示意图;从图中可以看出传统的k-means聚类方法的分类效果非常不合理,虽然改进后的k-means聚类算法对模态分类效果有所改善,但是仍然没达到要求。
图3(a)是普通的模糊聚类方法对半导体的所有模态进行分类的结果示意图;图3(b)是利用本发明对选取聚类中心作改进的模糊聚类方法对半导体的所有模态进行分类的结果示意图;从图中可以看出模糊聚类算法模态数不正确、分类也不合理,改进后的模糊聚类算法虽然模态数正确,但是各个模态的样本点分配的也有较多错误。
图4是传统的基于密度峰值聚类算法对半导体工业过程各个模态的分类结果示意图,从图中可以看出该方法吧原本16类的数据分成3大类,说明该方法不能达到精确分类的效果。
图5(a)是利用本发明密度峰值聚类的工业过程数据聚类方法在第一种参数下的对半导体的所有模态进行分类的结果示意图;图5(b)是利用本发明密度峰值聚类的工业过程数据聚类方法在第二种参数下的对半导体的所有模态进行分类的结果示意图;第一种参数和第二种参数均还未达到较优情况,对工业过程各个模态进行分类,从图中我们可以看出改进的DPC方法当参数没达到最优时它把原本16类的数据分成8类和11类,各个类的样本点划分也较合理。
图6是本发明密度峰值聚类的工业过程数据聚类方法在较优参数(调节参数为0.1%至5%,λ的取值在0.2至5之间)下对半导体工业过程各个模态的分类结果示意图,表2为半导体实际的各个模态分布与本发明密度峰值聚类的工业过程数据聚类方法对半导体工业过程各个模态的分类结果对比图。从中我们可以看出分类结果与实际的结果非常符合,分类精度达到98%以上,也验证了本发明的有效性。当利用本发明在离线建立好模型后,建模者再根据对工业过程的经验调节该模型的参数p与λ的值,使得到较好的模型,随后我们就可以根据建立好的模型与确定好的参数去对工业过程数据进行在线的分类。
表2
半导体的实际模态结果 改进DPC的分类结果
1-24 1-24
25-49 25-49
50-73 50-73
74-82 74-82
83-107 83-108
108-132 109-132
133-153 133-153
154-178 154-178
179-203 179-203
204-223 204-224
224-248 225-248
249-269 249-271
270-294 272-294
295-318 295-318
319-340 319-340
341-364 341-364
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种密度峰值聚类的工业过程数据聚类方法,其特征在于,包括:
(1)获取工业过程数据,包括正常数据、故障数据和不同模态的数据,组成数据集;将数据集中数据之间的欧氏距离与时间因数相结合,得到数据之间的距离;
(2)根据数据之间的距离和调节参数,得到截断距离,根据截断距离和数据之间的距离,得到每个数据的局部密度,计算每个数据与比它的局部密度大的数据之间的最小距离;
(3)对数据集中每个数据的局部密度与最小距离的乘积排序,取乘积较大的前H个数据为聚类中心,比聚类中心的局部密度大的数据中距离聚类中心最近的数据与聚类中心属于同一类;
(4)对于数据集中没有类属性的数据按照局部密度从大到小的顺序判断其类属性,对于没有类属性的数据中的任意一个数据,该数据与比它的局部密度大的数据中距离它最近的数据属于同一类,进而得到工业过程数据的聚类结果;
所述步骤(1)中数据之间的距离为:d’ij=dij+tij,其中,d’ij为数据i与数据j之间的距离,dij为数据i与数据j之间的欧氏距离,tij为数据i与数据j之间时间因数,
Figure FDA0002358441610000011
tij=λ(i-j)a,其中,sk是第k个变量的标准差,1≤k≤n,n为数据的变量总数,xik-xjk为数据i与数据j之间对应的变量之差,λ为时间因数调节参数。
2.如权利要求1所述的一种密度峰值聚类的工业过程数据聚类方法,其特征在于,其特征在于,所述时间因数调节参数λ的范围为0.2至5。
3.如权利要求1所述的一种密度峰值聚类的工业过程数据聚类方法,其特征在于,其特征在于,所述步骤(2)还包括:
将数据之间的距离按照降序排列成序列sda(d’1,d’2,…,d’M),其中,
Figure FDA0002358441610000021
N表示数据总数,d’M为序列中第M个数据之间的距离。
4.如权利要求3所述的一种密度峰值聚类的工业过程数据聚类方法,其特征在于,其特征在于,所述截断距离为:
dc=sda[round(N×(N-1)×p)]
其中,dc为截断距离,sda[round(N×(N-1)×p)]表示序列中第round(N×(N-1)×p)个数据之间的距离,round表示四舍五入,p为调节参数。
5.如权利要求1或4所述的一种密度峰值聚类的工业过程数据聚类方法,其特征在于,其特征在于,所述调节参数为0.1%至5%。
6.如权利要求4所述的一种密度峰值聚类的工业过程数据聚类方法,其特征在于,其特征在于,所述局部密度为:ρi=∑jχ(d’ij-dc),其中
Figure FDA0002358441610000022
ρi为数据i的局部密度。
7.如权利要求4所述的一种密度峰值聚类的工业过程数据聚类方法,其特征在于,其特征在于,所述最小距离为:
Figure FDA0002358441610000023
其中,δi为数据i与比它的局部密度大的数据之间的最小距离。
8.如权利要求1或2所述的一种密度峰值聚类的工业过程数据聚类方法,其特征在于,其特征在于,所述工业过程数据聚类方法还包括:
(5)对于新的工业过程数据,计算新的工业过程数据与数据集中每个数据之间的欧氏距离与时间因数相结合,得到新的数据之间的距离;根据新的数据之间的距离和调节参数,得到新的截断距离,根据新的截断距离和新的数据之间的距离,得到新的数据的局部密度,计算新的数据与比它的局部密度大的数据之间的新的最小距离;新的工业过程数据与数据集中比新的数据的局部密度大且与新的数据的最小距离相等的数据属于同一类。
CN201810217551.1A 2018-03-15 2018-03-15 一种密度峰值聚类的工业过程数据聚类方法 Expired - Fee Related CN108537249B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810217551.1A CN108537249B (zh) 2018-03-15 2018-03-15 一种密度峰值聚类的工业过程数据聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810217551.1A CN108537249B (zh) 2018-03-15 2018-03-15 一种密度峰值聚类的工业过程数据聚类方法

Publications (2)

Publication Number Publication Date
CN108537249A CN108537249A (zh) 2018-09-14
CN108537249B true CN108537249B (zh) 2020-05-19

Family

ID=63484703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810217551.1A Expired - Fee Related CN108537249B (zh) 2018-03-15 2018-03-15 一种密度峰值聚类的工业过程数据聚类方法

Country Status (1)

Country Link
CN (1) CN108537249B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348488B (zh) * 2019-06-19 2021-07-27 华中科技大学 一种基于局部密度峰值聚类的模态辨识方法
CN113741263B (zh) * 2021-08-28 2024-08-16 北京工业大学 基于全局-局部信息聚类的多模态过程模态划分方法
CN116810493B (zh) * 2023-08-31 2023-11-21 山东惠硕重工机械有限公司 基于数据驱动的数控机床防碰撞检测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930653A (zh) * 2016-04-19 2016-09-07 清华大学 一种基于计量分区流量监测数据的爆管预警方法
CN105930862A (zh) * 2016-04-13 2016-09-07 江南大学 一种基于密度自适应距离的密度峰聚类算法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170371886A1 (en) * 2016-06-22 2017-12-28 Agency For Science, Technology And Research Methods for identifying clusters in a dataset, methods of analyzing cytometry data with the aid of a computer and methods of detecting cell sub-populations in a plurality of cells

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930862A (zh) * 2016-04-13 2016-09-07 江南大学 一种基于密度自适应距离的密度峰聚类算法
CN105930653A (zh) * 2016-04-19 2016-09-07 清华大学 一种基于计量分区流量监测数据的爆管预警方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Adaptive density trajectory cluster based on time and space distance;Fagui Liu et.al;《Physica A》;20170510;第43-44页 *
Battery Grouping with Time Series Clustering based on Features;Jiayun Yang et.al;《2017 IEEE 26th International Symposium on Industrial Electronics (ISIE)》;20170808;第1320-1323页 *
Density Peaks Clustering Based Sub-phase Partition and Monitoring for Batch Process;Haolan Yan et.al;《2017 IEEE 6th Data Driven Control and Learning Systems Conference》;20171016;第297-299页 *

Also Published As

Publication number Publication date
CN108537249A (zh) 2018-09-14

Similar Documents

Publication Publication Date Title
Grabusts The choice of metrics for clustering algorithms
CN108537249B (zh) 一种密度峰值聚类的工业过程数据聚类方法
CN110909507A (zh) 焊锡制程参数建议方法
CN107682319A (zh) 一种基于增强型角度异常因子的数据流异常检测及多重验证的方法
CN108197647B (zh) 一种汽车起动机耐久测试数据的快速聚类方法
CN110348488B (zh) 一种基于局部密度峰值聚类的模态辨识方法
CN105955214B (zh) 基于样本时序和近邻相似性信息的间歇过程故障检测方法
CN113298162A (zh) 一种基于K-means算法的桥梁健康监测方法及系统
CN112837754B (zh) 一种基于特征基因的单细胞自动分类方法和装置
CN111291822A (zh) 基于模糊聚类最优k值选择算法的设备运行状态判断方法
CN110716500A (zh) 用于确定温度敏感区间分段建模点的方法与系统
CN110782546A (zh) 基于组合树模型的半导体pvd制程的电阻率虚拟量测方法
CN110084301B (zh) 一种基于隐马尔可夫模型的多工况过程工况辨识方法
CN106547899B (zh) 一种基于多尺度时变聚类中心变化的间歇过程时段划分的方法
CN113554079B (zh) 一种基于二次检测法的电力负荷异常数据检测方法及系统
CN110910021A (zh) 一种基于支持向量机监控在线缺陷的方法
CN110544047A (zh) 一种不良数据辨识方法
CN112164144B (zh) 一种结合d2算子和法向算子的铸件三维模型分类方法
CN117587403A (zh) 基于化学转化的铝合金模板表面处理方法及系统
CN109639283B (zh) 基于决策树的工件编码方法
CN106569982A (zh) 带奇异点检测补偿的gpr在线软测量方法及系统
CN114462699A (zh) 一种基于随机森林的光纤生产合格指标预测方法
CN109193624B (zh) 一种基于改进k均值聚类的负荷分类方法
CN108089136B (zh) 一种燃料电池电堆极化曲线测试数据自动切片方法
Wang et al. Multimode process fault detection method based on variable local outlier factor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200519

Termination date: 20210315

CF01 Termination of patent right due to non-payment of annual fee