CN109858544B - 基于区间阴影集和密度峰值聚类的钢材质量检测方法 - Google Patents

基于区间阴影集和密度峰值聚类的钢材质量检测方法 Download PDF

Info

Publication number
CN109858544B
CN109858544B CN201910077726.8A CN201910077726A CN109858544B CN 109858544 B CN109858544 B CN 109858544B CN 201910077726 A CN201910077726 A CN 201910077726A CN 109858544 B CN109858544 B CN 109858544B
Authority
CN
China
Prior art keywords
steel
cluster
clustering
membership
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910077726.8A
Other languages
English (en)
Other versions
CN109858544A (zh
Inventor
张清华
陈玉洪
刘学颖
杨洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201910077726.8A priority Critical patent/CN109858544B/zh
Publication of CN109858544A publication Critical patent/CN109858544A/zh
Application granted granted Critical
Publication of CN109858544B publication Critical patent/CN109858544B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明属于钢材质量测试领域,具体涉及一种基于区间阴影集和密度峰值聚类的钢材质量检测方法;所述方法包括获取原始钢材数据集,采用欧式距离公式计算得到其距离矩阵;通过密度峰值聚类中的计算公式,获取局部密度矩阵和相对距离矩阵;输出密度峰值聚类中数据集的决策图,并选取m个聚类中心,将非聚类中心进行归类得到m个类簇;计算出m个类簇中各个对象的隶属度值;通过最小化模糊熵差异,确定出m个类簇的最优阈值序列;基于最优阈值序列,采用分类规则分别对m个类簇中的非中心对象按照其隶属度值采用区间阴影集进行三支分类,从而确定出每个对象的质量检测结果,即获得原始钢材数据集的质量检测结果。本发明能够有效且快速的检测出钢材质量。

Description

基于区间阴影集和密度峰值聚类的钢材质量检测方法
技术领域
本发明属于钢材质量测试领域,具体涉及一种基于区间阴影集和密度峰值聚类的钢材质量检测方法。
背景技术
冶金工厂生产各种钢材,出厂时都要按照相应标准及技术文件的规定进行各项检测。检测过程将会产生大量数据,且随着生产的进行,数据呈现爆炸式增长,人工比对各项数据在此大数据背景下不仅耗费人力成本,同时效率低下,甚至无法完成质量检测工作。其次,钢材大数据信息系统的属性不仅多样化,而且属性之间往往具有一定的关联性。因此,诸如粒计算理论、聚类分析等数据挖掘方法大量应用于工业大数据中,快速有效提升知识发现的效果。
钢材质量检测中,检测结果通常可分为m种不同等级,该m类分别对应聚类分析算法中的m个类簇。但此分类形成的是一个初步检测结果。
2014年,Alex Rodriguez在《Science》上发表的密度峰值聚类(Density PeaksClustering,DPC)引起了业界广泛关注。大量密度峰值聚类相关算法得到广泛研究。算法能够快速、有效地发现任意形状的簇。该算法同时具有K中心点聚类(K-medoids)算法、基于密度的空间聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法和均值漂移聚类(Mean-Shift)算法的特点,简洁新颖。该算法的中心点同时具有以下两个特点:本身的密度大,即它被密度均不超过它的邻居包围;与其他密度更大的数据点之间的“距离”相对更大。
类簇中心点找到后,剩余的每个点被决策归类到它的有更高密度的最近邻所属类簇,此过程只需一步完成。因此该算法的优势在于无需迭代,极大地降低了算法的成本开销。本发明中定义了类簇的边界区域,通过对边界内对象的处理来进一步检测噪声对象,但此方法受截断距离dc的设置影响较大,dc的设置不合理可能引起对噪声对象的处理能力降低,导致类簇结构划分不合理,影响聚类效果。
DPC算法的核心思想在于对中心点的刻画上,显然,中心点是局部密度和与高密度点之间的相对距离均大的点。因此,该算法主要有两个需要计算的量:每个点的局部密度ρ以及与高密度点之间的相对距离δ;在数据集中,通过初始化参数dc;计算每个对象的局部密度ρ和相对距离δ;输出决策图,并选取聚类中心;将非聚类中心进行归类得到Ck(k=1,2,…,m);对边界区域的对象进行噪声检测,并进一步分配给core区域或halos区域,即划分为优质钢材或劣质钢材。
为了增加算法对噪声数据的鲁棒性,DPC算法定义了类簇的边界区域,一个类簇的边界区域由那些属于该类簇但与其他类簇对象的距离小于截断距离dc的对象构成。以每一个类簇边界区域中密度最大对象的密度为阈值ρb,定义该类簇中密度大于ρb的对象为本类簇的核(core),该类簇的其他对象判别为噪声点,即分配给halos区域。显然,该分配策略存在一定的缺陷。一方面,若一个类簇不存在边界区域(即不存在属于该类簇且截断距离与其他类簇对象的距离小于截断距离dc的对象),则局部密度较小且相对距离较大的噪声一些对象将会错误归类到该类簇。另一方面,若一个类簇存在边界区域,但ρb的确定与截断距离dc的选取直接相关,若
Figure BDA0001959413820000021
Figure BDA0001959413820000022
因此,dc值过大,可能使得本该属于该类簇core区域的对象被错误分配到halos区域;反之,dc值过小,可能使得本该属于halos区域的对象被错误分配到该类簇的core区域。而dc的设置没有一个统一的准则,如图1所示,图中记录了截断距离dc分别取包含数据样本总数的不同值时得到的不同聚类结果,表明已有噪声检测策略存在一定缺陷,即聚类结果受dc(人为因素)影响较大。对同一数据集,dc取不同值时对应的聚类结果。易知,对于不同的dc值,虽然类簇数相同,但是非噪声对象以及噪声对象的归类随dc的变化而变化。研究其内在原因:dc值的变化引起ρb值的变化,进一步引起core区域和halos区域的变化。因此,DPC算法的噪声检测策略存在一定的局限性。
发明内容
针对上述噪声检测问题,本发明在于提供一种基于区间阴影集的密度峰值聚类改进算法(ISS-DPC),消除dc值对噪声对象检测的影响,以此来达到钢材质量检测的目的。
本发明的一种基于区间阴影集和密度峰值聚类的钢材质量检测方法,所述方法包括以下步骤:
S1、获取原始钢材数据集,采用欧式距离公式计算得到其距离矩阵;
S2、通过密度峰值聚类中的计算公式,获取距离矩阵中的局部密度矩阵以及相对距离矩阵;
S3、输出密度峰值聚类中钢材数据集的决策图,并选取m个聚类中心;将非聚类中心进行归类得到m个类簇,分别代表数据集中初分类的m个等级钢材,即一等钢材,二等钢材,…,m等钢材。
S4、计算出m个类簇中各个对象的隶属度值;
S5、通过最小化模糊熵差异,确定出所述m个类簇的最优阈值序列;
S6、基于最优阈值序列,采用分类规则分别对m个类簇中的非中心对象按照其隶属度值采用区间阴影集进行三支分类,从而确定出每个对象的质量检测结果,即获得原始钢材数据集的质量检测结果。
进一步的,步骤S2中,
所述局部密度矩阵的计算公式包括
Figure BDA0001959413820000031
Figure BDA0001959413820000032
中任意一种方式;
优选的,本发明选择
Figure BDA0001959413820000041
作为局部密度矩阵;
所述相对距离矩阵的计算公式包括
Figure BDA0001959413820000042
其中,
Figure BDA0001959413820000043
ρi表示第i个对象的局部密度;δi表示第i个对象的相对距离;dij表示xi与xj之间的距离,参数dc为截断距离;xi表示钢铁数据集S中的第i个对象;S={x1,x2,…,xn};n表示钢铁数据集的对象总数;IS表示对象指标集,IS={k∈ISki},当
Figure BDA0001959413820000044
时,
Figure BDA0001959413820000045
对象指标集为空集,即不存在还有局部密度更大的点,表明ρi为局部密度最大的点。
进一步的,所述隶属度的计算公式包括:
Figure BDA0001959413820000046
其中,ω表示权重阈值因子,0.5<ω<1,μ(xi)表示第i个对象xi的隶属度值;xi∈Ck,Ck表示第k个类簇,k=1,2,…,m;dic表示第i个对象xi到该类簇中心点xc的距离;ρi表示第i个对象的局部密度;ρmin该类簇中对象局部密度的最小值;ρmax表示该类簇中对象局部密度的最大值;R表示包围大部分对象的球半径。
优选的,球半径R的确定方法包括以半径R形成的球能够以半径R形成的球包围一个类簇中70%~80%的类簇对象;即使得类簇中心点的近邻数是该类簇规模的70%~80%。
进一步的,所述最优阈值序列的确定方式包括:
Figure BDA0001959413820000051
其中,
Figure BDA0001959413820000052
表示最小化隶属度提升、降低操作的模糊熵之和与阴影区域的模糊熵之差,从而获得最优阈值序列(α11),(α22),…,(αmm);e*(ElevatedArea)表示将对象的隶属度提升为1形成的变换区域;e*(Reduced Area)表示将对象的隶属度降低为0形成的变换区域;e*(Shadow)表示将对象的隶属度转化为[βkk]区间形成的变换区域;(αkk)表示第k个类簇的最优阈值,αk表示第k个类簇的最优上阈值;βk表示第k个类簇的最优下阈值;k=1,2,…,m。
进一步的,所述将对象的隶属度提升为1形成的变换区域e*(Elevated Area)的计算公式包括
Figure BDA0001959413820000053
e*(Reduced Area)的计算公式包括
Figure BDA0001959413820000054
e*(Shadow)的计算公式包括
Figure BDA0001959413820000055
其中,μA(x)表示对象x的隶属度值;α表示隶属度上阈值;β表示隶属度下阈值;
进一步的,进行三支分类的操作包括当第k个类簇中对象的隶属度大于或等于最优上阈值αk时,则该对象属于第k等级钢材中的优质钢材;当对象的隶属度小于或等于第k个类簇的最优下阈值βk时,则该对象属于第k等级钢材中的劣质钢材;当对象x的隶属度大于βk且小于αk时,则该对象属于第k等级钢材中的合格钢材。
本发明的有益效果:
1、通过采用本发明使用的方法,工程人员可根据聚类结果直接判断钢材质量(“一等”,“二等”,…,“m等”),无需逐一比对分析每项数据,极大提高工作效率。
2、现有聚类分析算法针对工业数据集往往分类精度较低,且二支聚类结果太过武断。本发明采用三支聚类的思想进一步将二支聚类分析得到的钢材质量初分类结果进行再分类,使其得到一个精度更高,且符合人类认知的三支结构。工程人员可根据此三支结果进行直观挑选钢材。若对m个等级质量要求均较高,可挑选m个等级中core区域(优质)钢材;若适当降低要求,可挑选m个等级中core区域(优质)和fringe区域(合格)中的钢材。
3、从算法时间复杂度来分析,本发明与经典密度峰值聚类算法保持了同一量级,且聚类算法本身就极大地提高了工程人员工作效率,因此本发明依旧高效、可行。
附图说明
图1为现有技术中截断距离dc取不同值时对应的聚类结果;
图2为本发明的方法流程框图;
图3为本发明中两个不同类中对象之间隶属度差别图;
图4为本发明所采用的区间阴影集的示例图;
图5为本发明的决策图;
图6为本发明的钢材质量检测聚类结果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例1
本发明采用基于区间阴影集和密度峰值聚类的钢材质量检测方法,以下对基于区间阴影集和密度峰值聚类简称为ISS-DPC算法;如图2所示,本发明的钢材质量检测方法其包括以下步骤:
输入:数据集S。
输出:
Figure BDA0001959413820000071
Step 1:初始化参数dc
Step 2:通过公式(1)或(2)计算每个点的局部密度ρ,通过公式(3)计算相对距离δ;
Figure BDA0001959413820000072
Figure BDA0001959413820000073
Figure BDA0001959413820000074
其中,ρi表示第i个对象的局部密度;δi表示第i个对象的相对距离;dij表示xi与xj之间的距离,参数dc为截断距离;xi表示钢铁数据集S中的第i个对象;S={x1,x2,…,xn};n表示钢铁数据集的对象总数;IS表示对象指标集,IS={k∈ISki},即当
Figure BDA0001959413820000075
时,
Figure BDA0001959413820000076
Step 3:输出决策图,并选取聚类中心;
Step 4:将非聚类中心进行归类得到Ck(k=1,2,…,m);
Step 5:通过公式(4)计算各类簇中对象隶属度得到{μk(x)|x∈Ck},其中k=1,2,…,m;
作为一种可选方式,本实施例中权重阈值因子ω=0.6;其隶属度的计算公式则为:
Figure BDA0001959413820000081
式(4)中,μ(xi)表示第i个对象xi的隶属度值;xi∈Ck,Ck表示第k个类簇,k=1,2,…,m;dic表示第i个对象xi到该类簇中心点xc的距离;ρi表示第i个对象的局部密度;ρmin该类簇中对象局部密度的最小值;ρmax表示该类簇中对象局部密度的最大值;R表示包围大部分对象的球半径。
Step 6:通过公式(5)计算各类簇最优阈值序列(α11),(α22),…,(αmm);
Figure BDA0001959413820000082
其中,
Figure BDA0001959413820000083
表示最小化隶属度提升、降低操作的模糊熵之和与阴影区域的模糊熵之差,从而获得最优阈值序列(α11),(α22),…,(αmm);e*(ElevatedArea)表示将对象的隶属度提升为1形成的变换区域;e*(Reduced Area)表示将对象的隶属度降低为0形成的变换区域;e*(Shadow)表示将对象的隶属度转化为[βkk]区间形成的变换区域;(αkk)表示第k个类簇的最优阈值,αk表示第k个类簇的最优上阈值;βk表示第k个类簇的最优下阈值;k=1,2,…,m。
Step 7:采用规则I,II,III分别对每个类簇中的非中心点进行三支归类。
本发明的改进之处在于,当现有技术进行到选取聚类中心后,本发明则引入区间阴影集(ISS)模型进行下一步三支分类。因此,本发明的首要工作是对各类簇中对象依据各属性值将其转化为隶属度表达形式。考虑DPC算法的特性,对象隶属度大小应呈现如下规律:一是对象离所属类簇中心点距离越近,则隶属度越大;二是对象局部密度越大,则隶属度越大。
如图3所示,(a),(b)中的对象x离中心点的距离相等,但考虑它们与类簇中其余点之间紧密程度,显然,(a)中x与其它对象更加紧密(局部密度更大)。因此(a)中的对象x应该具有更大的隶属度。
为了度量如图3所示对象之间隶属度的差异,本发明引入最小球半径R的概念来转化隶属度。在数据集数目固定的情况下,球半径R越大,对象的紧密度越小;反之,球半径R越小,对象的紧密度越大。因此,当数据集中存在噪声对象时,寻找一个能够包围大部分对象的球半径R,允许小部分对象位于球外面,再分别对位于球内与球外的每个对象采用不同的公式求其隶属度。定义3具体给出了隶属度转化方法。
显然,各类簇中心xc拥有最大的隶属度1。公式(4)中的两个多项式前一项考虑对象与类簇中心点的距离因素,该项提供的隶属度使得位于球内的对象隶属度大于或等于0.2,且位于球外的对象隶属度小于0.2。而两个多项式后一项是对象局部密度归一化处理的结果乘以0.5,通常情况下,各类簇中距离中心点越远的对象,其局部密度越大,因此该项提供的隶属度使得位于球内的对象较之球外的对象隶属度差异更大。据上述分析,通常情况下位于球内的对象隶属度与位于球外的对象隶属度之间的差异会大于0.2,这使得位于球内、球外对象之间的隶属度具有更好的区分性。当然,本发明为了方便说明问题,公式(4)多项式的前后两项均给定权重为0.5,该权重也可根据具体研究作具体调整。
本发明采用的区间阴影集如图4所示,设α和β为两个实数且0≤β<α≤1,在论域U上,区间阴影集被定义为一个从U到集合{0,[β,α],1}的映射,即S*:U→{0,[0,1],1}。S*被定义如下:
Figure BDA0001959413820000101
显然,构建ISS模型规则如下:
1)当对象的隶属度μA(x)大于或等于阈值α,将这些对象的隶属度提升为1,变化区域被定义为Elevated Area;
2)当对象的隶属μA(x)小于或等于阈值β,将这些对象的隶属度降低为0,变化区域被定义为Reduced Area;
3)当对象的隶属度μA(x)大于β且小于α,将这些对象的隶属度转化为[β,α],变化区域被定义为Shadow。
为了减小所ISS模型与模糊集A之间的不确定性差异,本发明基于模糊熵提出如下目标函数,
e*(Shadow)=e*(Elevated Area)+e*(Reduced Area). (6)
公式(6)表明Shadow区域的模糊熵等于提升和降低操作减少的模糊熵。然而在实际情况下,很难找到一对阈值满足公式(6)的条件。因此,对于任何一个给定的模糊集,通过求解式(5)的最小化问题可求得最优阈值(α,β),
本发明中提到的规则I,II,III描述如下:
I.当对象x的隶属度大于或等于αk时,x∈core(Ck);
II.当对象x的隶属度小于或等于βk时,x∈halos(Ck);
III.当对象x的隶属度大于βk且小于αk时,x∈fringe(Ck)=Ck-(core(Ck)∪halos(Ck))。
其中,
core(Ck)∪halos(Ck)∪fringe(Ck)=Ck,
Figure BDA0001959413820000111
Figure BDA0001959413820000112
Figure BDA0001959413820000113
语义上x∈core(Ck)、x∈halos(Ck)、x∈fringe(Ck)分别表示x确定属于类簇Ck、x确定不属于类簇Ck、可能属于类簇Ck。如果,
Figure BDA0001959413820000114
则聚类结果退化为二支聚类,显然二支聚类是三支聚类的一种特殊情况。
core(Ck)、halos(Ck)、fringe(Ck)需要满足一定条件,本发明提出如下有关性质:
a)
Figure BDA0001959413820000115
b)
Figure BDA0001959413820000116
c)
Figure BDA0001959413820000117
d)
Figure BDA0001959413820000118
e)
Figure BDA0001959413820000119
性质a)要求所有类簇不为空,性质b)~e)表明所有对象当且仅当属于某一个类簇。根据上述讨论,本发明分别给出如下二支和三支聚类结果表达式:
Figure BDA00019594138200001110
Figure BDA00019594138200001111
实施例2
本例以某钢厂炼钢数据为例,为方便展示与说明问题,本发明选择两列数据为例进行聚类分析,所选两列数据分别是炉内目标结束温度和钢液温度,共计800条数据。如表1所示列举了原始表中的开始10条数据:
表1部分原始数据
Figure BDA0001959413820000121
原始数据表中,每行数据记录一次炼钢过程中的相关指标,当炉内目标结束温度与钢液温度相差越小时,炼出的钢材质量越高;反之相差越大,钢材质量越低。因此本例采用聚类分析的方法快速判断钢材质量。
表2列举了原始表中开始10条数据的距离矩阵;表3列举了原始表中开始10条数据的局部密度矩阵。
表2部分原始数据距离矩阵
ID 1 2 3 4 5 6 7 8 9 10
1 0 51.41984 42.63801 48.09366 39.59798 72.36712 25.4951 60.16644 89.47067 71.30919
2 51.41984 0 84.34453 15.13275 27.20294 33.42155 27.01851 52.15362 111.8258 94.04786
3 42.63801 84.34453 0 86.37708 61.0082 111.79 58.24088 62.17717 54.23099 39.45884
4 48.09366 15.13275 86.37708 0 36.89173 25.4951 28.6531 64.4748 120.2165 101.9117
5 39.59798 27.20294 61.0082 36.89173 0 60.10824 17.72005 28.63564 84.64632 66.85058
6 72.36712 33.42155 111.79 25.4951 60.10824 0 54.12024 85.44589 144.5891 126.5069
7 25.4951 27.01851 58.24088 28.6531 17.72005 54.12024 0 45.01111 92.84934 74.33034
8 60.16644 52.15362 62.17717 64.4748 28.63564 85.44589 45.01111 0 65 50.01
9 89.47067 111.8258 54.23099 120.2165 84.64632 144.5891 92.84934 65 0 18.60108
10 71.30919 94.04786 39.45884 101.9117 66.85058 126.5069 74.33034 50.01 18.60108 0
表3部分原始数据密度矩阵
Figure BDA0001959413820000122
Figure BDA0001959413820000131
采用本发明进行聚类分析的参数设置为:设置dc使得对象的近邻数大约是整个数据集规模的2%;ISS-DPC算法设置最小球半径R的参考为:使得类簇中心点的近邻数大约是该类簇规模的75%。
步骤1.输入原始数据集S,并采用欧式距离公式
Figure BDA0001959413820000132
计算得到距离矩阵d;
步骤2.通过公式
Figure BDA0001959413820000133
计算得到样本的局部密度矩阵ρ,通过公式
Figure BDA0001959413820000134
得到样本的相对距离矩阵δ;
步骤3.输出决策图Decision Graph,并选取聚类中心。如图5所示,本例选取到3个聚类中心(其ID分别为143,367,473),代表数据集中的3种类型钢材;
步骤4.非聚类中心归类得到C1,C2,C3三个类簇;
步骤5.通过公式(4)计算各类簇中对象隶属度得到{μk(x)|x∈Ck},其中k=1,2,3;
步骤6.通过公式(5)优化得到3个类簇依次的最优阈值序列(0.668,0.332),(0.674,0.326),(0.637,0.363);
步骤7.采用规则I,II,III分别对3个类簇中的非中心点进行三支归类:例如第1个类簇中,最优阈值序列为(0.668,0.332),因此当对象隶属度大于等于0.668时,该对象归类到core区域;当对象隶属度小于等于0.332时,该对象归类到halos区域;当对象隶属度介于0.332到0.668之间时,该对象归类到fringe区域;其余两个类簇按相同规则归类,最终输出三支聚类结果
Figure BDA0001959413820000135
本例的最终结果统计为:如图6所示,优质采用“*”,合格采用“○”表示、不合格采用“x”表示;800条数据中,其中353条数据所代表的钢材属于生产出的三个等级中的“优质”产品之和,331条数据所代表的钢材属于三个等级中的“合格”产品之和,116条数据所代表的钢材属于三个等级中的“劣质”产品之和。可以理解的是,本发明中每一个等级的产品都分为了“优”“中”“差”3类,即此处采用第一、二、三等级中的优质产品数量之和;第一、二、三等级中合格数量之和;第一、二、三等级中劣质数量之和来代表的钢材所属质量。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于区间阴影集和密度峰值聚类的钢材质量检测方法,其特征在于,所述方法包括以下步骤:
S1、获取原始钢材数据集,采用欧式距离公式计算得到其距离矩阵;
S2、通过密度峰值聚类中的计算公式,获取距离矩阵中的局部密度矩阵以及相对距离矩阵;
S3、输出密度峰值聚类中钢材数据集的决策图,并选取m个聚类中心;将非聚类中心进行归类得到m个类簇,分别代表数据集中初分类的m个等级钢材,即一等钢材,二等钢材,…,m等钢材;
S4、计算出m个类簇中各个对象的隶属度值;
S5、通过最小化模糊熵差异,确定出所述m个类簇的最优阈值序列;
所述最优阈值序列中每对最优阈值的求解方式表示为:
Figure FDA0002828415580000011
其中,所述区间阴影集表示为论域U到集合{0,[β,α],1}的映射;
Figure FDA0002828415580000012
表示最小化隶属度提升、降低操作的模糊熵之和与阴影区域的模糊熵之差的绝对值,从而获得每对最优阈值(α,β);e*(Elevated Area)表示将对象的隶属度提升为1形成的变换区域;e*(Reduced Area)表示将对象的隶属度降低为0形成的变换区域;e*(Shadow)表示将对象的隶属度转化为[βkk]区间形成的变换区域;(αkk)表示第k个类簇的最优阈值,αk表示第k个类簇的最优上阈值;βk表示第k个类簇的最优下阈值;k=1,2,…,m;μA(x)表示模糊集A中对象x的隶属度值;
S6、基于最优阈值序列,采用分类规则分别对m个类簇中的非中心对象按照其隶属度值采用区间阴影集进行三支分类,从而确定出每个类簇中对象的进一步质量检测结果,即获得原始钢材数据集的最终质量检测结果。
2.根据权利要求1所述的一种基于区间阴影集和密度峰值聚类的钢材质量检测方法,其特征在于,步骤S2中,
所述局部密度矩阵的计算公式包括
Figure FDA0002828415580000021
Figure FDA0002828415580000022
中任意一种方式;
所述相对距离矩阵的计算公式表示为
Figure FDA0002828415580000023
其中,
Figure FDA0002828415580000024
ρi表示第i个对象的局部密度;δi表示第i个对象的相对距离;dij表示xi与xj之间的距离,dc为截断距离;xi表示钢铁数据集S中的第i个对象;S={x1,x2,…,xn};n表示钢铁数据集的对象总数;IS表示对象指标集,IS={k∈ISki},当
Figure FDA0002828415580000025
时,
Figure FDA0002828415580000026
即对象指标集为空集。
3.根据权利要求1所述的一种基于区间阴影集和密度峰值聚类的钢材质量检测方法,其特征在于,所述隶属度的计算公式包括:
Figure FDA0002828415580000027
其中,ω表示权重阈值因子,0.5<ω<1,μ(xi)表示第i个对象xi的隶属度值;xi∈Ck,Ck表示第k个类簇,k=1,2,…,m;dic表示第i个对象xi到该类簇中心点xc的距离;ρi表示第i个对象的局部密度;ρmin该类簇中对象局部密度的最小值;ρmax表示该类簇中对象局部密度的最大值;R表示包围大部分对象的球半径。
4.根据权利要求3所述的一种基于区间阴影集和密度峰值聚类的钢材质量检测方法,其特征在于,球半径R的确定方法以半径R形成的球包围一个类簇中70%~80%的类簇对象,即使得类簇中心点的近邻数是该类簇规模的70%~80%。
5.根据权利要求1所述的一种基于区间阴影集和密度峰值聚类的钢材质量检测方法,其特征在于,进行三支分类的操作方式为当第k个类簇中对象的隶属度大于或等于最优上阈值αk时,则该对象属于第k等级钢材中的优质钢材;当对象的隶属度小于或等于第k个类簇的最优下阈值βk时,则该对象属于第k等级钢材中的劣质钢材;当对象x的隶属度大于βk且小于αk时,则该对象属于第k等级钢材中的合格钢材。
CN201910077726.8A 2019-01-28 2019-01-28 基于区间阴影集和密度峰值聚类的钢材质量检测方法 Active CN109858544B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910077726.8A CN109858544B (zh) 2019-01-28 2019-01-28 基于区间阴影集和密度峰值聚类的钢材质量检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910077726.8A CN109858544B (zh) 2019-01-28 2019-01-28 基于区间阴影集和密度峰值聚类的钢材质量检测方法

Publications (2)

Publication Number Publication Date
CN109858544A CN109858544A (zh) 2019-06-07
CN109858544B true CN109858544B (zh) 2021-01-29

Family

ID=66896386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910077726.8A Active CN109858544B (zh) 2019-01-28 2019-01-28 基于区间阴影集和密度峰值聚类的钢材质量检测方法

Country Status (1)

Country Link
CN (1) CN109858544B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111144910B (zh) * 2019-12-28 2022-11-15 重庆邮电大学 基于模糊熵均值阴影集的招投标“串标、陪标”对象推荐方法及装置
CN113158817B (zh) * 2021-03-29 2023-07-18 南京信息工程大学 一种基于快速密度峰聚类的客观天气分型方法
CN113255288B (zh) * 2021-07-15 2021-09-24 成都威频通讯技术有限公司 一种基于快速密度峰值聚类的电子元器件聚类方法
CN114613456B (zh) * 2022-03-07 2023-04-28 哈尔滨理工大学 一种基于改进密度峰值聚类算法的高熵合金硬度预测方法
CN116975672B (zh) * 2023-09-22 2023-12-15 山东乐普矿用设备股份有限公司 一种煤矿皮带输送电机温度监测方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101249168B1 (ko) * 2009-12-18 2013-03-29 주식회사 포스코 냉간압연에서의 품질이상 예지 시스템과 그 방법
CN104630410A (zh) * 2015-02-10 2015-05-20 东北大学 一种基于数据解析的转炉炼钢质量实时动态预测方法
CN106339416A (zh) * 2016-08-15 2017-01-18 常熟理工学院 基于网格快速搜寻密度峰值的数据聚类方法
CN106649877A (zh) * 2017-01-06 2017-05-10 广东工业大学 一种基于密度峰值的大数据挖掘方法及装置
CN107038454A (zh) * 2017-03-09 2017-08-11 中国矿业大学 一种使用模糊近邻的鲁棒性密度峰值算法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101249168B1 (ko) * 2009-12-18 2013-03-29 주식회사 포스코 냉간압연에서의 품질이상 예지 시스템과 그 방법
CN104630410A (zh) * 2015-02-10 2015-05-20 东北大学 一种基于数据解析的转炉炼钢质量实时动态预测方法
CN106339416A (zh) * 2016-08-15 2017-01-18 常熟理工学院 基于网格快速搜寻密度峰值的数据聚类方法
CN106649877A (zh) * 2017-01-06 2017-05-10 广东工业大学 一种基于密度峰值的大数据挖掘方法及装置
CN107038454A (zh) * 2017-03-09 2017-08-11 中国矿业大学 一种使用模糊近邻的鲁棒性密度峰值算法及系统

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
10CrNi3MoV船体钢力学性能的聚类分析;曹雷 等;《中国造船》;20040930;第45卷(第3期);第3.2、3.3、3.4节 *
Clustering by fast search and find of density peaks;Alex Rodriguez 等;《Science》;20041231;第1492-1496页 *
Constructing shadowed sets and three-way approximations of;Yiyu Yao 等;《Information Sciences》;20171231;第132-153页 *
Decision-theoretic three-way approximations of fuzzy sets;Xiaofei Deng 等;《Information Sciences》;20141231;第702-715页 *
Interpretation of clusters in the framework of shadowed sets;Witold Pedrycz;《Pattern Recognition Letters》;20050629;第26卷;第2443页左栏、参见第2443页、表5、图4 *
Shadowed Sets: Representing and Processing Fuzzy Sets;Witold Pedrycz;《IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS—PART B: CYBERNETICS》;19980228;第28卷(第1期);第103-109页 *
基于FSVM的未知病毒检测技术研究;徐林枫;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20180615;第2018卷(第06期);第4.2.2 节 *
基于样本之间紧密度的模糊支持向量机方法;张翔 等;《软件学报》;20060531;第17卷(第5期);第1.2节 *
海岸带生态健康状态评价案例分析;吝涛 等;《海岸带生态安全评价模式研究与案例分析》;20180228;第104-109页 *

Also Published As

Publication number Publication date
CN109858544A (zh) 2019-06-07

Similar Documents

Publication Publication Date Title
CN109858544B (zh) 基于区间阴影集和密度峰值聚类的钢材质量检测方法
Chen et al. Combining discriminant analysis and neural networks for corn variety identification
CN114445387A (zh) 一种基于机器视觉的纤维板质量分类方法
CN108898479B (zh) 信用评价模型的构建方法及装置
CN111062425B (zh) 基于c-k-smote算法的不平衡数据集处理方法
CN105719291A (zh) 品种可选择的表面缺陷图像分类系统
CN109509196B (zh) 一种基于改进的蚁群算法的模糊聚类的舌诊图像分割方法
CN108074025A (zh) 基于表面缺陷分布特征的钢卷表面缺陷判定方法
CN112633337A (zh) 一种基于聚类和边界点的不平衡数据处理方法
CN111402236A (zh) 一种基于图像灰度值的热轧带钢表面缺陷分级方法
CN114741603A (zh) 基于用户聚类和商品聚类的混合协同过滤推荐算法
CN115841624A (zh) 基于红外图像的高炉煤气流分布识别方法
Iqbal et al. Mitochondrial organelle movement classification (fission and fusion) via convolutional neural network approach
CN113297723A (zh) 基于均值漂移-灰色关联分析的电主轴温度测点优化方法
CN107016454B (zh) 一种非均质矿球磨破碎分布函数预测方法
CN110751660B (zh) 一种彩色图像分割方法
Bai et al. Recognition of bovine milk somatic cells based on multi-feature extraction and a GBDT-AdaBoost fusion model
CN113298148B (zh) 一种面向生态环境评价的不平衡数据重采样方法
CN115935160A (zh) 一种基于邻域粗糙集属性约简的空气质量数据处理方法
CN111814046B (zh) 一种基于邻域粗糙集的电影三支推荐方法
Cai et al. Fuzzy criteria in multi-objective feature selection for unsupervised learning
Liang et al. ASE: Anomaly Scoring Based Ensemble Learning for Imbalanced Datasets
Destarianto et al. Detection of Essential Thrombocythemia based on Platelet Count using Channel Area Thresholding
CN112308160A (zh) 一种k—均值聚类人工智能优化算法
US20200090186A1 (en) Fabricated data detection method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant