CN112329868A - 基于clara聚类的制造加工设备群能效状态评价方法 - Google Patents

基于clara聚类的制造加工设备群能效状态评价方法 Download PDF

Info

Publication number
CN112329868A
CN112329868A CN202011246905.9A CN202011246905A CN112329868A CN 112329868 A CN112329868 A CN 112329868A CN 202011246905 A CN202011246905 A CN 202011246905A CN 112329868 A CN112329868 A CN 112329868A
Authority
CN
China
Prior art keywords
cluster
energy efficiency
equal
clara
efficiency state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011246905.9A
Other languages
English (en)
Other versions
CN112329868B (zh
Inventor
陈改革
常建涛
马洪波
孔宪光
程帆
沈明磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202011246905.9A priority Critical patent/CN112329868B/zh
Publication of CN112329868A publication Critical patent/CN112329868A/zh
Application granted granted Critical
Publication of CN112329868B publication Critical patent/CN112329868B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P80/00Climate change mitigation technologies for sector-wide applications
    • Y02P80/10Efficient use of energy, e.g. using compressed air or pressurized fluid as energy carrier
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/82Energy audits or management systems therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)

Abstract

本发明提出了一种基于CLARA聚类的制造加工设备群能效状态评价方法,用以解决现有技术中存在的评价可靠性较差的技术问题,实现步骤为:获取设备群的能效状态训练数据集和能效状态验证数据集;对能效状态训练数据集和能效状态验证数据集进行预处理;对CLARA聚类算法进行优化;获取设备群在指定时间区间内的能效状态评价结果。本发明通过采集、构造设备群中设备的相关运行参数,通过网格搜索法寻找CLARA聚类算法的最优中心点个数和最优选样次数,通过优化后的CLARA聚类算法对能效状态验证数据集进行聚类处理,具有评价可靠性高和评价成本低的特点,可用于工厂设备的运行状态检测。

Description

基于CLARA聚类的制造加工设备群能效状态评价方法
技术领域
本发明属于工业大数据技术领域,涉及一种设备群能效状态评价方法,具体涉及一种基于CLARA聚类的制造加工车间设备群能效状态评价方法,可用于工厂设备运行状态检测。
背景技术
制造加工车间中设备种类繁杂、设备数量繁多、制造上下游产线间依赖关系强。现有的设备管理措施存在单一、粗放等特点,造成了制造加工车间高能耗和设备低能效等问题,给企业技术管理、日常运营、成本管控等带来了诸多问题。
为了保证制造加工车间设备群的高能效运行,需要引入设备群能效状态评价技术,客观地评价当前制造车间中各个设备的能效情况,结合现场运行人员的经验合理分配设备加工资源。
现有的制造加工车间设备群能效评价方法分为基于定义能效指标、基于定量能量分析方法和基于统计与人工智能算法三类。
基于定义能效指标是制造加工车间根据运行实际情况及相关行业知识,通过经验试验公式、数据包络分析等方式进行计算,进而评估车间内设备群的能效;基于定量能量分析方法是通过运行能耗试验的方式进行评估,通过指定的能量计算方法,定量地测算设备的能效;基于统计与人工智能算法是通过统计学习如假设检验、似然估计,机器学习算法如分类算法、聚类算法等来评估设备群的运行能效。
基于统计与人工智能算法是一种典型的制造加工车间设备群能效评价方法,例如申请公布号为CN 110210730 A,名称为“一种区域综合能源系统能效状态评价方法”,公开了一种区域综合能源系统能效评价方法,该方法通过对区域综合能源系统设备的历史数据进行采集、分析并存储;采用模糊C均值方法确定系统能效基准状态,并结合多元状态估计,构建多指标融合的能效状态评价模型;采用欧氏距离衡量观测向量与估计向量之间的残差大小,计算能效状态指数;采用核密度估计方法估计能效状态指数的概率密度分布,通过设定置信度确定评语等级阈值,根据滑窗内的能效状态指数的平均值确定系统的能效状态评语等级,解决了区域综合能源系统在复杂边界下的能效状态,有助于了解并掌握当前工况下系统的能效水平。但其存在的缺陷是:第一,该方法在建立能效评价模型时需要较多的通过专家经验确定的相关模型参数,降低了能效评估结果的可靠性,不稳定较差;第二,该方法在训练能效评价模型时所采集的数据种类过多,需要系统部署较多的采集传感器,导致评估成本较高。
发明内容
本发明的目的在于克服上述现有技术存在的缺陷,提供了一种基于CLARA聚类的运行设备群能效状态评价方法,用以解决现有技术中存在的评价可靠性较差的技术问题。
为实现上述目的,本发明的技术方案包括如下步骤:
(1)获取设备群E的能效状态训练数据集Ω和能效状态验证数据集Ω′:
(1a)采集制造加工设备群E={e1,e2,...,ei,...,en}在时间区间Δ=[T-2·N,T-N]内的运行电压U和运行功率P,以及在时间区间ψ=[T-N,T]内的运行电压U′和运行功率P′,
Figure BDA0002770331510000021
Figure BDA0002770331510000022
其中N表示历史采样间隔区间,24h≤N≤48h,T表示当前运行时刻,ei表示第i个设备,n表示设备的总数,n≥2,
Figure BDA0002770331510000023
Figure BDA0002770331510000024
Figure BDA0002770331510000025
分别表示ei在时间区间Δ和ψ内对应的运行电压子集合和运行功率子集合,
Figure BDA0002770331510000026
Figure BDA0002770331510000027
ut和pt分别表示ei在时间点t处的电压值和功率值,ug和pg分别表示ei在时间点g处的电压值和功率值;
(1b)计算
Figure BDA0002770331510000028
Figure BDA0002770331510000029
的峰值电压
Figure BDA00027703315100000210
Figure BDA00027703315100000211
谷值电压
Figure BDA00027703315100000212
Figure BDA00027703315100000213
峰谷电压差
Figure BDA0002770331510000031
Figure BDA0002770331510000032
以及
Figure BDA0002770331510000033
Figure BDA0002770331510000034
的峰值功率
Figure BDA0002770331510000035
Figure BDA0002770331510000036
谷值功率
Figure BDA0002770331510000037
Figure BDA0002770331510000038
峰谷功率差
Figure BDA0002770331510000039
Figure BDA00027703315100000310
上四分位数功率相对运行时间
Figure BDA00027703315100000311
Figure BDA00027703315100000312
下四分位数功率相对运行时间
Figure BDA00027703315100000313
Figure BDA00027703315100000314
停机时间
Figure BDA00027703315100000315
Figure BDA00027703315100000316
并构建ei的历史运行特征数据
Figure BDA00027703315100000317
Figure BDA00027703315100000318
其中
Figure BDA00027703315100000319
Figure BDA00027703315100000320
的计算公式分别为:
Figure BDA00027703315100000321
Figure BDA00027703315100000322
其中,count表示取集合大小函数,
Figure BDA00027703315100000323
sort表示升序排序函数,Num表示
Figure BDA00027703315100000324
的集合大小;
(1c)将ei的额定电压
Figure BDA00027703315100000325
和额定功率
Figure BDA00027703315100000326
组合成铭牌特征数据
Figure BDA00027703315100000327
Figure BDA00027703315100000328
(1d)将ei
Figure BDA00027703315100000329
Figure BDA00027703315100000330
组合成能效状态训练数据集
Figure BDA00027703315100000331
将ei
Figure BDA00027703315100000332
Figure BDA00027703315100000333
组合成能效状态验证数据集
Figure BDA00027703315100000334
Figure BDA00027703315100000335
Figure BDA00027703315100000336
分别表示ei对应的能效状态训练数据和能效状态验证数据,
Figure BDA00027703315100000337
Figure BDA00027703315100000338
(2)对能效状态训练数据集Ω和能效状态验证数据集Ω′进行预处理;
(2a)将Ω和Ω′转换成矩阵M1和M′1
Figure BDA00027703315100000339
Figure BDA00027703315100000340
(2b)对M1和M′1中的元素进行缺失值检测,并对存在缺失值的元素进行平均数填充,得到包含完整参数数据的矩阵M2和M′2
(2c)对M2和M′2进行归一化,得到矩阵M3和M′3
(3)对CLARA聚类算法进行优化:
(3a)初始化参数,包括中心点个数为k,k≥2,k的选取间隔和选取步长分别为μ和T,1≤μ≤n,选样次数为v,v≥1,v的选取间隔和选取步长分别为ω和S,1≤ω≤100;
(3b)根据初始化参数,构建大小为(T+1)·(S+1)且第t行第s列元素为
Figure BDA0002770331510000041
的聚类参数网格搜索矩阵
Figure BDA0002770331510000042
其中
Figure BDA0002770331510000043
1≤t≤T+1,1≤s≤S+1,并令t=1,s=1;
(3c)利用CLARA聚类算法,并通过
Figure BDA0002770331510000044
对M3进行聚类,得到包含
Figure BDA0002770331510000045
个聚类簇的聚类簇集合
Figure BDA0002770331510000046
和包括
Figure BDA0002770331510000047
个聚类簇中心点的中心点集合
Figure BDA0002770331510000048
Cu表示第u个聚类簇,σu表示Cu的中心点;
(3d)基于聚类间隔性计算公式,并通过
Figure BDA0002770331510000049
计算
Figure BDA00027703315100000410
的聚类准确度
Figure BDA00027703315100000411
(3e)设聚类准确度判断阈值为ρ,并判断
Figure BDA00027703315100000412
是否成立,若是,则将
Figure BDA00027703315100000413
Figure BDA00027703315100000414
分别作为CLARA聚类算法的最优中心点个数和最优选样次数,得到优化后的CLARA聚类算法,否则,执行步骤(3f);
(3f)判断t=T+1是否成立,若是,执行步骤(3g),否则,令t=t+1,并执行步骤(3c);
(3g)判断s=S+1是否成立,若是,将
Figure BDA00027703315100000415
Figure BDA00027703315100000416
分别作为优化后CLARA聚类算法的最优中心点个数、最优选样次数,否则,令t=1,s=s+1,并执行步骤(3c);
(4)获取设备群E在时间区间ψ内的能效状态评价结果:
(4a)采用优化后的CLARA聚类算法对M′3进行聚类,得到包括K个聚类簇的聚类簇集合C=[C1,...,Cj,...Ck]和包括K个聚类簇中心点的中心点集合Γ=[σ1,...σj,...,σK],Cj表示第j个聚类簇,
Figure BDA0002770331510000051
Figure BDA0002770331510000052
表示Cj中第χ个设备,d表示Cj中的设备个数,d≤n,σj表示Cj的中心点;
(4b)基于Γ构建大小为K·K的中心点欧式距离矩阵D,表示为
Figure BDA0002770331510000053
其中,
Figure BDA0002770331510000054
表示聚类簇Cr的中心点σr与聚类簇Cc的中心点σc之间的欧氏距离,1≤r≤K,1≤c≤K;
(4c)计算D每行的和S=[S1,...,Sr,...,SK],其中Sr表示D中第r行的元素之和;将Sr作为第r个聚类簇Cr中的设备群
Figure BDA0002770331510000055
在时间区间ψ内的能效评价结果,其中Sr表示D中第r行的元素之和。
本发明与现有技术相比,具有以下优点:
1.本发明通过对能效状态训练数据集进行预处理,并通过预处理后的矩阵对CLARA聚类算法进行优化,然后通过优化后具有最优中心点个数和最优选样次数的CLARA聚类算法获取设备群的能效状态评价结果,避免了现有技术中依靠较多通过专家经验确定的相关模型参数导致的评价结果稳定性较差的缺陷,与现有技术相比,有效提高了评价结果的可靠性。
2.本发明通过采集制造加工设备群中设备的运行电压U和运行功率P,计算其历史运行特征数据和铭牌特征数据构造出能效状态训练数据集和能效状态验证数据集,不需要采集设备的其他运行状态数据和环境数据,不需要部署较多的采集传感器,避免了现有技术中需要系统部署较多的采集传感器,会导致数据采集成本较高的问题,与现有技术相比,有效降低了数据采集成本。
附图说明
图1为本发明的实现流程图;
图2为本发明优化CLARA聚类算法的实现流程图;
具体实施方式
以下结合结合附图和具体实施例,对本发明作进一步详细描述。
参照图1,本发明包括步骤如下:
步骤1)获取设备群E的能效状态训练数据集Ω和能效状态验证数据集Ω′:
步骤1a)采集制造加工设备群E={e1,e2,...,ei,...,en}在时间区间Δ=[T-2·N,T-N]内的运行电压U和运行功率P,以及在时间区间ψ=[T-N,T]内的运行电压U′和运行功率P′,
Figure BDA0002770331510000061
Figure BDA0002770331510000062
其中N表示历史采样间隔区间,24h≤N≤48h,T表示当前运行时刻,ei表示第i个设备,n表示设备的总数,n≥2,
Figure BDA0002770331510000063
Figure BDA0002770331510000064
Figure BDA0002770331510000065
分别表示ei在时间区间Δ和ψ内对应的运行电压子集合和运行功率子集合,
Figure BDA0002770331510000066
Figure BDA0002770331510000067
ut和pt分别表示ei在时间点t处的电压值和功率值,ug和pg分别表示ei在时间点g处的电压值和功率值;
步骤1b)计算
Figure BDA0002770331510000068
Figure BDA0002770331510000069
的峰值电压
Figure BDA00027703315100000610
Figure BDA00027703315100000611
谷值电压
Figure BDA00027703315100000612
Figure BDA00027703315100000613
峰谷电压差
Figure BDA00027703315100000614
Figure BDA00027703315100000615
以及
Figure BDA00027703315100000616
Figure BDA00027703315100000617
的峰值功率
Figure BDA00027703315100000618
Figure BDA00027703315100000619
谷值功率
Figure BDA00027703315100000620
Figure BDA00027703315100000621
峰谷功率差
Figure BDA00027703315100000622
Figure BDA00027703315100000623
上四分位数功率相对运行时间
Figure BDA00027703315100000624
Figure BDA00027703315100000625
下四分位数功率相对运行时间
Figure BDA00027703315100000626
Figure BDA00027703315100000627
停机时间
Figure BDA00027703315100000628
Figure BDA00027703315100000629
并构建ei的历史运行特征数据
Figure BDA00027703315100000630
Figure BDA0002770331510000071
其中
Figure BDA0002770331510000072
Figure BDA0002770331510000073
的计算公式分别为:
Figure BDA0002770331510000074
Figure BDA0002770331510000075
其中,count表示取集合大小函数,
Figure BDA0002770331510000076
sort表示升序排序函数,Num表示
Figure BDA0002770331510000077
的集合大小;
为计算峰值电压
Figure BDA0002770331510000078
谷值电压
Figure BDA0002770331510000079
峰谷电压差
Figure BDA00027703315100000710
峰值功率
Figure BDA00027703315100000711
谷值功率
Figure BDA00027703315100000712
峰谷功率差
Figure BDA00027703315100000713
和停机时间
Figure BDA00027703315100000714
其计算公式如步骤1b1)所示:
步骤1b1)
Figure BDA00027703315100000715
Figure BDA00027703315100000716
其中,max表示求取最大值函数,min表示求取最小值函数。
步骤1c)将ei的额定电压
Figure BDA00027703315100000717
和额定功率
Figure BDA00027703315100000718
组合成铭牌特征数据
Figure BDA00027703315100000719
Figure BDA00027703315100000720
步骤1d)将ei
Figure BDA00027703315100000721
Figure BDA00027703315100000722
组合成能效状态训练数据集
Figure BDA00027703315100000723
将ei
Figure BDA00027703315100000724
Figure BDA00027703315100000725
组合成能效状态验证数据集
Figure BDA00027703315100000726
Figure BDA00027703315100000727
Figure BDA00027703315100000728
分别表示ei对应的能效状态训练数据和能效状态验证数据,
Figure BDA00027703315100000729
由于存在传感器故障及意外因素,采集的数据可能存在缺失值,所以需要对对能效状态训练数据集Ω和能效状态验证数据集Ω′进行缺失值处理;由于不同设备的电压功率数据差距较大,如果不做归一化处理会导致CLARA聚类算法的聚类效果不理想,所以需要对对能效状态训练数据集Ω和能效状态验证数据集Ω′进行归一化处理;
步骤2)对能效状态训练数据集Ω和能效状态验证数据集Ω′进行预处理:
对能效状态训练数据集Ω和能效状态验证数据集Ω′进行预处理的具体步骤为:
步骤2a)将Ω和Ω′转换成矩阵M1和M′1
Figure BDA0002770331510000081
Figure BDA0002770331510000082
步骤2b)对M1和M′1中的元素进行缺失值检测,并对存在缺失值的元素进行平均数填充,得到包含完整参数数据的矩阵M2和M′2
步骤2c)对M2和M′2进行归一化,得到矩阵M3和M′3,其中归一化的计算如步骤2c1)所示:
步骤2c1)对M2和M′2中每个元素Mmn的归一化公式为:
Figure BDA0002770331510000083
其中,Mmn *为Mmn归一化后的第m行第n列元素,Mn为对应第n列的元素集合,min表示求元素集合的最小值,max表示求元素集合的最大值;
步骤3)CLARA聚类算法的中心点个数及选样次数决定了算法聚类的可靠性,为了达到最优聚类效果,采取网格搜索法对CLARA聚类算法进行参数寻优过程,对CLARA聚类算法进行优化的实现步骤如图2所示:
步骤3a)初始化参数,包括中心点个数为k,k≥2,k的选取间隔和选取步长分别为μ和T,1≤μ≤n,选样次数为v,v≥1,v的选取间隔和选取步长分别为ω和S,1≤ω≤100;
步骤3b)根据初始化参数,构建大小为(T+1)·(S+1)且第t行第s列元素为
Figure BDA0002770331510000084
的聚类参数网格搜索矩阵
Figure BDA0002770331510000085
其中
Figure BDA0002770331510000086
1≤t≤T+1,1≤s≤S+1;
步骤3c)利用CLARA聚类算法,并通过
Figure BDA0002770331510000091
对M3进行聚类,得到包含
Figure BDA0002770331510000092
个聚类簇的聚类簇集合
Figure BDA0002770331510000093
和包括
Figure BDA0002770331510000094
个聚类簇中心点的中心点集合
Figure BDA0002770331510000095
Cu表示第u个聚类簇,σu表示Cu的中心点,其步骤如下确定:
(3c1)初始化最优代价Jm=+∞,Jm对应的聚类簇集合为Cm,Jm对应的聚类簇中心点集合为Γm
(3c2)使用PAM方法找出M3中在
Figure BDA0002770331510000096
选样次数下的的
Figure BDA0002770331510000097
个最优的中心点集合
Figure BDA0002770331510000098
为使用PAM方法找出M3中在
Figure BDA0002770331510000099
选样次数下的的
Figure BDA00027703315100000910
个最优的中心点集合,由以下步骤确定:
(3c21)初始化最小聚类代价为
Figure BDA00027703315100000911
(3c22)随机在M3中选取
Figure BDA00027703315100000912
个中心点
Figure BDA00027703315100000913
(3c23)依次选择非中心点元素ζ,计算其与各中心点的欧氏距离,并将ζ指派给距离最小的中心点元素,初始化簇集合
Figure BDA00027703315100000914
(3c24)循环遍历簇集合O元素,对于每一个簇元素,遍历其非中心点元素,将其代替该簇对应的中心点,计算代替后的聚类代价;
(3c25)若该聚类代价小于
Figure BDA00027703315100000915
将非中心点元素替换为中心点元素,更新聚类簇;
(3c26)当
Figure BDA00027703315100000916
不发生改变时,将当前聚类的中心点集合作为最优的中心点集合,当更新后的聚类簇发生改变时,执行步骤(3c22);
(3c3)定义每一个在M3且非Θ的元素为oj
Figure BDA00027703315100000917
计算oj与Θ中每一个元素的欧氏距离,选取最小的欧式距离对应的Θ元素作为oj所在簇,得到包含
Figure BDA00027703315100000918
个聚类簇的聚类簇集合
Figure BDA00027703315100000919
和包含
Figure BDA00027703315100000920
个聚类簇中心点的中心点集合
Figure BDA00027703315100000921
(3c4)利用CLARA聚类算法代价函数计算
Figure BDA00027703315100000922
的代价
Figure BDA00027703315100000923
Figure BDA00027703315100000924
Figure BDA0002770331510000101
(3c5)将
Figure BDA0002770331510000102
减1;
(3c6)判断
Figure BDA0002770331510000103
是否成立,若是,得到包含有
Figure BDA0002770331510000104
个聚类簇的集合Cm和包括
Figure BDA0002770331510000105
个聚类簇中心点的中心点集合
Figure BDA0002770331510000106
否则重复步骤(3c2);
步骤3d)基于聚类间隔性计算公式,并通过
Figure BDA0002770331510000107
计算
Figure BDA0002770331510000108
的聚类准确度
Figure BDA0002770331510000109
其中聚类间隔性计算公式如下式确定:
Figure BDA00027703315100001010
其中,d表示求欧氏距离,σzl
Figure BDA00027703315100001011
中的元素;
步骤3e)设聚类准确度判断阈值为ρ,并判断
Figure BDA00027703315100001012
是否成立,若是,则将
Figure BDA00027703315100001013
Figure BDA00027703315100001014
分别作为CLARA聚类算法的最优中心点个数和最优选样次数,得到优化后的CLARA聚类算法,否则,执行步骤(3f);
步骤3f)判断t=T+1是否成立,若是,执行步骤(3g),否则,令t=t+1,并执行步骤(3c);
步骤3g)判断s=S+1是否成立,若是,将
Figure BDA00027703315100001015
Figure BDA00027703315100001016
分别作为优化后CLARA聚类算法的最优中心点个数、最优选样次数,否则,令t=1,s=s+1,并执行步骤3c);
步骤4)获取设备群E在时间区间ψ内的能效状态评价结果:
步骤4a)采用优化后的CLARA聚类算法对M′3进行聚类,得到包括K个聚类簇的聚类簇集合C=[C1,...,Cj,...Ck]和包括K个聚类簇中心点的中心点集合Γ=[σ1,...σj,...,σK],Cj表示第j个聚类簇,
Figure BDA00027703315100001017
Figure BDA00027703315100001018
表示Cj中第χ个设备,d表示Cj中的设备个数,d≤n,σj表示Cj的中心点;
步骤4b)基于Γ构建大小为K·K的中心点欧式距离矩阵D,表示为
Figure BDA0002770331510000111
其中,
Figure BDA0002770331510000112
表示聚类簇Cr的中心点σr与聚类簇Cc的中心点σc之间的欧氏距离,1≤r≤K,1≤c≤K;
步骤4c)计算D每行的和S=[S1,...,Sr,...,SK],其中Sr表示D中第r行的元素之和;将Sr作为第r个聚类簇Cr中的设备群
Figure BDA0002770331510000113
在时间区间ψ内的能效评价。

Claims (6)

1.一种基于CLARA聚类的制造加工设备群能效状态评价方法,其特征在于,包括如下步骤:
(1)获取设备群E的能效状态训练数据集Ω和能效状态验证数据集Ω′:
(1a)采集制造加工设备群E={e1,e2,...,ei,...,en}在时间区间Δ=[T-2·N,T-N]内的运行电压U和运行功率P,以及在时间区间ψ=[T-N,T]内的运行电压U′和运行功率P′,
Figure FDA0002770331500000011
Figure FDA0002770331500000012
其中N表示历史采样间隔区间,24h≤N≤48h,T表示当前运行时刻,ei表示第i个设备,n表示设备的总数,n≥2,
Figure FDA0002770331500000013
Figure FDA0002770331500000014
Figure FDA0002770331500000015
分别表示ei在时间区间Δ和ψ内对应的运行电压子集合和运行功率子集合,
Figure FDA0002770331500000016
Figure FDA0002770331500000017
ut和pt分别表示ei在时间点t处的电压值和功率值,ug和pg分别表示ei在时间点g处的电压值和功率值;
(1b)计算
Figure FDA0002770331500000018
Figure FDA0002770331500000019
的峰值电压
Figure FDA00027703315000000110
Figure FDA00027703315000000111
谷值电压
Figure FDA00027703315000000112
Figure FDA00027703315000000113
峰谷电压差
Figure FDA00027703315000000114
Figure FDA00027703315000000115
以及
Figure FDA00027703315000000116
Figure FDA00027703315000000117
的峰值功率
Figure FDA00027703315000000118
Figure FDA00027703315000000119
谷值功率
Figure FDA00027703315000000120
Figure FDA00027703315000000121
峰谷功率差
Figure FDA00027703315000000122
Figure FDA00027703315000000123
上四分位数功率相对运行时间
Figure FDA00027703315000000124
Figure FDA00027703315000000125
下四分位数功率相对运行时间
Figure FDA00027703315000000126
Figure FDA00027703315000000127
停机时间
Figure FDA00027703315000000128
Figure FDA00027703315000000129
并构建ei的历史运行特征数据
Figure FDA00027703315000000130
Figure FDA00027703315000000131
其中
Figure FDA00027703315000000132
Figure FDA00027703315000000133
的计算公式分别为:
Figure FDA00027703315000000134
Figure FDA0002770331500000021
其中,count表示取集合大小函数,
Figure FDA0002770331500000022
sort表示升序排序函数,Num表示
Figure FDA0002770331500000023
的集合大小;
(1c)将ei的额定电压
Figure FDA0002770331500000024
和额定功率
Figure FDA0002770331500000025
组合成铭牌特征数据
Figure FDA0002770331500000026
Figure FDA0002770331500000027
(1d)将ei
Figure FDA0002770331500000028
Figure FDA0002770331500000029
组合成能效状态训练数据集
Figure FDA00027703315000000210
将ei
Figure FDA00027703315000000211
Figure FDA00027703315000000212
组合成能效状态验证数据集
Figure FDA00027703315000000213
Figure FDA00027703315000000214
Figure FDA00027703315000000215
分别表示ei对应的能效状态训练数据和能效状态验证数据,
Figure FDA00027703315000000216
Figure FDA00027703315000000217
(2)对能效状态训练数据集Ω和能效状态验证数据集Ω′进行预处理;
(2a)将Ω和Ω′转换成矩阵M1和M′1
Figure FDA00027703315000000218
Figure FDA00027703315000000219
(2b)对M1和M′1中的元素进行缺失值检测,并对存在缺失值的元素进行平均数填充,得到包含完整参数数据的矩阵M2和M′2
(2c)对M2和M′2进行归一化,得到矩阵M3和M′3
(3)对CLARA聚类算法进行优化:
(3a)初始化参数,包括中心点个数为k,k≥2,k的选取间隔和选取步长分别为μ和T,1≤μ≤n,选样次数为v,v≥1,v的选取间隔和选取步长分别为ω和S,1≤ω≤100;
(3b)根据初始化参数,构建大小为(T+1)·(S+1)且第t行第s列元素为
Figure FDA0002770331500000031
的聚类参数网格搜索矩阵
Figure FDA0002770331500000032
其中
Figure FDA0002770331500000033
1≤t≤T+1,1≤s≤S+1,并令t=1,s=1;
(3c)利用CLARA聚类算法,并通过
Figure FDA0002770331500000034
对M3进行聚类,得到包含
Figure FDA0002770331500000035
个聚类簇的聚类簇集合
Figure FDA0002770331500000036
和包括
Figure FDA0002770331500000037
个聚类簇中心点的中心点集合
Figure FDA0002770331500000038
Cu表示第u个聚类簇,σu表示Cu的中心点;
(3d)基于聚类间隔性计算公式,并通过
Figure FDA0002770331500000039
计算
Figure FDA00027703315000000310
的聚类准确度
Figure FDA00027703315000000311
(3e)设聚类准确度判断阈值为ρ,并判断
Figure FDA00027703315000000312
是否成立,若是,则将
Figure FDA00027703315000000313
Figure FDA00027703315000000314
分别作为CLARA聚类算法的最优中心点个数和最优选样次数,得到优化后的CLARA聚类算法,否则,执行步骤(3f);
(3f)判断t=T+1是否成立,若是,执行步骤(3g),否则,令t=t+1,并执行步骤(3c);
(3g)判断s=S+1是否成立,若是,将
Figure FDA00027703315000000315
Figure FDA00027703315000000316
分别作为优化后CLARA聚类算法的最优中心点个数、最优选样次数,否则,令t=1,s=s+1,并执行步骤(3c);
(4)获取设备群E在时间区间ψ内的能效状态评价结果:
(4a)采用优化后的CLARA聚类算法对M′3进行聚类,得到包括K个聚类簇的聚类簇集合C=[C1,...,Cj,...Ck]和包括K个聚类簇中心点的中心点集合Γ=[σ1,...σj,...,σK],Cj表示第j个聚类簇,
Figure FDA00027703315000000317
Figure FDA00027703315000000318
表示Cj中第χ个设备,d表示Cj中的设备个数,d≤n,σj表示Cj的中心点;
(4b)基于Γ构建大小为K·K的中心点欧式距离矩阵D,表示为
Figure FDA0002770331500000041
其中,
Figure FDA0002770331500000042
表示聚类簇Cr的中心点σr与聚类簇Cc的中心点σc之间的欧氏距离,1≤r≤K,1≤c≤K;
(4c)计算D每行的和S=[S1,...,Sr,...,SK],其中Sr表示D中第r行的元素之和;将Sr作为第r个聚类簇Cr中的设备群
Figure FDA00027703315000000418
在时间区间ψ内的能效评价结果,其中Sr表示D中第r行的元素之和。
2.根据权利要求1所述的基于CLARA聚类的制造加工设备群能效状态评价方法,其特征在于,步骤(1b)中所述的ei的历史运行特征数据
Figure FDA0002770331500000043
其中峰值电压
Figure FDA0002770331500000044
谷值电压
Figure FDA0002770331500000045
峰谷电压差
Figure FDA0002770331500000046
峰值功率
Figure FDA0002770331500000047
谷值功率
Figure FDA0002770331500000048
峰谷功率差
Figure FDA0002770331500000049
和停机时间
Figure FDA00027703315000000410
的计算公式分别为:
Figure FDA00027703315000000411
Figure FDA00027703315000000412
Figure FDA00027703315000000413
Figure FDA00027703315000000414
Figure FDA00027703315000000415
Figure FDA00027703315000000416
Figure FDA00027703315000000417
其中,max表示求取最大值函数,min表示求取最小值函数。
3.根据权利要求1所述的基于CLARA聚类的制造加工设备群能效状态评价方法,其特征在于,步骤(2c)中所述的对M2和M′2进行归一化,其中对M2和M′2中每个元素Mmn的归一化公式为:
Figure FDA0002770331500000051
其中,Mmn *为Mmn归一化后的第m行第n列元素,Mn为对应第n列的元素集合,min表示求元素集合的最小值,max表示求元素集合的最大值。
4.根据权利要求1所述的基于CLARA聚类的制造加工设备群能效状态评价方法,其特征在于,步骤(3c)所述的利用CLARA聚类算法,并通过
Figure FDA0002770331500000052
对M3进行聚类,实现步骤为:
(3c1)初始化最优代价Jm=+∞,Jm对应的聚类簇集合为Cm,Jm对应的聚类簇中心点集合为Γm
(3c2)使用PAM方法找出M3中在
Figure FDA0002770331500000053
选样次数下的的
Figure FDA0002770331500000054
个最优的中心点集合
Figure FDA0002770331500000055
(3c3)定义每一个在M3且非Θ的元素为oj
Figure FDA0002770331500000056
计算oj与Θ中每一个元素的欧氏距离,选取最小的欧式距离对应的Θ元素作为oj所在簇,得到包含
Figure FDA0002770331500000057
个聚类簇的聚类簇集合
Figure FDA0002770331500000058
和包含
Figure FDA0002770331500000059
个聚类簇中心点的中心点集合
Figure FDA00027703315000000510
(3c4)利用CLARA聚类算法代价函数计算
Figure FDA00027703315000000511
的代价
Figure FDA00027703315000000512
Figure FDA00027703315000000513
Figure FDA00027703315000000514
(3c5)将
Figure FDA00027703315000000515
减1;
(3c6)判断
Figure FDA00027703315000000516
是否成立,若是,得到包含有
Figure FDA00027703315000000517
个聚类簇的集合Cm和包括
Figure FDA00027703315000000518
个聚类簇中心点的中心点集合
Figure FDA00027703315000000519
否则重复步骤(3c2)。
5.根据权利要求1所述的基于CLARA聚类的制造加工设备群能效状态评价方法,其特征在于,步骤(3c4)所述的利用CLARA聚类算法代价函数计算
Figure FDA0002770331500000061
的代价
Figure FDA0002770331500000062
其计算公式如下:
Figure FDA0002770331500000063
其中,
Figure FDA0002770331500000064
代表
Figure FDA0002770331500000065
的代价,lr
Figure FDA0002770331500000066
中第r个聚类簇的大小,μr代表第r个聚类簇的中心点,xv (r)表示第r个聚类簇的第v个设备,0≤v≤lr,d表示求取欧氏距离。
6.根据权利要求1所述的基于CLARA聚类的制造加工设备群能效状态评价方法,步骤(3d)所述的基于聚类间隔性公式和
Figure FDA0002770331500000067
计算
Figure FDA0002770331500000068
的聚类准确度
Figure FDA0002770331500000069
其计算公式如下给出:
Figure FDA00027703315000000610
其中,d表示求欧氏距离,σzl
Figure FDA00027703315000000611
中的元素。
CN202011246905.9A 2020-11-10 2020-11-10 基于clara聚类的制造加工设备群能效状态评价方法 Active CN112329868B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011246905.9A CN112329868B (zh) 2020-11-10 2020-11-10 基于clara聚类的制造加工设备群能效状态评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011246905.9A CN112329868B (zh) 2020-11-10 2020-11-10 基于clara聚类的制造加工设备群能效状态评价方法

Publications (2)

Publication Number Publication Date
CN112329868A true CN112329868A (zh) 2021-02-05
CN112329868B CN112329868B (zh) 2023-08-01

Family

ID=74318123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011246905.9A Active CN112329868B (zh) 2020-11-10 2020-11-10 基于clara聚类的制造加工设备群能效状态评价方法

Country Status (1)

Country Link
CN (1) CN112329868B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115374881A (zh) * 2022-10-17 2022-11-22 图林科技(深圳)有限公司 一种制冷设备运行状态故障诊断方法
CN115828118A (zh) * 2022-11-24 2023-03-21 东联信息技术有限公司 基于机器学习的空调异常识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210730A (zh) * 2019-05-20 2019-09-06 太原理工大学 一种区域综合能源系统能效状态评价方法
WO2020155755A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 基于谱聚类的异常点比例优化方法、装置及计算机设备
CN111582571A (zh) * 2020-04-30 2020-08-25 中国电力科学研究院有限公司 模型驱动和数据驱动融合的电网运行态势感知方法及系统
CN111695807A (zh) * 2020-06-11 2020-09-22 国网江苏省电力有限公司经济技术研究院 计及发电和用电侧能效的地区电网能效评估方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020155755A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 基于谱聚类的异常点比例优化方法、装置及计算机设备
CN110210730A (zh) * 2019-05-20 2019-09-06 太原理工大学 一种区域综合能源系统能效状态评价方法
CN111275367A (zh) * 2019-05-20 2020-06-12 太原理工大学 一种区域综合能源系统能效状态评价方法
CN111582571A (zh) * 2020-04-30 2020-08-25 中国电力科学研究院有限公司 模型驱动和数据驱动融合的电网运行态势感知方法及系统
CN111695807A (zh) * 2020-06-11 2020-09-22 国网江苏省电力有限公司经济技术研究院 计及发电和用电侧能效的地区电网能效评估方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邹臣嵩;段桂芹;: "基于改进K-medoids的聚类质量评价指标研究", 计算机系统应用, no. 06 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115374881A (zh) * 2022-10-17 2022-11-22 图林科技(深圳)有限公司 一种制冷设备运行状态故障诊断方法
CN115374881B (zh) * 2022-10-17 2023-01-17 图林科技(深圳)有限公司 一种制冷设备运行状态故障诊断方法
CN115828118A (zh) * 2022-11-24 2023-03-21 东联信息技术有限公司 基于机器学习的空调异常识别方法

Also Published As

Publication number Publication date
CN112329868B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CN111382542B (zh) 一种面向全寿命周期的公路机电设备寿命预测系统
CN109816031B (zh) 一种基于数据不均衡度量的变压器状态评估聚类分析方法
CN112651167A (zh) 一种基于图神经网络的半监督滚动轴承故障诊断方法
CN113128567A (zh) 一种基于用电量数据的异常用电行为识别方法
CN109389325B (zh) 基于小波神经网络的变电站电子式互感器状态评估方法
CN108304567B (zh) 高压变压器工况模式识别与数据分类方法及系统
CN112329868A (zh) 基于clara聚类的制造加工设备群能效状态评价方法
CN109947815B (zh) 一种基于离群点算法的窃电辨识方法
CN115021679B (zh) 一种基于多维离群点检测的光伏设备故障检测方法
CN112766301B (zh) 一种采油机示功图相似性判断方法
CN113866455A (zh) 基于深度学习的桥梁加速度监测数据异常检测方法、系统和装置
CN110930057A (zh) 基于lof算法的配电变压器检验结果可信度的量化评判方法
CN112949735A (zh) 一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法
CN113484817A (zh) 基于tsvm模型的智能电能表自动化检定系统异常检测方法
CN114118219A (zh) 基于数据驱动的长期加电设备健康状态实时异常检测方法
CN113204894B (zh) 一种电能计量异常诊断模型的构建方法及应用
CN117113232A (zh) 一种电动汽车锂离子电池组热失控风险识别方法
CN111027841A (zh) 一种基于梯度提升决策树的低压台区线损计算方法
CN114200245A (zh) 一种配电网的线损异常识别模型的构建方法
CN113283546A (zh) 加热炉完整性管理集控装置的炉况异常报警方法及系统
CN109784777B (zh) 基于时序信息片段云相似度度量的电网设备状态评估方法
CN116881640A (zh) 岩心采出程度的预测方法、系统及计算机可读存储介质
CN117056815A (zh) 基于对比预测编码与支持向量数据的窃电用户检测方法
CN116304789A (zh) Vp倾斜仪故障诊断方法及装置
CN115982656A (zh) 一种基于集成学习技术的腐蚀类型分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant