CN112413814B - 基于综合距离的在线可更新暖通空调传感器故障检测方法 - Google Patents

基于综合距离的在线可更新暖通空调传感器故障检测方法 Download PDF

Info

Publication number
CN112413814B
CN112413814B CN202011215524.4A CN202011215524A CN112413814B CN 112413814 B CN112413814 B CN 112413814B CN 202011215524 A CN202011215524 A CN 202011215524A CN 112413814 B CN112413814 B CN 112413814B
Authority
CN
China
Prior art keywords
distance
sample
model
fault
comprehensive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011215524.4A
Other languages
English (en)
Other versions
CN112413814A (zh
Inventor
李冠男
郑悦
梁致远
毛前军
胡云鹏
李涛
方曦
赵小维
姚庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Science and Engineering WUSE
Original Assignee
Wuhan University of Science and Engineering WUSE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Science and Engineering WUSE filed Critical Wuhan University of Science and Engineering WUSE
Priority to CN202011215524.4A priority Critical patent/CN112413814B/zh
Publication of CN112413814A publication Critical patent/CN112413814A/zh
Application granted granted Critical
Publication of CN112413814B publication Critical patent/CN112413814B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/30Control or safety arrangements for purposes related to the operation of the system, e.g. for safety or monitoring
    • F24F11/32Responding to malfunctions or emergencies
    • F24F11/38Failure diagnosis
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/62Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
    • F24F11/63Electronic processing
    • F24F11/64Electronic processing using pre-stored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Mechanical Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及暖通空调系统监控及故障诊断技术领域,公开了基于综合距离的在线可更新暖通空调传感器故障检测方法。检测通过构建两层距离模型:第一层采用四种原始的单一距离模型作为一级距离模型获取距离减边界距离的新差值距离;第二层进一步通过新差值距离再次构建单一距离模型作为二级距离模型,从而实现对传感器故障的检测。将新差值距离取代原始样本作为输入,提高了一级距离模型在不同工况样本下的故障检测正确率并降低了错识率,有效的克服了传统的单一距离模型对小幅值故障不敏感的局限性;其中一级距离模型根据实时更新的样本集进行筛选更新,形成动态的综合距离模型,也解决了单一距离模型在线更新上的问题。

Description

基于综合距离的在线可更新暖通空调传感器故障检测方法
技术领域
本发明涉及暖通空调系统监控及故障诊断技术领域,具体涉及基于综合距离的在线可更新暖通空调传感器故障检测方法。
背景技术
随着现代科技社会的飞速发展,建筑行业不可忽视的成为了全国能源消耗的巨头之一,其中,暖通空调能耗所占建筑业内的住宅建筑和商业建筑近一半的能耗量。而在暖通空调系统中,传感器一旦发生故障将导致暖通空调系统难以保持运行在高效、节能的控制策略中,因此,能否尽早且准确的将发生故障的传感器检测并划分出来对暖通空调系统节能减耗具备重要意义。
传统的故障检测模型通常通过样本建立单一的故障检测模型,这种单一检测模型仅对于单一的故障标签和均匀分布的原始样本有着较好的检测性能,对于多故障类别、原始样本分布不均的问题就显得束手无策。主成分分析算法主要通过保留主要信息舍弃部分信息来建立故障检测模型,然而舍弃的这部分信息可能存在着样本的重要信息,容易导致过拟合现象的加剧;单类支持向量机算法是典型的处理二检测问题的检测模型,一旦样本数据缺失或者非线性,检测模型的性能就会显著下降;K均值聚类算法对于数据的要求高,不适用于有噪音和异常点的数据集;自动编码器存在着计算能力弱,容易过拟合缺点,更适用于小样本数据。上述模型也都是离线模型,不存在数据和模型的更新。然而在暖通空调系统中,其存储的建筑空调数据存在着多度量,多维度,地域性、大量且实时更新等特点,单一的检测模型难以在特征空间中充分利用样本数据信息建模,在全局中容易存在错误检测、检测性能不高等问题;而且上述的四个算法对同一个样本集建模的侧重不同,难以同时充分利用空调领域原始样本中的数据信息,也无法针对不同的样本集同时取得最佳的故障检测性能。
发明内容
基于以上问题,本发明提供基于综合距离的在线可更新暖通空调传感器故障检测方法。通过构建两层距离模型,在第一层通过四种单一算法建立相应的单一距离模型作为一级距离模型获取距离减边界距离的新差值距离集;在第二层进一步通过新差值距离构建上述四种单一距离模型中检测性能最高的距离模型作为最终的二级距离模型,从而实现对传感器故障的检测。新差值距离由于其去除了边界信息,相比于原始样本变得更加精悍,通过将新差值距离取代原始样本作为输入,来提高故障检测模型对故障检测的正确率并降低错识率,有效的克服了传统的单一距离模型对小幅值故障不敏感的局限性。其中一级距离模型根据实时更新的样本集进行筛选更新,形成动态的综合距离模型,提高了暖通空调系统中传感器的故障检测性能,也解决了传统单一距离模型中在在线更新上的问题。
为实现上述技术效果,本发明采用的技术方案是:
基于综合距离的在线可更新暖通空调传感器故障检测方法,包括如下步骤:
S1、建立综合距离模型,具体流程如下:
1)将暖通空调系统内的正常运行数据作为原始样本集;
2)将原始样本集分为建模集和寻优集两部分,在寻优集中引入故障;对寻优集进行和建模集相同的标准化处理;
3)选取主成分分析算法、单类支持向量机算法、K均值聚类算法和自动编码器算法,输入标准化的建模集训练为四个一级距离模型,通过寻优集对一级距离模型的参数进行寻优,建立最优的四个一级距离模型,剔除检测性能弱的一级距离模型;定义每个一级距离模型的输出距离与其对应的模型边界距离的差值为新差值距离,组合筛选后的最优一级距离模型的输出结果,形成新差值距离集;
4)通过标准化后的新差值距离集分为新建模集和新寻优集,建立基于以上四种算法的二级距离模型,选取性能最好的二级距离模型作为最终的二级距离故障检测模型;其中,二级距离模型的输出结果为单个距离,将其和输出单个距离对应的边界距离作比较,小于则为正常样本,储存至正常样本集A1中;大于则为故障样本,储存至故障样本集A2中;
S2、样本数据更新后启动增量学习训练更新综合距离模型,具体流程为:数据更新后启动增量学习训练新增样本集Ф2,将新增样本集输入到S1中得到的综合距离模型内,输出结果同样被划分为新增正常样本集B1和新增故障样本集B2;将B2和4)中的A1、A2混合形成更新后的样本集,训练出更新后的关于综合距离的故障检测模型。
进一步地,主成分分析算法具体故障检测流程为:将原始样本数据x投影到主元空间,分解为主元向量
Figure BDA0002760248110000031
和非主元向量
Figure BDA0002760248110000032
通常认为主元向量包含原始样本数据中的重要信息,而非主元向量则反映数据的各种误差关系,即可定义主成分分析算法的单一距离QP为非主元向量的欧式距离的平方:
Figure BDA0002760248110000033
那么,QP对应的边界距离表示为:
Figure BDA0002760248110000034
式(2)中,
Figure BDA0002760248110000035
l为模型的主成分个数,cα为置信度为α的标准正太分布置信限,λ为标准化后的原始样本矩阵的协方差阵R的特征值;即对应的新差值距离Dp为:
Dp=Qp-Tp (3)
当Dp>0时,样本超出边界距离范围,检测为故障样本,反之则检测为正常样本;
所述单类支持向量机算法故障检测流程为:通过训练正常样本,在其特征空间中构造一个最大化距离平面以实现训练样本与原点距离的最大化,即根据样本y,若样本y到原点的距离小于该距离平面则检测为故障样本,定义单类支持向量机算法的单一距离Qo为最大化距离平面F(y)的负值,其表达式为:
Figure BDA0002760248110000036
式(4)中,ω和ρ为决策最大化距离平面的参数,ψ为原始样本在特征空间中的映射,此时Qo对应的边界距离To=0,即对应的新差值距离Do为:
Do=Qo-To=Qo(5)
即当Do>0时,样本检测为故障样本,反之则检测为正常样本;
所述K均值聚类算法故障检测流程为:通过以距离相似度进行检测,将原始样本数据分为K类,定义聚类中心为质心O;计算聚类中非质心样本到每个质心的欧氏距离,通过最小化该欧式距离来寻找最终质心的个数,即聚类个数;根据样本z,定义K均值聚类算法的单一距离Qk为最小化后的欧氏距离H(z,o),其表达式为:
Figure BDA0002760248110000041
将计算得到的Qk从小到大排列,选择第95百分位数的欧氏距离作为Qk对应的边界距离Tk,即对应的新差值距离Dk为:
Dk=Qk-Tk (7)
若得出Dk>0,则认为样本不属于任何一个聚类,距离模型检测为故障样本;反之检测为正常样本;
所述自动编码器算法的故障检测流程为:将原始样本输入到隐含层,进行编码重构解码生成重构样本,通过最小化原始样本和重构样本之间的均方差来检测故障样本;根据m维样本p,定义自动编码器算法的单一距离Qa为最小化后的均方差MSE(p,p′),其表达式为:
Figure BDA0002760248110000042
将计算得到的Qa从小到大排列,选择第95百分位数的Qa作为其对应的边界距离Ta,即对应的新差值距离Da为:
Da=Qa-Ta (9)
若得出的Da>0,则认为重构样本与原始样本不一致,检测为故障样本;反之则检测为正常样本;
所述增量学习的综合距离模型更新的故障检测流程为:原始数据集Ф1为建模集F和寻优集G的集合:Ф1={F,G};基于Ф1建立的初始综合距离的故障检测模型可以看作是,通过Ф1建立一个距离模型,距离模型对应有一组参数θ,即可得到距离模型和θ的联合概率分布P,当P最大时,意味着此时的θ与基于Ф1建立的距离模型最为适配,即:
Figure BDA0002760248110000043
样本更新后得到新增样本集Ф2,通过初始综合距离的故障检测模型检测为正常样本集B1和故障样本集B2,将B2和Ф1混合,形成更新后的样本集Ф1′,则基于Ф1′建立的更新后的综合距离故障检测模型希望该距离模型预期与建立距离模型对应产生的一组参数θ'的联合概率分布P′达到最大:
Figure BDA0002760248110000044
式(10)和式(11)中,N1,N2分别为更新前后的样本数量;P′达到最大时,意味着综合距离模型与其对应的一系列参数是最优适配,此时的综合距离模型达到最优,检测结果输出为正常样本集A1′和故障样本集A2′。
与现有技术相比,本发明的有益效果是:本发明通过构建两层距离模型,通过构建两层距离模型,在第一层通过四种单一算法建立相应的单一距离模型作为一级距离模型获取距离减边界距离的新差值距离集;在第二层进一步通过新差值距离构建上述四种单一距离模型中检测性能最高的距离模型作为最终的二级距离模型,从而实现对传感器故障的检测。新差值距离由于其去除了边界信息,相比于原始样本变得更加精悍,通过将新差值距离取代原始样本作为输入,来提高故障检测模型对故障检测的正确率并降低错识率,有效的克服了传统的单一距离模型对小幅值故障不敏感的局限性。其中一级距离模型根据实时更新的样本集进行筛选更新,形成动态的综合距离模型,提高暖通空调系统中传感器的故障检测性能,也解决了单一距离模型在在线更新上的问题。
附图说明
图1为实施例1和2中基于综合距离的在线可更新暖通空调传感器故障检测方法的流程图;
图2为实施例1和2中基于增量学习的模型更新原理图;
图3为实施例2中在不同故障幅值下的一级距离模型得检测性能比较图;
图4为实施例2中基于主成分分析算法的一级距离模型的距离Qp的分布图;
图5为实施例2中基于单类支持向量机算法的一级距离模型的距离Qo的分布图;
图6为实施例2中基于K均值聚类算法的一级距离模型的距离Qk的分布图;
图7为实施例2中基于自动编码器算法的一级距离模型的距离Qa的分布图;
图8为实施例2中在不同故障幅值下的二级距离模型的检测性能比较图;
图9为实施例2中二级距离模型的距离Qk′的分布图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1:
参见图1和图2,基于综合距离的在线可更新暖通空调传感器故障检测方法,包括如下步骤:
S1、建立综合距离模型,具体流程如下:
1)将暖通空调系统内的正常运行数据作为原始样本集;
2)将原始样本集分为建模集和寻优集两部分,在寻优集中引入故障;对寻优集进行和建模集相同的标准化处理;
3)选取主成分分析算法、单类支持向量机算法、K均值聚类算法和自动编码器算法,输入标准化的建模集训练为四个一级距离模型,通过寻优集对一级距离模型的参数进行寻优,建立最优的四个一级距离模型,剔除检测性能弱的一级距离模型;定义每个一级距离模型的输出距离与其对应的模型边界距离的差值为新差值距离,组合筛选后的最优一级距离模型的输出结果,形成新差值距离集;
4)通过标准化后的新差值距离集分为新建模集和新寻优集,建立基于以上四种算法的二级距离模型,选取性能最好的二级距离模型作为最终的二级距离故障检测模型;其中,二级距离模型的输出结果为单个距离,将其和输出单个距离对应的边界距离作比较,小于则为正常样本,储存至正常样本集A1中;大于则为故障样本,储存至故障样本集A2中;
综合距离模型作为二检测模型,将样本在数据空间中映射为距离,和边界距离进行比较,从而对正常样本和故障样本进行划分;此时输出结果为整个综合距离模型的故障检测结果,是将样本通过模型检测后的正常样本集和故障样本集。
S2、样本数据更新后启动增量学习训练更新综合距离模型,具体流程为:数据更新后启动增量学习训练新增样本集Ф2,将新增样本集输入到S1中得到的综合距离模型内,输出结果同样被划分为新增正常样本集B1和新增故障样本集B2;将B2和4)中的A1、A2混合形成更新后的样本集,训练出更新后的关于综合距离的故障检测模型。
在本实施例中,选取主成分分析,单类支持向量机算法,K均值聚类,自动编码器四个算法,本发明通过构建两层距离模型,通过构建两层距离模型,在第一层通过四种单一算法建立相应的单一距离模型作为一级距离模型获取距离减边界距离的新差值距离集;在第二层进一步通过新差值距离构建上述四种单一距离模型中检测性能最高的距离模型作为最终的二级距离模型,从而实现对传感器故障的检测。新差值距离由于其去除了边界信息,相比于原始样本变得更加精悍,通过将新差值距离取代原始样本作为输入,来提高故障检测模型对故障检测的正确率并降低错识率,有效的克服了传统的单一距离模型对小幅值故障不敏感的局限性。其中一级距离模型根据实时更新的样本集进行筛选更新,形成动态的综合距离模型,提高暖通空调系统中传感器的故障检测性能,也解决了传统单一距离模型中在在线更新上的问题。
本实施例中,所述主成分分析算法具体故障检测流程为:将原始样本数据x投影到主元空间,分解为主元向量
Figure BDA0002760248110000071
和非主元向量
Figure BDA0002760248110000072
通常认为主元向量包含原始样本数据中的重要信息,而非主元向量则反映数据的各种误差关系,即可定义主成分分析算法的单一距离QP为非主元向量的欧式距离的平方:
Figure BDA0002760248110000073
那么,QP对应的边界距离表示为:
Figure BDA0002760248110000074
式(2)中,
Figure BDA0002760248110000075
l为模型的主成分个数,cα为置信度为α的标准正太分布置信限,λ为标准化后的原始样本矩阵的协方差阵R的特征值;即对应的新差值距离Dp为:
Dp=Qp-Tp (3)
当Dp>0时,样本超出边界距离范围,检测为故障样本,反之则检测为正常样本;
所述单类支持向量机算法故障检测流程为:通过训练正常样本,在其特征空间中构造一个最大化距离平面以实现训练样本与原点距离的最大化,即根据样本y,若样本y到原点的距离小于原点到该距离平面则检测为故障样本,定义单类支持向量机算法的单一距离Qo为最大化距离平面F(y)的负值,其表达式为:
Figure BDA0002760248110000076
式(4)中,ω和ρ为决策最大化距离平面的参数,ψ为原始样本在特征空间中的映射,此时Qo对应的边界距离To=0,即对应的新差值距离Do为:
Do=Qo-To=Qo (5)
即当Do>0时,样本检测为故障样本,反之则检测为正常样本;
所述K均值聚类算法故障检测流程为:通过以距离相似度进行检测,将原始样本数据分为K类,定义聚类中心为质心O;计算聚类中非质心样本到每个质心的欧氏距离,通过最小化该欧式距离来寻找最终质心的个数,即聚类个数;根据样本z,定义K均值聚类算法的单一距离Qk为最小化后的欧氏距离H(z,o),其表达式为:
Figure BDA0002760248110000081
将计算得到的Qk从小到大排列,选择第95百分位数的欧氏距离作为Qk对应的边界距离Tk,即对应的新差值距离Dk为:
Dk=Qk-Tk (7)
若得出Dk>0,则认为样本不属于任何一个聚类,距离模型检测为故障样本;反之检测为正常样本;
所述自动编码器算法的故障检测流程为:将原始样本输入到隐含层,进行编码重构解码生成重构样本,通过最小化原始样本和重构样本之间的均方差来检测故障样本;根据m维样本p,定义自动编码器算法的单一距离Qa为最小化后的均方差MSE(p,p′),其表达式为:
Figure BDA0002760248110000082
将计算得到的Qa从小到大排列,选择第95百分位数的Qa作为其对应的边界距离Ta,即对应的新差值距离Da为:
Da=0a-Ta (9)
若得出的Da>0,则认为重构样本与原始样本不一致,检测为故障样本;反之则检测为正常样本;
所述增量学习的综合距离模型更新的故障检测流程为:原始数据集Ф1为建模集F和寻优集G的集合:Ф1={F,G};基于Ф1建立的初始综合距离的故障检测模型可以看作是,通过Ф1建立一个距离模型,距离模型对应有一组参数θ,即可得到距离模型和θ的联合概率分布P,当P最大时,意味着此时的θ与基于Ф1建立的距离模型最为适配,即:
Figure BDA0002760248110000091
样本更新后得到新增样本集Ф2,通过初始综合距离的故障检测模型检测为正常样本集B1和故障样本集B2,将B2和Ф1混合,形成更新后的样本集Ф1′,则基于Ф1′建立的更新后的综合距离故障检测模型希望该距离模型预期与建立距离模型对应产生的一组参数θ'的联合概率分布P′达到最大:
Figure BDA0002760248110000092
式(10)和式(11)中,N1,N2分别为更新前后的样本数量;P′达到最大时,意味着综合距离模型与其对应的一系列参数是最优适配,此时的综合距离模型达到最优,检测结果输出为正常样本集A1′和故障样本集A2′。
实施例2:
参见图1-9,本实施例以冷冻水侧供水温度的传感器故障为例,实验数据采集于武汉市某高校的复合式地源热泵系统的正常运行状态数据,该地源热泵系统的主机为一台额定制冷量为30.4KW的热泵机组。实验数据的采集时间为该机组7、8两月份,时段为上午8点到下午20点,每隔半个小时记录一次数据,记录的特征参数如表1所示。
表1热泵机组特征参数的符号及意义
Figure BDA0002760248110000093
1)确定原始样本集
筛选明显的异常数据后的数据共772组,作为原始样本集,按照时间顺序令前412组为建模集,后360组为寻优集,寻优集引入一定的正负小幅值的传感器故障。
2)评价指标
引入T1来表征故障样本在寻优集中的检测准确率。式(10)中,N1表示寻优集中故障样本的总个数,TN表示检测故障样本的准确个数:
Figure BDA0002760248110000101
引入T2来表征寻优集中正常样本的错识率。式(11)中,N2表示寻优集中正常样本的总个数,TF表示正常样本中检测错误的个数:
Figure BDA0002760248110000102
引入ROC曲线来评价T1和T2的相关性。通过将T2作为横坐标,T1作为纵坐标,建立ROC曲线,用来表征距离模型的性能。
引入ROC曲线下包围的面积值记作AUC值,该值可以直接的评价距离模型的性能。AUC∈[0.1,1],显然,AUC值越大,其模型检测性能越高;当AUC值为0.5及以下时,检测模型的检测效果与随机检测类似,不具备故障检测能力。
3)参数选择
3.1一级距离模型的参数选择
表2一级距离模型的相关参数及对应边界距离
Figure BDA0002760248110000103
3.2二级距离模型的参数选择
选取在四种算法中性能最好的算法建立最终的二级距离模型(将一级距离模型中的输出结果分别通过四种算法建立二级距离模型,比较得到检测性能最好的作为本实施例最终的二级距离模型),其特征参数选择如下:
表3二级距离模型的相关参数及对应边界距离
Figure BDA0002760248110000104
Figure BDA0002760248110000111
本实例在比较之下选取K均值聚类算法建立最终的二级距离模型(选择过程将在4.2中展示),此时,根据新差值样本集q=(q1,q2,…,qs),随机分为K′个聚类,通过最小化每类非质心样本与质心的欧式距离H′(z,o)来计算得到二级距离,其表达式为:
Figure BDA0002760248110000112
将计算得到的Q′k从小到大排列,选择第95百分位数的欧氏距离作为Q′k对应的边界距离T′k,若得出Q′k>T′k,则检测为故障样本;反之检测为正常样本;二级距离模型的输出结果即为综合距离模型的最终输出结果,用于后续增量学习的模型更新。表4为二级距离模型在不同参数K′值下的错识率,可以看到当K′在2及2以上时,错识率已超过10%,故本实施例确定K′=1,来建立最终的二级距离模型。
表4二级距离模型中不同K值下的错识率
Figure BDA0002760248110000113
4)检测结果
4.1一级距离算法的筛选
从图3种可以看到,在负向上的故障幅值中,基于单类支持向量机的一级距离模型取得了最优的检测性能,整体AUC值在其他三个一级距离模型之上,基于K均值聚类的一级距离模型取得第二优的检测性能;而在正向上,基于K均值聚类的一级距离模型取得最优。整体上基于K均值聚类的一级距离模型检测性能较好,而基于自动编码器的一级距离模型的AUC曲线位置靠下,取得相对较差的检测性能。在图4到图7中,边界距离之上的样本为检测错误的样本,为了样本分布表达清晰,Qo和Qa的纵坐标轴与其余距离空间的范围相比更小。可以看到,Qp和Qo的距离空间中的样本分布均匀,容易被边界距离检测出来,而Qo和Qa在距离空间中,样本分布较紧凑,边界距离胶着在样本分布中,不容易被边界距离检测;Qa的距离空间上识别错误的样本相比Qo太多,故最终剔除自动编码器距离模型,选取的一级距离模型算法为主成分分析,单类支持向量机算法和K均值聚类。
4.2二级距离算法的比较选择
计算结果绘制AUC值变化曲线图。如图8所示,2-主成分分析,2-单类支持向量机算法,2-K均值聚类,2-自动编码器分别表示这四种算法作为二级距离模型下建立的相应模型。
可以看出在四种二级距离模型中,K均值聚类距离模型比其他距离模型都要表现的好;AUC值均值在0.88及以上。对比可以得出,主成分分析距离模型的性能最低,K均值聚类距离模型性能最优。故选取K均值聚类作为最终的二级距离模型。图9展示了二级距离模型Qk′的距离分布图。
4.3不同模型的检测性能比较
本实施例将用所建立的综合距离模型和多数投票组合距离模型,基于原始样本集建立的主成分分析,单类支持向量机算法,K均值聚类,自动编码器这四种单个距离模型共六种方法作比较。表中故障幅值随机选取。
表5不同模型下的在不同故障幅值下的AUC值
Figure BDA0002760248110000121
表5可以看出,综合距离模型取得了最优的故障检测性能,AUC值均在0.96之上;比基于是原始样本集建立的单一距离模型的最大值提升了4%左右,比多数投票综合策略下也有一定的提高,且在不同故障幅值下的AUC值保持一个稳定的高水平。图9也可以直观的看到Qk′相比于Qk在距离空间中样本更加分散,边界距离检测错误的样本更少,可以实现更好的检测结果。
表6是所有故障检测方法在未引入故障幅值的寻优集上的错识率,可以看出,综合距离模型的错识率显著降到了0.83%,而其它距离模型则在4%和6%之间。
表6不同故障检测方法在未引入故障的寻优集上的错识率
Figure BDA0002760248110000131
5)一级距离模型的多样性分析
提出熵测度E来表征参与综合策略的一级距离模型对样本检测的多样性。对于样本集L*,其公式如下:
Figure BDA0002760248110000132
式(15)中,N为单个距离模型个数,Nα为样本集L*中所有的样本个数,l(Lj)表示样本在N个距离模型中被正确检测的次数。
本实施例以在引入故障幅值的寻优集作为样本集。将不同故障幅值下的一级距离模型输出的最大差值距离定义为差值,将其和对应的熵测度E比较用来表征综合距离模型相比于单个距离模型的提升范围及一级距离模型的输出多样性。表7为随机选取的故障幅值下对应得熵测度和差值列表。
表7不同幅值下的熵测度及差值
Figure BDA0002760248110000133
表7可以看出熵测度E值和差值在整体上有着一定的相关性,差值较高的故障幅值处其熵测度也较高,这说明在综合距离模型的性能提高的越多的幅值上,其一级距离模型输出的多样性就越丰富。
如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (2)

1.基于综合距离的在线可更新暖通空调传感器故障检测方法,其特征在于,包括如下步骤:
S1、建立综合距离模型,具体流程如下:
1)将暖通空调系统内的正常运行数据作为原始样本集;
2)将原始样本集分为建模集和寻优集两部分,在寻优集中引入故障;对寻优集进行和建模集相同的标准化处理;
3)选取主成分分析算法、单类支持向量机算法、K均值聚类算法和自动编码器算法,输入标准化的建模集训练为四个一级距离模型,通过寻优集对一级距离模型的参数进行寻优,建立最优的四个一级距离模型,剔除检测性能弱的一级距离模型;定义每个一级距离模型的输出距离与其对应的模型边界距离的差值为新差值距离,组合筛选后的最优一级距离模型的输出结果,形成新差值距离集;
所述主成分分析算法具体故障检测流程为:将原始样本数据x投影到主元空间,分解为主元向量
Figure FDA0003288650140000011
和非主元向量
Figure FDA0003288650140000012
通常认为主元向量包含原始样本数据中的重要信息,而非主元向量则反映数据的各种误差关系,即可定义主成分分析算法的单一距离QP为非主元向量的欧式距离的平方:
Figure FDA0003288650140000013
那么,QP对应的边界距离表示为:
Figure FDA0003288650140000014
式(2)中,
Figure FDA0003288650140000015
l为模型的主成分个数,cα为置信度为α的标准正态分布置信限,λ为标准化后的原始样本矩阵的协方差阵R的特征值;即对应的新差值距离Dp为:
Dp=Qp-Tp (3)
当Dp>0时,样本超出边界距离范围,检测为故障样本,反之则检测为正常样本;
4)通过标准化后的新差值距离集分为新建模集和新寻优集,建立基于以上四种算法的二级距离模型,选取性能最好的二级距离模型作为最终的二级距离故障检测模型;其中,二级距离模型的输出结果为单个距离,将其和输出单个距离对应的边界距离作比较,小于则为正常样本,储存至正常样本集A1中;大于则为故障样本,储存至故障样本集A2中;
S2、样本数据更新后启动增量学习训练更新综合距离模型,具体流程为:数据更新后启动增量学习训练新增样本集Ф2,将新增样本集输入到S1中得到的综合距离模型内,输出结果同样被划分为新增正常样本集B1和新增故障样本集B2;将B2和4)中的A1、A2混合形成更新后的样本集,训练出更新后的关于综合距离的故障检测模型。
2.根据权利要求1所述的基于综合距离的在线可更新暖通空调传感器故障检测方法,其特征在于,所述单类支持向量机算法故障检测流程为:通过训练正常样本,在其特征空间中构造一个最大化距离平面以实现训练样本与原点距离的最大化,即根据样本y,若样本y到原点的距离小于原点到该距离平面的距离则检测为故障样本,定义单类支持向量机算法的单一距离Qo为最大化距离平面F(y)的负值,其表达式为:
Figure FDA0003288650140000021
式(4)中,ω和ρ为决策最大化距离平面的参数,
Figure FDA0003288650140000022
为原始样本在特征空间中的映射,此时Qo对应的边界距离To=0,即对应的新差值距离Do为:
Do=Qo-To=Qo (5)
即当Do>0时,样本检测为故障样本,反之则检测为正常样本;
所述K均值聚类算法故障检测流程为:通过以距离相似度进行检测,将原始样本数据分为K类,定义聚类中心为质心O;计算聚类中非质心样本到每个质心的欧氏距离,通过最小化该欧式距离来寻找最终质心的个数,即聚类个数;根据样本z,定义K均值聚类算法的单一距离Qk为最小化后的欧氏距离H(z,o),其表达式为:
Figure FDA0003288650140000023
将计算得到的Qk从小到大排列,选择第95百分位数的欧氏距离作为Qk对应的边界距离Tk,即对应的新差值距离Dk为:
Dk=Qk-Tk (7)
若得出Dk>0,则认为样本不属于任何一个聚类,距离模型检测为故障样本;反之检测为正常样本;
所述自动编码器算法的故障检测流程为:将原始样本输入到隐含层,进行编码重构解码生成重构样本,通过最小化原始样本和重构样本之间的均方差来检测故障样本;根据m维样本p,定义自动编码器算法的单一距离Qa为最小化后的均方差MSE(p,p′),其表达式为:
Figure FDA0003288650140000031
将计算得到的Qa从小到大排列,选择第95百分位数的Qa作为其对应的边界距离Ta,即对应的新差值距离Da为:
Da=Qa-Ta (9)
若得出的Da>0,则认为重构样本与原始样本不一致,检测为故障样本;反之则检测为正常样本;
所述增量学习的综合距离模型更新的故障检测流程为:原始数据集Ф1为建模集F和寻优集G的集合:Ф1={F,G};基于Ф1建立的初始综合距离的故障检测模型可以看作是,通过Ф1建立一个距离模型,距离模型对应有一组参数θ,即可得到距离模型和θ的联合概率分布P,当P最大时,意味着此时的θ与基于Ф1建立的距离模型最为适配,即:
Figure FDA0003288650140000032
样本更新后得到新增样本集Ф2,通过初始综合距离的故障检测模型检测为正常样本集B1和故障样本集B2,将B2和Ф1混合,形成更新后的样本集Ф1′,则基于Ф1′建立的更新后的综合距离故障检测模型希望该距离模型预期与建立距离模型对应产生的一组参数θ′的联合概率分布P′达到最大:
Figure FDA0003288650140000033
式(10)和式(11)中,N1,N2分别为更新前后的样本数量;P′达到最大时,意味着综合距离模型与其对应的一系列参数是最优适配,此时的综合距离模型达到最优,检测结果输出为正常样本集A1′和故障样本集A2′。
CN202011215524.4A 2020-11-04 2020-11-04 基于综合距离的在线可更新暖通空调传感器故障检测方法 Active CN112413814B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011215524.4A CN112413814B (zh) 2020-11-04 2020-11-04 基于综合距离的在线可更新暖通空调传感器故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011215524.4A CN112413814B (zh) 2020-11-04 2020-11-04 基于综合距离的在线可更新暖通空调传感器故障检测方法

Publications (2)

Publication Number Publication Date
CN112413814A CN112413814A (zh) 2021-02-26
CN112413814B true CN112413814B (zh) 2021-11-19

Family

ID=74828461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011215524.4A Active CN112413814B (zh) 2020-11-04 2020-11-04 基于综合距离的在线可更新暖通空调传感器故障检测方法

Country Status (1)

Country Link
CN (1) CN112413814B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114484732B (zh) * 2022-01-14 2023-06-02 南京信息工程大学 一种基于投票网络的空调机组传感器故障诊断方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101738998A (zh) * 2009-12-10 2010-06-16 浙江大学 一种基于局部判别分析的工业过程监测系统及方法
CN105740619A (zh) * 2016-01-28 2016-07-06 华南理工大学 基于核函数的加权极限学习机污水处理在线故障诊断方法
JP2018054567A (ja) * 2016-09-30 2018-04-05 日本車輌製造株式会社 鉄道車両の異常検知方法
CN108051660A (zh) * 2017-10-31 2018-05-18 华北电力大学(保定) 一种变压器故障组合诊断模型建立方法及诊断方法
CN108241348A (zh) * 2018-01-09 2018-07-03 北京科技大学 一种数据驱动的工业过程实时监测与故障检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101738998A (zh) * 2009-12-10 2010-06-16 浙江大学 一种基于局部判别分析的工业过程监测系统及方法
CN105740619A (zh) * 2016-01-28 2016-07-06 华南理工大学 基于核函数的加权极限学习机污水处理在线故障诊断方法
JP2018054567A (ja) * 2016-09-30 2018-04-05 日本車輌製造株式会社 鉄道車両の異常検知方法
CN108051660A (zh) * 2017-10-31 2018-05-18 华北电力大学(保定) 一种变压器故障组合诊断模型建立方法及诊断方法
CN108241348A (zh) * 2018-01-09 2018-07-03 北京科技大学 一种数据驱动的工业过程实时监测与故障检测方法

Also Published As

Publication number Publication date
CN112413814A (zh) 2021-02-26

Similar Documents

Publication Publication Date Title
CN106845717B (zh) 一种基于多模型融合策略的能源效率评价方法
CN110579709B (zh) 一种有轨电车用质子交换膜燃料电池故障诊断方法
CN113962259B (zh) 一种燃料电池系统多模式双层故障诊断方法
CN111140986A (zh) 空调系统的运行状态检测方法、装置、存储介质及空调
CN111079978B (zh) 基于逻辑回归和增强学习的煤与瓦斯突出预测的方法
CN116992322B (zh) 一种智慧城市数据中心管理系统
CN103426004B (zh) 基于纠错输出编码的车型识别方法
CN110633729A (zh) 一种面向智能网联车辆群组测试的驾驶风险分级聚类方法
Zhang et al. Imbalanced data based fault diagnosis of the chiller via integrating a new resampling technique with an improved ensemble extreme learning machine
CN112413814B (zh) 基于综合距离的在线可更新暖通空调传感器故障检测方法
CN114817856B (zh) 一种基于结构信息保持域适应网络的抽油机故障诊断方法
CN113283491A (zh) 一种基于优化深度置信网络的电动汽车交流充电桩的故障诊断方法
CN112101659A (zh) 一种基于堆叠去噪自编码器的复杂装备寿命预测方法
CN115423079A (zh) 中心约束对比学习特征变换的自集成卫星异常检测方法
CN115146718A (zh) 基于深度表示的风电机组异常检测方法
CN114897103A (zh) 一种基于近邻成分损失优化多尺度卷积神经网络的工业过程故障诊断方法
CN111984626A (zh) 一种基于统计模式的能耗数据识别与修复方法
CN110702438B (zh) 一种离心式冷水机组与新风系统联合故障诊断方法
CN110163437B (zh) 基于DPK-means的日前光伏发电功率预测方法
CN107544447A (zh) 一种基于核学习的化工过程故障分类方法
CN116412162A (zh) 基于数字孪生模型的磁悬浮鼓风机故障诊断方法及系统
CN110781538B (zh) 基于实地监测的开窗仿真算法
CN113780405B (zh) 基于深度神经网络的空调机参数回归优化方法
CN106709598B (zh) 一种基于单类样本的电压稳定性预测判断方法
Yang et al. Fault detection for air conditioner using PCANet

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant