CN112733943A - 一种基于数据混剪技术的热泵故障诊断模型迁移方法 - Google Patents

一种基于数据混剪技术的热泵故障诊断模型迁移方法 Download PDF

Info

Publication number
CN112733943A
CN112733943A CN202110042981.6A CN202110042981A CN112733943A CN 112733943 A CN112733943 A CN 112733943A CN 202110042981 A CN202110042981 A CN 202110042981A CN 112733943 A CN112733943 A CN 112733943A
Authority
CN
China
Prior art keywords
data
heat pump
source domain
diagnosis model
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110042981.6A
Other languages
English (en)
Other versions
CN112733943B (zh
Inventor
孙哲
沈希
赵清雯
金华强
顾江萍
黄跃进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202110042981.6A priority Critical patent/CN112733943B/zh
Publication of CN112733943A publication Critical patent/CN112733943A/zh
Application granted granted Critical
Publication of CN112733943B publication Critical patent/CN112733943B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

一种基于数据混剪技术的热泵故障诊断模型迁移方法,属于制冷空调运维与人工智能的交叉领域。重点解决热泵故障标记数据集获取困难的条件下,将诊断模型从源热泵系统迁移到其他类似热泵系统,实现诊断模型自适应的难题。由于目标热泵系统数据获取困难,通常只包含部分健康运行数据,本发明充分利用这些数据,将其混剪到源域数据集上,生成混合数据,进一步利用混合数据微调诊断模型,实现定向模型迁移,极大降低了数据获取成本,提高了智能诊断算法的应用范围,具有重要工程价值。

Description

一种基于数据混剪技术的热泵故障诊断模型迁移方法
技术领域
本发明涉及制冷空调系统的运维领域,是一种结合人工智能、深 度学习、测试技术、制冷技术等的热泵故障诊断模型迁移方法。
背景技术
热泵系统的能量转移效率大于1,因其节能优势明显而被广泛用 于采暖、制冷、生活热水和工业领域。由于使用量大面广,又为能耗 装置,故总耗能巨大,约占社会能耗的25%左右。因此,热泵系统的 故障诊断方法一直是换能领域的研究重点。在工业智能化的大背景下, 人工智能、“互联网+”技术在热泵系统运行全生命周期的应用得到了 快速发展,其中智能故障诊断成为了一大亮点,极大提高了故障诊断 精度且降低了运行维护成本。
现有的基于数据驱动的智能诊断方法多数依赖标记数据进行监 督训练,必须在诊断实施前获取目标热泵系统各类故障标记数据,这 通常是十分困难的。一种可行的方案是利用实验室搭建热泵实验系统, 并模拟各类故障状态,获取足量的标记数据。利用获取的数据集训练 诊断模型,并通过模型迁移的方式将其迁移到待诊断的目标热泵系统 上实现应用。
模型迁移通常需要一些附加条件,结合热泵系统自身特点,我们 可以给出的附加条件是提供目标热泵系统的健康运行数据。这是因为, 全新的热泵系统通常是健康的,而传感技术十分发达的今天想要获取 实时运行数据是非常容易的,这种数据比故障标记数据更容易获取。
现有热泵系统智能故障诊断应用过程面临以下三个问题:(1)对 于每个热泵装置个体,无法提供全类别故障的标记数据,即无法针对 每一个热泵装置训练私有模型;(2)一台热泵系统运行数据训练的故 障诊断模型直接应用到其他热泵系统后诊断精度极低;(3)故障诊断 模型迁移过程中,目标热泵系统仅能提供一定量健康数据,使得迁移 难度极大。
本发明针对这一特定条件,提出一种数据混剪技术,在仅利用目 标域健康数据的条件下将源域故障诊断模型迁移到目标域,实现跨域 知识共享。
发明内容
为了克服现有技术的不足,本发明提出一种基于数据混剪技术的 热泵故障诊断模型迁移方法,将目标域健康数据混剪到源域数据全类 别中,构建新的训练数据集,实现故障诊断模型的迁移;在仅利用目 标域健康数据的条件下将源域故障诊断模型迁移到目标域,实现跨域 知识共享。
为了解决上述技术问题本发明提供如下的技术方案:
一种基于数据混剪技术的热泵故障诊断模型迁移方法,包括以下 步骤:
1).搭建实验热泵系统,要求与待诊断真实热泵系统结构相似, 模拟各类故障状态,采集故障标记数据,即源域数据集;
2).利用源域数据集训练深度模型,获取源域系统上可用的故障 诊断模型;
3).采集待诊断目标热泵系统运行数据,需在目标系统全新时及 时采集,保证热泵为健康状态;
4).将目标数据集进行局部剪切,并覆盖源域数据的对应部位, 形成合成数据,数据的标签为软标签,即源域数据标签和健康类别按 照剪切局部面积占比的分配,两者和为1,剪切局部的位置使用随机 策略;
5).利用合成数据联合源域数据对诊断模型进行再训练,达到模 型迁移的目的;
6).利用迁移完成的故障诊断模型对目标系统进行在线监测,实 现故障诊断的目的。
进一步,所述步骤1)中,选择数据集作为源域数据集,获取8 种类别故障标记数据,故障标签以one-hot编码形式表示,用于诊断 模型监督训练。数据集使用arctan((data/μ)/σ)进行归一化处理。
所述步骤2)中,热泵运行数据是多维时序数据,将其按照设定 的时间段分割后,就变成了一个个矩阵数据;构建基于卷积神经网络 的故障诊断模型,模型包含5层卷积层,后接128神经单元的全连接 层,然后接softmax分类层。利用源域数据集监督训练深度模型,训 练轮数100轮,batch-size64,优化器Adam,最终实现源域诊断模型 训练。
所述步骤3)中,选择数据集作为目标域数据,抽取其中健康类 别数据组成各自的目标域数据集。
所述步骤4)的过程为:
401)进行数据混剪:首先,利用随机数生成方式,决策出局部 剪切块的位置和大小,位置以随机数生成的起点(x,y)坐标为准, 大小不超过矩阵数据的1/4,即长宽上限均为一半;
402)将全类别源域数据进行局部替换,即源域数据对应位置替 换成目标域剪切数据块,生成合成数据;
403)从新构建数据软标签,原始标签以one-hot编码方式呈现, 新标签根据局部剪切块的面积生成。
所述步骤5)中,利用合成数据联合源域数据同时对诊断模型再 训练,合成数据量和源域数据量保证相同,训练轮数为50轮,batch-size为64,优化器Adam,再次训练完毕的模型实现了迁移效 果。
本发明的有益效果主要表现在:
(1)本发明利用一台热泵系统故障数据训练模型,可实现多台 不同热泵系统的故障诊断,不需要每台热泵系统单独提供足量标记数 据,大大降低了数据获取成本。
(2)相比现有的利用小批量样本实现模型迁移的方法,本发明 只需要目标域提供健康类别数据,而不需要目标域提供故障类别数据, 极大增加的技术的可行性。
附图说明
图1是数据混剪技术示意图。
图2是有无混剪技术的模型迁移诊断混淆矩阵,其中,(A)为 无混剪,(B)为有混剪。
图3是有无混剪技术的模型迁移诊断精度对比,其中,(A)为 无混剪,(B)为有混剪。
具体实施方式
结合说明书附图,以自行搭建热泵实验平台采集的数据为算例, 对本发明方法的具体实施做进一步说明。
参照图1~图3,一种基于数据混剪技术的热泵故障诊断模型迁移 方法,热泵实验平台为小型风冷式热泵系统,压缩机、工质等均可变 更。为验证迁移模型的迁移效果,共采集三组数据集,三组数据集详 细情况见表1。利用三组数据集互为源域,验证迁移模型在自身数据 集上的诊断效果。
Figure BDA0002895986330000061
表1
本实施例的一种基于数据混剪技术的热泵系统故障诊断模型迁 移方法,包括以下步骤:
1)源域数据准备:选择数据集1作为源域数据集,获取8种类 别故障标记数据,故障标签以one-hot编码形式表示,用于诊断模型 监督训练。数据集使用arctan((data/μ)/σ)进行归一化处理。
2)热泵运行数据是多维时序数据,将其按照一定的时间段分割 后,就变成了一个个矩阵数据。针对数据的这一特点,构建基于卷积 神经网络的故障诊断模型,模型包含5层卷积层,后接128神经单元 的全连接层,然后接softmax分类层。利用源域数据集监督训练深度 模型,训练轮数100轮,batch-size64,优化器Adam,最终实现源域 诊断模型训练。
3)目标域数据准备:分别选择数据集2和数据集3作为目标域 数据,抽取其中健康类别数据组成各自的目标域数据集。
4)将目标数据集进行局部剪切,并覆盖源域数据的对应部位, 形成合成数据,数据的标签为软标签,即源域数据标签和健康类别按 照剪切局部面积占比的分配,两者和为1,剪切局部的位置使用随机 策略;过程为:
401)按照图1所示方式进行数据混剪。首先,利用随机数生成 方式,决策出局部剪切块的位置和大小,位置以随机数生成的起点 (x,y)坐标为准,大小不超过矩阵数据的1/4,即长宽上限均为一半。
402)将全类别源域数据进行局部替换,即源域数据对应位置替 换成目标域剪切数据块,生成合成数据。
403)从新构建数据软标签,原始标签以one-hot编码方式呈现, 新标签根据局部剪切块的面积生成。如局部剪切块面积为1/4,源域 数据为故障类别1的数据,原始标签为[0,1,0,0,0,0,0,0],新生成的软 标签为[0.25,0.75,0,0,0,0,0,0],又如源域数据为健康数据,则合成数据 标签不变,为[1,0,0,0,0,0,0,0]。
5)利用合成数据联合源域数据同时对诊断模型再训练,合成数 据量和源域数据量保证相同,训练轮数为50轮,batch-size为64,优 化器Adam,再次训练完毕的模型实现了迁移效果。
6)将迁移完成的诊断模型部署到目标系统上,实现故障在线监 控的目的。其中,实验对比了有无数据混剪参与的最终迁移诊断效果。 利用数据集1作为源域,将数据集2作为目标域的实验对比结果。图 2为诊断的混淆矩阵,验证数据为2400组样本,每类故障300组, 未使用混剪数据迁移的结果如图2A,使用混剪数据迁移的结果如图 2B,可以看不出,虽然使用混剪数据迁移后健康数据的诊断效果较 弱,但整体诊断效果有明显提升。进一步对比各类故障的诊断正确率, 可以看出,使用混剪数据迁移后,整体诊断精度提高。证明混剪数据 技术对提高诊断模型迁移精度具有明显效果。
本说明书的实施例所述的内容仅仅是对发明构思的实现形式的 列举,仅作说明用途。本发明的保护范围不应当被视为仅限于本实施 例所陈述的具体形式,本发明的保护范围也及于本领域的普通技术人 员根据本发明构思所能想到的等同技术手段。

Claims (6)

1.一种基于数据混剪技术的热泵故障诊断模型迁移方法,其特征在于,所述方法包括以下步骤:
1).搭建实验热泵系统,要求与待诊断真实热泵系统结构相似,模拟各类故障状态,采集故障标记数据,即源域数据集;
2).利用源域数据集训练深度模型,获取源域系统上可用的故障诊断模型;
3).采集待诊断目标热泵系统运行数据,需在目标系统全新时及时采集,保证热泵为健康状态;
4).将目标数据集进行局部剪切,并覆盖源域数据的对应部位,形成合成数据,数据的标签为软标签,即源域数据标签和健康类别按照剪切局部面积占比的分配,两者和为1,剪切局部的位置使用随机策略;
5).利用合成数据联合源域数据对诊断模型进行再训练,达到模型迁移的目的;
6).利用迁移完成的故障诊断模型对目标系统进行在线监测,实现故障诊断的目的。
2.如权利要求1所述的一种基于数据混剪技术的热泵故障诊断模型迁移方法,其特征在于,所述步骤1)中,选择数据集作为源域数据集,获取8种类别故障标记数据,故障标签以one-hot编码形式表示,用于诊断模型监督训练,数据集使用arctan((data/μ)/σ)进行归一化处理。
3.如权利要求1或2所述的一种基于数据混剪技术的热泵故障诊断模型迁移方法,其特征在于,所述步骤2)中,热泵运行数据是多维时序数据,将其按照设定的时间段分割后,就变成了一个个矩阵数据;构建基于卷积神经网络的故障诊断模型,模型包含5层卷积层,后接128神经单元的全连接层,然后接softmax分类层;利用源域数据集监督训练深度模型,训练轮数100轮,batch-size64,优化器Adam,最终实现源域诊断模型训练。
4.如权利要求1或2所述的一种基于数据混剪技术的热泵故障诊断模型迁移方法,其特征在于,所述步骤3)中,选择数据集作为目标域数据,抽取其中健康类别数据组成各自的目标域数据集。
5.如权利要求1或2所述的一种基于数据混剪技术的热泵故障诊断模型迁移方法,其特征在于,所述步骤4)的过程为:
401)进行数据混剪:首先,利用随机数生成方式,决策出局部剪切块的位置和大小,位置以随机数生成的起点(x,y)坐标为准,大小不超过矩阵数据的1/4,即长宽上限均为一半;
402)将全类别源域数据进行局部替换,即源域数据对应位置替换成目标域剪切数据块,生成合成数据;
403)从新构建数据软标签,原始标签以one-hot编码方式呈现,新标签根据局部剪切块的面积生成。
6.如权利要求1或2所述的一种基于数据混剪技术的热泵故障诊断模型迁移方法,其特征在于,所述步骤5)中,利用合成数据联合源域数据同时对诊断模型再训练,合成数据量和源域数据量保证相同,训练轮数为50轮,batch-size为64,优化器Adam,再次训练完毕的模型实现了迁移效果。
CN202110042981.6A 2021-01-13 2021-01-13 一种基于数据混剪技术的热泵故障诊断模型迁移方法 Active CN112733943B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110042981.6A CN112733943B (zh) 2021-01-13 2021-01-13 一种基于数据混剪技术的热泵故障诊断模型迁移方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110042981.6A CN112733943B (zh) 2021-01-13 2021-01-13 一种基于数据混剪技术的热泵故障诊断模型迁移方法

Publications (2)

Publication Number Publication Date
CN112733943A true CN112733943A (zh) 2021-04-30
CN112733943B CN112733943B (zh) 2024-03-22

Family

ID=75592965

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110042981.6A Active CN112733943B (zh) 2021-01-13 2021-01-13 一种基于数据混剪技术的热泵故障诊断模型迁移方法

Country Status (1)

Country Link
CN (1) CN112733943B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822359A (zh) * 2021-09-23 2021-12-21 浙江工业大学 基于残差数据缩放策略的热泵系统自适应故障诊断方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947086A (zh) * 2019-04-11 2019-06-28 清华大学 基于对抗学习的机械故障迁移诊断方法及系统
CN110245711A (zh) * 2019-06-18 2019-09-17 西安电子科技大学 基于角度旋转生成网络的sar目标识别方法
CN112149350A (zh) * 2020-09-21 2020-12-29 浙江工业大学 解决热泵系统故障诊断中数据依赖问题的模型迁移方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947086A (zh) * 2019-04-11 2019-06-28 清华大学 基于对抗学习的机械故障迁移诊断方法及系统
CN110245711A (zh) * 2019-06-18 2019-09-17 西安电子科技大学 基于角度旋转生成网络的sar目标识别方法
CN112149350A (zh) * 2020-09-21 2020-12-29 浙江工业大学 解决热泵系统故障诊断中数据依赖问题的模型迁移方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822359A (zh) * 2021-09-23 2021-12-21 浙江工业大学 基于残差数据缩放策略的热泵系统自适应故障诊断方法
CN113822359B (zh) * 2021-09-23 2024-02-02 浙江工业大学 基于残差数据缩放策略的热泵系统自适应故障诊断方法

Also Published As

Publication number Publication date
CN112733943B (zh) 2024-03-22

Similar Documents

Publication Publication Date Title
Yu et al. A novel methodology for knowledge discovery through mining associations between building operational data
CN102663232B (zh) 一种面向用户能效评估的多维仿真分析系统及其方法
CN105930861A (zh) 一种基于Adaboost算法的变压器故障诊断方法
CN109376960A (zh) 基于lstm神经网络的电网负荷预测方法
CN106295153A (zh) 一种基于孪生支持向量机的航空发动机气路故障诊断方法
CN109116150A (zh) 一种基于小脑模型神经网络的电力电子变换器故障诊断方法
CN107392304A (zh) 一种风电机组异常数据识别方法及装置
CN113205203A (zh) 基于cnn-lstm的建筑能耗预测方法和系统
CN108961468B (zh) 一种基于集成学习的船舶动力系统故障诊断方法
CN104881735A (zh) 用于支撑智慧城市运行管理的智能电网大数据挖掘系统及方法
CN114004374B (zh) 一种基于玻尔兹曼机投票的空调机组传感器故障诊断方法
CN110500709A (zh) 空调器运行状态在线判别方法
CN112733943B (zh) 一种基于数据混剪技术的热泵故障诊断模型迁移方法
CN113822359B (zh) 基于残差数据缩放策略的热泵系统自适应故障诊断方法
CN108764626A (zh) 一种节能诊断方法和装置
Huang et al. Analyzing residential weatherization decisions using hybrid simulation modeling
CN112232608B (zh) 一种基于数据驱动的区域建筑空调器短期耗电量预测方法
CN104679945A (zh) 基于有色Petri网的系统综合评估方法
Ram et al. Reliability evaluation and cost optimization of solar road studs
CN117332288A (zh) 一种建筑节能技术评估系统及方法
CN104318316A (zh) 一种用户用电实时测量方法
CN112365082A (zh) 一种基于机器学习的公共能源消耗预测方法
CN109032084A (zh) 一种过程能力指数驱动的状态评估与故障诊断系统及方法
CN105976126A (zh) 基于主成分分析法的机床制造能耗分析方法
Li et al. Air-Conditioner Usage Patterns in Teaching Buildings of Universities by Data Mining Approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant