CN112733943A - 一种基于数据混剪技术的热泵故障诊断模型迁移方法 - Google Patents
一种基于数据混剪技术的热泵故障诊断模型迁移方法 Download PDFInfo
- Publication number
- CN112733943A CN112733943A CN202110042981.6A CN202110042981A CN112733943A CN 112733943 A CN112733943 A CN 112733943A CN 202110042981 A CN202110042981 A CN 202110042981A CN 112733943 A CN112733943 A CN 112733943A
- Authority
- CN
- China
- Prior art keywords
- data
- heat pump
- source domain
- diagnosis model
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 54
- 238000013508 migration Methods 0.000 title claims abstract description 39
- 230000005012 migration Effects 0.000 title claims abstract description 39
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000010008 shearing Methods 0.000 title claims abstract description 29
- 238000005516 engineering process Methods 0.000 title claims abstract description 21
- 238000012549 training Methods 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 11
- 230000000694 effects Effects 0.000 claims description 9
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 230000001537 neural effect Effects 0.000 claims description 3
- 238000005057 refrigeration Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000012423 maintenance Methods 0.000 abstract description 3
- 238000002474 experimental method Methods 0.000 description 4
- 238000005265 energy consumption Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
一种基于数据混剪技术的热泵故障诊断模型迁移方法,属于制冷空调运维与人工智能的交叉领域。重点解决热泵故障标记数据集获取困难的条件下,将诊断模型从源热泵系统迁移到其他类似热泵系统,实现诊断模型自适应的难题。由于目标热泵系统数据获取困难,通常只包含部分健康运行数据,本发明充分利用这些数据,将其混剪到源域数据集上,生成混合数据,进一步利用混合数据微调诊断模型,实现定向模型迁移,极大降低了数据获取成本,提高了智能诊断算法的应用范围,具有重要工程价值。
Description
技术领域
本发明涉及制冷空调系统的运维领域,是一种结合人工智能、深 度学习、测试技术、制冷技术等的热泵故障诊断模型迁移方法。
背景技术
热泵系统的能量转移效率大于1,因其节能优势明显而被广泛用 于采暖、制冷、生活热水和工业领域。由于使用量大面广,又为能耗 装置,故总耗能巨大,约占社会能耗的25%左右。因此,热泵系统的 故障诊断方法一直是换能领域的研究重点。在工业智能化的大背景下, 人工智能、“互联网+”技术在热泵系统运行全生命周期的应用得到了 快速发展,其中智能故障诊断成为了一大亮点,极大提高了故障诊断 精度且降低了运行维护成本。
现有的基于数据驱动的智能诊断方法多数依赖标记数据进行监 督训练,必须在诊断实施前获取目标热泵系统各类故障标记数据,这 通常是十分困难的。一种可行的方案是利用实验室搭建热泵实验系统, 并模拟各类故障状态,获取足量的标记数据。利用获取的数据集训练 诊断模型,并通过模型迁移的方式将其迁移到待诊断的目标热泵系统 上实现应用。
模型迁移通常需要一些附加条件,结合热泵系统自身特点,我们 可以给出的附加条件是提供目标热泵系统的健康运行数据。这是因为, 全新的热泵系统通常是健康的,而传感技术十分发达的今天想要获取 实时运行数据是非常容易的,这种数据比故障标记数据更容易获取。
现有热泵系统智能故障诊断应用过程面临以下三个问题:(1)对 于每个热泵装置个体,无法提供全类别故障的标记数据,即无法针对 每一个热泵装置训练私有模型;(2)一台热泵系统运行数据训练的故 障诊断模型直接应用到其他热泵系统后诊断精度极低;(3)故障诊断 模型迁移过程中,目标热泵系统仅能提供一定量健康数据,使得迁移 难度极大。
本发明针对这一特定条件,提出一种数据混剪技术,在仅利用目 标域健康数据的条件下将源域故障诊断模型迁移到目标域,实现跨域 知识共享。
发明内容
为了克服现有技术的不足,本发明提出一种基于数据混剪技术的 热泵故障诊断模型迁移方法,将目标域健康数据混剪到源域数据全类 别中,构建新的训练数据集,实现故障诊断模型的迁移;在仅利用目 标域健康数据的条件下将源域故障诊断模型迁移到目标域,实现跨域 知识共享。
为了解决上述技术问题本发明提供如下的技术方案:
一种基于数据混剪技术的热泵故障诊断模型迁移方法,包括以下 步骤:
1).搭建实验热泵系统,要求与待诊断真实热泵系统结构相似, 模拟各类故障状态,采集故障标记数据,即源域数据集;
2).利用源域数据集训练深度模型,获取源域系统上可用的故障 诊断模型;
3).采集待诊断目标热泵系统运行数据,需在目标系统全新时及 时采集,保证热泵为健康状态;
4).将目标数据集进行局部剪切,并覆盖源域数据的对应部位, 形成合成数据,数据的标签为软标签,即源域数据标签和健康类别按 照剪切局部面积占比的分配,两者和为1,剪切局部的位置使用随机 策略;
5).利用合成数据联合源域数据对诊断模型进行再训练,达到模 型迁移的目的;
6).利用迁移完成的故障诊断模型对目标系统进行在线监测,实 现故障诊断的目的。
进一步,所述步骤1)中,选择数据集作为源域数据集,获取8 种类别故障标记数据,故障标签以one-hot编码形式表示,用于诊断 模型监督训练。数据集使用arctan((data/μ)/σ)进行归一化处理。
所述步骤2)中,热泵运行数据是多维时序数据,将其按照设定 的时间段分割后,就变成了一个个矩阵数据;构建基于卷积神经网络 的故障诊断模型,模型包含5层卷积层,后接128神经单元的全连接 层,然后接softmax分类层。利用源域数据集监督训练深度模型,训 练轮数100轮,batch-size64,优化器Adam,最终实现源域诊断模型 训练。
所述步骤3)中,选择数据集作为目标域数据,抽取其中健康类 别数据组成各自的目标域数据集。
所述步骤4)的过程为:
401)进行数据混剪:首先,利用随机数生成方式,决策出局部 剪切块的位置和大小,位置以随机数生成的起点(x,y)坐标为准, 大小不超过矩阵数据的1/4,即长宽上限均为一半;
402)将全类别源域数据进行局部替换,即源域数据对应位置替 换成目标域剪切数据块,生成合成数据;
403)从新构建数据软标签,原始标签以one-hot编码方式呈现, 新标签根据局部剪切块的面积生成。
所述步骤5)中,利用合成数据联合源域数据同时对诊断模型再 训练,合成数据量和源域数据量保证相同,训练轮数为50轮,batch-size为64,优化器Adam,再次训练完毕的模型实现了迁移效 果。
本发明的有益效果主要表现在:
(1)本发明利用一台热泵系统故障数据训练模型,可实现多台 不同热泵系统的故障诊断,不需要每台热泵系统单独提供足量标记数 据,大大降低了数据获取成本。
(2)相比现有的利用小批量样本实现模型迁移的方法,本发明 只需要目标域提供健康类别数据,而不需要目标域提供故障类别数据, 极大增加的技术的可行性。
附图说明
图1是数据混剪技术示意图。
图2是有无混剪技术的模型迁移诊断混淆矩阵,其中,(A)为 无混剪,(B)为有混剪。
图3是有无混剪技术的模型迁移诊断精度对比,其中,(A)为 无混剪,(B)为有混剪。
具体实施方式
结合说明书附图,以自行搭建热泵实验平台采集的数据为算例, 对本发明方法的具体实施做进一步说明。
参照图1~图3,一种基于数据混剪技术的热泵故障诊断模型迁移 方法,热泵实验平台为小型风冷式热泵系统,压缩机、工质等均可变 更。为验证迁移模型的迁移效果,共采集三组数据集,三组数据集详 细情况见表1。利用三组数据集互为源域,验证迁移模型在自身数据 集上的诊断效果。
表1
本实施例的一种基于数据混剪技术的热泵系统故障诊断模型迁 移方法,包括以下步骤:
1)源域数据准备:选择数据集1作为源域数据集,获取8种类 别故障标记数据,故障标签以one-hot编码形式表示,用于诊断模型 监督训练。数据集使用arctan((data/μ)/σ)进行归一化处理。
2)热泵运行数据是多维时序数据,将其按照一定的时间段分割 后,就变成了一个个矩阵数据。针对数据的这一特点,构建基于卷积 神经网络的故障诊断模型,模型包含5层卷积层,后接128神经单元 的全连接层,然后接softmax分类层。利用源域数据集监督训练深度 模型,训练轮数100轮,batch-size64,优化器Adam,最终实现源域 诊断模型训练。
3)目标域数据准备:分别选择数据集2和数据集3作为目标域 数据,抽取其中健康类别数据组成各自的目标域数据集。
4)将目标数据集进行局部剪切,并覆盖源域数据的对应部位, 形成合成数据,数据的标签为软标签,即源域数据标签和健康类别按 照剪切局部面积占比的分配,两者和为1,剪切局部的位置使用随机 策略;过程为:
401)按照图1所示方式进行数据混剪。首先,利用随机数生成 方式,决策出局部剪切块的位置和大小,位置以随机数生成的起点 (x,y)坐标为准,大小不超过矩阵数据的1/4,即长宽上限均为一半。
402)将全类别源域数据进行局部替换,即源域数据对应位置替 换成目标域剪切数据块,生成合成数据。
403)从新构建数据软标签,原始标签以one-hot编码方式呈现, 新标签根据局部剪切块的面积生成。如局部剪切块面积为1/4,源域 数据为故障类别1的数据,原始标签为[0,1,0,0,0,0,0,0],新生成的软 标签为[0.25,0.75,0,0,0,0,0,0],又如源域数据为健康数据,则合成数据 标签不变,为[1,0,0,0,0,0,0,0]。
5)利用合成数据联合源域数据同时对诊断模型再训练,合成数 据量和源域数据量保证相同,训练轮数为50轮,batch-size为64,优 化器Adam,再次训练完毕的模型实现了迁移效果。
6)将迁移完成的诊断模型部署到目标系统上,实现故障在线监 控的目的。其中,实验对比了有无数据混剪参与的最终迁移诊断效果。 利用数据集1作为源域,将数据集2作为目标域的实验对比结果。图 2为诊断的混淆矩阵,验证数据为2400组样本,每类故障300组, 未使用混剪数据迁移的结果如图2A,使用混剪数据迁移的结果如图 2B,可以看不出,虽然使用混剪数据迁移后健康数据的诊断效果较 弱,但整体诊断效果有明显提升。进一步对比各类故障的诊断正确率, 可以看出,使用混剪数据迁移后,整体诊断精度提高。证明混剪数据 技术对提高诊断模型迁移精度具有明显效果。
本说明书的实施例所述的内容仅仅是对发明构思的实现形式的 列举,仅作说明用途。本发明的保护范围不应当被视为仅限于本实施 例所陈述的具体形式,本发明的保护范围也及于本领域的普通技术人 员根据本发明构思所能想到的等同技术手段。
Claims (6)
1.一种基于数据混剪技术的热泵故障诊断模型迁移方法,其特征在于,所述方法包括以下步骤:
1).搭建实验热泵系统,要求与待诊断真实热泵系统结构相似,模拟各类故障状态,采集故障标记数据,即源域数据集;
2).利用源域数据集训练深度模型,获取源域系统上可用的故障诊断模型;
3).采集待诊断目标热泵系统运行数据,需在目标系统全新时及时采集,保证热泵为健康状态;
4).将目标数据集进行局部剪切,并覆盖源域数据的对应部位,形成合成数据,数据的标签为软标签,即源域数据标签和健康类别按照剪切局部面积占比的分配,两者和为1,剪切局部的位置使用随机策略;
5).利用合成数据联合源域数据对诊断模型进行再训练,达到模型迁移的目的;
6).利用迁移完成的故障诊断模型对目标系统进行在线监测,实现故障诊断的目的。
2.如权利要求1所述的一种基于数据混剪技术的热泵故障诊断模型迁移方法,其特征在于,所述步骤1)中,选择数据集作为源域数据集,获取8种类别故障标记数据,故障标签以one-hot编码形式表示,用于诊断模型监督训练,数据集使用arctan((data/μ)/σ)进行归一化处理。
3.如权利要求1或2所述的一种基于数据混剪技术的热泵故障诊断模型迁移方法,其特征在于,所述步骤2)中,热泵运行数据是多维时序数据,将其按照设定的时间段分割后,就变成了一个个矩阵数据;构建基于卷积神经网络的故障诊断模型,模型包含5层卷积层,后接128神经单元的全连接层,然后接softmax分类层;利用源域数据集监督训练深度模型,训练轮数100轮,batch-size64,优化器Adam,最终实现源域诊断模型训练。
4.如权利要求1或2所述的一种基于数据混剪技术的热泵故障诊断模型迁移方法,其特征在于,所述步骤3)中,选择数据集作为目标域数据,抽取其中健康类别数据组成各自的目标域数据集。
5.如权利要求1或2所述的一种基于数据混剪技术的热泵故障诊断模型迁移方法,其特征在于,所述步骤4)的过程为:
401)进行数据混剪:首先,利用随机数生成方式,决策出局部剪切块的位置和大小,位置以随机数生成的起点(x,y)坐标为准,大小不超过矩阵数据的1/4,即长宽上限均为一半;
402)将全类别源域数据进行局部替换,即源域数据对应位置替换成目标域剪切数据块,生成合成数据;
403)从新构建数据软标签,原始标签以one-hot编码方式呈现,新标签根据局部剪切块的面积生成。
6.如权利要求1或2所述的一种基于数据混剪技术的热泵故障诊断模型迁移方法,其特征在于,所述步骤5)中,利用合成数据联合源域数据同时对诊断模型再训练,合成数据量和源域数据量保证相同,训练轮数为50轮,batch-size为64,优化器Adam,再次训练完毕的模型实现了迁移效果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110042981.6A CN112733943B (zh) | 2021-01-13 | 2021-01-13 | 一种基于数据混剪技术的热泵故障诊断模型迁移方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110042981.6A CN112733943B (zh) | 2021-01-13 | 2021-01-13 | 一种基于数据混剪技术的热泵故障诊断模型迁移方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112733943A true CN112733943A (zh) | 2021-04-30 |
CN112733943B CN112733943B (zh) | 2024-03-22 |
Family
ID=75592965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110042981.6A Active CN112733943B (zh) | 2021-01-13 | 2021-01-13 | 一种基于数据混剪技术的热泵故障诊断模型迁移方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112733943B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822359A (zh) * | 2021-09-23 | 2021-12-21 | 浙江工业大学 | 基于残差数据缩放策略的热泵系统自适应故障诊断方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109947086A (zh) * | 2019-04-11 | 2019-06-28 | 清华大学 | 基于对抗学习的机械故障迁移诊断方法及系统 |
CN110245711A (zh) * | 2019-06-18 | 2019-09-17 | 西安电子科技大学 | 基于角度旋转生成网络的sar目标识别方法 |
CN112149350A (zh) * | 2020-09-21 | 2020-12-29 | 浙江工业大学 | 解决热泵系统故障诊断中数据依赖问题的模型迁移方法 |
-
2021
- 2021-01-13 CN CN202110042981.6A patent/CN112733943B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109947086A (zh) * | 2019-04-11 | 2019-06-28 | 清华大学 | 基于对抗学习的机械故障迁移诊断方法及系统 |
CN110245711A (zh) * | 2019-06-18 | 2019-09-17 | 西安电子科技大学 | 基于角度旋转生成网络的sar目标识别方法 |
CN112149350A (zh) * | 2020-09-21 | 2020-12-29 | 浙江工业大学 | 解决热泵系统故障诊断中数据依赖问题的模型迁移方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822359A (zh) * | 2021-09-23 | 2021-12-21 | 浙江工业大学 | 基于残差数据缩放策略的热泵系统自适应故障诊断方法 |
CN113822359B (zh) * | 2021-09-23 | 2024-02-02 | 浙江工业大学 | 基于残差数据缩放策略的热泵系统自适应故障诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112733943B (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yu et al. | A novel methodology for knowledge discovery through mining associations between building operational data | |
CN102663232B (zh) | 一种面向用户能效评估的多维仿真分析系统及其方法 | |
CN105930861A (zh) | 一种基于Adaboost算法的变压器故障诊断方法 | |
CN109376960A (zh) | 基于lstm神经网络的电网负荷预测方法 | |
CN106295153A (zh) | 一种基于孪生支持向量机的航空发动机气路故障诊断方法 | |
CN109116150A (zh) | 一种基于小脑模型神经网络的电力电子变换器故障诊断方法 | |
CN107392304A (zh) | 一种风电机组异常数据识别方法及装置 | |
CN113205203A (zh) | 基于cnn-lstm的建筑能耗预测方法和系统 | |
CN108961468B (zh) | 一种基于集成学习的船舶动力系统故障诊断方法 | |
CN104881735A (zh) | 用于支撑智慧城市运行管理的智能电网大数据挖掘系统及方法 | |
CN114004374B (zh) | 一种基于玻尔兹曼机投票的空调机组传感器故障诊断方法 | |
CN110500709A (zh) | 空调器运行状态在线判别方法 | |
CN112733943B (zh) | 一种基于数据混剪技术的热泵故障诊断模型迁移方法 | |
CN113822359B (zh) | 基于残差数据缩放策略的热泵系统自适应故障诊断方法 | |
CN108764626A (zh) | 一种节能诊断方法和装置 | |
Huang et al. | Analyzing residential weatherization decisions using hybrid simulation modeling | |
CN112232608B (zh) | 一种基于数据驱动的区域建筑空调器短期耗电量预测方法 | |
CN104679945A (zh) | 基于有色Petri网的系统综合评估方法 | |
Ram et al. | Reliability evaluation and cost optimization of solar road studs | |
CN117332288A (zh) | 一种建筑节能技术评估系统及方法 | |
CN104318316A (zh) | 一种用户用电实时测量方法 | |
CN112365082A (zh) | 一种基于机器学习的公共能源消耗预测方法 | |
CN109032084A (zh) | 一种过程能力指数驱动的状态评估与故障诊断系统及方法 | |
CN105976126A (zh) | 基于主成分分析法的机床制造能耗分析方法 | |
Li et al. | Air-Conditioner Usage Patterns in Teaching Buildings of Universities by Data Mining Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |