CN114328742B - 一种中央空调的缺失数据预处理方法 - Google Patents

一种中央空调的缺失数据预处理方法 Download PDF

Info

Publication number
CN114328742B
CN114328742B CN202111656956.3A CN202111656956A CN114328742B CN 114328742 B CN114328742 B CN 114328742B CN 202111656956 A CN202111656956 A CN 202111656956A CN 114328742 B CN114328742 B CN 114328742B
Authority
CN
China
Prior art keywords
data
missing
feature
air conditioner
central air
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111656956.3A
Other languages
English (en)
Other versions
CN114328742A (zh
Inventor
张良均
徐圣兵
王宏刚
王振友
施兴
张敏
赵云龙
刘名军
张尚佳
周东平
杨惠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Teddy Intelligent Technology Co ltd
Original Assignee
Guangdong Teddy Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Teddy Intelligent Technology Co ltd filed Critical Guangdong Teddy Intelligent Technology Co ltd
Priority to CN202111656956.3A priority Critical patent/CN114328742B/zh
Publication of CN114328742A publication Critical patent/CN114328742A/zh
Application granted granted Critical
Publication of CN114328742B publication Critical patent/CN114328742B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Air Conditioning Control Device (AREA)

Abstract

本发明涉及空调数据处理技术领域,且公开了一种中央空调的缺失数据预处理方法,包括以下步骤:S1:数据采集,在中央空调上安装的传感器采集数据,把得到的动态数据整合并建立中央空调云端初始学习数据库;S2:获取含缺失数据学习样本;S3:缺失值初始化;S4:无缺样本重构;S5:静态缺失数据填补;S6:在云端建立动态无缺训练数据集。本发明既能适应边缘端的计算,能保证实时计算,也能根据云端服务满足大数据计算量大的需求,能利用共享特征,填补单个缺失特征数据,适应中央空调数据存储量大的需求,并提供云端完整无缺数据的计算工作,为边缘端的动态缺失数据填补提供数据与知识支撑。

Description

一种中央空调的缺失数据预处理方法
技术领域
本发明涉及空调数据处理技术领域,具体为一种中央空调的缺失数据预处理方法。
背景技术
随着全球气候的变迁和空调技术的发展,越来越多的大型建筑物利用中央空调云端系统来调节控制室内温度和湿度,中央空调系统的云端优化控制必然涉及到中央空调的各种边缘端的实时数据,而中央空调的边缘端实时数据如设备耗电量、冷凝水温度、流速等一般特征数据都由对应的传感器采集,由于受外部环境、其他电器设备、人员活动等多种因素的影响,容易使传感器数据采集工作出现中断或不稳定情况,从而产生缺失的实时数据,有的甚至出现各种其它异常的实时数据,而这些边缘端数据的缺失会对中央空调云端系统的优化调控研究工作造成很大的影响,导致云端因无法获取优化控制数据而开展优化控制工作或优化控制工作的优化效果不理想,所以要对传感器采集到的存在缺失的数据进行预处理,得到无缺失而完整的数据,以便开展后续的云端优化调控工作。
缺失数据传统预处理的方法是直接删除或填充,这样会导致丢失数据中的一些重要信息,且主观性较强,容易造成数据质量的整体下降,删除方式简便易行,但删除缺失数据的过程中减少了原始的数据,导致了信息的损耗,不适合高维特征缺失数据的处理,加权处理方式是一个减少偏差的简单措施,但在样本量较大时,容易受到边缘计算能力的限制,也容易出现错误的结果,在大数据时代,缺失数据的处理方法主要采用数据挖掘方法:贝叶斯网络和人工神经网络方法,贝叶斯网络仅适合于对领域知识具有一定了解的情况,至少对变量间的依赖关系较清楚的情况,人工神经网络可以有效的解决空值问题,但人工神经网络学习方式必须提供一定量的标签数据,不能满足人们的要求,因此提出一种中央空调的缺失数据预处理方法。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种中央空调的缺失数据预处理方法,解决了一般的缺失数据预处理方法不能保证实时计算,不能根据云端服务满足大数据计算量大的需求的问题。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:
一种中央空调的缺失数据预处理方法,包括以下步骤:
S1:数据采集,在中央空调上安装的传感器采集数据,把得到的动态数据整合并建立中央空调云端初始学习数据库;
S2:获取含缺失数据学习样本,按采集时间依序抽取样本量为l,特征数为d的数据集X=(xij)d×l,其中xij表示第j个样本的第i个传感器采集特征数据,j=1,…,l,i=1,…,d,xj表示X的j列,j=1,…,l,xi.表示X的i行,i=1,…,q。
缺失标记矩阵:Γ=(γij)q×l,其中
Figure GDA0003945189740000021
无缺标记矩阵:Π=(πij)q×l,其中
Figure GDA0003945189740000022
另外记
Figure GDA0003945189740000023
S3:缺失值初始化,对第i个特征对应的所有缺失值从区间[αii]随机选取填补,i=1,…,d,形成无缺数据X′=(x′ij)d×l
S4:无缺样本重构,输入xj,j=1,…,l,利用自动编码器算法训练重构更新X′=(x′ij)d×l=Z′,并保存训练所得权重参数θ=(W,b)和θ′=(W′,b′),其中y=fθ(x)=Wx+b,z=gθ′(y)=W′y+b′,自动编码器学习的损失函数为l2(x,z)=||x-z||2
S5:静态缺失数据填补,利用X=X·Π+X′·Γ,其中X·Π和X′·Γ表示矩阵的对应元素相乘,完成缺失数据的填补;
S6:在云端建立动态无缺训练数据集,按时间顺序获取样本x1,x2,…,xl,xl+1,xl+2,…,xl+m,组成多任务学习模型训练数据集,S6中包括数据识别模块,数据识别模块识别时间数据并进行排列;
S7:多任务模型学习数据模型构造,依据选(x1,x2,…,xl),(x2,x3,…,xl+1),…,(xl,xl+1,…,xl+m-1)作为特征输入数据,对应标签数据为xl+1,xl+2,…,xl+m
S8:模型学习,利用多任务前馈神经网络算法训练得对应特征的预测模型fi(X;θ),i=1,…,d;
S9:获取对象x,边缘端获取有缺失特征数据的对象x;
S10:更新X,用最近时间段内无缺数据更新X;
S11:动态缺失数据填补,利用fi(X;θ),i=1,…,d,填补x的第i个缺失特征数据,以动态缺失数据的填补。
作为本发明再进一步的方案,所述S1中传感器包括温度传感器、湿度传感器、压力传感器,在采集数据时进行全天候采集。
进一步的,所述述S4中包括训练模块,自动编码器算法在计算时首先输入x,然后加权θ激活,然后反向加权θ’z=gθ′(y),然后训练θ和θ’,最后输出θ和θ’和z。
在前述方案的基础上,所述S5中的完成缺失数据填补后进行记录,并进行统计。
进一步的,所述S8中包括模型学习模块,多任务前馈神经网络算法在训练时首先输入特征1、特征L、特征d,特征1、特征L、特征d分别进入输入层,然后进入隐藏层,然后进入输出层,然后进入隐藏层和输出层时进行交互,最后输出特征1、特征L、特征d。
在前述方案的基础上,所述S9中包括数据获取模块,数据获取模块与模型学习模块相连接。
(三)有益效果
与现有技术相比,本发明提供了一种中央空调的缺失数据预处理方法,具备以下有益效果:
1、本发明既能适应边缘端的计算,能保证实时计算,也能根据云端服务满足大数据计算量大的需求,能利用共享特征,填补单个缺失特征数据。
2、本发明中,适应中央空调数据存储量大的需求,并提供云端完整无缺数据的计算工作,为边缘端的动态缺失数据填补提供数据与知识支撑。
3、本发明中,能够在云端定期更新边缘端的动态缺失数据填补模型知识。
4、本发明中,边缘端提供实时的动态缺失数据填补功能,以为中央空调的优化控制提供有效的信息支撑。
附图说明
图1为本发明提出的一种中央空调的缺失数据预处理方法的流程结构示意图;
图2为本发明提出的一种中央空调的缺失数据预处理方法的多任务前馈神经网络算法示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1-2,一种中央空调的缺失数据预处理方法,包括以下步骤:
S1:数据采集,在中央空调上安装的传感器采集数据,把得到的动态数据整合并建立中央空调云端初始学习数据库;
S2:获取含缺失数据学习样本,按采集时间依序抽取样本量为l,特征数为d的数据集X=(xij)d×l,其中xij表示第j个样本的第i个传感器采集特征数据,j=1,…,l,i=1,…,d,xj表示X的j列,j=1,…,l,xi.表示X的i行,i=1,…,q。
缺失标记矩阵:Γ=(γij)q×l,其中
Figure GDA0003945189740000051
无缺标记矩阵:Π=(πij)q×l,其中
Figure GDA0003945189740000052
另外记
Figure GDA0003945189740000053
S3:缺失值初始化,对第i个特征对应的所有缺失值从区间[αii]随机选取填补,i=1,…,d,形成无缺数据X′=(x′ij)d×l
S4:无缺样本重构,输入xj,j=1,…,l,利用自动编码器算法训练重构更新X′=(x′ij)d×l=Z′,并保存训练所得权重参数θ=(W,b)和θ′=(W′,b′),其中y=fθ(x)=Wx+b,z=gθ′(y)=W′y+b′,自动编码器学习的损失函数为l2(x,z)=||x-z||2
S5:静态缺失数据填补,利用X=X·Π+X′·Γ,其中X·Π和X′·Γ表示矩阵的对应元素相乘,完成缺失数据的填补,适应中央空调数据存储量大的需求,并提供云端完整无缺数据的计算工作,为边缘端的动态缺失数据填补提供数据与知识支撑;
S6:在云端建立动态无缺训练数据集,按时间顺序获取样本x1,x2,…,xl,xl+1,xl+2,…,xl+m,组成多任务学习模型训练数据集,S6中包括数据识别模块,数据识别模块识别时间数据并进行排列;
S7:多任务模型学习数据模型构造,依据选(x1,x2,…,xl),(x2,x3,…,xl+1),…,(xl,xl+1,…,xl+m-1)作为特征输入数据,对应标签数据为xl+1,xl+2,…,xl+m
S8:模型学习,利用多任务前馈神经网络算法训练得对应特征的预测模型fi(X;θ),i=1,…,d,在云端定期更新边缘端的动态缺失数据填补模型知识;
S9:获取对象x,边缘端获取有缺失特征数据的对象x;
S10:更新X,用最近时间段内无缺数据更新X;
S11:动态缺失数据填补,利用fi(X;θ),i=1,…,d,填补x的第i个缺失特征数据,以动态缺失数据的填补,边缘端提供实时的动态缺失数据填补功能,以为中央空调的优化控制提供有效的信息支撑,既能适应边缘端的计算,能保证实时计算,也能根据云端服务满足大数据计算量大的需求,能利用共享特征,填补单个缺失特征数据。
本发明的S1中传感器包括温度传感器、湿度传感器、压力传感器,在采集数据时进行全天候采集,述S4中包括训练模块,自动编码器算法在计算时首先输入x,然后加权θ激活,然后反向加权θ’z=gθ′(y),然后训练θ和θ’,最后输出θ和θ’和z,S5中的完成缺失数据填补后进行记录,并进行统计,S8中包括模型学习模块,多任务前馈神经网络算法在训练时首先输入特征1、特征L、特征d,特征1、特征L、特征d分别进入输入层,然后进入隐藏层,然后进入输出层,然后进入隐藏层和输出层时进行交互,最后输出特征1、特征L、特征d,S9中包括数据获取模块,数据获取模块与模型学习模块相连接。
在该文中的描述中,需要说明的是,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (6)

1.一种中央空调的缺失数据预处理方法,其特征在于,包括以下步骤:
S1:数据采集,在中央空调上安装的传感器采集数据,把得到的动态数据整合并建立中央空调云端初始学习数据库;
S2:获取含缺失数据学习样本,按采集时间依序抽取样本量为l,特征数为d的数据集X=(xij)d×l,其中xij表示第j个样本的第i个传感器采集特征数据,j=1,…,l,i=1,…,d,xj表示X的j列,j=1,…,l,xi.表示X的i行,i=1,…,d;
缺失标记矩阵:Γ=(γij)d×l,其中
Figure FDA0003945189730000011
无缺标记矩阵:Π=(πij)d×l,其中
Figure FDA0003945189730000012
另外记
Figure FDA0003945189730000013
S3:缺失值初始化,对第i个特征对应的所有缺失值从区间[αii]随机选取填补,i=1,…,d,形成无缺数据X′=(x′ij)d×l
S4:无缺样本重构,输入xj,j=1,…,l,利用自动编码器算法训练重构更新X′=(x′ij)d×l=Z′,并保存训练所得权重参数θ=(W,b)和θ′=(W′,b′),其中y=fθ(x)=Wx+b,z=gθ′(y)=W′y+b′,自动编码器学习的损失函数为l2(x,z)=||x-z||2
S5:静态缺失数据填补,利用X=X·Π+X′·Γ,其中X·Π和X′·Γ表示矩阵的对应元素相乘,完成缺失数据的填补;
S6:在云端建立动态无缺训练数据集,按时间顺序获取样本x1,x2,…,xl,xl+1,xl+2,…,xl+m,组成多任务学习模型训练数据集,S6中包括数据识别模块,数据识别模块识别时间数据并进行排列;
S7:多任务模型学习数据模型构造,依据选(x1,x2,…,xl),(x2,x3,…,xl+1),…,(xl,xl+1,…,xl+m-1)作为特征输入数据,对应标签数据为xl+1,xl+2,…,xl+m
S8:模型学习,利用多任务前馈神经网络算法训练得对应特征的预测模型fi(X;θ),i=1,…,d;
S9:获取对象x,边缘端获取有缺失特征数据的对象x;
S10:更新X,用最近时间段内无缺数据更新X;
S11:动态缺失数据填补,利用fi(X;θ),i=1,…,d,填补x的第i个缺失特征数据,以动态缺失数据的填补。
2.根据权利要求1所述的一种中央空调的缺失数据预处理方法,其特征在于,所述S1中传感器包括温度传感器、湿度传感器、压力传感器,在采集数据时进行全天候采集。
3.根据权利要求1所述的一种中央空调的缺失数据预处理方法,其特征在于,所述S4中包括训练模块,自动编码器算法在计算时首先输入x,然后加权θ激活,然后反向加权θ’z=gθ′(y),然后训练θ和θ’,最后输出θ和θ’和z。
4.根据权利要求1所述的一种中央空调的缺失数据预处理方法,其特征在于,所述S5中的完成缺失数据填补后进行记录,并进行统计。
5.根据权利要求1所述的一种中央空调的缺失数据预处理方法,其特征在于,所述S8中包括模型学习模块,多任务前馈神经网络算法在训练时首先输入特征1、特征L、特征d,特征1、特征L、特征d分别进入输入层,然后进入隐藏层,然后进入输出层,然后进入隐藏层和输出层时进行交互,最后输出特征1、特征L、特征d。
6.根据权利要求5所述的一种中央空调的缺失数据预处理方法,其特征在于,所述S9中包括数据获取模块,数据获取模块与模型学习模块相连接。
CN202111656956.3A 2021-12-31 2021-12-31 一种中央空调的缺失数据预处理方法 Active CN114328742B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111656956.3A CN114328742B (zh) 2021-12-31 2021-12-31 一种中央空调的缺失数据预处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111656956.3A CN114328742B (zh) 2021-12-31 2021-12-31 一种中央空调的缺失数据预处理方法

Publications (2)

Publication Number Publication Date
CN114328742A CN114328742A (zh) 2022-04-12
CN114328742B true CN114328742B (zh) 2023-02-03

Family

ID=81019623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111656956.3A Active CN114328742B (zh) 2021-12-31 2021-12-31 一种中央空调的缺失数据预处理方法

Country Status (1)

Country Link
CN (1) CN114328742B (zh)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2656094A2 (en) * 2010-12-22 2013-10-30 Koninklijke Philips N.V. Rapid parallel reconstruction for arbitrary k-space trajectories
US20190042952A1 (en) * 2017-08-03 2019-02-07 Beijing University Of Technology Multi-task Semi-Supervised Online Sequential Extreme Learning Method for Emotion Judgment of User
CN108090558B (zh) * 2018-01-03 2021-06-08 华南理工大学 一种基于长短期记忆网络的时间序列缺失值自动填补方法
CN110309907A (zh) * 2019-06-06 2019-10-08 大连理工大学 一种基于去跟踪自编码器的动态缺失值填补方法
US11568187B2 (en) * 2019-08-16 2023-01-31 Fair Isaac Corporation Managing missing values in datasets for machine learning models
CN112365029B (zh) * 2019-09-03 2021-08-17 深圳市得益节能科技股份有限公司 用于空调负荷预测的缺失值处理方法及空调负荷预测系统
CN111353525A (zh) * 2020-02-11 2020-06-30 大连理工大学 一种不均衡不完整数据集的建模及缺失值填补方法
CN111694830A (zh) * 2020-06-12 2020-09-22 复旦大学 基于深度集成学习的缺失数据补全方法
CN113468156A (zh) * 2021-07-06 2021-10-01 西南交通大学 基于特征融合增强的数据集缺失值填补方法

Also Published As

Publication number Publication date
CN114328742A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN109214592B (zh) 一种多模型融合的深度学习的空气质量预测方法
CN108171117B (zh) 基于多核异构并行计算的电力人工智能视觉分析系统
CN107703564B (zh) 一种降雨预测方法、系统及电子设备
CN110533086B (zh) 图像数据半自动标注方法
CN110991690B (zh) 一种基于深度卷积神经网络的多时次风速预测方法
CN108563739A (zh) 天气数据获取方法及装置、计算机装置及可读存储介质
CN110766222B (zh) 基于粒子群参数优化和随机森林的pm2.5浓度预测方法
CN112489497B (zh) 基于深度卷积神经网络的空域运行复杂度评估方法
CN111539355A (zh) 一种基于深层神经网络的光伏板异物检测系统及检测方法
CN114092832A (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
CN112465199B (zh) 空域态势评估系统
CN112215426A (zh) 一种短期用电负荷预测方法
CN112801270A (zh) 融合深度卷积与注意力机制的u形网络槽自动识别方法
CN106897957A (zh) 一种基于pca和pso‑elm的自动气象站实时数据质量控制方法
CN109615147A (zh) 一种未来72小时大气污染预报预警方法
Tarik et al. Big data analytics and artificial intelligence serving agriculture
CN110738272B (zh) 一种输电线路通道可视化机械类连续告警样本的标注方法
Priatna et al. Precipitation prediction using recurrent neural networks and long short-term memory
CN114328742B (zh) 一种中央空调的缺失数据预处理方法
CN114862032A (zh) 一种基于XGBoost-LSTM的电网负荷预测方法及装置
CN114662793A (zh) 基于可解释分层模型的业务流程剩余时间预测方法与系统
CN117436653A (zh) 一种网约车出行需求的预测模型构建方法和预测方法
CN108845075B (zh) 基于深度学习网络的堆肥腐熟实时预测方法
CN114611788A (zh) 一种基于gru网络的寒潮天气客观判别方法
CN114332039A (zh) 一种光伏板积灰浓度识别网络、系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant