CN110490379B - 基于mcmc的办公室人员用能行为预测方法及系统 - Google Patents
基于mcmc的办公室人员用能行为预测方法及系统 Download PDFInfo
- Publication number
- CN110490379B CN110490379B CN201910744738.1A CN201910744738A CN110490379B CN 110490379 B CN110490379 B CN 110490379B CN 201910744738 A CN201910744738 A CN 201910744738A CN 110490379 B CN110490379 B CN 110490379B
- Authority
- CN
- China
- Prior art keywords
- model
- electric equipment
- parameters
- data
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000005265 energy consumption Methods 0.000 title claims abstract description 35
- 238000009826 distribution Methods 0.000 claims abstract description 105
- 230000009471 action Effects 0.000 claims abstract description 65
- 238000005070 sampling Methods 0.000 claims abstract description 53
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 39
- 238000007477 logistic regression Methods 0.000 claims abstract description 21
- 230000006399 behavior Effects 0.000 claims description 61
- 230000006870 function Effects 0.000 claims description 43
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 19
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000004134 energy conservation Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Algebra (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Artificial Intelligence (AREA)
- Mathematical Analysis (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Primary Health Care (AREA)
- Mathematical Optimization (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Mathematics (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
Abstract
本公开提供一种基于MCMC的办公室人员用能行为预测方法及系统。该方法包括获取办公室中所有电气设备预设时间段内开关时间数据及工作时长数据;利用逻辑回归函数对电气设备的开关时间数据的后验概率分布进行建模,得到用电设备动作模型,利用MCMC算法对用电设备动作模型的参数进行随机采样,取所有样本值的平均值为用电设备动作模型参数的最优值,得到用户设备动作模型;根据用电设备工作时长数据,确定出用电设备工作时长数据概率分布对应的函数,构建出用电设备工作时长模型,利用MCMC算法在先验分布的参数分布中不断采样,取所有样本参数的平均值拟合用电设备工作时长模型;根据用电设备动作模型及用电设备工作时长模型,预测出办公室人员用能行为。
Description
技术领域
本公开属于办公室人员用能行为预测领域,尤其涉及一种基于MCMC的办公室人员用能行为预测方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
国内外大量研究表明,建筑能耗不仅受气象参数、建筑体形、围护结构和窗墙比等因素影响,而且与居住者的行为有关。尽可能充分挖掘办公室人员设备使用状态,并建立相应人员用能行为模型,将有利于分析和评估人员用能行为和工作绩效,并为建筑能耗预测和建筑节能控制提供智能决策支持。
Kasteren等人基于分层隐马尔科夫模型(HHMM)将每个传感器激活当做人员行为动作,模拟每个动作之间的关系,能够预测人员连续的行为,但识别精度不高。Chen等人利用利用CRF方法识别了无线传感网环境中的单用户活动,虽然缩短了识别时间,但成本较高。摄像头、手机、穿戴设备等都属于侵入式设备,容易造成安全问题,不满足人们的隐私要求。王闯等人提出一套针对有关建筑用能的人员行为的基本研究框架和定量描述方法,提出了基于分段概率函数和条件触发形式的人员动作模型,刻画了室内人员行为现象,有效反映了人行为的随机性、环境相关性、不同个体之间的多样性等特征,实现非侵入式人员行为识别,但缺乏时间序列的考虑。潘阳阳等人提出了一种新的人员行为描述方法,并在此方法的基础上建立基于“主体和事件机制”的用能行为模型及算法流程,该模型聚焦于建筑内人员从移动行为到用能行为的整体流程,思路更加清晰,贴近居民生活,但识别精度较低。
发明人发现,现有的办公室人员用能行为预测方法存在隐私性低、成本高、准确率和识别率且实用性较差的问题。
发明内容
为了解决上述问题,本公开的第一个方面提供一种基于MCMC的办公室人员用能行为预测方法,其基于时间序列预测人员用能行为,能够提高预测的准确率和识别速度,具有较高的实用性。
为了实现上述目的,本公开采用如下技术方案:
一种基于MCMC的办公室人员用能行为预测方法,包括:
获取办公室中所有电气设备预设时间段内开关时间数据及工作时长数据;
利用逻辑回归函数对电气设备的开关时间数据的后验概率分布进行建模,得到用电设备动作模型,利用MCMC算法对用电设备动作模型的参数进行随机采样,取所有样本值的平均值为用电设备动作模型参数的最优值,得到用户设备动作模型;
根据用电设备工作时长数据,确定出用电设备工作时长数据概率分布对应的函数,构建出用电设备工作时长模型,利用MCMC算法在先验分布的参数分布中不断采样,取所有样本参数的平均值拟合用电设备工作时长模型;
根据用电设备动作模型及用电设备工作时长模型,预测出办公室人员用能行为。
为了解决上述问题,本公开的第二个方面提供一种基于MCMC的办公室人员用能行为预测系统,其基于时间序列预测人员用能行为,能够提高预测的准确率和识别速度,具有较高的实用性。
为了实现上述目的,本公开采用如下技术方案:
一种基于MCMC的办公室人员用能行为预测系统,包括:
数据获取模块,其用于获取办公室中所有电气设备预设时间段内开关时间数据及工作时长数据;
动作模型构建及训练模块,其用于利用逻辑回归函数对电气设备的开关时间数据的后验概率分布进行建模,得到用电设备动作模型,利用MCMC算法对用电设备动作模型的参数进行随机采样,取所有样本值的平均值为用电设备动作模型参数的最优值,得到用户设备动作模型;
工作时长模型构建及训练模块,其用于根据用电设备工作时长数据,确定出用电设备工作时长数据概率分布对应的函数,构建出用电设备工作时长模型,利用MCMC算法在先验分布的参数分布中不断采样,取所有样本参数的平均值拟合用电设备工作时长模型;
用能行为预测模块,其用于根据用电设备动作模型及用电设备工作时长模型,预测出办公室人员用能行为。
本公开的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述所述的基于MCMC的办公室人员用能行为预测方法中的步骤。
本公开的第四个方面提供一种计算机终端。
一种计算机终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述所述的基于MCMC的办公室人员用能行为预测方法中的步骤。
本公开的有益效果是:
本公开通过分析办公室人员的设备开关状态数据,使用MCMC算法拟合用户设备启停的时间概率模型和工作时间模型,从而预测用户的用能行为,提高了预测的准确率和识别速度,具有较高的实用性。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1是本公开实施例的基于MCMC的办公室人员用能行为预测方法流程图;
图2是本公开实施例的数据预处理流程图;
图3(a)是本公开实施例的台式机开机时间概率分布直方图;
图3(b)是本公开实施例的台式机关机时间概率分布直方图;
图4是本公开实施例的不同β值的逻辑回归函数;
图5是本公开实施例的不同α、β值的逻辑回归函数;
图6(a)是本公开实施例的参数正态先验分布的参数空间横截面图;
图6(b)是本公开实施例的参数正态先验分布的参数空间三维图;
图7(a)是本公开实施例的台式机开机模型的α轨迹图;
图7(b)是本公开实施例的台式机开机模型的β轨迹图;
图7(c)是本公开实施例的台式机关机模型的α轨迹图;
图7(d)是本公开实施例的台式机关机模型的β轨迹图;
图7(e)是本公开实施例的台式机开机模型的α后验分布图;
图7(f)是本公开实施例的台式机开机模型的β后验分布图;
图7(g)是本公开实施例的台式机关机模型的α后验分布图;
图7(h)是本公开实施例的台式机关机模型的β后验分布图;
图8(a)是本公开实施例的台式机、灯、饮水机的开机时间概率模型;
图8(b)是本公开实施例的台式机、灯、饮水机的关机时间概率模型;
图9(a)是本公开实施例的上午7:00台式机开关机后验分布图;
图9(b)是本公开实施例的上午7:30台式机开关机后验分布图;
图9(c)是本公开实施例的上午8:00台式机开关机后验分布图;
图9(d)是本公开实施例的下午2:30台式机开关机后验分布图;
图9(e)是本公开实施例的下午3:00台式机开关机后验分布图;
图9(f)是本公开实施例的下午3:30台式机开关机后验分布图;
图10(a)是本公开实施例的台式机的工作时长概率密度分布模型;
图10(b)是本公开实施例的灯的工作时长概率密度分布模型;
图10(c)是本公开实施例的饮水机的工作时长概率密度分布模型;
图11是本公开实施例的台式机开机模型真实分布与拟合曲线;
图12(a)是本公开实施例的台式机、灯、饮水机的开机概率密度模型;
图12(b)是本公开实施例的台式机、灯、饮水机的关机概率密度模型
图13是本公开实施例的基于MCMC的办公室人员用能行为预测系统结构示意图。
具体实施方式
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本实施例使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
术语解释:
MCMC:Markov Chain Monte Carlo,马尔科夫链-蒙特卡罗。
MCMC算法在机器学习、深度学习以及自然语言处理等领域都有广泛的应用。综合马尔可夫链和蒙特卡罗的思想,MCMC本质是基于马尔科夫链进行转移计算从而实现从目标分布中进行采样。MCMC是一种基于当前值重复绘制分布参数随机值的方法,直至收敛到真正的分布,每个值的样本都是随机采样的,但是值的选择受当前状态和假定参数先验分布的限制。
(1)马尔科夫链
用一句话来概括马尔科夫链,那就是某一时刻状态转移的概率只依赖于它的前一个状态,体现的是状态空间的转换关系。假设状态序列为...,xt-2,xt-1,xt,xt+1,xt+2,...,由马尔科夫链定义可知,时刻xt+1的状态只与xt有关,数学公式如下:
P(xt+1|...,xt-2,xt-1,xt)=P(xt+1|xt) (1)
马尔科夫链有非常强的稳定性,在满足细致平稳分布的马尔科夫链都具有稳定性。细致平稳分布满足如下等式:
P(x(i))T(x(i-1)|x(i))=P(x(i-1))T(x(i)|x(i-1)) (2)
其中:P(x)是系统的平稳分布,P(x(i))代表当前状态对应的概率值;T(x)是转移矩阵,T(x(i-1)|x(i))代表由状态i到状态i-1的转移概率。这一性质的存在,使马尔科夫链具有常返性,即当i足够大时马尔科夫链的状态可以以大于0的概率回到任意状态。马尔科夫链的收敛性质主要由转移矩阵决定,如何构造转移矩阵使得平稳分布是目标分布是基于马尔科夫链采样的关键。
(2)MH采样定理,指的是Metropolis-Hastings算法。
在采用MCMC方法时,马尔科夫链转移矩阵的构造至关重要,不同的构造方法,将产生不同的MCMC方法,目前常用的MCMC方法主要有两种:Gibbs抽样和Metropolis-Hastings算法,本实施例选用的是Metropolis-Hastings算法。
Metropolis算法是马尔科夫链蒙特卡罗的基石,假设存在一个稳态分布P(x),x是根据马尔科夫链得到的一个样本,依照等式(2)可以根据转移矩阵T(x(i-1)|x(i))和T(x(i)|x(i-1))来得到P(x(i))和P(x(i-1))的比值,进而按照一定的概率x(i)和x(i-1)这两个样本进行选择,通过大量的迭代进行采样,得到的样本满足P(x)。MH采样定理的内容如下:
(1)MH算法在参数空间随机取值,作为起始点x(0)。由参数的分布函数生成随机的参数x(1),按照这一系列参数的组合,计算当前点的概率密度。
(2)在[0,1]均匀分布中抽取一个随机数μt,依据当前点x(1)和起始点x(0)的概率密度比值是否大于μt来判断是否保留当前点。若当前点的接收概率大于μt,即μt≤r(x(0),x(1)),此时状态未接受状态,需要更新x(t+1)=x(1),否则令x(t+1)=x(0)。Metropolis-Hastings的接受概率r(x(i-1),x(i))应满足如下公式:
由上式可知,接受概率r(x(i-1),x(i))要取[0,1]之间的值。
实施例1
图1是本实施例的基于MCMC的办公室人员用能行为预测方法流程图。
办公室人员的用能行为具有一定的时间规律,用户一天的电气设备的启停与用户的用能行为习惯有关。本实施例通过分析办公室人员的设备开关状态数据,使用MCMC算法拟合用户设备启停的时间概率模型和工作时间模型,从而预测用户的用能行为,其具体过程如图1所示:
本实施例一种基于MCMC的办公室人员用能行为预测方法,包括:
S101:获取办公室中所有电气设备预设时间段内开关时间数据及工作时长数据。
办公建筑中用电设备种类繁多,本实施例以山东建筑大学被动实验楼为实验平台,采集实验办公室303用户的用电设备使用状态信息,挑选台式机、照明灯、饮水机共3种常见典型的办公室用电设备进行深入研究,采样周期为半年。
被动实验楼是室内电气物联网系统和公共基础设施系统组成的物联网建筑,本实施例通过室内电气物联网系统中的智能插座和智能开关采集用户室内台式机、照明灯、饮水机的设备运行数据,为人员行为识别提供大数据支撑。电气设备的选取依据兼顾了用户的拥有率、工作时间、测试容易性等。
选取实验人员的用电行为数据进行测试研究,通过对该用户房间内的台式机、照明灯、饮水机这3种典型办公室常用电气设备进行测试,获取三种电气设备的开关数据,采样间隔为1min,采样时间为半年,将其作为“原始数据集”。
其中,对原始数据的预处理主要有:时间处理、截取时间、去除零向量、补足数据、剔除异常值、新增数据列等,数据预处理流程如图2所示。
1)日期处理与时间对齐:数据集要严格要求每天的数据从00:00时刻开始,以1min为采样周期,以yyyy/m/d h:mm为时间格式进行日期处理。
2)截取时间:将时间数据以天为基本单位,截取每天从00:00到23:59时刻、长度为1440的数据值。判断数据是否完整,若有缺失值,则赋值上一状态。
3)去除零向量:去除一整天都没有运行工作的用电设备的开关数据。
4)剔除异常值:对于原始数据集中偶尔出现的数据异常值,通过拉伊达算法等提出异常值。
5)截取数据:通过分析设备每天动作的时间段,分别截取设备启动和停止时间段的设备运行数据,并为了算法的需要,补充一列递增数据。
其中,动作模型是指设备在给定时间内进入开机、关机状态的概率,动作持续时间模型是指用户设备用能持续时间的概率。由于时间是一个连续变量,确定整个后验分布比较困难,因此采取马尔科夫链蒙特卡罗(MCMC)研究其近似分布,获取数据分布的拟合曲线,通过Python编程实现模型的实验仿真。以台式机为例,具体介绍台式机的开关机时间模型和工作时长模型的训练过程。
S102:利用逻辑回归函数对电气设备的开关时间数据的后验概率分布进行建模,得到用电设备动作模型,利用MCMC算法对用电设备动作模型的参数进行随机采样,取所有样本值的平均值为用电设备动作模型参数的最优值,得到用户设备动作模型。
(1)函数模型选取
首先,使用Python导入算法所需的数据库,并将电脑的开机数据和关机数据可视化,通过观察该用户开关机时间历史数据的概率分布直方图,如图3(a)和图3(b)所示,选取开机时间段为6:00~9:00AM,关机时间段为2:00~5:00PM。
在执行MCMC采样之前,需要通过观察数据选取一个合适的函数来对电脑开关机时间的后验概率分布进行建模,通过大量实验最终选择逻辑回归(logistic)函数,基本的逻辑回归函数表达式为:
其中:P表示某时刻动作的概率;β为MCMC训练的参数;t动作为时间。
由上式可知,t→-∞,P(action|time)→0;t→+∞;P(action|time)→1,由于参数β未知,需要通过MCMC来设定,从而找到最大概率的β值,图4展示几个参数β值的逻辑回归函数。
如图4所示的不同参数β的基本逻辑回归函数存在一个问题,其转换的中心为0,不符合设备运行时刻的时间特性,如在台式机的开、关机数据中转换点分别为7:30AM和3:00PM左右,因此需要添加偏移值α来调整逻辑函数的位置,最终的表达式为:
其中,参数β影响曲线方向和陡峭程度,参数α影响位置,β和α是需要在MCMC过程中必须学习的两个模型参数,具有不同参数的logistic函数图像如图5所示。
(2)MCMC采样
MCMC采样是从参数的分布模型进行随机采样,为函数的参数(β和α)生成了无数个样本值,从而取所有样本值的平均值得到最优的近似值。对逻辑回归模型参数β和α的值进行建模,并假设其先验分布来自于正态分布或者高斯分布。其正态分布表示为:
其中:μ为正态分布的均值;τ为精度。精度显示函数的分布情况;均值μ决定了分布的位置。精度越高,表示数据越集中,因此变化越小,均值可以是正值或者负值,但精度必须是正值。对于参数β和α的先验分布中的μ或τ值,并没有任何假设,为了使β和α的可能性最大化,选取μ=0以及τ=0.01。可对参数β和α的正态先验分布的参数空间可视化,由图6(a)和图6(b)所示。
具体地,通过MCMC算法进行采样拟合,MCMC过程如下:
a.通过观察设备基于时间序列的开关状态分布,确定拟合的函数模型,确定需要训练的参数值,设置采样次数并赋予参数初始值准备采样。
b.假设参数的先验分布,通过搜索参数的分布空间进行Metropolis-Hastings随机采样,并利用马尔科夫特性,根据当前状态随机分配新的随机值给对应的参数。
c.检查新的随机值是否满足MH采样定理,若不满足,则拒绝这些值并返回到之前的状态;若满足,则接受这些值作为新的当前状态。
d.对指定的迭代次数重复步骤b和c。
该算法返回的是参数生成的所有值,将这些值的平均值用作函数中参数最可能的最终值。MCMC无法返回“真正”的值,而是返回分布的近似值。得到最优参数后,通过伯努利函数将观测数据与参数连接,从未计算设备动作时间的概率。
由图6(a)和图6(b)可知并不能尝试参数分布空间中的每个点,而是通过对从较高概率地区随机抽样,进而创建最可能的模型。本实施例设置的采样次数为5000,仿真得到参数β和α的采样轨迹和后验分布,如图7(a)-图7(h)所示。
(3)构建模型
基于以上准备工作,logistic函数可以表达台式机开关状态的转换,但是并不能确定模型参数β和α的值。因此,构建模型的目标在于确定参数的值,以最大可能地揭示出观察数据的分布规律。MCMC算法将对参数β和α采样,以得到给定数据下logistic函数最大可能性的参数值,数据观察从而通过伯努利变量连接到参数。
伯努利变量是一个离散的随机变量,可以是0或者1。本实施例将开关模型或者关机模型设置为一个伯努利变量,其中开机设为1,关机设为0。台式机开关机数据的伯努利变量取决于时间,可以通过逻辑回归函数定义,表达式为:
Si~Ber(p(ti)),i=1..N (7)
其中:p(ti)是具有时间自变量的逻辑回归函数,代表某时刻动作的概率。因此开、关机的概率应满足以下公式:
式(8)表示台式机开机时刻概率;式(9)表示关机时刻概率。MCMC的目标就是在使用数据集、假定正态先验分布的基础上找到参数β和α的值。由于数据的传播导致测量时存在不确定性,开机和关机的观察值存在相当大的重叠,不确定性也会更大,为了找到最可能的开、关机后验分布,此处取β和α样本的平均值,从而得到开机和关机的最大概率逻辑回归曲线,如图8(a)-图8(b)所示。
横坐标为时间,纵坐标为动作时间的概率,如图8(a)-图8(b)可知几乎每个时间点上是否开机都存在不确定性。这也表明MCMC得到的只是对事实数据的最近似估计,而无法得到真正的参数。
同时,也可以基于参数所有样本,对某个时间点上的后验分布绘制直方图,横坐标代表动作时刻的概率,纵坐标代表在散落在该时刻的样本数,如图9(a)-图9(f)所示。从而可以看出模型的不确定性,只能得到事实数据的最近似估计。
S103:根据用电设备工作时长数据,确定出用电设备工作时长数据概率分布对应的函数,构建出用电设备工作时长模型,利用MCMC算法在先验分布的参数分布中不断采样,取所有样本参数的平均值拟合用电设备工作时长模型。
基于用户开关机数据集,通过观察也可以得到一个模型来估计台式机工作时长。首先查看用户每天工作时长数据,确定哪个函数符合概率分布,本实施例采用设备工作时长分布表示为偏斜正态分布。通过MCMC算法获取偏斜正态分布中均值、方差、偏斜度三个参数的最优值,拟合用户使用台式机时长的最大概率值,其中,台式机工作时长模型建立的示意图如图10(a)-图10(c)所示。
S104:根据用电设备动作模型及用电设备工作时长模型,预测出办公室人员用能行为。
将训练的最优拟合函数与用户设备使用的真实值分布进行对比分析,通过MSE(Mean Square Error)均方误差公式,得到实验的误差值。以台式机开机模型为例,如图11所示。
MSE是真实值与预测值的差值的平方求和的平均值,通常被用做机器学习中线性回归的损失函数,如下式所示:
基于以上模型也可以得到关于用户使用台式机、照明灯、饮水机的动作和使用时长概率分布,如图12(a)-图12(b)所示。本实施例根据办公室用电设备1min间隔的开关状态分布,以及上述的MCMC算法,选取参数β和α所有采样值的均值作为最优参数值,从而得到用户用电行为时间概率拟合曲线,对于该用户台式机、照明灯、饮水机的使用状况,其结果表1所示。
表1设备模型最优参数结果
表2用户用能行为分析结果
由此可见,人员的用电行为习惯分析具有较高的时间依赖性,具有不确定性。本实施例通过选取大量的用户设备使用状态的实验数据,采用MCMC算法选取最优的参数值,采用的数据量越大,得到的结果越准确,具有较高的识别率。
本实施例基于某用户预设时间段的电气设备的使用数据,通过MCMC算法实现基于时间序列的用户用能行为分析的研究,得到了比较满意的识别结果。随着人工智能的出现,为人员行为分析提供技术支撑,识别率将会越来越准确。通过分析办公建筑办公室中人员用能行为,不仅能够为用户提供个性化管理、作为绩效评估的参考,同时也为建筑节能提供决策支持,为办公人员提供舒适、便捷、高效、绿色的工作环境。
实施例2
如图13所示,本实施例提供一种基于MCMC的办公室人员用能行为预测系统,其包括:
(1)数据获取模块,其用于获取办公室中所有电气设备预设时间段内开关时间数据及工作时长数据;
(2)动作模型构建及训练模块,其用于利用逻辑回归函数对电气设备的开关时间数据的后验概率分布进行建模,得到用电设备动作模型,利用MCMC算法对用电设备动作模型的参数进行随机采样,取所有样本值的平均值为用电设备动作模型参数的最优值,得到用户设备动作模型;
具体地,在所述动作模型构建及训练模块中,利用MCMC算法对用电设备动作模型的参数进行随机采样的过程为:
a.设置采样次数并赋予参数初始值准备采样;
b.假设参数的先验分布,通过搜索参数的分布空间进行Metropolis-Hastings随机采样,并利用马尔科夫特性,根据当前状态随机分配新的随机值给对应的参数;
c.检查新的随机值是否满足MH采样定理,若不满足,则拒绝这些值并返回到之前的状态;若满足,则接受这些值作为新的当前状态;
d.对指定的迭代次数,重复步骤b和c,直至达到预设设定的采样次数。
(3)工作时长模型构建及训练模块,其用于根据用电设备工作时长数据,确定出用电设备工作时长数据概率分布对应的函数,构建出用电设备工作时长模型,利用MCMC算法在先验分布的参数分布中不断采样,取所有样本参数的平均值拟合用电设备工作时长模型;
在所述工作时长模型构建及训练模块中,当用电设备工作时长模型为偏斜正态分布时,通过MCMC算法获取偏斜正态分布中均值、方差、偏斜度三个参数的最优值,拟合用户使用相应用电设备时长的最大概率值。
(4)用能行为预测模块,其用于根据用电设备动作模型及用电设备工作时长模型,预测出办公室人员用能行为。
在另一实施例中,基于MCMC的办公室人员用能行为预测系统,还包括:
预处理模块,其用于将获取的办公室中所有电气设备预设时间段内开关时间数据及工作时长数据作为原始数据,对原始数据进行预处理操作,以保证数据的完整及正确性。
实施例3
本实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如图1所示的基于MCMC的办公室人员用能行为预测方法中的步骤。
实施例4
本实施例提供一种计算机终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如图1所示的基于MCMC的办公室人员用能行为预测方法中的步骤。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (7)
1.一种基于MCMC的办公室人员用能行为预测方法,其特征在于,包括:
获取办公室中所有电气设备预设时间段内开关时间数据及工作时长数据;
利用逻辑回归函数对电气设备的开关时间数据的后验概率分布进行建模,得到用电设备动作模型,利用MCMC算法对用电设备动作模型的参数进行随机采样,取所有样本值的平均值为用电设备动作模型参数的最优值,得到用户设备动作模型;其中,用电设备动作模型是指用电设备在给定时间内进入开机或关机状态的概率;选择逻辑回归(logistic)函数来对电气设备开关机时间的后验概率分布进行建模,所述逻辑回归函数表达式为:
其中:P表示某时刻动作的概率;β为MCMC训练的参数;t为动作时间;α为偏移值;β和α为用电设备动作模型的参数,假设其先验分布来自于正态分布或者高斯分布;
根据用电设备工作时长数据,确定出用电设备工作时长数据概率分布对应的函数,构建出用电设备工作时长模型,利用MCMC算法在先验分布的参数分布中不断采样,取所有样本参数的平均值拟合用电设备工作时长模型;
其中,用电设备工作时长模型是指用电设备用能持续时间的概率;当用电设备工作时长模型为偏斜正态分布时,通过MCMC算法获取偏斜正态分布中均值、方差、偏斜度三个参数的最优值,拟合用户使用相应用电设备时长的最大概率值;
根据用电设备动作模型及用电设备工作时长模型,预测出办公室人员用能行为;
其中,利用MCMC算法对用电设备动作模型的参数进行随机采样的过程为:
a.设置采样次数并赋予参数初始值准备采样;
b.假设参数的先验分布,通过搜索参数的分布空间进行Metropolis-Hastings随机采样,并利用马尔科夫特性,根据当前状态随机分配新的随机值给对应的参数;
c.检查新的随机值是否满足Metropolis-Hastings随机采样要求,若不满足,则拒绝这些值并返回到之前的状态;若满足,则接受这些值作为新的当前状态;
d.对指定的迭代次数,重复步骤b和c,直至达到预先设定的采样次数。
2.如权利要求1所述的基于MCMC的办公室人员用能行为预测方法,其特征在于,还包括:
将获取的办公室中所有电气设备预设时间段内开关时间数据及工作时长数据作为原始数据,对原始数据进行预处理操作,以保证数据的完整及正确性。
3.如权利要求2所述的基于MCMC的办公室人员用能行为预测方法,其特征在于,对原始数据进行的预处理操作包括:日期处理与时间对齐、截取时间、去除零向量、补足数据、剔除异常值和新增数据列。
4.一种基于MCMC的办公室人员用能行为预测系统,其特征在于,包括:
数据获取模块,其用于获取办公室中所有电气设备预设时间段内开关时间数据及工作时长数据;
动作模型构建及训练模块,其用于利用逻辑回归函数对电气设备的开关时间数据的后验概率分布进行建模,得到用电设备动作模型,利用MCMC算法对用电设备动作模型的参数进行随机采样,取所有样本值的平均值为用电设备动作模型参数的最优值,得到用户设备动作模型;其中,用电设备动作模型是指用电设备在给定时间内进入开机或关机状态的概率;选择逻辑回归(logistic)函数来对电气设备开关机时间的后验概率分布进行建模,所述逻辑回归函数表达式为:
其中:P表示某时刻动作的概率;β为MCMC训练的参数;t为动作时间;α为偏移值;β和α为用电设备动作模型的参数,假设其先验分布来自于正态分布或者高斯分布;
工作时长模型构建及训练模块,其用于根据用电设备工作时长数据,确定出用电设备工作时长数据概率分布对应的函数,构建出用电设备工作时长模型,利用MCMC算法在先验分布的参数分布中不断采样,取所有样本参数的平均值拟合用电设备工作时长模型;
其中,用电设备工作时长模型是指用电设备用能持续时间的概率;当用电设备工作时长模型为偏斜正态分布时,通过MCMC算法获取偏斜正态分布中均值、方差、偏斜度三个参数的最优值,拟合用户使用相应用电设备时长的最大概率值;
用能行为预测模块,其用于根据用电设备动作模型及用电设备工作时长模型,预测出办公室人员用能行为;
其中,利用MCMC算法对用电设备动作模型的参数进行随机采样的过程为:
a.设置采样次数并赋予参数初始值准备采样;
b.假设参数的先验分布,通过搜索参数的分布空间进行Metropolis-Hastings随机采样,并利用马尔科夫特性,根据当前状态随机分配新的随机值给对应的参数;
c.检查新的随机值是否满足Metropolis-Hastings随机采样要求,若不满足,则拒绝这些值并返回到之前的状态;若满足,则接受这些值作为新的当前状态;
d.对指定的迭代次数,重复步骤b和c,直至达到预先设定的采样次数。
5.如权利要求4所述的基于MCMC的办公室人员用能行为预测系统,其特征在于,还包括:
预处理模块,其用于将获取的办公室中所有电气设备预设时间段内开关时间数据及工作时长数据作为原始数据,对原始数据进行预处理操作,以保证数据的完整及正确性。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一项所述的基于MCMC的办公室人员用能行为预测方法中的步骤。
7.一种计算机终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-3中任一项所述的基于MCMC的办公室人员用能行为预测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910744738.1A CN110490379B (zh) | 2019-08-13 | 2019-08-13 | 基于mcmc的办公室人员用能行为预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910744738.1A CN110490379B (zh) | 2019-08-13 | 2019-08-13 | 基于mcmc的办公室人员用能行为预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110490379A CN110490379A (zh) | 2019-11-22 |
CN110490379B true CN110490379B (zh) | 2021-11-23 |
Family
ID=68550996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910744738.1A Active CN110490379B (zh) | 2019-08-13 | 2019-08-13 | 基于mcmc的办公室人员用能行为预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110490379B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111950929A (zh) * | 2020-08-25 | 2020-11-17 | 上海逸迅信息科技有限公司 | 一种项目型任务的工作量均衡分配方法和设备 |
CN112507420B (zh) * | 2020-11-19 | 2022-12-27 | 同济大学 | 办公建筑内人员个性化环控行为预测模型训练集构建系统 |
CN113570207B (zh) * | 2021-07-09 | 2024-04-26 | 北京淇瑀信息科技有限公司 | 用户策略分配方法、装置及电子设备 |
CN114200829B (zh) * | 2021-11-09 | 2023-06-23 | 西北工业大学 | 一种超音速大机动靶标基于伪闭环的高精度速度控制方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014121147A1 (en) * | 2013-01-31 | 2014-08-07 | Betazi, Llc | Production analysis and/or forecasting methods, apparatus, and systems |
CN104483843A (zh) * | 2014-10-28 | 2015-04-01 | 天津大学 | 办公用能的预测方法 |
CN109146295A (zh) * | 2018-08-28 | 2019-01-04 | 国网湖南省电力有限公司 | 电网山火灾害故障的后验概率分布计算方法及系统 |
CN109214605A (zh) * | 2018-11-12 | 2019-01-15 | 国网山东省电力公司电力科学研究院 | 电力系统短期负荷概率预测方法、装置及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140310071A1 (en) * | 2013-03-13 | 2014-10-16 | Betazi, Llc | Physically-based financial analysis and/or forecasting methods, apparatus, and systems |
-
2019
- 2019-08-13 CN CN201910744738.1A patent/CN110490379B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014121147A1 (en) * | 2013-01-31 | 2014-08-07 | Betazi, Llc | Production analysis and/or forecasting methods, apparatus, and systems |
CN104483843A (zh) * | 2014-10-28 | 2015-04-01 | 天津大学 | 办公用能的预测方法 |
CN109146295A (zh) * | 2018-08-28 | 2019-01-04 | 国网湖南省电力有限公司 | 电网山火灾害故障的后验概率分布计算方法及系统 |
CN109214605A (zh) * | 2018-11-12 | 2019-01-15 | 国网山东省电力公司电力科学研究院 | 电力系统短期负荷概率预测方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110490379A (zh) | 2019-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110490379B (zh) | 基于mcmc的办公室人员用能行为预测方法及系统 | |
Kadhem et al. | Computational techniques for assessing the reliability and sustainability of electrical power systems: A review | |
Mocanu et al. | Deep learning for estimating building energy consumption | |
Jung et al. | Prediction of building energy consumption using an improved real coded genetic algorithm based least squares support vector machine approach | |
Truong et al. | Forecasting multi-appliance usage for smart home energy management | |
Dinesh et al. | Non-intrusive load monitoring under residential solar power influx | |
CN107480432B (zh) | 一种基于云平台的负荷分解方法 | |
CN109633301B (zh) | 基于量子遗传优化的非侵入式电器负荷识别方法 | |
Lee et al. | Appliance recognition and unattended appliance detection for energy conservation | |
Liu et al. | Heating load forecasting for combined heat and power plants via strand-based LSTM | |
Guo et al. | Low dimensional mid-term chaotic time series prediction by delay parameterized method | |
CN109002928A (zh) | 一种基于贝叶斯网络模型的电力负荷峰值预测方法和装置 | |
Zhai et al. | Analysis of dynamic appliance flexibility considering user behavior via non-intrusive load monitoring and deep user modeling | |
CN114119273A (zh) | 一种园区综合能源系统非侵入式负荷分解方法及系统 | |
CN114721345A (zh) | 基于强化学习的工业控制方法、装置、系统和电子设备 | |
Zhang et al. | Accurate ultra-short-term load forecasting based on load characteristic decomposition and convolutional neural network with bidirectional long short-term memory model | |
Xing et al. | Research of a novel combined deterministic and probabilistic forecasting system for air pollutant concentration | |
Wang et al. | A non-intrusive method of industrial load disaggregation based on load operating states and improved grey wolf algorithm | |
CN106529095A (zh) | 一种基于Matlab的光伏发电预测研究系统 | |
CN116467631A (zh) | 电力指纹识别模型训练方法、电力指纹识别方法及装置 | |
Wang et al. | Prediction of user behavior in smart home based on improved arima model | |
Li et al. | Agent-based optimisation systems for electrical load management | |
CN114646799A (zh) | 一种低采样率的非侵入式负荷监测方法及系统 | |
CN116050674B (zh) | 水利工程运行趋势预测方法以及装置 | |
CN116722545B (zh) | 基于多源数据的光伏发电预测方法和相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |