CN117435676A

CN117435676A - 基于子序列挖掘与有向加权图聚类的建筑能源管理方法

Info

Publication number: CN117435676A
Application number: CN202310858448.6A
Authority: CN
Inventors: 马斌; 高海洋; 郑馨怡; 桂帆; 王昱婷; 徐琼璟; 端凌立; 张若微; 张瑶; 张汀荟; 范庆华; 陈庭记; 杨莲; 刘永生; 朱海超; 蔡可庆; 王艳巧; 陈雪薇
Original assignee: Nanjing Electric Power Design And Research Institute Co ltd
Current assignee: Nanjing Electric Power Design And Research Institute Co ltd
Priority date: 2023-07-13
Filing date: 2023-07-13
Publication date: 2024-01-23
Anticipated expiration: 2043-07-13
Also published as: CN117435676B

Abstract

本发明公开了一种基于子序列挖掘与有向加权图聚类的建筑能源管理方法，该方法包括以下步骤：对负载数据进行预处理；将时间序列分段为子序列，并提取子序列特征得到符号数据；将符号数据建模为有向加权图，用图表示子序列；进行准完全连通子图聚类，得到聚类子图；基于聚类结果，计算建筑能耗的稳定性，并识别非典型能耗模式。本发明通过时间序列子序列挖掘提取有关负载消耗模式的重要内容，有助于构建能源管理系统；将住宅建筑负载数据上的子序列聚类表述为有向加权图上的图聚类问题，捕捉了子序列之间的时间依赖性和相似性。

Description

基于子序列挖掘与有向加权图聚类的建筑能源管理方法

技术领域

本发明涉及数据挖掘及图聚类的技术领域，尤其涉及基于子序列挖掘与有向加权图聚类的建筑能源管理方法。

背景技术

建筑的能源消耗占全球能源使用量的近三分之一，控制建筑物的运作方式有助于开发高效的生态友好型智能能源系统。随着高级计量基础设施的安装及智能仪表等测量技术在住宅等建筑中的应用，大量的负载数据提供了分析不同的建筑负载模式如何协助解决电力系统操作的各种问题的机会。通过数据挖掘，能够分析负载概况以确定适合采用需求响应计划的能耗模式。

但是，现有的聚类能源管理方法仅考虑了子序列之间基于形状或特征的相似性，而忽略了子序列之间的复杂时间依赖性，成对相似度计算方法也不可扩展到大型的时间序列数据集。

因此，亟需基于子序列挖掘与有向加权图聚类的建筑能源管理方法的解决上述问题。

发明内容

本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊，而这种简化或省略不能用于限制本发明的范围。

鉴于上述现有建筑能源管理方法存在的问题，提出了本发明。

为解决上述技术问题，本发明提供如下技术方案：

基于子序列挖掘与有向加权图聚类的建筑能源管理方法，该方法包括以下步骤：

步骤一：对负载数据进行预处理；

步骤二：将时间序列分段为子序列，并提取子序列特征得到符号数据；

步骤三：将符号数据建模为有向加权图，用图表示子序列；

步骤四：进行准完全连通子图聚类，得到聚类子图；

步骤五：基于聚类结果，计算建筑能耗的稳定性，并识别非典型能耗模式。

作为本发明所述基于子序列挖掘与有向加权图聚类的建筑能源管理方法的一种优选方案，其中：所述步骤一中的具体方法为：

S1：收集n个建筑样本在m个时间序列上的负载数据集，得到T＝R^m×n的负载数据矩阵；

S2：对数据的预处理包括调整缺失值、删除重复值和标准化；

其中，使用线性插值来估算缺失值，对重复值的处理可以选择删去或用平均值代替，最后将数据标准化。

作为本发明所述基于子序列挖掘与有向加权图聚类的建筑能源管理方法的一种优选方案，其中：对时间序列数据集进行处理后，将时间序列t_i分割成等长的、不重叠的子序列，子序列的长度为l，对于n个建筑样本，得到的子序列数量q＝n/l；

将子序列用符号表示，使用时间序列符号聚合近似进行降维编码，时间序列具有高负荷持续时间、上升时间、下降时间、均值、斜率、极差等特征，本方法选取均值、斜率、极差表示子序列的趋势和峰值；

将每个时间序列t_i标准化，并将其分段聚合近似表示为；标准化的时间序列具有高斯分布，能够实现时间序列的离散化；求取使得高斯分布被划分成任意数量等概率区间的断点序列B，通过断点序列B和分段聚合近似序列值/>完成SAX符号化；

并通过符号表示算法，输出原始时间序列数据集T的符号数据

作为本发明所述基于子序列挖掘与有向加权图聚类的建筑能源管理方法的一种优选方案，其中：所述步骤三中，为了提取时间序列数据集的相似子序列组并保持子序列出现的时间顺序，将符号数据建模为有向加权图G(V,E)；

其中，具有相同符号的子序列表示相似的模式，因此提取在符号数据中的独特符号，通过映射函数将其映射成有向加权图G的顶点和边；

为了获取两个连续符号之间的距离，使用修正的SAX距离计算两个子序列之间的距离

其中，其中max(α_r)、min(α_c)分别是字符串α_r的第r个元素、字符串α_c的第c个元素对应区域的最大值、最小值，dist(.，.)可以使用表查找来实现，表的行与列代表SAX字母表的字母，q个子序列的距离SD(.，.)的总和是两个时间序列之间修正后的SAX距离。

作为本发明所述基于子序列挖掘与有向加权图聚类的建筑能源管理方法的一种优选方案，其中：所述步骤四中，在构造图之后，使用基于准完全连通子图的聚类方法，提出具有标准化边权重的有向加权图的ψ-准完全连通子图；

通过贪婪图聚类算法使有向加权图G中的每一个聚类都是最大ψ-准完全连通子图：首先，计算有向加权图G的顶点v_i的权重W(v_i)；以权重作为优先级对顶点进行非递增顺序排列，得到优先级队列Q；从队列Q中选择权重最高的顶点，将其包含并形成一个独立聚类s_i，在每次迭代中，选择顶点权重次高于s_i的顶点权重的聚类作为s_j，使s_i与s_j相邻；当满足以下两点条件时，合并聚类s_i和s_j，得到新的子图new_s_i：

条件1：新子图new_s_i应该形成一个弱连通体，以确保顶点之间的最小连通性；

条件2：新子图应该满足条件ψ(new_s_i)≥ψ_min，其中

其中，z＝|new_s_i|，是子图new_s_i的顶点数，参数ψ_min决定了聚类的质量；

重复迭代，直到s_i不能再合并为止，最终形成一个最大的ψ-准完全连通子图。对于其他不属于s_i的所有顶点，重复上述步骤，最终算法返回一组子图S_G，它是图G的最大的ψ-准完全连通子图。

作为本发明所述基于子序列挖掘与有向加权图聚类的建筑能源管理方法的一种优选方案，其中：所述步骤五中，将聚类结果应用到需求响应程序，测量建筑负载稳定性，遵循一致负载模式的建筑，被认为是稳定的，适合实施需求响应程序和节能计划，聚焦峰值负载转移以及减少日常消耗；

假设一个聚类集使用熵来测量一个建筑物t_j的稳定性得分，熵越低，建筑物具有更高的稳定性：

其中，时间变化函数当子序列/>的聚类标签为s_i时，否则为0。

作为本发明所述基于子序列挖掘与有向加权图聚类的建筑能源管理方法的一种优选方案，其中：所述步骤五中，识别非典型模式有助于设计准确的负载预测模型；使用基于图的分析方法从时间序列数据集中发现非典型模式，关键是检查有向加权图G中符号的出现频率和顶点的度；顶点的度捕获了时间依赖的独特模式的数量，度较低的顶点在时间序列数据集中出现的频率最小，只有少数时间依赖模式；根据顶点的度分布决定阈值vd，基于阈值vd分隔低度顶点，并将被分隔的顶点的代表模式作为非典型模式。

本发明的有益效果：

1、本发明通过时间序列子序列挖掘提取有关负载消耗模式的重要内容，有助于构建能源管理系统；将住宅建筑负载数据上的子序列聚类表述为有向加权图上的图聚类问题，捕捉了子序列之间的时间依赖性和相似性；

2、通过数据处理、分段与符号表示、图表示、准完全连通子图聚类等过程，使用图聚类算法得到了时间序列子序列的子图聚类，揭示了建筑物的能耗模式及其出现时间；通过稠密子图挖掘进一步获得标记子序列，识别了连续发生和非典型的能耗模式；测量了建筑物稳定性，根据其在需求响应程序和负载转移操作中的适用性对建筑进行排名；

3、本发明提出的准完全连通子图聚类通过改变稳定建筑的能耗模式，转移峰值负载，能够减少高峰时段的用电量。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。其中：

图1为本发明提出的基于子序列挖掘与有向加权图聚类的建筑能源管理方法的流程图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合说明书附图对本发明的具体实施方式做详细的说明。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。

其次，此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例，也不是单独的或选择性的与其他实施例互相排斥的实施例。

参照图1，为本发明的一个实施例，提供了基于子序列挖掘与有向加权图聚类的建筑能源管理方法，此方法包括以下步骤：

步骤一：对负载数据进行预处理；

步骤三：将符号数据建模为有向加权图，用图表示子序列；

步骤四：进行准完全连通子图聚类，得到聚类子图；

需要对每个步骤进行详细的说明，具体来说：

步骤一中，在收集n个建筑样本在m个时间序列上的负载数据集，得到T＝R^m×n的负载数据矩阵；然后对数据的预处理包括调整缺失值、删除重复值和标准化；其中，使用线性插值来估算缺失值，对重复值的处理可以选择删去或用平均值代替，最后将数据标准化；

步骤二中，对时间序列数据集进行处理后，将时间序列t_i分割成等长的、不重叠的子序列，子序列的长度为l，对于n个建筑样本，得到的子序列数量q＝n/l，这里分段子序列的长度l的选取对子序列分析起到重要作用：太高的l值可能导致信息丢失，太低的l值可能产生许多独特的编码、导致无法发现子序列之间的共同模式。

将子序列用符号表示，使用时间序列符号聚合近似进行降维编码(Symbolicaggregate approximation，SAX)，时间序列具有高负荷持续时间、上升时间、下降时间、均值、斜率、极差等特征，提取均值、斜率、极差三个特征来表示、获取子序列的趋势和峰值；

将每个时间序列t_i标准化，并将其分段聚合近似(Piecewise AggregateApproximation，PAA)表示为；标准化的时间序列/>具有高斯分布，能够实现时间序列的离散化；求取使得高斯分布被划分成任意数量等概率区间的断点序列B，通过断点序列B和分段聚合近似序列值/>完成SAX符号化；

并通过符号表示算法，输出原始时间序列数据集T的符号数据

步骤三中，步骤三中，为了提取时间序列数据集的相似子序列组并保持子序列出现的时间顺序，将符号数据建模为有向加权图G(V，E)；

步骤四中，在构造图之后，使用基于准完全连通子图的聚类方法，提出具有标准化边权重的有向加权图的ψ-准完全连通子图(ψ-quasi clique)，该子图是弱连通体(weaklyconnected component，WCC)，能够保留由顶点表示的模式出现的时间顺序，同时能够确保每个γ-准完全连通子图是密集的；

条件2：新子图new_s_i应该满足条件ψ(new_s_i)≥ψ_min，其中

重复迭代，直到s_i不能再合并为止，最终形成一个最大的ψ-准完全连通子图。对于其他不属于s_i的所有顶点，重复上述步骤，最终算法返回一组子图S_G，它是图G的最大的ψ-准完全连通子图；

步骤五中，将聚类结果应用到需求响应程序，一方面是测量建筑负载稳定性。需求响应程序的目的是将某些负载转移到非峰值时间，从而减少峰值负载。遵循一致负载模式的建筑，被认为是稳定的，适合实施需求响应程序和节能计划，聚焦峰值负载转移以及减少日常消耗；

其中，时间变化函数当子序列/>的聚类标签为s_i时，否则为0；

另一方面识别非典型能耗模式。与大多数消耗模式不同，非典型模式本质上是不规律的，表现为跟随有最小数目的其他唯一模式的子序列。识别非典型模式有助于设计准确的负载预测模型，本文使用图聚类分析方法来从整个时间序列数据集中发现非典型模式，其关键是检查有向加权图G中符号的出现频率和顶点的度；顶点的度捕获了时间依赖的独特模式的数量，度较低的顶点在时间序列数据集中出现的频率最小，只有少数时间依赖模式；根据顶点的度分布决定阈值vd，基于阈值vd分隔低度顶点，并将被分隔的顶点的代表模式作为非典型模式。

综上，本发明通过时间序列子序列挖掘提取有关负载消耗模式的重要内容，有助于构建能源管理系统；将住宅建筑负载数据上的子序列聚类表述为有向加权图上的图聚类问题，捕捉了子序列之间的时间依赖性和相似性；通过数据处理、分段与符号表示、图表示、准完全连通子图聚类等过程，使用图聚类算法得到了时间序列子序列的子图聚类，揭示了建筑物的能耗模式及其出现时间；通过稠密子图挖掘进一步获得标记子序列，识别了连续发生和非典型的能耗模式；测量了建筑物稳定性，根据其在需求响应程序和负载转移操作中的适用性对建筑进行排名，本发明提出的准完全连通子图聚类通过改变稳定建筑的能耗模式，转移峰值负载，能够减少高峰时段的用电量。

应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.基于子序列挖掘与有向加权图聚类的建筑能源管理方法，其特征在于，该方法包括以下步骤：

步骤一：对负载数据进行预处理；

步骤三：将符号数据建模为有向加权图，用图表示子序列；

步骤四：进行准完全连通子图聚类，得到聚类子图；

2.根据权利要求1所述的基于子序列挖掘与有向加权图聚类的建筑能源管理方法，其特征在于：所述步骤一中的具体方法为：

3.根据权利要求2所述的基于子序列挖掘与有向加权图聚类的建筑能源管理方法，其特征在于：所述步骤二中，对时间序列数据集进行处理后，将时间序列t_i分割成等长的、不重叠的子序列，子序列的长度为l，对于n个建筑样本，得到的子序列数量q＝n/l；

将每个时间序列t_i标准化，并将其分段聚合近似表示为标准化的时间序列具有高斯分布，能够实现时间序列的离散化；求取使得高斯分布被划分成任意数量等概率区间的断点序列B，通过断点序列B和分段聚合近似序列值/>完成SAX符号化；并通过符号表示算法，输出原始时间序列数据集T的符号数据/>

4.根据权利要求3所述的基于子序列挖掘与有向加权图聚类的建筑能源管理方法，其特征在于：所述步骤三中，为了提取时间序列数据集的相似子序列组并保持子序列出现的时间顺序，将符号数据建模为有向加权图G(V,E)；

其中，其中max(α_r)、min(α_c)分别是字符串α_r的第r个元素、字符串α_c的第c个元素对应区域的最大值、最小值，dist(.,.)可以使用表查找来实现，表的行与列代表SAX字母表的字母，q个子序列的距离SD(.,.)的总和是两个时间序列之间修正后的SAX距离。

5.根据权利要求4所述的基于子序列挖掘与有向加权图聚类的建筑能源管理方法，其特征在于：所述步骤四中，在构造图之后，使用基于准完全连通子图的聚类方法，提出具有标准化边权重的有向加权图的ψ-准完全连通子图；

条件2：新子图new_s_i应该满足条件ψ(new_s_i)≥ψ_min，其中

6.根据权利要求5所述的基于子序列挖掘与有向加权图聚类的建筑能源管理方法，其特征在于：所述步骤五中，将聚类结果应用到需求响应程序，测量建筑负载稳定性，遵循一致负载模式的建筑，被认为是稳定的，适合实施需求响应程序和节能计划，聚焦峰值负载转移以及减少日常消耗；

7.根据权利要求1-6任一项所述的基于子序列挖掘与有向加权图聚类的建筑能源管理方法，其特征在于：所述步骤五中，识别非典型模式有助于设计准确的负载预测模型；使用基于图的分析方法从时间序列数据集中发现非典型模式，关键是检查有向加权图G中符号的出现频率和顶点的度；顶点的度捕获了时间依赖的独特模式的数量，度较低的顶点在时间序列数据集中出现的频率最小，只有少数时间依赖模式；根据顶点的度分布决定阈值vd，基于阈值vd分隔低度顶点，并将被分隔的顶点的代表模式作为非典型模式。