CN117435676A - 基于子序列挖掘与有向加权图聚类的建筑能源管理方法 - Google Patents
基于子序列挖掘与有向加权图聚类的建筑能源管理方法 Download PDFInfo
- Publication number
- CN117435676A CN117435676A CN202310858448.6A CN202310858448A CN117435676A CN 117435676 A CN117435676 A CN 117435676A CN 202310858448 A CN202310858448 A CN 202310858448A CN 117435676 A CN117435676 A CN 117435676A
- Authority
- CN
- China
- Prior art keywords
- weighted graph
- subsequence
- time
- directed weighted
- energy management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007726 management method Methods 0.000 title claims abstract description 31
- 238000005065 mining Methods 0.000 title claims abstract description 26
- 238000005265 energy consumption Methods 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000000034 method Methods 0.000 claims description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 230000004044 response Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 6
- 230000036962 time dependent Effects 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 4
- 230000001174 ascending effect Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 238000013506 data mapping Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000000630 rising effect Effects 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 230000002776 aggregation Effects 0.000 claims description 2
- 238000004220 aggregation Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 abstract description 5
- 239000000284 extract Substances 0.000 abstract description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000007418 data mining Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2323—Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Discrete Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Computation (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于子序列挖掘与有向加权图聚类的建筑能源管理方法,该方法包括以下步骤:对负载数据进行预处理;将时间序列分段为子序列,并提取子序列特征得到符号数据;将符号数据建模为有向加权图,用图表示子序列;进行准完全连通子图聚类,得到聚类子图;基于聚类结果,计算建筑能耗的稳定性,并识别非典型能耗模式。本发明通过时间序列子序列挖掘提取有关负载消耗模式的重要内容,有助于构建能源管理系统;将住宅建筑负载数据上的子序列聚类表述为有向加权图上的图聚类问题,捕捉了子序列之间的时间依赖性和相似性。
Description
技术领域
本发明涉及数据挖掘及图聚类的技术领域,尤其涉及基于子序列挖掘与有向加权图聚类的建筑能源管理方法。
背景技术
建筑的能源消耗占全球能源使用量的近三分之一,控制建筑物的运作方式有助于开发高效的生态友好型智能能源系统。随着高级计量基础设施的安装及智能仪表等测量技术在住宅等建筑中的应用,大量的负载数据提供了分析不同的建筑负载模式如何协助解决电力系统操作的各种问题的机会。通过数据挖掘,能够分析负载概况以确定适合采用需求响应计划的能耗模式。
但是,现有的聚类能源管理方法仅考虑了子序列之间基于形状或特征的相似性,而忽略了子序列之间的复杂时间依赖性,成对相似度计算方法也不可扩展到大型的时间序列数据集。
因此,亟需基于子序列挖掘与有向加权图聚类的建筑能源管理方法的解决上述问题。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有建筑能源管理方法存在的问题,提出了本发明。
为解决上述技术问题,本发明提供如下技术方案:
基于子序列挖掘与有向加权图聚类的建筑能源管理方法,该方法包括以下步骤:
步骤一:对负载数据进行预处理;
步骤二:将时间序列分段为子序列,并提取子序列特征得到符号数据;
步骤三:将符号数据建模为有向加权图,用图表示子序列;
步骤四:进行准完全连通子图聚类,得到聚类子图;
步骤五:基于聚类结果,计算建筑能耗的稳定性,并识别非典型能耗模式。
作为本发明所述基于子序列挖掘与有向加权图聚类的建筑能源管理方法的一种优选方案,其中:所述步骤一中的具体方法为:
S1:收集n个建筑样本在m个时间序列上的负载数据集,得到T=Rm×n的负载数据矩阵;
S2:对数据的预处理包括调整缺失值、删除重复值和标准化;
其中,使用线性插值来估算缺失值,对重复值的处理可以选择删去或用平均值代替,最后将数据标准化。
作为本发明所述基于子序列挖掘与有向加权图聚类的建筑能源管理方法的一种优选方案,其中:对时间序列数据集进行处理后,将时间序列ti分割成等长的、不重叠的子序列,子序列的长度为l,对于n个建筑样本,得到的子序列数量q=n/l;
将子序列用符号表示,使用时间序列符号聚合近似进行降维编码,时间序列具有高负荷持续时间、上升时间、下降时间、均值、斜率、极差等特征,本方法选取均值、斜率、极差表示子序列的趋势和峰值;
将每个时间序列ti标准化,并将其分段聚合近似表示为;标准化的时间序列具有高斯分布,能够实现时间序列的离散化;求取使得高斯分布被划分成任意数量等概率区间的断点序列B,通过断点序列B和分段聚合近似序列值/>完成SAX符号化;
并通过符号表示算法,输出原始时间序列数据集T的符号数据
作为本发明所述基于子序列挖掘与有向加权图聚类的建筑能源管理方法的一种优选方案,其中:所述步骤三中,为了提取时间序列数据集的相似子序列组并保持子序列出现的时间顺序,将符号数据建模为有向加权图G(V,E);
其中,具有相同符号的子序列表示相似的模式,因此提取在符号数据中的独特符号,通过映射函数将其映射成有向加权图G的顶点和边;
为了获取两个连续符号之间的距离,使用修正的SAX距离计算两个子序列之间的距离
其中,其中max(αr)、min(αc)分别是字符串αr的第r个元素、字符串αc的第c个元素对应区域的最大值、最小值,dist(.,.)可以使用表查找来实现,表的行与列代表SAX字母表的字母,q个子序列的距离SD(.,.)的总和是两个时间序列之间修正后的SAX距离。
作为本发明所述基于子序列挖掘与有向加权图聚类的建筑能源管理方法的一种优选方案,其中:所述步骤四中,在构造图之后,使用基于准完全连通子图的聚类方法,提出具有标准化边权重的有向加权图的ψ-准完全连通子图;
通过贪婪图聚类算法使有向加权图G中的每一个聚类都是最大ψ-准完全连通子图:首先,计算有向加权图G的顶点vi的权重W(vi);以权重作为优先级对顶点进行非递增顺序排列,得到优先级队列Q;从队列Q中选择权重最高的顶点,将其包含并形成一个独立聚类si,在每次迭代中,选择顶点权重次高于si的顶点权重的聚类作为sj,使si与sj相邻;当满足以下两点条件时,合并聚类si和sj,得到新的子图new_si:
条件1:新子图new_si应该形成一个弱连通体,以确保顶点之间的最小连通性;
条件2:新子图应该满足条件ψ(new_si)≥ψmin,其中
其中,z=|new_si|,是子图new_si的顶点数,参数ψmin决定了聚类的质量;
重复迭代,直到si不能再合并为止,最终形成一个最大的ψ-准完全连通子图。对于其他不属于si的所有顶点,重复上述步骤,最终算法返回一组子图SG,它是图G的最大的ψ-准完全连通子图。
作为本发明所述基于子序列挖掘与有向加权图聚类的建筑能源管理方法的一种优选方案,其中:所述步骤五中,将聚类结果应用到需求响应程序,测量建筑负载稳定性,遵循一致负载模式的建筑,被认为是稳定的,适合实施需求响应程序和节能计划,聚焦峰值负载转移以及减少日常消耗;
假设一个聚类集使用熵来测量一个建筑物tj的稳定性得分,熵越低,建筑物具有更高的稳定性:
其中,时间变化函数当子序列/>的聚类标签为si时,否则为0。
作为本发明所述基于子序列挖掘与有向加权图聚类的建筑能源管理方法的一种优选方案,其中:所述步骤五中,识别非典型模式有助于设计准确的负载预测模型;使用基于图的分析方法从时间序列数据集中发现非典型模式,关键是检查有向加权图G中符号的出现频率和顶点的度;顶点的度捕获了时间依赖的独特模式的数量,度较低的顶点在时间序列数据集中出现的频率最小,只有少数时间依赖模式;根据顶点的度分布决定阈值vd,基于阈值vd分隔低度顶点,并将被分隔的顶点的代表模式作为非典型模式。
本发明的有益效果:
1、本发明通过时间序列子序列挖掘提取有关负载消耗模式的重要内容,有助于构建能源管理系统;将住宅建筑负载数据上的子序列聚类表述为有向加权图上的图聚类问题,捕捉了子序列之间的时间依赖性和相似性;
2、通过数据处理、分段与符号表示、图表示、准完全连通子图聚类等过程,使用图聚类算法得到了时间序列子序列的子图聚类,揭示了建筑物的能耗模式及其出现时间;通过稠密子图挖掘进一步获得标记子序列,识别了连续发生和非典型的能耗模式;测量了建筑物稳定性,根据其在需求响应程序和负载转移操作中的适用性对建筑进行排名;
3、本发明提出的准完全连通子图聚类通过改变稳定建筑的能耗模式,转移峰值负载,能够减少高峰时段的用电量。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明提出的基于子序列挖掘与有向加权图聚类的建筑能源管理方法的流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
参照图1,为本发明的一个实施例,提供了基于子序列挖掘与有向加权图聚类的建筑能源管理方法,此方法包括以下步骤:
步骤一:对负载数据进行预处理;
步骤二:将时间序列分段为子序列,并提取子序列特征得到符号数据;
步骤三:将符号数据建模为有向加权图,用图表示子序列;
步骤四:进行准完全连通子图聚类,得到聚类子图;
步骤五:基于聚类结果,计算建筑能耗的稳定性,并识别非典型能耗模式。
需要对每个步骤进行详细的说明,具体来说:
步骤一中,在收集n个建筑样本在m个时间序列上的负载数据集,得到T=Rm×n的负载数据矩阵;然后对数据的预处理包括调整缺失值、删除重复值和标准化;其中,使用线性插值来估算缺失值,对重复值的处理可以选择删去或用平均值代替,最后将数据标准化;
步骤二中,对时间序列数据集进行处理后,将时间序列ti分割成等长的、不重叠的子序列,子序列的长度为l,对于n个建筑样本,得到的子序列数量q=n/l,这里分段子序列的长度l的选取对子序列分析起到重要作用:太高的l值可能导致信息丢失,太低的l值可能产生许多独特的编码、导致无法发现子序列之间的共同模式。
将子序列用符号表示,使用时间序列符号聚合近似进行降维编码(Symbolicaggregate approximation,SAX),时间序列具有高负荷持续时间、上升时间、下降时间、均值、斜率、极差等特征,提取均值、斜率、极差三个特征来表示、获取子序列的趋势和峰值;
将每个时间序列ti标准化,并将其分段聚合近似(Piecewise AggregateApproximation,PAA)表示为;标准化的时间序列/>具有高斯分布,能够实现时间序列的离散化;求取使得高斯分布被划分成任意数量等概率区间的断点序列B,通过断点序列B和分段聚合近似序列值/>完成SAX符号化;
并通过符号表示算法,输出原始时间序列数据集T的符号数据
步骤三中,步骤三中,为了提取时间序列数据集的相似子序列组并保持子序列出现的时间顺序,将符号数据建模为有向加权图G(V,E);
其中,具有相同符号的子序列表示相似的模式,因此提取在符号数据中的独特符号,通过映射函数将其映射成有向加权图G的顶点和边;
为了获取两个连续符号之间的距离,使用修正的SAX距离计算两个子序列之间的距离
其中,其中max(αr)、min(αc)分别是字符串αr的第r个元素、字符串αc的第c个元素对应区域的最大值、最小值,dist(.,.)可以使用表查找来实现,表的行与列代表SAX字母表的字母,q个子序列的距离SD(.,.)的总和是两个时间序列之间修正后的SAX距离。
步骤四中,在构造图之后,使用基于准完全连通子图的聚类方法,提出具有标准化边权重的有向加权图的ψ-准完全连通子图(ψ-quasi clique),该子图是弱连通体(weaklyconnected component,WCC),能够保留由顶点表示的模式出现的时间顺序,同时能够确保每个γ-准完全连通子图是密集的;
通过贪婪图聚类算法使有向加权图G中的每一个聚类都是最大ψ-准完全连通子图:首先,计算有向加权图G的顶点vi的权重W(vi);以权重作为优先级对顶点进行非递增顺序排列,得到优先级队列Q;从队列Q中选择权重最高的顶点,将其包含并形成一个独立聚类si,在每次迭代中,选择顶点权重次高于si的顶点权重的聚类作为sj,使si与sj相邻;当满足以下两点条件时,合并聚类si和sj,得到新的子图new_si:
条件1:新子图new_si应该形成一个弱连通体,以确保顶点之间的最小连通性;
条件2:新子图new_si应该满足条件ψ(new_si)≥ψmin,其中
其中,z=|new_si|,是子图new_si的顶点数,参数ψmin决定了聚类的质量;
重复迭代,直到si不能再合并为止,最终形成一个最大的ψ-准完全连通子图。对于其他不属于si的所有顶点,重复上述步骤,最终算法返回一组子图SG,它是图G的最大的ψ-准完全连通子图;
步骤五中,将聚类结果应用到需求响应程序,一方面是测量建筑负载稳定性。需求响应程序的目的是将某些负载转移到非峰值时间,从而减少峰值负载。遵循一致负载模式的建筑,被认为是稳定的,适合实施需求响应程序和节能计划,聚焦峰值负载转移以及减少日常消耗;
假设一个聚类集使用熵来测量一个建筑物tj的稳定性得分,熵越低,建筑物具有更高的稳定性:
其中,时间变化函数当子序列/>的聚类标签为si时,否则为0;
另一方面识别非典型能耗模式。与大多数消耗模式不同,非典型模式本质上是不规律的,表现为跟随有最小数目的其他唯一模式的子序列。识别非典型模式有助于设计准确的负载预测模型,本文使用图聚类分析方法来从整个时间序列数据集中发现非典型模式,其关键是检查有向加权图G中符号的出现频率和顶点的度;顶点的度捕获了时间依赖的独特模式的数量,度较低的顶点在时间序列数据集中出现的频率最小,只有少数时间依赖模式;根据顶点的度分布决定阈值vd,基于阈值vd分隔低度顶点,并将被分隔的顶点的代表模式作为非典型模式。
综上,本发明通过时间序列子序列挖掘提取有关负载消耗模式的重要内容,有助于构建能源管理系统;将住宅建筑负载数据上的子序列聚类表述为有向加权图上的图聚类问题,捕捉了子序列之间的时间依赖性和相似性;通过数据处理、分段与符号表示、图表示、准完全连通子图聚类等过程,使用图聚类算法得到了时间序列子序列的子图聚类,揭示了建筑物的能耗模式及其出现时间;通过稠密子图挖掘进一步获得标记子序列,识别了连续发生和非典型的能耗模式;测量了建筑物稳定性,根据其在需求响应程序和负载转移操作中的适用性对建筑进行排名,本发明提出的准完全连通子图聚类通过改变稳定建筑的能耗模式,转移峰值负载,能够减少高峰时段的用电量。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (7)
1.基于子序列挖掘与有向加权图聚类的建筑能源管理方法,其特征在于,该方法包括以下步骤:
步骤一:对负载数据进行预处理;
步骤二:将时间序列分段为子序列,并提取子序列特征得到符号数据;
步骤三:将符号数据建模为有向加权图,用图表示子序列;
步骤四:进行准完全连通子图聚类,得到聚类子图;
步骤五:基于聚类结果,计算建筑能耗的稳定性,并识别非典型能耗模式。
2.根据权利要求1所述的基于子序列挖掘与有向加权图聚类的建筑能源管理方法,其特征在于:所述步骤一中的具体方法为:
S1:收集n个建筑样本在m个时间序列上的负载数据集,得到T=Rm×n的负载数据矩阵;
S2:对数据的预处理包括调整缺失值、删除重复值和标准化;
其中,使用线性插值来估算缺失值,对重复值的处理可以选择删去或用平均值代替,最后将数据标准化。
3.根据权利要求2所述的基于子序列挖掘与有向加权图聚类的建筑能源管理方法,其特征在于:所述步骤二中,对时间序列数据集进行处理后,将时间序列ti分割成等长的、不重叠的子序列,子序列的长度为l,对于n个建筑样本,得到的子序列数量q=n/l;
将子序列用符号表示,使用时间序列符号聚合近似进行降维编码,时间序列具有高负荷持续时间、上升时间、下降时间、均值、斜率、极差等特征,本方法选取均值、斜率、极差表示子序列的趋势和峰值;
将每个时间序列ti标准化,并将其分段聚合近似表示为标准化的时间序列具有高斯分布,能够实现时间序列的离散化;求取使得高斯分布被划分成任意数量等概率区间的断点序列B,通过断点序列B和分段聚合近似序列值/>完成SAX符号化;并通过符号表示算法,输出原始时间序列数据集T的符号数据/>
4.根据权利要求3所述的基于子序列挖掘与有向加权图聚类的建筑能源管理方法,其特征在于:所述步骤三中,为了提取时间序列数据集的相似子序列组并保持子序列出现的时间顺序,将符号数据建模为有向加权图G(V,E);
其中,具有相同符号的子序列表示相似的模式,因此提取在符号数据中的独特符号,通过映射函数将其映射成有向加权图G的顶点和边;
为了获取两个连续符号之间的距离,使用修正的SAX距离计算两个子序列之间的距离
其中,其中max(αr)、min(αc)分别是字符串αr的第r个元素、字符串αc的第c个元素对应区域的最大值、最小值,dist(.,.)可以使用表查找来实现,表的行与列代表SAX字母表的字母,q个子序列的距离SD(.,.)的总和是两个时间序列之间修正后的SAX距离。
5.根据权利要求4所述的基于子序列挖掘与有向加权图聚类的建筑能源管理方法,其特征在于:所述步骤四中,在构造图之后,使用基于准完全连通子图的聚类方法,提出具有标准化边权重的有向加权图的ψ-准完全连通子图;
通过贪婪图聚类算法使有向加权图G中的每一个聚类都是最大ψ-准完全连通子图:首先,计算有向加权图G的顶点vi的权重W(vi);以权重作为优先级对顶点进行非递增顺序排列,得到优先级队列Q;从队列Q中选择权重最高的顶点,将其包含并形成一个独立聚类si,在每次迭代中,选择顶点权重次高于si的顶点权重的聚类作为sj,使si与sj相邻;当满足以下两点条件时,合并聚类si和sj,得到新的子图new_si:
条件1:新子图new_si应该形成一个弱连通体,以确保顶点之间的最小连通性;
条件2:新子图new_si应该满足条件ψ(new_si)≥ψmin,其中
其中,z=|new_si|,是子图new_si的顶点数,参数ψmin决定了聚类的质量;
重复迭代,直到si不能再合并为止,最终形成一个最大的ψ-准完全连通子图。对于其他不属于si的所有顶点,重复上述步骤,最终算法返回一组子图SG,它是图G的最大的ψ-准完全连通子图。
6.根据权利要求5所述的基于子序列挖掘与有向加权图聚类的建筑能源管理方法,其特征在于:所述步骤五中,将聚类结果应用到需求响应程序,测量建筑负载稳定性,遵循一致负载模式的建筑,被认为是稳定的,适合实施需求响应程序和节能计划,聚焦峰值负载转移以及减少日常消耗;
假设一个聚类集使用熵来测量一个建筑物tj的稳定性得分,熵越低,建筑物具有更高的稳定性:
其中,时间变化函数当子序列/>的聚类标签为si时,否则为0。
7.根据权利要求1-6任一项所述的基于子序列挖掘与有向加权图聚类的建筑能源管理方法,其特征在于:所述步骤五中,识别非典型模式有助于设计准确的负载预测模型;使用基于图的分析方法从时间序列数据集中发现非典型模式,关键是检查有向加权图G中符号的出现频率和顶点的度;顶点的度捕获了时间依赖的独特模式的数量,度较低的顶点在时间序列数据集中出现的频率最小,只有少数时间依赖模式;根据顶点的度分布决定阈值vd,基于阈值vd分隔低度顶点,并将被分隔的顶点的代表模式作为非典型模式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310858448.6A CN117435676B (zh) | 2023-07-13 | 2023-07-13 | 基于子序列挖掘与有向加权图聚类的建筑能源管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310858448.6A CN117435676B (zh) | 2023-07-13 | 2023-07-13 | 基于子序列挖掘与有向加权图聚类的建筑能源管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117435676A true CN117435676A (zh) | 2024-01-23 |
CN117435676B CN117435676B (zh) | 2024-06-07 |
Family
ID=89548684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310858448.6A Active CN117435676B (zh) | 2023-07-13 | 2023-07-13 | 基于子序列挖掘与有向加权图聚类的建筑能源管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117435676B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102495883A (zh) * | 2011-12-08 | 2012-06-13 | 河海大学 | 一种水文时间序列的异步周期模式挖掘方法 |
CN102564568A (zh) * | 2011-12-29 | 2012-07-11 | 华北电力大学 | 大型旋转机械复杂工况下的早期故障搜索方法 |
CN104346539A (zh) * | 2013-07-29 | 2015-02-11 | 安捷伦科技有限公司 | 从目标测序面板中寻找变异的方法 |
US20150073724A1 (en) * | 2013-07-29 | 2015-03-12 | Agilent Technologies, Inc | Method for finding variants from targeted sequencing panels |
US20150161233A1 (en) * | 2013-12-11 | 2015-06-11 | The Board Of Trustees Of The Leland Stanford Junior University | Customer energy consumption segmentation using time-series data |
CN106919689A (zh) * | 2017-03-03 | 2017-07-04 | 中国科学技术信息研究所 | 基于术语释义知识单元的专业领域知识图谱动态构建方法 |
CN107527144A (zh) * | 2017-08-21 | 2017-12-29 | 复旦大学 | 一种金融领域关联交易的检测方法 |
US20180150547A1 (en) * | 2016-11-30 | 2018-05-31 | Business Objects Software Ltd. | Time series analysis using a clustering based symbolic representation |
CN108647737A (zh) * | 2018-05-17 | 2018-10-12 | 哈尔滨工业大学 | 一种基于聚类的自适应时间序列异常检测方法及装置 |
CN111913463A (zh) * | 2020-06-12 | 2020-11-10 | 西安交通大学 | 一种核电厂化学容积控制系统状态监测方法 |
CN112102891A (zh) * | 2020-08-04 | 2020-12-18 | 广东工业大学 | 基于根因分析层次聚类的马蹄焰玻璃熔窑能耗异常定位方法 |
CN112418482A (zh) * | 2020-10-26 | 2021-02-26 | 南京邮电大学 | 一种基于时间序列聚类的云计算能耗预测方法 |
CN113420994A (zh) * | 2021-06-28 | 2021-09-21 | 山东大学 | 一种主动配电网结构灵活性评估方法及系统 |
CN113986674A (zh) * | 2021-10-28 | 2022-01-28 | 建信金融科技有限责任公司 | 时序数据的异常检测方法、装置和电子设备 |
CN114495492A (zh) * | 2021-12-31 | 2022-05-13 | 中国科学院软件研究所 | 一种基于图神经网络的交通流预测方法 |
CN115423033A (zh) * | 2022-09-23 | 2022-12-02 | 国网黑龙江省电力有限公司电力科学研究院 | 基于符号特征表示的电能质量时间序列聚类方法 |
-
2023
- 2023-07-13 CN CN202310858448.6A patent/CN117435676B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102495883A (zh) * | 2011-12-08 | 2012-06-13 | 河海大学 | 一种水文时间序列的异步周期模式挖掘方法 |
CN102564568A (zh) * | 2011-12-29 | 2012-07-11 | 华北电力大学 | 大型旋转机械复杂工况下的早期故障搜索方法 |
CN104346539A (zh) * | 2013-07-29 | 2015-02-11 | 安捷伦科技有限公司 | 从目标测序面板中寻找变异的方法 |
US20150073724A1 (en) * | 2013-07-29 | 2015-03-12 | Agilent Technologies, Inc | Method for finding variants from targeted sequencing panels |
US20150161233A1 (en) * | 2013-12-11 | 2015-06-11 | The Board Of Trustees Of The Leland Stanford Junior University | Customer energy consumption segmentation using time-series data |
US20180150547A1 (en) * | 2016-11-30 | 2018-05-31 | Business Objects Software Ltd. | Time series analysis using a clustering based symbolic representation |
CN106919689A (zh) * | 2017-03-03 | 2017-07-04 | 中国科学技术信息研究所 | 基于术语释义知识单元的专业领域知识图谱动态构建方法 |
CN107527144A (zh) * | 2017-08-21 | 2017-12-29 | 复旦大学 | 一种金融领域关联交易的检测方法 |
CN108647737A (zh) * | 2018-05-17 | 2018-10-12 | 哈尔滨工业大学 | 一种基于聚类的自适应时间序列异常检测方法及装置 |
CN111913463A (zh) * | 2020-06-12 | 2020-11-10 | 西安交通大学 | 一种核电厂化学容积控制系统状态监测方法 |
CN112102891A (zh) * | 2020-08-04 | 2020-12-18 | 广东工业大学 | 基于根因分析层次聚类的马蹄焰玻璃熔窑能耗异常定位方法 |
CN112418482A (zh) * | 2020-10-26 | 2021-02-26 | 南京邮电大学 | 一种基于时间序列聚类的云计算能耗预测方法 |
CN113420994A (zh) * | 2021-06-28 | 2021-09-21 | 山东大学 | 一种主动配电网结构灵活性评估方法及系统 |
CN113986674A (zh) * | 2021-10-28 | 2022-01-28 | 建信金融科技有限责任公司 | 时序数据的异常检测方法、装置和电子设备 |
CN114495492A (zh) * | 2021-12-31 | 2022-05-13 | 中国科学院软件研究所 | 一种基于图神经网络的交通流预测方法 |
CN115423033A (zh) * | 2022-09-23 | 2022-12-02 | 国网黑龙江省电力有限公司电力科学研究院 | 基于符号特征表示的电能质量时间序列聚类方法 |
Non-Patent Citations (2)
Title |
---|
CHENG FAN 等: "Temporal knowledge discovery in big BAS data for building enery management", 《ENERY AND BUILDINGS》, 26 September 2015 (2015-09-26), pages 75 - 89, XP029325309, DOI: 10.1016/j.enbuild.2015.09.060 * |
曾明 等: "基于时间序列符号化模式表征的有向加权复杂网络", 《物理学报》, vol. 66, no. 21, 30 September 2017 (2017-09-30), pages 292 - 302 * |
Also Published As
Publication number | Publication date |
---|---|
CN117435676B (zh) | 2024-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rajabi et al. | A comparative study of clustering techniques for electrical load pattern segmentation | |
Zhang et al. | Integrating bottom-up classification and top-down feedback for improving urban land-cover and functional-zone mapping | |
CN108596362B (zh) | 基于自适应分段聚合近似的电力负荷曲线形态聚类方法 | |
CN102663382B (zh) | 基于子网格特征自适应加权的视频图像文字识别方法 | |
CN110781332A (zh) | 基于复合聚类算法的电力居民用户日负荷曲线聚类方法 | |
CN108427713B (zh) | 一种用于自制视频的视频摘要方法及系统 | |
CN108805213B (zh) | 计及小波熵降维的电力负荷曲线双层谱聚类方法 | |
CN108428015B (zh) | 一种基于历史气象数据和随机模拟的风电功率预测方法 | |
CN101789005A (zh) | 一种基于感兴趣区域的图像检索方法 | |
CN108595582B (zh) | 一种基于社会信号的灾害性气象热点事件识别方法 | |
CN103390046A (zh) | 潜在狄利克雷模型的多尺度字典自然场景图像分类方法 | |
CN113159451B (zh) | 一种基于事件知识图谱构建的流域旱涝事件长期预测方法 | |
CN109597757B (zh) | 一种基于多维时间序列熵的软件网络间相似度的度量方法 | |
CN111177216A (zh) | 综合能源消费者行为特征的关联规则生成方法及装置 | |
CN105574265B (zh) | 面向模型检索的装配体模型定量描述方法 | |
CN114359632A (zh) | 一种基于改进PointNet++神经网络的点云目标分类方法 | |
CN111027574A (zh) | 基于图卷积的建筑物模式识别方法 | |
CN114722098B (zh) | 一种基于正态云模型和密度聚类算法的典型负荷曲线辨识方法 | |
CN109522859B (zh) | 基于高光谱遥感影像多特征输入的城市不透水层提取方法 | |
CN117435676B (zh) | 基于子序列挖掘与有向加权图聚类的建筑能源管理方法 | |
CN117671517A (zh) | 基于大规模预训练神经网络的遥感图像识别方法 | |
CN113159044A (zh) | 一种基于深度学习的卷积神经网络的道路材质识别方法 | |
CN107944146A (zh) | 基于主成分分析的多元水文时间序列匹配模型构建方法 | |
CN112990001A (zh) | 应用于数字征迁的遥感影像单体建筑快速精准提取方法 | |
Dongre et al. | Clustering appliance energy consumption data for occupant energy-behavior modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |