CN111340645A - 一种针对电力负荷的改进关联分析方法 - Google Patents

一种针对电力负荷的改进关联分析方法 Download PDF

Info

Publication number
CN111340645A
CN111340645A CN201811548317.3A CN201811548317A CN111340645A CN 111340645 A CN111340645 A CN 111340645A CN 201811548317 A CN201811548317 A CN 201811548317A CN 111340645 A CN111340645 A CN 111340645A
Authority
CN
China
Prior art keywords
data
numerical
load
threshold value
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811548317.3A
Other languages
English (en)
Other versions
CN111340645B (zh
Inventor
田世明
曹硕
卜凡鹏
李德智
田英杰
苏运
石坤
龚桃荣
韩凝辉
董明宇
潘明明
陈宋宋
王李果
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
State Grid Shanghai Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
State Grid Shanghai Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI, State Grid Shanghai Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201811548317.3A priority Critical patent/CN111340645B/zh
Publication of CN111340645A publication Critical patent/CN111340645A/zh
Application granted granted Critical
Publication of CN111340645B publication Critical patent/CN111340645B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种针对电力负荷的改进关联分析方法。首先,获取初始数据集,判断事务中是否含有非数值型数据,将数据分为数值型数据集与非数值型数据集;其次,利用基于熵权法的灰色关联分析方法,计算数值型影响因素对负荷变量的灰色关联度,设置关联度阈值,获取与负荷关系密切的数值型影响因素;然后,利用基于FP‑Growth算法的改进关联规则挖掘方法,对包含非数值型影响因素与负荷数据进行关联规则挖掘,通过对挖掘出的关联规则进行解读得到与负荷关系密切的非数值型影响因素;最后综合输出与负荷关系密切的影响因素。本发明具有很好的鲁棒性,可以有效解决电力负荷关联分析对数据类型及低频数据考虑不足的问题。

Description

一种针对电力负荷的改进关联分析方法
技术领域
本本发明涉及电力工程技术领域,具体涉及一种针对电力负荷的改进关联分析方法。
背景技术
电力行业积累的数据量越来越庞大,逐步形成了用户侧电力大数据。数据挖掘是信息技术发展进化的结果,其目的就是在从数据库的大量数据中提取隐含的、未知的并有潜在价值的信息和知识。而关联分析是数据挖掘里的一个重要分支,现已被广泛应用于市场营销、电信、银行等应用领域。对于电力系统而言,借助电力大数据对电力负荷及其可能的影响因素进行关联分析,有助于进一步理解用户用电行为、探索电力系统的发展规律,对具有重要的指导意义。
目前电力负荷关联分析多采用灰色关联分析方法或基本关联规则挖掘方法。但在电力负荷关联分析中既存在数值型数据又存在非数值型的文本类数据。现有的电力负荷关联分析技术大多都不区分数据是否为数值型,只采用一种方法对电力负荷及其影响因素进行关联分析。此外,电力负荷关联分析中存在一些频率较低但重要性较强的数据,而利用传统关联规则挖掘算法的“支持度-置信度”框架,很难对这些低频的重要数据进行关联规则挖掘。
发明内容
针对上述问题,本发明提出了一种针对电力负荷的关联分析方法,用于更好地指导电力负荷预测、配网负荷预警及智能电网的安全经济运行工作。
该针对电力负荷的改进关联分析方法,具体包括如下步骤:
步骤1:获取影响因素数据与负荷数据,计算影响因素数据与负荷数据的日平均值并按时间标签对影响因素数据与负荷数据进行匹配,组成事务,按影响因素是否为数值型数据,将数据分为数值型事务集与非数值型事务集;
步骤2:利用基于熵权法的灰色关联分析方法,计算数值型事务集中影响因素对负荷数据的灰色关联度,同时设置关联度阈值,获取关联度大于阈值的数值型影响因素;
步骤3:利用K-means方法对非数值型事务集进行聚类分析,并对聚类分析结果进行概化处理;
步骤4:基于FP-Growth算法对概化后的数据进行关联规则挖掘,筛选后项为负荷类型的关联规则,并对挖掘出的关联规则进行解读,得出各影响因素与负荷数据的关联关系,获取与负荷关系密切的非数值型影响因素。
步骤5:基于所述数值型影响因素与所述非数值型影响因素,输出与负荷数据关系密切的影响因素。
所述步骤1中所述影响因素数据包括:平均温度、最高温度、最低温度、降水量、湿度、气压、风速、负荷数据、风向、节假日信息、节气信息。
所述数值型事务集包括平均温度、最高温度、最低温度、降水量、湿度、气压、风速、负荷数据,非数值型事务集包括风向、节假日信息、节气信息。
所述步骤3中用不同符号表示各聚类类别,达到概化目的,以适应关联规则挖掘算法。
所述步骤4进一步包括:
步骤4-1:输入数据集,并确定分类支持度阈值、支持度阈值、置信度阈值3个参数;
步骤4-2:判断分类支持度阈值与小于支持度阈值的低频数据是否为影响因素,将数据集分为一般组、影响因素低频组、目标因素低频组三类,若计数大于分类支持度阈值,则将事务归进一般组,若计数小于分类支持度阈值且该类别为影响因素,则归进影响因素低频组,若计数小于分类支持度阈值且该类别为目标因素,则归进目标因素低频组。
步骤4-3:对于一般组,提取全部事务,采用FP-Growth算法挖掘并输出大于支持度、置信度阈值的关联规则;
对于影响因素低频组,提取该组中的低频影响因素数据与负荷数据构成新事务组,以n(A)、n(AB)、n(all)分别表示新事务组中事务A、事务AB和所有事物出现的次数,令n(A)=n(all),则支持度sup=n(AB)/n(all)=n(AB)/n(A)=置信度,故计算各类支持度,大于支持度阈值的,输出{该低频因素=>该类目标因素}的关联规则;
对于目标因素低频组,提取含该类目标因素的事务,该事务发生的次数记为n(B),令n(B)=n(all),n(AB)=n(A),则置信度=n(AB)/n(A)=1,故计算各类支持度,大于支持度阈值的,输出{该类因素=>该低频目标因素}的关联规则。
本发明具有如下有益效果:
考虑到电力负荷关联分析中在电力负荷关联分析中存在一些非数值型的文本数据和重要性较高的低频数据,相较于单一、基本的关联分析方法,提出的改进关联分析方法对电力负荷中的特殊数据具有更强的鲁棒性,在一定程度上提高了关联分析的全面性与准确性。日平均负荷的关联分析,对电力负荷预测、配网负荷预警及智能电网的安全经济运行具有重要的指导意义。
附图说明
图1针对电力负荷的改进关联分析方法流程图
图2基于FP-Growth算法的改进关联规则挖掘方法
具体实施方式
以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。
如图1所示,针对电力负荷的改进关联方法流程图,具体包括以下步骤:
(1)获取影响因素数据与负荷数据,计算影响因素数据与负荷数据的日平均值并按时间标签对影响因素数据与负荷数据进行匹配,组成事务,按影响因素是否为数值型数据,将数据分为数值型事务集与非数值型事务集;
(2)利用基于熵权法的灰色关联分析方法,计算数值型事务集中影响因素对负荷数据的灰色关联度,同时设置关联度阈值,获取关联度大于阈值的数值型影响因素;
(3)利用K-means方法对非数值型事务集进行聚类分析,并对聚类分析结果进行概化处理,以便下一步进行关联规则挖掘;
(4)利用基于FP-Growth算法的改进关联规则挖掘方法,对步骤3中概化后的数据进行关联规则挖掘,筛选后项为负荷类型的关联规则,并对挖掘出的关联规则进行解读,得出各影响因素与负荷数据的关联关系,获取与负荷关系密切的非数值型影响因素。
(5)综合步骤2与步骤4的结果,输出与负荷数据关系密切的影响因素。
实施步骤(1):获取上海市浦东区2014年1月1日到2015年6月30日的实测气象数据与负荷数据,并计算其日平均值,选取数值型气象数据与负荷数据作为灰色关联分析的初始数据集。上述实测数据均为15分钟获取一次数据,全天共有96点实测数据,其中气象数据包括平均温度、最高温度、最低温度、降水量、风向、风速、气压、湿度,数值型气象数据不包括风向。表1是上述浦东区初始数据集示例。
表1浦东区初始数据集示例
Figure BDA0001909943180000041
实施步骤(2):采用基于熵权法的灰色关联分析算法对上述初始数据集进行加权关联度计算,将加权关联度结果与采用传统灰色关联分析算法得到的关联度结果进行对比,传统方法计算结果有悖于专家经验,而改进方法更符合客观规律。故考虑信息熵的改进方法所得结果准确性更高。选取关联度阈值为0.7,获取与负荷关系密切的数值型影响因素为平均温度、最高温度、气压、湿度。
关联度结果对比如表2所示。
表2关联度结果对比
Figure BDA0001909943180000042
如图2所示,基于FP-Growth算法的改进关联规则挖掘方法流程图,具体包括以下步骤:
(1)输入数据集,并确定分类支持度阈值、支持度阈值、置信度阈值3个参数。
(2)根据分类支持度阈值与小于支持度阈值的低频数据是否为影响因素,将数据集分为一般组、影响因素低频组、目标因素低频组三类,若计数大于分类支持度阈值,则将事务归进一般组,若计数小于分类支持度阈值且该类别为影响因素,则归进影响因素低频组,若计数小于分类支持度阈值且该类别为目标因素,则归进目标因素低频组。
(3)针对上述不同类别数据集的数据特点,分别采用不同方法进行关联规则挖掘。具体步骤如下:
(a)对于一般组,提取全部事务,采用FP-Growth算法挖掘并输出大于支持度、置信度阈值的关联规则;
(b)对于影响因素低频组,提取该组中的低频影响因素数据与负荷数据构成新事务组,此时以n(A)、n(AB)、n(all)分别表示事务A、事务AB和所有事物的频数,则有n(A)=n(all),故支持度sup=n(AB)/n(all)=n(AB)/n(A)=置信度con。故计算各类支持度,大于支持度阈值的,输出{该低频因素=>该类目标因素}的关联规则;
(c)对于目标因素低频组,提取含该类目标因素的事务,此时以n(B)表示事务B发生的频数,则有n(B)=n(all),n(AB)=n(A),置信度con=n(AB)/n(A)=1,故计算各类支持度,大于支持度阈值的,输出{该类因素=>该低频目标因素}的关联规则。
实施步骤(3):获取上海市浦东区2014年1月1日到2015年6月30日的节假日数据与节气数据。选取节假日数据、节气数据、实施步骤1中的全部气象数据与负荷数据的日平均值为初始数据集。利用K-means方法对上述初始数据集进行聚类处理,k值取5。其中节假日、节气数据自然分类,无需再进行聚类。然后对聚类结果进行概化处理。聚类与概化结果示例如表3所示。
表3聚类与概化结果示例
Figure BDA0001909943180000061
实施步骤(4):利用基于FP-Growth算法的改进关联规则挖掘方法,对实施步骤3中概化后的数据进行关联规则挖掘。其中,设置分类支持度阈值为0.15,正常组支持度、置信度阈值分别为0.05、0.8,并将其与支持度、置信度阈值相同的基本FP-Growth挖掘结果进行比较,挖掘结果对比情况可知,关联规则综合挖掘算法能有效挖掘包含小计数高重要性信息的数据集,适用于电力负荷关联分析。挖掘出的关联规则示例如表4所示。两种方法关联规则挖掘对比结果如表5所示。
表4关联规则示例
Figure BDA0001909943180000062
表5两种方法关联规则挖掘对比结果
Figure BDA0001909943180000071
表2和表5的对比结果显示基于FP-Growth的改进关联规则挖掘方法能更好地对含有低频重要数据的数据集进行关联规则挖掘。同时获取与负荷关系密切的非数值型影响因素有气象、节假日信息。
实施步骤(5):综合输出与上海市浦东区日均负荷关系密切的影响因素有平均温度、最高温度、最低温度、降水量、风向、风速、气压、湿度、气象、节假日信息。
可以看出,本发明提出的改进关联分析方法对电力负荷中的特殊数据具有更强的鲁棒性,在一定程度上提高了关联分析的全面性与准确性。考虑到电力负荷关联分析中在电力负荷关联分析中存在一些非数值型的文本数据和重要性较高的低频数据,相较于单一、基本的关联分析方法,提出的改进关联分析方法对电力负荷中的特殊数据具有更强的鲁棒性,在一定程度上提高了关联分析的全面性与准确性。日平均负荷的关联分析,对电力负荷预测、配网负荷预警及智能电网的安全经济运行具有重要的指导意义。
这里只说明了本发明的优选实施例,但其意并非限制本发明的范围、适用性和配置。相反,对实施例的详细说明可使本领域技术人员得以实施。应能理解,在不偏离所附权利要求书确定的本发明精神和范围情况下,可对一些细节做适当变更和修改。

Claims (5)

1.一种针对电力负荷的改进关联分析方法,包括如下步骤:
步骤1:获取影响因素数据与负荷数据,计算影响因素数据与负荷数据的日平均值并按时间标签对影响因素数据与负荷数据进行匹配,组成事务,按影响因素是否为数值型数据,将数据分为数值型事务集与非数值型事务集;
步骤2:利用基于熵权法的灰色关联分析方法,计算数值型事务集中影响因素对负荷数据的灰色关联度,同时设置关联度阈值,获取关联度大于阈值的数值型影响因素;
步骤3:利用K-means方法对非数值型事务集进行聚类分析,并对聚类分析结果进行概化处理;
步骤4:基于FP-Growth算法对概化后的数据进行关联规则挖掘,筛选后项为负荷类型的关联规则,并对挖掘出的关联规则进行解读,得出各影响因素与负荷数据的关联关系,获取与负荷关系密切的非数值型影响因素;
步骤5:基于所述数值型影响因素与所述非数值型影响因素,输出与负荷数据关系密切的影响因素。
2.如权利要求1所述的一种针对电力负荷的改进关联分析方法,所述步骤1中所述影响因素数据包括:平均温度、最高温度、最低温度、降水量、湿度、气压、风速、负荷数据、风向、节假日信息、节气信息。
3.如权利要求1或者2所述的一种针对电力负荷的改进关联分析方法,所述数值型事务集包括平均温度、最高温度、最低温度、降水量、湿度、气压、风速、负荷数据,非数值型事务集包括风向、节假日信息、节气信息。
4.如权利要求1所述的一种针对电力负荷的改进关联分析方法,所述步骤3中用不同符号表示各聚类类别,达到概化目的,以适应关联规则挖掘算法。
5.如权利要求1所述的一种针对电力负荷的改进关联分析方法,所述步骤4进一步包括:
步骤4-1:输入数据集,并确定分类支持度阈值、支持度阈值、置信度阈值3个参数;
步骤4-2:判断分类支持度阈值与小于支持度阈值的低频数据是否为影响因素,将数据集分为一般组、影响因素低频组、目标因素低频组三类,若计数大于分类支持度阈值,则将事务归进一般组,若计数小于分类支持度阈值且该类别为影响因素,则归进影响因素低频组,若计数小于分类支持度阈值且该类别为目标因素,则归进目标因素低频组;
步骤4-3:对于一般组,提取全部事务,采用FP-Growth算法挖掘并输出大于支持度、置信度阈值的关联规则;
对于影响因素低频组,提取该组中的低频影响因素数据与负荷数据构成新事务组,以n(A)、n(AB)、n(all)分别表示新事务组中事务A、事务AB和所有事物出现的次数,令n(A)=n(all),则支持度sup=n(AB)/n(all)=n(AB)/n(A)=置信度,故计算各类支持度,大于支持度阈值的,输出{该低频因素=>该类目标因素}的关联规则;
对于目标因素低频组,提取含该类目标因素的事务,该事务发生的次数记为n(B),令n(B)=n(all),n(AB)=n(A),则置信度=n(AB)/n(A)=1,故计算各类支持度,大于支持度阈值的,输出{该类因素=>该低频目标因素}的关联规则。
CN201811548317.3A 2018-12-18 2018-12-18 一种针对电力负荷的改进关联分析方法 Active CN111340645B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811548317.3A CN111340645B (zh) 2018-12-18 2018-12-18 一种针对电力负荷的改进关联分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811548317.3A CN111340645B (zh) 2018-12-18 2018-12-18 一种针对电力负荷的改进关联分析方法

Publications (2)

Publication Number Publication Date
CN111340645A true CN111340645A (zh) 2020-06-26
CN111340645B CN111340645B (zh) 2023-10-20

Family

ID=71181345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811548317.3A Active CN111340645B (zh) 2018-12-18 2018-12-18 一种针对电力负荷的改进关联分析方法

Country Status (1)

Country Link
CN (1) CN111340645B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112113316A (zh) * 2020-09-18 2020-12-22 国网辽宁省电力有限公司电力科学研究院 一种空调负荷提取的方法
CN112288143A (zh) * 2020-10-14 2021-01-29 昆明电力交易中心有限责任公司 一种基于关联分析的地区能源消耗研究方法
CN115310888A (zh) * 2022-10-13 2022-11-08 国网天津市电力公司城东供电分公司 基于多元数据处理的综合能源用户用能行为关联分析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030208488A1 (en) * 2000-09-20 2003-11-06 North Dakota State University System and method for organizing, compressing and structuring data for data mining readiness
CN101556464A (zh) * 2009-05-22 2009-10-14 天津大学 基于关联规则的城市电力负荷预测模型自动推荐方法
CN105760947A (zh) * 2016-02-02 2016-07-13 国网江苏省电力公司 一种分析气象环境对电网负荷的影响因素的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030208488A1 (en) * 2000-09-20 2003-11-06 North Dakota State University System and method for organizing, compressing and structuring data for data mining readiness
CN101556464A (zh) * 2009-05-22 2009-10-14 天津大学 基于关联规则的城市电力负荷预测模型自动推荐方法
CN105760947A (zh) * 2016-02-02 2016-07-13 国网江苏省电力公司 一种分析气象环境对电网负荷的影响因素的方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112113316A (zh) * 2020-09-18 2020-12-22 国网辽宁省电力有限公司电力科学研究院 一种空调负荷提取的方法
CN112113316B (zh) * 2020-09-18 2022-03-11 国网辽宁省电力有限公司电力科学研究院 一种空调负荷提取的方法
CN112288143A (zh) * 2020-10-14 2021-01-29 昆明电力交易中心有限责任公司 一种基于关联分析的地区能源消耗研究方法
CN112288143B (zh) * 2020-10-14 2024-02-20 昆明电力交易中心有限责任公司 一种基于关联分析的地区能源消耗研究方法
CN115310888A (zh) * 2022-10-13 2022-11-08 国网天津市电力公司城东供电分公司 基于多元数据处理的综合能源用户用能行为关联分析方法

Also Published As

Publication number Publication date
CN111340645B (zh) 2023-10-20

Similar Documents

Publication Publication Date Title
CN106845717B (zh) 一种基于多模型融合策略的能源效率评价方法
CN107169628B (zh) 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN109376772B (zh) 一种基于神经网络模型的电力负荷组合预测方法
WO2016101628A1 (zh) 一种数据建模中的数据处理方法及装置
CN111340645B (zh) 一种针对电力负荷的改进关联分析方法
CN103294817A (zh) 一种基于类别分布概率的文本特征抽取方法
CN112735097A (zh) 一种区域滑坡预警方法及系统
CN108345908A (zh) 电网数据的分类方法、分类设备及存储介质
CN108197795B (zh) 恶意团体账户识别方法、装置、终端及存储介质
CN109409426A (zh) 一种极值梯度提升逻辑回归分类预测方法
CN104850868A (zh) 一种基于k-means和神经网络聚类的客户细分方法
CN114912720A (zh) 基于记忆网络电力负荷预测方法、装置、终端及存储介质
CN111339155B (zh) 一种关联分析系统
CN104809229A (zh) 一种文本特征词提取方法及系统
CN109409407A (zh) 一种基于le算法的工业监测数据聚类方法
CN110807159B (zh) 数据标记方法、装置、存储介质及电子设备
CN104657473B (zh) 一种保证质量单调性的大规模数据挖掘方法
CN108346287B (zh) 基于影响因素分析的交通流量序列模式匹配方法
CN103218516A (zh) 一种聚类再回归的机场噪声单步预测方法
CN111144424A (zh) 一种基于聚类算法的人员特征检分析方法
CN116204647A (zh) 一种目标比对学习模型的建立、文本聚类方法及装置
CN116340781A (zh) 相似度确定方法、相似度预测模型训练方法及装置
CN113505863B (zh) 基于级联均值向量综合评分的图片多级分类方法及系统
CN114818849A (zh) 基于大数据信息的卷积神经网络和遗传算法的反窃电方法
CN113191089A (zh) 一种基于滑动窗口的尾矿砂液化数据聚类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant