CN115907822A - 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 - Google Patents
一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 Download PDFInfo
- Publication number
- CN115907822A CN115907822A CN202211488712.3A CN202211488712A CN115907822A CN 115907822 A CN115907822 A CN 115907822A CN 202211488712 A CN202211488712 A CN 202211488712A CN 115907822 A CN115907822 A CN 115907822A
- Authority
- CN
- China
- Prior art keywords
- data
- load
- economic
- association
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明公开了一种考虑区域及经济影响的负荷特征指标关联性挖掘方法及系统,所述挖掘方法包括获取待挖掘的负荷数据的信息数据流;根据信息数据流的地理信息,获取对应地理信息的经济特征数据和气象特征数据;建立数据库,将所获得的数据依照地理位置的行政区域划分分层级存储入数据库;从数据库中选取用于关联规则的主数据;关联规则挖掘。采用本发明所发表的数据挖掘方法,利用规则关联挖掘技术,可以对系统电力需求进行大数据梳理,掌握电网的电能结构和电力需求,解决传统的电力负荷分析方法评价指标单一的缺憾,实现在规则关联挖掘的过程中的自动化处理,在负荷预测工作中帮助构建经济特征,提高负荷预测系统的预测准确率。
Description
技术领域
本发明涉及一种负荷特征指标关联性挖掘方法,尤其涉及一种考虑区域及经济影响的负荷特征指标关联性挖掘方法,属于数据挖掘技术领域。
背景技术
电能消费是产业结构调整的客观数据,也是衡量经济发展质量阶段性效果的重要指标,也可以说,电力指标可以作为衡量经济发展状况的晴雨表。用电负荷,也就是用电装置在一定时间内从电网中抽取的电量,根据电能消耗的用途,可以划分为城市/乡镇居民生活用电、商业用电、工业用电、农业用电等。随着我国经济规模和质量的不断发展,电力设施建设的不断完善,电力设备的种类和数量不断增加,电力负荷也随之提高。电力负荷的统计数据结果从客观上反映了我国的经济、社会发展状况。通过对各行业经济要素的统计,分析行业中主要要素对用电负荷的影响,可以为电力系统的运行状况提供客观数据的支持。用电负荷是一种既能反映经济运行状况,又能反映包括气温、人口等因素对电能影响的复杂数据;另外,电力系统中的电力负荷也是一个相对滞后的数据,电力系统必须根据历史资料对电力的需求进行准确地预测,以确保在城市化进程中满足生活及生产所需的电力需求、减少过度的用电量的浪费和损耗。因此,对用电负荷的准确预测,关系到整个电网的安全、稳定、可靠的运行,对电力系统的安全调度有极其重要的作用。
新经济形势的发展与新型电力系统的建设与发展,需要对用电状况进行更加细致的管理,以达到提高投资收益,增加回报率,满足用电需求的目的。随着经济质量及规模的发展以及二、三产业细分行业的结构和模式的调整,使得高耗能低效率的产能逐步淘汰,需要从质量、效率、动力变革、结构优化、转换增长动力等方面,寻找新的经济增长点。发展低耗绿色的新经济业态,推动新型工业化、信息化、农业现代化同步发展,提高全要素生产率,推动经济发展质量变革、效率变革和动力变革。掌握经济和用电需求之间的关系,准确地实现预测负荷,指导经济发展方向和电网后续建设,也是非常有意义的研究课题。在数据挖掘中,如何利用数据挖掘技术对电力负荷与经济状况进行关联规则分析,如何分析和处理区域的负荷预测与分行业的负荷预测,这是实际工程实施中亟待解决的问题。
在现实生活、生产等方面,由于电力消费的复杂性,主要的宏观经济变量及气温对电力消费的影响也具有复杂的、非线性的特点,是与经济价值和气象特征相关的多值函数。由于对电力负荷的影响因素的影响力的判别不明晰,经济和温度各自的特征属性对电力负荷的作用相互融合、相互干扰,难以观察,给电力负荷的数据统计及分析造成了实质性的困扰,因此,亟需展开经济性因素对分行业统计的温度解耦后负荷的影响进行分析,获取经济与负荷的关联关系。
发明内容
发明目的:本发明的目的是提供一种考虑区域及经济影响的负荷特征指标关联性挖掘方法,该方法能够实现面向系统负荷预测系统的海量数据清洗技术,并实现对影响电网负荷的条件因素(如气象数据,价值数据,区域经济特点等)的有效分析和统计,用于提高获取关联挖掘结果的效率以及获取关联挖掘结果的可靠性;本发明的另一目的是提供一种考虑区域及经济影响的负荷特征指标关联性挖掘系统。
技术方案:本发明的一种考虑区域及经济影响的负荷特征指标关联性挖掘方法,其特征在于,包括以下步骤:
获取待挖掘的负荷数据的信息数据流;
根据信息数据流的地理信息,获取对应地理信息的经济特征数据和气象特征数据,将以上数据按照用电的行业分别统计,获得分行业统计的负荷数据、气象数据、经济学描述数据;
建立数据库,将所获得的数据依照地理位置的行政区域划分分层级存储入数据库;通过数据仓库技术对系统负荷数据进行分省、地、县存储读取,为实现更高的系统负荷预测准确率的工作服务;
从数据库中选取用于关联规则的主数据;
关联规则挖掘,确定用电负荷数据与分行业统计的负荷数据、气象数据、经济学描述数据之间的规则关联方法,将参数中规则关联度大于预定门限的参数视为存在较密切的关联关系。
在本申请的一些实施例中,所述数据库包括历史负荷数据库、负荷-气象数据库、负荷-经济特征数据库;
历史负荷数据库由以下方法构建:采集历史负荷数据和分行业统计的用电数据,数据预处理后,建立系统历史负荷数据库;
负荷-气象数据库由以下方法构建:获取与历史负荷数据库中数据相关的社会全口径用电数据、分行业的用电数据及相应的经济性描述数据、气候/气象数据,对获取的多元信息进行预处理,实现连续数据的离散化分解,进行基于气候、经济、人口数据的分类处理,并建立时间序列格式的负荷-气象数据库;
负荷-经济特征数据库由以下方法构建:筛选出贡献较大及贡献度变化较大的行业,建立负荷-经济特征数据库。
在本申请的一些实施例中,经济性描述数据的获取方法包括:根据预处理方法,实现对原始经济性描述数据的属性筛选、数字化、归一化处理,获取经济性数据,其中,预处理的源数据的经济性数据包括:筛选需要参与负荷-经济关联规则研究的数据,删除源数据中明显异常或较长时间尺度不完整的数据;
经济性数据的归一化预处理流程包括:将选取的关联数据进行格式的归一化、相同层次的数据的归一化,以及将特征参数的归一化。
优选的,经济性描述数据包括参数化的区域城市化率、行业与经济贡献度的相关性结果、区域经济集中度、第二/三产业经济占比等参数中的一项或多项。
在本申请的一些实施例中,从数据库中选取用于关联规则的主数据的具体方法为:从负荷-气象数据库和负荷-经济特征数据库提取一定时间范围和相应地理区域范围的历史数据,基于pearson算法进行主成分分析,确定历史数据中用于进行规则关联方法的相关参数及其数据,作为用于关联规则的主数据。
在本申请的一些实施例中,所述主成分分析为:根据负荷数据来源的区域、层级、行业,结合负荷的来源和经济统计数据的影响因素,确定各影响因素与经济性描述数据及行业负荷数据之间的主要影响成分;计算影响因素与经济及负荷数据之间的Pearson相关性分布系数的公式如下:
优选的,所述影响因素包含全社会统计口径及分行业统计的用电负荷量,温度,湿度信息,区域信息、城镇化率及常驻人口统计数据,确定分行业统计的历史用电信息及分行业统计的历史GDP数据,按行业统计的从业人数信息。
在本申请的一些实施例中,所述关联规则挖掘还包括:
分层级读取历史负荷数据库及负荷-气象数据库的数据,进行数据分析,实现温度与用电负荷的解耦,建立系统负荷与历史负荷、天气数据的关系模型;
分层级读取负荷-气象数据库和负荷-经济特征数据库,确定用电负荷数据与分行业统计的负荷数据、气象数据、经济学描述数据之间的规则关联方法,将参数中规则关联度大于预定门限的参数视为存在较密切的关联关系。
在本申请的一些实施例中,所述将参数中规则关联度大于预定门限的参数视为存在较密切的关联关系包括分析参数间关联关系相关度大于预定门限的参数的选取方法,其具体为:
将出现在同一线路的用电负荷数据或者同一时间戳所有线路的用电数据中,负荷参数、经济性参数、时间参数作为共同考虑进行规则关联的待分析的项;
在项集中,基于预定支持度门限,获取支持度大于等于门限度的项,由所选的项聚合生成频繁项集;其中,项间的预定相关度的门限与项集的支持度呈正相关性;
进一步地,分析参数间关联关系相关度大于预定门限的参数的选取方法还包括参数门限关联度判别方法,其中,基于设定的门限支持度,获取大于等于该支持度的项,聚合生成频繁项集,包括:
基于预设支持度门限,从数据中搜索支持度大于等于门限的项,聚合生成频繁项集;
在n-1维的频繁项集的基础上获取第n维的频繁项集,直到在第n+1维的频繁项集中,该集合的项集为空为止。其中,n为不小于1的正整数,同时n不超过项的总数。
更进一步地,频繁项集获取方法中,决定预定相关度的门限和参数相关度的关联关系方法,包括:
将包含负荷数据、经济数据的每个参数分别作为数据集中待分析的项,生成负荷数据信息向量;
根据分类方法,将相似的行业用电贡献、经济贡献的数据集合,基于预定支持度门限,获取支持度大于门限的项,聚合生成频繁项集。其中,项间的预定相关度的门限与项集的支持度呈正相关性。
基于所述预定支持度门限阈值及规则关联算法,确定源分析数据的时间数据、负荷数据、经济参数与经济性描述数据之间的规则关联度,探索所述参数类型下,不同参数之间的关联关系。
另一方面,本发明提供一种实现上述方法的考虑区域及经济影响的负荷特征指标关联性挖掘系统,其包括:
信息数据流获取模块,用于获取待挖掘的负荷数据的信息数据流;
气象及经济描述数据获取模块,用于根据信息数据流获取模块中信息数据流的地理信息,获取对应地理信息的经济特征数据和气象特征数据,将以上数据按照用电的行业分别统计,获得分行业统计的负荷数据、气象数据、经济学描述数据;
数据库模块,用于将气象及经济描述数据获取模块所获得的数据依照地理位置的行政区域划分分层级存储入数据库;
主数据筛选模块,用于从数据库中选取用于关联规则的主数据;
关联规则挖掘模块,用于根据主数据筛选模块中选取的主数据,确定用电负荷数据与分行业统计的负荷数据、气象数据、经济学描述数据之间的规则关联方法,将参数中规则关联度大于预定门限的参数视为存在较密切的关联关系。
优选的,本发明使用Apriori算法处理数据集,根据支持度和置信区间过滤得到频繁项集。将频繁项集进行自连接,生成项集对应的序列号,依据支持度进行剪枝,达到k-1次频繁项集。将得到的k-1项集存储并再进行计算,迭代重用上个步骤得到k-n频繁项集,直到再无频繁项集生成。依据频繁项集,生成满足支持度门限的强关联规则。
本发明分析日最大用电负荷和日最小用电负荷分别与经济、气温因素的关联关系;对日最大用电负荷指数、日最大降温负荷指数、基础负荷指数和日用电量指数进行分析,探索负荷特征数据与经济性描述性数据之间的关系;尝试用现代计量经济学的方法构建用电负荷与经济变量的模型,将经济变量与气温对用电负荷的复杂非线性特征的多值函数加以模型化。
本发明通过从电力数据采集与监视控制系统(SCADA)的历史及实时数据库中获取规定时间范围和相应地理区域范围的历史数据,用于作为关联规则挖掘的数据;确定所述关联规则挖掘方法使用的气象信息数据及经济性描述信息数据;并根据所述关联规则挖掘方法,获取所述数据中气象及经济信息的最小支持度,生成频繁项集;然后,根据上一步骤建立的频繁项集和最小置信度,建立负荷-经济性数据的支持门限单元,最终获取电力负荷与行业经济的规则关联关系。由此,实现了对影响电网负荷的条件因素(如气象数据,价值数据,区域经济特点等)的有效分析和统计,用于提高获取关联挖掘结果的效率以及获取关联挖掘结果的可靠性,为实现更高的系统负荷预测准确率的工作服务。
本发明的功能包括:能够分析系统负荷与历史负荷、天气数据的关系;构建气象数据和电网负荷、价值数据,地区经济特点的相关特征,分析气象数据对负荷数据的影响并实现解耦,降低温度对负荷的影响因素,建立经济指标与系统负荷的关联关系;通过数据仓库技术对系统负荷数据进行按省、地、县的区域划分的,计及所属区域城市化率及常驻人口统计,以及所属第二、三产业按行业划分的经济数值的存储读取数据功能,实现基于区域的经济集中度及影响负荷的经济特性指标分析。
有益效果:与现有技术相比,本发明具有如下显著优点:
(1)本发明利用规则关联挖掘技术,可以对系统电力需求进行大数据梳理,掌握电网的电能结构和电力需求,解决传统的电力负荷分析方法评价指标单一的缺憾,实现在规则关联挖掘的过程中的自动化处理,在负荷预测工作中帮助构建经济特征,提高负荷预测系统的预测准确率。
(2)本发明根据行业负荷特性和主成分分析法计算出与区域经济性相关性较高的行业维度;本发明根据选择的行业维度,建立基于行业用电数据的区域经济性描述分类模型;本发明可依据分类结果及负荷的用电量,进行基于经济指数的线路负荷的精准预测,便于调度人员掌握区域内负荷状况及经济规划情况。
附图说明
图1示出了根据本发明实施例的负荷特征指标关联性挖掘方法的流程图1。
图2示出了根据本发明实施例的数据库的存储结构的构成示意图。
图3示出了根据本发明实施例的建立数据库的流程图。
图4示出了根据本发明实施例的负荷特征指标关联性挖掘方法的流程图2。
图5示出了根据本发明实施例的数据挖掘方法中确定参数关联关系的流程图。
图6示出了根据本发明实施例的负荷特征指标关联性挖掘系统的模块图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此,实际执行的顺序有可能根据实际情况改变。
图1示出了根据本发明实施例的负荷特征指标关联性挖掘方法的流程图。负荷特征指标关联性挖掘方法包括如下步骤:
S110获取待挖掘的负荷数据的信息数据流。
具体而言,获取信息数据流,信息数据中包括负荷线路的名称(ID),全社会统计口径及分行业统计的用电负荷量,时间戳,温度,湿度信息等。在一个实施例中,信息数据的收集可以以线路名称及时间戳为单位,汇总单个线路的历史数据作为一条完整的信息数据。
S120根据信息数据流的地理信息,获取对应地理信息的经济特征数据和气象特征数据,将以上数据按照用电的行业分别统计,获得分行业统计的负荷数据、气象数据、经济学描述数据;
具体而言,根据信息数据流,确定线路所在的地理信息,根据线路的地理信息及历史时间信息,获取对应地理信息的气候信息、城市信息、城镇化率及常驻人口统计数据,确定分行业统计的历史用电信息及分行业统计的历史GDP数据,同时获取按行业统计的从业人数信息,用以描述经济特性。将上述信息归一化处理并作为特征向量,并拼接加入信息数据中。
S130建立数据库,将所获得的数据依照地理位置的行政区域划分分层级存储入数据库。
S140从数据库中选取用于关联规则的主数据。
具体而言,从数据库中选取用于关联规则的主数据的具体方法为:从数据库提取一定时间范围和相应地理区域范围的历史数据,基于pearson算法进行主成分分析,确定历史数据中用于进行规则关联方法的相关参数及其数据,作为用于关联规则的主数据。
S150关联规则挖掘,确定用电负荷数据与分行业统计的负荷数据、气象数据、经济学描述数据之间的规则关联方法,将参数中规则关联度大于预定门限的参数视为存在较密切的关联关系。
具体而言,根据负荷数据及特征数据,研究冬夏日负荷数据上升与城镇化率及温度的关系,提取基础负荷指数,剥离出较为平稳的基础负荷指数,降低温度因素对负荷的影响。其后,计算确定负荷数据的时间、负荷、经济参数与经济性描述参数之间的相关度,基于预定支持度门限,使用Pearson主成分分析确定对负荷及用电量影响程度较大的行业,通过Apriori算法建立用电负荷与经济特性之间的关联关系并输出强规则关联的频繁项集,便于调度员获取负荷预期。
基于上述步骤,建立负荷数据与气象数据、经济性数据的关联关系,实现对负荷数据的经济性分析,有助于提升用电质量的经济性及准确性。
通过这样的方法,不仅能够获得负荷与负荷、区域与区域的经济性、行业对用电量及经济性的关联关系,还可以得到分行业的用电及经济贡献关系、时间尺度的产业变化关系、经济变化的导向等,进一步作为负荷预测的精准判断及未来电力系统的建设建议,从而进一步增强电能的有效利用率,提高用电质量及水平。
下面参见图2,图2示出了根据本发明实施例的数据库的存储结构的构成示意图。数据库包括实时数据、统计数据、和特征分类数据。实时数据包括负荷数据和时间数据。统计数据包括行业产业比例信息、分行业统计GDP数据、分行业统计从业人员数据、分行业统计负荷数据。特征分类数据包括城市分类及人口信息、行业分类信息、气候分类信息和经济描述信息。
下面参见图3,图3示出了根据本发明实施例的建立数据库的流程图。历史负荷数据库、负荷-气象数据库、负荷-经济特征数据库。建立数据库的方法包括如下步骤:
S120根据地理位置信息,建立包含层级划分的省、地、县的数据库,并且存储地区的位置信息。
S121历史负荷数据库由以下方法构建:采集历史负荷数据和分行业统计的用电数据,数据预处理后,建立系统历史负荷数据库。
具体而言,根据步骤S200的数据库读取分级数据及位置信息,收集系统负荷数据及分行业统计的用电数据,建立系统历史负荷数据库,并对所述历史负荷数据及分行业统计数据进行预处理。
S122负荷-气象数据库由以下方法构建:获取与历史负荷数据库中数据相关的社会全口径用电数据、分行业的用电数据及相应的经济性描述数据、气候/气象数据,对获取的多元信息进行预处理,实现连续数据的离散化分解,进行基于气候、经济、人口数据的分类处理,并建立时间序列格式的负荷-气象数据库。
在一些实施例中,经济性描述数据的获取方法包括:根据预处理方法,实现对原始经济性描述数据的属性筛选、数字化、归一化处理,获取经济性数据,其中,预处理的源数据的经济性数据包括:筛选需要参与负荷-经济关联规则研究的数据,删除源数据中明显异常或较长时间尺度不完整的数据;经济性数据的归一化预处理流程包括:将选取的关联数据进行格式的归一化、相同层次的数据的归一化,以及将特征参数的归一化。
进一步地,经济性描述数据包括参数化的区域城市化率、行业与经济贡献度的相关性结果、区域经济集中度、第二/三产业经济占比等参数中的一项或多项。
具体而言,根据步骤S120的数据库数据分级及位置信息收集,读取与步骤S210数据相关的社会全口径用电数据、分行业的用电数据及相应的经济性描述数据、气候/气象数据,对收集的多元信息进行预处理,实现连续数据的离散化分解,进行基于气候、经济、人口等数据的分类处理,并建立时间序列格式的负荷-气象数据库。
S123负荷-经济特征数据库由以下方法构建:筛选出贡献较大及贡献度变化较大的行业,建立负荷-经济特征数据库。
具体而言,基于步骤S121的负荷数据及步骤S120的位置信息,收集电网负荷相关的价值数据及经济特征数据,建立基于行业分类的经济性描述方案,筛选出贡献较大及贡献度变化较大的行业,建立负荷-经济特征数据库。
进一步地,电网负荷相关的价值数据:基于电力大数据进行分析,挖掘电力数据的价值,提升电网系统运维监测,提升客户满意度,降低损耗和成本。其通过对客户服务进行客户电力数据进行价值分析(如:电费管理,电能计量及信息采集,用电类型,用电习惯及用电模式等)实现对客户服务、电费管理、有序用电实施及需求响应潜力挖掘、能效管理等质量指标的有效评估,实现基于大数据和数据分析的高附加值的增值服务业务,提升电力企业盈利水平与控制水平,为电网实现完全、可靠、经济、高效地运行提供保障。
本发明实施例提供一种分析电力负荷数据与区域经济繁荣度关联性的数据挖掘方法,所述方法计算可获得与区域经济繁荣度相关性强的数据维度,并根据所选择的数据维度,建立基于数据的区域经济繁荣度的多分类模型。具体包括如下步骤:
S1231所述区域内按照经济繁荣度将所述区域进行特征分类,依据所述区域的最大用电负荷,常驻人口数量,GDP规模,第二、三产业分行业口径统计的GDP规模,区域物理面积等分为5个特征,然后采用Pearson相关性分析方法来计算备选的数据维度与以行业划分的经济规模的相关性,计算区域经济繁荣度的数据维度。
S1232经济性样本的数据选择:以市、区、县、镇的常住人口为数据样本,分行业统计的从业人口为统计口径,将全经济统计的规模分为4个等级。
S1233根据不同行业的经济及发展定位,将电力需求按功能划分为5个级别:第一产业用电量、第二产业用电量、第三产业用电量、城市居民用电量、村镇居民用电量,这五个用电类型,从而实现温度与线路负荷用电量受温度影响的解耦效果。
S1234按照经济的集中程度进行分类:标注为1的是城市中的第三产业密集聚集区域,通常会有高密度的建筑群,例如商业街区;标注为2的是城市中的第二产业企业聚集较多的区域,如产业开发区和工业园区;标注为3的是在城市具中有较多企业,但商业密集程度不高的地方,如中心城区;标注为4的是城市中小企业、个体经营场所,通常如住宅区周边的小型商圈;标注为5的是市区中以住宅区为主体的区域等。
本发明实施例使用经济学相关分析理论,展开电力特性指标间的关联性分析,使用Pearson相关系数分析法,过特征指数法,以期去除噪音及环境数据的影响,保证最终结果的准确性。
本发明实施例提出一种用电负荷及经济水平描述的特性指标关联性分析方法,具体实现过程如下:
选取Pearson相关系数分析法,基于行业分类,计算经济指标和负荷特性指标的相关性系数。按大小排序确定相关性指标;
使用过特征指数法,建立基准最高用电负荷指标。考虑季度甚至月度的统计用电数据,并分析最大负荷数据与经济指标之间的相关性;此外,针对冬季及夏季用电高峰的客观现状,构建最大/最小用电负荷、日最大温度变化、基础负荷和日用电量指数,从而剥离温度的负荷影响,揭示基础的平稳的负荷指数,可帮助阐明各行业电能消耗量与经济要素之间的联系;
采用行业细分法与单耗法相结合的计算方法,平衡主要工业企业利润、峰谷电成本控制等因素,获得基于行业的电能消耗模型。同时充分考虑居民及商业企业负荷的特点,对非工业用电状况进行修正;
分析GDP,经济中心度,行业集中度,气候,行政级别,第二产业比重,用电增长率,GDP增长率与用电负荷的关系;
劳动力的统计可按15个国民经济部门划分的行业构成,参考城市化率指标,推断城市经济发展水平。人口素质和文化水平的高低,与城市经济的发展有高度相关的关联性,通过教育类指标,科技类指标,文化类指标描述城市人口的文化素质。
下面参见图4,图4示出了根据本发明实施例的负荷特征指标关联性挖掘方法的流程图2。负荷特征指标关联性挖掘方法包括如下步骤:
S210获取负荷数据源,负荷数据源包括负荷数据集。
S220从负荷数据集中提取时间信息,以时间戳为单位,汇总单个线路的历史数据作为一条完整的信息数据作为整合历史信息。
S230从负荷数据集中提取地理信息,根据地理信息及历史时间信息,获取对应地理信息的城市信息及行业信息、行业经济信息。将上述信息归一化处理并作为特征向量,并拼接加入信息数据中,得到处理完成的数据集。
具体而言,与其他行业的时序数据相比,在结构上,电力负荷的数据存在明显的差异。如:电力负荷的相关数据中包含了负荷、温度、人口、经济总量等连续数据,但数据的连续性并不利于数据挖掘算法的数据规律归纳。为了适应数据挖掘及规则关联分析的需求,本发明实施例采用k-means聚类算法对挖掘的数据信息进行分类处理,建立数据挖掘数据库,为规则关联分析工作做准备。
离散化数据处理是把连续的数据范围划分为多个子分类,降低数值上连续的数据分布,从而实现数据降维,增强数据的区分度,使用区间的标号替代数据真实的数值。通过这种方法,将连续的原始数据进行离散化处理,形成归一化、标准化、关系明晰的离散数据集,建立关联分析所需的数据源,从而为关联规则数据挖掘提供了必要的条件。
S240从数据集中选取关联规则主数据。
S250根据关联规则的主数据,进行负荷与经济特征因素关联规则的数据挖掘。
S260输出关联规则的结果。
本发明公开的数据挖掘方法的另一个实施例的流程如下所示:
S310根据预处理方法,实现对原始经济性描述数据的属性筛选、数字化、归一化处理,获取经济性数据,其中,预处理的源数据的经济性数据包括:筛选需要参与负荷-经济关联规则研究的数据,删除源数据中明显异常或较长时间尺度不完整的数据;经济性数据的归一化预处理流程包括:将选取的关联数据进行格式的归一化、相同层次的数据的归一化,以及将特征参数的归一化;
S320将包含负荷数据、经济数据的每个参数分别作为数据集中待分析的项,生成负荷数据信息向量;
S330获取支持度大于等于预定支持度门限的项,聚合生成频繁项集。在一个实施例中,可以通过调节支持度来控制所需的参数之间的关联强度。如,若需要提高获取的参数关联关系的关联强度,则提高支持度门限;若需要获得更多的参数关联关系,放低对关联强度的要求,则可以降低支持度门限;
S340可根据参数关联关系辅助负荷预测,提升预测准确度。
通过这样的方法,可以克服负荷数据的特征参数数据来源不统一,格式多样化,不便于处理的问题,为便于后期数据处理,还能够通过设置支持度门限的阈值控制目标的关联程度,从而控制数据量,有助于提升数据分析的针对性。
如图5示出了根据本发明实施例的数据挖掘方法中确定参数关联关系的流程图。确定参数关联关系的方法如下:
S410:将出现在同一线路的用电负荷数据或者同一时间戳所有线路的用电数据中,负荷参数、经济性参数、时间参数作为共同考虑进行规则关联的待分析的项,并设n=1。
S420:令n=n+1,在规则关联中参考预定的支持度门限数值,获取支持度超过所设门限值的n元频繁项集。
S430:判断n元频繁项集中是否是空集。若该项集中存在参数项,则继续执行步骤S320;若否,则执行步骤S340。
S440:获取2~n元频繁项集,n为不小于1的整数。
在实施例中,将出现在同一线路的用电负荷数据或者同一时间戳所有线路的用电数据中,负荷参数、经济性参数、时间参数作为共同考虑进行规则关联的待分析的项,生成数据向量,根据余弦相似度、轮廓相似度、趋势相似度算法或者分类算法实现时序数据的分类处理,获取数据集的向量合集,根据同一合集中,支持度超过预定支持度门限的项,聚合生成频繁项集,从而能够针对相似环境分类的负荷进行数据挖掘,实现有针对性地分析,提高生成多元频繁项集的概率,有助于提升负荷预测的准确性。
本发明实施例提供的基于关联规则的电力负荷数据挖掘方法,通过从电力数据采集与监视控制系统(SCADA)的历史及实时数据库中获取规定时间范围和相应地理区域范围的历史数据,用于作为关联规则挖掘的数据;确定所述关联规则挖掘方法使用的气象信息数据及经济性描述信息数据;并根据所述关联规则挖掘方法,获取所述数据中气象及经济信息的最小支持度,生成频繁项集;然后,根据上一步骤建立的频繁项集和最小置信度,建立负荷-经济性数据的支持门限单元,最终获取电力负荷与行业经济的规则关联关系。本发明,实现了对影响电网负荷的条件因素(如气象数据,分行业统计的价值数据,区域经济特点等)的有效分析和统计,用于提高获取关联挖掘结果的效率以及获取关联挖掘结果的可靠性,为实现更高的系统负荷预测准确率的工作服务。
在本发明实施例,同时提供了电力负荷及经济数据的关联规则的挖掘方法的步骤,其步骤包括:
关联数据获取步骤S510,从电力数据采集与监视控制系统的历史与实时数据中提取一定时间范围和相应地理区域范围的历史数据,基于pearson算法进行主成分分析,确定用于进行关联规则挖掘的相关参数及其数据:
关联属性确定步骤S520,从选定层级的传输线及相应地理信息中获取所述关联规则挖掘数据;
关联项集生成步骤S530,基于所述获取S510步骤执行的关联规则计算所需的关联数据挖掘,基于所述步骤S520抽取气象数据及经济数据,经过计算关联规则的最小支持度和相关性设置门限,聚合数据参数中的项,生成频繁项集;
规则获取步骤S540,基于所述步骤S530抽取用于分析项的频繁项集的最小置信度及相关性设置门限,建立负荷-经济支持门限单元,生成电力负荷关联规则。
进一步地,所述关联数据获取步骤S510的主成分分析方法包括:
根据负荷数据来源的区域、层级、行业,结合负荷的来源和经济统计数据的影响因素,确定各影响因素与经济性描述数据及行业负荷数据之间的主要影响成分:
计算影响因素与经济及负荷数据之间的Pearson相关性分布系数的公式如下:
所述影响因素包含全社会统计口径及分行业统计的用电负荷量,温度,湿度信息,区域信息、城镇化率及常驻人口统计数据,确定分行业统计的历史用电信息及分行业统计的历史GDP数据,按行业统计的从业人数信息等。
进一步地,所述关联确定步骤520具体包括:
层次存储:获取所选的基于地理信息及市、区、县的层次和所划分的经济类子行业信息,获取用于进行规则关联的相关数据;
属性确定:按照层次存储步骤中,基于所选空间层次,获取所述层次相应的信息数据,确定所述关联规则挖掘数据的电力负荷规则关联的相关属性。
进一步地,所述关联项集生成步骤530具体包括:
关联项集获取步骤:用于在确定的频繁项集的集合中,获取各个项之间的最小支持度和门限阈值条件;
关联项集生成步骤:根据所述关联规则获取步骤实施关联规则数据挖掘,使用所述关联属性确定步骤选取区域的电力负荷数据,气象、经济性描述性数据。
进一步地,依据所述关联项集生成步骤,根据所述的数据获取步骤进行所挖掘的数据的规则关联,依据所述属性确定步骤获取相应数据,以及依据所述的条件获取步骤提取的最小支持度系数和门限相关度阈值,进行规则关联,生成频繁项集。
进一步地,所述关联规则获取步骤540具体包括:
关联规则获取步骤:生成规则获取的最小置信度参数以及限制规则关联的条件;
根据所述项集获取步骤从源数据中将待关联参数项之间的频繁项集进行聚合;根据所述规则获取进行最小置信度的及规则关联条件的获取;根据所述最小置信度的数值和所述关联规则进行参数的规则关联,将生成的通过最小置信度及支持门限的规则作为电力负荷与经济描述性参数之间的关联规则。
下面参见图6,图6示出了根据本发明实施例的负荷特征指标关联性挖掘系统的模块图。负荷特征指标关联性挖掘系统600,其包括
信息数据流获取模块610,用于获取待挖掘的负荷数据的信息数据流;
气象及经济描述数据获取模块620,用于根据信息数据流获取模块中信息数据流的地理信息,获取对应地理信息的经济特征数据和气象特征数据,将以上数据按照用电的行业分别统计,获得分行业统计的负荷数据、气象数据、经济学描述数据;
数据库模块630,用于将气象及经济描述数据获取模块所获得的数据依照地理位置的行政区域划分分层级存储入数据库;
主数据筛选模块640,用于从数据库中选取用于关联规则的主数据;
关联规则挖掘模块650,用于根据主数据筛选模块中选取的主数据,确定用电负荷数据与分行业统计的负荷数据、气象数据、经济学描述数据之间的规则关联方法,将参数中规则关联度大于预定门限的参数视为存在较密切的关联关系。
图6仅仅是示意性的示出本发明提供的负荷特征指标关联性挖掘系统600,在不违背本发明构思的前提下,模块的拆分、合并、增加都在本发明的保护范围之内。本发明提供的负荷特征指标关联性挖掘系统600可以由软件、硬件、固件、插件及他们之间的任意组合来实现,本发明并非以此为限。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内,因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种考虑区域及经济影响的负荷特征指标关联性挖掘方法,其特征在于,包括以下步骤:
获取待挖掘的负荷数据的信息数据流;
根据信息数据流的地理信息,获取对应地理信息的经济特征数据和气象特征数据,将以上数据按照用电的行业分别统计,获得分行业统计的负荷数据、气象数据、经济学描述数据;
建立数据库,将所获得的数据依照地理位置的行政区域划分分层级存储入数据库;
从数据库中选取用于关联规则的主数据;
关联规则挖掘,确定用电负荷数据与分行业统计的负荷数据、气象数据、经济学描述数据之间的规则关联方法,将参数中规则关联度大于预定门限的参数视为存在较密切的关联关系。
2.根据权利要求1所述的方法,其特征在于,所述数据库包括历史负荷数据库、负荷-气象数据库、负荷-经济特征数据库;
历史负荷数据库由以下方法构建:采集历史负荷数据和分行业统计的用电数据,数据预处理后,建立系统历史负荷数据库;
负荷-气象数据库由以下方法构建:获取与历史负荷数据库中数据相关的社会全口径用电数据、分行业的用电数据及相应的经济性描述数据、气候/气象数据,对获取的多元信息进行预处理,实现连续数据的离散化分解,进行基于气候、经济、人口数据的分类处理,并建立时间序列格式的负荷-气象数据库;
负荷-经济特征数据库由以下方法构建:筛选出贡献较大及贡献度变化较大的行业,建立负荷-经济特征数据库。
3.根据权利要求1所述的方法,其特征在于,负荷-气象数据库中,
所述经济性描述数据的获取方法包括:根据预处理方法,实现对原始经济性描述数据的属性筛选、数字化、归一化处理,获取经济性数据,其中,预处理的源数据的经济性数据包括:筛选需要参与负荷-经济关联规则研究的数据,删除源数据中明显异常或较长时间尺度不完整的数据;
所述归一化预处理的流程包括:将选取的关联数据进行格式的归一化、相同层次的数据的归一化,以及将特征参数的归一化。
4.根据权利要求2所述的挖掘方法,其特征在于,从数据库中选取用于关联规则的主数据的具体方法为:从负荷-气象数据库和负荷-经济特征数据库提取一定时间范围和相应地理区域范围的历史数据,基于pearson算法进行主成分分析,确定历史数据中用于进行规则关联方法的相关参数及其数据,作为用于关联规则的主数据。
5.根据权利要求4所述的挖掘方法,其特征在于,所述主成分分析为:根据负荷数据来源的区域、层级、行业,结合负荷的来源和经济统计数据的影响因素,确定各影响因素与经济性描述数据及行业负荷数据之间的主要影响成分;计算影响因素与经济及负荷数据之间的Pearson相关性分布系数的公式如下:
其中,Pyx为负荷或经济性数据y与相应的影响因素x的Pearson相关性系数;yk,xk分别为第k个时间戳的时间序列数据y与影响因素参数x的样本,和分别为y和x的平均值,n为样本数量的总数。
6.根据权利要求1所述的方法,其特征在于,所述关联规则挖掘还包括:
分层级读取历史负荷数据库及负荷-气象数据库的数据,进行数据分析,实现温度与用电负荷的解耦,建立系统负荷与历史负荷、天气数据的关系模型;
分层级读取负荷-气象数据库和负荷-经济特征数据库,确定用电负荷数据与分行业统计的负荷数据、气象数据、经济学描述数据之间的规则关联方法,将参数中规则关联度大于预定门限的参数视为存在较密切的关联关系。
7.根据权利要求1所述的方法,其特征在于,所述将参数中规则关联度大于预定门限的参数视为存在较密切的关联关系包括分析参数间关联关系相关度大于预定门限的参数的选取方法,其具体为:
将出现在同一线路的用电负荷数据或者同一时间戳所有线路的用电数据中,负荷参数、经济性参数、时间参数作为共同考虑进行规则关联的待分析的项;
在项集中,基于预定支持度门限,获取支持度大于等于门限度的项,由所选的项聚合生成频繁项集;其中,项间的预定相关度的门限与项集的支持度呈正相关性。
8.根据权利要求7所述的所述的方法,其特征在于,分析参数间关联关系相关度大于预定门限的参数的选取方法还包括参数门限关联度判别方法,其中,基于设定的门限支持度,获取大于等于该支持度的项,聚合生成频繁项集,包括:
基于预设支持度门限,从数据中搜索支持度大于等于门限的项,聚合生成频繁项集;
在n-1维的频繁项集的基础上获取第n维的频繁项集,直到在第n+1维的频繁项集中,该集合的项集为空为止。其中,n为不小于1的正整数,同时n不超过项的总数。
9.根据权利要求8所述的方法,其特征在于,频繁项集获取方法中,决定预定相关度的门限和参数相关度的关联关系方法,包括:
将包含负荷数据、经济数据的每个参数分别作为数据集中待分析的项,生成负荷数据信息向量;
根据分类方法,将相似的行业用电贡献、经济贡献的数据集合,基于预定支持度门限,获取支持度大于门限的项,聚合生成频繁项集。其中,项间的预定相关度的门限与项集的支持度呈正相关性。
基于所述预定支持度门限阈值及规则关联算法,确定源分析数据的时间数据、负荷数据、经济参数与经济性描述数据之间的规则关联度,探索所述参数类型下,不同参数之间的关联关系。
10.一种实现权利要求1所述的方法的考虑区域及经济影响的负荷特征指标关联性挖掘系统,其特征在于,
其包括:信息数据流获取模块,用于获取待挖掘的负荷数据的信息数据流;
气象及经济描述数据获取模块,用于根据信息数据流获取模块中信息数据流的地理信息,获取对应地理信息的经济特征数据和气象特征数据,将以上数据按照用电的行业分别统计,获得分行业统计的负荷数据、气象数据、经济学描述数据;
数据库模块,用于将气象及经济描述数据获取模块所获得的数据依照地理位置的行政区域划分分层级存储入数据库;
主数据筛选模块,用于从数据库中选取用于关联规则的主数据;
关联规则挖掘模块,用于根据主数据筛选模块中选取的主数据,确定用电负荷数据与分行业统计的负荷数据、气象数据、经济学描述数据之间的规则关联方法,将参数中规则关联度大于预定门限的参数视为存在较密切的关联关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211488712.3A CN115907822A (zh) | 2022-11-25 | 2022-11-25 | 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211488712.3A CN115907822A (zh) | 2022-11-25 | 2022-11-25 | 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115907822A true CN115907822A (zh) | 2023-04-04 |
Family
ID=86475863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211488712.3A Pending CN115907822A (zh) | 2022-11-25 | 2022-11-25 | 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115907822A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116415984A (zh) * | 2023-06-09 | 2023-07-11 | 江苏圣骏智能科技有限公司 | 一种分布式自助机的管理系统及方法 |
CN116742625A (zh) * | 2023-08-14 | 2023-09-12 | 天津大学 | 变电站下网负荷的预测方法及系统 |
CN117335409A (zh) * | 2023-10-26 | 2024-01-02 | 河北建投电力科技服务有限公司 | 基于人工智能的电力用户负荷预测系统 |
-
2022
- 2022-11-25 CN CN202211488712.3A patent/CN115907822A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116415984A (zh) * | 2023-06-09 | 2023-07-11 | 江苏圣骏智能科技有限公司 | 一种分布式自助机的管理系统及方法 |
CN116415984B (zh) * | 2023-06-09 | 2023-08-18 | 江苏圣骏智能科技有限公司 | 一种分布式自助机的管理系统及方法 |
CN116742625A (zh) * | 2023-08-14 | 2023-09-12 | 天津大学 | 变电站下网负荷的预测方法及系统 |
CN116742625B (zh) * | 2023-08-14 | 2023-12-19 | 天津大学 | 变电站下网负荷的预测方法及系统 |
CN117335409A (zh) * | 2023-10-26 | 2024-01-02 | 河北建投电力科技服务有限公司 | 基于人工智能的电力用户负荷预测系统 |
CN117335409B (zh) * | 2023-10-26 | 2024-04-19 | 河北建投电力科技服务有限公司 | 基于人工智能的电力用户负荷预测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN113962364B (zh) | 一种基于深度学习的多因素用电负荷预测方法 | |
CN108491969B (zh) | 基于大数据的空间负荷预测模型构建方法 | |
CN109919353B (zh) | 一种基于空间相关性的arima模型的分布式光伏预测方法 | |
CN115907822A (zh) | 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 | |
Shang et al. | Short-term load forecasting based on PSO-KFCM daily load curve clustering and CNN-LSTM model | |
CN110503256B (zh) | 基于大数据技术的短期负荷预测方法及系统 | |
CN111324642A (zh) | 一种面向电网大数据分析的模型算法选型与评价方法 | |
WO2020098728A1 (zh) | 集群负荷预测方法、装置及存储介质 | |
CN105374209B (zh) | 一种城市区域路网运行状态特征信息提取方法 | |
CN110750524A (zh) | 一种有源配电网故障特征的确定方法及系统 | |
CN105678481A (zh) | 一种基于随机森林模型的管线健康状态评估方法 | |
CN110097220B (zh) | 一种风力发电月度电量预测方法 | |
CN101728868A (zh) | 遥测电力负荷特性的分类和预测方法 | |
CN107748940B (zh) | 一种节电潜力量化预测方法 | |
CN117236199B (zh) | 城市水网区域河湖水质提升与水安全保障方法及系统 | |
CN108256724B (zh) | 一种基于动态行业系数的配电网可开放容量规划方法 | |
Wang et al. | Prediction and analysis of train passenger load factor of high-speed railway based on LightGBM algorithm | |
CN113537569B (zh) | 一种基于权重堆叠决策树的短时公交客流预测方法及系统 | |
CN108830405B (zh) | 基于多指标动态匹配的实时电力负荷预测系统及其方法 | |
CN114580494A (zh) | 基于随机森林算法的依据企业用电对排污行为的监测方法 | |
CN115905319B (zh) | 一种海量用户电费异常的自动识别方法及系统 | |
CN115907228A (zh) | 一种基于pso-lssvm的短期电力负荷预测分析方法 | |
CN114648163A (zh) | 一种适用于智慧城市的能耗数据管理系统及方法 | |
CN114372835A (zh) | 综合能源服务潜力客户识别方法、系统及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |