CN115860273B - 用电负荷预测方法、装置、计算机设备和存储介质 - Google Patents

用电负荷预测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN115860273B
CN115860273B CN202310146456.8A CN202310146456A CN115860273B CN 115860273 B CN115860273 B CN 115860273B CN 202310146456 A CN202310146456 A CN 202310146456A CN 115860273 B CN115860273 B CN 115860273B
Authority
CN
China
Prior art keywords
data
target
features
fitting
source heterogeneous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310146456.8A
Other languages
English (en)
Other versions
CN115860273A (zh
Inventor
李鹏
黄文琦
梁凌宇
曹尚
张焕明
戴珍
侯佳萱
李轩昂
习伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Power Grid Digital Grid Research Institute Co Ltd
Original Assignee
Southern Power Grid Digital Grid Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern Power Grid Digital Grid Research Institute Co Ltd filed Critical Southern Power Grid Digital Grid Research Institute Co Ltd
Priority to CN202310146456.8A priority Critical patent/CN115860273B/zh
Publication of CN115860273A publication Critical patent/CN115860273A/zh
Application granted granted Critical
Publication of CN115860273B publication Critical patent/CN115860273B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本申请涉及一种用电负荷预测方法、装置、计算机设备和存储介质。所述方法包括:获取电力多源异构数据;对所述电力多源异构数据进行回归预测,得到目标数据;对所述目标数据进行探索分析,得到多个相关指标特征;所述相关指标特征用于表征所述目标数据和用电负荷的相关性;根据多个所述相关指标特征和所述目标数据构建评价样本集;对所述评价样本集中的样本数据进行标度排序,得到标度排序结果;根据所述标度排序结果对多个所述相关指标特征去冗余,得到目标特征集;根据所述目标特征集对所述用电负荷进行预测。采用本方法能够提高用电负荷预测的准确性。

Description

用电负荷预测方法、装置、计算机设备和存储介质
技术领域
本申请涉及电力分析技术领域,特别是涉及一种用电负荷预测方法、装置、计算机设备和存储介质。
背景技术
随着经济和科学的发展,电力需求越来越大。为实现科学地配电,需要对用户用电进行预测,以确定配电网的用电负荷。
相关技术中,采取灰色关联模型直接对配电网的用电负荷进行预测,然而这种方式存在用电负荷预测不准确的问题。因此,如何提高用电负荷预测的准确性,成为本领域技术人员亟需解决的技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高用电负荷预测准确性的用电负荷预测方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种用电负荷预测方法。所述方法包括:
获取电力多源异构数据;
对所述电力多源异构数据进行回归预测,得到目标数据;
对所述目标数据进行探索分析,得到多个相关指标特征;所述相关指标特征用于表征所述目标数据和用电负荷的相关性;
根据多个所述相关指标特征和所述目标数据构建评价样本集;
对所述评价样本集中的样本数据进行标度排序,得到标度排序结果;
根据所述标度排序结果对多个所述相关指标特征去冗余,得到目标特征集;
根据所述目标特征集对所述用电负荷进行预测。
在其中一个实施例中,所述对所述电力多源异构数据进行回归预测,得到目标数据,包括:
从所述电力多源异构数据中筛选出异常数据;
对所述异常数据进行回归预测,得到对应的回归预测数据;
将所述回归预测数据填充至筛选后的电力多源异构数据中,得到所述目标数据。
在其中一个实施例中,所述异常数据包括异常值和缺失值;
所述对所述异常数据进行回归预测,得到对应的回归预测数据,包括:
根据所述电力多源异构数据对所述异常值和所述缺失值进行预测,得到对应的预测值;
根据所述电力多源异构数据对所述异常值和所述缺失值进行拟合处理,得到对应的拟合值;
根据所述预测值和所述拟合值计算得到所述回归预测数据。
在其中一个实施例中,所述对所述目标数据进行探索分析,得到多个相关指标特征,包括:
根据预设的分析维度对所述目标数据进行分类,得到各所述分析维度对应的维度数据;
获取各所述分析维度对应的维度特征;
根据各所述分析维度对应的维度数据和对应的维度特征进行相关性分析,得到多个初步相关特征;
根据所述目标数据和多个所述初步相关特征进行拟合分析,得到多个所述相关指标特征。
在其中一个实施例中,所述根据所述目标数据和多个所述初步相关特征进行拟合分析,得到多个所述相关指标特征,包括:
将所述目标数据和各所述初步相关特征进行一元线性拟合,得到多个第一拟合结果,并根据多个所述第一拟合结果在各所述初步相关特征中筛选得到第一指标特征;
将所述目标数据和各所述初步相关特征进行多元线性拟合,得到第二拟合结果,并根据所述第二拟合结果在各所述初步相关特征中筛选得到第二指标特征;
根据所述第一指标特征和所述第二指标特征,得到多个所述相关指标特征。
在其中一个实施例中,所述对所述评价样本集中的样本数据进行标度排序,得到标度排序结果,包括:
根据所述评价样本集中的样本数据和预设的映射关系构建得到判断矩阵;所述映射关系用于表征样本数据之间的重要程度;
根据所述判断矩阵进行权数分配,得到标度排序结果。
在其中一个实施例中,所述根据所述标度排序结果对多个所述相关指标特征去冗余,得到目标特征集,包括:
根据所述标度排序结果获取各相关指标特征对应的标度排序值;
将所述标度排序值满足预设条件的所述相关指标特征标记为目标特征集中的目标特征。
第二方面,本申请还提供了一种用电负荷预测装置。所述装置包括:
数据获取模块,用于获取电力多源异构数据;
回归预测模块,用于对所述电力多源异构数据进行回归预测,得到目标数据;
探索分析模块,用于对所述目标数据进行探索分析,得到多个相关指标特征;所述相关指标特征用于表征所述目标数据和用电负荷的相关性;
构建模块,用于根据多个所述相关指标特征和所述目标数据构建评价样本集;
标度排序模块,用于对所述评价样本集中的样本数据进行标度排序,得到标度排序结果;
去冗余模块,用于根据所述标度排序结果对多个所述相关指标特征去冗余,得到目标特征集;
预测模块,用于根据所述目标特征集对所述用电负荷进行预测。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的用电负荷预测方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的用电负荷预测方法的步骤。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的用电负荷预测方法的步骤。
上述用电负荷预测方法、装置、计算机设备和存储介质,通过获取电力多源异构数据,从而保证电力数据的全面性,避免因电力数据的局限性和不确定性导致用电负荷的预测不全面,通过对电力多源异构数据进行回归预测,从而实现了对电力多源异构数据的重整和提炼,保证了数据的完整性,通过根据标度排序结果对多个相关指标特征去冗余,从而实现了特征的提炼,避免无关特征对用电负荷预测的影响,进而提高了用电负荷预测的准确性。
附图说明
图1为一个实施例中用电负荷预测方法的应用环境图;
图2为一个实施例中用电负荷预测方法的流程示意图;
图3为一个实施例中目标数据确定步骤的流程示意图;
图4为一个实施例中回归预测数据确定步骤的流程示意图;
图5为一个实施例中相关指标特征确定步骤的第一流程示意图;
图6为一个实施例中相关指标特征确定步骤的第二流程示意图;
图7为一个实施例中标度排序结果确定步骤的流程示意图
图8为另一个实施例中用电负荷预测方法的流程示意图;
图9为一个实施例中用电负荷预测装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的用电负荷预测方法,可以应用于如图1所示的应用环境中。该用电负荷预测方法可以由终端102执行,也可以由服务器104执行,在本申请实施例中以终端102执行该用电负荷预测方法为例进行说明。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据,如存储电力多源异构数据、映射关系等。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102获取电力多源异构数据,然后对电力多源异构数据进行回归预测,得到目标数据,对目标数据进行探索分析,得到多个相关指标特征,根据相关指标特征和目标数据构建评价样本集,对评价样本集中的样本数据进行标度排序,得到标度排序结果,再根据标度排序结果对多个相关指标特征去冗余,得到目标特征集,根据目标特征集对用电负荷进行预测。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种用电负荷预测方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
步骤202,获取电力多源异构数据。
其中,电力多源异构数据可以指来自多个数据源、存在多种数据构型的电力数据。多源可以指多个数据源,即数据的来源多元化,如数据源可以是不同数据库系统和不同数据采集设备等。异构可以指数据种类及形态具有复杂性、异构性,其包括结构化数据、半结构化数据和非结构化数据。
示例性地,可以建立用于存储电力多源异构数据的多源异构数据库,该多源异构数据库可以与各个电力采集设备和电力数据处理系统相连接,以获取电力采集设备和电力数据处理系统的数据。终端102可以直接通过访问多源异构数据库,以获取得到电力多源异构数据。
示例性地,电力多源异构数据可以存储在服务器104中,终端102可以通过网络的方式获取电力多源异构数据。
通过获取电力多源异构数据,从而保证电力数据的全面性,避免因电力数据的局限性和不确定性导致用电负荷的预测不全面。
步骤204,对电力多源异构数据进行回归预测,得到目标数据。
其中,回归预测可以指用于对电力多源异构数据中异常数据进行清洗、修正、修复的处理方式。通过对电力多源异构数据进行回归预测,以保证处理后的电力多源异构数据所携带信息量的完整性。如可以对电力多源异构数据进行缺失值修复、错误值识别和更正、冗余值删除等操作。
目标数据可以指对电力多源异构数据回归预测后得到的数据。目标数据所携带的信息量比电力多源异构数据所携带的信息量更加完整,冗余性更低。
示例性地,可以从电力多源异构数据中提取出异常的数据,然后再根据正常的对这些异常的数据进行修正、修复等操作,从而实现对电力多源异构数据的回归预测,得到目标数据。
相关技术中,当数据中存在异常数据(如缺失值、异常值)时,是直接将异常数据直接删除,或者如采用的Aprior算法对数据进行处理时,是直接对样本进行平均处理,客观性较差。即相关技术中对异常数据的处理方式,容易导致数据携带信息量的不完整,本实施例,通过对电力多源异构数据进行回归预测,从而实现了对电力多源异构数据的重整和提炼,保证了数据的完整性。
步骤206,对目标数据进行探索分析,得到多个相关指标特征;相关指标特征用于表征目标数据和用电负荷的相关性。
其中,探索分析可以指用于对影响用电负荷因素的探索式分析。该探索分析包括数据可视化分析(如作图、制表、时间序列的趋势波动分析等)、方程拟合、计算特征量等方式。通过对目标数据进行探索分析能够判断目标数据的稳定性、确定目标数据之间的相关性以及确定对用电负荷的影响因素。
示例性地,可以先将目标数据进行数据可视化处理,然后再对数据可视化后的目标数据进行分析,得到多个相关指标特征。
例如,可以根据目标数据构建得到对应的相关系数热力图矩阵,然后再通过相关系数热力图矩阵分析各个特征之间的相关性及各个特征与用电负荷之间的相关性,并选择其中相关性较高的多个特征作为相关指标特征。
例如,可以根据目标数据的时间戳构建目标数据关于时间序列的变化趋势图,然后再通过时间序列的趋势波动分析目标数据中各个对用电负荷的特征,随着时间变化对应的变化特性,然后再基于变化特性筛选得到对应的相关指标特征。
例如,可以根据目标数据构建得到对应的相关系数热力图矩阵,然后再通过相关系数热力图矩阵分析各个特征之间的相关性及各个特征与用电负荷之间的相关性,然后再根据时间序列的变化趋势筛选得到相关指标特征。
例如,可以将目标数据中各个特征对用电负荷的影响程度之间进行对比,得到不同特征之间的特性,然后再根据不同特征之间的特性确定多个相关指标特征。
步骤208,根据多个相关指标特征和目标数据构建评价样本集。
其中,评价样本集可以指用于进行重要性排序的样本数据所组成的数据集。
示例性地,可以将相关指标特征标记为评价目标,然后在目标数据中获取各评价目标对应的数据,并将该数据作为样本数据。确定各指标相关特征对应的数据,得到多个样本数据,多个样本数据组成评价样本集。
步骤210,对评价样本集中的样本数据进行标度排序,得到标度排序结果。
其中,标度排序可以指用于对评价样本集中的样本数据计算相对重要性分数,然后再根据相对重要性分数进行排序的处理方式。通过对样本数据进行标度排序,能够确定样本数据对应的评价目标(相关指标特征)对用电负荷的影响程度。一般地,标度排序越靠前的样本数据对应的评价目标,其对用电负荷的影响程度越高,与用电负荷的关联程度越高,标度排序越靠后的样本数据对应的评价目标,其对用电负荷的影响程度越低,与用电负荷的关联程度越低。
标度排序结果用于表征样本数据对应的评价目标对用电负荷的影响程度和关联程度。标度排序结果中越靠前的样本数据对应的评价目标,其对用电负荷的影响程度越高,与用电负荷的关联程度越高;标度排序结果中越靠后的样本数据对应的评价目标,其对用电负荷的影响程度越低,与用电负荷的关联程度越低。
示例性地,可以计算评价样本集中各样本数据之间的相对重要性分数,然后根据对应的相关重要性分数进行排序,从而实现对评价样本集中各样本数据的标度排序,得到标度排序结果。
步骤212,根据标度排序结果对多个相关指标特征去冗余,得到目标特征集。
其中,去冗余可以指用于去除数据中重复的数据、或者去除数据中的无关特征参数、或者去除相关特征参数中较小的数据。通过对多个相关指标特征进行去冗余,能够去除相关指标特征中对用电负荷的影响较小的特征,去除相关指标特征中重复的特征等。
目标特征集可以指用于表征对用电负荷影响较大的目标特征所组成的集合。
示例性地,可以根据标度排序结果选择排序较为靠前的样本数据对应的相关指标特征,得到多个目标特征,多个目标特征组合得到目标特征集。
例如,当存在20个相关指标特征时,可以根据标度排序结果选择排序靠前的10个相关指标特征组成得到目标特征集。
步骤214,根据目标特征集对用电负荷进行预测。
示例性地,在确定对用电负荷影响较大的目标特征集后,根据目标特征集中的目标特征对用电负荷进行预测。
本申请实施例的用电负荷预测方法,通过获取电力多源异构数据,从而保证电力数据的全面性,避免因电力数据的局限性和不确定性导致用电负荷的预测不全面,通过对电力多源异构数据进行回归预测,从而实现了对电力多源异构数据的重整和提炼,保证了数据的完整性,通过根据标度排序结果对多个相关指标特征去冗余,从而实现了特征的提炼,避免无关特征对用电负荷预测的影响,进而提高了用电负荷预测的准确性。
如图3所示,在一些实施例中,步骤“对电力多源异构数据进行回归预测,得到目标数据”包括但不限于以下步骤:
步骤302,从电力多源异构数据中筛选出异常数据。
其中,筛选可以指用于将电力多源异构数据中的异常数据和正常数据进行分离的过程。通过将电力多源异构数据中的异常数据分离出来,从而便于实现对异常数据进行修复、修正、删除等处理,进而便于提高电力多源异构数据的完整性,提高后续的用电负荷预测的准确性。
示例性地,可以对电力多源异构数据进行识别处理,以确定电力多源异构数据中的异常数据和正常数据,然后将正常数据和异常数据进行分离,从而实现对异常数据的筛选。
步骤304,对异常数据进行回归预测,得到对应的回归预测数据。
其中,回归预测可以指用于对异常数据中存在异常的数值、缺失的数据进行预测,然后将预测后的数值填充到异常处,从而实现异常数据的修正和修复。如可以使用K近邻(K-Nearest Neighbor,KNN)算法或梯度提升树(gradient boosting tree,GBDT)算法对异常数据进行回归预测,得到对应的回归预测数据。
示例性地,可以根据电力多源异构数据中的正常数据对异常数据进行预测,得到对应的回归预测数据。
例如,可以使用KNN算法根据电力多源异构数据中的正常数据对异常数据进行回归预测,得到对应的回归预测数据。
步骤306,将回归预测数据填充至筛选后的电力多源异构数据中,得到目标数据。
其中,填充可以指将回归预测数据补充到电力多源异构数据中的缺失部分。在本实施例中,填充可以指用于将回归预测数据代替至异常数据。
示例性地,在将异常数据从电力多源异构数据中筛选出来后,筛选后的电力多源异构数据会缺失一部分数据,将回归预测数据填充该缺失的部分数据,从而使得电力多源异构数据恢复数据的完整性。
本申请实施例的技术方案,通过将异常数据从电力多源异构数据中筛选出来,然后对异常数据进行回归预测,得到回归预测数据,再将回归预测数据填充至筛选后的电力多源异构数据中,得到目标数据,从而实现了对电力多源异构数据的修正和修复,保证了电力多源异构数据的完整性,提高了用电负荷预测的准确性。
请参见图4,在一些实施例中,异常数据包括异常值和缺失值,步骤“对异常数据进行回归预测,得到对应的回归预测数据”包括但不限于以下步骤:
步骤402,根据电力多源异构数据对异常值和缺失值进行预测,得到对应的预测值。
其中,预测可以指用于根据电力多源异构数据中的正常数据对异常数据(异常值和缺失值)对应的正常值进行预测。如可以使用预测算法根据电力多源异构数据中的正常数据对异常值和缺失值进行预测,得到对应的预测值。预测算法可以是KNN算法等等。
预测值可以指根据电力多源异构数据中的正常数据对异常数据进行预测后,得到的异常数据对应的正常值。
示例性地,可以使用预测算法对异常值和缺失值进行预测,得到对应的预测值。
例如,可以使用KNN算法对异常值和缺失值进行预测,得到对应的预测值。其中,KNN算法是一种常见的监督学习方法。KNN算法使用距离新样本最近的K个样本来对新样本进行预测。其工作原理是:给出一定的带有标签的训练样本集,即清楚的知道训练样本中每一个样本所属的类别或是每个样本的目标值。输入没有标签的新数据后,将数据的每个特征和训练集的数据特征比较,在训练集中尝试找到相似度(距离)最接近新数据的K个数据,然后根据这K个训练集中的数据对新数据进行预测。通常,在分类任务中可以选择K个样本中出现最多类别的(投票)作为对数据分类的结果;在回归任务中可以使用K个样本中的平均值作为预测结果;还可以基于相似程度不同,赋予不同的权重,然后加权投票或者加权平均对结果预测。在使用KNN时,需要根据样本数据大小对K值进行设置,一般来说K值需要小于20。
步骤404,根据电力多源异构数据对异常值和缺失值进行拟合处理,得到对应的拟合值。
其中,拟合可以指用于根据电力多源异构数据中的正常数据进行拟合,得到对应的函数表达式,然后将异常值和缺失值代入函数表达式中,以确定异常值和缺失值对应的正常值的数据分析方式。如可以使用拟合算法进行拟合,如使用梯度提升树进行拟合。
拟合值可以指异常值和缺失值对应的正常值,该正常值通过根据电力多源异构数据中的正常数据进行拟合,得到函数表达式后,然后根据函数表达式计算得到。
示例性地,可以使用拟合算法,根据电力多源异构数据对异常值和缺失值进行拟合处理,得到对应的拟合值。
例如,可以通过使用梯度提升树根据电力多源异构数据对异常值和缺失值进行拟合处理,得到对应的拟合值。
步骤406,根据预测值和拟合值计算得到回归预测数据。
示例性地,可以将前述计算得到的预测值和拟合值进行取平均,以获取预测值和拟合值的平均值,然后再将该平均值作为回归预测数据。
本申请实施例的技术方案,通过确定电力多源异构数据中异常值和缺失值的预测值与拟合值,再根据预测值和拟合值计算得到回归预测数据,从而实现了对电力多源异构数据的修正和修复,提高了电力多源异构数据携带数据量的完整性,进而提高了用电负荷预测的准确性。
请参见图5,在一些实施例中,步骤“对目标数据进行探索分析,得到多个相关指标特征”包括但不限于以后步骤:
步骤502,根据预设的分析维度对目标数据进行分类,得到各分析维度对应的维度数据。
其中,分析维度可以指用于进行数据分析的维度。该分析维度为预先设定的,可以包括但不限于气象维度、经济维度、地域维度等。其中,气象维度包括但不限于温度、湿度、降雨量、风速和大气压等;经济维度包括但不限于产业结构、GDP和人口数量等;地域维度包括不同地域的用电特性等。
分类可以指用于根据分析维度对目标数据进行分组的过程。
示例性地,可以根据分析维度对目标数据进行分组,得到各个分析维度对应的维度数据。
例如,可以根据地域维度、气象维度和经济维度将目标数据分析分类,得到地域维度对应的维度数据、经济维度对应的维度数据和气象维度对应的维度数据。
步骤504,获取各分析维度对应的维度特征。
其中,维度特征可以指各个分析维度中对用电负荷影响的特征。该维度特征可以是温度特征、湿度特征、降雨量特征、地域用电特性、人口数量特征等等。
示例性地,可以根据各个维度的具体特性获取各分析维度对应的维度特征。
步骤506,根据各分析维度对应的维度数据和对应的维度特征进行相关性分析,得到多个初步相关特征。
其中,相关性分析可以指用于对维度数据和维度特征进行分析,以确定维度数据和维度特征之间的联系密切程度。
示例性地,可以对维度数据进行探索分析,以探索同一维度中不同特征之间是否存在不同的规律和特性,得到对应的初步相关特征。
例如,对于地域维度,可以对不同地域的数据进行分别的探索分析,以探索不同地域之间是否存在不同的规律和特性。对不同地域的用电负荷与各个分析维度的特征进行相关性分析,以得到初步相关特征。
步骤508,根据目标数据和多个初步相关特征进行拟合分析,得到多个相关指标特征。
其中,拟合分析可以指先将目标数据和初步相关特征进行拟合,得到拟合结果,然后根据拟合结果分析得到相关指标特征的处理方式。拟合分析包括一元线性拟合和多元线性拟合。
示例性地,可以将目标数据和多个初步相关特征进行一元线性拟合和多元线性拟合,得到一元线性拟合结果和多元线性拟合结果,然后再根据一元线性拟合结果和多元线性拟合结果确定对应的多个相关指标特征。
本申请实施例的技术方案,通过根据目标数据和多个初步相关特征进行拟合分析,以确定对用电负荷影响较大的相关指标特征,从而便于实现对用电负荷的预测,提高了用电负荷预测的准确性。
请参见图6,在一些实施例中,步骤“根据目标数据和多个初步相关特征进行拟合分析,得到多个相关指标特征”包括但不限于以下步骤:
步骤602,将目标数据和各初步相关特征进行一元线性拟合,得到多个第一拟合结果,并根据多个第一拟合结果在各初步相关特征中筛选得到第一指标特征。
其中,一元线性拟合可以指将目标数据和初步相关特征拟合为一元线性函数的拟合方式。在一元线性拟合时存在一个自变量和一个因变量。
第一拟合结果可以指进行一元线性拟合后得到的结果,该第一拟合结果为线性函数。多个初步相关特征都和目标数据进行一元线性拟合,即可得到多个第一拟合结果。
第一指标特征可以指初步相关特征中对用电负荷影响较大的指标特征。
对第一拟合结果进行分析,可以得到拟合得到的线性函数的斜率、拟合优度等,通过对斜率和拟合优度等进行分析,可确定第一拟合结果对应的相关特征对用电负荷的影响程度和可信程度。
本步骤中的筛选可以指通过对第一拟合结果进行分析,从多个第一拟合结果中选取对用电负荷影响程度较大,可信程度较高的特征,得到第一指标特征的过程。
示例性地,可以将每个初步相关特征和目标数据都进行一元线性拟合,得到各初步相关特征对应的第一拟合结果,然后再对第一拟合结果进行分析,确定第一拟合结果的拟合优度和斜率等,再根据拟合优度和斜率从初步相关特征中筛选得到可信程度较高的、对用电负荷影响较大的第一指标特征。
步骤604,将目标数据和各初步相关特征进行多元线性拟合,得到第二拟合结果,并根据第二拟合结果在各初步相关特征中筛选得到第二指标特征。
其中,多元线性拟合可以指将目标数据和多个初步相关特征拟合成为多元曲线的过程。在多元线性拟合中,存在多个自变量和一个因变量。如可以通过指数啮合实现多元线性拟合。
第二拟合结果可以指对目标数据和多个初步相关特征进行拟合得到的多元曲线。在本实施例中,第二拟合结果可以有一个,也可以有多个。
第二指标特征可以指初步相关特征中在多个特征相互影响时对用电负荷影响较大的指标特征。
示例性地,可以将目标数据和各初步相关特征进行指数啮合,得到第二拟合结果,然后再对第二拟合结果进行分析,以筛选得到各个初步相关特征中对用电负荷影响较大的第二指标特征。
步骤606,根据第一指标特征和第二指标特征,得到多个相关指标特征。
示例性地,可以将所有的第一指标特征和所有的第二指标特征都标记为相关指标特征,也可以在第一指标特征和第二指标特征中选取可信程度更高的多个特征,得到多个相关指标特征。
请参见图7,在一些实施例中,步骤“对评价样本集中的样本数据进行标度排序,得到标度排序结果”包括但不限于以下步骤:
步骤702,根据评价样本集中的样本数据和预设的映射关系构建得到判断矩阵;映射关系用于表征样本数据之间的重要程度。
其中,映射关系可以指用于表征样本数据之间的重要程度的关系。该映射关系可以通过计算样本数据之间的标度得到,也可以为预先设置的。如,该映射关系可以如表1所示,表1如下:
表1
标度 标度含义
1 表示样本数据
Figure SMS_17
Figure SMS_21
比较,具有同等重要性
3 表示样本数据
Figure SMS_23
Figure SMS_1
比较,
Figure SMS_6
Figure SMS_10
稍微重要
5 表示样本数据
Figure SMS_13
Figure SMS_2
比较,
Figure SMS_5
Figure SMS_9
明显重要
7 表示样本数据
Figure SMS_14
Figure SMS_7
比较,
Figure SMS_11
Figure SMS_15
强烈重要
9 表示样本数据
Figure SMS_19
Figure SMS_18
比较,
Figure SMS_20
Figure SMS_22
极端重要
2,4,6,8 表示相邻判断的中值
倒数 表示样本数据
Figure SMS_24
Figure SMS_3
比较的判断
Figure SMS_8
,则
Figure SMS_12
Figure SMS_16
比较得判断
Figure SMS_4
可以以A表示评价目标(相关指标特征),U表示评价样本集,
Figure SMS_25
表示样本数据,/>
Figure SMS_26
∈U,(k=1,2,...,m)用/>
Figure SMS_27
表示样本数据/>
Figure SMS_28
对样本数据/>
Figure SMS_29
的相对重要性数值(l=1,2,...,m),/>
Figure SMS_30
的取值可以如表1所示。
示例性地,可以从服务器中获取得到映射关系,该映射关系可以如表1所示,然后根据映射关系和评价样本集中的样本数据构建得到判断矩阵,该判断矩阵可以如公式(1)所示,公式(1)具体为:
Figure SMS_31
(1)
步骤704,根据判断矩阵进行权数分配,得到标度排序结果。
其中,权数分配可以指根据样本数据对应的相关指标特征在用电负荷的影响程度大小进行排序的过程。
标度排序结果可以指相关指标特征的重要性值的排序结果。该标度排序结果包括各个相关指标特征对应的重要性值和各相关指标特征的排序值。
示例性地,可以根据判断矩阵计算最大特征根对应的特征向量,该最大特征根对应的特征向量即为相关指标特征的重要性排序值。
例如,可以计算判断矩阵每一行元素的乘积
Figure SMS_32
,该乘积/>
Figure SMS_33
可以如公式(2)所示,公式(2)具体为:
Figure SMS_34
(2)
在计算得到乘积
Figure SMS_35
后,取乘积/>
Figure SMS_36
的m次方根/>
Figure SMS_37
,该/>
Figure SMS_38
可以如公式(3)所示,公式(3)为:
Figure SMS_39
(3)
然后再对m次方根做归一化处理,并将归一化处理后的向量作为最大特征根对应的最大特征向量。归一化过程可以如下公式(4)所示:
Figure SMS_40
(4)
通过以上步骤计算得到判断矩阵的最大特征根对应的特征向量,从而确定标度排序结果,便于后续根据标度排序结果筛选得到相关指标特征,进而提高了用电负荷预测的准确性。
在一些实施例中,步骤“根据标度排序结果对多个相关指标特征去冗余,得到目标特征集”包括:根据标度排序结果获取各相关指标特征对应的标度排序值;将标度排序值满足预设条件的相关指标特征标记为目标特征集中的目标特征。
其中,标度排序值可以指各相关指标特征对用电负荷的影响程度值,标度排序值越高说明对应的相关指标特征对用电负荷的影响越大。
预设条件可以指预先设置的、用于筛选相关指标特征得到目标特征的条件。如该预设条件可以是标度排序值在预设值之前的,如可以是标度排序值在10之前的。
示例性地,首先根据前述计算步骤得到的标度排序结果获取各相关指标特征对应的标度排序值,然后再将满足预设条件的标度排序值对应的相关指标特征标记为目标特征,得到目标特征集。
请参见图8,在一些实施例中,用电负荷预测方法包括但不限于以下步骤:
步骤802,获取电力多源异构数据。
步骤804,从电力多源异构数据中筛选出异常数据。
步骤806,根据电力多源异构数据对异常值和缺失值进行预测,得到对应的预测值。
步骤808,根据电力多源异构数据对异常值和缺失值进行拟合处理,得到对应的拟合值。
步骤810,根据预测值和拟合值计算得到回归预测数据;将回归预测数据填充至筛选后的电力多源异构数据中,得到目标数据。
步骤812,根据预设的分析维度对目标数据进行分类,得到各分析维度对应的维度数据。
步骤814,获取各分析维度对应的维度特征,根据各分析维度对应的维度数据和对应的维度特征进行相关性分析,得到多个初步相关特征。
步骤816,将目标数据和各初步相关特征进行一元线性拟合,得到多个第一拟合结果,并根据多个第一拟合结果在各初步相关特征中筛选得到第一指标特征。
步骤818,将目标数据和各初步相关特征进行多元线性拟合,得到第二拟合结果,并根据第二拟合结果在各初步相关特征中筛选得到第二指标特征。
步骤820,根据第一指标特征和第二指标特征,得到多个相关指标特征。
步骤822,根据多个相关指标特征和目标数据构建评价样本集。
步骤824,根据评价样本集中的样本数据和预设的映射关系构建得到判断矩阵;映射关系用于表征样本数据之间的重要程度。
步骤826,根据判断矩阵进行权数分配,得到标度排序结果。
步骤828,根据标度排序结果获取各相关指标特征对应的标度排序值,
步骤830,将标度排序值满足预设条件的相关指标特征标记为目标特征集中的目标特征。
步骤832,根据目标特征集对用电负荷进行预测。
具体地,步骤802~步骤832的具体步骤请参照前述的实施例,在此不再赘述。
本申请实施例的技术方案,通过获取电力多源异构数据,从而保证电力数据的全面性,避免因电力数据的局限性和不确定性导致用电负荷的预测不全面,提高了用电负荷预测的准确性;通过对电力多源异构数据进行回归预测,从而实现了对电力多源异构数据的重整和提炼,保证了数据的完整性,从而提高了用电预测的准确性;通过对多个相关指标特征进行去冗余,能够去除相关指标特征中对用电负荷的影响较小的特征,去除相关指标特征中重复的特征等,得到目标特征集,提高了用电负荷预测的准确性。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的用电负荷预测方法的用电负荷预测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似。
在一个实施例中,如图9所示,提供了一种用电负荷预测装置,包括:数据获取模块902、回归预测模块904、探索分析模块906、构建模块908、标度排序模块910、去冗余模块912和预测模块914,其中:
数据获取模块902,用于获取电力多源异构数据。
回归预测模块904,用于对电力多源异构数据进行回归预测,得到目标数据。
探索分析模块906,用于对目标数据进行探索分析,得到多个相关指标特征;相关指标特征用于表征目标数据和用电负荷的相关性。
构建模块908,用于根据多个相关指标特征和目标数据构建评价样本集。
标度排序模块910,用于对评价样本集中的样本数据进行标度排序,得到标度排序结果。
去冗余模块912,用于根据标度排序结果对多个相关指标特征去冗余,得到目标特征集。
预测模块914,用于根据目标特征集对用电负荷进行预测。
在一些实施例中,回归预测模块904还用于从电力多源异构数据中筛选出异常数据;对异常数据进行回归预测,得到对应的回归预测数据;将回归预测数据填充至筛选后的电力多源异构数据中,得到目标数据。
在一些实施例中,回归预测模块904还用于根据电力多源异构数据对异常值和缺失值进行预测,得到对应的预测值;根据电力多源异构数据对异常值和缺失值进行拟合处理,得到对应的拟合值;根据预测值和拟合值计算得到回归预测数据。
在一些实施例中,探索分析模块906还用于根据预设的分析维度对目标数据进行分类,得到各分析维度对应的维度数据;获取各分析维度对应的维度特征;根据各分析维度对应的维度数据和对应的维度特征进行相关性分析,得到多个初步相关特征;根据目标数据和多个初步相关特征进行拟合分析,得到多个相关指标特征。
在一些实施例中,探索分析模块906还用于将目标数据和各初步相关特征进行一元线性拟合,得到多个第一拟合结果,并根据多个第一拟合结果在各初步相关特征中筛选得到第一指标特征;将目标数据和各初步相关特征进行多元线性拟合,得到第二拟合结果,并根据第二拟合结果在各初步相关特征中筛选得到第二指标特征;根据第一指标特征和第二指标特征,得到多个相关指标特征。
在一些实施例中,标度排序模块910还用于根据评价样本集中的样本数据和预设的映射关系构建得到判断矩阵;映射关系用于表征样本数据之间的重要程度;根据判断矩阵进行权数分配,得到标度排序结果。
在一些实施例中,去冗余模块912还用于根据标度排序结果获取各相关指标特征对应的标度排序值;将标度排序值满足预设条件的相关指标特征标记为目标特征集中的目标特征。
上述用电负荷预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种用电负荷预测方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取电力多源异构数据;对电力多源异构数据进行回归预测,得到目标数据;对目标数据进行探索分析,得到多个相关指标特征;相关指标特征用于表征目标数据和用电负荷的相关性;根据多个相关指标特征和目标数据构建评价样本集;对评价样本集中的样本数据进行标度排序,得到标度排序结果;根据标度排序结果对多个相关指标特征去冗余,得到目标特征集;根据目标特征集对用电负荷进行预测。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从电力多源异构数据中筛选出异常数据;对异常数据进行回归预测,得到对应的回归预测数据;将回归预测数据填充至筛选后的电力多源异构数据中,得到目标数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据电力多源异构数据对异常值和缺失值进行预测,得到对应的预测值;根据电力多源异构数据对异常值和缺失值进行拟合处理,得到对应的拟合值;根据预测值和拟合值计算得到回归预测数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据预设的分析维度对目标数据进行分类,得到各分析维度对应的维度数据;获取各分析维度对应的维度特征;根据各分析维度对应的维度数据和对应的维度特征进行相关性分析,得到多个初步相关特征;根据目标数据和多个初步相关特征进行拟合分析,得到多个相关指标特征。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将目标数据和各初步相关特征进行一元线性拟合,得到多个第一拟合结果,并根据多个第一拟合结果在各初步相关特征中筛选得到第一指标特征;将目标数据和各初步相关特征进行多元线性拟合,得到第二拟合结果,并根据第二拟合结果在各初步相关特征中筛选得到第二指标特征;根据第一指标特征和第二指标特征,得到多个相关指标特征。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据评价样本集中的样本数据和预设的映射关系构建得到判断矩阵;映射关系用于表征样本数据之间的重要程度;根据判断矩阵进行权数分配,得到标度排序结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据标度排序结果获取各相关指标特征对应的标度排序值;将标度排序值满足预设条件的相关指标特征标记为目标特征集中的目标特征。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取电力多源异构数据;对电力多源异构数据进行回归预测,得到目标数据;对目标数据进行探索分析,得到多个相关指标特征;相关指标特征用于表征目标数据和用电负荷的相关性;根据多个相关指标特征和目标数据构建评价样本集;对评价样本集中的样本数据进行标度排序,得到标度排序结果;根据标度排序结果对多个相关指标特征去冗余,得到目标特征集;根据目标特征集对用电负荷进行预测。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从电力多源异构数据中筛选出异常数据;对异常数据进行回归预测,得到对应的回归预测数据;将回归预测数据填充至筛选后的电力多源异构数据中,得到目标数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据电力多源异构数据对异常值和缺失值进行预测,得到对应的预测值;根据电力多源异构数据对异常值和缺失值进行拟合处理,得到对应的拟合值;根据预测值和拟合值计算得到回归预测数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据预设的分析维度对目标数据进行分类,得到各分析维度对应的维度数据;获取各分析维度对应的维度特征;根据各分析维度对应的维度数据和对应的维度特征进行相关性分析,得到多个初步相关特征;根据目标数据和多个初步相关特征进行拟合分析,得到多个相关指标特征。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将目标数据和各初步相关特征进行一元线性拟合,得到多个第一拟合结果,并根据多个第一拟合结果在各初步相关特征中筛选得到第一指标特征;将目标数据和各初步相关特征进行多元线性拟合,得到第二拟合结果,并根据第二拟合结果在各初步相关特征中筛选得到第二指标特征;根据第一指标特征和第二指标特征,得到多个相关指标特征。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据评价样本集中的样本数据和预设的映射关系构建得到判断矩阵;映射关系用于表征样本数据之间的重要程度;根据判断矩阵进行权数分配,得到标度排序结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据标度排序结果获取各相关指标特征对应的标度排序值;将标度排序值满足预设条件的相关指标特征标记为目标特征集中的目标特征。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤::获取电力多源异构数据;对电力多源异构数据进行回归预测,得到目标数据;对目标数据进行探索分析,得到多个相关指标特征;相关指标特征用于表征目标数据和用电负荷的相关性;根据多个相关指标特征和目标数据构建评价样本集;对评价样本集中的样本数据进行标度排序,得到标度排序结果;根据标度排序结果对多个相关指标特征去冗余,得到目标特征集;根据目标特征集对用电负荷进行预测。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从电力多源异构数据中筛选出异常数据;对异常数据进行回归预测,得到对应的回归预测数据;将回归预测数据填充至筛选后的电力多源异构数据中,得到目标数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据电力多源异构数据对异常值和缺失值进行预测,得到对应的预测值;根据电力多源异构数据对异常值和缺失值进行拟合处理,得到对应的拟合值;根据预测值和拟合值计算得到回归预测数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据预设的分析维度对目标数据进行分类,得到各分析维度对应的维度数据;获取各分析维度对应的维度特征;根据各分析维度对应的维度数据和对应的维度特征进行相关性分析,得到多个初步相关特征;根据目标数据和多个初步相关特征进行拟合分析,得到多个相关指标特征。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将目标数据和各初步相关特征进行一元线性拟合,得到多个第一拟合结果,并根据多个第一拟合结果在各初步相关特征中筛选得到第一指标特征;将目标数据和各初步相关特征进行多元线性拟合,得到第二拟合结果,并根据第二拟合结果在各初步相关特征中筛选得到第二指标特征;根据第一指标特征和第二指标特征,得到多个相关指标特征。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据评价样本集中的样本数据和预设的映射关系构建得到判断矩阵;映射关系用于表征样本数据之间的重要程度;根据判断矩阵进行权数分配,得到标度排序结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据标度排序结果获取各相关指标特征对应的标度排序值;将标度排序值满足预设条件的相关指标特征标记为目标特征集中的目标特征。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccessMemory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种用电负荷预测方法,其特征在于,所述方法包括:
获取电力多源异构数据;所述电力多源异构数据是指来自多个数据源、存在多种数据构型的电力数据,包括结构化数据、半结构化数据和非结构化数据;
对所述电力多源异构数据进行回归预测,得到目标数据;
对所述目标数据进行探索分析,得到多个相关指标特征;所述相关指标特征用于表征所述目标数据和用电负荷的相关性;
根据多个所述相关指标特征和所述目标数据构建评价样本集;
对所述评价样本集中的样本数据进行标度排序,得到标度排序结果;
根据所述标度排序结果对多个所述相关指标特征去冗余,得到目标特征集;
根据所述目标特征集对所述用电负荷进行预测;
其中,所述对所述电力多源异构数据进行回归预测,得到目标数据,包括:
从所述电力多源异构数据中筛选出异常数据;
采取K近邻算法或者梯度提升树算法对所述异常数据进行回归预测,得到对应的回归预测数据;
将所述回归预测数据填充至筛选后的电力多源异构数据中,得到所述目标数据;
其中,对所述目标数据进行探索分析,得到多个相关指标特征,包括:根据预设的分析维度对所述目标数据进行分类,得到各所述分析维度对应的维度数据;
获取各所述分析维度对应的维度特征;
根据各所述分析维度对应的维度数据和对应的维度特征进行相关性分析,得到多个初步相关特征;
将所述目标数据和各所述初步相关特征进行一元线性拟合,得到多个第一拟合结果,并根据多个所述第一拟合结果在各所述初步相关特征中筛选得到第一指标特征;
将所述目标数据和各所述初步相关特征进行多元线性拟合,得到第二拟合结果,并根据所述第二拟合结果在各所述初步相关特征中筛选得到第二指标特征;
根据所述第一指标特征和所述第二指标特征,得到多个所述相关指标特征。
2.根据权利要求1所述的方法,其特征在于,所述异常数据包括异常值和缺失值;
所述对所述异常数据进行回归预测,得到对应的回归预测数据,包括:
根据所述电力多源异构数据对所述异常值和所述缺失值进行预测,得到对应的预测值;
根据所述电力多源异构数据对所述异常值和所述缺失值进行拟合处理,得到对应的拟合值;
根据所述预测值和所述拟合值计算得到所述回归预测数据。
3.根据权利要求1至2任一项所述的方法,其特征在于,所述对所述评价样本集中的样本数据进行标度排序,得到标度排序结果,包括:
根据所述评价样本集中的样本数据和预设的映射关系构建得到判断矩阵;所述映射关系用于表征样本数据之间的重要程度;
根据所述判断矩阵进行权数分配,得到标度排序结果。
4.根据权利要求1至2任一项所述的方法,其特征在于,所述根据所述标度排序结果对多个所述相关指标特征去冗余,得到目标特征集,包括:
根据所述标度排序结果获取各相关指标特征对应的标度排序值;
将所述标度排序值满足预设条件的所述相关指标特征标记为目标特征集中的目标特征。
5.一种用电负荷预测装置,其特征在于,所述装置包括:
数据获取模块,用于获取电力多源异构数据;所述电力多源异构数据是指来自多个数据源、存在多种数据构型的电力数据,包括结构化数据、半结构化数据和非结构化数据;
回归预测模块,用于对所述电力多源异构数据进行回归预测,得到目标数据;
探索分析模块,用于对所述目标数据进行探索分析,得到多个相关指标特征;所述相关指标特征用于表征所述目标数据和用电负荷的相关性;
构建模块,用于根据多个所述相关指标特征和所述目标数据构建评价样本集;
标度排序模块,用于对所述评价样本集中的样本数据进行标度排序,得到标度排序结果;
去冗余模块,用于根据所述标度排序结果对多个所述相关指标特征去冗余,得到目标特征集;
预测模块,用于根据所述目标特征集对所述用电负荷进行预测;
其中,所述对所述电力多源异构数据进行回归预测,得到目标数据,包括:
从所述电力多源异构数据中筛选出异常数据;
采取K近邻算法或者梯度提升树算法对所述异常数据进行回归预测,得到对应的回归预测数据;
将所述回归预测数据填充至筛选后的电力多源异构数据中,得到所述目标数据;
其中,对所述目标数据进行探索分析,得到多个相关指标特征,包括:根据预设的分析维度对所述目标数据进行分类,得到各所述分析维度对应的维度数据;
获取各所述分析维度对应的维度特征;
根据各所述分析维度对应的维度数据和对应的维度特征进行相关性分析,得到多个初步相关特征;
将所述目标数据和各所述初步相关特征进行一元线性拟合,得到多个第一拟合结果,并根据多个所述第一拟合结果在各所述初步相关特征中筛选得到第一指标特征;
将所述目标数据和各所述初步相关特征进行多元线性拟合,得到第二拟合结果,并根据所述第二拟合结果在各所述初步相关特征中筛选得到第二指标特征;
根据所述第一指标特征和所述第二指标特征,得到多个所述相关指标特征。
6.根据权利要求5所述的装置,其特征在于,所述回归预测模块还用于根据所述电力多源异构数据对异常值和缺失值进行预测,得到对应的预测值;根据所述电力多源异构数据对所述异常值和所述缺失值进行拟合处理,得到对应的拟合值;根据所述预测值和所述拟合值计算得到所述回归预测数据。
7.根据权利要求5所述的装置,其特征在于,标度排序模块还用于:
根据所述评价样本集中的样本数据和预设的映射关系构建得到判断矩阵;所述映射关系用于表征样本数据之间的重要程度;
根据所述判断矩阵进行权数分配,得到标度排序结果。
8.根据权利要求5所述的装置,其特征在于,所述去冗余模块,还用于:
根据所述标度排序结果获取各相关指标特征对应的标度排序值;
将所述标度排序值满足预设条件的所述相关指标特征标记为目标特征集中的目标特征。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
CN202310146456.8A 2023-02-22 2023-02-22 用电负荷预测方法、装置、计算机设备和存储介质 Active CN115860273B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310146456.8A CN115860273B (zh) 2023-02-22 2023-02-22 用电负荷预测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310146456.8A CN115860273B (zh) 2023-02-22 2023-02-22 用电负荷预测方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN115860273A CN115860273A (zh) 2023-03-28
CN115860273B true CN115860273B (zh) 2023-06-27

Family

ID=85658579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310146456.8A Active CN115860273B (zh) 2023-02-22 2023-02-22 用电负荷预测方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN115860273B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115081597A (zh) * 2022-08-23 2022-09-20 中国电力科学研究院有限公司 一种基于机器学习的以电核碳方法、系统、设备和介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184424B (zh) * 2015-10-19 2017-07-07 国网山东省电力公司菏泽供电公司 实现多源异构数据融合的多核函数学习SVM的Mapreduce化短期负荷预测方法
CN112365070B (zh) * 2020-11-18 2024-05-31 深圳供电局有限公司 一种电力负荷预测方法、装置、设备及可读存储介质
CN113516291A (zh) * 2021-05-24 2021-10-19 国网河北省电力有限公司经济技术研究院 电力负荷预测方法、装置及设备
CN114169226A (zh) * 2021-11-18 2022-03-11 国网浙江省电力有限公司绍兴供电公司 短期电力负荷预测方法、计算机设备以及存储介质
CN115018119A (zh) * 2022-04-26 2022-09-06 河北大学 用电负荷预测方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115081597A (zh) * 2022-08-23 2022-09-20 中国电力科学研究院有限公司 一种基于机器学习的以电核碳方法、系统、设备和介质

Also Published As

Publication number Publication date
CN115860273A (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
CN111797928A (zh) 生成机器学习样本的组合特征的方法及系统
CN113435602A (zh) 确定机器学习样本的特征重要性的方法及系统
CN112990486A (zh) 生成机器学习样本的组合特征的方法及系统
CN111797927A (zh) 用于确定机器学习样本的重要特征的方法及系统
CN114298323A (zh) 生成机器学习样本的组合特征的方法及系统
CN112508679A (zh) 一种小微企业贷款风险评估方法、装置及存储介质
CN113516417A (zh) 基于智能建模的业务评估方法、装置、电子设备及介质
CN114266421B (zh) 基于复合气象特征构建与选择的新能源功率预测方法
CN116756494B (zh) 数据异常值处理方法、装置、计算机设备和可读存储介质
CA3179311A1 (en) Identifying claim complexity by integrating supervised and unsupervised learning
CN115860273B (zh) 用电负荷预测方法、装置、计算机设备和存储介质
CN116191398A (zh) 负荷预测方法、装置、计算机设备和存储介质
CN111324594A (zh) 用于粮食加工业的数据融合方法、装置、设备及存储介质
CN114580791B (zh) 膨化机工作状态识别方法、装置、计算机设备、存储介质
CN116304251A (zh) 标签处理方法、装置、计算机设备和存储介质
CN116049644A (zh) 特征筛选和聚类分箱方法、装置、电子设备及存储介质
CN115473219A (zh) 负荷预测方法、装置、计算机设备和存储介质
CN114819344A (zh) 一种基于关键影响因子的全局时空气象农灾预测方法
CN114065814A (zh) Gil局部放电的缺陷类型识别方法、装置
CN113361750A (zh) 一种基于业扩报装大数据的售电量预测方法
CN117036008B (zh) 一种多源数据的自动化建模方法及系统
CN113901223B (zh) 企业分类模型的生成方法、装置、计算机设备、存储介质
CN116595389B (zh) 识别异常客户端的方法、装置、计算机设备和存储介质
US11281689B1 (en) Distributed interaction feature generation system
Umarani et al. A Classification and Regression Tree Analysis for Prediction of Surgical Patient Lengths of Stay

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant