CN112308299A - 用于电力系统负荷预测模型的样本数据提取方法和装置 - Google Patents
用于电力系统负荷预测模型的样本数据提取方法和装置 Download PDFInfo
- Publication number
- CN112308299A CN112308299A CN202011117886.XA CN202011117886A CN112308299A CN 112308299 A CN112308299 A CN 112308299A CN 202011117886 A CN202011117886 A CN 202011117886A CN 112308299 A CN112308299 A CN 112308299A
- Authority
- CN
- China
- Prior art keywords
- time
- feature
- matrix
- sequence data
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000013075 data extraction Methods 0.000 title claims abstract description 15
- 239000011159 matrix material Substances 0.000 claims abstract description 123
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 238000013519 translation Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 14
- 238000010276 construction Methods 0.000 claims description 11
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 239000000523 sample Substances 0.000 description 48
- 238000011156 evaluation Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明适用于人工智能技术领域,提供了用于电力系统负荷预测模型的样本数据提取方法和装置,该方法包括:获取电力系统历史负荷的时序数据;根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵;利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵;对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三特征矩阵;拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据;输出所述目标样本数据。利用该样本数据训练得到的预测模型,可以进一步提高模型的准确率。
Description
技术领域
本发明属于人工智能技术领域,尤其涉及用于电力系统负荷预测模型的样本数据提取方法和装置。
背景技术
由于电能有着不易储存的特点,电力行业的预测需求一直以来都比其他行业更加紧迫。因此,实现电力系统负荷的科学可靠预测是促进电网稳固运行的首要任务。具体的,电力系统负荷预测是一种时间序列预测,主要是通过大量的历史负荷数据建立起可以拟合历史数据变化规律的数学模型,该模型不仅可以定量表征出电力系统负荷数据的时间规律性,还可以作为负荷预测模型的雏形,实现对未来电力负荷的科学有效预测。
现有技术中,电力系统负荷预测模型的准确率是技术人员一直致力研究的技术问题。当前对于电力系统负荷的预测模型很多,相比于提出一种新的预测模型,对已有预测模型进行改进,进一步提升模型的准确率,同样是实际中的一个技术难题。
发明内容
鉴于现有技术中的问题,本发明实施例提供了用于电力系统负荷预测模型的样本数据提取方法和装置,以解决如何进一步提升电力系统负荷预测模型的准确率的问题。
本发明实施例的第一方面提供了一种用于电力系统负荷预测模型的样本数据提取方法,其包括:获取电力系统历史负荷的时序数据;根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵;利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵;对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三特征矩阵;拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据;输出所述目标样本数据。
优选地,所述根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵,包括:获取时序数据的时间戳;根据所述时间戳,对所述时序数据按年、月、日、周和小时中的至少一种时间分类生成M列的第一特征矩阵,M为整数,且1≤M≤5。
优选地,所述利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵,包括:根据时间窗口平移,获取到对时间窗口平移到N天前的时序数据;对N天前的时序数据按小时分类,生成K列的第二特征矩阵,K为整数,且1≤K≤24。
优选地,所述对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三负荷特征矩阵,具体包括:调用tsfresh特征提取工具包,并设置(time_shift)时间参数;根据所述时间参数,至少提取对时间窗口平移到N天前的时序数据的i个特征的第三特征矩阵,其中,i>1。
优选地,所述拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据,包括:根据第二特征矩阵,确定样本数量;根据第一特征矩阵和第三特征矩阵,确定每个样本中的特征数量;根据所述样本数量和特征数量,生成作为电力系统负荷预测模型训练样本的目标矩阵。
本发明实施例的第二方面提供了一种用于电力系统负荷预测模型的样本数据提取装置,具体包括:历史负荷获取模块,用于获取电力系统历史负荷的时序数据;第一特征构造模块,用于根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵;第二特征构造模块,用于利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵;第三特征构造模块,用于对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三特征矩阵;特征拼接模块,用于拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据;目标样本输出模块,用于输出所述目标样本数据。
优选地,第一特征构造模块,可以具体包括:时间确定单元,用于获取时序数据的时间戳;第一特征矩阵构造单元,用于根据所述时间戳,对所述时序数据按年、月、日、周和小时中的至少一种时间分类生成M列的第一特征矩阵,M为整数,且1≤M≤5。
优选地,第二特征构造模块,可以具体包括:时间平移单元,用于根据时间窗口平移,获取到对时间窗口平移到N天前的时序数据;第二特征矩阵构造单元,用于对N天前的时序数据按小时分类,生成K列的第二特征矩阵,K为整数,且1≤K≤24。
优选地,第三特征构造模块,可以具体包括:配置单元,用于调用tsfresh特征提取工具包,并设置时间参数;第三特征矩阵构造单元,用于根据所述时间参数,至少提取对时间窗口平移到N天前的时序数据的i个特征的第三特征矩阵,其中,i>1。
优选地,特征拼接模块,可以具体包括:样本数量确定单元,用于根据第二特征矩阵,确定样本数量;特征数量确定单元,用于根据第一特征矩阵和第三特征矩阵,确定每个样本中的特征数量;目标矩阵生成单元,用于根据所述样本数量和特征数量,生成作为电力系统负荷预测模型训练样本的目标矩阵。
本发明实施例的有益效果是:本发明通过时间窗口平移来构造历史负荷特征,同时基于时间分类来构造时间特征,以及利用tsfresh特征提取工具来提取历史负荷特征,最后再对构造的三种特征进行拼接,生成用于电力系统预测模型的样本数据,利用该样本数据训练得到的预测模型,可以进一步提高模型的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明在一实施例中提供的用于电力系统负荷预测模型的样本数据提取方法的流程图;
图2为上述图1中所述步骤S120在一实施例中的实现流程图;
图3为上述图1中所述步骤S130在一实施例中的实现流程图;
图4为上述图1中所述步骤S140在一实施例中的实现流程图;
图5为上述图1中所述步骤S150在一实施例中的实现流程图;
图6为本发明在一实施例中提供的用于电力系统负荷预测模型的样本数据提取装置的原理示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
在技术研发过程中,经发明人研究发现使用用户侧的负荷指标数据作为特征,通过该特征训练得到的预测模型的准确率并不理想。为此,发明人尝试对训练模型的样本数据进行实验,针对相同的负荷指标数据,即用户侧的历史负荷数据,采用不同的特征提取方式得到不同的特征数据,然后用这些不同的特征数据进行训练,发现所得到的预测模型的预测效果差异明显。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
实施例一
请参见图1,为本发明在一实施例中提供的用于电力系统负荷预测模型的样本数据提取方法的流程图。
结合图1所示,该样本数据提取方法,至少包括以下步骤S110-S160:
S110:获取电力系统历史负荷的时序数据。
其中,电力系统历史负荷是指用户侧(例如用电企业)的负荷指标数据,即根据用户侧的用电指标从数据库中筛选得到的数据。具体的,电力系统负荷数据具有时间性,所以也称为时序数据。在下文的一些描述中,电力系统负荷数据也可简称为历史负荷或负荷数据。
示例性的,假设获取的时序数据包括:用户侧提供小时级(即时间单位为小时)的负荷数据,假设有H个样本。
S120:根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵。
具体的,时间戳即负荷数据对应的时间,为此,可以按年、月、周、天及小时的时间分类来对时序数据进行划分,形成一个特征矩阵。
示例性的,见图2,为上述步骤S120在一实施例中的实现流程图,如图2所示,步骤S120可以具体包括步骤S210-S220:
S210:获取时序数据的时间戳;
S220:根据所述时间戳,对所述时序数据按年、月、日、周和小时中的至少一种时间分类生成M列的第一特征矩阵,M为整数,且1≤M≤5。
本示例提供的方法,利用时序数据的时间特征,对该时序数据体现为例如5列的特征矩阵,即第一特征矩阵。
S130:利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵。
根据实际应用场景对时间窗口进行平移后的负荷,例如,D日的实际负荷会在D+5日公布,所以在特征构造过程中使用5天前的负荷数据对实际负荷进行解释。
示例性的,见图3,为上述步骤S130在一实施例中的实现流程图。
结合图3所示,步骤S130,可以具体包括步骤S310-S320:
S310:根据时间窗口平移,获取到对时间窗口平移到N天前的时序数据;
S320:对N天前的时序数据按小时分类,生成K列的第二特征矩阵,K为整数,且1≤K≤24。
其中,N可以是任一的正整数。例如,当时间窗口平移N天后,对移至的前N天的1小时、2小时……24小时的历史负荷作为特征,即体现为特征矩阵的24列。具体一点说就是,第二负荷特征矩阵有24列,第一列为N天零1小时前的负荷,第二列为N天零2小时前的负荷,…,以此类推。
S140:对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三特征矩阵。
其中,所述tsfresh是开源的提取时序数据特征的python(一种计算机程序设计语言)包,能够提取出超过4000种特征。时间序列通常包含噪音、冗余或者不相关的信息,因此并非所有提取的特征对于机器学习任务来说都是有用的。为了避免提取不相关的特性,tsfresh包有一个内置的过滤过程,这个过滤过程评估了回归或者分类任务中每个特性的解释能力和重要性。
具体的,时间窗口平移得到平移至N天前的时序数据,是一个具体的时间序列数据,转换为矩阵来说,是一维数据。
见图4,为上述步骤S140在一实施例中的实现流程图。
结合图4所示,上述步骤S140,可以具体包括步骤S410-S420:
S410:调用tsfresh特征提取工具包,并设置时间参数;
S420:根据所述时间参数,至少提取对时间窗口平移到N天前的时序数据的i个特征的第三特征矩阵,其中,i>1。
所述时间参数,即tsfresh特征提取工具包中的time_shift参数,该time_shift参数即:最多可以提取当前时间点前多少个样本的特征。例如,将其设置为24,则最多可以提取前24个样本的特征。
S150:拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据。
通过上述构造各类特征,通过进行拼接,可以使生成的样本数据更为丰富,相当于可以从不同维度体现历史负荷的特征。
示例性的,见图5,为上述步骤S150在一实施例中的实现流程图。
结合图5所示,上述步骤S150可以具体包括步骤S510-S530:
S510:根据第二特征矩阵,确定样本数量;
S520:根据第一特征矩阵和第三特征矩阵,确定每个样本中的特征数量;
S530:根据所述样本数量和特征数量,生成作为电力系统负荷预测模型训练样本的目标矩阵。
具体的,结合上述各示例,假设获取到的总的样本数量为H个;第一特征矩阵为包括年、月、周、日、时的5列矩阵;第二特征矩阵为时间窗口向前平移5天的全天24小时的24列矩阵;第三特征矩阵为tsfresh特征提取工具包提取到i个特征的i列矩阵。
为此,由于时间窗口平移5天,那么总的样本数量H将会减少24*5-24个样本,即最后将有(H-24*5-24)个样本;同时,在平移之后,根据时间特征构造的第一特征矩阵和tsfresh特征提取的第三特征矩阵,那么每个样本将有(5+24+i)个特征;那么,对三个构造的特征矩阵进行拼接,即得到的(n-144)×(29+i)阶的目标矩阵。
S160:输出所述目标样本数据。
关于利用构造目标特征矩阵训练预测模型后的结果评估与验证:下面将针对训练和预测分别构造特征矩阵,模型训练完成后,进行负荷预测,返回一个预测结果的时间序列。在上述模型训练和负荷晕预测的基础上,将预测结果与实际负荷进行比较,并使用r2-score作为评价标准。
其中,r2-score的计算公式为:
具体的,利用下述公式1)确定回归平方和SSR:
具体的,利用下述公式2)计算残差平方和SSE:
其中,yi表示真实的观测值,上述公式的作用为估计值与真实值的误差,反映模型拟合程度。
具体的,利用下述公式3)计算总离差平方和SST:
其中,上述公式表示平均值与真实值的误差,反映与数学期望的偏离程度。根据上述评价方法,如果该结果越接近于1,则表明所构造特征对负荷的解释程度越高。
例如,在一实验中,采用上述第一特征矩阵、第二特征矩阵和第三特征矩阵作为特征进行分组训练同一预测算法得到模型的r2-score评价如何下表1:
表1
由上表1可知,采用上述第一特征矩阵、第二特征矩阵和第三特征矩阵作为特征来训练的到的模型的r2-score评价值要明显高于采用第一特征矩阵和第二特征矩阵的r2-score,由此可见本发明对于提升模型的准确度有明显的效果。
综上所述,本发明提供的样本数据提取方法,通过时间窗口平移来构造历史负荷特征,同时基于时间分类来构造时间特征,以及利用tsfresh特征提取工具来提取历史负荷特征,最后再对构造的三种特征进行拼接,生成用于电力系统预测模型的样本数据。通过实验证明,利用该样本数据训练得到的预测模型相比于现有利用历史负荷数据训练的预测模型,准确率要明显高出很多。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例二
在与实施例一为相同发明构思的基础上,本实施例还提供了一种用于电力系统负荷预测模型的样本数据提取装置。
请参见图6,为本发明在一实施例中提供的用于电力系统负荷预测模型的样本数据提取装置的原理示意图。
结合图6所示,该用于电力系统负荷预测模型的样本数据提取装置600,具体包括:历史负荷获取模块610,用于获取电力系统历史负荷的时序数据;第一特征构造模块620,用于根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵;第二特征构造模块630,用于利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵;第三特征构造模块640,用于对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三特征矩阵;特征拼接模块650,用于拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据;目标样本输出模块660,用于输出所述目标样本数据。
在一些示例性实施方式中,第一特征构造模块620,可以具体包括:时间确定单元,用于获取时序数据的时间戳;第一特征矩阵构造单元,用于根据所述时间戳,对所述时序数据按年、月、日、周和小时中的至少一种时间分类生成M列的第一特征矩阵,M为整数,且1≤M≤5。
在一些示例性实施方式中,第二特征构造模块630,可以具体包括:时间平移单元,用于根据时间窗口平移,获取到对时间窗口平移到N天前的时序数据;第二特征矩阵构造单元,用于对N天前的时序数据按小时分类,生成K列的第二特征矩阵,K为整数,且1≤K≤24。
在一些示例性实施方式中,第三特征构造模块640,可以具体包括:配置单元,用于调用tsfresh特征提取工具包,并设置时间参数;第三特征矩阵构造单元,用于根据所述时间参数,至少提取对时间窗口平移到N天前的时序数据的i个特征的第三特征矩阵,其中,i>1。
在一些示例性实施方式中,特征拼接模块650,可以具体包括:样本数量确定单元,用于根据第二特征矩阵,确定样本数量;特征数量确定单元,用于根据第一特征矩阵和第三特征矩阵,确定每个样本中的特征数量;目标矩阵生成单元,用于根据所述样本数量和特征数量,生成作为电力系统负荷预测模型训练样本的目标矩阵。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种用于电力系统负荷预测模型的样本数据提取方法,其特征在于,包括:
获取电力系统历史负荷的时序数据;
根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵;
利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵;
对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三特征矩阵;
拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据;
输出所述目标样本数据。
2.根据权利要求1所述的用于电力系统负荷预测模型的样本数据提取方法,其特征在于,所述根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵,包括:
获取时序数据的时间戳;
根据所述时间戳,对所述时序数据按年、月、日、周和小时中的至少一种时间分类生成M列的第一特征矩阵,M为整数,且1≤M≤5。
3.根据权利要求2所述的用于电力系统负荷预测模型的样本数据提取方法,其特征在于,所述利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵,包括:
根据时间窗口平移,获取到对时间窗口平移到N天前的时序数据;
对N天前的时序数据按小时分类,生成K列的第二特征矩阵,K为整数,且1≤K≤24。
4.根据权利要求3所述的用于电力系统负荷预测模型的样本数据提取方法,其特征在于,所述对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三负荷特征矩阵,具体包括:
调用tsfresh特征提取工具包,并设置(time_shift)时间参数;
根据所述时间参数,至少提取对时间窗口平移到N天前的时序数据的i个特征的第三特征矩阵,其中,i>1。
5.根据权利要求1-4任一项所述的用于电力系统负荷预测模型的样本数据提取方法,其特征在于,所述拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据,包括:
根据第二特征矩阵,确定样本数量;
根据第一特征矩阵和第三特征矩阵,确定每个样本中的特征数量;
根据所述样本数量和特征数量,生成作为电力系统负荷预测模型训练样本的目标矩阵。
6.一种用于电力系统负荷预测模型的样本数据提取装置,其特征在于,包括:
历史负荷获取模块,用于获取电力系统历史负荷的时序数据;
第一特征构造模块,用于根据所述时序数据的时间戳,构造所述时序数据在时间分类下的第一特征矩阵;
第二特征构造模块,用于利用时间窗口平移得到平移至N天前的时序数据,并构造N天前的时序数据在全天小时分类下的第二特征矩阵;
第三特征构造模块,用于对时间窗口平移得到平移至N天前的时序数据进行tsfresh特征提取,得到i个第三特征矩阵;
特征拼接模块,用于拼合所述第一特征矩阵、第二特征矩阵及第三特征矩阵,生成目标样本数据;
目标样本输出模块,用于输出所述目标样本数据。
7.根据权利要求6所述的用于电力系统负荷预测模型的样本数据提取装置,其特征在于,所述第一特征构造模块,具体包括:
时间确定单元,用于获取时序数据的时间戳;
第一特征矩阵构造单元,用于根据所述时间戳,对所述时序数据按年、月、日、周和小时中的至少一种时间分类生成M列的第一特征矩阵,M为整数,且1≤M≤5。
8.根据权利要求7所述的用于电力系统负荷预测模型的样本数据提取装置,其特征在于,所述第二特征构造模块,具体包括:
时间平移单元,用于根据时间窗口平移,获取到对时间窗口平移到N天前的时序数据;
第二特征矩阵构造单元,用于对N天前的时序数据按小时分类,生成K列的第二特征矩阵,K为整数,且1≤K≤24。
9.根据权利要求8所述的用于电力系统负荷预测模型的样本数据提取装置,其特征在于,所述第三特征构造模块,具体包括:
配置单元,用于调用tsfresh特征提取工具包,并设置时间参数;
第三特征矩阵构造单元,用于根据所述时间参数,至少提取对时间窗口平移到N天前的时序数据的i个特征的第三特征矩阵,其中,i>1。
10.根据权利要求6-9任一所述的用于电力系统负荷预测模型的样本数据提取装置,其特征在于,所述特征拼接模块,具体包括:
样本数量确定单元,用于根据第二特征矩阵,确定样本数量;
特征数量确定单元,用于根据第一特征矩阵和第三特征矩阵,确定每个样本中的特征数量;
目标矩阵生成单元,用于根据所述样本数量和特征数量,生成作为电力系统负荷预测模型训练样本的目标矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011117886.XA CN112308299B (zh) | 2020-10-19 | 2020-10-19 | 用于电力系统负荷预测模型的样本数据提取方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011117886.XA CN112308299B (zh) | 2020-10-19 | 2020-10-19 | 用于电力系统负荷预测模型的样本数据提取方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112308299A true CN112308299A (zh) | 2021-02-02 |
CN112308299B CN112308299B (zh) | 2024-04-19 |
Family
ID=74327871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011117886.XA Active CN112308299B (zh) | 2020-10-19 | 2020-10-19 | 用于电力系统负荷预测模型的样本数据提取方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112308299B (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070038191A (ko) * | 2005-10-05 | 2007-04-10 | 한국전기연구원 | 전력기기의 부분방전 측정을 위한 잡음 제거방법 |
JP2013218451A (ja) * | 2012-04-06 | 2013-10-24 | Takumi Giken:Kk | 時系列情報解析装置および時系列情報解析用プログラム |
CN103646354A (zh) * | 2013-11-28 | 2014-03-19 | 国家电网公司 | 基于有效指标fcm和rbf神经网络的变电站负荷特性分类方法 |
CN103678322A (zh) * | 2012-09-03 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 一种样本数据的整合系统及方法 |
CN105528660A (zh) * | 2016-03-09 | 2016-04-27 | 湖南大学 | 一种基于日负荷曲线的变电站负荷模型参数预测方法 |
CN106503851A (zh) * | 2016-10-25 | 2017-03-15 | 国家电网公司 | 一种改进的基于小波分析的短期电力负荷预测方法 |
US20180039865A1 (en) * | 2015-08-07 | 2018-02-08 | Hefei University Of Technology | Analog circuit fault mode classification method |
CN108196165A (zh) * | 2018-01-09 | 2018-06-22 | 贵州大学 | 基于样本协方差矩阵最大特征值的电网异常状态检测方法 |
CN108199374A (zh) * | 2018-01-30 | 2018-06-22 | 清华大学 | 一种基于熵的电力系统的稳定性评价方法及系统 |
CN109034504A (zh) * | 2018-09-14 | 2018-12-18 | 云南电网有限责任公司 | 一种短期负荷预测模型建立方法及装置 |
WO2019019255A1 (zh) * | 2017-07-25 | 2019-01-31 | 平安科技(深圳)有限公司 | 建立预测模型的装置、方法、预测模型建立程序及计算机可读存储介质 |
WO2019056498A1 (zh) * | 2017-09-19 | 2019-03-28 | 平安科技(深圳)有限公司 | 驾驶模型训练方法、驾驶人识别方法、装置、设备及介质 |
CN109840530A (zh) * | 2017-11-24 | 2019-06-04 | 华为技术有限公司 | 训练多标签分类模型的方法和装置 |
CN110647456A (zh) * | 2019-09-29 | 2020-01-03 | 苏州浪潮智能科技有限公司 | 一种存储设备的故障预测方法、系统及相关装置 |
CN110707763A (zh) * | 2019-10-17 | 2020-01-17 | 南京理工大学 | 一种基于集成学习的交直流配电网负荷预测方法 |
CN111047074A (zh) * | 2019-11-15 | 2020-04-21 | 中国电力科学研究院有限公司 | 一种电力负荷波动范围预测方法及装置 |
CN111400366A (zh) * | 2020-02-27 | 2020-07-10 | 西安交通大学 | 一种基于CatBoost模型的交互式门诊量预测可视分析方法及系统 |
-
2020
- 2020-10-19 CN CN202011117886.XA patent/CN112308299B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070038191A (ko) * | 2005-10-05 | 2007-04-10 | 한국전기연구원 | 전력기기의 부분방전 측정을 위한 잡음 제거방법 |
JP2013218451A (ja) * | 2012-04-06 | 2013-10-24 | Takumi Giken:Kk | 時系列情報解析装置および時系列情報解析用プログラム |
CN103678322A (zh) * | 2012-09-03 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 一种样本数据的整合系统及方法 |
CN103646354A (zh) * | 2013-11-28 | 2014-03-19 | 国家电网公司 | 基于有效指标fcm和rbf神经网络的变电站负荷特性分类方法 |
US20180039865A1 (en) * | 2015-08-07 | 2018-02-08 | Hefei University Of Technology | Analog circuit fault mode classification method |
CN105528660A (zh) * | 2016-03-09 | 2016-04-27 | 湖南大学 | 一种基于日负荷曲线的变电站负荷模型参数预测方法 |
CN106503851A (zh) * | 2016-10-25 | 2017-03-15 | 国家电网公司 | 一种改进的基于小波分析的短期电力负荷预测方法 |
WO2019019255A1 (zh) * | 2017-07-25 | 2019-01-31 | 平安科技(深圳)有限公司 | 建立预测模型的装置、方法、预测模型建立程序及计算机可读存储介质 |
WO2019056498A1 (zh) * | 2017-09-19 | 2019-03-28 | 平安科技(深圳)有限公司 | 驾驶模型训练方法、驾驶人识别方法、装置、设备及介质 |
CN109840530A (zh) * | 2017-11-24 | 2019-06-04 | 华为技术有限公司 | 训练多标签分类模型的方法和装置 |
CN108196165A (zh) * | 2018-01-09 | 2018-06-22 | 贵州大学 | 基于样本协方差矩阵最大特征值的电网异常状态检测方法 |
CN108199374A (zh) * | 2018-01-30 | 2018-06-22 | 清华大学 | 一种基于熵的电力系统的稳定性评价方法及系统 |
CN109034504A (zh) * | 2018-09-14 | 2018-12-18 | 云南电网有限责任公司 | 一种短期负荷预测模型建立方法及装置 |
CN110647456A (zh) * | 2019-09-29 | 2020-01-03 | 苏州浪潮智能科技有限公司 | 一种存储设备的故障预测方法、系统及相关装置 |
CN110707763A (zh) * | 2019-10-17 | 2020-01-17 | 南京理工大学 | 一种基于集成学习的交直流配电网负荷预测方法 |
CN111047074A (zh) * | 2019-11-15 | 2020-04-21 | 中国电力科学研究院有限公司 | 一种电力负荷波动范围预测方法及装置 |
CN111400366A (zh) * | 2020-02-27 | 2020-07-10 | 西安交通大学 | 一种基于CatBoost模型的交互式门诊量预测可视分析方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112308299B (zh) | 2024-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3043447B1 (en) | Distribution transformer heavy loading and overloading mid-term and short-term pre-warning analytics model | |
CN111797928A (zh) | 生成机器学习样本的组合特征的方法及系统 | |
EP3907671A2 (en) | Method and apparatus for incrementally training model | |
US20190114711A1 (en) | Financial analysis system and method for unstructured text data | |
Rathnayaka et al. | Grey system based novel approach for stock market forecasting | |
Alkawaz et al. | Day-ahead electricity price forecasting based on hybrid regression model | |
CN111027629A (zh) | 基于改进随机森林的配电网故障停电率预测方法及系统 | |
CN111783893A (zh) | 生成机器学习样本的组合特征的方法及系统 | |
CN111815432A (zh) | 金融服务风险预测方法及装置 | |
CN114626585A (zh) | 一种基于生成对抗网络的城市轨道交通短时客流预测方法 | |
CN111444094B (zh) | 一种测试数据的生成方法和系统 | |
CN112308299A (zh) | 用于电力系统负荷预测模型的样本数据提取方法和装置 | |
CN116977091A (zh) | 个股投资组合的确定方法、装置、电子设备及可读存储介质 | |
CN115358473A (zh) | 基于深度学习的电力负荷预测方法及预测系统 | |
CN113239272A (zh) | 一种网络管控系统的意图预测方法和意图预测装置 | |
CN114461619A (zh) | 能源互联网多源数据融合方法、装置、终端及存储介质 | |
Ma et al. | A combined model based on seasonal autoregressive integrated moving average and modified particle swarm optimization algorithm for electrical load forecasting | |
CN113610111B (zh) | 分布式多源数据的融合方法、装置、设备及存储介质 | |
Tsianikas et al. | Comparison of neural network based approaches for short-term residential energy load forecasting | |
CN115908119B (zh) | 基于人工智能的人脸图像美颜处理方法及系统 | |
Gonçalves et al. | A hybrid algorithm for load curve filtering and clustering | |
CN117707929A (zh) | 测试用例生成方法及目标测试用例生成模型训练方法 | |
CN117669726A (zh) | 自然语言问题处理方法、电子设备及计算机可读存储介质 | |
Darvishi Salokolaei et al. | Grey Prediction Model for Forecasting Electricity Consumption | |
CN113496330A (zh) | 用于评估站点服务质量的方法、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |