CN116976507A - 电网数据的关联处理方法、装置、计算机设备和存储介质 - Google Patents
电网数据的关联处理方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN116976507A CN116976507A CN202310887611.1A CN202310887611A CN116976507A CN 116976507 A CN116976507 A CN 116976507A CN 202310887611 A CN202310887611 A CN 202310887611A CN 116976507 A CN116976507 A CN 116976507A
- Authority
- CN
- China
- Prior art keywords
- model
- time sequence
- cluster
- sequence data
- data samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012545 processing Methods 0.000 title claims abstract description 27
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000013499 data model Methods 0.000 claims abstract description 88
- 238000012549 training Methods 0.000 claims abstract description 51
- 230000004931 aggregating effect Effects 0.000 claims abstract description 14
- 238000004590 computer program Methods 0.000 claims description 25
- 230000006870 function Effects 0.000 claims description 19
- 230000002776 aggregation Effects 0.000 claims description 17
- 238000004220 aggregation Methods 0.000 claims description 17
- 238000011156 evaluation Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 8
- 238000012300 Sequence Analysis Methods 0.000 claims description 7
- 238000004146 energy storage Methods 0.000 description 6
- 238000003672 processing method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000009827 uniform distribution Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/098—Distributed learning, e.g. federated learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Power Engineering (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种电网数据的关联处理方法、装置、计算机设备和存储介质。所述方法包括:通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇;对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本;通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型;将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型;所述全局模型用于进行数据预测。采用本方法能够提高模型的数据预测准确性。
Description
技术领域
本申请涉及电力数据处理技术领域,特别是涉及一种电网数据的关联处理方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着电网数据技术的发展,可以通过根据电网数据进行建模,通过建模得到的模型对电力负荷和电网的发电量等数据进行预测。
传统技术中,通常是将历史电网数据假设为独立同分布的,即数据之间是相互独立且从同一分布中独立地采样得到的,根据历史电网数据进行建模,并根据构建得到的模型进行数据预测,但是由于历史电网数据之间不是独立同分布的,数据之间存在相关性或者差异性,导致模型的数据预测准确性较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高模型的数据预测准确性的电网数据的关联处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种电网数据的关联处理方法。该方法包括:
通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇;
对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本;
通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型;
将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型;全局模型用于进行数据预测。
在其中一个实施例中,通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇包括:
将多个参与方的电网数据样本中,具有相似特征和时空关联性的电网数据样本划分至同一个簇中,得到多个不同的簇。
在其中一个实施例中,对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本包括:
通过时间序列分析方法将各个簇内的电网数据样本在相同时间点上对齐,得到各个簇对应的时序数据样本。
在其中一个实施例中,通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型包括:
针对每一簇对应的时序数据样本,通过该簇对应的时序数据样本对具有时序关联性的模型进行训练,在模型训练过程中,对该簇对应的时序数据样本中的时间片段的注意力权重进行调整,并根据调整后的时序数据样本得到模型的损失函数值;
当模型的损失函数值最小时,停止训练,得到各个簇对应的时序数据模型。
在其中一个实施例中,将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型包括:
将各个簇对应的时序数据模型的模型参数上传至中央服务器;中央服务器用于对多个簇对应的时序数据模型的模型参数进行加权聚合,得到全局模型;
接收中央服务器发送的全局模型。
在其中一个实施例中,该方法还包括:
根据预设评估指标对全局模型进行性能评估;
当全局模型不满足预设性能条件时,将待训练时序数据模型更新为全局模型,返回至通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练的步骤,直至全局模型满足预设性能条件,根据满足预设性能条件的全局模型进行数据预测。
第二方面,本申请还提供了一种电网数据的关联处理装置。该装置包括:
数据聚类模块,用于通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇;
时空对齐模块,用于对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本;
模型训练模块,用于通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型;
模型聚合模块,用于将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型;全局模型用于进行数据预测。
第三方面,本申请还提供了一种计算机设备。该计算机设备包括存储器和处理器,该存储器存储有计算机程序,该处理器执行该计算机程序时实现以下步骤:
通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇;
对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本;
通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型;
将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型;全局模型用于进行数据预测。
第四方面,本申请还提供了一种计算机可读存储介质。该计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以下步骤:
通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇;
对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本;
通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型;
将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型;全局模型用于进行数据预测。
第五方面,本申请还提供了一种计算机程序产品。该计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇;
对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本;
通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型;
将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型;全局模型用于进行数据预测。
上述电网数据的关联处理方法、装置、计算机设备、存储介质和计算机程序产品,通过对多个参与方的电网数据样本进行聚类操作和时空对齐操作得到时序数据样本,能够解决数据之间的非独立同分布的问题,根据时序数据样本训练得到时序数据模型,将时序数据模型的模型参数进行聚合,得到的全局模型能够有效地提高模型的数据预测准确性。
附图说明
图1为一个实施例中电网数据的关联处理方法的应用环境图;
图2为一个实施例中电网数据的关联处理方法的流程示意图;
图3为一个实施例中通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型步骤的流程示意图;
图4为一个实施例中将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型步骤的流程示意图;
图5为一个实施例中对全局模型进行性能评估的步骤的流程示意图;
图6为另一个实施例中电网数据的关联处理方法的流程示意图;
图7为一个实施例中电网数据的关联处理装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的电网数据的关联处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。服务器104获取参与方电网数据样本,其中参与方可以是多个终端102,服务器104通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇,对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本,通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型,服务器104将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型,全局模型用于进行数据预测。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种电网数据的关联处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤202,通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇。
其中,参与方是指需要进行数据预测而提供数据样本的主体。电网数据样本是指参与方提供的本地电网数据样本集。
具体地,服务器进行数据准备,分别获取多个参与方的电网数据样本,多个参与方可以是不同城市、不同电网等主体对应的终端。根据电网数据样本之间的关联性,使用聚类算法,例如K-means(K均值聚类)、DBSCAN(Density-Based Spatial Clustering ofApplications with Noise,一种基于密度的对噪声鲁棒的空间聚类算法)等,将具有相似或相同特征和时空上具有关联性的电网数据样本放在同一个簇中,从而将多个参与方的电网数据样本划分为多个不同的簇,其中电网数据样本为城市或电网的电网数据,包括负荷数据、天气数据、时序信息等。
步骤204,对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本。
其中,时空对齐操作是指将电网数据样本对齐到统一的时间尺度的操作。时序数据样本是指各个簇中处于统一的时间尺度的电网数据样本。
具体地,将各个簇内的电网数据样本按照统一的时间尺度进行对齐,例如按照小时对齐,从而使每个簇的电网数据样本在相同的时间电上是对齐的,对齐后即得到各个簇对应的时序数据样本。
步骤206,通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型。
其中,时序数据模型是指根据时序数据样本训练得到的本地数据预测模型。
具体地,通过各个簇对应的时序数据样本对待训练时序数据模型进行联邦学习训练,待训练时序数据模型是具有时序建模能力的模型,例如循环神经网络模型、长短时记忆网络模型等,训练完成即得到各个簇对应的时序数据模型。
步骤208,将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型;全局模型用于进行数据预测。
其中,模型参数是指模型内部的配置变量。全局模型是指能够适用于不同参与方进行数据预测的预测模型。
具体地,在时序数据模型的每个训练轮次结束后,将各个簇对应的时序数据模型的模型参数上传到中央服务器,由中央服务器使用类似于FedAvg(联邦学习)的算法对模型参数进行聚合,得到全局模型,全局模型可用于进行数据预测。
上述电网数据的关联处理方法中,通过对多个参与方的电网数据样本进行聚类操作和时空对齐操作得到时序数据样本,能够解决数据之间的非独立同分布的问题,同时每个参与方只需在本地进行计算,无需共享原始数据,从而保护了敏感的电网数据,根据时序数据样本训练得到时序数据模型,将时序数据模型的模型参数进行聚合,得到全局模型,相对于传统技术中没有处理数据的非独立同分布的问题导致建模的效果差,上述方法得到的全局模型能够有效地提高模型的数据预测准确性,模型的泛化能力和预测性能得到大大提升,可以适应不同城市、不同电网的数据特点和联邦学习需求,通过调整聚类算法、时空对齐方法和个性化模型调整策略,可以灵活地应用于各种电网数据场景,并实现良好的扩展性。
在一个实施例中,本申请所提供的电网数据的关联处理方法可以应用的主要场景包括:(1)负荷预测:电网运营商需要准确预测电力负荷,以便做出合理的供电计划和调度决策。通过电网数据的关联处理,不同城市或地区的负荷数据可以进行个性化建模,并通过聚合得到更准确的全局负荷预测模型。(2)故障检测与诊断:电网中的故障检测与诊断对于维护电网的正常运行至关重要。电网数据的关联处理可以帮助从不同城市或电网中收集的数据中学习故障的模式和特征,从而实现更准确的故障检测和诊断。(3)能源调度与优化:电网运营商需要合理调度能源资源,以提高电网的效率和可靠性。通过电网数据的关联处理,可以综合不同城市或电网的能源数据,学习全局能源调度模型,并优化能源的分配和使用策略。(4)储能管理:储能技术在电网中起着重要作用,可以平衡能源供需并提高电网的稳定性。电网数据的关联处理可以利用不同城市或电网中的储能数据,学习储能管理模型,以优化储能设备的充放电策略和运行效率。(5)需求响应:电网运营商需要根据用户需求实现灵活的电力供应和需求响应。通过电网数据的关联处理,可以结合不同城市或地区的用户数据,学习用户需求模型,并制定相应的电力调度和响应策略。
总之,电网数据的关联处理方法在电网领域中可应用于负荷预测、故障检测与诊断、能源调度与优化、储能管理、需求响应等多个场景,帮助电网运营商提升数据建模的效果和决策的准确性。
在一个实施例中,通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇包括:
将多个参与方的电网数据样本中,具有相似特征和时空关联性的电网数据样本划分至同一个簇中,得到多个不同的簇。
其中,时空关联性是指由于设备的运行时间和位置上的关联,导致相关电网数据之间的关联性。
具体地,确定要创建的聚类数K和需要进行聚类的多个参与方的电网数据样本,随机选择K个数据点作为初始聚类中心,对于每个电网数据样本,计算其与每个聚类中心之间的距离,并将其分配到最近的聚类中心,对于每个聚类,计算其所有分配到该聚类的电网数据样本的均值,以获得新的聚类中心,直到聚类中心不再改变或达到预定的迭代次数,即完成聚类,得到多个不同的簇。
可选地,聚类算法(例如K-means)的目标是将数据集D划分为K个簇C={C1,C2,...,CK},其中每个簇Ci包含一组数据样本。聚类的目标是最小化每个簇内数据样本与簇中心的距离,聚类目标函数:其中,C表示电网数据样本所属的簇的集合,M表示每个簇的中心。例如可以是对城市A和城市B的负荷数据进行聚类操作,经过聚类操作后,将得到两个簇,簇A1代表城市A的负荷数据,簇B1代表城市B的负荷数据。
本实施例中,通过将多个参与方的电网数据样本中,具有相似特征和时空关联性的电网数据样本划分至同一个簇中,得到多个不同的簇,实现了将相关的电网数据样本划分到同一个簇中,从而更好地捕捉数据的时空关联性,有助于提升联邦学习模型的效果,能够提高数据预测的准确性。
在一个实施例中,对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本包括:
通过时间序列分析方法将各个簇内的电网数据样本在相同时间点上对齐,得到各个簇对应的时序数据样本。
其中,时间序列分析方法是指用来实现时空对齐操作的数据处理方法。
具体地,时间序列分析方法可以包括时序插值、时间对齐等,时空对齐涉及对电网数据样本进行插值、重采样或时间对齐等操作,以使不同参与方的数据在相同时间点上对齐。在进行插值时,给定一个电网数据样本X在时间点t1和t2的时间序列,通过插值方法(如线性插值或样条插值)得到在某个目标时间点t的插值样本x',时间插值公式为x′=f(t,x,t1,t2),其中f为插值函数,将得到的x'插入电网数据样本X的时间序列即可完成时空对齐,以此类推,即可得到各个簇对应的时序数据样本。
本实施例中,通过时间序列分析方法将各个簇内的电网数据样本在相同时间点上对齐,得到各个簇对应的时序数据样本,能够使不同城市或电网的电网数据样本在相同时间点上对齐,从而消除时序差异,解决了数据之间的差异性,使得每个参与方的本地数据更加相似,有助于提升联邦学习模型的效果,能够提高数据预测的准确性。
在一个实施例中,如图3所示,通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型包括:
步骤302,针对每一簇对应的时序数据样本,通过该簇对应的时序数据样本对具有时序关联性的模型进行训练,在模型训练过程中,对该簇对应的时序数据样本中的时间片段的注意力权重进行调整,并根据调整后的时序数据样本得到模型的损失函数值。
步骤304,当模型的损失函数值最小时,停止训练,得到各个簇对应的时序数据模型。
其中,注意力权重是指时序数据样本中的不同时间片段的重要性。损失函数值是指模型训练的目标函数的函数值。
具体地,针对每一簇对应的时序数据样本,通过该簇对应的时序数据样本对具有时序关联性的模型进行训练,训练过程中,模型的参数记为θ,每个参与方的目标是最小化本地损失函数L(θ),本地损失函数为L(θ)=min{θ}L(θ)。为了引入个性化建模,可以在模型训练中引入时序注意力机制,通过注意力权重α来调整不同时间片段的重要性,即对该簇对应的时序数据样本中的时间片段的注意力权重进行调整,并根据调整后的时序数据样本得到模型的损失函数值,其中时序注意力机制公式为ht=LSTM(h{t-1},xt,αt),ht为神经网络模型的隐藏状态,Xt为输入的时序数据样本,αt为注意力权重。当模型的损失函数值最小时,停止训练,得到各个簇对应的时序数据模型。
本实施例中,通过在模型训练过程中引入注意力机制,能够使模型根据数据的重要性在不同时间片段上进行个性化调整,从而使模型可以更好地适应每个参与方数据的时序特性和时空关联性,并且每个参与方只需在本地进行模型训练,无需共享原始数据,可以保护敏感的电网数据,增强数据的安全性和隐私保护。
在一个实施例中,如图4所示,将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型包括:
步骤402,将各个簇对应的时序数据模型的模型参数上传至中央服务器;中央服务器用于对多个簇对应的时序数据模型的模型参数进行加权聚合,得到全局模型。
步骤404,接收中央服务器发送的全局模型。
其中,中央服务器是指对模型参数进行聚合处理的服务器。
具体地,各个簇对应的参与方通过联邦学习将本地的时序数据模型的参数上传到中央服务器进行聚合。聚合算法是可以是FedAvg算法,它通过平均化参与方的模型参数来获得全局模型参数。具体而言,参与方i上传其本地时序数据模型参数θi到中央服务器,然后中央服务器使用加权公式进行参数加权聚合,加权公式为其中N表示参与方的数量。得到全局模型参数后,使用全局模型参数对模型进行更新,得到全局模型。
本实施例中,通过模型参数的聚合,能够融合多个参与方的模型,从而得到更全面和准确的全局模型,参与方之间的信息交互和模型参数聚合有助于提升全局模型的泛化能力和预测性能。
在一个实施例中,如图5所示,还包括对全局模型进行性能评估的步骤,该步骤可以包括:
步骤502,根据预设评估指标对全局模型进行性能评估。
步骤504,当全局模型不满足预设性能条件时,将待训练时序数据模型更新为全局模型,返回至通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练的步骤,直至全局模型满足预设性能条件,根据满足预设性能条件的全局模型进行数据预测。
其中,预设评估指标是指预先设定的评估全局模型数据预测准确性的指标。预设性能条件是指预设的全局模型预测准确性的标准。
具体地,对聚合后的全局模型进行性能评估,通常使用一些指标(如均方根误差RMSE或平均绝对误差MAE)来衡量全局模型在负荷预测等任务上的性能。如果全局模型性能不满足需求,可以通过反馈机制将更新的模型参数返回给各参与方,参与方可以使用更新后的参数进行本地时序数据模型更新,将待训练时序数据模型更新为全局模型,返回至通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练的步骤,直至全局模型满足预设性能条件,根据满足预设性能条件的全局模型进行数据预测。
本实施例中,通过对全局模型进行性能评估,并对全局模型进行更新,能够提高全局模型的泛化能力和预测性能,使全局模型在数据预测时的准确性更高。
在另一个实施例中,如图6所示,提供了一种电网数据的关联处理方法,该方法可以包括以下步骤:
步骤602,将多个参与方的电网数据样本中,具有相似特征和时空关联性的电网数据样本划分至同一个簇中,得到多个不同的簇。
步骤604,通过时间序列分析方法将各个簇内的电网数据样本在相同时间点上对齐,得到各个簇对应的时序数据样本。
步骤606,针对每一簇对应的时序数据样本,通过该簇对应的时序数据样本对具有时序关联性的模型进行训练,在模型训练过程中,对该簇对应的时序数据样本中的时间片段的注意力权重进行调整,并根据调整后的时序数据样本得到模型的损失函数值。
步骤608,当模型的损失函数值最小时,停止训练,得到各个簇对应的时序数据模型。
步骤610,将各个簇对应的时序数据模型的模型参数上传至中央服务器;中央服务器用于对多个簇对应的时序数据模型的模型参数进行加权聚合,得到全局模型。
步骤612,接收中央服务器发送的全局模型。
步骤614,根据预设评估指标对全局模型进行性能评估。
步骤616,当全局模型不满足预设性能条件时,将待训练时序数据模型更新为全局模型,返回至通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练的步骤,直至全局模型满足预设性能条件,根据满足预设性能条件的全局模型进行数据预测。
本实施例中,上述电网数据的关联处理方法中,通过对多个参与方的电网数据样本进行聚类操作和时空对齐操作得到时序数据样本,能够解决数据之间的非独立同分布的问题,同时每个参与方只需在本地进行计算,无需共享原始数据,从而保护了敏感的电网数据,根据时序数据样本训练得到时序数据模型,将时序数据模型的模型参数进行聚合,得到全局模型,相对于传统技术中没有处理数据的非独立同分布的问题导致建模的效果差,上述方法得到的全局模型能够有效地提高模型的数据预测准确性,模型的泛化能力和预测性能得到大大提升,可以适应不同城市、不同电网的数据特点和联邦学习需求,通过调整聚类算法、时空对齐方法和个性化模型调整策略,可以灵活地应用于各种电网数据场景,并实现良好的扩展性。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的电网数据的关联处理方法的电网数据的关联处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个电网数据的关联处理装置实施例中的具体限定可以参见上文中对于电网数据的关联处理方法的限定,在此不再赘述。
在一个实施例中,如图7所示,提供了一种电网数据的关联处理装置,包括:数据聚类模块702、时空对齐模块704、模型训练模块706和模型聚合模块708,其中:
数据聚类模块702,用于通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇。
时空对齐模块704,用于对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本。
模型训练模块706,用于通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型。
模型聚合模块708,用于将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型;全局模型用于进行数据预测。
在一个实施例中,数据聚类模块702,还用于将多个参与方的电网数据样本中,具有相似特征和时空关联性的电网数据样本划分至同一个簇中,得到多个不同的簇。
在一个实施例中,时空对齐模块704,还用于通过时间序列分析方法将各个簇内的电网数据样本在相同时间点上对齐,得到各个簇对应的时序数据样本。
在一个实施例中,模型训练模块706,还用于针对每一簇对应的时序数据样本,通过该簇对应的时序数据样本对具有时序关联性的模型进行训练,在模型训练过程中,对该簇对应的时序数据样本中的时间片段的注意力权重进行调整,并根据调整后的时序数据样本得到模型的损失函数值;当模型的损失函数值最小时,停止训练,得到各个簇对应的时序数据模型。
在一个实施例中,模型聚合模块708,还用于将各个簇对应的时序数据模型的模型参数上传至中央服务器;中央服务器用于对多个簇对应的时序数据模型的模型参数进行加权聚合,得到全局模型;接收中央服务器发送的全局模型。
在一个实施例中,模型聚合模块708,还用于根据预设评估指标对全局模型进行性能评估;当全局模型不满足预设性能条件时,将待训练时序数据模型更新为全局模型,返回至通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练的步骤,直至全局模型满足预设性能条件,根据满足预设性能条件的全局模型进行数据预测。
上述电网数据的关联处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储电网数据样本、时序数据样本、模型参数、注意力权重等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种电网数据的关联处理方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种电网数据的关联处理方法,其特征在于,所述方法包括:
通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇;
对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本;
通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型;
将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型;所述全局模型用于进行数据预测。
2.根据权利要求1所述的方法,其特征在于,所述通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇包括:
将多个参与方的电网数据样本中,具有相似特征和时空关联性的电网数据样本划分至同一个簇中,得到多个不同的簇。
3.根据权利要求1所述的方法,其特征在于,所述对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本包括:
通过时间序列分析方法将各个簇内的电网数据样本在相同时间点上对齐,得到各个簇对应的时序数据样本。
4.根据权利要求1所述的方法,其特征在于,所述通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型包括:
针对每一簇对应的时序数据样本,通过该簇对应的时序数据样本对具有时序关联性的模型进行训练,在模型训练过程中,对该簇对应的时序数据样本中的时间片段的注意力权重进行调整,并根据调整后的时序数据样本得到模型的损失函数值;
当模型的损失函数值最小时,停止训练,得到各个簇对应的时序数据模型。
5.根据权利要求1所述的方法,其特征在于,所述将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型包括:
将所述各个簇对应的时序数据模型的模型参数上传至中央服务器;所述中央服务器用于对多个簇对应的时序数据模型的模型参数进行加权聚合,得到全局模型;
接收所述中央服务器发送的全局模型。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据预设评估指标对所述全局模型进行性能评估;
当所述全局模型不满足预设性能条件时,将待训练时序数据模型更新为所述全局模型,返回至所述通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练的步骤,直至所述全局模型满足预设性能条件,根据满足预设性能条件的全局模型进行数据预测。
7.一种电网数据的关联处理装置,其特征在于,所述装置包括:
数据聚类模块,用于通过聚类操作,将多个参与方的电网数据样本划分为多个不同的簇;
时空对齐模块,用于对各个簇内的电网数据样本进行时空对齐操作,得到各个簇对应的时序数据样本;
模型训练模块,用于通过各个簇对应的时序数据样本分别对待训练时序数据模型进行训练,得到各个簇对应的时序数据模型;
模型聚合模块,用于将多个簇对应的时序数据模型的模型参数进行聚合,得到全局模型;所述全局模型用于进行数据预测。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310887611.1A CN116976507A (zh) | 2023-07-18 | 2023-07-18 | 电网数据的关联处理方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310887611.1A CN116976507A (zh) | 2023-07-18 | 2023-07-18 | 电网数据的关联处理方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116976507A true CN116976507A (zh) | 2023-10-31 |
Family
ID=88477703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310887611.1A Pending CN116976507A (zh) | 2023-07-18 | 2023-07-18 | 电网数据的关联处理方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116976507A (zh) |
-
2023
- 2023-07-18 CN CN202310887611.1A patent/CN116976507A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yu et al. | Probabilistic prediction of regional wind power based on spatiotemporal quantile regression | |
CN111047078B (zh) | 交通特征预测方法、系统及存储介质 | |
CN114330935B (zh) | 基于多种结合策略集成学习的新能源功率预测方法和系统 | |
CN114493052B (zh) | 多模型融合自适应新能源功率预测方法和系统 | |
Zhang et al. | Load Prediction Based on Hybrid Model of VMD‐mRMR‐BPNN‐LSSVM | |
CN114077912A (zh) | 数据预测方法以及数据预测装置 | |
CN116167581A (zh) | 电池需求量预估方法、装置、调度方法和计算机设备 | |
CN114881343A (zh) | 基于特征选择的电力系统短期负荷预测方法及装置 | |
CN113570106A (zh) | 基于高速公路神经网络的电力负荷预测方法及设备 | |
CN117674119A (zh) | 电网运行风险评估方法、装置、计算机设备和存储介质 | |
CN116523001A (zh) | 电网薄弱线路识别模型构建方法、装置和计算机设备 | |
CN116304713A (zh) | 风电场故障场景预测模型的生成方法、装置和计算机设备 | |
CN116258923A (zh) | 图像识别模型训练方法、装置、计算机设备和存储介质 | |
CN116976507A (zh) | 电网数据的关联处理方法、装置、计算机设备和存储介质 | |
CN115577857B (zh) | 能源系统出力数据预测方法、装置和计算机设备 | |
WO2022156743A1 (zh) | 特征构建方法和装置、模型训练方法和装置、设备、介质 | |
CN117318026A (zh) | 光伏发电功率预测方法、装置、计算机设备和存储介质 | |
CN114596116B (zh) | 负荷聚合商电量预测方法、装置和计算机设备 | |
CN116667377A (zh) | 多能源电力系统振荡稳定性评估方法、装置、设备和介质 | |
CN114004398A (zh) | 基于联合学习的电力负荷预测模型建立方法和装置 | |
CN118195160A (zh) | 一种电网断面调控模型训练方法、装置和计算机设备 | |
CN117910777A (zh) | 储能系统调度方法、装置、计算机设备和存储介质 | |
CN116702958A (zh) | 供热系统的热负荷预测方法、模型训练方法、装置及设备 | |
Chen et al. | An Effective Evolutionary Neural Architecture Search for Bike-Sharing System Demand Prediction | |
CN118114916A (zh) | 新能源场站功率预测技术评估与调度方法、系统和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |