CN117094420A - 一种模型训练方法、装置和功率预测方法以及设备和介质 - Google Patents

一种模型训练方法、装置和功率预测方法以及设备和介质 Download PDF

Info

Publication number
CN117094420A
CN117094420A CN202311361709.XA CN202311361709A CN117094420A CN 117094420 A CN117094420 A CN 117094420A CN 202311361709 A CN202311361709 A CN 202311361709A CN 117094420 A CN117094420 A CN 117094420A
Authority
CN
China
Prior art keywords
model
local
local model
aggregation
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311361709.XA
Other languages
English (en)
Other versions
CN117094420B (zh
Inventor
严新荣
郑成航
徐思达
张勇铭
高翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Huadian Electric Power Research Institute Co Ltd
Original Assignee
Zhejiang University ZJU
Huadian Electric Power Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU, Huadian Electric Power Research Institute Co Ltd filed Critical Zhejiang University ZJU
Priority to CN202311361709.XA priority Critical patent/CN117094420B/zh
Publication of CN117094420A publication Critical patent/CN117094420A/zh
Application granted granted Critical
Publication of CN117094420B publication Critical patent/CN117094420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种模型训练方法、装置和功率预测方法以及设备和介质,其中,该模型训练方法包括:基于共识机制将每个新能源场站本地训练的本地模型的本地模型参数,通过区块链节点服务器上传至区块链,生成最新区块;通过区块链节点服务器获取最新区块中的本地模型参数数据;基于本地模型参数数据对每个本地模型进行相关度聚合,得到对应的聚合模型。相比于现有联邦学习方案,通过区块链技术对联邦学习进行去中心化处理,且模型聚合只在新能源场站的本地服务器中进行,区块链节点服务器只进行模型参数的上传与下发,避免了中心节点的异常对模型训练所产生的不利影响,解决了如何提高基于联邦学习的模型训练稳定性的问题。

Description

一种模型训练方法、装置和功率预测方法以及设备和介质
技术领域
本申请涉及人工智能技术领域,特别是涉及一种模型训练方法、装置和功率预测方法以及设备和介质。
背景技术
联邦学习是一种分布式机器学习方法,它允许多个参与方在不需要上传本地数据的情况下共同训练,每个拥有数据的参与方在本地训练一个模型,然后将各子模型聚合得到一个全局模型。联邦学习应用于新能源功率预测可以在保障样本数量的同时解决现阶段集中式功率预测的数据隐私问题。
现有通用的联邦学习架构大多设置一个中心节点用于训练调度、收集各参与方上传的模型参数、执行参数聚合并把更新后的全局模型参数下发给各参与方。在这样的结构中,当中心节点出现故障则会导致全局训练中止,且当参与方过多或任务较为复杂时,中心节点有限的网络带宽也会影响数据交互的效率。
目前针对相关技术中如何提高基于联邦学习的模型训练稳定性的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种模型训练方法、装置和功率预测方法以及设备和介质,以至少解决相关技术中如何提高基于联邦学习的模型训练稳定性的问题。
第一方面,本申请实施例提供了一种模型训练方法,所述方法包括:
基于每个新能源场站的本地运行数据,训练得到每个所述新能源场站的本地模型;
基于共识机制将每个所述本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块;
通过所述区块链节点服务器获取所述最新区块中的本地模型参数数据;
基于所述本地模型参数数据对每个所述本地模型进行相关度聚合,得到对应的聚合模型。
在其中一些实施例中,基于所述本地模型参数数据对每个所述本地模型进行相关度聚合,得到对应的聚合模型包括:
重复执行预设训练步骤,直至全部所述本地模型转换为对应的所述聚合模型,所述预设训练步骤包括:
从所述本地模型中确定目标模型;
确定所述本地模型参数数据中每个所述本地模型参数与所述目标模型的目标模型参数之间的余弦相关度;
基于所述余弦相关度计算所述本地模型参数数据中每个所述本地模型参数的聚合比重;
基于所述聚合比重与所述本地模型参数数据计算聚合参数;
将所述目标模型的所述目标模型参数替换为所述聚合参数,得到所述聚合模型。
在其中一些实施例中,基于所述余弦相关度计算所述本地模型参数数据中每个所述本地模型参数的聚合比重包括:
将所述余弦相关度输入第一模型,计算所述本地模型参数数据中每个所述本地模型参数的所述聚合比重,所述第一模型的表达式为:
其中,ki,j为所述本地模型参数数据中第j个所述本地模型参数ωj的所述聚合比重,N为所述本地模型参数数据中所述本地模型参数的个数,cos(ωi j)为所述本地模型参数数据中第j个所述本地模型参数ωj与所述目标模型参数ωi之间的所述余弦相关度,α为超参数。
在其中一些实施例中,基于所述聚合比重与所述本地模型参数数据计算聚合参数包括:
将所述聚合比重与所述本地模型参数输入第二模型计算所述聚合参数,所述第二模型的表达式为:
其中,ω为所述聚合参数,ki,j为所述本地模型参数数据中第j个所述本地模型参数ωj的所述聚合比重,ωj为所述本地模型参数数据中第j个所述本地模型参数,N为所述本地模型参数数据中所述本地模型参数的个数。
在其中一些实施例中,所述方法还包括:
当接收到迭代训练指令时,基于所述新能源场站的最新本地运行数据,对所述新能源场站的所述聚合模型重新训练,得到所述本地模型;
重新基于共识机制将每个所述本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块。
在其中一些实施例中,所述方法还包括:
当接收到修正训练指令时,根据所述修正训练指令从所述聚合模型中确定待修正模型;
从所述聚合模型中确定所述待修正模型的协同训练模型;
基于对应所述新能源场站的最新本地运行数据,对所述待修正模型及所述协同训练模型重新训练,得到所述本地模型;
重新基于共识机制将每个所述本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块。
第二方面,本申请实施例提供了一种新能源功率预测方法,所述方法包括:
获取待预测新能源场站运行数据;
将所述待预测新能源场站运行数据输入对应新能源场站的聚合模型,得到预测功率;
其中,所述聚合模型为上述第一方面中任一项所述模型训练方法训练得到的模型。
第三方面,本申请实施例提供了一种模型训练装置,所述装置包括:
第一模块,用于根据每个新能源场站的本地运行数据,训练得到每个所述新能源场站的本地模型;
第二模块,用于基于共识机制将每个所述本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块;
第三模块,用于通过所述区块链节点服务器获取所述最新区块中的本地模型参数数据;
第四模块,用于基于所述本地模型参数数据对每个所述本地模型进行相关度聚合,得到对应的聚合模型。
第四方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面和第二方面所述的方法。
第五方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面和第二方面所述的方法。
相比于相关技术,本申请实施例提供的一种模型训练方法、装置和功率预测方法以及设备和介质,其中,该模型训练方法基于共识机制将每个新能源场站本地训练的本地模型的本地模型参数,通过区块链节点服务器上传至区块链,生成最新区块;通过区块链节点服务器获取最新区块中的本地模型参数数据;基于本地模型参数数据对每个本地模型进行相关度聚合,得到对应的聚合模型。相比于现有联邦学习方案,通过区块链技术对联邦学习进行去中心化处理,同时,模型聚合只在新能源场站的本地服务器中进行,区块链节点服务器只进行模型参数的上传与下发,避免了当中心节点出现故障或网络带宽有限,导致影响模型训练进度的情况发生,解决了如何提高基于联邦学习的模型训练稳定性的问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明实施例所提供的一种模型训练方法的流程图;
图2为本发明实施例所提供的一种新能源功率预测方法的流程图;
图3为本发明实施例所提供的一种模型训练装置的结构框图;
图4为本发明实施例所提供的电子设备的内部结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
实施例1
以下结合图1,图1为本发明实施例所提供的一种模型训练方法的流程图,该方法可以包括:
S101:通过每个新能源场站的本地运行数据训练得到每个新能源场站的本地模型。
新能源场站的运行数据属于核心机密,部署在外地容易造成数据隐私泄露,本实施例可以采用联邦学习方法,利用每个新能源场站的本地运行数据训练得到每个新能源场站的本地模型。本实施例并不限定具体的训练方式,一般可以在各场站的本地服务器上布置一个初始化模型,通过新能源场站的本地运行数据训练初始化模型得到本地模型。本实施例并不限定初始化模型的类型。
S102:基于共识机制将每个本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块。
本实施例可以基于共识机制将每个本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块。在本实施例中,可以为每个新能源场站的分配一个区块链节点服务器,本实施例中的区块链节点服务器可以是新能源场站的本地服务器,也可以另外设置一个服务器作为区块链节点服务器。
在训练得到本地模型之后,本地服务器可以将本地模型的本地模型参数上传至区块链节点服务器,各新能源场站的区块链节点服务器在接收到本地模型参数之后,区块链节点服务器可以将本地模型参数以交易的形式上传至交易池中。在上传至交易池的过程中一般会进行交易验证,本实施例的交易中可以包括初始化模型参数、本地模型参数、本地模型准确率以及训练轮次用于交易验证,本实施例并不限定具体的验证方式。
本实施例可以基于共识机制将交易池中的数据上传至区块链中生成最新区块,本实施例中的最新区块为相对概念,每当新生成一个区块,该区块则成为最新区块,上一个最新区块自动变为普通区块。共识机制一般有两个作用: 对数据进行验证,保证数据的正确性和通过共识机制筛选出一个节点来向链上写入数据。本实施例通过共识机制从区块链节点中筛选出一个主节点,该节点可以发出对最新区块的共识请求对交易池中的数据进行验证,共识过程主要是对最新区块进行恶意节点检查、签名检查、区块信息检查、序号检查、节点信息表检查,共识结束后,主节点进行全网广播,最新区块生效。
本实施例并不限定共识机制的具体类型,一般可以选取Raft共识机制,Raft共识机制是一种在分布式系统中常用的共识机制。本发明采用Raft共识机制,所有区块链节点的初始状态都是follower(从)状态,处于时期0,各区块链节点被分配随机的超时时间,一般为150ms-300ms。由于初始状态下没有leader(主)节点发送心跳信息,则超时时间最短的区块链节点A最先变成candidate(候选)状态,时期+1,向还未超时的follower节点发送选举请求,并投自己一票,当follower节点收到节点A的选举请求,且没有收到其他candidate节点的选举请求,投票给节点A并将自己的时期+1,节点A收到多数节点的投票后变成leader节点,开始向其他节点以小于超时时间的时间间隔发送心跳信息,其他节点回归为follower状态,计时器清零,时期与leader节点保持一致。如果leader节点故障,follower节点超过超时时间未收到心跳信息,则该leader节点转变为candidate节点,重复上述步骤选举新的leader节点,如果故障的leader节点恢复正常后时期小于当前全局时期,则恢复正常后的leader节点自动变为follower节点。本实施例采用Raft共识机制进行主节点的选择,解决了中心化架构的中心节点故障导致整个架构无法运行的问题。
本实施例并不限定触发共识机制的方式,在本实施例中,一般在电网调度上报预测结果时间节点的前n个小时或者当主节点交易池中的交易数量达到新能源场站总数时,主节点会生成最新区块,进而发起对最新区块的共识请求。
S103:通过区块链节点服务器获取最新区块中的本地模型参数数据。
S104:基于本地模型参数数据对每个本地模型进行相关度聚合,得到对应的聚合模型。
在本实施例中,各区块链节点服务器可以从区块链的最新区块中获取本地模型参数数据用于本地模型的聚合,本地模型参数数据包含来自各个新能源场站的本地模型的本地模型参数。本实施例并不限定对本地模型的聚合方式,由于每个新能源场站在地理环境及发电方式等方面存在差异性,本实施例可以通过本地模型参数数据对每个本地模型进行相关度聚合,得到对应的聚合模型。
本实施例并不限定对本地模型进行相关度聚合的具体方式,在本实施例中,可以从各本地模型中确定一个目标模型;进而确定本地模型参数数据中每个本地模型参数与目标模型的目标模型参数之间的余弦相关度,基于余弦相关度计算本地模型参数数据中每个本地模型参数的聚合比重,本实施例并不限定计算聚合比重的具体方式,一般可以将余弦相关度输入第一模型,计算本地模型参数数据中每个本地模型参数的聚合比重,第一模型的表达式为:
其中,ki,j为所述本地模型参数数据中第j个所述本地模型参数ωj的所述聚合比重,N为所述本地模型参数数据中所述本地模型参数的个数,cos(ωi j)为所述本地模型参数数据中第j个所述本地模型参数ωj与所述目标模型参数ωi之间的所述余弦相关度,α为超参数。
本实施例可以基于聚合比重与本地模型参数数据计算聚合参数,本实施例并不限定聚合参数的具体计算方式,一般可以将聚合比重与本地模型参数输入第二模型计算聚合参数,第二模型的表达式为:
其中,ω为所述聚合参数,ki,j为所述本地模型参数数据中第j个所述本地模型参数ωj的所述聚合比重,ωj为所述本地模型参数数据中第j个所述本地模型参数,N为所述本地模型参数数据中所述本地模型参数的个数。
进一步地,将目标模型的目标模型参数替换为聚合参数,可以得到聚合模型;
为了实现将全部本地模型转换为聚合模型,本实施例可以继续从本地模型中确定目标模型,按照上述方式将目标模型转换为聚合模型,直至全部本地模型转换为对应的聚合模型。
在本实施例中,为了让聚合模型的性能保持较高水准,本实施例可以进行聚合模型的迭代训练,本实施例并不限定迭代训练的具体方式,一般可以为:
当接收到迭代训练指令时,通过每个新能源场站的最新本地运行数据训练每个新能源场站的聚合模型重新得到本地模型;
基于共识机制将每个本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块;且在迭代训练的交易验证过程中,初始模型参数变为上一轮聚合模型的模型参数;
通过区块链节点服务器获取最新区块中的本地模型参数数据,基于本地模型参数数据对每个本地模型进行相关度聚合,得到对应的聚合模型。
本实施例并不限定触发迭代训练指令的具体方式,可以预先设置迭代时间,如一个月,当达到迭代时间时触发生成迭代训练指令。
进一步地,当发现存在聚合模型的准确率明显下降的情况,本实施例可以对该聚合模型进行修正训练,本实施例并不限定修正训练的具体方式,一般可以为:
当接收到修正训练指令时,根据修正训练指令从聚合模型中确定待修正模型;
从聚合模型中确定待修正模型的协同训练模型;
通过对应新能源场站的最新本地运行数据训练待修正模型及协同训练模型重新得到本地模型;
基于共识机制将每个本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块;且在迭代训练的交易验证过程中,初始模型参数变为上一轮聚合模型的模型参数;
通过区块链节点服务器获取最新区块中的本地模型参数数据,基于本地模型参数数据对每个本地模型进行相关度聚合,得到对应的聚合模型。
本实施例并不限定触发修正训练指令的具体方式,一般当发现某一聚合模型的准确率低于预设阈值,可以根据该聚合模型的信息生成修正训练指令。本实施例也不限定从聚合模型中确定待修正模型的协同训练模型的具体方式,一般可以挑选与待修正模型相似度高的预设数量个模型作为协同训练模型。本实施例并不限定相关度的确定方式,一般可以根据模型参数之间的余弦相关度进行确定。
本发明实施例通过区块链技术对联邦学习进行去中心化处理,模型聚合只在新能源场站的本地服务器中进行,区块链节点服务器只进行模型参数的上传与下发,相比于现有技术,避免了当中心节点出现故障则导致全局训练中止,且当训练任务复杂时,中心节点网络带宽有限导致训练效率慢的问题。
实施例2
以下结合图2,图2为本发明实施例提供一种新能源功率预测方法的流程图,该方法可以包括:
S201:获取待预测新能源场站运行数据。
S202:将待预测新能源场站运行数据输入对应新能源场站的聚合模型,得到预测功率。
其中,聚合模型为根据任一项模型训练方法训练得到的模型。
本实施例可以使用任一项模型训练方法训练得到各新能源场站的聚合模型,以利用聚合模型实现功率预测。获取待预测新能源场站运行数据,将带预测新能源场站的运行数据输入对应新能源场站的聚合模型中可以得到预测功率。
实施例3
以下为本发明实施例所提供的一种模型训练方法的具体实施例,该具体实施例可以包括以下步骤:
S1、通过每个新能源场站的本地运行数据在场站的本地服务器上训练得到每个新能源场站的本地模型;
S2、为每个本地服务器分配一个区块链节点服务器,将本地模型的本地模型参数上传至区块链节点服务器;
S3、区块链节点服务器将本地模型参数以交易的形式上传至交易池中;
S4、基于Raft共识机制交易池中的数据将上传至区块链,生成最新区块;
S5、通过各区块链节点服务器获取最新区块中的本地模型参数数据;
S6、从本地模型中确定目标模型;
S7、确定本地模型参数数据中每个本地模型参数与目标模型的目标模型参数之间的余弦相关度;
S8、基于余弦相关度计算本地模型参数数据中每个本地模型参数的聚合比重;
S9、基于聚合比重与本地模型参数数据计算聚合参数;
S10、将目标模型的目标模型参数替换为聚合参数,得到聚合模型;
S11、继续执行上述S2至S10,直至全部本地模型转换为对应的聚合模型。
实施例4
以下结合图3,图3为本发明实施例所提供的一种模型训练装置的结构框图,该装置可以包括:
第一模块100,用于通过每个新能源场站的本地运行数据训练得到每个所述新能源场站的本地模型;
第二模块200,用于基于共识机制将每个所述本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块;
第三模块300,用于通过所述区块链节点服务器获取所述最新区块中的本地模型参数数据;
第四模块400,用于基于所述本地模型参数数据对每个所述本地模型进行相关度聚合,得到对应的聚合模型。
基于上述实施例,本发明实施例通过区块链技术对联邦学习进行去中心化处理,模型聚合只在新能源场站的本地服务器中进行,区块链节点服务器只进行模型参数的上传与下发,相比于现有技术,避免了当中心节点出现故障则导致全局训练中止,且当训练任务复杂时,中心节点网络带宽有限导致训练效率慢的问题。
基于上述实施例,所述第四模块400,可以包括:
第一单元,用于从所述本地模型中确定目标模型;
第二单元,用于确定所述本地模型参数数据中每个所述本地模型参数与所述目标模型的目标模型参数之间的余弦相关度;
第三单元,用于基于所述余弦相关度计算所述本地模型参数数据中每个所述本地模型参数的聚合比重;
第四单元,用于基于所述聚合比重与所述本地模型参数数据计算所述聚合参数;
第五单元,用于将所述目标模型的所述目标模型参数替换为所述聚合参数,得到所述聚合模型;
第六单元,用于继续执行从所述本地模型中确定所述目标模型的步骤,直至全部所述本地模型转换为对应的所述聚合模型。
基于上述各实施例,所述第三单元,可以包括:
第一子单元,用于将所述余弦相关度输入第一模型,计算所述本地模型参数数据中每个所述本地模型参数的所述聚合比重,所述第一模型的表达式为:
其中,ki,j为所述本地模型参数数据中第j个所述本地模型参数ωj的所述聚合比重,N为所述本地模型参数数据中所述本地模型参数的个数,cos(ωi j)为所述本地模型参数数据中第j个所述本地模型参数ωj与所述目标模型参数ωi之间的所述余弦相关度,α为超参数。
基于上述各实施例,所述第四单元,可以包括:
第二子单元,用于将所述聚合比重与所述本地模型参数输入第二模型计算所述聚合参数,所述第二模型的表达式为:
其中,ω为所述聚合参数,ki,j为所述本地模型参数数据中第j个所述本地模型参数ωj的所述聚合比重,ωj为所述本地模型参数数据中第j个所述本地模型参数,N为所述本地模型参数数据中所述本地模型参数的个数。
基于上述各实施例,该装置还可以包括:
第五模块,用于当接收到迭代训练指令时,通过每个所述新能源场站的最新本地运行数据训练每个所述新能源场站的所述聚合模型重新得到所述本地模型;
第六模块,用于重新进入所述基于共识机制将每个所述本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块的步骤。
基于上述各实施例,该装置还可以包括:
第七模块,用于当接收到修正训练指令时,根据所述修正训练指令从所述聚合模型中确定待修正模型;
第八模块,用于从所述聚合模型中确定所述待修正模型的协同训练模型;
第九模块,用于通过对应所述新能源场站的最新本地运行数据训练所述待修正模型及所述协同训练模型重新得到所述本地模型;
第十模块,用于重新进入所述基于共识机制将每个所述本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块的步骤。
实施例5
以下为本发明实施例所提供的一种新能源功率预测装置,该装置可以包括:
第十一模块,用于获取待预测新能源场站运行数据。
第十二模块,用于将待预测新能源场站运行数据输入对应新能源场站的聚合模型,得到预测功率。
本实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
另外,结合上述实施例中的型训练方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种型训练方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种型训练方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,图4为本发明实施例所提供的电子设备的内部结构示意图,如图4所示,提供了一种电子设备,该电子设备可以是服务器,其内部结构图可以如图4所示。该电子设备包括通过内部总线连接的处理器、网络接口、内存储器和非易失性存储器,其中,该非易失性存储器存储有操作系统、计算机程序和数据库。处理器用于提供计算和控制能力,网络接口用于与外部的终端通过网络连接通信,内存储器用于为操作系统和计算机程序的运行提供环境,计算机程序被处理器执行时以实现一种型训练方法,数据库用于存储数据。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域的技术人员应该明白,以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种模型训练方法,其特征在于,所述方法包括:
基于每个新能源场站的本地运行数据,训练得到每个所述新能源场站的本地模型;
基于共识机制将每个所述本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块;
通过所述区块链节点服务器获取所述最新区块中的本地模型参数数据;
基于所述本地模型参数数据对每个所述本地模型进行相关度聚合,得到对应的聚合模型。
2.根据权利要求1所述模型训练方法,其特征在于,基于所述本地模型参数数据对每个所述本地模型进行相关度聚合,得到对应的聚合模型包括:
重复执行预设训练步骤,直至全部所述本地模型转换为对应的所述聚合模型,所述预设训练步骤包括:
从所述本地模型中确定目标模型;
确定所述本地模型参数数据中每个所述本地模型参数与所述目标模型的目标模型参数之间的余弦相关度;
基于所述余弦相关度计算所述本地模型参数数据中每个所述本地模型参数的聚合比重;
基于所述聚合比重与所述本地模型参数数据计算聚合参数;
将所述目标模型的所述目标模型参数替换为所述聚合参数,得到所述聚合模型。
3.根据权利要求2所述模型训练方法,其特征在于,基于所述余弦相关度计算所述本地模型参数数据中每个所述本地模型参数的聚合比重包括:
将所述余弦相关度输入第一模型,计算所述本地模型参数数据中每个所述本地模型参数的所述聚合比重,所述第一模型的表达式为:
其中,ki,j为所述本地模型参数数据中第j个所述本地模型参数ωj的所述聚合比重,N为所述本地模型参数数据中所述本地模型参数的个数,cos(ωi j)为所述本地模型参数数据中第j个所述本地模型参数ωj与所述目标模型参数ωi之间的所述余弦相关度,α为超参数。
4.根据权利要求2所述模型训练方法,其特征在于,基于所述聚合比重与所述本地模型参数数据计算聚合参数包括:
将所述聚合比重与所述本地模型参数输入第二模型计算所述聚合参数,所述第二模型的表达式为:
其中,ω为所述聚合参数,ki,j为所述本地模型参数数据中第j个所述本地模型参数ωj的所述聚合比重,ωj为所述本地模型参数数据中第j个所述本地模型参数,N为所述本地模型参数数据中所述本地模型参数的个数。
5.根据权利要求1所述模型训练方法,其特征在于,所述方法还包括:
当接收到迭代训练指令时,基于所述新能源场站的最新本地运行数据,对所述新能源场站的所述聚合模型重新训练,得到所述本地模型;
重新基于共识机制将每个所述本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块。
6.根据权利要求1所述模型训练方法,其特征在于,所述方法还包括:
当接收到修正训练指令时,根据所述修正训练指令从所述聚合模型中确定待修正模型;
从所述聚合模型中确定所述待修正模型的协同训练模型;
基于对应所述新能源场站的最新本地运行数据,对所述待修正模型及所述协同训练模型重新训练,得到所述本地模型;
重新基于共识机制将每个所述本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块。
7.一种新能源功率预测方法,其特征在于,所述方法包括:
获取待预测新能源场站运行数据;
将所述待预测新能源场站运行数据输入对应新能源场站的聚合模型,得到预测功率;
其中,所述聚合模型为根据权利要求1至6任一项所述模型训练方法训练得到的模型。
8.一种模型训练装置,其特征在于,所述装置包括:
第一模块,用于根据每个新能源场站的本地运行数据,训练得到每个所述新能源场站的本地模型;
第二模块,用于基于共识机制将每个所述本地模型的本地模型参数通过区块链节点服务器上传至区块链,生成最新区块;
第三模块,用于通过所述区块链节点服务器获取所述最新区块中的本地模型参数数据;
第四模块,用于基于所述本地模型参数数据对每个所述本地模型进行相关度聚合,得到对应的聚合模型。
9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
CN202311361709.XA 2023-10-20 2023-10-20 一种模型训练方法、装置和功率预测方法以及设备和介质 Active CN117094420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311361709.XA CN117094420B (zh) 2023-10-20 2023-10-20 一种模型训练方法、装置和功率预测方法以及设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311361709.XA CN117094420B (zh) 2023-10-20 2023-10-20 一种模型训练方法、装置和功率预测方法以及设备和介质

Publications (2)

Publication Number Publication Date
CN117094420A true CN117094420A (zh) 2023-11-21
CN117094420B CN117094420B (zh) 2024-02-06

Family

ID=88780169

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311361709.XA Active CN117094420B (zh) 2023-10-20 2023-10-20 一种模型训练方法、装置和功率预测方法以及设备和介质

Country Status (1)

Country Link
CN (1) CN117094420B (zh)

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190279107A1 (en) * 2018-03-09 2019-09-12 Lenovo (Beijing) Co., Ltd. Blockchain-based data processing method, apparatus, and electronic device thereof
CN111143308A (zh) * 2019-12-26 2020-05-12 许昌中科森尼瑞技术有限公司 基于联邦学习的高低压电动机数据处理方法、系统及装置
CN112949760A (zh) * 2021-03-30 2021-06-11 平安科技(深圳)有限公司 基于联邦学习的模型精度控制方法、装置及存储介质
CN113592102A (zh) * 2021-07-23 2021-11-02 青岛亿联信息科技股份有限公司 基于联邦学习和区块链的停车预测模型训练方法与系统
CN113972012A (zh) * 2021-10-25 2022-01-25 扬州大学 基于联盟链和公有链的传染病防控协同系统
CN114154392A (zh) * 2021-10-15 2022-03-08 海南火链科技有限公司 基于区块链和联邦学习的模型共建方法、装置及设备
CN114418133A (zh) * 2022-01-20 2022-04-29 广州广电运通金融电子股份有限公司 一种基于区块链的异步联邦学习方法、系统、设备及介质
CN114826699A (zh) * 2022-04-08 2022-07-29 西安电子科技大学 基于区块链的去中心化联邦学习中拜占庭攻击抵御方法
CN115081002A (zh) * 2022-06-28 2022-09-20 西安电子科技大学 用于去中心化联邦学习的聚合服务器选择方法
CN114493052B (zh) * 2022-04-08 2022-10-11 南方电网数字电网研究院有限公司 多模型融合自适应新能源功率预测方法和系统
CN115564600A (zh) * 2022-10-09 2023-01-03 深圳市农博创新科技有限公司 白酒生产辅助方法、服务器及存储介质
US20230080737A1 (en) * 2020-05-27 2023-03-16 North China Electric Power University Federated Learning-Based Regional Photovoltaic Power Probabilistic Forecasting Method and Coordinated Control System
CN115953044A (zh) * 2022-06-29 2023-04-11 南京工业大学 一种基于联邦学习和区块链技术的电网状态稳定性评估方法
WO2023077627A1 (zh) * 2021-11-03 2023-05-11 深圳前海微众银行股份有限公司 一种基于区块链的隐私保护方案聚合方法及装置
CN116128051A (zh) * 2022-11-08 2023-05-16 浙江大学 一种激励驱动的链上半异步联邦学习方法
CN116796864A (zh) * 2023-03-29 2023-09-22 国网安徽省电力有限公司信息通信分公司 一种基于数据相似度聚合的电力数据分布式联邦学习系统及方法
CN116866017A (zh) * 2023-06-28 2023-10-10 北京航空航天大学 一种智能工厂区块链异常检测方法

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190279107A1 (en) * 2018-03-09 2019-09-12 Lenovo (Beijing) Co., Ltd. Blockchain-based data processing method, apparatus, and electronic device thereof
CN111143308A (zh) * 2019-12-26 2020-05-12 许昌中科森尼瑞技术有限公司 基于联邦学习的高低压电动机数据处理方法、系统及装置
US20230080737A1 (en) * 2020-05-27 2023-03-16 North China Electric Power University Federated Learning-Based Regional Photovoltaic Power Probabilistic Forecasting Method and Coordinated Control System
CN112949760A (zh) * 2021-03-30 2021-06-11 平安科技(深圳)有限公司 基于联邦学习的模型精度控制方法、装置及存储介质
CN113592102A (zh) * 2021-07-23 2021-11-02 青岛亿联信息科技股份有限公司 基于联邦学习和区块链的停车预测模型训练方法与系统
CN114154392A (zh) * 2021-10-15 2022-03-08 海南火链科技有限公司 基于区块链和联邦学习的模型共建方法、装置及设备
CN113972012A (zh) * 2021-10-25 2022-01-25 扬州大学 基于联盟链和公有链的传染病防控协同系统
WO2023077627A1 (zh) * 2021-11-03 2023-05-11 深圳前海微众银行股份有限公司 一种基于区块链的隐私保护方案聚合方法及装置
CN114418133A (zh) * 2022-01-20 2022-04-29 广州广电运通金融电子股份有限公司 一种基于区块链的异步联邦学习方法、系统、设备及介质
CN114826699A (zh) * 2022-04-08 2022-07-29 西安电子科技大学 基于区块链的去中心化联邦学习中拜占庭攻击抵御方法
CN114493052B (zh) * 2022-04-08 2022-10-11 南方电网数字电网研究院有限公司 多模型融合自适应新能源功率预测方法和系统
CN115081002A (zh) * 2022-06-28 2022-09-20 西安电子科技大学 用于去中心化联邦学习的聚合服务器选择方法
CN115953044A (zh) * 2022-06-29 2023-04-11 南京工业大学 一种基于联邦学习和区块链技术的电网状态稳定性评估方法
CN115564600A (zh) * 2022-10-09 2023-01-03 深圳市农博创新科技有限公司 白酒生产辅助方法、服务器及存储介质
CN116128051A (zh) * 2022-11-08 2023-05-16 浙江大学 一种激励驱动的链上半异步联邦学习方法
CN116796864A (zh) * 2023-03-29 2023-09-22 国网安徽省电力有限公司信息通信分公司 一种基于数据相似度聚合的电力数据分布式联邦学习系统及方法
CN116866017A (zh) * 2023-06-28 2023-10-10 北京航空航天大学 一种智能工厂区块链异常检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WENKE HUANG 等: "Few-Shot Model Agnostic Federated Learning", 2022 ASSOCIATION FOR COMPUTING MACHINERY *
朱建明等: "基于区块链的隐私保护可信联邦学习模型", 计算机学报 *

Also Published As

Publication number Publication date
CN117094420B (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
US10699043B2 (en) Generating integrated circuit floorplans using neural networks
US10540587B2 (en) Parallelizing the training of convolutional neural networks
CN109919304B (zh) 图像处理方法、装置、可读存储介质和计算机设备
CN111126574A (zh) 基于内镜图像对机器学习模型进行训练的方法、装置和存储介质
CN108921221A (zh) 用户特征的生成方法、装置、设备及存储介质
CN109493417B (zh) 三维物体重建方法、装置、设备和存储介质
CN110597799B (zh) 一种时序数据缺失值自动填补方法、系统和设备
CN113206887A (zh) 边缘计算下针对数据与设备异构性加速联邦学习的方法
CN114330935A (zh) 基于多种结合策略集成学习的新能源功率预测方法和系统
CN110246095A (zh) 一种图像修复方法、装置、存储介质及终端设备
CN117094420B (zh) 一种模型训练方法、装置和功率预测方法以及设备和介质
US20160342899A1 (en) Collaborative filtering in directed graph
CN116431915A (zh) 一种基于联邦学习和注意力机制的跨域推荐方法与装置
CN112787833A (zh) 内容分发网络cdn服务器的部署方法和装置
WO2022227169A1 (zh) 图像分类方法、装置、电子设备及存储介质
Song et al. Personalized federated learning with server-side information
Yang et al. Probabilistic modeling of renewable energy source based on Spark platform with large‐scale sample data
CN113378929A (zh) 一种肺结节生长预测方法和计算机设备
Horng et al. Merging artificial immune system and ordinal optimization for solving the optimal buffer resource allocation of production line
CN116050548B (zh) 一种联邦学习方法、装置及电子设备
CN109524102A (zh) 检查参数选择的方法及装置、计算机设备和可读存储介质
WO2023065309A1 (zh) 一种电路设计方法及装置
CN113810212B (zh) 5g切片用户投诉的根因定位方法及装置
CN112017790B (zh) 基于对抗网络的电子病历筛查方法、装置、设备及介质
CN113822850A (zh) 剂量预测方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant