CN115688805A - 基于元-多任务学习的电力虚拟调度方法及调度系统 - Google Patents

基于元-多任务学习的电力虚拟调度方法及调度系统 Download PDF

Info

Publication number
CN115688805A
CN115688805A CN202211331157.3A CN202211331157A CN115688805A CN 115688805 A CN115688805 A CN 115688805A CN 202211331157 A CN202211331157 A CN 202211331157A CN 115688805 A CN115688805 A CN 115688805A
Authority
CN
China
Prior art keywords
learner
meta
scheduling
task
transfer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211331157.3A
Other languages
English (en)
Inventor
黄兴
刘为
李立
王维
安鑫
冯宇
李蒸
李蒙
柳璐
齐云飞
齐俊
刘育博
刘晓强
高强
张瑜
聂希柱
张磊
吴昕昀
李清玉
郑善奇
吴赫
李云鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information and Telecommunication Branch of State Grid Liaoning Electric Power Co Ltd
Original Assignee
Information and Telecommunication Branch of State Grid Liaoning Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information and Telecommunication Branch of State Grid Liaoning Electric Power Co Ltd filed Critical Information and Telecommunication Branch of State Grid Liaoning Electric Power Co Ltd
Priority to CN202211331157.3A priority Critical patent/CN115688805A/zh
Publication of CN115688805A publication Critical patent/CN115688805A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于元‑多任务学习的电力虚拟调度方法及调度系统,电力虚拟调度方法包括将调度命令语音和文本数据的数据集划分为训练集和测试集;基于训练集,训练元学习器和迁移学习器;基于测试集,利用训练好的元学习器和迁移学习器,预测测试集上调度语音命令的语义识别标签;基于语义识别标签,获取准确的调度目标,即所需要调度的新能源场站,通过新能源场站的最小运行成本获取达到调度目标的最佳调度路径,基于最小调度路径将调度命令下达至新能源场站。利用元‑多任务学习对电力调度命令语音的识别平均准确率明显优于传统的虚拟调度方法,同时电力虚拟调度的调度准确率高于人工调度的准确率。

Description

基于元-多任务学习的电力虚拟调度方法及调度系统
技术领域
本发明涉及电力调度技术领域,尤其涉及一种基于元-多任务学习的电力虚拟调度方法及调度系统。
背景技术
随着新能源场站数量增长迅猛,新能源场站调度业务处理量急剧增加,导致电力调度人员承载力不足,影响电力调度工作效率,给电力调度带来了极大的挑战。为此,大量的学者对提高调度人员效率的方法做了研究,主要分为调度语音识别和人工智能调度识别两类。
调度语音识别是人机交互领域的一个重要内容,在调度语音识别方面,如基于神经网络的调度语音识别方法采用声学训练模型,提高了调度语音识别准确率,防止调度员语音失误的辅助系统通过调度口令语音校验,避免了调度人员语音交互过程中的失误,预防了事故的发生;梅尔倒谱系数的调度语音分析方法采用小词汇量的声学模型,提高调度语义识别精度。但上述研究仅限于对调度人员语音的识别,并未结合调度流程下达调度指令。
在人工智能调度识别方面已有大量的研究成果,基于人工智能的辅助调度工具通过调度信息挖掘,实现了多种能源调度信息的辨识分析,基于多网融合的调度信息系统采用用户代理模型和跨网络融通,提高了电力调度网络通信指挥的效率;电力调度小机器人的方法分析了人机调度交互语音辨识的特点,并对调度机器人进行了评价。但上述研究仅局限于调度信息挖掘,缺少对调度命令、调度策略、调度仿真的结合,不能下达有效的调度命令。
因此,有必要开发一种基于元-多任务学习的电力虚拟调度方法及调度系统,利用元学习对多任务学习进行改进,在调度人员语音识别的基础上对调度目标进行综合分析,得到最优调度路径并下达调度命令。
发明内容
本发明旨在解决现有技术或相关技术中存在的技术问题之一。
有鉴于此,本发明的一方面提出了一种基于元-多任务学习的电力虚拟调度方法,所述电力虚拟调度方法包括:
步骤1,将调度命令语音和文本数据的数据集划分为训练集和测试集;
步骤2,基于所述训练集,训练元学习器和迁移学习器;
步骤3,基于所述测试集,利用训练好的所述元学习器和所述迁移学习器,预测测试集上所述调度语音命令的语义识别标签;
步骤4,基于所述语义识别标签,获取准确的调度目标,即所需要调度的新能源场站,通过新能源场站的最小运行成本获取达到所述调度目标的最佳调度路径,基于所述最小调度路径将调度命令下达至所述新能源场站。
进一步地,所述训练集和所述测试集划分包括:
步骤101,语义识别数据集包括多个调度人员的调度命令语音和与所述调度命令语音对应的语料,所述语料包括一个语义信息和N个分词信息,基于所述调度命令语音的个数,将所述语义识别数据集划分为若干个子数据集,每个子数据集对应元学习任务集合中的一个任务;
步骤102,选择一个所述调度命令语音作为测试集,其余的所述调度语音命令作为训练集;
其中,所述元任务集合为{T1,T2,...,TK},任务Tk表示第k个调度命令语音。
进一步地,所述元学习器和所述迁移学习器的训练包括:
步骤201,基于所述训练集,将每个所述调度命令语音对应的所述语料划分成支撑集和查询集,所述查询集即所述语义信息为每个所述调度命令语音的目标任务,所述支撑集即所述分词信息为与所述目标任务相关的辅助任务;
步骤202,基于所述训练集上的所述支撑集,训练元学习器,并临时更新元学习器参数,获得基于所述调度命令语音的临时元学习器,用于对所述辅助任务之间的相关性进行建模;
步骤203,基于所述训练集上的所述查询集,利用所述临时元学习器,训练迁移学习器并更新迁移学习器参数,用于对所述辅助任务到所述目标任务的知识迁移能力进行建模;
步骤204,基于所述训练集上的每个所述查询集,利用更新后的所述元学习器参数和所述迁移学习器参数,重新计算所述元学习器获取结果与实际结果的损失,对所得的损失求和取平均作为总损失,采用梯度下降法,继续更新所述元学习器和所述迁移学习器的参数;
步骤205,重复步骤203和步骤204,迭代至所述元学习器和所述迁移学习器收敛后,放入到所述测试集中。
进一步地,所述步骤201包括:
在所述训练集上,令D={D1,D2,...,DK}表示每次训练所述元学习器时所采样到的K个不同所述调度命令语音及与所述调度命令语音相对应的一定量的所述语料,X={X1,...,XK}表示为所述调度命令语音对应的输入语音特征,所述支撑集用于所述分词信息识别上的标签,所述查询集用于进行所述语义信息识别上的标签,设定所述支撑集为每个所述调度命令语音的辅助任务
Figure BDA0003913278950000031
所述查询集为每个所述调度命令语音的目标任务
Figure BDA0003913278950000032
对于给定任务Tk,所述目标任务
Figure BDA0003913278950000033
为给定第k个所述调度命令语音的输入语音特征Xk,从而识别所述调度命令语音的语义信息
Figure BDA0003913278950000034
Figure BDA0003913278950000035
为在所述查询集上对应的标签集,其中所述目标任务记为
Figure BDA0003913278950000036
所述辅助任务
Figure BDA0003913278950000037
为给定第k个所述调度命令语音信息的输入语音特征Xk,识别所述语料中N个所述分词信息
Figure BDA0003913278950000038
Figure BDA0003913278950000039
为在所述支撑集上第n个辅助任务对应的标签集,
Figure BDA00039132789500000310
为第n个辅助任务,所述辅助任务记为
Figure BDA00039132789500000311
综上,对于每个所述调度命令语音的所述语义识别数据集,记为
Figure BDA00039132789500000312
进一步地,所述步骤202包括:
在所述任务Tk的每个所述辅助任务
Figure BDA00039132789500000313
上训练所述元学习器;
选择CNN-LSTM模型作为元学习器,则θ为元学习器的参数,所有的所述辅助任务
Figure BDA00039132789500000314
共享同一个特征提取器,但不共享分类器,此步采用soft max分类器,假设辅助任务n的输出概率为
Figure BDA00039132789500000315
则所述辅助任务n在第n个所述支撑集上的损失为
Figure BDA00039132789500000316
在输入语音特征Xj通过所述元学习器后,分别在所述支撑集的各个辅助任务上对参数θ求导计算相应的梯度
Figure BDA0003913278950000041
再将所有梯度加和后取平均作为这个阶段的总梯度,对于所述任务Tk,按照梯度下降法计算得到所述元学习器的新参数θk′为
Figure BDA0003913278950000042
获取临时元学习器。
进一步地,在所述元学习器之后添加一个用于学习知识迁移的网络层,称为迁移学习器,用于将所述辅助任务的知识迁移到所述目标任务上,所述步骤203包括:
输入语音特征Xk会依次通过所述元学习器和所述迁移学习器,只对所述迁移学习器进行训练,保证所述迁移学习器能够尽快学习知识迁移;
对所述任务Tk的所述目标任务
Figure BDA0003913278950000043
假设所述目标任务的输出概率
Figure BDA0003913278950000044
所述迁移学习器的参数为φ,学习率为β,所述任务Tk在这个阶段的损失
Figure BDA0003913278950000045
Figure BDA0003913278950000046
在所述查询集的所述目标任务上对参数φ求导计算相应的梯度
Figure BDA0003913278950000047
得到迁移学习器的参数更新方式为
Figure BDA0003913278950000048
进一步地,所述步骤204包括:
基于所述训练集,对于每个所述任务Tk的目标任务
Figure BDA0003913278950000049
基于临时更新的元学习器参数θk′和更新后的所述迁移学习器参数φk′,重新计算各个所述任务在所述查询集上的损失,所有损失求和去平均作为总损失为
Figure BDA00039132789500000410
N为辅助任务个数;
采用梯度下降法,用所述总损失分别对所述元学习器和迁移学习器的参数做求导,更新所述元学习器初始参数θ和所述迁移学习器初始参数φ,将γ作为微调的学习率,使得所述元学习器和所述迁移学习器(能够朝着优化目标任务预测的方向发展,更新初始参数如下式:
Figure BDA00039132789500000411
Figure BDA0003913278950000051
进一步地,引入惩罚因子的弃风成本即为风力发电成本为
Figure BDA0003913278950000052
Cw为弃风惩罚因子,Pwfh为风力发电功率的预测值,Pwnh为风力发电实际发电容量;
同理,不计及光伏发电系统建设维护费用的情况下,光伏发电成本即为引入弃光惩罚因子Cs的弃光成本为
Figure BDA0003913278950000053
Psfh为光伏发电功率的预测值,Psnh为光伏实际发电容量;
为使新能源场站的运行成本最小,设新能源场站的运行时间为H,电力虚拟调度的调度决策模型目标函数为:
Figure BDA0003913278950000054
受风电、光伏波动的影响,采用自寻优的方式求解最小运行成本通过粒子群算法进行迭代,假设上一时刻点的运行成本为Fma,得到最小的运行成本minFmb=Fma+rand(Fma);
基于所述测试集上预测识别的所述调度语音命令的所述语义信息和分词信息的标签,识别出所需调度的所述新能源场站,通过所述新能源场站最小运行成本,获取最佳的新能源场站调度路径,将调度命令下达到新能源场。
本发明的另一方面提出了一种基于元-多任务学习的电力虚拟调度系统,所述电力虚拟调度系统包括:
训练集模块和测试集模块,将调度命令语音和文本数据的数据集划分为训练集和测试集;
元学习器模块和迁移学习器模块,基于所述训练集,训练元学习器和迁移学习器;
语义识别标签模块,基于所述测试集,利用训练好的所述元学习器和所述迁移学习器,预测测试集上所述调度语音命令的语义识别标签;
调度命令模块,基于所述语义识别标签,获取准确的调度目标,即所需要调度的新能源场站,通过新能源场站的最小运行成本获取达到所述调度目标的最佳调度路径,基于所述最小调度路径将调度命令下达至所述新能源场站。
本发明的又一方面提出了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现所述的基于元-多任务学习的电力虚拟调度方法。
本发明提供的技术方案可以包括以下有益效果:
本发明利用元-多任务学习对电力调度命令语音的识别平均准确率明显优于传统的虚拟调度方法,与人工调度相比,电力虚拟调度的总时间小于人工调度时间,同时电力虚拟调度的调度准确率高于人工调度的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明一个实施例的基于元-多任务学习的电力虚拟调度方法的步骤流程图;
图2示出了根据本发明一个实施例的本申请识别结果与现有技术识别结果的准确率的对照图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
实施例1
图1示出了根据本发明一个实施例的基于元-多任务学习的电力虚拟调度方法的步骤流程图。
如图1所示,本实施例提供了一种基于元-多任务学习的电力虚拟调度方法,该电力虚拟调度方法包括:
步骤1,将调度命令语音和文本数据的数据集划分为训练集和测试集;
步骤2,基于训练集,训练元学习器和迁移学习器;
步骤3,基于测试集,利用训练好的元学习器和迁移学习器,预测测试集上调度语音命令的语义识别标签;
步骤4,基于语义识别标签,获取准确的调度目标,即所需要调度的新能源场站,通过新能源场站的最小运行成本获取达到调度目标的最佳调度路径,基于最小调度路径将调度命令下达至新能源场站。
本发明利用元-多任务学习对电力调度命令语音的识别平均准确率明显优于传统的虚拟调度方法,与人工调度相比,电力虚拟调度的总时间小于人工调度时间,同时电力虚拟调度的调度准确率高于人工调度的准确率。
进一步地,训练集和测试集划分包括:
步骤101,语义识别数据集包括多个调度人员的调度命令语音和与调度命令语音对应的语料,所述语料包括一个语义信息和N个分词信息,基于调度命令语音的个数,将语义识别数据集划分为若干个子数据集,每个子数据集对应元学习任务集合中的一个任务;
步骤102,选择一个调度命令语音作为测试集,其余的调度语音命令作为训练集;
其中,元任务集合为{T1,T2,...,TK},任务Tk表示第k个调度命令语音。
需要说明的是,语义识别数据集:首先收集文本语料(K条),交给调度人员进行录制,每条录制的语音对应一个语义信息以及N个分词信息,语义信息就是对应的文本含义,分词信息包含特殊读音、专有名词,特殊符号等,针对某区域电网需要,建立了覆盖常用专业名词,专业术语、特殊符号和特殊读音等的语料库,语料库是调度命令语音以及调度命令语音对应的文本信息(包括语义信息及分词信息)。
具体地,语义识别数据集D=(X,Y)一个语义识别数据集对应一条调度命令语音及该调度命令语音对应的语义信息及分词信息,第k条调度命令语音输入为Xk,对应的语义信息为
Figure BDA0003913278950000071
也就是后面说的目标任务,也即查询集
Figure BDA0003913278950000072
对应的分词信息为
Figure BDA0003913278950000073
也就是后面说的辅助任务N个,也即支撑集
Figure BDA0003913278950000074
其中,
Figure BDA0003913278950000075
图2示出了根据本发明一个实施例的元学习器和迁移学习器的训练的步骤流程图。
如图2所示,元学习器和迁移学习器的训练包括:
步骤201,基于训练集,将每个调度命令语音对应的所述语料划分成支撑集和查询集,查询集即语义信息为每个调度命令语音的目标任务,支撑集即分词信息为与目标任务相关的辅助任务;
步骤202,基于训练集上的支撑集,训练元学习器,并临时更新元学习器参数,获得基于调度命令语音的临时元学习器,用于对辅助任务之间的相关性进行建模;
步骤203,基于训练集上的查询集,利用临时元学习器,训练迁移学习器并更新迁移学习器参数,用于对辅助任务到目标任务的知识迁移能力进行建模;
步骤204,基于训练集上的每个查询集,利用更新后的元学习器参数和迁移学习器参数,重新计算元学习器获取结果与实际结果的损失,对对所得的损失求和取平均作为总损失,采用梯度下降法,继续更新元学习器和迁移学习器的参数;
步骤205,重复步骤203和步骤204,迭代至元学习器和迁移学习器收敛后,放入到测试集中。
其中,通过训练集中的支撑集上不同的数据(调度命令语音及分词信息)训练元学习器,并更新元学习器的参数,从而使得元学习器能够匹配与调度命令语音对应的正确的分词信息的标签,当再次输入调度命令语音(X)时,直接能得到对应的分词信息(YS);同理,通过训练集中查询集上不同的数据(调度命令语音和语义信息),并利用临时元学习器训练迁移学习器,并更新迁移学习器的参数,从而使得迁移学习器能够匹配调度命令语音对饮给的正确的语义信息的标签,当再次输入调度命令语音(X)时,直接能得到对应的语义信息(YQ)。
更进一步地,元学习器和迁移学习器收敛的条件为,元学习器和迁移学习器对调度命令语音的识别精确度大于90%以上,则结束训练过程。
需要说明的是,每组数据都会对元学习器进行一次训练,每训练一次都会调整(更新)元学习器的系数,使得元学习器的识别精度提高,训练元学习器和迁移学习器,以便得到更准确的识别结果。
进一步地,步骤201包括:
在训练集上,令D={D1,D2,...,DK}表示每次训练元学习器时所采样到的K个不同调度命令语音及与调度命令语音相对应的一定量的语料,X={X1,...,XK}表示为调度命令语音对应的输入语音特征,支撑集用于分词信息识别上的标签,查询集用于进行语义信息识别上的标签,设定支撑集为每个调度命令语音的辅助任务
Figure BDA0003913278950000081
查询集为每个调度命令语音的目标任务
Figure BDA0003913278950000082
对于给定任务Tk,目标任务
Figure BDA0003913278950000091
为给定第k个调度命令语音的输入语音特征Xk,从而识别调度命令语音的语义信息
Figure BDA0003913278950000092
Figure BDA0003913278950000093
为在查询集上对应的标签集,其中目标任务记为
Figure BDA0003913278950000094
辅助任务
Figure BDA0003913278950000095
为给定第k个调度命令语音信息的输入语音特征Xk,识别语料中N个分词信息
Figure BDA0003913278950000096
Figure BDA0003913278950000097
为在支撑集上第n个辅助任务对应的标签集,
Figure BDA0003913278950000098
为第n个辅助任务,辅助任务记为
Figure BDA0003913278950000099
综上,对于每个调度命令语音的语义识别数据集,记为
Figure BDA00039132789500000910
进一步地,步骤202包括:
在任务Tk的每个辅助任务
Figure BDA00039132789500000911
上训练元学习器;
选择CNN-LSTM模型作为元学习器,则θ为元学习器的参数,所有的辅助任务
Figure BDA00039132789500000912
共享同一个特征提取器,但不共享分类器,此步采用soft max分类器,假设辅助任务n的输出概率为
Figure BDA00039132789500000913
则辅助任务n在第n个支撑集上的损失为
Figure BDA00039132789500000914
在输入语音特征Xj通过元学习器后,分别在支撑集的各个辅助任务上对参数θ求导计算相应的梯度
Figure BDA00039132789500000915
再将所有梯度加和后取平均作为这个阶段的总梯度,对于任务Tk,按照梯度下降法计算得到元学习器的新参数θk′为
Figure BDA00039132789500000916
获取临时元学习器。
进一步地,在元学习器之后添加一个用于学习知识迁移的网络层,称为迁移学习器,用于将辅助任务的知识迁移到目标任务上,步骤203包括:
输入语音特征Xk会依次通过元学习器和迁移学习器,只对迁移学习器进行训练,保证迁移学习器能够尽快学习知识迁移;
对任务Tk的目标任务
Figure BDA00039132789500000917
假设目标任务的输出概率
Figure BDA00039132789500000918
迁移学习器的参数为φ,学习率为β,任务Tk在这个阶段的损失
Figure BDA00039132789500000919
Figure BDA0003913278950000101
在查询集的目标任务上对参数φ求导计算相应的梯度
Figure BDA0003913278950000102
得到迁移学习器的参数更新方式为
Figure BDA0003913278950000103
需要说明的是,元学习器的参数都是通过计算损失进行调整的,先分开分别训练元学习器和迁移学习器,也就是说每一步都要计算损失,用训练得到的结果(标签)与实际情况进行比较,通过支撑集(辅助任务)数据先对元学习器的参数进行更新,再通过查询集(目标任务)数据对迁移学习器的参数进行更新。通过查询集(目标任务)对元学习器和迁移学习器进行训练,得到新的元学习器和迁移学习器的参数。
进一步地,步骤204包括:
基于训练集,对于每个任务Tk的目标任务
Figure BDA0003913278950000104
基于临时更新的元学习器参数θk′和更新后的迁移学习器参数φk′,重新计算各个任务在查询集上的损失,所有损失求和去平均作为本次迭代的总损失为
Figure BDA0003913278950000105
N为辅助任务个数;
采用梯度下降法,用总损失分别对元学习器θ和迁移学习器φ的参数(θ和φ)做求导,更新元学习器初始参数θ和迁移学习器初始参数φ,将γ作为微调的学习率,使得元学习器和迁移学习器能够朝着优化目标任务预测的方向发展,更新如下式:
Figure BDA0003913278950000106
Figure BDA0003913278950000107
需要说明的是,步骤3中,测试集也需要划分为支撑集和查询集,在测试集的支撑集上,利用步骤2训练得到的元学习器按照梯度下降法对训练集上临时元学习器参数进行微调,更新元学习参数,而迁移学习器不参与训练,对应参数也不更新;在测试集的查询集上,利用测试集微调后的元学习器参数
Figure BDA0003913278950000108
和训练集训练好的迁移学习器参数
Figure BDA0003913278950000109
直接预测测试集上调度命令语音的语义信息的标签。
需要说明的是,整体的步骤可以简化为(1)训练元学习器,更新元学习器参数;(2)训练迁移学习器更新迁移学习器参数;(3)对元学习器和迁移学习器整体训练,对元学习器参数进行微调;(4)完成以上步骤得到语音识别模型:元学习器+迁移学习器;(5)在测试集上,通过语音识别模型获取语义信息的标签。
进一步地,步骤4包括:
引入惩罚因子的弃风成本即为风力发电成本为
Figure BDA0003913278950000111
Cw为弃风惩罚因子,Pwfh为风力发电功率的预测值,Pwnh为风力发电实际发电容量;
同理,不计及光伏发电系统建设维护费用的情况下,光伏发电成本即为引入弃光惩罚因子Cs的弃光成本为
Figure BDA0003913278950000112
Psfh为光伏发电功率的预测值,Psnh为光伏实际发电容量;
为使新能源场站的运行成本最小,设新能源场站的运行时间为H,电力虚拟调度的调度决策模型目标函数为:
Figure BDA0003913278950000113
受风电、光伏波动的影响,采用自寻优的方式求解最小运行成本通过粒子群算法进行迭代,假设上一时刻点的运行成本为F,得到最小的运行成本
ma minFmb=Fma+rand(Fma);
基于所述测试集上预测识别的调度语音命令的语义信息和分词信息的标签,识别出所需调度的新能源场站,通过新能源场站最小运行成本,获取最佳的新能源场站调度路径,将调度命令下达到新能源场。
根据上面获取的元学习器和迁移学习器的模型,通过调度语音命令的语义信息的标新,获得所需调度的新能源场站,根据所需调度的新能源场站寻找最优路径进行调度命令的下达,实现实时调度。
需要说明的是,本申请主要是训练学习器和迁移学习器进行语音识别,最小运行成本采用自寻优算法,根据上一时刻点的运行成本,通过自寻优粒子更新,得到最小的运行成本,获取到最佳的新能源场站调度策略。
电力虚拟调度的调度决策模型目标函数以新能源场站调度的运行成本最小,通过自寻优的调度决策算法,计算出最优的新能源场站调度策略(最小成本),通过最小的新能源场站运行成本,获取到最佳的新能源场站调度路径,将调度策略下达至新能源场站。
实施例2
本实施例提供了一种基于元-多任务学习的电力虚拟调度系统,该电力虚拟调度系统包括:
训练集模块和测试集模块,将调度命令语音和文本数据的数据集划分为训练集和测试集;
元学习器模块和迁移学习器模块,基于训练集,训练元学习器和迁移学习器;
语义识别标签模块,基于测试集,利用训练好的元学习器和迁移学习器,预测测试集上调度语音命令的语义识别标签;
调度命令模块,基于语义识别标签,获取准确的调度目标,即所需要调度的新能源场站,通过新能源场站的最小运行成本获取达到调度目标的最佳调度路径,基于最小调度路径将调度命令下达至新能源场站。
实施例3
本实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现权利要求实施例1基于元-多任务学习的电力虚拟调度方法。
对比例
通过本发明的模型(学习器和迁移学习器,MTML)获取的语料信息与现有技术相比,如表1所示,对于调度命令语音识别的准确率明显优于传统基于高斯混合模型的隐马尔可夫模型(GMM-HMM)和基于深度神经网络的隐马尔科夫模型(DNN-HMM)。
表1,本申请识别结果与现有技术识别结果的准确率对照表
Figure BDA0003913278950000121
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种基于元-多任务学习的电力虚拟调度方法,其特征在于,所述电力虚拟调度方法包括:
步骤1,将调度命令语音和文本数据的数据集划分为训练集和测试集;
步骤2,基于所述训练集,训练元学习器和迁移学习器;
步骤3,基于所述测试集,利用训练好的所述元学习器和所述迁移学习器,预测测试集上所述调度语音命令的语义识别标签;
步骤4,基于所述语义识别标签,获取准确的调度目标,即所需要调度的新能源场站,通过新能源场站的最小运行成本获取达到所述调度目标的最佳调度路径,基于所述最小调度路径将调度命令下达至所述新能源场站。
2.根据权利要求1所述的基于元-多任务学习的电力虚拟调度方法,其特征在于,所述训练集和所述测试集划分包括:
步骤101,语义识别数据集包括多个调度人员的调度命令语音和与所述调度命令语音对应的语料,所述语料包括一个语义信息和N个分词信息,基于所述调度命令语音的个数,将所述语义识别数据集划分为若干个子数据集,每个子数据集对应元学习任务集合中的一个任务;
步骤102,选择一个所述调度命令语音作为测试集,其余的所述调度语音命令作为训练集;
其中,所述元任务集合为{T1,T2,...,TK},任务Tk表示第k个调度命令语音。
3.根据权利要求2所述的基于元-多任务学习的电力虚拟调度方法,其特征在于,所述元学习器和所述迁移学习器的训练包括:
步骤201,基于所述训练集,将每个所述调度命令语音对应的所述语料划分成支撑集和查询集,所述查询集即所述语义信息为每个所述调度命令语音的目标任务,所述支撑集即所述分词信息为与所述目标任务相关的辅助任务;
步骤202,基于所述训练集上的所述支撑集,训练元学习器,并临时更新元学习器参数,获得基于所述调度命令语音的临时元学习器,用于对所述辅助任务之间的相关性进行建模;
步骤203,基于所述训练集上的所述查询集,利用所述临时元学习器,训练迁移学习器并更新迁移学习器参数,用于对所述辅助任务到所述目标任务的知识迁移能力进行建模;
步骤204,基于所述训练集上的每个所述查询集,利用更新后的所述元学习器参数和所述迁移学习器参数,重新计算所述元学习器获取结果与实际结果的损失,对所得的损失求和取平均作为总损失,采用梯度下降法,继续更新所述元学习器和所述迁移学习器的参数;
步骤205,重复步骤203和步骤204,迭代至所述元学习器和所述迁移学习器收敛后,放入到所述测试集中。
4.根据权利要求3所述的基于元-多任务学习的电力虚拟调度方法,其特征在于,所述步骤201包括:
在所述训练集上,令D={D1,D2,...,DK}表示每次训练所述元学习器时所采样到的K个不同所述调度命令语音及与所述调度命令语音相对应的一定量的所述语料,X={X1,...,XK}表示为所述调度命令语音对应的输入语音特征,所述支撑集用于所述分词信息识别上的标签,所述查询集用于进行所述语义信息识别上的标签,设定所述支撑集为每个所述调度命令语音的辅助任务
Figure FDA0003913278940000021
所述查询集为每个所述调度命令语音的目标任务
Figure FDA0003913278940000022
对于给定任务Tk,所述目标任务
Figure FDA0003913278940000023
为给定第k个所述调度命令语音的输入语音特征Xk,从而识别所述调度命令语音的语义信息
Figure FDA0003913278940000024
Figure FDA0003913278940000025
为在所述查询集上对应的标签集,其中所述目标任务记为
Figure FDA0003913278940000026
所述辅助任务
Figure FDA0003913278940000027
为给定第k个所述调度命令语音信息的输入语音特征Xk,识别所述语料中N个所述分词信息
Figure FDA0003913278940000028
Figure FDA0003913278940000029
为在所述支撑集上第n个辅助任务对应的标签集,
Figure FDA00039132789400000210
为第n个辅助任务,所述辅助任务记为
Figure FDA00039132789400000211
综上,对于每个所述调度命令语音的所述语义识别数据集,记为
Figure FDA00039132789400000212
5.根据权利要求4所述的基于元-多任务学习的电力虚拟调度方法,其特征在于,所述步骤202包括:
在所述任务Tk的每个所述辅助任务
Figure FDA0003913278940000031
上训练所述元学习器;
选择CNN-LSTM模型作为元学习器,则θ为元学习器的参数,所有的所述辅助任务
Figure FDA0003913278940000032
共享同一个特征提取器,但不共享分类器,此步采用soft max分类器,假设辅助任务n的输出概率为
Figure FDA0003913278940000033
则所述辅助任务n在第n个所述支撑集上的损失为
Figure FDA0003913278940000034
在输入语音特征Xj通过所述元学习器后,分别在所述支撑集的各个辅助任务上对参数θ求导计算相应的梯度
Figure FDA0003913278940000035
再将所有梯度加和后取平均作为这个阶段的总梯度,对于所述任务Tk,按照梯度下降法计算得到所述元学习器的新参数θk′为
Figure FDA0003913278940000036
获取临时元学习器。
6.根据权利要求5所述的基于元-多任务学习的电力虚拟调度方法,其特征在于,在所述元学习器之后添加一个用于学习知识迁移的网络层,称为迁移学习器,用于将所述辅助任务的知识迁移到所述目标任务上,所述步骤203包括:
输入语音特征Xk会依次通过所述元学习器和所述迁移学习器,只对所述迁移学习器进行训练,保证所述迁移学习器能够尽快学习知识迁移;
对所述任务Tk的所述目标任务
Figure FDA0003913278940000037
假设所述目标任务的输出概率
Figure FDA0003913278940000038
所述迁移学习器的参数为φ,学习率为β,所述任务Tk在这个阶段的损失
Figure FDA0003913278940000039
Figure FDA00039132789400000310
在所述查询集的所述目标任务上对参数φ求导计算相应的梯度
Figure FDA00039132789400000311
得到迁移学习器的参数更新方式为
Figure FDA00039132789400000312
7.根据权利要求6所述的基于元-多任务学习的电力虚拟调度方法,其特征在于,所述步骤204包括:
基于所述训练集,对于每个所述任务Tk的目标任务
Figure FDA0003913278940000041
基于临时更新的元学习器参数θk′和更新后的所述迁移学习器参数φk′,重新计算各个所述任务在所述查询集上的损失,所有损失求和去平均作为总损失为
Figure FDA0003913278940000042
N为辅助任务个数;
采用梯度下降法,用所述总损失分别对所述元学习器和迁移学习器的参数做求导,更新所述元学习器初始参数θ和所述迁移学习器初始参数φ,将γ作为微调的学习率,使得所述元学习器和所述迁移学习器能够朝着优化目标任务预测的方向发展,更新初始参数如下式:
Figure FDA0003913278940000043
Figure FDA0003913278940000044
8.根据权利要求3所述的基于元-多任务学习的电力虚拟调度方法,其特征在于,所述步骤4包括:
引入惩罚因子的弃风成本即为风力发电成本为
Figure FDA0003913278940000045
Cw为弃风惩罚因子,Pwfh为风力发电功率的预测值,Pwnh为风力发电实际发电容量;
同理,不计及光伏发电系统建设维护费用的情况下,光伏发电成本即为引入弃光惩罚因子Cs的弃光成本为
Figure FDA0003913278940000046
Psfh为光伏发电功率的预测值,Psnh为光伏实际发电容量;
为使新能源场站的运行成本最小,设新能源场站的运行时间为H,电力虚拟调度的调度决策模型目标函数为:
Figure FDA0003913278940000047
受风电、光伏波动的影响,采用自寻优的方式求解最小运行成本通过粒子群算法进行迭代,假设上一时刻点的运行成本为Fma,得到最小的运行成本minFmb=Fma+rand(Fma);
基于所述测试集上预测识别的所述调度语音命令的所述语义信息和分词信息的标签,识别出所需调度的所述新能源场站,通过所述新能源场站最小运行成本,获取最佳的新能源场站调度路径,将调度命令下达到新能源场。
9.一种基于元-多任务学习的电力虚拟调度系统,其特征在于,所述电力虚拟调度系统包括:
训练集模块和测试集模块,将调度命令语音和文本数据的数据集划分为训练集和测试集;
元学习器模块和迁移学习器模块,基于所述训练集,训练元学习器和迁移学习器;
语义识别标签模块,基于所述测试集,利用训练好的所述元学习器和所述迁移学习器,预测测试集上所述调度语音命令的语义识别标签;
调度命令模块,基于所述语义识别标签,获取准确的调度目标,即所需要调度的新能源场站,通过新能源场站的最小运行成本获取达到所述调度目标的最佳调度路径,基于所述最小调度路径将调度命令下达至所述新能源场站。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现权利要求1至8中任一项所述的基于元-多任务学习的电力虚拟调度方法。
CN202211331157.3A 2022-10-28 2022-10-28 基于元-多任务学习的电力虚拟调度方法及调度系统 Pending CN115688805A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211331157.3A CN115688805A (zh) 2022-10-28 2022-10-28 基于元-多任务学习的电力虚拟调度方法及调度系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211331157.3A CN115688805A (zh) 2022-10-28 2022-10-28 基于元-多任务学习的电力虚拟调度方法及调度系统

Publications (1)

Publication Number Publication Date
CN115688805A true CN115688805A (zh) 2023-02-03

Family

ID=85045635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211331157.3A Pending CN115688805A (zh) 2022-10-28 2022-10-28 基于元-多任务学习的电力虚拟调度方法及调度系统

Country Status (1)

Country Link
CN (1) CN115688805A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116910630A (zh) * 2023-09-14 2023-10-20 北京国电通网络技术有限公司 用户识别信息存储方法、装置、电子设备和介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116910630A (zh) * 2023-09-14 2023-10-20 北京国电通网络技术有限公司 用户识别信息存储方法、装置、电子设备和介质
CN116910630B (zh) * 2023-09-14 2023-11-24 北京国电通网络技术有限公司 用户识别信息存储方法、装置、电子设备和介质

Similar Documents

Publication Publication Date Title
CN114241282B (zh) 一种基于知识蒸馏的边缘设备场景识别方法及装置
CN112599124A (zh) 一种面向电网调度的语音调度方法及系统
CN108984745B (zh) 一种融合多知识图谱的神经网络文本分类方法
CN101101752B (zh) 基于视觉特征的单音节语言唇读识别系统
CN105229725B (zh) 多语言深神经网络
CN111785257B (zh) 一种针对少量标注样本的空管语音识别方法及装置
Leung et al. A procedure for automatic alignment of phonetic transcriptions with continuous speech
CN109204007A (zh) 一种无人驾驶的悬挂式磁悬浮列车及其控制方法
CN109886072B (zh) 基于双向Ladder结构的人脸属性分类系统
CN110751260B (zh) 电子设备、任务处理的方法以及训练神经网络的方法
CN111353029B (zh) 一种基于语义匹配的多轮对话口语理解方法
CN111104498A (zh) 一种任务型对话系统中的语义理解方法
CN111145729A (zh) 语音识别模型训练方法、系统、移动终端及存储介质
CN112990558B (zh) 一种基于深度迁移学习的气象温度、光照的预测方法
CN112632288A (zh) 一种基于知识图谱的电力调度系统及方法
CN107169586A (zh) 基于人工智能的资源组合优化方法、装置及存储介质
CN115688805A (zh) 基于元-多任务学习的电力虚拟调度方法及调度系统
CN111522923B (zh) 一种多轮任务式对话状态追踪方法
CN110008332A (zh) 通过强化学习提取主干词的方法及装置
JP5387274B2 (ja) 標準パタン学習装置、ラベル付与基準算出装置、標準パタン学習方法およびプログラム
CN112036179A (zh) 基于文本分类与语义框架的电力预案信息抽取方法
CN113642862A (zh) 基于bert-mbigru-crf模型的电网调度指令命名实体识别方法及系统
CN112863485A (zh) 口音语音识别方法、装置、设备及存储介质
CN116050419B (zh) 一种面向科学文献知识实体的无监督识别方法及系统
CN112270922B (zh) 一种调度日志自动化填写方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination