CN113298329A

CN113298329A - 训练、策略生成方法、系统、计算机装置及存储介质

Info

Publication number: CN113298329A
Application number: CN202010106599.2A
Authority: CN
Inventors: 卢晨贝
Original assignee: Zhongguancun Haihua Information Technology Frontier Research Institute
Current assignee: Zhongguancun Haihua Information Technology Frontier Research Institute
Priority date: 2020-02-21
Filing date: 2020-02-21
Publication date: 2021-08-24

Abstract

本申请提供训练、策略生成方法、系统、计算机装置及存储介质，通过端到端的深度学习框架来进行产能控制策略的生成；其中，在训练该深度学习框架时，令所述深度学习框架接收需能量相关数据集的输入，以输出至少一时隙的产能控制策略；令产能控制策略输入损失函数得到基于该至少一时隙的产能控制策略形成的预测产能量和实际需能量间的匹配损失，通过相应的误差反馈以更新所述深度学习框架的模型参数以限制所述匹配损失。通过深度学习框架确定依据预测产能量的产能控制策略，令预测更为准确；并且通过深度学习框架的端到端学习能有效提升运算效率。

Description

训练、策略生成方法、系统、计算机装置及存储介质

技术领域

本申请涉及能源管理技术领域，特别是涉及训练、策略生成方法、系统、计算机装置及存储介质。

背景技术

可再生能源的日益普及挑战了传统的能量产生系统(如电力系统，包含发电机、发电机组等)的运行模式，相应的，设计对能量产生系统的能量产生行为的控制策略并执行的行为，俗称经济调度(ED)也愈发困难。其难点在于，需要对负载(LOAD)的用能需求进行预测，而短期负荷预测可能相当准确，因此，基于这些预测的调度产生的发电成本几乎为最小。但是，当可再生能源发电被视为负负载时，其随机性使净负载难以预测。

现有的负载预测技术采用的预测精度的度量标准是均方误差(MSE)，并且该度量指标通常与ED的目标函数不一致，存在预测不准确、并不降低成本等问题。

并且，良好的ED策略实现的主要困难来自时间耦合和动态实现。为了解决时间挑战，解决方案的概念从经典的线性和二次规划到用于值点加载的遗传算法不等。为了克服动态调度的困难，已经提出了各种数学规划方法，包括Lambda迭代方法，内部点方法和动态规划等。但是，这些方法通常很耗时，即运算效率低下，及时性差，不适用于大规模的能量产生系统。

发明内容

鉴于以上所述现有相关的缺点，本申请的目的在于提供训练、策略生成方法、系统、计算机装置及存储介质，用于解决现有技术中对能量产生系统的能量产生行为的控制策略存在的种种弊端。

为实现上述目的及其他相关目的，本申请的第一方面提供一种训练方法，用于训练深度学习框架，所述深度学习框架能生成用于控制能量产生系统在至少一时隙的产能控制策略；其中，所述能量产生系统包括一或多个能量产生装置，以至少令对应所述产能控制策略的所述能量产生系统的预测产能量满足同一时隙的用能系统的实际需能量；所述训练方法包括：令所述深度学习框架接收需能量相关数据集的输入，以输出至少一时隙的产能控制策略；令产能控制策略输入损失函数得到基于该至少一时隙的产能控制策略形成的预测产能量和实际需能量间的匹配损失，通过相应的误差反馈以更新所述深度学习框架的模型参数以限制所述匹配损失。

在本申请第一方面的某些实施例中，所述深度学习框架包括：负载预测器，用于根据需能量相关数据集预测该至少一时隙的需能量的概率分布信息；策略生成器，用于根据所述概率分布信息获得所述产能控制策略；所述更新所述深度学习框架的模型参数，包括：更新所述负载预测器的模型参数。

在本申请第一方面的某些实施例中，所述深度学习框架包括：产能预测器，用于根据需能量相关数据集预测所述预测产能量的信息，以用于生成产能控制策略；

所述更新所述深度学习框架的模型参数，包括：

更新所述产能预测器的模型参数。

在本申请第一方面的某些实施例中，所述需能量相关数据集包括：一或多组单元数据，每组单元数据包括：在先时间的历史需求状态参数、及历史实际需能量。

在本申请第一方面的某些实施例中，所述需能量相关数据集中的部分作为训练集，另一部分作为测试集。

在本申请第一方面的某些实施例中，所述深度学习框架根据相关于产能量的产能成本、和/或产能量相对预测需能量短缺和/或超出情形下的供需误差量符合最小化条件以获得所述预测产能量。

在本申请第一方面的某些实施例中，符合最小化条件的所述产能成本的函数是通过在产能量的预设取值范围中执行分段线性函数的建立方法来得到的。

在本申请第一方面的某些实施例中，所述供需误差量根据预测产能量在相对于已知概率密度分布的预测需能量短缺和/或超出情形下得到的累积概率分布与相应系数所表示。

在本申请第一方面的某些实施例中，所述预测产能量位于产能量限制范围中；其中，所述产能量限制范围的边界值与能量产生系统的产能限制相关。

在本申请第一方面的某些实施例中，所述产能量限制范围的边界还与能量产生系统的线路传输能量限制相关。

在本申请第一方面的某些实施例中，所述预测产能量是在所述产能量限制范围上采用步进递减至预设阈值的查询方式所查询得到的，所述步进的方向由所述产能成本和/或供需误差量的函数随预测产能量变化而单调增加或单调递减所确定。

在本申请第一方面的某些实施例中，在所查询到的预测产能量位于所述产能量限制范围以外时，以最接近的所述边界值作为预测产能量。

在本申请第一方面的某些实施例中，所述匹配损失包括：成本损失及供需误差损失中的一种或多种组合。

在本申请第一方面的某些实施例中，所述成本损失包括：预测产能成本及实际需能成本间的偏差；所述预测产能成本为能量产生系统生产一预测产能量的总生产成本；所述实际需能成本等同于该预测产能量满足实际需能量情形下达成的所述总生产成本的最小值。

在本申请第一方面的某些实施例中，所述供需误差损失包括：预测产能量相对实际需能量短缺和/或超出情形下产生的损失。

在本申请第一方面的某些实施例中，所述产能控制策略的生成方式，包括：通过分解函数处理所述预测产能量得到对所述一或多个能量产生装置的能量产生动作，以形成所述产能控制策略；其中，所述分解函数的获取依据包括能量产生系统的产能限制。

在本申请第一方面的某些实施例中，所述分解函数的获取依据还包括：能量产生系统的线路传输能量限制。

在本申请第一方面的某些实施例中，所述产能控制策略的生成方式，包括：以所述预测产能量作为产能控制策略。

为实现上述目的及其他相关目的，本申请的第二方面提供一种产能控制策略生成方法，包括：令深度学习框架接收需能量相关数据集，以输出至少一时隙的产能控制策略；其中，所述深度学习框架是由如第一方面中任一项所述的训练方法所训练得到的。

为实现上述目的及其他相关目的，本申请的第三方面提供一种计算机装置，包括：存储装置，用于存储至少一程序；处理装置，通信连接所述存储装置，用于调用所述至少一程序，以执行如第一方面中任一项所述的训练方法。

为实现上述目的及其他相关目的，本申请的第四方面提供一种计算机装置，包括：存储装置，用于存储至少一程序；处理装置，通信连接所述存储装置，用于调用所述至少一程序，以执行如第二方面所述的产能控制策略生成方法。

为实现上述目的及其他相关目的，本申请的第五方面提供一种能量生成系统；所述能量生成系统包括或通信连接于如第四方面所述的计算机装置以获取对应该至少一时隙的产能控制策略；所述能量生成系统包括：一或多个能量产生装置，用于在该至少一时隙执行由所述产能控制策略所确定的能量产生动作。

为实现上述目的及其他相关目的，本申请的第六方面提供一种计算机存储介质，存储有至少一计算机程序，所述至少一计算机程序被运行时执行如第一方面中任一项所述的训练方法；或者，执行如第二方面所述的产能控制策略生成方法。

如上所述，鉴于MSE不是评估进行ED的负载预测性能的理想选择，本申请提供训练、策略生成方法、系统、计算机装置及存储介质，通过端到端的深度学习框架来进行产能控制策略的生成；其中，在训练该深度学习框架时，令所述深度学习框架接收需能量相关数据集的输入，以输出至少一时隙的产能控制策略；令产能控制策略输入损失函数得到基于该至少一时隙的产能控制策略形成的预测产能量和实际需能量间的匹配损失，通过相应的误差反馈以更新所述深度学习框架的模型参数以限制所述匹配损失。通过深度学习框架确定依据预测产能量的产能控制策略，令预测更为准确；并且通过深度学习框架的端到端学习能有效提升运算效率。

在一些实施例中，通过构造深度学习框架的优化内核实现无约束的单变量优化，避免现有技术中每次迭代中求解多变量约束随机优化问题；进一步的，通过放开优化，可以提升深度学习框架的运算效率和有效性。

附图说明

图1显示为现有技术中的传统学习框架的运行逻辑示意图。

图2显示为本申请实施例中深度学习框架的运行逻辑示意图。

图3显示为本申请实施例中深度学习框架的训练方法的流程示意图。

图4显示为本申请一实施例中深度学习框架的逻辑架构示意图。

图5显示为本申请又一实施例中深度学习框架的逻辑架构示意图。

图6显示为本申请实施例中计算机装置的结构示意图。

图7显示为本申请实施例中能量产生系统的应用示意图。

具体实施方式

以下由特定的具体实施例说明本申请的实施方式，熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本申请的其他优点及功效。在下述描述中，参考附图，附图描述了本申请的若干实施例。应当理解，还可使用其他实施例，并且可以在不背离本申请的精神和范围的情况下进行组成以及操作上的改变。下面的详细描述不应该被认为是限制性的，并且本申请的实施例的范围仅由本申请的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例，而并非旨在限制本申请。

虽然在一些实例中术语第一、第二等在本文中用来描述各种元件，但是这些元件不应当被这些术语限制。这些术语仅用来将一个元件与另一个元件进行区分。

再者，如同在本文中所使用的，单数形式“一”、“一个”和“该”旨在也包括复数形式，除非上下文中有相反的指示。应当进一步理解，术语“包含”、“包括”表明存在所述的特征、步骤、操作、元件、组件、项目、种类、和/或组，但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的，或意味着任一个或任何组合。

应理解，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

现有技术中关于能量产生系统的产能控制策略的生成方式存在缺陷，导致产能控制策略不准确、计算效率低下等问题。在一些实施例中，所述能量可以是电能，所述能量产生系统可以包括一或多个发电厂、发电站、发电机组、或多台协同工作的发电机等，其包括一或多个能量产生装置，例如发电机、发电机组等。

在一些示例中，所述能量产生系统完全是通过传统方式生产能量的，例如火力发电；在一些示例中，所述能量产生系统中可以有部分是通过传统方式生产能量的，例如火力发电，而另一部分是利用可再生能源来生产能量的，例如太阳能、风能、水能、地热、潮汐、生物质能等；当然，在实际情况中，可能传统能源发电的部分占大部分而可再生能源发电的部分占小部分，例如火力发电所生成的电力占总发电电力的80％，而可再生能源发电所产生的电力占总发电电力的20％等；在一些示例中，所述能量产生系统也可以完全是利用可再生能源发电；在一些示例中，所述能量产生系统也可以是根据电池供电来产生能量的。

能量产生系统的电力可以通过电网供应给用能系统。在一些实施例中，所述用能系统包括：一或多个用能装置，例如用能的生产设备、工业设备、运输设备、家用电器等。

为展示现有产能控制策略的生成方式的缺陷，对实际场景进行以下数学建模过程。

具体的，设要获取在包含T个时隙的一段时间内的产能控制策略，设能量产生系统包括n个能量产生装置，用能系统包括m个用能装置，能量产生装置(generator)所生产能量的量值称为产能量，而用能装置所需求的能量称为需能量(demand)，产能量对应用于满足需能量。除了每个发电机的发电成本外，还假设存在与实时供需误差相关的某些风险成本；它们建模为随机变量，并遵循可能的不同分布。试图通过解决以下优化问题来使产能的总成本最小化，即表达为以下模型：

其中，

表示在第t个时隙的第j个用能装置的预测需能量；

表示m个用能装置在第t个时隙各自的预测需能量所构成的向量，

g_it表示第i个能量产生装置的产能量；G_t表示n个能量产生装置在第t个时隙各自的产能量所构成的向量；γ₁、γ₂表示产能量相对需能量短缺、及超出的单位能量，可以是一个或多个单位能量；S_t表示基于m个用能装置的预测需能量、n个能量产生装置的产能量间的误差；B_i表示第i个能量产生装置的产能限制；b表示能量传输线路的线路传输能量限制；H_q，H_d表示产能和用能间的转移系数矩阵。

其中，预测需能量的随机性使得求解式(1)成为一个具有线性约束的多变量随机优化问题。

基于现有技术的预测方式，将负载预测从整个ED过程中分离出来，目的是获得一个跨时间的理想负载预测。因此，传统的ED过程的主要任务是训练一个准确的负载预测器，而执行ED的过程是直接将预测负载(即预测需能量)输入进行调度。

如图1所示显示为现有技术中的传统学习框架的学习过程的运行逻辑示意图。如图所示，根据历史数据，例如过去一段时间的历史数据(如需能量等)，来训练负载预测器101，得到预测需能量的输出并基于MSE的指标来与实际需能量相比进行损失计算，然而，基于MSE的训练是一种通用的选择，并不是为ED定制的，因此，通过该过程训练的负载预测器101在实际应用中并不一定能降低发电成本。

为了突出最小均方误差可能是低效的这一事实，我们在简化的电力池模型上进行具体分析。

简化式(1)～(3)为式(5)：

其中，对于每个时隙t而言，存在以下式(6)

可注意到，式(1)的问题经转化成式(5)的问题后，在进行分析时，只需要考虑整个能量产生系统的总体的产能量g_t即可，而不用先考虑每个能量产生装置i的个体的产能量g_it，降低分析难度；并且，与现有技术不同的是，我们可以根据g_t构建贯穿整个时段T的产能控制策略，而不同于图1中的预测需能量。

在现有技术中，获得第t个时隙的预测需能量之后，将其分解为对应每个用能装置j的需能量，即参考式(7)：

基于式(5)中的后两项的产能量相对需能量的误差风险项，可以通过下式(8)计算：

其中，f(x)表示为预测需能量所遵循的概率密度分布函数(pdf)，而对其求积分即为累积概率分布函数(cdf)。

据此，根据式(5)可以得到，对于每个t，存在式(9)：

求解这个式子得到解g _t即表示为式(10)

其中，

表示为最大产能量，’表示一阶导数。

在经济调度(ED)所讨论的一般情形下，调度的目标是调配部分发电资源来与需求匹配，发电装机容量会大于峰值所需能量，那么在实践中，式(10)可以表示为式(11)：

根据发电量和预测需求应一致的概念，可以得到d_t ^*，其中，d_t ^*表示为：

然而，基于MSE标准的学习框架所得到的d_t ^**，用以进行ED控制，其表示为：

也即是说，d_t ^**是对符合f(x)概率密度分布的预测需能量求数学期望所得到的，与g_t并无关联，也就不会考虑ED控制对能量产生系统的成本影响，故现有技术的基于MSE标准的学习框架的计算方式是存在缺陷而不准确的。

此外，现有技术中采用的数学规划算法存在耗时，效率低下等问题。

鉴于此，本申请实施例中通过设计端到端的深度学习框架来从能量产生系统的产能量角度直接出发，以构建直接对应能量产生系统的产能控制策略，从而克服上述缺陷。

如图2所示，展示本申请实施例中深度学习框架的运行逻辑示意图。

如图所示，所述深度学习框架201是基于端到端(end-to-end)的架构的神经网络实现；所谓端到端，是相比于传统机器学习的流程来讲的。传统机器学习的流程往往由多个独立的模块组成，比如在一个典型的自然语言处理(Natural Language Processing)问题中，包括分词、词性标注、句法分析、语义分析等多个独立步骤，每个步骤是一个独立的任务，其结果的好坏会影响到下一步骤，从而影响整个训练的结果，这是非端到端的；而深度学习框架201在训练过程中，从输入端(输入数据)到输出端会得到一个预测结果，与真实结果相比较会得到一个误差，这个误差会在模型中的每一层传递(反向传播)，每一层的表示都会根据这个误差来做调整，直到模型收敛或达到预期的效果才结束，中间所有的操作都包含在神经网络内部，不再分成多个模块处理。由原始数据输入到结果输出，从输入端到输出端中间的神经网络自成一体，故称为端到端。

相比之下，端到端的深度学习框架201省去了在每一个独立学习任务执行之前所做的昂贵的、易出错的数据标注。

在本实施例中，所述深度学习框架201根据历史用能数据来预测得到时隙t的预测产能值，通过损失函数计算该预测产能值计算与真实结果间的误差，在所述深度学习框架201反向传播以更新参数，从而降低误差；在深度学习框架201训练完成之后，其所输出的预测产能值即可用于产生产能控制策略，例如分解成对应每个能量产生装置的任务产能量，用于作为执行能量产生动作的依据等；或者直接输出预测产能值作为产能控制策略等。

具体的，如图3所示，展示本申请实施例中对深度学习框架的训练方法的流程示意图。

所述流程包括：

步骤S301：令所述深度学习框架接收需能量相关数据集的输入，以输出至少一时隙的产能控制策略。

所述产能控制策略是基于预测产能值所产生的，对应每个时隙t的预测产能值都能产生相应的产能控制策略。

在一些实施例中，由于t时隙实际的需能量d_t是遵循概率分布密度函数

的，其中，

为概率分布密度函数的参数，就例如指数分布的λ，正态分布的μ，σ²等。在一些示例中，该时隙t的长度可能是一或几分钟、一或多小时、一或多天、一或多周、一或多月等等。

在一些实施例中，可以构建如图4所示的深度学习框架，其包括：负载预测器401、策略生成器402及损失函数403。

所述负载预测器401，用于根据需能量相关数据集预测该至少一时隙的需能量的概率分布信息。在一些实施例中，所述负载预测器401可以根据需能量相关数据集预测概率分布密度函数f_t(x)的参数

其中，f_t(x)的类型可以是设定或拟合得到的，例如通过混合高斯模型(GMM)等来进行函数拟合。在一些示例中，所述负载预测器401可以通过端到端的神经网络的模型实现，例如DNN、CNN、RNN等。

所述策略生成器402，用于根据所述概率分布信息获得所述产能控制策略。在一些实施例中，在已知需能量的概率分布密度函数f_t(x)的类型及其参数

的情形下，相应的预测产能量应需至少满足相应时隙的需能量的条件，且可考虑此情形下令成本最低的条件，从而得到优选的预测需能量的解，进而构成产能控制策略。

在一些实施例中，所述深度学习框架根据相关于产能量的产能成本、和/或产能量相对预测需能量短缺和/或超出情形下的供需误差量符合最小化条件以获得所述预测产能量。

可选但非限制的，以下举例中通过根据相关于产能量的产能成本和产能量相对预测需能量短缺和/或超出情形下的供需误差量符合最小化条件，来得到所述预测产能量。

就其原理进行举例说明：由于每个时隙都要满足该时隙的需能量，式(5)中的问题，转化成对每个对其中单个时隙t而言，实现最小成本：

s.t.式(2)、(3)的约束；

其中，第一项表示时隙t的各个能量产生装置i总和(即能量产生系统)的产能成本，后两项分别是时隙t时产能量相对预测需能量短缺、以及超出情形下的供需误差量。

在产能控制策略G_t应用的情形下，其成本C(G_t)应满足：

并且，满足实际需能量d_t需求情形下下实现的最小产能成本表示为:

s.t.式(2)、(3)的约束；以及

也即是在时隙t的产能量g_t恰好满足实际需求量的约束。

根据对应时隙t的理想的产能量g_t所构建的理想的产能控制策略

向量满足下式：

s.t.式(2)、(3)的约束。

另外，式(13)的问题可以转换为式(19)：

s.t.式(2)、(3)的约束，

的约束。

其中，C(g_t)的最小值，即符合最小化条件的所述产能成本，其与式(16)中展示的C_t(d_t)是相同的函数，都是在g_t不同取值情形下所达到的产能成本最小化的函数输出结果；而后两项的供需误差量通过

表示，可以将式(19)近似表示为式(20)：

对式(20)得到其中g_t的最优解作为该时隙t的预测产能量，从而就能构建该时隙t的产能控制策略。

需特别说明的是，在虽然在式(20)中考虑的是产能成本和供需误差量，但是在其他实施例中也可以是择一，即“或”的关系，并非以本实施例为限。

在一些实施例中，应当考虑g_t是存在上限和下限的，取决于式(2)，(3)的约束限制，即取决于式(2)定义得能量产生系统的产能限制，还可以增加考虑如式(3)的能量产生系统的线路传输能量限制，该上限和下限由g_t在(2)，(3)约束下计算定义域的边界得到；另外，也取决于满足时隙t需能量。而g_t这样的上、下限之间的取值范围以内得到的最优解才是符合能量产生系统实际情况的策略生成基础，而由上、下限所限制的产能量限制范围

在这一区间上，C_t(g_t)为凸函数(Convex)。

其中，产能量限制范围的下限值

和上限值

定义为：

可以通过分段线性函数的建立方法高效得到该函数曲线。具体说明该分段线性函数的建立方法：

给定预设取值范围

在该预设取值范围上构建C_t(g_t)函数。

在以C_t(g_t)和g_t分别为坐标轴而建立的平面坐标系中，对应预设取值范围

的两个端点，将代入

计算得到

将

代入式(16)计算得到

并计算得到两个拉格朗日乘子

分别作为两条直线的斜率；其中一条直线经AC两点的直线，其中，A点

C点

另一条直线为经BC两点的直线，其中，B点

联立两条直线的方程形成下式(24)所示：

其中，若

相同，则两条直线不存在交点，则可确定C_t(g_t)函数在预设取值范围上的斜率为

若

不相同，则两条直线存在交点C，从式(24)解出C点坐标值

且将

代入式(16)得到

输出，进而判断C_z和所期望的

是否相等；如果相等，那么表示

就是C_t(g_t)的函数曲线在

之间部分上的点，就可以得到C_t(g_t)函数在两个预设取值范围段

中的分段函数曲线，斜率分别为

若否，则分别依据

作为新的预设取值范围重复执行上述分段线性函数的建立方法，直至得到C_t(g_t)的函数曲线上的点；如此，就可以推广得到

的产能限制范围内的C_t(g_t)的函数曲线。

在一些实施例中，所述分段函数的建立方法可以实际实现为一软件模块，如插件、函数、组件等，可用于被调用来在迭代计算过程或其它需要构建分段函数的情况下依据预设取值范围以输出所构建的C_t(g_t)在预设取值范围上的函数曲线，即例如线性的分段线段的函数。

在式(20)中，

可以通过如式(8)的方式计算。也即是说，所述供需误差量根据预测产能量在相对于已知概率密度分布的预测需能量短缺和/或超出情形下得到的累积概率分布函数F(x)(可以根据概率密度函数f(x)的积分计算)与相应系数γ₁，γ₂所表示。

在一些实施例中，可以证得

的二阶导数大于0，且g_t大于0，可知

存在极小值，令式(20)满足最小化条件的下式(25)，也即存在g_t的最优解

令对应的产能成本最小的同时也使供需误差量最小：

在具体实施例中，本申请可以提供对于深度学习框架优化的学习方式以提升学习效率，以下具体描述。

在可能的实现方式中，所述需能量相关数据集可以是从需能量的历史数据中提取的，所述需能量的历史数据包括在一或多个时隙的需能量的信息，所述时隙可以是以分钟、小时、天、周、月、年为单位。在一些实施方式中，用能系统的需能量可由计量装置测量而得，即按时序采集的在各能价期间测得的用能系统的历史需能量。例如，采集工业企业的计量装置所计量的需能量，并按照采集的时序予以保存。在又一些实施方式中，基于用能系统的用能相关信息预测用能系统的需能量。其中，所述用能相关信息为与用能计划相关的信息，其包括但不限于：用能系统的能参数、用能系统的排产信息、影响用能系统的其他信息中的至少一种。所述能参数举例包括：额定功率、最大功率、变频参数等。所述排产信息举例包括生产计划、对应生产计划的用能系统的运行状态变化等。所述其他信息举例包括天气信息等。按照所述用能相关信息预测用能系统在执行用能计划期间在各阶能价期间的需能量，并按照各能源价格时段的时序对所预测的需能量进行保存。在又一些实施方式中，所述需能量为基于行业的历史需能量而确定的。例如，采用行业内公开的按照时序记录的历史需能量等。

在一些实施例中，所述需能量相关数据集包括：一或多组单元数据，每组单元数据包括：在先时间的历史需求状态参数、及历史实际需能量。举例来说，需能量相关数据集表示为一或多组(x，d)，其中，x表示为在先时间的历史需求状态参数，例如前一天的需能量，工作日或周末的类型，温度等等，而d表示当天的实际需能量；每组单元数据表示的是隐含有形成d结果的可能起因x。可选的，该需能量相关数据集中的部分可用作对深度学习框架的训练集，另一部分可用作测试集。

在本实施例中，可以根据式计算

g_t的取值在

中，进而C_t(g_t)的一阶导数C_t'(g_t)满足：

将需能量相关数据集输入负载预测器P，以根据训练集(x，d)中的x预测时隙t的f_t(x)的分布参数

表示为：

策略生成器402根据

得到概率密度分布

进行预测需求量

的计算。在一些实施例中，所述预测产能量是在所述产能量限制范围上采用步进递减至预设阈值的查询方式所查询得到的，所述步进的方向由所述产能成本和/或供需误差量的函数随预测产能量变化而单调增加或单调递减所确定的。

举例来讲，设置

初始值为

步进

并进一步执行：

当gap大于

时，循环执行：将当前

赋给下一次的

并将gap/2赋给下一次的gap。

其中，sign函数是根据其输入和0之间的关系来输出，例如大于0输出1，等于0输出0，小于0输出-1，那么通过这个函数就可以表示出

大于0、等于0、及小于0时的情形，而一阶导数的这些情形对应了原函数式(20)单增、极值、单减的情况，则本实施例是通过考虑原函数的输出(本实施例中即产能成本和供需误差量符合最小化条件的结果)大小随

变化的情形来得到

的解。

由于

的原函数可以根据前文所述的分段函数构建方法得到，而

的原函数可以参考式(8)得到，故能分别得到

和

的函数。

从而在gap减少到不满足其大于

时，结束循环而得到解得的

需说明的是，其中的a可以根据精度需求选择，例如10的-2、-3、-4、-5、-6次方等。需说明的是，在此过程中，

的最终解可能落在

以外，而

需在

中取值，那么通过对解得的

执行

取中位数，以得到最终的

进一步的，可以通过所构建的分解

函数来将

分解成每个能量产生装置i的任务量g_it，任务量对应了能量产生装置的能量产生动作，以构成预测的时隙t的产能控制策略

在一些实施例中，所述分解函数的获取依据包括能量产生系统的产能限制

可选的，还可包括如式(3)的能量产生系统的线路传输能量限制，产能限制和线路传输能量限制取决于能量产生系统的网络结构。在可能的实现方式中，若能量产生装置都是相同配置(产能限制和线路传输能量限制基本相同)，而生产成本相同或相近似，则可以简单地根据

逐一开启能量产生装置以满负荷产生g_it直至达到

也就是若开启n个能量产生装置来满足

那么n-1个能量产生装置的g_it相同，而最后一个能量产生装置生产的g_it与前n-1个的产能量之和满足

而在更加贴近实际的情况中，能量产生装置的配置可能存在差异，可以通过前述分段函数的构建方法，基于g_t和对应的g_it为坐标构建分段函数G()，可以这样构建的原因在于g_it同样是分段线性的，且对每个g_it可以在求解C_t(g_t)时作为优化问题的内部参数得到。

步骤S302：令产能控制策略输入损失函数403得到基于该至少一时隙的产能控制策略形成的预测产能量和实际需能量间的匹配损失，通过相应的误差反馈以更新所述深度学习框架的模型参数以限制所述匹配损失。

在一些实施例中，通过损失函数403计算匹配损失。在可能的实现方式中，所述匹配损失包括：成本损失及供需误差损失中的一种或多种组合。

以图4所示的深度学习框架举例来说，对应式(13)问题的损失函数403可以表示为：

其中，所述成本损失包括：预测产能成本

及实际需能成本C_t(d_t)间的偏差；所述预测产能成本为能量产生系统生产一预测产能量的总生产成本，可以参考式(15)；所述实际需能成本等同于该预测产能量满足实际需能量情形下达成的所述总生产成本的最小值，可以参考式(16)；所述供需误差损失包括：预测产能量相对实际需能量短缺和/或超出情形下产生的损失，即

其中，结合步骤S301的示例，实际需能量d_t可以是来自单元数据(x，d)中的d，即对应f(x)得到的实际需能量d。

且在根据步骤S301所示例的得到产能控制策略

之后，计算匹配损失

并进一步得到相应的误差反馈，表示为

对负载预测器401预测的分布信息

的偏导结果

进而通过反向传播来更新负载预测器401的模型参数。

其中，根据链式法则，

可以表示为：

表示反向传播过程中误差反馈从损失函数403到策略生成器402再到负载预测器401的过程，用于计算得到

需说明的是，上述展示的是一次训练的过程，训练可能是多次迭代过程，而控制训练次数的指标可以是固定次数、时间，也可以是和损失函数403

相同形式的验证损失函数403L_v，L_v是根据前述需能量相关数据集中分出的测试集对应的，在每次负载预测器401的模型参数更新之后，可以再通过测试集、验证损失函数403来验证负载预测器401是否已达到要求，举例来说，如果再某次通过测试集的(x，d)输入深度学习框架并发现L_v相对上一次来讲并未增加或增加幅度小于预定阈值等，则认为收敛达到精度而训练完成。

需特别说明的是，在上述实施例中，以图4的逻辑架构举例来进行说明深度学习框架的实现，但并非对其限制；举例来说，也可以采用图5的逻辑架构。相比较，图4的深度学习框架进行了无约束的单变量g_t的优化；而图5的深度学习框架相对减少对需能量概率分布的预测，而可以达到更快的运行速度。

如图5所示，展示本申请又一实施例中深度学习框架的逻辑架构示意图。

在本实施例中，与图4实施例的主要差异在于深度学习框架包括：产能预测器501，用于根据需能量相关数据集预测所述预测产能量的信息，以用于生成产能控制策略。

由于学习过程的最终目标应该是尽可能准确地得到预测产能量，而不限制对需能量的分布信息了解得非常精确，对需能量的分布预测往往也会导致需要预测更多的分布参数，故在本实施例中，通过式(3)的线路能量传输限制对每个d_jt的约束所形成的

而约束到C_t()函数中的d_t，而在深度学习的框架中不再对d_t的分布参数进行预测。在训练过程中，所使用的d_t的概率分布信息可以是来自其它模型预测的，或根据历史实际的d_t数据直接拟合得到的，该概率分布信息可以预先设置，而在进行C_t()函数计算时直接使用。

深度学习框架的损失函数502，用于得到基于该产能控制策略对应的预测产能量和实际需能量间的匹配损失，通过相应的误差反馈以更新所述产能预测器501的模型参数以限制所述匹配损失。为了对g_t更精确地预测，本实施例中定义损失函数502：

其中，由于计算损失时实际需求量d_t可以使用被观测到的已发生的量值，而不是所预测的一个分布，因此在本式中直接利用d_t代入计算损失。

执行每次的训练过程：通过训练集的单元数据(x，d)输入产能预测器T，产能预测器501根据C_t(g_t)函数、

进行预测得到

即

且通过

得到限制范围内的

据以计算损失函数502

并进一步计算误差反馈

反向传播以更新T的模型参数。

由于根据式(20)可知，

实际上可以只与g_t相关，即所有能量产生装置的产能量之和相关，那么在本实施例中，训练时不再对

进行分解到每个能量产生装置的调度，而直接输出

需说明的是，在未使用训练完成的深度学习框架进行产能控制策略预测时，在预测得到

后，仍可使用分解函数

来得到产能控制策略，即如图5中虚线所示。

与之前实施例类似的是，每次训练后可以通过测试集的(x，d)输入产能预测器T，并通过相应的验证损失函数502Q_v来进行训练结束判断，若例如Q_v的结果相比前一次训练不再增加或增加幅度小于预定阈值等，则认为收敛达到精度而训练完成。

对应上述训练方法，本申请实施例中还可以提供一种产能控制策略生成方法，其可以利用前述实施例中的训练方法所训练完成的深度学习框架进行策略生成，所述深度学习框架如图3所示，可以是图4、或图5中训练完成的深度学习框架。

所述产能控制策略生成方法包括：令深度学习框架接收需能量相关数据集，以输出至少一时隙的产能控制策略；其中，所述深度学习框架是由图3所示的训练方法所训练得到的。

举例来说，若采用例如图4实施例中的深度学习框架，例如对深度学习框架输入过去一周的历史需能数据，以预测未来某天对每台发电机的产能控制策略。在此实施例中，深度学习框架根据输入数据预测它的分布信息，并进而得到

构建产能控制策略

若采用例如图5实施例中的深度学习框架，例如对深度学习框架输入过去一周的历史需能数据，以预测未来某天各发电机总产能量的产能控制策略。在此实施例中，深度学习框架根据输入数据预测得到

作为产能控制策略输出。

申请人通过实验比较了传统框架和本申请上述实施例中两种深度学习框架的性能：具有MSE标准的常规方法，和本申请提供的深度学习框架；评估指标采用负载预测误差(MSE)和成本损失。

在比较过程中，例如可将每天分为四个时段：午夜(从0:00am到6:00am)，早晨(从6:00am到12:00pm)，下午(从12:00pm到6：00pm)和晚上(从6:00pm到0:00am)，分别对这四个时间段进行上述两个指标的比较，即负载预测误差和成本损失。进而发现，传统的学习方法并不能在所有时期都产生最佳预测，这确实会导致额外成本及较高损失，相比之下，本申请的图4的深度学习框架相比传统方法能够有效降低损失且提高运算效率，而采用图5的深度学习框架通过放宽负载预测分布的假设能实现更高比例的额外改进。

另外，在效率方面也进行了各种框架的对比，与现有技术相比，更好的性能使得本申请的深度学习框架确实在运算过程上会更复杂；但是，与SQP序列二次规划使用的学习框架相比，图4的深度学习框架仍能将学习过程加快182％；而图5的深度学习框架能进一步加快了运算过程，使其达到了图1的传统框架的运行速度，从而验证了本申请技术方案的先进性。

承前所述，本申请还可以提供一种深度学习框架系统，其基于例如图4所示的深度学习框架实现。

在本实施例中，所述深度学习框架系统包括：负载预测器、策略生成器及损失函数。

所述负载预测器，用于根据需能量相关数据集预测该至少一时隙的需能量的概率分布信息。在一些实施例中，所述负载预测器可以根据需能量相关数据集预测概率分布密度函数f_t(x)的参数

其中，f_t(x)的类型可以是设定或拟合得到的，例如通过混合高斯模型(GMM)等来进行函数拟合。在一些示例中，所述负载预测器可以通过端到端的神经网络的模型实现，例如DNN、CNN、RNN等。

所述策略生成器，用于根据所述概率分布信息获得所述产能控制策略。在一些实施例中，在已知需能量的概率分布密度函数f_t(x)的类型及其参数

在一些实施例中，应当考虑g_t是存在上限和下限的，取决于式(2)，(3)的约束限制，即取决于式(2)定义得能量产生系统的产能限制，还可以增加考虑如式(3)的能量产生系统的线路传输能量限制；另外，也取决于满足时隙t需能量。而g_t这样的上、下限之间的取值范围以内得到的最优解才是符合能量产生系统实际情况的策略生成基础，而由上、下限所限制的产能量限制范围

在这一区间上，C_t(g_t)为凸函数(Convex)。

可以通过分段线性函数的建立方法高效得到C_t(g_t)的函数曲线。

在式(20)中，

在一些实施例中，可以证得

的二阶导数大于0，且g_t大于0，可知

令对应的产能成本最小的同时也使供需误差量最小。

在一具体实施例中，本申请提供深度学习框架的优化学习内核以提升学习效率。

在本实施例中，可以根据式计算

g_t的取值在

中，进而C_t(g_t)的一阶导数C_t'(g_t)满足式(28)的分段线性函数；将需能量相关数据集输入负载预测器P，以根据训练集(x，d)中的x预测时隙t的f_t(x)的分布参数

表示为：

策略生成器根据

得到概率密度分布

进行预测需求量

举例来讲，设置

初始值为

步进

并进一步执行：

当gap大于

时，循环执行：将当前

赋给下一次的

并将gap/2赋给下一次的gap。

变化的情形来得到

的解。

由于

的原函数可以根据前文所述的分段函数构建方法得到，而

的原函数可以参考式(8)得到，故能分别得到

和

的函数。

从而在gap减少到不满足其大于

时，结束循环而得到解得的

的最终解可能落在

以外，而

需在

中取值，那么通过对解得的

执行

取中位数，以得到最终的

进一步的，可以通过所构建的分解

函数来将

逐一开启能量产生装置以满负荷产生g_it直至达到

也就是若开启n个能量产生装置来满足

而在更加贴近实际的情况中，能量产生装置的配置可能存在差异，可以通过前述分段函数的构建方法，基于g_it和对应的C(g_it)为坐标构建分段函数G()。

通过损失函数计算匹配损失。在一些实施例中，所述匹配损失包括：成本损失及供需误差损失中的一种或多种组合。

举例来说，基于图4所示的深度学习框架，对应式(13)问题的损失函数可以表示为：

其中，所述成本损失包括：预测产能成本

得到产能控制策略

之后，计算匹配损失

并进一步得到相应的误差反馈，表示为

对负载预测器预测的分布信息

的偏导结果

进而通过反向传播来更新负载预测器的模型参数。

其中，根据链式法则，

可以表示为：

表示反向传播过程中误差反馈从损失函数到策略生成器再到负载预测器的过程，用于计算得到

需说明的是，上述展示的是一次训练的过程，训练可能是多次迭代过程，而控制训练次数的指标可以是固定次数、时间，也可以是和损失函数

相同形式的验证损失函数L_v，L_v是根据前述需能量相关数据集中分出的测试集对应的，在每次负载预测器的模型参数更新之后，可以再通过测试集、验证损失函数来验证负载预测器是否已达到要求，举例来说，如果再某次通过测试集的(x，d)输入深度学习框架并发现L_v相对上一次来讲并未增加或增加幅度小于预定阈值等，则认为收敛达到精度而训练完成。

在一些实施例中，本申请还可以提供一种深度学习框架系统，其基于例如图5所示的深度学习框架实现。

本实施例中，所述深度学习框架系统包括：

产能预测器，用于根据需能量相关数据集预测所述预测产能量的信息，以用于生成产能控制策略；

损失函数，用于得到基于该产能控制策略对应的预测产能量和实际需能量间的匹配损失，通过相应的误差反馈以更新所述产能预测器的模型参数以限制所述匹配损失。

为了对g_t更精确地预测，本实施例中定义损失函数：

执行每次的训练过程：通过训练集的单元数据(x，d)输入产能预测器T，产能预测器根据C_t(g_t)函数、

进行预测得到

即

且通过

得到限制范围内的

据以计算损失函数

并进一步计算误差反馈

反向传播以更新T的模型参数。

由于根据式(20)可知，

进行分解到每个能量产生装置的调度，而直接输出

需说明的是，在未来使用训练完成的深度学习框架预测得到

后，在预测得到

后，仍可使用分解函数

来得到产能控制策略，即如图5中虚线所示。

与之前实施例类似的是，每次训练后可以通过测试集的(x，d)输入产能预测器T，并通过相应的验证损失函数Q_v来进行训练结束判断，若例如Q_v的结果相比前一次训练不再增加或增加幅度小于预定阈值等，则认为收敛达到精度而训练完成。

如图6所示，展示本申请实施例中计算机装置的结构示意图。

所述计算机装置601包括：

存储装置602，用于存储至少一程序。在一些实施例中，所述存储装置602包括一或多个存储服务器或者存储器，所述存储器可包括高速随机存取存储器，并且还可包括非易失性存储器，例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备。在某些实施例中，存储器还可以包括远离一个或多个处理器的存储器，例如经由RF电路或外部端口以及通信网络(未示出)访问的网络附加存储器，其中所述通信网络可以是因特网、一个或多个内部网、局域网、广域网、存储局域网等，或其适当组合。存储器控制器可控制设备的诸如CPU和外设接口之类的其他组件对存储器的访问。所述网络可以是因特网、一个或多个内部网、局域网(LAN)、广域网(WLAN)、存储局域网(SAN)。

处理装置603，通信连接所述存储装置602，用于调用所述至少一程序，以执行对应例如前述实施例中所述的训练方法、或产能控制策略生成方法。所述处理装置603例如为包括具有处理器的终端，例如用户终端、或服务器等，比如应用服务器等，所述处理器可操作地与存储器和/或非易失性存储设备耦接。更具体地，处理器可执行在存储器和/或非易失性存储设备中存储的指令以在计算设备中执行操作，诸如生成图像数据和/或将图像数据传输到电子显示器。如此，处理器可包括一个或多个通用微处理器、一个或多个专用处理器、一个或多个现场可编程逻辑阵列、或它们的任何组合。

其中，所述用户终端例如为包括但不限于台式计算机、桌面电脑、智能手机、手持电脑、平板电脑、智能手表，智能眼镜、媒体播放器、个人数字助理(PDA)等等便携式电子设备或者穿戴式电子设备。

其中，所述服务器可以根据功能、负载等多种因素布置在一个或多个实体服务器上。其中，当分布在多个实体服务器时，所述服务端可以由基于云架构的服务器组成。例如，基于云架构的服务器包括公共云(Public Cloud)服务端与私有云(Private Cloud)服务端，其中，所述公共或私有云服务端包括Software-as-a-Service(软件即服务，SaaS)、Platform-as-a-Service(平台即服务，PaaS)及Infrastructure-as-a-Service(基础设施即服务，IaaS)等。所述私有云服务端例如阿里云计算服务平台、亚马逊(Amazon)云计算服务平台、百度云计算平台、腾讯云计算平台等。所述服务端还可以由分布的或集中的服务器集群构成。例如，所述服务器集群由至少一台实体服务器构成。每个实体服务器中配置多个虚拟服务器，每个虚拟服务器运行所述广告投放系统中的至少一功能模块，各虚拟服务器之间通过器通信。

如图7所示，展示本申请实施例中的一种能量产生系统的应用示意图。

在一些实施例中，所述能量可以是电能，所述能量产生系统可以包括一或多个发电厂、发电站、发电机组、或多台协同工作的发电机等，其包括一或多个能量产生装置701，例如发电机组、发电机等。在一些实施例中，所述能量产生系统也可以是装载在一或多台电动设备上的发电机组，所述电动设备例如为电动车等。在一些示例中，所述能量产生系统完全是通过传统方式生产能量的，例如火力发电；在一些示例中，所述能量产生系统中可以有部分是通过传统方式生产能量的，例如火力发电，而另一部分是利用可再生能源来生产能量的，例如太阳能、风能、水能、地热、潮汐、生物质能等；当然，在实际情况中，可能传统能源发电的部分占大部分而可再生能源发电的部分占小部分，例如火力发电所产生的电力占总发电电力的80％，而可再生能源发电所产生的电力占总发电电力的20％等；在一些示例中，所述能量产生系统也可以完全是利用可再生能源发电；在一些示例中，所述能量产生系统也可以是根据电池供电来产生能量的。

能量产生系统的电力可以通过电网供应给用能系统。

所述用能系统包括：一或多个用能装置702。例如用能的生产设备、工业设备、运输设备、家用电器等。

其中，所述能量产生系统包括或通信连接于如图6所示的计算机装置601以获取对应该至少一时隙的产能控制策略，而一或多个能量产生装置701，用于在该至少一时隙执行由所述产能控制策略所确定的能量产生动作。

在一些实施例中，本申请还提供一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序在运行时执行前述实施例中的训练方法；或者，执行前述实施例中的产能控制策略生成方法。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者器设备等)执行本申请各个实施例所述方法的全部或部分步骤。

于本申请提供的实施例中，所述计算机可读写存储介质可以包括只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，RandomAccessMemory)、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁存储设备、闪存、U盘、移动硬盘、或者能够用于存储具有指令或数据结构形式的期望的程序代码并能够由计算机进行存取的任何其它介质。另外，任何连接都可以适当地称为计算机可读介质。例如，如果指令是使用同轴电缆、光纤光缆、双绞线、数字订户线(DSL)或者诸如红外线、无线电和微波之类的无线技术，从网站、服务器或其它远程源发送的，则所述同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线电和微波之类的无线技术包括在所述介质的定义中。然而，应当理解的是，计算机可读写存储介质和数据存储介质不包括连接、载波、信号或者其它暂时性介质，而是旨在针对于非暂时性、有形的存储介质。如申请中所使用的磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软盘和蓝光光盘，其中，磁盘通常磁性地复制数据，而光盘则用激光来光学地复制数据。

综上所述，鉴于MSE不是评估进行ED的负荷预测性能的理想选择，本申请提供训练、策略生成方法、系统、计算机装置及存储介质，通过端到端的深度学习框架来进行产能控制策略的生成；其中，在训练该深度学习框架时，令所述深度学习框架接收需能量相关数据集的输入，以输出至少一时隙的产能控制策略；令产能控制策略输入损失函数得到基于该至少一时隙的产能控制策略形成的预测产能量和实际需能量间的匹配损失，通过相应的误差反馈以更新所述深度学习框架的模型参数以限制所述匹配损失。

应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

上述实施例仅例示性说明本申请的原理及其功效，而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本申请的权利要求所涵盖。

Claims

1.一种训练方法，其特征在于，用于训练深度学习框架，所述深度学习框架能生成用于控制能量产生系统在至少一时隙的产能控制策略；其中，所述能量产生系统包括一或多个能量产生装置，以至少令对应所述产能控制策略的所述能量产生系统的预测产能量满足同一时隙的用能系统的实际需能量；所述训练方法包括：

令所述深度学习框架接收需能量相关数据集的输入，以输出至少一时隙的产能控制策略；

令产能控制策略输入损失函数得到基于该至少一时隙的产能控制策略形成的预测产能量和实际需能量间的匹配损失，通过相应的误差反馈以更新所述深度学习框架的模型参数以限制所述匹配损失。

2.根据权利要求1所述的训练方法，其特征在于，所述深度学习框架包括：负载预测器，用于根据需能量相关数据集预测该至少一时隙的需能量的概率分布信息；策略生成器，用于根据所述概率分布信息获得所述产能控制策略；

所述更新所述深度学习框架的模型参数，包括：

更新所述负载预测器的模型参数。

3.根据权利要求1所述的训练方法，其特征在于，所述深度学习框架包括：产能预测器，用于根据需能量相关数据集预测所述预测产能量的信息，以用于生成产能控制策略；

所述更新所述深度学习框架的模型参数，包括：

更新所述产能预测器的模型参数。

4.根据权利要求1所述的训练方法，其特征在于，所述需能量相关数据集包括：一或多组单元数据，每组单元数据包括：在先时间的历史需求状态参数、及历史实际需能量。

5.根据权利要求1所述的训练方法，其特征在于，所述需能量相关数据集中的部分作为训练集，另一部分作为测试集。

6.根据权利要求1所述的训练方法，其特征在于，所述深度学习框架根据相关于产能量的产能成本、和/或产能量相对预测需能量短缺和/或超出情形下的供需误差量符合最小化条件以获得所述预测产能量。

7.根据权利要求6所述的训练方法，其特征在于，符合最小化条件的所述产能成本的函数是通过在产能量的预设取值范围中执行分段线性函数的建立方法来得到的。

8.根据权利要求6所述的训练方法，其特征在于，所述供需误差量根据预测产能量在相对于已知概率密度分布的预测需能量短缺和/或超出情形下得到的累积概率分布与相应系数所表示。

9.根据权利要求6所述的训练方法，其特征在于，所述预测产能量位于产能量限制范围中；其中，所述产能量限制范围的边界值与能量产生系统的产能限制相关。

10.根据权利要求9所述的训练方法，其特征在于，所述产能量限制范围的边界还与能量产生系统的线路传输能量限制相关。

11.根据权利要求9所述的，其特征在于，所述预测产能量是在所述产能量限制范围上采用步进递减至预设阈值的查询方式所查询得到的，所述步进的方向由所述产能成本和/或供需误差量的函数随预测产能量变化而单调增加或单调递减所确定。

12.根据权利要求11所述的训练方法，其特征在于，在所查询到的预测产能量位于所述产能量限制范围以外时，以最接近的所述边界值作为预测产能量。

13.根据权利要求1或6所述的训练方法，其特征在于，所述匹配损失包括：成本损失及供需误差损失中的一种或多种组合。

14.根据权利要求13所述的训练方法，其特征在于，所述成本损失包括：预测产能成本及实际需能成本间的偏差；所述预测产能成本为能量产生系统生产一预测产能量的总生产成本；所述实际需能成本等同于该预测产能量满足实际需能量情形下达成的所述总生产成本的最小值。

15.根据权利要求13所述的训练方法，其特征在于，所述供需误差损失包括：预测产能量相对实际需能量短缺和/或超出情形下产生的损失。

16.根据权利要求1所述的训练方法，其特征在于，所述产能控制策略的生成方式，包括：

通过分解函数处理所述预测产能量得到对所述一或多个能量产生装置的能量产生动作，以形成所述产能控制策略；

其中，所述分解函数的获取依据包括能量产生系统的产能限制。

17.根据权利要求16所述的训练方法，其特征在于，所述分解函数的获取依据还包括：能量产生系统的线路传输能量限制。

18.根据权利要求3所述的训练方法，其特征在于，所述产能控制策略的生成方式，包括：以所述预测产能量作为产能控制策略。

19.一种产能控制策略生成方法，其特征在于，包括：

令深度学习框架接收需能量相关数据集，以输出至少一时隙的产能控制策略；

其中，所述深度学习框架是由如权利要求1至18中任一项所述的训练方法所训练得到的。

20.一种深度学习框架系统，其特征在于，包括：

负载预测器，用于根据需能量相关数据集预测至少一时隙的需能量的概率分布信息；

策略生成器，用于根据所述概率分布信息获得至少一时隙的产能控制策略；

损失函数，用于得到基于该产能控制策略对应的预测产能量和实际需能量间的匹配损失，通过相应的误差反馈以更新所述负载预测器的模型参数以限制所述匹配损失。

21.一种深度学习框架系统，其特征在于，包括：

22.一种计算机装置，其特征在于，包括：

存储装置，用于存储至少一程序；

处理装置，通信连接所述存储装置，用于调用所述至少一程序，以执行如权利要求1至18中任一项所述的训练方法。

23.一种计算机装置，其特征在于，包括：

存储装置，用于存储至少一程序；

处理装置，通信连接所述存储装置，用于调用所述至少一程序，以执行如权利要求19所述的产能控制策略生成方法。

24.一种能量生成系统，其特征在于，至少部分基于可再生能源以生产能量；所述能量生成系统包括或通信连接于如权利要求23所述的计算机装置以获取对应该至少一时隙的产能控制策略；所述能量生成系统包括：

一或多个能量产生装置，用于在该至少一时隙执行由所述产能控制策略所确定的能量产生动作。

25.一种计算机存储介质，其特征在于，存储有至少一计算机程序，所述至少一计算机程序被运行时执行如权利要求1至18中任一项所述的训练方法；或者，执行如权利要求19所述的产能控制策略生成方法。