CN112560981B

CN112560981B - 生成对抗模型的训练方法、装置、设备、程序和存储介质

Info

Publication number: CN112560981B
Application number: CN202011547686.8A
Authority: CN
Inventors: 刘浩; 韩金栋; 祝恒书; 窦德景
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-12-24
Filing date: 2020-12-24
Publication date: 2023-07-25
Anticipated expiration: 2040-12-24
Also published as: US20220092433A1; CN112560981A

Abstract

本公开公开了一种异质生成对抗模型的训练方法、装置、设备、程序和存储介质，涉及计算机技术领域，尤其涉及深度学习技术。具体实现方案为：获取异质站点的实测数据；采用异质站点的实测数据作为训练样本，基于总目标函数对所述异质生成对抗模型进行联合训练；其中，生成器用于根据异质站点历史时刻的环境数据对未来时刻的环境数据进行预测，以输出预测数据；判别器用于输入生成器输出的预测数据和对应的实测数据，判别实测数据和预测数据的近似度；总目标函数包括所述生成器的第一目标函数和所述判别器的第二目标函数，通过该异质生成对抗模型的训练方法训练得到的异质生成对抗模型能够实现对不同类别的环境数据的联合预测。

Description

生成对抗模型的训练方法、装置、设备、程序和存储介质

技术领域

本公开涉及计算机技术领域，尤其涉及深度学习技术，具体涉及一种异质生成对抗模型的训练方法、装置、设备、程序和存储介质。

背景技术

随着环境污染的危害加剧，人们越来越关注天气、空气质量给工作生活带来的影响。因此，在关注区域，特别是大城市中布设了很多空气质量监测站和天气监测站，对空气质量和天气的各项指标数据分别进行监测。但是，监测站的布设有限，仅能覆盖部分区域，也无法满足人们对未来时刻空气质量和天气情况的获知需求。所以，现有技术提出了基于监测站数据来预测空气质量和天气的方案，例如可以采用深度学习模型来进行数据学习和预测。

现有的预测模型是基于监测站的实测数据来进行模型训练和预测的，但是，监测站的实测数据中会由于监测站的传感器、监测条件等各种原因引入测量误差，实测数据与实际环境的数据并不完全一致。这些误差会在预测模型的学习过程中被传播、放大，进而影响了预测模型的准确性。

发明内容

本公开提供了一种异质生成对抗模型的训练方法、装置、设备、程序和存储介质，以实现异质生成对抗模型对不同类别的环境数据的联合预测。

第一方面，本公开实施例提供了一种异质生成对抗模型的训练方法，所述异质生成对抗模型包括生成器和判别器，所述方法包括：

获取异质站点的实测数据；其中，所述异质站点包括至少两类站点，每类站点用于测量获得对应类别的环境数据，作为该站点的实测数据；

采用异质站点的实测数据作为训练样本，基于总目标函数对所述异质生成对抗模型进行联合训练；

其中，所述生成器用于根据异质站点历史时刻的环境数据对未来时刻的环境数据进行预测，以输出预测数据；

所述判别器用于输入所述生成器输出的预测数据和对应的实测数据，判别所述实测数据和预测数据的近似度；

所述总目标函数包括所述生成器的第一目标函数和所述判别器的第二目标函数。

第二方面，本公开实施例提供了一种异质生成对抗模型的训练装置，包括：

获取模块，用于获取异质站点的实测数据；其中，所述异质站点包括至少两类站点，每类站点用于测量获得对应类别的环境数据，作为该站点的实测数据；

处理模块，用于采用异质站点的实测数据作为训练样本，基于总目标函数对所述异质生成对抗模型进行联合训练；

第三方面，本公开实施例提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述第一方面所述的方法。

第四方面，本公开实施例提供一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现上述第一方面所述的方法。

第五方面，本公开实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据上述第一方面所述的方法。

本公开实施例提供了一种异质生成对抗模型的训练方法、装置、电子设备、程序和存储介质，能够提高预测模型的准确性。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是可以实现本公开实施例提供的异质生成对抗模型的训练方法的场景图；

图2为本公开实施例提供的一种异质生成对抗模型的训练方法的流程示意图；

图3为本公开实施例提供的一种空间判别器的原理示意图；

图4为本公开实施例提供的一种时间判别器的原理示意图；

图5为本公开实施例提供的一种宏观判别器的原理示意图；

图6为本公开实施提供的一种异质生成对抗模型的训练装置的结构示意图；

图7是用来实施本公开实施例的异质生成对抗模型的训练方法的电子设备的示意性框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本公开实施例提供一种异质生成对抗模型的训练技术方案，训练得到的异质生成对抗模型可应用于客户端，如天气客户端，用于对空气质量、天气等环境状况进行联合预测。

本实施例的提供的异质生成对抗模型的训练方法可以由数据处理能力的电子设备执行，示例性地，图1是可以实现本公开实施例提供的异质生成对抗模型的训练方法的场景图，如图1所示，该场景中包括至少一个中心设备和多个站点设备，其中，中心设备用于执行本公开实施例提供的异质生成对抗模型的训练方法，中心设备与各站点设备之间通信连接，站点设备即为设置在各环境监测站点的设备，可以是天气数据监测站，也可以是空气质量数据监测站。各站点设备用于采集对应监测站点的环境数据。当然，站点设备也可以将采集的数据汇集到某数据库中，以便集中提供给中心设备。

图2为本公开实施例提供的一种异质生成对抗模型的训练方法的流程示意图，本实施例的方法可以由本公开实施例所提供的异质生成对抗模型的训练装置执行，该装置可以由软件和/或硬件的方式来实现，并可集成于服务器以及智能终端等电子设备中。如图2所示，本实施例的异质生成对抗模型的训练方法，包括：

S201、获取异质站点的实测数据。

本步骤中，获取进行模型训练所需的异质站点的实测数据，其中，异质站点包括至少两类站点，每类站点用于测量获得对应类别的环境数据，作为该站点的实测数据，实测数据是指通过传感器等器件或相应的环境数据采集方法，测得的实际环境数据。

可选地，异质站点包括空气质量监测站点和天气监测站点，相应地，实测数据中包括天气实测数据和空气质量实测数据，示例性地，天气实测数据可以包括气象、温度、湿度、风速等，相应地，可以由天气监测站采集或测量获得，空气质量实测数据可以包括空气中各种成分，如烟尘、PM2.5、SO2、NO2等的含量数据，可以由空气质量监测站采集或测量获得。

可以理解的是，本步骤中，可以从数据库中提取预先收集的各异质站点的实测数据，也可以实时从异质站点获取相应的实测数据。

示例性地，如图1所示，中心设备通过数据库对各站点设备上报的实测数据进行存储，在进行模型训练时，中心设备从自身的数据库中提取所需的实测数据。

示例性地，如图1所示，各站点设备对其所在监测站的实测数据进行存储，当中心设备需要进行模型训练时，中心设备向各监测站发送数据获取指令，各监测站根据接收到的数据获取指令，将对应的实测数据发送给中心设备。

S202、采用异质站点的实测数据作为训练样本，基于总目标函数对异质生成对抗模型进行联合训练。

本步骤中，采用S201中获取的异质站点的实测数据作为训练样本，并利用预先构建的总目标函数对异质生成对抗模型进行联合训练，以使训练得到的异质生成对抗模型可以对空气质量、天气等环境状况进行联合预测，与现有技术中对不同的环境状况单独进行预测的技术方案相比，本公开的技术方案可以提高处理效率，降低能耗。

本实施例中，异质生成对抗模型包括生成器和判别器，其中，生成器用于根据异质站点历史时刻的环境数据对未来时刻的环境数据进行预测，以输出预测数据；判别器用于输入生成器输出的预测数据和对应的实测数据，判别实测数据和预测数据的近似度；总目标函数包括生成器的第一目标函数和判别器的第二目标函数，第二目标函数中包括近似度。

可选地，总目标函数为生成器的第一目标函数与判别器的第二目标函数的和，可以用公式表示为：

L＝L_g+L_D (1)

其中，L表示总目标函数；L_g表示生成器的第一目标函数；L_D表示判别器的第二目标函数。

本实施例中，在一种可能的实现方式中，第一目标函数为生成器的损失函数，该损失函数一般为最小二乘损失。

第二目标函数中的近似度，即预测数据与对应的实测数据之间的近似度，用于确定预测数据与实测数据的接近程度，进而确定生成器生成的预测数据的准确度和可信度，以判定生成器生成的预测数据是否能够达到对环境状况进行预测的目的。

对应的实测数据，是指与预测数据对应的实测数据，该对应不仅包括监测站点的对应，还包括时刻上的对应判别器判别的是相同监测站点同一时刻的预测数据与实测数据之间的近似度。

可以理解的是，生成器与判别器连接，且判别器设置在生成器的数据下游，生成器与判别器中的数据处理是异步进行的，示例性地，生成器在T时刻，采用T时刻和T时刻以前的环境数据，对T+1时刻的环境数据进行预测，得到T+1时刻的预测数据，并将预测数据输出到判别器，判别器在T+1时刻，获取T+1时刻的实测数据，并判别T+1的预测数据与T+1时刻的实测数据之间的近似度。

可以理解的是，在异质生成对抗模型中，生成器和判别器有各自独立的模型和模型参数，本实施例中，对异质生成对抗模型的训练主要是对生成器和判别器的模型参数进行训练。在一种可能的实施方式中，本实施例中，通过采用异质站点的实测数据作为训练样本，输入生成器，并基于总目标函数中的第一目标函数对生成器中的模型参数进行训练；将生成器输出的预测数据和对应的实测数据，输入判别器，并基于总目标函数中的第二目标函数对判别器中的模型参数进行训练；根据判别器的训练结果，基于总目标函数对生成器的模型参数进行更新，并进入下一轮训练。通过不断基于判别器的训练结果，对生成器的模型参数进行更新，使生成器输出的预测数据与对应的实测数据越来越接近，实现了对异质生成对抗模型的有效训练，使异质生成对抗模型最终达到对环境状况进行准确预测的目的。

在地理空间上邻近的监测站点的实测数据之间是高度相关并且相互影响的，而且这种相关性是随着时间动态变化的。比如某区域的兴趣点(points of interest，POI)分布稀疏，密度比较小，同时风速比较大。那么该区域的空气质量监测站点和天气监测站点会具有更强的相关性。

为体现这种异质空间动态相关性，更好地对空气质量和天气等环境状况进行联合预测，可选地，本实施例中，生成器的模型是基于异质站点图构建的，异质站点图中的节点代表站点，站点的类别至少包括空气质量监测站点和天气监测站点；设定距离范围内的站点之间建立边。

由于距离较近的监测站点之间具有较强的相关性，而距离较远的监测站点之间的相关性较弱，为此，示例性地，可以根据实际情况预先设置用于描述距离范围的距离阈值(如20km)，在距离(通常为两个监测站点之间的地球表面距离)小于或等于该距离阈值的监测站点之间建立边，而距离大于该距离阈值的监测站点之间不建立边，即只考虑设定距离范围内监测站点之间的相关性，而忽略设定距离范围外的监测站点之间的相关性，得到异质站点图。

示例性地，以异质站点的类别包括空气质量监测站点和天气监测站点为例，相应地，异质站点图中包括四种类型的边，分别为由空气质量监测站点到空气质量监测站点的边、由空气质量监测站点到天气监测站点的边、由天气监测站点到天气监测站点边和由天气监测站点到空气质量监测站点的边，不仅考虑同种监测站点之间的相关性，还考虑了不同监测站点之间的相关性，提高了生成器得到的预测数据的准确性和可靠性。

相关性包括时间和空间的不同层面，为强制生成器从不同的角度进行空气质量、天气等环境数据的预测，提高预测数据的可信度和准确度，本公开实施例提供的判别器可以包括以下判别器中的至少一个：

(a)空间判别器，用于输入各站点在设定时刻、生成器输出的预测数据和对应的实测数据，判别设定时刻实测数据和预测数据的空间近似度。

(b)时间判别器，用于输入设定站点在至少两个时刻、生成器输出的预测数据和对应的实测数据，判别设定站点实测数据和预测数据的时间近似度。

(c)宏观判别器，用于输入多个站点在多个时刻、生成器输出的预测数据和对应的实测数据，判别生成器的预测数据和实测数据的宏观近似度。

其中，每个判别器都设置有对应的第二目标函数，为便于区分，我们将设置于空间判别器的第二目标函数，叫做第二空间目标函数，将设置于时间判别器的第二目标函数，叫做第二时间目标函数，将设置于宏观判别器的第二目标函数，叫做第二宏观目标函数。

示例性地，以异质站点的类别包括空气质量监测站点和天气监测站点为例，图3为本公开实施例提供的一种空间判别器的原理示意图，如图3所示，空间判别器包括图神经网络、池化层和多层感知器；空间判别器的输入数据为设定时刻各个异质站点预测数据组成的预测矩阵，以及设定时刻各个异质站点实测数据组成的实测矩阵；多层感知器用于计算输入数据为实测数据的概率；

第二空间目标函数(空间判别器的第二目标函数)L_s的公式如下：

其中，D_s()为空间判别器函数；Y^t为实测矩阵；为预测矩阵；θ_s为空间判别器的待训练参数。

从空间域来看，同一时刻，具有相关性的一个监测站点会对另一个监测站点的预测数据产生影响，从而造成累积误差，设置空间判别器的目的就是希望从空间域的角度消除累积误差，从空间域上强制生成器生成的预测数据与实测数据更近接，提高生成器生成的预测数据的可靠性和可用性。

由于同一监测站点的实测数据或预测数据，通常包括多个，即每个监测站点的实测数据或预测数据实际上是一个向量，如某一监测站点为天气监测站点，其对应的实测数据或预测数据可以包括气象、温度、湿度、风速等，可以表示为[气象，温度，温度，风速……]，所以，本实施例中，通过将同一时刻所有监测站点的实测数据就构成一个实测矩阵，其中，实测矩阵中的每一行可以为一个监测站点的实测数据向量，通过将同一时刻所有站点的预测数据就构成一个预测矩阵，其中，预测矩阵中的每一行可以为一个监测站点的预测数据向量，并分别以实测矩阵和预测矩阵作为空间判别器的输入，通过图神经网络、池化层和多层感知器，基于第二空间目标函数对空间判别器的待训练参数θ_s进行训练，以使第二空间判别器的输出最大化，最终达到使生成器生成的预测数据逐渐接近实测数据，提高生成器生成的预测数据的可靠性和可用性的目的。

其中，图神经网络，可以为图卷积的黑盒，是其于上下文感知的异质图神经网络。

池化层(pool)，设置在图神经网络之后，用于对图神经网络的输出结果进行池化，得到空间判别器的隐层向量。

多层感知器(multi-layer perceptron，MLP)，也叫做人工神经网络，用于通过分类，达到计算输入数据为实测数据的概率为目的。

可以理解的是，如图3所示，在空间判别器内部，空间判别器先通过图神经网络、池化层和多层感知器分别计算实测数据和预测数据为实测数据的概率，得到D_s(Y^t；θ_s)和其中，D_s(Y^t；θ_s)表示空间判别器判别的实测数据为实测数据的概率，表示空间判别器判别的预测数据为实测数据的概率，再将D_s(Y^t；θ_s)和代入公式(2)所示的第二空间目标函数中，得到实测数据与预测数据的空间近似度L_s。

可选地，θ_s为空间判别器中图神经网络和多层感知器的待训练参数矩阵。

可选地，如图3所示，为便于区分，本实施例中，将空间判别器中产生的隐层向量分别叫做H₁(输入数据为设定时刻、各个异质站点的实测矩阵时)和(输入数据为设定时刻、各个异质站点的预测矩阵时)。

示例性地，以异质站点的类别包括空气质量监测站点和天气监测站点为例，图4为本公开实施例提供的一种时间判别器的原理示意图，如图4所示，时间判别器包括门控循环模型和多层感知器；时间判别器的输入数据为设定站点多个时刻预测数据组成的预测序列，以及设定站点多个时刻实测数据组成的实测序列；多层感知器用于计算输入数据为实测数据的概率；

第二时间目标函数(时间判别器的第二目标函数)L_t的公式如下：

其中，D_t()为时间判别器函数；y_i为实测序列；为预测序列；θ_t为所述时间判别器的待训练参数。

从时间域来看，每一个站点后一个时间步的预测数据都会受都前一个时间步的预测数据的影响，从而产生累积误差，设置时间判别器的目的就是希望从时间域的角度消除累积误差，从时间域上强制生成器生成的预测数据与实测数据更接近，提高生成器生成的预测数据的可用性和可靠性。

由于同一监测站点不同时刻的实测数据(或预测数据)各不相同，本实施例中，通过将同一监测站点的多个不同时刻的实测数据组合在一起，得到实测序列，通过将同一监测站点的多个不同时刻的预测数据组合在一起作为预测序列，并分别以实测序列和预测序列作为时间判别器的输入，通过控循环模型和多层感知器，基于第二时间目标函数对时间判别器的待训练参数θ_t进行训练，以使第二时间判别器的输出最大化，最终达到使生成器生成的预测数据逐渐接近实测数据，提高生成器生成的预测数据的可靠性和可用性的目的。

其中，门控循环模型中包括多个门控循环单元(gated recurrent unit，GRU)，门控循环单元是一种常用的门控循环神经网络，用于更好地捕捉时间序列中时间步距离较大的依赖关系，得到时间判别器的隐层向量。

多层感知器的作用与空间判别器中多层感知器的作用相同，此处不再赘述。

可选地，θ_t为时间判别器中门控循环模型和多层感知器的待训练参数矩阵。

可以理解的是，如图4所示，在时间判别器内部，时间判别器先通过门控循环模型和多层感知器分别计算实测数据和预测数据为实测数据的概率，得到D_t(y_i；θ_t)和其中，D_t(y_i；θ_t)表示时间判别器判别的实测数据为实测数据的概率，表示时间判别器判别的预测数据为实测数据的概率，再将D_t(y_i；θ_t)和/>代入公式(3)所示的第二时间目标函数中，得到实测数据与预测数据的时间近似度L_t。

可选地，如图4所示，为便于区分，本实施例中，将时间判别器中产生的隐层向量分别叫做H₂(输入数据为实测序列时)和(输入数据为预测序列时)。

示例性地，以异质站点的类别包括空气质量监测站点和天气监测站点为例，图5为本公开实施例提供的一种宏观判别器的原理示意图，如图5所示，宏观判别器包括连接层、门控循环模型和多层感知器；宏观判别器的输入数据为在多个时刻、各个异质站点预测数据组成的预测矩阵，以及在多个时刻、各个异质站点实测数据组成的实测矩阵；连接层用于将每个矩阵中各个站点的向量拼接成时刻向量；多层感知器用于计算输入数据为实测数据的概率；

第二宏观目标函数(宏观判别器的第二目标函数)L_m的公式如下：

其中，D_m()为宏观判别器函数；Y为所有站点的预测时刻向量；为所有站点的实测时刻向量；θ_m为时间判别器的待训练参数。

上述空间判别器和时间判别器均是从微观的角度(即考虑空间或时间的一方面)强制生成器去近似空气质量和天气的潜在空间和时间分布，进一步地，提出一个宏观判别器来捕捉全局的潜在分布，进行累积误差的全局修正，达到从而全局上强制生成器生成的预测数据与实测数据更接近，提高生成器生成的预测数据的可用性和可靠性。

与空间判别器或时间判别器不同的，宏观判别器的输入的多个时刻、多个监测站点的数据，由前述空间判别器的分析可知，同一时刻各个异质站点的数据构成一个矩阵，为根据对多个时刻、各个监测站点的数据实现对宏观判别器的训练，本实施例中，在宏观判别器中引入连接层，连接层用于将每个矩阵中各个站点的向量拼接成时刻向量，每个时刻向量中包括了顺序拼接的所有站点向量。再通过门控循环模型和多层感知器对时刻向量进行处理，得到计算输入数据为实测数据的概率，再基于第二宏观目标函数，判别生成器生成的预测数据与实测数据的宏观近似度。

本实施例中，对宏观判别器的待训练参数θ_m进行训练的目的是第二宏观判别器的输出最大化，最终达到使生成器生成的预测数据逐渐接近实测数据，提高生成器生成的预测数据的可靠性和可用性的目的。

其中，门控循环模型和多层感知器与时间判别器中的门控循环模型和多层感知器作用相同，此处不再赘述。

可选地，θ_m是宏观判别器中门控循环模型和多层感知器的待训练参数矩阵。

可以理解的是，如图5所示，在宏观判别器内部，先通过连接层分别对多个时刻、各个异质站点的实测数据和预测数据分别进行处理，得到实测数据的多个时刻向量和预测数据的多个时刻向量，再通过门控循环模型和多层感知器分别计算得到实测数据和预测数据为实测数据的概率D_m(Y；θ_m)和其中，D_m(Y；θ_m)表示宏观判别器判别的实测数据为实测数据的概率，/>表示宏观判别器判别的预测数据为实测数据的概率，再将D_m(Y；θ_m)和/>代入公式(4)所示的第二宏观目标函数中，得到实测数据与预测数据的宏观近似度L_m。

可选地，如图5所示，为便于区分，本实施例中，将宏观判别器中产生的隐层向量分别叫做H₃(输入数据为多个时刻、各个异质站点的实测矩阵时)和(输入数据为多个时刻、各个异质站点的预测矩阵时)。

可以理解的是，当判别器的数量大于或等于两个时，总目标函数为多个判别器的第二目标函数的加权和，与第一目标函数的累加和，用公式表示为：

其中，L为总目标函数；L_g是生成器的第一目标函数；是判别器d_i的第二目标函数；λ_i为判别器d_i的权重值；判别器d_i为空间判别器、时间判别器或宏观判别器；K为判别器的个数。

众所周知，对抗训练存在训练不稳定和模式崩溃的问题，其中生成器很容易对特定的判别器过度优化，本实例中，通过设置者多个判别器共同作用于生成器，每个判别器用于从不同的角度强制生成器生成的预测数据向实测数据靠近，并通过以多个判别器的第二目标函数的加权和，与第一目标函数的累加和作为总目标函数，使生成器在不同的时空视角都有良好的表现，提高生成的预测数据的准确性。

其中，λ_i为判别器d_i的权重值，用于控制的判别损失在整体损失中的重要性。在一种可能的实现方式中，权重值λ_i的计算公式如下：

其中，K为判别器的数量；γ_i的计算公式如下：

其中，sim()是基于欧几里得距离的函数；σ代表sigmoid函数H_i为输入实测数据时判别器d_i的的隐层向量；为输入预测数据时判别器d_i的隐层向量。

上述公式(7)可知，γ_i用于衡量H_i和之间的差异，即判别器d_i识别真识样本的难度，再通过公式(6)对γ_i进行归一化，得到判别器d_i的权重值λ_i，通过上述将上述公式(6)和(7)代入到公式(5)，实现对判别损失进行动态加权，从而使生成器重点关注具有更大改进空间的判别器，能更好地去优化判别损失，避免对判别器进行过度优化，有利于提高多对抗学习的稳定性，并有助于获得更高的预测准确率。

本公开实施例，通过获取异质站点的实测数据；其中，异质站点包括至少两类站点，每类站点用于测量获得对应类别的环境数据，作为该站点的实测数据；采用异质站点的实测数据作为训练样本，基于总目标函数对所述异质生成对抗模型进行联合训练；其中，生成器用于根据异质站点历史时刻的环境数据对未来时刻的环境数据进行预测，以输出预测数据；判别器用于输入生成器输出的预测数据和对应的实测数据，判别实测数据和预测数据的近似度；总目标函数包括所述生成器的第一目标函数和所述判别器的第二目标函数，实现了对不同类别的环境数据的联合预测，并提高了联合预测的准确率。

图6为本公开实施提供的一种异质生成对抗模型的训练装置的结构示意图，如图6所示，本实施例提供的异质生成对抗模型的训练装置包600包括：

获取模块601和处理模块602。

获取模块601，用于获取异质站点的实测数据；其中，所述异质站点包括至少两类站点，每类站点用于测量获得对应类别的环境数据，作为该站点的实测数据；

处理模块602，用于采用异质站点的实测数据作为训练样本，基于总目标函数对所述异质生成对抗模型进行联合训练；

可选地，所述判别器包括下述至少一个：

空间判别器，用于输入各站点在设定时刻、所述生成器输出的预测数据和对应的实测数据，判别设定时刻所述实测数据和预测数据的空间近似度；

时间判别器，用于输入设定站点在至少两个时刻、所述生成器输出的预测数据和对应的实测数据，判别设定站点所述实测数据和预测数据的时间近似度；

宏观判别器，用于输入多个站点在多个时刻、所述生成器输出的预测数据和对应的实测数据，判别所述生成器的预测数据和实测数据的宏观近似度；

其中，每个所述判别器设置有对应的第二目标函数。

可选地，所述总目标函数为多个判别器的第二目标函数的加权和，与所述第一目标函数的累加和。

可选地，所述总目标函数的公式如下：

其中，L为总目标函数；L_g是生成器的第一目标函数；是判别器d_i的第二目标函数；λ_i为判别器d_i的权重值；判别器d_i为空间判别器、时间判别器或宏观判别器；K为判别器的数量。

可选地，所述空间判别器包括图神经网络、池化层和多层感知器；所述空间判别器的输入数据为设定时刻各个异质站点预测数据组成的预测矩阵，以及设定时刻各个异质站点实测数据组成的实测矩阵；所述多层感知器用于计算输入数据为实测数据的概率；

所述空间判别器的第二目标函数L_s的公式如下：

其中，D_s()为空间判别器函数；Y^t为实测矩阵；为预测矩阵；θ_s为所述空间判别器的待训练参数。

可选地，所述时间判别器包括门控循环模型和多层感知器；所述时间判别器的输入数据为设定站点多个时刻预测数据组成的预测序列，以及设定站点多个时刻实测数据组成的实测序列；所述多层感知器用于计算输入数据为实测数据的概率；

所述时间判别器的第二目标函数L_t的公式如下：

可选地，所述宏观判别器包括连接层、门控循环模型和多层感知器；所述宏观判别器的输入数据为在多个时刻、各个异质站点预测数据组成的预测矩阵，以及在多个时刻、各个异质站点实测数据组成的实测矩阵；所述连接层用于将每个矩阵中各个站点的向量拼接成时刻向量；所述多层感知器用于计算输入数据为实测数据的概率；

所述宏观判别器的第二目标函数L_m的公式如下：

其中，D_m()为宏观判别器函数；Y为所有站点的预测时刻向量；为所有站点的实测时刻向量；θ_m为所述时间判别器的待训练参数。

可选地，所述权重值λ_i的计算公式如下：

其中，γ_i的计算公式如下：

其中，sim()是基于欧几里得距离的函数；σ代表sigmoid函数；H_i为输入实测数据时判别器d_i的隐层向量；为输入预测数据时判别器d_i的隐层向量。

可选地，所述生成器的模型基于异质站点图构建，所述异质站点图中的节点代表站点，所述站点的类别包括空气质量监测站点和天气监测站点；设定距离范围内的站点之间建立边。

可选地，所述处理模块602具体用于:

采用异质站点的实测数据作为训练样本，输入生成器，并基于所述总目标函数中的第一目标函数对所述生成器中的模型参数进行训练；

将所述生成器输出的预测数据和对应的实测数据，输入判别器，并基于所述总目标函数中的第二目标函数对所述判别器中的模型参数进行训练；

根据所述判别器的训练结果，基于总目标函数对所述生成器的模型参数进行更新，并进入下一轮训练。

本实施例所提供的异质生成对抗模型的训练装置可执行上述方法实施例所提供的异质生成对抗模型的训练装置，具备执行方法相应的功能模块和有益效果。本实施例的实现原理和技术效果与上述方法实施例类似，此处不再一一赘述。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图7是用来实施本公开实施例的异质生成对抗模型的训练方法的电子设备的示意性框图。如图7所示，电子设备700旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图7所示，设备700包括计算单元701，其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序，来执行各种适当的动作和处理。在RAM 703中，还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705，包括：输入单元706，例如键盘、鼠标等；输出单元707，例如各种类型的显示器、扬声器等；存储单元708，例如磁盘、光盘等；以及通信单元709，例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理。例如，在一些实施例中，异质生成对抗模型的训练方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时，可以执行上文描述的异质生成对抗模型的训练方法一个或多个步骤。可选地，在其他实施例中，计算单元701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行异质生成对抗模型的训练方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务中，存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种异质生成对抗模型的训练方法，所述异质生成对抗模型包括生成器和判别器，所述方法包括：

所述总目标函数包括所述生成器的第一目标函数和所述判别器的第二目标函数；

其中，所述判别器包括下述至少一个：

其中，每个所述判别器设置有对应的第二目标函数。

2.根据权利要求1所述的方法，其中，所述总目标函数为多个判别器的第二目标函数的加权和，与所述第一目标函数的累加和。

3.根据权利要求2所述的方法，其中，所述总目标函数的公式如下：其中，L为总目标函数；Lg是生成器的第一目标函数；Ldi是判别器di的第二目标函数；λi为判别器di的权重值；判别器di为空间判别器、时间判别器或宏观判别器；K为判别器的数量。

4.根据权利要求1-3任一所述的方法，其中：

所述空间判别器包括图神经网络、池化层和多层感知器；所述空间判别器的输入数据为设定时刻各个异质站点预测数据组成的预测矩阵，以及设定时刻各个异质站点实测数据组成的实测矩阵；所述多层感知器用于计算输入数据为实测数据的概率；

所述空间判别器的第二目标函数Ls的公式如下：其中，Ds（）为空间判别器函数；/>为实测矩阵；/>为预测矩阵；θs为所述空间判别器的待训练参数。

5.根据权利要求1-3任一所述的方法，其中：

所述时间判别器包括门控循环模型和多层感知器；所述时间判别器的输入数据为设定站点多个时刻预测数据组成的预测序列，以及设定站点多个时刻实测数据组成的实测序列；所述多层感知器用于计算输入数据为实测数据的概率；

所述时间判别器的第二目标函数Lt的公式如下：其中，Dt（）为时间判别器函数；yi为实测序列；/>为预测序列；θt为所述时间判别器的待训练参数。

6.根据权利要求1-3任一所述的方法，其中：

所述宏观判别器包括连接层、门控循环模型和多层感知器；所述宏观判别器的输入数据为在多个时刻、各个异质站点预测数据组成的预测矩阵，以及在多个时刻、各个异质站点实测数据组成的实测矩阵；所述连接层用于将每个矩阵中各个站点的向量拼接成时刻向量；所述多层感知器用于计算输入数据为实测数据的概率；

所述宏观判别器的第二目标函数Lm的公式如下：其中，Dm（）为宏观判别器函数；Y为所有站点的预测时刻向量；/>为所有站点的实测时刻向量；θm为所述时间判别器的待训练参数。

7.根据权利要求3所述的方法，其中，所述权重值λi的计算公式如下：其中，γi的计算公式如下：/>其中，sim（）是基于欧几里得距离的函数；σ代表sigmoid函数；Hi为输入实测数据时判别器di的隐层向量；/>为输入预测数据时判别器di的隐层向量。

8.根据权利要求1所述的方法，其中，所述生成器的模型基于异质站点图构建，所述异质站点图中的节点代表站点，所述站点的类别包括空气质量监测站点和天气监测站点；设定距离范围内的站点之间建立边。

9.根据权利要求1所述的方法，其中，所述采用异质站点的实测数据作为训练样本，基于总目标函数对所述异质生成对抗模型进行联合训练包括:

10.一种异质生成对抗模型的训练装置，包括：

其中，生成器用于根据异质站点历史时刻的环境数据对未来时刻的环境数据进行预测，以输出预测数据；

判别器用于输入所述生成器输出的预测数据和对应的实测数据，判别所述实测数据和预测数据的近似度；

其中，所述判别器包括下述至少一个：

其中，每个所述判别器设置有对应的第二目标函数。

11.根据权利要求10所述的装置，其中，所述总目标函数为多个判别器的第二目标函数的加权和，与所述第一目标函数的累加和。

12.根据权利要求11所述的装置，其中，所述总目标函数的公式如下：其中，L为总目标函数；Lg是生成器的第一目标函数；Ldi是判别器的第二目标函数；λi为判别器di的权重值；判别器di为空间判别器、时间判别器或宏观判别器；K为判别器的数量。

13.根据权利要求10-12任一所述的装置，其中：

14.根据权利要求10-12任一所述的装置，其中：

15.根据权利要求10-12任一所述的装置，其中：

所述宏观判别器的第二目标函数Lm的公式如下：

其中，Dm（）为宏观判别器函数；Y为所有站点的预测时刻向量；/>为所有站点的实测时刻向量；θm为所述时间判别器的待训练参数。

16.根据权利要求12所述的装置，其中，所述权重值的计算公式如下：其中，γi的计算公式如下：/>其中，sim（）是基于欧几里得距离的函数；σ代表sigmoid函数；Hi为输入实测数据时判别器di的隐层向量；为输入预测数据时判别器di的隐层向量。

17.根据权利要求10所述的装置，其中，所述生成器的模型基于异质站点图构建，所述异质站点图中的节点代表站点，所述站点的类别包括空气质量监测站点和天气监测站点；设定距离范围内的站点之间建立边。

18.根据权利要求10所述的装置，其中，所述处理模块具体用于:

19. 一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。

20.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法。