CN116227756A

CN116227756A - 一种城市时空数据预测因果模型的评价方法

Info

Publication number: CN116227756A
Application number: CN202310517345.3A
Authority: CN
Inventors: 邓攀; 赵宇; 闫洁; 刘俊廷; 汪慕澜
Original assignee: Xicheng District Bureau Of Science Technology And Information Technology Of Beijing Municipality Beijing Xicheng District Big Data Management Bureau; Beihang University
Current assignee: Xicheng District Bureau Of Science Technology And Information Technology Of Beijing Municipality Beijing Xicheng District Big Data Management Bureau; Beihang University
Priority date: 2023-05-10
Filing date: 2023-05-10
Publication date: 2023-06-06
Anticipated expiration: 2043-05-10
Also published as: CN116227756B

Abstract

本发明属于基于特定计算模型的机器学习技术领域，具体为一种城市时空数据预测因果模型的评价方法，包括构建城市时空数据预测因果模型并采用城市用电数据集进行学习，利用神经网络搭建城市时空数据预测因果模型的学习框架对城市时空数据预测因果模型进行训练，采用训练后的城市时空数据预测因果模型，使用城市用电历史数据来预测下一时间段用电数据，使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能，本方法采用合理的训练、验证、预测评价比例，提高了评价效果。

Description

一种城市时空数据预测因果模型的评价方法

技术领域

本发明属于基于特定计算模型的机器学习技术领域，尤其是涉及城市复杂系统中时空数据的挖掘和预测用模型评价，具体为一种城市时空数据预测因果模型的评价方法。

背景技术

城市级复杂系统可以表示为一个复杂图网络，其中空间节点表示为城市中某个区域，节点属性表示为区域随时间演化的可观测时间序列，节点之间的连接表示区域间的相互作用或交互关系。复杂系统在宏观层面上的可观测现象由中观区域间的相互作用涌现而出。为了探索并预测城市级复杂系统内部的动力学过程，大多数方法在中观层面学习区域间隐式的图网络结构，或建立区域内复杂的注意力机制以捕获的长时期时空相关性。然而，中观层面的时空数据是基于区域间的相关性在多种因素的混合影响下产生的观测结果，易受外部环境和系统噪声的干扰，从而掩盖了区域本身的特点。受中观层面自身的局限性，大多数方法停滞于研究区域间显式的相关关系，而忽略了影响区域观测生成原理的隐式因果关系，这不利于真实场景的推广和应用。

因果关系被认为是刻画观测现象生成规则的基本公理，在机器学习的背景下，正确地建模和推断因果变量和因果机制可以诱导出更稳健的特征表示，这有助于解释观测数据的生成原理。因而，采用生成因果解释模型对城市级复杂系统进行建模并进而利用其对城市电力时空数据进行预测是一种很好的解决思路。

然而，为了能使训练后的模型对城市复杂系统的时空数据进行预测的效果进行表征，需要对构建的模型进行有效的评价。如CN111488994A公开了一种正样本学习模型评估方法及装置，包括利用待评估模型对PU测试集进行打分，获取打分结果；其中，所述打分结果为所述PU测试集中每个样本被所述待评估模型判断成正样本的条件概率；所述PU测试集包含有观察到正样本和收集到的无标签样本；根据待评估模型对PU测试集的打分结果，确定所述PU测试集的AUL值。JP2022080367A公开了一种模型评估装置、模型评估方法和用于评估使用机器学习技术生成的分析模型的性能的程序。在模型评估装置中，计算单元使用要评估的分析模型通过数据分析计算预测的准确性，提取单元计算与要评估的分析模型和通用规范相关的规范信息。其他从存储库中提取链接到信息的分析模型，并且评估单元通过数据分析在待评估的分析模型和其他分析模型之间比较预测的准确性，评估分析模型的性能。

但针对城市复杂系统进行预测的生成因果解释模型有其自身的特点，包括外生变量、时空条件父变量、受控因果转移函数和时空混合函数等构成元素，现有的模型评价方法不适用于城市时空数据预测因果模型并对其进行有效评价。

发明内容

针对现有技术的问题，本发明提供了一种城市时空数据预测因果模型的评价方法。

本发明完整的技术方案包括：

一种城市时空数据预测因果模型的评价方法，包括如下步骤：

（1）构建城市时空数据预测因果模型并采用城市用电数据集进行学习，所述城市用电数据集的每一条数据包括时间、用电量和所在区域；利用神经网络搭建城市时空数据预测因果模型的学习框架，并将可识别性条件作为神经网络的约束条件，对城市时空数据预测因果模型进行训练；

（2）采用训练后的城市时空数据预测因果模型，使用城市用电历史数据来预测下一时间段用电数据，使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能，具体如下：

其中，RMSE为均方根误差，MAE为平均绝对误差，MAPE为平均绝对百分比误差，

表示采用训练后的城市时空数据预测因果模型预测的下一时间段用电数据，/>

表示真实的下一时间段用电数据，N表示区域个数。

进一步的，所述城市用电数据集采用的数据源包括370个区域从2011年到2014年各区域的用电量，采样周期为15分钟。

进一步的，针对采用的数据源，以1小时的间隔分割该数据源，以获得城市用电数据集。

进一步的，将城市用电数据集中，60%的数据用于训练，20%的数据用于验证，20%的数据用于预测和评价。

进一步的，在预测时，使用过去1小时的用电历史数据来预测下一时段的用电数据。

进一步的，所述下一时段为30分钟。

进一步的，所述城市时空数据预测因果模型为生成因果解释模型；

进一步的，所述生成因果解释模型包括外生变量、时空条件父变量、受控因果转移函数和时空混合函数，所述外生变量为由外部状态决定的变量，所述时空混合函数用以从所观测的城市数据中确定因果描述子，所述因果描述子为采用神经网络进行生成因果解释模型学习过程的因果隐变量，所述时空条件父变量为在可学习因果邻接矩阵中，所有与因果描述子有直接连接的变量集合，所述受控因果转移函数用以确定因果描述子的因果传播方式；具体为：

（1）

式中，

表示/>

时刻各区域的观测数据，/>

表示/>

时刻各区域的因果描述子集合，所述因果描述子为采用神经网络进行生成因果解释模型学习过程的因果隐变量；/>

为时空混合函数；/>

为/>

中的元素，/>

表示第i个区域内在第/>

时刻的第/>

个因果描述子；/>

为受控因果转移函数，/>

表示/>

所对应的外生变量，/>

为受控因果转移函数/>

的条件参数；/>

是在特征维度上参数无关的多层感知机函数，/>

表示对

具有直接因果效应的时空条件父变量；/>

为域信息集合/>

的元素，表示第i个区域属于第r个域，/>

表示/>

影响下的第i个区域内k个外生变量/>

的分布；

进一步的，所述学习框架为Pytoch深度学习框架。包括变分自编码器、域适配器、条件生成模块（Condition Generation Module，CGM）和因果解释模块（CausalInterpretation Module，CIM），具体训练过程包括：

步骤2.1：使用变分自动编码器框架来建模因果描述子的推断过程和观测数据的生成过程。GraphGRU被用作编码器和解码器，以同时处理空间和时间维度，编码器用以拟合时空混合函数，从观测数据中利用编码器推断因果描述子的后验分布，该后验分布是一个各向同性的高斯分布，编码器输出该高斯分布的均值和方差。编码器用以逼近时空混合函数的逆函数，以重参数化的方式从后验分布中采样估计的因果描述子和时空混合函数，并使用解码器从估计的因果描述子中生成各节点的重构数据。

步骤2.2：采用域适配器来从观测数据中捕获潜在的域信息，并使用GumbelSoftmax方法来确保每个节点的观测仅属于某个域。并在域信息集合的基础上确定外生变量分布。

步骤2.3：采用条件生成模块（CGM）捕捉时空因果结构。所述条件生成模块将时空因果结构分解为区域内因果关系和区域间因果关系，并使用可学习的参数矩阵对区域内因果关系和区域间因果关系进行建模。

通过

将时空因果结构得到的父变量转化为因果转移函数的条件参数，/>

是在特征维度上参数无关的多层感知机函数。

步骤2.4：采用因果解释模块，因果解释模块基于因果转换函数

对因果描述子的先验分布进行建模，本发明使用可逆的神经样条流网络来拟合因果转换函数。/>

步骤2.5：设域信息在短时间内不发生变化，因此可以从外生变量分布中采样当前区域下一时刻的外生变量，其次利用条件生成模块CGM，根据前一时刻因果描述子的时空条件父变量生成受控因果转移函数的条件参数；然后利用因果解释模块CIM，在条件参数的影响下将外生变量映射到当前区域下一时刻的因果描述子；最后利用变分自编码器中的解码器，对因果描述子进行非线性混合，生成当前区域下一时刻的时空数据。

进一步的，所述训练，所用神经网络的特征通道数设置为64，批处理大小设置为64，学习率设置为0.001，使用Adam优化器和多步学习速率衰减策略进行训练。

本发明相对于现有技术的优点在于：

（1）不同于传统关注中观区域层面的城市复杂系统建模方法，本发明从时空数据生成原理的角度，提出生成因果解释的数学模型来建模微观层面因果描述子的时空因果结构和因果机制，并模拟时空数据的生成过程。相较于传统的相关性研究，本发明可以将城市复杂系统的观测数据分解为具有物理含义的因果描述子，在稳定的因果结构影响下，可以提升模型整体的鲁棒性和适用性，使得预测结果更加符合城市复杂系统运行情况。

（2）针对训练后的城市时空数据预测因果模型的预测结果，使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能，构建了历年来城市多个区域的历史用电数据构建数据集，并采用合理的训练、验证、预测评价比例，提高了评价效果。

（3）真实数据集的实验表明，本发明的评价方法能够有效对城市时空数据预测因果模型进行评价，并且因果模型GCIM成功地识别了潜在的时空因果结构和机制，并有效地预测了未来的数据。

具体实施方式

下面对本发明的技术方案进行进一步的详细说明，显然，所描述的实施例仅作为例示，并非用于限制本次申请。

本发明提供一种城市时空数据预测因果模型的评价方法，该模型为生成解释模型，采用该模型可以对城市级时空数据进行挖掘和预测，从微观因果描述子层面理解城市复杂系统中观测数据的生成原理，并从历史观测数据中学习该数学模型，以此来预测未来的时空数据。

构建城市时空数据预测因果模型，该模型为生成因果解释模型GCIM（GenerativeCausal Interpretation Model，GCIM），通过数学建模对城市复杂系统的观测生成过程进行分析，该模型中包含外生变量、时空条件父变量、受控因果转移函数、时空混合函数，具体形式如下：

（1）/>

其中

表示/>

时刻各区域的观测数据，N表示复杂系统中的区域个数，D表示观测数据维度；/>

为时空混合函数。

表示/>

时刻各区域的因果描述子集合，K表示区域内因果描述子个数。

为/>

时刻各区域的因果描述子集合/>

中的元素，/>

表示第i个区域内在第/>

时刻的第/>

个因果描述子。

为受控因果转移函数，/>

表示因果描述子/>

所对应的外生变量，/>

为受控因果转移函数的条件参数；/>

是在特征维度上参数无关的多层感知机函数。

表示对因果描述子/>

具有直接因果效应的时空条件父变量。

表示域信息集合，R表示域的数量；其中/>

的元素/>

表示第i个区域属于第r个域中，/>

表示域信息/>

影响下的第i个区域内k个外生变量/>

的分布；

外生变量

由复杂系统外部状态决定，通常外生变量的非平稳性是由域引起的。

表示第i个区域内在第t时刻的第k个外生变量。外生变量的分布在每个域中是一致的，但在不同域中是不同的。因此，在给定域信息/>

的条件下，外生变量/>

之间相互独立。

外生变量是一种固有属性，其刻画了某个物理概念（如区域属性、天气情况），因此它对因果描述子有直接影响。外生变量的非平稳性也直接导致了因果描述子的分布具有非平稳性。

时空条件父变量

时间和空间维度分别刻画因果结构，明确了因果传播路径，定义如下：

其中

为哈达玛积，/>

表示t-1时刻区域i内部的因果描述子集合，/>

表示同一个区域内，第k个因果描述子在前一时刻的区域内因果关系矩阵。

是由邻接关系决定区域i的局部邻域集合，/>

表示t-1时刻区域i局部邻域内所有因果描述子集合，/>

表示第i个区域中第k个因果描述子在前一时刻的区域间因果关系。/>

由于不同区域的局部邻域带来的因果影响不同，因此存在N个不同的区域间因果关系矩阵。在因果充分系统中，在给定时空条件父变量的条件下，因果描述子之间相互独立，因此我们将

视为受控因果转移函数的条件参数/>

，控制着方程具体形式，其中/>

是在特征维度上参数无关的多层感知机函数。

受控因果转移函数

刻画了因果描述子的因果传播机制，其在条件父变量的影响下，将在外生变量映射到具有物理意义的因果描述子。给定条件参数/>

，/>

是全局共享的且稳定的，并且它的实现形式直接影响因果描述子的可识别性。

时空混合函数

解释了因果描述子生成观测的过程，其形式全局共享且稳定，可以是任意复杂非线性但可逆的函数。

以下就以本实施方式具体涉及到的城市电力复杂系统，对上述模型进行进一步说明，针对区域属性作为系统的外生变量，可能随时间动态变化，导致非平稳的时空观测序列的问题，本发明将区域属性定义为一种域信息。针对多区域用电量时空数据预测，因果描述子是影响区域用电量不可观测的隐变量，本发明利用深度学习技术挖掘该隐变量来建模并解释城市复杂系统中用电量的生成过程。城市复杂系统中各区域用电量的因果描述子可能包括但不限于下列几种情况（人口密度、建筑密度、经济活动强度、交通状况等难以收集等数据），本发明目的是从可观测的城市中各区域用电量数据，推断出可能影响区域内用电量的因果描述子，并建立各个因果描述子之间的因果关系，进而建模并解释城市复杂系统中各区域用电量的生成规律和因果机制。

1.人口密度：人口密度是一个重要的空间特征，因为人口密度高的地区往往需要更多的电力供应，以满足人们的生活和商业需求。比如，大城市的用电量通常比农村地区的用电量高，因为城市有更多的人和商业活动。

2.建筑密度：建筑密度也是一个重要的空间特征，因为建筑密度高的地区需要更多的电力供应，以满足建筑物的照明、空调、电梯等用电需求。比如，商业区的用电量通常比住宅区的用电量高，因为商业区的建筑密度更高。

3.经济活动强度：经济活动强度也是一个影响用电量的重要因素。发达地区往往需要更多的电力供应，以满足更高的生产和消费需求。比如，一个工业化程度较高的地区的用电量可能会比一个农业化程度较高的地区的用电量更高。

4.交通状况：交通状况也可能影响用电量，因为交通状况影响了人们的出行和物流需求。比如，交通状况糟糕的城市可能需要更多的照明和信号灯，以保障交通安全，从而增加用电量。

此外，本发明将区域自身属性、天气状况和区域性聚集活动等变量作为系统之外未知的外生变量，并将各区域用电量的时间序列模式归纳为一种域信息，例如，各区域用电量的时间序列模式具有周期性、趋势性、季节性和突发性，当由于天气等外生变量发生改变时，该区域的用电量时间序列模式也会因此发生变化，同时，突发的区域性聚集活动也会导致区域用电量模式发生动态变化，因此，因果描述子的时空转移过程也受到非平稳外生变量的调节。

该评价方法包括如下步骤：

（1）通过构建的上述生成因果解释模型，采用城市用电数据集进行学习，所述城市用电数据集的每一条数据包括时间、用电量和所在区域；利用神经网络搭建城市时空数据预测因果模型的学习框架，并将可识别性条件作为神经网络的约束条件，对城市时空数据预测因果模型进行训练。

所述数据集的数据示例如表1所示：

表1城市用电数据集示例

时间	区域1用电量	区域2用电量	区域3用电量	区域4用电量
					9:30	14	69	234	415
10:00	18	92	312	556
					10:30	21	96	312	560
11:00	20	92	312	443
					11:30	22	91	312	346
12:00	20	92	187	340

所述可识别性条件具体如下：

定义1（观测等价性）：令

是通过真实的潜在时空因果机制

生成的可观测时空序列变量，其中/>

在公式中给出定义，/>

为时空混合函数、/>

为所有因果描述子的受控因果转移函数集合、/>

为由时空条件父变量生成的条件参数集合、/>

为受域影响下的外生变量分布。

通过观测数据可以学习得到估计模型

，/>

表示从观测数据中估计的时空混合函数、/>

表示从观测数据中估计的受控因果转移函数集合、/>

表示从观测数据中估计的条件参数集合、/>

表示从观测数据中估计的外生变量分布。

如果通过估计模型得到的数据分布

真实的数据分布

处相匹配，则称通过观测数据可以学习得到估计模型

真实的潜在时空因果机制/>

是观测等价的。

定义2（逐分量可识别性）：在观测等价性的基础上，真实的时空混合函数

和从观测数据中估计的时空混合函数/>

之间可以通过置换操作/>

和逐分量可逆转换/>

相互变换，形式化描述如下：

则称真实的潜在时空因果机制是逐分量可识别的，即模型

所描述的因果描述子可以通过观测数据学习得到，使得真实的因果描述子集合/>

和估计的因果描述子集合/>

之间可以通过置换操作/>

和逐分量可逆转换/>

相互变换。

此外，如果从观测数据中估计的因果描述子可以达到逐分量可识别的程度，则潜在时空因果结构也具有可识别性，因为在因果充分系统的城市复杂系统中，因果描述子的条件独立性可以完全表征系统内时空因果结构，置换操作和逐分量可逆操作不会破坏因果描述子之间的条件独立性。

在定义1和定义2的保证下，本发明提出使生成因果解释模型GCIM具备可识别性的条件，具体定理如下：

定理1（生成因果解释模型GCIM的可识别性条件）：如果生成因果解释模型GCIM的学习框架满足下述条件：

（1）时空混合函数

可逆且处处可微，同时受控因果转移函数/>

可逆且二次可微；

（2）外生变量分布

的变化受域信息集合/>

的控制，给定域信息集合/>

，外生变量之间相互独立。

（3）对于任意的第i个区域的因果描述子集合

，都存在/>

个不同的域信息/>

，使得同一区域内的因果描述子/>

在不同域信息/>

的影响下具有较大的差异。

则称生成因果解释模型GCIM具有可识别性，可以从观测数据中学习到真实的潜在时空因果机制和时空因果结构。

所述学习为在可识别性条件约束下搭建一种基于变分推断的生成因果解释模型GCIM学习框架，以此从观测数据中学习估计模型，推断因果描述子。

GCIM的估计框架由四个组件组成：变分自编码器、域适配器、条件生成模块（Condition GenerationModule，CGM）和因果解释模块（Causal InterpretationModule，CIM），首先，本发明建立变分自编码器结构确保时空混合函数

的可逆性并满足条件（1），编码器从观测数据中推断因果描述子，解码器对因果描述子进行非线性混合，生成区域的时空数据；其次，为了建模受外生变量影响下的非平稳性并满足条件（2）和条件（3），本发明提出一个域适配器，其将一定时间段内的观测数据分配到对应的域，在同一个域内的外生变量分布一致，在不同域之间的外生变量分布不同；然后，为了捕获时空因果结构，本发明提出了一个条件生成模块（Condition GenerationModule，CGM），通过将区域间的邻接关系作为归纳偏置，捕捉区域内和区域间的因果关系，生成时空条件父变量，并将时空条件父变量转化为因果转移函数的条件参数，控制因果转移函数的具体形式；最后，为了满足受控因果转移函数/>

的可逆性并满足条件（1），本发明提出一个因果解释模块（CausalInterpretation Module，CIM），通过利用可逆的神经样条流网络实现因果转移函数，并在条件参数的影响下将外生变量映射到具有物理意义的因果描述子。在应用阶段：首先从外生变量分布中采样当前区域当前时刻下的外生变量；其次利用条件生成模块CGM，根据前一时刻因果描述子的时空条件父变量生成受控因果转移函数的条件参数；然后利用因果解释模块CIM，在条件参数的影响下将外生变量映射到当前区域当前时刻下因果描述子；最后利用变分自编码器中的解码器，对因果描述子进行非线性混合，生成当前区域当前时刻下的时空数据。

具体步骤包括：

步骤（1）：根据城市复杂系统内部的时空因果关系，从微观因果描述子层面上定义观测数据的生成过程，建立因果解释模型GCIM的数学原理；同时采集研究区域的多模态数据，将数据量化，构造城市多模态数据，得到各区域分时段数据，作为生成因果解释模型GCIM学习框架的输入。

步骤（2）：利用神经网络，搭建生成式解释模型GCIM的学习框架，并将可识别性条件作为神经网络的约束条件，主要目的是从当前系统的观测数据中推断因果描述子，并估计潜在的时空因果结构和时空因果机制，本步骤包含如下步骤（2.1）-步骤（2.5）。

步骤2.1：为了满足条件（1）中时空混合函数

的可逆性，使用变分自动编码器（Variational Auto Encoder，VAE）框架来建模因果描述子的推断过程和观测数据的生成过程。GraphGRU被用作编码器和解码器，以同时处理空间和时间维度，其定义如下：

其中，

是中间变量，无实际物理意义，/>

表示特征拼接操作。/>

是sigmoid的函数，/>

表示双曲正切函数，/>

是t时刻各个区域的观测数据，

均是图卷积参数，/>

是由GraphGRU输出的当前t时刻的因果描述子，/>

是t-1时刻的因果描述子，/>

表示图卷积操作，具体定义如下，

其中

表示预定义的区域间邻接关系，/>

，/>

是复杂系统中的区域个数。

和/>

为图卷积参数，/>

为图卷积输入，/>

为单位矩阵。

预定义邻接关系定义如下：

其中，

是区域/>

和区域/>

之间的距离，根据区域中心的纬度和经度计算，/>

表示距离阈值，并根据实际情况设置为2公里，/>

是距离矩阵的方差，用于控制矩阵的分布和稀疏性。

编码阶段的目的是拟合时空混合函数

，本发明从观测数据中/>

利用编码器推断因果描述子的后验分布/>

，该后验分布是一个各向同性的高斯分布，编码器输出该高斯分布的均值和方差。解码阶段目的是逼近时空混合函数的逆函数/>

，本发明以重参数化的方式从后验分布/>

中采样估计的因果描述子/>

，并使用解码器从估计的因果描述子/>

中生成各节点的重构数据/>

。

步骤（2.2）在大多数情况下，尽管由于域的影响，观测数据表现出非平稳性，但域信息通常是未知的。为了满足条件（2）和条件（3）的约束，本发明提出了一种域适配器来从观测数据中捕获潜在的域信息，并使用Gumbel Softmax方法来确保每个节点的观测仅属于某个域，定义如下：

其中

是在输入为时间窗口P的观测数据的情况下，估计的域信息集合，MLP是多层感知机，/>

是温度变量，/>

为从/>

分布独立采样的随机噪声，

表示时间窗口P内的观测数据。

根据假设（3），如果因果描述子的数量为

，则域的数量需要为/>

。在域信息的基础上，我们可以定义外生变量的分布，并根据条件独立性进一步分解步骤1中所定义的外生变量的分布/>

：

其中,

表示在t时刻估计的外生变量集合，/>

表示在输入为时间窗口P的观测数据的情况下，估计的域信息集合，/>

是/>

中的元素，表示第i个区域在第t时刻的第k个估计外生变量，/>

是/>

中的元素，表示第i个区域估计的域信息类别是r。/>

和/>

表示利用MLP求得高斯分布的均值和方差，/>

表示高斯分布。

步骤（2.3）为了充分捕捉时空因果结构，我们提出了条件生成模块（CGM）。我们将时空因果结构分解为区域内因果关系

和区域间因果关系

，并使用可学习的参数矩阵对它们进行建模。/>

和/>

，分别表示/>

到/>

和/>

到/>

具有因果连边。邻接关系/>

作为节点间因果关系的归纳偏差，可以将参数矩阵/>

从/>

压缩到/>

，其中/>

，/>

表示空间复杂度，这大大减少了可学习参数并提高了可识别性。

根据因果描述子的条件独立性，本发明通过

将时空因果结构得到的父变量转化为因果转移函数的条件参数/>

，/>

是在特征维度上参数无关的多层感知机函数：

步骤（2.4）先前基于VAE的时间序列表征学习方法使用标准的多元高斯先验正则化隐变量的后验，这极大地限制了模型的表达能力。为此，本发明提出了一个因果解释模块，其目的是基于因果转换函数

对因果描述子的先验分布/>

进行建模。此外，本发明将条件（2）和条件（3）注入到因果描述子生成的先验规则中，并使用可逆的神经样条流网络来拟合/>

，/>

表示为/>

的逆函数。

首先，使用变元定理将先验分布转换到外生变量分布，定义如下：

其中外生变量

和时空条件父变量/>

是相互独立的，且/>

和/>

是一一对应的关系，这使得Jacobian是三角矩阵，上述公式可以进一步推导成如下形式：

CIM解释了因果描述子的内在因果机制，并用可学习的先验分布逼近复杂系统内部真实的潜在因果机制，从而规范了因果描述子后验分布，提高了模型的可识别性。

（2）采用训练后的城市时空数据预测因果模型，使用城市用电历史数据来预测下一时间段用电数据，使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能。

其中预测为基于估计的因果描述子预测系统的未来状态是生成模型的一项重要功能。本发明假设域信息在短时间内不发生变化，因此可以从外生变量分布中采样当前区域下一时刻的外生变量，其次利用条件生成模块CGM，根据前一时刻因果描述子的时空条件父变量生成受控因果转移函数的条件参数；然后利用因果解释模块CIM，在条件参数的影响下将外生变量映射到当前区域下一时刻的因果描述子；最后利用变分自编码器中的解码器，对因果描述子进行非线性混合，生成当前区域下一时刻的时空数据。

在真实世界的公开时空数据集上评估了GCIM的可识别性和预测性能，即Electricity Load Diagrams 2011-2014（Electricity）数据集，该数据集记录了某国家370个区域从2011年到2014年各区域的用电量，采样周期为15分钟。为了时间序列的稳定性，本发明将具有缺失值的区域删除，只保留了2021年到2014年各区域的用电量，并以1小时的间隔分割该数据集，以获得Electricity数据集的26304个样本和321个区域。本发明使用1小时的历史数据来预测未来30分钟的数据。60%的数据用于训练，20%用于验证，其余用于测试。

本发明在配有24G内存Nvidia GeForce RTX 3090 GPU的工作站上进行了整个实验。因果解释模型GCIM各组件的特征通道数设置为64，批处理大小也设置为64。学习率设置为0.001。使用Adam优化器和多步学习速率衰减策略。对于超参数，时间窗口的大小为6，因果描述子的数量为8，域的数量为20。Electricity数据集的空间节点的数量为321，Electricity数据集的观测数据的维度为1。

本发明使用均方根误差（RMSE）、平均绝对误差（MAE）和平均绝对百分比误差（MAPE）方法来评估模型性能，定义如下：

其中，

表示预测的结果，/>

表示数据真实结果，N表示区域个数。

本发明将因果解释模型与目前先进的时空表示学习方法进行了比较，以验证因果解释模型的预测性能，最终的平均结果如表2所示，

表2 在Electricity数据集上本发明方法与其他方法的定量分析结果

表2显示了总体预测性能，对于时空观测序列数据，观测的维度越高，系统内的因果关系就越复杂，MAPE可以有效地反映模型抵抗随机波动的能力。因此，本发明的GCIM始终优于基线模型。用于基于隐式关系矩阵挖掘的方法。AGCRN只使用自适应邻接关系矩阵，导致性能较差，这表明有必要使用预定义的邻接关系作为先验知识。DMSTGCN和RGSL将训练数据中的时空相关性嵌入到隐式关系矩阵中，并融合显式关系矩阵来预测观察结果，具有相似的性能。DGCRN使用输入数据动态生成隐式关系矩阵，可以更好地捕捉动态时空相关性。

最终的平均结果如表3所示，表3 在Solar-Energy数据集上本发明方法与其他方法的定量分析结果：

表3 在Solar-Energy数据集上本发明方法与其他方法的定量分析结果

表3显示了总体预测性能，对于时空观测序列数据，观测的维度越高，系统内的因果关系就越复杂。因此，本发明的GCIM始终优于基线模型。用于基于隐式关系矩阵挖掘的方法。AGCRN只使用自适应邻接关系矩阵，导致性能较差，这表明有必要使用预定义的邻接关系作为先验知识。DMSTGCN将训练数据中的时空相关性嵌入到隐式关系矩阵中，并融合显式关系矩阵来预测观察结果，具有相似的性能。DGCRN使用输入数据动态生成隐式关系矩阵，可以更好地捕捉动态时空相关性。这表明，捕捉动态时空相关性有利于预测。得益于对系统内因果关系的精确建模，GCIM模型在每个时期表现最好，这反映了其稳定性。

以上申请的仅为本申请的一些实施方式。对于本领域的普通技术人员来说，在不脱离本申请创造构思的前提下，还可以做出若干变型和改进，这些都属于本申请的保护范围。

Claims

1.一种城市时空数据预测因果模型的评价方法，其特征在于，包括如下步骤：

表示真实的下一时间段用电数据，N表示区域个数。

2.根据权利要求1所述的一种城市时空数据预测因果模型的评价方法，其特征在于，所述城市用电数据集采用的数据源包括从2011年到2014年各区域的用电量，区域数量为370个，用电量采样周期为15分钟。

3.根据权利要求2所述的一种城市时空数据预测因果模型的评价方法，其特征在于，针对采用的数据源，以1小时的间隔分割该数据源，以获得城市用电数据集。

4.根据权利要求3所述的一种城市时空数据预测因果模型的评价方法，其特征在于，城市用电数据集中，60%的数据用于训练，20%的数据用于验证，20%的数据用于预测和评价。

5.根据权利要求4所述的一种城市时空数据预测因果模型的评价方法，其特征在于，在预测时，用过去1小时的用电历史数据来预测下一时段的用电数据。

6.根据权利要求5所述的一种城市时空数据预测因果模型的评价方法，其特征在于，所述下一时段为30分钟。

7.根据权利要求6所述的一种城市时空数据预测因果模型的评价方法，其特征在于，所述城市时空数据预测因果模型为生成因果解释模型。

8.根据权利要求7所述的一种城市时空数据预测因果模型的评价方法，其特征在于，所述学习框架为Pytorch深度学习框架。

9.根据权利要求8所述的一种城市时空数据预测因果模型的评价方法，其特征在于，训练过程中，所用神经网络的特征通道数设置为64，批处理大小设置为64，学习率设置为0.001，使用Adam优化器和多步学习速率衰减策略进行训练。