CN116227756A - 一种城市时空数据预测因果模型的评价方法 - Google Patents

一种城市时空数据预测因果模型的评价方法 Download PDF

Info

Publication number
CN116227756A
CN116227756A CN202310517345.3A CN202310517345A CN116227756A CN 116227756 A CN116227756 A CN 116227756A CN 202310517345 A CN202310517345 A CN 202310517345A CN 116227756 A CN116227756 A CN 116227756A
Authority
CN
China
Prior art keywords
causal
data
model
time
urban
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310517345.3A
Other languages
English (en)
Other versions
CN116227756B (zh
Inventor
邓攀
赵宇
闫洁
刘俊廷
汪慕澜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xicheng District Bureau Of Science Technology And Information Technology Of Beijing Municipality Beijing Xicheng District Big Data Management Bureau
Beihang University
Original Assignee
Xicheng District Bureau Of Science Technology And Information Technology Of Beijing Municipality Beijing Xicheng District Big Data Management Bureau
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xicheng District Bureau Of Science Technology And Information Technology Of Beijing Municipality Beijing Xicheng District Big Data Management Bureau, Beihang University filed Critical Xicheng District Bureau Of Science Technology And Information Technology Of Beijing Municipality Beijing Xicheng District Big Data Management Bureau
Priority to CN202310517345.3A priority Critical patent/CN116227756B/zh
Publication of CN116227756A publication Critical patent/CN116227756A/zh
Application granted granted Critical
Publication of CN116227756B publication Critical patent/CN116227756B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Remote Sensing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Primary Health Care (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于基于特定计算模型的机器学习技术领域,具体为一种城市时空数据预测因果模型的评价方法,包括构建城市时空数据预测因果模型并采用城市用电数据集进行学习,利用神经网络搭建城市时空数据预测因果模型的学习框架对城市时空数据预测因果模型进行训练,采用训练后的城市时空数据预测因果模型,使用城市用电历史数据来预测下一时间段用电数据,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能,本方法采用合理的训练、验证、预测评价比例,提高了评价效果。

Description

一种城市时空数据预测因果模型的评价方法
技术领域
本发明属于基于特定计算模型的机器学习技术领域,尤其是涉及城市复杂系统中时空数据的挖掘和预测用模型评价,具体为一种城市时空数据预测因果模型的评价方法。
背景技术
城市级复杂系统可以表示为一个复杂图网络,其中空间节点表示为城市中某个区域,节点属性表示为区域随时间演化的可观测时间序列,节点之间的连接表示区域间的相互作用或交互关系。复杂系统在宏观层面上的可观测现象由中观区域间的相互作用涌现而出。为了探索并预测城市级复杂系统内部的动力学过程,大多数方法在中观层面学习区域间隐式的图网络结构,或建立区域内复杂的注意力机制以捕获的长时期时空相关性。然而,中观层面的时空数据是基于区域间的相关性在多种因素的混合影响下产生的观测结果,易受外部环境和系统噪声的干扰,从而掩盖了区域本身的特点。受中观层面自身的局限性,大多数方法停滞于研究区域间显式的相关关系,而忽略了影响区域观测生成原理的隐式因果关系,这不利于真实场景的推广和应用。
因果关系被认为是刻画观测现象生成规则的基本公理,在机器学习的背景下,正确地建模和推断因果变量和因果机制可以诱导出更稳健的特征表示,这有助于解释观测数据的生成原理。因而,采用生成因果解释模型对城市级复杂系统进行建模并进而利用其对城市电力时空数据进行预测是一种很好的解决思路。
然而,为了能使训练后的模型对城市复杂系统的时空数据进行预测的效果进行表征,需要对构建的模型进行有效的评价。如CN111488994A公开了一种正样本学习模型评估方法及装置,包括利用待评估模型对PU测试集进行打分,获取打分结果;其中,所述打分结果为所述PU测试集中每个样本被所述待评估模型判断成正样本的条件概率;所述PU测试集包含有观察到正样本和收集到的无标签样本;根据待评估模型对PU测试集的打分结果,确定所述PU测试集的AUL值。JP2022080367A公开了一种模型评估装置、模型评估方法和用于评估使用机器学习技术生成的分析模型的性能的程序。在模型评估装置中,计算单元使用要评估的分析模型通过数据分析计算预测的准确性,提取单元计算与要评估的分析模型和通用规范相关的规范信息。其他从存储库中提取链接到信息的分析模型,并且评估单元通过数据分析在待评估的分析模型和其他分析模型之间比较预测的准确性,评估分析模型的性能。
但针对城市复杂系统进行预测的生成因果解释模型有其自身的特点,包括外生变量、时空条件父变量、受控因果转移函数和时空混合函数等构成元素,现有的模型评价方法不适用于城市时空数据预测因果模型并对其进行有效评价。
发明内容
针对现有技术的问题,本发明提供了一种城市时空数据预测因果模型的评价方法。
本发明完整的技术方案包括:
一种城市时空数据预测因果模型的评价方法,包括如下步骤:
(1)构建城市时空数据预测因果模型并采用城市用电数据集进行学习,所述城市用电数据集的每一条数据包括时间、用电量和所在区域;利用神经网络搭建城市时空数据预测因果模型的学习框架,并将可识别性条件作为神经网络的约束条件,对城市时空数据预测因果模型进行训练;
(2)采用训练后的城市时空数据预测因果模型,使用城市用电历史数据来预测下一时间段用电数据,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能,具体如下:
Figure SMS_1
其中,RMSE为均方根误差,MAE为平均绝对误差,MAPE为平均绝对百分比误差,
Figure SMS_2
表示采用训练后的城市时空数据预测因果模型预测的下一时间段用电数据,/>
Figure SMS_3
表示真实的下一时间段用电数据,N表示区域个数。
进一步的,所述城市用电数据集采用的数据源包括370个区域从2011年到2014年各区域的用电量,采样周期为15分钟。
进一步的,针对采用的数据源,以1小时的间隔分割该数据源,以获得城市用电数据集。
进一步的,将城市用电数据集中,60%的数据用于训练,20%的数据用于验证,20%的数据用于预测和评价。
进一步的,在预测时,使用过去1小时的用电历史数据来预测下一时段的用电数据。
进一步的,所述下一时段为30分钟。
进一步的,所述城市时空数据预测因果模型为生成因果解释模型;
进一步的,所述生成因果解释模型包括外生变量、时空条件父变量、受控因果转移函数和时空混合函数,所述外生变量为由外部状态决定的变量,所述时空混合函数用以从所观测的城市数据中确定因果描述子,所述因果描述子为采用神经网络进行生成因果解释模型学习过程的因果隐变量,所述时空条件父变量为在可学习因果邻接矩阵中,所有与因果描述子有直接连接的变量集合,所述受控因果转移函数用以确定因果描述子的因果传播方式;具体为:
Figure SMS_4
(1)
式中,
Figure SMS_14
表示/>
Figure SMS_10
时刻各区域的观测数据,/>
Figure SMS_19
表示/>
Figure SMS_12
时刻各区域的因果描述子集合,所述因果描述子为采用神经网络进行生成因果解释模型学习过程的因果隐变量;/>
Figure SMS_27
为时空混合函数;/>
Figure SMS_15
为/>
Figure SMS_25
中的元素,/>
Figure SMS_9
表示第i个区域内在第/>
Figure SMS_20
时刻的第/>
Figure SMS_5
个因果描述子;/>
Figure SMS_17
为受控因果转移函数,/>
Figure SMS_6
表示/>
Figure SMS_18
所对应的外生变量,/>
Figure SMS_7
为受控因果转移函数/>
Figure SMS_21
的条件参数;/>
Figure SMS_11
是在特征维度上参数无关的多层感知机函数,/>
Figure SMS_22
表示对
Figure SMS_16
具有直接因果效应的时空条件父变量;/>
Figure SMS_26
为域信息集合/>
Figure SMS_13
的元素,表示第i个区域属于第r个域,/>
Figure SMS_24
表示/>
Figure SMS_8
影响下的第i个区域内k个外生变量/>
Figure SMS_23
的分布;
进一步的,所述学习框架为Pytoch深度学习框架。包括变分自编码器、域适配器、条件生成模块(Condition Generation Module,CGM)和因果解释模块(CausalInterpretation Module,CIM),具体训练过程包括:
步骤2.1:使用变分自动编码器框架来建模因果描述子的推断过程和观测数据的生成过程。GraphGRU被用作编码器和解码器,以同时处理空间和时间维度,编码器用以拟合时空混合函数,从观测数据中利用编码器推断因果描述子的后验分布,该后验分布是一个各向同性的高斯分布,编码器输出该高斯分布的均值和方差。编码器用以逼近时空混合函数的逆函数,以重参数化的方式从后验分布中采样估计的因果描述子和时空混合函数,并使用解码器从估计的因果描述子中生成各节点的重构数据。
步骤2.2:采用域适配器来从观测数据中捕获潜在的域信息,并使用GumbelSoftmax方法来确保每个节点的观测仅属于某个域。并在域信息集合的基础上确定外生变量分布。
步骤2.3:采用条件生成模块(CGM)捕捉时空因果结构。所述条件生成模块将时空因果结构分解为区域内因果关系和区域间因果关系,并使用可学习的参数矩阵对区域内因果关系和区域间因果关系进行建模。
通过
Figure SMS_28
将时空因果结构得到的父变量转化为因果转移函数的条件参数,/>
Figure SMS_29
是在特征维度上参数无关的多层感知机函数。
步骤2.4:采用因果解释模块,因果解释模块基于因果转换函数
Figure SMS_30
对因果描述子的先验分布进行建模,本发明使用可逆的神经样条流网络来拟合因果转换函数。/>
步骤2.5:设域信息在短时间内不发生变化,因此可以从外生变量分布中采样当前区域下一时刻的外生变量,其次利用条件生成模块CGM,根据前一时刻因果描述子的时空条件父变量生成受控因果转移函数的条件参数;然后利用因果解释模块CIM,在条件参数的影响下将外生变量映射到当前区域下一时刻的因果描述子;最后利用变分自编码器中的解码器,对因果描述子进行非线性混合,生成当前区域下一时刻的时空数据。
进一步的,所述训练,所用神经网络的特征通道数设置为64,批处理大小设置为64,学习率设置为0.001,使用Adam优化器和多步学习速率衰减策略进行训练。
本发明相对于现有技术的优点在于:
(1)不同于传统关注中观区域层面的城市复杂系统建模方法,本发明从时空数据生成原理的角度,提出生成因果解释的数学模型来建模微观层面因果描述子的时空因果结构和因果机制,并模拟时空数据的生成过程。相较于传统的相关性研究,本发明可以将城市复杂系统的观测数据分解为具有物理含义的因果描述子,在稳定的因果结构影响下,可以提升模型整体的鲁棒性和适用性,使得预测结果更加符合城市复杂系统运行情况。
(2)针对训练后的城市时空数据预测因果模型的预测结果,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能,构建了历年来城市多个区域的历史用电数据构建数据集,并采用合理的训练、验证、预测评价比例,提高了评价效果。
(3)真实数据集的实验表明,本发明的评价方法能够有效对城市时空数据预测因果模型进行评价,并且因果模型GCIM成功地识别了潜在的时空因果结构和机制,并有效地预测了未来的数据。
具体实施方式
下面对本发明的技术方案进行进一步的详细说明,显然,所描述的实施例仅作为例示,并非用于限制本次申请。
本发明提供一种城市时空数据预测因果模型的评价方法,该模型为生成解释模型,采用该模型可以对城市级时空数据进行挖掘和预测,从微观因果描述子层面理解城市复杂系统中观测数据的生成原理,并从历史观测数据中学习该数学模型,以此来预测未来的时空数据。
构建城市时空数据预测因果模型,该模型为生成因果解释模型GCIM(GenerativeCausal Interpretation Model,GCIM),通过数学建模对城市复杂系统的观测生成过程进行分析,该模型中包含外生变量、时空条件父变量、受控因果转移函数、时空混合函数,具体形式如下:
Figure SMS_31
(1)/>
其中
Figure SMS_32
表示/>
Figure SMS_33
时刻各区域的观测数据,N表示复杂系统中的区域个数,D表示观测数据维度;/>
Figure SMS_34
为时空混合函数。
Figure SMS_35
表示/>
Figure SMS_36
时刻各区域的因果描述子集合,K表示区域内因果描述子个数。
Figure SMS_37
为/>
Figure SMS_38
时刻各区域的因果描述子集合/>
Figure SMS_39
中的元素,/>
Figure SMS_40
表示第i个区域内在第/>
Figure SMS_41
时刻的第/>
Figure SMS_42
个因果描述子。
Figure SMS_43
为受控因果转移函数,/>
Figure SMS_44
表示因果描述子/>
Figure SMS_45
所对应的外生变量,/>
Figure SMS_46
为受控因果转移函数的条件参数;/>
Figure SMS_47
是在特征维度上参数无关的多层感知机函数。
Figure SMS_48
表示对因果描述子/>
Figure SMS_49
具有直接因果效应的时空条件父变量。
Figure SMS_50
表示域信息集合,R表示域的数量;其中/>
Figure SMS_51
的元素/>
Figure SMS_52
表示第i个区域属于第r个域中,/>
Figure SMS_53
表示域信息/>
Figure SMS_54
影响下的第i个区域内k个外生变量/>
Figure SMS_55
的分布;
外生变量
Figure SMS_56
由复杂系统外部状态决定,通常外生变量的非平稳性是由域引起的。
Figure SMS_57
表示第i个区域内在第t时刻的第k个外生变量。外生变量的分布在每个域中是一致的,但在不同域中是不同的。因此,在给定域信息/>
Figure SMS_58
的条件下,外生变量/>
Figure SMS_59
之间相互独立。
外生变量是一种固有属性,其刻画了某个物理概念(如区域属性、天气情况),因此它对因果描述子有直接影响。外生变量的非平稳性也直接导致了因果描述子的分布具有非平稳性。
时空条件父变量
Figure SMS_60
时间和空间维度分别刻画因果结构,明确了因果传播路径,定义如下:
Figure SMS_61
其中
Figure SMS_62
为哈达玛积,/>
Figure SMS_63
表示t-1时刻区域i内部的因果描述子集合,/>
Figure SMS_64
表示同一个区域内,第k个因果描述子在前一时刻的区域内因果关系矩阵。
Figure SMS_65
是由邻接关系决定区域i的局部邻域集合,/>
Figure SMS_66
表示t-1时刻区域i局部邻域内所有因果描述子集合,/>
Figure SMS_67
表示第i个区域中第k个因果描述子在前一时刻的区域间因果关系。/>
由于不同区域的局部邻域带来的因果影响不同,因此存在N个不同的区域间因果关系矩阵。在因果充分系统中,在给定时空条件父变量的条件下,因果描述子之间相互独立,因此我们将
Figure SMS_68
视为受控因果转移函数的条件参数/>
Figure SMS_69
,控制着方程具体形式,其中/>
Figure SMS_70
是在特征维度上参数无关的多层感知机函数。
受控因果转移函数
Figure SMS_71
刻画了因果描述子的因果传播机制,其在条件父变量的影响下,将在外生变量映射到具有物理意义的因果描述子。给定条件参数/>
Figure SMS_72
,/>
Figure SMS_73
是全局共享的且稳定的,并且它的实现形式直接影响因果描述子的可识别性。
时空混合函数
Figure SMS_74
解释了因果描述子生成观测的过程,其形式全局共享且稳定,可以是任意复杂非线性但可逆的函数。
以下就以本实施方式具体涉及到的城市电力复杂系统,对上述模型进行进一步说明,针对区域属性作为系统的外生变量,可能随时间动态变化,导致非平稳的时空观测序列的问题,本发明将区域属性定义为一种域信息。针对多区域用电量时空数据预测,因果描述子是影响区域用电量不可观测的隐变量,本发明利用深度学习技术挖掘该隐变量来建模并解释城市复杂系统中用电量的生成过程。城市复杂系统中各区域用电量的因果描述子可能包括但不限于下列几种情况(人口密度、建筑密度、经济活动强度、交通状况等难以收集等数据),本发明目的是从可观测的城市中各区域用电量数据,推断出可能影响区域内用电量的因果描述子,并建立各个因果描述子之间的因果关系,进而建模并解释城市复杂系统中各区域用电量的生成规律和因果机制。
1.人口密度:人口密度是一个重要的空间特征,因为人口密度高的地区往往需要更多的电力供应,以满足人们的生活和商业需求。比如,大城市的用电量通常比农村地区的用电量高,因为城市有更多的人和商业活动。
2.建筑密度:建筑密度也是一个重要的空间特征,因为建筑密度高的地区需要更多的电力供应,以满足建筑物的照明、空调、电梯等用电需求。比如,商业区的用电量通常比住宅区的用电量高,因为商业区的建筑密度更高。
3.经济活动强度:经济活动强度也是一个影响用电量的重要因素。发达地区往往需要更多的电力供应,以满足更高的生产和消费需求。比如,一个工业化程度较高的地区的用电量可能会比一个农业化程度较高的地区的用电量更高。
4.交通状况:交通状况也可能影响用电量,因为交通状况影响了人们的出行和物流需求。比如,交通状况糟糕的城市可能需要更多的照明和信号灯,以保障交通安全,从而增加用电量。
此外,本发明将区域自身属性、天气状况和区域性聚集活动等变量作为系统之外未知的外生变量,并将各区域用电量的时间序列模式归纳为一种域信息,例如,各区域用电量的时间序列模式具有周期性、趋势性、季节性和突发性,当由于天气等外生变量发生改变时,该区域的用电量时间序列模式也会因此发生变化,同时,突发的区域性聚集活动也会导致区域用电量模式发生动态变化,因此,因果描述子的时空转移过程也受到非平稳外生变量的调节。
该评价方法包括如下步骤:
(1)通过构建的上述生成因果解释模型,采用城市用电数据集进行学习,所述城市用电数据集的每一条数据包括时间、用电量和所在区域;利用神经网络搭建城市时空数据预测因果模型的学习框架,并将可识别性条件作为神经网络的约束条件,对城市时空数据预测因果模型进行训练。
所述数据集的数据示例如表1所示:
表1城市用电数据集示例
时间 区域1用电量 区域2用电量 区域3用电量 区域4用电量
9:30 14 69 234 415
10:00 18 92 312 556
10:30 21 96 312 560
11:00 20 92 312 443
11:30 22 91 312 346
12:00 20 92 187 340
所述可识别性条件具体如下:
定义1(观测等价性):令
Figure SMS_75
是通过真实的潜在时空因果机制
Figure SMS_76
生成的可观测时空序列变量,其中/>
Figure SMS_77
在公式中给出定义,/>
Figure SMS_78
为时空混合函数、/>
Figure SMS_79
为所有因果描述子的受控因果转移函数集合、/>
Figure SMS_80
为由时空条件父变量生成的条件参数集合、/>
Figure SMS_81
为受域影响下的外生变量分布。
通过观测数据可以学习得到估计模型
Figure SMS_82
,/>
Figure SMS_83
表示从观测数据中估计的时空混合函数、/>
Figure SMS_84
表示从观测数据中估计的受控因果转移函数集合、/>
Figure SMS_85
表示从观测数据中估计的条件参数集合、/>
Figure SMS_86
表示从观测数据中估计的外生变量分布。
如果通过估计模型得到的数据分布
Figure SMS_87
真实的数据分布
Figure SMS_88
处相匹配,则称通过观测数据可以学习得到估计模型
Figure SMS_89
真实的潜在时空因果机制/>
Figure SMS_90
是观测等价的。
定义2(逐分量可识别性):在观测等价性的基础上,真实的时空混合函数
Figure SMS_91
和从观测数据中估计的时空混合函数/>
Figure SMS_92
之间可以通过置换操作/>
Figure SMS_93
和逐分量可逆转换/>
Figure SMS_94
相互变换,形式化描述如下:
Figure SMS_95
则称真实的潜在时空因果机制是逐分量可识别的,即模型
Figure SMS_96
所描述的因果描述子可以通过观测数据学习得到,使得真实的因果描述子集合/>
Figure SMS_97
和估计的因果描述子集合/>
Figure SMS_98
之间可以通过置换操作/>
Figure SMS_99
和逐分量可逆转换/>
Figure SMS_100
相互变换。
此外,如果从观测数据中估计的因果描述子可以达到逐分量可识别的程度,则潜在时空因果结构也具有可识别性,因为在因果充分系统的城市复杂系统中,因果描述子的条件独立性可以完全表征系统内时空因果结构,置换操作和逐分量可逆操作不会破坏因果描述子之间的条件独立性。
在定义1和定义2的保证下,本发明提出使生成因果解释模型GCIM具备可识别性的条件,具体定理如下:
定理1(生成因果解释模型GCIM的可识别性条件):如果生成因果解释模型GCIM的学习框架满足下述条件:
(1)时空混合函数
Figure SMS_101
可逆且处处可微,同时受控因果转移函数/>
Figure SMS_102
可逆且二次可微;
(2)外生变量分布
Figure SMS_103
的变化受域信息集合/>
Figure SMS_104
的控制,给定域信息集合/>
Figure SMS_105
,外生变量之间相互独立。
(3)对于任意的第i个区域的因果描述子集合
Figure SMS_106
,都存在/>
Figure SMS_107
个不同的域信息/>
Figure SMS_108
,使得同一区域内的因果描述子/>
Figure SMS_109
在不同域信息/>
Figure SMS_110
的影响下具有较大的差异。
则称生成因果解释模型GCIM具有可识别性,可以从观测数据中学习到真实的潜在时空因果机制和时空因果结构。
所述学习为在可识别性条件约束下搭建一种基于变分推断的生成因果解释模型GCIM学习框架,以此从观测数据中学习估计模型,推断因果描述子。
GCIM的估计框架由四个组件组成:变分自编码器、域适配器、条件生成模块(Condition GenerationModule,CGM)和因果解释模块(Causal InterpretationModule,CIM),首先,本发明建立变分自编码器结构确保时空混合函数
Figure SMS_111
的可逆性并满足条件(1),编码器从观测数据中推断因果描述子,解码器对因果描述子进行非线性混合,生成区域的时空数据;其次,为了建模受外生变量影响下的非平稳性并满足条件(2)和条件(3),本发明提出一个域适配器,其将一定时间段内的观测数据分配到对应的域,在同一个域内的外生变量分布一致,在不同域之间的外生变量分布不同;然后,为了捕获时空因果结构,本发明提出了一个条件生成模块(Condition GenerationModule,CGM),通过将区域间的邻接关系作为归纳偏置,捕捉区域内和区域间的因果关系,生成时空条件父变量,并将时空条件父变量转化为因果转移函数的条件参数,控制因果转移函数的具体形式;最后,为了满足受控因果转移函数/>
Figure SMS_112
的可逆性并满足条件(1),本发明提出一个因果解释模块(CausalInterpretation Module,CIM),通过利用可逆的神经样条流网络实现因果转移函数,并在条件参数的影响下将外生变量映射到具有物理意义的因果描述子。在应用阶段:首先从外生变量分布中采样当前区域当前时刻下的外生变量;其次利用条件生成模块CGM,根据前一时刻因果描述子的时空条件父变量生成受控因果转移函数的条件参数;然后利用因果解释模块CIM,在条件参数的影响下将外生变量映射到当前区域当前时刻下因果描述子;最后利用变分自编码器中的解码器,对因果描述子进行非线性混合,生成当前区域当前时刻下的时空数据。
具体步骤包括:
步骤(1):根据城市复杂系统内部的时空因果关系,从微观因果描述子层面上定义观测数据的生成过程,建立因果解释模型GCIM的数学原理;同时采集研究区域的多模态数据,将数据量化,构造城市多模态数据,得到各区域分时段数据,作为生成因果解释模型GCIM学习框架的输入。
步骤(2):利用神经网络,搭建生成式解释模型GCIM的学习框架,并将可识别性条件作为神经网络的约束条件,主要目的是从当前系统的观测数据中推断因果描述子,并估计潜在的时空因果结构和时空因果机制,本步骤包含如下步骤(2.1)-步骤(2.5)。
步骤2.1:为了满足条件(1)中时空混合函数
Figure SMS_113
的可逆性,使用变分自动编码器(Variational Auto Encoder,VAE)框架来建模因果描述子的推断过程和观测数据的生成过程。GraphGRU被用作编码器和解码器,以同时处理空间和时间维度,其定义如下:
Figure SMS_114
其中,
Figure SMS_116
是中间变量,无实际物理意义,/>
Figure SMS_120
表示特征拼接操作。/>
Figure SMS_122
是sigmoid的函数,/>
Figure SMS_117
表示双曲正切函数,/>
Figure SMS_119
是t时刻各个区域的观测数据,
Figure SMS_121
均是图卷积参数,/>
Figure SMS_123
是由GraphGRU输出的当前t时刻的因果描述子,/>
Figure SMS_115
是t-1时刻的因果描述子,/>
Figure SMS_118
表示图卷积操作,具体定义如下,
Figure SMS_124
其中
Figure SMS_125
表示预定义的区域间邻接关系,/>
Figure SMS_126
,/>
Figure SMS_127
是复杂系统中的区域个数。
Figure SMS_128
和/>
Figure SMS_129
为图卷积参数,/>
Figure SMS_130
为图卷积输入,/>
Figure SMS_131
为单位矩阵。
预定义邻接关系定义如下:
Figure SMS_132
其中,
Figure SMS_133
是区域/>
Figure SMS_134
和区域/>
Figure SMS_135
之间的距离,根据区域中心的纬度和经度计算,/>
Figure SMS_136
表示距离阈值,并根据实际情况设置为2公里,/>
Figure SMS_137
是距离矩阵的方差,用于控制矩阵的分布和稀疏性。
编码阶段的目的是拟合时空混合函数
Figure SMS_140
,本发明从观测数据中/>
Figure SMS_142
利用编码器推断因果描述子的后验分布/>
Figure SMS_144
,该后验分布是一个各向同性的高斯分布,编码器输出该高斯分布的均值和方差。解码阶段目的是逼近时空混合函数的逆函数/>
Figure SMS_139
,本发明以重参数化的方式从后验分布/>
Figure SMS_141
中采样估计的因果描述子/>
Figure SMS_143
,并使用解码器从估计的因果描述子/>
Figure SMS_145
中生成各节点的重构数据/>
Figure SMS_138
步骤(2.2)在大多数情况下,尽管由于域的影响,观测数据表现出非平稳性,但域信息通常是未知的。为了满足条件(2)和条件(3)的约束,本发明提出了一种域适配器来从观测数据中捕获潜在的域信息,并使用Gumbel Softmax方法来确保每个节点的观测仅属于某个域,定义如下:
Figure SMS_146
其中
Figure SMS_147
是在输入为时间窗口P的观测数据的情况下,估计的域信息集合,MLP是多层感知机,/>
Figure SMS_148
是温度变量,/>
Figure SMS_149
为从/>
Figure SMS_150
分布独立采样的随机噪声,
Figure SMS_151
表示时间窗口P内的观测数据。
根据假设(3),如果因果描述子的数量为
Figure SMS_152
,则域的数量需要为/>
Figure SMS_153
。在域信息的基础上,我们可以定义外生变量的分布,并根据条件独立性进一步分解步骤1中所定义的外生变量的分布/>
Figure SMS_154
Figure SMS_155
Figure SMS_156
其中,
Figure SMS_159
表示在t时刻估计的外生变量集合,/>
Figure SMS_162
表示在输入为时间窗口P的观测数据的情况下,估计的域信息集合,/>
Figure SMS_164
是/>
Figure SMS_158
中的元素,表示第i个区域在第t时刻的第k个估计外生变量,/>
Figure SMS_161
是/>
Figure SMS_163
中的元素,表示第i个区域估计的域信息类别是r。/>
Figure SMS_165
和/>
Figure SMS_157
表示利用MLP求得高斯分布的均值和方差,/>
Figure SMS_160
表示高斯分布。
步骤(2.3)为了充分捕捉时空因果结构,我们提出了条件生成模块(CGM)。我们将时空因果结构分解为区域内因果关系
Figure SMS_167
和区域间因果关系
Figure SMS_171
,并使用可学习的参数矩阵对它们进行建模。/>
Figure SMS_175
和/>
Figure SMS_169
,分别表示/>
Figure SMS_173
到/>
Figure SMS_177
和/>
Figure SMS_179
到/>
Figure SMS_166
具有因果连边。邻接关系/>
Figure SMS_170
作为节点间因果关系的归纳偏差,可以将参数矩阵/>
Figure SMS_174
从/>
Figure SMS_178
压缩到/>
Figure SMS_168
,其中/>
Figure SMS_172
,/>
Figure SMS_176
表示空间复杂度,这大大减少了可学习参数并提高了可识别性。
根据因果描述子的条件独立性,本发明通过
Figure SMS_180
将时空因果结构得到的父变量转化为因果转移函数的条件参数/>
Figure SMS_181
,/>
Figure SMS_182
是在特征维度上参数无关的多层感知机函数:
Figure SMS_183
步骤(2.4) 先前基于VAE的时间序列表征学习方法使用标准的多元高斯先验正则化隐变量的后验,这极大地限制了模型的表达能力。为此,本发明提出了一个因果解释模块,其目的是基于因果转换函数
Figure SMS_184
对因果描述子的先验分布/>
Figure SMS_185
进行建模。此外,本发明将条件(2)和条件(3)注入到因果描述子生成的先验规则中,并使用可逆的神经样条流网络来拟合/>
Figure SMS_186
,/>
Figure SMS_187
表示为/>
Figure SMS_188
的逆函数。
首先,使用变元定理将先验分布转换到外生变量分布,定义如下:
Figure SMS_189
其中外生变量
Figure SMS_190
和时空条件父变量/>
Figure SMS_191
是相互独立的,且/>
Figure SMS_192
和/>
Figure SMS_193
是一一对应的关系,这使得Jacobian是三角矩阵,上述公式可以进一步推导成如下形式:
Figure SMS_194
CIM解释了因果描述子的内在因果机制,并用可学习的先验分布逼近复杂系统内部真实的潜在因果机制,从而规范了因果描述子后验分布,提高了模型的可识别性。
(2)采用训练后的城市时空数据预测因果模型,使用城市用电历史数据来预测下一时间段用电数据,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能。
其中预测为基于估计的因果描述子预测系统的未来状态是生成模型的一项重要功能。本发明假设域信息在短时间内不发生变化,因此可以从外生变量分布中采样当前区域下一时刻的外生变量,其次利用条件生成模块CGM,根据前一时刻因果描述子的时空条件父变量生成受控因果转移函数的条件参数;然后利用因果解释模块CIM,在条件参数的影响下将外生变量映射到当前区域下一时刻的因果描述子;最后利用变分自编码器中的解码器,对因果描述子进行非线性混合,生成当前区域下一时刻的时空数据。
在真实世界的公开时空数据集上评估了GCIM的可识别性和预测性能,即Electricity Load Diagrams 2011-2014(Electricity)数据集,该数据集记录了某国家370个区域从2011年到2014年各区域的用电量,采样周期为15分钟。为了时间序列的稳定性,本发明将具有缺失值的区域删除,只保留了2021年到2014年各区域的用电量,并以1小时的间隔分割该数据集,以获得Electricity数据集的26304个样本和321个区域。本发明使用1小时的历史数据来预测未来30分钟的数据。60%的数据用于训练,20%用于验证,其余用于测试。
本发明在配有24G内存Nvidia GeForce RTX 3090 GPU的工作站上进行了整个实验。因果解释模型GCIM各组件的特征通道数设置为64,批处理大小也设置为64。学习率设置为0.001。使用Adam优化器和多步学习速率衰减策略。对于超参数,时间窗口的大小为6,因果描述子的数量为8,域的数量为20。Electricity数据集的空间节点的数量为321,Electricity数据集的观测数据的维度为1。
本发明使用均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)方法来评估模型性能,定义如下:
Figure SMS_195
其中,
Figure SMS_196
表示预测的结果,/>
Figure SMS_197
表示数据真实结果,N表示区域个数。
本发明将因果解释模型与目前先进的时空表示学习方法进行了比较,以验证因果解释模型的预测性能,最终的平均结果如表2所示,
表2 在Electricity数据集上本发明方法与其他方法的定量分析结果
Figure SMS_198
表2显示了总体预测性能,对于时空观测序列数据,观测的维度越高,系统内的因果关系就越复杂,MAPE可以有效地反映模型抵抗随机波动的能力。因此,本发明的GCIM始终优于基线模型。用于基于隐式关系矩阵挖掘的方法。AGCRN只使用自适应邻接关系矩阵,导致性能较差,这表明有必要使用预定义的邻接关系作为先验知识。DMSTGCN和RGSL将训练数据中的时空相关性嵌入到隐式关系矩阵中,并融合显式关系矩阵来预测观察结果,具有相似的性能。DGCRN使用输入数据动态生成隐式关系矩阵,可以更好地捕捉动态时空相关性。
最终的平均结果如表3所示,表3 在Solar-Energy数据集上本发明方法与其他方法的定量分析结果:
表3 在Solar-Energy数据集上本发明方法与其他方法的定量分析结果
Figure SMS_199
表3显示了总体预测性能,对于时空观测序列数据,观测的维度越高,系统内的因果关系就越复杂。因此,本发明的GCIM始终优于基线模型。用于基于隐式关系矩阵挖掘的方法。AGCRN只使用自适应邻接关系矩阵,导致性能较差,这表明有必要使用预定义的邻接关系作为先验知识。DMSTGCN将训练数据中的时空相关性嵌入到隐式关系矩阵中,并融合显式关系矩阵来预测观察结果,具有相似的性能。DGCRN使用输入数据动态生成隐式关系矩阵,可以更好地捕捉动态时空相关性。这表明,捕捉动态时空相关性有利于预测。得益于对系统内因果关系的精确建模,GCIM模型在每个时期表现最好,这反映了其稳定性。
以上申请的仅为本申请的一些实施方式。对于本领域的普通技术人员来说,在不脱离本申请创造构思的前提下,还可以做出若干变型和改进,这些都属于本申请的保护范围。

Claims (9)

1.一种城市时空数据预测因果模型的评价方法,其特征在于,包括如下步骤:
(1)构建城市时空数据预测因果模型并采用城市用电数据集进行学习,所述城市用电数据集的每一条数据包括时间、用电量和所在区域;利用神经网络搭建城市时空数据预测因果模型的学习框架,并将可识别性条件作为神经网络的约束条件,对城市时空数据预测因果模型进行训练;
(2)采用训练后的城市时空数据预测因果模型,使用城市用电历史数据来预测下一时间段用电数据,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能,具体如下:
Figure QLYQS_1
其中,RMSE为均方根误差,MAE为平均绝对误差,MAPE为平均绝对百分比误差,
Figure QLYQS_2
表示采用训练后的城市时空数据预测因果模型预测的下一时间段用电数据,/>
Figure QLYQS_3
表示真实的下一时间段用电数据,N表示区域个数。
2.根据权利要求1所述的一种城市时空数据预测因果模型的评价方法,其特征在于,所述城市用电数据集采用的数据源包括从2011年到2014年各区域的用电量,区域数量为370个,用电量采样周期为15分钟。
3.根据权利要求2所述的一种城市时空数据预测因果模型的评价方法,其特征在于,针对采用的数据源,以1小时的间隔分割该数据源,以获得城市用电数据集。
4.根据权利要求3所述的一种城市时空数据预测因果模型的评价方法,其特征在于,城市用电数据集中,60%的数据用于训练,20%的数据用于验证,20%的数据用于预测和评价。
5.根据权利要求4所述的一种城市时空数据预测因果模型的评价方法,其特征在于,在预测时,用过去1小时的用电历史数据来预测下一时段的用电数据。
6.根据权利要求5所述的一种城市时空数据预测因果模型的评价方法,其特征在于,所述下一时段为30分钟。
7.根据权利要求6所述的一种城市时空数据预测因果模型的评价方法,其特征在于,所述城市时空数据预测因果模型为生成因果解释模型。
8.根据权利要求7所述的一种城市时空数据预测因果模型的评价方法,其特征在于,所述学习框架为Pytorch深度学习框架。
9.根据权利要求8所述的一种城市时空数据预测因果模型的评价方法,其特征在于,训练过程中,所用神经网络的特征通道数设置为64,批处理大小设置为64,学习率设置为0.001,使用Adam优化器和多步学习速率衰减策略进行训练。
CN202310517345.3A 2023-05-10 2023-05-10 一种城市时空数据预测因果模型的评价方法 Active CN116227756B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310517345.3A CN116227756B (zh) 2023-05-10 2023-05-10 一种城市时空数据预测因果模型的评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310517345.3A CN116227756B (zh) 2023-05-10 2023-05-10 一种城市时空数据预测因果模型的评价方法

Publications (2)

Publication Number Publication Date
CN116227756A true CN116227756A (zh) 2023-06-06
CN116227756B CN116227756B (zh) 2023-07-07

Family

ID=86569995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310517345.3A Active CN116227756B (zh) 2023-05-10 2023-05-10 一种城市时空数据预测因果模型的评价方法

Country Status (1)

Country Link
CN (1) CN116227756B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120143796A1 (en) * 2010-12-03 2012-06-07 International Business Machines Corporation Group variable selection in spatiotemporal modeling
CN109492830A (zh) * 2018-12-17 2019-03-19 杭州电子科技大学 一种基于时空深度学习的移动污染源排放浓度预测方法
CN111126680A (zh) * 2019-12-11 2020-05-08 浙江大学 一种基于时间卷积神经网络的道路断面交通流量预测方法
CN115204478A (zh) * 2022-06-30 2022-10-18 北京航空航天大学 一种结合城市兴趣点和时空因果关系的公共交通流量预测方法
CN115204477A (zh) * 2022-06-30 2022-10-18 北京航空航天大学 一种上下文感知图递归网络的自行车流量预测方法
CN115691137A (zh) * 2022-11-01 2023-02-03 北京航空航天大学 一种基于因果马尔科夫模型的多模态数据预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120143796A1 (en) * 2010-12-03 2012-06-07 International Business Machines Corporation Group variable selection in spatiotemporal modeling
CN109492830A (zh) * 2018-12-17 2019-03-19 杭州电子科技大学 一种基于时空深度学习的移动污染源排放浓度预测方法
CN111126680A (zh) * 2019-12-11 2020-05-08 浙江大学 一种基于时间卷积神经网络的道路断面交通流量预测方法
CN115204478A (zh) * 2022-06-30 2022-10-18 北京航空航天大学 一种结合城市兴趣点和时空因果关系的公共交通流量预测方法
CN115204477A (zh) * 2022-06-30 2022-10-18 北京航空航天大学 一种上下文感知图递归网络的自行车流量预测方法
CN115691137A (zh) * 2022-11-01 2023-02-03 北京航空航天大学 一种基于因果马尔科夫模型的多模态数据预测方法

Also Published As

Publication number Publication date
CN116227756B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
Lei et al. A building energy consumption prediction model based on rough set theory and deep learning algorithms
Li et al. Attention-based interpretable neural network for building cooling load prediction
Amasyali et al. A review of data-driven building energy consumption prediction studies
Liu et al. A data mining-based framework for the identification of daily electricity usage patterns and anomaly detection in building electricity consumption data
Dubey et al. Study and analysis of SARIMA and LSTM in forecasting time series data
Grillone et al. A review of deterministic and data-driven methods to quantify energy efficiency savings and to predict retrofitting scenarios in buildings
Yu et al. Short term wind power prediction for regional wind farms based on spatial-temporal characteristic distribution
Ding et al. Evolutionary double attention-based long short-term memory model for building energy prediction: Case study of a green building
Jiang et al. Attention-LSTM architecture combined with Bayesian hyperparameter optimization for indoor temperature prediction
Liu et al. Short-term load forecasting of multi-energy in integrated energy system based on multivariate phase space reconstruction and support vector regression mode
Moradzadeh et al. Heating and cooling loads forecasting for residential buildings based on hybrid machine learning applications: A comprehensive review and comparative analysis
Konstantakopoulos et al. Design, benchmarking and explainability analysis of a game-theoretic framework towards energy efficiency in smart infrastructure
Li et al. A clustering-based approach for “cross-scale” load prediction on building level in HVAC systems
CN115691137B (zh) 一种基于因果马尔科夫模型的多模态数据预测方法
Du et al. A hybrid deep learning framework for predicting daily natural gas consumption
Yuan et al. Attention mechanism-based transfer learning model for day-ahead energy demand forecasting of shopping mall buildings
Zhang et al. High spatial granularity residential heating load forecast based on Dendrite net model
Sharif et al. Generation of whole building renovation scenarios using variational autoencoders
Zhang et al. Multi-quantile recurrent neural network for feeder-level probabilistic energy disaggregation considering roof-top solar energy
Seidu et al. A hybrid groundwater level prediction model using signal decomposition and optimised extreme learning machine
Wang et al. A novel wind power prediction model improved with feature enhancement and autoregressive error compensation
Yuan et al. SA–EMD–LSTM: A novel hybrid method for long-term prediction of classroom PM2. 5 concentration
CN116227756B (zh) 一种城市时空数据预测因果模型的评价方法
Wang Application of deep learning model in building energy consumption prediction
Lu Enhancing real-time nonintrusive occupancy estimation in buildings via knowledge fusion network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant