CN116227756A - 一种城市时空数据预测因果模型的评价方法 - Google Patents
一种城市时空数据预测因果模型的评价方法 Download PDFInfo
- Publication number
- CN116227756A CN116227756A CN202310517345.3A CN202310517345A CN116227756A CN 116227756 A CN116227756 A CN 116227756A CN 202310517345 A CN202310517345 A CN 202310517345A CN 116227756 A CN116227756 A CN 116227756A
- Authority
- CN
- China
- Prior art keywords
- causal
- data
- model
- time
- urban
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001364 causal effect Effects 0.000 title claims abstract description 209
- 238000011156 evaluation Methods 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 claims description 51
- 230000005611 electricity Effects 0.000 claims description 50
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims description 2
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims 1
- 238000010801 machine learning Methods 0.000 abstract description 4
- 238000004364 calculation method Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 46
- 238000009826 distribution Methods 0.000 description 33
- 238000012546 transfer Methods 0.000 description 24
- 239000011159 matrix material Substances 0.000 description 19
- 230000008569 process Effects 0.000 description 16
- 230000000694 effects Effects 0.000 description 13
- 230000007246 mechanism Effects 0.000 description 11
- 239000004973 liquid crystal related substance Substances 0.000 description 8
- 230000002441 reversible effect Effects 0.000 description 8
- 238000012360 testing method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000005065 mining Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 238000004445 quantitative analysis Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 101100356573 Homo sapiens RGSL1 gene Proteins 0.000 description 1
- 241000801118 Lepidium Species 0.000 description 1
- 102100030813 Regulator of G-protein signaling protein-like Human genes 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Computational Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Marketing (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Remote Sensing (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Primary Health Care (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Algebra (AREA)
- Operations Research (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于基于特定计算模型的机器学习技术领域,具体为一种城市时空数据预测因果模型的评价方法,包括构建城市时空数据预测因果模型并采用城市用电数据集进行学习,利用神经网络搭建城市时空数据预测因果模型的学习框架对城市时空数据预测因果模型进行训练,采用训练后的城市时空数据预测因果模型,使用城市用电历史数据来预测下一时间段用电数据,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能,本方法采用合理的训练、验证、预测评价比例,提高了评价效果。
Description
技术领域
本发明属于基于特定计算模型的机器学习技术领域,尤其是涉及城市复杂系统中时空数据的挖掘和预测用模型评价,具体为一种城市时空数据预测因果模型的评价方法。
背景技术
城市级复杂系统可以表示为一个复杂图网络,其中空间节点表示为城市中某个区域,节点属性表示为区域随时间演化的可观测时间序列,节点之间的连接表示区域间的相互作用或交互关系。复杂系统在宏观层面上的可观测现象由中观区域间的相互作用涌现而出。为了探索并预测城市级复杂系统内部的动力学过程,大多数方法在中观层面学习区域间隐式的图网络结构,或建立区域内复杂的注意力机制以捕获的长时期时空相关性。然而,中观层面的时空数据是基于区域间的相关性在多种因素的混合影响下产生的观测结果,易受外部环境和系统噪声的干扰,从而掩盖了区域本身的特点。受中观层面自身的局限性,大多数方法停滞于研究区域间显式的相关关系,而忽略了影响区域观测生成原理的隐式因果关系,这不利于真实场景的推广和应用。
因果关系被认为是刻画观测现象生成规则的基本公理,在机器学习的背景下,正确地建模和推断因果变量和因果机制可以诱导出更稳健的特征表示,这有助于解释观测数据的生成原理。因而,采用生成因果解释模型对城市级复杂系统进行建模并进而利用其对城市电力时空数据进行预测是一种很好的解决思路。
然而,为了能使训练后的模型对城市复杂系统的时空数据进行预测的效果进行表征,需要对构建的模型进行有效的评价。如CN111488994A公开了一种正样本学习模型评估方法及装置,包括利用待评估模型对PU测试集进行打分,获取打分结果;其中,所述打分结果为所述PU测试集中每个样本被所述待评估模型判断成正样本的条件概率;所述PU测试集包含有观察到正样本和收集到的无标签样本;根据待评估模型对PU测试集的打分结果,确定所述PU测试集的AUL值。JP2022080367A公开了一种模型评估装置、模型评估方法和用于评估使用机器学习技术生成的分析模型的性能的程序。在模型评估装置中,计算单元使用要评估的分析模型通过数据分析计算预测的准确性,提取单元计算与要评估的分析模型和通用规范相关的规范信息。其他从存储库中提取链接到信息的分析模型,并且评估单元通过数据分析在待评估的分析模型和其他分析模型之间比较预测的准确性,评估分析模型的性能。
但针对城市复杂系统进行预测的生成因果解释模型有其自身的特点,包括外生变量、时空条件父变量、受控因果转移函数和时空混合函数等构成元素,现有的模型评价方法不适用于城市时空数据预测因果模型并对其进行有效评价。
发明内容
针对现有技术的问题,本发明提供了一种城市时空数据预测因果模型的评价方法。
本发明完整的技术方案包括:
一种城市时空数据预测因果模型的评价方法,包括如下步骤:
(1)构建城市时空数据预测因果模型并采用城市用电数据集进行学习,所述城市用电数据集的每一条数据包括时间、用电量和所在区域;利用神经网络搭建城市时空数据预测因果模型的学习框架,并将可识别性条件作为神经网络的约束条件,对城市时空数据预测因果模型进行训练;
(2)采用训练后的城市时空数据预测因果模型,使用城市用电历史数据来预测下一时间段用电数据,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能,具体如下:
进一步的,所述城市用电数据集采用的数据源包括370个区域从2011年到2014年各区域的用电量,采样周期为15分钟。
进一步的,针对采用的数据源,以1小时的间隔分割该数据源,以获得城市用电数据集。
进一步的,将城市用电数据集中,60%的数据用于训练,20%的数据用于验证,20%的数据用于预测和评价。
进一步的,在预测时,使用过去1小时的用电历史数据来预测下一时段的用电数据。
进一步的,所述下一时段为30分钟。
进一步的,所述城市时空数据预测因果模型为生成因果解释模型;
进一步的,所述生成因果解释模型包括外生变量、时空条件父变量、受控因果转移函数和时空混合函数,所述外生变量为由外部状态决定的变量,所述时空混合函数用以从所观测的城市数据中确定因果描述子,所述因果描述子为采用神经网络进行生成因果解释模型学习过程的因果隐变量,所述时空条件父变量为在可学习因果邻接矩阵中,所有与因果描述子有直接连接的变量集合,所述受控因果转移函数用以确定因果描述子的因果传播方式;具体为:
式中,表示/>时刻各区域的观测数据,/>表示/>时刻各区域的因果描述子集合,所述因果描述子为采用神经网络进行生成因果解释模型学习过程的因果隐变量;/>为时空混合函数;/>为/>中的元素,/>表示第i个区域内在第/>时刻的第/>个因果描述子;/>为受控因果转移函数,/>表示/>所对应的外生变量,/>为受控因果转移函数/>的条件参数;/>是在特征维度上参数无关的多层感知机函数,/>表示对具有直接因果效应的时空条件父变量;/>为域信息集合/>的元素,表示第i个区域属于第r个域,/>表示/>影响下的第i个区域内k个外生变量/>的分布;
进一步的,所述学习框架为Pytoch深度学习框架。包括变分自编码器、域适配器、条件生成模块(Condition Generation Module,CGM)和因果解释模块(CausalInterpretation Module,CIM),具体训练过程包括:
步骤2.1:使用变分自动编码器框架来建模因果描述子的推断过程和观测数据的生成过程。GraphGRU被用作编码器和解码器,以同时处理空间和时间维度,编码器用以拟合时空混合函数,从观测数据中利用编码器推断因果描述子的后验分布,该后验分布是一个各向同性的高斯分布,编码器输出该高斯分布的均值和方差。编码器用以逼近时空混合函数的逆函数,以重参数化的方式从后验分布中采样估计的因果描述子和时空混合函数,并使用解码器从估计的因果描述子中生成各节点的重构数据。
步骤2.2:采用域适配器来从观测数据中捕获潜在的域信息,并使用GumbelSoftmax方法来确保每个节点的观测仅属于某个域。并在域信息集合的基础上确定外生变量分布。
步骤2.3:采用条件生成模块(CGM)捕捉时空因果结构。所述条件生成模块将时空因果结构分解为区域内因果关系和区域间因果关系,并使用可学习的参数矩阵对区域内因果关系和区域间因果关系进行建模。
步骤2.5:设域信息在短时间内不发生变化,因此可以从外生变量分布中采样当前区域下一时刻的外生变量,其次利用条件生成模块CGM,根据前一时刻因果描述子的时空条件父变量生成受控因果转移函数的条件参数;然后利用因果解释模块CIM,在条件参数的影响下将外生变量映射到当前区域下一时刻的因果描述子;最后利用变分自编码器中的解码器,对因果描述子进行非线性混合,生成当前区域下一时刻的时空数据。
进一步的,所述训练,所用神经网络的特征通道数设置为64,批处理大小设置为64,学习率设置为0.001,使用Adam优化器和多步学习速率衰减策略进行训练。
本发明相对于现有技术的优点在于:
(1)不同于传统关注中观区域层面的城市复杂系统建模方法,本发明从时空数据生成原理的角度,提出生成因果解释的数学模型来建模微观层面因果描述子的时空因果结构和因果机制,并模拟时空数据的生成过程。相较于传统的相关性研究,本发明可以将城市复杂系统的观测数据分解为具有物理含义的因果描述子,在稳定的因果结构影响下,可以提升模型整体的鲁棒性和适用性,使得预测结果更加符合城市复杂系统运行情况。
(2)针对训练后的城市时空数据预测因果模型的预测结果,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能,构建了历年来城市多个区域的历史用电数据构建数据集,并采用合理的训练、验证、预测评价比例,提高了评价效果。
(3)真实数据集的实验表明,本发明的评价方法能够有效对城市时空数据预测因果模型进行评价,并且因果模型GCIM成功地识别了潜在的时空因果结构和机制,并有效地预测了未来的数据。
具体实施方式
下面对本发明的技术方案进行进一步的详细说明,显然,所描述的实施例仅作为例示,并非用于限制本次申请。
本发明提供一种城市时空数据预测因果模型的评价方法,该模型为生成解释模型,采用该模型可以对城市级时空数据进行挖掘和预测,从微观因果描述子层面理解城市复杂系统中观测数据的生成原理,并从历史观测数据中学习该数学模型,以此来预测未来的时空数据。
构建城市时空数据预测因果模型,该模型为生成因果解释模型GCIM(GenerativeCausal Interpretation Model,GCIM),通过数学建模对城市复杂系统的观测生成过程进行分析,该模型中包含外生变量、时空条件父变量、受控因果转移函数、时空混合函数,具体形式如下:
外生变量由复杂系统外部状态决定,通常外生变量的非平稳性是由域引起的。表示第i个区域内在第t时刻的第k个外生变量。外生变量的分布在每个域中是一致的,但在不同域中是不同的。因此,在给定域信息/>的条件下,外生变量/>之间相互独立。
外生变量是一种固有属性,其刻画了某个物理概念(如区域属性、天气情况),因此它对因果描述子有直接影响。外生变量的非平稳性也直接导致了因果描述子的分布具有非平稳性。
由于不同区域的局部邻域带来的因果影响不同,因此存在N个不同的区域间因果关系矩阵。在因果充分系统中,在给定时空条件父变量的条件下,因果描述子之间相互独立,因此我们将视为受控因果转移函数的条件参数/>,控制着方程具体形式,其中/>是在特征维度上参数无关的多层感知机函数。
受控因果转移函数刻画了因果描述子的因果传播机制,其在条件父变量的影响下,将在外生变量映射到具有物理意义的因果描述子。给定条件参数/>,/>是全局共享的且稳定的,并且它的实现形式直接影响因果描述子的可识别性。
以下就以本实施方式具体涉及到的城市电力复杂系统,对上述模型进行进一步说明,针对区域属性作为系统的外生变量,可能随时间动态变化,导致非平稳的时空观测序列的问题,本发明将区域属性定义为一种域信息。针对多区域用电量时空数据预测,因果描述子是影响区域用电量不可观测的隐变量,本发明利用深度学习技术挖掘该隐变量来建模并解释城市复杂系统中用电量的生成过程。城市复杂系统中各区域用电量的因果描述子可能包括但不限于下列几种情况(人口密度、建筑密度、经济活动强度、交通状况等难以收集等数据),本发明目的是从可观测的城市中各区域用电量数据,推断出可能影响区域内用电量的因果描述子,并建立各个因果描述子之间的因果关系,进而建模并解释城市复杂系统中各区域用电量的生成规律和因果机制。
1.人口密度:人口密度是一个重要的空间特征,因为人口密度高的地区往往需要更多的电力供应,以满足人们的生活和商业需求。比如,大城市的用电量通常比农村地区的用电量高,因为城市有更多的人和商业活动。
2.建筑密度:建筑密度也是一个重要的空间特征,因为建筑密度高的地区需要更多的电力供应,以满足建筑物的照明、空调、电梯等用电需求。比如,商业区的用电量通常比住宅区的用电量高,因为商业区的建筑密度更高。
3.经济活动强度:经济活动强度也是一个影响用电量的重要因素。发达地区往往需要更多的电力供应,以满足更高的生产和消费需求。比如,一个工业化程度较高的地区的用电量可能会比一个农业化程度较高的地区的用电量更高。
4.交通状况:交通状况也可能影响用电量,因为交通状况影响了人们的出行和物流需求。比如,交通状况糟糕的城市可能需要更多的照明和信号灯,以保障交通安全,从而增加用电量。
此外,本发明将区域自身属性、天气状况和区域性聚集活动等变量作为系统之外未知的外生变量,并将各区域用电量的时间序列模式归纳为一种域信息,例如,各区域用电量的时间序列模式具有周期性、趋势性、季节性和突发性,当由于天气等外生变量发生改变时,该区域的用电量时间序列模式也会因此发生变化,同时,突发的区域性聚集活动也会导致区域用电量模式发生动态变化,因此,因果描述子的时空转移过程也受到非平稳外生变量的调节。
该评价方法包括如下步骤:
(1)通过构建的上述生成因果解释模型,采用城市用电数据集进行学习,所述城市用电数据集的每一条数据包括时间、用电量和所在区域;利用神经网络搭建城市时空数据预测因果模型的学习框架,并将可识别性条件作为神经网络的约束条件,对城市时空数据预测因果模型进行训练。
所述数据集的数据示例如表1所示:
表1城市用电数据集示例
时间 | 区域1用电量 | 区域2用电量 | 区域3用电量 | 区域4用电量 |
9:30 | 14 | 69 | 234 | 415 |
10:00 | 18 | 92 | 312 | 556 |
10:30 | 21 | 96 | 312 | 560 |
11:00 | 20 | 92 | 312 | 443 |
11:30 | 22 | 91 | 312 | 346 |
12:00 | 20 | 92 | 187 | 340 |
所述可识别性条件具体如下:
定义1(观测等价性):令是通过真实的潜在时空因果机制生成的可观测时空序列变量,其中/>在公式中给出定义,/>为时空混合函数、/>为所有因果描述子的受控因果转移函数集合、/>为由时空条件父变量生成的条件参数集合、/>为受域影响下的外生变量分布。
通过观测数据可以学习得到估计模型,/>表示从观测数据中估计的时空混合函数、/>表示从观测数据中估计的受控因果转移函数集合、/>表示从观测数据中估计的条件参数集合、/>表示从观测数据中估计的外生变量分布。
则称真实的潜在时空因果机制是逐分量可识别的,即模型所描述的因果描述子可以通过观测数据学习得到,使得真实的因果描述子集合/>和估计的因果描述子集合/>之间可以通过置换操作/>和逐分量可逆转换/>相互变换。
此外,如果从观测数据中估计的因果描述子可以达到逐分量可识别的程度,则潜在时空因果结构也具有可识别性,因为在因果充分系统的城市复杂系统中,因果描述子的条件独立性可以完全表征系统内时空因果结构,置换操作和逐分量可逆操作不会破坏因果描述子之间的条件独立性。
在定义1和定义2的保证下,本发明提出使生成因果解释模型GCIM具备可识别性的条件,具体定理如下:
定理1(生成因果解释模型GCIM的可识别性条件):如果生成因果解释模型GCIM的学习框架满足下述条件:
则称生成因果解释模型GCIM具有可识别性,可以从观测数据中学习到真实的潜在时空因果机制和时空因果结构。
所述学习为在可识别性条件约束下搭建一种基于变分推断的生成因果解释模型GCIM学习框架,以此从观测数据中学习估计模型,推断因果描述子。
GCIM的估计框架由四个组件组成:变分自编码器、域适配器、条件生成模块(Condition GenerationModule,CGM)和因果解释模块(Causal InterpretationModule,CIM),首先,本发明建立变分自编码器结构确保时空混合函数的可逆性并满足条件(1),编码器从观测数据中推断因果描述子,解码器对因果描述子进行非线性混合,生成区域的时空数据;其次,为了建模受外生变量影响下的非平稳性并满足条件(2)和条件(3),本发明提出一个域适配器,其将一定时间段内的观测数据分配到对应的域,在同一个域内的外生变量分布一致,在不同域之间的外生变量分布不同;然后,为了捕获时空因果结构,本发明提出了一个条件生成模块(Condition GenerationModule,CGM),通过将区域间的邻接关系作为归纳偏置,捕捉区域内和区域间的因果关系,生成时空条件父变量,并将时空条件父变量转化为因果转移函数的条件参数,控制因果转移函数的具体形式;最后,为了满足受控因果转移函数/>的可逆性并满足条件(1),本发明提出一个因果解释模块(CausalInterpretation Module,CIM),通过利用可逆的神经样条流网络实现因果转移函数,并在条件参数的影响下将外生变量映射到具有物理意义的因果描述子。在应用阶段:首先从外生变量分布中采样当前区域当前时刻下的外生变量;其次利用条件生成模块CGM,根据前一时刻因果描述子的时空条件父变量生成受控因果转移函数的条件参数;然后利用因果解释模块CIM,在条件参数的影响下将外生变量映射到当前区域当前时刻下因果描述子;最后利用变分自编码器中的解码器,对因果描述子进行非线性混合,生成当前区域当前时刻下的时空数据。
具体步骤包括:
步骤(1):根据城市复杂系统内部的时空因果关系,从微观因果描述子层面上定义观测数据的生成过程,建立因果解释模型GCIM的数学原理;同时采集研究区域的多模态数据,将数据量化,构造城市多模态数据,得到各区域分时段数据,作为生成因果解释模型GCIM学习框架的输入。
步骤(2):利用神经网络,搭建生成式解释模型GCIM的学习框架,并将可识别性条件作为神经网络的约束条件,主要目的是从当前系统的观测数据中推断因果描述子,并估计潜在的时空因果结构和时空因果机制,本步骤包含如下步骤(2.1)-步骤(2.5)。
步骤2.1:为了满足条件(1)中时空混合函数的可逆性,使用变分自动编码器(Variational Auto Encoder,VAE)框架来建模因果描述子的推断过程和观测数据的生成过程。GraphGRU被用作编码器和解码器,以同时处理空间和时间维度,其定义如下:
其中,是中间变量,无实际物理意义,/>表示特征拼接操作。/>是sigmoid的函数,/>表示双曲正切函数,/>是t时刻各个区域的观测数据,均是图卷积参数,/>是由GraphGRU输出的当前t时刻的因果描述子,/>是t-1时刻的因果描述子,/>表示图卷积操作,具体定义如下,
预定义邻接关系定义如下:
编码阶段的目的是拟合时空混合函数,本发明从观测数据中/>利用编码器推断因果描述子的后验分布/>,该后验分布是一个各向同性的高斯分布,编码器输出该高斯分布的均值和方差。解码阶段目的是逼近时空混合函数的逆函数/>,本发明以重参数化的方式从后验分布/>中采样估计的因果描述子/>,并使用解码器从估计的因果描述子/>中生成各节点的重构数据/>。
步骤(2.2)在大多数情况下,尽管由于域的影响,观测数据表现出非平稳性,但域信息通常是未知的。为了满足条件(2)和条件(3)的约束,本发明提出了一种域适配器来从观测数据中捕获潜在的域信息,并使用Gumbel Softmax方法来确保每个节点的观测仅属于某个域,定义如下:
其中,表示在t时刻估计的外生变量集合,/>表示在输入为时间窗口P的观测数据的情况下,估计的域信息集合,/>是/>中的元素,表示第i个区域在第t时刻的第k个估计外生变量,/>是/>中的元素,表示第i个区域估计的域信息类别是r。/>和/>表示利用MLP求得高斯分布的均值和方差,/>表示高斯分布。
步骤(2.3)为了充分捕捉时空因果结构,我们提出了条件生成模块(CGM)。我们将时空因果结构分解为区域内因果关系和区域间因果关系,并使用可学习的参数矩阵对它们进行建模。/>和/>,分别表示/>到/>和/>到/>具有因果连边。邻接关系/>作为节点间因果关系的归纳偏差,可以将参数矩阵/>从/>压缩到/>,其中/>,/>表示空间复杂度,这大大减少了可学习参数并提高了可识别性。
步骤(2.4) 先前基于VAE的时间序列表征学习方法使用标准的多元高斯先验正则化隐变量的后验,这极大地限制了模型的表达能力。为此,本发明提出了一个因果解释模块,其目的是基于因果转换函数对因果描述子的先验分布/>进行建模。此外,本发明将条件(2)和条件(3)注入到因果描述子生成的先验规则中,并使用可逆的神经样条流网络来拟合/>,/>表示为/>的逆函数。
首先,使用变元定理将先验分布转换到外生变量分布,定义如下:
CIM解释了因果描述子的内在因果机制,并用可学习的先验分布逼近复杂系统内部真实的潜在因果机制,从而规范了因果描述子后验分布,提高了模型的可识别性。
(2)采用训练后的城市时空数据预测因果模型,使用城市用电历史数据来预测下一时间段用电数据,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能。
其中预测为基于估计的因果描述子预测系统的未来状态是生成模型的一项重要功能。本发明假设域信息在短时间内不发生变化,因此可以从外生变量分布中采样当前区域下一时刻的外生变量,其次利用条件生成模块CGM,根据前一时刻因果描述子的时空条件父变量生成受控因果转移函数的条件参数;然后利用因果解释模块CIM,在条件参数的影响下将外生变量映射到当前区域下一时刻的因果描述子;最后利用变分自编码器中的解码器,对因果描述子进行非线性混合,生成当前区域下一时刻的时空数据。
在真实世界的公开时空数据集上评估了GCIM的可识别性和预测性能,即Electricity Load Diagrams 2011-2014(Electricity)数据集,该数据集记录了某国家370个区域从2011年到2014年各区域的用电量,采样周期为15分钟。为了时间序列的稳定性,本发明将具有缺失值的区域删除,只保留了2021年到2014年各区域的用电量,并以1小时的间隔分割该数据集,以获得Electricity数据集的26304个样本和321个区域。本发明使用1小时的历史数据来预测未来30分钟的数据。60%的数据用于训练,20%用于验证,其余用于测试。
本发明在配有24G内存Nvidia GeForce RTX 3090 GPU的工作站上进行了整个实验。因果解释模型GCIM各组件的特征通道数设置为64,批处理大小也设置为64。学习率设置为0.001。使用Adam优化器和多步学习速率衰减策略。对于超参数,时间窗口的大小为6,因果描述子的数量为8,域的数量为20。Electricity数据集的空间节点的数量为321,Electricity数据集的观测数据的维度为1。
本发明使用均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)方法来评估模型性能,定义如下:
本发明将因果解释模型与目前先进的时空表示学习方法进行了比较,以验证因果解释模型的预测性能,最终的平均结果如表2所示,
表2 在Electricity数据集上本发明方法与其他方法的定量分析结果
表2显示了总体预测性能,对于时空观测序列数据,观测的维度越高,系统内的因果关系就越复杂,MAPE可以有效地反映模型抵抗随机波动的能力。因此,本发明的GCIM始终优于基线模型。用于基于隐式关系矩阵挖掘的方法。AGCRN只使用自适应邻接关系矩阵,导致性能较差,这表明有必要使用预定义的邻接关系作为先验知识。DMSTGCN和RGSL将训练数据中的时空相关性嵌入到隐式关系矩阵中,并融合显式关系矩阵来预测观察结果,具有相似的性能。DGCRN使用输入数据动态生成隐式关系矩阵,可以更好地捕捉动态时空相关性。
最终的平均结果如表3所示,表3 在Solar-Energy数据集上本发明方法与其他方法的定量分析结果:
表3 在Solar-Energy数据集上本发明方法与其他方法的定量分析结果
表3显示了总体预测性能,对于时空观测序列数据,观测的维度越高,系统内的因果关系就越复杂。因此,本发明的GCIM始终优于基线模型。用于基于隐式关系矩阵挖掘的方法。AGCRN只使用自适应邻接关系矩阵,导致性能较差,这表明有必要使用预定义的邻接关系作为先验知识。DMSTGCN将训练数据中的时空相关性嵌入到隐式关系矩阵中,并融合显式关系矩阵来预测观察结果,具有相似的性能。DGCRN使用输入数据动态生成隐式关系矩阵,可以更好地捕捉动态时空相关性。这表明,捕捉动态时空相关性有利于预测。得益于对系统内因果关系的精确建模,GCIM模型在每个时期表现最好,这反映了其稳定性。
以上申请的仅为本申请的一些实施方式。对于本领域的普通技术人员来说,在不脱离本申请创造构思的前提下,还可以做出若干变型和改进,这些都属于本申请的保护范围。
Claims (9)
1.一种城市时空数据预测因果模型的评价方法,其特征在于,包括如下步骤:
(1)构建城市时空数据预测因果模型并采用城市用电数据集进行学习,所述城市用电数据集的每一条数据包括时间、用电量和所在区域;利用神经网络搭建城市时空数据预测因果模型的学习框架,并将可识别性条件作为神经网络的约束条件,对城市时空数据预测因果模型进行训练;
(2)采用训练后的城市时空数据预测因果模型,使用城市用电历史数据来预测下一时间段用电数据,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能,具体如下:
2.根据权利要求1所述的一种城市时空数据预测因果模型的评价方法,其特征在于,所述城市用电数据集采用的数据源包括从2011年到2014年各区域的用电量,区域数量为370个,用电量采样周期为15分钟。
3.根据权利要求2所述的一种城市时空数据预测因果模型的评价方法,其特征在于,针对采用的数据源,以1小时的间隔分割该数据源,以获得城市用电数据集。
4.根据权利要求3所述的一种城市时空数据预测因果模型的评价方法,其特征在于,城市用电数据集中,60%的数据用于训练,20%的数据用于验证,20%的数据用于预测和评价。
5.根据权利要求4所述的一种城市时空数据预测因果模型的评价方法,其特征在于,在预测时,用过去1小时的用电历史数据来预测下一时段的用电数据。
6.根据权利要求5所述的一种城市时空数据预测因果模型的评价方法,其特征在于,所述下一时段为30分钟。
7.根据权利要求6所述的一种城市时空数据预测因果模型的评价方法,其特征在于,所述城市时空数据预测因果模型为生成因果解释模型。
8.根据权利要求7所述的一种城市时空数据预测因果模型的评价方法,其特征在于,所述学习框架为Pytorch深度学习框架。
9.根据权利要求8所述的一种城市时空数据预测因果模型的评价方法,其特征在于,训练过程中,所用神经网络的特征通道数设置为64,批处理大小设置为64,学习率设置为0.001,使用Adam优化器和多步学习速率衰减策略进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310517345.3A CN116227756B (zh) | 2023-05-10 | 2023-05-10 | 一种城市时空数据预测因果模型的评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310517345.3A CN116227756B (zh) | 2023-05-10 | 2023-05-10 | 一种城市时空数据预测因果模型的评价方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116227756A true CN116227756A (zh) | 2023-06-06 |
CN116227756B CN116227756B (zh) | 2023-07-07 |
Family
ID=86569995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310517345.3A Active CN116227756B (zh) | 2023-05-10 | 2023-05-10 | 一种城市时空数据预测因果模型的评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116227756B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120143796A1 (en) * | 2010-12-03 | 2012-06-07 | International Business Machines Corporation | Group variable selection in spatiotemporal modeling |
CN109492830A (zh) * | 2018-12-17 | 2019-03-19 | 杭州电子科技大学 | 一种基于时空深度学习的移动污染源排放浓度预测方法 |
CN111126680A (zh) * | 2019-12-11 | 2020-05-08 | 浙江大学 | 一种基于时间卷积神经网络的道路断面交通流量预测方法 |
CN115204478A (zh) * | 2022-06-30 | 2022-10-18 | 北京航空航天大学 | 一种结合城市兴趣点和时空因果关系的公共交通流量预测方法 |
CN115204477A (zh) * | 2022-06-30 | 2022-10-18 | 北京航空航天大学 | 一种上下文感知图递归网络的自行车流量预测方法 |
CN115691137A (zh) * | 2022-11-01 | 2023-02-03 | 北京航空航天大学 | 一种基于因果马尔科夫模型的多模态数据预测方法 |
-
2023
- 2023-05-10 CN CN202310517345.3A patent/CN116227756B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120143796A1 (en) * | 2010-12-03 | 2012-06-07 | International Business Machines Corporation | Group variable selection in spatiotemporal modeling |
CN109492830A (zh) * | 2018-12-17 | 2019-03-19 | 杭州电子科技大学 | 一种基于时空深度学习的移动污染源排放浓度预测方法 |
CN111126680A (zh) * | 2019-12-11 | 2020-05-08 | 浙江大学 | 一种基于时间卷积神经网络的道路断面交通流量预测方法 |
CN115204478A (zh) * | 2022-06-30 | 2022-10-18 | 北京航空航天大学 | 一种结合城市兴趣点和时空因果关系的公共交通流量预测方法 |
CN115204477A (zh) * | 2022-06-30 | 2022-10-18 | 北京航空航天大学 | 一种上下文感知图递归网络的自行车流量预测方法 |
CN115691137A (zh) * | 2022-11-01 | 2023-02-03 | 北京航空航天大学 | 一种基于因果马尔科夫模型的多模态数据预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116227756B (zh) | 2023-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lei et al. | A building energy consumption prediction model based on rough set theory and deep learning algorithms | |
Li et al. | Attention-based interpretable neural network for building cooling load prediction | |
Amasyali et al. | A review of data-driven building energy consumption prediction studies | |
Liu et al. | A data mining-based framework for the identification of daily electricity usage patterns and anomaly detection in building electricity consumption data | |
Dubey et al. | Study and analysis of SARIMA and LSTM in forecasting time series data | |
Grillone et al. | A review of deterministic and data-driven methods to quantify energy efficiency savings and to predict retrofitting scenarios in buildings | |
Yu et al. | Short term wind power prediction for regional wind farms based on spatial-temporal characteristic distribution | |
Ding et al. | Evolutionary double attention-based long short-term memory model for building energy prediction: Case study of a green building | |
Jiang et al. | Attention-LSTM architecture combined with Bayesian hyperparameter optimization for indoor temperature prediction | |
Liu et al. | Short-term load forecasting of multi-energy in integrated energy system based on multivariate phase space reconstruction and support vector regression mode | |
Moradzadeh et al. | Heating and cooling loads forecasting for residential buildings based on hybrid machine learning applications: A comprehensive review and comparative analysis | |
Konstantakopoulos et al. | Design, benchmarking and explainability analysis of a game-theoretic framework towards energy efficiency in smart infrastructure | |
Li et al. | A clustering-based approach for “cross-scale” load prediction on building level in HVAC systems | |
CN115691137B (zh) | 一种基于因果马尔科夫模型的多模态数据预测方法 | |
Du et al. | A hybrid deep learning framework for predicting daily natural gas consumption | |
Yuan et al. | Attention mechanism-based transfer learning model for day-ahead energy demand forecasting of shopping mall buildings | |
Zhang et al. | High spatial granularity residential heating load forecast based on Dendrite net model | |
Sharif et al. | Generation of whole building renovation scenarios using variational autoencoders | |
Zhang et al. | Multi-quantile recurrent neural network for feeder-level probabilistic energy disaggregation considering roof-top solar energy | |
Seidu et al. | A hybrid groundwater level prediction model using signal decomposition and optimised extreme learning machine | |
Wang et al. | A novel wind power prediction model improved with feature enhancement and autoregressive error compensation | |
Yuan et al. | SA–EMD–LSTM: A novel hybrid method for long-term prediction of classroom PM2. 5 concentration | |
CN116227756B (zh) | 一种城市时空数据预测因果模型的评价方法 | |
Wang | Application of deep learning model in building energy consumption prediction | |
Lu | Enhancing real-time nonintrusive occupancy estimation in buildings via knowledge fusion network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |