CN109492760B - 基于深度模糊认知图模型的道路交通可解释预测方法 - Google Patents

基于深度模糊认知图模型的道路交通可解释预测方法 Download PDF

Info

Publication number
CN109492760B
CN109492760B CN201811573928.3A CN201811573928A CN109492760B CN 109492760 B CN109492760 B CN 109492760B CN 201811573928 A CN201811573928 A CN 201811573928A CN 109492760 B CN109492760 B CN 109492760B
Authority
CN
China
Prior art keywords
node
road
road section
causal
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811573928.3A
Other languages
English (en)
Other versions
CN109492760A (zh
Inventor
王晓达
李超
王静远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201811573928.3A priority Critical patent/CN109492760B/zh
Publication of CN109492760A publication Critical patent/CN109492760A/zh
Application granted granted Critical
Publication of CN109492760B publication Critical patent/CN109492760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/043Architecture, e.g. interconnection topology based on fuzzy logic, fuzzy membership or fuzzy inference, e.g. adaptive neuro-fuzzy inference systems [ANFIS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • Computational Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Neurology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于深度模糊认知图模型的可解释预测方法,将深度学习模型和FCM模型相结合,以非线性函数取代FCM中概念间的线性关系模型,以达到更好的预测性能;将两个概念间的因果关系建模为和系统当前各概念的输入状态相关,以建模概念间的动态因果关系;将影响系统的外部因素以附加的形式加入模型,以消除外部因素对系统的干扰,使模型可以得到准确的结果。

Description

基于深度模糊认知图模型的道路交通可解释预测方法
技术领域
本发明涉及模糊决策和深度学习技术领域,更具体的说是涉及一种基于深度模糊认知图模型的道路交通可解释预测方法。
背景技术
在模糊决策领域,智能系统的知识表示和因果关系推断方法是其研究中的一个关键问题。其致力于为预测问题提供人类可以理解的解释和因果关系。
在现有技术中,模糊认知图模型(FCM)是一个解决可解释知识表示和因果分析问题的灵活而有效的方法。但是FCM模型具有一些局限性:
FCM模型只能建模概念间的线性的关系。因此其虽然具有很好的可解释性能,但却难以建模现实世界中复杂的非线性关系,在预测性能上表现欠佳。
FCM模型中建模的关系是静态的。因此其隐含了特定概念对输出的影响力是恒定的的假设,而现实中某特定概念对输出的影响力往往和其他概念相关:如某个人体重指标对健康程度的影响力可能与这个人的年龄相关。
FCM模型要求模型构成一个封闭的系统。这就意味着影响系统的所有因素都应当被包含在系统内部,一旦有系统外的因素对系统的预测产生了影响,由FCM模型得到的结果将是不准确的。
因此,在保持FCM优秀的可解释能力和因果分析能力的同时,克服FCM模型的局限性是模糊系统技术领域亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种基于深度模糊认知图模型的道路交通可解释预测方法,弥补了FCM模型非线性关系建模能力薄弱、建模后关系是静态的以及只能建立在封闭系统纸上的局限,引入深度学习网络使得模型的非线性建模能力得到很大提高,同时提供了研究节点间因果关系影响力动态变化的手段,并且通过引入外部因素使模型可以应用于开放系统。
为了实现上述目的,本发明采用如下技术方案:
一种基于深度模糊认知图模型的道路交通可解释预测方法,包括:
S1:构建深度模糊认知图像模型:
Figure GDA0003627680110000021
其中,
Figure GDA0003627680110000022
为系统t+1时刻各要素的状态值,
Figure GDA0003627680110000023
为各要素节点与节点cj的非线性因果关系函数,该函数中的参数
Figure GDA0003627680110000024
为当前时刻下系统中所有节点的状态值构成的向量,uj(t)用于建模与时间有关的外部因素对系统中要素节点状态值的影响函数,
S2:利用深度神经网络来建模非线性因果关系函数
Figure GDA0003627680110000025
定义
Figure GDA0003627680110000026
是一个具有K层隐藏层的神经网络,其中,第k层具有Mk个神经元,在t时刻,第k层的第m个神经元的输出
Figure GDA0003627680110000027
通过下式计算:
Figure GDA0003627680110000028
其中,v(nm,k)是第k-1层的第n个神经元与第k层的第m个神经元之间的神经网络连接参数,ReLU(·)是线性整流单元激活函数,定义为:
Figure GDA0003627680110000029
Figure GDA00036276801100000210
表示的神经网络的输入层,令
Figure GDA00036276801100000211
作为神经网络的输入,即
Figure GDA00036276801100000212
则以节点cj为例,在输出层可以计算其t+1时刻的预测值:
Figure GDA0003627680110000031
S3:利用循环神经网络建模外部因素对内部节点cj影响的函数uj(t):
uj(t)=RNN(t,mod(t,τ),uj(t-1)) (5)
其包含三部分输入:当前时间戳t、周期τ下的周期时间戳和历史外部因素状态uj(t-1);
S4:对步骤S2中建模的非线性因果关系函数
Figure GDA0003627680110000032
进行因果度量:具体包括:对随着节点ck的激活强度ak变化的节点ci对节点cj的因果强度wij(ak)以及ci对cj的整体因果强度
Figure GDA0003627680110000033
进行度量;
对给定的系统状态
Figure GDA0003627680110000034
因果性被度量为:
Figure GDA0003627680110000035
其中,
Figure GDA0003627680110000036
表示
Figure GDA0003627680110000037
中除了ai以外的其他各节点的状态值向量,rij的含义为:在给定的系统状态
Figure GDA0003627680110000038
下,ai增大极端小量Δai导致的
Figure GDA0003627680110000039
的增大量;
为了研究因果关系
Figure GDA00036276801100000310
随某个节点ck的状态值的变化,需要消除节点ck以外的其他节点对因果关系
Figure GDA00036276801100000311
的影响,进而得到受节点ck的状态值变化影响的节点ci对节点cj的因果影响力贡献函数:
Figure GDA00036276801100000312
其中,
Figure GDA00036276801100000313
为除ck外的其他节点当前激活状态值向量为
Figure GDA00036276801100000314
时的概率密度函数值,然后使用
Figure GDA00036276801100000315
对因果关系
Figure GDA00036276801100000316
积分来消除ck外的其他节点对节点ci对节点cj的因果关系的影响;
同理,还可以对节点ci对节点cj的整体因果关系进行建模,得到建立在所有可能的系统状态值
Figure GDA0003627680110000041
之上的节点ci对节点cj的因果关系:
Figure GDA0003627680110000042
在实际应用中,对处于小区间[α,β]上的ak,假设有M个样本落在这个区间上,根据大数定律,可以得到:
Figure GDA0003627680110000043
使用双曲正切函数进行规范化:
Figure GDA0003627680110000044
Figure GDA0003627680110000045
其中,wij(ak)表示经过规范化的受节点ck的状态值变化影响的节点ci对节点cj的因果影响力贡献函数,
Figure GDA0003627680110000046
表示经过规范化的建立在所有可能的系统状态值
Figure GDA0003627680110000047
之上的节点ci对节点cj的因果影响力贡献,其中,Tanh(·)为:
Figure GDA0003627680110000048
S5:基于交替梯度下降方法对步骤S2中深度神经网络和步骤S3中循环神经网络中的参数进行参数推断,得到推断出来的深度模糊认知图像模型;
S6:利用推断出来的深度模糊认知图像模型进行预测和因果分析。
优选的,在步骤S3中,采用长短期记忆网络进行实现。
优选的,步骤S5具体包括:
对节点cj,假设其最初始的时间序列为
Figure GDA0003627680110000049
对于
Figure GDA00036276801100000410
其对应的激活状态值被定义为:
Figure GDA00036276801100000411
其中,μj和σj分别为
Figure GDA00036276801100000412
向量的均值和标准差,
Figure GDA0003627680110000051
由公式(1)和(10),得到:
Figure GDA0003627680110000052
其中,θf和θu分别为神经网络
Figure GDA0003627680110000053
和uj(t)的参数,为了推断θf和θu,需要最小化目标函数:
Figure GDA0003627680110000054
为了解决最小化目标函数的训练问题,提出一种交替梯度下降方法,该方法迭代地分别更新
Figure GDA0003627680110000055
和uj(t)的参数,在第q次迭代中,有:
Figure GDA0003627680110000056
Figure GDA0003627680110000057
其中,ηf和ηu为学习率,
给定通过训练数据集计算得到的
Figure GDA0003627680110000058
公式(13)(14)具体写为:
Figure GDA0003627680110000059
Figure GDA00036276801100000510
代入公式(12),得到:
Figure GDA00036276801100000511
Figure GDA00036276801100000512
计算得到学习率ηf=ηu=1,因此,对于给定的训练集,
Figure GDA00036276801100000513
和uj(t)使用下式迭代更新:
Figure GDA0003627680110000061
Figure GDA0003627680110000062
即在第q次迭代中,以
Figure GDA0003627680110000063
作为输入,
Figure GDA0003627680110000064
作为标签使用反向传播算法来推断
Figure GDA0003627680110000065
在第q次迭代中的参数,其中,
Figure GDA0003627680110000066
为在第q-1次迭代中推断得到的uj(t)的参数定义下的uj(t),式(19)同理。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于深度模糊认知图模型的道路交通可解释预测方法,将深度学习模型和FCM模型相结合,以非线性函数取代FCM中概念间的线性关系模型,以达到更好的预测性能;将两个概念间的因果关系建模为和系统当前各概念的输入状态相关,以建模概念间的动态因果关系;将影响系统的外部因素以附加的形式加入模型,以消除外部因素对系统的干扰,使模型可以得到准确的结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明提供的基于深度模糊认知图模型的道路交通可解释预测方法的流程图;
图2为本发明提供的基本FCM模型和深度FCM模型的对比示意图;
图3为本发明提供的北京市海淀区学院路上的六个路段的示意图;
图4为本发明提供的基础模糊认知图模型与深度模糊认知图模型的实验结果对比图一;
图5为本发明提供的基础模糊认知图模型与深度模糊认知图模型的实验结果对比图二;
图6为本发明提供的基础模糊认知图模型与深度模糊认知图模型的实验结果对比图三;
图7为本发明提供的Y型结构的示意图;
图8为本发明提供的气象指标对空气污染物中臭氧指标的影响力随气象指标的两种模型变化曲线对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合各个步骤对发明的技术方案做详细说明。
1.1建模非线性影响
基础的模糊认知图(FCM)模型由节点、节点的激活程度和因果关系三部分组成。给定具有I个节点的系统,FCM模型可以被表示为一个有向带权图:G(C,W),其中C={c1,...,ci,...,cI}为节点集,W∈RI×I为权重矩阵。
具体地,节点ci代表了复杂系统中的要素,节点的激活程度由时间序列
Figure GDA0003627680110000071
表示,其中
Figure GDA0003627680110000072
表示了t时刻系统中ci的动态状态值,而因果关系权重矩阵W中的值wij则表示了节点ci对节点cj的影响力大小。当wij>0时,表示节点ci状态的增加将导致节点cj的状态增加,即正因果关系;同理,当wij<0时存在负因果关系;而wij=0时则称两节点间不存在因果关系。模糊认知图模型认为系统的动态行为是由系统中各要素节点及其状态通过要素的相互作用而形成的,即系统t+1时刻各要素的状态值可通过因果关系与系统t时刻各要素的状态值得到:
Figure GDA0003627680110000081
以节点cj为例,其t+1时刻的状态值可通过因果关系权重矩阵W与系统t时刻各要素的状态值得到。其中,S(·)是变换函数,其作用是将输出变换到[0,1]。
模糊认知图模型的一个不足是其建模非线性关系的能力非常薄弱,严重降低了其预测性能。为了解决这一点,本发明尝试使用非线性函数
Figure GDA0003627680110000082
代替各要素对节点cj的因果关系w*j。既增强了模糊认知图模型的非线性建模能力,也将因果关系建模为动态的系统,因果关系的大小受各节点状态值起伏的影响。然后通过在模型中引入外部变量来构建开放系统,以避免外部因素对系统中节点间关系的影响。在本发明中,同样以节点cj为例,其在系统t+1时刻的状态值可被表示为:
Figure GDA0003627680110000083
其中,
Figure GDA0003627680110000084
为为各要素节点与节点cj的非线性因果关系函数。该函数中的参数
Figure GDA0003627680110000085
为当前时刻下系统中所有节点的状态值构成的向量。uj(t)用于建模与时间有关的外部因素对系统中要素节点状态值的影响函数。显然,基本的模糊认知图模型是本发明的一个特殊情况。
当uj(t)=0并且
Figure GDA0003627680110000086
wjj=1时,本发明提供的模型与基本的模糊认知图模型等价,请参见图2。
为了改进模糊认知图模型在建模非线性关系上的不足,本发明使用深度神经网络来建模非线性因果关系函数
Figure GDA0003627680110000087
定义
Figure GDA0003627680110000088
是一个具有K层隐藏层的神经网络,其中,第k层具有Mk个神经元。在t时刻,第k层的第m个神经元的输出
Figure GDA0003627680110000091
可以通过下式计算:
Figure GDA0003627680110000092
其中,v(nm,k)是第k-1层的第n个神经元与第k层的第m个神经元之间的神经网络连接参数,ReLU(·)是线性整流单元激活函数,定义为:
Figure GDA0003627680110000093
使用ReLU(·)激活函数可以确保在初始状态a1=…=ai=…=aI=0时,
Figure GDA0003627680110000094
以与基础模糊认知图模型保持一致。
Figure GDA0003627680110000095
表示的神经网络的输入层,令
Figure GDA0003627680110000096
作为神经网络的输入,即
Figure GDA0003627680110000097
则以节点cj为例,在输出层可以计算其t+1时刻的预测值:
Figure GDA0003627680110000098
1.2建模外部因素
在本发明中,uj(t)用于建模外部因素对节点cj的影响,外部因素是指对系统有影响但不能预先定义和直接测量的外源因素,因此这部分因素无法被基础的模糊认知图模型通过预定义为要素节点的方式进行描述。
在本发明中,根据公式(2),外部因素对系统中节点cj的影响可以通过下式间接度量:
Figure GDA0003627680110000099
即节点cj无法被系统的内部概念
Figure GDA00036276801100000910
通过
Figure GDA00036276801100000911
建模的部分。
本发明用于建模外部因素对内部节点cj影响的函数uj(t)使用循环神经网络(RNN,Recurrent Neural Network)进行实现,其包含三部分输入:当前时间戳t、周期τ下的周期时间戳和历史外部因素状态uj(t-1)。具体实现方式为:
uj(t)=RNN(t,mod(t,τ),uj(t-1)) (7)
为了建模时间影响下的外部因素,本发明使用t作为输入。同时由于在很多应用场景下,外部因素具有很强的周期性,如一天、一星期、一个月等。因此本发明将周期时间戳同样作为输入。动态的外部因素影响通常还具有记忆性,因此,本发明使用循环神经网络来实现对外部因素的建模。在具体使用中,可以使用循环神经网络的改进版本:长短期记忆网络(LSTM,Long Short-Term Memory)进行实现。
1.3度量因果关系
在改进模糊认知图模型不足的同时,本发明希望保留模糊认知图模型在知识表示和因果关系推断上的卓越能力。在本发明中,节点ci对节点cj的因果影响力贡献rij被表达为当前系统状态
Figure GDA0003627680110000101
的函数。对给定的系统状态
Figure GDA0003627680110000102
因果性被度量为:
Figure GDA0003627680110000103
其中,
Figure GDA0003627680110000104
表示
Figure GDA0003627680110000105
中除了ai以外的其他各节点的状态值向量。类比于基础模糊认知图模型中的节点ci对节点cj的因果关系wij,rij的含义为:在给定的系统状态
Figure GDA0003627680110000106
下,ai增大极端小量Δai导致的
Figure GDA0003627680110000107
的增大量。
在实际的应用中,为了研究因果关系
Figure GDA0003627680110000108
随某个节点ck的状态值的变化,需要消除节点ck以外的其他节点对因果关系
Figure GDA0003627680110000109
的影响。进而得到受节点ck的状态值变化影响的节点ci对节点cj的因果影响力贡献函数:
Figure GDA00036276801100001010
其中,
Figure GDA0003627680110000111
为除ck外的其他节点当前激活状态值向量为
Figure GDA0003627680110000112
时的概率密度函数值。然后使用
Figure GDA0003627680110000113
对因果关系
Figure GDA0003627680110000114
积分来消除ck外的其他节点对节点ci对节点cj的因果关系的影响。
同理,本发明还可以对节点ci对节点cj的整体因果关系进行建模,得到建立在所有可能的系统状态值
Figure GDA0003627680110000115
之上的节点ci对节点cj的因果关系:
Figure GDA0003627680110000116
在实际应用中,
Figure GDA0003627680110000117
Figure GDA0003627680110000118
是不可知的。较为通常的做法是使用频率来近似概率密度函数。对处于小区间[α,β]上的ak,假设有M个样本落在这个区间上,根据大数定律,可以得到:
Figure GDA0003627680110000119
由于模糊认知图模型要求节点间的因果强度在[-1,1]之间,因此使用双曲正切函数进行规范化:
Figure GDA00036276801100001110
其中,wij(ak)表示经过规范化的受节点ck的状态值变化影响的节点ci对节点cj的因果影响力贡献函数,
Figure GDA00036276801100001111
表示经过规范化的建立在所有可能的系统状态值
Figure GDA00036276801100001112
之上的节点ci对节点cj的因果影响力贡献,其中,Tanh(·)为:
Figure GDA00036276801100001113
至此可以得到经过规范后的随着节点ck的激活强度ak变化的节点ci对节点cj的因果强度wij(ak)以及经过规范后的节点ci对节点cj的整体因果强度
Figure GDA00036276801100001114
公式(8)中的偏导数
Figure GDA00036276801100001115
可以通过链式法则逐层计算:
Figure GDA00036276801100001116
其中,
Figure GDA0003627680110000121
其中,
Figure GDA0003627680110000122
为激活函数ReLU(·)的偏导,并且在输入层y(i,0)=ai,用这样的方式,就可以得到给定的系统状态
Figure GDA0003627680110000123
下节点ci对节点cj的因果影响力贡献
Figure GDA0003627680110000124
1.4参数推断方法
在本发明中,公式(2)中的非线性函数uj(t)、
Figure GDA0003627680110000125
均使用神经网络进行建模,为了通过训练数据推断神经网络中的参数,本发明提出了一种参数推断方法。
由于模糊认知图模型要求节点的激活程度在[0,1]区间内,因此本发明需要对训练数据集中各个要素节点的最初始时间序列进行预处理。对节点cj,假设其最初始的时间序列为
Figure GDA0003627680110000126
对于
Figure GDA0003627680110000127
其对应的激活状态值被定义为:
Figure GDA0003627680110000128
其中,μj和σj分别为
Figure GDA0003627680110000129
向量的均值和标准差。
Figure GDA00036276801100001210
由公式(2)(14),本模型可以表示为:
Figure GDA00036276801100001211
其中,θf和θu分别为神经网络
Figure GDA00036276801100001212
和uj(t)的参数。为了推断θf和θu,需要最小化目标函数:
Figure GDA00036276801100001213
为了解决最小化目标函数的训练问题,本发明提出了一种交替梯度下降方法(AFGD,Alternate Function Gradient Descent)。该方法迭代地分别更新
Figure GDA0003627680110000131
和uj(t)的参数。在第q次迭代中,有:
Figure GDA0003627680110000132
Figure GDA0003627680110000133
其中,ηf和ηu为学习率。
给定通过训练数据集计算得到的
Figure GDA0003627680110000134
公式(17)(18)可以具体写为:
Figure GDA0003627680110000135
Figure GDA0003627680110000136
代入公式(16),得到:
Figure GDA0003627680110000137
Figure GDA0003627680110000138
可以计算得到学习率ηf=ηu=1。因此,对于给定的训练集,
Figure GDA0003627680110000139
和uj(t)可使用下式迭代更新:
Figure GDA00036276801100001310
Figure GDA00036276801100001311
即在第q次迭代中,以
Figure GDA00036276801100001312
作为输入,
Figure GDA00036276801100001313
作为标签使用反向传播(BP,Back Propagation)算法来推断
Figure GDA00036276801100001314
在第q次迭代中的参数。其中,
Figure GDA00036276801100001315
为在第q-1次迭代中推断得到的uj(t)的参数定义下的uj(t)。式(23)同理。
至此,本发明通过训练数据推断神经网络中的参数,得到了本发明模型(公式(2))中用神经网络表示的非线性函数uj(t)、
Figure GDA0003627680110000141
下面结合具体实施例来进一步说明本发明的技术方案和优越性。
具体实施例一——道路交通系统
在道路交通速度预测问题上,使用了北京市海淀区学院路上的六个路段。如图3所示,R4、R5、R6为主路,R1、R2、R3为辅路,两个斜坡道将R3和R5、R5和R1连接在一起。
在本实施例中,将道路的路段(R1-R6)被建模为要素节点。如果两个路段通过斜坡道相连或直接相连,则在本发明提出的模型中为这两个路段建立连接。使用的数据集为这六条路段在2016年4月全月内每隔10分钟采集一次的交通速度时间序列。
对各路段原始交通速度时间序列的每个时间片上的速度,本实施例使用公式(14)进行标准化,得到每个要素节点的状态值时间序列。在建模过程中,ui(t)中使用的时间周期超参被设置为1天,即城市通勤的自然节律。在本实施例中,使用t时刻的系统状态来预测t+1时刻的系统状态。
在本实施例中比较了5种模型的预测性能。
DFCM-1L:用包含1个隐藏层的神经网络建模
Figure GDA0003627680110000142
用包含1个隐藏层的神经网络建模ui(t)。
DFCM-3L:用包含3个隐藏层的神经网络建模
Figure GDA0003627680110000143
用包含1个隐藏层的神经网络建模ui(t)。
fi-1L:用包含1个隐藏层的神经网络建模
Figure GDA0003627680110000144
不建模ui(t)。
fi-3L:用包含3个隐藏层的神经网络建模
Figure GDA0003627680110000145
不建模ui(t)。
FCM:基础的模糊认知图模型。
预测性能的评价指标选取了均方根误差(RMSE,Root Mean Square Error)和平均绝对百分比误差(MAPE,Mean Absolute Percentage Error)进行度量,实验结果如表1和表2。
表1交通预测的均方根误差(RMSE)指标
Figure GDA0003627680110000151
表2交通预测的平均绝对百分比误差(MAPE)指标
Figure GDA0003627680110000152
从预测性能上可以看出,使用本发明的模型在预测性能上较基础模糊认知图模型有极大的提高,证明非线性建模的引入极大的提高了建模非线性关系的能力。同时,引入外部因素的模型均比不引入外部因素的模型预测性能高不少,证明外部因素的引入可以极大的改善预测性能。最后,使用3个隐藏层建模
Figure GDA0003627680110000153
较使用1个隐藏层建模
Figure GDA0003627680110000154
在预测性能上有微弱的提高,证明深层结构在建模非线性关系上通常比浅层结构好,但更多的层将需要更多的计算复杂度和更高的过拟合风险。
本实施例使用方案中的度量因果关系方法对要素之间的因果关系进行了分析。
如图4~6所示,黑色虚线表示基础模糊认知图模型推断出来的因果关系,带圆标记的线表示本发明模型推断出来的因果关系。对标记为ak,wij的图片,其含义为:路段Ri速度对路段Rj速度预测的因果影响力随路段Rk速度变化的曲线。
图4显示了下游路段对其直接上游路段的因果影响力随下游路段交通速度的变化曲线。可以观察到随着下游路段道路速度的增加,下游路段对其直接上游路段的因果影响力变化不是单调的,而是先下降再升高。在研究中也观察到了这一现象,并对这一现象做出了解释:具有中等交通速度的路段通常比具有低速或高速的路段具有更弱的可预测性,这可能削弱其对上游路段的影响。
图5显示了下游路段对通过斜坡道连接的上游路段的因果影响力随下游路段交通速度的变化曲线。可以看出,通过斜坡道连接的下游路段对上游路段的影响力整体上小于直接连接的下游路段对上游路段的影响。并且在下游路段速度很低时,对上游路段的影响非常低,甚至为负。这可能是由于斜坡道的分流效果导致当下游路段速度很低时,车辆被分流进另一条道路,致使通过斜坡道连接的下游路段在拥堵时对上游道路影响力很低。
图6显示了Y型结构中的因果影响力变化曲线。Y型结构如图7所示,Y型结构是指:当沿着一条道路前行,可以选择继续直行或通过斜坡道前行时,当前道路、直行的下一条道路、斜坡道共同构成Y型结构。
图7显示了Y型结构中的阀现象,图7a为阀关闭的状态,即当斜坡下游道路拥堵时,上游路段也将被堵塞的状态。图7b为阀打开的状态,即当斜坡下游道路通畅时的道路状态。
图6观察了Y型结构中下游道路对其直接上游路段的因果影响力随Y型结构中由斜坡道连接到该上游道路的下游道路交通速度的变化曲线。可以观察到,在Y型结构中,下游道路对上游道路的影响具有阀现象,即当斜坡下游道路拥堵时,上游路段也将被堵塞(如图7a),导致直接下游道路不再影响上游道路。相反,当斜坡下游道路通畅时,直接下游道路对上游道路的影响将被恢复。
相较于基础模糊认知图得到的因果关系分析,使用本发明的模型得到的各个道路之间的影响整体上是正向影响。由于这六个路段速度之间具有很强的相关关系,得到这样的结果是满足人们预期的。而基础模糊认知图模型得到的因果关系却出现了两个路段速度的强负相关关系。这也进一步证明了基本模糊认知图模型由于不能捕捉现实系统中复杂的非线性关系而可能得到错误的因果关系分析结果。
具体实施例二——空气污染系统
在空气污染系统污染指标预测问题上,使用了北京市的气象和大气污染物系统收集到的数据来验证本发明模型的效果。
在本实验例中,将空气污染物指标(PM2.5、O3、SO2、CO和NO2)和气象因素(温度、湿度、压强和风速)指标建模为要素节点。在预测气象因素指标时,由于气象因素指标对气象因素指标应当具有相关影响,空气污染物指标对气象因素则没有影响,因此,只在气象因素与气象因素之间建立连接。在预测空气污染物指标时,气象因素和空气污染物指标应当都对其有影响,因此均建立连接。使用的数据集为2017年2月至2018年2月全年在北京的两个气象站采集到的气象和污染物数据。时间序列数据的采集时间间隔为1小时。
本实验例对时间序列的每个时间片上的指标,使用公式(14)进行标准化,得到每个要素节点的状态值时间序列。在建模过程中,ui(t)中使用的时间周期超参被设置为1天。在本实验例中,使用t时刻的系统状态来预测t+1时刻的系统状态。
在本实验例中比较了5种模型的预测性能。
DFCM-1L:用包含1个隐藏层的神经网络建模
Figure GDA0003627680110000181
用包含1个隐藏层的神经网络建模ui(t)。
DFCM-3L:用包含3个隐藏层的神经网络建模
Figure GDA0003627680110000182
用包含1个隐藏层的神经网络建模ui(t)。
fi-1L:用包含1个隐藏层的神经网络建模
Figure GDA0003627680110000183
不建模ui(t)。
fi-3L:用包含3个隐藏层的神经网络建模
Figure GDA0003627680110000184
不建模ui(t)。
FCM:基础的模糊认知图模型。
预测性能的评价指标选取了均方根误差(RMSE,Root Mean Square Error)和平均绝对百分比误差(MAPE,Mean Absolute Percentage Error)进行度量,实验结果如表3和表4。
表3空气污染预测的均方根误差(RMSE)指标
Figure GDA0003627680110000185
表4空气污染预测的平均绝对百分比误差(MAPE)指标
Figure GDA0003627680110000186
本实验例使用方案中的度量因果关系方法对要素之间的因果关系进行了分析。如图8所示,黑色虚线表示基础模糊认知图模型推断出来的因果关系,带圆标记的线表示本发明模型推断出来的因果关系。对标记为ak,wij的图片,其含义为:路段Ri速度对路段Rj速度预测的因果影响力随路段Rk速度变化的曲线。
图8显示了气象指标对空气污染物中臭氧指标的影响力随气象指标的变化曲线。对于大部分的空气污染物指标来说,高气压将导致空气流向周围地区,而带走污染物,因此气压对污染物有负面影响;高湿度通常对应于降水天气,可以冲走空气中的污染物,因此湿度对污染物也有负面影响;风可以吹走污染物,所以风速对污染物也是负面影响;温度和污染物之间的关系是间接的,人们冬天燃烧化石燃料进行取暖,导致在低温天气污染物增加。同理,气压和湿度对臭氧指标的影响也是负面影响,但是,由于臭氧指标的特殊性,在很多研究中,都证明高温能够促进臭氧的产生,因此温度指标对抽样指标具有正面影响,并且在风速对臭氧影响的研究中,普遍结论是当风速不是很高时,气流可以吹走臭氧,从而降低臭氧浓度,而当风速提高时会降低大气边界层的稳定性,导致臭氧从上层侵入到表层,增加表层的臭氧浓度,风速过高时,风的弥散作用将超过侵入作用。在本实验例中,可以同样发现这样的模式:温度对臭氧具有正向影响,压强和湿度对臭氧具有负向影响,而当风速较低时,风速对臭氧的影响为负向,随着风速的提高,变为正向影响,而风速过高时,由于风弥散作用超过侵入作用导致再度变为负向影响。本实验例发现的规律与相关气象研究的结论一致。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (3)

1.一种基于深度模糊认知图模型的道路交通可解释预测方法,其特征在于,包括:
S1:构建深度模糊认知图像模型:
Figure FDA0003627680100000011
其中,
Figure FDA0003627680100000012
为系统t+1时刻各路段的状态值,
Figure FDA0003627680100000013
为各路段节点与路段节点cj的下游路段对通过斜坡道连接的上游路段的非线性因果关系函数,该函数中的参数
Figure FDA0003627680100000014
为当前时刻下系统中所有路段节点的状态值构成的向量,uj(t)用于建模与城市通勤的自然节律对系统中路段节点状态值的影响函数;所述路段节点状态值为交通速度时间;
S2:利用深度神经网络来建模下游路段对通过斜坡道连接的上游路段的非线性因果关系函数
Figure FDA0003627680100000015
定义
Figure FDA0003627680100000016
是一个具有K层隐藏层的神经网络,其中,第k层具有Mk个神经元,在t时刻,第k层的第m个神经元的输出
Figure FDA0003627680100000017
通过下式计算:
Figure FDA0003627680100000018
其中,v(nm,k)是第k-1层的第n个神经元与第k层的第m个神经元之间的神经网络连接参数,ReLU(·)是线性整流单元激活函数,定义为:
Figure FDA0003627680100000019
Figure FDA00036276801000000110
表示的神经网络的输入层,令
Figure FDA00036276801000000111
作为神经网络的输入,即
Figure FDA00036276801000000112
则以路段节点cj为例,在输出层计算其t+1时刻的预测值:
Figure FDA00036276801000000113
S3:利用循环神经网络建模城市通勤的自然节律对内部路段节点cj影响的函数uj(t):uj(t)=RNN(t,mod(t,τ),uj(t-1)) (5)
其包含三部分输入:当前时间戳t、周期τ下的周期时间戳和历史外部因素状态uj(t-1);
S4:对步骤S2中建模的下游路段对通过斜坡道连接的上游路段的非线性因果关系函数
Figure FDA0003627680100000021
进行因果度量,具体包括:对随着路段节点ck的激活强度ak变化的路段节点ci对路段节点cj的因果强度wij(ak)以及ci对cj的整体因果强度
Figure FDA0003627680100000022
进行度量;
对给定的系统状态
Figure FDA0003627680100000023
因果性被度量为:
Figure FDA0003627680100000024
其中,
Figure FDA0003627680100000025
表示
Figure FDA0003627680100000026
中除了ai以外的其他各路段节点的状态值向量,rij的含义为:在给定的系统状态
Figure FDA0003627680100000027
下,ai增大极端小量Δai导致的
Figure FDA0003627680100000028
的增大量;
为了研究因果关系
Figure FDA0003627680100000029
随某个路段节点ck的状态值的变化,需要消除路段节点ck以外的其他路段节点对因果关系
Figure FDA00036276801000000210
的影响,进而得到受路段节点ck的状态值变化影响的路段节点ci对路段节点cj的因果影响力贡献函数:
Figure FDA00036276801000000211
其中,
Figure FDA00036276801000000212
为除ck外的其他路段节点当前激活状态值向量为
Figure FDA00036276801000000213
时的概率密度函数值,然后使用
Figure FDA00036276801000000214
对因果关系
Figure FDA00036276801000000215
积分来消除ck外的其他路段节点对路段节点ci对路段节点cj的因果关系的影响;
同理,还对路段节点ci对路段节点cj的整体因果关系进行建模,得到建立在所有可能的系统状态值
Figure FDA00036276801000000216
之上的路段节点ci对路段节点cj的因果关系:
Figure FDA0003627680100000031
在实际应用中,对处于小区间[α,β]上的ak,假设有M个样本落在这个区间上,根据大数定律,得到:
Figure FDA0003627680100000032
使用双曲正切函数进行规范化:
Figure FDA0003627680100000033
Figure FDA0003627680100000034
其中,wij(ak)表示经过规范化的受路段节点ck的状态值变化影响的路段节点ci对路段节点cj的因果影响力贡献函数,
Figure FDA0003627680100000035
表示经过规范化的建立在所有可能的系统状态值
Figure FDA0003627680100000036
之上的路段节点ci对路段节点cj的因果影响力贡献,其中,Tanh(·)为:
Figure FDA0003627680100000037
S5:基于交替梯度下降方法对步骤S2中深度神经网络和步骤S3中循环神经网络中的参数进行参数推断,得到推断出来的深度模糊认知图像模型;
S6:利用推断出来的深度模糊认知图像模型进行下游路段对通过斜坡道连接的上游路段的因果影响力随下游路段交通速度变化的预测和因果分析。
2.根据权利要求1所述的一种基于深度模糊认知图模型的道路交通可解释预测方法,其特征在于,在步骤S3中,采用长短期记忆网络进行实现。
3.根据权利要求1所述的一种基于深度模糊认知图模型的道路交通可解释预测方法,其特征在于,步骤S5具体包括:
对路段节点cj,假设其最初始的时间序列为
Figure FDA0003627680100000038
对于
Figure FDA0003627680100000039
其对应的激活状态值被定义为:
Figure FDA00036276801000000310
其中,μj和σj分别为
Figure FDA00036276801000000311
向量的均值和标准差,
Figure FDA0003627680100000041
由公式(1)和(10),得到:
Figure FDA0003627680100000042
其中,θf和θu分别为神经网络
Figure FDA0003627680100000043
和uj(t)的参数,为了推断θf和θu,需要最小化目标函数:
Figure FDA0003627680100000044
为了解决最小化目标函数的训练问题,采用交替梯度下降方法,该方法迭代地分别更新
Figure FDA0003627680100000045
和uj(t)的参数,在第q次迭代中,有:
Figure FDA0003627680100000046
Figure FDA0003627680100000047
其中,ηf和ηu为学习率,
给定通过训练数据集计算得到的
Figure FDA0003627680100000048
公式(13)(14)具体写为:
Figure FDA0003627680100000049
Figure FDA00036276801000000410
代入公式(12),得到:
Figure FDA00036276801000000411
Figure FDA00036276801000000412
计算得到学习率ηf=ηu=1,因此,对于给定的训练集,
Figure FDA00036276801000000413
和uj(t)使用下式迭代更新;所述训练集为交通速度时间序列:
Figure FDA0003627680100000051
Figure FDA0003627680100000052
即在第q次迭代中,以
Figure FDA0003627680100000053
作为输入,
Figure FDA0003627680100000054
作为标签使用反向传播算法来推断
Figure FDA0003627680100000055
在第q次迭代中的参数,其中,
Figure FDA0003627680100000056
为在第q-1次迭代中推断得到的uj(t)的参数定义下的uj(t),式(19)同理。
CN201811573928.3A 2018-12-21 2018-12-21 基于深度模糊认知图模型的道路交通可解释预测方法 Active CN109492760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811573928.3A CN109492760B (zh) 2018-12-21 2018-12-21 基于深度模糊认知图模型的道路交通可解释预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811573928.3A CN109492760B (zh) 2018-12-21 2018-12-21 基于深度模糊认知图模型的道路交通可解释预测方法

Publications (2)

Publication Number Publication Date
CN109492760A CN109492760A (zh) 2019-03-19
CN109492760B true CN109492760B (zh) 2022-06-14

Family

ID=65711343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811573928.3A Active CN109492760B (zh) 2018-12-21 2018-12-21 基于深度模糊认知图模型的道路交通可解释预测方法

Country Status (1)

Country Link
CN (1) CN109492760B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197031B (zh) * 2019-05-29 2021-03-26 北京化工大学 一种用于高密度聚乙烯串级聚合反应的软测量方法
CN110222822B (zh) * 2019-05-31 2021-04-09 北京工业大学 黑盒预测模型内部特征因果图的构建方法
CN111401605B (zh) * 2020-02-17 2023-05-02 北京石油化工学院 大气污染的可解释预测方法
CN111401559B (zh) * 2020-02-17 2023-05-05 北京石油化工学院 雾霾形成的模糊认知图及其多维时间序列挖掘方法
CN111832707A (zh) * 2020-07-17 2020-10-27 平安科技(深圳)有限公司 深度神经网络的解释方法、装置、终端及存储介质
CN113866391B (zh) * 2021-09-29 2024-03-08 天津师范大学 深度学习模型预测因素解释方法及其在土壤含水量预测中的应用
CN114071549A (zh) * 2021-11-16 2022-02-18 山东师范大学 基于多储层模糊认知图的5g基站簇kpi预测方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180285769A1 (en) * 2017-03-31 2018-10-04 Business Objects Software Ltd. Artificial immune system for fuzzy cognitive map learning
CN107563096B (zh) * 2017-09-23 2020-12-01 中电科新型智慧城市研究院有限公司 一种基于fcm的内涝建模分析方法
CN108510060A (zh) * 2018-03-12 2018-09-07 华南理工大学 一种基于模糊神经网络的区间二型模糊认知图模型
CN108764577A (zh) * 2018-05-31 2018-11-06 山东师范大学 基于动态模糊认知图的在线时间序列预测方法

Also Published As

Publication number Publication date
CN109492760A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
CN109492760B (zh) 基于深度模糊认知图模型的道路交通可解释预测方法
CN111832814B (zh) 一种基于图注意力机制的空气污染物浓度预测方法
CN111798051B (zh) 基于长短期记忆神经网络的空气质量时空预测方法
CN111899510B (zh) 基于发散卷积和gat的智能交通系统流量短期预测方法及系统
Zeinalnezhad et al. Air pollution prediction using semi-experimental regression model and Adaptive Neuro-Fuzzy Inference System
CN107909206B (zh) 一种基于深层结构循环神经网络的pm2.5预测方法
Loy-Benitez et al. Soft sensor validation for monitoring and resilient control of sequential subway indoor air quality through memory-gated recurrent neural networks-based autoencoders
Wang et al. Pan evaporation modeling using four different heuristic approaches
CN112085163A (zh) 一种基于注意力增强图卷积神经网络agc和门控循环单元gru的空气质量预测方法
Harrou et al. Detecting abnormal ozone measurements with a deep learning-based strategy
Xing et al. PM2. 5 concentration modeling and prediction by using temperature-based deep belief network
Das et al. Bayesian Network based modeling of regional rainfall from multiple local meteorological drivers
Kisi et al. Fuzzy genetic approach for estimating reference evapotranspiration of Turkey: Mediterranean region
Oprea et al. A comparative study of computational intelligence techniques applied to PM2. 5 air pollution forecasting
Ao et al. Hybrid model of air quality prediction using k-means clustering and deep neural network
Liu et al. Air Quality Index Forecasting via Genetic Algorithm-Based Improved Extreme Learning Machine
Kocjančič et al. Modelling of the river flowrate: the influence of the training set selection
Jiang et al. Long Short-Term Memory based PM2. 5 Concentration Prediction Method
Su et al. Effective PM2. 5 concentration forecasting based on multiple spatial–temporal GNN for areas without monitoring stations
CN113379148A (zh) 基于多种机器学习算法融合的污染物浓度反演方法
Moursi et al. PM2. 5 concentration prediction for air pollution using machine learning algorithms
Ghorbani et al. Sediment load estimation by MLR, ANN, NF and sediment rating curve (SRC) in Rio Chama river
Liu et al. Improvement of AI forecast of gridded PM2. 5 forecast in China through ConvLSTM and Attention
Lian et al. Single Pollutant Prediction Approach by Fusing MLSTM and CNN
Arampongsanuwat et al. Pm10 prediction model by support vector regression based on particle swarm optimization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant