CN109492760A - 基于深度模糊认知图模型的可解释预测方法 - Google Patents

基于深度模糊认知图模型的可解释预测方法 Download PDF

Info

Publication number
CN109492760A
CN109492760A CN201811573928.3A CN201811573928A CN109492760A CN 109492760 A CN109492760 A CN 109492760A CN 201811573928 A CN201811573928 A CN 201811573928A CN 109492760 A CN109492760 A CN 109492760A
Authority
CN
China
Prior art keywords
node
causality
model
function
influence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811573928.3A
Other languages
English (en)
Other versions
CN109492760B (zh
Inventor
王晓达
李超
王静远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201811573928.3A priority Critical patent/CN109492760B/zh
Publication of CN109492760A publication Critical patent/CN109492760A/zh
Application granted granted Critical
Publication of CN109492760B publication Critical patent/CN109492760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/043Architecture, e.g. interconnection topology based on fuzzy logic, fuzzy membership or fuzzy inference, e.g. adaptive neuro-fuzzy inference systems [ANFIS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • Computational Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Neurology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于深度模糊认知图模型的可解释预测方法,将深度学习模型和FCM模型相结合,以非线性函数取代FCM中概念间的线性关系模型,以达到更好的预测性能;将两个概念间的因果关系建模为和系统当前各概念的输入状态相关,以建模概念间的动态因果关系;将影响系统的外部因素以附加的形式加入模型,以消除外部因素对系统的干扰,使模型可以得到准确的结果。

Description

基于深度模糊认知图模型的可解释预测方法
技术领域
本发明涉及模糊决策和深度学习技术领域,更具体的说是涉及一种基于深度模糊认知图模型的可解释预测方法。
背景技术
在模糊决策领域,智能系统的知识表示和因果关系推断方法是其研究中的一个关键问题。其致力于为预测问题提供人类可以理解的解释和因果关系。
在现有技术中,模糊认知图模型(FCM)是一个解决可解释知识表示和因果分析问题的灵活而有效的方法。但是FCM模型具有一些局限性:
FCM模型只能建模概念间的线性的关系。因此其虽然具有很好的可解释性能,但却难以建模现实世界中复杂的非线性关系,在预测性能上表现欠佳。
FCM模型中建模的关系是静态的。因此其隐含了特定概念对输出的影响力是恒定的的假设,而现实中某特定概念对输出的影响力往往和其他概念相关:如某个人体重指标对健康程度的影响力可能与这个人的年龄相关。
FCM模型要求模型构成一个封闭的系统。这就意味着影响系统的所有因素都应当被包含在系统内部,一旦有系统外的因素对系统的预测产生了影响,由FCM模型得到的结果将是不准确的。
因此,在保持FCM优秀的可解释能力和因果分析能力的同时,克服FCM模型的局限性是模糊系统技术领域亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种基于深度模糊认知图模型的可解释预测方法,弥补了FCM模型非线性关系建模能力薄弱、建模后关系是静态的以及只能建立在封闭系统纸上的局限,引入深度学习网络使得模型的非线性建模能力得到很大提高,同时提供了研究节点间因果关系影响力动态变化的手段,并且通过引入外部因素使模型可以应用于开放系统。
为了实现上述目的,本发明采用如下技术方案:
一种基于深度模糊认知图模型的可解释预测方法,包括:
S1:构建深度模糊认知图像模型:
其中,为系统t+1时刻各要素的状态值,为各要素节点与节点cj的非线性因果关系函数,该函数中的参数为当前时刻下系统中所有节点的状态值构成的向量,uj(t)用于建模与时间有关的外部因素对系统中要素节点状态值的影响函数,
S2:利用深度神经网络来建模非线性因果关系函数
定义是一个具有K层隐藏层的神经网络,其中,第k层具有Mk个神经元,在t时刻,第k层的第m个神经元的输出通过下式计算:
其中,v(nm,k)是第k-1层的第n个神经元与第k层的第m个神经元之间的神经网络连接参数,ReLU(·)是线性整流单元激活函数,定义为:
表示的神经网络的输入层,令作为神经网络的输入,即则以节点cj为例,在输出层可以计算其t+1时刻的预测值:
S3:利用循环神经网络建模外部因素对内部节点cj影响的函数uj(t):
uj(t)=RNN(t,mod(t,τ),uj(t-1)) (5)
其包含三部分输入:当前时间戳t、周期τ下的周期时间戳和历史外部因素状态uj(t-1);
S4:对步骤S2中建模的非线性因果关系函数进行因果度量:具体包括:对随着节点ck的激活强度ak变化的节点ci对节点cj的因果强度wij(ak)以及ci对cj的整体因果强度进行度量;
对给定的系统状态因果性被度量为:
其中,表示中除了ai以外的其他各节点的状态值向量,rij的含义为:在给定的系统状态下,ai增大极端小量Δai导致的的增大量;
为了研究因果关系随某个节点ck的状态值的变化,需要消除节点ck以外的其他节点对因果关系的影响,进而得到受节点ck的状态值变化影响的节点ci对节点cj的因果影响力贡献函数:
其中,为除ck外的其他节点当前激活状态值向量为时的概率密度函数值,然后使用对因果关系积分来消除ck外的其他节点对节点ci对节点cj的因果关系的影响;
同理,还可以对节点ci对节点cj的整体因果关系进行建模,得到建立在所有可能的系统状态值之上的节点ci对节点cj的因果关系:
在实际应用中,对处于小区间[α,β]上的ak,假设有M个样本落在这个区间上,根据大数定律,可以得到:
使用双曲正切函数进行规范化:
其中,wij(ak)表示经过规范化的受节点ck的状态值变化影响的节点ci对节点cj的因果影响力贡献函数,表示经过规范化的建立在所有可能的系统状态值之上的节点ci对节点cj的因果影响力贡献,其中,Tanh(·)为:
S5:基于交替梯度下降方法对步骤S2中深度神经网络和步骤S3中循环神经网络中的参数进行参数推断,得到推断出来的深度模糊认知图像模型;
S6:利用推断出来的深度模糊认知图像模型进行预测和因果分析。
优选的,在步骤S3中,采用长短期记忆网络进行实现。
优选的,步骤S5具体包括:
对节点cj,假设其最初始的时间序列为对于其对应的激活状态值被定义为:
其中,μj和σj分别为向量的均值和标准差,
由公式(1)和(10),得到:
其中,θf和θu分别为神经网络和uj(t)的参数,为了推断θf和θu,需要最小化目标函数:
为了解决最小化目标函数的训练问题,提出一种交替梯度下降方法,该方法迭代地分别更新和uj(t)的参数,在第q次迭代中,有:
其中,ηf和ηu为学习率,
给定通过训练数据集计算得到的公式(13)(14)具体写为:
代入公式(12),得到:
计算得到学习率ηf=ηu=1,因此,对于给定的训练集,和uj(t)使用下式迭代更新:
即在第q次迭代中,以作为输入,作为标签使用反向传播算法来推断在第q次迭代中的参数,其中,为在第q-1次迭代中推断得到的uj(t)的参数定义下的uj(t),式(19)同理。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于深度模糊认知图模型的可解释预测方法,将深度学习模型和FCM模型相结合,以非线性函数取代FCM中概念间的线性关系模型,以达到更好的预测性能;将两个概念间的因果关系建模为和系统当前各概念的输入状态相关,以建模概念间的动态因果关系;将影响系统的外部因素以附加的形式加入模型,以消除外部因素对系统的干扰,使模型可以得到准确的结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明提供的基于深度模糊认知图模型的可解释预测方法的流程图;
图2为本发明提供的基本FCM模型和深度FCM模型的对比示意图;
图3为本发明提供的北京市海淀区学院路上的六个路段的示意图;
图4为本发明提供的基础模糊认知图模型与深度模糊认知图模型的实验结果对比图一;
图5为本发明提供的基础模糊认知图模型与深度模糊认知图模型的实验结果对比图二;
图6为本发明提供的基础模糊认知图模型与深度模糊认知图模型的实验结果对比图三;
图7为本发明提供的Y型结构的示意图;
图8为本发明提供的气象指标对空气污染物中臭氧指标的影响力随气象指标的两种模型变化曲线对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合各个步骤对发明的技术方案做详细说明。
1.1建模非线性影响
基础的模糊认知图(FCM)模型由节点、节点的激活程度和因果关系三部分组成。给定具有I个节点的系统,FCM模型可以被表示为一个有向带权图:G(C,W),其中C={c1,...,ci,...,cI}为节点集,W∈RI×I为权重矩阵。
具体地,节点ci代表了复杂系统中的要素,节点的激活程度由时间序列表示,其中表示了t时刻系统中ci的动态状态值,而因果关系权重矩阵W中的值wij则表示了节点ci对节点cj的影响力大小。当wij>0时,表示节点ci状态的增加将导致节点cj的状态增加,即正因果关系;同理,当wij<0时存在负因果关系;而wij=0时则称两节点间不存在因果关系。模糊认知图模型认为系统的动态行为是由系统中各要素节点及其状态通过要素的相互作用而形成的,即系统t+1时刻各要素的状态值可通过因果关系与系统t时刻各要素的状态值得到:
以节点cj为例,其t+1时刻的状态值可通过因果关系权重矩阵W与系统t时刻各要素的状态值得到。其中,S(·)是变换函数,其作用是将输出变换到[0,1]。
模糊认知图模型的一个不足是其建模非线性关系的能力非常薄弱,严重降低了其预测性能。为了解决这一点,本发明尝试使用非线性函数代替各要素对节点cj的因果关系w*j。既增强了模糊认知图模型的非线性建模能力,也将因果关系建模为动态的系统,因果关系的大小受各节点状态值起伏的影响。然后通过在模型中引入外部变量来构建开放系统,以避免外部因素对系统中节点间关系的影响。在本发明中,同样以节点cj为例,其在系统t+1时刻的状态值可被表示为:
其中,为为各要素节点与节点cj的非线性因果关系函数。该函数中的参数为当前时刻下系统中所有节点的状态值构成的向量。uj(t)用于建模与时间有关的外部因素对系统中要素节点状态值的影响函数。显然,基本的模糊认知图模型是本发明的一个特殊情况。
当uj(t)=0并且wjj=1时,本发明提供的模型与基本的模糊认知图模型等价,请参见图2。
为了改进模糊认知图模型在建模非线性关系上的不足,本发明使用深度神经网络来建模非线性因果关系函数定义是一个具有K层隐藏层的神经网络,其中,第k层具有Mk个神经元。在t时刻,第k层的第m个神经元的输出可以通过下式计算:
其中,v(nm,k)是第k-1层的第n个神经元与第k层的第m个神经元之间的神经网络连接参数,ReLU(·)是线性整流单元激活函数,定义为:
使用ReLU(·)激活函数可以确保在初始状态a1=…=ai=…=aI=0时,以与基础模糊认知图模型保持一致。
表示的神经网络的输入层,令作为神经网络的输入,即则以节点cj为例,在输出层可以计算其t+1时刻的预测值:
1.2建模外部因素
在本发明中,uj(t)用于建模外部因素对节点cj的影响,外部因素是指对系统有影响但不能预先定义和直接测量的外源因素,因此这部分因素无法被基础的模糊认知图模型通过预定义为要素节点的方式进行描述。
在本发明中,根据公式(2),外部因素对系统中节点cj的影响可以通过下式间接度量:
即节点cj无法被系统的内部概念通过建模的部分。
本发明用于建模外部因素对内部节点cj影响的函数uj(t)使用循环神经网络(RNN,RecurrentNeuralNetwork)进行实现,其包含三部分输入:当前时间戳t、周期τ下的周期时间戳和历史外部因素状态uj(t-1)。具体实现方式为:
uj(t)=RNN(t,mod(t,τ),uj(t-1)) (7)
为了建模时间影响下的外部因素,本发明使用t作为输入。同时由于在很多应用场景下,外部因素具有很强的周期性,如一天、一星期、一个月等。因此本发明将周期时间戳同样作为输入。动态的外部因素影响通常还具有记忆性,因此,本发明使用循环神经网络来实现对外部因素的建模。在具体使用中,可以使用循环神经网络的改进版本:长短期记忆网络(LSTM,Long Short-Term Memory)进行实现。
1.3度量因果关系
在改进模糊认知图模型不足的同时,本发明希望保留模糊认知图模型在知识表示和因果关系推断上的卓越能力。在本发明中,节点ci对节点cj的因果影响力贡献rij被表达为当前系统状态的函数。对给定的系统状态因果性被度量为:
其中,表示中除了ai以外的其他各节点的状态值向量。类比于基础模糊认知图模型中的节点ci对节点cj的因果关系wij,rij的含义为:在给定的系统状态下,ai增大极端小量Δai导致的的增大量。
在实际的应用中,为了研究因果关系随某个节点ck的状态值的变化,需要消除节点ck以外的其他节点对因果关系的影响。进而得到受节点ck的状态值变化影响的节点ci对节点cj的因果影响力贡献函数:
其中,为除ck外的其他节点当前激活状态值向量为时的概率密度函数值。然后使用对因果关系积分来消除ck外的其他节点对节点ci对节点cj的因果关系的影响。
同理,本发明还可以对节点ci对节点cj的整体因果关系进行建模,得到建立在所有可能的系统状态值之上的节点ci对节点cj的因果关系:
在实际应用中,是不可知的。较为通常的做法是使用频率来近似概率密度函数。对处于小区间[α,β]上的ak,假设有M个样本落在这个区间上,根据大数定律,可以得到:
由于模糊认知图模型要求节点间的因果强度在[-1,1]之间,因此使用双曲正切函数进行规范化:其中,wij(ak)表示经过规范化的受节点ck的状态值变化影响的节点ci对节点cj的因果影响力贡献函数,表示经过规范化的建立在所有可能的系统状态值之上的节点ci对节点cj的因果影响力贡献,其中,Tanh(·)为:
至此可以得到经过规范后的随着节点ck的激活强度ak变化的节点ci对节点cj的因果强度wij(ak)以及经过规范后的节点ci对节点cj的整体因果强度
公式(8)中的偏导数可以通过链式法则逐层计算:
其中,
其中,为激活函数ReLU(·)的偏导,并且在输入层y(i,0)=ai,用这样的方式,就可以得到给定的系统状态下节点ci对节点cj的因果影响力贡献
1.4参数推断方法
在本发明中,公式(2)中的非线性函数均使用神经网络进行建模,为了通过训练数据推断神经网络中的参数,本发明提出了一种参数推断方法。
由于模糊认知图模型要求节点的激活程度在[0,1]区间内,因此本发明需要对训练数据集中各个要素节点的最初始时间序列进行预处理。对节点cj,假设其最初始的时间序列为对于其对应的激活状态值被定义为:
其中,μj和σj分别为向量的均值和标准差。
由公式(2)(14),本模型可以表示为:
其中,θf和θu分别为神经网络和uj(t)的参数。为了推断θf和θu,需要最小化目标函数:
为了解决最小化目标函数的训练问题,本发明提出了一种交替梯度下降方法(AFGD,AlternateFunctionGradientDescent)。该方法迭代地分别更新和uj(t)的参数。在第q次迭代中,有:
其中,ηf和ηu为学习率。
给定通过训练数据集计算得到的公式(17)(18)可以具体写为:
代入公式(16),得到:
可以计算得到学习率ηf=ηu=1。因此,对于给定的训练集,和uj(t)可使用下式迭代更新:
即在第q次迭代中,以作为输入,作为标签使用反向传播(BP,BackPropagation)算法来推断在第q次迭代中的参数。其中,为在第q-1次迭代中推断得到的uj(t)的参数定义下的uj(t)。式(23)同理。
至此,本发明通过训练数据推断神经网络中的参数,得到了本发明模型(公式(2))中用神经网络表示的非线性函数
下面结合具体实施例来进一步说明本发明的技术方案和优越性。
具体实施例一——道路交通系统
在道路交通速度预测问题上,使用了北京市海淀区学院路上的六个路段。如图3所示,R4、R5、R6为主路,R1、R2、R3为辅路,两个斜坡道将R3和R5、R5和R1连接在一起。
在本实施例中,将道路的路段(R1-R6)被建模为要素节点。如果两个路段通过斜坡道相连或直接相连,则在本发明提出的模型中为这两个路段建立连接。使用的数据集为这六条路段在2016年4月全月内每隔10分钟采集一次的交通速度时间序列。
对各路段原始交通速度时间序列的每个时间片上的速度,本实施例使用公式(14)进行标准化,得到每个要素节点的状态值时间序列。在建模过程中,ui(t)中使用的时间周期超参被设置为1天,即城市通勤的自然节律。在本实施例中,使用t时刻的系统状态来预测t+1时刻的系统状态。
在本实施例中比较了5种模型的预测性能。
DFCM-1L:用包含1个隐藏层的神经网络建模用包含1个隐藏层的神经网络建模ui(t)。
DFCM-3L:用包含3个隐藏层的神经网络建模用包含1个隐藏层的神经网络建模ui(t)。
fi-1L:用包含1个隐藏层的神经网络建模不建模ui(t)。
fi-3L:用包含3个隐藏层的神经网络建模不建模ui(t)。
FCM:基础的模糊认知图模型。
预测性能的评价指标选取了均方根误差(RMSE,RootMean Square Error)和平均绝对百分比误差(MAPE,MeanAbsolute Percentage Error)进行度量,实验结果如表1和表2。
表1交通预测的均方根误差(RMSE)指标
表2交通预测的平均绝对百分比误差(MAPE)指标
从预测性能上可以看出,使用本发明的模型在预测性能上较基础模糊认知图模型有极大的提高,证明非线性建模的引入极大的提高了建模非线性关系的能力。同时,引入外部因素的模型均比不引入外部因素的模型预测性能高不少,证明外部因素的引入可以极大的改善预测性能。最后,使用3个隐藏层建模较使用1个隐藏层建模在预测性能上有微弱的提高,证明深层结构在建模非线性关系上通常比浅层结构好,但更多的层将需要更多的计算复杂度和更高的过拟合风险。
本实施例使用方案中的度量因果关系方法对要素之间的因果关系进行了分析。
如图4~6所示,黑色虚线表示基础模糊认知图模型推断出来的因果关系,带圆标记的线表示本发明模型推断出来的因果关系。对标记为ak,wij的图片,其含义为:路段Ri速度对路段Rj速度预测的因果影响力随路段Rk速度变化的曲线。
图4显示了下游路段对其直接上游路段的因果影响力随下游路段交通速度的变化曲线。可以观察到随着下游路段道路速度的增加,下游路段对其直接上游路段的因果影响力变化不是单调的,而是先下降再升高。在研究中也观察到了这一现象,并对这一现象做出了解释:具有中等交通速度的路段通常比具有低速或高速的路段具有更弱的可预测性,这可能削弱其对上游路段的影响。
图5显示了下游路段对通过斜坡道连接的上游路段的因果影响力随下游路段交通速度的变化曲线。可以看出,通过斜坡道连接的下游路段对上游路段的影响力整体上小于直接连接的下游路段对上游路段的影响。并且在下游路段速度很低时,对上游路段的影响非常低,甚至为负。这可能是由于斜坡道的分流效果导致当下游路段速度很低时,车辆被分流进另一条道路,致使通过斜坡道连接的下游路段在拥堵时对上游道路影响力很低。
图6显示了Y型结构中的因果影响力变化曲线。Y型结构如图7所示,Y型结构是指:当沿着一条道路前行,可以选择继续直行或通过斜坡道前行时,当前道路、直行的下一条道路、斜坡道共同构成Y型结构。
图7显示了Y型结构中的阀现象,图7a为阀关闭的状态,即当斜坡下游道路拥堵时,上游路段也将被堵塞的状态。图7b为阀打开的状态,即当斜坡下游道路通畅时的道路状态。
图6观察了Y型结构中下游道路对其直接上游路段的因果影响力随Y型结构中由斜坡道连接到该上游道路的下游道路交通速度的变化曲线。可以观察到,在Y型结构中,下游道路对上游道路的影响具有阀现象,即当斜坡下游道路拥堵时,上游路段也将被堵塞(如图7a),导致直接下游道路不再影响上游道路。相反,当斜坡下游道路通畅时,直接下游道路对上游道路的影响将被恢复。
相较于基础模糊认知图得到的因果关系分析,使用本发明的模型得到的各个道路之间的影响整体上是正向影响。由于这六个路段速度之间具有很强的相关关系,得到这样的结果是满足人们预期的。而基础模糊认知图模型得到的因果关系却出现了两个路段速度的强负相关关系。这也进一步证明了基本模糊认知图模型由于不能捕捉现实系统中复杂的非线性关系而可能得到错误的因果关系分析结果。
具体实施例二——空气污染系统
在空气污染系统污染指标预测问题上,使用了北京市的气象和大气污染物系统收集到的数据来验证本发明模型的效果。
在本实验例中,将空气污染物指标(PM2.5、O3、SO2、CO和NO2)和气象因素(温度、湿度、压强和风速)指标建模为要素节点。在预测气象因素指标时,由于气象因素指标对气象因素指标应当具有相关影响,空气污染物指标对气象因素则没有影响,因此,只在气象因素与气象因素之间建立连接。在预测空气污染物指标时,气象因素和空气污染物指标应当都对其有影响,因此均建立连接。使用的数据集为2017年2月至2018年2月全年在北京的两个气象站采集到的气象和污染物数据。时间序列数据的采集时间间隔为1小时。
本实验例对时间序列的每个时间片上的指标,使用公式(14)进行标准化,得到每个要素节点的状态值时间序列。在建模过程中,ui(t)中使用的时间周期超参被设置为1天。在本实验例中,使用t时刻的系统状态来预测t+1时刻的系统状态。
在本实验例中比较了5种模型的预测性能。
DFCM-1L:用包含1个隐藏层的神经网络建模用包含1个隐藏层的神经网络建模ui(t)。
DFCM-3L:用包含3个隐藏层的神经网络建模用包含1个隐藏层的神经网络建模ui(t)。
fi-1L:用包含1个隐藏层的神经网络建模不建模ui(t)。
fi-3L:用包含3个隐藏层的神经网络建模不建模ui(t)。
FCM:基础的模糊认知图模型。
预测性能的评价指标选取了均方根误差(RMSE,Root Mean Square Error)和平均绝对百分比误差(MAPE,MeanAbsolute Percentage Error)进行度量,实验结果如表3和表4。
表3空气污染预测的均方根误差(RMSE)指标
表4空气污染预测的平均绝对百分比误差(MAPE)指标
本实验例使用方案中的度量因果关系方法对要素之间的因果关系进行了分析。如图8所示,黑色虚线表示基础模糊认知图模型推断出来的因果关系,带圆标记的线表示本发明模型推断出来的因果关系。对标记为ak,wij的图片,其含义为:路段Ri速度对路段Rj速度预测的因果影响力随路段Rk速度变化的曲线。
图8显示了气象指标对空气污染物中臭氧指标的影响力随气象指标的变化曲线。对于大部分的空气污染物指标来说,高气压将导致空气流向周围地区,而带走污染物,因此气压对污染物有负面影响;高湿度通常对应于降水天气,可以冲走空气中的污染物,因此湿度对污染物也有负面影响;风可以吹走污染物,所以风速对污染物也是负面影响;温度和污染物之间的关系是间接的,人们冬天燃烧化石燃料进行取暖,导致在低温天气污染物增加。同理,气压和湿度对臭氧指标的影响也是负面影响,但是,由于臭氧指标的特殊性,在很多研究中,都证明高温能够促进臭氧的产生,因此温度指标对抽样指标具有正面影响,并且在风速对臭氧影响的研究中,普遍结论是当风速不是很高时,气流可以吹走臭氧,从而降低臭氧浓度,而当风速提高时会降低大气边界层的稳定性,导致臭氧从上层侵入到表层,增加表层的臭氧浓度,风速过高时,风的弥散作用将超过侵入作用。在本实验例中,可以同样发现这样的模式:温度对臭氧具有正向影响,压强和湿度对臭氧具有负向影响,而当风速较低时,风速对臭氧的影响为负向,随着风速的提高,变为正向影响,而风速过高时,由于风弥散作用超过侵入作用导致再度变为负向影响。本实验例发现的规律与相关气象研究的结论一致。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (3)

1.一种基于深度模糊认知图模型的可解释预测方法,其特征在于,包括:
S1:构建深度模糊认知图像模型:
其中,为系统t+1时刻各要素的状态值,为各要素节点与节点cj的非线性因果关系函数,该函数中的参数为当前时刻下系统中所有节点的状态值构成的向量,uj(t)用于建模与时间有关的外部因素对系统中要素节点状态值的影响函数;
S2:利用深度神经网络来建模非线性因果关系函数
定义是一个具有K层隐藏层的神经网络,其中,第k层具有Mk个神经元,在t时刻,第k层的第m个神经元的输出通过下式计算:
其中,v(nm,k)是第k-1层的第n个神经元与第k层的第m个神经元之间的神经网络连接参数,ReLU(·)是线性整流单元激活函数,定义为:
表示的神经网络的输入层,令作为神经网络的输入,即则以节点cj为例,在输出层可以计算其t+1时刻的预测值:
S3:利用循环神经网络建模外部因素对内部节点cj影响的函数uj(t):
uj(t)=RNN(t,mod(t,τ),uj(t-1)) (5)
其包含三部分输入:当前时间戳t、周期τ下的周期时间戳和历史外部因素状态uj(t-1);
S4:对步骤S2中建模的非线性因果关系函数进行因果度量,具体包括:对随着节点ck的激活强度ak变化的节点ci对节点cj的因果强度wij(ak)以及ci对cj的整体因果强度进行度量;
对给定的系统状态因果性被度量为:
其中,表示中除了ai以外的其他各节点的状态值向量,rij的含义为:在给定的系统状态下,ai增大极端小量Δai导致的的增大量;
为了研究因果关系随某个节点ck的状态值的变化,需要消除节点ck以外的其他节点对因果关系的影响,进而得到受节点ck的状态值变化影响的节点ci对节点cj的因果影响力贡献函数:
其中,为除ck外的其他节点当前激活状态值向量为时的概率密度函数值,然后使用对因果关系积分来消除ck外的其他节点对节点ci对节点cj的因果关系的影响;
同理,还可以对节点ci对节点cj的整体因果关系进行建模,得到建立在所有可能的系统状态值之上的节点ci对节点cj的因果关系:
在实际应用中,对处于小区间[α,β]上的ak,假设有M个样本落在这个区间上,根据大数定律,可以得到:
使用双曲正切函数进行规范化:
其中,wij(ak)表示经过规范化的受节点ck的状态值变化影响的节点ci对节点cj的因果影响力贡献函数,表示经过规范化的建立在所有可能的系统状态值之上的节点ci对节点cj的因果影响力贡献,其中,Tanh(·)为:
S5:基于交替梯度下降方法对步骤S2中深度神经网络和步骤S3中循环神经网络中的参数进行参数推断,得到推断出来的深度模糊认知图像模型;
S6:利用推断出来的深度模糊认知图像模型进行预测和因果分析。
2.根据权利要求1所述的一种基于深度模糊认知图模型的可解释预测方法,其特征在于,在步骤S3中,采用长短期记忆网络进行实现。
3.根据权利要求1所述的一种基于深度模糊认知图模型的可解释预测方法,其特征在于,步骤S5具体包括:
对节点cj,假设其最初始的时间序列为对于其对应的激活状态值被定义为:
其中,μj和σj分别为向量的均值和标准差,
由公式(1)和(10),得到:
其中,θf和θu分别为神经网络和uj(t)的参数,为了推断θf和θu,需要最小化目标函数:
为了解决最小化目标函数的训练问题,采用交替梯度下降方法,该方法迭代地分别更新和uj(t)的参数,在第q次迭代中,有:
其中,ηf和ηu为学习率,
给定通过训练数据集计算得到的公式(13)(14)具体写为:
代入公式(12),得到:
计算得到学习率ηf=ηu=1,因此,对于给定的训练集,和uj(t)使用下式迭代更新:
即在第q次迭代中,以作为输入,作为标签使用反向传播算法来推断在第q次迭代中的参数,其中,为在第q-1次迭代中推断得到的uj(t)的参数定义下的uj(t),式(19)同理。
CN201811573928.3A 2018-12-21 2018-12-21 基于深度模糊认知图模型的道路交通可解释预测方法 Active CN109492760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811573928.3A CN109492760B (zh) 2018-12-21 2018-12-21 基于深度模糊认知图模型的道路交通可解释预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811573928.3A CN109492760B (zh) 2018-12-21 2018-12-21 基于深度模糊认知图模型的道路交通可解释预测方法

Publications (2)

Publication Number Publication Date
CN109492760A true CN109492760A (zh) 2019-03-19
CN109492760B CN109492760B (zh) 2022-06-14

Family

ID=65711343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811573928.3A Active CN109492760B (zh) 2018-12-21 2018-12-21 基于深度模糊认知图模型的道路交通可解释预测方法

Country Status (1)

Country Link
CN (1) CN109492760B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197031A (zh) * 2019-05-29 2019-09-03 北京化工大学 一种用于高密度聚乙烯串级聚合反应的软测量方法
CN110222822A (zh) * 2019-05-31 2019-09-10 北京工业大学 黑盒预测模型内部特征因果图的构建方法
CN111401605A (zh) * 2020-02-17 2020-07-10 北京石油化工学院 大气污染的可解释预测方法
CN111401559A (zh) * 2020-02-17 2020-07-10 北京石油化工学院 雾霾形成的模糊认知图及其多维时间序列挖掘方法
WO2021135546A1 (zh) * 2020-07-17 2021-07-08 平安科技(深圳)有限公司 深度神经网络的解释方法、装置、终端及存储介质
CN113866391A (zh) * 2021-09-29 2021-12-31 天津师范大学 深度学习模型预测因素解释方法及其在土壤含水量预测中的应用
CN114071549A (zh) * 2021-11-16 2022-02-18 山东师范大学 基于多储层模糊认知图的5g基站簇kpi预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563096A (zh) * 2017-09-23 2018-01-09 中电科新型智慧城市研究院有限公司 一种基于fcm的内涝建模分析方法
CN108510060A (zh) * 2018-03-12 2018-09-07 华南理工大学 一种基于模糊神经网络的区间二型模糊认知图模型
US20180285769A1 (en) * 2017-03-31 2018-10-04 Business Objects Software Ltd. Artificial immune system for fuzzy cognitive map learning
CN108764577A (zh) * 2018-05-31 2018-11-06 山东师范大学 基于动态模糊认知图的在线时间序列预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180285769A1 (en) * 2017-03-31 2018-10-04 Business Objects Software Ltd. Artificial immune system for fuzzy cognitive map learning
CN107563096A (zh) * 2017-09-23 2018-01-09 中电科新型智慧城市研究院有限公司 一种基于fcm的内涝建模分析方法
CN108510060A (zh) * 2018-03-12 2018-09-07 华南理工大学 一种基于模糊神经网络的区间二型模糊认知图模型
CN108764577A (zh) * 2018-05-31 2018-11-06 山东师范大学 基于动态模糊认知图的在线时间序列预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
骆祥峰等: "概率模糊认知图", 《中国科学技术大学学报》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197031A (zh) * 2019-05-29 2019-09-03 北京化工大学 一种用于高密度聚乙烯串级聚合反应的软测量方法
CN110222822A (zh) * 2019-05-31 2019-09-10 北京工业大学 黑盒预测模型内部特征因果图的构建方法
CN111401605A (zh) * 2020-02-17 2020-07-10 北京石油化工学院 大气污染的可解释预测方法
CN111401559A (zh) * 2020-02-17 2020-07-10 北京石油化工学院 雾霾形成的模糊认知图及其多维时间序列挖掘方法
CN111401605B (zh) * 2020-02-17 2023-05-02 北京石油化工学院 大气污染的可解释预测方法
CN111401559B (zh) * 2020-02-17 2023-05-05 北京石油化工学院 雾霾形成的模糊认知图及其多维时间序列挖掘方法
WO2021135546A1 (zh) * 2020-07-17 2021-07-08 平安科技(深圳)有限公司 深度神经网络的解释方法、装置、终端及存储介质
CN113866391A (zh) * 2021-09-29 2021-12-31 天津师范大学 深度学习模型预测因素解释方法及其在土壤含水量预测中的应用
CN113866391B (zh) * 2021-09-29 2024-03-08 天津师范大学 深度学习模型预测因素解释方法及其在土壤含水量预测中的应用
CN114071549A (zh) * 2021-11-16 2022-02-18 山东师范大学 基于多储层模糊认知图的5g基站簇kpi预测方法及系统

Also Published As

Publication number Publication date
CN109492760B (zh) 2022-06-14

Similar Documents

Publication Publication Date Title
CN109492760A (zh) 基于深度模糊认知图模型的可解释预测方法
Zeinalnezhad et al. Air pollution prediction using semi-experimental regression model and Adaptive Neuro-Fuzzy Inference System
CN112085163A (zh) 一种基于注意力增强图卷积神经网络agc和门控循环单元gru的空气质量预测方法
CN108426812B (zh) 一种基于记忆神经网络的pm2.5浓度值预测方法
CN107909206B (zh) 一种基于深层结构循环神经网络的pm2.5预测方法
Asklany et al. Rainfall events prediction using rule-based fuzzy inference system
Xing et al. PM2. 5 concentration modeling and prediction by using temperature-based deep belief network
CN109165690A (zh) 一种城市路网尾气污染分布预测的方法及系统
CN109613178A (zh) 一种基于递归神经网络预测空气污染的方法及系统
CN109214570A (zh) 一种基于深度时空修正模型的城市区域尾气污染预测方法
CN113011455B (zh) 一种空气质量预测svm模型构建方法
CN111582541A (zh) 一种基于萤火虫算法的内涝模型预测方法
Zhang et al. Prediction of urban pm 2.5 concentration based on wavelet neural network
Oprea et al. A comparative study of computational intelligence techniques applied to PM2. 5 air pollution forecasting
CN109615147A (zh) 一种未来72小时大气污染预报预警方法
Zito et al. Predicting Real-Time Roadside CO and $\hbox {NO} _ {2} $ Concentrations Using Neural Networks
CN115656446A (zh) 一种基于物联网的空气质量检测系统及方法
Chowdhury et al. Application of data mining techniques on air pollution of Dhaka city
Jiang et al. Long Short-Term Memory based PM2. 5 Concentration Prediction Method
CN112862084B (zh) 基于深度迁移融合学习的交通流量预测方法
Ghorbani et al. Sediment load estimation by MLR, ANN, NF and sediment rating curve (SRC) in Rio Chama river
El Ibrahimi et al. Application of Neural Modeling and the SPI Index for the Prediction of Weather Drought in the Saïss Plain (Northern Morocco).
Kaur et al. Air pollution detection using modified traingularmutation based particle swarm optimization
Sahoo et al. Application of hybrid MLP-GWO for monthly rainfall forecasting in Cachar, Assam: a case study
Chen et al. Prediction of PM2. 5 concentration in Guangzhou based on LSTM neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant