CN114090651A - 基于双通道图神经网络自编码器的交通流异常数据判断方法 - Google Patents

基于双通道图神经网络自编码器的交通流异常数据判断方法 Download PDF

Info

Publication number
CN114090651A
CN114090651A CN202111328844.5A CN202111328844A CN114090651A CN 114090651 A CN114090651 A CN 114090651A CN 202111328844 A CN202111328844 A CN 202111328844A CN 114090651 A CN114090651 A CN 114090651A
Authority
CN
China
Prior art keywords
matrix
data
traffic flow
feature
traffic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111328844.5A
Other languages
English (en)
Other versions
CN114090651B (zh
Inventor
张硕
黄荷姣
顾崇林
陈锦毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN202111328844.5A priority Critical patent/CN114090651B/zh
Publication of CN114090651A publication Critical patent/CN114090651A/zh
Application granted granted Critical
Publication of CN114090651B publication Critical patent/CN114090651B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Remote Sensing (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于双通道图神经网络自编码器的交通流异常数据判断方法,包括依次执行以下步骤:数据预处理步骤:根据交通传感器所在道路的交通情况和历史采集数据分别计算出拓扑邻接矩阵和特征邻接矩阵,作为线下训练步骤和线上监测部步骤的双通道图卷积神经的输入,另外将不同交通传感器的历史数据使用滑动窗口切割成相同时间长度的时间窗,生成特征矩阵后输入给线下训练步骤使用;线下训练步骤;线上监测步骤。本发明的有益效果是:通过本发明交通流异常数据判断方法,不仅可以同时捕捉到同一传感器不同时间数据间的时间依赖性和不同传感器的非欧式空间的空间依赖性,还能更有效地提取到交通流数据的多重深层次特征,另外,可解决交通场景下训练阶段异常样本缺少的问题。

Description

基于双通道图神经网络自编码器的交通流异常数据判断方法
技术领域
本发明涉及大数据技术领域,尤其涉及基于双通道图神经网络自编码器的交通流异常数据判断方法。
背景技术
近些年来,伴随着物联网相应技术的发展与成熟,智慧交通系统ITS(IntelligentTraffic System)逐渐成为未来交通系统的发展方向,它主要是在交通领域中充分运用物联网、云计算、人工智能、自动控制、移动互联网等技术,对交通管理、交通运输、公众出行等等交通领域全方面以及交通建设管理全过程进行管控支撑,使交通系统在区域、城市甚至更大的时空范围具备感知、互联、分析、预测、控制等能力,以充分保障交通安全、发挥交通基础设施效能、提升交通系统运行效率和管理水平,为通畅的公众出行和可持续的经济发展服务。
在ITS中,交通流数据的采集、监测和分析已成为基本且不可获取的一部分,为整个ITS的正常运行和决策提供了底层的支撑。然而,在大多数交通场景下,采集交通流数据的传感器所布设的环境是复杂多变的,众多外部影响因素极易导致传感器采集到的数据存在异常。倘若不能将这些异常数据识别出来,不仅会降低数据存储的可靠性,更会影响ITS的决策,因此在对这些交通流数据进行入库、分析前,需要对其中的异常数据进行识别。
然后,在ITS中传感器的布设的位置间呈非欧几里得空间分布,很难通过传统的神经网络算法(例如:全连接网络、卷积神经网络、循环神经网络等)进行交通流数据的异常识别。其次,而传统的图卷积神经网络则需要节点间邻接矩阵作为输入,不同于其他领域(例如:社交网络、通信网络等等),ITS中传感器间的邻接矩阵并不是先验知识,无法直接得到。
在当前的现实交通环境中,采集交通流数据的传感器(例如:地感线圈)的布设往往构成的是不具备规则的网络空间结构,所以由其采集的数据在空间依赖性上属于非欧式空间下,而传统的神经网络(例如:全连接网络、卷积神经网络、循环神经网络等)对这类非欧几里得数据的处理能力会大打折扣。近些年,为了解决上述提到的问题,学术界与工业界普遍倾向于采用图神经网络对非欧氏空间的数据进行建模并捕获数据间的内部依赖关系,它主要可以划分为五大类:图卷积网络(Graph Convolution Networks,GCN)、图注意力网络(Graph Attention Networks)、图自编码器(Graph Autoencoders)、图生成网络(GraphGenerative Networks)和图时空网络(Graph Spatial-temporal Networks)。
发明内容
本发明提供了一种基于双通道图神经网络自编码器的交通流异常数据判断方法,包括依次执行以下步骤:
数据预处理步骤:根据交通传感器所在道路的交通情况和历史采集数据分别计算出拓扑邻接矩阵At和特征邻接矩阵Af,作为线下训练步骤和线上监测部步骤的双通道图卷积神经的输入,另外将不同交通传感器的历史数据使用滑动窗口切割成相同时间长度的时间窗,生成特征矩阵X后输入给线下训练步骤使用。
线下训练步骤:输入同一段时间窗内、不同位置传感器测量的经由数据预处理步骤得到的特征矩阵X、拓扑临近矩阵At、特征邻接矩阵Af到双通道图卷积神经网络自编码器中,输出得到重构后的特征矩阵
Figure BDA0003347932850000021
然后计算X与
Figure BDA0003347932850000022
的损失函数,接下来重复上述操作进行多轮训练直到损失函数收敛后,保存网络结构与相关参数并计算出异常阈值,传递给线上监测步骤使用。另外,在线下训练步骤中,待训练数据中不需要含有异常数据。线上监测步骤:输入以当前待监测的时刻为起点,与线下训练步骤相同大小的时间窗长度的时间内、不同位置交通传感器测量的交通流数据经由数据预处理部分得到的特征矩阵X、拓扑临近矩阵At、特征邻接矩阵Af到线下训练步骤训练完的双通道图卷积神经网络自编码器中,输出得到重构后的特征矩阵X,然后计算X与
Figure BDA0003347932850000023
的MSE。
作为本发明的进一步改进,在所述数据预处理步骤中,计算拓扑邻接矩阵At的规则是:
倘若两个采集交通流数据的传感器部署在同一条道路上,则该两个传感器的拓扑邻接矩阵相应位置的值为1,否则为0,另外,传感器自映射位置的拓扑邻接矩阵的值也为1。
作为本发明的进一步改进,在所述数据预处理步骤中,计算特征邻接矩阵Af的方法是:
首先根据历史交通流数据计算不同传感器间的皮尔森系数,然后依照皮尔森系数的值构建这些传感器所对应的邻接矩阵与度矩阵。
作为本发明的进一步改进,在所述数据预处理步骤中,为了得到特征矩阵,需要使用长度与特征矩阵相同的滑动时间窗对所有不同传感器的交通流数据进行分割,滑动时间窗的滑动步大小为1,最后再将不同传感器的时间窗排列在不同行的位置,组织成特征矩阵。
作为本发明的进一步改进,在所述线下训练步骤中,具体还包括依次执行以下步骤:
编码器步骤:采用了基于双通道的图卷积神经网络,拓扑邻接矩阵At与特征矩阵X被输入到拓扑通道中提取特征,而特征邻接矩阵Af与特征矩阵X被输入到特征通道中提取特征,最后将两种特征输入到融合器中进行融合。
融合器步骤:将编码器中两个通道分别提取到的特征进行融合,然后输入给解码器。
解码器步骤:采用基本的卷积神经网络结构,通过对融合器步骤中得到的融合特征进行反卷积运算从而重构得到最初的特征矩阵。
作为本发明的进一步改进,在所述编码器步骤中,编码器中的双通道图卷积神经网络由三层网络堆叠而成每一层网络的输出均为下一层网络的输入,除最后一层外,第1层的输出Hl的计算公式为:
Figure BDA0003347932850000031
其中σ为激活函数,A为预处理部分得到的邻接矩阵(拓扑通道为拓扑邻接矩阵At,特征通道为特征邻接矩阵Af),D为对应邻接矩阵A的度矩阵,Hl-1为第l-1层的输出,Wl为第l层的权重参数矩阵,另外,第一层的输入H0为预处理阶段输出的特征矩阵X。
作为本发明的进一步改进,在所述融合器步骤中,采用哈达玛乘积融合的特征融合方法,具体如下:
假如拓扑通道提取到的特征为Za,特征通道提取到的特征为Zb,则融合后的特征Z=Za⊙Wa+Zb⊙Wb,其中⊙为哈达玛乘积运算,Wa、Wb为跟随整体网络一同训练的参数矩阵。
作为本发明的进一步改进,在所述解码器步骤中,解码器中的卷积神经网络由三层网络堆叠而成每一层网络的输出均为下一层网络的输入,除最后一层外,第l层的输出Hl的计算公式为:
Hl=σ(Hl-1*Wl),
其中σ为激活函数,*为卷积运算,Hl-1为第(l-1)层的输出,Wl为第l层的权重参数矩阵,是需要通过网络训练得到的,另外,第一层的输入H0为融合器输出的融合特征Z。
作为本发明的进一步改进,在所述线下训练步骤中,假设预处理得到的特征矩阵为X,经过编码器步骤、融合器步骤和解码器步骤运算后得到的重构的特征矩阵为
Figure BDA0003347932850000041
则整个线下训练步骤网络训练的损失函数
Figure BDA0003347932850000042
其中MSE为均方误差运算,当网络训练结束,损失函数L收敛时,即可计算异常阈值T输入给线上监测部分的异常判别器,计算公式为T=σ·l,其中σ为超参。
作为本发明的进一步改进,在所述线上监测步骤中,倘若
Figure BDA0003347932850000043
大于异常阈值T则证明当前待监测时刻的交通流数据为异常数据,否则为正常数据。
本发明的有益效果是:1.通过本发明交通流异常数据判断方法,不仅可以同时捕捉到同一传感器不同时间数据间的时间依赖性和不同传感器的非欧式空间的空间依赖性,而且基于交通场景下的预处理得到基于道路的拓扑邻接矩阵和基于历史数据的特征邻接矩阵同时作为双通道图卷积神经网络的输入,能更有效地提取到交通流数据的多重深层次特征,进而更加准确、快速地判断出交通流数据中的异常数据;2.还有个增益效果是:在训练时不需要异常数据作为样本,而在实际中异常数据的数量是很稀少的,因此非常贴合工程实践。
附图说明
图1是本发明交通流异常数据判断方法流程图;
图2是本发明交通流异常数据判断方法预处理流程图;
图3是本发明双通道图卷积神经网络结构图。
具体实施方式
本发明的交通流异常数据判断方法目的是在基本的图神经网络的基础上,结合交通领域的背景提出一种双通道图卷积神经网络自编码器,并利用其解决交通流数据异常判断的问题。
如图1所示,本发明公开的交通流异常数据判断方法采用的技术方案如下:
整体技术方案分为数据预处理步骤、线下训练步骤和线上监测步骤三部分。
数据预处理步骤:根据交通传感器所在道路的交通情况和历史采集数据分别计算出拓扑邻接矩阵(度矩阵)At和特征邻接矩阵(度矩阵)Af,作为线下训练和线上监测部分的双通道图卷积神经的输入。另外,还需将不同传感器的历史数据使用滑动窗口切割成相同时间长度的时间窗,生成特征矩阵X后输入给线下训练步骤使用。
线下训练步骤:需要输入同一段时间窗内、不同位置传感器测量的交通流数据经由数据预处理部分得到的特征矩阵X、拓扑临近矩阵(度矩阵)At、特征邻接矩阵(度矩阵)Af到双通道图卷积神经网络自编码器中,输出得到重构后的特征矩阵
Figure BDA0003347932850000051
然后计算X与
Figure BDA0003347932850000052
的损失函数。接下来重复上述操作进行多轮训练直到损失函数收敛后,保存网络结构与相关参数并计算出异常阈值,传递给线上监测步骤使用。另外,在线下训练步骤中,待训练数据中不需要含有异常数据。
线上监测步骤:需要输入以当前待监测的时刻为起点,与线下训练步骤相同大小的时间窗长度的时间内、不同位置传感器测量的交通流数据经由数据预处理部分得到的特征矩阵X、拓扑临近矩阵(度矩阵)At、特征邻接矩阵(度矩阵)Af到线下训练步骤训练完的双通道图卷积神经网络自编码器中,输出得到重构后的特征矩阵
Figure BDA0003347932850000054
然后计算X与
Figure BDA0003347932850000053
的MSE,假如MSE值大于异常阈值则证明当前待监测时刻的交通流数据为异常数据,否则为正常数据。
数据预处理步骤得到的拓扑邻接矩阵At、特征邻接矩阵Af和特征矩阵X作为线下训练步骤网络和线上监测步骤网络的共同输入。线下训练步骤训练完成后,不仅将最终得到的网络结构与参数与线上监测步骤共享使用,还需计算得到“异常阈值”输入给线下监测步骤的异常判别器,异常判别器根据“异常阈值”实时判断最新一组交通流数据中是否存在异常。
数据预处理步骤的作用主要有三个:一是根据具体的交通道路情况生成拓扑邻接矩阵和拓扑度矩阵;二是在历史交通流数据基础上计算得到特征邻接矩阵和特征度矩阵;三是将不同传感器的历史数据使用滑动窗口切割成相同时间长度的时间窗,进而得到特征矩阵。
1)根据具体的交通道路情况生成拓扑邻接矩阵At的规则是:倘若两个采集交通流数据的传感器部署在同一条道路上,则该两个传感器的拓扑邻接矩阵相应位置的值为1,否则为0。另外,某传感器自映射位置的拓扑邻接矩阵的值也为1。下面以图2中的例子说明:由于1号传感器与2号传感器不在同一条道路上,则拓扑邻接矩阵(1,2)位置的值为0;同理,由于1号传感器与3号传感器在同一条道路上,则拓扑邻接矩阵(1,3)位置的值为1;另外,1号传感器自映射位置(1,1)的拓扑邻接矩阵的值也为1。
2)计算特征邻接矩阵Af的方法是:根据历史交通流数据计算不同传感器间的皮尔森系数,然后依照皮尔森系数的值构建这些传感器所对应的邻接矩阵与度矩阵。
假设有两个交通流采集传感器i与j,则需要通过两者相同时间段T的历史数据DATAi和DATAj和计算其皮尔森系数Sij,计算方法为:
Figure BDA0003347932850000061
然后根据如下的公式获得监测设备i与j对应的特征邻接矩阵Aij,计算公式为:
Figure BDA0003347932850000062
进而可获得其对应的特征度矩阵Dij,其中ε为超参阈值。
3)为了得到特征矩阵X,需要使用长度与特征矩阵相同的滑动时间窗对所有不同传感器的交通流数据进行分割,滑动时间窗的滑动步大小为1。最后,再将不同传感器的时间窗排列在不同行的位置,组织成特征矩阵X。
线下训练步骤与线上监测步骤的网络结构相同,如图3所示。整个网络结构可以分为三部分:编码器,融合器与解码器,具体如下:
编码器步骤:主要采用了基于双通道的图卷积神经网络,两个通道的图神经网络的网络结构与计算方法完全相同。拓扑邻接矩阵At与特征矩阵X被输入到拓扑通道中提取特征,而特征邻接矩阵Af与特征矩阵X被输入到特征通道中提取特征,最后将两种特征输入到融合器中进行融合。编码器中的双通道图卷积神经网络由三层网络堆叠而成每一层网络的输出均为下一层网络的输入,除最后一层(全连接层)外,第l层的输出Hl的计算公式为:
Figure BDA0003347932850000063
其中σ为激活函数,A为预处理部分得到的邻接矩阵(拓扑通道为拓扑邻接矩阵At,特征通道为特征邻接矩阵Af),D为对应邻接矩阵A的度矩阵,Hl-1为第(l-1)层的输出,Wl为第l层的权重参数矩阵,是需要通过网络训练得到的。另外,第一层的输入H0为预处理阶段输出的特征矩阵X。
融合器步骤:融合器的作用是将编码器中两个通道分别提取到的特征进行融合,然后输入给解码器,本发明采用的特征融合方法是哈达玛乘积融合。假如拓扑通道提取到的特征为Za,特征通道提取到的特征为Zb,则融合后的特征Z=Za⊙Wa+Zb⊙Wb,其中⊙为哈达玛乘积运算,Wa、Wb为跟随整体网络一同训练的参数矩阵。
解码器步骤:主要采用了基本的卷积神经网络结构,目的是通过对融合特征进行反卷积运算从而重构得到最初的特征矩阵。解码器中的卷积神经网络由三层网络堆叠而成每一层网络的输出均为下一层网络的输入,除最后一层(全连接层)外,第l层的输出Hl的计算公式为:
Hl=σ(Hl-1*Wl),
其中σ为激活函数,*为卷积运算,Hl-1为第(l-1)层的输出,Wl为第l层的权重参数矩阵,是需要通过网络训练得到的。另外,第一层的输入H0为融合器输出的融合特征Z。
在线下训练步骤中,假设预处理得到的特征矩阵为X,经过编码器步骤、融合器步骤和解码器步骤运算后得到的重构的特征矩阵为
Figure BDA0003347932850000071
则整个线下训练步骤网络训练的损失函数
Figure BDA0003347932850000072
其中MSE为均方误差运算。当网络训练结束,损失函数L收敛时(假设最终的收敛值为l),即可计算异常阈值T输入给线上监测部分的异常判别器,计算公式为T=σ·l,其中σ为超参。
在线上监测步骤中,使用线下训练步骤最终训练好的网络对当前最新一组的实时交通流数据的特征矩阵X进行运算得到重构后的特征矩阵
Figure BDA0003347932850000073
最后计算、对比
Figure BDA0003347932850000074
与线下训练阶段得到的异常阈值T。倘若
Figure BDA0003347932850000075
大于T则正面最新一组的交通流数据中存在异常,否则为正常数据。
本发明的有益效果:通过本发明交通流异常数据判断方法,不仅可以同时捕捉到同一传感器不同时间数据间的时间依赖性和不同传感器的非欧式空间的空间依赖性,而且基于交通场景下的预处理得到基于道路的拓扑邻接矩阵和基于历史数据的特征邻接矩阵同时作为双通道图卷积神经网络的输入,能更有效地提取到交通流数据的多重深层次特征,进而更加准确、快速地判断出交通流数据中的异常数据。(还有个增益效果是,在训练时不需要异常数据作为样本,而在实际中异常数据的数量是很稀少的,因此非常贴合工程实践)
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种基于双通道图神经网络自编码器的交通流异常数据判断方法,其特征在于,包括依次执行以下步骤:
数据预处理步骤:根据交通传感器所在道路的交通情况和历史采集数据分别计算出拓扑邻接矩阵At和特征邻接矩阵Af,作为线下训练步骤和线上监测部步骤的双通道图卷积神经的输入,另外将不同交通传感器的历史数据使用滑动窗口切割成相同时间长度的时间窗,生成特征矩阵X后输入给线下训练步骤使用;
线下训练步骤:输入同一段时间窗内、不同位置传感器测量的经由数据预处理步骤得到的特征矩阵
Figure FDA0003347932840000011
拓扑临近矩阵At、特征邻接矩阵Af到双通道图卷积神经网络自编码器中,输出得到重构后的特征矩阵
Figure FDA0003347932840000012
然后计算X与
Figure FDA0003347932840000013
的损失函数,接下来重复上述操作进行多轮训练直到损失函数收敛后,保存网络结构与相关参数并计算出异常阈值,传递给线上监测步骤使用;
线上监测步骤:输入以当前待监测的时刻为起点,与线下训练步骤相同大小的时间窗长度的时间内、不同位置交通传感器测量的交通流数据经由数据预处理部分得到的特征矩阵X、拓扑临近矩阵At、特征邻接矩阵Af到线下训练步骤训练完的双通道图卷积神经网络自编码器中,输出得到重构后的特征矩阵
Figure FDA0003347932840000014
然后计算X与
Figure FDA0003347932840000015
的MSE。
2.根据权利要求1所述的交通流异常数据判断方法,其特征在于,在所述数据预处理步骤中,计算拓扑邻接矩阵At的规则是:
倘若两个采集交通流数据的传感器部署在同一条道路上,则该两个传感器的拓扑邻接矩阵相应位置的值为1,否则为0,另外,传感器自映射位置的拓扑邻接矩阵的值也为1。
3.根据权利要求1所述的交通流异常数据判断方法,其特征在于,在所述数据预处理步骤中,计算特征邻接矩阵Af的方法是:
首先根据历史交通流数据计算不同传感器间的皮尔森系数,然后依照皮尔森系数的值构建这些传感器所对应的邻接矩阵与度矩阵。
4.根据权利要求1所述的交通流异常数据判断方法,其特征在于,在所述数据预处理步骤中,为了得到特征矩阵,需要使用长度与特征矩阵相同的滑动时间窗对所有不同传感器的交通流数据进行分割,滑动时间窗的滑动步大小为1,最后再将不同传感器的时间窗排列在不同行的位置,组织成特征矩阵。
5.根据权利要求1所述的交通流异常数据判断方法,其特征在于,在所述线下训练步骤中,具体还包括依次执行以下步骤:
编码器步骤:采用了基于双通道的图卷积神经网络,拓扑邻接矩阵At与特征矩阵X被输入到拓扑通道中提取特征,而特征邻接矩阵Af与特征矩阵X被输入到特征通道中提取特征,最后将两种特征输入到融合器中进行融合;
融合器步骤:将编码器中两个通道分别提取到的特征进行融合,然后输入给解码器;
解码器步骤:采用基本的卷积神经网络结构,通过对融合器步骤中得到的融合特征进行反卷积运算从而重构得到最初的特征矩阵;
另外,在所述线下训练步骤中,待训练数据中不需要含有异常数据。
6.根据权利要求5所述的交通流异常数据判断方法,其特征在于,在所述编码器步骤中,编码器中的双通道图卷积神经网络由三层网络堆叠而成每一层网络的输出均为下一层网络的输入,除最后一层外,第l层的输出Hl的计算公式为:
Figure FDA0003347932840000021
其中σ为激活函数,A为预处理部分得到的邻接矩阵,拓扑通道为拓扑邻接矩阵At,特征通道为特征邻接矩阵Af,D为对应邻接矩阵A的度矩阵,Hl-1为第l-1层的输出,Wl为第l层的权重参数矩阵,另外,第一层的输入H0为预处理阶段输出的特征矩阵X。
7.根据权利要求5所述的交通流异常数据判断方法,其特征在于,在所述融合器步骤中,采用哈达玛乘积融合的特征融合方法,具体如下:
假如拓扑通道提取到的特征为Za,特征通道提取到的特征为Zb,则融合后的特征Z=Za⊙Wa+Zb⊙Wb,其中⊙为哈达玛乘积运算,Wa、Wb为跟随整体网络一同训练的参数矩阵。
8.根据权利要求5所述的交通流异常数据判断方法,其特征在于,在所述解码器步骤中,解码器中的卷积神经网络由三层网络堆叠而成每一层网络的输出均为下一层网络的输入,除最后一层外,第l层的输出Hl的计算公式为:
Hl=σ(Hl-1*Wl),
其中σ为激活函数,*为卷积运算,Hl-1为第(l-1)层的输出,Wl为第l层的权重参数矩阵,是需要通过网络训练得到的,另外,第一层的输入H0为融合器输出的融合特征Z。
9.根据权利要求5所述的交通流异常数据判断方法,其特征在于:在所述线下训练步骤中,假设预处理得到的特征矩阵为X,经过编码器步骤、融合器步骤和解码器步骤运算后得到的重构的特征矩阵为
Figure FDA0003347932840000031
则整个线下训练步骤网络训练的损失函数
Figure FDA0003347932840000032
其中MSE为均方误差运算,当网络训练结束,损失函数L收敛时,即可计算异常阈值T输入给线上监测部分的异常判别器,计算公式为T=σ·l,其中σ为超参。
10.根据权利要求1所述的交通流异常数据判断方法,其特征在于,在所述线上监测步骤中,倘若
Figure FDA0003347932840000033
大于异常阈值T则证明当前待监测时刻的交通流数据为异常数据,否则为正常数据。
CN202111328844.5A 2021-11-10 2021-11-10 基于双通道图神经网络自编码器的交通流异常数据判断方法 Active CN114090651B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111328844.5A CN114090651B (zh) 2021-11-10 2021-11-10 基于双通道图神经网络自编码器的交通流异常数据判断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111328844.5A CN114090651B (zh) 2021-11-10 2021-11-10 基于双通道图神经网络自编码器的交通流异常数据判断方法

Publications (2)

Publication Number Publication Date
CN114090651A true CN114090651A (zh) 2022-02-25
CN114090651B CN114090651B (zh) 2023-04-18

Family

ID=80299625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111328844.5A Active CN114090651B (zh) 2021-11-10 2021-11-10 基于双通道图神经网络自编码器的交通流异常数据判断方法

Country Status (1)

Country Link
CN (1) CN114090651B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647834A (zh) * 2018-05-24 2018-10-12 浙江工业大学 一种基于卷积神经网络结构的交通流预测方法
WO2020248581A1 (zh) * 2019-06-11 2020-12-17 中国科学院自动化研究所 图数据识别方法、装置、计算机设备和存储介质
CN112241814A (zh) * 2020-10-20 2021-01-19 河南大学 一种基于强化时空图神经网络的交通预测方法
CN112508060A (zh) * 2020-11-18 2021-03-16 哈尔滨工业大学(深圳) 一种基于图卷积神经网络的滑坡体状态判断方法及系统
CN112784121A (zh) * 2021-01-28 2021-05-11 浙江工业大学 一种基于时空图表示学习的交通事故预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647834A (zh) * 2018-05-24 2018-10-12 浙江工业大学 一种基于卷积神经网络结构的交通流预测方法
WO2020248581A1 (zh) * 2019-06-11 2020-12-17 中国科学院自动化研究所 图数据识别方法、装置、计算机设备和存储介质
CN112241814A (zh) * 2020-10-20 2021-01-19 河南大学 一种基于强化时空图神经网络的交通预测方法
CN112508060A (zh) * 2020-11-18 2021-03-16 哈尔滨工业大学(深圳) 一种基于图卷积神经网络的滑坡体状态判断方法及系统
CN112784121A (zh) * 2021-01-28 2021-05-11 浙江工业大学 一种基于时空图表示学习的交通事故预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐红飞等: "基于时空卷积神经网络GL-GCN的交通流异常检测算法", 《现代信息科技》 *

Also Published As

Publication number Publication date
CN114090651B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN114167214B (zh) 基于随机矩阵理论的低压配电网边-云协同故障检测方法
CN111223301B (zh) 一种基于图注意力卷积网络的交通流量预测方法
CN112887145B (zh) 一种基于分布式的网络切片故障检测方法
CN110047291B (zh) 一种考虑扩散过程的短时交通流预测方法
CN112217674B (zh) 基于因果网络挖掘和图注意力网络的告警根因识别方法
CN114266301B (zh) 基于图卷积神经网络的电力设备故障智能预测方法
CN117201410B (zh) 用于物联网的流量管理方法及系统
CN113759974B (zh) 一种面向输电杆塔精细化巡检的航线生成方法
CN110807518A (zh) 一种面向电网数据的离群点检测方法
CN117078048A (zh) 基于数字孪生的智慧城市资源管理方法及系统
CN118133203A (zh) 一种电能计量检测信息故障诊断方法
CN113884807B (zh) 基于随机森林和多层架构聚类的配电网故障预测方法
CN115277789A (zh) 一种梯级水电站安全防护系统及方法
CN114124734A (zh) 一种基于GCN-Transformer集成模型的网络流量预测方法
CN117593877A (zh) 一种基于集成图卷积神经网络的短时交通流预测方法
CN113541986B (zh) 5g切片的故障预测方法、装置及计算设备
CN114090651B (zh) 基于双通道图神经网络自编码器的交通流异常数据判断方法
CN117477544A (zh) 融合时间模式特征的lstm超短期光伏功率预测方法及系统
CN113988189B (zh) 一种跨风电机组的迁移故障诊断方法
CN113515890B (zh) 一种基于联邦学习的可再生能源日前场景生成方法
CN115329834A (zh) 电缆状态确定方法、装置及系统
Yang et al. Lightweight Fault Prediction Method for Edge Networks
CN112949905A (zh) 边缘域传感器数据预测方法及装置
CN118473910B (zh) 基于边云协同的电力物联网故障检测方法及系统
Qiu et al. Automatic Locating Technology for Distribution Network Based on Graph Convolution Neural Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant