CN114662805B - 一种基于相似时间序列对比的交通流量预测方法 - Google Patents

一种基于相似时间序列对比的交通流量预测方法 Download PDF

Info

Publication number
CN114662805B
CN114662805B CN202210578040.9A CN202210578040A CN114662805B CN 114662805 B CN114662805 B CN 114662805B CN 202210578040 A CN202210578040 A CN 202210578040A CN 114662805 B CN114662805 B CN 114662805B
Authority
CN
China
Prior art keywords
flow
training
encoder
interval
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210578040.9A
Other languages
English (en)
Other versions
CN114662805A (zh
Inventor
高文飞
王辉
王瑞雪
郭丽丽
王磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Rongling Technology Group Co ltd
Original Assignee
Shandong Rongling Technology Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Rongling Technology Group Co ltd filed Critical Shandong Rongling Technology Group Co ltd
Priority to CN202210578040.9A priority Critical patent/CN114662805B/zh
Publication of CN114662805A publication Critical patent/CN114662805A/zh
Application granted granted Critical
Publication of CN114662805B publication Critical patent/CN114662805B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及智慧交通技术领域,具体涉及一种基于相似时间序列对比的交通流量预测方法,包括以下步骤:第一步:根据公开的数据网站获得某地区的交通流量数据,并对交通流量数据进行处理;第二步:挖掘区域流量周期;第三步:预训练编码器;在空间角度上使用深层ResNet网络进行编码,从空间角度上捕获流量图特征,由于相同城市职能的区域流量分布相似,使用多实例对比学习方法,让相似区域之间的特征彼此拉近,从而远离不相似区域的特征;第四步:将预训练好的编码器放入流量预测模型微调,第五步:保存模型。与以往的交通流量预测相比,本发明具有更少的参数量和训练成本,建模效果明显,预测结果好等特点。

Description

一种基于相似时间序列对比的交通流量预测方法
技术领域
本发明涉及智慧交通技术领域,具体涉及一种基于相似时间序列对比的交通流量预测方法。
背景技术
随着数据信息化的发展,交通预测在智慧城市领域起着至关重要的作用,准确的交通预测可以辅助路线规划,指导车辆调度,缓解交通拥堵。由于道路网络中不同区域之间复杂且动态的时空依赖关系,该问题具有挑战性。近些年来,人们致力于在这领域投入了大量的研究工作。其中早期的研究集中在传统的机器学习方法上,随着深度学习的发展,卷积神经网络、递归神经网络和前馈神经网络被应用于交通流量预测。基于残差结构在计算机视觉领域的重大突破,研究者将某地交通流量数据分割成的区域,每个区域代表流量大小。根据流量数据的邻近性、周期性和趋势性进行划分,最后设计一个融合机制对未来交通流量进行预测。
由于对未来交通流量预测需要大量的数据训练,自监督的出现打破了这一局面,自监督可以通过建立一系列辅助任务帮助模型有针对地学习数据本身特性。为了提高交通流量预测的准确性并且减少模型参数量和复杂程度,本发明提出一种基于相似时间序列对比的交通流量预测方法。
发明内容
本发明提供一种基于相似时间序列对比的交通流量预测方法,本发明根据交通流量数据的时空特性,在空间上,具有相似语义功能的区域它们流量分布状况相同;在时间上,区域的流量分布随着时间呈现出周期特性。根据这两个特点,本发明将区域按照功能属性划分成几种类别,每种类别的流量分布呈现出不同的周期特性,设计出一个编码器进行相似时间序列对比自监督学习。它的目的是为了使那些具有相似语义功能区域特征彼此相近,而使不同区域特征远离。编码器挖掘了时空流量数据特征,使简单的网络结构能够从数据本身获得强大的表示能力,结合这个预训练编码器微调网络来进行城市流量预测。
本发明是通过以下技术方案实现的:
一种基于相似时间序列对比的交通流量预测方法,包括以下步骤:
第一步:数据获取,根据公开的数据网站获得某地区的交通流量数据,并对交通流量数据进行处理;
第二步:挖掘区域流量周期,发现流量的周期性,按照经纬度对该地区的区域进行划分,将各个区域流量的大小进行DBSCAN聚类划分,流量图按照流量大小划分为若干个区域,基于同一类别的区域具有相似的流量周期特性;
第三步:预训练编码器;在空间角度上使用深层ResNet网络进行编码,编码器主体是由卷积网络Conv和若干层Resunit构成,从空间角度上捕获流量图特征,由于相同城市职能的区域流量分布相似,使用多实例对比学习方法,让相似区域之间的特征彼此拉近,从而远离不相似区域的特征;
第四步:将预训练好的编码器放入流量预测模型微调;
第五步:保存模型;得到的流量预测模型首先在训练集上进行训练,经过不断的迭代训练,模型中的参数也在不断完善,然后在验证集上进行测试,最后保存具有最好测试效果的模型。
进一步的,所述交通流量数据进行处理操作如下:由于交通流量数据具有相似性、周期性和趋势性,对流量按照时间间隔划分为相似区间
Figure DEST_PATH_IMAGE001
, 例如同一天的连续的不同时刻;周期区间
Figure DEST_PATH_IMAGE002
,例如不同天的同一的时刻,趋势区间
Figure DEST_PATH_IMAGE003
,例如不同周同一天的同一时刻;
Figure DEST_PATH_IMAGE004
其中
Figure DEST_PATH_IMAGE005
分别为相似区间、周期区间和趋势区间的间隔长度
Figure DEST_PATH_IMAGE006
是周期长度和趋势长度。
进一步的,所述预训练编码器的获得的操作如下:
分别将相似区间、周期区间、趋势区间的流量数据
Figure DEST_PATH_IMAGE007
输入深层ResNet编码器网络得到高层语义特征,得到相似高级语义特征、周期高级语义特征和趋势高级语义特征
Figure DEST_PATH_IMAGE008
,在训练过程中,将流量图
Figure DEST_PATH_IMAGE009
的大小裁剪为
Figure DEST_PATH_IMAGE010
的小块,计算当前小块
Figure DEST_PATH_IMAGE011
与其他小块
Figure DEST_PATH_IMAGE012
之间的特征距离
Figure DEST_PATH_IMAGE013
,设置参数
Figure DEST_PATH_IMAGE014
Figure DEST_PATH_IMAGE015
如果特征距离之间的差距小于参数
Figure DEST_PATH_IMAGE016
,将其视为正样本,否则将其视为负样本;通过上述操作得到当前小块的正样本集合
Figure DEST_PATH_IMAGE017
和负样本集
Figure DEST_PATH_IMAGE018
,设计多实例对比损失函数对高级语义特征进行计算:
Figure DEST_PATH_IMAGE019
其中
Figure DEST_PATH_IMAGE020
是内积计算,通过上述操作在相似区间、周期区间、趋势区间上进行预训练,得到相似区间预训练编码器、周期区间预训练编码器、趋势区间预训练编码器,保存预训练编码器,用于后续模型微调。
具体获得预训练编码器的操作如下所示:
(1) 相似区域预训练编码器:
Figure DEST_PATH_IMAGE021
数据进入深层ResNet编码器网络得到高层语义特征
Figure DEST_PATH_IMAGE022
;由于不同区域的流量分布状况随着时间呈现出不同的趋势,在训练过程中,将流量图
Figure DEST_PATH_IMAGE023
的大小裁剪为
Figure DEST_PATH_IMAGE024
的小块,不同小块之间的流量分布周期特性不同,计算当前小块
Figure DEST_PATH_IMAGE025
与其他小块
Figure DEST_PATH_IMAGE026
之间的特征距离,设置参数
Figure DEST_PATH_IMAGE027
Figure DEST_PATH_IMAGE028
如果特征距离之间的差距小于参数
Figure DEST_PATH_IMAGE029
,将其视为正样本,否则将其视为负样本。通过上述操作,得到当前小块的正样本集合
Figure DEST_PATH_IMAGE030
和负样本集合
Figure DEST_PATH_IMAGE031
,设计多实例对比损失函数对高级语义特征进行计算:
Figure DEST_PATH_IMAGE032
其中
Figure DEST_PATH_IMAGE033
是内积计算,通过上述操作在相似区间上进行预训练,保存预训练编码器,用于后续模型微调;
(2)周期区间预训练编码器:
将周期区域
Figure DEST_PATH_IMAGE034
的流量数据进入深层ResNet编码器网络得到高层语义特征
Figure DEST_PATH_IMAGE035
;由于不同区域的流量分布状况随着时间呈现出不同的趋势,在训练过程中,将流量图
Figure DEST_PATH_IMAGE036
的大小裁剪为
Figure DEST_PATH_IMAGE037
的小块;不同小块之间的流量分布周期特性不同;计算当前小块
Figure DEST_PATH_IMAGE038
与其他小块
Figure DEST_PATH_IMAGE039
之间的特征距离,设置参数
Figure DEST_PATH_IMAGE040
Figure DEST_PATH_IMAGE041
如果特征距离之间的差距小于参数
Figure DEST_PATH_IMAGE042
,将其视为正样本,否则将其视为负样本;通过上述操作,得到当前小块的正样本集合
Figure DEST_PATH_IMAGE043
和负样本集合
Figure DEST_PATH_IMAGE044
,设计多实例对比损失函数对高级语义特征进行计算:
Figure DEST_PATH_IMAGE045
其中
Figure DEST_PATH_IMAGE046
是内积计算,通过上述操作在相似区间上进行预训练,保存编码器;
(3)趋势区间预训练编码器:
将趋势区间
Figure DEST_PATH_IMAGE047
流量数据进入深层ResNet编码器网络得到高层语义特征
Figure DEST_PATH_IMAGE048
;由于不同区域的流量分布状况随着时间呈现出不同的趋势,在训练过程中,将流量图
Figure DEST_PATH_IMAGE049
的大小裁剪为
Figure 439236DEST_PATH_IMAGE037
的小块;不同小块之间的流量分布周期特性不同。计算当前小块
Figure DEST_PATH_IMAGE050
与其他小块
Figure DEST_PATH_IMAGE051
之间的特征距离,设置参数
Figure DEST_PATH_IMAGE052
Figure DEST_PATH_IMAGE053
如果特征距离之间的差距小于参数
Figure DEST_PATH_IMAGE054
,将其视为正样本,否则将其视为负样本;通过上述操作,得到当前小块的正样本集合
Figure DEST_PATH_IMAGE055
和负样本集合
Figure DEST_PATH_IMAGE056
,设计多实例对比损失函数对高级语义特征进行计算:
Figure DEST_PATH_IMAGE057
其中
Figure DEST_PATH_IMAGE058
是内积计算,通过上述操作,在相似区间上进行预训练,保存编码器。
进一步的,所述步骤4的具体操作如下:
由于流量数据和外部因素密不可分的关系,外部因素分为连续特征和离散特征,连续特征包括湿度、温度、风速等;离散特征包括天气(阴天、晴天、多云)、时间;将离散特征通过多层感知机编码为
Figure DEST_PATH_IMAGE059
,并与连续特征
Figure DEST_PATH_IMAGE060
进行向量拼接操作:
Figure DEST_PATH_IMAGE061
对外部特征e进行非线性激活函数变换得到外部信息高级语义特征:
Figure DEST_PATH_IMAGE062
其中ReLU是激活函数,
Figure DEST_PATH_IMAGE063
为权重矩阵,B为偏置矩阵;之后将上一步骤中得到的相似、周期、趋势和外部信息高级语义特征进行信息融合,具体操作如下:
Figure DEST_PATH_IMAGE064
其中Conv是卷积降维操作,将融合后的特征H进行未来交通流量预测。
本发明的有益效果体现在:现有的交通流量预测模型依赖于过多的训练数据和复杂的模型,由于自监督可以从数据本身挖掘特性。本发明将流量数据中的时空特性进行充分挖掘,在空间上捕获流量邻域信息,在时间上捕获周期特性。在一段时间内,具有相同城市功能的区域它们的流量分布是相似的,通过相似时间序列对比,这些相似区域之可以加强学习特征,从而远离那些不相似的区域。建立相似时间序列对比辅助任务有助于更好让编码器学习流量数据的时空特征,从而达到减少模型训练量和复杂程度。预训练好的编码器可以与下游任务更好得结合。与以往的交通流量预测相比,本发明具有更少的参数量和训练成本,建模效果明显,预测结果好等特点。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例中基于相似时间序列对比的交通流量预测流程图;
图2为本发明实施例中交通流量数据处理图;
图3为本发明实施例中区域周期性示意图;
图4为本发明实施例中编码器网络结构示意图;
图5为本发明实施例中流量预测整体流程示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
对比自监督技术介绍:机器学习分为监督学习、半监督学习和无监督学习。划分它们的依据是模型在训练的过程中是否需要人工标注的标签信息,监督学习需要利用大量的标签来帮助模型训练;半监督学习是使用部分标签来帮助训练,探究有标记数据和未标记数据之间的特征关系;无监督学习不需要人工标准,能够根据数据本身的特性来进行区域。对比自监督属于无监督学习的一种,它通过选取锚点来建立正负样本对。其中正样本数据与锚点数据具有相似的流量分布状况,而负样本数据产生截然相反的流量分布状况,它希望通过建立正负样本对来加强正样本之间的特征关系,从而拉远与负样本之间的距离。
本实施例公开了一种基于相似时间序列对比的交通流量预测方法,包括以下步骤:
第一步:数据获取,根据公开网站获得流量数据,并进行数据处理。
第二步:挖掘区域流量周期。
第三步:预训练相似时间序列编码器。
第四步:将预训练好的编码器放入流量预测模型微调。
第五步:保存模型。
具体预测流程图见图1所示。
上述各个步骤所述的具体操作如下:
1、数据获取
根据公开的数据网站获得某地区的交通流量数据,并对交通流量数据进行处理;由于交通流量数据具有相似性、周期性和趋势性,对流量按照时间间隔划分为相似区间
Figure 708107DEST_PATH_IMAGE001
; 例如同一天的连续的不同时刻;周期区间
Figure DEST_PATH_IMAGE065
; 不同天的同一的时刻,趋势区间
Figure 19002DEST_PATH_IMAGE003
;不同周同一天的同一时刻;
Figure 210949DEST_PATH_IMAGE004
其中
Figure 759742DEST_PATH_IMAGE005
分别为相似区间、周期区间和趋势区间的间隔长度
Figure DEST_PATH_IMAGE066
是周期长度和趋势长度,具体的数据处理如图2数据所示。
2、挖掘区域流量周期
城市区域流量之间呈现出不同的趋势,例如:城市主要的交通干道在早晚高峰时呈现出人员密集趋势,而其余时间流量平稳;在动物园等休闲场所周末人员密集但工作日期间客流量稀少。这种相似功能区域在城市中不止一处出现,在本实施例,挑选几处具有代表性的区域,如图3所示:上述区域的流量周期呈现出不同的趋势,按照区域流量的大小进行DBSCAN聚类划分,会将流量图按照流量大小划分为若干个区域,属于同一类别的区域具有相似的流量周期特性。
3、预训练编码器
交通流量数据具有时空特性,在空间角度上使用深层ResNet网络进行编码,编码器网络结构如图4所示:编码器主体是由卷积网络Conv和若干层Resunit构成,它可以从空间角度上捕获流量图特征。
所述预训练编码器的获得的具体操作如下:
(1) 相似区域预训练编码器:
Figure DEST_PATH_IMAGE067
数据进入深层ResNet编码器网络得到高层语义特征
Figure DEST_PATH_IMAGE068
;由于不同区域的流量分布状况随着时间呈现出不同的趋势,在训练过程中,将流量图
Figure 644522DEST_PATH_IMAGE049
的大小裁剪为
Figure DEST_PATH_IMAGE069
的小块,不同小块之间的流量分布周期特性不同,计算当前小块
Figure DEST_PATH_IMAGE070
与其他小块
Figure DEST_PATH_IMAGE071
之间的特征距离,设置参数
Figure DEST_PATH_IMAGE072
Figure DEST_PATH_IMAGE073
如果特征距离之间的差距小于参数
Figure DEST_PATH_IMAGE074
,将其视为正样本,否则将其视为负样本。通过上述操作,得到当前小块的正样本集合
Figure DEST_PATH_IMAGE075
和负样本集合
Figure DEST_PATH_IMAGE076
,设计多实例对比损失函数对高级语义特征进行计算:
Figure 567347DEST_PATH_IMAGE032
其中
Figure DEST_PATH_IMAGE077
是内积计算,通过上述操作在相似区间上进行预训练,保存预训练编码器,用于后续模型微调;
(2)周期区间预训练编码器:
将周期区域
Figure DEST_PATH_IMAGE078
的流量数据进入深层ResNet编码器网络得到高层语义特征
Figure DEST_PATH_IMAGE079
;由于不同区域的流量分布状况随着时间呈现出不同的趋势,在训练过程中,将流量图
Figure DEST_PATH_IMAGE080
的大小裁剪为
Figure 849072DEST_PATH_IMAGE037
的小块;不同小块之间的流量分布周期特性不同;计算当前小块
Figure 908164DEST_PATH_IMAGE038
与其他小块
Figure 432686DEST_PATH_IMAGE039
之间的特征距离,设置参数
Figure 718174DEST_PATH_IMAGE040
Figure DEST_PATH_IMAGE081
如果特征距离之间的差距小于参数
Figure 720765DEST_PATH_IMAGE042
,将其视为正样本,否则将其视为负样本;通过上述操作,得到当前小块的正样本集合
Figure DEST_PATH_IMAGE082
和负样本集合
Figure DEST_PATH_IMAGE083
,设计多实例对比损失函数对高级语义特征进行计算:
Figure 103205DEST_PATH_IMAGE045
其中
Figure DEST_PATH_IMAGE084
是内积计算,通过上述操作在相似区间上进行预训练,保存编码器;
(3)趋势区间预训练编码器:
将趋势区间
Figure DEST_PATH_IMAGE085
流量数据进入深层ResNet编码器网络得到高层语义特征
Figure DEST_PATH_IMAGE086
;由于不同区域的流量分布状况随着时间呈现出不同的趋势,在训练过程中,将流量图
Figure DEST_PATH_IMAGE087
的大小裁剪为
Figure 188841DEST_PATH_IMAGE037
的小块;不同小块之间的流量分布周期特性不同。计算当前小块
Figure DEST_PATH_IMAGE088
与其他小块
Figure DEST_PATH_IMAGE089
之间的特征距离,设置参数
Figure DEST_PATH_IMAGE090
Figure DEST_PATH_IMAGE091
如果特征距离之间的差距小于参数
Figure 414155DEST_PATH_IMAGE054
,将其视为正样本,否则将其视为负样本;通过上述操作,得到当前小块的正样本集合
Figure DEST_PATH_IMAGE092
和负样本集合
Figure DEST_PATH_IMAGE093
,设计多实例对比损失函数对高级语义特征进行计算:
Figure DEST_PATH_IMAGE094
其中
Figure 79492DEST_PATH_IMAGE084
是内积计算,通过上述操作,在相似区间上进行预训练,保存编码器。
4、微调流量预测模型
将上述预训练编码器放入到微调网络中进行流量预测,如图5所示。相似区间
Figure DEST_PATH_IMAGE095
;周期区间
Figure DEST_PATH_IMAGE096
;趋势区间
Figure DEST_PATH_IMAGE097
分别进入编码器得到相似高级语义特征
Figure DEST_PATH_IMAGE098
;周期高级语义特征
Figure DEST_PATH_IMAGE099
和趋势高级语义特征
Figure DEST_PATH_IMAGE100
;由于流量数据和外部因素密不可分的关系,外部因素分为连续特征和离散特征,连续特征包括湿度、温度、风速等;离散特征包括天气,即阴天、晴天、多云和时间;将离散特征通过多层感知机编码为
Figure DEST_PATH_IMAGE101
,并与连续特征
Figure DEST_PATH_IMAGE102
进行向量拼接操作:
Figure DEST_PATH_IMAGE103
对外部特征e进行非线性激活函数变换得到外部信息高级语义特征:
Figure DEST_PATH_IMAGE104
其中ReLU是激活函数,
Figure DEST_PATH_IMAGE105
为权重矩阵,B为偏置矩阵;之后将相似、周期、趋势和外部信息高级语义特征进行信息融合,具体操作如下:
Figure DEST_PATH_IMAGE106
其中Conv是卷积降维操作,将融合后的特征H进行未来交通流量预测。
5、保存模型
保存模型;得到的流量预测模型首先在训练集上进行训练,经过不断的迭代训练,模型中的参数也在不断完善,然后在验证集上进行测试,最后保存具有最好测试效果的模型。

Claims (2)

1.一种基于相似时间序列对比的交通流量预测方法,其特征在于:包括以下步骤:
第一步:数据获取,根据公开的数据网站获得某地区的交通流量数据,并对交通流量数据进行处理;
步骤1中的所述交通流量数据进行处理操作如下:对流量按照时间间隔划分为相似区间
Figure 274619DEST_PATH_IMAGE001
;周期区间
Figure 611578DEST_PATH_IMAGE002
;趋势区间
Figure 484856DEST_PATH_IMAGE003
Figure 802705DEST_PATH_IMAGE004
其中
Figure 786842DEST_PATH_IMAGE005
分别为相似区间、周期区间和趋势区间的间隔长度;
Figure 506536DEST_PATH_IMAGE006
是周期长度和趋势长度;
第二步:挖掘区域流量周期,发现流量的周期性,按照经纬度对该地区的区域进行划分,将各个区域流量的大小进行DBSCAN聚类划分,流量图按照流量大小划分为若干个区域,基于同一类别的区域具有相似的流量周期特性;
第三步:预训练编码器;在空间角度上使用深层ResNet网络进行编码,编码器主体是由卷积网络Conv和若干层Resunit构成,从空间角度上捕获流量图特征,由于相同城市职能的区域流量分布相似,使用多实例对比学习方法,让相似区域之间的特征彼此拉近,从而远离不相似区域的特征;
所述预训练编码器的获得的具体操作如下:
(1) 相似区域预训练编码器:
Figure 550716DEST_PATH_IMAGE007
数据进入深层ResNet编码器网络得到高层语义特征
Figure 355861DEST_PATH_IMAGE008
;由于不同区域的流量分布状况随着时间呈现出不同的趋势,在训练过程中,将流量图
Figure 143688DEST_PATH_IMAGE009
的大小裁剪为
Figure 717889DEST_PATH_IMAGE010
的小块,不同小块之间的流量分布周期特性不同,计算当前小块
Figure 932969DEST_PATH_IMAGE011
与其他小块
Figure 959831DEST_PATH_IMAGE012
之间的特征距离,设置参数
Figure 285770DEST_PATH_IMAGE013
Figure 714478DEST_PATH_IMAGE014
如果特征距离之间的差距小于参数
Figure 100460DEST_PATH_IMAGE015
,将其视为正样本,否则将其视为负样本;
通过上述操作,得到当前小块的正样本集合
Figure 880197DEST_PATH_IMAGE016
和负样本集合
Figure 9827DEST_PATH_IMAGE017
,设计多实例对比损失函数对高级语义特征进行计算:
Figure 293041DEST_PATH_IMAGE018
其中
Figure 115503DEST_PATH_IMAGE019
是内积计算,通过上述操作在相似区间上进行预训练,保存预训练编码器,用于后续模型微调;
(2)周期区间预训练编码器:
将周期区域
Figure 116957DEST_PATH_IMAGE020
的流量数据进入深层ResNet编码器网络得到高层语义特征
Figure 50278DEST_PATH_IMAGE021
;由于不同区域的流量分布状况随着时间呈现出不同的趋势,在训练过程中,将流量图
Figure 187998DEST_PATH_IMAGE022
的大小裁剪为
Figure 181362DEST_PATH_IMAGE023
的小块;不同小块之间的流量分布周期特性不同;计算当前小块
Figure 670112DEST_PATH_IMAGE024
与其他小块
Figure 875966DEST_PATH_IMAGE025
之间的特征距离,设置参数
Figure 133772DEST_PATH_IMAGE026
Figure 298037DEST_PATH_IMAGE027
如果特征距离之间的差距小于参数
Figure 8504DEST_PATH_IMAGE028
,将其视为正样本,否则将其视为负样本;通过上述操作,得到当前小块的正样本集合
Figure 283628DEST_PATH_IMAGE029
和负样本集合
Figure 661519DEST_PATH_IMAGE030
,设计多实例对比损失函数对高级语义特征进行计算:
Figure 731106DEST_PATH_IMAGE031
其中
Figure 191519DEST_PATH_IMAGE032
是内积计算,通过上述操作在相似区间上进行预训练,保存编码器;
(3)趋势区间预训练编码器:
将趋势区间
Figure 4754DEST_PATH_IMAGE033
流量数据进入深层ResNet编码器网络得到高层语义特征
Figure 237153DEST_PATH_IMAGE034
;由于不同区域的流量分布状况随着时间呈现出不同的趋势,在训练过程中,将流量图
Figure 477641DEST_PATH_IMAGE035
的大小裁剪为
Figure 428279DEST_PATH_IMAGE023
的小块;不同小块之间的流量分布周期特性不同;
计算当前小块
Figure 779626DEST_PATH_IMAGE036
与其他小块
Figure 866531DEST_PATH_IMAGE037
之间的特征距离,设置参数
Figure 809079DEST_PATH_IMAGE038
Figure 981435DEST_PATH_IMAGE039
如果特征距离之间的差距小于参数
Figure 870893DEST_PATH_IMAGE040
,将其视为正样本,否则将其视为负样本;通过上述操作,得到当前小块的正样本集合
Figure 77884DEST_PATH_IMAGE041
和负样本集合
Figure 660175DEST_PATH_IMAGE042
,设计多实例对比损失函数对高级语义特征进行计算:
Figure 319826DEST_PATH_IMAGE043
其中
Figure 278555DEST_PATH_IMAGE032
是内积计算,通过上述操作,在相似区间上进行预训练,保存编码器;
第四步:将预训练好的编码器放入流量预测模型微调;
第五步:保存模型;得到的流量预测模型首先在训练集上进行训练,经过不断的迭代训练,模型中的参数也在不断完善,然后在验证集上进行测试,最后保存具有最好测试效果的模型。
2.根据权利要求1所述的基于相似时间序列对比的交通流量预测方法,其特征在于:所述步骤4的具体操作如下:
将外部特征分为连续特征和离散特征,将离散特征通过多层感知机编码为
Figure 340052DEST_PATH_IMAGE044
,并与连续特征
Figure 358823DEST_PATH_IMAGE045
进行向量拼接操作:
Figure 505771DEST_PATH_IMAGE046
对外部特征e进行非线性激活函数变换得到外部信息高级语义特征:
Figure 2611DEST_PATH_IMAGE047
其中ReLU是激活函数,
Figure 918615DEST_PATH_IMAGE048
为权重矩阵,B为偏置矩阵;之后将步骤3得到的相似、周期、趋势和外部信息高级语义特征进行信息融合,具体操作如下:
Figure 108288DEST_PATH_IMAGE049
其中Conv是卷积降维操作,将融合后的特征H进行未来交通流量预测。
CN202210578040.9A 2022-05-26 2022-05-26 一种基于相似时间序列对比的交通流量预测方法 Active CN114662805B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210578040.9A CN114662805B (zh) 2022-05-26 2022-05-26 一种基于相似时间序列对比的交通流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210578040.9A CN114662805B (zh) 2022-05-26 2022-05-26 一种基于相似时间序列对比的交通流量预测方法

Publications (2)

Publication Number Publication Date
CN114662805A CN114662805A (zh) 2022-06-24
CN114662805B true CN114662805B (zh) 2022-09-13

Family

ID=82038175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210578040.9A Active CN114662805B (zh) 2022-05-26 2022-05-26 一种基于相似时间序列对比的交通流量预测方法

Country Status (1)

Country Link
CN (1) CN114662805B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633579A (zh) * 2020-12-24 2021-04-09 中国科学技术大学 一种基于域对抗的交通流迁移预测方法
CN113240179A (zh) * 2021-05-18 2021-08-10 重庆邮电大学 融合时空信息的轨道人流量预测方法及系统
WO2022068587A1 (zh) * 2020-09-30 2022-04-07 西南石油大学 基于融合神经网络模型的发动机喘振故障预测系统及方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111861027A (zh) * 2020-07-29 2020-10-30 北京工商大学 一种基于深度学习融合模型的城市交通流量预测方法
CN113947250A (zh) * 2021-10-22 2022-01-18 山东大学 一种基于有限数据资源的城市细粒度流量预测方法及系统
CN113962460B (zh) * 2021-10-22 2024-05-28 山东大学 基于时空对比自监督的城市细粒度流量预测方法及系统
CN114493034B (zh) * 2022-02-14 2024-05-31 重庆大学 一种面向区域流量预测的时空全局语义表示学习方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022068587A1 (zh) * 2020-09-30 2022-04-07 西南石油大学 基于融合神经网络模型的发动机喘振故障预测系统及方法
CN112633579A (zh) * 2020-12-24 2021-04-09 中国科学技术大学 一种基于域对抗的交通流迁移预测方法
CN113240179A (zh) * 2021-05-18 2021-08-10 重庆邮电大学 融合时空信息的轨道人流量预测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Road Traffic Prediction Using Context-Aware Random Forest Based on Volatility Nature of Traffic Flows;Narjes Zarei等;《Spring Link》;20131231;第196-205页 *
基于时空残差网络的区域客流量预测方法;董丽丽等;《计算机测量与控制》;20200630;第28卷(第06期);第170-174页 *

Also Published As

Publication number Publication date
CN114662805A (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
CN111612243B (zh) 交通速度预测方法、系统及存储介质
CN111223301B (zh) 一种基于图注意力卷积网络的交通流量预测方法
CN110047291B (zh) 一种考虑扩散过程的短时交通流预测方法
CN109389244A (zh) 一种基于gru的多因素感知短期景区内游客人数预测方法
CN110675632B (zh) 针对多特征空间和数据稀疏的车辆短时轨迹预测控制方法
AU2020317917A1 (en) Method for calculating length of time taken for train to pass through tunnel, system, and storage medium
CN109389246B (zh) 一种基于神经网络的交通工具目的地区域范围预测方法
CN113112791A (zh) 一种基于滑动窗口长短时记忆网络的交通流量预测方法
CN115829024B (zh) 一种模型训练方法、装置、设备及存储介质
CN114492978A (zh) 一种基于多层注意力机制的时空序列预测方法及设备
CN114493034B (zh) 一种面向区域流量预测的时空全局语义表示学习方法
CN116484217A (zh) 一种基于多模态预训练大模型的智能决策方法及系统
CN112559585A (zh) 交通时空序列单步预测方法、系统及存储介质
CN114418606B (zh) 基于时空卷积网络的网约车订单需求预测方法
CN114662805B (zh) 一种基于相似时间序列对比的交通流量预测方法
Al Duhayyim et al. Modeling of Artificial Intelligence Based Traffic Flow Prediction with Weather Conditions.
CN117237475A (zh) 一种基于扩散生成模型的车辆交通轨迹生成方法及装置
CN115938112A (zh) 交通需求预测方法、系统、电子设备及计算机存储介质
CN115017250B (zh) 基于深度学习的稀疏轨迹数据恢复系统及方法
CN116432850A (zh) 一种基于深层神经网络的pm2.5的全覆盖预测方法
CN115409276A (zh) 基于时空图自注意力模型的交通预测迁移学习方法
CN115689224A (zh) 基于轨迹语义化和图卷积网络的出租车需求预测方法
Mingzhou et al. Short-time traffic flow forecast with weather characteristics
CN111260121B (zh) 一种基于深度瓶颈残差网络的城市范围的人流量预测方法
CN112950933B (zh) 一种新型时空特征的车流量预测的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant