CN112396218A - 基于城市区域多模态融合的人群流量预测方法 - Google Patents

基于城市区域多模态融合的人群流量预测方法 Download PDF

Info

Publication number
CN112396218A
CN112396218A CN202011227802.8A CN202011227802A CN112396218A CN 112396218 A CN112396218 A CN 112396218A CN 202011227802 A CN202011227802 A CN 202011227802A CN 112396218 A CN112396218 A CN 112396218A
Authority
CN
China
Prior art keywords
grid
region
flow
data
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011227802.8A
Other languages
English (en)
Other versions
CN112396218B (zh
Inventor
顾晶晶
孙明
凌超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202011227802.8A priority Critical patent/CN112396218B/zh
Publication of CN112396218A publication Critical patent/CN112396218A/zh
Application granted granted Critical
Publication of CN112396218B publication Critical patent/CN112396218B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biomedical Technology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于城市区域多模态融合的人群流量预测方法,包括:获取城市数据并进行预处理;将城市划分成等大小的网格区域,并构建相应大小结构的城市数据矩阵;计算每个网格区域的流行度、兴趣点差异性矩阵、热度值;基于热度值,对人类活动数据进行OPTICS聚类,将城市划分成多种类的功能区域;计算每个网格区域的欧几里得距离、流量相似度、兴趣点相似度,并基于划分好的功能区域构建多模态相关性图;基于多模态相关性图,使用基于图卷积神经网络结构的多模态融合模型,对区域人群流量进行预测。本发明方法能够划分更加真实、多元的热点区域,并充分利用城市区域之间潜在的多种相关性。在基于海量的城市时空数据计算中,具有更良好的预测效果。

Description

基于城市区域多模态融合的人群流量预测方法
技术领域
本发明属于模式分析领域,特别涉及一种基于城市区域多模态融合的人群流量预测方法。
背景技术
随着经济的飞速发展,人民的生活水平不断提高,人们的出行方式日益多样化,出行次数也大幅上升。但与此同时,城市的交通拥堵问题也日益严重。随着位置技术服务Location Based Services(LBS)的普及和计算机计算能力的提高,城市居民的出行信息被采集,生成了大量的人类活动行为数据集。大数据的应用使得我们有机会发现一些现代城市中的各种出行行为的规律,以帮助解决快速的城市化带来的一系列问题。
如果能够及时准确的预测和分析人群活动的规律,许多城市化问题,比如交通拥堵、交通资源调度等问题就会迎刃而解。但由于不同年龄段、不同工作、不同文化背景的人们对兴趣点的偏好不同,城市中的人们流向是多种多样的以及城市环境的高度动态性,精确的城市人群流量预测一直是个难点。
通常情况下,对于城市的流量预测主要通过采集历史数据并使用某种数学模型来预测未来的流量情况,一般分为基于统计与机器学习方法、基于概率图模型的方法以及基于深度学习的方法。例如,A.Abadi等人提出了一种自回归综合移动平均(AutoregressiveIntegrated Moving Average,ARIMA)模型进行数据驱动的方法来预测城市交通流量。Longbiao Chen等提出了一种基于动态集群的过度预测框架来预测站点式共享自行车的流量。C.Thirumalai等人提出了一个深度神经网络模型,使用历史自行车数据来预测共享自行车的未来使用情况,并使用基于门控循环单元的循环神经网络(Recurrent NeuralNetwork,RNN)进行城市交通流量预测。
虽然现有研究工作中有大量关于城市人群活动数据的流量预测的工作,但是现有的工作主要是通过解决问题中的众多约束或图形模型来执行带有一些环境变量的交通量预测。然而,环境方面的变量很多,用户无法考虑所有这些变量。另外,这也会使优化变得极其复杂且难以解决。
发明内容
本发明的目的在于针对上述现有技术存在的问题,提供一种基于城市区域多模态融合的人群流量预测方法,利用多模态融合,结合图卷积神经网络以及城市数据的时空相关性,挖掘城市区域多重相关性,更好地预测人群流量。
实现本发明目的的技术解决方案为:一种基于城市区域多模态融合的人群流量预测方法,所述方法包括以下步骤:
步骤1,获取城市数据,并对数据进行预处理以消除噪声数据;
步骤2,将城市划分成等大小(H×W)的网格区域gi,并构建相应大小结构的城市数据矩阵:人类活动数据矩阵Mflow、城市兴趣点数据矩阵Mpoi和天气温度数据矩阵Mext
步骤3,计算每个网格区域的流行度PRi、兴趣点差异性矩阵f,并进一步计算网格区域的热度值Hi
步骤4,基于网格区域的热度值Hi,对人类活动数据进行OPTICS聚类,将城市划分成多种类的功能区域C;
步骤5,计算每个网格区域的欧几里得距离、流量相似度、兴趣点相似度,并基于划分好的城市功能区域构建多模态相关性图:区域间距离相关图Gd、流量相似图Gs、流量交互图Ge、兴趣点相似图Gp
步骤6,基于多模态相关性图,使用基于图卷积神经网络结构的多模态融合模型,对区域人群流量进行预测。
本发明与现有技术相比,其显著优点为:1)在高度复杂、动态的城市环境下,基于热度值的聚类方法可以对城市进行更真实、多元的功能区划分;2)针对城市复杂的结构、功能、交互特征,设计了多模态的相关性图,可以更加充分地挖掘城市多种潜在相关性;3)使用了基于图卷积神经网络的多模态融合预测模型,可以更好的提取图型结构的特征,并对城市多种潜在相关性进行融合,预测城市区域未来的人群流量。
下面结合附图对本发明作进一步详细描述。
附图说明
图1为本发明基于城市区域多模态融合的人群流量预测方法流程图。
图2为本发明基于城市区域多模态融合的人群流量预测方法框架图。
图3为一个实施例中基于热度值的OPTICS聚类形成的城市区域图,其中(a)为对上海地区聚类得到的功能区热力图,(b)为对北京地区聚类得到的功能区热力图。
图4为一个实施例中算法误差对比图,其中(a)和(b)分别为以MAE和RMSE作为评价指标,在不同时间序列上使用不同方法进行预测的对比实验结果图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,结合图1和图2,本发明提供了一种基于城市区域多模态融合的人群流量预测方法,所述方法包括以下步骤:
步骤1,获取城市数据,并对数据进行预处理以消除噪声数据;
这里,城市数据包括:
人类活动数据,包括人类活动起始点(x1,y1)以及终止点(x2,y2),以及对应的事件发生时间t1、t2
城市兴趣点数据,包括兴趣点名称、类别、位置等;
天气温度数据,包括每个时刻的天气及温度等。
步骤2,将城市划分成等大小(H×W)的网格区域gi,并构建相应大小结构的城市数据矩阵:人类活动数据矩阵Mflow、城市兴趣点数据矩阵Mpoi和天气温度数据矩阵Mext
步骤3,计算每个网格区域的流行度PRi、兴趣点差异性矩阵f,并进一步计算网格区域的热度值Hi
步骤4,基于网格区域的热度值Hi,对人类活动数据进行OPTICS聚类,将城市划分成多种类的功能区域C;
步骤5,计算每个网格区域的欧几里得距离、流量相似度、兴趣点相似度,并基于划分好的城市功能区域构建多模态相关性图:区域间距离相关图Gd、流量相似图Gs、流量交互图Ge、兴趣点相似图Gp
步骤6,基于多模态相关性图,使用基于图卷积神经网络结构的多模态融合模型,对区域人群流量进行预测。
进一步地,在其中一个实施例中,步骤1中所述对数据进行预处理以消除噪声数据,具体过程包括:
步骤1-1,若某一条数据记录中的某一特征存在空值,将该条数据删除;
步骤1-2,对剩余的数据进行降维处理,删除其中的离群点数据;
步骤1-3,对剩余的数据进行归一化处理,并将天气温度数据处理成独热值数据。
进一步地,在其中一个实施例中,步骤2中所述城市数据矩阵包括人类活动数据矩阵Mflow、城市兴趣点数据矩阵Mpoi和天气温度数据矩阵Mext,计算公式分别为:
Figure BDA0002764168210000041
Figure BDA0002764168210000042
Figure BDA0002764168210000043
式中,
Figure BDA0002764168210000044
表示网格区域i在t时刻的入度流量,
Figure BDA0002764168210000045
表示网格区域i在t时刻的出度流量;
Figure BDA0002764168210000046
表示网格区域i的第k类的兴趣点数量;
Figure BDA0002764168210000047
Figure BDA0002764168210000048
分别表示网格区域i在t时刻的天气和温度特征;K代表兴趣点的类别总数,H和W代表城市被划分成网格的尺寸,T代表人群活动持续的时间,时间跨度为一小时,D代表天气温度数据所处的日期,时间跨度为一小时。对于人类活动数据矩阵和天气温度数据矩阵,是具有时空特性的数据,表示一段时间内的城市内不同区域的人群活动情况和天气温度情况;城市兴趣点数据矩阵是空间性数据,表示城市不同区域的兴趣点分布情况,反映了城市的结构分布。
进一步地,在其中一个实施例中,步骤3中所述网格区域流行度使用PageRank值进行度量,计算公式为:
Figure BDA0002764168210000049
式中,PRi表示第i个网格区域流行度,outj表示第j个网格区域流出流量的大小,
Figure BDA00027641682100000410
表示第i个网格区域流出流量的目的地网格区域集合,R表示网格区域总数,
Figure BDA00027641682100000411
和β表示控制PageRank值大小的参数;
所述兴趣点差异性矩阵f的计算过程包括:
(1)计算网格内兴趣点的特征值vi,g,vi,g表示网格区域i的g类兴趣点的特征值:
Figure BDA00027641682100000412
式中,ng表示属于第g类的兴趣点数量,Ni表示位于网格区域i的所有兴趣点数量,rg表示含有第g类兴趣点网格区域总数;
(2)计算不同网格的兴趣点差异性,构建兴趣点差异性矩阵f:
Figure BDA0002764168210000051
式中,f(vi,vj)表示网格区域i和网格区域j的兴趣点差异性,vig和vjo分别表示网格区域i的g类兴趣点的特征值和网格区域j的o类兴趣点的特征值,vi和vj分别表示网格区域i和网格区域j的所有兴趣点的特征,该式表示若两个网格区域的最重要的兴趣点是同一类,则将两区域的兴趣点特征值相加,否则相减并取其绝对值;
所述网格区域的热度值Hi的计算公式为:
Figure BDA0002764168210000052
其中,
Figure BDA0002764168210000053
式中,h(i,j)为网格区域距离度量参数,α为差异性度量参数,σ表示距离方差,dist(i,j)为网格区域i和网格区域j的欧几里得距离,neii表示网格区域i的指定半径内的邻居区域;当网格区域i周围的网格区域流行度越高,并且与周围的区域兴趣点特征差异性越大,该网格区域的热度值越高。
由于人类活动的局限性,当用户乘坐交通工具出行,会经过公交站、地铁站等交通枢纽。这些区域虽然具有很高的活跃度,但是通常不是用户真正的目的。而上述设计的区域热度值可以解决这种不真实的活跃度的问题,从而发现更真实的城市热点区域。
进一步地,在其中一个实施例中,步骤4所述基于网格区域的热度值Hi,对人类活动数据进行OPTICS聚类,与传统的OPTICS聚类算法相比,基于热度值的OPTICS聚类算法利用城市区域的热度值,即考虑到了人类出行的密度以及真实目的,可以聚类出更加真实、多元的功能区域。其具体实施方法为:该方法需要两个超参数作为输入:质心的最大半径eps和集群内的最少数量minPts。基于热度值的OPTICS方法考虑到了城市人类活动密度的以及区域的有效活跃度的问题,对于不同的区域根据其热度值赋予了不同的质心半径MR:
MR=(1-l*Hi)*eps
式中,l为超参数,默认为0.01,eps为OPTICS聚类方法中质心的最大半径。
进一步地,在其中一个实施例中,步骤5中所述区域间距离相关图Gd、流量相似图Gs、流量交互图Ge、兴趣点相似图Gp具体为:区域间距离相关图Gd=(V,Rd,Ad)、流量相似图Gs=(V,Rs,As)、流量交互图Ge=(V,Re,Ae)、兴趣点相似图Gp=(V,Rp,Ap);其中V表示按照步骤4得到的功能区域数,Rd、Rs、Re、Rp分别表示区域之间的距离关系、流量相似关系、流量交互关系、兴趣点相似关系,A∈RV×V表示节点的邻接矩阵;
Figure BDA0002764168210000061
Figure BDA0002764168210000062
Figure BDA0002764168210000063
Figure BDA0002764168210000064
式中,
Figure BDA0002764168210000065
分别为区域i和j间距离相关图、流量相似图、流量交互图、兴趣点相似图中节点的邻接矩阵,ρi,j表示区域i和区域j的Pearson相关性,dist(i,j)表示区域i和区域j的区域中心的欧式距离,Fi,j表示从区域i流入区域j的人流数量,Th均表示阈值,Γ表示正则化函数。
进一步地,在其中一个实施例中,步骤6所述使用基于图卷积神经网络结构的多模态融合模型,对区域人群流量进行预测,具体包括:
步骤6-1,利用图卷积神经网络对四种多模态相关性图进行图卷积操作,得到每个相关性图的输出Oi
步骤6-2,对不同模态的相关性图的卷积结果Oi进行融合操作,所用公式为:
O=W1⊙O1+W2⊙O2+W3⊙O3+W4⊙O4
式中,W1...W4为多模态中的可调参数,分别代表区域间距离相关性、流量相似性、流量交互性、兴趣点相似性产生效应的程度;O1...O4分别表示基于图卷积神经网络的区域间距离相关图、流量相似图、流量交互图、兴趣点相似图的输出值;⊙表示张量内积;
步骤6-3,将融合得到的结果O输入到多个全连接层f,即可得到最终的预测值为:
Ft=f(O+sigmoid(Oext)⊙O)
式中,Ft为流量预测值,Oext表示额外特征(如交通事故等等),f为全连接神经网络。这里,为了防止突发性事件(如恶劣天气、交通事故)对模型的影响,使用门控单元(sigmoid函数)对额外特征进行平滑。
由上述过程构建出基于图卷积神经网络结构的多模态融合模型,通过反向传播减小预测值和真实值的误差更新模型参数,获得训练后的人群流量预测模型;
步骤6-4,针对待预测人群流量的城市区域,执行步骤1至步骤5,获得相应的多模态相关性图,将这些图输入人群流量预测模型得到人群流量预测结果。
作为一种具体示例,在其中一个实施例中,对本发明进行进一步验证说明。
本实施例中选择10000m×10000m范围的上海和北京地区作为研究城市区域,同时收集了真实的上海自行车数据和北京出租车数据来测试本发明的模型。上海自行车包含733,457,167个骑乘记录,从2017年2月至2018年3月在上海市共有314,812辆共享自行车。每条记录都包含一个自行车ID、出发位置,出发时间,到达位置和到达时间;北京出租车数据包含983,457,167个出行记录,时间跨度从2017年2月至2018年3月。每条记录都包含一个出租车ID、出发位置,出发时间,到达位置和到达时间。
对于实验中的流量数据,使用基于热度值的OPTICS算法进行区域划分。如图3所示:使用基于热度值的OPTICS算法得到不同种类的城市功能区域,其中每个灰度值像素标识一个类别。
本实施例选择目前流行的不同流量预测方法作为对比方法来进行对比实验:全连接(FNN)、扩散卷积递归神经网络(DCRNN)、注意力图卷积模型(AGCN)。本发明的方法记作MVFCR。
对比实验的实验结果如图4所示,横轴表示需要预测的未来时间流量的时间步长,纵轴表示评价指标(MSE,RMSE)。可以看到:本发明提出的MVFCR模型优于其他三种方法。其中,FNN性能最差,因为它仅使用最新的交通数据,并且没有考虑相关的时空信息,因此它忽略了许多其他重要因素。性能其次差的是DCRNN算法,它忽略了区域之间的多重相关性,所以这种方法对于长距离人群运动中的交通流量的预测效果不好。AGCN方法在最初的几个时间步长中与本发明的MFCFP方法非常接近,但是随着时间步长的增加,其多重相关性会产生更大的影响,并且高度动态的城市环境也会影响注意力机制的效果,因此误差会增加。这证明本发明的方法对于预测城市区域人群流量是有效的。
本发明方法能够划分更加真实、多元的热点区域,并充分利用城市区域之间潜在的多种相关性。在基于海量的城市时空数据计算中,具有更良好的预测效果,且通过与其他相关算法对比,进一步验证了本发明的方法可以更准确地对人群流量进行预测。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (8)

1.一种基于城市区域多模态融合的人群流量预测方法,其特征在于,所述方法包括以下步骤:
步骤1,获取城市数据,并对数据进行预处理以消除噪声数据;
步骤2,将城市划分成等大小(H×W)的网格区域gi,并构建相应大小结构的城市数据矩阵:人类活动数据矩阵Mflow、城市兴趣点数据矩阵Mpoi和天气温度数据矩阵Mext
步骤3,计算每个网格区域的流行度PRi、兴趣点差异性矩阵f,并进一步计算网格区域的热度值Hi
步骤4,基于网格区域的热度值Hi,对人类活动数据进行OPTICS聚类,将城市划分成多种类的功能区域C;
步骤5,计算每个网格区域的欧几里得距离、流量相似度、兴趣点相似度,并基于划分好的城市功能区域构建多模态相关性图:区域间距离相关图Gd、流量相似图Gs、流量交互图Ge、兴趣点相似图Gp
步骤6,基于多模态相关性图,使用基于图卷积神经网络结构的多模态融合模型,对区域人群流量进行预测。
2.根据权利要求1所述的基于城市区域多模态融合的人群流量预测方法,其特征在于,所述城市数据包括:
人类活动数据,包括人类活动起始点(x1,y1)以及终止点(x2,y2),以及对应的事件发生时间t1、t2
城市兴趣点数据,包括兴趣点名称、类别、位置;
天气温度数据,包括每个时刻的天气及温度。
3.根据权利要求2所述的基于城市区域多模态融合的人群流量预测方法,其特征在于,步骤1中所述对数据进行预处理以消除噪声数据,具体过程包括:
步骤1-1,若某一条数据记录中的某一特征存在空值,将该条数据删除;
步骤1-2,对剩余的数据进行降维处理,删除其中的离群点数据;
步骤1-3,对剩余的数据进行归一化处理,并将天气温度数据处理成独热值数据。
4.根据权利要求3所述的基于城市区域多模态融合的人群流量预测方法,其特征在于,步骤2中所述城市数据矩阵包括人类活动数据矩阵Mflow、城市兴趣点数据矩阵Mpoi和天气温度数据矩阵Mext,计算公式分别为:
Figure FDA0002764168200000021
Figure FDA0002764168200000022
Figure FDA0002764168200000023
式中,
Figure FDA0002764168200000024
表示网格区域i在t时刻的入度流量,
Figure FDA0002764168200000025
表示网格区域i在t时刻的出度流量;
Figure FDA0002764168200000026
表示网格区域i的第k类的兴趣点数量;
Figure FDA0002764168200000027
Figure FDA0002764168200000028
分别表示网格区域i在t时刻的天气和温度特征;K代表兴趣点的类别总数,H和W代表城市被划分成网格的尺寸,T代表人群活动持续的时间,时间跨度为一小时,D代表天气温度数据所处的日期,时间跨度为一小时。
5.根据权利要求4所述的基于城市区域多模态融合的人群流量预测方法,其特征在于,步骤3中所述网格区域流行度使用PageRank值进行度量,计算公式为:
Figure FDA0002764168200000029
式中,PRi表示第i个网格区域流行度,outj表示第j个网格区域流出流量的大小,
Figure FDA00027641682000000210
表示第i个网格区域流出流量的目的地网格区域集合,R表示网格区域总数,
Figure FDA00027641682000000211
和β表示控制PageRank值大小的参数;
所述兴趣点差异性矩阵f的计算过程包括:
(1)计算网格内兴趣点的特征值vi,g,vi,g表示网格区域i的g类兴趣点的特征值:
Figure FDA00027641682000000212
式中,ng表示属于第g类的兴趣点数量,Ni表示位于网格区域i的所有兴趣点数量,rg表示含有第g类兴趣点网格区域总数;
(2)计算不同网格的兴趣点差异性,构建兴趣点差异性矩阵f:
Figure FDA0002764168200000031
式中,f(vi,vj)表示网格区域i和网格区域j的兴趣点差异性,vig和vjo分别表示网格区域i的g类兴趣点的特征值和网格区域j的o类兴趣点的特征值,vi和vj分别表示网格区域i和网格区域j的所有兴趣点的特征,该式表示若两个网格区域的最重要的兴趣点是同一类,则将两区域的兴趣点特征值相加,否则相减并取其绝对值;
所述网格区域的热度值Hi的计算公式为:
Figure FDA0002764168200000032
其中,
Figure FDA0002764168200000033
式中,h(i,j)为网格区域距离度量参数,α为差异性度量参数,σ表示距离方差,dist(i,j)为网格区域i和网格区域j的欧几里得距离,neii表示网格区域i的指定半径内的邻居区域;当网格区域i周围的网格区域流行度越高,并且与周围的区域兴趣点特征差异性越大,该网格区域的热度值越高。
6.根据权利要求5所述的基于城市区域多模态融合的人群流量预测方法,其特征在于,步骤4所述基于网格区域的热度值Hi,对人类活动数据进行OPTICS聚类,其中对于不同的网格区域根据其热度值赋予不同的质心半径MR:
MR=(1-l*Hi)*eps
式中,l为超参数,默认为0.01,eps为OPTICS聚类方法中质心的最大半径。
7.根据权利要求6所述的基于城市区域多模态融合的人群流量预测方法,其特征在于,步骤5中所述区域间距离相关图Gd、流量相似图Gs、流量交互图Ge、兴趣点相似图Gp具体为:区域间距离相关图Gd=(V,Rd,Ad)、流量相似图Gs=(V,Rs,As)、流量交互图Ge=(V,Re,Ae)、兴趣点相似图Gp=(V,Rp,Ap);其中V表示按照步骤4得到的功能区域数,Rd、Rs、Re、Rp分别表示区域之间的距离关系、流量相似关系、流量交互关系、兴趣点相似关系,A∈RV×V表示节点的邻接矩阵;
Figure FDA0002764168200000041
Figure FDA0002764168200000042
Figure FDA0002764168200000043
Figure FDA0002764168200000044
式中,
Figure FDA0002764168200000045
分别为区域i和j间距离相关图、流量相似图、流量交互图、兴趣点相似图中节点的邻接矩阵,ρi,j表示区域i和区域j的Pearson相关性,dist(i,j)表示区域i和区域j的区域中心的欧式距离,Fi,j表示从区域i流入区域j的人流数量,Th均表示阈值,Γ表示正则化函数。
8.根据权利要求7所述的基于城市区域多模态融合的人群流量预测方法,其特征在于,步骤6所述使用基于图卷积神经网络结构的多模态融合模型,对区域人群流量进行预测,具体包括:
步骤6-1,利用图卷积神经网络对四种多模态相关性图进行图卷积操作,得到每个相关性图的输出Oi
步骤6-2,对不同模态的相关性图的卷积结果Oi进行融合操作,所用公式为:
O=W1⊙O1+W2⊙O2+W3⊙O3+W4⊙O4
式中,W1...W4为多模态中的可调参数,分别代表区域间距离相关性、流量相似性、流量交互性、兴趣点相似性产生效应的程度;O1...O4分别表示基于图卷积神经网络的区域间距离相关图、流量相似图、流量交互图、兴趣点相似图的输出值;⊙表示张量内积;
步骤6-3,将融合得到的结果O输入到多个全连接层f,即可得到最终的预测值为:
Ft=f(O+sigmoid(Oext)⊙O)
式中,Ft为流量预测值,Oext表示额外特征,f为全连接神经网络。
由上述过程构建出基于图卷积神经网络结构的多模态融合模型,通过反向传播减小预测值和真实值的误差更新模型参数,获得训练后的人群流量预测模型;
步骤6-4,针对待预测人群流量的城市区域,执行步骤1至步骤5,获得相应的多模态相关性图,将这些图输入人群流量预测模型得到人群流量预测结果。
CN202011227802.8A 2020-11-06 2020-11-06 基于城市区域多模态融合的人群流量预测方法 Active CN112396218B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011227802.8A CN112396218B (zh) 2020-11-06 2020-11-06 基于城市区域多模态融合的人群流量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011227802.8A CN112396218B (zh) 2020-11-06 2020-11-06 基于城市区域多模态融合的人群流量预测方法

Publications (2)

Publication Number Publication Date
CN112396218A true CN112396218A (zh) 2021-02-23
CN112396218B CN112396218B (zh) 2024-01-09

Family

ID=74598240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011227802.8A Active CN112396218B (zh) 2020-11-06 2020-11-06 基于城市区域多模态融合的人群流量预测方法

Country Status (1)

Country Link
CN (1) CN112396218B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077053A (zh) * 2021-03-18 2021-07-06 中国电子科技集团公司第五十四研究所 多元群体活动模式表征方法及目标地理活动区域识别方法
CN113420720A (zh) * 2021-07-21 2021-09-21 中通服咨询设计研究院有限公司 一种高精度低延时大型室内场馆人群分布计算方法
CN114358375A (zh) * 2021-11-29 2022-04-15 重庆邮电大学 一种基于大数据的人群密度预测方法及系统
CN115690556A (zh) * 2022-11-08 2023-02-03 河北北方学院附属第一医院 一种基于多模态影像学特征的图像识别方法及系统
CN117649028A (zh) * 2024-01-26 2024-03-05 南京航空航天大学 基于城市功能区域匹配的跨城市人群流量趋势预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967532A (zh) * 2017-10-30 2018-04-27 厦门大学 融合区域活力的城市交通流量预测方法
CN111160521A (zh) * 2019-12-09 2020-05-15 南京航空航天大学 基于深度神经网络图编码器的城市人类流动模式检测方法
CN111612206A (zh) * 2020-03-30 2020-09-01 清华大学 一种基于时空图卷积神经网络的街区人流预测方法及系统
CN111709778A (zh) * 2020-05-29 2020-09-25 北京百度网讯科技有限公司 出行流量预测方法、装置、电子设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967532A (zh) * 2017-10-30 2018-04-27 厦门大学 融合区域活力的城市交通流量预测方法
CN111160521A (zh) * 2019-12-09 2020-05-15 南京航空航天大学 基于深度神经网络图编码器的城市人类流动模式检测方法
CN111612206A (zh) * 2020-03-30 2020-09-01 清华大学 一种基于时空图卷积神经网络的街区人流预测方法及系统
CN111709778A (zh) * 2020-05-29 2020-09-25 北京百度网讯科技有限公司 出行流量预测方法、装置、电子设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
QIANG ZHOU等: "Exploiting Multiple Correlations Among Urban Regions for Crowd Flow Prediction", JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, vol. 35, no. 2, pages 338 - 352, XP037144821, DOI: 10.1007/s11390-020-9970-y *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077053A (zh) * 2021-03-18 2021-07-06 中国电子科技集团公司第五十四研究所 多元群体活动模式表征方法及目标地理活动区域识别方法
CN113420720A (zh) * 2021-07-21 2021-09-21 中通服咨询设计研究院有限公司 一种高精度低延时大型室内场馆人群分布计算方法
CN113420720B (zh) * 2021-07-21 2024-01-09 中通服咨询设计研究院有限公司 一种高精度低延时大型室内场馆人群分布计算方法
CN114358375A (zh) * 2021-11-29 2022-04-15 重庆邮电大学 一种基于大数据的人群密度预测方法及系统
CN114358375B (zh) * 2021-11-29 2024-05-24 重庆邮电大学 一种基于大数据的人群密度预测方法及系统
CN115690556A (zh) * 2022-11-08 2023-02-03 河北北方学院附属第一医院 一种基于多模态影像学特征的图像识别方法及系统
CN117649028A (zh) * 2024-01-26 2024-03-05 南京航空航天大学 基于城市功能区域匹配的跨城市人群流量趋势预测方法
CN117649028B (zh) * 2024-01-26 2024-04-02 南京航空航天大学 基于城市功能区域匹配的跨城市人群流量趋势预测方法

Also Published As

Publication number Publication date
CN112396218B (zh) 2024-01-09

Similar Documents

Publication Publication Date Title
Zheng et al. Deep and embedded learning approach for traffic flow prediction in urban informatics
Yin et al. Multi-stage attention spatial-temporal graph networks for traffic prediction
Hong et al. HetETA: Heterogeneous information network embedding for estimating time of arrival
CN112396218B (zh) 基于城市区域多模态融合的人群流量预测方法
Wang et al. Modeling inter-station relationships with attentive temporal graph convolutional network for air quality prediction
Vasconcelos et al. Smartphone-based outlier detection: a complex event processing approach for driving behavior detection
Yu et al. Taxi-based mobility demand formulation and prediction using conditional generative adversarial network-driven learning approaches
CN108986453A (zh) 一种基于情境信息的交通状况预测方法、系统及装置
Wang et al. An effective dynamic spatiotemporal framework with external features information for traffic prediction
Shao et al. The Traffic Flow Prediction Method Using the Incremental Learning‐Based CNN‐LTSM Model: The Solution of Mobile Application
Modi et al. Multistep traffic speed prediction: A deep learning based approach using latent space mapping considering spatio-temporal dependencies
Wang et al. On prediction of traffic flows in smart cities: a multitask deep learning based approach
Jiang et al. Bi‐GRCN: A Spatio‐Temporal Traffic Flow Prediction Model Based on Graph Neural Network
Huang et al. A multi-mode traffic flow prediction method with clustering based attention convolution LSTM
Wang et al. MMDP: A mobile-IoT based multi-modal reinforcement learning service framework
Djenouri et al. Intelligent deep fusion network for urban traffic flow anomaly identification
Xiao et al. Parking prediction in smart cities: A survey
Khaled et al. Gsta: gated spatial–temporal attention approach for travel time prediction
Hu et al. Multi-source information fusion based dlaas for traffic flow prediction
Xing et al. RL-GCN: Traffic flow prediction based on graph convolution and reinforcement learning for smart cities
Hou et al. Urban region profiling with spatio-temporal graph neural networks
Quan et al. An optimized task assignment framework based on crowdsourcing knowledge graph and prediction
Pan et al. Traffic speed prediction based on time classification in combination with spatial graph convolutional network
Zhao et al. Developing a multiview spatiotemporal model based on deep graph neural networks to predict the travel demand by bus
Xu et al. Short-term bus passenger flow forecast based on the multi-feature gradient boosting decision tree

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant