CN112766240B - 基于时空关系的残差多图卷积人群分布预测方法及系统 - Google Patents

基于时空关系的残差多图卷积人群分布预测方法及系统 Download PDF

Info

Publication number
CN112766240B
CN112766240B CN202110293235.4A CN202110293235A CN112766240B CN 112766240 B CN112766240 B CN 112766240B CN 202110293235 A CN202110293235 A CN 202110293235A CN 112766240 B CN112766240 B CN 112766240B
Authority
CN
China
Prior art keywords
time
grids
grid
graph
constructing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110293235.4A
Other languages
English (en)
Other versions
CN112766240A (zh
Inventor
赵志远
张宇
吴升
张雪霞
李代超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN202110293235.4A priority Critical patent/CN112766240B/zh
Publication of CN112766240A publication Critical patent/CN112766240A/zh
Application granted granted Critical
Publication of CN112766240B publication Critical patent/CN112766240B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/53Recognition of crowd images, e.g. recognition of crowd congestion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于时空关系的残差多图卷积人群分布预测方法及系统。该方法包括:包括:提取各区域各时段人群数量;进行多种空间关系构建并建模;进行时间关系构建并建模;融合时空关系预测人群分布。本发明同时考虑区域之间的邻近性、连通性和功能相似性三种空间关系以及时间关系,从而有效地提高人群分布预测的精度。

Description

基于时空关系的残差多图卷积人群分布预测方法及系统
技术领域
本发明属于空间信息技术领域,特别是涉及一种基于时空关系的残差多图卷积(Spatio-temporal Residual Multi-Graph Convolution Network,STRMGCN)人群分布预测模型,具体为一种基于时空关系的残差多图卷积人群分布预测方法及系统。
背景技术
目前,我国正在经历快速城镇化过程,人口在城市中的大量聚集对城市资源配置提出了更高的要求,而相对滞后的城市发展水平带来了一系列的城市问题(如交通拥堵、人群踩踏等公共安全事件)。研究城市人群移动的时空特征,实现人群分布预测,为优化公共资源、指导商业设施选址、公共安全预警等提供决策支持。
目前人群分布预测主要是基于特定的地理分析单元(如基于道路网络、基于规则格网),根据历史的各个地理分析单元的人群数量,预测未来时刻的各个地理分析单元的人群数量。本发明基于规则地理网格为分析单元实现人群分布预测,与之相近的方法可以分为两类:参数化的方法和非参数化的方法。参数化方法基于历史数据,拟合回归函数最优参数,进而对人群分布进行预测。这类模型主要有时间序列模型[1],线性回归模型[2]和卡尔曼滤波器[3]等。非参数模型一般基于机器学习的方法进行构建,将人群分布的总体作为随机变量,认为其分布是存在的,但是无法知道其分布的形式以及相关参数,只需要足够的历史数据就可以自动地从区域人群数量数据中学习统计规律。非参数模型常用的方法有决策树模型[4]、朴素贝叶斯模型[5]、支持向量机(SVM)模型[6]、神经网络[7,8]等。
现有技术存在的主要缺点是(1)很少同时考虑时空关系对于人群分布预测的影响。人的流动是同时受时间和空间资源约束的,然而现有的算法如SVR、LSTM模型等大多只考虑时间关系对于人群分布预测影响,很少研究同时顾及时空关系对人群分布进行预测。(2)对空间关系的考虑主要局限于邻近区域之间关系,忽略了其他对人群分布的空间关联。现有的算法大多仅考虑相邻区域的影响,然而城市内各区域人群分布具有网络特性,即区域人群分布除了受空间距离本身影响之外,还显著受道路、地铁等骨干交通资源连接的影响。例如虽然两个区域相隔较远,但是有地铁相连,两者的关联性更为密切。
[1]Ding QY,Wang X F,Zhang XY,et al.ForecastingTraffic Volume withSpace-TimeARIMA Model[J].AdvancedMaterialsResearch,2011,156-157:979-983.
[2]Sun H,Zhang C,Ran B.Interval prediction for traffic time seriesusing local linear predictor[C]//Intelligent Transportation Systems,2004.Proceedings.The 7th International IEEE Conference on.IEEE,WA,USA,2004:410-415.
[3]Bossanyi E.Short-term wind prediction using Kalman filters[J].WindEngineering,1985,9(1):1-8.
[4]程娟,陈先华.基于梯度提升决策树的高速公路行程时间预测模型(英文)[J].Journal of Southeast University(English Edition),2019,35(03):393-398.
[5]Castillo E,Menéndez J M,Sánchez-Cambronero S.Predicting trafficflow using Bayesian networks[J].Transportation Research Part BMethodological,2008,42(5):482-509.
[6]Wu C-H,Ho J-M,Lee D-T.Travel-time prediction with support vectorregression[J].IEEE transactions on intelligent transportation systems,2004,5(4):276-281.
[7]Liu Y,Zheng H,Feng X,et al.Short-term traffic flow prediction withConv-LSTM[C].20179th International Conference on Wireless Communications andSignal Processing(WCSP),Nanjing,2017:1-6.
[8]Zhao L,Song Y,Zhang C,et al.T-GCN:A Temporal GraphConvolutionalNetwork for Traffic Prediction[J].IEEE Transactions onIntelligent Transportation Systems,21(9):3848-3858.。
发明内容
本发明的目的在于提供一种基于时空关系的残差多图卷积人群分布预测方法及系统,同时考虑区域之间的邻近性、连通性和功能相似性三种空间关系以及时间关系,从而有效地提高人群分布预测的精度。
为实现上述目的,本发明的技术方案是:一种基于时空关系的残差多图卷积人群分布预测方法,包括:
提取各区域各时段人群数量;
进行多种空间关系构建并建模;
进行时间关系构建并建模;
融合时空关系预测人群分布。
在本发明一实施例中,所述提取各区域各时段人群数量的实现方式为:
数据预处理:对用户轨迹数据中异常值和缺失值进行处理;
研究区域网格划分:设定格网单元在垂直方向和水平方向的尺寸,分别以研究区域左侧边界和下侧边界为起始,向右和向上将研究区域进行网格划分,并对网格进行编码;
各网格各时段人群数量统计:计算每个用户每个时刻所在的网格,按照时间和网格编号对每个网格每个时刻的人群数量进行统计。
在本发明一实施例中,所述提取各区域各时段人群数量的具体实现方式如下:
数据预处理:对原始数据进行重采样和缺失值补全处理,从而形成等间隔的轨迹数据;具体即:首先,将目标时段按照预设的时间窗口宽度进行划分;其次,从第一个窗口开始遍历,如果该时间窗口中存在多条记录时,采用重采样方法,保留位置频次最高且靠近时间窗口中间的记录,如果该时间窗口无相关记录,则选择时间上与其最临近的前一个记录位置对缺失值进行补全;
研究区域网格划分:首先设定网格单元在垂直方向和水平方向的尺寸,分别以研究区域左侧边界和下侧边界为起始,向右和向上将研究区域进行网格划分,并根据网格的行列号对网格进行编码,具体行列号计算参考公式(1)到公式(3):
Figure BDA0002982179040000031
Figure BDA0002982179040000032
N=countlng*Countlat (3)
式中,maxlng、minlng分别是研究区的最大、最小经度坐标,maxlat、minlat分别是研究区的最大、最小纬度坐标,countlng、countlat为行列号的总数,d为规则格网尺寸,N为网格数量总数;
各网格各时段人群数量统计:首先遍历所有重采样和缺失值补全后的用户轨迹,如公式(4)所示,重采样和缺失值补全后的用户u的轨迹traju由经纬度坐标
Figure BDA0002982179040000033
构成,然后利用公式(5)至公式(7)计算每个用户每个时刻所属的网格,再而利用公式(8)和公式(9)按照时间和网格编号进行统计获得每个网格的人群数量变化;
Figure BDA0002982179040000034
Figure BDA0002982179040000035
Figure BDA0002982179040000039
Figure BDA0002982179040000036
Figure BDA0002982179040000037
Flow=(Flow1,Flow2,…,FlowN) (9)
式中,traju表示用户u由经纬度构成的轨迹,
Figure BDA0002982179040000038
表示用户u第t个时刻的经纬度坐标,t∈[1,M],M表示记录时刻总数,
Figure BDA0002982179040000041
表示用户u第t个时刻所在网格的行号,
Figure BDA0002982179040000042
表示用户u第t个时刻所在网格的列号,maxlng、minlng分别是研究区的最大、最小经度坐标,
Figure BDA0002982179040000043
为用户u第t个时刻所在的格网编号,d为规则格网尺寸;Flow∈RN×M为所有网格的人群数量;Flowi∈RM为第i个网格的各个时刻的人群数量,
Figure BDA0002982179040000044
表示第t个时刻第i个网格的人群数量。
在本发明一实施例中,所述多种空间关系构建并建模的实现方式为:
空间关系构建:构建三种空间关系,第一种基于空间的相近程度构建邻近性关系,第二种利用研究区域间POI的相似程度构建研究区域之间功能相似性关系,第三种利用研究区域之间路网的最短距离构建连通性关系;
多图融合:对三种空间关系构成的图矩阵通过加权求和的方式合并成一个图矩阵;
多图卷积:利用融合后的图矩阵和各网格历史时刻的人群数量进行残差图卷积操作提取多种空间关系。
在本发明一实施例中,所述多种空间关系构建并建模的具体实现方式如下:
空间关系构建:
(a)邻近空间关系图构建:邻近图GJ=(V,AJ)是基于空间的邻近性定义的,与任一网格的有邻近关系格网就是与其相连接的八邻域网格,其中V=(v1,v2,…,vN},表示N个网格的集合,AJ∈RN×N,表示各个网格间的邻接关系;将网格看成结点,网格与网格之间的邻近性看成边,构成邻近性矩阵图;计算公式如下:
Figure BDA0002982179040000045
式中,AJ表示邻近性图矩阵,vj和vj表示第i个网格和第j个网格;
(b)功能相似度图构建:功能相似度图GP=(V,AP)是基于网格之间POI的相似程度构建的,每个网格的功能使用网格内的POI类别来表达,其中,V={v1,v2,…,vN},表示N个网格的集合,AP∈RN×N,表示各个网格间的POI的相似性程度;将每个网格看成一个顶点,利用皮尔逊相关系数(12)衡量网格之间功能的相似性,将网格之间的功能的相似程度看成边,构成功能相似性图;计算公式如下:
Figure BDA0002982179040000046
Figure BDA0002982179040000051
式中,
Figure BDA0002982179040000052
表示第i个网格和第j个网格内第z种POI占所有POI的比值,z∈[1,Z],Z表示POI的种类,r表示第i个网格和第j个网格之间的功能相似度,AP表示功能相似性图矩阵;
(c)连通性图构建:区域的连通性图GC=(V,AC)是基于网格之间路网的最短距离构建的,其中,V={v1,v2,…,vN},表示N个网格的集合,AC∈RN×N,表示各个网格间的连通性关系;基于预测时间步长设置距离阈值δ,网格之间的最短路网格距离超过阈值则将其连通性设置为0;此外,由于在构建邻近性关系时已经考虑了与预测网格相邻接的网格,为了不重复提取邻接网格的空间的关系,在构建连通性矩阵时,将与预测网格相邻接的网格的连通性置为0;计算公式如下:
Figure BDA0002982179040000053
d(vi,vJ)=min(d(vi,vJ)) (14)
式中,d(vi,vj)表示第i个网格和第j个网格之间的最短距离,d(vi,vj)表示连接第i个网格和第j个网格所有道路的距离,AC代表连通性图矩阵;
多图融合:对上述三种图矩阵进行加权求和来融合;由于不同图矩阵的值的衡量尺度不一致,所以需要先对每个图矩阵进行归一化,具体计算公式如下:
L=I-D1/2AD1/2 (15)
Figure BDA0002982179040000054
式中A代表图矩阵(A∈[AJ,AP,AC]),D表示度矩阵,计算方法如公式(12),L表示归一化后的图矩阵,I表示单位矩阵,即每一个位于主对角线的元素为1,其他元素为0;
对三种图矩阵按照公式(15)分别进行归一化得到归一化后的邻近性图矩阵LJ,功能相似性图矩阵LP,连通性图矩阵LC;接着对三种归一化的图矩阵进行加权求和,加权求和的过程如下:
LF=WJ⊙LJ+WP⊙LP+WC⊙LC (17)
式中LF为加权求和后的图矩阵,WJ、WP、WC为可训练的参数;
多图卷积:利用残差图卷积模型对空间关系建模,残差图卷积模型就是在图卷积模型的基础上,为每一层增加一层残差连接,这些残差连接将每一层输入与输出求和作为下一层的输入,为信息和梯度的传输提供了额外的连接通道,有效地缓解因层次较多导致的过拟合问题,具体计算公式如下:
Figure BDA0002982179040000061
relu(x)=max(0,x) (19)
X′l+1=Xl+1+Xl (20)
式中Xl为N个网格l层的输入特征,Xl+1为N个网格l层的输出特征,X′l+1为N个网格l+1层的输入特征,M为特征数,
Figure BDA0002982179040000062
为融合后的图矩阵的k次幂;Yk是可训练的参数,K是图卷积的阶数,relu为激活函数,其中max为取最大值函数。
在本发明一实施例中,所述时间关系构建并建模的实现方式为:
时间邻近关系构建:设定时间分析单元长度并划分时间窗口,构建临近性时间序列,即与要预测时刻直接相临近的历史时间窗口;
时间关系建模:利用长短期记忆模型对临近性时间关系建模,提取与要预测时刻相临近的历史人群数量信息。
在本发明一实施例中,所述时间关系构建并建模的具体实现方式如下:
时间邻近关系构建:设定时间分析单元长度并划分时间窗口,构建与要预测时刻直接相临近的预定时间步长内的前若干个时刻的值作为临近性时间序列;
时间关系建模:首先输入第t个时刻的所有网格的人群数量量Xt,利用第t-1个时刻的输出ht-1和第t个时刻的输入Xt计算遗忘门ft,该层的输出是一个0到1之间的数值,用来确定第t-1个时刻人群数量信息的保留程度:
ft=σ(Wf·[ht-1,Xt]+bf) (21)
Figure BDA0002982179040000063
式中ht-1表示第t-1个时刻的输出,经过迭代循环计算获得,Xt表示第t个时刻的所有网格的人群数量,ft表示t时刻忘记门函数,Wf为输入层的权重矩阵,bf为输入层偏执项,σ为sigmoid函数;
接着利用第t-1个时刻的输出ht-1和第t个时刻的输入Xt计算输入门it,该层的输出是一个0到1之间的数值,用来确定t时刻人群数量信息的保留程度;同时,利用t-1时刻的输出ht-1和当前t时刻的输入xt生成一个候选向量
Figure BDA0002982179040000075
it=σ(Wi·[ht-1,Xt]+bi) (23)
Figure BDA0002982179040000071
Figure BDA0002982179040000072
式中Wi、WC分别表示输入和状态更新层中的权重矩阵,而bi、bc为则为对应的偏执项,tanh为激活函数;
然后更新细胞状态,即将Ct-1更新为Ct;将遗忘门的值ft与存储历史人群数量信息的旧的细胞状态Ct-1相乘,遗忘部分历史人群数量信息,然后将输入门值it与候选向量
Figure BDA0002982179040000073
相乘,存储当前时刻的部分人群数量信息,最后将两个结果相加,确定新的细胞状态:
Figure BDA0002982179040000074
最后利用第t-1个时刻的输出ht-1和第t个时刻的输入Xt计算输出门ot,该层的输出是一个0到1之间的数值,用来确定将新的细胞状态哪些部分输出;然后利用tanh函数对细胞状态Ct处理,而后将处理后的值与输出门值ot相乘得到输出值:
ot=σ(Wo·[ht-1,Xt]+bo) (27)
ht=ot*tanh(Ct) (28)
式中Wo和bo分别为输入出层的权重矩阵和偏执项。
在本发明一实施例中,所述融合时空关系预测人群分布实现方式为:
构建模型的输入:构建临近性时间序列;
空间关系建模:构建多种空间关系,利用残差多图卷积对区域间的空间关系建模;
时间关系建模:利用长短期记忆模型对人群数量的时间特征建模。
在本发明一实施例中,所述融合时空关系预测人群分布的具体实现方式如下:
构建模型的输入:利用所有网格的历史人群数量构建临近性时间序列XR=[Xt-T,Xt-T+1,…Xt-2,Xt-1],T为时间步长;
空间关系建模:首先利用图构建邻近性、功能相似性、连通性三种空间关系矩阵,然后将临近性时间序列XR和三种矩阵(AJ,AP,AC)输入到残差多图卷积模型,实现对空间关系的建模,得到提取空间关系后的矩阵X′R=[X′t-T,X′t-T+1,…X′t-2,X′t-1]:
X′R=RMGCN(XR,AJ,AP,AC) (29)
式中,RMGCN的计算参见公式(15)到(20),XR为第t-1个时刻到第t-T个时刻T个时间步长内所有网格的人群数量,X′R为提取空间关系后第t-1个时刻到第t-T个时刻T个时间步长内所有网格的人群数量值;
时间关系建模:将提取空间关系后的矩阵X′R输入长短期记忆网络模型得到预测结果Yt
Yt=LSTM(X′R) (30)
式中,LSTM的计算参见公式(21)到公式(28),Yt为所有网格第t个时刻的预测人群数量。
本发明还提供了一种基于时空关系的残差多图卷积人群分布预测系统,包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如上述所述的方法步骤。
相较于现有技术,本发明具有以下有益效果:
(1)本发明考虑了多种空间关系,提出了每种空间关系的构建方式,并在图卷积的基础上引入残差连接,构建残差多图卷积模型对空间关系建模,有效地缓解了多层图卷积带来的过平滑问题。
(2)本发明同时考虑了时空关系对于各网格人群数量预测的影响,提出了融合时空关系的STRMGCN模型,有效地的提高了人群分布预测的精度。
附图说明
图1为本发明时空残差多图卷积人群分布预测模型基本框架。
图2为邻近性关系。
图3为功能相似性关系。
图4为连通性关系。
图5为残差图卷积示意图。
图6为图卷积示意图。
图7为长短期记忆模型。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本发明一种基于时空关系的残差多图卷积人群分布预测方法,包括:
提取各区域各时段人群数量;
进行多种空间关系构建并建模;
进行时间关系构建并建模;
融合时空关系预测人群分布。
本发明还提供了一种基于时空关系的残差多图卷积人群分布预测系统,包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如上述所述的方法步骤。
以下为本发明的具体实现过程。
本发明的目的在于提出一种基于时空关系的残差多图卷积人群分布预测模型,该模型的基本框架如附图1,包括如下步骤:
第一步,各区域各时段人群数量的提取。
(1)数据预处理。对用户轨迹中异常值和缺失值进行处理。(2)研究区域网格划分。设定格网单元在垂直方向和水平方向的尺寸,分别以研究区域左侧边界和下侧边界为起始,向右和向上将研究区域进行网格划分,并对网格进行编码。(3)各网格各时段人群数量统计。计算每个用户每个时刻所在的网格,按照时间和网格编号对每个网格每个时刻的人群数量进行统计。
第二步,多种空间关系构建及建模。
(1)空间关系构建。本发明构建三种空间关系,第一种基于空间的相近程度构建邻近性关系,第二种是利用区域间POI的相似程度构建区域之间功能相似性关系,第三种是利用区域之间路网的最短距离构建连通性关系。(2)多图融合。对三种空间关系构成的图矩阵通过加权求和的方式合并成一个图矩阵。(3)多图卷积。利用融合后的图矩阵和各网格历史时刻的人群数量进行残差图卷积操作提取多种空间关系。
第三步,时间关系构建及建模。
(1)时间邻近关系构建。设定时间分析单元长度并划分时间窗口,构建临近性时间序列,即与要预测时刻直接相临近的历史时间窗口,(2)时间关系建模。本发明利用长短期记忆模型对临近性时间关系建模,提取与要预测时刻相临近的历史人群数量信息。
第四步,融合时空关系预测各网格人群数量。
(1)构建模型的输入。构建临近性时间序列。(2)空间关系建模。构建多种空间关系,利用残差多图卷积对区域间的空间关系建模。(3)时间关系建模。利用长短期记忆模型对人群数量的时间特征建模。
在上述步骤中,各区域各时段人群数量的提取、多种空间关系构建及建模、时间关系构建及建模、融合时空关系预测各网格人群数量是本发明的重点,在以下小节中进行详细论述。
(1)各区域各时段人群数量的提取
各区域各时段人群数量的提取具体方法会因数据来源不同而存在差异,本发明以手机数据为例对区域的人群数量提取方法进行说明,基于其他数据提取人群数量可具体参照有关方法。具体步骤如下:
(a)对原始手机数据重采样和缺失值补全处理,从而形成等间隔的轨迹数据。具体操作如下,首先,将目标时段按照预设的时间窗口宽度进行划分;其次,从第一个窗口开始遍历,如果该时间窗口中存在多条记录时,采用重采样方法,保留位置频次最高且靠近时间窗口中间的记录,如果该时间窗口无相关记录,则选择时间上与其最临近的前一个记录位置对缺失值进行补全。
(b)研究区格网化。首先设定网格单元在垂直方向和水平方向的尺寸,分别以研究区域左侧边界和下侧边界为起始,向右和向上将研究区域进行网格划分,并根据网格的行列号对网格进行编码,具体行列号计算参考公式(1)到公式(3)。
Figure BDA0002982179040000101
Figure BDA0002982179040000102
N=countlng*countlat (3)
式中,maxlng、minlng分别是研究区的最大、最小经度坐标,maxlat、minlat分别是研究区的最大、最小纬度坐标,countlng、countlat为行列号的总数,d为规则格网尺寸,N为网格数量总数;
(c)网格人群数量提取。设计的网格人群数量提取的算法如附表1所示,本文利用重采样和缺失值补全后的用户轨迹按照时间和网格编号进行统计获得每个网格的人群数量变化。首先遍历所有重采样和缺失值补全后的用户轨迹,如公式4所示,重采样和缺失值补全后的用户u的轨迹traju由经纬度坐标
Figure BDA0002982179040000103
构成,让然后利用公式(5)至公式(7)计算每个用户每个时刻所属的网格,然后按照时间和网格编号进行统计获得每个网格的人群数量变化(公式8和公式9)。
Figure BDA0002982179040000111
Figure BDA0002982179040000112
Figure BDA0002982179040000113
Figure BDA0002982179040000114
Figure BDA0002982179040000115
Flow=(Flow1,Flow2,…,FlowN) (9)
式中,traju表示用户u由经纬度构成的轨迹,
Figure BDA0002982179040000116
表示用户u第t个时刻的经纬度坐标,t∈[1,M],M表示记录时刻总数,
Figure BDA0002982179040000117
表示用户u第t个时刻所在网格的行号,
Figure BDA0002982179040000118
表示用户u第t个时刻所在网格的列号,maxlng、minlng分别是研究区的最大、最小经度坐标,
Figure BDA0002982179040000119
为用户u第t个时刻所在的格网编号,d为规则格网尺寸;Flow∈RN×M为所有网格的人群数量;Flowi∈RM为第i个网格的各个时刻的人群数量,
Figure BDA00029821790400001110
表示第t个时刻第i个网格的人群数量。
表1网格人群数量提取算法
Figure BDA00029821790400001111
(2)多种空间关系构建及建模
为了获取空间关系对于预测的影响,本发明构建了三种空间关系,并利用残差图卷积模型对其建模,具体操作步骤如下:
(a)邻近空间关系图构建。邻近图GJ=(V,AJ)(V={v1,v2…,vN},表示N个网格的集合,AJ∈RN×N,表示各个网格间的邻接关系)是基于空间的邻近性定义的,与任一网格的有邻近关系格网就是与其相连接的八邻域网格。如附图2所示,网格1的与网格2和4邻接,网格4与网格1、3、5邻接。本发明将网格看成结点,网格与网格之间的邻近性看成边,构成邻近性矩阵图。计算公式如下:
Figure BDA0002982179040000121
式中,AJ表示邻近性图矩阵,vj和vj表示第i个网格和第j个网格;
(b)功能相似度图构建。功能相似度图GP=(V,AP)(V={v1,v2,…,vN},表示N个网格的集合,AP∈RN×N,表示各个网格间的POI的相似性程度)是基于网格之间POI的相似程度构建的。如附图3所示,每个网格的功能可以使用网格内的POI类别来表达,如网格1中有公园、学校和医院,网格5中有医院,网格6中有公园,网格1和5都有医院,网格1和6都有公园,所以网格1与网格5和6之间的功能有着一定的相似性,而网格5和6的POI类别完全不同,不具备功能相似性。本发明每个网格看成一个顶点,利用皮尔逊相关系数衡量网格之间功能的相似性(公式(12)),将网格之间的功能的相似程度看成边,构成功能相似性图。计算公式如下:
Figure BDA0002982179040000122
Figure BDA0002982179040000123
式中,
Figure BDA0002982179040000124
表示第i个网格和第j个网格内第z种POI占所有POI的比值,z∈[1,Z],Z表示POI的种类,r表示第i个网格和第j个网格之间的功能相似度,AP表示功能相似性图矩阵;
(c)连通性图构建。区域的连通性图GC=(V,AC)(V={v1,v2,…,vN},表示N个网格的集合,AC∈RN×N,表示各个网格间的连通性关系)是基于网格之间路网的最短距离构建的。有些区域虽然与预测区域相隔较远,但是却有道路相连,对于预测区域也有着一定影响。如附图4所示,网格1和网格3、5虽然不是邻接关系,但是却有道路相连,所以网格3、5对网格1的人群数量也有着一定的影响,本发明利用网格之间路网的最短距离衡量其连通性。由于人在一定时间内移动的距离是有限的,如网格5和网格2,网格3和网格6虽然有道路相连,但是在预测的时间步长内,人无法移动这么远的距离,本发明认为这些网格不具备连通性,于是发明基于预测时间步长设置距离阈值δ,网格之间的最短路网距离超过阈值则将其连通性设置为0。此外,由于在构建邻近性关系时已经考虑了与预测网格相邻接的网格,为了不重复提取邻接网格的空间的关系,本文在构建连通性矩阵时,将与预测网格相邻接的网格的连通性置为0。计算公式如下:
Figure BDA0002982179040000131
d(vi,vj)=min(d(vi,vj)) (14)
式中,d(vi,vj)表示第i个网格和第j个网格之间的最短距离,d(vi,vj)表示连接第i个网格和第j个网格所有道路的距离,AC代表连通性图矩阵;
(d)多图融合。图融合步骤是将上述三种图融合一个图。本发明对上述三种图矩阵进行加权求和来融合。由于不同图矩阵的值的衡量尺度不一致,所以需要先对每个图矩阵进行归一化(公式(15))。
L=I-D1/2AD1/2 (15)
Figure BDA0002982179040000132
式中A代表图矩阵(A∈[AJ,AP,AC]),D表示度矩阵,计算方法如公式(12),L表示归一化后的图矩阵,I表示单位矩阵,即每一个位于主对角线的元素为1,其他元素为0;
本发明对三种图矩阵按照公式(15)分别进行归一化得到归一化后的邻近性图矩阵LJ,功能相似性图矩阵LP,连通性图矩阵LC。接着对三种归一化的图矩阵进行加权求和,加权求和的过程如下:
LF=WJ⊙LJ+WP⊙LP+WC⊙LC (17)
式中LF为加权求和后的图矩阵,WJ、WP、WC为可训练的参数;
(e)利用残差图卷积提取空间关系。本发明利用残差图卷积模型对空间关系建模,如附图5所示,残差图卷积模型就是在图卷积模型的基础上,为每一层增加一层残差连接,这些残差连接将每一层输入与输出求和作为下一层的输入(公式(20)),为信息和梯度的传输提供了额外的连接通道,有效地缓解了因层次较多导致的过拟合问题。本发明使用k阶图卷积模型(公式(18)),k决定了图卷积的范围,如附图6所示,当k=0时,
Figure BDA0002982179040000133
(I为单位矩阵),该模型不能提取空间关系。当k>0时,该模型可以提取k阶邻域关系,k=1时,该模型可以提取预测网格的一阶邻域关系,k=2时,该模型可以提取预测网格的一阶和二阶邻域关系。
Figure BDA0002982179040000134
relu(x)=max(0,x) (19)
X′l+1=Xl+1+Xl (20)
式中Xl为N个网格l层的输入特征,Xl+1为N个网格l层的输出特征,X′l+1为N个网格l+1层的输入特征,M为特征数,
Figure BDA0002982179040000144
为融合后的图矩阵的k次幂。γk是可训练的参数,K是图卷积的阶数,relu为激活函数,如果输入数值为负,将其转为0,否则,维持原数值,计算方式见公式(19),其中max为取最大值函数。
(3)时间关系构建及建模
为了获得用户历史时刻人群数量信息对下一个时刻人群数量预测的影响,本发明利用长短期记忆模型对临近性时间特征进行建模。具体流程说明如下:
(a)构建临近性时间序列。将要预测时刻一定时间步长内前几个时刻的值作为临近性时间序列。
(b)利用长短期记忆模型对邻近性时间序列建模提取临近性时间关系。结合附图7说明,具体步骤如下:
首先输入第t个时刻的所有网格的人群数量量Xt,利用第t-1个时刻的输出ht-1和第t个时刻的输入Xt计算遗忘门ft,该层的输出是一个0到1之间的数值,用来确定第t-1个时刻人群数量信息的保留程度。
ft=σ(Wf·[ht-1,Xt]+bf) (21)
Figure BDA0002982179040000141
式中ht-1表示第t-1个时刻的输出,经过迭代循环计算获得,具体可参见此流程最后一步中的公式(28),Xt表示第t个时刻的所有网格的人群数量,ft表示t时刻忘记门函数,Wf为输入层的权重矩阵,通过模型训练获得最优值,bf为输入层偏执项,通过模型训练获得最优值,σ为sigmoid函数,计算方法如公式(22)。
接着利用第t-1个时刻的输出ht-1和第t个时刻的输入Xt计算输入门it,该层的输出是一个0到1之间的数值,用来确定t时刻人群数量信息的保留程度;同时,利用t-1时刻的输出ht-1和当前t时刻的输入xt生成一个候选向量
Figure BDA0002982179040000145
it=σ(Wi·[ht-1,Xt]+bi) (23)
Figure BDA0002982179040000142
Figure BDA0002982179040000143
式中Wi、WC分别表示输入和状态更新层中的权重矩阵,而bi、bc为则为对应的偏执项,均通过模型训练获得最优值,tanh为激活函数,计算方法如公式(25)。
然后更新细胞状态,即将Ct-1更新为Ct;将遗忘门的值ft与存储历史人群数量信息的旧的细胞状态Ct-1相乘,遗忘部分历史人群数量信息,然后将输入门值it与候选向量
Figure BDA0002982179040000151
相乘,存储当前时刻的部分人群数量信息,最后将两个结果相加,确定新的细胞状态:
Figure BDA0002982179040000152
最后利用第t-1个时刻的输出ht-1和第t个时刻的输入Xt计算输出门ot,该层的输出是一个0到1之间的数值,用来确定将新的细胞状态哪些部分输出;然后利用tanh函数对细胞状态Ct处理,而后将处理后的值与输出门值ot相乘得到输出值:
ot=σ(Wo·[ht-1,Xt]+bo) (27)
ht=ot*tanh(Ct) (28)
式中Wo和bo分别为输入出层的权重矩阵和偏执项,通过模型训练获得最优值。
(4)融合时空关系预测人群分布
为了同时获得时空特征,本发明提出融合时空关系的STRMGCN模型。具体步骤如下:
(a)构建模型的输入。利用所有网格的历史人群数量构建临近性时间序列XR=[Xt-T,Xt-T+1,…Xt-2,Xt-1](T为时间步长)。
(b)空间关系建模。首先利用图构建邻近性、功能相似性、连通性三种空间关系矩阵,然后将临近性时间序列XR和三种矩阵(AJ,AP,AC)输入到残差多图卷积模型,实现对空间关系的建模,得到提取空间关系后的矩阵X′R=[X′t-T,X′t-T+1,…X′t-2,X′t-1]。
X′R=RMGCN(XR,AJ,AP,AC) (29)
式中,RMGCN的计算参见公式(15)到(20),XR为第t-1个时刻到第t-T个时刻T个时间步长内所有网格的人群数量,X′R为提取空间关系后第t-1个时刻到第t-T个时刻T个时间步长内所有网格的人群数量值;
(c)时间关系建模。将提取空间关系后的矩阵X′R输入长短期记忆网络模型得到预测结果Yt
Yt=LSTM(X′R) (30)
式中,LSTM的计算参见公式(21)到公式(28),Yt为所有网格第t个时刻的预测人群数量。
本发明还提供了一种基于时空关系的残差多图卷积人群分布预测系统,包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如权利要求1-9所述的方法步骤。
本发明从国内某大城市的手机位置数据,用于分析测试本发明方法对于预测人群分布的有效性。在本次实验中,本发明对研究区域划分格网时以经纬度数据为基准,将网格尺寸设置为0.005度(对应的地理距离约为500米),将预测的时间步长设定为15min,构建联通性矩阵时δ参数设置为20km。
本发明从国内某大城市的手机位置数据,用于分析测试本发明方法对于预测人群分布的有效性。在本次实验中,本发明对研究区域划分格网时以经纬度数据为基准,将网格尺寸设置为0.005度(对应的地理距离约为500米),将预测的时间步长设定为15min,构建联通性矩阵时δ参数设置为20km。
Figure BDA0002982179040000161
Figure BDA0002982179040000162
式中
Figure BDA0002982179040000164
表示第i个网格第t个时刻的预测人群数量,ytrue,i表示第i个网格第t个时刻的真实人群数量,Q为预测的样本数,MAEi表示平均绝对误差,RMSEi表示均方根误差。
本发明使用所有网格平均绝对误差和均方根误差的平均值衡量模型的有效性。
选取了几种经典的预测模型与本发明所提出的模型进行对比。LASSO模型是一种线性回归模型。SVR(支持向量机)模型是一种机器学习模型。LSTM模型和TGCN模型是两种深度学习模型,LSTM模型和TGCN模型学习率设置为0.001,迭代次数设置为1000次,批处理量设置为32。本发明提出的模型学习率设置为0.001,迭代次数设置为2000,批处理量设置为16,图卷积层数设置为3,阶数设置2。实现结果如下附表2。本发明提出的模型平均绝对误差为7.90,均方根误差为12.44,相比于LASSO模型平均绝对误差降低34.98%,均方根误差降低53.89%,相比于SVR模型平均绝对误差降低37.10%,均方根误差降低40.36%,相比于LSTM模型平均绝对误差降低16.49%,均方根误差23.12%,相比于TGCN模型平均绝对误差降低9.40%,均方根误差15.37%。由此可见,本发明提出的STRMGCN模型融合了时空关系,有效地提高了人群分布预测的精度。
表2各模型在不同指标下的对比
Figure BDA0002982179040000163
Figure BDA0002982179040000171
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

Claims (6)

1.一种基于时空关系的残差多图卷积人群分布预测方法,其特征在于,包括:
提取各区域各时段人群数量;
进行多种空间关系构建并建模;
进行时间关系构建并建模;
融合时空关系预测人群分布;
所述提取各区域各时段人群数量的实现方式为:
数据预处理:对用户轨迹数据中异常值和缺失值进行处理;
研究区域网格划分:设定网格单元在垂直方向和水平方向的尺寸,分别以研究区域左侧边界和下侧边界为起始,向右和向上将研究区域进行网格划分,并对网格进行编码;
各网格各时段人群数量统计:计算每个用户每个时刻所在的网格,按照时间和网格编号对每个网格每个时刻的人群数量进行统计;
所述多种空间关系构建并建模的实现方式为:
空间关系构建:构建三种空间关系,第一种基于空间的相近程度构建邻近性关系,第二种利用研究网格之间POI的相似程度构建研究网格之间功能相似性关系,第三种利用研究区域之间路网的最短距离构建连通性关系;
多图融合:对三种空间关系构成的图矩阵通过加权求和的方式合并成一个图矩阵;
多图卷积:利用融合后的图矩阵和各网格历史时刻的人群数量进行残差多图卷积操作提取多种空间关系;
所述时间关系构建并建模的实现方式为:
时间临近关系构建:设定时间分析单元长度并划分时间窗口,构建临近性时间序列,即与要预测时刻直接相临近的历史时间窗口;
时间关系建模:利用长短期记忆模型对临近性时间关系建模,提取与要预测时刻相临近的历史人群数量信息;
所述融合时空关系预测人群分布实现方式为:
构建模型的输入:构建人群数量动态变化序列;
空间关系建模:构建多种空间关系,利用残差多图卷积对网格之间的空间关系建模;
时间关系建模:利用长短期记忆模型对人群数量的时间特征建模。
2.根据权利要求1所述的基于时空关系的残差多图卷积人群分布预测方法,其特征在于,所述提取各区域各时段人群数量的具体实现方式如下:
数据预处理:对用户轨迹数据中异常值和缺失值进行处理,从而形成等间隔的轨迹数据;具体即:首先,将目标时段按照预设的时间窗口宽度进行划分;其次,从第一个窗口开始遍历,如果该时间窗口中存在多条记录时,采用重采样方法,保留位置频次最高且靠近时间窗口中间的记录,如果该时间窗口无相关记录,则选择时间上与其最临近的前一个记录位置对缺失值进行补全;
研究区域网格划分:首先设定网格单元在垂直方向和水平方向的尺寸,分别以研究区域左侧边界和下侧边界为起始,向右和向上将研究区域进行网格划分,并根据网格的行列号对网格进行编码,具体行列号计算参考公式(1)到公式(3):
Figure FDA0003674038550000021
Figure FDA0003674038550000022
N=countlng*countlat (3)
式中,maxlng、minlng分别是研究区的最大、最小经度坐标,maxlat、minlat分别是研究区的最大、最小纬度坐标,countlng、countlat为行列号的总数,d为规则网格尺寸,N为网格数量总数;
各网格各时段人群数量统计:首先遍历所有重采样和缺失值补全后的用户轨迹,如公式(4)所示,重采样和缺失值补全后的用户u的轨迹traju由经纬度坐标
Figure FDA0003674038550000023
构成,然后利用公式(5)至公式(7)计算每个用户每个时刻所属的网格,再而利用公式(8)和公式(9)按照时间和网格编号进行统计获得每个网格的人群数量变化;
Figure FDA0003674038550000024
Figure FDA0003674038550000025
Figure FDA0003674038550000026
Figure FDA0003674038550000027
Figure FDA0003674038550000028
Figure FDA0003674038550000029
式中,traju表示用户u由经纬度构成的轨迹,
Figure FDA00036740385500000210
表示用户u第t个时刻的经纬度坐标,t∈[1,M],M表示记录时刻总数,
Figure FDA00036740385500000211
表示用户u第t个时刻所在网格的行号,
Figure FDA00036740385500000212
表示用户u第t个时刻所在网格的列号,maxlng、minlng分别是研究区的最大、最小经度坐标,
Figure FDA0003674038550000031
为用户u第t个时刻所在的网格编号,d为规则网格尺寸;Flow∈RN×M为所有网格的人群数量;Flowi∈RM为第i个网格的各个时刻的人群数量,
Figure FDA0003674038550000032
表示第t个时刻第i个网格的人群数量。
3.根据权利要求1所述的基于时空关系的残差多图卷积人群分布预测方法,其特征在于,所述多种空间关系构建并建模的具体实现方式如下:
空间关系构建:
(a)邻近空间关系图构建:邻近图GJ=(V,AJ)是基于空间的邻近性定义的,与任一网格的有邻近关系网格就是与其相连接的八邻域网格,其中V={v1,v2,…,vN},表示N个网格的集合,AJ∈RN×N,表示各个网格间的邻接关系,将网格看成结点,网格与网格之间的邻近性看成边,构成邻近性图矩阵;计算公式如下:
Figure FDA0003674038550000033
式中,AJ表示邻近性图矩阵,vj和vj表示第i个网格和第j个网格;
(b)功能相似度图构建:功能相似度图GP=(V,AP)是基于网格之间POI的相似程度构建的,每个网格的功能使用网格内的POI类别来表达,其中,V={v1,v2,…,vN},表示N个网格的集合,AP∈RN×N,表示各个网格间的POI的相似性程度;将每个网格看成一个顶点,利用皮尔逊相关系数(12)衡量网格之间功能的相似性,将网格之间的功能的相似程度看成边,构成功能相似性图矩阵;计算公式如下:
Figure FDA0003674038550000034
Figure FDA0003674038550000035
式中,
Figure FDA0003674038550000036
表示第i个网格和第j个网格内第z种POI占所有POI的比值,z∈[1,Z],Z表示POI的种类,r表示第i个网格和第j个网格之间的功能相似度,AP表示功能相似性图矩阵;
(c)连通性图构建:区域的连通性图GC=(V,AC)是基于网格之间路网的最短距离构建的,其中,V={v1,v2,…,vN},表示N个网格的集合,AC∈RN×N,表示各个网格间的连通性关系;基于预测时间步长设置距离阈值δ,网格之间的最短路网格距离超过阈值则将其连通性设置为0;此外,由于在构建邻近性关系时已经考虑了与预测网格相邻接的网格,为了不重复提取邻接网格的空间的关系,在构建连通性矩阵时,将与预测网格相邻接的网格的连通性置为0;计算公式如下:
Figure FDA0003674038550000041
d(vi,vj)=min(d(vi,vj)) (14)
式中,min(d(vi,vj))表示第i个网格和第j个网格之间的最短距离,d(vi,vj)表示连接第i个网格和第j个网格所有道路的距离,AC代表连通性图矩阵;
多图融合:对上述三种图矩阵进行加权求和来融合;由于不同图矩阵的值的衡量尺度不一致,所以需要先对每个图矩阵进行归一化,具体计算公式如下:
L=I-D1/2AD1/2 (15)
Figure FDA0003674038550000042
式中A代表图矩阵,A∈[AJ,AP,AC],D表示度矩阵,计算方法如公式(16),L表示归一化后的图矩阵,I表示单位矩阵,即每一个位于主对角线的元素为1,其他元素为0;
对三种图矩阵按照公式(15)分别进行归一化得到归一化后的邻近性图矩阵LJ,功能相似性图矩阵LP,连通性图矩阵LC;接着对三种归一化的图矩阵进行加权求和,加权求和的过程如下:
LF=WJ⊙LJ+WP⊙LP+WC⊙LC (17)
式中LF为加权求和后的图矩阵,WJ、WP、WC为可训练的参数;
多图卷积:利用残差多图卷积模型对空间关系建模,残差多图卷积模型就是在图卷积模型的基础上,为每一层增加一层残差连接,这些残差连接将每一层输入与输出求和作为下一层的输入,为信息和梯度的传输提供了额外的连接通道,有效地缓解因层次较多导致的过拟合问题,具体计算公式如下:
Figure FDA0003674038550000043
relu(x)=max(0,x) (19)
X′l+1=Xl+1+Xl (20)
式中Xl为N个网格l层的输入特征,Xl+1为N个网格l层的输出特征,X′l+1为N个网格l+1层的输入特征,M为特征数,
Figure FDA0003674038550000051
为融合后的图矩阵的k次幂;γk是可训练的参数,K是图卷积的阶数,relu为激活函数,其中max为取最大值函数。
4.根据权利要求3所述的基于时空关系的残差多图卷积人群分布预测方法,其特征在于,所述时间关系构建并建模的具体实现方式如下:
时间临近关系构建:设定时间分析单元长度并划分时间窗口,构建与要预测时刻直接相临近的预定时间步长内的前若干个时刻的值作为临近性时间序列;
时间关系建模:首先输入第t个时刻的所有网格的人群数量Xt,利用第t-1个时刻的输出ht-1和第t个时刻的输入Xt计算遗忘门ft,该层的输出是一个0到1之间的数值,用来确定第t-1个时刻人群数量信息的保留程度:
ft=σ(Wf·[ht-1,Xt]+bf) (21)
Figure FDA0003674038550000052
式中ht-1表示第t-1个时刻的输出,经过迭代循环计算获得,Xt表示第t个时刻的所有网格的人群数量,ft表示t时刻遗忘门函数,Wf为输入层的权重矩阵,bf为输入层偏执项,σ为sigmoid函数;
接着利用第t-1个时刻的输出ht-1和第t个时刻的输入Xt计算输入门it,该层的输出是一个0到1之间的数值,用来确定t时刻人群数量信息的保留程度;同时,利用t-1时刻的输出ht-1和当前t时刻的输入xt生成一个候选向量
Figure FDA0003674038550000057
it=σ(Wi·[ht-1,Xt]+bi) (23)
Figure FDA0003674038550000053
Figure FDA0003674038550000054
式中Wi、WC分别表示输入和状态更新层中的权重矩阵,而bi、bc为则为对应的偏执项,tanh为激活函数;
然后更新细胞状态,即将Ct-1更新为Ct;将遗忘门的值ft与存储历史人群数量信息的旧的细胞状态Ct-1相乘,遗忘部分历史人群数量信息,然后将输入门值it与候选向量
Figure FDA0003674038550000055
相乘,存储当前时刻的部分人群数量信息,最后将两个结果相加,确定新的细胞状态:
Figure FDA0003674038550000056
最后利用第t-1个时刻的输出ht-1和第t个时刻的输入Xt计算输出门ot,该层的输出是一个0到1之间的数值,用来确定将新的细胞状态哪些部分输出;然后利用tanh函数对细胞状态Ct处理,而后将处理后的值与输出门值ot相乘得到输出值:
ot=σ(Wo·[ht-1,Xt]+bo) (27)
ht=ot*tanh(Ct) (28)式中,Wo和bo分别为输入出层的权重矩阵和偏执项。
5.根据权利要求4所述的基于时空关系的残差多图卷积人群分布预测方法,其特征在于,所述融合时空关系预测人群分布的具体实现方式如下:
构建模型的输入:利用所有网格的历史人群数量构建人群数量动态变化序列XR=[Xt-T,Xt-T+1,…Xt-2,Xt-1],T为时间步长;
空间关系建模:首先利用图构建邻近性、功能相似性、连通性三种空间关系矩阵,然后将人群数量动态变化序列XR和三种矩阵(AJ,AP,AC)输入到残差多图卷积模型,实现对空间关系的建模,得到提取空间关系后的矩阵X′R=[X′t-T,X′t-T+1,…X′t-2,X′t-1]:
X′R=RMGCN(XR,AJ,AP,AC) (29)
式中,RMGCN的计算参见公式(15)到(20),XR为第t-1个时刻到第t-T个时刻T个时间步长内所有网格的人群数量,X′R为提取空间关系后第t-1个时刻到第t-T个时刻T个时间步长内所有网格的人群数量值;
时间关系建模:将提取空间关系后的矩阵X′R输入长短期记忆网络模型得到预测结果Yt
Yt=LSTM(X′R) (30)
式中,LSTM的计算参见公式(21)到公式(28),Yt为所有网格第t个时刻的预测人群数量。
6.一种基于时空关系的残差多图卷积人群分布预测系统,其特征在于,包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如权利要求1-5任一项所述的方法步骤。
CN202110293235.4A 2021-03-18 2021-03-18 基于时空关系的残差多图卷积人群分布预测方法及系统 Active CN112766240B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110293235.4A CN112766240B (zh) 2021-03-18 2021-03-18 基于时空关系的残差多图卷积人群分布预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110293235.4A CN112766240B (zh) 2021-03-18 2021-03-18 基于时空关系的残差多图卷积人群分布预测方法及系统

Publications (2)

Publication Number Publication Date
CN112766240A CN112766240A (zh) 2021-05-07
CN112766240B true CN112766240B (zh) 2022-08-12

Family

ID=75691066

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110293235.4A Active CN112766240B (zh) 2021-03-18 2021-03-18 基于时空关系的残差多图卷积人群分布预测方法及系统

Country Status (1)

Country Link
CN (1) CN112766240B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113507356A (zh) * 2021-07-08 2021-10-15 哈尔滨工业大学 一种密态最短路网距离计算方法、设备及存储介质
CN114154740A (zh) * 2021-12-10 2022-03-08 杭州电子科技大学上虞科学与工程研究院有限公司 基于兴趣点时空残差神经网络的多方向交通流量预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016029936A1 (en) * 2014-08-26 2016-03-03 Telefonaktiebolaget L M Ericsson (Publ) Technique for analytical identification of spatio-temporal relationships in a mobile communications network
CN109376969A (zh) * 2018-12-14 2019-02-22 中南大学 基于深度学习的城市精细化人口分布动态预测方法及装置
CN110310474A (zh) * 2018-05-14 2019-10-08 桂林远望智能通信科技有限公司 一种基于时空残差网络的车流量预测方法及装置
CN110414747A (zh) * 2019-08-08 2019-11-05 东北大学秦皇岛分校 一种基于深度学习的时空长短期城市人流量预测方法
CN112365708A (zh) * 2020-09-29 2021-02-12 西北大学 基于多图卷积网络的景区交通量预测模型建立和预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10909388B2 (en) * 2019-05-03 2021-02-02 Royal Caribbean Cruises Ltd. Population density determination from multi-camera sourced imagery

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016029936A1 (en) * 2014-08-26 2016-03-03 Telefonaktiebolaget L M Ericsson (Publ) Technique for analytical identification of spatio-temporal relationships in a mobile communications network
CN110310474A (zh) * 2018-05-14 2019-10-08 桂林远望智能通信科技有限公司 一种基于时空残差网络的车流量预测方法及装置
CN109376969A (zh) * 2018-12-14 2019-02-22 中南大学 基于深度学习的城市精细化人口分布动态预测方法及装置
CN110414747A (zh) * 2019-08-08 2019-11-05 东北大学秦皇岛分校 一种基于深度学习的时空长短期城市人流量预测方法
CN112365708A (zh) * 2020-09-29 2021-02-12 西北大学 基于多图卷积网络的景区交通量预测模型建立和预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Junbo Zhang et al..deep spatio-temporal residual networks for citywide crowd flows prediction.《Thirty-First AAAI Conference on Artificial Intelligence》.2017, *
Yang Ning et al..ST-DRN: Deep Residual Networks for Spatio-Temporal Metro Stations Crowd Flows Forecast.《2018 International Joint Conference on Neural Networks (IJCNN)》.2018,2161-4407. *
陈实.基于深度神经网络的区域人流量预测.《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》.2021,(第01期),C034-837. *

Also Published As

Publication number Publication date
CN112766240A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
Qin et al. A novel combined prediction scheme based on CNN and LSTM for urban PM 2.5 concentration
Tekouabou et al. Improving parking availability prediction in smart cities with IoT and ensemble-based model
CN109142171B (zh) 基于特征扩张的融合神经网络的城市pm10浓度预测方法
Shao et al. Traffic flow prediction with long short-term memory networks (LSTMs)
CN109658695B (zh) 一种多因素的短时交通流预测方法
Wu et al. Evolving RBF neural networks for rainfall prediction using hybrid particle swarm optimization and genetic algorithm
Ma et al. Short-term traffic flow forecasting by selecting appropriate predictions based on pattern matching
Lv et al. Blind travel prediction based on obstacle avoidance in indoor scene
Jalalkamali Using of hybrid fuzzy models to predict spatiotemporal groundwater quality parameters
Ghanim et al. Estimating turning movements at signalized intersections using artificial neural networks
CN109902880A (zh) 一种基于Seq2Seq生成对抗网络的城市人流预测方法
CN115578852B (zh) 一种基于dstgcn的交通预测方法
CN112766240B (zh) 基于时空关系的残差多图卷积人群分布预测方法及系统
CN110164129B (zh) 基于gernn的单交叉口多车道交通流量预测方法
CN114202122A (zh) 基于马尔可夫聚类图注意力网络的城市交通流量预测方法
CN113516304B (zh) 基于时空图网络的区域污染物时空联合预测方法及装置
Chen et al. A multiscale-grid-based stacked bidirectional GRU neural network model for predicting traffic speeds of urban expressways
CN112418508B (zh) 基于物理空间与社交网络空间交互的人口分布预测方法
CN111242395A (zh) 用于od数据的预测模型构建方法及装置
Wu et al. Local and global Bayesian network based model for flood prediction
Guo et al. An unsupervised PM2. 5 estimation method with different spatio-temporal resolutions based on KIDW-TCGRU
Farfán et al. Improving the predictive skills of hydrological models using a combinatorial optimization algorithm and artificial neural networks
CN117808214A (zh) 水利工程数据分析系统
CN116913098B (zh) 一种融合空气质量与车流量数据的短时交通流预测方法
Ragab Spider Monkey Optimization with Statistical Analysis for Robust Rainfall Prediction.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant