CN111160521A - 基于深度神经网络图编码器的城市人类流动模式检测方法 - Google Patents

基于深度神经网络图编码器的城市人类流动模式检测方法 Download PDF

Info

Publication number
CN111160521A
CN111160521A CN201911248406.0A CN201911248406A CN111160521A CN 111160521 A CN111160521 A CN 111160521A CN 201911248406 A CN201911248406 A CN 201911248406A CN 111160521 A CN111160521 A CN 111160521A
Authority
CN
China
Prior art keywords
data
human activity
neural network
human
deep neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911248406.0A
Other languages
English (en)
Inventor
顾晶晶
凌超
黄海涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201911248406.0A priority Critical patent/CN111160521A/zh
Publication of CN111160521A publication Critical patent/CN111160521A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于深度神经网络稀疏图编码器的人类流动模式检测方法,包括以下步骤:采集城市数据,包括人类活动数据、城市兴趣点数据及城市地理信息数据;结合改进的OPTICS算法和城市数据将城市划分为若干个区域;根据区域划分结果,构建多个时间段的人类活动流量矩阵,并基于人类活动流量矩阵构建人类活动张量矩阵;基于深度神经网络的稀疏图编码器求取人类活动张量矩阵的结构化数据;利用聚类算法处理结构化数据获得各场景下的人类流动模式。本发明能适用于更复杂的数据结构,实现更有效的城市区域选取,更好地反映网络的结构特征,推断出在不同的时空环境下用户对POI的偏好,实现城市人类流动模式的有效检测,进而为城市规划和POI建设提供建议。

Description

基于深度神经网络图编码器的城市人类流动模式检测方法
技术领域
本发明涉及模式分析领域,特别涉及一种基于深度神经网络图编码器的城市人类流动模式检测方法。
背景技术
随着城市的快速发展,引发了诸如交通拥堵、资源浪费、人口密集等问题。另一方面随着定位技术服务(LTS)的普及以及计算能力的迅速提高,人类现实社会中的行为被数字化,形成海量数据。这些数据集的规模以及多维性使研究者们有机会探索社会的行为规律,并可以基于规律进行有效的预测从而解决快速城市化所带来的问题。
由于城市中的人群流动受时间、温度、环境等的影响,在不同的时间和天气情况会呈现着不同的人群流动模式,若是能够提前了解城市的流动模式,并对其进行相关的分析可以很好的解决由于人类流动所带来的交通拥堵问题,因此,探索城市人群的潜在流量模式对于城市建设、POI建议和需求分析具有重要意义。
目前已经有很多关于探索人类流动模式的研究,大多学者是基于主题模型发现城市人类流动模式,例如B.Gao等人通过从数字足迹和社交链接创建主题模型来发现人类的流动模式,Ziyatdinov等人提出了一种利用谱聚类算法的多视图数据模式提取方法,但经研究证明发现主题模型对于发现潜在的运动模式更为有效,而应用于实际的人类流动模式检测还存在一定问题,主要是因为:首先,城市数据对时间非常敏感,人类流动模式跟时间相关度很高,因此很难被主题模型捕获。其次,人类流动模式分析的主题模型中没有相应的评估措施。最后,人类流量数据是图形结构,这增加了数据处理过程的难度。
发明内容
本发明的目的在于提供一种基于深度神经网络稀疏图编码器的人类流动模式检测方法,能够适用于更复杂的数据结构,实现更有效的城市区域选取,更好地反映网络的结构特征,推断出在不同的时空环境下用户对POI的偏好。
实现本发明目的的技术解决方案为:一种基于深度神经网络稀疏图编码器的人类流动模式检测方法,包括以下步骤:
步骤1,采集城市数据,包括人类活动数据、城市兴趣点数据以及城市地理信息数据;
步骤2,结合改进的OPTICS算法和所述城市数据将整个城市划分为若干个区域;
步骤3,根据步骤2区域划分结果,构建多个时间段的人类活动流量矩阵,并基于人类活动流量矩阵构建人类活动张量矩阵;
步骤4,基于深度神经网络的稀疏图编码器求取人类活动张量矩阵的结构化数据;
步骤5,利用聚类算法处理所述结构化数据获得各场景下的人类流动模式。
进一步地,步骤1所述人类活动数据包括人类活动起始点经纬度(l1,w1)和人类活动终止点经纬度(l2,w2);
所述城市兴趣点数据包括:兴趣点名称、兴趣点所在经纬度、兴趣点类型。
进一步地,步骤2所述结合改进的OPTICS算法和所述城市数据将整个城市划分为若干个区域,具体包括:
步骤2-1,根据城市地理信息数据将城市划分为规模大小相同的网格,建立网格坐标系;
步骤2-2,将所述人类活动数据对应到网格坐标系中,形成网格坐标系下的人类活动数据集;
步骤2-3,从所述人类活动数据集中随机选取某一数据p;
步骤2-4,获取以所述数据p为圆心、以自定义设置的eps为半径的范围内人类活动数据的数目,根据该数目求取数据p的最大搜索半径MR,所用公式为:
Figure BDA0002308336100000021
式中,
Figure BDA0002308336100000022
表示参数,N表示网格坐标系的网格数,getNerghbors()表示获取以所述数据p为圆心、以eps为半径的范围内人类活动数据的数目;
步骤2-5,获取以所述数据p为圆心、以MR为半径的范围内人类活动数据的数目,判断该数目是否大于预设阈值Pts,若是,则由以所述数据p为圆心、以MR为半径的范围内的人类活动数据形成新的集群;反之返回步骤2-4;
步骤2-6,判断所述人类活动数据集中的每一个数据是否全部被访问,若是,则执行下一步,反之返回执行步骤2-3。
步骤2-7,针对人类活动数据集中未归为任何一个集群的数据点,将其划分到距离该数据点最近的一个集群中,由此完成城市区域划分。
进一步地,步骤3所述根据步骤2区域划分结果,构建多个时间段的人类活动流量矩阵,具体包括:
假设步骤2区域划分后的区域个数即集群个数为M,并对M个区域进行顺序编号;
步骤3-1,构建T个时间段的人类活动流量矩阵,T个时间段包括t1、t2、...、tT,且t1=t2=…=tT,其中某一时间段t1的人类活动流量矩阵
Figure BDA0002308336100000031
为:矩阵
Figure BDA0002308336100000032
的维度为M×M,矩阵
Figure BDA0002308336100000033
中第i行第j列的元素fij表示从第i个区域流动到第j个区域人类活动数据点的数目;
步骤3-2,基于T个时间段的人类活动流量矩阵构建人类活动张量矩阵F:
Figure BDA0002308336100000034
式中,F为T×M×M维度的矩阵。
进一步地,步骤4所述基于深度神经网络的稀疏图编码器求取人类活动张量矩阵的结构化数据,具体包括:
步骤4-1,利用相似性度量RBF求取人类活动张量矩阵F的相似矩阵S,所用公式为:
Figure BDA0002308336100000035
式中,Fi和Fj分别表示第i个时间段、第j个时间段的人类活动数据矩阵,σ表示惩罚因子;
步骤4-2,构建基于深度神经网络的稀疏图编码器,该编码器包括encode结构decode结构,具体包括输入层、三层隐藏层和输出层,并在编码器中添加Dropout层;按输入层至输出层的顺序,令l表示深度神经网络的第l层,l=1....L,L表示深度神经网络的总层数;
步骤4-3,对所述相似矩阵S进行拉普拉斯归一化计算,所用公式为:
a0=D-1S
式中,a0表示相似矩阵S的拉普拉斯矩阵,D表示在相应的对角元素中具有节点度的一个对角矩阵;
步骤4-4,初始化l=0,并令yl等于a0
步骤4-5,将yl输入至步骤4-2构建的基于深度神经网络的稀疏图编码器中,并执行如下计算:
r(l)~Bernoulli(p)
Y(l)=r(l)*y(l)
z(l+1)=w(l+1)Y(l)+b(l+1)
y(l+1)=f(z(l+1))
式中,yl表示深度神经网络第l层的输出值,Bernoulli(p)表示某一向量中0值的概率为p,wl和bl分别表示深度神经网络的权重矩阵、第l个隐藏层的偏差,f()表示隐藏层和输出层的非线性激活函数,其形式为:
Figure BDA0002308336100000041
步骤4-6,令l递增1,并判断l是否等于L,若是,执行下一步,反之返回执行步骤4-5;
步骤4-7,优化深度神经网络以实现最小化原始数据x即a0和重建误差数据y即yL,所用损失函数Loss(θ)为:
Figure BDA0002308336100000042
式中,β表示控制稀疏性惩罚的权重,
Figure BDA0002308336100000043
表示隐藏层激活的平均值,hj表示隐藏层中第j个节点的激活值,n表示该隐藏层所包含节点总数;
优化后的深度神经网络中隐藏层的数据即为人类活动张量矩阵的结构化数据。
本发明与现有技术相比,其显著优点为:1)改进OPTICS算法,降低了算法运行的时间,可以对城市进行更好的区域划分;2)针对复杂城市的区域特征,设计了不同区域可达距离的选择条件,实现了更有效的区域距离选择;3)设计了基于深度神经网络的自编码器结构,可以更好的提取人类活动数据的特征;4)可以实现全天候的人类流动模式检测;5)能够适用于更复杂的数据结构,实现更有效的城市区域选取,更好地反映城市网络的结构特征。
下面结合附图对本发明作进一步详细描述。
附图说明
图1为本发明基于深度神经网络图编码器的人类流动模式检测方法流程图。
图2为本发明实施例中城市人类活动密度图,其中图(a)为普通时间段自行车密度示意图,图(b)为高峰时间段自行车密度示意图。
图3为本发明实施例中利用改进的OPTICS算法对城市郊区进行分区形成的城市区域图,其中图(a)为改进的OPTICS参数选择图,图(b)为簇类效果图。
图4为本发明实施例中利用改进的OPTICS算法对城市中心进行分区形成的城市区域图,其中图(a)为改进的OPTICS参数选择图,图(b)为簇类效果图。
图5为本发明实施例中算法误差对比图,其中图(a)为城市郊区误差对比图,图(b)为城市中心误差对比图。
图6为本发明实施例中不同场景下的人类流动模式图,其中图(a)为工作日高峰期,图(b)为工作日平时期,图(c)为雨天工作日,图(d)为周末,图(e)为雨天周末,图(f)为夜晚。
具体实施方式
结合图1,本发明提出了一种基于深度神经网络稀疏图编码器的人类流动模式检测方法,包括以下步骤:
步骤1,采集城市数据,包括人类活动数据、城市兴趣点数据以及城市地理信息数据;
这里,人类活动数据包括人类活动起始点经纬度(l1,w1)和人类活动终止点经纬度(l2,w2);城市兴趣点数据包括:兴趣点名称、兴趣点所在经纬度、兴趣点类型,兴趣点表示人类感兴趣的区域。
步骤2,结合改进的OPTICS算法和城市数据将整个城市划分为若干个区域;该步骤具体包括:
步骤2-1,根据城市地理信息数据将城市划分为规模大小相同的网格,建立网格坐标系;
步骤2-2,将人类活动数据对应到网格坐标系中,形成网格坐标系下的人类活动数据集;
步骤2-3,从人类活动数据集中随机选取某一数据p;
步骤2-4,获取以数据p为圆心、以自定义设置的eps为半径的范围内人类活动数据的数目,根据该数目求取数据p的最大搜索半径MR,所用公式为:
Figure BDA0002308336100000061
式中,
Figure BDA0002308336100000066
表示参数,N表示网格坐标系的网格数,getNerghbors()表示获取以数据p为圆心、以eps为半径的范围内人类活动数据的数目;
步骤2-5,获取以数据p为圆心、以MR为半径的范围内人类活动数据的数目,判断该数目是否大于预设阈值Pts,若是,则由以数据p为圆心、以MR为半径的范围内的人类活动数据形成新的集群;反之返回步骤2-4;
步骤2-6,判断人类活动数据集中的每一个数据是否全部被访问,若是,则执行下一步,反之返回执行步骤2-3。
步骤2-7,针对人类活动数据集中未归为任何一个集群的数据点,将其划分到距离该数据点最近的一个集群中,由此完成城市区域划分。
这里,步骤2-7中针对人类活动数据集中未归为任何一个集群的数据点,将其划分到距离该数据点最近的一个集群中,具体包括:
针对人类活动数据集中未归为任何一个集群的数据点,求取该数据点到每一个集群中心的欧几里得距离d,所用公式为:
Figure BDA0002308336100000062
式中,(x1,y1)表示未归为任何一个集群的数据点在网格坐标系中的坐标,(x2,y2)表示某一个集群中心在网格坐标系中的坐标;
将未归为任何一个集群的数据点划分至最小的欧几里得距离d对应的集群中。
步骤3,根据步骤2区域划分结果,构建多个时间段的人类活动流量矩阵,并基于人类活动流量矩阵构建人类活动张量矩阵;该步具体包括:
假设步骤2区域划分后的区域个数即集群个数为M,并对M个区域进行顺序编号;
步骤3-1,构建T个时间段的人类活动流量矩阵,T个时间段包括t1、t2、...、tT,且t1=t2=…=tT,其中某一时间段t1的人类活动流量矩阵
Figure BDA0002308336100000063
为:矩阵
Figure BDA0002308336100000064
的维度为M×M,矩阵
Figure BDA0002308336100000065
中第i行第j列的元素fij表示从第i个区域流动到第j个区域人类活动数据点的数目;
步骤3-2,基于T个时间段的人类活动流量矩阵构建人类活动张量矩阵F:
Figure BDA0002308336100000071
式中,F为T×M×M维度的矩阵。
步骤4,基于深度神经网络的稀疏图编码器求取人类活动张量矩阵的结构化数据;该步具体包括:
步骤4-1,利用相似性度量RBF求取人类活动张量矩阵F的相似矩阵S,所用公式为:
Figure BDA0002308336100000072
式中,Fi和Fj分别表示第i个时间段、第j个时间段的人类活动数据矩阵,σ表示惩罚因子;
步骤4-2,构建基于深度神经网络的稀疏图编码器,该编码器包括encode结构decode结构,具体包括输入层、三层隐藏层和输出层,并在编码器中添加Dropout层;按输入层至输出层的顺序,令l表示深度神经网络的第l层,l=1....L,L表示深度神经网络的总层数;
步骤4-3,对相似矩阵S进行拉普拉斯归一化计算,所用公式为:
a0=D-1S
式中,a0表示相似矩阵S的拉普拉斯矩阵,D表示在相应的对角元素中具有节点度的一个对角矩阵;
步骤4-4,初始化l=0,并令yl等于a0
步骤4-5,将yl输入至步骤4-2构建的基于深度神经网络的稀疏图编码器中,并执行如下计算:
r(l)~Bernoulli(p)
Y(l)=r(l)*y(l)
z(l+1)=w(l+1)Y(l)+b(l+1)
y(l+1)=f(z(l+1))
式中,yl表示深度神经网络第l层的输出值,Bernoulli(p)表示某一向量中0值的概率为p,wl和bl分别表示深度神经网络的权重矩阵、第l个隐藏层的偏差,f()表示隐藏层和输出层的非线性激活函数,其形式为:
Figure BDA0002308336100000081
步骤4-6,令l递增1,并判断l是否等于L,若是,执行下一步,反之返回执行步骤4-5;
步骤4-7,优化深度神经网络以实现最小化原始数据x即a0和重建误差数据y即yL,所用损失函数Loss(θ)为:
Figure BDA0002308336100000082
式中,β表示控制稀疏性惩罚的权重,
Figure BDA0002308336100000083
表示隐藏层激活的平均值,hj表示隐藏层中第j个节点的激活值,n表示该隐藏层所包含节点总数;
优化后的深度神经网络中隐藏层的数据即为人类活动张量矩阵的结构化数据。
步骤5,利用聚类算法处理结构化数据获得各场景下的人类流动模式。
这里,各场景包括不同时间、不同环境等等。
这里优选地,采用k-means聚类算法处理结构化数据。
下面结合实施例对本发明作进一步详细的说明。
实施例
本实施例中研究的城市对象为10000m×10000m范围的上海地区,采集了大量共享单车数据来测试本发明的方法。采集的数据包含957,357,367个骑乘记录,每条记录都指定一个自行车ID、接送地点(起点经纬度)、接送时间(起点时间)、停车地点(终点经纬度)和停车时间(终点时间),其具体的分布如图2所示,图中点越密集表明自行车的密度越大,对比图2(a)、图2(b)可知,自行车密度在不同的时间段相差明显。
基于图2(b)中的流量数据,分别选择城市区域中的郊区和市中心两个地区为中心,并将其周围2000米半径的圆形范围作为研究区域,利用本发明改进的OPTICS算法进行区域划分,划分结果如图3、图4所示,图3(a)和4(a)中每个凹槽代表一个集群,凹槽的数量表示该区域所形成的集群簇,图3(b)和4(b)是对集群簇所处位置的可视化,其中每个聚集点标识为一个簇,空白处表示没人类活动流量。之后,根据区域划分结果,构建多个时间段的人类活动流量矩阵,并基于人类活动流量矩阵构建人类活动张量矩阵,随后利用相似性度量对于人类活动张量构建图并将其应用到基于稀疏性约束的图聚类模型(GCS)中,误差效果对比如图5所示,横轴表示预定义流动模式的数量,纵轴表示相应的DBI(度量标准)值,由图5可知,市中心区域被划分为9种流动模式时效果误差最小,而郊区区域的流量模式被划分为6种流动模式时效果误差最小,该差距是由于市中心区域自行车分布密集,人类流动模式更加复杂,因此可以形成更加多的集群,相比之下,郊区的自行车分布非常分散,人流流动模式更为单一,所以无法形成有效的集群。此外,对比本发明方法、传统的谱聚类和K-means方法的聚类效果如图5所示,由图5可知:(i)具有稀疏约束的图聚类模型(GCS)的总体误差低于谱聚类,这表明具有稀疏约束的图聚类有助于提高聚类的有效性;(ii)K-means不能很好地处理图形结构,因为k-means的DBI值远高于谱聚类和GCS;(iii)不同地区有不同的流动模式种类结果。
为了进一步评估本发明提出的模型的性能,以上海大剧院作为研究区域,执行本发明的过程,并利用另一种方式来可视化实验结果,如图6所示,共获得六种人类流动模式,包括工作日(早高峰时段),下雨工作日和周末等,每一种人类流动模式呈现着差异性,如工作日高峰期,自行车行程数远远大于其他模式,并且行程主要分布中等距离(400-1000米),另外周末的雨天和平时的周末也呈现不同的流动状态,这可能是因为雨天时许多准备外出游玩的人会选择其他交通工具或者待在家中。
综上所述,本发明能适用于更复杂的数据结构,实现更有效的城市区域选取,更好地反映网络的结构特征,推断出在不同的时空环境下用户对POI的偏好,实现城市人类流动模式的有效检测,进而为城市规划和POI建设提供建议。

Claims (7)

1.一种基于深度神经网络稀疏图编码器的人类流动模式检测方法,其特征在于,包括以下步骤:
步骤1,采集城市数据,包括人类活动数据、城市兴趣点数据以及城市地理信息数据;
步骤2,结合改进的OPTICS算法和所述城市数据将整个城市划分为若干个区域;
步骤3,根据步骤2区域划分结果,构建多个时间段的人类活动流量矩阵,并基于人类活动流量矩阵构建人类活动张量矩阵;
步骤4,基于深度神经网络的稀疏图编码器求取人类活动张量矩阵的结构化数据;
步骤5,利用聚类算法处理所述结构化数据获得各场景下的人类流动模式。
2.根据权利要求1所述的基于深度神经网络稀疏图编码器的人类流动模式检测方法,其特征在于,步骤1所述人类活动数据包括人类活动起始点经纬度(l1,w1)和人类活动终止点经纬度(l2,w2);
所述城市兴趣点数据包括:兴趣点名称、兴趣点所在经纬度、兴趣点类型。
3.根据权利要求1或2所述的基于深度神经网络图编码器的人类流动模式检测方法,其特征在于,步骤2所述结合改进的OPTICS算法和所述城市数据将整个城市划分为若干个区域,具体包括:
步骤2-1,根据城市地理信息数据将城市划分为规模大小相同的网格,建立网格坐标系;
步骤2-2,将所述人类活动数据对应到网格坐标系中,形成网格坐标系下的人类活动数据集;
步骤2-3,从所述人类活动数据集中随机选取某一数据p;
步骤2-4,获取以所述数据p为圆心、以自定义设置的eps为半径的范围内人类活动数据的数目,根据该数目求取数据p的最大搜索半径MR,所用公式为:
Figure FDA0002308336090000011
式中,
Figure FDA0002308336090000012
表示参数,N表示网格坐标系的网格数,getNerghbors()表示获取以所述数据p为圆心、以eps为半径的范围内人类活动数据的数目;
步骤2-5,获取以所述数据p为圆心、以MR为半径的范围内人类活动数据的数目,判断该数目是否大于预设阈值Pts,若是,则由以所述数据p为圆心、以MR为半径的范围内的人类活动数据形成新的集群;反之返回步骤2-4;
步骤2-6,判断所述人类活动数据集中的每一个数据是否全部被访问,若是,则执行下一步,反之返回执行步骤2-3。
步骤2-7,针对人类活动数据集中未归为任何一个集群的数据点,将其划分到距离该数据点最近的一个集群中,由此完成城市区域划分。
4.根据权利要求3所述的基于深度神经网络图编码器的人类流动模式检测方法,其特征在于,步骤2-7所述针对人类活动数据集中未归为任何一个集群的数据点,将其划分到距离该数据点最近的一个集群中,具体包括:
针对人类活动数据集中未归为任何一个集群的数据点,求取该数据点到每一个集群中心的欧几里得距离d,所用公式为:
Figure FDA0002308336090000021
式中,(x1,y1)表示未归为任何一个集群的数据点在网格坐标系中的坐标,(x2,y2)表示某一个集群中心在网格坐标系中的坐标;
将未归为任何一个集群的数据点划分至最小的欧几里得距离d对应的集群中。
5.根据权利要求1所述的基于深度神经网络图编码器的人类流动模式检测方法,其特征在于,步骤3所述根据步骤2区域划分结果,构建多个时间段的人类活动流量矩阵,具体包括:
假设步骤2区域划分后的区域个数即集群个数为M,并对M个区域进行顺序编号;
步骤3-1,构建T个时间段的人类活动流量矩阵,T个时间段包括t1、t2、...、tT,且t1=t2=…=tT,其中某一时间段t1的人类活动流量矩阵
Figure FDA0002308336090000022
为:矩阵
Figure FDA0002308336090000023
的维度为M×M,矩阵
Figure FDA0002308336090000024
中第i行第j列的元素fij表示从第i个区域流动到第j个区域人类活动数据点的数目;
步骤3-2,基于T个时间段的人类活动流量矩阵构建人类活动张量矩阵F:
Figure FDA0002308336090000025
式中,F为T×M×M维度的矩阵。
6.根据权利要求5所述的基于深度神经网络图编码器的人类流动模式检测方法,其特征在于,步骤4所述基于深度神经网络的稀疏图编码器求取人类活动张量矩阵的结构化数据,具体包括:
步骤4-1,利用相似性度量RBF求取人类活动张量矩阵F的相似矩阵S,所用公式为:
Figure FDA0002308336090000031
式中,Fi和Fj分别表示第i个时间段、第j个时间段的人类活动数据矩阵,σ表示惩罚因子;
步骤4-2,构建基于深度神经网络的稀疏图编码器,该编码器包括encode结构decode结构,具体包括输入层、三层隐藏层和输出层,并在编码器中添加Dropout层;按输入层至输出层的顺序,令l表示深度神经网络的第l层,l=1....L,L表示深度神经网络的总层数;
步骤4-3,对所述相似矩阵S进行拉普拉斯归一化计算,所用公式为:
a0=D-1S
式中,a0表示相似矩阵S的拉普拉斯矩阵,D表示在相应的对角元素中具有节点度的一个对角矩阵;
步骤4-4,初始化l=0,并令yl等于a0
步骤4-5,将yl输入至步骤4-2构建的基于深度神经网络的稀疏图编码器中,并执行如下计算:
r(l)~Bernoulli(p)
Y(l)=r(l)*y(l)
z(l+1)=w(l+1)Y(l)+b(l+1)
y(l+1)=f(z(l+1))
式中,yl表示深度神经网络第l层的输出值,Bernoulli(p)表示某一向量中0值的概率为p,wl和bl分别表示深度神经网络的权重矩阵、第l个隐藏层的偏差,f()表示隐藏层和输出层的非线性激活函数,其形式为:
Figure FDA0002308336090000032
步骤4-6,令l递增1,并判断l是否等于L,若是,执行下一步,反之返回执行步骤4-5;
步骤4-7,优化深度神经网络以实现最小化原始数据x即a0和重建误差数据y即yL,所用损失函数Loss(θ)为:
Figure FDA0002308336090000041
式中,β表示控制稀疏性惩罚的权重,
Figure FDA0002308336090000042
表示隐藏层激活的平均值,hj表示隐藏层中第j个节点的激活值,n表示该隐藏层所包含节点总数;
优化后的深度神经网络中隐藏层的数据即为人类活动张量矩阵的结构化数据。
7.根据权利要求6所述的基于深度神经网络图编码器的城市人类流动模式检测方法,其特征在于,步骤5所述利用聚类法处理所述结构化数据获得各场景下的人类流动模式,具体采用k-means聚类算法处理所述结构化数据。
CN201911248406.0A 2019-12-09 2019-12-09 基于深度神经网络图编码器的城市人类流动模式检测方法 Pending CN111160521A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911248406.0A CN111160521A (zh) 2019-12-09 2019-12-09 基于深度神经网络图编码器的城市人类流动模式检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911248406.0A CN111160521A (zh) 2019-12-09 2019-12-09 基于深度神经网络图编码器的城市人类流动模式检测方法

Publications (1)

Publication Number Publication Date
CN111160521A true CN111160521A (zh) 2020-05-15

Family

ID=70556529

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911248406.0A Pending CN111160521A (zh) 2019-12-09 2019-12-09 基于深度神经网络图编码器的城市人类流动模式检测方法

Country Status (1)

Country Link
CN (1) CN111160521A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396218A (zh) * 2020-11-06 2021-02-23 南京航空航天大学 基于城市区域多模态融合的人群流量预测方法
CN112580789A (zh) * 2021-02-22 2021-03-30 支付宝(杭州)信息技术有限公司 训练图编码网络、预测交互事件的方法及装置
CN113077053A (zh) * 2021-03-18 2021-07-06 中国电子科技集团公司第五十四研究所 多元群体活动模式表征方法及目标地理活动区域识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030065632A1 (en) * 2001-05-30 2003-04-03 Haci-Murat Hubey Scalable, parallelizable, fuzzy logic, boolean algebra, and multiplicative neural network based classifier, datamining, association rule finder and visualization software tool
CN104657424A (zh) * 2015-01-21 2015-05-27 段炼 一种多时空特征融合下的兴趣点轨迹聚类方法
CN108376982A (zh) * 2017-11-24 2018-08-07 上海泰豪迈能能源科技有限公司 负载相序的识别方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030065632A1 (en) * 2001-05-30 2003-04-03 Haci-Murat Hubey Scalable, parallelizable, fuzzy logic, boolean algebra, and multiplicative neural network based classifier, datamining, association rule finder and visualization software tool
CN104657424A (zh) * 2015-01-21 2015-05-27 段炼 一种多时空特征融合下的兴趣点轨迹聚类方法
CN108376982A (zh) * 2017-11-24 2018-08-07 上海泰豪迈能能源科技有限公司 负载相序的识别方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CHAO LING, JINGJING GU,MING SUN: "Latent Flow Patterns Discovery by Dockless Bike Trajectory Data for Demand Analysis" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112396218A (zh) * 2020-11-06 2021-02-23 南京航空航天大学 基于城市区域多模态融合的人群流量预测方法
CN112396218B (zh) * 2020-11-06 2024-01-09 南京航空航天大学 基于城市区域多模态融合的人群流量预测方法
CN112580789A (zh) * 2021-02-22 2021-03-30 支付宝(杭州)信息技术有限公司 训练图编码网络、预测交互事件的方法及装置
CN113077053A (zh) * 2021-03-18 2021-07-06 中国电子科技集团公司第五十四研究所 多元群体活动模式表征方法及目标地理活动区域识别方法

Similar Documents

Publication Publication Date Title
CN111160521A (zh) 基于深度神经网络图编码器的城市人类流动模式检测方法
CN111932026B (zh) 基于数据融合和知识图谱嵌入的城市流量模式挖掘方法
CN113792929B (zh) 交通流量预测方法、电子设备及存储介质
CN113516304B (zh) 基于时空图网络的区域污染物时空联合预测方法及装置
CN116681176B (zh) 一种基于聚类和异构图神经网络的交通流预测方法
CN113806419B (zh) 基于时空大数据的城市区域功能识别模型及识别方法
CN113505521B (zh) 一种耦合神经网络-数值模拟的城市内涝快速预报方法
CN112700104B (zh) 一种基于多模态分类的震区滑坡易发性评价方法
CN114944053A (zh) 一种基于时空超图神经网络的交通流预测方法
CN111639243A (zh) 时空数据渐进式多维模式提取与异常检测可视分析方法
CN116596151B (zh) 基于时空图注意力的交通流量预测方法及计算设备
CN116108984A (zh) 基于流量-poi因果关系推理的城市流量预测方法
CN116401941A (zh) 一种地铁站闸机疏散能力的预测方法
CN115099328A (zh) 基于对抗网络的交通流量预测方法、系统、设备及存储介质
CN104778355B (zh) 基于广域分布交通系统的异常轨迹检测方法
Zhang et al. Off-deployment traffic estimation—a traffic generative adversarial networks approach
CN117456730A (zh) 一种基于自适应部分注意力扩散图卷积神经网络的交通流量预测方法
CN115762147B (zh) 一种基于自适应图注意神经网络的交通流量预测方法
CN115328210B (zh) 路径规划方法、装置、终端设备以及存储介质
Liu et al. Co-prediction of multimodal transportation demands with self-learned spatial dependence
CN112052405A (zh) 一种基于司机经验的寻客区域推荐方法
CN115985132A (zh) 一种基于图神经网络的路边停车可用性预测方法
CN115456238A (zh) 一种基于动态多视图耦合图卷积的城市出行需求预测方法
CN115204445A (zh) 城市功能区之间交互的出行需求预测方法及系统
CN112926264A (zh) 可用泊位数的集成预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination