CN110555544B - 一种基于gps导航数据的交通需求估计方法 - Google Patents

一种基于gps导航数据的交通需求估计方法 Download PDF

Info

Publication number
CN110555544B
CN110555544B CN201910639986.XA CN201910639986A CN110555544B CN 110555544 B CN110555544 B CN 110555544B CN 201910639986 A CN201910639986 A CN 201910639986A CN 110555544 B CN110555544 B CN 110555544B
Authority
CN
China
Prior art keywords
entry
latitude
point
longitude
gps navigation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910639986.XA
Other languages
English (en)
Other versions
CN110555544A (zh
Inventor
曾伟良
陈仲武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201910639986.XA priority Critical patent/CN110555544B/zh
Publication of CN110555544A publication Critical patent/CN110555544A/zh
Application granted granted Critical
Publication of CN110555544B publication Critical patent/CN110555544B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Remote Sensing (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Analytical Chemistry (AREA)
  • Navigation (AREA)
  • Educational Administration (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

本发明公开了一种基于GPS导航数据的交通需求估计方法,大数据技术及人工智能算法日渐成熟,交通信息采集成本比以往任何时候都低廉,能更加直观、清晰地认识居民出行特点、交通需求的时空分布特征等。根据大数据呈现的宏观数据特征,本发明利用层次聚类算法划分出居民出行需求的热点区域。科学合理的聚类划分可以分析出当前居民的出行需求,为缓解城市交通拥堵和交通资源的最大化利用提供有效依据。交通需求的精确估计可以更好的理解城市交通行为的特征,为城市交通规划提供理论依据,有效减少居民出行成本,提高城市突发情况的疏导能力。

Description

一种基于GPS导航数据的交通需求估计方法
技术领域
本发明涉及交通运输领域,具体涉及一种基于GPS导航数据的交通需求估计方法。
背景技术
随着我国城市化发展进程的加速,城市交通拥堵、交通污染日益严重,交通事故频繁发生。及时、准确获取交通大数据、可视化分析数据并构建交通数据处理模型是建设智能交通的前提。GPS导航数据是交通大数据的重要来源之一。手机端地图APP记录了用户的GPS轨迹,包括时间和经纬度信息。例如,百度地图拥有3亿月活跃用户,2亿公里日导航服务,覆盖了375个大中城市和99%的全国道路。因此,通过分析GPS导航的数据,制定一种根据聚类算法对交通需求估计的方法,可以挖掘用户的出行模式,出行需求和出行路径等信息,从而更好的理解城市交通行为的特征,为治理城市交通拥堵提供有效依据。
现有技术中目前存在一些交通需求估计方法,但均存在一些缺陷:
方案1.《Analysis of Berlin’s taxi services by exporing GPS traces》。结合柏林浮动车数据分析出租车的出行行为和供需分布情况,对城市内出租车不同高峰时段的供需关系进行了研究;然而该方法未能以优先服务最大群体为目标,针对交通需求点的热点区域聚类分析,笼统大范围分析使得需求点估计显得分散,带有盲目性。
方案2.《基于大数据Hadoop平台的出租车载客热点区域挖掘研究》。通过搭建Hadoop集群平台对改进的并行K-means聚类算法进行设计,对提取到的出租车载客点进行聚类,从而挖掘出租车载客热点区,结合北京实际路况对热点区域进行分析。该方法使用k-means来聚类出需求点,生成硬性划分的聚类,即每个数据点唯一地分配给一个且仅一个聚类,由于事先不知道实际的聚类情况,因此这可能是一种严重的局限;很容易陷入局部极小值从而无法获取全局最优解,在大矢量空间搜索中性能下降;对于孤立和异常数据敏感,并对非球型簇可能失效。
方案3.《基于BP神经网络的网约车出行需求短时预测》。将网约车出行需求总数拆分为供需匹配数与需求缺口数,并定义了网约车供需匹配度与需求紧缺度。根据网约车出行需求缺口的特点构建了基于BP神经网络的网约车出行需求短时预测模型,依据相关性分析结果确定了模型结构,并以网约车出行实际数据进行了短时需求预测并验证了模型有效性。该方法的缺陷是参数众多,每次都需要更新数量较多的阈值和权值,往往需要经验选定,且很容易陷入局部最小值的问题,但这时所得到的解并不一定是问题的真正解。
方案4.《基于出租车轨迹的居民出行热点路径和区域挖掘》。基于欧式距离的DBSCAN聚类算法对出租车上下客轨迹点进行聚类分析,获取早中晚不同时间段的居民出行热点区域。从而发现不同时间段居民出行的热点路径和挖掘出租车上下客热点区域,获取其隐含的出行行为规律信息,探索解决道路拥堵等交通规划问题的新途径。该方法的缺陷是,基于密度的DBSCAN算法不进行任何的预处理而直接对整个数据集进行聚类操作。当数据量非常大时,就必须有大内存量做支持,I/O消耗也非常大。聚类过程的大部分时间用在邻域查询操作上。算法对参数Eps及Minpts非常敏感,且这两个参数很难确定。对于真正的高维数据集而言,对于真正的高维数据集而言,参数的设置通常是依靠经验的,因此难以确定。
方案5.《基于GPS数据的城市出租车出行需求研究》。通过网格划分法对出租车出行需求量进行估计,分析不同用地功能区出租车出行需求的时空分布特征,采用卡尔曼滤波模型、神经网络模型及组合模型对软件园区出租车出行需求预测,该方法的缺陷是交通网格单元大小的确定依赖于研究区域大小和研究问题的数据特征,没有统一的标准和依据,随意性较大。
发明内容
针对上述现有技术中存在的问题,本发明的目的是提供一种基于GPS导航数据的交通需求估计方法,根据大数据呈现的宏观数据特征,利用层次聚类算法划分出居民出行需求的热点区域,科学合理的聚类划分可以分析出当前居民的出行需求,为缓解城市交通拥堵和交通资源的最大化利用提供有效依据。交通需求的精确估计可以更好的理解城市交通行为的特征,为城市交通规划提供理论依据,有效减少居民出行成本,提高城市突发情况的疏导能力。
为了实现上述任务,本发明采用以下技术方案:
一种基于GPS导航数据的交通需求估计方法,包括以下步骤:
步骤1,采集GPS导航数据并进行预处理,以建立GPS导航数据词条汇总表
从GPS导航数据库中以天为单位,采集一天内不同设备产生的GPS导航数据,对GPS导航数据词条进行预处理,保留词条中的日期、时间、设备编号、经度、维度和速度属性,将其余属性筛除,然后将预处理后的GPS导航数据词条先按照设备编号排序,对于同一设备编号的词条按照时间顺序排序,得到同一天内不同设备编号的GPS导航数据词条汇总表;
步骤2,根据GPS导航数据词条汇总表中的数据,识别设备的出发点及到达点
步骤2.1,识别设备的出发点
对同一设备的所有按照时间排序的GPS导航数据词条记为词条1至词条N;依次判断词条1至词条N是否满足以出发点条件;每一次判断时,记词条i(i=1,2,...N)为B词条,B词条之前的一个词条为A词条;
记A词条的经纬度为(LonA,LatA),B词条的经纬度为(LonB,LatB);对所述的经纬度进行转换,经过转换后A词条的经度纬度、B词条的经纬度分别被记为(MLonA,MLatA)和(MLonB,MLatB);
所述出发点的条件为:
条件1:B词条中的速度值不为零,且不存在A词条;
条件2:B词条的速度不为零,存在A词条,A词条的速度值为0,A词条与B词条的时间差大于30s,且设备从A词条对应的地点到达B词条对应的地点间的平均速度
Figure BDA0002131512800000032
在0~0.1m/s;
所述的平均速度V的计算公式为:
C=sin(MLatA)*sin(MLatB)*cos(MLonA-MLonB)+cos(MLatA)*cos(MLatB)
式1
Distance=R*ArccosC*π/180 式2
Figure BDA0002131512800000031
其中,T1、T2分别为词条A中的时间以及词条B中的时间;
分别将词条i(i=1,2,...N)作为B词条,判断词条是否满足上述的条件1或条件2,如B词条满足条件1或条件2,则记B词条对应的设备所在的地点为设备的出发点;
步骤2.2,识别设备的到达点
分别将设备的词条1至词条N作为B词条,但之处是记B词条之后的一个词条为A词条;识别设备到达点所需满足的条件是:
条件3:B词条中的速度值为零,且不存在A词条;
条件4:B词条中的速度值为零,存在A词条,A词条中速度值不为0,A词条与B词条的时间差大于30s,且设备从A词条对应的地点到达B词条对应的地点间的平均速度
Figure BDA0002131512800000041
在0~0.1m/s;
分别将词条i(i=1,2,...N)作为B词条,判断词条是否满足上述的条件3或条件4,如B词条满足条件3或条件4,则记B词条对应的设备所在的地点为设备的到达点;
步骤3,采用核函数对数据进行挖掘分析
步骤3.1,将步骤2得到的所有设备出发点的词条或到达点的词条生成点要素;
步骤3.2,根据点要素的经纬度,确定带宽
记SD是标准距离,Dm是中值距离,加权值为1,SearchRadius是带宽,n是点要素个数,计算输入点要素的平均中心,计算公式如下:
Figure BDA0002131512800000042
其中,(xi,yi)是点要素i的坐标(经纬度),
Figure BDA0002131512800000043
为计算出的平均中心的坐标;
计算每个点要素与所述平均中心之间的距离,然后在计算出的距离中,选出距离的中值即Dm
计算标准距离SD,公式为:
Figure BDA0002131512800000044
计算带宽,公式为:
Figure BDA0002131512800000051
步骤3.3,根据步骤3.2计算出来的带宽,通过核函数计算每个输出栅格像元的密度,然后用自然间断点分级法生成热力图;
步骤3.4,根据热力图的输出栅格像元的密度确定研究区域,以自然间断点之间的分类间隔范围划定交通需求估计区域,记为热点区域。
进一步地,所述的基于GPS导航数据的交通需求估计方法还包括:
步骤4,通过聚类进行交通需求估计
步骤4.1,根据步骤2得到的出发点词条/到达点词条以及通过步骤3得到的针对于出发点词条/到达点词条的热点区域,将热点区域内的GPS导航数据词条筛选出来作为交通需求估计聚类点;
步骤4.2,设定阈值n;
步骤4.3,每个交通需求估计聚类点各成一簇,记所有交通需求估计聚类点中,根据聚类点的经纬度坐标计算各个聚类点间的距离d(i,j),构建距离矩阵D=[d(i,j)];其中i,j分别表示第i个聚类点、第j个聚类点;
步骤4.4,用L(m)表示第m次聚类层次,初始设置m=0,L(m)=0,簇的序号用(m)表示,簇(r)和簇(s)的距离矩阵中的值用d[(r),(s)]表示,从当前的所有簇中,找出距离最近的两个簇(r)、(s);
步骤4.5,将簇的序列号加1,即m=m+1,将簇(r)、(s)合并,并令聚类的层次L(m)=d[(r),(s)];其中d[(r),(s)]表示簇(r)、(s)间的距离;
步骤4.6,更新距离矩阵D,删除簇(r)、(s)在距离矩阵中对应的行和列,并在距离矩阵D中加上新生成的簇对应的行和列;
步骤4.7,重复步骤4.4至步骤4.6,直至距离最近的两个簇(r)、(s)的最小距离mind[(r),(s)]>阈值n为止。
进一步地,对所述的经纬度进行转换,包括:
按照0度经线为基准,东经取经度的正值(Longitude),西经取经度负值(-Longitude),北纬取90-纬度值(90-Latitude),南纬取90+纬度值(90+Latitude),经过转换后A词条的经度纬度、B词条的经纬度分别被记为(MLonA,MLatA)和(MLonB,MLatB)。
本发明具有以下技术特点:
1.本方法在已有的交通基础设施的基础上设计算法,最大限度的减少运算的和时间。本文中采用的核函数算法,既能达到传统K-means算法聚集处热点区域的效果,又能分析出在交通需求估计中最需要分析的区域范围,以得到减少和优化数据的效果。
2.传统的最短距离的层次聚类算法,凝聚式层次聚类是很直观的一种算法,一层一层地进行聚类,可以从下而上地把小的簇合并聚集,就是每次找到距离最短的两个簇,直到最后合成一个簇类才结束,造成后面的分类带来一定的困难,造成了算法的适应性较差。而本方案中的层次聚类算法在保证聚类样本数足够多的情况下,根据密度数设定合理的阈值数,使得热点区域内各样本点间的簇类距离满足阈值都归为一类,其他不满足条件的聚类筛选掉,更好的将热点区域内的密集的样本点聚类出来,这一种方法所需的计算空间和时间有所降低,更好地贴切真正交通需求,通过最后的聚类结果可以分析出具体路段区域的交通需求状况。
3.传统的交通需求数据来源只有一种:基于居民出行需求的调查。该方法所需的人力物力成本高,调查数据误差较大,并且容易受调查人的主观影响,调查样本容易遗漏交通的真正需求估计。本方案中提及的算法数据来源丰富易得,可采用百度地图和高德地图等导航工具的数据,政府交通道路监控资料等。
附图说明
图1为本发明方法的流程示意图;
图2为层次聚类算法的求解流程图。
具体实施方式
本发明公开了一种基于GPS导航数据的交通需求估计方法,具体包括以下步骤:
步骤1,采集GPS导航数据并进行预处理,以建立GPS导航数据词条汇总表
从GPS导航数据库中以天为单位,采集一天内不同设备产生的GPS导航数据,每一条GPS导航数据包括日期、时间、设备编号、GPS定位状态、经度、纬度、速度、方向角,作为GPS导航数据词条。所述的GPS导航数据库,是指导航APP上传GPS导航数据后,对上传的GPS数据进行汇总、存储的数据库,例如导航APP公司的服务器数据库。所述的设备是指内置导航模块且可以运行导航APP的设备,例如手机、平板电脑等。
对GPS导航数据词条进行预处理,保留词条中的日期、时间、设备编号、经度、维度和速度属性,将其余属性筛除,然后将预处理后的GPS导航数据词条先按照设备编号排序,对于同一设备编号的词条按照时间顺序排序,得到同一天内不同设备编号的GPS导航数据词条汇总表。本实施例中提供了一个具体的汇总表,如表1所示。
表1GPS导航数据词条汇总表
date time facility lng LAT speed
2016-09-20 00:00:00 9.223372036854776e18 114.045 22.5972 51
2016-09-20 04:04:43 9.223372036854776e18 113.837 22.6146 37
2016-09-20 08:14:45 1.2645835193132088e18 114.096 22.5686 11
2016-09-20 12:24:45 4.195613949915934e17 114.302 22.5984 0
2016-09-20 16:34:45 4.776180725000466e18 114.037 22.7986 96
..
步骤2,根据GPS导航数据词条汇总表中的数据,识别设备的出发点及到达点
为了更好地分析交通需求估计,根据提供的GPS导航数据词条汇总表识别出设备的出发点、到达点的GPS导航数据词条。因为同一设备的按时间属性排序的GPS导航数据词条是有一定的时间间隔,并不是连续的词条,因此不能简单地认为词条中的第一条数据认为是起点,最后一条数据认为是到达点。本方案通过对大量GPS导航数据词条的分析和验证工作,提出了一种能准确识别出发点、到达点的方法,从而为后续的交通需求分析提供精准的数据。具体方法如下:
步骤2.1,识别设备的出发点
对同一设备的所有按照时间排序的GPS导航数据词条记为词条1至词条N;依次判断词条1至词条N是否满足以出发点条件;每一次判断时,记词条i(i=1,2,...N)为B词条,B词条之前的一个词条为A词条。当i=1时,词条i即为按时间排序的第一个词条,在该词条之前不存在该设备的其他词条。A词条的经纬度为(LonA,LatA),B词条的经纬度为(LonB,LatB)。对所述的经纬度进行转换,规则为:
平均半径取R=6371.004千米,按照0度经线为基准,东经取经度的正值(Longitude),西经取经度负值(-Longitude),北纬取90-纬度值(90-Latitude),南纬取90+纬度值(90+Latitude),经过转换后A词条的经度纬度、B词条的经纬度分别被记为(MLonA,MLatA)和(MLonB,MLatB)。
所述出发点的条件为:
条件1:B词条中的速度值不为零,且不存在A词条;
条件2:B词条的速度不为零,存在A词条,A词条的速度值为0,A词条与B词条的时间差大于30s,且设备从A词条对应的地点到达B词条对应的地点间的平均速度
Figure BDA0002131512800000083
在0~0.1m/s。
所述的平均速度V的计算公式为:
C=sin(MLatA)*sin(MLatB)*cos(MLonA-MLonB)+cos(MLatA)*cos(MLatB)
式1
Distance=R*ArccosC*π/180 式2
Figure BDA0002131512800000081
其中,T1、T2分别为词条A中的时间以及词条B中的时间。
分别将词条i(i=1,2,...N)作为B词条,判断词条是否满足上述的条件1或条件2,如B词条满足条件1或条件2,则记B词条对应的设备所在的地点为设备的出发点。
按照上面的方法,筛选每一个设备的出发点的词条,得到出发点的GPS导航数据词条汇总表;本实施例中结果如表2所示。
表2出发点的GPS导航数据词条汇总表
Figure BDA0002131512800000082
Figure BDA0002131512800000091
步骤2.2,识别设备的到达点
识别设备到达点的方法和步骤2.1类似,即分别将设备的词条1至词条N作为B词条,但之处是记B词条之后的一个词条为A词条;那么当i=N时,词条i即为按时间排序的最后一个词条,在该词条之后不存在该设备的其他词条。识别设备到达点所需满足的条件是:
条件3:B词条中的速度值为零,且不存在A词条;
条件4:B词条中的速度值为零,存在A词条,A词条中速度值不为0,A词条与B词条的时间差大于30s,且设备从A词条对应的地点到达B词条对应的地点间的平均速度
Figure BDA0002131512800000092
在0~0.1m/s。
计算平均速度
Figure BDA0002131512800000093
的公式同式1至式3。
分别将词条i(i=1,2,...N)作为B词条,判断词条是否满足上述的条件3或条件4,如B词条满足条件3或条件4,则记B词条对应的设备所在的地点为设备的到达点。
按照上面的方法,筛选每一个设备的到达点的词条,得到到达点的GPS导航数据词条汇总表;本实施例中结果如表3所示。
表3到达点的GPS导航数据词条汇总表
Figure BDA0002131512800000094
Figure BDA0002131512800000101
步骤3,采用核函数对数据进行挖掘分析
以核函数为核心的核密度分析用于计算点要素在其周围邻域中的密度,即计算每个输出栅格像元周围的点要素的密度,每个输出栅格像元的密度均为叠加在栅格像元中心的所有核表面的值之和。据此,核密度分析可用于对城市交通需求的估计,交通需求约旺盛,在该地理位置处的GPS数据词条越多,输出栅格密度也越大。核函数以Silverman的著作(1986年版)《Density Estimation for Statistics and Data Analysis》中描述的四次核函数为基础。核密度分析往往以热力图的形式可视化展现,热力图(Heat Map)是通过密度函数进行可视化用于表示地图中点的密度的热图。它一般是基于离散点、线或面的分析与表达,或者基于连续表面的密度分析得到的热力图或热度图。强调空间位置和基本的空间分布特征。该步骤具体如下:
步骤3.1,将步骤2得到的所有设备出发点的词条(即出发点的GPS导航数据词条汇总表中的所有词条)或到达点的词条(到达点的GPS导航数据词条汇总表中的所有词条)导入热力图软件中生成点要素;由于一个词条中包含一个经纬度值,则一个词条即生成一个点要素;
步骤3.2,根据点要素的经纬度,确定带宽
记SD是标准距离,Dm是中值距离,加权值为1,SearchRadius是带宽,n是点要素个数,计算输入点要素的平均中心,计算公式如下:
Figure BDA0002131512800000102
其中,(xi,yi)是点要素i的坐标(经纬度),
Figure BDA0002131512800000103
为计算出的平均中心的坐标;
计算每个点要素与所述平均中心之间的距离,计算公式采用式1和式2;然后在计算出的距离中,选出距离的中值即Dm
计算标准距离SD,公式为:
Figure BDA0002131512800000104
计算带宽,公式为:
Figure BDA0002131512800000111
步骤3.3,根据步骤3.2计算出来的带宽,通过核函数计算每个输出栅格像元的密度,然后用自然间断点分级法生成热力图;
其中,输出栅格是地理处理工具GIS中根据研究的地理区域图层将其分成等大面积的栅格像元;计算出的带宽是以该栅格像元为中心,带宽为半径搜索点要素。
步骤3.4,根据热力图的输出栅格像元的密度确定研究区域,以自然间断点之间的分类间隔范围划定交通需求估计区域,记为热点区域,通过热点区域即可进行交通需求的分析和估计。
其中,当步骤3.1生成点要素的是出发点词条时,所述的热力图即为针对于出发点的热力图;而当生成点要素的是到达点词条时,热力图为针对于到达点的热力图。
本方案克服了以往的研究未考虑的缺陷,解决了交通需求热点区域的区域选择问题。针对背景技术中提及的方案1和方案5中的缺陷:本方案以优先服务最大群体为目标,根据核函数进行核密度分析形成的热力图,针对需要研究聚类的区域进一步划分,根据几何分割法筛选出连续的密度值热力图区域,由此我们得到的研究区域是出行需求最为旺盛的区域,交通出行需求较少的区域,将被筛选分割出来。针对方案3的缺陷:本方案有效减少了样本数,对于交通需求较旺盛的区域,输出的栅格密度就会越大,相应地相同栅格密度就会在密度分析中形成连续的热力图密度区域,反之,该区域并未形成连续的热力图密度区域;此过程筛选出热点区域即需要层次分析的样本数,有效减少了计算的空间和时间,使步骤4所聚类的GPS导航数据词条的经纬度属性仅限于热力图框选出的研究区域,提高了利用率,使得交通需求估计更加专注于热点区域,更加合理有效,如图1所示,通过计算带宽得出热力图后,根据热力图的不同密度划分,为判断估计交通需求提供了依据。
步骤4,通过聚类进行交通需求估计
在聚类算法研究中,层次的聚类方法(Hierarchical Method)是一种根据给定的簇间距离度量准则,构造和维护一棵由簇和子簇形成的聚类树,直至满足某个终结条件为止的方法。该算法正在交通调度,交通需求估计,区域划分等问题中有良好的表现。其中的最短距离的层次聚类算法,其每个簇可以被簇中所有对象代表,两个簇间的相似度由这两个不同簇中距离最近的数据点对的相似度来确定。聚类的合并过程反复进行直到所有的对象最终合并形成一个簇。该步骤具体包括:
步骤4.1,根据步骤2得到的出发点词条/到达点词条以及通过步骤3得到的针对于出发点词条/到达点词条的热点区域,将热点区域内的GPS导航数据词条筛选出来作为交通需求估计聚类点;
因为往往每个词条的经纬度位置代表着一个出行需求,在这里起始聚类的时候,层次聚类是把每一个词条的数据点当作一个聚类(一簇)。
步骤4.2,设定阈值n,根据热点区域的输出栅格像元的密度调整阈值;一般情况下,阈值取值范围为50~200,一般输出栅格像元密度较大,相应的阈值就会较小。阈值的设置目的为,当两个簇类之间的最短距离(两个簇类的聚类点的最短距离)小于阈值时,则将该簇与其他簇聚成一个簇。
步骤4.3,每个交通需求估计聚类点各成一簇,记所有交通需求估计聚类点中,第i点的经纬度为(LonI,LatI),第j点的经纬度为(LonJ,LatJ),根据聚类点的经纬度坐标计算各个聚类点间的距离d(i,j),构建距离矩阵D=[d(i,j)]:
Figure BDA0002131512800000121
步骤4.4,用L(m)表示第m次聚类层次,初始设置m=0,L(m)=0,簇的序号用(m)表示,簇(r)和簇(s)的距离矩阵中的值用d[(r),(s)]表示,从当前的所有簇中,找出距离最近的两个簇(r)、(s);
步骤4.5,将簇的序列号加1,即m=m+1,将簇(r)、(s)合并,并令聚类的层次L(m)=d[(r),(s)];其中d[(r),(s)]表示簇(r)、(s)间的距离;
步骤4.6,更新距离矩阵D,删除簇(r)、(s)在距离矩阵中对应的行和列,并在距离矩阵D中加上新生成的簇(即合并(r)、(s)后的簇)对应的行和列;其中新生成的簇(r,s)和原来的簇(k)的距离计算公式如下:
d[(k),(r,s)]=min(d[(k),(r)],d[(k),(s)]) 式8
步骤4.7,重复步骤4.4至步骤4.6,直至距离最近的两个簇(r)、(s)的最小距离mind[(r),(s)]>阈值n为止。
由此,通过本发明方法,可根据交通需求热点区域内GPS导航数据词条,进行交通需求估计规划,为交通调度,规划出行路线提供支持。
对于研究的GPS导航数据词条中的出发点和到达点,通过热力图展现了在出发点或到达点出每个输出栅格像元的密度分布情况,从而更好的确定研究区域,并利用改进的层次聚类算法对研究区域内的出发点或者到达点进行聚类分析,研究出发点和到达点,其对于交通需求的估计意义也不同。研究出发点,可以根据出发点的聚类结果在道路交通的分布状况,可估计出城市居民在出行交通需求最为旺盛的区域,交通部门可灵活地通过调动周边的公共交通设备,满足该区域居民的出行交通需求,以缓解和平衡城市的交通需求;对于研究到达点,可以根据到达点的聚类情况在道路的分布情况,可估计出城市居民在出行目的地的分布状况,交通部分可依据此临时规划调整公共交通设备的运行路线和运行时间,调整周边道路的运行情况,引导非到达聚类区域的车辆离开该区域,避免出现拥塞,缓解城市交通压力,同时可安排警力在到达点聚类的核心街道和区域疏散人流,对于维稳有一定的帮助。
本步骤改善了传统的交通需求估计的问题,弥补了以往方案的未考虑的问题。针对背景技术中方案2中的缺陷:本算法在开始构建初始矩阵后,比较最小簇类间距离与预定阈值大小,以作为判定聚类结束条件,避免生成硬性划分的聚类,尽可能达到全局最优解,划分出合理的聚类,如图2所示,聚类结束的条件是以距离矩阵大于阈值。针对方案3中的缺陷:本算法在每一次更新距离矩阵的时候,将研宄区域内点与点间距离小于等于阈值的数据点合并为一个簇,同时过滤掉距离阈值大于的点集,实现了传统K-means所要达到的目标,如图2所示,点集之间的聚类效果与输入阈值有关,使得聚类点间的距离满足在阈值范围内。针对方案4中的缺陷:本算法避免了敏感参数对聚类效果的严重影响,通过计算确定阈值范围,阈值的设定减少运算量,并且阈值间的变化对聚类效果的影响相对较少,使得交通需求估计更加合理。

Claims (3)

1.一种基于GPS导航数据的交通需求估计方法,其特征在于,包括以下步骤:
步骤1,采集GPS导航数据并进行预处理,以建立GPS导航数据词条汇总表
从GPS导航数据库中以天为单位,采集一天内不同设备产生的GPS导航数据,对GPS导航数据词条进行预处理,保留词条中的日期、时间、设备编号、经度、维度和速度属性,将其余属性筛除,然后将预处理后的GPS导航数据词条先按照设备编号排序,对于同一设备编号的词条按照时间顺序排序,得到同一天内不同设备编号的GPS导航数据词条汇总表;
步骤2,根据GPS导航数据词条汇总表中的数据,识别设备的出发点及到达点
步骤2.1,识别设备的出发点
对同一设备的所有按照时间排序的GPS导航数据词条记为词条1至词条N;依次判断词条1至词条N是否满足以出发点条件;每一次判断时,记词条i(i=1,2,...N)为B词条,B词条之前的一个词条为A词条;
记A词条的经纬度为(LonA,LatA),B词条的经纬度为(LonB,LatB);对所述的经纬度进行转换,经过转换后A词条的经度纬度、B词条的经纬度分别被记为(MLonA,MLatA)和(MLonB,MLatB);
所述出发点的条件为:
条件1:B词条中的速度值不为零,且不存在A词条;
条件2:B词条的速度不为零,存在A词条,A词条的速度值为0,A词条与B词条的时间差大于30s,且设备从A词条对应的地点到达B词条对应的地点间的平均速度
Figure FDA0002131512790000011
在0~0.1m/s;
所述的平均速度V的计算公式为:
C=sin(MLatA)*sin(MLatB)*cos(MLonA-MLonB)+cos(MLatA)*cos(MLatB)
式1
Distance=R*ArccosC*π/180 式2
Figure FDA0002131512790000021
其中,T1、T2分别为词条A中的时间以及词条B中的时间;
分别将词条i(i=1,2,...N)作为B词条,判断词条是否满足上述的条件1或条件2,如B词条满足条件1或条件2,则记B词条对应的设备所在的地点为设备的出发点;
步骤2.2,识别设备的到达点
分别将设备的词条1至词条N作为B词条,但之处是记B词条之后的一个词条为A词条;识别设备到达点所需满足的条件是:
条件3:B词条中的速度值为零,且不存在A词条;
条件4:B词条中的速度值为零,存在A词条,A词条中速度值不为0,A词条与B词条的时间差大于30s,且设备从A词条对应的地点到达B词条对应的地点间的平均速度
Figure FDA0002131512790000022
在0~0.1m/s;
分别将词条i(i=1,2,...N)作为B词条,判断词条是否满足上述的条件3或条件4,如B词条满足条件3或条件4,则记B词条对应的设备所在的地点为设备的到达点;
步骤3,采用核函数对数据进行挖掘分析
步骤3.1,将步骤2得到的所有设备出发点的词条或到达点的词条生成点要素;
步骤3.2,根据点要素的经纬度,确定带宽
记SD是标准距离,Dm是中值距离,加权值为1,SearchRadius是带宽,n是点要素个数,计算输入点要素的平均中心,计算公式如下:
Figure FDA0002131512790000023
其中,(xi,yi)是点要素i的坐标(经纬度),
Figure FDA0002131512790000024
为计算出的平均中心的坐标;
计算每个点要素与所述平均中心之间的距离,然后在计算出的距离中,选出距离的中值即Dm
计算标准距离SD,公式为:
Figure FDA0002131512790000031
计算带宽,公式为:
Figure FDA0002131512790000032
步骤3.3,根据步骤3.2计算出来的带宽,通过核函数计算每个输出栅格像元的密度,然后用自然间断点分级法生成热力图;
步骤3.4,根据热力图的输出栅格像元的密度确定研究区域,以自然间断点之间的分类间隔范围划定交通需求估计区域,记为热点区域。
2.如权利要求1所述的种基于GPS导航数据的交通需求估计方法,其特征在于,所述的基于GPS导航数据的交通需求估计方法还包括:
步骤4,通过聚类进行交通需求估计
步骤4.1,根据步骤2得到的出发点词条/到达点词条以及通过步骤3得到的针对于出发点词条/到达点词条的热点区域,将热点区域内的GPS导航数据词条筛选出来作为交通需求估计聚类点;
步骤4.2,设定阈值n;
步骤4.3,每个交通需求估计聚类点各成一簇,记所有交通需求估计聚类点中,根据聚类点的经纬度坐标计算各个聚类点间的距离d(i,j),构建距离矩阵D=[d(i,j)];其中i,j分别表示第i个聚类点、第j个聚类点;
步骤4.4,用L(m)表示第m次聚类层次,初始设置m=0,L(m)=0,簇的序号用(m)表示,簇(r)和簇(s)的距离矩阵中的值用d[(r),(s)]表示,从当前的所有簇中,找出距离最近的两个簇(r)、(s);
步骤4.5,将簇的序列号加1,即m=m+1,将簇(r)、(s)合并,并令聚类的层次L(m)=d[(r),(s)];其中d[(r),(s)]表示簇(r)、(s)间的距离;
步骤4.6,更新距离矩阵D,删除簇(r)、(s)在距离矩阵中对应的行和列,并在距离矩阵D中加上新生成的簇对应的行和列;
步骤4.7,重复步骤4.4至步骤4.6,直至距离最近的两个簇(r)、(s)的最小距离mind[(r),(s)]>阈值n为止。
3.如权利要求1所述的种基于GPS导航数据的交通需求估计方法,其特征在于,对所述的经纬度进行转换,包括:
按照0度经线为基准,东经取经度的正值(Longitude),西经取经度负值(-Longitude),北纬取90-纬度值(90-Latitude),南纬取90+纬度值(90+Latitude),经过转换后A词条的经度纬度、B词条的经纬度分别被记为(MLonA,MLatA)和(MLonB,MLatB)。
CN201910639986.XA 2019-07-16 2019-07-16 一种基于gps导航数据的交通需求估计方法 Active CN110555544B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910639986.XA CN110555544B (zh) 2019-07-16 2019-07-16 一种基于gps导航数据的交通需求估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910639986.XA CN110555544B (zh) 2019-07-16 2019-07-16 一种基于gps导航数据的交通需求估计方法

Publications (2)

Publication Number Publication Date
CN110555544A CN110555544A (zh) 2019-12-10
CN110555544B true CN110555544B (zh) 2022-04-08

Family

ID=68736478

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910639986.XA Active CN110555544B (zh) 2019-07-16 2019-07-16 一种基于gps导航数据的交通需求估计方法

Country Status (1)

Country Link
CN (1) CN110555544B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111582601A (zh) * 2020-05-15 2020-08-25 河南科技大学 一种公交站点选址方法及装置
CN112218235B (zh) * 2020-09-17 2024-03-08 上海市政工程设计研究总院(集团)有限公司 一种基于手机信令数据的市域组团间出行路径识别方法
CN113538033A (zh) * 2021-01-05 2021-10-22 天津大学 基于流域的经济发展及能源需求的分析方法及装置
CN113470352B (zh) * 2021-06-17 2022-10-21 之江实验室 一种基于多任务学习的交通大数据分析与预测系统及方法
CN115631416A (zh) * 2022-10-31 2023-01-20 南京林业大学 一种基于modis燃烧数据产品的火灾足迹提取方法
CN117292546B (zh) * 2023-10-23 2024-05-07 重庆交通大学 一种基于手机gps数据的交通出行方式od计算方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103854480A (zh) * 2012-12-05 2014-06-11 深圳先进技术研究院 交通监测数据矩阵补全算法
CN104240507A (zh) * 2014-09-18 2014-12-24 银江股份有限公司 一种基于多视角融合的交通小区划分方法
CN105307121A (zh) * 2015-10-16 2016-02-03 上海晶赞科技发展有限公司 一种信息处理方法及装置
CN106227726A (zh) * 2016-06-30 2016-12-14 北京航空航天大学 一种基于车辆轨迹数据的路径提取方法
CN107291873A (zh) * 2017-06-16 2017-10-24 晶赞广告(上海)有限公司 地理位置聚类方法
CN109299438A (zh) * 2018-09-21 2019-02-01 东南大学 一种基于网约车数据的公共交通设施供给水平评价方法
CN109410586A (zh) * 2018-12-13 2019-03-01 中南大学 一种基于多元数据融合的交通状态检测方法
CN109767615A (zh) * 2018-10-19 2019-05-17 江苏智通交通科技有限公司 路网交通流关键流向和关键路径分析方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6240235B2 (ja) * 2016-02-19 2017-11-29 ヤフー株式会社 判定装置、判定方法および判定プログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103854480A (zh) * 2012-12-05 2014-06-11 深圳先进技术研究院 交通监测数据矩阵补全算法
CN104240507A (zh) * 2014-09-18 2014-12-24 银江股份有限公司 一种基于多视角融合的交通小区划分方法
CN105307121A (zh) * 2015-10-16 2016-02-03 上海晶赞科技发展有限公司 一种信息处理方法及装置
CN106227726A (zh) * 2016-06-30 2016-12-14 北京航空航天大学 一种基于车辆轨迹数据的路径提取方法
CN107291873A (zh) * 2017-06-16 2017-10-24 晶赞广告(上海)有限公司 地理位置聚类方法
CN109299438A (zh) * 2018-09-21 2019-02-01 东南大学 一种基于网约车数据的公共交通设施供给水平评价方法
CN109767615A (zh) * 2018-10-19 2019-05-17 江苏智通交通科技有限公司 路网交通流关键流向和关键路径分析方法
CN109410586A (zh) * 2018-12-13 2019-03-01 中南大学 一种基于多元数据融合的交通状态检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
城市道路状况概率神经网络判别方法;郭庚麒等;《计算机工程与应用》;20090501;第214-216、219页 *

Also Published As

Publication number Publication date
CN110555544A (zh) 2019-12-10

Similar Documents

Publication Publication Date Title
CN110555544B (zh) 一种基于gps导航数据的交通需求估计方法
CN108564226B (zh) 一种基于出租车gps及手机信令数据的公交线路优化方法
CN110298500B (zh) 一种基于出租车数据和城市路网的城市交通轨迹数据集生成方法
Shang et al. Inferring gas consumption and pollution emission of vehicles throughout a city
WO2018214675A1 (zh) 一种量化分析城市建成环境对道路行程时间影响的方法
CN104318324A (zh) 基于出租车gps记录的机场巴士站点及路线规划方法
CN113159364A (zh) 一种大型交通场站的客流预测方法及系统
Huang et al. A method for bus OD matrix estimation using multisource data
CN110716935A (zh) 基于网约车出行的轨迹数据分析与可视化方法及系统
CN106067154A (zh) 一种基于手机大数据的城市间迁移客流分析方法
CN110990661B (zh) 一种基于路网约束和密度聚类的兴趣区域出入口提取方法
CN108961758A (zh) 一种基于梯度提升决策树的路口展宽车道探测方法
CN112784000B (zh) 基于出租车轨迹数据的寻客方法
CN110836675A (zh) 一种基于决策树的自动驾驶搜索决策方法
Zhou et al. Research on traffic situation analysis for urban road network through spatiotemporal data mining: a case study of Xi’an, China
CN106327867B (zh) 一种基于gps数据的公交准点预测方法
CN115412857B (zh) 一种居民出行信息预测方法
CN114969007A (zh) 一种基于功能混合度和集成学习的城市功能区识别方法
CN112000755A (zh) 一种基于手机信令数据的区域出行廊道识别方法
Chen et al. An analysis of movement patterns between zones using taxi GPS data
CN114530038B (zh) 一种基于时空数据聚类的出行兴趣区域提取方法及系统
WO2023014311A1 (en) Traffic density estimation system and a method thereof
CN108681741B (zh) 基于ic卡和居民调查数据的地铁通勤人群信息融合方法
Muñoz-Villamizar et al. Study of urban-traffic congestion based on Google Maps API: the case of Boston
CN112559909B (zh) 一种基于gcn嵌入空间聚类模型的商业区发现方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant