CN110516702B - 一种基于流数据的离散路径规划方法 - Google Patents

一种基于流数据的离散路径规划方法 Download PDF

Info

Publication number
CN110516702B
CN110516702B CN201910650798.7A CN201910650798A CN110516702B CN 110516702 B CN110516702 B CN 110516702B CN 201910650798 A CN201910650798 A CN 201910650798A CN 110516702 B CN110516702 B CN 110516702B
Authority
CN
China
Prior art keywords
data
path
feature
centroids
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910650798.7A
Other languages
English (en)
Other versions
CN110516702A (zh
Inventor
张凤荔
王瑞锦
张雪岩
周世杰
翟嘉伊
刘崛雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201910650798.7A priority Critical patent/CN110516702B/zh
Publication of CN110516702A publication Critical patent/CN110516702A/zh
Application granted granted Critical
Publication of CN110516702B publication Critical patent/CN110516702B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing

Abstract

本发明公开了一种基于流数据的离散路径规划方法,所述路径规划方法包括以下内容:输入起点及终点位置;定义路径网络拓扑结构中的节点结构;初始化节点结构输出路径网络拓扑结构信息;根据路径网络拓扑结构信息计算最短距离。通过十字链表存储结构替换邻接矩阵存储结构的方法对Dijkstra算法进行优化,分析得到路径权值影响因素,设置路径权值确定方法对路径权值进行计算,简化了算法的时间及空间复杂度,提高了路径规划结果的有效性。

Description

一种基于流数据的离散路径规划方法
技术领域
本发明涉及一种路径规划方法,尤其涉及一种基于流数据的离散路径规划 方法。
背景技术
近年来,城市经济的高速发展带来了城市交通需求的日益饱和,交通拥堵现 象已经成为城市交通运输中的头号公敌,城市道路呈现排队等待甚至拥塞状态, 严重影响了人们出行的积极性与效率。作为智能交通系统的一个重要组成部分, 车辆路径诱导能够实时高效地向出行者提供导航定位、地理信息等服务,引导 出行者从原地点到达目标地点。选用的路径规划策略直接决定着路径诱导提供 给出行者的行驶路径的质量优劣。依据动态交通需求,车辆路径诱导系统中涉 及的路径规划技术在提供精确的路径搜索结果的同时,还需要能够随着交通信 息的动态变化而实时计算结果,以防出现得出的路径规划结果失效。最优路径 规划技术利用GPS、传感器等智能设备获取路网实时运行状态,对路网中的原节点及目标节点的可达性进行分析,探寻对原节点至目标节点间的可达路径, 设置某种最优规则,例如油耗最低、躲避拥堵等,依据优化规则进行不同方案 的选择,并将筛选结果呈现给用户供用户进行选择。
车辆路径诱导依据用户的实时需求,利用最优化寻径技术为出行者展示当前 的最优规划方案。由于车辆路径诱导需要给出基于当前路网运行状态下的最优 寻径路线,因而对寻径算法的时效性提出了极大的挑战。而且随着网络拓扑中 节点、路径的指数增长,经典路径规划算法在路径求解的过程中当中存在一些 明显的缺陷,计算复杂度难以达到系统实时性的需求。
传统最短路径方法以Dijkstra算法的效果最好,应用最为广泛,直至当前,Dijkstra算法依旧是最短路径研究中的关键技术。传统Dijkstra算法以贪心理论 为基础,用于对起始节点到目标节点或网络中每个其他单源节点的最短路径的 求解,不同于其他最短路径搜索算法,Dijkstra算法在完成节点的遍历后,总会 得出一条正确的路径;但是传统Dijkstra存在以下几点缺陷及不足:
(1)传统Dijkstra算法能够正确处理路径权值为正的情况,但面对路径权 值为负的情况显得有些束手无策,当路径权值出现负值时,极易陷入局部最优 解而无法得到正确的结果。
(2)传统Dijkstra算法将节点关系存储在邻接矩阵中,当需要从邻接矩阵 中获取节点关系时,需要对n*n个存储单元进行遍历,即使针对边稀疏网络同 样需要进行n*n次访问,但其中存在大量无效关系,对这些无效的结构关系进 行访问会带来巨大的时间和空间复杂度。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于流数据的离散路径规 划方法,解决了现有路径规划方法存在的缺陷。
本发明的目的是通过以下技术方案来实现的:一种基于流数据的离散路径 规划方法,所述路径规划方法包括以下内容:
输入起点及终点位置;
定义路径网络拓扑结构中的节点结构;
初始化节点结构输出路径网络拓扑结构信息;
根据路径网络拓扑结构信息计算最短距离。
所述路径网络拓扑结构信息包括最短路径信息、路径网络拓扑结构中所有 未被访问的节点和路径网络拓扑结构中已访问的节点。
在进行输入起点及重点位置步骤之前还需要完成路径网络拓扑结构的构建, 其包括的步骤如下:
根据某一区域的高速公路网络拓扑中所有有效节点进行定义及获取;
定义节点的连通性,获取网络中的所有路径;
定义不同节点间的连通性,计算所有节点间的连通强度;
完成该区域网络拓扑结构的构建。
在进行路径规划之前还需要对不同的道路交通状态的路径权值进行分类计 算;路径权值计算步骤如下:
选取旅行时间作为主要判别参数并将其余参数转换为旅行速度;
根据其余参数对旅行时间进行定义;
根据不同的道路交通状态对旅行时间进行定义及路径权值的计算。
所述道路交通状态的判别方法如下:
数据预处理,对采集的交通流数据进行数据预处理;
特征选择,选择相关特征子集通过去除不相关及冗余特征降低数据维度;
多特征聚类,通过对多维特征分析对交通流数据进行划分;
实时分类,对交通流数据进行分类进行实时交通状态的判别。
所述数据预处理的步骤如下:
判断数据值域的波动范围是否在合理范围内;
如果数据值域超出合理范围,则说明数据出现明显错误,并对错误数据进行 处理;
如果数据值域在合理范围内波动,则说明数据正常;
对数据进行数据标准化处理;包括遍历所有交通流数据的特征向量,获取最 大值;遍历所有交通流数据的特征向量,获取最小值;对特征向量进行归一化 处理。
所述特征选择,选择相关特征子集通过去除不相关及冗余特征降低数据维度 的具体步骤如下:
计算训练集中不同特征向量和已知类别的相关性;
根据不同的相关性确定不同特征的不同权值;
删除权值小于阈值的特征。
所述多特征聚类,通过对多维特征分析对交通流数据进行划分的具体步骤如 下:
第一步:初始令S=1,对初始的m个数据使用K-Means聚类算法计算得到 k个S级质心。
第二步:重复执行第一步骤,直至得到m个S级质心。
第三步:对m个S级质心使用K-Means聚类算法计算得到k个S+1级质心。
第四步:重复执行第三步,直至得到m个S+1级质心,S=S+1
第五步:重复执行上述步骤,即每当得到m个S级质心时,就使用K-Means 算法进行聚类得到k个S+1级质心;直至最终得到最终的k个质心。
所述实时分类,对交通流数据进行分类进行实时交通状态的判别包括以下步 骤:
第一步:随机在样本集中进行有放回的样本选择过程,共选取m个随机样 本;
第二步:对于经过特征选择的特征集而言,随机在特征集中选择n个特征, 建立CART决策树模型;
第三步:重复第一步和第二步k次,生成k棵CART决策树,每棵决策树拥 有独立的决策准则;
第四步:将交通流数据输入到每棵树决策,最后确定特征所属类别。
所述网络拓扑结构信息通过改进后的十字链表存储路径结构进行存储,降低 简化了时间复杂度和空间关系。
本发明的有益效果是:一种基于流数据的离散路径规划方法,通过十字链表 存储结构替换邻接矩阵存储结构的方法对Dijkstra算法进行优化,分析得到路径 权值影响因素,设置路径权值确定方法对路径权值进行计算,简化了算法的时 间及空间复杂度,提高了路径规划结果的有效性。
附图说明
图1为路径规划方法的流程图;
图2为网络拓扑结构构建的流程图;
图3为连通强度计算流程图;
图4为改进十字链表节点结构图;
图5为改进十字链表顶点结构图;
图6为改进十字链表弧结构图;
图7为改进十字链表结构图;
图8为实施例的十字链表结构图;
图9为实施例的路线规划图;
图10为时间复杂测试对比图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明 实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然, 所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附 图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要 求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的 实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某 一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解 释。
在本发明的描述中,需要说明的是,术语“上”、“内”、“外”等指示的方位或 位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆 放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗 示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不 能理解为对本发明的限制。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设 置”、“安装”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸 连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连, 也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普 通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不 局限于以下所述。
如图1所示,一种基于流数据的离散路径规划方法,所述路径规划方法包 括以下内容:
输入起点及终点位置;
定义路径网络拓扑结构中的节点结构;
初始化节点结构输出路径网络拓扑结构信息;
根据路径网络拓扑结构信息计算最短距离。
所述路径网络拓扑结构信息包括最短路径信息、路径网络拓扑结构中所有 未被访问的节点和路径网络拓扑结构中已访问的节点。
如图2所示,在进行输入起点及重点位置步骤之前还需要完成路径网络拓 扑结构的构建,其包括的步骤如下:
根据某一区域的高速公路网络拓扑中所有有效节点进行定义及获取;
进一步地,将该区域内高速公路网络拓扑中的地级市、自治州、县定义为 节点并获取。
定义节点的连通性,获取网络中的所有路径;
进一步地,若连接地级市点节点间的高速公路直接互通且未途径任意中间 节点,则可直接完成该路段的定义。若连接地级市节点间的高速公路间接互通 且途径上述任意的中间节点,则需对路段进行一定的拆分,将原路段进行子路 段分割,直至每个子路段为地级市节点至中间节点或中间节点间的互通路段且 未途径任意中间节点。运用此方法进行路段定义可保证路段起止节点间完全互 通,且不会有其余中间节点的干扰。
定义不同节点间的连通性,计算所有节点间的连通强度;
进一步地,如图3所示,所有节点间连通强度的算法流程为:
1.路段类别划分;依据路段自身属性对路段进行划分,具体划分方法为: 若路段的起止节点均为地级市节点,且中间未经过中间节点,则该路段为1类 路段;若路段的起止节点中任意节点为中间节点,则该路段为2类路段。
2.针对1类路段R1=(Ri,Rj)而言,所有路段均符合建模要求,可直接储存结 果。
3.对于2类路段而言,若该路段形如R2=(Ri,rj)或R2=(ri,Rj),则转而执行 3.1,若该路段形如R2=(ri,rj),则转而执行4,depth=0;
3.1对于R2=(Ri,rj)路段,在所有形如R2=(rj,Rk)路段搜索以rj为中间节点 的路段,如存在符合要求的路段,则将结果进行存储,否则执行3.2;
3.2在所有形如R2=(rj,rk)路段中的搜索以rj为中间节点的路段,如存在符 合要求的路段,depth=depth+1,转而执行4;
4.对于R2=(ri,rj);
4.1在所有形如R2=(rj,Rk)的路段中搜索以rj为中间节点的路段,如存在符合 要求的路段,则将结果进行存储,否则,转而执行4.2;
4.2在所有形如R2=(rj,rk)的路段中搜索以rj为中间节点的路段,如存在符 合要求的路段,depth=depth+1。若depth≤7,则继续执行4.2,否则退出算法。
完成该区域网络拓扑结构的构建。
在进行路径规划之前还需要对不同的道路交通状态的路径权值进行分类计 算;路径权值计算步骤如下:
选取旅行时间作为主要判别参数并将其余参数转换为旅行速度;
根据其余参数对旅行时间进行定义;
根据不同的道路交通状态对旅行时间进行定义及路径权值的计算。
进一步地,选取旅行时间、道路长度、行驶速度和道路交通状态等参数作 为路径权值的确定依据;
由于参数间的单位完全不同,因而难以直接对参数进行加权求解。因此考 虑将旅行时间为主要判别参数,
weight=T
即将其余参数已不同形式转换为旅行速度,再进行加权处理。由于旅行时 间难以直接进行获取,并定义:
T=Ti+Tl
式中T为实际旅行时间,Ti为理论旅行时间,Tl为拥堵等待时间。
可以发现,实际旅行时间T由两部分组成,理论旅行时间Ti及拥堵时间Tl。 理论旅行时间Ti为在理想自由流情况下旅行时间,可由T=Ti+Tl进行求解得到:
Figure BDA0002135125150000091
式中Ti为理论旅行时间,L为道路长度,V为行驶平均速度。
若道路未出现拥堵,即路网内的车辆自由行驶,不会受到拥堵、事故等突 发事件的干扰而出现的排队阻塞。实际旅行时间可由公式
Figure BDA0002135125150000092
进行求解。但实 际情况下,道路不可能总不出现突发事件。当道路发生拥堵时,出现非自由流 状态,车辆间的行驶必然会受到制约,甚至出现排队等待等严重状况。因而在 道路权值确定的过程中,必须要考虑道路的实际拥堵状况。
由于高速公路的车流量远远小于城市道路,且不必受到交通信号灯、路口、 人行横道等停车等的限制。因此当高速公路发生拥堵时,极大可能是人为原因 造成的,特别是交通事故的影响。当高速公路发生交通事故后,由于时效性延 误而处理不及时,极易造成交通阻塞,车辆被迫停车,出现排队等待的状况。 由于排队时长的不确定性。本发明依据道路交通状态对排队时长进行定义:
Figure BDA0002135125150000093
式中K1、K2、K3均为常数
具体地,当道路交通状态为畅通时,不需要停车进行排队等待,因此拥堵 等待时长为0。当道路处于缓行、拥堵、严重拥堵状况下,车辆的行驶受到不同 程度的限制,同时车辆会出现不同程度的排队等待。具体时长可根据不同道路 的实际状态分别进行定义。
则基于高速公路背景的道路权值确定方法可由以下公式确定:
Figure BDA0002135125150000101
其中,对K1、K2、K3进行计算步骤如下:
获取路段的历史交通流数据,进行交通状态判别过程;
按照路段交通状态进行区分,并依据不同状态进行分类;
C∈{smooth,amble,congestion,severecongestion};
对于处于不同交通类别的交通流数据,取其排队时长字段的平均值作为K1、 K2、K3的值,即:
Figure BDA0002135125150000102
所述道路交通状态的判别方法如下:
数据预处理,对采集的交通流数据进行数据预处理;
进一步地,原始数据在获取、传输、存储的过程中,并不能保证完全的正确 性,必然存在许多不完备的地方,例如,数据类型不一致、数据缺失、数据冗 余等。如果对原始数据不加以处理而直接使用,放任低质量的数据流入算法模 型中,势必对算法模型的学习过程造成巨大的破坏。相反的,对数据进行适当 的预处理,将会显著提升算法模型决策的质量及可靠性。
特征选择,选择相关特征子集通过去除不相关及冗余特征降低数据维度;
进一步地,随着数据规模及数据复杂性的呈指数上升,往往需要建立超大型 的算法结构用以进行问题的求解,算法复杂度及响应时间骤然增加,但实际上, 大多数特征(变量)对问题的求解完全没有帮助,可以说,针对求解问题的过 程,是冗余特征(变量)。这对于数据本身自然是无法接受的,特别是流数据这 种随时间推移无限达到的数据流。因而,在进行模型构建的过程中,选择有效 的数据特征(变量)进行求解显得是至关重要的。
多特征聚类,通过对多维特征分析对交通流数据进行划分;
进一步地,不同特征对被求解问题有着不同方面的描述,表面看似相互独立, 实则有着深层次的联系,多特征聚类即通过对多维特征进行分析,利用相似性 原理将实例划分为多个存在明显差别的子实例。简而言之,聚类分析是将分类 对象置于多维空间内,根据对象间存在的差异性进行辨认,将具有同一属性的 对象划分为同一类,具有不同属性的对象划分为不同类,实现类别间的“高内 聚、低耦合”,即被分作同一类的对象中存在的相似度极高,被分作不同类的对 象间的差异性极大。
实时分类,对交通流数据进行分类进行实时交通状态的判别。
进一步地,由于流数据的特殊性,对模型算法的实时性有极高的要求,因而, 建立实时分类器对源源不断产生的流数据进行分类显得万分重要,实时分类器 需要能够对流入模型内部的数据做出快速的响应,能够在有限时间内完成对流 数据的分类过程,避免出现由于计算复杂度过大而导致大范围的数据排队及阻 塞。
所述数据预处理的步骤如下:
判断采集的交通流数据是否存在异常数据,并对异常数据进行数据处理;
对数据进行数据标准化处理。
如如图2所示,所述判断采集的交通流数据是否存在异常数据,并对异常数 据进行数据处理的具体步骤如下:
判断数据值域的波动范围是否在合理范围内;
进一步地,数据值域的波动在50%~150%之间表示,数据值域在合理范围内 波动。
如果数据值域超出合理范围,则说明数据出现明显错误,并对错误数据进行 处理;
如果数据值域在合理范围内波动,则说明数据正常。
进一步地,错误数据主要包括数据错和数据缺失两种;其中数据错误表示数 据在采集、存储的过程中由于数据格式错误导致数据出现意料之外的结果,如 在交通流量数据中出现负数;数据缺失表示设备在进行数据采集的过程中出现 中断,导致某些数据出现明显的遗漏,如未采集得到交通密度数据。
进一步地,当数据出现明显错误时需要进行错误或者异常处理;当仅出现少 量错误,相较于正确数据可忽略不计时,可以将错误数据直接进行删除。若错 误数据相较于正确数据小于5%时,可将错误数据直接删除。若错误数据相较于 正确数据超过5%,则需要对错误数据进行修正,本发明将使用相邻的数据或一 段时间内的代数平均数进行填补。
所述对数据进行数据标准化处理的具体步骤如下:
遍历所有交通流数据的特征向量,获取最大值Max;
遍历所有交通流数据的特征向量,获取最小值Min;
对特征向量进行归一化处理。
进一步地,归一化计算公式如下:
Figure BDA0002135125150000121
式中x0-1为进行归一化后的特征向量,x为特征向量,Min为特征向量的最 小值,Max为特征向量的最大值。
所述特征选择,选择相关特征子集通过去除不相关及冗余特征降低数据维度 的具体步骤如下:
计算训练集中不同特征向量和已知类别的相关性;
根据不同的相关性确定不同特征的不同权值;
删除权值小于阈值的特征。
具体地,从训练集T中随机选取一个样本S,然后从和S同类的样本集中找 出S的k个近邻样本Hk,从每一个和S不同类的样本集中均找出k个近邻样本 Mk,按照下面公式进行更新每个特征的权值。
W(A)=W(A)-similarityH(A)+differenceM(A)
其中,
Figure BDA0002135125150000131
Figure BDA0002135125150000132
Mj(c)表示类C中的第j个最邻近样本,diff(A,S,R)代表样本S和样本R 在特征A上的差,其计算公式如下所示:
Figure BDA0002135125150000133
可以发现,以上公式中第二个公式实质上在计算样本S的某一特征至同类最 邻近样本Hk的距离之和;第三个公式则是在计算样本S的某一特征至不同类最 邻近样本Mk的距离之和。依据第一个公式的更新公式可知,当样本S的某一特 征至同类最邻近样本Hk的距离之和大于该特征至不同类最邻近样本Mk的距离 之和时,该特征的权值将会被提升,即该特征在进行同类样本及非同类样本的 分类中是正向作用,相反,当样本S的某一特征至同类最邻近样本Hk的距离之 和小于该特征至不同类最邻近样本Mk的距离之和时,则权值将获得削减,即该 特征在进行同类样本及非同类样本的分类中是负向作用。当然,样本S的选择可能具有一定的随机性,因此,可以重复进行n次,取各特征平均权值为该特 征的最终权值,若某一特征的权值大于0.5,则证明该特征与被求解问题间的相 关性高,反之,则证明该特征与被求解问题间的相关性低,特别地,若某一特 征的权值小于阈值,则说明该特征与被求解问题间几乎没有关系,可直接从多 维特征向量组中去除,从而达到特征选择的目的。
所述多特征聚类,通过对多维特征分析对交通流数据进行划分的具体步骤如 下:
第一步:初始令S=1,对初始的m个数据使用K-Means聚类算法计算得到 k个S级质心。
第二步:重复执行第一步骤,直至得到m个S级质心。
第三步:对m个S级质心使用K-Means聚类算法计算得到k个S+1级质心。
第四步:重复执行第三步,直至得到m个S+1级质心,S=S+1
第五步:重复执行上述步骤,即每当得到m个S级质心时,就使用K-Means 算法进行聚类得到k个S+1级质心;直至最终得到最终的k个质心。
进一步地,本发明基于STREAM算法进行多特征聚类分析,STREAM算法 以K-Means算法为基础,引入滑动窗口机制解决流数据聚类中的问题。STREAM 算法的底层框架仍为K-means聚类算法,下面先对K-Means聚类算法作简要分 析。
在K-Means算法的基础上,使用STREAM算法实现对流数据特征的聚类过 程。STREAM算法的底层结构算法为K-Means算法,上层结构中加入批处理机 制,用以解决流数据中出现的概念漂移的问题。
K-Means算法根据多维特征空间内数据点的分布相似性划分各异类别。具体 地,随机从数据集中获取k个对象,将其视作k个簇的初始质心;将其余对象按 照其与各个簇质心的欧几里得距离分配到最邻近的簇,重新计算各个簇的质心, 迭代重复此过程,直至畸变函数收敛,得到k个固定不变的质心。具体地,其 算法流程如下:
1.随机从数据集中获取k个对象,作为k个簇的初始质心μ12...μk
2.针对每个对象,计算其与各个聚类中心点间的欧几里得距离,且根据最 小距离重新对相应对象进行划分,划分标准如公式所示;
C(i)=argmin||x(i)j||2
其中,C(i)为第i个数据对象所属类别,x(i)为第i个数据对象,μj为第j个 聚类中心。
3.根据下面公式更新k个簇的质心μ12...μk
Figure BDA0002135125150000151
4.重复2-3步骤,直至以下公式畸变函数收敛,得到k个不再变化的质心;
Figure BDA0002135125150000152
式中,J(c,μ)为畸变函数,μC为聚类完成后的中心。
如图3所示,实时分类基于决策树理论,建立随机森林模型,以多特征聚类 模块得到的划分类为训练集,对实时交通流进行分类,进行实时交通状态的判 别。
所述实时分类,对交通流数据进行分类进行实时交通状态的判别包括以下步 骤:
第一步:随机在样本集中进行有放回的样本选择过程,共选取m个随机样 本;
第二步:对于经过特征选择的特征集而言,随机在特征集中选择n个特征, 建立CART决策树模型;
第三步:重复第一步和第二步k次,生成k棵CART决策树,每棵决策树拥 有独立的决策准则;
第四步:将交通流数据输入到每棵树决策,最后确定特征所属类别。
所述网络拓扑结构信息通过改进后的十字链表存储路径结构进行存储,降 低简化了时间复杂度和空间关系。
进一步地,如图4所示,十字链表,可以视作在有向图邻接表的基础上建 立一个逆邻接表,将邻接表有逆邻接表优势进行集中。改进十字链表中的每一 个元素均可视为一个有效节点,每个节点包含多个域结构。ivertex及jvertex储 存节点的位置信息,记录该节点的行列信息。ilink及jlink存储下一个节点信息, 记录同一行(列)中下一个非零节点信息。next域指向下一个节点位置,info 域包含节点自身数据信息。
如图5和图6所示,改进十字链表中每一个有效节点均由两部分构成,顶 点结点及弧结点。改进十字链表有效节点的顶点结构包含3个域。其中,Data 域储存顶点自身信息,Fin及Fout域为指针域,Fin域记录以顶点为弧头的第一 条弧结点位置,相反的,Fout域记录以顶点为弧尾的第一条弧结点位置。改进 十字链表有效节点的顶点结构包含5个域。其中,Tailvertex域及Headvertex域 分别记录弧尾及弧头顶点位置。通过访问Tailvertex域及Headvertex域即可确认 当前弧的位置。Headlink域及Taillink域存储弧头及弧尾相同的下一弧位置,访 问Headlink域及Taillink域可获取下一结点位置,从而实现对图的遍历过程。Info 域存储弧结点自身信息。
如图7所示,通过访问改进十字链表节点结构中的指针域即可实现对整个 链表的访问。使用改进十字链表存储路径结构,相较于传统以邻接矩阵方式存 储路径结构的方法,舍弃了以二维数组存储节点关系的方式,转而使用双向链 式存储结构,设立指针域,将弧头或弧尾相同的节点使用指针连接,即前一个 节点的指针域中存储弧头或弧尾相同的下一个节点,相较于二维数组中使用下 标方式访问节点信息,极大程度上简化了存储结构,减少了查找邻接节点的时 间。特别地,当网络中路径增多,路径关系复杂时,可以快速进行节点关系的 检索。
使用改进十字链表存储网络结构关系在邻接节点及反向邻接节点的搜索过 程中,极大降低了时间复杂度。同时空间关系也得到明显简化,当网络拓扑关 系趋于复杂化,降低了内存的利用率。
本发明使用十字链表代替邻接矩阵用以对网络拓扑结构关系进行存储,优 化了算法结构,提高节点搜索的速度,进而提升了算法的效率。
本发明选取四川省境内18个地级市、3个自治州的全部高速公路交通数据 进行路径规划验证实施。在进行路径规划之前,需要对不同路段的路径权值进 行计算,根据道路权值确定方法公式可知,路径权值需要依照不同的道路交通 状态进行分类计算。道路交通状态可由第四章叙述的基于多模型融合的状态算 法进行判别。同时,路径权值的计算过程中需要确认常量K1、K2、K3。
依据基于多模型融合的状态判别算法得到的四川省高速公路实时交通状态 如表1所示;
表1四川省高速公路交通状态判别
Figure BDA0002135125150000171
Figure BDA0002135125150000181
在获取路网中路段的交通状态后,需要对K1、K2、K3的值进行确定,依 据公式
Figure BDA0002135125150000182
进行K1、K2、K3的计算。
下面以G5高速DeYang至ChengDu段为例进行K1、K2、K3计算。G5高 速DeYang至ChengDu段的历史记录交通流数据如表2所示;
表2 G5高速历史交通流数据
Figure BDA0002135125150000183
Figure BDA0002135125150000191
以大量历史交通流数据为参考,利用公式
Figure BDA0002135125150000192
计算 G5高速DeYang至ChengDu路段处于不同交通状态时的排队延误时长。
Figure BDA0002135125150000193
在获取了实时交通流状态及不同交通状态下的排队延误时长后,便可依据 道路权值确定方法公式对道路权值进行合理的求解。依据实时道路交通状态定 义的路径权值如表3所示;
表3四川省高速公路路径权值定义
Figure BDA0002135125150000201
在路径权值确定之后,即可在四川省高速公路网络拓扑环境中使用本发明 的方法完成最短路径的搜索。本发明的权值设置中不包含负权值,即Dijkstra 算法在遍历所有网络结构之后,必然能够得出一条符合条件的最短路径,在此 场景下不存在算法失效的情况。
Linked-Dijkstra算法使用十字链表替代传统的邻接矩阵,无论在邻接节点、 反向邻接节点搜索的复杂性,还是存储结构的空间复杂性,十字链表都要表现 的更加优异。
如图8所示,针对四川省高速公路路网结构,将定义的节点抽象为十字链 表中的节点,使用指针指代节点间的关系,即通过指针的连接关系描述某节点 的邻接节点及反向邻接节点。
如图9所示,通过本发明以成都至剑门关路径规划进行测试,起点坐标位 于成都市,终点坐标位于广元市剑门关的路线规划。
如图10所示,基于四川省高速公路路网拓扑结构,对于多组数据同时使用 传统Dijkstra算法及本发明(Linked-Dijkstra算法)进行路径规划。本文共设置 10组对照实验,时间复杂度结果对比由图。可以发现,采用Linked-Dijkstra方 法优化传统Dijkstra算法结构能够明显降低算法复杂度,在有限时间内得到正确 的结果。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利 用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运 用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (6)

1.一种基于流数据的离散路径规划方法,其特征在于:所述路径规划方法包括以下内容:
输入起点及终点位置,以确定起点到终点之间的节点结构;
根据起点位置和终点位置定义路径网络拓扑结构中的节点结构,得到起点到终点之间的所有节点结构;
初始化节点结构,输出起点到终点之间所有的路径网络拓扑结构信息;所述路径网络拓扑结构信息包括记录最短路径信息、记录路径网络拓扑结构中所有未被访问的节点和记录路径网络拓扑结构中已访问的节点;
计算起点到终点之间所有的路径网络拓扑结构信息得到最短距离规划路径;
所述网络拓扑结构信息通过改进后的十字链表存储路径结构进行存储,降低简化了时间复杂度和空间关系;
在进行输入起点及终点位置步骤之前还需要完成路径网络拓扑结构的构建,其包括的步骤如下:
根据某一区域的高速公路网络拓扑中所有有效节点进行定义及获取;
定义节点的连通性,获取网络中的所有路径;
定义不同节点间的连通性,计算所有节点间的连通强度;
完成该区域网络拓扑结构的构建;
在进行路径规划之前还需要对不同的道路交通状态的路径权值进行分类计算;路径权值计算步骤如下:
选取旅行时间作为主要判别参数并将其余参数转换为旅行速度;
根据其余参数对旅行时间进行定义;
根据不同的道路交通状态对旅行时间进行定义及路径权值的计算。
2.根据权利要求1所述的一种基于流数据的离散路径规划方法,其特征在于:所述道路交通状态的判别方法如下:
数据预处理,对采集的交通流数据进行数据预处理;
特征选择,选择相关特征子集通过去除不相关及冗余特征降低数据维度;
多特征聚类,通过对多维特征分析对交通流数据进行划分;
实时分类,对交通流数据进行分类进行实时交通状态的判别。
3.根据权利要求2所述的一种基于流数据的离散路径规划方法,其特征在于:所述数据预处理的步骤如下:
判断数据值域的波动范围是否在合理范围内;
如果数据值域超出合理范围,则说明数据出现明显错误,并对错误数据进行处理;
如果数据值域在合理范围内波动,则说明数据正常;
对数据进行数据标准化处理;包括遍历所有交通流数据的特征向量,获取最大值;遍历所有交通流数据的特征向量,获取最小值;对特征向量进行归一化处理。
4.根据权利要求2所述的一种基于流数据的离散路径规划方法,其特征在于:所述特征选择,选择相关特征子集通过去除不相关及冗余特征降低数据维度的具体步骤如下:计算训练集中不同特征向量和已知类别的相关性;根据不同的相关性确定不同特征的不同权值;删除权值小于阈值的特征。
5.根据权利要求2所述的一种基于流数据的离散路径规划方法,其特征在于:所述多特征聚类,通过对多维特征分析对交通流数据进行划分的具体步骤如下:
第一步:初始令S = 1,对初始的m个数据使用K-Means聚类算法计算得到k个S级质心;第二步:重复执行第一步骤,直至得到m个S级质心;
第三步:对m个S级质心使用K-Means聚类算法计算得到k个S +1级质心;
第四步:重复执行第三步,直至得到m个S +1级质心,S = S +1;
第五步:重复执行上述步骤,即每当得到m个S级质心时,就使用K-Means算法进行聚类得到k个S +1级质心;直至最终得到最终的k个质心。
6.根据权利要求2所述的一种基于流数据的离散路径规划方法,其特征在于:所述实时分类,对交通流数据进行分类进行实时交通状态的判别包括以下步骤:
第一步:随机在样本集中进行有放回的样本选择过程,共选取m个随机样本;
第二步:对于经过特征选择的特征集而言,随机在特征集中选择n个特征,建立CART决策树模型;
第三步:重复第一步和第二步k次,生成k棵CART决策树,每棵决策树拥有独立的决策准则;
第四步:将交通流数据输入到每棵树决策,最后确定特征所属类别。
CN201910650798.7A 2019-07-18 2019-07-18 一种基于流数据的离散路径规划方法 Active CN110516702B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910650798.7A CN110516702B (zh) 2019-07-18 2019-07-18 一种基于流数据的离散路径规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910650798.7A CN110516702B (zh) 2019-07-18 2019-07-18 一种基于流数据的离散路径规划方法

Publications (2)

Publication Number Publication Date
CN110516702A CN110516702A (zh) 2019-11-29
CN110516702B true CN110516702B (zh) 2022-07-05

Family

ID=68622659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910650798.7A Active CN110516702B (zh) 2019-07-18 2019-07-18 一种基于流数据的离散路径规划方法

Country Status (1)

Country Link
CN (1) CN110516702B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110968659B (zh) * 2019-12-05 2023-07-25 湖北工业大学 一种基于连续道路链的高层导航路网的去冗方法
CN111610417B (zh) * 2020-05-28 2022-03-15 华乘电气科技股份有限公司 一种基于社区发现的放电信号源分离方法
CN111832986A (zh) * 2020-06-05 2020-10-27 广东工业大学 一种产品入库存储方法、系统、存储介质及计算机设备
CN113177186A (zh) * 2020-09-29 2021-07-27 北京速通科技有限公司 一种用于高速公路最短路径计算的矩阵压缩算法
CN113808424B (zh) * 2021-09-28 2022-07-05 合肥工业大学 基于双向Dijkstra的城市路网K条最短路径的获取方法
CN114399124B (zh) * 2022-03-24 2022-06-17 腾讯科技(深圳)有限公司 路径数据处理、路径规划方法、装置和计算机设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107588779B (zh) * 2016-07-06 2021-03-05 中国第一汽车股份有限公司 一种基于任意两节点间行程时间的车辆智能导航方法
CN107516144A (zh) * 2017-07-26 2017-12-26 交控科技股份有限公司 一种交路自动生成方法及装置
JP6808590B2 (ja) * 2017-08-08 2021-01-06 株式会社東芝 情報処理装置、情報処理方法、プログラムおよび移動体
CN108492557A (zh) * 2018-03-23 2018-09-04 四川高路交通信息工程有限公司 基于多模型融合的高速公路拥堵等级判断方法
CN109284855B (zh) * 2018-07-25 2021-10-29 同济大学 基于城市场景中车联网时空数据分析的车辆节点之间连通强度的预测度量模型

Also Published As

Publication number Publication date
CN110516702A (zh) 2019-11-29

Similar Documents

Publication Publication Date Title
CN110516702B (zh) 一种基于流数据的离散路径规划方法
CN109191896B (zh) 个性化停车位推荐方法和系统
Guo et al. Learning to route with sparse trajectory sets
US9536146B2 (en) Determine spatiotemporal causal interactions in data
Jeung et al. Path prediction and predictive range querying in road network databases
CN110836675B (zh) 一种基于决策树的自动驾驶搜索决策方法
Merchán et al. An empirical validation and data‐driven extension of continuum approximation approaches for urban route distances
Kriegel et al. Statistical density prediction in traffic networks
CN115409256B (zh) 基于行程时间预测的拥堵区避让的路径推荐方法
CN112797995A (zh) 具有时空特性态势信息的车辆应急导航方法
Reyes et al. GPS trajectory clustering method for decision making on intelligent transportation systems
Garg et al. Mining bus stops from raw GPS data of bus trajectories
Tang et al. Trajectory clustering method based on spatial-temporal properties for mobile social networks
Cai et al. A novel vector-based dynamic path planning method in urban road network
Tanaka et al. Offline map matching using time-expanded graph for low-frequency data
D'Andrea et al. Path clustering based on a novel dissimilarity function for ride-sharing recommenders
CN108280548A (zh) 基于网络传输的智能处理方法
CN116542709A (zh) 一种基于交通态势感知的电动汽车充电站规划分析方法
CN115060278A (zh) 基于多目标遗传算法的车辆智能换电导航方法和系统
CN114692015A (zh) 一种基于密度聚类的乘车点推荐方法
CN116194935A (zh) 用于确定地理区域中的车辆的导航简档的方法和设备
Prathilothamai et al. Traffic prediction system using IoT cluster based evolutionary under sampling approach
Prezioso et al. Machine Learning Insights for Behavioral Data Analysis Supporting the Autonomous Vehicles Scenario
Cingel et al. Modal split analysis by best-worst method and multinominal logit model
Wang et al. STME: An effective method for discovering spatiotemporal multi‐type clusters containing events with different densities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant