CN114852135B - 基于大数据的类轨道交通行驶预测方法 - Google Patents
基于大数据的类轨道交通行驶预测方法 Download PDFInfo
- Publication number
- CN114852135B CN114852135B CN202210797720.XA CN202210797720A CN114852135B CN 114852135 B CN114852135 B CN 114852135B CN 202210797720 A CN202210797720 A CN 202210797720A CN 114852135 B CN114852135 B CN 114852135B
- Authority
- CN
- China
- Prior art keywords
- data
- gps
- speed
- per hour
- congestion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000003066 decision tree Methods 0.000 claims abstract description 19
- 238000012360 testing method Methods 0.000 claims abstract description 11
- 238000007405 data analysis Methods 0.000 claims abstract description 8
- 238000006243 chemical reaction Methods 0.000 claims abstract description 6
- 208000027744 congestion Diseases 0.000 claims description 72
- 208000024891 symptom Diseases 0.000 claims description 44
- 238000012549 training Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000003672 processing method Methods 0.000 abstract description 2
- 238000004458 analytical method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L25/00—Recording or indicating positions or identities of vehicles or trains or setting of track apparatus
- B61L25/02—Indicating or recording positions or identities of vehicles or trains
- B61L25/021—Measuring and recording of train speed
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L25/00—Recording or indicating positions or identities of vehicles or trains or setting of track apparatus
- B61L25/02—Indicating or recording positions or identities of vehicles or trains
- B61L25/023—Determination of driving direction of vehicle or train
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L25/00—Recording or indicating positions or identities of vehicles or trains or setting of track apparatus
- B61L25/02—Indicating or recording positions or identities of vehicles or trains
- B61L25/025—Absolute localisation, e.g. providing geodetic coordinates
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L25/00—Recording or indicating positions or identities of vehicles or trains or setting of track apparatus
- B61L25/02—Indicating or recording positions or identities of vehicles or trains
- B61L25/04—Indicating or recording train identities
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L27/00—Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
- B61L27/10—Operations, e.g. scheduling or time tables
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L27/00—Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
- B61L27/40—Handling position reports or trackside vehicle data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Landscapes
- Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Train Traffic Observation, Control, And Security (AREA)
Abstract
基于大数据的类轨道交通行驶预测方法,属于数据处理方法技术领域,包括以下步骤:步骤S1,提取类轨道交通的GPS轨迹原始资料,并针对GPS轨迹原始资料进行前处理和资料转换,将GPS轨迹原始资料中的每笔GPS资料转换成以下4个字段:行驶区间、连续区间速差、拥堵征兆布尔型、瞬间速度;步骤S2,运用C5.0决策树,对转换后的每笔GPS资料中的4个字段进行资料分析,获得7个叶节点,并产生7个决策规则,建置类轨道交通预拥堵前十分钟的行驶模型:S3,利用测试资料验证行驶模型的准确度。本方案,发现连续区间速差低于一定程度,在配合其他条件下就会有高机率在未来十分钟内发生拥堵,可以对类轨道交通提供相应的规则或意见。
Description
技术领域
本发明属于数据处理方法技术领域,特别涉及基于大数据的类轨道交通行驶预测方法。
背景技术
随着科技的发展,以地理位置数据为核心数据的相关服务也愈来愈多,比如地图服务,导航服务,数据分析服务,甚至基于数据分析服务为用户带来的其它高附加值的个性化定制服务。地理位置数据在应用服务中的作用以及重要性不言而喻,而如何妥善的获取地理位置数据,存储,以及应用都需要进行相关研究。
现有的地理位置数据的应用,多集中于客流预测。例如,CN108694463A的中国专利,公开了一种城市轨道交通站点进出站客流预测方法,得到新开轨道交通站点的工作日平均进出站客流量预测值,从而分析站点周边建成环境对进出站客流的影响,进而以此为依据,预测新开站点客流量。
我们希望,地理位置数据的应用,不仅仅局限于城市的地铁、轻轨和有轨电车等传统的轨道交通,也包括具有固定行驶路径的公交接驳等类轨道交通。此时,不仅需要考虑人流量,还需要考虑类轨道交通中的车辆行驶状态,从而指导轨道交通设计者定量化调整接驳设施供应或者优化交通出行网络。目前,尚缺少对于类轨道交通的行驶状态预测的研究。
发明内容
鉴于上述现有技术的不足之处,本发明的目的在于提供基于大数据的类轨道交通行驶预测方法。
为了达到上述目的,本发明采取了以下的技术方案。
基于大数据的类轨道交通行驶预测方法,包括以下步骤:
步骤S1,提取类轨道交通的GPS轨迹原始资料,并针对GPS轨迹原始资料进行前处理和资料转换,将GPS轨迹原始资料中的每笔GPS资料转换成以下4个字段:行驶区间、连续区间速差、拥堵征兆布尔型、瞬间速度;
步骤S2,运用C5.0决策树,对转换后的每笔GPS资料中的4个字段进行资料分析,获得7个叶节点,并产生7个决策规则,建置类轨道交通预拥堵前十分钟的行驶模型;7个决策规则,包括:
决策规则1:当瞬间速度小于或等于时速42公里且行驶区间小于或等于0.3355公里,10分钟内将面临拥堵;
决策规则3:当瞬间速度大于时速42公里小于或等于时速85公里,且连续区间速差小于或等于-12公里/小时,10分钟内将面临拥堵;
决策规则5:当瞬间速度大于时速42公里小于或等于时速54公里,且连续区间速差大于时速-12公里而行驶区间小于或等于0.3652公里,10分钟内将面临拥堵;
S3,利用测试资料验证行驶模型的准确度。
进一步,步骤S1中,GPS轨迹原始资料,包括记录车次GPS轨迹的GPS资料,同一车次GPS资料的记录时间间隔为30秒,每个车次的行驶时间为24小时,且车次的开始位置与结束位置相同;每笔GPS资料包含七个字段,分别为:车次编号、记录时间、GPS纬度、GPS经度、瞬间速度、方向角度、GPS状态;
对GPS轨迹原始资料,进行资料整合:将GPS轨迹原始资料,汇入Microsoft SQLServer数据库,合并不同来源的GPS轨迹原始资料;
对GPS轨迹原始资料,进行资料清理,删除不合理的GPS资料:不合理的GPS资料中,GPS纬度和GPS经度确定的坐标点,不在考察的轨道或行驶路线覆盖范围内,或者连续区间速差的绝对值高于时速60公里以上。
进一步,步骤S1中,所述行驶区间,以平面的直线距离当作相对距离计算两点坐标点的行驶区间,并采用正弦函数公式计算两个经纬度坐标点之间的距离;
两个经纬度坐标点A和B之间的距离的正弦函数公式:
其中:D是两个经纬度坐标点A和B之间的距离,单位为公里;R是地球半径6378.137公里;φ1是坐标点A的纬度转换成角度,纬度乘上π除180;φ2是坐标点B的纬度转换成角度,纬度乘上π除180;λ1是坐标点A的经度转换成角度,经度乘上π除180;λ2是坐标点B的经度转换成角度,经度乘上π除180。
进一步,步骤S1中,所述连续区间速差,计算过程如下:
计算由两个经纬度坐标点A和B确定的路段AB的平均速度为;其中是坐标A的平均速度,表示路段AB的平均速度,单位公里/小时;是路段AB的距离,单位为公里;是到达坐标点B的时间,单位为秒;是到达坐标点A的时间,单位为秒;
进一步,步骤S1中,对于字段:拥堵征兆布尔型,先对GPS轨迹原始资料,进行拥堵征兆的判断:当同一车次连续三笔GPS资料平均速度均小于40公里时,称为此三个GPS资料所形成的行车区间为拥堵路段,拥堵征兆布尔型,只有两个值:假和真,且假的序号为0,真的序号是1;当一个车次的GPS资料显示为拥堵路段时,将本车次拥堵路段以及拥堵路段前10分钟的所有的GPS资料的拥堵征兆布尔型字段设为真,其余为假。
进一步,步骤S2中,选择80%的此路段GPS资料做为训练资料集,20%GPS资料做为测试资料集。
进一步,步骤2中,运用C5.0决策树进行资料分析所获得的7个叶节点,分别如下:
叶节点1:GPS资料落在瞬间速度小于或等于时速42公里且行驶区间小于或等于0.3355公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为97.2%;
叶节点2:GPS资料落在瞬间速度小于或等于时速42公里且行驶区间大于0.3355公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为44.3%;
叶节点3:GPS资料落在瞬间速度大于时速42公里小于或等于时速85公里,且连续区间速差小于或等于时速-12公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为75%;
叶节点4:GPS资料落在瞬间速度大于时速85公里且连续区间速差小于或等于时速-12公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为29.6%;
叶节点5:GPS资料落在瞬间速度大于时速42公里小于或等于时速54公里,且连续区间速差大于时速-12公里而行驶区间小于或等于0.3652公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为72.7%;
叶节点6:GPS资料落在瞬间速度大于时速42公里小于或等于时速54公里,且连续区间速差大于时速-12公里且行驶区间大于0.3652公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为23.6%;
叶节点7:GPS资料落在瞬间速度大于时速 54公里且连续区间速差大于时速-12公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为19.9%。
进一步,步骤2中,7个决策规则,还包括:
决策规则2:当瞬间速度小于或等于时速42公里且行驶区间大于0.3355公里,10分钟内将不会面临拥堵;
决策规则4:当瞬间速度大于时速85公里且连续区间速差小于或等于时速-12公里,10分钟内将不会面临拥堵;
决策规则6:当瞬间速度大于时速42公里小于或等于时速54公里,且连续区间速差大于时速-12公里且行驶区间大于0.3652公里,10分钟内将不会面临拥堵;
决策规则7:当瞬间速度大于时速 54公里且连续区间速差大于时速-12公里,10分钟内将不会面临拥堵。
进一步,步骤S3中,在预测时放入测试资料字段的瞬间速度、行驶区间、连续区间速差,让行驶模型预测该笔GPS资料的拥堵征兆布尔型会是真或假,然后用判断矩阵比对预测后的拥堵征兆布尔型与原始的拥堵征兆布尔型,得到成功判别率。
本方案,发现连续区间速差低于一定程度,在配合其他条件下就会有高机率在未来十分钟内发生拥堵,可以对类轨道交通提供相应的规则或意见。
传统的GPS轨迹原始资料,总数量非常庞大,难以有效利用。本方案,在大数据中,抓取其中的有效信息,利用其中的连续区间速差字段并延伸其它字段的属性,来做决策树分析,为行驶状态提供可靠的预测。
附图说明
图1是本发明的流程示意图;
图2是本发明的决策树分析示意图。
具体实施方式
下面结合附图,对本发明作进一步详细说明。
图1是本发明的流程示意图;如图1所示,基于大数据的类轨道交通行驶预测方法,包括以下步骤:
步骤S1,提取类轨道交通的GPS轨迹原始资料,并针对GPS轨迹原始资料进行前处理。
GPS轨迹原始资料,包括记录车次GPS轨迹的GPS资料,同一车次GPS资料的记录时间间隔为30秒,每个车次的行驶时间为24小时,且车次的开始位置与结束位置相同。
每笔GPS资料包含七个字段,分别为:
1,车次编号:为类轨道交通车辆的编号;
2,记录时间:为GPS记录的时间;
3,GPS纬度:采用度DDD为坐标单位;
4,GPS经度:采用度DDD为坐标单位;
5,瞬间速度;
6,方向角度:以北方为0计算行驶方向;
7,GPS状态:A表示正常、V表示资料异常。
对GPS轨迹原始资料,进行资料整合。将GPS轨迹原始资料,汇入Microsoft SQLServer数据库,合并来源不同的GPS轨迹原始资料。
对GPS轨迹原始资料,进行资料清理。删除不合理的资料,例如,GPS纬度和GPS经度确定的坐标点,不在考察的轨道或行驶路线覆盖范围内。删除连续区间速差的绝对值高于时速60公里以上资料,该资料表示轨道或行驶路线急停状况。
对GPS轨迹原始资料,进行资料转换,将每笔GPS资料转换成以下4个字段:
1,行驶区间:以平面的直线距离当作相对距离计算两点坐标点的行驶区间,并采用正弦函数公式计算两点经纬度坐标。采用本方案,即使距离较小都能保持足够的有效数字。
两个经纬度坐标点A和B之间的距离的正弦函数公式:
其中:D是两个经纬度坐标点A和B之间的距离,单位为公里;R是地球半径6378.137公里;φ1是坐标点A的纬度转换成角度,纬度乘上π除180;φ2是坐标点B的纬度转换成角度,纬度乘上π除180;λ1是坐标点A的经度转换成角度,经度乘上π除180;λ2是坐标点B的经度转换成角度,经度乘上π除180。
2,连续区间速差:先取得平均速度,利用每个坐标点与下一个坐标点的区间除上时间差,因时间差的单位是秒数,需做单位上的转换,所以区间与时间差的相除时要乘上3600以做转换,单位转换后平均速度的单位为公里/小时。
由两个经纬度坐标点A和B确定的路段AB的平均速度为;其中是坐标A的平均速度,表示路段AB的平均速度,单位公里/小时;是路段AB的距离,单位为公里;是到达坐标点B的时间,单位为秒;是到达坐标点A的时间,单位为秒。
3,拥堵征兆布尔型。
对GPS轨迹原始资料,进行拥堵征兆的判断。当同一车次连续三笔GPS资料平均速度均小于40公里时,称为此三个GPS资料所形成的行车区间为拥堵路段;拥堵征兆布尔型,只有两个值:假(false)和真(true),且假的序号为0,真的序号是1。当一个车次的GPS资料显示为拥堵路段时,将本车次拥堵路段以及拥堵路段前10分钟的所有的GPS资料的拥堵征兆布尔型字段设为真,其余为假。
4,瞬间速度。采用GPS轨迹原始资料中的瞬间速度。
步骤S2,运用决策树,进行资料分析和产生规则,建置类轨道交通预拥堵前十分钟的行驶模型。
决策树学习算法是对分类问题进行深入分析的一种方法,最早由Hunt等人在1966年提出,其中C5.0算法是Quinlan从最初的ID3算法、C4.5算法中发展起来的最新的决策树算法,根据提供最大信息增益的字段分割样本数据,并对决策树各叶子进行裁剪或合并来提高分类精度,最后确定各叶子的最佳阈值。通常不需花费大量的训练时间即可建立决策树,且生成的决策树容易进行解译。
使用C5.0进行决策树分析,选择80%的此路段GPS资料做为训练资料集,20%GPS资料做为测试资料集。
国内城市的轨道交通速度是一种是设计时速(也就是最快行驶速度),该速度通常在60至120km/h。
表1为进行决策树分析的字段示意图。
训练资料集中的训练资料共14,891笔,其中拥堵征兆布尔型为假有9337笔,真有5554笔,比例为(0.6270230,0.3729770)。由于C5.0决策树有些叶节点的样本数过低,导致该叶节点规则不易参考,因此规定叶节点的样本数不能小于100笔,得到更加简洁且更高正确率的分析结果。
C5.0决策树规则数据,如下:
speed<=42:
:…distance<=0.3355:true(2670/75)
:distance>0.3355:false(264/117)speed>42:
:…change<=-12:
:…speed<=85:true(600/150)
:speed>85:false(125/37)
change>-12:
:…speed>54:false(10801/2156)
speed<=54:
:distance<=0.3652:true(198/54)
distance>0.3652: false (233/55)。
图2是本发明的决策树分析示意图,如图2所示,通过C5.0决策树分析,获得7个叶节点,分别如下:
叶节点1:有2670笔GPS资料落在瞬间速度小于或等于时速42公里且行驶区间小于或等于0.3355公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为97.2%。
叶节点2:有264笔GPS资料落在瞬间速度小于或等于时速42公里且行驶区间大于0.3355公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为44.3%。
叶节点3:有600笔GPS资料落在瞬间速度大于时速42公里小于或等于时速85公里,且连续区间速差小于或等于时速-12公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为75%。
叶节点4:有125笔GPS资料落在瞬间速度大于时速85公里且连续区间速差小于或等于时速-12公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为29.6%。
叶节点5:有198笔GPS资料落在瞬间速度大于时速42公里小于或等于时速54公里,且连续区间速差大于时速-12公里而行驶区间小于或等于0.3652公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为72.7%。
叶节点6:有233笔GPS资料落在瞬间速度大于时速42公里小于或等于时速54公里,且连续区间速差大于时速-12公里且行驶区间大于0.3652公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为23.6%。
叶节点7:有10801笔GPS资料落在瞬间速度大于时速 54公里且连续区间速差大于时速-12公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为19.9%。
上述7个叶节点,产生以下决策规则:
决策规则1:当瞬间速度小于或等于时速42公里且行驶区间小于或等于0.3355公里,10分钟内将面临拥堵。
决策规则2:当瞬间速度小于或等于时速42公里且行驶区间大于0.3355公里,10分钟内将不会面临拥堵。
决策规则3:当瞬间速度大于时速42公里小于或等于时速85公里,且连续区间速差小于或等于-12公里/小时,10分钟内将面临拥堵。
决策规则4:当瞬间速度大于时速85公里且连续区间速差小于或等于时速-12公里,10分钟内将不会面临拥堵。
决策规则5:有198笔GPS资料落在瞬间速度大于时速42公里小于或等于时速54公里,且连续区间速差大于时速-12公里而行驶区间小于或等于0.3652公里,10分钟内将面临拥堵。
决策规则6:有233笔GPS资料落在瞬间速度大于时速42公里小于或等于时速54公里,且连续区间速差大于时速-12公里且行驶区间大于0.3652公里,10分钟内将不会面临拥堵。
决策规则7:有10801笔GPS资料落在瞬间速度大于时速 54公里且连续区间速差大于时速-12公里,10分钟内将不会面临拥堵。
步骤S3,利用测试资料验证行驶模型的准确度。
利用测试资料验证此7个决策规则,该测试资料共3723笔,其中拥堵征兆布尔型为假有2355笔,真为1368笔,比例为(0.6325543,0.3674456)。在预测时放入测试资料字段的瞬间速度、行驶区间、连续区间速差,让行驶模型预测该笔GPS资料的拥堵征兆布尔型会是真或假,然后用判断矩阵比对预测后的拥堵征兆布尔型与原始的拥堵征兆布尔型,比对后两个拥堵征兆布尔型都为假有2278笔,都为真有761笔,成功判别率为81.6%,即(2278+761)*100%/3723=81.6%。
表2是判断矩阵表格。
步骤S4,对符合决策规则1、决策规则3、或决策规则5的行驶条件的车辆,预测其10分钟内将面临拥堵。此时,针对不同的类型的车辆,可以采用不同的处理方式,例如,对于公交,对于非站点的路线可以建议调换行驶路线以避开拥堵路段;对于经常拥堵的班次,优化其交通出行路线。
本方案中,从 C5.0决策树筛选出会面临拥堵的规则,发现七条规则里有三条规则会面临拥堵,并抓取这三条的规则做探讨,规则如下:
决策规则1:在当下瞬间速度只要低于时速42公里且行驶区间又小于0.3355公里就会面临拥堵,行驶区间的长短会影响平均行驶速度的高低,例如行驶区间约为0.350公里而每笔GPS资料间隔时间为30秒,则平均时速为42公里。
决策规则3:在当下瞬间速度介于小于时速85公里且连续区间速差小于时速-12公里,这是类轨道交通车辆越开越慢的情况,若现在路段平均速度为时速85公里,每次的连续区间速差的为时速-12公里,只要约2分钟就会面临拥堵。
决策规则5:在当下瞬间速度小于或等于时速54公里虽然连续区间速差大于时速-12 公里但是行驶区间小于0.3652公里。连续区间速差不为正的情况下,路段平均速度为时速54公里,连续区间速差维持在小于时速3.5公里就会在2分钟内会面临拥堵。
这三条规则分别代表了正在拥堵中,行驶区间不长且行驶平均速度也无法上升,无法脱离拥堵状态;瞬间速度开始低于轨道交通的限速标准并且每30秒行驶速度就有明显的下滑情况就会拥堵;即将面临拥堵,当行驶区间)无法拉长且连续区间速差没有明显的上升。
可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及其发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。
Claims (8)
1.基于大数据的类轨道交通行驶预测方法,其特征在于,包括以下步骤:
步骤S1,提取类轨道交通的GPS轨迹原始资料,并针对GPS轨迹原始资料进行前处理和资料转换,将GPS轨迹原始资料中的每笔GPS资料转换成以下4个字段:行驶区间、连续区间速差、拥堵征兆布尔型、瞬间速度;
步骤S2,运用C5.0决策树,对转换后的每笔GPS资料中的4个字段进行资料分析,获得7个叶节点,并产生7个决策规则,建置类轨道交通预拥堵前十分钟的行驶模型;7个决策规则,包括:
决策规则1:当瞬间速度小于或等于时速42公里且行驶区间小于或等于0.3355公里,10分钟内将面临拥堵;
决策规则2:当瞬间速度小于或等于时速42公里且行驶区间大于0.3355公里,10分钟内将不会面临拥堵;
决策规则3:当瞬间速度大于时速42公里小于或等于时速85公里,且连续区间速差小于或等于-12公里/小时,10分钟内将面临拥堵;
决策规则4:当瞬间速度大于时速85公里且连续区间速差小于或等于时速-12公里,10分钟内将不会面临拥堵;
决策规则5:当瞬间速度大于时速42公里小于或等于时速54公里,且连续区间速差大于时速-12公里而行驶区间小于或等于0.3652公里,10分钟内将面临拥堵;
决策规则6:当瞬间速度大于时速42公里小于或等于时速54公里,且连续区间速差大于时速-12公里且行驶区间大于0.3652公里,10分钟内将不会面临拥堵;
决策规则7:当瞬间速度大于时速 54公里且连续区间速差大于时速-12公里,10分钟内将不会面临拥堵;
S3,利用测试资料验证行驶模型的准确度。
2.根据权利要求1所述的基于大数据的类轨道交通行驶预测方法,其特征在于,步骤S1中,GPS轨迹原始资料,包括记录车次GPS轨迹的GPS资料,同一车次GPS资料的记录时间间隔为30秒,每个车次的行驶时间为24小时,且车次的开始位置与结束位置相同;每笔GPS资料包含七个字段,分别为:车次编号、记录时间、GPS纬度、GPS经度、瞬间速度、方向角度、GPS状态;
对GPS轨迹原始资料,进行资料整合:将GPS轨迹原始资料,汇入Microsoft SQL Server数据库,合并不同来源的GPS轨迹原始资料;
对GPS轨迹原始资料,进行资料清理,删除不合理的GPS资料:不合理的GPS资料中,GPS纬度和GPS经度确定的坐标点,不在考察的轨道或行驶路线覆盖范围内,或者连续区间速差的绝对值高于时速60公里以上。
5.根据权利要求4所述的基于大数据的类轨道交通行驶预测方法,其特征在于,步骤S1中,对于字段:拥堵征兆布尔型,先对GPS轨迹原始资料,进行拥堵征兆的判断:当同一车次连续三笔GPS资料平均速度均小于40公里时,称为此三个GPS资料所形成的行车区间为拥堵路段,拥堵征兆布尔型,只有两个值:假和真,且假的序号为0,真的序号是1;当一个车次的GPS资料显示为拥堵路段时,将本车次拥堵路段以及拥堵路段前10分钟的所有的GPS资料的拥堵征兆布尔型字段设为真,其余为假。
6.根据权利要求5所述的基于大数据的类轨道交通行驶预测方法,其特征在于,步骤S2中,选择80%的此路段GPS资料做为训练资料集,20%GPS资料做为测试资料集。
7.根据权利要求6所述的基于大数据的类轨道交通行驶预测方法,其特征在于,步骤2中,运用C5.0决策树进行资料分析所获得的7个叶节点,分别如下:
叶节点1:GPS资料落在瞬间速度小于或等于时速42公里且行驶区间小于或等于0.3355公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为97.2%;
叶节点2:GPS资料落在瞬间速度小于或等于时速42公里且行驶区间大于0.3355公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为44.3%;
叶节点3:GPS资料落在瞬间速度大于时速42公里小于或等于时速85公里,且连续区间速差小于或等于时速-12公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为75%;
叶节点4:GPS资料落在瞬间速度大于时速85公里且连续区间速差小于或等于时速-12公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为29.6%;
叶节点5:GPS资料落在瞬间速度大于时速42公里小于或等于时速54公里,且连续区间速差大于时速-12公里而行驶区间小于或等于0.3652公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为72.7%;
叶节点6:GPS资料落在瞬间速度大于时速42公里小于或等于时速54公里,且连续区间速差大于时速-12公里且行驶区间大于0.3652公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为23.6%;
叶节点7:GPS资料落在瞬间速度大于时速 54公里且连续区间速差大于时速-12公里的叶节点上,在这叶节点上拥堵征兆布尔型为真的机率为19.9%。
8.根据权利要求7所述的基于大数据的类轨道交通行驶预测方法,其特征在于,步骤S3中,在预测时放入测试资料字段的瞬间速度、行驶区间、连续区间速差,让行驶模型预测该笔GPS资料的拥堵征兆布尔型会是真或假,然后用判断矩阵比对预测后的拥堵征兆布尔型与原始的拥堵征兆布尔型,得到成功判别率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210797720.XA CN114852135B (zh) | 2022-07-08 | 2022-07-08 | 基于大数据的类轨道交通行驶预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210797720.XA CN114852135B (zh) | 2022-07-08 | 2022-07-08 | 基于大数据的类轨道交通行驶预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114852135A CN114852135A (zh) | 2022-08-05 |
CN114852135B true CN114852135B (zh) | 2022-10-04 |
Family
ID=82626345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210797720.XA Active CN114852135B (zh) | 2022-07-08 | 2022-07-08 | 基于大数据的类轨道交通行驶预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114852135B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180086602A (ko) * | 2017-01-23 | 2018-08-01 | 충남대학교산학협력단 | 기계학습을 이용한 교통 정체 구간 추정 장치 및 방법 |
CN108694463A (zh) * | 2018-04-25 | 2018-10-23 | 东南大学 | 一种城市轨道交通站点进出站客流预测方法 |
CN109658695A (zh) * | 2019-01-02 | 2019-04-19 | 华南理工大学 | 一种多因素的短时交通流预测方法 |
CN109754606A (zh) * | 2019-02-28 | 2019-05-14 | 山东浪潮云信息技术有限公司 | 一种基于出租车定位预测道路拥堵情况的方法 |
CN110176139A (zh) * | 2019-02-21 | 2019-08-27 | 淮阴工学院 | 一种基于dbscan+的道路拥堵识别可视化方法 |
JP2020101908A (ja) * | 2018-12-20 | 2020-07-02 | 株式会社東芝 | 交通状況予測装置、および交通状況予測方法 |
CN111785031A (zh) * | 2020-09-07 | 2020-10-16 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种基于速度时空图的交通拥堵成因智能识别算法 |
CN112598199A (zh) * | 2021-01-29 | 2021-04-02 | 杭州易龙安全科技有限公司 | 一种基于决策树算法的监测预警方法 |
CN112950934A (zh) * | 2021-01-26 | 2021-06-11 | 西安电子科技大学 | 一种道路拥堵原因识别方法 |
CN113345225A (zh) * | 2021-05-24 | 2021-09-03 | 郑州航空工业管理学院 | 基于v2v通信的物流车辆前方道路实时路况的预测方法及系统 |
CN113378458A (zh) * | 2021-05-26 | 2021-09-10 | 广州华南路桥实业有限公司 | 一种基于大数据的拥堵预警方法、装置、介质及设备 |
CN113988488A (zh) * | 2021-12-27 | 2022-01-28 | 上海一嗨成山汽车租赁南京有限公司 | 一种多因子预测车辆通过etc概率的方法 |
CN114078327A (zh) * | 2020-08-20 | 2022-02-22 | 浙江宇视科技有限公司 | 道路拥堵状态检测方法、装置、设备和存储介质 |
CN114626684A (zh) * | 2022-02-18 | 2022-06-14 | 西安石油大学 | 一种大数据驱动的高速公路交通事件持续时间预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8700296B2 (en) * | 2006-03-03 | 2014-04-15 | Inrix, Inc. | Dynamic prediction of road traffic conditions |
-
2022
- 2022-07-08 CN CN202210797720.XA patent/CN114852135B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180086602A (ko) * | 2017-01-23 | 2018-08-01 | 충남대학교산학협력단 | 기계학습을 이용한 교통 정체 구간 추정 장치 및 방법 |
CN108694463A (zh) * | 2018-04-25 | 2018-10-23 | 东南大学 | 一种城市轨道交通站点进出站客流预测方法 |
JP2020101908A (ja) * | 2018-12-20 | 2020-07-02 | 株式会社東芝 | 交通状況予測装置、および交通状況予測方法 |
CN109658695A (zh) * | 2019-01-02 | 2019-04-19 | 华南理工大学 | 一种多因素的短时交通流预测方法 |
CN110176139A (zh) * | 2019-02-21 | 2019-08-27 | 淮阴工学院 | 一种基于dbscan+的道路拥堵识别可视化方法 |
CN109754606A (zh) * | 2019-02-28 | 2019-05-14 | 山东浪潮云信息技术有限公司 | 一种基于出租车定位预测道路拥堵情况的方法 |
CN114078327A (zh) * | 2020-08-20 | 2022-02-22 | 浙江宇视科技有限公司 | 道路拥堵状态检测方法、装置、设备和存储介质 |
CN111785031A (zh) * | 2020-09-07 | 2020-10-16 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种基于速度时空图的交通拥堵成因智能识别算法 |
CN112950934A (zh) * | 2021-01-26 | 2021-06-11 | 西安电子科技大学 | 一种道路拥堵原因识别方法 |
CN112598199A (zh) * | 2021-01-29 | 2021-04-02 | 杭州易龙安全科技有限公司 | 一种基于决策树算法的监测预警方法 |
CN113345225A (zh) * | 2021-05-24 | 2021-09-03 | 郑州航空工业管理学院 | 基于v2v通信的物流车辆前方道路实时路况的预测方法及系统 |
CN113378458A (zh) * | 2021-05-26 | 2021-09-10 | 广州华南路桥实业有限公司 | 一种基于大数据的拥堵预警方法、装置、介质及设备 |
CN113988488A (zh) * | 2021-12-27 | 2022-01-28 | 上海一嗨成山汽车租赁南京有限公司 | 一种多因子预测车辆通过etc概率的方法 |
CN114626684A (zh) * | 2022-02-18 | 2022-06-14 | 西安石油大学 | 一种大数据驱动的高速公路交通事件持续时间预测方法 |
Non-Patent Citations (1)
Title |
---|
张振.基于车辆通行大数据的高速公路路况预测的研究与应用.《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》.2021, * |
Also Published As
Publication number | Publication date |
---|---|
CN114852135A (zh) | 2022-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yoon et al. | Surface street traffic estimation | |
CN110555544B (zh) | 一种基于gps导航数据的交通需求估计方法 | |
CN100463009C (zh) | 一种交通信息融合处理方法和系统 | |
CN104121908B (zh) | 一种延时路径规划的方法和系统 | |
CN105825310A (zh) | 基于信息熵的出租车寻客路线推荐方法 | |
CN110836675B (zh) | 一种基于决策树的自动驾驶搜索决策方法 | |
CN111524353B (zh) | 一种交通文本数据用于速度预测及行程规划方法 | |
CN112036757B (zh) | 基于手机信令和浮动车数据的停车换乘停车场的选址方法 | |
CN110738855A (zh) | 一种数据稀疏时间段的道路交通流状况预测方法 | |
CN106023592A (zh) | 一种基于gps数据的交通拥堵检测方法 | |
CN111768619A (zh) | 一种基于卡口数据的快速路车辆od点确定方法 | |
Li et al. | An automatic extraction method of coach operation information from historical trajectory data | |
CN111444286B (zh) | 一种基于轨迹数据的远距离交通节点关联性挖掘方法 | |
CN114852135B (zh) | 基于大数据的类轨道交通行驶预测方法 | |
CN114078322B (zh) | 一种公交运行状态评价方法、装置、设备及存储介质 | |
CN113723761B (zh) | 一种基于运行数据的多维度城市公交运行服务可靠度评价方法 | |
Shan et al. | Interfering spatiotemporal features and causes of bus bunching using empirical GPS trajectory data | |
CN114333323B (zh) | 一种基于压力特征的高速公路行程速度预测方法 | |
Qiang et al. | Measuring variability of arterial road traffic condition using archived probe data | |
CN111931968B (zh) | 一种应用手机gps数据来优化公共自行车站点布局的方法 | |
CN113988422A (zh) | 一种乘客需求预测方法和打车路径规划方法 | |
Huo et al. | Mining massive truck GPS data for freight OD estimation: Case study of liaoning province in China | |
Yan et al. | An Efficient Division Method of Traffic Cell Based on Improved K-means Clustering Algorithm for the Location of Infrastructure in Vehicular Networks | |
CN111369200B (zh) | 一种基于车辆lbs数据的城市物流通道识别方法及系统 | |
Wang et al. | CycleTrajectory: An End-to-End Pipeline for Enriching and Analyzing GPS Trajectories to Understand Cycling Behavior and Environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |