CN110889558A - 路况预测方法及装置 - Google Patents
路况预测方法及装置 Download PDFInfo
- Publication number
- CN110889558A CN110889558A CN201911205475.3A CN201911205475A CN110889558A CN 110889558 A CN110889558 A CN 110889558A CN 201911205475 A CN201911205475 A CN 201911205475A CN 110889558 A CN110889558 A CN 110889558A
- Authority
- CN
- China
- Prior art keywords
- road
- predicted
- road condition
- data
- link
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 48
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 22
- 238000003066 decision tree Methods 0.000 claims abstract description 19
- 238000012360 testing method Methods 0.000 claims description 24
- 238000004891 communication Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 5
- 230000002123 temporal effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 20
- 230000015654 memory Effects 0.000 description 14
- 238000013461 design Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000007667 floating Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- AGVAZMGAQJOSFJ-WZHZPDAFSA-M cobalt(2+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+2].N#[C-].[N-]([C@@H]1[C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@@H](C)OP(O)(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O AGVAZMGAQJOSFJ-WZHZPDAFSA-M 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种路况预测方法及装置,涉及智能交通技术领域,可以实现更加准确的路况预测。该方法包括:获取待预测路链的训练集,训练集包括多个样本数据,样本数据包括特征数据和标签数据,特征数据用于反映待预测路链在第一时间段的特征,标签数据用于反映待预测路链在第二时间段的真实路况值;服务器根据训练集对路况预测模型进行训练,路况预测模型基于梯度提升决策树算法来构建;服务器根据训练完成的路况预测模型,确定待预测路链的预测路况值。本申请适用于城市路况预测的场景下。
Description
技术领域
本申请属于智能交通技术领域,尤其涉及一种交通路况预测方法及装置。
背景技术
随着人均汽车保有量的持续快速增长,城市道路交通拥堵问题也日益严重,路况交通信息的快速准确的处理和预测成为城市规划和市民日常出行的关键问题。
传统交通路况信息预测方法,主要分为两种。第一种是通过交通信息中的车辆位置信息进行收集和预处理,通过非线性理论的方法于并行计算相结合进行预测和更新。第二种方法是将神经网络模型与并行计算结合起来,采用广义神经网络预测模型,通过设计一种并行节点间的通信策略,减少了算法的迭代次数,加快了神经网络模型的收敛速度,从而有效降低了神经网络模型的计算开销。这两种方法都是基于交通模式的路况预测模型,交通模式是指按照时间属性对路况进行聚类,根据时间属性去查找所属的类簇,然后映射出对应的交通模式。
然而,一方面,由于引起路况变化的因素有很多,基于交通模式的路况预测模型对影响因素的考虑不够全面。另一方面,现有技术需要将属于同一类簇的路况属性进行均值化,使数据不能够很好的表现个体差异性,导致最终在进行路况预测时不能很好的反应真实路况,无法缓解城市交通压力。
发明内容
本申请提供一种路况预测方法和装置,用于解决现阶段在进行路况预测时不能很好的反应真实的情况,无法缓解城市交通压力的问题。
为达到上述目的,本申请采用如下技术方案:
第一方面,本申请提供了一种路况预测方法,包括:服务器获取待预测路链的训练集,训练集包括多个样本数据,样本数据包括特征数据和标签数据,特征数据用于反映待预测路链在一个时间段的特征,标签数据用于反映特征数据对应的真实路况值;服务器根据训练集对路况预测模型进行训练,路况预测模型基于梯度提升决策树算法来构建;服务器根据训练好的路况预测模型,确定所述待预测路链的预测路况值。
基于上述技术方案,由于路况预测模型是基于梯度提升决策树来构建的,并且用于训练路况预测模型的训练集包括多个样本数据,因此本申请所提供的路况预测模型是基于大数据技术和机器学习技术的结合来实现的。基于该路况预测模型,服务器可以进行更准确地路况预测,从而给城市管理者(例如交警)提供更有效的路况预测信息,帮助城市管理者对道路进行有效的管理,进而达到缓解城市交通压力的目的。
一种可能的设计中,特征数据包括动态路况属性数据、时间属性数据、空间属性数据、外部因素属性数据、以及拓扑路链属性数据。动态路况属性数据用于反映待预测路链上的车辆行驶情况。时间属性数据用于反映所述待预测路链的特征数据对应的时间属性。空间属性数据包括以下一项或多项:待预测路链的道路等级、道路长度、道路宽度、坡度、弯道曲率、与交通信号灯的关系方位。外部因素属性数据用于反映在待预测路链上发生的事件。拓扑路链属性数据包括M个第一路链的特征数据,M个第一路链是对待预测路链的路况影响最大的M个路链,M为正整数。
一种可能的设计中,路况预测模型包括以下参数:
参数名称 | 参数值 |
树的数量 | 60 |
树的最大深度 | 13 |
每个特征的分裂点的数量 | 2 |
学习速率 | 0.01 |
每次验证的样本比率 | 0.1 |
特征下采样的比率 | 1.0 |
两阶段分裂算法开关 | 关闭 |
低精度压缩,每个浮点数的大小 | 2 |
一种可能的设计中,服务器根据测试集,对训练完成的路况预测模型进行测试;其中,所述测试集包括多个样本数据。
第二方面,本申请提供了一种服务器,该服务器包括:获取模块,用于获取待预测路链的训练集,训练集包括多个样本数据,样本数据包括特征数据和标签数据,特征数据用于反映所述待预测路链在第一时间段的特征,标签数据用于反映待预测路链在第二时间段的真实路况值,第一时间段的结束时间为第二时间段的起始时间。训练模块,用于根据训练集对路况预测模型进行训练,路况预测模型基于梯度提升决策树算法来构建。确定模块,用于根据训练完成的路况预测模型,确定待预测路链的预测路况值。
一种可能的设计中,特征数据包括动态路况属性数据、时间属性数据、空间属性数据、外部因素属性数据、以及拓扑路链属性数据。动态路况属性数据用于反映待预测路链上的车辆行驶情况。时间属性数据用于反映所述待预测路链的特征数据对应的时间属性。空间属性数据包括以下一项或多项:待预测路链的道路等级、道路长度、道路宽度、坡度、弯道曲率、与交通信号灯的关系方位。外部因素属性数据用于反映在待预测路链上发生的事件。拓扑路链属性数据包括M个第一路链的特征数据,M个第一路链是对待预测路链的路况影响最大的M个路链,M为正整数。
一种可能的设计中,路况预测模型包括以下参数:
参数名称 | 参数值 |
树的数量 | 60 |
树的最大深度 | 13 |
每个特征的分裂点的数量 | 2 |
学习速率 | 0.01 |
每次验证的样本比率 | 0.1 |
特征下采样的比率 | 1.0 |
两阶段分裂算法开关 | 关闭 |
低精度压缩,每个浮点数的大小 | 2 |
一种可能的设计中,训练模块还用于根据测试集,对训练完成的路况预测模型进行测试;其中,测试集包括多个样本数据。
第三方面,本申请提供了一种路况预测的装置,该装置包括:处理器和通信接口;通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的路况预测方法。
第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行上述第一方面和第一方面的任一种可能的实现方式中所描述的路况预测方法。
第五方面,本申请提供一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行上述第一方面和第一方面的任一种可能的实现方式中所描述的路况预测方法。
第六方面,本申请提供一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行计算机程序或指令,以实现如第一方面和第一方面的任一种可能的实现方式中所描述的路况预测方法。
附图说明
图1为本申请实施例提供的一种路况预测方法的流程图;
图2为本申请实施例提供的另一种路况预测方法的流程图;
图3为本申请实施例提供的一种服务器的结构示意图;
图4为本申请实施例提供的另一种服务器的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
本文中字符“/”,一般表示前后关联对象是一种“或者”的关系。例如,A/B可以理解为A或者B。
本申请的说明书和权利要求书中的术语“第一”和“第二”是用于区别不同的对象,而不是用于描述对象的特定顺序。例如,第一边缘服务节点和第二边缘服务节点是用于区别不同的边缘服务节点,而不是用于描述边缘服务节点的特征顺序。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括其他没有列出的步骤或模块,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
另外,在本申请实施例中,“示例性的”、或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”、或者“例如”等词旨在以具体方式呈现概念。
为了便于理解本申请的技术方案,下面对一些技术术语进行介绍。
1、路链
路链,是指路网数据中任意相邻两个点之间的道路段。路网是指城市范围内由不同功能、等级、区位的道路,以一定的密度和适当的形式组成的网络体系结构。
2、皮尔逊相关系数
皮尔逊相关系数(pearson correlation coefficient,PCCs),又称皮尔逊积矩相关系数(pearson product-moment correlation coefficient,PPMCC),在统计学中,是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。
总体和样本皮尔逊系数的绝对值小于或等于1。如果样本数据点精确的落在直线上(计算样本皮尔逊系数的情况),或者双变量分布完全在直线上(计算总体皮尔逊系数的情况),则相关系数等于1或-1。皮尔逊系数是对称的:
corr(X,Y)=corr(Y,X)。
皮尔逊相关系数有一个重要的数学特性是,因两个变量的位置和尺度的变化并不会引起该系数的改变,即它该变化的不变量(由符号确定)。也就是说,我们如果把X移动到a+bX和把Y移动到c+dY,其中a、b、c和d是常数,并不会改变两个变量的相关系数(该结论在总体和样本皮尔逊相关系数中都成立)。
两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商:
上式定义了总体相关系数,常用希腊小写字母ρX,Y作为代表符号。估算样本的协方差和标准差,可得到样本相关系数(样本皮尔逊系数),常用英文小写字母r代表:
r亦可由(Xi,Yi)样本点的标准分数均值估计,得到与上式等价的表达式:
如表1所示,相关系数的大小直接反应了当前link与拓扑link的相关程度。
表1相关系数与相关性强弱
3、梯度提升决策树
梯度提升决策树,是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终结果。其中,梯度提升决策树算法构建的模型的不确定程度由损失函数来描述,损失函数越大,模型越错误率越高。如果该模型能够让损失函数持续下降,则说明模型预测的准确率在不停提升,而最好的方式就是让损失函数在其梯度的方向上下降。算法的每一步沿着损失函数下降最快的方向建立新的模型,这样使得算法在每一步均沿着下降最快的方向收敛。直到满足要求,建立满足要求的若干组合加权子模型。
本申请实施例提供的技术方案可以应用于城市路况预测,主要用于城市路况的短期预测,在现有技术中,对于路况的预测一般按照时间属性去定义,例如早晚高峰、节假日等都被定义为道路拥挤时段,然而这种预测方法虽然实现过程简单,但是过于片面,准确率较低。影响路况的因素多种多样,例如天气、道路属性、道路上是否有突发事故等都会对当前路况产生影响。
本申请实施例通过建立路况预测模型实现路况的预测,根据待预测路链的特征融合多方面影响因素进行特征数据的采集和处理,再结合真实路况值形成路况预测模型的训练集,将训练集输入到梯度提升决策树中进行迭代训练与算法调整,最终得到能够应用于实践的路况预测模型。本申请实施例致力于解决目前路况短期预测准确率较低的问题,为城市路网规划、城市交通管理与控制提供依据。
下面对本申请实施例提供的路况预测方法进行具体介绍。其中,该路况预测方法的执行主体可以是任意具体数据处理功能的电子设备,例如服务器等。为了便于说明,下文以服务器作为执行主体进行介绍。
如图1所示,本申请实施例提供一种路况预测方法,包括:
S101、服务器获取待预测路链的训练集。
其中,训练集包括多个样本数据。每个样本数据包括特征数据和标签数据。特征数据用于反映待预测路链在第一时间段的特征。标签数据用于反映待预测路链在第二时间段的真实路况值。第一时间段的结束时间为第二时间段的起始时间。
可以理解的是,不同样本数据的特征数据所对应的第一时间段可以是不同的。例如,样本数据1的特征数据对应的第一时间段为2019年1月6日8:00-8:30;样本数据2的特征数据对应的第一时间段为2019年1月6日9:00-9:30。
需要说明的是,真实路况值可以为速度或拥挤等级,也可以为其他可以表示路况的数值。拥挤等级是指根据路况划分的多个等级,例如,若某条路链断面的平均行车速度较快,则确定该路链的拥挤等级较低,若某条路链断面的平均行车速度较慢,则确定该路链的拥挤等级较高,该拥挤等级可以根据速度进行划分,也可以有其他划分方式,在此不做限定。
下面对待预测路链的特征数据进行具体说明。
待预测路链的特征数据包括:动态路况属性数据、时间属性数据、空间属性数据、外部因素属性数据以及拓扑路链属性数据。
(1)待预测路链的动态路况属性数据用于反映待预测路链上的车辆行驶情况。
需要说明的是,待预测路链的动态路况属性数据可以通过在待预测路链上行驶的每辆车的车辆轨迹信息来确定。
为了保证待预测路链的动态路况属性数据的准确性,服务器在计算待预测路链的动态路况属性数据的过程中,会排除车辆异常值和离群值。
可选的,对于一个路链来说,动态路况属性数据可以包括:单车动态路况属性数据和多车动态路况属性数据。
其中,单车动态路况属性数据用于反映一辆车在一个时间段内在待预测路链上的行驶特征。可选的,单车动态路况属性数据包括:行驶速度、行驶距离、加速度等。
多车动态路况属性数据用于反映多辆车在一个时间段内在待预测路链上的行驶特征。可选的,多车动态路况属性数据包括:多辆车之间的行驶速度的平均值、行驶速度的方差、行驶距离的平均值、行驶距离的方差、加速度的平均值、加速度的方差等。
可以理解的是,多车动态路况属性数据是通过多个单车数据进行数据融合计算得到的。
可选的,在待预测路链的长度大于预设长度的情况下,服务器可以将待预测路链划分为多个子路链。之后,服务器获取多个子路链中每一个子路链的动态路况属性数据。从而,待预测路链的动态路况属性数据包括:多个子路链的动态路况属性数据。
(2)待预测路链的时间属性数据用于反映待预测路链的特征数据对应的时间属性。
这里,时间属性可以是指待预测路链的特征数据对应的星期、月份、季节、节假日等。
示例性的,由于待预测路链的车辆轨迹信息的发布周期设定为1分钟,以1分钟为时间区间,将特征数据的时间匹配到星期、月份、季节和节假日,得到相应的时间属性特征。
(3)待预测路链的空间属性数据用于反映待预测路链在空间上的固有属性。
可选的,空间属性数据包括以下一项或多项:待预测路链的道路等级、道路长度、道路宽度、坡度、弯道曲率、与交通信号灯的关系方位。
可以理解的是,服务器可以从交通部门的数据库查询到待预测路链的道路等级、道路长度、道路宽度、坡度、弯道曲率、与交通信号灯的关系方位。
(4)待预测路链的外部因素属性数据用于反映在待预测路链上发生的事件。
可选的,上述事件包括一项或多项:道路施工、临时改道、天气数据、自然灾害和交通事故等。
示例性的,服务器可以通过中国气象局的服务网站/数据库获取到待预测路链的气象数据。上述气象数据包括:降水量、温度、雨雪天气、雾霾指数等。
示例性的,服务器可以将交警部门录入的事件信息或者广播播放的事件信息进行规范化的整理,获取并存储多个事件信息,该事件信息包括事件发生的位置。进而,服务器可以从多个事件信息中确定发生在待预测路链上的事件。
(5)待预测路链的拓扑路链属性数据用于反映其他路链对待预测路链的路况影响程度。
在本申请实施例中,待预测路链的拓扑路链属性数据包括M个第一路链的特征数据。其中,M个第一路链是对待预测路链的路况影响最大的M个路链。M为正整数。
可以理解的是,城市道路网络由大数量的单一道路相互连接构成。因此,在计算待预测路链的路况信息是仅仅使用待预测路链的一段时间内的特征数据是不够充分的,尤其在深夜和凌晨时分道路车辆较少的情况,很难根据待预测路链的少部分特征数据得到准确的路况信息。因此,为了保证预测的准确性,服务器有必要获取与待预测路链相关的路链的特征数据。
在本申请实施例中,M个第一路链可以通过以下方式确定:服务器确定P个第二路链,第二路链是与所述待预测路链具有拓扑关系的路链;之后,对于P个第二路链中的每一个第二路链,服务器根据第二路链在预设时间区间内的特征数据以及待预测路链在预设时间区间内的特征数据,计算第二路链和待预测路链之间的皮尔逊相关系数;最后,服务器根据P个第二路链中每一个第二路链与待预测路链之间的皮尔逊相关系数,从P个第二路链中确定M个第一路链。
示例性的,服务器提取当前待预测路链的上下游长度为1公里、深度为10层的静态拓扑关系数据。此处的10层深度的静态拓扑关系数据是单方向延伸不做回环的拓扑关系数据。之后,服务器根据该静态拓扑关系数据,确定P个第二路链。需要说明的是,静态拓扑关系数据能够从交通部门的数据库中提取获得。
示例性的,服务器按照时间维度对第二路链的特征数据进行划分,例如,按照星期划分数据为工作日和周末,1天内的历史特征数据按照30分钟区间进行划分,这样每天划分为48个时间区间。服务器在计算预设时间区间内的待预测路链的拓扑路链属性数据时,也要选取对应时间属性的第二路链的特征数据。例如,今日为周三(工作日),在计算今日8点00分至8点30分的待预测路链的拓扑路链属性数据时,服务器选取昨日周二(也为工作日)8点00分至8点30分的第二路链的特征数据。
示例性的,以M等于6为例,服务器可以从P个第二路链中,选择正相关度最高的3条第二路链作为第一路链,以及选择负相关度最高的三条第二路链作为第一路链。例如,服务器以相关系数绝对值大于0.4的6条第二路链作为第一路链。
下面对待预测路链的标签数据进行具体说明。
在本申请实施例中,待预测路链的标签数据对待预测路链的特征数据进行数据标定。
示例性的,一条路链有9:00-9:30共计半个小时的历史路况数据,那么可以将这半个小时(9:00-9:30)生成对应的特征数据,设置5分钟、10分钟、15分钟、20分钟、25分钟、30分钟为间隔点,即6个时间长度为5分钟的时间区间。对于9点00分至9点05分这一时间区间,服务器获取9点05分至9点06分的真实路况值,并生成标签数据,根据此标签数据对9点00分至9点05分这一时间区间对应的待预测路链的特征数据进行数据标定。
可以理解的是,此时的第一时间段为9点00分至9点05分,第二时间段为9点05分至9点06分。9点05分至9点06分的标签数据就是9点00分至9点05分这一时间区间的路况预测的标准答案。
需要说明的是,由于路况信息在连续短时间波动较小,为了使得标签信息准确的反应当前1分钟的路况信息,计算连续5分钟历史路况信息对标签数据进行限制。具体的,将连续的5分钟历史路况信息数据进行数据平滑处理,计算得到当前1分钟的真实路况值。
可以理解的是,本申请能够根据需求,例如路况预测模型的预测结果不满足目标预期的情况下,对输入的模型参数进行调整。
S102、服务器根据待预测路链的训练集对路况预测模型进行训练。
其中,路况预测模型基于梯度提升决策树算法来构建。
示例性的,路况预测模型的模型参数可以如表2所示:
表2梯度提升决策树输入参数
参数名称 | 参数值 |
树的数量 | 60 |
树的最大深度 | 13 |
每个特征的分裂点的数量 | 2 |
学习速率 | 0.01 |
每次验证(validation)的样本比率 | 0.1 |
特征下采样的比率 | 1.0 |
两阶段分裂算法开关 | 关闭(false) |
低精度压缩,每个浮点数的大小 | 2 |
可以理解的是,如果路况预测模型的预测结果不够准确,服务器可以调整路况预测模型的模型参数,并重新训练路况预测模型。
在本申请实施例中,梯度提升决策树算法流程如下:
(1)、初始化,输入训练数据集T={(x1,y1),(x2,y2),...,(xN,yN)},xi∈χ=Rn,i=1,2,...,N;
其中,x代表样本数据的特征数据,y代表样本数据的标签数据,L(yi,c)是损失函数,c代表整棵树。
(2)、对于m=1,2,...,M,分别计算
这里,m是树的棵数。然后对rmi拟合一颗回归树,得到有J个叶子节点组成的第m棵树。然后对j=1,2,...,J,分别计算:
(3)、得到回归树
可选的,通过损失函数来体现路况预测模型的错误率,如果路况预测模型能够让损失函数持续下降,则说明路况预测模型的预测结果的准确率在持续上升。也就是说,训练路况预测模型的方式就是让损失函数在其梯度的方向上下降。因此,通过算法调整,使得算法的每一步沿着损失函数下降最快的方向建立新的模型,这样使得算法在每一步均沿着下降最快的方向收敛。
在一种可能实现的方式中,服务器将训练集输入路况预测模型后,得出训练结果;之后,服务器将训练结果与目标结果进行比对,计算此次路况预测的准确率。若此次路况预测的准确率小于预设准确率,则服务器进行算法调整,重新训练路况预测模型;若此次路况预测的准确率大于或等于预设准确率,则路况预测模型训练完成。
可以理解的是,目标结果就是输入的特征数据所对应的标签数据中的真实路况值。
可选的,算法调整分为特征数据提取调整和梯度提升决策树模型调整。特征数据提取调整可以是对特征提取维度的调整,例如添加、修改或删减等。梯度提升决策树模型调整可以是对路况预测模型中输入参数的调整,例如模型中回归树的数量、最大深度的调整。
S103、服务器根据训练完成的路况预测模型,确定待预测路链的预测路况值。
服务器在路况预测模型的预测结果正确率达到预设的期望值后,获取待预测路链当前时间段的特征数据,并输入至路况预测模型中,得出路况预测值。
基于上述技术方案,由于路况预测模型是基于梯度提升决策树来构建的,并且由于训练路况预测模型的训练集包括多个样本数据,因此本申请所提供的路况预测模型是基于大数据技术和机器学习技术的结合来实现的。基于该路况预测模型,服务器可以进行更准确地路况预测,从而给城市管理者(例如交警)提供更有效的路况预测信息,帮助城市管理者对道路进行有效的管理,进而达到缓解城市交通压力的目的。
可选的,如图2所示,路况预测方法在步骤S102之后还包括步骤S201-S203。
S201、服务器获取待预测路链的测试集。
其中,测试集也包括多个样本数据。测试集中的样本数据的获取方法与步骤S101中训练集中样本数据的获取方法相同,在此不再赘述。
S202、服务器根据测试集对训练完成的路况预测模型进行测试。
可以理解的是,将训练集的样本数据输入训练完成的路况预测模型,得出训练结果。
S203、服务器根据测试结果,确认路况预测模型能否用于实际路况预测。
可选的,服务器将测试集输入路况预测模型后得出的测试结果与正确结果进行对比,确定误差率。若误差率小于预设误差率,则路况预测模型建立成功,能够用于实际路况预测;若误差率大于或等于预设误差率,则重新对路况预测模型进行训练,直至误差率小于预设误差率为止。其中,正确结果就是测试集中的标签数据中包括的真实路况值。
本申请实施例可以根据上述方法示例对服务器进行功能模块或者功能单元的划分,例如,可以对应各个功能划分各个功能模块或者功能单元,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块或者功能单元的形式实现。其中,本申请实施例中对模块或者单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
如图3所示,为上述实施例中所涉及的服务器的一种可能的结构示意图。
该服务器包括:
获取模块101,用于获取待预测路链的训练集,训练集包括多个样本数据,样本数据包括特征数据和标签数据,特征数据用于反映待预测路链在第一时间段的特征,标签数据用于反映待预测路链在第二时间段的真实路况值,第一时间段的结束时间为第二时间段的起始时间。
训练模块102,用于根据训练集对路况预测模型进行训练,路况预测模型基于梯度提升决策树算法来构建。
确定模块103,用于根据训练完成的路况预测模型,确定待预测路链的预测路况值。
可选的,训练模块102,还用于根据测试集,对训练完成的路况预测模型进行测试;其中,所述测试集包括多个样本数据。
如图4所示,为上述实施例中所涉及的服务器的又一种可能的结构示意图。
该服务器包括:
处理器202,用于对该服务器的动作进行控制管理,例如,执行上述获取模块101、训练模块102和确定模块103执行的步骤,和/或用于执行本文所描述的技术的其它过程。
上述处理器202可以是实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。该处理器可以是中央处理器,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
可选的,该服务器还可以包括通信接口203、存储器201和总线204,通信接口203用于支持服务器与其他网络实体的通信。存储器201用于存储该服务器的程序代码和数据。
其中,存储器201可以是服务器中的存储器,该存储器可以包括易失性存储器,例如随机存取存储器;该存储器也可以包括非易失性存储器,例如只读存储器,快闪存储器,硬盘或固态硬盘;该存储器还可以包括上述种类的存储器的组合。
总线204可以是扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。总线204可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例提供一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行上述方法实施例所述的路况预测模型的方法。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当网络设备执行该指令时,该网络设备执行上述方法实施例所示的方法流程中网络设备执行的各个步骤。
其中,计算机可读存储介质,例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘。随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、寄存器、硬盘、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的人以合适的组合、或者本领域数值的任何其他形式的计算机可读存储介质。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于特定用途集成电路(Application Specific Integrated Circuit,ASIC)中。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种路况预测方法,其特征在于,所述方法包括:
获取待预测路链的训练集,所述训练集包括多个样本数据,所述样本数据包括特征数据和标签数据,所述特征数据用于反映所述待预测路链在第一时间段的特征,所述标签数据用于反映所述待预测路链在第二时间段的真实路况值,所述第一时间段的结束时间为所述第二时间段的起始时间;
根据所述训练集对路况预测模型进行训练,所述路况预测模型基于梯度提升决策树算法来构建;
根据训练完成的路况预测模型,确定所述待预测路链的预测路况值。
2.根据权利要求1所述的路况预测方法,其特征在于,所述特征数据包括动态路况属性数据、时间属性数据、空间属性数据、外部因素属性数据、以及拓扑路链属性数据;
其中,所述动态路况属性数据用于反映所述待预测路链上的车辆行驶情况;
所述时间属性数据用于反映所述待预测路链的特征数据对应的时间属性;
所述空间属性数据包括以下一项或多项:所述待预测路链的道路等级、道路长度、道路宽度、坡度、弯道曲率、与交通信号灯的关系方位;
所述外部因素属性数据用于反映在所述待预测路链上发生的事件;
所述拓扑路链属性数据包括M个第一路链的特征数据,所述M个第一路链是对所述待预测路链的路况影响最大的M个路链,M为正整数。
4.根据权利要求1所述的路况预测方法,其特征在于,所述方法还包括:
根据测试集,对所述训练完成的路况预测模型进行测试;其中,所述测试集包括多个样本数据。
5.一种服务器,其特征在于,所述服务器包括:
获取模块,用于获取待预测路链的训练集,所述训练集包括多个样本数据,所述样本数据包括特征数据和标签数据,所述特征数据用于反映所述待预测路链在第一时间段的特征,所述标签数据用于反映所述待预测路链在第二时间段的真实路况值,所述第一时间段的结束时间为所述第二时间段的起始时间;
训练模块,用于根据所述训练集对路况预测模型进行训练,所述路况预测模型基于梯度提升决策树算法来构建;
确定模块,用于根据训练完成的路况预测模型,确定所述待预测路链的预测路况值。
6.根据权利要求5所述的服务器,其特征在于,所述特征数据包括动态路况属性数据、时间属性数据、空间属性数据、外部因素属性数据、以及拓扑路链属性数据;
其中,所述动态路况属性数据用于反映所述待预测路链上的车辆行驶情况;
所述时间属性数据用于反映所述待预测路链的特征数据对应的时间属性;
所述空间属性数据包括以下一项或多项:所述待预测路链的道路等级、道路长度、道路宽度、坡度、弯道曲率、与交通信号灯的关系方位;
所述外部因素属性数据用于反映在所述待预测路链上发生的事件;
所述拓扑路链属性数据包括M个第一路链的特征数据,所述M个第一路链是对待预测路链的路况影响最大的M个路链,M为正整数。
8.根据权利要求5所述的服务器,其特征在于,
所述训练模块,还用于根据测试集,对所述训练完成的路况预测模型进行测试;其中,所述测试集包括多个样本数据。
9.一种服务器,其特征在于,包括:处理器和通信接口;所述通信接口和所述处理器耦合,所述处理器用于运行计算机程序或指令,以实现上述权利要求1-4任一项中所述的路况预测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当计算机执行该指令时,该计算机执行上述权利要求1-4任一项中所述的路况预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911205475.3A CN110889558B (zh) | 2019-11-29 | 2019-11-29 | 路况预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911205475.3A CN110889558B (zh) | 2019-11-29 | 2019-11-29 | 路况预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110889558A true CN110889558A (zh) | 2020-03-17 |
CN110889558B CN110889558B (zh) | 2023-06-06 |
Family
ID=69749605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911205475.3A Active CN110889558B (zh) | 2019-11-29 | 2019-11-29 | 路况预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110889558B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111784084A (zh) * | 2020-08-17 | 2020-10-16 | 北京市城市规划设计研究院 | 基于梯度提升决策树的出行生成预测方法、系统及装置 |
CN111862590A (zh) * | 2020-05-13 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 路况预测方法、装置及存储介质 |
CN111882112A (zh) * | 2020-07-01 | 2020-11-03 | 北京嘀嘀无限科技发展有限公司 | 一种预测到达时间的方法和系统 |
CN112652165A (zh) * | 2020-12-11 | 2021-04-13 | 北京百度网讯科技有限公司 | 模型训练及路况预测方法、装置、设备、介质及程序产品 |
CN113160563A (zh) * | 2021-03-31 | 2021-07-23 | 西安交通大学 | 一种基于历史路况的短时路况预测方法、系统及设备 |
CN115457766A (zh) * | 2022-08-31 | 2022-12-09 | 华迪计算机集团有限公司 | 一种用于预测道路拥堵状态的方法及系统 |
CN116720634A (zh) * | 2023-08-11 | 2023-09-08 | 北京泰豪智能工程有限公司 | 一种园区运行数据处理方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109754594A (zh) * | 2017-11-01 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 一种路况信息获取方法及其设备、存储介质、终端 |
CN110232820A (zh) * | 2019-05-20 | 2019-09-13 | 北京世纪高通科技有限公司 | 一种路况预测模型的建立方法及装置 |
CN110335165A (zh) * | 2019-06-28 | 2019-10-15 | 京东数字科技控股有限公司 | 一种链路预测方法和装置 |
-
2019
- 2019-11-29 CN CN201911205475.3A patent/CN110889558B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109754594A (zh) * | 2017-11-01 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 一种路况信息获取方法及其设备、存储介质、终端 |
CN110232820A (zh) * | 2019-05-20 | 2019-09-13 | 北京世纪高通科技有限公司 | 一种路况预测模型的建立方法及装置 |
CN110335165A (zh) * | 2019-06-28 | 2019-10-15 | 京东数字科技控股有限公司 | 一种链路预测方法和装置 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111862590A (zh) * | 2020-05-13 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 路况预测方法、装置及存储介质 |
CN111882112A (zh) * | 2020-07-01 | 2020-11-03 | 北京嘀嘀无限科技发展有限公司 | 一种预测到达时间的方法和系统 |
CN111882112B (zh) * | 2020-07-01 | 2024-05-10 | 北京嘀嘀无限科技发展有限公司 | 一种预测到达时间的方法和系统 |
CN111784084A (zh) * | 2020-08-17 | 2020-10-16 | 北京市城市规划设计研究院 | 基于梯度提升决策树的出行生成预测方法、系统及装置 |
CN111784084B (zh) * | 2020-08-17 | 2021-12-28 | 北京市城市规划设计研究院 | 基于梯度提升决策树的出行生成预测方法、系统及装置 |
CN112652165A (zh) * | 2020-12-11 | 2021-04-13 | 北京百度网讯科技有限公司 | 模型训练及路况预测方法、装置、设备、介质及程序产品 |
CN112652165B (zh) * | 2020-12-11 | 2022-05-31 | 北京百度网讯科技有限公司 | 模型训练及路况预测方法、装置、设备、介质及程序产品 |
CN113160563A (zh) * | 2021-03-31 | 2021-07-23 | 西安交通大学 | 一种基于历史路况的短时路况预测方法、系统及设备 |
CN115457766A (zh) * | 2022-08-31 | 2022-12-09 | 华迪计算机集团有限公司 | 一种用于预测道路拥堵状态的方法及系统 |
CN115457766B (zh) * | 2022-08-31 | 2023-08-08 | 华迪计算机集团有限公司 | 一种用于预测道路拥堵状态的方法及系统 |
CN116720634A (zh) * | 2023-08-11 | 2023-09-08 | 北京泰豪智能工程有限公司 | 一种园区运行数据处理方法及系统 |
CN116720634B (zh) * | 2023-08-11 | 2023-10-13 | 北京泰豪智能工程有限公司 | 一种园区运行数据处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110889558B (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110889558B (zh) | 路况预测方法及装置 | |
CN109670277B (zh) | 一种基于多模态数据融合与多模型集成的旅行时间预测方法 | |
Kim et al. | Urban traffic flow prediction system using a multifactor pattern recognition model | |
CN111582559B (zh) | 一种到达时间的预估方法及装置 | |
CN108694673A (zh) | 一种保险业务风险预测的处理方法、装置及处理设备 | |
Song et al. | A match‐then‐predict method for daily traffic flow forecasting based on group method of data handling | |
US11238728B2 (en) | Determining traffic congestion patterns | |
CN110348601A (zh) | 一种基于双向长短期记忆网络的地铁短期客流量预测方法 | |
CN111292534A (zh) | 一种基于聚类与深度序列学习的交通状态估计方法 | |
CN111753910A (zh) | 基于lstm的滴滴订单需求预测方法及装置 | |
CN110598775B (zh) | 基于模糊聚类和bp神经网络的预测方法、系统及存储介质 | |
CN113380043B (zh) | 一种基于深度神经网络计算的公交到站时间预测方法 | |
CN112149922A (zh) | 高速公路隧道下行线出入口区域事故严重程度预测方法 | |
Xing et al. | A short-term traffic flow prediction method based on kernel extreme learning machine | |
Saracoglu et al. | Estimation of traffic incident duration: a comparative study of decision tree models | |
CN106875681B (zh) | 一种交通拥塞趋势预测方法及系统 | |
Treboux et al. | A predictive data-driven model for traffic-jams forecasting in smart santader city-scale testbed | |
CN110796301B (zh) | 一种基于ic卡数据的乘客流量预测方法及装置 | |
CN110264725B (zh) | 路段流量的确定方法及装置 | |
Xu et al. | Applying finite mixture models to New York City travel times | |
Nizar et al. | Forecasting of temperature by using LSTM and bidirectional LSTM approach: case study in Semarang, Indonesia | |
CN116311927A (zh) | 一种交通流量的预测方法、装置、电子设备及存储介质 | |
CN114627642B (zh) | 一种交通拥堵识别方法及装置 | |
Petelin et al. | Models for forecasting the traffic flow within the city of Ljubljana | |
CN114463978A (zh) | 一种基于轨道交通信息处理终端的数据监测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |