CN116052416A - 基于道路历史数据的车流量预测方法、系统及存储介质 - Google Patents
基于道路历史数据的车流量预测方法、系统及存储介质 Download PDFInfo
- Publication number
- CN116052416A CN116052416A CN202211648508.3A CN202211648508A CN116052416A CN 116052416 A CN116052416 A CN 116052416A CN 202211648508 A CN202211648508 A CN 202211648508A CN 116052416 A CN116052416 A CN 116052416A
- Authority
- CN
- China
- Prior art keywords
- data
- traffic flow
- traffic
- flow data
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000003860 storage Methods 0.000 title claims description 16
- 238000012549 training Methods 0.000 claims abstract description 79
- 239000013598 vector Substances 0.000 claims abstract description 56
- 238000012545 processing Methods 0.000 claims abstract description 36
- 238000005457 optimization Methods 0.000 claims abstract description 28
- 238000000926 separation method Methods 0.000 claims abstract description 21
- 238000012706 support-vector machine Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000005070 sampling Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 37
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 238000009826 distribution Methods 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 230000009467 reduction Effects 0.000 claims description 10
- 238000001125 extrusion Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000000513 principal component analysis Methods 0.000 claims description 7
- 230000007246 mechanism Effects 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 4
- 230000003213 activating effect Effects 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 4
- 230000015556 catabolic process Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000006731 degradation reaction Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/065—Traffic control systems for road vehicles by counting the vehicles in a section of the road or in a parking area, i.e. comparing incoming count with outgoing count
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供了一种基于道路历史数据的车流量预测方法,其特征在于,包括以下步骤:获取历史车流量数据构建历史车流量数据集;针对所述历史车流量数据集进行预处理;对所述历史车流量数据集进行不平衡处理,得到目标训练数据;使用注意力模块对所述目标训练数据的特征向量进行处理,得到目标特征向量;利用目标训练数据和目标特征向量,使用支持向量机进行训练,得到预测模型;将实时车流量数据输入所述预测模型,输出预测结果;其中,所述预测模型设置有优化目标函数,所述优化目标函数用于对所述目标训练数据具有最小间隔的车流量数据样点进行间隔最大化,以使预测模型得到对应所述目标训练数据的分隔超平面。
Description
技术领域
本发明属于城市交通流量预测技术领域,具体涉及基于道路历史数据的车流量预测方法、系统及存储介质。
背景技术
在智慧城市建设过程中,随着车载传感器增加,车辆行驶过程中将产生大量的交通车流量数据,如何充分挖掘隐含在车流量数据中的普遍规律从而进一步推动智慧交通系统的发展,是一个非常值得关注的问题。准确的车流量预测不仅有利于城市道路的规划建设,还有助于提高车辆的通行效率,缓解城市交通拥堵,减少资源浪费和环境污染。为了提高交通流量的预测精度,研究人员做了大量探索。但现有的方法及模型模型容易产生滞后现象,难以适应日益复杂的城市路网结构。此外,在面对车流量数据小样本场景下,尤其是车流量数据集车流量数据样本不平衡的情况下,效果欠佳;另外,由于所提出的算法模型对训练车流量数据样本的数量和质量要求较高,鲁棒性和泛化能力有待提升。
发明内容
为了克服现有技术的不足,本发明提供一种基于道路历史数据的车流量预测方法、系统及存储介质,以解决现有技术中的问题。
本发明其中一个实施例提供了一种基于道路历史数据的车流量预测方法,包括以下步骤:
获取历史车流量数据构建历史车流量数据集;
针对所述历史车流量数据集进行预处理;
对所述历史车流量数据集进行不平衡处理,得到目标训练数据;
使用注意力模块对所述目标训练数据的特征向量进行处理,得到目标特征向量;
利用目标训练数据和目标特征向量,使用支持向量机进行训练,得到预测模型;
将实时车流量数据输入所述预测模型,输出预测结果;
其中,所述目标训练数据包括历史车流量数据集的不平衡率、新车流量数据样本总数和不平衡类别的新车流量数据样本;
所述预测模型设置有优化目标函数,所述优化目标函数用于对所述目标训练数据具有最小间隔的车流量数据样点进行间隔最大化,以使预测模型得到对应所述目标训练数据的分隔超平面。
在其中一个实施例中,所述预处理包括:
对车流量数据集进行批量归一化处理;
对车流量数据集进行PCA降维和去噪。
在其中一个实施例中,所述批量归一化处理:
yi=γzi+β
其中,Nbatch表示每个预设批次的车流量数据样本的个数;
gi表示某一批处理中第i个车流量数据样本的车流量数据特征;
ε是趋近零的常量,用于保持车流量数据的稳定性;
γ和β为可学习重构参数,通过自适应学习减少车流量数据特征分布间的差异;
zi为中间变量,μb为中间变量。
在其中一个实施例中,所述对所述历史车流量数据集进行不平衡处理,得到目标训练数据,包括:
计算车流量数据集的不平衡率,公式如下:
其中,d为车流量数据集的不平衡率,n1为不平衡的车流量数据样本种类的数量,n2为平衡的车流量数据样本的种类数量;
计算合成的新车流量数据样本总数N,公式如下:
N=d×α,α∈[0,1];
根据欧式距离计算少数类样本xi的K个近邻车流量数据样本xij,并计算每个少数类车流量数据样本的γi,公式如下:
其中:Δi表示K个近邻车流量数据样本中的多数类车流量数据样本数,
γi为每个少数类车流量数据样本数据;
归一化处理,公式如下:
计算每个少数类车流量数据样本合成的样本数量:
其中,Mi为每个少数类车流量数据样本合成的样本数量,
生成新车流量数据样本,公式如下:
xnew=xi+xi-xij)×rand(0,1)
其中,xi为少数类车流量数据样本;
xij为xi的近邻车流量数据样本;
rand(0,1)为0到1之间的随机数;
xnew为生成不平衡类别的新车流量数据样本。
在其中一个实施例中,所述使用注意力模块对所述目标训练数据的特征向量进行处理,得到目标特征向量,包括:
将所述目标训练数据的特征向量作为输入,使用挤压和通道网络注意力模块进行挤压操作,输出全局空间车流量数据特征;
获取所述全局空间车流量数据特征作为输入,使用神经网络结构输出所述目标特征向量;
其中,所述神经网络结构含有两个全连接层。
在其中一个实施例中,所述使用挤压和通道网络注意力模块进行挤压操作,输出全局空间车流量数据特征,包括:
使用全局平均池化将一个通道的整个空间车流量数据特征转换为一个全局空间车流量数据特征作为该通道的表示;
所述使用神经网络结构输出所述目标特征向量,包括:
使用第一个全连接层进行降维,获取对应通道的降维数据,并使用ReLU函数激活;
将激活后的降维数据作为输入,使用第二全连接层恢复原始的维度,并使用门控机制,得到0至1之间的权重值;
通过将所述目标训练数据的特征向量乘以对应通道的权重,得到目标特征向量。
在其中一个实施例中,所述利用目标训练数据和目标特征向量,使用支持向量机进行训练,得到预测模型,包括:
通过|wTx+b|/||w||计算点到分隔面的法线或垂线的长度;
通过优化目标函数对分类器进行优化,寻找最大间隔;
使用SMO算法进行求解,得到分隔超平面;
其中,wTx+b为分类器;wT和w为向量;b为常数。
在其中一个实施例中,所述对分类器进行优化,得到所述优化目标函数,包括:
将目标训练数据输入分类器,得到类别标签;
使用单位阶跃函数对wTx+b作用,得到f(wTx+b);
通过label×(wTx+b)计算间隔,得到具有最小间隔的所述目标训练数据的车流量数据样本点;
使用优化目标函数对所述具有最小间隔的车流量数据样本点进行优化,得到具有最大化间隔的车流量数据样本点;
其中,C为常数,用于控制“最大化间隔”的车流量数据样本点的权重;
Labe为类别标签,所述类别标签使用-1和+1表示;
所述w为向量,b为常数;
m为样本数量,α为优化变量。
本发明其中一个实施例还提供了一种基于道路历史数据的车流量预测系统,包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上任意一项所述的基于道路历史数据的车流量预测方法的步骤。
本发明其中一个实施例还提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任意一项所述的基于道路历史数据的车流量预测方法的步骤。
以上实施例所提供的基于道路历史数据的车流量预测方法、系统及存储介质具有以下有益效果:
1、通过对历史车流量数据集进行不平衡处理,从而降低所述历史车流量数据集中的样本各类别间数量的差异,以降低预测模型对某一或某些样本的判别倾向性,并有效提升车流量数据质量,降低车流量数据采集与车流量数据标注的成本与代价。
2、在其中一个实施例中,由于所述历史车流量数据集的各个车辆流量数据样本的车流量数据特征分布存在差异,如果训练数据与测试数据的分布不同,那么网络的泛化能力也会大大降低,并且在使用小批量数据对神经网络进行训练时,若每批训练数据的分布各不相同,网络在每次迭代都需要去学习适应不同的分布,会大大降低网络的训练速度,因此,需要对所述历史车流量数据集进行预处理。
3、在其中一个实施例中,通过将所述目标训练数据和目标特征向量作为训练集,根据训练集有限的车流量数据样本信息,使用改进的支持向量机进行训练,得到车流量的预测模型,在最小化车流量数据样本点误差的同时,提高模型的泛化能力,从而得到可靠的车流量数据小样本车流量数据的分析结果,提高车流量预测精度。
4、在其中一个实施例中,通过设置优化目标函数对分类器进行优化,并采用SMO算法进行高效求解,从而提高对车流量的预侧精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明实施例提供的基于道路历史数据的车流量预测方法的步骤流程图;
图2为图1中的基于道路历史数据的车流量预测方法的预处理的步骤流程图;
图3为图1中的基于道路历史数据的车流量预测方法的不平衡处理的步骤流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,若全文中出现的“和/或”或者“及/或”,其含义包括三个并列的方案,以“A和/或B”为例,包括A方案、或B方案、或A和B同时满足的方案。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
请参阅图1,本发明其中一个实施例提供了一种基于道路历史数据的车流量预测方法,包括以下步骤:
S100:获取历史车流量数据构建历史车流量数据集;
在本实施例中,当车辆行驶在道路上时,会产生相应的车流量数据,而随着车载传感器的增加,车辆行驶的过程中将产生大量的交通车流量数据,首先,通过后台设备获取多源道路的历史车流量数据,将多源道路的历史车流量进行分批设置,并将每批的历史车流量数据按类别预设分成若干个样本,可根据需要进行设定,形成预设批次,通过将预设批次组合形成所述历史车流量数据集;其中,所述历史车流量数据还可按时序进行分类设置,可根据工作、场景的需要进行设定,满足预测所需的各类数据的需求,并提高模型预测精度,多源道路包括若干不同类型的道路,包括高速路、城区路和天桥等类型,可根据需要进行设定;以提高预测精度。
S200:针对所述历史车流量数据集进行预处理;
在本实施例中,由于所述历史车流量数据集的各个车辆流量数据样本的车流量数据特征分布存在差异,如果训练数据与测试数据的分布不同,那么网络的泛化能力也会大大降低,并且在使用小批量数据对神经网络进行训练时,若每批训练数据的分布各不相同,网络在每次迭代都需要去学习适应不同的分布,会大大降低网络的训练速度,因此,需要对所述历史车流量数据集进行预处理;
请参阅图2,在其中一个实施例中,所述预处理包括:
S201:对车流量数据集进行批量归一化处理;
在本实施例中,所述批量归一化目前已在深度学习领域中被大量应用。所述批量归一化主要有加快网络的训练和收敛的速度、控制梯度爆炸并防止梯度消失以及防止发生过拟合的作用。与一般的归一化不同,批量归一化是嵌入在深度神经网络内部层之间的一种运算,通常用于激活函数前,先对一个层的输出进行归一化,将预设批次的车流量数据样本强制在统一的数据分布下,然后再将其输入到下一层,使整个神经网络在各层的中间输出的数值更稳定。从而使深层神经网络更容易收敛而且降低模型过拟合的风险使得梯度传递更加通畅;
S201-1:在其中一个实施例中,所述批量归一化处理:
yi=γzi+β
其中,Nbatch表示每个预设批次的车流量数据样本的个数;
gi表示某一批处理中第i个车流量数据样本的车流量数据特征;
ε是趋近零的常量,用于保持车流量数据的稳定性;
γ和β为可学习重构参数,通过自适应学习减少车流量数据特征分布间的差异,所述可学习表示能够学习的意思;
在本实施例中,所述批量归一化包括以下步骤:
S201-11:计算每一个预设批次数据的均值,
S201-11:计算每一个预设批次数据的方差,
S201-11:规范化:使用求得的均值和方差对该批次的训练数据做归一化,获得0-1分布。其中ε是为了避免除数为0时所使用的微小正数,
S201-11:尺寸变换和偏移:将g乘以γ调整数值大小,再加上β增加偏移后得到,这里的γ是尺度因子,β是平移因子。由于归一化后的g基本会被限制在正态分布下,使得网络的表达能力下降。
为解决该问题,使用yi=γzi+β=BNγ,β(gi)。我们引入两个新的参数:γ,β,γ和β是在训练时网络自己学习得到的。
S202:对历史车流量数据集进行PCA降维和去噪;
在本实施例中,通过对历史车流量数据集进行PCA降维、去噪等操作,以使提高车流量数据质量。
S300:对所述历史车流量数据集进行不平衡处理,得到目标训练数据;
在本实施例中,为避免样本不均衡导致分类精度降低。比如有的类别有10个训练样本,有的类别有10000个训练样本,那么对前者类别进行区分时,难度较大,精度较低;把10个训练样本的类别扩充到8000个,两个类别的样本数量级相当,更容易训练出精度高的模型。
在车流量预测中,由于所述历史车流量数据集中的样本各类别间数量差异较大,容易使预测模型对某一或某些样本的判别具有倾向性,因此需进行样本不平衡处理。主要步骤如下:
请参阅图3,在其中一个实施例中,所述对所述历史车流量数据集进行不平衡处理,得到目标训练数据,包括:
S301:计算历史车流量数据集的不平衡率,公式如下:
其中,d为历史车流量数据集的不平衡率,n1为不平衡的历史车流量数据样本种类的数量,n2为平衡的历史车流量数据样本的种类数量;
S302:计算合成的新车流量数据样本总数N,公式如下:
N=d×α,α∈[0,1];
S303:根据欧式距离计算少数类样本xi的K个近邻车流量数据样本xij,并计算每个少数类车流量数据样本的γi,公式如下:
其中:Δi表示K个近邻车流量数据样本中的多数类车流量数据样本数,
γi为每个少数类车流量数据样本数据;
S304:归一化处理,公式如下:
S305:计算每个少数类车流量数据样本合成的样本数量:
其中,Mi为每个少数类车流量数据样本合成的样本数量,
S306:生成不平衡类别的新车流量数据样本,公式如下:
其中,xi为少数类车流量数据样本;
xij为xi的近邻车流量数据样本;
rand(0,1)为0到1之间的随机数;
xnew为生成不平衡类别的新车流量数据样本。
在本实施例中,通过使用随机过采样算法对历史车流量数据集的样本进行不平衡处理,能有效提升车流量数据样本的车流量数据质量,降低历史车流量数据的采集与车流量数据标注的成本与代价;
其中,所述目标训练数据包括历史车流量数据集的不平衡率、新车流量数据样本总数、归一化后的车流量数据样本数据、每个少数类车流量数据样本合成的样本数量和不平衡类别的新车流量数据样本。少数类样本,就是样本数量比较少的类别,相差10倍以上,为少数类样本;平衡与不平衡的区分,就是看有没有少数类样本,没有少数类样本了,就是平衡了。
S400:使用注意力模块对所述目标训练数据的特征向量进行处理,得到目标特征向量;
在本实施例中,通过注意力模块对所述目标训练数据的特征向量进行校正,形成所述目标特征向量,校正后的特征可保留有价值的特征,从而剔除没有价值的特征,从而达到提高特征表示能力的目的。
在其中一个实施例中,所述使用注意力模块对所述目标训练数据的特征向量进行处理,得到目标特征向量,包括:
S401:将所述目标训练数据的特征向量作为输入,使用挤压和通道网络注意力模块进行挤压操作,输出全局空间车流量数据特征;
在其中一个实施例中,所述使用挤压和通道网络注意力模块进行挤压操作,输出全局空间车流量数据特征,包括:
S401-1:使用全局平均池化将一个通道的整个空间车流量数据特征转换为一个全局空间车流量数据特征作为该通道的表示;如下式:
其中,Xm(i,j)表示第m个车流量数据特征映射Xm在(i,j)位置上的通道车流量数据特征值;
Fsq()表示挤压操作,即GAP操作;
在本实施例中,通过全局平均池化对输入的特征向量的空间维度进行压缩,以使输入的目标训练数据的特征向量被压缩成全局空间车流量数据特征,通过将目标训练数据的全局空间信息压缩到全局空间车流量数据特征,既降低了网络参数,也能达到防止过拟合的作用。
S402:使用激励函数抓取通道间的相关性;
在本实施例中,通过激励操作抓取通道间的相关性,从而实现对非线性数据的处理。包括以下步骤:
S403:获取所述全局空间车流量数据特征和所述通道间的相关性作为输入,使用神经网络结构输出所述目标特征向量;
其中,所述神经网络结构含有两个全连接层。
在本实施例中,通过将全局空间车流量数据特征输入到两个全连接层网络中,得到注意力权重矩阵,再与目标训练数据的特征向量做乘法运算得到校准之后的目标特征向量。
所述使用神经网络结构输出所述目标特征向量,包括:
S403-1:使用第一个全连接层进行降维,获取对应通道的降维数据,并使用ReLU函数激活;
S403-2:将激活后的降维数据作为输入,使用第二全连接层恢复原始的维度,并使用门控机制,得到0至1之间的权重值;
S403-3:通过将所述目标训练数据的特征向量乘以对应通道的权重,得到目标特征向量。
在本实施例中,采用含有两个全连接层的神经网络结构,第一个全连接层负责降维,采用ReLU函数激活后,再采用第二个全连接层恢复原始的维度,并引入Sigmoid形式的门控机制,该机制可以灵活学习到各个通道间的非线性关系,得到0至1之间的权重值,对原始的每个原始车流量数据特征乘以对应通道的权重,得到新的车流量数据特征向量,运算过程如下:
u=f(WUδ(WX))
其中,f()和δ()分别表示Sigmoid函数和ReLU函数;
WU是低维车流量数据特征映射通过卷积层时通道数以一定比率增加后得到的权重,
WX的作用是减少通道数目,是卷积层的权重。
通过训练这两个权重得到一个一维的激励权重来激活每一层通道。
u表示最终获得的通道统计量。
um表示第m个通道缩放描述符,与Xm逐通道相乘得到Hadamard乘积。
S500:利用目标训练数据和目标特征向量,使用支持向量机进行训练,得到预测模型;
在本实施例中,通过将所述目标训练数据和目标特征向量作为训练集,根据训练集有限的车流量数据样本信息,使用改进的支持向量机进行训练,得到车流量的预测模型,在最小化车流量数据样本点误差的同时,提高模型的泛化能力,从而得到可靠的车流量数据小样本车流量数据的分析结果。
在其中一个实施例中,所述利用目标训练数据和目标特征向量,使用支持向量机进行训练,得到预测模型,包括:
S501:通过|wTx+b|/||w||计算点到分隔面的法线或垂线的长度;
在本实施例中,分隔超平面的形式可以写成wTx+b。要计算点A到分隔超平面的距离,就必须给出点到分隔面的法线或垂线的长度,该值为|wTx+b|/||w||。这里的常数b类似于逻辑回归中的结局w0。这里的向量w和常数b一起描述了所有车流量数据的分隔线或超平面,其中,wTx+b为分类器;wT和w为向量;b为常数,T为运算符,矩阵的转置,不是角标字母。
S502:对分类器进行优化,寻找最大间隔,得到所述优化目标函数;
在其中一个实施例中,所述对分类器进行优化,得到所述优化目标函数,包括:
S502-1:将目标训练数据输入分类器,得到类别标签;
S502-2:使用单位阶跃函数对wTx+b作用,得到f(wTx+b);
S502-3:通过label×(wTx+b)计算间隔,得到具有最小间隔的所述目标训练数据的车流量数据样本点;
S502-4:使用优化目标函数对所述具有最小间隔的车流量数据样本点进行优化,得到具有最大化间隔的车流量数据样本点;
其中,C为常数,用于控制“最大化间隔”的车流量数据样本点的权重;
Labe为类别标签,所述类别标签使用-1和+1表示;
所述w为向量,b为常数;
m为样本数量,α为优化变量。
在本实施例中,输入车流量数据给分类器会输出一个类别标签。下面将使用单位阶跃函数对wTx+b作用得到f(wTx+b),其中,当u<0时f(u)输出-1,反之则输出+1。这里的标签采用-1和+1,仅仅相差一个符号,方便数学上处理。可以通过一个统一的公式来表示间隔或者车流量数据样本点到分隔超平面的距离,同时不必担心车流量数据到底是属于-1还是+1;
当计算车流量数据样本点到分隔面的距离并确定分隔面的放置位置时,间隔通过label×(wTx+b)来计算,这时就能体现出-1和+1的好处了。如果车流量数据样本点处于正方向(即+1类)并且离分隔超平面很远的位置时,wTx+b会是一个很大的正数,同时label×(wTx+b)也会是一个很大的正数。如果车流量数据样本点处于负方向(即-1类)并且离分隔超平面很远的位置时,此时由于类别标签为-1,label×(wTx+b)仍然是一个很大的正数。
现在的目标就是找出分类器定义中的w和b。为此,必须找到具有最小间隔的车流量数据样本点,这些车流量数据样本点也就是前面提到的支持向量。一旦找到具有最小间隔的车流量数据样本点,本发明就需要对该间隔最大化。可以写作:
直接求解相当困难,可以将它转换为另一种更容易求解的形式。首先考虑上式中大括号内的部分。本发明要做的是固定其中一个因子而最大化其他因子。如果令所有支持向量的label×(wTx+b)都等于1,那么就可以通过求||w||的最大化来得到最终解。但是,并非所有车流量数据样本点的label×(wTx+b)都等于1,只有那些离分隔超平面最近的点得到值才为1。而离超平面越远的车流量数据样本点,其label×(wTx+b)值也就越大。
在上述优化问题中,给定了一些约束条件然后求最优值,因此该问题是一个带约束条件的优化问题。这里的约束条件就是label×(wTx+b)>=1.0。对于这类优化问题,有一个非常著名的求解方法,即拉格朗日乘子法。通过引入拉个朗日乘子,就可以基于约束条件来表述原来的问题。由于这里的约束条件都是基于车流量数据样本点的,因此可以将超平面携程车流量数据样本点的形式。于是优化目标函数最后可以写成:
其约束条件为:
但是这里有个假设:车流量数据必须100%线性可分。但是,几乎所有车流量数据都不那么“干净”。这时就可以通过引入松弛变量来允许有些车流量数据样本点可以处于分隔面错误一侧。这里的优化目标就能保持仍然不变,但是此时新的约束条件则变为:
这里的常数C用于控制“最大化间隔”和“保证大部分点的函数间隔小于1.0”这两个目标的权重。在优化算的实现代码中,常数C是一个参数,因此就可以通过调节该参数得到不同的结果。一旦求出了所有的alpha,那么分隔超平面就可以通过这些alpha来表达。SVM的主要工作就是求解这些alphaS503:使用SMO算法进行求解,得到分隔超平面。
在本实施例中,可以通过SMO高效优化算法进行求解,SMO算法的目标是求出一系列alpha和b,而alphas是一个n×1的矩阵,矩阵中的每一个值代表一个数据点对应的alpha,一旦求出这些alpha,就很容易计算出权重向量,并得到分隔超平面。SMO算法的工作原理是:每次循环中选择两个alpha进行优化处理。一旦找到一堆的目标alpha,那么就增大其中一个同时减小另一个。所述目标alpha就是指两个alpha必须要符合一定的条件,条件之一就是这两个alpha必须要在间隔边界之外,而其中第二个条件则是这两个alpha还没有进行过区间化处理或者不在边界上。
S600:将实时车流量数据输入所述预测模型,输出预测结果;
所述预测模型设置有优化目标函数,所述优化目标函数用于对所述目标训练数据具有最小间隔的车流量数据样点进行间隔最大化,以使预测模型得到对应所述目标训练数据的分隔超平面。
在本实施例中,通过预测模型对实时车流量数据进行预测,从而实现了对所述实时车流量数据的道路进行预测,以输出下一时刻道路的预测车流量数据;
根据需要,在所述步骤S600之前还包括:所述历史车流量数据还包括第一时刻车流量数据和第二时刻车流量数据,所述第一时刻车流量数据和第二时刻车流量数据均包括多源道路车流量数据,所述第二时刻车流量数据为所述第一时刻车流量数据的下一时刻车流量数据,且对应所述第一时刻车流量数据的多源道路数据,通过将第一时刻车流量数据输入预测模型进行预测,输出第二时刻预测车流量数据,将所述第二时刻预测车流量数据与所述第二时刻车流量数据匹对,得到预测分析结果,将所述预测分析结果与预设精确值比对,当所述预测分析结果大于或等于所述预设精确值时,执行步骤S600,否则循环执行上述步骤,以使得到分析结果大于或等于所述预设精确值的预测模型,所述预设精确值根据对预测精度或使用场景的需求进行设定。
根据需要,在步骤S100之前还可以包括:构建历史车流量数据区、车流量数据集区以及车流量预测区;
通过所述车流量预测区下发预测指令,所述历史车流量数据区设置有历史车流量数据库,所述历史车流量数据库分类设置有若干个历史车流量数据表,具体为,根据不同类型的道路或时序设置不同的历史车流量数据表进行区分;
所述车流量数据集区设置有数据集存储库;所述数据集存储库存储有数据集存储表,所述车流量数据集区用于根据所述预测指令实时获取所述历史车流量数据库中对应的历史车流量数据表的历史车流量数据,并存储到所述数据集存储表中,以使形成历史车流量数据集;所述数据集存储表用于存储所述历史车流量数据集;
所述车流量预测区设置有数据预测库,所述数据预测库存储有数据来源表、数据处理表以及数据预测表,所述车流量预测区用于获取所述车流量数据集区的车流量数据集,并将预处理后的历史车流量数据集存储到所述数据来源表;所述数据处理表用于存储目标训练数据和目标特征向量;所述数据预测表用于储存预测模型输出的预测结果。所述数据预测区还用于根据所述历史车流量数据集生成预测模型,从而生成相应的预测结果;所述生成预测模型,从而生成相应的预测结果的步骤,包括步骤S100-步骤S600。从而实现对历史车流量数据进行高效、有序、规范的整合处理,并采用不平衡处理和支持向量机对车流量进行精确预测,以保证对道路的车流量进行高效率和高精确预测。
本发明其中一个实施例还提供了一种基于道路历史数据的车流量预测系统,包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上任意一项所述的基于道路历史数据的车流量预测方法的步骤。
本发明其中一个实施例还提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任意一项所述的基于道路历史数据的车流量预测方法的步骤。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用储存介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。
Claims (10)
1.一种基于道路历史数据的车流量预测方法,其特征在于,包括以下步骤:
获取历史车流量数据构建历史车流量数据集;
针对所述历史车流量数据集进行预处理;
对所述历史车流量数据集进行不平衡处理,得到目标训练数据;
使用注意力模块对所述目标训练数据的特征向量进行处理,得到目标特征向量;
利用目标训练数据和目标特征向量,使用支持向量机进行训练,得到预测模型;
将实时车流量数据输入所述预测模型,输出预测结果;
其中,所述目标训练数据包括历史车流量数据集的不平衡率、新车流量数据样本总数和不平衡类别的新车流量数据样本;
所述预测模型设置有优化目标函数,所述优化目标函数用于对所述目标训练数据具有最小间隔的车流量数据样点进行间隔最大化,以使预测模型得到对应所述目标训练数据的分隔超平面。
2.如权利要求1所述的基于道路历史数据的车流量预测方法,其特征在于,所述预处理包括:
对车流量数据集进行批量归一化处理;
对车流量数据集进行PCA降维和去噪。
4.如权利要求1所述的基于道路历史数据的车流量预测方法,其特征在于,所述对所述历史车流量数据集进行不平衡处理,得到目标训练数据,包括:
计算历史车流量数据集的不平衡率,公式如下:
其中,d为历史车流量数据集的不平衡率,n1为不平衡的历史车流量数据样本种类的数量,n2为平衡的历史车流量数据样本的种类数量;
计算合成的新车流量数据样本总数N,公式如下:
N=d×α,α∈[0,1];
根据欧式距离计算少数类样本xi的K个近邻车流量数据样本xij,并计算每个少数类车流量数据样本的γi,公式如下:
其中:Δi表示K个近邻车流量数据样本中的多数类车流量数据样本数,
γi为每个少数类车流量数据样本数据;
归一化处理,公式如下:
计算每个少数类车流量数据样本合成的样本数量:
其中,Mi为每个少数类车流量数据样本合成的样本数量,
生成新车流量数据样本,公式如下:
xnew=xi+xi-xij)×rand(0,1)
其中,xi为少数类车流量数据样本;
xij为xi的近邻车流量数据样本;
rand(0,1)为0到1之间的随机数;
xnew为生成不平衡类别的新车流量数据样本。
5.如权利要求1所述的基于道路历史数据的车流量预测方法,其特征在于,所述使用注意力模块对所述目标训练数据的特征向量进行处理,得到目标特征向量,包括:
将所述目标训练数据的特征向量作为输入,使用挤压和通道网络注意力模块进行挤压操作,输出全局空间车流量数据特征;
获取所述全局空间车流量数据特征作为输入,使用神经网络结构输出所述目标特征向量;
其中,所述神经网络结构含有两个全连接层。
6.如权利要求5所述的基于道路历史数据的车流量预测方法,其特征在于,
所述使用挤压和通道网络注意力模块进行挤压操作,输出全局空间车流量数据特征,包括:
使用全局平均池化将一个通道的整个空间车流量数据特征转换为一个全局空间车流量数据特征作为该通道的表示;
所述使用神经网络结构输出所述目标特征向量,包括:
使用第一个全连接层进行降维,获取对应通道的降维数据,并使用ReLU函数激活;
将激活后的降维数据作为输入,使用第二全连接层恢复原始的维度,并使用门控机制,得到0至1之间的权重值;
通过将所述目标训练数据的特征向量乘以对应通道的权重,得到目标特征向量。
7.如权利要求1所述的基于道路历史数据的车流量预测方法,其特征在于,所述利用目标训练数据和目标特征向量,使用支持向量机进行训练,得到预测模型,包括:
通过|wTx+b|/||w||计算点到分隔面的法线或垂线的长度;
通过优化目标函数对分类器进行优化,寻找最大间隔;
使用SMO算法进行求解,得到分隔超平面;
其中,wTx+b为分类器;wT和w为向量;b为常数。
8.如权利要求7所述的基于道路历史数据的车流量预测方法,其特征在于,所述通过优化目标函数对分类器进行优化,寻找最大间隔,包括:
将目标训练数据输入分类器,得到类别标签;
使用单位阶跃函数对wTx+b作用,得到f(wTx+b);
通过label×(wTx+b)计算间隔,得到具有最小间隔的所述目标训练数据的车流量数据样本点;
使用优化目标函数对所述具有最小间隔的车流量数据样本点进行优化,得到具有最大化间隔的车流量数据样本点;
其中,C为常数,用于控制“最大化间隔”的车流量数据样本点的权重;
Labe为类别标签,所述类别标签使用-1和+1表示;
所述w为向量,b为常数;
m为样本数量,α为优化变量。
9.一种基于道路历史数据的车流量预测系统,其特征在于,包括:
存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-8任意一项所述的基于道路历史数据的车流量预测方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-8任意一项所述的基于道路历史数据的车流量预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211648508.3A CN116052416A (zh) | 2022-12-21 | 2022-12-21 | 基于道路历史数据的车流量预测方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211648508.3A CN116052416A (zh) | 2022-12-21 | 2022-12-21 | 基于道路历史数据的车流量预测方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116052416A true CN116052416A (zh) | 2023-05-02 |
Family
ID=86112436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211648508.3A Pending CN116052416A (zh) | 2022-12-21 | 2022-12-21 | 基于道路历史数据的车流量预测方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116052416A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117523850A (zh) * | 2024-01-08 | 2024-02-06 | 浙江浙商互联信息科技有限公司 | 一种高速服务区短时拥堵预测方法与系统 |
-
2022
- 2022-12-21 CN CN202211648508.3A patent/CN116052416A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117523850A (zh) * | 2024-01-08 | 2024-02-06 | 浙江浙商互联信息科技有限公司 | 一种高速服务区短时拥堵预测方法与系统 |
CN117523850B (zh) * | 2024-01-08 | 2024-03-29 | 浙江浙商互联信息科技有限公司 | 一种高速服务区短时拥堵预测方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106971194B (zh) | 一种基于改进hmm和svm双层算法的驾驶意图识别方法 | |
CN101630376B (zh) | 多模型神经网络的生物发酵过程软测量建模方法及软仪表 | |
CN111160311A (zh) | 基于多注意力机制双流融合网络的黄河冰凌语义分割方法 | |
CN111783844B (zh) | 基于深度学习的目标检测模型训练方法、设备及存储介质 | |
CN111881958B (zh) | 车牌分类识别方法、装置、设备及存储介质 | |
CN105654102A (zh) | 数据处理装置及数据处理方法 | |
CN110119768B (zh) | 用于车辆定位的视觉信息融合系统及方法 | |
CN116052416A (zh) | 基于道路历史数据的车流量预测方法、系统及存储介质 | |
WO2020000191A1 (en) | Method for driver identification based on car following modeling | |
CN112046489A (zh) | 一种基于因子分析和机器学习的驾驶风格辨识算法 | |
CN115742855A (zh) | 电动汽车剩余里程预测方法、装置、电动汽车及介质 | |
CN114898327A (zh) | 一种基于轻量化深度学习网络的车辆检测方法 | |
CN108171365B (zh) | 一种基于改进svm算法的交通状态预测方法 | |
CN114240687A (zh) | 一种适用于综合能源系统的能源托管效率分析方法 | |
Bi et al. | Critical direction projection networks for few-shot learning | |
CN117113086A (zh) | 一种储能机组负荷预测方法、系统、电子设备及介质 | |
CN112149896A (zh) | 一种基于注意力机制的机械设备多工况故障预测方法 | |
CN115794805B (zh) | 一种中低压配网量测数据补齐方法 | |
CN106650814A (zh) | 一种基于车载单目视觉室外道路自适应分类器生成方法 | |
CN115034812B (zh) | 基于大数据的钢铁行业销售量预测方法及装置 | |
CN113792794A (zh) | 一种基于膜算法的特征选择方法 | |
Kaushik et al. | Software cost estimation using lstm-rnn | |
US20230386190A1 (en) | Modeling disjoint manifolds | |
Igneczi et al. | A Linear Driver Model of Local Path Planning for Lane Driving | |
Anjitha et al. | Road segmentation from satellite images using FCNN for autonomous driving vehicles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |