CN111754775A - 一种基于特征重构误差的交通流量预测方法 - Google Patents
一种基于特征重构误差的交通流量预测方法 Download PDFInfo
- Publication number
- CN111754775A CN111754775A CN202010634989.7A CN202010634989A CN111754775A CN 111754775 A CN111754775 A CN 111754775A CN 202010634989 A CN202010634989 A CN 202010634989A CN 111754775 A CN111754775 A CN 111754775A
- Authority
- CN
- China
- Prior art keywords
- feature
- training
- traffic flow
- machine learning
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于特征重构误差的交通流量预测方法,属于机器学习技术领域,包括:(1)选择目标机器学习网络,初始化目标机器学习网络的参数;(2)构建交通流量的训练数据集,初始化特征校正权值矩阵的参数;(3)利用训练数据集对特征校正权值矩阵进行训练,训练过程使用随机梯度下降算法和特征重构误差损失函数;(4)固定特征校正权值矩阵参数,对目标机器学习网络进行训练,训练过程使用随机梯度下降算法;(5)重复步骤(3)和步骤(4),直至损失函数收敛或达到最大训练步数;(6)训练结束,将待预测的交通流量数据输入训练好的网络模型,得到预测的交通流量。利用本发明,可以增强模型在进行交通流量预测的稳定性。
Description
技术领域
本发明属于机器学习技术领域,尤其是涉及一种基于特征重构误差的 交通流量预测方法。
背景技术
基于神经网络的交通流量预测模型的训练过程要求数据样本遵循独 立同分布假设(i.i.d假设),即训练和测试数据集是从相同的数据分布中 采样得到的。在i.i.d假设下,训练好的模型可以直接应用到测试数据集 上,并能够获得与训练数据集上相当的效果。这种方法虽然在许多研究性 公开数据集中被证明是非常成功的,但在实际应用中是存在缺陷的。其原 因是在实际应用中普遍存在的数据选择偏差,即无法保证训练或测试样本是完全随机采样得到的。因此,在测试数据分布未知的工业应用中,无法 保证训练数据和未知的测试数据具有相同的分布。而在存在数据选择偏差 的训练数据集上训练得到的模型,为了获得更低的训练损失,会倾向于拟 合训练数据中特征间的统计相关性。这直接导致了模型在不存在这种相关 性的测试数据集上的性能不稳定。
解决上述数据选择偏差导致的模型不稳定问题有多条技术路径。其中 一种比较直接的方式是利用测试数据分布的先验知识,如Minghao Chen 等人2020年发表在《TheThirty-Fourth AAAI Conference on Artificial Intelligence》(AAAI’20)上的《Adversarial-learned loss for domain adaptation》。 该工作利用测试数据分布的先验知识,在模型训练时,修正训练数据的分 布。由于交通流量预测任务中测试数据的分布信息是无法提前知晓的,使 得这些需要数据分布先验的工作不可行。
另外一些工作尝试通过改变各训练样本在训练过程中的权重来解决 上述问题,如Kun Kuang等人2020年发表在《The Thirty-Fourth AAAI Conference on ArtificialIntelligence》(AAAI’20)上的《Stable Prediction with Model Misspecification andAgnostic Distribution Shift》。该工作通过改变 训练样本权重来修正数据选择偏差导致的出现频次少的特征模式被忽略 的问题。这些通过改变训练样本权重的工作,需要维护一个与样本个数相 同大小的权值矩阵,使得其在大规模工业应用中的计算、空间复杂度很大, 因此这些工作在交通流量预测工业应用中的可行性较低。
发明内容
本发明提供了一种基于特征重构误差的交通流量预测方法,可以增强 模型在进行交通流量预测的稳定性。
一种基于特征重构误差的交通流量预测方法,包括以下步骤:
(1)选择目标机器学习网络,初始化目标机器学习网络的参数;
(2)构建交通流量的训练数据集,初始化特征校正权值矩阵的参数, 所述特征校正权值矩阵的大小为W∈Rp×p,p为输入神经网络的数据样本 特征维度;
(3)利用训练数据集对特征校正权值矩阵进行训练,训练过程使用 随机梯度下降算法和特征重构误差损失函数;
(4)固定特征校正权值矩阵参数,对目标机器学习网络进行训练, 训练过程使用随机梯度下降算法;
(5)重复步骤(3)和步骤(4),直至损失函数收敛或达到最大训 练步数;
(6)训练结束,将待预测的交通流量数据输入训练好的网络模型, 得到预测的交通流量。
本发明的方法,利用训练样本特征间的重构误差学习得到特征间的相 关性系数。并利用该系数,在训练网络模型过程中抑制由数据选择偏差导 致的特征间统计相关性对模型训练的影响,从而提高模型应用时,预测效 果稳定性。
步骤(1)中,目标机器学习网络可以为大部分的深度神经网络模型 如时空图网络(ST-GCN),亦可以是线性机器学习网络如最小二乘网络(OLE)。
本发明以最小二乘网络为例,所述目标机器学习网络采用线性机器学 习网络中的最小二乘网络,参数的初始化由高斯分布采样得到。
步骤(2)中,所述的训练数据集中,各样本特征由因果特征S和无 关特征V两部分组成,其中,S表示与目标真值存在因果关系的特征,V 表示与目标真值不存在因果关系的特征。
特征校正权值矩阵的大小由输入样本特征维度决定,初始化的参数由 高斯分布中采样得到。
步骤(3)中,对特征校正权值矩阵进行训练,通过训练样本特征间 的重构关系,构建特征间的因果关系图。
所述的特征重构误差损失函数为:
式中,p表示特征维度、n表示训练样本总数、W∈Rp×p表示特征校 正权值矩阵,其中Xi,-j表示第i个样本除去第j维特征剩余所有特征组成的 矩阵,Wj,-j表示第j行除去第j列权值剩余所有权值组成的矩阵。
步骤(4)中,若目标机器学习网络采用最小二乘网络,则训练的损 失函数如下:
其中,Yi表示样本i对应的真值,Xi表示样本i的特征表达,β表示最小 二乘网络的参数,n表示训练样本总数,Wr表示步骤(3)中训练得到的特 征校正权值矩阵;Xiβ是基础网络的原始输出,(XiWr)β是使用特征校正 权值矩阵对输入特征修正后的网络输出。
与现有技术相比,本发明具有以下有益效果:
1、与需要数据分布先验知识的域适应和迁移学习为基础的方法相比, 本发明能够用于测试数据不可知的交通流量预测,同时也可以应用于其它 测试数据不可知的工业场景。
2、与基于训练样本权重的先前方法相比,本发明所需参数量与样本 量无关,在大规模数据场景下计算、空间复杂度更小,模型预测更稳定。
附图说明
图1为本发明一种基于特征重构误差的交通流量预测方法的流程示意 图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细描述,需要指出的是, 以下所述实施例旨在便于对本发明的理解,而对其不起任何限定作用。
如图1所示,一种基于特征重构误差的交通流量预测方法,包括:
S01,初始化目标机器学习网络参数。
目标机器学习网络可以是大部分常用的深度神经网络模型如时空图 网络(ST-GCN),亦可以是线性机器学习网络如最小二乘网络(OLE)。
本实施例以最小二乘网络(OLE)作为基础网络进行交通流量预测为例。 同时,模型参数的初始化由高斯分布采样得到。
S02,初始化特征校正权值矩阵参数W,其中W∈Rp×p即矩阵的大小 由输入样本特征维度决定。初始化参数由高斯分布中采样得到。
S03,利用训练数据集对特征校正权值矩阵进行训练,训练过程使用 随机梯度下降算法和本发明中提出的如下特征重构误差损失函数:
该损失函数中p表示特征维度、n表示训练样本总数、W∈Rp×p表示 特征校正权值矩阵。其中Xi,-j表示第i个样本的特征向量除去第j维特征剩 余所有特征组成的矩阵,Wj,-j表示权值矩阵的第j行除第j列外所有权值组 成的矩阵。
S04,固定特征校正权值矩阵参数,对目标机器学习网络进行训练, 训练过程使用随机梯度下降算法,损失函数如下:
其中,Yi表示样本i对应的真值,Xi表示样本i的特征表达,β表示OLE 网络的参数,n表示训练样本总数,Wr表示S03中得到的特征校正权值矩 阵。
S06训练结束,使用训练得到的模型进行交通流量预测应用。
为验证本发明方法的有效性,本发明在发表在《The Thirty-Fourth AAAIConference on Artificial Intelligence》(AAAI’20)上的《Stable prediction withmodel misspecification and agnostic distribution》的数据集DDWR上与目 前最前沿的稳定机器学习方法进行对比。同时,《Stable prediction with model misspecificationand agnostic distribution》中提出的方法(DWR)是 目前最前沿的稳定机器学习方法。因此,在DDWR中DWR方法比较保证了 实验的公平性和合理性。数据集DDWR中各样本特征由因果特征S和无关特 征V两部分组成,其中S表示与目标真值存在因果关系的特征集,V表示与目标真值不存在因果关系的特征集。DDWR根据因果特征和无关特征间的 因果关系分为三个子数据集包括S⊥V、S→V、S←V三种,其中S⊥V表 示S特征与V特征间无本质上的相关性,S→V表示V特征值部分或完全 取决于S特征值,S←V表示S特征值部分或完全取决于V特征值。
同时,为了考察模型在不同非线性情况下的效果,各子数据集中包括 了多项式函数和指数函数两种真值生成函数生成的样本。为了模拟实际应 用中的数据生成偏差,DDWR利用数据选择偏差参数r来改变具有某种特征 的样本被选择到数据集的概率,模拟了模型学得的特征间因果关系受到数 据选择偏差导致的统计相关性干扰的情况。DDWR测试数据集由r∈[-3,-2,-1.7,-1.5,-1.3,1.3,1.5,1.7,2,3]的10个不同数据分布的子测 试集构成,因此我们通过测试神经网络模型在10个子测试集中的平均稳 定程度来评价方法的有效性。
在DDWR数据集上本发明主要在三个指标上进行对比,包括目标机器 学习网络对无关特征参数估计误差β_v_error,不同配置的测试子数据集 上的平均预测误差AE和预测方差SE。其中AE、SE发表在《The Thirty-Fourth AAAI Conference on ArtificialIntelligence》(AAAI’20)上的 《Stable prediction with model misspecification andagnostic distribution》。
本发明与三个不同的基准线模型进行了比较,包括常用的线性回归方 法最小二乘网络(OLE)、最小绝对值收敛和选择算子(Lasso)、岭回归 (Ridge)。同时,与目前最前沿的稳定学习方法DWR(发表在《The Thirty-Fourth AAAI Conference on ArtificialIntelligence》(AAAI’20)上的 《Stable prediction with model misspecification andagnostic distribution》) 进行了比较。本发明的方法与DWR均利用OLE模型作为基础网络模型搭 建。
在DDWR数据集中,非线性函数为多项式函数(Y=Ypoly)的样本集 上的评测结果如表1所示:
表1
其中,Y=Ypoly表示真值由样本特征通过多项式函数算得。该数据集 的训练样本量n=2000,样本特征维度p=20,训练数据集中样本特征间统 计相关性系数r=1.7。测试数据集由n=2000,p=20, r∈[-3,-2,-1.7,-1.5,-1.3,1.3,1.5,1.7,2,3]的10个不同配置的子测试集 构成。各组实验分别重复了50次,每次实验中均重新生成了训练数据集, 但使用相同的测试数据集。可以看出,在所有实验中,本发明方法在 β_v_error和SE上,均超过了其他方法。
在DDWR数据集中,非线性函数为指数函数的样本上的评测结果如表2 所示:
表2
其中,Y=Yexp表示真值由样本特征通过指数函数算得。该数据集的 训练样本量n=2000,样本特征维度p=20,训练数据集中样本特征间统计 相关性系数r=1.7。测试数据集由n=2000,p=20, r∈[-3,-2,-1.7,-1.5,-1.3,1.3,1.5,1.7,2,3]的10个不同配置的子测试集 构成。各组实验分别重复了50次,每次实验中均重新生成了训练数据集, 但使用相同的测试数据集。可以看出,在所有实验中,本发明方法在 β_v_error和SE上,均超过了其他方法。
另外,在DDWR数据集上的S⊥V子集上进行了n、p、r变化的稳定性 评测实验,该数据真值使用Y=Yexp生成,结果如表3所示:
表3
其中n表示训练数据集样本总数,p表示样本的特征维度,r表示训 练数据集上的特征间统计相关性系数,系数越大表示统计相关性越强。各 组实验中测试数据集的n和p值与训练数据集相同, r∈[-3,-2,-1.7,-1.5,-1.3,1.3,1.5,1.7,2,3]。各组实验分别重复了50次, 每次实验中均重新生成了训练数据集,但使用相同的测试数据集。
表中,Scenario 1对比了本发明方法与其他方法在不同n值时的效果, Scenario2对比了本发明方法与其他方法在不同p值时的效果,Scenario 3 对比了本发明方法与其他方法在不同r值时的效果。可以看出,在所有实 验中,本发明方法在β_v_error和SE上,均超过了其他方法。
以上所述的实施例对本发明的技术方案和有益效果进行了详细说明, 应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡 在本发明的原则范围内所做的任何修改、补充和等同替换,均应包含在本 发明的保护范围之内。
Claims (8)
1.一种基于特征重构误差的交通流量预测方法,其特征在于,包括以下步骤:
(1)选择目标机器学习网络,初始化目标机器学习网络的参数;
(2)构建交通流量的训练数据集,初始化特征校正权值矩阵的参数,所述特征校正权值矩阵的大小为W∈Rp×p,p为输入神经网络的数据样本特征维度;
(3)利用训练数据集对特征校正权值矩阵进行训练,训练过程使用随机梯度下降算法和特征重构误差损失函数;
(4)固定特征校正权值矩阵参数,对目标机器学习网络进行训练,训练过程使用随机梯度下降算法;
(5)重复步骤(3)和步骤(4),直至损失函数收敛或达到最大训练步数;
(6)训练结束,将待预测的交通流量数据输入训练好的网络模型,得到预测的交通流量。
2.根据权利要求1所述的基于特征重构误差的交通流量预测方法,其特征在于,步骤(1)中,所述目标机器学习网络采用深度学习网络或线性机器学习网络。
3.根据权利要求1所述的基于特征重构误差的交通流量预测方法,其特征在于,步骤(1)中,所述目标机器学习网络采用线性机器学习网络中的最小二乘网络,参数的初始化由高斯分布采样得到。
4.根据权利要求1所述的基于特征重构误差的交通流量预测方法,其特征在于,步骤(2)中,所述的训练数据集中,各样本特征由因果特征S和无关特征V两部分组成,其中,S表示与目标真值存在因果关系的特征,V表示与目标真值不存在因果关系的特征。
5.根据权利要求1所述的基于特征重构误差的交通流量预测方法,其特征在于,步骤(2)中,特征校正权值矩阵的大小由输入样本特征维度决定,初始化的参数由高斯分布中采样得到。
6.根据权利要求1所述的基于特征重构误差的交通流量预测方法,其特征在于,步骤(3)中,对特征校正权值矩阵进行训练,通过训练样本特征间的重构关系,构建特征间的因果关系图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010634989.7A CN111754775B (zh) | 2020-07-03 | 2020-07-03 | 一种基于特征重构误差的交通流量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010634989.7A CN111754775B (zh) | 2020-07-03 | 2020-07-03 | 一种基于特征重构误差的交通流量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111754775A true CN111754775A (zh) | 2020-10-09 |
CN111754775B CN111754775B (zh) | 2021-05-25 |
Family
ID=72679356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010634989.7A Active CN111754775B (zh) | 2020-07-03 | 2020-07-03 | 一种基于特征重构误差的交通流量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111754775B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819253A (zh) * | 2021-03-02 | 2021-05-18 | 华东师范大学 | 一种无人机避障和路径规划装置及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492814A (zh) * | 2018-11-15 | 2019-03-19 | 中国科学院深圳先进技术研究院 | 一种城市交通流量预测方法、系统及电子设备 |
CN110210644A (zh) * | 2019-04-17 | 2019-09-06 | 浙江大学 | 基于深度神经网络集成的交通流量预测方法 |
CN110647917A (zh) * | 2019-08-23 | 2020-01-03 | 北京大学 | 一种模型复用方法与系统 |
WO2020010717A1 (zh) * | 2018-07-13 | 2020-01-16 | 南京理工大学 | 一种基于时空相关性的短时交通流预测方法 |
CN110825900A (zh) * | 2019-11-07 | 2020-02-21 | 重庆紫光华山智安科技有限公司 | 特征重构层的训练方法、图像特征的重构方法及相关装置 |
-
2020
- 2020-07-03 CN CN202010634989.7A patent/CN111754775B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020010717A1 (zh) * | 2018-07-13 | 2020-01-16 | 南京理工大学 | 一种基于时空相关性的短时交通流预测方法 |
CN109492814A (zh) * | 2018-11-15 | 2019-03-19 | 中国科学院深圳先进技术研究院 | 一种城市交通流量预测方法、系统及电子设备 |
CN110210644A (zh) * | 2019-04-17 | 2019-09-06 | 浙江大学 | 基于深度神经网络集成的交通流量预测方法 |
CN110647917A (zh) * | 2019-08-23 | 2020-01-03 | 北京大学 | 一种模型复用方法与系统 |
CN110825900A (zh) * | 2019-11-07 | 2020-02-21 | 重庆紫光华山智安科技有限公司 | 特征重构层的训练方法、图像特征的重构方法及相关装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819253A (zh) * | 2021-03-02 | 2021-05-18 | 华东师范大学 | 一种无人机避障和路径规划装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111754775B (zh) | 2021-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cai et al. | Adaptive thresholding for sparse covariance matrix estimation | |
Joglekar et al. | Comprehensive and reliable crowd assessment algorithms | |
Guimarães et al. | Complex correntropy function: properties, and application to a channel equalization problem | |
Mohammad et al. | Complexity-scalable neural-network-based MIMO detection with learnable weight scaling | |
CN113240105B (zh) | 一种基于图神经网络池化的电网稳态判别方法 | |
CN111754775B (zh) | 一种基于特征重构误差的交通流量预测方法 | |
Zhang et al. | Synchronization in fixed/preassigned-time of delayed fully quaternion-valued memristive neural networks via non-separation method | |
Nemtsov et al. | Matrix compression using the Nyström method | |
Bogdan et al. | Pattern recovery by SLOPE | |
Lawrence et al. | Explaining neural matrix factorization with gradient rollback | |
Collins et al. | In-Context Learning with Transformers: Softmax Attention Adapts to Function Lipschitzness | |
CN111343115B (zh) | 一种5g通信调制信号识别方法及系统 | |
Pimentel-Alarcón et al. | Low algebraic dimension matrix completion | |
Xu et al. | An efficient kernel-based nonlinear regression method for two-class classification | |
Marušić et al. | Least squares fitting the three-parameter inverse Weibull density | |
Silva et al. | A Michigan-like immune-inspired framework for performing independent component analysis over Galois fields of prime order | |
Khaleghi et al. | Nonparametric multiple change point estimation in highly dependent time series | |
Li et al. | A BYY scale-incremental EM algorithm for Gaussian mixture learning | |
Feng et al. | Energy-efficient and robust cumulative training with net2net transformation | |
Neininger et al. | Probabilistic Analysis of the Dual-Pivot Quicksort “Count” | |
Tod et al. | Discovering PDEs from Multiple Experiments | |
Zainuddin et al. | A comparative study of missing value estimation methods: Which method performs better? | |
Dickhaus et al. | Binary classification with pFDR‐pFNR losses | |
Othman et al. | A new criteria for comparing neural networks and Bayesian classifier | |
Jwo et al. | An Empirical Investigation of Transfer Effects for Reinforcement Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |