CN106372765B - 一种基于融合数据的高速公路气象站数据修复方法 - Google Patents

一种基于融合数据的高速公路气象站数据修复方法 Download PDF

Info

Publication number
CN106372765B
CN106372765B CN201611076791.1A CN201611076791A CN106372765B CN 106372765 B CN106372765 B CN 106372765B CN 201611076791 A CN201611076791 A CN 201611076791A CN 106372765 B CN106372765 B CN 106372765B
Authority
CN
China
Prior art keywords
data
matrix
model
meteorological
traffic flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611076791.1A
Other languages
English (en)
Other versions
CN106372765A (zh
Inventor
张健
李林超
冉斌
张小丽
洪阳
李汉初
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201611076791.1A priority Critical patent/CN106372765B/zh
Publication of CN106372765A publication Critical patent/CN106372765A/zh
Application granted granted Critical
Publication of CN106372765B publication Critical patent/CN106372765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于融合数据的高速公路气象站数据修复方法,包括如下步骤:(1)从相应的气象检测设备和交通流检测设备中提取气象数据和交通流数据,并对数据进行时间和空间维度的匹配;将获取的气象数据和交通流数据合并,得到数据矩阵X;(2)从数据矩阵中筛选出缺失数据;(3)对数据进行修复建模;(4)对数据进行修复;(5)数据反归一化;将反归一化结果数据插入到矩阵X的相应位置,得到完整的数据矩阵。本发明的有益效果为:充分利用多源数据信息,包括缺失数据后数据的信息,对缺失数据进行修正;考虑天气因素和交通流的协同影响作用,提高修复精度;算法简单明了,能够满足实时处理的要求。

Description

一种基于融合数据的高速公路气象站数据修复方法
技术领域
本发明涉及交通气象技术领域,尤其是一种基于融合数据的高速公路气象站数据修复方法。
背景技术
随着高速公路的快速发展,智能交通技术日益受到国内外研究人员的高度重视,大量的数据是其发展的基础,其中高速公路气象数据是智能交通系统中重要的数据之一。目前高速公路管理部门主要通过安装在高速公路上的气象检测设备获取大量的气象数据,然而检测设备由于通信、通电等原因常常发生数据缺失的问题,为后续的数据挖掘带来较大困难。
现有技术中,气象数据修复采用的方法包括时间序列及神经网络等各种智能算法,然而,这些算法不能够充分挖掘数据信息,并且多为单一的气象数据源,缺乏考虑气象因素与交通流的协同影响作用,不能够满足智能交通系统的发展要求。
发明内容
本发明所要解决的技术问题在于,提供一种基于融合数据的高速公路气象站数据修复方法,可以准确的填充高速公路气象站数据中的缺失数据,提高修复精度,满足实时处理的要求。
为解决上述技术问题,本发明提供一种基于融合数据的高速公路气象站数据修复方法,包括如下步骤:
(1)从相应的气象检测设备和交通流检测设备中提取气象数据和交通流数据,并对数据进行时间和空间维度的匹配;将获取的气象数据和交通流数据合并,得到数据矩阵X;
(2)从数据矩阵中筛选出缺失数据;
(3)对数据进行修复建模;
(4)对数据进行修复;
(5)数据反归一化;将反归一化结果数据插入到矩阵X的相应位置,得到完整的数据矩阵。
优选的,步骤(1)中,对数据进行时间维度匹配,选取时间间隔,将两种数据进行转换,使两种数据具有相同的时间间隔,时间间隔取两种不同数据的时间间隔的公倍数;进行空间维度匹配,提取获取的气象检测设备的经纬度(lone,lae),提取交通流检测设备的经纬度(lont,lat),根据下式获取距离气象检测设备最近的交通流检测设备,完成空间维度的匹配;
式中:t表示交通流检测设备的编号;将获取的气象数据和交通流数据合并,得到数据矩阵X。
优选的,步骤(2)中,对缺失气象数据筛选的具体步骤为:设数据矩阵其中该矩阵包含m行n列,其中m行表示时间段的个数,n列为相应的气象数据和交通流数据,表示第i列第j行的数据。从数据矩阵中筛选出缺失数据,将第i列第j行的缺失数据定义为xij
优选的,步骤(3)中,对气象数据修复建模的具体步骤为:
(a)记录缺失数据所在行的编号集合M,将其从数据矩阵X中提取出来为数据矩阵Xmiss,其余数据组成新的数据矩阵X′,然后将矩阵进行归一化处理;针对数据矩阵X′,随机产生30%的气象缺失数据,记录缺失数据所在行的编号集合M′,将其从数据矩阵X′中提取出来构成新的数据矩阵为X′test,剩余数据矩阵为X′train
(b)基于支持向量回归模型和数据矩阵X′train分别建立各项气象数据与交通流数据的支持向量回归方程,包括模型一:湿度与流量、速度、占有率的回归方程;模型二:风速与湿度、流量、速度、占有率的回归方程;模型三:降雨量与风速、湿度、流量、速度、占有率的回归方程;模型四:温度与湿度、风速、降雨量、速度、流量、占有率的回归方程;
(c)将集合X′test中对应变量的数据依次带入到模型一、二、三、四中计算气象数据的数值,得到气象数据矩阵Y={yij},并将数据按照其时间位置插入到数据矩阵X′train中得到数据矩阵X″train
(d)对数据矩阵X″train,按照时间进行降序排列,得到数据矩阵X″′train和缺失数据编号集合M″;利用支持向量回归模型和数据矩阵X″′train分别建立各项气象数据与交通流数据的支持向量回归方程,包括模型五:湿度与流量、速度、占有率的回归方程;模型六:风速与湿度、流量、速度、占有率的回归方程;模型七:降雨量与风速、湿度、流量、速度、占有率的回归方程;模型八:温度与湿度、风速、降雨量、速度、流量、占有率的回归方程;
(e)将集合M″中的数据依次带入到模型五、六、七、八中计算缺失的气象数据,得到数据矩阵Y′={y′ij};
(f)设数据矩阵X′test中气象数据矩阵为利用最小二乘原理求解下式中的参数a、b、∈:
优选的,步骤(4)中,对数据进行修复的具体步骤为:将数据矩阵Xmiss归一化,其公式如下:
上式中X1为归一化序列,Xmin和Xmax分别为归一化序列中的最小值和最大值,Xnorm为归一化结果;利用模型一、二、三、四求得数据矩阵利用模型五、六、七、八求得数据矩阵缺失数据通过下式求得:
优选的,步骤(5)中,数据反归一化的具体步骤为:
上式中,为待反归一化序列,分别为待反归一化序列中的最大值和最小值,X2为反归一化结果;将反归一化结果数据插入到矩阵X的相应位置,得到完整的数据矩阵。
本发明的有益效果为:充分利用多源数据信息,包括缺失数据后数据的信息,对缺失数据进行修正;考虑天气因素和交通流的协同影响作用,提高修复精度;算法简单明了,能够满足实时处理的要求。
附图说明
图1是本发明的方法流程示意图。
具体实施方式
如图1所示,一种基于融合数据的高速公路气象站数据修复方法,包括如下步骤:
(1)从相应的气象检测设备和交通流检测设备中提取气象数据和交通流数据,并对数据进行时间和空间维度的匹配。
首先完成时间维度匹配,选取时间间隔,将两种数据进行转换,使两种数据具有相同的时间间隔。
所述的时间间隔应取两种不同数据的时间间隔的公倍数。
然后完成空间维度匹配,提取获取气象检测设备的经纬度(lone,lae),提取交通流检测设备的经纬度(lont,lat),根据下式:
获取距离气象检测设备最近的交通流检测设备,完成空间维度的匹配。式中:t表示交通流检测设备的编号。
最后将获取的气象数据和交通流数据合并,得到数据矩阵X。
(2)缺失气象数据筛选
设数据矩阵其中该矩阵包含m行n列,其中m行表示时间段的个数,n列为相应的气象数据和交通流数据,表示第i列第j行的数据。从数据矩阵中筛选出缺失数据,将第i列第j行的缺失数据定义为xij
(3)气象数据修复建模
3.1记录缺失数据所在行的编号集合M,将其从数据矩阵X中提取出来为数据矩阵Xmiss,其余数据组成新的数据矩阵X′,然后将矩阵进行归一化处理。针对数据矩阵X′,随机产生30%的气象缺失数据,记录缺失数据所在行的编号集合M′,将其从数据矩阵X′中提取出来构成新的数据矩阵为X′test,剩余数据矩阵为X′train
3.2基于支持向量回归模型和数据矩阵X′train分别建立各项气象数据与交通流数据的支持向量回归方程,包括模型一:湿度与流量、速度、占有率的回归方程;模型二:风速与湿度、流量、速度、占有率的回归方程;模型三:降雨量与风速、湿度、流量、速度、占有率的回归方程;模型四:温度与湿度、风速、降雨量、速度、流量、占有率的回归方程。
所用到的支持向量回归模型通过以下步骤建立:
考虑给定n个学习样本(Xi,yi),模型的目标为求解f(x)=(W⊙X)+b。
式中b∈R,⊙表示向量的内积,优化目标为
L(Xi)=g(yi-f(Xi))
常用的损失函数L(Xi)包括二次函数,Huber函数和ε-不敏感函数等。本模型选用ε-不敏感函数作为损失函数。
如果预测值f(x)与实际值y之间的误差小于ε则损失函数为0,否则会产生一个与误差相关联的线性代价。
(W,b)应满足:
式中反映了回归函数f的泛化能力,C表示惩罚因子。如果|yi-f(Xi)-b|≤ε成立,即所有样本损失函数都为0,则有R(f)=0,因此:
显然,约束条件无法同时满足,此时需引入松弛因子ξi≥0和ξ′i≥0,此时优化问题转化为:
引入参数αi,α′i,ηi,η′i≥0,构造拉格朗日函数求解上述优化问题:
考虑上式中W,b,ηi,η′i取极小值,因此对L关于W,b,ξi,ξ′i求偏导,并令其偏导数为0:
根据上式,得到对偶优化问题:
对于非线性问题,引入核函数K(Xi,Xj)代替样本向量的内积,可以实现从空间到特征空间的映射,并使得低维数据空间的非线性问题转化为高维空间的线性问题:
根据Karush-Kuhn-Tucker(KTT)最优化条件,对上式进行求解得到:
其他参数可一一获取。
3.3将集合X′test中对应变量的数据依次带入到模型一、二、三、四中计算气象数据的数值,得到气象数据矩阵Y={yij},并将数据按照其时间位置插入到数据矩阵X′train中得到数据矩阵X″train
3.4对数据矩阵X″train,按照时间进行降序排列,得到数据矩阵X″′train和缺失数据编号集合M″。利用支持向量回归模型和数据矩阵X″′train分别建立各项气象数据与交通流数据的支持向量回归方程,包括模型五:湿度与流量、速度、占有率的回归方程;模型六:风速与湿度、流量、速度、占有率的回归方程;模型七:降雨量与风速、湿度、流量、速度、占有率的回归方程;模型八:温度与湿度、风速、降雨量、速度、流量、占有率的回归方程。
3.5将集合M″中的数据依次带入到模型五、六、七、八中计算缺失的气象数据,得到数据矩阵Y′={y′ij}。
3.6设数据矩阵X′test中气象数据矩阵为利用最小二乘原理求解下式中的参数a、b、∈:
步骤(4)数据修复
将数据矩阵Xmiss归一化,其公式如下:
上式中X1为归一化序列,Xmin和Xmax分别为归一化序列中的最小值和最大值,Xnorm为归一化结果。
利用模型一、二、三、四求得数据矩阵利用模型五、六、七、八求得数据矩阵缺失数据可通过下式求得:
(5)数据反归一化
上式中,为待反归一化序列,分别为待反归一化序列中的最大值和最小值,X2为反归一化结果。
尽管本发明就优选实施方式进行了示意和描述,但本领域的技术人员应当理解,只要不超出本发明的权利要求所限定的范围,可以对本发明进行各种变化和修改。

Claims (5)

1.一种基于融合数据的高速公路气象站数据修复方法,其特征在于,包括如下步骤:
(1)从相应的气象检测设备和交通流检测设备中提取气象数据和交通流数据,并对数据进行时间和空间维度的匹配;将获取的气象数据和交通流数据合并,得到数据矩阵X;
(2)从数据矩阵中筛选出缺失数据;
(3)对数据进行修复建模;对气象数据修复建模的具体步骤为:
(a)记录缺失数据所在行的编号集合M,将其从数据矩阵X中提取出来为数据矩阵Xmiss,其余数据组成新的数据矩阵X′,然后将矩阵进行归一化处理;针对数据矩阵X′,随机产生30%的气象缺失数据,记录缺失数据所在行的编号集合M′,将其从数据矩阵X′中提取出来构成新的数据矩阵为X′test,剩余数据矩阵为X′train
(b)基于支持向量回归模型和数据矩阵X′train分别建立各项气象数据与交通流数据的支持向量回归方程,包括模型一:湿度与流量、速度、占有率的回归方程;模型二:风速与湿度、流量、速度、占有率的回归方程;模型三:降雨量与风速、湿度、流量、速度、占有率的回归方程;模型四:温度与湿度、风速、降雨量、速度、流量、占有率的回归方程;
(c)将集合X′test中对应变量的数据依次带入到模型一、二、三、四中计算气象数据的数值,得到气象数据矩阵Y={yij},并将数据按照其时间位置插入到数据矩阵X′train中得到数据矩阵X″train
(d)对数据矩阵X″train,按照时间进行降序排列,得到数据矩阵X″′train和缺失数据编号集合M″;利用支持向量回归模型和数据矩阵X″′train分别建立各项气象数据与交通流数据的支持向量回归方程,包括模型五:湿度与流量、速度、占有率的回归方程;模型六:风速与湿度、流量、速度、占有率的回归方程;模型七:降雨量与风速、湿度、流量、速度、占有率的回归方程;模型八:温度与湿度、风速、降雨量、速度、流量、占有率的回归方程;
(e)将集合M″中的数据依次带入到模型五、六、七、八中计算缺失的气象数据,得到数据矩阵Y′={y′ij};
(f)设数据矩阵X′test中气象数据矩阵为利用最小二乘原理求解下式中的参数a、b、∈:
(4)对数据进行修复;
(5)数据反归一化;将反归一化结果数据插入到矩阵X的相应位置,得到完整的数据矩阵。
2.如权利要求1所述的基于融合数据的高速公路气象站数据修复方法,其特征在于,步骤(1)中,对数据进行时间维度匹配,选取时间间隔,将两种数据进行转换,使两种数据具有相同的时间间隔,时间间隔取两种不同数据的时间间隔的公倍数;进行空间维度匹配,提取获取的气象检测设备的经纬度(lone,lae),提取交通流检测设备的经纬度(lont,lat),根据下式获取距离气象检测设备最近的交通流检测设备,完成空间维度的匹配;
式中:t表示交通流检测设备的编号;将获取的气象数据和交通流数据合并,得到数据矩阵X。
3.如权利要求1所述的基于融合数据的高速公路气象站数据修复方法,其特征在于,步骤(2)中,对缺失气象数据筛选的具体步骤为:设数据矩阵其中该矩阵包含m行n列,其中m行表示时间段的个数,n列为相应的气象数据和交通流数据,表示第i列第j行的数据;从数据矩阵中筛选出缺失数据,将第i列第j行的缺失数据定义为xij
4.如权利要求1所述的基于融合数据的高速公路气象站数据修复方法,其特征在于,步骤(4)中,对数据进行修复的具体步骤为:将数据矩阵Xmiss归一化,其公式如下:
上式中X1为归一化序列,Xmin和Xmax分别为归一化序列中的最小值和最大值,Xnorm为归一化结果;利用模型一、二、三、四求得数据矩阵利用模型五、六、七、八求得数据矩阵缺失数据通过下式求得:
5.如权利要求1所述的基于融合数据的高速公路气象站数据修复方法,其特征在于,步骤(5)中,数据反归一化的具体步骤为:
上式中,为待反归一化序列,分别为待反归一化序列中的最大值和最小值,X2为反归一化结果;将反归一化结果数据插入到矩阵X的相应位置,得到完整的数据矩阵。
CN201611076791.1A 2016-11-29 2016-11-29 一种基于融合数据的高速公路气象站数据修复方法 Active CN106372765B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611076791.1A CN106372765B (zh) 2016-11-29 2016-11-29 一种基于融合数据的高速公路气象站数据修复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611076791.1A CN106372765B (zh) 2016-11-29 2016-11-29 一种基于融合数据的高速公路气象站数据修复方法

Publications (2)

Publication Number Publication Date
CN106372765A CN106372765A (zh) 2017-02-01
CN106372765B true CN106372765B (zh) 2019-11-12

Family

ID=57891179

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611076791.1A Active CN106372765B (zh) 2016-11-29 2016-11-29 一种基于融合数据的高速公路气象站数据修复方法

Country Status (1)

Country Link
CN (1) CN106372765B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108519984B (zh) * 2018-02-07 2022-11-04 平安科技(深圳)有限公司 天气数据处理方法、服务器及计算机可读存储介质
CN115440029B (zh) * 2022-07-29 2023-08-08 重庆大学 一种考虑检测设备分布的车检器数据修复方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105702041A (zh) * 2016-04-21 2016-06-22 东南大学 基于神经网络的高速公路多源数据融合状态估计系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5832523B2 (ja) * 2010-04-29 2015-12-16 マサチューセッツ インスティテュート オブ テクノロジー 光コヒーレンストモグラフィのための動き補正および画像改善の方法および装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105702041A (zh) * 2016-04-21 2016-06-22 东南大学 基于神经网络的高速公路多源数据融合状态估计系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于数据修正的改进型灰色-RBF网络预测;严修红等;《华东交通大学学报》;20061031;第23卷(第5期);第170-172页 *

Also Published As

Publication number Publication date
CN106372765A (zh) 2017-02-01

Similar Documents

Publication Publication Date Title
Dinda et al. An integrated simulation approach to the assessment of urban growth pattern and loss in urban green space in Kolkata, India: A GIS-based analysis
CN110782093B (zh) 融合ssae深度特征学习和lstm的pm2.5小时浓度预测方法及系统
CN114092832B (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
Pijanowski et al. Modelling urbanization patterns in two diverse regions of the world
CN105303197A (zh) 一种基于机器学习的车辆跟车安全自动评估方法
CN105513370B (zh) 基于稀疏车牌识别数据挖掘的交通小区划分方法
Athukorala et al. Urban heat island formation in Greater Cairo: Spatio-temporal analysis of daytime and nighttime land surface temperatures along the urban–rural gradient
CN109002492B (zh) 一种基于LightGBM的绩点预测方法
CN105493109A (zh) 使用多个数据源的空气质量推断
CN106781457B (zh) 一种基于多源融合数据的高速公路交通流参数修正方法
CN116186548B (zh) 电力负荷预测模型训练方法及电力负荷预测方法
CN106372765B (zh) 一种基于融合数据的高速公路气象站数据修复方法
CN102567648B (zh) 一种绿地生态评价单元粒度自适应栅格取样方法
CN113987912A (zh) 一种基于地理信息的污染物在线监测系统
CN111783295B (zh) 城市社区特定人行为链动态识别与预测评估方法及系统
CN113836999A (zh) 基于探地雷达的隧道施工风险智能识别方法及系统
Huang et al. Predicting urban rail traffic passenger flow based on LSTM
Balti et al. Big data based architecture for drought forecasting using LSTM, ARIMA, and Prophet: Case study of the Jiangsu Province, China
Li et al. Assessing urban micro-climates with vertical and horizontal building morphological cutting deep transfer learning neural networks
Shi et al. An improved framework for assessing the impact of different urban development strategies on land cover and ecological quality changes-A case study from Nanjing Jiangbei New Area, China
CN116664095B (zh) 一种基于深度学习的安保巡检预测方法
CN103605988A (zh) 一种基于空间金字塔随机映射的地基云图分类方法
Wan et al. Contribution degree of different surface factors in urban interior to urban thermal environment
CN114913475B (zh) 基于gis和机器视觉的城市网格化管理方法及系统
CN114582128B (zh) 基于图离散注意力网络的交通流预测方法、介质及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant