CN110213827B - 基于深度强化学习的车辆数据采集频率动态调节方法 - Google Patents

基于深度强化学习的车辆数据采集频率动态调节方法 Download PDF

Info

Publication number
CN110213827B
CN110213827B CN201910439512.0A CN201910439512A CN110213827B CN 110213827 B CN110213827 B CN 110213827B CN 201910439512 A CN201910439512 A CN 201910439512A CN 110213827 B CN110213827 B CN 110213827B
Authority
CN
China
Prior art keywords
variance
vehicle
frequency
data
data acquisition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910439512.0A
Other languages
English (en)
Other versions
CN110213827A (zh
Inventor
李骏
邢志超
吴平阳
梁腾
赵熙唯
刘倩
丁冉
桂林卿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN201910439512.0A priority Critical patent/CN110213827B/zh
Publication of CN110213827A publication Critical patent/CN110213827A/zh
Application granted granted Critical
Publication of CN110213827B publication Critical patent/CN110213827B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/16Central resource management; Negotiation of resources or communication parameters, e.g. negotiating bandwidth or QoS [Quality of Service]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • H04W4/027Services making use of location information using location based information parameters using movement velocity, acceleration information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/40Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • H04W72/0453Resources in frequency domain, e.g. a carrier in FDMA
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明设计了一套应用于道路安全的算法,实现了在监控路上车辆时数据采集频率的动态调整。由于数据中心监控道路的车辆情况时都是固定的数据采集频率,可能会导致对危险情况的关注度不够,造成不必要的资源浪费,同时大量上传的数据也会对数据中心处理数据产生一定的压力,因此考虑在数据的采集过程中对数据进行预处理。本发明通过对道路环境与车辆移动的建模,获得采集频率与道路状况的匹配度。通过结合深度强化学习算法,找出在每个时刻针对于每种状况的最优决策,从而获得最优的匹配度与最少的能源消耗,从而极大提升数据中心对行驶车辆数据采集的效率。

Description

基于深度强化学习的车辆数据采集频率动态调节方法
技术领域
本发明涉及无线通信方法领域,以及计算机领域中基于神经网络的深度强化学习算法,属于交叉学科的方法应用。
背景技术
车联网概念引申自物联网(Internet of Things),智能交通系统是一个巨大的互动信息网络,如车辆位置,速度和路线。通过GPS,射频识别方法,传感器,摄像机图像处理等设备,车辆可以完成自身环境和状态信息的收集;通过互联网方法,所有车辆都可以将各种信息传输到中央处理器;通过计算机方法,可以分析和处理大量车辆上的这些信息,以计算不同车辆的最佳路线,及时报告道路状况,并安排信号周期。
正是由于车联网有着非常丰富的上层应用,为了服务于日益增长的大数据分析需求,合理利用计算资源,需要数据采集端在采集数据时也体现出智能化,而非传统的固定频率。智能的数据采集频率调节方法可以帮助上层计算中心预先过滤掉一部分无用的信息,提升计算有效性,同时节省传感器的能源消耗。
发明内容
本发明所要解决的方法问题是在车联网的发展背景下,针对目前通常采取固定车辆数据采集频率的系统,提供了一种基于深度强化学习的车辆数据采集频率动态调节方法,以有效提高系统道路安全与计算资源分配。
本发明为解决上述方法问题采用以下方法方案:假设车辆在基站服务区域内行驶的时间为t=1,...,T,每个服务的时隙为
Figure GDA0003940495840000011
时隙内最小采样间隔为τ。通过动态调整采样间隔的大小a(t)τ,从而为不同的情况匹配不同的采样频率
Figure GDA0003940495840000012
其中,MDP中的动作集
Figure GDA0003940495840000013
状态集s(t)={f(t),var(t)},即每个时刻的频率与速度的样本方差。每个时刻动作的选择会参考状态中的样本方差,而动作的选定也会改变状态中的频率。
系统的已知量与目标:车辆的速度公式为:
Figure GDA0003940495840000014
在每个时刻t,系统选择不同的采样间隔a(t)τ,以获得不同的数据采集频率
Figure GDA0003940495840000015
此外,系统会有一个长度为L的数据库用来保存历史速度值:
V={v(t-1-L),v(t-L),...,v(t-1)},基于这些历史数据,通过我们所建立的机制得到相应的采集频率fvar。最终,使Z(t)=|f(t)-fvar(t)|越小越好,从而实现动态频率调节的功能。
步骤11)为了实现对车辆数据的动态采集,因此先将车辆以高斯-马尔科夫移动模型建模,根据Gauss-Markov移动模型:
Figure GDA0003940495840000021
其中φ(t)服从
Figure GDA0003940495840000022
以下推导速度方差的上界:
Figure GDA0003940495840000023
Figure GDA0003940495840000024
Figure GDA0003940495840000025
Figure GDA0003940495840000026
综上,
Figure GDA0003940495840000027
移项得
Figure GDA0003940495840000028
因此:
Figure GDA0003940495840000029
速度方差的上界:
Figure GDA00039404958400000210
步骤12)每个时刻系统都会根据之前保存的车辆速度值计算方差,再根据方差去调整车辆的数据采集频率。在此我们定义一个数据长度为L的数据库用来保存历史速度值:V={v(t-1-L),v(t-L),...,v(t-1)}。然后,以无偏估计计算样本速度的方差:
Figure GDA00039404958400000211
步骤13)归一化样本方差:
Figure GDA00039404958400000212
由于样本方差var(t)的最大值不一定小于总体方差最大值Dmax,因此考虑使用sigmoid函数,在归一化值var大于1时,其对应的频率还保持为频率的最大值。根据sigmoid公式:
Figure GDA0003940495840000031
通过调整公式中的参数θ,γ,可以修改不同的频率fvar与归一化方差var的对应关系。
然后再通过将动作选择的频率f(t)与方差匹配的频率fvar(t)做差Z(t)=|f(t)-fvar(t)|,最小化两者的差值以优化频率的选择。
Reward:R(t)=1-Z(t),差值Z(t)越小,回报R(t)越大。
2.根据权利要求1所述的方法,通过深度神经网络的学习方法找算法中的最优决策,包括:
步骤21),将目标函数进行问题转化:令
Figure GDA0003940495840000032
R(t)=-e(t)+χ(t),从而问题转换为;
Figure GDA0003940495840000033
其中π为需要找出的最优决策;
步骤22)用基于神经网络的深度强化学习算法,通过最小化神经网络的收敛值找到收敛时刻的决策序列,再通过调整对车辆超速速度的阈值设定,找出能够使收敛最优的参数。
本发明采用以上方法方案与现有方法相比,具有以下方法效果:
提出的基于深度强化学习的车辆数据采集频率动态调节算法性能优于现有的固定频率的车辆数据采集方法,且采集能耗与数据有效度明显优于后者,实现了性能与能量消耗的良好折中,同时因为采集的数据有效性的提高,使得上层数据处理中心的压力减小,优化上层数据中心的计算资源分配。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1是本发明原理示意图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域方法人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明的一种路侧节点基于深度强化学习的车辆数据采集频率动态调节方法包括:确定想要优化的参数,通过合适的训练集设计MDP过程,通过深度强化学习方法线下训练数据集,待训练完成后放置线上应用。
作为一种实施例,所述方法包括:考虑车辆的移动模型,模拟车辆在道路上的速度、角度变化;利用基于目标车辆历史速度值的方差的无偏估计,将方差归一化为能表示车辆速度变化幅度的参量;通过深度强化学习的学习机制,学习每个时刻车辆的方差参量,在时刻开始初即给定当前时刻的数据采集频率,从而实现频率的动态调节。

Claims (2)

1.一种基于深度强化学习的车辆数据采集频率动态调节方法,其特征包括:
假设车辆在基站服务区域内行驶的时间为t=1,...,T,每个服务的时隙为
Figure FDA0003940495830000011
时隙内最小采样间隔为τ,通过动态调整采样间隔的大小a(t)τ,从而为不同的情况匹配不同的采样频率
Figure FDA0003940495830000012
其中,动作集
Figure FDA0003940495830000013
状态集s(t)={f(t),var(t)},即每个时刻的频率与速度的样本方差;
在道路安全的角度对道路上车辆的数据采集频率进行动态规划;
通过深度神经网络的学习方法找算法中的最优决策,以获得比较理想的效果;
所述在道路安全的角度对道路上车辆的数据采集频率进行动态规划,包括:
步骤11)为了实现对车辆数据的动态采集,因此先将车辆以高斯-马尔科夫移动模型建模,根据Gauss-Markov移动模型:
Figure FDA0003940495830000014
其中φ(t)服从
Figure FDA0003940495830000015
以下推导速度方差的上界:
Figure FDA0003940495830000016
Figure FDA0003940495830000017
Figure FDA0003940495830000018
Figure FDA0003940495830000019
综上,
Figure FDA00039404958300000110
移项得
Figure FDA00039404958300000111
因此:
Figure FDA00039404958300000112
速度方差的上界:
Figure FDA00039404958300000113
步骤12)每个时刻系统都会根据之前保存的车辆速度值计算方差,再根据方差去调整车辆的数据采集频率,在此我们定义一个数据长度为L的数据库用来保存历史速度值:V={v(t-1-L),v(t-L),...,v(t-1)},然后,以无偏估计计算样本速度的方差:
Figure FDA0003940495830000021
步骤13)归一化样本方差:
Figure FDA0003940495830000022
由于样本方差var(t)的最大值不一定小于总体方差最大值Dmax,因此考虑使用sigmoid函数,在归一化值var大于1时,其对应的频率还保持为频率的最大值,根据sigmoid公式:
Figure FDA0003940495830000023
通过调整公式中的参数θ,γ,可以修改不同的频率fvar与归一化方差var的对应关系,
然后再通过将动作选择的频率f(t)与方差匹配的频率fvar(t)做差Z(t)=|f(t)-fvar(t)|,最小化两者的差值以优化频率的选择,
Reward:R(t)=1-Z(t),差值Z(t)越小,回报R(t)越大。
2.根据权利要求1所述的方法,通过深度神经网络的学习方法找算法中的最优决策,包括:
步骤21),将目标函数进行问题转化:令
Figure FDA0003940495830000024
R(t)=-e(t),从而问题转换为;
Figure FDA0003940495830000025
其中π为需要找出的最优决策;
步骤22)用基于神经网络的深度强化学习算法,通过最小化神经网络的收敛值找到收敛时刻的决策序列,再通过调整对车辆超速速度的阈值设定,找出能够使收敛最优的参数。
CN201910439512.0A 2019-05-24 2019-05-24 基于深度强化学习的车辆数据采集频率动态调节方法 Active CN110213827B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910439512.0A CN110213827B (zh) 2019-05-24 2019-05-24 基于深度强化学习的车辆数据采集频率动态调节方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910439512.0A CN110213827B (zh) 2019-05-24 2019-05-24 基于深度强化学习的车辆数据采集频率动态调节方法

Publications (2)

Publication Number Publication Date
CN110213827A CN110213827A (zh) 2019-09-06
CN110213827B true CN110213827B (zh) 2023-05-02

Family

ID=67788424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910439512.0A Active CN110213827B (zh) 2019-05-24 2019-05-24 基于深度强化学习的车辆数据采集频率动态调节方法

Country Status (1)

Country Link
CN (1) CN110213827B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210155158A1 (en) * 2019-11-22 2021-05-27 Telenav, Inc. Navigation system with lane estimation mechanism and method of operation thereof
CN113129473B (zh) * 2020-01-15 2023-06-27 北京京东振世信息技术有限公司 数据采集的方法、装置和系统
CN111768028B (zh) * 2020-06-05 2022-05-27 天津大学 一种基于深度强化学习的gwlf模型参数调节方法
CN111753163A (zh) * 2020-07-08 2020-10-09 北京鼎泰智源科技有限公司 一种数据采集方法
CN112422359A (zh) * 2020-09-22 2021-02-26 深圳市修远文化创意有限公司 一种网络传输速率上下限数值调整的方法及服务器
CN113392577B (zh) * 2021-05-18 2023-01-13 广东工业大学 一种基于深度强化学习的区域边界主交叉口信号控制方法
CN113628460B (zh) * 2021-07-16 2022-07-08 浙江数智交院科技股份有限公司 一种基于边缘计算的高速公路车辆实时管控方法
CN114120482A (zh) * 2021-11-30 2022-03-01 上汽通用五菱汽车股份有限公司 车辆数据采集方法、装置、车辆及计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102637363A (zh) * 2012-04-11 2012-08-15 天津大学 基于支持向量机的道路车辆行驶速度预测方法
CN106910351B (zh) * 2017-04-19 2019-10-11 大连理工大学 一种基于深度强化学习的交通信号自适应控制方法
CN107767036A (zh) * 2017-09-29 2018-03-06 北斗导航位置服务(北京)有限公司 一种基于条件随机场的实时交通状态估计方法
CN108932840B (zh) * 2018-07-17 2021-09-07 北京理工大学 基于强化学习的无人驾驶车辆城市交叉口通行方法

Also Published As

Publication number Publication date
CN110213827A (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
CN110213827B (zh) 基于深度强化学习的车辆数据采集频率动态调节方法
US11300619B2 (en) Method and system for predicting energy consumption of a vehicle through application of a statistical model utilizing sensor and database data
CN107862864B (zh) 基于驾驶习惯和交通路况的行驶工况智能预测估计方法
CN104484911B (zh) 基于QoE的个性化自动驾驶参数优化设定方法
CN110443288B (zh) 一种基于排序学习的轨迹相似性计算方法
CN104318765A (zh) 基于智能手机的实时交通拥堵自动检测方法
US20170177950A1 (en) Method and device for creating a map
CN109741626A (zh) 停车场停车情况预测方法、调度方法和系统
CN106067001A (zh) 一种动作识别方法及系统
CN103345660A (zh) 一种基于猫群算法优化支持向量机参数的冷负荷预测方法
CN108572648A (zh) 一种无人驾驶车辆电源多源融合预测方法及系统
CN115984769A (zh) 一种智慧城市垃圾清扫点确定方法和物联网系统
CN115507867A (zh) 目标轨迹预测方法、装置、电子装置和存储介质
US20210390725A1 (en) Adaptive stereo matching optimization method and apparatus, device and storage medium
JP2018073389A (ja) データ処理装置、及びデータ処理方法
CN104794726A (zh) 一种水下图像并行分割方法及装置
CN106875720A (zh) 基于车位数据的车辆找寻时间服务系统及方法
CN116702038A (zh) 基于云边协同的能源站高频数据采集和异常状态识别方法
CN104183150A (zh) 车载单体道路交通状态判别装置与方法
CN114604140B (zh) 一种基于云管控的新能源汽车统一调温系统及方法
CN111985526B (zh) 一种基于相似场景聚类的尾随间隔管理策略生成方法及其系统
CN114187759B (zh) 一种基于数据驱动模型的路侧单元驾驶辅助方法及装置
Xie et al. Soft actor–critic-based multilevel cooperative perception for connected autonomous vehicles
US11341111B2 (en) Data processor and data processing method
CN112434877A (zh) 一种基于云计算的智慧城市数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Li Jun

Inventor after: Xing Zhichao

Inventor after: Wu Pingyang

Inventor after: Liang Teng

Inventor after: Zhao Xiwei

Inventor after: Liu Qian

Inventor after: Ding Ran

Inventor after: Gui Linqing

Inventor before: Xing Zhichao

Inventor before: Wu Pingyang

Inventor before: Liang Teng

Inventor before: Zhao Xiwei

Inventor before: Liu Qian

Inventor before: Ding Ran

Inventor before: Li Jun

Inventor before: Gui Linqing

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant