CN114745314B - 基于优化随机森林的车载容迟网数据报文转发方法 - Google Patents

基于优化随机森林的车载容迟网数据报文转发方法 Download PDF

Info

Publication number
CN114745314B
CN114745314B CN202210279752.0A CN202210279752A CN114745314B CN 114745314 B CN114745314 B CN 114745314B CN 202210279752 A CN202210279752 A CN 202210279752A CN 114745314 B CN114745314 B CN 114745314B
Authority
CN
China
Prior art keywords
vehicle
vehicle node
data message
random forest
delivery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210279752.0A
Other languages
English (en)
Other versions
CN114745314A (zh
Inventor
吴家皋
芮琦
刘林峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202210279752.0A priority Critical patent/CN114745314B/zh
Publication of CN114745314A publication Critical patent/CN114745314A/zh
Application granted granted Critical
Publication of CN114745314B publication Critical patent/CN114745314B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/14Routing performance; Theoretical aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/48Routing tree calculation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于优化随机森林的车载容迟网数据报文转发方法:首先基于历史训练集生成多棵以车辆节点投递等级为预测目标的分类回归决策树,建立初始随机森林模型。然后,通过决策权重和相似性两个指标优化随机森林模型。在数据报文转发过程中当携带数据报文的车辆节点与该报文的目的车辆节点相遇,则将报文直接转发给目的车辆节点;否则,当前车辆节点利用优化的随机森林模型预测自身的投递等级,并请求相遇车辆节点返回其投递等级。若相遇车辆节点的投递等级更高,则将报文转发给相遇车辆节点;否则,当前车辆节点保留该报文。本发明考虑了随机森林模型的泛化能力和准确性,提高了车载容迟网数据报文转发的投递率,同时减少了网络开销。

Description

基于优化随机森林的车载容迟网数据报文转发方法
技术领域
本发明涉及基于优化随机森林的车载容迟网数据报文转发方法,属于车载容迟网络中路由协议的领域。
背景技术
车载容迟网络(Vehicular Delay Tolerant Networks,VDTNs)是一种将延迟容忍网络应用到车联网中的一种新型网络结构,通过车辆节点的移动、相遇带来的机会进行数据的“存储-携带-转发”(store-carry-forward)的路由模式来实现通信。在传统的网络中,通常都是依赖于一些基础设施,所以针对这种类型的网络研究都是基于确定的端到端的连接假设。然而在动态环境中是无法保证网络是贯穿始终的端到端的连接。因此,通过利用延迟容忍网络(DTN,Delay-Tolerant Network,或Disruption-Tolerant Network)解决了在极端情况下缺乏端到端的连接下的通信问题。在实际应用,车载容迟网络能有效解决道路拥塞管理、交通事故传播等,这些应用场景通常具有传输延迟大、传输率低、网络拥塞、排队时间长等特点。
目前已有的典型算法包括Epidemic、Spray and Wait和Prophet等。Epidemic是基于泛洪策略的路由算法,每个车辆节点都将报文副本传递给相遇的所有邻居节点,可以最大化的提升成功的投递率,但是在实际环境下,消息泛洪往往会导致网络拥塞。Spray andWait路由算法则通过限制消息副本的数目来解决消息泛洪问题,但与此同时,该算法的投递率等性能指标也有所降低。Prophet路由算法则利用节点相遇的历史信息估计不同节点与消息目的节点之间的相遇概率,根据相遇概率决定消息转发策略。然而,在VDTN中,车辆的移动通常具有特定的模式,例如公交车遵循固定的路线和时刻表,私家车的移动倾向于有规律的轨迹,出租车的移动行为则体现了人流的热区等。而Prophet路由算法并没有很好地考虑车辆的这些移动模式。近几年随着机器学习的兴起,许多机器学习中的算法都被应用到DTN路由算法,比如决策树、强化学习、朴素贝叶斯分类器等。然而,决策树泛化能力差,而且并不够稳定,小部分数据的变化会导致生成结构相差较大的树形结构。强化学习则收敛速度较慢,并导致额外的网络路由开销。虽然朴素贝叶斯分类器简单高效,但是它的条件独立性假设使其无法表达出属性间的依赖关系,从而降低了分类的准确率。而本专利分别从分类性能和多样性两个衡量标准出发,对随机森林进行优化。首先,从分类性能出发,根据每棵树的分类错误率以及在森林中的表现分别给予局部和全局惩罚,从而挑选出在森林中准确率高的的树,使其拥有较高的决策权重。其次,再根据多样性评判指标-不合度量来评判决策树的相似度,继而挑选出相似度较低的决策树,不仅保证了泛化能力同时还提高了准确率,因此路由决策是基于优化的随机森林模型,可以进一步提高容迟网的性能。
发明内容
发明目的:本发明目的提供一种基于优化随机森林的车载容迟网数据报文转发方法,该方法着重考虑了泛化能力和准确率,相较于现有算法,能够有效提高网络性能。
技术方案:本发明为实现上述发明目的,采用如下技术方案:一种基于优化随机森林的车载容迟网数据报文转发方法,该方法包括如下步骤:
步骤1、获取每个车载容迟网络车辆节点的历史数据表,并对车辆属性进行划分;
步骤2、根据每个车载容迟网络车辆节点的属性建立训练集,并根据训练集建立初始随机森林模型;
步骤3、根据每棵决策树的权重和相似度对随机森林模型进行优化;
步骤4、当携带数据报文的车辆节点与其他车辆节点相遇时,若相遇车辆节点为数据报文的目的车辆节点时,此时数据报文直接被投递到相遇车辆节点;如果相遇的车辆节点不是目的车辆节点时,进入步骤5;
步骤5、利用优化后的随机森林模型预测当前车辆节点的投递等级x8,当前和相遇车辆节点投递等级x8,相遇
步骤6、若x8,当前>x8,相遇,则当前携带数据报文的车辆节点会继续携带报文,转到步骤4;否则,当前携带数据报文的节点将数据报文转发给相遇节点,由相遇节点继续转发报文,本次转发结束。
进一步的,步骤1的具体方法如下:
每个车载容迟网络车辆节点均维护一张数据报文转发历史数据表,根据实际路线中车辆轨迹特点进行属性的划分,其属性包括:区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7和投递等级x8;其中,区域码是对地理区域的编码,即将整个网络的地理区域以10m×10m的大小划分为不同的网格,对每个网格赋予一个唯一的区域码,用于记录数据报文转发时车辆节点所处的位置;时间戳是对时间段的编码,即将一天24小时以10分钟为间隔单位依次离散化编码,用于记录数据报文转发的时间;平均接触时间间隔是在数据报文转发前1小时内该车辆节点与其他车辆节点相遇的平均间隔时间,并以1分钟为单位依次离散化编码;运动方向是车辆节点在数据报文转发时的运动方向,划分为东、西、南、北、东南、东北、西南、西北8个运动方向;速度是车辆节点在数据报文转发时的行驶速度,以历史数据集为依据,并以20km/h为单位依次离散化编码;平均时延表示数据报文从源车辆节点转发到目的车辆节点所经过的平均时间,以2000s为单位依次离散化编码;行驶距离是车辆节点自上次转发数据报文后到本次数据报文转发时行驶的距离,以8km为单位依次离散化编码;投递等级是车辆节点转发数据报文的能力,用该车辆节点已成功转发数据报文数量来表示,并以100为单位依次离散化编码,并且根据每个车载容迟网络车辆节点获得区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7和投递等级x8作为一个数据样本。
进一步的,步骤2的具体方法如下:
步骤2.1:将所有车载网络车辆节点对应的样本形成数据集合M,按均匀分布随机地将历史数据集M中80%的样本划分为训练数据集F,20%样本划分为测试数据集D;
步骤2.2:通过自助重采样技术,从训练数据集F中有放回地重复随机抽取70%的数据,生成以属性x1到x7作为内部节点,投递等级x8为预测目标的分类回归决策树,也即CART树;
步骤2.3:重复上述步骤2.2,最后组成T棵决策树的初始随机森林,T>=100。
进一步的,步骤3的具体方法如下:
设测试数据集的样本数量为|D|,对于第i个样本,i∈[1,|D|],其投递等级标签为ci,ci∈[1,C],C为最大投递等级数;设
Figure BDA0003556369950000031
为初始随机森林中的决策树j对样本i的预测分类,j∈[1,T];/>
Figure BDA0003556369950000032
表示初始随机森林对样本i预测的分类;
步骤3.1、设置每棵决策树的权重;
步骤3.2、计算每棵决策树的相似度;
步骤3.3、将所有决策树按照权重Wj降序排序,选取前N个权重对应的决策树,再将这N棵决策树按相似度simj进行升序排序,选择前S棵决策树以构成最终的优化随机森林模型,所有车载网络车辆节点上都使用该模型预测车辆节点的投递等级。
进一步的,步骤3.1的具体方法如下:
步骤3.1.1、计算决策树j的局部惩罚因子Pj
Figure BDA0003556369950000033
其中,
Figure BDA0003556369950000041
为决策树j预测投递等级错误的样本数据集Pj表示决策树j的预测错误率;|Qj|为数据集样本的数量;
步骤3.1.2、计算决策树j的全局惩罚因子
Figure BDA0003556369950000042
Figure BDA0003556369950000043
其中,
Figure BDA0003556369950000044
为决策树j与初始随机森林预测的投递等级不一致的样本数据集,/>
Figure BDA0003556369950000045
表示决策树j相对于初始随机森林的预测错误率;
步骤3.1.3、计算决策树j的权重Wj
Figure BDA0003556369950000046
进一步的,步骤3.2的具体方法如下:
步骤3.2.1、计算决策树j的不合度量disj
Figure BDA0003556369950000047
其中,
Figure BDA0003556369950000048
表示对投递等级决策树j预测为正确而决策树1预测为错误的样本集合,/>
Figure BDA0003556369950000049
表示对投递等级决策树1预测为正确而决策树j测为错误的样本集合;
步骤3.2.2、计算决策树j的相似度simj
simj=1-disj
进一步的,步骤5中,利用随机森林模型预测当前车辆节点的投递等级x8,当前和相遇车辆节点投递等级x8,相遇具体方法如下:
如果相遇的车辆节点不是目的车辆节点时,此时当前携带数据报文的车辆节点获取属性区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7的当前值,并生成包括属性x1,x2,…,x7的实例样本i′,并利用优化的随机森林模型预测样本i′的投递等级x8作为当前车辆节点的投递等级:
Figure BDA00035563699500000410
其中,
Figure BDA0003556369950000051
即Lk(i′)为优化的随机森林模型中将样本i′预测为投递等级为k的决策树的集合,/>
Figure BDA0003556369950000052
表示所有将样本i′预测为投递等级为k的决策树的权重之和,x8,当前为权重之和最大的投递等级,S为优化的随机森林模型中决策树的个数;按照上述预测当前车辆节点的投递等级x8,当前的方法预测计算相遇车辆节点投递等级x8,相遇
有益效果:与现有技术相比,本发明的技术方案具有以下有益技术效果:
(1)本方法基于随机森林模型,采用集成学习思想克服单一分类器的不足,从而在车载容迟网络数据报文转发路由决策时,能利用更多信息更加精确的选择报文的下一跳节点,进而提升算法的性能。
(2)本方法综合考虑了随机森林的多样性和分类性能首先,从分类性能出发,通过每棵树分类错误率以其在森林中的表现分别给予局部和全局惩罚,以此来分配每棵树的权重,从而挑选出权重更高的树。接下来,在权重高的树中,利用多样性评判标准不合度量去选择低相似度的树,最后形成优化的随机森林模型,进一步提高了随机森林模型的准确性和泛化能力,进而提升了报文转发的投递率。
(3)通过选择不同的优化参数N和S的值,本方法可适应不同的车载容迟网络环境,具有较好的灵活性。
附图说明
图1是本发明方法对于容迟网络中任意一个报文的转发流程图。
具体实施方式
下面结合附图对本发明的技术方案的实施作进一步的详细描述:
如图1所示,本发明提出一种基于优化随机森林的车载容迟网数据报文转发方法,该方法包括如下步骤:
步骤1、获取每个车载容迟网络车辆节点的历史数据表,并对车辆属性进行划分;
步骤2、根据每个车载容迟网络车辆节点的属性建立训练集,并根据训练集建立初始随机森林模型;
步骤3、根据每棵决策树的权重和相似度对随机森林模型进行优化;
步骤4、当携带数据报文的车辆节点与其他车辆节点相遇时,若相遇车辆节点为数据报文的目的车辆节点时,此时数据报文直接被投递到相遇车辆节点;如果相遇的车辆节点不是目的车辆节点时,进入步骤5;
步骤5、利用优化后的随机森林模型预测当前车辆节点的投递等级x8,当前和相遇车辆节点投递等级x8,相遇
步骤6、若x8,当前>x8,相遇,则当前携带数据报文的车辆节点会继续携带报文,转到步骤4;否则,当前携带数据报文的节点将数据报文转发给相遇节点,由相遇节点继续转发报文,本次转发结束。
步骤1的具体方法如下:
每个车载容迟网络车辆节点均维护一张数据报文转发历史数据表,根据实际路线中车辆轨迹特点进行属性的划分,其属性包括:区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7和投递等级x8;其中,区域码是对地理区域的编码,即将整个网络的地理区域以10m×10m的大小划分为不同的网格,对每个网格赋予一个唯一的区域码,用于记录数据报文转发时车辆节点所处的位置;时间戳是对时间段的编码,即将一天24小时以10分钟为间隔单位依次离散化编码,用于记录数据报文转发的时间;平均接触时间间隔是在数据报文转发前1小时内该车辆节点与其他车辆节点相遇的平均间隔时间,并以1分钟为单位依次离散化编码;运动方向是车辆节点在数据报文转发时的运动方向,划分为东、西、南、北、东南、东北、西南、西北8个运动方向;速度是车辆节点在数据报文转发时的行驶速度,以历史数据集为依据,并以20km/h为单位依次离散化编码;平均时延表示数据报文从源车辆节点转发到目的车辆节点所经过的平均时间,以2000s为单位依次离散化编码;行驶距离是车辆节点自上次转发数据报文后到本次数据报文转发时行驶的距离,以8km为单位依次离散化编码;投递等级是车辆节点转发数据报文的能力,用该车辆节点已成功转发数据报文数量来表示,并以100为单位依次离散化编码,并且根据每个车载容迟网络车辆节点获得区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7和投递等级x8作为一个数据样本。
步骤2的具体方法如下:
步骤2.1:将所有车载网络车辆节点对应的样本形成数据集合M,按均匀分布随机地将历史数据集M中80%的样本划分为训练数据集F,20%样本划分为测试数据集D;
步骤2.2:通过自助重采样技术,从训练数据集F中有放回地重复随机抽取70%的数据,生成以属性x1到x7作为内部节点,投递等级x8为预测目标的分类回归决策树,也即CART树;
步骤2.3:重复上述步骤2.2,最后组成T棵决策树的初始随机森林,T>=1000。
步骤3的具体方法如下:
设测试数据集的样本数量为|D|,对于第i个样本,i∈[1,|D|],其投递等级标签为ct,ci∈[1,C],C为最大投递等级数;设
Figure BDA0003556369950000071
为初始随机森林中的决策树j对样本i的预测分类,j∈[1,T];/>
Figure BDA0003556369950000072
表示初始随机森林对样本i预测的分类;
步骤3.1、设置每棵决策树的权重;
步骤3.2、计算每棵决策树的相似度;
步骤3.3、将所有决策树按照权重Wj降序排序,选取前N个权重对应的决策树,再将这N棵决策树按相似度simj进行升序排序,选择前S棵决策树以构成最终的优化随机森林模型,所有车载网络车辆节点上都使用该模型预测车辆节点的投递等级。
步骤3.1的具体方法如下:
步骤3.1.1、计算决策树j的局部惩罚因子Pj
Figure BDA0003556369950000073
其中,
Figure BDA0003556369950000074
为决策树j预测投递等级错误的样本数据集Pj表示决策树j的预测错误率;|Qj|为数据集样本的数量;
步骤3.1.2、计算决策树j的全局惩罚因子
Figure BDA0003556369950000075
Figure BDA0003556369950000076
其中,
Figure BDA0003556369950000077
为决策树j与初始随机森林预测的投递等级不一致的样本数据集,/>
Figure BDA0003556369950000078
表示决策树j相对于初始随机森林的预测错误率;
步骤3.1.3、计算决策树j的权重Wj
Figure BDA0003556369950000079
步骤3.2的具体方法如下:
步骤3.2.1、计算决策树j的不合度量disj
Figure BDA0003556369950000081
其中,
Figure BDA0003556369950000082
表示对投递等级决策树j预测为正确而决策树1预测为错误的样本集合,/>
Figure BDA0003556369950000083
表示对投递等级决策树1预测为正确而决策树j测为错误的样本集合;
步骤3.2.2、计算决策树j的相似度simj
simj=1-disj
步骤5中,利用随机森林模型预测当前车辆节点的投递等级x8,当前和相遇车辆节点投递等级x8,相遇具体方法如下:
如果相遇的车辆节点不是目的车辆节点时,此时当前携带数据报文的车辆节点获取属性区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7的当前值,并生成包括属性x1,x2,…,x7的实例样本i′,并利用优化的随机森林模型预测样本i′的投递等级x8作为当前车辆节点的投递等级:
Figure BDA0003556369950000084
其中,
Figure BDA0003556369950000085
即Lk(i′)为优化的随机森林模型中将样本i′预测为投递等级为k的决策树的集合,/>
Figure BDA0003556369950000086
表示所有将样本i′预测为投递等级为k的决策树的权重之和,x8,当前为权重之和最大的投递等级,S为优化的随机森林模型中决策树的个数;按照上述预测当前车辆节点的投递等级x8当前的方法预测计算相遇车辆节点投递等级x8,相遇
为了验证本发明的报文转发方法能够有效性,特列举一验证例进行说明。
表1部分历史数据集
Figure BDA0003556369950000087
Figure BDA0003556369950000091
表1是部分历史数据集。首先,根据训练集建立初始的随机森林模型。接下来,根据测试集进一步优化随机森林模型,利用步骤3,我们会获得优化的随机森林模型,假设优化的随机森林模型的决策树的棵数为10。本验证例中,假设携带报文的车辆节点n当前与车辆节点n相遇相遇,设n相遇报文不是目的车辆节点,此时n当前的属性实例样本i′当前的取值为<x1=R3,x2=T1,x3=A1,x4=P1,x5=V1,x6=W1,x7=D1>,则优化的随机森林模型中每棵树对实例样本i′当前预测的投递等级结果如表2所示:
表2每棵决策树对i′当前投递等级的预测结果
Figure BDA0003556369950000092
则,根据步骤4可得:
L1(i′当前)={1,5,6},
L2(i′当前)={2,3,8,9,10},
L3(i′当前)={4,7},
Figure BDA0003556369950000093
Figure BDA0003556369950000094
Figure BDA0003556369950000095
因此,可得车辆节点n当前的投递等级为:
Figure BDA0003556369950000096
同理,携带报文的车辆节点n当前请求相遇车辆节点n相遇用同样的方法计算其投递等级x8,相遇,设x8,相遇=1。因为n当前的投递等级更大,所以车辆节点n当前将继续携带报文,等待下一次相遇转发机会。
综上所述,本发明提出了一种基于优化随机森林的车载容迟网数据转发方法,综合考虑了随机森林的多样性和分类性能,提高了随机森林模型的准确性和泛化能力,根据预测投递等级去进行路由决策。该方法能够显著提升报文投递率,并降低网络开销。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护。

Claims (6)

1.一种基于优化随机森林的车载容迟网数据报文转发方法,其特征在于,该方法包括如下步骤:
步骤1、获取每个车载容迟网络车辆节点的历史数据表,并对车辆属性进行划分;
步骤2、根据每个车载容迟网络车辆节点的属性建立训练集,并根据训练集建立初始随机森林模型;
步骤3、根据每棵决策树的权重和相似度对随机森林模型进行优化;
步骤4、当携带数据报文的车辆节点与其他车辆节点相遇时,若相遇车辆节点为数据报文的目的车辆节点时,此时数据报文直接被投递到相遇车辆节点;如果相遇的车辆节点不是目的车辆节点时,进入步骤5;
步骤5、利用优化后的随机森林模型预测当前车辆节点的投递等级x8,当前和相遇车辆节点投递等级x8,相遇
步骤6、若x8,当前>x8,相遇,则当前携带数据报文的车辆节点会继续携带报文,转到步骤4;否则,当前携带数据报文的节点将数据报文转发给相遇节点,由相遇节点继续转发报文,本次转发结束;
步骤5中,利用随机森林模型预测当前车辆节点的投递等级x8,当前和相遇车辆节点投递等级x8,相遇具体方法如下:
如果相遇的车辆节点不是目的车辆节点时,此时当前携带数据报文的车辆节点获取属性区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7的当前值,并生成包括属性x1,x2,…,x7的实例样本i′,并利用优化的随机森林模型预测样本i′的投递等级x8作为当前车辆节点的投递等级:
Figure FDA0004228723590000011
其中,
Figure FDA0004228723590000012
即Lk(i′)为优化的随机森林模型中将样本i′预测为投递等级为k的决策树的集合,/>
Figure FDA0004228723590000013
表示所有将样本i′预测为投递等级为k的决策树的权重之和,x8,当前为权重之和最大的投递等级,S为优化的随机森林模型中决策树的个数;按照上述预测当前车辆节点的投递等级x8,当前的方法预测计算相遇车辆节点投递等级x8,相遇
2.根据权利要求1所述的一种基于优化随机森林的车载容迟网数据报文转发方法,其特征在于,步骤1的具体方法如下:
每个车载容迟网络车辆节点均维护一张数据报文转发历史数据表,根据实际路线中车辆轨迹特点进行属性的划分,其属性包括:区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7和投递等级x8;其中,区域码是对地理区域的编码,即将整个网络的地理区域以10m×10m的大小划分为不同的网格,对每个网格赋予一个唯一的区域码,用于记录数据报文转发时车辆节点所处的位置;时间戳是对时间段的编码,即将一天24小时以10分钟为间隔单位依次离散化编码,用于记录数据报文转发的时间;平均接触时间间隔是在数据报文转发前1小时内该车辆节点与其他车辆节点相遇的平均间隔时间,并以1分钟为单位依次离散化编码;运动方向是车辆节点在数据报文转发时的运动方向,划分为东、西、南、北、东南、东北、西南、西北8个运动方向;速度是车辆节点在数据报文转发时的行驶速度,以历史数据集为依据,并以20km/h为单位依次离散化编码;平均时延表示数据报文从源车辆节点转发到目的车辆节点所经过的平均时间,以2000s为单位依次离散化编码;行驶距离是车辆节点自上次转发数据报文后到本次数据报文转发时行驶的距离,以8km为单位依次离散化编码;投递等级是车辆节点转发数据报文的能力,用该车辆节点已成功转发数据报文数量来表示,并以100为单位依次离散化编码,并且根据每个车载容迟网络车辆节点获得区域码x1、时间戳x2、平均接触时间间隔x3、运动方向x4、速度x5、平均时延x6、距离x7和投递等级x8作为一个数据样本。
3.根据权利要求2所述的一种基于优化随机森林的车载容迟网数据报文转发方法,其特征在于,步骤2的具体方法如下:
步骤2.1:将所有车载网络车辆节点对应的样本形成数据集合M,按均匀分布随机地将历史数据集M中80%的样本划分为训练数据集F,20%样本划分为测试数据集D;
步骤2.2:通过自助重采样技术,从训练数据集F中有放回地重复随机抽取70%的数据,生成以属性x1到x7作为内部节点,投递等级x8为预测目标的分类回归决策树,也即CART树;
步骤2.3:重复上述步骤2.2,最后组成T棵决策树的初始随机森林,T>=100。
4.根据权利要求3所述的一种基于优化随机森林的车载容迟网数据报文转发方法,其特征在于,步骤3的具体方法如下:
设测试数据集的样本数量为|D|,对于第i个样本,i∈[1,|D|],其投递等级标签为ci,ci∈[1,C],C为最大投递等级数;设
Figure FDA0004228723590000031
为初始随机森林中的决策树j对样本i的预测分类,j∈[1,T];/>
Figure FDA0004228723590000032
表示初始随机森林对样本i预测的分类;
步骤3.1、设置每棵决策树的权重;
步骤3.2、计算每棵决策树的相似度;
步骤3.3、将所有决策树按照权重Wj降序排序,选取前N个权重对应的决策树,再将这N棵决策树按相似度simj进行升序排序,选择前S棵决策树以构成最终的优化随机森林模型,所有车载网络车辆节点上都使用该模型预测车辆节点的投递等级。
5.根据权利要求4所述的一种基于优化随机森林的车载容迟网数据报文转发方法,其特征在于,步骤3.1的具体方法如下:
步骤3.1.1、计算决策树j的局部惩罚因子Pj
Figure FDA0004228723590000033
其中,
Figure FDA0004228723590000034
为决策树j预测投递等级错误的样本数据集,Pj表示决策树j的预测错误率;|Qj|为数据集样本的数量;
步骤3.1.2、计算决策树j的全局惩罚因子
Figure FDA0004228723590000035
Figure FDA0004228723590000036
其中,
Figure FDA0004228723590000037
为决策树j与初始随机森林预测的投递等级不一致的样本数据集,/>
Figure FDA0004228723590000038
表示决策树j相对于初始随机森林的预测错误率;
步骤3.1.3、计算决策树j的权重Wj
Figure FDA0004228723590000039
6.根据权利要求5所述的一种基于优化随机森林的车载容迟网数据报文转发方法,其特征在于,步骤3.2的具体方法如下:
步骤3.2.1、计算决策树j的不合度量disj
Figure FDA0004228723590000041
其中,
Figure FDA0004228723590000042
表示对投递等级决策树j预测为正确而决策树l预测为错误的样本集合,/>
Figure FDA0004228723590000043
Figure FDA0004228723590000044
表示对投递等级决策树l预测为正确而决策树j测为错误的样本集合;
步骤3.2.2、计算决策树j的相似度simj
simj=1-disj
CN202210279752.0A 2022-03-21 2022-03-21 基于优化随机森林的车载容迟网数据报文转发方法 Active CN114745314B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210279752.0A CN114745314B (zh) 2022-03-21 2022-03-21 基于优化随机森林的车载容迟网数据报文转发方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210279752.0A CN114745314B (zh) 2022-03-21 2022-03-21 基于优化随机森林的车载容迟网数据报文转发方法

Publications (2)

Publication Number Publication Date
CN114745314A CN114745314A (zh) 2022-07-12
CN114745314B true CN114745314B (zh) 2023-07-11

Family

ID=82276549

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210279752.0A Active CN114745314B (zh) 2022-03-21 2022-03-21 基于优化随机森林的车载容迟网数据报文转发方法

Country Status (1)

Country Link
CN (1) CN114745314B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109041010A (zh) * 2018-07-10 2018-12-18 南京邮电大学 基于半朴素贝叶斯分类器的车载容迟网络数据转发方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190318248A1 (en) * 2018-04-13 2019-10-17 NEC Laboratories Europe GmbH Automated feature generation, selection and hyperparameter tuning from structured data for supervised learning problems
WO2020068127A1 (en) * 2018-09-28 2020-04-02 Ravikumar Balakrishnan System and method using collaborative learning of interference environment and network topology for autonomous spectrum sharing
US11829800B2 (en) * 2019-11-06 2023-11-28 Centurylink Intellectual Property Llc Predictive resource allocation in an edge computing network utilizing machine learning
US11889458B2 (en) * 2020-08-04 2024-01-30 Qualcomm Incorporated Neural network functions for positioning measurement data processing at a user equipment

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109041010A (zh) * 2018-07-10 2018-12-18 南京邮电大学 基于半朴素贝叶斯分类器的车载容迟网络数据转发方法

Also Published As

Publication number Publication date
CN114745314A (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
Civilis et al. Techniques for efficient road-network-based tracking of moving objects
CN110602117B (zh) 基于区块链的车联网节点一致性共识方法
CN107944605B (zh) 一种基于数据预测的动态交通路径规划方法
CN109000676B (zh) 一种vanet环境下结合预测信息的路径规划方法
CN110428117A (zh) 城市轨道交通多场景下客流精准诱导方法及系统
Chavhan et al. An efficient context-aware vehicle incidents route service management for intelligent transport system
Sangaiah et al. Hierarchical clustering based on dendrogram in sustainable transportation systems
Zhao et al. Dynamic path planning of emergency vehicles based on travel time prediction
CN114449477B (zh) 一种基于边缘缓存和免疫克隆策略的车联网内容分发方法
CN103366224B (zh) 一种基于公交网络的乘客需求预测系统和方法
CN114202120A (zh) 一种针对多源异构数据的城市交通行程时间预测方法
CN113824641B (zh) 车联网路由方法、系统、设备及存储介质
CN115708343A (zh) 从一组载具收集数据的方法
CN116782296A (zh) 一种基于数字孪生的车联网边缘计算卸载多目标决策方法
CN109769285A (zh) 一种基于位置预测的车辆间通信的路由方法
Seo et al. Combined time bound optimization of control, communication, and data processing for FSO‐based 6G UAV aerial networks
Miri et al. Improved routing vehicular ad-hoc networks (VANETs) based on mobility and bandwidth available criteria using fuzzy logic
CN114745314B (zh) 基于优化随机森林的车载容迟网数据报文转发方法
CN102843301A (zh) 一种基于接触预测的移动容迟网络路由方法
Yu et al. A short-term prediction model for forecasting traffic information using Bayesian network
CN113490181B (zh) 一种基于lstm神经网络的车辆传输时延优化方法
Zhang et al. Bidirectional k-nearest neighbor spatial crowdsourcing allocation protocol based on edge computing
CN113781280A (zh) 铁路网络大规模中断下的列车调整方法
CN114363308A (zh) 一种地图数据的传输方法及装置
CN111915889A (zh) 一种基于遗传蚁群混合算法的车联网路侧单元部署方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant