CN110113418B - 一种车联信息中心网络的协同缓存更新方法 - Google Patents

一种车联信息中心网络的协同缓存更新方法 Download PDF

Info

Publication number
CN110113418B
CN110113418B CN201910379979.0A CN201910379979A CN110113418B CN 110113418 B CN110113418 B CN 110113418B CN 201910379979 A CN201910379979 A CN 201910379979A CN 110113418 B CN110113418 B CN 110113418B
Authority
CN
China
Prior art keywords
cache
vehicle
updating
message
income
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910379979.0A
Other languages
English (en)
Other versions
CN110113418A (zh
Inventor
马立香
张悦田
张科
罗荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201910379979.0A priority Critical patent/CN110113418B/zh
Publication of CN110113418A publication Critical patent/CN110113418A/zh
Application granted granted Critical
Publication of CN110113418B publication Critical patent/CN110113418B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching
    • H04L67/5682Policies or rules for updating, deleting or replacing the stored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Traffic Control Systems (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开一种车联信息中心网络的协同缓存更新方法,应用于车联信息中心网络技术领域,为了解决现有技术存在的不能很好地综合多因素决策以及车辆之间不进行协同导致的不能充分利用缓存空间的问题;本发明通过增强学习的Policy Gradient算法,使用神经网络用于参数的选取,以观察到的环境因素为神经网络的输入,把神经网络的输出作为缓存更新决策,可以综合考虑多种影响因素,具有现实意义;本发明通过综合缓存更新中的缓存决策与缓存替换两个过程,基于设计的Beacon报文实现多车之间的信息共享,实现了车辆用户之间的协同缓存更新策略,一定程度上避免出现缓存的大量冗余,提高了对车辆用户上有限缓存空间的利用率。

Description

一种车联信息中心网络的协同缓存更新方法
技术领域
本发明属于车联信息中心网络领域,特别涉及一种车联信息中心网络缓存更新技术。
背景技术
随着新型车载网络通信设备的广泛普及和各类车联网应用的发展,车联网从传统的辅助交通管理的安全类应用正在向支持多元化、海量化的娱乐信息服务类应用发展。车联网中的网络服务需求日益增加,由于信息中心网络(Information-Centric Networking,ICN)能提供对大规模的车联网服务及海量内容的有效支持,使得基于ICN的车联网成为了研究中的热门课题,简称为车联ICN。信息中心网络是以内容为中心的新型通信架构,它克服了IP网络许多的限制,能够提供有效的内容交付。网内缓存是ICN的重要特性,ICN中的节点可以对内容进行存储。有效的车联ICN缓存更新策略可以降低网络负载,提高内容请求的成功率,降低内容请求的时延,然而频繁的缓存更新一方面为车辆用户带来较大的开销,另一方面给缓存发现过程也造成一定的困难。ICN场景缓存更新示意图如图1所示。
在现有的缓存更新策略中,有以下两点可以考虑改进的地方。一方面,需要纳入考虑的因素很多,比如内容流行度、车速、邻居节点的缓存情况等,现有的策略选择其中某个因素进行研究或者简单使用线性组合的方式综合考虑多个因素。然而在不同环境下,各因素对结果的影响不同,同时各因素的量纲不同。若使用线性组合的方式,则各参数的设置需要大量的实验比较且具有个体差异性,即不同车辆用户最优的参数不同。另一方面,现有的策略将缓存决策与缓存替换问题分开设计,缓存决策用于分析该内容是否被缓存,缓存替换则分析被替换的内容。然而缓存决策是通过将该内容与缓存的内容进行比较得出结论的,因此缓存决策与缓存替换应该是同时进行的。
发明内容
为解决上述技术问题,本发明提出一种车联信息中心网络的协同缓存更新方法,包括Interest报文缓存命中收益更新,根据Beacon报文进行信息更新,通过PolicyGradient算法更新神经网络参数,根据Data报文基于神经网络进行缓存决策与缓存替换;可以有效降低网络负载,提高内容请求的成功率,降低内容请求的时延。
本发明采用的技术方案为:一种车联信息中心网络的协同缓存更新方法,包括:
S1、若收到的报文为Interest报文,则根据Interest报文请求的内容是否存在于缓存中更新收益;否则收到Data报文,执行步骤S2;
S2、收到Data报文,若为Beacon报文,根据Beacon报文内容进行信息更新;否则执行步骤S3;
S3、当收到非Beacon的Data报文,进行缓存决策与缓存替换。
进一步地,步骤S1所述根据Interest报文请求的内容是否存在于缓存中更新收益,具体为:当Interest报文请求的内容存在于缓存中时,根据公式r=r+wstep更新收益;当Interest报文请求的内容不存在于缓存中时,根据公式r=r-mstep更新收益;
其中,r表示收益,wstep表示正收益,mstep表示负收益。
更进一步地,每次命中缓存根据Interest报文的累积跳数,设置正收益wstep;每次命中失败设置负收益mstep
进一步地,步骤S2所述信息更新,包括:邻居车辆存储的内容、邻居车辆请求内容的期望跳数、邻居车辆对内容流行度的估计、邻居车辆的轨迹信息。
进一步地,步骤S3具体包括以下分步骤:
S31、当收到非Beacon的Data报文,将当前的收益存入轨迹,确定环境状态;
S32、确定当前神经网络的参数θ;
S33、根据步骤S32确定的当前神经网络的参数θ,将步骤S31中的环境状态作为神经网络的输入,得到采取每一种行为的概率,并根据该概率随机选择一个行为执行;
S34、根据步骤S33所选择的行为,若需要替换缓存,则收益r=-ch;否则令收益r=0;其中ch为缓存更新的负收益;
S35、将步骤S31的环境状态与步骤S33选择的行为存入轨迹。
进一步地,步骤S32所述的确定当前神经网络的参数θ,计算式为:
Figure BDA0002053053050000021
其中,t表示时间T中的某个时隙,n表示轨迹的标号,α为学习率,
Figure BDA0002053053050000022
表示在轨迹n中时隙t对应的行为,
Figure BDA0002053053050000023
表示在轨迹n中时隙t对应的状态,
Figure BDA0002053053050000024
表示在轨迹n中时间[t,T]内的收益之和。
进一步地,步骤S35所述轨迹为:{s1,a1,r1,…,sT,aT,rT}~πθ
其中,r1、rT表示收益,π表示策略,θ表示策略π所使用的参数。
本发明的有益效果:通过增强学习的Policy Gradient算法,使用神经网络用于参数的选取,以观察到的环境因素为神经网络的输入,把神经网络的输出作为缓存决策,可以综合考虑多种影响因素,具有现实意义;通过综合缓存决策与缓存替换,基于设计的Beacon报文实现多车之间的信息共享,实现了车辆用户之间的协同缓存更新策略,一定程度上避免出现缓存的大量冗余,提高对车辆用户上有限缓存空间的利用率;本发明的缓存更新策略可以有效的降低网络负载,提高内容请求的成功率,降低内容请求的时延。
附图说明
图1为本发明实施例提供的缓存更新场景;
图2为本发明实施例提供的收到报文的缓存更新决策流程图;
图3为本发明的神经网络决策示意图;
图4为本发明的仿真图。
具体实施方式
为了便于本领域的普通技术人员理解本发明,首先对技术术语做出如下定义:
智能体:Agent。检测环境并执行相应的动作,同时建立自己的策略适应环境的系统。本发明中的智能体为网络中的车辆。
环境:Environment。智能体所处的现实世界。
状态:State。智能体当前所处的现状。
State=[PC,QC,Pl,Ql,Cv,VEL,P′C,Q′C,N′C]
其中,C表示当前车辆缓存内容的集合。P′C表示邻居车辆上对于C的请求概率,Q′C表示邻居车辆对于C缓存发现过程中需要的期望跳数,N′C表示邻居车辆对于C存储的数量。
行为:Action。智能体采取的动作。在缓存更新过程中,需要解决的问题有两个:是否缓存以及替换对象。所以此问题中行为的定义即为替换内容标号或者不替换。即假设车辆用户可以缓存的内容总量为N,那么神经网络的输出维度为N+1维,分别表示替换第一个到第N个内容的概率以及不替换的概率。在缓存空间剩余的情况下,必定会缓存收到的Data报文内所包含的内容。
收益:Reward。智能体从环境中得到的反馈。在车联ICN中,期望缓存的内容命中的概率尽量大,所以需要设置相应的收益函数鼓励提高内容命中率的行为。为了防止车辆缓存更新过于频繁,使得周围车辆缓存发现过程中Q表难以收敛,影响缓存发现过程的效果,因此给予一次缓存更新负收益ch。每次命中缓存根据Interest报文的累积跳数step,设置正收益为wstep;同样,命中失败也设置相应的负收益mstep,设当前Data报文到达时刻为T,下一个Data报文到达时刻为T′,首先需要定义一个集合ψ={t|b(t)=1},对于反馈RT公式如下:
Figure BDA0002053053050000041
其中,gT表示T时刻是否进行缓存更新,b(t)表示在时隙t是否收到Interest报文,δ(t)为脉冲函数,f(t)=h(t)*wstep(t)-(1-h(t))*mstep(t),h(t)表示时隙t收到Interest报文请求的内容是否命中,step(t)表示时隙t收到的Interest报文累积跳数。
策略:Policy。智能体学习得到的状态到行为的一个映射。
轨迹:Trajectory。{s1,a1,r1,…,sT,aT,rT}~πθ表示在一段时间内智能体收集的状态、行为与收益三元组的集合以及对应策略π和策略所使用的参数θ。
Interest报文与Data报文:ICN中的报文分为Interest报文与Data报文两类,Interest报文用于内容的请求,Data报文是内容提供方发出的包含内容的报文。
Beacon报文:一种特殊的Data报文,车辆用户之间通过Beacon报文交互信息,包括共享自身收集的轨迹、缓存发现过程中维护的Q表以及对内容流行度的估计和自身缓存中已有的内容。Beacon报文的内容如表1所示。
表1 Beacon报文
Figure BDA0002053053050000051
下面结合附图和具体实施例进一步说明本发明的技术方案。
本实施例中,缓存更新场景如图1所示,假设无线网络容量为Cnet,车辆与车辆最大通信距离为Dv2v,车辆与路旁系统(Road Side Unit,RSU)最大通信距离为Dv2s,车辆集合为Nv,Data报文内容大小为Cpacket,数量为Npacket,Interest报文产生频率为f。
基于上述描述,本实施例提供一种车联信息中心网络的协同缓存更新方法,具体流程如图2所示,包括以下步骤:
S1、车辆集合Nv中任一车辆收到报文,判断是否为Interest报文,根据Interest报文请求的内容是否存在于缓存中更新收益;具体包括以下子步骤:
S11、判断报文是否为Interest报文,若是,则进入步骤S12;若不是,则进入步骤S21;
S12、根据Interest报文请求的内容判断是否存在于缓存中,若存在,则根据公式r=r+wstep更新收益;若不存在,则根据公式r=r-mstep更新收益;其中r表示收益,每次命中缓存根据Interest报文的累积跳数step,设置正收益为wstep;同样,命中失败也设置相应的负收益mstep,w与m的取值视具体情况而定,在收益的期望值为0时,算法收敛会更快。因此,当在缓存命中率大约为p的场景中,可以设置w·p-m*(1-p)=0。例如,在缓存命中率大约为40%的场景中,可以设置w=0.03,m=0.02。
S13、结束,等待下一报文。
S2、收到Data报文,判断是否为Beacon报文,根据Beacon报文内容进行信息更新;具体包括如下分步骤:
S21、收到Data报文,判断是否为Beacon报文,若是,进入步骤S22;若不是,则进入步骤S31;
S22、根据Beacon报文内容进行信息更新,包括:邻居车辆存储的内容、邻居车辆请求内容的期望跳数、邻居车辆对内容流行度的估计、邻居车辆的轨迹信息。
S3、收到非Beacon的Data报文,进行缓存决策与缓存替换;本步骤中采用神经网络进行参数的选取,具体决策过程如图3所示;包括如下分步骤:
S31、收到非Beacon的Data报文,将当前的收益r存入轨迹,确定环境状态s;
S32、确定当前神经网络参数θ,若θ未初始化,首先初始化θ,可以使用均值为0的均匀分布随机生成;对于轨迹{s1,a1,r1,…,sT,aT,rT}~πθ中的每一个轨迹在时间T内的每一个时隙t,通过
Figure BDA0002053053050000061
更新θ;其中Rt表示在时间[t,T]内的轨迹内的收益之和,本领域的技术人员应知这里的时隙t为整数,t=1,2,3,…,T,α为学习率;
S33、根据确定的神经网络参数θ,将确定的环境状态s作为神经网络的输入,得到采取每一种行为的概率p(a|s,θ),并按照概率随机选择一个行为a具体执行;神经网络决策流程如图3所示;
S34、根据S33选择的行为a可以得到替换当前缓存中的第几条缓存或是不进行缓存,若需要缓存,令收益r=-ch;否则令收益r=0;其中ch为缓存更新的负收益;
S35、将环境状态s与执行的行为a存入轨迹,结束,等待一下报文。
本实施例中,在收到Data报文时,如果缓存空间在有剩余的情况下,必定会缓存收到的Data报文内所包含的内容。
综上所述,本发明提出了一种基于增强学习的Policy Gradient算法和综合缓存决策与缓存替换的车联信息中心网络缓存更新策略。通过增强学习的Policy Gradient算法,使用神经网络用于参数的选取,可以综合考虑多种影响因素;通过综合缓存决策与缓存替换,基于设计的Beacon报文实现多车之间的信息共享,实现了车辆用户之间的协同缓存更新策略,如图4所示,本发明的方法相比于现有技术,内容请求成功率更高,图4中,PGCD-LRU表示使用PGCD算法决策是否进行缓存,并用LRU算法进行缓存替换;Prob(0.5)-LRU表示使用Prob(0.5)算法决策是否进行缓存,并用LRU算法进行缓存替换;LCE-LRU表示使用LCE算法决策是否进行缓存,并用LRU算法进行缓存替换;C-PGCU为本发明的协同缓存更新方法;PGCU表示不使用Beacon帧对车辆之间进行协同的情况下进行缓存更新;本领域的技术人员应知当内容请求成功率提高时,表明本发明的方法更为有效的利用了车辆上有限的空间,即本发明的方法一定程度上避免出现缓存的大量冗余,并提高对车辆用户上有限缓存空间的利用率。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (5)

1.一种车联信息中心网络的协同缓存更新方法,其特征在于,包括:
S1、若收到的报文为Interest报文,则根据Interest报文请求的内容是否存在于缓存中更新收益;否则收到Data报文,执行步骤S2;
S2、收到Data报文,若为Beacon报文,则根据Beacon报文内容进行信息更新;否则执行步骤S3;
S3、当收到非Beacon的Data报文,进行缓存决策与缓存替换;步骤S3具体包括以下分步骤:
S31、当收到非Beacon的Data报文,将当前的收益存入轨迹,确定环境状态;
S32、确定当前神经网络的参数θ;计算式为:
Figure FDA0002412161100000011
其中,t表示时间T中的某个时隙,n表示轨迹的标号,α为学习率,
Figure FDA0002412161100000012
表示在轨迹n中时隙t对应的行为,
Figure FDA0002412161100000013
表示在轨迹n中时隙t对应的状态,
Figure FDA0002412161100000014
表示在轨迹n中时间[t,T]内的收益之和;
S33、根据步骤S32确定的当前神经网络的参数θ,将步骤S31中的环境状态作为神经网络的输入,得到采取每一种行为的概率,并根据该概率随机选择一个行为执行;
S34、根据步骤S33所选择的行为,若需要替换缓存,则收益r=-ch;否则令收益r=0;其中ch为缓存更新的负收益;
S35、将步骤S31的环境状态与步骤S33选择的行为存入轨迹。
2.根据权利要求1所述的一种车联信息中心网络的协同缓存更新方法,其特征在于,步骤S1所述根据Interest报文请求的内容是否存在于缓存中更新收益,具体为:当Interest报文请求的内容存在于缓存中时,根据公式r=r+wstep更新收益;当Interest报文请求的内容不存在于缓存中时,根据公式r=r-mstep更新收益;
其中,r表示收益,wstep表示正收益,mstep表示负收益。
3.根据权利要求2所述的一种车联信息中心网络的协同缓存更新方法,其特征在于,每次命中缓存根据Interest报文的累积跳数,设置正收益wstep;每次命中失败设置负收益mstep
4.根据权利要求1所述的一种车联信息中心网络的协同缓存更新方法,其特征在于,步骤S2所述信息更新,包括:邻居车辆存储的内容、邻居车辆请求内容的期望跳数、邻居车辆对内容流行度的估计、邻居车辆的轨迹信息。
5.根据权利要求1所述的一种车联信息中心网络的协同缓存更新方法,其特征在于,步骤S35所述轨迹为:{s1,a1,r1,…,sT,aT,rT}~πθ
其中,r1、rT表示收益,π表示策略,θ表示策略π所使用的参数;s1表示当前轨迹在时隙t对应的状态,sT表示当前轨迹在时隙T对应的状态,a1表示当前轨迹在时隙t对应的行为,aT表示当前轨迹在时隙T对应的行为。
CN201910379979.0A 2019-05-08 2019-05-08 一种车联信息中心网络的协同缓存更新方法 Active CN110113418B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910379979.0A CN110113418B (zh) 2019-05-08 2019-05-08 一种车联信息中心网络的协同缓存更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910379979.0A CN110113418B (zh) 2019-05-08 2019-05-08 一种车联信息中心网络的协同缓存更新方法

Publications (2)

Publication Number Publication Date
CN110113418A CN110113418A (zh) 2019-08-09
CN110113418B true CN110113418B (zh) 2020-06-02

Family

ID=67488824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910379979.0A Active CN110113418B (zh) 2019-05-08 2019-05-08 一种车联信息中心网络的协同缓存更新方法

Country Status (1)

Country Link
CN (1) CN110113418B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110933645B (zh) * 2019-11-01 2021-04-20 西安交通大学 一种基于车联网场景下的ccn停留时间内容缓存方法
CN116761152B (zh) * 2023-08-14 2023-11-03 合肥工业大学 路侧单元边缘缓存放置及内容交付方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9390289B2 (en) * 2014-04-07 2016-07-12 Palo Alto Research Center Incorporated Secure collection synchronization using matched network names
CN106028057A (zh) * 2016-05-05 2016-10-12 北京邮电大学 一种移动ccn中可伸缩编码的自适应流媒体内容的缓存方法
US9921068B2 (en) * 2017-03-09 2018-03-20 Thomas Danaher Harvey Devices and methods to facilitate escape from a venue with a sudden hazard
CN107948073B (zh) * 2017-11-21 2020-06-16 中南大学 基于ndn架构的无线数据传输方法、装置及系统
CN109302262B (zh) * 2018-09-27 2020-07-10 电子科技大学 一种基于深度确定梯度强化学习的通信抗干扰方法

Also Published As

Publication number Publication date
CN110113418A (zh) 2019-08-09

Similar Documents

Publication Publication Date Title
Zhang et al. Cooperative edge caching: A multi-agent deep learning based approach
Zhou et al. Distributed media services in P2P-based vehicular networks
CN111416771A (zh) 基于多智能体强化学习路由策略控制路由动作的方法
CN110113418B (zh) 一种车联信息中心网络的协同缓存更新方法
Zhao et al. Towards cooperative caching for vehicular networks with multi-level federated reinforcement learning
Xu et al. An actor-critic-based transfer learning framework for experience-driven networking
Zhang et al. icache: An intelligent caching scheme for dynamic network environments in icn-based iot networks
CN115714814B (zh) 一种基于多智能体强化学习的边缘缓存替换方法
CN110913430B (zh) 无线网络中文件的主动式协作缓存方法及缓存管理装置
Alipio et al. Deep Reinforcement Learning perspectives on improving reliable transmissions in IoT networks: Problem formulation, parameter choices, challenges, and future directions
CN111629218A (zh) 一种vanet中基于时变线性的加速强化学习边缘缓存方法
Wu et al. Ptf: Popularity-topology-freshness-based caching strategy for icn-iot networks
Alduayji et al. PF-EdgeCache: Popularity and freshness aware edge caching scheme for NDN/IoT networks
Reshadinezhad et al. An efficient adaptive cache management scheme for named data networks
Wu et al. Social-Aware Decentralized Cooperative Caching for Internet of Vehicles
Buragohain et al. Quality of Service provisioning in Named Data Networking via PIT entry reservation and PIT replacement policy
Zhang et al. Intelligent resources management system design in information centric networking
Yao et al. A POMDP framework for forwarding mechanism in named data networking
Jia et al. Cluster-based content caching driven by popularity prediction
Wei et al. Data forwarding and caching strategy for RSU Aided V-NDN
CN115643176A (zh) 社交车联网去中心化协作缓存方法
CN110012071B (zh) 用于物联网的缓存方法和装置
Zhi et al. GAC: Gain-aware 2-round cooperative caching approach in information-centric networking
Niknia et al. Edge Caching Based on Deep Reinforcement Learning
Hou et al. An Optimized GNN-Based Caching Scheme for SDN-Based Information-Centric Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant