CN110312277B - 一种基于机器学习的移动网络边缘协作缓存模型构造方法 - Google Patents

一种基于机器学习的移动网络边缘协作缓存模型构造方法 Download PDF

Info

Publication number
CN110312277B
CN110312277B CN201910277048.XA CN201910277048A CN110312277B CN 110312277 B CN110312277 B CN 110312277B CN 201910277048 A CN201910277048 A CN 201910277048A CN 110312277 B CN110312277 B CN 110312277B
Authority
CN
China
Prior art keywords
base station
user
content
cache
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910277048.XA
Other languages
English (en)
Other versions
CN110312277A (zh
Inventor
王晓飞
李丁
李文凯
韩溢文
王晨阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Cloud Computing Shanghai Co ltd
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201910277048.XA priority Critical patent/CN110312277B/zh
Publication of CN110312277A publication Critical patent/CN110312277A/zh
Application granted granted Critical
Publication of CN110312277B publication Critical patent/CN110312277B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic

Abstract

本发明公开了一种基于机器学习的移动网络边缘协作缓存模型构造方法,步骤1、根据用户发送内容请求数据建立网络训练模型;步骤2、网络训练模型中判断路由模块按照自适应选择动作要求对用户发送内容请求数据进行基站识别;步骤3、网络训练模型中更新模块按照替换动作要求对本地基站缓存替换;步骤4、重复步骤1~3直至网络训练模型稳定,该方法可以显著降低用户接入时延、提高缓存命中率已经缓解主干网流量压力。

Description

一种基于机器学习的移动网络边缘协作缓存模型构造方法
技术领域
本发明涉及移动通信领域,尤其涉及一种基于机器学习的移动网络边缘协作缓存机制。
背景技术
随着无线接入技术和移动设备的迅速发展,互联网服务和应用程序逐渐迁移到移动网络。移动网络流量呈现爆发式的突涨,有限的无线频谱资源及传统的移动网络架构很难应付移动流量的爆发式增长。与此同时,移动用户对业务服务质量的要求也不断提升。研究发现大部分流量用于下载相同的流行内容, 这给移动网络带来了极大压力与挑战,重复内容传输增大了回传链路压力、浪费网络资源,降低用户体验。缓存技术应用十分广泛,从计算机系统的内存缓存,到网络系统网页缓存,再到内容核心网、云存储系统。在移动边缘网络中,以基站为主的蜂窝接入网中,每次用户请求视频、社交等业务,从基站到远端服务器之间都会产生很大的时延,更何况在短时间内大量用户对统一热门内容提出传输请求时,给网络链路带来了巨大的压力,同时造成带宽资源浪费、用户体验差等问题。为了避免上述问题,在边缘网络中部署缓存成为新的解决方案。
在基站部署缓存是移动边缘缓存的重要实现方式。在基站部署缓存是移动边缘缓存的重要实现方式。其中,根据缓存的部署位置,可将基站缓存分为宏基站缓存和微基站缓存,一般宏基站的覆盖面积、缓存容量会更大些。当基站部署缓存之后,用户请求内容的流程为:(1)用户发起内容请求,如果在小基站命中缓存,则小基站立刻响应用户;(2)如果在小基站没有命中,小基站将用户的内容请求转发至宏基站,如果在宏基站命中缓存,则立刻响应用户;(3) 如果在宏基站也没有命中,宏基站将用户请求转发至移动核心网,直至目标内容。在基站部署缓存,可以极大地缓解回程链路和移动核心网络的压力,并降低网络时延。
移动边缘缓存特性:(1)用户终端的移动性。无线边缘网络最大的特征就是用户终端的移动性,终端位置的持续变动会改变网络的拓扑结构,这就需要具备自适应的缓存策略来进行调整。(2)边缘网络的复杂性。信道的衰落和干扰导致无线环境的不确定性,缓存内容所需要的最佳环境可能在无线环境发生变化时失效。(3)缓存空间的有限性。单个基站或者用户终端的存储空间相对于主干网的存储空间都是有限的,再加上接入单个基站的用户数很少,可能导致缓存的命中率低。
缓存策略解决的问题是何处缓存,缓存哪些内容,如何更新缓存内容。缓存策略可以借助长期稳定的网络信息,如用户的历史请求、内容的流行度、网络拓扑、信道信息和用户时变的位置信息等。传统的缓存替换策略有基于时间的和频率,分别删除最近最少使用的对象(LRU)和最不常用的对象(LFU),以及随机替、语义替换。上述缓存替换算法只考虑了内容访问的本地特征,由于缺乏基站间的协作,将这些基于本地信息的方法用于基站缓存替换时,存在缓存资源利用率不高的问题。与此同时,这些工作主要侧重于通过传统优化技术寻找最佳/次优解决方案,在动态环境中通常缺乏自适应性,并且需要几乎在现实世界中无法获取的全局信息。人工智能(AI)与机器学习(Machine Learning) 在无线通信中受到越来越多的关注。强化学习(Reinforcement Learning)是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。这个方法具有普适性,因此在其他许多领域都有研究,例如博弈论、控制论、运筹学、信息论、仿真优化、多主体系统学习、群体智能、统计学以及遗传算法。该领域的自适应环境的性能可以为边缘网络缓存问题提供解决方案。
发明内容
本发明的目的是提供面向移动网络中边缘协作缓存的解决方案,基于各层基站的计算存储能力,形成分层协作、同层协作的缓存框架以支撑大规模各类型的智能终端,并以学习机制来适应复杂动态多变的用户请求与网络环境,解决各层基站的内容请求路由与缓存替换问题,从而达到提高用户上网体验,减少用户访问时延。
为了解决现有问题,本发明所采用的技术方案是:
一种基于移动边缘协助缓存的通信网络模型构建方法,包括如下步骤:
步骤1、根据用户发送内容请求数据建立网络训练模型;
步骤2、网络训练模型中判断路由模块按照自适应选择动作要求对用户发送内容请求数据进行基站识别;
2.1若所选动作为本地基站,则本地基站中存在用户请求内容副本;
2.2若所选动作为协作基站服务,则将该次请求交由协作基站处理;
2.3若所选动作为远程网站服务,则该次请求传递至运营商网络,再由运营商网络从内容服务商请求内容;
2.31所述远程网站对缓存进行判断,若远程网站缓存已满,则进行缓存替换;否则执行请求内容;
步骤3、网络训练模型中更新模块按照替换动作要求对本地基站缓存替换;
步骤4、重复步骤1~3直至网络训练模型稳定。
使用强化学习(Q-learning)进行模型自适应学习,步骤如下:
定义最优缓存策略:π*={π*(s1),π*(s2),...,π*(sn)}
获取价值函数:Vπ(s,a)=E[R(s1,a1)+γ2R(s2,a2)+...|s1=s,π]
贝尔曼方程转换:
Figure BDA0002020353010000031
获取最优Q值:
Figure BDA0002020353010000032
f)迭代最优Q值方差:
Figure BDA0002020353010000041
与现有技术相比,本发明具有的优点:
与现有技术相比,本发明具有以下明显的优势和有意效果:
本发明提出一种基于学习的协作边缘缓存机制,区别于传统的单基站协作,提高了缓存性能,并且并非通过传统优化技术寻找最佳/次优解决方案,而是采用学习机制动态适应环境的变化。
本发明将内容流行度、传输时延具体模型化,将缓存替换问题与路由分发问题建模为MDP过程,着重于最小化用接入时延,以用户的服务体验来构建移动通信接入的通信模型。实验表明,运用本方法可以显著降低用户接入时延、提高缓存命中率已经缓解主干网流量压力。
附图说明
图1本发明一种基于机器学习的移动网络边缘协作缓存机制流程图;
图2边缘协作缓存体系架构;
具体实施方式
本发明的系统流程图如图1~2所示。
一种基于移动边缘协助缓存的通信网络模型构建方法,包括如下步骤:
步骤1、根据用户发送内容请求数据建立网络训练模型;即,用户使用移动发送内容请求(以视频内容为例),设备所接入的本地使用检测技术(如字段拦截、DPI检测)提取与视频内容相关的信息;本发明对用户请求处理是基于ZIPF定律对内容流行度建模:
Figure BDA0002020353010000042
其中Rf代表内容f流行度降序的等级,β代表偏度因子。我们假设
步骤2、网络训练模型中判断路由模块按照自适应选择动作要求对用户发送内容请求数据进行基站识别;
本发明对基站识别基于香浓定律技术无线传输速率与时延,即总体内容流行度变化缓慢。
本发明运用香农定律无线传输速率建模:
Figure BDA0002020353010000051
其中w表示信道带宽,σ2表示噪声功率,qu表示基站n对用户u的传输功率, gu,n表示信道增益,该值取决于基站n与用户u的距离。
2.1若所选动作为本地基站,则本地基站中存在用户请求内容副本;
2.2若所选动作为协作基站服务,则将该次请求交由协作基站处理;
2.3若所选动作为远程网站服务,则该次请求传递至运营商网络,再由运营商网络从内容服务商请求内容;
本发明使用强化学习(Q-learning)进行模型自适应学习,步骤如下:
定义最优缓存策略:π*={π*(s1),π*(s2),...,π*(sn)}
a)获取价值函数:Vπ(s,a)=E[R(s1,a1)+γ2R(s2,a2)+...|s1=s,π]
b)贝尔曼方程转换:
Figure BDA0002020353010000052
c)获取最优Q值:
Figure BDA0002020353010000053
d)迭代最优Q值方差:
Figure BDA0002020353010000054
2)其中,使用Double DQN解决Q-learning高维难收敛以及过估计问题:
最优状态-动作Q函数近似:Q(s,a)≈Q(s,a;θ)
e)获取损失函数:
Figure BDA0002020353010000055
f)计算θ的梯度,实现End-to-end的优化目标;
2.31所述远程网站对缓存进行判断,若远程网站缓存已满,则进行缓存替换;否则执行请求内容;所述步骤2.31中对缓存替换按照如下方法:
使用马尔科夫决策过程对请求路由与内容替换问题建模:
g)状态s:当前请求内容+当前缓存情况;
h)动作a:1.用户请求由本地基站服务;
2.用户请求由协作基站服务;
3.用户请求由内容服务商服务;
i)奖励函数R(s,a):基于用户传输时延制定;
步骤3、网络训练模型中更新模块按照替换动作要求对本地基站缓存替换;本地基站进行缓存替换选择,基于训练模型选取替换动作,若所选动作为不替换,则保存之前的缓存状态。若动作为替换某个内容,则基站执行替换策略;
基于时延,对所选动作进行奖惩,若是更合理的动作,则用户时延必会减少,加大奖励,若是不合理动作,用户时延加大,进行惩罚,引导基站朝着最小化时延的方向更新训练模型
步骤4、重复步骤1~3直至网络训练模型稳定。
应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (1)

1.一种基于机器学习的移动网络边缘协作缓存模型构造方法,其区别特征在于:包括如下步骤:
步骤1、根据用户发送内容请求数据建立网络训练模型;对用户请求处理是基于ZIPF定律对内容流行度建模:
Figure FDA0003290875080000011
其中Rf代表内容f流行度降序的等级,β代表偏度因子;
步骤2、网络训练模型中判断路由模块按照自适应选择动作要求对用户发送内容请求数据进行基站识别;所述步骤2中的判断路由模块自适应选择动作过程:
a)定义最优缓存策略:π*={π*(s1),π*(s2),...,π*(sn)}
b)获取价值函数:Vπ(s,a)=E[R(s1,a1)+γ2R(s2,a2)+...|s1=s,π]
c)贝尔曼方程转换:
Figure FDA0003290875080000012
d)获取最优Q值:
Figure FDA0003290875080000013
e)迭代最优Q值方差:
Figure FDA0003290875080000014
其中:
2.1若所选动作为本地基站,则本地基站中存在用户请求内容副本;
2.2若所选动作为协作基站服务,则将该次请求交由协作基站处理;
2.3若所选动作为远程网站服务,则该次请求传递至运营商网络,再由运营商网络从内容服务商请求内容;
2.31所述远程网站对缓存进行判断,若远程网站缓存已满,则进行缓存替换;否则执行请求内容;包括如下步骤:
使用马尔科夫决策过程对请求路由与内容替换问题建模:
运用香农定律无线传输速率建模:
Figure FDA0003290875080000021
其中:w表示信道带宽,σ2表示噪声功率,qu表示基站n对用户u的传输功率,gu,n表示信道增益,该值取决于基站n与用户u的距离;状态s:当前请求内容+当前缓存情况;动作a:1.用户请求由本地基站服务;
2.31a.用户请求由协作基站服务;
2.31b.用户请求由内容服务商服务;
f)奖励函数R(s,a):基于用户传输时延制定;
步骤3、网络训练模型中更新模块按照替换动作要求对本地基站缓存替换;本地基站进行缓存替换选择,基于训练模型选取替换动作,若所选动作为不替换,则保存之前的缓存状态;若动作为替换某个内容,则基站执行替换策略;
基于时延,对所选动作进行奖惩,若是更合理的动作,则用户时延必会减少,加大奖励;若是不合理动作,用户时延加大,进行惩罚,引导基站朝着最小化时延的方向更新训练模型;
步骤4、重复步骤1~3直至网络训练模型稳定。
CN201910277048.XA 2019-04-08 2019-04-08 一种基于机器学习的移动网络边缘协作缓存模型构造方法 Active CN110312277B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910277048.XA CN110312277B (zh) 2019-04-08 2019-04-08 一种基于机器学习的移动网络边缘协作缓存模型构造方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910277048.XA CN110312277B (zh) 2019-04-08 2019-04-08 一种基于机器学习的移动网络边缘协作缓存模型构造方法

Publications (2)

Publication Number Publication Date
CN110312277A CN110312277A (zh) 2019-10-08
CN110312277B true CN110312277B (zh) 2022-01-28

Family

ID=68074447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910277048.XA Active CN110312277B (zh) 2019-04-08 2019-04-08 一种基于机器学习的移动网络边缘协作缓存模型构造方法

Country Status (1)

Country Link
CN (1) CN110312277B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110968816B (zh) * 2019-12-23 2023-11-28 广东技术师范大学 一种基于强化学习的内容缓存方法、装置及存储介质
CN111885113B (zh) * 2020-06-24 2021-09-28 天津大学 一种社交网络中锚定节点的自适应选取和资源分配方法
CN111815367A (zh) * 2020-07-22 2020-10-23 北京工业大学 基于边缘缓存的网络利润最优化分配机制构建方法
CN112218337B (zh) * 2020-09-04 2023-02-28 暨南大学 一种移动边缘计算中的缓存策略决策方法
CN113395333B (zh) * 2021-05-31 2022-03-25 电子科技大学 基于智能体深度增强学习的多边缘基站联合缓存替换方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1346289A1 (en) * 2000-11-30 2003-09-24 Appfluent Technology, Inc. System and method for delivering dynamic content
CN102088389A (zh) * 2009-12-02 2011-06-08 中兴通讯股份有限公司 一种分布式内容存取调度装置和内容读取方法
CN102812450A (zh) * 2009-10-30 2012-12-05 时代华纳有线公司 用于在内容递送网络上进行经包化内容递送的方法及设备
WO2013044821A1 (en) * 2011-09-29 2013-04-04 Hangzhou H3C Technologies Co., Ltd. Learning a mac address

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1346289A1 (en) * 2000-11-30 2003-09-24 Appfluent Technology, Inc. System and method for delivering dynamic content
CN102812450A (zh) * 2009-10-30 2012-12-05 时代华纳有线公司 用于在内容递送网络上进行经包化内容递送的方法及设备
CN102088389A (zh) * 2009-12-02 2011-06-08 中兴通讯股份有限公司 一种分布式内容存取调度装置和内容读取方法
WO2013044821A1 (en) * 2011-09-29 2013-04-04 Hangzhou H3C Technologies Co., Ltd. Learning a mac address

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Q-Learning based Edge Caching Optimization for D2D Enabled Hierarchical Wireless Networks;Chenyang Wang;《2018 IEEE 15th International Conference on Mobile Ad-hoc and Sensor Systems》;20181210;正文第56-59页 *

Also Published As

Publication number Publication date
CN110312277A (zh) 2019-10-08

Similar Documents

Publication Publication Date Title
CN110312277B (zh) 一种基于机器学习的移动网络边缘协作缓存模型构造方法
Hu et al. Twin-timescale artificial intelligence aided mobility-aware edge caching and computing in vehicular networks
CN113114756A (zh) 一种移动边缘计算中自适应码率选择的视频缓存更新方法
CN108093435B (zh) 基于缓存流行内容的蜂窝下行链路网络能效优化系统及方法
CN112218337A (zh) 一种移动边缘计算中的缓存策略决策方法
Li et al. Deep reinforcement learning for cooperative edge caching in future mobile networks
CN108600998B (zh) 超密度蜂窝与d2d异构融合网络缓存优化决策方法
CN114390057B (zh) Mec环境下基于强化学习的多接口自适应数据卸载方法
Guo et al. Dueling deep-Q-network based delay-aware cache update policy for mobile users in fog radio access networks
CN108541025B (zh) 一种面向无线异构网络的基站与d2d共同缓存方法
He et al. Cache-enabled coordinated mobile edge network: Opportunities and challenges
CN114553963A (zh) 移动边缘计算中基于深度神经网络的多边缘节点协作缓存方法
Zhang et al. Two time-scale caching placement and user association in dynamic cellular networks
CN114615730B (zh) 回程受限密集无线网络面向内容覆盖的功率分配方法
CN116321307A (zh) 一种无蜂窝网络中基于深度强化学习的双向缓存放置方法
CN113993168B (zh) 一种雾无线接入网中基于多智能体强化学习的协作缓存方法
Xie et al. Energy‐efficient hierarchical cooperative caching optimisation for 5G networks
Huang et al. D2D-assisted VR video pre-caching strategy
Xu et al. Intelligent edge content caching: A deep recurrent reinforcement learning method
Xu et al. Social-aware D2D caching content deployment strategy over edge computing wireless networks
Zheng et al. Reinforcement learning for energy-efficient edge caching in mobile edge networks
CN112822727B (zh) 一种基于移动性和流行度感知的自适应边缘内容缓存方法
CN113411862B (zh) 一种动态蜂窝网络中的缓存放置和用户接入方法及装置
CN113115362B (zh) 协同边缘缓存方法及装置
CN113766540B (zh) 低时延的网络内容传输方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220713

Address after: 200120 rooms 902A and 902B, block B, No. 112, liangxiu Road, pilot Free Trade Zone, Pudong New Area, Shanghai

Patentee after: PPLABS NETWORK TECHNOLOGY (SHANGHAI) Co.,Ltd.

Address before: 300072 Tianjin City, Nankai District Wei Jin Road No. 92

Patentee before: Tianjin University

TR01 Transfer of patent right
CP01 Change in the name or title of a patent holder

Address after: 200120 rooms 902A and 902B, block B, No. 112, liangxiu Road, pilot Free Trade Zone, Pudong New Area, Shanghai

Patentee after: Pioneer Cloud Computing (Shanghai) Co.,Ltd.

Address before: 200120 rooms 902A and 902B, block B, No. 112, liangxiu Road, pilot Free Trade Zone, Pudong New Area, Shanghai

Patentee before: PPLABS NETWORK TECHNOLOGY (SHANGHAI) Co.,Ltd.

CP01 Change in the name or title of a patent holder