CN110012299B - 一种基于线性加权原则的多目标主动缓存的在线学习方法 - Google Patents

一种基于线性加权原则的多目标主动缓存的在线学习方法 Download PDF

Info

Publication number
CN110012299B
CN110012299B CN201910162538.5A CN201910162538A CN110012299B CN 110012299 B CN110012299 B CN 110012299B CN 201910162538 A CN201910162538 A CN 201910162538A CN 110012299 B CN110012299 B CN 110012299B
Authority
CN
China
Prior art keywords
file
value
representing
files
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910162538.5A
Other languages
English (en)
Other versions
CN110012299A (zh
Inventor
陈特
董彬虹
陈延涛
张存林
曹蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201910162538.5A priority Critical patent/CN110012299B/zh
Publication of CN110012299A publication Critical patent/CN110012299A/zh
Application granted granted Critical
Publication of CN110012299B publication Critical patent/CN110012299B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2183Cache memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/231Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
    • H04N21/23106Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion involving caching operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4331Caching operations, e.g. of an advertisement for later insertion during playback

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

该发明公开了一种基于线性加权原则的多目标主动缓存的在线学习方法,该方法属于移动通信领域,主要涉及移动通信中基站在无线网络闲暇时从内容提供商处提前缓存附近用户所需求内容并同时考虑了内容提供商收益的方法。本方法简单、算法复杂度为对数函数级别。其次,在优先考虑了无线缓存的核心目标的同时,即在有限时间内,最大化卸载回程链路中的累计流量,还考虑了内容提供商的收益,即具体表现在文件价值的重要性上。本方法兼顾多个目标,能较好符合无线通信收发双方的需求。

Description

一种基于线性加权原则的多目标主动缓存的在线学习方法
技术领域
本发明属于移动通信领域,主要涉及移动通信中基站在无线网络闲暇时从内容提供商处提前缓存附近用户所需求内容并同时考虑了内容提供商收益的方法。该方法具体为一种基于线性加权原则的多目标主动缓存的在线学习方法。
背景技术
近年来,随着带有多媒体功能的移动设备(如智能手机,平板电脑等)逐渐普及,新型的无线服务应用也大量涌现,如微信,视频,淘宝,微博等。这使得无线移动通信的功能由最初的通话渗透到了娱乐,办公,社交领域等方方面面。与此同时,这也促使了在无线网络中数据流量的急速增长。
移动数据流量的爆发式增长对现有的蜂窝网络基础设施是个巨大的负担,特别是在通信的高峰期,容易出现延迟、中断等状况,导致用户体验变差。同时,根据最新的2018年思科移动流量趋势表明,在未来移动数据流量中,移动视频流量比重将超过七成。因此,基于视频本身的特性以及硬盘存储的现实,有学者提出了一种名为无线缓存的解决方案,其基本思想是在无线接入点处配置大容量的存储器,利用非高峰时段(如夜间)将受欢迎的视频提前缓存到接入点处的存储器中。通过这样的方式,用户在请求视频文件时,若缓存中有请求文件,无线接入点可以直接将文件传输给用户,使流量本地化。这种处理方式不仅能够大大降低数据在回程链路及核心网络的延迟,而且也降低了高峰期时回程链路及核心网络的负载。同时,这也降低了回程链路容量的占用量,可以释放更多的网络资源来为其他业务服务,间接地提升了系统的吞吐量。
另外,文件内容属性也是一个不能忽略的因素,目前各大视频网站(比如,爱奇艺,腾讯视频,优酷等)版权费用逐年提升,内容提供商们会将优质、热门的影片采用分级的方式进行播出,比如用券、会员、收费等方式来赚取视频文件的费用,并且不同的视频的来源很可能不一样,这是由于版权决定的。以及各大移动网络运营商(移动、联通、电信)也与内容提供商们合作,采取定向流量包的方式吸引用户群,使之能培养用户的习惯,从而占据更高的流量入口。综上,这些都说明了不同视频文件的价值是不同的,而且文件价值的属性与用户、微基站、内容提供商的这三者的利益都息息相关。
文件流行度分布是一个重要因素指导这着本地基站缓存哪些文件。大多数研究工作假设流行度已知并且设计出的缓存策略都是基于这种假设。然而实际上,流行度是未知并且需要预测的。最近,有研究人员利用机器学习的方式去预测文件流行度,他们将无线缓存问题构建为一个多臂老虎机模型,并基于预测的结果来设计缓存策略。
这些研究工作仅仅考虑了如何最大化直接从微基站中获取流量,这是从用户、微基站的角度来考虑流量收益。然而,这不可避免地忽略了每个文件价值的差异性,而文件价值属性取决于文件的来源,即内容提供商。
发明内容
为了解决以上问题,本发明提出的方法具体为一种基于线性加权原则的多目标主动缓存的在线学习的方法。该方法在保证最大化卸载网络流量损失较小的情况下,同时考虑到不同文件价值差异的情况下,尽可能地最大化文件价值的累计收益。为了方便地描述本发明的内容,首先对本发明所使用的模型进行介绍,对本发明所使用的术语进行定义。
系统模型介绍:如图1所示,该模型的意义是:在闲暇时间段内,微基站的缓存控制器根据当前文件流行度趋势分析,从内容提供商处下载所需的缓存文件,当小区内的用户请求网络下载所需文件时,若该文件在微基站的存储内,则微基站服务于该用户,若否,则宏基站服务于该用户。一般来说,在无线电覆盖区域中,基站(Base Station,BS)是终端之间进行信息传输的无线收发电台。本发明考虑在基站中配置具有缓存一定数量文件能力的储存器,对流行文件进行缓存。假设文件集合为F={f1,f2,...fn},且所有文件的大小相同。基站的容量可描述为基站最大可在文件集合中缓存m个文件。时间间隙设置为t=1,2,...,T,其中T表示时间终点,也可表示时隙长度。本发明的解决的问题是:在时间T内,保证在通信高峰期内卸载回程链路上的文件流量最大化(主目标:从通信运营商角度),同时也能保证其卸载文件的收益最大化(次目标:从内容提供商角度)。
定义1、每个文件的估计奖赏向量值定义为
Figure BDA0001985148210000021
其中,上标1,2分别表示当前时刻下的文件f的期望请求数、文件的期望价值。
定义2、定义当前时刻缓存文件的集合为Ct={f1 *,...,fm *},该集合中的元素个数为 m且m<|F|。
定义3、定义标量化函数集合S=(h1,h2,...,hs),
Figure BDA0001985148210000022
Figure BDA0001985148210000023
其中hs表示的是第s组函数权重值,
Figure BDA0001985148210000024
分别表示卸载流量和文件收益的权重。
定义4、定义每个文件的观察反馈奖赏值为rf t=(rf 1,rf 2),其中rf 1,rf 2分别表示当前时刻下的文件f的请求量、文件f的价值。
定义5、定义每个文件的置信上界区间值为
Figure BDA0001985148210000031
其中,
Figure BDA0001985148210000032
表示文件f在第j组权重值下的估计值,tj表示的是第j权重被选中的次数,Nf,j表示的是文件f在第j组权重下被选中的次数。
本发明技术方案如下:
该方法具体为一种基于多目标多臂赌博机在线学习的无线缓存方法,该方法是对标准 UCB1(upper confidence bound)方法的改进,通过该改进的方法能够解决无线缓存中多目标优化问题:即保证在通信高峰期内卸载回程链路上的视频流量最大化(主目标:从通信运营商角度),同时也能保证其卸载视频的收益最大化(次目标:从内容提供商角度)。
本方法是一种基于多目标多臂赌博机的在线学习无线缓存策略的方法,具体包括以下步骤:
步骤1、设置当前标量化函数集S=(h1,h2,...,hs),时间周期T,其中
Figure BDA0001985148210000022
Figure BDA0001985148210000023
hs表示的是第s组函数权重值,
Figure BDA0001985148210000035
分别表示卸载流量和文件收益的权重;
步骤2、初始化阶段:缓存当前内容提供商的所有文件至少一次,观察反馈奖赏向量rf t,并且更新
Figure BDA0001985148210000036
值和Tf,s值,
Figure BDA0001985148210000037
其中,
Figure BDA0001985148210000038
表示文件f在第s权重函数下的估计奖赏值,Tf,s代表的是文件f第s权重函数下被选中的次数;设置t←F+1,其中文件集合为F={f1,f2,...fn},其中
Figure BDA0001985148210000039
上标1,2分别表示当前时刻下的文件f的期望请求数、文件的期望价值;
步骤3、随机从当前标量化函数集S=(h1,h2,...,hs)中选择一组权重函数hj,计算得到
Figure BDA00019851482100000310
步骤4、计算每个文件的置信上界区间值
Figure BDA00019851482100000311
根据 Xf,j(t)计算结果,按照降序方式排列不同文件的估计奖赏区间数值,然后选择前m个文件构成当前时刻的缓存文件集Ct={f1 *,f2 *,...,fm *};
步骤5、观察反馈奖赏向量rf t,
Figure BDA00019851482100000312
每个目标的观察反馈奖赏值为rf t=(rf 1,rf 2),其中,rf 1,rf 2分别表示当前时刻下的文件f的请求量、文件f的价值;
步骤6、更新
Figure BDA0001985148210000041
和Tf,j=Tf,j+1,
Figure BDA0001985148210000042
步骤7、设置t=t+1,返回步骤3。
本方法的有益效果:首先,本方法简单、算法复杂度为对数函数级别。其次,在优先考虑了无线缓存的核心目标的同时,(即在有限时间内,最大化卸载回程链路中的累计流量),还考虑了内容提供商的收益,即具体表现在文件价值的重要性上。本方法兼顾多个目标,能较好符合无线通信收发双方的需求。
附图说明
图1为无线缓存场景图;
图2为本发明算法流程图;
图3为本发明的算法仿真图,图3-1为主目标累计收益图,图3-2为次目标累计收益图。
具体实施方式
下面根据一个具体实施案例详细叙述本发明的技术方案。但不应该将此理解为本发明上述主体的范围仅限于以下实例,凡基于本发明内容所实现的技术均属于本发明的范围。
首先对本发明的具体实施范例的数据设置进行介绍。假设本发明中的文件流行度与文件的价值皆服从Zipf分布。文件流行度Zipf值设置为0.58;文件价值Zipf值为0.95。时间T=8000,用户人数为250,缓存文件数为m=60,文件数为F=1000,h=(0.55,0.45)。
如图2所示为算法的流程图,具体包括以下步骤:
步骤1、设置当前标量化函数集S=(h1,h2,...,hs),时间周期T。
步骤2、初始化阶段:缓存当前内容提供商的所有文件至少一次,观察反馈奖赏向量rf t,并且更新
Figure BDA0001985148210000043
值和Tf,s值,
Figure BDA0001985148210000044
其中,
Figure BDA0001985148210000045
表示文件f在第s权重函数下的估计奖赏值,Tf,s代表的是文件f第s权重函数下被选中的次数。设置t←F+1,其中文件集合为F={f1,f2,...fn},其中
Figure BDA0001985148210000046
其中,上标1,2分别表示当前时刻下的文件f的期望请求数、文件的期望价值。
步骤3、随机从当前标量化函数集S=(h1,h2,...,hs)中选择一组权重函数hj
步骤4、计算
Figure BDA0001985148210000051
根据Xf,j(t)计算结果,按照降序方式排列不同文件的估计奖赏区间数值,然后选择前m个文件构成当前时刻的缓存文件集 Ct={f1 *,f2 *,...,fm *}。
步骤5、观察反馈奖赏向量rf t,
Figure BDA0001985148210000052
每个目标的观察反馈奖赏值为rf t=(rf 1,rf 2)。其中,rf 1,rf 2分别表示当前时刻下的文件f的请求量、文件f的价值;
步骤6、更新
Figure BDA0001985148210000053
和Tf,j=Tf,j+1,
Figure BDA0001985148210000054
步骤7、设置t=t+1,返回步骤3。
算法的仿真性能如附图3所示,算法仿真分析如下:
仿真结果分析:从附图3中可知。在主目标(卸载流量)的累计收益图上,显然地,仅考虑了单目标的置信上界算法和贪婪算法的收益要略好于考虑了多目标的所提算法。而本专利提出的算法的性能分别在置信上界算法和贪婪算法上损失性能大约为18.9%和13.9%。至于随机算法,它的性能明显差于前面三种算法。另外,在次目标为文件价值的收益上,考虑了多目标的所提算法明显好于仅考虑单目标的其它算法,具体地,所提算法的累计收益优于贪婪算法和置信上界算法分别约为1145.7%,1218.3%。同时,所提算法的累计收益超过随机算法约为 600.8%。
综上所述,本专利提出的LB-MOMAB方法在主目标损失不大的情况下(最大损失约为18.9%),相较于其它算法,能较大提升了次目标文件累计收益的性能(上述已分析)。

Claims (1)

1.一种基于线性加权原则的多目标主动缓存的在线学习方法,具体包括以下步骤:
步骤1、设置当前标量化函数集S=(h1,h2,...,hs),时间周期T,其中:
Figure FDA0002952495690000011
Figure FDA0002952495690000012
hs表示的是第s组函数权重值,
Figure FDA0002952495690000013
分别表示卸载流量和文件收益的权重;
步骤2、初始化阶段:缓存当前内容提供商的所有文件至少一次,观察反馈奖赏向量rf t,并且更新
Figure FDA0002952495690000014
值和Tf,s值,
Figure FDA0002952495690000015
其中,
Figure FDA0002952495690000016
表示文件f在第s权重函数下的估计奖赏值,Tf,s代表的是文件f第s权重函数下被选中的次数;设置t←F+1,其中文件集合为F={f1,f2,...fn},其中
Figure FDA0002952495690000017
上标1,2分别表示当前时刻下的文件f的期望请求数、文件的期望价值;
步骤3、随机从当前标量化函数集S=(h1,h2,...,hs)中选择一组权重函数hj,计算得到
Figure FDA0002952495690000018
步骤4、计算每个文件的置信上界区间值
Figure FDA0002952495690000019
其中Nf,j表示文件f在权重函数j下的的缓存次数,根据Xf,j(t)计算结果,按照降序方式排列不同文件的估计奖赏区间数值,然后选择前m个文件构成当前时刻的缓存文件集Ct={f1 *,f2 *,...,fm *};
步骤5、观察反馈奖赏向量rf t,
Figure FDA00029524956900000110
每个目标的观察反馈奖赏值为rf t=(rf 1,rf 2),其中,rf 1,rf 2分别表示当前时刻下的文件f的请求量、文件f的价值;
步骤6、更新
Figure FDA00029524956900000111
和Tf,j=Tf,j+1,
Figure FDA00029524956900000112
步骤7、设置t=t+1,返回步骤3。
CN201910162538.5A 2019-03-05 2019-03-05 一种基于线性加权原则的多目标主动缓存的在线学习方法 Active CN110012299B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910162538.5A CN110012299B (zh) 2019-03-05 2019-03-05 一种基于线性加权原则的多目标主动缓存的在线学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910162538.5A CN110012299B (zh) 2019-03-05 2019-03-05 一种基于线性加权原则的多目标主动缓存的在线学习方法

Publications (2)

Publication Number Publication Date
CN110012299A CN110012299A (zh) 2019-07-12
CN110012299B true CN110012299B (zh) 2021-04-30

Family

ID=67166481

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910162538.5A Active CN110012299B (zh) 2019-03-05 2019-03-05 一种基于线性加权原则的多目标主动缓存的在线学习方法

Country Status (1)

Country Link
CN (1) CN110012299B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102932913B (zh) * 2012-10-24 2018-10-26 南京中兴新软件有限责任公司 获取mab终端接入位置的方法、服务器、网关及系统
CN106851731B (zh) * 2017-03-07 2019-11-15 电子科技大学 一种最大化卸载概率的d2d缓存分配方法
KR101928650B1 (ko) * 2017-03-29 2018-12-13 한국과학기술원 제한된 캐시 메모리 환경에서 파일 및 화질의 선호도를 고려한 파일 저장 방법 및 파일 저장 장치
CN107171961B (zh) * 2017-04-28 2019-12-03 中国人民解放军信息工程大学 基于内容流行度的缓存方法及其装置
CN107943720A (zh) * 2017-11-29 2018-04-20 武汉理工大学 混合云中基于文件收益及优先级权重的lru缓存优化算法

Also Published As

Publication number Publication date
CN110012299A (zh) 2019-07-12

Similar Documents

Publication Publication Date Title
Jiang et al. Multi-agent reinforcement learning based cooperative content caching for mobile edge networks
US8355384B2 (en) System and method of handover in wireless network
Jiang et al. Learning-based cooperative content caching policy for mobile edge computing
CN106851731B (zh) 一种最大化卸载概率的d2d缓存分配方法
CN108848395B (zh) 基于果蝇优化算法的边缘协作缓存布置方法
US9560694B2 (en) Cache-induced opportunistic MIMO cooperation for wireless networks
CN112702443B (zh) 一种星地协同通信系统多星多级缓存分配方法及装置
CN101800749A (zh) 管理对等端之间的数据传输的方法和管理设备
EP2649541A2 (en) Resource profile adjustment for pre-fetching of assets to user equipment
CN107949007A (zh) 无线缓存系统中基于拍卖理论的一种资源分配算法
CN112996058A (zh) 基于多无人机网络的用户QoE优化方法、无人机及系统
CN113115362B (zh) 协同边缘缓存方法及装置
CN108810139B (zh) 一种基于蒙特卡洛树搜索辅助的无线缓存方法
KR101924628B1 (ko) 트래픽 오프로딩을 제어하기 위한 장치 및 방법
CN109982389B (zh) 一种基于多目标多臂赌博机在线学习的无线缓存方法
CN110012299B (zh) 一种基于线性加权原则的多目标主动缓存的在线学习方法
CN110247953B (zh) 一种基于超级帕累托原则的多目标在线学习的无线缓存方法
US20230231813A1 (en) Enhanced network with data flow differentiation
CN108668288B (zh) 用于优化无线缓存网络中小基站位置的方法
Yao et al. Joint caching in fronthaul and backhaul constrained C-RAN
KR101937558B1 (ko) 저장 장치 활용 기지국의 저장 용량 및 백홀 사용량 최적화 방법 및 송신 장치
CN113473408B (zh) 一种车联网中实现视频传输的用户关联方法及系统
CN114245422A (zh) 一种基于簇内智能共享的边缘主动缓存方法
Fang et al. Distributed caching popular services by using deep Q-learning in converged networks
Liu et al. Joint mixed-timescale optimization of content caching and delivery policy in NOMA-based vehicular networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant