CN111901394B - 一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统 - Google Patents

一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统 Download PDF

Info

Publication number
CN111901394B
CN111901394B CN202010646593.4A CN202010646593A CN111901394B CN 111901394 B CN111901394 B CN 111901394B CN 202010646593 A CN202010646593 A CN 202010646593A CN 111901394 B CN111901394 B CN 111901394B
Authority
CN
China
Prior art keywords
user
time period
file
vector
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010646593.4A
Other languages
English (en)
Other versions
CN111901394A (zh
Inventor
罗晶晶
戚雨龙
高林
郑福春
张钦宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN202010646593.4A priority Critical patent/CN111901394B/zh
Publication of CN111901394A publication Critical patent/CN111901394A/zh
Application granted granted Critical
Publication of CN111901394B publication Critical patent/CN111901394B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/70Services for machine-to-machine communication [M2M] or machine type communication [MTC]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统,该方法包括内容交付步骤、信息交换步骤和内容放置步骤。本发明的有益效果是:本发明所设计的缓存系统减少了传统D2D缓存系统对中心基站或者云端控制器的依赖,本发明采用了滑动窗口法预测用户在下一个时间周期的活跃程度,在缓存放置阶段每个用户可以根据预测结果和活跃用户的用户偏好进行更精准的内容放置,从而可以有效提高D2D缓存命中率。另外,如果预测结果表明下一个时间周期内某个用户周围没有活跃用户,该用户可以跳过缓存放置阶段,进而可以减少缓存更新对基站产生的流量负载。

Description

一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统
技术领域
本发明涉及移动通信领域,尤其涉及一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统。
背景技术
近年来,随着移动互联网以及相关产业的迅猛发展,无线流量呈现爆炸式增长。无线网络需要承载海量数据的传输,回传链路将成为整个网络的瓶颈所在。思科公司最新报告显示,到2022年,全球移动流量预计将达到每月77EB,与2017年相比移动流量增长了7倍,移动数据流量将从2017年到2022年以46%的复合年增长率增长,无线流量需求的快速增长会给当前无线网络带来巨大的压力。以视频文件为例,如图1所示,李凯院士团队根据社交软件FaceBook视频播放情况得出的统计结果显示,前0.1%和1%的视频分别占据了62%和83%的总视频观看时间。因此,如果能够把最具有缓存价值的文件放在蜂窝移动网络的边缘节点,这样就能极大地缓解核心网的回程链路压力。
同时,报告还显示到2022年,全球将会有57亿移动用户,巨大数量的移动设备和日渐成熟的D2D通信技术使D2D边缘缓存技术成为了热门研究方向。近年来,边缘缓存的研究工作大多都假设所有用户具有相同的个人偏好,且设计缓存策略时较少考虑用户偏好之间存在差异性。但在实际场景中,用户偏好存在明显的差异性。例如,不同的用户喜欢的电影类型不同,且具有时变性。如图2所示,对于MovieLens数据集中一部名叫“ToyStory”电影而言,可以看出,不同年龄段的用户对同一部电影的喜好程度存在明显的差异性。因此,设计更为实际的缓存策略需要考虑用户偏好之间存在的差异性。
目前学术界已经有工作考虑用户偏好差异对缓存机制设计的影响。北航的杨晨阳教授提出了一种pLSA(Probabilistic latent semantic analysis,概率隐性语义分析)模型对用户偏好进行建模,通过最大期望法得到用户偏好的模型参数,通过统计的方法可以较快速得到用户偏好模型,但模型参数一旦得到便不会发生改变,也即是认为一个人的个人喜好是固定的,这种假设是较为理想的。
发明内容
本发明针对时变用户偏好需求,提出了一种联合考虑用户偏好及用户活跃程度的移动边缘缓存的方法,致力于提高D2D缓存命中率和降低基站的回程流量压力。
本发明提供了一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法,包括如下步骤:
步骤S1,内容交付步骤:在第t个时间周期开始时,每个用户uk会首先获取当前邻居用户集合Uk,t,uk记录在当前时间周期内自身请求的所有文件的特征向量和对所有这些文件的评价,同时,uk还会记录自身在当前时间周期内请求文件的总次数;
步骤S2,信息交换步骤:判断文件请求集合是否为空,如果是,那么将用户偏好向量wt+1(k)=wt(k)和请求向量Qk广播给周围用户,否则,更新用户偏好向量然后将用户偏好向量wt+1(k)和请求向量Qk广播给周围用户;
步骤S3,内容放置步骤包括如下步骤:
步骤S31,活跃程度预测步骤:uk首先预测在下一个时间周期内所有邻居用户的活跃程度;
步骤S32,判断步骤:判断下一下时间周期内周围是否存在活跃用户,如果是,那么uk将预测下一个时间周期内的区域文件流行度,并根据周围用户的缓存状态放置缓存内容,然后执行广播步骤;如果下一下时间周期内周围不存在活跃用户,那么执行广播步骤;
步骤S33,广播步骤:uk把更新后的缓存状态广播给周围用户,作为周围用户更新缓存的依据。
作为本发明的进一步改进,在所述步骤S2,信息交换步骤中,用户uk通过训练在第t个时间周期内请求的历史文件数据来得到在第(t+1)个时间周期内的用户偏好向量wt+1(k),
Figure BDA0002573358670000021
在式(9)中,Qk,t是用户uk在第t个时间周期内请求文件的总次数,α是迭代学习率,用户uk在第t个时间周期内的用户偏好向量为wt(k)={wk,1,t,wk,2,t,…,wk,N,t}T,wk,i,t∈R,1≤i≤N,其中wk,i,t代表用户uk在第t个时间周期内对文件向量中第i维的用户偏好值。
作为本发明的进一步改进,在所述步骤S31,活跃程度预测步骤中,采用滑动窗口法预测用户活跃程度,根据最近一段时间内用户的活跃程度来预测用户在下一个时间周期内的活跃程度。
作为本发明的进一步改进,在所述步骤S31,活跃程度预测步骤中,根据滑动窗口法,用户uk预测任意用户um∈Uk,t的活跃程度λk,m,t+1
Figure BDA0002573358670000031
其中,L代表滑动窗口的长度,也即是滑动窗口内时间周期的个数,ηi代表滑动窗口内第i个时间周期的权重,ηi越大代表第i个时间周期越重要,并且满足
Figure BDA0002573358670000032
当滑动窗口的长度L大于当前时间周期t时,我们假设滑动窗口内的前(L-t)个时间周期内所有用户的请求次数为0。
作为本发明的进一步改进,在所述步骤S3,内容放置步骤中,每个用户uk首先预测周围用户的活跃程度,如果在下一个时间周期内周围存在活跃用户,uk将根据接收到的用户偏好向量和请求向量,并综合自身的用户偏好向量和请求向量,评估区域内容流行度,如果文件f已经被周围用户所缓存,uk将不会缓存文件f,这样避免了区域内出现缓存冗余,因此,文件f在用户uk处的区域文件流行度pk,t+1(f)为
Figure BDA0002573358670000033
uk将会根据式(11)预测所有文件的区域流行度,然后根据区域内容流行度,把缓存空间内的文件更新为预测结果中流行度最大的前S个文件,并把更新后的缓存状态广播给周围用户。
本发明还提供了一种联合考虑用户偏好及活跃程度的移动边缘缓存的系统,包括:
内容交付模块:用于在第t个时间周期开始时,每个用户uk会首先获取当前邻居用户集合Uk,t,uk记录在当前时间周期内自身请求的所有文件的特征向量和对所有这些文件的评价,同时,uk还会记录自身在当前时间周期内请求文件的总次数;
信息交换模块:用于判断文件请求集合是否为空,如果是,那么将用户偏好向量wt+1(k)和请求向量Qk广播给周围用户,否则,更新用户偏好向量然后将用户偏好向量wt+1(k)和请求向量Qk广播给周围用户;
内容放置模块包括:
活跃程度预测模块:用于uk首先预测在下一个时间周期内所有邻居用户的活跃程度;
判断模块:用于判断下一下时间周期内周围是否存在活跃用户,如果是,那么uk将预测下一个时间周期内的区域文件流行度,并根据周围用户的缓存状态放置缓存内容,然后执行广播模块;如果下一下时间周期内周围不存在活跃用户,那么执行广播模块;
广播模块:用于uk把更新后的缓存状态广播给周围用户,作为周围用户更新缓存的依据。
作为本发明的进一步改进,在所述信息交换模块中,用户uk通过训练在第t个时间周期内请求的历史文件数据来得到在第(t+1)个时间周期内的用户偏好向量wt+1(k),
Figure BDA0002573358670000041
在式(9)中,Qk,t是用户uk在第t个时间周期内请求文件的总次数,α是迭代学习率,用户uk在第t个时间周期内的用户偏好向量为wt(k)={wk,1,t,wk,2,t,…,wk,N,t}T,wk,i,t∈R,1≤i≤N,其中wk,i,t代表用户uk在第t个时间周期内对文件向量中第i维的用户偏好值。
作为本发明的进一步改进,在所述活跃程度预测模块中,采用滑动窗口法预测用户活跃程度,根据最近一段时间内用户的活跃程度来预测用户在下一个时间周期内的活跃程度。
作为本发明的进一步改进,在所述活跃程度预测模块中,根据滑动窗口法,用户uk预测任意用户um∈Uk,t的活跃程度λk,m,t+1
Figure BDA0002573358670000051
其中,L代表滑动窗口的长度,也即是滑动窗口内时间周期的个数,ηi代表滑动窗口内第i个时间周期的权重,ηi越大代表第i个时间周期越重要,并且满足
Figure BDA0002573358670000052
当滑动窗口的长度L大于当前时间周期t时,我们假设滑动窗口内的前(L-t)个时间周期内所有用户的请求次数为0。
作为本发明的进一步改进,在所述内容放置模块中,每个用户uk首先预测周围用户的活跃程度,如果在下一个时间周期内周围存在活跃用户,uk将根据接收到的用户偏好向量和请求向量,并综合自身的用户偏好向量和请求向量,评估区域内容流行度,如果文件f已经被周围用户所缓存,uk将不会缓存文件f,这样避免了区域内出现缓存冗余,因此,文件f在用户uk处的区域文件流行度pk,t+1(f)为
Figure BDA0002573358670000053
uk将会根据式(11)预测所有文件的区域流行度,然后根据区域内容流行度,把缓存空间内的文件更新为预测结果中流行度最大的前S个文件,并把更新后的缓存状态广播给周围用户。
本发明的有益效果是:本发明所设计的缓存系统减少了传统D2D缓存系统对中心基站或者云端控制器的依赖,联合考虑用户偏好及活跃程度对区域内容流行度的影响,依靠设备之间有限的信息交换就可以及时捕捉到区域内流行度较高的文件,算法复杂度较低易实现。所提出的缓存方法由于采用了滑动窗口法预测用户在下一个时间周期的活跃程度,在缓存放置阶段每个用户可以根据预测结果和活跃用户的用户偏好进行更精准的内容放置,从而可以有效提高D2D缓存命中率。另外,如果预测结果表明下一个时间周期内某个用户周围没有活跃用户,该用户可以跳过缓存放置阶段,进而可以减少缓存更新对基站产生的流量负载。
附图说明
图1是视频播放量与视频流行度排名的关系图;
图2是电影评分高低与用户年龄段的关系图;
图3为分布式D2D边缘缓存模型图;
图4为时间周期的划分图;
图5为缓存方案设计流程图;
图6滑动窗口法预测用户活跃程度图。
具体实施方式
本发明公开了一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统,下面进行详细说明。
一.系统模型
如图3所示,小区内有一个中心基站和K个均匀分布的智能终端用户,用户集合为U={u1,u2,...,uK},所有用户既可以与基站进行蜂窝通信,也能进行D2D通信以此实现数据共享。时间被划分为T个时间周期,即t=1,2,...,T,其中每个时间周期大小相同和T足够大。为了便于干扰管理,假设所有用户能够进行D2D通信的最大距离为RD,则在第t个时间周期内能与用户uk进行D2D通信的用户集合为um∈Uk,t={um∈U|||um-uk||≤RD},同时假设D2D通信采用正交频率以避免同信道干扰。
在不失一般性的前提下,本发明考虑一个静态文件库
Figure BDA0002573358670000061
并假设每个文件的大小相同。此外,每个文件f都有一个属于自身的N维静态特征向量x(f)={xf,1,xf,2,...,xf,N}T,x(f)∈RN。以电影文件为例,文件特征向量可能包括电影类型,电影的历史平均得分,历史观看人数和首映年份等。相应地,每个用户也有一个属于自己的用户偏好向量wt(k)={wk,t,1,wk,t,N,…,wk,t,N},wk,t,i∈R,1≤i≤N,且用户偏好向量是动态时变的。为了更完整地描述该系统,下面给出了三个描述请求信息的三个变量:
1)pk,f,t:pk,f,t∈[0,1]是指用户uk在第t个时间周期内对文件f的偏好程度,pk,f,t的值越大代表uk越喜欢文件f;
2)λk,m,t:λk,m,t∈[0,1]是指用户uk对用户um预测的用户活跃程度;
3)pk,t:pk,t是指所有文件在用户uk处的区域流行度,pk,t=[pk,t(1),pk,t(2),…,pk,t(F)],并且
Figure BDA0002573358670000071
如图4所示,每个时间周期包含3个阶段:内容交付阶段、信息交换阶段和内容放置阶段。内容交付阶段发生在每个时间周期的开始,每个用户根据自己的用户偏好独立的发出文件请求。假设Q=[Q1,Q2,...,QK]代表所有用户的文件请求矩阵,其中Qk=[Qk,1,Qk,2,...,Qk,T],k∈[1,K]是用户uk的文件请求向量,Qk,t代表uk在第t个时间周期内请求文件的总次数。当用户uk∈U在第t个时间周期内请求文件f时,用户会首先检查自身缓存空间内是否缓存了文件f;如果自身没有缓存文件f,uk会向周围用户um∈Uk,t发出文件请求,周围一跳范围内空闲的用户如果缓存f时会产生应答,然后二者建立D2D通信链路实现内容共享;如果uk自身和周围用户Uk,t都没有缓存f,uk将会向中心基站发出请求并通过核心网获得文件f。在信息交换阶段,每个用户会把更新后的用户偏好向量和请求向量广播给周围邻居用户,这些信息会被用来预测区域内容流行度。接下来,在内容放置阶段,每个用户根据预测的区域内容流行度放置或更新缓存文件。最后,每个用户在放置完缓存文件后会把自身的缓存状态告诉周围邻居用户。
二.问题建模
如果用户通过D2D通信获取内容,用户将会以较低时延满足请求,则用户体验质量更高。因此,本发明以平均D2D缓存命中率
Figure BDA0002573358670000073
作为系统优化目标。为了更好的表示
Figure BDA0002573358670000074
首先介绍如下指示变量:
1)qk,f,t:qk,f,t=1表示用户uk在第t个时间周期请求了文件f,
Figure BDA0002573358670000072
则表示未请求;
2)ak,m,t:ak,m,t=1代表用户uk和用户um在第t个时间周期可以建立D2D通信链路,ak,m,t=0则代表不可以;
3)ck,m,t:ck,m,t=1代表用户uk在第t个时间周期内缓存了文件f,ck,m,t=0则代表未缓存;
4)lk,f,t:lk,f,t=1代表用户uk在第t个时间周期内可以通过D2D通信的方式获得文件f,lk,f,t=0则代表不可以。
由于lk,f,t的值取决于用户uk和其周围邻居用户在第t个时间周期内是否缓存有文件f,因此lk,f,t可以被表示为
Figure BDA0002573358670000081
进一步地,平均D2D缓存命中率
Figure BDA0002573358670000082
可以被表示为
Figure BDA0002573358670000083
最后,缓存优化问题可以被构造为
Figure BDA0002573358670000084
本发明目的是通过在有限缓存空间的限制下最大化平均D2D缓存命中率
Figure BDA0002573358670000085
来找到最佳的分布式D2D缓存策略。
三.解决方案
为了最大化平均D2D缓存命中率
Figure BDA0002573358670000086
本发明提出了一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法,详细流程如图5所示。
本发明的一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法包括:
步骤S1,内容交付步骤:在第t个时间周期开始时,每个用户uk会首先获取当前邻居用户集合Uk,t,uk记录在当前时间周期内自身请求的所有文件的特征向量和对所有这些文件的评价,即给出的标签,同时,uk还会记录自身在当前时间周期内请求文件的总次数(即,更新文件请求向量)。
步骤S2,信息交换步骤:判断文件请求集合是否为空,如果是,那么将用户偏好向量wt+1(k)和请求向量Qk广播给周围用户,否则,更新用户偏好向量然后将用户偏好向量wt+1(k)和请求向量Qk广播给周围用户。
步骤S3,内容放置步骤包括如下步骤:
步骤S31,活跃程度预测步骤:uk首先预测在下一个时间周期内所有邻居用户的活跃程度;
步骤S32,判断步骤:判断下一下时间周期内周围是否存在活跃用户,如果是,那么uk将预测下一个时间周期内的区域文件流行度,并根据周围用户的缓存状态放置缓存内容(例如,缓存流行度较大的前5个文件),然后执行广播步骤;如果下一下时间周期内周围不存在活跃用户,那么执行广播步骤;
步骤S33,广播步骤:uk把更新后的缓存状态广播给周围用户,作为周围用户更新缓存的依据。
在步骤S2,信息交换步骤中,本发明提出一种基于监督逻辑回归算法来学习用户偏好。为了表示用户对某一文件是否喜欢,采用yk,f作为用户uk∈U是否喜欢文件f的指示变量,其中yk,f=1代表用户uk∈U喜欢文件f和yk,f=0代表不喜欢。通常而言,用户会请求自己喜欢的文件,因此预测一个用户是否会请求某一文件这个问题可以转换为预测该用户是否喜欢该文件。采用S型函数(Sigmoid function)来表示用户偏好向量与文件特征向量之间的关系:
Figure BDA0002573358670000091
其中,pk,f,t∈[0,1]。
为了衡量用户偏好向量学习的准确性,采用逻辑回归的代价函数J(wk,t)
Figure BDA0002573358670000092
其中,Qk,t是用户uk在第t个时间周期内请求文件的总次数。
易知,式(5)是一个凸函数,因此可以通过寻找能够使代价函数J(wt(k))最小的wt(k)进行用户偏好向量的更新,即
Figure BDA0002573358670000101
对于式(6)采用梯度下降法解决该优化问题,因此wt+1(k)为
wt+1(k)=wt(k)-αΔwt(k) (7)
其中,α是迭代学习率和Δwt(k)为
Figure BDA0002573358670000102
其中,
Figure BDA0002573358670000103
综上,用户uk可以通过训练在第t个时间周期内请求的历史文件数据来得到在第(t+1)个时间周期内的用户偏好向量wt+1(k),如式(9)所示
Figure BDA0002573358670000104
在步骤S31,活跃程度预测步骤中,采用滑动窗口法预测用户活跃程度,如图6所示。一般而言,用户在某个时间周期内的活跃程度与该用户在当前时间周期内请求文件的次数有关,请求文件的次数越多,用户活跃程度越大。而且,用户的活跃状态将会持续一段时间,我们可以根据最近一段时间内用户的活跃程度来预测用户在下一个时间周期内的活跃程度。
根据滑动窗口法,用户uk预测任意用户um∈Uk,t的活跃程度λk,m,t+1
Figure BDA0002573358670000105
其中,L代表滑动窗口的长度,也即是滑动窗口内时间周期的个数,ηi代表滑动窗口内第i个时间周期的权重,ηi越大代表第i个时间周期越重要,并且满足
Figure BDA0002573358670000106
值得注意的是,当滑动窗口的长度L大于当前时间周期t时,我们假设滑动窗口内的前(L-t)个时间周期内所有用户的请求次数为0。
在步骤S3,内容放置步骤中,在缓存放置阶段,每个用户uk首先预测周围用户的活跃程度。如果在下一个时间周期内周围存在活跃用户,uk将根据接收到的用户偏好向量和请求向量,并综合自身的用户偏好向量和请求向量,评估区域内容流行度。如果文件f已经被周围用户所缓存,uk将不会缓存文件f,这样避免了区域内出现缓存冗余。因此,文件f在用户uk处的区域文件流行度pk,t+1(f)为
Figure BDA0002573358670000111
uk将会根据式(11)预测所有文件的区域流行度,然后根据区域内容流行度,把缓存空间内的文件更新为预测结果中流行度最大的前S个文件,并把更新后的缓存状态广播给周围用户。
综上,在本发明中,首先需要构造文件特征向量。通常需要对原始文件信息进行预处理,预处理主要是对文件信息进行归一化处理,得到文件库中每个文件的特征向量x(f),其中x(f)={xf,1,xf,2,…,xf,N}T,x(f)∈RN,即x(f)是描述文件f的N维向量。
然后学习用户偏好向量。用户偏好向量需要通过训练用户的历史请求数据得到,本发明中采用有监督逻辑回归学习用户偏好。实际场景中,用户的偏好会随时间发生变化,为了更好的表示这种变化,把时间划分为T个时间周期,即t=1,2,...,T,其中每个时间周期大小相同且T足够大。与文件特征向量相对应,用户偏好向量也是N维向量,但用户偏好具有时变性,例如用户uk在第t个时间周期内的用户偏好向量为wt(k)={wk,1,t,wk,2,t,…,wk,N,t}T,wk,i,t∈R,1≤i≤N,其中wk,i,t代表用户uk在第t个时间周期内对文件向量中第i维的用户偏好值。在第t个时间周期内,每个用户请求的文件可以被划分为喜欢或者不喜欢两种类型,而这可以认为是用户赋予文件f的标签yk,f。一般来说,用户通常会请求喜欢的文件类型。因此可以把用户是否会请求某个特定文件f建模为一个二分类问题,使用有监督的逻辑回归模型来学习用户偏好。用户请求过的文件f的特征向量x(f)和标签yk,f会被记录下来,用来更新用户偏好向量,从而及时地捕捉到用户偏好的变化。
再者,预测用户在下一个时间周期的活跃程度。以视频文件为例,用户往往会集中在一天当中的某一个时间段或者几个时间段请求视频文件,因此可以认为用户的会在连续的一些时间周期内都处于活跃状态,因此本发明采用滑动窗口法来对下一周期用户活跃程度进行预测。
最后,分别规定内容共享,信息交换和内容放置的方式。本发明把每个时间周期分为三个阶段:内容传递阶段,信息交换和内容放置阶段。在内容传递阶段,当用户uk∈U在第t个时间周期内请求文件f时,用户会首先检查自身缓存空间内是否缓存了文件f;如果自身没有缓存文件f,uk会向周围用户um∈Uk,t发出文件请求,周围一跳范围内空闲的用户如果缓存f时会产生应答,然后二者建立D2D通信链路实现内容共享;如果uk及其周围用户都没有缓存f,uk通过基站获取文件f。同时,用户都会记录自己在当前时间周期内的请求文件的次数Qk,t并储存在请求向量Qk中。在信息传递阶段,用户uk会将请求向量Qk和更新后的用户偏好向量wt+1(k)广播给周围用户。在内容放置阶段,uk会根据自身和周围用户的请求向量利用滑动窗口法预测用户活跃程度,如果预测结果显示在下一个时间周期内有活跃用户,uk将根据预测的用户活跃程度和接收到的用户偏好实时预测内容流行度,最后按照内容流行度大小和周围用户um∈Uk,t已经缓存的文件来更新自身的缓存内容,并且把已经缓存的文件编号广播给周围用户,避免区域缓存内容产生冗余。
本发明关键技术点在于:(1)提出了一种分布式D2D缓存方法及系统,从用户偏好和用户活跃程度两个角度去预测用户需求,然后根据预测的用户需求指导缓存内容放置;(2)首次使用滑动时间窗口法实时预测用户活跃程度;(3)综合考虑了用户偏好和用户活跃程度对实时文件流行度的影响,根据区域实时内容流行度用户之间进行协作缓存。
本发明的有益效果如下:
1.本发明提出的分布式D2D缓存系统可以在没有基站参与的情况下通过用户之间的信息交换分布式完成对实时文件流行度的预测,减少了对基站或者云端控制器的依赖。
2.采用滑动时间窗口法预测用户活跃程度,结合采用逻辑回归来用户偏好,可以得到实时区域文件流行度,根据实时文件流行度更新缓存内容可以保证较高的D2D缓存命中率。除此之外,用户还可以根据用户活跃程度的预测结果决定是否更新缓存,从而避免了无效果的缓存更新和大大降低了更新缓存对基站产生的负载。
3.在更新缓存内容时,用户会综合考虑实时内容流行度和周围用户已缓存的内容进行更新自身缓存,避免缓存冗余,进一步提高D2D缓存命中率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法,其特征在于,包括如下步骤:
步骤S1,内容交付步骤:在第t个时间周期开始时,每个用户uk会首先获取当前邻居用户集合Uk,t,uk记录在当前时间周期内自身请求的文件的特征向量和对这些文件的评价,同时,uk还会记录自身在当前时间周期内请求文件的总次数;
步骤S2,信息交换步骤:判断文件请求集合是否为空,如果是,那么将用户偏好向量wt+1(k)=wt(k)和请求向量Qk广播给周围用户,否则,更新用户偏好向量然后将用户偏好向量wt+1(k)和请求向量Qk广播给周围用户;
步骤S3,内容放置步骤包括如下步骤:
步骤S31,活跃程度预测步骤:uk首先预测在下一个时间周期内所有邻居用户的活跃程度;
步骤S32,判断步骤:判断下一下时间周期内周围是否存在活跃用户,如果是,那么uk将预测下一个时间周期内的区域文件流行度,并根据周围用户的缓存状态放置缓存内容,然后执行广播步骤;如果下一下时间周期内周围不存在活跃用户,那么执行广播步骤;
步骤S33,广播步骤:uk把更新后的缓存状态广播给周围用户,作为周围用户更新缓存的依据。
2.根据权利要求1所述的方法,其特征在于,在所述步骤S2,信息交换步骤中,用户uk通过训练在第t个时间周期内请求的历史文件数据来得到在第(t+1)个时间周期内的用户偏好向量wt+1(k),
Figure FDA0004116798040000011
在式(9)中,Qk,t是用户uk在第t个时间周期内请求文件的总次数,α是迭代学习率,用户uk在第t个时间周期内的用户偏好向量为wt(k)={wk,1,t,wk,2,t,…,wk,N,t}T,wk,i,t∈R,1≤i≤N,其中wk,i,t代表用户uk在第t个时间周期内对文件向量中第i维的用户偏好值;
Figure FDA0004116798040000012
X代表用户uk在第t个时间周期内所有请求文件的特征向量的集合;
Figure FDA0004116798040000013
其中
Figure FDA0004116798040000014
ε代表通过当前用户偏好向量预测的喜欢程度与实际值的差值的集合。
3.根据权利要求1所述的方法,其特征在于,在所述步骤S31,活跃程度预测步骤中,采用滑动窗口法预测用户活跃程度,根据最近一段时间内用户的活跃程度来预测用户在下一个时间周期内的活跃程度。
4.根据权利要求3所述的方法,其特征在于,在所述步骤S31,活跃程度预测步骤中,根据滑动窗口法,用户uk预测任意用户um∈Uk,t的活跃程度λk,m,t+1
Figure FDA0004116798040000021
其中,L代表滑动窗口的长度,也即是滑动窗口内时间周期的个数,ηi代表滑动窗口内第i个时间周期的权重,ηi越大代表第i个时间周期越重要,并且满足η1≤η2≤…≤ηL,
Figure FDA0004116798040000022
当滑动窗口的长度L大于当前时间周期t时,我们假设滑动窗口内的前(L–t)个时间周期内所有用户的请求次数为0,Qm,t-L+i表示用户um在第(t-L+i)个时间周期内的文件请求次数。
5.根据权利要求4所述的方法,其特征在于,在所述步骤S3,内容放置步骤中,每个用户uk首先预测周围用户的活跃程度,如果在下一个时间周期内周围存在活跃用户,uk将根据接收到的用户偏好向量和请求向量,并综合自身的用户偏好向量和请求向量,评估区域内容流行度,如果文件f已经被周围用户所缓存,uk将不会缓存文件f,这样避免了区域内出现缓存冗余,因此,文件f在用户uk处的区域文件流行度pk,t+1(f)为
Figure FDA0004116798040000023
uk将会根据式(11)预测所有文件的区域流行度,然后根据区域内容流行度,把缓存空间内的文件更新为预测结果中流行度最大的前S个文件,并把更新后的缓存状态广播给周围用户;pk,t+1(f)代表第(t+1)个时间周期内文件f在用户uk处的区域流行度,Uk,t代表第t个时间周期内用户uk的周围用户集合,λk,m,t+1代表用户uk预测用户um在第(t+1)个时间周期内活跃程度,pm,f,t+1代表第(t+1)个时间周期内用户um对文件f的喜欢程度,cm,f,t+1代表用户um在第(t+1)个时间周期内是否缓存了文件f。
6.一种联合考虑用户偏好及活跃程度的移动边缘缓存的系统,其特征在于,包括:
内容交付模块:用于在第t个时间周期开始时,每个用户uk会首先获取当前邻居用户集合Uk,t,uk记录在当前时间周期内自身请求的所有文件的特征向量和对所有这些文件的评价,同时,uk还会记录自身在当前时间周期内请求文件的总次数;
信息交换模块:用于判断文件请求集合是否为空,如果是,那么将用户偏好向量wt+1(k)=wt(k)和请求向量Qk广播给周围用户,否则,更新用户偏好向量然后将用户偏好向量wt+1(k)和请求向量Qk广播给周围用户;
内容放置模块包括:
活跃程度预测模块:用于uk首先预测在下一个时间周期内所有邻居用户的活跃程度;
判断模块:用于判断下一下时间周期内周围是否存在活跃用户,如果是,那么uk将预测下一个时间周期内的区域文件流行度,并根据周围用户的缓存状态放置缓存内容,然后执行广播模块;如果下一下时间周期内周围不存在活跃用户,那么执行广播模块;
广播模块:用于uk把更新后的缓存状态广播给周围用户,作为周围用户更新缓存的依据。
7.根据权利要求6所述的系统,其特征在于,在所述信息交换模块中,用户uk通过训练在第t个时间周期内请求的历史文件数据来得到在第(t+1)个时间周期内的用户偏好向量wt+1(k),
Figure FDA0004116798040000031
在式(9)中,Qk,t是用户uk在第t个时间周期内请求文件的总次数,α是迭代学习率,用户uk在第t个时间周期内的用户偏好向量为wt(k)={wk,1,t,wk,2,t,…,wk,N,t}T,wk,i,t∈R,1≤i≤N,其中wk,i,t代表用户uk在第t个时间周期内对文件向量中第i维的用户偏好值;
Figure FDA0004116798040000041
X代表用户uk在第t个时间周期内所有请求文件的特征向量的集合;
Figure FDA0004116798040000042
其中
Figure FDA0004116798040000043
ε代表通过当前用户偏好向量预测的喜欢程度与实际值的差值的集合。
8.根据权利要求6所述的系统,其特征在于,在所述活跃程度预测模块中,采用滑动窗口法预测用户活跃程度,根据最近一段时间内用户的活跃程度来预测用户在下一个时间周期内的活跃程度。
9.根据权利要求8所述的系统,其特征在于,在所述活跃程度预测模块中,根据滑动窗口法,用户uk预测任意用户um∈Uk,t的活跃程度λk,m,t+1
Figure FDA0004116798040000044
其中,L代表滑动窗口的长度,也即是滑动窗口内时间周期的个数,ηi代表滑动窗口内第i个时间周期的权重,ηi越大代表第i个时间周期越重要,并且满足η1≤η2≤…≤ηL,
Figure FDA0004116798040000045
当滑动窗口的长度L大于当前时间周期t时,我们假设滑动窗口内的前(L-t)个时间周期内所有用户的请求次数为0,Qm,t-L+i表示用户um在第(t-L+i)个时间周期内的文件请求次数。
10.根据权利要求9所述的系统,其特征在于,在所述内容放置模块中,每个用户uk首先预测周围用户的活跃程度,如果在下一个时间周期内周围存在活跃用户,uk将根据接收到的用户偏好向量和请求向量,并综合自身的用户偏好向量和请求向量,评估区域内容流行度,如果文件f已经被周围用户所缓存,uk将不会缓存文件f,这样避免了区域内出现缓存冗余,因此,文件f在用户uk处的区域文件流行度pk,t+1(f)为
Figure FDA0004116798040000046
uk将会根据式(11)预测所有文件的区域流行度,然后根据区域内容流行度,把缓存空间内的文件更新为预测结果中流行度最大的前S个文件,并把更新后的缓存状态广播给周围用户;pk,t+1(f)代表第(t+1)个时间周期内文件f在用户uk处的区域流行度,Uk,t代表第t个时间周期内用户uk的周围用户集合,λk,m,t+1代表用户uk预测用户um在第(t+1)个时间周期内活跃程度,pm,f,t+1代表第(t+1)个时间周期内用户um对文件f的喜欢程度,cm,f,t+1代表用户um在第(t+1)个时间周期内是否缓存了文件f。
CN202010646593.4A 2020-07-07 2020-07-07 一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统 Active CN111901394B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010646593.4A CN111901394B (zh) 2020-07-07 2020-07-07 一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010646593.4A CN111901394B (zh) 2020-07-07 2020-07-07 一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统

Publications (2)

Publication Number Publication Date
CN111901394A CN111901394A (zh) 2020-11-06
CN111901394B true CN111901394B (zh) 2023-05-02

Family

ID=73191946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010646593.4A Active CN111901394B (zh) 2020-07-07 2020-07-07 一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统

Country Status (1)

Country Link
CN (1) CN111901394B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114143376A (zh) * 2021-11-18 2022-03-04 青岛聚看云科技有限公司 一种用于加载缓存的服务器、显示设备及资源播放方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107909108A (zh) * 2017-11-15 2018-04-13 东南大学 基于内容流行度预测的边缘缓存系统及其方法
CN108541025A (zh) * 2018-04-20 2018-09-14 西安交通大学 一种面向无线异构网络的基站与d2d共同缓存方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107909108A (zh) * 2017-11-15 2018-04-13 东南大学 基于内容流行度预测的边缘缓存系统及其方法
WO2019095402A1 (zh) * 2017-11-15 2019-05-23 东南大学 基于内容流行度预测的边缘缓存系统及其方法
CN108541025A (zh) * 2018-04-20 2018-09-14 西安交通大学 一种面向无线异构网络的基站与d2d共同缓存方法

Also Published As

Publication number Publication date
CN111901394A (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
Yu et al. Federated learning based proactive content caching in edge computing
Zhong et al. A deep reinforcement learning-based framework for content caching
Xu et al. Asynchronous federated learning on heterogeneous devices: A survey
Pang et al. Toward smart and cooperative edge caching for 5G networks: A deep learning based approach
CN110730471B (zh) 基于区域用户兴趣匹配的移动边缘缓存方法
CN113283177B (zh) 一种基于异步联邦学习的移动感知缓存方法
CN105812834B (zh) 基于聚类信息的视频推荐服务器、推荐方法和预缓存方法
CN111491331B (zh) 一种雾计算网络中基于迁移学习的网络感知自适应缓存方法
CN113687960B (zh) 一种基于深度强化学习的边缘计算智能缓存方法
CN113918829A (zh) 一种雾计算网络中基于联邦学习的内容缓存和推荐方法
CN108521640B (zh) 一种蜂窝网络中的内容分发方法
CN111901394B (zh) 一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及系统
Li et al. From reputation perspective: a hybrid matrix factorization for qos prediction in location‐aware mobile service recommendation system
CN112637908A (zh) 一种基于内容流行度的细粒度分层边缘缓存方法
CN113114762B (zh) 一种数据缓存方法及系统
CN108600365A (zh) 一种基于排序学习的无线异构网络缓存方法
CN117499484A (zh) 一种基于深度强化学习的边缘缓存替换方法
CN116155991B (zh) 一种基于深度强化学习的边缘内容缓存与推荐方法及系统
Li et al. Video caching and scheduling with edge cooperation
CN115904731A (zh) 一种边缘协作式副本放置方法
Chen et al. An edge caching strategy based on separated learning of user preference and content popularity
Mishra et al. Efficient proactive caching in storage constrained 5g small cells
Si et al. Edge Caching Strategy Based on User's Long and Short Term Interests
Wei et al. Cooperative caching algorithm for mobile edge networks based on multi-agent meta reinforcement learning
Taghizade Firouzjaee et al. A novel user preference-aware content caching algorithm in mobile edge networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant