CN113271631A - 基于用户请求可能性与时空特性的新型内容缓存部署方案 - Google Patents

基于用户请求可能性与时空特性的新型内容缓存部署方案 Download PDF

Info

Publication number
CN113271631A
CN113271631A CN202110497580.XA CN202110497580A CN113271631A CN 113271631 A CN113271631 A CN 113271631A CN 202110497580 A CN202110497580 A CN 202110497580A CN 113271631 A CN113271631 A CN 113271631A
Authority
CN
China
Prior art keywords
content
user
request
cache
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110497580.XA
Other languages
English (en)
Other versions
CN113271631B (zh
Inventor
徐友云
李大鹏
蒋锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Ai Er Win Technology Co ltd
Original Assignee
Nanjing Ai Er Win Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Ai Er Win Technology Co ltd filed Critical Nanjing Ai Er Win Technology Co ltd
Publication of CN113271631A publication Critical patent/CN113271631A/zh
Application granted granted Critical
Publication of CN113271631B publication Critical patent/CN113271631B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/02Traffic management, e.g. flow control or congestion control
    • H04W28/08Load balancing or load distribution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Optimization (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于用户请求可能性与时空特性的新型内容缓存部署方案,本发明的边缘缓存策略同时考虑了用户请求行为与用户对请求内容的满意度信息,既能反映用户点击行为又能反映用户对内容的满意程度,更符合用户需求,本发明在总体缓存命中率上的性能略优于现存缓存方案,但是在本发明中提出的缓存方案评估指标CSR上的性能显示出显著优势。

Description

基于用户请求可能性与时空特性的新型内容缓存部署方案
技术领域
本发明涉及一种无线通信技术领域的边缘缓存部署方案,具体提出了一种基于用户请求可能性和考虑时空特性的用户偏好的新型内容缓存部署方案。
背景技术
自从第五代移动通信技术提出以来,业界对通信系统便提出了高可靠性和低延迟的要求。同时,要求5G移动通信系统具有更高的系统容量,频谱效率,能效,场景适应性和更高的用户体验质量。然而,随着各种智能设备和多媒体应用的普及,对网络通信,特别是对于因特网视频业务的需求激增。现有的被动通信模式将大大增加在高峰数据通信时间期间阻塞的可能性,因此可以考虑选择主动通信方式,例如可以提前主动缓存内容的边缘缓存。一种可行的解决方案是将位于云中心的部分资源(例如通信,计算和缓存)迁移到更靠近用户的网络边缘,以便可以在本地提供用户经常请求的内容,减少通信延迟和转发负载,并可以提高整个网络的通信质量。
诸如FIFO(先进先出),LRU和LFU之类的传统缓存技术已广泛用于有线网络中,这些缓存策略通过简单的统计数据进行分析,用足够的缓存空间和计算资源来判断可能的缓存热点,并且服务区域通常很大。然而,在实际的通信场景中,与传统的有线网络不同,AP(接入点)的缓存容量和计算资源有限,覆盖范围较小,并且用户对内容的请求具有随机特征。因此,传统的缓存技术不能应用于变化的无线通信场景。为了确保为更多内容提供有效的本地化服务并达到最小化通信延迟的目的,边缘缓存技术面临着巨大的挑战。
经过对现有技术文献检索发现,Sabrina Müller等在《IEEE Transactions onWireless Communications,vol.16,no.2,pp.1024-1036,Feb.2017.》上发表的文章“Context-Aware Proactive Content Caching With Service Differentiation inWireless Networks(无线网络中具有服务区分功能的上下文感知主动内容缓存)”提出了一种上下文感知的主动缓存新算法。通过定期观察已连接用户的上下文信息,更新缓存内容然后观察缓存命中,可以考虑对上下文特定内容的受欢迎程度进行在线学习。然而,它忽略了内容相似度和用户偏好对内容流行度的影响,学习复杂度较高。
另经检索发现,Yanxiang Jiang等在《IEEE Transactions on Communications,vol.67,no.2,pp.1268-1283,Feb.2019.》上发表的文章“User Preference Learning-Based Edge Caching for Fog Radio Access Network(基于用户偏好学习的雾无线电接入网络边缘缓存)”提出了一种基于用户偏好学习的边缘缓存方案,考虑了边缘缓存的时空特性,并认为用户对内容的请求不只是遵循一定的分布,而是具有随机性,能够在线预测内容流行度,降低了计算复杂度,但是,用户在不同时间或地点对某些类型的内容的偏好程度可能存在较大差异,该文章提出的方案并没有考虑时间特性对于用户偏好的影响。
经检索还发现,R.Sun等在《IEEE Transactions on Vehicular Technology,vol.69,no.1,pp.636-650,Jan.2020.》上发表了文章“QoE-Driven Transmission-AwareCache Placement and Cooperative Beamforming Design in Cloud-RANs(Cloud-RAN中QoE驱动的传输感知缓存放置和协作波束形成设计)”。该文章针对支持缓存的cloudRAN提出了一种短期传输策略下的长期感知传输缓存方案,以提高视频流的体验质量。然而,这些工作并没有利用大数据和基于优化工具设计缓存方案。因此,这些研究的应用可能在真实环境中受到限制,因为无论是应用哪种缓存策略,用户的偏好/满意度通常都不像统一的分布那样具有可追踪性。
发明内容
本发明要解决的技术问题是克服现有技术中传统的缓存技术不能很好的应用于变化的无线通信场景的缺陷,提供一种通过协同过滤挖掘数据集内多维信息,从用户点击行为和用户满意度两方面综合考虑缓存评估的缓存方案。
为了解决上述技术问题,本发明提供了如下的技术方案:
本发明考虑了内容组合特征对用户请求行为的影响,与现有方法不同,基于逻辑回归算法学习内容的多维特征影响,挖掘数据特征值之间的相关性,从而构建了用户请求概率预测算法。此外,将时间特征的影响引入到用户满意度的学习过程中,构建包含用户、内容得分和时间的三维张量数据模型,用于获取在特定时间下用户对请求内容的评分值。基于上述方法获得的用户请求概率预测值与用户满意度评分预测值得到区域用户满意度值,并以此为依据制定缓存更新策略。
定义无线网络缓存模型。在无线网络的边缘,接入点AP的集合表示为
Figure BDA0003055172860000031
不失一般性,假定每个AP的缓存容量为Δ,文件大小相同或被划分为相同大小的内容块,并且该区域的缓存内容大小满足ΔS<<F,其中F来自云中心文件集
Figure BDA0003055172860000032
且随时间变化。以离散时间t={1,2···T}监测用户,其中T是一个有限的时间,S个APs均设置特定场景下的监测周期,用于定期监测区域用户集
Figure BDA0003055172860000033
即第t个时间段内S个APs监测到的用户集。设第t个时间段内检测到的用户数为Mt∈[Mmin,Mmax],Kt表示第t个时隙中的内容请求数,
Figure BDA0003055172860000034
表示有限时间内T内的内容总请求数。
Figure BDA0003055172860000035
表示时间t内用户请求的内容的集合。Askt,k=(fk,xk,tk),1≤t≤T,1≤k≤Kt,其中fk代表第k个请求内容/文件,
Figure BDA0003055172860000036
为被请求文件的特征向量,其中D表示所请求内容的特征维数。用户
Figure BDA0003055172860000037
在时间t内的请求Askt,k以及请求内容fk的特征xk会被同时记录下来。为了提高用户请求概率模型的预测精度,该记录将会被用来进行用户请求概率模型的更新。
本发明是通过以下技术方案实现的,本发明包括如下步骤:
S1、将区域用户在时间t内对于某个可能请求的内容fk的满意程度定义为区域用户请求满意度Qt,k。在时间t内,抽取请求内容fk的特征矢量xk以及在用户请求行为模型中学习到的参数向量
Figure BDA0003055172860000041
去预测用户m的点击可能性
Figure BDA0003055172860000042
S2、利用请求内容特征向量xk特征向量符号一致问题、用户m对请求内容fk的偏好向量mk以及时间特征向量tk去预测用户在第t时间内对第k个请求内容的请求评分向量
Figure BDA0003055172860000043
最后,利用用户点击可能性预测值
Figure BDA0003055172860000044
与用户偏好
Figure BDA0003055172860000045
来预测用户请求满意度(RPSA)
Figure BDA0003055172860000046
由此,区域用户请求满意度为
Figure BDA0003055172860000047
S3、缓存更新。为了方便查看当前的请求内容是否已经缓存在本地,设置一个本地缓存内容集
Figure BDA0003055172860000048
用于当前缓存内容的存储。对于一个请求内容fk,S个APs均需要做出相应的缓存决策,以确定是否将该请求内容缓存在本地。在缓存更新过程中,用户不仅会更改请求内容的可能性,还可能会改变对相同内容的满意度。当内容请求到达AP时,缓存实体首先检查所请求的内容是否已经存储在本地存储ct,k,如果内容位于ct,k中,则AP将直接服务于用户,否则,将从存储该内容的云文件中心或相邻的块AP中检索内容,并进一步确定是否需要在本地缓存该请求内容。由于AP的缓存容量有限,如果决定在本地缓存fk,则需要删除本地缓存中已有的某个内容,此过程称为缓存更新。具体的,令
Figure BDA0003055172860000049
表示一个优先级队列,其每个元素都是一个元组,由当前请求内容fk,该内容相应的初始缓存时间
Figure BDA00030551728600000417
以及区域RPSAQt,k组成。
Figure BDA00030551728600000411
以Qt,k
Figure BDA00030551728600000412
的升序排列,因此,
Figure BDA00030551728600000413
的最顶部元素由最小的区域RPSAQls,最早的初始缓存时间tls和相应的内容fls组成。当缓存更新发生时,我们可以在本地缓存中快速定位到需要替换的内容fls。接下来,根据Qt,k与Qls的比较来做出缓存决定,如果Qt,k大于Qls,则本地缓存中的内容fls将被当前请求的内容fk代替,所以,原本地缓存中的[fls,tls,Qls]将会被更新为
Figure BDA00030551728600000414
最后,为了下次缓存更新的快速定位,
Figure BDA00030551728600000415
将会重新排序,这样,缓存更新操作完成。相反,将不会发生缓存更新。
此外,本发明中提出边缘缓存方案评估指标。令指示变量
Figure BDA00030551728600000416
表示请求的内容fk是否在时隙t内存储在本地缓存中,
Figure BDA0003055172860000051
表示已存储在本地缓存中,而
Figure BDA0003055172860000052
表示它需要从相邻区域的AP或云内容中心获取。然后,作出缓存更新决策,以决定是否在本地缓存该请求文件。当决定缓存内容fk时,缓存将更新。令fls表示要被替换的本地文件,缓存状态根据以下规则进行更新:
Figure BDA0003055172860000053
当未缓存fk时,缓存状态保持不变,即
Figure BDA0003055172860000054
设向量
Figure BDA0003055172860000055
表示请求时间t内所有文件的缓存状态。缓存策略/算法应基于请求文件特征向量,时间特征向量和当前请求数量,通过映射函数
Figure BDA0003055172860000056
将当前缓存状态向量映射到下一个缓存状态向量,映射函数
Figure BDA0003055172860000057
定义为
Figure BDA0003055172860000058
其中Tk是第k个请求内容的时间特征向量,将在用户满意度学习模型中予以考虑。
通过考虑用户点击行为和用户对内容的满意度(即用户对内容的评分),我们定义了一个新的缓存性能指标,即缓存满意率(CSR)。令
Figure BDA0003055172860000059
表示总体缓存满意率,Rt,k(fk)用于指示用户对时隙t中所请求内容的偏好,Rmax是最高分数。缓存问题如下所示:
Figure BDA00030551728600000510
Figure BDA00030551728600000511
Figure BDA00030551728600000512
为了优化CSR,本发明将首先考虑内容多维特征的影响,提出请求行为预测算法。然后,本发明将时间特征的影响引入用户满意度学习过程。最后,本发明提出结合了用户点击动作和用户满意度的缓存算法。
所述的用户请求行为预测模型与用户满意度学习模型具体是:
1)用户请求行为预测模型(BPMM)
首先,对于每个请求
Figure BDA00030551728600000514
相应的内容具有特征向量
Figure BDA00030551728600000513
令yk为对应的类别标签。如果请求的文件是用户喜欢的类型,则yk=1,否则yk=0。符号
Figure BDA0003055172860000061
被定义为用户m在tk时请求文件fk的请求可能性。假设用户先前曾请求过内容,则将减少他再次请求内容的可能性,即
Figure BDA0003055172860000062
其中ω是可能性的衰减系数,t′是最接近t的时间段。如果用户m以前未访问过内容fk,则可以基于分解机模型将用户请求行为建模为二进制分类问题,以预测yk。因此,基于S形函数,可能性
Figure BDA0003055172860000063
为:
Figure BDA0003055172860000064
Figure BDA0003055172860000065
其中
Figure BDA0003055172860000066
是用户m的请求可能性参数向量。xk,i是第k个请求内容的第i个维度的特征值。
Figure BDA00030551728600000616
表示用户m的请求的偏差参数,
Figure BDA0003055172860000068
表示用户m对单个特征的请求可能性参数,并且
Figure BDA0003055172860000069
表示xk,i的隐藏向量的第l维的请求行为参数。
为了评估用户请求行为预测错误,引入了针对用户m的逻辑损失函数
Figure BDA00030551728600000617
该函数表示给定
Figure BDA00030551728600000610
的情况下yk的负对数似然:
Figure BDA00030551728600000611
收集的样本集表示为
Figure BDA00030551728600000612
其中x(n)表示第n个样本的特征向量,y(n)是第n个样本的标签,Nm是样本预测期间用户m的样本数。另外,将模型的阈值参数定义为ξ∈[0,1]。当用户m的累积平均损失
Figure BDA00030551728600000613
大于ξ时,预测模型将开始更新参数。
Figure BDA00030551728600000614
可以计算为:
Figure BDA00030551728600000615
构造的数据集具有特征维度大,数据稀疏和不平衡的特征,因此,使用基于在线梯度下降(OGD)方案的正则化领导者(FTRL)模型进行学习BPMM模型中的多个组合特征。实际上,引入组合功能会导致更高的模型复杂性。即使引入了L_1-正则,传统的OGD方法也无法产生良好的稀疏性。所提出的参数学习算法引入了L_1-正则化以获得组合特征的稀疏参数估计结果,并通过使用L_2-正则项来平滑结果。具体过程如下:
令N为学习请求行为参数的样本数。然后,可以在第n个样本迭代之后获得参数向量
Figure BDA0003055172860000071
即:
Figure BDA0003055172860000072
其中||·||1,||·||2分别表示L_1范数和L_2范数。L1,L2代表惩罚项系数。
Figure BDA0003055172860000073
是第n个样本的梯度向量,
Figure BDA0003055172860000074
表示n个样本的梯度和。令σn与非增学习率ηn有关,即
Figure BDA0003055172860000075
为了方便表示,令
Figure BDA0003055172860000076
解决该优化问题等同于解决以下问题:
Figure BDA0003055172860000077
样本本身在不同特征中具有不同的稀疏性,在BPMM模型中引入的特征隐藏向量也具有相似的稀疏性,这将导致在学习过程中不同维度的用户请求行为参数
Figure BDA00030551728600000710
的转换率不同。假设
Figure BDA0003055172860000078
表示第j个维度的学习率,其中α和β是调整参数。可以将上述问题分解为以下j个子问题来求解:
Figure BDA0003055172860000079
然后,根据上述等式使用不同的学习率来学习参数
Figure BDA00030551728600000711
中每个维度的值,即:
Figure BDA0003055172860000081
Figure BDA0003055172860000082
Figure BDA0003055172860000083
2)用户满意度学习模型
令{mm},{fk},{tt}分别表示用户,文件和时隙,
Figure BDA0003055172860000084
表示用户m在时间t对第k个请求内容的满意度/内容评分;假设有M′个用户、K′个内容和和T′个时间,则以(mm;fk;tt)为索引,
Figure BDA0003055172860000085
元素值可以构建一个稀疏三维张量
Figure BDA0003055172860000086
可以表示为以下三个D′维向量的内积:
Figure BDA0003055172860000087
其中,Mm,Fk分别是用户特征矩阵
Figure BDA0003055172860000088
和内容特征矩阵
Figure BDA0003055172860000089
中的第k列向量,而Tt是第t个时隙引入的固有特征向量。考虑到用户对内容评分的随机性,使用以下均值为<Mm,Fk,Tt>和方差为α-1的高斯分布:
Figure BDA00030551728600000810
其中
Figure BDA00030551728600000811
用于指示是否已获取到评分值
Figure BDA00030551728600000812
本发明利用完全贝叶斯处理方法,将模型中的超参数也视为随机变量,由于多维积分求解困难,使用马尔科夫链蒙特卡罗方法进行近似求解。本发明使用最常用的求解多维参数的Gibbs采样方法进行求解,即:
Figure BDA00030551728600000813
其中,L代表收集的样本数。由此,我们可以获得M,F,T,由此获得用户m在时间t对请求内容fk的评分预测值
Figure BDA00030551728600000814
实际上,如果可以通过考虑位置信息来构造数据集,则上述模型也可以直接用于检查用户满意度的空间变化。
与现有技术相比,本发明的有益效果是:本发明的边缘缓存策略同时考虑了用户请求行为与用户对请求内容的满意度信息,既能反映用户点击行为又能反映用户对内容的满意程度,更符合用户需求,本发明在总体缓存满意率上的性能略优于现存缓存方案,但是在本发明中提出的缓存方案评估指标CSR上的性能显示出显著优势。
本发明通过协同过滤挖掘多维数据,从用户点击行为和用户满意度两方面综合考虑缓存评估,提出了一种新的缓存度量-缓存满意率(CSR)来表示用户对缓存内容的标准化总体满意度值;本发明提出的缓存算法可以根据用户请求概率和用户满意度的乘积对缓存内容进行更新,并预测每个时间段的值;在用户请求概率预测学习中,引入了内容的多维特征的影响来挖掘数据特征之间的相关性。另一方面,我们构建了包含用户、内容得分以及相应时间的三维张量数据模型。利用实体之间固有的协作关系表述为一个概率张量因式分解问题。此外,还利用了一种完全的贝叶斯处理方法,以确保因子的演化是平滑的,并避免参数的调整;基于真实数据集的实验结果表明,本文算法的总体缓存命中率优于现有算法,在用户满意度性能方面取得了显著的效果。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是实施例系统模型图;
图2是实施例不同缓存容量下的总体缓存命中率效果图;
图3是实施例得到的不同请求内容的总体缓存满意度图;
图4是实施例得到的不同缓存容量下的总体缓存满意率效果图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例
本实施例使用MovieLens数据集。从2010年1月1日至2018年9月25日的数据集中选择30个用户作为整体请求数据集。其中,选择数据的前2/3作为RBPL算法的初始化数据集,其余数据用作性能评估,包括步骤如下:
S1、S个APs均设置特定场景下的监测周期,用于定期监测区域用户集
Figure BDA0003055172860000101
即第t个时间段内S个APs监测到的用户集,假设第t个时间段内检测到的用户数为Mt∈[Mmin,Mmax]。令Kt表示第t个时隙中的用户请求数,
Figure BDA0003055172860000102
表示有限时间内T内的总请求数。
Figure BDA0003055172860000103
表示时间t内的用户请求集合。Askt,k=(fk,xk,tk),1≤t≤T,1≤k≤Kt,其中fk代表k个请求内容/文件,
Figure BDA0003055172860000104
表示为被请求文件的特征向量,其中D表示所请求内容的特征维数。用户
Figure BDA0003055172860000105
在时间t内的请求Askt,k以及请求内容fk的特征xk会被同时记录下来。为了提高用户请求概率模型的预测精度,该记录将会被用来进行用户请求概率模型的更新。
S2、在时间t内,会抽取请求内容fk的特征矢量xk以及在用户请求行为模型中学习到的参数向量
Figure BDA0003055172860000106
去预测用户m的点击可能性
Figure BDA0003055172860000107
其次,利用请求内容特征向量xk、用户m对请求内容fk的偏好向量mk以及时间特征向量tk去预测用户在第t时间内对第k个请求内容的请求评分向量
Figure BDA0003055172860000108
最后,利用用户点击可能性预测值
Figure BDA0003055172860000109
与用户偏好
Figure BDA00030551728600001010
来预测用户请求满意度(RPSA)
Figure BDA00030551728600001011
由此,区域用户请求满意度为
Figure BDA00030551728600001012
S3、为了方便查看当前的请求内容是否已经缓存在本地,设置一个本地缓存内容集
Figure BDA00030551728600001013
用于当前缓存内容的存储。对于一个请求内容fk,S个APs均需要做出相应的缓存决策,以确定是否将该请求内容缓存在本地。在缓存更新过程中,用户不仅会更改请求内容的可能性,还可能会改变对相同内容的满意度。当内容请求到达AP时,缓存实体首先检查所请求的内容是否已经存储在本地存储ct,k,如果内容位于ct,k中,则AP将直接服务于用户。否则,将从存储该内容的云文件中心或相邻的块AP中检索内容,并进一步确定是否需要在本地缓存该请求内容。由于AP的缓存容量有限,如果决定在本地缓存fk,则需要删除本地缓存中已有的某个内容。此过程称为缓存更新。具体的,令
Figure BDA0003055172860000111
表示一个优先级队列,其每个元素都是一个元组,由当前请求内容fk,该内容相应的初始缓存时间
Figure BDA00030551728600001113
以及区域RPSAQt,k组成。
Figure BDA0003055172860000112
以Qt,k
Figure BDA0003055172860000113
的升序排列,因此,
Figure BDA0003055172860000114
的最顶部元素由最小的区域RPSAQls,最早的初始缓存时间tls和相应的内容fls组成。当缓存更新发生时,我们可以在本地缓存中快速定位到需要替换的内容fls。接下来,根据Qt,k与Qls的比较来做出缓存决定,如果Qt,k大于Qls,则本地缓存中的内容fls将被当前请求的内容fk代替,所以,原本地缓存中的[fls,tls,Qls]将会被更新为
Figure BDA00030551728600001114
最后,为了下次缓存更新的快速定位,
Figure BDA0003055172860000116
将会重新排序,这样,缓存更新操作完成。相反,将不会发生缓存更新。
所述用户请求行为预测模型与用户满意度学习模型具体是:
1)用户请求行为预测模型
第一步,当一个请求内容被发起的时候,对于当前区域用户
Figure BDA0003055172860000117
首先判断该用户之前是否请求过该内容,如果请求过,则
Figure BDA0003055172860000118
如果该用户没有请求过当前内容,则利用以下公式计算:
Figure BDA0003055172860000119
Figure BDA00030551728600001110
第二步,计算该用户的目标损失函数,计算在请求过程中的累计损失值,即:
Figure BDA00030551728600001111
第三步,判断是否需要重启用户请求行为参数学习模型,当
Figure BDA00030551728600001112
时将会自动启动用户请求行为参数学习模型,相反,则随着请求内容的到来从步骤一开始重复执行。
用户请求行为参数学习模型具体如下:
第一步,设置初始参数,获取模型样本集中第n个样本的特征向量,根据如下公式计算用户请求行为参数
Figure BDA00030551728600001221
各个维度上的值:
Figure BDA0003055172860000121
Figure BDA0003055172860000122
Figure BDA0003055172860000123
第二步,获取该用户对当前请求内容的真实请求行为
Figure BDA0003055172860000124
根据如下公式计算用户请求概率预测值:
Figure BDA0003055172860000125
Figure BDA0003055172860000126
计算损失函数:
Figure BDA0003055172860000127
根据公式
Figure BDA0003055172860000128
计算样本在各个维度上的梯度值得到
Figure BDA0003055172860000129
Figure BDA00030551728600001210
Figure BDA00030551728600001211
第三步,根据如下公式分别在各个特征值不为0的维度上更新模型参数:
Figure BDA00030551728600001212
Figure BDA00030551728600001213
Figure BDA00030551728600001214
Figure BDA00030551728600001215
Figure BDA00030551728600001216
Figure BDA00030551728600001217
Figure BDA00030551728600001218
Figure BDA00030551728600001219
Figure BDA00030551728600001220
返回步骤一循环执行,直到损失函数达到最小值时终止模型训练,获取用户请求行为参数
Figure BDA00030551728600001312
2)用户满意度学习模型
令{mm},{fk},{tt}分别表示用户,文件和时隙,
Figure BDA0003055172860000131
表示用户m在时间t对第k个请求内容的满意度/内容评分。假设有M′个用户和K′个内容,则以(mm,fk,tt)为索引,
Figure BDA0003055172860000132
为元素值可以构建一个稀疏三维张量
Figure BDA0003055172860000133
可以表示为以下三个D′维向量的内积:
Figure BDA0003055172860000134
其中,Mm,Fk分别是用户特征矩阵
Figure BDA0003055172860000135
和内容特征矩阵
Figure BDA0003055172860000136
中的第k列向量,而Tt是第t个时隙引入的固有特征向量。考虑到用户对内容评分的随机性,使用以下均值为<Mm;Fk,Tt>和方差为α-1的高斯分布:
Figure BDA0003055172860000137
其中
Figure BDA0003055172860000138
用于指示是否已获取到评分值
Figure BDA0003055172860000139
本发明利用完全贝叶斯处理方法,将模型中的超参数也视为随机变量,由于多维积分求解困难,使用马尔科夫链蒙特卡罗方法进行近似求解。本发明使用最常用的求解多维参数的Gibbs采样方法进行求解,即:
Figure BDA00030551728600001310
其中,L代表收集的样本数。由此,我们可以获得M,F,T,由此获得用户m在时间t对请求内容fk的评分预测值
Figure BDA00030551728600001311
本实施例方法得到的在不同缓存容量下的总体缓存命中率效果图如图2所示,与显现缓存策略相比,略占优势,图3表明本发明连续缓存具有较高区域RPSA的内容,而缓存满意度较低的内容将被替换,所以会显示出较高的缓存满意度值。本实施例得到的在不同缓存容量下的总体缓存满意率效果图如图4所示,本发明在用户满意率CSR指标上的性能明显好于现有缓存策略,图中效果表明本发明通过挖掘数据集多维特征设计的新型缓存策略可以实现增强智能缓存,从而提高无线网络中用户的体验质量。
本实施例的优点:本边缘缓存策略同时考虑了用户请求行为与用户对请求内容的满意度信息,既能反映用户点击行为又能反映用户对内容的满意程度,更符合用户需求,本发明在总体缓存满意率上的性能略优于现存缓存方案,但是在本发明中提出的缓存方案评估指标CSR上的性能显示出显著优势。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于用户请求可能性与时空特性的新型内容缓存部署方案,其特征在于,包括以下步骤:
S1、定义无线网络缓存模型:
以离散时间t={1,2…T}监测用户,其中T是一个有限的时间,S个APs均设置特定场景下的监测周期,用于定期监测区域用户集
Figure FDA0003055172850000011
即第t个时间段内S个APs监测到的用户集;
假设第t个时间段内检测到的用户数为Mt∈[Mmin,Mmax],令Kt表示第t个时隙中的用户请求数,
Figure FDA0003055172850000012
表示有限时间内T内的总请求数;
Figure FDA00030551728500000113
表示时间t内的用户请求集合;Askt,k=(fk,xk,tk),1≤t≤T,1≤k≤Kt,其中fk代表k个请求内容/文件,
Figure FDA0003055172850000013
表示为被请求文件的特征向量,其中D表示所请求内容的特征维数;用户
Figure FDA0003055172850000014
在时间t内的请求Askt,k以及请求内容fk的特征xk会被同时记录下来;
S2、首先在时间t内,抽取请求内容fk的特征矢量xk以及在用户请求行为模型中学习到的参数向量
Figure FDA0003055172850000015
去预测用户m的点击可能性
Figure FDA0003055172850000016
其次,利用请求内容特征向量xk内容特征矢量符号需一致、用户m对请求内容fk的偏好向量mk以及时间特征向量tk去预测用户在第t时间内对第k个请求内容的请求评分向量
Figure FDA0003055172850000017
最后,利用用户点击可能性预测值
Figure FDA0003055172850000018
与用户偏好
Figure FDA0003055172850000019
来预测用户请求满意度
Figure FDA00030551728500000110
由此,区域用户请求满意度为
Figure FDA00030551728500000111
S3、为了方便查看当前的请求内容是否已经缓存在本地,设置一个本地缓存内容集
Figure FDA00030551728500000112
用于当前缓存内容的存储;对于一个请求内容fk,S个APs均需要做出相应的缓存决策,以确定是否将该请求内容缓存在本地;当内容请求到达AP时,缓存实体首先检查所请求的内容是否已经存储在本地存储
Figure FDA0003055172850000021
如果内容位于
Figure FDA0003055172850000022
中,则AP将直接服务于用户;否则,将从存储该内容的云文件中心或相邻的块AP中检索内容,并进一步确定是否需要在本地缓存该请求内容。
2.如权利要求1所述的基于用户请求可能性与时空特性的新型内容缓存部署方案,其特征在于,S3中缓存更新的具体方法为:
Figure FDA0003055172850000023
表示一个优先级队列,其每个元素都是一个元组,由当前请求内容fk,该内容相应的初始缓存时间
Figure FDA0003055172850000029
以及区域RPSA Qt,k组成;
Figure FDA0003055172850000024
以Qt,k
Figure FDA00030551728500000210
的升序排列,当缓存更新发生时,在本地缓存中快速定位到需要替换的内容fls;接下来,根据Qt,k与Qls的比较来做出缓存决定,如果Qt,k大于Qls,则本地缓存中的内容fls将被当前请求的内容fk代替,所以,原本地缓存中的[fls,tls,Qls]将会被更新为
Figure FDA0003055172850000025
为了下次缓存更新的快速定位,
Figure FDA0003055172850000026
将会重新排序,相反,将不会发生缓存更新。
3.如权利要求1所述的基于用户请求可能性与时空特性的新型内容缓存部署方案,其特征在于,S2中用户请求行为模型的预测模型具体如下:
S1.当一个请求内容被发起的时候,对于当前区域用户
Figure FDA0003055172850000027
首先判断该用户之前是否请求过该内容,如果请求过,则
Figure FDA0003055172850000028
如果该用户没有请求过当前内容,则利用以下公式计算:
Figure FDA0003055172850000031
Figure FDA0003055172850000032
S2、计算该用户的目标损失函数,计算在请求过程中的累计损失值,即:
Figure FDA0003055172850000033
S3、判断是否需要重启用户请求行为参数学习模型,当
Figure FDA0003055172850000034
时将会自动启动用户请求行为参数学习模型,相反,则随着请求内容的到来从步骤一开始重复执行。
4.如权利要求1所述的基于用户请求可能性与时空特性的新型内容缓存部署方案,其特征在于,S2中用户请求行为模型的参数学习模型具体如下:
S1、设置初始参数,获取模型样本集中第n个样本的特征向量,根据如下公式计算用户请求行为参数Θm各个维度上的值:
Figure FDA0003055172850000035
Figure FDA0003055172850000036
Figure FDA0003055172850000037
S2、获取该用户对当前请求内容的真实请求行为yk,根据如下公式计算用户请求概率预测值:
Figure FDA0003055172850000041
Figure FDA0003055172850000042
计算损失函数:
Figure FDA0003055172850000043
根据公式
Figure FDA0003055172850000044
计算样本在各个维度上的梯度值得到
Figure FDA0003055172850000045
Figure FDA0003055172850000046
S3、根据如下公式分别在各个特征值不为0的维度上更新模型参数:
Figure FDA0003055172850000047
Figure FDA0003055172850000048
Figure FDA0003055172850000049
Figure FDA00030551728500000410
Figure FDA00030551728500000411
Figure FDA00030551728500000412
Figure FDA00030551728500000413
Figure FDA00030551728500000414
Figure FDA00030551728500000415
返回S1循环执行,直到损失函数达到最小值时终止模型训练,获取用户请求行为参数Θm
5.如权利要求1所述的基于用户请求可能性与时空特性的新型内容缓存部署方案,其特征在于,S2中用户请求行为模型的用户满意度学习模型具体如下:
令{mm},{fk},{tt}分别表示用户,文件和时隙,
Figure FDA00030551728500000416
表示用户m在时间t对第k个请求内容的满意度/内容评分;假设有M′个用户、K′个内容和K′个时隙,则以(mm,fk,tt)为索引,
Figure FDA0003055172850000051
为元素值可以构建一个稀疏三维张量
Figure FDA0003055172850000052
Figure FDA0003055172850000053
可以表示为以下三个D′维向量的内积:
Figure FDA0003055172850000054
其中,Mm,Fk分别是用户特征矩阵
Figure FDA0003055172850000055
和内容特征矩阵
Figure FDA0003055172850000056
中的第k列向量,而Tt是第t个时隙引入的固有特征向量;考虑到用户对内容评分的随机性,使用以下均值为<Mm,Fk,Tt>和方差为α-1的高斯分布:
Figure FDA0003055172850000057
其中
Figure FDA0003055172850000058
用于指示是否已获取到评分值
Figure FDA0003055172850000059
6.如权利要求1所述的基于用户请求可能性与时空特性的新型内容缓存部署方案,其特征在于,本发明使用求解多维参数的Gibbs采样方法进行求解,即:
Figure FDA00030551728500000510
其中,L代表收集的样本数,由此,我们可以获得M,F,T,由此获得用户m在时间t对请求内容fk的评分预测值
Figure FDA00030551728500000511
CN202110497580.XA 2020-10-19 2021-05-08 基于用户请求可能性与时空特性的新型内容缓存部署方案 Active CN113271631B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011115050 2020-10-19
CN2020111150506 2020-10-19

Publications (2)

Publication Number Publication Date
CN113271631A true CN113271631A (zh) 2021-08-17
CN113271631B CN113271631B (zh) 2024-02-27

Family

ID=77230116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110497580.XA Active CN113271631B (zh) 2020-10-19 2021-05-08 基于用户请求可能性与时空特性的新型内容缓存部署方案

Country Status (1)

Country Link
CN (1) CN113271631B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114564667A (zh) * 2022-04-28 2022-05-31 深圳市艾德网络科技发展有限公司 分析大规模数据的低延时缓存数据处理方法
CN114647387A (zh) * 2022-05-23 2022-06-21 南京道成网络科技有限公司 一种适用于云端存储的缓存优化方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090198833A1 (en) * 2007-12-17 2009-08-06 Alcatel-Lucent Via The Electronic Patent Assignment System (Epas). Method for distributing content data packages originated by users of a super peer-to-peer network
CN108153830A (zh) * 2017-12-13 2018-06-12 东南大学 无线通信网络中基于学习的主动缓存控制方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090198833A1 (en) * 2007-12-17 2009-08-06 Alcatel-Lucent Via The Electronic Patent Assignment System (Epas). Method for distributing content data packages originated by users of a super peer-to-peer network
CN108153830A (zh) * 2017-12-13 2018-06-12 东南大学 无线通信网络中基于学习的主动缓存控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MENGGE LIU ET AL.: "Multi-dimensional Data-driven Mobile Edge Caching with Dynamic User Preference", THE 12TH INTERNATIONAL CONFERENCE ON WIRELESS COMMUNICATIONS AND SIGNAL PROCESSING, pages 580 - 585 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114564667A (zh) * 2022-04-28 2022-05-31 深圳市艾德网络科技发展有限公司 分析大规模数据的低延时缓存数据处理方法
CN114564667B (zh) * 2022-04-28 2022-07-19 深圳市艾德网络科技发展有限公司 分析大规模数据的低延时缓存数据处理方法
CN114647387A (zh) * 2022-05-23 2022-06-21 南京道成网络科技有限公司 一种适用于云端存储的缓存优化方法

Also Published As

Publication number Publication date
CN113271631B (zh) 2024-02-27

Similar Documents

Publication Publication Date Title
Elgendy et al. Joint computation offloading and task caching for multi-user and multi-task MEC systems: reinforcement learning-based algorithms
Zhong et al. A deep reinforcement learning-based framework for content caching
CN107909108B (zh) 基于内容流行度预测的边缘缓存系统及其方法
Jiang et al. User preference learning-based edge caching for fog radio access network
Wu et al. Dynamic content update for wireless edge caching via deep reinforcement learning
He et al. QoE-driven content-centric caching with deep reinforcement learning in edge-enabled IoT
Zhang et al. Toward edge-assisted video content intelligent caching with long short-term memory learning
Jiang et al. A novel caching policy with content popularity prediction and user preference learning in fog-RAN
CN113271631A (zh) 基于用户请求可能性与时空特性的新型内容缓存部署方案
CN114553963B (zh) 移动边缘计算中基于深度神经网络的多边缘节点协作缓存方法
Feng et al. Content popularity prediction via deep learning in cache-enabled fog radio access networks
WO2023279674A1 (en) Memory-augmented graph convolutional neural networks
Wu et al. Content popularity prediction in fog radio access networks: A federated learning based approach
CN111314862A (zh) 雾无线接入网中深度强化学习下带有推荐的缓存方法
Ye et al. Joint cache size scaling and replacement adaptation for small content providers
Qiu et al. Oa-cache: Oracle approximation based cache replacement at the network edge
Chao Web cache intelligent replacement strategy combined with GDSF and SVM network re-accessed probability prediction
CN117675918A (zh) 基于多智能体深度强化学习的边缘区域协作缓存更新方法
Ugwuanyi et al. A novel predictive-collaborative-replacement (PCR) intelligent caching scheme for multi-access edge computing
CN113127515A (zh) 面向电网的调控数据高速缓存方法、装置、计算机设备和存储介质
Fan et al. Pa-cache: Learning-based popularity-aware content caching in edge networks
CN112862060A (zh) 一种基于深度学习的内容缓存方法
Shi et al. Ppvc: Online learning toward optimized video content caching
CN113268458B (zh) 一种基于代价敏感分类算法的缓存方法及系统
Liu et al. Multi-dimensional data-driven mobile edge caching with dynamic user preference

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant