CN113992653B - 一种基于边缘缓存的cdn-p2p网络的内容下载、预存和替换方法 - Google Patents
一种基于边缘缓存的cdn-p2p网络的内容下载、预存和替换方法 Download PDFInfo
- Publication number
- CN113992653B CN113992653B CN202111215312.0A CN202111215312A CN113992653B CN 113992653 B CN113992653 B CN 113992653B CN 202111215312 A CN202111215312 A CN 202111215312A CN 113992653 B CN113992653 B CN 113992653B
- Authority
- CN
- China
- Prior art keywords
- file
- edge
- edge cache
- files
- cdn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000000694 effects Effects 0.000 claims description 8
- 230000001174 ascending effect Effects 0.000 claims description 4
- 230000005484 gravity Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000007726 management method Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 11
- 239000012634 fragment Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
- H04L67/1074—Peer-to-peer [P2P] networks for supporting data block transmission mechanisms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明属于无线通信技术中内容分发网络领域,尤其涉及一种基于边缘缓存的CDN‑P2P网络的内容下载、预存和替换方法,以解决现有网络中的下载、预存和替换方法造成服务器压力过大,引起了网络开销和下载时延,不能够最大化利用边缘缓存节点的存储空间的技术问题。该基于边缘缓存的CDN‑P2P网络的内容下载、预存方法,包括以下步骤:步骤S1、用户请求下载文件a;步骤S2、将边缘CDN服务器中存储的所有文件根据内容分成若干类,并根据流行度提前对各类文件进行排序;步骤S3、根据边缘CDN服务器中与文件a兴趣‑相关度、支持度和置信度,找出与文件a最相关的同类型文件b;根据同类型文件a与文件b的预存效用,请求预存文件b;步骤S4、预存文件b。
Description
技术领域
本发明属于无线通信技术中内容分发网络领域,尤其涉及一种基于边缘缓存的CDN-P2P网络的内容下载、预存和替换方法。
背景技术
近些年,随着网络及其用户的爆炸性增长,向大规模的用户稳定而又持续地传输流式内容,无论是在学术界还是工业界,已成为研究的热点话题。多媒体流式应用在这种情况下应运而生,人们可以通过互联网络随时随地获取到多媒体内容。在上述问题下,内容分发网络(CDN,Content Delivery Network)、对等网络(P2P,Peer-to-Peer)受到了广泛关注。
内容分发网络是在现有互联网基础之上的一层智能虚拟网络。一方面,它把源服务器上的内容,通过一定的策略,将内容传送到离用户较近的代理服务器上。另一方面,它根据各个代理服务器的负载情况、内容请求用户距代理服务器的位置和网络流量等信息,选定一个合适的代理服务器为用户提供服务。在P2P网络中,各个设备没有主从之分,网络上任意节点的计算机既可以作为网络服务器,为其他计算机提供资源,也可以作为一般客户端,从其他计算机获取资源。CDN和P2P网络各自存在局限性,但两者能在部署成本和可扩展性等方面能很好地互补,因此,近年来展开了对混合CDN-P2P网络中的内容下载、内容预存、请求重定向、内容替换和计费等技术研究。现有的混合CDN-P2P网络在内容下载、内容预存、请求重定向、内容替换时存在重复利用网络资源,存在网络开销大、下载延迟、占用存在空间较大的问题,同时易造成主干网络拥堵。因此,研究合理的缓存替换方法有效减少服务器压力,降低了网络开销和下载时延,最大化利用节点的存储空间是非常必要的。
发明内容
本发明的目的是解决现有网络中的下载、预存和替换方法造成服务器压力过大,引起了网络开销和下载时延,不能够最大化利用边缘缓存节点的存储空间,而提供了一种基于边缘缓存的CDN-P2P网络及其内容下载、预存和替换方法,最大程度的减少了主干网络的拥堵,充分提高了资源的响应能力。
为达到上述目的,本发明采用的技术方案为:
一种基于边缘缓存的CDN-P2P网络的内容下载、预存方法,其特殊之处在于,包括以下步骤:
步骤S1、用户请求下载文件a;
若本地边缘缓存节点缓存了文件a,则用户从本地边缘缓存节点下载文件a;否则,用户从其他边缘缓存节点、边缘CDN服务器或源服务器上下载文件a;
步骤S2、将边缘CDN服务器中存储的所有文件根据内容分类,并根据流行度提前对各类文件进行排序,记录各类文件流行度最高的前A(A≥100)个,用于后续的预存;
步骤S3、根据边缘CDN服务器中与文件a兴趣-相关度、支持度和置信度,找出在流行度为前A(A≥100)个中与文件a最相关的同类型文件b;根据同类型文件a与文件b的预存效用,请求用户所在的边缘缓存节点进行预存文件b;
步骤S4、预存文件b;
当用户所在的边缘缓存节点存储空间足够时,直接预存文件b;当用户所在的边缘缓存节点存储空间不足时,根据基于文件缓存价值的内容替换方法先替换出一些文件后再预存文件b。
进一步地,所述步骤S1具体为:
(1)若本地边缘缓存节点已缓存文件a,则用户从本地边缘缓存节点下载文件a;同时,用户向后台系统发送一条自己下载文件a的消息;
(2)若本地边缘缓存节点没有缓存文件a,则用户通过访问后台系统,寻找其他已缓存了文件a的边缘缓存节点进行下载;
(3)若本地边缘缓存节点与其他边缘缓存节点均没有缓存文件a,则用户从边缘CDN服务器上下载文件a;
(4)若本地边缘缓存节点、其他边缘缓存节点与边缘CDN服务器均没有缓存文件a,则用户从源服务器下载文件a。
进一步地,所述步骤S2具体为:
定义边缘CDN服务器下属l个边缘缓存节点的集合为S={s1,s2,...,sl},l为大于等于1的整数;
步骤S2.1、边缘CDN服务器将存储的所有文件根据内容分成q类,q为大于等于1的整数;
步骤S2.2、计算边缘CDN服务器上每个文件的流行度;
所述流行度是边缘CDN服务器内所有边缘缓存节点对一个任意文件k在一个周期T内的访问次数总和;
计算文件k的流行度Fk:
其中,Fi k为边缘缓存节点si所辖所有用户对文件k的总请求次数;
步骤S2.3、根据流行度提前对各类文件进行排序,记录各类文件流行度最高的前A(A≥100)个;
定义各类型流行度前A(A≥100)的文件的集合为Dj={dj1,dj2,...,djb,...,djA},其中,j∈[1,q],dj1是j类型文件中流行度最高的文件,djb是j类型文件中流行度第b高的文件,以此类推。
进一步地,所述步骤S3具体为:
步骤S3.1、计算边缘缓存节点si对文件a的兴趣度Ii(a);
所述兴趣度是指节点对资源感兴趣的程度,可以通过用户对数据对象的访问频率来衡量;
所述边缘缓存节点si对文件a的兴趣度Ii(a)为:
Ii(a)越大,表示边缘缓存节点si对文件a的兴趣度越高;
步骤S3.2、计算同一j类型文件a与文件b间的兴趣-相关度R(dja,djb):
其中,dja为j类型文件中用户请求下载的文件a;
djb为边缘CDN服务器中与dja同类型且流行度前A(A≥100)的文件之一,即djb∈Dj,其中b∈{1,2,...,A};
为CDN-P2P网络中所有边缘缓存节点对文件a的兴趣度的平均值;/>为CDN-P2P网络中所有边缘缓存节点对文件b的兴趣度的平均值;
R(dja,djb)值越大,表示文件a与文件b的兴趣-相关度越高,反之表示兴趣-相关度越低;
步骤S3.3、计算同一j类型文件a与文件b间的支持度Sup(a,b);
所述同一j类型文件a与文件b间的支持度指文件a和文件b同时出现的概率;
Sup(a,b)值越大,表示文件a和文件b同时出现的概率越高,则其相关性就越高;
步骤S3.4、计算同一j类型文件a与文件b间的置信度Con(a,b);
所述同一j类型文件a与文件b间的置信度指文件a被访问时,文件b被访问的概率;
Con(a,b)值越大,则说明文件a被访问时,文件b被访问的概率越高,则其相关性就越高;
步骤S3.5、计算与用户请求j类型文件a,同类型文件b的预存效用f(dja,djb);
所述预存效用与文件之间的兴趣-相关度、支持度、置信度相关;
所述j类型文件a和文件b的预存效用f(dja,djb)通过下式计算:
f(dja,djb)=αR(dja,djb)×βSup(dja,djb)×γCon(dja,djb)
其中,α、β、γ分别为全局影响因子,取值范围均为[0,1];
文件间的兴趣-相关度越高,对预存效用值起促进作用;文件间的支持度越高,对预存效用值起促进作用;文件间的置信度越高,对预存效用值起促进作用。
本发明还提供了一种基于边缘缓存的CDN-P2P网络的内容替换方法,其特殊之处在于,内容替换方法具体为:
若请求下载文件a的用户所在边缘缓存节点从后台系统接收到可以预存文件b的消息时,则便可以开始对文件b进行缓存;
若用户所在边缘缓存节点的存储空间足够缓存预存文件b时,预存文件b将直接被缓存入该边缘缓存节点的存储空间;
若用户所在边缘缓存节点的存储空间不足以缓存预存文件b时,将采用基于文件缓存价值的内容替换方法先替换出某些文件后再缓存预存文件b。
进一步地,所述基于文件缓存价值的内容替换方法为:
步骤S4.1、当确定了预存文件b后,边缘缓存节点开始对其进行缓存;边缘缓存节点对已存储的文件m的缓存价值按升序排列,即m={1,2,…,n};
步骤S4.2、如果边缘缓存节点的剩余存储空间足够存储文件b,则该边缘缓存节点直接缓存文件b,否则,转步骤S4.3;
步骤S4.3、依次比较文件b与边缘缓存节点已存储文件m的缓存价值,若文件b的缓存价值小于第一个文件的缓存价值,则不进行替换,否则,进入步骤S4.4;
步骤S4.4、边缘缓存节点依次删除缓存价值最小的一个文件或多个文件,直到腾出足够的缓存空间存储文件b,然后存储文件b。
进一步地,步骤4.1)中,所述已存储文件m的缓存价值Vm(t):
其中:
Nm(t)为t时刻系统中文件m被请求的次数;
Cm(t)为t时刻系统中所有边缘缓存节点存储的文件m的总数量;
ρ为比重因子,介于0-1之间;
T是一个周期;t是T的整数倍;
Vm(t-T)为文件m在t时刻的上一个周期的缓存价值;
Vm(t)为文件m在t时刻的缓存价值,Vm(t)的值越大,表示文件m的缓存价值越高。
与现有技术相比,本发明具有的有益技术效果如下:
1、本发明提出的CDN-P2P混合结构中,边缘缓存节点之间是以P2P的形式连接的,各个边缘缓存节点之间可以共享资源;边缘缓存节点所辖用户端可直接从边缘缓存节点获取资源,也可从CDN服务器获取,其意义在于最大程度的减少了主干网络的拥堵,充分提高了资源的响应能力。
2、在本发明提出的CDN-P2P的混合网络系统中,用户可以去不同的数据源下载所请求的文件;通过使用部署在边缘CDN服务器附近的后台系统来分析用户访问数据的信息,并基于用户访问数据信息向用户所在边缘缓存节点推荐与用户所访问文件兴趣-相关度最高的文件进行预存当用户所在的边缘缓存节点存储空间已满的时候,采用基于文件缓存价值的内容替换方法先删除部分文件再对预存文件进行预存。
3、本发明提供的CDN-P2P混合网络系统中基于边缘缓存的内容预存和替换方法,缓解了随用户量增加而对CDN服务器造成的巨大服务压力;提高了网络服务质量;提高了缓存命中率;降低了网络开销和下载时延;最大化利用了边缘缓存节点的存储空间。
附图说明
图1是本发明基于边缘缓存的CDN-P2P网络的内容下载、预存和替换方法流程图;
图2是本发明基于边缘缓存的CDN-P2P网络的内容下载、预存和替换系统,即后台系统的内容管理模块的结构示意图;
图3是本发明可应用的一个场景图;
图4是本发明基于边缘缓存的CDN-P2P网络的内容下载方法工作流程;
图5是本发明基于边缘缓存的CDN-P2P网络的内容预存方法工作流程;
图6是本发明基于边缘缓存的CDN-P2P网络中基于文件缓存价值的内容替换方法工作流程;
附图标记:
图3中,1-源服务器,2-边缘CDN服务器,3-后台系统,4-边缘缓存节点。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施方式对本发明提出的一种基于边缘缓存的CDN-P2P网络的内容下载、预存和替换方法作进一步详细说明。本领域技术人员应当理解的是,这些实施方式仅仅用来解释本发明的技术原理,目的并不是用来限制本发明的保护范围。
本发明基于的边缘缓存的CDN-P2P网络包括前台系统和后台系统;
所述的前台系统由边缘缓存节点组成,边缘缓存节点是一种部署在用户生活场所中的专用家庭CDN盒子,与传统CDN服务器相似,具有一定的缓存功能,可提前将一些文件存储在其存储空间中。若边缘缓存节点所辖用户请求的文件已被边缘缓存节点缓存,则可以直接从边缘缓存节点获取,因此可以显著降低网络开销和网络时延。它一方面用于用户信息的存储,一方面作为CDN边缘缓存设备存储流媒体资源,用户则就近从边缘服务器获取服务,这样就提高了用户获取服务的速度。边缘缓存节点之间以逻辑上P2P方式通信,用户需要的内容可以从边缘缓存节点获取,如果有的片段在边缘缓存节点中没有,用户也可以从边缘CDN服务器甚至源服务器获取。
所述后台系统包括内容路由模块、目录服务器、内容管理模块和运营管理模块;
所述的内容路由模块把访问需求调度到最优的边缘缓存节点。
所述的目录服务器模块主要维护系统中可服务的视频信息列表,即系统内文件分片分布情况,包括资源名称、贡献资源的用户地址等,比如当前系统中有哪些视频文件,当前在线边缘缓存节点上拥有哪些视频文件分片可向其他节点提供。
所述的内容管理模块一方面,每隔一段时间或者系统接收到一定次数的内容请求,边缘缓存节点执行内容副本放置算法。另一方面,根据P2P用户的请求,更新内容服务器中内容列表。
所述的运营管理模块包括节点管理功能和网络管理功能等;节点管理功能:通过接收边缘缓存节点定时发送的心跳包获取并管理自治域内的对等节点的基本信息,包括该边缘缓存节点的网络地址,是否在线,节点内存占用情况,自身上传下载带宽、插件更新、版本更新等信息。这些信息可以用于对系统内节点分布情况进行管理;网络管理功能:如CDN系统的网络拓扑管理、故障管理、网络设备管理和链路监控,为管理员提供集中化的管理操作界面。
如图1所示,本发明的提供的基于边缘缓存的内容下载、预存和替换方法,包括以下步骤:
S1:用户请求文件a,如果本地边缘缓存节点缓存了该文件,则用户直接在本地边缘缓存节点下载该文件;如果本地边缘缓存节点没有缓存该文件,则用户通过访问后台系统去其他P2P节点下载或者去边缘CDN服务器、源服务器下载;
S2:边缘CDN服务器提前将其存储的所有文件根据内容分成若干类,并根据流行度提前对各类文件进行排序,记录各类文件流行度最高的前A(A≥100)个,用于后续的预存;
S3:后台系统根据请求用户访问的文件a,根据预存效用函数,从边缘CDN服务器中找出与文件a兴趣-相关度最高的同类型文件流行度前A(A≥100)个中的文件b,并推送给请求用户所在的边缘缓存节点进行预存;
S4:当用户所在的边缘缓存节点存储空间足够时,直接缓存文件b;当用户所在的边缘缓存节点存储空间不足时,根据基于文件缓存价值的内容替换策略先替换出一些文件后再缓存文件b。
本发明提供的基于边缘缓存的内容下载、预存和替换方法业内的普通技术人员还可以采用其他的步骤实施,图1的本发明提供的基于边缘缓存的内容下载、预存和替换方法仅仅是一个具体实施例而已。
如图2所示,本发明提供的基于边缘缓存的内容下载、预存和替换系统,即后台系统包括:
模块1:下载文件模块,用于通过分析用户所请求文件在全局的分布情况,指导用户去不同的数据源下载请求文件a;
模块2:预存文件模块,用于基于文件的诸多信息,计算文件a与待预存文件之间的兴趣-相关度、支持度及置信度数值,然后基于这些数值,代入预存效用函数选择预存效用值最高的文件b进行预存;
模块3:缓存替换模块,用于当边缘缓存节点的存储空间不足以缓存预存文件时,采用基于文件缓存价值的内容替换方法先替换出某些文件后再缓存预存文件。
图3是本发明的方法可应用的一个场景图。系统中包含若干个边缘缓存节点,这些边缘缓存节点是以P2P的形式进行信息交换的,每个边缘缓存节点在其服务范围内服务着若干个用户。在这些边缘缓存节点的边缘,布置了一个CDN服务器,并且在CDN服务器的附近,装备了一个后台系统。后台系统由目录服务器、运营管理模块、内容管理模块等组成。因此,后台系统拥有所有边缘缓存节点和用户的数据信息并可以对它们的数据的删除和缓存做出决策。
在这场景下,用户若需要下载一个文件a,可以优先向自己的边缘缓存节点发送请求,边缘缓存节点解析该请求。如果用户所请求的文件a己经被存储在该边缘缓存节点,该边缘缓存节点直接将文件a返回给用户。否则,该边缘缓存节点将向后台系统发送信息,因为后台系统拥有所有边缘缓存节点的信息(包括文件a在其他边缘缓存节点的存储信息),其中的后台系统中的内容管理模块就会进行计算,为请求用户决定出一个最佳的且已经存储了文件a的P2P边缘缓存节点,请求用户就可以去这个边缘缓存节点下载文件a。如果所有边缘缓存节点都没有存储文件a,但边缘的CDN服务器上有该文件,则后台系统会返回给用户去CDN服务器下载文件a的决策信息。如果所有边缘缓存节点都没有存储文件a,边缘的CDN服务器上也没有该文件,则后台系统会返回给用户去源服务器下载文件a的决策信息。
如图4所示,本发明的基于边缘缓存的内容下载方法工作流程,即步骤S1具体步骤,用户请求并下载文件a存在以下四种情况:
(1)用户若需要下载一个文件a,可以优先向自己的边缘缓存节点发送请求,边缘缓存节点解析该请求,如果本地边缘缓存节点缓存了该文件,则用户直接在本地边缘缓存节点下载该文件。与此同时,用户向后台系统发送一条自己下载文件a的消息。由于用户下载文件a的消息很小,所以用户把它传给后台系统的时延和信令开销都很小,基本可以忽略。
(2)如果本地边缘缓存节点没有缓存该文件a,该边缘缓存节点将向后台系统发送信息,因为后台系统拥有所有边缘缓存节点的信息(包括文件a在其他边缘缓存节点的存储信息),寻找其他已经缓存了文件a的P2P边缘缓存节点进行下载。具体而言,在后台系统中,与文件有关的信息可以从目录服务器获得,与边缘缓存节点状态有关的信息可以从运营管理模块获得。这些参数信息将被发送给后台系统中的内容管理模块,内容管理模块将根据这些信息进行计算,并作出最终的缓存决策,为请求用户决定出一个最佳的且已经存储了文件a的P2P边缘缓存节点。然后,内容路由模块将把用户的请求重新定向至这个被确定的最佳边缘缓存节点,用户就可以以P2P的方式去该边缘缓存节点下载文件a。
(3)如果本地边缘缓存节点没有缓存该文件,访问后台系统后,其他P2P边缘缓存节点也没有缓存该文件,则用户需要去边缘CDN服务器下载文件a。具体而言,后台系统的目录服务器查询文件a在各P2P边缘缓存节点的存储情况,在发现所有边缘缓存节点都没有存储文件a后,内容路由模块将把用户的请求重新定向至边缘CDN服务器,用户就可以去边缘CDN服务器下载文件a。
(4)如果本地边缘缓存节点和其他P2P边缘缓存节点都没有缓存该文件,且边缘CDN服务器也没有缓存该文件,则用户需要去源服务器下载文件a。具体而言,如果本地边缘缓存节点和其他P2P边缘缓存节点都没有缓存该文件,且边缘CDN服务器也没有缓存该文件,后台系统的内容路由模块将把用户的请求重新定向至源服务器,用户就可以去源服务器下载文件a。
如图5所示,本发明的基于边缘缓存的内容预存方法工作流程,即步骤S2和步骤S3的具体步骤:
假定边缘CDN服务器下属所有边缘缓存节点的集合为S={s1,s2,...,sl},为方便后续选择合适的预存内容,边缘CDN服务器需要提前做以下工作:
(1)边缘CDN服务器需要提前将其存储的所有文件根据内容分成若干类;
具体而言,若系统中所述文件为视频文件,则边缘CDN服务器需要将其存储的全部视频文件分为喜剧类、爱情类、悬疑类等若干个大类,即给其存储的每个视频文件增加一个类型标签。
(2)边缘CDN服务器需要提前计算每个文件的流行度;
具体而言,文件的流行度具体表现为CDN服务器下属所有边缘缓存节点对一个文件在一个周期T内的访问次数总和。记Fk为CDN服务器下属所有边缘缓存节点对文件k在一个周期T内的访问次数总和,则:
其中,Fi k表示边缘缓存节点si所辖所有用户对文件k的总请求次数。
(3)边缘CDN服务器将各类型所有文件按流行度进行排序,找出各类型流行度前A(A≥100)的文件。
具体而言,假设所有文件可分为q类,则定义各类型流行度前A(A≥100)的文件的集合为Dj={dj1,dj2,...,djb,...,djA},其中,j∈[1,q],dj1是j类型文件中流行度最高的文件,djb是j类型文件中流行度第b高的文件,以此类推。
在步骤S3,后台系统向请求文件a的用户所在边缘缓存节点推送文件b还包括:
在用户下载了文件a之后,所述系统将向用户所在边缘缓存节点推荐预存文件b,其中,文件b是边缘CDN服务器中文件a同类型的前A(A≥100)个最流行文件中与文件a兴趣-相关度最高的文件。
(1)定义1,兴趣度。兴趣度是指节点对资源感兴趣的程度,可以通过用户对数据对象的访问频率来衡量,即边缘缓存节点si对文件a的兴趣度为:
其中,Ii(a)越大,则说明边缘缓存节点si对文件a的兴趣度越高。
(2)定义2,兴趣-相关度。同一j类型文件a与文件b的兴趣-相关度定义如下:
其中,dja即为用户下载的文件a,它属于j类型文件;
djb为边缘CDN服务器中与dja同类型的流行度前A(A≥100)的文件之一,即djb∈Dj,b∈{1,2,...,A};
表示整个CDN-P2P系统的所有边缘缓存节点对文件a的兴趣度的平均值;
表示整个CDN-P2P系统的所有边缘缓存节点对文件b的兴趣度的平均值;
R(dja,djb)∈[0,1],其含义为:系统中所有用户平均每访问一次文件a,就访问多少次文件b,例如:若R(dja,djb)=0.5,则表明系统中所有用户平均每访问一次文件a,就访问0.5次文件b。R(dja,djb)值越大,表示文件a与文件b的兴趣-相关度越高,反之表示兴趣-相关度越低。
(3)定义3,支持度。支持度表示文件a和文件b同时出现的概率,定义如下:
上式中,所有用户同时访问文件a和文件b的次数之和以及所有用户总的访问次数均可从后台系统直接获得。
Sup(a,b)值越大,说明文件a和文件b同时出现的概率越高,则其相关性就越高。
(4)定义4,置信度。置信度表示文件a被访问时,文件b被访问的概率有多大,定义如下:
上式中,所有用户同时访问文件a和文件b的次数之和以及所有用户访问文件a的总次数均可从后台系统直接获得。
Con(a,b)值越大,则说明文件a被访问时,文件b被访问的概率越高,则其相关性就越高。
(5)本专利所述内容预存方法,综合考虑了文件之间的兴趣-相关度、支持度、置信度等因素,对于用户已经访问了j类型文件a,建立了同类型文件b的预存效用函数,如下:
f(dja,djb)=αR(dja,djb)×βSup(dja,djb)×γCon(dja,djb)
其中R(dja,djb)为j类型文件a和b的兴趣-相关度,R(dja,djb)越大,则文件a和文件b的兴趣-相关度越高,其对预存效用值起促进作用;
Sup(dja,djb)为j类型文件a和b的支持度,Sup(dja,djb)越大,则文件a和文件b的支持度越高,其对预存效用值起促进作用;
Con(dja,djb)为j类型文件a和b的置信度,Con(dja,djb)越大,则文件a和文件b的置信度越高,其对预存效用值起促进作用;
α、β、γ分别为全局影响因子,取值范围均为[0,1],可以根据实际情况进行选取,即根据三种参数对不同系统贡献程度有差异进行合理选取。
后台系统向请求文件a的用户所在边缘缓存节点推送文件b还包括:
在用户下载了文件a之后,后台系统开始向用户所在边缘缓存节点推送预存文件。
具体而言:首先,后台系统中的目录服务器和运营管理模块将计算预存效用函数所需的文件信息和边缘缓存节点信息发送给内容管理模块;其次,内容管理模块将利用预存效用函数进行计算,求出边缘CDN服务器中与已下载文件a同类型的流行度前A(A≥100)的文件中预存效用值最大的文件b;最后,内容路由模块将向用户所在边缘缓存节点发送下载文件b的推送消息。这样,本地边缘缓存节点就可以对文件b进行预存。
请求文件a的用户所在边缘缓存节点从后台系统接收到可以预存文件b的消息时,便可以开始对文件b进行缓存。
如果该边缘缓存节点的存储空间足够缓存预存文件时,预存文件将直接被缓存入该边缘缓存节点的存储空间;当边缘缓存节点的存储空间不足以缓存预存文件时,将采用基于文件缓存价值的内容替换方法先替换出某些文件后再缓存预存文件。即步骤S4中具体如下:
(1)采用以文件为粒度执行缓存内容替换,基本思想是用预存文件b替换边缘缓存节点存储空间中缓存价值较小的文件。
(2)假设边缘缓存节点i中的用户预存文件b,如果本边缘缓存节点有足够的剩余存储空间缓存文件b,则该边缘缓存节点将直接缓存文件b。否则,该边缘缓存节点将用文件b替换一个或多个存储空间中已缓存的缓存价值最小的文件。
(3)在执行内容替换时,边缘缓存节点首先比较文件b和已缓存的缓存价值最小的文件(假设为文件1)的大小,如果文件b的尺寸不大于文件1,该边缘缓存节点删除文件1,腾出存储空间来缓存文件b。否则,边缘缓存节点比较文件b和文件1+文件2(文件2为缓存节点中缓存价值第二小的文件)的大小。如果文件b的尺寸不大于文件1+文件2的尺寸,边缘缓存节点删除文件1和文件2,腾出足够的缓存空间存储文件b。否则,该边缘缓存节点将继续寻找待替换的文件。
边缘缓存节点中已存储文件的缓存价值计算公式如下:
其中,Nm(t)表示t时刻系统中文件m被请求的次数;Cm(t)表示t时刻系统中所有边缘缓存节点存储的文件m的总数量;ρ为比重因子,用来防止价值抖动,介于0-1之间;t是T的整数倍;Vm(t-T)表示文件m在t的上一个周期的缓存价值;Vm(t)表示文件m在t时刻的缓存价值,其值越大,表示该文件段缓存价值越高。
所述内容替换方法中,边缘缓存节点可提前按上述缓存价值表达式计算出其存储空间中所有文件的缓存价值,并按照缓存价值升序将这些文件排序,方便后续的替换工作。
如图6所示,本发明的基于文件缓存价值的内容替换方法工作流程如下:
步骤S4.1、当确定了预存文件b后,边缘缓存节点开始对其进行缓存。边缘缓存节点对自身已存储的文件m按缓存价值升序排列,即m={1,2,…,n};
步骤S4.2、如果边缘缓存节点的剩余存储空间足够存储文件b,则该边缘缓存节点直接缓存文件b,否则,转步骤S4.3;
步骤S4.3、边缘缓存节点首先比较文件b和已缓存的缓存价值最小的文件(假设为文件1)的大小,如果文件b的尺寸不大于文件1,该边缘缓存节点删除文件1,腾出存储空间来缓存文件b。否则,边缘缓存节点比较文件b和文件1+文件2(文件2为缓存节点中缓存价值第二小的文件)的大小。如果文件b的尺寸不大于文件1+文件2的尺寸,边缘缓存节点删除文件1和文件2,腾出足够的缓存空间存储文件b。否则,该边缘缓存节点将继续寻找待替换的文件;
步骤S4.4、边缘缓存节点缓存文件b。
Claims (7)
1.一种基于边缘缓存的CDN-P2P网络的内容下载、预存方法,其特征在于,包括以下步骤:
步骤S1、用户请求下载文件a;
若本地边缘缓存节点缓存了文件a,则用户从本地边缘缓存节点下载文件a;否则,用户从其他边缘缓存节点、边缘CDN服务器或源服务器上下载文件a;
步骤S2、将边缘CDN服务器中存储的所有文件根据内容分类,并根据流行度提前对各类文件进行排序,记录各类文件流行度最高的前A(A≥100)个,用于后续的预存;
步骤S3、根据边缘CDN服务器中与文件a兴趣-相关度、支持度和置信度,找出在流行度为前A(A≥100)个中与文件a最相关的同类型文件b;根据同类型文件a与文件b的预存效用,请求用户所在的边缘缓存节点进行预存文件b;
步骤S4、预存文件b;
当用户所在的边缘缓存节点存储空间足够时,直接预存文件b;当用户所在的边缘缓存节点存储空间不足时,根据基于文件缓存价值的内容替换方法先替换出一些文件后再预存文件b。
2.根据权利要求1所述的基于边缘缓存的CDN-P2P网络的内容下载、预存方法,其特征在于,所述步骤S1具体为:
(1)若本地边缘缓存节点已缓存文件a,则用户从本地边缘缓存节点下载文件a;同时,用户向后台系统发送一条自己下载文件a的消息;
(2)若本地边缘缓存节点没有缓存文件a,则用户通过访问后台系统,寻找其他已缓存了文件a的边缘缓存节点进行下载;
(3)若本地边缘缓存节点与其他边缘缓存节点均没有缓存文件a,则用户从边缘CDN服务器上下载文件a;
(4)若本地边缘缓存节点、其他边缘缓存节点与边缘CDN服务器均没有缓存文件a,则用户从源服务器下载文件a。
3.根据权利要求1所述的基于边缘缓存的CDN-P2P网络的内容下载、预存方法,其特征在于,所述步骤S2具体为:
定义边缘CDN服务器下属l个边缘缓存节点的集合为S={s1,s2,...,sl},l为大于等于1的整数;
步骤S2.1、边缘CDN服务器将存储的所有文件根据内容分成q类,q为大于等于1的整数;
步骤S2.2、计算边缘CDN服务器上每个文件的流行度;
所述流行度是边缘CDN服务器内所有边缘缓存节点对一个任意文件k在一个周期T内的访问次数总和;
计算文件k的流行度Fk:
其中,为边缘缓存节点si所辖所有用户对文件k的总请求次数;
步骤S2.3、根据流行度提前对各类文件进行排序,记录各类文件流行度最高的前A(A≥100)个;
定义各类型流行度前A(A≥100)的文件的集合为Dj={dj1,dj2,...,djb,...,djA},其中,j∈[1,q],dj1是j类型文件中流行度最高的文件,djb是j类型文件中流行度第b高的文件,以此类推。
4.根据权利要求1所述的基于边缘缓存的CDN-P2P网络的内容下载、预存方法,其特征在于,所述步骤S3具体为:
步骤S3.1、计算边缘缓存节点si对文件a的兴趣度Ii(a);
所述兴趣度是指节点对资源感兴趣的程度,可以通过用户对数据对象的访问频率来衡量;
所述边缘缓存节点si对文件a的兴趣度Ii(a)为:
Ii(a)越大,表示边缘缓存节点si对文件a的兴趣度越高;
步骤S3.2、计算同一j类型文件a与文件b间的兴趣-相关度R(dja,djb):
其中,dja为j类型文件中用户请求下载的文件a;
djb为边缘CDN服务器中与dja同类型且流行度前A(A≥100)的文件之一,即djb∈Dj,其中b∈{1,2,...,A};
为CDN-P2P网络中所有边缘缓存节点对文件a的兴趣度的平均值;
为CDN-P2P网络中所有边缘缓存节点对文件b的兴趣度的平均值;
R(dja,djb)值越大,表示文件a与文件b的兴趣-相关度越高,反之表示兴趣-相关度越低;
步骤S3.3、计算同一j类型文件a与文件b间的支持度Sup(a,b);
所述同一j类型文件a与文件b间的支持度指文件a和文件b同时出现的概率;
Sup(a,b)值越大,表示文件a和文件b同时出现的概率越高,则其相关性就越高;
步骤S3.4、计算同一j类型文件a与文件b间的置信度Con(a,b);
所述同一j类型文件a与文件b间的置信度指文件a被访问时,文件b被访问的概率;
Con(a,b)值越大,则说明文件a被访问时,文件b被访问的概率越高,则其相关性就越高;
步骤S3.5、计算与用户请求j类型文件a,同类型文件b的预存效用f(dja,djb);
所述预存效用与文件之间的兴趣-相关度、支持度、置信度相关;
所述j类型文件a和文件b的预存效用f(dja,djb)通过下式计算:
f(dja,djb)=αR(dja,djb)×βSup(dja,djb)×γCon(dja,djb)
其中,α、β、γ分别为全局影响因子,取值范围均为[0,1];
文件间的兴趣-相关度越高,对预存效用值起促进作用;文件间的支持度越高,对预存效用值起促进作用;文件间的置信度越高,对预存效用值起促进作用。
5.一种基于边缘缓存的CDN-P2P网络的内容替换方法,其特征在于,内容替换方法具体为:
若请求下载文件a的用户所在边缘缓存节点从后台系统接收到可以预存文件b的消息时,则便可以开始对文件b进行缓存;
若用户所在边缘缓存节点的存储空间足够缓存预存文件b时,预存文件b将直接被缓存入该边缘缓存节点的存储空间;
若用户所在边缘缓存节点的存储空间不足以缓存预存文件b时,将采用基于文件缓存价值的内容替换方法先替换出某些文件后再缓存预存文件b。
6.一种如权利要求5所述的基于边缘缓存的CDN-P2P网络的内容替换方法,其特征在于,所述基于文件缓存价值的内容替换方法为:
步骤S4.1、当确定了预存文件b后,边缘缓存节点开始对其进行缓存;边缘缓存节点对已存储的文件m的缓存价值按升序排列,即m={1,2,…,n};
步骤S4.2、如果边缘缓存节点的剩余存储空间足够存储文件b,则该边缘缓存节点直接缓存文件b,否则,转步骤S4.3;
步骤S4.3、依次比较文件b与边缘缓存节点已存储文件m的缓存价值,若文件b的缓存价值小于第一个文件的缓存价值,则不进行替换,否则,进入步骤S4.4;
步骤S4.4、边缘缓存节点依次删除缓存价值最小的一个文件或多个文件,直到腾出足够的缓存空间存储文件b,然后存储文件b。
7.根据权利要求6所述的一种基于边缘缓存的CDN-P2P网络的内容替换方法,其特征在于:
步骤4.1)中,所述已存储文件m的缓存价值Vm(t):
其中:
Nm(t)为t时刻系统中文件m被请求的次数;
Cm(t)为t时刻系统中所有边缘缓存节点存储的文件m的总数量;
ρ为比重因子,介于0-1之间;
T是一个周期;t是T的整数倍;
Vm(t-T)为文件m在t时刻的上一个周期的缓存价值;
Vm(t)为文件m在t时刻的缓存价值,Vm(t)的值越大,表示文件m的缓存价值越高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111215312.0A CN113992653B (zh) | 2021-10-19 | 2021-10-19 | 一种基于边缘缓存的cdn-p2p网络的内容下载、预存和替换方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111215312.0A CN113992653B (zh) | 2021-10-19 | 2021-10-19 | 一种基于边缘缓存的cdn-p2p网络的内容下载、预存和替换方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113992653A CN113992653A (zh) | 2022-01-28 |
CN113992653B true CN113992653B (zh) | 2023-09-15 |
Family
ID=79739328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111215312.0A Active CN113992653B (zh) | 2021-10-19 | 2021-10-19 | 一种基于边缘缓存的cdn-p2p网络的内容下载、预存和替换方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113992653B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103607386A (zh) * | 2013-11-15 | 2014-02-26 | 南京云川信息技术有限公司 | 一种P2P Cache系统中的协作缓存方法 |
CN109194767A (zh) * | 2018-09-27 | 2019-01-11 | 华侨大学 | 一种适用于混杂网络的流媒体缓存调度方法 |
CN113453038A (zh) * | 2021-06-25 | 2021-09-28 | 桂林电子科技大学 | 一种cdn-p2p混合架构下效用最优协同缓存管理方法 |
-
2021
- 2021-10-19 CN CN202111215312.0A patent/CN113992653B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103607386A (zh) * | 2013-11-15 | 2014-02-26 | 南京云川信息技术有限公司 | 一种P2P Cache系统中的协作缓存方法 |
CN109194767A (zh) * | 2018-09-27 | 2019-01-11 | 华侨大学 | 一种适用于混杂网络的流媒体缓存调度方法 |
CN113453038A (zh) * | 2021-06-25 | 2021-09-28 | 桂林电子科技大学 | 一种cdn-p2p混合架构下效用最优协同缓存管理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113992653A (zh) | 2022-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11194719B2 (en) | Cache optimization | |
US11431791B2 (en) | Content delivery method, virtual server management method, cloud platform, and system | |
US10341700B2 (en) | Dynamic binding for use in content distribution | |
KR101228230B1 (ko) | 컨텐츠 전달 네트워크 내의 노드에서 하나 이상의 컨텐츠 아이템을 캐싱하는 방법, 장치 및 제품 | |
US8745262B2 (en) | Adaptive network content delivery system | |
US8612668B2 (en) | Storage optimization system based on object size | |
EP2359536B1 (en) | Adaptive network content delivery system | |
US6370620B1 (en) | Web object caching and apparatus for performing the same | |
JP4938074B2 (ja) | リソースの位置情報の要求方法、当該方法のためのユーザノードおよびサーバ | |
CN102523279A (zh) | 一种分布式文件系统及其热点文件存取方法 | |
US20190266633A1 (en) | System and Method for Optimizing Content Distribution | |
WO2009079948A1 (fr) | Procédé de mise en tampon et d'interrogation de contenu, et système de transmission multimédia point à point | |
US6973536B1 (en) | Self-adaptive hybrid cache | |
Azimdoost et al. | Optimal in-network cache allocation and content placement | |
CN113992653B (zh) | 一种基于边缘缓存的cdn-p2p网络的内容下载、预存和替换方法 | |
CN114095573B (zh) | 基于边缘缓存的cdn-p2p网络的内容副本放置方法 | |
JP7174372B2 (ja) | 分散ストレージネットワークにおけるデータ管理方法、装置、プログラム | |
CN116633921A (zh) | 基于边缘缓存的cdn-p2p网络及缓存方法、缓存放置方法 | |
CN114124971B (zh) | 一种基于边缘缓存的cdn-p2p网络的内容副本放置方法 | |
Nam et al. | Data Utilization-Based Adaptive Data Management Method for Distributed Storage System in WAN Environment. | |
Lee et al. | Fera: a caching scheme in ccn using file-extension and regression analysis | |
Papadakis et al. | Adaptive content caching simulation with visualization capabilities | |
CN118233468A (zh) | 一种基于云计算的资源下载管理方法及系统 | |
JP2021170289A (ja) | 情報処理システム、情報処理装置およびプログラム | |
Rao et al. | SURVEY ON CACHING AND REPLICATION ALGORITHM FOR CONTENT DISTRIBUTION IN PEER TO PEER NETWORKS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |