CN107508758A - 一种热点文件自动扩散的方法 - Google Patents
一种热点文件自动扩散的方法 Download PDFInfo
- Publication number
- CN107508758A CN107508758A CN201710702580.2A CN201710702580A CN107508758A CN 107508758 A CN107508758 A CN 107508758A CN 201710702580 A CN201710702580 A CN 201710702580A CN 107508758 A CN107508758 A CN 107508758A
- Authority
- CN
- China
- Prior art keywords
- buffer memory
- memory device
- focus
- load
- url
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
- H04L47/125—Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
- H04L67/1044—Group management mechanisms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/568—Storing data temporarily at an intermediate stage, e.g. caching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/568—Storing data temporarily at an intermediate stage, e.g. caching
- H04L67/5682—Policies or rules for updating, deleting or replacing the stored data
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种热点文件自动扩散的方法,将热点发现分为两个维度:请求数和带宽;只要有一个维度判断成功,则认为发现热点文件,负载均衡设备即进行热点扩散行为,访问后端缓存设备时不执行一致性哈希策略,随机选取缓存设备进行访问,再使该文件可以均匀访问到每一台缓存设备,结构合理,使用方便,集群各设备负载均匀,使这些文件对应设备的负载增大且便利的随时提供服务。
Description
技术领域
本发明涉及互联网技术领域,尤其是涉及一种热点文件自动扩散的方法。
背景技术
随着社会的发展,互联网用户快速增长带动了互联网经济的蓬勃发展,移动互联网、电子商务、网络视频、品牌网络广告、网上招聘、网络游戏等在极短的时间得到快速发展并积累了众多用户,成为了人们生活中不可或缺的一部分。
让人们越来越关注互联网技术的更新,如何更好更快更方便的共享互联网资源,成为人们共同的焦点。
CDN的全称是Content Delivery Network,即内容分发网络。其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快、更稳定.通过在网络各处放置节点服务器所构成的在现有的互联网基础之上的一层智能虚拟网络,CDN系统能够实时地根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上.其目的是使用户可就近取得所需内容,解决Internet网络拥挤的状况,提高用户访问网站的响应速度。
热点文件在CDN领域中的解释为访问较为频繁的文件,比如一个门户网站上,当出现了一个热点的新闻事件,公众对这个新闻事件的访问比较频繁,这个文件就可称为热点文件;再比如一个热播的电视剧,公众通过下载观看的人数比较多,这个视频文件就可称为热点文件。
在CDN业务系统中,在cdn的缓存集群中,通常采用两层架构:负载均衡层和缓存层,负载均衡层通常采用一致性哈希策略将文件哈希到不同的缓存设备,达到节省集群存储和提高缓存命中率的作用。
在这种策略下,如果某些文件的访问特别集中,会造成集群各设备负载不均,使这些文件对应设备的负载增大甚至无法提供服务。
发明内容
本发明的目的在于提供一种热点文件自动扩散的方法,以解决上述背景技术中提出的问题和缺陷。
为实现上述目的,本发明提供如下技术方案:
一种热点文件自动扩散的方法,将热点发现分为两个维度:请求数和带宽;只要有一个维度判断成功,则认为发现热点文件,即进行热点扩散行为,热点文件的扩散由负载均衡设备来完成,负载均衡设备访问后端缓存设备时不执行一致性哈希策略,随机选取缓存设备进行访问,再将被判断为热点的文件均衡地调度到每一台缓存设备。
在上述技术方案中,发现热点文件的具体过程为:
Q1:负载均衡设备每接收到一次请求,通过一致性哈希策略选择一台缓存设备,增加该缓存设备的请求数或带宽计数,以及增加该url的访问次数或带宽计数;
Q2:判断是否出现热点,即负载均衡设备判断是否有缓存设备的请求计数值或带宽数值超过所有设备均值和一个热点系数的乘积,如果超过则认为该缓存设备出现热点,
Q3:负载均衡设备查找该缓存设备中访问次数最多的url,认为该url需要做热点扩散,将该url加入到热点url集合中;
Q4:负载均衡设备从该缓存设备的请求计数值减掉该url的请求计数值或带宽计数值,再次判断该缓存设备的请求计数值或宽计数值是否超过所有缓存设备均值和一个热点系数的乘积,循环该操作,直到该设备的请求计数值或宽计数值小于所有设备均值和一个热点系数的乘积;
Q5:负载均衡设备收到用户请求后,判断该请求的url是否在热点url集合中,如果命中,则认为是热点文件,进行热点扩散,负载均衡设备访问后端缓存设备时不执行一致性哈希策略,随机选取缓存设备进行访问,再使该文件可以均匀访问到每一台缓存设备。
本发明的优点:
本发明实施例提供的一种热点文件自动扩散的方法,提供了两种判断方式,结构合理,使用方便,集群各设备负载均匀,使这些文件对应设备的负载增大且便利的随时提供服务。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种热点文件自动扩散的方的当判断请求数维度时,负载均衡层的工作流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的 附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
当判断请求数维度时,负载均衡层维护了每台后端缓存设备的请求数,以及每个url的访问次数(所有url会以访问计数值构建红黑树(或其他数据结构,以获取最大访问计数的url)),该数据周期性清零。发现步骤如下:
Q1:负载均衡层每接收到一次请求,通过一致性哈希策略选择一台缓存设备,增加该缓存设备的请求数计数,以及增加该url的访问次数计数;
Q2:判断是否出现热点,即负载均衡层判断是否有缓存设备的请求计数值超过所有设备均值和一个热点系数的乘积,如果超过则认为该缓存设备出现热点,
Q3:负载均衡层查找该缓存设备中访问次数最多的url,认为该url需要做热点扩散,将该url加入到热点url集合中。
Q4:负载均衡设备从该缓存设备的请求计数值减掉该url的请求计数值,再次判断该缓存设备的请求计数值是否超过所有缓存设备均值和一个热点系数的乘积,循环该操作,直到该设备的请求计数值小于所有设备均值和一个热点系数的乘积。
Q5:负载均衡层收到用户请求后,判断该请求的url是否在热点url集合中,如果命中,则认为是热点文件,利用自身的负载均衡功能进行热点扩散,访问后端缓存设备时不执行一致性哈希策略,随机选取缓存设备进行访问。从而使该文件可以均匀访问到每一台缓存设备。
负载均衡设备能够将访问量进行均衡,分摊到多个操作单元上进行执行,例如Web服务器、FTP服务器、企业关键应用服务器和其它关键任务服务器等,从而共同完成工作任务。
实施例2
当判断带宽维度时,负载均衡层维护了每台后端缓存设备的带宽数,以及每个url的带宽数(所有url会以带宽数计数值构建红黑树(或其他数据结构,以获取最大带宽数计数的url)),该数据周期性清零。发现步骤如下:
Q1:负载均衡层每接收到一次请求,通过一致性哈希策略选择一台缓存设备,增加该缓存设备的带宽数计数,以及增加该url的访带宽数计数;
Q2:判断是否出现热点,即负载均衡层判断是否有缓存设备的带宽数计数值超过所有设备均值和一个热点系数的乘积,如果超过则认为该缓存设备出现热点,
Q3:负载均衡层查找该缓存设备中带宽数最多的url,认为该url需要做热点扩散,将该url加入到热点url集合中。
Q4:负载均衡设备从该缓存设备的带宽数计数值减掉该url的带宽数计数值,负载均衡设备再次判断该缓存设备的带宽数计数值是否超过所有缓存设备均值和一个热点系数的乘积,循环该操作,直到该设备的带宽数计数值小于所有设备均值和一个热点系数的乘积。
Q5:负载均衡层收到用户请求后,判断该请求的url是否在热点url集合中,如果命中,则认为是热点文件,利用自身的负载均衡功能进行热点扩散,访问后端缓存设备时不执行一致性哈希策略,随机选取缓存设备进行访问。从而使该文件可以均匀访问到每一台缓存设备。
以上所述仅为本发明的较佳实施方式作了详细说明,但是本发明并不限于上述实施方式,保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内,本发明实施例还可以在不脱离本专利宗旨的前提下做出各种变化。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (2)
1.一种热点文件自动扩散的方法,其特征在于,将热点发现分为两个维度:请求数和带宽;只要有一个维度判断成功,则认为发现热点文件,即进行热点扩散行为,热点文件的扩散由负载均衡设备来完成,负载均衡设备访问后端缓存设备时不执行一致性哈希策略,随机选取缓存设备进行访问,再将被判断为热点的文件均衡地调度到每一台缓存设备。
2.根据权利要求1所述的一种热点文件自动扩散的方法,其特征在于,发现热点文件的具体过程为:
Q1:负载均衡设备每接收到一次请求,通过一致性哈希策略选择一台缓存设备,增加该缓存设备的请求数或带宽计数,以及增加该url的访问次数或带宽计数;
Q2:判断是否出现热点,即负载均衡设备判断是否有缓存设备的请求计数值或带宽数值超过所有设备均值和一个热点系数的乘积,如果超过则认为该缓存设备出现热点,
Q3:负载均衡设备查找该缓存设备中访问次数最多的url,认为该url需要做热点扩散,将该url加入到热点url集合中;
Q4:负载均衡设备从该缓存设备的请求计数值减掉该url的请求计数值或带宽计数值,再次判断该缓存设备的请求计数值或宽计数值是否超过所有缓存设备均值和一个热点系数的乘积,循环该操作,直到该设备的请求计数值或宽计数值小于所有设备均值和一个热点系数的乘积;
Q5:负载均衡设备收到用户请求后,判断该请求的url是否在热点url集合中,如果命中,则认为是热点文件,进行热点扩散,负载均衡设备访问后端缓存设备时不执行一致性哈希策略,随机选取缓存设备进行访问,再使该文件可以均匀访问到每一台缓存设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710702580.2A CN107508758A (zh) | 2017-08-16 | 2017-08-16 | 一种热点文件自动扩散的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710702580.2A CN107508758A (zh) | 2017-08-16 | 2017-08-16 | 一种热点文件自动扩散的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107508758A true CN107508758A (zh) | 2017-12-22 |
Family
ID=60691417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710702580.2A Pending CN107508758A (zh) | 2017-08-16 | 2017-08-16 | 一种热点文件自动扩散的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107508758A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109525662A (zh) * | 2018-11-14 | 2019-03-26 | 程桂平 | 为热点内容设置副本的方法 |
CN110149394A (zh) * | 2019-05-20 | 2019-08-20 | 典基网络科技(上海)有限公司 | 系统资源的调度方法、装置和存储介质 |
CN110830535A (zh) * | 2018-08-10 | 2020-02-21 | 网宿科技股份有限公司 | 一种超热文件的处理方法、负载均衡设备及下载服务器 |
CN111432039A (zh) * | 2020-06-15 | 2020-07-17 | 北京金山云网络技术有限公司 | Cdn中数据请求方法、装置、设备和cdn节点 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103281367A (zh) * | 2013-05-22 | 2013-09-04 | 北京蓝汛通信技术有限责任公司 | 一种负载均衡方法及装置 |
CN104065568A (zh) * | 2014-07-07 | 2014-09-24 | 电子科技大学 | 一种Web服务器集群的路由方法 |
CN104935653A (zh) * | 2015-06-09 | 2015-09-23 | 中国人民解放军国防科学技术大学 | 一种访问热点资源的旁路缓存方法和装置 |
-
2017
- 2017-08-16 CN CN201710702580.2A patent/CN107508758A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103281367A (zh) * | 2013-05-22 | 2013-09-04 | 北京蓝汛通信技术有限责任公司 | 一种负载均衡方法及装置 |
CN104065568A (zh) * | 2014-07-07 | 2014-09-24 | 电子科技大学 | 一种Web服务器集群的路由方法 |
CN104935653A (zh) * | 2015-06-09 | 2015-09-23 | 中国人民解放军国防科学技术大学 | 一种访问热点资源的旁路缓存方法和装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110830535A (zh) * | 2018-08-10 | 2020-02-21 | 网宿科技股份有限公司 | 一种超热文件的处理方法、负载均衡设备及下载服务器 |
CN110830535B (zh) * | 2018-08-10 | 2021-03-02 | 网宿科技股份有限公司 | 一种超热文件的处理方法、负载均衡设备及下载服务器 |
US11201914B2 (en) | 2018-08-10 | 2021-12-14 | Wangsu Science & Technology Co., Ltd. | Method for processing a super-hot file, load balancing device and download server |
CN109525662A (zh) * | 2018-11-14 | 2019-03-26 | 程桂平 | 为热点内容设置副本的方法 |
CN110149394A (zh) * | 2019-05-20 | 2019-08-20 | 典基网络科技(上海)有限公司 | 系统资源的调度方法、装置和存储介质 |
CN111432039A (zh) * | 2020-06-15 | 2020-07-17 | 北京金山云网络技术有限公司 | Cdn中数据请求方法、装置、设备和cdn节点 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102523256B (zh) | 内容的管理方法的方法、装置和系统 | |
CN102882939B (zh) | 负载均衡方法、设备及泛域名加速访问系统 | |
CN107801086B (zh) | 多缓存服务器的调度方法和系统 | |
CN1331333C (zh) | 基于对等式分布计算技术的并行信息传送方法及其系统 | |
CN107508758A (zh) | 一种热点文件自动扩散的方法 | |
US20170134517A1 (en) | Data storage based on content popularity | |
CN107835437B (zh) | 基于多缓存服务器的调度方法和装置 | |
CN106790324A (zh) | 内容分发方法、虚拟服务器管理方法、云平台和系统 | |
EP3790254A1 (en) | Access log processing method and device | |
US20150256479A1 (en) | Weighted request rate limiting for resources | |
US20140280996A1 (en) | Pre-delivery of content to devices | |
CN101510899B (zh) | 一种实现内容源选择的方法、系统和设备 | |
WO2005086043A2 (en) | Content provisioning method and system | |
CN102577241A (zh) | 分布式缓存资源调度的方法、装置及系统 | |
EP2385680B1 (en) | Content delivery over a peer-to-peer network | |
CN103179148A (zh) | 一种在互联网中分享附件的处理方法和系统 | |
CN108449388A (zh) | 一种多节点设备闲置带宽聚合利用方法及系统 | |
CN105243078B (zh) | 一种文件资源的分发方法、系统和装置 | |
JP2009122981A (ja) | キャッシュ配置方法 | |
JPWO2011024930A1 (ja) | コンテンツ配信システム、コンテンツ配信方法及びコンテンツ配信用プログラム | |
CN103416027A (zh) | 缓存优化的方法、缓存器和缓存优化的系统 | |
Zeng et al. | Space4time: Optimization latency-sensitive content service in cloud | |
CN104168299A (zh) | 资源处理系统和资源处理方法 | |
Liu et al. | Cache behavior characterization and validation over large-scale video data | |
KR20150011087A (ko) | 컨텐츠 전송 서비스를 위한 분산 캐싱 관리 방법 및 이를 위한 중앙 관리 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20171222 |