CN111107135B - 一种容器镜像并行分发方法、调度器及存储介质 - Google Patents

一种容器镜像并行分发方法、调度器及存储介质 Download PDF

Info

Publication number
CN111107135B
CN111107135B CN201911214484.9A CN201911214484A CN111107135B CN 111107135 B CN111107135 B CN 111107135B CN 201911214484 A CN201911214484 A CN 201911214484A CN 111107135 B CN111107135 B CN 111107135B
Authority
CN
China
Prior art keywords
node
data block
distribution
scheduling
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911214484.9A
Other languages
English (en)
Other versions
CN111107135A (zh
Inventor
马德超
高原
顾文杰
顾雯轩
丁雨恒
董子奇
赵京虎
彭晖
陈鹏
陈泊宇
陈旻昱
陈兴亮
汤雨豪
符鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nari Technology Co Ltd
NARI Nanjing Control System Co Ltd
Original Assignee
Nari Technology Co Ltd
NARI Nanjing Control System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nari Technology Co Ltd, NARI Nanjing Control System Co Ltd filed Critical Nari Technology Co Ltd
Priority to CN201911214484.9A priority Critical patent/CN111107135B/zh
Publication of CN111107135A publication Critical patent/CN111107135A/zh
Application granted granted Critical
Publication of CN111107135B publication Critical patent/CN111107135B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种容器镜像并行分发方法、调度器及存储介质,所述方法包括:将节点调度队列中数据块所在节点作为分发节点,向请求节点传输数据块;接收超级节点推送的请求节点数据块写磁盘操作成功的确认信息,并将该请求节点插入到节点调度队列中;在调度窗口内根据数据块信息,对分发节点和请求节点进行调度匹配:若调度匹配成功,则控制请求节点从所述分发节点下载数据块。本发明能够保证负载均衡性,提高大规模文件分发效率。

Description

一种容器镜像并行分发方法、调度器及存储介质
技术领域
本发明涉及一种容器镜像并行分发方法、调度器及存储介质,属于技术领域。
背景技术
为了获得更高效率的云服务,容器技术自诞生以来便受到了业界的广泛支持。作为一种基于容器的虚拟化技术,Docker在很多公司及数据中心中被广泛部署使用。在实际应用中,随着不同模板数量的增多,容器环境下的镜像分发逐渐成为了一个令云服务管理者头疼的问题。大规模数据中心每天会启动数十万个Docker容器,Docker容器的启动速度对数据中心的高效运行十分重要,如果不能及时启动应用程序的容器以响应请求,镜像并发拉取时分发效率会急剧下降。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种容器镜像并行分发方法、调度器及存储介质,能够保证负载均衡性,提高大规模文件分发效率。
为达到上述目的,本发明是采用下述技术方案实现的:
一方面,本发明提供了一种容器镜像并行分发方法,所述方法包括如下步骤:
将节点调度队列中数据块所在节点作为分发节点,向请求节点传输数据块;
接收超级节点推送的请求节点数据块写磁盘操作成功的确认信息,并将该请求节点插入到节点调度队列中;
在调度窗口内根据数据块信息,对分发节点和请求节点进行调度匹配:若调度匹配成功,则控制请求节点从所述分发节点下载数据块。
结合第一方面,进一步的,所述方法还包括:
接收超级节点推送的请求下载的数据块信息和数据块所在节点信息,将所有数据块信息插入到数据块调度队列,并将数据块所在节点插入到节点调度队列。
结合第一方面,进一步的,调度匹配的方法包括如下步骤:
获取待下载数量最大的数据块;
在节点调度队列中查找满足以下条件的分发节点:
下载数量最大的数据块存在于分发节点上,且分发节点网络输出带宽空闲且分发节点与请求节点地理位置最近;
控制请求节点从所查找的分发节点下载数据块。
结合第一方面,进一步的,所述方法还包括:
接收超级节点发出的数据块下载完成确认信息,将数据块下载完成的请求节点加入到节点调度队列中。
结合第一方面,进一步的,如果未接收到超级节点发出的数据块下载完成确认信息,且请求节点尝试下载失败或请求节点自带心跳超时,则将所述分发节点移除节点调度队列。
结合第一方面,进一步的,数据块调度队列为空时,发出文件下载完成消息,并清除节点调度队列。
第二方面,本发明提供了一种调度器,包括存储器和处理器,所述存储器用于存储指令,所述处理器用于加载所述指令以执行前述任一项所述的方法步骤。
第三方面,本发明提供了一种存储介质,用于存储指令,所述指令能够被处理器加载以执行前述任一项所述的方法步骤。
与现有技术相比,本发明所达到的有益效果包括:
对分发节点和请求节点进行动态调度匹配,能够使分发节点根据自身性能分配到相应数量的数据块,保证在时间和空间上的负载均衡性,提高大规模文件分发效率。
附图说明
图1是根据本发明实施例提供的一种容器镜像并行分发方法的原理框图;
图2是根据本发明实施例提供的数据块调度队列的工作原理示意图;
图3是根据本发明实施例提供的节点调度队列的工作原理示意图。
具体实施方式
容器镜像是分层存储,单个镜像层可能被多个镜像共享,根据每层数据大小下载时会划分成不同数据块,超级节点会将请求下载的数据块所在集群中的位置信息和下载请求信息推送到调度器,镜像分发时P2P网络中的数据块流向由调度器动态决定,使得集群内各个节点的网络和磁盘等资源被充分使用;同时考虑到集群中服务器能力差异问题,让性能弱的节点分担较少的分发任务。调度器主要由两个调度队列组成,分别是存放待下载数据块的数据块调度队列和存放可响应数据块下载请求的节点调度队列。在每个调度窗口的开始时刻处理下载请求,根据下载请求的连续性,可以预测出在当前调度窗口内的所有下载请求。从数据块调度队列中每次选取待下载数量最大的数据块进行分发,因为下载请求数量越大,说明该数据块更加需要其他节点在集群中进行分发。随着时间的推移,调度窗口也不断向前平移。节点资源代理负责向调度器实时汇报本节点网络带宽状态和节点所在集群中的网络拓扑情况等等。调度器可独立部署在超级节点或者对等节点上,节点资源代理工作在集群中每个节点上。
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,是根据本发明实施例提供的一种容器镜像并行分发方法的原理框图,容器镜像并行分发方法包括如下步骤:
步骤1,超级节点会将请求下载的数据块信息和数据块所在节点信息推送到调度器,然后调度器将所有数据块信息插入数据块调度队列,并将数据块所在节点插入到节点调度队列,控制节点调度队列中的节点依次向请求节点传输数据块;
步骤2,请求节点接收到数据块后立刻开始写磁盘操作,写入成功后通过节点资源代理向超级节点发出确认信息,汇报本节点增加了一个数据块,可提供此数据块的转发服务,由超级节点推送到调度器,将本节点插入到节点调度队列,同时请求下一个数据块;
步骤3,调度器会在调度窗口内根据数据块调度队列中的数据块信息,对分发节点和请求节点进行调度匹配,调度过程的伪代码如下所示:
Figure BDA0002299111750000041
Figure BDA0002299111750000051
步骤3中分发节点一旦调度成功则从该节点下载数据块,如果超级节点收到数据块下载完成的确认,会将该节点加入到节点调度队列,当数据块请求下载数为零时会被移出数据块调度队列;如果未收到数据块下载完成的确认,且请求节点尝试重试下载失败,或节点自带心跳超时,则判定该分发节点离线,会被移除节点调度队列,尝试从下个分发节点下载数据块;
数据块调度队列为空时向全系统发出文件下载完成消息,清除节点调度队列。数据块调度队列中的数据块可以属于多个不同镜像文件。
算法一旦从步骤1开始执行则重复执行步骤1以外的其他步骤,直到清除节点调度队列停止。等待下一次提交文件下载请求,再从步骤1开始执行。
本发明实施例利用两个调度队列和系统节点的资源状态,将分发节点与请求节点动态匹配,使分发节点根据自身性能分配到相应数量的数据块,保证了系统时间和空间上的负载均衡性,提高了大规模文件分发效率。
下面以4个对等节点和一个超级节点构成网络集群对本发明实施例提供的方法做进一步详细描述。数据块block1简称b1,对等节点peer1简称p1,其他数据块和对等节点名称类推,超级节点supernode简称s。4个待分发的数据块,每个对等节点数据请求情况:p1(b1、b2),p2(b1、b2,b3),p3(b1、b2,b3,b4),p4(b1、b2,b3,b4),数据块b1-b4的请求数量分别是:4、4、3、2,具体分析本算法数据块的分发过程。算法开始时,集群首次文件分发默认将s放入节点调度队列,数据块调度队列中放入待下载的数据块。图2、图3分别是数据块调度器队列和节点调度器队列工作过程示意图,图中b1[4-0]代表数据块1当前请求下载数为4,已完成下载0次,其他同理。
第一步,s接收到4个节点对b1的下载请求,s将b1缓存下来并分发到p1、p2,由于s的宽带输出被占用,对于其他数据块的请求只能等待下载。p1、p2在接收到b1后具备了分发b1的能力。此时将p1、p2插入到节点调度队列,数据块调度队列中b1待分发数量减2,已完成下载数量加2。
第二步,选择待下载数量最大的b2进行分发,从s将b2缓存下来并分发到p1、p2,同第一步原理,s的宽带输出被占用,只能选择将b1从p1分发到p3、p4,并将p3、p4插入到节点调度队列队尾。
第三步,待收到b1分发完成的确认消息后,调度器将b1从数据块调度队列移出。紧接着选择待下载数量最大的b3进行分发,b3将有s缓存下来会被分发到p2、p3,此时s宽带被占用,p4对b3的请求和b4的请求只能等待下载,b2由p1分发到p4。
第四步,选择待下载量做大的b4进行分发,s将缓存下b4分发到p3、p4,此时s宽带被占用,b2由p1分发到p3,b3由p2分发到p4。
第五步,此时所有数据块被分发完成,节点队列被清空。
本发明还提供了一种调度器,包括存储器和处理器,所述存储器用于存储指令,所述处理器用于加载所述指令以执行前述任一项所述的方法步骤。
本发明还提供了一种存储介质,用于存储指令,所述指令能够被处理器加载以执行前述任一项所述的方法步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (6)

1.一种容器镜像并行分发方法,其特征在于,所述方法包括如下步骤:
接收超级节点推送的请求下载的数据块信息和数据块所在节点信息,将所有数据块信息插入到数据块调度队列,并将数据块所在节点插入到节点调度队列;
将节点调度队列中数据块所在节点作为分发节点,向请求节点传输数据块;
接收超级节点推送的请求节点数据块写磁盘操作成功的确认信息,并将该请求节点插入到节点调度队列中;
在调度窗口内根据数据块信息,对分发节点和请求节点进行调度匹配:若调度匹配成功,则控制请求节点从所述分发节点下载数据块;
调度匹配的方法包括如下步骤:
获取待下载数量最大的数据块;
在节点调度队列中查找满足以下条件的分发节点:
下载数量最大的数据块存在于分发节点上,且分发节点网络输出带宽空闲且分发节点与请求节点地理位置最近;
控制请求节点从所查找的分发节点下载数据块。
2.根据权利要求1所述的容器镜像并行分发方法,其特征在于,所述方法还包括:
接收超级节点发出的数据块下载完成确认信息,将数据块下载完成的请求节点加入到节点调度队列中。
3.根据权利要求2所述的容器镜像并行分发方法,其特征在于,如果未接收到超级节点发出的数据块下载完成确认信息,且请求节点尝试下载失败或请求节点自带心跳超时,则将所述分发节点移除节点调度队列。
4.根据权利要求2所述的容器镜像并行分发方法,其特征在于,数据块调度队列为空时,发出文件下载完成消息,并清除节点调度队列。
5.一种调度器,包括存储器和处理器,所述存储器用于存储指令,其特征在于,所述处理器用于加载所述指令以执行权利要求1至4任一项所述的方法步骤。
6.一种存储介质,用于存储指令,其特征在于,所述指令能够被处理器加载以执行权利要求1至4任一项所述的方法步骤。
CN201911214484.9A 2019-12-02 2019-12-02 一种容器镜像并行分发方法、调度器及存储介质 Active CN111107135B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911214484.9A CN111107135B (zh) 2019-12-02 2019-12-02 一种容器镜像并行分发方法、调度器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911214484.9A CN111107135B (zh) 2019-12-02 2019-12-02 一种容器镜像并行分发方法、调度器及存储介质

Publications (2)

Publication Number Publication Date
CN111107135A CN111107135A (zh) 2020-05-05
CN111107135B true CN111107135B (zh) 2022-07-29

Family

ID=70420821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911214484.9A Active CN111107135B (zh) 2019-12-02 2019-12-02 一种容器镜像并行分发方法、调度器及存储介质

Country Status (1)

Country Link
CN (1) CN111107135B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114489957B (zh) * 2022-04-01 2022-07-22 国家卫星海洋应用中心 遥感卫星数据处理方法、装置和电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102238137A (zh) * 2010-04-27 2011-11-09 腾讯科技(深圳)有限公司 一种下载方法、系统和装置
CN106371889A (zh) * 2016-08-22 2017-02-01 浪潮(北京)电子信息产业有限公司 一种调度镜像的高性能集群系统实现方法及装置
WO2017045424A1 (zh) * 2015-09-18 2017-03-23 乐视控股(北京)有限公司 一种应用程序部署系统及部署方法
CN107404541A (zh) * 2017-09-20 2017-11-28 郑州云海信息技术有限公司 一种对等网络传输邻居节点选择的方法及系统
CN108322496A (zh) * 2017-01-17 2018-07-24 北京京东尚科信息技术有限公司 镜像文件分发方法及系统、计算机可读存储介质、电子设备
CN109104451A (zh) * 2017-06-21 2018-12-28 阿里巴巴集团控股有限公司 Docker镜像的下载方法及节点、Docker镜像的预热方法及节点
CN110198330A (zh) * 2018-03-27 2019-09-03 腾讯科技(深圳)有限公司 镜像下载方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102238137A (zh) * 2010-04-27 2011-11-09 腾讯科技(深圳)有限公司 一种下载方法、系统和装置
WO2017045424A1 (zh) * 2015-09-18 2017-03-23 乐视控股(北京)有限公司 一种应用程序部署系统及部署方法
CN106371889A (zh) * 2016-08-22 2017-02-01 浪潮(北京)电子信息产业有限公司 一种调度镜像的高性能集群系统实现方法及装置
CN108322496A (zh) * 2017-01-17 2018-07-24 北京京东尚科信息技术有限公司 镜像文件分发方法及系统、计算机可读存储介质、电子设备
CN109104451A (zh) * 2017-06-21 2018-12-28 阿里巴巴集团控股有限公司 Docker镜像的下载方法及节点、Docker镜像的预热方法及节点
CN107404541A (zh) * 2017-09-20 2017-11-28 郑州云海信息技术有限公司 一种对等网络传输邻居节点选择的方法及系统
CN110198330A (zh) * 2018-03-27 2019-09-03 腾讯科技(深圳)有限公司 镜像下载方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
如何把Docker镜像分发速度提升90+%;王康瑾;《https://mp.weixin.qq.com/s/eRBLAF0Kfcc5Uwu_55xghA》;20171022;全文 *
数据中心环境下基于相似文件协同的镜像分发技术;韦立超;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑(月刊)》;20180415;正文第5-7、15、38页 *

Also Published As

Publication number Publication date
CN111107135A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
CN112470112B (zh) 块存储系统的分布式副本
US8671134B2 (en) Method and system for data distribution in high performance computing cluster
EP0950952A2 (en) Server workload management in an asynchronous client/server computing system
US8671306B2 (en) Scaling out a messaging system
CN106170016A (zh) 一种处理高并发数据请求的方法和系统
US20100138540A1 (en) Method of managing organization of a computer system, computer system, and program for managing organization
CN101951411A (zh) 云调度系统及方法以及多级云调度系统
CN115328663A (zh) 基于PaaS平台进行资源调度的方法、装置、设备和存储介质
CN102299959A (zh) 一种数据库集群系统的负载均衡实现方法和装置
CN106603692B (zh) 一种分布式存储系统中的数据存储方法及装置
CN111309491B (zh) 一种作业协同处理方法及系统
CN111756841A (zh) 基于微服务集群的业务实现方法、装置、设备及存储介质
CN113132456B (zh) 一种基于截止时间感知的边云协同任务调度方法及系统
CN110427270A (zh) 一种面向rdma网络下分布式连接算子的动态负载均衡方法
US20110131288A1 (en) Load-Balancing In Replication Engine of Directory Server
CN115297008B (zh) 基于智算网络的协同训练方法、装置、终端及存储介质
CN111107135B (zh) 一种容器镜像并行分发方法、调度器及存储介质
CN112261125B (zh) 集中单元的云化部署方法、装置及系统
Ekanayake et al. A scalable communication runtime for clouds
CN112306419B (zh) 一种存储系统中读io的转发方法和存储系统
CN108667920B (zh) 一种雾计算环境业务流量加速系统及其业务流量加速方法
CN116149814A (zh) 一种基于kafka的数据持久化任务分布式调度方法及系统
KR100952166B1 (ko) 그리드 데이터 베이스의 데이터 버전 관리 방법 및 장치
CN112099728B (zh) 一种执行写操作、读操作的方法及装置
CN113687962A (zh) 一种请求处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant