CN103617083B - 存储调度方法和系统、作业调度方法和系统及管理节点 - Google Patents

存储调度方法和系统、作业调度方法和系统及管理节点 Download PDF

Info

Publication number
CN103617083B
CN103617083B CN201310534978.1A CN201310534978A CN103617083B CN 103617083 B CN103617083 B CN 103617083B CN 201310534978 A CN201310534978 A CN 201310534978A CN 103617083 B CN103617083 B CN 103617083B
Authority
CN
China
Prior art keywords
back end
available bandwidth
task
data block
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310534978.1A
Other languages
English (en)
Other versions
CN103617083A (zh
Inventor
左奇
戚晨
王东
王志坤
曲文武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201310534978.1A priority Critical patent/CN103617083B/zh
Publication of CN103617083A publication Critical patent/CN103617083A/zh
Application granted granted Critical
Publication of CN103617083B publication Critical patent/CN103617083B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提出了一种根据路径可用带宽进行调度的存储调度方法和作业调度方法,还提出了与之相对应的管理节点、存储调度系统和作业调度系统。本发明根据存储调度算法将数据块存储在路径可用带宽加权均值最大的数据节点列表,避免了网络拥塞并缩短了数据块存储的网络传输时间。本发明根据路径可用带宽信息为数据节点分配优选作业进行处理,提升了作业的本地化概率,并且减少了作业总完成时间。

Description

存储调度方法和系统、作业调度方法和系统及管理节点
技术领域
本发明涉及云计算技术领域,尤其涉及一种云计算任务调度中的存储调度方法和系统、作业调度方法和系统及管理节点。
背景技术
随着搜索引擎、社交网站、电子商务等数据密集型互联网应用的迅猛发展,基于分布式基础架构的海量数据处理平台(如Hadoop、MapReduce、分布式文件系统、数据定义存储等)被广泛关注。在这些平台上,不仅需要支持大容量文件(TB级、PB级)存储/下载、快速检索,还需要执行机器学习、数据挖掘、数据分析等大规模数据处理作业,还需要快速响应交互式用户请求,因此,云计算平台需要分发执行多个数据密集型的并行作业。当前作业调度算法往往从保证作业间公平分享数据中心计算资源存储的同时,通过加强作业的数据本地性(即把任务调度于输入数据所在的数据节点以减少网络传输开销)来提升系统性能和作业吞吐率。
这类任务调度算法存在如下缺点:1、远程数据存储和读取过程中,分布式文件系统因未感知平台内的网络路径可用带宽信息,任务调度算法为作业所选择的数据节点可能会因网络质量差,导致数据存取时间延长,用户体验很差;2、数据中心工作负荷、网络负荷等环境因素随时可能变化,而现有的延迟调度算法的等待时间阈值是用户提交作业时设定的,不能适应数据中心负荷的变化,虽有改进的算法,如时间阈值动态变化,但计算公式复杂,计算负荷较大,不适合大容量分布式系统,导致实用性降低。
发明内容
本发明的目的是提出一种云计算任务调度中的存储调度方法和系统、作业调度方法和系统及管理节点,够提高云计算系统的执行性能。
为了达到上述目的,本发明提出了一种存储调度方法,包括:
管理节点获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;
当管理节点接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,n、m为预先设定的整数;
管理节点根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;
并将计算得到的路径可用带宽加权均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点。
优选地,所述m为3,每组数据节点中,包括第二数据节点、第三数据节点和第四数据节点,第三数据节点和第四数据节点处于同一机架,第二数据节点与第三数据节点处于不同机架;
所述管理节点根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值包括:
计算每组数据节点中所述客户端到所述第二数据节点之间的第一网络路径的路径可用带宽;
计算每组数据节点中所述第二数据节点到第三数据节点之间的第二网络路径的路径可用带宽;
计算每组数据节点中所述第三数据节点到第四数据节点之间的第三网络路径的路径可用带宽;
将每组数据节点中三条网络路径的路径可用带宽进行加权平均计算路径可用带宽加权均值。
优选地,所述每组数据节点中所述第一网络路径和所述第二网络路径的加权系数均为0.4,所述第三网络路径的加权系数为0.2。
本发明还提出一种作业调度方法,包括:
管理节点获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;
当第一数据节点空闲并向管理节点请求新任务时,管理节点选择一个作业;
当所选择的作业中没有尚未处理的数据块存储在所述第一数据节点的任务,但有尚未处理的数据块存储的数据节点与所述第一数据节点处于同一机架的任务时,
管理节点根据获得的各数据节点的路径可用带宽,计算第一数据节点所在的机架内含有所述选择的作业所需数据块的第一待选数据节点和第一数据节点间的路径可用带宽均值Btemp,并计算路径可用带宽比值γ;所述第一待选数据节点为一个或一个以上。
优选地,所述第一待选数据节点和所述第一数据节点的路径可用带宽均值Btemp为:
其中,n为所述第一待选数据节点的个数;i表示机架;j表示端口;Bi,j1,Bi,j2,……,Bi,jn为所述第一待选数据节点的路径可用带宽;
所述路径可用带宽比值γ为:
其中Bport为所述第一数据节点所在机架的机架交换机入口与服务器的端口带宽标称值。
优选地,当所述选择的作业的轮空次数满足第一条件时,该方法还包括:
所述管理节点选择所述第一待选数据节点中路径可用带宽最大的数据节点作为所述第一数据节点的数据源;
设置所述选择的作业的轮空次数为0;
所述管理节点将所述路径可用带宽最大的数据节点作为数据源的任务返回给所述第一数据节点执行;
其中,第一条件为:Countk≥(1-γ)x1
其中,Countk为所述选择的作业的轮空次数,x1为所述第一数据节点可以申请到数据块存储在所述第一数据节点的任务的概率为时的申请次数,R为文件分块的备份数,M为物理机集群数。
优选地,当所选择出的作业中有尚未处理的数据块存储在第一数据节点的任务时,该方法还包括:
所述管理节点将所述任务返回给所述第一数据节点执行。
优选地,当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点所在的机架内的任务,且所述选择的作业的轮空次数满足第二条件时,该方法还包括:
所述管理节点选择其他机架中含有所述选择的作业所需数据块所在的第二待选数据节点的路径中路径可用带宽最大的数据节点作为所述第一数据节点的数据源;
设置所述选择的作业的轮空次数为0;
所述管理节点将所述路径可用带宽最大的数据节点作为数据源的任务返回给所述第一数据节点执行;
其中,第二条件为:Countk≥x2
其中,x2为所述第一数据节点可以申请到数据块存储在所述第一数据节点的任务的概率为时的申请次数,N为所述选择的作业中尚未处理的任务数,R为文件分块的备份数,M为物理机集群数。
优选地,当所述选择的作业中有尚未处理的数据块存储的数据节点与所述第一数据节点处于同一机架的任务,且所述选择的作业的轮空次数不满足第一条件;或者当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点所在的机架内的任务,且所述选择的作业的轮空次数不满足第二条件时,该方法还包括:
所述管理节点将所述选择的作业的轮空次数加1。
优选地,所述管理节点选择一个作业的方法包括:
所述管理节点根据各作业在系统中运行的任务数对作业进行升序排列;
所述管理节点在作业队列中查找第一个含有尚未处理的数据块存储在所述第一数据节点的任务的作业,将该作业调整至同一级别的最高位置;
所述管理节点从作业队列中由上到下选择一个作业。
本发明还提出了一种管理节点,至少包括:
获取模块,用于获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;
预选模块,用于当接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,m、n为预先设定的整数;
计算模块,用于根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;将计算得到的路径可用带宽均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点。
本发明还提出了一种管理节点,至少包括:
获取模块,用于获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;
选择模块,用于当接收到来自第一数据节点的新任务请求时,选择一个作业;
返回模块,用于当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点的任务,但有尚未处理的数据块存储的数据节点与所述第一数据节点处于同一机架的任务时,根据获得的各数据节点的路径可用带宽,计算所述数据节点所在的机架内含有所述作业所需数据块的第一待选数据节点和所述第一数据节点的路径可用带宽均值Btemp,并计算路径可用带宽比值γ,所述第一待选数据节点为一个或一个以上。
优选地,当所述选择的作业的轮空次数满足第一条件时,所述返回模块,还用于:
选择所述第一待选数据节点中路径可用带宽最大的数据节点作为所述第一数据节点的数据源;
设置所述选择的作业的轮空次数为0;
将所述路径可用带宽最大的数据节点作为数据源的任务返回给所述第一数据节点执行;
其中,第一条件为:Countk≥(1-γ)x1
其中,Countk为所述选择的作业的轮空次数,x1为所述第一数据节点可以申请到数据块存储在所述第一数据节点的任务的概率为时的申请次数,R为文件分块的备份数,M为物理机集群数。
优选地,当所选择的作业中有尚未处理的数据块存储在所述第一数据节点的任务时,所述返回模块,还用于:
将所述任务返回给所述第一数据节点执行。
优选地,当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点所在的机架内的任务,且所述选择的作业的轮空次数满足第二条件时,所述返回模块,还用于:
选择其他机架中含有所述选择的作业所需数据块所在的各数据节点的路径中路径可用带宽最大的第二待选数据节点作为所述第一数据节点的数据源;
设置所述选择的作业的轮空次数为0;
将所述路径可用带宽最大的数据节点作为数据源的任务返回给所述第一数据节点执行;
其中,第二条件为:Countk≥x2
其中,x2为所述第一数据节点可以申请到数据块存储在所述第一数据节点的任务的概率为时的申请次数,N为所述选择的作业中尚未处理的任务数,R为文件分块的备份数,M为物理机集群数。
优选地,当所述选择的作业中有尚未处理的数据块存储的数据节点与所述第一数据节点处于同一机架的任务,且所述选择的作业的轮空次数不满足第一条件;或者当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点所在的机架内的任务,且所述选择的作业的轮空次数不满足第二条件时,所述返回模块,还用于:
将所述选择的作业的轮空次数加1。
优选地,所述选择模块,还用于:
当接收到来自所述第一数据节点的新任务请求时,根据各作业在系统中运行的任务数对作业进行升序排列;
在作业队列中查找第一个含有尚未处理的数据块存储在第一数据节点的任务的作业,将该作业调整至同一级别的最高位置;
从作业队列中由上到下选择一个作业。
优选地,还包括:
预选模块,用于当接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,m、n为预先设定的整数;
计算模块,用于根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;将计算得到的路径可用带宽均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点。
本发明还提出了一种存储调度系统,至少包括:
管理节点,用于获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;;当接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,n、m为预先设定的整数;根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;将计算得到的路径可用带宽加权均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点;
至少一个数据节点,用于存储来自客户端的数据块。
本发明还提出了一种作业调度系统,至少包括:
管理节点,用于获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;;用于当接收到来自第一数据节点的新任务请求时,选择一个作业;当所选择的作业中没有尚未处理的数据块存储在所述第一数据节点的任务,但有尚未处理的数据块存储的数据节点与所述第一数据节点处于同一机架的任务时,根据获得的各数据节点的路径可用带宽,计算所述第一数据节点所在的机架内含有所述作业所需数据块的第一待选数据节点和所述第一数据节点的路径可用带宽均值Btemp,并根据计算路径可用带宽比值γ,所述第一待选数据节点为一个或一个以上;
至少一个数据节点,用于向所述管理节点请求新任务。
优选地,当所述选择的作业的轮空次数满足第一条件时,所述管理节点,还用于:
选择所述第一待选数据节点中路径可用带宽最大的数据节点作为所述第一数据节点的数据源;
设置所述选择的作业的轮空次数为0;
将所述路径可用带宽最大的数据节点作为数据源的任务返回给所述第一数据节点执行;
其中,第一条件为:Countk≥(1-γ)x1
其中,Countk为所述选择的作业的轮空次数,x1为所述第一数据节点可以申请到数据块存储在所述第一数据节点的任务的概率为时的申请次数,R为文件分块的备份数,M为物理机集群数;
所述至少一个数据节点,还用于执行所述管理节点返回的任务。
优选地,当所选择出的作业中有尚未处理的数据块存储在第一数据节点的任务时,所述管理节点,还用于:
将所述任务返回给所述第一数据节点执行。
优选地,当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点所在的机架内的任务,且所述选择的作业的轮空次数满足第二条件时,所述管理节点还用于:
选择其他机架中含有所述选择的作业所需数据块所在的第二待选数据节点的路径中路径可用带宽最大的数据节点作为所述第一数据节点的数据源;
设置所述选择的作业的轮空次数为0;
将所述路径可用带宽最大的数据节点作为数据源的任务返回给所述第一数据节点;
其中,第二条件为:Countk≥x2
其中,x2为所述第一数据节点可以申请到数据块存储在所述第一数据节点的任务的概率为时的申请次数,N为所述选择的作业中尚未处理的任务数,R为文件分块的备份数,M为物理机集群数。
优选地,当所述选择的作业中有尚未处理的数据块存储的数据节点与所述第一数据节点处于同一机架的任务,且所述选择的作业的轮空次数不满足第一条件;或者当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点所在的机架内的任务,且所述选择的作业的轮空次数不满足第二条件时,所述管理节点还用于:
将所述选择的作业的轮空次数加1。
优选地,所述管理节点还用于:
当接收到来自所述第一据数据节点的新任务请求时,根据各作业在系统中运行的任务数对作业进行升序排列;
在作业队列中查找第一个含有尚未处理的数据块存储在所述第一数据节点的任务的作业,将该作业调整至同一级别的最高位置;
从作业队列中由上到下选择一个作业。
本发明根据存储调度算法将数据块存储在路径可用带宽加权均值最大的数据节点列表,避免了网络拥塞并缩短了数据块存储的网络传输时间。
本发明根据路径可用带宽信息为数据节点分配优选作业进行处理,提升了作业的本地化概率,并且减少了作业总完成时间。
附图说明
下面对本发明实施例中的附图进行说明,实施例中的附图是用于对本发明的进一步理解,与说明书一起用于解释本发明,并不构成对本发明保护范围的限制。
图1为本发明的实施例中云计算系统的网络拓扑结构图;
图2为本发明的实施例中存储调度方法流程图;
图3为本发明的实施例中管理节点获取各数据节点的网络流量统计信息的流程示意图;
图4为本发明的实施例中客户端存储数据块的流程示意图;
图5为图2为本发明的实施例中作业调度方法流程图;
图6为本发明的实施例中提出的一种管理节点的结构组成图;
图7为本发明的实施例中提出的另一种管理节点的结构组成图;
图8为本发明的实施例中提出的结合图6和图7两种管理节点的结构组成图。
具体实施方式
为了便于本领域技术人员的理解,下面结合附图对本发明作进一步的描述,并不能用来限制本发明的保护范围。
参见图1,本发明中云计算系统包括管理节点、机架,其中机架包括机架交换机和数据节点。其中,数据节点与机架交换机相连,管理节点和机架交换机与数据节点相连。数据节点负载数据块存储和任务执行,管理节点负责将用户提交的作业分解成若干子任务,并将这些任务返回给各数据节点执行。
当机架数量较大时,机架之间通过核心交换机相连,管理节点通过核心交换机和机架交换机与数据节点相连。核心交换机负责机架信息的汇总。
参见图2,为了提高云计算系统的执行性能,本发明的一个实施例提出了一种存储调度方法,包括:
步骤200、管理节点获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;
步骤201、当管理节点接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,n、m为预先设定的整数;
步骤202、管理节点根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;
步骤203、管理节点将计算得到的路径可用带宽加权均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点。
参见图3,步骤200中管理节点获取网络节点各端口的网络流量统计信息包括:
管理节点下发网络信息统计指令,要求平台内的各级交换机统计各端口的流量,管理节点定期(如3s)轮询获取这些信息;
管理节点根据统计的各端口的流量换算每个端口的路径可用带宽,即流量统计的时间平均值,并计算预设时间内(如最近1分钟)机架交换机i端口j的路径可用带宽均值Bi,j,机架交换机i所对应的核心交换机端口的路径可用带宽均值BCore,i和客户端的路径可用带宽均值Ba,b,其中,客户端连接于机架a的端口b。
除此之外,管理节点还获取并存储分布式基础架构的网络拓扑信息。
管理节点可以通过网络控制器(如SDN控制器)来获取各数据节点的网络流量统计信息。
步骤201中,管理节点如何根据存储调度算法预选出n组数据节点为现有技术,不在本发明的保护范围之内。
参见图4,步骤202中,每组数据节点包括三个数据节点,存储调度算法依据存储负荷分担、存储安全的原则,对每个数据块进行3份备份,总有两份存在同一机架上,另外一份则必须放在另一个机架上。其中每组数据节点中,包括第二数据节点、第三数据节点和第四数据节点,第三数据节点和第四数据节点处于同一机架,第二数据节点和第三数据节点处于不同机架。
那么,步骤202中,管理节点根据获得的各数据节点的网络流量统计信息,分别计算每组数据节点的路径可用带宽加权均值包括:
步骤400、计算每组数据节点中所述客户端到第二数据节点之间的第一网络路径的路径可用带宽;
步骤401、计算每组数据节点中第二数据节点到第三数据节点之间的第二网络路径的路径可用带宽;
步骤402、计算每组数据节点中第三数据节点到第四数据节点之间的第三网络路径的路径可用带宽;
步骤403、将每组数据节点中三条网络路径的路径可用带宽进行加权平均计算路径可用带宽加权均值。
假设每组数据节点中的三个数据节点表示为(Di1,j1,Di2,j2,Di3,j3),那么,客户端到数据节点Di1,j1之间的网络路径的路径可用带宽可表示为:B1=min(Ba,b,BCore,a,BCore,i1,Bi1,j1);如果客户端与数据节点Di1,j1位于同一机架,那么B1=min(Ba,b,Bi1,j1);
数据节点Di1,j1到数据节点Di2,j2之间的网络路径的路径可用带宽可表示为:B2=min(Bi1,j1,BCore,i1,BCore,i2,Bi2,j2);
数据节点Di2,j2到数据节点Di3,j3之间的网络路径的路径可用带宽可表示为:B3=min(Bi2,j2,Bi2,j3);
三条网络路径的路径可用带宽加权均值为:
其中,α为加权系数。
加权系数可根据实际情况确定,鉴于机架间网络传输比机架内网络传输影响更大,可取α12=0.4,α3=0.2。
采用上述方法对n套数据节点列表进行计算得到
例如,数据中心有5个机架,每个机架20台数据节点,数据节点总数M=100台,客户端位于第5个机架的第一台物理机(D5,1),机架交换机的端口是千兆网接口,核心交换机是万兆网接口,文件中的任何一个数据块的副本数R=3。管理节点接收到客户端提交的第n块数据块存储请求后,预选出3套数据节点列表(D1,1,D2,1,D2,3),(D2,4,D4,1,D4,5),(D5,5,D3,2,D3,3);管理节点根据网络控制设备获取的当前网络统计数据而获取的各机架路径可用带宽分别为:(300,400,500,600,700),预选的3套数据节点列表的各数据节点路径可用带宽分别为(300,400,500),(500,400,300),(600,500,400),客户端所在的数据节点路径可用带宽为600,则:
第一组数据节点:B1=300,B2=300,B3=400,
第二组数据节点:B1=400,B2=400,B3=300,
第一组数据节点:B1=600,B2=500,B3=400,
根据路径可用带宽加权均值对比,将第三组数据节点(D5,5,D3,2,D3,3)作为该数据块的最终存储位置。
参见图5,本发明的实施例还提出了一种作业调度方法,包括:
步骤500、管理节点获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;
步骤501、当第一数据节点向管理节点请求新任务时,管理节点选择一个作业;
步骤502、当所选择出的作业中没有尚未处理的数据块存储在第一数据节点的任务,但有数据块存储的数据节点与第一数据节点处于同一机架的任务时,管理节点根据获得的各数据节点的路径可用带宽,计算第一数据节点所在的机架内含有所选择的作业所需数据块的第一待选数据节点和第一数据节点的路径可用带宽均值Btemp,并计算路径可用带宽比值γ,第一待选数据节点为一个或一个以上。
路径可用带宽均值Btemp为:
其中,n为第一待选数据节点的个数;i表示机架;j表示端口;Bi,j1,Bi,j2,……,Bi,jn为第一待选数据节点的路径可用带宽;
路径可用带宽比值γ为:
其中,Bport为第一数据节点所在机架的机架交换机入口与服务器的端口带宽标称值。
步骤501中,管理节点选择一个作业的方法包括:
管理节点根据各作业在系统中运行的任务数对作业进行升序排列;
管理节点在作业队列中查找第一个含有数据块存储在第一数据节点的任务的作业,将该作业调整至同一级别的最高位置;
管理节点从作业队列中由上到下选择一个作业。
步骤502中,当所选择的作业的轮空次数满足第一条件时,管理节点选择第一数据节点所在的机架中含有所选择的作业所需数据块所在的数据节点中路径可用带宽最大的数据节点作为第一数据节点的数据源;
设置所选择的作业的轮空次数为0;
管理节点将路径可用带宽最大的数据节点作为数据源的任务返回给第一数据节点执行;
其中,第一条件为:Countk≥(1-γ)x1
其中,Countk为所选择的作业的轮空次数,x1为第一数据节点可以申请到数据块存储在第一数据节点的任务的概率为时的申请次数,R为文件分块的备份数,M为物理机集群数。
本发明提出的作业处理方法中,当所选择出的作业中有尚未处理的数据块存储在第一数据节点的任务时,还包括以下步骤:
步骤503、管理节点将任务返回给第一数据节点执行。
本发明提出的作业处理方法中,当所选择的作业中没有尚未处理的数据块存储在第一数据节点所在的机架内的任务,且所选择的作业的轮空次数满足第二条件时,还可以包括以下步骤:
步骤504、管理节点选择其他机架中含有所选择的作业所需数据块所在的第二待选数据节点的路径中路径可用带宽最大的数据节点作为第一数据节点的数据源;
设置所选择的作业的轮空次数为0;
管理节点将路径可用带宽最大的数据节点作为数据源的任务返回给第一数据节点执行;
其中,第二条件为:Countk≥x2
其中,x2为所述请求新任务的数据节点可以申请到数据块存储在所述请求新任务的数据节点的任务的概率为时的申请次数,N为所选择的作业中尚未处理的任务数,R为文件分块的备份数,M为物理机集群数。
步骤503和步骤504中,基于网络感知的延迟调度算法模型如下:
假定:分布式文件系统有M台物理机集群,每个文件的数据块有R个备份,当前所有物理机都处于忙状态,所选择的作业尚未处理的任务数为N。当某台物理机完成任务后,可申请到新的数据块存储在该台物理机中的任务的概率Pk为:
那么,该物理机经过x次申请可以申请到数据块存储在该台物理机中的任务的概率Pk的取值范围为
设定Pk值,分别求解
例如,取M=100,R=3,N=5,Pk=0.9,那么,可求得x1=14.16,x2=76.75。
如果从概率角度看,所选择的作业的数据块分布于每个物理主机的概率无限接近于1,因此设定x2=20。
本发明提出的作业处理方法中,当所选择的作业中有尚未处理的数据块存储的数据节点与第一数据节点处于同一机架的任务,且所选择的作业的轮空次数不满足第一条件;或者当所选择的作业中没有尚未处理的数据块存储在第一数据节点所在的机架内的任务,且所选择的作业的轮空次数不满足第二条件时,还可以包括以下步骤:
步骤505、管理节点将所选择的作业的轮空次数加1。
本发明提出的作业调度方法中,在进行作业调度之前还可以采用本发明提出的存储调度方法进行数据块存储。
参见图6,本发明的实施例提出了一种管理节点,至少包括:
获取模块,用于获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;
预选模块,用于当接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,n、m为预先设定的整数;
计算模块,用于根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;将计算得到的路径可用带宽加权均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点。
参见图7,本发明的实施例还提出了另一种管理节点,至少包括:
获取模块,用于获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;
选择模块,用于当第一数据节点向管理节点请求新任务时,选择一个作业;
返回模块,用于当所选择的作业中没有尚未处理的数据块存储在第一数据节点的任务,但有数据块存储的数据节点与第一数据节点处于同一机架的任务时,计算第一数据节点所在的机架内含有所选择的作业所需数据块的第一待选数据节点和第一数据节点的路径可用带宽均值Btemp,并计算路径可用带宽比值γ,第一待选数据节点为一个或一个以上。
当所选择的作业的轮空次数满足第一条件时,返回模块,还用于:
选择第一待选数据节点中路径可用带宽最大的数据节点作为第一数据节点的数据源;
设置所选择的作业的轮空次数为0;
将路径可用带宽最大的数据节点作为数据源的任务返回给第一数据节点执行;
其中,第一条件为:Countk≥(1-γ)x1
其中,Countk为作业的轮空次数,x1为第一数据节点可以申请到数据块存储在第一数据节点的任务的概率为时的申请次数,R为文件分块的备份数,M为物理机集群数。
当所选择出的作业中有尚未处理的数据块存储在第一数据节点的任务时,返回模块还用于:将该任务返回给第一数据节点执行。
当所选择的作业中没有尚未处理的数据块存储在第一数据节点所在的机架内的任务,且所选择的作业的轮空次数满足第二条件时,返回模块,还用于:
选择其他机架中含有所选择的作业所需数据块所在的第二待选数据节点的路径中路径可用带宽最大的数据节点作为第一数据节点的数据源;
设置所选择的作业的轮空次数为0;
将路径可用带宽最大的数据节点作为数据源的任务返回给请求新任务的数据节点执行;
其中,第二条件为:Countk≥x2
其中,x2为第一数据节点可以申请到数据块存储在第一数据节点的任务的概率为时的申请次数,N为所选择的作业中尚未处理的任务数,R为文件分块的备份数,M为物理机集群数。
当所选择的作业中有尚未处理的数据块存储的数据节点与第一数据节点处于同一机架的任务,且所选择的作业的轮空次数不满足第一条件;或者当所选择的作业中没有数据块存储在第一数据节点所在的机架内的任务,且所选择的作业的轮空次数不满足第二条件时,返回模块,还用于:
将所选择的作业的轮空次数加1。
选择模块,还用于:
当接收到来自第一数据节点的新任务请求时,根据各作业在系统中运行的任务数对作业进行升序排列;
在作业队列中查找第一个含有数据块存储在第一数据节点的任务的作业,将该作业调整至同一级别的最高位置;
从作业队列中由上到下选择一个作业。
参见图8,另一种管理节点,在进行作业调度之前,还包括:
预选模块,用于当接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,n、m为预先设定的整数;
计算模块,用于根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;将计算得到的路径可用带宽加权均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点。
本发明还提出了一种存储调度系统,至少包括:
管理节点,用于获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;当接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,n、m为预先设定的整数;根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;将计算得到的路径可用带宽加权均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点;
至少一个数据节点,用于存储来自客户端的数据块。
本发明还提出了一种作业调度系统,至少包括:
管理节点,用于获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;当接收到来自第一数据节点的新任务请求时,选择一个作业;当所选择的作业中没有尚未处理的数据块存储在第一数据节点的任务,但有尚未处理的数据块存储的数据节点与第一数据节点处于同一机架的任务时,根据获得的各数据节点的路径可用带宽,计算第一数据节点所在的机架内含有所选择的作业所需数据块的第一待选数据节点和第一数据节点的路径可用带宽均值,并计算路径可用带宽比值;
至少一个数据节点,用于向管理节点请求新任务。
本发明提出的作业调度系统中,当所述选择的作业的轮空次数满足第一条件时,管理节点还用于:
选择第一待选数据节点路径可用带宽最大的数据节点作为第一数据节点的数据源;
设置所选择的作业的轮空次数为0;
将路径可用带宽最大的数据节点作为数据源的任务返回给第一数据节点执行;
其中,第一条件为:Countk≥(1-γ)x1
其中,Countk为所选择作业的轮空次数,x1为第一数据节点可以申请到数据块存储在第一数据节点的任务的概率为时的申请次数,R为文件分块的备份数,M为物理机集群数;
至少一个数据节点,还用于执行管理节点返回的任务。
本发明提出的作业处理系统中,当所选择的作业中有尚未处理的数据块存储在第一数据节点的任务时,管理节点还用于将该任务返回给所述数据节点执行;
本发明提出的作业处理系统中,当所选择的作业中没有尚未处理的数据块存储在第一数据节点所在的机架内的任务,且所选择的作业的轮空次数满足第二条件时,管理节点还用于:
选择其他机架中含有所选择的作业所需数据块所在的第二待选数据节点的路径中路径可用带宽最大的数据节点作为第一数据节点的数据源;
设置所选择的作业的轮空次数为0;
将路径可用带宽最大的数据节点作为数据源的任务返回给第一数据节点;
其中,第二条件为:Countk≥x2
其中,x2为第一数据节点可以申请到数据块存储在第一数据节点的任务的概率为时的申请次数,N为所选择的作业中尚未处理的任务数,R为文件分块的备份数,M为物理机集群数。
本发明提出的作业处理系统中,当所选择的作业中有尚未处理的数据块存储的数据节点与第一数据节点处于同一机架的任务,且所选择的作业的轮空次数不满足第一条件;或者当所选择的作业中没有尚未处理的数据块存储在第一数据节点所在的机架内的任务,且所选择的作业的轮空次数不满足第二条件时,管理节点还用于:
将所选择的作业的轮空次数加1。
本发明提出的作业处理系统中,管理节点还用于:
当接收到来自第一数据节点的新任务请求时,根据各作业在系统中运行的任务数对作业进行升序排列;
在作业队列中查找第一个含有数据块存储在第一数据节点的任务的作业,将该作业调整至同一级别的最高位置;
从作业队列中由上到下选择一个作业。
本发明提出的作业调度系统中,在进行作业调度之前,管理节点还用于:
获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;当接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,n、m为预先设定的整数;根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;将计算得到的路径可用带宽加权均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点;
至少一个数据节点,还用于存储来自客户端的数据块。
本发明根据存储调度算法将数据块存储在路径可用带宽均值最大的数据节点列表,避免了网络拥塞并缩短了数据块存储的网络传输时间。
本发明根据路径可用带宽信息为数据节点分配优选作业进行处理,提升了作业的本地化概率,并且减少了作业总完成时间。
需要说明的是,以上所述的实施例仅是为了便于本领域的技术人员理解而已,并不用于限制本发明的保护范围,在不脱离本发明的发明构思的前提下,本领域技术人员对本发明所做出的任何显而易见的替换和改进等均在本发明的保护范围之内。

Claims (19)

1.一种存储调度方法,其特征在于,包括:
管理节点获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;
当管理节点接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,n、m为预先设定的整数;
管理节点根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;
并将计算得到的路径可用带宽加权均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点。
2.如权利要求1所述的存储调度方法,其特征在于,所述m为3,每组数据节点中,包括第二数据节点、第三数据节点和第四数据节点,第三数据节点和第四数据节点处于同一机架,第二数据节点与第三数据节点处于不同机架;
所述管理节点根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值包括:
计算每组数据节点中所述客户端到所述第二数据节点之间的第一网络路径的路径可用带宽;
计算每组数据节点中所述第二数据节点到第三数据节点之间的第二网络路径的路径可用带宽;
计算每组数据节点中所述第三数据节点到第四数据节点之间的第三网络路径的路径可用带宽;
将每组数据节点中三条网络路径的路径可用带宽进行加权平均计算路径可用带宽加权均值。
3.如权利要求2所述的存储调度方法,其特征在于,所述每组数据节点中所述第一网络路径和所述第二网络路径的加权系数均为0.4,所述第三网络路径的加权系数为0.2。
4.一种作业调度方法,其特征在于,包括:
管理节点获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;
当第一数据节点空闲并向管理节点请求新任务时,管理节点选择一个作业;
当所选择的作业中没有尚未处理的数据块存储在所述第一数据节点的任务,但有尚未处理的数据块存储的数据节点与所述第一数据节点处于同一机架的任务时,
管理节点根据获得的各数据节点的路径可用带宽,计算第一数据节点所在的机架内含有所述选择的作业所需数据块的第一待选数据节点和第一数据节点间的路径可用带宽均值Btemp,并计算路径可用带宽比值γ;所述第一待选数据节点为一个或一个以上;
当所述选择的作业的轮空次数满足第一条件时,该方法还包括:
所述管理节点选择所述第一待选数据节点中路径可用带宽最大的数据节点作为所述第一数据节点的数据源;
设置所述选择的作业的轮空次数为0;
所述管理节点将所述路径可用带宽最大的数据节点作为数据源的任务返回给所述第一数据节点执行;
其中,第一条件为:Countk≥(1-γ)x1
其中,Countk为所述选择的作业的轮空次数,x1为所述第一数据节点可以申请到数据块存储在所述第一数据节点的任务的概率为时的申请次数,R为文件分块的备份数,M为物理机集群数;
或者,当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点所在的机架内的任务,且所述选择的作业的轮空次数满足第二条件时,该方法还包括:
所述管理节点选择其他机架中含有所述选择的作业所需数据块所在的第二待选数据节点的路径中路径可用带宽最大的数据节点作为所述第一数据节点的数据源;
设置所述选择的作业的轮空次数为0;
所述管理节点将所述路径可用带宽最大的数据节点作为数据源的任务返回给所述第一数据节点执行;
其中,第二条件为:Countk≥x2
其中,x2为所述第一数据节点可以申请到数据块存储在所述第一数据节点的任务的概率为时的申请次数,N为所述选择的作业中尚未处理的任务数,R为文件分块的备份数,M为物理机集群数。
5.如权利要求4所述的作业调度方法,其特征在于,所述第一待选数据节点和所述第一数据节点的路径可用带宽均值Btemp为:
其中,n为所述第一待选数据节点的个数;i表示机架;j表示端口;Bi,j1,Bi,j2,……,Bi,jn为所述第一待选数据节点的路径可用带宽;
所述路径可用带宽比值γ为:
其中Bport为所述第一数据节点所在机架的机架交换机入口与服务器的端口带宽标称值。
6.如权利要求4所述的作业调度方法,其特征在于,当所选择出的作业中有尚未处理的数据块存储在第一数据节点的任务时,该方法还包括:
所述管理节点将所述任务返回给所述第一数据节点执行。
7.如权利要求4所述的作业调度方法,其特征在于,当所述选择的作业中有尚未处理的数据块存储的数据节点与所述第一数据节点处于同一机架的任务,且所述选择的作业的轮空次数不满足第一条件;或者当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点所在的机架内的任务,且所述选择的作业的轮空次数不满足第二条件时,该方法还包括:
所述管理节点将所述选择的作业的轮空次数加1。
8.根据权利要求4~7任意一项所述的作业调度方法,所述管理节点选择一个作业的方法包括:
所述管理节点根据各作业在系统中运行的任务数对作业进行升序排列;
所述管理节点在作业队列中查找第一个含有尚未处理的数据块存储在所述第一数据节点的任务的作业,将该作业调整至同一级别的最高位置;
所述管理节点从作业队列中由上到下选择一个作业。
9.一种管理节点,其特征在于,至少包括:
获取模块,用于获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;
预选模块,用于当接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,m、n为预先设定的整数;
计算模块,用于根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;将计算得到的路径可用带宽均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点。
10.一种管理节点,其特征在于,至少包括:
获取模块,用于获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;
选择模块,用于当接收到来自第一数据节点的新任务请求时,选择一个作业;
返回模块,用于当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点的任务,但有尚未处理的数据块存储的数据节点与所述第一数据节点处于同一机架的任务时,根据获得的各数据节点的路径可用带宽,计算所述数据节点所在的机架内含有所述作业所需数据块的第一待选数据节点和所述第一数据节点的路径可用带宽均值Btemp,并计算路径可用带宽比值γ,所述第一待选数据节点为一个或一个以上;
当所述选择的作业的轮空次数满足第一条件时,所述返回模块,还用于:
选择所述第一待选数据节点中路径可用带宽最大的数据节点作为所述第一数据节点的数据源;
设置所述选择的作业的轮空次数为0;
将所述路径可用带宽最大的数据节点作为数据源的任务返回给所述第一数据节点执行;
其中,第一条件为:Countk≥(1-γ)x1
其中,Countk为所述选择的作业的轮空次数,x1为所述第一数据节点可以申请到数据块存储在所述第一数据节点的任务的概率为时的申请次数,R为文件分块的备份数,M为物理机集群数;
或者,当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点所在的机架内的任务,且所述选择的作业的轮空次数满足第二条件时,所述返回模块,还用于:
选择其他机架中含有所述选择的作业所需数据块所在的各数据节点的路径中路径可用带宽最大的第二待选数据节点作为所述第一数据节点的数据源;
设置所述选择的作业的轮空次数为0;
将所述路径可用带宽最大的数据节点作为数据源的任务返回给所述第一数据节点执行;
其中,第二条件为:Countk≥x2
其中,x2为所述第一数据节点可以申请到数据块存储在所述第一数据节点的任务的概率为时的申请次数,N为所述选择的作业中尚未处理的任务数,R为文件分块的备份数,M为物理机集群数。
11.根据权利要求10所述的管理节点,当所选择的作业中有尚未处理的数据块存储在所述第一数据节点的任务时,所述返回模块,还用于:
将所述任务返回给所述第一数据节点执行。
12.根据权利要求10所述的管理节点,当所述选择的作业中有尚未处理的数据块存储的数据节点与所述第一数据节点处于同一机架的任务,且所述选择的作业的轮空次数不满足第一条件;或者当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点所在的机架内的任务,且所述选择的作业的轮空次数不满足第二条件时,所述返回模块,还用于:
将所述选择的作业的轮空次数加1。
13.根据权利要求10~12任意一项所述的管理节点,所述选择模块,还用于:
当接收到来自所述第一数据节点的新任务请求时,根据各作业在系统中运行的任务数对作业进行升序排列;
在作业队列中查找第一个含有尚未处理的数据块存储在第一数据节点的任务的作业,将该作业调整至同一级别的最高位置;
从作业队列中由上到下选择一个作业。
14.根据权利要求10~12任意一项所述的管理节点,还包括:
预选模块,用于当接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,m、n为预先设定的整数;
计算模块,用于根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;将计算得到的路径可用带宽均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点。
15.一种存储调度系统,其特征在于,至少包括:
管理节点,用于获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;当接收到来自客户端的数据块存储请求时,根据存储调度算法预选出n组数据节点,每组数据节点中包括m个数据节点,其中,n、m为预先设定的整数;根据获得的各数据节点的路径可用带宽,分别计算每组数据节点的路径可用带宽加权均值;将计算得到的路径可用带宽加权均值最大的一组数据节点作为发起数据块存储请求的数据块的存储节点;
至少一个数据节点,用于存储来自客户端的数据块。
16.一种作业调度系统,其特征在于,至少包括:
管理节点,用于获取网络节点各端口的网络流量统计信息,并换算出各数据节点的路径可用带宽;用于当接收到来自第一数据节点的新任务请求时,选择一个作业;当所选择的作业中没有尚未处理的数据块存储在所述第一数据节点的任务,但有尚未处理的数据块存储的数据节点与所述第一数据节点处于同一机架的任务时,根据获得的各数据节点的路径可用带宽,计算所述第一数据节点所在的机架内含有所述作业所需数据块的第一待选数据节点和所述第一数据节点的路径可用带宽均值Btemp,并根据计算路径可用带宽比值γ,所述第一待选数据节点为一个或一个以上;
至少一个数据节点,用于向所述管理节点请求新任务;
当所述选择的作业的轮空次数满足第一条件时,所述管理节点,还用于:
选择所述第一待选数据节点中路径可用带宽最大的数据节点作为所述第一数据节点的数据源;
设置所述选择的作业的轮空次数为0;
将所述路径可用带宽最大的数据节点作为数据源的任务返回给所述第一数据节点执行;
其中,第一条件为:Countk≥(1-γ)x1
其中,Countk为所述选择的作业的轮空次数,x1为所述第一数据节点可以申请到数据块存储在所述第一数据节点的任务的概率为时的申请次数,R为文件分块的备份数,M为物理机集群数;
所述至少一个数据节点,还用于执行所述管理节点返回的任务;
或者,当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点所在的机架内的任务,且所述选择的作业的轮空次数满足第二条件时,所述管理节点还用于:
选择其他机架中含有所述选择的作业所需数据块所在的第二待选数据节点的路径中路径可用带宽最大的数据节点作为所述第一数据节点的数据源;
设置所述选择的作业的轮空次数为0;
将所述路径可用带宽最大的数据节点作为数据源的任务返回给所述第一数据节点;
其中,第二条件为:Countk≥x2
其中,x2为所述第一数据节点可以申请到数据块存储在所述第一数据节点的任务的概率为时的申请次数,N为所述选择的作业中尚未处理的任务数,R为文件分块的备份数,M为物理机集群数。
17.根据权利要求16所述的作业调度系统,其特征在于,当所选择出的作业中有尚未处理的数据块存储在第一数据节点的任务时,所述管理节点,还用于:
将所述任务返回给所述第一数据节点执行。
18.根据权利要求16所述的作业调度系统,当所述选择的作业中有尚未处理的数据块存储的数据节点与所述第一数据节点处于同一机架的任务,且所述选择的作业的轮空次数不满足第一条件;或者当所述选择的作业中没有尚未处理的数据块存储在所述第一数据节点所在的机架内的任务,且所述选择的作业的轮空次数不满足第二条件时,所述管理节点还用于:
将所述选择的作业的轮空次数加1。
19.根据权利要求16~18任意一项所述的作业调度系统,所述管理节点还用于:
当接收到来自所述第一数据节点的新任务请求时,根据各作业在系统中运行的任务数对作业进行升序排列;
在作业队列中查找第一个含有尚未处理的数据块存储在所述第一数据节点的任务的作业,将该作业调整至同一级别的最高位置;
从作业队列中由上到下选择一个作业。
CN201310534978.1A 2013-10-31 2013-10-31 存储调度方法和系统、作业调度方法和系统及管理节点 Active CN103617083B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310534978.1A CN103617083B (zh) 2013-10-31 2013-10-31 存储调度方法和系统、作业调度方法和系统及管理节点

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310534978.1A CN103617083B (zh) 2013-10-31 2013-10-31 存储调度方法和系统、作业调度方法和系统及管理节点

Publications (2)

Publication Number Publication Date
CN103617083A CN103617083A (zh) 2014-03-05
CN103617083B true CN103617083B (zh) 2019-02-15

Family

ID=50167786

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310534978.1A Active CN103617083B (zh) 2013-10-31 2013-10-31 存储调度方法和系统、作业调度方法和系统及管理节点

Country Status (1)

Country Link
CN (1) CN103617083B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107104992B (zh) * 2016-02-19 2019-11-22 杭州海康威视数字技术股份有限公司 一种视频云存储的存储资源分配方法和装置
CN110139166B (zh) * 2018-02-08 2021-07-09 杭州海康威视系统技术有限公司 一种视频数据传输方法、装置、系统及电子设备
CN109120556B (zh) * 2018-08-21 2019-07-09 广州市品高软件股份有限公司 一种云主机访问对象存储服务器的方法及系统
CN114697353B (zh) * 2022-05-27 2022-09-06 邹平市供电有限公司 一种分布式存储集群电网数据存储控制方法
CN116069766B (zh) * 2023-03-14 2023-06-27 天云融创数据科技(北京)有限公司 一种基于大数据的数据调度优化方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1764146A (zh) * 2004-10-21 2006-04-26 华为技术有限公司 一种最优路由的选择方法
CN101800768A (zh) * 2010-01-19 2010-08-11 南京邮电大学 一种基于存储联盟子集划分的网格数据副本生成方法
CN102075582A (zh) * 2011-01-26 2011-05-25 南京财经大学 一种可信的云存储系统数据存储模型的存储方法
CN102857554A (zh) * 2012-07-26 2013-01-02 福建网龙计算机网络信息技术有限公司 基于分布式存储系统进行数据冗余处理方法
CN103077197A (zh) * 2012-12-26 2013-05-01 北京思特奇信息技术股份有限公司 一种数据存储方法装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9250972B2 (en) * 2006-06-19 2016-02-02 International Business Machines Corporation Orchestrated peer-to-peer server provisioning
CN102739785B (zh) * 2012-06-20 2014-12-17 东南大学 基于网络带宽估计的云计算任务调度方法
CN103019853A (zh) * 2012-11-19 2013-04-03 北京亿赞普网络技术有限公司 一种作业任务的调度方法和装置
CN103279351B (zh) * 2013-05-31 2016-06-29 北京高森明晨信息科技有限公司 一种任务调度的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1764146A (zh) * 2004-10-21 2006-04-26 华为技术有限公司 一种最优路由的选择方法
CN101800768A (zh) * 2010-01-19 2010-08-11 南京邮电大学 一种基于存储联盟子集划分的网格数据副本生成方法
CN102075582A (zh) * 2011-01-26 2011-05-25 南京财经大学 一种可信的云存储系统数据存储模型的存储方法
CN102857554A (zh) * 2012-07-26 2013-01-02 福建网龙计算机网络信息技术有限公司 基于分布式存储系统进行数据冗余处理方法
CN103077197A (zh) * 2012-12-26 2013-05-01 北京思特奇信息技术股份有限公司 一种数据存储方法装置

Also Published As

Publication number Publication date
CN103617083A (zh) 2014-03-05

Similar Documents

Publication Publication Date Title
CN114138486B (zh) 面向云边异构环境的容器化微服务编排方法、系统及介质
CN103617083B (zh) 存储调度方法和系统、作业调度方法和系统及管理节点
CN103092698B (zh) 云计算应用自动部署系统及方法
CN102387173B (zh) 一种MapReduce系统及其调度任务的方法和装置
JPH09167141A (ja) 負荷分散制御方法
WO2019179250A1 (zh) 调度方法、调度器、存储介质及系统
CN106534318B (zh) 一种基于流量亲和性的OpenStack云平台资源动态调度系统和方法
CN108345501A (zh) 一种分布式资源调度方法和系统
CN103927231B (zh) 一种面向数据处理的能耗优化数据集分配方法
Nguyen et al. A hybrid scheduling algorithm for data intensive workloads in a mapreduce environment
CN104023042B (zh) 云平台资源调度方法
CN103634330A (zh) 一种云计算环境下的资源自动分配方法
CN104391918A (zh) 基于对等部署的分布式数据库查询优先级管理的实现方法
CN109783225B (zh) 一种多租户大数据平台的租户优先级管理方法及系统
CN109582448A (zh) 一种面向关键度和时效性的边缘计算任务调度方法
CN110311965A (zh) 一种云计算环境下的任务调度方法及系统
CN107291550A (zh) 一种针对迭代应用的Spark平台资源动态分配方法及系统
CN103257896B (zh) 一种云环境下的Max-D作业调度方法
CN107168799A (zh) 基于云计算架构的数据优化处理方法
CN106201681B (zh) Hadoop平台下基于预释放资源列表的任务调度方法
CN107239342A (zh) 一种存储集群任务管理方法及装置
CN104731528A (zh) 一种云计算块存储服务的构建方法及系统
CN104112049A (zh) 基于P2P构架的MapReduce任务跨数据中心调度系统及方法
CN104917839A (zh) 一种用于云计算环境下的负载均衡方法
CN105608138B (zh) 一种优化阵列数据库并行数据加载性能的系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant