CN107450983A - 一种基于虚拟聚类的分级网络资源调度方法及系统 - Google Patents

一种基于虚拟聚类的分级网络资源调度方法及系统 Download PDF

Info

Publication number
CN107450983A
CN107450983A CN201710574760.7A CN201710574760A CN107450983A CN 107450983 A CN107450983 A CN 107450983A CN 201710574760 A CN201710574760 A CN 201710574760A CN 107450983 A CN107450983 A CN 107450983A
Authority
CN
China
Prior art keywords
resource
job
scheduling
mrow
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710574760.7A
Other languages
English (en)
Inventor
梁鸿
高源�
魏倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN201710574760.7A priority Critical patent/CN107450983A/zh
Publication of CN107450983A publication Critical patent/CN107450983A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种基于虚拟聚类的分级网络资源调度方法及系统,方法包括:获取当前网络环境中的可用资源信息,构建资源池;接收用户提交的待执行作业描述文件,构建作业管理池,所述待执行作业描述文件包括待执行作业以及作业对资源的需求信息;根据所述作业对资源的需求信息,采用基于虚拟聚类的网络资源分级方法,选择资源池中符合要求的资源,构建资源—作业匹配对;最后提交作业至对应的网格资源中,并监控作业执行情况,针对监控结果及时应对。

Description

一种基于虚拟聚类的分级网络资源调度方法及系统
技术领域
本发明涉及网络资源分配领域,具体是一种基于虚拟聚类的分级网络资源调度方法及系统。
背景技术
网络作为现代社会一种重要的信息基础设施汇集了大量的资源,这些资源是信息时代国家资源的重要组成部分。随着internet和WEB技术的出现,人们可以有效地共享利用网络资源,但是从总体上讲,网络资源的共享利用率不高的问题仍旧比较明显。首先,互联网资源分布不均匀,有的地方供大于求,而有的地方供不应求;其次,网络基础设施不够完善,网络传输、管理域之间的通信交流仍然是网络应用的瓶颈。另一方面,网络应用不断发展,经济、行政、教育、科研、军事等各个领域都对网络资源的共享和综合利用提出迫切需求。
网格技术的发展极大的推动了并行以及分布式计算的发展,但是随着并行及分布式应用的发展,再加上网格本身资源不稳定等特性,使得网格任务调度成为当今网格研究的重点和难点。网格任务调度系统根据适当的调度策略把网格作业调度到合适的网格资源当中,从而减少网格用户使用网格资源的复杂性、提高作业执行的效率和资源使用率。好的调度系统可以充分利用网格资源的并行能力,保证用户作业按质按量的完成;相反,不好的调度系统将会增加任务执行时间,降低资源利用率。
目前,由于网格应用非常复杂,网络任务调度的计算过程耗时也较长,如果计算过程中出现问题,可能导致整个计算的失败。所以需要一种容错机制,定期对计算过程进行保存,一旦出现问题,可以从上一个断点处继续执行,减少时间消耗和资源浪费。
发明内容
针对现有技术中存在的不足,本发明提供了一种基于虚拟聚类的分级网络资源调度方法,首先对网格资源属性提取建模,然后利用虚拟聚类的方法将异构的资源进行分组,获得相对同构的网格资源,根据作业描述文件的资源请求条件,对资源分组按照性能排序,方便调度参考,可以有效减少资源选择的时间消耗。
本发明的技术方案为:
一种基于虚拟聚类的分级网络资源调度方法,包括:
获取当前网络环境中的可用资源信息,构建资源池;
接收用户提交的待执行作业描述文件,构建作业管理池,所述待执行作业描述文件包括待执行作业以及作业对资源的需求信息;
根据所述作业对资源的需求信息,采用基于虚拟聚类的网络资源分级方法,选择资源池中符合要求的资源,构建资源—作业匹配对;最后提交作业至对应的网格资源中,并监控作业执行情况,针对监控结果及时应对。
进一步的,采用基于虚拟聚类的网络资源分级方法,选择资源池中符合要求的资源包括:
为资源池中每一种资源建立多元指标矢量,基于模糊聚类分析理论,对资源池中全部资源进行相似性分析,根据相似性分析结果,对资源进行聚类分组,被聚为同一类的资源具有相似的数据处理能力。
进一步的,对资源池中全部资源进行相似性分析包括:对资源采用极值标准化进行归一化处理,然后采用算数平均最小法计算出资源的相似系数矩阵,对相似关系矩阵R进行点积运算,获得模糊等价关系矩阵R’,根据模糊等价关系的聚类方法,设置计算阈值λ,当模糊等价关系矩阵R’中的元素值大于λ时取1,反之取0,获得的以0和1为元素的矩阵即为相似性分析结果;其中λ∈[0,1],通过设置不同的λ,获得资源不同相似性等级的分析结果。
进一步的,所述多元指标矢量的元素至少包括网络资源的计算能力、通信能力、系统负载、内存负载和空闲硬盘空间。
进一步的,本方法还包括:
根据每一资源的元素性能,按下以下公式计算不同聚类资源的综合性能:
其中C表示资源的聚类,n为第i个聚类中资源的数目,r表示C中的资源,rk表示C中的第k个资源的,rkj表示第k个资源的第j个属性值,为资源第j个属性的权值,根据所述不同聚类的综合性能进行排序,在构建资源—作业匹配对时,优先考虑性综合性能高的聚类资源进行作业调度。
进一步的,所述网络环境为开放式环境,接收新资源的注册,对新资源进行认证和授权;同时监控资源负载情况,注销满载资源。
进一步的,判断用户提交的待执行作业文件是否为关联作业或并行作业,若是,则先对关联作业或并行作业进行划分,然后构建资源—作业匹配对并提交;若不是,则采用FIFO或MIN-MIN调度策略对其进行调度,并提交。
进一步的,监控作业执行情况还包括:监控网络环境中资源使用情况,当正在执行作业的资源不可用时,将作业调度到其他资源上继续运行。
进一步的,接收用户提交的待执行作业描述文件采用图形化交互界面,所述资源池采用资源池视图界面,同时定期更新资源池视图。
本发明还提供了一种基于虚拟聚类的分级网络资源调度系统,包括:
请求管理模块,用于接收并解析用户请求,将用户请求发送给作业管理模块;
作业管理模块,用于根据用户请求解析待执行作业描述文件,建立作业队列,定位执行作业需要的输入文件和目录;在作业队列中开辟存储空间,将待执行作业插入作业队列中;维护作业队列,及时修改作业状态;对关联作业进行DAG图的构建、划分、任务群维护;接收调度中心模块和用户对作业的操作请求,根据所述操作请求,执行相应的操作;
调度中心模块,用于根据调度策略构建资源—作业匹配对,提交作业并监控作业的执行;与信息管理模块交互,获得当前可用资源池;与传输模块、执行模块分别进行交互;
传输模块,用于接收调度中心模块的文件传输请求,通过GLOBUS的GridFTP工具向作提交作业文件和数据,创建工作目录;
执行模块,用于接收调度中心的执行请求,通过GLOBUS的GRAM工具提交作业,在作业执行过程中,定期监控作业执行情况及资源使用情况,当发现资源异常或者作业执行出现问题时,向调度中心模块发送重新调度请求。
信息管理模块,用于采用GLOBUS的MDS服务搜索网格环境中的可用资源信息,建立资源池,并定期的同MDS服务交互,修改资源池中资源的状态;根据所述作业对资源的需求信息,采用基于虚拟聚类的网络资源分级方法,对网格资源进行划分,减少任务调度时用于搜索资源所花费的时间。
本发明的有益效果:
本发明采用分级式调度模型支持网格资源的动态加入与退出,有效地屏蔽了资源的动态性特点;对网格资源属性提取建模,然后利用虚拟聚类的方法将异构的资源进行分组,获得相对同构的网格资源,根据作业描述文件的资源请求条件,对资源分组按照性能排序,方便调度参考,可以有效减少资源选择的时间消耗。
附图说明
图1为本发明的网格资源节点调度框架;
图2为本发明的网络资源中的网格系统示意图;
图3为本发明的方法流程图a;
图4为本发明的方法流程图b。
具体实施方式:
下面结合附图与实施例对本发明作进一步说明:
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
虚拟计算环境从构建资源的主体化模型、利益共同体和分布执行机制的角度提出了3个重要的概念:自主元素、虚拟共同体和虚拟执行体,并在此基础上提出了资源层、虚拟层、聚合层、自主协同层和应用层为核心的网络计算系统体系结构。根据虚拟计算环境的理论,我们在构建网格调度环境时,采用分层管理、按级调度的方式。网格资源节点调度框架如图1所示,主要元素有:网格计算节点、本地调度单元、逻辑共同体以及元调度执行体。
网格计算节点是虚拟计算环境的资源层,可以是同构的集群资源也可以是彼此差异的网格单机节点,通过互联网或者高速总线连接,彼此共享计算资源,可以相互交换用户提交的任务。
本地调度单元是虚拟计算环境中自主元素的具体表现,通过统一的资源描述接口,将加入虚拟计算环境的网格资源封装为一台虚拟计算机,它位于虚拟计算环境的虚拟层,由调度中心和信息中心构成。调度中心负责接收上层调度器的任务调度请求,进行任务分发、监控和执行结果收集;信息中心负责网格资源注册、资源信息维护与更新,为上层逻辑共同体的创建提供必要的信息。
逻辑共同体对应于虚拟计算环境的虚拟共同体,位于虚拟计算环境的聚合层,是具有并发作业协同能力的本地调度单元的集合。本文通过虚拟聚类的方式对将本地调度单元收集的资源进行分组产生逻辑共同体,并把它们作为元调度器调度的直接对象。
元调度执行体是虚拟计算环境中的虚拟执行体,也是整个层次框架的核心,主要目的是协调系统各个调度器的工作,用于接收用于请求,采用一定的调度策略将作业调度到各共同体上进行执行,达到降低资源负载、提高资源利用率、系统吞吐量的效果。
传统的集群环境下作业调度面临的资源往往都是同构的,它们在机器架构、网络连接、系统构成上都是相同的,调度时没必要在某些参数上对它们进行比较。但是在网格环境中,资源往往都是异构的,很多网格调度算法在进行作业调度的时候都会遍历所有的网格资源,然后比较找出能够胜任作业执行的资源,这无疑增加了整个调度周期的时间花费。本发明于减少资源搜索时间的考虑,定义了一组刻画资源性能的特征,并利用模糊聚类的方法对他们进行划分,获得性能较好的资源,从而缩小了资源搜索空间,由于该操作不是在调度过程中进行的,所以有效地减少了网格作业调度的时间。
具体的,这种基于虚拟聚类的分级网络资源调度方法包括:
获取当前网络环境中的可用资源信息,构建资源池;
接收用户提交的待执行作业描述文件,构建作业管理池,所述待执行作业描述文件包括待执行作业以及作业对资源的需求信息;
为资源池中每一种资源建立多元指标矢量,基于模糊聚类分析理论,对资源池中全部资源进行相似性分析,根据相似性分析结果,对资源进行聚类分组,被聚为同一类的资源具有相似的数据处理能力。
根据所述作业对资源的需求信息,选择资源池中符合要求的资源,构建资源—作业匹配对;最后提交作业至对应的网格资源中,并监控作业执行情况,针对监控结果及时应对。
其中为每一种资源建立多元指标矢量是本发明的基础,由于网格资源是具有一定拓扑结构的处理器单元网络,处理器有自己独立的存储单元,资源间不共享内存,通信依靠消息传递进行。网格环境主要是由高性能计算集群站点和单机计算节点组成。为了进行统一的资源处理,我们将资源信息进行提取建模。对于单机节点,我们采用以下几个参数来描述多元指标矢量:
(1)处理能力:即网格资源CPU的计算能力。现在的网格计算大都是科学计算,而科学计算中最主要的计算就是浮点运算,所以我们采用每秒百万浮点数(MFLOPS)作为反映CPU计算能力的指标。吉林大学的郭东[36]等人编写了WfpSensor程序,采用计算量动态选择算法,在网格资源上定期运行Whestone计算程序,然后利用PAPI编程接口对CPU进行计数,得到MFLOPS值,最后通过GLOBUS的MDS信息服务发布出去。除此之外,简单起见,也可以用CPU主频来反应资源的处理能力。
(2)通信能力:衡量网格资源同外界网络连接的速度,单位Mbps。网络速度是用来衡量网络连接的通信能力,是针对某个网络连接而言的,一台网格主机可以通过路由器或者交换机同网格中的资源构成多条网络,因此,在说某一台网格主机的通信能力时,往往是指的当前主机同外界网格节点的连接速度的均值。网格节点i的通信能力可以用如下公式计算:
其中,j是与i有网络连接的节点,num为j的数目。
在我们搭建的网格环境中,为了获取网格主机间的网络连接速度,我们通过发送数据包的形式来测量。在实际的应用中,网络连接速度会受用户计算机性能、资源使用情况、网络高峰期、网站服务能力、线路等因素影响,所以我们在实验的时候,分多次、不同时段的进行测试,然后取平均值,这样会比较接近网络速度的真实值。
(3)系统负载:衡量当前系统的负载情况,目前,LINUX系统可以提供实时的CPU使用率,我们通过计算5分钟内CPU的使用率均值作为系统负载的衡量。单位%。
(4)内存负载:衡量当前内存的负载情况,计算方法同系统负载,单位%。
(5)空闲硬盘空间:资源中空闲的硬盘容量,单位是GB。
对于集群站点,我们同样可以提取以上类似的几个参数,此时一个集群站点就可以等同为网格环境中的单机节点,其处理能力是所有节点处理能力的均值;通信能力是对外连接的节点的通信能力均值;可以用集群管理节点的位置代替集群站点来计算其网络位置。
这样,网格系统可以表示为一个资源集合R={r1,r2……rn},其中每个资源都有一个五维指标矢量来表示R(r1)=(r10,r11,r12,r13,r14),其中,rij表示第i个资源的第j个属性值。网格系统如图2所示:节点内数值表示节点的处理能力、CPU和存储空间的使用率,连接线上数值表示链路的传输能力。
根据图2构造资源属性表如下:
基于模糊聚类分析的思想,对上述10个资源进行相似性分析的前提是对数据进行标准化处理,将其统一到[0,1]区间中,在此我们采用极值标准化方法,公式如下所示:
tik'=(tik-ti min)(ti max-ti min) (2)
其中tik为第k个资源的第i个属性,ti max和ti min为第i个属性的最大值和最小值。标准化后如下表所示:
然后我们采用算数平均最小法计算出资源的相似系数矩阵R:
最后,对相似关系矩阵R进行点积运算直到R8=R4·R4=R4,则获得模糊等价关系矩阵R’:
然后根据基于模糊等价关系的聚类方法,设置不同的λ∈[0,1],求的矩阵R’的λ截集矩阵,λ越接近1,表明聚类资源之间的关系越近,反之,相似性越低。我们取λ=0.8,得到截集R'0.8如下:
被聚为同一类的资源具有相似的数据处理能力,相互之间不会形成性能上的瓶颈。根据上述方法,我们得到十个资源被划分为以下几组:{{r0,r1,r2,r7,r8,r9},{r3},{r4},{5},{r6}}。
上述方法建立起来的资源分组并没有考虑各个属性指标的重要性差异,认为所有资源属性对于应用是相同的。但是在实际应用中,在提交任务的时候可以对资源的上述属性提出特别的需求,比如如果任务更侧重于系统的处理能力,那么可以给系统的处理能力附一个比较高的权值。这样,每一个资源分组可以通过如下公式计算出其综合性能,然后对其按照性能进行排序,在调度作业时优先考虑性能高的聚类进行作业调度。
其中,其中C表示资源的聚类,n为第i个聚类中资源的数目,r表示C中的资源,rk表示C中的第k个资源的,rkj表示第k个资源的第j个属性值,为资源第j个属性的权值,根据所述不同聚类的综合性能进行排序,在构建资源—作业匹配对时,优先考虑性综合性能高的聚类资源进行作业调度。
网络调度系统工作的过程是:网络调度系统在启动之后,通过网格资源信息管理模块同网格信息服务进行交互,获得当前网格环境中的可用资源信息,构造资源池;用户通过网络调度系统提供的作业提交接口将事先编辑好的作业描述文件提交到系统中,由调度系统构建一个作业管理池;系统根据作业描述文件中对资源的需求,结合调度策略,选择资源池中合适的资源,构建资源-作业匹配对;最后调度系统将作业提交到网格中,并定时的监控作业执行情况,对出现的问题及时处理,工作过程如图3所示。
为了更好的适应网络调度,我们还进行了改进,包括以下内容:
(1)网格环境中的资源可以随时的加入与退出,因此,网络调度系统需要提供网格资源的注册与注销功能,并提供相应的安全保证,能够对新注册的资源进行认证和授权,为后续的功能模块提供安全支持;
(2)网格资源是多种多样的,调度系统必须长期维护一个资源池,即网格资源的基本信息视图,并定期的更新该视图。
(3)对提交到系统中的作业进行评估、优化等处理,对于比较简单的独立作业或者组作业,可以采用简单的调度策略(如FIFO,MIN-MIN等)对它们进行调度,但是对关联作业或者并行作业,由于涉及作业之间通信的问题,需要在调度之前对作业进行优化,如作业划分等,然后进行提交。
(4)实行作业监控,方便用户实时的查看作业执行情况,能够对系统中的作业执行删除、重调度、暂停执行的操作。
(5)网格环境是动态变化的,调度系统需要对作业执行过程中,资源发生的任何变化做出相应的反应。当正在执行作业的资源不可用时,调度系统需要能够将作业调度到其他资源上继续运行,这就要求系统提供检查点和迁移功能。
(6)另外,为了方便用户使用,系统必须提供美观的、方便易用的、人性化的人机接口。
在实际的应用当中,普通用户和管理员具有不同的系统使用权限,简单地说,普通用户可以通过终端提交作业,查看自己提交的作业;管理员用户则可以对整个系统进行启动、暂停、终止,还可以管理任何用户提交到系统中的作业。
本发明的再一实施例是元调度器系统,也就是一种基于虚拟聚类的分级网络资源调度系统,主要包括以下几个功能模块:请求管理模块、作业管理模块、调度中心模块、传输模块、执行模块、信息模块,还有两个数据池用来存放资源和作业信息,另外有一个独立的调度策略模块,方便调度策略的扩展。
(1)请求管理模块
该模块是用户同系统的接口,用来解析用户请求,然后通过信号传递的方式提交给调度系统的核心进程。
(2)作业管理模块
作业管理是调度系统的前台,通过该模块,系统可以维护一个作业队列,并根据相应的策略进行排序,具体功能有:解析用户作业描述文件,定位作业执行需要的输入文件和目录;在作业队列中开辟存储空间,将新作业插入作业队列中;维护作业队列,及时修改作业状态;接收调度中心和用户对作业的操作请求。对于关联作业,主要完成DAG图的构建、划分、任务群的维护等工作,并提取、维护任务请求。
(3)调度中心模块
该模块是整个调度系统的核心模块,主要负责根据调度策略执行作业-资源的匹配,提交作业并监控。具体内容包括:接收作业调度请求,同信息管理模块交互,获得当前可用资源列表,根据调度策略,进行作业资源的匹配;同传输模块进行交互,通知其向作业执行主机上提前拷贝输入文件,创建临时工作目录;将匹配好的作业-资源对提交给执行管理模块,由其提交到网格中间件中。
(4)传输模块
接收调度中心的文件传输请求,通过GLOBUS的GridFTP工具向作业执行主机提交输入文件和数据,创建临时工作目录。
(5)执行模块
接收调度中心的执行请求,通过GLOBUS的GRAM工具向指定的主机提交作业,在作业执行过程中,定期的访问远程主机,查看作业执行情况及资源使用情况,当发现资源异常或者作业执行出现问题时,向调度中心发送重调度请求。
(6)信息管理模块
在调度系统启动时,其首先被加载,通过GLOBUS的MDS服务发现网格环境中可用的网格资源,建立资源队列,并定期的同MDS交互,修改资源队列中资源的状态;另外其还负责同调度中心交互,将符合条件的资源列表返回给调度中心,供其调度使用;该模块第三个功能就是对资源队列中的资源进行预处理,利用虚拟聚类的方法,分析资源池中综合性能相似的处理单元作为一类,对网格资源进行提前划分,减少任务调度时资源搜索的时间花费。
通过所述系统,原来复杂的手工作业提交方式可以简化为一条命令或者一个鼠标点击动作,其他的工作都可以由调度系统完成,其调度流程图如图4所示。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于虚拟聚类的分级网络资源调度方法,其特征在于,包括:
获取当前网络环境中的可用资源信息,构建资源池;
接收用户提交的待执行作业描述文件,构建作业管理池,所述待执行作业描述文件包括待执行作业以及作业对资源的需求信息;
根据所述作业对资源的需求信息,采用基于虚拟聚类的网络资源分级方法,选择资源池中符合要求的资源,构建资源—作业匹配对;最后提交作业至对应的网格资源中,并监控作业执行情况,针对监控结果及时应对。
2.根据权利要求1所述的方法,其特征在于,采用基于虚拟聚类的网络资源分级方法,选择资源池中符合要求的资源包括:
为资源池中每一种资源建立多元指标矢量,基于模糊聚类分析理论,对资源池中全部资源进行相似性分析,根据相似性分析结果,对资源进行聚类分组,被聚为同一类的资源具有相似的数据处理能力。
3.根据权利要求2所述的方法,其特征在于,对资源池中全部资源进行相似性分析包括:对资源采用极值标准化进行归一化处理,然后采用算数平均最小法计算出资源的相似系数矩阵,对相似关系矩阵R进行点积运算,获得模糊等价关系矩阵R’,根据模糊等价关系的聚类方法,设置计算阈值λ,当模糊等价关系矩阵R’中的元素值大于λ时取1,反之取0,获得的以0和1为元素的矩阵即为相似性分析结果;其中λ∈[0,1],通过设置不同的λ,获得资源不同相似性等级的分析结果。
4.根据权利要求2所述的方法,其特征在于:所述多元指标矢量的元素至少包括网络资源的计算能力、通信能力、系统负载、内存负载和空闲硬盘空间。
5.根据权利要求4所述的方法,其特征在于,还包括:
根据每一资源的元素性能,按下以下公式计算不同聚类资源的综合性能:
<mrow> <mi>F</mi> <mi>u</mi> <mi>n</mi> <mi>c</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munder> <mo>&amp;Sigma;</mo> <mrow> <msub> <mi>r</mi> <mi>k</mi> </msub> <mo>&amp;Element;</mo> <msub> <mi>C</mi> <mi>i</mi> </msub> </mrow> </munder> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>4</mn> </munderover> <msub> <mi>&amp;alpha;gr</mi> <mrow> <mi>k</mi> <mi>j</mi> </mrow> </msub> </mrow> <mi>n</mi> </mfrac> </mrow>
其中C表示资源的聚类,n为第i个聚类中资源的数目,r表示C中的资源,rk表示C中的第k个资源的,rkj表示第k个资源的第j个属性值,为资源第j个属性的权值,根据所述不同聚类的综合性能进行排序,在构建资源—作业匹配对时,优先考虑性综合性能高的聚类资源进行作业调度。
6.根据权利要求1所述的方法,其特征在于:所述网络环境为开放式环境,接收新资源的注册,对新资源进行认证和授权;同时监控资源负载情况,注销满载资源。
7.根据权利要求1所述的方法,其特征在于:判断用户提交的待执行作业文件是否为关联作业或并行作业,若是,则先对关联作业或并行作业进行划分,然后构建资源—作业匹配对并提交;若不是,则采用FIFO或MIN-MIN调度策略对其进行调度,并提交。
8.根据权利要求1所述的方法,其特征在于,监控作业执行情况还包括:监控网络环境中资源使用情况,当正在执行作业的资源不可用时,将作业调度到其他资源上继续运行。
9.根据权利要求1所述的方法,其特征在于:接收用户提交的待执行作业描述文件采用图形化交互界面,所述资源池采用资源池视图界面,同时定期更新资源池视图。
10.一种基于虚拟聚类的分级网络资源调度系统,其特征在于,包括:
请求管理模块,用于接收并解析用户请求,将用户请求发送给作业管理模块;
作业管理模块,用于根据用户请求解析待执行作业描述文件,建立作业队列,定位执行作业需要的输入文件和目录;在作业队列中开辟存储空间,将待执行作业插入作业队列中;维护作业队列,及时修改作业状态;对关联作业进行DAG图的构建、划分、任务群维护;接收调度中心模块和用户对作业的操作请求,根据所述操作请求,执行相应的操作;
调度中心模块,用于根据调度策略构建资源—作业匹配对,提交作业并监控作业的执行;与信息管理模块交互,获得当前可用资源池;与传输模块、执行模块分别进行交互;
传输模块,用于接收调度中心模块的文件传输请求,通过GLOBUS的GridFTP工具向作提交作业文件和数据,创建工作目录;
执行模块,用于接收调度中心的执行请求,通过GLOBUS的GRAM工具提交作业,在作业执行过程中,定期监控作业执行情况及资源使用情况,当发现资源异常或者作业执行出现问题时,向调度中心模块发送重新调度请求。
信息管理模块,用于采用GLOBUS的MDS服务搜索网格环境中的可用资源信息,建立资源池,并定期的同MDS服务交互,修改资源池中资源的状态;根据所述作业对资源的需求信息,采用基于虚拟聚类的网络资源分级方法,对网格资源进行划分,减少任务调度时用于搜索资源所花费的时间。
CN201710574760.7A 2017-07-14 2017-07-14 一种基于虚拟聚类的分级网络资源调度方法及系统 Pending CN107450983A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710574760.7A CN107450983A (zh) 2017-07-14 2017-07-14 一种基于虚拟聚类的分级网络资源调度方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710574760.7A CN107450983A (zh) 2017-07-14 2017-07-14 一种基于虚拟聚类的分级网络资源调度方法及系统

Publications (1)

Publication Number Publication Date
CN107450983A true CN107450983A (zh) 2017-12-08

Family

ID=60488070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710574760.7A Pending CN107450983A (zh) 2017-07-14 2017-07-14 一种基于虚拟聚类的分级网络资源调度方法及系统

Country Status (1)

Country Link
CN (1) CN107450983A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108257077A (zh) * 2018-01-02 2018-07-06 深圳云天励飞技术有限公司 基于gpu的聚类数据的处理方法、系统及计算设备
CN108304261A (zh) * 2017-12-29 2018-07-20 曙光信息产业(北京)有限公司 一种基于6D-Torus网络的作业调度方法和装置
CN108304260A (zh) * 2017-12-15 2018-07-20 上海超算科技有限公司 一种基于高性能云计算的虚拟化作业调度系统及其实现方法
CN108446174A (zh) * 2018-03-06 2018-08-24 苏州大学 基于资源预分配与公共引导代理的多核作业调度方法
CN108958946A (zh) * 2018-08-02 2018-12-07 中国建设银行股份有限公司 虚拟化资源池切换方法、装置和电子设备
CN110084507A (zh) * 2019-04-24 2019-08-02 信雅达系统工程股份有限公司 云计算环境下分级感知的科学工作流调度优化方法
CN110245108A (zh) * 2019-07-15 2019-09-17 北京一流科技有限公司 执行体创建系统和执行体创建方法
CN111512287A (zh) * 2018-03-27 2020-08-07 甲骨文金融服务软件有限公司 对执行流水线的计算机化控制
CN113722079A (zh) * 2021-11-03 2021-11-30 北京云歌科技有限责任公司 基于目标应用的任务调度分配方法、装置、设备及介质
CN115208764A (zh) * 2022-07-27 2022-10-18 济南浪潮数据技术有限公司 一种基于资源池的请求响应方法、装置及其介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101309208A (zh) * 2008-06-21 2008-11-19 华中科技大学 一种适用于网格环境的基于可靠性代价的作业调度系统
US20120159506A1 (en) * 2010-12-20 2012-06-21 Microsoft Corporation Scheduling and management in a personal datacenter
CN102932279A (zh) * 2012-10-30 2013-02-13 北京邮电大学 一种云环境数据中心多维资源调度系统及方法
CN104536804A (zh) * 2014-12-23 2015-04-22 西安电子科技大学 面向关联任务请求的虚拟资源调度系统及调度和分配方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101309208A (zh) * 2008-06-21 2008-11-19 华中科技大学 一种适用于网格环境的基于可靠性代价的作业调度系统
US20120159506A1 (en) * 2010-12-20 2012-06-21 Microsoft Corporation Scheduling and management in a personal datacenter
CN102932279A (zh) * 2012-10-30 2013-02-13 北京邮电大学 一种云环境数据中心多维资源调度系统及方法
CN104536804A (zh) * 2014-12-23 2015-04-22 西安电子科技大学 面向关联任务请求的虚拟资源调度系统及调度和分配方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邢常振: "基于虚拟计算环境的元调度器研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304260A (zh) * 2017-12-15 2018-07-20 上海超算科技有限公司 一种基于高性能云计算的虚拟化作业调度系统及其实现方法
CN108304260B (zh) * 2017-12-15 2022-02-22 上海超算科技有限公司 一种基于高性能云计算的虚拟化作业调度系统及其实现方法
CN108304261A (zh) * 2017-12-29 2018-07-20 曙光信息产业(北京)有限公司 一种基于6D-Torus网络的作业调度方法和装置
CN108257077A (zh) * 2018-01-02 2018-07-06 深圳云天励飞技术有限公司 基于gpu的聚类数据的处理方法、系统及计算设备
CN108257077B (zh) * 2018-01-02 2022-03-22 深圳云天励飞技术有限公司 基于gpu的聚类数据的处理方法、系统及计算设备
CN108446174A (zh) * 2018-03-06 2018-08-24 苏州大学 基于资源预分配与公共引导代理的多核作业调度方法
CN111512287A (zh) * 2018-03-27 2020-08-07 甲骨文金融服务软件有限公司 对执行流水线的计算机化控制
CN108958946A (zh) * 2018-08-02 2018-12-07 中国建设银行股份有限公司 虚拟化资源池切换方法、装置和电子设备
CN110084507A (zh) * 2019-04-24 2019-08-02 信雅达系统工程股份有限公司 云计算环境下分级感知的科学工作流调度优化方法
CN110245108A (zh) * 2019-07-15 2019-09-17 北京一流科技有限公司 执行体创建系统和执行体创建方法
CN113722079A (zh) * 2021-11-03 2021-11-30 北京云歌科技有限责任公司 基于目标应用的任务调度分配方法、装置、设备及介质
CN115208764A (zh) * 2022-07-27 2022-10-18 济南浪潮数据技术有限公司 一种基于资源池的请求响应方法、装置及其介质

Similar Documents

Publication Publication Date Title
CN107450983A (zh) 一种基于虚拟聚类的分级网络资源调度方法及系统
CN106505593B (zh) 一种基于大数据的配变三相不平衡分析与负荷调整的方法
CN104377826B (zh) 一种主动配电网控制策略及方法
CN105205729B (zh) 一种基于云计算的电力系统能效公共服务云平台
CN105677486B (zh) 数据并行处理方法及系统
CN105046327B (zh) 一种基于机器学习技术的智能电网信息系统及方法
CN104298550B (zh) 一种面向Hadoop的动态调度方法
Zhu et al. Study on cloud computing resource scheduling strategy based on the ant colony optimization algorithm
CN103607466B (zh) 一种基于云计算的广域多级分布式并行电网分析方法
CN103118124B (zh) 一种基于分层多代理的云计算负载均衡方法
CN103488539B (zh) 一种基于cpu动态调频技术的数据中心节能方法
CN108829494A (zh) 基于负载预测的容器云平台智能资源优化方法
CN103700041A (zh) 基于云计算的智能电网负荷预测管理平台
CN106209482A (zh) 一种数据中心监控方法及系统
CN103561077A (zh) 一种多QoS约束的云存储任务调度法
CN103365727A (zh) 一种云计算环境中的主机负载预测方法
CN102903010A (zh) 一种用于面向工矿企业的安全生产云服务平台的基于支持向量机的异常判断方法
CN107657389A (zh) 一种电力需求侧管理平台
CN106408126A (zh) 一种面向能耗数据并发采集的三阶段优化方法
CN108460294B (zh) 一种决策证明型区块链算法及其物理架构
CN106161640A (zh) 一种基于云计算的虚拟机两级优化调度管理平台
CN109522120A (zh) 一种基于Hadoop的智能家居管理平台
CN108446174A (zh) 基于资源预分配与公共引导代理的多核作业调度方法
CN106530110A (zh) 一种基于大数据的海洋工程管理系统及方法
Li et al. Cress: Dynamic scheduling for resource constrained jobs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171208