CN102833289B - 一种分布式云计算资源组织和任务分配方法 - Google Patents

一种分布式云计算资源组织和任务分配方法 Download PDF

Info

Publication number
CN102833289B
CN102833289B CN201110162126.5A CN201110162126A CN102833289B CN 102833289 B CN102833289 B CN 102833289B CN 201110162126 A CN201110162126 A CN 201110162126A CN 102833289 B CN102833289 B CN 102833289B
Authority
CN
China
Prior art keywords
node
bunch
cluster head
resource
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110162126.5A
Other languages
English (en)
Other versions
CN102833289A (zh
Inventor
郭双宙
郑哲
柴家发
许少杰
张顺顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NINGBO SUTENG ELECTRONICS CO Ltd
Original Assignee
NINGBO SUTENG ELECTRONICS CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NINGBO SUTENG ELECTRONICS CO Ltd filed Critical NINGBO SUTENG ELECTRONICS CO Ltd
Priority to CN201110162126.5A priority Critical patent/CN102833289B/zh
Publication of CN102833289A publication Critical patent/CN102833289A/zh
Application granted granted Critical
Publication of CN102833289B publication Critical patent/CN102833289B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种分布式云计算资源组织和任务分配方法,该方法中,云计算资源被组织为若干自治的簇,每个簇由一个簇首节点和若干个资源节点构成,簇首节点是系统启动初始化时采用分布式簇首选举法产生,资源节点根据与簇首节点的通信选择加入不同的簇;系统运行时,簇首节点动态调整簇大小;每个簇内采用最佳分配任务法和任务迁移法进行节点上的任务分配。本发明方法在保证系统性能的前提下,实现整个簇内资源的最优化,在降低系统管理复杂性的前提下,提高了系统灵活性和可扩展性,为大规模、大范围的云计算应用提供了保证。

Description

一种分布式云计算资源组织和任务分配方法
技术领域
本发明属于大规模分布式云计算信息技术领域,具体涉及一种分布式云计算资源组织和任务分配方法。
背景技术
云计算是一种新型的商业计算模式,它通过对大量计算机构成的资源池进行统一调配,使各种不同的应用能够按需获取处理器、存储空间等各种计算资源。云计算将传统基于桌面的任务处理转化为基于网络的任务处理,使得计算资源能够像商品一样在互联网上进行流通,用户可以以极低的成本获得较高的计算能力,而不再需要购买并维护昂贵的软硬件设备。
云计算能够将计算分布在大量的分布式计算机上,而非本地计算机或单一远程服务器中,这样,企业就能够将资源切换到需要的应用上,根据需求访问计算机和存储系统,应用提供者无需为繁琐的计算资源管理而烦恼,从而能够更加专注于自己的业务逻辑。这种业务逻辑与计算资源的分离大大的降低了企业信息化的复杂度。更重要的是,云计算带来的服务整合与按需供给大大提高了当前计算资源的利用率,降低服务的能耗量,并且有效屏蔽计算资源的出错问题。
由于云计算的核心就是资源,因此资源的组织和分配是云计算技术要解决的一个重要问题,其效率直接影响整个云计算服务的质量。因此,对云计算资源管理的研究也由来已久。
UCBerkeley开发的Ganglia是一个面向分布式计算系统的资源和负载监测系统。Ganglia包括若干组件,这些组件效率很高,分别负责系统监控、数据收集和指标显示等工作。Ganglia采用树形结构,并对搜集的信息进行集中管理,然后通过UDP多播或者TCP连接发布资源和负载信息。集中的管理会导致系统的扩展性较差,从而无法适应云计算大规模动态的数据信息管理。另外,Ganglia使用RRD(RoundRobinDatabase)数据库,能够在一定程度上简化海量监控历史数据的处理,但是Ganglia使用它却会造成性能上的瓶颈,尤其是在对数据进行归档合并的时候,会造成瞬间磁盘的访问量提高,对云计算系统干扰较大。
Supermon是由美国洛斯阿拉莫斯国家高级计算实验室开发的一套高速集群监控系统。它强调低扰动、高采样率,并且提供从单一处理器到多处理器的支持。Supermon在结构上分为三个层次,底层是每个结点上的监控信息收集程序,用来收集结点状态信息;中间层是一个数据集中器,它的任务是汇总来自每个mon的数据并处理来自上层的数据请求事例;最上层是应用客户端或者顶层数据集中器,用来进行显示或是再次数据汇总这种层次结构使得Supermon有较好的可扩展性。但是因为仍旧采用集中式管理,所以当节点规模变大时性能会呈线性下降,同时Supermon也是系统中的单一失效点,使系统可靠性下降。
发明内容
本发明针对现有的云计算系统集中式资源调度方法的灵活性以及可扩展性等缺陷,提出了一种分布式云计算资源组织和任务分配方法。
实现上述发明目的的技术方案为,一种分布式云计算资源组织和任务分配方法,云计算资源被组织为若干自治的簇,每个簇由一个簇首节点和若干个资源节点构成,簇首节点是系统启动初始化时采用分布式簇首选举法产生,资源节点根据与簇首节点的通信选择加入不同的簇;系统运行时,簇首节点动态调整簇大小;每个簇内采用最佳分配任务法和任务迁移法进行节点上的任务分配。
所述分布式簇首选举法的步骤为:(1)确定簇大小期望值参数CSize和簇大小容许范围参数CRange,从而确定一个簇的资源节点个数范围在CSize-CRange和CSize+CRange之间;(2)每个资源节点选取一个介于0到1之间的随机数,如果该随机数大于1/CSize,则该节点成为簇首节点,否则为普通资源节点。
所述资源节点根据与簇首的通信选择加入不同的簇的步骤为:(1)资源节点广播1类请求加入数据包,该数据包仅针对簇首节点,簇首节点在收到该数据包后,返回一个应答数据包,其中包含其簇内尚可容许加入的节点个数;(2)步骤(1)的资源节点在收到应答数据包之后,按照信号强度开始查询第一个尚可容许加入的节点个数大于0的簇,如果找到则加入该簇;否则,广播2类请求加入数据包,该数据包针对一般资源节点,收到该数据包的节点将该数据包转发给其簇首节点,然后簇首节点返回一个应答数据包,该数据包中包含该节点到簇首节点的跳数和其簇内尚可容许加入的节点个数,广播2类请求加入数据包的资源节点在收到应答数据包之后,选择跳数最少且尚可容许加入的节点个数大于0的簇加入,如果仍然找不到符合条件的簇,则该资源节点升级为簇首节点。
所述簇首节点动态调整簇大小包括簇分割和簇解散,簇分割的方法步骤为:(1)簇首节点统计簇内的资源节点个数,若资源节点个数大于CSize+CRange,则簇分割开始,否则不进行簇分割;(2)簇分割开始后,首先簇首节点发起广播,资源节点上报其统计的平均信号强度,簇首节点选择平均信号强度最大的资源节点作为新簇的簇首,并广播给所有簇内资源节点;(3)簇内资源节点根据信号强度重新选择簇首节点,完成簇分割。簇解散的方法步骤为:(1)簇首节点统计簇内的资源节点个数,若资源节点个数小于CSize-CRange,则簇解散开始,否则不进行簇解散;(2)首先簇首节点发起广播,簇内资源节点在收到这个广播数据包之后便各自启动加入不同的簇的方法,完成簇解散。
每个簇内采用的最佳分配任务法为,资源节点接收到一个任务之后,向簇内所有资源节点广播该任务所需要的处理器个数,资源节点分别计算分配此任务后剩余的处理器数目,簇首节点选择一个剩余处理器数目最小的资源节点,并将任务分配给此资源节点。
每个簇内采用的任务迁移法步骤为:(1)簇首节点向簇内所有资源节点发出汇报要求数据包,资源节点发回各自的处理器以及任务分配情况;(2)簇首节点开始计算迁移方案,对于每一个节点的处理器占用最少的任务拿出,放入一个任务池中,再将节点按照剩余任务所占处理器个数排序,接下来按从小到大的顺序依次将各节点的任务使用最佳分配任务法进行分配,如果某任务无法分配就保持其在原有的节点上;(3)将任务池中的任务按照所占处理器从大到小的顺序使用最佳分配任务法进行分配。
本发明的方法将云计算的资源划分为很多自治的簇,通过簇首选举法选出相应的簇首节点,簇首节点对簇内的节点资源进行一定的管理;另外,该方法中还对簇进行动态的调整,根据簇的大小实现簇的自发分割和合并;对于簇内任务的分配,提出了一种能耗最小化的任务分配方法,该方法以能耗为优化目标,在保证系统的性能的前提下,实现整个簇内资源的最优化。本发明所涉及的方法,均采用分布式的方式,因此不需要一个统一的资源管理服务器,在降低系统管理复杂性的前提下,提高了系统灵活性和可扩展性,为大规模、大范围的云计算应用提供了保证。
附图说明
图1是云计算资源的簇结构图;
图2是资源节点加入不同簇的流程图;
图3是簇分割的流程图;
图4是最佳分配任务法流程图;
图5是任务迁移法流程图;
图中,A1、A2、A3代表不同的簇,H1、H2、H3代表不同簇的簇首节点,N表示云资源节点。
具体实施方式
为便于本发明技术方案的理解,下面结合具体的实施方式进行介绍。如图1是本发明所述分布式云计算资源组织和任务分配方法中的节点资源簇结构图。如图,云计算资源被组织为若干自治的簇,图中所示的实施例用A1、A2、A3表示了3个簇,每个簇由一个簇首节点和若干个资源节点N构成,图中的3个簇首节点是H1、H2和H3,簇的个数不局限于实施例所表示的3个簇。每个簇首节点是系统启动初始化时采用分布式簇首选举法产生,分布式簇首选举法的步骤为:(1)确定簇大小期望值参数CSize和簇大小容许范围参数CRange,从而确定一个簇的资源节点个数范围在CSize-CRange和CSize+CRange之间;(2)每个资源节点选取一个介于0到1之间的随机数,如果该随机数大于1/CSize,则该节点成为簇首节点,否则为普通资源节点。
簇首节点产生后,资源节点根据与簇首节点的通信选择加入不同的簇,其具体方法如图2所示,(1)资源节点广播1类请求加入数据包,该数据包仅针对簇首节点,簇首节点在收到该数据包后,返回一个应答数据包,其中包含其簇内尚可容许加入的节点个数;(2)步骤(1)的资源节点在收到应答数据包之后,按照信号强度开始查询第一个尚可容许加入的节点个数大于0的簇,如果找到则加入该簇;否则,广播2类请求加入数据包,该数据包针对一般资源节点,收到该数据包的节点将该数据包转发给其簇首节点,然后簇首节点返回一个应答数据包,该数据包中包含该节点到簇首节点的跳数和其簇内尚可容许加入的节点个数,广播2类请求加入数据包的资源节点在收到应答数据包之后,选择跳数最少且尚可容许加入的节点个数大于0的簇加入,如果仍然找不到符合条件的簇,则该资源节点升级为簇首节点。
系统运行时,簇首节点动态调整簇大小,调整的方法包括簇分割和簇解散,簇分割的方法流程如图3,(1)簇首节点统计簇内的资源节点个数,若资源节点个数大于CSize+CRange,则簇分割开始,否则不进行簇分割;(2)簇分割开始后,首先簇首节点发起广播,资源节点上报其统计的平均信号强度,簇首节点选择平均信号强度最大的资源节点作为新簇的簇首,并广播给所有簇内资源节点;(3)簇内资源节点根据信号强度重新选择簇首节点,完成簇分割。簇解散的方法为:(1)簇首节点统计簇内的资源节点个数,若资源节点个数小于CSize-CRange,则簇解散开始,否则不进行簇解散;(2)首先簇首节点发起广播,簇内资源节点在收到这个广播数据包之后便各自启动加入不同的簇的方法,完成簇解散。
每个簇内采用最佳分配任务法和任务迁移法进行节点上的任务分配,如图4是最佳分配任务法流程图,资源节点接收到一个任务之后,向簇内所有资源节点广播该任务所需要的处理器个数,资源节点分别计算分配此任务后剩余的处理器数目,簇首节点选择一个剩余处理器数目最小的资源节点,并将任务分配给此资源节点;任务迁移法流程如图5所示,(1)簇首节点向簇内所有资源节点发出汇报要求数据包,资源节点发回各自的处理器以及任务分配情况;(2)簇首节点开始计算迁移方案,对于每一个节点的处理器占用最少的任务拿出,放入一个任务池中,再将节点按照剩余任务所占处理器个数排序,接下来按从小到大的顺序依次将各节点的任务使用最佳分配任务法进行分配,如果某任务无法分配就保持其在原有的节点上;(3)将任务池中的任务按照所占处理器从大到小的顺序使用最佳分配任务法进行分配。
本发明所提出的分布式的云计算系统资源组织与任务分配方法,从分簇到簇内资源管理提供了一系列的分布式方法。同现有方法相比,该方法在簇管理方面提供了完全分布式的解决方案,提高了资源管理的灵活性和可扩展性,并减少了人工参与,提高了系统管理的效率。在簇内任务分配方面,针对系统能耗为目标进行了优化,提供了一种基于最佳分配的任务分配方法,另外,还提供了一种定期执行的任务迁移方法,这两种方法在保证系统运行效率额前提下,降低了系统的能耗。本发明对现有云计算系统的资源组合和任务分配从扩展性和能耗方面进行了较大的提升,从而为大规模、大范围的云计算的应用提供了保证。
以上所述,为本发明的较佳实施案例,并非对本发明作任何限制,凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化,均仍属于本发明技术方案的保护范围内。

Claims (5)

1.一种分布式云计算资源组织和任务分配方法,其特征在于,云计算资源被组织为若干自治的簇,每个簇由一个簇首节点和若干个资源节点构成,簇首节点是系统启动初始化时采用分布式簇首选举法产生,资源节点根据与簇首节点的通信选择加入不同的簇;系统运行时,簇首节点动态调整簇大小;每个簇内采用最佳分配任务法和任务迁移法进行节点上的任务分配;上述分布式簇首选举法的步骤为:(1)确定簇大小期望值参数CSize和簇大小容许范围参数CRange,从而确定一个簇的资源节点个数范围在CSize-CRange和CSize+CRange之间;(2)每个资源节点选取一个介于0到1之间的随机数,如果该随机数大于1/CSize,则该节点成为簇首节点,否则为普通资源节点;每个簇内采用的最佳分配任务法为:资源节点接收到一个任务之后,向簇内所有资源节点广播该任务所需要的处理器个数,资源节点分别计算分配此任务后剩余的处理器数目,簇首节点选择一个剩余处理器数目最小的资源节点,并将任务分配给此资源节点;每个簇内采用的任务迁移法步骤为:(1)簇首节点向簇内所有资源节点发出汇报要求数据包,资源节点发回各自的处理器以及任务分配情况;(2)簇首节点开始计算迁移方案,对于每一个节点的处理器占用最少的任务拿出,放入一个任务池中,再将节点按照剩余任务所占处理器个数排序,接下来按从小到大的顺序依次将各节点的任务使用最佳分配任务法进行分配,如果某任务无法分配就保持其在原有的节点上;(3)将任务池中的任务按照所占处理器从大到小的顺序使用最佳分配任务法进行分配。
2.根据权利要求1所述的分布式云计算资源组织和任务分配方法,其特征在于,资源节点根据与簇首的通信选择加入不同的簇的步骤为:
(1)资源节点广播1类请求加入数据包,该数据包仅针对簇首节点,簇首节点在收到该数据包后,返回一个应答数据包,其中包含其簇内尚可容许加入的节点个数;
(2)步骤(1)的资源节点在收到应答数据包之后,按照信号强度开始查询第一个尚可容许加入的节点个数大于0的簇,如果找到则加入该簇;否则,广播2类请求加入数据包,该数据包针对一般资源节点,收到该数据包的节点将该数据包转发给其簇首节点,然后簇首节点返回一个应答数据包,该数据包中包含该节点到簇首节点的跳数和其簇内尚可容许加入的节点个数,广播2类请求加入数据包的资源节点在收到应答数据包之后,选择跳数最少且尚可容许加入的节点个数大于0的簇加入,如果仍然找不到符合条件的簇,则该资源节点升级为簇首节点。
3.根据权利要求1或2所述的分布式云计算资源组织和任务分配方法,其特征在于,簇首节点动态调整簇大小包括簇分割和簇解散。
4.根据权利要求3所述的分布式云计算资源组织和任务分配方法,其特征在于,簇分割的方法步骤为:
(1)簇首节点统计簇内的资源节点个数,若资源节点个数大于CSize+CRange,则簇分割开始,否则不进行簇分割;
(2)簇分割开始后,首先簇首节点发起广播,资源节点上报其统计的平均信号强度,簇首节点选择平均信号强度最大的资源节点作为新簇的簇首,并广播给所有簇内资源节点;
(3)簇内资源节点根据信号强度重新选择簇首节点,完成簇分割。
5.根据权利要求3所述的分布式云计算资源组织和任务分配方法,其特征在于,簇解散的方法步骤为:
(1)簇首节点统计簇内的资源节点个数,若资源节点个数小于CSize-CRange,则簇解散开始,否则不进行簇解散;
(2)首先簇首节点发起广播,簇内资源节点在收到这个广播数据包之后便各自启动加入不同的簇的方法,完成簇解散。
CN201110162126.5A 2011-06-16 2011-06-16 一种分布式云计算资源组织和任务分配方法 Active CN102833289B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110162126.5A CN102833289B (zh) 2011-06-16 2011-06-16 一种分布式云计算资源组织和任务分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110162126.5A CN102833289B (zh) 2011-06-16 2011-06-16 一种分布式云计算资源组织和任务分配方法

Publications (2)

Publication Number Publication Date
CN102833289A CN102833289A (zh) 2012-12-19
CN102833289B true CN102833289B (zh) 2016-02-17

Family

ID=47336259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110162126.5A Active CN102833289B (zh) 2011-06-16 2011-06-16 一种分布式云计算资源组织和任务分配方法

Country Status (1)

Country Link
CN (1) CN102833289B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2951679A4 (en) * 2013-01-31 2016-08-10 Hewlett Packard Entpr Dev Lp DETERMINING THE TRANSFERABILITY OF A CALCULATION RESOURCE TO A COMPUTER CLOUD ENVIRONMENT
CN103677759B (zh) * 2013-11-08 2017-01-11 国家电网公司 一种用于信息系统性能提升的对象化并行计算方法及系统
CN104539689B (zh) * 2014-12-23 2017-12-26 西安电子科技大学 一种云平台下的资源监控方法
CN107493485B (zh) * 2016-06-13 2021-11-05 中兴通讯股份有限公司 一种资源控制方法、装置和iptv服务器
WO2018098753A1 (zh) * 2016-11-30 2018-06-07 深圳天珑无线科技有限公司 分布式网络的管理方法、节点及系统
CN106851213A (zh) * 2017-03-06 2017-06-13 深圳市博信诺达经贸咨询有限公司 监控系统中云平台的分组任务分配方法及系统
CN107862835A (zh) * 2017-12-11 2018-03-30 何旭连 一种基于云计算的山洪灾害监测系统
CN109995669B (zh) * 2019-04-09 2024-05-03 深圳前海微众银行股份有限公司 分布式限流方法、装置、设备及可读存储介质
CN110932920B (zh) * 2020-01-23 2021-02-02 飞诺门阵(北京)科技有限公司 一种网络拓扑结构
CN110928694B (zh) * 2020-01-23 2021-01-22 飞诺门阵(北京)科技有限公司 一种计算机系统
US11706076B2 (en) 2020-01-23 2023-07-18 Novnet Computing System Tech Co., Ltd. Computer system with computing devices, communication device, task processing device
CN114297808B (zh) * 2020-12-02 2023-04-07 北京航空航天大学 航空电子系统的任务分配与资源调度方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0776502A2 (en) * 1994-08-19 1997-06-04 Peerlogic, Inc. Scalable distributed computing environment
CN1645862A (zh) * 2005-02-01 2005-07-27 北京北方烽火科技有限公司 一种集群中主控节点自适应选举算法
CN101702721A (zh) * 2009-10-26 2010-05-05 北京航空航天大学 一种多集群系统的可重组方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0776502A2 (en) * 1994-08-19 1997-06-04 Peerlogic, Inc. Scalable distributed computing environment
CN1645862A (zh) * 2005-02-01 2005-07-27 北京北方烽火科技有限公司 一种集群中主控节点自适应选举算法
CN101702721A (zh) * 2009-10-26 2010-05-05 北京航空航天大学 一种多集群系统的可重组方法

Also Published As

Publication number Publication date
CN102833289A (zh) 2012-12-19

Similar Documents

Publication Publication Date Title
CN102833289B (zh) 一种分布式云计算资源组织和任务分配方法
Liu et al. Job scheduling model for cloud computing based on multi-objective genetic algorithm
CN104461740B (zh) 一种跨域集群计算资源聚合和分配的方法
CN100428167C (zh) 计算机系统、服务器以及作业执行控制方法
CN104112049B (zh) 基于P2P构架的MapReduce任务跨数据中心调度系统及方法
CN102801750B (zh) 一种云计算目标系统构建方法
CN114138488A (zh) 一种基于弹性高性能计算的云原生实现方法及系统
CN102904963A (zh) 一种基于云模型云服务的管理方法及系统
CN115080533A (zh) 基于大数据用于数据交换与共享的中台系统
Guo et al. Grid resource allocation and management algorithm based on optimized multi-task target decision
CN104683480A (zh) 一种基于应用的分布式计算方法
GuiLing et al. Service-oriented grid architecture and middleware technologies for collaborative e-learning
CN103268261A (zh) 一种适用于大规模高效能计算机的层次式计算资源管理方法
Chang et al. Energy efficient virtual machine consolidation in cloud datacenters
Maalla et al. The Construction of Heterogeneous Platform of Unified Service System Based on Cloud Computing [J]
Butt et al. Optimization of response and processing time for smart societies using particle swarm optimization and levy walk
CN112148546A (zh) 电力系统静态安全分析并行计算系统及方法
Liu et al. Grid resource scheduling algorithm based on optimization hierarchy
Ajibola et al. On energy efficiency of networks for composable datacentre infrastructures
Zhang et al. Research on resource scheduling algorithm in cloud computing data center
Lu et al. Grid load balancing scheduling algorithm based on statistics thinking
Dai et al. A resource occupancy ratio-oriented load balancing task scheduling mechanism for flink
CN101321354B (zh) 一种移动通信系统中上报性能数据的方法
Yasmin et al. A constraint programming-based resource allocation and scheduling of map reduce jobs with service level agreement
WO2019006721A1 (zh) 一种基于云计算的风电大数据分析系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 315105 No. 17, No. 818, Qiming Road, Ningbo, Zhejiang, Yinzhou District 117

Applicant after: Ningbo Suteng Electronics Co.,Ltd.

Address before: 315100 room 298, No. 607-609, bachelor Road, Ningbo, Zhejiang, Yinzhou District

Applicant before: Ningbo Suteng Electronics Co.,Ltd.

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant