CN103534687A - 聚簇数据格网中的可扩展集中动态资源分配 - Google Patents

聚簇数据格网中的可扩展集中动态资源分配 Download PDF

Info

Publication number
CN103534687A
CN103534687A CN201280023355.1A CN201280023355A CN103534687A CN 103534687 A CN103534687 A CN 103534687A CN 201280023355 A CN201280023355 A CN 201280023355A CN 103534687 A CN103534687 A CN 103534687A
Authority
CN
China
Prior art keywords
distribution
node
clustering
cutting part
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280023355.1A
Other languages
English (en)
Other versions
CN103534687B (zh
Inventor
R·H·李
G·格莱泽
M·法尔科
C·普尔蒂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oracle International Corp
Original Assignee
Oracle International Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oracle International Corp filed Critical Oracle International Corp
Publication of CN103534687A publication Critical patent/CN103534687A/zh
Application granted granted Critical
Publication of CN103534687B publication Critical patent/CN103534687B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Abstract

描述了一种集中式资源分配,其中在聚簇节点之间分割数据的决定部分被集中,而实施分割的实际机构保留分布式算法。使用中央分配协调器来产生可扩展中央策略,其控制数据将如何在聚簇上被分割。根据分布式算法,实施该策略的工作由所有成员独立且非同步地执行。中央策略可传输到所有聚簇成员,每个成员能执行分割,只要涉及其本身。例如,根据分布式算法,一个节点可根据中央策略而决定它需要获得特定分割部,并且执行不要的步骤以获得该数据,而另一些节点可以非同步地执行与那些特定节点相关的其他个体分割部的转移。

Description

聚簇数据格网中的可扩展集中动态资源分配
版权声明
本专利文献公开的一部分包含受到版权保护的内容。版权所有者不反对任何人对本专利文献或专利公开进行传真复印,只要它出现在专商局专利文件或记录中,但是在其他情况下,保留任何所有版权。
技术领域
本发明涉及分布式计算环境中的数据高速缓存技术,更特别地,涉及在聚簇网络的成员之间分割数据。
背景技术
分布式计算和分布式算法已经由于增大的性能和承载能力、高可用性和失效转移(failover)、以及更快的数据访问而广泛流行于各种情境中。分布式计算一般涉及彼此通信以解决任务(诸如执行应用,解决复杂的计算问题,或者向用户提供到各种服务的接入)的多个自治计算机(也称为节点)。每个计算机节点一般包括其自身的一个或多个处理器、存储器、以及到其他节点的通信链路。计算机可以位于特定位置(例如,聚簇网络)中,或者可以通过大面积网络(LAN)诸如因特网而被连接。在很多情况中,分布式计算机使用消息来彼此通信以及协调任务处理和数据管理。
数据管理是分布式计算中的重要问题。在聚簇网络的情境中,大数据集可以在聚簇的各个节点之间分割。每个节点通常储存多个这样的分割部(整个数据集的子部(subpart))并且对分割部执行事务。在许多情况下,分割部包括在成员之间分配的数据的主拷贝和备份拷贝以用于失效转移。数据以此分割方式的分配能改善易管理性、性能和信息可用性。
数据在该情境下的理想分配受到许多限制和问题的影响。例如,将数据从一个服务器移动到另一服务器需要耗费时间和/或处理器能力。出于高可用性的原因,通常优选将数据的主拷贝和备份拷贝定位在物理不同的机器上。此外,出于性能、扩缩性和容量的原因,通常优选在可用的储存服务器之间在一定程度上均等地平衡数据分配,并且当从聚簇增加或去除节点时调整该分配。
在一些使用情况下,可能期望进一步的应用特定的偏好。例如,指定特定数据集应位于特定服务器上在某些情况下可能是有用的。此外,可能期望指定分配应使用运行时(runtime)反馈和输入以将数据安置于节点成员中。根据上述内容,需要一种简单有效的方式来解决全部或许多数据分配问题并且在分布式聚簇成员之间优化分割部的平衡。
发明内容
根据本发明的各种实施例,在聚簇节点之间分割数据的决策部分可以被集中,而实施分割的实际机构可保留分布式算法。中央分配协调器可执行集中逻辑或算法(策略),其生成分配计划。分配计划控制跨整个聚簇将分割多少数据。根据分布式算法,实施该分配计划的工作由所有成员独立且非同步地执行。分配计划可以传输到聚簇的所有成员,然后每个成员执行仅涉及其本身的分割。例如,根据分布式算法,一个节点可根据分配计划确定它需要获得特定分割部,并且执行必要的步骤来获得该数据,而另一些节点可以非同步地执行与那些特定节点相关的其他单独分割部的传输。以此方式,可防止单个协同点导致的瓶颈,同时实现数据分配的集中管理和控制。
附图说明
图1是根据本发明各种实施例的在聚簇中实施的可扩展集中资源分配的图示。
图2是根据本发明各种实施例的由聚簇中的节点实施的分配计划的图示。
图3是根据本发明各种实施例的提供集中资源分配的过程的流程图。
图4是根据本发明各种实施例的由分配协调器执行的过程的流程图。
图5是根据本发明各种实施例的由聚簇中的节点执行的过程的流程图。
具体实施方式
聚簇数据格网的功能之一在于维护和实现数据储存分割部在各聚簇成员(节点)之间的分配。在此情境下,分配可视为数据的主拷贝和备份拷贝二者在提供数据储存的给定聚簇成员服务器上的安置。
跨聚簇实施数据分割的一种方式是通过实施分布式算法,其中每个储存服务器独立地确定是否将其拥有的分割部移动到另一服务器或者从另一服务器获得分割部。作为示例,聚簇的数据集可最初包括256个主分割部(具有对应的256个备份分割部),其最终跨两个聚簇成员(节点)分配,每个成员储存128个主分割部和128个备份分割部。如果第三成员加入到聚簇,则成员将在彼此之间重新分配分割部,使得每个节点将储存85个分割部,节点之一储存86个。例如,新加入的成员节点能请求聚簇中的另外两个节点中的每一个传输43个分割部到新节点。替选地,另外两个节点可以确定新成员已经加入到聚簇并且独立地传输分割部到新节点。
这种使用分布式算法来分派分割部的自治且分离的方案提供许多优点,包括更好的扩缩性,消除单个失效点等。然而,也变得更难以实施复杂的分配策略,因为成员节点关于分割部转移作出独立决定。例如,可能期望根据更加动态和复杂的因素来分配分割部,诸如特定分割部可能会被多频繁地访问,特定成员节点上的当前处理负载和每个节点的CPU/存储器能力。此外,可能出于高可用性和失效转移的原因而期望以更复杂和优化的方式来协调主分割部和备份分割部的布置。
根据各种实施例,描述一种方案,其中各个分割部的转移被点对点地执行(作为发送节点和接收节点之间的直接但非同步通信的结果),但是允许单个协调点(分配协调器)。该单个协调点提供聚簇的全局状态,包括当前分配(数据拥有者)以及动态运行时反馈,诸如在给定时间点处聚簇中的每个节点上的处理负载。在单个点处具有系统的全局概观的能力允许比分布式算法的比较方案远更具表达性的分配逻辑。
根据一实施例,聚簇中的每个服务器节点不经常地将分配状态传输到分配协调器。分配协调器收集该信息并且周期性地(或者作为成员变动的结果)调用所配置的分配策略来分析该分配。此外,可以提供到可插入逻辑(策略)的接口,其提供到当前分配状态的策略访问,且被策略用于建议分割部在可用服务器节点之间的新分配(布置)。
根据一实施例,分配协调器将分配策略作出的建议收集到总分配计划或目标中。计划被传输到聚簇中的所有节点。之后,每个服务器开始各个分割部传输(数据移动)以实现新分配计划。
根据各种实施例,可扩展集中分配还能形成各种附加特征的基础。例如,适应性分配允许聚簇动态适应应用负载或数据分配的波动。此外,集中分配能对于WAN安全聚簇是有用的。
图1是根据本发明各种实施例的在聚簇中实施可扩展集中资源分配的图示。尽管该图描绘了逻辑分离的组件,但是这种绘示仅用于说明。本领域技术人员将意识到,此图中描绘的组件可以组合或划分为单独的软件、固件和/或硬件。此外,本领域技术人员将意识到,这些组件能在同一计算设备上运行或者能分布在通过一个或更多网络或其他通信手段连接的不同计算设备之间,而与这些组件如何组合或划分无关。
如图所示,聚簇包括多个节点(100、101、102、103),其储存遍布其分配的数据分割部(110、111、112、113、114、115、116)。聚簇中的节点之一100被指定为中央分配协调器104。根据一实施例,分配协调器周期性地基于多个因素重新评估分割部跨聚簇的分配(布置),并且确定是否需要对其进行改变。例如,分配协调器能根据每个节点上的当前请求负载,特定分割部可能被多频繁地访问和/或节点的CPU和存储器能力来评估分割部安置。类似地,中央分配协调器104能用于执行更复杂的主分割部相对于备份分割部的分配。例如,对于特定节点上的所有主分割部,分配协调器能确保与那些主分割部相关联的备份分割部不分配在大量节点上。通常优选的是,为了失效转移,备份分割部置于和与之相关联的主分割部不同的物理节点上。然而,当主分割部被更新时,其备份分割部也需要更新。这能导致显著数量的节点跳跃(jump),增加了聚簇中的网络流量。因此,有利的是限制备份分割部位于其上的节点数。中央分配协调器能强制执行该策略以及任何其他分割部布置策略。
根据一实施例,分配协调器104维护全局聚簇状态105的概观(view)。全局状态能包括如下信息,包括(但不限于)分割部在节点中的位置,每个节点上的处理负载,对每个分割部中储存的数据的可能需求,每个节点的CPU和/或存储器能力等。根据一实施例,分配协调器采用全局状态来周期性地(或者响应于节点成员变动)重新评估聚簇中的分割部分配。应注意,全局聚簇状态无需一定储存在分配协调器上,能替代地储存在聚簇的其他成员上以及远程储存在其他机器上。
根据一实施例,分配协调器104能调用可插入逻辑组件106以评估分割部分配。可插入逻辑器106能指定应用于聚簇的特定的定制分配策略。分配协调器能根据该策略评估分割部分配并且确定是否需要对其进行改变。
如果分配协调器104确定应对分割部分配作出改变,则它能产生分配计划107。该分配计划107然后能用于聚簇中的每个节点。根据一实施例,分配计划107能指定哪些分割部应位于哪个节点。一旦新分配计划可用,各节点能以分布式方式进行适当的分割部转移,如下面将描述的那样。
图2是根据本发明各种实施例的由聚簇中的节点实施的分配计划的图示。尽管该图描绘了逻辑分离的组件,但是这种绘示仅用于说明。本领域技术人员将意识到,此图中描绘的组件可以组合或划分为单独的软件、固件和/或硬件。此外,本领域技术人员将意识到,这些组件能在同一计算设备上运行或者能分布在通过一个或更多网络或其他通信手段连接的不同计算设备之间,而与这些组件如何组合或划分无关。
根据所示实施例,一旦分配协调器产生分配计划,它就能使分配计划可用于聚簇中的每个节点。然后节点可以根据分配计划独立执行转移分割部到正确节点所需的决定和步骤。以此方式,分配分割部的机构保留分布式算法,而分割部布置的决定和策略被集中作出。
如图所示,新分配计划107指定节点100应储存分割部110和112;节点101应储存分割部111;节点102应储存分割部113和114;节点103应储存分割部115和116。因为分割部112当前位于节点101上,所以节点100能检查新分配计划并从节点101请求分割部112。类似地,节点103能从节点102请求分割部115。根据替选实施例,节点101和102能在接收分配计划之后传输必要的分割部到节点100和103,而无需等候来自节点100和103的任何请求。
图3是根据本发明各种实施例的提供集中资源分配的过程的流程图。尽管该图为了说明而以特定顺序描绘了功能步骤,但是该过程不一定局限于该特定步骤顺序。本领域技术人员将意识到,此图描绘的各种步骤可以被改变,重新布置,并行执行或以各种方式变化。此外将理解,某些步骤或步骤序列能被添加或从该过程省略,而不偏离本发明的思想和范围。
如步骤300所示,计算机节点的聚簇将数据集储存为多个分割部。这些分割部分布在聚簇中的节点上。在步骤301,计算机节点之一被指定为中央分配协调器。根据一实施例,分配协调器收集指示聚簇的全局状态的数据,并且提供对全局状态的访问。如步骤302进一步所示,分配协调器周期性地分析聚簇的全局状态并且确定是否需要对分割部在聚簇的节点中的分配进行改变。替选地,分配协调器可响应于聚簇中的成员变动(而不是周期性地)来重新评估分割部分配。
如果分配协调器确定应进行改变,则它基于那些改变产生新的分配计划,并向聚簇中的所有节点提供对分配计划的访问,如步骤303所示。然后可以利用分布式算法进行各个分割部传输,如步骤304所示。换言之,每个节点能独立确定如何进行涉及其的各个分割部转移,以最优地实施新分配计划。
图4是根据本发明各种实施例的由分配协调器执行的过程的流程图。尽管该图为了说明而以特定顺序描绘了功能步骤,但是该过程不一定局限于该特定步骤顺序。本领域技术人员将意识到,此图描绘的各种步骤可以被改变,重新布置,并行执行或以各种方式变化。此外将理解,某些步骤或步骤序列能被添加或从该过程省略,而不偏离本发明的思想和范围。
根据所示实施例,过程始于步骤400。一旦开始,分配协调器就从聚簇中的每个节点持续接收运行时反馈和其他数据以汇编聚簇的全局状态(步骤401)。分配协调器能使用该全局状态来周期性地分析分割部在聚簇中的分配,如步骤402所示。如果无需改变(步骤403),则分配协调器能不执行动作,直到下一次需要评估分割部分配。另一方面,如果分配协调器确定应对分配进行改变,那么它能生成包括那些改变的新分配计划,如步骤404所示。在步骤405,分配协调器能向聚簇中的所有节点提供分配计划。
图5是根据本发明各种实施例的由聚簇中的节点执行的过程的流程图。尽管该图为了说明而以特定顺序描绘了功能步骤,但是该过程不一定局限于该特定步骤顺序。本领域技术人员将意识到,此图描绘的各种步骤可以被改变,重新布置,并行执行或以各种方式变化。此外将理解,某些步骤或步骤序列能被添加或从该过程省略,而不偏离本发明的思想和范围。
根据所示实施例,过程始于步骤500。一旦开始,每个节点能周期性地发送运行时反馈、负载统计和其他数据到分配协调器,如步骤501所示。步骤501还包括回到其本身的箭头,表示没有新计划生成的可能情况,成员简单地继续运行,周期性地收集和发送统计数据。
在步骤502,节点可以从分配协调器接收新分配计划。此时,节点可检查分配计划并确定该计划是否指定与该特定节点相关的改变(步骤503)。如果新计划不涉及该节点,则节点能不执行转移,并且能继续周期性地发送运行时反馈到分配协调器。另一方面,如果分配计划包括涉及该节点的分割部变动,则节点能根据分配计划从其他节点获得必要的分割部和/或提供必要的分割部到其他节点(步骤504)。
贯穿本公开描述的各种情境,本发明的实施例还涵盖计算机装置、计算系统和机器可读介质,其配置为执行前述系统和方法。除了包括具体设计的集成电路或其他电子电路的实施例之外,本发明可以利用常规通用或专用数字计算机或微处理器来便捷地实施,数字计算机或微处理器被根据本公开的技术编程,如计算机领域的技术人员将要意识到的那样。
总体上,本发明涉及提供可扩展集中动态资源分配的系统,该系统包括:用于储存分配在计算机节点的聚簇中的数据集的多个分割部的装置;用于指定所述计算机节点之一作为中央分配协调器的装置,该中央分配协调器收集指示所述聚簇的全局状态的信息并且提供对所述全局状态的访问;用于通过所述分配协调器来周期性分析所述聚簇的全局状态以确定是否应对所述分割部在所述计算机节点中的分配作出改变的装置;用于通过所述分配协调器基于对所述分割部的分配的改变产生新分配计划并且向所述计算机节点的聚簇中的所有计算机节点提供对所述分配计划的访问的装置;以及用于采用分布式算法由聚簇中的每个节点独立地确定如何执行与所述节点相关联的分割部的转移以实施所述新分配计划的装置。
在所述系统中,所述用于通过所述分配协调器周期性分析所述聚簇的全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变的装置进一步包括:用于由所述分配协调器调用可插入分配逻辑模块的装置,其中所述可插入分配逻辑模块能在运行时切换以调节用于在所述计算机节点的聚簇中分配所述分割部的算法。
在所述系统中,所述用于采用分布式算法的装置进一步包括:用于在两个计算机节点之间点对点地执行各个分割部的转移的装置,所述转移是发送节点和接收节点之间的直接非同步通信的结果,其中所述分配协调器不参与指引所述分割部转移。
在所述系统中,所述聚簇的全局状态包括指示所述分割部中的哪些被分配给所述聚簇中的各个计算机节点的信息。
在所述系统中,所述聚簇的全局状态包括指示聚簇中的每个计算机节点上的当前处理负载的信息,其中所述当前处理负载通过所述每个计算机节点周期性发送运行时反馈统计数据到所述分配协调器来确定。
在所述系统中,所述聚簇的全局状态包括指示聚簇中的每个计算机节点的存储器能力和处理器能力的信息。
在所述系统中,所述多个分割部进一步包括一组主分割部和一组备份分割部,其中所述分配协调器确保每个主分割部位于与该主分割部所关联的备份分割部不同的物理节点上。
在所述系统中,所述分配协调器产生的新分配计划实施下列限制:对于每个给定计算机节点,限制允许包含位于所述给定计算机节点上的主分割部所关联的备份分割部的计算机节点的数量。
在所述系统中,所述分配协调器为所述分割部在所述聚簇中的计算机节点中的分配提供单个协调点。
在所述系统中,所述新分配计划指明特定分割部应位于聚簇中的指定计算机节点上。
有经验的编程人员可以根据本公开的教导容易地准备适当的软件代码,如软件领域的技术人员将要意识到的那样。本发明还可以通过准备特定用途集成电路或者通过互连常规组件电路的适当网络来实施,如本领域技术人员将容易理解的那样。
各种实施例包括计算机程序产品,其是其上/其中储存有指令的储存介质,该指令可用于编程通用或专用计算处理器/设备以执行这里给出的任何特征。储存介质可包括但不限于下列中的一个或多个:任何类型的物理介质,包括软盘、光盘、DVD、CD-ROM、微驱动器、磁光盘、全息储存器、ROM、RAM、PRAMS、EPROM、EEPROM、DRAM、VRAM、闪存器、磁卡或光学卡、纳米系统(包括分子存储器IC);纸张或基于纸张的介质;以及适于储存指令和/或信息的任何类型的介质或设备。计算机程序产品可整体或部分地通过一个或多个公共和/或私有网络来传输,其中传输包括能由一个或多个处理器用于执行这里给出的任何特征的指令。传输可包括多个单独的传输。然而,根据某些实施例,含有指令的计算机储存介质不是临时性的(即,不是在正被传输的过程中),而是在物理设备上持续。
1.一种提供可扩展集中式动态资源分配的方法,该方法包括:
储存数据集的多个分割部,所述多个分割部分配在计算机节点的聚簇上;
指定所述计算机节点中的一个节点作为中央分配协调器,该中央分配协调器收集指示所述聚簇的全局状态的信息并且提供对所述全局状态的访问;
所述分配协调器周期性地分析所述聚簇的全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变;
所述分配协调器基于对所述分割部的分配的改变产生新分配计划,并且向所述计算机节点的聚簇中的所有计算机节点提供对所述分配计划的访问;以及
采用分布式算法来由所述聚簇中的每个节点独立地确定如何执行与所述节点相关联的各个分割部的转移以实施所述新分配计划。
2.根据项目1的方法,其中所述分配协调器周期性地分析所述聚簇的全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变进一步包括:
所述分配协调器调用可插入分配逻辑模块,其中所述可插入分配逻辑模块能在运行时被切换以调节用于在所述计算机节点的聚簇中分配所述分割部的算法。
3.根据项目1的方法,其中采用分布式算法进一步包括:
在两个计算机节点之间点对点地执行各个分割部的转移,所述转移是发送节点和接收节点之间的直接非同步通信的结果,其中所述分配协调器不参与指引所述分割部的转移。
4.根据项目1的方法,其中所述聚簇的全局状态包括指示所述分割部中的哪些被分配给所述聚簇中的各个计算机节点的信息。
5.根据项目1的方法,其中所述聚簇的全局状态包括指示所述聚簇中的每个计算机节点上的当前处理负载的信息,其中所述当前处理负载通过所述每个计算机节点周期性地发送运行时反馈统计数据到所述分配协调器来确定。
6.根据项目1的方法,其中所述聚簇的全局状态包括指示所述聚簇中的每个计算机节点的存储器能力和处理器能力的信息。
7.根据项目1的方法,其中所述多个分割部进一步包括一组主分割部和一组备份分割部,其中所述分配协调器确保每个主分割部位于与该主分割部所关联的备份分割部不同的物理节点上。
8.根据项目7的方法,其中所述分配协调器产生的新分配计划实施下列限制:
对于每个给定计算机节点,限制允许包含与位于所述给定计算机节点上的主分割部相关联的备份分割部的计算机节点的数量。
9.根据项目1的方法,其中所述分配协调器为所述分割部在所述聚簇中的计算机节点中的分配提供单个协调点。
10.根据项目1的方法,其中所述新分配计划指明特定分割部应位于所述聚簇中的指定计算机节点上。
11.一种用于提供可扩展集中式动态资源分配的系统,该系统包括:
计算机节点的聚簇,储存数据集的多个分割部,所述分割部分配在所述计算机节点的聚簇上;以及
选自所述计算机节点的分配协调器,所述分配协调器收集指示所述聚簇的全局状态的信息,周期性地分析所述全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变,根据所述改变产生新分配计划,以及向所述计算机节点的聚簇中的所有计算机节点提供对所述分配计划的访问;
其中所述计算机节点的聚簇采用分布式算法来由所述聚簇中的每个节点独立地确定如何执行与所述节点相关联的各个分割部的转移以实施所述分配协调器产生的新分配计划。
12.根据项目11的系统,其中所述分配协调器调用可插入分配逻辑模块以确定是否应进行所述改变,其中所述可插入分配逻辑模块能在运行时被切换以调节用于在所述计算机节点的聚簇中分配所述分割部的算法。
13.根据项目11的系统,其中所述计算机节点采用所述分布式算法进一步包括:
在两个计算机节点之间点对点地执行各个分割部的转移,所述转移是发送节点和接收节点之间的直接非同步通信的结果,其中所述分配协调器不参与指引所述分割部的转移。
14.根据项目11的系统,其中所述聚簇的全局状态包括指示所述分割部中的哪些被分配给所述聚簇中的各个计算机节点的信息。
15.根据项目11的系统,其中所述聚簇的全局状态包括指示所述聚簇中的每个计算机节点上的当前处理负载的信息,其中所述当前处理负载通过所述每个计算机节点周期性地传输运行时反馈统计数据到所述分配协调器来确定。
16.根据项目11的系统,其中所述聚簇的全局状态包括指示所述聚簇中的每个计算机节点的存储器能力和处理器能力的信息。
17.根据项目11的系统,其中所述多个分割部进一步包括一组主分割部和一组备份分割部,其中所述分配协调器确保每个主分割部位于与所述主分割部所关联的备份分割部不同的物理节点上。
18.根据项目17的系统,其中所述分配协调器产生的新分配计划实施下列限制:
对于每个给定计算机节点,限制允许包含与位于所述给定计算机节点上的主分割部相关联的备份分割部的计算机节点的数目。
19.根据项目11的系统,其中所述新分配计划指明特定分割部应位于所述聚簇中的指定计算机节点上。
20.一种非暂时性计算机可读储存介质,存储一个或多个指令序列,所述指令序列可由一个或多个处理器运行以执行一组步骤,所述步骤包括:
储存数据集的多个分割部,所述多个分割部分配在计算机节点的聚簇上;
指定所述计算机节点中的一个节点作为中央分配协调器,该中央分配协调器收集指示所述聚簇的全局状态的信息并且提供对所述全局状态的访问;
所述分配协调器周期性地分析所述聚簇的全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变;
所述分配协调器基于对所述分割部的分配的改变产生新分配计划,并且向所述计算机节点的聚簇中的所有计算机节点提供对所述分配计划的访问;以及
采用分布式算法来由所述聚簇中的每个节点独立地确定如何执行与所述节点相关联的各个分割部的转移以实施所述新分配计划。
21.一种用于提供可扩展集中式动态资源分配的系统,所述系统包括:
用于储存数据集的多个分割部的装置,所述多个分割部分配在计算机节点的聚簇上;
用于指定所述计算机节点中的一个节点作为中央分配协调器的装置,该中央分配协调器收集指示所述聚簇的全局状态的信息并且提供对所述全局状态的访问;
用于由所述分配协调器周期性地分析所述聚簇的全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变的装置;
用于由所述分配协调器基于对所述分割部的分配的改变产生新分配计划,并且向所述计算机节点的聚簇中的所有计算机节点提供对所述分配计划的访问的装置;以及
用于采用分布式算法来由所述聚簇中的每个节点独立地确定如何执行与所述节点相关联的各个分割部的转移以实施所述新分配计划的装置。
22.根据项目21的系统,其中用于由所述分配协调器周期性地分析所述聚簇的全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变的装置进一步包括:
用于由所述分配协调器调用可插入分配逻辑模块的装置,其中所述可插入分配逻辑模块能在运行时被切换以调节用于在所述计算机节点的聚簇中分配所述分割部的算法。
23.根据项目21的系统,其中用于采用分布式算法的装置进一步包括:
用于在两个计算机节点之间点对点地执行各个分割部的转移的装置,所述转移是发送节点和接收节点之间的直接非同步通信的结果,其中所述分配协调器不参与指引所述分割部的转移。
24.根据项目21的系统,其中所述聚簇的全局状态包括指示所述分割部中的哪些被分配给所述聚簇中的各个计算机节点的信息。
25.根据项目21的系统,其中所述聚簇的全局状态包括指示所述聚簇中的每个计算机节点上的当前处理负载的信息,其中所述当前处理负载通过所述每个计算机节点周期性地发送运行时反馈统计数据到所述分配协调器来确定。
26.根据项目21的系统,其中所述聚簇的全局状态包括指示所述聚簇中的每个计算机节点的存储器能力和处理器能力的信息。
27.根据项目21的系统,其中所述多个分割部进一步包括一组主分割部和一组备份分割部,其中所述分配协调器确保每个主分割部位于与该主分割部所关联的备份分割部不同的物理节点上。
28.根据项目27的系统,其中所述分配协调器产生的新分配计划实施下列限制:
对于每个给定计算机节点,限制允许包含与位于所述给定计算机节点上的主分割部相关联的备份分割部的计算机节点的数量。
29.根据项目21的系统,其中所述分配协调器为所述分割部在所述聚簇中的计算机节点中的分配提供单个协调点。
30.根据项目21的系统,其中所述新分配计划指明特定分割部应位于所述聚簇中的指定计算机节点上。
已经为了示范和说明而给出了前面对本发明的优选实施例的描述。其无意是详尽无遗的,也无意将本发明限制到所公开的精确形式。许多修改和变型对本领域技术人员而言是显而易见的。选择和描述了这些实施例是为了最佳地说明本发明的原理和其实际应用,由此使相关领域的技术人员能够理解本发明。本发明的范围旨在由所附权利要求及其等价物定义。

Claims (18)

1.一种计算机实施的用于提供可扩展集中式动态资源分配的方法,该方法包括:
储存数据集的多个分割部,所述多个分割部被分配在计算机节点的聚簇上;
指定所述计算机节点中的一个节点作为中央分配协调器,该中央分配协调器收集指示所述聚簇的全局状态的信息并且提供对所述全局状态的访问;
所述分配协调器周期性地分析所述聚簇的全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变;
所述分配协调器基于对所述分割部的分配的改变产生新分配计划,并且向所述计算机节点的聚簇中的所有计算机节点提供对所述分配计划的访问;以及
采用分布式算法来由所述聚簇中的每个节点独立地确定如何执行与所述节点相关联的各个分割部的转移以实施所述新分配计划。
2.根据权利要求1的方法,其中所述分配协调器周期性地分析所述全局状态以确定是否应对所述分割部的分配进行改变进一步包括:
所述分配协调器调用可插入分配逻辑模块,其中所述可插入分配逻辑模块能在运行时被切换以调节用于在所述计算机节点的聚簇中分配所述分割部的算法。
3.根据权利要求1或2的方法,其中采用分布式算法进一步包括:
在所述计算机节点的聚簇中的两个计算机节点之间点对点地执行各个分割部的转移,所述转移是发送节点和接收节点之间的直接非同步通信的结果,其中所述分配协调器不参与指引所述分割部的转移。
4.根据任一前述权利要求的方法,其中所述聚簇的全局状态包括指示所述分割部中的哪些被分配给所述聚簇中的各个计算机节点的信息。
5.根据任一前述权利要求的方法,其中所述聚簇的全局状态包括指示所述聚簇中的每个计算机节点上的当前处理负载的信息,其中所述当前处理负载通过所述每个计算机节点周期性地发送运行时反馈统计数据到所述分配协调器来确定。
6.根据任一前述权利要求的方法,其中所述聚簇的全局状态包括指示所述聚簇中的每个计算机节点的存储器能力和处理器能力的信息。
7.根据任一前述权利要求的方法,其中所述多个分割部进一步包括一组主分割部和一组备份分割部,其中所述分配协调器确保每个主分割部位于与该主分割部所关联的备份分割部不同的物理节点上。
8.根据项目7的方法,其中所述分配协调器产生的新分配计划实施下列限制:
对于每个给定计算机节点,允许有限数量的计算机节点包含与位于所述给定计算机节点上的主分割部相关联的备份分割部。
9.根据任一前述权利要求的方法,其中所述分配协调器为所述分割部在所述聚簇的计算机节点中的分配提供单个协调点。
10.根据任一前述权利要求的方法,其中所述新分配计划指明特定分割部应位于所述聚簇中的指定计算机节点上。
11.一种计算机程序,包括指令,所述指令在由一个或多个计算机运行时使所述一个或多个计算机执行任一前述权利要求的方法。
12.一种计算机可读介质,储存权利要求11的计算机程序。
13.一种装置,包括一个或多个计算机,所述一个或多个计算机配置成执行权利要求1至10中的任一项的方法的所有步骤。
14.一种用于提供可扩展集中式动态资源分配的系统,该系统包括:
计算机节点的聚簇,储存数据集的多个分割部,所述分割部分配在所述计算机节点的聚簇上;以及
选自所述计算机节点的分配协调器,所述分配协调器收集指示所述聚簇的全局状态的信息,周期性地分析所述全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变,根据所述改变产生新分配计划,以及向所述计算机节点的聚簇中的所有计算机节点提供对所述分配计划的访问;
其中所述计算机节点的聚簇采用分布式算法来由所述聚簇中的每个节点独立地确定如何执行与所述节点相关联的各个分割部的转移以实施所述分配协调器产生的新分配计划。
15.一种非暂时性计算机可读储存介质,储存一个或多个指令序列,所述指令序列由一个或多个处理器运行以执行一组步骤,所述步骤包括:
储存数据集的多个分割部,所述多个分割部被分配在计算机节点的聚簇上;
指定所述计算机节点中的一个节点作为中央分配协调器,该中央分配协调器收集指示所述聚簇的全局状态的信息并且提供对所述全局状态的访问;
所述分配协调器周期性地分析所述聚簇的全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变;
所述分配协调器基于对所述分割部的分配的改变产生新分配计划,并且向所述计算机节点的聚簇中的所有计算机节点提供对所述分配计划的访问;以及
采用分布式算法来由所述聚簇中的每个节点独立地确定如何执行与所述节点相关联的各个分割部的转移以实施所述新分配计划。
16.一种用于提供可扩展集中式动态资源分配的方法,该方法包括:
储存数据集的多个分割部,所述多个分割部被分配在计算机节点的聚簇上;
由分配协调器周期性地分析所述聚簇的全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变,所述分配协调器是所述计算机节点之一;
由所述分配协调器基于对所述分割部的分配的改变产生新分配计划,并且向所述计算机节点的聚簇中的所有计算机节点提供对所述分配计划的访问;以及
采用分布式算法来由所述聚簇中的每个节点独立地确定如何执行与所述节点相关联的各个分割部的转移以实施所述新分配计划。
17.一种非易失性计算机可读储存介质,储存一个或多个指令序列,所述指令序列由一个或多个处理器运行以执行一组步骤,所述步骤包括:
储存数据集的多个分割部,所述多个分割部被分配在计算机节点的聚簇上;
指定所述计算机节点中的一个节点作为中央分配协调器,该中央分配协调器收集指示所述聚簇的全局状态的信息并且提供对所述全局状态的访问;
所述分配协调器周期性地分析所述聚簇的全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变;
所述分配协调器基于对所述分割部的分配的改变产生新分配计划,并且向所述计算机节点的聚簇中的所有计算机节点提供对所述分配计划的访问;以及
采用分布式算法来由所述聚簇中的每个节点独立地确定如何执行与所述节点相关联的各个分割部的转移以实施所述新分配计划。
18.一种使处理器执行一组步骤的程序,所述步骤包括:
储存数据集的多个分割部,所述多个分割部被分配在计算机节点的聚簇上;
由分配协调器周期性地分析所述聚簇的全局状态以确定是否应对所述分割部在所述计算机节点中的分配进行改变,所述分配协调器是所述计算机节点之一;
由所述分配协调器基于对所述分割部的分配的改变产生新分配计划,并且向所述计算机节点的聚簇中的所有计算机节点提供对所述分配计划的访问;以及
采用分布式算法来由所述聚簇中的每个节点独立地确定如何执行与所述节点相关联的各个分割部的转移以实施所述新分配计划。
CN201280023355.1A 2011-05-16 2012-05-15 聚簇数据格网中的可扩展集中动态资源分配 Active CN103534687B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161486701P 2011-05-16 2011-05-16
US61/486,701 2011-05-16
US13/239,253 US9703610B2 (en) 2011-05-16 2011-09-21 Extensible centralized dynamic resource distribution in a clustered data grid
US13/239,253 2011-09-21
PCT/US2012/037997 WO2012158718A1 (en) 2011-05-16 2012-05-15 Extensible centralized dynamic resource distribution in a clustered data grid

Publications (2)

Publication Number Publication Date
CN103534687A true CN103534687A (zh) 2014-01-22
CN103534687B CN103534687B (zh) 2017-04-12

Family

ID=47175797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280023355.1A Active CN103534687B (zh) 2011-05-16 2012-05-15 聚簇数据格网中的可扩展集中动态资源分配

Country Status (5)

Country Link
US (1) US9703610B2 (zh)
EP (1) EP2710470B1 (zh)
JP (1) JP5998206B2 (zh)
CN (1) CN103534687B (zh)
WO (1) WO2012158718A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107005596A (zh) * 2014-12-19 2017-08-01 华为技术有限公司 用于在集群重新配置后的工作负载平衡的复制型数据库分配
CN107526533A (zh) * 2016-06-21 2017-12-29 伊姆西公司 存储管理方法及设备
CN108351881A (zh) * 2015-10-16 2018-07-31 谷歌有限责任公司 分布式最优化的系统和方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9262229B2 (en) 2011-01-28 2016-02-16 Oracle International Corporation System and method for supporting service level quorum in a data grid cluster
US20150169598A1 (en) * 2012-01-17 2015-06-18 Oracle International Corporation System and method for providing a persistent snapshot of a running system in a distributed data grid
US10394611B2 (en) 2012-11-26 2019-08-27 Amazon Technologies, Inc. Scaling computing clusters in a distributed computing system
US9607071B2 (en) * 2014-03-07 2017-03-28 Adobe Systems Incorporated Managing a distributed database across a plurality of clusters
US9448843B2 (en) 2014-03-26 2016-09-20 International Business Machines Corporation Allocating a global resource to consumers across different regions of a distributed grid environment based on use data and demand data of each consumer
US10250519B2 (en) * 2014-05-21 2019-04-02 Oracle International Corporation System and method for supporting a distributed data structure in a distributed data grid
US10664495B2 (en) 2014-09-25 2020-05-26 Oracle International Corporation System and method for supporting data grid snapshot and federation
US10860378B2 (en) 2015-07-01 2020-12-08 Oracle International Corporation System and method for association aware executor service in a distributed computing environment
US10585599B2 (en) 2015-07-01 2020-03-10 Oracle International Corporation System and method for distributed persistent store archival and retrieval in a distributed computing environment
US11163498B2 (en) 2015-07-01 2021-11-02 Oracle International Corporation System and method for rare copy-on-write in a distributed computing environment
US10798146B2 (en) 2015-07-01 2020-10-06 Oracle International Corporation System and method for universal timeout in a distributed computing environment
US10558637B2 (en) * 2015-12-17 2020-02-11 Sap Se Modularized data distribution plan generation
US11550820B2 (en) 2017-04-28 2023-01-10 Oracle International Corporation System and method for partition-scoped snapshot creation in a distributed data computing environment
US10769019B2 (en) 2017-07-19 2020-09-08 Oracle International Corporation System and method for data recovery in a distributed data computing environment implementing active persistence
US10862965B2 (en) 2017-10-01 2020-12-08 Oracle International Corporation System and method for topics implementation in a distributed data computing environment
CN109067649B (zh) * 2018-07-31 2021-06-22 平安科技(深圳)有限公司 节点处理方法及装置、存储介质和电子设备
CN110855737B (zh) * 2019-09-24 2020-11-06 中国科学院软件研究所 一种一致性级别可控的自适应数据同步方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080294646A1 (en) * 2007-05-24 2008-11-27 Via Technologies, Inc. Data distributing and accessing method and system
CN101442435A (zh) * 2008-12-25 2009-05-27 华为技术有限公司 分布式系统的业务数据管理方法、装置及分布式系统
CN102014137A (zh) * 2010-12-13 2011-04-13 哈尔滨工业大学 一种基于hla的通用分布式数据记录装置和方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7020697B1 (en) * 1999-10-01 2006-03-28 Accenture Llp Architectures for netcentric computing systems
US20020055972A1 (en) * 2000-05-08 2002-05-09 Weinman Joseph Bernard Dynamic content distribution and data continuity architecture
JP4087097B2 (ja) * 2001-11-12 2008-05-14 株式会社日立製作所 データベース管理システム情報を考慮したデータ再配置方法およびデータ再配置を行う計算機システム
US7080221B1 (en) * 2003-04-23 2006-07-18 Emc Corporation Method and apparatus for managing migration of data in a clustered computer system environment
US7698428B2 (en) * 2003-12-15 2010-04-13 International Business Machines Corporation Apparatus, system, and method for grid based data storage
JP4677412B2 (ja) * 2004-11-08 2011-04-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 複数のクライアントにまたがってデータをバックアップするための方法
US20060106782A1 (en) * 2004-11-17 2006-05-18 Steven Blumenau Systems and methods for searching digital assets using virtual folders having labels based on taxonomy tags
JP4670042B2 (ja) * 2005-01-13 2011-04-13 ブラザー工業株式会社 ノード装置、ノード装置情報更新方法、及びノード装置情報更新プログラム
US7941401B2 (en) * 2005-05-09 2011-05-10 Gemstone Systems, Inc. Distributed data management system
JP4757165B2 (ja) * 2006-10-04 2011-08-24 株式会社日立製作所 計算機システム、データ移行監視方法及びデータ移行監視プログラム
WO2008056507A1 (fr) * 2006-11-09 2008-05-15 Konica Minolta Holdings, Inc. Procédé de gestion d'informations et dispositif de traitement d'informations
US7779074B2 (en) * 2007-11-19 2010-08-17 Red Hat, Inc. Dynamic data partitioning of data across a cluster in a distributed-tree structure
US8103628B2 (en) * 2008-04-09 2012-01-24 Harmonic Inc. Directed placement of data in a redundant data storage system
JP2010277517A (ja) * 2009-06-01 2010-12-09 Ricoh Co Ltd ファイル管理サーバ、ファイル管理システム、ファイル管理プログラム、及びファイル管理方法
US8417899B2 (en) * 2010-01-21 2013-04-09 Oracle America, Inc. System and method for controlling access to shared storage device
US8818956B2 (en) * 2010-03-26 2014-08-26 Carbonite, Inc. Transfer of user data between logical data sites
EP2385680B1 (en) * 2010-05-06 2012-10-03 Voddler Sweden AB Content delivery over a peer-to-peer network
US20120254118A1 (en) * 2011-03-31 2012-10-04 Microsoft Corporation Recovery of tenant data across tenant moves

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080294646A1 (en) * 2007-05-24 2008-11-27 Via Technologies, Inc. Data distributing and accessing method and system
CN101442435A (zh) * 2008-12-25 2009-05-27 华为技术有限公司 分布式系统的业务数据管理方法、装置及分布式系统
CN102014137A (zh) * 2010-12-13 2011-04-13 哈尔滨工业大学 一种基于hla的通用分布式数据记录装置和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TENGJIAO WANG 等: "Dynamic Data Migration Policies for Query-Intensive Distributed Data Environments", 《ADVANCES IN DATA AND WEB MANAGEMENT: JOINT INTERNATIONAL CONFERENCES, APWEB/WAIM 2009, SUZHOU, CHINA, APRIL 2-4, 2009, PROCEEDINGS》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107005596A (zh) * 2014-12-19 2017-08-01 华为技术有限公司 用于在集群重新配置后的工作负载平衡的复制型数据库分配
CN108351881A (zh) * 2015-10-16 2018-07-31 谷歌有限责任公司 分布式最优化的系统和方法
US11120102B2 (en) 2015-10-16 2021-09-14 Google Llc Systems and methods of distributed optimization
CN107526533A (zh) * 2016-06-21 2017-12-29 伊姆西公司 存储管理方法及设备
CN107526533B (zh) * 2016-06-21 2020-08-11 伊姆西Ip控股有限责任公司 存储管理方法及设备

Also Published As

Publication number Publication date
CN103534687B (zh) 2017-04-12
JP5998206B2 (ja) 2016-09-28
US9703610B2 (en) 2017-07-11
US20120297056A1 (en) 2012-11-22
EP2710470B1 (en) 2016-12-21
EP2710470A1 (en) 2014-03-26
JP2014513852A (ja) 2014-06-05
WO2012158718A1 (en) 2012-11-22

Similar Documents

Publication Publication Date Title
CN103534687A (zh) 聚簇数据格网中的可扩展集中动态资源分配
CN109218355B (zh) 负载均衡引擎,客户端,分布式计算系统以及负载均衡方法
CN101014036B (zh) 用于节点簇的分散应用程序资源分配的方法与系统
US10333859B2 (en) Multi-tenant resource coordination method
KR101781063B1 (ko) 동적 자원 관리를 위한 2단계 자원 관리 방법 및 장치
US7647590B2 (en) Parallel computing system using coordinator and master nodes for load balancing and distributing work
CN102929707B (zh) 并行任务动态分配方法
US20080294872A1 (en) Defragmenting blocks in a clustered or distributed computing system
US20050071843A1 (en) Topology aware scheduling for a multiprocessor system
US20080229320A1 (en) Method, an apparatus and a system for controlling of parallel execution of services
US20070180451A1 (en) System and method for meta-scheduling
CN107864211B (zh) 集群资源调度方法及系统
CN103797462A (zh) 一种创建虚拟机的方法和装置
KR20160087706A (ko) 가상화 플랫폼을 고려한 분산 데이터 처리 시스템의 자원 할당 장치 및 할당 방법
CN107291536B (zh) 一种云计算环境下应用任务流调度方法
JP2008152618A (ja) ジョブ割当プログラム、方法及び装置
KR20130073449A (ko) 상호 의존 관계가 있는 컴포넌트 분배 및 관리 방법
CN104981781A (zh) 分布式计算架构
CN110914805A (zh) 用于分层任务调度的计算系统
CN111240824A (zh) 一种cpu资源调度方法及电子设备
JP5577745B2 (ja) クラスタシステム、プロセス配置方法、及びプログラム
CN103226480A (zh) 用于动态地重新配置多核系统的操作系统的设备和方法
KR100788328B1 (ko) 그리드 컴퓨팅을 이용한 미들웨어 시스템 및 그 동작 방법
US20100083034A1 (en) Information processing apparatus and configuration control method
CN111143035B (zh) Cpu资源的分配方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant