CN107329801A - 一种节点管理方法及装置、多子星服务器 - Google Patents

一种节点管理方法及装置、多子星服务器 Download PDF

Info

Publication number
CN107329801A
CN107329801A CN201710516808.9A CN201710516808A CN107329801A CN 107329801 A CN107329801 A CN 107329801A CN 201710516808 A CN201710516808 A CN 201710516808A CN 107329801 A CN107329801 A CN 107329801A
Authority
CN
China
Prior art keywords
nodes
node
storage medium
computing resource
resource utilization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710516808.9A
Other languages
English (en)
Other versions
CN107329801B (zh
Inventor
张国军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sangfor Technologies Co Ltd
Original Assignee
Sangfor Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sangfor Technologies Co Ltd filed Critical Sangfor Technologies Co Ltd
Priority to CN201710516808.9A priority Critical patent/CN107329801B/zh
Publication of CN107329801A publication Critical patent/CN107329801A/zh
Application granted granted Critical
Publication of CN107329801B publication Critical patent/CN107329801B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/161Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Power Sources (AREA)

Abstract

本发明实施例公开了一种节点管理方法及装置、多子星服务器、计算机装置、可读存储介质,用于根据业务需求适时调整节点的运行状态,以进行节能减排。本发明实施例方法包括:获取第一节点已使用的第一计算资源,第一节点为n个A节点和m个B节点中正在运行的节点,集群包括n个A节点和m个B节点,n、m为不小于1的整数;根据第一计算资源确定集群的资源使用率;判断资源使用率是否小于第一预设阈值;若是,则根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点;将由Ai节点对第一存储介质的控制切换为Bj节点,并将由Ai节点对第一存储介质的映射更新为Bj节点;向Ai节点发送关闭指令,以关闭Ai节点。

Description

一种节点管理方法及装置、多子星服务器
技术领域
本发明涉及通信技术领域,尤其涉及一种节点管理方法及装置、多子星服务器、计算机装置、可读存储介质。
背景技术
随着全球环境污染的日益严重化,节能减排不断地受到全世界的关注。全球每年都会召开各种各样的峰会商讨减少碳排放问题,很多国家(特别是欧洲发达国家)都定下了严格的减排目标,中国政府也非常重视节能减排,并在十三五目标里面定下了到2020年单位GDP二氧化碳减少40%到45%的目标,长远承诺在2030年减排65%的目标。作为电能消耗大户的IT界,也有责任和义务为节能减排作贡献。
一般而言,云是一个高度灵活、高度弹性的架构,且通常业务可以以虚拟机的形式在云里面运行。其中,在云的业务高峰期,需要的计算资源(CPU、内存)非常的多,而到了云的业务低谷期,需要的计算资源又会大幅下降。在实际应用中,如果是基于传统“服务器+交换+存储”构建的云,可以在业务低谷期通过虚拟机热迁移功能把所有虚拟机迁移到少数几台服务器上运行,把其他的服务器关闭,以达到节能减排的目的。
近几年,超融合架构由于其具备很好的弹性性能,与云的弹性需求不谋而合,在云里面得到广泛使用。然而,由于超融合架构是计算+存储的融合体,每个超融合节点都是一个存储节点,一关机则意味着数据无法访问,因而不能随意关机,从而将给节能减排造成极大的阻碍。
发明内容
本发明实施例提供了一种节点管理方法及装置、多子星服务器、计算机装置、可读存储介质,用于根据云环境中的业务需求适时调整节点的运行状态,以达到节能减排的目的。
本发明第一方面提供一种节点管理方法,应用于超融合集群,可包括:
获取第一节点已使用的第一计算资源,第一节点为n个A节点和m个B节点中正在运行的节点的集合,集群包括n个A节点和m个B节点,n、m为不小于1的整数;
根据第一计算资源确定集群的资源使用率;
判断资源使用率是否小于第一预设阈值;
若是,则根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点,第二节点为n个A节点和m个B节点中除Ai节点的节点,i为不大于n的正整数;
将由Ai节点对第一存储介质的控制切换为m个B节点中正在运行的Bj节点,并将由Ai节点对第一存储介质的映射更新为Bj节点,j为不大于m的正整数;
向Ai节点发送关闭指令,以关闭Ai节点。
进一步的,方法还包括:
获取第一节点的第二计算资源,第二计算资源为第一节点已使用与未使用的计算资源的总和;
根据第一计算资源确定集群的资源使用率包括:
根据第一计算资源和第二计算资源确定集群的资源使用率。
进一步的,在根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点之前,该方法还包括:
根据资源使用率确定计算资源缩减量;
根据计算资源缩减量从n个A节点中确定用于关闭的Ai节点;
将Ai节点上运行的虚拟机迁移至m个B节点中正在运行的Bj节点。
进一步的,方法还包括:
若资源使用率不小于第一预设阈值,则判断资源使用率是否大于第二预设阈值;
若是,则向n个A节点中的Ax节点发送开启指令,以开启Ax节点,x为不大于n的正整数;
将由m个B节点中的Bp节点对第二存储介质的控制切换为Ax节点,并将由Bp节点对第二存储介质的映射更新为Ax节点,p为不大于m的正整数。
进一步的,在向n个A节点中的Ax节点发送开启指令之前,方法还包括:
根据资源使用率确定计算资源增加量;
根据计算资源增加量从n个A节点中确定用于开启的Ax节点。
进一步的,在向n个A节点中的Ax节点发送开启指令之后,方法还包括:
将第三节点上运行的第二虚拟机迁移至Ax节点,所述第三节点为n个A节点、m个B节点中的节点。
本发明第二方面提供一种节点管理装置,应用于超融合集群,可包括:
第一获取单元,用于获取第一节点已使用的第一计算资源,第一节点为n个A节点和m个B节点中正在运行的节点的集合,集群包括n个A节点和m个B节点,n、m为不小于1的整数;
第一确定单元,用于根据第一计算资源确定集群的资源使用率;
判断单元,用于判断资源使用率是否小于第一预设阈值;
第一迁移单元,用于当资源使用率小于第一预设阈值时,则根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点,第二节点为n个A节点和m个B节点中除Ai节点的节点,i为不大于n的正整数;
第一切换单元,用于将由Ai节点对第一存储介质的控制切换为m个B节点中正在运行的Bj节点,j为不大于m的正整数;
第一更新单元,用于将由Ai节点对第一存储介质的映射更新为Bj节点,
第一发送单元,用于向Ai节点发送关闭指令,以关闭Ai节点。
进一步的,装置还包括:
第二获取单元,用于获取第一节点的第二计算资源,第二计算资源为第一节点已使用与未使用的计算资源的总和;
第一确定单元,具体用于:
根据第一计算资源和第二计算资源确定集群的资源使用率。
进一步的,装置还包括:
第二确定单元,用于根据资源使用率确定计算资源缩减量;
第三确定单元,用于根据计算资源缩减量从n个A节点中确定用于关闭的Ai节点。
进一步的,装置还包括:
第二判断单元,用于当资源使用率不小于第一预设阈值时,则判断资源使用率是否大于第二预设阈值;
第二发送单元,用于当资源使用率大于第二预设阈值时,则向n个A节点中的Ax节点发送开启指令,以开启Ax节点,x为不大于n的正整数;
第二切换单元,用于将由m个B节点中的Bp节点对第二存储介质的控制切换为Ax节点,p为不大于m的正整数;
第二更新单元,用于将由Bp节点对第二存储介质的映射更新为Ax节点。
进一步的,装置还包括:
第四确定单元,用于根据资源使用率确定计算资源增加量;
第五确定单元,用于根据计算资源增加量从n个A节点中确定用于开启的Ax节点。
进一步的,装置还包括:
第二迁移单元,用于将第三节点上运行的第二虚拟机迁移至Ax节点,第三节点为n个A节点、m个B节点中的节点。
本发明第三方面提供一种多子星服务器,应用于超融合集群,可包括:
n个A节点、m个B节点、IPMI接口,n、m为不小于1的整数;
n个A节点中Ai节点的第一存储介质分别与Ai节点的第一主板、m个B节点中Bj节点的第二主板连接,Bj节点的第二存储介质与第二主板连接,i为不大于n的正整数、j为不大于m的正整数;
Ai节点的第一电源分别与第一主板、第一存储介质连接,Bj节点的第二电源分别与第二主板、第一存储介质、第二存储介质连接;
IPMI接口用于监控n个A和m个B节点的运行状态。
进一步的,述Bj节点的第二存储介质与第二主板连接包括:
Bi节点的第二存储介质分别与第一主板、第二主板连接;
Ai节点的第一电源分别与第一主板、第一存储介质连接包括:
Ai节点的第一电源分别与第一主板、第一存储介质、第二存储介质连接。
进一步的,第一存储介质和第二存储介质包括至少两个连接端口。
进一步的,第一存储介质和第二存储介质为SAS盘。
进一步的,SAS盘包括SAS接口的HDD盘或SAS接口的SSD盘。
进一步的,n个A节点中的每一个由对应的一个第一电源进行供电,m个B节点中的每一个由对应的一个第二电源进行供电。
进一步的,当n、m大于1时,n个A节点中的每一个由对应的一个第一电源进行供电,m个B节点中的至少两个由一个第二电源进行供电。
本发明第四方面提供一种计算机装置,计算机装置包括处理器,处理器用于执行存储器中存储的计算机程序时,实现如下步骤:
获取第一节点已使用的第一计算资源,第一节点为n个A节点和m个B节点中正在运行的节点,集群包括n个A节点和m个B节点,n、m为不小于1的整数;
根据第一计算资源确定集群的资源使用率;
判断资源使用率是否小于第一预设阈值;
若是,则根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至m个B节点中正在运行的Bj节点,i为不大于n的正整数、j为不大于m的正整数;
将由Ai节点对第一存储介质的控制切换为Bj节点,并将由Ai节点对第一存储介质的映射更新为Bj节点;
向Ai节点发送关闭指令,以关闭Ai节点。
本发明第五方面提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,处理器,用于执行如下步骤:
获取第一节点已使用的第一计算资源,第一节点为n个A节点和m个B节点中正在运行的节点,集群包括n个A节点和m个B节点,n、m为不小于1的整数;
根据第一计算资源确定集群的资源使用率;
判断资源使用率是否小于第一预设阈值;
若是,则根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至m个B节点中正在运行的Bj节点,i为不大于n的正整数、j为不大于m的正整数;
将由Ai节点对第一存储介质的控制切换为Bj节点,并将由Ai节点对第一存储介质的映射更新为Bj节点;
向Ai节点发送关闭指令,以关闭Ai节点。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明提供了一种节点管理方法,通过确定集群的资源使用率,可以在资源使用率低于第一预设阈值时,将n个A节点中Ai节点的虚拟机进行位置的转移,并可以将Ai节点对第一存储介质的控制切换为m个B节点中Bj节点对第一存储介质的控制,还可以将Ai节点与第一存储介质的映射更新为Bj节点与第一存储介质的映射,由此,在Ai节点关闭后,第一存储介质上的数据仍能得到有效的访问,而同时由于Ai节点的关闭,可以达到节能减排的目的。
附图说明
图1为本发明实施例中多子星服务器的第一结构示意图;
图2为本发明实施例中多子星服务器的第二结构示意图;
图3为本发明实施例中多子星服务器的第三结构示意图;
图4为本发明实施例中节点管理方法一个实施例示意图;
图5为本发明实施例中超融合集群的分布示意图;
图6为本发明实施例中超融合集群的控制结构示意图;
图7为本发明实施例中节点管理方法另一实施例示意图;
图8为本发明实施例中节点管理装置一个实施例示意图;
图9为本发明实施例中节点管理装置另一实施例示意图。
具体实施方式
本发明实施例提供了一种节点管理方法及装置、多子星服务器、计算机装置、可读存储介质,用于根据云环境中的业务需求适时调整节点的运行状态,以达到节能减排的目的。
为了使本技术领域的人员更好地理解本发明方案,下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面先对本发明实施例中用于实现节点管理方法的多子星服务器进行具体说明,该多子星服务器可包括:
n个A节点、m个B节点、IPMI接口,n、m为不小于1的整数;
n个A节点中Ai节点的第一存储介质分别与Ai节点的第一主板、m个B节点中Bj节点的第二主板连接,Bj节点的第二存储介质与第二主板连接,i为不大于n的正整数、j为不大于m的正整数;
Ai节点的第一电源分别与第一主板、第一存储介质连接,Bj节点的第二电源分别与第二主板、第一存储介质、第二存储介质连接;
IPMI接口用于监控n个A和m个B节点的运行状态。
具体的,超融合集群可以包括至少一个多子星服务器,多子星服务器是服务器的一种,指在一个服务器硬件盒子里面继承了若干个节点,每个节点都是独立工作,相当于一个独立的服务器,根据在一个服务器硬件盒子里面的节点数,可以分为双子星(2节点)、三子星(3节点)、四子星(4节点)、六子星(6节点)等类型。
其中,一个多子星服务器里面可以包括n个A节点和m个B节点,n、m可以为不小于1的整数,即意味着包括至少一个A节点和至少一个B节点,例如,当n、m为1时,该多子星服务器可以包括A1节点和B1节点,为双子星服务器,当n为2、m为1时,该多子星服务器可以包括A1、A2、B1节点,为三子星服务器,当n为2、m为2时,该多子星服务器可以包括A1、A2、B1、B2节点,为四子星服务器,以此类推,多子星服务器可以包括更多的节点。
进一步的,每一个节点都有对应的存储介质以及对应的主板,在n个A节点中,n个A节点中Ai节点的第一存储介质可以分别与Ai节点的第一主板、m个B节点中Bj节点的第二主板连接,由此第一存储介质可以被Ai节点、Bj节点控制。然而,由于Ai节点的第一存储介质可以由Bj节点控制,而在相应的两个A节点和B节点中,需要保证其中一个节点的持续开启,那么Bj节点中的第二存储介质可以只与Bj节点的第二主板连接,由此第二存储介质可以被Bj节点控制。同时,每一个节点都可以由对应的电源进行供电,以保证正常的运行,在n个A节点中,Ai节点的第一电源可以与其第一主板连接,以给第一主板供电,在m个B节点中,Bj节点的第二电源可以与其第二主板连接,以给第二主板供电,由此通过IPMI接口监控n个A和m个B节点的运行状态,可以关闭相应的节点,从而可以切断第一电源或第二电源对第一主板或第二主板的供电,以减少相应节点的主板的计算资源的使用。
再进一步的,为了保证相应的节点关闭后,该关闭的节点的存储介质中的数据仍可以访问,Ai节点的第一电源可以与第一主板、第一存储介质连接,Bj节点的第二电源分别与第二主板、第一存储介质、第二存储介质连接,由此可知,第一存储介质可以至少被两个节点对应的电源同时供电,那么在Ai节点关闭时,仍可以由对应的Bj节点的电源进行正常供电。
可以理解的是,本实施例中的n个A节点和m个B节点并不指代具体的节点,只是为了本文的描述方便而示意说明的一个称谓,例如,n为1、m为1时,包括A1节点、B1节点,A1节点可以为第1个节点,也可以为第2个节点,n为2、m为2时,包括A1、A2、B1、B2节点,A1节点可以为第1个节点,也可以为第4个节点,即具体的n个A节点、m个B节点在服务器硬件盒子里面的排列顺序不做限定性要求。
由此可知,通过上述描述可知,由于n个A节点中Ai节点的第一存储介质均与m个B节点中对应的Bj节点的第二电源、第二主板连接,那么关闭n个A中的任一个节点后,关闭的节点的第一存储介质仍可以由m个B节点对应的节点进行相应的控制,并能够得到正常的供电,在节能减排的同时,不会阻断对关闭的n个A中的任一个节点的第一存储介质的数据的访问。
基于上述说明的结构,为了利于n个A、m个B节点中的任一个节点关闭后,其控制的存储介质仍能得到正常的访问,或避免m个B节点中的任一个的电源发生故障而阻碍该节点的第二存储介质的正常访问,可选的,本实施例中,m个B节点中Bj节点的第二存储介质可以分别与第一主板、第二主板连接,同时,Ai节点的第一电源分别与第一主板、第一存储介质、第二存储介质连接。由此可知,Bj节点的第二存储介质也可以由Ai节点进行控制,并由Ai节点的第一电源进行供电。可以理解的是,本实施例中的Ai、Bj节点分别指的是n个A、m个B节点中的某一个节点,如A2节点、B3节点。
进一步的,本实施例中的第一存储介质和第二存储介质可以包括至少两个连接端口,以第一介质为例进行说明,若第一存储介质包括至少两个端口,则第一存储介质可以与至少两个节点的主板进行连接,即第一存储介质除了与控制其的Ai节点的第一主板进行连接,还可以与m个B节点中的至少两个节点对应的第二主板进行连接。
在实际应用中,假设n个A系列节点为可用于关闭或开启的节点,m个B系列节点是保持开启的节点,可选的,为了不导致m个B中相应节点对第一存储介质的控制的逻辑混乱,本实施例中,n和m数值相同,即多子星服务器中的节点数为双数。同时,每一个节点中的存储介质可以包括两个连接端口,即一个A节点与一个B节点相互配合,共享对第一存储介质、第二存储介质的控制,从而一个多子星服务器中在任何时刻都至少有一个节点处于运行状态,则可以保证所有的存储资源在任意时刻都是可以被访问的。
可选的,本实施例中,第一存储介质和第二存储介质可以为SAS盘,SAS盘有2个连接端口,可以连接到2个节点,默认情况下可以由其中一个节点控制,也可以切换为另一节点进行控制。其中,SAS盘可以包括SAS接口的HDD盘或SAS接口的SSD盘,以保证双连接端口的应用。
本实施例中,以多子星服务器为2个节点为例进行说明,如图1所示,A(即A1)、B(即B1)两个节点独立供电,A节点和B节点中分别包括两个SAS盘,所有的SAS盘通过与主板上的诸如HBA卡连接都可以被A、B两个节点控制,并由A、B两个节点的电源同时供电,以保证A、B节点中任一个节点关闭时,所有的SAS盘都能正常供电。其中,当A、B节点都开启时,一半的SAS盘归A节点控制,一半的SAS盘归B节点控制,当A节点关闭后,A节点控制的SAS盘转交给B节点控制,而当A节点重新开启后,这些SAS盘都可以重新再转交给A节点控制。其中,为了利于对节点的控制,可选的,当多子星服务器中的节点数大于2时,可以采用多个双子星的结构。
本实施例中多子星服务器有两种电源设计方式,下面进行具体说明:
1、无论节点数为多少,每一个节点都可以进行独立供电,即n个A节点中的每一个由对应的一个第一电源进行供电,m个B节点中的每一个由对应的一个第二电源进行供电。例如,如图2所示,假设多子星服务器为4个节点,四子星服务器采用了2个双子星的结构,且4个节点都有自己独立的电源,四个节点之间可以实现独立供电。
2、由于n个A系列节点为可用于关闭或开启的节点,m个B系列节点为保持开启的节点,那么意味着m个B系列节点中相应节点对应的第二电源将保持供电,但n个A系列节点中相应节点对应的第一电源将不定时断电,则当n、m大于1时,n个A节点中的每一个可以由对应的一个第一电源进行供电,m个B节点中的至少两个可以由一个第二电源进行供电,即保持开启的至少两个节点之间可以实现电源的共享,以减少电源的使用,降低硬件成本。如图3所示,假设多子星服务器为4个节点,四子星服务器采用了2个双子星的结构,那么A1、A2节点可以分别有自己的独立电源,B1、B2节点则可以共用电源,从而无论是关闭A1节点还是A2节点的情况,即使B1、B2节点共用一个电源,也可以保持对A1、A2节点中的第一存储介质的供电。需要说明的是,本实施例中,当m个B节点中的多个节点共用电源时,共用电源的节点数、共用电源的节点的顺序不做限定。
可以理解的是,本实施例中,可选的,无论是独立的电源还是共用的电源,都可以有备用电源,以在电源发生故障时,可以通过备用电源进行供电,有利于防患于未然,具体此处不做限定。
基于上述对多子星服务器的结构说明,下面对超融合集群中的节点的运行状态进行适时的调整进行具体的说明:
请参阅图4,本发明实施例中节点管理方法一个实施例包括:
401、获取第一节点已使用的第一计算资源;
本实施例中,超融合集群可以包括至少一个多子星服务器,每一个多子星服务器可以包括至少两个节点,由于多子星服务器是在一个服务器硬件盒子里面集成若干个节点,那么说明超融合集群可以包括至少两个节点。
具体的,超融合集群可以包括n个A节点和m个B节点,n、m为不小于1的整数,即整个集群由A1、B1、A2、B2至An、Bm等n+m个节点组成,其中,n个A系列为可以根据云环境的业务高峰期和业务低谷期随时关闭或开启的节点,m个B系列节点。本实施例中,以多子星服务器的节点数为双数进行说明,即m与n相等,如图5所示,超融合集群可以包括多个多子星服务器。可以理解的是,图5所示的一个多子星服务器中节点的命名和上述图2、图3说明的多子星服务器的命名不一致,图5所示可以认为是一个具有2n个节点数,且采用n个双子星的结构的2n子星服务器。需要说明的是,在超融合集群中,n个A节点和m个B可以不对应排列,如一个双子星服务器中可以为A1、B2节点,图5所示仅为举例说明。
在实际应用中,如图6所示,所有节点的IPMI接口可以通过一个交换机连接起来,以便通过网络远程控制节点的关闭或开启,尤其是对n个A系列节点的控制。
在超融合集群中,当业务以虚拟机的形式在云里面运行时,分有业务高峰期和业务低谷期。其中,业务高峰期需要的计算资源较多,而业务低谷期需要的计算资源较少,因此,需要根据业务需要的计算资源进行相应节点的关闭,以达到节能减排的目的。
由于n个A系列节点为可以根据云环境的业务高峰期和业务低谷期随时关闭或开启的节点,那么在n个A节点中可以存在部分处于关闭状态的节点,则可以从n个A节点和m个B节点中确定正在运行的节点的集合为第一节点,并可以获取第一节点中的每一个已使用的计算资源,第一节点中的每一个已使用的计算资源的总和即为第一计算资源。
本实施例中,第一计算资源可以包括但不限于第一节点的CPU、内存使用情况。
402、根据第一计算资源确定集群的资源使用率;
本实施例中,获取第一节点已使用的第一计算资源后,可以根据第一计算资源确定集群的资源使用率。
本实施例中,根据第一计算资源确定集群的资源使用率的具体方式可以为:
获取第一节点的第二计算资源,第二计算资源为第一节点已使用与未使用的计算资源的总和;
根据第一计算资源和第二计算资源确定集群的资源使用率。
具体的,获取第一计算资源后,可以根据第一计算资源,还可以获取第二节点的第二计算资源,该第二计算资源为第一节点已使用与未使用的计算资源的总和,即第一节点的配置的计算资源的总和,而后可以按照预设方式确定集群的资源使用率。
例如,假设n、m均为3,第一节点可以包括A1、A2、B1、B2、B3节点,获取A1、A2、B1、B2、B3节点的第一计算资源以及第二计算资源后,可以按照“资源使用率=第一计算资源/第二计算资源”的计算方式得到集群的资源使用率。需要说明的是,本实施例中资源使用率的确定方式除了上述说明的内容,在实际应用中,还可以采用其它方式,如第一计算资源与2倍第二计算资源的比值,具体此处不做限定。
可以理解的是,本实施例中根据第一计算资源确定集群的资源使用率的具体方式除了上述说明的内容,在实际应用中,还可以采用其它的方式,只要能够确定集群的资源使用率即可,具体此处不做限定。
403、判断资源使用率是否小于第一预设阈值,若是,则执行步骤404,若否,则执行步骤407;
本实施例中,根据第一计算资源确定集群的资源使用率后,可以判断该资源使用率是否小于第一预设阈值。
具体的,可以预先设置第一预设阈值,如60%,并可以将第一预设阈值作为是否关闭相应节点的标准,即若资源使用率不小于60%,则可以认为集群的计算资源得到了有效利用,不需要进行相应节点的关闭,反之,则可以认为云环境中的业务处于低谷期,集群的计算资源过于空闲,并未得到有效利用,需要进行相应节点的关闭,以达到节能减排的目的。
404、根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点;
本实施例中,若判断资源使用率小于第一预设阈值,则可以根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点。其中,第二节点为n个A节点和m个B节点中除Ai节点的节点,i为不大于n的正整数。
具体的,当资源使用率小于第一预设阈值时,可以从n个A节点中确定可以关闭的节点,并可以从可以关闭的节点中确定用于关闭的Ai节点,确定Ai节点后,可以将在Ai节点上运行的第一虚拟机迁移至第二节点,即n个A节点和m个B节点中除Ai节点的节点。
例如,沿用步骤402说明的内容,假设n、m均为3,第一节点可以包括A1、A2、B1、B2、B3节点,那么可以确定A1、A2节点可以被关闭,则可以进一步从A1、A2节点中确定其中一个节点关闭,还是两个节点都关闭,以使得在相应的节点关闭后,资源使用率可以不小于第一预设阈值。若确定关闭A1节点即可,则可以将A1节点上运行的第一虚拟机迁移至A2、B1、B2、B3节点中的至少一个节点。以使得第一虚拟机可以通过第一节点中除A1节点以外的节点进行相应业务的开展。
405、将由Ai节点对第一存储介质的控制切换为m个B节点中正在运行的Bj节点,并将由Ai节点对第一存储介质的映射更新为Bj节点;
本实施例中,根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点后,可以将由Ai节点对第一存储介质的控制切换为m个B节点中正在运行的Bj节点,并将由Ai节点对第一存储介质的映射更新为Bj节点。其中,j为不大于m的正整数。
具体的,数据在超融合集群中的存储可以采用分布式存储,即存储对象在被切成指定大小的数据块存储到不同节点的不同存储介质(如硬盘),为了保证能够正常寻找到保存的数据块,每个数据块都要记录一条元数据信息,元数据记录中,“数据块”字段由偏移和长度组成,指明了这个数据在存储对象中的偏移位置和数据的长度。在数据块保存到不同节点的不同硬盘上后,必须要能够指明数据块在硬盘的位置,才能够正常寻址到这个数据块。一般来说,对数据块物理存储位置的寻址由“硬盘标识”和“硬盘位置”组成,硬盘标识是一个硬盘的唯一标识,一个硬盘在与相应的节点建立映射关系后,通过查询该硬盘的标识,即可知道该硬盘位于哪个节点。如表1和表2所示,超融合集群的管理服务器可以设有两个数据结构:分布式存储元数据和硬盘映射表,由此可以实现对相应硬盘的数据的访问。
表1
存储对象 数据块 硬盘标识 硬盘位置
表2
硬盘标识 所属节点
本实施例中,为了Ai节点关闭后,仍可以通过Bj节点访问第一存储介质中的数据,超融合集群的管理服务器可以向Ai节点发送指令,以使得Ai节点可以放弃对第一存储介质的控制,然后可以向Bj节点发送指令,以使得Bj节点可以接管Ai的第一存储介质,从而可以将Ai节点对第一存储介质的控制切换为Bj节点对第一存储介质的控制。在实际应用中,Ai、Bi节点位于同一个多子星服务器中,Ai节点为正在运行的节点,Ai节点的第一存储介质可以与Bj节点的第二主板、第二电源进行连接,由此Bj节点的运行可以实现对第一存储介质的控制以及供电。可以理解的是,本实施例中的Ai、Bj节点在排序上不做限定。
同时,超融合集群的管理服务器可以修改第一存储介质的映射关系,即当Ai节点控制第一存储介质时,Ai节点与第一存储介质中间可以建立映射关系,而当Bj节点控制第一存储介质后,可以将Ai节点的第一存储介质映射到Bj节点,即更新为Bj节点与第一存储介质中间建立映射关系。
406、向Ai节点发送关闭指令,以关闭Ai节点;
本实施例中,将由Ai节点对第一存储介质的控制切换为Bj节点,并将由Ai节点对第一存储介质的映射更新为Bj节点后,可以向Ai节点发送关闭指令,以关闭Ai节点。
具体的,由于第一虚拟机进行了热迁移,第一存储介质也由Bj节点控制,并由Bj节点的电源供电,那么超融合集群的管理服务器可以向Ai节点发送关闭指令,以使得Ai节点接收到关闭指令后,可以通过IPMI接口进行关机操作,达到关闭Ai节点的目的。
进一步的,沿用步骤405说明的内容,通过分布式存储元数据可以确定存储对象的数据块对应的硬盘标识以及硬盘位置,通过硬盘映射表可以确定访问硬盘的所属节点,那么通过上述的关系,在Ai节点关闭后,相应虚拟机仍要访问第一存储介质上的数据时,通过查询硬盘映射表,获取到对应的Bj节点后,可以向该Bj节点发送IO指令,对该第一存储介质(如硬盘)的“硬盘位置”字段制定的地址进行IO。由此可知,Ai节点的关闭,不会影响Ai节点原来控制的第一存储介质的数据的访问,且能达到节能减排的作用。
407、结束流程。
本实施例中,若判断资源使用率不小于第一预设阈值,则意味着集群的计算资源没有过于空闲,没必要进行相应节点的关闭,那么可以不执行其它操作,即结束流程。
可以理解的是,在实际应用中,为了满足业务的需求,如业务高峰期,可以进一步判断资源使用率,以确定是否需要进行计算资源的增加,具体此处不做限定。
本实施例中,通过确定集群的资源使用率,可以在资源使用率低于第一预设阈值时,将n个A节点中Ai节点的虚拟机进行位置的转移,并可以将Ai节点对第一存储介质的控制切换为m个B节点中Bj节点对第一存储介质的控制,还可以将Ai节点与第一存储介质的映射更新为Bj节点与第一存储介质的映射,由此,在Ai节点关闭后,第一存储介质上的数据仍能得到有效的访问,而同时由于Ai节点的关闭,可以达到节能减排的目的。
可以理解的是,在实际应用中,除了业务低谷期,也会存在业务高峰期,业务高峰期相对于业务低谷期的计算资源要多,那么为了满足业务需求,也可以对业务高峰期进行相应节点的开启,以增加计算资源,下面进行具体说明:
请参阅图7,本发明实施例中节点管理方法另一实施例包括:
本实施例中的步骤701至步骤703与步骤401至步骤403相同,此处不再赘述。
704、根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点;
基于图4所示实施例中步骤404说明的内容,本实施例中,在根据资源使用率,将n个A节点中Ai节点上运行的虚拟机迁移至第二节点之前,可以先确定Ai节点,确定Ai节点的具体方式可以为:
根据资源使用率确定计算资源缩减量;
根据计算资源缩减量从n个A节点中确定用于关闭的Ai节点;
将Ai节点上运行的虚拟机迁移至m个B节点中正在运行的Bj节点。
例如,假设资源使用率为50%,第一预设阈值为60%,可以确定集群的计算资源没有得到有效利用,那么应该缩减计算资源,则可以以60%为基准,根据资源使用率确定计算资源缩减量。假设假设n、m均为3,第一节点可以包括A1、A2、B1、B2、B3节点,其中,A1、A2、B1、B2、B3节点中的每一个已使用与未使用的计算资源分别为10份,A1、A2、B1、B2、B3节点中的每一个已使用的计算资源分别为2份、5份、5份、7份、5份,若要使得资源使用率不小于60%,则第一计算资源至少要为第二计算资源的60%,由于节点的关闭,并不会影响相应存储介质的数据的访问,由此第一计算资源不会相应减少,则可以通过减少第二计算资源来确定计算资源缩减量,通过计算,可以确定计算资源缩减量至少要为8.33份,那么关闭A1、A2其中一个节点即可。可以理解的是,在实际应用中,可以通过排列顺序轮流关闭A1、A2节点中的一个节点,还可以采用其它方式关闭其中的一个节点,只要能够使得计算资源使用率不小于第一预设阈值即可,具体此处不做限定。
本实施例中的步骤705至步骤706与图4所示实施例中的步骤405至步骤406相同,此处不再赘述。
707、判断资源使用率是否大于第二预设阈值,若是,则执行步骤708,若否,则执行步骤710;
本实施例中,若资源使用率不小于第一预设阈值,则可以进一步判断资源使用率是否大于第二预设阈值;
具体的,可以预先设置第二预设阈值,如90%,并可以将第二预设阈值作为是否开启相应节点的标准,即若资源使用率大于90%,则可以认为云环境中的业务处于高峰期,集群的计算资源过于繁忙,较难满足业务需求,需要进行相应节点的开启,以达到满足业务需求的目的反之,则可以认为集群的计算资源使用适中,不需要进行相应节点的开启。
708、向n个A节点中的Ax节点发送开启指令,以开启Ax节点;
本实施例中,若判断资源使用率大于第一预设阈值,则可以向n个A节点中的Ax节点发送开启指令,以开启Ax节点。其中,x为不大于n的正整数
具体的,当资源使用率大于第二预设阈值时,可以从n个A节点中确定可以开启的节点,并可以从可以开启的节点中确定用于开启的Ax节点,确定Ax节点后,可以向Ax节点发送开启指令。
例如,假设n、m均为3,第一节点可以包括A1、B1、B2、B3节点,那么可以确定A2、A3节点可以被关闭,则可以进一步从A2、A3节点中确定其中一个节点关闭,还是两个节点都开启,以使得在相应的节点开启后,资源使用率可以不大于第二预设阈值。若确定开启A2节点即可,则可以向A2节点发送开启指令。以开启A2节点。
本实施例中,确定Ax节点的具体方式可以为:
根据资源使用率确定计算资源增加量;
根据计算资源增加量从n个A节点中确定用于开启的Ax节点。
例如,假设资源使用率为95%,第二预设阈值为90%,可以确定集群的计算资源过于繁忙,那么应该增加计算资源,则可以以90%为基准,根据资源使用率确定计算资源增加量。沿用上述说明,若A1、B1、B2、B3节点中的每一个已使用与未使用的计算资源分别为10份,A1、B1、B2、B3节点中的每一个已使用的计算资源分别为8份、7份、7份、8份、8份,若要使得资源使用率不大于90%,则第一计算资源至少要不大于第二计算资源的90%,由于节点的开启,并不会影响相应存储介质的数据的访问,由此第一计算资源不会相应减少,则可以通过增加第二计算资源来确定计算资源增加量,通过计算,可以确定计算资源增加量至少要为2.22份,那么开启A2、A3其中一个节点即可。可以理解的是,在实际应用中,可以通过排列顺序轮流关闭A2、A3节点中的一个节点,还可以采用其它方式开启其中的一个节点,只要能够使得计算资源使用率不小于第一预设阈值即可,具体此处不做限定。
可以理解的是,本实施例中,当资源使用率低于第一预设阈值时,也可以关闭多个相应节点,以提高资源使用率,当资源使用率高于第二预设阈值时,也可以开启多个相应节点,以降低相应节点的计算资源的占用,减轻相应节点的计算负载,优选的,无论是资源使用率低于第一预设阈值,还是高于第二预设阈值,在关闭或开启相应节点时,均可以使得资源使用率位于第一预设阈值与第二预设阈值范围内,以达到满足业务需求的同时还能节能减排的目的,具体此处不做限定。
709、将由m个B节点中的Bp节点对第二存储介质的控制切换为Ax节点,并将由Bp节点对第二存储介质的映射更新为Ax节点;
本实施例中,向n个A节点中的Ax节点发送开启指令,以开启Ax节点后,可以将由m个B节点中的Bp节点对第二存储介质的控制切换为Ax节点,并将由Bp节点对第二存储介质的映射更新为Ax节点。其中,p为不大于m的正整数。
具体的,Ax开启后,可以重新归入第一节点,为了可以通过Ax节点访问第一存储介质中的数据,超融合集群的管理服务器可以向Bp节点发送指令,以使得Bp节点可以放弃对原来由Ax节点控制的第一存储介质的控制,然后可以向Ax节点发送指令,以使得Ax节点可以重新接管第一存储介质,从而可以将Bp节点对第一存储介质的控制切换为Ax节点对第一存储介质的控制。在实际应用中,Ax、Bp节点位于同一个多子星服务器中,Ax节点为正在运行的节点,Ax节点的第一存储介质可以与Bp节点的第二主板、第二电源进行连接,由此Bp节点的运行可以实现对第一存储介质的控制以及供电。可以理解的是,本实施例中的Ax、Bp节点在排序上不做限定。
同时,超融合集群的管理服务器可以修改第一存储介质的映射关系,即当Bp节点控制第一存储介质时,Bp节点与第一存储介质中间可以建立映射关系,而当Ax节点重新控制第一存储介质后,可以将Bp节点的第一存储介质映射到Ax节点,即更新为Ax节点与第一存储介质中间建立映射关系。
由此可知,在Ax节点开启后,相应虚拟机需要访问第一存储介质上的数据时,通过查询硬盘映射表以及分布式存储元数据,可以获取到对应的Ax节点,并可以向该Ax节点而非Bp发送IO指令,对该第一存储介质(如硬盘)的“硬盘位置”字段制定的地址进行IO。由此可知,Ai节点的开启,不会影响对第一存储介质的数据的访问,并可以通过增加Ai节点的计算资源,有利于改变计算资源过于繁忙的状态,以满足业务需求。
进一步的,本实施例中,在Ax节点开启后,为了减少第三节点上的第二虚拟机对第三节点的计算资源的占用,可以将第三节点上运行的第二虚拟机迁移至Ax节点,第三节点可以为n个A节点、m个B节点中的至少一个节点,从而可以有效缓解第三节点的计算资源的使用,又不会影响第二虚拟机的运行。
本实施例中,第二虚拟机可以包括由原来从Ax节点上迁移至Bp节点的虚拟机,也可以包括需要访问第一存储介质的虚拟机,具体此处不做限定。
710、结束流程。
本实施例中,若判断资源使用率不大于第一预设阈值,则意味着集群的计算资源使用适中,没必要进行相应节点的关闭或关闭,那么可以不执行其它操作,即结束流程。
可以理解的是,本实施例中,当第一节点为多个时,也可以对单个节点的资源使用率进行计算,如确定单个节点已使用的计算资源后,可以利用该计算资源判断单个节点的资源使用率是否过于空闲或过于繁忙,以能够单独用于对单个节点的虚拟机进行相应的转移,对第一存储介质的控制进行切换,以及对第一存储介质的映射关系进行更新。
面对本发明实施例中的节点管理方法进行了描述,下面分别对本发明实施例中的节点管理装置进行描述,该节点管理装置应用于超融合集群,请参阅图8,本发明实施例中节点管理装置一个实施例包括:
第一获取单元801,用于获取第一节点已使用的第一计算资源,第一节点为n个A节点和m个B节点中正在运行的节点的集合,集群包括n个A节点和m个B节点,n、m为不小于1的整数;
第一确定单元802,用于根据第一计算资源确定集群的资源使用率;
判断单元803,用于判断资源使用率是否小于第一预设阈值;
第一迁移单元804,用于当资源使用率小于第一预设阈值时,则根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点,第二节点为n个A节点和m个B节点中除Ai节点的节点,i为不大于n的正整数;
第一切换单元805,用于将由Ai节点对第一存储介质的控制切换为Bj节点,j为不大于m的正整数;
第一更新单元806,用于将由Ai节点对第一存储介质的映射更新为m个B节点中正在运行的Bj节点,
第一发送单元807,用于向Ai节点发送关闭指令,以关闭Ai节点。
请参阅图9,本发明实施例中节点管理装置另一实施例包括:
本实施例中的单元901与图8所示实施例中的单元801相同,此处不再赘述。
第二获取单元902,用于获取第一节点的第二计算资源,第二计算资源为第一节点已使用与未使用的计算资源的总和;
第一确定单元903,用于根据第一计算资源和第二计算资源确定集群的资源使用率。
本实施例中的单元904与图8所示实施例中的单元803相同,此处不再赘述。
第二确定单元905,用于根据所述资源使用率确定计算资源缩减量;
第三确定单元906,用于根据所述计算资源缩减量从所述n个A节点中确定用于关闭的Ai节点。
本实施例中的单元907与图8所示实施例中的单元804相同,单元908与图8所示实施例中的单元805相同,单元909与图8所示实施例中的单元806相同,单元910与图8所示实施例中的单元807相同,此处不再赘述。
第二判断单元911,用于当资源使用率不小于第一预设阈值时,则判断资源使用率是否大于第二预设阈值;
第四确定单元912,用于根据资源使用率确定计算资源增加量;
第五确定单元913,用于根据计算资源增加量从n个A节点中确定用于开启的Ax节点。
第二发送单元914,用于当资源使用率大于第二预设阈值时,则向n个A节点中的Ax节点发送开启指令,以开启Ax节点,x为不大于n的正整数;
第二切换单元915,用于将由m个B节点中的Bp节点对第二存储介质的控制切换为Ax节点,p为不大于m的正整数;
第二更新单元916,用于将由Bp节点对第二存储介质的映射更新为Ax节点;
第二迁移单元917,用于将第三节点上运行的第二虚拟机迁移至Ax节点,第三节点为n个A节点、m个B节点中的节点。
上面从模块化功能实体的角度对本发明实施例中的节点管理装置进行了描述,下面从硬件处理的角度对本发明实施例中的计算机装置进行描述:
本发明实施例中计算机装置一个实施例包括:
获取第一节点已使用的第一计算资源,第一节点为n个A节点和m个B节点中正在运行的节点的集合,集群包括n个A节点和m个B节点,n、m为不小于1的整数;
根据第一计算资源确定集群的资源使用率;
判断资源使用率是否小于第一预设阈值;
若是,则根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点,第二节点为n个A节点和m个B节点中除Ai节点的节点,,i为不大于n的正整数;
将由Ai节点对第一存储介质的控制切换为m个B节点中正在运行的Bj节点,并将由Ai节点对第一存储介质的映射更新为Bj节点,j为不大于m的正整数;
向Ai节点发送关闭指令,以关闭Ai节点。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
获取第一节点的第二计算资源,第二计算资源为第一节点已使用与未使用的计算资源的总和;
根据第一计算资源确定集群的资源使用率包括:
根据第一计算资源和第二计算资源确定集群的资源使用率。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
根据资源使用率确定计算资源缩减量;
根据计算资源缩减量从n个A节点中确定用于关闭的Ai节点。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
若资源使用率不小于第一预设阈值,则判断资源使用率是否大于第二预设阈值;
若是,则向n个A节点中的Ax节点发送开启指令,以开启Ax节点,x为不大于n的正整数;
将由m个B节点中的Bp节点对第二存储介质的控制切换为Ax节点,并将由Bp节点对第二存储介质的映射更新为Ax节点,p为不大于m的正整数。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
根据资源使用率确定计算资源增加量;
根据计算资源增加量从n个A节点中确定用于开启的Ax节点。
在本发明的一些实施例中,处理器,还可以用于实现如下步骤:
将第三节点上运行的第二虚拟机迁移至Ax节点,第三节点为n个A节点、m个B节点中的节点。
可以理解的是,上述说明的计算机装置中的处理器执行所述计算机程序时,也可以实现上述对应的各装置实施例中各单元的功能,此处不再赘述。示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述节点管理装置中的执行过程。例如,所述计算机程序可以被分割成上述节点管理装置中的各单元,各单元可以实现如上述相应节点管理装置说明的具体功能。
所述计算机装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机装置可包括但不仅限于处理器、存储器。本领域技术人员可以理解,处理器、存储器仅仅是计算机装置的示例,并不构成对计算机装置的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置还可以包括输入输出设备、网络接入设备、总线等。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本发明还提供了一种计算机可读存储介质,该计算机可读存储介质其上存储有计算机程序,计算机程序被处理器执行时,处理器,可以用于执行如下步骤:
获取第一节点已使用的第一计算资源,第一节点为n个A节点和m个B节点中正在运行的节点的集合,集群包括n个A节点和m个B节点,n、m为不小于1的整数;
根据第一计算资源确定集群的资源使用率;
判断资源使用率是否小于第一预设阈值;
若是,则根据资源使用率,将n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点,第二节点为n个A节点和m个B节点中除Ai节点的节点,i为不大于n的正整数;
将由Ai节点对第一存储介质的控制切换为m个B节点中正在运行的Bj节点,并将由Ai节点对第一存储介质的映射更新为Bj节点、j为不大于m的正整数;
向Ai节点发送关闭指令,以关闭Ai节点。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以具体用于执行如下步骤:
获取第一节点的第二计算资源,第二计算资源为第一节点已使用与未使用的计算资源的总和;
根据第一计算资源确定集群的资源使用率包括:
根据第一计算资源和第二计算资源确定集群的资源使用率。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以具体用于执行如下步骤:
根据资源使用率确定计算资源缩减量;
根据计算资源缩减量从n个A节点中确定用于关闭的Ai节点。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以具体用于执行如下步骤:
若资源使用率不小于第一预设阈值,则判断资源使用率是否大于第二预设阈值;
若是,则向n个A节点中的Ax节点发送开启指令,以开启Ax节点,x为不大于n的正整数;
将由m个B节点中的Bp节点对第二存储介质的控制切换为Ax节点,并将由Bp节点对第二存储介质的映射更新为Ax节点,p为不大于m的正整数。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以具体用于执行如下步骤:
根据资源使用率确定计算资源增加量;
根据计算资源增加量从n个A节点中确定用于开启的Ax节点。
在本发明的一些实施例中,计算机可读存储介质存储的计算机程序被处理器执行时,处理器,可以具体用于执行如下步骤:
将第三节点上运行的第二虚拟机迁移至Ax节点,第三节点为n个A节点、m个B节点中的节点。
可以理解的是,所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在相应的一个计算机可读取存储介质中。基于这样的理解,本发明实现上述相应的实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (21)

1.一种节点管理方法,应用于超融合集群,其特征在于,包括:
获取第一节点已使用的第一计算资源,所述第一节点为n个A节点和m个B节点中正在运行的节点的集合,所述集群包括所述n个A节点和所述m个B节点,所述n、所述m为不小于1的整数;
根据所述第一计算资源确定所述集群的资源使用率;
判断所述资源使用率是否小于第一预设阈值;
若是,则根据所述资源使用率,将所述n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点,所述第二节点为所述n个A节点和所述m个B节点中除所述Ai节点的节点,所述i为不大于所述n的正整数;
将由所述Ai节点对第一存储介质的控制切换为所述m个B节点中正在运行的Bj节点,并将由所述Ai节点对第一存储介质的映射更新为所述Bj节点,所述j为不大于所述m的正整数;
向所述Ai节点发送关闭指令,以关闭所述Ai节点。
2.根据权利要求1所述的节点管理方法,其特征在于,所述方法还包括:
获取所述第一节点的第二计算资源,所述第二计算资源为所述第一节点已使用与未使用的计算资源的总和;
所述根据所述第一计算资源确定所述集群的资源使用率包括:
根据所述第一计算资源和第二计算资源确定所述集群的资源使用率。
3.根据权利要求1或2所述的节点管理方法,其特征在于,在所述根据所述资源使用率,将所述n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点之前,所述方法还包括:
根据所述资源使用率确定计算资源缩减量;
根据所述计算资源缩减量从所述n个A节点中确定用于关闭的Ai节点。
4.根据权利要求3所述的节点管理方法,其特征在于,所述方法还包括:
若所述资源使用率不小于所述第一预设阈值,则判断所述资源使用率是否大于第二预设阈值;
若是,则向所述n个A节点中的Ax节点发送开启指令,以开启所述Ax节点,所述x为不大于所述n的正整数;
将由所述m个B节点中的Bp节点对第二存储介质的控制切换为所述Ax节点,并将由所述Bp节点对第二存储介质的映射更新为所述Ax节点,所述p为不大于所述m的正整数。
5.根据权利要求4所述的节点管理方法,其特征在于,在所述向所述n个A节点中的Ax节点发送开启指令之前,所述方法还包括:
根据所述资源使用率确定计算资源增加量;
根据所述计算资源增加量从所述n个A节点中确定用于开启的所述Ax节点。
6.根据权利要求4或5所述的节点管理方法,其特征在于,在所述向所述n个A节点中的Ax节点发送开启指令之后,所述方法还包括:
将第三节点上运行的第二虚拟机迁移至Ax节点,所述第三节点为所述n个A节点、所述m个B节点中的节点。
7.一种节点管理装置,应用于超融合集群,其特征在于,包括:
第一获取单元,用于获取第一节点已使用的第一计算资源,所述第一节点为n个A节点和m个B节点中正在运行的节点的集合,所述集群包括所述n个A节点和所述m个B节点,所述n、所述m为不小于1的整数;
第一确定单元,用于根据所述第一计算资源确定所述集群的资源使用率;
判断单元,用于判断所述资源使用率是否小于第一预设阈值;
第一迁移单元,用于当所述资源使用率小于第一预设阈值时,则根据所述资源使用率,将所述n个A节点中Ai节点上运行的第一虚拟机迁移至第二节点,所述第二节点为所述n个A节点和所述m个B节点中除所述Ai节点的节点,所述i为不大于所述n的正整数;
第一切换单元,用于将由所述Ai节点对第一存储介质的控制切换为所述m个B节点中正在运行的Bj节点,所述j为不大于所述m的正整数;
第一更新单元,用于将由所述Ai节点对第一存储介质的映射更新为所述Bj节点,
第一发送单元,用于向所述Ai节点发送关闭指令,以关闭所述Ai节点。
8.根据权利要求7所述的节点管理装置,其特征在于,所述装置还包括:
第二获取单元,用于获取所述第一节点的第二计算资源,所述第二计算资源为所述第一节点已使用与未使用的计算资源的总和;
所述第一确定单元,具体用于:
根据所述第一计算资源和第二计算资源确定所述集群的资源使用率。
9.根据权利要求7或8所述的节点管理装置,其特征在于,所述装置还包括:
第二确定单元,用于根据所述资源使用率确定计算资源缩减量;
第三确定单元,用于根据所述计算资源缩减量从所述n个A节点中确定用于关闭的Ai节点。
10.根据权利要求9所述的节点管理装置,其特征在于,所述装置还包括:
第二判断单元,用于当所述资源使用率不小于所述第一预设阈值时,则判断所述资源使用率是否大于第二预设阈值;
第二发送单元,用于当所述资源使用率大于所述第二预设阈值时,则向所述n个A节点中的Ax节点发送开启指令,以开启所述Ax节点,所述x为不大于所述n的正整数;
第二切换单元,用于将由所述m个B节点中的Bp节点对第二存储介质的控制切换为所述Ax节点,所述p为不大于所述m的正整数;
第二更新单元,用于将由所述Bp节点对第二存储介质的映射更新为所述Ax节点。
11.根据权利要求10所述的节点管理装置,其特征在于,所述装置还包括:
第四确定单元,用于根据所述资源使用率确定计算资源增加量;
第五确定单元,用于根据所述计算资源增加量从所述n个A节点中确定用于开启的所述Ax节点。
12.根据权利要求10或11所述的节点管理装置,其特征在于,所述装置还包括:
第二迁移单元,用于将第三节点上运行的第二虚拟机迁移至Ax节点,所述第三节点为所述n个A节点、所述m个B节点中的节点。
13.一种多子星服务器,应用于超融合集群,其特征在于,包括:
n个A节点、m个B节点、IPMI接口,所述n、所述m为不小于1的整数;
所述n个A节点中Ai节点的第一存储介质分别与所述Ai节点的第一主板、所述m个B节点中Bj节点的第二主板连接,所述Bj节点的第二存储介质与所述第二主板连接,所述i为不大于所述n的正整数、所述j为不大于所述m的正整数;
所述Ai节点的第一电源分别与所述第一主板、所述第一存储介质连接,所述Bj节点的第二电源分别与所述第二主板、所述第一存储介质、所述第二存储介质连接;
所述IPMI接口用于监控所述n个A节点和所述m个B节点的运行状态。
14.根据权利要求11所述的多子星服务器,其特征在于,所述Bj节点的第二存储介质与所述第二主板连接包括:
所述Bi节点的第二存储介质分别与所述第一主板、所述第二主板连接;
所述Ai节点的第一电源分别与所述第一主板、所述第一存储介质连接包括:
所述Ai节点的第一电源分别与所述第一主板、所述第一存储介质、所述第二存储介质连接。
15.根据权利要求12所述的多子星服务器,其特征在于,所述第一存储介质和所述第二存储介质包括至少两个连接端口。
16.根据权利要求13所述的多子星服务器,其特征在于,所述第一存储介质和第二存储介质为SAS盘。
17.根据权利要求14所述的多子星服务器,其特征在于,所述SAS盘包括SAS接口的HDD盘或SAS接口的SSD盘。
18.根据权利要求11至15中任一项所述的多子星服务器,其特征在于,所述n个A节点中的每一个由对应的一个第一电源进行供电,所述m个B节点中的每一个由对应的一个第二电源进行供电。
19.根据权利要求11至15任一项所述的多子星服务器,其特征在于,当所述n、所述m大于1时,所述n个A节点中的每一个由对应的一个第一电源进行供电,所述m个B节点中的至少两个由一个第二电源进行供电。
20.一种计算机装置,其特征在于:所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至6中任意一项所述节点管理方法的步骤。
21.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1至6中任意一项所述节点管理方法的步骤。
CN201710516808.9A 2017-06-29 2017-06-29 一种节点管理方法及装置、多子星服务器 Active CN107329801B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710516808.9A CN107329801B (zh) 2017-06-29 2017-06-29 一种节点管理方法及装置、多子星服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710516808.9A CN107329801B (zh) 2017-06-29 2017-06-29 一种节点管理方法及装置、多子星服务器

Publications (2)

Publication Number Publication Date
CN107329801A true CN107329801A (zh) 2017-11-07
CN107329801B CN107329801B (zh) 2020-12-15

Family

ID=60197967

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710516808.9A Active CN107329801B (zh) 2017-06-29 2017-06-29 一种节点管理方法及装置、多子星服务器

Country Status (1)

Country Link
CN (1) CN107329801B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491262A (zh) * 2018-02-28 2018-09-04 华为技术有限公司 一种抽样查询的方法和装置
CN112235383A (zh) * 2020-10-09 2021-01-15 腾讯科技(深圳)有限公司 容器服务集群节点调度方法及装置、服务器、存储介质
CN113326099A (zh) * 2021-06-25 2021-08-31 深信服科技股份有限公司 资源管理方法、装置、电子设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1947096A (zh) * 2004-05-08 2007-04-11 国际商业机器公司 虚拟机计算机程序的动态迁移
CN102158513A (zh) * 2010-02-11 2011-08-17 联想(北京)有限公司 一种服务器集群节能的方法、装置和服务器集群
US20130132942A1 (en) * 2011-11-22 2013-05-23 Huawei Technologies Co., Ltd. Application software installation method and application software installation apparatus
CN104506589A (zh) * 2014-12-10 2015-04-08 上海爱数软件有限公司 一种基于超融合存储的资源迁移调度方法
CN105208099A (zh) * 2015-08-24 2015-12-30 浪潮(北京)电子信息产业有限公司 一种云服务器内利用sdn技术智能节电的体系架构
CN105892952A (zh) * 2016-04-22 2016-08-24 深圳市深信服电子科技有限公司 超融合系统及其纵向扩展方法
CN106502933A (zh) * 2016-11-04 2017-03-15 郑州云海信息技术有限公司 一种硬盘可动态分配的四子星服务器系统
CN106774763A (zh) * 2016-11-30 2017-05-31 郑州云海信息技术有限公司 一种控制多节点服务器系统开机上电的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1947096A (zh) * 2004-05-08 2007-04-11 国际商业机器公司 虚拟机计算机程序的动态迁移
CN102158513A (zh) * 2010-02-11 2011-08-17 联想(北京)有限公司 一种服务器集群节能的方法、装置和服务器集群
US20130132942A1 (en) * 2011-11-22 2013-05-23 Huawei Technologies Co., Ltd. Application software installation method and application software installation apparatus
CN104506589A (zh) * 2014-12-10 2015-04-08 上海爱数软件有限公司 一种基于超融合存储的资源迁移调度方法
CN105208099A (zh) * 2015-08-24 2015-12-30 浪潮(北京)电子信息产业有限公司 一种云服务器内利用sdn技术智能节电的体系架构
CN105892952A (zh) * 2016-04-22 2016-08-24 深圳市深信服电子科技有限公司 超融合系统及其纵向扩展方法
CN106502933A (zh) * 2016-11-04 2017-03-15 郑州云海信息技术有限公司 一种硬盘可动态分配的四子星服务器系统
CN106774763A (zh) * 2016-11-30 2017-05-31 郑州云海信息技术有限公司 一种控制多节点服务器系统开机上电的方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491262A (zh) * 2018-02-28 2018-09-04 华为技术有限公司 一种抽样查询的方法和装置
CN112235383A (zh) * 2020-10-09 2021-01-15 腾讯科技(深圳)有限公司 容器服务集群节点调度方法及装置、服务器、存储介质
CN112235383B (zh) * 2020-10-09 2024-03-22 腾讯科技(深圳)有限公司 容器服务集群节点调度方法及装置、服务器、存储介质
CN113326099A (zh) * 2021-06-25 2021-08-31 深信服科技股份有限公司 资源管理方法、装置、电子设备和存储介质
CN113326099B (zh) * 2021-06-25 2022-08-05 深信服科技股份有限公司 资源管理方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN107329801B (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
CN107733855B (zh) 一种可同时支持公有链、联盟链及私有链的区块链系统及应用方法
CN102255962B (zh) 一种分布式存储方法、装置和系统
CN115237550A (zh) 网络处理资源的池化
CN104657308A (zh) 一种用fpga实现的服务器硬件加速的方法
CN109271330A (zh) 基于综合化信息系统的通用bmc系统
CN107329801A (zh) 一种节点管理方法及装置、多子星服务器
CN110489407A (zh) 数据补采方法、装置、计算机设备及存储介质
CN103501242A (zh) 资源管理方法和多节点集群设备
CN110119304B (zh) 一种中断处理方法、装置及服务器
CN102413183B (zh) 云智能交换机及其处理方法、系统
CN108052569A (zh) 数据库访问方法、装置、计算机可读存储介质和计算设备
CN106155264A (zh) 管理存储子系统的电力消耗的计算机方法与计算机系统
CN104615684A (zh) 一种海量数据通信并发处理方法及系统
KR20210124082A (ko) 구성 가능한 일관성 장치들을 위한 시스템 및 방법
CN105159617A (zh) 一种池化存储系统架构
CN103222286A (zh) 路由交换装置、网络交换系统和路由交换方法
CN104408069A (zh) 一种基于布隆过滤器思想的一致性目录设计方法
CN103678001A (zh) 一种基于反射内存网的多节点内存自动分配方法
CN107003932A (zh) 多核处理器系统的缓存目录处理方法和目录控制器
CN111191956A (zh) 一种基于区块链的无人机光伏板检修方法及其系统
CN103217681B (zh) 一种树形拓扑机构多处理器声纳信号处理的方法
CN108551439A (zh) 一种策略模板应用的改进方法及装置
CN110535724A (zh) 应用程序网络读写限制方法、装置、电子设备及存储介质
EP4020208A1 (en) Memory pool data placement technologies
CN115426221A (zh) 一种物联网网关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant