CN113505001A - 服务器管理方法和服务器、电子设备及计算机可读存储介质 - Google Patents

服务器管理方法和服务器、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113505001A
CN113505001A CN202111058315.8A CN202111058315A CN113505001A CN 113505001 A CN113505001 A CN 113505001A CN 202111058315 A CN202111058315 A CN 202111058315A CN 113505001 A CN113505001 A CN 113505001A
Authority
CN
China
Prior art keywords
server
cluster
information
servers
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111058315.8A
Other languages
English (en)
Other versions
CN113505001B (zh
Inventor
黄征
李志兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Alibaba Cloud Computing Ltd
Original Assignee
Alibaba China Co Ltd
Alibaba Cloud Computing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd, Alibaba Cloud Computing Ltd filed Critical Alibaba China Co Ltd
Priority to CN202111058315.8A priority Critical patent/CN113505001B/zh
Publication of CN113505001A publication Critical patent/CN113505001A/zh
Application granted granted Critical
Publication of CN113505001B publication Critical patent/CN113505001B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • G06F11/3062Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Power Sources (AREA)

Abstract

本申请公开了一种集群中的服务器管理方法和服务器、电子设备及计算机可读存储介质。该方法包括:获取除本机服务器之外的其他服务器的第一服务器信息,所述服务器信息至少包括所述服务器的位置信息和功率信息;根据多个第一服务器信息和本机服务器的第二服务器信息确定所述集群的集群信息;根据所述集群信息对所述本机服务器启动第一操作。本申请实施例通过本机服务器获取集群中其他服务器的服务器信息并结合本机的服务器信息来确定整个集群的集群信息,从而本机服务器就能够根据整个集群的集群信息来对本机服务器启动操作,因此使得集群中的每个服务器都能够了解整个集群的情况,从而实现了集群中各服务器基于集群的整体情况下的自我管理。

Description

服务器管理方法和服务器、电子设备及计算机可读存储介质
技术领域
本申请涉及服务器技术领域,尤其涉及一种集群中的服务器管理方法和服务器、电子设备及计算机可读存储介质。
背景技术
随着网络技术的发展,可以通过网络为用户提供多台计算机/服务器构成的集群来执行用户的计算任务,因此原来用户只能够使用本地计算机来执行计算任务而遇到的计算资源或性能受限的问题就得到了解决,特别是可以将多台服务器布置在机房中形成具有强大计算能力或性能的集群并且通过网络提供给各地的用户来使用。但是随之而来的是这样的集群在使用时必须要满足机房的功率要求。特别是通常机房或机柜这样的容纳多个服务器的空间都具有预定的功率指标,即最大提供功率,而如果其中容纳的服务器的用电功率超过给了该限制,则可能导致整个机房或机柜的供电中断或者甚至由于超功率用电导致发热而起火。另外在目前节能减排的大环境下,更需要对这样的集群功耗进行一定的限制。
发明内容
本申请实施例提供一种集群中的服务器管理方法和服务器、电子设备及计算机可读存储介质,以解决现有技术中需要额外设置中心管理服务器的缺陷。
为达到上述目的,本申请实施例提供了一种集群中的服务器管理方法,其中所述集群由多个服务器构成,所述服务器管理方法由所述集群中的服务器执行,并且包括:
获取除本机服务器之外的其他服务器的第一服务器信息;
根据多个第一服务器信息和本机服务器的第二服务器信息确定所述集群的集群信息;
根据所述集群信息对所述本机服务器启动第一操作。
本申请实施例还提供了一种集群中的服务器,其中,所述集群由多个服务器构成,所述集群中的服务器包括:
获取模块,用于获取除本机服务器之外的其他服务器的第一服务器信息;
确定模块,用于根据多个第一服务器信息和本机服务器的第二服务器信息确定所述集群的集群信息;
操作模块,用于根据所述集群信息对所述本机服务器启动第一操作。
本申请实施例还提供了一种电子设备,包括:
存储器,用于存储程序;
处理器,用于运行所述存储器中存储的所述程序,所述程序运行时执行本申请实施例提供的集群中的服务器管理方法。
本申请实施例还提供了一种计算机可读存储介质,其上存储有可被处理器执行的计算机程序,其中,该程序被处理器执行时实现如本申请实施例提供的集群中的服务器管理方法。
本申请实施例提供的集群中的服务器管理方法和服务器、电子设备及计算机可读存储介质,通过本机服务器获取集群中其他服务器的服务器信息并结合本机的服务器信息来确定整个集群的集群信息,从而本机服务器就能够根据整个集群的集群信息来对本机服务器启动操作,因此使得集群中的每个服务器都能够了解整个集群的情况,从而实现了集群中各服务器基于集群的整体情况下的自我管理。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本申请实施例提供的集群中的服务器管理方案的应用场景示意图;
图2为本申请提供的集群中的服务器管理方法的一个实施例的流程图;
图3为本申请提供的集群中的服务器管理方法的一个实施例的流程图;
图4为本申请提供的集群中的服务器的实施例的结构示意图;
图5为本申请提供的电子设备实施例的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
本申请实施例提供的方案可应用于任何具有多个服务器的集群系统,例如包括有服务器功能的芯片的服务器系统等等。图1为本申请实施例提供的集群中的服务器管理方案的应用场景示意图,图1所示的场景仅仅是本申请的技术方案可应用的示例之一。
随着网络技术的发展,可以通过网络为用户提供多台计算机/服务器构成的集群来执行用户的计算任务,因此原来用户只能够使用本地计算机来执行计算任务而遇到的计算资源或性能受限的问题就得到了解决,特别是可以将多台服务器布置在机房中形成具有强大计算能力或性能的集群并且通过网络提供给各地的用户来使用。但是随之而来的是这样的集群在使用时必须要满足机房的功率要求。特别是通常机房或机柜这样的容纳多个服务器的空间都具有预定的功率指标,即最大提供功率,而如果其中容纳的服务器的用电功率超过给了该限制,则可能导致整个机房或机柜的供电中断或者甚至由于超功率用电导致发热而起火。另外在目前节能减排的大环境下,更需要对这样的集群功耗进行一定的限制。
例如,如图1中所示的服务器集群中,集群由服务器1、服务器2和服务器3构成。图1中所示的服务器的数量仅是示例,并且本申请的技术方案不限于此。本领域技术人员在实施本申请的技术方案时可以根据实际来设置集群中服务器的数量。在图1中所示的集群场景中,服务器1的最大功率为1000W,服务器2的最大功率为1500W,并且服务器3的最大功率为1200W,而集群所在的机房可提供的最大功率3000W。在该情况下,当该集群被布置在该机房中时,通常只能够使用服务器1-3中的两台服务器,但是如果根据用户的需求,需要同时使用者三台服务器1-3,在该情况下,如果用户的需求没有使得三台服务器1-3全功率工作,例如,在使用中,服务器1的使用功率实际上为800W,服务器2的使用功率为1000W,并且服务器3的使用功率实际上为1000W,则这三个服务器的总使用功率,即集群的总功率仅为2800W,仍然处于机房能够提供的功率范围内。但是随着用户对于该集群的使用,如果用户突然增加了计算需求,例如,需要将服务器2的使用功率提高到1300W,那么集群按照用户的需求来提高服务器的使用功率以满足用户增加的计算要求,那么这必然导致该集群的总使用功率超过了机房能够提供的最大功率,那么就会导致机房的电力供应超负荷,从而导致跳闸断电,使得集群的电力供应中断。
为此,在现有技术中已经提出了对于集群的管控方案,例如现有技术中提出了一种基于RMC(Remote Management Console,远程控制台)设备的功率控制方案,即针对带有RMC模块的机柜服务器构成的集群,通过各个RMC设备之间实现集群对于各服务器的功率控制,但是这样的方案必须依赖于服务器自身具有的RMC设备或模块,而当前越来越多的集群开始使用普通服务器,即不具有RMC设备的服务器来构成集群或者使用普通服务器与带有RMC设备的机柜服务器构成的混合集群,在这样的情况下,由于集群中并不是每个服务器都具有RMC模块,因此就无法实现对于集群中各个服务器的功率封顶控制。
现有技术中还提出了一种集群中服务器的功率控制方案,其通过在集群的中心侧部署管控服务器,该管控服务器可以采集该集群中所有服务器的功耗数据。例如,在如图1中所示的场景中,该管控服务器可以实时获取服务器1-3的使用功率,并且当功率数据即将超过指定范围的额定功率时,例如,当服务器2的使用功率根据用户的需求需要提高到1300W时,该管控服务器就可以确定服务器2的这样的功率提高会导致集群的整体使用功率超过了机房能够提供的最高功率,因此,管控服务器就可以对该服务器2进行功耗限制(Power capping),例如,将服务器2的使用功率限制到1200W,即只允许服务器2的使用功率提高200W至1200W,从而起到了集群的总使用功率超出机房允许的总功率的作用。
但是该现有技术的方案虽然免去了对于RMC设备的依赖,但是其需要额外单独设置一台管控服务器,并需要在该服务器上安装相应的管理软件,例如代理脚本、采集脚本、平台系统等等,并且该管控服务器还需要具备设备纳管能力。因此,对于服务商来说,部署这样的管控服务器相对复杂,并且当中心管控服务器出现故障或者与集群中其他服务器的网络通信失败时,该集群实际上就失去了功率封顶的管控能力。
为此,在本申请实施例中,由集群的各服务器来彼此沟通信息。例如,在如图1中所示的场景中,服务器1-3中的每一个可以使用其自身的带外管理模块或带内管理服务模块来开启简单服务发现协议(SSDP),并且可以通过该SSDP协议在组播消息中发送各自的服务器信息,例如,可以包括该服务器的机柜位置、该服务器的功耗、功率封顶状态等信息。例如,服务器1可以在其SSDP协议组播消息中将服务器1的位置(例如,机柜1)、设备功耗(例如,1000W)以及功率封顶状态(无)广播给与其处于同一网络,例如同一路由器下的二层网络中国的其他服务器2和3,从而服务器2和3就可以借助于该消息了解到服务器1的信息,尤其是功耗和功率封顶信息。同样地,服务器2和3也可以分别借助于例如SSDP协议在组播消息中将自己服务器的信息广播给其他服务器,从而集群中的服务器1-3中的每一个都能够了解其他服务器的信息。因此,各个服务器可以将通过SSDP协议组播消息获取到的其他服务器的信息与自己服务器的信息结合就能够确定整个集群的信息。
例如,服务器1基于SSDP协议接收到服务器2发送来的服务器消息,并且可以了解到服务器2处于机房1中并且当前的功耗为1000W,功率封顶状态为未封顶,并且接收到服务器3发送来的服务器消息,了解到服务器3处于机房1中,并且当前功耗为1200W,功率封顶状态为未封顶。而服务器1自身的信息为服务器1处于机房1中,当前功耗为1000W,功率封顶状态为未封顶。因此服务器1可以通过其管理模块或者其他模块确定集群的服务器1-3都处于机房1中,并且当前总功耗为3200W,而服务器1由于处于机房1中,因此可以预先就了解机房1的供电最大功率为3000W,或者服务器1也可以通过其管理模块中存储的功耗管理策略了解到集群的总功率不能够超过3000W。因此,在该情况下,服务器1可以确定其所在的集群的总功率需要降低200W,而服务器2和3都没有处于功率封顶状态,因此,服务器1可以确定需要执行其自己的功率封顶操作,并且需要将其功率降低200W至800W,以确保集群的总功率不超过3000W。
因此,与现有技术相比,本申请实施例无需额外设置专门的管控服务器来搜集集群的各服务器信息并确定功率封顶操作和操作对象,并且由于直接使用各服务器自身的管理模块来实现服务器间的信息通信和功率封顶操作的确定,大大降低了对集群服务器的要求,并且还减少了根据集群的整体状态对各服务器进行管理所需的成本。
因此,本申请实施例提供的集群中的服务器管理方案,通过本机服务器获取集群中其他服务器的服务器信息并结合本机的服务器信息来确定整个集群的集群信息,从而本机服务器就能够根据整个集群的集群信息来对本机服务器启动操作,因此使得集群中的每个服务器都能够了解整个集群的情况,从而实现了集群中各服务器基于集群的整体情况下的自我管理。
上述实施例是对本申请实施例的技术原理和示例性的应用框架的说明,下面通过多个实施例来进一步对本申请实施例具体技术方案进行详细描述。
实施例二
图2为本申请提供的集群中的服务器管理方法的一个实施例的流程图,该方法的执行主体可以为通过网络连接的各种终端或服务器设备,也可以为集成在这些设备上的装置或芯片。如图2所示,该服务器管理方法可以包括如下步骤:
S201,获取除本机服务器之外的其他服务器的第一服务器信息。
在本申请实施例中,服务器可以是与其他至少一个服务器通过网络连接共同构成集群的服务器,并且可以是该集群中的任一服务器。在本申请实施例的步骤S201中,可以由集群的各服务器来彼此沟通信息。
在本申请实施例中,服务器可以是云计算服务中所使用的各种形式的服务器。例如,服务器可以以物理节点的形式实现在独立的物理设备中,例如,可以实施为集群中的各个物理节点,并且可以包括CPU(中央处理器)、内存以及图形处理器(GPU)等物理装置,服务器也可以以云节点的形式实施在物理主机或主机集群承载的虚拟服务器中,例如,同一网络中通过虚拟机技术运行在物理机上的虚拟服务器,从而本申请实施例中处于同一集群中的多个服务器可以是运行在同一物理机上的多个虚拟服务器,也可以是运行在不同物理机上的多个虚拟服务器,本申请对此不做限制。
例如,在如图1中所示的场景中,服务器1-3中的每一个可以使用其自身的带外管理模块或带内管理服务模块来开启简单服务发现协议(SSDP),并且可以通过该SSDP协议在组播消息中发送各自的服务器信息,例如,可以包括该服务器的机柜位置、该服务器的功耗、功率封顶状态等信息。在本申请实施例中,功耗信息不仅可以包括服务器自身的功耗信息,还可以包含例如服务器中使用的CPU(中央处理器)的功耗信息、GPU(图形处理单元)的功耗信息以及内存等其他装置的功耗信息,这些功耗信息都可以在本申请实施例的服务器的功耗控制管理中使用。
S202,根据多个第一服务器信息和本机服务器的第二服务器信息确定集群的集群信息。
当集群中的每个服务器,例如图1中的服务器1,在步骤S201获取到集群中其他服务器的信息之后,该服务器可以基于步骤S201中获取到的其他服务器的信息和自己服务器的信息来确定整个集群的集群信息。换言之,各个服务器可以将通过接收例如广播消息而在步骤S201获取到的其他服务器的信息与自己服务器的信息结合就能够确定整个集群的信息。
S203,根据集群信息对本机服务器启动第一操作。
因此,当集群中的服务器在步骤S202根据步骤S201获取到的其他服务器的信息和自己的信息确定的集群信息之后,可以在步骤S203根据预定的管理策略来基于整个集群的信息确定将对本机执行何种操作。例如,如图1中所示的场景中,当服务器1根据步骤S201获取到的服务器2和3的功耗信息以及自己的功耗信息确定整个集群的功耗将超过机房允许的最大功率时,可以根据预先存储的封顶策略而将自己的功耗降低,从而使得整个集群的功耗处于最大功率范围内,避免超负荷。
因此,本申请实施例提供的集群中的服务器管理方案,通过本机服务器获取集群中其他服务器的服务器信息并结合本机的服务器信息来确定整个集群的集群信息,从而本机服务器就能够根据整个集群的集群信息来对本机服务器启动操作,因此使得集群中的每个服务器都能够了解整个集群的情况,从而实现了集群中各服务器基于集群的整体情况下的自我管理。
实施例三
图3为本申请提供的集群中的服务器管理方法的一个实施例的流程图,该方法的执行主体可以为通过网络连接成集群的各种终端或服务器设备,也可以为集成在这些设备上的装置或芯片。如图3所示,该服务器管理方法可以包括如下步骤:
S301,基于简单服务发现协议获取除本机服务器之外的其他服务器的第一服务器信息。
在本申请实施例中,服务器可以是与其他至少一个服务器通过网络连接共同构成集群的服务器,并且可以是该集群中的任一服务器。在本申请实施例的步骤S301中,可以由集群的各服务器基于简单服务发现协议来彼此沟通信息。
例如,在如图1中所示的场景中,服务器1-3中的每一个可以使用其自身的带外管理模块或带内管理服务模块来开启简单服务发现协议(SSDP),并且可以通过该SSDP协议在组播消息中发送各自的服务器信息,例如,可以包括该服务器的机柜位置、该服务器的功耗、功率封顶状态等信息。例如,可以包括该服务器的机柜位置、该服务器的功耗、功率封顶状态等信息。例如,服务器1可以在其SSDP协议组播消息中将服务器1的位置(例如,机柜1)、设备功耗(例如,1000W)以及功率封顶状态(无)广播给与其处于同一网络,例如同一路由器下的二层网络中的其他服务器2和3,从而服务器2和3就可以借助于该消息了解到服务器1的信息,尤其是功耗和功率封顶信息。同样地,服务器2和3也可以分别借助于例如SSDP协议在组播消息中将自己服务器的信息广播给其他服务器,从而集群中的服务器1-3中的每一个都能够了解其他服务器的信息。
S302,根据多个第一服务器信息和本机服务器的第二服务器信息确定集群的集群信息。
当集群中的每个服务器,例如图1中的服务器1,在步骤S301基于SSDP协议获取到集群中其他服务器的信息之后,该服务器可以基于步骤S301中获取到的其他服务器的信息和自己服务器的信息来确定整个集群的集群信息。换言之,各个服务器可以将通过接收例如广播消息而在步骤S301获取到的其他服务器的信息与自己服务器的信息结合就能够确定整个集群的信息。
例如,服务器1基于SSDP协议接收到服务器2发送来的服务器消息,并且可以了解到服务器2处于机房1中并且当前的功耗为1000W,功率封顶状态为未封顶,并且接收到服务器3发送来的服务器消息,了解到服务器3处于机房1中,并且当前功耗为1200W,功率封顶状态为未封顶。而服务器1自身的信息为服务器1处于机房1中,当前功耗为1000W,功率封顶状态为未封顶。因此服务器1可以通过其管理模块或者其他模块确定集群的服务器1-3都处于机房1中,并且当前总功耗为3200W。
S303,当集群功率超过预设的功率封顶阈值时对本机服务器启动第一操作。
因此,当集群中的服务器在步骤S302根据步骤S301获取到的其他服务器的信息和自己的信息确定的集群信息之后,可以在步骤S303根据预定的功率管理策略来基于整个集群的功耗信息确定将对本机执行功率封顶操作。例如,如图1中所示的场景中,当服务器1根据步骤S201获取到的服务器2和3的功耗信息以及自己的功耗信息确定整个集群的功耗将超过机房允许的最大功率时,可以根据预先存储的封顶策略而将自己的功耗降低,从而使得整个集群的功耗处于最大功率范围内,避免超负荷。
例如,在如图1中所示的场景中,服务器1根据接收到的服务器2和3的位置、功耗以及功率封顶状态确定同处于一个机房,并且服务器1可以预先就了解机房1的供电最大功率为3000W,或者服务器1也可以通过其管理模块中存储的功耗管理策略了解到集群的总功率不能够超过3000W。因此服务器1可以确定需要执行其自己的功率封顶操作,并且需要将其功率降低200W至800W,以确保集群的总功率不超过3000W。
因此,本申请实施例提供的集群中的服务器管理方法,通过本机服务器获取集群中其他服务器的服务器信息并结合本机的服务器信息来确定整个集群的集群信息,从而本机服务器就能够根据整个集群的集群信息来对本机服务器启动操作,因此使得集群中的每个服务器都能够了解整个集群的情况,从而实现了集群中各服务器基于集群的整体情况下的自我管理。
实施例四
图4为本申请提供的集群中的服务器的实施例的结构示意图,可以用于执行图2或图3中所示的集群中的服务器管理方法。如图4所示,该服务器可以包括:获取模块41、确定模块42和操作模块43。
获取模块41可以用于获取除本机服务器之外的其他服务器的第一服务器信息。
在本申请实施例中,服务器可以是与其他至少一个服务器通过网络连接共同构成集群的服务器,并且可以是该集群中的任一服务器。在本申请实施例中,可以由集群的各服务器的获取模块41来彼此沟通信息。
例如,在如图1中所示的场景中,服务器1-3中的每一个可以使用其自身的获取模块41来开启简单服务发现协议(SSDP),并且可以通过该SSDP协议在组播消息中发送各自的服务器信息,例如,可以包括该服务器的机柜位置、该服务器的功耗、功率封顶状态等信息。例如,可以包括该服务器的机柜位置、该服务器的功耗、功率封顶状态等信息。例如,服务器1的获取模块41可以在其SSDP协议组播消息中将服务器1的位置(例如,机柜1)、设备功耗(例如,1000W)以及功率封顶状态(无)广播给与其处于同一网络,例如同一路由器下的二层网络中的其他服务器2和3,从而服务器2和3就可以借助于该消息了解到服务器1的信息,尤其是功耗和功率封顶信息。同样地,服务器2和3也可以分别借助于例如SSDP协议在组播消息中将自己服务器的信息广播给其他服务器,从而集群中的服务器1-3中的每一个都能够通过获取模块41而了解其他服务器的信息。
确定模块42可以用于根据多个第一服务器信息和本机服务器的第二服务器信息确定集群的集群信息。
当集群中的每个服务器,例如图1中的服务器1通过获取模块41基于SSDP协议获取到集群中其他服务器的信息之后,该服务器的确定模块42可以基于获取模块41获取到的其他服务器的信息和自己服务器的信息来确定整个集群的集群信息。换言之,各个服务器的确定模块42可以将获取模块41通过接收例如广播消息而获取到的其他服务器的信息与自己服务器的信息结合就能够确定整个集群的信息。
例如,服务器1的获取模块41基于SSDP协议接收到服务器2发送来的服务器消息,并且可以通过确定模块42了解到服务器2处于机房1中并且当前的功耗为1000W,功率封顶状态为未封顶,并且接收到服务器3发送来的服务器消息,了解到服务器3处于机房1中,并且当前功耗为1200W,功率封顶状态为未封顶。而服务器1自身的信息为服务器1处于机房1中,当前功耗为1000W,功率封顶状态为未封顶。因此服务器1可以通过其管理模块或者其他模块确定集群的服务器1-3都处于机房1中,并且当前总功耗为3200W。
操作模块43可以用于根据集群信息对本机服务器启动第一操作。
因此,当集群中的服务器的确定模块42根据获取模块41获取到的其他服务器的信息和自己的信息确定的集群信息之后,操作模块43可以根据预定的功率管理策略来基于整个集群的例如功耗信息确定将对本机执行第一操作,例如功率封顶操作。
例如,如图1中所示的场景中,当服务器1的确定模块42根据获取模块41获取到的服务器2和3的功耗信息以及自己的功耗信息确定整个集群的功耗将超过机房允许的最大功率时,操作模块43可以根据预先存储的封顶策略而将自己的功耗降低,从而使得整个集群的功耗处于最大功率范围内,避免超负荷。
例如,在如图1中所示的场景中,服务器1的确定模块42根据获取模块41接收到的服务器2和3的位置、功耗以及功率封顶状态确定同处于一个机房,并且服务器1的操作模块43可以预先就了解机房1的供电最大功率为3000W,或者服务器1也可以通过其管理模块中存储的功耗管理策略了解到集群的总功率不能够超过3000W。因此服务器1的操作模块43可以确定需要执行其自己的功率封顶操作,并且需要将其功率降低200W至800W,以确保集群的总功率不超过3000W。
因此,本申请实施例提供的集群中的服务器,通过本机服务器获取集群中其他服务器的服务器信息并结合本机的服务器信息来确定整个集群的集群信息,从而本机服务器就能够根据整个集群的集群信息来对本机服务器启动操作,因此使得集群中的每个服务器都能够了解整个集群的情况,从而实现了集群中各服务器基于集群的整体情况下的自我管理。
实施例五
以上描述了服务器的内部功能和结构,该装置可实现为一种电子设备。图5为本申请提供的电子设备实施例的结构示意图。如图5所示,该电子设备包括存储器51和处理器52。
存储器51,用于存储程序。除上述程序之外,存储器51还可被配置为存储其它各种数据以支持在电子设备上的操作。这些数据的示例包括用于在电子设备上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。
存储器51可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
处理器52,不仅仅局限于中央处理器(CPU),还可能为图形处理器(GPU)、现场可编辑门阵列(FPGA)、嵌入式神经网络处理器(NPU)或人工智能(AI)芯片等处理芯片。处理器52,与存储器51耦合,执行存储器51所存储的程序,以执行上述实施例二和三的服务器管理方法。
进一步,如图5所示,电子设备还可以包括:通信组件53、电源组件54、音频组件55、显示器56等其它组件。图5中仅示意性给出部分组件,并不意味着电子设备只包括图5所示组件。
通信组件53被配置为便于电子设备和其他设备之间有线或无线方式的通信。电子设备可以接入基于通信标准的无线网络,如WiFi,3G、4G或5G,或它们的组合。在一个示例性实施例中,通信组件53经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件53还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
电源组件54,为电子设备的各种组件提供电力。电源组件54可以包括电源管理系统,一个或多个电源,及其他与为电子设备生成、管理和分配电力相关联的组件。
音频组件55被配置为输出和/或输入音频信号。例如,音频组件55包括一个麦克风(MIC),当电子设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器51或经由通信组件53发送。在一些实施例中,音频组件55还包括一个扬声器,用于输出音频信号。
显示器56包括屏幕,其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种集群中的服务器管理方法,其中,所述集群由多个服务器构成,所述服务器管理方法由所述集群中的服务器执行,并且包括:
获取除本机服务器之外的其他服务器的第一服务器信息;
根据多个第一服务器信息和本机服务器的第二服务器信息确定所述集群的集群信息;
根据所述集群信息对所述本机服务器启动第一操作。
2.根据权利要求1所述的服务器管理方法,其中,所述获取除本机服务器之外的其他服务器的第一服务器信息包括:
基于简单服务发现协议获取所述第一服务器信息。
3.根据权利要求1所述的服务器管理方法,其中,所述第一服务器信息包括:所述其他服务器的位置信息、所述其他服务器的服务器功耗和功率封顶状态中的一个或多个的组合,并且
所述第二服务器信息包括:所述本机服务器的位置信息、所述本机服务器的服务器功耗和功率封顶状态中的一个或多个的组合。
4.根据权利要求1所述的服务器管理方法,其中,所述集群信息包括集群功率,并且所述根据所述集群信息对所述本机服务器启动第一操作进一步包括:
当所述集群功率超过预设的功率封顶阈值时对所述本机服务器启动第一操作。
5.一种集群中的服务器,其中,所述集群由多个服务器构成,所述集群中的服务器包括:
获取模块,用于获取除本机服务器之外的其他服务器的第一服务器信息;
确定模块,用于根据多个第一服务器信息和本机服务器的第二服务器信息确定所述集群的集群信息;
操作模块,用于根据所述集群信息对所述本机服务器启动第一操作。
6.根据权利要求5所述的服务器,其中,所述获取模块进一步用于:
基于简单服务发现协议获取所述第一服务器信息。
7.根据权利要求5所述的服务器,其中,所述第一服务器信息包括:
所述第一服务器信息包括:所述其他服务器的位置信息、所述其他服务器的服务器功耗和功率封顶状态中的一个或多个的组合,并且
所述第二服务器信息包括:所述本机服务器的位置信息、所述本机服务器的服务器功耗和功率封顶状态中的一个或多个的组合。
8.根据权利要求5所述的服务器,其中,所述集群信息包括集群功率,并且所述操作模块进一步用于:
当所述集群功率超过预设的功率封顶阈值时对所述本机服务器启动第一操作。
9.一种电子设备,包括:
存储器,用于存储程序;
处理器,用于运行所述存储器中存储的所述程序,以执行如权利要求1至4中任一所述的集群中的服务器管理方法。
10.一种计算机可读存储介质,其上存储有可被处理器执行的计算机程序,其中,所述程序被处理器执行时实现如权利要求1至4中任一所述的集群中的服务器管理方法。
CN202111058315.8A 2021-09-10 2021-09-10 服务器管理方法和服务器、电子设备及计算机可读存储介质 Active CN113505001B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111058315.8A CN113505001B (zh) 2021-09-10 2021-09-10 服务器管理方法和服务器、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111058315.8A CN113505001B (zh) 2021-09-10 2021-09-10 服务器管理方法和服务器、电子设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113505001A true CN113505001A (zh) 2021-10-15
CN113505001B CN113505001B (zh) 2022-05-31

Family

ID=78016937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111058315.8A Active CN113505001B (zh) 2021-09-10 2021-09-10 服务器管理方法和服务器、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113505001B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130040636A1 (en) * 2008-02-22 2013-02-14 Christophe S. Borg Method and system for monitoring a mobile equipment fleet
CN105635199A (zh) * 2014-10-28 2016-06-01 广州睿哲网络科技有限公司 一种支持负载均衡的自组织集群服务器实现方法和装置
CN105897827A (zh) * 2015-11-27 2016-08-24 乐视云计算有限公司 服务器节点、局域网服务器集群及其实现方法
CN107145393A (zh) * 2017-04-27 2017-09-08 努比亚技术有限公司 一种负载调整方法、设备及计算机可读存储介质
CN112947734A (zh) * 2021-03-04 2021-06-11 山东英信计算机技术有限公司 一种服务器电源功耗控制方法、系统、终端及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130040636A1 (en) * 2008-02-22 2013-02-14 Christophe S. Borg Method and system for monitoring a mobile equipment fleet
CN105635199A (zh) * 2014-10-28 2016-06-01 广州睿哲网络科技有限公司 一种支持负载均衡的自组织集群服务器实现方法和装置
CN105897827A (zh) * 2015-11-27 2016-08-24 乐视云计算有限公司 服务器节点、局域网服务器集群及其实现方法
CN107145393A (zh) * 2017-04-27 2017-09-08 努比亚技术有限公司 一种负载调整方法、设备及计算机可读存储介质
CN112947734A (zh) * 2021-03-04 2021-06-11 山东英信计算机技术有限公司 一种服务器电源功耗控制方法、系统、终端及存储介质

Also Published As

Publication number Publication date
CN113505001B (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
US20190200047A1 (en) Data processing method, apparatus, and system for live streaming page
US7779282B2 (en) Maintaining network connectivity while operating in low power mode
CN111045901B (zh) 容器的监控方法、装置、存储介质和电子设备
US9338642B2 (en) Method and apparatus for processing application program, and mobile terminal therefor
CN108924274B (zh) 域名系统dns处理方法、装置、存储介质及电子设备
CN107197507B (zh) 控制网络链接的方法、装置及移动终端
US20140075217A1 (en) Power Saving Network Controller
US10581697B2 (en) SDN controlled PoE management system
CN108337127B (zh) 应用性能监控方法、系统、终端及计算机可读存储介质
CN107092507A (zh) 应用程序的换肤方法、装置及系统
CN104753825A (zh) 即时通信多终端登录时登录状态的下发方法和系统
CN113505001B (zh) 服务器管理方法和服务器、电子设备及计算机可读存储介质
CN112003708A (zh) 一种接入设备的监测方法、装置、设备及介质
CN113067769A (zh) 路由器重启方法、装置、设备及存储介质
CN113420007A (zh) 数据库访问的审计处理方法、装置及电子设备
CN113596197B (zh) 一种地址切换方法、装置、电子设备及存储介质
CN113840313B (zh) 移动终端的网络模式控制方法、装置和计算机设备
CN114070884A (zh) 一种远程管理方法、远程管理设备、模块及可读存储介质
CN113612659A (zh) 设备连网测试方法、装置、电子设备及存储介质
KR20210091075A (ko) 트래픽 조정 방법 및 장치
CN108108124B (zh) 存储阵列和控制存储阵列的方法
US11825411B2 (en) Network device, method and computer readable medium for wireless networks
CN116527486B (zh) 设备独立功能自适应管理方法、装置、设备和介质
CN117033084B (zh) 虚拟机备份方法、装置、电子设备及存储介质
US20240007825A1 (en) Proximity-based network registration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40060926

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant