CN103873279A - 一种服务器管理方法,及装置 - Google Patents

一种服务器管理方法,及装置 Download PDF

Info

Publication number
CN103873279A
CN103873279A CN201210538753.9A CN201210538753A CN103873279A CN 103873279 A CN103873279 A CN 103873279A CN 201210538753 A CN201210538753 A CN 201210538753A CN 103873279 A CN103873279 A CN 103873279A
Authority
CN
China
Prior art keywords
server
unit
level
configuration file
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210538753.9A
Other languages
English (en)
Other versions
CN103873279B (zh
Inventor
林力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210538753.9A priority Critical patent/CN103873279B/zh
Priority to TW102135418A priority patent/TW201423429A/zh
Priority to PCT/CN2013/087369 priority patent/WO2014090070A1/en
Priority to US14/263,964 priority patent/US9985859B2/en
Publication of CN103873279A publication Critical patent/CN103873279A/zh
Application granted granted Critical
Publication of CN103873279B publication Critical patent/CN103873279B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/042Network management architectures or arrangements comprising distributed management centres cooperatively managing the network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/185Hierarchical storage management [HSM] systems, e.g. file migration or policies thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5055Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering software capabilities, i.e. software resources associated or available to the machine
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/044Network management architectures or arrangements comprising hierarchical management structures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/63Routing a service request depending on the request content or context
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Environmental & Geological Engineering (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明实施例公开了一种服务器管理方法,及装置,其中方法包括:获取集群服务器的配置文件;上述配置文件配置将各服务器按照业务逻辑分为预定的层级,各层级按树形拓扑结构分布;接收并解析接收到的操作指令,得到操作指令所对应的目标服务器;将上述操作指令按照上述配置文件中层级逐层转发至上述目标服务器。以上方案通过对服务器的分层管理,使服务器之间的逻辑关系更为简单,因此提供了有效的方式来梳理服务器之间的复杂关系。

Description

一种服务器管理方法,及装置
技术领域
本发明涉及通信技术领域,特别涉及一种服务器管理方法,及装置。
背景技术
服务器,也称伺服器。服务器是网络环境中的高性能计算机,它侦听网络上的其他计算机(客户机)提交的服务请求,并提供相应的服务,为此,服务器具有承担服务并且保障服务的能力。如网页(Web)服务器,它可能是指用于提供网站的计算机,也可能是指像Apache(一种虚拟主机软件)这样的软件,运行在这样的计算机上以管理网页组件和回应网页浏览器的请求。
服务器的高性能主要体现在高速度的运算能力、长时间的可靠运行、强大的外部数据吞吐能力等方面。服务器的构成与微机基本相似,有处理器、硬盘、内存、系统总线等,它们是针对具体的网络应用特别制定的,因而服务器与微机在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面存在差异很大。一个管理资源并为用户提供服务的计算机软件,通常分为文件服务器(能使用户在其它计算机访问文件),数据库服务器和应用程序服务器。
随着业务范围越来越大,客户端与服务器的交互越来越复杂,后台的服务器根据不同业务逻辑,会以集群方式分布。当业务数量和服务器数量增加到一定量级别后,管理服务器给服务器管理员增加了极大的负担,不同业务逻辑与IDC(Internet Data Center,因特网数据中心)的相互交错,导致服务器之间的关联错综复杂,操作困难并且频繁出错。于是需要一套有效的技术方案来梳理不同种类服务器之间的关系。
发明内容
本发明实施例提供了一种服务器管理方法,及装置,用于提供有效的方式来梳理服务器之间的复杂关系。
一种服务器管理方法,包括:
获取集群服务器的配置文件;上述配置文件配置将各服务器按照业务逻辑分为预定的层级,各层级按树形拓扑结构分布;
接收并解析接收到的操作指令,得到操作指令所对应的目标服务器;
将上述操作指令按照上述配置文件中层级逐层转发至上述目标服务器。
一种服务器管理装置,包括:
配置获取单元,用于获取集群服务器的配置文件;上述配置文件配置将各服务器按照业务逻辑分为预定的层级,各层级按树形拓扑结构分布;
指令解析单元,用于接收并解析接收到的操作指令,得到操作指令所对应的目标服务器;
指令转发单元,用于将上述操作指令按照上述配置文件中层级逐层转发至上述目标服务器。
从以上技术方案可以看出,本发明实施例具有以下优点:以上方案通过对服务器的分层管理,使服务器之间的逻辑关系更为简单,因此提供了有效的方式来梳理服务器之间的复杂关系。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例方法流程示意图;
图2为本发明实施例层级结构示意图;
图3为本发明实施例方法流程示意图;
图4为本发明实施例方法流程示意图;
图5为本发明实施例方法流程示意图;
图6为本发明实施例装置结构示意图;
图7为本发明实施例装置结构示意图;
图8为本发明实施例装置结构示意图;
图9为本发明实施例装置结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例提供了一种服务器管理方法,如图1所示,包括:
101:获取集群服务器的配置文件;上述配置文件配置将各服务器按照业务逻辑分为预定的层级,各层级按树形拓扑结构分布;
本发明实施例还给出了层级的举例,上述层级包括:四个层级,从上到下依次为:集群cluster、组group、集合set、单元unit;cluster作为最高层级的根节点,是提供相同服务的一组服务器、按照服务的运行环境划分cluster得到的group是cluster的子节点,按照不同业务划分group得到set,set是group的子节点,set的子节点是unit,unit是执行服务逻辑的执行服务器。后续实施例将就此给出更详细的结构性说明。需要说明的是,按照不同的需求,可能有更多层级也可以压缩层级更为扁平,具体层级的数量本发明实施例不予限定。
进一步地,本发明实施例还给出了负载监控方案,上述方法还包括:监控set的负载状态,若负载状态超过预定门限值,则发送需要扩容的提示。该方案可以实现负载的监控,智能提醒扩容。
进一步地,本发明实施例还给出了进行扩容的具体实现方案,具体为:接受用户登录,在确定登录的用户具有服务器搭建权限后,将配置文件拉取至缓存,并按照用户输入指示增加指定层级的节点到配置文件,并分配相应资源,然后启动增加的节点对应的服务器以及业务逻辑。
优选地,上述层级中,位于最底层的服务器互为主备,最底层的一个或者一个以上的服务器设置于一台实体服务器。若有一个以上的服务器设置于一台实体服务器,那么可以有效利用具有空闲资源的实体服务器。
进一步地,由于最底层的服务器互为主备本发明实施例还给出了服务器故障的解决方案:监测最底层的服务器的状态,在最底层的服务器出现故障后提示移除出现故障的最底层的服务器,使用故障的最底层的服务器的兄弟节点服务器执行上述故障的最底层的服务器的业务逻辑。由于最底层的服务器互为主备,最底层的服务器移除并不会影响到对客户的服务提供,因此即使最底层服务器出现故障也不会影响用户体验,实现平滑的故障处理。
102:接收并解析接收到的操作指令,得到操作指令所对应的目标服务器;
优选地,上述接收并解析接收到的操作指令包括:通过向用户展现的可视化操作界面接收操作指令,然后解析接收到的操作指令。通过向用户展现的可视化操作界面接收操作指令的方案有很多,例如使用UI(User Interface,用户界面)图形操作方式来接收操作指令。具体采用何种可视化操作界面并不影响本发明实施例的实现,本发明实施例对此不予限定。
103:将上述操作指令按照上述配置文件中层级逐层转发至上述目标服务器。
以上方案通过对服务器的分层管理,使服务器之间的逻辑关系更为简单,因此提供了有效的方式来梳理服务器之间的复杂关系。
可选地,上述将上述操作指令按照上述配置文件中层级逐层转发至上述目标服务器包括:若上述目标服务器对应的层级非最底层,则将以上述目标服务器对应层的服务器为根节点的子树作为目标服务器的单位,将上述操作指令按照上述配置文件中层级逐层转发至上述目标服务器的单位。另外,可以理解的是,如果目标服务器是最底层服务器,直接执行:将上述操作指令按照上述配置文件中层级逐层转发至上述目标服务器。
在后续实施例中,将对本发明实施例方法中提到层级结构进行举例说明,并对各种功能的实现进行分别举例说明,如下:
一、服务器分层
请参阅图2所示,服务器集群按照业务逻辑可以细分为集群cluster、组group、集合set、单元unit四层。Unit是最小的管理单元。拓扑关系如下图:
将提供相同服务的一组服务器定义为cluster,在同一个cluster下,根据公司的运营模式,抽象出不同的group,例如游戏分为正式服、体验服、测试服等。在具体的每一个group下,以业务为划分标准分出不同的set,每一个set中可以是一个业务,也可以是多个业务,对于小业务,可以多个业务公用一个set,对于用户量大的业务,可以独占一个set,划分标准管理员根据业务规模来定。例如图2中业务1~业务7。在每一个Set的子节点,是当前服务器的最小管理单元服务器,一般会在每一个set下面分布多个不同IDC的服务器,例如Server1~Server4。
以上拓扑结构的层级以及各层级的关系存储在配置文件中,以上各层级服务器的概念可以是逻辑服务器概念,在实体服务器上的分部情况本发明实施例不予限定。在后续实施例中将给出几个举例。
二、指令的转发
在每一台服务器上部署代理(agent),用于转发并执行中央管理服务器(处于管理位置的服务器)发送的指令,cluster、group、set、unit四层均可抽象出相同的命令对当前的节点以及兄弟节点、子节点进行相同的操作。例如,可以对group层抽象出升级操作,以group为单位升级服务器。在set层,针对每个业务抽象出进程启动、停止、加载配置等操作。以下给出一个举例,如图3所示,包括:
301:操作人员向服务器发送操作指令;
302:接收模块收到操作指令;
303:将指令放置到执行队列尾部;
304:中央处理器从队列中取出操作指令,并从操作指令中解析出命令执行的目标服务器;
305:中央服务器将命令转发给目标服务器的代理进程;
306:目标服务器代理进程接收到中央服务器转发的操作指令并执行;
307:代理进程将执行结果返回给中央服务器。
三、中央服务器的应用
可以设置一台中央服务器来管理众多cluster。具体的:以一些友好、简单的UI(User Interface用户界面)图形操作方式,来操作中央服务器,以实现管理cluster的目的。在本发明实施例应用的产品中,平台的服务器管理员可以用以门户网站(web portal)的方式来操作中央服务器;如图4所示,用户通过web portal将操作指令发送至中央服务器,中央服务器再将操作指令发送给不同的cluster,cluster1和或cluster2,进入cluster的代理(Agent)。
四、服务器备份
对于每一个set下的每一个服务器,各服务器之间可以相同,并且提供相同的服务,互为主备,比如set1下面分布10台服务器,set1中包含2个业务,那么这2个业务均在这个set的10台服务器中具有服务逻辑,对于一个业务来说,这10台服务器互为主备,互相备份。一个set中,业务越多,服务器的利用率就越高。
五、服务器扩容的监控
在上面服务器的部署结构架构中,实现服务器的平滑扩容,可以对其他并行的业务不产生影响,具体如下:对于每一个set,我们可以根据当前服务器的CPU(Central Processing Unit,中央处理器)、网卡收发包的数量、内存大小、服务器进程的繁忙程度等可量化的指标,来衡量每一套set的最大容量,并且在监控系统中,显示当前已经达到的负载,管理员可以依据当前set的容量,决定是否对服务器进行扩容。
六、服务器扩容
若管理员决定扩容,先选择合适的Group下的对应的Set,然后可以根据web portal的指引,进行服务器扩容操作。下面给出了一个举例,如图5所示,包括:
501:运维人员需要为新业务架设服务器,调用搭建业务接口进行登录;
502:判断是否拥有搭建权限,是,进入503,否则进入511;
503:确定缓存中是否存在服务器信息配置,该配置信息可以包含在配置文件中,是,进入504,否则进入512;
504:修改配置文件,将服务器资源分配给新业务,并纳入到中央管理器管理范围;
505:推送已修改的配置文件至中央管理服务器;
506:确定是否推送成功,是,进入507,否则进入511;
507:中央管理服务器加载推送的配置文件并根据指示分配服务器给新业务;
508:确定是否立即启动新业务服务器进程,是,进入509,否则可以返回处理结果并结束流程;
509:命令处理模块将启动命令放入命令执行队列;
510:中央处理器执行启动命令。
511:返回相应错误;结束流程。
512:从中央管理服务器拉取服务器配置文件至缓存;
513:确定是否拉取成功,是进入504,否则进入512。
七、集中部署
采用集中部署可以减小服务器的开销。由于,在传统的方式中,服务器是以零散的方式分布的。每一个服务器仅仅针对某一项业务提供单一的服务。对于某一些服务器负载很轻的业务,这样会造成极大的浪费,采用本发明实施例的方案管理服务器,以每一个set的容量为标准利用了服务器资源,在每一个set下面,只要一台服务器有足够多的资源,可以将多个unit搭建在同一台实体服务器上,这样就能最大的减小了服务器的花费。在本发明实施例的应用产品的应用试验:互娱有40个业务使用了服务器,按传统部署方式,一个业务根据IDC部署需要4台服务器,40个业务需要160台服务器。但是,这160台服务器中,有将近50%以上的业务由于用户量小,服务器资源没有充分利用,使用了本发明实施例防范以后,我们将用户量小的多个业务分配到一个set中,这个set以容量为标准,可以多个业务可以公用一台实体服务器。当set的负载达到80%时,我们再考虑扩容新的set以减小业务压力。这个方案实施以后,至少为公司节约了50%的服务器成本。
八、故障处理
当存在故障服务器时候,可以通过监测得到故障并发送告警来提示管理员。此时管理员可以直接将故障机器从set中移除。由于在每一个set下所有服务器都是相同的,服务器互为主备,因此当一台服务器发生故障时,客户端对这个故障是无感知的,基本对业务没有造成影响,移除以后如果剩余服务器负载太大,可以进行服务器的扩容,具体扩容方案请参阅前文。
本发明实施例还提供了一种服务器管理装置,如图6所示,包括:
配置获取单元601,用于获取集群服务器的配置文件;上述配置文件配置将各服务器按照业务逻辑分为预定的层级,各层级按树形拓扑结构分布;
指令解析单元602,用于接收并解析接收到的操作指令,得到操作指令所对应的目标服务器;
指令转发单元603,用于将上述操作指令按照上述配置文件中层级逐层转发至上述目标服务器。
以上方案通过对服务器的分层管理,使服务器之间的逻辑关系更为简单,因此提供了有效的方式来梳理服务器之间的复杂关系。
优选地,本发明实施例还给出了层级的举例,上述配置获取单元601,具体用于获取集群服务器的配置文件;上述配置文件配置将各服务器按照业务逻辑分为预定的层级,各层级按树形拓扑结构分布;层级包括:四个层级,从上到下依次为:集群cluster、组group、集合set、单元unit;cluster作为最高层级的根节点,是提供相同服务的一组服务器、按照服务的运行环境划分cluster得到的group是cluster的子节点,按照不同业务划分group得到set,set是group的子节点,set的子节点是unit,unit是执行服务逻辑的执行服务器。需要说明的是,按照不同的需求,可能有更多层级也可以压缩层级更为扁平,具体层级的数量本发明实施例不予限定。
进一步地,本发明实施例还给出了负载监控方案,如图7所示,上述装置还包括:
负载监控单元701,用于监控set的负载状态;
提示单元702,用于若负载监控单元701监控到负载状态超过预定门限值,则发送需要扩容的提示。
进一步地,本发明实施例还给出了进行扩容的具体实现方案,如图8所示,上述装置还包括:
权限控制单元801,用于接受用户登录,确定登录的用户是否具有服务器搭建权限;
资源控制单元803,用于在权限控制单元801确定登录的用户具有服务器搭建权限后,将配置文件拉取至缓存,并按照用户输入指示增加指定层级的节点到配置文件,并分配相应资源,然后启动增加的节点对应的服务器以及业务逻辑。
优选地,上述层级中,位于最底层的服务器互为主备,最底层的一个或者一个以上的服务器设置于一台实体服务器。若有一个以上的服务器设置于一台实体服务器,那么可以有效利用具有空闲资源的实体服务器。
进一步地,由于最底层的服务器互为主备本发明实施例还给出了服务器故障的解决方案:如图9所示,上述装置还包括:
状态监控单元901,用于监测最底层的服务器的状态;
逻辑控制单元902,用于在状态监控单元901检测到最底层的服务器出现故障后提示移除出现故障的最底层的服务器,使用故障的最底层的服务器的兄弟节点服务器执行上述故障的最底层的服务器的业务逻辑。
由于最底层的服务器互为主备,最底层的服务器移除并不会影响到对客户的服务提供,因此即使最底层服务器出现故障也不会影响用户体验,实现平滑的故障处理。
可选地,上述指令转发单元603,具体用于若上述目标服务器对应的层级非最底层,则将以上述目标服务器对应层的服务器为根节点的子树作为目标服务器的单位,将上述操作指令按照上述配置文件中层级逐层转发至上述目标服务器的单位。另外,可以理解的是,如果目标服务器是最底层服务器,直接执行:将上述操作指令按照上述配置文件中层级逐层转发至上述目标服务器。
可选地,上述指令解析单元602,具体用于通过向用户展现的可视化操作界面接收操作指令,然后解析接收到的操作指令。通过向用户展现的可视化操作界面接收操作指令的方案有很多,例如使用UI(User Interface,用户界面)图形操作方式来接收操作指令。具体采用何种可视化操作界面并不影响本发明实施例的实现,本发明实施例对此不予限定。
值得注意的是,上述装置实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,本领域普通技术人员可以理解实现上述各方法实施例中的全部或部分步骤是可以通过程序来指令相关的硬件完成,相应的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明实施例揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (16)

1.一种服务器管理方法,其特征在于,包括:
获取集群服务器的配置文件;所述配置文件配置将各服务器按照业务逻辑分为预定的层级,各层级按树形拓扑结构分布;
接收并解析接收到的操作指令,得到操作指令所对应的目标服务器;
将所述操作指令按照所述配置文件中层级逐层转发至所述目标服务器。
2.根据权利要求1所述方法,其特征在于,所述层级包括:
四个层级,从上到下依次为:集群cluster、组group、集合set、单元unit;
cluster作为最高层级的根节点,是提供相同服务的一组服务器、按照服务的运行环境划分cluster得到的group是cluster的子节点,按照不同业务划分group得到set,set是group的子节点,set的子节点是unit,unit是执行服务逻辑的执行服务器。
3.根据权利要求2所述方法,其特征在于,还包括:
监控set的负载状态,若负载状态超过预定门限值,则发送需要扩容的提示。
4.根据权利要求3所述方法,其特征在于,还包括:
接受用户登录,在确定登录的用户具有服务器搭建权限后,将配置文件拉取至缓存,并按照用户输入指示增加指定层级的节点到配置文件,并分配相应资源,然后启动增加的节点对应的服务器以及业务逻辑。
5.根据权利要求1至4任意一项所述方法,其特征在于,所述层级中,位于最底层的服务器互为主备,最底层的一个或者一个以上的服务器设置于一台实体服务器。
6.根据权利要求5所述方法,其特征在于,包括:
监测最底层的服务器的状态,在最底层的服务器出现故障后提示移除出现故障的最底层的服务器,使用故障的最底层的服务器的兄弟节点服务器执行所述故障的最底层的服务器的业务逻辑。
7.根据权利要求1所述方法,其特征在于,所述将所述操作指令按照所述配置文件中层级逐层转发至所述目标服务器包括:
若所述目标服务器对应的层级非最底层,则将以所述目标服务器对应层的服务器为根节点的子树作为目标服务器的单位,将所述操作指令按照所述配置文件中层级逐层转发至所述目标服务器的单位。
8.根据权利要求1所述方法,其特征在于,所述接收并解析接收到的操作指令包括:
通过向用户展现的可视化操作界面接收操作指令,然后解析接收到的操作指令。
9.一种服务器管理装置,其特征在于,包括:
配置获取单元,用于获取集群服务器的配置文件;所述配置文件配置将各服务器按照业务逻辑分为预定的层级,各层级按树形拓扑结构分布;
指令解析单元,用于接收并解析接收到的操作指令,得到操作指令所对应的目标服务器;
指令转发单元,用于将所述操作指令按照所述配置文件中层级逐层转发至所述目标服务器。
10.根据权利要求9所述装置,其特征在于,
所述配置获取单元,具体用于获取集群服务器的配置文件;所述配置文件配置将各服务器按照业务逻辑分为预定的层级,各层级按树形拓扑结构分布;层级包括:四个层级,从上到下依次为:集群cluster、组group、集合set、单元unit;cluster作为最高层级的根节点,是提供相同服务的一组服务器、按照服务的运行环境划分cluster得到的group是cluster的子节点,按照不同业务划分group得到set,set是group的子节点,set的子节点是unit,unit是执行服务逻辑的执行服务器。
11.根据权利要求10所述装置,其特征在于,还包括:
负载监控单元,用于监控set的负载状态;
提示单元,用于若负载监控单元监控到负载状态超过预定门限值,则发送需要扩容的提示。
12.根据权利要求11所述装置,其特征在于,还包括:
权限控制单元,用于接受用户登录,确定登录的用户是否具有服务器搭建权限;
资源控制单元,用于在权限控制单元确定登录的用户具有服务器搭建权限后,将配置文件拉取至缓存,并按照用户输入指示增加指定层级的节点到配置文件,并分配相应资源,然后启动增加的节点对应的服务器以及业务逻辑。
13.根据权利要求9至12任意一项所述装置,其特征在于,所述层级中,位于最底层的服务器互为主备,最底层的一个或者一个以上的服务器设置于一台实体服务器。
14.根据权利要求13所述装置,其特征在于,包括:
状态监控单元,用于监测最底层的服务器的状态;
逻辑控制单元,用于在状态监控单元检测到最底层的服务器出现故障后提示移除出现故障的最底层的服务器,使用故障的最底层的服务器的兄弟节点服务器执行所述故障的最底层的服务器的业务逻辑。
15.根据权利要求9所述装置,其特征在于,
所述指令转发单元,具体用于若所述目标服务器对应的层级非最底层,则将以所述目标服务器对应层的服务器为根节点的子树作为目标服务器的单位,将所述操作指令按照所述配置文件中层级逐层转发至所述目标服务器的单位。
16.根据权利要求9所述装置,其特征在于,
所述指令解析单元,具体用于通过向用户展现的可视化操作界面接收操作指令,然后解析接收到的操作指令。
CN201210538753.9A 2012-12-13 2012-12-13 一种服务器管理方法,及装置 Active CN103873279B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201210538753.9A CN103873279B (zh) 2012-12-13 2012-12-13 一种服务器管理方法,及装置
TW102135418A TW201423429A (zh) 2012-12-13 2013-09-30 伺服器管理方法及裝置
PCT/CN2013/087369 WO2014090070A1 (en) 2012-12-13 2013-11-19 Method and system for managing servers
US14/263,964 US9985859B2 (en) 2012-12-13 2014-04-28 Method and system for managing servers

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210538753.9A CN103873279B (zh) 2012-12-13 2012-12-13 一种服务器管理方法,及装置

Publications (2)

Publication Number Publication Date
CN103873279A true CN103873279A (zh) 2014-06-18
CN103873279B CN103873279B (zh) 2015-07-15

Family

ID=50911429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210538753.9A Active CN103873279B (zh) 2012-12-13 2012-12-13 一种服务器管理方法,及装置

Country Status (4)

Country Link
US (1) US9985859B2 (zh)
CN (1) CN103873279B (zh)
TW (1) TW201423429A (zh)
WO (1) WO2014090070A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015154473A1 (zh) * 2014-07-16 2015-10-15 中兴通讯股份有限公司 跳板处理方法及装置
CN105471607A (zh) * 2014-09-04 2016-04-06 中国石油化工股份有限公司 一种大规模集群节点动态信息的树形监视方法
CN105592110A (zh) * 2014-10-20 2016-05-18 中兴通讯股份有限公司 一种资源调度方法及装置
CN105933166A (zh) * 2016-06-30 2016-09-07 北京奇艺世纪科技有限公司 一种服务器管理方法及装置
CN106059798A (zh) * 2016-05-18 2016-10-26 厦门市美亚柏科信息股份有限公司 一种基于节点集合的多层管理系统
CN106453549A (zh) * 2016-10-08 2017-02-22 中国工商银行股份有限公司 一种分布式软件版本发布方法及系统
CN107623587A (zh) * 2017-07-25 2018-01-23 郑州云海信息技术有限公司 一种网络拓扑管理系统及网络管理方法
CN109240996A (zh) * 2018-08-23 2019-01-18 平安科技(深圳)有限公司 附件导出方法、装置、计算机设备及计算机可读存储介质
CN109621430A (zh) * 2018-12-12 2019-04-16 网易(杭州)网络有限公司 游戏服务端系统、游戏控制方法、装置、介质及电子设备
CN109714328A (zh) * 2018-12-24 2019-05-03 网易(杭州)网络有限公司 游戏集群的容量调整方法和装置
CN110266720A (zh) * 2019-07-05 2019-09-20 上海麦克风文化传媒有限公司 在线管理服务器资产数据的优化工作方法
CN111338617A (zh) * 2020-02-26 2020-06-26 北京慧博科技有限公司 使用xml和python集中控制linux的方法
CN111600749A (zh) * 2020-04-29 2020-08-28 厦门市美亚柏科信息股份有限公司 一种多个服务器的管理方法、系统及计算机存储介质

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10078534B2 (en) 2015-01-23 2018-09-18 Cisco Technology, Inc. Network-aware workload placement in a data center
US10437510B2 (en) * 2015-02-03 2019-10-08 Netapp Inc. Monitoring storage cluster elements
EP3320435A1 (en) * 2015-07-09 2018-05-16 Telecom Italia S.p.A. Method and system of ict services provisioning
US10387198B2 (en) 2016-08-11 2019-08-20 Rescale, Inc. Integrated multi-provider compute platform
US10193762B2 (en) * 2016-08-11 2019-01-29 Rescale, Inc. Dynamic optimization of simulation resources
US9742871B1 (en) * 2017-02-24 2017-08-22 Spotify Ab Methods and systems for session clustering based on user experience, behavior, and interactions
US9942356B1 (en) * 2017-02-24 2018-04-10 Spotify Ab Methods and systems for personalizing user experience based on personality traits
US11100531B2 (en) * 2018-06-08 2021-08-24 Groupon, Inc. Method and apparatus for clustering platform sessions and user accounts associated with the platform sessions
CN111581042B (zh) * 2019-02-15 2023-09-12 网宿科技股份有限公司 一种集群部署方法、部署平台及待部署服务器
CN110855473B (zh) * 2019-10-16 2022-11-18 平安科技(深圳)有限公司 一种监控方法、装置、服务器及存储介质
CN111082964B (zh) * 2019-10-18 2023-03-03 网宿科技股份有限公司 一种配置信息的分发方法和装置
CN112115016B (zh) * 2020-08-06 2024-07-23 北京水滴科技集团有限公司 应用性能监控系统
CN112269714B (zh) * 2020-10-23 2023-02-28 山东云海国创云计算装备产业创新中心有限公司 一种服务器bmc集中管理系统、方法、设备及介质
CN112702203A (zh) * 2020-12-22 2021-04-23 上海智迩智能科技有限公司 一种nginx集群白屏化配置管理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1805379A (zh) * 2006-01-05 2006-07-19 西安交通大学 一种具有弹性体系架构的集群管理监控系统的构建方法
US7219160B1 (en) * 1999-08-27 2007-05-15 At&T Corp. Method for fast network-aware clustering
CN102412988A (zh) * 2011-11-14 2012-04-11 浪潮(北京)电子信息产业有限公司 一种业务信息系统及其实现持续运营的方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7024466B2 (en) * 2000-04-07 2006-04-04 Movielink, Llc Network configured for delivery of content for download to a recipient
CN1256684C (zh) * 2002-12-27 2006-05-17 联想(北京)有限公司 一种大规模机群的机群管理系统及其信息处理方法
US7493624B1 (en) * 2003-12-30 2009-02-17 Sap Ag Management architecture and method employed within a clustered node configuration
US20060053216A1 (en) * 2004-09-07 2006-03-09 Metamachinix, Inc. Clustered computer system with centralized administration
US7512707B1 (en) * 2005-11-03 2009-03-31 Adobe Systems Incorporated Load balancing of server clusters
CN101035113A (zh) * 2006-03-09 2007-09-12 董崇军 一种终端访问服务器群的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7219160B1 (en) * 1999-08-27 2007-05-15 At&T Corp. Method for fast network-aware clustering
CN1805379A (zh) * 2006-01-05 2006-07-19 西安交通大学 一种具有弹性体系架构的集群管理监控系统的构建方法
CN102412988A (zh) * 2011-11-14 2012-04-11 浪潮(北京)电子信息产业有限公司 一种业务信息系统及其实现持续运营的方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015154473A1 (zh) * 2014-07-16 2015-10-15 中兴通讯股份有限公司 跳板处理方法及装置
CN105471607A (zh) * 2014-09-04 2016-04-06 中国石油化工股份有限公司 一种大规模集群节点动态信息的树形监视方法
CN105592110A (zh) * 2014-10-20 2016-05-18 中兴通讯股份有限公司 一种资源调度方法及装置
CN106059798B (zh) * 2016-05-18 2019-10-01 厦门市美亚柏科信息股份有限公司 一种基于节点集合的多层管理系统
CN106059798A (zh) * 2016-05-18 2016-10-26 厦门市美亚柏科信息股份有限公司 一种基于节点集合的多层管理系统
CN105933166A (zh) * 2016-06-30 2016-09-07 北京奇艺世纪科技有限公司 一种服务器管理方法及装置
CN106453549B (zh) * 2016-10-08 2019-09-13 中国工商银行股份有限公司 一种分布式软件版本发布方法及系统
CN106453549A (zh) * 2016-10-08 2017-02-22 中国工商银行股份有限公司 一种分布式软件版本发布方法及系统
CN107623587A (zh) * 2017-07-25 2018-01-23 郑州云海信息技术有限公司 一种网络拓扑管理系统及网络管理方法
CN107623587B (zh) * 2017-07-25 2021-06-29 郑州云海信息技术有限公司 一种网络拓扑管理系统及网络管理方法
CN109240996A (zh) * 2018-08-23 2019-01-18 平安科技(深圳)有限公司 附件导出方法、装置、计算机设备及计算机可读存储介质
CN109240996B (zh) * 2018-08-23 2024-02-27 平安科技(深圳)有限公司 附件导出方法、装置、计算机设备及计算机可读存储介质
CN109621430A (zh) * 2018-12-12 2019-04-16 网易(杭州)网络有限公司 游戏服务端系统、游戏控制方法、装置、介质及电子设备
CN109714328A (zh) * 2018-12-24 2019-05-03 网易(杭州)网络有限公司 游戏集群的容量调整方法和装置
CN110266720A (zh) * 2019-07-05 2019-09-20 上海麦克风文化传媒有限公司 在线管理服务器资产数据的优化工作方法
CN110266720B (zh) * 2019-07-05 2022-02-08 上海麦克风文化传媒有限公司 在线管理服务器资产数据的优化工作方法
CN111338617A (zh) * 2020-02-26 2020-06-26 北京慧博科技有限公司 使用xml和python集中控制linux的方法
CN111600749A (zh) * 2020-04-29 2020-08-28 厦门市美亚柏科信息股份有限公司 一种多个服务器的管理方法、系统及计算机存储介质
CN111600749B (zh) * 2020-04-29 2023-01-24 厦门市美亚柏科信息股份有限公司 一种多个服务器的管理方法、系统及计算机存储介质

Also Published As

Publication number Publication date
US20140237114A1 (en) 2014-08-21
US9985859B2 (en) 2018-05-29
CN103873279B (zh) 2015-07-15
TW201423429A (zh) 2014-06-16
WO2014090070A1 (en) 2014-06-19

Similar Documents

Publication Publication Date Title
CN103873279B (zh) 一种服务器管理方法,及装置
CN107689953B (zh) 一种面向多租户云计算的容器安全监控方法及系统
CN105357038B (zh) 监控虚拟机集群的方法和系统
EP3979592A1 (en) Decentralization processing method, communication proxy, host and storage medium
WO2023142054A1 (zh) 一种面向容器微服务的性能监控告警方法及告警系统
CN103607297B (zh) 一种计算机集群系统的故障处理方法
CN105095001B (zh) 分布式环境下虚拟机异常恢复方法
EP3255833B1 (en) Alarm information processing method, relevant device and system
CN104408071A (zh) 一种基于集群管理器的分布式数据库高可用方法及系统
CN108347339B (zh) 一种业务恢复方法及装置
CN113452607B (zh) 分布式链路采集的方法、装置、计算设备和存储介质
CN103647820A (zh) 用于分布式集群系统的仲裁方法及仲裁装置
CN112948063A (zh) 云平台的创建方法、装置、云平台以及云平台实现系统
CN117608825A (zh) 基于多云管理平台的资源管理方法和相关设备
CN116089005A (zh) 一种服务器容器实例的自动迁移方法和装置
CN117130730A (zh) 面向联邦Kubernetes集群的元数据管理方法
CN107453888B (zh) 高可用性的虚拟机集群的管理方法及装置
US20120054324A1 (en) Device, method, and storage medium for detecting multiplexed relation of applications
Lin et al. Research on building an innovative electric power marketing business application system based on cloud computing and microservices architecture technologies
CN109981782A (zh) 用于集群脑裂的远端存储异常处理方法及系统
US11544091B2 (en) Determining and implementing recovery actions for containers to recover the containers from failures
CN113254245A (zh) 一种存储集群的故障检测方法和系统
CN103034545A (zh) 基于ace的通信框架和方法、及功能模块间的通信方法
US6496863B1 (en) Method and system for communication in a heterogeneous network
CN115580522A (zh) 一种容器云平台运行状态的监控方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant