CN117155767A - 服务器的管理方法、装置、设备、存储介质和程序产品 - Google Patents

服务器的管理方法、装置、设备、存储介质和程序产品 Download PDF

Info

Publication number
CN117155767A
CN117155767A CN202311125225.5A CN202311125225A CN117155767A CN 117155767 A CN117155767 A CN 117155767A CN 202311125225 A CN202311125225 A CN 202311125225A CN 117155767 A CN117155767 A CN 117155767A
Authority
CN
China
Prior art keywords
server
main
standby
servers
slave
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311125225.5A
Other languages
English (en)
Inventor
王梓博
翟菁
边新梅
印凌潼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202311125225.5A priority Critical patent/CN117155767A/zh
Publication of CN117155767A publication Critical patent/CN117155767A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/22Arrangements for detecting or preventing errors in the information received using redundant apparatus to increase reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/141Setup of application sessions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请涉及一种服务器的管理方法、装置、计算机设备、存储介质和计算机程序产品。涉及服务器管理技术领域,可用于金融科技领域或其他相关领域,所述方法包括:从服务器集群中选定主服务器和主服务器对应的备用服务器;为主服务器和主服务器对应的备用服务器配置Redis数据库,对主服务器与备用服务器进行数据同步;建立主服务器与每个从服务器之间的安全通道,为与主服务器通信的多个从服务器部署监测脚本,检测主服务器是否出现故障;在检测到主服务器出现故障的情况下,从主服务器对应的备用服务器中选定一个服务器作为主服务器。采用本方法能够提高了对服务器管理的效率,并降低了人力成本。

Description

服务器的管理方法、装置、设备、存储介质和程序产品
技术领域
本申请涉及服务器管理技术领域,特别是涉及一种服务器的管理方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
网络部门存在大量不同性能配置的用于办公环境和生产环境的服务器,从用途上可规划为工具、组件以及网络管理服务器。
传统技术中,是由运维人员对大量服务器进行一一监测,以进行管理。
然而,采用人工对大量服务器进行一一管理的方式,人力成本比较高。无法及时地监测每个服务器,导致对服务器的管理效率比较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高服务器的管理效率的服务器的管理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种服务器的管理方法。所述方法包括:
从服务器集群中选定目标服务器,所述目标服务器包括主服务器和所述主服务器对应的备用服务器;
为主服务器和所述主服务器对应的备用服务器配置Redis数据库,对所述主服务器与备用服务器进行数据同步;
建立主服务器与每个从服务器之间的安全通道,所述从服务器为在所述服务器集群中除目标服务器的剩余服务器;
为与所述主服务器通信的多个从服务器部署监测脚本,所述监测脚本用于获取所述从服务器的指标数据;
检测所述主服务器是否出现故障;
在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器。
在其中一个实施例中,所述从服务器集群中选定目标服务器,包括:
获取服务器集群中各个服务器的配置参数,所述配置参数包括处理器性能参数和存储性能参数;
根据所述配置参数,从所述服务器集群中选取预设数量个且符合预设条件的服务器作为目标服务器,所述预设条件为所述处理器性能参数大于第一预设阈值,且所述存储性能参数大于第二预设阈值。
在其中一个实施例中,所述对所述主服务器与备用服务器进行数据同步,包括:
获取目标服务器的地址信息和端口信息;
根据所述地址信息和所述端口信息,建立主服务器与备用服务器间的通信链路;
在检测到所述主服务器中存储的数据出现变化后,将变化后的数据同步至所述主服务器对应的备用服务器。
在其中一个实施例中,所述建立主服务器与每个从服务器之间的安全通道,包括:
获取密钥信息,所述密钥信息包括公钥信息和私钥信息;
获取所述从服务器的地址信息;
根据所述地址信息,通过主服务器将所述公钥信息发送至对应的从服务器。
在其中一个实施例中,在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器,包括:
在检测到所述主服务器出现故障的情况下,获取所述备用服务器的当前性能信息;所述当前性能信息包括所述备用服务器的当前资源使用占比;
根据所述备用服务器的当前资源使用占比,选定所述当前资源使用占比最小的备用服务器作为当前主服务器。
在其中一个实施例中,所述方法还包括:
在所述主服务器接收到任务管理请求的情况下,选取所述任务管理请求中的标识信息对应的从服务器;
将所述任务管理请求发送至与所述标识信息对应的从服务器,以使所述从服务器根据所述任务管理请求执行相应的任务处理操作。
第二方面,本申请还提供了一种服务器的管理装置。所述装置包括:
目标服务器选定模块,用于从服务器集群中选定目标服务器,所述目标服务器包括主服务器和所述主服务器对应的备用服务器;
数据同步模块,用于为主服务器和所述主服务器对应的备用服务器配置Redis数据库,对所述主服务器与备用服务器进行数据同步;
安全通道建立模块,用于建立主服务器与每个从服务器之间的安全通道,所述从服务器为在所述服务器集群中除目标服务器的剩余服务器;
监测脚本部署模块,用于为与所述主服务器通信的多个从服务器部署监测脚本,所述监测脚本用于获取所述从服务器的指标数据;
故障检测模块,用于检测所述主服务器是否出现故障;
主服务器切换模块,用于在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
从服务器集群中选定目标服务器,所述目标服务器包括主服务器和所述主服务器对应的备用服务器;
为主服务器和所述主服务器对应的备用服务器配置Redis数据库,对所述主服务器与备用服务器进行数据同步;
建立主服务器与每个从服务器之间的安全通道,所述从服务器为在所述服务器集群中除目标服务器的剩余服务器;
为与所述主服务器通信的多个从服务器部署监测脚本,所述监测脚本用于获取所述从服务器的指标数据;
检测所述主服务器是否出现故障;
在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
从服务器集群中选定目标服务器,所述目标服务器包括主服务器和所述主服务器对应的备用服务器;
为主服务器和所述主服务器对应的备用服务器配置Redis数据库,对所述主服务器与备用服务器进行数据同步;
建立主服务器与每个从服务器之间的安全通道,所述从服务器为在所述服务器集群中除目标服务器的剩余服务器;
为与所述主服务器通信的多个从服务器部署监测脚本,所述监测脚本用于获取所述从服务器的指标数据;
检测所述主服务器是否出现故障;
在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
从服务器集群中选定目标服务器,所述目标服务器包括主服务器和所述主服务器对应的备用服务器;
为主服务器和所述主服务器对应的备用服务器配置Redis数据库,对所述主服务器与备用服务器进行数据同步;
建立主服务器与每个从服务器之间的安全通道,所述从服务器为在所述服务器集群中除目标服务器的剩余服务器;
为与所述主服务器通信的多个从服务器部署监测脚本,所述监测脚本用于获取所述从服务器的指标数据;
检测所述主服务器是否出现故障;
在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器。
上述服务器管理方法、装置、计算机设备、存储介质和计算机程序产品,从服务器集群中选定主服务器和主服务器对应的备用服务器;为主服务器和主服务器对应的备用服务器配置Redis数据库,对主服务器与备用服务器进行数据同步;建立主服务器与每个从服务器之间的安全通道,为与主服务器通信的多个从服务器部署监测脚本,检测主服务器是否出现故障;在检测到主服务器出现故障的情况下,从主服务器对应的备用服务器中选定一个服务器作为主服务器,相对于传统技术中采用人工对大量服务器进行一一管理的方式,本方法中,在选定主服务器和主服务器对应的备用服务器后,通过主服务器建立与每个从服务器的安全通道,保证了主服务器与从服务器的安全通信;通过为主服务器通信的多个从服务器部署检测脚本,实现了实时对从服务器的监测;在识别出主服务器故障的情况下,通过备用服务器接管主服务器,实现继续提供服务,从而在提高了对服务器管理的效率的同时,降低了人力成本。
附图说明
图1为一个实施例中服务器的管理方法的流程示意图;
图2为一个实施例中多个服务器连接的结构图;
图3为一个实施例中主服务器切换的流程示意图;
图4为另一个实施例中服务器的管理方法的流程示意图;
图5为一个实施例中服务器的管理装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种服务器的管理方法,包括以下步骤:
步骤102,从服务器集群中选定目标服务器,所述目标服务器包括主服务器和所述主服务器对应的备用服务器。
其中,服务器集群包括多个服务器。目标服务器可以包括主服务器和主服务器对应的备用服务器。备用服务器的数量可以为一个或多个。在具体实践中,主服务器的选定可以根据实际情况进行选定。具体地,可以将目标服务器中当前性能最佳的服务器作为主服务器。
示例性地,从服务器集群中选定主服务器和主服务器对应的备用服务器。具体地,可以获取服务器集群中每个服务器的配置信息,根据每个服务器的配置信息,选定主服务器和主服务器对应的备用服务器。
步骤104,为主服务器和所述主服务器对应的备用服务器配置Redis数据库,对所述主服务器与备用服务器进行数据同步。
在具体实践中,可以为主服务器和主服务器对应的备用服务器均配置Redis数据库。在为主服务器和备用服务器配置Redis数据库的过程中,主服务器的Redis数据库用于写入数据,而一个或多个备用服务器的Redis数据库用于复制主服务器的数据。
在一示例中,若主服务器为服务器A,备用服务器为服务器B,为服务器A和服务器B配置Redis数据库的过程可以为:具体地,通过包管理工具分别在服务器A和服务器B中进行安装Redis数据库,通过编辑Redis配置文件,并为服务器A指定端口信息和密码信息,为服务器B指定服务器A的端口信息、IP地址和密码信息等。
示例性地,分别为主服务器和主服务器对应的备用服务器配置Redis数据库,在配置Redis数据库后,建立主服务器与备用服务器的通信链路;通过主服务器与备用服务器的通信链路,实现主服务器与备用服务器之间的数据同步。
步骤106,建立主服务器与每个从服务器之间的安全通道,所述从服务器为在所述服务器集群中除目标服务器的剩余服务器。
其中,可以建立目标服务器与每个从服务器的安全通道。具体地,可以建立主服务器与每个从服务器之间的安全通道,以及建立主服务器对应的备用服务器与每个从服务器之间的安全通道。
示例性地,建立主服务器与每个从服务器之间的安全通道,具体地,可以通过在主服务器中生成密钥信息,以通过密钥信息,建立主服务器与每个从服务器的安全通道。
在具体实践中,主服务器与每个从服务器之间的安全通道可以通过SSH(SecureShell Protocol,安全外壳协议)密钥对进行建立。
步骤108,为与所述主服务器通信的多个从服务器部署监测脚本,所述监测脚本用于获取所述从服务器的指标数据。
其中,指标数据包括从服务器的性能数据和业务指标数据,性能数据为CPU使用率等系统动态参数,业务指标数据可以包括业务服务的配置数据等。具体地,可以通过监测脚本进行设定想要监测的指标数据。
示例性地,通过安全通道,为与主服务器通信的多个从服务器部署监测脚本,以获取从服务器的指标数据。
在具体实践中,在每一台从服务器中配置Prometheus(普罗米修斯)组件,以通过监测脚本,获取指标数据。具体地,可以设置定期收集指标数据的方式,进行收集每个从服务器的指标数据,并按照预设周期,控制删除从服务器中的指标数据,无需在从服务器中保留长期的指标数据,以保证从服务器的基本性能。
具体地,可以为每一个从服务器配置InfluxDB(时序)数据库,从而将采集的指标数据记录至InfluxDB数据库,以便采用可视化的工具对指标数据进行分析。
为了更好地理解本发明中服务器之间的连接关系,参考图2,示出一个实施例中多个服务器连接的结构图,可以包括,主服务器、备用服务器,以及N个从服务器,每一个从服务器对应着一个监测脚本。
主服务器与每个从服务器建立安全通道进行通信,并在每个从服务器中部署有监测脚本,主服务器对应的备用服务器与每个从服务器建立安全通道进行通信。
步骤110,检测所述主服务器是否出现故障。
在具体实践中,检测主服务器是否出现故障的方式可以为心跳检测、外部检测系统检测、哨兵模式检测等等,具体地,心跳检测的过程为通过在主服务器上部署一个心跳监测机制,以定时发送心跳信号,若在预设时长中没有收到心跳信号,则会判定主服务器出现故障。外部检测系统检测的过程为通过定期对主服务器进行Ping或TCP连接测试,若主服务器不响应Ping或TCP连接测试,则判定主服务器出现故障。哨兵模式检测为Redis Sentinel(哨兵)是Redis官方提供的一个用于监控和管理Redis实例的工具,可以通过配置哨兵工具,实现对主服务器的故障检测。
步骤112,在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器。
示例性地,在检测到主服务器出现故障的情况下,从主服务器对应的备用服务器选定一个服务器作为主服务器,具体地,在检测到主服务器出现故障的情况下,可以获取备用服务器的当前性能信息,以进行选定一个备用服务器作为主服务器。
在具体实践中,在配置Redis数据库后,建立主服务器与备用服务器的通信链路;通过主服务器与备用服务器的通信链路,实现主服务器与备用服务器之间的数据同步,并且,通过为主服务器和备用服务器均配置Redis数据库,实现系统高可用性和加快了系统故障恢复速度。当主服务器发生故障时,备用服务器可以自动切换为主服务器,保持系统的正常运行。
上述服务器的管理方法中,从服务器集群中选定主服务器和主服务器对应的备用服务器;为主服务器和主服务器对应的备用服务器配置Redis数据库,对主服务器与备用服务器进行数据同步;建立主服务器与每个从服务器之间的安全通道,为与主服务器通信的多个从服务器部署监测脚本,检测主服务器是否出现故障;在检测到主服务器出现故障的情况下,从主服务器对应的备用服务器中选定一个服务器作为主服务器,相对于传统技术中采用人工对大量服务器进行一一管理的方式,本方法中,在选定主服务器和主服务器对应的备用服务器后,通过主服务器建立与每个从服务器的安全通道,保证了主服务器与从服务器的安全通信;通过为主服务器通信的多个从服务器部署检测脚本,实现了实时对从服务器的监测;在识别出主服务器故障的情况下,通过备用服务器接管主服务器,实现继续提供服务,从而在提高了对服务器管理的效率的同时,降低了人力成本。
在一个实施例中,步骤102,包括:
步骤1022,获取服务器集群中各个服务器的配置参数,所述配置参数包括处理器性能参数和存储性能参数。
步骤1024,根据所述配置参数,从所述服务器集群中选取预设数量个且符合预设条件的服务器作为目标服务器,所述预设条件为所述处理器性能参数大于第一预设阈值,且所述存储性能参数大于第二预设阈值。
其中,配置参数可以包括处理器性能参数和存储性能参数。处理器性能参数为物理处理器的核心数,一般可以为双核、4核、6核、8核、16核等。存储性能参数可以为服务器的运行内存,一般为8G、16G以及32G等。
在具体实践中,一般采用处理器性能参数为8核以上,存储性能参数为16G运行内存以上的服务器作为目标服务器。
示例性地,可以通过获取服务器集群中每个服务器的处理器性能参数和存储性能参数,以选取预设数量个、处理器性能参数大于第一预设阈值,且存储性能参数大于第二预设阈值的服务器作为目标服务器。具体地,预设数量的大小、第一预设阈值、第二预设阈值可以根据时间情况进行设定,本发明在此不作限定。
在上述实施例中,根据服务器集群中各个服务器的配置参数,以选定处理性能参数大于第一预设阈值,且存储性能参数大于第二预设阈值的服务器作为目标服务器,以确保选定的目标服务器的处理器性能参数和存储性能参数处于良好状态,有利于通过主服务器对从服务器的监测。
在一个实施例中,步骤104,包括:
步骤1042,获取目标服务器的地址信息和端口信息。
步骤1044,根据所述地址信息和所述端口信息,建立主服务器与备用服务器间的通信链路。
步骤1046,在检测到所述主服务器中存储的数据出现变化后,将变化后的数据同步至所述主服务器对应的备用服务器。
其中,地址信息可以为IP地址信息。
示例性地,根据目标服务器的地址信息和端口信息,建立主服务器与备用服务器间的通信链路,在检测到主服务器中存储的数据发生变化后,将变化后的数据同步至主服务器对应的备用服务器。
在具体实践中,主服务器与备用服务器都配置有Redis数据库,主服务器的Redis数据库用于写入数据,一个或多个备用服务器的Redis数据库用于复制主服务器的数据。在建立主服务器与备用服务器间的通信链路的情况下,在检测到主服务器中存储的数据发生变化后,将变化后的数据同步至主服务器对应的备用服务器。
在上述实施例中,通过主服务器与备用服务器建立数据同步,实现了在主服务器存在故障的情况下,可以通过使用备用服务器进行切换主服务器,从而降低了系统的停机时间,维持系统的使用性能。
在一个实施例中,步骤106,包括:
步骤1062,获取密钥信息,所述密钥信息包括公钥信息和私钥信息。
步骤1064,获取所述从服务器的地址信息。
步骤1066,根据所述地址信息,通过主服务器将所述公钥信息发送至对应的从服务器。
其中,密钥信息可以包括公钥信息和私钥信息。
在具体实践中,在主服务器上生成密钥信息,即SSH密钥对,包括公钥信息和私钥信息,通过主服务器将公钥信息发送至对应的从服务器,以建立安全通道。
在上述实施例中,获取密钥信息以及从服务器的地址信息,以根据地址信息,通过主服务器将公钥信息发送至对应的从服务器,实现了建立主服务器与每个从服务器之间的安全通道,以确保了主服务器与每个从服务器之间安全、高效的通信。
在一个实施例中,参考图3,示出了主服务器切换的流程示意图,步骤112,包括:
步骤302,在检测到所述主服务器出现故障的情况下,获取所述备用服务器的当前性能信息;所述当前性能信息包括所述备用服务器的当前资源使用占比。
步骤304,根据所述备用服务器的当前资源使用占比,选定所述当前资源使用占比最小的备用服务器作为当前主服务器。
其中,当前性能信息可以包括备用服务器的当前资源使用占比。当前资源使用占比为当前系统性能情况。具体地,若当前资源使用占比越低,则说明服务器的性能越好;若当前资源使用占比越高,则说明服务器的性能不佳。
在具体实践中,还可以通过监测主服务器的当前资源使用占比,来确定是否进行主服务器的切换。
示例性地,当前资源占比最小的备用服务器即为当前情况下,性能最佳的备用服务器。
在上述实施例中,在检测到主服务器出现故障的情况下,获取备用服务器的当前资源使用占比,根据备用服务器的当前资源使用占比,选定当前资源使用占比最小的备用服务器作为当前主服务器,以通过当前主服务器,实现继续提供控制服务和监测服务,从而提高了对服务器管理的效率。
在一个实施例中,在所述主服务器接收到任务管理请求的情况下,选取所述任务管理请求中的标识信息对应的从服务器;将所述任务管理请求发送至与所述标识信息对应的从服务器,以使所述从服务器根据所述任务管理请求执行相应的任务处理操作。
其中,标识信息可以为服务器的主机名。
示例性地,在主服务器接收到任务管理请求的情况下,选取任务管理请求中的标识信息对应的从服务器;控制主服务器将任务管理请求发送至与标识信息对应的从服务器,以使从服务器根据任务管理请求执行相应的任务处理操作。
在具体实践中,可以将主服务器和备用服务器中安装Ansible组件,默认通过服务器之间的SSH协议进行远程命令执行或下发配置,从而不需要部署任何客户端代理软件,以实现更加方便地对服务器进行管理。具体地,可以通过Ansible组件选定需要管理的服务器的标识信息以及相关的IP地址,以生成任务管理请求,通过主服务器实现批量任务的下发,实现了能够一次性地对多个从服务器进行控制。
在上述实施例中,通过主服务器实现批量任务的下发,从而实现了能够一次性地对多个从服务器进行控制。
为了更好地理解本发明实施例中服务器的管理的完整过程,以一完整示例加以说明,参考图4,示出了另一个实施例中服务器的管理方法的流程示意图,包括以下步骤:
步骤402,获取服务器集群中各个服务器的配置参数,根据配置参数,从服务器集群中选取预设数量个且符合预设条件的服务器作为目标服务器。
其中,配置参数包括处理器性能参数和存储性能参数;预设条件为处理器性能参数大于第一预设阈值,且存储性能参数大于第二预设阈值。
步骤404,为主服务器和主服务器对应的备用服务器配置Redis数据库,获取目标服务器的地址信息和端口信息;根据地址信息和端口信息,建立主服务器与备用服务器间的通信链路;在检测到主服务器中存储的数据出现变化后,将变化后的数据同步至主服务器对应的备用服务器。
步骤406,获取密钥信息,密钥信息包括公钥信息和私钥信息,获取从服务器的地址信息。
步骤408,根据地址信息,通过主服务器将公钥信息发送至对应的从服务器。
步骤410,为与主服务器通信的多个从服务器部署监测脚本,监测脚本用于获取从服务器的指标数据。
步骤412,检测主服务器是否出现故障。
步骤414,在检测到主服务器出现故障的情况下,获取备用服务器的当前资源使用占比;根据备用服务器的当前资源使用占比,选定当前资源使用占比最小的备用服务器作为当前主服务器。
步骤416,在主服务器接收到任务管理请求的情况下,选取任务管理请求中的标识信息对应的从服务器。
步骤418,将任务管理请求发送至与标识信息对应的从服务器,以使从服务器根据任务管理请求执行相应的任务处理操作。
本实施例中,从服务器集群中选定主服务器和主服务器对应的备用服务器;为主服务器和主服务器对应的备用服务器配置Redis数据库,对主服务器与备用服务器进行数据同步;建立主服务器与每个从服务器之间的安全通道,为与主服务器通信的多个从服务器部署监测脚本,检测主服务器是否出现故障;在检测到主服务器出现故障的情况下,从主服务器对应的备用服务器中选定一个服务器作为主服务器,相对于传统技术中采用人工对大量服务器进行一一管理的方式,本方法中,在选定主服务器和主服务器对应的备用服务器后,通过主服务器建立与每个从服务器的安全通道,保证了主服务器与从服务器的安全通信;通过为主服务器通信的多个从服务器部署检测脚本,实现了实时对从服务器的监测;在识别出主服务器故障的情况下,通过备用服务器接管主服务器,实现继续提供服务,从而在提高了对服务器管理的效率的同时,降低了人力成本。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的服务器的管理方法的服务器的管理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个服务器的管理装置实施例中的具体限定可以参见上文中对于服务器的管理方法的限定,在此不再赘述。
在一个实施例中,如图5所示,提供了一种服务器的管理装置,包括:目标服务器选定模块502、数据同步模块504、安全通道建立模块506、监测脚本部署模块508、故障检测模块510和主服务器切换模块512,其中:
目标服务器选定模块502,用于从服务器集群中选定目标服务器,所述目标服务器包括主服务器和所述主服务器对应的备用服务器;
数据同步模块504,用于为主服务器和所述主服务器对应的备用服务器配置Redis数据库,对所述主服务器与备用服务器进行数据同步;
安全通道建立模块506,用于建立主服务器与每个从服务器之间的安全通道,所述从服务器为在所述服务器集群中除目标服务器的剩余服务器;
监测脚本部署模块508,用于为与所述主服务器通信的多个从服务器部署监测脚本,所述监测脚本用于获取所述从服务器的指标数据;
故障检测模块510,用于检测所述主服务器是否出现故障;
主服务器切换模块512,用于在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器。
在一些实施例中,目标服务器选定模块502,包括:
配置参数获取单元,用于获取服务器集群中各个服务器的配置参数,所述配置参数包括处理器性能参数和存储性能参数;
目标服务器选取单元,用于根据所述配置参数,从所述服务器集群中选取预设数量个且符合预设条件的服务器作为目标服务器,所述预设条件为所述处理器性能参数大于第一预设阈值,且所述存储性能参数大于第二预设阈值。
在一些实施例中,数据同步模块504,包括:
地址和端口信息获取单元,用于获取目标服务器的地址信息和端口信息;
通信链路建立单元,用于根据所述地址信息和所述端口信息,建立主服务器与备用服务器间的通信链路;
数据同步单元,用于在检测到所述主服务器中存储的数据出现变化后,将变化后的数据同步至所述主服务器对应的备用服务器。
在一些实施例中,安全通道建立模块506,包括:
密钥信息获取单元,用于获取密钥信息,所述密钥信息包括公钥信息和私钥信息;
地址信息获取单元,用于获取所述从服务器的地址信息;
公钥信息发送单元,用于根据所述地址信息,通过主服务器将所述公钥信息发送至对应的从服务器。
在一些实施例中,主服务器切换模块512,包括:
当前信息获取单元,用于在检测到所述主服务器出现故障的情况下,获取所述备用服务器的当前性能信息;所述当前性能信息包括所述备用服务器的当前资源使用占比;
主服务器切换单元,用于根据所述备用服务器的当前资源使用占比,选定所述当前资源使用占比最小的备用服务器作为当前主服务器。
在一些实施例中,服务器的管理装置,包括:
从服务器选取模块,用于在所述主服务器接收到任务管理请求的情况下,选取所述任务管理请求中的标识信息对应的从服务器;
任务处理操作执行模块,用于将所述任务管理请求发送至与所述标识信息对应的从服务器,以使所述从服务器根据所述任务管理请求执行相应的任务处理操作。
上述服务器的管理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储配置参数、地址信息、端口信息以及指标数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种服务器的管理方法。
该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
从服务器集群中选定目标服务器,所述目标服务器包括主服务器和所述主服务器对应的备用服务器;
为主服务器和所述主服务器对应的备用服务器配置Redis数据库,对所述主服务器与备用服务器进行数据同步;
建立主服务器与每个从服务器之间的安全通道,所述从服务器为在所述服务器集群中除目标服务器的剩余服务器;
为与所述主服务器通信的多个从服务器部署监测脚本,所述监测脚本用于获取所述从服务器的指标数据;
检测所述主服务器是否出现故障;
在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取服务器集群中各个服务器的配置参数,所述配置参数包括处理器性能参数和存储性能参数;
根据所述配置参数,从所述服务器集群中选取预设数量个且符合预设条件的服务器作为目标服务器,所述预设条件为所述处理器性能参数大于第一预设阈值,且所述存储性能参数大于第二预设阈值。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
从服务器集群中选定目标服务器,所述目标服务器包括主服务器和所述主服务器对应的备用服务器;
为主服务器和所述主服务器对应的备用服务器配置Redis数据库,对所述主服务器与备用服务器进行数据同步;
建立主服务器与每个从服务器之间的安全通道,所述从服务器为在所述服务器集群中除目标服务器的剩余服务器;
为与所述主服务器通信的多个从服务器部署监测脚本,所述监测脚本用于获取所述从服务器的指标数据;
检测所述主服务器是否出现故障;
在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取服务器集群中各个服务器的配置参数,所述配置参数包括处理器性能参数和存储性能参数;
根据所述配置参数,从所述服务器集群中选取预设数量个且符合预设条件的服务器作为目标服务器,所述预设条件为所述处理器性能参数大于第一预设阈值,且所述存储性能参数大于第二预设阈值。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
从服务器集群中选定目标服务器,所述目标服务器包括主服务器和所述主服务器对应的备用服务器;
为主服务器和所述主服务器对应的备用服务器配置Redis数据库,对所述主服务器与备用服务器进行数据同步;
建立主服务器与每个从服务器之间的安全通道,所述从服务器为在所述服务器集群中除目标服务器的剩余服务器;
为与所述主服务器通信的多个从服务器部署监测脚本,所述监测脚本用于获取所述从服务器的指标数据;
检测所述主服务器是否出现故障;
在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取服务器集群中各个服务器的配置参数,所述配置参数包括处理器性能参数和存储性能参数;
根据所述配置参数,从所述服务器集群中选取预设数量个且符合预设条件的服务器作为目标服务器,所述预设条件为所述处理器性能参数大于第一预设阈值,且所述存储性能参数大于第二预设阈值。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种服务器的管理方法,其特征在于,所述方法包括:
从服务器集群中选定目标服务器,所述目标服务器包括主服务器和所述主服务器对应的备用服务器;
为主服务器和所述主服务器对应的备用服务器配置Redis数据库,对所述主服务器与备用服务器进行数据同步;
建立主服务器与每个从服务器之间的安全通道,所述从服务器为在所述服务器集群中除目标服务器的剩余服务器;
为与所述主服务器通信的多个从服务器部署监测脚本,所述监测脚本用于获取所述从服务器的指标数据;
检测所述主服务器是否出现故障;
在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器。
2.根据权利要求1所述的方法,其特征在于,所述从服务器集群中选定目标服务器,包括:
获取服务器集群中各个服务器的配置参数,所述配置参数包括处理器性能参数和存储性能参数;
根据所述配置参数,从所述服务器集群中选取预设数量个且符合预设条件的服务器作为目标服务器,所述预设条件为所述处理器性能参数大于第一预设阈值,且所述存储性能参数大于第二预设阈值。
3.根据权利要求1所述的方法,其特征在于,所述对所述主服务器与备用服务器进行数据同步,包括:
获取目标服务器的地址信息和端口信息;
根据所述地址信息和所述端口信息,建立主服务器与备用服务器间的通信链路;
在检测到所述主服务器中存储的数据出现变化后,将变化后的数据同步至所述主服务器对应的备用服务器。
4.根据权利要求1所述的方法,其特征在于,所述建立主服务器与每个从服务器之间的安全通道,包括:
获取密钥信息,所述密钥信息包括公钥信息和私钥信息;
获取所述从服务器的地址信息;
根据所述地址信息,通过主服务器将所述公钥信息发送至对应的从服务器。
5.根据权利要求1所述的方法,其特征在于,在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器,包括:
在检测到所述主服务器出现故障的情况下,获取所述备用服务器的当前性能信息;所述当前性能信息包括所述备用服务器的当前资源使用占比;
根据所述备用服务器的当前资源使用占比,选定所述当前资源使用占比最小的备用服务器作为当前主服务器。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述主服务器接收到任务管理请求的情况下,选取所述任务管理请求中的标识信息对应的从服务器;
将所述任务管理请求发送至与所述标识信息对应的从服务器,以使所述从服务器根据所述任务管理请求执行相应的任务处理操作。
7.一种服务器的管理装置,其特征在于,所述装置包括:
目标服务器选定模块,用于从服务器集群中选定目标服务器,所述目标服务器包括主服务器和所述主服务器对应的备用服务器;
数据同步模块,用于为主服务器和所述主服务器对应的备用服务器配置Redis数据库,对所述主服务器与备用服务器进行数据同步;
安全通道建立模块,用于建立主服务器与每个从服务器之间的安全通道,所述从服务器为在所述服务器集群中除目标服务器的剩余服务器;
监测脚本部署模块,用于为与所述主服务器通信的多个从服务器部署监测脚本,所述监测脚本用于获取所述从服务器的指标数据;
故障检测模块,用于检测所述主服务器是否出现故障;
主服务器切换模块,用于在检测到所述主服务器出现故障的情况下,从所述主服务器对应的备用服务器中选定一个服务器作为主服务器。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202311125225.5A 2023-09-01 2023-09-01 服务器的管理方法、装置、设备、存储介质和程序产品 Pending CN117155767A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311125225.5A CN117155767A (zh) 2023-09-01 2023-09-01 服务器的管理方法、装置、设备、存储介质和程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311125225.5A CN117155767A (zh) 2023-09-01 2023-09-01 服务器的管理方法、装置、设备、存储介质和程序产品

Publications (1)

Publication Number Publication Date
CN117155767A true CN117155767A (zh) 2023-12-01

Family

ID=88905739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311125225.5A Pending CN117155767A (zh) 2023-09-01 2023-09-01 服务器的管理方法、装置、设备、存储介质和程序产品

Country Status (1)

Country Link
CN (1) CN117155767A (zh)

Similar Documents

Publication Publication Date Title
CN106331098B (zh) 一种服务器集群系统
US6973595B2 (en) Distributed fault detection for data storage networks
CN103812699A (zh) 基于云计算的监控管理系统
JP2017529590A (ja) グラフ理論を用いたアプリケーション、仮想化およびクラウド・インフラストラクチャ・リソースの集中型分析
CN108234170A (zh) 一种服务器集群的监控方法和装置
CN102394914A (zh) 集群脑裂处理方法和装置
CN111949444A (zh) 一种基于分布式服务集群的数据备份与恢复系统及方法
CN106484565A (zh) 多数据中心间的数据同步方法及相关设备
CN111813605A (zh) 容灾方法、平台、电子设备以及介质
CN105490847B (zh) 一种私有云存储系统中节点故障实时检测及处理方法
CN111082998A (zh) 一种运维监控校园汇聚层的架构系统
CN104811348A (zh) 可用性装置、具有可用性装置的储存局域网络及其操作方法
CN106250048B (zh) 管理存储阵列的方法及装置
CN115550287B (zh) 一种远程复制关系的建立方法及相关装置
CN114356650A (zh) 数据备份方法、装置、设备、系统及存储介质
CN116185697B (zh) 容器集群管理方法、装置、系统、电子设备及存储介质
CN117155767A (zh) 服务器的管理方法、装置、设备、存储介质和程序产品
CN116389233A (zh) 容器云管理平台主备切换系统、方法、装置和计算机设备
CN114363356B (zh) 数据同步方法、系统、装置、计算机设备和存储介质
CN115766405A (zh) 一种故障处理方法、装置、设备和存储介质
CN116192616A (zh) 基于微服务的电力备调系统处理方法、装置和计算机设备
CN115174596A (zh) 一种设备远程复制方法、装置以及介质
WO2016086579A1 (zh) 一种网管系统中网元数据智能备份恢复的方法及装置
CN114610545A (zh) 减少私有云计算的单点故障的方法、系统、设备及介质
CN113961398A (zh) 业务处理方法、装置、系统、设备、存储介质和产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination