CN114297032A - 一种多服务器环境中的服务管理方法及可视化系统 - Google Patents

一种多服务器环境中的服务管理方法及可视化系统 Download PDF

Info

Publication number
CN114297032A
CN114297032A CN202111654979.0A CN202111654979A CN114297032A CN 114297032 A CN114297032 A CN 114297032A CN 202111654979 A CN202111654979 A CN 202111654979A CN 114297032 A CN114297032 A CN 114297032A
Authority
CN
China
Prior art keywords
service
module
management
cluster
starting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111654979.0A
Other languages
English (en)
Inventor
涂霖
周文龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Qiruike Technology Co Ltd
Original Assignee
Sichuan Qiruike Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Qiruike Technology Co Ltd filed Critical Sichuan Qiruike Technology Co Ltd
Priority to CN202111654979.0A priority Critical patent/CN114297032A/zh
Publication of CN114297032A publication Critical patent/CN114297032A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种多服务器环境中的服务管理方法及可视化系统,多服务器运行在同一网络环境中,对外提供多种应用服务,所述方法包括:对服务器硬件信息收集;对服务器上服务信息收集;根据预设规则检测服务运行情况,设置服务状态;按照是否包含多个独立功能模块或者是否跨服务器部署进行服务分类;服务模块关联和架构管理维护;服务模块启动顺序编排;根据不同的服务分类进行服务管理操作。本发明实现了多服务器环境中服务的自动化收集和服务运行情况的可视化监控,避免了服务管理人员大量重复的服务器登录和服务管理操作。本发明将服务分为了单点服务和集群服务,对不同服务类型采用了不同的服务管理方式,提高了服务管理的适应性和灵活性。

Description

一种多服务器环境中的服务管理方法及可视化系统
技术领域
本发明涉及集群和服务管理技术领域,尤其涉及一种多服务器环境中的服务管理方法及可视化系统。
背景技术
随着互联网行业的发展,各种形形色色的计算机服务层出不穷。但不管其如何发展和变化,服务都可以划分为单一独立进程提供服务的单点服务和多个独立进程提供统一服务的集群服务两种类型。对于单点服务,通常采用启动命令或者启动脚本直接启动;而集群服务则需要对每个模块分别在不同的服务器上进行启动,而且需要服务管理员熟悉集群服务架构和模块间的依赖关系,从而通过人工方式调整模块的启动顺序。
在现有的技术中,服务器中的服务类型通常没有加以区分,往往采用单一的方式进行管理;在多服务器环境下,需要通过登录每一台服务器手动收集所有服务信息,并监控每一个服务运行状况,进而才能获取服务集群的运行状态。由于多服务器环境中部署的服务多而杂,服务管理的所有操作往往都需要大量的人工干预,而且还必须是熟悉整个服务器环境和所有服务架构的专业人员来完成。这就大大增加了服务的管理难度和运维成本。
发明内容
本发明提供了一种多服务器环境中服务管理方法和可视化系统,以解决现有技术中多服务器环境中服务无法快速准确梳理和监控,集群服务管理需要大量专业技术人员人工干预的问题。
本发明采用的技术方案是:提供一种多服务器环境中的服务管理方法,多服务器运行在同一网络环境中,对外提供多种应用服务,所述方法包括以下步骤:
a.对服务器硬件信息收集;
b.对服务器上服务信息收集;
c.根据预设规则检测服务运行情况,设置服务状态;
d.按照是否包含多个独立功能模块或者是否跨服务器部署进行服务分类;
e.服务模块关联和架构管理维护;
f.服务模块启动顺序编排;
g.根据不同的服务分类进行服务管理操作。
进一步的,步骤a所述的硬件信息包括IP地址、硬件资源配置、系统运行状态和系统资源占用情况。
进一步的,步骤b所述的服务信息包括服务名称、安装路径、服务占用端口、服务资源占用情况、服务启动命令及启动脚本。
进一步的,步骤c所述预设规则是指服务是否正常运行的验证规则,所述预设规则包括web管理界面验证、API方法验证、端口验证、日志验证规则的组合逻辑,如果满足预设规则,则说明服务正常运行,服务状态设置为启动;如果不满足预设规则,服务状态则设置为关闭。
进一步的,步骤d所述服务分类包括单点服务和集群服务。
进一步的,步骤e包括:针对步骤d中的集群服务,构建出当前服务的模块关联和服务架构图,结合步骤b和步骤c收集到的相关信息,直观展现出每个模块运行在哪台服务器上以及模块当前的运行状态。
进一步的,步骤f包括,基于步骤e中集群服务的模块关联和服务架构图,在可视化界面中通过简单拖拽的方式构建集群服务各模块的启动时序流程图,实现服务模块启动顺序的编排。
进一步的,步骤g包括:
如果是步骤d中的单点服务,服务的启动是通过步骤b中收集的启动命令或者是启动脚本来完成;
针对步骤d中的集群服务,如果是集群服务中的单个模块的启动则也是通过步骤b中收集的启动命令或者是启动脚本来完成;
如果是需要启动整个集群服务,则是通过步骤f中构建的集群服务各模块启动时序流程图,按照编排的启动顺序分别启动各个模块。
本案发明提供一种多服务器环境中的服务管理可视化系统,所述可视化系统包括:
服务收集模块,用于当前环境中服务器硬件信息的收集和不同服务器中服务信息的收集;
服务检测模块,用于检测所有服务的服务状态;
服务管理模块,用于服务分类和服务状态管理;还用于集群服务的架构管理及模块关联依赖管理,构建服务的模块关联和服务架构图;还用于集群服务的模块启动顺序编排,构建集群服务模块的启动时序流程图;
显示模块,用于服务器和服务的分布和运行情况展示;还用于集群服务的架构和模块启动顺序展示;还用于与服务检测模块交互,通过显示界面直接跳转到服务地址;还用于与服务管理模块交互,通过显示界面直接进行服务的启动、停止或者重启。
本发明的有益效果是:
(1)、本发明实现了多服务器环境中服务的自动化收集和服务运行情况的可视化监控,避免了服务管理人员大量重复的服务器登录和服务管理操作。
(2)、本发明将服务分为了单点服务和集群服务,对不同服务类型采用了不同的服务管理方式。通过可视化界面不仅实现了单点服务的管理,而且也实现了集群服务甚至是集群服务内部单个模块的管理,提高了服务管理的适应性和灵活性。同时,针对集群服务实现了模块启动顺序的编排,避免了集群服务因模块启动顺序混乱而造成服务反复重启的发生,可以实现集群服务的快速启动,避免资源的浪费。
(3)、本发明提出的可视化系统,可以直观展示集群服务中模块的关联依赖关系和集群服务架构,可以直观展现集群服务各模块的部署位置和运行情况,方便相关人员快速了解集群架构和服务部署方式,快速定位服务故障,降低了对运维人员的能力要求,避免了过多的人为干预。
附图说明
图1为本发明所述的多服务器环境中服务管理方法的流程图;
图2为本发明提供的可视化系统的结构框图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步详细描述,但本发明的实施方式不限于此。
实施例1:
本发明实施例一中提供了一种多服务器环境中的服务管理方法,步骤流程如图1所示,具体包括以下步骤:
步骤S1:服务器硬件信息收集。
运行在同一网络环境中的多台服务器自动上报自身的硬件信息,其中硬件信息具体包括:当前服务器的IP地址、CPU、内存、硬盘资源信息、服务器负载压力信息等。
步骤S2:服务器上服务信息收集。
运行在同一网络环境中的多台服务器自动上报本服务器上部署的应用服务信息,其中服务信息具体包括:服务名称、服务安装目录、服务端口、服务当前占用的CPU和内存资源以及服务启动的相关信息。所述服务启动的相关信息具体是指服务启动命令或者是服务启动脚本。所述应用服务是除了服务器自身系统服务以外的所有服务。
步骤S3:根据预设规则检测服务运行情况,设置服务状态。
每一个服务都维护一个预设规则来判断其是否正常运行,所述预设规则具体包括了:web管理界面验证、API方法验证、端口验证、日志验证等规则的组合逻辑。如果满足预设规则,则说明服务正常运行,服务状态设置为启动;如果不满足预设规则,服务状态则设置为关闭。
步骤S4:按照是否包含多个独立功能模块或者是否跨服务器部署进行服务分类。
将步骤S2中收集的所有服务进行具体的分类。如果某个服务包含了很多独立的功能模块,并且是以单独的服务进程运行,占用独立的端口,则划分为集群服务;如果某个服务在多个服务器上都有部署,而且互相关联(如主从模式、副本模式),则也划分为集群服务;如果某个服务是一个独立个体,则划分为单点服务。
步骤S5:服务模块关联和架构管理维护。
针对步骤S4中的集群服务,构建出当前服务的模块关联和服务架构图,结合步骤S2和步骤S3收集到的相关信息,直观展现出每个模块运行在哪台服务器上以及模块当前的运行状态。
步骤S6:服务模块启动顺序编排。
基于步骤S5中集群服务的模块关联和服务架构图,在可视化界面中通过简单拖拽的方式构建集群服务各模块的启动时序流程图,实现服务模块启动顺序的编排。
步骤S7:根据不同的服务分类进行服务管理操作。
如果是步骤S4中的单点服务,服务的启动是通过步骤S2中收集的启动命令或者是启动脚本来完成;针对步骤S4中的集群服务,如果是集群服务中的单个模块的启动则也是通过步骤S2中收集的启动命令或者是启动脚本来完成;如果是需要启动整个集群服务,则是通过步骤S6中构建的集群服务各模块启动时序流程图,按照编排的启动顺序分别启动各个模块。
与现有技术相比,一方面,本发明通过自动收集多服务器环境中所有服务器上的应用服务,避免了大量重复的服务器登录和服务管理操作;另一方面,本发明区分服务类型并采用不同的管理方式,实现了集群服务模块关联架构的直观展现和集群服务模块启动顺序编排,避免了集群服务的反复重启,实现服务的快速启动,避免资源的浪费。
实施例二
为达到上述目的,本发明的实例二中提供了一种多服务器环境中的服务管理可视化系统10,如图2所示,具体包括:服务收集模块11、服务检测模块12、服务管理模块13和显示模块14。
服务收集模块11,用于当前环境中服务器硬件信息的收集和不同服务器中服务信息的收集。
服务检测模块12,用于检测所有服务的服务状态,服务状态包括:服务启动和服务关闭。
服务管理模块13,用于服务分类和服务状态管理。服务分类包括:单点服务和集群服务。服务状态管理包括了单点服务、集群服务的单个模块和整个集群服务的启动、停止或者重启。
所述服务管理模块13,还用于集群服务的架构管理及模块关联依赖管理,构建服务的模块关联和服务架构图。
所述服务管理模块13,还用于集群服务的模块启动顺序编排,构建集群服务模块的启动时序流程图。
显示模块14,用于服务器和服务的分布和运行情况展示。
所述显示模块14,还用于集群服务的架构和模块启动顺序展示。
所述显示模块14,还用于与服务检测模块交互,通过显示界面直接跳转到服务地址。
所述显示模块14,还用于与服务管理模块交互,通过显示界面直接进行服务的启动、停止或者重启。以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种多服务器环境中的服务管理方法,多服务器运行在同一网络环境中,对外提供多种应用服务,其特征在于,所述方法包括以下步骤:
a.对服务器硬件信息收集;
b.对服务器上服务信息收集;
c.根据预设规则检测服务运行情况,设置服务状态;
d.按照是否包含多个独立功能模块或者是否跨服务器部署进行服务分类;
e.服务模块关联和架构管理维护;
f.服务模块启动顺序编排;
g.根据不同的服务分类进行服务管理操作。
2.根据权利要求1所述的多服务器环境中的服务管理方法,其特征在于,步骤a所述的硬件信息包括IP地址、硬件资源配置、系统运行状态和系统资源占用情况。
3.根据权利要求1所述的多服务器环境中的服务管理方法,其特征在于,步骤b所述的服务信息包括服务名称、安装路径、服务占用端口、服务资源占用情况、服务启动命令及启动脚本。
4.根据权利要求1所述的多服务器环境中的服务管理方法,其特征在于,步骤c所述预设规则是指服务是否正常运行的验证规则,所述预设规则包括web管理界面验证、API方法验证、端口验证、日志验证规则的组合逻辑,如果满足预设规则,则说明服务正常运行,服务状态设置为启动;如果不满足预设规则,服务状态则设置为关闭。
5.根据权利要求1所述的多服务器环境中的服务管理方法,其特征在于,步骤d所述服务分类包括单点服务和集群服务。
6.根据权利要求1所述的多服务器环境中的服务管理方法,其特征在于,步骤e包括:针对步骤d中的集群服务,构建出当前服务的模块关联和服务架构图,结合步骤b和步骤c收集到的相关信息,直观展现出每个模块运行在哪台服务器上以及模块当前的运行状态。
7.根据权利要求1所述的多服务器环境中的服务管理方法,其特征在于,步骤f包括,基于步骤e中集群服务的模块关联和服务架构图,在可视化界面中通过简单拖拽的方式构建集群服务各模块的启动时序流程图,实现服务模块启动顺序的编排。
8.根据权利要求1所述的多服务器环境中的服务管理方法,其特征在于,步骤g包括:
如果是步骤d中的单点服务,服务的启动是通过步骤b中收集的启动命令或者是启动脚本来完成;
针对步骤d中的集群服务,如果是集群服务中的单个模块的启动则也是通过步骤b中收集的启动命令或者是启动脚本来完成;
如果是需要启动整个集群服务,则是通过步骤f中构建的集群服务各模块启动时序流程图,按照编排的启动顺序分别启动各个模块。
9.一种多服务器环境中的服务管理可视化系统,其特征在于,所述可视化系统包括:
服务收集模块,用于当前环境中服务器硬件信息的收集和不同服务器中服务信息的收集;
服务检测模块,用于检测所有服务的服务状态;
服务管理模块,用于服务分类和服务状态管理;还用于集群服务的架构管理及模块关联依赖管理,构建服务的模块关联和服务架构图;还用于集群服务的模块启动顺序编排,构建集群服务模块的启动时序流程图;
显示模块,用于服务器和服务的分布和运行情况展示;还用于集群服务的架构和模块启动顺序展示;还用于与服务检测模块交互,通过显示界面直接跳转到服务地址;还用于与服务管理模块交互,通过显示界面直接进行服务的启动、停止或者重启。
CN202111654979.0A 2021-12-30 2021-12-30 一种多服务器环境中的服务管理方法及可视化系统 Pending CN114297032A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111654979.0A CN114297032A (zh) 2021-12-30 2021-12-30 一种多服务器环境中的服务管理方法及可视化系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111654979.0A CN114297032A (zh) 2021-12-30 2021-12-30 一种多服务器环境中的服务管理方法及可视化系统

Publications (1)

Publication Number Publication Date
CN114297032A true CN114297032A (zh) 2022-04-08

Family

ID=80973451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111654979.0A Pending CN114297032A (zh) 2021-12-30 2021-12-30 一种多服务器环境中的服务管理方法及可视化系统

Country Status (1)

Country Link
CN (1) CN114297032A (zh)

Similar Documents

Publication Publication Date Title
US10951485B1 (en) System, method, and computer program for operating a multi-stage artificial intelligence (AI) analysis in a communication network
US9514387B2 (en) System and method of monitoring and measuring cluster performance hosted by an IAAS provider by means of outlier detection
US7340654B2 (en) Autonomic monitoring in a grid environment
US9176803B2 (en) Collecting data from a system in response to an event based on an identification in a file of the data to collect
US11138058B2 (en) Hierarchical fault determination in an application performance management system
CN101206569B (zh) 用于动态识别促使服务劣化的组件的方法和系统
CN106462702B (zh) 用于在分布式计算机基础设施中获取并且分析电子取证数据的方法和系统
CN103392176B (zh) 用于预测网络事件泛滥的装置和方法
CN101527660B (zh) 告警方法、相关设备及系统
CN114064196A (zh) 用于预测性保障的系统和方法
CN111552556A (zh) 一种gpu集群服务管理系统及方法
US10474954B2 (en) Feedback and customization in expert systems for anomaly prediction
US10671470B2 (en) Application performance management system with dynamic discovery and extension
CN114884838A (zh) Kubernetes组件的监控方法及服务器
CN103207825A (zh) 一种用于管理整机柜的故障的方法及装置
US8554908B2 (en) Device, method, and storage medium for detecting multiplexed relation of applications
CN112671586B (zh) 一种业务配置自动迁移和保障方法及装置
CN114297032A (zh) 一种多服务器环境中的服务管理方法及可视化系统
US20160366021A1 (en) User interface for an application performance management system
WO2019241199A1 (en) System and method for predictive maintenance of networked devices
JP2006344091A (ja) システム再構成自動化装置
CN112882892B (zh) 数据处理方法和装置、电子设备及存储介质
CN113962398A (zh) 量子计算机自动化管控方法、系统、服务器及存储介质
Kawahara et al. Application of AI to network operation
US12032431B2 (en) Method and system for real-time identification of blast radius of a fault in a globally distributed virtual desktop fabric

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination