CN109815093A - 服务器监控方法、装置、计算机设备及存储介质 - Google Patents

服务器监控方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109815093A
CN109815093A CN201811527623.9A CN201811527623A CN109815093A CN 109815093 A CN109815093 A CN 109815093A CN 201811527623 A CN201811527623 A CN 201811527623A CN 109815093 A CN109815093 A CN 109815093A
Authority
CN
China
Prior art keywords
monitoring
information
equipment
default
tools
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811527623.9A
Other languages
English (en)
Inventor
尹彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201811527623.9A priority Critical patent/CN109815093A/zh
Publication of CN109815093A publication Critical patent/CN109815093A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)

Abstract

本发明公开了服务器监控方法、装置、计算机设备及存储介质。方法包括:获取所有待监控服务器的设备基础信息;根据预设监控图构建规则及所得到的设备基础信息构建三维监控图;根据预设监控项对三维监控图中所有设备的运行状态进行实时监控以得到设备监控信息;对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取设备的设备状态信息并添加至三维监控图中。本发明基于主机设备管理技术,通过获取待监控服务器中所包含设备的基础信息并根据预设监控图构建规则构建得到三维监控图,通过所构建的三维监控图对设备进行实时监控,能够对故障设备进行快速定位,方便运维人员对待监控服务器进行维护,大幅提高了对服务器进行维护的效率。

Description

服务器监控方法、装置、计算机设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种服务器监控方法、装置、计算机设备及存储介质。
背景技术
在对企业级服务器进行维护的过程中,由于企业级服务器中所包含的设备量十分巨大,对其中存在故障的某一台设备进行快速定位需依赖运维人员丰富的经验,因而需耗费大量时间对企业级服务器中存在故障的设备进行定位及处理,因而现有的技术方法中对企业级服务器进行维护的效率较低。
发明内容
本发明实施例提供了一种服务器监控方法、装置、计算机设备及存储介质,旨在解决现有技术中所存在的对服务器进行维护的效率较低的问题。
第一方面,本发明实施例提供了一种服务器监控方法,其包括:
获取所有待监控服务器的设备基础信息;
根据预设监控图构建规则及所得到的设备基础信息构建三维监控图;
根据预设监控项对三维监控图中所有设备的运行状态进行实时监控以得到设备监控信息;
对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中。
第二方面,本发明实施例提供了一种服务器监控装置,其包括:
基础信息获取单元,用于获取所有待监控服务器的设备基础信息;
三维监控图构建单元,用于根据预设监控图构建规则及所得到的设备基础信息构建三维监控图;
设备监控信息获取单元,用于根据预设监控项对三维监控图中所有设备的运行状态进行实时监控以得到设备监控信息;
设备状态信息添加单元,用于对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的服务器监控方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的服务器监控方法。
本发明实施例提供了一种服务器监控方法、装置、计算机设备及存储介质。通过获取待监控服务器中所包含设备的基础信息并根据预设监控图构建规则构建得到三维监控图,通过所构建的三维监控图对设备进行实时监控,能够对故障设备进行快速定位,方便运维人员对待监控服务器进行维护,大幅提高了对服务器进行维护的效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的服务器监控方法的流程示意图;
图2为本发明实施例提供的服务器监控方法的子流程示意图;
图3为本发明实施例提供的服务器监控方法的另一子流程示意图;
图4为本发明实施例提供的服务器监控方法的另一流程示意图;
图5为本发明实施例提供的服务器监控方法的另一子流程示意图;
图6为本发明实施例提供的服务器监控装置的示意性框图;
图7为本发明实施例提供的服务器监控装置的子单元示意性框图;
图8为本发明实施例提供的服务器监控装置的另一子单元示意性框图;
图9为本发明实施例提供的服务器监控装置的另一示意性框图;
图10为本发明实施例提供的服务器监控装置的另一子单元示意性框图;
图11为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本发明实施例提供的服务器监控方法的流程示意图。该服务器监控方法应用于用户终端中,该方法通过安装于用户终端中的应用软件进行执行,其中,用户终端是具有接入互联网功能的终端设备,例如台式电脑、笔记本电脑、平板电脑或手机等。
如图1所示,该方法包括步骤S110~S140。
S110、获取所有待监控服务器的设备基础信息。
获取所有待监控服务器中每一台设备的基础信息,其中,基础信息包括设备的位置信息、属性信息及名称信息。待监控服务器即是企业中所需进行监控的企业终端,其中,待监控服务器为企业级服务器,企业级服务器运行在需要处理大量数据、高处理速度和对可靠性要求极高的金融、证券、交通、邮电、通信或大型企业,企业级服务器用于联网计算机在数百台以上、对处理速度和数据安全要求非常高的大型网络,因而待监控服务器中所包含的设备量十分巨大。其中,待监控服务器可以为一个或多个。
具体的,位置信息即是设备在待监控服务器中所处的地理位置信息,属性信息即是用于对设备的种类进行区分的信息,不同种类的设备具有不同的属性信息,名称信息即是该设备的具体名称。
例如,所获取得到的设备的基础信息如表1所示。
位置信息 属性信息 名称信息
第一机柜第一列第一层 业务服务器 A
第一机柜第一列第二层 业务服务器 B
第一机柜第二列第一层 业务服务器 C
第二机柜第一列第一层 交换机 X
表1
S120、根据预设监控图构建规则及所得到的设备基础信息构建三维监控图。
根据预设监控图构建规则及所得到的设备基础信息构建三维监控图。其中,监控图构建规则即是用于构建三维监控图的规则信息,通过监控图构建规则对所有设备的基础信息进行处理即可构建得到三维监控图,所述监控图构建规则中包括三维坐标。三维监控图即是对设备进行立体展示的三维图,通过三维监控图运维人员能够直观地察看所监控的所有设备,并且能够通过察看三维监控图快速获取故障设备在待监控服务器中所处的位置,方便运维人员快速对待监控服务器中存在故障的设备进行定位并及时排除故障。
在一实施例中,如图2所示,步骤S120包括子步骤S121、S122和S123。
S121、根据设备基础信息中的属性信息对设备进行分类以得到设备分类信息。
根据设备基础信息中的属性信息对所有设备进行分类以得到设备分类信息。属性信息即是用于对设备的种类进行区分的信息,不同种类的设备具有不同的属性信息,设备分类信息即是根据属性信息对待监控服务器中的所有设备进行分类之后每一个类别所包含的设备。
例如,根据设备基础信息中的属性信息表对1中所包含的四台设备进行分类,所得到的设备分类信息为,业务服务器类:服务器A、服务器B、服务器C;交换机类:服务器X。
S122、根据设备分类信息将与设备基础信息中的位置信息相对应的设备分类添加至三维坐标以构建得到三维监控图。
根据设备分类信息,将与设备基础信息中的位置信息相对应的设备分类添加至三维坐标,以构建得到三维监控图。具体的,三维坐标即是包含X轴、Y轴、Z轴的三维坐标系,在所构建的三维监控图中分不同的区域对不同类别的设备进行添加,设备的位置信息中,设备的机柜号对应X轴,设备的列数对应Y轴,设备的行数对应Z轴。
例如,根据设备分类信息将与表1中所包含的四台设备添加至三维坐标中,首先将服务器A、服务器B及服务器C按照其对应的位置信息添加至三维坐标的第一区域中,将服务器X按照其对应的位置信息添加至三维坐标的第二区域中。具体的,服务器A的位置信息为第一机柜第一列第一层,则服务器A在三维坐标的第一区域中的坐标为(1,1,1)。
S123、将设备基础信息中的名称信息添加至所构建三维监控图对应的设备中。
将设备基础信息中的名称信息添加至所构建三维监控图对应的设备中,为使三维监控图中的每一个设备与该设备的名称信息一一对应,需将设备基础信息中的名称信息添加至所构建的三维监控图对应的设备中。
S130、根据预设监控项对三维监控图中所有设备的运行状态进行实时监控以得到设备监控信息。
根据预设监控项对每一台设备的运行状态进行实时监控以得到设备监控信息。预设监控项即是对待监控的企业级服务器中每一台设备所需进行监控的项目信息设备监控信息即是根据预设监控项对每一台设备进行监控所得到的数据信息,设备监控信息中每一台设备的数据信息包含多个监控项目值,监控项目值即与预设监控项中所包含的监控项目一一对应。
具体的,预设监控项中包括多个监控项目,预设监控项中所包含的监控项目包括但不限于:设备温度、工作状态、资源占比、数据流量、响应时间、进程数量。工作状态即是所监控设备是否工作的状态信息,若设备断电则该设备的工作状态为非工作,若设备通电则该设备的工作状态为工作,资源占比即是该设备中所包含的资源被占用的比例信息,其中,设备的资源占比具体为该设备CPU的使用率、内存的使用率等的平均值,数据流量即是该设备输入及输出的数据量信息,响应时间即是该设备对所接收到的操作指令进行响应的时间信息,进程数量即是该设备当前所执行的进程的数量信息。
S140、对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中。
对所得到的设备监控信息是否超出预设监控项阈值进行判断,即可获取得到设备状态信息,将设备状态信息添加至所构建的三维监控图中。其中,预设监控阈值中包含多个监控项目阈值,预设监控阈值即是对设备监控信息所包含的多个监控项目值进行预警的阈值信息,监控项目阈值与监控数据信息所包含的监控项目值一一对应。
运行状态信息即是用于对设备的运行状态是否健康进行标注的信息,若设备状态信息为健康,则表明该设备不存在故障,若设备状态信息为不健康,则表明该设备存在故障,需对该设备的故障进行排除。
在一实施例中,如图3所示,步骤S140包括子步骤S141和S142。
S141、根据预设监控项阈值对设备监控信息中的设备进行判断以获取该设备监控数据信息中监控项目值超出预设监控项阈值的数量。
根据预设监控项阈值对设备监控信息中的设备进行判断,即可获取该设备监控数据信息中监控项目值超出预设监控项阈值的数量。具体的,设备监控数据信息中包含多个监控项目值,根据预设监控项阈值中的监控项目阈值与设备监控数据信息中的所对应的监控项目值进行一一比对,即可统计得到该设备监控数据信息中监控项目值超出预设监控项阈值的数量。
例如,某一设备的监控数据信息如表2所示:
监控项目 监控项目值
设备温度 35℃
工作状态 工作
资源占比 75%
数据流量 12M/s
响应时间 25ms
进程数量 1703
表2
预设监控项阈值为设备温度40℃,工作状态为工作、资源占比为95%,数量流量为20M/s,响应时间为20ms,进程数量为2000。则表2中设备监控数据信息中监控项目值超出预设监控项阈值的数量为1。
S142、根据设备监控数据信息中监控项目值超出预设监控项阈值的数量对设备是否健康进行判断以得到所有设备的设备状态信息。
根据设备监控数据信息中监控项目值超出预设监控项阈值的数量对设备是否健康进行判断以得到所有设备的设备状态信息。具体的,若设备监控数据信息中某一设备的监控项目值超出预设监控项阈值的数量为零,则该设备的运行状态信息为健康;若设备监控数据信息中某一设备的监控项目值超出预设监控项阈值的数量为1个,则该设备的运行状态信息为亚健康,若设备监控数据信息中某一设备的监控项目值超出预设监控项阈值的数量大于1个,则该设备的运行状态信息为不健康。
获取所有设备的运行状态信息后,将所述运行状态信息添加至所构建的三维监控图中进行显示,即可使运维人员能够直观地察看到所有设备的健康状态,并且能够通过察看三维监控图中设备的监控状态信息快速获取非健康设备在待监控服务器中所处的位置。具体的,可通过添加标记、颜色信息等方法将设备的运行状态信息添加至所构建的三维监控图中进行显示。
例如,若设备的运行状态为健康,则在三维监控图中显示该设备为绿色;若设备的运行状态信息为亚健康,则在三维监控图中显示该设备为黄色;若设备的运行状态信息为不健康,则在三维监控图中显示该设备为红色。用户通过察看三维监控图,即可对显示为红色的设备进行优先处理,并在处理完显示为红色的设备之后,再处理三维监控图中显示为黄色的设备。
在一实施例中,如图4所示,步骤S140之后还包括步骤S150。
S150、若设备监控信息超出预设监控阈值,根据该设备监控信息在预设脚本库中进行搜索以得到目标脚本并将该目标脚本发送至该设备以对目标脚本进行执行。
若某一设备的监控数据信息超出预设监控阈值,根据该设备的监控数据信息,对预设脚本库进行搜索以得到目标脚本,并将目标脚本发送至该设备以对目标脚本进行执行。其中,所述预设脚本库中包含多个脚本,不同的脚本在设备中执行之后能够对该设备中所存在的相应的故障进行排除。具体的,脚本是一种计算机程序语言,脚本是一系列控制计算机进行运算操作动作的组合,通过对预设脚本库中的脚本进行执行即可对服务器中所存在的故障进行排除。
在一实施例中,如图5所示,步骤S150包括子步骤S151和S152。
S151、根据该设备监控数据信息中超出预设监控项阈值的监控项目值对预设脚本库进行检索以得到目标脚本。
根据该设备监控数据信息中超出预设监控项阈值的监控项目值所对应的监控项目对预设脚本库进行检索以得到目标脚本。由于监控数据信息中监控项目值与预设监控项中所包含的监控项目一一对应,通过获取设备监控数据信息中超出预设监控项阈值的监控项目值所对应的监控项目,即可对预设脚本库进行检索以得到目标脚本。
例如,某一设备监控数据信息中超出预设监控项阈值的监控项目值所对应的监控项目为进程数量,也即是该设备中进程数量这一监控项目值超出预设监控项阈值,则通过进程数量对脚本库中所对应的脚本进行检索得到终止部分进程的脚本为目标脚本。
S152、将所得到的目标脚本发送至该设备以对目标脚本进行执行。
将所得到的目标脚本发送至该设备进行执行,即可对该设备的故障进行排除,对设备故障进行排除的过程有程序自行实现,完全无需人为操作,能够极大地方便运维人员对企业级服务器中巨量的设备进行管理。
例如,某一设备监控数据信息中超出预设监控项阈值的监控项目值所对应的监控项目为进程数量,也即是该设备中进程数量这一监控项目值超出预设监控项阈值,执行终止部分进程的脚本之后,通过减少该设备所运行的进程以将该设备的进程数量减少至预设监控阈值以下。
通过获取待监控服务器中所包含设备的基础信息并根据预设监控图构建规则构建得到三维监控图,通过所构建的三维监控图对设备进行实时监控,能够对故障设备进行快速定位,方便运维人员对待监控服务器进行维护,大幅提高了对服务器进行维护的效率。
本发明实施例还提供一种服务器监控装置,该服务器监控装置用于执行前述服务器监控方法的任一实施例。具体地,请参阅图6,图6是本发明实施例提供的服务器监控装置的示意性框图。该服务器监控装置100可以配置于用户终端中。
如图6所示,服务器监控装置100包括基础信息获取单元110、三维监控图构建单元120、设备监控信息获取单元130和设备状态信息添加单元140。
基础信息获取单元110,用于获取所有待监控服务器的设备基础信息。
获取所有待监控服务器中每一台设备的基础信息,其中,基础信息包括设备的位置信息、属性信息及名称信息。待监控服务器即是企业中所需进行监控的企业终端,其中,待监控服务器为企业级服务器,企业级服务器运行在需要处理大量数据、高处理速度和对可靠性要求极高的金融、证券、交通、邮电、通信或大型企业,企业级服务器用于联网计算机在数百台以上、对处理速度和数据安全要求非常高的大型网络,因而待监控服务器中所包含的设备量十分巨大。其中,待监控服务器可以为一个或多个。
具体的,位置信息即是设备在待监控服务器中所处的地理位置信息,属性信息即是用于对设备的种类进行区分的信息,不同种类的设备具有不同的属性信息,名称信息即是该设备的具体名称。
三维监控图构建单元120,用于根据预设监控图构建规则及所得到的设备基础信息构建三维监控图。
根据预设监控图构建规则及所得到的设备基础信息构建三维监控图。其中,监控图构建规则即是用于构建三维监控图的规则信息,通过监控图构建规则对所有设备的基础信息进行处理即可构建得到三维监控图,所述监控图构建规则中包括三维坐标。三维监控图即是对设备进行立体展示的三维图,通过三维监控图运维人员能够直观地察看所监控的所有设备,并且能够通过察看三维监控图快速获取故障设备在待监控服务器中所处的位置,方便运维人员快速对待监控服务器中存在故障的设备进行定位并及时排除故障。
其他发明实施例中,如图7所示,所述三维监控图构建单元120包括子单元:设备分类信息获取单元121、设备添加单元122和名称信息添加单元123。
设备分类信息获取单元121,用于根据设备基础信息中的属性信息对设备进行分类以得到设备分类信息。
根据设备基础信息中的属性信息对所有设备进行分类以得到设备分类信息。属性信息即是用于对设备的种类进行区分的信息,不同种类的设备具有不同的属性信息,设备分类信息即是根据属性信息对待监控服务器中的所有设备进行分类之后每一个类别所包含的设备。
设备添加单元122,用于根据设备分类信息将与设备基础信息中的位置信息相对应的设备分类添加至三维坐标以构建得到三维监控图。
根据设备分类信息,将与设备基础信息中的位置信息相对应的设备分类添加至三维坐标,以构建得到三维监控图。具体的,三维坐标即是包含X轴、Y轴、Z轴的三维坐标系,在所构建的三维监控图中分不同的区域对不同类别的设备进行添加,设备的位置信息中,设备的机柜号对应X轴,设备的列数对应Y轴,设备的行数对应Z轴。
名称信息添加单元123,将设备基础信息中的名称信息添加至所构建三维监控图对应的设备中。
将设备基础信息中的名称信息添加至所构建三维监控图对应的设备中,为使三维监控图中的每一个设备与该设备的名称信息一一对应,需将设备基础信息中的名称信息添加至所构建的三维监控图对应的设备中。
设备监控信息获取单元130,用于根据预设监控项对三维监控图中所有设备的运行状态进行实时监控以得到设备监控信息。
根据预设监控项对每一台设备的运行状态进行实时监控以得到设备监控信息。预设监控项即是对待监控的企业级服务器中每一台设备所需进行监控的项目信息设备监控信息即是根据预设监控项对每一台设备进行监控所得到的数据信息,设备监控信息中每一台设备的数据信息包含多个监控项目值,监控项目值即与预设监控项中所包含的监控项目一一对应。
具体的,预设监控项中包括多个监控项目,预设监控项中所包含的监控项目包括但不限于:设备温度、工作状态、资源占比、数据流量、响应时间、进程数量。工作状态即是所监控设备是否工作的状态信息,若设备断电则该设备的工作状态为非工作,若设备通电则该设备的工作状态为工作,资源占比即是该设备中所包含的资源被占用的比例信息,其中,设备的资源占比具体为该设备CPU的使用率、内存的使用率等的平均值,数据流量即是该设备输入及输出的数据量信息,响应时间即是该设备对所接收到的操作指令进行响应的时间信息,进程数量即是该设备当前所执行的进程的数量信息。
设备状态信息添加单元140,用于对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中。
对所得到的设备监控信息是否超出预设监控项阈值进行判断,即可获取得到设备状态信息,将设备状态信息添加至所构建的三维监控图中。其中,预设监控阈值中包含多个监控项目阈值,预设监控阈值即是对设备监控信息所包含的多个监控项目值进行预警的阈值信息,监控项目阈值与监控数据信息所包含的监控项目值一一对应。
运行状态信息即是用于对设备的运行状态是否健康进行标注的信息,若设备状态信息为健康,则表明该设备不存在故障,若设备状态信息为不健康,则表明该设备存在故障,需对该设备的故障进行排除。
其他发明实施例中,如图8所示,所述设备状态信息添加单元140包括子单元:监控数据信息判断单元141和设备状态信息判断单元142。
监控数据信息判断单元141,用于根据预设监控项阈值对设备监控信息中的设备进行判断以获取该设备监控数据信息中监控项目值超出预设监控项阈值的数量。
根据预设监控项阈值对设备监控信息中的设备进行判断,即可获取该设备监控数据信息中监控项目值超出预设监控项阈值的数量。具体的,设备监控数据信息中包含多个监控项目值,根据预设监控项阈值中的监控项目阈值与设备监控数据信息中的所对应的监控项目值进行一一比对,即可统计得到该设备监控数据信息中监控项目值超出预设监控项阈值的数量。
设备状态信息判断单元142,用于根据设备监控数据信息中监控项目值超出预设监控项阈值的数量对设备是否健康进行判断以得到所有设备的设备状态信息。
根据设备监控数据信息中监控项目值超出预设监控项阈值的数量对设备是否健康进行判断以得到所有设备的设备状态信息。具体的,若设备监控数据信息中某一设备的监控项目值超出预设监控项阈值的数量为零,则该设备的运行状态信息为健康;若设备监控数据信息中某一设备的监控项目值超出预设监控项阈值的数量为1个,则该设备的运行状态信息为亚健康,若设备监控数据信息中某一设备的监控项目值超出预设监控项阈值的数量大于1个,则该设备的运行状态信息为不健康。
获取所有设备的运行状态信息后,将所述运行状态信息添加至所构建的三维监控图中进行显示,即可使运维人员能够直观地察看到所有设备的健康状态,并且能够通过察看三维监控图中设备的监控状态信息快速获取非健康设备在待监控服务器中所处的位置。具体的,可通过添加标记、颜色信息等方法将设备的运行状态信息添加至所构建的三维监控图中进行显示。
其他发明实施例中,如图9所示,所述服务器监控装置100还包括子单元:目标脚本执行单元150。
目标脚本执行单元150,用于若设备监控信息超出预设监控阈值,根据该设备监控信息在预设脚本库中进行搜索以得到目标脚本并将该目标脚本发送至该设备以对目标脚本进行执行。
若某一设备的监控数据信息超出预设监控阈值,根据该设备的监控数据信息,对预设脚本库进行搜索以得到目标脚本,并将目标脚本发送至该设备以对目标脚本进行执行。其中,所述预设脚本库中包含多个脚本,不同的脚本在设备中执行之后能够对该设备中所存在的相应的故障进行排除。具体的,脚本是一种计算机程序语言,脚本是一系列控制计算机进行运算操作动作的组合,通过对预设脚本库中的脚本进行执行即可对服务器中所存在的故障进行排除。
其他发明实施例中,如图10所示,所述目标脚本执行单元150包括子单元:目标脚本获取单元151和目标脚本发送单元152。
目标脚本获取单元151,用于根据该设备监控数据信息中超出预设监控项阈值的监控项目值对预设脚本库进行检索以得到目标脚本。
根据该设备监控数据信息中超出预设监控项阈值的监控项目值所对应的监控项目对预设脚本库进行检索以得到目标脚本。由于监控数据信息中监控项目值与预设监控项中所包含的监控项目一一对应,通过获取设备监控数据信息中超出预设监控项阈值的监控项目值所对应的监控项目,即可对预设脚本库进行检索以得到目标脚本。
目标脚本发送单元152,用于将所得到的目标脚本发送至该设备以对目标脚本进行执行。
将所得到的目标脚本发送至该设备进行执行,即可对该设备的故障进行排除,对设备故障进行排除的过程有程序自行实现,完全无需人为操作,能够极大地方便运维人员对企业级服务器中巨量的设备进行管理。
通过获取待监控服务器中所包含设备的基础信息并根据预设监控图构建规则构建得到三维监控图,通过所构建的三维监控图对设备进行实时监控,能够对故障设备进行快速定位,方便运维人员对待监控服务器进行维护,大幅提高了对服务器进行维护的效率。
上述服务器监控装置可以实现为计算机程序的形式,该计算机程序可以在如图11所示的计算机设备上运行。
请参阅图11,图11是本发明实施例提供的计算机设备的示意性框图。
参阅图11,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行服务器监控方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行服务器监控方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图11中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:获取所有待监控服务器的设备基础信息;根据预设监控图构建规则及所得到的设备基础信息构建三维监控图;根据预设监控项对三维监控图中所有设备的运行状态进行实时监控以得到设备监控信息;对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中。
在一实施例中,处理器502在执行根据预设监控图构建规则及所得到的设备基础信息构建三维监控图的步骤时,执行如下操作:根据设备基础信息中的属性信息对设备进行分类以得到设备分类信息;根据设备分类信息将与设备基础信息中的位置信息相对应的设备分类添加至三维坐标以构建得到三维监控图;将设备基础信息中的名称信息添加至所构建三维监控图对应的设备中。
在一实施例中,处理器502在执行对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中的步骤时,执行如下操作:根据预设监控项阈值对设备监控信息中的设备进行判断以获取该设备监控数据信息中监控项目值超出预设监控项阈值的数量;根据设备监控数据信息中监控项目值超出预设监控项阈值的数量对设备是否健康进行判断以得到所有设备的设备状态信息。
在一实施例中,处理器502在执行对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中的步骤之后,还执行如下操作:若设备监控信息超出预设监控阈值,根据该设备监控信息在预设脚本库中进行搜索以得到目标脚本并将该目标脚本发送至该设备以对目标脚本进行执行。
在一实施例中,处理器502在执行若设备监控信息超出预设监控阈值,根据该设备监控信息在预设脚本库中进行搜索以得到目标脚本并将该目标脚本发送至该设备以对目标脚本进行执行的步骤时,执行如下操作:根据该设备监控数据信息中超出预设监控项阈值的监控项目值对预设脚本库进行检索以得到目标脚本;将所得到的目标脚本发送至该设备以对目标脚本进行执行。
本领域技术人员可以理解,图11中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图11所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:获取所有待监控服务器的设备基础信息;根据预设监控图构建规则及所得到的设备基础信息构建三维监控图;根据预设监控项对三维监控图中所有设备的运行状态进行实时监控以得到设备监控信息;对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中。
在一实施例中,所述根据预设监控图构建规则及所得到的设备基础信息构建三维监控图的步骤,包括:根据设备基础信息中的属性信息对设备进行分类以得到设备分类信息;根据设备分类信息将与设备基础信息中的位置信息相对应的设备分类添加至三维坐标以构建得到三维监控图;将设备基础信息中的名称信息添加至所构建三维监控图对应的设备中。
在一实施例中,所述对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中的步骤,包括:根据预设监控项阈值对设备监控信息中的设备进行判断以获取该设备监控数据信息中监控项目值超出预设监控项阈值的数量;根据设备监控数据信息中监控项目值超出预设监控项阈值的数量对设备是否健康进行判断以得到所有设备的设备状态信息。
在一实施例中,所述对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中的步骤之后,还包括:若设备监控信息超出预设监控阈值,根据该设备监控信息在预设脚本库中进行搜索以得到目标脚本并将该目标脚本发送至该设备以对目标脚本进行执行。
在一实施例中,所述若设备监控信息超出预设监控阈值,根据该设备监控信息在预设脚本库中进行搜索以得到目标脚本并将该目标脚本发送至该设备以对目标脚本进行执行的步骤,包括:根据该设备监控数据信息中超出预设监控项阈值的监控项目值对预设脚本库进行检索以得到目标脚本;将所得到的目标脚本发送至该设备以对目标脚本进行执行。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种服务器监控方法,其特征在于,包括:
获取所有待监控服务器的设备基础信息;
根据预设监控图构建规则及所得到的设备基础信息构建三维监控图;
根据预设监控项对三维监控图中所有设备的运行状态进行实时监控以得到设备监控信息;
对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中。
2.根据权利要求1所述的服务器监控方法,其特征在于,所述根据预设监控图构建规则及所得到的设备基础信息构建三维监控图,包括:
根据设备基础信息中的属性信息对设备进行分类以得到设备分类信息;
根据设备分类信息将与设备基础信息中的位置信息相对应的设备分类添加至三维坐标以构建得到三维监控图;
将设备基础信息中的名称信息添加至所构建三维监控图对应的设备中。
3.根据权利要求1所述的服务器监控方法,其特征在于,所述对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,包括:
根据预设监控项阈值对设备监控信息中的设备进行判断以获取该设备监控数据信息中监控项目值超出预设监控项阈值的数量;
根据设备监控数据信息中监控项目值超出预设监控项阈值的数量对设备是否健康进行判断以得到所有设备的设备状态信息。
4.根据权利要求1所述的服务器监控方法,其特征在于,所述对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中之后,还包括:
若设备监控信息超出预设监控阈值,根据该设备监控信息在预设脚本库中进行搜索以得到目标脚本并将该目标脚本发送至该设备以对目标脚本进行执行。
5.根据权利要求4所述的服务器监控方法,其特征在于,根据该设备监控信息在预设脚本库中进行搜索以得到目标脚本并将该目标脚本发送至该设备以对目标脚本进行执行,包括:
根据该设备监控数据信息中超出预设监控项阈值的监控项目值对预设脚本库进行检索以得到目标脚本;
将所得到的目标脚本发送至该设备以对目标脚本进行执行。
6.一种服务器监控装置,其特征在于,包括:
基础信息获取单元,用于获取所有待监控服务器的设备基础信息;
三维监控图构建单元,用于根据预设监控图构建规则及所得到的设备基础信息构建三维监控图;
设备监控信息获取单元,用于根据预设监控项对三维监控图中所有设备的运行状态进行实时监控以得到设备监控信息;
设备状态信息添加单元,用于对所得到的设备监控信息是否超出预设监控项阈值进行判断以获取所有设备的设备状态信息,并添加至所构建的三维监控图中。
7.根据权利要求6所述的服务器监控装置,其特征在于,所述三维监控图构建单元,包括:
设备分类信息获取单元,用于根据设备基础信息中的属性信息对待监控服务器中的所有设备进行分类以得到设备分类信息;
设备添加单元,用于根据设备分类信息将与设备基础信息中的位置信息相对应的设备分类添加至三维坐标以构建得到三维监控图;
名称信息添加单元,将设备基础信息中的名称信息添加至所构建三维监控图对应的设备中。
8.根据权利要求6所述的服务器监控装置,其特征在于,所述设备状态信息添加单元,包括:
监控数据信息判断单元,用于根据预设监控项阈值对设备监控信息中的设备进行判断以获取该设备监控数据信息中监控项目值超出预设监控项阈值的数量;
设备状态信息判断单元,用于根据设备监控数据信息中监控项目值超出预设监控项阈值的数量对设备是否健康进行判断以得到所有设备的设备状态信息。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的服务器监控方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至5任一项所述的服务器监控方法。
CN201811527623.9A 2018-12-13 2018-12-13 服务器监控方法、装置、计算机设备及存储介质 Pending CN109815093A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811527623.9A CN109815093A (zh) 2018-12-13 2018-12-13 服务器监控方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811527623.9A CN109815093A (zh) 2018-12-13 2018-12-13 服务器监控方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN109815093A true CN109815093A (zh) 2019-05-28

Family

ID=66602915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811527623.9A Pending CN109815093A (zh) 2018-12-13 2018-12-13 服务器监控方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109815093A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442628A (zh) * 2019-07-09 2019-11-12 恩亿科(北京)数据科技有限公司 一种数据监控方法、系统和计算机设备
CN111427739A (zh) * 2019-12-20 2020-07-17 上海有个机器人有限公司 一种机器人实时监控方法、介质、终端和装置
CN112697191A (zh) * 2020-12-31 2021-04-23 龙岩烟草工业有限责任公司 传感器工作状态显示方法、装置以及存储介质
CN112953792A (zh) * 2021-02-05 2021-06-11 中国工商银行股份有限公司 网络流量监测方法及装置
CN113326072A (zh) * 2021-05-24 2021-08-31 北京计算机技术及应用研究所 一种飞腾服务器平台下基于非易失内存的实时监控方法
CN115407711A (zh) * 2022-10-28 2022-11-29 山东柏源技术有限公司 一种面向企业管理的企业运营监管系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102608939A (zh) * 2012-01-19 2012-07-25 山西省电力公司电力通信中心 三维机房监控系统及方法
CN105471671A (zh) * 2015-11-10 2016-04-06 国云科技股份有限公司 一种云平台资源自定义监控规则的方法
CN105843904A (zh) * 2016-03-23 2016-08-10 江苏太湖云计算信息技术股份有限公司 针对数据库运行性能的监控告警系统
CN106600010A (zh) * 2016-12-02 2017-04-26 国家电网公司 基于场景自适应的智能化应急处理信息系统
CN106776207A (zh) * 2016-12-02 2017-05-31 郑州云海信息技术有限公司 一种数据中心监控系统
CN107452063A (zh) * 2017-08-07 2017-12-08 郑州云海信息技术有限公司 一种云数据中心三维3d智能监控机房的构建方法和装置
CN107862393A (zh) * 2017-10-31 2018-03-30 广西宜州市联森网络科技有限公司 一种it运维管理系统
CN108052660A (zh) * 2017-12-29 2018-05-18 王开富 一种设备搜索定位方法及智能联动管理方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102608939A (zh) * 2012-01-19 2012-07-25 山西省电力公司电力通信中心 三维机房监控系统及方法
CN105471671A (zh) * 2015-11-10 2016-04-06 国云科技股份有限公司 一种云平台资源自定义监控规则的方法
CN105843904A (zh) * 2016-03-23 2016-08-10 江苏太湖云计算信息技术股份有限公司 针对数据库运行性能的监控告警系统
CN106600010A (zh) * 2016-12-02 2017-04-26 国家电网公司 基于场景自适应的智能化应急处理信息系统
CN106776207A (zh) * 2016-12-02 2017-05-31 郑州云海信息技术有限公司 一种数据中心监控系统
CN107452063A (zh) * 2017-08-07 2017-12-08 郑州云海信息技术有限公司 一种云数据中心三维3d智能监控机房的构建方法和装置
CN107862393A (zh) * 2017-10-31 2018-03-30 广西宜州市联森网络科技有限公司 一种it运维管理系统
CN108052660A (zh) * 2017-12-29 2018-05-18 王开富 一种设备搜索定位方法及智能联动管理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱琦: "《分布式应用系统运维理论与实践》", pages: 238 - 242 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442628A (zh) * 2019-07-09 2019-11-12 恩亿科(北京)数据科技有限公司 一种数据监控方法、系统和计算机设备
CN111427739A (zh) * 2019-12-20 2020-07-17 上海有个机器人有限公司 一种机器人实时监控方法、介质、终端和装置
CN112697191A (zh) * 2020-12-31 2021-04-23 龙岩烟草工业有限责任公司 传感器工作状态显示方法、装置以及存储介质
CN112953792A (zh) * 2021-02-05 2021-06-11 中国工商银行股份有限公司 网络流量监测方法及装置
CN112953792B (zh) * 2021-02-05 2023-09-19 中国工商银行股份有限公司 网络流量监测方法及装置
CN113326072A (zh) * 2021-05-24 2021-08-31 北京计算机技术及应用研究所 一种飞腾服务器平台下基于非易失内存的实时监控方法
CN113326072B (zh) * 2021-05-24 2023-11-24 北京计算机技术及应用研究所 一种飞腾服务器平台下基于非易失内存的实时监控方法
CN115407711A (zh) * 2022-10-28 2022-11-29 山东柏源技术有限公司 一种面向企业管理的企业运营监管系统
CN115407711B (zh) * 2022-10-28 2023-03-10 山东柏源技术有限公司 一种面向企业管理的企业运营监管系统

Similar Documents

Publication Publication Date Title
CN109815093A (zh) 服务器监控方法、装置、计算机设备及存储介质
CN109586952B (zh) 服务器扩容方法、装置
CN110601898B (zh) 异常预警方法、装置、服务器及存储介质
CN101710400B (zh) 一种对核电站进行风险评估的方法和装置
CN108845910A (zh) 大规模微服务系统的监控方法、装置及存储介质
JP6647824B2 (ja) 異常診断システム及び異常診断方法
CN108762966A (zh) 系统异常拦截方法、装置、计算机设备及存储介质
CN105159964A (zh) 一种日志监控方法及系统
CN109005085A (zh) 一种服务可用性监控系统、方法、装置及设备
CN109189640A (zh) 服务器的监控方法、装置、计算机设备及存储介质
CN105260823A (zh) 一种重大设备健康状态的评估方法及系统
CN102111797A (zh) 一种故障的诊断方法和设备
CN106940913B (zh) 一种金融终端的故障处理方法及其装置
CN105847237A (zh) 一种基于nfv的安全管理方法和装置
US10142242B2 (en) Network support node traffic reduction for self-organizing networks
CN109992473A (zh) 应用系统的监控方法、装置、设备及存储介质
CN103281461A (zh) 一种呼叫中心监控方法、装置与系统
CN109115262A (zh) 一种搅拌厂生产线监测方法及系统
CN109783260A (zh) 智能it全流程运维方法、装置、设备及可读存储介质
CN103166776A (zh) 一种接入网设备综合管理系统
CN110968479B (zh) 一种针对应用程序的业务级全链路监控方法及服务器
CN113704018A (zh) 应用运维数据处理方法、装置、计算机设备及存储介质
KR101469179B1 (ko) 원자력 발전 시뮬레이터의 통신 진단 시스템
US11228485B2 (en) Dynamic action dashlet for real-time systems operation management
CN111159029A (zh) 自动化测试方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190528

RJ01 Rejection of invention patent application after publication