CN109254899B - 一种服务器监控方法和装置 - Google Patents
一种服务器监控方法和装置 Download PDFInfo
- Publication number
- CN109254899B CN109254899B CN201811149127.4A CN201811149127A CN109254899B CN 109254899 B CN109254899 B CN 109254899B CN 201811149127 A CN201811149127 A CN 201811149127A CN 109254899 B CN109254899 B CN 109254899B
- Authority
- CN
- China
- Prior art keywords
- monitoring
- metafunction
- script
- server
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 142
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000013515 script Methods 0.000 claims abstract description 102
- 230000008520 organization Effects 0.000 claims abstract description 32
- 238000000547 structure data Methods 0.000 claims abstract description 32
- 230000006870 function Effects 0.000 claims description 16
- 238000013075 data extraction Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 2
- 238000012806 monitoring device Methods 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 4
- 230000006978 adaptation Effects 0.000 description 11
- 238000011161 development Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3089—Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种服务器监控方法和装置。涉及云计算技术,解决了现有服务器监控系统大量消耗人力资源、适应性差的问题。该方法包括:根据服务器的设备基本信息,从元函数库中获取匹配的监控脚本组织结构数据,所述监控脚本组织结构数据包括指标集及所述指标集中各指标对应的元函数地址;根据所述监控脚本组织结构数据生成监控脚本;执行所述监控脚本,获取所述服务器的各项指标信息。本发明提供的技术方案适用于大规模数据中心,实现了高兼容性的数据中心监控。
Description
技术领域
本发明涉及云计算技术,尤指一种服务器监控方法和装置。
背景技术
当前,云计算逐渐被行业认可,数据中心的规模逐渐扩大。数据中心中异构设备各种各样,数量成千上万。对于基础设备特别是物理服务器的监控和管理成为数据中心工作的重要部分,各厂商、各型号服务器的指标没有统一的标准去约束,造成数据中心服务器异构、无标准,这给监控和运维带来了极大的挑战,造成了极大的人力浪费。通常的做法是基于硬件型号的各个版本分别进行适配开发,在开发过程中还存在大部分的重复工作,单纯的自动化脚本监控也是针对机型去适配的,适配量增加。同时,如果机器的固件进行升级更新,相应的监控适配脚本也要进行相应调整才能满足监控和设置的需求。
发明内容
为了解决上述技术问题,本发明提供了一种服务器监控方法和装置。
为了达到本发明目的,本发明提供了一种服务器监控方法,包括:
根据服务器的设备基本信息,从元函数库中获取匹配的监控脚本组织结构数据,所述监控脚本组织结构数据包括指标集及所述指标集中各指标对应的元函数地址;
根据所述监控脚本组织结构数据生成监控脚本;
执行所述监控脚本,获取所述服务器的各项指标信息。
优选的,根据所述监控脚本组织结构数据生成监控脚本的步骤包括:
针对所述指标集中的各个指标,根据对应的元函数地址,提取元函数;
将各指标与相应的元函数组成所述监控脚本。
优选的,执行所述监控脚本,获取所述服务器的各项指标信息的步骤之后,还包括:
步骤一、在一个或多个指标监控失败的情况下,对于涉及的指标,从所述元函数库中选取与所述指标匹配的其他元函数地址,所述其他元函数地址与所述服务器的设备基本信息完全匹配或最接近;
步骤二、获取所述其他元函数;
步骤三、使用所述其他元函数构建新的监控脚本并运行;
步骤四、在仍存在监控失败的指标的情况下,重复上述步骤一至三,直至无监控失败的指标为止。
本发明还提供了一种服务器监控装置,包括:
数据提取模块,用于根据服务器的设备基本信息,从元函数库中获取匹配的监控脚本组织结构数据,所述监控脚本组织结构数据包括指标集及所述指标集中各指标对应的元函数地址;
脚本生成模块,用于根据所述监控脚本组织结构数据生成监控脚本;
监控执行模块,用于执行所述监控脚本,获取所述服务器的各项指标信息。
优选的,所述脚本生成模块包括:
元函数提取单元,用于针对所述指标集中的各个指标,根据对应的元函数地址,提取元函数;
脚本构建单元,用于将各指标与相应的元函数组成所述监控脚本。
优选的,所述数据提取模块,还用于在一个或多个指标监控失败的情况下,对于涉及的指标,从所述元函数库中选取与所述指标匹配的其他元函数地址,所述其他元函数地址与所述服务器的设备基本信息完全匹配或最接近;
所述脚本生成模块,还用于获取所述其他元函数,使用所述其他元函数构建新的监控脚本并运行,直至无监控失败的指标为止。
本发明提供了一种服务器监控方法和装置,根据服务器的设备基本信息,从元函数库中获取匹配的监控脚本组织结构数据,所述监控脚本组织结构数据包括指标集及所述指标集中各指标对应的元函数地址;再根据所述监控脚本组织结构数据生成监控脚本;最后执行所述监控脚本,获取所述服务器的各项指标信息。实现了高兼容性的数据中心监控,解决了现有服务器监控系统大量消耗人力资源、适应性差的问题。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明的一实施例提供的一种服务器监控方法的流程示意图;
图2为图1中步骤102的具体流程示意图;
图3为本发明的一实施例提供的又一种服务器监控方法的流程示意图;
图4为本发明的一实施例提供的一种服务器监控装置的结构示意图;
图5为图4中脚本生成模块402的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
各厂商、各型号服务器的指标没有统一的标准去约束,造成数据中心服务器异构、无标准,这给监控和运维带来了极大的挑战,造成了极大的人力浪费。通常的做法是基于硬件型号的各个版本分别进行适配开发,在开发过程中还存在大部分的重复工作,单纯的自动化脚本监控也是针对机型去适配的,适配量增加。同时,如果机器的固件进行升级更新,相应的监控适配脚本也要进行相应调整才能满足监控和设置的需求。
为了解决上述问题,本发明的实施例提供了一种服务器监控方法,使用该方法完成服务器监控的流程如图1所示,包括:
步骤101、根据服务器的设备基本信息,从元函数库中获取匹配的监控脚本组织结构数据。
本发明实施例中,所述监控脚本组织结构数据包括指标集及所述指标集中各指标对应的元函数地址。
以包括调度器、决策者、装配工、元函数库管理四部分的系统为例进行说明。调度器主要负责调度并反馈当前监控的信息,相应获取不到的信息反馈给决策者;决策者根据相应服务器基本信息去元函数库中尝试和验证某个函数库适应此服务器;装配工根据决策者提供的相关的信息从元函数库中获取函数组装成相应的监控脚本交付给调度器使用;元函数库负责维护函数的元数据包括获取的指标、参数等信息。
对于新的设备,决策者根据相应的设备基本信息(用户名、密码、型号),从元函数库中获取相应的监控脚本组织结构数据,包含相应的指标集、相应指标的元函数地址。
步骤102、根据所述监控脚本组织结构数据生成监控脚本。
本步骤具体如图2所示,包括:
步骤1021、针对所述指标集中的各个指标,根据对应的元函数地址,提取元函数;
步骤1022、将各指标与相应的元函数组成所述监控脚本。
仍沿用步骤101中的举例,决策者发送相应的监控脚本基本信息给装配工,装配工根据决策者提供的信息去元数据库获取相应的函数信息,装配工自动加工元函数成为一个服务器相应的全部监控指标的可执行脚本,且发送脚本路径给调度器。
步骤103、执行所述监控脚本,获取所述服务器的各项指标信息。
本发明的一实施例还提供了一种服务器监控方法,在执行监控脚本完成监控任务的过程中,可能会发生监控脚本中的部分指标匹配得到的元函数实际上并不适用的情况,例如,监控过程中,设备的固件发生升级和刷新,调度器获取不到相应的指标。此时无法获取指标数值,导致该部分指标监控失败。针对上述情况,本发明的实施例提供的服务器监控方法还可对监控脚本进行进一步调整,以适配服务器配置,具体如图3所示,包括:
步骤301、在一个或多个指标监控失败的情况下,对于涉及的指标,从所述元函数库中选取与所述指标匹配的其他元函数地址,所述其他元函数地址与所述服务器的设备基本信息完全匹配或最接近。
元函数库中的监控脚本组织结构数据可在监控适配开发过程中自定义维护,尤其是在系统初始化时,元函数库的数据主要根据定义配置生成。随着监控过程的时间推移,以及服务器BMC、BIOS升级等原因,会造成元函数库中对于监控指标(CPU、内存等)的获取命令方式变化,对于元函数库中各项指标项均可从包括服务器型号、BMC版本等多项维度进行准确匹配,也会包括BMC版本号、型号的模糊匹配及自更新(所谓的自更新,就是通过对元数据指标获取相对服务器信息的时候如果获取成功,就把这个指标的元数据更新和添加这个机型的具体信息)。
对于没有找到完全匹配的指标的情况,则优先选择BMC版本、BIOS版本相近的。例如,当前服务器BMC版本为3.4。元函数库中存在BMC版本2.5和3.4的指标获取元函数,则可优先选择3.4版本尝试是否获取成功,然后组装监控脚本。对于服务器型号也是基于同样的原理,在没有完全匹配指标的情况下选择相近的。例如都是M4平台则肯定优先选择同平台的,然后再根据型号相近和相似的顺序进行匹配及更新。
因此,本步骤中,对于涉及的指标,从所述元函数库中选取与所述指标匹配的其他元函数地址,即选择其他的元函数时,首先优选与该指标完全匹配的。在无法匹配时,则选择与该指标的设备基本信息最接近的元函数来完成监控。
步骤302、获取所述其他元函数。
步骤303、使用所述其他元函数构建新的监控脚本并运行。
步骤304、在仍存在监控失败的指标的情况下,重复上述步骤301-303,直至无监控失败的指标为止。
仍沿用步骤101中的举例,调度器根据设备的信息自动的执行调度,且反馈相应的信息,对于失败的指标,调度器会把相应的指标反馈给决策者。决策者又从元数据中寻找和轮训相应的指标元函数,查看哪个元函数满足当前设备,然后重复以上步骤,直至全部指标监控完成。
本发明的一实施例还提供了一种服务器监控装置,其结构如图4所示,包括:
数据提取模块401,用于根据服务器的设备基本信息,从元函数库中获取匹配的监控脚本组织结构数据,所述监控脚本组织结构数据包括指标集及所述指标集中各指标对应的元函数地址;
脚本生成模块402,用于根据所述监控脚本组织结构数据生成监控脚本;
监控执行模块403,用于执行所述监控脚本,获取所述服务器的各项指标信息。
优选的,所述脚本生成模块402的结构如图5所示,包括:
元函数提取单元4021,用于针对所述指标集中的各个指标,根据对应的元函数地址,提取元函数;
脚本构建单元4022,用于将各指标与相应的元函数组成所述监控脚本。
优选的,所述数据提取模块401,还用于在一个或多个指标监控失败的情况下,对于涉及的指标,从所述元函数库中选取与所述指标匹配的其他元函数地址,所述其他元函数地址与所述服务器的设备基本信息完全匹配或最接近;
所述脚本生成模块402,还用于获取所述其他元函数,使用所述其他元函数构建新的监控脚本并运行,直至无监控失败的指标为止。
本发明的实施例提供了一种服务器监控方法和装置,根据服务器的设备基本信息,从元函数库中获取匹配的监控脚本组织结构数据,所述监控脚本组织结构数据包括指标集及所述指标集中各指标对应的元函数地址;再根据所述监控脚本组织结构数据生成监控脚本;最后执行所述监控脚本,获取所述服务器的各项指标信息。实现了高兼容性的数据中心监控,解决了现有服务器监控系统大量消耗人力资源、适应性差的问题。
拆分监控整体脚本到指标函数级别,根据智能尝试指标函数自动组装相应的监控,对监控脚本采用人工函数级拆分,机器智能组装的方式进行智能监控。打破了传统的使用整体监控脚本统一监控,且脚本提前固定写好的人工适配的方式,采用决策者智能学习和验证指标函数的方式更加自动智能准确,降低了适配开发的工作量,且提升了产品的准确性、适应性,同时用户自定义扩展相应的监控指标,便于根据系统需求关注相应的指标。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
Claims (4)
1.一种服务器监控方法,其特征在于,包括:
根据服务器的设备基本信息,从元函数库中获取匹配的监控脚本组织结构数据,所述监控脚本组织结构数据包括指标集及所述指标集中各指标对应的元函数地址;
根据所述监控脚本组织结构数据生成监控脚本;
执行所述监控脚本,获取所述服务器的各项指标信息;
根据所述监控脚本组织结构数据生成监控脚本的步骤包括:
针对所述指标集中的各个指标,根据对应的元函数地址,提取元函数;
将各指标与相应的元函数组成所述监控脚本。
2.根据权利要求1所述的服务器监控方法,其特征在于,执行所述监控脚本,获取所述服务器的各项指标信息的步骤之后,还包括:
步骤一、在一个或多个指标监控失败的情况下,对于涉及的指标,从所述元函数库中选取与所述指标匹配的其他元函数地址,所述其他元函数地址与所述服务器的设备基本信息完全匹配或最接近;
步骤二、获取所述其他元函数;
步骤三、使用所述其他元函数构建新的监控脚本并运行;
步骤四、在仍存在监控失败的指标的情况下,重复上述步骤一至三,直至无监控失败的指标为止。
3.一种服务器监控装置,其特征在于,包括:
数据提取模块,用于根据服务器的设备基本信息,从元函数库中获取匹配的监控脚本组织结构数据,所述监控脚本组织结构数据包括指标集及所述指标集中各指标对应的元函数地址;
脚本生成模块,用于根据所述监控脚本组织结构数据生成监控脚本;
监控执行模块,用于执行所述监控脚本,获取所述服务器的各项指标信息;
所述脚本生成模块包括:
元函数提取单元,用于针对所述指标集中的各个指标,根据对应的元函数地址,提取元函数;
脚本构建单元,用于将各指标与相应的元函数组成所述监控脚本。
4.根据权利要求3所述的服务器监控装置,其特征在于,
所述数据提取模块,还用于在一个或多个指标监控失败的情况下,对于涉及的指标,从所述元函数库中选取与所述指标匹配的其他元函数地址,所述其他元函数地址与所述服务器的设备基本信息完全匹配或最接近;
所述脚本生成模块,还用于获取所述其他元函数,使用所述其他元函数构建新的监控脚本并运行,直至无监控失败的指标为止。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811149127.4A CN109254899B (zh) | 2018-09-29 | 2018-09-29 | 一种服务器监控方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811149127.4A CN109254899B (zh) | 2018-09-29 | 2018-09-29 | 一种服务器监控方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109254899A CN109254899A (zh) | 2019-01-22 |
CN109254899B true CN109254899B (zh) | 2022-03-22 |
Family
ID=65044740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811149127.4A Active CN109254899B (zh) | 2018-09-29 | 2018-09-29 | 一种服务器监控方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109254899B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111143165A (zh) * | 2019-12-20 | 2020-05-12 | 深圳前海微众银行股份有限公司 | 一种监控方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104022902A (zh) * | 2014-05-30 | 2014-09-03 | 京东方科技集团股份有限公司 | 一种监控服务器集群的方法和系统 |
CN105005527A (zh) * | 2015-05-26 | 2015-10-28 | 北京中亦安图科技股份有限公司 | 一种服务端产品监测方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8332509B2 (en) * | 2010-02-20 | 2012-12-11 | Microsoft Corporation | Parameterized computer monitoring system |
-
2018
- 2018-09-29 CN CN201811149127.4A patent/CN109254899B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104022902A (zh) * | 2014-05-30 | 2014-09-03 | 京东方科技集团股份有限公司 | 一种监控服务器集群的方法和系统 |
CN105005527A (zh) * | 2015-05-26 | 2015-10-28 | 北京中亦安图科技股份有限公司 | 一种服务端产品监测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109254899A (zh) | 2019-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9626271B2 (en) | Multivariate metadata based cloud deployment monitoring for lifecycle operations | |
US8806471B2 (en) | Upgrade and downgrade in package update operations | |
US9348573B2 (en) | Installation and fault handling in a distributed system utilizing supervisor and dependency manager nodes | |
US9405630B2 (en) | Methods and apparatus to perform site recovery of a virtual data center | |
US7870169B2 (en) | Method for enabling traceability and recovery from errors during migration of software applications | |
CN109240716B (zh) | 一种大数据平台版本管理与快速迭代部署方法及系统 | |
US11693731B2 (en) | System and methods for diagnosing and repairing a smart mobile device by disabling components | |
CN111190823A (zh) | Ui自动化测试方法、电子装置及计算机可读存储介质 | |
CN112306626B (zh) | 用于更新云平台的方法和装置 | |
US20230384750A1 (en) | Efficient controller data generation and extraction | |
CN108255735B (zh) | 关联环境测试方法、电子装置及计算机可读存储介质 | |
CN112416803A (zh) | 一种自动化测试方法和装置 | |
CN109254899B (zh) | 一种服务器监控方法和装置 | |
CN106843935A (zh) | 一种自动更新静态文件版本号的方法及系统 | |
CN113721948A (zh) | 一种数据库升级方法、系统及存储介质 | |
US20150089018A1 (en) | Centralized management of webservice resources in an enterprise | |
CN108989074A (zh) | 程序升级方法和程序升级装置 | |
CN112579247A (zh) | 确定任务状态的方法和装置 | |
CN107436790A (zh) | 一种组件升级管理方法及装置 | |
CN111897794A (zh) | 数据库的维护方法、装置、电子设备和存储介质 | |
CN113553097B (zh) | 模型版本管理方法及装置 | |
CN118092942B (zh) | 大数据分析平台的离线部署方法及装置 | |
CN107256163B (zh) | 一种实现节点管理的方法及装置 | |
CN113849291A (zh) | 基于容器集群的任务处理方法、装置、设备、介质及产品 | |
CN116938711A (zh) | 固件升级方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |