CN116089220A - 基于操作系统的指标巡检方法及其装置、电子设备 - Google Patents

基于操作系统的指标巡检方法及其装置、电子设备 Download PDF

Info

Publication number
CN116089220A
CN116089220A CN202310124847.XA CN202310124847A CN116089220A CN 116089220 A CN116089220 A CN 116089220A CN 202310124847 A CN202310124847 A CN 202310124847A CN 116089220 A CN116089220 A CN 116089220A
Authority
CN
China
Prior art keywords
server
index
script
preset
inspection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310124847.XA
Other languages
English (en)
Inventor
类铭辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310124847.XA priority Critical patent/CN116089220A/zh
Publication of CN116089220A publication Critical patent/CN116089220A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于操作系统的指标巡检方法及其装置、电子设备,涉及金融科技领域或其他相关领域,其中,该指标巡检方法包括:接收巡检任务,在到达执行时间的情况下,依据服务器清单调度服务器标识指示的服务器执行预设指标检查脚本,在服务器对预设指标检查脚本执行完成的情况下,接收服务器返回的检查结果,在指标值属于预设阈值范围的情况下,确定服务器的操作系统的指标状态为正常状态。本发明解决了相关技术中无法自动对操作系统的指标进行巡检的技术问题。

Description

基于操作系统的指标巡检方法及其装置、电子设备
技术领域
本发明涉及金融科技领域,具体而言,涉及一种基于操作系统的指标巡检方法及其装置、电子设备。
背景技术
目前,数据中心服务器规模呈现爆发性增长,其中数量增长最快的主要集中在开放平台系统(例如,X86开放平台系统)。面对如此服务器爆发式的增长,当前操作系统的运维方式无法很好的应对,很多操作系统的指标存在隐患,例如,服务器nfs(Network FileSystem,即网络文件系统)卸载异常、服务器长时间未重启、syslog进程(日志守护进程)异常导致报警无法正常发送。为此数据中心系统部门引入操作系统指标巡检模块,需对全量服务器相关操作系统指标进行巡检。然而,在此背景下相关技术中通过人工执行命令式的巡检工作难以开展,无法适应服务器规模化下的巡检工作需求。因此,亟需自动化的操作系统指标巡检作业满足高效、快速的要求,以应对数据中心快速发现隐患,整改异常指标。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种基于操作系统的指标巡检方法及其装置、电子设备,以至少解决相关技术中无法自动对操作系统的指标进行巡检的技术问题。
根据本发明实施例的一个方面,提供了一种基于操作系统的指标巡检方法,包括:接收巡检任务,其中,所述巡检任务至少包括:执行时间、服务器清单,所述服务器清单用于记录服务器标识;在到达所述执行时间的情况下,依据所述服务器清单调度所述服务器标识指示的服务器执行预设指标检查脚本,其中,所述预设指标检查脚本预先部署在所述服务器上;在所述服务器对所述预设指标检查脚本执行完成的情况下,接收所述服务器返回的检查结果,其中,所述检查结果至少包括:指标值;在所述指标值属于预设阈值范围的情况下,确定所述服务器的操作系统的指标状态为正常状态。
可选地,在接收巡检任务之前,还包括:确定业务需求;基于所述业务需求,生成所述预设指标检查脚本;在所述预设指标检查脚本测试通过的情况下,将所述预设指标检查脚本加入至预设脚本库;基于所述预设脚本库,为所述服务器部署所述预设指标检查脚本。
可选地,在基于所述业务需求,生成所述预设指标检查脚本之后,还包括:对所述预设指标检查脚本进行测试,得到测试结果,其中,所述测试的测试类型包括下述至少之一:脚本编码格式测试、脚本输出格式测试、脚本适配性测试;在每个所述测试类型指示的测试都通过的情况下,将所述测试结果记录为测试通过。
可选地,在接收巡检任务之前,还包括:确定待检测服务器集合,并基于所述待检测服务器集合中的每个所述服务器标识,生成所述服务器清单;采集所述待检测服务器集合中的每个所述服务器的服务器信息,生成全量服务器信息;确定所述执行时间以及执行频率;基于所述服务器清单、所述全量服务器信息、所述执行时间以及所述执行频率,生成所述巡检任务。
可选地,在接收巡检任务之后,还包括:依据所述全量服务器信息,确定所述服务器清单中的每个所述服务器标识指示的所述服务器的服务器类型;为每个所述服务器生成与所述服务器类型对应的服务器标签。
可选地,在依据所述服务器清单调度所述服务器标识指示的服务器执行预设指标检查脚本之后,还包括:所述服务器依据所述服务器标签,采集指标信息;所述服务器基于所述指标信息生成指标值,并将所述指标值记录至所述检查结果;所述服务器将所述检查结果返回至脚本调度工具,其中,所述脚本调度工具用于调度所述服务器执行所述预设指标检查脚本,所述脚本调度工具依据所述巡检任务携带的预设格式返回所述检查结果。
可选地,在接收所述服务器返回的检查结果之后,还包括:在所述指标值不属于所述预设阈值范围的情况下,确定与所述指标值关联的待调整服务器;调整所述待调整服务器的所述操作系统,其中,所述调整的调整类型包括下述至少之一:参数调整、重启调整。
根据本发明实施例的另一方面,还提供了一种基于操作系统的指标巡检装置,包括:第一接收单元,用于接收巡检任务,其中,所述巡检任务至少包括:执行时间、服务器清单,所述服务器清单用于记录服务器标识;调度单元,用于在到达所述执行时间的情况下,依据所述服务器清单调度所述服务器标识指示的服务器执行预设指标检查脚本,其中,所述预设指标检查脚本预先部署在所述服务器上;第二接收单元,用于在所述服务器对所述预设指标检查脚本执行完成的情况下,接收所述服务器返回的检查结果,其中,所述检查结果至少包括:指标值;确定单元,用于在所述指标值属于预设阈值范围的情况下,确定所述服务器的操作系统的指标状态为正常状态。
可选地,所述指标巡检装置还包括:第一确定模块,用于在接收巡检任务之前,确定业务需求;第一生成模块,用于基于所述业务需求,生成所述预设指标检查脚本;第一加入模块,用于在所述预设指标检查脚本测试通过的情况下,将所述预设指标检查脚本加入至预设脚本库;第一部署模块,用于基于所述预设脚本库,为所述服务器部署所述预设指标检查脚本。
可选地,所述指标巡检装置还包括:第一测试模块,用于在基于所述业务需求,生成所述预设指标检查脚本之后,对所述预设指标检查脚本进行测试,得到测试结果,其中,所述测试的测试类型包括下述至少之一:脚本编码格式测试、脚本输出格式测试、脚本适配性测试;第一记录模块,用于在每个所述测试类型指示的测试都通过的情况下,将所述测试结果记录为测试通过。
可选地,所述指标巡检装置还包括:第二确定模块,用于在接收巡检任务之前,确定待检测服务器集合,并基于所述待检测服务器集合中的每个所述服务器标识,生成所述服务器清单;第一采集模块,用于采集所述待检测服务器集合中的每个所述服务器的服务器信息,生成全量服务器信息;第三确定模块,用于确定所述执行时间以及执行频率;第二生成模块,用于基于所述服务器清单、所述全量服务器信息、所述执行时间以及所述执行频率,生成所述巡检任务。
可选地,所述指标巡检装置还包括:第四确定模块,用于在接收巡检任务之后,依据所述全量服务器信息,确定所述服务器清单中的每个所述服务器标识指示的所述服务器的服务器类型;第三生成模块,用于为每个所述服务器生成与所述服务器类型对应的服务器标签。
可选地,所述指标巡检装置还包括:第二采集模块,用于在依据所述服务器清单调度所述服务器标识指示的服务器执行预设指标检查脚本之后,所述服务器依据所述服务器标签,采集指标信息;第四生成模块,用于所述服务器基于所述指标信息生成指标值,并将所述指标值记录至所述检查结果;第一返回模块,用于所述服务器将所述检查结果返回至脚本调度工具,其中,所述脚本调度工具用于调度所述服务器执行所述预设指标检查脚本,所述脚本调度工具依据所述巡检任务携带的预设格式返回所述检查结果。
可选地,所述指标巡检装置还包括:第五确定模块,用于在接收所述服务器返回的检查结果之后,在所述指标值不属于所述预设阈值范围的情况下,确定与所述指标值关联的待调整服务器;第一调整模块,用于调整所述待调整服务器的所述操作系统,其中,所述调整的调整类型包括下述至少之一:参数调整、重启调整。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述基于操作系统的指标巡检方法。
根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述基于操作系统的指标巡检方法。
在本公开中,接收巡检任务,在到达执行时间的情况下,依据服务器清单调度服务器标识指示的服务器执行预设指标检查脚本,在服务器对预设指标检查脚本执行完成的情况下,接收服务器返回的检查结果,在指标值属于预设阈值范围的情况下,确定服务器的操作系统的指标状态为正常状态。在本公开中,在达到巡检任务设定的执行时间时,可以根据巡检任务携带的服务器清单调度服务器执行预设指标检查脚本,当服务器对预设指标检查脚本执行完成后,接收服务器返回的检查结果,如果检查结果中携带的指标值属于预设阈值范围,则可以确定该服务器的操作系统的指标状态为正常状态,能够实现开放平台操作系统指标的自动化巡检,能够及时发现异常指标,进而解决了相关技术中无法自动对操作系统的指标进行巡检的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的基于操作系统的指标巡检方法的流程图;
图2是根据本发明实施例的一种可选的脚本部署流程的示意图;
图3是根据本发明实施例的一种可选的巡检任务执行流程的示意图;
图4是根据本发明实施例的一种可选的操作系统的指标的示意图;
图5是根据本发明实施例的一种可选的基于操作系统的指标巡检装置的示意图;
图6是根据本发明实施例的一种用于基于操作系统的指标巡检方法的电子设备(或移动设备)的硬件结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本公开中的基于操作系统的指标巡检方法及其装置可用于金融科技领域在基于操作系统进行指标巡检的情况下,也可用于除金融科技领域之外的任意领域在基于操作系统进行指标巡检的情况下,本公开中对基于操作系统的指标巡检方法及其装置的应用领域不做限定。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。例如,本系统和相关用户或机构间设置有接口,在获取相关信息之前,需要通过接口向前述的用户或机构发送获取请求,并在接收到前述的用户或机构反馈的同意信息后,获取相关信息。
本发明下述各实施例可应用于各种基于操作系统进行指标巡检的系统/应用/设备中。本发明提出了一种开放平台操作系统指标巡检方法,可以先获取配置管理平台全量服务器信息并为服务器部署对应巡检脚本(即预设指标检查脚本),通过巡检任务设置执行频率并依赖WOP(即脚本调度工具,是一种自动化部署执行脚本平台)执行脚本,检查服务器相关操作系统指标是否正常。并在定位异常指标的服务器后,通过手工或者自动工具进行操作系统整改。
本发明实现了与配置管理平台、作业执行工具、脚本管理平台等相关工具平台的联动,为运维人员提供了友好的统一巡检结果视图,具有较好的普适性和推广性。
下面结合各个实施例来详细说明本发明。
实施例一
根据本发明实施例,提供了一种基于操作系统的指标巡检方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的基于操作系统的指标巡检方法的流程图,如图1所示,该方法包括如下步骤:
步骤S101,接收巡检任务,其中,巡检任务至少包括:执行时间、服务器清单,服务器清单用于记录服务器标识。
步骤S102,在到达执行时间的情况下,依据服务器清单调度服务器标识指示的服务器执行预设指标检查脚本,其中,预设指标检查脚本预先部署在服务器上。
步骤S103,在服务器对预设指标检查脚本执行完成的情况下,接收服务器返回的检查结果,其中,检查结果至少包括:指标值。
步骤S104,在指标值属于预设阈值范围的情况下,确定服务器的操作系统的指标状态为正常状态。
通过上述步骤,可以接收巡检任务,在到达执行时间的情况下,依据服务器清单调度服务器标识指示的服务器执行预设指标检查脚本,在服务器对预设指标检查脚本执行完成的情况下,接收服务器返回的检查结果,在指标值属于预设阈值范围的情况下,确定服务器的操作系统的指标状态为正常状态。在本发明实施例中,在达到巡检任务设定的执行时间时,可以根据巡检任务携带的服务器清单调度服务器执行预设指标检查脚本,当服务器对预设指标检查脚本执行完成后,接收服务器返回的检查结果,如果检查结果中携带的指标值属于预设阈值范围,则可以确定该服务器的操作系统的指标状态为正常状态,能够实现开放平台操作系统指标的自动化巡检,能够及时发现异常指标,进而解决了相关技术中无法自动对操作系统的指标进行巡检的技术问题。
下面结合上述各步骤对本发明实施例进行详细说明。
在本发明实施例中,通过部署操作系统指标巡检任务以及通过统一的任务调度框架可以实现全量服务器的指标检查。例如,可以使用J2EE(Java 2Platform EnterpriseEdition)等开发语言,使用Jetty(一个开源的容器)、MYSQL(关系型数据库管理系统)、quartz(一个开源的作业调度框架)等相关软件进行实现,在此不做限制。
可选地,在接收巡检任务之前,还包括:确定业务需求;基于业务需求,生成预设指标检查脚本;在预设指标检查脚本测试通过的情况下,将预设指标检查脚本加入至预设脚本库;基于预设脚本库,为服务器部署预设指标检查脚本。
在本发明实施例中,可以提供脚本录入功能。可以先确定业务需求,然后根据业务需求生成操作系统指标检查脚本(即预设指标检查脚本,该预设指标检查脚本用于检查服务器各项操作系统指标状态),通过脚本管理平台进行脚本发布,并且如果预设指标检查脚本测试通过,则可以将预设指标检查脚本加入至预设脚本库,再根据预设脚本库,为服务器部署预设指标检查脚本。例如,脚本测试通过并提交到脚本库后,脚本管理平台会可以按照设定的时间对所需服务器进行脚本部署,如每天凌晨1点对全量服务器部署脚本(如test.sh),并可以部署至指定目录下。
可选地,在基于业务需求,生成预设指标检查脚本之后,还包括:对预设指标检查脚本进行测试,得到测试结果,其中,测试的测试类型包括下述至少之一:脚本编码格式测试、脚本输出格式测试、脚本适配性测试;在每个测试类型指示的测试都通过的情况下,将测试结果记录为测试通过。
在本发明实施例中,可以提供脚本审核功能,生成脚本后可以对脚本进行功能测试(即对预设指标检查脚本进行测试,得到测试结果),测试类型包括但不限于:脚本编码格式测试、脚本输出格式测试、脚本适配性测试等。并在每个测试类型指示的测试都通过后,将测试结果记录为测试通过,脚本测试通过后提交到脚本库。
图2是根据本发明实施例的一种可选的脚本部署流程的示意图,如图2所示,运维人员可以编写操作系统指标检查脚本,然后将操作系统指标检查脚本发布至脚本管理平台,并通知脚本管理员对操作系统指标检查脚本进行审核,审核通过后将操作系统指标检查脚本加入至脚本库,并部署在服务器上。
可选地,在接收巡检任务之前,还包括:确定待检测服务器集合,并基于待检测服务器集合中的每个服务器标识,生成服务器清单;采集待检测服务器集合中的每个服务器的服务器信息,生成全量服务器信息;确定执行时间以及执行频率;基于服务器清单、全量服务器信息、执行时间以及执行频率,生成巡检任务。
在本发明实施例中,可以先确定待检测服务器集合(即需要检测的服务器集合),然后根据待检测服务器集合中的每个服务器标识,生成服务器清单。然后可以采集待检测服务器集合中的每个服务器的服务器信息,以得到全量服务器信息。并且可以确定执行时间(即巡检任务的开始执行时间)以及执行频率(即巡检任务间隔多久执行一次),之后根据服务器清单、全量服务器信息、执行时间以及执行频率,生成巡检任务,以实现自动化操作系统指标巡检。
步骤S101,接收巡检任务,其中,巡检任务至少包括:执行时间、服务器清单,服务器清单用于记录服务器标识。
在本发明实施例中,可以接收巡检任务,该巡检任务包括:执行时间、服务器清单,该服务器清单用于记录服务器标识。
可选地,在接收巡检任务之后,还包括:依据全量服务器信息,确定服务器清单中的每个服务器标识指示的服务器的服务器类型;为每个服务器生成与服务器类型对应的服务器标签。
在本发明实施例中,接收到巡检任务后,脚本调度工具可以先依据CMDB信息(即全量服务器信息),自动区分服务器类型并做好标签(即可以依据全量服务器信息,确定服务器清单中的每个服务器标识指示的服务器的服务器类型,并为每个服务器生成与服务器类型对应的服务器标签)。之后脚本执行时可以依据标签信息采集相关指标,例如,有些服务器安装有mysql(一种数据库),其它服务器则没有安装,脚本调度工具会依据标签去安装有mysql的服务器采集mysql信息,其它服务器不采集mysql信息,避免采集无效指标。
步骤S102,在到达执行时间的情况下,依据服务器清单调度服务器标识指示的服务器执行预设指标检查脚本,其中,预设指标检查脚本预先部署在服务器上。
在本发明实施例中,如果达到巡检任务设定的执行时间,则可以依据服务器清单调度服务器标识指示的服务器执行预设指标检查脚本,该预设指标检查脚本预先部署在服务器上。例如,通过巡检平台部署操作系统指标巡检任务,可设置巡检任务执行频率,在指定时间(即设定的执行时间)依据服务器清单(该服务器清单可以与配置管理平台联动)通过wop(即脚本调度工具)对服务器进行调度并执行操作系统指标检查脚本,之后将检查结果返回给巡检任务并存储到Mysql数据库中。
图3是根据本发明实施例的一种可选的巡检任务执行流程的示意图,如图3所示,运维人员可以先部署操作系统指标检查巡检任务,设置巡检任务执行频率,然后结合配置管理平台(CMDB)执行巡检任务,拉取全量服务器信息并执行检查脚本,然后将结果入库至Mysql数据库。
可选地,在依据服务器清单调度服务器标识指示的服务器执行预设指标检查脚本之后,还包括:服务器依据服务器标签,采集指标信息;服务器基于指标信息生成指标值,并将指标值记录至检查结果;服务器将检查结果返回至脚本调度工具,其中,脚本调度工具用于调度服务器执行预设指标检查脚本,脚本调度工具依据巡检任务携带的预设格式返回检查结果。
在本发明实施例中,服务器可以依据服务器标签,采集相应的指标信息,并指标信息生成指标值(例如,如果服务器标签为某一数据库标签,则可以采集该数据库指标信息,并根据该指标信息生成相应的指标值(如写入量等)),然后将指标值记录至检查结果。之后可以将检查结果返回至脚本调度工具,该脚本调度工具用于调度服务器执行预设指标检查脚本,能够依据巡检任务携带的预设格式返回检查结果(即部署巡检任务后,巡检任务按照设定时间自动通知脚本调度工具(wop),脚本调度工具接收到消息后通知到具体服务器去执行对应脚本,服务器收到消息并执行脚本将结果返回给脚本调度工具,脚本调用工具依据与巡检任务的格式约定返回检测结果。本实施例中脚本调度工具作为中间服务商,负责发起任务以及收集结果)。
步骤S103,在服务器对预设指标检查脚本执行完成的情况下,接收服务器返回的检查结果,其中,检查结果至少包括:指标值。
在本发明实施例中,在服务器对预设指标检查脚本执行完成后,可以接收服务器返回的检查结果(该检查结果至少包括:指标值)。
可选地,在接收服务器返回的检查结果之后,还包括:在指标值不属于预设阈值范围的情况下,确定与指标值关联的待调整服务器;调整待调整服务器的操作系统,其中,调整的调整类型包括下述至少之一:参数调整、重启调整。
在本发明实施例中,如果检查结果中的指标值不属于预设阈值范围,则确定与指标值关联的待调整服务器(即操作系统的指标状态为异常状态的服务器),调整待调整服务器的操作系统,例如,可以进行参数调整(如调整该指标的相应参数)、重启调整(如重启该指标的相关程序等)等。
步骤S104,在指标值属于预设阈值范围的情况下,确定服务器的操作系统的指标状态为正常状态。
在本发明实施例中,如果指标值属于预设阈值范围,则可以确定服务器的操作系统的指标状态为正常状态。
图4是根据本发明实施例的一种可选的操作系统的指标的示意图,如图4所示,操作系统的指标包括:nfs_clientstatus(即共享存储服务客户端是否正常)、nfs(即共享存储服务是否正常)、ntp(即时钟同步是否正常)、syslog(即syslog状态是否正常)、Bond(即网卡状态是否正常)、Mysql_io(即Mysql读写是否正常)、gdm(即图形化进程是否正常)、last_reboot(即最后一次重启时间是否正常)、fs_mount(即文件系统挂载情况是否正常)、cpu(即cpu是否正常)、swap(即交换空间使用率是否正常)、conn(即连接数是否正常)。
本发明实施例中,能够实现开放平台操作系统指标自动化巡检,解决数据中心开放平台操作系统指标无法自动化巡检的问题。并且,本实施例提出的操作系统指标自动化巡检方法具备推广性,可以推广到各类具有相近需求的平台系统指标巡检工作中。此外,还具备快速部署特性,仅需要开发相关巡检脚本、进行简单的巡检任务编码,能够降低巡检任务的开发门槛,实现巡检任务的快速上线。
下面结合另一实施例进行详细说明。
实施例二
本实施例中提供的一种基于操作系统的指标巡检装置包含了多个实施单元,每个实施单元对应于上述实施例一中的各个实施步骤。
图5是根据本发明实施例的一种可选的基于操作系统的指标巡检装置的示意图,如图5所示,该指标巡检装置可以包括:第一接收单元50,调度单元51,第二接收单元52,确定单元53,其中,
第一接收单元50,用于接收巡检任务,其中,巡检任务至少包括:执行时间、服务器清单,服务器清单用于记录服务器标识;
调度单元51,用于在到达执行时间的情况下,依据服务器清单调度服务器标识指示的服务器执行预设指标检查脚本,其中,预设指标检查脚本预先部署在服务器上;
第二接收单元52,用于在服务器对预设指标检查脚本执行完成的情况下,接收服务器返回的检查结果,其中,检查结果至少包括:指标值;
确定单元53,用于在指标值属于预设阈值范围的情况下,确定服务器的操作系统的指标状态为正常状态。
上述指标巡检装置,可以通过第一接收单元50接收巡检任务,通过调度单元51在到达执行时间的情况下,依据服务器清单调度服务器标识指示的服务器执行预设指标检查脚本,通过第二接收单元52在服务器对预设指标检查脚本执行完成的情况下,接收服务器返回的检查结果,通过确定单元53在指标值属于预设阈值范围的情况下,确定服务器的操作系统的指标状态为正常状态。在本发明实施例中,在达到巡检任务设定的执行时间时,可以根据巡检任务携带的服务器清单调度服务器执行预设指标检查脚本,当服务器对预设指标检查脚本执行完成后,接收服务器返回的检查结果,如果检查结果中携带的指标值属于预设阈值范围,则可以确定该服务器的操作系统的指标状态为正常状态,能够实现开放平台操作系统指标的自动化巡检,能够及时发现异常指标,进而解决了相关技术中无法自动对操作系统的指标进行巡检的技术问题。
可选地,指标巡检装置还包括:第一确定模块,用于在接收巡检任务之前,确定业务需求;第一生成模块,用于基于业务需求,生成预设指标检查脚本;第一加入模块,用于在预设指标检查脚本测试通过的情况下,将预设指标检查脚本加入至预设脚本库;第一部署模块,用于基于预设脚本库,为服务器部署预设指标检查脚本。
可选地,指标巡检装置还包括:第一测试模块,用于在基于业务需求,生成预设指标检查脚本之后,对预设指标检查脚本进行测试,得到测试结果,其中,测试的测试类型包括下述至少之一:脚本编码格式测试、脚本输出格式测试、脚本适配性测试;第一记录模块,用于在每个测试类型指示的测试都通过的情况下,将测试结果记录为测试通过。
可选地,指标巡检装置还包括:第二确定模块,用于在接收巡检任务之前,确定待检测服务器集合,并基于待检测服务器集合中的每个服务器标识,生成服务器清单;第一采集模块,用于采集待检测服务器集合中的每个服务器的服务器信息,生成全量服务器信息;第三确定模块,用于确定执行时间以及执行频率;第二生成模块,用于基于服务器清单、全量服务器信息、执行时间以及执行频率,生成巡检任务。
可选地,指标巡检装置还包括:第四确定模块,用于在接收巡检任务之后,依据全量服务器信息,确定服务器清单中的每个服务器标识指示的服务器的服务器类型;第三生成模块,用于为每个服务器生成与服务器类型对应的服务器标签。
可选地,指标巡检装置还包括:第二采集模块,用于在依据服务器清单调度服务器标识指示的服务器执行预设指标检查脚本之后,服务器依据服务器标签,采集指标信息;第四生成模块,用于服务器基于指标信息生成指标值,并将指标值记录至检查结果;第一返回模块,用于服务器将检查结果返回至脚本调度工具,其中,脚本调度工具用于调度服务器执行预设指标检查脚本,脚本调度工具依据巡检任务携带的预设格式返回检查结果。
可选地,指标巡检装置还包括:第五确定模块,用于在接收服务器返回的检查结果之后,在指标值不属于预设阈值范围的情况下,确定与指标值关联的待调整服务器;第一调整模块,用于调整待调整服务器的操作系统,其中,调整的调整类型包括下述至少之一:参数调整、重启调整。
上述的指标巡检装置还可以包括处理器和存储器,上述第一接收单元50,调度单元51,第二接收单元52,确定单元53等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
上述处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来在指标值属于预设阈值范围的情况下,确定服务器的操作系统的指标状态为正常状态。
上述存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:接收巡检任务,在到达执行时间的情况下,依据服务器清单调度服务器标识指示的服务器执行预设指标检查脚本,在服务器对预设指标检查脚本执行完成的情况下,接收服务器返回的检查结果,在指标值属于预设阈值范围的情况下,确定服务器的操作系统的指标状态为正常状态。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述的基于操作系统的指标巡检方法。
根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述的基于操作系统的指标巡检方法。
图6是根据本发明实施例的一种用于基于操作系统的指标巡检方法的电子设备(或移动设备)的硬件结构框图。如图6所示,电子设备可以包括一个或多个(图6中采用602a、602b,……,602n来示出)处理器602(处理器602可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器604。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、键盘、电源和/或相机。本领域普通技术人员可以理解,图6所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,电子设备还可包括比图6中所示更多或者更少的组件,或者具有与图6所示不同的配置。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于操作系统的指标巡检方法,其特征在于,包括:
接收巡检任务,其中,所述巡检任务至少包括:执行时间、服务器清单,所述服务器清单用于记录服务器标识;
在到达所述执行时间的情况下,依据所述服务器清单调度所述服务器标识指示的服务器执行预设指标检查脚本,其中,所述预设指标检查脚本预先部署在所述服务器上;
在所述服务器对所述预设指标检查脚本执行完成的情况下,接收所述服务器返回的检查结果,其中,所述检查结果至少包括:指标值;
在所述指标值属于预设阈值范围的情况下,确定所述服务器的操作系统的指标状态为正常状态。
2.根据权利要求1所述的指标巡检方法,其特征在于,在接收巡检任务之前,还包括:
确定业务需求;
基于所述业务需求,生成所述预设指标检查脚本;
在所述预设指标检查脚本测试通过的情况下,将所述预设指标检查脚本加入至预设脚本库;
基于所述预设脚本库,为所述服务器部署所述预设指标检查脚本。
3.根据权利要求2所述的指标巡检方法,其特征在于,在基于所述业务需求,生成所述预设指标检查脚本之后,还包括:
对所述预设指标检查脚本进行测试,得到测试结果,其中,所述测试的测试类型包括下述至少之一:脚本编码格式测试、脚本输出格式测试、脚本适配性测试;
在每个所述测试类型指示的测试都通过的情况下,将所述测试结果记录为测试通过。
4.根据权利要求1所述的指标巡检方法,其特征在于,在接收巡检任务之前,还包括:
确定待检测服务器集合,并基于所述待检测服务器集合中的每个所述服务器标识,生成所述服务器清单;
采集所述待检测服务器集合中的每个所述服务器的服务器信息,生成全量服务器信息;
确定所述执行时间以及执行频率;
基于所述服务器清单、所述全量服务器信息、所述执行时间以及所述执行频率,生成所述巡检任务。
5.根据权利要求4所述的指标巡检方法,其特征在于,在接收巡检任务之后,还包括:
依据所述全量服务器信息,确定所述服务器清单中的每个所述服务器标识指示的所述服务器的服务器类型;
为每个所述服务器生成与所述服务器类型对应的服务器标签。
6.根据权利要求5所述的指标巡检方法,其特征在于,在依据所述服务器清单调度所述服务器标识指示的服务器执行预设指标检查脚本之后,还包括:
所述服务器依据所述服务器标签,采集指标信息;
所述服务器基于所述指标信息生成指标值,并将所述指标值记录至所述检查结果;
所述服务器将所述检查结果返回至脚本调度工具,其中,所述脚本调度工具用于调度所述服务器执行所述预设指标检查脚本,所述脚本调度工具依据所述巡检任务携带的预设格式返回所述检查结果。
7.根据权利要求1所述的指标巡检方法,其特征在于,在接收所述服务器返回的检查结果之后,还包括:
在所述指标值不属于所述预设阈值范围的情况下,确定与所述指标值关联的待调整服务器;
调整所述待调整服务器的所述操作系统,其中,所述调整的调整类型包括下述至少之一:参数调整、重启调整。
8.一种基于操作系统的指标巡检装置,其特征在于,包括:
第一接收单元,用于接收巡检任务,其中,所述巡检任务至少包括:执行时间、服务器清单,所述服务器清单用于记录服务器标识;
调度单元,用于在到达所述执行时间的情况下,依据所述服务器清单调度所述服务器标识指示的服务器执行预设指标检查脚本,其中,所述预设指标检查脚本预先部署在所述服务器上;
第二接收单元,用于在所述服务器对所述预设指标检查脚本执行完成的情况下,接收所述服务器返回的检查结果,其中,所述检查结果至少包括:指标值;
确定单元,用于在所述指标值属于预设阈值范围的情况下,确定所述服务器的操作系统的指标状态为正常状态。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的基于操作系统的指标巡检方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的基于操作系统的指标巡检方法。
CN202310124847.XA 2023-02-06 2023-02-06 基于操作系统的指标巡检方法及其装置、电子设备 Pending CN116089220A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310124847.XA CN116089220A (zh) 2023-02-06 2023-02-06 基于操作系统的指标巡检方法及其装置、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310124847.XA CN116089220A (zh) 2023-02-06 2023-02-06 基于操作系统的指标巡检方法及其装置、电子设备

Publications (1)

Publication Number Publication Date
CN116089220A true CN116089220A (zh) 2023-05-09

Family

ID=86202428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310124847.XA Pending CN116089220A (zh) 2023-02-06 2023-02-06 基于操作系统的指标巡检方法及其装置、电子设备

Country Status (1)

Country Link
CN (1) CN116089220A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116401138A (zh) * 2023-06-08 2023-07-07 建信金融科技有限责任公司 操作系统的运行状态检测方法、装置、电子设备和介质
CN116627747A (zh) * 2023-07-24 2023-08-22 北京微吼时代科技有限公司 服务器压力测试巡检方法、系统、电子设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116401138A (zh) * 2023-06-08 2023-07-07 建信金融科技有限责任公司 操作系统的运行状态检测方法、装置、电子设备和介质
CN116401138B (zh) * 2023-06-08 2023-09-15 建信金融科技有限责任公司 操作系统的运行状态检测方法、装置、电子设备和介质
CN116627747A (zh) * 2023-07-24 2023-08-22 北京微吼时代科技有限公司 服务器压力测试巡检方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US9558459B2 (en) Dynamic selection of actions in an information technology environment
CN116089220A (zh) 基于操作系统的指标巡检方法及其装置、电子设备
CN107818431B (zh) 一种提供订单轨迹数据的方法和系统
US20100114629A1 (en) Extracting Enterprise Information Through Analysis of Provenance Data
US10657028B2 (en) Method for replicating production behaviours in a development environment
CN103631713A (zh) Erp软件自动化测试系统及方法
CN112231219A (zh) 自动化测试监控方法、装置、设备及存储介质
US20220197770A1 (en) Software upgrade stability recommendations
CN109284331B (zh) 基于业务数据资源的制证信息获取方法、终端设备及介质
CN112650688A (zh) 自动化回归测试方法、关联设备以及计算机程序产品
JP2017016507A (ja) テスト管理システムおよびプログラム
CN117474696A (zh) 佣金结算问题的诊断方法、系统、设备及存储介质
CN115587041A (zh) 移动应用交付任务处理方法和装置、电子设备和存储介质
CN115525568A (zh) 代码覆盖率的巡检方法、装置、计算机设备及存储介质
CN116010244A (zh) 自动化测试方法、装置、电子设备及存储介质
CN115617612A (zh) 一种日志上报方法、装置、计算机设备和存储介质
CN115543491A (zh) 微服务处理方法和装置
CN113204334A (zh) 一种基于git的软件研发效能度量系统
CN113448836A (zh) 软件接口测试方法、装置、电子设备及存储介质
CN112035362A (zh) 测试项目进度管理方法、装置、设备以及存储介质
CN115629950B (zh) 一种性能测试异步请求处理时间点的提取方法
KR102669668B1 (ko) 인터페이스 관리 방법, 인터페이스 거버넌스 시스템, 및 인터페이스를 관리하는, 컴퓨터로 실행가능한 프로그램을 저장하는 저장매체
KR102669665B1 (ko) 인터페이스 관리 방법, 인터페이스 거버넌스 시스템, 및 인터페이스를 관리하는, 컴퓨터로 실행가능한 프로그램을 저장하는 저장매체
CN116450499A (zh) 测试报告的生成方法及其装置、电子设备及存储介质
Venegas et al. Monitoring Model for Preventive Incident Identification and Execution of Corrective Measures in Technological Services of Organizations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination