CN113238913B - 服务器故障智能推送方法、装置、设备及存储介质 - Google Patents

服务器故障智能推送方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113238913B
CN113238913B CN202110514149.1A CN202110514149A CN113238913B CN 113238913 B CN113238913 B CN 113238913B CN 202110514149 A CN202110514149 A CN 202110514149A CN 113238913 B CN113238913 B CN 113238913B
Authority
CN
China
Prior art keywords
log
state
preset
log collection
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110514149.1A
Other languages
English (en)
Other versions
CN113238913A (zh
Inventor
吴晓馨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kangjian Information Technology Shenzhen Co Ltd
Original Assignee
Kangjian Information Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kangjian Information Technology Shenzhen Co Ltd filed Critical Kangjian Information Technology Shenzhen Co Ltd
Priority to CN202110514149.1A priority Critical patent/CN113238913B/zh
Publication of CN113238913A publication Critical patent/CN113238913A/zh
Priority to PCT/CN2022/088786 priority patent/WO2022237507A1/zh
Application granted granted Critical
Publication of CN113238913B publication Critical patent/CN113238913B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及信息安全技术领域,应用于智慧医疗领域中,公开了一种服务器故障智能推送方法、装置、设备及存储介质,用于提高数据采集效率和运维效率。服务器故障智能推送方法包括:调用预设的配置管理接口按照待报修工单信息生成日志收集请求;通过预设的收集日志接口按照异常服务器网络协议地址和业务类型处理目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;若日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集;若日志收集状态为收集成功状态,则通过预设的报修接口将日志数据文件的文件链接地址和异常服务器的位置信息推送至消息通知对象。此外,本发明还涉及区块链技术,日志数据文件可存储于区块链节点中。

Description

服务器故障智能推送方法、装置、设备及存储介质
技术领域
本发明涉及信息安全的操作系统安全监控领域,尤其涉及一种服务器故障智能推送方法、装置、设备及存储介质。
背景技术
目前服务器硬件报修的方式主要包括800电话报修和手动收集日志发邮件给厂商报修。伴随着服务器数量越来越来多,以上两种报修方式逐渐提高了运维成本。
服务器报修的流程相对固定,运维效率低,当今业界有多种可用的远程服务控制系统OOB管理接口标准。但是,没有一种管理接口标准能满足当今不断发展的IT解决方案模型的需求,例如,支持扩展规模,更高的安全性和多供应商开放性,同时还需要与现代开发运维工具和流程保持一致。现有的远程服务控制系统存在管理接口标准不统一,开发重复工作多,导致运维效率低和维护成本高的问题。
发明内容
本发明提供了一种服务器故障智能推送方法、装置、设备及存储介质,用于提高日志数据采集效率和运维效率,并降低运维成本。
为实现上述目的,本发明第一方面提供了一种服务器故障智能推送方法,包括:获取待报修工单信息,并调用预设的配置管理接口按照所述待报修工单信息生成日志收集请求,所述待报修工单信息包括异常服务器网络协议地址、业务类型、业务处理优先级和消息通知对象;基于所述业务处理优先级将所述日志收集请求添加至目标消息队列中,通过预设的收集日志接口,按照所述异常服务器网络协议地址和所述业务类型处理所述目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;判断所述日志收集状态是收集异常状态还是收集成功状态;若所述日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集,得到重试结果,当所述重试结果为重试失败时,生成日志预警信息,并向目标终端发送所述日志预警信息;若所述日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将所述日志数据文件的文件链接地址和所述异常服务器的位置信息推送至所述消息通知对象。
可选的,在本发明第一方面的第一种实现方式中,所述获取待报修工单信息,并调用预设的配置管理接口按照所述待报修工单信息生成日志收集请求,所述待报修工单信息包括异常服务器网络协议地址、业务类型、业务处理优先级和消息通知对象,包括:接收故障报修请求,对所述故障报修请求进行参数解析,得到待报修工单信息,所述待报修工单信息包括异常服务器网络协议地址、业务类型、优先级和消息通知对象;从预设的文件目录中提取参数校验模板文件,从所述参数校验模板文件中读取参数校验规则,并按照所述参数校验规则对所述待报修工单信息进行参数校验处理,得到校验结果;当所述校验结果为校验通过时,对所述待报修工单信息进行缓存处理,并通过预设的配置管理接口将所述待报修工单信息封装成日志收集请求。
可选的,在本发明第一方面的第二种实现方式中,所述基于所述业务处理优先级将所述日志收集请求添加至目标消息队列中,通过预设的收集日志接口,按照所述异常服务器网络协议地址和所述业务类型处理所述目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件,包括:按照所述业务处理优先级确定目标消息队列,并将所述日志收集请求插入到所述目标消息队列中,得到消息标识,所述业务处理优先级与所述目标消息队列一一对应;通过预设的收集日志接口,对所述目标消息队列中的日志收集请求按照先入先出规则进行异步读取,并按照所述异常服务器网络协议地址将所述日志收集请求转发至远程访问控制接口;通过所述远程访问控制接口,按照所述业务类型对所述日志收集请求进行日志收集,并在日志收集过程时,通过预设的日志收集消费服务定时轮询所述日志收集请求对应的日志收集状态;当检测到日志收集完成时,按照所述消息标识将所述日志收集状态更新至状态消息队列中,获取并缓存目标日志数据,基于预设主题将所述目标日志数据更新至日志数据文件中。
可选的,在本发明第一方面的第三种实现方式中,所述判断所述日志收集状态是收集异常状态还是收集成功状态,包括:按照所述消息标识从所述状态消息队列中读取所述日志收集请求对应的日志收集状态,判断所述日志收集状态是预设的成功状态值还是预设的异常状态值;若所述日志收集状态为预设的异常状态值,则确定所述日志收集状态为收集异常状态;若所述日志收集状态为预设的成功状态值,则确定所述日志收集状态为收集成功状态。
可选的,在本发明第一方面的第四种实现方式中,所述若所述日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集,得到重试结果,当所述重试结果为重试失败时,生成日志预警信息,并向目标终端发送所述日志预警信息,包括:若所述日志收集状态为收集异常状态,则通过预设的重试机制从所述目标消息队列中获取异常消息,并对所述异常消息重新进行日志收集,所述异常消息用于指示所述日志收集状态为收集异常状态的日志收集请求;累加重试次数,直到所述异常消息被处理成功,或所述重试次数等于预设次数阈值时,停止日志收集操作,并获取重试结果;当所述重试结果为重试失败时,按照预设的警示模板生成日志预警信息,将所述日志预警信息记录至预设的操作日志中,并向目标终端发送所述日志预警信息,以使得所述目标终端显示所述日志预警信息。
可选的,在本发明第一方面的第五种实现方式中,所述若所述日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将所述日志数据文件的文件链接地址和所述异常服务器的位置信息推送至所述消息通知对象,包括:若所述日志收集状态为收集成功状态,则获取所述日志数据文件对应的文件路径,根据所述文件路径从预设的映射关系表中读取日志数据文件的文件链接地址;按照所述异常服务器的网络协议地址和所述业务类型查询预设的配置信息,得到异常服务器的位置信息和异常服务器的故障类型;基于预设的邮件模板、所述异常服务器的位置信息和所述异常服务器的故障类型生成电子邮件正文内容,并获取所述消息通知对象对应的邮箱地址;调用预设的报修接口按照预设的电子邮件传输协议,将所述日志数据文件的文件链接地址和所述电子邮件正文内容发送至所述消息通知对象对应的邮箱地址。
可选的,在本发明第一方面的第六种实现方式中,在所述若所述日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将所述日志数据文件的文件链接地址和所述异常服务器的位置信息推送至所述消息通知对象之后,所述服务器故障智能推送方法还包括:获取异常服务器的维修信息,并将所述异常服务器的维修信息和所述日志数据文件远程同步到预设的文件存储系统中;基于所述异常服务器的维修信息和所述日志数据文件构建运维知识图谱。
本发明第二方面提供了一种服务器故障智能推送装置,包括:生成模块,用于获取待报修工单信息,并调用预设的配置管理接口按照所述待报修工单信息生成日志收集请求,所述待报修工单信息包括异常服务器网络协议地址、业务类型、业务处理优先级和消息通知对象;处理模块,用于基于所述业务处理优先级将所述日志收集请求添加至目标消息队列中,通过预设的收集日志接口,按照所述异常服务器网络协议地址和所述业务类型处理所述目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;判断模块,用于判断所述日志收集状态是收集异常状态还是收集成功状态;重试模块,用于若所述日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集,得到重试结果,当所述重试结果为重试失败时,生成日志预警信息,并向目标终端发送所述日志预警信息;推送模块,用于若所述日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将所述日志数据文件的文件链接地址和所述异常服务器的位置信息推送至所述消息通知对象。
可选的,在本发明第二方面的第一种实现方式中,所述生成模块具体用于:接收故障报修请求,对所述故障报修请求进行参数解析,得到待报修工单信息,所述待报修工单信息包括异常服务器网络协议地址、业务类型、优先级和消息通知对象;从预设的文件目录中提取参数校验模板文件,从所述参数校验模板文件中读取参数校验规则,并按照所述参数校验规则对所述待报修工单信息进行参数校验处理,得到校验结果;当所述校验结果为校验通过时,对所述待报修工单信息进行缓存处理,并通过预设的配置管理接口将所述待报修工单信息封装成日志收集请求。
可选的,在本发明第二方面的第二种实现方式中,所述处理模块具体用于:按照所述业务处理优先级确定目标消息队列,并将所述日志收集请求插入到所述目标消息队列中,得到消息标识,所述业务处理优先级与所述目标消息队列一一对应;通过预设的收集日志接口,对所述目标消息队列中的日志收集请求按照先入先出规则进行异步读取,并按照所述异常服务器网络协议地址将所述日志收集请求转发至远程访问控制接口;通过所述远程访问控制接口,按照所述业务类型对所述日志收集请求进行日志收集,并在日志收集过程时,通过预设的日志收集消费服务定时轮询所述日志收集请求对应的日志收集状态;当检测到日志收集完成时,按照所述消息标识将所述日志收集状态更新至状态消息队列中,获取并缓存目标日志数据,基于预设主题将所述目标日志数据更新至日志数据文件中。
可选的,在本发明第二方面的第三种实现方式中,所述判断模块具体用于:按照所述消息标识从所述状态消息队列中读取所述日志收集请求对应的日志收集状态,判断所述日志收集状态是预设的成功状态值还是预设的异常状态值;若所述日志收集状态为预设的异常状态值,则确定所述日志收集状态为收集异常状态;若所述日志收集状态为预设的成功状态值,则确定所述日志收集状态为收集成功状态。
可选的,在本发明第二方面的第四种实现方式中,所述重试模块具体用于:若所述日志收集状态为收集异常状态,则通过预设的重试机制从所述目标消息队列中获取异常消息,并对所述异常消息重新进行日志收集,所述异常消息用于指示所述日志收集状态为收集异常状态的日志收集请求;累加重试次数,直到所述异常消息被处理成功,或所述重试次数等于预设次数阈值时,停止日志收集操作,并获取重试结果;当所述重试结果为重试失败时,按照预设的警示模板生成日志预警信息,将所述日志预警信息记录至预设的操作日志中,并向目标终端发送所述日志预警信息,以使得所述目标终端显示所述日志预警信息。
可选的,在本发明第二方面的第五种实现方式中,所述推送模块具体用于:若所述日志收集状态为收集成功状态,则获取所述日志数据文件对应的文件路径,根据所述文件路径从预设的映射关系表中读取日志数据文件的文件链接地址;按照所述异常服务器的网络协议地址和所述业务类型查询预设的配置信息,得到异常服务器的位置信息和异常服务器的故障类型;基于预设的邮件模板、所述异常服务器的位置信息和所述异常服务器的故障类型生成电子邮件正文内容,并获取所述消息通知对象对应的邮箱地址;调用预设的报修接口按照预设的电子邮件传输协议,将所述日志数据文件的文件链接地址和所述电子邮件正文内容发送至所述消息通知对象对应的邮箱地址。
可选的,在本发明第二方面的第六种实现方式中,所述服务器故障智能推送装置还包括:同步模块,用于获取异常服务器的维修信息,并将所述异常服务器的维修信息和所述日志数据文件远程同步到预设的文件存储系统中;构建模块,用于基于所述异常服务器的维修信息和所述日志数据文件构建运维知识图谱。
本发明第三方面提供了一种服务器故障智能推送设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述服务器故障智能推送设备执行上述的服务器故障智能推送方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的服务器故障智能推送方法。
本发明提供的技术方案中,获取待报修工单信息,并调用预设的配置管理接口按照所述待报修工单信息生成日志收集请求,所述待报修工单信息包括异常服务器网络协议地址、业务类型、业务处理优先级和消息通知对象;基于所述业务处理优先级将所述日志收集请求添加至目标消息队列中,通过预设的收集日志接口,按照所述异常服务器网络协议地址和所述业务类型处理所述目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;判断所述日志收集状态是收集异常状态还是收集成功状态;若所述日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集,得到重试结果,当所述重试结果为重试失败时,生成日志预警信息,并向目标终端发送所述日志预警信息;若所述日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将所述日志数据文件的文件链接地址和所述异常服务器的位置信息推送至所述消息通知对象。本发明实施例中,调用预设的配置管理接口按照待报修工单信息生成日志收集请求;通过预设的收集日志接口按照异常服务器网络协议地址和业务类型处理目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;若日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集;若日志收集状态为收集成功状态,则通过预设的报修接口将日志数据文件的文件链接地址和异常服务器的位置信息推送至消息通知对象。避免日志文件过大发送失败的情况,提高了日志数据采集效率和运维效率,并降低了运维成本。
附图说明
图1为本发明实施例中服务器故障智能推送方法的一个实施例示意图;
图2为本发明实施例中服务器故障智能推送方法的另一个实施例示意图;
图3为本发明实施例中服务器故障智能推送装置的一个实施例示意图;
图4为本发明实施例中服务器故障智能推送装置的另一个实施例示意图;
图5为本发明实施例中服务器故障智能推送设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种服务器故障智能推送方法、装置、设备及存储介质,用于通过自动完成日志数据收集,并将日志数据文件以日志链接方式进行邮件发送,避免日志文件过大发送失败的情况,提高日志数据采集效率和运维效率。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中服务器故障智能推送方法的一个实施例包括:
101、获取待报修工单信息,并调用预设的配置管理接口按照待报修工单信息生成日志收集请求,待报修工单信息包括异常服务器网络协议地址、业务类型、业务处理优先级和消息通知对象。
其中,待报修工单信息还可以包括工单号、标题信息、提单人信息、业务团队信息和备注信息,还可以包括疑似原因(也就是,初步预测的故障原因)、故障时刻和是否重装系统,具体此处不做限定。业务类型可以包括分布式系统基础架构hadoop,数据库database和高速缓冲存储器cache,还可以包括其他业务类型,具体此处不做限定。业务处理优先级包括紧急、普通和其他优先级。例如,工单号为10685,标题为服务器硬件报修,异常服务器网络协议地址为10.129.68.166,故障时刻为2021-01-26,疑似原因为硬件报警,带外日志异常。具体的,服务器通过预设的巡检任务获取异常服务器的序列号,并根据异常服务器的序列号查询异常服务器的网络协议地址,预设的巡检任务用于指示按照预设的巡检指标对多个预设的服务器进行故障检测;或服务器接收监控报警信息,并从监控报警信息中提取异常服务器的网络协议地址。其中,异常服务器存在软件故障和/硬件故障,软件故障和/硬件故障分别对应的巡检指标;并将异常服务器的网络协议地址发送至目标终端(也就是,预设的工单系统),以使得目标终端按照异常服务器的网络协议地址配置并发送待报修工单信息;服务器接收目标终端发送的待报修工单信息,服务器调用预设的配置管理接口,按照待报修工单信息生成收集日志请求。服务器接收待报修工单信息,并调用预设的管理接口对待报修工单信息生成日志收集请求,待报修工单信息包括异常服务器网络协议地址、业务类型、业务处理优先级和消息通知对象。
可以理解的是,本发明的执行主体可以为服务器故障智能推送装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
102、基于业务处理优先级将日志收集请求添加至目标消息队列中,通过预设的收集日志接口,按照异常服务器网络协议地址和业务类型处理目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件。
具体的,服务器按照业务处理优先级将日志收集请求添加至目标消息队列中,其中,目标消息队列用于指示业务处理优先级对应的消息队列,业务处理优先级用于指示待报修工单信息处理的紧急程度,业务处理优先级与目标消息队列一一对应,例如,当业务处理优先级为1时,服务器确定待报修工单信息处理的紧急程度为紧急,当业务处理优先级为2时,服务器确定待报修工单信息处理的紧急程度为普通,当业务处理优先级为3时,服务器确定待报修工单信息处理的紧急程度为其他优先级。服务器将日志收集请求写入至业务处理优先级对应的目标消息队列中,目标消息队列属于多个预设的消息队列;服务器调用收集日志接口按照优先级从高到低顺序先后处理多个消息队列中的消息数据(例如,日志收集请求),得到日志收集状态和日志数据文件。进一步地,服务器将日志数据文件存储于区块链数据库中,具体此处不做限定。
103、判断日志收集状态是收集异常状态还是收集成功状态。
需要说明的是,日志收集状态包括待收集状态、收集中状态、收集异常状态和收集成功状态。服务器可以按照预设的数值表示日志收集状态,也可以采用预设的字符串表示日志收集状态。例如,服务器采用00、01、10和11分别标识待收集状态、收集中状态、收集异常状态和收集成功状态,还可以采用state_1、state_2、state_3和state_4分别标识待收集状态、收集中状态、收集异常状态和收集成功状态。具体的,服务器判断日志收集状态是预设的成功状态值11还是预设的异常状态值10;若日志收集状态为预设的成功状态值11,则服务器停止日志收集操作,服务器确定日志收集状态为收集成功状态;若日志收集状态为预设的异常状态值10,则服务器停止日志收集操作,服务器确定日志收集状态为收集异常状态。
104、若日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集,得到重试结果,当重试结果为重试失败时,生成日志预警信息,并向目标终端发送日志预警信息。
其中,重试结果包括重试成功和重试失败。进一步地,若日志收集状态为收集异常状态,则服务器通过预设的重试机制(例如,反射机制等)从消息队列中获取收集异常状态对应的日志收集请求,并执行步骤102至103,服务器将重试次数加1,重试次数的初始值为0;直到日志收集成功,或重试次数等于预设次数阈值时,服务器获取重试结果;服务器判断重试结果是否为重试失败,若重试结果为重试失败,则服务器按照预设的警示模板生成日志预警信息,并向目标终端发送日志预警信息。
105、若日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将日志数据文件的文件链接地址和异常服务器的位置信息推送至消息通知对象。
其中,日志数据文件的数量可以为1个,也可以为多个,具体此处不做限定。异常服务器用于运行医疗场景下的多个预设医疗管理系统。具体的,若日志收集状态为收集成功状态,则服务器获取日志数据文件的文件链接地址和异常服务器的位置信息,服务器调用预设的报修接口,按照预设的电子邮件传输协议将日志数据文件的文件链接地址和异常服务器的位置信息推送至消息通知对象。例如,服务器将日志数据文件的文件链接地址和异常服务器的位置信息通过邮件方式发送至厂商人员,并抄送异常服务器的运维人员,等待厂商人员的诊断结果。
本发明实施例中,通过预设的收集日志接口按照异常服务器网络协议地址和业务类型处理目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;若日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集;若日志收集状态为收集成功状态,则通过预设的报修接口将日志数据文件的文件链接地址和异常服务器的位置信息推送至消息通知对象。避免日志文件过大发送失败的情况,提高了日志数据采集效率和运维效率,并降低了运维成本。本方案可应用于智慧医疗领域中,从而推动智慧城市的建设。
请参阅图2,本发明实施例中服务器故障智能推送方法的另一个实施例包括:
201、获取待报修工单信息,并调用预设的配置管理接口按照待报修工单信息生成日志收集请求,待报修工单信息包括异常服务器网络协议地址、业务类型、业务处理优先级和消息通知对象。
其中,待报修工单信息可以采用预设的数据格式进行封装,预设的数据格式可以为数据序列化YAML格式,也可以为JS对象简谱JSON格式,还可以为其他数据格式,具体此处不做限定。可选的,服务器接收故障报修请求,服务器对故障报修请求进行参数解析,得到待报修工单信息,待报修工单信息包括异常服务器网络协议地址、业务类型、优先级和消息通知对象;服务器从预设的文件目录中提取参数校验模板文件,服务器从参数校验模板文件中读取参数校验规则,并按照参数校验规则对待报修工单信息进行参数校验处理,得到校验结果,可以理解的是,当待报修工单信息中任意一个参数数据存在异常时,服务器确定校验结果为校验未通过,当待报修工单信息中全部参数数据均正常时,服务器确定校验结果为校验通过;当校验结果为校验通过时,服务器对待报修工单信息进行缓存处理,并通过预设的配置管理接口将待报修工单信息封装成日志收集请求。
需要说明的是,服务器还可以对待报修工单信息进行持久化存储。服务器将待报修工单信息设置为预设的配置管理接口对应的输入参数,服务器基于输入参数调用并执行预设的配置管理接口,得到配置管理接口的响应数据和返回码,当返回码为预设目标值时,服务器对响应数据进行数据解析和数据提取处理,得到日志收集请求。预设的配置管理接口属于运维自动化工具ansible。待报修工单信息中的异常服务器网络协议地址可以为一个,也可以为多个,具体此处不做限定,多个异常服务器网络协议地址之间通过预设的符号(例如,逗号)进行分隔。
202、基于业务处理优先级将日志收集请求添加至目标消息队列中,通过预设的收集日志接口,按照异常服务器网络协议地址和业务类型处理目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件。
需要说明的是,服务器还可以按照预设的优先级划分并映射多个消息队列,业务处理优先级与目标消息队列之间存在对应关系。服务器按照业务处理优先级确定日志收集请求的紧急程度,服务器将日志收集请求按照紧急程度写入至不同优先级的消息队列(也就是,目标消息队列),以使得多个消息队列按照优先级先后处理日志收集请求。
可选的,服务器按照业务处理优先级确定目标消息队列,并将日志收集请求插入到目标消息队列中,得到消息标识,业务处理优先级与目标消息队列一一对应;服务器通过预设的收集日志接口,对目标消息队列中的日志收集请求按照先入先出规则进行异步读取,并按照异常服务器网络协议地址将日志收集请求转发至远程访问控制接口;服务器通过远程访问控制接口,按照业务类型对日志收集请求进行日志收集,并在日志收集过程时,通过预设的日志收集消费服务定时轮询日志收集请求对应的日志收集状态;当服务器检测到日志收集完成时,服务器按照消息标识将日志收集状态更新至状态消息队列中,服务器获取并缓存目标日志数据,服务器基于预设主题将目标日志数据更新至日志数据文件中。
其中,远程访问控制接口drac用于指示访问服务器的管理系统。用于查看待检测服务器的硬件资源,并利用虚拟控制台可以模拟目标终端访问操作系统。并结合数据模型redfish协议和ansible实现对待报修工单信息的批量处理。进一步地,服务器还可以通过远程访问控制接口监控日志收集是否存在异常,并对日志收集请求进行异常处理。服务器通过ansible生成一条消息队列消息(也就是状态消息队列),以记录日志收集状态。
203、判断日志收集状态是收集异常状态还是收集成功状态。
其中,收集异常状态用于指示日志采集失败的状态。可选的,服务器按照消息标识从状态消息队列中读取日志收集请求对应的日志收集状态,判断日志收集状态是预设的成功状态值还是预设的异常状态值,也就是,服务器采用预设的成功状态值唯一标识日志收集状态是收集成功状态;服务器预设的异常状态值唯一标识日志收集状态是收集异常状态;若日志收集状态为预设的异常状态值,则服务器确定日志收集状态为收集异常状态;若日志收集状态为预设的成功状态值,则服务器确定日志收集状态为收集成功状态。
可以理解的是,当日志收集状态不为预设的成功状态值,也不为预设的异常状态值时,服务器继续执行日志收集操作。直到服务器检测到日志收集状态是收集成功状态或者收集异常状态时,服务器停止日志收集操作。
204、若日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集,得到重试结果,当重试结果为重试失败时,生成日志预警信息,并向目标终端发送日志预警信息。
例如,重试次数的初始值为0,预设次数阈值为5,服务器对异常消息重新执行一次日志收集,若异常消息被处理成功,重试次数为1,服务器停止日志收集操作,并确定重试结果为重试成功;若异常消息被处理失败,重试次数为1,服务器重新执行日志收集,直到重试次数为5时,服务器停止日志收集操作,服务器确定重试结果为重试失败。
可选的,若日志收集状态为收集异常状态,则服务器通过预设的重试机制从目标消息队列中获取异常消息,并对异常消息重新进行日志收集,异常消息用于指示日志收集状态为收集异常状态的日志收集请求;服务器累加重试次数,直到异常消息被处理成功,或重试次数等于预设次数阈值时,服务器停止日志收集操作,并获取重试结果;当重试结果为重试失败时,按照预设的警示模板生成日志预警信息,将日志预警信息记录至预设的操作日志中,并向目标终端发送日志预警信息,以使得目标终端显示日志预警信息。也就是,当服务器累加重试次数达到警示阈值时,服务器向目标终端发送日志收集节点运行异常的警示信息。
205、若日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将日志数据文件的文件链接地址和异常服务器的位置信息推送至消息通知对象。
其中,消息通知对象包括异常服务器对应的厂商人员和运维人员,还可以包括其他对象,具体此处不做限定。可选的,若日志收集状态为收集成功状态,则服务器获取日志数据文件对应的文件路径,服务器根据文件路径从预设的映射关系表中读取日志数据文件的文件链接地址,其中,预设的映射关系表用于指示日志数据文件对应的文件路径与日志数据文件的文件链接地址之间的绑定关系;服务器按照异常服务器的网络协议地址和业务类型查询预设的配置信息,得到异常服务器的位置信息和异常服务器的故障类型,例如,异常服务器的位置信息为上海市浦东新区外高桥机房位置。故障类型用于指示软件故障类型和硬件故障类型;服务器基于预设的邮件模板、异常服务器的位置信息和异常服务器的故障类型生成电子邮件正文内容,并获取消息通知对象对应的邮箱地址,例如,电子邮件正文内容包括称呼为“xxx,您好!”、故障类型为“1ZX6LV2内存故障”、描述内容为“外高桥机房位置(工作日09:00-18:00)”、联系人为xx、电话为xx、和地址为“上海市浦东新区”等信息;服务器调用预设的报修接口按照预设的电子邮件传输协议,将日志数据文件的文件链接地址和电子邮件正文内容发送至消息通知对象对应的邮箱地址。预设的电子邮件传输协议为STMP协议,进一步地,服务器调用预设的报修接口按照预设的电子邮件传输协议,将日志数据文件的文件链接地址和电子邮件正文内容变换成报修邮件,并将报修邮件发送至消息通知对象对应的邮箱地址中。进一步地,异常服务器还可以用于对在线问诊服务和在线药品服务等提供运行环境。
206、获取异常服务器的维修信息,并将异常服务器的维修信息和日志数据文件远程同步到预设的文件存储系统中。
其中,预设的文件存储系统用于指示统一管理异常服务器的维修信息和日志数据文件。具体的,服务器从预设的配置表中读取预设的地址信息,并从预设的操作日志中获取异常服务器的维修信息;服务器按照预设的地址信息远程连接预设的文件存储系统,得到连接结果;当连接结果为连接成功时,服务器执行预设的文件拷贝指令,将异常服务器的维修信息和日志数据文件远程更新到预设的文件存储系统中。
207、基于异常服务器的维修信息和日志数据文件构建运维知识图谱。
具体的,服务器根据自然语言处理算法对异常服务器的维修信息和日志数据文件进行语义分析,得到结构化数据;服务器对结构化数据抽取多个运维知识实体和多个运维知识实体关系;服务器基于多个运维知识实体和多个运维知识实体关系进行知识融合处理,得到运维知识图谱,服务器对异常服务器网络协议地址和运维知识图谱进行关联映射,并存储至预设的图数据库中。进一步地,服务器还可以对预设的图数据库中的运维知识图谱进行数据增加、数据修改和数据删除操作。
本发明实施例中,通过预设的收集日志接口按照异常服务器网络协议地址和业务类型处理目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;若日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集;若日志收集状态为收集成功状态,则通过预设的报修接口将日志数据文件的文件链接地址和异常服务器的位置信息推送至消息通知对象。避免日志文件过大发送失败的情况,提高了日志数据采集效率和运维效率,并降低了运维成本。本方案可应用于智慧医疗领域中,从而推动智慧城市的建设。
上面对本发明实施例中服务器故障智能推送方法进行了描述,下面对本发明实施例中服务器故障智能推送装置进行描述,请参阅图3,本发明实施例中服务器故障智能推送装置的一个实施例包括:
生成模块301,用于获取待报修工单信息,并调用预设的配置管理接口按照待报修工单信息生成日志收集请求,待报修工单信息包括异常服务器网络协议地址、业务类型、业务处理优先级和消息通知对象;
处理模块302,用于基于业务处理优先级将日志收集请求添加至目标消息队列中,通过预设的收集日志接口,按照异常服务器网络协议地址和业务类型处理目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;
判断模块303,用于判断日志收集状态是收集异常状态还是收集成功状态;
重试模块304,用于若日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集,得到重试结果,当重试结果为重试失败时,生成日志预警信息,并向目标终端发送日志预警信息;
推送模块305,用于若日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将日志数据文件的文件链接地址和异常服务器的位置信息推送至消息通知对象。
进一步地,将负载关联映射信息存储于区块链数据库中,具体此处不做限定。
本发明实施例中,通过预设的收集日志接口按照异常服务器网络协议地址和业务类型处理目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;若日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集;若日志收集状态为收集成功状态,则通过预设的报修接口将日志数据文件的文件链接地址和异常服务器的位置信息推送至消息通知对象。避免日志文件过大发送失败的情况,提高了日志数据采集效率和运维效率,并降低了运维成本。
请参阅图4,本发明实施例中服务器故障智能推送装置的另一个实施例包括:
生成模块301,用于获取待报修工单信息,并调用预设的配置管理接口按照待报修工单信息生成日志收集请求,待报修工单信息包括异常服务器网络协议地址、业务类型、业务处理优先级和消息通知对象;
处理模块302,用于基于业务处理优先级将日志收集请求添加至目标消息队列中,通过预设的收集日志接口,按照异常服务器网络协议地址和业务类型处理目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;
判断模块303,用于判断日志收集状态是收集异常状态还是收集成功状态;
重试模块304,用于若日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集,得到重试结果,当重试结果为重试失败时,生成日志预警信息,并向目标终端发送日志预警信息;
推送模块305,用于若日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将日志数据文件的文件链接地址和异常服务器的位置信息推送至消息通知对象。
可选的,生成模块301还可以具体用于:
接收故障报修请求,对故障报修请求进行参数解析,得到待报修工单信息,待报修工单信息包括异常服务器网络协议地址、业务类型、优先级和消息通知对象;
从预设的文件目录中提取参数校验模板文件,从参数校验模板文件中读取参数校验规则,并按照参数校验规则对待报修工单信息进行参数校验处理,得到校验结果;
当校验结果为校验通过时,对待报修工单信息进行缓存处理,并通过预设的配置管理接口将待报修工单信息封装成日志收集请求。
可选的,处理模块302还可以具体用于:
按照业务处理优先级确定目标消息队列,并将日志收集请求插入到目标消息队列中,得到消息标识,业务处理优先级与目标消息队列一一对应;
通过预设的收集日志接口,对目标消息队列中的日志收集请求按照先入先出规则进行异步读取,并按照异常服务器网络协议地址将日志收集请求转发至远程访问控制接口;
通过远程访问控制接口,按照业务类型对日志收集请求进行日志收集,并在日志收集过程时,通过预设的日志收集消费服务定时轮询日志收集请求对应的日志收集状态;
当检测到日志收集完成时,按照消息标识将日志收集状态更新至状态消息队列中,获取并缓存目标日志数据,基于预设主题将目标日志数据更新至日志数据文件中。
可选的,判断模块303还可以具体用于:
按照消息标识从状态消息队列中读取日志收集请求对应的日志收集状态,判断日志收集状态是预设的成功状态值还是预设的异常状态值;
若日志收集状态为预设的异常状态值,则确定日志收集状态为收集异常状态;
若日志收集状态为预设的成功状态值,则确定日志收集状态为收集成功状态。
可选的,重试模块304还可以具体用于:
若日志收集状态为收集异常状态,则通过预设的重试机制从目标消息队列中获取异常消息,并对异常消息重新进行日志收集,异常消息用于指示日志收集状态为收集异常状态的日志收集请求;
累加重试次数,直到异常消息被处理成功,或重试次数等于预设次数阈值时,停止日志收集操作,并获取重试结果;
当重试结果为重试失败时,按照预设的警示模板生成日志预警信息,将日志预警信息记录至预设的操作日志中,并向目标终端发送日志预警信息,以使得目标终端显示日志预警信息。
可选的,推送模块305还可以具体用于:
若日志收集状态为收集成功状态,则获取日志数据文件对应的文件路径,根据文件路径从预设的映射关系表中读取日志数据文件的文件链接地址;
按照异常服务器的网络协议地址和业务类型查询预设的配置信息,得到异常服务器的位置信息和异常服务器的故障类型;
基于预设的邮件模板、异常服务器的位置信息和异常服务器的故障类型生成电子邮件正文内容,并获取消息通知对象对应的邮箱地址;
调用预设的报修接口按照预设的电子邮件传输协议,将日志数据文件的文件链接地址和电子邮件正文内容发送至消息通知对象对应的邮箱地址。
可选的,服务器故障智能推送装置还包括:
同步模块306,用于获取异常服务器的维修信息,并将异常服务器的维修信息和日志数据文件远程同步到预设的文件存储系统中;
构建模块307,用于基于异常服务器的维修信息和日志数据文件构建运维知识图谱。
本发明实施例中,通过预设的收集日志接口按照异常服务器网络协议地址和业务类型处理目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;若日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集;若日志收集状态为收集成功状态,则通过预设的报修接口将日志数据文件的文件链接地址和异常服务器的位置信息推送至消息通知对象。避免日志文件过大发送失败的情况,提高了日志数据采集效率和运维效率,并降低了运维成本。
上面图3和图4从模块化的角度对本发明实施例中的服务器故障智能推送装置进行详细描述,下面从硬件处理的角度对本发明实施例中服务器故障智能推送设备进行详细描述。
图5是本发明实施例提供的一种服务器故障智能推送设备的结构示意图,该服务器故障智能推送设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器故障智能推送设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在服务器故障智能推送设备500上执行存储介质530中的一系列指令操作。
服务器故障智能推送设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的服务器故障智能推送设备结构并不构成对服务器故障智能推送设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述服务器故障智能推送方法的步骤。
本发明还提供一种服务器故障智能推送设备,所述服务器故障智能推送设备包括存储器和处理器,存储器中存储有指令,所述指令被处理器执行时,使得处理器执行上述各实施例中的所述服务器故障智能推送方法的步骤。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种服务器故障智能推送方法,其特征在于,所述服务器故障智能推送方法包括:
获取待报修工单信息,并调用预设的配置管理接口按照所述待报修工单信息生成日志收集请求,所述待报修工单信息包括异常服务器网络协议地址、业务类型、业务处理优先级和消息通知对象;
基于所述业务处理优先级将所述日志收集请求添加至目标消息队列中,通过预设的收集日志接口,按照所述异常服务器网络协议地址和所述业务类型处理所述目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;
判断所述日志收集状态是收集异常状态还是收集成功状态;
若所述日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集,得到重试结果,当所述重试结果为重试失败时,生成日志预警信息,并向目标终端发送所述日志预警信息;
若所述日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将所述日志数据文件的文件链接地址和所述异常服务器的位置信息推送至所述消息通知对象;
所述基于所述业务处理优先级将所述日志收集请求添加至目标消息队列中,通过预设的收集日志接口,按照所述异常服务器网络协议地址和所述业务类型处理所述目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件,包括:
按照所述业务处理优先级确定目标消息队列,并将所述日志收集请求插入到所述目标消息队列中,得到消息标识,所述业务处理优先级与所述目标消息队列一一对应;
通过预设的收集日志接口,对所述目标消息队列中的日志收集请求按照先入先出规则进行异步读取,并按照所述异常服务器网络协议地址将所述日志收集请求转发至远程访问控制接口;
通过所述远程访问控制接口,按照所述业务类型对所述日志收集请求进行日志收集,并在日志收集过程时,通过预设的日志收集消费服务定时轮询所述日志收集请求对应的日志收集状态;
当检测到日志收集完成时,按照所述消息标识将所述日志收集状态更新至状态消息队列中,获取并缓存目标日志数据,基于预设主题将所述目标日志数据更新至日志数据文件中。
2.根据权利要求1所述的服务器故障智能推送方法,其特征在于,所述获取待报修工单信息,并调用预设的配置管理接口按照所述待报修工单信息生成日志收集请求,包括:
接收故障报修请求,对所述故障报修请求进行参数解析,得到待报修工单信息;
从预设的文件目录中提取参数校验模板文件,从所述参数校验模板文件中读取参数校验规则,并按照所述参数校验规则对所述待报修工单信息进行参数校验处理,得到校验结果;
当所述校验结果为校验通过时,对所述待报修工单信息进行缓存处理,并通过预设的配置管理接口将所述待报修工单信息封装成日志收集请求。
3.根据权利要求1所述的服务器故障智能推送方法,其特征在于,所述判断所述日志收集状态是收集异常状态还是收集成功状态,包括:
按照所述消息标识从所述状态消息队列中读取所述日志收集请求对应的日志收集状态,判断所述日志收集状态是预设的成功状态值还是预设的异常状态值;
若所述日志收集状态为预设的异常状态值,则确定所述日志收集状态为收集异常状态;
若所述日志收集状态为预设的成功状态值,则确定所述日志收集状态为收集成功状态。
4.根据权利要求1所述的服务器故障智能推送方法,其特征在于,所述若所述日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集,得到重试结果,当所述重试结果为重试失败时,生成日志预警信息,并向目标终端发送所述日志预警信息,包括:
若所述日志收集状态为收集异常状态,则通过预设的重试机制从所述目标消息队列中获取异常消息,并对所述异常消息重新进行日志收集,所述异常消息用于指示所述日志收集状态为收集异常状态的日志收集请求;
累加重试次数,直到所述异常消息被处理成功,或所述重试次数等于预设次数阈值时,停止日志收集操作,并获取重试结果;
当所述重试结果为重试失败时,按照预设的警示模板生成日志预警信息,将所述日志预警信息记录至预设的操作日志中,并向目标终端发送所述日志预警信息,以使得所述目标终端显示所述日志预警信息。
5.根据权利要求1所述的服务器故障智能推送方法,其特征在于,所述若所述日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将所述日志数据文件的文件链接地址和所述异常服务器的位置信息推送至所述消息通知对象,包括:
若所述日志收集状态为收集成功状态,则获取所述日志数据文件对应的文件路径,根据所述文件路径从预设的映射关系表中读取日志数据文件的文件链接地址;
按照所述异常服务器的网络协议地址和所述业务类型查询预设的配置信息,得到异常服务器的位置信息和异常服务器的故障类型;
基于预设的邮件模板、所述异常服务器的位置信息和所述异常服务器的故障类型生成电子邮件正文内容,并获取所述消息通知对象对应的邮箱地址;
调用预设的报修接口按照预设的电子邮件传输协议,将所述日志数据文件的文件链接地址和所述电子邮件正文内容发送至所述消息通知对象对应的邮箱地址。
6.根据权利要求1-5中任意一项所述的服务器故障智能推送方法,其特征在于,在所述若所述日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将所述日志数据文件的文件链接地址和所述异常服务器的位置信息推送至所述消息通知对象之后,所述服务器故障智能推送方法还包括:
获取异常服务器的维修信息,并将所述异常服务器的维修信息和所述日志数据文件远程同步到预设的文件存储系统中;
基于所述异常服务器的维修信息和所述日志数据文件构建运维知识图谱。
7.一种服务器故障智能推送装置,其特征在于,所述服务器故障智能推送装置包括:
生成模块,用于获取待报修工单信息,并调用预设的配置管理接口按照所述待报修工单信息生成日志收集请求,所述待报修工单信息包括异常服务器网络协议地址、业务类型、业务处理优先级和消息通知对象;
处理模块,用于基于所述业务处理优先级将所述日志收集请求添加至目标消息队列中,通过预设的收集日志接口,按照所述异常服务器网络协议地址和所述业务类型处理所述目标消息队列中的日志收集请求,得到日志收集状态和日志数据文件;
判断模块,用于判断所述日志收集状态是收集异常状态还是收集成功状态;
重试模块,用于若所述日志收集状态为收集异常状态,则通过预设的重试机制重新进行日志收集,得到重试结果,当所述重试结果为重试失败时,生成日志预警信息,并向目标终端发送所述日志预警信息;
推送模块,用于若所述日志收集状态为收集成功状态,则获取日志数据文件的文件链接地址和异常服务器的位置信息,通过预设的报修接口将所述日志数据文件的文件链接地址和所述异常服务器的位置信息推送至所述消息通知对象;
所述处理模块具体用于:
按照所述业务处理优先级确定目标消息队列,并将所述日志收集请求插入到所述目标消息队列中,得到消息标识,所述业务处理优先级与所述目标消息队列一一对应;
通过预设的收集日志接口,对所述目标消息队列中的日志收集请求按照先入先出规则进行异步读取,并按照所述异常服务器网络协议地址将所述日志收集请求转发至远程访问控制接口;
通过所述远程访问控制接口,按照所述业务类型对所述日志收集请求进行日志收集,并在日志收集过程时,通过预设的日志收集消费服务定时轮询所述日志收集请求对应的日志收集状态;
当检测到日志收集完成时,按照所述消息标识将所述日志收集状态更新至状态消息队列中,获取并缓存目标日志数据,基于预设主题将所述目标日志数据更新至日志数据文件中。
8.一种服务器故障智能推送设备,其特征在于,所述服务器故障智能推送设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述服务器故障智能推送设备执行如权利要求1-6中任意一项所述的服务器故障智能推送方法。
9.一种计算机可读存储介质,其上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-6中任意一项所述的服务器故障智能推送方法。
CN202110514149.1A 2021-05-12 2021-05-12 服务器故障智能推送方法、装置、设备及存储介质 Active CN113238913B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110514149.1A CN113238913B (zh) 2021-05-12 2021-05-12 服务器故障智能推送方法、装置、设备及存储介质
PCT/CN2022/088786 WO2022237507A1 (zh) 2021-05-12 2022-04-24 服务器故障智能推送方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110514149.1A CN113238913B (zh) 2021-05-12 2021-05-12 服务器故障智能推送方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113238913A CN113238913A (zh) 2021-08-10
CN113238913B true CN113238913B (zh) 2023-10-24

Family

ID=77133565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110514149.1A Active CN113238913B (zh) 2021-05-12 2021-05-12 服务器故障智能推送方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN113238913B (zh)
WO (1) WO2022237507A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113238913B (zh) * 2021-05-12 2023-10-24 康键信息技术(深圳)有限公司 服务器故障智能推送方法、装置、设备及存储介质
CN113835968A (zh) * 2021-09-29 2021-12-24 浪潮卓数大数据产业发展有限公司 一种适用于数安链的应用服务器接口管理方法及设备、介质
CN113849440B (zh) * 2021-09-30 2024-04-26 北京金山云网络技术有限公司 日志的访问方法、装置及服务器
CN114049065A (zh) * 2021-11-11 2022-02-15 北京京东振世信息技术有限公司 一种数据处理方法、装置及系统
CN114328040B (zh) * 2021-11-30 2023-12-22 浪潮(山东)计算机科技有限公司 一种异常板卡的检测方法、系统、电子设备及存储介质
CN114880194B (zh) * 2022-07-08 2022-09-13 天津金城银行股份有限公司 服务异常监控方法、装置、电子设备及计算机存储介质
CN115545452B (zh) * 2022-09-28 2024-07-23 惠州市海葵信息技术有限公司 运维方法、运维系统、设备及存储介质
CN116055343B (zh) * 2023-01-28 2024-09-13 福寿康智慧医疗养老服务(上海)有限公司 一种养老行业防止因网络中断导致未及时履约的方法
CN116319647A (zh) * 2023-03-08 2023-06-23 金蝶征信有限公司 信息通知、信息处理方法、装置、计算机设备和存储介质
CN116074388B (zh) * 2023-03-28 2023-06-27 武汉卓鹰世纪科技有限公司 一种基于日志队列的流量转发方法及系统
CN117389843B (zh) * 2023-12-13 2024-04-09 广州嘉为科技有限公司 一种智能运维系统、方法、电子设备及存储介质
CN117472640B (zh) * 2023-12-28 2024-03-22 成都中科合迅科技有限公司 跨平台事件处理方法和系统
CN117762812B (zh) * 2023-12-28 2024-08-13 北京天空卫士网络安全技术有限公司 一种处理日志信息的方法和装置
CN117914687B (zh) * 2024-03-20 2024-05-14 深圳市派勤电子技术有限公司 一种工业计算机服务器的管理方法及系统
CN117931681B (zh) * 2024-03-22 2024-07-26 云筑信息科技(成都)有限公司 一种基于API网关日志回放的接口diff测试方法
CN118227582B (zh) * 2024-05-07 2024-09-17 江铃汽车股份有限公司 一种终端日志处理方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110515820A (zh) * 2019-08-29 2019-11-29 北京浪潮数据技术有限公司 一种服务器故障维护方法、装置、服务器及存储介质
CN111240952A (zh) * 2020-02-28 2020-06-05 北京百度网讯科技有限公司 日志采集方法和装置
CN111581002A (zh) * 2020-04-29 2020-08-25 上海中通吉网络技术有限公司 服务器故障的自动报障方法、装置和设备
CN111694719A (zh) * 2020-06-10 2020-09-22 腾讯科技(深圳)有限公司 服务器故障处理方法、装置、存储介质及电子设备
CN112529223A (zh) * 2020-12-24 2021-03-19 同盾控股有限公司 一种设备故障报修方法、装置、服务器及储存介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377481B (zh) * 2019-06-19 2022-06-28 深圳壹账通智能科技有限公司 日志管理方法、装置、设备及存储介质
CN110502389A (zh) * 2019-07-01 2019-11-26 无锡天脉聚源传媒科技有限公司 一种服务器异常监控方法、系统、装置及存储介质
US11176020B2 (en) * 2019-11-05 2021-11-16 Microsoft Technology Licensing, Llc Server status monitoring system and method using baseboard management controller
CN113238913B (zh) * 2021-05-12 2023-10-24 康键信息技术(深圳)有限公司 服务器故障智能推送方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110515820A (zh) * 2019-08-29 2019-11-29 北京浪潮数据技术有限公司 一种服务器故障维护方法、装置、服务器及存储介质
CN111240952A (zh) * 2020-02-28 2020-06-05 北京百度网讯科技有限公司 日志采集方法和装置
CN111581002A (zh) * 2020-04-29 2020-08-25 上海中通吉网络技术有限公司 服务器故障的自动报障方法、装置和设备
CN111694719A (zh) * 2020-06-10 2020-09-22 腾讯科技(深圳)有限公司 服务器故障处理方法、装置、存储介质及电子设备
CN112529223A (zh) * 2020-12-24 2021-03-19 同盾控股有限公司 一种设备故障报修方法、装置、服务器及储存介质

Also Published As

Publication number Publication date
CN113238913A (zh) 2021-08-10
WO2022237507A1 (zh) 2022-11-17

Similar Documents

Publication Publication Date Title
CN113238913B (zh) 服务器故障智能推送方法、装置、设备及存储介质
CN110224858B (zh) 基于日志的告警方法及相关装置
CN110661659B (zh) 一种告警方法、装置、系统及电子设备
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
US9563531B2 (en) Storage of mass data for monitoring
CN112506702B (zh) 数据中心容灾方法、装置、设备及存储介质
WO2015176389A1 (zh) 一种设备信息的采集方法、装置以及系统
CN112039701B (zh) 接口调用监控方法、装置、设备及存储介质
US20140143625A1 (en) Computer-readable recording medium, failure prediction device and applicability determination method
CN111046011A (zh) 日志收集方法、系统、节点、电子设备及可读存储介质
CN114154035A (zh) 一种动环监控的数据处理系统
CN114356499A (zh) Kubernetes集群告警根因分析方法及装置
WO2007149340A2 (en) Method and system for monitoring non-occurring events
CN111061498A (zh) 一种配置信息管理系统
CN112650642A (zh) 一种告警处理方法及装置、设备、存储介质
CN110750425A (zh) 数据库监控方法、装置、系统和存储介质
CN113342608B (zh) 流式计算引擎任务的监控方法及装置
CN106487852B (zh) 实现客户端文件同步的方法、装置、终端设备及系统
CN112260902B (zh) 网络设备监控方法、装置、设备及存储介质
CN110011845B (zh) 日志采集方法及系统
CN114629786A (zh) 日志实时分析方法、装置、存储介质及系统
CN111930591A (zh) 一种对zookeeper集群的监控方法、存储介质及计算机设备
CN112799921A (zh) 一种多设备、多网络环境运维监控方法、装置及存储介质
US8032797B1 (en) Storage of mass data for monitoring
JP5136200B2 (ja) ログ記録システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant