CN115202953A - 日志监控处理方法、装置、设备和存储介质 - Google Patents

日志监控处理方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN115202953A
CN115202953A CN202110377398.0A CN202110377398A CN115202953A CN 115202953 A CN115202953 A CN 115202953A CN 202110377398 A CN202110377398 A CN 202110377398A CN 115202953 A CN115202953 A CN 115202953A
Authority
CN
China
Prior art keywords
error
log
error log
information
responsible person
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110377398.0A
Other languages
English (en)
Inventor
伍鹏程
梁本志
李建全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110377398.0A priority Critical patent/CN115202953A/zh
Publication of CN115202953A publication Critical patent/CN115202953A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/362Software debugging
    • G06F11/3628Software debugging of optimised code
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3664Environments for testing or debugging software
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提供了一种日志监控处理方法、装置、设备和存储介质,该方法包括:获得服务器上报的错误日志,错误日志关联有服务器为错误日志添加的标识信息,且标识信息为用于检测出错误日志的错误检测代码的代码标识;依据错误日志关联的标识信息,获得错误检测代码的基础属性信息,基础属性信息包括:错误检测代码的目标负责人的通信账号;向目标负责人的通信账号发送错误日志的告警信息,以向目标负责人通知告警信息。本申请的方案能够更为合理和有效的处理错误日志。

Description

日志监控处理方法、装置、设备和存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种日志监控处理方法、装置、设备和存储介质。
背景技术
日志监控是针对后台产生的错误日志进行监控,并依据错误日志对软件版本中的错误及时修复和处理的一种常用技术。如,以游戏业务为例,在开发出游戏版本之后,在游戏版本的测试、预发布以及上线过程中,均需要检测游戏版本运行中产生的错误日志并基于错误日志对游戏运行中的错误进行修复处理。
可见,较为有效和可靠的日志监控是及时发现和处理软件版本中存在错误的前提。因此,在软件版本的日志监控过程中,如何能够更为有效且合理的处理错误日志是本领域技术人员需要解决的技术问题。
发明内容
有鉴于此,本申请提供了一种日志监控处理方法、装置、设备和存储介质,以实现更为有效和合理的处理错误日志。
为实现上述目的,本申请提供了如下技术方案:
一方面,本申请提供了一种日志监控处理方法,包括:
获得服务器上报的错误日志,所述错误日志关联有所述服务器为所述错误日志添加的标识信息,且所述标识信息为用于检测出所述错误日志的错误检测代码的代码标识;
依据所述错误日志关联的标识信息,获得所述错误检测代码的基础属性信息,所述基础属性信息包括:所述错误检测代码的目标负责人的通信账号;
向所述目标负责人的通信账号发送所述错误日志的告警信息,以向所述目标负责人通知所述告警信息。
在一种可能的实现方式中,在所述向所述目标负责人的通信账号发送所述错误日志的告警信息之前,还包括:
确定所述服务器所属的运行环境;
获得所述运行环境对应的告警规则;
所述向所述目标负责人的通信账号发送所述错误日志的告警信息,包括:
依据所述告警规则,向所述目标负责人的通信账号发送所述错误日志的告警信息。
在又一种可能的实现方式中,所述基础属性信息还包括:所述错误检测代码的目标错误级别;
获得所述运行环境对应的告警规则,包括:
如所述运行环境为设定运行环境,获得所述运行环境下不同种错误级别对应的告警规则;
所述依据所述告警规则,向所述目标负责人的通信账号发送所述错误日志的告警信息,包括:
依据所述运行环境下所述目标错误级别对应的告警规则,向所述目标负责人的通信账号发送所述错误日志的告警信息。
在又一种可能的实现方式中,在所述向所述目标负责人的通信账号发送所述错误日志的告警信息之前,还包括:
获得所述错误日志的详情信息,所述详情信息包括:所述错误日志的日志内容,所述错误日志的标识信息和上报所述错误日志的服务器所属的运行环境;
所述向所述目标负责人的通信账号发送所述错误日志的告警信息,包括:
向所述目标负责人的通信账号发送所述错误日志的告警信息,所述告警信息携带有所述错误日志的详情信息。
在又一种可能的实现方式中,所述基础属性信息包括:所述目标负责人的至少一种通信账号,所述至少一种通信账号包括:所述目标负责人的即时通讯账号;
所述向所述目标负责人的通信账号发送所述错误日志的告警信息包括如下至少一种:
向所述目标负责人的即时通讯账号发送所述错误日志的告警消息;
向所述目标负责人的即时通讯账号所在的即时通讯群组发送所述错误日志的告警消息,所述告警消息指示所述目标负责人的即时通讯账号为所述告警消息的被提醒对象。
在又一种可能的实现方式中,还包括:
获得所述目标负责人的即时通讯账号对应的即时通讯客户端针对所述告警消息返回的回复消息,所述回复消息包括消息引用部分和回复内容,所述消息引用部分表征所述回复内容针对的所述告警消息中的至少部分内容;
基于所述消息引用部分和回复内容,更改所述基础属性信息或者所述告警规则。
又一方面,本申请还提供了一种日志监控处理装置,包括:
日志获得单元,用于获得服务器上报的错误日志,所述错误日志关联有所述服务器为所述错误日志添加的标识信息,且所述标识信息为用于检测出所述错误日志的错误检测代码的代码标识;
属性获得单元,用于依据所述错误日志关联的标识信息,获得所述错误检测代码的基础属性信息,所述基础属性信息包括:所述错误检测代码的目标负责人的通信账号;
告警发送单元,用于向所述目标负责人的通信账号发送所述错误日志的告警信息,以向所述目标负责人通知所述告警信息。
又一方面,本申请还提供了一种日志监控处理系统,包括:
至少一台服务器,至少一台存储设备以及至少一台日志监控设备;
其中,所述服务器,用于基于错误检测代码从所述服务器产生的运行日志中确定错误日志,将所述错误检测代码的代码标识确定为所述错误日志的标识信息,并向所述存储设备发送携带有所述标识信息的错误日志;
所述存储设备,用于存储错误检测代码的代码标识对应的基础属性信息,并将所述服务器发送的错误日志的标识信息与所述错误日志对应存储,所述基础属性信息包括所述错误检测代码的目标负责人的通信账号;
所述日志监控设备,用于从存储设备获得所述错误日志;依据所述错误日志关联的标识信息,获得所述错误检测代码的基础属性信息;向所述目标负责人的通信账号发送所述错误日志的告警信息,以向所述目标负责人通知所述告警信息。
又一方面,本申请还提供了一种服务器,包括存储器和处理器;
其中,所述存储器用于存储程序;
所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如上任意一项所述的日志监控处理方法。
又一方面,本申请还提供了一种存储介质,用于存储程序,所述程序被执行时,用于实现如上任意一项所述日志监控处理方法。
由以上内容可知,本申请获得的错误日志中会携带有能够表征错误日志对应的错误检测代码的代码标识,而基于该代码标识可以确定出该错误检测代码的负责人的通信账号,基于此,可以向该目标负责人的通信账号发送该错误日志的告警信息,从而使得负责处理该错误日志的负责人可以及时查看到相应的错误日志,进而使得错误日志能够被更为及时和有效被相应负责人员看到并处理,提高了错误日志处理的及时性和有效性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本申请所适用的一种系统架构示意图;
图2示出了本申请提供的日志监控处理方法的一种流程示意图;
图3示出了本申请提供的日志监控处理方法的又一种流程示意图;
图4示出了本申请展示出的告警信息的一种示意图;
图5示出了本申请基于即时通讯展示出的告警信息所进行的一种交互界面示意图;
图6示出了本申请的方案的一种实现原理框图;
图7示出了本申请提供的日志监控处理方法的一种流程交互示意图;
图8示出了本申请输出的测试环境中多条错误日志的告警汇总信息的一种示意图;
图9为告警汇总信息的一种网页形式的示意图;
图10为本申请提供的日志监控处理装置的一种组成结构示意图;
图11为本申请提供服务器的一种组成结构示意图。
具体实施方式
本申请的方案适用于对任意业务的软件版本进行日志监控与处理的场景。如,本申请可以应用于游戏业务场景下所涉及到的日志监控与处理。
可以理解的是,在软件版本开发之后,软件版本可能会经过测试、预发布以及上线等等多个环节,这多个环节对应了软件版本的多个运行环境,如,测试环境、预发布环境和上线环境等,在本申请中可以分别对这几种环境中的部分或者全部进行日志监控与处理。
在本申请的方案中可以通过日志监控设备对运行软件版本的服务器产生的错误日志进行监控以及告警处理,使得错误日志能够被更为合理和高效的处理。
为了便于理解,下面先对本申请的方案所适用的系统架构进行介绍。
本申请的日志监控处理系统包括至少一台运行软件版本的服务器,以及至少一台日志监控设备。
如图1,其示出了本申请的方案所适用的一种系统架构的组成结构示意图。
由图1可以看出,该系统架构可以包括:
软件运行系统110和日志监控系统120。
其中,软件运行系统110可以包括至少一套服务器系统,每套服务器系统包括至少一台服务器111。为了便于区分,也可以称为软件运行系统中的服务也可以称为软件运行服务器。
其中,不同服务器系统属于软件代码的不同运行环境,因此,不同服务器系统用于运行软件代码的不同版本。
如,软件运行系统可以包括用于测试软件代码的测试环境对应的测试服务器系统,用于实现软件代码预发布的预发布环境对应的预发布服务器系统,以及,用于发布软件代码的上线环境对应的上线服务器系统。相应的,测试服务器系统中各台测试服务器可以运行软件代码的测试版本,而预发布服务器系统用于运行软件代码的预发布版本,而上线服务器系统用于运行软件代码的上线版本。
当然,根据不同业务场景,软件运行系统中涉及到的运行环境的种类和数量也会有所差别。
以本申请的软件运行系统为游戏运行系统为例,游戏软件开发之后会依次经过测试环境、先游环境和预发布环境之后,才会发布到线上环境,因此,游戏场景中,游戏运行系统至少会涉及到测试环境、先游环境、预发布环境和线上环境。
其中,该日志监控系统120包括至少一台日志监控设备121,日志监控设备121也可以称为日志监控服务器。日志监控设备可以获得软件运行系统的服务器上报的错误日志,结合错误日志告警规则,对错误日志进行分析处理并进行告警,以使得软件运行系统运行的软件代码中所存在的错误能够被及时处理。
在一种可选方式中,该日志监控系统还包括至少一台存储设备122。相应的,软件运行系统的服务器可以向该至少一台存储设备中上报错误日志,而日志监控系统可以从该至少一台存储设备中获得待处理的错误日志。
其中,该存储设备可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库等基础云计算服务的云服务器。
如,存储设备可以基于云存储实现错误日志等相关数据的存储。其中,云存储(cloudstorage)是在云计算概念上延伸和发展出来的一个新的概念,分布式云存储系统(以下简称存储系统)是指通过集群应用、网格技术以及分布存储文件系统等功能,将网络中大量各种不同类型的存储设备(存储设备也称之为存储节点)通过应用软件或应用接口集合起来协同工作,共同对外提供数据存储和业务访问功能的一个存储系统。
在又一种可能的情况中,该至少一个存储设备还可以是采用区块链技术实现错误日志等相关数据的存储。其中,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
在本申请中通过日志监控系统可以对软件运行环境中各个运行环境下的服务器的错误日志同时进行监控与处理,从而可以实现更为全面的日志监控。当然,在实际应用中,也可以根据需要仅仅对部分运行环境的错误日志进行监控。
可以理解的是,图1仅仅是本申请的方案所适用的一种系统架构示意图,在实际应用中,系统架构还可以有其他可能,对此不加限制。
在以上基础上,下面先从日志监控设备侧对本申请的日志监控处理方法进行介绍。如图1所示,其示出了本申请的日志监控处理方法的一种流程示意图,本实施例的方法应用于如上日志监控设备。
本实施例的方法可以包括:
S201,获得服务器上报的错误日志。
其中,错误日志关联有所述服务器为该错误日志添加的标识信息,且该标识信息为用于检测出该错误日志的错误检测代码的代码标识。
其中,此处的服务器为前面提到的代码运行系统中的服务器。
日志监控设备获得服务器上报的错误日志的方式可以有多种可能。如,在一种可能的情况中,日志监控设备可以获得服务器发送给日志监控设备的错误日志及错误日志关联的标识信息等。
在又一种可能的情况中,在日志监控系统包括至少一台存储设备的情况中,日志监控设备可以从存储设备获得待处理的错误日志。
在本申请中,针对同一类错误产生的错误日志,软件运行系统的任意一套服务器系统中的服务器均可以运行同一套错误检测代码。服务器基于错误检测代码可以从该服务器产生的运行日志中确定出错误日志,并将错误检测代码的代码标识确定为错误日志的标识信息,并向存储设备或者该日志监控设备发送携带有标识信息的错误日志。
举例说明,以软件运行系统为游戏运行系统为例,假设在游戏过程中,打败怪物可以产生100个经验值,因此,如果打败怪物产生的经验值超过一千个就可以认为是游戏存在漏洞。在此基础上,开发人员可以编写错误检测代码用于指示存在错误:打败怪物产生超过1000个经验值。相应的,如果日志记录的内容涉及到打败怪物产生的经验值超过了1000,则该日志会被检测为错误日志。
其中,由于错误检测代码的代码标识为错误检测代码生成时固定分配的唯一标识,因此,将基于错误检测代码得到的错误日志的标识信息设定为该代码标识,有利于跟踪该错误检测代码的开发人所需负责的各个错误日志,也无需关心错误日志来自哪个运行环境等。
S202,依据该错误日志关联的标识信息,获得该错误检测代码的基础属性信息。
其中,该基础属性信息包括:该错误检测代码的目标负责人的信息,该目标负责人的信息至少包括目标负责人的通信账号。当然,该目标负责人的信息还可以包括:目标负责人的标识,如姓名或者工号等等。
其中,目标负责人为负责处理由该错误检测代码检测出的错误日志的人员。如,该目标负责人可以为开发该错误检测代码的开发人员。在实际应用中,还可以设置开发人员之外的其他人员来负责基于该错误检测代码检测出的错误日志,具体根据需要设定即可。
该目标负责人的通信账号为能够向目标负责人发送通信数据的通信标识。该通信账号可以有一种或者多种,具体可以根据需要设定。如,目标负责人的通信账号可以为目标负责人的即时通讯账号,目标负责人的邮箱地址,以及目标负责人的电话号码等通信账号中的一种或者多种。
可以理解的是,该基础属性信息还可以包括错误检测代码的代码内容,以及错误检测代码的生成时间等等信息中一种或者几种。
可以理解的是,在开发人员编写了错误检测代码之后,可以通过软件运行系统中代码管理程序(也称为代码管理系统或者代码管理工具)为该条错误检测代码生成唯一的代码标识,同时,代码管理程序会存储该错误检测代码的代码标识对应的错误检测代码以及目标负责人的信息等基础属性信息。其中,该代码管理程序可以运行在日志监控系统,如,运行在日志监控系统的日志监控设备或者存储设备,当然,也可以是运行在软件运行系统中。对此不加限制。
在此基础上,本申请的日志监控设备可以查询并获得错误日志的标识信息对应的基础属性信息,从而得到相应的错误检测代码的基础属性信息。
如,在一种可能的实现方式中,日志监控系统可以在确认代码管理程序检测到新增或者更新的错误检测代码时,获得该错误检测代码的代码标识以及该代码标识对应的基础属性信息,并存储代码标识对应的基础属性信息。相应的,日志监控设备可以从日志监控系统存储的各代码标识对应的基础属性信息中,获得该错误日志的标识信息对应的基础属性信息。
在一种可选方式中,如日志监控系统包括有至少一台存储设备的情况下,日志监控系统可以在存储设备在确认该代码管理程序中存在新增或者更新的错误检测代码时,获得该代码管理程序存储的该错误检测代码的代码标识及基础属性信息,并在存储设备中存储代码标识对应的基础属性信息。如,存储设备中可以运行更新监测程序,并通过该更新程序监测该代码管理程序是否获得新增或者更新的错误检测代码。
相应的,日志监控设备可以从存储设备获得与该错误日志的标识信息对应的基础属性信息。
S203,向该目标负责人的通信账号发送错误日志的告警信息,以向该目标负责人通知该告警信息。
其中,该告警信息用于提醒目标负责人出现待处理的错误日志。
在一种可能的实现方式中,为了使得目标负责人可以通过告警信息可以了解到错误日志的详细信息,日志监控设备还可以获得该错误日志的详情信息,并告警信息中携带该错误日志的详情信息。
其中,错误日志的详情信息可以包括:该错误日志的日志内容,该错误日志的标识信息和上报该错误日志的服务器的信息。其中,上报该错误日志的服务器的信息可以是,该服务器的IP地址和该服务器的运行环境中的一种或者两种。
可以理解的是,错误日志的详情信息可以是在获得服务器上报的错误日志,获得错误日志的详情信息并存储在日志监控系统中的。
如,在一种可能情况中,如果服务器将错误日志上报给日志监控系统的存储设备,由于错误日志携带有相应的标识信息,存储设备可以存储该标识信息对应的详情信息,该详情信息可以包括该错误日志的日志内容。同时,存储设备可以获得服务器的IP地址以及运行环境等信息,并存储到错误日志的标识信息对应的详情信息中。
其中,存储设备获得上报错误日志的服务器的运行环境也可以有多种方式。如,可以预先配置不同IP地址的服务器对应的运行环境,在此基础上,基于服务器的IP地址可以确定该服务器对应的运行环境。又如,不同运行环境的服务器可以调用存储设备的不同日志上报接口上报错误日志,因此,存储设备基于服务器上报错误日志所调用的日志上报接口,可以确定服务器所属的运行环境。
本申请中,向目标负责人发送告警信息的频率以及告警信息的展示方式等均可以有多种可能。在实际应用中,可以结合错误日志的级别不同,发送告警信息的频率以及展示方式也会有所不同,对此不加限制。
在一种可选方式中,考虑到不同运行环境对于错误日志的关注程度也会有所不同,因此,本申请还可以依据服务器所属的运行环境来确定发送告警信息的具体实现方式。
当然,在实际应用中,还可以结合服务器所属的运行环境以及错误日志的级别,来综合确定发送告警信息的具体实现方式,后续会以一种可能情况为例说明,在此不再赘述。
在一种可能的实现方式中,在向目标负责人的通信账号发送错误日志的告警信息之后,目标责任人还可以通过终端向日志监控系统反馈对于错误日志的处理状态信息。相应的,日志监控设备可以获得该目标负责人的终端发送的该目标负责人对于错误日志的处理状态信息,日志监控设备可以在日志监控系统中存储该错误日志的处理状态信息。同时,日志监控设备还可以定期向目标负责人的通信账号反馈该错误日志的处理状态信息,以便于目标负责人可以核实错误日志的处理是否与记录的处理状态信息一致,减少错误日志被遗漏等情况。
需要说明的是,本实施例以获得一个错误日志为例说明,但是可以理解的是,日志监控设备可能会同时获得多个待处理的错误日志,但是针对每个错误日志的处理过程是相同的,对此不再赘述。
由以上内容可知,本申请获得的错误日志中会携带有能够表征错误日志对应的错误检测代码的代码标识,而错误检测代码的代码标识为错误检测代码生成时为错误检测代码分配的唯一且固定的代码,因此,将基于该错误检测代码的代码标识作为该错误检测代码检测到的错误日志的标识信息,可以实现基于该代码标识对该错误检测代码检测到的所有错误日志进行跟踪,从而更为高效的确定出错误日志的负责人。
在以上基础上,基于该代码标识可以确定出该错误检测代码的负责人的通信账号,基于此,可以向该目标负责人的通信账号发送该错误日志的告警信息,从而使得负责处理该错误日志的负责人可以及时查看到相应的错误日志,进而使得错误日志能够被更为及时和有效被相应负责人员看到并处理,提高了错误日志处理的及时性和有效性。
可以理解的是,在实际应用中,软件运行系统中不同运行环境的服务器对于同一类型的错误的容忍程度也会有所不同。如,在测试环境中,如果出现错误日志指示的错误日志之后只需要定时汇总并上报错误日志即可,而不需要每次都离开处理错误日志;而在预发布环境或者线上环境,由于软件版本已经是正常用户访问,如果出现错误则会可能影响到用户的正常访问,因此,在出现错误日志指示的错误时,就可能需要及时处理相应的错误。
在此基础上,本申请中日志监控系统可以针对不同的运行环境设置不同的告警规则。相应的,日志监控设备在获得错误日志之后,确定上报错误日志的服务器所属的运行环境,并结合该运行环境对应的告警规则,向负责该错误日志的目标负责人的通信账号发送该错误日志的告警信息。
进一步的,针对软件运行系统中的多种运行环境中的某一种或者几种,日志监控系统还可以设置运行环境中不同级别的错误日志对应的告警规则,并结合当前获得的错误日志的级别,确定告警规则。
下面结合一种实现情况进行说明,如图3所示,其示出了本申请提供的日志监控处理方法的又一种流程示意图,本实施例应用于日志监控设备,本实施例的方法可以包括:
S301,获得服务器上报的错误日志。
其中,该错误日志关联有该服务器为该错误日志添加的标识信息,且所述标识信息为用于检测出该错误日志的错误检测代码的代码标识。
S302,依据该错误日志关联的标识信息,获得该标识信息对应的错误检测代码的基础属性信息。
如,日志监控设备可以从日志监控系统的存储设备中获得存储的该标识信息对应的基础属性信息。
其中,该基础属性信息包括:错误检测代码的目标负责人的通信账号。
在本实施例中,错误检测代码的基础属性信息还包括:该错误检测代码的目标错误级别。其中,为了便于区分,将获得的错误日志的标识对应的服务检测代码的错误级别称为目标错误级别。
可以理解的是,错误检测代码的错误级别是指错误检测代码所能检测出的错误日志对应的错误所属的级别。
其中,错误检测代码的错误级别一般包含于开发出的错误检测代码的备注或者特殊标记信息中,在此基础上,日志监控系统获得在检测到软件运行系统新增了该错误检测代码之后,可以获得该错误检测代码对应的错误级别,并存储的错误检测代码的基础属性信息中记录错误级别。
如,错误检测代码的错误级别可以包括:普通错误、严重错误和致命错误。其中,普通错误是指错误导致的影响相对较低,而严重错误则可能导致较大的运行异常,而致命错误则属于需要立刻处理且需要持续提醒的错误类别。当然,在实际应用中,错误级别除了以上三种之外,还可以包括自定义错误,以便针对自定义错误设置一些自定义告警规则。
S303,确定该服务器所属的运行环境。
如,日志监控设备可以基于服务器的IP地址或者服务器上报该错误日志的日志上报接口,来确定服务器所属的运行环境。
又如,在日志监控系统中通过存储设备存储服务器上报的错误日志的情况下,存储设备可以确定并存储该错误日志的标识信息对应的详情信息,在该详情信息中可以记录有服务器所属的运行环境。相应的,日志监控系统可以根据错误日志的标识信息,获得该错误日志的详情信息,并从详情信息中获得该服务器所属的运行环境。
可以理解的是,如前面所述软件运行系统可以划分为多种运行环境,而每台服务器仅仅属于某一种运行环境。而服务器所属的运行环境实际上就表征了该服务器上报的错误日志所产生的运行环境。
S304,如该服务器所属运行环境为设定运行环境,获得该运行环境下不同种错误级别对应的告警规则。
其中,设定运行环境可以包括软件运行系统的多种运行环境中的至少一种。
设定运行环境为需要针对不同错误级别的错误日志采取不同告警措施的运行环境。
如,由于线上环境和预发布环境是面向真实用户的访问环境,因此,在这两个运行环境中软件版本出现漏洞或者异常等错误的情况下,可能需要及时相应的错误,但是不同的错误的处理及时性可以稍有差别。因此,设定运行环境可以包括线上环境和预发布环境。类似的,由于测试环境是为了测试软件运行中所存在的各种错误,但是却不需要在出现错误日志时立刻处理该错误日志对应的错误,因此,测试环境可以不属于设定运行环境。
在本申请实施例中,告警规则可以包括:告警途径、告警频率、告警内容以及告警内容的展示方式等信息的一种或者几种。
其中,告警途径可以包括采用即时通讯、网页或者电话等告警渠道中的一种或者几种。
告警内容可以规定告警信息中具体包括哪几类信息。
告警内容的展示方式包括:图片形式、网页链接、高亮以闪烁等展示方式中的一种或者几种。
告警频率为单位时间内发出告警信息的次数,如,告警频率可以为持续输出告警信息,每间隔5秒输出一次告警信息,或者每分钟输出一次告警信息。
可以理解的是,在每种设定运行环境中,不同错误级别的告警规则也可以根据需要设定。
如,以线上环境或者预发布环境为例,可以设置普通错误级别的告警规则、严重错误级别的告警规则以及致命错误级别的告警规则。其中,普通级别的告警规则中可以设置仅仅输出一次告警信息,且只需要采用一种通信途径发送告警信息;而严重错误级别对应的告警规则中,告警内容的展示方式可能会采取更能引起关注的展示方式、告警频率会相对较高,且可能需要通过多种通信账号对应的通信途径发送告警信息;而严重错误级别的告警规则可以规定需要立刻处理错误日志,否则会持续通过多种通信途径发送告警信息。
以上这三种错误级别的告警规则可以是日志监控系统设定好的,不随设定运行环境变化而变化,当然,也可以根据需要调整每种错误级别的告警规则。当然,如果错误日志的错误级别不属于以上三种,还可以将错误日志设置为自定义错误级别,并设定自定义的错误规则。
S305,依据该运行环境下该目标错误级别对应的告警规则,向目标负责人的通信账号发送该错误日志的告警信息。
如,告警规则包括了发送告警信息所采用的至少一种通信途径,告警信息的告警频率和告警内容,则可以按照告警内容的规定获得错误日志相关的信息;同时,按照该运行环境下该目标错误级别对应的告警规则中规定的至少一种通信途径,获得目标负责人在该至少一种通信途径中各自的通信账号,并按照告警频率,向该目标负责人在该至少一种通信途径中的通信账号发送具有相应告警内容的告警信息。
S306,如该服务器所属的运行环境不是设定运行环境,则获得该运行环境对应的告警规则。
对于设定运行环境之外的其他运行环境而言,运行环境所产生的不同级别的错误日志可以采用相同的告警规则,在此基础上,可以不区分错误日志的日志级别,而直接按照统一的告警规则进行告警。
举例说明:
以不属于设定运行环境的测试环境为例说明,在测试环境中只需要关心存在哪些测试问题而并不需要及时处理这些错误,因此,测试环境的告警规则中告警频率可以为每天统计并汇报一次。
基于此,可以统计每天中同一标识信息的错误日志的信息,每天达到错误日志的汇报时刻时,才发送该错误日志的告警信息。
S307,依据确定出的告警规则,向该目标负责人的通信账号发送该错误日志的告警信息。
与前面实施例相似,在本实施例中,为了避免目标负责人获知告警信息后,再人工查找错误日志相关的错误内容以及产生的环境等等相关信息,在本实施例中,在该步骤S305或者S307发送告警信息之前,获得错误日志的详情信息,如,该错误日志的详情信息可以包括:该错误日志的日志内容,错误日志的标识信息和上报该错误日志的服务器所属的运行环境。具体获得错误日志的详情信息的过程可以前面实施例的相关介绍,在此不再赘述。
相应的,日志监控设备发送的告警信息可以携带该错误日志的详情信息。在此基础上,目标负责人可以根据该错误日志的详情信息可以该错误日志相关的信息,从而可以为有效且及时的处理错误日志提供可靠依据。
为了便于理解,结合一种情况说明:
参见图4,其示出了本申请输出的告警信息的一种展示示意图。
在图4示出的告警信息为标识信息(如图4中【标识】所示)为9220的错误日志对应的告警信息。
由图4中告警信息的界面顶部指示出的“测试环境监控”可知,该错误日志是由测试环境中的服务器产生的。
同时,告警信息的界面中依次显示有:
具有该标识信息的错误日志上报次数为3次,如图4中示出的[次数]:3;
产生该错误日志的机器(即服务器)的IP地址为“IP****”,如图4中示出的:[错误机器]:IP***;
负责人为“张##”,如图4中[负责开发]:张##;
该错误日志对应的标识信息为9220,如图4中示出的[错误标识]:9220;
该错误日志的标识信息对应的错误检测代码所在文件或者是错误日志指向的错误代码所在的文件,如图4中示出的[文件]:a*b//ab***;
错误日志的错误内容,如图4中示出的[错误]中的具体内容。
由图4可以看出,根据图4中告警信息可以了解到错误日志相关的各项信息,而无需错误日志对应的负责人再单独去查找相关信息,有利于根据告警信息更为及时和有针对性的处理相应的错误。
可以理解的是,在本申请以上实施例中,在向目标负责人的通信账号发送该错误日志的告警信息之后,如果目标负责人依据告警信息处理了该错误日志,目标负责人还可以向日志监控系统反馈其处理错误日志的处理措施。该处理措施为修复该错误日志对应的错误的措施。如,该处理措施可以包括该错误日志出现的原因以及解决该错误日志出现的错误所采用的方式等等。
相应的,日志监控设备在获得目标负责人的终端发送的目标负责人处理该错误的处理措施之后,可以将该错误日志的处理措施存储到该错误日志的标识信息对应的基础属性信息中。其中,目标负责人的终端可以为目标负责人的通信账号所在的客户端,也可以是目标负责人通过其他终端返回处理措施,本申请对此不加限制。
在此基础上,如果后续出现与该错误日志同类型的错误日志,则相关负责人可以参照基础属性信息中记录的该处理措施进行错误处理,有利于更为高效的处理错误日志对应的错误,减少处理错误的耗时。
由以上可知,每个标识信息代表的错误检测代码对应的基础属性信息还可以包括具有该标识信息的历史错误日志对应的历史处理措施的信息。为了在对错误日志进行告警时,使得目标负责人可以快速了解到历史处理措施,本申请在向目标负责人的通信账号发送的告警信息中还可以包括历史错误日志的历史处理措施,如,在告警信息携带的该错误日志的详情信息中除了前面提到的几种信息之外,还可以包括历史处理措施的信息。
其中,该历史处理措施的信息可以为历史处理措施的具体内容。当然,也可以指示该具体内容所在地址的链接地址,以使得目标负责人可以基于该链接地址可以直接访问该历史处理措施的详细信息。
如,在图4中的[备注信息]中可以显示该历史错误日志对应的历史处理错误的信息,或者是,在图4示出的告警信息中新增一项历史处理记录,并在历史处理记录这一项中添加历史错误日志的历史处理措施的具体内容。
可以理解的是,在本申请实施例中,错误检测代码的基础属性信息可以包括目标负责人的至少一种通信账号,在实际应用中,可以结合告警规则向目标负责人的部分或者全部通信账号发送告警信息。
在一种可选方式中,为了能够使得目标负责人能够及时和便捷的查看到告警信息,在本申请中,该至少一种通信账号可以包括:目标负责人的即时通讯账号。相应的,在本申请中,向目标负责人的通信账号发送错误日志的告警信息至少可以包括如下任意一种或者两种:
依据目标负责人的即时通讯账号,向目标负责人的即时通讯账号发送该错误日志的告警消息;
依据目标负责人的即时通讯账号,向目标负责人的即时通讯账号所在的即时通讯群组发送该错误日志的告警消息,该告警消息中指示有该目标负责人的即时通讯账号为该告警消息的提醒对象。
其中,目标负责人的即时通讯账号所在的即时通讯群组为目标负责人的即时通讯账号关联的指定类型的群组。如,目标负责人的即时通讯账号绑定的企业群组,企业群组中包括负责该软件运行系统的多个人员的即时通讯账号。
可以理解的是,通过在告警消息中指示有该目标负责人的即时通讯账号为告警消息的提醒对象,可以使得该即时通讯群组中各个用户可以确认需要处理该错误日志的目标负责人,也使得该目标负责人能够及时获知存在需要其处理的错误日志,减少告警信息遗漏的情况。
如,仍结合图4说明,假设图4为向即时通讯群组中发送的一条告警消息的内容。在图4中的标识信息为9220的错误日志的目标负责人为“张##”,告警消息指示有“张##”的即时通讯账号为提醒对象。
假设“张##”的即时通讯账号为张##账号aa,相应的,在[备注信息]将“张##账号aa”标记为提醒对象。如图4中的[备注信息]显示有“@张##账号aa”。同时,即时通讯应用也会根据提醒对象的信息,向张##的即时通讯客户端发送该“@张##账号aa”作为提醒对象的提醒。
可以理解的是,在向目标负责人的即时通讯账号或者即时通讯账号所在的即时通讯群组发送告警消息之后,为了提高目标负责人与日志监控系统的可交互性,目标负责人还可以在即时通讯客户端上针对该告警消息的部分或者全部内容进行信息回复,通过信息回复可以向日志监控系统上报针对错误的处理状态或者是请求修改错误日志对应的目标负责人等等基础属性。
相应的,日志监控系统可以获得目标负责人的即时通讯账号对应即时通讯客户端针对所述告警消息返回的回复消息。其中,该回复消息包括消息引用部分和回复内容,该消息引用部分用于指示回复内容针对的该告警消息中的至少部分内容。在此基础上,基于该消息引用部分和回复内容,可以更改基础属性信息或者告警规则。
其中,回复消息中的回复内容是指针对该消息引用部分所回复的信息内容。
可以理解的是,在消息引用部分和回复内容不同的情况下,回复消息所表征的含义也会有所差别。相应的,需要分析回复消息所指示的内容含义,来确定回复消息的操作意图,从而对基础属性信息或者告警规则中的一种或者两个进行修改。
在一种可能的实现方式中,可以采用结合消息引用部分和回复内容分析回复消息的语义意图,根据语义意图确定需要修改基础属性信息和告警规则中的哪一个或者两个。
如,在语义意图为反馈错误日志的处理状态的情况下,由于错误日志的处理状态反映的是目标负责人在获知该错误日志后,处理该错误日志的处理状态(如,启动错误日志的处理或者完成错误日志的处理等),因此,可以修改告警规则。如,修改告警规则中的告警频率,以避免在目标负责人处理错误日志的过程中仍频率发送该错误日志的告警信息。
又如,在语义意图为修改基础属性信息的内容时,则可以修改基础属性信息中的内容。例如,语义意图为反馈错误日志的处理措施,则可以在基础属性信息中添加处理措施的信息。又比如,语义意图为更改错误日志对应的目标负责人,则需要修改基础属性信息中的目标负责人的相关信息。
下面结合图5进行举例说明:
图5示出了基于即时通讯应用的界面中展现出的告警消息进行交互控制的一种示意图。
在图5中,日志监控设备针对预发布环境的监控进程向即时通讯客户端中某个即时通讯群组发送告警消息后,在该即时通讯群组对应的界面中会显示出“预发布监控”对应的会话消息,该会话消息的内容包括错误日志的详情信息。如,错误日志的标识信息(如,[错误标识]所示)为5539,该错误日志出现次数为3,产生该错误日志的服务器的IP地址等等信息。同时,该条会话消息指示了提醒对象为错误日志对应的负责人“王##”的账号。
在以上基础上,负责人“王##”看到该条会话消息之后,可以引用该条会话消息,并针对该条会话消息进行回复“我看下”,在此基础上,负责人“王##”的即时通讯客户端会将该消息引用部分为针对预发布监控发布的错误日志的告警信息,且回复内容为“我看下”的回复消息发送给日志监控设备。
日志监控设备通过分析该条回复消息,则可以确定负责人“张##”已开始处理该错误日志,从而可以修改其针对该条错误日志的告警规则,避免持续频繁的发出告警。
类似的,负责人“张##”还可以在该即时通讯交互界面上引用该告警信息之后输入“负责人修改为高**”的回复消息,则日志监控设备可以基于回复消息修改错误日志的标识信息“5539”对应的基本属性信息中负责人的信息。
可以理解的是,在本申请中涉及到错误检测代码的基础属性信息以及错误日志的相关信息的修改时,日志监控设备会同步自身存储的相关信息的同时,会同步到存储设备侧。
如图6所示,其示出了本申请的日志监控处理方法的一种实现原理示意框图。
由图6可以看出,本申请的方案实现了日志打印、采集以及监控告警的一个闭环系统。其中,运行软件的服务器侧负责错误日志打印与上报,存储设备负责收集并存储错误日志,而日志监控设备侧对错误日志进行监控告警、告警信息的展示控制以及结合负责人的反馈修改并同步错误日志的备注以及相关规则。
下面以软件运行系统的各服务器均向存储设备上报其产生的错误日志为例,并结合图6对本申请的日志监控处理方法进行介绍。
如图7所示,其示出了本申请的日志监控处理方法的一种流程交互示意图,本实施例的方法可以包括:
S701,软件运行系统的服务器运行该服务器所属运行环境对应的软件版本,获得软件版本运行中产生的运行日志集。
运行日志集中可以包括至少一条运行日志。
如,测试环境中的服务器可以运行软件的测试版本,而上线环境的服务器则会运行软件的上线版本。
S702,针对服务器配置的每条错误检测代码,服务器从运行日志集中检测与该错误检测代码匹配的错误日志,并将错误检测代码的代码标识设置为该错误日志的标识信息。
其中,软件运行系统的不同运行环境中的服务器均可以运行相同的一套错误检测代码集,该套错误检测代码集中包括至少一条用于检测出错误日志的错误检测代码。在此基础上,通过基于一套错误检测代码集对软件运行系统的多个运行环境的错误日志进行监控,而无需针对不同运行环境配置不同的用于检测错误日志的参数,降低了错误日志监测的复杂度。
如前面的介绍,在本申请可以通过代码管理程序管理软件检测代码的代码标识,因此,软件运行系统的服务器可以代码管理程序获得该错误检测代码的代码标识。
在一种示例中,服务器可以将检测到的错误日志和标识信息生成一个错误日志文件,如,服务器可以采用Lua或者C++等脚本语言生成该错误日志文件,本申请对于服务器生成包含错误日志及其标识信息的文件所采用的语言不加限制。
可以理解的是,对照图6可知,以上步骤S701和S702为图6中错误日志打印所涉及到的相关处理。
S703,服务器向日志监控系统的至少一台存储设备发送携带有标识信息的错误日志。
在本申请实施例中,服务器无需区分错误日志,只需将错误日志生成文件之后上报给存储设备,有利于减少服务器侧处理错误日志对性能的影响。
S704,存储设备确定服务器所属的运行环境,并存储错误日志的标识信息对应的该错误日志信息。
其中,该错误日志信息可以包括错误日志以及产生该错误日志的运行环境。
可以理解的是,由于每种运行环境下可能会涉及多台服务器,为了能够明确产生该错误日志的运行环境及具体的服务器,存储设备还可以获得服务器的设备标识,如服务器的IP地址等,相应的,存储设备会向该标识信息对应的错误日志信息中存储错误日志产生的运行环境,上报该错误日志的服务器的IP地址等设备标识,以及错误日志产生的时间等等信息。
可以理解的是,存储设备还预先存储有不同错误检测代码的代码标识对应的基础属性信息,该基础属性信息可以包括负责该错误检测代码的负责人的信息,其中,负责人的信息可以包括负责人的姓名和负责人的通信账号等信息中的一种或者几种。
其中,在负责人的通信账号可以至少包括负责人的即时通讯账号的信息,负责人的即时通讯账号以及负责人的即时通讯账号所绑定的企业群组等等。
在一种可能的情况中,该基础属性信息还可以包括:具有该代码标识(或者说标识信息)的历史错误日志对应的历史处理措施等,对此不加限制。
在又一种可能的情况中,基础属性信息还可以包括:该错误检测代码对应的错误级别。
在一种实现方式中,不同运行环境的服务器可以调用存储设备中不同的日志调用接口上报错误日志,其中,不同的日志调用接口用于调用存储设备中不同的日志收集进程。相应的,存储设备根据服务器上报错误日志所调用的日志调用接口,可以确定服务器所属的运行环境。
以上步骤S703和S704为图6中日志收集分析相关的处理操作,结合图6中日志收集分析部分以及以上步骤S703和S704可知,存储设备可以获得多个不同运行环境上报的错误日志。同时,存储设备在收集到错误日志的标识信息、错误日志的内容以及错误日志产生的运行环境等信息之后,可以采用关系型数据库来存储错误日志的相关信息,例如,依据关系型数据库管理系统(MySQL)存储和管理错误日志及相关信息。
可以理解的是,采用MySQL等关系型数据库存储错误日志相关的信息仅仅是一种可能的实现方式,在实际应用中还可以通过其他数据存储形式存储错误日志及相关信息,本申请对此不加限制。
S705,日志监控设备从存储设备获得待处理的至少一条错误日志的错误日志信息。
如图6所示,日志监控设备从存储设备拉取错误日志信息。
如,日志监控设备可以基于设定的日志采集周期,周期性从存储设备获得待处理的错误日志信息。例如,日志监控设备可以每分钟从存储设备获取一次待处理的错误日志的错误日志信息。
其中,每条错误日志的错误日志信息包括错误日志的标识信息以及错误日志的日志内容,当然,还可以包括该产生该错误日志的运行环境以及该错误日志的IP地址等。
S706,日志监控设备依据各错误日志对应的运行环境,对至少一条错误日志进行归类,使得同一运行环境的错误日志被归类到一组。
如,日志监控设备可以各条错误日志的错误日志信息中记录的运行环境,可以确定出各条错误日志对应的运行环境,在此基础上,基于运行环境对各错误日志进行聚类。
S707,针对每条错误日志,日志监控设备依据该错误日志关联的标识信息,从存储设备获得该标识信息对应的错误检测代码的基础属性信息。
基础属性信息可以参见前面的介绍。
S708,针对每个运行环境,日志监控设备获得该运行环境的告警规则。
其中,告警规则可以存储到日志监控设备中。
该告警规则也可以是存储在存储设备中,在此基础上,日志监控设备需要从存储设备中获得该运行环境的告警规则。
可以理解的是,如果运行环境属于设定运行环境,可以获得该运行环境下不同种错误级别对应的告警规则。如果运行环境不属于设定运行环境,则可以获得适用于该运行环境下任意错误级别的错误日志的一套告警规则。
S709,针对每个运行环境中每条错误日志,日志监控设备依据错误日志的标识信息,获得该错误日志的详情信息。
如,在错误日志的详情信息可以包括前面错误日志的错误日志信息中记录的错误日志的日志内容、标识信息、产生错误日志的运行环境,以及产生错误日志的服务器的IP地址。还可以包括,该错误日志的标识信息对应的基础属性信息中错误检测代码、目标负责人的通信账号以及历史处理措施等。
S710,针对每个运行环境的每条错误日志,日志监控设备依据该运行环境对应的告警规则,向该错误日志的目标负责人对应的通信账号发送该错误日志的告警信息。
如图6所示,日志监控设备可以通过企业即时通讯、即时通讯、电话以及页面报表等形式发送告警信息。在图7中是以通信账号为即时通讯账号为例说明,对于其他告警信息的发送方式也同样适用。
本申请中具体告警方式可以参见前面实施例的相关介绍,在此不再赘述。
由图7可以看出,在本申请中,错误日志的产生以及监控告警处理的整个过程都无法人工参与,只需要人工对告警出的错误日志进行处理即可,从而避免了人工参与错误日志监控处理,降低了错误日志监控与处理的复杂度。
可以理解的是,在本申请以上任意一个实施例中,日志监控设备还可以获得目标负责人的终端发送的该目标负责人对于错误日志的处理状态结果,其中,处理状态结果用于表征错误日志的处理状态和该目标负责人解决错误日志所指示的错误所采用的处理措施中的一种或者两种。
如图5所示为目标负责人通过即时通讯应用发送针对错误日志回复的回复消息“我看下”和“已处理”分别表示了错误日志已启动处理,和已完成错误日志的处理两种处理状态。当然,还可以通过其他方式反馈对于错误日志的处理状态。类似的,目标负责人对于错误日志的处理措施也可以通过多种途径获得,对此不加限制。
相应的,日志监控设备可以存储错误日志对应的处理状态结果。如,在本地存储该错误日志的处理状态结果,也可以是存储到存储设备中。
在以上基础上,为了使得目标负责人以及相关人员能够查看到一定时间段内产生的错误日志及其相关信息,日志监控设备还可以在按照设定的统计汇报周期确定到达设定的统计汇报时刻时,获得该统计汇报周期内获得的至少一个错误日志的汇总信息。
其中,该至少一个错误日志的汇总信息包括该至少一个错误日志各自的日志内容、目标负责人的信息以及该至少一个错误日志的处理状态结果。当然,该汇总信息还可以包括前面提到的错误日志的详情信息,具体不加限制。
相应的,日志监控设备可以向该至少一个错误日志各自对应的目标负责人的通信账号发送至少一个错误日志的汇总信息。
在一种可选方式中,该至少一个错误日志的汇总信息可以为同一运行环境下产生的至少一个错误日志的汇总信息。
可以理解的是,该至少一个错误日志的汇总信息可以是分别发送给涉及到的各个目标负责人的通信账号,也可以是发送到包含该至少一个错误日志相关负责人的通信群组。
如,以错误检测代码的负责人的通信账号至少包括即时通讯账号为例,则可以将该至少一个错误日志的汇总信息发送到负责人的即时通讯账号所在的群组,从而使得该群组内的各个用户均可以查看到自己需要处理的错误日志的相关信息,也可以查看到全部错误日志的相关信息,以实现二次核查,避免遗漏错误日志的情况。
如图8,其示出了将汇总信息发送到即时通讯群组的一种示意图,在图8中以每日统计测试环境中涉及到的错误日志的告警汇总信息为例。
由图8可以看出,告警汇总信息包括7月12日测试环境产生各错误日志的标识信息、错误日志的错误信息(如错误日志的内容)、产生错误日志的机器的IP地址、错误日志出现次数(即数量)以及负责人等等信息。
同时,在即时通讯群组中会指示该告警汇总信息中各错误日志所涉及到的相关负责人为提醒对象,如图8会“@”相关负责人。
在图8中,即时通讯群组会采用图片形式显示出告警汇总信息,为了使得相关负责人可以能够更清楚的查看告警汇总信息,告警汇总信息的提醒消息还可以包括该告警汇总信息的链接地址,如图8中示出的链接地址“Http://ab###****········”。
如果用户在即时通讯界面中点击该链接地址,则可以采用网页形式呈现出包含该告警汇总信息的网页页面,如图9所示。
对应本申请的一种日志监控处理方法,本申请还提供了一种日志监控处理装置。如图10所示,其示出了本申请一种日志监控处理装置一个实施例的组成结构示意图,本实施例的装置可以包括:
日志获得单元1001,用于获得服务器上报的错误日志,该错误日志关联有该服务器为该错误日志添加的标识信息,且该标识信息为用于检测出该错误日志的错误检测代码的代码标识;
属性获得单元1002,用于依据该错误日志关联的标识信息,获得该错误检测代码的基础属性信息,该基础属性信息包括:该错误检测代码的目标负责人的通信账号;
告警发送单元1003,用于向该目标负责人的通信账号发送该错误日志的告警信息,以向该目标负责人通知该告警信息。
在一种可能的实现方式中,该装置还包括:
环境确定单元,用于在告警发送单元向该目标负责人的通信账号发送该错误日志的告警信息之前,确定该服务器所属的运行环境;
规则获得单元,用于获得该运行环境对应的告警规则;
告警发送单元,具体为,用于依据该告警规则,向该目标负责人的通信账号发送该错误日志的告警信息。
在一种可选方式中,属性获得单元获得的基础属性信息还包括:该错误检测代码的目标错误级别;
规则获得单元具体为,用于如该运行环境为设定运行环境,获得该运行环境下不同种错误级别对应的告警规则;
该告警发送单元包括:
告警发送子单元,用于依据该运行环境下该目标错误级别对应的告警规则,向该目标负责人的通信账号发送该错误日志的告警信息。
在又一种可能的实现方式中,该装置还包括:
详情获得单元,用于在告警发送单元向该目标负责人的通信账号发送该错误日志的告警信息之前,获得该错误日志的详情信息,该详情信息包括:该错误日志的日志内容,该错误日志的标识信息和上报该错误日志的服务器所属的运行环境;
该告警发送单元发送的该告警信息携带有该错误日志的详情信息。
在一种可选方式中,该基础属性信息还包括:具有该标识信息的历史错误日志对应的历史处理措施;
该错误日志的详情信息还包括:该历史错误日志的历史处理措施;
该装置还可以包括:
措施获得单元,用于在告警发送单元向该目标负责人的通信账号发送该错误日志的告警信息之后,获得该目标负责人的终端发送的该目标负责人处理该错误日志的处理措施;
措施存储单元,用于将该错误日志的处理措施存储到该标识信息对应的该基础属性信息中。
在又一种可能的实现方式中,该属性获得单元获得的基础属性信息包括:该目标负责人的至少一种通信账号,该至少一种通信账号包括:该目标负责人的即时通讯账号;
告警发送单元包括如下第一告警发送单元和第二告警发送单元中的至少一种:
第一告警发送单元,用于向该目标负责人的即时通讯账号发送该错误日志的告警消息;
第二告警发送单元,用于向该目标负责人的即时通讯账号所在的即时通讯群组发送该错误日志的告警消息,该告警消息指示该目标负责人的即时通讯账号为该告警消息的被提醒对象。
在一种可选方式中,该装置还包括:
回复获得单元,用于获得该目标负责人的即时通讯账号对应的即时通讯客户端针对该告警消息返回的回复消息,该回复消息包括消息引用部分和回复内容,该消息引用部分表征该回复内容针对的该告警消息中的至少部分内容;
信息更改单元,用于基于该消息引用部分和回复内容,更改该基础属性信息或者该告警规则。
在又一种可能的实现方式中,该属性获得单元获得的基础属性信息包括:该错误检测代码的目标负责人的信息,该目标负责人的信息包括该目标负责人的通信账号;
该装置还包括:
状态获得单元,用于在告警发送单元向该目标负责人的通信账号发送该错误日志的告警信息之后,获得该目标负责人的终端发送的该目标负责人对于该错误日志的处理状态结果,该处理状态结果用于表征该错误日志的处理状态和该目标负责人解决该错误日志所指示的错误所采用的处理措施中的一种或者两种;
状态存储单元,用于存储该错误日志对应的处理状态结果;
错误汇总单元,用于在按照设定的统计汇报周期确定到达设定的统计汇报时刻时,获得该统计汇报周期内获得的至少一个错误日志的汇总信息,该至少一个错误日志的汇总信息包括该至少一个错误日志各自的日志内容、目标负责人的信息以及该至少一个错误日志的处理状态结果;
汇总发送单元,用于向该至少一个错误日志各自对应的目标负责人的通信账号发送该至少一个错误日志的汇总信息。
又一方面,本申请还提供了一种服务器,该服务器可以为日志监控系统中的日志监控设备。如图11,其示出了本申请提供的服务器的一种组成架构示意图。在图11中,该服务器1100可以包括:处理器1101和存储器1102。
可选的,该服务器还可以包括:通信接口1103、输入单元1104和显示器1105和通信总线1106。
其中,处理器1101、存储器1102、通信接口1103、输入单元1104和显示器1105均通过通信总线1106完成相互间的通信。
在本申请实施例中,该处理器1101,可以为中央处理器,特定应用集成电路等。
该处理器可以调用存储器1102中存储的程序,具体的,处理器可以执行以上实施例中日志监控处理方法。
存储器1102中用于存放一个或者一个以上程序,程序可以包括程序代码,所述程序代码包括计算机操作指令,在本申请实施例中,该存储器中至少存储有用于实现以上任意一个实施例中日志监控处理方法的程序。
在一种可能的实现方式中,该存储器1102可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、以上所提到的程序,以及日志监控处理相关的应用程序等;存储数据区可存储根据服务器的使用过程中所创建的数据。
该通信接口1103可以为通信模块的接口。
本申请还可以包括输入单元1104,该输入单元可以包括触摸感应单元、键盘等等。
该显示器1105包括显示面板,如触摸显示面板等。
当然,图11所示的服务器结构并不构成对本申请实施例中服务器的限定,在实际应用中服务器可以包括比图11所示的更多或更少的部件,或者组合某些部件。
另一方面,本申请还提供了一种存储介质,该存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上任意一个实施例中的日志监控处理方法。
本申请还提出了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述日志监控处理方法方面或日志监控处理装置方面的各种可选实现方式中所提供方法,具体实现过程可以参照上述相应实施例的描述,不做赘述。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。同时,本说明书中各实施例中记载的特征可以相互替换或者组合,使本领域专业技术人员能够实现或使用本申请。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (12)

1.一种日志监控处理方法,其特征在于,包括:
获得服务器上报的错误日志,所述错误日志关联有所述服务器为所述错误日志添加的标识信息,且所述标识信息为用于检测出所述错误日志的错误检测代码的代码标识;
依据所述错误日志关联的标识信息,获得所述错误检测代码的基础属性信息,所述基础属性信息包括:所述错误检测代码的目标负责人的通信账号;
向所述目标负责人的通信账号发送所述错误日志的告警信息,以向所述目标负责人通知所述告警信息。
2.根据权利要求1所述的方法,其特征在于,在所述向所述目标负责人的通信账号发送所述错误日志的告警信息之前,还包括:
确定所述服务器所属的运行环境;
获得所述运行环境对应的告警规则;
所述向所述目标负责人的通信账号发送所述错误日志的告警信息,包括:
依据所述告警规则,向所述目标负责人的通信账号发送所述错误日志的告警信息。
3.根据权利要求2所述的方法,其特征在于,所述基础属性信息还包括:所述错误检测代码的目标错误级别;
获得所述运行环境对应的告警规则,包括:
如所述运行环境为设定运行环境,获得所述运行环境下不同种错误级别对应的告警规则;
所述依据所述告警规则,向所述目标负责人的通信账号发送所述错误日志的告警信息,包括:
依据所述运行环境下所述目标错误级别对应的告警规则,向所述目标负责人的通信账号发送所述错误日志的告警信息。
4.根据权利要求2所述的方法,其特征在于,在所述向所述目标负责人的通信账号发送所述错误日志的告警信息之前,还包括:
获得所述错误日志的详情信息,所述详情信息包括:所述错误日志的日志内容,所述错误日志的标识信息和上报所述错误日志的服务器所属的运行环境;
所述向所述目标负责人的通信账号发送所述错误日志的告警信息,包括:
向所述目标负责人的通信账号发送所述错误日志的告警信息,所述告警信息携带有所述错误日志的详情信息。
5.根据权利要求4所述的方法,其特征在于,所述基础属性信息还包括:具有所述标识信息的历史错误日志对应的历史处理措施;
所述错误日志的详情信息还包括:所述历史错误日志的历史处理措施;
在所述向所述目标负责人的通信账号发送所述错误日志的告警信息之后,还包括:
获得所述目标负责人的终端发送的所述目标负责人处理所述错误日志的处理措施;
将所述错误日志的处理措施存储到所述标识信息对应的所述基础属性信息中。
6.根据权利要求2所述的方法,其特征在于,所述基础属性信息包括:所述目标负责人的至少一种通信账号,所述至少一种通信账号包括:所述目标负责人的即时通讯账号;
所述向所述目标负责人的通信账号发送所述错误日志的告警信息包括如下至少一种:
向所述目标负责人的即时通讯账号发送所述错误日志的告警消息;
向所述目标负责人的即时通讯账号所在的即时通讯群组发送所述错误日志的告警消息,所述告警消息指示所述目标负责人的即时通讯账号为所述告警消息的被提醒对象。
7.根据权利要求6所述的方法,其特征在于,还包括:
获得所述目标负责人的即时通讯账号对应的即时通讯客户端针对所述告警消息返回的回复消息,所述回复消息包括消息引用部分和回复内容,所述消息引用部分表征所述回复内容针对的所述告警消息中的至少部分内容;
基于所述消息引用部分和回复内容,更改所述基础属性信息或者所述告警规则。
8.根据权利要求1或2所述的方法,其特征在于,所述基础属性信息包括:所述错误检测代码的目标负责人的信息,所述目标负责人的信息包括所述目标负责人的通信账号;
在所述向所述目标负责人的通信账号发送所述错误日志的告警信息之后,还包括:
获得所述目标负责人的终端发送的所述目标负责人对于所述错误日志的处理状态结果,所述处理状态结果用于表征所述错误日志的处理状态和所述目标负责人解决所述错误日志所指示的错误所采用的处理措施中的一种或者两种;
存储所述错误日志对应的处理状态结果;
在按照设定的统计汇报周期确定到达设定的统计汇报时刻时,获得所述统计汇报周期内获得的至少一个错误日志的汇总信息,所述至少一个错误日志的汇总信息包括所述至少一个错误日志各自的日志内容、目标负责人的信息以及所述至少一个错误日志的处理状态结果;
向所述至少一个错误日志各自对应的目标负责人的通信账号发送所述至少一个错误日志的汇总信息。
9.一种日志监控处理装置,其特征在于,包括:
日志获得单元,用于获得服务器上报的错误日志,所述错误日志关联有所述服务器为所述错误日志添加的标识信息,且所述标识信息为用于检测出所述错误日志的错误检测代码的代码标识;
属性获得单元,用于依据所述错误日志关联的标识信息,获得所述错误检测代码的基础属性信息,所述基础属性信息包括:所述错误检测代码的目标负责人的通信账号;
告警发送单元,用于向所述目标负责人的通信账号发送所述错误日志的告警信息,以向所述目标负责人通知所述告警信息。
10.一种日志监控处理系统,其特征在于,包括:
至少一台服务器,至少一台存储设备以及至少一台日志监控设备;
其中,所述服务器,用于基于错误检测代码从所述服务器产生的运行日志中确定错误日志,将所述错误检测代码的代码标识确定为所述错误日志的标识信息,并向所述存储设备发送携带有所述标识信息的错误日志;
所述存储设备,用于存储错误检测代码的代码标识对应的基础属性信息,并将所述服务器发送的错误日志的标识信息与所述错误日志对应存储,所述基础属性信息包括所述错误检测代码的目标负责人的通信账号;
所述日志监控设备,用于从存储设备获得所述错误日志;依据所述错误日志关联的标识信息,获得所述错误检测代码的基础属性信息;向所述目标负责人的通信账号发送所述错误日志的告警信息,以向所述目标负责人通知所述告警信息。
11.一种服务器,其特征在于,包括存储器和处理器;
其中,所述存储器用于存储程序;
所述处理器用于执行所述程序,所述程序被执行时,具体用于实现如权利要求1至8任意一项所述的日志监控处理方法。
12.一种存储介质,其特征在于,用于存储程序,所述程序被执行时,用于实现如权利要求1至8任意一项所述日志监控处理方法。
CN202110377398.0A 2021-04-08 2021-04-08 日志监控处理方法、装置、设备和存储介质 Pending CN115202953A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110377398.0A CN115202953A (zh) 2021-04-08 2021-04-08 日志监控处理方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110377398.0A CN115202953A (zh) 2021-04-08 2021-04-08 日志监控处理方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN115202953A true CN115202953A (zh) 2022-10-18

Family

ID=83571011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110377398.0A Pending CN115202953A (zh) 2021-04-08 2021-04-08 日志监控处理方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN115202953A (zh)

Similar Documents

Publication Publication Date Title
US8060782B2 (en) Root cause problem identification through event correlation
US9298525B2 (en) Adaptive fault diagnosis
US6792456B1 (en) Systems and methods for authoring and executing operational policies that use event rates
US7984334B2 (en) Call-stack pattern matching for problem resolution within software
CN112540811B (zh) 缓存数据的检测方法、装置、计算机设备和存储介质
CN110752969B (zh) 一种性能检测方法、装置、设备及介质
CN111752850B (zh) 区块链系统的测试方法及相关设备
CN114595127A (zh) 日志异常处理方法、装置、设备和存储介质
CN108259202A (zh) 一种ca监测预警方法和ca监测预警系统
CN113872828B (zh) 区块链预言机状态监控方法
CN112256593B (zh) 一种程序处理方法、装置、计算机设备和可读存储介质
CN111460031A (zh) 一种数据同步的方法、装置、设备和介质
KR20180037342A (ko) 어플리케이션 에러 모니터링 및 통계관리 서비스 및 방법
CN109542894A (zh) 用户数据集中存储方法、装置、介质和计算机设备
CN112202647B (zh) 区块链网络中的测试方法、装置及测试设备
CN113672452A (zh) 一种数据采集任务的运行监控方法、系统
CN112799868A (zh) 一种根因确定方法、装置、计算机设备及存储介质
CN112395125A (zh) 页面报错的通知方法、装置、计算机设备及存储介质
CN115202953A (zh) 日志监控处理方法、装置、设备和存储介质
ZHANG et al. Approach to anomaly detection in microservice system with multi-source data streams
CN116414594A (zh) 故障树更新方法、装置、计算机设备和存储介质
CN113946465A (zh) 一种大数据的故障处理方法及其相关设备
CN113138896A (zh) 一种应用运行情况的监控方法、装置和设备
CN113742400A (zh) 一种基于自适应约束条件的网络数据获取系统及方法
CN115701078A (zh) 跨链交易处理方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination