CN115146120A - 日志解析的方法和装置 - Google Patents
日志解析的方法和装置 Download PDFInfo
- Publication number
- CN115146120A CN115146120A CN202210890934.1A CN202210890934A CN115146120A CN 115146120 A CN115146120 A CN 115146120A CN 202210890934 A CN202210890934 A CN 202210890934A CN 115146120 A CN115146120 A CN 115146120A
- Authority
- CN
- China
- Prior art keywords
- log
- regular expression
- monitoring
- fields
- monitored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本说明书实施例提供一种日志解析的方法和装置,方法包括:获取第一日志的日志实例;所述第一日志为标准化日志,其包括多个字段,相邻字段间通过第一符号来进行字段分割;查找所述日志实例中的各个第一符号,将相邻的两个第一符号之间的日志确定为一个捕获字段;根据各个捕获字段,生成用于监测所述第一日志的正则表达式,所述正则表达式包括待监测字符串。能够确保解析的准确性和效率。
Description
技术领域
本说明书一个或多个实施例涉及计算机领域,尤其涉及日志解析的方法和装置。
背景技术
网络设备、系统及服务程序等,在运行时都会产生一个叫日志(log)的事件记录;每一条记录都记载着日期、时间、使用者、动作或运行参数等相关操作的描述。以系统日志为例,通常是指系统所指定对象的某些操作和其操作结果按时间有序的集合。每个日志文件由日志记录组成,每条日志记录描述了一次单独的系统事件。通常情况下,系统日志是用户可以直接阅读的文本文件,其中包含了一个时间戳和一个信息或者子系统所特有的其他信息。
为了实现对网络设备、系统及服务程序等自身各类指标的可监测、可告警,通过日志解析来实现监测是通用方案。由于不同的日志记载的内容不同,现有技术中,通过人工编写的程序实现特定日志的日志解析,以实现对某些指标的监测,解析的准确性和效率都得不到保障。
发明内容
本说明书一个或多个实施例描述了一种日志解析的方法和装置,能够确保解析的准确性和效率。
第一方面,提供了一种日志解析的方法,方法包括:
获取第一日志的日志实例;所述第一日志为标准化日志,其包括多个字段,相邻字段间通过第一符号来进行字段分割;
查找所述日志实例中的各个第一符号,将相邻的两个第一符号之间的日志确定为一个捕获字段;
根据各个捕获字段,生成用于监测所述第一日志的正则表达式,所述正则表达式包括待监测字符串。
在一种可能的实施方式中,所述生成用于监测所述第一日志的正则表达式,包括:
将各个捕获字段展示给用户;
接收用户的选择指令,根据所述选择指令从所述各个捕获字段中选择出至少一个第一捕获字段;
将所述至少一个第一捕获字段分别作为待监测字符串,生成用于监测所述第一日志的正则表达式。
进一步地,所述方法还包括:
接收用户的合并指令,根据所述合并指令将相邻的两个捕获字段合并为一个所述第一捕获字段。
在一种可能的实施方式中,所述生成用于监测所述第一日志的正则表达式之后,所述方法还包括:
响应于第一用户指令,指定所述待监测字符串的长度范围。
在一种可能的实施方式中,所述生成用于监测所述第一日志的正则表达式之后,所述方法还包括:
响应于第二用户指令,修改所述第一日志中的与所述待监测字符串对应的字段名称。
在一种可能的实施方式中,所述生成用于监测所述第一日志的正则表达式之后,所述方法还包括:
将所述正则表达式提供给数据采集器,以使所述数据采集器将所述第一日志与所述正则表达式中的待监测字符串进行匹配,以获取监测结果。
第二方面,提供了一种日志解析的装置,装置包括:
获取单元,用于获取第一日志的日志实例;所述第一日志为标准化日志,其包括多个字段,相邻字段间通过第一符号来进行字段分割;
查找单元,用于查找所述获取单元获取的日志实例中的各个第一符号,将相邻的两个第一符号之间的日志确定为一个捕获字段;
生成单元,用于根据所述查找单元得到的各个捕获字段,生成用于监测所述第一日志的正则表达式,所述正则表达式包括待监测字符串。
第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
通过本说明书实施例提供的方法和装置,首先获取第一日志的日志实例;所述第一日志为标准化日志,其包括多个字段,相邻字段间通过第一符号来进行字段分割;然后查找所述日志实例中的各个第一符号,将相邻的两个第一符号之间的日志确定为一个捕获字段;最后根据各个捕获字段,生成用于监测所述第一日志的正则表达式,所述正则表达式包括待监测字符串。由上可见,本说明书实施例,采用正则表达式来监测第一日志,并且正则表达式的生成基于对日志实例的解析而得到,与纯人工手写的方式得到正则表达式相比,能够确保解析的准确性和效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书披露的一个实施例的实施场景示意图;
图2示出根据一个实施例的日志解析的方法流程图;
图3示出根据一个实施例的日志解析的装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1为本说明书披露的一个实施例的实施场景示意图。该实施场景涉及日志解析,日志解析所针对的对象为标准化日志,其包括多个字段,相邻字段间通过预定符号来进行字段分割,其中,预定符号可以为分隔符或者特殊符号。参照图1,一个标准化日志中包括的字段分别为:时间、用户id、api名、关键参数、是否成功、执行时间。该日志中,各个字段之间通过空格分割。本说明书实施例,可以通过正则表达式监测该标准化日志,例如,通过正则表达式提取其中的字段,再基于提取的字段生成诸如展示用户某一段时间内调用api成功率的图表。
正则表达式,又称规则表达式,是一种文本模式,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式或规则的文本。
与通常地人工手写得到正则表达式的方式不同,本说明书实施例,通过快捷解析日志生成正则表达式,实现日志的标准化解析,确保生成正则表达式的准确性和减轻研发人员的工作量。
本说明书实施例提供的方案,可以应用于公有云场景,也可以应用于专有云场景,例如,可以实现智科产品专有云输出后,对产品自身各类指标的可监测、可告警。
图2示出根据一个实施例的日志解析的方法流程图,该方法可以基于图1所示的实施场景。如图2所示,该实施例中日志解析的方法包括以下步骤:步骤21,获取第一日志的日志实例;所述第一日志为标准化日志,其包括多个字段,相邻字段间通过第一符号来进行字段分割;步骤22,查找所述日志实例中的各个第一符号,将相邻的两个第一符号之间的日志确定为一个捕获字段;步骤23,根据各个捕获字段,生成用于监测所述第一日志的正则表达式,所述正则表达式包括待监测字符串。下面描述以上各个步骤的具体执行方式。
首先在步骤21,获取第一日志的日志实例;所述第一日志为标准化日志,其包括多个字段,相邻字段间通过第一符号来进行字段分割。可以理解的是,第一日志为具有一定数据格式的某一类日志,可以但不限于为应用程序日志、安全日志、系统日志中的任意一种。
本说明书实施例,第一日志可以包括多条记录,日志实例可以是上述多条记录中的任意一条记录。
其中,前述第一符号为预定符号,可以为分隔符或者特殊符号,例如,空格、*、#等等。
然后在步骤22,查找所述日志实例中的各个第一符号,将相邻的两个第一符号之间的日志确定为一个捕获字段。可以理解的是,第一符号通常为分隔符或者特殊符号,日志的各个字段中通常不会包含该第一符号。
本说明书实施例,由于日志示例包括多个字段,相应地,得到的捕获字段也为多个,其中,可能存在需要监测的字段和不需要监测的字段。
最后在步骤23,根据各个捕获字段,生成用于监测所述第一日志的正则表达式,所述正则表达式包括待监测字符串。可以理解的是,各个捕获字段通常是不需要全部监测的,在得到各个捕获字段之后,至少需要对各个捕获字段进行筛选,筛选出需要监测的捕获字段,基于筛选出的捕获字段,生成用于监测所述第一日志的正则表达式。
本说明书实施例,可以基于预设规则对各个捕获字段进行筛选,也可以采用人工筛选的方式对各个捕获字段进行筛选。
在一个示例中,所述生成用于监测所述第一日志的正则表达式,包括:
将各个捕获字段展示给用户;
接收用户的选择指令,根据所述选择指令从所述各个捕获字段中选择出至少一个第一捕获字段;
将所述至少一个第一捕获字段分别作为待监测字符串,生成用于监测所述第一日志的正则表达式。
该示例中,采用人工筛选的方式对各个捕获字段进行筛选,由于各个捕获字段是通过日志解析获得的,各个捕获字段的准确性能够得到保障,并且效率较高,用户只需从其中进行选择即可,大大减轻了用户的工作量。
进一步地,所述方法还包括:
接收用户的合并指令,根据所述合并指令将相邻的两个捕获字段合并为一个所述第一捕获字段。
该示例中,针对日志的字段内部也有第一符号的情况,在步骤22中会将该字段划分成多个捕获字段,通过合并的方式可以对该情况进行修正。
在一个示例中,所述生成用于监测所述第一日志的正则表达式之后,所述方法还包括:
响应于第一用户指令,指定所述待监测字符串的长度范围。
该示例中,通过指定所述待监测字符串的长度范围,能够显著提升正则表达式的解析速度。
在一个示例中,所述生成用于监测所述第一日志的正则表达式之后,所述方法还包括:
响应于第二用户指令,修改所述第一日志中的与所述待监测字符串对应的字段名称。
该示例中,通过用户指令,可以进一步优化正则表达式。
在一个示例中,所述生成用于监测所述第一日志的正则表达式之后,所述方法还包括:
将所述正则表达式提供给数据采集器,以使所述数据采集器将所述第一日志与所述正则表达式中的待监测字符串进行匹配,以获取监测结果。
该示例中,数据采集器支持正则表达式解析,其可以安装于服务器上,在获取监测结果之后,还可以将监测结果上传到监测平台。
通过本说明书实施例提供的方法,首先获取第一日志的日志实例;所述第一日志为标准化日志,其包括多个字段,相邻字段间通过第一符号来进行字段分割;然后查找所述日志实例中的各个第一符号,将相邻的两个第一符号之间的日志确定为一个捕获字段;最后根据各个捕获字段,生成用于监测所述第一日志的正则表达式,所述正则表达式包括待监测字符串。由上可见,本说明书实施例,采用正则表达式来监测第一日志,并且正则表达式的生成基于对日志实例的解析而得到,与纯人工手写的方式得到正则表达式相比,能够确保解析的准确性和效率。
根据另一方面的实施例,还提供一种日志解析的装置,该装置用于执行本说明书实施例提供的方法。图3示出根据一个实施例的日志解析的装置的示意性框图。如图3所示,该装置300包括:
获取单元31,用于获取第一日志的日志实例;所述第一日志为标准化日志,其包括多个字段,相邻字段间通过第一符号来进行字段分割;
查找单元32,用于查找所述获取单元31获取的日志实例中的各个第一符号,将相邻的两个第一符号之间的日志确定为一个捕获字段;
生成单元33,用于根据所述查找单元32得到的各个捕获字段,生成用于监测所述第一日志的正则表达式,所述正则表达式包括待监测字符串。
可选地,作为一个实施例,所述生成单元33包括:
展示子单元,用于将各个捕获字段展示给用户;
接收子单元,用于接收用户的选择指令,根据所述选择指令从所述展示子单元展示的各个捕获字段中选择出至少一个第一捕获字段;
生成子单元,用于将所述接收子单元得到的至少一个第一捕获字段分别作为待监测字符串,生成用于监测所述第一日志的正则表达式。
进一步地,所述接收子单元,还用于接收用户的合并指令,根据所述合并指令将相邻的两个捕获字段合并为一个所述第一捕获字段。
可选地,作为一个实施例,所述装置还包括:
指定单元,用于在所述生成单元33生成用于监测所述第一日志的正则表达式之后,响应于第一用户指令,指定所述待监测字符串的长度范围。
可选地,作为一个实施例,所述装置还包括:
修改单元,用于在所述生成单元33生成用于监测所述第一日志的正则表达式之后,响应于第二用户指令,修改所述第一日志中的与所述待监测字符串对应的字段名称。
可选地,作为一个实施例,所述装置还包括:
提供单元,用于在所述生成单元33生成用于监测所述第一日志的正则表达式之后,将所述正则表达式提供给数据采集器,以使所述数据采集器将所述第一日志与所述正则表达式中的待监测字符串进行匹配,以获取监测结果。
通过本说明书实施例提供的装置,首先获取单元31获取第一日志的日志实例;所述第一日志为标准化日志,其包括多个字段,相邻字段间通过第一符号来进行字段分割;然后查找单元32查找所述日志实例中的各个第一符号,将相邻的两个第一符号之间的日志确定为一个捕获字段;最后生成单元33根据各个捕获字段,生成用于监测所述第一日志的正则表达式,所述正则表达式包括待监测字符串。由上可见,本说明书实施例,采用正则表达式来监测第一日志,并且正则表达式的生成基于对日志实例的解析而得到,与纯人工手写的方式得到正则表达式相比,能够确保解析的准确性和效率。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所描述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (14)
1.一种日志解析的方法,所述方法包括:
获取第一日志的日志实例;所述第一日志为标准化日志,其包括多个字段,相邻字段间通过第一符号来进行字段分割;
查找所述日志实例中的各个第一符号,将相邻的两个第一符号之间的日志确定为一个捕获字段;
根据各个捕获字段,生成用于监测所述第一日志的正则表达式,所述正则表达式包括待监测字符串。
2.如权利要求1所述的方法,其中,所述生成用于监测所述第一日志的正则表达式,包括:
将各个捕获字段展示给用户;
接收用户的选择指令,根据所述选择指令从所述各个捕获字段中选择出至少一个第一捕获字段;
将所述至少一个第一捕获字段分别作为待监测字符串,生成用于监测所述第一日志的正则表达式。
3.如权利要求2所述的方法,其中,所述方法还包括:
接收用户的合并指令,根据所述合并指令将相邻的两个捕获字段合并为一个所述第一捕获字段。
4.如权利要求1所述的方法,其中,所述生成用于监测所述第一日志的正则表达式之后,所述方法还包括:
响应于第一用户指令,指定所述待监测字符串的长度范围。
5.如权利要求1所述的方法,其中,所述生成用于监测所述第一日志的正则表达式之后,所述方法还包括:
响应于第二用户指令,修改所述第一日志中的与所述待监测字符串对应的字段名称。
6.如权利要求1所述的方法,其中,所述生成用于监测所述第一日志的正则表达式之后,所述方法还包括:
将所述正则表达式提供给数据采集器,以使所述数据采集器将所述第一日志与所述正则表达式中的待监测字符串进行匹配,以获取监测结果。
7.一种日志解析的装置,所述装置包括:
获取单元,用于获取第一日志的日志实例;所述第一日志为标准化日志,其包括多个字段,相邻字段间通过第一符号来进行字段分割;
查找单元,用于查找所述获取单元获取的日志实例中的各个第一符号,将相邻的两个第一符号之间的日志确定为一个捕获字段;
生成单元,用于根据所述查找单元得到的各个捕获字段,生成用于监测所述第一日志的正则表达式,所述正则表达式包括待监测字符串。
8.如权利要求7所述的装置,其中,所述生成单元包括:
展示子单元,用于将各个捕获字段展示给用户;
接收子单元,用于接收用户的选择指令,根据所述选择指令从所述展示子单元展示的各个捕获字段中选择出至少一个第一捕获字段;
生成子单元,用于将所述接收子单元得到的至少一个第一捕获字段分别作为待监测字符串,生成用于监测所述第一日志的正则表达式。
9.如权利要求8所述的装置,其中,所述接收子单元,还用于接收用户的合并指令,根据所述合并指令将相邻的两个捕获字段合并为一个所述第一捕获字段。
10.如权利要求7所述的装置,其中,所述装置还包括:
指定单元,用于在所述生成单元生成用于监测所述第一日志的正则表达式之后,响应于第一用户指令,指定所述待监测字符串的长度范围。
11.如权利要求7所述的装置,其中,所述装置还包括:
修改单元,用于在所述生成单元生成用于监测所述第一日志的正则表达式之后,响应于第二用户指令,修改所述第一日志中的与所述待监测字符串对应的字段名称。
12.如权利要求7所述的装置,其中,所述装置还包括:
提供单元,用于在所述生成单元生成用于监测所述第一日志的正则表达式之后,将所述正则表达式提供给数据采集器,以使所述数据采集器将所述第一日志与所述正则表达式中的待监测字符串进行匹配,以获取监测结果。
13.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-6中任一项的所述的方法。
14.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-6中任一项的所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210890934.1A CN115146120A (zh) | 2022-07-27 | 2022-07-27 | 日志解析的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210890934.1A CN115146120A (zh) | 2022-07-27 | 2022-07-27 | 日志解析的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115146120A true CN115146120A (zh) | 2022-10-04 |
Family
ID=83414960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210890934.1A Pending CN115146120A (zh) | 2022-07-27 | 2022-07-27 | 日志解析的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115146120A (zh) |
-
2022
- 2022-07-27 CN CN202210890934.1A patent/CN115146120A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106656536B (zh) | 一种用于处理服务调用信息的方法与设备 | |
CN106815125A (zh) | 一种日志审计方法及平台 | |
US20180357214A1 (en) | Log analysis system, log analysis method, and storage medium | |
US12120170B1 (en) | Presenting un-deployed features of an application | |
CN110569214A (zh) | 用于日志文件的索引构建方法、装置及电子设备 | |
US8095514B2 (en) | Treemap visualizations of database time | |
EP2498186A1 (en) | Operation management device and operation management method | |
US10567557B2 (en) | Automatically adjusting timestamps from remote systems based on time zone differences | |
US7913233B2 (en) | Performance analyzer | |
US20110054964A1 (en) | Automatic Documentation of Ticket Execution | |
CN111796809A (zh) | 接口文档生成方法、装置、电子设备及介质 | |
CN114528457A (zh) | Web指纹检测方法及相关设备 | |
KR20190058141A (ko) | 문서로부터 추출되는 데이터를 생성하는 방법 및 그 장치 | |
WO2017164856A1 (en) | Comparable user interface object identifications | |
CN114936269A (zh) | 文档搜索平台、搜索方法、装置、电子设备及存储介质 | |
JP4928848B2 (ja) | 計算機システム統合管理環境におけるメッセージ変換装置 | |
CN113704216A (zh) | 系统日志处理方法、装置、计算机设备和存储介质 | |
CN108989074A (zh) | 程序升级方法和程序升级装置 | |
CN115146120A (zh) | 日志解析的方法和装置 | |
CN113641523B (zh) | 一种日志处理方法及装置 | |
CN111817867A (zh) | 分布式环境下进行多日志协同分析的方法及系统 | |
JP2006099249A (ja) | 障害管理装置および障害管理方法 | |
CN115310011A (zh) | 页面展示方法、系统以及可读存储介质 | |
US20180365123A1 (en) | Test execution comparisons | |
JP5444071B2 (ja) | 障害情報収集システムと方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |