CN113553309A - 一种日志模板的确定方法、装置、电子设备及存储介质 - Google Patents
一种日志模板的确定方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113553309A CN113553309A CN202110859470.3A CN202110859470A CN113553309A CN 113553309 A CN113553309 A CN 113553309A CN 202110859470 A CN202110859470 A CN 202110859470A CN 113553309 A CN113553309 A CN 113553309A
- Authority
- CN
- China
- Prior art keywords
- log
- template
- processed
- matching rule
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012545 processing Methods 0.000 claims description 32
- 125000004122 cyclic group Chemical group 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 abstract description 24
- 238000004364 calculation method Methods 0.000 description 16
- 238000012549 training Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 3
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/1805—Append-only file systems, e.g. using logs or journals to store data
- G06F16/1815—Journaling file systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明实施例公开了一种日志模板的确定方法、装置、电子设备及存储介质。日志模板的确定方法,包括:在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则;采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作;如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作;在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。本发明实施例的技术方案能够降低日志模板提取的计算复杂度,提高日志模板提取的通用性。
Description
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种日志模板的确定方法、装置、电子设备及存储介质。
背景技术
日志记录了系统运行期间大量的有价值的信息,系统的后期维护也是以查看日志为主要手段,日志在系统开发和运维过程中扮演了重要的角色。
其中,日志模板的提取是日志分析中非常重要的一环,通过提取日志的模板可以对日志进行聚类,使得同类日志属于相同模板。一般来说,正常日志占据了绝大部分,异常日志很少。通过模板进行聚类以后,运维人员可以将注意力集中于那些日志较少的模板上,快速找到想要的信息。除了能够对日志进行聚类以外,日志的模板提取还是基于数据驱动的日志分析的前置步骤,将半结构化的日志结构化,方便后续日志分析。比如提取出日志的模板后,可以进一步提取出变量。由于变量可能表明系统的某些运行指标,因此通过对变量的分析可以进行系统的异常检测。
但是传统的日志模板提取方法往往需要一个线下的训练过程。通常是收集系统运行初期一段时间内的运行日志,然后利用这些日志训练一个模型,最后将这个训练得到的模型用于线上日志的模板提取。但这种方法存在几个问题,(1)针对不同的系统都需要训练模型,这导致了模型训练较为繁琐,且计算复杂度较高的问题。(2)初期阶段收集到的日志不一定能够覆盖系统中所有事件对应的日志,例如,系统初期运行阶段不一定能够运行到所有可能的逻辑流。(3)系统通常是需要迭代更新的,更新极有可能导致日志的变化,而初期收集到的日志没有包含这些新的日志,模型无法对这些新日志进行分析预测,使得模型的通用性较差,易用性也大打折扣。
发明内容
本发明实施例提供一种日志模板的确定方法、装置、电子设备及存储介质,在不进行模型训练的前提下,降低了日志模板提取的计算复杂度,提高日志模板提取的通用性。
第一方面,本发明实施例提供了一种日志模板的确定方法,包括:
在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则;
采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作;
如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作;
在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。
第二方面,本发明实施例还提供了一种日志模板的确定装置,包括:
目标匹配规则获取模块,用于在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则;
匹配处理模块,用于采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作;
循环执行模块,用于如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作;
日志模板库更新模块,用于在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。
第三方面,本发明实施例还提供了一种电子设备,电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本发明任意实施例所提供的日志模板的确定方法。
第四方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的日志模板的确定方法。
本实施例的技术方案,通过在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则,进而采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作。如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作。在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。本方案无需训练用于识别日志模板的模型,直接利用不同的匹配规则即可实现对待处理日志的日志模板的确定,对于系统更新后产生的新的日志也能确定与之匹配的日志模板,并且通过不同的目标匹配规则去确定与待处理日志匹配的日志模板可以避免单一匹配规则所导致的计算复杂度较高,或者单一匹配规则匹配效果较差的问题,解决了现有技术中日志模板提取模型训练繁琐、计算复杂度高,且通用性较差的问题,能够在不进行模型训练的前提下,降低日志模板提取的计算复杂度,提高日志模板提取的通用性。
附图说明
图1是本发明实施例一提供的一种日志模板的确定方法的流程图;
图2是本发明实施例二提供的一种模板前缀树的示意图;
图3是本发明实施例二提供的一种日志模板的确定方法的示意图;
图4是本发明实施例三提供的一种日志模板的确定装置的示意图;
图5为本发明实施例四提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1是本发明实施例一提供的一种日志模板的确定方法的流程图,本实施例可适用于对日志模板的高效提取的情况,该方法可以由日志模板的确定装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在电子设备中。相应的,如图1所示,该方法包括如下操作:
S110、在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则。
其中,待处理日志可以是从任意终端获取的日志。匹配规则库可以是存储有多个匹配规则的数据库。目标匹配规则可以是在匹配规则库中能够进行选择的,当前优先级最高的匹配规则。需要说明的是,当匹配规则库中的匹配规则A被选定为目标匹配规则之后,需要再次从匹配规则库中选择目标匹配规则时,匹配规则A不会再被选定为目标匹配规则。
在本发明实施例中,在接收到待处理日志时,可以首先确定匹配规则库中各匹配规则的优先级顺序,进而按照各匹配规则的优先级顺序将匹配规则库中能够进行选择的,当前优先级最高的匹配规则作为目标匹配规则。
在本发明的一个可选实施例中,匹配规则库中可以包括:模板前缀树匹配规则、最简单循环匹配规则以及最长公共子序列匹配规则。
其中,模板前缀树匹配规则可以用于按照模板前缀树,对待处理日志和日志模板进行匹配。模板前缀树可以是由日志模板中的字符组成的字典树,用于有序存储日志模板中的字符数据。最简单循环匹配规则可以用于根据数据指针对待处理日志和日志模板进行匹配。最长公共子序列匹配规则可以用于根据待处理日志与日志模板的最长公共字符,对待处理日志与日志模板进行匹配。模板前缀树匹配规则的优先级高于最简单循环匹配规则,最简单循环匹配规则的优先级高于最长公共子序列匹配规则。本发明实施例对匹配规则库中的具体匹配规则类型不做限定,即匹配规则库中可以包括模板前缀树匹配规则、最简单循环匹配规则以及最长公共子序列匹配规则之外的匹配规则。
S120、采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作。
其中,日志模板库可以是存储有多个日志模板的数据库。日志模板可以用于表征同类日志的固有格式。例如,一条日志模板可以代表一类系统事件。
在本发明实施例中,在得到目标匹配规则之后,可以根据目标匹配规则对待处理日志的字符,和日志模板库中的各日志模板的字符进行匹配操作,以确定日志模板库中是否存在与待处理日志匹配的日志模板。
S130、如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作。
在本发明实施例中,如果根据当前目标匹配规则无法获取与待处理日志匹配的日志模板,则可以根据匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中确定需要与待处理日志进行匹配操作的另一目标匹配规则,进而根据再次确定的目标匹配规则,执行将待处理日志和日志模板库中各日志模板进行匹配的操作。
S140、在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。
在本发明实施例中,当按照各匹配规则优先级顺序,采用所有匹配规则执行待处理日志与各日志模板的匹配操作之后,均未能获取与待处理日志匹配的日志模板时,可以将待处理日志作为新的日志模板,并将新的日志模板存入日志模板库中。
在本发明的一个可选实施例中,将待处理日志作为新的日志模板加入至日志模板库之后,还可以包括:根据待处理日志字符更新模板前缀树。
在本发明实施例中,将待处理日志作为新的日志模板添加到日志模板库之后,可以进一步将待处理日志的字符转化为一条有由根节点和叶子节点组成的路径,进而将与待处理日志对应的路径添加至模板前缀树中。
本实施例的技术方案,通过在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则,进而采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作。如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作。在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。本方案无需训练用于识别日志模板的模型,直接利用不同的匹配规则即可实现对待处理日志的日志模板的确定,对于系统更新后产生的新的日志也能确定与之匹配的日志模板,并且通过不同的目标匹配规则去确定与待处理日志匹配的日志模板可以避免单一匹配规则所导致的计算复杂度较高的问题,解决了现有技术中日志模板提取模型训练繁琐、计算复杂度高,且通用性较差的问题,能够在不进行模型训练的前提下,降低日志模板提取的计算复杂度,提高日志模板提取的通用性。
实施例二
本实施例以上述实施例为基础进行具体化,在本实施例中,给出了采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作,以及对日志模板和模板前缀树进行更新的具体的可选的实施方案。
最长公共子序列的复杂度是O(n2),若有m个日志模板,利用最长公共子序列匹配规则确定与待处理日志模板匹配的日志模板时,计算复杂度会达到O(mn2)。而随着日志模板的不断积累,日志模板库会趋于稳定。日志模板库中的日志模板基本不变,不会增加新的日志模板,也不会更新旧有日志模板。待处理日志与旧有日志模板的最长公共子序列会与旧有日志模板一样,即旧有日志模板构成了新日志的子序列。因此,在利用最长公共子序列匹配规则确定与待处理日志匹配的日志模板时,可以利用计算复杂度较低的前置规则确定日志模板与待处理日志的匹配情况,在日志模板的字符串长度占待处理日志全部字符串长度的比例超过比例阈值的情况下,确定该日志模板与待处理日志匹配。
在本发明的一个可选实施例中,采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作,可以包括:在当前获取的目标匹配规则为模板前缀树匹配规则时,获取与日志模板库匹配的模板前缀树;顺序将模板前缀树包括的各条路径与待处理日志进行匹配,并在确定待处理日志与目标路径完全匹配时,计算目标路径的字符串长度占待处理日志中全部字符串长度的比例;如果比例超过预设的比例阈值,则确定待处理日志与目标路径对应的日志模板相匹配;否则,确定未能获取与待处理日志匹配的日志模板。
其中,比例阈值可以是预先设定的数值,用于判断待处理日志与日志模板是否匹配。模板前缀树的一条路径对应日志模板库中的一个日志模板,每个路径中的各路径节点对应日志模板中包括的不同字符。目标路径可以是与待处理日志能够完全匹配的模板前缀树中的路径。模板前缀树匹配规则的计算复杂度是O(n)。
在本发明实施例中,如果当前获取的目标匹配规则为模板前缀树匹配规则,则进一步确定与日志模板库匹配的模板前缀树。在获取到与日志模板库匹配的模板前缀树之后,可以进一步对待处理日志中的字符进行解析,并顺序将模板前缀树的各条路径所包括的字符与将待处理日志的字符进行匹配操作。在待处理日志与目标路径完全匹配时,可以计算目标路径所包括的字符串长度以及待处理日志的全部字符串长度,进一步计算目标路径的字符串长度占待处理日志中全部字符串长度的比例。如果目标路径的字符串长度占待处理日志中全部字符串长度的比例超过预设的比例阈值,则可以确定待处理日志与目标路径对应的日志模板相匹配,也即待处理日志属于与目标路径对应的日志模板。如果目标路径的字符串长度占待处理日志中全部字符串长度的比例低于预设的比例阈值,则可以确定根据模板前缀树匹配规则无法获取与待处理日志对应的日志模板。
需要说明的是,当根据模板前缀树匹配规则确定与待处理日志匹配的日志模板时,一旦目标路径被确定就不会将待处理日志与模板前缀树中的其他路径进行匹配。示例性的,假设待处理日志为XAYBC,模板前缀树包括两条路径分别为:根节点-X-Y,根节点-A-B-C。待处理日志中的首个字符与X匹配,则待处理日志与根节点-X-Y这条路径继续匹配,不会再与其他路径进行匹配。待处理日志中的A无法与路径中的Y匹配,会跳过A由待处理日志中的Y与路径中的Y匹配。由于Y是路径根节点-X-Y的根节点,因此与待处理日志完全匹配的目标路径为根节点-X-Y。
图2是本发明实施例二提供的一种模板前缀树的示意图,在一个具体的例子中,如图2所示,模板前缀树包括4条路径,分别为根节点-A-C-G、根节点-A-D-H、根节点-A-E以及根节点-B-F。假设待处理日志为ACXG,按照模板前缀树匹配规则,顺序将模板前缀树包括的各条路径与待处理日志的单词序列进行匹配。由于待处理日志中的首个字符为A,则可以将与根节点相邻的字符为A的路径进行下个字符的匹配。模板前缀树中的根节点-A-C-G与待处理日志的单词序列进行匹配时,待处理日志中的A和C能够与该路径中的前两个字符相匹配,而待处理日志中的X无法与路径中下一字符G匹配,可以跳过待处理日志中的X,用待处理日志中的G与路径中下一个字符G进行匹配。由于G是该路径的叶子节点(该路径的最后一个节点),可以判定待处理日志与该路径完全匹配。
在本发明的一个可选实施例中,采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作,可以包括:在当前获取的目标匹配规则为最简单循环匹配规则时,依次从日志模板库中获取当前处理日志模板;创建第一指针和第二指针分别指向待处理日志和当前处理日志模板的首个字符;迭代执行在第一指针和第二指针所指向的字符相同时,同时将第一指针和第二指针指向下一字符,并在第一指针和第二指针所指向的字符不同时,仅将第一指针指向下一字符的操作;在第一指针移动至待处理日志的末位字符时,检测第二指针是否位于当前处理日志模板的末位字符;若是,则在当前处理日志模板的字符串长度占待处理日志中全部字符串长度的比例超过预设的比例阈值的情况下,确定待处理日志与当前处理日志模板相匹配;否则,返回执行依次从日志模板库中获取当前处理日志模板的操作,并在确定全部日志模板均与待处理日志不匹配时,确定未能获取与待处理日志匹配的日志模板。
其中,第一指针可以是指向待处理日志中字符的数据指针。第二指针可以是指向当前处理日志模板中的字符的数据指针。当前处理日志模板可以是当前需要与待处理日志进行匹配操作的日志模板。
在本发明实施例中,如果根据模板前缀树匹配规则无法确定与待处理日志匹配的日志模板,则可以将最简单循环匹配规则作为当前的目标匹配规则,并依次从日志模板库中获取当前处理日志模板。在得到当前处理日志模板之后,可以创建第一指针以及第二指针。在初始状态下,第一指针指向待处理日志的首个字符,第二指针指向当前处理日志模板的首个字符。迭代执行在第一指针指向的字符与第二指针指向的字符相同时,将第一指针指向待处理日志的下一个字符,并将第二指针指向当前处理日志模板的下一个字符。在第一指针指向的字符与第二指针指向的字符不相同时,仅将第一指针指向下一个字符,第二指针指向的字符不变。如果第一指针指向的是待处理日志的末位字符,则进一步检测第二指针所指向的字符是否位于当前处理日志模板的末位字符。如果第一指针与第二指针分别指向待处理日志和当前处理日志模板的末位字符,则进一步计算当前处理日志模板的字符串长度占待处理日志中全部字符串长度的比例,在当前处理日志模板的字符串长度占待处理日志中全部字符串长度的比例超过预设的比例阈值的情况下,可以确定待处理日志与当前处理日志模板相匹配。如果第一指针指向待处理日志的末位字符而第二指针未指向当前处理日志模板的末位字符,或者,第一指针与第二指针分别指向待处理日志和当前处理日志模板的末位字符但计算的比例低于比例阈值,则返回执行依次从日志模板库中获取当前处理日志模板的操作。如果全部日志模板均与待处理日志不匹配,则可以确定根据最简单循环匹配规则无法获取与待处理日志匹配的日志模板。其中,单个日志模板与待处理日志比较的复杂度为O(n),比较m个日志模板的复杂度为O(mn)。
可选的,在根据最简单循环匹配规则确定与待处理日志匹配的日志模板时,可以对各日志模板的全部按字符串长度进行统计,当日志模板的字符串长度占待处理日志全部字符串长度的比例低于比例阈值时,可以直接跳过字符串长度无法满足比例阈值的日志模板,降低计算复杂度。
示例性的,假设当前处理日志模板为Name Update is added。待处理日志为NameUpdate 10 is added 8763,比例阈值为1/2。初始状态下,第一指针指向Name,第二指针指向Name。由于第一指针和第二指针指向的字符相同,同时将第一指针指向Update,第二指针指向Update。由于第一指针和第二指针指向的字符相同,将第一指针指向10,第二指针指向is。此时第一指针与第二指针指向的字符不同,仅将第一指针指向下一字符is。由于第二指针没有移动指向的是字符is,使得第一指针与第二指针指向相同的字符。第一指针指向下一字符added,第二指针指向added,由于两个指针指向的字符相同同时移动两个指针。第一指针指向8763,而第二指针指向的最后一个字符,使得第二指针无法移动。此时第一指针已经移动至待处理日志末位字符,第二指针指向当前处理日志模板的末位字符,并且当前处理日志模板的字符串长度为4,待处理日志中全部字符串为6,当前处理日志模板的字符串长度占待处理日志中全部字符串的比例超过1/2,此时可以确定待处理日志与当前处理日志模板相匹配。
在本发明的一个可选实施例中,采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作,可以包括:在当前获取的目标匹配规则为最长公共子序列匹配规则时,分别计算待处理日志与各日志模板的公共子序列;确定各公共子序列中的最长公共子序列、最长公共子序列所属的目标日志模板,以及目标日志模板的字符串长度;计算最长公共子序列的字符串长度占待处理日志中全部字符串长度的第一比例,以及最长公共子序列的字符串长度占目标日志模板的字符串长度的第二比例;如果第一比例和第二比例均超过预设的比例阈值,则确定待处理日志与目标日志模板相匹配;否则,确定未能获取与待处理日志匹配的日志模板。
其中,公共子序列可以是在待处理日志与日志模板中同时存在的字符序列。最长公共子序列可以是公共子序列中字符长度最大的序列。目标日志模板可以是存在最长公共子序列的日志模板。第一比例可以是最长公共子序列的字符串长度占待处理日志中全部字符串长度的比例。第二比例可以是最长公共子序列的字符串长度占目标日志模板的字符串长度的比例。
在本发明实施例中,当根据模板前缀树匹配规则以及最简单循环匹配规则均无法确定与待处理日志匹配的日志模板时,可以将最长公共子序列匹配规则作为目标匹配规则。在确定当前获取的目标匹配规则为最长公共子序列匹配规则时,需要分别计算待处理日志与匹配规则库中各日志模板的公共子序列,进而对公共子序列进行比较,得到最长公共子序列。在得到最长公共子序列之后,可以进一步确定最长公共子序列所属的日志模板,并将最长公共子序列所属的日志模板作为目标日志模板,进而计算目标日志模板的字符串长度。在得到目标日志模板的字符串长度之后,进一步计算最长公共子序列的字符串长度占待处理日志中全部字符串长度的第一比例,以及最长公共子序列的字符串长度占目标日志模板的字符串长度的第二比例。如果第一比例和第二比例均超过预设的比例阈值,则可以将确定待处理日志与目标日志模板相匹配。如果第一比例和第二比例中任一数据低于预设的比例阈值,则可以确定通过最长公共子序列匹配规则无法确定与待处理日志匹配的日志模板。
示例性的,当待处理日志s1与待处理日志s2实际属于两个不同的日志模板,而s1与s2的公共子序列的字符串长度占s2全部字符的比例超过比例阈值,但是公共子序列的字符长度占s1全部字符的比例低于比例阈值时,假设先为s1确定匹配的日志模板,再为s2确定匹配的日志模板。而在处理s1时将s1作为新的日志模板加入日志模板库。当为s2确定匹配的模板时,根据模板前缀树匹配规则或最简单匹配规则会将s2匹配到日志模板s1,导致模板识别错误。而在第一比例和第二比例都超过比例阈值的条件下,确定待处理日志与目标日志模板相匹配,可以防止待处理日志匹配到错误的日志模板。
在本发明的一个可选实施例中,在确定待处理日志与目标日志模板相匹配之后,还可以包括:获取与目标日志模板对应的至少一个最长公共子序列,并从至少一个最长公共子序列中选定目标最长公共子序列;将目标最长公共子序列作为更新日志模板,并利用更新日志模板替代目标日志模板;根据目标最长公共子序列的字符更新模板前缀树。
其中,目标最长公共子序列可以是最长公共子序列中的一个序列。
在本发明实施例中,在根据最长公共子序列匹配规则确定与待处理日志匹配的目标日志模板之后,可以确定目标日志模板中与待处理日志对应的至少一个最长公共子序列,进而可以从至少一个最长公共子序列中选定目标最长公共子序列。在得到目标最长公共子序列之后,可以将目标最长公共子序列作为更新日志模板,进而将更新日志模板存入日志模板库中,并将目标日志模板从日志模板库中删除。对目标最长公共子序列所包括字符进行解析,以根据目标最长公共子序列的字符构建模板前缀树的新路径,并进一步删除目标日志模板在模板前缀树中的路径。
图3是本发明实施例二提供的一种日志模板的确定方法的示意图,如图所示,可以首先对待处理日志进行预处理,以使待处理日志完成分词处理和字符小写转换。然后通过模板前缀树匹配规则确定与待处理日志匹配的日志模板,具体的:顺序将模板前缀树包括的各条路径与待处理日志进行匹配,判断是否存在与待处理日志完全匹配的目标路径,如果存在目标路径且目标路径的字符串长度占待处理日志中全部字符串长度的比例超过1/2(比例阈值),则确定待处理日志与目标路径对应的日志模板相匹配,否则确定无法获取与待处理日志匹配的日志模板。
在通过模板前缀树匹配规则无法获取与待处理日志匹配的日志模板的情况下,通过最简单循环匹配规则确定与待处理日志匹配的日志模板,具体的:将待处理日志与当前处理日志模板进行匹配,如果第一指针指向待处理日志末位字符,第二指针指向当前处理日志模板的末位字符,且当前处理日志模板的字符串长度占待处理日志中全部字符串长度的比例超过1/2,则确定待处理日志与当前处理日志模板相匹配,否则依次从日志模板库中获取当前处理日志模板,在全部日志模板均无法与待处理日志匹配时,则确定无法获取与待处理日志匹配的日志模板。
在通过最简单循环匹配规则无法获取与待处理日志匹配的日志模板的情况下,利用最长公共子序列匹配规则确定与待处理日志匹配的日志模板,具体的,最长公共子序列的字符串长度占待处理日志全部字符串长度的第一比例,以及最长公共子序列的字符串长度占目标日志模板的字符串长度的第二比例均超过比例阈值,则确定待处理日志与目标日志模板匹配,否则确定无法获取与待处理日志匹配的日志模板。在通过最长公共子序列匹配规则无法获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入日志模板库中,并根据待处理日志更新模板前缀树。
本实施例的技术方案,通过在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则,进而采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作。如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作。在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。本方案无需训练用于识别日志模板的模型,直接利用不同的匹配规则即可实现对待处理日志的日志模板的确定,对于系统更新后产生的新的日志也能确定与之匹配的日志模板,并且通过不同的目标匹配规则去确定与待处理日志匹配的日志模板可以避免单一匹配规则所导致的计算复杂度较高的问题,解决了现有技术中日志模板提取模型训练繁琐、计算复杂度高,且通用性较差的问题,能够在不进行模型训练的前提下,降低日志模板提取的计算复杂度,提高日志模板提取的通用性。
需要说明的是,以上各实施例中各技术特征之间的任意排列组合也属于本发明的保护范围。
实施例三
图4是本发明实施例三提供的一种日志模板的确定装置的示意图,如图4所示,所述装置包括:目标匹配规则获取模块210、匹配处理模块220、循环执行模块230以及日志模板库更新模块240,其中:
目标匹配规则获取模块210,用于在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则;
匹配处理模块220,用于采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作;
循环执行模块230,用于如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作;
日志模板库更新模块240,用于在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。
本实施例的技术方案,通过在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则,进而采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作。如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作。在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。本方案无需训练用于识别日志模板的模型,直接利用不同的匹配规则即可实现对待处理日志的日志模板的确定,对于系统更新后产生的新的日志也能确定与之匹配的日志模板,并且通过不同的目标匹配规则去确定与待处理日志匹配的日志模板可以避免单一匹配规则所导致的计算复杂度较高的问题,解决了现有技术中日志模板提取模型训练繁琐、计算复杂度高,且通用性较差的问题,能够在不进行模型训练的前提下,降低日志模板提取的计算复杂度,提高日志模板提取的通用性。
可选的,匹配规则库中包括:模板前缀树匹配规则、最简单循环匹配规则以及最长公共子序列匹配规则;其中,所述模板前缀树匹配规则的优先级高于所述最简单循环匹配规则,所述最简单循环匹配规则的优先级高于所述最长公共子序列匹配规则。
可选的,匹配处理模块220,具体用于:在当前获取的目标匹配规则为模板前缀树匹配规则时,获取与所述日志模板库匹配的模板前缀树;其中,模板前缀树的一条路径对应日志模板库中的一个日志模板,每个路径中的各路径节点对应日志模板中包括的不同字符;顺序将模板前缀树包括的各条路径与所述待处理日志进行匹配,并在确定所述待处理日志与目标路径完全匹配时,计算所述目标路径的字符串长度占所述待处理日志中全部字符串长度的比例;如果所述比例超过预设的比例阈值,则确定所述待处理日志与目标路径对应的日志模板相匹配;否则,确定未能获取与待处理日志匹配的日志模板。
可选的,匹配处理模块220,具体用于:在当前获取的目标匹配规则为最简单循环匹配规则时,依次从所述日志模板库中获取当前处理日志模板;创建第一指针和第二指针分别指向待处理日志和当前处理日志模板的首个字符;迭代执行在第一指针和第二指针所指向的字符相同时,同时将第一指针和第二指针指向下一字符,并在第一指针和第二指针所指向的字符不同时,仅将第一指针指向下一字符的操作;在第一指针移动至待处理日志的末位字符时,检测第二指针是否位于当前处理日志模板的末位字符;若是,则在当前处理日志模板的字符串长度占所述待处理日志中全部字符串长度的比例超过预设的比例阈值的情况下,确定所述待处理日志与当前处理日志模板相匹配;否则,返回执行依次从所述日志模板库中获取当前处理日志模板的操作,并在确定全部日志模板均与待处理日志不匹配时,确定未能获取与待处理日志匹配的日志模板。
可选的,匹配处理模块220,具体用于:在当前获取的目标匹配规则为最长公共子序列匹配规则时,分别计算所述待处理日志与所述各日志模板的公共子序列;确定各所述公共子序列中的最长公共子序列、最长公共子序列所属的目标日志模板,以及所述目标日志模板的字符串长度;计算所述最长公共子序列的字符串长度占所述待处理日志中全部字符串长度的第一比例,以及所述最长公共子序列的字符串长度占所述目标日志模板的字符串长度的第二比例;如果所述第一比例和所述第二比例均超过预设的比例阈值,则确定所述待处理日志与目标日志模板相匹配;否则,确定未能获取与待处理日志匹配的日志模板。
可选的,日志模板库更新模块240,具体用于:获取与所述目标日志模板对应的至少一个最长公共子序列,并从至少一个最长公共子序列中选定目标最长公共子序列;将所述目标最长公共子序列作为更新日志模板,并利用所述更新日志模板替代所述目标日志模板。
可选的,所述日志模板的确定装置还包括模板前缀树更新模块,用于根据所述目标最长公共子序列的字符更新模板前缀树。
可选的,模板前缀树更新模块,具体用于:根据所述待处理日志字符更新模板前缀树。
上述日志模板的确定装置可执行本发明任意实施例所提供的日志模板的确定方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的日志模板的确定方法。
由于上述所介绍的日志模板的确定装置为可以执行本发明实施例中的日志模板的确定方法的装置,故而基于本发明实施例中所介绍的日志模板的确定方法,本领域所属技术人员能够了解本实施例的日志模板的确定装置的具体实施方式以及其各种变化形式,所以在此对于该日志模板的确定装置如何实现本发明实施例中的日志模板的确定方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中日志模板的确定方法所采用的装置,都属于本申请所欲保护的范围。
实施例四
图5为本发明实施例四提供的一种电子设备的结构示意图。图5示出了适于用来实现本发明实施方式的电子设备312的框图。图5显示的电子设备312仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。电子设备312例如可以是计算机设备或服务器设备等。
如图5所示,电子设备312以通用计算设备的形式表现。电子设备312的组件可以包括但不限于:一个或者多个处理器316,存储装置328,连接不同系统组件(包括存储装置328和处理器316)的总线318。
总线318表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(MicroChannel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
电子设备312典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备312访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置328可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)330和/或高速缓存存储器332。电子设备312可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统334可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-ReadOnly Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线318相连。存储装置328可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块326的程序336,可以存储在例如存储装置328中,这样的程序模块326包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块326通常执行本发明所描述的实施例中的功能和/或方法。
电子设备312也可以与一个或多个外部设备314(例如键盘、指向设备、摄像头、显示器324等)通信,还可与一个或者多个使得用户能与该电子设备312交互的设备通信,和/或与使得该电子设备312能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(Input/Output,I/O)接口322进行。并且,电子设备312还可以通过网络适配器320与一个或者多个网络(例如局域网(Local AreaNetwork,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器320通过总线318与电子设备312的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备312使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of IndependentDisks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器316通过运行存储在存储装置328中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的日志模板的确定方法:在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则;采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作;如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作;在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。
本实施例的技术方案,通过在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则,进而采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作。如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作。在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。本方案无需训练用于识别日志模板的模型,直接利用不同的匹配规则即可实现对待处理日志的日志模板的确定,对于系统更新后产生的新的日志也能确定与之匹配的日志模板,并且通过不同的目标匹配规则去确定与待处理日志匹配的日志模板可以避免单一匹配规则所导致的计算复杂度较高的问题,解决了现有技术中日志模板提取模型训练繁琐、计算复杂度高,且通用性较差的问题,能够在不进行模型训练的前提下,降低日志模板提取的计算复杂度,提高日志模板提取的通用性。
实施例五
本发明实施例五还提供一种存储计算机程序的计算机存储介质,所述计算机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的日志模板的确定方法:在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则;采用目标匹配规则,执行将待处理日志和日志模板库中的各日志模板进行匹配的操作;如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作;在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ReadOnly Memory,ROM)、可擦式可编程只读存储器((Erasable Programmable Read OnlyMemory,EPROM)或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种日志模板的确定方法,其特征在于,包括:
在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则;
采用目标匹配规则,执行将所述待处理日志和日志模板库中的各日志模板进行匹配的操作;
如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作;
在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。
2.根据权利要求1所述的方法,其特征在于,所述匹配规则库中包括:模板前缀树匹配规则、最简单循环匹配规则以及最长公共子序列匹配规则;
其中,所述模板前缀树匹配规则的优先级高于所述最简单循环匹配规则,所述最简单循环匹配规则的优先级高于所述最长公共子序列匹配规则。
3.根据权利要求2所述的方法,其特征在于,采用目标匹配规则,执行将所述待处理日志和日志模板库中的各日志模板进行匹配的操作,包括:
在当前获取的目标匹配规则为模板前缀树匹配规则时,获取与所述日志模板库匹配的模板前缀树;
其中,模板前缀树的一条路径对应日志模板库中的一个日志模板,每个路径中的各路径节点对应日志模板中包括的不同字符;
顺序将模板前缀树包括的各条路径与所述待处理日志进行匹配,并在确定所述待处理日志与目标路径完全匹配时,计算所述目标路径的字符串长度占所述待处理日志中全部字符串长度的比例;
如果所述比例超过预设的比例阈值,则确定所述待处理日志与目标路径对应的日志模板相匹配;否则,确定未能获取与待处理日志匹配的日志模板。
4.根据权利要求2所述的方法,其特征在于,采用目标匹配规则,执行将所述待处理日志和日志模板库中的各日志模板进行匹配的操作,包括:
在当前获取的目标匹配规则为最简单循环匹配规则时,依次从所述日志模板库中获取当前处理日志模板;
创建第一指针和第二指针分别指向待处理日志和当前处理日志模板的首个字符;
迭代执行在第一指针和第二指针所指向的字符相同时,同时将第一指针和第二指针指向下一字符,并在第一指针和第二指针所指向的字符不同时,仅将第一指针指向下一字符的操作;
在第一指针移动至待处理日志的末位字符时,检测第二指针是否位于当前处理日志模板的末位字符;
若是,则在当前处理日志模板的字符串长度占所述待处理日志中全部字符串长度的比例超过预设的比例阈值的情况下,确定所述待处理日志与当前处理日志模板相匹配;否则,返回执行依次从所述日志模板库中获取当前处理日志模板的操作,并在确定全部日志模板均与待处理日志不匹配时,确定未能获取与待处理日志匹配的日志模板。
5.根据权利要求2所述的方法,其特征在于,采用目标匹配规则,执行将所述待处理日志和日志模板库中的各日志模板进行匹配的操作,包括:
在当前获取的目标匹配规则为最长公共子序列匹配规则时,分别计算所述待处理日志与所述各日志模板的公共子序列;
确定各所述公共子序列中的最长公共子序列、最长公共子序列所属的目标日志模板,以及所述目标日志模板的字符串长度;
计算所述最长公共子序列的字符串长度占所述待处理日志中全部字符串长度的第一比例,以及所述最长公共子序列的字符串长度占所述目标日志模板的字符串长度的第二比例;
如果所述第一比例和所述第二比例均超过预设的比例阈值,则确定所述待处理日志与目标日志模板相匹配;否则,确定未能获取与待处理日志匹配的日志模板。
6.根据权利要求5所述的方法,其特征在于,在所述确定所述待处理日志与目标日志模板相匹配之后,还包括:
获取与所述目标日志模板对应的至少一个最长公共子序列,并从至少一个最长公共子序列中选定目标最长公共子序列;
将所述目标最长公共子序列作为更新日志模板,并利用所述更新日志模板替代所述目标日志模板;
根据所述目标最长公共子序列的字符更新模板前缀树。
7.根据权利要求1所述的方法,其特征在于,将待处理日志作为新的日志模板加入至日志模板库之后,还包括:
根据所述待处理日志字符更新模板前缀树。
8.一种日志模板的确定装置,其特征在于,包括:
目标匹配规则获取模块,用于在接收到待处理日志时,按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则;
匹配处理模块,用于采用目标匹配规则,执行将所述待处理日志和日志模板库中的各日志模板进行匹配的操作;
循环执行模块,用于如果未能获取与待处理日志匹配的日志模板,则返回执行按照匹配规则库中各匹配规则的优先级顺序,依次从匹配规则库中获取目标匹配规则的操作;
日志模板库更新模块,用于在确定使用全部匹配规则均未能获取与待处理日志匹配的日志模板时,将待处理日志作为新的日志模板加入至日志模板库中。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的日志模板的确定方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的日志模板的确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110859470.3A CN113553309A (zh) | 2021-07-28 | 2021-07-28 | 一种日志模板的确定方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110859470.3A CN113553309A (zh) | 2021-07-28 | 2021-07-28 | 一种日志模板的确定方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113553309A true CN113553309A (zh) | 2021-10-26 |
Family
ID=78133150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110859470.3A Pending CN113553309A (zh) | 2021-07-28 | 2021-07-28 | 一种日志模板的确定方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113553309A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114239531A (zh) * | 2021-12-17 | 2022-03-25 | 北京达佳互联信息技术有限公司 | 模板推荐方法、装置、电子设备及存储介质 |
CN115871745A (zh) * | 2022-12-28 | 2023-03-31 | 江苏安防科技有限公司 | 一种应用于轨道交通的智能维护方法与装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1645336A (zh) * | 2005-01-20 | 2005-07-27 | 上海复旦光华信息科技股份有限公司 | 基于模板的异构日志信息自动提取与分析方法 |
CN108170580A (zh) * | 2017-11-22 | 2018-06-15 | 链家网(北京)科技有限公司 | 一种基于规则的日志报警方法、装置及系统 |
CN110532536A (zh) * | 2019-08-30 | 2019-12-03 | 深圳前海微众银行股份有限公司 | 一种规则配置方法及装置 |
CN110990352A (zh) * | 2019-12-09 | 2020-04-10 | 华青融天(北京)软件股份有限公司 | 一种数据提取规则的确定方法、装置、计算机设备和介质 |
CN111708860A (zh) * | 2020-06-15 | 2020-09-25 | 北京优特捷信息技术有限公司 | 信息提取方法、装置、设备及存储介质 |
CN112541074A (zh) * | 2019-09-20 | 2021-03-23 | 中兴通讯股份有限公司 | 日志解析方法、装置、服务器和存储介质 |
CN112560407A (zh) * | 2020-12-18 | 2021-03-26 | 上海中畅数据技术有限公司 | 一种在线提取计算机软件日志模板的方法 |
CN112632960A (zh) * | 2021-01-06 | 2021-04-09 | 北京启明星辰信息安全技术有限公司 | 基于动态字段模板的日志解析方法及系统 |
-
2021
- 2021-07-28 CN CN202110859470.3A patent/CN113553309A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1645336A (zh) * | 2005-01-20 | 2005-07-27 | 上海复旦光华信息科技股份有限公司 | 基于模板的异构日志信息自动提取与分析方法 |
CN108170580A (zh) * | 2017-11-22 | 2018-06-15 | 链家网(北京)科技有限公司 | 一种基于规则的日志报警方法、装置及系统 |
CN110532536A (zh) * | 2019-08-30 | 2019-12-03 | 深圳前海微众银行股份有限公司 | 一种规则配置方法及装置 |
CN112541074A (zh) * | 2019-09-20 | 2021-03-23 | 中兴通讯股份有限公司 | 日志解析方法、装置、服务器和存储介质 |
CN110990352A (zh) * | 2019-12-09 | 2020-04-10 | 华青融天(北京)软件股份有限公司 | 一种数据提取规则的确定方法、装置、计算机设备和介质 |
CN111708860A (zh) * | 2020-06-15 | 2020-09-25 | 北京优特捷信息技术有限公司 | 信息提取方法、装置、设备及存储介质 |
CN112560407A (zh) * | 2020-12-18 | 2021-03-26 | 上海中畅数据技术有限公司 | 一种在线提取计算机软件日志模板的方法 |
CN112632960A (zh) * | 2021-01-06 | 2021-04-09 | 北京启明星辰信息安全技术有限公司 | 基于动态字段模板的日志解析方法及系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114239531A (zh) * | 2021-12-17 | 2022-03-25 | 北京达佳互联信息技术有限公司 | 模板推荐方法、装置、电子设备及存储介质 |
CN115871745A (zh) * | 2022-12-28 | 2023-03-31 | 江苏安防科技有限公司 | 一种应用于轨道交通的智能维护方法与装置 |
CN115871745B (zh) * | 2022-12-28 | 2024-05-10 | 江苏安防科技有限公司 | 一种应用于轨道交通的智能维护方法与装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107992596B (zh) | 一种文本聚类方法、装置、服务器和存储介质 | |
CN107832662B (zh) | 一种获取图片标注数据的方法和系统 | |
CN111343161B (zh) | 异常信息处理节点分析方法、装置、介质及电子设备 | |
CN111460250B (zh) | 用于画像的数据的清洗方法、装置、介质及电子设备 | |
CN108932218B (zh) | 一种实例扩展方法、装置、设备和介质 | |
CN112445775B (zh) | 一种光刻机的故障分析方法、装置、设备和存储介质 | |
CN110826494A (zh) | 标注数据质量评价方法、装置、计算机设备及存储介质 | |
CN113553309A (zh) | 一种日志模板的确定方法、装置、电子设备及存储介质 | |
CN113723618B (zh) | 一种shap的优化方法、设备及介质 | |
CN111143556A (zh) | 软件功能点自动计数方法、装置、介质及电子设备 | |
CN113360521A (zh) | 日志查询方法、装置、设备及存储介质 | |
CN115346686A (zh) | 关系图谱生成方法及装置、存储介质及电子设备 | |
CN116523284A (zh) | 基于机器学习的业务操作流程自动化评估方法、系统 | |
CN110175128B (zh) | 一种相似代码案例获取方法、装置、设备和存储介质 | |
CN114090601B (zh) | 一种数据筛选方法、装置、设备以及存储介质 | |
CN113138906A (zh) | 一种调用链数据采集方法、装置、设备及存储介质 | |
CN111240971B (zh) | 风控规则测试用例的生成方法、装置、服务器和存储介质 | |
CN111367813B (zh) | 决策引擎自动化测试方法、装置、服务器及存储介质 | |
CN110688558B (zh) | 网页搜索的方法、装置、电子设备和存储介质 | |
CN115345600B (zh) | 一种rpa流程的生成方法和装置 | |
CN116340172A (zh) | 基于测试场景的数据收集方法、装置及测试用例检测方法 | |
WO2022148239A1 (zh) | 信息输出方法、装置和电子设备 | |
CN110134435B (zh) | 一种代码修复案例获取方法、装置、设备及存储介质 | |
CN112560459B (zh) | 用于模型训练的样本筛选方法、装置、设备及存储介质 | |
CN115292008A (zh) | 用于分布式系统的事务处理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |