CN115169490A - 一种日志分类方法、装置、设备及计算机可读存储介质 - Google Patents

一种日志分类方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN115169490A
CN115169490A CN202210884671.3A CN202210884671A CN115169490A CN 115169490 A CN115169490 A CN 115169490A CN 202210884671 A CN202210884671 A CN 202210884671A CN 115169490 A CN115169490 A CN 115169490A
Authority
CN
China
Prior art keywords
log
target
logs
training
outputting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210884671.3A
Other languages
English (en)
Inventor
陶帝豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Jinan data Technology Co ltd
Original Assignee
Inspur Jinan data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Jinan data Technology Co ltd filed Critical Inspur Jinan data Technology Co ltd
Priority to CN202210884671.3A priority Critical patent/CN115169490A/zh
Publication of CN115169490A publication Critical patent/CN115169490A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种日志分类方法,该方法包括以下步骤:获取预生成的目标日志;利用预训练得到的目标朴素贝叶斯模型对目标日志进行分类,得到日志分类结果;对日志分类结果输出操作。应用本发明所提供的日志分类方法,通过预先训练能够对日志进行自动分类的目标朴素贝叶斯模型,在获取到预生成的目标日志之后,直接利用目标朴素贝叶斯模型对所述目标日志进行分类,即可得到目标日志具体是异常日志还是正常日志的分类结果。相较于现有的人工对日志逐条的阅读、分析的方式,较大地节省了人力,提升了异常日志定位效率。本发明还公开了一种日志分类装置、设备及存储介质,具有相应技术效果。

Description

一种日志分类方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及日志处理技术领域,特别是涉及一种日志分类方法、装置、设备及计算机可读存储介质。
背景技术
程序运行过程中输出的日志是开发人员、运维人员等进行问题分析、定位的主要依据之一。但是一些应用场景中的程序(如大型商业程序)运行过程中输出的日志是大量、复杂的,从而给开发人员、运维人员等在进行分析原因,定位问题时带来了巨大的日志阅读量。
目前在开发、运维过程中对于日志的分析主要是采用日志管理工具对日志进行集中的采集与记录,给开发人员、运维人员提供基础的检索、可视化功能,需要依靠开发人员、运维人员对日志逐条的阅读、分析,寻找程序运行出错后相关的日志信息,浪费人力,异常日志定位效率低。
综上所述,如何有效地解决现有的日志分析方法浪费人力,异常日志定位效率低等问题,是目前本领域技术人员急需解决的问题。
发明内容
本发明的目的是提供一种日志分类方法,该方法较大地节省了人力,提升了异常日志定位效率;本发明的另一目的是提供一种日志分类装置、设备及计算机可读存储介质。
为解决上述技术问题,本发明提供如下技术方案:
一种日志分类方法,包括:
获取预生成的目标日志;
利用预训练得到的目标朴素贝叶斯模型对所述目标日志进行分类,得到日志分类结果;
对所述日志分类结果输出操作。
在本发明的一种具体实施方式中,还包括对所述目标朴素贝叶斯模型的训练过程,所述目标朴素贝叶斯模型的训练过程包括:
获取训练日志集;
获取预设的错误日志特征值和正常日志特征值;
利用所述错误日志特征值对所述训练日志集中的错误日志进行标注,并利用所述正常日志特征值对所述训练日志集中的正常日志进行标注;
利用标注完成的训练日志集对原始朴素贝叶斯模型进行训练,得到所述目标朴素贝叶斯模型。
在本发明的一种具体实施方式中,在得到日志分类结果之后,还包括:
判断所述日志分类结果是否为异常日志;
若是,则利用正则表达式对所述目标日志的关键信息进行提取操作,得到日志信息提取结果;
对所述日志信息提取结果进行输出操作。
在本发明的一种具体实施方式中,利用正则表达式对所述目标日志的关键信息进行提取操作,包括:
利用正则表达式对所述目标日志的日志时间、日志地址、代码模块、日志等级及日志内容进行提取操作。
在本发明的一种具体实施方式中,对所述日志分类结果输出操作,包括:
当所述日志分类结果为异常日志时,输出日志异常提示信息。
在本发明的一种具体实施方式中,输出日志异常提示信息,包括:
获取所述日志等级对应的目标异常提示手段;
利用所述目标异常提示手段输出所述日志异常提示信息。
在本发明的一种具体实施方式中,对所述日志信息提取结果进行输出操作,包括:
获取预设文本输出格式;
按照所述预设文本输出格式对所述日志信息提取结果进行输出操作。
一种日志分类装置,包括:
日志获取单元,用于获取预生成的目标日志;
日志分类单元,用于利用预训练得到的目标朴素贝叶斯模型对所述目标日志进行分类,得到日志分类结果;
分类结果输出单元,用于对所述日志分类结果输出操作。
一种日志分类设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如前所述日志分类方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述日志分类方法的步骤。
本发明所提供的日志分类方法,获取预生成的目标日志;利用预训练得到的目标朴素贝叶斯模型对目标日志进行分类,得到日志分类结果;对日志分类结果输出操作。通过预先训练能够对日志进行自动分类的目标朴素贝叶斯模型,在获取到预生成的目标日志之后,直接利用目标朴素贝叶斯模型对所述目标日志进行分类,即可得到目标日志具体是异常日志还是正常日志的分类结果。相较于现有的人工对日志逐条的阅读、分析的方式,较大地节省了人力,提升了异常日志定位效率。
相应的,本发明还提供了与上述日志分类方法相对应的日志分类装置、设备和计算机可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中日志分类方法的一种实施流程图;
图2为本发明实施例中日志分类方法的另一种实施流程图;
图3为本发明实施例中一种基于朴素贝叶斯算法的日志监测分析流程图;
图4为本发明实施例中一种日志分类装置的结构框图;
图5为本发明实施例中一种日志分类设备的结构框图;
图6为本实施例提供的一种日志分类设备的具体结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1为本发明实施例中日志分类方法的一种实施流程图,该方法可以包括以下步骤:
S101:获取预生成的目标日志。
预先设置对生成的日志进行监测,当监测到存在生成的目标日志时,获取预生成的目标日志。
目标日志可以为程序运行过程中生成任意一条日志。对于程序日志而言,在程序运行过程中,日志是逐条增加的,所以可以对每条日志作为一个对象进行处理。通过对日志的监测,将增加的每条日志作为一个输入数据。
S102:利用预训练得到的目标朴素贝叶斯模型对目标日志进行分类,得到日志分类结果。
预先训练对正常日志和异常日志进行自动分类的目标朴素贝叶斯模型。在获取到预生成的目标日志之后,利用预训练得到的目标朴素贝叶斯模型对目标日志进行分类,得到日志分类结果,从而得到预生成的目标日志具体为正常日志还是异常日志。
朴素贝叶斯算法(Naive Bayesian algorithm)是应用最为广泛的分类算法之一。朴素贝叶斯方法是在贝叶斯算法的基础上进行了相应的简化,即假定给定目标值时属性之间相互条件独立。也就是说没有哪个属性变量对于决策结果来说占有着较大的比重,也没有哪个属性变量对于决策结果占有着较小的比重。极大地简化了贝叶斯方法的复杂性。
贝叶斯算法:贝叶斯方法是以贝叶斯原理为基础,使用概率统计的知识对样本数据集进行分类。由于其有着坚实的数学基础,贝叶斯分类算法的误判率是很低的。贝叶斯方法的特点是结合先验概率和后验概率,既避免了只使用先验概率的主观偏见,也避免了单独使用样本信息的过拟合现象。贝叶斯分类算法在数据集较大的情况下表现出较高的准确率,同时算法本身也比较简单。
S103:对日志分类结果输出操作。
在利用预训练得到的目标朴素贝叶斯模型对目标日志进行分类,得到日志分类结果之后,对日志分类结果输出操作。从而开发人员或运维人员能够根据输出的日志分类结果清楚地了解到程序当前运行是否正常。通过预先训练能够对日志进行自动分类的目标朴素贝叶斯模型,在获取到预生成的目标日志之后,直接利用目标朴素贝叶斯模型对所述目标日志进行分类,即可得到目标日志具体是异常日志还是正常日志的分类结果。相较于现有的人工对日志逐条的阅读、分析的方式,较大地节省了人力,提升了异常日志定位效率。
在本发明的一种具体实施方式中,步骤S103可以包括以下步骤:
当日志分类结果为异常日志时,输出日志异常提示信息。
在利用预训练得到的目标朴素贝叶斯模型对目标日志进行分类,得到日志分类结果之后,判断日志分类结果是否为异常日志,如可以根据预先设置的正常日志和异常日志分别对应的类别标识符确定日志分类结果是否为异常日志。当日志分类结果为异常日志时,说明程序当前可能处于运行异常状态,输出日志异常提示信息。从而开发人员或运维人员能够根据输出的日志异常提示信息快速定位到异常日志,并根据异常日志进行后续维护操作。
在本发明的一种具体实施方式中,输出日志异常提示信息,可以包括以下步骤:
步骤一:获取日志等级对应的目标异常提示手段;
步骤二:利用目标异常提示手段输出日志异常提示信息。
为方便描述,可以将上述两个步骤结合起来进行说明。
预先对异常日志进行等级划分,并分别设置各等级的异常日志分别对应的异常提示手段,如可以将异常日志划分为轻度异常、一般异常和严重异常三个等级,相应地,各异常提示手段可以设置为轻度提示、一般提示、紧急提示,并预先设置轻度异常对应轻度提示,一般异常对应一般提示,严重异常对应紧急提示。如可以设置当确定异常日志为轻度异常时,通过向开发人员或运维人员发送邮件的方式提示当前程序运行异常,当确定异常日志为一般异常时,通过向开发人员或运维人员发送短信的方式提示当前程序运行异常,当确定异常日志为严重异常时,通过向声光报警的方式提示开发人员或运维人员当前程序运行异常。
当确定目标日志为异常日志时,说明需要提示开发人员或运维人员当前程序运行存在异常,获取日志等级对应的目标异常提示手段,利用目标异常提示手段输出日志异常提示信息。通过预先设置日志等级与异常提示手段之间的对应关系,能够对目标日志的异常情况进行更加精确地提示,以便开发人员或运维人员根据相应的提示信息准确判断程序当前运行状态。
本发明所提供的日志分类方法,获取预生成的目标日志;利用预训练得到的目标朴素贝叶斯模型对目标日志进行分类,得到日志分类结果;对日志分类结果输出操作。通过预先训练能够对日志进行自动分类的目标朴素贝叶斯模型,在获取到预生成的目标日志之后,直接利用目标朴素贝叶斯模型对目标日志进行分类,即可得到目标日志具体是异常日志还是正常日志的分类结果。相较于现有的人工对日志逐条的阅读、分析的方式,较大地节省了人力,提升了异常日志定位效率。
需要说明的是,基于上述实施例,本发明实施例还提供了相应的改进方案。在后续实施例中涉及与上述实施例中相同步骤或相应步骤之间可相互参考,相应的有益效果也可相互参照,在下文的改进实施例中不再一一赘述。
在本发明的一种具体实施方式中,该方法还可以包括对目标朴素贝叶斯模型的训练过程,目标朴素贝叶斯模型的训练过程包括:
步骤一:获取训练日志集;
步骤二:获取预设的错误日志特征值和正常日志特征值;
步骤三:利用错误日志特征值对训练日志集中的错误日志进行标注,并利用正常日志特征值对训练日志集中的正常日志进行标注;
步骤四:利用标注完成的训练日志集对原始朴素贝叶斯模型进行训练,得到目标朴素贝叶斯模型。
为方便描述,可以将上述四个步骤结合起来进行说明。
预先收集日志信息作为训练日志集,并预先设置错误日志特征值和正常日志特征值。在对目标朴素贝叶斯模型进行训练时,获取训练日志集,获取预设的错误日志特征值和正常日志特征值,利用错误日志特征值对训练日志集中的错误日志进行标注,并利用正常日志特征值对训练日志集中的正常日志进行标注,利用标注完成的训练日志集对原始朴素贝叶斯模型进行训练,得到目标朴素贝叶斯模型。
参见图2,图2为本发明实施例中日志分类方法的另一种实施流程图,该方法可以包括以下步骤:
S201:获取预生成的目标日志。
S202:利用预训练得到的目标朴素贝叶斯模型对目标日志进行分类,得到日志分类结果。
朴素贝叶斯算法原理如下:
a)设有样本数据集D={d1,d2,…,dn},对应样本数据的特征属性集为X={x1,x2,…,xd}类变量为Y={y1,y2,…,ym},即D可以为ym类别。在对于日志分类过程中,每条日志视为一个样本数据,对应样本数据的特征属性集则为每条日志信息中包含的文本单词;类变量在日志分类中只有两种,即正常日志与异常日志。其中x1,x2,…,xd相互独立且随机,则Y的先验概率Pprior=P(Y),Y的后验概率Ppost=P(Y|X),由朴素贝叶斯算法可得,后验概率可以有先验概率Pprior=P(Y)、证据P(X)、类条件概率P(X|Y)计算出:
P(Y|X)=P(Y)P(X|Y)/P(X);
b)朴素贝叶斯基于各特征之间相互独立,在给定类别y的情况下,上式可以进一步表达为下式:
Figure BDA0003763823150000071
c)由以上两式可以计算出后验概率为:
Figure BDA0003763823150000072
d)由于P(X)的大小是固定不变的,因此在比较后验概率时,只比较上式的分子部分即可。因此可以得到一个样本数据属于类别ym的朴素贝叶斯计算:
Figure BDA0003763823150000081
通过朴素贝叶斯算法,可以计算出每条日志的属于类变量Y中正常日志和异常日志的概率,进而判断日志的分类。
S203:对日志分类结果输出操作。
S204:判断日志分类结果是否为异常日志,若是,则执行步骤S205,若是,则不做处理。
在利用预训练得到的目标朴素贝叶斯模型对目标日志进行分类,得到日志分类结果之后,判断日志分类结果是否为异常日志,若是,则说明后续需要根据该异常日志进行问题定位,执行步骤S205中进行日志关键信息提取的步骤,若是,则说明当前程序运行正常,不需要做任何处理。
S205:利用正则表达式对目标日志的关键信息进行提取操作,得到日志信息提取结果。
预先设置用于对目标日志的关键信息进行提取的正则表达式,当确定日志分类结果为异常日志时,说明后续需要根据该异常日志进行问题定位,对于异常日志的处理,由于日志输出信息的种类较多,并且没有固定的信息模板,所以日志信息被视为半结构化数据。针对半结构化数据,利用正则表达式对目标日志的关键信息进行提取操作,得到日志信息提取结果。通过预先设置正则表达式对目标日志的关键信息进行提取,较大地提升了对目标日志的关键信息提取效率,提升了关键信息提取准确性。
需要说明的是,用于对目标日志的关键信息进行提取的可以根据实际情况进行设定和调整,本发明实施例对此不做限定,如可以根据需要提取的关键信息的项数或者关键信息的内容变化进行调整。
正则表达式:又称规则表达式,(Regular Expression,在代码中常简写为regex、regexp或RE),是一种文本模式,包括普通字符(例如,a到z之间的字母)和特殊字符(称为"元字符"),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式(规则)的文本。
在本发明的一种具体实施方式中,利用正则表达式对目标日志的关键信息进行提取操作,可以包括以下步骤:
利用正则表达式对目标日志的日志时间、日志地址、代码模块、日志等级及日志内容进行提取操作。
预先设置对日志的日志时间、日志地址、代码模块、日志等级及日志内容进行提取的正则表达式。当确定日志分类结果为异常日志时,说明后续需要根据该异常日志进行问题定位,利用正则表达式对目标日志的日志时间、日志地址、代码模块、日志等级及日志内容进行提取操作。通过对目标日志的日志时间、日志地址、代码模块、日志等级及日志内容进行提取,从而提取到目标日志最关键的信息,便于开发人员或运维人员基于获取到的目标日志的日志时间、日志地址、代码模块、日志等级及日志内容进行问题定位。
S206:对日志信息提取结果进行输出操作。
在利用正则表达式对目标日志的日志时间、日志地址、代码模块、日志等级及日志内容进行提取操作之后,对日志信息提取结果进行输出操作。通过输出目标日志的日志时间、日志地址、代码模块、日志等级及日志内容,方便开发人员或运维人员进行问题定位及异常维护。
在本发明的一种具体实施方式中,对日志信息提取结果进行输出操作,可以包括以下步骤:
步骤一:获取预设文本输出格式;
步骤二:按照预设文本输出格式对日志信息提取结果进行输出操作。
为方便描述,可以将上述两个步骤结合起来进行说明。
预先设置标准的文本输出格式,获取预设文本输出格式,按照预设文本输出格式对日志信息提取结果进行输出操作。通过按照标准的预设文本输出格式对目标日志的日志时间、日志地址、代码模块、日志等级及日志内容进行输出操作,提升了日志关键信息提取效率,提升了关键信息提取准确性,方便开发人员或运维人员进行问题定位及异常维护。
由上述技术方案可知,通过预先训练能够对日志进行自动分类的目标朴素贝叶斯模型,在获取到预生成的目标日志之后,直接利用目标朴素贝叶斯模型对目标日志进行分类,即可得到目标日志具体是异常日志还是正常日志的分类结果。相较于现有的人工对日志逐条的阅读、分析的方式,较大地节省了人力,提升了异常日志定位效率。
在一种具体实例应用中,参见图3,图3为本发明实施例中一种基于朴素贝叶斯算法的日志监测分析流程图,实现基于朴素贝叶斯算法的日志监测分析方法,主要包括如下几个步骤:
步骤一、使用日志中可能出现的错误日志和正常日志根据特征值进行标注区分,作为训练数据对朴素贝叶斯算法进行训练;
步骤二、对于程序日志而言,在程序运行过程中,日志是逐条增加的,所以可以对每条日志作为一个对象进行处理。通过对日志的监测,将增加的每条日志作为一个输入数据,使用朴素贝叶斯算法对其进行判断分类为正常日志或者异常日志;
步骤三、使用正则表达式对每条异常日志的时间、日志地址、代码模块、日志等级和具体的日志内容进行识别提取,并存到固定格式的文本中。
相应于上面的方法实施例,本发明还提供了一种日志分类装置,下文描述的日志分类装置与上文描述的日志分类方法可相互对应参照。
参见图4,图4为本发明实施例中一种日志分类装置的结构框图,该装置可以包括:
日志获取单元41,用于获取预生成的目标日志;
日志分类单元42,用于利用预训练得到的目标朴素贝叶斯模型对目标日志进行分类,得到日志分类结果;
分类结果输出单元43,用于对日志分类结果输出操作。
本发明所提供的日志分类装置,获取预生成的目标日志;利用预训练得到的目标朴素贝叶斯模型对目标日志进行分类,得到日志分类结果;对日志分类结果输出操作。通过预先训练能够对日志进行自动分类的目标朴素贝叶斯模型,在获取到预生成的目标日志之后,直接利用目标朴素贝叶斯模型对目标日志进行分类,即可得到目标日志具体是异常日志还是正常日志的分类结果。相较于现有的人工对日志逐条的阅读、分析的方式,较大地节省了人力,提升了异常日志定位效率。
在本发明的一种具体实施方式中,该装置还可以包括模型训练单元,模型训练单元包括:
日志获取子单元,用于获取训练日志集;
特征值获取子单元,用于获取预设的错误日志特征值和正常日志特征值;
日志标注子单元,用于利用错误日志特征值对训练日志集中的错误日志进行标注,并利用正常日志特征值对训练日志集中的正常日志进行标注;
模型训练子单元,用于利用标注完成的训练日志集对原始朴素贝叶斯模型进行训练,得到目标朴素贝叶斯模型。
在本发明的一种具体实施方式中,该装置还可以包括:
判断单元,用于在得到日志分类结果之后,判断日志分类结果是否为异常日志;
关键信息提取单元,用于当确定日志分类结果为异常日志时,利用正则表达式对目标日志的关键信息进行提取操作,得到日志信息提取结果;
提取结果输出单元,用于对日志信息提取结果进行输出操作。
在本发明的一种具体实施方式中,关键信息提取单元具体为利用正则表达式对目标日志的日志时间、日志地址、代码模块、日志等级及日志内容进行提取操作的单元。
在本发明的一种具体实施方式中,分类结果输出单元43具体为当日志分类结果为异常日志时,输出日志异常提示信息的单元。
在本发明的一种具体实施方式中,分类结果输出单元43包括:
提示手段获取子单元,用于获取日志等级对应的目标异常提示手段;
结果输出子单元,用于利用目标异常提示手段输出日志异常提示信息。
在本发明的一种具体实施方式中,提取结果输出单元包括:
输出格式获取子单元,用于获取预设文本输出格式;
提取结果输出子单元,用于按照预设文本输出格式对日志信息提取结果进行输出操作。
相应于上面的方法实施例,参见图5,图5为本发明所提供的日志分类设备的示意图,该设备可以包括:
存储器332,用于存储计算机程序;
处理器322,用于执行计算机程序时实现上述方法实施例的日志分类方法的步骤。
具体的,请参考图6,图6为本实施例提供的一种日志分类设备的具体结构示意图,该日志分类设备可因配置或性能不同而产生比较大的差异,可以包括处理器(centralprocessing units,CPU)322(例如,一个或一个以上处理器)和存储器332,存储器332存储有一个或一个以上的计算机应用程序342或数据344。其中,存储器332可以是短暂存储或持久存储。存储在存储器332的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对数据处理设备中的一系列指令操作。更进一步地,处理器322可以设置为与存储器332通信,在日志分类设备301上执行存储器332中的一系列指令操作。
日志分类设备301还可以包括一个或一个以上电源326,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口358,和/或,一个或一个以上操作系统341。
上文所描述的日志分类方法中的步骤可以由日志分类设备的结构实现。
相应于上面的方法实施例,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现如下步骤:
获取预生成的目标日志;利用预训练得到的目标朴素贝叶斯模型对目标日志进行分类,得到日志分类结果;对日志分类结果输出操作。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本发明提供的计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不做赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置、设备及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种日志分类方法,其特征在于,包括:
获取预生成的目标日志;
利用预训练得到的目标朴素贝叶斯模型对所述目标日志进行分类,得到日志分类结果;
对所述日志分类结果输出操作。
2.根据权利要求1所述的日志分类方法,其特征在于,还包括对所述目标朴素贝叶斯模型的训练过程,所述目标朴素贝叶斯模型的训练过程包括:
获取训练日志集;
获取预设的错误日志特征值和正常日志特征值;
利用所述错误日志特征值对所述训练日志集中的错误日志进行标注,并利用所述正常日志特征值对所述训练日志集中的正常日志进行标注;
利用标注完成的训练日志集对原始朴素贝叶斯模型进行训练,得到所述目标朴素贝叶斯模型。
3.根据权利要求1所述的日志分类方法,其特征在于,在得到日志分类结果之后,还包括:
判断所述日志分类结果是否为异常日志;
若是,则利用正则表达式对所述目标日志的关键信息进行提取操作,得到日志信息提取结果;
对所述日志信息提取结果进行输出操作。
4.根据权利要求3所述的日志分类方法,其特征在于,利用正则表达式对所述目标日志的关键信息进行提取操作,包括:
利用正则表达式对所述目标日志的日志时间、日志地址、代码模块、日志等级及日志内容进行提取操作。
5.根据权利要求4所述的日志分类方法,其特征在于,对所述日志分类结果输出操作,包括:
当所述日志分类结果为异常日志时,输出日志异常提示信息。
6.根据权利要求5所述的日志分类方法,其特征在于,输出日志异常提示信息,包括:
获取所述日志等级对应的目标异常提示手段;
利用所述目标异常提示手段输出所述日志异常提示信息。
7.根据权利要求3至6任一项所述的日志分类方法,其特征在于,对所述日志信息提取结果进行输出操作,包括:
获取预设文本输出格式;
按照所述预设文本输出格式对所述日志信息提取结果进行输出操作。
8.一种日志分类装置,其特征在于,包括:
日志获取单元,用于获取预生成的目标日志;
日志分类单元,用于利用预训练得到的目标朴素贝叶斯模型对所述目标日志进行分类,得到日志分类结果;
分类结果输出单元,用于对所述日志分类结果输出操作。
9.一种日志分类设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述日志分类方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述日志分类方法的步骤。
CN202210884671.3A 2022-07-25 2022-07-25 一种日志分类方法、装置、设备及计算机可读存储介质 Pending CN115169490A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210884671.3A CN115169490A (zh) 2022-07-25 2022-07-25 一种日志分类方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210884671.3A CN115169490A (zh) 2022-07-25 2022-07-25 一种日志分类方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN115169490A true CN115169490A (zh) 2022-10-11

Family

ID=83497467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210884671.3A Pending CN115169490A (zh) 2022-07-25 2022-07-25 一种日志分类方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN115169490A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115713099A (zh) * 2023-01-03 2023-02-24 税友信息技术有限公司 一种模型设计方法、装置、设备及存储介质
CN118295864A (zh) * 2024-06-05 2024-07-05 浪潮云信息技术股份公司 一种Linux操作系统硬件错误识别方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115713099A (zh) * 2023-01-03 2023-02-24 税友信息技术有限公司 一种模型设计方法、装置、设备及存储介质
CN115713099B (zh) * 2023-01-03 2023-05-09 税友信息技术有限公司 一种模型设计方法、装置、设备及存储介质
CN118295864A (zh) * 2024-06-05 2024-07-05 浪潮云信息技术股份公司 一种Linux操作系统硬件错误识别方法及系统
CN118295864B (zh) * 2024-06-05 2024-08-13 浪潮云信息技术股份公司 一种Linux操作系统硬件错误识别方法及系统

Similar Documents

Publication Publication Date Title
CN114610515B (zh) 基于日志全语义的多特征日志异常检测方法及系统
CN110263009B (zh) 日志分类规则的生成方法、装置、设备及可读存储介质
CN115169490A (zh) 一种日志分类方法、装置、设备及计算机可读存储介质
CN112231431B (zh) 一种异常地址识别方法、设备和计算机可读存储介质
CN112307741B (zh) 保险行业文档智能化解析方法和装置
CN114528845A (zh) 异常日志的分析方法、装置及电子设备
CN112433874A (zh) 一种故障定位方法、系统、电子设备及存储介质
Shah et al. Towards benchmarking feature type inference for automl platforms
CN113590396A (zh) 一次设备的缺陷诊断方法、系统、电子设备及存储介质
CN113297051A (zh) 一种日志分析处理方法及装置
CN116561748A (zh) 一种组件子序列相关性感知的日志异常检测装置
Wong et al. Wiki-reliability: A large scale dataset for content reliability on wikipedia
CN116361147A (zh) 测试用例根因定位方法及其装置、设备、介质、产品
CN115618355A (zh) 注入攻击结果判定方法、装置、设备及存储介质
CN115758183A (zh) 日志异常检测模型的训练方法及装置
CN112416904A (zh) 电力数据规范化处理方法及装置
CN116126807A (zh) 一种日志分析方法及相关装置
CN117873839B (zh) 复杂算力系统的故障检测方法、装置、设备和存储介质
CN117544482A (zh) 基于ai的运维故障确定方法、装置、设备和存储介质
CN117874662A (zh) 基于图模式的微服务日志异常检测方法
CN111104422A (zh) 一种数据推荐模型的训练方法、装置、设备及存储介质
CN113517998B (zh) 预警配置数据的处理方法、装置、设备及存储介质
CN113343051B (zh) 一种异常sql检测模型构建方法及检测方法
Bhanage et al. Improving classification-based log analysis using vectorization techniques
CN115470034A (zh) 一种日志分析方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination