CN113535454B - 一种日志数据异常检测的方法及设备 - Google Patents

一种日志数据异常检测的方法及设备 Download PDF

Info

Publication number
CN113535454B
CN113535454B CN202110800694.7A CN202110800694A CN113535454B CN 113535454 B CN113535454 B CN 113535454B CN 202110800694 A CN202110800694 A CN 202110800694A CN 113535454 B CN113535454 B CN 113535454B
Authority
CN
China
Prior art keywords
log
current detection
data
time
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110800694.7A
Other languages
English (en)
Other versions
CN113535454A (zh
Inventor
韦帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Suninfo Technology Co ltd
Original Assignee
Shanghai Suninfo Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Suninfo Technology Co ltd filed Critical Shanghai Suninfo Technology Co ltd
Priority to CN202110800694.7A priority Critical patent/CN113535454B/zh
Publication of CN113535454A publication Critical patent/CN113535454A/zh
Application granted granted Critical
Publication of CN113535454B publication Critical patent/CN113535454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请的目的是提供一种日志数据异常检测的方法及设备,本申请通过按照日志相似度对原始日志进行聚类处理,得到若干类别日志;统计每一类别日志在当前检测时刻的前预设时间内的单位时间的日志量,得到每一类别日志的时间序列的日志量数据;根据所述每一类别日志的时间序列的日志量数据及对应的动态阈值判断当前检测时刻是否为异常点。从而从日志量层面发现日志异常,通过检测易于历史的日志量变化达到检测异常事件的目的;仅对历史数据的学习即可对当前点进行检测,无需提前训练和人为标记,适用性高、计算速度快以及应用范围广。

Description

一种日志数据异常检测的方法及设备
技术领域
本申请涉及计算机领域,尤其涉及一种日志数据异常检测的方法及设备。
背景技术
传统的日志异常检测方法,是在针对日志信息进行检测时,采用正则表达式进行关键字匹配,从而发现其预先设定的异常日志;但这种方式局限于单条日志内容的检测,且只能对设定关键字的对应日志进行匹配发现,对其他日志进行忽略,其检测方式单一、实用性差。
发明内容
本申请的一个目的是提供一种日志数据异常检测的方法及设备,解决现有技术中检测方式只能进行单条日志内容的检测,检测方式单一以及实用性差的问题。
根据本申请的一个方面,提供了一种日志数据异常检测的方法,该方法包括:
按照日志相似度对原始日志进行聚类处理,得到若干类别日志;
统计每一类别日志在当前检测时刻的前预设时间内的单位时间的日志量,得到每一类别日志的时间序列的日志量数据;
根据所述每一类别日志的时间序列的日志量数据及对应的动态阈值判断当前检测时刻是否为异常点。
可选地,按照日志相似度对原始日志进行聚类处理,得到若干类别日志,包括:
按照日志的字段及词序的相似度对原始日志进行聚类处理,得到若干类别日志。
可选地,根据所述每一类别日志的时间序列的日志量数据及对应的动态阈值判断当前检测时刻是否为异常点,包括:
根据所述每一类别日志的时间序列的日志量数据判定当前检测时刻的前预设时间内的日志量是否稳定,若稳定,则判定所述当前检测时刻是否为离群点;
当所述当前检测时刻为离群点时,确定每一类别日志的动态阈值,根据所述动态阈值进行当前检测时刻的突变点检测;
根据检测结果判断所述当前时刻的日志检测点是否为异常点。
可选地,根据所述每一类别日志的时间序列的日志量数据判定当前检测时刻的前预设时间内的日志量是否稳定,包括:
将当前检测时刻的前预设时间内的历史日志作为训练数据;
根据所述每一类别日志的时间序列的日志量数据判定所述训练数据在所述当前检测时刻的前预设时间内的日志量是否稳定。
可选地,根据所述每一类别日志的时间序列的日志量数据判定所述训练数据在所述当前检测时刻的前预设时间内的日志量是否稳定,包括:
对所述训练数据计算每一类别日志的上限值和下限值;
根据所述每一类别日志的时间序列的日志量数据、所述上限值和下限值判定所述训练数据在所述当前检测时刻的前预设时间内的日志量是否稳定。
可选地,判定所述当前检测时刻是否为离群点,包括:
计算所述当前检测时刻的日志量,根据所述当前检测时刻的日志量以及所述训练数据判定所述当前检测时刻是否为离群点。
可选地,确定每一类别日志的动态阈值,包括:
对所述训练数据中的每一类别日志进行归一化处理,得到归一化数值;
根据所述归一化数值计算日志总体的标准差;
根据所述日志总体的标准差设定每一类别日志的对应的动态阈值。
可选地,根据检测结果判断所述当前时刻的日志检测点是否为异常点,包括:
若检测结果为当前检测时刻为突变点,则计算所述当前检测时刻与所述训练数据的平均值的比率;
判断所述比率是否超过所述动态阈值,若超过,则所述当前检测时刻为异常点。
根据本申请另一个方面,还提供了一种日志数据异常检测的设备,该设备包括:
聚类装置,用于按照日志相似度对原始日志进行聚类处理,得到若干类别日志;
统计装置,用于统计每一类别日志在当前检测时刻的前预设时间内的单位时间的日志量,得到每一类别日志的时间序列的日志量数据;
检测装置,用于根据所述每一类别日志的时间序列的日志量数据及对应的动态阈值判断当前检测时刻是否为异常点。
根据本申请又一个方面,还提供了一种日志数据异常检测的设备,所述设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如前述所述方法的操作。
根据本申请再一个方面,还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如前述所述的方法。
与现有技术相比,本申请通过按照日志相似度对原始日志进行聚类处理,得到若干类别日志;统计每一类别日志在当前检测时刻的前预设时间内的单位时间的日志量,得到每一类别日志的时间序列的日志量数据;根据所述每一类别日志的时间序列的日志量数据及对应的动态阈值判断当前检测时刻是否为异常点。从而从日志量层面发现日志异常,通过检测易于历史的日志量变化达到检测异常事件的目的;仅对历史数据的学习即可对当前点进行检测,无需提前训练和人为标记,适用性高、计算速度快以及应用范围广。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出根据本申请的一个方面提供的一种日志数据异常检测的方法流程示意图;
图2示出本申请一具体实施例中一种日志数据异常检测的方法流程示意图;
图3示出本申请又一个方面提供一种日志数据异常检测的设备的结构示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本申请作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(例如中央处理器(Central Processing Unit,CPU))、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RandomAccess Memory,RAM)和/或非易失性内存等形式,如只读存储器(Read Only Memory,ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(Phase-Change RAM,PRAM)、静态随机存取存储器(Static Random Access Memory,SRAM)、动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、数字多功能光盘(Digital Versatile Disk,DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
图1示出根据本申请的一个方面提供的一种日志数据异常检测的方法流程示意图,该方法包括:步骤S11~步骤S13,其中,步骤S11,按照日志相似度对原始日志进行聚类处理,得到若干类别日志;步骤S12,统计每一类别日志在当前检测时刻的前预设时间内的单位时间的日志量,得到每一类别日志的时间序列的日志量数据;步骤S13,根据所述每一类别日志的时间序列的日志量数据及对应的动态阈值判断当前检测时刻是否为异常点。从而通过将每一类在单位时间内的日志量转化为时间序列数据,再通过对该时间序列数据进行异常检测,发现其中的异常点,该方式是将从日志量层面发现日志异常,通过检测易于历史的日志量变化达到检测异常事件的目的。
具体地,在步骤S11中,按照日志相似度对原始日志进行聚类处理,得到若干类别日志;在此,先进行日志预处理,即将获取到的原始日志进行聚类处理,聚类处理时是按照日志的相似度来进行的,从而可以得到若干类别日志;其中,原始日志为需要进行检测的某一来源的日志,比如需要对某一服务进行访问时产生的日志进行检测,则该服务访问时得到的日志为原始日志,对该原始日志进行分类,即是对这一服务访问时所得到的所有日志进行了分类,从而为后续进行检测该服务访问的日志提供方便。
具体地,在步骤S12中,统计每一类别日志在当前检测时刻的前预设时间内的单位时间的日志量,得到每一类别日志的时间序列的日志量数据;在此,对获得每一类别日志进行一个统计,可以统计单位时间的日志量,比如统计每小时的日志量,从而可以积累在当前检测时刻前预设时间内的所有单位时间的日志量,比如当时检测时刻前2周的单位时间的日志量,从而得到每一类别日志的在这2周内的日志量数据,且该日志量数据是以时间序列进行的;其中,当前检测时刻为进行检测日志时在当前时刻所进行检测的位置,即当前的检测点,获取该当前检测点之前的历史日志量数据,从而利用获得的历史日志量数据来判定当前检测点是否为异常点。
具体地,在步骤S13中,根据所述每一类别日志的时间序列的日志量数据及对应的动态阈值判断当前检测时刻是否为异常点。在此,根据统计得到的每一类别日志的日志量,以及确定的每一类别对应的动态阈值来判断当前检测时刻是否为异常点,即利用每一类别日志在时间序列下的日志量来衡量下当前检测时刻时日志量是否也符合之前的日志量规律,从而可以判断出当前时刻的日志量是不是有问题,进而得出当前时刻的检测点是否为异常点;例如,原始日志通过聚类处理被划分为A,B,C,D……类日志,统计每一类日志在每小时内的日志量,从而转化为时间序列数据,再通过无监督异常检测方法对时间序列数据进行异常检测,发现其中的异常点,比如A类日志在过去的时间内一直保持平稳,每小时日志量为500条左右,而在当前检测时刻出现了暴增,达到800条,则该当前检测时刻的检测点为异常点。通过本申请所述的检测方式可以及时发现异于历史的日志量变化点,仅通过对历史数据学习即可对当前点进行检测,无需提前训练和人为标记,适用性高,计算速度快,应用范围广。
在本申请一些实施例中,在步骤S11中,按照日志的字段及词序的相似度对原始日志进行聚类处理,得到若干类别日志。在此,对原始日志进行聚类处理时,比如对1000条Nginx Web服务的访问日志,经过drain3进行聚类后,被划分为七类日志,该drain3进行聚类时是按照日志的字段以及词序的相似度进行的。
在本申请一些实施例中,在步骤S13中,根据所述每一类别日志的时间序列的日志量数据判定当前检测时刻的前预设时间内的日志量是否稳定,若稳定,则判定所述当前检测时刻是否为离群点;当所述当前检测时刻为离群点时,确定每一类别日志的动态阈值,根据所述动态阈值进行当前检测时刻的突变点检测;根据检测结果判断所述当前时刻的日志检测点是否为异常点。在此,先判定需要检测的日志的历史变化是否为稳定,如果历史变化随机性过强,则这类数据没有判定意义,因此,当历史数据稳定的前提下,判断当前检测时刻的检测点是否为离群点,通过上述两项判定后计算当前日志类别的动态阈值,从而利用动态阈值再次对这个离群点进行突变点检测,判定是否为异常点。在进行判定历史数据稳定时,是将每一类别日志的时间序列的日志量数据与当前检测时刻的前预设时间内的日志量进行比较,即比如前预设时间内为当前检测时刻的前2周内,则判断这前2周内的单位时间内的日志量的变化情况,使用该类别日志的时间序列的日志数量(单位时间的日志量)的稳定性来判定,若单位时间内的日志量的变化相差不大,则表示稳定;比如在前2周内的每小时的日志量都在300条至305条之间变化,因此,根据历史数据(前2周内的数据)可以判定是稳定的,可以使用前2周内的历史数据来检测当前检测时刻的日志是否有异变。
接上述实施例,将当前检测时刻的前预设时间内的历史日志作为训练数据;根据所述每一类别日志的时间序列的日志量数据判定所述训练数据在所述当前检测时刻的前预设时间内的日志量是否稳定。在此,统计每一类别日志的单位时间的日志量(比如每小时的日志量),积累14天的每一类别日志的历史数据作为训练数据,即积累14天内的每小时的日志量作为训练数据;从而判定这14天的每一类别的日志数据是否稳定,利用日志量来判定。
具体地,对所述训练数据计算每一类别日志的上限值和下限值;根据所述每一类别日志的时间序列的日志量数据、所述上限值和下限值判定所述训练数据在所述当前检测时刻的前预设时间内的日志量是否稳定。在此,可以使用五数概括法进行判定,对训练数据计算出其上下限值,该上下限值为该类日志在前预设时间内的单位时间的上限值和下限值,统计整体数值,比如绝大部分点(99%)分布在上下限区间内,则判定其相对稳定;例如,14天内的单位时间内的日志量按照时间序列为300条、301条、300条、305条、301条、300条……304条,日志量的上限值为305条,下限值为300条,则判定这些单位时间的日志量在上限值以及下限值的区间内的比例或者多个日志量记录直接的差值等进行比较,判定出是符合稳定,则继续进行下一步的离群点的判断;否则将判定其历史数据被判定为随机离散,则说明此类型数据无实际判定意义,不再进行下一步判断。
在本申请一些实施例中,判定所述当前检测时刻是否为离群点时,可以计算所述当前检测时刻的日志量,根据所述当前检测时刻的日志量以及所述训练数据判定所述当前检测时刻是否为离群点。在此,对当前检测时刻的日志数值进行计算,即计算当前检测时刻对应的日志量,判断当前的日志量与训练数据进行比较,是否符合训练数据的稳定性变化规律,比如是否大于99%的训练点数值,如果是,则说明是变化超出训练数据的稳定性变化的,判定其为离群点。例如,对于A类日志,之前两周时间内每小时日志条数为5~20条,而当前检测时刻的前一小时其却报出了30条日志,则判定当前检测时刻为离群点,即当前的检测点易于历史点的历史变化范围。
在本申请一些实施例中,进行确定动态阈值时,可以对所述训练数据中的每一类别日志进行归一化处理,得到归一化数值;根据所述归一化数值计算日志总体的标准差;根据所述日志总体的标准差设定每一类别日志的对应的动态阈值。在此,对训练数据的日志量进行归一化处理,即将其等比例缩小到0~1变化区间,随后对归一化的数值计算其总体标准差,标准差取值区间为0~1,其越小则说明前期数据(训练数据)越稳定,则对当前检测时刻的检测点进行突变检测时设定阈值越小,检测灵敏度越高;标准差数值越大,则说明前期数据越不稳定,随机离散度高,则对检测点进行突变检测时设定阈值越大,检测灵敏度越低。例如,标准差在0~0.2范围内,则突变检测的判断阈值为历史数据(训练数据)平均值的1.2倍,即比如对于A类日志,获取到前14天的每小时的日志量进行平均值计算,然后取该平均值的1.2倍作为A类日志的动态阈值;若检测A类日志时,当前检测时刻对应的日志量超过该动态阈值,则判定为异常。又例如标准差在0.5~0.8范围,则突变检测的判断阈值为历史数据平均值的4倍,若当前检测时刻对应的日志量超过此刻的动态阈值(即平均值的4倍),则判定为异常。
在本申请一些实施例中,在步骤S13中,若检测结果为当前检测时刻为突变点,则计算所述当前检测时刻与所述训练数据的平均值的比率;判断所述比率是否超过所述动态阈值,若超过,则所述当前检测时刻为异常点。在此,当进行突变检测时,检测出当前检测时刻对应的日志量超过动态阈值,则说明该当前检测时刻为突变点,此时计算检测点与训练数据的平均值的比率,若该比率超过动态阈值,则判定当前检测时刻为异常点。从而仅对历史数据的学习即可对当前点进行检测,无需提前训练和人为标记,适用性高、计算速度快以及应用范围广。
在本申请一具体实施例中,如图2所示,获得原始日志,该原始日志为监控数据,首先基于字段及词序对该原始日志相似度进行聚类处理,将原始日志划分为若干类,比如使用drain3进行聚类,划分为A、B、C……类;接着,分别统计A、B、C……类日志的单位时间日志量的时间序列数据,积累并输出时间序列数据(比如积累14天),将输出的前期数据作为训练数据,对该训练数据进行稳定性判定,若稳定,则对检测点数值进行计算,判定其是否为离群点,若是,则对训练点数值进行归一化处理,计算标准差并确定动态阈值,从而输出动态阈值进行突变点检测,计算检测点与前期数据的平均值的比率,若该比率超过动态阈值,则判定检测点为异常点;从而实现针对时间序列日志监控数据的无监督异常发现,从日志量层面发现日志异常,通过检测异于历史的日志量变化达到检测异常事件的目的。
此外,本申请实施例还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现前述一种的方法。
与上文所述的方法相对应的,本申请还提供一种终端,其包括能够执行上述图1或图2或各个实施例所述的方法步骤的模块或单元,这些模块或单元可以通过硬件、软件或软硬结合的方式来实现,本申请并不限定。例如,在本申请一实施例中,还提供了一种日志数据异常检测的设备,所述设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如前述所述方法的操作。
例如,计算机可读指令在被执行时使所述一个或多个处理器:
按照日志相似度对原始日志进行聚类处理,得到若干类别日志;
统计每一类别日志在当前检测时刻的前预设时间内的单位时间的日志量,得到每一类别日志的时间序列的日志量数据;
根据所述每一类别日志的时间序列的日志量数据及对应的动态阈值判断当前检测时刻是否为异常点。
图3示出本申请又一个方面提供一种日志数据异常检测的设备的结构示意图,所述设备包括:聚类装置11、统计装置12及检测装置13,其中,聚类装置11用于按照日志相似度对原始日志进行聚类处理,得到若干类别日志;统计装置12用于统计每一类别日志在当前检测时刻的前预设时间内的单位时间的日志量,得到每一类别日志的时间序列的日志量数据;检测装置13用于根据所述每一类别日志的时间序列的日志量数据及对应的动态阈值判断当前检测时刻是否为异常点。
需要说明的是,聚类装置11、统计装置12及检测装置13执行的内容分别与上述步骤S11、S12和S13中的内容相同或相应相同,为简明起见,在此不再赘述。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (9)

1.一种日志数据异常检测的方法,其特征在于,所述方法包括:
按照日志相似度对原始日志进行聚类处理,得到若干类别日志;
统计每一类别日志在当前检测时刻的前预设时间内的单位时间的日志量,得到每一类别日志的时间序列的日志量数据;
根据所述每一类别日志的时间序列的日志量数据及对应的动态阈值判断当前检测时刻是否为异常点;
其中,根据所述每一类别日志的时间序列的日志量数据及对应的动态阈值判断当前检测时刻是否为异常点,包括:
根据所述每一类别日志的时间序列的日志量数据判定当前检测时刻的前预设时间内的日志量是否稳定,若稳定,则判定所述当前检测时刻是否为离群点;
当所述当前检测时刻为离群点时,确定每一类别日志的动态阈值,根据所述动态阈值进行当前检测时刻的突变点检测;
若检测结果为当前检测时刻为突变点,则计算所述当前检测时刻与训练数据的平均值的比率;
判断所述比率是否超过动态阈值,若超过,则所述当前检测时刻为异常点。
2.根据权利要求1所述的方法,其特征在于,按照日志相似度对原始日志进行聚类处理,得到若干类别日志,包括:
按照日志的字段及词序的相似度对原始日志进行聚类处理,得到若干类别日志。
3.根据权利要求1所述的方法,其特征在于,根据所述每一类别日志的时间序列的日志量数据判定当前检测时刻的前预设时间内的日志量是否稳定,包括:
将当前检测时刻的前预设时间内的历史日志作为训练数据;
根据所述每一类别日志的时间序列的日志量数据判定所述训练数据在所述当前检测时刻的前预设时间内的日志量是否稳定。
4.根据权利要求3所述的方法,其特征在于,根据所述每一类别日志的时间序列的日志量数据判定所述训练数据在所述当前检测时刻的前预设时间内的日志量是否稳定,包括:
对所述训练数据计算每一类别日志的上限值和下限值;
根据所述每一类别日志的时间序列的日志量数据、所述上限值和下限值判定所述训练数据在所述当前检测时刻的前预设时间内的日志量是否稳定。
5.根据权利要求3或4所述的方法,其特征在于,判定所述当前检测时刻是否为离群点,包括:
计算所述当前检测时刻的日志量,根据所述当前检测时刻的日志量以及所述训练数据判定所述当前检测时刻是否为离群点。
6.根据权利要求3所述的方法,其特征在于,确定每一类别日志的动态阈值,包括:
对所述训练数据中的每一类别日志进行归一化处理,得到归一化数值;
根据所述归一化数值计算日志总体的标准差;
根据所述日志总体的标准差设定每一类别日志的对应的动态阈值。
7.一种日志数据异常检测的设备,其特征在于,所述设备包括:
聚类装置,用于按照日志相似度对原始日志进行聚类处理,得到若干类别日志;
统计装置,用于统计每一类别日志在当前检测时刻的前预设时间内的单位时间的日志量,得到每一类别日志的时间序列的日志量数据;
检测装置,用于根据所述每一类别日志的时间序列的日志量数据及对应的动态阈值判断当前检测时刻是否为异常点;
其中,所述检测装置用于:
根据所述每一类别日志的时间序列的日志量数据判定当前检测时刻的前预设时间内的日志量是否稳定,若稳定,则判定所述当前检测时刻是否为离群点;
当所述当前检测时刻为离群点时,确定每一类别日志的动态阈值,根据所述动态阈值进行当前检测时刻的突变点检测;
若检测结果为当前检测时刻为突变点,则计算所述当前检测时刻与训练数据的平均值的比率;
判断所述比率是否超过动态阈值,若超过,则所述当前检测时刻为异常点。
8.一种日志数据异常检测的设备,其特征在于,所述设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如权利要求1至6中任一项所述方法的操作。
9.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至6中任一项所述的方法。
CN202110800694.7A 2021-07-15 2021-07-15 一种日志数据异常检测的方法及设备 Active CN113535454B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110800694.7A CN113535454B (zh) 2021-07-15 2021-07-15 一种日志数据异常检测的方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110800694.7A CN113535454B (zh) 2021-07-15 2021-07-15 一种日志数据异常检测的方法及设备

Publications (2)

Publication Number Publication Date
CN113535454A CN113535454A (zh) 2021-10-22
CN113535454B true CN113535454B (zh) 2023-05-30

Family

ID=78099439

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110800694.7A Active CN113535454B (zh) 2021-07-15 2021-07-15 一种日志数据异常检测的方法及设备

Country Status (1)

Country Link
CN (1) CN113535454B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114138620B (zh) * 2021-11-16 2024-01-16 苏州浪潮智能科技有限公司 一种云平台日志暴增的检测方法、装置、设备、存储介质
CN115168154B (zh) * 2022-07-26 2023-06-23 北京优特捷信息技术有限公司 一种基于动态基线的异常日志检测方法、装置及设备
CN117009911B (zh) * 2023-10-08 2023-12-08 深圳安天网络安全技术有限公司 一种目标事件的异常判定方法、装置、介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347547A (zh) * 2019-05-27 2019-10-18 中国平安人寿保险股份有限公司 基于深度学习的日志异常检测方法、装置、终端及介质
CN111767957A (zh) * 2020-07-01 2020-10-13 中国银行股份有限公司 一种日志异常的检测方法、装置、存储介质及电子设备
CN112235327A (zh) * 2020-12-16 2021-01-15 中移(苏州)软件技术有限公司 异常日志检测方法、装置、设备和计算机可读存储介质
WO2021073144A1 (zh) * 2019-10-18 2021-04-22 平安科技(深圳)有限公司 分布式文件系统的监控方法、装置、终端及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8495429B2 (en) * 2010-05-25 2013-07-23 Microsoft Corporation Log message anomaly detection
CN114048051A (zh) * 2017-07-25 2022-02-15 华为技术有限公司 检测方法、设备及计算机可读存储介质
CN111984442A (zh) * 2019-05-22 2020-11-24 中兴通讯股份有限公司 计算机集群系统的异常检测方法及装置、存储介质
US11513935B2 (en) * 2019-08-30 2022-11-29 Dell Products L.P. System and method for detecting anomalies by discovering sequences in log entries
CN112131075B (zh) * 2020-09-15 2023-04-28 上海上讯信息技术股份有限公司 一种用于存储监控数据异常检测的方法及设备
CN112306982B (zh) * 2020-11-16 2021-07-16 杭州海康威视数字技术股份有限公司 异常用户检测方法、装置、计算设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347547A (zh) * 2019-05-27 2019-10-18 中国平安人寿保险股份有限公司 基于深度学习的日志异常检测方法、装置、终端及介质
WO2021073144A1 (zh) * 2019-10-18 2021-04-22 平安科技(深圳)有限公司 分布式文件系统的监控方法、装置、终端及存储介质
CN111767957A (zh) * 2020-07-01 2020-10-13 中国银行股份有限公司 一种日志异常的检测方法、装置、存储介质及电子设备
CN112235327A (zh) * 2020-12-16 2021-01-15 中移(苏州)软件技术有限公司 异常日志检测方法、装置、设备和计算机可读存储介质

Also Published As

Publication number Publication date
CN113535454A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
CN113535454B (zh) 一种日志数据异常检测的方法及设备
CN111092757B (zh) 一种异常数据的检测方法、系统及设备
CN111538642B (zh) 一种异常行为的检测方法、装置、电子设备及存储介质
CN109934268B (zh) 异常交易检测方法及系统
CN111767957B (zh) 一种日志异常的检测方法、装置、存储介质及电子设备
CN112131075B (zh) 一种用于存储监控数据异常检测的方法及设备
CN106294406B (zh) 一种用于处理应用访问数据的方法与设备
CN106301979B (zh) 检测异常渠道的方法和系统
CN113641526A (zh) 告警根因定位方法、装置、电子设备及计算机存储介质
CN110046188A (zh) 业务处理方法及其系统
US10637878B2 (en) Multi-dimensional data samples representing anomalous entities
CN114285587B (zh) 域名鉴别方法和装置、域名分类模型的获取方法和装置
CN112131078B (zh) 一种监控磁盘容量的方法及设备
CN112130944A (zh) 页面异常的检测方法、装置、设备及存储介质
CN111984515B (zh) 多源异构日志分析方法
CN114581219A (zh) 一种反电信网络诈骗预警方法及系统
CN113032242B (zh) 数据标记方法及装置,计算机存储介质和电子设备
CN114756401B (zh) 基于日志的异常节点检测方法、装置、设备及介质
CN117076184B (zh) 一种交易系统检测方法、装置及存储介质
CN115237739B (zh) 板卡运行环境的分析方法、装置、设备及可读存储介质
CN111984516B (zh) 基于sgse-ecc的日志异常检测系统
CN110689034B (zh) 一种分类器的优化方法及设备
CN115337648A (zh) 外挂检测方法、装置、电子设备及计算机可读存储介质
CN116483809A (zh) 数据质量检测方法、装置及设备
CN114691447A (zh) 一种设备的状态分析方法和分析装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant