CN111459776A - 一种基于动态时间规整的服务器日志异常判断方法与系统 - Google Patents
一种基于动态时间规整的服务器日志异常判断方法与系统 Download PDFInfo
- Publication number
- CN111459776A CN111459776A CN202010154801.9A CN202010154801A CN111459776A CN 111459776 A CN111459776 A CN 111459776A CN 202010154801 A CN202010154801 A CN 202010154801A CN 111459776 A CN111459776 A CN 111459776A
- Authority
- CN
- China
- Prior art keywords
- log
- server
- sequences
- judged
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 12
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 230000005856 abnormality Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000010835 comparative analysis Methods 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 abstract description 9
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 101100452236 Caenorhabditis elegans inf-1 gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供了一种基于动态时间规整的服务器日志异常判断方法与系统,本发明通过选择服务器正常工作时一段时间内的日志数据作为标准日志序列,并选取任意一段时间内的日志数据作为待判断日志序列,通过动态时间规整算法比较标准日志序列和待判断日志序列的最大距离,作为评判两个序列相似性的依据,从而根据一段时间内服务器日志的数量多少判断服务器是否出现异常,完成服务器日志自动化异常检测。本发明可快速进行判断异常,具有速度快、方法简单的特点,可用于服务器或者云端对服务器的状态进行监控,提高监控准确性和效率。
Description
技术领域
本发明涉及服务器监控技术领域,特别是一种基于动态时间规整的服务器日志异常判断方法与系统。
背景技术
服务器的日志分析和监控具有重要价值。服务器所能产生的日志数量往往是人肉眼难以分析和判断的,定期的进行自动化分析可以帮助用户了解服务器的运行状况,根据日志的内容判断服务器的异常是一种可靠的手段,而现有技术中缺乏此种自动化分析技术。
发明内容
本发明的目的是提供一种基于动态时间规整的服务器日志异常判断方法与系统,旨在解决现有技术中缺少服务器日志数量自动分析手段的问题,实现服务器日志自动化异常检测,提高监控准确性和效率。
为达到上述技术目的,本发明提供了一种基于动态时间规整的服务器日志异常判断方法,所述方法包括以下操作:
选取服务器正常工作时一段时间内的日志数据,记录该段时间内每隔固定时间间隔服务器所产生的日志数量,生成标准日志序列;
选取待监控的任意时间段内按照所述固定时间间隔所产生的服务器日志数量,生成待判断日志序列;
利用动态时间规整算法计算标准日志序列和待判断日志序列的最大距离,并根据最大距离判断两个序列之间的相似性,以此判断服务器日志是否存在异常。
优选地,所述利用动态时间规整算法计算标准日志序列和待判断日志序列的最大距离具体为:
根据标准日志序列和待判断日志序列创建二维矩阵表xi,j,0≤i≤M,0≤j≤N,其中M为标准日志序列最大数量,N为待判断日志序列最大数量;
依次计算表中每一位置xi,j的值,作为两个序列各个点之间的最佳距离;
将xM,N作为两个序列的最大距离。
优选地,所述表中每一位置xi,j的值计算公式如下:
xi,j=d(i,j)+min(xi-1,j,xi-1,j-1,xi,j-1)。
本发明还提供了一种基于动态时间规整的服务器日志异常判断系统,所述系统包括:
标准日志序列获取模块,用于选取服务器正常工作时一段时间内的日志数据,记录该段时间内每隔固定时间间隔服务器所产生的日志数量,生成标准日志序列;
待判断日志序列获取模块,用于选取待监控的任意时间段内按照所述固定时间间隔所产生的服务器日志数量,生成待判断日志序列;
比较分析模块,用于利用动态时间规整算法计算标准日志序列和待判断日志序列的最大距离,并根据最大距离判断两个序列之间的相似性,以此判断服务器日志是否存在异常。
优选地,所述比较分析模块包括:
二维矩阵表创建单元,用于根据标准日志序列和待判断日志序列创建二维矩阵表xi,j,0≤i≤M,0≤j≤N,其中M为标准日志序列最大数量,N为待判断日志序列最大数量;
最大距离计算单元,用于依次计算表中每一位置xi,j的值,作为两个序列各个点之间的最佳距离,并将xM,N作为两个序列的最大距离。
优选地,所述表中每一位置xi,j的值计算公式如下:
xi,j=d(i,j)+min(xi-1,j,xi-1,j-1,xi,j-1)。
本发明还提供了一种基于动态时间规整的服务器日志异常判断设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现所述的基于动态时间规整的服务器日志异常判断方法。
本发明还提供了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现所述的基于动态时间规整的服务器日志异常判断方法。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
与现有技术相比,本发明通过选择服务器正常工作时一段时间内的日志数据作为标准日志序列,并选取任意一段时间内的日志数据作为待判断日志序列,通过动态时间规整算法比较标准日志序列和待判断日志序列的最大距离,作为评判两个序列相似性的依据,从而根据一段时间内服务器日志的数量多少判断服务器是否出现异常,完成服务器日志自动化异常检测。本发明可快速进行判断异常,具有速度快、方法简单的特点,可用于服务器或者云端对服务器的状态进行监控,提高监控准确性和效率。
附图说明
图1为本发明实施例中所提供的一种基于动态时间规整的服务器日志异常判断方法流程图;
图2为本发明实施例中所提供的一种基于动态时间规整的服务器日志异常判断系统框图。
具体实施方式
为了能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
下面结合附图对本发明实施例所提供的一种基于动态时间规整的服务器日志异常判断方法与系统进行详细说明。
如图1所示,本发明公开了一种基于动态时间规整的服务器日志异常判断方法,所述方法包括以下操作:
选取服务器正常工作时一段时间内的日志数据,记录该段时间内每隔固定时间间隔服务器所产生的日志数量,生成标准日志序列;
选取待监控的任意时间段内按照所述固定时间间隔所产生的服务器日志数量,生成待判断日志序列;
利用动态时间规整算法计算标准日志序列和待判断日志序列的最大距离,并根据最大距离判断两个序列之间的相似性,以此判断服务器日志是否存在异常。
服务器产生的日志主要记录时间戳信息和日志条目,两者是一一对应的关系。当服务器运行异常的时候,所产生的日志条目会有一定的规律性,会区别于正常状态的日志条目。区别正常和异常要根据一段时间的日志序列的内容,在本发明实施例中,假设日志都是按照时间进行排序。
动态时间规整(Dynamic Time Wraping,DTW)作为一种时间序列分析方法,被广泛应用于对比时间序列数据的相似性,例如可用来比较基因序列的相似性,如果两段时间序列的数据是一样的,那么动态时间规整所测量出的距离为0,就是完全相似。动态时间规整是一种基于动态编程思想的算法,属于无监督算法,即不需要进行任何的数据打标签工作。
选择服务器正常工作时一段时间内的日志数据作为标准,记录该段时间内每隔固定时间间隔服务器所产生的日志数量,从而生成一个关于服务器日志数量的序列,作为标准日志序列。
选择另一段时间内,按照所述固定时间间隔所产生的服务器日志数量,生成日志数量序列,作为待判断日志序列。并将其与标准日志序列进行比较,利用动态时间规整进行相似性比较,得到比较数值。
假设标准日志序列为:日志1={1,2,3,5,5,5,6};
待判断日志序列为:日志2={1,1,2,2,3,5}。
定义日志1和日志2中两个点之间的距离:
d(i,j)=|i-j|
根据上述两个序列创建二维矩阵表,计算日志1中每个点与日志2中每个点之间的距离,并找到两个序列之间的最佳匹配。
如表1所示,对于日志1[i]和日志2[j]的序列,xi,j,0≤i≤M,0≤j≤N为两个序列之间的最佳距离,其中M为标准日志序列最大数量,N为待判断日志序列最大数量。对于表中第一行,如果不从日志1中取任何值,则此行与日志2之间的距离将为无穷大,因此第一行为无穷大,而0和0之间的距离为0。
表1
0 | 1 | 1 | 2 | 2 | 3 | 5 | |
0 | 0 | inf | inf | inf | inf | inf | inf |
1 | inf | ||||||
2 | inf | ||||||
3 | inf | ||||||
5 | inf | ||||||
5 | inf | ||||||
5 | inf | ||||||
6 | inf |
对于两个序列中每个点之间的距离,并将其与找到的最小距离相加,从而提供两个序列到某一位置的最佳距离。
xi,j=d(i,j)+min(xi-1,j,xi-1,j-1,xi,j-1)
对于d1,1=0,表中x0,1、x0,0、x1,0最小值为x0,0,因此,x1,1的值为0+0=0。依次计算表中每个位置的值,如表2所示。
表2
表中x7,6的值表示两个指定序列之间的最大距离,因此,标准日志序列和待判断日志序列之间的距离为1。
通过序列之间的最大距离来表征两个序列的相似性,数值越大则表明两个序列越不相似,因此存在异常的可能性也就越大。对于异常的判断,设置一个阈值,当最大距离大于阈值时,启动异常检查。该阈值的设置,可根据主观经验进行设置,并可动态根据实际情况进行调整。
本发明实施例通过选择服务器正常工作时一段时间内的日志数据作为标准日志序列,并选取任意一段时间内的日志数据作为待判断日志序列,通过动态时间规整算法比较标准日志序列和待判断日志序列的最大距离,作为评判两个序列相似性的依据,从而根据一段时间内服务器日志的数量多少判断服务器是否出现异常,完成服务器日志自动化异常检测。本发明可快速进行判断异常,具有速度快、方法简单的特点,可用于服务器或者云端对服务器的状态进行监控,提高监控准确性和效率。
如图2所示,本发明实施例还公开了一种基于动态时间规整的服务器日志异常判断系统,所述系统包括:
标准日志序列获取模块,用于选取服务器正常工作时一段时间内的日志数据,记录该段时间内每隔固定时间间隔服务器所产生的日志数量,生成标准日志序列;
待判断日志序列获取模块,用于选取待监控的任意时间段内按照所述固定时间间隔所产生的服务器日志数量,生成待判断日志序列;
比较分析模块,用于利用动态时间规整算法计算标准日志序列和待判断日志序列的最大距离,并根据最大距离判断两个序列之间的相似性,以此判断服务器日志是否存在异常。
选择服务器正常工作时一段时间内的日志数据作为标准,记录该段时间内每隔固定时间间隔服务器所产生的日志数量,从而生成一个关于服务器日志数量的序列,作为标准日志序列。
选择另一段时间内,按照所述固定时间间隔所产生的服务器日志数量,生成日志数量序列,作为待判断日志序列。并将其与标准日志序列进行比较,利用动态时间规整进行相似性比较,得到比较数值。
假设标准日志序列为:日志1={1,2,3,5,5,5,6};
待判断日志序列为:日志2={1,1,2,2,3,5}。
定义日志1和日志2中两个点之间的距离:
d(i,j)=|i-j|
根据上述两个序列创建二维矩阵表,计算日志1中每个点与日志2中每个点之间的距离,并找到两个序列之间的最佳匹配。
对于日志1[i]和日志2[j]的序列,xi,j,0≤i≤M,0≤j≤N为两个序列之间的最佳距离,其中M为标准日志序列最大数量,N为待判断日志序列最大数量。对于表中第一行,如果不从日志1中取任何值,则此行与日志2之间的距离将为无穷大,因此第一行为无穷大,而0和0之间的距离为0。
对于两个序列中每个点之间的距离,并将其与找到的最小距离相加,从而提供两个序列到某一位置的最佳距离。
xi,j=d(i,j)+min(xi-1,j,xi-1,j-1,xi,j-1)
对于d1,1=0,表中x0,1、x0,0、x1,0最小值为x0,0,因此,x1,1的值为0+0=0。依次计算表中每个位置的值。
表中x7,6的值表示两个指定序列之间的最大距离,因此,标准日志序列和待判断日志序列之间的距离为1。
通过序列之间的最大距离来表征两个序列的相似性,数值越大则表明两个序列越不相似,因此存在异常的可能性也就越大。对于异常的判断,设置一个阈值,当最大距离大于阈值时,启动异常检查。该阈值的设置,可根据主观经验进行设置,并可动态根据实际情况进行调整。
本发明实施例还公开了一种基于动态时间规整的服务器日志异常判断设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现所述的基于动态时间规整的服务器日志异常判断方法。
本发明实施例还公开了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现所述的基于动态时间规整的服务器日志异常判断方法。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于动态时间规整的服务器日志异常判断方法,其特征在于,所述方法包括以下操作:
选取服务器正常工作时一段时间内的日志数据,记录该段时间内每隔固定时间间隔服务器所产生的日志数量,生成标准日志序列;
选取待监控的任意时间段内按照所述固定时间间隔所产生的服务器日志数量,生成待判断日志序列;
利用动态时间规整算法计算标准日志序列和待判断日志序列的最大距离,并根据最大距离判断两个序列之间的相似性,以此判断服务器日志是否存在异常。
2.根据权利要求1所述的一种基于动态时间规整的服务器日志异常判断方法,其特征在于,所述利用动态时间规整算法计算标准日志序列和待判断日志序列的最大距离具体为:
根据标准日志序列和待判断日志序列创建二维矩阵表xi,j,0≤i≤M,0≤j≤N,其中M为标准日志序列最大数量,N为待判断日志序列最大数量;
依次计算表中每一位置xi,j的值,作为两个序列各个点之间的最佳距离;
将xM,N作为两个序列的最大距离。
3.根据权利要求2所述的一种基于动态时间规整的服务器日志异常判断方法,其特征在于,所述表中每一位置xi,j的值计算公式如下:
xi,j=d(i,j)+min(xi-1,j,xi-1,j-1,xi,j-1)。
4.一种基于动态时间规整的服务器日志异常判断系统,其特征在于,所述系统包括:
标准日志序列获取模块,用于选取服务器正常工作时一段时间内的日志数据,记录该段时间内每隔固定时间间隔服务器所产生的日志数量,生成标准日志序列;
待判断日志序列获取模块,用于选取待监控的任意时间段内按照所述固定时间间隔所产生的服务器日志数量,生成待判断日志序列;
比较分析模块,用于利用动态时间规整算法计算标准日志序列和待判断日志序列的最大距离,并根据最大距离判断两个序列之间的相似性,以此判断服务器日志是否存在异常。
5.根据权利要求4所述的一种基于动态时间规整的服务器日志异常判断系统,其特征在于,所述比较分析模块包括:
二维矩阵表创建单元,用于根据标准日志序列和待判断日志序列创建二维矩阵表xi,j,0≤i≤M,0≤j≤N,其中M为标准日志序列最大数量,N为待判断日志序列最大数量;
最大距离计算单元,用于依次计算表中每一位置xi,j的值,作为两个序列各个点之间的最佳距离,并将xM,N作为两个序列的最大距离。
6.根据权利要求5所述的一种基于动态时间规整的服务器日志异常判断系统,其特征在于,所述表中每一位置xi,j的值计算公式如下:
xi,j=d(i,j)+min(xi-1,j,xi-1,j-1,xi,j-1)。
7.一种基于动态时间规整的服务器日志异常判断设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现根据权利要求1至3任意一项所述的基于动态时间规整的服务器日志异常判断方法。
8.一种可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现根据权利要求1至3任意一项所述的基于动态时间规整的服务器日志异常判断方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010154801.9A CN111459776A (zh) | 2020-03-08 | 2020-03-08 | 一种基于动态时间规整的服务器日志异常判断方法与系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010154801.9A CN111459776A (zh) | 2020-03-08 | 2020-03-08 | 一种基于动态时间规整的服务器日志异常判断方法与系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111459776A true CN111459776A (zh) | 2020-07-28 |
Family
ID=71678352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010154801.9A Withdrawn CN111459776A (zh) | 2020-03-08 | 2020-03-08 | 一种基于动态时间规整的服务器日志异常判断方法与系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111459776A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112540309A (zh) * | 2020-12-10 | 2021-03-23 | 广州能源检测研究院 | 一种基于电池循环数据相似度分析的电池监控系统及方法 |
CN113344059A (zh) * | 2021-05-31 | 2021-09-03 | 武汉大学 | 一种基于时间序列的空间分析异常检测方法 |
CN115871745A (zh) * | 2022-12-28 | 2023-03-31 | 江苏安防科技有限公司 | 一种应用于轨道交通的智能维护方法与装置 |
-
2020
- 2020-03-08 CN CN202010154801.9A patent/CN111459776A/zh not_active Withdrawn
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112540309A (zh) * | 2020-12-10 | 2021-03-23 | 广州能源检测研究院 | 一种基于电池循环数据相似度分析的电池监控系统及方法 |
CN112540309B (zh) * | 2020-12-10 | 2024-02-06 | 广州能源检测研究院 | 一种基于电池循环数据相似度分析的电池监控系统及方法 |
CN113344059A (zh) * | 2021-05-31 | 2021-09-03 | 武汉大学 | 一种基于时间序列的空间分析异常检测方法 |
CN113344059B (zh) * | 2021-05-31 | 2022-06-07 | 武汉大学 | 一种基于时间序列的空间分析异常检测方法 |
CN115871745A (zh) * | 2022-12-28 | 2023-03-31 | 江苏安防科技有限公司 | 一种应用于轨道交通的智能维护方法与装置 |
CN115871745B (zh) * | 2022-12-28 | 2024-05-10 | 江苏安防科技有限公司 | 一种应用于轨道交通的智能维护方法与装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111459776A (zh) | 一种基于动态时间规整的服务器日志异常判断方法与系统 | |
CN110826648B (zh) | 一种利用时序聚类算法实现故障检测的方法 | |
WO2020147480A1 (zh) | 基于流式处理的监控指标异常检测方法、装置及设备 | |
WO2018177275A1 (zh) | 一种多数据源用户信息整合方法和装置 | |
WO2017020614A1 (zh) | 一种检测磁盘的方法及装置 | |
CN108809734B (zh) | 网络告警根源分析方法、系统、存储介质及计算机设备 | |
TWI717831B (zh) | 攻擊路徑偵測方法、攻擊路徑偵測系統及非暫態電腦可讀取媒體 | |
CN108399115B (zh) | 一种运维操作检测方法、装置及电子设备 | |
GB2604081A (en) | Identification of constituent events in an event storm in operations management | |
CN113033639A (zh) | 一种异常数据检测模型的训练方法、电子设备及存储介质 | |
CN116594801A (zh) | 一种大数据云计算的故障分析系统 | |
CN112181792A (zh) | 一种时序数据异常标注的方法、系统及相关组件 | |
CN107562593A (zh) | 一种验证内存ecc功能的自动化测试方法与系统 | |
CN116743474A (zh) | 决策树生成方法、装置、电子设备及存储介质 | |
CN113157520B (zh) | 一种基于变分自动编码器的分布式系统异常检测方法 | |
CN116079498A (zh) | 一种刀具异常信号的识别方法 | |
CN111984515B (zh) | 多源异构日志分析方法 | |
US11750629B2 (en) | Classification based anomaly detection | |
CN110609832B (zh) | 一种面向流式数据的非重复采样方法 | |
KR102343139B1 (ko) | 어노멀리 검출방법 및 그 장치 | |
CN112307086A (zh) | 一种消防业务中自动化数据校验方法及装置 | |
CN111625825A (zh) | 一种病毒检测方法、装置、设备及存储介质 | |
CN110929800A (zh) | 一种基于sax算法的商业体异常用电检测方法 | |
CN112884167B (zh) | 一种基于机器学习的多指标异常检测方法及其应用系统 | |
CN114310488B (zh) | 刀具断裂检测模型的生成方法、检测方法、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20200728 |