CN109684162A - 设备状态预测方法、系统、终端及计算机可读存储介质 - Google Patents

设备状态预测方法、系统、终端及计算机可读存储介质 Download PDF

Info

Publication number
CN109684162A
CN109684162A CN201811334475.9A CN201811334475A CN109684162A CN 109684162 A CN109684162 A CN 109684162A CN 201811334475 A CN201811334475 A CN 201811334475A CN 109684162 A CN109684162 A CN 109684162A
Authority
CN
China
Prior art keywords
index
monitored object
classification
time series
trend
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811334475.9A
Other languages
English (en)
Other versions
CN109684162B (zh
Inventor
王亚杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811334475.9A priority Critical patent/CN109684162B/zh
Priority to PCT/CN2019/077513 priority patent/WO2020093637A1/zh
Publication of CN109684162A publication Critical patent/CN109684162A/zh
Application granted granted Critical
Publication of CN109684162B publication Critical patent/CN109684162B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种设备状态预测方法、系统、终端及计算机可读存储介质。所述设备状态预测方法包括:获取第一监控对象及与其关联的第二监控对象的时间序列数据;根据第二监控对象的时间序列数据生成多个趋势图,其中每一趋势图对应于第二监控对象的一类型指标;统计得出第二监控对象的每一趋势图中包含的极值点;根据每一趋势图的极值点判断与所述趋势图对应的类型指标是否发生异常;当第二监控对象的第一类型指标被判定为发生异常时,根据所述第一类型指标的时间序列数据预测与其关联的第一监控对象的第二类型指标的状态。本发明基于数据分析算法可实现对监控对象的运行状态趋势进行分析与预测,进而可做到问题提前发现,提前进行告警通知。

Description

设备状态预测方法、系统、终端及计算机可读存储介质
技术领域
本发明涉及数据处理领域,尤其涉及一种设备状态预测方法、系统、终端及计算机可读存储介质。
背景技术
本部分旨在为权利要求书及具体实施方式中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
进行设备故障的自动监测,已经成为保障设备正常运行的一种重要技术手段。当设备的某项参数超出预先设定的报警门限值时,设备可以发出相应的报警信息。现有的设备监控平台无法对监控对象的运行状态趋势进行分析判断,进而无法做到问题提前发现,无法提前告警通知。
发明内容
鉴于上述,本发明提供一种设备状态预测方法、系统、终端及计算机可读存储介质,其可以实现提前对设备运行状态趋势进行分析预测,以提前进行预警。
本申请一实施方式提供一种设备状态预测方法,所述方法包括:
获取第一监控对象及与所述第一监控对象关联的第二监控对象的时间序列数据,其中每一所述监控对象包括一个或者多个监控类别,每一所述监控类别包括一个或者多个类型指标,所述时间序列数据为在不同时间节点上每一所述类型指标的参数集;
根据所述第二监控对象的时间序列数据生成多个趋势图,其中每一所述趋势图对应于所述第二监控对象的每一类型指标;
通过预设趋势分析算法统计得出所述第二监控对象的每一趋势图中包含的极值点;
根据每一所述趋势图的极值点判断与所述趋势图对应的类型指标是否发生异常;及
当所述第二监控对象的第一类型指标被判定为发生异常时,根据所述第一类型指标的时间序列数据预测所述第一监控对象的第二类型指标的状态,其中,所述第一监控对象的第二类型指标与所述第二监控对象的第一类型指标相关联。
优选地,所述根据所述第二监控对象的时间序列数据生成多个趋势图,其中每一所述趋势图对应于所述第二监控对象的每一类型指标的步骤包括:
将所述第二监控对象的时间序列数据按照每一监控类别进行一次分类,再将每一所述监控类别的时间序列数据按照每一类型指标进行二次分类;
建立一XY坐标轴,并将所述第一类型指标的时间序列数据中每一时间节点作为趋势图在X轴上的点;及
将每一所述时间节点对应的参数信息作为所述趋势图在Y轴上的值,以得到对应于所述第一类型指标的趋势图。
优选地,所述通过预设趋势分析算法统计得出所述第二监控对象的每一趋势图中包含的极值点的步骤包括:
从所述第二监控对象的一趋势图中任意选取一时间节点数据及与所述时间节点数据相邻的上一时间节点数据;
计算所述时间节点数据与所述上一时间节点数据之间的趋势斜率;
判断计算得到的趋势斜率是否大于预设阈值;及
当所述趋势斜率大于所述预设阈值时,判定所述时间节点数据为所述趋势图中的一极值点。
优选地,所述时间节点数据与所述上一时间节点数据的趋势斜率可以通过以下数学式计算得到:
Km=|(Vm-Vm-1)/(tm-tm-1)|;
其中,Km为趋势斜率,tm为所述时间节点数据对应的时间节点,tm-1为与tm相邻的上一时间节点,Vm为时间节点tm对应的参数信息,Vm-1为时间节点tm-1对应的参数信息。
优选地,所述根据每一所述趋势图的极值点判断与所述趋势图对应的类型指标是否发生异常的步骤包括:
从所述第二监控对象的一趋势图中任意选取一极值点,并获取与所述极值点相邻的至少两个在先时间节点数据;
分别计算所述极值点与第一时间节点数据之间的第一趋势斜率,所述极值点与第二时间节点数据之间的第二趋势斜率,其中所述第一时间节点数据为与所述极值点临近的上一时间节点数据,所述第二时间节点数据为与所述第一时间节点数据临近的上一时间节点数据;
计算所述第一趋势斜率与所述第二趋势斜率的标准差及均值斜率;
根据计算得到的标准差及均值斜率计算得到所述极值点的综合趋势斜率;
判断所述极值点的综合趋势斜率是否位于预设范围值内;及
当所述极值点的综合趋势斜率不在所述预设范围值内时,判定所述趋势图对应的类型指标发生异常。
优选地,所述极值点的综合趋势斜率可通过以下数学式计算得到:
K=(Km,m-1-Om)/Km,sd*Km,m-1+(Km,m-2-Om)/Km,sd*Km,m-2
其中,K为所述综合趋势斜率,Km,m-1为所述第一趋势斜率,Km,m-2为所述第二趋势斜率,Om为所述第一趋势斜率与所述第二趋势斜率的均值斜率,Km,sd为所述第一趋势斜率与所述第二趋势斜率的标准差。
优选地,所述根据所述第一类型指标的时间序列数据预测所述第一监控对象的第二类型指标的状态的步骤包括:
获取所述第一类型指标包含的所有不在所述预设范围值内的综合趋势斜率;
计算该些不在所述预设范围值内的综合趋势斜率的平均综合趋势斜率;
根据所述平均综合趋势斜率及所述第二类型指标的当前时间节点数据计算得到所述第二类型指标的下一时间节点数据;及
根据所述第二类型指标的下一时间节点数据得到所述第二类型指标在下一时间的状态。
本申请一实施方式提供一种设备状态预测系统,所述系统包括:
获取模块,用于获取第一监控对象及与所述第一监控对象关联的第二监控对象的时间序列数据,其中每一所述监控对象包括一个或者多个监控类别,每一所述监控类别包括一个或者多个类型指标,所述时间序列数据为在不同时间节点上每一所述类型指标的参数集;
生成模块,用于根据所述第二监控对象的时间序列数据生成多个趋势图,其中每一所述趋势图对应于所述第二监控对象的每一类型指标;
统计模块,用于通过预设趋势分析算法统计得出所述第二监控对象的每一趋势图中包含的极值点;
判断模块,用于根据每一所述趋势图的极值点判断与所述趋势图对应的类型指标是否发生异常;及
预测模块,用于在所述第二监控对象的第一类型指标被判定为发生异常时,根据所述第一类型指标的时间序列数据预测所述第一监控对象的第二类型指标的状态;
其中,所述第一监控对象的第二类型指标与所述第二监控对象的第一类型指标相关联。
本申请一实施方式提供一种终端,所述终端包括处理器及存储器,所述存储器上存储有若干计算机程序,所述处理器用于执行存储器中存储的计算机程序时实现如前面所述的设备状态预测方法的步骤。
本申请一实施方式提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前面所述的设备状态预测方法的步骤。
上述设备状态预测方法、系统、终端及计算机可读存储介质,通过获取一个或者多个监控对象的时间序列数据来实现对监控对象的运行状态进行分析与预测,并且还可根据一判定为异常状态的监控对象的时间序列数据来预测与其关联的其他监控对象的运行状态,进而可做到问题提前发现,提前进行告警通知。
附图说明
为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中设备状态预测方法的步骤流程图。
图2为本发明一实施例中设备状态预测系统的功能模块图。
图3为本发明一实施例中计算机装置示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施方式及实施方式中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本发明。
优选地,本发明的设备状态预测方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机装置可以是桌上型计算机、笔记本电脑、平板电脑、服务器等计算设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
实施例一:
图1是本发明设备状态预测方法较佳实施例的步骤流程图。根据不同的需求,所述流程图中步骤的顺序可以改变,某些步骤可以省略。
参阅图1所示,所述设备状态预测方法具体包括以下步骤。
步骤S11、获取第一监控对象及与所述第一监控对象关联的第二监控对象的时间序列数据,其中每一所述监控对象包括一个或者多个监控类别,每一所述监控类别包括一个或者多个类型指标,所述时间序列数据为在不同时间节点上每一所述类型指标的参数集。
在一实施方式中,可以通过接入网络来连接至一个或多个所述监控对象,进而获取所述每一监控对象的时间序列数据。所述监控对象可以是一服务器、一服务器集群或者其他电子设备。所述服务器或所述服务器集群可包括若干硬件资源(例如:CPU、内存、I/O接口、存储器等)。所述服务器或所述服务器集群可运行有不同或相同的操作系统、数据库、运用软件、系统软件。可以理解地,所述服务器集群可由多个运行有虚拟机管理器(VirtualMachine Manager,VMM)、若干物理节点(Physical Node,PN)构成,VMM之上运行着多个操作系统,通过VMM的资源调度算法,这些操作系统共享物理机的资源。
举例而言,所述监控对象包括第一监控对象及第二监控对象。所述第一监控对象与所述第二监控对象存在关联关系,当所述第二监控对象发生变化时,若所述第一监控对象并不进行相应的变化,可能会致使所述第一监控对象的资源浪费或超负荷运作,如此,当所述第二监控对象发生变化时,与其存在关联关系的第一监控对象亦需做相应的调整;或者当所述第二监控对象的一类型指标参数发生变化,其会导致所述第一监控对象的一类型指标跟随所述第二监控对象的类型指标参数的变化而变化。
每一所述监控对象包括一个或者多个监控类别,每一所述监控类别包括一个或者多个类型指标。可以理解地,所述监控对象时间序列数据为在不同时间节点上每一所述类型指标的参数集。
在一实施方式中,所述监控对象可包括系统资源对象及/或业务类型对象,可实时或周期性接收/获取监控对象的时间序列数据。例如,每隔一预设时间从所述监控对象读取所述时间序列数据,或者所述监控对象每隔一预设时间上传所述时间序列数据至设备状态预测系统。
例如,当服务器作为系统资源的监控对象时,所述监控对象可包括CPU、内存、硬盘等硬件类的监控类别,还可包括运行于所述服务器中的数据库、系统软件等软件类的监控类别。当监控类别为CPU时,可输出利用率(处理器执行非闲置线程时间的百分比)、中断率(每秒钟设备中断处理器的次数)、系统调用率(处理器调用操作系统服务例行程序的综合速率)等类型指标的参数信息;当监控类别为内存时,可输出页缺失率(表示处理器向内存指定的位置请求一页出现错误)等类型指标的参数信息;当监控类别为硬盘时,可输出读取和写入请求的平均数(为硬盘在实例间隔中列队)等类型指标的参数信息;当监控类别为数据库时,可输出数据读写性能等类型指标的参数信息。
当业务类型作为业务类的监控对象时,其可包括用户登陆量、用户注册量、核心交易数据等监控类别。例如,监控类别为用户登陆量时可输出用户在线数量等类型指标的参数信息;当监控类别为用户注册量时,可输出注册账号数量等类型指标的参数信息,当监控类别为核心交易数据时,可输出订单、点击广告等类型指标的参数信息。
本一实施方式中,所述监控对象具有属性信息,所述属性信息可包含但不限于位置信息。例如,监控对象为服务器的具有位置信息,可以在获取监控对象的时间序列数据的同时获取监控对象的属性信息,或是服务器存储有一个或多个属性信息,当获取监控对象的时间序列数据时,可从其存储的属性信息中获取对应的属性信息。比如,在2017年9月3日21点24分44秒,华东区的服务器001的CPU利用率是80.02%,其中华东区即可表示服务器001的属性信息。
可以理解地,所述时间序列数据可表示为监控类别在t时刻所对应的类型指标的参数信息v。比如,在2017年9月3日21点24分44秒,华东区的服务器001的CPU利用率是80.02%,其中,时刻信息为2017年9月3日21点24分44秒,监控对象为服务器001,监控类别为CPU,类型指标为利用率,类型指标的参数信息为80.02%。因而,对于监控类别包含一个类型指标时,其对应的监控类别的时间序列数据可表示为:{X=(v1,t1),(v2,t2),...,(vn,tn)}其中n为自然数,(vn,tn)表示时间节点tn的时间节点数据,tn>tn-1,即时间节点数据(vn,tn)为最新的时间节点数据;对于监控类别包含两个或两个以上的类型指标时,其监控类别的时间序列数据可表示为:X={X1,X2,…,Xm},其中,Xm可表示为:{Xm=(v1m,t1),(v2m,t2),…,(vnm,tn)},其中m表示类型指标的数量,n为自然数。
在一实施方式中,当获取监控对象的时间序列数据后,还可对其进行本地化存储,以方便后续进行数据分析与读取。时间序列数据可默认存在关系型数据库中,即将时间序列数据中时刻t时刻及类型指标的参数信息v作为键值对存储于关系型数据库。其中,关系型数据库可以是直接基于文件的简单存储的RRD Tool数据库,基于K/V数据库构建的opentsdb数据库,基于关系型数据库构建mysql、postgresql数据库。
在本发明的其他实施方式中,当对数据存储要求较高或数据量比较大时,可以将时间序列数据存储于时间序列数据类数据库中,以提升数据读写效率和减少数据占用存储空间。其中,时间序列数据类数据库可包括基于Lucene构建的搜索引擎Elasticsearch,Crate.io,Solr数据库,或基于列式存储数据库的Vertica,Actian数据库。
步骤S12、根据所述第二监控对象的时间序列数据生成多个趋势图,其中每一所述趋势图对应于所述第二监控对象的每一类型指标。
在一实施方式中,可根据所述第二监控对象时间序列数据生成对应于该第二监控对象的趋势图。具体地,当获取到所述第二监控对象的时间序列数据后,先对所述第二监控对象的时间序列数据进行分类处理,比如将所述第二监控对象的时间序列数据按照每一监控类别进行一次分类,再将每一所述监控类别的时间序列数据按照每一类型指标进行二次分类,然后再根据分类后的时间序列数据生成对应每一类型指标的趋势图。
当监控类别具有一类型指标(如监控类别为内存时,其具有页缺失率一个类型指标;或监控类别为用户登陆量时,其具有一用户在线数量的类型指标)时,其对应的时间序列数据可表示为{X=(v1,t1),(v2,t2),…,(vn,tn)},建立一XY坐标轴,并将时间序列数据中各时刻tn作为趋势图在横轴(X轴)上的点,而对应的类型指标的参数信息vn作为趋势图中纵轴(Y轴)上的值,之后,再将对应的类型指标的参数信息通过直线或平滑的曲线连接,如此,即可生成对应该监控类别趋势图。
当监控类别具有两个或多个类型指标时,对应的时间序列数据可表示为:X={X1,X2,…,Xm},其中,Xm可表示为:{Xm=(v1m,t1),(v2m,t2),…,(vnm,tn)}。例如,监控类别为CPU时,其具有利用率、中断率及系统调用率三个类型指标,此时,获取的时间序列数据可表示为可X={X1,X2,X3},对时间序列数据进行分类拆分,以得到对应每一类型指标的子时间序列X1、X2、X3,其中X1对应利用率的类型指标、X2对应中断率的类型指标,X3对应系统调用率的类型指标,进而再按照上述方式绘制每一类型指标所对应的趋势图。
例如,对于CPU利用率的趋势图,对于X1子时间序列而言,其可表示为{X1=(v11,t1),(v12,t2),…,(vn1,tn)},可将时间序列数据中各时刻tn作为第一趋势图的横轴上的点,而对应的类型指标的参数信息vn1作为该第一趋势图中纵轴上的值,之后,再将对应的类型指标的参数信息通过直线或平滑的曲线连接,如此,即可生成对应于CPU利用率的第一趋势图。同理,对于CPU中断率的趋势图,对于X2子时间序列而言,其可表示为{X2=(v21,t1),(v22,t2),…,(vn2,tn)},可将时间序列数据中各时刻tn作为趋势图的横轴上的点,而对应的类型指标的参数信息vn2作为趋势图中纵轴上的值,之后,再将对应的类型指标的参数信息通过直线或平滑的曲线连接,如此,即可生成对应于CPU中断率的第二趋势图。如此,对于监控类型为CPU的趋势图,其可包括利用率、中断率及系统调用三个类型指标所分别对应的趋势图。
步骤S13,通过预设趋势分析算法统计得出所述第二监控对象的每一趋势图中包含的极值点。
在一实施方式中,可以通过以下方式统计得出所述第二监控对象的每一趋势图中包含的极值点:首先从一趋势图中任意选取一时间节点数据及与所述时间节点数据相邻的上一时间节点数据,其次计算所述时间节点数据与所述上一时间节点数据之间的趋势斜率,再判断计算得到的趋势斜率是否大于预设阈值;当所述趋势斜率大于所述预设阈值时,判定所述时间节点数据为所述趋势图中的一极值点。
举例而言,从一趋势图中选取一时间节点数据(vm,tm)及与所述时间节点数据相邻的上一时间节点数据(vm-1,tm-1),其趋势斜率可以通过以下数学式计算得到:
Km=|(Vm-Vm-1)/(tm-tm-1)|
其中,Km为趋势斜率。如果趋势斜率Km>R,其中R表示预设阈值,那么可以确定所述时间节点数据(vm,tm)为所述趋势图中的一极值点。
在一实施方式中,一趋势图中所有的极值点的集合可表示为极值集合。对于不同的类别指标的R值可设置为不同。例如,根据应用系统情况而言,CPU的利用率在±5%范围内波动为宜。过低,则服务器CPU利用率不高;过高,则CPU可能成为系统的处理瓶颈。因而,对于监控类别是CPU而言,其利用率的类型指标的预设阈值可设为[-5,5]。对于CPU的中断率而言,一般而言,处理器中断率越低越好;不宜超过1000次/秒;如果中断率的值显著增加,则表明可能存在硬件问题,需要检查引起中断的网络适配器、磁盘或其他硬件。因而,对于监控类别CPU而言,其中断率的类型指示的预设阈值为1000次。
步骤S14,根据每一所述趋势图的极值点判断与所述趋势图对应的类型指标是否发生异常。
在一实施方式中,可将一趋势图中相邻于极值点的两个或两个以上的时间序列数据所对应的综合趋势斜率K来判断该趋势图对应的类型指标是否异常。具体地:首先从一趋势图中任意选取一极值点,并获取与所述极值点相邻的至少两个在先时间节点数据;其次分别计算所述极值点与第一时间节点数据之间的第一趋势斜率,所述极值点与第二时间节点数据之间的第二趋势斜率,其中所述第一时间节点数据为与所述极值点临近的上一时间节点数据,所述第二时间节点数据为与所述第一时间节点数据临近的上一时间节点数据;再者,计算所述第一趋势斜率与所述第二趋势斜率的标准差及均值斜率;再者,根据计算得到的标准差及均值斜率计算得到所述极值点的综合趋势斜率;最后,判断所述极值点的综合趋势斜率是否位于预设范围值内;当所述极值点的综合趋势斜率不在所述预设范围值内时,判定所述趋势图对应的类型指标发生异常。
举例而言,对于一极值点,其对应的时间序列数据为(vm,tm),因而,相邻该极值点的两个时间序列数据分别为(vm-1,tm-1)、(vm-2,tm-2);相邻该极值点的三个时间序列数据分别为(vm-1,tm-1)、(vm-2,tm-2)、(vm-3,tm-3)。以下以极值点及其相邻的三个在先时间节点数据为例进行举例说明:
假设,时间序列数据(vm,tm)与时间序列数据(vm-1,tm-1)之间的趋势斜率为Km,m-1;时间序列数据(vm,tm)与时间序列数据(vm-2,tm-2)之间的趋势斜率为Km,m-2,时间序列数据(vm,tm)与时间序列数据(vm-3,tm-3)之间的趋势斜率为Km,m-3
趋势斜率Km,m-1、Km,m-2、Km,m-3之间的标准差Km,sd可以通过以下数学式计算得到:
趋势斜率Km,m-1、Km,m-2、Km,m-3的均值斜率Om可以通过以下数学式计算得到:Om=(Km,m-1+Km,m-2+Km,m-2)/3;
对于极值点(vm,tm)的综合趋势斜率K可以通过以下数学式计算得到:
K=(Km,m-1-Om)/Km,sd*Km,m-1+(Km,m-2-Om)/Km,sd*Km,m-2+(Km,m-3-Om)/Km,sd*Km,m-3
通过判断综合趋势斜率K是否在预设范围[-c,c]内,当K在预设范围[-c,c]内时,则表示该类型指标的状态正常;当K不在预设范围[-c,c]内时,则表示该类型指标的状态异常。所述预设范围[-c,c]可以根据实际使用需求进行设定及调整。
步骤S15,当所述第二监控对象的第一类型指标被判定为发生异常时,根据所述第一类型指标的时间序列数据预测所述第一监控对象的第二类型指标的状态;其中,所述第一监控对象的第二类型指标与所述第二监控对象的第一类型指标相关联。
在一实施方式中,当所述第二监控对象的第一类型指标存在极值点的综合趋势斜率K不在预设范围[-c,c]内时,则表示该第一类型指标的状态异常。
当所述第二监控对象的第一类型指标被判定为发生异常时,根据所述第一类型指标的时间序列数据预测所述第一监控对象的第二类型指标的状态的方式可以具体是:获取所述第一类型指标包含的所有不在所述预设范围值内的综合趋势斜率,并计算该些不在所述预设范围值内的综合趋势斜率的平均综合趋势斜率,再根据所述平均综合趋势斜率及所述第二类型指标的当前时间节点数据计算得到所述第二类型指标的下一时间节点数据,最后再根据所述第二类型指标的下一时间节点数据得到所述第二类型指标在下一时间的状态。
举例而言,所述第一类型指标包含有3个极值点的综合趋势斜率不在所述预设范围值内,该3个极值点的综合趋势斜率分别为K1、K2、K3,该三个极值点的平均综合趋势斜率Kp=(K1+K2+K3)/3。假设所述第二类型指标的当前时间节点数据为(vp,tp),则所述第二类型指标在下一时间节点tP+1的时间节点数据为(vp+1,tp+1),其中vp+1可以通过以下数学式计算得到:vp+1=vp+Kp
在一实施方式中,可以根据时间节点数据(vp,tp),(vp+1,tp+1)预测得到所述第一监控对象的第二类型指标在即将到来的下一时间节点tp+1的状态,具体而言,两相邻时间序列数据(vp,tp),(vp+1,tp+1),可计算得到时间序列数据(vp+1,tp+1)相对于时间序列数据(vp,tp)的趋势斜率Kp+1=(vp+1-vp)/(tp+1-tp),当Kp+1>R时,表示时间序列数据(vp+1,tp+1)对应为极大值;当趋势斜率Kp+1<-R时,表示时间序列数据(vp+1,tp+1)对应为极小值。当(vp+1,tp+1)为极大值时,表示该第二类型指标运行参数过高,可判断所述第一监控对象的第二类型指标可能会在时间节点tp+1出现超负荷运作,并输出第一预警提示信息;当(vp+1,tp+1)为极小值时,表示该第二类型指标运行参数过低,可判断所述第一监控对象的第二类型指标可能会在时间节点tp+1出现资源浪费的可能,并输出第二预警提示信息。
在一实施方式中,所述预警提示信息还可以包括对应第一监控对象的属性信息,例如所述预警提示信息为:华东区的服务器002可能在时间节点tp+1出现超负荷运作现象,有利于定位第一监控对象的位置,进行有针对性的处理。
实施例二:
图2为本发明设备状态预测系统较佳实施例的功能模块图。
参阅图2所示,所述设备状态预测系统10可以包括获取模块101、生成模块102、统计模块103、判断模块104、预测模块105。
所述获取模块101用于获取第一监控对象及与所述第一监控对象关联的第二监控对象的时间序列数据,其中每一所述监控对象包括一个或者多个监控类别,每一所述监控类别包括一个或者多个类型指标,所述时间序列数据为在不同时间节点上每一所述类型指标的参数集。
在一实施方式中,所述获取模块101可以通过接入网络来连接至一个或多个所述监控对象,进而获取所述每一监控对象的时间序列数据。所述监控对象可以是一服务器、一服务器集群或者其他电子设备。所述服务器或所述服务器集群可包括若干硬件资源(例如:CPU、内存、I/O接口、存储器等)。所述服务器或所述服务器集群可运行有不同或相同的操作系统、数据库、运用软件、系统软件。可以理解地,所述服务器集群可由多个运行有虚拟机管理器(Virtual Machine Manager,VMM)、若干物理节点(Physical Node,PN)构成,VMM之上运行着多个操作系统,通过VMM的资源调度算法,这些操作系统共享物理机的资源。
举例而言,所述监控对象包括第一监控对象及第二监控对象。所述第一监控对象与所述第二监控对象存在关联关系,当所述第二监控对象发生变化时,若所述第一监控对象并不进行相应的变化,可能会致使所述第一监控对象的资源浪费或超负荷运作,如此,当所述第二监控对象发生变化时,与其存在关联关系的第一监控对象亦需做相应的调整;或者当所述第二监控对象的一类型指标参数发生变化,其会导致所述第一监控对象的一类型指标跟随所述第二监控对象的类型指标参数的变化而变化。
每一所述监控对象包括一个或者多个监控类别,每一所述监控类别包括一个或者多个类型指标。可以理解地,所述监控对象时间序列数据为在不同时间节点上每一所述类型指标的参数集。
在一实施方式中,所述监控对象可包括系统资源对象及/或业务类型对象,可实时或周期性接收/获取监控对象的时间序列数据。例如,每隔一预设时间从所述监控对象读取所述时间序列数据,或者所述监控对象每隔一预设时间上传所述时间序列数据至设备状态预测系统。
例如,当服务器作为系统资源的监控对象时,所述监控对象可包括CPU、内存、硬盘等硬件类的监控类别,还可包括运行于所述服务器中的数据库、系统软件等软件类的监控类别。当监控类别为CPU时,可输出利用率(处理器执行非闲置线程时间的百分比)、中断率(每秒钟设备中断处理器的次数)、系统调用率(处理器调用操作系统服务例行程序的综合速率)等类型指标的参数信息;当监控类别为内存时,可输出页缺失率(表示处理器向内存指定的位置请求一页出现错误)等类型指标的参数信息;当监控类别为硬盘时,可输出读取和写入请求的平均数(为硬盘在实例间隔中列队)等类型指标的参数信息;当监控类别为数据库时,可输出数据读写性能等类型指标的参数信息。
当业务类型作为业务类的监控对象时,其可包括用户登陆量、用户注册量、核心交易数据等监控类别。例如,监控类别为用户登陆量时可输出用户在线数量等类型指标的参数信息;当监控类别为用户注册量时,可输出注册账号数量等类型指标的参数信息,当监控类别为核心交易数据时,可输出订单、点击广告等类型指标的参数信息。
本一实施方式中,所述监控对象具有属性信息,所述属性信息可包含但不限于位置信息。例如,监控对象为服务器的具有位置信息,可以在获取监控对象的时间序列数据的同时获取监控对象的属性信息,或是服务器存储有一个或多个属性信息,当获取监控对象的时间序列数据时,可从其存储的属性信息中获取对应的属性信息。比如,在2017年9月3日21点24分44秒,华东区的服务器001的CPU利用率是80.02%,其中华东区即可表示服务器001的属性信息。
可以理解地,所述时间序列数据可表示为监控类别在t时刻所对应的类型指标的参数信息v。比如,在2017年9月3日21点24分44秒,华东区的服务器001的CPU利用率是80.02%,其中,时刻信息为2017年9月3日21点24分44秒,监控对象为服务器001,监控类别为CPU,类型指标为利用率,类型指标的参数信息为80.02%。因而,对于监控类别包含一个类型指标时,其对应的监控类别的时间序列数据可表示为:{X=(v1,t1),(v2,t2),...,(vn,tn)}其中n为自然数,(vn,tn)表示时间节点tn的时间节点数据,tn>tn-1,即时间节点数据(vn,tn)为最新的时间节点数据;对于监控类别包含两个或两个以上的类型指标时,其监控类别的时间序列数据可表示为:X={X1,X2,…,Xm},其中,Xm可表示为:{Xm=(v1m,t1),(v2m,t2),…,(vnm,tn)},其中m表示类型指标的数量,n为自然数。
在一实施方式中,当获取监控对象的时间序列数据后,还可对其进行本地化存储,以方便后续进行数据分析与读取。时间序列数据可默认存在关系型数据库中,即将时间序列数据中时刻t时刻及类型指标的参数信息v作为键值对存储于关系型数据库。其中,关系型数据库可以是直接基于文件的简单存储的RRD Tool数据库,基于K/V数据库构建的opentsdb数据库,基于关系型数据库构建mysql、postgresql数据库。
在本发明的其他实施方式中,当对数据存储要求较高或数据量比较大时,可以将时间序列数据存储于时间序列数据类数据库中,以提升数据读写效率和减少数据占用存储空间。其中,时间序列数据类数据库可包括基于Lucene构建的搜索引擎Elasticsearch,Crate.io,Solr数据库,或基于列式存储数据库的Vertica,Actian数据库。
所述生成模块102用于根据所述第二监控对象的时间序列数据生成多个趋势图,其中每一所述趋势图对应于所述第二监控对象的每一类型指标。
在一实施方式中,所述生成模块102可根据所述第二监控对象时间序列数据生成对应于该第二监控对象的趋势图。具体地,当获取到所述第二监控对象的时间序列数据后,所述生成模块102先对所述第二监控对象的时间序列数据进行分类处理,比如将所述第二监控对象的时间序列数据按照每一监控类别进行一次分类,再将每一所述监控类别的时间序列数据按照每一类型指标进行二次分类,然后再根据分类后的时间序列数据生成对应每一类型指标的趋势图。
当监控类别具有一类型指标(如监控类别为内存时,其具有页缺失率一个类型指标;或监控类别为用户登陆量时,其具有一用户在线数量的类型指标)时,其对应的时间序列数据可表示为{X=(v1,t1),(v2,t2),…,(vn,tn)},所述生成模块102建立一XY坐标轴,并将时间序列数据中各时刻tn作为趋势图在横轴(X轴)上的点,而对应的类型指标的参数信息vn作为趋势图中纵轴(Y轴)上的值,之后,再将对应的类型指标的参数信息通过直线或平滑的曲线连接,如此,即可生成对应该监控类别趋势图。
当监控类别具有两个或多个类型指标时,对应的时间序列数据可表示为:X={X1,X2,…,Xm},其中,Xm可表示为:{Xm=(v1m,t1),(v2m,t2),…,(vnm,tn)}。例如,监控类别为CPU时,其具有利用率、中断率及系统调用率三个类型指标,此时,获取的时间序列数据可表示为可X={X1,X2,X3},对时间序列数据进行分类拆分,以得到对应每一类型指标的子时间序列X1、X2、X3,其中X1对应利用率的类型指标、X2对应中断率的类型指标,X3对应系统调用率的类型指标,进而再按照上述方式绘制每一类型指标所对应的趋势图。
例如,对于CPU利用率的趋势图,对于X1子时间序列而言,其可表示为{X1=(v11,t1),(v12,t2),…,(vn1,tn)},可将时间序列数据中各时刻tn作为第一趋势图的横轴上的点,而对应的类型指标的参数信息vn1作为该第一趋势图中纵轴上的值,之后,再将对应的类型指标的参数信息通过直线或平滑的曲线连接,如此,即可生成对应于CPU利用率的第一趋势图。同理,对于CPU中断率的趋势图,对于X2子时间序列而言,其可表示为{X2=(v21,t1),(v22,t2),…,(vn2,tn)},可将时间序列数据中各时刻tn作为趋势图的横轴上的点,而对应的类型指标的参数信息vn2作为趋势图中纵轴上的值,之后,再将对应的类型指标的参数信息通过直线或平滑的曲线连接,如此,即可生成对应于CPU中断率的第二趋势图。如此,对于监控类型为CPU的趋势图,其可包括利用率、中断率及系统调用三个类型指标所分别对应的趋势图。
所述统计模块103用于通过预设趋势分析算法统计得出所述第二监控对象的每一趋势图中包含的极值点。
在一实施方式中,所述统计模块103可以通过以下方式统计得出所述第二监控对象的每一趋势图中包含的极值点:首先从一趋势图中任意选取一时间节点数据及与所述时间节点数据相邻的上一时间节点数据,其次计算所述时间节点数据与所述上一时间节点数据之间的趋势斜率,再判断计算得到的趋势斜率是否大于预设阈值;当所述趋势斜率大于所述预设阈值时,判定所述时间节点数据为所述趋势图中的一极值点。
举例而言,所述统计模块103从一趋势图中选取一时间节点数据(vm,tm)及与所述时间节点数据相邻的上一时间节点数据(vm-1,tm-1),其趋势斜率可以通过以下数学式计算得到:
Km=|(Vm-Vm-1)/(tm-tm-1)|
其中,Km为趋势斜率。如果趋势斜率Km>R,其中R表示预设阈值,那么可以确定所述时间节点数据(vm,tm)为所述趋势图中的一极值点。
在一实施方式中,一趋势图中所有的极值点的集合可表示为极值集合。对于不同的类别指标的R值可设置为不同。例如,根据应用系统情况而言,CPU的利用率在±5%范围内波动为宜。过低,则服务器CPU利用率不高;过高,则CPU可能成为系统的处理瓶颈。因而,对于监控类别是CPU而言,其利用率的类型指标的预设阈值可设为[-5,5]。对于CPU的中断率而言,一般而言,处理器中断率越低越好;不宜超过1000次/秒;如果中断率的值显著增加,则表明可能存在硬件问题,需要检查引起中断的网络适配器、磁盘或其他硬件。因而,对于监控类别CPU而言,其中断率的类型指示的预设阈值为1000次。
所述判断模块104用于根据每一所述趋势图的极值点判断与所述趋势图对应的类型指标是否发生异常。
在一实施方式中,所述判断模块104可将一趋势图中相邻于极值点的两个或两个以上的时间序列数据所对应的综合趋势斜率K来判断该趋势图对应的类型指标是否异常。具体地:首先从一趋势图中任意选取一极值点,并获取与所述极值点相邻的至少两个在先时间节点数据;其次分别计算所述极值点与第一时间节点数据之间的第一趋势斜率,所述极值点与第二时间节点数据之间的第二趋势斜率,其中所述第一时间节点数据为与所述极值点临近的上一时间节点数据,所述第二时间节点数据为与所述第一时间节点数据临近的上一时间节点数据;再者,计算所述第一趋势斜率与所述第二趋势斜率的标准差及均值斜率;再者,根据计算得到的标准差及均值斜率计算得到所述极值点的综合趋势斜率;最后,判断所述极值点的综合趋势斜率是否位于预设范围值内;当所述极值点的综合趋势斜率不在所述预设范围值内时,判定所述趋势图对应的类型指标发生异常。
举例而言,对于一极值点,其对应的时间序列数据为(vm,tm),因而,相邻该极值点的两个时间序列数据分别为(vm-1,tm-1)、(vm-2,tm-2);相邻该极值点的三个时间序列数据分别为(vm-1,tm-1)、(vm-2,tm-2)、(vm-3,tm-3)。以下以极值点及其相邻的三个在先时间节点数据为例进行举例说明:
假设,时间序列数据(vm,tm)与时间序列数据(vm-1,tm-1)之间的趋势斜率为Km,m-1;时间序列数据(vm,tm)与时间序列数据(vm-2,tm-2)之间的趋势斜率为Km,m-2,时间序列数据(vm,tm)与时间序列数据(vm-3,tm-3)之间的趋势斜率为Km,m-3
趋势斜率Km,m-1、Km,m-2、Km,m-3之间的标准差Km,sd可以通过以下数学式计算得到:
趋势斜率Km,m-1、Km,m-2、Km,m-3的均值斜率Om可以通过以下数学式计算得到:Om=(Km,m-1+Km,m-2+Km,m-2)/3;
对于极值点(vm,tm)的综合趋势斜率K可以通过以下数学式计算得到:
K=(Km,m-1-Om)/Km,sd*Km,m-1+(Km,m-2-Om)/Km,sd*Km,m-2+(Km,m-3-Om)/Km,sd*Km,m-3
通过判断综合趋势斜率K是否在预设范围[-c,c]内来判断该类型指标是否异常,当K在预设范围[-c,c]内时,则表示该类型指标的状态正常;当K不在预设范围[-c,c]内时,则表示该类型指标的状态异常。所述预设范围[-c,c]可以根据实际使用需求进行设定及调整。
所述预测模块105用于在所述第二监控对象的第一类型指标被判定为发生异常时,根据所述第一类型指标的时间序列数据预测所述第一监控对象的第二类型指标的状态;其中,所述第一监控对象的第二类型指标与所述第二监控对象的第一类型指标相关联。
在一实施方式中,当所述第二监控对象的第一类型指标存在极值点的综合趋势斜率K不在预设范围[-c,c]内时,则表示该第一类型指标的状态异常。
当所述第二监控对象的第一类型指标被判定为发生异常时,所述预测模块105根据所述第一类型指标的时间序列数据预测所述第一监控对象的第二类型指标的状态的方式可以具体是:获取所述第一类型指标包含的所有不在所述预设范围值内的综合趋势斜率,并计算该些不在所述预设范围值内的综合趋势斜率的平均综合趋势斜率,再根据所述平均综合趋势斜率及所述第二类型指标的当前时间节点数据计算得到所述第二类型指标的下一时间节点数据,最后再根据所述第二类型指标的下一时间节点数据得到所述第二类型指标在下一时间的状态。
举例而言,所述第一类型指标包含有3个极值点的综合趋势斜率不在所述预设范围值内,该3个极值点的综合趋势斜率分别为K1、K2、K3,该三个极值点的平均综合趋势斜率Kp=(K1+K2+K3)/3。假设所述第二类型指标的当前时间节点数据为(vp,tp),则所述第二类型指标在下一时间节点tP+1的时间节点数据为(vp+1,tp+1),其中vp+1可以通过以下数学式计算得到:vp+1=vp+Kp
在一实施方式中,所述预测模块105可以根据时间节点数据(vp,tp),(vp+1,tp+1)预测得到所述第一监控对象的第二类型指标在即将到来的下一时间节点tp+1的状态,具体而言,两相邻时间序列数据(vp,tp),(vp+1,tp+1),可计算得到时间序列数据(vp+1,tp+1)相对于时间序列数据(vp,tp)的趋势斜率Kp+1=(vp+1-vp)/(tp+1-tp),当Kp+1>R时,表示时间序列数据(vp+1,tp+1)对应为极大值;当趋势斜率Kp+1<-R时,表示时间序列数据(vp+1,tp+1)对应为极小值。当(vp+1,tp+1)为极大值时,表示该第二类型指标运行参数过高,可判断所述第一监控对象的第二类型指标可能会在时间节点tp+1出现超负荷运作,并输出第一预警提示信息;当(vp+1,tp+1)为极小值时,表示该第二类型指标运行参数过低,可判断所述第一监控对象的第二类型指标可能会在时间节点tp+1出现资源浪费的可能,并输出第二预警提示信息。
在一实施方式中,所述预警提示信息还可以包括对应第一监控对象的属性信息,例如所述预警提示信息为:华东区的服务器002可能在时间节点tp+1出现超负荷运作现象,有利于定位第一监控对象的位置,进行有针对性的处理。
图3为本发明计算机装置较佳实施例的示意图。
所述计算机装置1包括存储器20、处理器30以及存储在所述存储器20中并可在所述处理器30上运行的计算机程序40,例如设备状态预测程序。所述处理器30执行所述计算机程序40时实现上述设备状态预测方法实施例中的步骤,例如图1所示的步骤S11~S15。或者,所述处理器30执行所述计算机程序40时实现上述设备状态预测系统实施例中各模块的功能,例如图2中的模块101~105。
示例性的,所述计算机程序40可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器20中,并由所述处理器30执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,所述指令段用于描述所述计算机程序40在所述计算机装置1中的执行过程。例如,所述计算机程序40可以被分割成图2中的获取模块101、生成模块102、统计模块103、判断模块104、预测模块105。各模块具体功能参见实施例二。
所述计算机装置1可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解,所述示意图仅仅是计算机装置1的示例,并不构成对计算机装置1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置1还可以包括输入输出设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器30也可以是任何常规的处理器等,所述处理器30是所述计算机装置1的控制中心,利用各种接口和线路连接整个计算机装置1的各个部分。
所述存储器20可用于存储所述计算机程序40和/或模块/单元,所述处理器30通过运行或执行存储在所述存储器20内的计算机程序和/或模块/单元,以及调用存储在存储器20内的数据,实现所述计算机装置1的各种功能。所述存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机装置1的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述计算机装置1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,所述计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
在本发明所提供的几个实施例中,应该理解到,所揭露的计算机装置和方法,可以通过其它的方式实现。例如,以上所描述的计算机装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
另外,在本发明各个实施例中的各功能单元可以集成在相同处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。计算机装置权利要求中陈述的多个单元或计算机装置也可以由同一个单元或计算机装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种设备状态预测方法,其特征在于,所述方法包括:
获取第一监控对象及与所述第一监控对象关联的第二监控对象的时间序列数据,其中每一所述监控对象包括一个或者多个监控类别,每一所述监控类别包括一个或者多个类型指标,所述时间序列数据为在不同时间节点上每一所述类型指标的参数集;
根据所述第二监控对象的时间序列数据生成多个趋势图,其中每一所述趋势图对应于所述第二监控对象的每一类型指标;
通过预设趋势分析算法统计得出所述第二监控对象的每一趋势图中包含的极值点;
根据每一所述趋势图的极值点判断与所述趋势图对应的类型指标是否发生异常;及
当所述第二监控对象的第一类型指标被判定为发生异常时,根据所述第一类型指标的时间序列数据预测所述第一监控对象的第二类型指标的状态,其中,所述第一监控对象的第二类型指标与所述第二监控对象的第一类型指标相关联。
2.如权利要求1所述的设备状态预测方法,其特征在于,所述根据所述第二监控对象的时间序列数据生成多个趋势图,其中每一所述趋势图对应于所述第二监控对象的每一类型指标的步骤包括:
将所述第二监控对象的时间序列数据按照每一监控类别进行一次分类,再将每一所述监控类别的时间序列数据按照每一类型指标进行二次分类;
建立一XY坐标轴,并将所述第一类型指标的时间序列数据中每一时间节点作为趋势图在X轴上的点;及
将每一所述时间节点对应的参数信息作为所述趋势图在Y轴上的值,以得到对应于所述第一类型指标的趋势图。
3.如权利要求1-2任意一项所述的设备状态预测方法,其特征在于,所述通过预设趋势分析算法统计得出所述第二监控对象的每一趋势图中包含的极值点的步骤包括:
从所述第二监控对象的一趋势图中任意选取一时间节点数据及与所述时间节点数据相邻的上一时间节点数据;
计算所述时间节点数据与所述上一时间节点数据之间的趋势斜率;
判断计算得到的趋势斜率是否大于预设阈值;及
当所述趋势斜率大于所述预设阈值时,判定所述时间节点数据为所述趋势图中的一极值点。
4.如权利要求3所述的设备状态预测方法,其特征在于,所述时间节点数据与所述上一时间节点数据的趋势斜率可以通过以下数学式计算得到:
Km=|(Vm-Vm-1)/(tm-tm-1)|;
其中,Km为趋势斜率,tm为所述时间节点数据对应的时间节点,tm-1为与tm相邻的上一时间节点,Vm为时间节点tm对应的参数信息,Vm-1为时间节点tm-1对应的参数信息。
5.如权利要求1-2任意一项所述的设备状态预测方法,其特征在于,所述根据每一所述趋势图的极值点判断与所述趋势图对应的类型指标是否发生异常的步骤包括:
从所述第二监控对象的一趋势图中任意选取一极值点,并获取与所述极值点相邻的至少两个在先时间节点数据;
分别计算所述极值点与第一时间节点数据之间的第一趋势斜率,所述极值点与第二时间节点数据之间的第二趋势斜率,其中所述第一时间节点数据为与所述极值点临近的上一时间节点数据,所述第二时间节点数据为与所述第一时间节点数据临近的上一时间节点数据;
计算所述第一趋势斜率与所述第二趋势斜率的标准差及均值斜率;
根据计算得到的标准差及均值斜率计算得到所述极值点的综合趋势斜率;
判断所述极值点的综合趋势斜率是否位于预设范围值内;及
当所述极值点的综合趋势斜率不在所述预设范围值内时,判定所述趋势图对应的类型指标发生异常。
6.如权利要求5所述的设备状态预测方法,其特征在于,所述极值点的综合趋势斜率可通过以下数学式计算得到:
K=(Km,m-1-Om)/Km,sd*Km,m-1+(Km,m-2-Om)/Km,sd*Km,m-2
其中,K为所述综合趋势斜率,Km,m-1为所述第一趋势斜率,Km,m-2为所述第二趋势斜率,Om为所述第一趋势斜率与所述第二趋势斜率的均值斜率,Km,sd为所述第一趋势斜率与所述第二趋势斜率的标准差。
7.如权利要求5所述的设备状态预测方法,其特征在于,所述根据所述第一类型指标的时间序列数据预测所述第一监控对象的第二类型指标的状态的步骤包括:
获取所述第一类型指标包含的所有不在所述预设范围值内的综合趋势斜率;
计算该些不在所述预设范围值内的综合趋势斜率的平均综合趋势斜率;
根据所述平均综合趋势斜率及所述第二类型指标的当前时间节点数据计算得到所述第二类型指标的下一时间节点数据;及
根据所述第二类型指标的下一时间节点数据得到所述第二类型指标在下一时间的状态。
8.一种设备状态预测系统,其特征在于,所述系统包括:
获取模块,用于获取第一监控对象及与所述第一监控对象关联的第二监控对象的时间序列数据,其中每一所述监控对象包括一个或者多个监控类别,每一所述监控类别包括一个或者多个类型指标,所述时间序列数据为在不同时间节点上每一所述类型指标的参数集;
生成模块,用于根据所述第二监控对象的时间序列数据生成多个趋势图,其中每一所述趋势图对应于所述第二监控对象的每一类型指标;
统计模块,用于通过预设趋势分析算法统计得出所述第二监控对象的每一趋势图中包含的极值点;
判断模块,用于根据每一所述趋势图的极值点判断与所述趋势图对应的类型指标是否发生异常;及
预测模块,用于在所述第二监控对象的第一类型指标被判定为发生异常时,根据所述第一类型指标的时间序列数据预测所述第一监控对象的第二类型指标的状态;
其中,所述第一监控对象的第二类型指标与所述第二监控对象的第一类型指标相关联。
9.一种终端,所述终端包括处理器及存储器,所述存储器上存储有若干计算机程序,其特征在于,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-7中任意一项所述的设备状态预测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任意一项所述的设备状态预测方法的步骤。
CN201811334475.9A 2018-11-09 2018-11-09 设备状态预测方法、系统、终端及计算机可读存储介质 Active CN109684162B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811334475.9A CN109684162B (zh) 2018-11-09 2018-11-09 设备状态预测方法、系统、终端及计算机可读存储介质
PCT/CN2019/077513 WO2020093637A1 (zh) 2018-11-09 2019-03-08 设备状态预测方法、系统、计算机装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811334475.9A CN109684162B (zh) 2018-11-09 2018-11-09 设备状态预测方法、系统、终端及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109684162A true CN109684162A (zh) 2019-04-26
CN109684162B CN109684162B (zh) 2022-05-27

Family

ID=66185739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811334475.9A Active CN109684162B (zh) 2018-11-09 2018-11-09 设备状态预测方法、系统、终端及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN109684162B (zh)
WO (1) WO2020093637A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112132722A (zh) * 2020-08-20 2020-12-25 彭涛 政务热线数量趋势异常确定方法、装置、电子设备及介质
CN112131381A (zh) * 2020-08-20 2020-12-25 彭涛 警情高发地的识别方法、装置、电子设备及存储介质
CN112668772A (zh) * 2020-12-24 2021-04-16 润电能源科学技术有限公司 一种状态发展趋势预测方法、装置、设备及存储介质
CN112990842A (zh) * 2019-12-16 2021-06-18 可可株式会社 提供日历服务的方法及其装置
CN113762717A (zh) * 2021-08-03 2021-12-07 国能国华(北京)电力研究院有限公司 设备运行状态监控方法、装置、电子设备、存储介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115001877B (zh) * 2022-08-08 2022-12-09 北京宏数科技有限公司 一种基于大数据的信息安全运维管理系统及方法
CN117216469B (zh) * 2023-09-03 2024-03-15 国网江苏省电力有限公司信息通信分公司 一种电力系统实时监测与预测的大数据处理方法及系统
CN117688464B (zh) * 2024-02-04 2024-04-19 国网上海市电力公司 一种基于多源传感器数据的隐患分析方法及系统
CN117933827A (zh) * 2024-03-13 2024-04-26 深圳市吉方工控有限公司 计算机终端工控信息数据处理方法、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095655A (zh) * 2016-05-31 2016-11-09 北京蓝海讯通科技股份有限公司 一种异常检测方法、应用和监控设备
CN107766299A (zh) * 2017-10-24 2018-03-06 携程旅游信息技术(上海)有限公司 数据指标异常的监控方法及其系统、存储介质、电子设备
CN108206747A (zh) * 2016-12-16 2018-06-26 中国移动通信集团山西有限公司 告警生成方法和系统
WO2018116488A1 (ja) * 2016-12-22 2018-06-28 日本電気株式会社 解析サーバ、監視システム、監視方法及びプログラム
CN108376299A (zh) * 2018-02-27 2018-08-07 深圳市智物联网络有限公司 一种设备运行趋势的预测方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908533B (zh) * 2017-06-15 2019-11-12 平安科技(深圳)有限公司 一种数据库性能指标的监测方法、装置、计算机可读存储介质及设备
CN107705149A (zh) * 2017-09-22 2018-02-16 平安科技(深圳)有限公司 数据实时监控方法、装置、终端设备及存储介质
CN108399115B (zh) * 2018-02-28 2021-06-22 北京奇艺世纪科技有限公司 一种运维操作检测方法、装置及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095655A (zh) * 2016-05-31 2016-11-09 北京蓝海讯通科技股份有限公司 一种异常检测方法、应用和监控设备
CN108206747A (zh) * 2016-12-16 2018-06-26 中国移动通信集团山西有限公司 告警生成方法和系统
WO2018116488A1 (ja) * 2016-12-22 2018-06-28 日本電気株式会社 解析サーバ、監視システム、監視方法及びプログラム
CN107766299A (zh) * 2017-10-24 2018-03-06 携程旅游信息技术(上海)有限公司 数据指标异常的监控方法及其系统、存储介质、电子设备
CN108376299A (zh) * 2018-02-27 2018-08-07 深圳市智物联网络有限公司 一种设备运行趋势的预测方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990842A (zh) * 2019-12-16 2021-06-18 可可株式会社 提供日历服务的方法及其装置
CN112132722A (zh) * 2020-08-20 2020-12-25 彭涛 政务热线数量趋势异常确定方法、装置、电子设备及介质
CN112131381A (zh) * 2020-08-20 2020-12-25 彭涛 警情高发地的识别方法、装置、电子设备及存储介质
CN112132722B (zh) * 2020-08-20 2023-12-26 彭涛 政务热线数量趋势异常确定方法、装置、电子设备及介质
CN112668772A (zh) * 2020-12-24 2021-04-16 润电能源科学技术有限公司 一种状态发展趋势预测方法、装置、设备及存储介质
CN112668772B (zh) * 2020-12-24 2024-03-12 润电能源科学技术有限公司 一种状态发展趋势预测方法、装置、设备及存储介质
CN113762717A (zh) * 2021-08-03 2021-12-07 国能国华(北京)电力研究院有限公司 设备运行状态监控方法、装置、电子设备、存储介质

Also Published As

Publication number Publication date
WO2020093637A1 (zh) 2020-05-14
CN109684162B (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
CN109634801A (zh) 数据趋势分析方法、系统、计算机装置及可读存储介质
CN109684162A (zh) 设备状态预测方法、系统、终端及计算机可读存储介质
CN110826071B (zh) 软件漏洞风险预测方法、装置、设备及存储介质
CN112445854B (zh) 多源业务数据实时处理方法、装置、终端及存储介质
CN108038040A (zh) 计算机集群性能指标检测方法、电子设备及存储介质
CN112860695B (zh) 监控数据查询方法、装置、设备、存储介质及程序产品
CN109669837A (zh) 设备状态预警方法、系统、计算机装置及可读存储介质
CN111290924A (zh) 监控方法、装置及电子设备
CN109933601A (zh) 数据库管理方法、系统、计算机装置及可读存储介质
CN109840142A (zh) 基于云监控的线程控制方法、装置、电子设备及存储介质
CN109241096A (zh) 数据处理方法、装置和系统
US11099908B2 (en) Measuring provisioning capacity across distributed systems
CN115373835A (zh) Flink集群的任务资源调整方法、装置及电子设备
CN115033340A (zh) 一种宿主机的选择方法及相关装置
CN109840141A (zh) 基于云监控的线程控制方法、装置、电子设备及存储介质
US20170351721A1 (en) Predicting index fragmentation caused by database statements
Maroulis et al. A holistic energy-efficient real-time scheduler for mixed stream and batch processing workloads
CN110825526A (zh) 基于er关系的分布式调度方法及装置、设备以及存储介质
CN111736975A (zh) 请求控制方法、装置、计算机设备及计算机可读存储介质
CN113780675B (zh) 一种消耗预测方法、装置、存储介质及电子设备
US8868485B2 (en) Data flow cost modeling
EP4209933A1 (en) Data processing method and apparatus, and electronic device and storage medium
CN115168042A (zh) 监控集群的管理方法及装置、计算机存储介质、电子设备
CN111143328A (zh) 一种敏捷商业智能数据构建方法、系统、设备、存储介质
WO2024032239A1 (zh) 应用调度方法、云服务平台以及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant