CN109992473A - 应用系统的监控方法、装置、设备及存储介质 - Google Patents

应用系统的监控方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109992473A
CN109992473A CN201910145580.6A CN201910145580A CN109992473A CN 109992473 A CN109992473 A CN 109992473A CN 201910145580 A CN201910145580 A CN 201910145580A CN 109992473 A CN109992473 A CN 109992473A
Authority
CN
China
Prior art keywords
data
application system
characteristic
user
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910145580.6A
Other languages
English (en)
Other versions
CN109992473B (zh
Inventor
朱坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910145580.6A priority Critical patent/CN109992473B/zh
Publication of CN109992473A publication Critical patent/CN109992473A/zh
Priority to PCT/CN2019/118226 priority patent/WO2020173136A1/zh
Application granted granted Critical
Publication of CN109992473B publication Critical patent/CN109992473B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Abstract

本申请涉及云监控领域,具体通过监控用户行为实现异常监控,并公开了一种应用系统的监控方法、装置、设备及存储介质,所述方法包括:提取应用系统的特征数据,所述特征数据包括历史用户行为数据和当前用户行为数据;基于支持向量机算法,根据所述历史用户行为数据进行模型训练以建立行为预测模型;将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的预测值;根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。进而及时地发现应用系统的问题以便后续技术人员针对该异常状况及时对应用系统进行改进,减少异常状况发生。

Description

应用系统的监控方法、装置、设备及存储介质
技术领域
本申请涉及互联网保险技术领域,尤其涉及一种应用系统的监控方法、装置、设备及存储介质。
背景技术
随着公司网络业务的快速发展,各种网络业务的应用系统的数量不断增多,保险领域的应用系统也得到了飞速发展。一个保险业务的运行通常需要多个应用系统的支持。然而由于保险业务的多变、应用系统漏洞等原因,应用系统经常出现异常情况,因而导致保险业务难以正常运行。
目前,行业内相关的监控产品通常是通过监控应用程序的性能,例如CPU、内存、网络带宽等数据来进行报警,从而监控应用系统是否异常。然而,由于保险业务受到诸多因素影响,多个应用系统关联复杂等原因,很多时候不能及时发现应用系统的异常,影响用户正常使用保险业务。为了更好的维护保险业务的正常使用,保障用户的体验和使用,有必要提供一种应用系统的监控方法,以及时监控应用系统是否异常。
发明内容
本申请提供了一种应用系统的监控方法、装置、设备及存储介质,该监控方法能够及时地发现应用系统的问题以便后续技术人员针对该异常状况及时对应用系统进行改进,减少异常状况发生。
第一方面,本申请提供了一种应用系统的监控方法,所述方法包括:
提取应用系统的特征数据,所述特征数据包括历史用户行为数据和当前用户行为数据;
基于支持向量机算法,根据所述历史用户行为数据进行模型训练以建立行为预测模型;
将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的预测值;
根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。
第二方面,本申请还提供了一种应用系统的监控装置,所述装置包括:
特征提取单元,用于提取应用系统的特征数据,所述特征数据包括历史用户行为数据和当前用户行为数据;
模型建立单元,用于基于支持向量机算法,根据所述历史用户行为数据进行模型训练以建立行为预测模型;
输入输出单元,用于将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的预测值;
异常确定单元,用于根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的应用系统的监控方法。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的应用系统的监控方法。
本申请公开了一种应用系统的监控方法、装置、设备及存储介质,通过基于支持向量机算法,根据历史用户行为数据进行模型训练,得到行为预测模型,用已经采集到的当前用户行为数据输入至行为预测模型,以输出下一时刻对应的预测值,再通过比较预测值和真实值(即下一时刻的用户行为数据)确定系统的异常状况,从而通过监控用户行为及时地发现应用系统的问题以便后续技术人员针对该异常状况及时对应用系统进行改进,减少异常状况发生。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的实施例一提供的应用系统的监控方法的步骤示意流程图;
图2是本申请的实施例二提供的应用系统的监控方法的步骤示意流程图;
图3为图2中应用系统的监控方法的子步骤的示意流程图;
图4是本申请的实施例三提供的应用系统的监控方法的步骤示意流程图;
图5是本申请的一实施例提供的一种应用系统的监控装置的示意性框图;
图6是本申请的另一实施例提供的一种应用系统的监控装置的示意性框图;
图7是图6中应用系统的监控装置的子单元的示意性框图;
图8是本申请的再一实施例提供的一种应用系统的监控装置的示意性框图;
图9是本申请实施例提供的一种计算机设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本申请的实施例提供了一种应用系统的监控方法、装置、计算机设备及存储介质。该应用系统的监控方法可用于监控保险业务的应用系统,针对应用系统的异常,能够及时地发现应用系统出现的异常状况。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请的实施例一提供的应用系统的监控方法的步骤示意流程图。该应用系统的监控方法,通过监控用户行为及时发现应用系统出现的异常状况,以便后续技术人员针对该异常状况及时对应用系统进行改进,减少异常状况发生,用户的体验效果好。该方法的执行主体可以为网络设备,例如服务器或网络优化设备。
如图1所示,该应用系统的监控方法,具体包括:步骤101至步骤104。
S101、提取应用系统的特征数据,所述特征数据包括历史用户行为数据和当前用户行为数据。
具体的,在提取特征数据时,可以以预设单位时间作为提取的一个周期,提取每个应用系统的特征数据。单位时间可以根据实际需求进行设定,例如设定为一天、一个小时或一分钟。
特征数据用于反映应用系统的外在特征的数据,其与用户行为密切相关,能够反映机器或服务的运行状况,具有特定的变化规律。在某些实施方式中,在提取应用系统的特征数据时,可以获取应用系统某一个维度的特征数据,得到一种行为特征数据。当然,在其他实施方式中,也可以获取应用系统在K个维度的特征数据,得到K种用户行为特征数据,其中,上述K值为大于1的整数。K个维度可以为例如曝光数量、点击数量、交易数量等等,K种用户行为特征数据对应可以为曝光特征数据、点击特征数据、交易特征数据等。
可以理解的,每种用户行为在每个周期都有相应的用户行为数据。在本实施例中,当前用户行为数据是指应用系统在当前周期内所对应的用户行为数据。历史用户行为数据是指应用系统在当前周期之前的预设数量的周期内所对应的用户行为数据的集合。例如,当前周期为T,预设数量为u,则历史用户行为数据为应用系统在T-1周期至T-u周期的用户行为数据的集合。
其中,被监控的应用系统可以和应用系统的监控方法在同一个电子设备(例如服务器)上运行,也可以分别在不同的电子设备上运行。
S102、基于支持向量机算法,根据所述历史用户行为数据进行模型训练以建立行为预测模型。
以每种用户行为的历史用户行为数据作为样本数据,可以建立一个机器学习模型来预测该用户行为在下一时刻的预测值。每种用户行为的历史用户行为数据可以看成一个时间序列{Xt,t=1,2,...,T},下一时刻对应的预测值可以将当前时刻的用户行为数据输入至所述行为预测模型而输出。
具体的,所述行为预测模型可以描述为:
在上式中,Xt表示所述预测值,Xt-1,...,Xt-p表示历史用户行为数据,和θj(1≤j≤q)为实参数,t/p/q为整数,且p≤t,q≤t;服从正态分布:且是与前一时刻的Xt-k(k>0)不相关的随机序列。
需要说明的是,应用系统在正常工作时,其所支持的保险业务中用户行为数据的分布是有规律的。由于保险业务中用户的使用行为会发生变化,因而用户行为数据的分布规律会发生缓慢改变。因此行为预测模型不能是一成不变的,需要根据用户行为数据的分布规律的动态变化而变化。在实际应用中,每隔一段时间,应该按照新提取的特征数据,重新建立行为预测模型。这样,当前用户行为数据输入至行为预测模型,所输出的预测值能准确反映应用系统在下一时刻的用户行为数据的分布规律。
S103、将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的预测值。
具体的,在确定行为预测模型之后,保险监控系统可以定时或实时输入当前周期的用户行为数据至行为预测模型,从而输出预测值。所述预测值为基于所述行为预测模型和当前用户行为数据预测得到数据。
例如,将当前点击数据输入至点击预测模型,从而输出下一周期的点击数据的预测值。又如,将当前曝光数据输入至曝光预测模型,从而输出下一周期的曝光数据的预测值。
S104、根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。
具体的,下一时刻应与当前周期的时间长度相同。若当前周期为T,下一时刻可以为T+1。下一时刻的用户行为数据是指从下一时刻的状态指标数据中提取的用户行为数据。
在一个实施例中,所述根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况之前,还包括:
从下一时刻的状态指标数据中提取下一时刻的用户行为数据。
在一个实施例中,所述根据所述预测值与下一时刻的用户行为数据确定应用系统的异常状况,具体包括:
若所述用户行为数据与所述预测值的比值小于预设阀值,确定所述应用系统存在异常。
在一实施例中,预设阀值的具体取值需要根据实际需要来确定。下一时刻的用户行为数据是指从下一时刻状态指标数据中提取的用户行为数据。
具体的,当上述比值大于等于第一预设阀值时,可以说明预测值与下一时刻的用户行为数据比较相近,用户能够正常使用保险业务,从而可以确定应用系统在下一时刻的状况与正常工作时的状况相近,因此可以确定应用系统在下一时刻处于正常状态。
当上述比值小于第一预设阀值时,确定应用系统处于异常状态。当比值小于第一预设阀值时,可以说明预测值与下一时刻的用户行为数据有很大不同,从而可以确定应用系统在所述下一时刻的状况与正常工作时的状况不同,用户使用保险业务受到影响,进而确定应用系统出现异常。在确定应用系统出现异常后,应及时通知技术人员到现场查看并维修,避免由于应用系统处于异常状态而影响用户的使用,从而保障用户的体验和使用。
例如,第一预设阀值为8%,当在周六九点时预测十点时的网站点击数量为50000,但到了十点时实际提取到的点击数量为50,所述下一时刻用户行为数据与所述预测值的比值为0.1%,小于第一预设阀值8%,因而确定应用系统处于异常状态。如果十点时提取到的点击数量的真实值为55000时,下一时刻的用户行为数据与所述预测值的比值为110%,大于第一预设阀值8%,因而确定应用系统处于正常状态。
上述实施例的监控方法,通过基于支持向量机算法,根据历史用户行为数据进行模型训练,得到行为预测模型,用已经采集到的当前用户行为数据输入至行为预测模型,以输出下一时刻对应的预测值,再通过比较所述预测值和下一时刻的用户行为数据确定系统的异常状况,从而通过监控用户行为及时地发现应用系统的问题以便后续技术人员针对该异常状况及时对应用系统进行改进,减少异常状况发生,用户的体验效果好。
请参阅图2,图2是本申请的实施例二提供的应用系统的监控方法的步骤示意流程图。该应用系统的监控方法,通过监控用户行为及时发现应用系统出现的异常状况,以便后续技术人员针对该异常状况及时对应用系统进行改进,减少异常状况发生,用户的体验效果好。该方法的执行主体可以为网络设备,例如服务器或网络优化设备。
如图2所示,该应用系统的监控方法,具体包括:
S201、实时采集应用系统的状态指标数据。
应用系统的监控方法运行于其上的电子设备(例如服务器)可以通过有线连接方式或者无线连接方式周期性地采集系统的状态指标数据,生成状态指标数据序列。
其中,状态指标数据例如,搜索引擎响应用户点击数量,保险业务在展示媒介(例如网页、客户端页面)上的曝光数量、交易数量等等。
需要说明的是,每个应用系统在每个周期都有对应的状态指标数据。所述状态指标数据包括当前状态指标数据和历史状态指标数据,其中,当前状态指标数据是指在当前时刻采集的应用系统的状态指标数据。历史状态指标数据是指在当前时刻之前的时刻采集的应用系统的状态指标数据。历史用户行为数据是指从历史状态指标数据中按照采集时间由新到旧的顺序提取的用户行为数据。当前用户行为数据是指从当前状态指标数据中提取的用户行为数据。
具体的,以设定时间为一个周期,即按照设定时间作为采集状态指标数据的周期。设定时间可根据需要设定,例如1分钟、3分钟、5分钟等。例如,假设设定时间为5分钟,当前周期为10:00至10:05的时间段,则当前状态指标数据为在10:00至10:05的时间段内采集的系统的状态指标数据。
S202、从所述状态指标数据中提取应用系统的特征数据,所述特征数据包括历史用户行为数据和当前用户行为数据。
其中,每种用户行为在每个周期都有相应的用户行为数据。具体的,当前用户行为数据是指应用系统在当前周期内所对应的用户行为数据。历史用户行为数据是指应用系统在当前周期之前的预设数量的周期所对应的用户行为数据的集合。
S203、基于支持向量机算法,根据所述历史用户行为数据进行模型训练以建立行为预测模型。
具体的,每种用户行为的历史用户行为数据可以看成一个时间序列。基于支持向量机算法,根据历史用户行为数据可以建立该种用户行为对应的行为预测模型,通过将当前用户行为数据输入至该行为预测模型,能够预测下一时刻对应的预测值。
S204、将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的预测值。
在确定行为预测模型之后,保险监控系统可以定时或实时输入当前用户行为数据至行为预测模型,从而输出下一时刻对应的预测值。所述预测值为基于所述行为预测模型和当前用户行为数据预测得到数据。
S205、根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。
其中,下一时刻的用户行为数据是指从下一时刻的状态指标数据中提取的用户行为数据。
上述实施例的监控方法,通过实时采集应用系统的状态指标数据;从所述状态指标数据中提取应用系统的特征数据,所述特征数据包括历史用户行为数据和当前用户行为数据;基于支持向量机算法,根据历史用户行为数据进行模型训练,得到行为预测模型,用已经采集到的当前用户行为数据输入至行为预测模型,以输出下一时刻对应的预测值,再通过比较所述预测值和下一时刻的用户行为数据确定系统的异常状况,从而通过监控用户行为及时地发现应用系统的问题以便后续技术人员针对该异常状况及时对应用系统进行改进,减少异常状况发生,用户的体验效果好。
对于上述实施例步骤S202,从所述状态指标数据中提取应用系统的特征数据,本申请提供了一实现该步骤的实施例,请参考图3,图3为从所述状态指标数据中提取应用系统的特征数据的子步骤的示意流程图,具体的包括:
S301、根据所述状态指标数据,构建数据矩阵。
具体的,将所述状态指标数据按照矩阵形式排列,构建数据矩阵W。
S302、对所述数据矩阵进行标准化处理以得到标准矩阵。
具体的,所述对所述数据矩阵进行标准化处理得到标准矩阵,具体包括:基于标准化公式,对所述数据矩阵进行标准化处理以得到标准矩阵R。
其中,标准化公式为:
其中,数据均值m为所述数据矩阵的行数;数据标准差wa,b为标准化前的所述状态指标数据,表示所述数据矩阵中第a行第b列的数据点;ra,b为标准化后的所述状态指标数据。
S303、计算所述标准矩阵对应的协方差矩阵以及所述协方差矩阵的特征值。
具体的,所述计算所述标准矩阵对应的协方差矩阵以及所述协方差矩阵的特征值,具体包括:
计算所述标准矩阵对应的协方差;
计算所述协方差矩阵的特征值。
在一实施方式中,所述计算所述标准矩阵对应的协方差矩阵,具体包括:
基于协方差公式,计算所述标准矩阵对应的协方差矩阵;其中,所述协方差公式为:
具体的,所述计算所述协方差矩阵的特征值,具体为:根据Cu=λu,计算所述协方差矩阵的特征值λ。通过上述方式计算特征值λ,也可以相应计算所述协方差矩阵的特征向量。
具体的,将所述特征值按降序排列,得到特征值序列。所述特征值序列中各特征值所对应的各特征向量也按照降序排列,得到特征向量序列。选择特征向量序列中不同范围内的一组特征向量即可实现特征向量序列的选择。
S304、根据所述特征值,计算所述特征值的贡献率。
具体的,所述根据所述特征值,所述计算所述特征值的贡献率,具体包括:
基于贡献率公式,根据所述特征值,计算所述特征值的贡献率;其中,所述贡献率公式为:
其中,g为所述贡献率,s为所述特征数据的维数;z为特征值的个数。
S305、根据所述贡献率,提取特征数据。
具体的,所述根据所述贡献率,提取特征数据,具体包括:
根据所述贡献率,确定主成分;根据所述主成分对应的标准化处理后的样本数据,构建特征数据。
具体的,所述根据所述贡献率,确定主成分,具体包括:选取所述贡献率大于或等于设定阀值的s个特征值所对应的成分作为主成分。根据s个所述主成分对应的标准化处理后的s项样本数据,构建特征数据。
以用户行为数据包括点击数量、曝光数量、交易数量为例,假设设定阀值为0.80,经过计算,点击数量对应的特征值为0.5,曝光数量对应的特征值为0.4,交易数量对应的特征值为0.2,则贡献率此时g大于设定阀值0.80,提取点击数量、曝光数量作为特征数据。
需要说明的是,本实施例中,以点击数量、曝光数量作为特征数据为例进行说明提取特征数据的具体过程,但在实际场合中,特征数据也可以为交易数量,本申请对此不作限定。
请参阅图4,图4是本申请的实施例三提供的应用系统的监控方法的步骤示意流程图。该应用系统的监控方法,通过监控用户行为及时、准确地发现应用系统出现的异常状况,以便后续技术人员针对该异常状况及时对应用系统进行改进,减少异常状况发生,用户的体验效果好。该方法的执行主体可以为网络设备,例如服务器或网络优化设备。
如图4所示,该应用系统的监控方法,具体包括:
S401、实时采集应用系统的状态指标数据。
其中,状态指标数据例如,搜索引擎响应用户点击数量,保险业务在展示媒介(例如网页、客户端页面)上的曝光数量、交易数量等等。
需要说明的是,每个应用系统在每个周期都有对应的状态指标数据。其中,当前状态指标数据是指在当前周期采集的系统的状态指标数据。历史状态指标数据是指在当前周期之前采集的系统的状态指标数据。历史用户行为数据是指从历史状态指标数据中按照采集时间由新到旧的顺序提取的用户行为数据。当前用户行为数据是指从当前状态指标数据中提取的用户行为数据。
S402、从所述状态指标数据中提取应用系统的特征数据,所述特征数据包括历史用户行为数据和当前用户行为数据。
其中,每种用户行为在每个周期都有相应的用户行为数据。具体的,当前用户行为数据是指应用系统在当前周期内所对应的用户行为数据。历史用户行为数据是指应用系统在当前周期之前的预设数量的周期所对应的用户行为数据的集合。
S403、基于支持向量机算法,根据所述历史用户行为数据进行模型训练以建立行为预测模型。
具体的,每种用户行为的历史用户行为数据可以看成一个时间序列。基于支持向量机算法,根据历史用户行为数据可以建立该种用户行为对应的行为预测模型,通过将当前周期的用户行为数据输入至该行为预测模型,能够预测下一时刻对应的预测值。
S404、将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的预测值。
在确定行为预测模型之后,保险监控系统可以定时或实时输入当前用户行为数据至行为预测模型,从而输出下一时刻对应的预测值。
S405、根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。
其中,下一时刻的用户行为数据是指从下一时刻的状态指标数据中提取的用户行为数据。
S406、当确定所述应用系统处于异常状态时,生成报警信息。
报警信息用于指示应用系统当前处于异常状态。
具体的,报警信息可以为文字报警信息、图片报警信息、音频报警信息、视频报警信息等,还可以进行相应的灯光报警、振动报警等。文字报警信息、图片报警信息、音频报警信息、视频报警信息等通过邮件、短信或者微信的至少一种消息通知媒介实现。
S407、根据预设报警策略,发送所述报警信息。
为了防止监控异常泛滥(例如当某些保险业务依赖的服务器宕机的极端情况下),报警系统压力过大,所述当确定所述应用系统处于异常状态时,生成报警信息之后,还包括:
根据预设报警策略,发送所述报警信息。
在某些实施方式中,所述预设报警策略可以包括以下的其中一种:
当确定所述应用系统处于异常状态的次数为一次时,发送所述报警信息;或,
当在第一预设时间内确定所述应用系统处于异常状态的次数大于或等于第二预设阀值时,发送所述报警信息;或,
当确定所述应用系统处于异常状态的次数等于第三预设阀值时,发送所述报警信息;或,
当确定所述应用系统处于异常状态的次数等于第四预设阀值且持续第二预设时间时,发送所述报警信息。
具体的,为了进一步防止监控异常泛滥(例如当某些保险业务依赖的服务器宕机的极端情况下),报警系统压力过大,致使短信、邮件系统压力巨大,带来雪崩效应的问题,需要根据实际需要,将监控异常选择不同的报警策略发出报警信息。比如“点击数量”的监控异常,可以定义为在30s内发生2次才发短信,也可以定义为5min内最多报警5次,一天内最多报警50次;虽然报警信息得到了合并,但在数据存储上,依然记录每条报警,如在6min内发生了200次报警,虽然只发了一条短信,但后台仍然记录200次报警记录。
其中,第一预设时间、第二预设时间、第二预设阀值、第三预设阀值、第四预设阀值可以根据实际需求进行设定。
上述实施例的监控方法,通过实时采集应用系统的状态指标数据;从所述状态指标数据中提取应用系统的特征数据,所述特征数据包括历史用户行为数据和当前用户行为数据;基于支持向量机算法,根据历史用户行为数据进行模型训练,得到行为预测模型;将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的预测值;根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况;当确定所述应用系统处于异常状态时,生成报警信息;根据预设报警策略,发送所述报警信息从而通过监控用户行为及时、准确地发现应用系统出现的异常状况以便后续技术人员针对该异常状况及时对应用系统进行改进,减少异常状况发生,用户的体验效果好。
可以理解的,行为预测模型可以有多个,包括点击预测模型、曝光预测模型等多个维度的用户行为的预测模型。在对应用系统进行监控的过程中,可以根据实际需要选择当前所需的行为预测模型。即,在对保险业务系统进行监控的过程中,多个维度的用户行为的行为预测模型可以只选择其中一个行为预测模型预测相应用户行为的预测值,也可以选择多个行为预测模型预测多个相应用户行为的预测值,以从多个维度确定应用系统的异常状况。
示例性的,为了提高监控的准确度,可以选择根据点击预测模型和曝光预测模型预测点击数量的预测值和曝光数量的预测值,以从点击数量和曝光数量两个维度确定应用系统的异常状况。即,根据点击预测模型预测点击数量的预测值,根据曝光预测模型预测曝光数量的预测值,从而从点击数量和曝光数量两个维度确定应用系统的异常状况,提高应用系统异常的监控效果。
需要说明的是,本申请提供的应用系统的监控方法,除了应用在保险应用系统的场景以外,还可以应用到其它应用系统的场景之中,例如游戏应用系统、购物应用系统、视频应用系统等应用场景,在此不做限定。
请参阅图5,图5是本申请的实施例还提供一种应用系统的监控装置的示意性框图,该应用系统的监控装置用于执行前述任一项应用系统的监控方法。其中,该应用系统的监控装置可以配置于服务器或终端中。
其中,服务器可以为独立的服务器,也可以为服务器集群。该终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。
如图5所示,应用系统的监控装置500包括:特征提取单元501、模型建立单元502、输入输出单元503、异常确定单元504。
特征提取单元501,用于提取应用系统的特征数据,所述特征数据包括历史用户行为数据和当前用户行为数据。
模型建立单元502,用于基于支持向量机算法,根据所述历史用户行为数据进行模型训练以建立行为预测模型。
输入输出单元503,用于将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的预测值。
异常确定单元504,用于根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。
在一实施例中,如图6所示,所述应用系统的监控装置还包括数据采集单元505,用于实时采集应用系统的状态指标数据。在该实施例中,特征提取单元501具体用于从所述状态指标数据中提取应用系统的特征数据。
在一实施例中,如图7所示,所述特征提取单元501包括数据构建单元5011、标准处理单元5012、第一计算单元5013、第二计算单元5014和数据提取单元5015。
其中,数据构建单元5011,用于根据所述状态指标数据,构建数据矩阵。
标准处理单元5012,用于对所述数据矩阵进行标准化处理以得到标准矩阵。
第一计算单元5013,用于计算所述标准矩阵对应的协方差矩阵以及所述协方差矩阵的特征值。
第二计算单元5014,用于根据所述特征值,计算所述特征值的贡献率。
数据提取单元5015,用于根据所述贡献率,提取特征数据。
在一个实施例中,标准处理单元5012,具体用于基于标准化公式,对所述数据矩阵进行标准化处理以得到标准矩阵,其中,所述标准化公式为:
其中,数据均值m为所述数据矩阵的行数;数据标准差wa,b为标准化前的所述状态指标数据,表示所述数据矩阵中第a行第b列的数据点;ra,b为标准化后的所述状态指标数据。
数据提取单元5015,具体用于基于贡献率公式,根据所述特征值,计算所述特征值的贡献率;其中,所述贡献率公式为:
其中,λ为所述特征值,g为所述贡献率,s为所述特征数据的维数;z为特征值的个数,s≤z。
模型建立单元502,具体用于基于支持向量机算法,根据所述历史用户行为数据进行模型训练,建立行为预测模型,其中,所述行为预测模型为:
其中,Xt为所述预测值,Xt-1,...,Xt-p为历史用户行为数据,和θj(1≤j≤q)为实参数,t/p/q为整数,且p≤t,q≤t;服从正态分布:是与前一时刻的Xt-k(k>0)不相关的随机序列。
在一实施例中,如图8所示,所述应用系统的监控装置还包括报警生成单元506和报警发送单元507。
其中,报警生成单元506,用于当确定所述应用系统处于异常状态时,生成报警信息。
报警发送单元507,用于根据预设报警策略,发送所述报警信息。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的应用系统的监控装置和各单元的具体工作过程,可以参考前述应用系统的监控方法实施例中的对应过程,在此不再赘述。
上述的应用系统的监控装置可以实现为一种计算机程序的形式,该计算机程序可以在如图9所示的计算机设备上运行。
请参阅图9,图9是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备可以是服务器或终端。
参阅图9,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行一种应用系统的监控方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行一种应用系统的监控方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
提取应用系统的特征数据,所述特征数据包括历史用户行为数据和当前用户行为数据;基于支持向量机算法,根据所述历史用户行为数据进行模型训练以建立行为预测模型;将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的预测值;根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。
在一实施例中,所述处理器在实现所述提取应用系统的特征数据之前,用于实现:
实时采集应用系统的状态指标数据。
在该实施例中,所述处理器在实现所述提取应用系统的特征数据时,用于实现:
从所述状态指标数据中提取应用系统的特征数据。
在一实施例中,所述处理器在实现所述从所述状态指标数据中提取应用系统的特征数据时,用于实现:根据所述状态指标数据,构建数据矩阵;
对所述数据矩阵进行标准化处理以得到标准矩阵;
计算所述标准矩阵对应的协方差矩阵以及所述协方差矩阵的特征值;
根据所述特征值,计算所述特征值的贡献率;
根据所述贡献率,提取特征数据。
在一实施例中,所述处理器在实现所述对所述数据矩阵进行标准化处理得到标准矩阵时,用于实现:
基于标准化公式,对所述数据矩阵进行标准化处理以得到标准矩阵,其中,所述标准化公式为:
其中,数据均值m为所述数据矩阵的行数;数据标准差wa,b为标准化前的所述状态指标数据,表示所述数据矩阵中第a行第b列的数据点;ra,b为标准化后的所述状态指标数据。
在一实施例中,所述处理器在实现所述根据所述特征值,计算所述特征值的贡献率时,用于实现:
基于贡献率公式,根据所述特征值,计算所述特征值的贡献率;其中,所述贡献率公式为:
其中,λ为所述特征值,g为所述贡献率,s为所述特征数据的维数;z为特征值的个数,s≤z。
在一实施例中,所述处理器在实现基于支持向量机算法,根据所述历史用户行为数据进行模型训练以建立行为预测模型时,具体用于实现:
基于支持向量机算法,根据所述历史用户行为数据进行模型训练以建立行为预测模型,所述行为预测模型为:
其中,Xt为所述预测值,Xt-1,...,Xt-p为历史用户行为数据,和θj(1≤j≤q)为实参数,t/p/q为整数,且p≤t,q≤t;服从正态分布:是与前一时刻的Xt-k(k>0)不相关的随机序列。
在一实施例中,所述处理器在实现所述根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况之后,还用于实现:
当确定所述应用系统处于异常状态时,生成报警信息;
根据预设报警策略,发送所述报警信息。
本申请的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项应用系统的监控方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种应用系统的监控方法,其特征在于,包括:
提取应用系统的特征数据,所述特征数据包括历史用户行为数据和当前用户行为数据;
基于支持向量机算法,根据所述历史用户行为数据进行模型训练以建立行为预测模型;
将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的预测值;
根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。
2.根据权利要求1所述的应用系统的监控方法,其特征在于,所述提取应用系统的特征数据之前,还包括:
实时采集应用系统的状态指标数据;
所述提取应用系统的特征数据,包括:
从所述状态指标数据中提取应用系统的特征数据。
3.根据权利要求2所述的应用系统的监控方法,其特征在于,所述从所述状态指标数据中提取应用系统的特征数据,包括:
根据所述状态指标数据,构建数据矩阵;
对所述数据矩阵进行标准化处理以得到标准矩阵;
计算所述标准矩阵对应的协方差矩阵以及所述协方差矩阵的特征值;
根据所述特征值,计算所述特征值的贡献率;
根据所述贡献率,提取特征数据。
4.根据权利要求3所述的应用系统的监控方法,其特征在于,所述对所述数据矩阵进行标准化处理得到标准矩阵,包括:基于标准化公式,对所述数据矩阵进行标准化处理以得到标准矩阵,其中,所述标准化公式为:
其中,数据均值m为所述数据矩阵的行数;数据标准差wa,b为标准化前的所述状态指标数据,表示所述数据矩阵中第a行第b列的数据点;ra,b为标准化后的所述状态指标数据。
5.根据权利要求3所述的应用系统的监控方法,其特征在于,所述根据所述特征值,计算所述特征值的贡献率,包括:
基于贡献率公式,根据所述特征值,计算所述特征值的贡献率;其中,所述贡献率公式为:
其中,λ为所述特征值,g为所述贡献率,s为所述特征数据的维数;z为特征值的个数,s≤z。
6.根据权利要求1-5任一项所述的应用系统的监控方法,其特征在于,所述行为预测模型为:
其中,Xt为所述预测值,Xt-1,...,Xt-p为历史用户行为数据,和θj(1≤j≤q)为实参数,t/p/q为整数,且p≤t,q≤t;服从正态分布:是与前一时刻的Xt-k(k>0)不相关的随机序列。
7.根据权利要求6所述的应用系统的监控方法,其特征在于,所述根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况之后,还包括:
当确定所述应用系统处于异常状态时,生成报警信息;
根据预设报警策略,发送所述报警信息。
8.一种应用系统的监控装置,其特征在于,包括:
特征提取单元,用于提取应用系统的特征数据,所述特征数据包括历史用户行为数据和当前用户行为数据;
模型建立单元,用于基于支持向量机算法,根据所述历史用户行为数据进行模型训练以建立行为预测模型;
输入输出单元,用于将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的预测值;
异常确定单元,用于根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至7中任一项所述的应用系统的监控方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的应用系统的监控方法。
CN201910145580.6A 2019-02-27 2019-02-27 应用系统的监控方法、装置、设备及存储介质 Active CN109992473B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910145580.6A CN109992473B (zh) 2019-02-27 2019-02-27 应用系统的监控方法、装置、设备及存储介质
PCT/CN2019/118226 WO2020173136A1 (zh) 2019-02-27 2019-11-13 应用系统的监控方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910145580.6A CN109992473B (zh) 2019-02-27 2019-02-27 应用系统的监控方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109992473A true CN109992473A (zh) 2019-07-09
CN109992473B CN109992473B (zh) 2022-07-15

Family

ID=67130253

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910145580.6A Active CN109992473B (zh) 2019-02-27 2019-02-27 应用系统的监控方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN109992473B (zh)
WO (1) WO2020173136A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026626A (zh) * 2019-11-29 2020-04-17 中国建设银行股份有限公司 Cpu消耗量预估、预估模型训练方法及装置
WO2020173136A1 (zh) * 2019-02-27 2020-09-03 平安科技(深圳)有限公司 应用系统的监控方法、装置、设备及存储介质
CN111708682A (zh) * 2020-06-17 2020-09-25 腾讯科技(深圳)有限公司 数据预测方法、装置、设备及存储介质
CN112116397A (zh) * 2020-09-25 2020-12-22 贝壳技术有限公司 用户行为特征实时处理方法、装置、存储介质及电子设备
CN114090411A (zh) * 2022-01-20 2022-02-25 山东中创软件商用中间件股份有限公司 一种应用数据分析方法、装置、设备及可读存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115840356B (zh) * 2022-10-18 2023-12-22 中健国康科技(江苏)有限公司 一种微感智能护理床控制方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324034A (zh) * 2011-05-25 2012-01-18 北京理工大学 基于最小二乘支持向量机在线预测的传感器故障诊断方法
CN106126391A (zh) * 2016-06-28 2016-11-16 北京百度网讯科技有限公司 系统监控方法和装置
CN108089962A (zh) * 2017-11-13 2018-05-29 北京奇艺世纪科技有限公司 一种异常检测方法、装置及电子设备
CN108197737A (zh) * 2017-12-29 2018-06-22 山大地纬软件股份有限公司 一种建立医保住院费用预测模型的方法及系统
CN108595301A (zh) * 2018-03-26 2018-09-28 中国科学院计算技术研究所 一种基于机器学习的服务器能耗预测方法和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106383766B (zh) * 2016-09-09 2018-09-11 北京百度网讯科技有限公司 系统监控方法和装置
CN106534212A (zh) * 2016-12-29 2017-03-22 杭州世平信息科技有限公司 基于用户行为和数据状态的自适应安全防护方法及系统
CN107864405B (zh) * 2017-11-14 2020-12-01 国家新闻出版广电总局广播科学研究院 一种收视行为类型的预测方法、装置及计算机可读介质
CN109345013A (zh) * 2018-09-25 2019-02-15 广西电网有限责任公司电力科学研究院 一种配电用户用电行为预测方法
CN109992473B (zh) * 2019-02-27 2022-07-15 平安科技(深圳)有限公司 应用系统的监控方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324034A (zh) * 2011-05-25 2012-01-18 北京理工大学 基于最小二乘支持向量机在线预测的传感器故障诊断方法
CN106126391A (zh) * 2016-06-28 2016-11-16 北京百度网讯科技有限公司 系统监控方法和装置
CN108089962A (zh) * 2017-11-13 2018-05-29 北京奇艺世纪科技有限公司 一种异常检测方法、装置及电子设备
CN108197737A (zh) * 2017-12-29 2018-06-22 山大地纬软件股份有限公司 一种建立医保住院费用预测模型的方法及系统
CN108595301A (zh) * 2018-03-26 2018-09-28 中国科学院计算技术研究所 一种基于机器学习的服务器能耗预测方法和系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020173136A1 (zh) * 2019-02-27 2020-09-03 平安科技(深圳)有限公司 应用系统的监控方法、装置、设备及存储介质
CN111026626A (zh) * 2019-11-29 2020-04-17 中国建设银行股份有限公司 Cpu消耗量预估、预估模型训练方法及装置
CN111708682A (zh) * 2020-06-17 2020-09-25 腾讯科技(深圳)有限公司 数据预测方法、装置、设备及存储介质
CN112116397A (zh) * 2020-09-25 2020-12-22 贝壳技术有限公司 用户行为特征实时处理方法、装置、存储介质及电子设备
CN114090411A (zh) * 2022-01-20 2022-02-25 山东中创软件商用中间件股份有限公司 一种应用数据分析方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN109992473B (zh) 2022-07-15
WO2020173136A1 (zh) 2020-09-03

Similar Documents

Publication Publication Date Title
CN109992473A (zh) 应用系统的监控方法、装置、设备及存储介质
US10270668B1 (en) Identifying correlated events in a distributed system according to operational metrics
AU2019201687B2 (en) Network device vulnerability prediction
CN110493080B (zh) 一种区块链节点监控方法、装置及电子设备和存储介质
EP2874064B1 (en) Adaptive metric collection, storage, and alert thresholds
US8862119B2 (en) Method and apparatus for telecommunications network performance anomaly events detection and notification
CN111478857B (zh) 一种接口限流控制方法、装置以及电子设备
US20190147354A1 (en) Event identification through machine learning
US10935970B2 (en) Electrical device degradation determination
US11074652B2 (en) System and method for model-based prediction using a distributed computational graph workflow
US10484253B2 (en) Topology map update with service quality indicators
CN110955586A (zh) 一种基于日志的系统故障预测方法、装置和设备
CN106933677A (zh) 系统异常处理方法及装置
CN114338372A (zh) 网络信息安全监控方法及系统
CN116418653A (zh) 基于多指标根因定位算法的故障定位方法及装置
US20160094392A1 (en) Evaluating Configuration Changes Based on Aggregate Activity Level
US10282245B1 (en) Root cause detection and monitoring for storage systems
US20220058745A1 (en) System and method for crowdsensing-based insurance premiums
US10223189B1 (en) Root cause detection and monitoring for storage systems
CN105490835A (zh) 信息监控方法和装置
CN113835961B (zh) 告警信息监控方法、装置、服务器及存储介质
CN109669836A (zh) 智能it运维分析方法、装置、设备及可读存储介质
US9898357B1 (en) Root cause detection and monitoring for storage systems
CN109783310A (zh) It设备的多维动态安全监控方法及其监控装置
CN113946493A (zh) 一种监控阈值确定及监控报警方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant