WO2020173136A1 - 应用系统的监控方法、装置、设备及存储介质 - Google Patents

应用系统的监控方法、装置、设备及存储介质 Download PDF

Info

Publication number
WO2020173136A1
WO2020173136A1 PCT/CN2019/118226 CN2019118226W WO2020173136A1 WO 2020173136 A1 WO2020173136 A1 WO 2020173136A1 CN 2019118226 W CN2019118226 W CN 2019118226W WO 2020173136 A1 WO2020173136 A1 WO 2020173136A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
application system
user behavior
characteristic
matrix
Prior art date
Application number
PCT/CN2019/118226
Other languages
English (en)
French (fr)
Inventor
朱坤
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2020173136A1 publication Critical patent/WO2020173136A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Definitions

  • This application relates to the field of Internet insurance technology, and in particular to a monitoring method, device, device, and storage medium of an application system. Background technique
  • This application provides a monitoring method, device, device, and storage medium for an application system, which can detect problems in the application system in time so that subsequent technicians can improve the application system in time for the abnormal situation and reduce the occurrence of abnormal situations.
  • this application provides a monitoring method of an application system, the method includes: extracting characteristic data of the application system, the characteristic data including historical user behavior data and current user behavior data;
  • this application also provides a monitoring device for an application system, the device comprising: a feature extraction unit configured to extract feature data of the application system, the feature data including historical user behavior data and current user behavior data;
  • the model building unit is configured to perform calculations based on the support vector machine algorithm according to the historical user behavior data Perform model training to build behavior prediction models;
  • An input and output unit configured to input the current user behavior data into the behavior prediction model to output the prediction value corresponding to the next moment
  • the abnormality determining unit is configured to determine the abnormal condition of the application system according to the predicted value and user behavior data at the next moment.
  • the present application also provides a computer device that includes a memory and a processor; the memory is used to store a computer program; the processor is used to execute the computer program and when the The computer program implements the monitoring method of the application system as described above.
  • the present application also provides a computer-readable storage medium, where the computer-readable storage medium stores a computer program, and when the computer program is executed by a processor, the processor implements the application system as described above. Monitoring method.
  • FIG. 1 is a schematic flow chart of the steps of the monitoring method of the application system provided in the first embodiment of the application
  • FIG. 2 is a schematic flow chart of the steps of the monitoring method of the application system provided in the second embodiment of the present application
  • FIG. 3 is in FIG. 2 A schematic flow chart of the sub-steps of the monitoring method of the application system
  • FIG. 4 is a schematic flowchart of the steps of the monitoring method of the application system provided in the third embodiment of the present application;
  • FIG. 5 is a schematic block diagram of the monitoring device of the application system provided in an embodiment of the present application;
  • FIG. 6 is the present application Another embodiment provides a schematic block diagram of a monitoring device of an application system;
  • FIG. 7 is a schematic block diagram of a subunit of the monitoring device of the application system in FIG. 6;
  • Fig. 8 is a schematic block diagram of a monitoring device of an application system provided by still another embodiment of the present application
  • Fig. 9 is a schematic block diagram of a computer device provided by an embodiment of the present application. detailed description
  • the embodiments of the present application provide a monitoring method, device, computer equipment, and storage medium of an application system.
  • the monitoring method of the application system can be used to monitor the application system of insurance business. Abnormalities of the application system can be detected in time.
  • Fig. 1 is a schematic flowchart of the steps of the monitoring method of the application system provided in the first embodiment of the present application.
  • the monitoring method of the application system detects abnormal conditions in the application system in time by monitoring user behavior, so that subsequent technicians can improve the application system in time for the abnormal conditions, reduce the occurrence of abnormal conditions, and have a good user experience.
  • the execution subject of this method may be a network device, such as a server or a network optimization device.
  • the monitoring method of the application system specifically includes: Step 101 to Step 104.
  • the preset unit time may be used as a cycle of extraction to extract the feature data of each application system.
  • the unit time can be set according to actual needs, such as one day, one hour or one minute.
  • Characteristic data is used to reflect the external characteristics of the application system. It is closely related to user behavior, can reflect the operating conditions of machines or services, and has a specific changing law.
  • the characteristic data of a certain dimension of the application system can be obtained, and a kind of behavior characteristic data can be obtained.
  • K dimensions may be, for example, the number of exposures, the number of clicks, the number of transactions, etc.
  • the corresponding K types of user behavior characteristic data may be exposure characteristic data, click characteristic data, transaction characteristic data, and so on.
  • each user behavior has corresponding user behavior data in each cycle.
  • current user behavior data refers to user behavior data corresponding to the application system in the current cycle.
  • Historical user behavior data refers to a collection of user behavior data corresponding to the application system in a preset number of cycles before the current cycle. For example, if the current period is T and the preset number is u, the historical user behavior data is a collection of user behavior data of the application system from the T-1 period to the T-u period.
  • the monitored application system and the monitoring method of the application system can run on the same electronic device (for example, a server), or can run on different electronic devices.
  • a machine learning model can be established to predict the predicted value of the user behavior at the next moment.
  • the behavior prediction model can be described as:
  • Cloth ⁇ NID(0, (jd ), and is a random sequence that is not related to X tk > 0 at the previous moment.
  • the behavior prediction model cannot be set in stone. It needs to change according to the dynamic changes of the distribution law of user behavior data. In practical applications, at regular intervals, the behavior prediction model should be rebuilt according to the newly extracted feature data. In this way, the current user behavior data is input to the behavior prediction model, and the output prediction value can accurately reflect the distribution law of the user behavior data of the application system at the next moment.
  • the insurance monitoring system can input the user behavior data of the current period into the behavior prediction model regularly or in real time to output the prediction value.
  • the predicted value is data predicted based on the behavior prediction model and current user behavior data.
  • the current click data is input to the click prediction model to output the predicted value of the click data in the next cycle.
  • the current exposure data is input to the exposure prediction model, so as to output the predicted value of the exposure data in the next cycle.
  • next moment should be the same length as the current period. If the current period is T, the next moment can be T+1.
  • the user behavior data at the next moment refers to user behavior data extracted from the state indicator data at the next moment.
  • the method before determining the abnormal condition of the application system according to the predicted value and user behavior data at the next moment, the method further includes:
  • the determining the abnormal condition of the application system according to the predicted value and user behavior data at the next moment specifically includes:
  • the ratio of the user behavior data to the predicted value is less than a preset threshold, it is determined that the application system is abnormal.
  • the specific value of the preset threshold needs to be determined according to actual needs.
  • the user behavior data at the next moment refers to user behavior data extracted from the state indicator data at the next moment.
  • the predicted value is relatively similar to the user behavior data at the next moment, and the user can use the insurance business normally, so that the status of the application system at the next moment can be determined to be normal.
  • the working conditions are similar, so it can be determined that the application system is in a normal state at the next moment.
  • the above ratio is less than the first preset threshold, it is determined that the application system is in an abnormal state.
  • the ratio is less than the first preset threshold value, it can be indicated that the predicted value is very different from the user behavior data at the next moment, so that it can be determined that the state of the application system at the next moment is different from the state of normal operation.
  • the use of insurance business is affected, and it is determined that the application system is abnormal. After determining that the application system is abnormal, the technicians should be notified to check and repair on site in time to avoid affecting the user's use due to the abnormal state of the application system, thereby ensuring the user's experience and use.
  • the first preset threshold is 8%, when the number of clicks on the website at ten o'clock is predicted to be 50000 at nine o'clock on Saturday, but the number of clicks actually extracted at ten o'clock is 50, the user at the next moment
  • the ratio of the behavior data to the predicted value is 0.1%, which is less than the first preset threshold of 8%, so it is determined that the application system is in an abnormal state. If the actual value of the number of clicks extracted at ten o'clock is 55,000, the ratio of the user behavior data at the next moment to the predicted value is 1 to 10%, which is greater than the first preset threshold of 8%, thus it is determined that the application system is at normal status.
  • a behavior prediction model is obtained by performing model training based on a support vector machine algorithm based on historical user behavior data, and the current user behavior data that has been collected is used to input the behavior prediction model to output the corresponding behavior at the next moment. Predicted value, and then compare the predicted value with the next The user behavior data at a moment determines the abnormal state of the system, so that the application system can be discovered in time by monitoring user behavior so that subsequent technicians can improve the application system in time for the abnormal state, reduce the occurrence of abnormal conditions, and have a good user experience.
  • Fig. 2 is a schematic flowchart of the steps of the monitoring method of the application system provided in the second embodiment of the present application.
  • the monitoring method of the application system detects abnormal conditions in the application system in time by monitoring user behavior, so that subsequent technicians can improve the application system in time for the abnormal conditions, reduce the occurrence of abnormal conditions, and have a good user experience.
  • the execution subject of this method may be a network device, such as a server or a network optimization device.
  • the monitoring method of the application system specifically includes:
  • the status indicator data is, for example, the number of clicks that the search engine responds to the user, the number of exposures of the insurance business on the display medium (such as a webpage, a client page), the number of transactions, and so on.
  • the state indicator data includes current state indicator data and historical state indicator data, where the current state indicator data refers to the state indicator data of the application system collected at the current moment.
  • the historical state index data refers to the state index data of the application system collected at the time before the current time.
  • Historical user behavior data refers to user behavior data extracted from historical state indicator data in the order of collection time from newest to oldest.
  • Current user behavior data refers to user behavior data extracted from current state indicator data.
  • the set time is taken as a cycle, that is, the set time is taken as the cycle of collecting state indicator data.
  • the set time can be set as required, such as 1 minute, 3 minutes, 5 minutes, etc. For example, assuming that the set time is 5 minutes and the current cycle is the time period from 10:00 to 10:05, the current state indicator data is the state indicator of the system collected in the time period from 10:00 to 10:05 data.
  • S202 Extract characteristic data of the application system from the state indicator data, where the characteristic data includes historical user behavior data and current user behavior data.
  • each user behavior has corresponding user behavior data in each cycle.
  • current user behavior data refers to user behavior data corresponding to the application system in the current cycle.
  • Historical user behavior data refers to the collection of user behavior data corresponding to a preset number of cycles before the current cycle of the application system.
  • S203 Based on the support vector machine algorithm, perform model training according to the historical user behavior data to establish a behavior prediction model.
  • the historical user behavior data of each user behavior can be regarded as a time series.
  • a behavior prediction model corresponding to this user behavior can be established based on historical user behavior data.
  • the prediction value corresponding to the next moment can be predicted.
  • the insurance monitoring system can input the current user behavior data into the behavior prediction model regularly or in real time, so as to output the corresponding prediction value at the next moment.
  • the predicted value is data predicted based on the behavior prediction model and current user behavior data.
  • S205 Determine the abnormal condition of the application system according to the predicted value and user behavior data at the next moment.
  • the user behavior data at the next moment refers to user behavior data extracted from the state indicator data at the next moment.
  • the monitoring method of the above embodiment collects the status indicator data of the application system in real time; extracts the characteristic data of the application system from the status indicator data, the characteristic data includes historical user behavior data and current user behavior data; based on support vector machine
  • the algorithm performs model training based on historical user behavior data to obtain a behavior prediction model, and uses the collected current user behavior data to input to the behavior prediction model to output the prediction value corresponding to the next moment, and then compare the prediction value with the next
  • the user behavior data at a moment determines the abnormal state of the system, so that the application system can be discovered in time by monitoring user behavior so that subsequent technicians can improve the application system in time for the abnormal state, reduce the occurrence of abnormal conditions, and have a good user experience.
  • step S202 of the above embodiment the characteristic data of the application system is extracted from the state indicator data.
  • This application provides an embodiment for implementing this step. Please refer to FIG. 3, which is an example of extracting the application system from the state indicator data.
  • the schematic flow chart of the sub-steps of the characteristic data of the system specifically includes:
  • the state indicator data is arranged in a matrix form to construct a data matrix W.
  • the calculating the covariance matrix corresponding to the standard matrix and the characteristic value of the covariance matrix specifically includes:
  • the calculating the covariance matrix corresponding to the standard matrix specifically includes: calculating the covariance matrix corresponding to the standard matrix based on a covariance formula; wherein, the covariance formula is:
  • the characteristic values are arranged in descending order to obtain a characteristic value sequence.
  • the feature vectors corresponding to the feature values in the feature value sequence are also arranged in descending order to obtain the feature vector sequence.
  • the selection of the feature vector sequence can be achieved by selecting a group of feature vectors in different ranges in the feature vector sequence.
  • S304. Calculate the contribution rate of the characteristic value according to the characteristic value.
  • the calculating the contribution rate of the characteristic value according to the characteristic value specifically includes: calculating the contribution rate of the characteristic value according to the characteristic value based on the contribution rate formula; wherein, the contribution The rate formula is:
  • g is the contribution rate
  • s is the dimension of the feature data
  • z is the number of feature values.
  • the extracting feature data according to the contribution rate specifically includes:
  • the threshold is set to 0.80
  • the feature value corresponding to the number of clicks is 0.5
  • the feature value corresponding to the number of exposures is 0.5
  • the number of clicks and the number of exposures are taken as the characteristic data as examples to illustrate the specific process of extracting the characteristic data, but in actual situations, the characteristic data may also be the transaction quantity, which is not limited in this application. .
  • FIG. 4 is a schematic flowchart of the steps of the monitoring method of the application system provided in the third embodiment of the present application.
  • the monitoring method of the application system can timely and accurately discover abnormal conditions in the application system by monitoring user behaviors, so that subsequent technicians can improve the application system in time for the abnormal conditions, reduce the occurrence of abnormal conditions, and have a good user experience.
  • the execution subject of this method may be a network device, such as a server or a network optimization device.
  • the monitoring method of the application system specifically includes:
  • S402 Extract characteristic data of the application system from the state indicator data, where the characteristic data includes historical user behavior data and current user behavior data.
  • each user behavior has corresponding user behavior data in each cycle.
  • current user behavior data refers to user behavior data corresponding to the application system in the current cycle.
  • Historical user behavior data refers to user behavior data corresponding to a preset number of cycles before the current cycle of the application system Collection.
  • S403 Based on the support vector machine algorithm, perform model training according to the historical user behavior data to establish a behavior prediction model.
  • the historical user behavior data of each user behavior can be regarded as a time series.
  • a behavior prediction model corresponding to this type of user behavior can be established based on historical user behavior data.
  • the prediction value corresponding to the next moment can be predicted.
  • the insurance monitoring system can input the current user behavior data into the behavior prediction model regularly or in real time, so as to output the corresponding prediction value at the next moment.
  • S405. Determine the abnormal status of the application system according to the predicted value and the user behavior data at the next moment.
  • the user behavior data at the next moment refers to user behavior data extracted from the state indicator data at the next moment.
  • the alarm information is used to indicate that the application system is currently in an abnormal state.
  • the alarm information can be text alarm information, picture alarm information, audio alarm information, video alarm information, etc., and corresponding light alarms, vibration alarms, etc. can also be performed.
  • Text alarm information, picture alarm information, audio alarm information, video alarm information, etc. are realized through at least one message notification medium such as email, SMS or WeChat.
  • S407 Send the alarm information according to a preset alarm strategy.
  • the method further includes:
  • the alarm information is sent.
  • the preset alarm strategy may include one of the following: when it is determined that the number of times the application system is in an abnormal state is once, sending the alarm information; or,
  • the alarm information is sent; or,
  • the alarm system in order to further prevent the abnormal flooding of monitoring (for example, when some insurance services rely on the extreme case of server downtime), the alarm system is over-stressed, resulting in huge pressure on the SMS and email systems, and the problem of avalanche effect.
  • the monitoring abnormality of "number of clicks" can be defined as two times within 30s before sending a text message, or it can be defined as a maximum of 5 alarms within 5 minutes and a maximum of 50 alarms within a day; although the alarm information is merged, In the data storage, each alarm is still recorded. For example, 200 alarms have occurred within 6 min. Although only one SMS is sent, the background still records 200 alarms.
  • the first preset time, the second preset time, the second preset threshold, the third preset threshold, and the fourth preset threshold can be set according to actual needs.
  • the status indicator data of the application system is collected in real time;
  • the characteristic data of the application system is extracted from the state index data, and the characteristic data includes historical user behavior data and current user behavior data; based on the support vector machine algorithm, model training is performed according to the historical user behavior data to obtain a behavior prediction model; Input user behavior data into the behavior prediction model to output the prediction value corresponding to the next moment; determine the abnormal condition of the application system according to the prediction value and user behavior data at the next moment; when it is determined that the application system is abnormal In the state, the alarm information is generated; according to the preset alarm strategy, the alarm information is sent to timely and accurately discover the abnormal conditions of the application system by monitoring user behavior so that the follow-up technicians can improve the application system in time according to the abnormal conditions to reduce An abnormal situation occurs, and the user experience is good.
  • the behavior prediction model currently required can be selected according to actual needs. That is, in the process of monitoring the insurance business system, the behavior prediction models of user behaviors in multiple dimensions may select only one behavior prediction model to predict the prediction value of the corresponding user behavior, or select multiple behavior prediction models to predict multiple behavior prediction models. The predicted value of the corresponding user behavior to determine the abnormal condition of the application system from multiple dimensions.
  • monitoring method of the application system provided in this application can be applied to scenarios of other application systems, such as game application systems, shopping application systems, video application systems, etc., in addition to the scenarios of insurance application systems.
  • the application scenario is not limited here.
  • FIG. 5 is a schematic block diagram of a monitoring device of an application system according to an embodiment of the present application.
  • the monitoring device of the application system is used to execute any of the foregoing monitoring methods of the application system.
  • the monitoring device of the application system can be configured in a server or a terminal.
  • the server may be an independent server or a server cluster.
  • the terminal can be an electronic device such as a mobile phone, a tablet computer, a notebook computer, a desktop computer, a personal digital assistant, and a wearable device.
  • the monitoring device 500 of the application system includes: a feature extraction unit 501, a model establishment unit 502, an input output unit 503, and an abnormality determination unit 504.
  • the feature extraction unit 501 is configured to extract feature data of the application system, where the feature data includes historical user behavior data and current user behavior data.
  • the model establishment unit 502 is configured to perform model training according to the historical user behavior data based on the support vector machine algorithm to establish a behavior prediction model.
  • the input and output unit 503 is configured to input the current user behavior data into the behavior prediction model to output the prediction value corresponding to the next moment.
  • the abnormality determining unit 504 is configured to determine the abnormal condition of the application system according to the predicted value and user behavior data at the next moment.
  • the monitoring device of the application system further includes a data collection unit 505 for real-time collection of status indicator data of the application system.
  • the feature extraction unit 501 is specifically configured to extract feature data of the application system from the state indicator data.
  • the feature extraction unit 501 includes a data construction unit 5011, a standard processing unit 5012, a first calculation unit 5013, a second calculation unit 5014, and a data extraction unit 5015.
  • the second calculation unit 5014 is configured to calculate the contribution rate of the characteristic value according to the characteristic value.
  • the data extraction unit 5015 is configured to extract feature data according to the contribution rate.
  • the standard processing unit 5012 is specifically configured to perform standardization processing on the data matrix based on a standardization formula to obtain a standard matrix, where the standardization formula is:
  • the model building unit 502 is specifically configured to perform model training based on the support vector machine algorithm according to the historical user behavior data to establish a behavior prediction model, where the behavior prediction model is:
  • the monitoring device of the application system further includes an alarm generating unit 506 and an alarm sending unit 507.
  • the alarm generating unit 506 is configured to generate alarm information when it is determined that the application system is in an abnormal state.
  • the monitoring device of the application system described above and the specific working process of each unit can refer to the monitoring method embodiment of the application system described above. The corresponding process will not be repeated here.
  • FIG. 9 is a schematic block diagram of a computer device according to an embodiment of the present application.
  • the computer equipment can be a server or a terminal.
  • the computer device includes a processor, a memory, and a network interface connected through a system bus, where the memory may include a non-volatile storage medium and an internal memory.
  • the non-volatile storage medium can store the operating system and the computer program.
  • the computer program includes program instructions, and when the program instructions are executed, the processor can execute an application system monitoring method.
  • the processor is used to provide calculation and control capabilities, and supports the operation of the entire computer equipment.
  • the processor may be a central processing unit (Central Processing Unit, CPU), and the processor may also be other general-purpose processors, digital signal processors (digital signal processors, DSP), and application-specific integrated circuits (application-specific integrated circuits). Specific Integrated Circuit, ASIC), ready-made programmable gate array (Fielch Programmable Gate Array, FPGA) or other programmable logic devices, discrete gates or transistor logic devices, discrete hardware components, etc.
  • the general-purpose processor may be a microprocessor or the processor may also be any conventional processor.
  • the processor when the processor realizes the calculation of the contribution rate of the characteristic value according to the characteristic value, it is configured to realize:
  • 2 is the characteristic value
  • g is the contribution rate
  • s is the dimension of the characteristic data
  • z is the number of characteristic values
  • model training is performed according to the historical user behavior data to establish behavior
  • the alarm information is sent.
  • the computer-readable storage medium may be the internal storage unit of the computer device described in the foregoing embodiment, for example, the hard disk or memory of the computer device.
  • the computer-readable storage medium may also be an external storage device of the computer device, such as a plug-in hard disk, a smart memory card (Smart Med ia Card, SMC), and a secure digital (Secure Digi ta l, SD) card, flash card (Flash Card), etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

一种应用系统的监控方法、装置、设备及存储介质,方法包括:提取应用系统的特征数据;基于支持向量机算法,根据历史用户行为数据进行模型训练以建立行为预测模型;将当前用户行为数据输入至行为预测模型以输出下一时刻对应的预测值;根据预测值与下一时刻的用户行为数据确定应用系统的异常状况。

Description

应用系统的监控方法、 装置、 设备及存储介质
本申请要求于 2019年 02月 27日提交中国专利局、申请号为 201910145580. 6、 发明名称为 “应用系统的监控方法、 装置、 设备及存储介质” 的中国专利申请 的优先权, 其全部内容通过引用结合在本申请中。 技术领域
本申请涉及互联网保险技术领域, 尤其涉及一种应用系统的监控方法、 装 置、 设备及存储介质。 背景技术
随着公司网络业务的快速发展, 各种网络业务的应用系统的数量不断增多, 保险领域的应用系统也得到了飞速发展。 一个保险业务的运行通常需要多个应 用系统的支持。 然而由于保险业务的多变、 应用系统漏洞等原因, 应用系统经 常出现异常情况, 因而导致保险业务难以正常运行。
目前, 行业内相关的监控产品通常是通过监控应用程序的性能, 例如 CPU、 内存、 网络带宽等数据来进行报警, 从而监控应用系统是否异常。 然而, 由于 保险业务受到诸多因素影响, 多个应用系统关联复杂等原因, 很多时候不能及 时发现应用系统的异常, 影响用户正常使用保险业务。 为了更好的维护保险业 务的正常使用, 保障用户的体验和使用, 有必要提供一种应用系统的监控方法, 以及时监控应用系统是否异常。 发明内容
本申请提供了一种应用系统的监控方法、 装置、 设备及存储介质, 该监控 方法能够及时地发现应用系统的问题以便后续技术人员针对该异常状况及时对 应用系统进行改进, 减少异常状况发生。
第一方面, 本申请提供了一种应用系统的监控方法, 所述方法包括: 提取应用系统的特征数据, 所述特征数据包括历史用户行为数据和当前用 户行为数据;
基于支持向量机算法, 根据所述历史用户行为数据进行模型训练以建立行 为预测模型;
将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的 预测值;
根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。 第二方面, 本申请还提供了一种应用系统的监控装置, 所述装置包括: 特征提取单元, 用于提取应用系统的特征数据, 所述特征数据包括历史用 户行为数据和当前用户行为数据;
模型建立单元, 用于基于支持向量机算法, 根据所述历史用户行为数据进 行模型训练以建立行为预测模型;
输入输出单元, 用于将所述当前用户行为数据输入至所述行为预测模型以 输出下一时刻对应的预测值;
异常确定单元, 用于根据所述预测值与下一时刻的用户行为数据确定所述 应用系统的异常状况。
第三方面, 本申请还提供了一种计算机设备, 所述计算机设备包括存储器 和处理器; 所述存储器用于存储计算机程序; 所述处理器, 用于执行所述计算 机程序并在执行所述计算机程序时实现如上述的应用系统的监控方法。
第四方面, 本申请还提供了一种计算机可读存储介质, 所述计算机可读存 储介质存储有计算机程序, 所述计算机程序被处理器执行时使所述处理器实现 如上述的应用系统的监控方法。
本申请公开了一种应用系统的监控方法、 装置、 设备及存储介质, 通过基 于支持向量机算法, 根据历史用户行为数据进行模型训练, 得到行为预测模型, 用已经采集到的当前用户行为数据输入至行为预测模型, 以输出下一时刻对应 的预测值, 再通过比较预测值和真实值 (即下一时刻的用户行为数据) 确定系 统的异常状况, 从而通过监控用户行为及时地发现应用系统的问题以便后续技 术人员针对该异常状况及时对应用系统进行改进, 减少异常状况发生。 附图说明
为了更清楚地说明本申请实施例技术方案, 下面将对实施例描述中所需要 使用的附图作简单地介绍, 显而易见地, 下面描述中的附图是本申请的一些实 施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以 根据这些附图获得其他的附图。
图 1是本申请的实施例一提供的应用系统的监控方法的步骤示意流程图; 图 2是本申请的实施例二提供的应用系统的监控方法的步骤示意流程图; 图 3为图 2中应用系统的监控方法的子步骤的示意流程图;
图 4是本申请的实施例三提供的应用系统的监控方法的步骤示意流程图; 图 5是本申请的一实施例提供的一种应用系统的监控装置的示意性框图; 图 6是本申请的另一实施例提供的一种应用系统的监控装置的示意性框图; 图 7是图 6中应用系统的监控装置的子单元的示意性框图;
图 8是本申请的再一实施例提供的一种应用系统的监控装置的示意性框图; 图 9是本申请实施例提供的一种计算机设备的示意性框图。 具体实施方式
下面将结合本申请实施例中的附图, 对本申请实施例中的技术方案进行清 楚、 完整地描述, 显然, 所描述的实施例是本申请一部分实施例, 而不是全部 的实施例。 基于本申请中的实施例, 本领域普通技术人员在没有做出创造性劳 动前提下所获得的所有其他实施例, 都属于本申请保护的范围。
附图中所示的流程图仅是示例说明, 不是必须包括所有的内容和操作 /步骤, 也不是必须按所描述的顺序执行。 例如, 有的操作 /步騍还可以分解、 组合或部 分合并, 因此实际执行的顺序有可能根据实际情况改变。
本申请的实施例提供了一种应用系统的监控方法、 装置、 计算机设备及存 储介质。 该应用系统的监控方法可用于监控保险业务的应用系统, 针对应用系 统的异常, 能够及时地发现应用系统出现的异常状况。
下面结合附图, 对本申请的一些实施方式作详细说明。 在不冲突的情况下, 下述的实施例及实施例中的特征可以相互组合。
请参阅图 1 , 图 1是本申请的实施例一提供的应用系统的监控方法的步骤示 意流程图。 该应用系统的监控方法, 通过监控用户行为及时发现应用系统出现 的异常状况, 以便后续技术人员针对该异常状况及时对应用系统进行改进, 减 少异常状况发生, 用户的体验效果好。 该方法的执行主体可以为网络设备, 例 如服务器或网络优化设备。
如图 1所示, 该应用系统的监控方法, 具体包括: 步骤 101 至步骤 1 04。
51 01、 提取应用系统的特征数据, 所述特征数据包括历史用户行为数据和 当前用户行为数据。
具体的, 在提取特征数据时, 可以以预设单位时间作为提取的一个周期, 提取每个应用系统的特征数据。 单位时间可以根据实际需求进行设定, 例如设 定为一天、 一个小时或一分钟。
特征数据用于反映应用系统的外在特征的数据, 其与用户行为密切相关, 能够反映机器或服务的运行状况, 具有特定的变化规律。 在某些实施方式中, 在提取应用系统的特征数据时, 可以获取应用系统某一个維度的特征数据, 得 到一种行为特征数据。 当然, 在其他实施方式中, 也可以获取应用系统在 K个 维度的特征数据, 得到 K种用户行为特征数据, 其中, 上述 K值为大于 1 的整 数。 K个维度可以为例如曝光数量、 点击数量、 交易数量等等, K种用户行为特 征数据对应可以为曝光特征数据、 点击特征数据、 交易特征数据等。
可以理解的, 每种用户行为在每个周期都有相应的用户行为数据。 在本实 施例中, 当前用户行为数据是指应用系统在当前周期内所对应的用户行为数据。 历史用户行为数据是指应用系统在当前周期之前的预设数量的周期内所对应的 用户行为数据的集合。 例如, 当前周期为 T, 预设数量为 u, 则历史用户行为数 据为应用系统在 T-1周期至 T-u周期的用户行为数据的集合。
其中,被监控的应用系统可以和应用系统的监控方法在同一个电子设备 (例 如服务器) 上运行, 也可以分别在不同的电子设备上运行。
51 02、 基于支持向量机算法, 根据所述历史用户行为数据进行模型训练以 建立行为预测模型。
以每种用户行为的历史用户行为数据作为样本数据, 可以建立一个机器学 习模型来预测该用户行为在下一时刻的预测值。 每种用户行为的历史用户行为 数据可以看成一个时间序列 OC = 1, 2,..., T},下一时刻对应的预测值可以将当前 时刻的用户行为数据输入至所述行为预测模型而输出。
具体的, 所述行为预测模型可以描述为:
Figure imgf000005_0001
布: 〜 NID(0, (jd) , 且是与前一时刻的 Xt k > 0)不相关的随机序列。
需要说明的是, 应用系统在正常工作时, 其所支持的保险业务中用户行为 数据的分布是有规律的。 由于保险业务中用户的使用行为会发生变化, 因而用 户行为数据的分布规律会发生缓慢改变。 因此行为预测模型不能是一成不变的, 需要根据用户行为数据的分布规律的动态变化而变化。 在实际应用中, 每隔一 段时间, 应该按照新提取的特征数据, 重新建立行为预测模型。 这样, 当前用 户行为数据输入至行为预测模型, 所输出的预测值能准确反映应用系统在下一 时刻的用户行为数据的分布规律。
51 03、 将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻 对应的预测值。
具体的, 在确定行为预测模型之后, 保险监控系统可以定时或实时输入当 前周期的用户行为数据至行为预测模型, 从而输出预测值。 所述预测值为基于 所述行为预测模型和当前用户行为数据预测得到数据。
例如, 将当前点击数据输入至点击预测模型, 从而输出下一周期的点击数 据的预测值。 又如, 将当前曝光数据输入至曝光预测模型, 从而输出下一周期 的曝光数据的预测值。
51 04、 根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异 常状况。
具体的, 下一时刻应与当前周期的时间长度相同。 若当前周期为 T, 下一时 刻可以为 T+1。下一时刻的用户行为数据是指从下一时刻的状态指标数据中提取 的用户行为数据。
在一个实施例中, 所述根据所述预测值与下一时刻的用户行为数据确定所 述应用系统的异常状况之前, 还包括:
从下一时刻的状态指标数据中提取下一时刻的用户行为数据。
在一个实施例中, 所述根据所述预测值与下一时刻的用户行为数据确定应 用系统的异常状况, 具体包括:
若所述用户行为数据与所述预测值的比值小于预设阀值, 确定所述应用系 统存在异常。
在一实施例中, 预设阀值的具体取值需要根据实际需要来确定。 下一时刻 的用户行为数据是指从下一时刻状态指标数据中提取的用户行为数据。
具体的, 当上述比值大于等于第一预设阀值时, 可以说明预测值与下一时 刻的用户行为数据比较相近, 用户能够正常使用保险业务, 从而可以确定应用 系统在下一时刻的状况与正常工作时的状况相近, 因此可以确定应用系统在下 一时刻处于正常状态。
当上述比值小于第一预设阀值时, 确定应用系统处于异常状态。 当比值小 于第一预设阀值时, 可以说明预测值与下一时刻的用户行为数据有很大不同, 从而可以确定应用系统在所述下一时刻的状况与正常工作时的状况不同, 用户 使用保险业务受到影响, 进而确定应用系统出现异常。 在确定应用系统出现异 常后, 应及时通知技术人员到现场查看并維修, 避免由于应用系统处于异常状 态而影响用户的使用, 从而保障用户的体验和使用。
例如, 第一预设阀值为 8%, 当在周六九点时预测十点时的网站点击数量为 50000 , 但到了十点时实际提取到的点击数量为 50 , 所述下一时刻用户行为数据 与所述预测值的比值为 0. 1 %, 小于第一预设阀值 8%, 因而确定应用系统处于异 常状态。 如果十点时提取到的点击数量的真实值为 55000时, 下一时刻的用户 行为数据与所述预测值的比值为 1 10%, 大于第一预设阀值 8%, 因而确定应用系 统处于正常状态。
上述实施例的监控方法, 通过基于支持向量机算法, 根据历史用户行为数 据进行模型训练, 得到行为预测模型, 用已经采集到的当前用户行为数据输入 至行为预测模型, 以输出下一时刻对应的预测值, 再通过比较所述预测值和下 一时刻的用户行为数据确定系统的异常状况, 从而通过监控用户行为及时地发 现应用系统的问题以便后续技术人员针对该异常状况及时对应用系统进行改进, 减少异常状况发生, 用户的体验效果好。
请参阅图 2 , 图 2是本申请的实施例二提供的应用系统的监控方法的步骤示 意流程图。 该应用系统的监控方法, 通过监控用户行为及时发现应用系统出现 的异常状况, 以便后续技术人员针对该异常状况及时对应用系统进行改进, 减 少异常状况发生, 用户的体验效果好。 该方法的执行主体可以为网络设备, 例 如服务器或网络优化设备。
如图 2所示, 该应用系统的监控方法, 具体包括:
5201、 实时采集应用系统的状态指标数据。
应用系统的监控方法运行于其上的电子设备(例如服务器)可以通过有线连 接方式或者无线连接方式周期性地采集系统的状态指标数据, 生成状态指标数 据序列。
其中, 状态指标数据例如, 搜索引擎响应用户点击数量, 保险业务在展示 媒介 (例如网页、 客户端页面) 上的曝光数量、 交易数量等等。
需要说明的是, 每个应用系统在每个周期都有对应的状态指标数据。 所述 状态指标数据包括当前状态指标数据和历史状态指标数据, 其中, 当前状态指 标数据是指在当前时刻采集的应用系统的状态指标数据。 历史状态指标数据是 指在当前时刻之前的时刻采集的应用系统的状态指标数据。 历史用户行为数据 是指从历史状态指标数据中按照采集时间由新到旧的顺序提取的用户行为数据。 当前用户行为数据是指从当前状态指标数据中提取的用户行为数据。
具体的, 以设定时间为一个周期, 即按照设定时间作为采集状态指标数据 的周期。 设定时间可根据需要设定, 例如 1分钟、 3分钟、 5分钟等。 例如, 假 设设定时间为 5分钟, 当前周期为 10 : 00至 1 0 : 05的时间段, 则当前状态指标 数据为在 10 : 00至 1 0 : 05的时间段内采集的系统的状态指标数据。
5202、 从所述状态指标数据中提取应用系统的特征数据, 所述特征数据包 括历史用户行为数据和当前用户行为数据。
其中, 每种用户行为在每个周期都有相应的用户行为数据。 具体的, 当前 用户行为数据是指应用系统在当前周期内所对应的用户行为数据。 历史用户行 为数据是指应用系统在当前周期之前的预设数量的周期所对应的用户行为数据 的集合。
5203、 基于支持向量机算法, 根据所述历史用户行为数据进行模型训练以 建立行为预测模型。
具体的, 每种用户行为的历史用户行为数据可以看成一个时间序列。 基于 支持向量机算法, 根据历史用户行为数据可以建立该种用户行为对应的行为预 测模型, 通过将当前用户行为数据输入至该行为预测模型, 能够预测下一时刻 对应的预测值。
5204、 将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻 对应的预测值。
在确定行为预测模型之后, 保险监控系统可以定时或实时输入当前用户行 为数据至行为预测模型, 从而输出下一时刻对应的预测值。 所述预测值为基于 所述行为预测模型和当前用户行为数据预测得到数据。
5205、 根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异 常状况。 其中, 下一时刻的用户行为数据是指从下一时刻的状态指标数据中提取的 用户行为数据。
上述实施例的监控方法, 通过实时采集应用系统的状态指标数据; 从所述 状态指标数据中提取应用系统的特征数据, 所述特征数据包括历史用户行为数 据和当前用户行为数据; 基于支持向量机算法, 根据历史用户行为数据进行模 型训练, 得到行为预测模型, 用已经采集到的当前用户行为数据输入至行为预 测模型, 以输出下一时刻对应的预测值, 再通过比较所述预测值和下一时刻的 用户行为数据确定系统的异常状况, 从而通过监控用户行为及时地发现应用系 统的问题以便后续技术人员针对该异常状况及时对应用系统进行改进, 减少异 常状况发生, 用户的体验效果好。
对于上述实施例步骤 S202, 从所述状态指标数据中提取应用系统的特征数 据, 本申请提供了一实现该步骤的实施例, 请参考图 3, 图 3为从所述状态指标 数据中提取应用系统的特征数据的子步骤的示意流程图, 具体的包括:
5301、 根据所述状态指标数据, 构建数据矩阵。
具体的, 将所述状态指标数据按照矩阵形式排列, 构建数据矩阵 W。
5302、 对所述数据矩阵进行标准化处理以得到标准矩阵。
Figure imgf000008_0001
S303、 计算所述标准矩阵对应的协方差矩阵以及所述协方差矩阵的特征值。 具体的, 所述计算所述标准矩阵对应的协方差矩阵以及所述协方差矩阵的 特征值, 具体包括:
计算所述标准矩阵对应的协方差;
计算所述协方差矩阵的特征值。
在一实施方式中, 所述计算所述标准矩阵对应的协方差矩阵, 具体包括: 基于协方差公式, 计算所述标准矩阵对应的协方差矩阵; 其中, 所述协方 差公式为:
c =-ir r T 具体的, 所述计算所述协方差矩阵的特征值, 具体为: 根据 = , 计算 所述协方差矩阵的特征值 ^。 通过上述方式计算特征值 ^, 也可以相应计算所述 协方差矩阵的特征向量。
具体的, 将所述特征值按降序排列, 得到特征值序列。 所述特征值序列中 各特征值所对应的各特征向量也按照降序排列, 得到特征向量序列。 选择特征 向量序列中不同范围内的一组特征向量即可实现特征向量序列的选择。 5304、 根据所述特征值, 计算所述特征值的贡献率。
具体的, 所述根据所述特征值, 所述计算所述特征值的贡献率, 具体包括: 基于贡献率公式, 根据所述特征值, 计算所述特征值的贡献率; 其中, 所 述贡献率公式为:
Figure imgf000009_0001
其中, g为所述贡献率, s为所述特征数据的维数; z为特征值的个数。
5305、 根据所述贡献率, 提取特征数据。
具体的, 所述根据所述贡献率, 提取特征数据, 具体包括:
根据所述贡献率, 确定主成分; 根据所述主成分对应的标准化处理后的样 本数据, 构建特征数据。
具体的, 所述根据所述贡献率, 确定主成分, 具体包括: 选取所述贡献率 大于或等于设定阀值的 S个特征值所对应的成分作为主成分。 根据 S个所述主 成分对应的标准化处理后的 S项样本数据, 构建特征数据。
以用户行为数据包括点击数量、 曝光数量、 交易数量为例, 假设设定阀值 为 0. 80, 经过计算, 点击数量对应的特征值为 0. 5, 曝光数量对应的特征值为
0. 4, 交易数量对应的特征值为 a 2, 则贡献率 = °-5 + 0-4 = 0.8182 , 此时 g
0.5 + 0.4 + 0.2
大于设定阀值 0. 80, 提取点击数量、 曝光数量作为特征数据。
需要说明的是, 本实施例中, 以点击数量、 曝光数量作为特征数据为例进 行说明提取特征数据的具体过程, 但在实际场合中, 特征数据也可以为交易数 量, 本申请对此不作限定。
请参阅图 4, 图 4是本申请的实施例三提供的应用系统的监控方法的步骤示 意流程图。 该应用系统的监控方法, 通过监控用户行为及时、 准确地发现应用 系统出现的异常状况, 以便后续技术人员针对该异常状况及时对应用系统进行 改进, 减少异常状况发生, 用户的体验效果好。 该方法的执行主体可以为网络 设备, 例如服务器或网络优化设备。
如图 4所示, 该应用系统的监控方法, 具体包括:
5401、 实时采集应用系统的状态指标数据。
其中, 状态指标数据例如, 搜索引擎响应用户点击数量, 保险业务在展示 媒介 (例如网页、 客户端页面) 上的曝光数量、 交易数量等等。
需要说明的是, 每个应用系统在每个周期都有对应的状态指标数据。 其中, 当前状态指标数据是指在当前周期采集的系统的状态指标数据。 历史状态指标 数据是指在当前周期之前采集的系统的状态指标数据。 历史用户行为数据是指 从历史状态指标数据中按照采集时间由新到旧的顺序提取的用户行为数据。 当 前用户行为数据是指从当前状态指标数据中提取的用户行为数据。
5402、 从所述状态指标数据中提取应用系统的特征数据, 所述特征数据包 括历史用户行为数据和当前用户行为数据。
其中, 每种用户行为在每个周期都有相应的用户行为数据。 具体的, 当前 用户行为数据是指应用系统在当前周期内所对应的用户行为数据。 历史用户行 为数据是指应用系统在当前周期之前的预设数量的周期所对应的用户行为数据 的集合。
5403、 基于支持向量机算法, 根据所述历史用户行为数据进行模型训练以 建立行为预测模型。
具体的, 每种用户行为的历史用户行为数据可以看成一个时间序列。 基于 支持向量机算法, 根据历史用户行为数据可以建立该种用户行为对应的行为预 测模型, 通过将当前周期的用户行为数据输入至该行为预测模型, 能够预测下 一时刻对应的预测值。
5404、 将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻 对应的预测值。
在确定行为预测模型之后, 保险监控系统可以定时或实时输入当前用户行 为数据至行为预测模型, 从而输出下一时刻对应的预测值。
5405、 根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异 常状况。
其中, 下一时刻的用户行为数据是指从下一时刻的状态指标数据中提取的 用户行为数据。
5406、 当确定所述应用系统处于异常状态时, 生成报警信息。
报警信息用于指示应用系统当前处于异常状态。
具体的, 报警信息可以为文字报警信息、 图片报警信息、 音频报警信息、 视频报警信息等, 还可以进行相应的灯光报警、 振动报警等。 文字报警信息、 图片报警信息、 音频报警信息、 视频报警信息等通过邮件、 短信或者微信的至 少一种消息通知媒介实现。
5407、 根据预设报警策略, 发送所述报警信息。
为了防止监控异常泛滥 (例如当某些保险业务依赖的服务器宕机的极端情 况下) , 报警系统压力过大, 所述当确定所述应用系统处于异常状态时, 生成 报警信息之后, 还包括:
根据预设报警策略, 发送所述报警信息。
在某些实施方式中, 所述预设报警策略可以包括以下的其中一种: 当确定所述应用系统处于异常状态的次数为一次时, 发送所述报警信息; 或,
’ 当在第一预设时间内确定所述应用系统处于异常状态的次数大于或等于第 二预设阀值时, 发送所述报警信息; 或,
当确定所述应用系统处于异常状态的次数等于第三预设阀值时, 发送所述 报警信息; 或,
°当 所’述应用系统处于异常状态的次数等于第四预设阀值且持续第二预 设时间时, 发送所述报警信息。
具体的, 为了进一步防止监控异常泛滥 (例如当某些保险业务依赖的服务 器宕机的极端情况下) , 报警系统压力过大, 致使短信、 邮件系统压力巨大, 带来雪崩效应的问题, 需要根据实际需要, 将监控异常选择不同的报警策略发 出报警信息。 比如“点击数量” 的监控异常, 可以定义为在 30s内发生 2次才 发短信, 也可以定义为 5mi n内最多报警 5次, 一天内最多报警 50次; 虽然报 警信息得到了合并, 但在数据存储上, 依然记录每条报警, 如在 6mi n内发生了 200次报警, 虽然只发了一条短信, 但后台仍然记录 200次报警记录。
其中, 第一预设时间、 第二预设时间、 第二预设阀值、 第三预设阀值、 第 四预设阀值可以根据实际需求进行设定。
上述实施例的监控方法, 通过实时采集应用系统的状态指标数据; 从所述 状态指标数据中提取应用系统的特征数据, 所述特征数据包括历史用户行为数 据和当前用户行为数据; 基于支持向量机算法, 根据历史用户行为数据进行模 型训练, 得到行为预测模型; 将所述当前用户行为数据输入至所述行为预测模 型以输出下一时刻对应的预测值; 根据所述预测值与下一时刻的用户行为数据 确定所述应用系统的异常状况; 当确定所述应用系统处于异常状态时, 生成报 警信息; 根据预设报警策略, 发送所述报警信息从而通过监控用户行为及时、 准确地发现应用系统出现的异常状况以便后续技术人员针对该异常状况及时对 应用系统进行改进, 减少异常状况发生, 用户的体验效果好。
可以理解的, 行为预测模型可以有多个, 包括点击预测模型、 曝光预测模 型等多个维度的用户行为的预测模型。 在对应用系统进行监控的过程中, 可以 根据实际需要选择当前所需的行为预测模型。 即, 在对保险业务系统进行监控 的过程中, 多个维度的用户行为的行为预测模型可以只选择其中一个行为预测 模型预测相应用户行为的预测值, 也可以选择多个行为预测模型预测多个相应 用户行为的预测值, 以从多个維度确定应用系统的异常状况。
示例性的, 为了提高监控的准确度, 可以选择根据点击预测模型和曝光预 测模型预测点击数量的预测值和曝光数量的预测值, 以从点击数量和曝光数量 两个维度确定应用系统的异常状况。 即, 根据点击预测模型预测点击数量的预 测值, 根据曝光预测模型预测曝光数量的预测值, 从而从点击数量和曝光数量 两个维度确定应用系统的异常状况, 提高应用系统异常的监控效果。
需要说明的是, 本申请提供的应用系统的监控方法, 除了应用在保险应用 系统的场景以外, 还可以应用到其它应用系统的场景之中, 例如游戏应用系统、 购物应用系统、 视频应用系统等应用场景, 在此不做限定。
请参阅图 5 , 图 5是本申请的实施例还提供一种应用系统的监控装置的示意 性框图, 该应用系统的监控装置用于执行前述任一项应用系统的监控方法。 其 中, 该应用系统的监控装置可以配置于服务器或终端中。
其中, 服务器可以为独立的服务器, 也可以为服务器集群。 该终端可以是 手机、 平板电脑、 笔记本电脑、 台式电脑、 个人数字助理和穿戴式设备等电子 设备。
如图 5所示, 应用系统的监控装置 500包括: 特征提取单元 501、 模型建立 单元 502、 输入输出单元 503、 异常确定单元 504。
特征提取单元 501 , 用于提取应用系统的特征数据, 所述特征数据包括历史 用户行为数据和当前用户行为数据。
模型建立单元 502 , 用于基于支持向量机算法, 根据所述历史用户行为数据 进行模型训练以建立行为预测模型。
输入输出单元 503 , 用于将所述当前用户行为数据输入至所述行为预测模型 以输出下一时刻对应的预测值。
异常确定单元 504, 用于根据所述预测值与下一时刻的用户行为数据确定所 述应用系统的异常状况。
在一实施例中, 如图 6所示, 所述应用系统的监控装置还包括数据采集单 元 505, 用于实时采集应用系统的状态指标数据。 在该实施例中, 特征提取单元 501具体用于从所述状态指标数据中提取应用系统的特征数据。
在一实施例中,如图 7所示,所述特征提取单元 501包括数据构建单元 501 1、 标准处理单元 5012、 第一计算单元 5013、 第二计算单元 5014和数据提取单元 5015。
其中, 数据构建单元 501 1, 用于根据所述状态指标数据, 构建数据矩阵。 标准处理单元 5012 , 用于对所述数据矩阵进行标准化处理以得到标准矩阵。 第一计算单元 5013, 用于计算所述标准矩阵对应的协方差矩阵以及所述协 方差矩阵的特征值。
第二计算单元 5014, 用于根据所述特征值, 计算所述特征值的贡献率。 数据提取单元 5015, 用于根据所述贡献率, 提取特征数据。
在一个实施例中, 标准处理单元 5012, 具体用于基于标准化公式, 对所述 数据矩阵进行标准化处理以得到标准矩阵, 其中, 所述标准化公式为:
Figure imgf000012_0001
其中, 2为所述特征值, g为所述贡献率, s为所述特征数据的維数; z为 特征值的个数, S < Z 0
模型建立单元 502 , 具体用于基于支持向量机算法, 根据所述历史用户行为 数据进行模型训练, 建立行为预测模型, 其中, 所述行为预测模型为:
xt =(p, X 'U ,-2+.. -+(PpX t-p+dt 0l dt l - Oqdt-q
Figure imgf000012_0002
在一实施例中, 如图 8所示, 所述应用系统的监控装置还包括报警生成单 元 506和报警发送单元 507。
其中, 报警生成单元 506, 用于当确定所述应用系统处于异常状态时, 生成 报警信息。
报警发送单元 507, 用于根据预设报警策略, 发送所述报警信息。
需要说明的是, 所属领域的技术人员可以清楚地了解到, 为了描述的方便 和简洁, 上述描述的应用系统的监控装置和各单元的具体工作过程, 可以参考 前述应用系统的监控方法实施例中的对应过程, 在此不再赘述。
上述的应用系统的监控装置可以实现为一种计算机程序的形式, 该计算机 程序可以在如图 9所示的计算机设备上运行。
请参阅图 9 , 图 9是本申请实施例提供的一种计算机设备的示意性框图。 该 计算机设备可以是服务器或终端。 参阅图 9, 该计算机设备包括通过系统总线连接的处理器、 存储器和网络接 口, 其中, 存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储彳罙作系统和计算机程序。 该计算机程序包括程序 指令, 该程序指令被执行时, 可使得处理器执行一种应用系统的监控方法。
处理器用于提供计算和控制能力, 支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境, 该计算机 程序被处理器执行时, 可使得处理器执行一种应用系统的监控方法。
该网络接口用于进行网络通信, 如发送分配的任务等。 本领域技术人员可 以理解, 图 9中示出的结构, 仅仅是与本申请方案相关的部分结构的框图, 并 不构成对本申请方案所应用于其上的计算机设备的限定, 具体的计算机设备可 以包括比图中所示更多或更少的部件, 或者组合某些部件, 或者具有不同的部 件布置。
应当理解的是, 处理器可以是中央处理单元 (Central Processing Unit, CPU) , 该处理器还可以是其他通用处理器、 数字信号处理器 (Digital Signal Processor , DSP)、 专用集成电路 (Appl icat ion Specif ic Integrated Circuit, ASIC)、 现成可编程门阵列 (FielchProgrammable Gate Array, FPGA) 或者 他可编程逻辑器件、 分立门或者晶体管逻辑器件、 分立硬件组件等。 其中, 通 用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中, 所述处理器用于运行存储在存储器中的计算机程序, 以实现如下步 骤:
提取应用系统的特征数据, 所述特征数据包括历史用户行为数据和当前用 户行为数据; 基于支持向量机算法, 根据所述历史用户行为数据进行模型训练 以建立行为预测模型; 将所述当前用户行为数据输入至所述行为预测模型以输 出下一时刻对应的预测值; 根据所述预测值与下一时刻的用户行为数据确定所 述应用系统的异常状况。
在一实施例中, 所述处理器在实现所述提取应用系统的特征数据之前, 用 于实现:
实时采集应用系统的状态指标数据。
在该实施例中, 所述处理器在实现所述提取应用系统的特征数据时, 用于 实现:
' 从所述状态指标数据中提取应用系统的特征数据。
在一实施例中, 所述处理器在实现所述从所述状态指标数据中提取应用系 统的特征数据时, 用于实现: 根据所述状态指标数据, 构建数据矩阵;
对所述数据矩阵进行标准化处理以得到标准矩阵;
计算所述标准矩阵对应的协方差矩 以及所述协方差矩阵的特征值; 根据所述特征值, 计算所述特征值的贡献率;
根据所述贡献率, 提取特征数据。
在一实施例中, 所述处理器在实现所述对所述数据矩阵进行标准化处理得 到标准矩阵时, 用于实现:
基于标准化公式, 对所述数据矩阵进行标准化处理以得到标准矩阵, 其中, 所述标准化公式为:
Figure imgf000013_0001
Yb = ]-^—Y (W a,b -:Wbf ;
Figure imgf000014_0001
表示所述数据 a-\
矩阵中第 a行第 b列的数据点; 为标准化后的所述状态指标数据。
在一实施例中, 所述处理器在实现所述根据所述特征值, 计算所述特征值 的贡献率时, 用于实现:
基于贡献率公式, 根据所述特征值, 计算所述特征值的贡献率; 其中, 所 述贡献率公式为:
Figure imgf000014_0002
其中, 2为所述特征值, g为所述贡献率, s为所述特征数据的維数; z为 特征值的个数, A' < Z 0
在一实施例中, 所述处理器在实现基于支持向量机算法, 根据所述历史用 户行为数据进行模型训练以建立行为预测模型时, 具体用于实现:
基于支持向量机算法, 根据所述历史用户行为数据进行模型训练以建立行
Figure imgf000014_0003
在一实施例中, 所述处理器在实现所述根据所述预测值与下一时刻的用户 行为数据确定所述应用系统的异常状况之后, 还用于实现:
当确定所述应用系统处于异常状态时, 生成报警信息;
根据预设报警策略, 发送所述报警信息。
本申请的实施例中还提供一种计算机可读存储介质, 所述计算机可读存储 介质存储有计算机程序, 所述计算机程序中包括程序指令, 所述处理器执行所 述程序指令, 实现本申请实施例提供的任一项应用系统的监控方法。
其中, 所述计算机可读存储介质可以是前述实施例所述的计算机设备的内 部存储单元, 例如所述计算机设备的硬盘或内存。 所述计算机可读存储介质也 可以是所述计算机设备的外部存储设备, 例如所述计算机设备上配备的插接式 硬盘, 智能存储卡 (Smart Med i a Card , SMC) , 安全数字 (Secure D i g i ta l , SD) 卡, 闪存卡 (F l ash Card)等。
以上所述, 仅为本申请的具体实施方式, 但本申请的保护范围并不局限于 此, 任何熟悉本技术领域的技术人员在本申请揭露的技术范围内, 可轻易想到 各种等效的修改或替换, 这些修改或替换都应涵盖在本申请的保护范围之内。 因此, 本申请的保护范围应以权利要求的保护范围为准。

Claims

权 利 要 求 书
1 . 一种应用系统的监控方法, 包括:
提取应用系统的特征数据, 所述特征数据包括历史用户行为数据和当前用 户行为数据;
基于支持向量机算法, 根据所述历史用户行为数据进行模型训练以建立行 为预测模型;
将所述当前用户行为数据输入至所述行为预测模型以输出下一时刻对应的 预测值, 所述行为预测模型为:
Figure imgf000015_0001
根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。
2. 根据权利要求 1所述的应用系统的监控方法, 其中, 所述提取应用系统 的特征数据之前,还包括:
实时采集应用系统的状态指标数据;
所述提取应用系统的特征数据, 包括:
从所述状态指标数据中提取应用系统的特征数据。
3. 根据权利要求 2所述的应用系统的监控方法, 其中, 所述从所述状态指 标数据中提取应用系统的特征数据, 包括:
根据所述状态指标数据, 构建数据矩阵;
对所述数据矩阵进行标准化处理以得到标准矩阵;
计算所述标准矩阵对应的协方差矩 以及所述协方差矩阵的特征值; 根据所述特征值, 计算所述特征值的贡献率;
根据所述贡献率, 提取特征数据。
4. 根据权利要求 3所述的应用系统的监控方法, 其中, 所述对所述数据矩 阵进行标准化处理得到标准矩阵, 包括: 基于标准化公式, 对所述数据矩阵进 行标准化处理以得到标准矩阵, 其中, 所述标准化公式为:
Figure imgf000015_0002
值, 计算所述特征值的贡献率, 包括:
基于贡献率公式, 根据所述特征值, 计算所述特征值的贡献率; 其中, 所 述贡献率公式为: 其中, 2为所述特征值, g为所述贡献率, S为所述特征数据的維数; Z为 特征值的个数, ^ < Z 0
6. 根据权利要求 1所述的应用系统的监控方法, 其中, 所述根据所述预测 值与下一时刻的用户行为数据确定所述应用系统的异常状况之前, 还包括: 从下一时刻的状态指标数据中提取下一时刻的用户行为数据。
7. 根据权利要求 1所述的应用系统的监控方法, 其中, 所述根据所述预测 值与下一时刻的用户行为数据确定所述应用系统的异常状况之后, 还包括: 当确定所述应用系统处于异常状态时, 生成报警信息;
根据预设报警策略, 发送所述报警信息。
8. 一种应用系统的监控装置, 其中, 包括:
特征提取单元, 用于提取应用系统的特征数据, 所述特征数据包括历史用 户行为数据和当前用户行为数据;
模型建立单元, 用于基于支持向量机算法, 根据所述历史用户行为数据进
Figure imgf000016_0001
输入输出单元, 用于将所述当前用户行为数据输入至所述行为预测模型以 输出下一时刻对应的预测值;
异常确定单元, 用于根据所述预测值与下一时刻的用户行为数据确定所述 应用系统的异常状况。
9. 一种计算机设备, 其中, 所述计算机设备包括存储器和处理器; 所述存储器用于存储计算机程序;
所述处理器, 用于执行所述计算机程序并在执行所述计算机程序时实现如 下步骤:
提取应用系统的特征数据, 所述特征数据包括历史用户行为数据和当前用 户行为数据;
基于支持向量机算法, 根据所述历史用户行为数据进行模型训练以建立行
Figure imgf000016_0002
根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。
10. 根据权利要求 9所述的计算机设备, 其中, 所述提取应用系统的特征 数据之前,还包括:
实时采集应用系统的状态指标数据;
所述提取应用系统的特征数据, 包括:
从所述状态指标数据中提取应用系统的特征数据。
1 1 . 根据权利要求 1 0所述的计算机设备, 其中, 所述从所述状态指标数据 中提取应用系统的特征数据, 包括:
根据所述状态指标数据, 构建数据矩阵;
对所述数据矩阵进行标准化处理以得到标准矩阵;
计算所述标准矩阵对应的协方差矩 以及所述协方差矩阵的特征值; 根据所述特征值, 计算所述特征值的贡献率;
根据所述贡献率, 提取特征数据。
12. 根据权利要求 1 1所述的计算机设备, 其中, 所述对所述数据矩阵进行 标准化处理得到标准矩阵, 包括: 基于标准化公式, 对所述数据矩阵进行标准
Figure imgf000017_0001
13. 根据权利要求 1 1所述的计算机设备, 其中, 所述根据所述特征值, 计 算所述特征值的贡献率, 包括:
基于贡献率公式, 根据所述特征值, 计算所述特征值的贡献率; 其中, 所 述贡献率公式为:
IX
S = IT—
IX
/ =1
其中, 2为所述特征值, g为所述贡献率, S为所述特征数据的維数; Z为 特征值的个数, A' < Z 0
14. 根据权利要求 9所述的计算机设备, 其中, 所述根据所述预测值与下 一时刻的用户行为数据确定所述应用系统的异常状况之后, 还包括:
当确定所述应用系统处于异常状态时, 生成报警信息;
根据预设报警策略, 发送所述报警信息。
15. 一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程 序, 所述计算机程序被处理器执行时使所述处理器实现如下步騍:
提取应用系统的特征数据, 所述特征数据包括历史用户行为数据和当前用 户行为数据;
基于支持向量机算法, 根据所述历史用户行为数据进行模型训练以建立行 为预测模型, 所述行为预测模型为:
H ' X 'U 2+.. -+(PpX t-p+dt 0 d - 6 qdt-q
Figure imgf000018_0001
根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况。
16. 根据权利要求 15所述的计算机可读存储介质, 其中, 所述提取应用系 统的特征数据之前,还包括:
实时采集应用系统的状态指标数据;
所述提取应用系统的特征数据, 包括:
从所述状态指标数据中提取应用系统的特征数据。
17. 根据权利要求 16所述的计算机可读存储介质, 其中, 所述从所述状态 指标数据中提取应用系统的特征数据, 包括:
根据所述状态指标数据, 构建数据矩阵;
对所述数据矩阵进行标准化处理以得到标准矩阵;
计算所述标准矩阵对应的协方差矩 以及所述协方差矩阵的特征值; 根据所述特征值, 计算所述特征值的贡献率;
根据所述贡献率, 提取特征数据。
18. 根据权利要求 17所述的计算机可读存储介质, 其中, 所述对所述数据 矩阵进行标准化处理得到标准矩阵, 包括: 基于标准化公式, 对所述数据矩阵
Figure imgf000018_0002
19. 根据权利要求 17所述的计算机可读存储介质, 其中, 所述根据所述特 征值, 计算所述特征值的贡献率, 包括:
基于贡献率公式, 根据所述特征值, 计算所述特征值的贡献率; 其中, 所 述贡献率公式为: 其中, 2为所述特征值, g为所述贡献率, S为所述特征数据的維数; Z为 特征值的个数, ^ < Z 0
20. 根据权利要求 15-19任一项所述的计算机可读存储介质, 其中, 所述 根据所述预测值与下一时刻的用户行为数据确定所述应用系统的异常状况之后, 还包括:
当确定所述应用系统处于异常状态时, 生成报警信息;
根据预设报警策略, 发送所述报警信息。
PCT/CN2019/118226 2019-02-27 2019-11-13 应用系统的监控方法、装置、设备及存储介质 WO2020173136A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910145580.6 2019-02-27
CN201910145580.6A CN109992473B (zh) 2019-02-27 2019-02-27 应用系统的监控方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
WO2020173136A1 true WO2020173136A1 (zh) 2020-09-03

Family

ID=67130253

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2019/118226 WO2020173136A1 (zh) 2019-02-27 2019-11-13 应用系统的监控方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN109992473B (zh)
WO (1) WO2020173136A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115840356A (zh) * 2022-10-18 2023-03-24 中健国康科技(江苏)有限公司 一种微感智能护理床控制方法及装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109992473B (zh) * 2019-02-27 2022-07-15 平安科技(深圳)有限公司 应用系统的监控方法、装置、设备及存储介质
CN111026626A (zh) * 2019-11-29 2020-04-17 中国建设银行股份有限公司 Cpu消耗量预估、预估模型训练方法及装置
CN111538608A (zh) * 2020-04-30 2020-08-14 深圳前海微众银行股份有限公司 预防终端设备宕机的方法、终端设备及存储介质
CN111708682B (zh) * 2020-06-17 2021-10-26 腾讯科技(深圳)有限公司 数据预测方法、装置、设备及存储介质
CN112116397A (zh) * 2020-09-25 2020-12-22 贝壳技术有限公司 用户行为特征实时处理方法、装置、存储介质及电子设备
CN114090411B (zh) * 2022-01-20 2022-09-16 山东中创软件商用中间件股份有限公司 一种应用数据分析方法、装置、设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126391A (zh) * 2016-06-28 2016-11-16 北京百度网讯科技有限公司 系统监控方法和装置
CN106534212A (zh) * 2016-12-29 2017-03-22 杭州世平信息科技有限公司 基于用户行为和数据状态的自适应安全防护方法及系统
US20180075356A1 (en) * 2016-09-09 2018-03-15 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for monitoring system
CN107864405A (zh) * 2017-11-14 2018-03-30 国家新闻出版广电总局广播科学研究院 一种收视行为类型的预测方法、装置及计算机可读介质
CN109345013A (zh) * 2018-09-25 2019-02-15 广西电网有限责任公司电力科学研究院 一种配电用户用电行为预测方法
CN109992473A (zh) * 2019-02-27 2019-07-09 平安科技(深圳)有限公司 应用系统的监控方法、装置、设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324034B (zh) * 2011-05-25 2012-08-15 北京理工大学 基于最小二乘支持向量机在线预测的传感器故障诊断方法
CN108089962A (zh) * 2017-11-13 2018-05-29 北京奇艺世纪科技有限公司 一种异常检测方法、装置及电子设备
CN108197737A (zh) * 2017-12-29 2018-06-22 山大地纬软件股份有限公司 一种建立医保住院费用预测模型的方法及系统
CN108595301B (zh) * 2018-03-26 2021-03-26 中国科学院计算技术研究所 一种基于机器学习的服务器能耗预测方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126391A (zh) * 2016-06-28 2016-11-16 北京百度网讯科技有限公司 系统监控方法和装置
US20180075356A1 (en) * 2016-09-09 2018-03-15 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for monitoring system
CN106534212A (zh) * 2016-12-29 2017-03-22 杭州世平信息科技有限公司 基于用户行为和数据状态的自适应安全防护方法及系统
CN107864405A (zh) * 2017-11-14 2018-03-30 国家新闻出版广电总局广播科学研究院 一种收视行为类型的预测方法、装置及计算机可读介质
CN109345013A (zh) * 2018-09-25 2019-02-15 广西电网有限责任公司电力科学研究院 一种配电用户用电行为预测方法
CN109992473A (zh) * 2019-02-27 2019-07-09 平安科技(深圳)有限公司 应用系统的监控方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115840356A (zh) * 2022-10-18 2023-03-24 中健国康科技(江苏)有限公司 一种微感智能护理床控制方法及装置
CN115840356B (zh) * 2022-10-18 2023-12-22 中健国康科技(江苏)有限公司 一种微感智能护理床控制方法及装置

Also Published As

Publication number Publication date
CN109992473B (zh) 2022-07-15
CN109992473A (zh) 2019-07-09

Similar Documents

Publication Publication Date Title
WO2020173136A1 (zh) 应用系统的监控方法、装置、设备及存储介质
US11416456B2 (en) Method, apparatus, and computer program product for data quality analysis
US10210036B2 (en) Time series metric data modeling and prediction
US9384114B2 (en) Group server performance correction via actions to server subset
JP6526907B2 (ja) 分散型記憶システムの性能監視
US10896073B1 (en) Actionability metric generation for events
US10108520B2 (en) Systems and methods for service demand based performance prediction with varying workloads
US20180365571A1 (en) Dynamic Converging Times for Real-Time Data Monitoring
US11693842B2 (en) Generating compact data structures for monitoring data processing performance across high scale network infrastructures
US11438239B2 (en) Tail-based span data sampling
WO2021189845A1 (zh) 时间序列异常点的检测方法、装置、设备及可读存储介质
JP7098735B2 (ja) 大規模データ分析の最適化
CN111626498A (zh) 设备运行状态预测方法、装置、设备及存储介质
CN108390770B (zh) 一种信息生成方法、装置及服务器
US10180894B2 (en) Identifying a stack frame responsible for resource usage
JP4934660B2 (ja) 通信帯域算出方法、装置、およびトラヒック管理方法
CN114090407A (zh) 基于线性回归模型的接口性能预警方法及其相关设备
JP4823258B2 (ja) 通信帯域算出方法、装置、およびトラヒック管理方法
CN115292339B (zh) 数据库更新方法、装置、电子设备和存储介质
CN118363811A (zh) 系统运行状态监测方法、装置、计算机设备及存储介质
US20240112053A1 (en) Determination of an outlier score using extreme value theory (evt)
CN111831677B (zh) 一种数据处理方法及装置
CN114844810B (zh) 心跳数据处理方法、装置、设备及介质
CN111400126B (zh) 网络服务异常数据检测方法、装置、设备和介质
CN111078718B (zh) 频率控制方法、装置、设备以及计算机存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19917017

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19917017

Country of ref document: EP

Kind code of ref document: A1