CN115378928B - 基于云服务的监控方法及系统 - Google Patents

基于云服务的监控方法及系统 Download PDF

Info

Publication number
CN115378928B
CN115378928B CN202211314594.4A CN202211314594A CN115378928B CN 115378928 B CN115378928 B CN 115378928B CN 202211314594 A CN202211314594 A CN 202211314594A CN 115378928 B CN115378928 B CN 115378928B
Authority
CN
China
Prior art keywords
monitoring
event
abnormal
result
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211314594.4A
Other languages
English (en)
Other versions
CN115378928A (zh
Inventor
王捷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changsha Developer Technology Co ltd
Beijing Innovation Lezhi Network Technology Co ltd
Original Assignee
Changsha Developer Technology Co ltd
Beijing Innovation Lezhi Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changsha Developer Technology Co ltd, Beijing Innovation Lezhi Network Technology Co ltd filed Critical Changsha Developer Technology Co ltd
Priority to CN202211314594.4A priority Critical patent/CN115378928B/zh
Publication of CN115378928A publication Critical patent/CN115378928A/zh
Application granted granted Critical
Publication of CN115378928B publication Critical patent/CN115378928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提出一种基于云服务的监控方法及系统,其方法包括:捕捉云服务平台的发布任务,并基于初始监控策略对发布任务的任务服务过程进行监控;根据监控结果,确定任务服务过程中的服务事件;确定服务事件中的异常事件,并对服务事件进行事件分类及分析,同时,对每个异常事件进行单独分析;根据事件分类及分析结果对单独分析结果的关联关系,获取每个异常事件的异常因素,并按照异常因素对初始监控策略进行策略调整;按照调整后的监控策略重新对任务服务过程进行监控。通过按照初始监控策略对服务过程进行监控,并对存在的异常事件进行分析,来提取异常因素,对策略进行调整,有效的保证对任务监控的精准性。

Description

基于云服务的监控方法及系统
技术领域
本发明涉及一种基于云服务的监控方法及系统,属于云服务监控技术领域。
背景技术
随着网络技术的发展,云服务监控可以为用户提供监控服务,可以通过监控实时查看云服务器、云磁盘、数据库等资源的性能视图及告警记录,还可对重要资源自定义配置及告警信息。
云服务监控可以对不同的执行任务进行监控,其是会基于事先配置好的监控参数所构建的监控策略,来对执行任务进行监测,但是在监控过程中,由于执行任务会受到一些异常因素的干扰,导致按照原本的监控策略进行监控会存在监控不精准的情况。
因此,本发明提取一种基于云服务的监控方法及系统。
发明内容
针对上述现有技术的不足,本发明的目的在于提供一种基于云服务的监控方法及系统,通过按照初始监控策略对服务过程进行监控,并对存在的异常事件进行分析,来提取异常因素,对策略进行调整,有效的保证对任务监控的精准性。
根据本发明的实施方案,提供第一个方案为:
一种基于云服务的监控方法,包括:
步骤1:捕捉云服务平台的发布任务,并基于初始监控策略对发布任务的任务服务过程进行监控;
步骤2:根据监控结果,确定任务服务过程中的服务事件;
步骤3:确定所述服务事件中的异常事件,并对所述服务事件进行事件分类及分析,同时,对每个异常事件进行单独分析;
步骤4:根据事件分类及分析结果对单独分析结果的关联关系,获取每个异常事件的异常因素,并按照所述异常因素对初始监控策略进行策略调整;
步骤5:按照调整后的监控策略重新对任务服务过程进行监控。
进一步地,捕捉云服务平台的发布任务,并基于初始监控策略对发布任务的任务服务过程进行监控,包括:
捕捉所述云服务平台的发布任务,并对所述发布任务进行任务解析,得到所述发布任务的任务属性以及监控对象列表;
根据所述任务属性,确定所述监控对象列表中每个监控对象的需要监控内容;
从内容-权重-指标数据库中,调取与所述需要监控内容匹配的内容权重以及监控指标;
根据所述内容权重,向不同的监控指标赋予监控权重,并基于策略输出模型,获取与所有监控指标匹配的初始监控策略。
进一步地,根据所述内容权重,向不同的监控指标赋予监控权重,包括:
获取所述需要监控内容中每个监控指标的指标监控类型;
确定同个需要监控内容中每个监控指标的出现次数,并向对应监控指标设置监控权重;
其中,表示对应监控指标的监控权重;表示对应监控指标基于所述需要监控内容的当下频繁出现值;2表示对应监控指标的出现次数;m1表示对应需要监控内容中所有监控指标的总出现次数;m3表示对应的内容权重;表示基于所述需要监控内容的历史最频繁出现值。
进一步地,根据监控结果,确定任务服务过程中的服务事件,包括:
根据监控结果,确定突变时间点;
提取同个突变时间点的一侧的第一结果特征以及另一侧的第二结果特征,并判断所述第一结果特征与第二结果特征是否一致;
若一致,则在所述突变时间点进行第一标定;
若不一致,在所述突变时间点进行第二标定;
根据第一标定结果以及第二标定结果,对监控结果进行划分,得到若干个子结果,并基于结果-事件转换机制,得到对应子结果的服务事件。
进一步地,确定所述服务事件中的异常事件,并对所述服务事件进行事件分类及分析,同时,对每个异常事件进行单独分析,包括:
基于事件标准执行机制,对每个服务事件进行标准分析,确定存在的异常事件;
按照事件分类及分析模型,对所有服务事件进行分类及分析,同时,按照事件异常分析模型,对每个异常事件进行单独分析。
进一步地,根据事件分类及分析结果对单独分析结果的关联关系,获取每个异常事件的异常因素,并按照所述异常因素对初始监控策略进行策略调整,包括:
确定事件分类及分析结果中正常事件的第一分析结果以及异常事件的第二分析结果;
基于每个异常事件的第二分析结果与单独分析结果进行相似比较,获取相似值;
对相似值大于或等于预设值a1的异常事件进行第一提取,对相似值小于预设值a1的异常事件进行第二提取;
按照第一提取结果,对每个第一事件的第二分析结果进行异常因素的获取;
按照第一提取结果,确定每个第二事件的单独分析结果与对应所有正常事件的第一分析结果的第一衔接关系、以及确定每个第二事件的第二分析结果与对应所有正常事件的第一分析结果的第二衔接关系;
确定第一衔接关系与第二衔接关系的衔接匹配度;
当所述衔接匹配度大于预设匹配度时,获取同个异常事件对应的第二分析结果以及单独分析结果的交集结果,并进行异常因素的获取;
否则,获取同个异常事件对应的第二分析结果以及单独分析结果的并集结果,并进行异常因素的获取;
基于所获取的每个异常事件的异常因素,对初始监控策略进行策略调整。
进一步地,按照调整后的监控策略重新对任务服务过程进行监控之后,还包括:
获取基于调整后的监控策略的新监控结果,并对所述新监控结果所确定的新服务事件进行分类分析;
根据分类分析结果,确定每个新分类事件的分析集合,且所述分析集合包括:若干分析指标以及与每个分析指标一致的分析值;
获取所述分析集合中凸显结果,并从预设数据库中确定与所述凸显结果相关的历史影响,同时,还预测与所述凸显结果相关的预测影响;
根据所述历史影响与预测影响的影响差,从差-因子数据库中,调取对应的修正因子;
确定第二新分类事件对第一新分类事件的分类影响指标;
基于分类影响指标以及修正因子,确定对应新分类事件的被影响值Y1;
其中,表示对应新分类事件中所有凸显结果对应的修正因子;表示对应新分类事件中对应修正因子的绝对值和;表示第i个分类影响指标对相应新分类事件的第一影响值;表示第i个分类影响指标对相应新分类事件的影响权重;n1表示分类影响指标的总个数;
基于所有新分类事件的被影响值Y1,得到执行合格值Y2;
其中,n2表示新分类事件的个数;表示第j个新分类事件的被影响值;表示第j个新分类事件的事件权重;
将所述执行合格值Y2与对应的报警表格进行匹配,根据匹配结果获取相应的报警指令执行相应的报警操作。
根据本发明的实施方案,提供第二个方案为:
一种基于云服务的监控系统,包括:
过程监控模块,用于捕捉云服务平台的发布任务,并基于初始监控策略对发布任务的任务服务过程进行监控;
事件确定模块,用于根据监控结果,确定任务服务过程中的服务事件;
事件分析模块,用于确定所述服务事件中的异常事件,并对所述服务事件进行事件分类及分析,同时,对每个异常事件进行单独分析;
策略调整模块,用于根据事件分类及分析结果对单独分析结果的关联关系,获取每个异常事件的异常因素,并按照所述异常因素对初始监控策略进行策略调整;
重新监控模块,用于按照调整后的监控策略重新对任务服务过程进行监控。
进一步地,所述过程监控模块,包括:
捕捉单元,用于捕捉所述云服务平台的发布任务,并对所述发布任务进行任务解析,得到所述发布任务的任务属性以及监控对象列表;
内容确定单元,用于根据所述任务属性,确定所述监控对象列表中每个监控对象的需要监控内容;
调取单元,用于从内容-权重-指标数据库中,调取与所述需要监控内容匹配的内容权重以及监控指标;
策略获取单元,用于根据所述内容权重,向不同的监控指标赋予监控权重,并基于策略输出模型,获取与所有监控指标匹配的初始监控策略。
进一步地,所述策略获取单元,包括:
类型获取块,用于获取所述需要监控内容中每个监控指标的指标监控类型;
权重计算块,用于确定同个需要监控内容中每个监控指标的出现次数,并向对应监控指标设置监控权重;
其中,表示对应监控指标的监控权重;表示对应监控指标基于所述需要监控内容的当下频繁出现值;2表示对应监控指标的出现次数;m1表示对应需要监控内容中所有监控指标的总出现次数;m3表示对应的内容权重;表示基于所述需要监控内容的历史最频繁出现值。
与现有技术相比,本申请的有益效果如下:
首先,按照初始监控策略对服务过程进行监控,并对存在的异常事件进行分析,来提取异常因素,然后根据异常因素对策略进行调整,有效的保证对任务监控的精准性。
附图说明
图1为本发明一种基于云服务的监控方法的流程图;
图2为本发明一种基于云服务的监控系统的结构图。
具体实施方式
为了使本领域的技术人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,当元件被称为“固定于”或“设置于”另一个部件上,它可以直接在另一个部件上或者间接设置在另一个部件上;当一个部件被称为是“连接于”另一个部件,它可以是直接连接到另一个部件或间接连接至另一个部件上。
需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或部件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”、“若干个”的含义是两个或两个以上,除非另有明确具体的限定。
须知,本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本申请可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本申请所能产生的功效及所能达成的目的下,均应仍落在本申请所揭示的技术内容得能涵盖的范围内。
根据本发明的实施方案,提供第一个方案为:
实施例1:
一种基于云服务的监控方法,如图1所示,包括:
步骤1:捕捉云服务平台的发布任务,并基于初始监控策略对发布任务的任务服务过程进行监控;
步骤2:根据监控结果,确定任务服务过程中的服务事件;
步骤3:确定所述服务事件中的异常事件,并对所述服务事件进行事件分类及分析,同时,对每个异常事件进行单独分析;
步骤4:根据事件分类及分析结果对单独分析结果的关联关系,获取每个异常事件的异常因素,并按照所述异常因素对初始监控策略进行策略调整;
步骤5:按照调整后的监控策略重新对任务服务过程进行监控。
需要说明的是,异常因素指的是异常事件中的异常参数等,进而实现对初始监控策略的调整。
需要说明的是,发布任务与该服务平台可以执行的任务有关,比如,对资源调度的监控任务,对数据迁移的监控任务等,且初始监控策略主要与发布任务有关,且不同的发布任务对应的初始监控策略是不一样的,比如,资源调度任务是对资源方以及资源调度过程的一个监控,数据迁移任务是对数据转移过程的一个监控,且对应的初始监控策略都是预先设置好的。
需要说明的是,在进行监控的过程中,会获取得到每个监控时间点的监控信息,进而可以得到相应的监控结果,且在确定服务事件的过程中,会对不同监控时间点左右两侧的信息进行一致分析,进而实现对监控结果的划分,每个划分结果都对应一个服务事件,且服务事件也就是按照策略进行监控过程中发生的监控事件,比如,对资源调取的监控任务,此时,资源调取的初始调取位置、资源传输位置等,不同位置都可以存在对应的服务事件,比如,是寻找初始调取位置事件、初始位置调取事件、资源传输事件等,按照顺序执行该任务且对该任务进行任务有序划分。
需要说明的是,异常事件指的是服务事件中存在的异常,比如资源传输过程中出现了丢失的情况,正常情况下是可以监控出来的,但是此刻下并未未监控出来,此时,就视为服务事件为异常事件。
需要说明的是,事件分类及分析指的是对全部服务事件先按照类型分类之后,再对每类中的每个事件进行分析,且会结合其他事件参与分析;单独分析指的是对异常事件进行单拎出来的分析,并不结合其他事件参与分析。
需要说明的是,关联关系指的是事件分类及分析结果与单独分析结果之间的关联,主要是针对异常事件的关联,也就是确定异常事件对应结果的一致性。
上述技术方案的有益效果是:通过按照初始监控策略对服务过程进行监控,并对存在的异常事件进行分析,来提取异常因素,对策略进行调整,有效的保证对任务监控的精准性。
实施例2:
基于实施例1的基础上,捕捉云服务平台的发布任务,并基于初始监控策略对发布任务的任务服务过程进行监控,包括:
捕捉所述云服务平台的发布任务,并对所述发布任务进行任务解析,得到所述发布任务的任务属性以及监控对象列表;
根据所述任务属性,确定所述监控对象列表中每个监控对象的需要监控内容;
从内容-权重-指标数据库中,调取与所述需要监控内容匹配的内容权重以及监控指标;
根据所述内容权重,向不同的监控指标赋予监控权重,并基于策略输出模型,获取与所有监控指标匹配的初始监控策略。
该实施例中,任务解析一般是基于解析模型进行解析得到的,且解析模型是基于不同的发布任务以及发布任务对应的任务属性以及监控对象为样本训练得到的。
该实施例中,需要监控内容指的是监控项目,也可理解为指令。
该实施例中,内容-权重-指标数据库中包括不同的需要监控内容与需要监控内容一致的内容权重以及指标在内,因此,可以获取得到内容权重以及监控指标。
该实施例中,策略输出模型是基于不同组合的监控权重、监控指标组合情况以及对应的策略为样本训练得到的,因此,可以获取得到初始监控策略。
上述技术方案的有益效果是:通过对任务解析,确定属性与内容,进而通过数据库调取权重和指标,从模型输出,获取得到监控策略,为后续进行任务监控提供精准性基础。
实施例3:
基于实施例2的基础上,根据所述内容权重,向不同的监控指标赋予监控权重,包括:
获取所述需要监控内容中每个监控指标的指标监控类型;
确定同个需要监控内容中每个监控指标的出现次数,并向对应监控指标设置监控权重;
其中,表示对应监控指标的监控权重;表示对应监控指标基于所述需要监控内容的当下频繁出现值;2表示对应监控指标的出现次数;m1表示对应需要监控内容中所有监控指标的总出现次数;m3表示对应的内容权重;表示基于所述需要监控内容的历史最频繁出现值。
上述技术方案的有益效果是:基于内容权重,并按照相应指标的出现相关情况,有效的向对应指标设置监控权重,为后续任务监控提供精准性基础。
实施例4:
基于实施例1的基础上,根据监控结果,确定任务服务过程中的服务事件,包括:
根据监控结果,确定预设事件更改时间点;
提取同个预设事件更改时间点的一侧的第一结果特征以及另一侧的第二结果特征,并判断所述第一结果特征与第二结果特征是否一致;
若一致,则在所述预设事件更改时间点进行第一标定;
若不一致,基于所述预设事件更改时间点向两侧延伸来获取每个延伸点两侧的特征一致结果,并寻找到关键点进行第二标定;
根据第一标定结果以及第二标定结果,对监控结果进行划分,得到若干个子结果,并基于结果-事件转换机制,得到对应子结果的服务事件。
需要说明的是,预设事件更改时间点是按照相关的任务服务对应的策略来初步确定的,但是,由于在监控的过程中会出现延迟、错误等的情况,导致预设事件更改时间点可能会发生变化,因此,需要向两侧延伸,进而得到若干子结果。
需要说明的是,结果-事件转换机制是为了将不同的监控结果转换为服务事件,来便于对异常事件进行获取。
上述技术方案的有益效果是:通过对突变时间点左右两侧的特征进行一致分析,来对结果进行划分,得到若干子结果,最后得到服务事件,方便为后续确定异常事件以及对策略的更改提供有效基础。
实施例5:
基于实施例1的基础上,确定所述服务事件中的异常事件,并对所述服务事件进行事件分类及分析,同时,对每个异常事件进行单独分析,包括:
基于事件标准执行机制,对每个服务事件进行标准分析,确定存在的异常事件;
按照事件分类及分析模型,对所有服务事件进行分类及分析,同时,按照事件异常分析模型,对每个异常事件进行单独分析。
需要说明的是,事件标准执行机制是预先设置好的,也就是每个服务事件的标准执行情况,当实际执行情况与对应标准执行情况出现差异时,就判定对应事件为异常事件。
需要说明的是,事件分类及分析模型是预先训练好的,且是基于不同分类后的事件以及对不同分类组合事件的分析结果为样本训练得到的,事件异常分析模型是预先训练好的,且是基于不同事件以及事件出现各种不同异常为样本训练得到的。
上述技术方案的有益效果是:通过对服务事件继续宁标准分析以及按照不同的模型对事件进行不同的分析,为后续对策略的调整提供有效基础。
实施例6:
基于实施例1的基础上,根据事件分类及分析结果对单独分析结果的关联关系,获取每个异常事件的异常因素,并按照所述异常因素对初始监控策略进行策略调整,包括:
确定事件分类及分析结果中正常事件的第一分析结果以及异常事件的第二分析结果;
基于每个异常事件的第二分析结果与单独分析结果进行相似比较,获取相似值;
对相似值大于或等于预设值a1的异常事件进行第一提取,对相似值小于预设值a1的异常事件进行第二提取;
按照第一提取结果,对每个第一事件的第二分析结果进行异常因素的获取;
按照第一提取结果,确定每个第二事件的单独分析结果与对应所有正常事件的第一分析结果的第一衔接关系、以及确定每个第二事件的第二分析结果与对应所有正常事件的第一分析结果的第二衔接关系;
确定第一衔接关系与第二衔接关系的衔接匹配度;
当所述衔接匹配度大于预设匹配度时,获取同个异常事件对应的第二分析结果以及单独分析结果的交集结果,并进行异常因素的获取;
否则,获取同个异常事件对应的第二分析结果以及单独分析结果的并集结果,并进行异常因素的获取;
基于所获取的每个异常事件的异常因素,对初始监控策略进行策略调整。
需要说明的是,事件分类及分析结果为:事件分类结果01存在正常事件1、2和3对应的第一分析结果,事件分类结果01中存在异常事件4对应的第二分析结果;
需要说明的是,通过将全部事件进行分析比较以及单个事件分析比较,主要是为了确定两种情况分析下,同个异常事件是否相似。
需要说明的是,a1是预设值,一般取值为0.8,第一事件是指的满足相似值大于或等于预设值的异常事件,第二事件指的是不满足相似值大于或等于预设值的异常事件。
需要说明的是,衔接关系主要是将对应事件归到同类事件中进行分析,来确定的衔接情况,也就是该同类事件对该事件的联系紧密情况以及影响情况。
需要说明的是,衔接匹配度指的是基于衔接关系来确定的,联系越紧密、影响越大,对应的匹配度越高。
需要说明的是,预设匹配度是预先设置好的。
需要说明的是,交集结果指的是结果与结果中的交集信息,并集结果指的是结果与结果的并集信息。
需要说明的是,异常因素的获取都是可以基于异常因素提取模型来得到的,前提是先确定异常因素提取的信息基础。
需要说明的是,策略调整主要是对某些监控任务进行调整,比如,持续性监控,增加安全监控等。
上述技术方案的有益效果是:从两种情况中分析异常事件对应结果的相似值,并通过相似值的大小比较,通过进行不同的分析讨论,来确定因素获取的提取基础,为后续策略的调整提供有效基础。
实施例7:
基于实施例1的基础上,按照调整后的监控策略重新对任务服务过程进行监控之后,还包括:
获取基于调整后的监控策略的新监控结果,并对所述新监控结果所确定的新服务事件进行分类分析;
根据分类分析结果,确定每个新分类事件的分析集合,且所述分析集合包括:若干分析指标以及与每个分析指标一致的分析值;
获取所述分析集合中凸显结果,并从预设数据库中确定与所述凸显结果相关的历史影响,同时,还预测与所述凸显结果相关的预测影响;
根据所述历史影响与预测影响的影响差,从差-因子数据库中,调取对应的修正因子;
确定第二新分类事件对第一新分类事件的分类影响指标;
基于分类影响指标以及修正因子,确定对应新分类事件的被影响值Y1;
其中,表示对应新分类事件中所有凸显结果对应的修正因子;表示对应新分类事件中对应修正因子的绝对值和;表示第i个分类影响指标对相应新分类事件的第一影响值;表示第i个分类影响指标对相应新分类事件的影响权重;n1表示分类影响指标的总个数;
基于所有新分类事件的被影响值Y1,得到执行合格值Y2;
其中,n2表示新分类事件的个数;表示第j个新分类事件的被影响值;表示第j个新分类事件的事件权重;
将所述执行合格值Y2与对应的报警表格进行匹配,根据匹配结果获取相应的报警指令执行相应的报警操作。
需要说明的是,事件权重的累加和为1,n2的取值范围至少为10。
需要说明的是,新监控结果指的是按照新策略进行监控得到的结果。
需要说明的是,分类分析方式与实施例5中的分类分析方式一致。
需要说明的是,预设数据库包括不同分凸显结果以及与凸显结果匹配的历史影响,且差-因子数据库包括不同的影响差以及与影响差以及影响类型匹配的修正因子在内,且预测影响与历史影响都可以规划到一个值上去比较计算。
需要说明的是,第一新分类事件指的是其中的一类新分类事件,第二新分类事件指的是剩余新分类事件,且每个新分类事件中都存在对应的若干个分类影响指标。
需要说明的是,凸显结果指的是分析值异常的结果,进而来获取对应的预测影响以及历史影响。
需要说明的是,报警表格是预先设置好的,且包括不同的合格值以及匹配的报警结果在内。
需要说明的是,不同的合格值对应的报警是不一样的,且报警操作是基于声音、文字等组合报警的。
上述技术方案的有益效果是:通过对调整后的策略获取的新监控结果进行分类分析,以及获取历史影响以及预测影响,确定修正因子,进而结合分类影响指标,可以有效的计算出被影响值,进而有效计算出执行合格值,为执行相应报警提供有效基础,保证监控的有效性。
根据本发明的实施方案,提供第二个方案为:
实施例8:
一种基于云服务的监控系统,如图2所示,包括:
过程监控模块,用于捕捉云服务平台的发布任务,并基于初始监控策略对发布任务的任务服务过程进行监控;
事件确定模块,用于根据监控结果,确定任务服务过程中的服务事件;
事件分析模块,用于确定所述服务事件中的异常事件,并对所述服务事件进行事件分类及分析,同时,对每个异常事件进行单独分析;
策略调整模块,用于根据事件分类及分析结果对单独分析结果的关联关系,获取每个异常事件的异常因素,并按照所述异常因素对初始监控策略进行策略调整;
重新监控模块,用于按照调整后的监控策略重新对任务服务过程进行监控。
上述技术方案的有益效果是:通过按照初始监控策略对服务过程进行监控,并对存在的异常事件进行分析,来提取异常因素,对策略进行调整,有效的保证对任务监控的精准性。
实施例9:
基于实施例8的基础上,所述过程监控模块,包括:
捕捉单元,用于捕捉所述云服务平台的发布任务,并对所述发布任务进行任务解析,得到所述发布任务的任务属性以及监控对象列表;
内容确定单元,用于根据所述任务属性,确定所述监控对象列表中每个监控对象的需要监控内容;
调取单元,用于从内容-权重-指标数据库中,调取与所述需要监控内容匹配的内容权重以及监控指标;
策略获取单元,用于根据所述内容权重,向不同的监控指标赋予监控权重,并基于策略输出模型,获取与所有监控指标匹配的初始监控策略。
上述技术方案的有益效果是:通过对任务解析,确定属性与内容,进而通过数据库调取权重和指标,从模型输出,获取得到监控策略,为后续进行任务监控提供精准性基础。
实施例10:
基于实施例9的基础上,所述策略获取单元,包括:
类型获取块,用于获取所述需要监控内容中每个监控指标的指标监控类型;
权重计算块,用于确定同个需要监控内容中每个监控指标的出现次数,并向对应监控指标设置监控权重;
其中,表示对应监控指标的监控权重;表示对应监控指标基于所述需要监控内容的当下频繁出现值;2表示对应监控指标的出现次数;m1表示对应需要监控内容中所有监控指标的总出现次数;m3表示对应的内容权重;表示基于所述需要监控内容的历史最频繁出现值。
上述技术方案的有益效果是:基于内容权重,并按照相应指标的出现相关情况,有效的向对应指标设置监控权重,为后续任务监控提供精准性基础。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种基于云服务的监控方法,其特征在于,包括:
步骤1:捕捉云服务平台的发布任务,并基于初始监控策略对发布任务的任务服务过程进行监控;
步骤2:根据监控结果,确定任务服务过程中的服务事件;
步骤3:确定所述服务事件中的异常事件,并对所述服务事件进行事件分类及分析,同时,对每个异常事件进行单独分析;
步骤4:根据事件分类及分析结果对单独分析结果的关联关系,获取每个异常事件的异常因素,并按照所述异常因素对初始监控策略进行策略调整;
步骤5:按照调整后的监控策略重新对任务服务过程进行监控;
根据事件分类及分析结果对单独分析结果的关联关系,获取每个异常事件的异常因素,并按照所述异常因素对初始监控策略进行策略调整,包括:
确定事件分类及分析结果中正常事件的第一分析结果以及异常事件的第二分析结果;
基于每个异常事件的第二分析结果与单独分析结果进行相似比较,获取相似值;
对相似值大于或等于预设值a1的异常事件进行第一提取,对相似值小于预设值a1的异常事件进行第二提取;
按照第一提取结果,对每个第一事件的第二分析结果进行异常因素的获取;
按照第一提取结果,确定每个第二事件的单独分析结果与对应所有正常事件的第一分析结果的第一衔接关系、以及确定每个第二事件的第二分析结果与对应所有正常事件的第一分析结果的第二衔接关系;
确定第一衔接关系与第二衔接关系的衔接匹配度;
当所述衔接匹配度大于预设匹配度时,获取同个异常事件对应的第二分析结果以及单独分析结果的交集结果,并进行异常因素的获取;
否则,获取同个异常事件对应的第二分析结果以及单独分析结果的并集结果,并进行异常因素的获取;
基于所获取的每个异常事件的异常因素,对初始监控策略进行策略调整。
2.如权利要求1所述的基于云服务的监控方法,其特征在于,捕捉云服务平台的发布任务,并基于初始监控策略对发布任务的任务服务过程进行监控,包括:
捕捉所述云服务平台的发布任务,并对所述发布任务进行任务解析,得到所述发布任务的任务属性以及监控对象列表;
根据所述任务属性,确定所述监控对象列表中每个监控对象的需要监控内容;
从内容-权重-指标数据库中,调取与所述需要监控内容匹配的内容权重以及监控指标;
根据所述内容权重,向不同的监控指标赋予监控权重,并基于策略输出模型,获取与所有监控指标匹配的初始监控策略。
3.如权利要求2所述的基于云服务的监控方法,其特征在于,根据所述内容权重,向不同的监控指标赋予监控权重,包括:
获取所述需要监控内容中每个监控指标的指标监控类型;
确定同个需要监控内容中每个监控指标的出现次数,并向对应监控指标设置监控权重;
其中,表示对应监控指标的监控权重;表示对应监控指标基于所述需要监控内容的当下频繁出现值;2表示对应监控指标的出现次数;m1表示对应需要监控内容中所有监控指标的总出现次数;m3表示对应的内容权重;表示基于所述需要监控内容的历史最频繁出现值。
4.如权利要求1所述的基于云服务的监控方法,其特征在于,根据监控结果,确定任务服务过程中的服务事件,包括:
根据监控结果,确定突变时间点;
提取同个突变时间点的一侧的第一结果特征以及另一侧的第二结果特征,并判断所述第一结果特征与第二结果特征是否一致;
若一致,则在所述突变时间点进行第一标定;
若不一致,在所述突变时间点进行第二标定;
根据第一标定结果以及第二标定结果,对监控结果进行划分,得到若干个子结果,并基于结果-事件转换机制,得到对应子结果的服务事件。
5.如权利要求1所述的基于云服务的监控方法,其特征在于,确定所述服务事件中的异常事件,并对所述服务事件进行事件分类及分析,同时,对每个异常事件进行单独分析,包括:
基于事件标准执行机制,对每个服务事件进行标准分析,确定存在的异常事件;
按照事件分类及分析模型,对所有服务事件进行分类及分析,同时,按照事件异常分析模型,对每个异常事件进行单独分析。
6.如权利要求1所述的基于云服务的监控方法,其特征在于,按照调整后的监控策略重新对任务服务过程进行监控之后,还包括:
获取基于调整后的监控策略的新监控结果,并对所述新监控结果所确定的新服务事件进行分类分析;
根据分类分析结果,确定每个新分类事件的分析集合,且所述分析集合包括:若干分析指标以及与每个分析指标一致的分析值;
获取所述分析集合中凸显结果,并从预设数据库中确定与所述凸显结果相关的历史影响,同时,还预测与所述凸显结果相关的预测影响;
根据所述历史影响与预测影响的影响差,从差-因子数据库中,调取对应的修正因子;
确定第二新分类事件对第一新分类事件的分类影响指标;
基于分类影响指标以及修正因子,确定对应新分类事件的被影响值Y1;
其中,表示对应新分类事件中所有凸显结果对应的修正因子;表示对应新分类事件中对应修正因子的绝对值和;表示第i个分类影响指标对相应新分类事件的第一影响值;表示第i个分类影响指标对相应新分类事件的影响权重;n1表示分类影响指标的总个数;
基于所有新分类事件的被影响值Y1,得到执行合格值Y2;
其中,n2表示新分类事件的个数;表示第j个新分类事件的被影响值;表示第j个新分类事件的事件权重;
将所述执行合格值Y2与对应的报警表格进行匹配,根据匹配结果获取相应的报警指令执行相应的报警操作。
7.一种基于云服务的监控系统,其特征在于,包括:
过程监控模块,用于捕捉云服务平台的发布任务,并基于初始监控策略对发布任务的任务服务过程进行监控;
事件确定模块,用于根据监控结果,确定任务服务过程中的服务事件;
事件分析模块,用于确定所述服务事件中的异常事件,并对所述服务事件进行事件分类及分析,同时,对每个异常事件进行单独分析;
策略调整模块,用于根据事件分类及分析结果对单独分析结果的关联关系,获取每个异常事件的异常因素,并按照所述异常因素对初始监控策略进行策略调整;
重新监控模块,用于按照调整后的监控策略重新对任务服务过程进行监控;
根据事件分类及分析结果对单独分析结果的关联关系,获取每个异常事件的异常因素,并按照所述异常因素对初始监控策略进行策略调整,包括:
确定事件分类及分析结果中正常事件的第一分析结果以及异常事件的第二分析结果;
基于每个异常事件的第二分析结果与单独分析结果进行相似比较,获取相似值;
对相似值大于或等于预设值a1的异常事件进行第一提取,对相似值小于预设值a1的异常事件进行第二提取;
按照第一提取结果,对每个第一事件的第二分析结果进行异常因素的获取;
按照第一提取结果,确定每个第二事件的单独分析结果与对应所有正常事件的第一分析结果的第一衔接关系、以及确定每个第二事件的第二分析结果与对应所有正常事件的第一分析结果的第二衔接关系;
确定第一衔接关系与第二衔接关系的衔接匹配度;
当所述衔接匹配度大于预设匹配度时,获取同个异常事件对应的第二分析结果以及单独分析结果的交集结果,并进行异常因素的获取;
否则,获取同个异常事件对应的第二分析结果以及单独分析结果的并集结果,并进行异常因素的获取;
基于所获取的每个异常事件的异常因素,对初始监控策略进行策略调整。
8.如权利要求7所述的基于云服务的监控系统,其特征在于,所述过程监控模块,包括:
捕捉单元,用于捕捉所述云服务平台的发布任务,并对所述发布任务进行任务解析,得到所述发布任务的任务属性以及监控对象列表;
内容确定单元,用于根据所述任务属性,确定所述监控对象列表中每个监控对象的需要监控内容;
调取单元,用于从内容-权重-指标数据库中,调取与所述需要监控内容匹配的内容权重以及监控指标;
策略获取单元,用于根据所述内容权重,向不同的监控指标赋予监控权重,并基于策略输出模型,获取与所有监控指标匹配的初始监控策略。
9.如权利要求8所述的基于云服务的监控系统,其特征在于,所述策略获取单元,包括:
类型获取块,用于获取所述需要监控内容中每个监控指标的指标监控类型;
权重计算块,用于确定同个需要监控内容中每个监控指标的出现次数,并向对应监控指标设置监控权重;
其中,表示对应监控指标的监控权重;表示对应监控指标基于所述需要监控内容的当下频繁出现值;2表示对应监控指标的出现次数;m1表示对应需要监控内容中所有监控指标的总出现次数;m3表示对应的内容权重;表示基于所述需要监控内容的历史最频繁出现值。
CN202211314594.4A 2022-10-26 2022-10-26 基于云服务的监控方法及系统 Active CN115378928B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211314594.4A CN115378928B (zh) 2022-10-26 2022-10-26 基于云服务的监控方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211314594.4A CN115378928B (zh) 2022-10-26 2022-10-26 基于云服务的监控方法及系统

Publications (2)

Publication Number Publication Date
CN115378928A CN115378928A (zh) 2022-11-22
CN115378928B true CN115378928B (zh) 2023-04-07

Family

ID=84073159

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211314594.4A Active CN115378928B (zh) 2022-10-26 2022-10-26 基于云服务的监控方法及系统

Country Status (1)

Country Link
CN (1) CN115378928B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116030592A (zh) * 2022-12-12 2023-04-28 佳禾智能科技股份有限公司 一种基于多点关联分析的异常事件预警系统及方法
CN116668482B (zh) * 2023-06-02 2024-03-26 南京国铁电气有限责任公司 一种基于人工智能的智慧楼宇二总线监控系统及方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113705981A (zh) * 2021-08-03 2021-11-26 彭亮 一种基于大数据的异常监测的方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190372827A1 (en) * 2018-06-04 2019-12-05 Cisco Technology, Inc. Anomaly severity scoring in a network assurance service
CN110351436B (zh) * 2019-07-08 2022-04-22 平安科技(深圳)有限公司 FreeSWITCH监控方法、设备、存储介质及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113705981A (zh) * 2021-08-03 2021-11-26 彭亮 一种基于大数据的异常监测的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
制造云服务组合异常自适应调整方法;马文龙等;《中国机械工程》;20160331;第27卷(第06期);全文 *

Also Published As

Publication number Publication date
CN115378928A (zh) 2022-11-22

Similar Documents

Publication Publication Date Title
CN115378928B (zh) 基于云服务的监控方法及系统
CN112258093B (zh) 风险等级的数据处理方法及装置、存储介质、电子设备
US10031829B2 (en) Method and system for it resources performance analysis
US6542881B1 (en) System and method for revealing necessary and sufficient conditions for database analysis
WO2021012930A1 (zh) 投票节点配置方法及系统
US20190180379A1 (en) Life insurance system with fully automated underwriting process for real-time underwriting and risk adjustment, and corresponding method thereof
CN113360358B (zh) 一种自适应计算it智能运维健康指数的方法及系统
CN110457175B (zh) 业务数据处理方法、装置、电子设备及介质
US11042525B2 (en) Extracting and labeling custom information from log messages
CN109995611B (zh) 流量分类模型建立及流量分类方法、装置、设备和服务器
WO2024066331A1 (zh) 网络异常检测方法、装置、电子设备及存储介质
CN117094184B (zh) 基于内网平台的风险预测模型的建模方法、系统及介质
US7617313B1 (en) Metric transport and database load
CN114386034A (zh) 动态迭代的多引擎融合恶意代码检测方法、设备及介质
CN114338351B (zh) 网络异常根因确定方法、装置、计算机设备及存储介质
CN118067204A (zh) 一种基于数字计量技术的安全生产数据采集系统
CN114138601A (zh) 一种业务告警方法、装置、设备及存储介质
CN117349502A (zh) 一种基于互联网数据中心的运维数据查询分析方法及系统
CN115114124A (zh) 主机风险的评估方法及评估装置
CN111258866A (zh) 计算机性能预测方法、装置、设备及可读存储介质
CN112907124A (zh) 一种数据链路异常评测方法、装置、电子设备及存储介质
CN105844376A (zh) 一种识别因子对业务系统影响度的方法及装置
US20240036963A1 (en) Multi-contextual anomaly detection
CN118779798A (zh) 基于物联网云边协同的电力边侧优化控制方法及系统
CN116739395A (zh) 一种企业外迁预测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant