CN114374597A - 一种网络事件的故障处理方法、装置、设备及产品 - Google Patents

一种网络事件的故障处理方法、装置、设备及产品 Download PDF

Info

Publication number
CN114374597A
CN114374597A CN202111614623.4A CN202111614623A CN114374597A CN 114374597 A CN114374597 A CN 114374597A CN 202111614623 A CN202111614623 A CN 202111614623A CN 114374597 A CN114374597 A CN 114374597A
Authority
CN
China
Prior art keywords
network event
processed
event
fault
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111614623.4A
Other languages
English (en)
Inventor
吴鲜篷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Communication Information System Co Ltd
Original Assignee
Inspur Communication Information System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Communication Information System Co Ltd filed Critical Inspur Communication Information System Co Ltd
Priority to CN202111614623.4A priority Critical patent/CN114374597A/zh
Publication of CN114374597A publication Critical patent/CN114374597A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种网络事件的故障处理方法、装置、设备及产品,涉及故障处理技术领域,该方法包括以下步骤:生成待处理网络事件;提取所述待处理网络事件中的关联信息;根据所述关联信息,将所述待处理网络事件与历史网络事件进行关联;对关联后的所述待处理网络事件输入至故障分析模型中,得到所述故障分析模型输出的所述待处理网络事件的故障原因和处理方案;其中,所述故障分析模型是基于历史网络事件训练得到的;根据所述故障原因和所述处理方案,将所述待处理网络事件调度给对应的运维人员进行故障处理。本发明实现对异常事件自动化的处理,直接派单到相关的运维人员,完成整治整改,全流程闭环归档,减轻运维人员的运维压力。

Description

一种网络事件的故障处理方法、装置、设备及产品
技术领域
本发明涉及故障处理技术领域,尤其涉及一种网络事件的故障处理方法、装置、设备及产品。
背景技术
网络媒体作为一种新的信息传播形式,已深入人们的日常生活。目前网络中突发事件的处理流程为:由运维人员提前介入,并启动相应的应急方案,并根据应急方案交给相应的处理人员去处理。
然而,由于每位维护人员的能力层次不同,在进行网络事件的数据分析和运维的同时可能会出现人为因素导致的错误,导致制定的应急方案并不准确,网络事件在处理后收到的相关反馈并不好,用户满意度较差。
发明内容
本发明提供一种网络事件的故障处理方法、装置、设备及产品,用以解决现有技术中人工处理网络事件并不准确的缺陷,实现对异常事件自动化的处理。
本发明提供一种网络事件的故障处理方法,包括以下步骤:
生成待处理网络事件;
提取所述待处理网络事件中的关联信息;
根据所述关联信息,将所述待处理网络事件与历史网络事件进行关联;
对关联后的所述待处理网络事件输入至故障分析模型中,得到所述故障分析模型输出的所述待处理网络事件的故障原因和处理方案;其中,所述故障分析模型是基于历史网络事件训练得到的;
根据所述故障原因和所述处理方案,将所述待处理网络事件调度给对应的运维人员进行故障处理。
根据本发明提供的网络事件的故障处理方法,所述提取所述待处理网络事件中的关联信息,具体包括以下步骤:
将所述待处理网络事件输入至事件解析模型中,得到所述事件解析模型输出的所述关联信息;其中,所述事件解析模型是基于历史网络事件训练得到的。
根据本发明提供的网络事件的故障处理方法,所述根据所述关联信息,将所述待处理网络事件与历史网络事件进行关联,具体包括以下步骤:
根据预设关联规则,根据所述待处理网络事件的所述关联信息与所述历史网络事件已确定的历史关联信息,将所述待处理网络事件与所述历史网络事件进行关联。
根据本发明提供的网络事件的故障处理方法,所述生成待处理网络事件,具体包括以下步骤:
采集数据源的告警信息;
根据预设过滤规则,过滤掉所述告警信息中的杂质信息;
根据预设衍生规则,对经过过滤后的所述告警信息进行衍生处理,衍生得到一件所述待处理网络事件。
根据本发明提供的网络事件的故障处理方法,根据预设衍生规则,对经过过滤后的所述告警信息进行衍生处理,衍生得到一件所述待处理网络事件,具体包括以下步骤:
获取所述告警信息中的字段信息;
当在预设时间内所述字段信息达到预设次数时,对所述告警信息进行衍生处理,衍生得到一件所述待处理网络事件。
根据本发明提供的网络事件的故障处理方法,在所述根据所述故障原因,将所述待处理网络事件调度给对应的运维人员进行故障处理步骤之后,该方法还包括以下步骤:
获取故障处理的处理时间,并根据所述处理时间,得到所述待处理网络事件的监控状态;其中,所述监控状态包括事件发生督办、事件升级督办、事件跟踪督办以及事件闭环;
当所述待处理网络事件进行故障处理时,所述监控状态为所述事件发生督办;
当所述处理时间超过第一预设时间后,所述待处理网络事件仍未被解决,所述监控状态为所述事件升级督办;
当所述处理时间超过第二预设时间后,所述待处理网络事件仍未被解决,所述监控状态为所述事件跟踪督办;
当所述待处理网络事件经过故障处理并被解决时,所述监控状态为所述事件闭环。
本发明还提供网络事件的故障处理装置,包括:
生成模块,用于生成待处理网络事件;
解析模块,用于提取所述待处理网络事件中的关联信息;
关联模块,用于根据所述关联信息,将所述待处理网络事件与历史网络事件进行关联;
分析模块,用于对关联后的所述待处理网络事件输入至故障分析模型中,得到所述故障分析模型输出的所述待处理网络事件的故障原因和处理方案;其中,所述故障分析模型是基于历史网络事件训练得到的;
调度模块,用于根据所述故障原因和所述处理方案,将所述待处理网络事件调度给对应的运维人员进行故障处理。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述网络事件的故障处理方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述网络事件的故障处理方法的步骤。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述网络事件的故障处理方法的步骤。
本发明提供的网络事件的故障处理方法、装置、设备及产品,通过自动生成网络中的待处理网络事件,并关联已处理的历史网络事件对网络,进而得到待处理网络事件的故障原因和处理方案,实现对异常事件自动化的处理,直接派单到相关的运维人员,完成整治整改,全流程闭环归档,积极推进监控去人工化,从而节省运维时长,提高工作效率,为系统自动化运维提供助力,减轻运维人员的运维压力;
当用户投诉时,运维人员通过调度的故障原因和处理方案及时迅速定位问题并获取解决建议,进行快速预处理,相对于低效率遍历式巡检故障原因的传统投诉诊断方式,能提供对应的处理建议,有效降低上门处理投诉比例,提升投诉处理效率,节约投诉处理成本,提升用户满意度,解决用户上报相应故障后,投诉故障处理后原因定位不准、故障处理时间长等问题。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的网络事件的故障处理方法的流程示意图之一;
图2是本发明提供的网络事件的故障处理方法中步骤S100具体的流程示意图;
图3是本发明提供的网络事件的故障处理方法中步骤S130具体的流程示意图;
图4是本发明提供的网络事件的故障处理方法的流程示意图之二;
图5是本发明提供的网络事件的故障处理装置的结构示意图之一;
图6是本发明提供的网络事件的故障处理装置中生成模块具体的结构示意图;
图7是本发明提供的网络事件的故障处理装置中生成单元具体的结构示意图;
图8是本发明提供的网络事件的故障处理装置的结构示意图之二;
图9是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1描述本发明的网络事件的故障处理方法,该方法包括以下步骤:
S100、生成待处理网络事件。
通过对网络中故障产生的数据源进行实时地监控,进而获取到待处理网络事件。
在本实施例中,数据来源包括:集团在线(投诉预警、数据采集系统)、设备告警、性能告警、投诉和信令等。
需要说明的是,在本实施例中,在该方法中还能够提供事件资源索引管理功能,其中,待处理网络事件的资源包括:无线资源、传输资源、集客家客资源、互联网资源、WLAN资源、动力设备资源、云资源等。
S200、提取待处理网络事件中的关联信息。
在本实施例中,步骤S200具体包括以下步骤:
将待处理网络事件输入至事件解析模型中,得到事件解析模型输出的关联信息,事件解析模型是基于历史网络事件训练得到的。
根据网络事件的资源类型,关联信息可以包括:断网、无法上网、掉线、故障、网络、卡顿、延迟、瘫痪、基站辐射、信号干扰、信号差、信号不好、没信号、没有信号、无信号、不能上网、上不了网、上网慢、网速慢、打不开网页、上网卡、限速、卡顿、掉线、崩溃、瘫痪、打不出电话、打不出、打不了电话、电话打不通、网络电视卡顿、电视卡、地震、暴雨、雷暴、冰雹、冰冻、泥石流、交通事故、灾害、塌方、爆炸、洪水、洪涝、台风、火灾、大雪、暴雪、冰灾、雾霾、高温、干旱、降霜、滑坡、强对流、龙卷风、山洪、死亡、死伤、失踪、伤亡、爆炸、踩踏、矿难、交通事故、车祸、重大伤亡、疏散、活动、晚会、保障、宴会、展览、博览、交通违法、交警部门等等。
在本实施例中,进行关联处理时的管理粒度可以包括:分钟、小时、日、周、月等。
S300、根据关联信息,将待处理网络事件与历史网络事件进行关联。
在本实施例中,步骤S300具体包括以下步骤:
根据预设关联规则,根据待处理网络事件的关联信息与历史网络事件已确定的历史关联信息,将待处理网络事件与历史网络事件进行关联。
在该方法中,在步骤S300进行关联处理时,会对关联信息进行解析并管理,包括:
事件定界定位:对待处理网络事件的定界结果进行呈现,包括根因分析、根因地点、诊断信息、诊断过程以及根因网元和告警等;
事件拓扑:呈现当前待处理网络事件的网元拓扑,如果存在多个网元,可选择切换不同网元的拓扑图。可以对告警网元进行告警渲染和快速定位。可以钻取呈现网元所在机房的拓扑;
事件地理位置分析:在地理信息系统(Geographic Information System或Geo-Information system,GIS)上以打点的方式呈现受待处理网络事件影响的各个网元以及客户位置,可以对告警网元进行告警渲染。如果存在传输光缆信息,也可在GIS上呈现传输光缆情况。
S400、对关联后的待处理网络事件输入至故障分析模型中,得到故障分析模型输出的待处理网络事件的故障原因和处理方案;其中,故障分析模型是基于历史网络事件训练得到的。
S500、根据故障原因和处理方案,将待处理网络事件调度给对应的运维人员进行故障处理。
具体的,可以根据待处理网络事件其对应的资源属性,结合资源点与维护人员的包机关系,建立自动调度功能。这样,在根据历史网络事件的历史故障原因和历史处理方案,已训练好的故障分析模型能够输出待处理网络事件的故障原因和处理方案之后,可以将待处理网络事件以及相应的故障原因和处理方案均分配或者调度给对应的运维人员,交由这些运维人员进行更加精准和专业的故障处理。
在本实施例中,还可以采用图形化的方式呈现当前待处理网络事件的处理过程,显示各环节的执行状态。可以通过tip的方式呈现已完成节点的数据情况,运维人员可以实时地查看调度详情可以跳转事件调度详情页面。
本发明的网络事件的故障处理方法,通过自动生成网络中的待处理网络事件,并关联已处理的历史网络事件对网络,进而得到待处理网络事件的故障原因和处理方案,实现对异常事件自动化的处理,直接派单到相关的运维人员,完成整治整改,全流程闭环归档,积极推进监控去人工化,从而节省运维时长,提高工作效率,为系统自动化运维提供助力,减轻运维人员的运维压力;
当用户投诉时,运维人员通过调度的故障原因和处理方案及时迅速定位问题并获取解决建议,进行快速预处理,相对于低效率遍历式巡检故障原因的传统投诉诊断方式,能提供对应的处理建议,有效降低上门处理投诉比例,提升投诉处理效率,节约投诉处理成本,提升用户满意度,解决用户上报相应故障后,投诉故障处理后原因定位不准、故障处理时间长等问题。
下面结合图2描述本发明的网络事件的故障处理方法,步骤S100 具体包括以下步骤:
S110、采集数据源的告警信息。
在本实施例中,告警信息包括在告警、投诉、工程、性能、日志等信息流中。
S120、根据预设过滤规则,过滤掉告警信息中的杂质信息。可以根据需要设置不同的告警过滤条件,作为满足事件触发的输入,可以理解的是,过滤条件可以分为多组,相互之间的逻辑关系为“AND”或者“OR”。
S130、根据预设衍生规则,对经过过滤后的告警信息进行衍生处理,衍生得到一件待处理网络事件。
通过对包含上述内容的信息流中捕捉网络运行中的异常现象,并通过预设衍生规则对告警、日志等信息进行关联,进一步衍生生成待处理网络事件。
在步骤S100中,预设规则的基本信息包括规则名称、启用状态、事件级别、触发来源、规则描述、关联等待时间窗、规则梳理人、梳理人电话和调度处理流程。
下面结合图3描述本发明的网络事件的故障处理方法,步骤S130 具体包括以下步骤:
S131、获取告警信息中的字段信息。
S132、当在预设时间内字段信息达到预设次数时,对告警信息进行衍生处理,衍生得到一件待处理网络事件。
步骤S130中会设置延伸事件触发满足的门限,一般采用计数的方式进行判断。可以指定多个分组字段和一个计数字段,并设置门限值即预设次数和故障历时即预设时间,满足计数门限值和故障历时条件时,触发事件衍生。
可以理解的是,该方法中可以配置事件的基本字段信息,包括事件名称、专业、厂家、设备类型、事件可能原因、事件正文、省、地市、区县等,并且不同规则使用的事件名称可以不重复,以清楚表达事件的含义为主。
相应的,事件清除时满足的条件,包括:告警全部清除、告警清除任意一条、低于门限比例、持续一定时间自动清除、处理流程结束或者手动清除。
下面结合图4描述本发明的网络事件的故障处理方法,该方法还包括以下步骤:
S600、获取故障处理的处理时间,并根据处理时间,得到待处理网络事件的监控状态。在该方法中,监控状态包括事件发生督办、事件升级督办、事件跟踪督办以及事件闭环。
具体的,当待处理网络事件进行故障处理时,监控状态为事件发生督办;
当处理时间超过第一预设时间(例如30分钟)后,待处理网络事件仍未被解决即仍未清除,监控状态为事件升级督办;
当处理时间超过第二预设时间(例如60分钟)后,待处理网络事件仍未被解决即仍未清除,监控状态为事件跟踪督办;
当待处理网络事件经过故障处理并被解决时,监控状态为事件闭环。
因此,该方法通过建立日常监测以及事件触发的管控模式,实现日常关注场景的实时监控和流程管理,同时根据事件触发的方式,有周期性的实现重大活动、节假日保障的事件触发监控。
该方法采用流式处理框架,将性能数据、投诉数据融入到故障升降级流程中,当出现性能劣化达阈值、投诉工单增加时,自动与已有故障关联,完成故障的升级判断。
下面对本发明提供的网络事件的故障处理装置进行描述,下文描述的网络事件的故障处理装置与上文描述的网络事件的故障处理方法可相互对应参照。
下面结合图5描述本发明的网络事件的故障处理装置,该装置包括:
生成模块100,用于生成待处理网络事件。
通过对网络中故障产生的数据源进行实时地监控,进而获取到待处理网络事件。
在本实施例中,数据来源包括:集团在线(投诉预警、数据采集系统)、设备告警、性能告警、投诉和信令等。
需要说明的是,在本实施例中,在该装置中还能够提供事件资源索引管理功能,其中,待处理网络事件的资源包括:无线资源、传输资源、集客家客资源、互联网资源、WLAN资源、动力设备资源、云资源等。
解析模块200,用于提取待处理网络事件中的关联信息。
在本实施例中,解析模块200具体包括:
将待处理网络事件输入至事件解析模型中,得到事件解析模型输出的关联信息,事件解析模型是基于历史网络事件训练得到的。
根据网络事件的资源类型,关联信息可以包括:断网、无法上网、掉线、故障、网络、卡顿、延迟、瘫痪、基站辐射、信号干扰、信号差、信号不好、没信号、没有信号、无信号、不能上网、上不了网、上网慢、网速慢、打不开网页、上网卡、限速、卡顿、掉线、崩溃、瘫痪、打不出电话、打不出、打不了电话、电话打不通、网络电视卡顿、电视卡、地震、暴雨、雷暴、冰雹、冰冻、泥石流、交通事故、灾害、塌方、爆炸、洪水、洪涝、台风、火灾、大雪、暴雪、冰灾、雾霾、高温、干旱、降霜、滑坡、强对流、龙卷风、山洪、死亡、死伤、失踪、伤亡、爆炸、踩踏、矿难、交通事故、车祸、重大伤亡、疏散、活动、晚会、保障、宴会、展览、博览、交通违法、交警部门等等。
在本实施例中,进行关联处理时的管理粒度可以包括:分钟、小时、日、周、月等。
关联模块300,用于根据关联信息,将待处理网络事件与历史网络事件进行关联。
在本实施例中,关联模块300具体包括:
根据预设关联规则,根据待处理网络事件的关联信息与历史网络事件已确定的历史关联信息,将待处理网络事件与历史网络事件进行关联。
在该装置中,在关联模块300进行关联处理时,会对关联信息进行解析并管理,包括:
事件定界定位:对待处理网络事件的定界结果进行呈现,包括根因分析、根因地点、诊断信息、诊断过程以及根因网元和告警等;
事件拓扑:呈现当前待处理网络事件的网元拓扑,如果存在多个网元,可选择切换不同网元的拓扑图。可以对告警网元进行告警渲染和快速定位。可以钻取呈现网元所在机房的拓扑;
事件地理位置分析:在GIS上以打点的方式呈现受待处理网络事件影响的各个网元以及客户位置,可以对告警网元进行告警渲染。如果存在传输光缆信息,也可在GIS上呈现传输光缆情况。
分析模块400,用于对关联后的待处理网络事件输入至故障分析模型中,得到故障分析模型输出的待处理网络事件的故障原因和处理方案;其中,故障分析模型是基于历史网络事件训练得到的。
调度模块500,用于根据故障原因和处理方案,将待处理网络事件调度给对应的运维人员进行故障处理。
具体的,可以根据待处理网络事件其对应的资源属性,结合资源点与维护人员的包机关系,建立自动调度功能。这样,在根据历史网络事件的历史故障原因和历史处理方案,已训练好的故障分析模型能够输出待处理网络事件的故障原因和处理方案之后,可以将待处理网络事件以及相应的故障原因和处理方案均分配或者调度给对应的运维人员,交由这些运维人员进行更加精准和专业的故障处理。
在本实施例中,还可以采用图形化的方式呈现当前待处理网络事件的处理过程,显示各环节的执行状态。可以通过tip的方式呈现已完成节点的数据情况,运维人员可以实时地查看调度详情可以跳转事件调度详情页面。
本发明的网络事件的故障处理装置,通过自动生成网络中的待处理网络事件,并关联已处理的历史网络事件对网络,进而得到待处理网络事件的故障原因和处理方案,实现对异常事件自动化的处理,直接派单到相关的运维人员,完成整治整改,全流程闭环归档,积极推进监控去人工化,从而节省运维时长,提高工作效率,为系统自动化运维提供助力,减轻运维人员的运维压力;
当用户投诉时,运维人员通过调度的故障原因和处理方案及时迅速定位问题并获取解决建议,进行快速预处理,相对于低效率遍历式巡检故障原因的传统投诉诊断方式,能提供对应的处理建议,有效降低上门处理投诉比例,提升投诉处理效率,节约投诉处理成本,提升用户满意度,解决用户上报相应故障后,投诉故障处理后原因定位不准、故障处理时间长等问题。
下面结合图6描述本发明的网络事件的故障处理装置,生成模块 100具体包括:
采集单元110,用于采集数据源的告警信息。
在本实施例中,告警信息包括在告警、投诉、工程、性能、日志等信息流中。
过滤单元120,用于根据预设过滤规则,过滤掉告警信息中的杂质信息。可以根据需要设置不同的告警过滤条件,作为满足事件触发的输入,可以理解的是,过滤条件可以分为多组,相互之间的逻辑关系为“AND”或者“OR”。
生成单元130,用于根据预设衍生规则,对经过过滤后的告警信息进行衍生处理,衍生得到一件待处理网络事件。
通过对包含上述内容的信息流中捕捉网络运行中的异常现象,并通过预设衍生规则对告警、日志等信息进行关联,进一步衍生生成待处理网络事件。
在生成模块100中,预设规则的基本信息包括规则名称、启用状态、事件级别、触发来源、规则描述、关联等待时间窗、规则梳理人、梳理人电话和调度处理流程。
下面结合图7描述本发明的网络事件的故障处理装置,生成单元 130具体包括:
获取单元131,用于获取告警信息中的字段信息。
衍生单元132,用于当在预设时间内字段信息达到预设次数时,对告警信息进行衍生处理,衍生得到一件待处理网络事件。
生成单元130中会设置延伸事件触发满足的门限,一般采用计数的方式进行判断。可以指定多个分组字段和一个计数字段,并设置门限值即预设次数和故障历时即预设时间,满足计数门限值和故障历时条件时,触发事件衍生。
可以理解的是,该装置中可以配置事件的基本字段信息,包括事件名称、专业、厂家、设备类型、事件可能原因、事件正文、省、地市、区县等,并且不同规则使用的事件名称可以不重复,以清楚表达事件的含义为主。
相应的,事件清除时满足的条件,包括:告警全部清除、告警清除任意一条、低于门限比例、持续一定时间自动清除、处理流程结束或者手动清除。
下面结合图8描述本发明的网络事件的故障处理装置,该装置还包括:
监控模块600,用于获取故障处理的处理时间,并根据处理时间,得到待处理网络事件的监控状态。在该装置中,监控状态包括事件发生督办、事件升级督办、事件跟踪督办以及事件闭环。
具体的,当待处理网络事件进行故障处理时,监控状态为事件发生督办;
当处理时间超过第一预设时间(例如30分钟)后,待处理网络事件仍未被解决即仍未清除,监控状态为事件升级督办;
当处理时间超过第二预设时间(例如60分钟)后,待处理网络事件仍未被解决即仍未清除,监控状态为事件跟踪督办;
当待处理网络事件经过故障处理并被解决时,监控状态为事件闭环。
因此,该装置通过建立日常监测以及事件触发的管控模式,实现日常关注场景的实时监控和流程管理,同时根据事件触发的方式,有周期性的实现重大活动、节假日保障的事件触发监控。
该装置采用流式处理框架,将性能数据、投诉数据融入到故障升降级流程中,当出现性能劣化达阈值、投诉工单增加时,自动与已有故障关联,完成故障的升级判断。
图9示例了一种电子设备的实体结构示意图,如图9所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行网络事件的故障处理方法,该方法包括以下步骤:
S100、生成待处理网络事件;
S200、提取所述待处理网络事件中的关联信息;
S300、根据所述关联信息,将所述待处理网络事件与历史网络事件进行关联;
S400、对关联后的所述待处理网络事件输入至故障分析模型中,得到所述故障分析模型输出的所述待处理网络事件的故障原因和处理方案;其中,所述故障分析模型是基于历史网络事件训练得到的;
S500、根据所述故障原因和所述处理方案,将所述待处理网络事件调度给对应的运维人员进行故障处理。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的网络事件的故障处理方法,该方法包括以下步骤:
S100、生成待处理网络事件;
S200、提取所述待处理网络事件中的关联信息;
S300、根据所述关联信息,将所述待处理网络事件与历史网络事件进行关联;
S400、对关联后的所述待处理网络事件输入至故障分析模型中,得到所述故障分析模型输出的所述待处理网络事件的故障原因和处理方案;其中,所述故障分析模型是基于历史网络事件训练得到的;
S500、根据所述故障原因和所述处理方案,将所述待处理网络事件调度给对应的运维人员进行故障处理。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的网络事件的故障处理方法,该方法包括:该方法包括以下步骤:
S100、生成待处理网络事件;
S200、提取所述待处理网络事件中的关联信息;
S300、根据所述关联信息,将所述待处理网络事件与历史网络事件进行关联;
S400、对关联后的所述待处理网络事件输入至故障分析模型中,得到所述故障分析模型输出的所述待处理网络事件的故障原因和处理方案;其中,所述故障分析模型是基于历史网络事件训练得到的;
S500、根据所述故障原因和所述处理方案,将所述待处理网络事件调度给对应的运维人员进行故障处理。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种网络事件的故障处理方法,其特征在于,包括以下步骤:
生成待处理网络事件;
提取所述待处理网络事件中的关联信息;
根据所述关联信息,将所述待处理网络事件与历史网络事件进行关联;
对关联后的所述待处理网络事件输入至故障分析模型中,得到所述故障分析模型输出的所述待处理网络事件的故障原因和处理方案;其中,所述故障分析模型是基于历史网络事件训练得到的;
根据所述故障原因和所述处理方案,将所述待处理网络事件调度给对应的运维人员进行故障处理。
2.根据权利要求1所述的网络事件的故障处理方法,其特征在于,所述提取所述待处理网络事件中的关联信息,具体包括以下步骤:
将所述待处理网络事件输入至事件解析模型中,得到所述事件解析模型输出的所述关联信息;其中,所述事件解析模型是基于历史网络事件训练得到的。
3.根据权利要求1所述的网络事件的故障处理方法,其特征在于,所述根据所述关联信息,将所述待处理网络事件与历史网络事件进行关联,具体包括以下步骤:
根据预设关联规则,根据所述待处理网络事件的所述关联信息与所述历史网络事件已确定的历史关联信息,将所述待处理网络事件与所述历史网络事件进行关联。
4.根据权利要求1所述的网络事件的故障处理方法,其特征在于,所述生成待处理网络事件,具体包括以下步骤:
采集数据源的告警信息;
根据预设过滤规则,过滤掉所述告警信息中的杂质信息;
根据预设衍生规则,对经过过滤后的所述告警信息进行衍生处理,衍生得到一件所述待处理网络事件。
5.根据权利要求4所述的网络事件的故障处理方法,其特征在于,根据预设衍生规则,对经过过滤后的所述告警信息进行衍生处理,衍生得到一件所述待处理网络事件,具体包括以下步骤:
获取所述告警信息中的字段信息;
当在预设时间内所述字段信息达到预设次数时,对所述告警信息进行衍生处理,衍生得到一件所述待处理网络事件。
6.根据权利要求1所述的网络事件的故障处理方法,其特征在于,在所述根据所述故障原因,将所述待处理网络事件调度给对应的运维人员进行故障处理步骤之后,该方法还包括以下步骤:
获取故障处理的处理时间,并根据所述处理时间,得到所述待处理网络事件的监控状态;其中,所述监控状态包括事件发生督办、事件升级督办、事件跟踪督办以及事件闭环;
当所述待处理网络事件进行故障处理时,所述监控状态为所述事件发生督办;
当所述处理时间超过第一预设时间后,所述待处理网络事件仍未被解决,所述监控状态为所述事件升级督办;
当所述处理时间超过第二预设时间后,所述待处理网络事件仍未被解决,所述监控状态为所述事件跟踪督办;
当所述待处理网络事件经过故障处理并被解决时,所述监控状态为所述事件闭环。
7.一种网络事件的故障处理装置,其特征在于,包括:
生成模块,用于生成待处理网络事件;
解析模块,用于提取所述待处理网络事件中的关联信息;
关联模块,用于根据所述关联信息,将所述待处理网络事件与历史网络事件进行关联;
分析模块,用于对关联后的所述待处理网络事件输入至故障分析模型中,得到所述故障分析模型输出的所述待处理网络事件的故障原因和处理方案;其中,所述故障分析模型是基于历史网络事件训练得到的;
调度模块,用于根据所述故障原因和所述处理方案,将所述待处理网络事件调度给对应的运维人员进行故障处理。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述网络事件的故障处理方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述网络事件的故障处理方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述网络事件的故障处理方法的步骤。
CN202111614623.4A 2021-12-27 2021-12-27 一种网络事件的故障处理方法、装置、设备及产品 Pending CN114374597A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111614623.4A CN114374597A (zh) 2021-12-27 2021-12-27 一种网络事件的故障处理方法、装置、设备及产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111614623.4A CN114374597A (zh) 2021-12-27 2021-12-27 一种网络事件的故障处理方法、装置、设备及产品

Publications (1)

Publication Number Publication Date
CN114374597A true CN114374597A (zh) 2022-04-19

Family

ID=81141997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111614623.4A Pending CN114374597A (zh) 2021-12-27 2021-12-27 一种网络事件的故障处理方法、装置、设备及产品

Country Status (1)

Country Link
CN (1) CN114374597A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114595848A (zh) * 2022-04-29 2022-06-07 武汉四通信息服务有限公司 设备监管方法和装置
CN115695142A (zh) * 2022-10-25 2023-02-03 浪潮通信信息系统有限公司 一种面向网络运维的事件监控方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1878093A (zh) * 2006-07-19 2006-12-13 华为技术有限公司 安全事件关联分析方法和系统
CN104734775A (zh) * 2015-04-10 2015-06-24 江苏通软科技有限公司 光缆通信网络故障处理方法及系统
CN106130786A (zh) * 2016-07-26 2016-11-16 腾讯科技(深圳)有限公司 一种网络故障的检测方法及装置
CN110247792A (zh) * 2019-05-28 2019-09-17 广东南方通信建设有限公司 一种基于网络告警关联的故障处理方法及装置
CN110943874A (zh) * 2018-09-21 2020-03-31 中国移动通信有限公司研究院 一种家庭宽带网络的故障检测方法、装置和可读介质
CN111030857A (zh) * 2019-12-06 2020-04-17 深圳前海微众银行股份有限公司 网络告警方法、装置、系统与计算机可读存储介质
CN111126824A (zh) * 2019-12-19 2020-05-08 中国移动通信集团江苏有限公司 多指标关联模型训练方法及多指标异常分析方法
CN111124840A (zh) * 2019-12-02 2020-05-08 北京天元创新科技有限公司 业务运维中告警的预测方法、装置与电子设备
CN111860900A (zh) * 2020-08-14 2020-10-30 中国能源建设集团广东省电力设计研究院有限公司 基于bim的数字孪生智慧机房管理方法、装置、设备及介质
CN113822421A (zh) * 2021-10-14 2021-12-21 平安科技(深圳)有限公司 基于神经网络的异常定位方法、系统、设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1878093A (zh) * 2006-07-19 2006-12-13 华为技术有限公司 安全事件关联分析方法和系统
CN104734775A (zh) * 2015-04-10 2015-06-24 江苏通软科技有限公司 光缆通信网络故障处理方法及系统
CN106130786A (zh) * 2016-07-26 2016-11-16 腾讯科技(深圳)有限公司 一种网络故障的检测方法及装置
CN110943874A (zh) * 2018-09-21 2020-03-31 中国移动通信有限公司研究院 一种家庭宽带网络的故障检测方法、装置和可读介质
CN110247792A (zh) * 2019-05-28 2019-09-17 广东南方通信建设有限公司 一种基于网络告警关联的故障处理方法及装置
CN111124840A (zh) * 2019-12-02 2020-05-08 北京天元创新科技有限公司 业务运维中告警的预测方法、装置与电子设备
CN111030857A (zh) * 2019-12-06 2020-04-17 深圳前海微众银行股份有限公司 网络告警方法、装置、系统与计算机可读存储介质
CN111126824A (zh) * 2019-12-19 2020-05-08 中国移动通信集团江苏有限公司 多指标关联模型训练方法及多指标异常分析方法
CN111860900A (zh) * 2020-08-14 2020-10-30 中国能源建设集团广东省电力设计研究院有限公司 基于bim的数字孪生智慧机房管理方法、装置、设备及介质
CN113822421A (zh) * 2021-10-14 2021-12-21 平安科技(深圳)有限公司 基于神经网络的异常定位方法、系统、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114595848A (zh) * 2022-04-29 2022-06-07 武汉四通信息服务有限公司 设备监管方法和装置
CN115695142A (zh) * 2022-10-25 2023-02-03 浪潮通信信息系统有限公司 一种面向网络运维的事件监控方法及装置

Similar Documents

Publication Publication Date Title
CN111444240A (zh) 输电线路故障预警方法及装置
CN108763957B (zh) 一种数据库的安全审计系统、方法及服务器
CN114374597A (zh) 一种网络事件的故障处理方法、装置、设备及产品
CN103856339B (zh) 一种对告警信息进行压缩的方法和设备
CN106254137B (zh) 监管系统的告警根源分析系统及方法
CN103489138B (zh) 一种输电网故障信息与线路越限信息的相关度分析法
CN101808351B (zh) 业务影响分析方法和系统
CN105976116B (zh) 基于物联网的消防安全动态评价方法及系统
CN106656590A (zh) 一种网络设备告警消息风暴的处理方法和装置
CN112751925B (zh) 基于大数据与物联网的宠物狗管理系统、方法及智能设备
CN101989931A (zh) 一种运维告警处理方法和装置
CN112489387B (zh) 一种基于天气监测的配电施工现场安全预警方法
CN106936621A (zh) 一种工单风暴控制方法、装置及系统
CN113283824A (zh) 智慧园区数据综合管理方法及系统
CN111932100A (zh) 一种城市公共安全应急救援平台
CN112487935A (zh) 一种危险点源安全管控系统
CN104065503A (zh) 一种智能交通物联网设施故障溯源判别分析方法
CN202218244U (zh) 用于业务系统监控的it运维系统
CN103268353B (zh) 电网报警自动响应系统及电网报警自动响应方法
CN108650124B (zh) 一种基于WebGIS的电网通信预警系统
CN113156906B (zh) 基于污染源在线监控的活性炭饱和分析和管理方法
CN112583792A (zh) 一种网站群日常监测系统及方法
CN111008787A (zh) 基于计量终端告警技术的计划停电主动监控及调度方法
CN109427177B (zh) 一种监控报警方法及装置
CN103389361A (zh) 气体监控、预警和分析系统及气体监控、预警和分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination