CN116016244A - 监控网络故障处理过程的方法、装置及设备 - Google Patents

监控网络故障处理过程的方法、装置及设备 Download PDF

Info

Publication number
CN116016244A
CN116016244A CN202111222647.5A CN202111222647A CN116016244A CN 116016244 A CN116016244 A CN 116016244A CN 202111222647 A CN202111222647 A CN 202111222647A CN 116016244 A CN116016244 A CN 116016244A
Authority
CN
China
Prior art keywords
network
monitoring
alarm information
processing operation
fault processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111222647.5A
Other languages
English (en)
Inventor
章宇
戴重阳
胡蔚
赵静
林锦明
蔡明师
寇仲伟
刘志伟
王镇
段庆新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202111222647.5A priority Critical patent/CN116016244A/zh
Publication of CN116016244A publication Critical patent/CN116016244A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02BCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
    • Y02B20/00Energy efficient lighting technologies, e.g. halogen lamps or gas discharge lamps
    • Y02B20/40Control techniques providing energy savings, e.g. smart controller or presence detection

Abstract

本申请提供了一种监控网络故障处理过程的方法、装置及设备,该方法包括:生成网络故障监控单,网络故障监控单包括:第一网络设备的名称和观察窗口;根据第一网络设备的名称确定第一网络设备对应的监控配置;执行网络故障处理操作,并在观察窗口内根据监控配置进行网络监控,以得到网络监控结果;根据网络监控结果向终端设备发送控制信息,控制信息用于控制终端设备上的红绿灯点灯页面上的主灯颜色,以指示是否监控到监控配置对应的至少一个告警信息,若监控到至少一个告警信息,还用于指示至少一个告警信息与网络故障处理操作之间是否关联,从而可以实现在故障处理过程中,对网络质量的监控,以及时发现网络异常情况。

Description

监控网络故障处理过程的方法、装置及设备
技术领域
本申请实施例涉及互联网技术领域,尤其涉及一种监控网络故障处理过程的方法、装置及设备。
背景技术
网络故障处理过程在互联网中非常常见,例如:两台网络设备之间出现端口故障时,为了避免该端口故障造成的网络异常,对该端口故障进行处理至关重要。
传统模式中的自动化故障处理方法,通常聚焦于故障处理过程,缺乏关联的网络质量监控,一旦故障处理过程引发新的网络异常,往往不能及时发现和处理,可能造成更加严重的网络质量异常问题。
发明内容
本申请提供一种监控网络故障处理过程的方法、装置及设备,从而可以实现在故障处理过程中,对网络质量的监控,以及时发现网络异常情况。
第一方面,提供一种监控网络故障处理过程的方法,包括:生成网络故障监控单,网络故障监控单包括:第一网络设备的名称和观察窗口,第一网络设备是网络故障处理操作关联的网络设备;根据第一网络设备的名称确定第一网络设备对应的监控配置;执行网络故障处理操作,并在观察窗口内根据监控配置进行网络监控,以得到网络监控结果;根据网络监控结果向终端设备发送控制信息,控制信息用于控制终端设备上的红绿灯点灯页面上的主灯颜色,以指示是否监控到监控配置对应的至少一个告警信息,若监控到至少一个告警信息,还用于指示至少一个告警信息与网络故障处理操作之间是否关联。
第二方面,提供一种监控网络故障处理过程的方法,包括:显示红绿灯点灯页面;其中,红绿灯点灯页面包括:主灯,主灯颜色用于指示是否监控到监控配置对应的至少一个告警信息,若监控到至少一个告警信息,以指示至少一个告警信息与网络故障处理操作之间是否关联;监控配置是第一网络设备对应的监控配置,第一网络设备是网络故障处理操作关联的网络设备。
第三方面,提供一种服务器,包括:生成模块、第一确定模块、处理模块和发送模块,其中,生成模块用于生成网络故障监控单,网络故障监控单包括:第一网络设备的名称和网络故障处理操作的观察窗口,第一网络设备是网络故障处理操作关联的网络设备;第一确定模块用于根据第一网络设备的名称确定第一网络设备对应的监控配置;处理模块用于执行网络故障处理操作,并在观察窗口内根据监控配置进行网络监控,以得到网络监控结果;发送模块用于根据网络监控结果向终端设备发送控制信息,控制信息用于控制终端设备上的红绿灯点灯页面上的主灯颜色,以指示是否监控到监控配置对应的至少一个告警信息,若监控到至少一个告警信息,还用于指示至少一个告警信息与网络故障处理操作之间是否关联。
第四方面,提供一种终端设备,包括:显示模块,用于红绿灯点灯页面;其中,红绿灯点灯页面包括:主灯,主灯颜色用于指示是否监控到监控配置对应的至少一个告警信息,若监控到至少一个告警信息,以指示至少一个告警信息与网络故障处理操作之间是否关联;监控配置是第一网络设备对应的监控配置,第一网络设备是网络故障处理操作关联的网络设备。
第五方面,提供一种服务器,包括:处理器和存储器,该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,执行如第一方面或其各实现方式中的方法。
第六方面,提供一种终端设备,包括:处理器和存储器,该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,执行如第二方面或其各实现方式中的方法。
第七方面,提供一种计算机可读存储介质,用于存储计算机程序,计算机程序使得计算机执行如第一方面、第二方面或其各实现方式中的方法。
第八方面,提供一种计算机程序产品,包括计算机程序指令,该计算机程序指令使得计算机执行如第一方面、第二方面或其各实现方式中的方法。
第九方面,提供一种计算机程序,计算机程序使得计算机执行如第一方面、第二方面或其各实现方式中的方法。
通过本申请提供的技术方案,服务器可以自动获取网络故障处理操作关联的网络设备的监控配置,在进行网络故障处理操作时,可以根据该监控配置进行网络监控,并且可以根据监控结果可以控制红绿灯点灯页面上的主灯颜色,以提醒网络运营人员是否存在该监控配置对应的告警信息,如果监控到了该监控配置对应的告警信息,该主灯颜色还可以提醒网络运营人员该告警信息与网络故障处理操作是否关联。从而可以实现在故障处理过程中,对网络质量的监控,以及时发现网络异常情况。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种应用场景图;
图2为本申请实施例提供的一种监控网络故障处理过程的方法的交互流程图;
图3为本申请实施例提供的一种网络架构图;
图4为本申请实施例提供的一种监控配置的示意图;
图5为本申请实施例提供的一种网络故障处理过程的示意图;
图6为本申请实施例提供的主灯-子灯-告警灯的三层结构关系图;
图7为本申请实施例提供的一种操作命令识别规则的示意图;
图8为本申请实施例提供的一种界面示意图;
图9为本申请实施例提供的一种红绿灯点灯页面的示意图;
图10为本申请实施例提供的一种监控配置模型示意图;
图11为本申请实施例提供的一种服务器的示意图;
图12为本申请实施例提供的一种终端设备的示意图;
图13是本申请实施例提供的电子设备1300的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
传统模式中的自动化故障处理方法,通常聚焦于故障处理过程,缺乏关联的网络质量监控,一旦故障处理过程引发新的网络异常,往往不能及时发现和处理,可能造成更加严重的网络质量异常问题。
为了解决上述技术问题,本申请的发明构思是:服务器可以自动获取网络故障处理操作或过程关联的网络设备的监控配置和观察窗口,在进行网络故障处理操作时,可以在该观察窗口内根据该监控配置进行网络监控,并且可以根据监控结果可以控制红绿灯点灯页面上的主灯颜色,以提醒网络运营人员是否存在该监控配置对应的告警信息,如果监控到了告警信息,该主灯颜色还可以提醒网络运营人员该告警信息与网络故障处理操作是否关联。
应理解的是,本申请技术方案可以应用于如下场景,但不限于:
示例性的,图1为本申请实施例提供的一种应用场景图,如图1所示,终端设备110可以与服务器120进行通信,其中,终端设备110可以安装有网络监控应用(Application,APP),网络运营人员可以通过该网络监控APP可以访问网络监控系统,或者,终端设备无需安装该网络监控APP,这种情况下,网络运营人员可以通过浏览器访问网络监控系统。
在一些可实现方式中,图1所示的应用场景中还可以包括:基站、核心网侧设备等,此外,图1示例性地示出了一个终端设备、一台服务器,实际上可以包括其他数量的终端设备和服务器,本申请对此不做限制。
在一些可实现方式中,图1中的终端设备110可以是台式计算机、笔记本电脑、平板电脑或者手机等,本申请对此不做限制。
在一些可实现方式中,图1中的服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。本申请对此不做限制。
下面将对本申请技术方案进行详细阐述:
图2为本申请实施例提供的一种监控网络故障处理过程的方法的交互流程图,该方法涉及的执行主体是服务器和终端设备,该服务器可以是图1中的服务器120,终端设备可以是图1中的终端设备110,但不限于此,如图2所示,该方法包括如下步骤:
S210:服务器生成网络故障监控单,网络故障监控单包括:第一网络设备的名称和观察窗口,第一网络设备是网络故障处理操作关联的网络设备;
S220:服务器根据第一网络设备的名称确定第一网络设备对应的监控配置;
S230:服务器执行网络故障处理操作,并在观察窗口内根据监控配置进行网络监控,以得到网络监控结果;
S240:服务器根据网络监控结果向终端设备发送控制信息;
S250:终端设备上显示红绿灯点灯页面,其中,控制信息用于控制红绿灯点灯页面上的主灯颜色,以指示是否监控到监控配置对应的至少一个告警信息,若监控到至少一个告警信息,还用于指示至少一个告警信息与网络故障处理操作之间是否关联。
应理解的是,本申请中的网络设备可以是交换机或者路由器等,本申请对此不做限制。
应理解的是,上述第一网络设备可以是一个或者多个,例如:图3为本申请实施例提供的一种网络架构图,如图3所示,当某园区内汇聚设备与互联网数据中心(InternetData Center,IDC)园区内网出口设备之间的链路端口发生故障时,那么园区内汇聚设备和IDC园区内网出口设备均是这种网络故障处理情况下的第一网络设备。当然,如果将这里的园区内汇聚设备替换为园区内汇聚系统,将IDC园区内网出口设备替换为IDC园区内网出口系统,而每个园区内汇聚系统包括一个或者多个园区内汇聚设备,每个IDC园区内网出口系统包括一个或者多个IDC园区内网出口设备,当某园区内汇聚系统到IDC园区内网出口系统之间的链路端口发生故障时,那么该园区内汇聚系统中的所有设备和IDC园区内网出口系统中的所有设备均是第一网络设备。
在一些可实现方式中,服务器收到网络故障告警,如链路端口故障告警后,立即自动创建故障工单,该故障工单可以包括以下至少一项:发生网络故障的设备的名称、该设备的机房信息、网络故障告警的信息等,其中,该设备可以是上述第一网络设备。网络故障告警的信息可以包括:该故障的故障类型,例如,端口故障类型、带宽故障类型、设备板卡故障类型等,但不限于此。进一步地,服务器可以根据故障工单,如故障类型启动处理方案评估进程,从故障处理方案库中拉取到合适的处理方案后,以自动创建网络故障监控单。
在一些可实现方式中,服务器可以自动依据第一网络设备的名称确定第一网络设备对应的网络侧监控配置、业务侧监控配置和用户侧监控配置中的至少一项。例如:针对图3所示的网络架构,当某园区内汇聚设备到IDC园区内网出口设备之间的链路端口发生故障时,假设服务器采用的是网络侧监控系统,如全互联(fullmesh)监控系统,基于此,服务器确定监控层级包括城市(zone)间探测、园区网(campus)间探测和模块(module)间探测。同时,服务器还将依据第一网络设备的网络拓扑获取下联IDC的所属业务确定完整的监控配置,包括:网络类型,根据第一网络设备的机房信息,确定网络监控的源标识,即探测源,以及网络探测的目的标识,即探测目的等,详细的监控配置如图4所示。
在一些可实现方式中,网络故障处理过程或者网络故障处理操作一般包括:故障隔离、故障处理和故障隔离恢复三个动作,具体如图5所示。为了降低网络故障对业务的影响,当网络故障产生后,首先服务器对故障区域,进行隔离,确保故障区域不会对现网造成影响;然后进入真正的故障处理环节,在故障处理完成之后,通过隔离恢复操作,将处理好的区域并入现网。由于真正的故障处理环节是在隔离环境进行的,所以不会有网络影响。可能对现网造成影响的是故障隔离和故障隔离恢复两个动作,因此,观察窗口包括两个观察子窗口,一个是故障隔离对应的观察子窗口,另一个是故障隔离恢复对应的观察子窗口。此外,由于故障隔离和故障隔离恢复这两个动作操作耗时都很短,网络质量变化可能没那么快,因此需要在操作完成之后加上一段观察时间,避免质量异常不能被正常发现,因此,这两个动作分别对应的观察子窗口均可以包括一个观察时间。
在一些可实现方式中,观察窗口可基于故障处理方案灵活设置,本申请对此不做限制。
应理解的是,当到达观察窗口的起始时间时,服务器开始进行网络监控,以得到网络监控结果。例如:针对图3所示的网络架构,若某园区内汇聚设备到IDC园区内网出口设备之间的链路端口发生故障,且采取了网络故障处理操作,并且到达观察窗口的起始时间,则服务器开始进行网络监控,如果服务器采用的是网络侧监控系统,如全互联(fullmesh)监控系统,基于此,服务器可以在如图4所示的监控配置下进行网络监控,这时服务器需要监测是否存在监控配置下的网络存在异常,即是否出现了该监控配置对应的至少一个告警信息,如果出现了该监控配置对应的至少一个告警信息,那么服务器需要判断该至少一个告警信息是否与上述的网络故障处理操作有关。
应理解的是,上述网络故障处理操作是一种泛指概念,它可以被理解为网络故障处理过程,本申请对此不做限制。
进一步地,如上所述,服务器可以控制终端设备上的红绿灯点灯页面上的主灯颜色,以指示是否监控到所述监控配置对应的至少一个告警信息,若监控到所述至少一个告警信息,还用于指示所述至少一个告警信息与所述网络故障处理操作之间是否关联。
在一些可实现方式中,若主灯颜色为红色,则表示上述至少一个告警信息与网络故障处理操作之间存在关联;若主灯颜色为黄色,则表示上述至少一个告警信息与网络故障处理操作之间不存在关联,其中,上述至少一个告警信息是上述第一网络设备的监控配置对应的全部告警信息;若主灯颜色为绿色,则表示不存在上述至少一个告警信息。应理解的是,本申请对主灯颜色所表征的意义不做限制。
在一些可实现方式中,为了便于网络运营人员获知具体是哪一个监控项下的告警信息与上述网络故障处理操作之间存在关联,在本申请中,红绿灯点灯页面还包括:至少一个监控项各自对应的子灯;第一监控项对应的子灯颜色用于指示第一监控项中是否存在告警信息,若存在告警信息,还用于指示第一监控项中存在的告警信息与网络故障处理操作之间是否关联;其中,第一监控项是至少一个监控项中的任一个监控项。
在一些可实现方式中,为了便于网络运营人员获知具体是哪一个告警信息与上述网络故障处理操作之间存在关联,在本申请中,若监控到至少一个告警信息,则红绿灯点灯页面上还包括:至少一个告警信息各自对应的告警灯;第一告警信息对应的告警灯颜色用于指示第一告警信息与网络故障处理操作之间是否关联;其中,第一告警信息是至少一个告警信息中的任一个告警信息。
示例性地,图6为本申请实施例提供的主灯-子灯-告警灯的三层结构关系图,如图6所示,一个主灯下可以存在至少一个监控项分别对应的子灯,当某个监控项下有告警信息时,该监控项对应的子灯下还存在该告警信息对应的告警灯。
应理解的是,各个告警灯之间状态相互独立。若服务器没有监控到监控配置对应的告警信息,则红绿灯点灯页面上不存在告警灯。各个子灯之间状态也是相互独立的,其中,每个子灯的状态由其对应的监控项下的告警灯取或运算而得。即当某个监控项下存在至少一个告警灯颜色是红色时,那么该监控项对应的子灯就亮红灯;若该监控项下没有告警灯,那么该监控项对应的子灯就亮绿灯,否则,该监控项对应的子灯就亮黄灯。主灯只有一个,其状态由各子灯取或运算计算而得。即当有一个子灯亮红灯时,该主灯就亮红灯,当子灯均亮绿灯时,该主灯也亮绿灯,否则主灯就亮黄灯。
在一些可实现方式中,上述点灯模式是一种自动点灯模式,当服务器在自动点灯模式中存在未能准确点灯的情况时,人工点灯作为补充,即网络运营人员可以支持按照业务类型、区域信息、客户信息、网络故障监控单(Identity,ID)等多个维度进行点灯。
在一些可实现方式中,若主灯颜色为红色,表示上述监控配置对应的至少一个告警信息与上述网络故障处理操作之间存在关联,这时服务器可以触发网络故障处理操作的回退操作;例如:针对图3所示的网络架构,若某园区内汇聚设备到IDC园区内网出口设备之间的链路端口发生故障,并且进行了相应的网络故障处理操作,这时如果红绿灯点灯页面的主灯颜色为红色,那么服务器可以将该园区内汇聚设备到IDC园区内网出口设备之间的链路故障恢复到故障处理之前。若主灯颜色为黄色,则表示存在上述监控配置对应的至少一个告警信息,但是该至少一个告警信息与上述网络故障处理操作之间不存在关联,这时服务器可以先暂停上述网络故障处理操作,从而规避继续进行网络故障处理操作可能带来的叠加风险,这时可以通过人工介入来决策下一步操作。若主灯颜色为绿色,则表示不存在监控配置对应的至少一个告警信息,即网络故障处理过程正常,这时服务器可以继续执行网络故障处理操作。
综上,在本申请中,服务器可以自动获取网络故障处理操作关联的网络设备的监控配置,在进行网络故障处理操作时,可以根据该监控配置进行网络监控,并且可以根据监控结果可以控制红绿灯点灯页面上的主灯颜色,以提醒网络运营人员是否存在该监控配置对应的告警信息,如果监控到了该监控配置对应的告警信息,该主灯颜色还可以提醒网络运营人员该告警信息与网络故障处理操作是否关联。从而可以实现在故障处理过程中,对网络质量的监控,以及时发现网络异常情况。
进一步地,在本申请中,每个网络故障监控单都有一个主灯,网络运营人员只需要关注该主灯颜色即可确认是否存在上述监控配置对应的告警信息,并且可以确定告警信息与网络故障处理操作是否关联,这种一单一灯的方式,具有信息简洁,指令明确的效果。
应理解的是,服务器在判断上述至少一个告警信息与网络故障处理操作之间是否关联时,实际上,服务器判断第一告警信息与网络故障处理操作之间是否关联,第一告警信息是至少一个告警信息中的任一告警信息;若存在至少一个第一告警信息与网络故障处理操作之间关联,则确定至少一个告警信息与网络故障处理操作之间关联;若不存在第一告警信息与网络故障处理操作之间关联,则确定至少一个告警信息与网络故障处理操作之间不存在关联。也就是说,只要存在上述网络配置对应的一个或者多个告警信息与网络故障处理操作之间存在关联,则说明上述至少一个告警信息与网络故障处理操作之间存在关联,否则,说明上述至少一个告警信息与网络故障处理操作之间不存在关联。
在一些可实现方式中,针对上述第一告警信息,服务器可以判断其与网络故障处理操作是否存在时间关联、空间关联和内容关联。
在一些可实现方式中,服务器判断第一告警信息的产生时间是否在观察窗口内;若第一告警信息的产生时间未在观察窗口内,则确定第一告警信息与网络故障处理操作不存在时间关联;若第一告警信息的产生时间在观察窗口内,则判断在第一告警信息的产生时间之前的预设时间段内是否存在网络故障处理操作;若在第一告警信息的产生时间之前的预设时间段内存在网络故障处理操作,则确定第一告警信息与网络故障处理操作之间存在时间关联;若在第一告警信息的产生时间之前的预设时间段内未存在网络故障处理操作,则确定第一告警信息与网络故障处理操作之间不存在时间关联。
应理解的是,上述预设时间段可以根据实际情况设置,例如:可以设置为2分钟或者3分钟等,本申请对此不做限制。
示例性的,假设服务器在2021-08-23 13:26:15监控到上述网络配置对应的告警信息,即该告警信息的产生时间是2021-08-23 13:26:15,而观察窗口是2021-08-23 13:22:39至2021-08-23 13:47:40,因此,服务器确定该告警信息的产生时间在该观察窗口内,此外,假设服务器从该告警信息的产生时间往前2分钟内检测到网络故障处理操作,表示该第一告警信息与网络故障处理操作之间存在时间关联。
在一些可实现方式中,空间关联包括物理空间关联和逻辑空间关联,但不限于此。
在一些可实现方式中,服务器判断第一告警信息对应的地域信息与网络故障处理操作关联的第二网络设备的地域信息是否一致;若第一告警信息对应的地域信息与第二网络设备的地域信息不一致,则确定第一告警信息与网络故障处理操作之间不存在物理空间关联;若第一告警信息对应的地域信息与第二网络设备的地域信息一致,则确定第一告警信息与网络故障处理操作之间存在物理空间关联。
示例性地,假设服务器从第一告警信息中提取到的地域信息为“A市-园区网1”,同时从第二网络设备的名称中提取到地域信息也为“A市-园区网1”,则确定该告警信息与网络故障处理操作之间存在物理空间关联。
在一些可实现方式中,服务器判断第一告警信息对应的业务类型与网络故障处理操作关联的第二网络设备覆盖的业务类型是否一致;若第一告警信息对应的业务类型与第二网络设备覆盖的业务类型不一致,则确定第一告警信息与网络故障处理操作之间不存在逻辑空间关联;若第一告警信息对应的业务类型与第二网络设备覆盖的业务类型一致,则确定第一告警信息与网络故障处理操作之间存在逻辑空间关联。
示例性地,假设服务器从第一告警信息中提取到的业务类型字段是“B企业云”,而确定第二网络设备所属的IDC模块的业务类型也是“B企业云”,则确定第一告警信息与网络故障处理操作之间存在逻辑空间关联。
在一些可实现方式中,服务器判断第一告警信息与网络故障处理操作是否存在内容关联,包括:判断网络故障处理操作对应的命令是否是危险命令。
在一些可实现方式中,服务器可以将不会改变网络运行状态的命令标记为安全命令,将会改变网络运行状态的命令标记为危险命令。由于不同厂商、型号的设备命令不一致,且同一型号设备的不同操作系统(Operating System,OS)版本也存在命令变化的可能,因此,服务器按照“厂商+型号+OS版本”的配套组方式维护命令集。同时,为了准确识别出危险命令和安全命令,红绿灯针对命令行配置命令生效模式的不同,采取如下差异化的命令维护方式,但不限于此:
两阶段命令生效模式,包括:输入配置命令阶段和提交命令阶段;在这种模式下,只有提交命令才会使得配置生效。因此,这种情况下的危险命令就是提交命令,而除提交命令的其余命令则是安全命令。这些危险命令可以构成危险命令集。基于此,如果上述网络故障处理操作对应的命令与危险命令集进行匹配,如果匹配成功,则表示上述网络故障处理操作对应的命令为危险命令。相反,如果匹配失败,则表示上述网络故障处理操作对应的命令为安全命令,具体如图7所示。
立即命令生效模式:是传统的命令生效模式,即用户在输入命令行并按下回车键后立即生效的模式。在这种模式下,如查询类命令、进入终端设备上存在的视图,例如堆叠视图、物理接口视图等预设命令均属于安全命令,而这些安全命令构成了安全命令集。基于此,如果上述网络故障处理操作对应的命令与安全命令集进行匹配,如果匹配成功,则表示上述网络故障处理操作对应的命令为安全命令。相反,如果匹配失败,则表示上述网络故障处理操作对应的命令为危险命令,具体如图7所示。
下面通过一个具体示例对服务器进行的时间、空间、内容关联进行说明:
示例性的,在服务器确定了第一网络设备对应的监控配置之后,终端设备可以正式提交网络故障监控单。待观察窗口的开始时间到达后,进入网络故障处理实施环节,这时服务器立即启动网络异常扫描进程。假设服务器在2021-08-23 13:26:15监控到上述网络配置对应的告警信息,具体如下:
告警详细信息-ID:16296937513613471
告警信息:B市(网络设备,未知机房)于2021-08-23 13:26:15产生fullmesh秒级质量告警(1级),于2021-08-23 13:30:42恢复;负责人:未知;备份负责人:未知;
关联告警:父告警:无。子告警数量:0。
告警原因:
某企业云:B市1分钟内到A市区域网络质量存在丢包异常:
A市到B市丢包11.81%,告警阈值0.25%;
B市到A市丢包11.87%,告警阈值0.25%;
服务器确定该告警信息的产生时间是2021-08-23 13:26:15,而观察窗口是2021-08-23 13:22:39至2021-08-23 13:47:40,说明该告警信息的产生时间在该观察窗口内,同时服务器从该告警信息的产生时间往前2分钟内检测到网络故障处理操作,例如:图8为本申请实施例提供的一种界面示意图,如图8所示,网络运营人员可以查询告警信息的产生时间往前2分钟内是否存在网络故障处理操作,其中,这里的操作命令“us”表示“undoshutdown”。从图8可以看出,服务器从该告警信息的产生时间往前2分钟内检测到了网络故障处理操作。表示该告警信息与网络故障处理操作之间存在时间关联。根据上述告警详细信息可知,服务器从告警信息中提取到的地域信息为“A市”,同时从第二网络设备的名称中提取到地域信息也为“A市”,则确定该告警信息与网络故障处理操作之间存在物理空间关联。根据上述告警详细信息可知,服务器从该告警信息中提取到的业务类型字段是“某企业云”,而确定第二网络设备所属的IDC模块覆盖的业务类型也是“某企业云”,则确定该告警信息与网络故障处理操作之间存在逻辑空间关联。最后,结合图8可知,这些网络故障处理操作对应的命令都是危险命令,此时,服务器确定上述告警信息与网络故障处理操作之间存在内容关联。在这种情况下,显示如图9所示的红绿灯点灯页面,如图9所示,红绿灯点灯页面上显示的主灯颜色是红色,表示上述告警信息与网络故障处理操作之间存在关联关系。这种情况下,服务器可以于2021-08-23 13:26:27自动触发紧急操作程序(EmergencyOperating Procedure,EOP)回退流程,快速恢复业务。
进一步地,监控项“全互联秒级质量告警”为红色,表示该监控项下存在告警信息与上述网络故障处理操作之间存在关联关系。而监控项“全联网自研上云告警(0)”“云告警(0)”以及“人工点灯(0)”对应的子灯颜色均为绿色,表示这三个监控项下不存在告警信息与上述网络故障处理操作之间存在关联关系。而上述告警信息对应的告警灯颜色是红色,表示该告警信息与上述网络故障处理操作之间存在关联关系。
综上,在本申请中,如果服务器监控到上述监控配置对应的至少一个告警信息,则可以确定该至少一个告警信息与网络故障处理操作之间是否存在关联,这种智能关联方式2秒即可精准定位出产生异常的网络故障处理操作,有效缩短异常关联时间,降低业务影响时长,从而提高用户体验感。
为了快速提升监控覆盖率,服务器可以联合网络侧监控系统、业务侧监控系统和用户侧监控系统中的至少一项,全方位整合监控资源,确保对网络故障处理过程的监控达到百分百覆盖。基于此,服务器根据第一网络设备的名称确定第一网络设备对应的网络侧监控配置、业务侧监控配置和用户侧监控配置中的至少一项。也就是说,上述监控配置包括:网络侧监控配置、业务侧监控配置和用户侧监控配置中的至少一项。
在一些可实现方式中,服务器可以根据第一网络设备的名称确定第一网络设备的架构角色和网络拓扑;根据第一网络设备的架构角色确定第一网络设备的流量路径;根据第一网络设备的流量路径确定第一网络设备的监控项和监控层次;根据第一网络设备的网络拓扑确定第一网络设备的网络类型和位置信息;根据第一网络设备的位置信息确定网络监控的源标识和目的标识;其中,网络侧监控配置包括监控项、监控层次、网络类型、源标识和目的标识。
应理解的是,这种情况的网络侧监控配置一般是针对fullmesh监控网络系统而言的,如果是其他监控网络系统,那么监控配置会与这里的监控配置有所不同。另外,本申请对具体如何根据第一网络设备的名称确定出上述监控配置不做限制。
在一些可实现方式中,服务器可以先根据第一网络设备的网络拓扑确定第一网络设备的业务类型,再根据该业务类型确定网络类型,如图10所示的监控配置模型。
在一些可实现方式中,网络侧监控系统包括:大盘监控系统和个性化监控系统,但不限于此。
应理解的是,对于大盘监控系统而言,上述监控项指的是该大盘监控系统下的监控项,例如:监控项可以是全互联秒级质量告警。对于个性化监控系统而言,上述监控项指的是该个性化监控系统下的监控项,即自定义监控项。
应理解的是,大盘监控系统不仅包括针对上述网络侧监控配置对应的探测任务,还可以包括:其他探测任务。而个性化监控系统是专门用于实现上述网络侧监控配置对应的探测任务的。
在一些可实现方式中,服务器可以判断在进行网络故障处理操作之前是否存在网络质量异常,得到判断结果;根据判断结果确定网络侧监控配置对应的探测任务和告警规则。
在一些可实现方式中,若得到的判断结果是网络故障处理操作之前不存在网络质量异常,则服务器判断大盘监控系统是否覆盖流量路径;若大盘监控系统覆盖了上述流量路径,则服务器需要预测上述网络故障处理操作是否会引起网络质量异常;若预测该网络故障处理操作不会引起网络质量异常,则服务器可以复用大盘监控系统中的上述网络侧监控配置对应的探测任务和告警规则;若预测网络故障处理操作会引起网络质量异常,则服务器复用大盘监控系统中的网络侧监控配置对应的探测任务,且建立网络侧监控配置对应的第一告警规则;若大盘监控系统未覆盖流量路径,则服务器预测网络故障处理操作是否会引起网络质量异常;若预测网络故障处理操作不会引起网络质量异常,则服务器建立网络侧监控配置对应的探测任务以及第二告警规则;若预测网络故障处理操作会引起网络质量异常,则服务器建立网络侧监控配置对应的探测任务以及第一告警规则。
在一些可实现方式中,第一告警规则包括如下信息,但不限于此:若网络故障处理操作对探测任务中的任一区域的网络质量影响区域、网络质量影响时长和网络质量影响程度中的至少一项超过对应的预设阈值,则产生网络侧监控配置对应的告警信息。
应理解的是,在本申请中,探测任务中的任一区域包括:物理区域和逻辑区域。例如:探测任务是网络故障处理操作的影响区域,包括:C企业云(即逻辑区域)和A市-园区网1/A市-园区网2(即物理区域)。
应理解的是,在本申请中,网络故障处理操作对探测任务中的任一区域的网络质量影响区域指的网络故障处理操作对探测任务中的任一区域带来网络质量影响的区域,该区域包括逻辑区域和物理区域。例如:网络质量影响区域可以是C企业云和A市-园区网2。
应理解的是,在本申请中,当网络质量影响物理区域和网络质量影响逻辑区域中的至少一者超过对应的预设阈值时,可以称网络质量影响区域超过对应的预设阈值。
应理解的是,在本申请中,网络故障处理操作对探测任务中的任一区域的网络质量影响时长指的网络故障处理操作对探测任务中的任一区域带来网络质量影响的影响时长,该影响时长可以是连续影响时长或者是多个间断影响时长的累计时长,本申请对此不做限制。
在一些可实现方式中,上述网络质量影响程度可以涉及以下至少一个影响指标,但不限于此:丢包率、不可达率、延时等。
在一些可实现方式中,基于上述任一影响指标的影响程度可以是以下任一项,但不限于此:相对值、绝对值、相对值和绝对值。例如:丢包率对应的影响程度可以是相对值、不可达率对应的影响程度是绝对值、延时对应的影响程度是相对值和绝对值,比如:当延时范围小于10秒时,该延时对应的影响程度是绝对值,当延时范围大于或等于10秒时,该延时对应的影响程度是相对值。
在一些可实现方式中,上述网络质量影响区域、网络质量影响时长和网络质量影响程度分别对应的预设阈值可以是经过实验得到的,但不限于此。
下面通过示例对上述第一告警规则进行说明:
示例性地,假设探测任务包括的网络故障处理操作影响区域是:C企业云(即逻辑区域)和A市-园区网1/A市-园区网2(即物理区域);而网络质量影响区域对应的预设阈值是:C企业云、A市-园区网1;网络质量影响时长对应的预设阈值是:30s;网络质量影响程度对应的预设阈值是丢包5%。若网络故障处理操作实际影响情况是:网络质量影响区域C企业云、A市-园区网3,网络质量影响程度是丢包5%、网络质量影响时长60s,由于A市-园区网3未在探测任务包括的网络故障处理操作影响区域内,因此服务器不产生告警。若网络故障处理操作实际影响情况是:网络质量影响区域C企业云、A市-园区网2,网络质量影响程度是丢包2%、网络质量影响时长20s,由于A市-园区网2在探测任务包括的网络故障处理操作影响区域内,且它与网络故障处理操作影响区域不同,即其超过了它所对应的预设阈值A市-园区网1,这时服务器需要产生告警。
在一些可实现方式中,第二告警规则包括如下信息,但不限于此:若网络故障处理操作对探测任务中的任一区域的网络质量影响时长和网络质量影响程度超过对应的预设阈值,则产生网络侧监控配置对应的告警信息。
应理解的是,若大盘监控系统未覆盖上述流量路径,且预测网络故障处理操作不会引起网络质量异常,则服务器可以参考大盘监控系统中建立告警规则的方式来建立第二告警规则。例如:网络质量影响时长对应的预设阈值可以设置为20s,而假设网络质量影响程度通过丢包率表示,那么其对应的预设阈值可以设置为丢包率2%。
在一些可实现方式中,若服务器得到的上述判断结果是网络故障处理操作之前存在网络质量异常,则服务器判断大盘监控系统是否覆盖流量路径;若大盘监控系统覆盖流量路径,则复用大盘监控系统中的网络侧监控配置对应的探测任务,且建立网络侧监控配置对应的第三告警规则;若大盘监控系统未覆盖流量路径则建立网络侧监控配置对应的探测任务以及第三告警规则。
在一些可实现方式中,第三告警规则包括:若网络故障处理操作的网络质量影响区域和网络质量影响程度中的至少一项超过对应的预设阈值,且网络故障处理操作的网络质量影响时长超过对应的预设阈值,则产生网络侧监控配置对应的告警信息。
在一些可实现方式中,网络质量影响区域对应的预设阈值与网络故障处理操作之前所存在的网络质量异常关联的影响区域关联。例如:网络质量影响区域对应的预设阈值是网络故障处理操作之前所存在的网络质量异常关联的影响区域,但不限于此。
在一些可实现方式中,网络质量影响程度对应的预设阈值与网络故障处理操作之前所存在的网络质量异常关联的网络质量影响程度关联。例如:网络质量影响程度对应的预设阈值是网络故障处理操作之前所存在的网络质量异常关联的网络质量影响程度,或者,网络质量影响程度对应的预设阈值是网络故障处理操作之前所存在的网络质量异常关联的网络质量影响程度的预设百分比,但不限于此。
在一些可实现方式中,网络故障处理操作的网络质量影响时长是参考大盘监控系统得到的,但不限于此。
示例性地,假设网络故障导致A市到B市、C市的丢包率达到10%。则网络质量影响区域对应的预设阈值设置为“A市到B市、C市”,网络质量影响程度对应的预设阈值设置为“丢包率10%”。若在故障处理过程中,网络质量影响区域变成A市到B市、C市和D市,且网络故障处理操作的网络质量影响时长超过对应预设阈值20s,说明当前影响已超出了网络故障处理操作前的影响范围,网络质量存在恶化,服务器需要自动生成告警。或者,若网络质量影响区域不变,但是丢包率达到20%,网络故障处理操作的网络质量影响时长超过对应预设阈值20s,也说明网络质量存在恶化,服务器需要自动生成告警。
在一些可实现方式中,服务器可以根据第一网络设备的名称确定第一网络设备对应的业务监控名称和地域信息;其中,业务侧监控配置包括业务监控名称和地域信息。例如:确定的业务监控名称是某游戏在线告警,地域信息是A市-园区网1,而服务器可以从业务侧监控系统查询是否存在该A市-园区网1的某游戏在线告警,如果存在,说明业务侧监控系统存在第一网络设备对应的网络配置下的告警信息。
在一些可实现方式中,如果服务器结合业务侧监控系统进行监控,那么服务器可以自动开启该第一网络设备涉及的业务监控名称对应的告警的推送路径,确保业务侧监控系统可以将该告警推送至服务器。
在一些可实现方式中,服务器可以根据第一网络设备的名称确定第一网络设备对应的用户信息;其中,用户侧监控配置包括用户信息。例如:服务器可以根据第一网络设备的名称确定该第一网络设备上涉及的用户信息,而服务器可以从用户侧监控系统查询是否存在该用户信息的报障信息,如果存在,说明用户侧监控系统存在第一网络设备对应的网络配置下的告警信息。
在一些可实现方式中,如果服务器结合用户侧监控系统进行监控,那么服务器可以自动开启该第一网络设备涉及的用户信息对应的告警的推送路径,确保用户侧监控系统可以将该告警推送至服务器。
在本申请中,服务器可以联合网络侧监控系统、业务侧监控系统和用户侧监控系统中的至少一项,全方位整合监控资源,确保对网络故障处理过程的监控实现百分百覆盖,进而可以快速提升监控覆盖率。
此外,服务器可以根据大盘网络监控系统是否覆盖到上述流量路径以及预测网络故障处理操作是否会引起网络质量异常来复用或者建立告警规则,从而提高网络监控地灵活性。
图11为本申请实施例提供的一种服务器的示意图,该服务器可以是图1中的服务器120,但不限于此,如图11所述,该服务器包括:生成模块1110、第一确定模块1120、处理模块1130和发送模块1140,其中,生成模块1110用于生成网络故障监控单,所述网络故障监控单包括:第一网络设备的名称和网络故障处理操作的观察窗口,所述第一网络设备是所述网络故障处理操作关联的网络设备;第一确定模块1120用于根据所述第一网络设备的名称确定所述第一网络设备对应的监控配置;处理模块1130用于执行所述网络故障处理操作,并在所述观察窗口内根据所述监控配置进行网络监控,以得到网络监控结果;发送模块1140用于根据所述网络监控结果向所述终端设备发送控制信息,所述控制信息用于控制所述终端设备上的红绿灯点灯页面上的主灯颜色,以指示是否监控到所述监控配置对应的至少一个告警信息,若监控到所述至少一个告警信息,还用于指示所述至少一个告警信息与所述网络故障处理操作之间是否关联。
在一些可实现方式中,服务器还包括:第一判断模块1150,用于若监控到至少一个告警信息,则判断至少一个告警信息与网络故障处理操作之间是否关联。
在一些可实现方式中,第一判断模块1150具体用于:判断第一告警信息与网络故障处理操作之间是否关联,第一告警信息是至少一个告警信息中的任一告警信息;若存在至少一个第一告警信息与网络故障处理操作之间关联,则确定至少一个告警信息与网络故障处理操作之间关联;若不存在第一告警信息与网络故障处理操作之间关联,则确定至少一个告警信息与网络故障处理操作之间不存在关联。
在一些可实现方式中,第一判断模块1150具体用于:判断第一告警信息与网络故障处理操作是否存在时间关联、空间关联和内容关联。
在一些可实现方式中,第一判断模块1150具体用于:判断第一告警信息的产生时间是否在观察窗口内;若第一告警信息的产生时间未在观察窗口内,则确定第一告警信息与网络故障处理操作不存在时间关联;若第一告警信息的产生时间在观察窗口内,则判断在第一告警信息的产生时间之前的预设时间段内是否存在网络故障处理操作;若在第一告警信息的产生时间之前的预设时间段内存在网络故障处理操作,则确定第一告警信息与网络故障处理操作之间存在时间关联;若在第一告警信息的产生时间之前的预设时间段内未存在网络故障处理操作,则确定第一告警信息与网络故障处理操作之间不存在时间关联。
在一些可实现方式中,空间关联包括物理空间关联和逻辑空间关联。
在一些可实现方式中,第一判断模块1150具体用于:判断第一告警信息对应的地域信息与网络故障处理操作关联的第二网络设备的地域信息是否一致;若第一告警信息对应的地域信息与第二网络设备的地域信息不一致,则确定第一告警信息与网络故障处理操作之间不存在物理空间关联;若第一告警信息对应的地域信息与第二网络设备的地域信息一致,则确定第一告警信息与网络故障处理操作之间存在物理空间关联。
在一些可实现方式中,第一判断模块1150具体用于:判断第一告警信息对应的业务类型与网络故障处理操作关联的第二网络设备的业务类型是否一致;若第一告警信息对应的业务类型与第二网络设备的业务类型不一致,则确定第一告警信息与网络故障处理操作之间不存在逻辑空间关联;若第一告警信息对应的业务类型与第二网络设备的业务类型一致,则确定第一告警信息与网络故障处理操作之间存在逻辑空间关联。
在一些可实现方式中,第一判断模块1150具体用于:判断网络故障处理操作对应的命令是否是危险命令。
在一些可实现方式中,第一判断模块1150具体用于:确定网络故障处理操作关联的第二网络设备的命令生效模式;根据命令生效模式判断网络故障处理操作对应的命令是否是危险命令。
在一些可实现方式中,第一判断模块1150具体用于:若命令生效模式是两阶段命令生效模式,且网络故障处理操作是提交命令,则确定网络故障处理操作对应的是危险命令;若命令生效模式是立即命令生效模式,且网络故障处理操作是预设命令,则确定网络故障处理操作对应的命令是安全命令,否则,确定网络故障处理操作对应的命令是危险命令;其中,两阶段命令生效模式包括:输入配置命令阶段和提交命令阶段;立即命令生效模式是用户在输入命令行并按下回车键后立即生效的模式。
在一些可实现方式中,第一确定模块1120具体用于:根据第一网络设备的名称确定第一网络设备对应的网络侧监控配置、业务侧监控配置和用户侧监控配置中的至少一项。
在一些可实现方式中,第一确定模块1120具体用于:根据第一网络设备的名称确定第一网络设备的架构角色和网络拓扑;根据第一网络设备的架构角色确定第一网络设备的流量路径;根据第一网络设备的流量路径确定第一网络设备的监控项和监控层次;根据第一网络设备的网络拓扑确定第一网络设备的网络类型和位置信息;根据第一网络设备的位置信息确定网络监控的源标识和目的标识;其中,网络侧监控配置包括监控项、监控层次、网络类型、源标识和目的标识。
在一些可实现方式中,若监控配置包括:网络侧监控配置,则服务器还包括:第二判断模块1160和第二确定模块1170,其中,第二判断模块1160用于判断在进行所述网络故障处理操作之前是否存在网络质量异常,得到判断结果;第二确定模块1170用于根据所述判断结果确定所述网络侧监控配置对应的探测任务和告警规则。
在一些可实现方式中,第二确定模块1170具体用于:若判断结果是网络故障处理操作之前不存在网络质量异常,则判断大盘监控系统是否覆盖流量路径;若大盘监控系统覆盖流量路径,则预测网络故障处理操作是否会引起网络质量异常;若预测网络故障处理操作不会引起网络质量异常,则复用大盘监控系统中的网络侧监控配置对应的探测任务和告警规则;若预测网络故障处理操作会引起网络质量异常,则复用大盘监控系统中的网络侧监控配置对应的探测任务,且建立网络侧监控配置对应的第一告警规则;若大盘监控系统未覆盖流量路径,则预测网络故障处理操作是否会引起网络质量异常;若预测网络故障处理操作不会引起网络质量异常,则建立网络侧监控配置对应的探测任务以及第二告警规则;若预测网络故障处理操作会引起网络质量异常,则建立网络侧监控配置对应的探测任务以及第一告警规则。
在一些可实现方式中,第一告警规则包括:若网络故障处理操作对探测任务中的任一区域的网络质量影响区域、网络质量影响时长和网络质量影响程度中的至少一项超过对应的预设阈值,则产生网络侧监控配置对应的告警信息。
在一些可实现方式中,第二告警规则包括:若网络故障处理操作对探测任务中的任一区域的网络质量影响时长和网络质量影响程度超过对应的预设阈值,则产生网络侧监控配置对应的告警信息。
在一些可实现方式中,第二确定模块1170具体用于:若判断结果是网络故障处理操作之前存在网络质量异常,则判断大盘监控系统是否覆盖流量路径以及预测网络故障处理操作是否会引起网络质量异常;若大盘监控系统覆盖流量路径,则复用大盘监控系统中的网络侧监控配置对应的探测任务,且建立网络侧监控配置对应的第三告警规则;若大盘监控系统未覆盖流量路径则建立网络侧监控配置对应的探测任务以及第三告警规则。
在一些可实现方式中,第三告警规则包括:若网络故障处理操作的网络质量影响区域和网络质量影响程度中的至少一项超过对应的预设阈值,且网络故障处理操作的网络质量影响时长超过对应的预设阈值,则产生网络侧监控配置对应的告警信息。
在一些可实现方式中,网络质量影响区域对应的预设阈值与网络故障处理操作之前所存在的网络质量异常关联的影响区域关联。
在一些可实现方式中,网络质量影响程度对应的预设阈值与网络故障处理操作之前所存在的网络质量异常关联的网络质量影响程度关联。
在一些可实现方式中,网络故障处理操作的网络质量影响时长是参考大盘监控系统得到的。
在一些可实现方式中,第一确定模块1120具体用于:根据第一网络设备的名称确定第一网络设备对应的业务监控名称和地域信息;其中,业务侧监控配置包括业务监控名称和地域信息。
在一些可实现方式中,第一确定模块1120具体用于:根据第一网络设备的名称确定第一网络设备对应的用户信息;其中,用户侧监控配置包括用户信息。
在一些可实现方式中,红绿灯点灯页面还包括:至少一个监控项各自对应的子灯;第一监控项对应的子灯颜色用于指示第一监控项中是否存在告警信息,若存在告警信息,还用于指示第一监控项中存在的告警信息与网络故障处理操作之间是否关联;其中,第一监控项是至少一个监控项中的任一个监控项。
在一些可实现方式中,若监控到至少一个告警信息,则红绿灯点灯页面上还包括:至少一个告警信息各自对应的告警灯;第一告警信息对应的告警灯颜色用于指示第一告警信息与网络故障处理操作之间是否关联;其中,第一告警信息是至少一个告警信息中的任一个告警信息。
在一些可实现方式中,若主灯颜色为红色,则表示至少一个告警信息与网络故障处理操作之间存在关联;若主灯颜色为黄色,则表示至少一个告警信息与网络故障处理操作之间不存在关联;若主灯颜色为绿色,则表示不存在至少一个告警信息。
在一些可实现方式中,处理模块1130还用于:若主灯颜色为红色,则触发网络故障处理操作的回退操作;若主灯颜色为黄色,则暂停网络故障处理操作;若主灯颜色为绿色,则继续执行网络故障处理操作。
应理解的是,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图11所示的服务器可以执行图2服务器侧对应的方法实施例,并且服务器中的各个模块的前述和其它操作和/或功能分别为了实现图2中服务器侧的各个方法中的相应流程,为了简洁,在此不再赘述。
上文中结合附图从功能模块的角度描述了本申请实施例的服务器。应理解,该功能模块可以通过硬件形式实现,也可以通过软件形式的指令实现,还可以通过硬件和软件模块组合实现。具体地,本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成,结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。在一些可实现方式中,软件模块可以位于随机存储器,闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法实施例中的步骤。
图12为本申请实施例提供的一种终端设备的示意图,该终端设备可以是图1中的终端设备110,但不限于此,如图12,该终端设备包括:显示模块1210,用于红绿灯点灯页面;其中,红绿灯点灯页面包括:主灯,主灯颜色用于指示是否监控到监控配置对应的至少一个告警信息,若监控到至少一个告警信息,以指示至少一个告警信息与网络故障处理操作之间是否关联;监控配置是第一网络设备对应的监控配置,第一网络设备是网络故障处理操作关联的网络设备。
在一些可实现方式中,红绿灯点灯页面还包括:至少一个监控项各自对应的子灯;第一监控项对应的子灯颜色用于指示第一监控项中是否存在告警信息,若存在告警信息,还用于指示第一监控项中存在的告警信息与网络故障处理操作之间是否关联;其中,第一监控项是至少一个监控项中的任一个监控项。
在一些可实现方式中,若监控到至少一个告警信息,则红绿灯点灯页面上还包括:至少一个告警信息各自对应的告警灯;第一告警信息对应的告警灯颜色用于指示第一告警信息与网络故障处理操作之间是否关联;其中,第一告警信息是至少一个告警信息中的任一个告警信息。
应理解的是,装置实施例与方法实施例可以相互对应,类似的描述可以参照方法实施例。为避免重复,此处不再赘述。具体地,图11所示的终端设备可以执行图2终端设备侧对应的方法实施例,并且终端设备中的各个模块的前述和其它操作和/或功能分别为了实现图2中终端设备侧的各个方法中的相应流程,为了简洁,在此不再赘述。
上文中结合附图从功能模块的角度描述了本申请实施例的终端设备。应理解,该功能模块可以通过硬件形式实现,也可以通过软件形式的指令实现,还可以通过硬件和软件模块组合实现。具体地,本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成,结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。在一些可实现方式中,软件模块可以位于随机存储器,闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法实施例中的步骤。
图13是本申请实施例提供的电子设备1300的示意性框图。该电子设备可以是图1中的服务器120,也可以是图1中的终端设备110,但不限于此,如图13所示,该电子设备1300可包括:
存储器1310和处理器1320,该存储器1310用于存储计算机程序,并将该程序代码传输给该处理器1320。换言之,该处理器1320可以从存储器1310中调用并运行计算机程序,以实现本申请实施例中的方法。
例如,该处理器1320可用于根据该计算机程序中的指令执行上述方法实施例。
在本申请的一些实施例中,该处理器1320可以包括但不限于:
通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。
在本申请的一些实施例中,该存储器1310包括但不限于:
易失性存储器和/或非易失性存储器。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DR RAM)。
在本申请的一些实施例中,该计算机程序可以被分割成一个或多个模块,该一个或者多个模块被存储在该存储器1310中,并由该处理器1320执行,以完成本申请提供的方法。该一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述该计算机程序在该电子设备中的执行过程。
如图13所示,该电子设备还可包括:
收发器1330,该收发器1330可连接至该处理器1320或存储器1310。
其中,处理器1320可以控制该收发器1330与其他设备进行通信,具体地,可以向其他设备发送信息或数据,或接收其他设备发送的信息或数据。收发器1330可以包括发射机和接收机。收发器1330还可以进一步包括天线,天线的数量可以为一个或多个。
应当理解,该电子设备中的各个组件通过总线系统相连,其中,总线系统除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。
本申请还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。或者说,本申请实施例还提供一种包含指令的计算机程序产品,该指令被计算机执行时使得计算机执行上述方法实施例的方法。
当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。例如,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
以上该,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以该权利要求的保护范围为准。

Claims (20)

1.一种监控网络故障处理过程的方法,其特征在于,包括:
生成网络故障监控单,所述网络故障监控单包括:第一网络设备的名称和观察窗口,所述第一网络设备是所述网络故障处理操作关联的网络设备;
根据所述第一网络设备的名称确定所述第一网络设备对应的监控配置;
执行所述网络故障处理操作,并在所述观察窗口内根据所述监控配置进行网络监控,以得到网络监控结果;
根据所述网络监控结果向终端设备发送控制信息,所述控制信息用于控制所述终端设备上的红绿灯点灯页面上的主灯颜色,以指示是否监控到所述监控配置对应的至少一个告警信息,若监控到所述至少一个告警信息,还用于指示所述至少一个告警信息与所述网络故障处理操作之间是否关联。
2.根据权利要求1所述的方法,其特征在于,还包括:
若监控到所述至少一个告警信息,则判断所述至少一个告警信息与所述网络故障处理操作之间是否关联;
其中,所述判断所述至少一个告警信息与所述网络故障处理操作之间是否关联,包括:
判断第一告警信息与所述网络故障处理操作之间是否关联,所述第一告警信息是所述至少一个告警信息中的任一告警信息;
若存在至少一个所述第一告警信息与所述网络故障处理操作之间关联,则确定所述至少一个告警信息与所述网络故障处理操作之间关联;
若不存在所述第一告警信息与所述网络故障处理操作之间关联,则确定所述至少一个告警信息与所述网络故障处理操作之间不存在关联。
3.根据权利要求2所述的方法,其特征在于,所述判断第一告警信息与所述网络故障处理操作是否关联,包括:
判断所述第一告警信息与所述网络故障处理操作是否存在时间关联、空间关联和内容关联。
4.根据权利要求3所述的方法,其特征在于,判断所述第一告警信息与所述网络故障处理操作是否存在时间关联,包括:
判断所述第一告警信息的产生时间是否在所述观察窗口内;
若所述第一告警信息的产生时间未在所述观察窗口内,则确定所述第一告警信息与所述网络故障处理操作不存在时间关联;
若所述第一告警信息的产生时间在所述观察窗口内,则判断在所述第一告警信息的产生时间之前的预设时间段内是否存在所述网络故障处理操作;
若在所述第一告警信息的产生时间之前的预设时间段内存在所述网络故障处理操作,则确定所述第一告警信息与所述网络故障处理操作之间存在时间关联;
若在所述第一告警信息的产生时间之前的预设时间段内未存在所述网络故障处理操作,则确定所述第一告警信息与所述网络故障处理操作之间不存在时间关联。
5.根据权利要求3所述的方法,其特征在于,所述空间关联包括物理空间关联和逻辑空间关联。
6.根据权利要求5所述的方法,其特征在于,判断所述第一告警信息与所述网络故障处理操作是否存在物理空间关联,包括:
判断所述第一告警信息对应的地域信息与所述网络故障处理操作关联的第二网络设备的地域信息是否一致;
若所述第一告警信息对应的地域信息与所述第二网络设备的地域信息不一致,则确定所述第一告警信息与所述网络故障处理操作之间不存在物理空间关联;
若所述第一告警信息对应的地域信息与所述第二网络设备的地域信息一致,则确定所述第一告警信息与所述网络故障处理操作之间存在物理空间关联。
7.根据权利要求5所述的方法,其特征在于,判断所述第一告警信息与所述网络故障处理操作是否存在逻辑空间关联,包括:
判断所述第一告警信息对应的业务类型与所述网络故障处理操作关联的第二网络设备覆盖的业务类型是否一致;
若所述第一告警信息对应的业务类型与所述第二网络设备覆盖的业务类型不一致,则确定所述第一告警信息与所述网络故障处理操作之间不存在逻辑空间关联;
若所述第一告警信息对应的业务类型与所述第二网络设备覆盖的业务类型一致,则确定所述第一告警信息与所述网络故障处理操作之间存在逻辑空间关联。
8.根据权利要求3所述的方法,其特征在于,判断所述第一告警信息与所述网络故障处理操作是否存在内容关联,包括:
确定所述网络故障处理操作关联的第二网络设备的命令生效模式;
根据所述命令生效模式判断所述网络故障处理操作对应的命令是否是危险命令。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述根据所述第一网络设备的名称确定所述第一网络设备对应的监控配置,包括:
根据所述第一网络设备的名称确定所述第一网络设备对应的网络侧监控配置、业务侧监控配置和用户侧监控配置中的至少一项。
10.根据权利要求9所述的方法,其特征在于,若所述监控配置包括:所述网络侧监控配置,则所述方法还包括:
判断在进行所述网络故障处理操作之前是否存在网络质量异常,得到判断结果;
根据所述判断结果确定所述网络侧监控配置对应的探测任务和告警规则。
11.根据权利要求10所述的方法,其特征在于,所述根据所述判断结果确定所述网络侧监控配置对应的探测任务和告警规则,包括:
若所述判断结果是所述网络故障处理操作之前不存在网络质量异常,则判断大盘监控系统是否覆盖所述第一网络设备的流量路径;
若所述大盘监控系统覆盖所述流量路径,则预测所述网络故障处理操作是否会引起网络质量异常;
若预测所述网络故障处理操作不会引起网络质量异常,则复用所述大盘监控系统中的所述网络侧监控配置对应的探测任务和告警规则;
若预测所述网络故障处理操作会引起网络质量异常,则复用所述大盘监控系统中的所述网络侧监控配置对应的探测任务,且建立所述网络侧监控配置对应的第一告警规则;
若所述大盘监控系统未覆盖所述流量路径,则预测所述网络故障处理操作是否会引起网络质量异常;
若预测所述网络故障处理操作不会引起网络质量异常,则建立所述网络侧监控配置对应的探测任务以及第二告警规则;
若预测所述网络故障处理操作会引起网络质量异常,则建立所述网络侧监控配置对应的探测任务以及所述第一告警规则。
12.根据权利要求11所述的方法,其特征在于,所述第一告警规则包括:若所述网络故障处理操作对所述探测任务中的任一区域的网络质量影响区域、网络质量影响时长和网络质量影响程度中的至少一项超过对应的预设阈值,则产生所述网络侧监控配置对应的告警信息;
所述第二告警规则包括:若所述网络故障处理操作对所述探测任务中的任一区域的网络质量影响时长和网络质量影响程度超过对应的预设阈值,则产生所述网络侧监控配置对应的告警信息。
13.根据权利要求10所述的方法,其特征在于,所述根据所述判断结果确定所述网络侧监控配置对应的探测任务和告警规则,包括:
若所述判断结果是所述网络故障处理操作之前存在网络质量异常,则判断大盘监控系统是否覆盖所述第一网络设备的流量路径;
若所述大盘监控系统覆盖所述流量路径,则复用所述大盘监控系统中的所述网络侧监控配置对应的探测任务,且建立所述网络侧监控配置对应的第三告警规则;
若所述大盘监控系统未覆盖所述流量路径,则建立所述网络侧监控配置对应的探测任务以及所述第三告警规则。
14.根据权利要求13所述的方法,其特征在于,所述第三告警规则包括:若所述网络故障处理操作的网络质量影响区域和网络质量影响程度中的至少一项超过对应的预设阈值,且所述网络故障处理操作的网络质量影响时长超过对应的预设阈值,则产生所述网络侧监控配置对应的告警信息。
15.根据权利要求1-8任一项所述的方法,其特征在于,所述红绿灯点灯页面还包括:至少一个监控项各自对应的子灯;
第一监控项对应的子灯颜色用于指示所述第一监控项中是否存在告警信息,若存在告警信息,还用于指示所述第一监控项中存在的告警信息与所述网络故障处理操作之间是否关联;
其中,所述第一监控项是所述至少一个监控项中的任一个监控项。
16.根据权利要求1-8任一项所述的方法,其特征在于,若监控到所述至少一个告警信息,则所述红绿灯点灯页面上还包括:所述至少一个告警信息各自对应的告警灯;
第一告警信息对应的告警灯颜色用于指示所述第一告警信息与所述网络故障处理操作之间是否关联;
其中,所述第一告警信息是所述至少一个告警信息中的任一个告警信息。
17.一种监控网络故障处理过程的方法,其特征在于,包括:
显示红绿灯点灯页面;
其中,所述红绿灯点灯页面包括:主灯,主灯颜色用于指示是否监控到监控配置对应的至少一个告警信息,若监控到所述至少一个告警信息,以指示所述至少一个告警信息与网络故障处理操作之间是否关联;
所述监控配置是第一网络设备对应的监控配置,所述第一网络设备是所述网络故障处理操作关联的网络设备。
18.一种服务器,其特征在于,包括:
生成模块,用于生成网络故障监控单,所述网络故障监控单包括:第一网络设备的名称和网络故障处理操作的观察窗口,所述第一网络设备是所述网络故障处理操作关联的网络设备;
第一确定模块,用于根据所述第一网络设备的名称确定所述第一网络设备对应的监控配置;
处理模块,用于执行所述网络故障处理操作,并在所述观察窗口内根据所述监控配置进行网络监控,以得到网络监控结果;
发送模块,用于根据所述网络监控结果向终端设备发送控制信息,所述控制信息用于控制所述终端设备上的红绿灯点灯页面上的主灯颜色,以指示是否监控到所述监控配置对应的至少一个告警信息,若监控到所述至少一个告警信息,还用于指示所述至少一个告警信息与所述网络故障处理操作之间是否关联。
19.一种终端设备,其特征在于,包括:
显示模块,用于红绿灯点灯页面;
其中,所述红绿灯点灯页面包括:主灯,主灯颜色用于指示是否监控到监控配置对应的至少一个告警信息,若监控到所述至少一个告警信息,以指示所述至少一个告警信息与网络故障处理操作之间是否关联;
所述监控配置是第一网络设备对应的监控配置,所述第一网络设备是所述网络故障处理操作关联的网络设备。
20.一种电子设备,其特征在于,包括:
处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,以执行权利要求1至17中任一项所述的方法。
CN202111222647.5A 2021-10-20 2021-10-20 监控网络故障处理过程的方法、装置及设备 Pending CN116016244A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111222647.5A CN116016244A (zh) 2021-10-20 2021-10-20 监控网络故障处理过程的方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111222647.5A CN116016244A (zh) 2021-10-20 2021-10-20 监控网络故障处理过程的方法、装置及设备

Publications (1)

Publication Number Publication Date
CN116016244A true CN116016244A (zh) 2023-04-25

Family

ID=86032257

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111222647.5A Pending CN116016244A (zh) 2021-10-20 2021-10-20 监控网络故障处理过程的方法、装置及设备

Country Status (1)

Country Link
CN (1) CN116016244A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117459188A (zh) * 2023-12-25 2024-01-26 吉林省吉能电力通信有限公司 基于北斗通信技术的电力北斗通信系统及通信方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117459188A (zh) * 2023-12-25 2024-01-26 吉林省吉能电力通信有限公司 基于北斗通信技术的电力北斗通信系统及通信方法
CN117459188B (zh) * 2023-12-25 2024-04-05 吉林省吉能电力通信有限公司 基于北斗通信技术的电力北斗通信系统及通信方法

Similar Documents

Publication Publication Date Title
EP3048759B1 (en) Fault diagnosis method, device and system
US9684574B2 (en) Method and system for implementing remote disaster recovery switching of service delivery platform
CN109040119B (zh) 一种智能楼宇网络的漏洞检测方法和装置
CN104065526B (zh) 一种服务器故障报警的方法和装置
CN107800783B (zh) 远程监控服务器的方法及装置
CN101034976B (zh) Ip连接安全系统中的入侵检测设备
CN105450472A (zh) 一种自动获取服务器物理部件状态的方法及装置
CN112615858B (zh) 物联网设备监控方法、装置与系统
CN103378991A (zh) 一种在线服务异常监测方法及其监测系统
CN105630647A (zh) 一种设备检测方法及检测设备
CN116016244A (zh) 监控网络故障处理过程的方法、装置及设备
CN113852506A (zh) 一种故障处理方法、装置及电子设备和存储介质
CN103870349B (zh) 用于数据处理系统的配置管理装置及方法
CN113162815B (zh) 一种流量切换方法、系统、设备及介质
CN114625074A (zh) 一种用于火电机组dcs系统的安全防护系统及方法
EP2801961B1 (en) System and method for using customer data networks for alarm systems
CN108494858A (zh) 一种车窗天窗监控系统及方法
KR101343693B1 (ko) 네트워크 보안시스템 및 그 처리방법
WO2017107669A1 (zh) 基站近端维护端口管理方法、装置和基站
CN114244686B (zh) 通讯故障的检测方法、装置及系统
CN103248505B (zh) 基于视图的网络监控方法及装置
CN116016102A (zh) 监控网络变更的方法、装置、设备及存储介质
CN110730163B (zh) 一种变电站主辅控联动方法及变电站辅控设备
CN113704051A (zh) 一种服务器故障检测系统及实现方法
CN117041760B (zh) 一种通信网络切换装置、系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination