CN113691395A - 网络运维方法、装置、计算机设备和存储介质 - Google Patents

网络运维方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN113691395A
CN113691395A CN202110891595.4A CN202110891595A CN113691395A CN 113691395 A CN113691395 A CN 113691395A CN 202110891595 A CN202110891595 A CN 202110891595A CN 113691395 A CN113691395 A CN 113691395A
Authority
CN
China
Prior art keywords
data
network
abnormal
target data
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110891595.4A
Other languages
English (en)
Inventor
刘耀华
万伟
苏勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dawning Information Industry Beijing Co Ltd
Original Assignee
Dawning Information Industry Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dawning Information Industry Beijing Co Ltd filed Critical Dawning Information Industry Beijing Co Ltd
Priority to CN202110891595.4A priority Critical patent/CN113691395A/zh
Publication of CN113691395A publication Critical patent/CN113691395A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

本申请涉及一种网络运维方法、装置、计算机设备和存储介质。该方法包括:计算机设备获取网络中各网络设备的运维监控数据,从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据,根据各目标数据属性下对应的异常数据,生成各目标数据属性的网络异常日志。在本方法中,计算机设备根据目标数据属性对运维监控数据进行提取分类,并基于目标数据属性来确定各个目标数据属性对应的异常数据,并且基于异常数据生成对应的网络异常日志,相当于,基于目标数据属性对网络异常日志进行分类,从而可以使得运维人员根据分类之后的网路异常日志实现快速异常定位,提高了网络异常定位的速度,进一步地提高了网络运维的效率。

Description

网络运维方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机网络技术领域,特别是涉及一种网络运维方法、装置、计算机设备和存储介质。
背景技术
网络运行维护对于网络来说是个非常重要的环节。现有的网络运行维护的方式为,通过网络运维工具获取网络运行状态中的相关数据,从而生成网络运行日志。用户在发现网络运行异常时,通知管理人员来进行人工异常定位,即,管理人员基于网络运行日志人工提取网络异常的关键信息,然后基于提取到的关键信息定位网络问题,最终通知维护人员来对网络进行维护处理。
上述网络运行维护的方法每次需要人工判断和处理,网络运维效率低下。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高网络运维效率的网络运维方法、装置、计算机设备和存储介质。
第一方面,提供一种网络运维方法,该方法包括:
获取网络中各网络设备的运维监控数据;
从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据;
根据各目标数据属性下对应的异常数据,生成各目标数据属性的网络异常日志。
在本实施例中,计算机设备在获取到网络中各个网络设备的运维监控数据之后,可以根据目标数据属性对运维监控数据进行提取分类,并基于目标数据属性来确定各个目标数据属性对应的异常数据,并且基于异常数据生成对应的网络异常日志,相当于,基于目标数据属性对网络异常日志进行分类,从而可以使得运维人员根据分类之后的网路异常日志实现快速异常定位,避免了依赖运维人员对网络运行日志进行异常提取的局限性,提高了网络异常定位的速度,进一步地提高了网络运维的效率。
在其中一个可选的实施例中,运维监控数据包括运行状态数据;从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据,包括:
针对每个目标数据属性,判断目标数据属性下的运行状态数据是否符合目标数据属性对应的第一异常判定条件;
在当前运行状态数据符合第一异常判定条件的情况下,确定当前运行状态数据为异常数据。
在本实施例中,计算机设备可以针对网络中的网络设备的运行状态数据进行监控和检测,并基于运行状态数据和第一异常判定条件确定网络设备是否存在异常,为后续进行快速异常定位提供了数据支撑。
在其中一个可选的实施例中,目标数据属性包括运行温度;第一异常判定条件包括预设温度阈值;判断目标数据属性下的运行状态数据是否符合目标数据属性对应的第一异常判定条件,包括:
若运行状态数据中的运行温度超过预设温度阈值,则确定运行状态数据符合第一异常判定条件;
若运行状态数据中的运行温度不超过预设温度阈值,则确定运行状态数据不符合第一异常判定条件。
在本实施例中,计算机设备可以针对运行温度对网络中的网络设备进行监控和检测,并基于网络设备的运行温度确定网络设备是否存在异常,为后续进行快速异常定位提供了数据支撑。
在其中一个可选的实施例中,目标数据属性包括误码率;第一异常判定条件包括预设误码率阈值;判断目标数据属性下的运行状态数据是否符合目标数据属性对应的第一异常判定条件,包括:
若运行状态数据中的误码率超过预设误码率阈值,则确定运行状态数据符合第一异常判定条件;
若运行状态数据中的误码率不超过预设误码率阈值,则确定运行状态数据不符合第一异常判定条件。
在本实施例中,计算机设备可以针对误码率对网络中的网络设备进行监控和检测,并基于网络设备的误码率确定网络设备是否存在异常,为后续进行快速异常定位提供了数据支撑。
在其中一个可选的实施例中,运维监控数据包括运行状态数据;获取网络中各网络设备的运维监控数据,包括:
获取网络中各网络设备的原始运行状态数据;
将原始运行状态数据写入至指定的格式文件;
解析格式文件,得到数据标准化处理后的运行状态数据。
在本实施例中,计算机设备将采集到的原始运行状态数据输入至CSV文件中,并通过解析该文件得到数据标准化处理后的运行状态数据,使得计算机设备基于数据标准化处理后的运行状态数据可以直接进行异常数据的判断,减少了数据处理数据量,提高了数据处理效率。
在其中一个可选的实施例中,运维监控数据包括环境数据;从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据,包括:
根据各目标数据属性对应的第二异常判定条件,从环境数据中确定各目标数据属性下的异常数据。
在本实施例中,计算机设备可以对网络的环境数据、网络设备的环境数据进行监控和检测,并基于环境数据确定网络设备是否存在异常,为后续进行快速异常定位提供了数据支撑。
在其中一个可选的实施例中,目标数据属性包括网络设备的网络状态,第二异常判定条件包括掉落状态;根据各目标数据属性对应的第二异常判定条件,从环境数据中确定各目标数据属性下的异常数据,包括:
获取环境数据中各网络设备的网络状态;
将网络状态为掉落状态的网络设备的环境数据确定为异常数据。
在本实施例中,计算机设备可以针对网络状态对网络中的网络设备进行监控和检测,并基于网络设备的网络状态确定网络设备是否存在异常,为后续进行快速异常定位提供了数据支撑。
在其中一个可选的实施例中,目标数据属性包括网络设备的流量控制时长,第二异常判定条件包括预设时长;根据各目标数据属性对应的第二异常判定条件,从环境数据中确定各目标数据属性下的异常数据,包括:
获取环境数据中各网络设备的流量控制时长;
将流量控制时长大于预设时长的网络设备的环境数据,确定为异常数据。
在本实施例中,计算机设备可以针对网络状态对流量控制时长与进行监控和检测,并基于流量控制时长与和预设时长确定流量控制时长与是否存在异常,为后续进行快速异常定位提供了数据支撑。
在其中一个可选的实施例中,目标数据属性包括故障链路,第二异常判定条件包括预设故障重启次数阈值;根据各目标数据属性对应的第二异常判定条件,从环境数据中确定各目标数据属性下的异常数据,包括:
确定环境数据中各故障链路的重启次数;
将重启次数大于预设故障重启次数阈值的故障链路的环境数据,确定为异常数据。
在本实施例中,计算机设备可以针对故障链路的重启次数进行监控和检测,并基于故障链路的重启次数自动化的对异常的故障链路进行禁用处理,同时输出故障链路的异常日志,自动化的禁用处理提高了故障处理效率,异常日志为后续进行快速异常定位提供了数据支撑。
在其中一个可选的实施例中,该方法还包括:
从各目标数据属性的网络异常日志中,获取目标时间段的各目标数据属性下的异常数据;
根据目标时间段的各目标数据属性下的异常数据,生成异常总结日志,并根据异常总结日志输出告警信息。
在本实施例中,计算机设备可以根据各个目标数据属性的网络异常日志生成目标时间段对应的异常总结日志,从而基于异常总结日志输出告警信息,使得用户可以及时获知网络的整体运行情况,及时地对网络中的异常进行定位维护,提高了网络运维的效率。
第二方面,提供一种网络运维装置,该装置包括:
获取模块,用于获取网络中各网络设备的运维监控数据;
确定模块,用于从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据;
生成模块,用于根据各目标数据属性下对应的异常数据,生成各目标数据属性的网络异常日志。
第三方面,提供一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行该计算机程序时实现上述第一方面任一所述的网络运维方法。
第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述第一方面任一所述的网络运维方法。
上述网络运维方法、装置、计算机设备和存储介质,计算机设备获取网络中各网络设备的运维监控数据,从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据,根据各目标数据属性下对应的异常数据,生成各目标数据属性的网络异常日志。在本方法中,计算机设备在获取到网络中各个网络设备的运维监控数据之后,可以根据目标数据属性对运维监控数据进行提取分类,并基于目标数据属性来确定各个目标数据属性对应的异常数据,并且基于异常数据生成对应的网络异常日志,相当于,基于目标数据属性对网络异常日志进行分类,从而可以使得运维人员根据分类之后的网路异常日志实现快速异常定位,避免了依赖运维人员对网络运行日志进行异常提取的局限性,提高了网络异常定位的速度,进一步地提高了网络运维的效率。
附图说明
图1为一个实施例中网络运维方法的应用环境图;
图2为一个实施例中网络运维方法的流程示意图;
图3为一个实施例中网络运维方法的流程示意图;
图4为一个实施例中网络运维方法的流程示意图;
图5为一个实施例中网络运维方法的流程示意图;
图6为一个实施例中网络运维方法的流程示意图;
图7为一个实施例中网络运维方法的流程示意图;
图8为一个实施例中网络运维方法的流程示意图;
图9为一个实施例中异常总结日志的示意图;
图10为一个实施例中网络运维方法的流程示意图;
图11为一个实施例中网络运维装置的结构框图;
图12为一个实施例中网络运维装置的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的网络运维方法,可以应用于如图1所示的应用环境中。在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图1所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种网络运维方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
下面将通过实施例并结合附图具体地对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。需要说明的是,本申请图2-图11实施例提供的网络运维方法,其执行主体为计算机设备,也可以是网络运维装置,该网络运维装置可以通过软件、硬件或者软硬件结合的方式成为计算机设备的部分或全部。下述方法实施例中,均以执行主体是计算机设备为例来进行说明。
在一个实施例中,如图2所示,提供了一种网络运维方法,涉及的是计算机设备获取网络中各网络设备的运维监控数据,从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据,根据各目标数据属性下对应的异常数据,生成各目标数据属性的网络异常日志的过程,包括以下步骤:
S201、获取网络中各网络设备的运维监控数据。
其中,计算机设备可以基于网络中约定的协议获取网络设备的运维监控数据,其中,包括网络设备的运行状态数据、网络设备所在的环境数据、以及网络实时数据等。可选地,在获取网络设备的运维监控数据之前,计算机设备还可以初始化数据采集相关的参数,例如,初始化数据采集频率、采集次数、采集间隔等。另外,计算机设备还可以初始化运维监控数据中各个数据属性对应的阈值参数,例如,数据属性为运行温度,那么对应设定温度阈值;数据属性为误码率,那么对应设定误码率阈值等。
在本实施例中,计算机设备可以基于构建的监控模块来采集网络中各个网络设备的运维监控参数,例如,计算机设备通过调用ibdiagnet模块采集网络中各个无限带宽IB网卡、交换机的运维监控数据,本实施例对此不做限定。
S202、从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据。
其中,目标数据属性为从数据属性中确定的用户关注度较高的属性,例如,网络设备的运行温度、误码率、网络的故障链路、网络中网络设备的网络状态等。该目标数据属性可以为用户指定输入,也可以是将所有数据属性输入至神经网络模型中,得到的与网络运行状态相关度最接近的目标数据属性。
在本实施例中,计算机设备根据目标数据属性,从采集到的运维监控数据中提取各个目标数据属性对应的数据,并基于提取到的各个目标数据属性下的数据,确定其中的异常数据。可选地,计算机设备可以设定各个目标数据属性对应的异常判定条件,将符合异常判定条件的数据确定为异常数据。或者,计算机设备也可以对各个目标数据属性对应的数据进行数据分布分析,确定不符合数据分布的异常数据,本实施例对此不做限定。
S203、根据各目标数据属性下对应的异常数据,生成各目标数据属性的网络异常日志。
在本实施例中,计算机设备在确定各个目标数据属性下对应的异常数据之后,可以根据异常数据生成对应的日常日志。例如,将网络设备的运行温度对应的异常数据输出至温度异常日志中;将误码率对应的异常数据输出至误码率异常日志中;将网络的故障链路对应的异常数据输出至故障链路异常日志中;将网络中网络设备的网络状态对应的异常数据输出至网络状态异常日志中,本实施例对此不做限定。
上述网络运维方法中,计算机设备获取网络中各网络设备的运维监控数据,从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据,根据各目标数据属性下对应的异常数据,生成各目标数据属性的网络异常日志。在本方法中,计算机设备在获取到网络中各个网络设备的运维监控数据之后,可以根据目标数据属性对运维监控数据进行提取分类,并基于目标数据属性来确定各个目标数据属性对应的异常数据,并且基于异常数据生成对应的网络异常日志,相当于,基于目标数据属性对网络异常日志进行分类,从而可以使得运维人员根据分类之后的网路异常日志实现快速异常定位,避免了依赖运维人员对网络运行日志进行异常提取的局限性,提高了网络异常定位的速度,进一步地提高了网络运维的效率。
网络设备在运行过程中涉及到的不仅是自身产生的运行状态数据,也涉及到所在网络环境的环境数据,在其中一个场景下,在一个实施例中,如图3所示,上述运维监控数据包括运行状态数据;从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据,包括:
S301、针对每个目标数据属性,判断目标数据属性下的运行状态数据是否符合目标数据属性对应的第一异常判定条件。
在本实施例中,计算机设备根据目标数据属性从运行状态数据中提取相应的目标数据,根据各个目标数据属性对应的第一异常判定条件,确定各个目标数据属性对应的运行状态数据中是否存在异常数据。
S302、在当前运行状态数据符合第一异常判定条件的情况下,确定当前运行状态数据为异常数据。
在本实施例中,在确定当前运行状态数据符合第一异常判定条件的条件下,就确定当前运行状态数据为异常数据。例如,目标数据属性包括温度,那么对应的第一异常判定条件包括温度阈值,若当前运行状态数据中的温度值超过该温度阈值,则确定当前运行状态数据符合第一异常判定条件,即,当前运行状态数据为异常数据。相应地,目标数据属性为其他属性、第一异常判定条件为对应的其他条件也是类似的判定过程,具体可参考以下几种场景的实施例。
可选地,在一个实施例中,目标数据属性包括运行温度;第一异常判定条件包括预设温度阈值;判断目标数据属性下的运行状态数据是否符合目标数据属性对应的第一异常判定条件,包括:
若运行状态数据中的运行温度超过预设温度阈值,则确定运行状态数据符合第一异常判定条件;若运行状态数据中的运行温度不超过预设温度阈值,则确定运行状态数据不符合第一异常判定条件。
在本实施例中,计算机设备采集到的网络设备的温度值超过预设温度阈值,则确定该网络设备对应的温度值符合第一异常判定条件,即该网络设备对应的温度值为异常数据;若网络设备的温度值未超过预设温度阈值,则确定该网络设备对应的温度值不符合第一异常判定条件,即该网络设备对应的温度值为正常数据。其中,可选地,运行温度还可以细化为网络中无限带宽网卡的运行温度、交换机的运行温度、端口的运行温度等,进一步地,在针对不同网络设备的运行温度进行异常判定时,可以将不同网络设备的异常数据输出至对应的网络异常日志中,例如,无限带宽网卡的运行温度的异常数据写入至temp.log中;交换机的运行温度的异常数据写入至ber.log中,本实施例对此不做限定。
在本实施例中,计算机设备可以针对运行温度对网络中的网络设备进行监控和检测,并基于网络设备的运行温度确定网络设备是否存在异常,为后续进行快速异常定位提供了数据支撑。
可选地,在一个实施例中,标数据属性包括误码率;第一异常判定条件包括预设误码率阈值;判断目标数据属性下的运行状态数据是否符合目标数据属性对应的第一异常判定条件,包括:
若运行状态数据中的误码率超过预设误码率阈值,则确定运行状态数据符合第一异常判定条件;若运行状态数据中的误码率不超过预设误码率阈值,则确定运行状态数据不符合第一异常判定条件。
在本实施例中,计算机设备采集到的网络设备的误码率超过预设误码率阈值,则确定该网络设备对应的误码率符合第一异常判定条件,即该网络设备对应的误码率为异常数据;若网络设备的误码率未超过预设误码率阈值,则确定该网络设备对应的误码率不符合第一异常判定条件,即该网络设备对应的误码率为正常数据。其中,可选地,误码率还可以细化为网络中无主机通道适配器HCA卡误码率、端口的误码率、光缆的误码率、交换机的误码率等,进一步地,在针对不同网络设备的误码率进行异常判定时,可以将不同网络设备的异常数据输出至对应的网络异常日志中,例如,HCA卡误码率的异常数据写入至ber1.log中;交换机的误码率的异常数据写入至ber2.log中,本实施例对此不做限定。
在本实施例中,计算机设备可以针对误码率对网络中的网络设备进行监控和检测,并基于网络设备的误码率确定网络设备是否存在异常,为后续进行快速异常定位提供了数据支撑。
计算机设备在获取到各个网络设备的运行状态数据之后,由于网络设备的运行状态数据比较冗杂,为了提高数据处理效率,可以对运行状态数据进行数据格式标准化处理,在一个实施例中,如图4所示,运维监控数据包括运行状态数据;获取网络中各网络设备的运维监控数据,包括:
S401、获取网络中各网络设备的原始运行状态数据。
在本实施例中,原始运行状态数据指的是计算机设备直接从网络中的各个网络设备中采集到的没有进行任何数据处理的数据。其中,不同属性的数据具有不同的数值范畴、不同的数据格式等。
S402、将原始运行状态数据写入至指定的格式文件。
其中,指定的格式文件可以为字符分隔值(Comma-Separated Values,CSV)文件,该格式文件是以纯文本形式存储表格数据。在本实施例中,计算机设备将采集到的原始运行数据写入至CSV文件中,生成本次采集到的原始运行数据对应的CSV文件,得到以纯文本形式存储的网络中各个网络设备的运行状态数据。
S403、解析格式文件,得到数据标准化处理后的运行状态数据。
在本实施例中,计算机设备对CSV文件进行解析,其中,可选地,计算机设备可以根据数据属性对CSV文件中的原始运行状态数据进行提取归类,从而得到各个数据属性下对应的运行状态数据,相当于对原始运行状态数据进行过滤,得到数据标准化处理后的运行状态数据。进一步地,计算机设备可以从数据属性中确定目标数据属性,以对目标数据属性下的运行状态数据进行后续的数据处理。
另外,可选地,计算机设备可以将每次采集到的数据对应生成的CSV文件存储至指定的文件目录中,并定时对该目录进行文件扫描,若该目标下CSV文件的数量超过预设的数量阈值,则按照CSV文件的存储日期的顺序,对CSV文件进行备份处理或者删除处理,进一步释放CSV文件的存储空间。
在本实施例中,计算机设备将采集到的原始运行状态数据输入至CSV文件中,并通过解析该文件得到数据标准化处理后的运行状态数据,使得计算机设备基于数据标准化处理后的运行状态数据可以直接进行异常数据的判断,减少了数据处理数据量,提高了数据处理效率。
在另外一种场景下,运维监控数据涉及到网络设备所在网络环境的环境数据,在一个实施例中,运维监控数据包括环境数据;从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据,包括:
根据各目标数据属性对应的第二异常判定条件,从环境数据中确定各目标数据属性下的异常数据。
在本实施例中,计算机设备根据目标数据属性从环境数据中提取相应的目标数据,根据各个目标数据属性对应的第二异常判定条件,确定各个目标数据属性对应的环境数据中是否存在异常数据。例如,目标数据属性包括网络设备的网络状态,那么对应的第一异常判定条件掉落状态,若当前网络设备处于掉落状态,则确定当前网络设备的网络状态为异常数据。相应地,目标数据属性为其他属性、第二异常判定条件为对应的其他条件也是类似的判定过程,具体可参考以下几种场景的实施例。
环境数据中的目标数据属性包括多个,例如,网络设备的接入/掉落状态、网络设备的流量控制时长、网络设备所在链路的故障情况等。在一个实施例中,如图5所示,目标数据属性包括网络设备的网络状态,第二异常判定条件包括掉落状态;根据各目标数据属性对应的第二异常判定条件,从环境数据中确定各目标数据属性下的异常数据,包括:
S501、获取环境数据中各网络设备的网络状态。
在本实施例中,可选的,计算机设备可以调用opensm日志,基于该opensm日志获取网络中各个网络设备的网络状态,其中包括网络设备的接入状态、掉落状态等,网络设备包括交换机等。
S502、将网络状态为掉落状态的网络设备的环境数据确定为异常数据。
在本实施例中,计算机设备将网络状态为掉落状态的网络设备的数据确定为异常数据。可选的,计算机设备可以将网络状态为掉落状态的网络设备的数据输出至指定的异常日志removed.log中。另外,计算机设备还可以将网络状态为接入状态的网络设备的数据输出至指定的日志discovered.log中,本实施例对此不做限定。
在本实施例中,计算机设备可以针对网络状态对网络中的网络设备进行监控和检测,并基于网络设备的网络状态确定网络设备是否存在异常,为后续进行快速异常定位提供了数据支撑。
可选地,在一个实施例中,如图6所示,目标数据属性包括网络设备的流量控制时长,第二异常判定条件包括预设时长;根据各目标数据属性对应的第二异常判定条件,从环境数据中确定各目标数据属性下的异常数据,包括:
S601、获取环境数据中各网络设备的流量控制时长。
在本实施例中,可选的,计算机设备可以调用opensm日志,基于该opensm日志获取网络中网络设备的流量控制时长。
S602、将流量控制时长大于预设时长的网络设备的环境数据,确定为异常数据。
在本实施例中,计算机设备将网络设备的流量控制时长与预设时长进行比较,将流量控制时长超过预设时长的环境数据确定为异常数据。可选的,计算机设备可以将异常数据输出至指定的异常日志resetfc.log中,本实施例对此不做限定。
在本实施例中,计算机设备可以针对网络状态对流量控制时长与进行监控和检测,并基于流量控制时长与和预设时长确定流量控制时长与是否存在异常,为后续进行快速异常定位提供了数据支撑。
可选地,在一个实施例中,如图7所示,目标数据属性包括故障链路,第二异常判定条件包括预设故障重启次数阈值;根据各目标数据属性对应的第二异常判定条件,从环境数据中确定各目标数据属性下的异常数据,包括:
S701、确定环境数据中各故障链路的重启次数。
在本实施例中,计算机设备可以获取当前网络的故障链路日志reset.log,从该日志中确定各故障链路的重启次数。可选地,计算机设备可以基于该日志,确定预设时间段内各故障链路的重启次数,例如,确定24小时内各故障链路的重启次数。
S702、将重启次数大于预设故障重启次数阈值的故障链路的环境数据,确定为异常数据。
在本实施例中,在确定各个故障链路的重启次数之后,根据重启次数阈值确定异常数据,示例地,预设时间段为24小时,计算机设备可以确定24小时内重启次数超过重启次数阀值的故障链路,将这些故障链路对应的数据确定为异常数据。进一步地,计算机设备还可以直接对这种故障链路进行禁用disable处理,并输出至日志disable.log中。
在本实施例中,计算机设备可以针对故障链路的重启次数进行监控和检测,并基于故障链路的重启次数自动化的对异常的故障链路进行禁用处理,同时输出故障链路的异常日志,自动化的禁用处理提高了故障处理效率,异常日志为后续进行快速异常定位提供了数据支撑。
为了进一步优化与用户的交互体验,在计算机设备得到各个目标数据属性下对应的网络异常日志之后,还可以针对某个时间段生成用于展示给用户的异常总结日志,在一个实施例中,如图8所示,该方法还包括:
S801、从各目标数据属性的网络异常日志中,获取目标时间段的各目标数据属性下的异常数据。
在本实施例中,目标时间段可以为一天中的某一个时间段,例如,上午8点到中午12点,也可以为一周中几天的时间段,例如,周一0点到周二24点。目标时间段可以为计算机设备默认划分的,也可以为用户输入的。计算机设备根据目标时间段,从各个目标数据属性对应的网络异常日志中,例如,网络异常日志包括温度异常日志、误码率异常日志、网络设备掉落异常日志、故障链路异常日志,从各个异常日志中获取与目标时间段对应的异常数据,得到当前目标时间段对应的所有网络设备在所有目标数据属性下的异常数据。
S802、根据目标时间段的各目标数据属性下的异常数据,生成异常总结日志,并根据异常总结日志输出告警信息。
在本实施例中,计算机设备在获取到当前目标时间段对应的所有网络设备在所有目标数据属性下的异常数据之后,按照一定的输出格式,生成异常总结日志,异常总结日志可参考图9所示。可选的,计算机设备可以根据以邮件形式输出该异常总结日志;也可以根据异常总结日志生成对应的短信,并向用户输出该短信,从而起到告警的作用,本实施例对此不做限定。
在本实施例中,计算机设备可以根据各个目标数据属性的网络异常日志生成目标时间段对应的异常总结日志,从而基于异常总结日志输出告警信息,使得用户可以及时获知网络的整体运行情况,及时地对网络中的异常进行定位维护,提高了网络运维的效率。
为了更好的说明上述方法,如图10所示,本实施例提供一种网络运维方法,具体包括:
S101、获取网络中各网络设备的原始运行状态数据和环境数据;
S102、将原始运行状态数据写入至指定的格式文件;
S103、解析格式文件,得到数据标准化处理后的运行状态数据;
S104、针对每个目标数据属性,判断目标数据属性下的运行状态数据是否符合目标数据属性对应的第一异常判定条件;
S105、在当前运行状态数据符合第一异常判定条件的情况下,确定当前运行状态数据为异常数据;
S106、根据各目标数据属性对应的第二异常判定条件,从环境数据中确定各目标数据属性下的异常数据;
S107、根据各目标数据属性下对应的异常数据,生成各目标数据属性的网络异常日志;
S108、从各目标数据属性的网络异常日志中,获取目标时间段的各目标数据属性下的异常数据;
S109、根据目标时间段的各目标数据属性下的异常数据,生成异常总结日志,并根据异常总结日志输出告警信息。
在本实施例中,计算机设备在获取到网络中各个网络设备的运维监控数据之后,可以根据目标数据属性对运维监控数据进行提取分类,并基于目标数据属性来确定各个目标数据属性对应的异常数据,并且基于异常数据生成对应的网络异常日志,相当于,基于目标数据属性对网络异常日志进行分类,从而可以使得运维人员根据分类之后的网路异常日志实现快速异常定位,避免了依赖运维人员对网络运行日志进行异常提取的局限性,提高了网络异常定位的速度,进一步地提高了网络运维的效率。
上述实施例提供的网络运维方法,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
应该理解的是,虽然图2-10的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-10中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图11所示,提供了一种网络运维装置,包括:
获取模块01,用于获取网络中各网络设备的运维监控数据;
确定模块02,用于从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据;
生成模块03,用于根据各目标数据属性下对应的异常数据,生成各目标数据属性的网络异常日志。
在其中一个可选的实施例中,运维监控数据包括运行状态数据;确定模块02,用于针对每个目标数据属性,判断目标数据属性下的运行状态数据是否符合目标数据属性对应的第一异常判定条件;在当前运行状态数据符合第一异常判定条件的情况下,确定当前运行状态数据为异常数据。
在其中一个可选的实施例中,目标数据属性包括运行温度;第一异常判定条件包括预设温度阈值;确定模块02,用于若运行状态数据中的运行温度超过预设温度阈值,则确定运行状态数据符合第一异常判定条件;若运行状态数据中的运行温度不超过预设温度阈值,则确定运行状态数据不符合第一异常判定条件。
在其中一个可选的实施例中,目标数据属性包括误码率;第一异常判定条件包括预设误码率阈值;确定模块02,用于若运行状态数据中的误码率超过预设误码率阈值,则确定运行状态数据符合第一异常判定条件;若运行状态数据中的误码率不超过预设误码率阈值,则确定运行状态数据不符合第一异常判定条件。
在其中一个可选的实施例中,运维监控数据包括运行状态数据;获取模块01,用于获取网络中各网络设备的原始运行状态数据;将原始运行状态数据写入至指定的格式文件;解析格式文件,得到数据标准化处理后的运行状态数据。
在其中一个可选的实施例中,运维监控数据包括环境数据;确定模块02,用于根据各目标数据属性对应的第二异常判定条件,从环境数据中确定各目标数据属性下的异常数据。
在其中一个可选的实施例中,目标数据属性包括网络设备的网络状态,第二异常判定条件包括掉落状态;确定模块02,用于获取环境数据中各网络设备的网络状态;将网络状态为掉落状态的网络设备的环境数据确定为异常数据。
在其中一个可选的实施例中,目标数据属性包括网络设备的流量控制时长,第二异常判定条件包括预设时长;确定模块02,用于获取环境数据中各网络设备的流量控制时长;将流量控制时长大于预设时长的网络设备的环境数据,确定为异常数据。
在其中一个可选的实施例中,目标数据属性包括故障链路,第二异常判定条件包括预设故障重启次数阈值;确定模块02,用于确定环境数据中各故障链路的重启次数;将重启次数大于预设故障重启次数阈值的故障链路的环境数据,确定为异常数据。
在其中一个可选的实施例中,如图12所示,该装置还包括输出模块04;其中:
获取模块01,还用于从各目标数据属性的网络异常日志中,获取目标时间段的各目标数据属性下的异常数据;
输出模块04,用于根据目标时间段的各目标数据属性下的异常数据,生成异常总结日志,并根据异常总结日志输出告警信息。
关于网络运维装置的具体限定可以参见上文中对于网络运维方法的限定,在此不再赘述。上述网络运维装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取网络中各网络设备的运维监控数据;
从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据;
根据各目标数据属性下对应的异常数据,生成各目标数据属性的网络异常日志。
上述实施例提供的计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取网络中各网络设备的运维监控数据;
从运维监控数据中提取各网络设备在目标数据属性下对应的异常数据;
根据各目标数据属性下对应的异常数据,生成各目标数据属性的网络异常日志。
上述实施例提供的计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种网络运维方法,其特征在于,所述方法包括:
获取网络中各网络设备的运维监控数据;
从所述运维监控数据中提取各所述网络设备在目标数据属性下对应的异常数据;
根据各所述目标数据属性下对应的异常数据,生成各所述目标数据属性的网络异常日志。
2.根据权利要求1所述的方法,其特征在于,所述运维监控数据包括运行状态数据;所述从所述运维监控数据中提取各所述网络设备在目标数据属性下对应的异常数据,包括:
针对每个所述目标数据属性,判断所述目标数据属性下的所述运行状态数据是否符合所述目标数据属性对应的第一异常判定条件;
在当前运行状态数据符合第一异常判定条件的情况下,确定所述当前运行状态数据为所述异常数据。
3.根据权利要求2所述的方法,其特征在于,所述目标数据属性包括运行温度;所述第一异常判定条件包括预设温度阈值;
所述判断所述目标数据属性下的所述运行状态数据是否符合所述目标数据属性对应的第一异常判定条件,包括:
若所述运行状态数据中的运行温度超过所述预设温度阈值,则确定所述运行状态数据符合所述第一异常判定条件;
若所述运行状态数据中的运行温度不超过所述预设温度阈值,则确定所述运行状态数据不符合所述第一异常判定条件。
4.根据权利要求2所述的方法,其特征在于,所述目标数据属性包括误码率;所述第一异常判定条件包括预设误码率阈值;
所述判断所述目标数据属性下的所述运行状态数据是否符合所述目标数据属性对应的第一异常判定条件,包括:
若所述运行状态数据中的误码率超过所述预设误码率阈值,则确定所述运行状态数据符合所述第一异常判定条件;
若所述运行状态数据中的误码率不超过所述预设误码率阈值,则确定所述运行状态数据不符合所述第一异常判定条件。
5.根据权利要求1所述的方法,其特征在于,所述运维监控数据包括环境数据;所述从所述运维监控数据中提取各所述网络设备在目标数据属性下对应的异常数据,包括:
根据各所述目标数据属性对应的第二异常判定条件,从所述环境数据中确定各所述目标数据属性下的异常数据。
6.根据权利要求5所述的方法,其特征在于,所述目标数据属性包括网络设备的网络状态,所述第二异常判定条件包括掉落状态;
所述根据各所述目标数据属性对应的第二异常判定条件,从所述环境数据中确定各所述目标数据属性下的异常数据,包括:
获取所述环境数据中各所述网络设备的网络状态;
将网络状态为掉落状态的网络设备的环境数据确定为异常数据。
7.根据权利要求5所述的方法,其特征在于,所述目标数据属性包括网络设备的流量控制时长,所述第二异常判定条件包括预设时长;
所述根据各所述目标数据属性对应的第二异常判定条件,从所述环境数据中确定各所述目标数据属性下的异常数据,包括:
获取所述环境数据中各所述网络设备的流量控制时长;
将流量控制时长大于所述预设时长的网络设备的环境数据,确定为异常数据。
8.根据权利要求5所述的方法,其特征在于,所述目标数据属性包括故障链路,所述第二异常判定条件包括预设故障重启次数阈值;
所述根据各所述目标数据属性对应的第二异常判定条件,从所述环境数据中确定各所述目标数据属性下的异常数据,包括:
确定所述环境数据中各所述故障链路的重启次数;
将重启次数大于所述预设故障重启次数阈值的故障链路的环境数据,确定为异常数据。
9.一种网络运维装置,其特征在于,所述装置包括:
获取模块,用于获取网络中各网络设备的运维监控数据;
确定模块,用于从所述运维监控数据中提取各所述网络设备在目标数据属性下对应的异常数据;
生成模块,用于根据各所述目标数据属性下对应的异常数据,生成各所述目标数据属性的网络异常日志。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
CN202110891595.4A 2021-08-04 2021-08-04 网络运维方法、装置、计算机设备和存储介质 Pending CN113691395A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110891595.4A CN113691395A (zh) 2021-08-04 2021-08-04 网络运维方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110891595.4A CN113691395A (zh) 2021-08-04 2021-08-04 网络运维方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN113691395A true CN113691395A (zh) 2021-11-23

Family

ID=78578817

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110891595.4A Pending CN113691395A (zh) 2021-08-04 2021-08-04 网络运维方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN113691395A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114240155A (zh) * 2021-12-17 2022-03-25 中国工商银行股份有限公司 机房设备健康度的评估方法、装置、计算机设备
CN117234806A (zh) * 2023-09-22 2023-12-15 深圳市联瑞电子有限公司 一种网卡自动重启方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012168547A (ja) * 2012-04-02 2012-09-06 Seiko Epson Corp プロジェクタ、プログラムおよび投写方法
CN109474483A (zh) * 2019-01-08 2019-03-15 Oppo广东移动通信有限公司 一种设备异常情况的检测方法、检测装置及终端设备
WO2019079961A1 (zh) * 2017-10-24 2019-05-02 华为技术有限公司 一种确定共享风险链路组的方法及装置
CN109818787A (zh) * 2019-01-21 2019-05-28 苏州科达科技股份有限公司 业务异常检测方法、装置及存储介质
CN111193608A (zh) * 2019-11-19 2020-05-22 腾讯云计算(北京)有限责任公司 网络质量探测监控方法、装置、系统和计算机设备
CN111817891A (zh) * 2020-07-07 2020-10-23 中国联合网络通信集团有限公司 网络故障处理方法、装置、存储介质及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012168547A (ja) * 2012-04-02 2012-09-06 Seiko Epson Corp プロジェクタ、プログラムおよび投写方法
WO2019079961A1 (zh) * 2017-10-24 2019-05-02 华为技术有限公司 一种确定共享风险链路组的方法及装置
CN109474483A (zh) * 2019-01-08 2019-03-15 Oppo广东移动通信有限公司 一种设备异常情况的检测方法、检测装置及终端设备
CN109818787A (zh) * 2019-01-21 2019-05-28 苏州科达科技股份有限公司 业务异常检测方法、装置及存储介质
CN111193608A (zh) * 2019-11-19 2020-05-22 腾讯云计算(北京)有限责任公司 网络质量探测监控方法、装置、系统和计算机设备
CN111817891A (zh) * 2020-07-07 2020-10-23 中国联合网络通信集团有限公司 网络故障处理方法、装置、存储介质及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114240155A (zh) * 2021-12-17 2022-03-25 中国工商银行股份有限公司 机房设备健康度的评估方法、装置、计算机设备
CN117234806A (zh) * 2023-09-22 2023-12-15 深圳市联瑞电子有限公司 一种网卡自动重启方法和系统
CN117234806B (zh) * 2023-09-22 2024-04-30 深圳市联瑞电子有限公司 一种网卡自动重启方法和系统

Similar Documents

Publication Publication Date Title
CN109522287B (zh) 分布式文件存储集群的监控方法、系统、设备及介质
US9507936B2 (en) Systems, methods, apparatuses, and computer program products for forensic monitoring
KR101835303B1 (ko) 컴퓨팅 장치들에 대한 시스템 성능 및 이벤트 데이터를 수집, 추적 및 저장하기 위한 시스템들 및 방법들
CN111143163B (zh) 数据监控方法、装置、计算机设备和存储介质
CN112631913B (zh) 应用程序的运行故障监控方法、装置、设备和存储介质
CN113691395A (zh) 网络运维方法、装置、计算机设备和存储介质
CN111400367B (zh) 业务报告生成方法、装置、计算机设备和存储介质
CN114077525A (zh) 异常日志处理方法、装置、终端设备、云服务器及系统
CN111767173A (zh) 网络设备数据处理方法、装置、计算机设备和存储介质
CN110763952A (zh) 地下电缆故障监测方法和装置
US11757708B2 (en) Anomaly detection device, anomaly detection method, and anomaly detection program
CN111669295A (zh) 业务管理方法和装置
JP2009181496A (ja) ジョブ処理システムおよびジョブ管理方法
CN113609230A (zh) 数据同步异常告警方法、装置、计算机设备和存储介质
CN110838940B (zh) 地下电缆巡检任务配置方法和装置
CN106294470A (zh) 基于切分日志的实时增量日志信息读取的方法
CN111176950A (zh) 一种监控服务器集群的网卡的方法和设备
US11181290B2 (en) Alarm processing devices, methods, and systems
CN113672449A (zh) 智能运维异常监测方法、装置、计算机设备和存储介质
US11157381B2 (en) Display control method and display control device
CN112035315A (zh) 网页数据监控方法、装置、计算机设备及存储介质
CN112612679A (zh) 系统运行状态监控方法、装置、计算机设备和存储介质
CN114428704A (zh) 全链路分布式监控的方法、装置、计算机设备和存储介质
CN112131090A (zh) 业务系统性能监控方法及装置、设备及介质
CN107783852B (zh) 一种dump文件生成方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination