CN110806921A - 一种ovs异常告警监控系统及方法 - Google Patents

一种ovs异常告警监控系统及方法 Download PDF

Info

Publication number
CN110806921A
CN110806921A CN201910941775.1A CN201910941775A CN110806921A CN 110806921 A CN110806921 A CN 110806921A CN 201910941775 A CN201910941775 A CN 201910941775A CN 110806921 A CN110806921 A CN 110806921A
Authority
CN
China
Prior art keywords
data
information
module
original
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910941775.1A
Other languages
English (en)
Other versions
CN110806921B (zh
Inventor
谢迎运
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fiberhome Telecommunication Technologies Co Ltd
Original Assignee
Fiberhome Telecommunication Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fiberhome Telecommunication Technologies Co Ltd filed Critical Fiberhome Telecommunication Technologies Co Ltd
Priority to CN201910941775.1A priority Critical patent/CN110806921B/zh
Publication of CN110806921A publication Critical patent/CN110806921A/zh
Application granted granted Critical
Publication of CN110806921B publication Critical patent/CN110806921B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45587Isolation or security of virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明公开了一种OVS异常告警监控系统及方法,其特征在于,包括:数据采集模块,数据封装模块,数据解析模块,告警信息展示模块;其中,数据采集模块用于从OVS虚拟交换机获取原始信息;数据封装模块用于对上述原始信息按照后续数据的处理层级逻辑执行自定义封装;数据解析模块用于接收数据封装模块封装后的数据,并对解析后的数据进行分析处理,将分析处理后的信息发送至告警信息展示模块执行展示。按照本发明实现的异常告警监控系统及方法,提出了一种对OVS的原始数据进行自定义封装再通过管理平台来进行告警信息处理并实现分类管理,将故障的类型、发生的原因及故障的位置信息展示在管理平台告警页面,以方便运维人员进行定位排查异常情况。

Description

一种OVS异常告警监控系统及方法
技术领域
本发明属于云平台技术领域,特别是涉及一种云平台的OVS异常告警监控系统及方法。
背景技术
随着云计算的蓬勃发展,由于其灵活性、高扩展性、按需服务等优势,越来越多的企业将服务部署到云上。数据中心的服务器是直接连在硬件交换机上,后来VMware实现了服务器虚拟化技术,使虚拟服务器(VMs)能够连接在虚拟交换机上,借助这个虚拟交换机,可以为服务器上运行的VMs或容器提供逻辑的虚拟的以太网接口,这些逻辑接口都连接到虚拟交换机上,有三种比较流行的虚拟交换机:VMware virtual switch,Cisco Nexus1000V,和Open vSwitch。
Open vSwitch(OVS)是运行在虚拟化平台上的虚拟交换机,其支持OpenFlow协议,也支持gre/vxlan/IPsec等隧道技术,在OVS之前,基于Linux的虚拟化平台比如KVM或Xen上,缺少一个功能丰富的虚拟交换机,因此OVS迅速崛起并开始在Xen/KVM中流行起来,并且应用于越来越多的开源项目,比如openstack neutron中的网络解决方案。
OVS(Open vSwitch开源虚拟交换机)因其出色的性能被广泛应用于云计算场景以构建虚拟网络,随着OVS使用规模的扩大,对OVS的异常流量告警、异常问题排查、故障定位面临迫切的需求。目前针对OVS提出了很多流量采集、监控、分析的系统及方法,但是缺乏对OVS的异常进行分析、定位和上报并告警的系统及方法。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种OVS的异常监控告警系统及方法,通过对OVS的各项数据进行采集分析,实现了对OVS故障进行告警上报和故障原因定位。
为实现上述目的,按照本发明,提供一种OVS异常告警监控系统,其特征在于,所述监控系统包括依次进行数据传输连接的数据采集模块,数据封装模块,数据解析模块,告警信息展示模块;所述数据采集模块用于从OVS虚拟交换机获取原始信息;所述数据封装模块用于对所述原始信息进行处理并按照自定义格式封装;所述数据解析模块对所述数据封装模块封装后的数据执行解析处理,所述告警信息展示模块用于对将分析处理后的信息发送至告警信息展示模块执行展示;所述数据封装模块包括原始信息提取子模块,原始信息处理子模块,自定义封装子模块;所述原始信息提取子模块用于依据所述异常告警监控系统的处理层级所决定的封装格式从所述原始信息中直接提取第一部分信息,所述原始信息处理子模块用于依据所述异常告警监控系统的处理层级所决定的封装格式从所述原始信息中提取并计算获取第二部分信息,所述自定义封装子模块用于对所述第一部分信息及所述第二部分信息执行封装。
进一步地,所述数据解析模块进一步包括有数据过滤子模块、异常信息判断子模块、异常信息分类子模块以及数据接口模块,所述数据过滤子模块的作用是将封装后的数据进行过滤,将正常信息进行滤除,将异常的信息按照类型执行异常程度分类判断分析;其中所述异常信息分类子模块用于将依据异常信息判断子模块的结果告警展示的赋值编号。
进一步地,所述自定义封装子模块所封装的数据信息包括:
节点信息,包括链路状态、端口ID、链路带宽、管理状态、接口ID、端口类型;
接口状态信息,包括端口ID、端口丢包率、收到数据字节数、发送数据包数、收到数据包数、收到的数据字节数、端口编号。
进一步地,所述数据解析模块所解析的异常信息包括:OVS故障发生位置、虚拟机端口状态、控制器连通性、数据流量是否异常、端口的使用量是否超过阈值。
进一步地,所述数据采集模块提取的所述原始信息包括:CPU资源使用统计、内存资源使用统计、接口资源使用统计、LACP资源使用统计、OVSDB资源使用统计、OPENFLOW资源使用统计、节点信息、网络资源使用统计信息。
本发明还公开了一种OVS异常告警监控方法,其特征在于,所述方法主要包括如下步骤:
从OVS虚拟交换机获取OVS各项原始信息;
对所述原始信息进行数据格式转换并执行处理,转换成自定义格式数据;
对转换成自定义格式的数据执行处理,生成异常告警监控信息;
将生成的异常告警监控信息发送至管理平台进行异常告警信息的警报展示。
进一步地,所述自定义格式数据生成包括如下步骤:
对原始数据中的第一部分原始信息按照指令进行原始信息提取;
对原始数据中的第二部分原始信息开展数据统计计算,为自定义数据封装处理中提供处理后的信息;
按照数据解析模块设定的处理层级和逻辑对上述信息进行编辑,并按照设定顺序格式完成数据封装并存储;以此方式,完成数据的封装。
进一步地,所述数据解析包括如下步骤:
执行正常数据和异常数据的过滤处理;
对所述经过过滤的数据信息执行进一步分析,判断故障类型并按照设定的分类依据执行分类;对所述已经分好类别的故障类型事件执行编号处理;
对所述编号处理后数据执行存储,以进行异常信息展示。
进一步地,所述自定义封装子模块所封装的数据信息包括:
节点信息,包括链路状态、端口ID、链路带宽、管理状态、接口ID、端口类型;
接口状态信息,包括端口ID、端口丢包率、收到数据字节数、发送数据包数、收到数据包数、收到的数据字节数、端口编号。
本发明还公开了一种OVS异常告警监控方法,其特征在于,所述监控方法包括如下步骤:
STEP1:依据接口协议以一定更新周期从云平台中采集原始数据并在终端监控服务器的第一存储设备上存储原始数据;
STEP2:对上述采集的原始数据进行封装处理,生成可在终端监控服务器上按照处理逻辑和队列进行数据处理的自定义数据,上述自定义数据包括设定顺序的信息存储格式,以及从原始数据中提取的数据,以及依据原始数据执行处理后的数据;其中,包括:
STEP2-1:数据封装模块从第一存储设备中执行数据提取,对原始数据中的第一部分原始信息按照指令进行原始信息提取;
STEP2-2:数据封装模块从第一存储设备中执行数据提取,对原始数据中的第二部分原始信息开展数据统计计算,为自定义数据封装处理中提供处理后的信息;
STEP2-3:按照数据解析模块设定的处理层级和逻辑对上述信息进行编辑,并按照设定顺序格式完成数据封装,并在终端监控服务器的第二存储设备上执行存储;以此方式,完成数据的封装;
STEP3:数据解析模块对转换成自定义格式的数据汇总执行处理,生成异常告警监控信息;其中,包括:
STEP3-1:筛除正常数据;其中,数据过滤子模块执行正常数据和异常数据的过滤处理,对正常数据与异常数据的判断信息包括节点链路状态、端口丢包率;
STEP3-2:对上述经过过滤的数据信息执行进一步分析,异常信息判断子模块判断故障类型并执行分类,其中分类的依据包括有故障对系统影响的重要等级;
STEP3-3:对所述已经分好类别的故障类型事件执行编号处理;
STEP3-4:对完成编号处理的数据进行存储,以方便用户端的异常信息展示模块通过数据接口模块执行调用处理,按照异常信息展示模块的选择框调用命令执行相应信息的调用展示处理;
STEP4:执行异常信息的展示
STEP4-1:异常信息展示模块接收异常信息控件选项展示指令,从存储队列调用相应的信息执行异常信息展示。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,具有以下有益效果:
提出了一种完备的OVS异常告警监控方案,使得OVS监控并不仅仅在流量的监控方面,而是充分利用原始数据信息和后续的逻辑处理,将信息进行充分的整理,并在后端显示,使得故障运维高效并可视化。
附图说明
图1为按照本发明实现的OVS异常告警监控的功能框架示意图;
图2为按照本发明实现的OVS异常告警监控系统的组成框架示意图;
图3为按照本发明实现的OVS异常告警监控系统的数据封装模块的组成示意图;
图4为按照本发明实现的OVS异常告警监控系统的数据解析模块的组成示意图;
图5为按照本发明实现的OVS异常告警监控方法的流程框架示意图;
图6为按照本发明实现的OVS异常告警监控方法的数据封装流程示意图;
图7为按照本发明实现的OVS异常告警监控方法的数据解析流程示意图;
图8为按照本发明实现的OVS异常告警监控方法的执行流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1中所示,按照本发明实现的异常告警监控系统所实现的异常告警监控系统所实现的功能主要包括如下:
从OVS虚拟交换机获取OVS各项原始信息;对上述原始信息进行数据格式转换并执行处理,转换成自定义格式数据;对转换成自定义格式的数据汇总执行处理,生成异常告警监控信息;将生成的异常告警监控信息发送至管理平台进行异常告警信息的警报展示。
对应于上述异常告警监控系统所实现的功能,如图2中所示,本发明提供的基于云平台的OVS异常告警监控系统包括如下组成模块:数据采集模块,数据封装模块,数据解析模块,告警信息展示模块;其中,数据采集模块用于从OVS虚拟交换机获取原始信息;数据封装模块用于对上述原始信息进行处理,对原始信息进行处理的原则主要按照后续数据的处理层级逻辑执行编辑;数据解析模块用于接收数据封装模块封装后的数据,并对解析后的数据进行分析处理,将分析处理后的信息发送至告警信息展示模块执行展示。
按照本发明所实现的异常告警监控系统,其从OVS平台中采集的数据中,所执行的并不仅仅涉及流量的采集、监控和分析作用,还包括数据信息的更多维度的分析,第一方面是能快速并精准发现异常处,并且能自动对系统的所有状态的情况进行定期维护更新,并执行告警展示以使得运维人员能够依据异常具体情况展开针对性的维护处理。
其中,数据采集模块采集的云平台的原始信息,按照本发明的实施方案的其中一种实施例主要包括有:
CPU资源使用统计(CPU的编号、CPU可用量、CPU使用量)、内存资源使用统计(Socket编号、OVS内存总量、OVS内存空闲)、接口资源使用统计(OVS接口ID、OVS接口上层编号、OVS接口中正常端口数、OVS接口类型、OVS接口模式、OVS接口成员)、LACP资源使用统计(LACP接口编号、LACP接口状态)、OVSDB(开放虚拟交换机数据库)资源使用统计(OVSDB编号、OVSDB连接状态)、OPENFLOW资源使用统计(OpenFlow网络、OpenFlow网络名称、OpenFlow连接状态、OpenFlow地址、OpenFlow协议、OpenFlow端口)、节点信息、网络资源使用统计信息(网络编号、网络类型、网络名称)等,CPU资源使用统计:
其中,数据封装模块,将数据按照固定的格式进行封装,对于异常监控来说,从云平台中采集的原始数据,缺乏有顺序的逻辑执行程序,以及层级的逻辑执行关系,导致在后续的分析中不能提取出有效的数据来异常分析,按照本发明实现的数据封装模块中,将各项原始信息转化为自定义数据格式来执行封装。
如图3中所示,数据封装模块包括原始信息提取子模块,原始信息处理子模块,自定义封装子模块;原始信息提取子模块用于依据异常告警监控系统的处理层级所决定的封装格式从原始信息中直接提取第一部分信息,原始信息处理子模块用于依据异常告警监控系统的处理层级所决定的封装格式从原始信息中提取并计算获取第二部分信息,自定义封装子模块用于对第一部分信息及第二部分信息执行封装。
其中按照本发明的实施方案的其中一种实施例,数据封装的格式以如下方式执行:一、port信息:1、链路状态(up/down)2、端口id 3、链路带宽4、管理状态5、接口(可能包含多个端口)id 6、端口类型;二、接口状态信息:1、端口id 2、端口丢包率3、收到数据字节数4、发送数据包数5、收到数据包数6、收到的数据字节数7、端口编号,在上述的数据封装处理逻辑中,其中可以发现,在数据封装模块中,对其中一部分的数据进行处理,加入封装的数据格式中,例如上述的端口丢包率,以方便后续的数据解析处理,当然,整个数据的封装并不仅仅只限于上述的例子,只是举出实施例说明数据的构成时由原始信息中提取的信息以及计算处理后的信息共同组成,并且由一定的逻辑层次进行封装编辑而成。
其中,如图6中所示,数据封装模块通过http协议将数据发送至数据解析模块,将上述数据进行解析,数据解析模块执行如下步骤的操作:(1)过滤正常数据;(2)分析处理异常信息,其中异常信息包括不限于:ovs上的故障发生位置、虚拟机端口状态、控制器连通性、数据流量是否异常、端口的使用量是否超过阈值等,上述异常信息的判断主要来自两个部分,其中一部分依据来自OVS原始信息的上报状态来进行判断,其中一部分需要设置阈值来进行对比判断;(3)将异常信息进行分类,并按照重要等级例如数据口和普通口的类别对异常信息赋予告警号,其中告警号的赋值编号可以依据待分析的异常类型来进行;(4)上报处理后的信息发送予告警信息展示模块对数据执行异常告警展示处理。
从而,数据解析模块进一步包括有数据过滤子模块、异常信息判断子模块、异常信息分类子模块以及数据接口模块。
其中,数据过滤子模块的作用是将封装后的数据进行过滤,将正常信息进行滤除,将异常的信息按照类型执行异常程度分类判断分析;其中异常信息分类子模块用于将依据异常信息判断子模块的结果进行告警的赋值编号,以方便告警信息展示模块的展示调用处理。
其中,按照本发明实现的管理平台告警展示模块,所实现的异常告警处理,按照本发明的实施方案的其中一种实施例,包括如下部分:
告警展示平台包括不限于如下类别:故障管理、软件管理、主机资源、租户网络、租户网络拓扑、存储概况、操作日志、系统配置、接口调用阀、配置备份;
故障管理包括不限于如下类别:活跃告警、事件、事件抑制、阈值、告警通知前端、通知服务器;
其中,作为本发明地告警信息展示的事件栏所展示信息包括但不限于:时间数,状态,ID,原因,实例ID,Suppression Status(抑制状况)和严重性等级,例如一种告警展示实施方式为:2019-07-10 10:39:15,状态为set,ID为300.001,原因为data port failed,数据端口失败,实例ID为host=compute-0.port=f8aa21t-b146-46b9-adcb-12c224f87173,Suppression Status为unsuppressed,严重性为major。
进一步地,其中数据采集程序通过OVS API接口来获取OVS的各项原始数据;
进一步地,周期性的向数据采集程序来发送请求,获取OVS监控数据并执行状态的更新,在接收更新操作触发后,能展示更新后的故障信息,当然,当OVS故障排除后,将在告警页面清除告警。
附图中的流程图和框图,展示了按照本发明系统实现的各种实施例的模块,方法和计算机程序能够实现的功能操作,在此基础之上,计算可以针对上述框图中的步骤或者是功能设计程序代码,利用计算机指令来实现相应的功能。
其中,在本发明的其中一种实施方式中,上述异常告警监控系统基于一个终端监控服务器,其中,告警信息展示模块设置在用户端,监控服务器按照更新周期通过接口接收云平台的数据信息,并进行解析处理,将解析后的数据发送至用户端,并进行异常信息的多维度展示以方便运维人员执行异常信息的及时排查处理,当然,数据之间的传输需要依据各个服务器终端的协议来进行信息交互,在本发明中,尤其在于从云平台获知原始数据之后对数据进行了封装处理,按照上述的封装处理,更有利于终端监控服务器进行异常信息的处理、分析以及显示。
按照本发明实现的异常告警监控系统的存储器中还有异常告警信息展示队列,在终端监控服务器设置有异常告警信息队列,由于在异常告警监控信息进行展示之前,已经进行了异常信息的判断、分类以及告警号的赋予,使得用户端进行告警信息展示时不需要解析,能够快速准确按照展示格式执行信息展示。
如图5中所示,本发明还提出了一种OVS异常告警监控方法,方法主要包括如下步骤:
从OVS虚拟交换机获取OVS各项原始信息;
对上述原始信息进行数据格式转换并执行处理,转换成自定义格式数据;
对转换成自定义格式的数据汇总执行处理,生成异常告警监控信息;
将生成的异常告警监控信息发送至管理平台进行异常告警信息的警报展示。
其中,如图6中所示,数据封装包括如下步骤:
数据封装模块从第一存储设备中执行数据提取,对原始数据中的第一部分原始信息按照指令进行原始信息提取;
数据封装模块从第一存储设备中执行数据提取,对原始数据中的第二部分原始信息开展数据统计计算,为自定义数据封装处理中提供处理后的信息;
按照数据解析模块设定的处理层级和逻辑对上述信息进行编辑,并按照设定顺序格式完成数据封装,并在终端监控服务器的第二存储设备上执行存储;以此方式,完成数据的封装。
其中,如图7中所示,数据解析包括如下步骤:
筛除正常数据,以提高异常信息处理的效率;其中,数据过滤子模块执行正常数据和异常数据的过滤处理;
对上述经过过滤的数据信息执行进一步分析,异常信息判断子模块判断故障类型并执行分类,其中分类的依据包括有故障对系统影响的重要等级;
对所述已经分好类别的故障类型事件执行编号处理异常信息分类子模块;
对完成分类的数据进行存储,以方便用户端的异常信息展示模块通过数据接口模块执行调用处理,按照异常信息展示模块的选择框调用命令执行相应信息的调用展示处理。
具体来说,更进一步地,如图8中所示,本发明还提出了一种云平台的OVS异常告警监控方法,其中上述方法主要包括如下步骤:
STEP1:依据接口协议以一定更新周期从云平台中采集原始数据并在终端监控服务器的第一存储设备上存储原始数据;上述原始数据第一方面要实现定时的更新,第二方面,上述原始数据会被处理成新的自定义格式数据,上述第一存储设备上的原始数据可依据需求进行备录取或者在处理后被定时清除;
STEP2:数据封装模块从第一存储设备中执行数据提取,对原始数据中的第一部分原始信息按照指令进行原始信息提取;
数据封装模块从第一存储设备中执行数据提取,对原始数据中的第二部分原始信息开展数据统计计算,为自定义数据封装处理中提供处理后的信息;
按照数据解析模块设定的处理层级和逻辑对上述信息进行编辑,并按照设定顺序格式完成数据封装,并在终端监控服务器的第二存储设备上执行存储;以此方式,完成数据的封装。
在上述的数据封装步骤中,对于本发明的改进,是需要按照后续的处理逻辑和层次对原始数据执行进一步的封装加工,以方便后续处理。
STEP3:筛除正常数据,以提高异常信息处理的效率;其中,数据过滤子模块执行正常数据和异常数据的过滤处理,其中,在上述正常与异常数据的过滤筛查中,主要包括对封装后的数据执行对比,第一信息包括不限于节点链路状态,第二信息包括不限于端口丢包率;对上述经过过滤的数据信息执行进一步分析,异常信息判断子模块判断故障类型并执行分类,其中分类的依据包括有故障对系统影响的重要等级;对所述已经分好类别的故障类型事件执行编号处理异常信息分类子模块;对完成分类的数据进行存储,以方便用户端的异常信息展示模块通过数据接口模块执行调用处理,按照异常信息展示模块的选择框调用命令执行相应信息的调用展示处理;其中正常数据与异常数据的处理主要是通过依据上报情况和依据设定阈值的对比情况来筛选正常与异常数据。
STEP4:执行异常信息的展示,异常信息展示模块接收异常信息控件选项展示指令,从存储队列调用相应的信息执行异常信息展示。
本发明的上述实施方式是参照本发明实施例的方法、终端设备和计算机产品的步骤来进行描述的,应当理解为可由计算机程序指令实现上述步骤的结合,并且可提供这些计算机程指令能够使得数据得以存储,处理的硬件设备,使得可编程数据处理器能够按照上述的方法或者模块实现上述实施例中的方案。
其中,上述模块对应的操作方法步骤的顺序及其实现的功能可通过组合匹配的方式进行灵活的执行上述功能在模块中的重新封装,在此不再赘述。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种OVS异常告警监控系统,其特征在于,所述监控系统包括依次进行数据传输连接的数据采集模块,数据封装模块,数据解析模块,告警信息展示模块;所述数据采集模块用于从OVS虚拟交换机获取原始信息;所述数据封装模块用于对所述原始信息进行处理并按照自定义格式封装;所述数据解析模块对所述数据封装模块封装后的数据执行解析处理,所述告警信息展示模块用于对将分析处理后的信息发送至告警信息展示模块执行展示;所述数据封装模块包括原始信息提取子模块,原始信息处理子模块,自定义封装子模块;所述原始信息提取子模块用于依据所述异常告警监控系统的处理层级所决定的封装格式从所述原始信息中直接提取第一部分信息,所述原始信息处理子模块用于依据所述异常告警监控系统的处理层级所决定的封装格式从所述原始信息中提取并计算获取第二部分信息,所述自定义封装子模块用于对所述第一部分信息及所述第二部分信息执行封装。
2.如权利要求1所述的OVS异常告警监控系统,其特征在于,所述数据解析模块进一步包括有数据过滤子模块、异常信息判断子模块、异常信息分类子模块以及数据接口模块,所述数据过滤子模块的作用是将封装后的数据进行过滤,将正常信息进行滤除,将异常的信息按照类型执行异常程度分类判断分析;其中所述异常信息分类子模块用于将依据异常信息判断子模块的结果告警展示的赋值编号。
3.如权利要求1或2中所述的OVS异常告警监控系统,其特征在于,所述自定义封装子模块所封装的数据信息包括:
节点信息,包括链路状态、端口ID、链路带宽、管理状态、接口ID、端口类型;
接口状态信息,包括端口ID、端口丢包率、收到数据字节数、发送数据包数、收到数据包数、收到的数据字节数、端口编号。
4.如权利要求3中所述的OVS异常告警监控系统,其特征在于,所述数据解析模块所解析的异常信息包括:OVS故障发生位置、虚拟机端口状态、控制器连通性、数据流量是否异常、端口的使用量是否超过阈值。
5.如权利要求4所述的OVS异常告警监控系统,其特征在于,所述数据采集模块提取的所述原始信息包括:CPU资源使用统计、内存资源使用统计、接口资源使用统计、LACP资源使用统计、OVSDB资源使用统计、OPENFLOW资源使用统计、节点信息、网络资源使用统计信息。
6.一种OVS异常告警监控方法,其特征在于,所述方法主要包括如下步骤:
从OVS虚拟交换机获取OVS各项原始信息;
对所述原始信息进行数据格式转换并执行处理,转换成自定义格式数据;
对转换成自定义格式的数据执行处理,生成异常告警监控信息;
将生成的异常告警监控信息发送至管理平台进行异常告警信息的警报展示。
7.如权利要求6中所述的OVS异常告警监控方法,其特征在于,所述自定义格式数据生成包括如下步骤:
对原始数据中的第一部分原始信息按照指令进行原始信息提取;
对原始数据中的第二部分原始信息开展数据统计计算,为自定义数据封装处理中提供处理后的信息;
按照数据解析模块设定的处理层级和逻辑对上述信息进行编辑,并按照设定顺序格式完成数据封装并存储;以此方式,完成数据的封装。
8.如权利要求7所述的OVS异常告警监控方法,其特征在于,所述数据解析包括如下步骤:
执行正常数据和异常数据的过滤处理;
对所述经过过滤的数据信息执行进一步分析,判断故障类型并按照设定的分类依据执行分类;对所述已经分好类别的故障类型事件执行编号处理;
对所述编号处理后数据执行存储,以进行异常信息展示。
9.如权利要求8所述的OVS异常告警监控方法,其特征在于,所述自定义封装子模块所封装的数据信息包括:
节点信息,包括链路状态、端口ID、链路带宽、管理状态、接口ID、端口类型;
接口状态信息,包括端口ID、端口丢包率、收到数据字节数、发送数据包数、收到数据包数、收到的数据字节数、端口编号。
10.一种OVS异常告警监控方法,其特征在于,所述监控方法包括如下步骤:
STEP1:依据接口协议以一定更新周期从云平台中采集原始数据并在终端监控服务器的第一存储设备上存储原始数据;
STEP2:对上述采集的原始数据进行封装处理,生成可在终端监控服务器上按照处理逻辑和队列进行数据处理的自定义数据,上述自定义数据包括设定顺序的信息存储格式,以及从原始数据中提取的数据,以及依据原始数据执行处理后的数据;其中,包括:
STEP2-1:数据封装模块从第一存储设备中执行数据提取,对原始数据中的第一部分原始信息按照指令进行原始信息提取;
STEP2-2:数据封装模块从第一存储设备中执行数据提取,对原始数据中的第二部分原始信息开展数据统计计算,为自定义数据封装处理中提供处理后的信息;
STEP2-3:按照数据解析模块设定的处理层级和逻辑对上述信息进行编辑,并按照设定顺序格式完成数据封装,并在终端监控服务器的第二存储设备上执行存储;以此方式,完成数据的封装;
STEP3:数据解析模块对转换成自定义格式的数据汇总执行处理,生成异常告警监控信息;其中,包括:
STEP3-1:筛除正常数据;其中,数据过滤子模块执行正常数据和异常数据的过滤处理,对正常数据与异常数据的判断信息包括节点链路状态、端口丢包率;
STEP3-2:对上述经过过滤的数据信息执行进一步分析,异常信息判断子模块判断故障类型并执行分类,其中分类的依据包括有故障对系统影响的重要等级;
STEP3-3:对所述已经分好类别的故障类型事件执行编号处理;
STEP3-4:对完成编号处理的数据进行存储,以方便用户端的异常信息展示模块通过数据接口模块执行调用处理,按照异常信息展示模块的选择框调用命令执行相应信息的调用展示处理;
STEP4:执行异常信息的展示
STEP4-1:异常信息展示模块接收异常信息控件选项展示指令,从存储队列调用相应的信息执行异常信息展示。
CN201910941775.1A 2019-09-30 2019-09-30 一种ovs异常告警监控系统及方法 Active CN110806921B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910941775.1A CN110806921B (zh) 2019-09-30 2019-09-30 一种ovs异常告警监控系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910941775.1A CN110806921B (zh) 2019-09-30 2019-09-30 一种ovs异常告警监控系统及方法

Publications (2)

Publication Number Publication Date
CN110806921A true CN110806921A (zh) 2020-02-18
CN110806921B CN110806921B (zh) 2023-02-07

Family

ID=69488010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910941775.1A Active CN110806921B (zh) 2019-09-30 2019-09-30 一种ovs异常告警监控系统及方法

Country Status (1)

Country Link
CN (1) CN110806921B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204453A (zh) * 2021-04-25 2021-08-03 深圳致星科技有限公司 基于异构系统的异常反馈方法、设备、介质及程序产品
CN113701819A (zh) * 2021-08-31 2021-11-26 四川省建筑科学研究院有限公司 一种建筑结构监测方法、监测装置、监测系统及存储介质
CN113837774A (zh) * 2021-09-26 2021-12-24 东莞科耀机电设备有限公司 一种基于云服务的设备售后服务系统及其方法
CN114884801A (zh) * 2022-06-09 2022-08-09 奇安信科技集团股份有限公司 告警方法、装置、电子设备及存储介质
WO2023103344A1 (zh) * 2021-12-08 2023-06-15 深圳前海微众银行股份有限公司 一种数据处理方法、装置、设备及存储介质
WO2023125773A1 (zh) * 2021-12-30 2023-07-06 网络通信与安全紫金山实验室 大规模微服务集群场景下的全局异常处理方法和平台

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130044631A1 (en) * 2011-08-18 2013-02-21 International Business Machines Corporation Methods of forming virtual network overlays
US20160057005A1 (en) * 2014-08-22 2016-02-25 Vmware, Inc. Enabling uniform switch management in virtual infrastructure
CN107667505A (zh) * 2015-06-05 2018-02-06 思科技术公司 用于监控和管理数据中心的系统
CN108156019A (zh) * 2017-11-29 2018-06-12 全球能源互联网研究院有限公司 一种基于sdn的网络衍生告警过滤系统及方法
CN108762886A (zh) * 2018-05-08 2018-11-06 烽火通信科技股份有限公司 虚拟机的故障检测恢复方法及系统
US20190028435A1 (en) * 2017-07-20 2019-01-24 Nicira, Inc. Enhanced network processing of virtual node data packets
CN109358950A (zh) * 2018-10-24 2019-02-19 郑州云海信息技术有限公司 虚拟机告警管理方法和装置
CN109445912A (zh) * 2018-11-14 2019-03-08 国网新疆电力有限公司信息通信公司 一种虚拟机的配置方法、配置系统及sdn控制器
CN110224894A (zh) * 2019-06-18 2019-09-10 国网四川省电力公司内江供电公司 一种智能变电站过程层网络监测管理系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130044631A1 (en) * 2011-08-18 2013-02-21 International Business Machines Corporation Methods of forming virtual network overlays
US20160057005A1 (en) * 2014-08-22 2016-02-25 Vmware, Inc. Enabling uniform switch management in virtual infrastructure
CN107667505A (zh) * 2015-06-05 2018-02-06 思科技术公司 用于监控和管理数据中心的系统
US20190028435A1 (en) * 2017-07-20 2019-01-24 Nicira, Inc. Enhanced network processing of virtual node data packets
CN108156019A (zh) * 2017-11-29 2018-06-12 全球能源互联网研究院有限公司 一种基于sdn的网络衍生告警过滤系统及方法
CN108762886A (zh) * 2018-05-08 2018-11-06 烽火通信科技股份有限公司 虚拟机的故障检测恢复方法及系统
CN109358950A (zh) * 2018-10-24 2019-02-19 郑州云海信息技术有限公司 虚拟机告警管理方法和装置
CN109445912A (zh) * 2018-11-14 2019-03-08 国网新疆电力有限公司信息通信公司 一种虚拟机的配置方法、配置系统及sdn控制器
CN110224894A (zh) * 2019-06-18 2019-09-10 国网四川省电力公司内江供电公司 一种智能变电站过程层网络监测管理系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BO XIE: ""DCFLA:A distributed collaborative-filtering neighbor-locating algorithm"", 《INFORMATION SCIENCES》 *
厉梦如: ""虚拟交换机(vSwitch)原理及配置"", 《HTTPS://ZHILIAO.H3C.COM/THEME/DETAILS/2729》 *
唐宏: ""网络功能虚拟化中的网络转发性能优化技术研究"", 《电信科学》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204453A (zh) * 2021-04-25 2021-08-03 深圳致星科技有限公司 基于异构系统的异常反馈方法、设备、介质及程序产品
CN113204453B (zh) * 2021-04-25 2024-06-11 深圳致星科技有限公司 基于异构系统的异常反馈方法、设备、介质及程序产品
CN113701819A (zh) * 2021-08-31 2021-11-26 四川省建筑科学研究院有限公司 一种建筑结构监测方法、监测装置、监测系统及存储介质
CN113837774A (zh) * 2021-09-26 2021-12-24 东莞科耀机电设备有限公司 一种基于云服务的设备售后服务系统及其方法
WO2023103344A1 (zh) * 2021-12-08 2023-06-15 深圳前海微众银行股份有限公司 一种数据处理方法、装置、设备及存储介质
WO2023125773A1 (zh) * 2021-12-30 2023-07-06 网络通信与安全紫金山实验室 大规模微服务集群场景下的全局异常处理方法和平台
CN114884801A (zh) * 2022-06-09 2022-08-09 奇安信科技集团股份有限公司 告警方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN110806921B (zh) 2023-02-07

Similar Documents

Publication Publication Date Title
CN110806921B (zh) 一种ovs异常告警监控系统及方法
CN112671560B (zh) 一种高可用的分布式实时告警处理方法及系统
CN107508722B (zh) 一种业务监控方法和装置
CN111885012B (zh) 基于多种网络设备信息采集的网络态势感知方法及系统
CN106330602B (zh) 一种云计算虚拟租户网络监控方法及系统
CN104022904B (zh) 分布式机房it设备统一管理平台
US20160359695A1 (en) Network behavior data collection and analytics for anomaly detection
WO2019223062A1 (zh) 系统异常的处理方法和系统
CN112350854B (zh) 一种流量故障定位方法、装置、设备及存储介质
CN104778042A (zh) 一种基于事件流处理和插件式开发框架的流数据处理方法
CN103929334A (zh) 网络异常通知方法和装置
CN113364624B (zh) 基于边缘计算的混合云流量采集方法和系统
CN113364651B (zh) 一种分布式网络流量采集方法
CN109960634A (zh) 一种应用程序监控方法、装置及系统
CN105007175A (zh) 一种基于openflow的流深度关联分析方法及系统
KR20180086919A (ko) 네트워크 보안 기능 가상화 기반의 클라우드 보안 분석 장치, 보안 정책 관리 장치 및 보안 정책 관리 방법
CN102195791A (zh) 一种告警的分析方法、装置及系统
CN115102730A (zh) 多种设备的一体化监控方法
CN115484047A (zh) 云平台中的泛洪攻击的识别方法、装置、设备及存储介质
TWI448975B (zh) 應用於影像監控平台的分散式運算系統
CN104486122A (zh) 基于看门狗的路由器异常恢复系统及方法
CN112835794B (zh) 一种基于Swoole的代码执行问题的定位监测方法及系统
Bashir et al. VirtMonE: Efficient detection of elephant flows in virtualized data centers
CN112636965B (zh) 一种云环境下虚机网络连通性监控方法
EP3815303B1 (en) Automated network monitoring and control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant