CN111404716B - 一种协同告警处理的方法及系统 - Google Patents

一种协同告警处理的方法及系统 Download PDF

Info

Publication number
CN111404716B
CN111404716B CN201910002561.8A CN201910002561A CN111404716B CN 111404716 B CN111404716 B CN 111404716B CN 201910002561 A CN201910002561 A CN 201910002561A CN 111404716 B CN111404716 B CN 111404716B
Authority
CN
China
Prior art keywords
oss
network element
alarm information
hardware
nfvo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910002561.8A
Other languages
English (en)
Other versions
CN111404716A (zh
Inventor
纪春芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Communications Ltd Research Institute filed Critical China Mobile Communications Group Co Ltd
Priority to CN201910002561.8A priority Critical patent/CN111404716B/zh
Publication of CN111404716A publication Critical patent/CN111404716A/zh
Application granted granted Critical
Publication of CN111404716B publication Critical patent/CN111404716B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0613Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on the type or category of the network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0618Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on the physical or logical position

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及通信领域,公开了一种协同告警处理的方法及系统,用于为NFVO制定有效的协同处理机制,保证告警事件的及时处理。该方法为:NFVO接收到硬件类告警信息以及网元类告警信息后,基于预设的筛选规则,从与所述硬件类告警信息关联的至少两个网元类告警信息的物理区域标识对应的OSS中,筛选出目标OSS,并指示所述目标OSS基于所述硬件类告警信息进行故障处理,这样,由于通过物理区域标识来实现信息之间的关联,这样,便在MAGO集中部署而OSS分区部署的情况下,通过NFVO与OSS之间的协同操作,有效地制定了针对硬件告警和网元告警的协同故障处理方案,实现了网元和硬件资源的高效运维。

Description

一种协同告警处理的方法及系统
技术领域
本发明涉及通信领域,尤其涉及一种协同告警处理的方法及系统。
背景技术
虚拟化网络功能(Network Function Virtualization,NFV)技术,是指采用虚拟化技术,将传统的电信设备与硬件解耦,可基于通用的计算、存储、网络设备实现电信网络功能,从而提升管理和维护效率,增强系统灵活性。
目前现网部署的网元有两大类:物理网元和用于物联网的少量虚拟化网元,这两大类网元都是分别分散部署在各省份的,不同省份的网元相互之间不共享硬件和软件资源。
参阅图1所示,目前现网中,运营支撑系统(Operations Support System,OSS)都是按照省级建设的,各省级的OSS分别管理各省的网元,运营商集团会设置集中式的OSS系统,但主要是通过接口接收省级的OSS上报来的少量汇总数据,基本不承担生产功能。随着NFV逐步商用化,相关标准要求集中建设电信云资源池,因此VNF是物理区域上集中部署,但是逻辑功能上又区分服务省份,初期网元的运维依然由各省分别承担。
如图1所示,已有技术下,在NFV系统标准定义的网络架构中增加了虚拟网络功能基础设施(NFV Infrastructure,NFVI)、虚拟机基础设施管理(VirtualizedInfrastructureManager,VIM)、虚拟化网元(Virtualized Network Function,VNF)、虚拟网络功能管理(VNF Manager,VNFM)和虚拟网络功能调度(NFV Orchestrator,NFVO)等功能节点;其中NFVO、VNFM和VIM一起被称为管理编排(Management and orchestration,MANO)。
如图1所示,基于上述网络架构,网元管理系统(Element Management System,EMS)用于收集各个VNF的运行状态信息,并向NFVO上报,VNFM用于记录各个VNF和虚拟化平台中各个虚拟机之间的映射关系,并上报至NFVO,而VIM,用于记录各个虚拟机和底层的硬件之间的关联关系,以及记录各个硬件的运行状态信息,并上报至NFVO。
可见,按照当前规划,NFV商用时会建设集中的虚拟网络功能调度(NFVOrchestrator,NFVO),用于汇总并处理系统中各个层级的上报信息,但是并不同期建设集中的运营支撑系统(Operations Support System,OSS)系统。因此,理论上,NFVO会统一收集各省的相关运营数据,再下发至各省级的OSS。
但是,VNF的运行状态信息和硬件的运行状态信息中,均有可能包含告警信息,而VNF告警的原因有可能是硬件原因引起的,实际应用中,VNF能够按照省份进行区分,而硬件中部分硬件资源能够按照省份区分,还有部分硬件不能够按照区分省份的,是各省之间共享的。
那么,当共享的硬件资源引发告警而导致相应的VNF告警时,已有技术下,针对NFVO没有制定的相应的协同处理机制,因此,NFVO无法及时决策由哪一个省份的OSS进行告警处理。
发明内容
本发明的目的是提供一种协同告警处理的方法,用于针对告警事件,为NFVO制定有效的协同处理机制,保证告警事件的及时处理。
本发明实施例提供的具体技术方案如下:
一种协同告警处理的方法,包括:
虚拟网络功能调度NFVO接收硬件类告警信息以及网元类告警信息;其中,硬件类告警信息是由虚拟机基础设施管理VIM上报的,各个网元类告警信息是由网元管理系统EMS上报的,不同的网元类告警信息关联不同的物理区域标识;
NFVO基于共享硬件资源与虚拟化网元VNF之间的关联关系,确定与所述硬件类告警信息关联的至少两个网元类告警信息;
NFVO基于所述至少两个网元告警信息关联的物理区域标识,将相应的运营支撑系统OSS作为待选OSS,并基于预设的筛选规则,从所述待选OSS中筛选出目标OSS;
NFVO指示所述目标OSS基于所述硬件类告警信息进行故障处理。
可选的,进一步包括:
NFVO接收到硬件类告警信息后,将所述硬件类告警信息在本地进行保存;以及,
NFVO接收到网元类告警信息后,按照网元类告警信息关联的物理标识信息,分别将各个网元类告警信息发送至相应的OSS。
可选的,NFVO基于共享硬件资源与VNF之间的关联关系,确定与所述硬件类告警信息关联的至少两个网元类告警信息之前,进一步包括:
NFVO基于EMS上报的网元类告警信息关联的物理区域标识,和VIM上报的虚拟机的运行状态信息中携带的物理区域标识,确定VNF和虚拟机之间的关联关系;
NFVO获取VIM上报的共享硬件资源与虚拟机之间的关联关系;
NFVO根据所述VNF和虚拟机之间的关联关系,以及所述共享硬件资源与虚拟机之间的关联关系,确定共享硬件资源与VNF之间的关联关系。
可选的,NFVO基于预设的筛选规则,从所述待选OSS中筛选出目标OSS,包括:
将告警级别最高的网元类告警信息关联的物理地区标识对应的待选OSS,作为目标OSS;以及,
若存在多个告警级别最高的网元类告警信息,则基于所述多个告警级别最高的网元类告警信息关联的物理地区标识,将关联的网元类告警信息最多的物理地区标识对应的待选OSS,作为目标OSS;以及,
若存在多个关联的网元类告警信号最多的物理地区标识,则从所述多个关联的网元类告警信号最多的物理地区标识中,随机选取一个物理地区标识,并将相应的待选OSS作为目标OSS。
可选的,NFVO指示所述目标OSS基于所述硬件类告警信息进行故障处理,包括:
NFVO将所述硬件类告警信息发送至所述目标OSS,并通知所述目标OSS,所述硬件类告警信息与所述目标OSS的物理区域标识对应的网元类告警信息相关联,触发所述目标OSS基于所述硬件类告警进行故障处理。
可选的,进一步包括:
NFVO将所述硬件类告警信息发送至所述待选OSS中除所述目标OSS之外的其他OSS,并通知所述其他OSS,所述硬件类告警信息与所述待选OSS的物理区域标识对应的网元类告警信息相关联。
可选的,NFVO指示所述目标OSS基于所述硬件类告警信息进行故障处理之后,进一步包括:
NFVO接收目标OSS反馈的每一种故障处理操作,并将所述每一种故障处理操作通知所述待选OSS中除所述目标OSS之外的其他OSS;
NFVO根据VIM通知,定期更新所述硬件类告警信息对应的共享硬件资源的最新状态。
可选的,进一步包括:
NFVO根据VIM通知,确定所述硬件类告警信息对应的共享硬件资源的故障已清除时,当故障处理结果通知所述目标OSS以及所述其他OSS。
一种协同告警处理的系统,包括:
接收模块,用于接收硬件类告警信息以及网元类告警信息;其中,硬件类告警信息是由虚拟机基础设施管理VIM上报的,各个网元类告警信息是由网元管理系统EMS上报的,不同的网元类告警信息关联不同的物理区域标识;
确定模块,用于基于共享硬件资源与虚拟化网元VNF之间的关联关系,确定与所述硬件类告警信息关联的至少两个网元类告警信息;
协同处理模块,用于基于所述至少两个网元告警信息关联的物理区域标识,将相应的运营支撑系统OSS作为待选OSS,并基于预设的筛选规则,从所述待选OSS中筛选出目标OSS;
发送模块,用于指示所述目标OSS基于所述硬件类告警信息进行故障处理。
可选的,所述接收模块进一步用于:
接收到硬件类告警信息后,将所述硬件类告警信息在本地进行保存;以及,
接收到网元类告警信息后,按照网元类告警信息关联的物理标识信息,分别将各个网元类告警信息发送至相应的OSS。
可选的,基于共享硬件资源与VNF之间的关联关系,确定与所述硬件类告警信息关联的至少两个网元类告警信息之前,所述确定单元进一步用于:
基于EMS上报的网元类告警信息关联的物理区域标识,和VIM上报的虚拟机的运行状态信息中携带的物理区域标识,确定VNF和虚拟机之间的关联关系;
获取VIM上报的共享硬件资源与虚拟机之间的关联关系;
根据所述VNF和虚拟机之间的关联关系,以及所述共享硬件资源与虚拟机之间的关联关系,确定共享硬件资源与VNF之间的关联关系。
可选的,基于预设的筛选规则,从所述待选OSS中筛选出目标OSS时,所述协同处理模块用于:
将告警级别最高的网元类告警信息关联的物理地区标识对应的待选OSS,作为目标OSS;以及,
若存在多个告警级别最高的网元类告警信息,则基于所述多个告警级别最高的网元类告警信息关联的物理地区标识,将关联的网元类告警信息最多的物理地区标识对应的待选OSS,作为目标OSS;以及,
若存在多个关联的网元类告警信号最多的物理地区标识,则从所述多个关联的网元类告警信号最多的物理地区标识中,随机选取一个物理地区标识,并将相应的待选OSS作为目标OSS。
可选的,指示所述目标OSS基于所述硬件类告警信息进行故障处理时,所述发送模块用于:
将所述硬件类告警信息发送至所述目标OSS,并通知所述目标OSS,所述硬件类告警信息与所述目标OSS的物理区域标识对应的网元类告警信息相关联,触发所述目标OSS基于所述硬件类告警进行故障处理。
可选的,所述发送模块进一步用于:
将所述硬件类告警信息发送至所述待选OSS中除所述目标OSS之外的其他OSS,并通知所述其他OSS,所述硬件类告警信息与所述待选OSS的物理区域标识对应的网元类告警信息相关联。
可选的,指示所述目标OSS基于所述硬件类告警信息进行故障处理之后,所述接收模块进一步用于:
接收目标OSS反馈的每一种故障处理操作,并通过所述发送模块将所述每一种故障处理操作通知所述待选OSS中除所述目标OSS之外的其他OSS;
根据VIM通知,定期更新所述硬件类告警信息对应的共享硬件资源的最新状态。
可选的,所述发送模块进一步用于:
根据VIM通知,确定所述硬件类告警信息对应的共享硬件资源的故障已清除时,当故障处理结果通知所述目标OSS以及所述其他OSS。
一种存储介质,存储有用于实现协同告警处理的方法的程序,执行以下步骤:
接收硬件类告警信息以及网元类告警信息;其中,硬件类告警信息是由虚拟机基础设施管理VIM上报的,各个网元类告警信息是由网元管理系统EMS上报的,不同的网元类告警信息关联不同的物理区域标识;
基于共享硬件资源与虚拟化网元VNF之间的关联关系,确定与所述硬件类告警信息关联的至少两个网元类告警信息;
基于所述至少两个网元告警信息关联的物理区域标识,将相应的运营支撑系统OSS作为待选OSS,并基于预设的筛选规则,从所述待选OSS中筛选出目标OSS;
指示所述目标OSS基于所述硬件类告警信息进行故障处理。
一种通信设备,包括一个或多个处理器;以及一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被所述一个或多个处理器执行时,使得所述装置执行上述任一项所述的方法。
本发明实施例中,NFVO接收到硬件类告警信息以及网元类告警信息后,基于预设的筛选规则,从与所述硬件类告警信息关联的至少两个网元类告警信息的物理区域标识对应的OSS中,筛选出目标OSS,并指示所述目标OSS基于所述硬件类告警信息进行故障处理,这样,由于通过物理区域标识来实现信息之间的关联,这样,便在MAGO集中部署而OSS分区部署的情况下,通过NFVO与OSS之间的协同操作,有效地制定了针对硬件告警和网元告警的协同故障处理方案,实现了网元和硬件资源的高效运维。
附图说明
图1为已有技术下和本发明实施例中NFV系统标准定义的网络架构示意图;
图2为本发明实施例中NFVO接收上报的运行状态信息的流程示意图;
图3为本发明实施例中NFVO和OSS进行协同告警处理流程示意图;
图4为本发明实施例中NFVO功能结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1所示,本发明实施例中,VNF在部署时会指定服务的省份,即VNF会按照省份进行部署,并且和MANO集中部署在指定区域,所有VNF共享底层的NFVI资源,即共享虚拟机资源以及共享硬件资源。
NFVO对VNF进行分省运维时,为了安全考虑,不允许NFVO将NFVI的全面的运行状态信息(如,配置信息、告警信息和性能信息)报送给省级的OSS。
本发明实施例中,如图1所示,EMS、VNFM、VIM和NFVO均采用集中式设置,其中,
EMS,用于管理各个VNF,一个EMS可以管理至少一个VNF,用于向NFVO上报管辖的VNF的运行状态信息,一个VNF的运行状态信息至少包含VNF的配置信息、告警信息和性能信息。
VNFM,用于向NFVO上报VNF和虚拟机之间的对应关系。
VIM,用于向NFVO上报虚拟机和低层硬件之间的对应关系,以及上报虚拟机的运行状态信息,以及硬件的运行状态信息,一个硬件的运行状态信息至少包含硬件的配置信息、告警信息和性能信息。
一个硬件的运行状态信息至少包含硬件的配置信息、告警信息和性能信息。
为了实现EMS、VIM、NFVO和省级的OSS之间的有效协同,实现高效运维,本发明实施例中,NFVO会按照以下原则采集上报的信息:
首先,NFVO需要具备按OSS的物理区域进行区域性数据分发的能力,如,针对A省的OSS,只下发A省的相关信息。
同时,为了配合NFVO的区域性数据分发,EMS在将VNF的运行状态信息上报给NFVO时,需要在VNF的运行状态信息中添加物理区域标识,如,省份标识;以及,VIM在将虚拟机的运行状态信息上报给NFVO时,需要在虚拟机的运行状态信息中添加虚拟机的物理区域标识,如,省份标识。
其次,对于硬件层面的各个虚拟机的宿主机、分布式存储等公共资源而言,这些公共资源会被上层的各个VNF共享,而当这些共享的公共资源出现故障时,可能会影响多个省的业务,理论上,这应该通过一套有效的协同处理机制,由NFVO指派出现故障的公共资源牵连到的其中一个省的OSS,通知相应的运维人员负责处理和跟进公共资源的故障,出现故障的公共资源牵连到的其他省的OSS只需要通知运维人员处理本省的网元侧故障即可,并关注公共资源的故障处理结果,以便判断公共资源的故障对本省的业务的影响,以及负责处理和跟进公共资源的故障的运维人员,也需要了解该公共资源的故障影响了哪些省份的哪些网元。
再次,需要增设协同处理模块,来设置协同处理规则,所述协同处理规则用于指示根据共享的公共资源对多省的网元的影响程度,来确定具体由哪一个省的OSS负责通知运维人员对公共资源的故障进行处理,进一步地,由于协同处理规则需要及时更新,因此,协同处理模块需要具备对协同处理规则进行增加、修改、查询和删除的管理能力。
本发明实施例中,协同处理模块可以是独立的装置,也可以是NFVO中增设的功能模块,后续实施例中,以后者为例进行说明,将不再赘述。
最后,按照国际标准,EMS会与OSS对接,但是,由于全国范围内没有集中部署的OSS系统,只有集中部署的NFVO和集中部署的EMS,因此,集中部署的EMS需要对接集中部署的NFVO,集中的NFVO需要能够接收集中部署的EMS上报的数据并做进一步处理,如,告警关联和告警根因分析等等,这一点将在后续实施例中作出进一步详细介绍。
参阅图2所示,本发明实施例中,集中部署的NFVO接收其他网元上报的运行状态信息的详细流程如下:
步骤200:NFVO接收集中部署的EMS上报的各个VNF的运行状态信息,一个VNF的运行状态信息中携带有所述VNF的物理区域标识。
实际应用中,其中,一个VNF的运行状态信息至少包含所述一个VNF的配置信息和性能信息,进一步的,在所述一个VNF发生故障时,所述一个VNF的运行状态信息中还可以进一步携带有所述一个VNF的告警信息。
步骤201:NFVO按照各个VNF的物理区域标识,将各个VNF的运行状态信息下发至相应的OSS,其中,一个OSS对应一种物理区域标识。
步骤202:NFVO接收集中部署的VIM上报的各个虚拟机的运行状态信息,以及共享硬件资源的运行状态信息,其中,一个虚拟机的运行状态信息中携带有所述虚拟机的物理区域信息。
实际应用中,其中,一个虚拟机的运行状态信息至少包含所述一个虚拟机的配置信息和性能信息,进一步的,在所述一个虚拟机发生故障时,所述一个虚拟机的运行状态信息中还可以进一步携带有所述一个虚拟机的告警信息;
一个共享硬件资源的运行状态信息至少包含所述一个共享硬件资源的配置信息和性能信息,进一步的,在所述一个共享硬件资源发生故障时,所述一个虚拟机的运行状态信息中还可以进一步携带有所述一个共享硬件资源的告警信息。
步骤203:NFVO按照各个虚拟机的物理区域标识,将各个虚拟机的运行状态信息下发至相应的OSS。
具体的,本发明实施例中,一个虚拟机最多只能承载一个省份的VNF,因此,虚拟机也是可以按照服务的省份进行区分的。
理论上,集中部署的NFVO可以根据VNFM通知的VNF和虚拟机之间的关联关系,将相关联的VNF的运行状态信息和虚拟机的运行状态信息一同下发给相应的OSS,但是,由于集中部署的NFVO需要对接多个VIM和多个EMS,还要实时对各类资源进行编排,为了尽量减轻NFVO的数据分拣压力,要求VIM上报各个虚拟机的运行状态信息时,要携带物理区域标识,方便NFVO对数据进行分拣。
步骤204:NFVO在本地保存的共享硬件资源的运行状态信息。
实际应用中,由于共享硬件资源(如,宿主机、分布式存储等)是在各省OSS之间共享的,因此无法按照物理区域进行区分,因此,从安全角度出发,NFVO不能将共享硬件资源的运行状态信息进行下发,只能在本地保存管理。
基于上述实施例,当NFVO接收到的共享硬件资源的运行状态信息中携带有硬件类的告警信息时,NFVO可以根据VIM上报的共享硬件资源和虚拟机之间的关联关系,以及虚拟机和VNF之间的关联关系,确认硬件类的告警信息会影响到哪些VNF的服务,从而通知这些VNF对应的OSS进行协同处理。
为了便于说明,下面以两个OSS为例进行介绍,其中,一个称为A省OSS,一个称为B省OSS,A省OSS和B省OSS使用相同的共享硬件资源,参阅图3所示,本发明实施例中,NFVO与各个OSS进行协同告警处理的详细流程如下:
步骤300:NFVO从EMS接收第一网元类告警信息,并将第一网元类告警信息发送至A省OSS,所述第一网元类告警信息是A省对应的VNF触发上报的。
具体的,EMS可以将A省部署的VNF的运行状态信息上报至NFVO,NFVO根据运行状态信息中携带的物理区域标识,确定上述运行状态信息与A省关联,其中,在A省的VNF发生故障时,NFVO可以从A省的运行状态信息中进一步获取到A省的第一网元类告警信息。
步骤301:NFVO从EMS接收第一网元类告警信息,并将第一网元类告警信息发送至A省OSS,所述第一网元类告警信息是A省对应的VNF触发上报的。
具体的,EMS可以将B省部署的VNF的运行状态信息上报至NFVO,NFVO根据运行状态信息中携带的物理区域标识,确定上述运行状态信息与B省关联,其中,在B省的VNF发生故障时,NFVO可以从B省的运行状态信息中进一步获取到B省的第二网元类告警信息。
步骤302:NFVO从VIM接收硬件类告警信息。
具体的,由于硬件类的资源是共享的,因此,共享硬件资源发生故障后,其硬件类告警信息由VIM上传至NFVO。
步骤303、NFVO根据VIM上报的硬件与虚拟机之间的关联关系,以及虚拟机与VNF之间的关联关系,确定硬件告警信息与所述第一网元类告警信息以及所述第二网元类告警信息关联。
VIM会向NFVO上报硬件与虚拟机之间的关联关系,即每个虚拟机具体是由哪些共享硬件资源支撑的。
而由于EMS上报的VNF的运行状态信息中携带有物理区域标识,以及VIM上报的虚拟机的运行状态信息中也携带有物理区域标识,因此,NFVO基于物理区域标识,便可以确定VNF和虚拟机之间的关联关系,再结合硬件与虚拟机之间的关联关系,NFVO可以迅速确定每一个VNF是由哪些共享硬件资源支撑的,因此,当共享硬件资源发生故障,NFVO接收到硬件类告警信息时,以及同时也接收到网元类告警信息时,便可以迅速确定硬件类故障触发了哪些VNF发生了网元类故障,即可以迅速确定硬件类告警信息与网元类告警信息之间的关联关系。
本发明实施例中,NFVO执行告警关联和根因分析,确定硬件类告警信息(如,资源池1内host01告警)与所述第一网元类告警信息以及所述第二网元类告警信息关联,即硬件类告警信息引起了A省的VNF发生故障从而触发EMS上报第一网元类告警信息,以及上述硬件类告警信息同时引起了B省的VNF发生故障,从而触发EMS上报第二网元类告警信息。
步骤304:NFVO通知NFVO中的协同处理模块,所述硬件告警信息与所述第一网元类告警信息以及所述第二网元类告警信息关联。
步骤305:NFVO中的协同处理模块将A省OSS和B省OSS作为待选OSS,基于预设的筛选规则,选取A省OSS作为目标OSS。
本发明实施例中,如图3所示,协同处理模块用于在本地预先设置并维护筛选规则,以及基于预设规则,从待选OSS中选取目标OSS,的设置和执行均由NFVO中的协同处理模块操作,具体的,协同处理模块在使用筛选规则时,具体可以采用但不限于以下方式:
NFVO中的协同处理模块将告警级别最高的网元类告警信息关联的物理地区标识对应的待选OSS,作为目标OSS。
例如,如果A省VNF的告警级别>B省VNF的告警级别,则选取A省OSS作为目标OSS来负责处理上述硬件类告警信息对应的硬件故障。
进一步地,若存在多个告警级别最高的网元类告警信息,则基于所述多个告警级别最高的网元类告警信息关联的物理地区标识,将关联的网元类告警信息最多的物理地区标识对应的待选OSS,作为目标OSS。
例如,假设A省VNF的告警区别=B省VNF的告警级别,则如果A省VNF的告警数量>B省VNF的告警数量,则选取A省OSS作为目标OSS来负责处理上述硬件类告警信息对应的硬件故障。
进一步地,若存在多个关联的网元类告警信号最多的物理地区标识,则从所述多个关联的网元类告警信号最多的物理地区标识中,随机选取一个物理地区标识,并将相应的待选OSS作为目标OSS。
可选的,上述方式1中作说的由于VNF故障触发的网元类告警信息,是指受同一个共享硬件资源故障影响的VNF告警。
另一方面,实际应用中,NFVO中的协同处理模块还将与硬件类告警信息对应的故障位置处于同一物理区域的待选OSS,作为目标OSS。
例如,假设共享硬件资源设置在C省,则NFVO中的协同处理模块将C省的OSS作为目标OSS。
步骤306:NFVO中的协同处理模块通知NFVO已选取A省OSS和作为目标OSS。
步骤307:NFVO向A省OSS发送所述硬件类告警信息,通知A省OSS已选取所述A省OSS进行故障处理。
具体的,NFVO向A省OSS发送所述硬件类告警信息之后,NFVO还需要通知A省OSS,所述硬件类告警信息与A省OSS的物理区域标识对应的第一网元类告警信息相关联,触发A目标OSS基于所述硬件类告警进行故障处理。
步骤308:NFVO向B省OSS发送所述硬件类告警信息,通知B省OSS已选取所述A省OSS进行故障处理。
具体的,NFVO向B省OSS发送所述硬件类告警信息之后,NFVO还需要通知B省OSS,所述硬件类告警信息与B省OSS的物理区域标识关联的第二网元类告警信息相关联。
即NFVO需要将硬件类告警信息通知到每一个关联的待选OSS,因为这些待选OSS对应的网元类告警信息均是由所述硬件类告警信息触发的。
步骤309:A省OSS开始进行故障处理,并将执行的第一种故障处理操作通知NFVO。
具体的,A省OSS会向运维人员呈现所述硬件故障告警信息以及所述第一网元类告警信息,运维人员会执行相应的故障处理,并在A省OSS上进行记录,A省OSS会将运维人员记录的每一种故障处理操作通知NFVO。
步骤310:NFVO根据VIM通知,定期更新所述硬件类告警信息对应的共享硬件资源的最新状态。
这样,NFVO可以随时掌握共享硬件资源的故障恢复进程,从而在故障恢复的第一时间便可以及时获知运维结果,便于后续操作。
步骤311:NFVO将A省OSS针对所述硬件类告警信息执行的每一种故障处理操作通知到B省OSS。
具体的,NFVO也会将A省OSS执行的每一种故障处理操作通知到每一个待选OSS,以便在全网范围内掌握故障恢复进程。
步骤312:NFVO根据VIM通知,确定所述硬件类告警信息对应的共享硬件资源的故障已清除。
步骤313:NFVO通知A省OSS所述硬件类告警信息对应的故障已清除。
这样,A省OSS便可以获知硬件故障已成功排除,从而停止故障处理操作,同时,也可以确认第一网元类告警信息对应的VNF故障能够恢复正常。
步骤314:NFVO通知B省OSS所述硬件类告警信息对应的故障已清除。
这样,待选OSS中的其他OSS也可以及时获知硬件故障已排除,同时,B省OSS也可以确认第二网元类告警信息对应的VNF故障也能够恢复正常。
例如,假设所述硬件类告警信息对应的故障为资源池1host01告警,那么,当资源池1host01恢复正常时,NFVO需要通知A省OSS及B省OSS,清除所述硬件类告警信息。
基于上述实施例,参阅图4所示,本发明实施例中,用于协同告警处理的系统(如,NFVO),至少包括接收模块40、确定模块41、协同处理模块42和发送模块43,其中,
接收模块40,用于接收硬件类告警信息以及网元类告警信息;其中,硬件类告警信息是由虚拟机基础设施管理VIM上报的,各个网元类告警信息是由网元管理系统EMS上报的,不同的网元类告警信息关联不同的物理区域标识;
确定模块41,用于基于共享硬件资源与虚拟化网元VNF之间的关联关系,确定与所述硬件类告警信息关联的至少两个网元类告警信息;
协同处理模块42,用于基于所述至少两个网元告警信息关联的物理区域标识,将相应的运营支撑系统OSS作为待选OSS,并基于预设的筛选规则,从所述待选OSS中筛选出目标OSS;
发送模块43,用于指示所述目标OSS基于所述硬件类告警信息进行故障处理。
可选的,接收模块40进一步用于:
接收到硬件类告警信息后,将所述硬件类告警信息在本地进行保存;以及,
接收到网元类告警信息后,按照网元类告警信息关联的物理标识信息,分别将各个网元类告警信息发送至相应的OSS。
可选的,基于共享硬件资源与VNF之间的关联关系,确定与所述硬件类告警信息关联的至少两个网元类告警信息之前,确定单元41进一步用于:
基于EMS上报的网元类告警信息关联的物理区域标识,和VIM上报的虚拟机的运行状态信息中携带的物理区域标识,确定VNF和虚拟机之间的关联关系;
获取VIM上报的共享硬件资源与虚拟机之间的关联关系;
根据所述VNF和虚拟机之间的关联关系,以及所述共享硬件资源与虚拟机之间的关联关系,确定共享硬件资源与VNF之间的关联关系。
可选的,基于预设的筛选规则,从所述待选OSS中筛选出目标OSS时,协同处理模块42用于:
将告警级别最高的网元类告警信息关联的物理地区标识对应的待选OSS,作为目标OSS;以及,
若存在多个告警级别最高的网元类告警信息,则基于所述多个告警级别最高的网元类告警信息关联的物理地区标识,将关联的网元类告警信息最多的物理地区标识对应的待选OSS,作为目标OSS;以及,
若存在多个关联的网元类告警信号最多的物理地区标识,则从所述多个关联的网元类告警信号最多的物理地区标识中,随机选取一个物理地区标识,并将相应的待选OSS作为目标OSS。
可选的,指示所述目标OSS基于所述硬件类告警信息进行故障处理时,发送模块43用于:
将所述硬件类告警信息发送至所述目标OSS,并通知所述目标OSS,所述硬件类告警信息与所述目标OSS的物理区域标识对应的网元类告警信息相关联,触发所述目标OSS基于所述硬件类告警进行故障处理。
可选的,发送模块43进一步用于:
将所述硬件类告警信息发送至所述待选OSS中除所述目标OSS之外的其他OSS,并通知所述其他OSS,所述硬件类告警信息与所述待选OSS的物理区域标识对应的网元类告警信息相关联。
可选的,指示所述目标OSS基于所述硬件类告警信息进行故障处理之后,接收模块40进一步用于:
接收目标OSS反馈的每一种故障处理操作,并通过所述发送模块将所述每一种故障处理操作通知所述待选OSS中除所述目标OSS之外的其他OSS;
根据VIM通知,定期更新所述硬件类告警信息对应的共享硬件资源的最新状态。
可选的,发送模块43进一步用于:
根据VIM通知,确定所述硬件类告警信息对应的共享硬件资源的故障已清除时,当故障处理结果通知所述目标OSS以及所述其他OSS。
基于同一发明构思,本发明实施例中提供一种存储介质,存储有用于实现协同告警处理的方法的程序,执行以下步骤:
接收硬件类告警信息以及网元类告警信息;其中,硬件类告警信息是由虚拟机基础设施管理VIM上报的,各个网元类告警信息是由网元管理系统EMS上报的,不同的网元类告警信息关联不同的物理区域标识;
基于共享硬件资源与虚拟化网元VNF之间的关联关系,确定与所述硬件类告警信息关联的至少两个网元类告警信息;
基于所述至少两个网元告警信息关联的物理区域标识,将相应的运营支撑系统OSS作为待选OSS,并基于预设的筛选规则,从所述待选OSS中筛选出目标OSS;
指示所述目标OSS基于所述硬件类告警信息进行故障处理。
基于同一发明构思,本发明实施例提供一种通信设备,包括一个或多个处理器;以及一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被所述一个或多个处理器执行时,使得所述装置执行上述任一项所述的方法。
综上所述,本发明实施例中,NFVO接收到硬件类告警信息以及网元类告警信息后,基于预设的筛选规则,从与所述硬件类告警信息关联的至少两个网元类告警信息的物理区域标识对应的OSS中,筛选出目标OSS,并指示所述目标OSS基于所述硬件类告警信息进行故障处理,这样,由于通过物理区域标识来实现信息之间的关联,这样,便在MAGO集中部署而OSS分区部署的情况下,通过NFVO与OSS之间的协同操作,有效地制定了针对硬件告警和网元告警的协同故障处理方案,实现了网元和硬件资源的高效运维。
进一步地,本发明实施例中,由于EMS和VIM向NFVO上报的各类信息中均携带有相应的物理区域标识,这样,有利于NFVO对数据的分拣及分类,在一定程度上有效减轻了NFVO的运行压力。
进一步地,本发明实施例中,还会在故障处理方(即目标OSS)和故障影响方(即其他OSS)之间,共享故障原因以及故障处理方式,这样,可以让各个物理区域内的OSS,均可以及时了解共享硬件资源的故障,对自身物理区域的VNF以及其他物理区域的VNF在运行方面的影响,便于随时掌握故障处理进程,了解故障处理的实时状态变化。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (11)

1.一种协同告警处理的方法,其特征在于,包括:
虚拟网络功能调度NFVO接收硬件类告警信息以及网元类告警信息;其中,硬件类告警信息是由虚拟机基础设施管理VIM上报的,各个网元类告警信息是由网元管理系统EMS上报的,不同的网元类告警信息关联不同的物理区域标识;
NFVO基于共享硬件资源与虚拟化网元VNF之间的关联关系,确定与所述硬件类告警信息关联的至少两个网元类告警信息;
NFVO基于所述至少两个网元类告警信息关联的物理区域标识,将相应的运营支撑系统OSS作为待选OSS,并基于预设的筛选规则,从所述待选OSS中筛选出目标OSS:将告警级别最高的网元类告警信息关联的物理区域标识对应的待选OSS,作为目标OSS;
NFVO指示所述目标OSS基于所述硬件类告警信息进行故障处理。
2.如权利要求1所述的方法,其特征在于,进一步包括:
NFVO接收到硬件类告警信息后,将所述硬件类告警信息在本地进行保存;以及,
NFVO接收到网元类告警信息后,按照网元类告警信息关联的物理标识信息,分别将各个网元类告警信息发送至相应的OSS。
3.如权利要求1所述的方法,其特征在于,NFVO基于共享硬件资源与VNF之间的关联关系,确定与所述硬件类告警信息关联的至少两个网元类告警信息之前,进一步包括:
NFVO基于EMS上报的网元类告警信息关联的物理区域标识,和VIM上报的虚拟机的运行状态信息中携带的物理区域标识,确定VNF和虚拟机之间的关联关系;
NFVO获取VIM上报的共享硬件资源与虚拟机之间的关联关系;
NFVO根据所述VNF和虚拟机之间的关联关系,以及所述共享硬件资源与虚拟机之间的关联关系,确定共享硬件资源与VNF之间的关联关系。
4.如权利要求1所述的方法,其特征在于,还包括:
若存在多个告警级别最高的网元类告警信息,则基于所述多个告警级别最高的网元类告警信息关联的物理区域标识,将关联的网元类告警信息最多的物理区域标识对应的待选OSS,作为目标OSS;以及;
若存在多个关联的网元类告警信号最多的物理区域标识,则从所述多个关联的网元类告警信号最多的物理区域标识中,随机选取一个物理区域标识,并将相应的待选OSS作为目标OSS。
5.如权利要求1、2或3所述的方法,其特征在于,NFVO指示所述目标OSS基于所述硬件类告警信息进行故障处理,包括:
NFVO将所述硬件类告警信息发送至所述目标OSS,并通知所述目标OSS,所述硬件类告警信息与所述目标OSS的物理区域标识对应的网元类告警信息相关联,触发所述目标OSS基于所述硬件类告警进行故障处理。
6.如权利要求5所述的方法,其特征在于,进一步包括:
NFVO将所述硬件类告警信息发送至所述待选OSS中除所述目标OSS之外的其他OSS,并通知所述其他OSS,所述硬件类告警信息与所述待选OSS的物理区域标识对应的网元类告警信息相关联。
7.如权利要求1、2或3所述的方法,其特征在于,NFVO指示所述目标OSS基于所述硬件类告警信息进行故障处理之后,进一步包括:
NFVO接收目标OSS反馈的每一种故障处理操作,并将所述每一种故障处理操作通知所述待选OSS中除所述目标OSS之外的其他OSS;
NFVO根据VIM通知,定期更新所述硬件类告警信息对应的共享硬件资源的最新状态。
8.如权利要求7所述的方法,其特征在于,进一步包括:
NFVO根据VIM通知,确定所述硬件类告警信息对应的共享硬件资源的故障已清除时,当故障处理结果通知所述目标OSS以及所述其他OSS。
9.一种协同告警处理的系统,其特征在于,包括:
接收模块,用于接收硬件类告警信息以及网元类告警信息;其中,硬件类告警信息是由虚拟机基础设施管理VIM上报的,各个网元类告警信息是由网元管理系统EMS上报的,不同的网元类告警信息关联不同的物理区域标识;
确定模块,用于基于共享硬件资源与虚拟化网元VNF之间的关联关系,确定与所述硬件类告警信息关联的至少两个网元类告警信息;
协同处理模块,用于基于所述至少两个网元类告警信息关联的物理区域标识,将相应的运营支撑系统OSS作为待选OSS,并基于预设的筛选规则,从所述待选OSS中筛选出目标OSS:将告警级别最高的网元类告警信息关联的物理区域标识对应的待选OSS,作为目标OSS;
发送模块,用于指示所述目标OSS基于所述硬件类告警信息进行故障处理。
10.一种存储介质,包括存储器及处理器,其特征在于,存储器存储有用于实现协同告警处理的方法的程序,并通过处理器执行上述程序以实现以下步骤:
接收硬件类告警信息以及网元类告警信息;其中,硬件类告警信息是由虚拟机基础设施管理VIM上报的,各个网元类告警信息是由网元管理系统EMS上报的,不同的网元类告警信息关联不同的物理区域标识;
基于共享硬件资源与虚拟化网元VNF之间的关联关系,确定与所述硬件类告警信息关联的至少两个网元类告警信息;
基于所述至少两个网元类告警信息关联的物理区域标识,将相应的运营支撑系统OSS作为待选OSS,并基于预设的筛选规则,从所述待选OSS中筛选出目标OSS:将告警级别最高的网元类告警信息关联的物理区域标识对应的待选OSS,作为目标OSS;
指示所述目标OSS基于所述硬件类告警信息进行故障处理。
11.一种通信设备,其特征在于,包括一个或多个处理器;以及一个或多个计算机可读介质,所述可读介质上存储有指令,所述指令被所述一个或多个处理器执行时,使得所述通信设备执行如权利要求1至8中任一项所述的方法。
CN201910002561.8A 2019-01-02 2019-01-02 一种协同告警处理的方法及系统 Active CN111404716B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910002561.8A CN111404716B (zh) 2019-01-02 2019-01-02 一种协同告警处理的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910002561.8A CN111404716B (zh) 2019-01-02 2019-01-02 一种协同告警处理的方法及系统

Publications (2)

Publication Number Publication Date
CN111404716A CN111404716A (zh) 2020-07-10
CN111404716B true CN111404716B (zh) 2022-12-13

Family

ID=71432036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910002561.8A Active CN111404716B (zh) 2019-01-02 2019-01-02 一种协同告警处理的方法及系统

Country Status (1)

Country Link
CN (1) CN111404716B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105634785A (zh) * 2014-11-07 2016-06-01 中国移动通信集团公司 一种故障上报方法、系统及相关装置
CN106170947A (zh) * 2015-02-12 2016-11-30 华为技术有限公司 一种告警信息处理方法、相关设备和系统
CN108886473A (zh) * 2016-04-08 2018-11-23 华为技术有限公司 一种管理方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10348517B2 (en) * 2015-10-09 2019-07-09 Openet Telecom Ltd. System and method for enabling service lifecycle based policy, licensing, and charging in a network function virtualization ecosystem

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105634785A (zh) * 2014-11-07 2016-06-01 中国移动通信集团公司 一种故障上报方法、系统及相关装置
CN106170947A (zh) * 2015-02-12 2016-11-30 华为技术有限公司 一种告警信息处理方法、相关设备和系统
CN108886473A (zh) * 2016-04-08 2018-11-23 华为技术有限公司 一种管理方法及装置

Also Published As

Publication number Publication date
CN111404716A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN107508722B (zh) 一种业务监控方法和装置
CN107544839B (zh) 虚拟机迁移系统、方法及装置
US20200106662A1 (en) Systems and methods for managing network health
CN105187249B (zh) 一种故障恢复方法及装置
US20200382362A1 (en) Alarm information processing method, related device, and system
CN109714192A (zh) 一种监控云平台的监控方法及系统
CN103229535B (zh) 电信网络中用于单元恢复的方法和系统
CA2808239C (en) Determining equivalent subsets of agents to gather information for a fabric
CN108390907B (zh) 一种基于Hadoop集群的管理监控系统及方法
CN106021070A (zh) 服务器集群监测方法及装置
CN105871957A (zh) 监控框架设计方法和监控服务器、代理单元、中控服务器
CN108199860A (zh) 一种告警处理方法及网络设备
CN109039795A (zh) 一种云服务器资源监控方法和系统
CN108199901A (zh) 硬件报修方法、系统、设备、硬件管理服务器与存储介质
CN110855481B (zh) 数据采集系统及方法
CN106789158A (zh) 一种云服务保险定损方法和系统
CN111404716B (zh) 一种协同告警处理的方法及系统
CN107426012B (zh) 一种基于超融合架构的故障恢复方法及其装置
CN113411209A (zh) 一种分布式的密码服务全链路检测系统及方法
EP1820359B1 (en) Service alarm correlation
CN105471643B (zh) 一种应用于nfv网络的告警关联方法及系统
CN113543180A (zh) 一种告警处理方法和装置
CN106060123A (zh) 分布式数据系统的数据采集方法及分布式数据系统
CN103684862A (zh) 告警消息的处理方法、装置、系统以及设备
US10432451B2 (en) Systems and methods for managing network health

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant