CN111371570A - 一种nfv网络的故障检测方法及装置 - Google Patents

一种nfv网络的故障检测方法及装置 Download PDF

Info

Publication number
CN111371570A
CN111371570A CN201811587464.1A CN201811587464A CN111371570A CN 111371570 A CN111371570 A CN 111371570A CN 201811587464 A CN201811587464 A CN 201811587464A CN 111371570 A CN111371570 A CN 111371570A
Authority
CN
China
Prior art keywords
layer
network
index
data
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811587464.1A
Other languages
English (en)
Other versions
CN111371570B (zh
Inventor
陈锦潮
林文锋
吴宝庭
邓羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Guangdong Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811587464.1A priority Critical patent/CN111371570B/zh
Publication of CN111371570A publication Critical patent/CN111371570A/zh
Application granted granted Critical
Publication of CN111371570B publication Critical patent/CN111371570B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/044Network management architectures or arrangements comprising hierarchical management structures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level

Abstract

本发明实施例提供一种NFV网络的故障检测方法及装置,其中方法包括:获取网络功能虚拟NFV网络中的信息技术IT信息数据和应用业务的通信技术CT流量数据,其中所述IT信息数据包括虚拟网络功能VNF层、虚拟机VM层和物理主机HOST层的IT信息数据;将所述IT信息数据和所述CT流量数据进行关联,生成用户XDR话单;根据所述XDR话单,对NFV网络的故障进行检测。本发明实施例提高了NFV网络的故障检测的效率和准确率。

Description

一种NFV网络的故障检测方法及装置
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种NFV网络的故障检测方法及装置。
背景技术
网络功能虚拟化(Network Function Virtualization,NFV),通过使用x86等通用性硬件以及虚拟化技术,来承载很多功能的软件处理,从而降低网络昂贵的设备成本。但是,NFV在带来了资源便利的同时,也存在多种(多层)故障同时发生、相互影响的场景,这导致故障排查定位较为困难。
目前业界针对NFV网络的运维方案,通常包括如下几种:
其一,采用NFV管理编排(management and orchestration,MANO)的信息方案进行NFV网络的资源管理和编排,以及故障阈值的预警。该种方式只偏重于NFV资源的管理运维,准确性较低。
其二,通过分析虚拟网络功能(virtualized network function,VNF)启动的镜像参数与资源的匹配性来预判VNF的故障性。该种方式为根据VNF的所需资源的匹配性来判断,VNF启动是否正常进行人工预判,效率较低。
其三,采用VNF的业务层指标进行故障预判。该种方式采用VNF的业务体系指标的开销进行预警,并没有下钻到底层资源的架构体系中,难以快速定位NFV网络故障原因,效率较低。
综上所述,现有技术中在对NFV进行故障检测时,存在检测效率和准确率较低的问题。
发明内容
本发明实施例提供一种NFV网络的故障检测方法及装置,以解决现有技术中在对NFV进行故障检测时效率和准确率较低的问题。
为了解决上述技术问题,第一方面,本发明实施例提供一种NFV网络的故障检测方法,所述方法包括:
获取网络功能虚拟NFV网络中的信息技术IT信息数据和应用业务的通信技术CT流量数据,其中所述IT信息数据包括虚拟网络功能VNF层、虚拟机VM层和物理主机HOST层的IT信息数据;
将所述IT信息数据和所述CT流量数据进行关联,生成用户XDR话单;
根据所述XDR话单,对NFV网络的故障进行检测。
第二方面,本发明实施例提供一种NFV网络的故障检测装置,所述装置包括:
获取模块,用于获取网络功能虚拟NFV网络中的信息技术IT信息数据和应用业务的通信技术CT流量数据,其中所述IT信息数据包括虚拟网络功能VNF层、虚拟机VM层和物理主机HOST层的IT信息数据;
生成模块,用于将所述IT信息数据和所述CT流量数据进行关联,生成用户XDR话单;
检测模块,用于根据所述XDR话单,对NFV网络的故障进行检测。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的NFV网络的故障检测方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的NFV网络的故障检测方法的步骤。
本发明实施例提供的NFV网络的故障检测方法及装置,通过获取NFV网络中的IT信息数据和应用业务的CT流量数据,并将IT信息数据和CT流量数据进行关联,生成XDR话单,然后根据XDR话单,对NFV网络的故障进行检测,实现了NFV网络虚拟流量的完全可视化和采集,并且通过XDR话单对NFV网络的故障进行检测,实现了NFV底层架构资源和上层应用业务的关联分析,进而提高了NFV网络的故障检测时的效率和准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1表示本发明实施例中NFV网络的故障检测方法的步骤流程图;
图2表示本发明实施例中NFV网络的故障检测装置的模块框图;
图3表示本发明实施例中电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明实施例中NFV网络的故障检测方法的步骤流程图,该方法包括如下步骤:
步骤101:获取网络功能虚拟NFV网络中的信息技术IT信息数据和应用业务的通信技术CT流量数据。
在本步骤中,具体的,IT信息数据包括虚拟网络功能(简称VNF)层、虚拟机(简称VM)层和物理主机(简称HOST)层的IT信息数据。
此外,具体的,VNF层的IT信息数据可以包括VNF的ID信息、VNF实例信息和VNF对应的VM等;VM层的IT信息数据可以包括VM的ID信息、VM的IP信息、VM的CPU信息、VM的网络输入/输出信息和VM的RAM信息等;HOST层的IT信息数据可以包括HOST的ID信息、HOST的CPU信息、HOST的RAM信息和HOST的网络信息等。
另外,具体的,CT流量数据可以包括VNF各接口流量数据,如S1U、S10、S11和IP多媒体子系统(简称IMS)域接口等的流量数据。
这样,通过获取NFV网络的VNF、VM和HOST三层的IT信息数据和应用业务的CT流量数据,实现了NFV网络虚拟流量的完全可视化和采集,为NFV网络的上层应用和底层资源的全面故障分析提供了保障。
步骤102:将IT信息数据和CT流量数据进行关联,生成用户XDR话单。
在本步骤中,具体的,在得到IT信息数据和CT流量数据之后,可以将IT信息数据和CT流量数据进行关联,生成XDR话单。
这样,通过IT信息数据和CT流量数据进行关联,生成综合的XDR话单,实现了上层应用业务和底层资源的相结合,从而实现了NFV网络的应用业务的VNF、VM和HOST三层全栈体系分析,为NFV网络的故障分析提供了保障,进而提高了故障检测时的效率和准确率。
步骤103:根据XDR话单,对NFV网络的故障进行检测。
在本步骤中,具体的,可以直接根据XDR话单,对NFV网络的故障进行检测,基于XDR话单中的IT信息数据和CT流量数据,实现了NFV网络的应用业务的VNF、VM和HOST三层全栈体系分析,为NFV网络的故障分析提供了保障,进而提高了故障检测时的效率和准确率。
这样,本实施例通过采集NFV网络中的IT信息数据和应用业务的CT流量数据,并将IT信息数据和CT流量数据进行关联,生成XDR话单,然后根据XDR话单,对NFV网络的故障进行检测,实现了NFV网络虚拟流量的完全可视化和采集,并且通过XDR话单对NFV网络的故障进行检测,实现了NFV底层架构资源和上层应用业务的关联分析,进而提高了NFV网络的故障检测时的效率和准确性。
进一步地,在在本实施例中,在获取NFV网络中的IT信息数据和应用业务的CT流量数据时,可以通过部署在NFV网络中的虚拟探针,采集NFV网络中的IT原始信息流和应用业务的CT原始码流;然后通过处理服务器对所述IT原始信息流中的信息字段进行提取,提取得到VNF层、VM层和HOST层的IT信息数据;最后对所述CT原始码流进行解码,得到CT流量数据,其中所述CT流量数据包括VNF各接口的流量数据。
此外,在将IT信息数据和CT流量数据进行关联,生成XDR话单时,可以将所述VNF层、VM层和HOST层的IT信息数据进行合成,得到IT XDR话单,其中所述IT XDR话单中包括有VNF层、VM层和HOST层的指标参数;然后按照单域或多域多接口的信令流程,端到端的对所述CT流量数据进行合成,得到应用业务层的CT XDR话单;最后通过预设关键字段,分别将ITXDR话单中的VNF层、VM层和HOST层的指标参数与所述CT XDR话单进行关联,得到所述XDR话单。
下面对上述中的信息采集过程和数据流解码过程以及XDR话单合成过程进行说明。
具体的,本系统的源数据来自于NFV的上层应用业务的流量数据和VNF、VM和HOST层的IT信息数据,并通过部署在NFV网络中的虚拟探针来负责进行信息流量的采集。其中,虚拟探针的统一配置和管理可以由中央控制器来进行管理配置。
具体的,探针控制器需要安装在云环境的控制节点上,这样可以保证探针控制器保持与其他物理主机的通信。此外,探针控制器安装完成后,进行初始,自动采集云环境里面的物理主机、VM、VNF和租户等信息,并形成拓扑生成树目录。另外,探针控制器在需要捉包镜像的物理主机上,发送虚拟探针代理安装包,并进行自动安装,并可在探针控制器管理界面进行配置管理。具体的,虚拟探针代理是探针控制器的命令执行者,负责整个物理主机的捉包镜像工作,与物理主机对应的关系是一对一,对象粒度可以是虚拟机或者整个虚拟网桥。虚拟探针代理里面包含着IT信息采集模块和CT信息采集模块。此外,IT信息采集模块负责IT信息数据的采集,CT信息采集模块里包含着虚拟网桥所有的流量过滤采集。另外,流量缓存和导出同样由探针控制器配置负责,流量可以导出到控制主机上,当然也可以不导出到控制主机上。
具体的,探针控制器是整个底层采集的核心,具有中央控制命令发起功能,所有虚拟探针都归属探针控制器统一管理,虚拟探针代理只是探针控制器的所有命令的执行者。虚拟探针代理在安装过程中,自动获取物理主机一部分存储空间,并根据探针控制器的缓存策略对镜像的流量进行缓存,并根据探针控制器的制定的过滤规则进行流量的过滤捉取,同时根据探针控制器配置虚拟探针在当前物理主机的网络配置把流量导出物理主机,该网络配置要能具备2,3层网络能力,如vlan,IP隧道等。
此外,具体的,通过虚拟探针代理采集的信息流量输出到NFV环境外的服务器集群进行二次处理。采集服务器接收到的原始码流,然后经过处理服务器对CT原始码流进行处理,保留需要的流程及字段(如dns流程,http协议等),以及接收到的IT原始信息流进行字段提取和指标统计。
此外,基于分布式计算的CT/IT接口的解码功能,通过合成服务器分布式计算能力,实现采集设备输出的演进分组核心网(简称EPC)/IMS域接口XDR,并实现跨域多接口的身份信息回填,同时弥补由于单域单接口XDR中国际移动用户识别码IMSI/国际移动设备识别码IMEI/移动台识别号码MSISDN等用户身份信息无法填充的情况。此外,在解码CT接口的流量的同时,可以进行IT信息字段指标的提取和统计,并归类统计VNF层、VM层和HOST层的IT指标,并通过VM的内部IP通信和外部业务程序IP进行关联识别出具体VNF类型,从而关联到CT的VNF的上层业务指标体系。
此外,具体的,解码操作具体涉及到impala数据查询、sqoop数据导出、以备份形式将PostgreSQL数据本地化、main调度等。下面将从以上三个方面来描述该过程。
其中,impala端开发思想是把指标相应的查询语句用脚本跑出,并提交到impala上跑的脚本语句复制到某个文件中,然后再读取文件中的语句提交到impala去跑。用sqoop脚本把用于将impala查询出来的指标数据导出到PostgreSQL数据库相应的文件夹位置,实现数据本地化。脚本main.sh实现impala端、sqoop端的调度整合,实现实时运行脚本的作用。
CT原始码流的解码如下表所示。其中CT原始码流XDR详细记录了用户网上业务流程的各个节点的数据和详细记录,包括用户的位置信息、访问的业务类型及信令流程,并详细记录了用户上网的过程信息,这使得从数据中能够多方面评估NFV上层业务的健康度,其评估的结果具有实际意义的参考价值,能够帮助网络管理者掌握网络状况,为互联网的发展提供可靠依据。
Figure BDA0001919454220000061
此外,具体的,可以基于VM或者虚拟网桥的对象对流量做分路,过滤减轻后端分析探针的压力,此时可以把多台虚拟机的流量汇聚、过滤。当然,本实施例支持GRE/VLAN/ERSPAN封装发送复制的物理网,还可以随着虚拟机在物理服务器中移动,让流量获取无间断。
此外,IT原始信息流的信息字段详细记录了当时业务的虚拟层和物理层的性能指标信息,例如下表中的IT信息指标、资源指标、性能指标和网络指标等,反映出了承载业务的物理载体实时性能信息,为NFV网络的管理、保障、及故障定位排查提供重要的数据支撑。其中,IT XDR话单中的VNF层、VM层和HOST层的指标参数与CT XDR话单进行关联的表格可以如下所示:
Figure BDA0001919454220000071
另外,具体的,XDR话单生成系统由处理服务器、Hadoop集群、PostgreSQL数据库服务器组成,这些服务器均采用分布式架构,用交换机进行连接互通。
基于分布式计算的关联合成功能,可以实现按照单域或多域多接口的信令流程端到端的CT XDR合成,并且实现按照IT信息多层体系的指标统计的IT XDR合成,最后按照VNF层、VM层和HOST层的ICT XDR合成,即得到XDR话单。
此外,具体的,在XDR话单生成系统中的Hadoop集群和数据库部分,可以通过flume消费编解码后生成的XDR数据,对接口进行分类,每一个都入到本地kafka作为一个topic进行保存;然后在cdh集群上使用flume消费按接口的topic进行消费,每一个接口的数据以时间为文件名,每五分钟一个文件名进行保存到hdfs上面。在每一个5分钟文件夹下面保存XDR数据,格式是TXT;然后定时每5分钟增加每一个接口的数据分区到hive和impala的外部表,就是外部表增加接口数据路径文件的映射过程,没有涉及到数据的迁移和改变;然后定时从外部表进行压缩成parquet(压缩比大概是3:1)格式之后入库到内部表,这里涉及到数据的压缩和重新存储,内部表的最小分区粒度是1小时。每一个接口都有一个对应的外部表和内部表,查询只查内部表,外部表只是记录数据的路径,作为入库到impala内部表的中间表;最后通过程序调度,把相应的数据结果,推送到前台应用。当然,在XDR话单生成系统中,hadoop集群主要完成实时数据查询功能,实现对NFV虚拟网络及业务的实时指标查询推送功能。
此外,进一步地,在根据所述XDR话单,对NFV网络的故障进行检测时,可以根据所述XDR话单,实时检测NFV网络中多个层级中每个层级的指标参数,以对NFV网络故障进行检测定位。
其中,在根据所述XDR话单,实时检测NFV网络中多个层级中每个层级的指标参数,以对NFV网络故障进行检测定位时,可以根据所述XDR话单,获取多个层级中每个层级的指标参数,其中多个层级包括应用业务层、VNF层、VM层和HOST层;其中,当检测到所述应用业务层内存在指标参数的指标值大于对应的故障阈值时,下钻至所述VNF层进行指标检测;当检测得到所述VNF层内存在指标参数的指标值大于对应的故障阈值时,下钻至所述VM层进行指标检测;当检测得到所述VM层内存在指标参数的指标值大于对应的故障阈值时,下钻至所述HOST层进行指标检测;当检测到所述HOST层内存在指标参数的指标值大于对应的故障阈值时,显示故障告警信息,以对所述故障进行定位。
当然,具体的,在根据所述XDR话单,实时检测NFV网络中多个层级中每个层级的指标参数,以对NFV网络故障进行检测之前,还可以根据所述XDR话单,建立NFV网络的VNF层、VM层和HOST层之间关系的网络拓扑模型,其中所述网络拓扑模型中包括VNF层与VM层的实时关系、VM层与HOST层的实时关系、HOST层与数据中心DC的实时关系以及VNF层、VM层和HOST层的指标参数;然后按照时间实时显示所述网络拓扑模型的状态图,以对网络拓扑模型中的指标参数进行实时监控。
下面对上述实施例进行说明。
具体的,根据XDR话单进行指标统计,显示各个层级网元不同指标信息,且点击展示层级选择,可以选择需要在层级中展示的指标参数类型,可将表格中呈现的数据导出到excel等工具进行二次分析。其中,具体的,应用业务模块显示相关业务的指标的情况,并预警相关的指标阈值告警,并且自动关联下钻到VNF维度的相关指标。在应用业务层下,可通过时间维度、网元维度、指标维度多维度选择进行指标的查询分析,指标类型包含域名系统(DNS)指标、HTTP指标、TCP指标、即时通讯(IM)业务指标、网络指标和VOLTE指标等全部CT电信业务的指标类型,也涵括了全部CT电信业务的网元节点参与流程,多维度的指标查询分析,可全方面的多角度对业务进行评估,从业务的完整的信令流程进行指标衡量,同时可支持指标故障的下钻到VNF的指标功能分析。
此外,具体的,VNF层虚拟网元指标实时监控,并指标阈值告警触发,即以VNF为维度显示相应的指标情况,并预警相关的指标阈值告警,并且自动关联下钻到VM维度的相关指标。在下钻到VNF层时,可对VNF的整体资源情况进行查询分析,在时间维度,VNF资源维度类型下对VNF的资源情况进行查询分析,VNF的资源类型包括虚拟机摘要信息、CPU类指标、内存、磁盘、网络、磁盘空间,对于VNF的资源指标达到故障阈值的指标项,可通过下钻到VM的指标功能进行分析。
此外,VM层VM指标实时监控,能及时地发现VM的故障,即以VM为维度显示VM的相关指标情况,并预警相关的性能指标阈值告警,并且自动关联下钻到HOST维度的相关指标,便于运维者实时管理编排VM。具体的,在下钻到VM层时,可对VM的性能指标的整体资源情况进行查询分析与评估,在时间维度、VM的类型性能资源指标下对VM的资源情况进行查询分析,VM的类型包括虚拟机摘要信息、CPU类指标、内存、磁盘、网络、磁盘空间,对于VM的资源指标达到故障阈值的指标项,可通过下钻到HOST的指标功能进行分析。
此外,具体的,HOST的指标运行实时监控,并记录下物理主机运行的log信息,即以HOST为维度显示HOST的相关指标情况,并预警相关指标阈值告警。在下钻到HOST层时,可对HOST的性能指标的整体资源情况进行查询分析与评估,在时间维度、HOST的类型性能资源指标下对HOST的资源情况进行查询分析,HSOT的资源类型包括服务器主机摘要信息、CPU类指标、内存、磁盘、网络、磁盘空间,对于HOST的资源指标达到故障阈值的指标项时,进行阈值告警。
此外,具体的,通过对VNF、VM和HOST的关系表进行运行,生成NFV网络的虚拟网络拓扑图,构建NFV虚拟网络拓扑可视化,并在虚拟网络拓扑图附上相关的指标项,以达到能及时监控虚拟网络性能的目的,从而使得运维员能够对网络拓扑有清晰了解,提高运维效率,且实时监控着NFV网络中每个虚拟机彼此互联的状态指标,能及时地发现虚拟机的故障。当然,网络拓扑模型包括但不限于:VNF层与VM层的实时关系、VM层与HOST层的实时关系、HOST层与DC的实时关系。此外,可以通过时间范围的选择进行查询,实现实时展示网络拓扑模型的状态图,状态图中实现虚拟机的转发面指标的实时预警,如果出现预警情况,会自动地标红,以定位故障。
此外,具体的,网络管理人员能实时监控着NFV网络中网元类的指标,如vEPC的attach指标、HTTP类指标等,能及时地发现业务指标故障,及时地排查故障原因。对于NFV网元虚拟网元的单点故障虚拟机,运维者可以对其进行纵向维度的排查,由VNF、VM、HOST方向深入钻取分析排查。此外,当业务指标故障后,还可以自动层级关联业务指标、VNF、VM、HOST,进行全栈分析,这减低了虚拟网络多层排查的困难度,提高了运维效率。另外,还可以以红色图形表示,以达到提醒网络管理人员的作用,便于故障的精准分析定位,减少故障排查时间。
这样通过关联分析下钻分析方法,以及将应用业务指标、VNF层指标、VM层性能指标和HOST性能指标关联,分析VM和HOST性能指标有效性地对上层业务指标的影响,总结底层性能指标异常对业务指标的影响特征,关联分析定位VNF故障原因受底层性能指标的交互性影响,同时可形成特征库指导NFV网络性能管理工作。
这样,本实施例提供的NFV网络的故障检测方法,通过采集NFV网络的IT信息数据和CT流量数据,实现了NFV网络的全虚拟流量的完全可视化采集,实现了完全消除NFV网络的数据盲点的问题;此外,通过IT信息数据和CT流量数据合成的XDR话单,查询分析NFV的三层体系的指标数据,实现NFV网络业务VNF、VM、HOST三层全栈体系上下关联分析及故障自动定位,提高了故障检测和定位时的效率和准确率。
此外,如图2所示,为本发明实施例中NFV网络的故障检测装置的模块框图,该装置包括:
获取模块201,用于获取网络功能虚拟NFV网络中的信息技术IT信息数据和应用业务的通信技术CT流量数据,其中所述IT信息数据包括虚拟网络功能VNF层、虚拟机VM层和物理主机HOST层的IT信息数据;
生成模块202,用于将所述IT信息数据和所述CT流量数据进行关联,生成用户XDR话单;
检测模块203,用于根据所述XDR话单,对NFV网络的故障进行检测。
可选地,所述获取模块201包括:
采集单元,用于通过部署在NFV网络中的虚拟探针,采集NFV网络中的IT原始信息流和应用业务的CT原始码流;
提取单元,用于通过处理服务器对所述IT原始信息流中的信息字段进行提取,提取得到VNF层、VM层和HOST层的IT信息数据;
第一获取单元,用于对所述CT原始码流进行解码,得到CT流量数据,其中所述CT流量数据包括VNF各接口的流量数据。
可选地,所述生成模块202包括:
第二获取单元,用于将所述VNF层、VM层和HOST层的IT信息数据进行合成,得到ITXDR话单,其中所述IT XDR话单中包括有VNF层、VM层和HOST层的指标参数;
第三获取单元,用于按照单域或多域多接口的信令流程,端到端的对所述CT流量数据进行合成,得到应用业务层的CT XDR话单;
第四获取单元,用于通过预设关键字段,分别将IT XDR话单中的VNF层、VM层和HOST层的指标参数与所述CT XDR话单进行关联,得到所述XDR话单。
可选地,所述检测模块203用于,根据所述XDR话单,实时检测NFV网络中多个层级中每个层级的指标参数,以对NFV网络故障进行检测定位。
可选地,所述检测模块203包括:
第五获取单元,用于根据所述XDR话单,获取多个层级中每个层级的指标参数,其中多个层级包括应用业务层、VNF层、VM层和HOST层;其中,
第一检测单元,用于当检测到所述应用业务层内存在指标参数的指标值大于对应的故障阈值时,下钻至所述VNF层进行指标检测;
第二检测单元,用于当检测得到所述VNF层内存在指标参数的指标值大于对应的故障阈值时,下钻至所述VM层进行指标检测;
第三检测单元,用于当检测得到所述VM层内存在指标参数的指标值大于对应的故障阈值时,下钻至所述HOST层进行指标检测;
第四检测单元,用于当检测到所述HOST层内存在指标参数的指标值大于对应的故障阈值时,显示故障告警信息,以对所述故障进行定位。
可选地,所述装置还包括:
模型建立模块,用于根据所述XDR话单,建立NFV网络的VNF层、VM层和HOST层之间关系的网络拓扑模型,其中所述网络拓扑模型中包括VNF层与VM层的实时关系、VM层与HOST层的实时关系、HOST层与数据中心DC的实时关系以及VNF层、VM层和HOST层的指标参数;
监控模块,用于按照时间实时显示所述网络拓扑模型的状态图,以对网络拓扑模型中的指标参数进行实时监控。
这样,本实施例提供的NFV网络的故障检测装置,通过获取NFV网络中的IT信息数据和应用业务的CT流量数据,并将IT信息数据和CT流量数据进行关联,生成XDR话单,然后根据XDR话单,对NFV网络的故障进行检测,实现了NFV网络虚拟流量的完全可视化和采集,并且通过XDR话单对NFV网络的故障进行检测,实现了NFV底层架构资源和上层应用业务的关联分析,进而提高了NFV网络的故障检测时的效率和准确性。
此外,如图3所示,为本发明实施例提供的电子设备的实体结构示意图,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储在存储器330上并可在处理器310上运行的计算机程序,以执行上述各实施例提供的方法,例如包括:获取网络功能虚拟NFV网络中的信息技术IT信息数据和应用业务的通信技术CT流量数据,其中所述IT信息数据包括虚拟网络功能VNF层、虚拟机VM层和物理主机HOST层的IT信息数据;将所述IT信息数据和所述CT流量数据进行关联,生成用户XDR话单;根据所述XDR话单,对NFV网络的故障进行检测。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:获取网络功能虚拟NFV网络中的信息技术IT信息数据和应用业务的通信技术CT流量数据,其中所述IT信息数据包括虚拟网络功能VNF层、虚拟机VM层和物理主机HOST层的IT信息数据;将所述IT信息数据和所述CT流量数据进行关联,生成用户XDR话单;根据所述XDR话单,对NFV网络的故障进行检测。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种NFV网络的故障检测方法,其特征在于,所述方法包括:
获取网络功能虚拟NFV网络中的信息技术IT信息数据和应用业务的通信技术CT流量数据,其中所述IT信息数据包括虚拟网络功能VNF层、虚拟机VM层和物理主机HOST层的IT信息数据;
将所述IT信息数据和所述CT流量数据进行关联,生成用户XDR话单;
根据所述XDR话单,对NFV网络的故障进行检测。
2.根据权利要求1所述的方法,其特征在于,所述获取网络功能虚拟NFV网络中的信息技术IT信息数据和应用业务的通信技术CT流量数据,包括:
通过部署在NFV网络中的虚拟探针,采集NFV网络中的IT原始信息流和应用业务的CT原始码流;
通过处理服务器对所述IT原始信息流中的信息字段进行提取,提取得到VNF层、VM层和HOST层的IT信息数据;
对所述CT原始码流进行解码,得到CT流量数据,其中所述CT流量数据包括VNF各接口的流量数据。
3.根据权利要求1所述的方法,其特征在于,所述将所述IT信息数据和所述CT流量数据进行关联,生成用户XDR话单,包括:
将所述VNF层、VM层和HOST层的IT信息数据进行合成,得到IT XDR话单,其中所述ITXDR话单中包括有VNF层、VM层和HOST层的指标参数;
按照单域或多域多接口的信令流程,端到端的对所述CT流量数据进行合成,得到应用业务层的CT XDR话单;
通过预设关键字段,分别将IT XDR话单中的VNF层、VM层和HOST层的指标参数与所述CTXDR话单进行关联,得到所述XDR话单。
4.根据权利要求3所述的方法,其特征在于,所述根据所述XDR话单,对NFV网络的故障进行检测,包括:
根据所述XDR话单,实时检测NFV网络中多个层级中每个层级的指标参数,以对NFV网络故障进行检测定位。
5.根据权利要求4所述的方法,其特征在于,所述根据所述XDR话单,实时检测NFV网络中多个层级中每个层级的指标参数,以对NFV网络故障进行检测定位,包括:
根据所述XDR话单,获取多个层级中每个层级的指标参数,其中多个层级包括应用业务层、VNF层、VM层和HOST层;其中,
当检测到所述应用业务层内存在指标参数的指标值大于对应的故障阈值时,下钻至所述VNF层进行指标检测;
当检测得到所述VNF层内存在指标参数的指标值大于对应的故障阈值时,下钻至所述VM层进行指标检测;
当检测得到所述VM层内存在指标参数的指标值大于对应的故障阈值时,下钻至所述HOST层进行指标检测;
当检测到所述HOST层内存在指标参数的指标值大于对应的故障阈值时,显示故障告警信息,以对所述故障进行定位。
6.根据权利要求4所述的方法,其特征在于,所述根据所述XDR话单,实时检测NFV网络中多个层级中每个层级的指标参数,以对NFV网络故障进行检测之前,所述方法还包括:
根据所述XDR话单,建立NFV网络的VNF层、VM层和HOST层之间关系的网络拓扑模型,其中所述网络拓扑模型中包括VNF层与VM层的实时关系、VM层与HOST层的实时关系、HOST层与数据中心DC的实时关系以及VNF层、VM层和HOST层的指标参数;
按照时间实时显示所述网络拓扑模型的状态图,以对网络拓扑模型中的指标参数进行实时监控。
7.一种NFV网络的故障检测装置,其特征在于,所述装置包括:
获取模块,用于获取网络功能虚拟NFV网络中的信息技术IT信息数据和应用业务的通信技术CT流量数据,其中所述IT信息数据包括虚拟网络功能VNF层、虚拟机VM层和物理主机HOST层的IT信息数据;
生成模块,用于将所述IT信息数据和所述CT流量数据进行关联,生成用户XDR话单;
检测模块,用于根据所述XDR话单,对NFV网络的故障进行检测。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的NFV网络的故障检测方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6中任一项所述的NFV网络的故障检测方法的步骤。
CN201811587464.1A 2018-12-25 2018-12-25 一种nfv网络的故障检测方法及装置 Active CN111371570B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811587464.1A CN111371570B (zh) 2018-12-25 2018-12-25 一种nfv网络的故障检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811587464.1A CN111371570B (zh) 2018-12-25 2018-12-25 一种nfv网络的故障检测方法及装置

Publications (2)

Publication Number Publication Date
CN111371570A true CN111371570A (zh) 2020-07-03
CN111371570B CN111371570B (zh) 2023-03-10

Family

ID=71211372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811587464.1A Active CN111371570B (zh) 2018-12-25 2018-12-25 一种nfv网络的故障检测方法及装置

Country Status (1)

Country Link
CN (1) CN111371570B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113596891A (zh) * 2021-07-28 2021-11-02 中国联合网络通信集团有限公司 故障定位方法、装置、服务器、存储介质及系统
CN114422619A (zh) * 2020-10-12 2022-04-29 中国移动通信集团广东有限公司 业务识别方法、装置、设备及存储介质
CN115988438A (zh) * 2022-12-14 2023-04-18 中国联合网络通信集团有限公司 呼叫业务数据处理方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106301828A (zh) * 2015-05-21 2017-01-04 中兴通讯股份有限公司 一种虚拟化网络功能业务故障的处理方法及装置
CN106533724A (zh) * 2015-09-11 2017-03-22 中国移动通信集团公司 监控和优化网络功能虚拟化nfv网络的方法、装置及系统
CN108353004A (zh) * 2015-11-12 2018-07-31 是德科技新加坡(控股)私人有限公司 用于测试网络功能虚拟化(nfv)的方法、系统和计算机可读介质
CN108667777A (zh) * 2017-03-31 2018-10-16 华为技术有限公司 一种服务链生成方法及网络功能编排器nfvo

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106301828A (zh) * 2015-05-21 2017-01-04 中兴通讯股份有限公司 一种虚拟化网络功能业务故障的处理方法及装置
CN106533724A (zh) * 2015-09-11 2017-03-22 中国移动通信集团公司 监控和优化网络功能虚拟化nfv网络的方法、装置及系统
CN108353004A (zh) * 2015-11-12 2018-07-31 是德科技新加坡(控股)私人有限公司 用于测试网络功能虚拟化(nfv)的方法、系统和计算机可读介质
CN108667777A (zh) * 2017-03-31 2018-10-16 华为技术有限公司 一种服务链生成方法及网络功能编排器nfvo

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114422619A (zh) * 2020-10-12 2022-04-29 中国移动通信集团广东有限公司 业务识别方法、装置、设备及存储介质
CN114422619B (zh) * 2020-10-12 2023-11-10 中国移动通信集团广东有限公司 业务识别方法、装置、设备及存储介质
CN113596891A (zh) * 2021-07-28 2021-11-02 中国联合网络通信集团有限公司 故障定位方法、装置、服务器、存储介质及系统
CN113596891B (zh) * 2021-07-28 2023-07-14 中国联合网络通信集团有限公司 故障定位方法、装置、服务器、存储介质及系统
CN115988438A (zh) * 2022-12-14 2023-04-18 中国联合网络通信集团有限公司 呼叫业务数据处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111371570B (zh) 2023-03-10

Similar Documents

Publication Publication Date Title
CN107943668B (zh) 计算机服务器集群日志监控方法及监控平台
US9565076B2 (en) Distributed network traffic data collection and storage
CN104202201B (zh) 一种日志处理方法、装置及终端
CN109586999A (zh) 一种容器云平台状态监控预警系统、方法及电子设备
CN111371570B (zh) 一种nfv网络的故障检测方法及装置
CN107958337A (zh) 一种信息资源可视化移动管理系统
CN107547273B (zh) 一种电力系统虚拟实例高可用的保障方法及系统
CN113190423B (zh) 业务数据的监控方法、装置及系统
CN110716842A (zh) 集群故障检测方法和装置
CN110784374A (zh) 业务系统运行状态的监控方法、装置、设备和系统
US20180176095A1 (en) Data analytics rendering for triage efficiency
CN112769605B (zh) 一种异构多云的运维管理方法及混合云平台
CN106789442A (zh) 基于流量数据的本地网客户端性能分析方法
CN103049365B (zh) 信息与应用资源运行状态监控及评价方法
CN112699007A (zh) 监控机器性能的方法、系统、网络设备及存储介质
CN102256297B (zh) 一种td-scdma无线通信网络服务用户感知数据采集方法
CN103873298A (zh) 一种可以配置的维护中心操作维护中心北向接口的数据质量自动监测的方法
CN113505048A (zh) 基于应用系统画像的统一监控平台及实现方法
CN105606958A (zh) 电力系统故障信息的处理方法、系统及装置
CN112506969A (zh) 一种bmc地址查询方法、系统、设备及可读存储介质
CN110661660A (zh) 告警信息根源分析方法及装置
US10324818B2 (en) Data analytics correlation for heterogeneous monitoring systems
CN108337100B (zh) 一种云平台监测的方法和装置
CN115333966B (zh) 一种基于拓扑的Nginx日志分析方法、系统及设备
CN116170275A (zh) 一种云网络运维管理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant