CN106685695B - 一种故障检测方法及其设备 - Google Patents

一种故障检测方法及其设备 Download PDF

Info

Publication number
CN106685695B
CN106685695B CN201611063667.1A CN201611063667A CN106685695B CN 106685695 B CN106685695 B CN 106685695B CN 201611063667 A CN201611063667 A CN 201611063667A CN 106685695 B CN106685695 B CN 106685695B
Authority
CN
China
Prior art keywords
virtual
detection
fault
vnhc
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611063667.1A
Other languages
English (en)
Other versions
CN106685695A (zh
Inventor
邹成钢
邢睿智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201611063667.1A priority Critical patent/CN106685695B/zh
Publication of CN106685695A publication Critical patent/CN106685695A/zh
Application granted granted Critical
Publication of CN106685695B publication Critical patent/CN106685695B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications

Abstract

本发明实施例公开了一种故障检测方法及其设备,用于对虚拟主机中的虚拟设备进行故障检测和处理。本发明实施例方法包括:所述虚拟主机中的虚拟网络健康监测组件VNHC对所述虚拟主机中的虚拟设备进行故障检测,得到检测数据;所述VNHC对所述检测数据进行分析,得到检测结果,所述检测结果用于显示所述虚拟设备是否存在故障;若所述检测结果显示存在故障,则所述VNHC向所述虚拟主机的虚拟后端发送所述检测结果,以使得所述虚拟后端对所述故障进行处理。

Description

一种故障检测方法及其设备
技术领域
本发明涉及虚拟技术领域,尤其涉及一种故障检测方法及其设备。
背景技术
随着互联网技术(英文:internet technology;缩写:IT)与电信网技术(英文:Community Technology;缩写:CT)的融合和相关技术的不断成熟,网络设备虚拟化、云化的技术演进成为新的趋势,使得电信设备虚拟化成为演进过程中的重要选择。
将IT中得到过验证的虚拟化技术应用到CT中来,实现软件和硬件的解耦,使得统一部署通用化的硬件给多个应用系统使用成为可能,提高网络/设备的资源利用率。另外,硬件平台的通用化和统一为硬件的采购管理优化、备件管理优化,以及资源利用率的提升奠定了基础,避免运营商被设备商锁定,从而使得运营商可以更广泛的选择不同功能组件、硬件的厂商。
对于在网络设备虚拟化后的虚拟网络设备,如虚拟端口vNIC、设备对VETH、虚拟接口vPort,由于其全部都是基于软件实现的,本身不是物理器件,也没有物理信号检测物理通断,因此在上述端口故障或者删除释放时,当前的开源软件没有对此进行故障关联,也没有将该故障通知相关端口,从而导致当该故障出现时无法及时解决。
发明内容
本发明实施例提供了一种故障检测方法及其设备,用于对虚拟主机中的虚拟设备进行故障检测和处理。
有鉴于此,本发明实施例的第一方面提供一种故障检测方法,包括:
在本发明实施例中,该虚拟主机中的虚拟网络健康监测组件VNHC可以对虚拟主机中的虚拟设备进行故障检测,得到检测数据,可选的,其特征在于,该虚拟设备包括网桥、策略网桥、内部网桥以及物理上联口相连的网桥。
VNHC可以对该检测数据进行分析,得到检测结果,若该检测结果显示存在故障,就可以把该检测结果发送到该虚拟主机的虚拟后端,则虚拟后端可以处理该故障。
具体的,检测方法可以为,VNHC向该虚拟设备发送检测消息,可选的,其特征在于,该检测消息包括上行检测消息和下行检测消息,然后由该虚拟设备根据该检测消息生成并返回一个返回检测消息,根据该返回检测消息生成该检测数据。
避免虚拟机持续通过存在故障的虚拟端口发送数据导致业务长时间故障。因此有对虚拟设备的虚拟网络健康监测组件,当发生故障时,可以及时发现并处理。
本发明实施例的第二方面提供一种故障检测方法,包括:
虚拟主机的虚拟后端可以接收虚拟主机中的VNHC发送的检测结果,接着根据该检测结果确定显示的故障,然后对该故障进行处理。
避免虚拟机持续通过存在故障的虚拟端口发送数据导致业务长时间故障。因此有对虚拟设备的虚拟网络健康监测组件,当发生故障时,可以及时发现并处理。
结合本发明第二方面,本发明第二方面的第一种实施方式,包括:
该虚拟后端根据该检测结果确定该虚拟主机中存在故障的虚拟主机中的虚拟设备在虚拟机中所对应的虚拟端口,可选的,该虚拟设备包括网桥、策略网桥、内部网桥以及物理上联口相连的网桥,然后向该虚拟机发送控制消息,该控制消息指示该虚拟端口停止收发信息,可选的,该检测消息包括上行检测消息和下行检测消息。
避免虚拟机持续通过存在故障的虚拟端口发送数据导致业务长时间故障。因此有对虚拟设备的虚拟网络健康监测组件,当发生故障时,可以及时发现并处理。
本发明实施例的第三方面提供一种故障检测方法,包括:
VNHC可以对该虚拟主机中的虚拟设备进行故障检测,得到检测数据,然后VNHC对该检测数据进行分析,得到检测结果,若该检测结果显示该虚拟主机是否存在故障,则该VNHC可以向该虚拟主机的虚拟后端发送该检测结果,以使得虚拟后端对该故障进行处理。
避免虚拟机持续通过存在故障的虚拟端口发送数据导致业务长时间故障。因此有对虚拟设备的虚拟网络健康监测组件,当发生故障时,可以及时发现并处理。
本发明实施例的第四方面提供一种故障检测装置,包括:
检测单元,用于对该虚拟主机中的虚拟设备进行故障检测,得到检测数据;分析单元,用于对该检测数据进行分析,得到检测结果,该检测结果用于显示该虚拟设备是否存在故障;发送单元,用于若该检测结果显示存在故障,则向该虚拟主机的虚拟后端发送该检测结果,以使得该虚拟后端对该故障进行处理。
结合本发明第四方面,本发明第四方面的第一种实施方式,该检测单元包括:
发送子单元,用于向该虚拟设备发送检测消息;接收子单元,用于接收返回检测消息,该返回检测消息由该虚拟设备根据该检测消息生成并返回该VNHC;生成子单元,用于根据该返回检测消息生成该检测数据。
本发明实施例的第五方面提供一种故障检测装置,包括:
接收单元,用于接收该虚拟主机中的VNHC发送的检测结果;确定单元,用于根据该检测结果确定该虚拟主机存在的故障;处理单元,用于对该故障进行处理。
结合本发明第五方面,本发明第五方面的第一种实施方式,该确定单元包括:
确定子单元,用于根据该检测结果确定该虚拟主机中存在故障的虚拟主机中的虚拟设备在虚拟机中所对应的虚拟端口。
结合本发明第五方面,本发明第五方面的第二种实施方式,该处理单元包括:
发送子单元,用于向该虚拟机发送控制消息,该控制消息指示该虚拟端口停止收发信息。
本发明实施例的第六方面提供一种虚拟主机,包括:
虚拟设备,用于运行该虚拟主机的功能;VNHC,用于对该虚拟主机中的虚拟设备进行故障检测,得到检测数据,对该检测数据进行分析,得到检测结果,该检测结果用于显示该虚拟主机是否存在故障,若该检测结果显示存在故障,则向该虚拟主机的虚拟后端发送该检测结果;虚拟后端,用于对该故障进行处理。
本发明实施例的第七方面提供一种故障检测装置,包括:
处理器、存储器、收发器和总线;该总线用于与该处理器、该存储器和该收发器连接;该处理器用于对该虚拟主机中的虚拟设备进行故障检测,得到检测数据,对该检测数据进行分析,得到检测结果,该检测结果用于显示该虚拟设备是否存在故障;该收发器用于若该检测结果显示存在故障,则向虚拟后端发送该检测结果,以使得该虚拟后端对该故障进行处理;该存储器用于存储程序、该检测数据、该检测结果。
本发明实施例的第八方面提供一种故障检测装置,包括:
处理器、存储器、收发器和总线;该总线用于与该处理器、该存储器和该收发器连接;该收发器用于接收该虚拟主机中的VNHC发送的检测结果;该处理器用于根据该检测结果确定该虚拟主机存在的故障,对该故障进行处理;该存储器用于存储程序、该检测数据、该检测结果。
从以上技术方案可以看出,本发明实施例具有以下优点:
该虚拟主机中的虚拟网络健康监测组件VNHC对该虚拟主机中的虚拟设备进行故障检测,得到检测数据,该VNHC对该检测数据进行分析,得到检测结果,该检测结果用于显示该虚拟设备是否存在故障,若该检测结果显示存在故障,则该VNHC向该虚拟主机的虚拟后端发送该检测结果,以使得该虚拟后端根据虚拟设备与虚拟端口对应的映射关系,通知虚拟机对应的虚拟端口的状态为故障,避免虚拟机持续通过存在故障的虚拟端口发送数据导致业务长时间故障。因此有对虚拟设备的虚拟网络健康监测组件,当发生故障时,可以及时发现并处理。
附图说明
图1为本发明实施例中的虚拟网络设备系统的架构示意图;
图2为本发明实施例中的一种故障检测方法的示意图;
图3为本发明实施例中的一种故障检测装置;
图4为本发明实施例中的另一种故障检测装置;
图5为本发明实施例中的一种故障检测装置;
图6为本发明实施例中的另一种故障检测装置;
图7为本发明实施例中的另一种故障检测装置;
图8为本发明实施例中的一种虚拟主机;
图9为本发明实施例中的一种故障检测装置;
图10为本发明实施例中的一种故障检测装置。
具体实施方式
本发明实施例提供了一种故障检测方法以及装置,用于对虚拟主机中的虚拟设备进行故障检测和处理。
为了使本技术领域的人员更好地理解本发明实施例方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,为虚拟网络设备系统的架构示意图,该虚拟网络设备系统包括多个虚拟机(英文:Virtual machine;缩写:VM)、虚拟主机(英文:virtual host)以及硬件(英文:hardware)。
在本发明实施例中,虚拟机指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。
在一些可行的实施例中,虚拟机技术是虚拟化技术的一种,所谓虚拟化技术就是将事物从一种形式转变成另一种形式,最常用的虚拟化技术有操作系统中内存的虚拟化,实际运行时用户需要的内存空间可能远远大于物理机器的内存大小,利用内存的虚拟化技术,用户可以将一部分硬盘虚拟化为内存,而这对用户是透明的。又如,可以利用虚拟专用网技术(VPN)在公共网络中虚拟化一条安全,稳定的“隧道”,用户感觉像是使用私有网络一样。
在一些可行的实施例中,虚拟系统通过生成现有操作系统的全新虚拟镜像,它具有真实windows系统完全一样的功能,进入虚拟系统后,所有操作都是在这个全新的独立的虚拟系统里面进行,可以独立安装运行软件,保存数据,拥有自己的独立桌面,不会对真正的系统产生任何影响,而且具有能够在现有系统与虚拟镜像之间灵活切换的一类操作系统。虚拟系统和传统的虚拟机(Parallels Desktop,Vmware,VirtualBox,Virtual pc)不同在于:虚拟系统不会降低电脑的性能,启动虚拟系统不需要像启动windows系统那样耗费时间,运行程序更加方便快捷;虚拟系统只能模拟和现有操作系统相同的环境,而虚拟机则可以模拟出其他种类的操作系统;而且虚拟机需要模拟底层的硬件指令,所以在应用程序运行速度上比虚拟系统慢得多。
需要说明的是,虚拟机的结构可以包括客户操作系统、虚拟光驱和虚拟端口vNIC,该虚拟端口用于与虚拟主机连接。其中,虚拟光驱是一种模拟(CD/DVD-ROM)工作的工具软件,可以生成和你电脑上所安装的光驱功能一模一样的光盘镜像,一般光驱能做的事虚拟光驱一样可以做到,工作原理是先虚拟出一部或多部虚拟光驱后,将光盘上的应用软件,镜像存放在硬盘上,并生成一个虚拟光驱的镜像文件,然后就可以将此镜像文件放入虚拟光驱中来使用,所以当您日后要启动此应用程序时,只需要点下插入图标,即装入虚拟光驱中运行。
需要说明的是,一个虚拟主机可以有多个虚拟端口,当一个虚拟端口发生故障时,或者该端口对应的虚拟设备发生故障时,可以通过其他虚拟端口发送数据。
在一些可行的实施例中,多个虚拟主机中的两个虚拟主机可以互为主备,当其中一个虚拟主机发生故障时,可以选择另一个虚拟主机进行数据传输的工作。
在本发明实施例中,虚拟主机是指在网络服务器上分出一定的磁盘空间,用户可以租用此部分空间,以供用户放置站点及应用组件,提供必要的数据存放和传输功能。
虚拟主机技术是互联网服务器采用的节省服务器硬件成本的技术,虚拟主机技术主要应用于超文本传输协议(英文:Hypertext Transfer Protocol;缩写:HTTP)服务,将一台服务器的某项或者全部服务内容逻辑划分为多个服务单位,对外表现为多个服务器,从而充分利用服务器硬件资源。
虚拟主机是使用特殊的软硬件技术,把一台真实的物理服务器主机分割成多个逻辑存储单元。每个逻辑单元都没有物理实体,但是每一个逻辑单元都能像真实的物理主机一样在网络上工作,具有单独的IP地址(或共享的IP地址)、独立的域名以及完整的Internet服务器(支持WWW、FTP、E-mail等)功能。
虚拟主机的关键技术在于,即使在同一台硬件、同一个操作系统上,运行着为多个用户打开的不同的服务器程式,也互不干扰。而各个用户拥有自己的一部分系统资源(IP地址、文档存储空间、内存、CPU等)。各个虚拟主机之间完全独立,在外界看来,每一台虚拟主机和一台单独的主机的表现完全相同。所以这种被虚拟化的逻辑主机被形象地称为“虚拟主机”。
在本发明实施例中,一个虚拟主机为一个或多个虚拟机服务,连接着多个虚拟机同时连接硬件,起着为虚拟机和硬件之间传输信息的作用。
在一些可行的实施例中,虚拟主机可以包括虚拟设备,该虚拟设备可以包括网桥、策略网桥、内部网桥以及物理上联口相连的网桥。在一些可行的实施例中,虚拟主机还可以包括虚拟端口和物理端口NIC,该虚拟端口用于与虚拟机连接并传输数据,物理端口用于与硬件连接。
由于各种网桥的数据传输容易出现故障,因此需要部署一些故障检测系统。在本发明实施例中,可以针对故障检测的需求,为虚拟主机中部署一个虚拟网络健康监测组件(英文:virtual network health check;缩写:VNHC)以及一个虚拟后端(英文:virtiobackend)。该VNHC用于对虚拟主机中的虚拟设备进行故障检测,并将检测结果发送到虚拟后端。该后端用于接收检测结果,并根据该检测结果对故障进行处理。
需要说明的是,虚拟后端可以存在于平台模拟器QEMU中。QEMU还可以提供了用于IP地址分配的内部Dynamic Host Configuration Protocol服务器。
请参考图2,为本发明实施例中的一种故障检测方法,该方法包括:
201、该VNHC向该虚拟设备发送检测消息。
在本发明实施例中,VNHC可以通过向虚拟设备发送检测消息进行故障检测。优选的,该检测消息包括上行检测消息和下行检测消息。优选的,该虚拟设备包括网桥、策略网桥、内部网桥以及物理上联口相连的网桥。
具体的,请参考图1,在一些可行的实施例中,VNHC可以向网桥发送下行的检测消息,网桥将检测信息转发到策略网桥,策略网桥将检测消息转发到内部网桥,再转发到物理上联口相连的网桥,最后返回一个返回检测消息给VNHC。
在另一些可行的实施例中,VNHC还可以向物理上联口相连的网桥发送上行的检测消息,物理上联口相连的网桥向内部网桥转发,再转发到策略网桥,再转发到网桥,最后返回一个返回检测消息给VNHC。
需要说明的是,网桥是早期的两端口二层网络设备,用来连接不同网段。网桥的两个端口分别有一条独立的交换信道,不是共享一条背板总线,可隔离冲突域。网桥比集线器(Hub)性能更好,集线器上各端口都是共享同一条背板总线的。后来,网桥被具有更多端口、同时也可隔离冲突域的交换机(Switch)所取代。
在另一个可行的实施例中,网桥像一个聪明的中继器。中继器从一个网络电缆里接收信号,放大它们,将其送入下一个电缆。相比较而言,网桥对从关卡上传下来的信息更敏锐一些。网桥是一种对帧进行转发的技术,根据MAC分区块,可隔离碰撞。网桥将网络的多个网段在数据链路层连接起来。
网桥也叫桥接器,是连接两个局域网的一种存储/转发设备,它能将一个大的LAN分割为多个网段,或将两个以上的LAN互联为一个逻辑LAN,使LAN上的所有用户都可访问服务器。扩展局域网最常见的方法是使用网桥。最简单的网桥有两个端口,复杂些的网桥可以有更多的端口。网桥的每个端口与一个网段相连。
202、虚拟设备根据该检测消息生成返回检测消息,并返回VNHC。
如步骤201所述,在一些可行的实施例中,VNHC可以向网桥发送下行的检测消息,网桥将检测信息转发到策略网桥,策略网桥将检测消息转发到内部网桥,再转发到物理上联口相连的网桥,最后返回一个返回检测消息给VNHC。
在另一些可行的实施例中,VNHC还可以向物理上联口相连的网桥发送上行的检测消息,物理上联口相连的网桥向内部网桥转发,再转发到策略网桥,再转发到网桥,最后返回一个返回检测消息给VNHC。
需要说明的是,在另一些可行的实施例中,VNHC可以单独给一个网桥/策略网桥/内部网桥/物理上联口相连的网桥发送检测消息,当网桥/策略网桥/内部网桥/物理上联口相连的网桥接收到检测消息时,不需要转发,直接返回一个返回检测消息,只要VNHC能对虚拟设备进行故障检测,此处不作限定。需要说明的是,该检测消息可以是介质访问控制MAC层检测报文,并使用原始套接字raw sokcet协议发送和接收该检测消息的,而且支持双向并行检测。所述raw sokcet可以接收本机端口上的数据帧或者数据包,对于监听网络的流量和分析是很有作用的。
203、该VNHC根据该返回检测消息生成该检测数据。
在一些可行的实施例中,当VNHC接收到检测消息后,可以对接收的检测消息进行统计,得到上下行链路的丢包、时延、抖动数据,得到检测数据。
所谓丢包,即在通信中是指通信数据包丢失。在一些可行的实施例中,数据在通信网络上是以数据包为单位传输的,每个数据包中有表示数据信息和提供数据路由的帧。这就是说,不管网络情况有多好,数据都不是以线性(就像打电话一样)连续传输的,中间总是有空洞的。数据包的传输,不可能百分之百的能够完成,因为物理线路故障、设备故障、病毒攻击、路由信息错误等原因,总会有一定的损失。碰到这种情况,网络会自动的让通信的两端根据协议来补包。如果线路情况好,速度快,包的损失会非常小,补包的工作也相对较易完成,因此可以近似的将数据看作是无损传输。但是,如果线路较差(如用调制解调器),数据的损失量就会非常大,补包工作也不可能百分之百完成。在这种情况下,数据的传输就会出现空洞,造成丢包。
时延是指一个报文或分组从一个网络的一端传送到另一个端所需要的时间。它包括了发送时延,传播时延,处理时延,排队时延。(时延=发送时延+传播时延+处理时延+排队时延)一般,发送时延与传播时延是我们主要考虑的。对于报文长度较大的情况,发送时延是主要矛盾;报文长度较小的情况,传播时延是主要矛盾。(计算机网络方面的时延概念)
时延是指从说话人开始说话到受话人听到所说的内容的时间。一般人们能忍受小于250ms的时延,若时延太长,会使通信双方都不舒服。此外,时延还会造成回波,时延越长所需的用于消除回波的计算机指令的时间就越多。传送时延由Internet的路由情况决定,如果在低速信道或信道太拥挤时,可能会导致长时间时延或丢失数据包的情况。
抖动的定义是“数字信号的各个有效瞬时对其当时的理想位置的短期性偏离”,这意味着抖动是不希望有的数字信号的相位调制。
相位偏离的频率称为抖动频率,与抖动有密切关系的第二个参数称为漂移,把它定义为“数字信号的各个有效瞬间相对其当时的理想位置的长期偏离”。到目前为止,在抖动和漂移之间的界限还没有明确的定义,通常具有频率低于1Hz至10Hz相位变化部分称为漂移。
由于信号再生点把差错引入到数字比特流中以及在含有缓冲存储器的数字设备中的数字溢出或取空,可以把滑动引入到数字信号中,因此抖动可以降低数字电路的传输性能。抖动分系统性抖动和随机性抖动,系统性抖动是由于信号再生装置中定时恢复电路调整不当,或者码间干扰以及由于电缆均衡有缺陷而产生幅度到相位变换而引起的,系统性抖动与码型相关;随机抖动来源于内部干扰信号,如中继器的噪声、串话或反射,随机抖动与传输码型无关,在大部分现有低速数字系统中系统性抖动是主要的,在一个多接力段系统中,对所有数字波道都应该确定无输入抖动时输出抖动的累计平方根值和总的抖动转移函数。最大容许输入抖动通常与无线段的数目无关,因此应该分别测量所有数字波道中的每接力段的最大容许输入抖动。
204、该VNHC对该检测数据进行分析,得到检测结果,该检测结果用于显示该虚拟设备是否存在故障。
在本发明实施例中,该检测结果用于显示该虚拟设备是否存在故障。具体的,可以首先配置门限,即当丢包、时延、抖动的次数或者比例的门限数据,当通过统计得出检测数据后,可以通过预先配置的门限综合计算出被测虚拟网络的通信健康状态,即虚拟设备的故障或者正常。
205、若该检测结果显示存在故障,则该VNHC向该虚拟主机的虚拟后端发送该检测结果。
在本发明实施例中,若是检测数据显示所有虚拟设备均正常的情况下,则不会做出任何进一步行动,可以继续统计数据,检测故障。当检测数据显示虚拟设备存在故障的情况下,可以将故障打包成检测结果的消息,发送到虚拟主机的虚拟后端,让虚拟后端对该故障进行处理。
206、该虚拟后端根据该检测结果确定该虚拟主机存在的故障。
在一些可行的实施例中,虚拟后端接收到检测结果后,可以根据该检测结果确定存在的故障。优选的,该虚拟后端根据该检测结果确定该虚拟主机中存在故障的虚拟主机中的虚拟设备所对应的虚拟机。如,若虚拟机1号所对应的虚拟设备发生故障,而且可以确定虚拟设备中哪个设备哪个网桥存在故障。
207、该虚拟后端对该故障进行处理。
在本发明实施例中,当虚拟后端确定故障后,可以该故障进行处理。
优选的,该虚拟后端向该虚拟机发送控制消息,该控制消息指示该虚拟机将停止发送信息。即可以向虚拟机的虚拟光驱发送控制消息,以使得虚拟机的虚拟光驱指示虚拟端口停止收发信息,即可将整个虚拟机停止运行,而使用备用的虚拟机。通过这样的流程,可以检测到虚拟网络的健康状态,可以直接关联体现到GuestOS端口的管理状态,GuestOS可以根据端口状态,选择适当的接口收发报文,避免虚拟网络静默故障导致GuestOS用户业务受损。
另外,需要说明的是,还可以通过Cloud OS针对虚拟网络,周期检测虚拟网络节点状态信息,一旦发现部分vport/BR故障,则触发与该vport/BR相关路径上的vNIC故障,从而可以实现Bond方式下的主备链路及时倒换或者VM业务的迁移,避免业务长时间故障。
请参考图3,为本发明实施例中的一种故障检测装置300,包括:
检测单元301,用于对该虚拟主机中的虚拟设备进行故障检测,得到检测数据。
分析单元302,用于对该检测数据进行分析,得到检测结果,该检测结果用于显示该虚拟设备是否存在故障。
发送单元303,用于若该检测结果显示存在故障,则向该虚拟主机的虚拟后端发送该检测结果,以使得该虚拟后端对该故障进行处理。
请参考图4,该检测单元301包括:
发送子单元3011,用于向该虚拟设备发送检测消息。
接收子单元3012,用于接收返回检测消息,该返回检测消息由该虚拟设备根据该检测消息生成并返回该VNHC。
生成子单元3013,用于根据该返回检测消息生成该检测数据。
请参考图5,为本发明实施例中的一种故障检测装置500,包括:
接收单元501,用于接收该虚拟主机中的VNHC发送的检测结果。
确定单元502,用于根据该检测结果确定该虚拟主机存在的故障。
处理单元503,用于对该故障进行处理。
请参考图6,该确定单元502包括:
确定子单元5021,用于根据该检测结果确定该虚拟主机中存在故障的虚拟主机中的虚拟设备所对应的虚拟机。
请参考图7,该处理单元503包括:
发送子单元5031,用于向该虚拟机发送控制消息,该控制消息指示该虚拟机将停止发送信息。
请参考图8,为本发明实施例中的一种虚拟主机800,包括:
虚拟设备801,用于运行该虚拟主机的功能。
VNHC802,用于对该虚拟主机中的虚拟设备进行故障检测,得到检测数据,对该检测数据进行分析,得到检测结果,该检测结果用于显示该虚拟主机是否存在故障,若该检测结果显示存在故障,则向该虚拟主机的虚拟后端发送该检测结果。
虚拟后端803,用于对该故障进行处理。
请参考图9,为本发明实施例中的一种故障检测装置900,包括:
处理器901、存储器902、收发器903和总线904。
该总线904用于与该处理器901、该存储器902和该收发器903连接。
该处理器901用于对该虚拟主机中的虚拟设备进行故障检测,得到检测数据,对该检测数据进行分析,得到检测结果,该检测结果用于显示该虚拟设备是否存在故障。
该收发器903用于若该检测结果显示存在故障,则向虚拟后端发送该检测结果,以使得该虚拟后端对该故障进行处理。
该存储器902用于存储程序、该检测数据、该检测结果。
请参考图10,为本发明实施例中的一种故障检测装置1000,包括:
处理器1001、存储器1002、收发器1003和总线1004。
该总线1004用于与该处理器1001、该存储器1002和该收发器1003连接。
该收发器1003用于接收该虚拟主机中的VNHC发送的检测结果。
该处理器1001用于根据该检测结果确定该虚拟主机存在的故障,对该故障进行处理。
该存储器1002用于存储程序、该检测数据、该检测结果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (16)

1.一种故障检测方法,用于虚拟主机,其特征在于,包括:
所述虚拟主机中的虚拟网络健康监测组件VNHC对所述虚拟主机中的虚拟设备进行故障检测,得到检测数据;
所述VNHC对所述检测数据进行分析,得到检测结果,所述检测结果用于显示所述虚拟设备是否存在故障;
若所述检测结果显示存在故障,则所述VNHC向所述虚拟主机的虚拟后端发送所述检测结果,以使得所述虚拟后端对所述故障进行处理;
所述对所述虚拟主机中的虚拟设备进行故障检测包括:
所述VNHC向所述虚拟设备发送检测消息;
所述VNHC接收返回检测消息,所述返回检测消息由所述虚拟设备根据所述检测消息生成并返回所述VNHC;
所述VNHC根据所述返回检测消息生成所述检测数据。
2.根据权利要求1所述方法,其特征在于,所述虚拟设备包括网桥、策略网桥、内部网桥以及物理上联口相连的网桥。
3.根据权利要求1所述方法,其特征在于,所述检测消息包括上行检测消息和下行检测消息。
4.一种故障检测方法,用于虚拟主机,其特征在于,包括:
所述虚拟设备接收所述虚拟主机中的VNHC发送的检测消息;
所述虚拟设备根据所述检测消息生成返回检测消息;
所述虚拟设备向所述VNHC发送所述返回检测消息,以使得所述VNHC根据所述返回检测消息生成所述检测数据;
所述虚拟主机的虚拟后端接收所述VNHC发送的检测结果;
所述虚拟后端根据所述检测结果确定所述虚拟主机存在的故障;
所述虚拟后端对所述故障进行处理。
5.根据权利要求4所述方法,其特征在于,所述根据所述检测结果确定所述虚拟主机存在的故障包括:
所述虚拟后端根据所述检测结果确定所述虚拟主机中存在故障的虚拟主机中的虚拟设备在虚拟机中所对应的虚拟端口。
6.根据权利要求5所述方法,其特征在于,所述对所述故障进行处理包括:
所述虚拟后端向所述虚拟机发送控制消息,所述控制消息指示所述虚拟端口停止发送信息。
7.根据权利要求4至6中任一项所述方法,其特征在于,所述虚拟设备包括网桥、策略网桥、内部网桥以及物理上联口相连的网桥。
8.根据权利要求4至6中任一项所述方法,其特征在于,所述检测消息包括上行检测消息和下行检测消息。
9.一种故障检测方法,其特征在于,包括:
VNHC对虚拟主机中的虚拟设备进行故障检测,得到检测数据;
所述VNHC对所述检测数据进行分析,得到检测结果,所述检测结果用于显示所述虚拟主机是否存在故障;
所述VNHC若所述检测结果显示存在故障,则向所述虚拟主机的虚拟后端发送所述检测结果;
虚拟后端对所述故障进行处理。
10.一种故障检测装置,其特征在于,包括:
检测单元,用于对虚拟主机中的虚拟设备进行故障检测,得到检测数据;
分析单元,用于对所述检测数据进行分析,得到检测结果,所述检测结果用于显示所述虚拟设备是否存在故障;
发送单元,用于若所述检测结果显示存在故障,则向所述虚拟主机的虚拟后端发送所述检测结果,以使得所述虚拟后端对所述故障进行处理;
所述检测单元包括:
发送子单元,用于向所述虚拟设备发送检测消息;
接收子单元,用于接收返回检测消息,所述返回检测消息由所述虚拟设备根据所述检测消息生成并返回VNHC;
生成子单元,用于根据所述返回检测消息生成所述检测数据。
11.一种故障检测装置,其特征在于,包括:
接收单元,用于接收虚拟主机中的VNHC发送的检测消息;
处理单元,用于根据所述检测消息生成返回检测消息;
所述处理单元,向所述VNHC发送所述返回检测消息,以使得所述VNHC根据所述返回检测消息生成所述检测数据;
所述接收单元,用于接收所述虚拟主机中的VNHC发送的检测结果;
确定单元,用于根据所述检测结果确定所述虚拟主机存在的故障;
所述处理单元,用于对所述故障进行处理。
12.根据权利要求11所述装置,其特征在于,所述确定单元包括:
确定子单元,用于根据所述检测结果确定所述虚拟主机中存在故障的虚拟主机中的虚拟设备在虚拟机中所对应的虚拟端口。
13.根据权利要求12所述装置,其特征在于,所述处理单元包括:
发送子单元,用于向所述虚拟机发送控制消息,所述控制消息指示所述虚拟端口停止收发信息。
14.一种虚拟主机,其特征在于,包括:
虚拟设备,用于运行所述虚拟主机的功能;
VNHC,用于对所述虚拟主机中的虚拟设备进行故障检测,得到检测数据,对所述检测数据进行分析,得到检测结果,所述检测结果用于显示所述虚拟主机是否存在故障,若所述检测结果显示存在故障,则向所述虚拟主机的虚拟后端发送所述检测结果;
虚拟后端,用于对所述故障进行处理。
15.一种故障检测装置,其特征在于,包括:
处理器、存储器、收发器和总线;
所述总线用于与所述处理器、所述存储器和所述收发器连接;
所述处理器用于对虚拟主机中的虚拟设备进行故障检测,得到检测数据,对所述检测数据进行分析,得到检测结果,所述检测结果用于显示所述虚拟设备是否存在故障;
所述对所述虚拟主机中的虚拟设备进行故障检测包括:
VNHC向所述虚拟设备发送检测消息;
所述VNHC接收返回检测消息,所述返回检测消息由所述虚拟设备根据所述检测消息生成并返回所述VNHC;
所述VNHC根据所述返回检测消息生成所述检测数据;
所述收发器用于若所述检测结果显示存在故障,则向虚拟后端发送所述检测结果,以使得所述虚拟后端对所述故障进行处理;
所述存储器用于存储程序、所述检测数据、所述检测结果。
16.一种故障检测装置,其特征在于,包括:
处理器、存储器、收发器和总线;
所述总线用于与所述处理器、所述存储器和所述收发器连接;
所述收发器用于接收虚拟主机中的VNHC发送的检测消息;
所述处理单元用于根据所述检测消息生成返回检测消息;
所述处理单元向所述VNHC发送所述返回检测消息,以使得所述VNHC根据所述返回检测消息生成所述检测数据;
所述收发器用于接收所述虚拟主机中的VNHC发送的检测结果;
所述处理器用于根据所述检测结果确定所述虚拟主机存在的故障,对所述故障进行处理;
所述存储器用于存储程序、所述检测数据、所述检测结果。
CN201611063667.1A 2016-11-28 2016-11-28 一种故障检测方法及其设备 Active CN106685695B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611063667.1A CN106685695B (zh) 2016-11-28 2016-11-28 一种故障检测方法及其设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611063667.1A CN106685695B (zh) 2016-11-28 2016-11-28 一种故障检测方法及其设备

Publications (2)

Publication Number Publication Date
CN106685695A CN106685695A (zh) 2017-05-17
CN106685695B true CN106685695B (zh) 2020-02-14

Family

ID=58867265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611063667.1A Active CN106685695B (zh) 2016-11-28 2016-11-28 一种故障检测方法及其设备

Country Status (1)

Country Link
CN (1) CN106685695B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108712308B (zh) * 2018-06-06 2021-11-26 郑州云海信息技术有限公司 虚拟网络中检测网络设备的方法和装置
CN110138950B (zh) * 2019-05-14 2021-05-28 惠州Tcl移动通信有限公司 移动终端的wifi异常检测方法、计算机可读存储介质及移动终端
CN114244715B (zh) * 2021-12-17 2023-05-23 浪潮商用机器有限公司 一种vNIC主备端口选择方法、装置及其介质
CN114546498A (zh) * 2021-12-31 2022-05-27 广州芯德通信科技股份有限公司 一种基于光端机启动异常和处理方法、系统及平台

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104219107A (zh) * 2014-08-26 2014-12-17 华为技术有限公司 一种通信故障的检测方法、装置及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013120494A (ja) * 2011-12-07 2013-06-17 Hitachi Ltd Sr−iov対応デバイスを搭載した仮想計算機及び障害検出方法
KR101709632B1 (ko) * 2013-03-15 2017-02-23 닛본 덴끼 가부시끼가이샤 정보 처리 장치
US9350632B2 (en) * 2013-09-23 2016-05-24 Intel Corporation Detection and handling of virtual network appliance failures
CN103607296B (zh) * 2013-11-01 2017-08-22 新华三技术有限公司 一种虚拟机故障处理方法和设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104219107A (zh) * 2014-08-26 2014-12-17 华为技术有限公司 一种通信故障的检测方法、装置及系统

Also Published As

Publication number Publication date
CN106685695A (zh) 2017-05-17

Similar Documents

Publication Publication Date Title
US11683256B2 (en) Specializing virtual network device processing to avoid interrupt processing for high packet rate applications
US10389634B2 (en) Multiple active L3 gateways for logical networks
US9503371B2 (en) High availability L3 gateways for logical networks
CN106685695B (zh) 一种故障检测方法及其设备
US9830179B2 (en) Interaction with a virtual network
US10148556B2 (en) Link aggregation group (LAG) support on a software-defined network (SDN)
US9036638B2 (en) Avoiding unknown unicast floods resulting from MAC address table overflows
WO2018228302A1 (zh) 用于虚拟网络链路检测的方法及装置
US20140283045A1 (en) Managing virtual computing testing
JP2005006303A (ja) 仮想ネットワーク・アドレス
US8527665B2 (en) Redirecting function calls
US20190036802A1 (en) System and method for packet tracing within a packet switching asic
US11652717B2 (en) Simulation-based cross-cloud connectivity checks
CN112787913B (zh) 智能网卡组件、物理机、云服务系统以及报文发送方法
US9985864B2 (en) High precision packet generation in software using a hardware time stamp counter
CN111988221B (zh) 数据传输方法、数据传输装置、存储介质与电子设备
CN111131135B (zh) 数据传输方法、系统、计算机可读存储介质及电子设备
Landau et al. Plugging the hypervisor abstraction leaks caused by virtual networking
US10735292B1 (en) Monitoring interconnections between network devices of different network entities
KR101867881B1 (ko) 서비스 기능 체이닝을 운용하는 방법, 장치 및 컴퓨터 프로그램
Roulin Advancing the state of network switch asic offloading in the linux kernel
US11799749B1 (en) Systems and methods for facilitating traceroute operations across segment routing paths within networks
Miao et al. Developing a virtual network environment for analyzing malicious network behavior
WO2023081551A1 (en) Robust network connectivity leveraging edge compute

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant