CN109861863A - 数据中心的连接故障确定方法、装置、电子设备和介质 - Google Patents

数据中心的连接故障确定方法、装置、电子设备和介质 Download PDF

Info

Publication number
CN109861863A
CN109861863A CN201910110012.2A CN201910110012A CN109861863A CN 109861863 A CN109861863 A CN 109861863A CN 201910110012 A CN201910110012 A CN 201910110012A CN 109861863 A CN109861863 A CN 109861863A
Authority
CN
China
Prior art keywords
node
layer
node device
equipment
blueprint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910110012.2A
Other languages
English (en)
Other versions
CN109861863B (zh
Inventor
张彻
张实唯
汪漪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest University of Science and Technology
Southern University of Science and Technology
Original Assignee
Southwest University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest University of Science and Technology filed Critical Southwest University of Science and Technology
Priority to CN201910110012.2A priority Critical patent/CN109861863B/zh
Publication of CN109861863A publication Critical patent/CN109861863A/zh
Application granted granted Critical
Publication of CN109861863B publication Critical patent/CN109861863B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明实施例公开了一种数据中心的连接故障确定方法、装置、电子设备和介质,其中,该方法包括:基于物理图中节点连接度数确定服务器节点,并基于除去服务器节点之外的节点设备确定交换机图;在交换机图中基于各个节点设备对应的哈希值,以及与服务器节点的连接关系,分别得到边缘交换机节点层、核心交换机节点层和聚合交换机节点层,并对各节点层中的节点设备进行参数标记;对服务器节点进行参数标记;按照设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图;利用物理图和中间矩阵图中的目标差异矩阵元素,确定故障节点设备及其节点角色。本发明实施例提高了确定数据中心节点连接故障的效率以及准确性。

Description

数据中心的连接故障确定方法、装置、电子设备和介质
技术领域
本发明实施例涉及计算机网络技术领域,尤其涉及一种数据中心的连接故障确定方法、装置、电子设备和介质。
背景技术
为了给用户提供高带宽低延迟、稳定并可靠的网络服务,很多新开发的应用程序均部署在云环境中,这推动了存储、传输和计算服务从电脑客户端向数据中心(Datacenter,简称DC)的转变。为了满足单个电脑客户端中越来越多的服务需求,例如网络搜索、视频观看、移动互联网和云存储等,服务终端的规模呈指数级增长。构建合理的数据中心网络拓扑及路由,以实现数据中心快速扩展并充分利用数据中心网络性能,成为计算机网络领域的重要研究方向。
现有技术中根据预先设计的数据矩阵形式的机房蓝图,基于图论理论,以及记录的设备与位置的对应关系,构建数据中心。但是,该构建过程比较繁琐,并且记录每一个设备与位置的对应关系是一项巨大的工作,而且这种记录可能容易出错,导致数据中心构建出错。
现有的故障定位方法通常采用基于数据中心构建时采用的设计蓝图和从建好的数据中心收集的物理图,确定出设计蓝图和物理图之间的最大公共子图,则数据中心的故障部分即对应设计蓝图和物理图之间的差异部分。同时,假设管理员可以自己发现并修复有节点度数变化的故障,而对于节点度数不变的故障,首先在设计蓝图和物理图中初步确定预设数量的可能对应的节点,然后利用这些节点作为锚点来逐步扩展子图,并判断从设计蓝图和物理图中的锚点扩展出的子图是否同构,当判断出扩展的两个子图不同构时,则确定故障节点存在于当前子图中。
上述故障定位方法的准确性取决于选择的用于检测的锚点数量与网络中的错误布线的数量。并且,在没有正确选择锚点的情况下,不仅非常耗时,而且准确率更低。考虑给出的结果不一定都是真正的故障节点,维护人员便需要首先检查故障定位结果报告中关于可能故障节点的长列表,然后手动确定真正的故障节点。
发明内容
本发明实施例提供一种数据中心的连接故障确定方法、装置、电子设备和介质,提高了确定数据中心的节点连接故障的效率以及准确性。
第一方面,本发明实施例提供了一种数据中心的连接故障确定方法,该方法包括:
将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去所述服务器节点之外的节点设备确定交换机图;
在所述交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值;
根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备,其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,所述至少一个孤立节点设备中各个节点设备对应的哈希值互不相同;
在所述至少一个节点集合中,将在所述物理图中与所述服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在所述物理图中与所述服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层;
按照所述数据中心的设计蓝图中节点角色的标记规则,对所述边缘交换机节点层和所述核心交换机节点层中的节点设备进行参数标记,其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与所述设计蓝图中对应角色层的节点角色一一对应;
将所述至少一个孤立节点设备划分为聚合交换机节点层,并根据所述设计蓝图中节点角色的标记规则,以及所述聚合交换机节点层中节点设备在所述物理图中与所述边缘交换机节点层和所述核心交换机节点层中的节点设备的连接关系,对所述聚合交换机节点层中的节点设备进行参数标记;
根据所述设计蓝图中节点角色的标记规则,以及所述服务器节点在所述物理图中与所述边缘交换机节点层中节点设备的连接关系,对所述服务器节点进行参数标记;
按照所述设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,其中,每个节点设备在所述中间矩阵图中的位置与在所述物理图中的位置相同;
确定所述物理图和所述中间矩阵图中的目标差异矩阵元素,并根据所述目标差异矩阵元素确定故障节点设备以及所述故障节点设备对应的节点角色。
第二方面,本发明实施例还提供了一种数据中心的连接故障确定装置,该装置包括:
服务器节点确定模块,用于将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去所述服务器节点之外的节点设备确定交换机图;
哈希值确定模块,用于在所述交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值;
节点分类模块,用于根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备,其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,所述至少一个孤立节点设备中各个节点设备对应的哈希值互不相同;
边缘与核心交换机节点层确定模块,用于在所述至少一个节点集合中,将在所述物理图中与所述服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在所述物理图中与所述服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层;
边缘与核心交换机节点层标记模块,用于按照所述数据中心的设计蓝图中节点角色的标记规则,对所述边缘交换机节点层和所述核心交换机节点层中的节点设备进行参数标记,其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与所述设计蓝图中对应角色层的节点角色一一对应;
聚合交换机节点层确定及标记模块,用于将所述至少一个孤立节点设备划分为聚合交换机节点层,并根据所述设计蓝图中节点角色的标记规则,以及所述聚合交换机节点层中节点设备在所述物理图中与所述边缘交换机节点层和所述核心交换机节点层中的节点设备的连接关系,对所述聚合交换机节点层中的节点设备进行参数标记;
服务器节点标记模块,用于根据所述设计蓝图中节点角色的标记规则,以及所述服务器节点在所述物理图中与所述边缘交换机节点层中节点设备的连接关系,对所述服务器节点进行参数标记;
中间矩阵图创建模块,用于按照所述设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,其中,每个节点设备在所述中间矩阵图中的位置与在所述物理图中的位置相同;
故障确定模块,用于确定所述物理图和所述中间矩阵图中的目标差异矩阵元素,并根据所述目标差异矩阵元素确定故障节点设备以及所述故障节点设备对应的节点角色。
第三方面,本发明实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任一实施例所述的数据中心的连接故障确定方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任一实施例所述的数据中心的连接故障确定方法。
本发明实施例首先基于物理图中节点连接度数确定服务器节点,并基于除去服务器节点之外的节点设备确定交换机图;然后在交换机图中基于各个节点设备对应的哈希值,以及与服务器节点的连接关系,分别得到边缘交换机节点层、核心交换机节点层和聚合交换机节点层,并对当前确定的各节点层中的节点设备以及服务器节点进行参数标记;其次按照设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图;最后利用物理图和中间矩阵图中的目标差异矩阵元素,确定故障节点设备及其节点角色,解决了现有方法中故障确定比较耗时以及准确性较低的问题,提高了确定数据中心的节点连接故障的效率以及准确性。
附图说明
图1是本发明实施例一提供的数据中心的连接故障确定方法的流程图;
图2是本发明实施例一提供的设计蓝图的一种示意图;
图3是本发明实施例二提供的数据中心的连接故障确定方法的流程图;
图4是本发明实施例三提供的数据中心的连接故障确定方法的流程图;
图5a是本发明实施例三提供的中间蓝图的一种示意图;
图5b是本发明实施例三提供的中间矩阵图的一种示意图;
图6是本发明实施例四提供的数据中心的连接故障确定装置的结构示意图;
图7是本发明实施例五提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的数据中心的连接故障确定方法的流程图,本实施例可适用于依据数据中心的物理图确定数据中心中连接错误的故障节点的情况,该方法可以由数据中心的连接故障确定装置来执行,该装置可以采用软件和/或硬件的方式实现,并可集成在电子设备上。
本实施例中,根据数据中心的设备部署需求,数据中心的节点设备包括分为以下类型:服务器类、边缘交换机类、聚合交换机类和核心交换机类,对应至数据中心的节点设备连接关系网络中,分别对应服务器节点层、边缘交换机节点层、聚合交换机节点层和核心交换机节点层。当不存在节点设备连接错误的情况下,每个节点层中的节点设备均可以被划分为至少一个节点组(一个节点组即一个节点集合),每个节点组中至少包括两个节点设备。并且,除了聚合交换机节点层中的节点设备外,其他节点层中属于一个节点组的节点设备具有完全相同的连接关系;聚合交换机节点层中同一节点组的节点设备与边缘交换机节点层中相同的节点设备连接,但与核心交换机节点层中的不同节点设备连接。本实施例方案针对数据中心存在的连接错误较少的情况,即节点设备连接错误对应的连接度数小于故障度数阈值,该故障度数阈值与数据中心构建过程所依据的拓扑网络结构有关。此外,即使节点设备之间存在连接错误,也不会影响边缘交换机节点层和核心交换机节点层中包括的节点组的数量。
如图1所示,本实施例提供的数据中心的连接故障确定方法可以包括:
S110、将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去服务器节点之外的节点设备确定交换机图。
物理图用于记录已经建好的数据中心中各个节点设备之间的连接关系,也是检测数据中心存在的节点设备连接故障的基础。当数据中心的物理图创建需求被触发后,用于执行本实施例方案的电子设备可以统一向数据中心的各个节点设备发送查询指令;各个节点设备响应于该查询指令,并将各自的端口连接关系、各自的物理地址(MAC地址)以及各自的逻辑IP等信息发送至该电子设备;该电子设备基于接收的各个节点设备的端口连接关系、MAC地址和逻辑IP等信息,经过数据处理,得到数据中心的物理图。其中,物理图中预先指定的某一行和某一列,例如第一行和第一列,可以分别表示各节点设备的MAC地址,或者各节点设备的逻辑IP,用于实现在物理图中对各个节点设备的区分;除去节点设备占用的行与列之外的矩阵元素便表示对应的两个节点设备之间的连接关系,例如,若两个节点设备之间存在连接关系则使用数字1表示,若两个节点设备之间不存在连接关系则使用数字0表示。在可以实现区分表示节点设备之间是否存在连接关系的基础上,本实施例对所用的字符形式不作具体限定。
由于服务器节点层中节点设备的连接度数最小,将物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,即相当于将当前物理图中连接度数最小的节点设备确定为服务器节点。其中,连接度数指在物理图中与每个节点设备连接的其他节点设备的数量。第一度数阈值可以依据不存在连接错误时数据中心部署的服务器节点的标准连接度数进行适应性设置。根据连接度数确定出服务器节点后,物理图中剩余的节点设备便均属于交换机类型。由交换机类型的节点设备以及节点设备间的连接关系得到交换机图。
S120、在交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值。
考虑物理图或者交换机图中节点设备之间的连接关系均使用矩阵元素表示,对于每个节点设备,均有与该节点设备的连接关系相对应的一系列矩阵元素,将这一系列矩阵元素作为哈希函数的参数,从而得到每个节点设备对应的哈希值。通过哈希计算,将各个节点设备在交换机图中的连接关系进行量化表示,可以简化不同节点设备的连接关系的比较过程,实现基于连接关系对各个节点设备的分类。哈希函数的具体形式本实施例不作具体限定,例如,可以是半全局块匹配(Semi-Global Block Matching,SGBM)函数。
可选的,在交换机图中,基于每个节点设备与其他节点设备的连接关系,得到每个节点设备对应的哈希值,包括:
在交换机图中,基于每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的矩阵子图;
保持每个节点设备对应的矩阵子图中目标矩阵元素的位置顺序,得到对应于每个节点设备的由目标矩阵元素组成的数组,其中,目标矩阵元素是矩阵子图中除去节点设备占用的矩阵元素之外的剩余矩阵元素;
将数组作为哈希函数的输入,得到每个节点设备对应的哈希值,其中,具有相同连接关系的节点设备对应相同的哈希值。
矩阵子图是指只包括每个节点设备本身在交换机图中的连接关系的一部分交换机图,例如,矩阵子图可以是交换机图中节点设备所在的行或者列,该行或列的第一个矩阵元素表示节点设备本身,除去第一个矩阵元素外的剩余矩阵元素即目标矩阵元素。在进行哈希计算的过程中,保持矩阵元素在矩阵子图中的位置顺序,即将矩阵元素的位置因素同时加以考虑,以进一步保证哈希值可以正确体现节点设备的连接关系。
S130、根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备,其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,至少一个孤立节点设备中各个节点设备对应的哈希值互不相同。
统计交换机图中各个节点设备的哈希值,根据哈希值将节点设备分类。
S140、在至少一个节点集合中,将在物理图中与服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在物理图中与服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层。
根据数据中心的构建特点,在边缘交换机节点层和核心交换机节点层中,属于同一组的节点设备具有相同的连接关系,而具有相同连接关系的节点设备对应相同的哈希值,因此,根据哈希值得到的节点集合中包括属于边缘交换机节点层和核心交换机节点层的节点设备。节点集合的数量与边缘交换机节点层包括的节点组组数和核心交换机节点层包括的节点组组数的总和相同,并且,属于边缘交换机节点层的节点集合数量以及属于核心交换机节点层的节点集合数量分别与数据中心中各个节点层的标准组数量相同。标准组数量指不存在连接错误时,每个节点层中包括的节点组或者节点集合数量。
在物理图中,服务器节点层与边缘交换机节点层存在连接关系,边缘交换机节点层通过聚合交换机层与核心交换机节点层连接。当确定出服务器节点后,与服务器节点相连接的节点设备便可以划分为边缘交换机节点层,则至少一个节点集合中剩余的节点设备便可以划分为核心交换机节点层。
S150、按照数据中心的设计蓝图中节点角色的标记规则,对边缘交换机节点层和核心交换机节点层中的节点设备进行参数标记,其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与设计蓝图中对应角色层的节点角色一一对应。
设计蓝图是根据预先定义的节点设备的角色,结合数据中心的部署需求而设计的,用于指导数据中心的构建,其中,预先定义的节点角色用于代表与该角色所属类型相同的至少一个同类节点设备,节点角色连接关系反映了与节点角色对应的节点设备之间的正确连接关系。数据中心的部署需求中包括了预先规划的节点设备之间的连接关系。在设计蓝图中,按照预设的节点角色标记规则,每个节点角色使用对应的角色参数进行标记,节点角色的标记参数也可以反应不同角色层之间节点角色的连接关系。根据节点角色的分类,同一类型下的每个节点角色可以对应与角色类型相同的任一节点设备,例如属于交换机类型的每个节点角色,可以对应属于交换机类型的节点设备中的任一台交换机。因此,在设计蓝图中,并没有将每个节点角色对应的同类型的节点设备具体化和唯一化。
可选的,数据中心的设计蓝图基于具有层次化结构特点的网络拓扑图实现该网络拓扑图包括但不限于:胖树拓扑结构图、VL2数据中心架构图、谷歌数据中心网络结构图或多级交换网络架构图。图2作为示例,示出了一种基于胖树拓扑结构图的设计蓝图。如图2所示,该设计蓝图中包括4个节点角色层:服务器节点角色层、边缘交换机节点角色层、聚合交换机节点角色层和核心交换机节点角色层,每个节点角色上的数字标号即每个节点角色的角色参数的一种表示方式。
设计蓝图的节点角色标记规则即定义如何对节点角色进行参数标记,当确定出物理图中边缘交换机节点层和核心交换机节点层中的节点设备后,按照设计蓝图中对应的节点角色层中节点角色的标记参数,对物理图的节点设备依次进行参数标记,例如按照各层的节点组或者节点集合数量依次对节点设备进行组号标记。
S160、将至少一个孤立节点设备划分为聚合交换机节点层,并根据设计蓝图中节点角色的标记规则,以及聚合交换机节点层中节点设备在物理图中与边缘交换机节点层和核心交换机节点层中的节点设备的连接关系,对聚合交换机节点层中的节点设备进行参数标记。
聚合交换机节点层中属于同一节点组的节点设备与边缘交换机节点层中相同的节点设备连接,但与核心交换机节点层中的不同节点设备连接,因此核心交换机层中不存在连接关系完全相同的节点设备,节点设备对应的哈希值各不相同。示例性的,根据聚合交换机节点层分别与边缘交换机节点层和核心交换机节点层中节点设备之间的连接关系,将聚合交换机节点层的节点设备使用与之连接的边缘交换机类节点设备在边缘交换机节点层中的组号进行第一次标记,并将聚合交换机节点层的节点设备使用与之连接的核心交换机类节点设备在核心交换机节点层中的组号进行第二次标记,从而得到聚合交换机节点层的各个节点设备的标记参数。
S170、根据设计蓝图中节点角色的标记规则,以及服务器节点在物理图中与边缘交换机节点层中节点设备的连接关系,对服务器节点进行参数标记。
统计服务器节点与边缘交换机节点层中节点设备的连接关系,将连接至同一个边缘交换机类节点设备的服务器节点划分至同一节点组,并按照服务器节点组的数量依次进行组号标记,同一节点组内的服务器节点均使用该组组号作为标记参数。
可选的,根据设计蓝图中节点角色的标记规则,以及服务器节点在物理图中与边缘交换机节点层中节点设备的连接关系,对服务器节点进行参数标记,包括:
将与边缘交换机节点层的同一节点设备相连接的服务器节点,确定为同组服务器节点,并对确定的各个服务器节点组进行参数标记,其中,每个服务器节点组中的服务器节点使用相同的标记参数;
针对与边缘交换机节点层的节点设备不相连接的剩余服务器节点,建立剩余服务器节点与边缘交换机节点层中任意节点设备的虚拟连接关系,并对剩余服务器节点进行参数标记。
由于数据中心节点设备之间连接关系错误的不可预知性,服务器节点可能错误的连接在除边缘交换机节点层之外的节点设备上,因此,依据物理图中服务器节点与边缘交换机节点层中节点设备的连接关系,并不能保证实现对所有服务器节点的分组。此时,本实施例采用建立随机的虚拟连接关系的方式,实现对服务器节点设备的分组。例如,可以选择将剩余的服务器节点划分至包括的服务器节点数量小于服务器数量阈值的目标服务器节点组中,即将剩余的服务器节点划分至包括的服务器节点数量较少的服务器节点组中,使用目标服务节点组的组号对剩余服务器节点进行参数标记,相当于建立剩余服务器节点与目标服务器节点组所连接的边缘交换机类节点设备的虚拟连接关系。服务器数量阈值可以通过对已经分组的服务器节点组中的节点数量进行统计后灵活设置。参数标记的目的在于将各个节点设备对应至设计蓝图中节点角色,在此采用随机分组的方式对剩余服务器节点进行分组并标记,不会影响本实施例方案的准确性,在最终确定连接错误的故障节点设备时,存在连接错误的服务器节点依然可以被检测出来。
可选的,在对服务器节点进行参数标记后,该方法还包括:
使用每个服务器节点的标记参数,对与每个服务器节点连接的边缘交换机节点层的节点设备进行第二次参数标记,其中,与每个服务器节点的连接关系包括建立的虚拟连接关系。
如图2所示,边缘交换机节点角色层中的节点角色均使用二维数组作为角色标记参数,因此,如果在对边缘交换机节点层中节点设备进行初始的参数标记时,只进行了一次当前层中的组号参数标记,当服务器节点组完成组号标记后,还可以使用服务器节点组的组号对与之连接的边缘交换机类节点设备进行第二次参数标记,从而得到二维数组形式的标记参数。
S180、按照设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,其中,每个节点设备在中间矩阵图中的位置与在物理图中的位置相同。
设计蓝图中各节点角色之间的连接关系是对应至物理图中各节点设备应有的正确连接关系,因此,当数据中心构建过程中节点设备之间的连接关系出现连接错误,设计蓝图与物理图中所反映的连接关系便出现不一致的现象。利用设计蓝图中节点角色的正确连接关系,得到中间矩阵图,通过中间矩阵图确定物理图中存在连接关系错误的节点设备,即故障节点设备。
S190、确定物理图和中间矩阵图中的目标差异矩阵元素,并根据目标差异矩阵元素确定故障节点设备以及故障节点设备对应的节点角色。
物理图和中间矩阵图中除去节点设备占用的行与列之外,剩余的矩阵元素均表示两个节点设备之间的连接关系,存在的差异矩阵元素即表示与该矩阵元素对应的节点设备之间的连接关系在物理图和中间矩阵图中不一致,与目标差异矩阵元素对应的多个节点设备均属于故障节点设备。
当确定出故障节点设备后,便可以得到该设备的逻辑IP和物理地址(MAC地址)等信息。并且,根据故障节点设备对应的节点角色,可以利用为数据中心设计蓝图时记录的角色信息列表进一步确定故障节点设备对应的其他信息,例如,根据角色信息列表中节点角色与节点设备位置的对应关系,确定故障节点设备的位置,无需通过技术人员在数据中心进行实地排查确定故障节点设备的位置,方便技术人员快速开展数据中心的修复工作。
相比于现有的故障定位方法,本实施例方案不涉及在设计蓝图和物理图中确定锚点并基于锚点逐步扩展子图,方案实现逻辑更加清晰简单,并且本方案属于NP完全(NP-complete)问题,即多项式复杂程度的非确定性问题,计算复杂度远远低于现有技术的指数级复杂程度,因此,本方案的故障定位效率更高;并且本方案摆脱了现有技术中锚点选择对故障定位准确性的约束,因而故障定位的准确性也可以更高。
可选的,该方法还包括:依据中间矩阵图对物理图中故障节点设备的连接关系进行修正。例如,可以利用预先编写的修正程序,将确定的故障节点设备作为参数,依据中间矩阵图中的正确节点设备连接关系对物理图进行修正,这不仅使得技术人员可以准确掌握建好的数据中心中各节点设备间的正确连接关系,而且有助于加速数据中心及其物理图的修复过程。本实施例技术方案针对数据中心存在的连接错误故障较少的情况,快速确定出的故障节点设备数量可以达到最少,从而对物理图进行修复时,涉及的连接关系修复操作也最少,提高了修复效率。
本实施例的技术方案首先基于物理图中节点连接度数确定服务器节点,并基于除去服务器节点之外的节点设备确定交换机图;然后在交换机图中基于各个节点设备对应的哈希值,以及与服务器节点的连接关系,分别得到边缘交换机节点层、核心交换机节点层和聚合交换机节点层,并对当前确定的各节点层中的节点设备以及服务器节点进行参数标记;其次按照设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图;最后利用物理图和中间矩阵图中的目标差异矩阵元素,确定故障节点设备及其节点角色,解决了现有方法中故障确定比较耗时以及准确性较低的问题,提高了确定数据中心的节点连接故障的效率以及准确性;此外,本实施例技术方案针对数据中心存在的连接错误故障较少的情况,快速确定出的故障节点设备数量可以达到最少,从而对物理图进行修复时,涉及的连接关系修复操作也最少,提高了修复效率。
实施例二
图3是本发明实施例二提供的数据中心的连接故障确定方法的流程图,本实施例是在上述实施例的基础上进一步进行优化与扩展。如图3所示,该方法可以包括:
S201、将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去服务器节点之外的节点设备确定交换机图。
S202、在交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值。
S203、根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备。
其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,至少一个孤立节点设备中各个节点设备对应的哈希值互不相同。
S204、在至少一个节点集合中,将在物理图中与服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在物理图中与服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层。
S205、按照数据中心的设计蓝图中节点角色的标记规则,对边缘交换机节点层和核心交换机节点层中的节点设备进行参数标记。
其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与设计蓝图中对应角色层的节点角色一一对应。
S206、在至少一个孤立节点设备中,将在物理图中同时与边缘交换机节点层和核心交换机节点层中的节点设备连接的节点设备划分为聚合交换机节点层。
由于数据中心节点设备之间连接关系错误的不可预知性,基于交换机图中节点设备的哈希值确定出的至少一个孤立节点设备并非均同时与边缘交换机节点层和核心交换机节点层中的节点设备存在连接关系。考虑本实施例中当前确定的核心交换机层包括的节点集合的数量与不存在连接故障时核心交换机层应有的标准节点组的数量相同,而在核心交换机层中节点组的数量正确的前提下,我们认为与核心交换机层存在连接关系的节点设备可以覆盖所有的属于聚合交换机节点层的节点设备。
参考图2进行解释性说明,如图2所示,当前核心交换机节点角色层中包括两个节点角色组,组号分别为(1)和(2),不同节点角色组中的节点设备存在与聚合交换机节点角色层中相同的节点角色相连接的情况,因此,即使当前核心交换机节点角色层中某个节点角色组中包括的节点角色数量少于标准数量,在角色组的组数量正确的前提下,根据核心交换机节点角色层与聚合交换机节点角色层的连接关系,依然可以覆盖聚合交换机节点角色层中所有的节点角色。设计蓝图中反应的节点角色之间的连接关系与物理图中节点设备之间的连接关系实质上相同,因此,在物理图中同时与边缘交换机节点层和核心交换机节点层中的节点设备相连接的孤立节点设备即属于聚合交换机节点层。
S207、依据聚合交换机节点层中节点设备在物理图中与边缘交换机节点层和核心交换机节点层中的节点设备的连接关系,使用边缘交换机节点层和核心交换机节点层中节点设备的标记参数对聚合交换机节点层中节点设备进行参数标记。
S208、将至少一个孤立节点设备中除去被划分为聚合交换机节点层之外的剩余节点设备,按照每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至目标候选节点设备所属节点集合中。
其中,目标候选节点设备包括边缘交换机节点层或核心交换机节点层中的任一节点设备。同一节点集合中节点设备具有相同的连接关系,因此,可以在边缘交换机节点层和核心交换机节点层的每个节点集合中,任选一个节点设备作为代表与至少一个孤立节点设备中的剩余节点设备进行连接关系的相似度计算,将剩余节点设备划分至与其连接关系相似的代表节点设备所在的节点集合。
可选的,在确定边缘交换机节点层和核心交换机节点层中分别包括的节点集合后,该方法还包括:
将边缘交换机节点层中包含的节点设备数量小于节点数量阈值的节点集合标记为不完整边缘集合;
将核心交换机节点层中包含的节点设备数量小于节点数量阈值的节点集合标记为不完整核心集合;
其中,节点数量阈值与用于构建设计蓝图的网络拓扑图相关;
相应的,目标候选节点设备包括不完整边缘集合或不完整核心集合中的任一节点设备。
当节点集合中包括的节点设备数量小于当前节点层的节点集合应有的标准节点数量时,该节点集合即属于不完整集合。节点数量阈值即数据中心不存在连接错误时各层的节点集合中应有的标准节点数量。例如,对于依据胖树拓扑结构图创建的数据中心,每个交换机设备上的端口数量为k,当不存在连接错误时,每个节点层的节点集合内应有的标准节点数量为k/2,若当前节点集合中包括的节点设备数量小于k/2,则属于不完整集合。当分别确定出不完整边缘集合和不完整核心集合后,便可以根据连接关系的相似度计算,将至少一个孤立节点设备中的剩余节点设备划分至这些不完整集合中,从而保证对剩余节点设备分类的合理性。
S209、使用每个剩余节点设备被划分的节点集合的标记参数,对每个剩余的节点设备进行参数标记。
S210、根据设计蓝图中节点角色的标记规则,以及服务器节点在物理图中与边缘交换机节点层中节点设备的连接关系,对服务器节点进行参数标记。
S211、按照设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图。
其中,每个节点设备在中间矩阵图中的位置与在物理图中的位置相同。
S212、确定物理图和中间矩阵图中的目标差异矩阵元素,并根据目标差异矩阵元素确定故障节点设备以及故障节点设备对应的节点角色。
在上述技术方案的基础上,可选的,将至少一个孤立节点设备中除去被划分为聚合交换机节点层之外的剩余节点设备,按照每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至目标候选节点设备所属节点集合中,包括:
确定剩余节点设备中每个剩余节点设备的连接度数;
根据每个剩余节点设备的连接度数与第二度数阈值的关系,确定每个剩余节点设备所属的目标节点层,其中,目标节点层包括边缘交换机节点层或核心交换机节点层,第二度数阈值与用于构建设计蓝图的网络拓扑图相关,第二度数阈值可以设置为不存在连接故障时交换机类节点设备在物理图中的连接度数,与预设的故障度数阈值之间的差值;
在目标节点层中确定目标候选节点设备,按照每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至目标候选节点设备所属节点集合中。
首先根据至少一个孤立节点设备中剩余节点设备的连接度数,确定剩余节点设备所属的目标节点层,然后再根据连接关系的相似度确定其将被划分的具体节点集合,可以减少对剩余节点设备分组所涉及的计算量,提高对剩余节点设备进行分组的效率。
例如,对于依据胖树拓扑结构创建的数据中心,如果每个交换机设备上的端口数量为k,在不存在节点设备的连接错误的情况下,由物理图中去除服务器节点后剩余的节点设备组成的交换机图中,边缘交换机节点层中每个节点设备的连接度数是k/2,核心交换机节点层中每个节点设备的连接度数均是k。当可能存在连接错误时,本实施例的实施前提:数据中心存在的节点设备连接错误较少,指数据中心所有故障节点设备之间的错误连接对应的连接度数小于k/4,则此时可以将第二度数阈值设置为3k/4。如果剩余节点设备的连接度数大于3k/4,则确定剩余节点设备所属的目标节点层是核心交换机节点层;如果剩余节点设备的连接度数小于3k/4,则确定剩余节点设备所属的目标节点层是边缘交换机节点层。由于数据中心存在的连接故障较少,因此,属于同一节点层的节点设备之间的连接度数的差异仍然较小,按照剩余节点设备的连接度数确定其所属的目标节点层,不仅可以提高对剩余节点设备的分类效率,而且可以保证分类的合理性。采用本实施例方案,即使节点设备之间存在连接错误,也可以将各个节点设备进行合理分类,合理确定其所属的节点层以及节点集合。
可选的,按照每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至目标候选节点设备所属节点集合中,包括:
按照每个剩余节点设备与其他节点设备的连接关系,确定每个剩余节点设备的剩余节点矩阵子图;
按照目标候选节点设备与其他节点设备的连接关系,确定目标候选节点设备的目标节点矩阵子图;
将剩余节点矩阵子图和目标节点矩阵子图中相同位置上的矩阵元素进行异或计算,确定两个矩阵子图中差异矩阵元素的数量;
根据差异矩阵元素的数量确定每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度;
若相似度大于相似阈值,则将每个剩余节点设备划分至目标候选节点设备所属节点集合中。
示例性的,剩余节点设备与目标候选节点设备的连接关系相似度与异或计算确定的差异矩阵元素的数量成反比,差异矩阵元素的数量越多,剩余节点设备与目标候选节点设备的相似度越小。相似度阈值可以根据计算需要进行合理设置,对此不作具体限定。当每个剩余节点设备分别被划分至目标候选节点设备所属节点集合后,利用该目标候选节点设备所属节点集合的标记参数对剩余节点设备进行标记,例如。利用目标候选节点设备所属节点集合的组号对剩余节点设备进行标记。
本实施例的技术方案通过首先对数据中心的物理图进行处理,将各个节点设备进行不同层次的分类,例如划分节点设备所属的节点层与所属的节点集合,同时依据数据中心的设计蓝图对各个节点设备进行参数标记,使得标记后的节点设备与设计蓝图中的节点角色一一对应,然后再次利用设计蓝图,基于标记后的节点设备创建中间矩阵图,最后基于中间矩阵图与物理图的比较确定出连接错误的故障节点设备以及其节点角色,解决了现有方法中故障确定比较耗时以及准确性较低的问题,提高了确定数据中心的节点连接故障的效率以及准确性;并且本实施例技术方案针对数据中心存在的连接错误故障较少的情况,快速确定出的故障节点设备数量可以达到最少,从而对物理图进行修复时,涉及的连接关系修复操作也最少,提高了修复效率。
实施例三
图4是本发明实施例三提供的数据中心的连接故障确定方法的流程图,本实施例是在上述实施例的基础上进一步进行优化与扩展。如图4所示,该方法可以包括:
S301、将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去服务器节点之外的节点设备确定交换机图。
S302、在交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值。
S303、根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备。
其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,至少一个孤立节点设备中各个节点设备对应的哈希值互不相同。
S304、在至少一个节点集合中,将在物理图中与服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在物理图中与服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层。
S305、按照数据中心的设计蓝图中节点角色的标记规则,对边缘交换机节点层和核心交换机节点层中的节点设备进行参数标记。
其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与设计蓝图中对应角色层的节点角色一一对应。
S306、将至少一个孤立节点设备划分为聚合交换机节点层,并根据设计蓝图中节点角色的标记规则,以及聚合交换机节点层中节点设备在物理图中与边缘交换机节点层和核心交换机节点层中的节点设备的连接关系,对聚合交换机节点层中的节点设备进行参数标记。
S307、根据设计蓝图中节点角色的标记规则,以及服务器节点在物理图中与边缘交换机节点层中节点设备的连接关系,对服务器节点进行参数标记。
S308、按照设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备对应的节点角色创建中间蓝图。
中间蓝图的表现形式与数据中心的设计蓝图的表现形式类似,区别在于中间蓝图是基于物理图中各个节点设备以及各节点设备之间的连接关系进行反推得到。设计蓝图基于具有层次化结构特点的网络拓扑图实现,可以清晰地体现各节点角色之间的连接关系,进而清晰地展示对应的节点设备之间的连接关系。因此,中间蓝图也具有层次化的网络结构形式,可以清晰地体现物理图中节点设备的连接关系。
S309、将参数标记后的各个节点设备进行编号表示,并基于该编号和中间蓝图,确定与中间蓝图对应的中间矩阵图。
将各个节点设备进行编号,是为了在矩阵图中便捷表示各个节点设备。编号可以采用简洁的数字或字母编号形式。图5a示出了本实施例提供的一种中间蓝图的示意图,即将各个节点设备进行数字编号表示后的蓝图。图5a作为中间蓝图的一种示例,其表示的节点设备之间的连接关系与图2中展示的节点角色之间的连接关系并不对应。节点设备进行编号之后,利用无向图和邻接矩阵的转换关系,便可得到与中间蓝图对应的中间矩阵图。图5b示出了本实施例提供的一种中间矩阵图的示意图,与图5a展示的中间蓝图对应,即图5a和图5b展示的节点设备之间的连接关系实质相同。
S310、对物理图中的每个节点设备,采用与每个节点设备在中间矩阵图中相同的编号进行表示,并基于该编号和物理图,确定与物理图对应的第一矩阵图。
S311、对第一矩阵图和中间矩阵图中相同位置上的矩阵元素进行异或计算,确定目标差异矩阵元素。
第一矩阵图相对于物理图是一种将节点设备简化表示后的矩阵图,即利用编号替代物理图中使用的节点设备MAC地址或者IP地址。对于同一节点设备,其在第一矩阵图和物理图中的编号相同,因此,通过两个矩阵图中相同位置上的矩阵元素的异或计算,确定差异矩阵元素,进而确定出故障节点设备以及故障节点设备对应的节点角色。
S312、基于物理图确定目标差异矩阵元素对应的故障节点设备,并基于中间蓝图确定目标差异矩阵元素对应的故障节点角色。
在上述技术方案的基础上,可选的,在确定边缘交换机节点层和核心交换机节点层中分别包括的节点集合后,该方法还包括:
将边缘交换机节点层中连接度数处于第一度数范围的节点设备所属的节点集合标记为故障边缘集合,其中,第一度数范围指小于规范度数阈值,且不等于边缘交换机节点层中节点设备的标准连接度数;
将核心交换机节点层中连接度数处于第二度数范围的节点设备所属的节点集合标记为故障核心集合,其中,第二度数范围指大于规范度数阈值,且不等于核心交换机节点层中节点设备的标准连接度数;
将故障边缘集合和故障核心集合中的节点设备作为候选故障节点设备;
其中,规范度数阈值与用于构建设计蓝图的网络拓扑图相关,规范度数阈值可以设置为不存在连接故障时交换机类节点设备在物理图中的连接度数,与预设的故障度数阈值之间的差值;标准连接度数指不存在连接错误时交换机图中各个节点设备的连接度数。
示例性的,对于依据胖树拓扑结构创建的数据中心,若每个交换机设备上的端口数量为k,当不存在节点设备连接错误时,在去除服务器节点后的交换机图中,边缘交换机节点层中节点设备的标准连接度数是k/2,核心交换机节点层中节点设备的标准连接度数是k,规范度数阈值可以设置为3k/4。如果当前边缘交换机节点层中节点集合内的节点设备的连接度数小于3k/4且不等于k/2,则认为该节点集合属于故障边缘集合。如果当前核心交换机节点层中节点集合内的节点设备的连接度数大于3k/4且不等于k,则认为该节点集合属于故障核心集合。故障边缘集合与故障核心集合中的节点设备属于初步确定的候选故障节点设备,可以为数据中心的故障定位提供指导。
本实施例的技术方案通过首先对数据中心的物理图进行处理,将各个节点设备进行不同层次的分类,例如划分节点设备所属的节点层与所属的节点集合,同时依据数据中心的设计蓝图对各个节点设备进行参数标记,使得标记后的节点设备与设计蓝图中的节点角色一一对应,然后再次利用设计蓝图,基于标记后的节点设备创建中间蓝图,并确定与中间蓝图对应的中间矩阵图,以及与物理图对应的第一矩阵图,通过中间矩阵图与第一矩阵图中矩阵元素的比较确定出连接错误的故障节点设备以及故障节点设备的节点角色,解决了现有方法中故障确定比较耗时以及准确性较低的问题,提高了确定数据中心的节点连接故障的效率以及准确性。
实施例四
图6是本发明实施例四提供的数据中心的连接故障确定装置的结构示意图,本实施例可适用于依据数据中心的物理图确定数据中心中连接错误的故障节点的情况。该装置可以采用软件和/或硬件的方式实现,并可集成在电子设备上。
如图6所示,本实施例四提供的数据中心的连接故障确定装置可以包括服务器节点确定模块410、哈希值确定模块420、节点分类模块430、边缘与核心交换机节点层确定模块440、边缘与核心交换机节点层标记模块450、聚合交换机节点层确定及标记模块460、服务器节点标记模块470、中间矩阵图创建模块480和故障确定模块490,其中:
服务器节点确定模块410,用于将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去服务器节点之外的节点设备确定交换机图;
哈希值确定模块420,用于在交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值;
节点分类模块430,用于根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备,其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,至少一个孤立节点设备中各个节点设备对应的哈希值互不相同;
边缘与核心交换机节点层确定模块440,用于在至少一个节点集合中,将在物理图中与服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在物理图中与服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层;
边缘与核心交换机节点层标记模块450,用于按照数据中心的设计蓝图中节点角色的标记规则,对边缘交换机节点层和核心交换机节点层中的节点设备进行参数标记,其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与设计蓝图中对应角色层的节点角色一一对应;
聚合交换机节点层确定及标记模块460,用于将至少一个孤立节点设备划分为聚合交换机节点层,并根据设计蓝图中节点角色的标记规则,以及聚合交换机节点层中节点设备在物理图中与边缘交换机节点层和核心交换机节点层中的节点设备的连接关系,对聚合交换机节点层中的节点设备进行参数标记;
服务器节点标记模块470,用于根据设计蓝图中节点角色的标记规则,以及服务器节点在物理图中与边缘交换机节点层中节点设备的连接关系,对服务器节点进行参数标记;
中间矩阵图创建模块480,用于按照设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,其中,每个节点设备在中间矩阵图中的位置与在物理图中的位置相同;
故障确定模块490,用于确定物理图和中间矩阵图中的目标差异矩阵元素,并根据目标差异矩阵元素确定故障节点设备以及故障节点设备对应的节点角色。
可选的,哈希值确定模块420包括:
矩阵子图确定单元,用于在交换机图中,基于每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的矩阵子图;
数组确定单元,用于保持每个节点设备对应的矩阵子图中目标矩阵元素的位置顺序,得到对应于每个节点设备的由目标矩阵元素组成的数组,其中,目标矩阵元素是矩阵子图中除去节点设备占用的矩阵元素之外的剩余矩阵元素;
哈希值计算单元,用于将数组作为哈希函数的输入,得到每个节点设备对应的哈希值,其中,具有相同连接关系的节点设备对应相同的哈希值。
可选的,聚合交换机节点层确定及标记模块460包括:
聚合交换机节点层确定单元,用于在至少一个孤立节点设备中,将在物理图中同时与边缘交换机节点层和核心交换机节点层中的节点设备连接的节点设备划分为聚合交换机节点层;
聚合交换机节点层标记单元,用于依据聚合交换机节点层中节点设备在物理图中与边缘交换机节点层和核心交换机节点层中的节点设备的连接关系,使用边缘交换机节点层和核心交换机节点层中节点设备的标记参数对聚合交换机节点层中节点设备进行参数标记;
剩余孤立节点设备划分单元,用于将至少一个孤立节点设备中除去被划分为聚合交换机节点层之外的剩余节点设备,按照每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至目标候选节点设备所属节点集合中,其中,目标候选节点设备包括边缘交换机节点层或核心交换机节点层中的任一节点设备;
剩余孤立节点设备标记单元,使用每个剩余节点设备被划分的节点集合的标记参数,对每个剩余的节点设备进行参数标记;
可选的,该装置还包括:
不完整边缘集合确定单元,用于将边缘交换机节点层中包含的节点设备数量小于节点数量阈值的节点集合标记为不完整边缘集合;
不完整核心集合确定单元,用于将核心交换机节点层中包含的节点设备数量小于节点数量阈值的节点集合标记为不完整核心集合;
其中,节点数量阈值与用于构建设计蓝图的网络拓扑图相关;
相应的,剩余孤立节点设备划分单元中目标候选节点设备包括不完整边缘集合或不完整核心集合中的任一节点设备。
可选的,剩余孤立节点设备划分单元包括:
连接度数确定子单元,用于确定剩余节点设备中每个剩余节点设备的连接度数;
目标节点层确定子单元,用于根据每个剩余节点设备的连接度数与第二度数阈值的关系,确定每个剩余节点设备所属的目标节点层,其中,目标节点层包括边缘交换机节点层或核心交换机节点层,第二度数阈值与用于构建设计蓝图的网络拓扑图相关;
剩余节点设备划分子单元,用于在目标节点层中确定目标候选节点设备,按照每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至目标候选节点设备所属节点集合中。
可选的,剩余节点设备划分子单元具体用于:
按照每个剩余节点设备与其他节点设备的连接关系,确定每个剩余节点设备的剩余节点矩阵子图;
按照目标候选节点设备与其他节点设备的连接关系,确定目标候选节点设备的目标节点矩阵子图;
将剩余节点矩阵子图和目标节点矩阵子图中相同位置上的矩阵元素进行异或计算,确定两个矩阵子图中差异矩阵元素的数量;
根据差异矩阵元素的数量确定每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度;
若相似度大于相似阈值,则将每个剩余节点设备划分至目标候选节点设备所属节点集合中。
可选的,服务器节点标记模块470包括:
同组服务器节点标记单元,用于将与边缘交换机节点层的同一节点设备相连接的服务器节点,确定为同组服务器节点,并对确定的各个服务器节点组进行参数标记,其中,每个服务器节点组中的服务器节点使用相同的标记参数;
剩余服务器节点标记单元,用于针对与边缘交换机节点层的节点设备不相连接的剩余服务器节点,建立剩余服务器节点与边缘交换机节点层中任意节点设备的虚拟连接关系,并对剩余服务器节点进行参数标记。
可选的,该装置还包括:
边缘交换机节点层二次标记模块,用于使用每个服务器节点的标记参数,对与每个服务器节点连接的边缘交换机节点层的节点设备进行第二次参数标记,其中,与每个服务器节点的连接关系包括建立的虚拟连接关系。
可选的,该装置还包括:
故障边缘集合确定模块,用于将边缘交换机节点层中连接度数处于第一度数范围的节点设备所属的节点集合标记为故障边缘集合,其中,第一度数范围指小于规范度数阈值,且不等于边缘交换机节点层中节点设备的标准连接度数;
故障核心集合确定模块,用于将核心交换机节点层中连接度数处于第二度数范围的节点设备所属的节点集合标记为故障核心集合,其中,第二度数范围指大于规范度数阈值,且不等于核心交换机节点层中节点设备的标准连接度数;
候选故障节点设备确定模块,用于将故障边缘集合和故障核心集合中的节点设备作为候选故障节点设备;
其中,规范度数阈值与用于构建设计蓝图的网络拓扑图相关。
可选的,中间矩阵图创建模块480包括:
中间蓝图创建单元,用于按照设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备对应的节点角色创建中间蓝图;
中间矩阵图创建单元,用于将参数标记后的各个节点设备进行编号表示,并基于该编号和中间蓝图,确定与中间蓝图对应的中间矩阵图;
相应的,故障确定模块490包括:
第一矩阵图确定单元,用于对物理图中的每个节点设备,采用与每个节点设备在中间矩阵图中相同的编号进行表示,并基于该编号和物理图,确定与物理图对应的第一矩阵图;
异或计算单元,用于对第一矩阵图和中间矩阵图中相同位置上的矩阵元素进行异或计算,确定目标差异矩阵元素;
故障确定单元,用于基于物理图确定目标差异矩阵元素对应的故障节点设备,并基于中间蓝图确定目标差异矩阵元素对应的故障节点角色。
可选的,该装置还包括:
修正模块,用于依据中间矩阵图对物理图中故障节点设备的连接关系进行修正。
可选的,数据中心的设计蓝图基于具有层次化结构特点的网络拓扑图实现。
可选的,网络拓扑图包括胖树拓扑结构图。
本发明实施例所提供的数据中心的连接故障确定装置可执行本发明任意实施例所提供的数据中心的连接故障确定方法,具备执行方法相应的功能模块和有益效果。本实施例中未详尽描述的内容可以参考本发明方法实施例中的内容描述。
实施例五
图7是本发明实施例五提供的一种电子设备的结构示意图。图7示出了适于用来实现本发明实施方式的示例性电子设备512的框图。图7显示的电子设备512仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,电子设备512以通用电子设备的形式表现。电子设备512的组件可以包括但不限于:一个或者多个处理器516,存储装置528,连接不同系统组件(包括存储装置528和处理器516)的总线518。
总线518表示几类总线结构中的一种或多种,包括存储装置总线或者存储装置控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry SubversiveAlliance,ISA)总线,微通道体系结构(Micro Channel Architecture,MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
电子设备512典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备512访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置528可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)530和/或高速缓存存储器532。电子设备512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统534可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘,例如只读光盘(Compact Disc Read-Only Memory,CD-ROM),数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储装置528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块542的程序/实用工具540,可以存储在例如存储装置528中,这样的程序模块542包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本发明所描述的实施例中的功能和/或方法。
电子设备512也可以与一个或多个外部设备514(例如键盘、指向终端、显示器524等)通信,还可与一个或者多个使得用户能与该电子设备512交互的终端通信,和/或与使得该电子设备512能与一个或多个其它计算终端进行通信的任何终端(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口522进行。并且,电子设备512还可以通过网络适配器520与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网(Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图7所示,网络适配器520通过总线518与电子设备512的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备512使用其它硬件和/或软件模块,包括但不限于:微代码、终端驱动器、冗余处理器、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器516通过运行存储在存储装置528中的程序,从而执行各种功能应用以及数据处理,例如实现本发明任意实施例所提供的数据中心的连接故障确定方法,该方法可以包括:
将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去服务器节点之外的节点设备确定交换机图;
在交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值;
根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备,其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,至少一个孤立节点设备中各个节点设备对应的哈希值互不相同;
在至少一个节点集合中,将在物理图中与服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在物理图中与服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层;
按照数据中心的设计蓝图中节点角色的标记规则,对边缘交换机节点层和核心交换机节点层中的节点设备进行参数标记,其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与设计蓝图中对应角色层的节点角色一一对应;
将至少一个孤立节点设备划分为聚合交换机节点层,并根据设计蓝图中节点角色的标记规则,以及聚合交换机节点层中节点设备在物理图中与边缘交换机节点层和核心交换机节点层中的节点设备的连接关系,对聚合交换机节点层中的节点设备进行参数标记;
根据设计蓝图中节点角色的标记规则,以及服务器节点在物理图中与边缘交换机节点层中节点设备的连接关系,对服务器节点进行参数标记;
按照设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,其中,每个节点设备在中间矩阵图中的位置与在物理图中的位置相同;
确定物理图和中间矩阵图中的目标差异矩阵元素,并根据目标差异矩阵元素确定故障节点设备以及故障节点设备对应的节点角色。
实施例六
本发明实施例六还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的数据中心的连接故障确定方法,该方法可以包括:
将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去服务器节点之外的节点设备确定交换机图;
在交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值;
根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备,其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,至少一个孤立节点设备中各个节点设备对应的哈希值互不相同;
在至少一个节点集合中,将在物理图中与服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在物理图中与服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层;
按照数据中心的设计蓝图中节点角色的标记规则,对边缘交换机节点层和核心交换机节点层中的节点设备进行参数标记,其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与设计蓝图中对应角色层的节点角色一一对应;
将至少一个孤立节点设备划分为聚合交换机节点层,并根据设计蓝图中节点角色的标记规则,以及聚合交换机节点层中节点设备在物理图中与边缘交换机节点层和核心交换机节点层中的节点设备的连接关系,对聚合交换机节点层中的节点设备进行参数标记;
根据设计蓝图中节点角色的标记规则,以及服务器节点在物理图中与边缘交换机节点层中节点设备的连接关系,对服务器节点进行参数标记;
按照设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,其中,每个节点设备在中间矩阵图中的位置与在物理图中的位置相同;
确定物理图和中间矩阵图中的目标差异矩阵元素,并根据目标差异矩阵元素确定故障节点设备以及故障节点设备对应的节点角色。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (16)

1.一种数据中心的连接故障确定方法,其特征在于,包括:
将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去所述服务器节点之外的节点设备确定交换机图;
在所述交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值;
根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备,其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,所述至少一个孤立节点设备中各个节点设备对应的哈希值互不相同;
在所述至少一个节点集合中,将在所述物理图中与所述服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在所述物理图中与所述服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层;
按照所述数据中心的设计蓝图中节点角色的标记规则,对所述边缘交换机节点层和所述核心交换机节点层中的节点设备进行参数标记,其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与所述设计蓝图中对应角色层的节点角色一一对应;
将所述至少一个孤立节点设备划分为聚合交换机节点层,并根据所述设计蓝图中节点角色的标记规则,以及所述聚合交换机节点层中节点设备在所述物理图中与所述边缘交换机节点层和所述核心交换机节点层中的节点设备的连接关系,对所述聚合交换机节点层中的节点设备进行参数标记;
根据所述设计蓝图中节点角色的标记规则,以及所述服务器节点在所述物理图中与所述边缘交换机节点层中节点设备的连接关系,对所述服务器节点进行参数标记;
按照所述设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,其中,每个节点设备在所述中间矩阵图中的位置与在所述物理图中的位置相同;
确定所述物理图和所述中间矩阵图中的目标差异矩阵元素,并根据所述目标差异矩阵元素确定故障节点设备以及所述故障节点设备对应的节点角色。
2.根据权利要求1所述的方法,其特征在于,在所述交换机图中,基于每个节点设备与其他节点设备的连接关系,得到每个节点设备对应的哈希值,包括:
在所述交换机图中,基于每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的矩阵子图;
保持每个节点设备对应的矩阵子图中目标矩阵元素的位置顺序,得到对应于每个节点设备的由所述目标矩阵元素组成的数组,其中,所述目标矩阵元素是所述矩阵子图中除去节点设备占用的矩阵元素之外的剩余矩阵元素;
将所述数组作为哈希函数的输入,得到每个节点设备对应的哈希值,其中,具有相同连接关系的节点设备对应相同的哈希值。
3.根据权利要求1所述的方法,其特征在于,将所述至少一个孤立节点设备划分为聚合交换机节点层,并根据所述设计蓝图中节点角色的标记规则,以及所述聚合交换机节点层中节点设备在所述物理图中与所述边缘交换机节点层和所述核心交换机节点层中的节点设备的连接关系,对所述聚合交换机节点层中的节点设备进行参数标记,包括:
在所述至少一个孤立节点设备中,将在所述物理图中同时与所述边缘交换机节点层和所述核心交换机节点层中的节点设备连接的节点设备划分为聚合交换机节点层;
依据所述聚合交换机节点层中节点设备在所述物理图中与所述边缘交换机节点层和所述核心交换机节点层中的节点设备的连接关系,使用所述边缘交换机节点层和所述核心交换机节点层中节点设备的标记参数对所述聚合交换机节点层中节点设备进行参数标记;
将所述至少一个孤立节点设备中除去被划分为聚合交换机节点层之外的剩余节点设备,按照每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至所述目标候选节点设备所属节点集合中,其中,所述目标候选节点设备包括所述边缘交换机节点层或所述核心交换机节点层中的任一节点设备;
使用每个剩余节点设备被划分的节点集合的标记参数,对每个剩余的节点设备进行参数标记。
4.根据权利要求3所述的方法,其特征在于,在确定所述边缘交换机节点层和所述核心交换机节点层中分别包括的节点集合后,所述方法还包括:
将所述边缘交换机节点层中包含的节点设备数量小于节点数量阈值的节点集合标记为不完整边缘集合;
将所述核心交换机节点层中包含的节点设备数量小于所述节点数量阈值的节点集合标记为不完整核心集合;
其中,所述节点数量阈值与用于构建所述设计蓝图的网络拓扑图相关;
相应的,所述目标候选节点设备包括所述不完整边缘集合或所述不完整核心集合中的任一节点设备。
5.根据权利要求3或4所述的方法,其特征在于,将所述至少一个孤立节点设备中除去被划分为聚合交换机节点层之外的剩余节点设备,按照每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至所述目标候选节点设备所属节点集合中,包括:
确定所述剩余节点设备中每个剩余节点设备的连接度数;
根据所述每个剩余节点设备的连接度数与第二度数阈值的关系,确定每个剩余节点设备所属的目标节点层,其中,所述目标节点层包括所述边缘交换机节点层或所述核心交换机节点层,所述第二度数阈值与用于构建所述设计蓝图的网络拓扑图相关;
在所述目标节点层中确定所述目标候选节点设备,按照每个剩余节点设备和所述目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至所述目标候选节点设备所属节点集合中。
6.根据权利要求5所述的方法,其特征在于,所述按照每个剩余节点设备和目标候选节点设备分别与其他节点设备的连接关系之间的相似度,将每个剩余节点设备划分至所述目标候选节点设备所属节点集合中,包括:
按照每个剩余节点设备与其他节点设备的连接关系,确定每个剩余节点设备的剩余节点矩阵子图;
按照目标候选节点设备与其他节点设备的连接关系,确定所述目标候选节点设备的目标节点矩阵子图;
将所述剩余节点矩阵子图和所述目标节点矩阵子图中相同位置上的矩阵元素进行异或计算,确定两个矩阵子图中差异矩阵元素的数量;
根据所述差异矩阵元素的数量确定每个剩余节点设备和所述目标候选节点设备分别与其他节点设备的连接关系之间的相似度;
若所述相似度大于相似阈值,则将每个剩余节点设备划分至所述目标候选节点设备所属节点集合中。
7.根据权利要求1所述的方法,其特征在于,根据所述设计蓝图中节点角色的标记规则,以及所述服务器节点在所述物理图中与所述边缘交换机节点层中节点设备的连接关系,对所述服务器节点进行参数标记,包括:
将与所述边缘交换机节点层的同一节点设备相连接的服务器节点,确定为同组服务器节点,并对确定的各个服务器节点组进行参数标记,其中,每个服务器节点组中的服务器节点使用相同的标记参数;
针对与所述边缘交换机节点层的节点设备不相连接的剩余服务器节点,建立所述剩余服务器节点与所述边缘交换机节点层中任意节点设备的虚拟连接关系,并对所述剩余服务器节点进行参数标记。
8.根据权利要求1或7所述的方法,其特征在于,在对所述服务器节点进行参数标记后,所述方法还包括:
使用每个服务器节点的标记参数,对与每个服务器节点连接的所述边缘交换机节点层的节点设备进行第二次参数标记,其中,与每个服务器节点的连接关系包括所述建立的虚拟连接关系。
9.根据权利要求1所述的方法,其特征在于,在确定所述边缘交换机节点层和所述核心交换机节点层中分别包括的节点集合后,所述方法还包括:
将所述边缘交换机节点层中连接度数处于第一度数范围的节点设备所属的节点集合标记为故障边缘集合,其中,所述第一度数范围指小于规范度数阈值,且不等于所述边缘交换机节点层中节点设备的标准连接度数;
将所述核心交换机节点层中连接度数处于第二度数范围的节点设备所属的节点集合标记为故障核心集合,其中,所述第二度数范围指大于所述规范度数阈值,且不等于所述核心交换机节点层中节点设备的标准连接度数;
将所述故障边缘集合和所述故障核心集合中的节点设备作为候选故障节点设备;
其中,所述规范度数阈值与用于构建所述设计蓝图的网络拓扑图相关。
10.根据权利要求1所述的方法,其特征在于,按照所述设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,包括:
按照所述设计蓝图中各个节点角色之间的连接关系,基于所述参数标记后的各个节点设备对应的节点角色创建中间蓝图;
将所述参数标记后的各个节点设备进行编号表示,并基于该编号和所述中间蓝图,确定与所述中间蓝图对应的中间矩阵图;
相应的,确定所述物理图和所述中间矩阵图中的目标差异矩阵元素,并根据所述目标差异矩阵元素确定故障节点设备以及所述故障节点设备对应的节点角色,包括:
对所述物理图中的每个节点设备,采用与每个节点设备在所述中间矩阵图中相同的编号进行表示,并基于该编号和所述物理图,确定与所述物理图对应的第一矩阵图;
对所述第一矩阵图和所述中间矩阵图中相同位置上的矩阵元素进行异或计算,确定所述目标差异矩阵元素;
基于所述物理图确定所述目标差异矩阵元素对应的故障节点设备,并基于所述中间蓝图确定所述目标差异矩阵元素对应的故障节点角色。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
依据所述中间矩阵图对所述物理图中故障节点设备的连接关系进行修正。
12.根据权利要求1所述的方法,其特征在于,所述数据中心的设计蓝图基于具有层次化结构特点的网络拓扑图实现。
13.根据权利要求12所述的方法,其特征在于,所述网络拓扑图包括胖树拓扑结构图。
14.一种数据中心的连接故障确定装置,其特征在于,包括:
服务器节点确定模块,用于将数据中心的物理图中连接度数小于第一度数阈值的节点设备确定为服务器节点,并基于除去所述服务器节点之外的节点设备确定交换机图;
哈希值确定模块,用于在所述交换机图中,根据每个节点设备与其他节点设备的连接关系,确定每个节点设备对应的哈希值;
节点分类模块,用于根据每个节点设备对应的哈希值,得到至少一个节点集合和至少一个孤立节点设备,其中,每个节点集合中节点设备的哈希值相同,每个节点集合中至少包括两个节点设备,所述至少一个孤立节点设备中各个节点设备对应的哈希值互不相同;
边缘与核心交换机节点层确定模块,用于在所述至少一个节点集合中,将在所述物理图中与所述服务器节点连接的节点设备所属的节点集合划分为边缘交换机节点层,并将在所述物理图中与所述服务器节点不连接的节点设备所属的节点集合划分为核心交换机节点层;
边缘与核心交换机节点层标记模块,用于按照所述数据中心的设计蓝图中节点角色的标记规则,对所述边缘交换机节点层和所述核心交换机节点层中的节点设备进行参数标记,其中,每个节点集合中节点设备的标记参数相同,参数标记后的各个节点层中节点设备与所述设计蓝图中对应角色层的节点角色一一对应;
聚合交换机节点层确定及标记模块,用于将所述至少一个孤立节点设备划分为聚合交换机节点层,并根据所述设计蓝图中节点角色的标记规则,以及所述聚合交换机节点层中节点设备在所述物理图中与所述边缘交换机节点层和所述核心交换机节点层中的节点设备的连接关系,对所述聚合交换机节点层中的节点设备进行参数标记;
服务器节点标记模块,用于根据所述设计蓝图中节点角色的标记规则,以及所述服务器节点在所述物理图中与所述边缘交换机节点层中节点设备的连接关系,对所述服务器节点进行参数标记;
中间矩阵图创建模块,用于按照所述设计蓝图中各个节点角色之间的连接关系,基于参数标记后的各个节点设备创建中间矩阵图,其中,每个节点设备在所述中间矩阵图中的位置与在所述物理图中的位置相同;
故障确定模块,用于确定所述物理图和所述中间矩阵图中的目标差异矩阵元素,并根据所述目标差异矩阵元素确定故障节点设备以及所述故障节点设备对应的节点角色。
15.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-13中任一所述的数据中心的连接故障确定方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-13中任一所述的数据中心的连接故障确定方法。
CN201910110012.2A 2019-02-11 2019-02-11 数据中心的连接故障确定方法、装置、电子设备和介质 Active CN109861863B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910110012.2A CN109861863B (zh) 2019-02-11 2019-02-11 数据中心的连接故障确定方法、装置、电子设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910110012.2A CN109861863B (zh) 2019-02-11 2019-02-11 数据中心的连接故障确定方法、装置、电子设备和介质

Publications (2)

Publication Number Publication Date
CN109861863A true CN109861863A (zh) 2019-06-07
CN109861863B CN109861863B (zh) 2022-02-25

Family

ID=66897699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910110012.2A Active CN109861863B (zh) 2019-02-11 2019-02-11 数据中心的连接故障确定方法、装置、电子设备和介质

Country Status (1)

Country Link
CN (1) CN109861863B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111343014A (zh) * 2020-02-17 2020-06-26 上海科技大学 一种基于组合设计的数据中心网络拓扑设计方法
CN111343012A (zh) * 2020-02-17 2020-06-26 平安科技(深圳)有限公司 云平台的缓存服务器部署方法、装置和计算机设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101369918A (zh) * 2008-09-25 2009-02-18 浙江工业大学 网络管理浏览器
CN102546852A (zh) * 2011-12-13 2012-07-04 西安交通大学 可容错数据中心网络的地址自动配置方法
US20140344438A1 (en) * 2010-12-14 2014-11-20 Microsoft Corporation Generic and automatic address configuration for data center networks
CN104579788A (zh) * 2015-01-21 2015-04-29 上海交通大学 一种分布式动态路由网络的错误定位方法
CN106130761A (zh) * 2016-06-22 2016-11-16 北京百度网讯科技有限公司 数据中心的故障网络设备的识别方法和装置
CN107482766A (zh) * 2017-07-05 2017-12-15 国网江苏省电力公司经济技术研究院 基于数据网络和电力网络互动运行的电力系统调度方法
CN109040212A (zh) * 2018-07-24 2018-12-18 苏州科达科技股份有限公司 设备接入服务器集群方法、系统、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101369918A (zh) * 2008-09-25 2009-02-18 浙江工业大学 网络管理浏览器
US20140344438A1 (en) * 2010-12-14 2014-11-20 Microsoft Corporation Generic and automatic address configuration for data center networks
CN102546852A (zh) * 2011-12-13 2012-07-04 西安交通大学 可容错数据中心网络的地址自动配置方法
CN104579788A (zh) * 2015-01-21 2015-04-29 上海交通大学 一种分布式动态路由网络的错误定位方法
CN106130761A (zh) * 2016-06-22 2016-11-16 北京百度网讯科技有限公司 数据中心的故障网络设备的识别方法和装置
CN107482766A (zh) * 2017-07-05 2017-12-15 国网江苏省电力公司经济技术研究院 基于数据网络和电力网络互动运行的电力系统调度方法
CN109040212A (zh) * 2018-07-24 2018-12-18 苏州科达科技股份有限公司 设备接入服务器集群方法、系统、设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111343014A (zh) * 2020-02-17 2020-06-26 上海科技大学 一种基于组合设计的数据中心网络拓扑设计方法
CN111343012A (zh) * 2020-02-17 2020-06-26 平安科技(深圳)有限公司 云平台的缓存服务器部署方法、装置和计算机设备
CN111343012B (zh) * 2020-02-17 2022-08-02 平安科技(深圳)有限公司 云平台的缓存服务器部署方法、装置和计算机设备
CN111343014B (zh) * 2020-02-17 2022-12-02 上海科技大学 一种基于组合设计的数据中心网络拓扑设计方法

Also Published As

Publication number Publication date
CN109861863B (zh) 2022-02-25

Similar Documents

Publication Publication Date Title
CN106547678B (zh) 用于白盒测试的方法和装置
Jun et al. Valve-controlled segments in water distribution systems
CN105446793A (zh) 迁移虚拟资产的方法和设备
CN110750654A (zh) 知识图谱获取方法、装置、设备和介质
US7712059B1 (en) Coverage metric and coverage computation for verification based on design partitions
US10423751B2 (en) Semiconductor package floating metal checks
CN107506484B (zh) 运维数据关联审计方法、系统、设备及存储介质
US10628465B2 (en) Generating a ranked list of best fitting place names
US8990058B2 (en) Generating and evaluating expert networks
CN109861863A (zh) 数据中心的连接故障确定方法、装置、电子设备和介质
US10606975B2 (en) Coordinates-based generative adversarial networks for generating synthetic physical design layout patterns
CN109492066A (zh) 一种兴趣点分支名称的确定方法、装置、设备及存储介质
CN109818796B (zh) 数据中心构建方法、装置、电子设备和介质
US10956649B2 (en) Semiconductor package metal shadowing checks
CN109688758A (zh) 用于确定数据中心故障的方法、装置、电子设备和介质
WO2020057432A1 (zh) 地址的标准化方法、装置、存储介质及计算机终端
CN108256020A (zh) 异常路线的检测方法、装置、服务器及存储介质
US11409928B2 (en) Configurable digital twin
US10546096B2 (en) Semiconductor package via stack checking
CN104899908A (zh) 生成事件组演化图的方法和装置
CN109756381A (zh) 数据中心故障定位方法、装置、电子设备和介质
Czabarka et al. A tanglegram Kuratowski theorem
CN103514224A (zh) 数据库中的数据处理方法、数据查询方法和相应装置
CN110287338A (zh) 行业热点确定方法、装置、设备和介质
CN107430533B (zh) 一种数据校验方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant