CN108833168B - 一种服务器集群环境网络系统及稳定性检测方法 - Google Patents

一种服务器集群环境网络系统及稳定性检测方法 Download PDF

Info

Publication number
CN108833168B
CN108833168B CN201810638941.6A CN201810638941A CN108833168B CN 108833168 B CN108833168 B CN 108833168B CN 201810638941 A CN201810638941 A CN 201810638941A CN 108833168 B CN108833168 B CN 108833168B
Authority
CN
China
Prior art keywords
server
test
network
cluster
tested
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810638941.6A
Other languages
English (en)
Other versions
CN108833168A (zh
Inventor
刘云飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810638941.6A priority Critical patent/CN108833168B/zh
Publication of CN108833168A publication Critical patent/CN108833168A/zh
Application granted granted Critical
Publication of CN108833168B publication Critical patent/CN108833168B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/45Network directories; Name-to-address mapping
    • H04L61/4505Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols
    • H04L61/4511Network directories; Name-to-address mapping using standardised directories; using standardised directory access protocols using domain name system [DNS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • H04L61/5007Internet protocol [IP] addresses
    • H04L61/5014Internet protocol [IP] addresses using dynamic host configuration protocol [DHCP] or bootstrap protocol [BOOTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

本发明提供一种服务器集群环境网络系统及稳定性检测方法,包括OS灌装服务器,用于灌装测试需要的操作系统及系统参数配置;DNS服务器,用于域名解析;DHCP服务器,用于地址分配,并将IP地址与MAC地址表发给控制/分析服务器,待测集群首次接入时将重定向到OS灌装服务器进行系统安装;控制/分析服务器,用于测试环境搭建,控制测试程序运行,收集测试结果,并将结果存储到存储服务器中进行保存,结果分析给出测试结果及建议;存储服务器,用于存储测试数据及测试log;检测步骤包括:配置网络系统环境;进行网络系统稳定性测试,其中包括网络压力测试、干扰测试和性能测试;处理和分析测试数据及log。

Description

一种服务器集群环境网络系统及稳定性检测方法
技术领域
本发明涉及服务器技术领域,具体涉及一种服务器集群环境网络系统及稳定性检测方法。
背景技术
随着时代的发展,每天产生的数据量非常的庞大,为了处理这些庞大的数据信息,真对单台服务器的处理能力的需求也在不断提高;单纯提高单台服务器的处理能力,造成单体机器的成本不断攀升,性价比在不断下降;最好的解决方法便是降低单台机器的成本,即降低单台服务器的处理能力,通过增加机器搭建集群来处理数据,通过这种方式可以灵活的扩充处理能力,同时降低单一节点出现问题所带来的各种风险。
要想搭建集群,就需要有互联的方式,通过不同种类的交换机将不同速率的网口互联起来,组成一个整体,让各个单一服务器不在单一,协同作业;要想这个整体工作稳定,网络的稳定性至关重要,需要有方法来检验网络的稳定性,确保整个环境能够稳定、持续的提供服务。
Iperf 是一个网络压力/性能测试工具。Iperf可以测试最大TCP和UDP带宽性能,具有多种参数和UDP特性,可以根据需要调整,可以报告带宽、延迟抖动和数据包丢失。可以适应不同的网络接口及网络速率,灵活易用;通过它我们可以模拟满负荷网络压力及爆发式的网络压力;
Netperf是一种网络性能的测量工具,主要针对基于TCP或UDP的传输。Netperf根据应用的不同,可以进行不同模式的网络性能测试,即批量数据传输(bulk datatransfer)模式和请求/应答(request/reponse)模式。Netperf测试结果所反映的是一个系统能够以多快的速度向另外一个系统发送数据,以及另外一个系统能够以多快的速度接收数据。
Kubernetes是一个在集群主机间进行自动化部署、扩展和容器操作的提供以容器为中心基础设施的开源平台。
locust是一个使用简单的分布式负载测试工具。其目的是用于测试web或者其他系统,并确定系统能够处理多少并发用户数。
发明内容
为了克服上述现有技术中的不足,本发明提供一种服务器集群环境网络稳定性检测系统及方法,以解决上述技术问题。
本发明的技术方案:
一种服务器集群环境网络系统,包括OS灌装服务器、DNS服务器、DHCP服务器、控制/分析服务器和存储服务器;
OS灌装服务器,用于灌装测试需要的操作系统及系统参数配置;
DNS服务器,用于域名解析;
DHCP服务器,用于地址分配,并将IP地址与MAC地址表发给控制/分析服务器,待测集群首次接入时将重定向到OS灌装服务器进行系统安装;
控制/分析服务器,用于测试环境搭建,控制测试程序运行,收集测试结果,并将结果存储到存储服务器中进行保存,结果分析给出测试结果及建议;
存储服务器,用于存储测试数据及测试log;
OS灌装服务器、DNS服务器、DHCP服务器、控制/分析服务器和存储服务器通过测试网络连接有待测集群,控制/分析服务器通过管理网络与待测集群连接,控制/分析服务器通过交换机与用户终端连接。
进一步的,将待测集群中的待测机连接到网络系统中,不同速率的网口通过相应速率的线缆连接到对应的交换机接口上;被测机的管理口通过网线连接到管理网络中。
本发明技术方案还提供一种服务器集群环境网络系统稳定性检测方法,包括如下步骤:
配置网络系统环境;
进行网络系统稳定性测试,其中包括网络压力测试、干扰测试和性能测试;
处理和分析测试数据及log。
进一步的,步骤配置网络系统环境,包括:
S11:被测机安装操作系统;
S12:检测待测机是否安装成功;若否,执行步骤S11,若是,执行步骤S13;
S13:配置网络系统的参数,其中包括启动所有网口;
S14:上报IP地址/网口/MAC地址信息到控制/分析服务器;
S15:检测上报信息完整性,若上报信息完整执行步骤S16,若上报信息不完整,执行步骤S13;
S16:汇总所有信息,形成被测机信息统计表,并检测被测信息的完整性,若被测信息完整,结束网络配置过程并启动第一项测试;若被测信息不完整,执行步骤S13。
进一步的,网络压力测试的过程包括:
S21:根据集群服务器及网口数量建立测试互联树;
S22:测试所有互联树是否能正常访问,若是,执行步骤S24; 若否,执行步骤S23;
S23:修复网络问题,并收集网络修复过程的log,修复完成执行步骤S22;
S24:启动压力测试;收集实时测试数据,测试完成启动第二项测试。
进一步的,干扰测试的过程包括:
S31:启动网络压力测试;
S32:逐一断开压力测试过程中的服务器的网口连接;
S33:恢复断开网口的连接以及恢复压力测试过程,并检测能否完成恢复;若能完成恢复执行步骤S34;
S34:检测是否所有网口都被遍历到,若是,执行步骤S35,若否,执行步骤S32;
S35:逐一重启服务器;
S36:恢复重启服务器及服务器上网口连接;若可以完成恢复,并重新启动对应的压力测试;
S37:检测所有服务器是否都被遍历到,若是,结束干扰测试并启动第三项测试;若否,执行步骤S35。
进一步的,步骤S33中恢复断开网口的连接以及恢复压力测试过程,若不能完成恢复执行步骤S310;
S310:修复存在的问题,若修复成功,收集各服务器及各网口的数据,执行步骤S34;若修复失败,收集修复过程的数据,终止测试;或者执行步骤S311;
S311:记录问题及问题网口信息,并将此网口从互联树中删除,重新建立互联树,执行步骤S31。
进一步的,步骤S36中恢复重启服务器及服务器上网口连接;若不能完成恢复,执行步骤S38:
S38:修复存在的问题,若修复成功,收集各服务器及各网口的数据,执行步骤S37;若修复失败,收集修复过程的数据,终止测试;或者执行步骤S39;
S39:记录修复失败出现的问题及问题服务器的信息,并将此服务器及服务器上的网口从互联树中删除,重新建立互联树,执行步骤S35。
进一步的,干扰测试的过程实时收集各服务器及各网口数据。
进一步的,性能测试过程包括:
S41:创建网口性能测试遍历表;
S42:逐一测试各网口间的性能,实时收集各服务器及各网口的数据;
S43:检测所有网口是否都被遍历,若是执行步骤S44,若否,执行步骤S42;
S44:针对不同的网络分别建立集群,进行集群性能测试,并通过实时收集各服务器及各网口数据。
本方法利用Linux系统及开源工具,通过开源工具Iperf模拟网络压力,通过开源工具Netperf模拟性能测试,通过Kubernetes+Locust模拟集群网络延迟测试,通过远程管理控制台控制网口及机器开关状态模拟意外状态,检测整个集群的网络稳定性。
从以上技术方案可以看出,本发明具有以下优点:利用开源系统及工具,搭建低成本自动化检测环境,通过网络压力测试、干扰测试、性能测试三个模块,检验集群环境中的网络稳定性;每项测试都会记录测试结果,并在所有测试结束后,进行数据分析并给出综合评价及建议;整个测试环境简单,测试执行自动完成,可以自动判断集群规模进行参数配置,充分利用集群环境资源。使用开源的工具及系统,并且环境配置简单,整体投入少;全自动化执行,只有在出现故障时才会需要人工干预;可以根据集群规模自动设置匹配的测试内容;测试完成可以给出合理的建议,提前了解瓶颈。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。
附图说明
图1为一种服务器集群环境网络系统拓扑结构图;
图2为一种服务器集群环境网络系统稳定性检测方法流程图;
图3为网络系统环境配置子流程图;
图4为网络压力测试子流程图;
图5为干扰测试子流程图;
图6为性能测试子流程图。
具体实施方式
下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
如图1所示,本发明实施例提供一种服务器集群环境网络系统,包括OS灌装服务器1、DNS服务器2、DHCP服务器3、控制/分析服务器4和存储服务器5;
OS灌装服务器1,用于灌装测试需要的操作系统及系统参数配置;
DNS服务器2,用于域名解析;
DHCP服务器3,用于地址分配,并将IP地址与MAC地址表发给控制/分析服务器4,待测集群首次接入时将重定向到OS灌装服务器1进行系统安装;
控制/分析服务器4,用于测试环境搭建,控制测试程序运行,收集测试结果,并将结果存储到存储服务器5中进行保存,结果分析给出测试结果及建议;
存储服务器5,用于存储测试数据及测试log;
OS灌装服务器1、DNS服务器2、DHCP服务器3、控制/分析服务器4和存储服务器5通过测试网络7连接有待测集群9,控制/分析服务器4通过管理网络8与待测集群9连接,控制/分析服务器4通过交换机6与用户终端连接。
将待测集群9中的待测机连接到网络系统中,不同速率的网口通过相应速率的线缆连接到对应的交换机接口上;被测机的管理口通过网线连接到管理网络8中。
实施例二
本发明还提供一种服务器集群环境网络系统稳定性检测方法,整个环境需要一台OS灌装服务器1,用于灌装测试需要的操作系统及系统参数配置;一台DNS服务器2,用于域名解析;一台DHCP服务器3,用于地址分配,并将IP地址与MAC地址表发给控制/分析服务器4,待测集群9首次接入时将重定向到OS灌装服务器1进行系统安装;一台控制/分析服务器4,用于测试环境搭建,控制测试程序运行,收集测试结果,并将结果存储到存储服务器5中进行保存,结果分析给出测试结果及建议;一台存储服务器5,用于存储测试数据及测试log;
网络环境分为2部分,一部分是测试网络7,可以根据实际集群情况进行搭建(如果是10G网络环境,需要用10G交换机搭建环境;如果是25G网络环境,需要用25G交换机搭建环境;如果是10G+25G的混合网络,需要分别搭建10G、25G网络环境,并将服务器上相应速率的网口连接到对应的网络环境中),测试环境可以自动检测相应的环境,配置相关测试参数,进行匹配的测试;另一部分是管理网络8,用于控制集群服务器的状态,例如开机、关机、重启等;
将需要测试的服务器连接到网络环境中,不同速率的网口通过相应速率的线缆连接到对应的交换机接口上(需要测试的口连接到网络环境中);被测服务器的管理口,通过网线连接到管理网络中;待测集群9中的服务器数量没有限制,测试环境会根据检测到的服务器数量设置测试规模;需要根据服务器接口的数量,配置足够的交换机,并将交换机互联起来。
如图2所示,服务器集群环境网络系统稳定性检测方法,包括如下步骤:
S1:配置网络系统环境;
S2:进行网络系统稳定性测试,其中包括网络压力测试、干扰测试和性能测试;
S3:处理和分析测试数据及log。
如图3所示,步骤S1,包括:
S11:被测机安装操作系统;
S12:检测待测机是否安装成功;若否,执行步骤S11,若是,执行步骤S13;
S13:配置网络系统的参数,其中包括启动所有网口;
S14:上报IP地址/网口/MAC地址信息到控制/分析服务器;
S15:检测上报信息完整性,若上报信息完整执行步骤S16,若上报信息不完整,执行步骤S13;
S16:汇总所有信息,形成被测机信息统计表,并检测被测信息的完整性,若被测信息完整,结束网络配置过程并启动第一项测试;若被测信息不完整,执行步骤S13。
如图4所示,本实施例中,网络压力测试的过程包括:
S21:根据集群服务器及网口数量建立测试互联树;
S22:测试所有互联树是否能正常访问,若是,执行步骤S24; 若否,执行步骤S23;
S23:修复网络问题,并收集网络修复过程的log,修复完成执行步骤S22;
S24:启动压力测试;收集实时测试数据,测试完成启动第二项测试。
通过压力测试结果及log,可以判断网络在长时间压力下是否有报错等异常现象,同时可以反馈网络的波动情况、丢包情况、CPU/内存的占用率等;如果CPU/内存占用率比较高,会导致丢包或者网络延迟变大,也会导致网络的剧烈波动;通过这些现象可以给出配置上的建议。
如图5所示,本实施例中,干扰测试的过程包括:
S31:启动网络压力测试;
S32:逐一断开压力测试过程中的服务器的网口连接;
S33:恢复断开网口的连接以及恢复压力测试过程,并检测能否完成恢复;若能完成恢复执行步骤S34;
S34:检测是否所有网口都被遍历到,若是,执行步骤S35,若否,执行步骤S32;
S35:逐一重启服务器;
S36:恢复重启服务器及服务器上网口连接;若可以完成恢复,并重新启动对应的压力测试;
S37:检测所有服务器是否都被遍历到,若是,结束干扰测试并启动第三项测试;若否,执行步骤S35。
本实施例中,步骤S33中恢复断开网口的连接以及恢复压力测试过程,若不能完成恢复执行步骤S310;
S310:修复存在的问题,若修复成功,收集各服务器及各网口的数据,执行步骤S34;若修复失败,收集修复过程的数据,终止测试;或者执行步骤S311;
S311:记录问题及问题网口信息,并将此网口从互联树中删除,重新建立互联树,执行步骤S31。
本实施例中,步骤S36中恢复重启服务器及服务器上网口连接;若不能完成恢复,执行步骤S38:
S38:修复存在的问题,若修复成功,收集各服务器及各网口的数据,执行步骤S37;若修复失败,收集修复过程的数据,终止测试;或者执行步骤S39;
S39:记录修复失败出现的问题及问题服务器的信息,并将此服务器及服务器上的网口从互联树中删除,重新建立互联树,执行步骤S35。
干扰测试的过程实时收集各服务器及各网口数据。
通过干扰测试及相关实时数据,可以反映某个特定时间,单一网口出现故障后对这整个集群系统的影响;以及单台服务器出现故障时对整个集群系统的影响。
如图6所示,本实施例中,性能测试过程包括:
S41:安装性能测试工具Netperf,创建网口性能测试遍历表;
S42:逐一测试各网口间的性能,实时收集各服务器及各网口的数据;
S43:检测所有网口是否都被遍历,若是,安装Kubernetes工具执行步骤S44,若否,执行步骤S42;
S44:针对不同的网络分别建立集群并安装Locust工具,进行集群性能测试,并通过实时收集各服务器及各网口数据。
通过性能测试及相关实时数据,可以侧面反映集群系统整体的网络吞吐量,以及在不同的用户访问下,网络延迟的大小;通过这些实时数据,可以判断是否能够满足当前的应用需求;同时测试会模拟部分失效情况,并根据测试数据给出建议,预留多少网口或者多少服务器,以满足特殊情况的需求。
经历上述各种情况的模拟,可以充分的验证这个集群环境网络的健壮性、可靠性以及性能;程序充分利用集群的资源,可以根据集群的规模设定测试矩阵,完成测试;根据测试结果,能够发现集群的不足点或者配置过剩,在整个集群上线之前可以优化相关配置,即可以避免资源浪费,也可以避免上线后再发现问题所带来的时间浪费。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种服务器集群环境网络系统,其特征在于,包括OS灌装服务器(1)、DNS服务器(2)、DHCP服务器(3)、控制/分析服务器(4)和存储服务器(5);
OS灌装服务器(1),用于灌装测试需要的操作系统及系统参数配置;
DNS服务器(2),用于域名解析;
DHCP服务器(3),用于地址分配,并将IP地址与MAC地址表发给控制/分析服务器(4),待测集群首次接入时将重定向到OS灌装服务器(1)进行系统安装;
控制/分析服务器(4),用于测试环境搭建,控制测试程序运行,收集测试结果,并将结果存储到存储服务器(5)中进行保存,结果分析给出测试结果及建议;
存储服务器(5),用于存储测试数据及测试log;
OS灌装服务器(1)、DNS服务器(2)、DHCP服务器(3)、控制/分析服务器(4)和存储服务器(5)通过测试网络(7)连接有待测集群(9),控制/分析服务器(4)通过管理网络(8)与待测集群(9)连接,控制/分析服务器(4)通过交换机(6)与用户终端连接。
2.根据权利要求1所述的一种服务器集群环境网络系统,其特征在于,
将待测集群(9)中的被测机连接到网络系统中,不同速率的网口通过相应速率的线缆连接到对应的交换机接口上;被测机的管理口通过网线连接到管理网络(8)中。
3.一种服务器集群环境网络系统稳定性检测方法,其特征在于,整个环境需要一台OS灌装服务器,用于灌装测试需要的操作系统及系统参数配置;一台DNS服务器,用于域名解析;一台DHCP服务器,用于地址分配,并将IP地址与MAC地址表发给控制/分析服务器,待测集群首次接入时将重定向到OS灌装服务器进行系统安装;一台控制/分析服务器,用于测试环境搭建,控制测试程序运行,收集测试结果,并将结果存储到存储服务器中进行保存,结果分析给出测试结果及建议;一台存储服务器,用于存储测试数据及测试log;检测方法包括如下步骤:
配置网络系统环境;
进行网络系统稳定性测试,其中包括网络压力测试、干扰测试和性能测试;
处理和分析测试数据及log;
干扰测试的过程包括:
S31:启动网络压力测试;
S32:逐一断开压力测试过程中的服务器的网口连接;
S33:恢复断开网口的连接以及恢复压力测试过程,并检测能否完成恢复;若能完成恢复执行步骤S34;
S34:检测是否所有网口都被遍历到,若是,执行步骤S35,若否,执行步骤S32;
S35:逐一重启服务器;
S36:恢复重启服务器及服务器上网口连接;若可以完成恢复,并重新启动对应的压力测试;
S37:检测所有服务器是否都被遍历到,若是,结束干扰测试并启动第三项测试;若否,执行步骤S35;
步骤S33中恢复断开网口的连接以及恢复压力测试过程,若不能完成恢复执行步骤S310;
S310:修复存在的问题,若修复成功,收集各服务器及各网口的数据,执行步骤S34;若修复失败,收集修复过程的数据,终止测试;或者执行步骤S311;
S311:记录问题及问题网口信息,并将此网口从互联树中删除,重新建立互联树,执行步骤S31;
步骤S36中恢复重启服务器及服务器上网口连接;若不能完成恢复,执行步骤S38:
S38:修复存在的问题,若修复成功,收集各服务器及各网口的数据,执行步骤S37;若修复失败,收集修复过程的数据,终止测试;或者执行步骤S39;
S39:记录修复失败出现的问题及问题服务器的信息,并将此服务器及服务器上的网口从互联树中删除,重新建立互联树,执行步骤S35。
4.根据权利要求3所述的一种服务器集群环境网络系统稳定性检测方法,其特征在于,步骤配置网络系统环境,包括:
S11:被测机安装操作系统;
S12:检测被测机是否安装成功;若否,执行步骤S11,若是,执行步骤S13;
S13:配置网络系统的参数,其中包括启动所有网口;
S14:上报IP地址/网口/MAC地址信息到控制/分析服务器;
S15:检测上报信息完整性,若上报信息完整执行步骤S16,若上报信息不完整,执行步骤S13;
S16:汇总所有信息,形成被测机信息统计表,并检测被测信息的完整性,若被测信息完整,结束网络配置过程并启动第一项测试;若被测信息不完整,执行步骤S13。
5.根据权利要求3所述的一种服务器集群环境网络系统稳定性检测方法,其特征在于,网络压力测试的过程包括:
S21:根据集群服务器及网口数量建立测试互联树;
S22:测试所有互联树是否能正常访问,若是,执行步骤S24;若否,执行步骤S23;
S23:修复网络问题,并收集网络修复过程的log,修复完成执行步骤S22;
S24:启动压力测试;收集实时测试数据,测试完成启动第二项测试。
6.根据权利要求5所述的一种服务器集群环境网络系统稳定性检测方法,其特征在于,干扰测试的过程实时收集各服务器及各网口数据。
7.根据权利要求6所述的一种服务器集群环境网络系统稳定性检测方法,其特征在于,性能测试过程包括:
S41:创建网口性能测试遍历表;
S42:逐一测试各网口间的性能,实时收集各服务器及各网口的数据;
S43:检测所有网口是否都被遍历,若是执行步骤S44,若否,执行步骤S42;
S44:针对不同的网络分别建立集群,进行集群性能测试,并实时收集各服务器及各网口数据。
CN201810638941.6A 2018-06-20 2018-06-20 一种服务器集群环境网络系统及稳定性检测方法 Active CN108833168B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810638941.6A CN108833168B (zh) 2018-06-20 2018-06-20 一种服务器集群环境网络系统及稳定性检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810638941.6A CN108833168B (zh) 2018-06-20 2018-06-20 一种服务器集群环境网络系统及稳定性检测方法

Publications (2)

Publication Number Publication Date
CN108833168A CN108833168A (zh) 2018-11-16
CN108833168B true CN108833168B (zh) 2021-08-20

Family

ID=64143057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810638941.6A Active CN108833168B (zh) 2018-06-20 2018-06-20 一种服务器集群环境网络系统及稳定性检测方法

Country Status (1)

Country Link
CN (1) CN108833168B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110830300B (zh) * 2019-11-09 2022-05-31 苏州浪潮智能科技有限公司 一种服务器稳定性测试方法
CN114915571A (zh) * 2021-02-10 2022-08-16 中国电信股份有限公司 自动测试k8s集群网络质量的方法、设备及存储介质
CN114448774B (zh) * 2021-12-16 2023-12-05 武汉光迅科技股份有限公司 告警处理方法、装置和存储介质
CN116405412B (zh) * 2023-02-24 2024-05-03 中电金信数字科技集团有限公司 基于混沌工程故障模拟服务端集群有效性验证方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577328A (zh) * 2013-11-20 2014-02-12 北京奇虎科技有限公司 一种应用的性能分析方法及装置
CN104461804A (zh) * 2014-12-29 2015-03-25 浪潮电子信息产业股份有限公司 一种基于VSphere测试软件的服务器稳定性测试方法
CN104572372A (zh) * 2014-12-26 2015-04-29 浪潮电子信息产业股份有限公司 一种服务器性能测试环境搭建系统及方法
CN104639402A (zh) * 2015-03-05 2015-05-20 浪潮电子信息产业股份有限公司 一种用于服务器集群系统网络测试的方法
CN105243012A (zh) * 2015-09-11 2016-01-13 浪潮电子信息产业股份有限公司 一种基于linux的集群网络性能评估方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577328A (zh) * 2013-11-20 2014-02-12 北京奇虎科技有限公司 一种应用的性能分析方法及装置
CN104572372A (zh) * 2014-12-26 2015-04-29 浪潮电子信息产业股份有限公司 一种服务器性能测试环境搭建系统及方法
CN104461804A (zh) * 2014-12-29 2015-03-25 浪潮电子信息产业股份有限公司 一种基于VSphere测试软件的服务器稳定性测试方法
CN104639402A (zh) * 2015-03-05 2015-05-20 浪潮电子信息产业股份有限公司 一种用于服务器集群系统网络测试的方法
CN105243012A (zh) * 2015-09-11 2016-01-13 浪潮电子信息产业股份有限公司 一种基于linux的集群网络性能评估方法

Also Published As

Publication number Publication date
CN108833168A (zh) 2018-11-16

Similar Documents

Publication Publication Date Title
CN108833168B (zh) 一种服务器集群环境网络系统及稳定性检测方法
CN109361562B (zh) 一种基于关联网络设备接入的自动化测试方法
CN101197621B (zh) 一种对网管系统故障进行远程诊断定位的方法及其系统
WO2020151483A1 (zh) 物联网平台压力测试系统、方法、装置及服务器
CN102355368B (zh) 一种网络设备的故障处理方法及系统
CN102075384A (zh) 一种性能测试系统及方法
CN104182288A (zh) 一种服务器集群系统功耗自动化测试的方法
CN102185733A (zh) 一种网卡测试方法及系统
CN101114953A (zh) 一种宽带接入服务器自动化测试的方法
CN109120522B (zh) 一种多路径状态监测方法及装置
CN107070752B (zh) 一种长连接容量的测试方法及测试系统
CN112187574A (zh) 使用虚拟机进行网络压力测试的方法、系统和存储介质
CN106776346B (zh) Ccmts设备的测试方法和装置
CN105049284A (zh) 一种基于Linux系统的网络冗余测试方法及装置
CN111934953A (zh) 基于国产处理器计算机平台的批量测试方法
CN110198222B (zh) 一种配电自动化终端即插即用测试方法及测试主站
CN112583663B (zh) 一种基于国产操作系统的自动化网络性能测试方法
CN110830300B (zh) 一种服务器稳定性测试方法
CN111124724B (zh) 一种分布式块存储系统的节点故障测试方法及装置
CN115632706B (zh) 一种fc链路管理方法、装置、设备及可读存储介质
CN114050989B (zh) 基于云计算技术的分布式测试执行方法
CN115686921A (zh) 一种多路径异常检测修复方法、装置、设备及介质
CN113612644B (zh) 一种传输网网元动态仿真方法及系统
CN113300913B (zh) 一种设备测试方法、装置、测试设备及存储介质
CN113987065A (zh) 数据库漂移方法、系统、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant