CN116560921A - Raid卡测试方法、装置、电子设备及存储介质 - Google Patents

Raid卡测试方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116560921A
CN116560921A CN202310429612.1A CN202310429612A CN116560921A CN 116560921 A CN116560921 A CN 116560921A CN 202310429612 A CN202310429612 A CN 202310429612A CN 116560921 A CN116560921 A CN 116560921A
Authority
CN
China
Prior art keywords
test
monitoring
server
raid card
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310429612.1A
Other languages
English (en)
Inventor
王津堂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202310429612.1A priority Critical patent/CN116560921A/zh
Publication of CN116560921A publication Critical patent/CN116560921A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种RAID卡测试方法、装置、电子设备及存储介质,应用于测试系统,所述测试系统包括测试服务器、监控服务器、PC机和交换机,方法包括:配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,所述测试服务器、监控服务器以及PC机基于所述交换机置于同一网络;通过所述测试服务器运行RAID卡的测试脚本,基于所述监控服务器的第一监控工具对待测试RAID进行监控,对所述RAID卡的读/写过程进行数据采集,得到测试数据,基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像。本发明可实现RAID卡测试数据的可视化,便于在测试过程中对RAID卡异常进行定位,从而提高了测试的效率和准确性。

Description

RAID卡测试方法、装置、电子设备及存储介质
技术领域
本发明涉及服务器技术领域,尤其涉及一种RAID卡测试方法、装置、电子设备及存储介质。
背景技术
目前,RAID(磁盘阵列)卡稳定性测试方法是使用FIO(性能测试)工具对其RAID进行长时间的读写测试后,手动收集数据并进行作图处理,以此来观察RAID数据的波动情况。测试过程中无法直观的监测到RAID卡的性能指标,需要在测试完成后手动收集和处理RAID卡的各项参数来判断其稳定性,一旦数据出现异常无法有效的定位问题,这种方法效率低下,无法满足大规模RAID卡测试的需求。
发明内容
本发明提供一种RAID卡测试方法、装置、电子设备及存储介质,用以解决现有技术中上述存在的缺陷,实现RAID卡测试数据的可视化,便于在测试过程中对RAID卡异常进行定位,从而提高了测试的效率和准确性。
本发明提供一种RAID卡测试方法,应用于测试系统,所述测试系统包括测试服务器、监控服务器、PC机和交换机,包括:
配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,所述测试服务器、监控服务器以及PC机基于所述交换机置于同一网络;
通过所述测试服务器运行RAID卡的测试脚本,基于所述监控服务器的第一监控工具对待测试RAID进行监控,对所述RAID卡的读/写过程进行数据采集,得到测试数据,基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像。
根据本发明提供的一种RAID卡测试方法,所述基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像之后,还包括:
基于所述测试图像的波动信息对应的测试数据,确定测试是否通过;
在所述波动信息对应的测试数据不超过预设阈值的情况下,确定测试通过并收集测试日志;
在所述波动信息对应的测试数据超过预设阈值的情况下,确定测试未通过,并基于所述测试数据对所述测试服务器或所述待测试RAID卡进行问题检查。
根据本发明提供的一种RAID卡测试方法,所述配置测试服务器的测试环境,包括:
将所述待测试RAID卡及所述RAID卡测试所需硬盘安装至所述测试服务器;
在所述测试服务器安装目标操作系统,进入所述目标操作系统确定和记录所述待测试RAID卡的部件出厂编码,并将所述待测试RAID卡的固件程序、服务器BIOS、BMC以及各板卡CPLD基于测试策略进行更新;
重启所述测试服务器进入所述BIOS,基于所述测试策略确定RAID卡级别;
安装性能测试工具及所述测试脚本,并安装监控展示工具以展示所述待测试RAID卡测试过程中的关键参数。
根据本发明提供的一种RAID卡测试方法,所述配置监控服务器和PC机的监控环境,包括:
在所述监控服务器中配置所述第一监控工具和第二监控工具;
在所述PC机中配置监控服务,访问所述第一监控工具的第一端口确定第一监控服务正常工作,访问所述第二监控工具的第二端口确定第一监控服务正常工作。
根据本发明提供的一种RAID卡测试方法,所述基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像,包括:
基于测试人员的输入请求配置所述第二监控工具所需的数据源,基于已配置的所述数据源对测试数据进行可视化,确定测试数据的数据图示,得到符合所述数据图示的测试图像。
根据本发明提供的一种RAID卡测试方法,所述对所述RAID卡的读/写过程进行数据采集,得到测试数据,包括:
基于所述测试人员的输入请求在固定时间内采集所述RAID卡在读/写过程中的监控数据;
基于目标函数和监控数据获取所述RAID卡的读/写带宽,基于所述读/写带宽确定测试数据。
根据本发明提供的一种RAID卡测试方法,所述测试脚本用于日志清除、RAID格式化、服务器健康检查以及调用测试工具对RAID施加IO压力中的至少一种。
本发明还提供一种RAID卡测试装置,应用于测试系统,所述测试系统包括测试服务器、监控服务器、PC机和交换机,包括:
服务器配置模块,配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,所述测试服务器、监控服务器以及PC机基于所述交换机置于同一网络;
可视化模块,用于通过所述测试服务器运行RAID卡的测试脚本,基于所述监控服务器的第一监控工具对待测试RAID进行监控,对所述RAID卡的读/写过程进行数据采集,得到测试数据,基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述RAID卡测试方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述RAID卡测试方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述RAID卡测试方法。
本发明提供的RAID卡测试方法、装置、电子设备及存储介质,通过配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,测试服务器、监控服务器以及PC机基于交换机置于同一网络;通过测试服务器运行RAID卡的测试脚本,基于监控服务器的第一监控工具对待测试RAID进行监控,对RAID卡的读/写过程进行数据采集,得到测试数据,基于监控服务器的第二监控工具对测试数据进行可视化,得到所述待测试RAID卡的测试图像。本发明能够在测试过程中实现RAID卡测试数据的可视化,便于在测试过程中对RAID卡异常进行定位,从而提高了测试的效率和准确性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的RAID卡测试方法的流程示意图;
图2是本发明提供的RAID卡测试方法的系统框架图;
图3是本发明提供的RAID卡测试装置的结构示意图;
图4是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
RAID(Redundant Array of Independent Disks)是一种通过将多个硬盘组合起来实现数据冗余和性能提升的技术。RAID卡是负责管理服务器中硬盘的硬件设备,可以在服务器和硬盘之间提供接口和控制信号以及进行数据传输,其性能和稳定性对于数据的安全性和系统的可靠性至关重要。为确保RAID卡的正常工程,需要对其进行一系列性能和稳定性测试。传统的RAID卡稳定性测试方法存在以下问题:测试过程中无法直观的监测到RAID卡的性能指标,需要在测试完成后手动收集和处理RAID卡的各项参数来判断其稳定性,一旦数据出现异常无法有效的定位问题,这种方法效率低下,无法满足大规模RAID卡测试的需求。因此,本发明提供一种RAID卡测试方法、装置、电子设备及存储介质,用于在测试过程中实现RAID卡测试数据的可视化,便于在测试过程中对RAID卡异常进行定位,从而提高了测试的效率和准确性。
参照图1,本发明提供一种RAID卡测试方法,应用于测试系统,所述测试系统包括测试服务器、监控服务器、PC机和交换机,包括:
步骤110、配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,所述测试服务器、监控服务器以及PC机基于所述交换机置于同一网络;
步骤120、通过所述测试服务器运行RAID卡的测试脚本,基于所述监控服务器的第一监控工具对待测试RAID进行监控,对所述RAID卡的读/写过程进行数据采集,得到测试数据,基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像。
以下对上述步骤进行详细描述。
首先通过上述步骤110,对测试服务器、监控服务器和PC机进行数据配置。配置测试服务器的测试环境,即搭建RAID卡的测试环境,需要将待测试RAID卡及所需硬盘安装至测试服务器,在测试服务器下安装系统并在系统下确认和记录RAID卡及其他部件的部件出厂的编码PN。
并且,同时将RAID卡FW(固件程序)和服务器BIOS(基本输入输出系统)、BMC(基板管理控制器)及各板卡CPLD(复杂可编程逻辑器件)按测试策略更新。
进一步地,按照测试要求组建相应的RAID级别,最后安装FIO等测试工具及测试脚本至系统,同时安装node_exporter工具并开启服务,将RAID卡测试时的关键参数提供给监控服务器。
需要说明的是,node_exporter是一个通过Go语言编写的开源的用于监视服务器或节点性能的工具。它收集主机系统上的指标,并以Prometheus等监控系统可以使用的格式公开这些指标。node exporter可以收集各种性能计数器,包括CPU使用率、内存使用率、磁盘使用率、网络活动等。
然后通过上述步骤120,在测试服务器、监控服务器和PC机都配置完成的情况下,读取RAID卡测试脚本,通过监控服务器对RAID卡在测试服务器的测试过程中的测试数据进行采集,然后对测试数据进行可视化,并利用PC机进行显示,即可实现RAID卡测试数据的可视化。
需要说明的是,本实施例中在监控服务器上使用的监控工具主要包括:第一监控工具Prometheus和第二监控工具grafana。
可选地,所述测试脚本用于日志清除、RAID格式化、服务器健康检查以及调用测试工具对RAID施加IO压力中的至少一种。
Prometheus是一个开源的监控工具,可以收集来自各种不同的来源的时间序列数据,并将其存储在一个中央数据存储中。它支持非常多的原生工具,例如Grafana,以提供更易于使用的仪表盘和覆盖层,以进行可视化,查询和警报。Prometheus是一个客户端-服务器模型,其中Prometheus服务器作为核心实体,收集数据,并将其放入一个称为时序数据库的存储库中。Prometheus客户端,也称为Exporters,主要用于收集数据,并将其发送到Prometheus服务器进行处理。Prometheus服务可以非常灵活地运用于各种场景,例如网络监控、服务器监控、应用程序监控和容器监控等。通过Prometheus,用户可以快速了解系统的运行状况,并及时加以解决和优化。
Grafana是一个开源的仪表盘和分析平台,可以让用户将各种数据源的数据进行可视化展示和分析,包括Prometheus,InfluxDB,Elasticsearch,MySQL等。通过Grafana,用户可以从多个数据源中获取数据,更好地了解系统的运行状态,优化和调整系统的性能和可靠性。Grafana提供了直观的仪表盘编辑器,让用户可以轻松地创建自定义和美观的仪表盘。在仪表盘上,用户可以添加不同的图表,包括图形、表格、指标等,更形象地展现数据的变化和趋势。另外,Grafana还提供了强大的查询和分析工具,支持对大量的数据进行处理、统计和分析,并生成详细的报告和趋势图等。
Grafana服务可以广泛应用于各种场景,例如IT运维,网络监控,应用程序监控,物联网等,具有极高的灵活性和可扩展性,为用户提供了更好的数据监控和分析工具。
本发明提供的RAID卡测试方法,通过配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,测试服务器、监控服务器以及PC机基于交换机置于同一网络;通过测试服务器运行RAID卡的测试脚本,基于监控服务器的第一监控工具对待测试RAID进行监控,对RAID卡的读/写过程进行数据采集,得到测试数据,基于监控服务器的第二监控工具对测试数据进行可视化,得到所述待测试RAID卡的测试图像。本发明能够在测试过程中实现RAID卡测试数据的可视化,便于在测试过程中对RAID卡异常进行定位,从而提高了测试的效率和准确性。
在一些实施例中,所述基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像之后,还包括:
基于所述测试图像的波动信息对应的测试数据,确定测试是否通过;
在所述波动信息对应的测试数据不超过预设阈值的情况下,确定测试通过并收集测试日志;
在所述波动信息对应的测试数据超过预设阈值的情况下,确定测试未通过,并基于所述测试数据对所述测试服务器或所述待测试RAID卡进行问题检查。
具体地,在得到RAID卡的测试图像之后,对测试图像进一步分析,以确定RAID卡的测试是否通过。
测试人员可通过测试图像的波动信息确定对应的测试数据,然后判断测试数据是否大于预设阈值,当测试数据小于或等于预设阈值时,确定测试通过并收集测试日志。当测试数据大于预设阈值时,则表示测试未通过,说明RAID卡在测试过程中存在异常,那么则需要根据测试数据对RAID卡或者测试服务器进行问题检查,从而进一步确定测试过程中存在的异常问题。
在一些实施例中,所述配置测试服务器的测试环境,包括:
将所述待测试RAID卡及所述RAID卡测试所需硬盘安装至所述测试服务器;
在所述测试服务器安装目标操作系统,进入所述目标操作系统确定和记录所述待测试RAID卡的部件出厂编码,并将所述待测试RAID卡的固件程序、服务器BIOS、BMC以及各板卡CPLD基于测试策略进行更新;
重启所述测试服务器进入所述BIOS,基于所述测试策略确定RAID卡级别;
安装性能测试工具及所述测试脚本,并安装监控展示工具以展示所述待测试RAID卡测试过程中的关键参数。
进一步地,所述配置监控服务器和PC机的监控环境,包括:
在所述监控服务器中配置所述第一监控工具和第二监控工具;
在所述PC机中配置监控服务,访问所述第一监控工具的第一端口确定第一监控服务正常工作,访问所述第二监控工具的第二端口确定第一监控服务正常工作。
本实施例为测试服务器和监控服务器以及PC机的配置过程。参照图2,测试服务器包括硬盘、RAID卡和网卡,待测服务器和监控服务器的网卡插入交换机中,PC机同样与交换机连接,可实现将测试服务器、监控服务器以及PC机置于同一网络中。
一方面,配置测试服务器,搭建测试服务器。
根据测试需求选择适合型号(9560-8i)的RAID卡安装至测试服务器,安装RHEL7.6系统至服务器系统盘,进入系统后确认和记录RAID卡及其他部件的PN,同时将RAID卡FW和服务器BIOS、BMC及各板卡CPLD按测试策略更新。
重启系统进入BIOS按照测试策略组建RAID卡级别(RAID0),保存退出进入系统。然后安装RAID卡驱动,FIO等测试工具及测试脚本,同时安装node_exporter工具并开启服务,将RAID卡测试时的关键参数暴露,使用PC端的浏览器访问测试服务器IP+9100端口可以查看到node_exporter在被监控端收集的监控信息。
另一方面,配置监控服务器和PC机。
首先部署Prometheus服务:在监控服务器下载并安装Prometheus工具并开启相关服务,在Prometheus配置文件里添加被监控机器,设置完成后可以通过PC浏览器访问监控服务器IP+9090登录Prometheus提供的界面;进一步的,部署grafana服务:在监控服务器下载并安装grafana工具并开启相关服务,设置完成通过监控服务器IP+3030端口登录grafana提供的界面,选择进入datasource选项卡,配置premetheus服务作为数据源。
需要说明的是,datasource选项卡是一种用户界面菜单或工具栏选项,用于管理数据源或数据库连接。这些选项卡通常包括数据库连接、数据库驱动程序、数据源配置以及数据源维护等功能。通常,datasource选项卡可以在不同的应用程序中找到,如数据库管理工具、开发环境、数据可视化和分析工具等。在这些应用程序中,这些选项卡可以让用户轻松地创建、配置、管理和连接到不同类型的数据源,如关系型数据库、非关系型数据库、文件系统、Web服务、API等。
在datasource选项卡中,管理员和开发人员可以执行以下任务:创建新的数据库连接或数据源、配置当前数据库连接或数据源、测试数据库连接或数据源的可用性、更新或删除当前数据库连接或数据源、导入或导出数据源配置信息、管理数据源驱动程序、查看和管理数据源的高级属性和选项以及进行数据源维护操作,如备份和还原数据源。
datasource选项卡是用于管理数据库连接和数据源的一种工具。提供了方便和直观的图形化界面,使用户能够有效地管理和连接到不同类型的数据源。
在PC机中配置监控服务,访问第一监控工具的第一端口确定第一监控服务正常工作,访问第二监控工具的第二端口确定第一监控服务正常工作。
具体体现在:使用PC端的浏览器访问prometheus端口确认prometheus服务是否正常工作,访问grafana端口确认grafana服务是否正常,prometheus提供测试服务器中包括RAID卡、CPU及内存在内所有部件的测试数据,测试人员可根据测试需求选择配置grafana需要的数据源,进一步调整grafana呈现的数据图示,进而实现测试数据的可视化,同时可根据测试标准设置阈值以便测试出现异常时及时通知测试人员,进而及时判断和定位问题。
在一些实施例中,所述基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像,包括:
基于测试人员的输入请求配置所述第二监控工具所需的数据源,基于已配置的所述数据源对测试数据进行可视化,确定测试数据的数据图示,得到符合所述数据图示的测试图像。
具体地,测试人员根据测试需求确定输入请求,监控服务器根据测试人员的输入请求配置第二监控工具所需的数据源,已配置的数据源对测试数据进行可视化,确定测试数据的数据图示,得到符合数据图示的测试图像。
本实施例中,根据第二监控工具grafana需要的数据源,进一步调整grafana呈现的数据图示,进而实现测试数据的可视化,同时可根据测试标准设置阈值以便测试出现异常时及时通知测试人员,进而及时判断和定位问题。
在一些实施例中,所述对所述RAID卡的读/写过程进行数据采集,得到测试数据,包括:
基于所述测试人员的输入请求在固定时间内采集所述RAID卡在读/写过程中的监控数据;
基于目标函数和监控数据获取所述RAID卡的读/写带宽,基于所述读/写带宽确定测试数据。
具体地,根据测试需求设置固定时间,如1s采集一次RAID卡及相关部件测试数据,点击dashboards下的new dashboards新建项目,在metric中选择参数node_disk_written_bytes_total和node_disk_read_bytes_total来监控RAID进行顺序稳定性测试时写和读的总数据。
然后增加rate函数构成表达式rate(node_disk_read_bytes_total[$__interval])/1000/1000、rate(node_disk_written_bytes_total[$__interval])/1000/1000监控RAID的读和写带宽。在PC端上选择应用即可实现测试数据的可视化。
下面对本发明提供的RAID卡测试装置进行描述,下文描述的RAID卡测试装置与上文描述的RAID卡测试方法可相互对应参照。
参照图3,本发明还提供一种RAID卡测试装置,应用于测试系统,所述测试系统包括测试服务器、监控服务器、PC机和交换机,包括:
服务器配置模块310,配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,所述测试服务器、监控服务器以及PC机基于所述交换机置于同一网络;
可视化模块320,用于通过所述测试服务器运行RAID卡的测试脚本,基于所述监控服务器的第一监控工具对待测试RAID进行监控,对所述RAID卡的读/写过程进行数据采集,得到测试数据,基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像。
首先通过上述服务器配置模块310,对测试服务器、监控服务器和PC机进行数据配置。配置测试服务器的测试环境,即搭建RAID卡的测试环境,需要将待测试RAID卡及所需硬盘安装至测试服务器,在测试服务器下安装系统并在系统下确认和记录RAID卡及其他部件的部件出厂的编码PN。
并且,同时将RAID卡FW(固件程序)和服务器BIOS(基本输入输出系统)、BMC(基板管理控制器)及各板卡CPLD(复杂可编程逻辑器件)按测试策略更新。
进一步地,按照测试要求组建相应的RAID级别,最后安装FIO等测试工具及测试脚本至系统,同时安装node_exporter工具并开启服务,将RAID卡测试时的关键参数提供给监控服务器。
需要说明的是,node_exporter是一个通过Go语言编写的开源的用于监视服务器或节点性能的工具。它收集主机系统上的指标,并以Prometheus等监控系统可以使用的格式公开这些指标。node exporter可以收集各种性能计数器,包括CPU使用率、内存使用率、磁盘使用率、网络活动等。
然后通过上述可视化模块320,在测试服务器、监控服务器和PC机都配置完成的情况下,读取RAID卡测试脚本,通过监控服务器对RAID卡在测试服务器的测试过程中的测试数据进行采集,然后对测试数据进行可视化,并利用PC机进行显示,即可实现RAID卡测试数据的可视化。
需要说明的是,本实施例中在监控服务器上使用的监控工具主要包括:第一监控工具Prometheus和第二监控工具grafana。
可选地,所述测试脚本用于日志清除、RAID格式化、服务器健康检查以及调用测试工具对RAID施加IO压力中的至少一种。
Prometheus是一个开源的监控工具,可以收集来自各种不同的来源的时间序列数据,并将其存储在一个中央数据存储中。它支持非常多的原生工具,例如Grafana,以提供更易于使用的仪表盘和覆盖层,以进行可视化,查询和警报。Prometheus是一个客户端-服务器模型,其中Prometheus服务器作为核心实体,收集数据,并将其放入一个称为时序数据库的存储库中。Prometheus客户端,也称为Exporters,主要用于收集数据,并将其发送到Prometheus服务器进行处理。Prometheus服务可以非常灵活地运用于各种场景,例如网络监控、服务器监控、应用程序监控和容器监控等。通过Prometheus,用户可以快速了解系统的运行状况,并及时加以解决和优化。
Grafana是一个开源的仪表盘和分析平台,可以让用户将各种数据源的数据进行可视化展示和分析,包括Prometheus,InfluxDB,Elasticsearch,MySQL等。通过Grafana,用户可以从多个数据源中获取数据,更好地了解系统的运行状态,优化和调整系统的性能和可靠性。Grafana提供了直观的仪表盘编辑器,让用户可以轻松地创建自定义和美观的仪表盘。在仪表盘上,用户可以添加不同的图表,包括图形、表格、指标等,更形象地展现数据的变化和趋势。另外,Grafana还提供了强大的查询和分析工具,支持对大量的数据进行处理、统计和分析,并生成详细的报告和趋势图等。
Grafana服务可以广泛应用于各种场景,例如IT运维,网络监控,应用程序监控,物联网等,具有极高的灵活性和可扩展性,为用户提供了更好的数据监控和分析工具。
本发明提供的RAID卡测试装置,通过配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,测试服务器、监控服务器以及PC机基于交换机置于同一网络;通过测试服务器运行RAID卡的测试脚本,基于监控服务器的第一监控工具对待测试RAID进行监控,对RAID卡的读/写过程进行数据采集,得到测试数据,基于监控服务器的第二监控工具对测试数据进行可视化,得到所述待测试RAID卡的测试图像。本发明能够在测试过程中实现RAID卡测试数据的可视化,便于在测试过程中对RAID卡异常进行定位,从而提高了测试的效率和准确性。
在一些实施例中,所述基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像之后,还包括:
基于所述测试图像的波动信息对应的测试数据,确定测试是否通过;
在所述波动信息对应的测试数据不超过预设阈值的情况下,确定测试通过并收集测试日志;
在所述波动信息对应的测试数据超过预设阈值的情况下,确定测试未通过,并基于所述测试数据对所述测试服务器或所述待测试RAID卡进行问题检查。
具体地,在得到RAID卡的测试图像之后,对测试图像进一步分析,以确定RAID卡的测试是否通过。
测试人员可通过测试图像的波动信息确定对应的测试数据,然后判断测试数据是否大于预设阈值,当测试数据小于或等于预设阈值时,确定测试通过并收集测试日志。当测试数据大于预设阈值时,则表示测试未通过,说明RAID卡在测试过程中存在异常,那么则需要根据测试数据对RAID卡或者测试服务器进行问题检查,从而进一步确定测试过程中存在的异常问题。
在一些实施例中,所述配置测试服务器的测试环境,包括:
将所述待测试RAID卡及所述RAID卡测试所需硬盘安装至所述测试服务器;
在所述测试服务器安装目标操作系统,进入所述目标操作系统确定和记录所述待测试RAID卡的部件出厂编码,并将所述待测试RAID卡的固件程序、服务器BIOS、BMC以及各板卡CPLD基于测试策略进行更新;
重启所述测试服务器进入所述BIOS,基于所述测试策略确定RAID卡级别;
安装性能测试工具及所述测试脚本,并安装监控展示工具以展示所述待测试RAID卡测试过程中的关键参数。
进一步地,所述配置监控服务器和PC机的监控环境,包括:
在所述监控服务器中配置所述第一监控工具和第二监控工具;
在所述PC机中配置监控服务,访问所述第一监控工具的第一端口确定第一监控服务正常工作,访问所述第二监控工具的第二端口确定第一监控服务正常工作。
本实施例为测试服务器和监控服务器以及PC机的配置过程。一方面,配置测试服务器,搭建测试服务器。根据测试需求选择适合型号(9560-8i)的RAID卡安装至测试服务器,安装RHEL7.6系统至服务器系统盘,进入系统后确认和记录RAID卡及其他部件的PN,同时将RAID卡FW和服务器BIOS、BMC及各板卡CPLD按测试策略更新。
重启系统进入BIOS按照测试策略组建RAID卡级别(RAID0),保存退出进入系统。然后安装RAID卡驱动,FIO等测试工具及测试脚本,同时安装node_exporter工具并开启服务,将RAID卡测试时的关键参数暴露,使用PC端的浏览器访问测试服务器IP+9100端口可以查看到node_exporter在被监控端收集的监控信息。
另一方面,配置监控服务器和PC机。
首先部署Prometheus服务:在监控服务器下载并安装Prometheus工具并开启相关服务,在Prometheus配置文件里添加被监控机器,设置完成后可以通过PC浏览器访问监控服务器IP+9090登录Prometheus提供的界面;进一步的,部署grafana服务:在监控服务器下载并安装grafana工具并开启相关服务,设置完成通过监控服务器IP+3030端口登录grafana提供的界面,选择进入datasource选项卡,配置premetheus服务作为数据源。
需要说明的是,datasource选项卡是一种用户界面菜单或工具栏选项,用于管理数据源或数据库连接。这些选项卡通常包括数据库连接、数据库驱动程序、数据源配置以及数据源维护等功能。通常,datasource选项卡可以在不同的应用程序中找到,如数据库管理工具、开发环境、数据可视化和分析工具等。在这些应用程序中,这些选项卡可以让用户轻松地创建、配置、管理和连接到不同类型的数据源,如关系型数据库、非关系型数据库、文件系统、Web服务、API等。
在datasource选项卡中,管理员和开发人员可以执行以下任务:创建新的数据库连接或数据源、配置当前数据库连接或数据源、测试数据库连接或数据源的可用性、更新或删除当前数据库连接或数据源、导入或导出数据源配置信息、管理数据源驱动程序、查看和管理数据源的高级属性和选项以及进行数据源维护操作,如备份和还原数据源。
datasource选项卡是用于管理数据库连接和数据源的一种工具。提供了方便和直观的图形化界面,使用户能够有效地管理和连接到不同类型的数据源。
在PC机中配置监控服务,访问第一监控工具的第一端口确定第一监控服务正常工作,访问第二监控工具的第二端口确定第一监控服务正常工作。
具体体现在:使用PC端的浏览器访问prometheus端口确认prometheus服务是否正常工作,访问grafana端口确认grafana服务是否正常,prometheus提供测试服务器中包括RAID卡、CPU及内存在内所有部件的测试数据,测试人员可根据测试需求选择配置grafana需要的数据源,进一步调整grafana呈现的数据图示,进而实现测试数据的可视化,同时可根据测试标准设置阈值以便测试出现异常时及时通知测试人员,进而及时判断和定位问题。
在一些实施例中,所述基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像,包括:
基于测试人员的输入请求配置所述第二监控工具所需的数据源,基于已配置的所述数据源对测试数据进行可视化,确定测试数据的数据图示,得到符合所述数据图示的测试图像。
具体地,测试人员根据测试需求确定输入请求,监控服务器根据测试人员的输入请求配置第二监控工具所需的数据源,已配置的数据源对测试数据进行可视化,确定测试数据的数据图示,得到符合数据图示的测试图像。
本实施例中,根据第二监控工具grafana需要的数据源,进一步调整grafana呈现的数据图示,进而实现测试数据的可视化,同时可根据测试标准设置阈值以便测试出现异常时及时通知测试人员,进而及时判断和定位问题。
在一些实施例中,所述对所述RAID卡的读/写过程进行数据采集,得到测试数据,包括:
基于所述测试人员的输入请求在固定时间内采集所述RAID卡在读/写过程中的监控数据;
基于目标函数和监控数据获取所述RAID卡的读/写带宽,基于所述读/写带宽确定测试数据。
具体地,根据测试需求设置固定时间,如1s采集一次RAID卡及相关部件测试数据,点击dashboards下的new dashboards新建项目,在metric中选择参数node_disk_written_bytes_total和node_disk_read_bytes_total来监控RAID进行顺序稳定性测试时写和读的总数据。
然后增加rate函数构成表达式rate(node_disk_read_bytes_total[$__interval])/1000/1000、rate(node_disk_written_bytes_total[$__interval])/1000/1000监控RAID的读和写带宽。在PC端上选择应用即可实现测试数据的可视化。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行RAID卡测试方法,该方法包括:
配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,所述测试服务器、监控服务器以及PC机基于所述交换机置于同一网络;
通过所述测试服务器运行RAID卡的测试脚本,基于所述监控服务器的第一监控工具对待测试RAID进行监控,对所述RAID卡的读/写过程进行数据采集,得到测试数据,基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的RAID卡测试方法,该方法包括:
配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,所述测试服务器、监控服务器以及PC机基于所述交换机置于同一网络;
通过所述测试服务器运行RAID卡的测试脚本,基于所述监控服务器的第一监控工具对待测试RAID进行监控,对所述RAID卡的读/写过程进行数据采集,得到测试数据,基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的RAID卡测试方法,该方法包括:
配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,所述测试服务器、监控服务器以及PC机基于所述交换机置于同一网络;
通过所述测试服务器运行RAID卡的测试脚本,基于所述监控服务器的第一监控工具对待测试RAID进行监控,对所述RAID卡的读/写过程进行数据采集,得到测试数据,基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种RAID卡测试方法,应用于测试系统,所述测试系统包括测试服务器、监控服务器、PC机和交换机,其特征在于,包括:
配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,所述测试服务器、监控服务器以及PC机基于所述交换机置于同一网络;
通过所述测试服务器运行RAID卡的测试脚本,基于所述监控服务器的第一监控工具对待测试RAID进行监控,对所述RAID卡的读/写过程进行数据采集,得到测试数据,基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像。
2.根据权利要求1所述的RAID卡测试方法,其特征在于,所述基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像之后,还包括:
基于所述测试图像的波动信息对应的测试数据,确定测试是否通过;
在所述波动信息对应的测试数据超过不预设阈值的情况下,确定测试通过并收集测试日志;
在所述波动信息对应的测试数据超过预设阈值的情况下,确定测试未通过,并基于所述测试数据对所述测试服务器或所述待测试RAID卡进行问题检查。
3.根据权利要求1所述的RAID卡测试方法,其特征在于,所述配置测试服务器的测试环境,包括:
将所述待测试RAID卡及所述RAID卡测试所需硬盘安装至所述测试服务器;
在所述测试服务器安装目标操作系统,进入所述目标操作系统确定和记录所述待测试RAID卡的部件出厂编码,并将所述待测试RAID卡的固件程序、服务器BIOS、BMC以及各板卡CPLD基于测试策略进行更新;
重启所述测试服务器进入所述BIOS,基于所述测试策略确定RAID卡级别;
安装性能测试工具及所述测试脚本,并安装监控展示工具以展示所述待测试RAID卡测试过程中的关键参数。
4.根据权利要求1所述的RAID卡测试方法,其特征在于,所述配置监控服务器和PC机的监控环境,包括:
在所述监控服务器中配置所述第一监控工具和第二监控工具;
在所述PC机中配置监控服务,访问所述第一监控工具的第一端口确定第一监控服务正常工作,访问所述第二监控工具的第二端口确定第一监控服务正常工作。
5.根据权利要求1所述的RAID卡测试方法,其特征在于,所述基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像,包括:
基于测试人员的输入请求配置所述第二监控工具所需的数据源,基于已配置的所述数据源对测试数据进行可视化,确定测试数据的数据图示,得到符合所述数据图示的测试图像。
6.根据权利要求5所述的RAID卡测试方法,其特征在于,所述对所述RAID卡的读/写过程进行数据采集,得到测试数据,包括:
基于所述测试人员的输入请求在固定时间内采集所述RAID卡在读/写过程中的监控数据;
基于目标函数和监控数据获取所述RAID卡的读/写带宽,基于所述读/写带宽确定测试数据。
7.根据权利要求1-6任一项所述的RAID卡测试方法,其特征在于,所述测试脚本用于日志清除、RAID格式化、服务器健康检查以及调用测试工具对RAID施加IO压力中的至少一种。
8.一种RAID卡测试装置,应用于测试系统,所述测试系统包括测试服务器、监控服务器、PC机和交换机,其特征在于,包括:
服务器配置模块,配置测试服务器的测试环境,以及配置监控服务器和PC机的监控环境,其中,所述测试服务器、监控服务器以及PC机基于所述交换机置于同一网络;
可视化模块,用于通过所述测试服务器运行RAID卡的测试脚本,基于所述监控服务器的第一监控工具对待测试RAID进行监控,对所述RAID卡的读/写过程进行数据采集,得到测试数据,基于所述监控服务器的第二监控工具对所述测试数据进行可视化,得到所述待测试RAID卡的测试图像。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述RAID卡测试方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述RAID卡测试方法。
CN202310429612.1A 2023-04-20 2023-04-20 Raid卡测试方法、装置、电子设备及存储介质 Pending CN116560921A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310429612.1A CN116560921A (zh) 2023-04-20 2023-04-20 Raid卡测试方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310429612.1A CN116560921A (zh) 2023-04-20 2023-04-20 Raid卡测试方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116560921A true CN116560921A (zh) 2023-08-08

Family

ID=87488966

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310429612.1A Pending CN116560921A (zh) 2023-04-20 2023-04-20 Raid卡测试方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116560921A (zh)

Similar Documents

Publication Publication Date Title
US7620856B2 (en) Framework for automated testing of enterprise computer systems
US7340649B2 (en) System and method for determining fault isolation in an enterprise computing system
US20070203973A1 (en) Fuzzing Requests And Responses Using A Proxy
US20110012902A1 (en) Method and system for visualizing the performance of applications
JP2003330720A (ja) 規則ベースの構成問題検出
US8489941B2 (en) Automatic documentation of ticket execution
US20090006493A1 (en) Method For Enabling Traceability And Recovery From Errors During Migration Of Software Applications
US20150370619A1 (en) Management system for managing computer system and management method thereof
CN113396395A (zh) 有效评估日志模式的方法
US10509649B2 (en) Value stream graphs across heterogeneous software development platforms
US20090217103A1 (en) Logical to physical connectivity verification in a predefined networking environment
CN107957712A (zh) 改进的用于工业自动化控制器的测试管理器
CN111108481A (zh) 故障分析方法及相关设备
CN116089482A (zh) 分析大规模数据处理作业
CN113708986B (zh) 服务器监控装置、方法及计算机可读存储介质
CN114490375A (zh) 应用程序的性能测试方法、装置、设备及存储介质
US20060161387A1 (en) Framework for collecting, storing, and analyzing system metrics
US20090113243A1 (en) Method, Apparatus and Computer Program Product for Rule-Based Directed Problem Resolution for Servers with Scalable Proactive Monitoring
US8850407B2 (en) Test script generation
CN113010208B (zh) 一种版本信息的生成方法、装置、设备及存储介质
CN112148616B (zh) 一种性能测试管理平台
CN115248782B (zh) 一种自动化测试方法、装置及计算机设备
CN116405412A (zh) 服务端集群的有效性验证方法和系统
CN116225802A (zh) 一种故障测试方法、装置及计算设备
CN116560921A (zh) Raid卡测试方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination