CN105553783A - 一种配置双机资源切换的自动化测试方法 - Google Patents

一种配置双机资源切换的自动化测试方法 Download PDF

Info

Publication number
CN105553783A
CN105553783A CN201610046098.3A CN201610046098A CN105553783A CN 105553783 A CN105553783 A CN 105553783A CN 201610046098 A CN201610046098 A CN 201610046098A CN 105553783 A CN105553783 A CN 105553783A
Authority
CN
China
Prior art keywords
dual
resource
node
computer group
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610046098.3A
Other languages
English (en)
Inventor
王道邦
张恒
杨凡凡
周泽湘
沈晶
罗华
李艳国
潘兴旺
段舒文
于召鑫
杨威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING TOYOU FEIJI ELECTRONICS Co Ltd
Original Assignee
BEIJING TOYOU FEIJI ELECTRONICS Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING TOYOU FEIJI ELECTRONICS Co Ltd filed Critical BEIJING TOYOU FEIJI ELECTRONICS Co Ltd
Priority to CN201610046098.3A priority Critical patent/CN105553783A/zh
Publication of CN105553783A publication Critical patent/CN105553783A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3824Operand accessing
    • G06F9/3826Bypassing or forwarding of data results, e.g. locally between pipeline stages or within a pipeline stage
    • G06F9/3828Bypassing or forwarding of data results, e.g. locally between pipeline stages or within a pipeline stage with global bypass, e.g. between pipelines, between clusters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3885Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
    • G06F9/3889Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by multiple instructions, e.g. MIMD, decoupled access or execute
    • G06F9/3891Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units controlled by multiple instructions, e.g. MIMD, decoupled access or execute organised in groups of units sharing resources, e.g. clusters

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种配置双机资源切换的自动化测试方法,适用于任何业务的双机集群,属于计算机存储技术领域。本发明实现过程为:自动配置集群节点间安全外壳协议(SSH)免密码登陆;自动配置双机集群节点,创建双机集群资源;配置客户端访问双机集群资源,并正常进行IO读写;遍历触发双机集群资源切换条件;任意一种故障导致的资源切换要进行数千次以上的测试。若客户端IO无中断且能查询到资源在当前节点上的状态,则重新测试,否则测试终止,保存系统日志信息,保留系统环境。通过本发明,能够高效、准确的执行双机集群资源切换测试,且在出现问题时,能提供可靠的信息用以分析问题所在。

Description

一种配置双机资源切换的自动化测试方法
技术领域
本发明涉及一种配置双机资源切换的自动化测试方法,适用于任何业务的双机集群,属于计算机存储技术领域。
背景技术
双机集群技术是将一组相互独立的计算机通过网络整合成一个单一的计算机系统。双机集群的一个特点是:保证存储配置及数据的高可用性,在服务出现故障时,双机集群系统可以自动将服务从故障节点切换到另一个备用节点,从而提供不间断性服务,保证了业务的持续运行,同时提高了系统的可靠性和抗灾难性。
双机集群系统能达到资源切换的条件有多种,如断开业务网络、断开后端存储线缆、主节点设备关机等。为了保证双机集群系统的高可用性及抗灾难性,条件触发及切换过程测试要执行成千上万次,然而目前的测试方法多为手动触发切换条件,达到资源切换的目的,且无法自动抓取错误日志,需要人工手动记录,这样耗费了大量时间及人力成本。
综上所述,手动测试双机集群系统既费时又费力,且无法保证测试结果的准确性。
发明内容
本发明提出一种配置双机资源切换的自动化测试方法,思路是通过自动化脚本工具,资源在节点运行正常情况下,自动触发双机集群资源切换条件,使资源切换到另一节点,切换完成后,判断资源在节点是否运行正常,若资源运行正常,则继续触发双机集群资源切换条件,若资源切换出现问题,导致资源在节点运行异常,则自动抓取系统日志,并终止测试。
本发明的目的是通过以下技术方案实现的:
步骤一、自动配置集群节点间安全外壳协议(SSH)免密码登陆;
在主节点生成SSH秘钥对,将公共秘钥通过SCP命令传到另一节点,再将公共秘钥追加到授权的key里面,修改授权key的权限。在主节点进行SSH连接测试,可在主节点免密码登陆到另一节点。
步骤二、自动配置双机集群节点,创建双机集群资源;
首先需要验证集群节点间的系统版本、主机名、IP地址、用户名、密码、时间、网络端口类型及其数量、单双机模式、共享磁盘属性,验证通过后,通过远程过程调用协议RPC脚本命令自动创建双机集群系统;若验证失败,则自动设置正确的属性后,重新验证。
在主节点创建多个资源或在两个节点分别创建多个资源,并自动添加到双机集群系统中。
步骤三、配置客户端访问双机集群资源,并正常进行IO读写;
步骤四、遍历触发双机集群资源切换条件;
触发双机集群资源切换条件如下:
(1)资源业务前端链路故障;
(2)资源业务后端存储链路故障;
(3)资源所在节点heartbeat服务停止;
任意一种故障导致的资源切换要进行千次以上的测试。
步骤五、若客户端IO无中断且能查询到资源在当前节点上的状态,则重新执行步骤四,否则执行步骤六;
步骤六、测试终止,保存系统日志信息,保留系统环境。
有益效果
本发明提出一种配置双机资源切换的自动化测试方法,应用于双机集群存储设备中。
可缩短整个系统测试的周期,快速验证系统的稳定性,适用于多个测试阶段,极大的提高了测试效率,大量节约了时间成本;
也可更好的利用人力资源,将重复性的测试自动化,测试技术人员从重复繁琐的工作中解脱出来投入更多精力设计测试用例,提高测试人员的积极性,大幅节约了人力成本;
测试过程出现问题时,可自动收集系统日志信息,保留最准确的信息和环境,便于研发人员后续进行问题解析。
全程自动化测试,测试过程中无人为干预,提高了测试结果的准确性。
附图说明
图1本发明的一种适用于多种双机集群资源切换测试处理流程图;
图2本发明的一种适用于多种双机集群资源切换的测试拓扑结构图;
图3本发明的一种适用于多种双机集群资源切换的触发条件示意图。
具体实施方式
本发明提出一种双机集群资源切换的自动化测试方法,流程如图1所示,应用于双机集群存储设备中,图2为双机集群资源切换的测试拓扑图,下面以图2测试环境为例,来详细说明本发明的具体测试情况。
根据步骤一,进行SSH免密码登陆设置。在节点HA1使用ssh-keygen命令生成秘钥对,通过SCP命令将公共秘钥拷贝到节点HA2的/root目录下,在节点HA2将公共秘钥追加到授权的key里面,即authorized_keys文件中,修改该文件的使用权限为600。在HA1节点进行SSH连接测试:ssh“HA2节点ip”,即可免密码登陆到HA2节点。
根据步骤二,要创建如图2所示的双机集群系统,必须保证两个节点的系统版本、主机名、IP地址、用户名、密码、时间、网络端口类型及其数量、单双机模式、共享磁盘的验证信息一致通过RPC脚本命令自动验证以上信息;
如图2所示,集群两个节点互为主备,每个节点上各自都有双机资源,即搭建了一个active/active架构的双机集群环境,里面有两套“主/备”结构,本实例中选择以HA1为主节点的双机架构。根据业务类型及磁盘个数,双机集群资源可以创建任意多个。限于实际环境,使用节点上的所有磁盘创建3个资源,即3个存储池(pool),对双机集群来说,资源监控单位是存储池,与业务相关的存储都是基于存储池的,所谓的双机资源就是指存储池,存储池上可以创建dataset(NAS卷)、volume(iscsi卷),本实例中每个资源创建一个NAS卷。
根据步骤三,客户端通过虚拟对外IP1访问节点存储池的共享卷,本实例中,通过NFS方式使用IP1访问3个资源中的NAS卷,并使用vdbench工具对3个NAS卷同时进行IO读写。
根据步骤四,用自动化脚本使节点HA1前端链路,如图3中①所示或后端链路故障如图3中②所示或heartbeat服务终止如图3中③所示来触发双机集群资源切换条件,此时双机集群资源从主节点HA1导出后,导入到备节点HA2。
根据步骤五,通过SSH免密码登陆到备节点可搜索到存储池资源,存储池资源切换过程中IO有短暂停顿,资源切换完成后IO在短时间内(15s)恢复可知存储池在备节点正常运行。主节点故障恢复后,即链路故障恢复或heartbeat服务恢复即触发双机集群资源切换条件,则存储池资源切回主节点且IO不中断。若资源搜索失败或资源切换完成后IO恢复失败,则进入步骤六,测试结束。
判断资源在HA1、HA2节点运行正常通过如下方法:
(1)客户端IO无中断;
(2)能查询到资源在当前节点上的状态;
根据步骤六、测试中止,自动化脚本收集系统log信息后,退出,并保留系统环境。

Claims (1)

1.一种配置双机集群切换的自动化测试方法,其特征在于:
步骤一、自动配置集群节点间安全外壳协议(SSH)免密码登陆:在主节点生成SSH秘钥对,将公共秘钥通过SCP命令传到另一节点,再将公共秘钥追加到授权的key里面,修改授权key的权限;在主节点进行SSH连接测试,可在主节点免密码登陆到另一节点;
步骤二、自动配置双机集群节点,创建双机集群资源:首先需要验证集群节点间的系统版本、主机名、IP地址、用户名、密码、时间、网络端口类型及其数量、单双机模式、共享磁盘属性,验证通过后,通过远程过程调用协议RPC脚本命令自动创建双机集群系统;若验证失败,则自动设置正确的属性后,重新验证;在主节点创建多个资源或在两个节点分别创建多个资源,并自动添加到双机集群系统中;
步骤三、配置客户端访问双机集群资源,并正常进行IO读写;
步骤四、遍历触发双机集群资源切换条件;触发双机集群资源切换条件如下:
(1)资源业务前端链路故障;
(2)资源业务后端存储链路故障;
(3)资源所在节点heartbeat服务停止;
任意一种故障导致的资源切换要进行千次以上的测试;
步骤五、若客户端IO无中断且能查询到资源在当前节点上的状态,则重新执行步骤四,否则执行步骤六;
步骤六、测试终止,保存系统日志信息,保留系统环境。
CN201610046098.3A 2016-01-25 2016-01-25 一种配置双机资源切换的自动化测试方法 Pending CN105553783A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610046098.3A CN105553783A (zh) 2016-01-25 2016-01-25 一种配置双机资源切换的自动化测试方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610046098.3A CN105553783A (zh) 2016-01-25 2016-01-25 一种配置双机资源切换的自动化测试方法

Publications (1)

Publication Number Publication Date
CN105553783A true CN105553783A (zh) 2016-05-04

Family

ID=55832722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610046098.3A Pending CN105553783A (zh) 2016-01-25 2016-01-25 一种配置双机资源切换的自动化测试方法

Country Status (1)

Country Link
CN (1) CN105553783A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106850352A (zh) * 2017-02-10 2017-06-13 郑州云海信息技术有限公司 一种配置vdbench集群测试方法
CN106874159A (zh) * 2016-12-30 2017-06-20 北京同有飞骥科技股份有限公司 一种集群式自动化测试方法
CN107819869A (zh) * 2017-11-21 2018-03-20 深圳竹云科技有限公司 一种linux‑unix文件传输互信的方法
CN108804169A (zh) * 2018-06-14 2018-11-13 郑州云海信息技术有限公司 一种可配置资源的创建方法以及相关装置
CN108959045A (zh) * 2018-06-08 2018-12-07 郑州云海信息技术有限公司 一种nas集群故障切换性能的测试方法和系统
CN110557449A (zh) * 2019-08-30 2019-12-10 苏州浪潮智能科技有限公司 一种NAS分布式存储阵列与VMware互认证测试系统、方法及设备
CN110730196A (zh) * 2018-07-16 2020-01-24 阿里巴巴集团控股有限公司 一种网络资源访问方法、计算机设备、存储介质
CN111045923A (zh) * 2019-10-24 2020-04-21 苏州浪潮智能科技有限公司 一种hbase组件高可用性的测试方法、系统及设备
CN114584489A (zh) * 2022-03-08 2022-06-03 浪潮云信息技术股份公司 一种基于ssh通道的远程环境信息和配置检测方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1791233A (zh) * 2004-12-14 2006-06-21 华为技术有限公司 主备单板倒换测试方法
US20070294600A1 (en) * 2006-05-08 2007-12-20 Inventec Corporation Method of detecting heartbeats and device thereof
CN101291206A (zh) * 2008-06-20 2008-10-22 中兴通讯股份有限公司 一种单板主备倒换测试装置和方法
CN103973359A (zh) * 2014-04-16 2014-08-06 烽火通信科技股份有限公司 一种otn保护倒换自动化测试系统、方法及装置
CN104182288A (zh) * 2014-08-18 2014-12-03 浪潮电子信息产业股份有限公司 一种服务器集群系统功耗自动化测试的方法
CN104954189A (zh) * 2015-07-07 2015-09-30 上海斐讯数据通信技术有限公司 一种服务器集群的自动检测方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1791233A (zh) * 2004-12-14 2006-06-21 华为技术有限公司 主备单板倒换测试方法
US20070294600A1 (en) * 2006-05-08 2007-12-20 Inventec Corporation Method of detecting heartbeats and device thereof
CN101291206A (zh) * 2008-06-20 2008-10-22 中兴通讯股份有限公司 一种单板主备倒换测试装置和方法
CN103973359A (zh) * 2014-04-16 2014-08-06 烽火通信科技股份有限公司 一种otn保护倒换自动化测试系统、方法及装置
CN104182288A (zh) * 2014-08-18 2014-12-03 浪潮电子信息产业股份有限公司 一种服务器集群系统功耗自动化测试的方法
CN104954189A (zh) * 2015-07-07 2015-09-30 上海斐讯数据通信技术有限公司 一种服务器集群的自动检测方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
钟华: "《自动化测试浅析》", 《开发研究与设计技术》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874159A (zh) * 2016-12-30 2017-06-20 北京同有飞骥科技股份有限公司 一种集群式自动化测试方法
CN106850352A (zh) * 2017-02-10 2017-06-13 郑州云海信息技术有限公司 一种配置vdbench集群测试方法
CN107819869A (zh) * 2017-11-21 2018-03-20 深圳竹云科技有限公司 一种linux‑unix文件传输互信的方法
CN108959045A (zh) * 2018-06-08 2018-12-07 郑州云海信息技术有限公司 一种nas集群故障切换性能的测试方法和系统
CN108959045B (zh) * 2018-06-08 2021-11-09 郑州云海信息技术有限公司 一种nas集群故障切换性能的测试方法和系统
CN108804169A (zh) * 2018-06-14 2018-11-13 郑州云海信息技术有限公司 一种可配置资源的创建方法以及相关装置
CN110730196A (zh) * 2018-07-16 2020-01-24 阿里巴巴集团控股有限公司 一种网络资源访问方法、计算机设备、存储介质
CN110557449A (zh) * 2019-08-30 2019-12-10 苏州浪潮智能科技有限公司 一种NAS分布式存储阵列与VMware互认证测试系统、方法及设备
CN111045923A (zh) * 2019-10-24 2020-04-21 苏州浪潮智能科技有限公司 一种hbase组件高可用性的测试方法、系统及设备
CN114584489A (zh) * 2022-03-08 2022-06-03 浪潮云信息技术股份公司 一种基于ssh通道的远程环境信息和配置检测方法和系统

Similar Documents

Publication Publication Date Title
CN105553783A (zh) 一种配置双机资源切换的自动化测试方法
Meza et al. A large scale study of data center network reliability
CN107343034B (zh) 基于QConf的Redis高可用系统及方法
CN107317695B (zh) 用于调试联网故障的方法、系统和装置
CN105468295B (zh) 一种实现对象存储的安全防护访问方法及系统
US20100223609A1 (en) Systems and methods for automatic discovery of network software relationships
CN204859222U (zh) 同城数据中心双活高可用系统
CN106850260A (zh) 一种虚拟化资源管理平台的部署方法和装置
CN105511805A (zh) 集群文件系统的数据处理方法和装置
CN105550073A (zh) 数据库备份方法及其系统
CN103441863A (zh) 一种空管自动化系统中的双服务器热备系统及控制方法
CN104536860A (zh) 一种实时监测jbod模式下硬盘排列顺序的方法
CN109508295B (zh) 区块链共识算法测试方法、装置、计算装置和存储介质
CN111949444A (zh) 一种基于分布式服务集群的数据备份与恢复系统及方法
CN102571498A (zh) 故障注入控制方法和装置
CN103744743A (zh) 一种基于数据库rac模式心跳信号的冗余配置的方法
US8421614B2 (en) Reliable redundant data communication through alternating current power distribution system
CN105490847B (zh) 一种私有云存储系统中节点故障实时检测及处理方法
CN114090174A (zh) 基于超融合的城轨边缘云一体化设备
CN111404780B (zh) 一种远程直接存储器访问网络集群的功能测试方法和装置
CN108600156A (zh) 一种服务器及安全认证方法
CN115766405B (zh) 一种故障处理方法、装置、设备和存储介质
CN106301967B (zh) 一种数据同步方法及带外管理设备
US8565067B2 (en) Apparatus, system, and method for link maintenance
CN111988169A (zh) 一种云平台异常磁盘清理修复的方法、系统、设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160504