CN107977280A - 一种故障转移时验证ssd cache加速有效性的方法 - Google Patents

一种故障转移时验证ssd cache加速有效性的方法 Download PDF

Info

Publication number
CN107977280A
CN107977280A CN201711298100.7A CN201711298100A CN107977280A CN 107977280 A CN107977280 A CN 107977280A CN 201711298100 A CN201711298100 A CN 201711298100A CN 107977280 A CN107977280 A CN 107977280A
Authority
CN
China
Prior art keywords
controller
cache
accelerate
ssd
ssd cache
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711298100.7A
Other languages
English (en)
Other versions
CN107977280B (zh
Inventor
张超凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201711298100.7A priority Critical patent/CN107977280B/zh
Publication of CN107977280A publication Critical patent/CN107977280A/zh
Application granted granted Critical
Publication of CN107977280B publication Critical patent/CN107977280B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/073Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a memory management context, e.g. virtual memory or cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0778Dumping, i.e. gathering error/state information after a fault for later diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/26Functional testing
    • G06F11/263Generation of test inputs, e.g. test vectors, patterns or sequences ; with adaptation of the tested hardware for testability with external testers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本申请发明一种故障转移时验证ssd cache加速有效性的测试方法,通过创建ssd cache的缓存池和hdd的资源池,创建属于两个控制器的缓存分区并对其中一个控制器进行重启,同时监测另一控制器上的信息来验证对属于重启控制器的缓存分区和卷是否被故障接管。该方法可以针对故障转移时验证ssd cache加速有效性进行测试,大大提高了ssd cache加速有效性测试的效率。

Description

一种故障转移时验证ssd cache加速有效性的方法
技术领域
本发明涉及服务器测试领域,具体涉及一种故障转移时验证ssd cache加速有效性的方法。
背景技术
随着IT领域技术的不断发展和大数据时代的到来,对数据的存储和处理也随之越来越重要。统一存储系统的优势在于规划整体存储容量的能力——通过部署一个统一存储系统可以省去对文件存储容量以及数据块存储容量分别进行规划。在利用率得到提升的同时,容量本身并没有标准限制——统一存储可以避免与分别对数据块及文件存储支持相关的容量利用率方面的问题,用户不必担心买多了支持其中一种协议的存储而少买了支持另外一种协议。统一存储系统的另外优势在于,存储资源池的灵活性——用户可以在无需知道应用是否需要数据块或者文件数据访问的情况下,而自由分配存储来满足应用环境的需要。统一存储系统支持服务器虚拟化,在很多时候,用户在部署他们的服务器虚拟化环境的时候都会因为性能方面的要求而对基于数据块的裸设备映射(RDM)提出要求。统一存储为用户如何存储他们的虚拟机提供了选择,而无需像之前那样分别购买存储区域网络(SAN)和网络附件存储(NAS)设备。
随着存储系统的高速发展,单控已经越来越不适应多变的场景。控制器的冗余,包括对LUN管理的路径冗余,前端主机访问路径的冗余,即HA功能,是为了保障从前端到后端的任意路径出现故障时能及时切换访问路径,避免数据链路中断;另外,在HA功能里,两个控制器以互为Active-Standby/Standby-Active的状态去管理后端磁盘,等于将后端磁盘分成两组,进而变相提高存储对外的性能输出。
在某些高端的存储器中,还可以提供控制器的负载均衡,即从主机到后端任意访问点都能保障两个控制器的链路访问均分数据流量,很显然,能够做到控制器负载均衡,比单纯提供控制器冗余性能上要提高很多。
基于上述技术,存储系统逐渐在增加新的功能,使用户的数据处理速度和数据安全性都在增强,ssd cache是对小块数据的读加速功能,对在故障时的双控接管,保持数据加速的验证将会显得尤为重要。因此在存储系统上开发新功能模块并进行高效率的测试是一个值得研究的问题。
针对上述问题,本申请发明一种故障转移时验证ssd cache加速有效性的测试方法。可以针对故障转移时验证ssd cache加速有效性进行测试。
发明内容
本发明目的是提供一种实用性强,有效性高的故障转移时验证ssd cache加速有效性的测试方法。
具体地,本申请请求保护一种故障转移时验证ssd cache加速有效性的方法,其特征在于,该方法具体包括如下步骤:
灌装好带有ssd cache功能license的存储系统,并开启license;
创建ssd cache的缓存池和hdd的资源池;
创建属于两个控制器的缓存分区以及待使用分区加速的卷,并映射到主机端,进行IO;
对其中一个控制器进行重启,同时实时监测另一控制器上的信息;
通过主机端的IO工具反应的情况和未重启的控制器上的打印log信息来验证对属于重启控制器的缓存分区和卷是否被故障接管;
控制器重启完成后,查看两控制器活动状态是否均为active,如果均是active,则重启的控制器已正常加入原双控集群中;
此时再次验证主机端IO是否报错,存储端两控制器的ssd cache的log信息是否显示加速卷以及缓存分区回切至原控制器进行正常的加速IO;
若回切过程一切正常,则在故障转移场景下ssd cache加速有效性验证通过。
如上所述的故障转移时验证ssd cache加速有效性的方法,其特征还在于,该验证对属于重启控制器的缓存分区和卷是否被故障接管步骤进一步包括同时观察主机端的IO是否报错,以及存储端另一控制器的活动状态,若以上所要验证的信息均与预期一致无报错,则ssd cacha加速被成功接管。
附图说明
图1、本发明实现流程图
具体实施方式
本发明所述的故障转移时验证ssd cache加速有效性的测试方法具体实现过程为:
1.灌装好带有ssd cache功能license的存储系统,并开启license。
2.创建ssd cache的缓存池和hdd的资源池
3.创建属于两个控制器的缓存分区,以及待使用分区加速的卷,并映射到主机端,进行IO;
4.对其中一个控制器进行重启,同时实时监测另一控制器上的信息,通过主机端的IO工具反应的情况和未重启的控制器上的打印log信息来验证对属于重启控制器的缓存分区和卷是否被故障接管。
下面结合具体实施例对本发明作进一步说明。
一.预先灌装软件系统
执行测试前,先要确保统一存储设备上已灌装好带有该新增功能的软件系统,集群正常创建并使用,无报错信息。
二.创建ssd缓存池和hdd资源池
使用cli配置登录存储设备中待验证测试的ssd缓存池和hdd资源池。
建池操作的具体指令如下:
chdrive -use candidate 0
chdrive -use candidate 1
chdrive -use candidate 2
chdrive -use candidate 3
chdrive -use candidate 4
chdrive -use candidate 5
chdrive -use candidate 6
mkicapool -name ssd_pool -ext 1024
mkmdiskgrp -name hdd_pool -ext 1024
addicadrive -drive 0 0
svctask mkarray -drive 1:2:3:4:5:6 -level raid5 -sparegoal 0 -strip256 hdd_pool
查看建池是否成功:
lsicapool
lsmdiskgrp
三.创建缓存分区
创建属于两个控制器的缓存分区,以及待使用分区加速的卷,并映射到主机端,进行IO。部分指令如下:
mkicapartitIOn -ica_pool 0 -size 10 -unit gb -IOgrp 0 -node 2 #控制器2的分区
mkicapartitIOn -ica_pool 0 -size 10 -unit gb -IOgrp 0 -node 1 #控制器1的分区
mkvdisk -accessIOgrp 0 -IOgrp 0 -mdiskgrp 1 -node 2 -size 100 -unitgb -ica on -ica_bypass on -partitIOn 0 #控制器2的卷,并使用控制器2的分区进行加速
mkvdisk -accessIOgrp 0 -IOgrp 0 -mdiskgrp 1 -node 1 -size 50 -unit gb-ica on -ica_bypass on -partitIOn 1 #控制器1的卷,并使用控制器1的分区进行加速
lsicapartitIOn
查看是否创建并使缓存分区和卷一一对应成功;
将两个被加速的卷映射到主机端,使用pdtest工具进行IO。
四.验证是否被接管
对其中一个控制器1重启,同时观察主机端的IO是否报错,以及存储端另一控制器的活动状态,将dumps文件夹下ssd cache的log信息打印,从而得到加速信息是否被故障接管,若以上所要验证的信息均与预期一致无报错,则ssd cacha加速被成功接管。
对另一个控制器2执行mtop stopnode –reboot命令使其重启,观察控制器1的ssdcache的log信息。如所要验证的信息均与预期一致无报错,则显示加速配置信息已由重启的控制器2转移到控制器1了,被正常接管。
五.验证有效性测试是否完成
控制器重启完成后,查看两控制器活动状态是否均为active,如果均是active,则重启的控制器已正常加入原双控集群中,此时再次验证主机端IO是否报错,存储端两控制器的ssd cache的log信息是否显示加速卷以及缓存分区回切至原控制器进行正常的加速IO。
若回切过程一切正常,则在故障转移场景下ssd cache加速有效性验证通过。
此时,集群正常恢复,加速信息自动回切成功,整个过程中主机端IO无报错,则此功能在故障转移时的有效性验证完毕。
显而易见地,上面所示的仅仅是本发明的一个具体实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据上述实施例获得其他的技术方案,以及在本发明保护的范围内做出的等同变化均应落入本发明的保护范围内,都属于本发明保护的范围。
综上所述,本申请发明一种故障转移时验证ssd cache加速有效性的测试方法。可以针对故障转移时验证ssd cache加速有效性进行测试,大大提高了ssd cache加速有效性测试的效率,为在存储系统上开发新功能模块创造了良好的测试环境。

Claims (2)

1.一种故障转移时验证ssd cache加速有效性的方法,其特征在于,该方法具体包括如下步骤:
灌装好带有ssd cache功能license的存储系统,并开启license;
创建ssd cache的缓存池和hdd的资源池;
创建属于两个控制器的缓存分区以及待使用分区加速的卷,并映射到主机端,进行IO;
对其中一个控制器进行重启,同时实时监测另一控制器上的信息;
通过主机端的IO工具反应的情况和未重启的控制器上的打印log信息来验证对属于重启控制器的缓存分区和卷是否被故障接管;
控制器重启完成后,查看两控制器活动状态是否均为active,如果均是active,则重启的控制器已正常加入原双控集群中;
此时再次验证主机端IO是否报错,存储端两控制器的ssd cache的log信息是否显示加速卷以及缓存分区回切至原控制器进行正常的加速IO;
若回切过程一切正常,则在故障转移场景下ssd cache加速有效性验证通过。
2.如权利要求1所述的故障转移时验证ssd cache加速有效性的方法,其特征还在于,该验证对属于重启控制器的缓存分区和卷是否被故障接管步骤进一步包括同时观察主机端的IO是否报错,以及存储端另一控制器的活动状态,若以上所要验证的信息均与预期一致无报错,则ssd cacha加速被成功接管。
CN201711298100.7A 2017-12-08 2017-12-08 一种故障转移时验证ssd cache加速有效性的方法 Active CN107977280B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711298100.7A CN107977280B (zh) 2017-12-08 2017-12-08 一种故障转移时验证ssd cache加速有效性的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711298100.7A CN107977280B (zh) 2017-12-08 2017-12-08 一种故障转移时验证ssd cache加速有效性的方法

Publications (2)

Publication Number Publication Date
CN107977280A true CN107977280A (zh) 2018-05-01
CN107977280B CN107977280B (zh) 2020-07-24

Family

ID=62009609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711298100.7A Active CN107977280B (zh) 2017-12-08 2017-12-08 一种故障转移时验证ssd cache加速有效性的方法

Country Status (1)

Country Link
CN (1) CN107977280B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109358997A (zh) * 2018-10-10 2019-02-19 郑州云海信息技术有限公司 一种mcs存储系统卷迁移的自动化测试系统及方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101354633A (zh) * 2008-08-22 2009-01-28 杭州华三通信技术有限公司 提高虚拟存储系统写效率的方法及虚拟存储系统
CN101887386A (zh) * 2010-06-02 2010-11-17 深圳市迪菲特科技股份有限公司 一种磁盘阵列控制器故障处理方法及系统
US20110320733A1 (en) * 2010-06-04 2011-12-29 Steven Ted Sanford Cache management and acceleration of storage media
CN104412228A (zh) * 2012-04-04 2015-03-11 赛门铁克公司 动态迁移协议和群集服务器故障转移协议
CN105205017A (zh) * 2015-08-31 2015-12-30 浪潮(北京)电子信息产业有限公司 一种基于pcie ssd的存储控制器
CN205375445U (zh) * 2016-01-14 2016-07-06 徐州易存信息技术有限公司 一种固态硬盘的缓存加速装置
CN107301021A (zh) * 2017-06-22 2017-10-27 郑州云海信息技术有限公司 一种利用ssd缓存对lun进行加速的方法和装置
CN107315667A (zh) * 2017-06-26 2017-11-03 郑州云海信息技术有限公司 一种存储系统二级缓存加速性能测试方法及系统
CN107357697A (zh) * 2017-07-07 2017-11-17 郑州云海信息技术有限公司 一种自动进行存储产品压力测试的方法及系统
CN107402833A (zh) * 2017-06-23 2017-11-28 郑州云海信息技术有限公司 一种对存储系统上的功能模块进行自动测试的方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101354633A (zh) * 2008-08-22 2009-01-28 杭州华三通信技术有限公司 提高虚拟存储系统写效率的方法及虚拟存储系统
CN101887386A (zh) * 2010-06-02 2010-11-17 深圳市迪菲特科技股份有限公司 一种磁盘阵列控制器故障处理方法及系统
US20110320733A1 (en) * 2010-06-04 2011-12-29 Steven Ted Sanford Cache management and acceleration of storage media
CN104412228A (zh) * 2012-04-04 2015-03-11 赛门铁克公司 动态迁移协议和群集服务器故障转移协议
CN105205017A (zh) * 2015-08-31 2015-12-30 浪潮(北京)电子信息产业有限公司 一种基于pcie ssd的存储控制器
CN205375445U (zh) * 2016-01-14 2016-07-06 徐州易存信息技术有限公司 一种固态硬盘的缓存加速装置
CN107301021A (zh) * 2017-06-22 2017-10-27 郑州云海信息技术有限公司 一种利用ssd缓存对lun进行加速的方法和装置
CN107402833A (zh) * 2017-06-23 2017-11-28 郑州云海信息技术有限公司 一种对存储系统上的功能模块进行自动测试的方法
CN107315667A (zh) * 2017-06-26 2017-11-03 郑州云海信息技术有限公司 一种存储系统二级缓存加速性能测试方法及系统
CN107357697A (zh) * 2017-07-07 2017-11-17 郑州云海信息技术有限公司 一种自动进行存储产品压力测试的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
微型计算机: ""原创与SAS硬盘说再见!英特尔双端口NVMe SSD首测"", 《URL:HTTP://WWW.HDPFANS.COM/THREAD-741158-1-1.HTML》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109358997A (zh) * 2018-10-10 2019-02-19 郑州云海信息技术有限公司 一种mcs存储系统卷迁移的自动化测试系统及方法

Also Published As

Publication number Publication date
CN107977280B (zh) 2020-07-24

Similar Documents

Publication Publication Date Title
CN103189847B (zh) 用于操作数据处理系统的方法和装置
US10467246B2 (en) Content-based replication of data in scale out system
US8615676B2 (en) Providing first field data capture in a virtual input/output server (VIOS) cluster environment with cluster-aware vioses
KR101264521B1 (ko) 원격 다이렉트 스토리지 액세스
JP7034806B2 (ja) 分散ストレージネットワークにおけるデータ経路モニタリング
JP5102901B2 (ja) データセンタにわたる複数データサーバ間のデータ完全性を保持する方法およびシステム
US8983822B2 (en) Operating a storage server on a virtual machine
US8726274B2 (en) Registration and initialization of cluster-aware virtual input/output server nodes
CN105843557B (zh) 冗余存储系统、冗余存储方法和冗余存储装置
KR20180117641A (ko) 원격으로 액세스되는 데이터의 효율적인 라이브-이송
US20120151265A1 (en) Supporting cluster level system dumps in a cluster environment
JP2017531250A (ja) 粒状同期/半同期アーキテクチャ
US10970190B2 (en) Hybrid log viewer with thin memory usage
US9342420B2 (en) Communication of conditions at a primary storage controller to a host
US9606873B2 (en) Apparatus, system and method for temporary copy policy
US11409711B2 (en) Barriers for dependent operations among sharded data stores
CN105556473A (zh) 一种i/o任务处理的方法、设备和系统
CN107729536A (zh) 一种数据存储方法和装置
US11347414B2 (en) Using telemetry data from different storage systems to predict response time
US8661089B2 (en) VIOS cluster alert framework
CN107977280A (zh) 一种故障转移时验证ssd cache加速有效性的方法
US10990286B1 (en) Parallel upgrade of nodes in a storage system
CN104618191A (zh) 一种主机与裸存储块之间的通信故障检测方法和装置
KR101673882B1 (ko) 내장 디스크를 이용한 고가용성 가상화 기반 스토리지 시스템 및 이것의 동작방법
CN115391106A (zh) 一种备端资源池化的方法、系统及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200622

Address after: 215100 No. 1 Guanpu Road, Guoxiang Street, Wuzhong Economic Development Zone, Suzhou City, Jiangsu Province

Applicant after: SUZHOU LANGCHAO INTELLIGENT TECHNOLOGY Co.,Ltd.

Address before: 450000 Henan province Zheng Dong New District of Zhengzhou City Xinyi Road No. 278 16 floor room 1601

Applicant before: ZHENGZHOU YUNHAI INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant