CN1225698C - 一种存储设备数据再生进化方法 - Google Patents

一种存储设备数据再生进化方法 Download PDF

Info

Publication number
CN1225698C
CN1225698C CN 03119020 CN03119020A CN1225698C CN 1225698 C CN1225698 C CN 1225698C CN 03119020 CN03119020 CN 03119020 CN 03119020 A CN03119020 A CN 03119020A CN 1225698 C CN1225698 C CN 1225698C
Authority
CN
China
Prior art keywords
data
storage device
performance
storage
memory device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 03119020
Other languages
English (en)
Other versions
CN1445674A (zh
Inventor
谢长生
曹强
谭志虎
王宇德
刘瑞芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN 03119020 priority Critical patent/CN1225698C/zh
Publication of CN1445674A publication Critical patent/CN1445674A/zh
Application granted granted Critical
Publication of CN1225698C publication Critical patent/CN1225698C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种存储设备数据再生进化方法,其步骤为:(1)系统实时对每个存储设备簇的性能和读写请求进行检测。(2)判断某一存储设备簇上数据的组织是否影响性能:如果否,进入步骤(1)。如果是,系统告警,在待机存储池中选择合适的存储设备,将这些存储设备提升到运行存储池中组成新的簇;将原簇上的数据迁移到新的设备簇中;将原簇格式化,转入待机存储池中,进入步骤(1),直至任务结束。使用本发明,系统可对存储设备中的文件碎片进行整理,将在新存储设备中实现数据的重组。并将原存储设备格式化后加入系统中,使原有存储设备实际工作性得到提升,并且在使用过程中,系统通过不断加入新型的存储设备,使整个系统更新,实现其性能优化。

Description

一种存储设备数据再生进化方法
技术领域
本发明属于数据存储技术领域,具体涉及一种存储设备数据再生进化方法,即一种在海量存储环境中管理存储资源的技术。
背景技术
用于网络环境下的企业级海量存储系统面临如下挑战:数字化信息爆炸性增长、数据的重要性和安全性日益增加、大数量的用户群和多媒体的应用对存取性能产生巨大压力、24×7的服务需求要求极高的可用性和可维护性。迎接这种挑战的主要技术是高性能磁盘阵列、附网存储(NAS,NetworkAttached Storage)、存储区域网(SAN,Storage Area Network)、iSCSI(internet SCSI)和存储管理软件等。
虽然上述技术发展日新月异,它还存在以下几个方面的问题:
第一、现有系统有一个普遍存在的矛盾,即元部件的飞速发展和整体结构相对固定的矛盾。以最新的磁盘阵列技术为例,它的构成元部件是磁盘,一旦某个磁盘出故障,它会在备份的新盘上重构丢失的数据。然而,无论新盘在速度上和容量上比其它旧盘高出多少倍,重构后的磁盘阵列总体性能不会有丝毫提高。目前结构的存储系统不会由于更新了部件而得到整体性能的提高。因而,随着技术的进步,这种性能停滞不前的系统很快就会过时,用户不得不购买新的系统来满足应用新的需求;
第二、目前数据固定的组织方式使得数据分布不适应变化,系统整体性能呈现一种随使用而退化的趋势。例如,磁盘的性能随着反复改写的次数增多而性能逐步下降,这是众所周知的碎片问题。单机上的磁盘碎片整理十分耗时,整理时不继续使用此磁盘,磁盘阵列上更难使用整理程序;
第三、系统结构的组织方式较为固定,不能适应应用的多样性和动态性。例如,磁盘阵列的级别(RAID level)一般设定好后就固定下来,难以适应各种不同性质的应用,如对事务处理设定了RAID5而具有较高的性能,但对流媒体的应用就不大合适。
上述问题存在的原因在于现有存储系统物理和逻辑的组织是一种静态的结构,而静态组织结构模型不能很好地刻画处于不断变化之中的系统。这种结构往往适合于特定的应用需要,而且缺少适应不断变化的存储要求的机制。
在此之前,已有一些相关技术被提出来解决对存储资源的优化和管理。
例如,惠普公司开发的AutoRAID技术,见HP whitepaper,《HP AutoRAID:High-Performance Storage for the High-Availability NT Environment》,http://www.hp.com.cn/prodserv/server/pcserver/whitepaper/DOCS/au toraid.pdf,该技术是综合了不同RAID优点的多级RAID阵列技术,它将最近使用的数据放在按RAID 0/1方式存储的快速高性能的磁盘中,将不太常用的数据放在RAID5方式存储的经济高效的磁盘中。AutoRAID技术可以使系统的安装、配置和扩展变得容易,该技术不再需要将数据转移到阵列中的其他磁盘上,只需将新磁盘安装好,AutoRAID就可以自动地判断磁盘大小,并将它加入磁盘阵列中;系统马上就可以利用新磁盘的空间,并将更多的数据按RAID 0/1方式存储,以提高系统的性能和存取速度。此外,AutoRAID能够管理由不同容量磁盘组成的磁盘阵列。动态数据转移是HPAutoRAID的一大特点,它是系统内部的一套控制机构,能够连续监视磁盘阵列的性能,并决定是否将数据保持在缓存中、是否将数据按RAID1存储、是否将数据写入RAID5阵列。这些控制机构能够适应不同的数据情况,并保持系统的高性能。对于工作环境不断变化的场合,这一特点极为有用。
但是,该技术仅仅根据应用对数据使用频度的不同,在数据的动态分布的层次上对存储资源加以优化,因此效果还十分有限。
发明内容
本发明的目的在于提供一种存储设备数据再生进化方法,该方法能够克服普遍存在的系统整体性能随使用而逐渐下降的缺陷。
为实现上述发明目的,一种存储设备数据再生进化方法,其步骤为:
(1)系统实时对每个存储设备簇的性能和读写请求进行检测;
(2)判断某一存储设备簇上数据的组织是否影响性能:
(2.1)如果否,进入步骤(1);
(2.2.1)如果是,系统告警,在待机存储池中选择合适的存储设备,将这些存储设备提升到运行存储池中组成新的簇;
(2.2.2)将原簇上的数据迁移到新的设备簇中;
(2.2.3)将原簇格式化,转入待机存储池中,
(2.2.4)进入步骤(1),直至任务结束。
使用本发明方法,系统能够对存储设备中的文件碎片进行整理,将不连续的数据以合适的策略迁移到新的具有大量连续空间的存储设备中以实现数据的重组。并将原存储设备进行格式化后重新加入到系统中,使原来的存储设备的实际工作性能得到提升,并且在使用过程中,系统通过不断加入新型的存储设备,使整个系统得到更新,从而实现了整个进化存储系统的性能优化。
附图说明
图1为采用本发明方法的一种进化存储系统的结构示意图;
图2为进化存储系统的控制系统的结构示意图;
图3为图2中存储设备管理模块的一种具体实现方式的结构示意图;
图4为一种用于进化存储系统的进化方法的流程图。
具体实施方式
如图1所示,进化存储系统中包括存储库2、处理器3、交换机5和桥6。处理器3可以是单个处理器,SMP(Symmetric Multiple Processors,对称多处理器),MPP(Massively Parallel Processors,并行处理系统),群集或者其它网络计算装置。处理器3可以被多个注册装置所支持,如在进化存储系统中注册的计算机节点1所支持,计算机节点1可以是单个处理器,SMP,MPP,群集或者其它网络计算装置。存储库2包括多个物理存储设备4,如果存储设备支持SCSI接口,则每个物理存储设备4与一个SCSI(Small Computer Systems Interface)到FC(Fibre Channel,光纤通道)的桥6连接。由于SCSI通道数据传输速率与联接的存储设备个数有限,存储设备也可以采用FC接口,如果物理存储设备采用FC接口,桥6可以为光纤通道交换机。如果存储库2中物理存储设备的个数超过单个SCSI通道或者过光纤通道所能支持的范围,可以将SCSI通道或者光纤通道采用如图1所示的两级级联方式联接,光纤通道交换机5,也可以根据需要采用多级方式联接以扩充存储库2。将存储库2的物理存储设备指定为逻辑设备单元(LDU)。每一个物理存储设备4的LDU标识由该物理存储设备所在的SCSI通道(或FC通道)标识和该设备在SCSI通道(或FC通道)上的位置号共同确定,并在存储库2中唯一,例如位置号(1,1)可以标识在第一个通道上的第一个物理存储设备,该存储设备的LDU标识可能为LDU_20。存储设备4的LDU标识与位置号的映射关系表由系统维护,并可以动态更新。图1中的LDU由处理器3控制,并对其统一编址。整个存储系统的存储资源由处理器3进行管理。
在存储库2中,所有存储设备处于三种状态:运行,待机和禁用。
运行池中的存储设备按照存储设备簇的方式存放。存储设备簇是系统中基本的逻辑存储单位,提供一个相对稳定和线性的存储空间,它是由一个或者多个同构的物理存储设备的集合。同一存储设备簇中的存储设备具有相近的存储容量和物理存储性能。不同存储设备簇可以有不同的存储参数,如数据块大小。存储设备簇中的存储设备在物理上不一定相邻。每个存储设备簇中存储设备的数量可以动态改变,最少可以是一个。在保证可靠的存储空间的基础上,存储设备簇中的存储设备可以被另一个性能相近的存储设备替换。当存储设备簇中的存储设备数量变化或发生存储设备替换时,系统自动重构数据。存储设备簇以数据块的形式提供数据存取。
在工作中,处理器3,通过采用SCSI协议的SCSI总线,或者通过采用光纤通道协议的光纤,与存储库2连通,并将从处理器3接受到的数据传送到存储库2处,再将数据从存储库2中传送出来送给处理器3。
处理器3对存储库2中的物理存储设备4的工作性能进行实时监控,根据结果决定存储设备在存储库中的运行状态。同时对存储库2的输入输出数据进行特征分析,以决定数据在物理存储设备上的位置分布。
如图2所示,在工作中,计算机节点1传入的数据经过存储服务模块10传送到存储库2中,并通过该模块接收从存储库2中返回的数据,输出到计算机节点1,对外界提供可靠的存储服务。同时模块10对I/O数据进行采样,将采样数据传给数据I/O及分布特征分析模块9,由该模块对I/O数据的使用频率及该数据在存储库中的物理位置分布特征进行统计分析,将分析结果传送给决策分析模块8。存储设备管理模块7负责对存储库2中的存储设备进行管理,维护存储设备4的LDU标识与位置号的映射关系表,并完成决策分析模块8发送过来的操作命令。模块7还对存储库2中的物理存储设备4的运行状态信息进行实时采样分析,并将性能分析结果传送给决策分析模块8。
决策分析模块8综合从模块9传送来的I/O数据的使用频率和分布特征结果,与从模块7传送来的存储设备工作性能结果,在进化规则库11中选择适合当前运行状况的进化规则,得到该规则中制定的控制信息,将控制命令发送到存储设备管理模块7,由存储设备管理模块7对存储库中的数据重新进行分布或对存储设备进行再生处理。如果进化规则库11中有多条适用的进化规则,则让这几条规则进行竞争,即发送每条规则的测试数据到存储库中,根据返回的性能测试结果选择最佳的规则来优化系统。以自动优化存储系统工作性能,实现系统自身的进化功能。
在工作过程中,模块9将系统I/O及分布特征分析结果实时传送到用户管理模块12,以便用户对系统的数据I/O特征进行监控。同样存储设备管理模块7将收集到的存储库2中的物理存储设备4的运行状态信息实时传送到用户管理模块12。用户可以根据收集到的所有系统信息对系统运行状况做出分析,可以根据需要直接发送系统控制命令到决策分析模块8,以便对系统进行性能优化。例如可以手工将某个使用率较高的应用的数据统一迁移到性能较高的物理存储设备上。
在工作过程中,由于系统会根据自身状况和外界的数据访问特征动态调整数据的分布策略,因此决策分析模块8会实时将存储库2中的数据分布信息传给存储服务模块10,以便存储服务模块能够对外界提供可靠的存储服务。
管理员在进化存储系统运行过程中,可以通过用户管理模块12对进化规则库11进行维护。根据存储系统的运行状态,如果发现需要添加新的进化规则,则可以通过用户管理模块12加入新的进化规则,添加到进化规则库11中。同样也可以修改或删除不适用的进化规则。
图2中各模块均设置在处理器中,但用户管理模块12也可以设置在计算机节点上。
如图3所示,存储设备管理模块7包括存储设备管理控制子模块71、存储设备性能监控子模块72、LDU管理子模块73和存储设备维护子模块74。
存储设备管理控制子模块71的作用是接受决策分析模块8发出的命令,发送相应的控制信息到对应的模块,完成存储设备的管理功能。并将存储库2中的物理存储设备4的状态信息分别反馈到用户管理模块12和决策分析模块8。
存储设备性能监控子模块72对存储库2中的存储设备的性能(如数据吞吐率,平均响应时间,读写正确性)进行实时监控,并将结果传送给存储设备管理控制子模块71,由子模块71分别将结果传送给用户管理模块12和决策分析模块8。子模块71可根据运行情况决定是否向用户管理模块12发送告警信息。在工作过程中,控制子模块71可接收决策分析模块发出的命令,发送控制命令到性能监控子模块72,调整性能监控策略。
LDU管理子模块73接收控制子模块71传来的LDU动态配置信息,对存储设备4的LDU标识与位置号的映射关系表进行维护,并将相应信息通过决策分析模块8传到存储服务模块10。
存储设备维护子模块74接收存储设备控制子模块71发出的存储设备维护命令,对存储库2中的存储设备进行维护,如格式化处理,文件碎片整理等等。
图4描述的是本发明方法的实施例的流程图,该方法用于对存储资源中当某一存储设备簇的数据组织影响到存储设备簇工作性能时对存储设备进行再生处理。在步骤502中,系统实时监测程序对存储池进行扫描,监测每个存储设备簇的数据的组织状况,并进行统计;并对I/O数据的访问信息进行记录和统计分析。在步骤504中,监控程序对扫描结果进行分析,当发现某一存储设备簇上的空间使用率大于设定的阈值(如90%),且该簇上数据的组织影响到该簇的工作性能,例如在某个存储设备簇中存在大量不连续的读写请求,再根据该簇对应的文件系统信息推断在该存储设备簇中存在大量碎片,并且已经影响到存储设备簇的工作性能时,转入步骤507;否则转入步骤502,继续扫描。在步骤505中,系统向上层文件系统发出告警信息,询问是否需要对簇中的数据进行整理,如果需要整理,转入步骤505;否则转入步骤502。在步骤505中,系统在待机存储池中选择合适的存储设备,将这些存储设备提升到运行存储池中组成新的簇。在步骤506中,系统仍然保持online状态,即不停止该簇的存储服务。在保证数据一致性的前提下,将原簇上的数据以合适的策略迁移到新的具有大量连续空间的簇中以实现数据的重组,使得数据在物理地址连续的空间中存放。数据迁移的同时并行进行数据的I/O操作。在此过程中,系统仍然可以对外界提供可靠的存储服务,而不必象现有系统那样必须停止对外的存储服务,从而影响系统的可靠性。在数据迁移完成后,修改主机文件系统中的元数据表,以保证存储数据的一致性。在步骤508中,把原存储设备簇格式化,置存储设备工作状态为待机态,转入待机存储池中,以便重新使用。
本发明也考虑了上述实施例的各种变化。例如,步骤505也可以只对上层文件系统发出告警,由上层的文件系统发出数据重组的命令,来完成碎片的整理工作。
尽管已经详细描述了本发明公开的实施例,但应理解在不脱离其构思和范围的情况下,本发明的实施例还有各种变化,替代和修改。

Claims (1)

1、一种存储设备数据再生进化方法,其步骤为:
(1)系统实时对每个存储设备簇的性能和读写请求进行检测;
(2)判断某一存储设备簇上数据的组织是否影响性能:
(2.1)如果否,进入步骤(1);
(2.2.1)如果是,系统告警,在待机存储池中选择合适的存储设备,将这些存储设备提升到运行存储池中组成新的簇;
(2.2.2)将原簇上的数据迁移到新的设备簇中;
(2.2.3)将原簇格式化,转入待机存储池中,
(2.2.4)进入步骤(1),直至任务结束。
CN 03119020 2003-04-30 2003-04-30 一种存储设备数据再生进化方法 Expired - Fee Related CN1225698C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 03119020 CN1225698C (zh) 2003-04-30 2003-04-30 一种存储设备数据再生进化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 03119020 CN1225698C (zh) 2003-04-30 2003-04-30 一种存储设备数据再生进化方法

Publications (2)

Publication Number Publication Date
CN1445674A CN1445674A (zh) 2003-10-01
CN1225698C true CN1225698C (zh) 2005-11-02

Family

ID=27815002

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 03119020 Expired - Fee Related CN1225698C (zh) 2003-04-30 2003-04-30 一种存储设备数据再生进化方法

Country Status (1)

Country Link
CN (1) CN1225698C (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4146380B2 (ja) 2004-03-29 2008-09-10 東芝ソリューション株式会社 ストレージシステム、ブロック再配置制御方法及びプログラム
CN101576890B (zh) * 2008-05-08 2015-06-17 深圳市朗科科技股份有限公司 一种新型碎片整理方法和系统
CN104035723B (zh) * 2013-03-06 2018-05-22 腾讯科技(深圳)有限公司 一种整理存储文件的方法和终端设备

Also Published As

Publication number Publication date
CN1445674A (zh) 2003-10-01

Similar Documents

Publication Publication Date Title
US9456049B2 (en) Optimizing distributed data analytics for shared storage
US9116819B2 (en) Reducing metadata in a write-anywhere storage system
US6442682B1 (en) Characterization of data access using file system
JP3541744B2 (ja) ストレージサブシステム及びその制御方法
CN1804810A (zh) 用于存储器访问请求的重定向的方法和系统
CN1770088A (zh) 存储网络中的增量备份操作
US20120297145A1 (en) System and method to improve i/o performance of data analytic workloads
CN1770114A (zh) 存储网络中的复制操作
CN101662495A (zh) 备份方法、主服务器、备份服务器以及备份系统
CN1770115A (zh) 存储网络中的恢复操作
EP3353627B1 (en) Adaptive storage reclamation
US11314431B2 (en) Distributed data blocks using storage path cost values
US10810054B1 (en) Capacity balancing for data storage system
US7519636B2 (en) Key sequenced clustered I/O in a database management system
US11755557B2 (en) Flat object storage namespace in an object storage system
US11880716B2 (en) Parallelized segment generation via key-based subdivision in database systems
CN1833232A (zh) 用于运行时数据管理的存储系统类区别提示
US11182107B2 (en) Selective allocation of redundant data blocks to background operations
CN1225698C (zh) 一种存储设备数据再生进化方法
CN1185581C (zh) 一种进化存储系统及其进化方法
US11868334B2 (en) Integrating change tracking of storage objects of a distributed object storage database into a distributed storage system
CN1208724C (zh) 一种自适应数据存储优化分布方法
US20240104081A1 (en) Integrating change tracking of storage objects of a distributed object storage database into a distributed storage system
Wu et al. GA based placement optimization for hybrid distributed storage
WO2023081217A1 (en) Distributed storage systems and methods to provide change tracking integrated with scalable databases

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20051102

Termination date: 20200430

CF01 Termination of patent right due to non-payment of annual fee