CN105959356A - 一种实现多云存储容错转换机制的方法 - Google Patents

一种实现多云存储容错转换机制的方法 Download PDF

Info

Publication number
CN105959356A
CN105959356A CN201610262243.1A CN201610262243A CN105959356A CN 105959356 A CN105959356 A CN 105959356A CN 201610262243 A CN201610262243 A CN 201610262243A CN 105959356 A CN105959356 A CN 105959356A
Authority
CN
China
Prior art keywords
file
fault
data block
tolerant
cloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610262243.1A
Other languages
English (en)
Other versions
CN105959356B (zh
Inventor
冯丹
王阿孟
胡燏翀
常拴霞
吴锋
肖仁智
张晓阳
文可
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201610262243.1A priority Critical patent/CN105959356B/zh
Publication of CN105959356A publication Critical patent/CN105959356A/zh
Application granted granted Critical
Publication of CN105959356B publication Critical patent/CN105959356B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/22Arrangements for detecting or preventing errors in the information received using redundant apparatus to increase reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/565Conversion or adaptation of application format or content

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种实现多云存储容错转换机制的方法,包括:根据数据热度的变化,拟对热数据采用双副本冗余机制进行存储,对冷数据采用RAID5机制进行冗余存储。伴随时间的推移,数据会从热数据转变为冷数据,即容错转换过程。通过在容错转换过程中引入中间节点计算的方法,使用计算资源来换取带宽资源,减少容错转换成本。从多副本到RAID5机制的转换可采用多种路径,从众多路径中选择成本较低的路径进行转换,在一定程度上减少容错转换成本。本发明能在一定程度上提高存储效率、降低用户成本。

Description

一种实现多云存储容错转换机制的方法
技术领域
本发明属于多云存储系统领域,更具体地,涉及一种实现多云存储容错转换机制的方法。
背景技术
随着云存储技术的发展,公有云服务受到企业、政府部门及个人的广泛关注和欢迎。用户不需自己构建部署存储硬件,通过购买云服务提供商所提供的各项服务就可满足自身需求,节省了大量的成本。随着云服务商的大量出现,各个云服务商的费用之间存在着差异,为了应对单云中服务商垄断、云存储系统可靠性等问题,则采用多云存储架构来为用户提供所需服务。
多云存储是指将各种类型(public、private、hybrid clouds)和品牌(Azure、Amazon、Rackspace、Aliyun等)的云存储产品部署在一起,为用户提供可靠安全的存储和数据访问服务。在多云环境下,不会因某个云服务的瘫痪或中断,而影响用户的正常数据请求;当某个云服务商提供的服务出现价格或服务质量波动等情况时,如需迁移数据到另一个云平台,那么只需迁移部分数据,而不是全部数据,这样则可在很大程度上减少数据迁出费用,极大地降低了用户成本。
多云存储容错是指当前云服务提供商所提供的存储服务可能无法保证其真正承诺的数据可用性,采用容错机制保证在某个云存储服务中的数据不可靠时,其他云存储服务仍然能提供对该数据的正常访问。
容错转换是指各个云存储平台都支持着各自不同的应用,而不同的应用包含不同热度的数据,随着时间的推移,数据的热度也处于不停地变化当中。当数据热度发生变化时,出于对存储效率及性能的考虑,则需要对数据进行容错转换。例如当前比较常见的冗余机制:对热数据采用多副本存储冗余机制存储,对冷数据则采用冗余度较低的冗余机制存储(如RAID5),当数据从热变冷时,则需从双副本冗余机制转换到RAID5冗余机制,这个过程称为容错转换。
现有的多云存储研究均未考虑和涉及不同应用的不同容错方案之间容错转换成本问题。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种实现多云存储容错转换机制的方法,其目的在于在多云存储架构中提高数据存储效率,降低容错转换成本等问题,由此解决降低不同应用的不同容错方案转换成本的技术问题。
为实现上述目的,本发明提供了一种实现多云存储容错转换机制的方法,包括:
(1)当用户上传文件至多云架构时,首先在控制端主机上对文件进行分割处理;
(2)在文件的元数据信息中添加转换阈值属性,以备后期进行容错转换时使用;
(3)对每个分割后的数据块进行hash(key),key为数据块名称,然后通过hash计算结果确定数据块的放置位置,依次采用双副本冗余机制上传至多云存储架构中,并将所有元数据信息保存在控制端主机中;
(4)定期对多云存储架构中文件的转换阈值进行检查,对于达到阈值的文件,则采用双副本到RAID5的容错转换机制进行转换。
可选地,所述步骤(1)具体包括如下子步骤:
(1.1)当客户端上传文件至多云架构时,首先会将请求发送至控制端主机;
(1.2)控制端主机根据多云架构中包含的云服务数目来确定文件分割数据块的数目,其中数据块的数目比云服务器的数目少一;
(1.3)根据分割的数据块数目,对文件进行分割并通过随机函数产生随机数的方法对数据块进行命名。
可选地,所述步骤(3)具体包括如下子步骤:
(3.1)控制端主机对文件的各个数据块进行hash(key)运算,key为数据块名称,hash算法为对数据块名称进行取模运算;
(3.2)通过hash算法确定好数据块放置位置后,根据设定的云服务顺序来确定数据块在多云架构中的放置和分布情况,然后采用双副本机制上传文件所包含的数据块;
(3.3)将文件以及分割后的数据块元数据信息保存在控制端主机中,以备后期进行文件获取和容错转换时使用;每个文件的元数据信息包含:文件名、包含的数据块、每个数据块在多云架构中的存放位置以及转换阈值。
可选地,所述步骤(4)具体包括如下子步骤:
(4.1)通过提前设置的转换阈值来确定需要容错转换的文件,定期对元数据信息进行检查,如有文件达到阈值,则进行容错转换;
(4.2)根据(4.1)中获取到需要转换的文件后,根据文件名称查找该文件的元数据信息,通过元数据信息来确定具体的容错转换方案;
(4.3)容错转换方案中包含校验云的选择、条带布局的选择、冗余块删除步骤。
本发明实施例中,当文件包含的数据块被随机以双副本机制上传至多云存储平台时,数据的分布会出现两种情况:不均匀和均匀。通过分析得知,当数据分布均匀时,相对于不均匀的情况会较少数据块的传输,因此本发明拟采用一致性hash算法来保证数据块尽可能地在多云架构中分布均匀,以减少数据块传输,最终减少容错转换开销和成本。
本发明实施例中,通过对各云服务提供商存储和计算成本的调研,带宽成本是计算成本的2-14倍,因此为了节约成本,我们应尽可能使用计算资源进行编码,尽量减少数据传输带来的带宽成本,从而提出引入中间节点计算的思想。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,由于通过数据分布均匀减少容错转换过程中数据块传输,引入计算资源来替换带宽资源,能够取得减少容错转换开销和成本的有益效果。
附图说明
图1是本发明实施例中多云存储容错转换架构图;
图2是本发明实施例中多云存储中无容错与容错对比图;
图3是本发明实施例中多云存储中未引入计算与引入计算对比图;
图4是本发明实施例中多云存储中引入计算与引入计算对比图;
图5是本发明实施例中多云存储容错转换流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,本发明中多云存储容错转换系统架构图详细描述如下:
该系统中包含多个云存储服务(Azure、Amazon、Rackspace、Aliyun等),用于数据存储,控制端主机(Control Host)用于对用户上传的文件进行分割、合并,数据块布局的确定以及容错转换的控制。
当Client端将请求发送至多云存储容错转换系统时,由控制端主机对Client端请求进行处理。如Client端需要上传文件,则通过分割模块对文件进行分割,并通过数据块放置模块对数据块布局进行确定,然后采用双副本机制依次将文件包含的数据块上传至多云存储架构中。当文件达到转换阈值时,则通过容错转换模块对该文件进行容错转换控制,完成从双副本到RAID5冗余机制的转换。当用户获取文件时,控制端主机首先通过查找文件元数据信息,从对应的云存储服务中下载所包含的数据块,然后通过文件分割合并模块,对数据块进行合并操作,最终将完整的文件返回给用户。
如图2所示,本发明中多云存储中无容错与容错对比图详细描述如下:
该图解释了多云存储中容错的必要性。当用户将数据上传至多云存储架构中时,如未采用任何容错机制,则当某个云存储服务中的数据丢失或不可用时,则无法进行恢复,会彻底丢失数据,对用户产生不可估量的经济损失。当采用容错机制时,某个云存储服务中的数据发生丢失或不可用时,可通过冗余机制进行快速恢复,从而避免不必要的经济损失。
如图3和图4所示,本发明中多云存储中未引入计算与引入计算容错转换过程详细描述如下:
图3为未引入计算容错转换过程,图4为引入计算容错转换过程。
两张图介绍了容错转换所包含的大致过程:校验云的选择、条带布局的选择、冗余块删除步骤。在从双副本冗余机制转换到RAID5冗余机制时,需要选择在某个云上进行校验块的生成(RAID5中的校验块P),然后选择最终RAID5中的数据块布局,根据以上选择的校验云及数据块布局进行相应的数据块迁移及冗余块删除操作,最终完成容错转换过程。
从两张图的对比可以明显看出,采用中间节点计算会减少数据块的传输。通过调研得知,带宽成本是计算成本的2-14倍,因此为了节约成本,我们应尽可能使用计算资源进行编码,尽量减少数据传输带来的带宽成本。
如图5所示,本发明中多云存储容错转换流程图详细描述如下:
当Client发送文件上传请求时,首先由控制端主机对该请求进行处理,通过控制端主机中的文件分割合并模块对文件进行分割,并通过数据块放置模块对数据块布局进行确定,然后采用双副本机制将分割后的数据块依次上传至多云存储架构,并将元数据信息保存在控制端主机中,以备文件获取或容错转换过程使用。定期对元数据信息中的文件进行转换阈值检查,对达到转换阈值的文件,则通过控制端主机中的容错转换模块对容错转换过程进行控制,最终完成从双副本到RAID5冗余机制的容错转换。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种实现多云存储容错转换机制的方法,其特征在于,包括如下步骤:
(1)当用户上传文件至多云架构时,首先在控制端主机上对文件进行分割处理;
(2)在文件的元数据信息中添加转换阈值属性,以备后期进行容错转换时使用;
(3)对每个分割后的数据块进行hash(key),key为数据块名称,然后通过hash计算结果确定数据块的放置位置,依次采用双副本冗余机制上传至多云存储架构中,并将所有元数据信息保存在控制端主机中;
(4)定期对多云存储架构中文件的转换阈值进行检查,对于达到阈值的文件,则采用双副本到RAID5的容错转换机制进行转换。
2.如权利要求1所述的一种实现多云存储容错转换机制的方法,其特征在于,所述步骤(1)具体包括如下子步骤:
(1.1)当客户端上传文件至多云架构时,首先会将请求发送至控制端主机;
(1.2)控制端主机根据多云架构中包含的云服务数目来确定文件分割数据块的数目,其中数据块的数目比云服务器的数目少一;
(1.3)根据分割的数据块数目,对文件进行分割并通过随机函数产生随机数的方法对数据块进行命名。
3.如权利要求1或2所述的一种实现多云存储容错转换机制的方法,其特征在于,所述步骤(3)具体包括如下子步骤:
(3.1)控制端主机对文件的各个数据块进行hash(key)运算,key为数据块名称,hash算法为对数据块名称进行取模运算;
(3.2)通过hash算法确定好数据块放置位置后,根据设定的云服务顺序来确定数据块在多云架构中的放置和分布情况,然后采用双副本机制上传文件所包含的数据块;
(3.3)将文件以及分割后的数据块元数据信息保存在控制端主机中,以备后期进行文件获取和容错转换时使用;每个文件的元数据信息包含:文件名、包含的数据块、每个数据块在多云架构中的存放位置以及转换阈值。
4.如权利要求1或2所述的一种实现多云存储容错转换机制的方法,其特征在于,所述步骤(4)具体包括如下子步骤:
(4.1)通过提前设置的转换阈值来确定需要容错转换的文件,定期对元数据信息进行检查,如有文件达到阈值,则进行容错转换;
(4.2)根据(4.1)中获取到需要转换的文件后,根据文件名称查找该文件的元数据信息,通过元数据信息来确定具体的容错转换方案;
(4.3)容错转换方案中包含校验云的选择、条带布局的选择、冗余块删除步骤。
CN201610262243.1A 2016-04-26 2016-04-26 一种实现多云存储容错转换机制的方法 Active CN105959356B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610262243.1A CN105959356B (zh) 2016-04-26 2016-04-26 一种实现多云存储容错转换机制的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610262243.1A CN105959356B (zh) 2016-04-26 2016-04-26 一种实现多云存储容错转换机制的方法

Publications (2)

Publication Number Publication Date
CN105959356A true CN105959356A (zh) 2016-09-21
CN105959356B CN105959356B (zh) 2019-04-12

Family

ID=56915002

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610262243.1A Active CN105959356B (zh) 2016-04-26 2016-04-26 一种实现多云存储容错转换机制的方法

Country Status (1)

Country Link
CN (1) CN105959356B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528342A (zh) * 2016-11-11 2017-03-22 安徽维德工业自动化有限公司 一种具有云服务器备份的磁盘阵列容错装置
CN111343260A (zh) * 2020-02-19 2020-06-26 北京航空航天大学 一种用于多云部署的流处理系统容错方法
CN113238527A (zh) * 2020-12-19 2021-08-10 华中科技大学 一种工业数据汇聚方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901115A (zh) * 2010-07-23 2010-12-01 华中科技大学 一种磁盘阵列raid6级别的构建方法
CN103118089A (zh) * 2013-01-22 2013-05-22 华中科技大学 一种基于多个云存储系统的安全存储方法及其系统
CN105354111A (zh) * 2015-10-29 2016-02-24 国电南瑞科技股份有限公司 一种适用于广域分布式实时数据库的冗余备份方法
CN106027638A (zh) * 2016-05-18 2016-10-12 华中科技大学 一种基于混合编码的hadoop数据分发方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901115A (zh) * 2010-07-23 2010-12-01 华中科技大学 一种磁盘阵列raid6级别的构建方法
CN103118089A (zh) * 2013-01-22 2013-05-22 华中科技大学 一种基于多个云存储系统的安全存储方法及其系统
CN105354111A (zh) * 2015-10-29 2016-02-24 国电南瑞科技股份有限公司 一种适用于广域分布式实时数据库的冗余备份方法
CN106027638A (zh) * 2016-05-18 2016-10-12 华中科技大学 一种基于混合编码的hadoop数据分发方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BO MAO等: ""Improving Storage Availability in Cloud-of-Clouds with Hybrid Redundant Data"", 《IEEE》 *
DR. MOHAMMED ABDUL WAHEED等: ""A NETWORK-CODING BASED DISRTIBUTED STORAGE SYSTEM IN A MULTI-CLOUD"", 《INTERNATIONAL JOURNAL OF ADVANCED RESEARCH IN COMPUTER AND COMMUNICATION ENGINEERING》 *
VIKAS JAIN K等: ""Increase of Fault Tolerance in a Cloud of Clouds by Using Network Coding Based Storage System"", 《INTERNATIONAL JOURNAL OF INNOVATIVE RESEARCH IN COMPUTER AND COMMUNICATION ENGINEERING》 *
胡燏翀: ""基于网络编码的分布式存储容错中修复机制研究"", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528342A (zh) * 2016-11-11 2017-03-22 安徽维德工业自动化有限公司 一种具有云服务器备份的磁盘阵列容错装置
CN111343260A (zh) * 2020-02-19 2020-06-26 北京航空航天大学 一种用于多云部署的流处理系统容错方法
CN111343260B (zh) * 2020-02-19 2021-05-28 北京航空航天大学 一种用于多云部署的流处理系统容错方法
CN113238527A (zh) * 2020-12-19 2021-08-10 华中科技大学 一种工业数据汇聚方法及系统

Also Published As

Publication number Publication date
CN105959356B (zh) 2019-04-12

Similar Documents

Publication Publication Date Title
US10594340B2 (en) Disaster recovery with consolidated erasure coding in geographically distributed setups
US9912753B2 (en) Cloud storage brokering service
Liu et al. A low-cost multi-failure resilient replication scheme for high-data availability in cloud storage
CN104932956B (zh) 一种面向大数据的云容灾备份方法
CN102708165B (zh) 分布式文件系统中的文件处理方法及装置
US9411685B2 (en) Parity chunk operating method and data server apparatus for supporting the same in distributed raid system
KR102225196B1 (ko) 에러 정정 코드에 기초하는 공유 블록체인 데이터 저장의 컨센서스
CN103810061B (zh) 一种高可用云存储方法
CN103440301B (zh) 一种数据多副本混合存储方法及系统
KR102363271B1 (ko) 에러 정정 코드에 기초한 공유 블록체인 데이터 저장의 데이터 보안
CN105025053A (zh) 基于云存储技术的分布式文件的上传方法及其系统
US11113155B1 (en) Archiving and restoration of distributed database log records
EP3794770B1 (en) Shared blockchain data storage based on error correction code
KR20160130490A (ko) 블록-기반 저장을 위한 데이터 볼륨 지속성 상태 감소
EP3341867B1 (en) Management of multiple clusters of distributed file systems
KR20210055632A (ko) 공유 블록체인 데이터 저장 우선 순위화
JP2021528883A (ja) 符号化ブロックチェーンデータのインデックス化および復元
CN105959356A (zh) 一种实现多云存储容错转换机制的方法
CN105069152A (zh) 数据处理方法及装置
US10534667B2 (en) Segmented cloud storage
US20200218450A1 (en) Updating protection sets in a geographically distributed storage environment
Shuai et al. Performance models of access latency in cloud storage systems
KR20130097350A (ko) 비대칭 클러스터링 파일 시스템에서 복제 기반의 파일을 패리티 기반의 파일로 변환하는 장치 및 방법
You et al. Towards a delivery scheme for speedup of data backup in distributed storage systems using erasure codes
CN106027653A (zh) 一种基于raid4的多云存储系统扩展方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant