CN106612322B - 云存储中一种存数据节点分布优化的数据恢复方法 - Google Patents

云存储中一种存数据节点分布优化的数据恢复方法 Download PDF

Info

Publication number
CN106612322B
CN106612322B CN201610536621.0A CN201610536621A CN106612322B CN 106612322 B CN106612322 B CN 106612322B CN 201610536621 A CN201610536621 A CN 201610536621A CN 106612322 B CN106612322 B CN 106612322B
Authority
CN
China
Prior art keywords
node
data
decision
storage
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610536621.0A
Other languages
English (en)
Other versions
CN106612322A (zh
Inventor
范勇
胡成华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Buijian Information Technology Co ltd
Original Assignee
Nanjing Buijian Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Buijian Information Technology Co Ltd filed Critical Nanjing Buijian Information Technology Co Ltd
Priority to CN201610536621.0A priority Critical patent/CN106612322B/zh
Publication of CN106612322A publication Critical patent/CN106612322A/zh
Application granted granted Critical
Publication of CN106612322B publication Critical patent/CN106612322B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

云存储中一种存数据节点分布优化的数据恢复方法,提出了一种数据及数据副本在数据节点上局部最优分布的存储策略,主要是将数据对象映射到环形哈希数值空间中的数值作为计算中心,建立决策域;以负载率、相对负载热度、预计等待时间参数的权重作为决策准则指导建立决策分布,选择最佳的存储节点,其中包括建立有效的决策集合和决策集的扩展,数据变更后节点的增删处理。本发明降低了节点分布不均匀的概率。

Description

云存储中一种存数据节点分布优化的数据恢复方法
技术领域
本发明涉及云计算、云存储中数据安全和数据验证恢复领域。
背景技术
随着云技术的发展,企业和个人愈来愈倾向于将数据存储在云端,以便节省移动存储空间和方便随时随地访问;同时,数据也可在云端实现共享、方便他人下载。但是,由此也引起了数据的安全问题,数据存储在云端,脱离了数据所有者的控制,或因云服务商系统不稳定、云空间被恶意攻击,造成数据丢失和损坏。用户在不知情的情况下,或将因为数据不完整而造成各种损失;那么如何确定云端数据的完整性?数据在存储空间内被破坏后,数据不再完整,如何根据现有数据精确恢复被修改的部分?都是值得探讨的问题。然而当用户将数据存放在云存储中,他们最关心的是数据是否完整无误;如果出现故障,是否可以恢复其数据。
云存储中,数据块一般会有两个到三个数据块副本随机分布在数据节点上,但是由于分布的随机性,很大概率产生分布不均匀,产生副本均在一个机架的同一个节点上,或者都分布在异地机架的节点上,这种不均匀的分布容易出现数据节点损坏时副本数据也损坏的情况,或者是异地机架存储节点数据发送慢,严重影响数据的恢复。
发明内容
针对现有技术的上述不足,本发明提出了云存储中一种存数据节点分布优化的数据恢复方法。
为解决上述问题,本发明提出了以下技术方案:
提出了一种数据及数据副本在数据节点上局部最优分布的存储策略,主要是将数据对象映射到环形哈希数值空间中的数值作为计算中心,建立决策域;以负载率、相对负载热度、预计等待时间参数的权重作为决策准则指导建立决策分布,选择最佳的存储节点,其中包括建立有效的决策集合和决策集的扩展,数据变更后节点的增删处理。具体实施步骤如下:
步骤1:初始化系统,生成决策表。
步骤2:构造有效决策集。
步骤3:效决策集UH(o)的元素大于1时,进行优化,计算出最有的存储节点。
步骤4:数据存储。
步骤5:数据节点的增删。
本发明的有益效果是:本发明降低了节点分布不均匀的概率。
具体实施方式
步骤1:初始化系统,生成决策表
在数据存储的空间内,将所有用于存储的数据的存储节点映射到环形哈希数值空间,随机选择一个节点,顺时针找到第一个由存储节点映射到的数值作为计算中心,记为o;数值o对应的节点也用o来表示,从o开始,顺时针和逆时针找到相同个数的由存储节点映射二来的数值,所经过的节点个数为半径,记为r,某个数值从计算中心出发,顺时针和逆时针方向找到的第i个有存储节点映射到的数值称为数据到o的距离(distance,D),则顺时针(clockwise,cw)距离记为Dcw(o)i逆时针(anticlockwise,acw)距离记为Dacw(o)i,他们对应的存储节点分别为:DcwH(o)i和DacwH(o)i.
DcwH(o)={DcwH(o)1,DcwH(o)2,...,DcwH(o)r}
DacwH(o)={DacwH(o)i,DacwH(o)2,...,DacwH(o)r}
所以,决策域DH(o)=DcwH(o)∪DacwH(o)∪{o},决策域中所有存储节点的状态信息(info)就称为计算中心o的决策表,用info(o)表示,节点的状态信息包括存储能力、当前负载、热度负载、热度处理能力、等。
步骤2:构造有效决策集
当目录节点接收到数据副本的存储请求时,按照步骤一生成对应的计算中心o,将数据信息和数据请求单位到各数据中心的网络信息发送给o,然后o构造半径为r的有效决策集UH(o):
UH(o)={S|S∈DH(o),S满足条件Δ}
条件Δ为:(1)有足够的空间存储存储数据副本。
(2)存储节点上该数据副本的数量小于等于0。
(3)改存储节点所在的存储机架上该数据副本的数量小于等于1。
(4)该存储节点等待请求存储的数量低于该节点的上限。
如果该有效决策集UH(o)是空集的时候,输出错误,表示不能进行存储,如果效决策集UH(o)只有一个元素的时候,该元素对应的存储节点N为最佳存储节点,如果效决策集UH(o)的元素不止一个时候,进行决策集的优化计算。
步骤3:效决策集UH(o)的元素大于1时,进行优化,计算出最有的存储节点
3.1对于效决策集UH(o)中的每一个元素对应的节点,计算其存储后负载率、相对热度负载、预计等待时间:
3.1.1存储后负载率
存储后负载率(load rate,Lr)是为了衡量存储后节点N的压力,表示当前数据副本M加载到节点Ni后Ni的负载率:
其中L(Ni)表示原来的存储量,L(M)表示存储数据副本M所需的存储空间的大小,S(Ni)表示节点的负载能力,Lr(Ni)表示存储后的负载率。
那么效决策集UH(o)中的总体负载率为:
3.1.2相对负载热度
相对负载热度(H)表示节点收到请求的总次数
H(Ni)=N(Ni)+∑R(M)
N(Ni)表示Ni中的副本数量,ΣR(M)表示收到副本M请求的总数量。
那么效决策集UH(o)中的总体相对负载热度表示为:
H_(Ni)表示单位时间内请求处理的请求数的和。
3.1.3预计等待时间
预计等待时间T(Ni)用来预先估计存储请求等地的时间,
V(Ni,M)表示节点和数据之间的传输速度,Tp表示现有请求队列的完成时间,Ta表示数据M存储请求的到达时间,则有效决策集内的总体预计等待时间近似表示为:
3.2存储后负载率、相对热度负载、预计等待时间对有效决策集的影响权重分别用p、q、v三个参数来表示,权重的计算方法为:
p=p0+αLrUH(o)
q=q0+βHUH(o)
v=v0+γTUH(o)
p0、q0、v0为初始值,由云存状态信息决定;α、β、γ为权重参数
3.3建立对比矩阵,优化有效决策集中的存储节点,选择最佳的存储节点
依据Ni节点的存储后负载率、相对热度负载、预计等待时间的权重p、q、v,先建立一个一致性矩阵:
然后采用和法求A得单位特征向量W:
假设有效决策集UH(o)中,有m个节点(m>1),那么
w1={w11,w12,…w1m}
w2={w21,w22,…w2m}
w3={w31,w32,…w3m}
在这m个节点中,存储节点Ni对目标的组合组合权重就可以表示为:
其中i≤m,那么在有效决策集UH(o)中,组合权重最小的节点即min(Ui)对应的节点就是最有的存储节点
步骤4:数据存储
选择好最有存储节点N后,将N发送到目录节点,并将数据M加入节点N的请求队列,并更新决策表。
步骤5:数据节点的增删
当发生数据的修改时,云存储系统就会动态地添加或删除存储节点。
5.1节点增加
存储节点S加入云存储系统中时,假设从S出发顺时针寻找到的第一个存储节点为o,更新o的决策域DH(o)中所有存储节点的决策表相应位置的信息。
5.2节点的删除
从o的决策域DH(o)中选择与o同机架的存储节点,如果不存在则选择所属机架与o所属机架最近的存储节点,将o上的数据块分散到这些节点上,并更新o的DH(o)中的所有存储节点的决策表相应位置的信息。

Claims (1)

1.云存储中一种存数据节点分布优化的数据恢复方法,其特征是,所述方法包括如下步骤:
步骤1:初始化系统,生成决策表;
步骤2:构造有效决策集;
步骤3:效决策集UH(o)的元素大于1时,进行优化,计算出最优的存储节点;
步骤4:数据存储:选择好最优存储节点N后,将N发送到目录节点,并将数据M加入节点N的请求队列,并更新决策表;
步骤5:数据节点的增删,
步骤1中的具体描述如下:
在数据存储的空间内,将所有用于存储的数据的存储节点映射到环形哈希数值空间,随机选择一个节点,顺时针找到第一个由存储节点映射到的数值作为计算中心,记为o;数值o对应的节点也用o来表示,从o开始,顺时针和逆时针找到相同个数的由存储节点映射二来的数值,所经过的节点个数为半径,记为r,某个数值从计算中心出发,顺时针和逆时针方向找到的第i个有存储节点映射到的数值称为数据到o的距离distance,D,则顺时针clockwise,cw距离记为Dcw(o)i,逆时针anticlockwise,acw距离记为Dacw(o)i,他们对应的存储节点分别为:DcwH(o)i和DacwH(o)i
DcwH(o)={DcwH(o)1,DcwH(o)2,...,DcwH(o)r}
DacwH(o)={DacwH(o)i,DacwH(o)2,...,DacwH(o)r}
所以,决策域DH(o)=DcwH(o)∪DacwH(o)∪{o},决策域中所有存储节点的状态信息info就称为计算中心o的决策表,用info(o)表示,节点的状态信息包括存储能力、当前负载、热度负载、热度处理能力,
步骤2的具体描述如下:
当目录节点接收到数据副本的存储请求时,按照步骤一生成对应的计算中心o,将数据信息和数据请求单位到各数据中心的网络信息发送给o,然后o构造半径为r的有效决策为UH(o):
UH(o)={S|S∈DH(o),S满足条件Δ}
条件Δ为:1,有足够的空间存储数据副本;
2,存储节点上该数据副本的数量小于等于0;
3,改存储节点所在的存储机架上该数据副本的数量小于等于1;
4,该存储节点等待请求存储的数量低于该节点的上限;
如果该有效决策集UH(o)是空集的时候,输出错误,表示不能进行存储,如果效决策集UH(o)只有一个元素的时候,该元素对应的存储节点N为最佳存储节点,如果效决策集UH(o)的元素不止一个时候,进行决策集的优化计算,
步骤3中的具体计算过程如下:
3.1对于效决策集UH(o)中的每一个元素对应的节点,计算其存储后负载率、相对热度负载、预计等待时间:
3.1.1存储后负载率
存储后负载率load rate,Lr是为了衡量存储后节点N的压力,表示当前数据副本M加载到节点Ni后Ni的负载率:
其中L(Ni)表示原来的存储量,L(M)表示存储数据副本M所需的存储空间的大小,S(Ni)表示节点的负载能力,Lr(Ni)表示存储后的负载率那么效决策集UH(o)中的总体负载率为:
3.1.2相对负载热度
相对负载热度(H)表示节点收到请求的总次数:
N(Ni)H(Ni)=N(Ni)+∑R(M)
表示Ni中的副本数量,∑R(M)表示收到副本M请求的总数量,那么效决策集UH(o)中的总体相对负载热度表示为:
H_(Ni)表示单位时间内请求处理的请求数的和,
3.1.3预计等待时间
预计等待时间T(Ni)用来预先估计存储请求等待的时间,
表示节点和数据之间的传输速度,Tp表示现有请求队列的完成时间,Ta表示数据M存储请求的到达时间,则有效决策集内的总体预计等待时间表示为:
3.2存储后负载率、相对热度负载、预计等待时间对有效决策集的影响权重分别用p、q、v三个参数来表示,权重的计算方法为:
p=p0+αLrUH(o)
q=q0+βHUH(o)
v=v0+γTUH(o)
p0、q0、v0为初始值,由云存状态信息决定;α、β、γ为权重参数,
3.3建立对比矩阵,优化有效决策集中的存储节点,选择最佳的存储节点,
依据Ni节点的存储后负载率、相对热度负载、预计等待时间的权重p、q、v,先建立一个一致性矩阵:
然后采用和法求A得单位特征向量W:
假设有效决策集UH(o)中,有m个节点(m>1),那么
w1={w11,w12,...w1m}
w2={w21,w22,...w2m}
w3={w31,w32,...w3m}
在这m个节点中,存储节点Ni对目标的组合组合权重就可以表示为:
其中i≤m,那么在有效决策集UH(o)中,组合权重最小的节点即min(Ui)对应的节点就是最优的存储节点。
CN201610536621.0A 2016-07-11 2016-07-11 云存储中一种存数据节点分布优化的数据恢复方法 Expired - Fee Related CN106612322B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610536621.0A CN106612322B (zh) 2016-07-11 2016-07-11 云存储中一种存数据节点分布优化的数据恢复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610536621.0A CN106612322B (zh) 2016-07-11 2016-07-11 云存储中一种存数据节点分布优化的数据恢复方法

Publications (2)

Publication Number Publication Date
CN106612322A CN106612322A (zh) 2017-05-03
CN106612322B true CN106612322B (zh) 2019-10-11

Family

ID=58615352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610536621.0A Expired - Fee Related CN106612322B (zh) 2016-07-11 2016-07-11 云存储中一种存数据节点分布优化的数据恢复方法

Country Status (1)

Country Link
CN (1) CN106612322B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110535898B (zh) * 2018-05-25 2022-10-04 许继集团有限公司 大数据存储中副本存放、补全、节点选择方法及管理系统
CN112350947B (zh) * 2020-10-23 2022-07-29 杭州迪普信息技术有限公司 一种报文匹配决策树的更新方法及装置
CN117827850B (zh) * 2024-03-06 2024-05-10 深圳钰丰信息技术有限公司 一种数据存储方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102137157A (zh) * 2011-02-28 2011-07-27 浪潮(北京)电子信息产业有限公司 一种云存储系统及其实现方法
CN105068755A (zh) * 2015-07-08 2015-11-18 南京邮电大学 一种面向云计算内容分发网络的数据副本存储方法
CN105072086A (zh) * 2015-07-06 2015-11-18 武汉科技大学 一种基于MapReduce的云存储批量审计方法
CN105487818A (zh) * 2015-11-27 2016-04-13 清华大学 针对云存储系统中重复冗余数据的高效去重方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775376B2 (en) * 2011-06-30 2014-07-08 International Business Machines Corporation Hybrid data backup in a networked computing environment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102137157A (zh) * 2011-02-28 2011-07-27 浪潮(北京)电子信息产业有限公司 一种云存储系统及其实现方法
CN105072086A (zh) * 2015-07-06 2015-11-18 武汉科技大学 一种基于MapReduce的云存储批量审计方法
CN105068755A (zh) * 2015-07-08 2015-11-18 南京邮电大学 一种面向云计算内容分发网络的数据副本存储方法
CN105487818A (zh) * 2015-11-27 2016-04-13 清华大学 针对云存储系统中重复冗余数据的高效去重方法

Also Published As

Publication number Publication date
CN106612322A (zh) 2017-05-03

Similar Documents

Publication Publication Date Title
CN109617992B (zh) 一种基于区块链的边缘计算节点动态选举方法
CN102624922B (zh) 一种网络gis异构集群服务器负载均衡方法
KR101727525B1 (ko) 블록체인 기반 분산 저장 방법 및 이를 이용한 장치
CN104008152B (zh) 支持海量数据访问的分布式文件系统的架构方法
CN106612322B (zh) 云存储中一种存数据节点分布优化的数据恢复方法
CN107302561B (zh) 一种云存储系统中热点数据副本放置方法
CN109857710A (zh) 文件存储方法及终端设备
CN103763363B (zh) 一种云存储系统及基于该系统的文件副本部署方法
CN105791288B (zh) 基于并行多路径的关键虚拟链路防护方法
CN111597077B (zh) 数据处理方法、装置、计算机设备以及存储介质
CN107589992A (zh) 一种基于群体智能的容器化应用负载调度方法
CN103441918A (zh) 一种自组织集群服务器系统及其自组织方法
CN103281374A (zh) 一种云存储中数据快速调度的方法
CN103918239A (zh) 负载均衡方法、装置、系统及计算机可读介质
CN109597903A (zh) 图像文件处理装置和方法、文件存储系统及存储介质
CN106209415A (zh) 一种虚拟网络映射方法及系统
CN115357351A (zh) 算力网络调度方法、装置、系统、设备及介质
CN115189908A (zh) 一种基于网络数字孪生体的随机攻击生存性评估方法
CN108566430A (zh) 一种数据分配方法
CN104869044B (zh) 一种虚拟网映射方法及装置
CN110380906A (zh) 一种大规模多维融合的虚拟网络映射方法
CN109617989A (zh) 用于负载分配的方法、装置、系统和计算机可读介质
CN104767822A (zh) 一种基于版本的数据存储方法
CN107612980B (zh) 一种结构化p2p网络中可调节且可靠的一致性维护方法
CN106936706A (zh) 路由建立方法和系统及子域控制器、主控制器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190625

Address after: 361000 No. A303, Vanke City, Haicang District, Xiamen City, Fujian Province

Applicant after: Lin Chenyi

Address before: Room 1101, Electronic Information Industry Building, Chenghua District, Chengdu City, Sichuan Province

Applicant before: SICHUAN YONGLIAN INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190912

Address after: Room 015, 9th floor, 10 Building, Yunmicheng, 19 Ningshuang Road, Yuhuatai District, Nanjing City, Jiangsu Province, 210000

Applicant after: Nanjing Buijian Information Technology Co.,Ltd.

Address before: 361000 No. A303, Vanke City, Haicang District, Xiamen City, Fujian Province

Applicant before: Lin Chenyi

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20191011