CN102075582B - 一种可信的云存储系统数据存储模型的存储方法 - Google Patents

一种可信的云存储系统数据存储模型的存储方法 Download PDF

Info

Publication number
CN102075582B
CN102075582B CN 201110027596 CN201110027596A CN102075582B CN 102075582 B CN102075582 B CN 102075582B CN 201110027596 CN201110027596 CN 201110027596 CN 201110027596 A CN201110027596 A CN 201110027596A CN 102075582 B CN102075582 B CN 102075582B
Authority
CN
China
Prior art keywords
node
data
summit
storage
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201110027596
Other languages
English (en)
Other versions
CN102075582A (zh
Inventor
曹杰
伍之昂
张圣
王有权
方仓健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
Nanjing University of Finance and Economics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Finance and Economics filed Critical Nanjing University of Finance and Economics
Priority to CN 201110027596 priority Critical patent/CN102075582B/zh
Publication of CN102075582A publication Critical patent/CN102075582A/zh
Application granted granted Critical
Publication of CN102075582B publication Critical patent/CN102075582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种可信的云存储系统数据存储模型的存储方法,该方法根据结点在线时间与总时间的比值定义结点的可信度,使得该结点可信度最大、稳定性最好;根据用户与结点之间的可利用带宽以及是否有用户所请求的文件定义数据访问时间,使得数据访问时间最小,并保证各个结点存储的数据总量不超过其存储空间;该启发式求解策略降低了数据平均访问时间,而且平均可信度随着调度数据数量的增大,逐步趋于稳定。本发明成果提高了数据的可靠性和访问的高效性,并且确保了云存储系统的安全性和可信性,在云计算和可信计算领域具有重要的意义。

Description

一种可信的云存储系统数据存储模型的存储方法
技术领域
本发明属于云计算领域,具体地说是一种可信的云存储系统数据存储模型的存储方法。
背景技术
人类社会中的安全可信与网络空间(Cyberspace)中的安全可信休戚相关,只有解决了人类社会和网络空间的安全可信,才能保证人类社会的安全、和谐、繁荣和进步。
云存储是在云计算(Cloud Computing)概念上延伸和发展出来的一个新的概念,是指基于分布式文件系统,将“云”中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。 实际上,云存储系统也可以理解为一个以数据存储和管理为核心的云计算系统。
云存储系统通常将同一文件数据在多个结点上保留副本,以保证数据的可靠性。云存储系统集成了大量的存储结点,由于存储结点所在的地理位置和管理策略不同,存储结点的可信度存在极大的差异。因此,为确保数据的安全性和访问的高效性,云存储系统的数据存储策略需要考虑结点可信度,用结点可信度来度量各存储结点的可靠性,在确保较低数据访问时间的同时,还具有良好的数据的可靠性。
发明内容
本发明的目的是提供一种可信的云存储系统数据存储模型的存储方法,该方法提高了云存储系统数据的可靠性和访问的高效性,并且确保了云存储系统的安全性和可信性,在云计算和可信计算领域具有重要的意义。
本发明的目的是通过以下技术方案来实现的;
一种可信的云存储系统数据存储模型的存储方法,其特征在于:该方法包括根据结点在线时间与总时间的比值定义结点的可信度,使得该结点可信度最大、稳定性最好的第一阶段;根据用户与结点之间的可利用带宽以及是否有用户所请求的文件定义数据访问时间,使得数据访问时间最小的第二阶段,并保证各个结点存储的数据总量不超过其存储空间;具体要求如下:
1)第一阶段首先构造G个结点和结点间传输时间E的图Q(V, E),接着选择概率最大的Q个顶点,分别确定Q个顶点中可信度最大值C m 和对其余顶点加权平均访问时间的最小值T m ,最后计算出Q中每个顶点到其余Q-1个顶点的最短路径d (ij),将其权值作为顶点之间的访问时间;
2)第二阶段则是找出k个存储数据副本的结点,方法是构造局部最优向量(C m T m ),通过计算该向量的距离,通过反复迭代不断地去除距离最大的结点,直至找到k个存储数据副本的结点,即完成可信的云存储系统数据存储模型的存储。
本发明中,结点可信度定义要求如下:设有m个数据文本需要存储到系统中,系统共有N个存储结点供选择,每个文件需要在系统中存放k个副本,每个结点存储空间有限;结点可信度C i 为结点在线时间与总时间的比值,如式(1)所示结点可信度越高,表明该结点的稳定性越好,
Figure 2011100275960100002DEST_PATH_IMAGE001
                              (1)
其中 
Figure 2011100275960100002DEST_PATH_IMAGE002
 表示结点在线时间,
Figure 2011100275960100002DEST_PATH_IMAGE003
 表示总时间;
结点可信度最大,即:
            (3) 
数据访问时间定义要求如下:设i表示用户正在访问的结点,则文件f j (j=1…m)的访问时间可以定义为:
Figure 2011100275960100002DEST_PATH_IMAGE005
  (2)
其中b i 表示用户与结点i间的可利用带宽;d表示结点i是否有用户所请求的文件数据,若有则d=0,否则d=1;(max)b ij 表示若顶点i没有用户请求的文件数据,结点ik个副本所在顶点j中最大的可利用带宽。
数据访问时间最小,即:
Figure 2011100275960100002DEST_PATH_IMAGE006
                   (4)。
各个结点存储的文件数据总量不超过其存储空间。
本发明中,两阶段的启发式求解策略如下:
启发式求解策略可分为两个阶段:第一阶段首先构造G个结点和结点间传输时间E的图Q(V, E),接着选择概率最大的Q个顶点,分别确定Q个顶点中可信度最大值C m 和对其余顶点加权(连接的概率)平均访问时间的最小值T m ,最后利用Dijkstra算法计算出Q中每个顶点到其余Q-1个顶点的最短路径d (ij),将其权值作为顶点之间的访问时间。
第二阶段则是找出k个存储文件数据副本的结点,方法是构造局部最优向量(C m T m ),通过计算该向量的距离,然后反复迭代不断地去除距离最大的结点,直至找到k个存储文件数据副本的结点。
本发明通过提出结点可信度的定义和数据访问时间的定义,提出云存储系统数据存储模型及其约束条件;基于该模型,提出基于贪心算法的求解策略。本发明提高了云存储系统数据的可靠性和访问的高效性,并且确保了云存储系统的安全性和可信性,在云计算和可信计算领域具有重要的意义。
附图说明
图1为本发明的具体实施框架图;
图2为本发明的启发式求解策略、Greedy算法和Hadoop的平均访问时间比较图;
图3为本发明的启发式求解策略、Greedy算法和Hadoop的平均可信度分布图。
具体实施方式
一种本发明所述的可信的云存储系统数据存储模型的存储方法,图1是本发明的具体实施框架图,该方法包括根据结点在线时间与总时间的比值定义结点的可信度,使得该结点可信度最大、稳定性最好的第一阶段;根据用户与结点之间的可利用带宽以及是否有用户所请求的文件定义数据访问时间,使得数据访问时间最小的第二阶段,并保证各个结点存储的数据总量不超过其存储空间;具体要求如下:
第一阶段首先构造G个结点和结点间传输时间E的图Q(V, E),接着选择概率最大的Q个顶点,分别确定Q个顶点中可信度最大值C m 和对其余顶点加权平均访问时间的最小值T m ,最后计算出Q中每个顶点到其余Q-1个顶点的最短路径d (ij),将其权值作为顶点之间的访问时间;
结点可信度定义要求如下:设有m个数据文本需要存储到系统中,系统共有N个存储结点供选择,每个文件需要在系统中存放k个副本,每个结点存储空间有限;结点可信度C i 为结点在线时间与总时间的比值,如式(1)所示结点可信度越高,表明该结点的稳定性越好,
Figure 230633DEST_PATH_IMAGE001
                              (1)
其中 
Figure 147773DEST_PATH_IMAGE002
 表示结点在线时间,
Figure 927511DEST_PATH_IMAGE003
 表示总时间;
结点可信度最大,即:
Figure 260403DEST_PATH_IMAGE004
            (3) 
第二阶段则是找出k个存储数据副本的结点,方法是构造局部最优向量(C m T m ),通过计算该向量的距离,通过反复迭代不断地去除距离最大的结点,直至找到k个存储数据副本的结点,即完成可信的云存储系统数据存储模型的存储。
数据访问时间定义要求如下:设i表示用户正在访问的结点,则文件f j (j=1…m)的访问时间可以定义为:
Figure 74775DEST_PATH_IMAGE005
    (2)
其中b i 表示用户与结点i间的可利用带宽;d表示结点i是否有用户所请求的文件数据,若有则d=0,否则d=1;(max)b ij 表示若顶点i没有用户请求的文件数据,结点ik个副本所在顶点j中最大的可利用带宽。
数据访问时间T最小,即:
Figure 87118DEST_PATH_IMAGE006
                   (4)。
各个结点存储的文件数据总量不超过其存储空间。
具体步骤如下:
步骤1:选择用户经常访问的G个结点作为候选结点,每个结点用 (C i ,T i ) 向量表示,保证每个结点都拥有剩余存储空间。在这G个结点中找出可信度最大值C m 和访问时间最小值T m 。其中
Figure 2011100275960100002DEST_PATH_IMAGE007
构造图Q(V,E)。图Q中的顶点即候选的G个结点,边E上的权值表示结点间的数据传输时间,即结点间可利用带宽的倒数。利用Dijkstra算法求出图Q中每个顶点i到其他(G-1)个顶点的最短路径d (ij)。则
Figure 2011100275960100002DEST_PATH_IMAGE008
 
Figure 2011100275960100002DEST_PATH_IMAGE009
    步骤2:构造局部最优向量(C m T m )。
    步骤3:计算G个结点到局部最优向量的距离,去除其中距离最大的结点。
    步骤4:在剩余结点中按照步骤(1)重新计算局部最优向量,并计算结点到局部最优向量的距离,然后去除距离最大的结点。如此反复迭代直到剩余k个结点为止。这k个结点即为存储文件数据副本的结点。
步骤5:对每一个待存储的数据都执行步骤1至4。
图2为本发明的启发式求解策略、Greedy算法和Hadoop的平均访问时间比较图;其中Hadoop中的同一机架采用同一信任区域来模拟。图3为本发明的启发式求解策略、Greedy算法和Hadoop的平均可信度分布图。其中Hadoop中的同一机架采用同一信任区域来模拟,选择存储节点的个数5,10,15,20,25,30等多种情况下进行了任务的分配,在多次测试的基础之上给出相应结果的平均值。图2中,本发明的数据平均访问时间均低于Greedy算法和hadoop中所采用的策略,图3中,本发明平均可信度随着调度数据数量的增大,逐步趋于稳定,而其他两种算法的平均可信度随机摆动,稳定性较差。
本发明用结点可信度来度量各存储结点的可靠性,在确保较低数据访问时间的同时,还具有良好的数据的可靠性、安全性和访问的高效性。

Claims (1)

1.一种可信的云存储系统数据存储模型的存储方法,其特征在于:该方法包括根据结点在线时间与总时间的比值定义结点的可信度,使得该结点可信度最大、稳定性最好的第一阶段;根据用户与结点之间的可利用带宽以及是否有用户所请求的文件定义数据访问时间,使得数据访问时间最小的第二阶段,并保证各个结点存储的数据总量不超过其存储空间;具体要求如下:
1)第一阶段首先构造G个结点和结点间传输时间E的图Q(V, E),接着选择用户访问概率最大的Q个顶点,分别确定Q个顶点中可信度最大值C m 和对其余顶点加权平均访问时间的最小值T m ,最后计算出Q个顶点中每个顶点到其余Q-1个顶点的最短路径d (ij),将其权值作为顶点之间的路径,确定访问时间;
选择用户经常访问的G个结点作为候选结点,每个结点用 (C i ,T i ) 向量表示,保证每个结点都拥有剩余存储空间;在这G个结点中找出可信度最大值C m 和访问时间最小值T m
结点可信度定义要求如下:设有m个数据文本需要存储到系统中,系统共有N个存储结点供选择,每个文件需要在系统中存放k个副本,每个结点存储空间有限;结点可信度C i 为结点在线时间与总时间的比值,如式(1)所示,结点可信度越高,表明该结点的稳定性越好,
Figure 2011100275960100001DEST_PATH_IMAGE002A
                              (1)
其中 
Figure DEST_PATH_IMAGE004A
 表示结点在线时间,
Figure DEST_PATH_IMAGE006A
 表示总时间;
数据访问时间定义要求如下:设i表示用户正在访问的结点,则文件f j (j=1…m)的访问时间可以定义为:
                     (2)
其中b i 表示用户与结点i间的可利用带宽;d表示结点i是否有用户所请求的文件数据,若有则d=0,否则d=1;(max)b ij 表示若顶点i没有用户请求的文件数据,结点ik个副本所在顶点j中最大的可利用带宽;
结点可信度最大,即:
Figure DEST_PATH_IMAGE010A
                                      (3)
数据访问时间最小,即:
                   (4)。
CN 201110027596 2011-01-26 2011-01-26 一种可信的云存储系统数据存储模型的存储方法 Active CN102075582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110027596 CN102075582B (zh) 2011-01-26 2011-01-26 一种可信的云存储系统数据存储模型的存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110027596 CN102075582B (zh) 2011-01-26 2011-01-26 一种可信的云存储系统数据存储模型的存储方法

Publications (2)

Publication Number Publication Date
CN102075582A CN102075582A (zh) 2011-05-25
CN102075582B true CN102075582B (zh) 2013-03-13

Family

ID=44033923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110027596 Active CN102075582B (zh) 2011-01-26 2011-01-26 一种可信的云存储系统数据存储模型的存储方法

Country Status (1)

Country Link
CN (1) CN102075582B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102724294B (zh) * 2012-05-24 2014-12-24 中国科学院深圳先进技术研究院 数据分布存储方法和系统
CN103617083B (zh) * 2013-10-31 2019-02-15 中兴通讯股份有限公司 存储调度方法和系统、作业调度方法和系统及管理节点
CN106161599A (zh) * 2016-06-24 2016-11-23 电子科技大学 一种存在数据依赖关系时降低云存储整体开销的方法
CN110209666B (zh) * 2019-04-04 2020-01-31 特斯联(北京)科技有限公司 一种数据存储方法及终端设备
CN114006914B (zh) * 2021-12-28 2022-03-22 深圳市华盛智联科技有限公司 文件副本的云安全存储方法、系统、介质及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101197026A (zh) * 2007-12-20 2008-06-11 浙江大学 高性能访问控制系统中资源及其访问控制策略的设计与存储方法
US8769049B2 (en) * 2009-04-24 2014-07-01 Microsoft Corporation Intelligent tiers of backup data
CN101645038A (zh) * 2009-05-20 2010-02-10 中国科学院声学研究所 基于彼特森的网络存储结构的数据存储方法

Also Published As

Publication number Publication date
CN102075582A (zh) 2011-05-25

Similar Documents

Publication Publication Date Title
Wang et al. Load balancing task scheduling based on genetic algorithm in cloud computing
CN102075582B (zh) 一种可信的云存储系统数据存储模型的存储方法
Wang et al. Virtual network embedding by exploiting topological information
US7548843B2 (en) Simulation of distributed networks
CN103455531B (zh) 一种支持高维数据实时有偏查询的并行索引方法
CN102158417A (zh) 实现多约束QoS路由选择的优化方法及装置
CN104142888A (zh) 一种有状态协议的规则化状态机模型设计方法
CN102506886B (zh) 导航设备中实现路径规划的方法
CN103793483B (zh) 基于时钟节点结群的时钟树生成方法和系统
CN103914556A (zh) 大规模图数据处理方法
CN104202253A (zh) 基于动态路由表的片上网络拥塞控制方法
CN103838831A (zh) 一种基于社区划分的在线社交网络海量数据存储方法
CN105162654A (zh) 一种基于局部社团信息的链路预测方法
CN104917659A (zh) 一种基于虚拟网络连接特性的虚拟网络映射方法
CN111510334B (zh) 一种基于粒子群算法的vnf在线调度方法
CN110084865B (zh) 一种离散点分级加权拟合规则格网的方法
Feng et al. Topology-aware virtual network embedding through the degree
Lei et al. Web service composition based on reinforcement learning
CN102833326A (zh) 一种基于灰色预测的云存储负载均衡方法
CN103746894A (zh) 一种基于地理位置约束的批量虚拟网络映射方法
Seo et al. An efficient hardware architecture of the A-star algorithm for the shortest path search engine
Li et al. Analysis of the challenges and solutions of building a smart city
CN106209683B (zh) 基于数据中心广域网的数据传输方法及系统
CN106709045A (zh) 分布式文件系统中节点选择方法及装置
CN108009099B (zh) 一种应用于K-Mean聚类算法中的加速方法及其装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20110525

Assignee: Elefirst Science & Tech. Co., Ltd.

Assignor: Nanjing University of Finance and Economics

Contract record no.: 2016320000036

Denomination of invention: Storage method for data storage model of credible cloud storage system

Granted publication date: 20130313

License type: Exclusive License

Record date: 20160229

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EC01 Cancellation of recordation of patent licensing contract

Assignee: Elefirst Science & Tech. Co., Ltd.

Assignor: Nanjing University of Finance and Economics

Contract record no.: 2016320000036

Date of cancellation: 20170123

EC01 Cancellation of recordation of patent licensing contract
TR01 Transfer of patent right

Effective date of registration: 20201201

Address after: 210000 No. 20 West Beijing Road, Jiangsu, Nanjing

Patentee after: STATE GRID JIANGSU ELECTRIC POWER Co.,Ltd. INFORMATION & TELECOMMUNICATION BRANCH

Address before: 210003 No. 128 North Railway Street, Jiangsu, Nanjing

Patentee before: NANJING University OF FINANCE AND ECONOMICS

TR01 Transfer of patent right