CN103095832A - 一种基于通信可靠性的分布式存储方法 - Google Patents
一种基于通信可靠性的分布式存储方法 Download PDFInfo
- Publication number
- CN103095832A CN103095832A CN2013100147228A CN201310014722A CN103095832A CN 103095832 A CN103095832 A CN 103095832A CN 2013100147228 A CN2013100147228 A CN 2013100147228A CN 201310014722 A CN201310014722 A CN 201310014722A CN 103095832 A CN103095832 A CN 103095832A
- Authority
- CN
- China
- Prior art keywords
- risk
- storage
- backup
- path
- distributed storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于通信可靠性的分布式存储方法,该发明由网络结构分析模块、通信及流量风险分离分析模块、数据分布式存储风险分离分析模块组成,提出了备份存储路径概念,备份存储路径风险分离方法,数据服务器风险分离方法,可减少备份之间的存取风险。该发明可应用于分布式存储系统的文件备份存储、文件容灾、文件存储风险分离。
Description
技术领域
本发明涉及一种基于通信可靠性的分布式存储方法,通过使用分布式存储系统的网络结构的分析、通信及流量风险分离策略、数据分布式存储风险分离策略三部分,以减少分布式存储系统的文件备份之间的存取风险,属于信息技术领域。
背景技术
互联网、互联网企业等产生了海量的数据,这些海量数据的存储需要超级的数据中心,数据中心采用集群的方式进行分布式存储这些海量数据。目前分布式存储系统有HDFS(Hadoop DistributedFile System)、MogileFS(Mogile File System)、NAS(NetworkAttached Storage)、NFS(Network File System)等。
通过对上述分布式存储系统的分析发现,为了提高分布式存储系统的可靠性,这些系统在功能上一般支持文件的双备份和多备份。当文件的其中一个备份出现故障,另外一个文件备份就会被激活并提供服务,以替换出现故障的那个文件备份。多个文件备份能提高系统的可靠性,但如果多个备份存在同一个服务器上,服务器故障对分布式存储系统的可靠性是致命的,这样的存储策略可能使多个备份同时故障。在另一方面,即使多个备份在不同的服务器上,但如果这些服务器连接到同一个网络节点上,那么该网络节点的故障对于在线服务的分布式存储系统也是致命的。为了从高层次上提高分布式存储系统的可靠性,尤其是在线服务的分布式存储系统,研究人员必须考虑分布式存储系统的网络结构风险、通信流量风险和存储风险。
在分布式存储系统中,网络结构与服务性能、可靠性、流量风险都是直接相关的。从网络通信风险的角度看,星型结构的网络风险最大,中心交换机的故障直接导致分布式存储系统的瘫痪。对于网状结构网络、冗余备份网络,如果存储、通信不当也会存在同样的问题。为此,针对网状结构网络、冗余备份网络,本专利建议一种基于通信可靠性的分布式存储方法。
专利“一种基于通信可靠性的分布式存储方法”通过使用分布式存储系统的网络结构分析策略、通信及流量风险分离策略、数据分布式存储风险分离策略三部分,以提高分布式存储系统的可靠性和容错能力。
发明内容
本发明“一种基于通信可靠性的分布式存储方法”由三部分组成,它们是网络结构分析模块、通信及流量风险分离分析模块、数据分布式存储风险分离分析模块。下面详细介绍“一种基于通信可靠性的分布式存储方法”的结构、各个组成部分和执行流程。
(1)本发明形成的分布式存储系统结构及应用环境
为了实现本发明“一种基于通信可靠性的分布式存储方法”,要求对现有的分布式存储系统进行修改,本发明形成的分布式存储系统如图1所示。具体修改内容包括如下:
●本发明形成的分布式存储系统包含元数据服务器(Meta Server)、数据服务器(Data Server),其中元数据服务器和应用服务器在同一个区域,挂接在同一个边缘交换机上。
●本发明形成的分布式存储系统的元数据服务器具有获知集群网络的拓扑结构的能力,包括人工配置拓扑结构信息,其拓扑结构信息包括节点IP地址、端口速率、相互之间的链路关系等。
●本发明形成的分布式存储系统的数据服务器必须位于不同的区域,每个区域的数据服务器挂接到对应的边缘服务器上,这种挂接方式可以避免网络流量拥塞和网络故障风险。
●本发明形成的分布式存储系统的集群核心网络需要有网络冗余备份,网络冗余备份可以高度体现本发明的优势。
(2)本发明的三个组成部分
本发明“一种基于通信可靠性的分布式存储方法”由三个模块组成,本发明的组成如图2所示,它由网络结构分析模块、通信及流量风险分离分析模块、数据分布式存储风险分离分析模块组成。
●网络结构分析模块:该模块有两个功能,一是通过人工配置等措施获取网络结构信息,这些信息包括网络节点、数据服务器位置等信息。该模块另外一个功能是对应用程序提供的存储需求提供网络通信路径(这里称为“存储路径”)的计算。
●通信及流量风险分离分析模块:在应用程序对单个文件有多个备份存储需求的情况下,在网络结构分析模块中找到了其中一个备份(称为“第一备份”)的存储路径后,该模块依据第一份备存储路径,采用通信及流量风险分离算法,该模块计算出第二备份的存储路径。
●数据分布式存储风险分离分析模块:在通信及流量风险分离分析模块找到第二备份的存储路径后,该模块依据服务器存储情况和第二备份的存储路径,找到第二备份的数据分布式存储风险分离服务器。
(3)本发明各模块的执行流程
为了说明本发明执行流程,从文件的两个备份存储的过程描述本发明各模块之间的关系和本发明的执行流程,本发明分成三个阶段:第一备份路径的计算阶段、第二备份路径的计算阶段和数据服务器确定阶段。本发明的具体执行流程如下:
●第一备份路径的计算阶段:应用程序需要把文件的两个备份写入数据中心的两个服务器。应用程序首先把“请求”提交给网络结构分析模块,网络结构分析模块依据“请求”,根据收集起来的网络拓扑信息,采用最短路径计算(Shortest Path First)方法,计算出第一备份的存储路径。第一备份的存储路径如图3所示。
●第二备份路径的计算阶段:网络结构分析模块依据“请求”计算出第一备份存储路径后,提交给通信及流量风险分离分析模块。通信及流量风险分离分析模块依据“风险分离算法”计算出多条第二备份存储路径。
“风险分离算法”的执行流程分两步,第一步通信及流量风险分离分析模块在拓扑图中去除第一备份存储路径的链路。第二步,在第一步余下的拓扑中采用“最短路径”计算出多条第二备份存储路径。
图4中是第二备份的两条存储路径(采用虚线表示)。可以看出第二备份的两条存储路径和第一备份的存储路径没有共同的链路,说明第一备份和第二备份在通信风险和流量上是分离的,有利于规避通信风险和平衡流量。
●数据服务器确定阶段:依据图4的第二备份的存储路径,数据分布式存储风险分离分析模块找出第二备份的存储数据服务器,检查第一备份存储数据服务器和第二备份存储数据服务器之间的关系,依据存储风险分离原则,找到第二备份存储数据服务器。
存储风险分离原则是一种检查原则,在这里,指第一备份和第二备份不能存储在同一个区域的服务器,这样可以实现存储风险分离。依据该原则,在图4的两个第二备份存储路径中,发现两个第二备份的存储数据服务器B和C,但数据服务器C和第一备份的存储数据服务器在同一个区域,存在共同的风险,C不适合作为第二备份的存储数据服务器,而B和第一备份存储数据服务器在不同的区域,B适合作为第二备份存储数据服务器。
(4)本发明的特点
本发明涉及两个方法:通信及流量风险分离方法、数据服务器分布式存储风险分离方法;下面详细说明两种方法及其特点:
●通信及流量风险分离方法:该方法把第一备份和第二备份的数据存储分布到不同的存储路径上,该算法避免了网络通信风险。
●数据分布式存储风险分离方法:该方法把第一备份和第二备份的数据存储到风险分离的两台数据服务器上,该方法能够实现多备份存储到不同风险区域的机制,避免了服务器存储风险。
附图说明
图1是本发明形成的分布式存储系统示意图
图2是本发明的模块组成示意图
图3是第一备份的存储路径图
图4是第二备份的存储路径图
图5是分布式存储系统网络拓扑结构图
图6是文件F的第一备份存储路径图
图7是去除文件F的第一备份存储路径后的网络拓扑结构图
图8是文件F的第二备份存储路径图
图9是文件F的第二备份存储路径权重排序图
图10是重选的第二备份存储路径图
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例也仅仅是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
假设位于应用服务器上的应用程序P需要把文件F存储到分布式存储系统中,应用程序P要求分布式存储系统把文件F存储两个备份F1和F2到数据服务器中,其中F1为文件F的第一备份,F2为文件F的第二备份。在服务过程中,应用程序P优先访问文件F的第一备份,访问路径为第一备份存储路径。当应用程序P通过第一备份存储路径访问F1出现故障时,应用程序P应能够通过第二备份存储路径访问F2。
假设分布式存储系统的网络结构如图5所示,应用程序P部署在应用程序服务器A上,根据上述要求,应用程序P向元数据服务器中的网络结构分析模块首先提出请求,网络结构分析模块接受请求,进入本发明的第一备份存储路径计算阶段。
在文件F的第一备份存储路径计算阶段,元数据服务器中的网络结构分析模块,依据图5的拓扑结构,采用最短路径计算方法,即在网络拓扑结构中找出从应用服务器A到其它数据服务器之间网络链接权重之和最小的路径,计算出文件F的第一备份存储路径。文件F的第一备份存储路径如图6所示,文件F的第一备份存储路径这里标识为(A-A1),此路径表明,文件F的第一备份F1将存储在数据服务器A1中,A1为备选数据服务器。
计算完第一备份存储路径后,元数据服务器的通信及流量风险分离分析模块为文件F计算第二备份存储路径。通信及流量风险分离分析模块首先在图5中的网络拓扑结构中去除第一备份存储路径,即得到如图7所示的网络拓扑结构。
通信及流量风险分离分析模块依据图7的拓扑结构,采用最短路径计算方法,计算出文件F的第二备份存储路径。第二备份存储路径如图8所示,这里用(A-B1)所示,即采用数据服务器B1(B1为备选数据服务器)来存储文件F的第二备份F2。
通信及流量风险分离分析模块计算完文件F的第二备份存储路径后,数据分布式存储风险分离分析模块来确定备份存储的数据服务器,进入数据服务器确定阶段。数据分布式存储风险分离分析模块依据候选数据服务器A1和B1是否在同一区域、同一个服务器等确定风险和流量拥塞,在本例中,候选的数据服务器A1和B1在同一个区域,存在共同的区域的风险和网络风险,故候选数据服务器B1不合适,那么进入第二次查找第二备份存储路径。
在第二次查找第二备份存储路径中,通信及流量风险分离分析模块在图7中挑选出路径权重排序中第二的路径。假设存储路径权重排序如图9,则路径(A-B2)为选为第二备份存储路径。
通信及流量风险分离分析模块选择好第二备份存储路径后,数据分布式存储风险分离分析模块来挑选第二备份的数据服务器,经分析,重选的第二备份存储路径(A-B2)位置如图10所示,B2和A1位于不同区域,且应用程序P对上述两个备份的存储在路径上没有共同的风险,那么数据服务器B2被选为第二备份F2的存储数据服务器。
Claims (1)
1.本发明涉及一种基于通信可靠性的分布式存储方法,该发明应用于分布式存储系统中,以减少备份之间的存取风险。
本发明的主要特点及权利要求有:
(1)本发明由网络结构分析模块、通信及流量风险分离分析模块、数据分布式存储风险分离分析模块组成。
(2)本发明引出的存储路径、存储路径计算方法、存储路径风险分离方法。
(3)本发明引出的数据服务器风险分离方法、区域风险分离方法、数据分布式存储风险分离方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013100147228A CN103095832A (zh) | 2013-01-15 | 2013-01-15 | 一种基于通信可靠性的分布式存储方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013100147228A CN103095832A (zh) | 2013-01-15 | 2013-01-15 | 一种基于通信可靠性的分布式存储方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103095832A true CN103095832A (zh) | 2013-05-08 |
Family
ID=48207955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013100147228A Pending CN103095832A (zh) | 2013-01-15 | 2013-01-15 | 一种基于通信可靠性的分布式存储方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103095832A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104133734A (zh) * | 2014-07-29 | 2014-11-05 | 中国航空无线电电子研究所 | 分布式综合模块化航空电子系统混合式动态重构系统与方法 |
WO2018090585A1 (zh) * | 2016-11-21 | 2018-05-24 | 平安科技(深圳)有限公司 | 数据虚拟化存储方法、装置、服务器和存储介质 |
CN108156189A (zh) * | 2016-12-02 | 2018-06-12 | 航天星图科技(北京)有限公司 | 一种多节点系统中冗余数据处理方法 |
CN114785662A (zh) * | 2022-03-30 | 2022-07-22 | 新华三信息技术有限公司 | 一种存储管理方法、装置、设备及机器可读存储介质 |
CN118113526A (zh) * | 2024-04-02 | 2024-05-31 | 深圳市爱瑞古德科技有限公司 | 提高数据中心容灾能力的分布式数据存储规划方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101645039A (zh) * | 2009-06-02 | 2010-02-10 | 中国科学院声学研究所 | 一种基于彼得森图的数据存储和读取方法 |
CN102142006A (zh) * | 2010-10-27 | 2011-08-03 | 华为技术有限公司 | 分布式文件系统的文件处理方法及装置 |
CN102752381A (zh) * | 2012-06-28 | 2012-10-24 | 北京邮电大学 | 一种应用于分布式存储的多活动副本机制及其存取方法 |
-
2013
- 2013-01-15 CN CN2013100147228A patent/CN103095832A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101645039A (zh) * | 2009-06-02 | 2010-02-10 | 中国科学院声学研究所 | 一种基于彼得森图的数据存储和读取方法 |
CN102142006A (zh) * | 2010-10-27 | 2011-08-03 | 华为技术有限公司 | 分布式文件系统的文件处理方法及装置 |
CN102752381A (zh) * | 2012-06-28 | 2012-10-24 | 北京邮电大学 | 一种应用于分布式存储的多活动副本机制及其存取方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104133734A (zh) * | 2014-07-29 | 2014-11-05 | 中国航空无线电电子研究所 | 分布式综合模块化航空电子系统混合式动态重构系统与方法 |
WO2018090585A1 (zh) * | 2016-11-21 | 2018-05-24 | 平安科技(深圳)有限公司 | 数据虚拟化存储方法、装置、服务器和存储介质 |
CN108156189A (zh) * | 2016-12-02 | 2018-06-12 | 航天星图科技(北京)有限公司 | 一种多节点系统中冗余数据处理方法 |
CN108156189B (zh) * | 2016-12-02 | 2019-03-08 | 中科星图股份有限公司 | 一种多节点系统中冗余数据处理方法 |
CN114785662A (zh) * | 2022-03-30 | 2022-07-22 | 新华三信息技术有限公司 | 一种存储管理方法、装置、设备及机器可读存储介质 |
CN114785662B (zh) * | 2022-03-30 | 2023-06-13 | 新华三信息技术有限公司 | 一种存储管理方法、装置、设备及机器可读存储介质 |
CN118113526A (zh) * | 2024-04-02 | 2024-05-31 | 深圳市爱瑞古德科技有限公司 | 提高数据中心容灾能力的分布式数据存储规划方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107111457B (zh) | 跨集群冗余配置中的非间断的控制器替换 | |
EP3014446B1 (en) | Asynchronous message passing for large graph clustering | |
EP2883147B1 (en) | Synchronous local and cross-site failover in clustered storage systems | |
US20140244578A1 (en) | Highly available main memory database system, operating method and uses thereof | |
CN109828868B (zh) | 数据存储方法、装置、管理设备和双活数据存储系统 | |
CN101577735B (zh) | 一种接管故障元数据服务器的方法、装置及系统 | |
EP3224746B1 (en) | System and method for massively parallel processing database | |
CN102938705B (zh) | 一种高可用多机备份路由表管理与切换方法 | |
CN106506588A (zh) | 多地多中心的数据中心双活方法和系统 | |
CN103095832A (zh) | 一种基于通信可靠性的分布式存储方法 | |
CN109819004B (zh) | 用于部署多活数据中心的方法和系统 | |
EP2643771B1 (en) | Real time database system | |
WO2012145963A1 (zh) | 数据管理系统及方法 | |
CN103942112A (zh) | 磁盘容错方法、装置及系统 | |
CN114301972B (zh) | 一种基于云边协同的区块链节点分级部署方法和系统 | |
CN110784539A (zh) | 一种基于云计算的数据管理系统及方法 | |
CN105554074A (zh) | 一种基于rpc通信的nas资源监控系统及监控方法 | |
CN104239548A (zh) | 数据库容灾系统和数据库容灾方法 | |
CN102780769A (zh) | 一种基于云计算平台的容灾存储方法 | |
CN113220235A (zh) | 读写请求的处理方法、装置、设备及存储介质 | |
CN105959145B (zh) | 一种适用高可用性集群的并行管理服务器的方法及系统 | |
CN106254161A (zh) | 基于hdfs的节点失效的快速检测与恢复方法及系统 | |
CN109165122B (zh) | 一种提升基于区块链技术实现的应用系统同城多园区部署灾备能力的方法 | |
CN106844052A (zh) | 一种基于Windows Server构建融合集群的方法及装置 | |
Anderson et al. | Local recovery for high availability in strongly consistent cloud services |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130508 |