CN108459926A - 数据异地备份方法、装置及计算机可读介质 - Google Patents

数据异地备份方法、装置及计算机可读介质 Download PDF

Info

Publication number
CN108459926A
CN108459926A CN201810159776.6A CN201810159776A CN108459926A CN 108459926 A CN108459926 A CN 108459926A CN 201810159776 A CN201810159776 A CN 201810159776A CN 108459926 A CN108459926 A CN 108459926A
Authority
CN
China
Prior art keywords
communication
node
communication node
telecommunication link
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810159776.6A
Other languages
English (en)
Other versions
CN108459926B (zh
Inventor
胡柯东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd
Original Assignee
New H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Technologies Co Ltd filed Critical New H3C Technologies Co Ltd
Priority to CN201810159776.6A priority Critical patent/CN108459926B/zh
Publication of CN108459926A publication Critical patent/CN108459926A/zh
Application granted granted Critical
Publication of CN108459926B publication Critical patent/CN108459926B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/63Routing a service request depending on the request content or context

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了数据异地备份方法,涉及数据备份领域。本发明提供的分布式存储系统的数据异地方法,首先由一个分布式存储系统中的第一调度节点获取远程通讯链路建立规则;而后第一调度节点按照远程通讯链路建立规则控制至少两个第一通讯节点分别与不同的第二通讯节点建立远程通讯链路,其中,每个第二通讯节点均属于同一个第二分布式存储系统中;最后,再由第一调度节点控制建立好远程通讯链路的至少两个第一通讯节点并行的向第二通讯节点发送备份数据,进而通过这种并行的发送方式,提高了发送的效率,缩短了发送的时间,进而在网络状况不好的情况下,间接的提高了发送的成功率。

Description

数据异地备份方法、装置及计算机可读介质
技术领域
本发明涉及数据备份领域,具体而言,涉及数据异地备份方法、装置及存储介质。
背景技术
随着网络数据技术的发展,电子数据的数量呈现出了爆炸式的增长,进而,数据的存储成了首先遇到的问题。为了提高数据的使用便捷程度,以及数据的安全程度,某些情况下,用户通常首选使用分布式存储系统来进行数据的存储。
相对于集中式存储而言,分布式存储系统的一个主要特点是冗余存储,冗余存储指的是对于数据A而言,同时存储在至少两个存储节点(如服务器)上,进而当某一个存储节点出现故障(如硬盘损坏、被病毒入侵),导致该存储节点无法向用户提供数据的时候,用户还可以通过另一个存储节点来读取到数据A,以此来保证数据的安全。
上述内容介绍的是服务器级别的分布式存储,这些服务器均是属于同一个分布式存储系统中的,在此基础上,相关技术中还出现了系统级的异地容灾系统。异地容灾系统包括至少两个分布式存储系统,数据不仅是在某一个分布式存储系统内部进行冗余存储,还会同时存储在两个分布式存储系统中,以实现系统级别的数据冗余。
进而,为了实现系统级别的数据容易,需要将数据从一个分布式存储系统备份给另一个分布式存储系统,但这个备份过程容易出现备份失败的情况。
发明内容
本发明的目的在于提供数据异地备份方法、装置及计算机可读介质。
第一方面,本发明实施例提供了数据异地备份方法,作用于第一分布式存储系统,第一分布式存储系统包括第一调度节点和多个第一通讯节点;任意两个第一通讯节点之间均通过近距离通讯链路进行连接;第一调度节点分别与每个第一通讯节点通过近距离通讯链路连接;
数据异地备份方法包括:
第一调度节点获取远程通讯链路建立规则;
第一调度节点按照远程通讯链路建立规则控制至少两个第一通讯节点分别与不同的第二通讯节点建立远程通讯链路;每个第二通讯节点均属于同一个第二分布式存储系统;第一通讯节点、第二通讯节点和远程通讯链路是一一对应的;
第一调度节点控制至少两个第一通讯节点通过对应的远程通讯链路并行的发送备份数据;至少两个第一通讯节点中不同的第一通讯节点所发出的备份数据不同。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,
通过以下方式确定至少两个第一通讯节点中的每个第一通讯节点所发出的备份数据:
第一调度节点获取每个远程通讯链路的传输权重值,每个传输权重值是根据以下的一个或多个参数确定的:每个远程通讯链路对应的第一通讯节点的通讯性能、每个远程通讯链路对应的第一通讯节点的当前负载、每个远程通讯链路对应的第二通讯节点的通讯性能和每个远程通讯链路对应的第二传输节点的当前负载;
第一调度节点根据每个远程通讯链路的传输权重值,确定每个远程通讯链路对应的第一通讯节点所要发送的备份数据;每个远程通讯链路对应的第一通讯节点所要发送的备份数据的大小与对应的远程通讯链路的传输权重值呈正相关性。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,步骤第一调度节点根据每个远程通讯链路的传输权重值,确定每个远程通讯链路对应的第一通讯节点所要发送的备份数据包括:
第一调度节点计算全部远程通讯链路的传输权重值的最大公约数;
第一调度节点为每个目标第一通讯节点分配未分配的备份数据;目标第一通讯节点是传输权重值超过目标阈值的远程传输链路所对应的第一通讯节点;
第一调度节点判断是否还有未分配的备份数据;若是,则将目标阈值修改为目标阈值与最大公约数的差值,并重新执行步骤第一调度节点为每个目标第一通讯节点分配未分配的备份数据。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,至少一个远程通讯链路所对应的第一通讯节点和第二通讯节点的通讯性能是相同或相近的。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,同一个远程通讯链路所对应的第一通讯节点的第一排名和第二通讯节点的第二排名是相同或相近的,第一排名是指定的一个第一通讯节点的通讯性能在全部第一通讯节点中的通讯性能中的排名;第二排名是指定的一个第二通讯节点的通讯性能在全部第二通讯节点中的通讯性能中的排名。
第二方面,本发明实施例还提供了数据异地备份装置,作用于第一分布式存储系统,第一分布式存储系统包括第一调度节点和多个第一通讯节点;任意两个第一通讯节点之间均通过近距离通讯链路进行连接;第一调度节点分别与每个第一通讯节点通过近距离通讯链路连接;数据异地备份装置设置于第一调度节点中;
数据异地备份装置包括:
第一获取模块,用于获取远程通讯链路建立规则;
第一控制模块,用于按照远程通讯链路建立规则控制至少两个第一通讯节点分别与不同的第二通讯节点建立远程通讯链路;每个第二通讯节点均属于同一个第二分布式存储系统;第一通讯节点、第二通讯节点和远程通讯链路是一一对应的;
第二控制模块,用于控制至少两个第一通讯节点通过对应的远程通讯链路并行的发送备份数据;至少两个第一通讯节点中不同的第一通讯节点所发出的备份数据不同。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,该装置还包括:
第二获取模块,用于获取每个远程通讯链路的传输权重值,每个传输权重值是根据以下的一个或多个参数确定的:每个远程通讯链路对应的第一通讯节点的通讯性能、每个远程通讯链路对应的第一通讯节点的当前负载、每个远程通讯链路对应的第二通讯节点的通讯性能和每个远程通讯链路对应的第二传输节点的当前负载;
确定模块,用于根据每个远程通讯链路的传输权重值,确定每个远程通讯链路对应的第一通讯节点所要发送的备份数据;远程通讯链路对应的第一通讯节点所要发送的备份数据的大小与对应的远程通讯链路的传输权重值呈正相关性。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中,确定模块包括:
计算单元,用计算全部远程通讯链路的传输权重值的最大公约数;
分配单元,用于为每个目标第一通讯节点分配未分配的备份数据;目标第一通讯节点是传输权重值超过目标阈值的远程传输链路所对应的第一通讯节点;
判断单元,用于判断是否还有未分配的备份数据;若是,则将目标阈值修改为目标阈值与最大公约数的差值,并触发分配单元重新工作。
结合第二方面,本发明实施例提供了第二方面的第三种可能的实施方式,其中,至少一个远程通讯链路所对应的第一通讯节点和第二通讯节点的通讯性能是相同或相近的。
结合第二方面,本发明实施例提供了第二方面的第四种可能的实施方式,其中,同一个远程通讯链路所对应的第一通讯节点的第一排名和第二通讯节点的第二排名是相同或相近的,第一排名是指定的一个第一通讯节点的通讯性能在全部第一通讯节点中的通讯性能中的排名;第二排名是指定的一个第二通讯节点的通讯性能在全部第二通讯节点中的通讯性能中的排名。
第三方面,本发明实施例还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,该程序代码使所述处理器执行如第一方面任一项所述的数据异地备份方法。
本发明实施例提供的分布式存储系统的数据异地方法,首先由一个分布式存储系统中的第一调度节点获取远程通讯链路建立规则;而后,该第一调度节点按照远程通讯链路建立规则控制至少两个第一通讯节点分别与不同的第二通讯节点建立远程通讯链路,其中,每个第二通讯节点均属于同一个第二分布式存储系统中;最后,再由第一调度节点控制建立好远程通讯链路的至少两个第一通讯节点并行的向第二通讯节点发送备份数据,进而通过这种并行的发送方式,提高了发送的效率,缩短了发送的时间,进而在网络状况不好的情况下,间接的提高了发送的成功率。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了相关技术中的异地容灾系统的架构图;
图2示出了本发明实施例所提供的数据异地备份方法的系统架构示意图;
图3示出了本发明实施例所提供的数据异地备份方法的流程图;
图4示出了本发明实施例所提供的数据异地备份方法的异地容灾系统实例的系统架构图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
相关技术中,为了提高数据的安全性,通常会将数据存储在分布式存储系统中,这主要是利用了分布式存储系统的冗余特性。分布式存储技术在实现时可以分为两个层级,分别是服务器级别的分布式存储技术和系统级别的分布式存储技术(异地容灾系统)。下面,首先对服务器级别的分布式存储系统进行简要介绍。某种情况下,一个分布式存储系统是由多个服务器构成的,这多个服务器是接入到同一个局域网中的,即同一个分布式存储系统中的服务器是通过同一个局域网进行两两连接。冗余特性指的是,在使用分布式存储系统进行数据存储时,通常会将一份完整的数据分为多个数据块,每个数据块均会同时存储在至少两个服务器中,进而,当一个服务器出现故障,数据无法查找的时候,还可以从其他服务器中查找数据,以此来保证数据的安全性。
服务器级别的分布式存储能够使得同一个分布式存储系统中的某个服务器在损坏(数据无法读取)的时候,可以从该系统的另一个服务器中读取到数据。但当分布式存储系统所在地(如某个大楼)发生火灾或者其他灾难的时候,整个分布式存储系统中的服务器可能都会损坏,进而导致整个分布式存储系统中的数据都无法恢复了,针对该种情况,产生了系统级别的分布式存储技术,即异地容灾系统。通常,异地容灾系统由至少两个分布式存储系统组成,这两个分布式存储系统分别布置在不同的地区(即这两个系统空间上是相分离的,如两个分布式存储系统一个位于上海,一个位于北京;这两个分布式存储系统通过广域网连接),也就是对于同一份数据,不仅会冗余的存储在一个分布式存储系统中,还会同时冗余的存储在另一个分布式存储系统中,进而完成分布式存储系统之间的数据冗余,这样,即使某个地区的分布式存储系统出现了故障,也可以从另一个地区调取到需要的数据。
异地容灾系统在使用时,为了使得数据能够同时将数据存储在不同地区的分布式存储系统中,需要将一个分布式存储系统中的数据远程复制到另一个分布式存储系统中。如图1所示,示出了相关技术中的异地容灾系统,该异地容灾系统由分布式存储系统A和分布式存储系统B组成,分布式存储系统A由服务器A1、A2和A3组成,分布式存储系统B由服务器B1、B2和B3组成;数据X分别存储在服务器A1和服务器A2中,数据Y分别存储在服务器A2和服务器A3中;当需要将数据X和Y从分布式存储系统A备份到分布式存储系统B时,则可以由服务器A1与服务器B1建立传输链路,而后,服务器A1再将数据X发送给服务器B1,之后,服务器A1通过其所在的局域网从服务器A2处获取数据Y,而后再由服务器A1将数据Y发送给服务器B1,最后再由服务器B1按照既定的规则将数据X在分布式存储系统B中进行冗余存储,从而完成了服务器级别的分布式存储和系统级别的分布式存储。
但在实际使用中,发明人发现此种备份方式并不理想,主要体现在在服务器A1将数据X发送给服务器B1的过程中,可能会发生传输异常(比如,服务器A的网卡故障、丢包、网络阻塞),导致备份无法正常进行的情况,此时,两个服务器之间的备份无法继续进行,只能会采用人工操作的方式来重启备份,但这种人工纠正方式的时效性过低。
进而,发明人认为,某种情况下,造成上述问题的原因主要在于广域网的连接不够稳定(即两个分布式存储系统之间所建立的链路不够稳定,如上文中的例子而言,则是服务器A1和B1所建立的传输链路不够稳定),两个分布式存储系统之间传输数据的时间越长则传输失败的概率越大。
为解决上述情况中的问题,本申请发明人提供了数据异地备份方法。该数据异地备份方法作用于如图2所示的第一分布式存储系统,该第一分布式存储系统包括第一调度节点和多个第一通讯节点,任意两个第一通讯节点之间均通过近距离通讯链路进行连接;第一调度节点分别与每个第一通讯节点通过近距离通讯链路连接;
如图3所示,该方法包括:
步骤S101,第一调度节点获取远程通讯链路建立规则;
步骤S102,第一调度节点按照远程通讯链路建立规则控制至少两个第一通讯节点分别与不同的第二通讯节点建立远程通讯链路;每个第二通讯节点均属于同一个第二分布式存储系统;第一通讯节点、第二通讯节点和远程通讯链路是一一对应的;
步骤S103,第一调度节点控制至少两个第一通讯节点通过对应的远程通讯链路并行的发送备份数据;至少两个第一通讯节点中不同的第一通讯节点所发出的备份数据不同。
每个第一通讯节点均属于同一个的分布式存储系统(即第一分布式存储系统),每个第二通讯节点均是属于同一个分布式存储系统(即第二分布式存储系统),并且,第一分布式存储系统与第二分布式存储系统是不同的分布式存储系统。一般情况下,第一分布式存储系统和第二分布式存储系统是设置在不同地域的,或者是说这两个分布式存储系统所在的空间是相分离的(如第一分布式存储系统设置在北京,第二分布式存储系统设置在上海;或者,第一分布式存储系统设置在A市的第一个学校中,第二分布式存储系统设置在A市的另一个学校中)。通常情况下,所有第一通讯节点均是加入到同一个局域网(同一集群内的通讯节点通常通过双绞线或者光纤连接到企业级交换机上,从而形成局域网,或者是不同的通讯节点通过光纤连接)中的,进而,任意两个第一通讯节点可以通过近距离通讯链路进行数据的传输(通常,近距离通讯链路的数据传输速度比远程通讯链路的传输速度更快、更稳定)。类似的,通常情况下,所有第二通讯节点也均是加入到同一个局域网中的。也就是任意两个第二通讯节点之间也能够通过近距离通讯链路进行数据的传输。
第一调度节点的主要任务是进行任务分配和第一通讯节点的相关控制。第一调度节点也是通过近距离通讯链路与每个第一通讯节点连接的。
实际工作中,第一调度节点的主要作用是向第一通讯节点进行任务派发,比如第一调度节点会告知指定的一个第一通讯节点应当与哪个第二通讯节点建立远程通讯链路,以及第一调度节点会告知指定的一个第一通讯节点所要发送的备份数据的内容(也可以是备份数据的标识)。进而,通过任务的派发,使得第一调度节点完成控制第一通讯节点建立远程通讯链路的任务,以及完成控制至少两个第一通讯节点并行的发送备份数据的任务。
本方案中所记载的通讯节点(指第一通讯节点和第二通讯节点)指的是具有接入网络的能力,并且能够进行数据收发的设备。某种情况下,通讯节点可以是服务器。
上述步骤S101中,第一调度节点获取到的是远程通讯链路建立规则,该规则表示了通讯节点进行连接的方式(哪个第一通讯节点与哪个第二通讯节点之间进行连接)。具体而言,远程通讯链路建立规则有两种来源,下面分别进行说明。
第一种远程通讯链路建立规则的来源,该建立规则是由某个网络端(如用户端、其他服务器)预先生成,并存储在第一调度节点中。该种情况下,第一调度节点不需要自己进行计算,可以直接从该建立规则中获取到通讯节点的连接方式。比如,可以在第一调度节点中预存如下的表1的表格来标识远程通讯链路建立规则。
表1
远程通讯链路编号 第一通讯节点编号 第二通讯节点编号
1 A K
2 F V
3 H S
4 T W
按照表1中所示的连接方式,则第一通讯节点A和第二通讯节点K应当建立一条远程通讯链路;第一通讯节点F和第二通讯节点V应当建立一条远程通讯链路。
某种实现方式下,为了提高数据传输的效率,应当考虑第一通讯节点的通讯性能和第二通讯节点的通讯性能来确定建立规则,比如,远程通讯链路建立规则中记录了可以由通讯性能相同或相近的一个第一通讯节点和一个第二通讯节点建立远程通讯链路。也就是,建立规则中,至少一个远程通讯链路的所对应的第一通讯节点和第二通讯节点的通讯性能是相同或相近的。
第二种远程通讯链路建立规则的来源,该建立规则是由第一调度节点生成的。比如,第一调度节点可以先获取到每个第一通讯节点的通讯性能和每个第二通讯节点的通讯性能,之后第一调度节点根据第一通讯节点的通讯性能和第二通讯节点的通讯性能来生成远程通讯链路建立规则。与第一种获取方式相似的,某种实现方式下,为了保证数据传输的效率,应当由通讯性能相同或相近的一个第一通讯节点和一个第二通讯节点建立远程通讯链路。也就是,远程通讯链路建立规则中记录了,至少一个远程通讯链路的所对应的第一通讯节点和第二通讯节点的通讯性能是相同或相近的。
上述步骤S102中,一个通讯节点(指某一个第一通讯节点或某一个第二通讯节点)只能建立一个远程通讯链路(即一个通讯节点只与一个通讯链路所对应),比如第一通讯节点有节点A和节点B,第二通讯节点有节点C和节点D,那么可以是节点A和节点C建立通讯链路,以及,节点B和节点D建立通讯链路;或者是,节点A和节点D建立通讯链路,以及节点B和节点C建立通讯链路。即任何通讯节点只能通过其对应的一个通讯链路发送数据。也就是,建立远程通讯链路的第一通讯节点数量、第二通讯节点数量和远程通讯链路的数量均是相等的,并且,每个远程通讯链路均是与唯一的一个第一通讯节点相对应,且是与唯一的一个第二通讯节点相对应。
建立远程通讯链路的过程可以是由第一通讯节点主动向第二通讯节点发起的,也可以是第二通讯节点主动向第一通讯节点发起的。
步骤S103中,至少两个第一通讯节点中的每个第一通讯节点所发出的备份数据是不同的,这主要是因为本方案中第一分布式存储系统向第二分布式存储系统进行数据备份的时候,没有必要传送完全相同的数据。具体而言,如前文中的说明,同一个分布式存储系统的通讯节点之间是通过局域网进行通讯,不同分布式存储系统的通讯节点之间则是通过广域网进行通讯,由于局域网的通讯速度远大于广域网,因此,可以在成功发送数据后,由第二分布式存储系统内部进行冗余存储的处理(将同样的数据复制到不同的第二通讯节点中),这样能够提高整体的备份效率。进而,在步骤S103之后,第二通讯节点内部还可以进行冗余存储处理。
步骤S103之后,如果某个第一通讯节点发送备份数据失败,则第一调度节点将未发送成功的备份数据交给其他第一通讯节点进行发送即可。
本申请所提供的方案主要是采用了多链路协同备份的方式,将原本采用一条链路进行备份工作改为了使用至少两条链路进行备份,整体上提高了备份的效率,并且,针对广域网网络质量较差的情况,也提高了备份的成功率。
为了提高传输效率,缩短整体传输的时间,可以针对每条链路的传输性能来分配发送数据的数据量。
具体的,本申请所提供的分布式存储系统的数据异地备份方法还包括:
步骤201,第一调度节点获取每个远程通讯链路的传输权重值,传输权重值是根据以下的一个或多个参数确定的:第一通讯节点的通讯性能、第一通讯节点的当前负载、第二通讯节点的通讯性能和第二传输节点的当前负载;
步骤202,第一调度节点根据每个远程通讯链路的传输权重值,分别确定每个第一通讯节点所要发送的备份数据;第一通讯节点所要发送的备份数据的大小与第一通讯节点所对应的远程通讯链路的传输权重值呈正相关性。
其中,传输权重值可以根据第一通讯节点的通讯性能、第一通讯节点的当前负载、第二通讯节点的通讯性能和第二传输节点的当前负载这四个参数中的任意1个,或任意2个,或任意3个计算得出的(可以由第一调度节点计算传输权重值,也可是传输权重值是由其他模块计算之后发送给第一调度节点的),还可以是根据这四个参数计算得出的。其中,通讯性能主要是由通讯节点(第一通讯节点和第二通讯节点)的硬件所决定的,比如CPU的计算能力等。当前负载主要是由通讯节点的当前运行状态决定,比如当前CPU的使用率等。
也就是,传输权重值可以根据第一通讯节点的通讯性能计算得到;或,传输权重值可以根据第一通讯节点的当前负载计算得到;或,传输权重值可以根据第二通讯节点的通讯性能计算得到;或,传输权重值可以根据第二传输节点的当前负载计算得到;
还可以是,传输权重值可以根据第一通讯节点的通讯性能和第一通讯节点的当前负载计算得到;或,传输权重值可以根据第一通讯节点的通讯性能和第二通讯节点的通讯性能计算得到;或,传输权重值可以根据第一通讯节点的通讯性能和第二传输节点的当前负载计算得到;或,传输权重值可以根据第一通讯节点的当前负载和第二通讯节点的通讯性能计算得到;或,传输权重值可以根据第一通讯节点的当前负载和第二传输节点的当前负载计算得到;或,传输权重值可以根据第二通讯节点的通讯性能和第二传输节点的当前负载计算得到;
还可以是,传输权重值可以根据第一通讯节点的当前负载、第二通讯节点的通讯性能和第二传输节点的当前负载计算得到;或,传输权重值可以根据第一通讯节点的通讯性能、第二通讯节点的通讯性能和第二传输节点的当前负载计算得到;或,传输权重值可以根据第一通讯节点的通讯性能、第一通讯节点的当前负载和第二传输节点的当前负载计算得到;或,传输权重值可以根据第一通讯节点的通讯性能、第一通讯节点的当前负载和第二通讯节点的通讯性能计算得到;
还可以是,传输权重值可以根据第一通讯节点的通讯性能、第一通讯节点的当前负载、第二通讯节点的通讯性能和第二传输节点的当前负载计算得到。
具体在进行计算的时候,可以采取加权计算的方式来计算传输权重值,即,传输权重值可以按照加权计算的方式计算得到,第一通讯节点的通讯性能所对应的权值大于第二通讯节点的通讯性能所对应的权值;以及第一通讯节点的当前负载所对应的权值大于第二传输节点的当前负载所对应的权值。
需要说明的是,上述过程中的分配并不必然指的是将备份数据(或者是备份数据的存储位置/编号)发送给第一通讯节点,还可以是指确定分配计划(未发出)。
在步骤202执行完毕之后,第一调度节点可以将至少两个第一通讯节点中的每个第一通讯节点所要发送的备份数据发送给对应的第一通讯节点,或者是通过将至少两个第一通讯节点中的第一通讯节点所要发送的备份数据的存储位置/编号/索引发送给该第一通讯节点,而后,该第一通讯节点使用该存储位置/编号/索引到指定的存储区调取数据即可。
上述步骤201和步骤202是发生在步骤S102之后,以及步骤S103之前。通过为至少两个第一通讯节点中的每个第一通讯节点分配对应大小的备份数据,即,通讯能力越强的远程通讯链路承担的数据发送量越大,能够使得全部的备份数据能够更快的被传输完成。
第一通讯节点的通讯性能、第一通讯节点的当前负载可以是由第一调度节点自己收集到的;第二通讯节点的通讯性能和第二传输节点的当前负载可以是由第二分布式存储系统中的第二调度节点搜集到之后发送给第一调度节点的,也可以是第一通讯节点的通讯性能、第一通讯节点的当前负载、第二通讯节点的通讯性能和第二传输节点的当前负载均是由第一调度节点自己收集到的。
步骤202公开了按照远程通讯链路的传输权重值来分配备份数据的方式,更具体的,下面提供一种确定每个第一通讯节点所要发送的备份数据的方式,即步骤202包括:
步骤2021,第一调度节点计算全部(参与发送备份数据的)远程通讯链路的传输权重值的最大公约数;
步骤2022,第一调度节点为每个目标第一通讯节点分配未分配的备份数据(可以是分配预定大小或预定数量的未分配的备份数据,更具体的,可以是分配大小相同或数量相同的未分配的备份数据);目标第一通讯节点是传输权重值超过目标阈值的远程传输链路所对应的第一通讯节点;(目标阈值可以是所有远程传输链路的传输权重值的最大值);
步骤2023,第一调度节点判断是否还有未分配的备份数据,若否,则终止流程;若是,则将目标阈值修改为目标阈值与最大公约数的差值,并重新执行步骤2022。
为了提高分配的平均程度,还可以是在目标阈值较小的时候,重新调整目标阈值的大小,以达到平均分配备份数据的目的。具体实现时,当经过多轮遍历(重复执行多次步骤2022和步骤2023),使得目标阈值修改到预定数值(如修改到0)时,则将目标阈值恢复到第一次使用目标阈值时的数值。也就是,本申请所提供的方法中,第一调度节点在将目标阈值修改为目标阈值与最大公约数的差值后,还包括如下步骤:判断修改后的目标阈值是否小于预定数值(如0),若小于,则将目标阈值恢复为第一次使用目标阈值时的数值(如将目标阈值恢复为所有远程传输链路的传输权重值的最大值);若大于,则重新执行步骤2022。
上一段关于目标阈值大小的判断还可以是在步骤2023前执行,也就是,本申请所提供的方法中,在步骤2022后,还包括:判断目标阈值是否小于预定数值(如0.5等较小的数值),若小于,则将目标阈值恢复为第一次使用目标阈值时的数值(如将目标阈值恢复为所有远程传输链路的传输权重值的最大值);若大于,则执行步骤2023。
在执行步骤2022时,可以是给至少两个第一通讯节点中的每个目标第一通讯节点分配不同数量/大小的备份数据,也可以是给至少两个第一通讯节点中的每个第二远程通讯链路分配相同数量的备份数据。并且,可以是在步骤2022中为至少两个第一通讯节点中的每个目标第一通讯节点分配完备份数据后,再执行步骤2023。如果在执行步骤2022的过程中,备份数据已经分配完毕,则终止当前流程,可以不再执行步骤2023;也可以是在执行步骤2022的过程中,备份数据已经分配完毕,则直接跳转到步骤2023。
上述步骤2021-2023在执行的过程中,步骤2021和步骤2022并无绝对的先后关系,步骤2021在步骤2023使用最大公约数的数值前,执行完步骤2021即可。
目前,大部分分布式存储系统中是按照数据块的方式来存储数据的,因此,可以在将数据块作为备份数据分配给每个目标第一通讯节点,并且,将每个数据块的大小设置为相同的情况,以提高分配的平均程度和分配效率。进而,作为优选的方案,可以按照如下方式执行步骤2022:
为每个目标第一通讯节点分别分配相同数量的备份数据块;每个备份数据块的大小是相同的。
通过将每个备份数据块设置为相同的大小,可以提高分配的准确度和效率。为了降低出错概率,每次优选给一个第一通讯节点分配1个备份数据块。
和备份数据平均分配给每个目标第一通讯节点的方式相比,采用上述迭代分配的方式能够使得传输权重值越大的远程传输链路所对应的第一通讯节点被分配到更多的备份数据,从而使得传输权重值较大的远程传输链路承担更多的备份数据,进而使得整体的传输时间尽量缩小。同时,使用传输权重值的最大公约数来调整目标阈值,能够将方案进一步优化。这主要是考虑到,最大公约数是所有传输权重值能除尽的最大数,每轮次递减这个值能确保各远程传输链路分配的备份数据比例完全符合对应传输权重值的比例,且能用最少轮次的将目标阈值递减到0,避免因为递减值过小导致的部分传输权重值较低的远程传输链路值分配不到备份数据。
下面以一个具体的实例来说明备份数据的分配过程,共有6个备份数据(t1-t6)需要分发,每个备份数据的大小均是相同的,需要分配给3个通讯节点(S1-S3),S1、2和S3所对应的远程通讯链路的传输权重值分别是1、2和3,初始的目标阈值为3。
该分配过程包括如下步骤:
步骤1,从S1、S2和S3中选择传输权重值大于或等于3的通讯节点,选择到S3,并将t1分配给S3;
步骤2,判断得出目前还有未分配的备份数据t2-t6;
步骤3,将目标阈值调整为2(3-1=2,其中,1是传输权重值1、2和3的最大公约数);
步骤4,从S1、S2和S3中选择传输权重值大于或等于2的通讯节点,选择到S2和S3,并将t2分配给S2,将t3分配给S3;
步骤5,判断得出目前还有未分配的备份数据t4-t6;
步骤6,将目标阈值调整为1(2-1=1,其中,1是传输权重值1、2和3的最大公约数);
步骤7,从S1、S2和S3中选择传输权重值大于或等于1的通讯节点,选择到S1、S2和S3,并将t4分配给S1,将t5分配给S2,将t6分配给S3;
步骤8,判断得出目前没有未分配的备份数据,终止流程。
备份数据通常是存储在每个服务器所对应的存储区中,由于采用的分布式存储,因此每个服务器节点的存储区中都不会有全部的备份数据,因此可能会存在某个第一通讯节点所要发送的备份数据存储在其他第一通讯节点的存储区中,此时就需要由第一调度节点将备份数据提供给这个第一通讯节点,或者是由这个第一通讯节点来调取其需要发送的备份数据。
也就是,上述步骤202后,还可以通过如下2种方式为至少两个第一通讯节点中的每个第一通讯节点分配备份数据,下面分别对这2种方式进行介绍:
第一种,备份数据是由第一调度节点发送给至少两个第一通讯节点中的第一通讯节点的,此种情况下,步骤202后,还包括如下步骤:
第一调度节点从存储空间(如服务器的块存储区)读取至少两个第一通讯节点中的每个第一通讯节点所分配到的备份数据;
第一调度节点将读取到的备份数据发送到对应的第一通讯节点。
第二种,备份数据是由至少两个第一通讯节点中的第一通讯节点自行读取到的,此种情况下,步骤202后,还包括如下步骤:
第一调度节点向至少两个第一通讯节点中的第一通讯节点发送地址标识,地址标识表明该第一通讯节点所分配到的备份数据的存储位置,以使该第一通讯节点按照地址标识读取的备份数据。
上述两种方式相比,第二种更为实用,主要原因是同一个分布式存储系统中的两个第一通讯节点均是采用近距离通讯链路进行连接(近距离传输链路的数据传输能力较强),因此,即使某一个第一通讯节点需要从其他第一通讯节点的存储区中直接读取数据的速度很快。如果采用上述第一种方式,则需要第一调度节点来中转备份数据,这样反而速度较慢。
更优选的,在上述第二种方式的基础上,还可以是第一通讯节点的所分配到的备份数据是存储在第一通讯节点的本地存储区中的。
这样,第一通讯节点只需要从其自己内部的存储区提取备份数据即可,不需要从其他第一通讯节点处读取数据了,能够减少不同的第一通讯节点之间的数据交互,进而,进一步的提高效率。
具体的,为了提高数据备份的效率,除了根据每个远程通讯链路的通讯能力来分配备份数据,还可以选择处理能力基本匹配的第一通讯节点和第二通讯节点建立远程通讯链接,并进行备份数据的收发。
即,至少一个远程通讯链路所对应的第一通讯节点和第二通讯节点的通讯性能是相同或相近的。
此处的通讯性能相同或相近指的是建立该远程通讯链路的第一通讯节点和第二通讯节点的通讯性能是相同或相近的。也就是,通讯性能较强的第一通讯节点与通讯性能较强的第二通讯节点建立远程通讯链路。这主要是考虑到通讯性能相差过多的话,在进行备份数据传输的时候,通讯性能较强的一个通讯节点的资源会浪费很多。其中,通讯性能反应的是通讯节点传输数据的能力,该能力可以是临时获取到的(即通讯节点当前传输数据的能力,通常不是恒定不变的),也可以是根据通讯节点的硬件的参数计算得到(不考虑硬件老化的情况,通常是恒定不变的)。
某种情况下,上述方案在具体实现时,可以按照性能排名的方式来实现,也就是,建立同一个远程通讯链路的第一通讯节点的第一排名和第二通讯节点的第二排名是相同或相近的,第一排名是指定的一个第一通讯节点的通讯性能在全部第一通讯节点中的通讯性能中的排名;第二排名是指定的一个第二通讯节点的通讯性能在全部第二通讯节点中的通讯性能中的排名。
如,可以在第一调度节点中建立如下两个表格:
表2
表3
编号 通讯性能 第一通讯节点的名称
1 9 B5
2 7 B8
3 6 B9
4 4 B4
5 2 B1
如表2所示,示出了第一通讯节点的通讯性能排名,可见第一通讯节点的通讯性能排名中,按照通讯性能由大到小排列的话,前5位是A3、A5、A8、A7和A2;如表3所示,示出了第二通讯节点的通讯性能排名,可见第二通讯节点的通讯性能排名中,按照通讯性能由大到小排列的话,前5位是B5、B8、B9、B4和B1。
进而,通讯性能较强的第一通讯节点与通讯性能较强的第二通讯节点建立远程通讯链路,指的就是A3与B5建立远程通讯链路,A5与B8建立远程通讯链路,A8与B9建立远程通讯链路,A7与B4建立远程通讯链路,以及A2与B1建立远程通讯链路。
此处的相同指的是两个排名的顺位是相同的,如第一通讯节点通讯性能排名列表中,通讯性能排名第2位的第一通讯节点与第而通讯节点通讯性能排名列表中,通讯性能排名第2位的第而通讯节点建立一个远程通讯链路。
相近指的是两个排名的顺位是相近的,如第一通讯节点通讯性能排名列表中,通讯性能排名第2位的第一通讯节点与第而通讯节点通讯性能排名列表中,通讯性能排名第3位的第而通讯节点建立一个远程通讯链路。
下面以一个具体的实例来说明,本申请所提供的方法,该方法作用于如图4所示的异地容灾系统,该异地容灾系统包括至少两个分布式存储系统(为简化描述,图中只出现了第一分布式存储系统和第二分布式存储系统),第一分布式存储系统包括第一调度节点和多个第一通讯节点(第一通讯节点X、第一通讯节点Y等),第一调度节点和第一通讯节点之间通过近距离通讯链路连接,任意两个第一通讯节点之间通过近距离通讯链路连接;第二分布式存储系统包括第二调度节点和多个第二通讯节点(第二通讯节点X、第二通讯节点Y等),第一调度节点和第二通讯节点之间通过近距离通讯链路连接,任意两个第二通讯节点之间通过近距离通讯链路连接;
该方法包括如下步骤:
步骤1,第一调度节点在被触发后,扫描本地存储的位图中的标志位,以确定需要进行传送的备份数据有备份数据A、B和C(备份数据A、B和C的标志位显示这三个数据需要更新),备份数据A、B和C的大小均相同;
步骤2,第一调度节点通过查表(表中记录了远程通讯链路建立规则),确定第一通讯节点X应当与第二通讯节点Y建立远程通讯链路,以及第一通讯节点Y应当与第二通讯节点X建立远程通讯链路;
步骤3,第一调度节点控制第一通讯节点X与第二通讯节点Y建立第一远程通讯链路,以及第一通讯节点Y与第二通讯节点X建立第二远程通讯链路;
步骤4,第一调度节点获取第一通讯节点X的通讯性能和第一通讯节点Y的通讯性能;
步骤5,第一调度节点根据第一通讯节点X的通讯性能,确定第一远程通讯链路的传输权重值为3;以及,根据第一通讯节点Y的通讯性能确定第二远程通讯链路的传输权重值为2;
步骤6,第一调度节点根据第一远程通讯链路的传输权重值,确定备份数据A和B应当由第一通讯节点X进行发送;以及,根据第二远程通讯链路的传输权重值,确定备份数据C应当由第二通讯节点Y进行发送;
步骤7,第一调度节点将备份数据A和B的存储地址发送给第一通讯节点X;以及,将备份数据C的存储地址发送给第一通讯节点Y;以及,第一调度节点将本地存储的位图中,备份数据A、B和C在位图中的标志位调整为已备份;
步骤8,第一通讯节点X通过第一远程通讯链路向第二通讯节点Y发送备份数据A和B;以及,第一通讯节点Y通过第二远程通讯链路向第二通讯节点X发送备份数据C;
步骤9,第二通讯节点X接收到备份数据A和B之后,将备份数据A和B在第二通讯节点X进行存储,以及将备份数据A发送至第二通讯节点Y进行存储,以及将备份数据B发送至第二通讯节点C进行存储;
步骤10,第二通讯节点Y接收到备份数据C之后,将备份数据C在第二通讯节点Y进行存储,以及将备份数据C发送至第二通讯节点C进行存储。
一般情况下,步骤1中,标志位主要是显示数据在上次备份后是否有更新,有更新则需要备份,首次备份所有数据标志位都显示有更新需要备份。
上述步骤7中,是在将备份数据的存储地址发送给通讯节点后才对位图标志位进行的调整,还可以在其他的时机进行位图标志位的调整。
与上述方法相对应的,本申请还提供了数据异地备份装置,
作用于第一分布式存储系统,第一分布式存储系统包括第一调度节点和多个第一通讯节点;任意两个第一通讯节点之间均通过近距离通讯链路进行连接;第一调度节点分别与每个第一通讯节点通过近距离通讯链路连接;数据异地备份装置设置于第一调度节点中;
数据异地备份装置包括:
第一获取模块,用于获取远程通讯链路建立规则;
第一控制模块,用于按照远程通讯链路建立规则控制至少两个第一通讯节点分别与不同的第二通讯节点建立远程通讯链路;每个第二通讯节点均属于同一个第二分布式存储系统;第一通讯节点、第二通讯节点和远程通讯链路是一一对应的;
第二控制模块,用于控制至少两个第一通讯节点通过对应的远程通讯链路并行的发送备份数据;至少两个第一通讯节点中不同的第一通讯节点所发出的备份数据不同。
优选的,装置还包括:
第二获取模块,用于获取每个远程通讯链路的传输权重值,每个传输权重值是根据以下的一个或多个参数确定的:每个远程通讯链路对应的第一通讯节点的通讯性能、每个远程通讯链路对应的第一通讯节点的当前负载、每个远程通讯链路对应的第二通讯节点的通讯性能和每个远程通讯链路对应的第二传输节点的当前负载;
确定模块,用于根据每个远程通讯链路的传输权重值,确定每个每个远程通讯链路对应的第一通讯节点所要发送的备份数据;每个远程通讯链路对应的第一通讯节点所要发送的备份数据的大小与对应的远程通讯链路的传输权重值呈正相关性。
优选的,确定模块包括:
计算单元,用计算全部远程通讯链路的传输权重值的最大公约数;
分配单元,用于为每个目标第一通讯节点分配未分配的备份数据;目标第一通讯节点是传输权重值超过目标阈值的远程传输链路所对应的第一通讯节点;
判断单元,用于判断是否还有未分配的备份数据;若是,则将目标阈值修改为目标阈值与最大公约数的差值,并触发分配单元重新工作。
优选的,至少一个远程通讯链路所对应的第一通讯节点和第二通讯节点的通讯性能是相同或相近的。
优选的,同一个远程通讯链路所对应的第一通讯节点的第一排名和第二通讯节点的第二排名是相同或相近的,第一排名是指定的一个第一通讯节点的通讯性能在全部第一通讯节点中的通讯性能中的排名;第二排名是指定的一个第二通讯节点的通讯性能在全部第二通讯节点中的通讯性能中的排名。
进一步,本申请还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,程序代码使处理器执行上述数据异地备份方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (11)

1.数据异地备份方法,其特征在于,作用于第一分布式存储系统,第一分布式存储系统包括第一调度节点和多个第一通讯节点;任意两个第一通讯节点之间均通过近距离通讯链路进行连接;第一调度节点分别与每个第一通讯节点通过近距离通讯链路连接;
所述方法包括:
第一调度节点获取远程通讯链路建立规则;
第一调度节点按照远程通讯链路建立规则控制至少两个第一通讯节点分别与不同的第二通讯节点建立远程通讯链路;每个第二通讯节点均属于同一个第二分布式存储系统;第一通讯节点、第二通讯节点和远程通讯链路是一一对应的;
第一调度节点控制至少两个第一通讯节点通过对应的远程通讯链路并行的发送备份数据;至少两个第一通讯节点中不同的第一通讯节点所发出的备份数据不同。
2.根据权利要求1所述的方法,其特征在于,通过以下方式确定至少两个第一通讯节点中的每个第一通讯节点所发出的备份数据:
第一调度节点获取每个远程通讯链路的传输权重值,每个传输权重值是根据以下的一个或多个参数确定的:每个远程通讯链路对应的第一通讯节点的通讯性能、每个远程通讯链路对应的第一通讯节点的当前负载、每个远程通讯链路对应的第二通讯节点的通讯性能和每个远程通讯链路对应的第二传输节点的当前负载;
第一调度节点根据每个远程通讯链路的传输权重值,确定每个远程通讯链路对应的第一通讯节点所要发送的备份数据;每个远程通讯链路对应的第一通讯节点所要发送的备份数据的大小与对应的远程通讯链路的传输权重值呈正相关性。
3.根据权利要求2所述的方法,其特征在于,步骤第一调度节点根据每个远程通讯链路的传输权重值,确定每个远程通讯链路对应的第一通讯节点所要发送的备份数据包括:
第一调度节点计算全部远程通讯链路的传输权重值的最大公约数;
第一调度节点为每个目标第一通讯节点分配未分配的备份数据;目标第一通讯节点是传输权重值超过目标阈值的远程传输链路所对应的第一通讯节点;
第一调度节点判断是否还有未分配的备份数据;若是,则将目标阈值修改为目标阈值与最大公约数的差值,并重新执行步骤第一调度节点为每个目标第一通讯节点分配未分配的备份数据。
4.根据权利要求1所述的方法,其特征在于,至少一个远程通讯链路所对应的第一通讯节点和第二通讯节点的通讯性能是相同或相近的。
5.根据权利要求1所述的方法,其特征在于,同一个远程通讯链路所对应的第一通讯节点的第一排名和第二通讯节点的第二排名是相同或相近的,第一排名是指定的一个第一通讯节点的通讯性能在全部第一通讯节点中的通讯性能中的排名;第二排名是指定的一个第二通讯节点的通讯性能在全部第二通讯节点中的通讯性能中的排名。
6.数据异地备份装置,其特征在于,作用于第一分布式存储系统,第一分布式存储系统包括第一调度节点和多个第一通讯节点;数据异地备份装置设置于第一调度节点中;任意两个第一通讯节点之间均通过近距离通讯链路进行连接;第一调度节点分别与每个第一通讯节点通过近距离通讯链路连接;
数据异地备份装置包括:
第一获取模块,用于获取远程通讯链路建立规则;
第一控制模块,用于按照远程通讯链路建立规则控制至少两个第一通讯节点分别与不同的第二通讯节点建立远程通讯链路;每个第二通讯节点均属于同一个第二分布式存储系统;第一通讯节点、第二通讯节点和远程通讯链路是一一对应的;
第二控制模块,用于控制至少两个第一通讯节点通过对应的远程通讯链路并行的发送备份数据;至少两个第一通讯节点中不同的第一通讯节点所发出的备份数据不同。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取每个远程通讯链路的传输权重值,每个传输权重值是根据以下的一个或多个参数确定的:每个远程通讯链路对应的第一通讯节点的通讯性能、每个远程通讯链路对应的第一通讯节点的当前负载、每个远程通讯链路对应的第二通讯节点的通讯性能和每个远程通讯链路对应的第二传输节点的当前负载;
确定模块,用于根据每个远程通讯链路的传输权重值,确定每个远程通讯链路对应的第一通讯节点所要发送的备份数据;远程通讯链路对应的第一通讯节点所要发送的备份数据的大小与对应的远程通讯链路的传输权重值呈正相关性。
8.根据权利要求7所述的装置,其特征在于,确定模块包括:
计算单元,用计算全部远程通讯链路的传输权重值的最大公约数;
分配单元,用于为每个目标第一通讯节点分配未分配的备份数据;目标第一通讯节点是传输权重值超过目标阈值的远程传输链路所对应的第一通讯节点;
判断单元,用于判断是否还有未分配的备份数据;若是,则将目标阈值修改为目标阈值与最大公约数的差值,并触发分配单元重新工作。
9.根据权利要求6所述的装置,其特征在于,至少一个远程通讯链路所对应的第一通讯节点和第二通讯节点的通讯性能是相同或相近的。
10.根据权利要求6所述的装置,其特征在于,同一个远程通讯链路所对应的第一通讯节点的第一排名和第二通讯节点的第二排名是相同或相近的,第一排名是指定的一个第一通讯节点的通讯性能在全部第一通讯节点中的通讯性能中的排名;第二排名是指定的一个第二通讯节点的通讯性能在全部第二通讯节点中的通讯性能中的排名。
11.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行如权利要求1-5任一项所述的数据异地备份方法。
CN201810159776.6A 2018-02-26 2018-02-26 数据异地备份方法、装置及计算机可读介质 Active CN108459926B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810159776.6A CN108459926B (zh) 2018-02-26 2018-02-26 数据异地备份方法、装置及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810159776.6A CN108459926B (zh) 2018-02-26 2018-02-26 数据异地备份方法、装置及计算机可读介质

Publications (2)

Publication Number Publication Date
CN108459926A true CN108459926A (zh) 2018-08-28
CN108459926B CN108459926B (zh) 2020-05-15

Family

ID=63217385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810159776.6A Active CN108459926B (zh) 2018-02-26 2018-02-26 数据异地备份方法、装置及计算机可读介质

Country Status (1)

Country Link
CN (1) CN108459926B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111132234A (zh) * 2018-11-01 2020-05-08 华为终端有限公司 一种数据传输方法及对应的终端
CN111427696A (zh) * 2020-04-07 2020-07-17 上海飞旗网络技术股份有限公司 业务资源调度方法及装置
CN114780296A (zh) * 2022-05-09 2022-07-22 马上消费金融股份有限公司 数据库集群的数据备份方法、装置及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101094154A (zh) * 2007-06-28 2007-12-26 北京亚细亚智业科技有限公司 一种多主控模式的数据备份异地保护系统以及保护方法
CN104410683A (zh) * 2014-11-21 2015-03-11 四川神琥科技有限公司 一种数据备份方法
US9660924B2 (en) * 2012-04-16 2017-05-23 Hewlett Packard Enterprise Development Lp Determining a maximal size of packets
CN106791041A (zh) * 2016-12-05 2017-05-31 北京摇光智能科技有限公司 一种智能终端间的信息传输方法
CN107247638A (zh) * 2012-12-25 2017-10-13 华为技术有限公司 一种数据备份方法、装置和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101094154A (zh) * 2007-06-28 2007-12-26 北京亚细亚智业科技有限公司 一种多主控模式的数据备份异地保护系统以及保护方法
CN101094154B (zh) * 2007-06-28 2010-09-29 北京亚细亚智业科技有限公司 一种多主控模式的数据备份异地保护系统以及保护方法
US9660924B2 (en) * 2012-04-16 2017-05-23 Hewlett Packard Enterprise Development Lp Determining a maximal size of packets
CN107247638A (zh) * 2012-12-25 2017-10-13 华为技术有限公司 一种数据备份方法、装置和系统
CN104410683A (zh) * 2014-11-21 2015-03-11 四川神琥科技有限公司 一种数据备份方法
CN106791041A (zh) * 2016-12-05 2017-05-31 北京摇光智能科技有限公司 一种智能终端间的信息传输方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111132234A (zh) * 2018-11-01 2020-05-08 华为终端有限公司 一种数据传输方法及对应的终端
CN111132234B (zh) * 2018-11-01 2023-08-04 华为终端有限公司 一种数据传输方法及对应的终端
CN111427696A (zh) * 2020-04-07 2020-07-17 上海飞旗网络技术股份有限公司 业务资源调度方法及装置
CN111427696B (zh) * 2020-04-07 2023-03-14 上海飞旗网络技术股份有限公司 业务资源调度方法及装置
CN114780296A (zh) * 2022-05-09 2022-07-22 马上消费金融股份有限公司 数据库集群的数据备份方法、装置及系统

Also Published As

Publication number Publication date
CN108459926B (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
US7856572B2 (en) Information processing device, program thereof, modular type system operation management system, and component selection method
CN108459926A (zh) 数据异地备份方法、装置及计算机可读介质
CN105511801B (zh) 数据存储的方法和装置
CN106843745A (zh) 容量扩展方法及装置
CN111381936A (zh) 一种分布式云系统-云簇架构下的服务容器资源的分配方法与系统
CN106899681A (zh) 一种信息推送的方法以及服务器
CN104038540A (zh) 一种应用代理服务器自动选择方法及系统
CN101741907A (zh) 一种均衡服务器负载的方法、系统和主服务器
CN104142871B (zh) 用于数据备份的方法、装置和分布式文件系统
CN110149394A (zh) 系统资源的调度方法、装置和存储介质
CN105740063A (zh) 一种数据处理方法及装置
CN113742135B (zh) 数据备份方法、装置及计算机可读存储介质
CN109451540A (zh) 一种网络切片的资源分配方法和设备
CN114153580A (zh) 一种跨多集群的工作调度方法及装置
CN104484233A (zh) 一种资源分配方法
CN106021284A (zh) 数据查询方法、数据监测方法及装置
CN112463395A (zh) 一种资源分配方法、装置、设备及可读存储介质
CN110597598B (zh) 一种云环境中的虚拟机迁移的控制方法
CN106209415A (zh) 一种虚拟网络映射方法及系统
CN117314605B (zh) 一种互联网金融业务流程管理方法及系统
CN103077127B (zh) 一种确定数据迁移对象的方法和装置
CN101277317B (zh) 一种分布式处理系统的数据均衡分发方法
CN106254403A (zh) 数据的迁移方法及装置
CN102868594B (zh) 一种消息处理方法和装置
Huang et al. Reliable redundant services placement in federated micro-clouds

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant