CN103229480B - 分布式存储系统中的数据处理方法及设备、客户端 - Google Patents

分布式存储系统中的数据处理方法及设备、客户端 Download PDF

Info

Publication number
CN103229480B
CN103229480B CN201180003080.0A CN201180003080A CN103229480B CN 103229480 B CN103229480 B CN 103229480B CN 201180003080 A CN201180003080 A CN 201180003080A CN 103229480 B CN103229480 B CN 103229480B
Authority
CN
China
Prior art keywords
data
cryptographic hash
memory
memory node
mentioned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180003080.0A
Other languages
English (en)
Other versions
CN103229480A (zh
Inventor
杨德平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Cloud Computing Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN103229480A publication Critical patent/CN103229480A/zh
Application granted granted Critical
Publication of CN103229480B publication Critical patent/CN103229480B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1061Peer-to-peer [P2P] networks using node-based peer discovery mechanisms
    • H04L67/1065Discovery involving distributed pre-established resource-based relationships among peers, e.g. based on distributed hash tables [DHT] 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

本发明提供一种分布式存储系统中的数据处理方法及设备、客户端,客户端根据数据的特征信息,获得数据的哈希值,通过根据预先创建的分区表和数据的哈希值,确定与数据的哈希值对应的至少两个存储节点,至少两个存储节点对应不同的DHT重叠网,使得客户端能够将数据分别写入至少两个存储节点,系统中至少两个存储节点上只存储一份数据副本,其备份关系简单,能避免现有技术中由于系统中存储节点的备份关系复杂使得一个存储节点可能会存储多份不同的数据副本而导致的一个存储节点加入或者离开系统受到影响的存储节点可能包括该存储节点顺时针方向的顺序两个存储节点和逆时针方向的顺序两个存储节点的备份关系的问题,降低了系统维护和调度的难度。

Description

分布式存储系统中的数据处理方法及设备、客户端
技术领域
本发明实施例涉及信息存储技术,尤其涉及一种分布式存储系统中的数据处理方法及设备、客户端。
背景技术
基于分布式哈希表(Distributed Hash Table,简称DHT)重叠网的分布式存储系统中,每个存储节点被赋予一个全局唯一的键值(Key),由DHT描述;所有存储节点的键值形成一个封闭的、被切分了的空间环;每个存储节点负责存储的数据空间为在该存储节点的键值的顺时针或逆时针方向的一个分区。客户端可以根据待存储/读取数据的键值,在DHT中查询到该键值所在的分区和对应的主存储节点,完成数据的存储/读取。为保证数据的高可靠性,基于DHT重叠网的分布式存储系统中采用多副本存储策略,即一份数据存储多个副本,每个数据副本位于不同的存储节点。例如:在确定数据的主存储节点后,在顺时针或逆时针方向,顺序选择相应数目的存储节点,分别存储一个数据副本。
然而,由于上述系统中存储节点的备份关系复杂,使得一个存储节点可能会存储多份不同的数据副本,导致了一个存储节点加入或者离开系统,受到影响的存储节点可能包括该存储节点顺时针方向的顺序两个存储节点和逆时针方向的顺序两个存储节点的备份关系,从而增加了系统维护和调度的难度。
发明内容
本发明提供一种分布式存储系统中的数据处理方法及设备、客户端,用以降低系统维护和调度的难度。
一方面提供了一种分布式存储系统中的数据处理方法,包括:
客户端根据数据的特征信息,获得所述数据的哈希值;
所述客户端根据预先创建的分区表和所述数据的哈希值,确定与所述数据的哈希值对应的至少两个存储节点,所述至少两个存储节点对应不同的DHT重叠网;
所述客户端将所述数据分别写入所述至少两个存储节点。
另一方面提供了一种客户端,包括:
获得单元,用于根据数据的特征信息,获得所述数据的哈希值;
确定单元,用于根据预先创建的分区表和所述数据的哈希值,确定与所述数据的哈希值对应的至少两个存储节点,所述至少两个存储节点对应不同的DHT重叠网;
处理单元,用于将所述数据分别写入所述至少两个存储节点。
另一方面提供了一种分布式存储系统中的数据处理设备,包括:
确定单元,用于根据所述分布式存储系统中的数据副本个数,确定哈希值对应的至少两个存储节点,其中,所述哈希值对应的至少两个存储节点的个数等于所述分布式存储系统中的数据副本个数,所述哈希值对应的至少两个存储节点对应不同的DHT重叠网,所述不同的DHT重叠网的分区一致;
创建单元,用于根据所述哈希值和所述哈希值对应的至少两个存储节点的配置信息,创建分区表,以供客户端根据数据的特征信息,获得所述数据的哈希值,以及根据所述分区表和所述数据的哈希值,确定与所述数据的哈希值对应的至少两个存储节点,并将所述数据分别写入所述至少两个存储节点,所述至少两个存储节点对应不同的DHT重叠网。
由上述技术方案可知,本发明实施例客户端根据数据的特征信息,获得上述数据的哈希值,并通过根据预先创建的分区表和上述数据的哈希值,确定与上述数据的哈希值对应的至少两个存储节点,上述至少两个存储节点对应不同的DHT重叠网,使得上述客户端能够将上述数据分别写入上述至少两个存储节点,由于系统中上述至少两个存储节点上只存储一份数据副本,其备份关系简单,能够避免现有技术中由于系统中存储节点的备份关系复杂使得一个存储节点可能会存储多份不同的数据副本而导致的一个存储节点加入或者离开系统受到影响的存储节点可能包括该存储节点顺时针方向的顺序两个存储节点和逆时针方向的顺序两个存储节点的备份关系的问题,从而降低了系统维护和调度的难度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的分布式存储系统中的数据处理方法的流程示意图;
图2为本发明另一实施例提供的分布式存储系统中的数据处理方法的流程示意图;
图3为图1和图2对应的实施例提供的分布式存储系统中的数据处理方法中涉及的分区表的示意图;
图4为图1和图2对应的实施例提供的分布式存储系统中的数据处理方法中涉及的分布式存储系统;
图5为本发明另一实施例提供的客户端的结构示意图;
图6为本发明另一实施例提供的分布式存储系统中的数据处理设备的结构示意图;
图7为本发明另一实施例提供的分布式存储系统中的数据处理设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一实施例提供的分布式存储系统中的数据处理方法的流程示意图,如图1所示,本实施例的分布式存储系统中的数据处理方法可以包括:
101、客户端根据数据的特征信息,获得上述数据的哈希值;
特征信息可以包括以下内容,例如:数据的文件名字、数据的摘要信息或者数据的内容的等任何与该数据相关且能够标识该数据的信息。
在101之前,本实施例还可以进一步包括创建上述分区表的步骤。
例如:可以根据上述分布式存储系统中的数据副本个数,确定每一个哈希值对应的至少两个存储节点,其中,上述哈希值对应的至少两个存储节点的个数等于上述分布式存储系统中的数据副本个数,上述哈希值对应的至少两个存储节点对应不同的DHT重叠网,上述不同的DHT重叠网的分区一致;然后,根据上述哈希值和上述哈希值对应的至少两个存储节点的配置信息,创建上述分区表。
需要说明的是:本实施例中,创建了上述分区表之后,可以将该分区表存储在网络中,以使得客户端和上述不同的DHT重叠网对应的每一个存储节点共享上述分区表,或者还可以将该分区表直接分发至客户端,以及上述不同的DHT重叠网对应的每一个存储节点,以使得客户端和上述不同的DHT重叠网对应的每一个存储节点获得上述分区表。
本实施例中,上述不同的DHT重叠网对应的存储节点获得上述分区表之后,可以根据上述分区表,获得与本存储节点的配置信息对应的哈希值,并确定该哈希值对应的其他存储节点,即其他存储节点为本存储节点的备份存储节点;然后,上述不同的DHT重叠网对应的存储节点则可以根据本存储节点的数据和上述其他存储节点的数据,完成初始化操作。
其中,存储节点的配置信息可以包括但不限于IP地址、通信端口和存储空间中的至少一项。
例如:本存储节点可以与备份存储节点进行通信,并根据本存储节点的数据和备份存储节点的数据,检查二者是否同步,如果数据同步,本存储节点则完成初始化操作,如果数据不同步,本存储节点则进行数据同步,以完成初始化操作。
可选地,本实施例中,为了保证可靠性的要求,在创建分区表的过程中,不同重叠网的同一个哈希值可以对应不同的存储服务器上的存储节点,用以保证同一个哈希值对应的至少两个存储节点在物理上是隔离的。在具体实现时,还可以进一步考虑更多的隔离因素,例如:机架隔离、网络隔离或供电隔离等。
102、上述客户端根据预先创建的分区表和上述数据的哈希值,确定与上述数据的哈希值对应的至少两个存储节点,上述至少两个存储节点对应不同的DHT重叠网;
可选地,在102中,上述至少两个存储节点可以位于不同存储服务器上,从而提高了数据处理的可靠性。
103、上述客户端将上述数据分别写入上述至少两个存储节点。
需要说明的是,在本发明实施例中,DHT重叠网具备以下特性:每个存储节点被赋予一个全局唯一的键值(Key),由DHT描述;所有存储节点的键值形成一个封闭的、被切分了的空间环;每个存储节点负责存储的数据空间为在该存储节点的键值的顺时针或逆时针方向的一个分区。
本实施例中,客户端根据数据的特征信息,获得上述数据的哈希值,并通过根据预先创建的分区表和上述数据的哈希值,确定与上述数据的哈希值对应的至少两个存储节点,上述至少两个存储节点对应不同的DHT重叠网,使得上述客户端能够将上述数据分别写入上述至少两个存储节点,由于系统中上述至少两个存储节点上只存储一份数据副本,其备份关系简单,能够避免现有技术中由于系统中存储节点的备份关系复杂使得一个存储节点可能会存储多份不同的数据副本而导致的一个存储节点加入或者离开系统受到影响的存储节点可能包括该存储节点顺时针方向的顺序两个存储节点和逆时针方向的顺序两个存储节点的备份关系的问题,从而降低了系统维护和调度的难度。
图2为本发明另一实施例提供的分布式存储系统中的数据处理方法的流程示意图,在上述图1对应的实施例的基础之上,如图2所示,本实施例的分布式存储系统中的数据处理方法还可以进一步包括:
201、上述客户端根据上述数据的特征信息,获得上述数据的哈希值;
202、上述客户端根据预先创建的分区表和上述数据的哈希值,确定与上述数据的哈希值对应的至少两个存储节点,上述至少两个存储节点对应不同的DHT重叠网;
类似地,在202中,上述至少两个存储节点可以位于不同存储服务器上,从而提高了数据处理的可靠性。
203、上述客户端选择上述至少两个存储节点中的一个存储节点,并读取选择的上述存储节点中写入的上述数据。
本实施例中,客户端根据数据的特征信息,获得上述数据的哈希值,并通过根据预先创建的分区表和上述数据的哈希值,确定与上述数据的哈希值对应的至少两个存储节点,上述至少两个存储节点对应不同的DHT重叠网,使得上述客户端能够选择上述至少两个存储节点中的一个存储节点,并读取选择的上述存储节点中写入的上述数据,由于系统中上述至少两个存储节点上只存储一份数据副本,其备份关系简单,能够避免现有技术中由于系统中存储节点的备份关系复杂使得一个存储节点可能会存储多份不同的数据副本而导致的一个存储节点加入或者离开系统受到影响的存储节点可能包括该存储节点顺时针方向的顺序两个存储节点和逆时针方向的顺序两个存储节点的备份关系的问题,从而降低了系统维护和调度的难度。
为使得本发明实施例提供的方法更加清楚,下面将以三个数据副本的分布式存储系统作为举例。
举例来说,根据上述分布式存储系统中的数据副本个数3,确定哈希值对应的至少两个存储节点,其中,上述哈希值对应的至少两个存储节点的个数3等于上述分布式存储系统中的数据副本个数3,上述哈希值对应的至少两个存储节点对应不同的DHT重叠网,即DHT重叠网1、DHT重叠网2和DHT重叠网3,上述不同的DHT重叠网的分区一致,例如:可以采用均匀分区,空间被分成N等分,或者还可以采用非均匀分区,本实施例对此不进行限定;然后,根据上述哈希值和上述哈希值对应的至少两个存储节点的配置信息,创建上述分区表,如图3所示。所创建的分区表需要持久化保存,例如:将所创建的分区表存储在硬盘中。
上述创建的分区表可以分发到所有的存储节点,以及分发到所有的客户端。存储节点获得上述分区表之后,进行初始化操作,详细内容可以参见图1对应的实施例中的相关内容,此处不再赘述。
假设数据1需要存储到上述三个数据副本的分布式存储系统,客户端则可以根据获得的预先创建的分区表和待写入的数据1的哈希值,确定与数据1的哈希值对应的三个存储节点,例如:存储节点1、存储节点4和存储节点7,三个存储节点对应三个不同的DHT重叠网,即DHT重叠网1、DHT重叠网2和DHT重叠网3。为了提高数据处理的可靠性,存储节点1、存储节点4和存储节点7三个存储节点可以位于不同存储服务器,即存储服务器1、存储服务器2和存储服务器3,上,如图4所示;最后,客户端则可以将上述数据1分别写入存储节点1、存储节点4和存储节点7三个存储节点。
类似地,客户端则可以根据预先创建的分区表和待写入的数据1的哈希值,确定与数据1的哈希值对应的三个存储节点,例如:存储节点1、存储节点4和存储节点7,三个存储节点对应三个不同的DHT重叠网,即DHT重叠网1、DHT重叠网2和DHT重叠网3;最后客户端则可以选择存储节点1、存储节点4和存储节点7三个存储节点中的任意一个存储节点,并读取选择的存储节点中写入的上述数据1。
需要说明的是:对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图5为本发明另一实施例提供的客户端的结构示意图,如图5所示,本实施例的客户端可以包括获得单元51、确定单元52和处理单元53。其中,获得单元51用于根据数据的特征信息,获得上述数据的哈希值;确定单元52用于根据预先创建的分区表和上述数据的哈希值,确定与上述数据的哈希值对应的至少两个存储节点,上述至少两个存储节点对应不同的DHT重叠网;处理单元53用于将上述数据分别写入上述至少两个存储节点。
上述图1和图2对应的实施例中客户端的功能均可以由本实施例提供的客户端实现。
进一步地,本实施例中,
获得单元51还可以进一步用于根据上述数据的特征信息,获得上述数据的哈希值;
确定单元52还可以进一步用于根据预先创建的分区表和上述数据的哈希值,确定与上述数据的哈希值对应的至少两个存储节点,上述至少两个存储节点对应不同的DHT重叠网;
处理单元53还可以进一步用于选择上述至少两个存储节点中的一个存储节点,并读取选择的上述存储节点中写入的上述数据。
本实施例中,客户端通过获得单元根据数据的特征信息,获得上述数据的哈希值,并通过确定单元根据预先创建的分区表和上述数据的哈希值,确定与上述数据的哈希值对应的至少两个存储节点,上述至少两个存储节点对应不同的DHT重叠网,使得上处理单元能够选择上述至少两个存储节点中的一个存储节点,并读取选择的上述存储节点中写入的上述数据,或者还能够选择上述至少两个存储节点中的一个存储节点,并读取选择的上述存储节点中写入的上述数据,由于系统中上述至少两个存储节点上只存储一份数据副本,其备份关系简单,能够避免现有技术中由于系统中存储节点的备份关系复杂使得一个存储节点可能会存储多份不同的数据副本而导致的一个存储节点加入或者离开系统受到影响的存储节点可能包括该存储节点顺时针方向的顺序两个存储节点和逆时针方向的顺序两个存储节点的备份关系的问题,从而降低了系统维护和调度的难度。
图6为本发明另一实施例提供的分布式存储系统中的数据处理设备的结构示意图,如图6所示,本实施例的分布式存储系统中的数据处理设备可以包括确定单元61和创建单元62。其中,确定单元61根据上述分布式存储系统中的数据副本个数,确定哈希值对应的至少两个存储节点,其中,上述哈希值对应的至少两个存储节点的个数等于上述分布式存储系统中的数据副本个数,上述哈希值对应的至少两个存储节点对应不同的DHT重叠网,上述不同的DHT重叠网的分区一致;创建单元62根据上述哈希值和上述哈希值对应的至少两个存储节点的配置信息,创建分区表,以供客户端根据数据的特征信息,获得上述数据的哈希值,以及根据上述分区表和上述数据的哈希值,确定与上述数据的哈希值对应的至少两个存储节点,并将上述数据分别写入上述至少两个存储节点,上述至少两个存储节点对应不同的DHT重叠网。
可选地,如图7所示,本实施例提供的分布式存储系统中的数据处理设备还可以进一步包括发送单元71,用于可以向上述客户端和上述不同的DHT重叠网对应的存储节点发送上述分区表,以使得上述不同的DHT重叠网对应的存储节点根据上述分区表,获得与本存储节点的配置信息对应的哈希值,并确定该哈希值对应的其他存储节点,以及根据本存储节点的数据和上述其他存储节点的数据,完成初始化操作。
可选地,确定单元61确定的哈希值对应的至少两个存储节点可以位于不同存储服务器上,从而提高了数据处理的可靠性。
本实施例中,通过确定单元根据分布式存储系统中的数据副本个数,确定哈希值对应的至少两个存储节点,并由创建单元根据上述哈希值和上述哈希值对应的至少两个存储节点的配置信息,创建分区表,使得客户端根据数据的特征信息,获得上述数据的哈希值,并通过根据预先创建的分区表和上述数据的哈希值,确定与上述数据的哈希值对应的至少两个存储节点,上述至少两个存储节点对应不同的DHT重叠网,使得上述客户端能够将上述数据分别写入上述至少两个存储节点,由于系统中上述至少两个存储节点上只存储一份数据副本,其备份关系简单,能够避免现有技术中由于系统中存储节点的备份关系复杂使得一个存储节点可能会存储多份不同的数据副本而导致的一个存储节点加入或者离开系统受到影响的存储节点可能包括该存储节点顺时针方向的顺序两个存储节点和逆时针方向的顺序两个存储节点的备份关系的问题,从而降低了系统维护和调度的难度。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种分布式存储系统中的数据处理方法,其特征在于,包括:
根据分布式存储系统中的数据副本个数,确定哈希值对应的至少两个存储节点,其中,所述哈希值对应的至少两个存储节点的个数等于所述分布式存储系统中的数据副本个数,所述哈希值对应的至少两个存储节点对应不同的DHT重叠网,所述不同的DHT重叠网的分区一致;
根据所述哈希值和所述哈希值对应的至少两个存储节点的配置信息,创建分区表;
客户端根据数据的特征信息,获得所述数据的哈希值,所述特征信息包括:所述数据的文件名字、所述数据的摘要信息或者所述数据的内容;
所述客户端根据所述分区表和所述数据的哈希值,确定与所述数据的哈希值对应的至少两个存储节点;
所述客户端将所述数据分别写入所述至少两个存储节点。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述不同的DHT重叠网对应的存储节点获得所述分区表;
所述不同的DHT重叠网对应的存储节点根据所述分区表,获得与本存储节点的配置信息对应的哈希值,并确定该哈希值对应的其他存储节点;
所述不同的DHT重叠网对应的存储节点根据本存储节点的数据和所述其他存储节点的数据,完成初始化操作。
3.根据权利要求1或2所述的方法,其特征在于,所述客户端将所述数据分别写入所述至少两个存储节点之后,还包括:
所述客户端根据所述数据的特征信息,获得所述数据的哈希值;
所述客户端根据预先创建的分区表和所述数据的哈希值,确定与所述数据的哈希值对应的至少两个存储节点,所述至少两个存储节点对应不同的DHT重叠网;
所述客户端选择所述至少两个存储节点中的一个存储节点,并读取选择的所述存储节点中写入的所述数据。
4.根据权利要求1~3任一权利要求所述的方法,其特征在于,
所述至少两个存储节点位于不同存储服务器上。
5.一种分布式存储系统中的数据处理设备,其特征在于,包括:
确定单元,用于根据分布式存储系统中的数据副本个数,确定哈希值对应的至少两个存储节点,其中,所述哈希值对应的至少两个存储节点的个数等于所述分布式存储系统中的数据副本个数,所述哈希值对应的至少两个存储节点对应不同的DHT重叠网,所述不同的DHT重叠网的分区一致;
创建单元,用于根据所述哈希值和所述哈希值对应的至少两个存储节点的配置信息,创建分区表,以供客户端根据数据的特征信息,获得所述数据的哈希值,根据所述分区表和所述数据的哈希值,确定与所述数据的哈希值对应的至少两个存储节点,并将所述数据分别写入所述至少两个存储节点,所述特征信息包括:所述数据的文件名字、所述数据的摘要信息或者所述数据的内容。
6.根据权利要求5所述的设备,其特征在于,所述设备还包括发送单元,用于向所述客户端和所述不同的DHT重叠网对应的存储节点发送所述分区表,以使得
所述不同的DHT重叠网对应的存储节点根据所述分区表,获得与本存储节点的配置信息对应的哈希值,并确定该哈希值对应的其他存储节点,以及根据本存储节点的数据和所述其他存储节点的数据,完成初始化操作。
7.根据权利要求5或6所述的设备,其特征在于,所述确定单元确定的哈希值对应的至少两个存储节点位于不同存储服务器上。
CN201180003080.0A 2011-11-29 2011-11-29 分布式存储系统中的数据处理方法及设备、客户端 Active CN103229480B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/083127 WO2013078611A1 (zh) 2011-11-29 2011-11-29 分布式存储系统中的数据处理方法及设备、客户端

Publications (2)

Publication Number Publication Date
CN103229480A CN103229480A (zh) 2013-07-31
CN103229480B true CN103229480B (zh) 2017-10-17

Family

ID=48534598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180003080.0A Active CN103229480B (zh) 2011-11-29 2011-11-29 分布式存储系统中的数据处理方法及设备、客户端

Country Status (2)

Country Link
CN (1) CN103229480B (zh)
WO (1) WO2013078611A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104461777B (zh) * 2014-11-26 2018-07-13 华为技术有限公司 一种存储阵列中数据镜像方法及存储阵列
CN104468580B (zh) * 2014-12-10 2017-08-11 北京众享比特科技有限公司 适用于分布式存储的认证方法
CN106897344A (zh) * 2016-07-21 2017-06-27 阿里巴巴集团控股有限公司 分布式数据库的数据操作请求处理方法及装置
CN106980645B (zh) * 2017-02-24 2020-09-15 北京同有飞骥科技股份有限公司 一种分布式文件系统架构实现方法和装置
CN109271391B (zh) * 2018-09-29 2021-05-28 武汉极意网络科技有限公司 数据存储方法、服务器、存储介质及装置
CN110377611B (zh) * 2019-07-12 2022-07-15 北京三快在线科技有限公司 积分排名的方法及装置
CN111030930B (zh) * 2019-12-02 2022-02-01 北京众享比特科技有限公司 基于去中心化网络数据分片传输方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101150489A (zh) * 2007-10-19 2008-03-26 四川长虹电器股份有限公司 基于分布式哈希表的资源共享方法
WO2008103569A1 (en) * 2007-02-20 2008-08-28 Nec Laboratories America, Inc. Methods for operating a fixed prefix peer to peer network

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101378325A (zh) * 2007-08-31 2009-03-04 华为技术有限公司 一种重叠网络及其构建方法
CN102004797A (zh) * 2010-12-24 2011-04-06 深圳市同洲电子股份有限公司 一种数据处理方法、装置和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008103569A1 (en) * 2007-02-20 2008-08-28 Nec Laboratories America, Inc. Methods for operating a fixed prefix peer to peer network
CN101150489A (zh) * 2007-10-19 2008-03-26 四川长虹电器股份有限公司 基于分布式哈希表的资源共享方法

Also Published As

Publication number Publication date
CN103229480A (zh) 2013-07-31
WO2013078611A1 (zh) 2013-06-06

Similar Documents

Publication Publication Date Title
CN103229480B (zh) 分布式存储系统中的数据处理方法及设备、客户端
CN107733855B (zh) 一种可同时支持公有链、联盟链及私有链的区块链系统及应用方法
CN110650189B (zh) 一种基于中继的区块链的交互系统及方法
CN106228446B (zh) 基于私有区块链的资产交易平台系统及方法
CN101009516B (zh) 一种进行数据同步的方法、系统及装置
CN104011701B (zh) 内容传送网络系统和能够在内容传送网络中操作的方法
CN103186466B (zh) 基于关联测试用例自动生成的信息交互测试装置及方法
CN103916482B (zh) 一种基于sqlite的数据同步传输方法
CN110326255A (zh) 管理消息传递协议通信
CN105515872B (zh) 配置信息的更新方法、装置及系统
CN110166409A (zh) 设备接入方法、相关平台及计算机存储介质
CN108510389A (zh) 基于区块链的智能合约调用方法、设备及可读存储介质
CN109981279B (zh) 一种区块链系统、通信方法、装置、设备及介质
CN109598504A (zh) 基于区块链的交易处理方法及装置、电子设备
CN108173691B (zh) 一种跨设备聚合的方法及装置
CN105205143B (zh) 一种文件存储及处理方法、设备和系统
CN109104396A (zh) 一种基于代理签名的区块链代理授权方法、介质
CN103441935B (zh) 自动识别服务器与接入交换机的邻接关系的方法及装置
CN108769163A (zh) 联盟链共识达成方法、设备及计算机可读存储介质
CN112866380B (zh) 一种基于区块链的链网架构
CN110868286B (zh) 一种基于区块链智能合约生成随机数的方法
CN101753592B (zh) 用于数据处理的方法和系统
CN109495202A (zh) 一种时间同步方法及装置
CN107423635A (zh) 一种应用共享方法及其装置、用户终端
CN107734017A (zh) 数据服务方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220207

Address after: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province

Patentee after: Huawei Cloud Computing Technology Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.