CN108200112B - 分布式存储方法及系统 - Google Patents

分布式存储方法及系统 Download PDF

Info

Publication number
CN108200112B
CN108200112B CN201611171598.6A CN201611171598A CN108200112B CN 108200112 B CN108200112 B CN 108200112B CN 201611171598 A CN201611171598 A CN 201611171598A CN 108200112 B CN108200112 B CN 108200112B
Authority
CN
China
Prior art keywords
data
nodes
pipeline
data nodes
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201611171598.6A
Other languages
English (en)
Other versions
CN108200112A (zh
Inventor
黄正义
苏致玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanning Fulian Fugui Precision Industrial Co Ltd
Original Assignee
Nanning Fugui Precision Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanning Fugui Precision Industrial Co Ltd filed Critical Nanning Fugui Precision Industrial Co Ltd
Publication of CN108200112A publication Critical patent/CN108200112A/zh
Application granted granted Critical
Publication of CN108200112B publication Critical patent/CN108200112B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1074Peer-to-peer [P2P] networks for supporting data block transmission mechanisms
    • H04L67/1078Resource delivery mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1074Peer-to-peer [P2P] networks for supporting data block transmission mechanisms
    • H04L67/1078Resource delivery mechanisms
    • H04L67/108Resource delivery mechanisms characterised by resources being split in blocks or fragments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Multi Processors (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一种分布式存储方法,应用于分布式存储系统中。所述方法包括步骤:拆分原文件成数据包,并存储到数据包队列,分配多个数据节点形成一个管道以传输所述数据包中的同一数据包;当所述管道中的第一个数据节点被确认写入数据包后,再次分配多个数据节点形成另一个管道以传输所述数据包中的另一个数据包;当管道中所有的数据节点被确认写入数据包后,对所述管道进行传输;及所述管道被传输至所述分布式文件系统的目的区域后,读取所述管道中的数据包,并解散所述管道,释放所述管道的数据节点。本发明还提供一种分布式存储系统。本发明可以提高分布式文件存储所需的数据传输速度。

Description

分布式存储方法及系统
技术领域
本发明涉及数据处理技术,尤其是涉及一种分布式存储方法及系统。
背景技术
随着网络大数据技术的高速发展,分布式文件系统得到了广泛的应用和发展。当前主流的分布式文件系统包括Google文件系统(GFS),Hadoop分布式文件系统(HDFS),文件系统(Lustre),可扩展的高性能分布式文件系统(Ceph)等。这些分布式文件系统的架构和基本原理大致相同,主要由元数据节点、数据节点和客户节点组成。虽然分布式文件系统的传输速度是非常快速的,然而还是不能够适应日益增长的大数据的传输要求。所述分布式文件系统的传输速度主要体现为存储所需的传输速度,因此,一种快速和高效的存储传输方法或者系统是迫切需要的。
发明内容
鉴于以上内容,有必要提供一种分布式存储方法,可以提高分布式文件系统的数据存储所需的传输速度。
鉴于以上内容,还有必要提供一种分布式存储系统,用以提高分布式文件系统的数据存储所需的传输速度。
所述分布式存储方法包括步骤:拆分原文件成数据包,并存储到数据包队列。分配多个数据节点形成一个管道以传输所述数据包中的同一数据包。当所述管道中的第一个数据节点被确认写入数据包后,再次分配多个数据节点形成另一个管道以传输所述数据包中的另一个数据包。当管道中所有的数据节点被确认写入数据包后,对所述管道进行传输,及所述管道被传输至所述分布式文件系统的目标区域后,读取所述管道中的数据包,并解散所述管道,释放所述多个数据节点。
所述分布式存储系统包括:拆分模块,用于将原文件拆分成数据包。第一存储模块,用于存储所述数据包。数据节点管理器,用于分配多个数据节点形成一个管道以传输所述数据包中的同一数据包,当所述管道中的第一个数据节点被确认写入数据包后,再次分配多个数据节点形成另一个管道以传输所述数据包中的另一个数据包;传输模块,用于将所述多个数据节点均确认写入了数据包的管道传输至所述分布式文件系统的目标区域,将所述管道中的数据包读取出来,并解散所述管道,释放所述多个数据节点。
相较于现有技术,所述的分布式存储系统及分布式存储方法,在原有的分布式文件系统的架构上,增加数据节点管理器,将响应时长最短的数据节点依次分配给每一个管道做第一个数据节点以提高每一个管道的传输速度;并在前一个管道的第一个数据节点写入数据包并确认后形成另一个管道,保证存储传输的准确性;多管道并行传输,提高分布式存储的效率。因此,该分布式存储系统及分布式存储方法大幅度提升了现有的分布式文件系统的存储相关的文件数据的传输速度。
附图说明
图1是本发明较佳实施例之分布式存储系统的框架图。
图2是本发明较佳实施例之分布式存储系统的功能模块图。
图3是本发明较佳实施例之分布式存储系统的数据节点分配图。
图4是本发明较佳实施例之分布式存储系统的管道传输图。
图5是本发明较佳实施例之分布式存储方法的流程图。
主要元件符号说明
分布式存储系统 1
本地文件 2
客户端节点 10
客户端 13
元数据节点 20
数据节点 30
存储器 40
处理器 50
数据流模块 100
拆分模块 101
第一存储模块 103
传输模块 105
数据节点管理器 200
申请模块 201
分配模块 203
第二存储模块 205
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
参阅图1所示,是本发明较佳实施例之分布式存储系统1的框架图,其用于将本地文件2存储至分布式文件系统的目标区域。所述分布式存储系统1主要由客户端节点10、元数据节点20和数据节点30组成。所述分布式文件系统包括如背景技术中所述GFS,HDFS,Lustre,Ceph以及其他相类似架构的分布式文件系统。所述元数据节点20和所述数据节点30分别位于相应的元数据节点服务器和数据节点服务器。所述数据节点30用于装载文件数据以传输到分布式文件系统的目标区域。所述元数据节点20用于控制所述数据节点30并存储所述数据节点30装载的文件数据的元数据。
所述客户端节点10包括供用户进行控制和操作之客户端13。客户端13可以认为是PC机、计算机或具有存储和处理功能的电子装置。所述客户端13执行分布式存储功能时,创建数据流模块100,并激活数据节点管理器200。所述数据流模块100用于对将本地文件2拆分成数据包,使其适于存储的传输要求,所述传输包括写入传输和读取传输。
所述数据节点管理器200用于与所述元数据节点20通信。所述数据节点管理器200根据经由数据流模块100拆分后的数据包向元数据节点20申请数据节点,接著根据申请到的数据节点特性,将所述数据节点分配给数据流模块100以用于传输所述数据包。
参阅图2所示,是本发明较佳实施例之分布式存储系统的功能模块图。所述分布式存储系统1功能模块包括客户端节点10、元数据节点20、数据节点30。所述客户端节点10包括数据流模块100和客户端13。所述数据流模块100包括拆分模块101、第一存储模块103和传输模块105。所述客户端13主要包括数据节点管理器,所述数据节点管理器200包括申请模块201、分配模块203和第二存储模块205。位述模块被配置成由一个或多个处理器(本实施例为处理器50)执行,以完成本发明。本发明所称的模块是完成一特定功能的计算机程序段。存储器40用于分布式存储系统1的程序代码等资料。
图3是本发明较佳实施例之分布式存储系统的数据节点分配图,图4是本发明较佳实施例之分布式存储系统的管道传输图。以下将参阅图3和图4,对图2所示功能模块进行详细说明。
所述拆分模块101在接收到本地文件2向分布式存储系统1的存储请求时,根据预先配置的数据包格式和大小将所述本地文件2拆分成多个数据包,并将所述数据包以队列形式存储到第一存储模块103中。所述数据包大小在默认情况下为64M,也可以根据使用者需要设置成其他的大小,为了提高传输效率,所述数据包最小为64M。然后,所述拆分模块101向所述数据节点管理器200发出任务请求。
所述申请模块201接收到所述拆分模块101的任务请求后,向元数据节点20申请对应的数据节点数量,并将元数据节点20分配的数据节点存储于第二存储模块205中。所述向元数据节点20申请数据节点,是根据分布式文件系统中规定的管道中数据节点的数量、同时传输的管道数量、数据包队列中数据包的数量以及统计的无效数据节点出现概率综合考量后计算得到的数值。一个管道完成传输一个数据包后,该管道中的数据节点将被释放以进行重新分配,因此,同一时间内,使用的最大数据节点的数量不超过同时传输的管道数量与每一管道中的数据节点的数量的乘积。值得注意的是,一个管道的数据节点数量是由分布式文件系统所规定的,而同时传输的管道数量可以根据带宽设置。
例如,用以传输一个数据包的一个管道中的数据节点数量为3个,第一存储模块103中共有100个数据包需要传输。当同时传输的管道数量大于数据包队列中数据包的数量时,则同一时间内,使用的最大数据节点数为3*100个。然而,当同时传输的管道数小于数据包队列中数据包的数量时,例如同时传输的管道数量为10个,则此时使用的最大数据节点数为3*10个。
另外,申请数据节点时,还会根据统计的以往的出现无效数据节点的概率决定最终申请的数据节点数量。假如以上举例,用以传输数据包的管道中的数据节点数量为3个,第一存储模块103中共有100个数据包需要传输,同时传输的管道数量大于100,且无效数据节点的出现概率为30%,则所述申请模块201应申请3*100/(1-30%)个数据节点。
所述分配模块203用于根据第一存储模块103中数据包队列中所述数据包的数量,将第二存储模块205中存储的数据节点30按响应速度进行排序并编号,然后依次选择响应速度最快的数据节点用以作为传输所述第一存储模块103中的所述数据包的每一管道的第一个数据节点,如表1所示。
表1
数据节点 响应时间
5 50ms
1 100ms
6 200ms
2 200ms
8 250ms
10 300ms
…… ……
表1为分配模块203将所述第二存储模块205中存储的数据节点30按响应速度进行排序并编号,得到的响应速度最快的数据节点5,1,6,2等。
再请参阅图3所示,数据流模块100中的所述拆分模块101将本地文件2拆分成数据包1、数据包2和数据包3并存储于数据流模块100中的所述第一存储模块103,然后向数据节点管理器200发送任务请求。
假设所述分布式文件系统中规定每个数据包需要3个数据节点传输,所述数据节点管理器200中的申请模块201再根据统计以往的无效数据节点出现概率,每个数据包额外申请3个数据节点以做替换使用。值得注意的是,额外申请的数据节点可以是其他规则产生的数量,这里不做限制。因此,所述申请模块201根据所述第一存储模块103中的3个数据包向所述元数据节点20申请3*3+3*3=18个数据节点,并存储于所述第二存储模块203中。然后,所述数据节点管理器200中的所述分配模块205将所述第二存储模块203中的数据节点30根据响应速度进行排序,得到以上表格中数据节点的编号及响应时间,其中响应速度相同的数据节点随机排位。
在本实施例中,所述分配模块205分配多个数据节点形成第一管道以传输所述数据包1。值得注意的是,所述分配模块205是在响应速度排序在前面一定区间内(例如前6位)选择响应速度最快的数据节点5作为传输所述数据包1的所述第一管道的第一个数据节点,然后在排序前6位以后的数据节点中随机选择两个数据节点作为所述第一管道的第二和第三个数据节点。初步分配完后向所述数据流模块100发送所述数据包1的准备写入信息。
所述数据流模块100中的传输模块105接收到所述分配模块205发送的准备写入信息后,将所述第一存储模块103中的所述数据包1写入到所述数据节点5中。当所述数据包1确认写入到所述第一管道的所述数据节点5中后,所述数据包1再通过所述数据节点5,继续写入到所述第一管道的第二和第三数据节点中。同时,所述分配模块205再次分配多个数据节点形成第二管道以传输所述数据包2。所述分配模块205在响应速度排序前6位中选择响应速度最快的数据节点1分别作为传输所述数据包2的所述第二管道的第一个数据节点,然后在排序前6位以后的数据节点中随机选择两个数据节点作为所述第二管道的第二和第三个数据节点。
依照以上方式,再次将数据包2写入到所述第二管道的数据节点1及所述第二管道的第二、第三数据节点。并且,在确认将所述数据包2写入到所述第二管道的数据节点1后,所述分配模块205以同样的方式将数据节点6及排序前6以后的随机两个数据节点分配出来作为第一、第二和第三数据节点以形成第三管道以传输所述数据包3。
所述传输模块105写入数据包到其中一个数据节点后,还需要进行写入确认。当确认失败时,所述传输模块105判定该数据节点为无效数据节点,直接丢弃,并由所述分配模块205重新分配数据节点。例如,当确认失败的数据节点为第一管道、第二管道或者第三管道的第一数据节点时,则从排序前6位的剩余数据节点中重新选择响应时间最快的数据节点用以替换;当确认失败的数据节点为第一管道、第二管道或者第三管道的第二或第三数据节点时,则从排序前6以后的数据节点中重新随机选择。
当数据包写入到管道的三个数据节点并均完成确认写入后,开始进行传输。在本实施方式中,所述数据包1确认写入到所述第一管道中的第一、第二和第三数据节点后,所述第一管道开始进行传输。然后所述数据包2和3依次完成确认写入到所述第二、第三管道中的三个数据节点后并依次进行传输。这样,分别装载所述数据包1,2,3的三个数据节点形成三条管道,前后并行进行传输。根据这种方式,分布式存储系统1能够更加快速有序地将所述数据包1,2,3传输至分布式文件系统的目标区域。所述传输模块105将所述数据包1,2,3传输到所述分布式文件系统的目标区域后,还会将数据包1,2,3提取出来重新组合成原文件以存储。
参阅图5所示,是本发明分布式存储方法较佳实施例的流程图。所述分布式存储方法,应用于所述分布式存储系统,通过处理器50执行存储器40存储的程序代码实现。
步骤S12:根据预先配置的数据包格式和数据包大小将所述本地文件2拆分成多个数据包,并存储到数据包队列中。
步骤S14:根据所述数据包队列中存储的所述数据包数量及数据包大小,向元数据节点20申请数据节点,并将所述数据节点30存储到数据节点队列中。所述申请数据节点数量,是根据分布式文件系统中规定的一个管道的数据节点的数量、同时传输的管道数量、数据包的数量以及统计的无效数据节点出现概率综合考量后计算得到的数值。值得注意的是,一个管道的数据节点数量是由分布式文件系统所规定的,而同时传输的管道数量可以根据带宽设置。
步骤S16:在所述数据节点队列中选择多个数据节点形成一个管道以传输所述数据队列中的同一数据。选择多个数据节点的过程包括选择管道的第一个数据节点和第一个数据节点以外的数据节点。在本实施方式中,以一个管道中包含3个数据节点(顺序为第一、第二和第三个数据节点)为例,首先将所述数据节点队列中的数据节点按响应速度进行排序,然后将排序在前面一定区间之内依次选择响应速度最快的数据节点,作为每一管道的第一个数据节点,在排序前面一定区间之外的数据节点中随机选择数据节点作为每一管道的第二、第三个数据节点。
步骤S18:将所述数据包队列的同一个数据包依次写入到形成的一个管道中的所有数据节点中。将数据包写入到一个管道的过程包括:先将所述数据包写入到所述管道的第一个数据节点,然后通过该第一数据节点继续将所述数据包写入到第一数据节点以外的其他数据节点(如第二、第三数据节点)。
步骤S22:当所述数据包的确认写入到所述管道的第一个数据节点后,将所述数据包队列中的另一数据包以同样的方式依次写入到形成的另一个管道中的所有数据节点中。值得注意的是,当数据包写入到管道中的数据节点时,如果出现写入失败,则判定该数据节点为无效数据节点,直接丢弃并重新从所述数据节点队列中选择数据节点以替换所述无效数据节点。当确认失败的数据节点为管道中的第一数据节点时,则从所述数据节点队列中排序在前面一定区间之内的剩余数据节点中重新选择响应时间最快的数据节点用以替换;当确认失败的数据节点为管道中的第一数据节点以外的数据节点时,则从排序在前面一定区间之外的数据节点中重新随机选择。
步骤S24:依次将所述数据包队列中的一个数据包确认写入到对应的一个管道中的所有数据节点后,该管道开始进行传输。这样,分别装载所述数据包队列中的多个数据包的多个管道前后并行进行传输。然后多管道前后并行进行传输。当一个管道中的所有数据节点的数据包确认完成后,所述数据包传输完成,解散所述管道并释放形成所述管道的数据节点。当所有数据包传输完成后重新组成原文件进行存储。
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (8)

1.一种分布式存储系统,应用于分布式文件系统中,所述分布式存储系统包括元数据节点与数据节点,其特征在于,所述分布式存储系统包括:
拆分模块,用于将原文件拆分成数据包;
第一存储模块,用于存储所述数据包;
数据节点管理器,还包括:
申请模块,用于向所述元数据节点申请数据节点;
第二存储模块,用于存储所述数据节点;
分配模块,用于分配多个数据节点形成一个管道以传输所述数据包中的同一数据包,当所述管道中的第一个数据节点被确认写入数据包后,再次分配多个数据节点形成另一个管道以传输所述数据包中的另一个数据包,根据响应时间对所述数据节点进行排序,并将排序在前面一定区间内的数据节点依次分配给每一管道作为管道中的第一个数据节点;
传输模块,用于将所述多个数据节点均确认写入了数据包的管道传输至所述分布式文件系统的目标区域,将所述管道中的数据包读取出来,并解散所述管道,释放所述多个数据节点。
2.如权利要求1所述的分布式存储系统,其特征在于,所述分配模块还用于从排序在前面一定区间之外的数据节点中随机选择数据节点作为所述每一管道中第一个数据节点以外的其他数据节点。
3.如权利要求1所述的分布式存储系统,其特征在于,所述申请的数据节点的数量是根据一个管道的数据节点的数量、同时传输的管道数量、数据包的数量以及统计的无效数据节点出现概率所决定的。
4.如权利要求1-3任一项所述的分布式存储系统,其特征在于,所述管道中的数据节点的数量最少为3个,同时传输的管道最大数是根据传输带宽进行设置的。
5.一种分布式存储方法,应用于分布式存储系统中,所述分布式存储系统包括元数据节点与数据节点,其特征在于,所述方法包括步骤:
拆分原文件成数据包,并存储到数据包队列;
申请数据节点,并存储到数据节点队列;
分配多个数据节点形成一个管道以传输所述数据包中的同一数据包;
当所述管道中的第一个数据节点被确认写入数据包后,再次分配多个数据节点形成另一个管道以传输所述数据包中的另一个数据包;
根据响应时间对所述数据节点进行排序,并将排序在前面一定区间内的数据节点依次分配给每一管道作为管道中的第一个数据节点;
当管道中所有的数据节点被确认写入数据包后,对所述管道进行传输;及
所述管道被传输至所述分布式文件系统的目标区域后,读取所述管道中的数据包,并解散所述管道,释放所述多个数据节点。
6.如权利要求5所述的分布式存储方法,其特征在于,所述分配多个数据节点步骤还包括从排序在前面一定区间之外的数据节点中随机选择数据节点作为所述每一管道中第一数据节点以外的其他数据节点。
7.如权利要求5所述的分布式存储方法,其特征在于,所述申请的数据节点的数量是根据一个管道的数据节点的数量、同时传输的管道数量、数据包的数量以及统计的无效数据节点出现概率所决定的。
8.如权利要求5-7任一项所述的分布式存储方法,其特征在于,所述管道中的数据节点数最少为3个,同时传输的管道最大数是根据传输带宽进行设置的。
CN201611171598.6A 2016-12-08 2016-12-17 分布式存储方法及系统 Expired - Fee Related CN108200112B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/372405 2016-12-08
US15/372,405 US10447763B2 (en) 2016-12-08 2016-12-08 Distributed storage method and system

Publications (2)

Publication Number Publication Date
CN108200112A CN108200112A (zh) 2018-06-22
CN108200112B true CN108200112B (zh) 2021-04-20

Family

ID=62490401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611171598.6A Expired - Fee Related CN108200112B (zh) 2016-12-08 2016-12-17 分布式存储方法及系统

Country Status (3)

Country Link
US (1) US10447763B2 (zh)
CN (1) CN108200112B (zh)
TW (1) TWI658370B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3832464A1 (en) * 2019-12-06 2021-06-09 Tata Consultancy Services Limited System and method for selection of cloud service providers in a multi-cloud
US11165886B2 (en) * 2020-01-03 2021-11-02 Bank Of America Corporation Multi-distribution resource allocation system
CN111641709B (zh) * 2020-05-29 2022-12-27 苏州浪潮智能科技有限公司 一种分布式系统的带宽控制方法、系统、设备以及介质
CN112667592B (zh) * 2020-12-24 2024-05-07 平安科技(深圳)有限公司 数据存储方法、装置、计算机设备和存储介质
CN113297324B (zh) * 2021-04-13 2023-05-23 福建天泉教育科技有限公司 一种数据写入的优化方法及终端
CN116821046B (zh) * 2023-08-28 2023-11-24 上海燧原智能科技有限公司 异构单元间的数据自动同步方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5583995A (en) * 1995-01-30 1996-12-10 Mrj, Inc. Apparatus and method for data storage and retrieval using bandwidth allocation
US8281218B1 (en) * 2009-11-02 2012-10-02 Western Digital Technologies, Inc. Data manipulation engine
CN102882983A (zh) * 2012-10-22 2013-01-16 南京云创存储科技有限公司 一种云存储系统中提升并发访问性能的数据快速存储方法
CN103685373A (zh) * 2012-09-10 2014-03-26 联想(北京)有限公司 数据上传装置和数据上传方法
WO2016065229A2 (en) * 2014-10-23 2016-04-28 Vormetric, Inc. Access control for data blocks in a distributed filesystem
CN106060160A (zh) * 2016-07-07 2016-10-26 腾讯科技(深圳)有限公司 一种文件上传方法及装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6407752B1 (en) 1997-04-29 2002-06-18 International Business Machines Corporation Method and system for a user interface for remote FTP hosts
US7209972B1 (en) * 1997-10-30 2007-04-24 Commvault Systems, Inc. High speed data transfer mechanism
US20030132967A1 (en) * 2002-01-15 2003-07-17 Ram Gangadharan System and method for a drag and drop interface for transfer of multiple files between a web enabled device and a web server
WO2005065084A2 (en) * 2003-11-13 2005-07-21 Commvault Systems, Inc. System and method for providing encryption in pipelined storage operations in a storage network
US7257689B1 (en) * 2004-10-15 2007-08-14 Veritas Operating Corporation System and method for loosely coupled temporal storage management
CN101753592B (zh) * 2008-11-28 2013-04-17 国际商业机器公司 用于数据处理的方法和系统
US8375070B2 (en) * 2010-09-02 2013-02-12 International Business Machines Corporation Collective operations in a file system based execution model
JP2012059152A (ja) * 2010-09-10 2012-03-22 Internatl Business Mach Corp <Ibm> データ処理を行うシステムおよびメモリを割り当てる方法
CN103092487A (zh) * 2011-10-27 2013-05-08 腾讯科技(深圳)有限公司 上传和下载文件的方法及装置
JP5867206B2 (ja) * 2012-03-16 2016-02-24 富士通株式会社 移動制御装置,プログラム及びストレージ装置
US9183065B1 (en) * 2012-11-01 2015-11-10 Amazon Technologies, Inc. Providing access to an application programming interface through a named pipe
CN103853613A (zh) 2012-12-04 2014-06-11 中山大学深圳研究院 一种基于分布式存储下的数字家庭内容读数据的方法
US9087098B2 (en) * 2012-12-17 2015-07-21 General Electric Company System and method for storage, querying, and analysis service for time series data
US9460178B2 (en) * 2013-01-25 2016-10-04 Dell Products L.P. Synchronized storage system operation
CN104679772B (zh) * 2013-11-29 2019-01-25 深圳市腾讯计算机系统有限公司 分布式数据仓库中删除文件的方法、装置、设备及系统
US10291696B2 (en) * 2014-04-28 2019-05-14 Arizona Board Of Regents On Behalf Of Arizona State University Peer-to-peer architecture for processing big data
CN104462324A (zh) 2014-12-03 2015-03-25 浪潮电子信息产业股份有限公司 一种hdfs多线程并行下载方法
WO2016058289A1 (zh) * 2015-01-20 2016-04-21 北京大学深圳研究生院 一种能修复多个节点失效的mds纠删码
CN106294357B (zh) * 2015-05-14 2019-07-09 阿里巴巴集团控股有限公司 数据处理方法和流计算系统
US9619148B2 (en) * 2015-07-27 2017-04-11 Sas Institute Inc. Distributed data set storage and retrieval
CN106649406B (zh) * 2015-11-04 2020-04-28 华为技术有限公司 一种自适应存储文件的方法和装置
US11146613B2 (en) * 2016-07-29 2021-10-12 International Business Machines Corporation Distributed computing on document formats
US10803023B2 (en) * 2017-04-02 2020-10-13 Sas Institute Inc. Techniques for reading from and writing to distributed data stores

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5583995A (en) * 1995-01-30 1996-12-10 Mrj, Inc. Apparatus and method for data storage and retrieval using bandwidth allocation
US8281218B1 (en) * 2009-11-02 2012-10-02 Western Digital Technologies, Inc. Data manipulation engine
CN103685373A (zh) * 2012-09-10 2014-03-26 联想(北京)有限公司 数据上传装置和数据上传方法
CN102882983A (zh) * 2012-10-22 2013-01-16 南京云创存储科技有限公司 一种云存储系统中提升并发访问性能的数据快速存储方法
WO2016065229A2 (en) * 2014-10-23 2016-04-28 Vormetric, Inc. Access control for data blocks in a distributed filesystem
CN106060160A (zh) * 2016-07-07 2016-10-26 腾讯科技(深圳)有限公司 一种文件上传方法及装置

Also Published As

Publication number Publication date
US10447763B2 (en) 2019-10-15
US20180167439A1 (en) 2018-06-14
TW201824015A (zh) 2018-07-01
CN108200112A (zh) 2018-06-22
TWI658370B (zh) 2019-05-01

Similar Documents

Publication Publication Date Title
CN108200112B (zh) 分布式存储方法及系统
US11888599B2 (en) Scalable leadership election in a multi-processing computing environment
US9367600B2 (en) Policy-based storage structure distribution
US8671134B2 (en) Method and system for data distribution in high performance computing cluster
US8826284B1 (en) Scalable task scheduling
US10102086B2 (en) Replicated database distribution for workload balancing after cluster reconfiguration
US9197695B2 (en) Redundant data requests with cancellation
US8838595B2 (en) Operating on objects stored in a distributed database
US8984085B2 (en) Apparatus and method for controlling distributed memory cluster
US8930316B2 (en) System and method for providing partition persistent state consistency in a distributed data grid
US9185160B2 (en) Resource reservation protocol over unreliable packet transport
US20160275123A1 (en) Pipeline execution of multiple map-reduce jobs
US9256506B1 (en) System and method for performing operations on target servers
US7917495B1 (en) System and method for processing query requests in a database system
CN110058940B (zh) 一种多线程环境下的数据处理方法及装置
Ibrahim et al. Intelligent data placement mechanism for replicas distribution in cloud storage systems
WO2018031339A1 (en) Repartitioning data in a distributed computing system
CN1602480A (zh) 管理附装在数据网络上的存储器资源
CN113886430A (zh) 查询可重新开始性
KR102182493B1 (ko) 스몰 데이터 기계 학습을 위한 노드 관리 시스템
US7797333B1 (en) System and method for returning results of a query from one or more slave nodes to one or more master nodes of a database system
WO2015001596A1 (ja) 系列データ並列分析基盤およびその並列分散処理方法
US7406461B1 (en) System and method for processing a request to perform an activity associated with a precompiled query
RU2721235C2 (ru) Способ и система для маршрутизации и выполнения транзакций
US10824640B1 (en) Framework for scheduling concurrent replication cycles

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210420

CF01 Termination of patent right due to non-payment of annual fee