CN107832138A - 一种扁平化的高可用namenode模型的实现方法 - Google Patents

一种扁平化的高可用namenode模型的实现方法 Download PDF

Info

Publication number
CN107832138A
CN107832138A CN201710860998.6A CN201710860998A CN107832138A CN 107832138 A CN107832138 A CN 107832138A CN 201710860998 A CN201710860998 A CN 201710860998A CN 107832138 A CN107832138 A CN 107832138A
Authority
CN
China
Prior art keywords
namenode
leader
client
follower
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710860998.6A
Other languages
English (en)
Other versions
CN107832138B (zh
Inventor
胡文龙
王少辉
肖甫
王汝传
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201710860998.6A priority Critical patent/CN107832138B/zh
Publication of CN107832138A publication Critical patent/CN107832138A/zh
Application granted granted Critical
Publication of CN107832138B publication Critical patent/CN107832138B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system

Abstract

本发明公开了一种扁平化的高可用namenode模型的实现方法,该方法解决了分布式文件系统HDFS潜在单点故障问题,实现了负载均衡。该方法包括一种扁平化的三机namenode模型,该模型中包括领导者节点、候选者节点和跟随者节点三种角色的namenode节点协调工作。一个节点可能充当不止一种角色。相较于当前主/备模式的架构,本发明大大缩短了在主节点宕机后,集群重新选主并恢复服务功能的速度,提升了HDFS文件系统响应客户端读请求时的性能。该模型不仅有效地解决了集群的单点故障问题,还实现了namenode服务器处理客户端读请求时各节点的负载均衡,提升了系统整体性能。

Description

一种扁平化的高可用namenode模型的实现方法
技术领域
本发明涉及一种扁平化的高可用namenode模型的实现方法,属于分布式应用技术领域。
背景技术
namenode也称为元数据节点,它的主要功能是管理分布式文件系统中的元数据信息。HDFS中文件的元数据信息包括命名空间、文件到数据块的映射、数据块到数据节点的映射三部分。namenode是否能保持长时间的正常工作,关系到整个分布式文件系统的可用性。
行业中针对namenode潜在的单点故障问题而采取的解决方案大致有3类,分别是secondary Namenode机制、Backup Node机制和Avatar机制。
secondary namenode机制是在运行namenode进程的服务器上,又运行了一个secondary namenode进程。secondary namenode会定期从namenode上下载元数据镜像文件和操作日志,并将其合并为一份准完整的元数据副本,随后回传给namenode并覆盖原来的镜像文件,这一过程称为checkpoint。但checkpoint过程得到的元数据的镜像也只是准完整的,而且随着checkpoint时间变长,数据丢失的风险也会加大。
backup node机制是令namenode实时地将日志传送给backup node,即当namenode有日志时,不仅会写一份到本地日志文件中,同时还会向backup node中写一份。相较于secondary namenode每隔一段时间从namenode上下载镜像文件和操作日志,backup node可以实时地将得到操作日志合并到镜像文件中。该方案的优点在于实现了低延迟的日志复制,命名空间元数据可以实时同步更新。其缺点是块位置的映射信息未在内存同步,主备节点切换后,需要等待datanode上传自己所含的块信息,造成切换时间较长。
avatar机制由社交媒体网站FaceBook提出。avatar机制包含两个namenode节点,一个为primary namenode,另一个为standby namenode,primary namenode接替原生的namenode角色,负责响应客户端的请求并在内存中维护一份元数据信息。而standbynamenode是一个一直处于safemode(安全模式)的节点,它只维护元数据信息,不接受客户端的请求。在primary namenode宕机时,standby namenode切换为primary namenode的耗时非常短。但缺点是standby namenode在primary namenode正常工作情况下,负责的工作仅仅是同步元数据信息,并不对客户端提供任何服务。
HDFS作为Hadoop的分布式文件系统,由于设计的原因在架构上只设置了一个namenode节点,而这一个namenode节点既要处理来自客户端的所有读、写请求,又要承担集群中元数据的维护管理任务。这种单一主节点配若干从节点的典型分布式应用架构模型所潜藏的单点故障问题是HDFS高可用性的一大隐患。
发明内容
本发明目的在于针对上述现有技术的不足,提出了一种扁平化的高可用namenode模型的实现方法,该方法解决了分布式文件系统HDFS潜在单点故障问题,实现了负载均衡。
本发明包括一种扁平化的三机namenode模型,该模型中包括领导者节点、候选者节点和跟随者节点三种角色的namenode节点协调工作。一个节点可能充当不止一种角色。相较于当前主/备模式的架构,本发明大大缩短了在主节点宕机后,集群重新选主并恢复服务功能的速度,提升了HDFS文件系统响应客户端读请求时的性能。
本发明所涉及的一些关键词定义包括如下:
领导者namenode:
处理客户端提交的读或写请求,并完成元数据同步。一个任期内只存在一个领导者。
候选者namenode:
可以通过获得超过半数跟随者namenode的选票成为一个任期内的领导者。
跟随者namenode:
可以处理客户端提交的读请求。依据领导者的元数据来同步自己服务器上的元数据。
任期:
从一轮选举开始到下一轮选举开始之间称作一个任期,每一个任期都有一个唯一的编号。
方法流程:
领导者namenode的选举包括:
步骤1-1:当HDFS刚启动时,所有namenode节点均进入跟随者状态,没有领导者;
步骤1-2:如果在100ms至500ms之间的任意时刻,跟随者namenode没有接收到任何来自领导者namenode的心跳消息(不含数据信息的远程过程调用消息),它就会假定此时集群内没有可达或可用的领导者,那么该跟随者namenode就会发起选举,首先增加自己当前的任期号,创建一个比之前使用过的任何值都要大的新任期号。随即进入候选者角色,并尝试成为整个namenode集群的领导者;
步骤1-3:候选者namenode向其他namenode服务器发送投票请求,同时自己会投给自己一票,在获得集群中超过半数namenode节点反馈的同意响应后,候选者namenode会将自己的状态转换为领导者,并立即向namenode集群中其他服务器发送心跳信息,建立领导者地位;
中断事务包括:
当前候选者namenode如果收到了来自于有效领导者namenode的心跳信息,它就会立即放弃成为领导者的尝试,随即回到跟随者的状态;
候选者经过一个随机的选举超时时间后会再次自增自己的任期号,然后重启新一轮的选举,重复步骤1-3,直至集群最终产生领导者。
客户端从HDFS上读文件包括:
步骤3-1、客户端向namenode集群中任意一台服务器发送读请求。
步骤3-2、接收到来自客户端读请求的namenode服务器随即去目录树中检查HDFS中是否存在该文件。
步骤3-3、如果HDFS中不存在客户端要读的文件,则namenode服务器返回文件不存在异常,如果存在,则返回该文件对应的block及其副本所在的数据节点的列表信息。
步骤3-4、客户端从返回的block信息列表中挑选一个网络拓扑结构中距离最近的datanode服务器并向其发送读文件请求。
步骤3-5、被请求的datanode服务器向客户端传输文件。
崩溃恢复包括:
领导者namenode可能会出现崩溃或者由于网络原因失去与过半跟随者namenode的联系,为了保证日志在每台服务器节点上的完整性与一致性和整个namenode集群的高可用性,此时namenode集群就会进入崩溃恢复过程。
步骤4-1、某些或某一个跟随者namenode会进入候选者状态,并向其他服务器发起投票请求,请求里会包含自身最后一条日志记录信息的索引(lastIndex)以及任期号(lastTerm)。
步骤4-2、当响应投票的服务器接收到请求,它会将候选者的日志信息与自己的日志信息进行比较,如果投票者(跟随者namenode)的日志更完整:
(lastTermfollower>lastTermcandidate)||
((lastTermfollower==lastTermcandidate)&&(lastIndexfollower>lastTermcandidate))
它就会拒绝投票,结果是赢得选举的namenode服务器可以保证比大多数投票者有更完整的日志记录。
步骤4-3、经过上面的步骤已经选举出了领导者namenode,此时,领导者namenode会不断地向跟随者namenode发送包含自己日志信息的心跳消息。
步骤4-4、跟随者namenode根据接收到的心跳消息,删除所有跟领导者namenode不同的日志记录,并将所有丢失的日志记录依照领导者的日志进行补足。
进一步地,本发明所述步骤4-2中当集群中的旧领导者崩溃后,新领导者可以在秒级单位时间内就选举产生,并对外提供服务。相较于现行的主—备模式,大大缩短了集群崩溃恢复的时间,并且从现行的单一namenode节点变成了namenode集群来负责接收所有客户端发来的读、写请求,实现了负载均衡,提升了系统整体性能。
有益效果:
1、本发明的模型不仅有效地解决了集群的单点故障问题,还实现了namenode服务器处理客户端读请求时各节点的负载均衡,提升了系统整体性能。
2、本发明提高了HDFS的高可用性,并且提高了namenode节点的高可用性,而且提升了文件系统的整体性能。
3、本发明大大缩短了在主节点宕机后,集群重新选主并恢复服务功能的速度,提升了HDFS文件系统响应客户端读请求时的性能。
附图说明
图1为客户端向namenode集群请求写文件示意图。
图2为客户端向namenode集群请求读文件示意图。
图3为namenode状态转换示意图。
具体实施方式
下面结合说明书附图对本发明创造作进一步的详细说明。
本发明是一种扁平化的分布式一致性日志模型。如图3所示,模型中需要三种角色的节点来协调工作:领导者(Leader)节点、候选者(Candidate)节点和跟随者(Follower)节点。在具体的实施中,一个进程可能充当不止一种角色。相较于传统的基于paxos协议的日志模型,该日志模型采用了更高效的分布式一致性协议raft,主要提高了主—从结构的分布式应用在主节点崩溃后,集群重新选主并恢复服务功能的速度。
本发明领导者的选举实施过程包含在以下具体步骤:
领导者namenode的选举包括:
步骤1)当HDFS刚启动时,所有namenode节点均进入跟随者状态,没有领导者。
步骤2)如果在100ms至500ms之间的任意时刻,跟随者namenode没有接收到任何来自领导者namenode的心跳消息(不含数据信息的远程过程调用消息),它就会假定此时集群内没有可达或可用的领导者,那么该跟随者namenode就会发起选举,首先增加自己当前的任期号,创建一个比之前使用过的任何值都要大的新任期号。随即进入候选者角色,尝试成为整个namenode集群的领导者。
步骤3)候选者namenode向其他namenode服务器发送投票请求,同时自己会投给自己一票。在获得集群中超过半数namenode节点反馈的同意响应后,候选者namenode会将自己的状态转换为领导者,并立即向namenode集群中其他服务器发送心跳信息,建立领导者地位。中断事务:
namenode集群中可能存在着其他候选者试图竞选领导者,并成功获取多数票当选为领导者。此时,当前候选者namenode如果收到了来自于有效领导者namenode的心跳信息,它就会立即放弃成为领导者的尝试,随即回到跟随者的状态。
由于namenode集群中存在多个候选者,这些候选者namenode分摊了来自跟随者的选票,造成谁都没有获得多数票,谁都无法当选领导者的情况。解决方案是,候选者经过一个随机的选举超时时间后会再次自增自己的任期号,然后重启新一轮的选举,重复步骤3,直至集群最终产生领导者。
客户端向HDFS上写文件包括:
当领导者namenode被选举出来后,就可以接收来自客户端的请求,请求可以分为读请求和写请求两种类型。
步骤1)如图1所示,客户端向领导者提交写一个数据块的请求。
步骤2)领导者首先去本机内存中维护的元数据的目录树中检查客户端所请求写入的文件是否已存在于HDFS上,若没有,则会去datanode信息池中挑选副本数量个datanode服务器作为客户端可写入文件的数据节点,并将客户端申请写入HDFS的文件的元信息和挑选出来的datanode节点元信息作为一条日志发送给一致性模块。
步骤3)领导者namenode中的一致性模块向所有跟随者namenode同步日志。日志同步完成后将之前挑选出来的datanode数据节点列表信息返回给客户端。
步骤4)客户端在接收到领导者namenode返回的datanode列表信息后开始往这些datanode上写文件。
客户端从HDFS上读文件包括:
步骤1)如附图2所示,客户端向namenode集群中任意一台服务器发送读请求。
步骤2)接收到来自客户端读请求的namenode服务器随即去目录树中检查HDFS中是否存在该文件。
步骤3)如果HDFS中不存在客户端要读的文件,则namenode服务器返回文件不存在异常,如果存在,则返回该文件对应的block及其副本所在的数据节点的列表信息。
步骤4)客户端从返回的block信息列表中挑选一个网络拓扑结构中距离最近的datanode服务器并向其发送读文件请求。
步骤5)被请求的datanode服务器向客户端传输文件。
崩溃恢复包括:
领导者namenode可能会出现崩溃或者由于网络原因失去与过半跟随者namenode的联系,为了保证日志在每台服务器节点上的完整性与一致性和整个namenode集群的高可用性,此时namenode集群就会进入崩溃恢复过程。
步骤1)某些或某一个跟随者namenode会进入候选者状态,并向其他服务器发起投票请求,请求里会包含自身最后一条日志记录信息的索引(lastIndex)以及任期号(lastTerm)。
步骤2)当响应投票的服务器接收到请求,它会将候选者的日志信息与自己的日志信息进行比较,如果投票者(跟随者namenode)的日志更完整:
(lastTermfollower>lastTermcandidate)||
((lastTermfollower==lastTermcandidate)&&(lastIndexfollower>lastTermcandidate))
它就会拒绝投票,结果是赢得选举的namenode服务器可以保证比大多数投票者有更完整的日志记录。
步骤3)经过上面的步骤已经选举出了领导者namenode,此时,领导者namenode会不断地向跟随者namenode发送包含自己日志信息的心跳消息。
步骤4)跟随者namenode根据接收到的心跳消息,删除所有跟领导者namenode不同的日志记录,并将所有丢失的日志记录依照领导者的日志进行补足。
以上所述仅是本发明的优选实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种扁平化的高可用namenode模型的实现方法,其特征在于,领导者namenode的选举步骤:
步骤1-1:当HDFS刚启动时,所有namenode节点均进入跟随者状态,没有领导者;
步骤1-2:如果在100ms至500ms之间的任意时刻,跟随者namenode没有接收到任何来自领导者namenode的心跳消息,不含数据信息的远程过程调用消息,它就会假定此时集群内没有可达或可用的领导者,那么该跟随者namenode就会发起选举,首先增加自己当前的任期号,创建一个比之前使用过的任何值都要大的新任期号,随即进入候选者角色,并尝试成为整个namenode集群的领导者;
步骤1-3:候选者namenode向其他namenode服务器发送投票请求,同时自己会投给自己一票,在获得集群中超过半数namenode节点反馈的同意响应后,候选者namenode会将自己的状态转换为领导者,并立即向namenode集群中其他服务器发送心跳信息,建立领导者地位;
中断事务包括:
当前候选者namenode如果收到了来自于有效领导者namenode的心跳信息,它就会立即放弃成为领导者的尝试,随即回到跟随者的状态;
候选者经过一个随机的选举超时时间后会再次自增自己的任期号,然后重启新一轮的选举,重复步骤1-3,直至集群最终产生领导者。
2.根据权利要求1所述的一种扁平化的高可用namenode模型的实现方法,其特征在于,当领导者namenode被选举出来后,就能接收来自客户端的请求,请求可以分为读请求和写请求两种类型,包括:
步骤2-1:客户端向领导者提交写一个数据块的请求;
步骤2-2:领导者首先去本机内存中维护的元数据的目录树中检查客户端所请求写入的文件是否已存在于HDFS上,若没有,则会去datanode信息池中挑选副本数量个datanode服务器作为客户端可写入文件的数据节点,并将客户端申请写入HDFS的文件的元信息和挑选出来的datanode节点元信息作为一条日志发送给一致性模块;
步骤2-3:领导者namenode中的一致性模块向超过半数跟随者namenode同步日志,日志同步完成后将之前挑选出来的datanode数据节点列表信息返回给客户端;
步骤2-4:客户端在接收到领导者namenode返回的datanode列表信息后开始往这些datanode上写文件。
3.根据权利要求2所述的一种扁平化的高可用namenode模型的实现方法,其特征在于,所述的客户端从HDFS上读文件包括:
步骤3-1:客户端向namenode集群中任意一台服务器发送读请求;
步骤3-2:接收到来自客户端读请求的namenode服务器随即去目录树中检查HDFS中是否存在该文件;
步骤3-3:如果HDFS中不存在客户端要读的文件,则namenode服务器返回文件不存在异常,如果存在,则返回该文件对应的block及其副本所在的数据节点的列表信息;
步骤3-4:客户端从返回的block信息列表中挑选一个网络拓扑结构中距离最近的datanode服务器并向其发送读文件请求;
步骤3-5:被请求的datanode服务器向客户端传输文件。
4.根据权利要求1所述的一种扁平化的高可用namenode模型的实现方法,其特征在于,当领导者namenode出现崩溃或由于网络原因失去与过半跟随者namenode的联系,为了保证日志在每台服务器节点上的完整性与一致性和整个namenode集群的高可用性,此时namenode集群就会进入崩溃恢复过程,包括:
步骤4-1:某些或某一个跟随者namenode会进入候选者状态,并向其他服务器发起投票请求,请求里会包含自身最后一条日志记录信息的索引(lastIndex)以及任期号(lastTerm);
步骤4-2:当响应投票的服务器接收到请求,它会将候选者的日志信息与自己的日志信息进行比较,如果投票者(跟随者namenode)的日志更完整,它就会拒绝投票;
步骤4-3:经过上面的步骤已经选举出了领导者namenode,此时,领导者namenode会不断地向跟随者namenode发送包含自己日志信息的心跳消息;
步骤4-4:跟随者namenode根据接收到的心跳消息,删除所有跟领导者namenode不同的日志记录,并将所有丢失的日志记录依照领导者的日志进行补足。
5.根据权利要求4所述的一种扁平化的高可用namenode模型的实现方法,其特征在于,所述步骤4-2中当集群中的旧领导者崩溃后,新领导者可以在秒级单位时间内就选举产生,并对外提供服务,从现行的单一namenode节点变成了namenode集群来负责接收所有客户端发来的读、写请求。
CN201710860998.6A 2017-09-21 2017-09-21 一种扁平化的高可用namenode模型的实现方法 Active CN107832138B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710860998.6A CN107832138B (zh) 2017-09-21 2017-09-21 一种扁平化的高可用namenode模型的实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710860998.6A CN107832138B (zh) 2017-09-21 2017-09-21 一种扁平化的高可用namenode模型的实现方法

Publications (2)

Publication Number Publication Date
CN107832138A true CN107832138A (zh) 2018-03-23
CN107832138B CN107832138B (zh) 2021-09-14

Family

ID=61643942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710860998.6A Active CN107832138B (zh) 2017-09-21 2017-09-21 一种扁平化的高可用namenode模型的实现方法

Country Status (1)

Country Link
CN (1) CN107832138B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108737156A (zh) * 2018-04-08 2018-11-02 广东睿江云计算股份有限公司 一种基于多对等NameNode分布式文件系统及写入方法
CN110213352A (zh) * 2019-05-17 2019-09-06 北京航空航天大学 名字空间统一的分散自治存储资源聚合方法
CN110597809A (zh) * 2019-08-21 2019-12-20 中山大学 一种支持树状数据结构的一致性算法系统及其实现方法
CN111352943A (zh) * 2018-12-24 2020-06-30 华为技术有限公司 实现数据一致性的方法和装置、服务器和终端
CN112636345A (zh) * 2020-12-29 2021-04-09 浙江中力机械有限公司 一种基于分布式多机器人充电站分配问题的求解方法
CN113014634A (zh) * 2021-02-20 2021-06-22 成都新希望金融信息有限公司 集群选举处理方法、装置、设备及存储介质
CN114020357A (zh) * 2021-11-04 2022-02-08 湖北美和易思教育科技有限公司 namenode节点的启动方法、装置、系统及介质
CN114338695A (zh) * 2022-03-10 2022-04-12 深圳艾灵网络有限公司 基于多副本的领导者选举方法、装置、设备及存储介质
CN114363350A (zh) * 2021-12-14 2022-04-15 中科曙光南京研究院有限公司 一种服务治理系统及方法
CN115051913A (zh) * 2022-08-12 2022-09-13 杭州悦数科技有限公司 Raft配置变更方法和装置
CN116028250A (zh) * 2021-10-26 2023-04-28 慧与发展有限责任合伙企业 具有多个集群级别的分解式存储

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103152395A (zh) * 2013-02-05 2013-06-12 北京奇虎科技有限公司 一种分布式文件系统的存储方法及装置
CN104008152A (zh) * 2014-05-21 2014-08-27 华南理工大学 支持海量数据访问的分布式文件系统的架构方法
CN104731921A (zh) * 2015-03-26 2015-06-24 江苏物联网研究发展中心 Hadoop分布式文件系统针对日志型小文件的存储和处理方法
CN104765661A (zh) * 2014-12-30 2015-07-08 深圳市安云信息科技有限公司 一种云存储服务中元数据服务节点的多节点热备方法
CN105069152A (zh) * 2015-08-25 2015-11-18 航天恒星科技有限公司 数据处理方法及装置
US20160078052A1 (en) * 2010-06-19 2016-03-17 Mapr Technologies, Inc. Map-Reduce Ready Distributed File System
CN105512266A (zh) * 2015-12-03 2016-04-20 曙光信息产业(北京)有限公司 一种实现分布式数据库操作一致性的方法及装置
US20160275092A1 (en) * 2015-03-17 2016-09-22 Vm-Robot, Inc. Web Browsing Robot System And Method
CN106161495A (zh) * 2015-03-25 2016-11-23 中兴通讯股份有限公司 一种主节点选举方法、装置及存储系统
CN106357452A (zh) * 2016-09-29 2017-01-25 上海和付信息技术有限公司 一种单点异构数据存储的高可用框架系统及其实现方法
CN106407385A (zh) * 2016-09-14 2017-02-15 北京百度网讯科技有限公司 数据管理方法、设备和系统
CN106789197A (zh) * 2016-12-07 2017-05-31 高新兴科技集团股份有限公司 一种集群选举方法及系统
CN106909451A (zh) * 2017-02-28 2017-06-30 郑州云海信息技术有限公司 一种分布式任务调度系统及方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160078052A1 (en) * 2010-06-19 2016-03-17 Mapr Technologies, Inc. Map-Reduce Ready Distributed File System
CN103152395A (zh) * 2013-02-05 2013-06-12 北京奇虎科技有限公司 一种分布式文件系统的存储方法及装置
CN104008152A (zh) * 2014-05-21 2014-08-27 华南理工大学 支持海量数据访问的分布式文件系统的架构方法
CN104765661A (zh) * 2014-12-30 2015-07-08 深圳市安云信息科技有限公司 一种云存储服务中元数据服务节点的多节点热备方法
US20160275092A1 (en) * 2015-03-17 2016-09-22 Vm-Robot, Inc. Web Browsing Robot System And Method
CN106161495A (zh) * 2015-03-25 2016-11-23 中兴通讯股份有限公司 一种主节点选举方法、装置及存储系统
CN104731921A (zh) * 2015-03-26 2015-06-24 江苏物联网研究发展中心 Hadoop分布式文件系统针对日志型小文件的存储和处理方法
CN105069152A (zh) * 2015-08-25 2015-11-18 航天恒星科技有限公司 数据处理方法及装置
CN105512266A (zh) * 2015-12-03 2016-04-20 曙光信息产业(北京)有限公司 一种实现分布式数据库操作一致性的方法及装置
CN106407385A (zh) * 2016-09-14 2017-02-15 北京百度网讯科技有限公司 数据管理方法、设备和系统
CN106357452A (zh) * 2016-09-29 2017-01-25 上海和付信息技术有限公司 一种单点异构数据存储的高可用框架系统及其实现方法
CN106789197A (zh) * 2016-12-07 2017-05-31 高新兴科技集团股份有限公司 一种集群选举方法及系统
CN106909451A (zh) * 2017-02-28 2017-06-30 郑州云海信息技术有限公司 一种分布式任务调度系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MFMDAOYOU: ""Hadoop集群管理--保证集群平稳地执行"", 《HTTPS://WWW.CNBLOGS.COM/MFMDAOYOU/P/6920381.HTML》 *
马新凡: ""DOA下分布式数据注册中心高可用性研究与设计"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108737156A (zh) * 2018-04-08 2018-11-02 广东睿江云计算股份有限公司 一种基于多对等NameNode分布式文件系统及写入方法
CN111352943A (zh) * 2018-12-24 2020-06-30 华为技术有限公司 实现数据一致性的方法和装置、服务器和终端
CN110213352A (zh) * 2019-05-17 2019-09-06 北京航空航天大学 名字空间统一的分散自治存储资源聚合方法
CN110597809A (zh) * 2019-08-21 2019-12-20 中山大学 一种支持树状数据结构的一致性算法系统及其实现方法
CN110597809B (zh) * 2019-08-21 2023-05-23 中山大学 一种支持树状数据结构的一致性算法系统及其实现方法
CN112636345B (zh) * 2020-12-29 2022-05-31 浙江中力机械股份有限公司 一种基于分布式多机器人充电站分配问题的求解方法
CN112636345A (zh) * 2020-12-29 2021-04-09 浙江中力机械有限公司 一种基于分布式多机器人充电站分配问题的求解方法
CN113014634B (zh) * 2021-02-20 2023-01-31 成都新希望金融信息有限公司 集群选举处理方法、装置、设备及存储介质
CN113014634A (zh) * 2021-02-20 2021-06-22 成都新希望金融信息有限公司 集群选举处理方法、装置、设备及存储介质
CN116028250A (zh) * 2021-10-26 2023-04-28 慧与发展有限责任合伙企业 具有多个集群级别的分解式存储
CN114020357A (zh) * 2021-11-04 2022-02-08 湖北美和易思教育科技有限公司 namenode节点的启动方法、装置、系统及介质
CN114020357B (zh) * 2021-11-04 2024-05-03 湖北美和易思教育科技有限公司 namenode节点的启动方法、装置、系统及介质
CN114363350A (zh) * 2021-12-14 2022-04-15 中科曙光南京研究院有限公司 一种服务治理系统及方法
CN114363350B (zh) * 2021-12-14 2024-04-16 中科曙光南京研究院有限公司 一种服务治理系统及方法
CN114338695A (zh) * 2022-03-10 2022-04-12 深圳艾灵网络有限公司 基于多副本的领导者选举方法、装置、设备及存储介质
CN115051913A (zh) * 2022-08-12 2022-09-13 杭州悦数科技有限公司 Raft配置变更方法和装置
CN115051913B (zh) * 2022-08-12 2022-10-28 杭州悦数科技有限公司 Raft配置变更方法和装置

Also Published As

Publication number Publication date
CN107832138B (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
CN107832138A (zh) 一种扁平化的高可用namenode模型的实现方法
US11894972B2 (en) System and method for data replication using a single master failover protocol
US11120044B2 (en) System and method for maintaining a master replica for reads and writes in a data store
CN111124301B (zh) 一种对象存储设备的数据一致性存储方法及系统
US10929240B2 (en) System and method for adjusting membership of a data replication group
US10713275B2 (en) System and method for augmenting consensus election in a distributed database
CN100478902C (zh) 地理分布式集群
US9411873B2 (en) System and method for splitting a replicated data partition
US10621200B2 (en) Method and apparatus for maintaining replica sets
US10248704B2 (en) System and method for log conflict detection and resolution in a data store
US9489434B1 (en) System and method for replication log branching avoidance using post-failover rejoin
CN100388225C (zh) 具有远程数据镜像的集群数据库
CN102882927A (zh) 一种云存储数据同步框架及其实现方法
CN106406758A (zh) 一种基于分布式存储系统的数据处理方法及存储设备
DE112005002481T5 (de) Rekonfigurierung einer redundanten Datenspeicherung
CN103605698A (zh) 一种用于分布异构数据资源整合的云数据库系统
CN109547512A (zh) 一种基于NoSQL的分布式Session管理的方法及装置
CN110830582B (zh) 一种基于服务器集群选主方法和装置
CN113010549A (zh) 基于异地多活系统的数据处理方法、相关设备及存储介质
CN109726211B (zh) 一种分布式时序数据库
CN106776151A (zh) Samba集群tdb数据库记录备份方法、装置及系统
CN106170012A (zh) 一种面向云渲染的分布式文件系统及构建和访问方法
CN111653052B (zh) 收银系统及收银机切换方法
CN1821974B (zh) 远程拷贝系统
CN113905054A (zh) 基于RDMA的Kudu集群数据同步方法、装置、系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant