CN111506263B - 一种心跳连接的建立方法及装置 - Google Patents

一种心跳连接的建立方法及装置 Download PDF

Info

Publication number
CN111506263B
CN111506263B CN202010246544.1A CN202010246544A CN111506263B CN 111506263 B CN111506263 B CN 111506263B CN 202010246544 A CN202010246544 A CN 202010246544A CN 111506263 B CN111506263 B CN 111506263B
Authority
CN
China
Prior art keywords
osd
heartbeat
heartbeat connection
neighbor
storage node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010246544.1A
Other languages
English (en)
Other versions
CN111506263A (zh
Inventor
金朴堃
杨潇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd Chengdu Branch
Original Assignee
New H3C Technologies Co Ltd Chengdu Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Technologies Co Ltd Chengdu Branch filed Critical New H3C Technologies Co Ltd Chengdu Branch
Priority to CN202010246544.1A priority Critical patent/CN111506263B/zh
Publication of CN111506263A publication Critical patent/CN111506263A/zh
Application granted granted Critical
Publication of CN111506263B publication Critical patent/CN111506263B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提供了一种心跳连接的建立方法及装置,该方法应用于Ceph集群中的监视器,该方法包括:根据Ceph集群的OSD拓扑信息,构建多个由OSD组成的心跳连接环,每个心跳连接环上的每个OSD均从Ceph集群中不同的存储节点中的OSD中选择;将每个心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接。本申请可大大减轻Ceph集群中OSD的通信负载。

Description

一种心跳连接的建立方法及装置
技术领域
本申请涉及存储领域,特别涉及一种心跳连接的建立方法及装置。
背景技术
为了维护分布式存储系统(Ceph)集群的稳定、可靠的运行,在Ceph集群中,针对每个存储节点中的每个对象存储设备(Object Storage Device,OSD),会根据自身配置的心跳连接的条数,例如,配置10条心跳连接,随机与配置的条数个其他OSD建立心跳连接,这里的其他OSD可能是该OSD所属存储节点中的其他OSD,也可能是其他存储节点中的OSD。
在Ceph集群运行过程中,该OSD会发心跳报文给其他OSD,也会监听其他OSD发过来的心跳报文,一旦在一定时间段内没有收到和自己建立心跳连接的OSD的心跳报文,该OSD会上报给Ceph集群中的监视器(Monitor),由Monitor根据收到的该OSD的异常报告信息综合判定该OSD是否异常,并进行后续处理。
然而,在实际应用中,在Ceph集群规模较大的情况下,上述这种心跳连接的建立方式,需要建立非常多的心跳连接,导致OSD的通信负载较重。
发明内容
本申请提供一种心跳连接的建立方法及装置,可大大减轻Ceph集群中OSD的通信负载。
本申请提供的技术方案如下:
本申请提供一种心跳连接的建立方法,所述方法应用于Ceph集群中的监视器,所述方法包括:
根据Ceph集群的OSD拓扑信息,构建多个由OSD组成的心跳连接环,每个心跳连接环上的每个OSD均从所述Ceph集群中不同的存储节点中的OSD中选择;
将每个心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接。
本申请还提供一种心跳连接的建立装置,所述装置应用于Ceph集群中的监视器,所述装置包括:
构建模块,用于根据Ceph集群的OSD拓扑信息,构建多个由OSD组成的心跳连接环,每个心跳连接环上的每个OSD均从所述Ceph集群中不同的存储节点中的OSD中选择;
发送模块,用于将每个心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接。
由以上技术方案可以看出,在Ceph集群中,提供了一种新的建立OSD之间的心跳连接的机制,在此机制中,每个心跳连接环上的OSD均来自不同的存储节点,避免了同一存储节点中的OSD之间建立心跳连接,可大大减少心跳连接的建立条数,进而减轻了OSD的通信负载。
附图说明
图1为本申请实施例提供的一种心跳连接的建立方法的流程示意图;
图2为本申请实施例提供的基于Ceph集群建立的心跳连接环的示意图之一;
图3为本申请实施例提供的基于Ceph集群建立的心跳连接环的示意图之二;
图4为本申请实施例提供的基于Ceph集群建立的心跳连接环的示意图之三;
图5为本申请实施例提供的基于Ceph集群建立的心跳连接环的示意图之三中OSD1异常时的示意图;
图6为本申请实施例提供的基于Ceph集群建立的心跳连接环的示意图之三中OSD11异常时的示意图;
图7为本申请实施例提供的新增OSD时的处理流程示意图;
图8为本申请实施例提供的基于Ceph集群建立的心跳连接环的示意图之二中新增OSD时的示意图;
图9为本申请实施例提供的基于Ceph集群建立的心跳连接环的示意图之二中删除OSD时的示意图;
图10为本申请实施例提供的一种心跳连接的建立装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种心跳连接的建立方法,如图1所示,该方法应用于Ceph集群中的Monitor,该方法可以包括如下步骤:
S11:根据Ceph集群的OSD拓扑信息,构建多个由OSD组成的心跳连接环,每个心跳连接环上的每个OSD均从Ceph集群中不同的存储节点中的OSD中选择。
优选地,在本申请实施例中,Monitor可以通过以下方式构建心跳连接环:
根据Ceph集群的OSD拓扑信息,判断所有存储节点中的OSD的总数量是否均相同;
若是,将每个存储节点中的每个OSD分别与其他存储节点中的一个未被构建过心跳连接环的OSD构建一个第一心跳连接环,其中,不同的第一心跳连接环上的OSD均不相同;
否则,根据每个存储节点中的OSD,构建M个第一心跳连接环和N个第二心跳连接环;
其中,N个心跳连接环上的OSD中部分OSD为复用的各自所属存储节点中已构建过心跳连接环的OSD;
M的取值为OSD的数量最少的存储节点中所有OSD的总数量;
N的取值为OSD的数量最多的存储节点中所有OSD的总数量与OSD的数量最少的存储节点中所有OSD的总数量的差值。
需要说明的是,本申请实施例中,在构建第一心跳连接环时,可以优选处于同一归置组(Placement Group,PG)中的OSD。例如,如图2所示,假设Ceph集群中有3个存储节点,分别为存储节点A、存储节点B和存储节点C,每个存储节点包括的OSD如图2所示。在这种架构下,所有存储节点中OSD的总数量相同,构建的第一心跳连接环可以是如图2所示的心跳连接环。当然,图2仅为一种不同存储节点中不同OSD组合构建心跳连接环的示例,其他示例不再一一列举。
又例如,如图3所示,假设Ceph集群中有3个存储节点,分别为存储节点D、存储节点E和存储节点F,每个存储节点包括的OSD如图3所示。在这种架构下,所有存储节点中OSD的总数量不全部相同,构建的第一心跳连接环和第二心跳连接环可以是如图3所示的心跳连接环。其中,共构建了4个第一心跳连接环和1个第二心跳连接环,第一心跳连接环的数量为OSD数量最少的存储节点C中所有OSD的总数量;第二心跳连接环上的OSD3为复用的OSD,且第二心跳连接环的数量为OSD的数量最多的存储节点(存储节点A和存储节点B)中所有OSD的总数量(5个)与OSD的数量最少的存储节点(存储节点C)中所有OSD的总数量(4个)的差值。当然,图3仅为一种不同存储节点中不同OSD组合构建心跳连接环的示例,其他示例不再一一列举。
S12:将每个心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接。
可见,在本申请实施例中,在Ceph集群中,提供了一种新的建立OSD之间的心跳连接的机制,在此机制中,每个心跳连接环上的OSD均来自不同的存储节点,避免了同一存储节点中的OSD之间建立心跳连接,可大大减少心跳连接的建立条数,进而减轻了OSD的通信负载。
进一步地,在本申请实施例中,本申请还提供了在新的心跳连接建立机制下Ceph集群中OSD异常、新增OSD、新增存储节点、OSD被删除以及存储节点被删除时的处理流程,以确保Ceph集群业务正常运行。
下面针对每种情形下的处理流程进行详细说明。
第一种情形、Ceph集群中OSD异常
在这种情形下,Monitor可以执行以下操作:
针对Ceph集群中的每个心跳连接环,如果确定出该心跳连接环未被标记为用于表征心跳连接环上OSD数量减少的降级状态且发生异常的OSD的数量不小于该心跳连接环上所有OSD的总数量的一半,或者确定出该心跳连接环被标记为降级状态且发生异常的OSD的累计数量不小于该心跳连接环上所有OSD的总数量的一半,则通知该心跳连接环上未发生异常的OSD断开与其邻居OSD之间的连接,并删除该心跳连接环;
如果确定出该心跳连接环未被标记为降级状态且发生异常的OSD的数量小于该心跳连接环上所有OSD的总数量的一半,或者确定出该心跳连接环被标记为降级状态且发生异常的OSD的累计数量小于该心跳连接环上所有OSD的总数量的一半,则判断该心跳连接环上其他未发生异常的OSD是否均为复用的OSD;
若是,则删除该心跳连接环;
否则,进一步判断该心跳连接环上当前发生异常的OSD所属的存储节点中是否存在复用次数不大于设定阈值的OSD;
在判断结果为是时,从复用次数不大于设定阈值的OSD中选择一个OSD替换当前发生异常的OSD,并分别通知该心跳连接环上当前发生异常的OSD的邻居OSD重新与替换后的OSD建立心跳连接;
在判断结果为否时,如果该心跳连接环上未发生异常前所有OSD的总数量为3个,通知该心跳连接环上当前发生异常的OSD的邻居OSD彼此建立心跳连接,并将该心跳连接环标记为降级状态;
如果该心跳连接环上未发生异常前所有OSD的总数量大于3个且该心跳连接环未被标记为降级状态,在当前发生异常的OSD的邻居OSD均正常时,通知当前发生异常的OSD的邻居OSD彼此建立心跳连接,在当前发生异常的OSD为至少两个相邻的OSD时,通知该心跳连接环上至少两个相邻发生异常的OSD中邻居OSD为正常的OSD彼此建立心跳连接,并将该心跳连接环标记为降级状态;
如果该心跳连接环上未发生异常前所有OSD的总数量大于3个且该心跳连接环被标记为降级状态,在当前发生异常的OSD的邻居OSD均正常时,通知当前发生异常的OSD的邻居OSD彼此建立心跳连接,在当前发生异常的OSD为至少两个相邻的OSD时,通知该心跳连接环上至少两个相邻发生异常的OSD中邻居OSD为正常的OSD彼此建立心跳连接。
在此操作流程中,在本申请实施例中,对于任意一个心跳连接环上单个OSD发生异常的情况,Monitor可根据该心跳连接环上该OSD的两个邻居OSD上报的异常报告信息来判定;对于任意一个心跳连接环上多个相邻OSD发生异常的情况,Monitor可根据周期性查询心跳连接环上的OSD来发现。一旦发现异常,Monitor会更新OSD拓扑信息,并将异常信息扩散到整个Ceph集群。
并且,为了避免Ceph集群存储不可访问,对初始构建的心跳连接环上累计发生异常的OSD的数量进行了限制,即,必须小于该心跳连接环上所有OSD的总数量的一半,如果不满足这个条件,按照以上相关操作撤销该心跳连接环;如果满足这个条件,再进一步判定能否替换该心跳连接环上当前发生异常的OSD,以继续进行心跳监测。
在具体判定时,如果该心跳连接环上除当前发生异常的OSD之外的OSD均为复用的OSD,一旦当前发生异常的OSD被替换成复用的OSD,该心跳连接环上所有的OSD全部是复用的OSD了,由于这些OSD在其他心跳连接环上监测着心跳,所以,为了减轻OSD的通信负载,没必要再维护,在这种情况下,删除该心跳连接环即可。
另外,为了避免多次复用任一OSD,增加该OSD的通信负载,本申请对复用OSD的复用次数进行了限制,即,必须不大于设定阈值,此设定阈值可根据Ceph集群的实际情况设定。
例如,如图4所示,假设Ceph集群中有5个存储节点,分别为存储节点H、存储节点I、存储节点J、存储节点K和存储节点L,每个存储节点包括的OSD如图4所示,假设这些OSD的复用次数每个存储构建的心跳连接环如图4所示。
在这种架构下,初始时,所有心跳连接环均未被标记为降级状态,假设OSD1所在的心跳连接环上的OSD1发生异常,该心跳连接环上的其他OSD未发生异常,那么,对于该心跳连接环,发生异常的OSD的数量(即,1个)小于该心跳连接环上所有OSD的总数量的一半(2.5个),此时,进一步判断该心跳连接环上其他未发生异常的OSD是否均为复用的OSD,由于该心跳连接环上其他未发生异常的OSD均不是复用的OSD,再进一步判断存储节点H中是否存在复用次数不大于设定阈值的OSD。
假设存储节点H中除OSD1之外的OSD的复用次数均小于设定阈值,此时的判断结果为是,Monitor从OSD6和OSD11中选择一个OSD替换OSD1,假设选择了OSD6,通知OSD1的邻居OSD(即,OSD2和OSD5)重新与OSD6建立心跳连接,建立好的心跳连接环如图5所示。
之后,假设OSD11所在的心跳连接环上的OSD11发生异常,该心跳连接环上的其他OSD未发生异常,那么,对于该心跳连接环,发生异常的OSD的数量(即,1个)小于该心跳连接环上所有OSD的总数量的一半(2.5个),此时,进一步判断该心跳连接环上其他未发生异常的OSD是否均为复用的OSD,由于该心跳连接环上其他未发生异常的OSD均是复用的OSD,所以删除该心跳连接环,如图6所示。
需要说明的是,对于此操作流程中其他情形下对心跳连接关系的调整不再一一举例。需要注意的是,对于被标记为降级状态的心跳连接环,其上发生异常的OSD的累计数量是从该心跳连接环被初始构建时开始累计。
第二种情形、Ceph集群中存储节点中新增至少一个OSD
在这种情形下,如图7所示,Monitor可以执行以下步骤:
S71:判断新增的OSD中是否存在与被标记为降级状态的心跳连接环上减少的OSD处于同一存储节点的第一OSD,在判断结果为否时,执行步骤S72;在判断结果为是时,执行步骤S81。
S72:判断新增的OSD中是否存在与复用的OSD处于同一存储节点的第二OSD,在判断结果为否时,执行步骤73;在判断结果为是时,执行步骤S80。
S73:判断新增的OSD中是否存在能够构建新的第一心跳连接环的第三OSD,在判断结果为是时,执行步骤S74;在判断结果为否时,将新增的OSD作为第四OSD,执行步骤S75;
S74:根据第三OSD构建新的第一心跳连接环,并将新的第一心跳连接环上的每个第三OSD的邻居OSD分别发送给每个第三OSD,以使每个第三OSD分别与其邻居OSD建立心跳连接。
S75:若新增的OSD中还有剩余的第四OSD,判断当前的所有心跳连接环中是否存在第二心跳连接环,在在判断结果为否时,执行步骤S76;在判断结果为是时,执行步骤S77。
S76:根据第四OSD构建新的第二心跳连接环,并将新的第二心跳连接环上的每个第四OSD的邻居OSD分别发送给每个第四OSD,以使每个第四OSD分别与其邻居OSD建立心跳连接;
S77:判断同一存储节点中复用的OSD的数量是否不小于该存储节点中第四OSD的第二数量,在判断结果为是时,执行步骤S78;在判断结果为否时,执行步骤S79。
S78:从该存储节点中选择Q个不同的第四OSD替换不同的复用的OSD,分别通知Q个复用的OSD的邻居OSD重新与替换后的第四OSD建立心跳连接,并在新增的OSD中仍有剩余的第四OSD时,根据当前剩余的第四OSD构建新的第二心跳连接环,并将新的第二心跳连接环上的每个第四OSD的邻居OSD分别发送给每个第四OSD,以使每个第四OSD分别与其邻居OSD建立心跳连接,其中,Q的取值为该存储节点中所有第四OSD的总数量;
S79:从该存储节点中选择不同的第四OSD替换所有不同的复用的OSD,分别通知所有的复用的OSD的邻居OSD重新与替换后的第四OSD建立心跳连接,并在新增的OSD中仍有剩余的第四OSD时,根据当前剩余的第四OSD构建新的第二心跳连接环,将新的第二心跳连接环上的每个第四OSD的邻居OSD分别发送给每个第四OSD,以使每个第四OSD分别与其邻居OSD建立心跳连接。
S80:若同一存储节点中复用的OSD的数量不大于第二OSD的数量,从该存储节点中选择不同的第二OSD替换所有不同的复用的OSD,分别通知所有的复用的OSD的邻居OSD重新与替换后的第二OSD建立心跳连接,并在新增的OSD中还有剩余的OSD时,根据剩余的OSD构建新的心跳连接环,将新的心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接;
若同一存储节点中复用的OSD的数量大于第二OSD的数量,从该存储节点中选择S个不同的第二OSD替换不同的复用的OSD,分别通知S个复用的OSD的邻居OSD重新与替换后的第二OSD建立心跳连接,并在新增的OSD中还有剩余的OSD时,根据剩余的OSD构建新的心跳连接环,将新的心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接,其中,S的取值为该存储节点中所有第二OSD的总数量。
S81:将第一OSD恢复到该心跳连接环上,并在新增的OSD还有剩余的OSD时,执行步骤S72。
例如,仍以图3所示的Ceph集群架构为例,假设新增了部分OSD,如图8所示,假设没有降级状态的心跳连接环,那么,执行上述步骤S72,由于新增的OSD15和OSD18均与复用的OSD3处于存储节点F中,再执行上述步骤S81,由于复用的OSD的数量(即,1个)小于存储节点F中新增的OSD的数量(即,2个),从OSD15和OSD18中选择一个替换OSD3,假设选择了OSD15,分别通知OSD3的邻居OSD(即,OSD13和OSD14)重新与OSD15建立心跳连接,如图8所示。
由于新增的OSD还有剩余,继续按照以上流程构建新的心跳连接环,新的心跳连接环可以如图8所示,具体构建时,可以将剩余的OSD作为全新Ceph集群中的OSD,构建心跳连接环。
需要说明的是,在这种情形下,如果发生异常的OSD恢复正常,可以将该OSD认为是新增的OSD。
在上述步骤S81中,将第一OSD恢复到该心跳连接环上,具体恢复过程可以为:若第一OSD中存在未发生异常前的邻居OSD均正常的第一OSD,针对这种情况下的任意一个第一OSD,通知一对重新建立心跳连接的OSD重新与该第一OSD建立心跳连接;若第一OSD中存在至少两个未发生异常前相邻的第一OSD,重新确定至少两个未发生异常前相邻的第一OSD和一对重新建立心跳连接的OSD的邻居关系,分别通知互为邻居的OSD之间重新建立心跳连接。
第三种情形、Ceph集群中至少一个OSD被删除
在这种情形下,Monitor可以执行以下操作:
针对每个被删除的OSD,判断该被删除的OSD所在的心跳连接环上的其他OSD是否均为复用的OSD;
若是,删除该被删除的OSD所在的心跳连接环;
否则,从该被删除的OSD所属存储节点中的其他OSD中选择一个OSD替换被删除的OSD,并通知被删除的OSD的邻居OSD重新与替换后的OSD建立心跳连接。
例如,仍以图3所示的Ceph集群架构为例,假设OSD9和OSD14被删除,那么,针对每个被删除的OSD,以OSD9为例,判断OSD9所在的心跳连接环上的其他OSD是否均为复用的OSD,由于OSD9所在的心跳连接环上的其他OSD均不是复用的OSD,所以,从OSD9所属存储节点(即,存储节点F)中的其他OSD中选择一个OSD替换OSD9,假设选择了OSD6,通知OSD9的邻居OSD(即,OSD7和OSD8)重新与OSD6建立心跳连接,如图9所示。
类似地,针对OSD14,假设选择了OSD8替换OSD14,那么,通知OSD14的邻居OSD(即,OSD3和OSD13)重新与OSD8建立心跳连接,仍如图9所示。
第四种情形、Ceph集群中新增存储节点或者至少一个存储节点被删除
在这种情形下,通常适用于存储节点个数为4个以上的Ceph集群上,Monitor可以执行以下操作:
根据Ceph集群的最新OSD拓扑信息,重新构建心跳连接环;
将重新构建的每个心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD重新与其邻居OSD建立心跳连接。
基于同一发明构思,本申请还提供了一种心跳连接的建立装置,如图10所示,该装置应用于Ceph集群中的监视器,具体包括:
构建模块1011,用于根据Ceph集群的OSD拓扑信息,构建多个由OSD组成的心跳连接环,每个心跳连接环上的每个OSD均从所述Ceph集群中不同的存储节点中的OSD中选择;
发送模块1012,用于将每个心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接。
优选地,上述构建模块1011,具体用于:
根据Ceph集群的OSD拓扑信息,判断所有存储节点中的OSD的总数量是否均相同;
若是,将每个存储节点中的每个OSD分别与其他存储节点中的一个未被构建过心跳连接环的OSD构建一个第一心跳连接环,其中,不同的第一心跳连接环上的OSD均不相同;
否则,根据每个存储节点中的OSD,构建M个第一心跳连接环和N个第二心跳连接环;
其中,N个第二心跳连接环上的OSD中部分OSD为复用的OSD,每个复用的OSD为复用各自所属存储节点中已构建过心跳连接环的OSD;
M的取值为OSD的数量最少的存储节点中所有OSD的总数量;
N的取值为OSD的数量最多的存储节点中所有OSD的总数量与OSD的数量最少的存储节点中所有OSD的总数量的差值。
优选地,该装置还包括:
第一处理模块(图10中未示出),用于针对所述Ceph集群中的每个心跳连接环,如果确定出该心跳连接环未被标记为用于表征心跳连接环上OSD数量减少的降级状态且发生异常的OSD的数量不小于该心跳连接环上所有OSD的总数量的一半,或者确定出该心跳连接环被标记为降级状态且发生异常的OSD的累计数量不小于该心跳连接环上所有OSD的总数量的一半,则通知该心跳连接环上未发生异常的OSD断开与其邻居OSD之间的连接,并删除该心跳连接环;
如果确定出该心跳连接环未被标记为降级状态且发生异常的OSD的数量小于该心跳连接环上所有OSD的总数量的一半,或者确定出该心跳连接环被标记为降级状态且发生异常的OSD的累计数量小于该心跳连接环上所有OSD的总数量的一半,则判断该心跳连接环上其他未发生异常的OSD是否均为复用的OSD;
若是,则删除该心跳连接环;
否则,进一步判断该心跳连接环上当前发生异常的OSD所属的存储节点中是否存在复用次数不大于设定阈值的OSD;
在判断结果为是时,从复用次数不大于设定阈值的OSD中选择一个OSD替换当前发生异常的OSD,并分别通知该心跳连接环上当前发生异常的OSD的邻居OSD重新与替换后的OSD建立心跳连接;
在判断结果为否时,如果该心跳连接环上未发生异常前所有OSD的总数量为3个,通知该心跳连接环上当前发生异常的OSD的邻居OSD彼此建立心跳连接,并将该心跳连接环标记为降级状态;
如果该心跳连接环上未发生异常前所有OSD的总数量大于3个且该心跳连接环未被标记为降级状态,在当前发生异常的OSD的邻居OSD均正常时,通知当前发生异常的OSD的邻居OSD彼此建立心跳连接,在当前发生异常的OSD为至少两个相邻的OSD时,通知该心跳连接环上至少两个相邻的OSD中邻居OSD为正常的OSD彼此建立心跳连接,并将该心跳连接环标记为降级状态;
如果该心跳连接环上未发生异常前所有OSD的总数量大于3个且该心跳连接环被标记为降级状态,在当前发生异常的OSD的邻居OSD均正常时,通知当前发生异常的OSD的邻居OSD彼此建立心跳连接,在当前发生异常的OSD为至少两个相邻的OSD时,通知该心跳连接环上至少两个相邻发生异常的OSD中邻居OSD为正常的OSD彼此建立心跳连接。
优选地,该装置还包括:
第二处理模块(图10中未示出),用于在所述Ceph集群中的存储节点中新增至少一个OSD后,判断新增的OSD中是否存在与被标记为降级状态的心跳连接环上减少的OSD处于同一存储节点的第一OSD;
在判断出新增的OSD中不存在与被标记为降级状态的心跳连接环上减少的OSD处于同一存储节点的第一OSD时,判断新增的OSD中是否存在与复用的OSD处于同一存储节点的第二OSD;
在判断出新增的OSD中不存在与复用的OSD处于同一存储节点的第二OSD时,执行以下操作:
判断新增的OSD中是否存在能够构建新的第一心跳连接环的第三OSD;
在判断出新增的OSD中存在能够构建新的第一心跳连接环的第三OSD时,根据所述第三OSD构建新的第一心跳连接环,并将新的第一心跳连接环上的每个第三OSD的邻居OSD分别发送给每个第三OSD,以使每个第三OSD分别与其邻居OSD建立心跳连接;
若新增的OSD中还有剩余的第四OSD,判断当前的所有心跳连接环中是否存在第二心跳连接环;
在判断出当前的所有心跳连接环中不存在第二心跳连接环时,根据所述第四OSD构建新的第二心跳连接环,并将新的第二心跳连接环上的每个第四OSD的邻居OSD分别发送给每个第四OSD,以使每个第四OSD分别与其邻居OSD建立心跳连接;
在判断出当前的所有心跳连接环中存在第二心跳连接环时,进一步判断同一存储节点中复用的OSD的数量是否不小于该存储节点中第四OSD的第二数量;
在判断结果为是时,从该存储节点中选择Q个不同的第四OSD替换不同的复用的OSD,分别通知所述Q个复用的OSD的邻居OSD重新与替换后的第四OSD建立心跳连接,并在新增的OSD中仍有剩余的第四OSD时,根据当前剩余的第四OSD构建新的第二心跳连接环,并将新的第二心跳连接环上的每个第四OSD的邻居OSD分别发送给每个第四OSD,以使每个第四OSD分别与其邻居OSD建立心跳连接,其中,Q的取值为该存储节点中所有第四OSD的总数量;
在判断结果为否时,从该存储节点中选择不同的第四OSD替换所有不同的复用的OSD,分别通知所有的复用的OSD的邻居OSD重新与替换后的第四OSD建立心跳连接,并在新增的OSD中仍有剩余的第四OSD时,根据当前剩余的第四OSD构建新的第二心跳连接环,将新的第二心跳连接环上的每个第四OSD的邻居OSD分别发送给每个第四OSD,以使每个第四OSD分别与其邻居OSD建立心跳连接;
在判断出新增的OSD中不存在能够构建新的第一心跳连接环的第三OSD时,将新增的OSD作为第四OSD,执行判断当前的所有心跳连接环中是否存在第二心跳连接环的步骤;
在判断出新增的OSD中存在与复用的OSD处于同一存储节点的第二OSD时,执行以下操作:
若同一存储节点中复用的OSD的数量不大于第二OSD的数量,从该存储节点中选择不同的第二OSD替换所有不同的复用的OSD,分别通知所有的复用的OSD的邻居OSD重新与替换后的第二OSD建立心跳连接,并在新增的OSD中还有剩余的OSD时,根据剩余的OSD构建新的心跳连接环,将新的第二心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接;
若同一存储节点中复用的OSD的数量大于第二OSD的数量,从该存储节点中选择S个不同的第二OSD替换不同的复用的OSD,分别通知所述S个复用的OSD的邻居OSD重新与替换后的第二OSD建立心跳连接,并在新增的OSD中还有剩余的OSD时,根据剩余的OSD构建新的心跳连接环,将新的心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接,其中,S的取值为该存储节点中所有第二OSD的总数量;
在判断出新增的OSD中存在与被标记为降级状态的心跳连接环上减少的OSD处于同一存储节点的第一OSD时,将第一OSD恢复到该心跳连接环上,并在新增的OSD还有剩余的OSD时,执行判断新增的OSD中是否存在与复用的OSD处于同一存储节点的第二OSD的步骤。
优选地,该装置还包括:
第三处理模块(图10中未示出),用于在所述Ceph集群中的存储节点中的至少一个OSD被删除后,针对每个被删除的OSD,判断该被删除的OSD所在的心跳连接环上的其他OSD是否均为复用的OSD;
若是,删除该被删除的OSD所在的心跳连接环;
否则,从该被删除的OSD所属存储节点中的其他OSD中选择一个OSD替换被删除的OSD,并通知被删除的OSD的邻居OSD重新与替换后的OSD建立心跳连接。
优选地,该装置还包括:
第四处理模块(图10中未示出),用于在所述Ceph集群中新增存储节点或者至少一个存储节点被删除后,根据所述Ceph集群的最新OSD拓扑信息,重新构建心跳连接环;
将重新构建的每个心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD重新与其邻居OSD建立心跳连接。
由以上技术方案可以看出,在Ceph集群中,提供了一种新的建立OSD之间的心跳连接的机制,在此机制中,每个心跳连接环上的OSD均来自不同的存储节点,避免了同一存储节点中的OSD之间建立心跳连接,可大大减少心跳连接的建立条数,进而减轻了OSD的通信负载。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种心跳连接的建立方法,其特征在于,所述方法应用于分布式存储系统Ceph集群中的监视器,所述方法包括:
根据Ceph集群的对象存储设备OSD拓扑信息,构建多个由OSD组成的心跳连接环,每个心跳连接环上的每个OSD均从所述Ceph集群中不同的存储节点中的OSD中选择;
将每个心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接;
其中,根据Ceph集群的OSD拓扑信息,构建多个由OSD组成的心跳连接环,具体包括:
根据Ceph集群的OSD拓扑信息,判断所有存储节点中的OSD的总数量是否均相同;
若是,将每个存储节点中的每个OSD分别与其他存储节点中的一个未被构建过心跳连接环的OSD构建一个第一心跳连接环,其中,不同的第一心跳连接环上的OSD均不相同;
否则,根据每个存储节点中的OSD,构建M个第一心跳连接环和N个第二心跳连接环;
其中,N个第二心跳连接环上的OSD中部分OSD为复用的OSD,每个复用的OSD为复用各自所属存储节点中已构建过心跳连接环的OSD;
M的取值为OSD的数量最少的存储节点中所有OSD的总数量;
N的取值为OSD的数量最多的存储节点中所有OSD的总数量与OSD的数量最少的存储节点中所有OSD的总数量的差值。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对所述Ceph集群中的每个心跳连接环,如果确定出该心跳连接环未被标记为用于表征心跳连接环上OSD数量减少的降级状态且发生异常的OSD的数量不小于该心跳连接环上所有OSD的总数量的一半,或者确定出该心跳连接环被标记为降级状态且发生异常的OSD的累计数量不小于该心跳连接环上所有OSD的总数量的一半,则通知该心跳连接环上未发生异常的OSD断开与其邻居OSD之间的连接,并删除该心跳连接环;
如果确定出该心跳连接环未被标记为降级状态且发生异常的OSD的数量小于该心跳连接环上所有OSD的总数量的一半,或者确定出该心跳连接环被标记为降级状态且发生异常的OSD的累计数量小于该心跳连接环上所有OSD的总数量的一半,则判断该心跳连接环上其他未发生异常的OSD是否均为复用的OSD;
若是,则删除该心跳连接环;
否则,进一步判断该心跳连接环上当前发生异常的OSD所属的存储节点中是否存在复用次数不大于设定阈值的OSD;
在判断结果为是时,从复用次数不大于设定阈值的OSD中选择一个OSD替换当前发生异常的OSD,并分别通知该心跳连接环上当前发生异常的OSD的邻居OSD重新与替换后的OSD建立心跳连接;
在判断结果为否时,如果该心跳连接环上未发生异常前所有OSD的总数量为3个,通知该心跳连接环上当前发生异常的OSD的邻居OSD彼此建立心跳连接,并将该心跳连接环标记为降级状态;
如果该心跳连接环上未发生异常前所有OSD的总数量大于3个且该心跳连接环未被标记为降级状态,在当前发生异常的OSD的邻居OSD均正常时,通知当前发生异常的OSD的邻居OSD彼此建立心跳连接,在当前发生异常的OSD为至少两个相邻的OSD时,通知该心跳连接环上至少两个相邻的OSD中邻居OSD为正常的OSD彼此建立心跳连接,并将该心跳连接环标记为降级状态;
如果该心跳连接环上未发生异常前所有OSD的总数量大于3个且该心跳连接环被标记为降级状态,在当前发生异常的OSD的邻居OSD均正常时,通知当前发生异常的OSD的邻居OSD彼此建立心跳连接,在当前发生异常的OSD为至少两个相邻的OSD时,通知该心跳连接环上至少两个相邻发生异常的OSD中邻居OSD为正常的OSD彼此建立心跳连接。
3.根据权利要求2所述的方法,其特征在于,在所述Ceph集群中的存储节点中新增至少一个OSD后,所述方法还包括:
判断新增的OSD中是否存在与被标记为降级状态的心跳连接环上减少的OSD处于同一存储节点的第一OSD;
在判断出新增的OSD中不存在与被标记为降级状态的心跳连接环上减少的OSD处于同一存储节点的第一OSD时,判断新增的OSD中是否存在与复用的OSD处于同一存储节点的第二OSD;
在判断出新增的OSD中不存在与复用的OSD处于同一存储节点的第二OSD时,执行以下操作:
判断新增的OSD中是否存在能够构建新的第一心跳连接环的第三OSD;
在判断出新增的OSD中存在能够构建新的第一心跳连接环的第三OSD时,根据所述第三OSD构建新的第一心跳连接环,并将新的第一心跳连接环上的每个第三OSD的邻居OSD分别发送给每个第三OSD,以使每个第三OSD分别与其邻居OSD建立心跳连接;
若新增的OSD中还有剩余的第四OSD,判断当前的所有心跳连接环中是否存在第二心跳连接环;
在判断出当前的所有心跳连接环中不存在第二心跳连接环时,根据所述第四OSD构建新的第二心跳连接环,并将新的第二心跳连接环上的每个第四OSD的邻居OSD分别发送给每个第四OSD,以使每个第四OSD分别与其邻居OSD建立心跳连接;
在判断出当前的所有心跳连接环中存在第二心跳连接环时,进一步判断同一存储节点中复用的OSD的数量是否不小于该存储节点中第四OSD的第二数量;
在判断结果为是时,从该存储节点中选择Q个不同的第四OSD替换不同的复用的OSD,分别通知所述Q个复用的OSD的邻居OSD重新与替换后的第四OSD建立心跳连接,并在新增的OSD中仍有剩余的第四OSD时,根据当前剩余的第四OSD构建新的第二心跳连接环,并将新的第二心跳连接环上的每个第四OSD的邻居OSD分别发送给每个第四OSD,以使每个第四OSD分别与其邻居OSD建立心跳连接,其中,Q的取值为该存储节点中所有第四OSD的总数量;
在判断结果为否时,从该存储节点中选择不同的第四OSD替换所有不同的复用的OSD,分别通知所有的复用的OSD的邻居OSD重新与替换后的第四OSD建立心跳连接,并在新增的OSD中仍有剩余的第四OSD时,根据当前剩余的第四OSD构建新的第二心跳连接环,将新的第二心跳连接环上的每个第四OSD的邻居OSD分别发送给每个第四OSD,以使每个第四OSD分别与其邻居OSD建立心跳连接;
在判断出新增的OSD中不存在能够构建新的第一心跳连接环的第三OSD时,将新增的OSD作为第四OSD,执行判断当前的所有心跳连接环中是否存在第二心跳连接环的步骤;
在判断出新增的OSD中存在与复用的OSD处于同一存储节点的第二OSD时,执行以下操作:
若同一存储节点中复用的OSD的数量不大于第二OSD的数量,从该存储节点中选择不同的第二OSD替换所有不同的复用的OSD,分别通知所有的复用的OSD的邻居OSD重新与替换后的第二OSD建立心跳连接,并在新增的OSD中还有剩余的OSD时,根据剩余的OSD构建新的心跳连接环,将新的第二心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接;
若同一存储节点中复用的OSD的数量大于第二OSD的数量,从该存储节点中选择S个不同的第二OSD替换不同的复用的OSD,分别通知所述S个复用的OSD的邻居OSD重新与替换后的第二OSD建立心跳连接,并在新增的OSD中还有剩余的OSD时,根据剩余的OSD构建新的心跳连接环,将新的心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接,其中,S的取值为该存储节点中所有第二OSD的总数量;
在判断出新增的OSD中存在与被标记为降级状态的心跳连接环上减少的OSD处于同一存储节点的第一OSD时,将第一OSD恢复到该心跳连接环上,并在新增的OSD还有剩余的OSD时,执行判断新增的OSD中是否存在与复用的OSD处于同一存储节点的第二OSD的步骤。
4.根据权利要求1所述的方法,其特征在于,在所述Ceph集群中的存储节点中的至少一个OSD被删除后,所述方法还包括:
针对每个被删除的OSD,判断该被删除的OSD所在的心跳连接环上的其他OSD是否均为复用的OSD;
若是,删除该被删除的OSD所在的心跳连接环;
否则,从该被删除的OSD所属存储节点中的其他OSD中选择一个OSD替换被删除的OSD,并通知被删除的OSD的邻居OSD重新与替换后的OSD建立心跳连接。
5.根据权利要求1所述的方法,其特征在于,在所述Ceph集群中新增存储节点或者至少一个存储节点被删除后,所述方法还包括:
根据所述Ceph集群的最新OSD拓扑信息,重新构建心跳连接环;
将重新构建的每个心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD重新与其邻居OSD建立心跳连接。
6.一种心跳连接的建立装置,其特征在于,所述装置应用于分布式存储系统Ceph集群中的监视器,所述装置包括:
构建模块,用于根据Ceph集群的对象存储设备OSD拓扑信息,构建多个由OSD组成的心跳连接环,每个心跳连接环上的每个OSD均从所述Ceph集群中不同的存储节点中的OSD中选择;
发送模块,用于将每个心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接;
其中,所述构建模块,具体用于:
根据Ceph集群的OSD拓扑信息,判断所有存储节点中的OSD的总数量是否均相同;
若是,将每个存储节点中的每个OSD分别与其他存储节点中的一个未被构建过心跳连接环的OSD构建一个第一心跳连接环,其中,不同的第一心跳连接环上的OSD均不相同;
否则,根据每个存储节点中的OSD,构建M个第一心跳连接环和N个第二心跳连接环;
其中,N个第二心跳连接环上的OSD中部分OSD为复用的OSD,每个复用的OSD为复用各自所属存储节点中已构建过心跳连接环的OSD;
M的取值为OSD的数量最少的存储节点中所有OSD的总数量;
N的取值为OSD的数量最多的存储节点中所有OSD的总数量与OSD的数量最少的存储节点中所有OSD的总数量的差值。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第一处理模块,用于针对所述Ceph集群中的每个心跳连接环,如果确定出该心跳连接环未被标记为用于表征心跳连接环上OSD数量减少的降级状态且发生异常的OSD的数量不小于该心跳连接环上所有OSD的总数量的一半,或者确定出该心跳连接环被标记为降级状态且发生异常的OSD的累计数量不小于该心跳连接环上所有OSD的总数量的一半,则通知该心跳连接环上未发生异常的OSD断开与其邻居OSD之间的连接,并删除该心跳连接环;
如果确定出该心跳连接环未被标记为降级状态且发生异常的OSD的数量小于该心跳连接环上所有OSD的总数量的一半,或者确定出该心跳连接环被标记为降级状态且发生异常的OSD的累计数量小于该心跳连接环上所有OSD的总数量的一半,则判断该心跳连接环上其他未发生异常的OSD是否均为复用的OSD;
若是,则删除该心跳连接环;
否则,进一步判断该心跳连接环上当前发生异常的OSD所属的存储节点中是否存在复用次数不大于设定阈值的OSD;
在判断结果为是时,从复用次数不大于设定阈值的OSD中选择一个OSD替换当前发生异常的OSD,并分别通知该心跳连接环上当前发生异常的OSD的邻居OSD重新与替换后的OSD建立心跳连接;
在判断结果为否时,如果该心跳连接环上未发生异常前所有OSD的总数量为3个,通知该心跳连接环上当前发生异常的OSD的邻居OSD彼此建立心跳连接,并将该心跳连接环标记为降级状态;
如果该心跳连接环上未发生异常前所有OSD的总数量大于3个且该心跳连接环未被标记为降级状态,在当前发生异常的OSD的邻居OSD均正常时,通知当前发生异常的OSD的邻居OSD彼此建立心跳连接,在当前发生异常的OSD为至少两个相邻的OSD时,通知该心跳连接环上至少两个相邻的OSD中邻居OSD为正常的OSD彼此建立心跳连接,并将该心跳连接环标记为降级状态;
如果该心跳连接环上未发生异常前所有OSD的总数量大于3个且该心跳连接环被标记为降级状态,在当前发生异常的OSD的邻居OSD均正常时,通知当前发生异常的OSD的邻居OSD彼此建立心跳连接,在当前发生异常的OSD为至少两个相邻的OSD时,通知该心跳连接环上至少两个相邻发生异常的OSD中邻居OSD为正常的OSD彼此建立心跳连接。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二处理模块,用于在所述Ceph集群中的存储节点中新增至少一个OSD后,判断新增的OSD中是否存在与被标记为降级状态的心跳连接环上减少的OSD处于同一存储节点的第一OSD;
在判断出新增的OSD中不存在与被标记为降级状态的心跳连接环上减少的OSD处于同一存储节点的第一OSD时,判断新增的OSD中是否存在与复用的OSD处于同一存储节点的第二OSD;
在判断出新增的OSD中不存在与复用的OSD处于同一存储节点的第二OSD时,执行以下操作:
判断新增的OSD中是否存在能够构建新的第一心跳连接环的第三OSD;
在判断出新增的OSD中存在能够构建新的第一心跳连接环的第三OSD时,根据所述第三OSD构建新的第一心跳连接环,并将新的第一心跳连接环上的每个第三OSD的邻居OSD分别发送给每个第三OSD,以使每个第三OSD分别与其邻居OSD建立心跳连接;
若新增的OSD中还有剩余的第四OSD,判断当前的所有心跳连接环中是否存在第二心跳连接环;
在判断出当前的所有心跳连接环中不存在第二心跳连接环时,根据所述第四OSD构建新的第二心跳连接环,并将新的第二心跳连接环上的每个第四OSD的邻居OSD分别发送给每个第四OSD,以使每个第四OSD分别与其邻居OSD建立心跳连接;
在判断出当前的所有心跳连接环中存在第二心跳连接环时,进一步判断同一存储节点中复用的OSD的数量是否不小于该存储节点中第四OSD的第二数量;
在判断结果为是时,从该存储节点中选择Q个不同的第四OSD替换不同的复用的OSD,分别通知所述Q个复用的OSD的邻居OSD重新与替换后的第四OSD建立心跳连接,并在新增的OSD中仍有剩余的第四OSD时,根据当前剩余的第四OSD构建新的第二心跳连接环,并将新的第二心跳连接环上的每个第四OSD的邻居OSD分别发送给每个第四OSD,以使每个第四OSD分别与其邻居OSD建立心跳连接,其中,Q的取值为该存储节点中所有第四OSD的总数量;
在判断结果为否时,从该存储节点中选择不同的第四OSD替换所有不同的复用的OSD,分别通知所有的复用的OSD的邻居OSD重新与替换后的第四OSD建立心跳连接,并在新增的OSD中仍有剩余的第四OSD时,根据当前剩余的第四OSD构建新的第二心跳连接环,将新的第二心跳连接环上的每个第四OSD的邻居OSD分别发送给每个第四OSD,以使每个第四OSD分别与其邻居OSD建立心跳连接;
在判断出新增的OSD中不存在能够构建新的第一心跳连接环的第三OSD时,将新增的OSD作为第四OSD,执行判断当前的所有心跳连接环中是否存在第二心跳连接环的步骤;
在判断出新增的OSD中存在与复用的OSD处于同一存储节点的第二OSD时,执行以下操作:
若同一存储节点中复用的OSD的数量不大于第二OSD的数量,从该存储节点中选择不同的第二OSD替换所有不同的复用的OSD,分别通知所有的复用的OSD的邻居OSD重新与替换后的第二OSD建立心跳连接,并在新增的OSD中还有剩余的OSD时,根据剩余的OSD构建新的心跳连接环,将新的第二心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接;
若同一存储节点中复用的OSD的数量大于第二OSD的数量,从该存储节点中选择S个不同的第二OSD替换不同的复用的OSD,分别通知所述S个复用的OSD的邻居OSD重新与替换后的第二OSD建立心跳连接,并在新增的OSD中还有剩余的OSD时,根据剩余的OSD构建新的心跳连接环,将新的心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD分别与其邻居OSD建立心跳连接,其中,S的取值为该存储节点中所有第二OSD的总数量;
在判断出新增的OSD中存在与被标记为降级状态的心跳连接环上减少的OSD处于同一存储节点的第一OSD时,将第一OSD恢复到该心跳连接环上,并在新增的OSD还有剩余的OSD时,执行判断新增的OSD中是否存在与复用的OSD处于同一存储节点的第二OSD的步骤。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第三处理模块,用于在所述Ceph集群中的存储节点中的至少一个OSD被删除后,针对每个被删除的OSD,判断该被删除的OSD所在的心跳连接环上的其他OSD是否均为复用的OSD;
若是,删除该被删除的OSD所在的心跳连接环;
否则,从该被删除的OSD所属存储节点中的其他OSD中选择一个OSD替换被删除的OSD,并通知被删除的OSD的邻居OSD重新与替换后的OSD建立心跳连接。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第四处理模块,用于在所述Ceph集群中新增存储节点或者至少一个存储节点被删除后,根据所述Ceph集群的最新OSD拓扑信息,重新构建心跳连接环;
将重新构建的每个心跳连接环上的每个OSD的邻居OSD分别发送给每个OSD,以使每个OSD重新与其邻居OSD建立心跳连接。
CN202010246544.1A 2020-03-31 2020-03-31 一种心跳连接的建立方法及装置 Active CN111506263B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010246544.1A CN111506263B (zh) 2020-03-31 2020-03-31 一种心跳连接的建立方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010246544.1A CN111506263B (zh) 2020-03-31 2020-03-31 一种心跳连接的建立方法及装置

Publications (2)

Publication Number Publication Date
CN111506263A CN111506263A (zh) 2020-08-07
CN111506263B true CN111506263B (zh) 2022-07-12

Family

ID=71878207

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010246544.1A Active CN111506263B (zh) 2020-03-31 2020-03-31 一种心跳连接的建立方法及装置

Country Status (1)

Country Link
CN (1) CN111506263B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104811325A (zh) * 2014-01-24 2015-07-29 华为技术有限公司 一种集群节点控制器监控方法、相关装置以及控制器
CN107608632A (zh) * 2017-09-21 2018-01-19 郑州云海信息技术有限公司 一种分布式存储集群的通信方法、装置及系统
CN107678918A (zh) * 2017-09-26 2018-02-09 郑州云海信息技术有限公司 一种分布式文件系统的osd心跳机制设置方法及装置
CN108418860A (zh) * 2018-01-26 2018-08-17 郑州云海信息技术有限公司 一种基于ceph集群的osd心跳通讯方法
CN108509153A (zh) * 2018-03-23 2018-09-07 新华三技术有限公司 Osd选择方法、数据写入和读取方法、监控器和服务器集群
CN108924195A (zh) * 2018-06-20 2018-11-30 郑州云海信息技术有限公司 一种单向心跳机制实现方法、装置、设备及系统
CN109558437A (zh) * 2018-11-16 2019-04-02 新华三技术有限公司成都分公司 主osd调整方法及装置
CN112995254A (zh) * 2019-12-13 2021-06-18 北京金山云网络技术有限公司 传输心跳信息的方法、设备、系统、装置及组件

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10003649B2 (en) * 2015-05-07 2018-06-19 Dell Products Lp Systems and methods to improve read/write performance in object storage applications

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104811325A (zh) * 2014-01-24 2015-07-29 华为技术有限公司 一种集群节点控制器监控方法、相关装置以及控制器
CN107608632A (zh) * 2017-09-21 2018-01-19 郑州云海信息技术有限公司 一种分布式存储集群的通信方法、装置及系统
CN107678918A (zh) * 2017-09-26 2018-02-09 郑州云海信息技术有限公司 一种分布式文件系统的osd心跳机制设置方法及装置
CN108418860A (zh) * 2018-01-26 2018-08-17 郑州云海信息技术有限公司 一种基于ceph集群的osd心跳通讯方法
CN108509153A (zh) * 2018-03-23 2018-09-07 新华三技术有限公司 Osd选择方法、数据写入和读取方法、监控器和服务器集群
CN108924195A (zh) * 2018-06-20 2018-11-30 郑州云海信息技术有限公司 一种单向心跳机制实现方法、装置、设备及系统
CN109558437A (zh) * 2018-11-16 2019-04-02 新华三技术有限公司成都分公司 主osd调整方法及装置
CN112995254A (zh) * 2019-12-13 2021-06-18 北京金山云网络技术有限公司 传输心跳信息的方法、设备、系统、装置及组件

Also Published As

Publication number Publication date
CN111506263A (zh) 2020-08-07

Similar Documents

Publication Publication Date Title
US6549513B1 (en) Method and apparatus for fast distributed restoration of a communication network
US6038288A (en) System and method for maintenance arbitration at a switching node
CN105827419B (zh) 一种转发设备故障处理的方法、设备和控制器
EP0348331A2 (en) Method of efficiently updating the topology databases of the nodes in a data communications network
CN109525445B (zh) 链路切换方法、链路冗余备份网络和计算机可读存储介质
JPH0758765A (ja) リング網のノード間情報収集方式
CN1805400B (zh) 用于多点对多点中继的干线网络系统
CN109218126B (zh) 监测节点存活状态的方法、装置及系统
US6370110B1 (en) Back-up restoration technique for SONET/SHD rings
US10911295B2 (en) Server apparatus, cluster system, cluster control method and program
US7406074B2 (en) Bundling messages in communication networks
CN105763344A (zh) 一种动态调整srlg的方法和装置
CN102088372A (zh) 一种心跳检测方法、系统和设备
CN104853138A (zh) 一种视频会议网络监控方法、服务器和客户端
CN111506263B (zh) 一种心跳连接的建立方法及装置
JP6201678B2 (ja) ネットワーク管理システムにおけるネットワークエレメント、ネットワーク管理システム、及び、ネットワークの管理方法
CN102932183A (zh) 双上行链路故障处理方法及设备
CN104994327A (zh) 一种视频会议中mcu异常处理的方法及系统
CN105634774A (zh) 恢复链路通讯的方法、业务线卡及系统
CN113784377B (zh) 数据通信方法、装置、电子设备及存储介质
JP5168499B2 (ja) 通信ネットワークシステム及びパスの高信頼化方法
CN106130783B (zh) 一种端口故障处理方法及装置
EP1062819B1 (en) Backup circuits in a telecommunications network
CN101695046A (zh) 一种设置rrpp阻塞点的方法及设备
CN108712207A (zh) 一种链路和业务的管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant