CN109144415B - 节点检测方法及共享存储装置 - Google Patents

节点检测方法及共享存储装置 Download PDF

Info

Publication number
CN109144415B
CN109144415B CN201810866054.4A CN201810866054A CN109144415B CN 109144415 B CN109144415 B CN 109144415B CN 201810866054 A CN201810866054 A CN 201810866054A CN 109144415 B CN109144415 B CN 109144415B
Authority
CN
China
Prior art keywords
read
write
target node
shared storage
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810866054.4A
Other languages
English (en)
Other versions
CN109144415A (zh
Inventor
钟晋明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Cloud Technologies Co Ltd
Original Assignee
New H3C Cloud Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Cloud Technologies Co Ltd filed Critical New H3C Cloud Technologies Co Ltd
Priority to CN201810866054.4A priority Critical patent/CN109144415B/zh
Publication of CN109144415A publication Critical patent/CN109144415A/zh
Application granted granted Critical
Publication of CN109144415B publication Critical patent/CN109144415B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供一种节点检测方法及共享存储装置,共享存储装置与目标节点通信连接,且能够被该目标节点读写。共享存储装置按照预设检测周期对本装置和目标节点的连通性进行检测,若检测结果为不连通,则确定目标节点不能读写共享存储装置;若检测结果为连通,则对共享存储装置中的预设地址执行模拟读写操作,并根据执行该模拟读写操作的结果判断目标节点是否能读写共享存储装置。如此,可以避免目标节点频繁地进行读写操作,从而节约目标节点的I/O资源。

Description

节点检测方法及共享存储装置
技术领域
本申请涉及共享存储技术领域,具体而言,涉及一种节点检测方法及共享存储装置。
背景技术
共享文件系统是指由多个节点组成的集群,多个节点可以访问同一存储空间,在任一节点上读写文件,在其他节点上可以访问该文件,节点之间通过分布式锁协商读写权限。
在一些应用场景中,共享文件系统的节点通过读写心跳机制来判定其他节点是否在线,每个节点按照自身的节点号在对应的固定地址写数据,并读取其他节点写的数据来判断其他节点是否在线。如此,每个节点需要频繁地进行大量读写(I/O)操作,占用大量I/O资源。随着集群中节点数量的增加,共享文件系统的负载将成倍增加,当共享文件系统的存储繁忙时,可能产生心跳I/O不响应的问题,从而导致得到错误的检测结果。
发明内容
有鉴于此,本申请的目的在于提供一种节点检测方法及共享存储装置,以至少部分地改善上述问题。
为了达到上述目的,本申请实施例采用如下方案:
第一方面,本申请实施例提供一种节点检测方法,应用于与目标节点通信连接的共享存储装置,所述目标节点能够对所述共享存储装置进行数据读写,所述方法包括:
按照预设检测周期对所述目标节点和所述共享存储装置的连通性进行检测;
若检测到所述目标节点和所述共享存储装置不连通,则确定所述目标节点不能读写所述共享存储装置;
若检测到所述目标节点和所述共享存储装置连通,则对所述共享存储装置中的预设地址执行模拟读写操作,并根据执行所述模拟读写操作的结果判断所述目标节点是否能够读写所述共享存储装置。
第二方面,本申请实施例提供一种共享存储装置,与目标节点通信连接,所述目标节点能够对所述共享存储装置进行数据读写,所述装置包括:
连通性检测模块,用于按照预设检测周期对所述目标节点和所述共享存储装置的连通性进行检测,当检测到所述目标节点和所述共享存储装置不连通时,确定所述目标节点不能读写所述共享存储装置;
第一判断模块,用于当检测到所述目标节点和所述共享存储装置连通时,对所述共享存储装置中的预设地址执行模拟读写操作,并根据执行所述模拟读写操作的结果判断所述目标节点是否能够读写所述共享存储装置。
相对于现有技术而言,本申请实施例具有以下有益效果:
本申请实施例提供的一种节点检测方法及共享存储装置,共享存储装置与目标节点通信连接,且能够被目标节点进行数据读写。共享存储装置按照预设检测周期对目标节点和本装置的连通性进行检测,若检测到目标节点和共享存储装置不连通,则确定目标节点不能读写共享存储装置;若检测到目标节点和共享存储装置连通,则对共享存储装置中的预设地址执行模拟读写操作,并根据执行该模拟读写操作的结果判断目标节点是否能读写共享存储装置。如此,可以避免目标节点频繁地进行读写操作,节约目标节点的I/O资源,从而避免在共享存储装置的存储业务繁忙时,因心跳I/O不响应而导致的对节点在线情况进行误判。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种共享存储系统的连接示意图;
图2为本申请实施例提供的一种节点检测方法的流程示意图;
图3为本申请实施例提供的一种具体示例中的应用场景示意图;
图4为本申请实施例提供的一种共享存储装置的功能模块框图。
图标:10-共享存储系统;100-共享存储装置;110-连通性检测模块;120-第一判断模块;130-第二判断模块;140-读写模块;150-地址更新模块;200、300、400-节点;20-Ceph分布式存储系统;21、22、23-RBD卷;30-集群;31、32、33-节点。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
请参照图1,图1是本申请实施例提供的一种共享存储系统10的连接示意图,该共享存储系统10包括共享存储装置100及通过网络与共享存储装置100通信连接的至少一个节点,例如,图1所示的节点200、节点300和节点400,所述至少一个节点可以对所述共享存储装置100进行数据读写。
在本申请实施例中,所述节点可以是任意具有数据处理功能和通信功能的电子设备,例如主机、服务器等。
所述共享存储装置100可以是任意能够被多个节点访问和读写的存储装置,在一种具体实施方式中,所述共享存储装置100可以是共享文件系统,如Ocfs2系统。在又一种具体实施方式中,所述共享存储装置可以是分布式存储系统中能够被多个节点访问的逻辑卷,比如,Ceph系统中的RBD(Rados Block Device)卷。
请参阅图2,是本申请实施例提供的一种节点检测方法的流程示意图,该节点检测方法应用于图1所示的共享存储装置100,下面结合图2对该方法的步骤进行详细阐述。
步骤S21,按照预设检测周期对所述目标节点和所述共享存储装置100的连通性进行检测。若不连通,则执行步骤S22;若连通,则执行步骤S23。
在本实施例中,与所述共享存储装置100通信连接、且能够读写所述共享存储装置100的任意节点均可以是所述目标节点,例如,图1中示出的节点200、节点300和节点400均可以是所述目标节点。
其中,所述预设检测周期可以根据实际情况进行灵活设定,例如可以设置为1秒、2秒、2.5秒等,本实施例对此不做限制。在实施时,所述共享存储装置100可以进行计时,并对计时时长进行检测,每检测到计时满一个所述预设检测周期,即可对所述目标节点和所述共享存储装置100的连通性进行检测。可选地,可以通过对所述目标节点的IP地址和所述共享存储装置100的IP地址执行Ping命令来实现对所述目标节点和所述共享存储装置100的连通性的检测。
在实施时,所述共享存储装置100可以根据所述目标节点发送的请求或指令获得所述目标节点的IP地址。例如,可以从所述目标节点发送的挂载请求中解析得到所述目标节点的IP地址;又如,可以从所述目标节点发送的实际读写指令中解析得到所述目标节点的IP地址。其中,在本实施例中,所述实际读写指令是指所述目标节点用于进行正常读写业务的读写指令。
步骤S22,确定所述目标节点不能读写所述共享存储装置100。
在本申请实施例中,如果检测到所述目标节点和所述共享存储装置100不连通,在此情况下,所述共享存储装置100无法接收到所述目标节点发送的任何指令,因而无法根据所述目标节点发送的指令进行相应的读写操作。基于此,可以直接确定所述目标节点不能读写所述共享存储装置100,而不必再进行后续的检测。如此,可以提高检测效率。
考虑到即便所述目标节点和所述共享存储装置100连通,所述目标节点也可能无法读写所述共享存储装置100,在本申请实施例中,在检测到所述目标节点和所述共享存储装置100连通的情况下,本实施例通过对预设地址进行模拟读写操作,进而根据模拟读写操作返回的结果来做进一步的检测,具体可通过下述的步骤S23实现。
步骤S23,对所述共享存储装置100中的预设地址执行模拟读写操作,并根据执行所述模拟读写操作的结果判断所述目标节点是否能读写所述共享存储装置100。
其中,对所述共享存储装置100中的预设地址执行模拟读写操作,是指:所述共享存储装置100生成用于读写所述预设地址的模拟读写指令,并执行该模拟读写指令。其中,所述模拟读写指令包括用于读所述预设地址的读指令和用于写所述预设地址的写指令。
在现有的一些实施方式中,每个节点会按照一定的检测周期写固定地址及读取其他各节点对应的地址,并根据读取结果判断其他节点是否在线。采用这种方式,每个节点在每个检测周期需要进行多次读操作,并且随着集群中节点数量的增加,每个检测周期内进行读操作的次数也会增加,这将会极大地占用节点的I/O资源,当共享存储装置100的存储业务繁忙时,可能会出现无法响应节点的读操作的情况,从而导致节点误判其他节点的在线情况。而通过本申请实施例的上述设计,在每个预设检测周期内,目标节点可以不必执行额外的读写操作,节约了I/O资源,能够在一定程度上避免出现上述误判的情况。
为了节约共享存储装置100的资源,在本申请实施例中,可以进一步将步骤S23的检测过程分为两种情况进行,其中一种是在目标节点有存储业务时,即目标节点会发送读写指令给共享存储装置100时,直接根据共享存储装置100执行读写指令的结果进行检测;另一种是在目标节点没有存储业务时,再按照前述方式,通过模拟读写进行检测。
基于上述描述,所述步骤S21可以包括以下子步骤:
检测是否接收到所述目标节点发送的实际读写指令;
在未接收到所述目标节点发送的实际读写指令达到预设时长时,再按照预设检测周期对目标节点和所述共享存储装置100的连通性进行检测。
对应地,所述节点检测方法还可以包括以下步骤:
接收所述目标节点发送的实际读写指令,根据执行所述实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置100。
在一种实施方式中,可以是每次接收到目标节点发送的实际读写指令时,均根据执行该实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置100。在又一种实施方式中,可以是在每次接收到目标节点发送的实际读写指令时,判断当前是否到达所述预设检测周期,如果到达,再根据执行该实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置100。其中,判断当前是否到达所述预设检测周期即为判断是否重新计时满一个预设检测周期。
可选地,在本实施例中,接收所述目标节点发送的实际读写指令的步骤,可以包括以下子步骤:
在接收到所述实际读写指令时,记录所述实际读写指令的实际读写地址及实际读写长度。
其中,所述实际读写指令可以包括读指令和/或写指令,所述读指令携带有读地址和读长度,所述写指令携带有写地址和写长度。所述实际读写地址包括所述读地址和/或所述写地址,所述实际读写长度包括所述读长度和/或所述写长度。
在实施时,如果所述实际读写指令仅包括读指令,则记录该读指令中的读地址和读长度;如果所述实际读写指令仅包括写指令,则记录该写指令中的写地址和写长度;如果所述实际读写指令同时包括读指令和写指令,则记录所述实际读写指令中的读地址、读长度、写地址和写长度。
通过上述步骤,只要所述共享存储装置100有接收到所述目标节点发送的实际读写指令,记录的实际读写地址和实际读写长度就会发生改变。基于此,所述检测是否接收到所述目标节点发送的实际读写指令的步骤,可以包括以下子步骤:
检测记录的实际读写地址和实际读写长度是否发生变化,若记录的实际读写地址和实际读写长度在所述预设时长内未发生变化,则确定未接收到所述目标节点发送的实际读写指令达到所述预设时长。
在一种具体实施方式中,可以在预设的变量中记录所述实际读写地址和所述实际读写长度,并在根据执行所述实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置100之后,将所述预设的变量重置为初始值,比如0。如此,可以对所述预设的变量的值进行检测,如果检测到所述预设的变量的值所述预设时长维持所述初始值,则可以确定在所述预设时长内所述目标节点都没有发送实际读写指令给所述共享存储装置100。
可选地,为了避免出现误检的情况,在本实施例中,步骤S23可以包括以下子步骤,以根据执行所述模拟读写操作的结果或执行所述实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置100:
若得到的结果为读写失败,则记录读写失败的次数;
当记录的读写失败的持续次数达到预设阈值时,确定所述目标节点不能读写所述共享存储装置100。
在实施时,所述共享存储装置100中可以预存有读写失败次数,在执行所述实际读写指令失败或是执行所述模拟读写操作失败时,更新所述读写失败次数的当前值,例如累加1;在执行所述实际读写指令成功或执行所述模拟读写操作成功时,将所述读写失败次数重置为初始值。如此,当检测到所述读写失败次数的值达到所述预设阈值时,即可确定所述目标节点不能读写所述共享存储装置100。
在本申请实施例中,为了降低功能模块之间的耦合程度,根据执行所述实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置100的步骤,可以通过如下子步骤实现:
获取所述实际读写指令的实际读写地址,所述实际读写地址包括读地址和/或写地址;
生成包括该读地址和/或该写地址的虚检查指令,并执行所述实际读写指令,以及从执行所述实际读写指令的结果中获取与所述虚检查指令对应的结果,并根据该结果判断所述目标节点是否能读取所述共享存储装置100。
在本申请实施例中,所述共享存储装置100可以包括用于执行实际读写指令的读写模块。在实施时,可以将接收到的实际读写指令和生成的虚检查指令一并发送给所述读写模块,当所述读写模块接收到所述实际读写指令时,会进行对应的读写操作。所述虚检查指令用于通知所述读写模块在执行完所述实际读写指令时,根据得到的结果判断所述目标节点是否能读写所述共享存储装置100。
详细地,当所述读写模块接收到所述虚检查指令时,会保存所述虚检查指令,并在得到所述实际读写指令执行的结果时,从该结果中获得与所述虚检查指令对应的结果,以根据该对应的结果进行后续的判断。
其中,关于与所述虚检查指令对应的结果可以作如下理解:
在本实施例中,如果所述实际读写指令只包括读指令和写指令两者中的一个指令,则所述实际读写地址也只包括该指令中的操作地址(读地址或写地址),所述实际读写长度也只包括该指令中的操作长度(读长度或写长度)。在此情况下,可以直接以所述实际读写地址为目标地址,生成包括该目标地址的虚检查指令,对应地,执行所述实际读写指令的结果即为与所述虚检查指令对应的结果。
在另一种情况中,如果所述实际读写指令同时包括读指令和写指令,则所述实际读写指令同时包括读地址和写地址,所述实际读写长度同时包括读长度和写长度。在此情况下,可以从读地址和写地址中选择一个,例如可以选较大的一个地址作为目标地址,从而生成包括该目标地址的虚检查指令。
例如,假设实际读写地址中读地址比写地址大,则可以以读地址为目标地址生成包括读地址的虚检查指令,如此,读写模块在执行所述实际读写指令后,可以根据读取读地址的结果来判断所述目标节点是否能读写所述共享存储装置100,其中,读取读地址的结果即为与所述虚检查指令对应的结果。如此,可以减少判断的结果数量,提高检测效率。
对应地,所述步骤S23可以包括如下子步骤:
生成包括所述预设地址的实检查指令和用于读写所述预设地址的模拟读写指令;
执行所述模拟读写指令,并在检测到所述实检查指令时根据执行所述模拟读写指令的结果判断所述目标节点是否能读写所述共享存储装置100。
其中,所述模拟读写指令包括用于读所述预设地址的读指令和用于写所述预设地址的写指令,所述读指令中的读长度和所述写指令中的写长度均可以根据需要进行灵活设定,例如可以为1字节。
在本实施例中,生成的所述实检查指令和所述模拟读写指令可以一并发送给所述读写模块,当所述读写模块接收到所述模拟读写指令时会执行所述模拟读写指令,并返回相应的执行结果,具体为执行失败或执行成功。所述实检查指令用于通知所述读写模块在执行完所述模拟读写指令时,根据得到的执行结果判断所述目标节点是否能读写所述共享存储装置100。
在本实施例中,所述预设地址可以是预先设置的固定地址,也可以是按照预设规则实时更新的地址,比如,可以通过如下方式进行更新:
在根据执行所述实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置100之后,将所述预设地址更新为所述实际读写地址中的读地址和/或写地址。
在实施时,如果所述实际读写地址包括读地址和写地址中的一个,则所述共享存储装置100可以直接将所述预设地址更新为该地址。如果所述实际读写地址包括读地址和写地址两者,则可以在每次根据执行所述实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置100之后,获取所述实际读写指令的读地址和写地址中较大的地址,将所述预设地址更新为该较大的地址。
在前述的生成虚检查指令的步骤中,会在实际读写地址中确定一目标地址,再生成包括该目标地址的虚检查指令。可选地,可以在所述共享存储装置100中设置一用于特定变量lastaddr,可以在每次确定目标地址后,将所述特定变量lastaddr的值更新为当前所确定的目标地址。如此,在需要更新预设地址时,可以将所述预设地址的值直接更新为所述特定变量lastaddr的当前值。
应当理解,lastaddr仅为示例,该特定变量也可以为其他名称,本实施例对此不做限制。
可选地,在本实施例中,所述节点检测方法还可以包括如下步骤:
在执行步骤S23之前,禁止所述目标节点读写所述共享存储装置100;
在执行步骤S23之后,允许所述目标节点读写所述共享存储装置100。
如此,可以避免在进行模拟读写操作期间受到目标节点的读写操作的影响。在此值得说明的是,由于当前基本上目标节点没有存储业务,因而禁止所述目标节点对所述共享存储装置100的读写操作不会对所述目标节点造成影响。
下面结合图3所示场景给出一个具体示例,以对本申请实施例提供的节点检测方法做进一步的阐述。
请参照图3,图3是本申请实施例提供的一种Ceph分布式存储系统20中的RBD卷21与集群30中的多个主机之间的连接示意图。其中,Ceph分布式存储系统20提供有RBD卷21、RBD卷22、RBD卷23,所述集群30包括主机31、主机32和主机33,Ceph分布式存储系统20中的每个RBD卷均能被所述集群30中的各主机访问和读写。在此情况下,每个RBD卷均可充当本申请实施例中的共享存储装置100。
以主机31和RBD卷21为例,本申请实施例提供的节点检测方法可以包括以下步骤。其中,主机31充当本申请实施例中的目标节点,RBD卷21充当本申请实施例中的共享存储装置100。假设主机31的IP地址为192.168.1.1,Ceph分布式存储系统20的IP地址为192.168.1.10。
第一,RBD卷21接收主机31发送的实际读写指令instrcut1,从实际读写指令instrcut1中解析并记录主机31的IP地址192.168.1.1,获取Ceph分布式存储系统20的IP地址192.168.1.10,对192.168.1.1和192.168.1.10运行Ping命令,以检测所述主机31和RBD卷21的连通性。
第二,如果不连通,则确定所述主机31不能读写所述RBD卷21。
在此假设所述实际读写指令instruct1中包括读指令和写指令,则所述实际读写指令instruct1的实际读写地址同时包括读地址和写地址,且写地址较大。
第三,如果连通,则获取所述实际读写指令instrcut1中的实际读写地址,将该实际读写地址中的读地址记录到addr1中,将该实际读写地址中的写地址记录到addr2中,在addr1和addr2中确定较大者为addr2,将写地址对应的写长度记录到len中。
在本示例中,addr1、addr2和len为初始值为0的变量。在实施时,可以通过指令addr=max(addr1,addr2)实现对addr1和addr2中较大者的选取。
第四,检测是否到达新的预设检测周期,如果否,则直接执行实际读写指令instruct1;如果是,则生成包括addr(即写地址addr2)的虚检查指令instruct2,并将该虚检查指令instruct2和实际读写指令instruct1发送给RBD卷21中的读写模块211。
其中,RBD卷22中可以包括读写模块221,RBD卷23中可以包括读写模块231。
第五,读写模块211执行实际读写指令instruct1,并在接收到虚检查指令instruct2的情况下,对执行实际读写指令instruct1的结果进行判断,如果该结果为执行失败,则更新预设变量num的值,以用于记录执行失败的次数;如果该结果为执行成功,则确定主机31可以读写RBD卷21,并将变量num的值置为0。
第六,将addr的值记录到lastaddr中,并将addr1、addr2和len重置为初始值。
第七,对预设变量num的值进行检测,当检测到num的值达到预设阈值(比如,5)时,确定主机31不能读写RBD卷21。
第八,对addr1、addr2和len的值进行实时检测,如果检测到addr1、addr2和len三者的值在预设时长(比如,2分钟、5分钟等)内均为0,则确定RBD卷所述预设时长没有接收到主机31发送的实际读写指令。
在此情况下,可以认为主机21当前没有存储业务。
第九,在确定主机31当前没有存储业务时,按照所述预设检测周期对主机31和RBD卷21的连通性进行检测。
在本步骤中,进行连通性检测的方式与前述的第一步相同,其中,主机31的IP地址可以使用RBD卷31中当前保存的主机31的IP地址。
第十,如果检测到主机31和RBD卷21不连通,则直接确定主机31不能读写RBD卷21。
第十一,如果检测到主机31和RBD卷21连通,则生成包括lastaddr的实检查指令instruct3,以及用于读写lastaddr的模拟读写指令instruct4。
第十二,禁止主机31读写RBD卷21。
第十三,将实检查指令instruct3和模拟读写指令instruct4一并发送给读写模块211。
其中,模拟读写指令instruct4包括读指令readlastaddr v和写指令writelastaddrv,其中,v表示用于存储返回结果的变量。
第十四,读写模块211执行模拟读写指令instruct4,并在接收到实检查指令instruct3的情况下,对执行模拟读写指令instruct4的结果进行判断,如果该结果为执行失败,则更新所述预设变量num的值,以用于记录执行失败的次数;如果该结果为执行成功,则确定主机31可以读写RBD卷21,并将变量num的值置为0。
第十五,允许主机31读写RBD卷21。
应当理解,图3中的主机32、主机33也可以充当本申请实施例中的目标节点,RBD卷22、RBD卷23也可以充当本申请实施例中的共享存储装置100,其具体执行步骤与上述步骤类似,在此不再赘述。
请参照图4,是本申请实施例提供的一种共享存储装置100的功能模块框图,共享存储装置100包括连通性检测模块110和第一判断模块120。
连通性检测模块110用于按照预设检测周期对所述目标节点和所述共享存储装置100的连通性进行检测,当检测到所述目标节点和所述共享存储装置100不连通时,确定所述目标节点不能读写所述共享存储装置100。
在本实施例中,关于连通性检测模块110的描述具体可以参考对图2所示的步骤S21和步骤S22的详细描述。
第一判断模块120用于当检测到所述目标节点和所述共享存储装置100连通时,对所述共享存储装置100中的预设地址执行模拟读写操作,并根据执行所述模拟读写操作的结果判断所述目标节点是否能读写所述共享存储装置100。
在本实施例中,关于第一判断模块120的描述具体可参考对图2所示步骤S23的详细描述。
可选地,所述连通性检测模块110具体可以用于检测是否接收到所述目标节点发送的实际读写指令,并在未接收到所述目标节点发送的实际读写指令达到预设时长时,再按照预设检测周期对目标节点和所述共享存储装置100的连通性进行检测。
对应地,所述共享存储装置100还可以包括第二判断模块130。
其中,第二判断模块130用于接收所述目标节点发送的实际读写指令,根据执行所述实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置100。
可选地,在本实施例中,所述共享存储装置100还可以包括用于执行读写指令的读写模块140。
在此情况下,所述第二判断模块130具体可以用于获取所述实际读写指令的实际读写地址,所述实际读写地址包括读地址和/或写地址;生成包括该读地址和/或该写地址的虚检查指令,并将所述虚检查指令和所述实际读写指令发送给所述读写模块140,使所述读写模块140执行所述实际读写指令,以及从执行所述实际读写指令的结果中获取与所述虚检查指令对应的结果,并根据该结果判断所述目标节点是否能读取所述共享存储装置100。
可选地,所述共享存储装置100还可以包括地址更新模块150。
所述地址更新模块150用于在所述第二判断模块130根据执行所述实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置100之后,将所述预设地址更新为所述实际读写地址中的读地址和/或写地址。
可选地,所述第一判断模块120具体可以用于生成包括所述预设地址的实检查指令和用于读写所述预设地址的模拟读写指令,并将所述实检查指令和所述模拟读写指令发送给所述读写模块140,使所述读写模块140执行所述模拟读写指令,以及在接收到所述实检查指令时根据执行所述模拟读写指令的结果判断所述目标节点是否能读写所述共享存储装置100。
关于上述模块的描述,具体可参考对上述内容中相关步骤的详细描述。
综上所述,本申请实施例提供的一种节点检测方法及共享存储装置,共享存储装置与目标节点通信连接,且能够被目标节点进行数据读写。共享存储装置按照预设检测周期对目标节点和本装置的连通性进行检测,若检测到目标节点和共享存储装置不连通,则确定目标节点不能读写共享存储装置;若检测到目标节点和共享存储装置连通,则对共享存储装置中的预设地址执行模拟读写操作,并根据执行该模拟读写操作的结果判断目标节点是否能读写共享存储装置。如此,可以避免目标节点频繁地进行读写操作,节约目标节点的I/O资源,从而避免在共享存储装置的存储业务繁忙时,因心跳I/O不响应而导致的对节点在线情况进行误判。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (8)

1.一种节点检测方法,其特征在于,应用于与目标节点通信连接的共享存储装置,所述目标节点能够对所述共享存储装置进行数据读写,所述共享存储装置与多个节点通信连接,所述多个节点中的任一节点为所述目标节点,所述方法包括:
针对每个所述目标节点,检测是否接收到所述目标节点发送的实际读写指令;
在未接收到所述目标节点发送的实际读写指令达到预设时长时,按照预设检测周期对所述目标节点和所述共享存储装置的连通性进行检测;
若检测到所述目标节点和所述共享存储装置不连通,则确定所述目标节点不能读写所述共享存储装置;
若检测到所述目标节点和所述共享存储装置连通,则对所述共享存储装置中的所述目标节点对应的预设地址执行模拟读写操作,并根据执行所述模拟读写操作的结果判断所述目标节点是否能读写所述共享存储装置;
在接收到所述目标节点发送的实际读写指令时,根据执行所述实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置。
2.根据权利要求1所述的节点检测方法,其特征在于,根据执行所述实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置,包括:
获取所述实际读写指令的实际读写地址,所述实际读写地址包括读地址和/或写地址;
生成包括该读地址和/或该写地址的虚检查指令,并执行所述实际读写指令,以及从执行所述实际读写指令的结果中获取与所述虚检查指令对应的结果,并根据该结果判断所述目标节点是否能读取所述共享存储装置。
3.根据权利要求2所述的节点检测方法,其特征在于,所述方法还包括:
在根据执行所述实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置之后,将所述预设地址更新为所述实际读写地址中的读地址和/或写地址。
4.根据权利要求1-3中任一项所述的节点检测方法,其特征在于,对所述共享存储装置中的预设地址执行模拟读写操作,并根据执行所述模拟读写操作的结果判断所述目标节点是否能读写所述共享存储装置,包括:
生成包括所述预设地址的实检查指令和用于读写所述预设地址的模拟读写指令;
执行所述模拟读写指令,以及在检测到所述实检查指令时根据执行所述模拟读写指令的结果判断所述目标节点是否能读写所述共享存储装置。
5.根据权利要求1-3中任一项所述的节点检测方法,其特征在于,
接收所述目标节点发送的实际读写指令,包括:
在接收到所述目标节点发送的实际读写指令时,记录所述实际读写指令的实际读写地址及实际读写长度;
检测是否接收到所述目标节点发送的实际读写指令,包括:
检测记录的实际读写地址和实际读写长度是否发生变化,若记录的实际读写地址和实际读写长度在所述预设时长内未发生变化,则确定未接收到所述目标节点发送的实际读写指令达到所述预设时长。
6.一种共享存储装置,其特征在于,与目标节点通信连接,所述目标节点能够对所述共享存储装置进行数据读写,所述共享存储装置与多个节点通信连接,所述多个节点中的任一节点为所述目标节点,所述装置包括:
连通性检测模块,用于针对每个所述目标节点,检测是否接收到所述目标节点发送的实际读写指令,并在未接收到所述目标节点发送的实际读写指令达到预设时长时,按照预设检测周期对所述目标节点和所述共享存储装置的连通性进行检测,当检测到所述目标节点和所述共享存储装置不连通时,确定所述目标节点不能读写所述共享存储装置;
第一判断模块,用于当检测到所述目标节点和所述共享存储装置连通时,对所述共享存储装置中的所述目标节点对应的预设地址执行模拟读写操作,并根据执行所述模拟读写操作的结果判断所述目标节点是否能读写所述共享存储装置;
第二判断模块,用于接收所述目标节点发送的实际读写指令,根据执行所述实际读写指令的结果判断所述目标节点是否能读写所述共享存储装置。
7.根据权利要求6所述的共享存储装置,其特征在于,所述共享存储装置包括用于执行读写指令的读写模块;
所述第二判断模块,具体用于获取所述实际读写指令的实际读写地址,所述实际读写地址包括读地址和/或写地址;生成包括该读地址和/或该写地址的虚检查指令,并将所述虚检查指令和所述实际读写指令发送给所述读写模块,使所述读写模块执行所述实际读写指令,以及从执行所述实际读写指令的结果中获取与所述虚检查指令对应的结果,并根据该结果判断所述目标节点是否能读取所述共享存储装置。
8.根据权利要求7所述的共享存储装置,其特征在于,所述第一判断模块,具体用于生成包括所述预设地址的实检查指令和用于读写所述预设地址的模拟读写指令,并将所述实检查指令和所述模拟读写指令发送给所述读写模块,使所述读写模块执行所述模拟读写指令,以及在接收到所述实检查指令时根据执行所述模拟读写指令的结果判断所述目标节点是否能读写所述共享存储装置。
CN201810866054.4A 2018-08-01 2018-08-01 节点检测方法及共享存储装置 Active CN109144415B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810866054.4A CN109144415B (zh) 2018-08-01 2018-08-01 节点检测方法及共享存储装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810866054.4A CN109144415B (zh) 2018-08-01 2018-08-01 节点检测方法及共享存储装置

Publications (2)

Publication Number Publication Date
CN109144415A CN109144415A (zh) 2019-01-04
CN109144415B true CN109144415B (zh) 2022-05-06

Family

ID=64799445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810866054.4A Active CN109144415B (zh) 2018-08-01 2018-08-01 节点检测方法及共享存储装置

Country Status (1)

Country Link
CN (1) CN109144415B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114520778A (zh) * 2022-01-13 2022-05-20 深信服科技股份有限公司 一种连通性检测方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104407947A (zh) * 2014-10-29 2015-03-11 中国建设银行股份有限公司 主备nas切换方法及装置
CN105515838A (zh) * 2015-11-26 2016-04-20 青岛海信传媒网络技术有限公司 一种服务配置方法及ha集群系统
CN107147528A (zh) * 2017-05-23 2017-09-08 郑州云海信息技术有限公司 一种存储网关智能防脑裂系统及方法
CN107391036A (zh) * 2017-07-12 2017-11-24 郑州云海信息技术有限公司 一种存储的vpd信息访问方法及系统
CN107544758A (zh) * 2017-08-29 2018-01-05 新华三云计算技术有限公司 集群的磁盘心跳检测方法和装置
CN107872368A (zh) * 2017-11-22 2018-04-03 杭州华为数字技术有限公司 一种网络节点集群中网关可达性的检测方法、装置及终端

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8069366B1 (en) * 2009-04-29 2011-11-29 Netapp, Inc. Global write-log device for managing write logs of nodes of a cluster storage system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104407947A (zh) * 2014-10-29 2015-03-11 中国建设银行股份有限公司 主备nas切换方法及装置
CN105515838A (zh) * 2015-11-26 2016-04-20 青岛海信传媒网络技术有限公司 一种服务配置方法及ha集群系统
CN107147528A (zh) * 2017-05-23 2017-09-08 郑州云海信息技术有限公司 一种存储网关智能防脑裂系统及方法
CN107391036A (zh) * 2017-07-12 2017-11-24 郑州云海信息技术有限公司 一种存储的vpd信息访问方法及系统
CN107544758A (zh) * 2017-08-29 2018-01-05 新华三云计算技术有限公司 集群的磁盘心跳检测方法和装置
CN107872368A (zh) * 2017-11-22 2018-04-03 杭州华为数字技术有限公司 一种网络节点集群中网关可达性的检测方法、装置及终端

Also Published As

Publication number Publication date
CN109144415A (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
CN106815054B (zh) 一种刷新bmc固件的方法及装置
RU2571726C2 (ru) Система и способ проверки целесообразности установки обновлений
JP4185043B2 (ja) 加入者識別モジュール(sim)エミュレータ
CN107807797B (zh) 数据写入的方法、装置及服务器
CN110442473B (zh) 一种非易失性数据存储方法、装置、电子设备及介质
US20180210784A1 (en) Metadata Recovery Method and Apparatus
CN108874441B (zh) 一种板卡配置方法、装置、服务器和存储介质
CN112307045A (zh) 一种数据同步方法及系统
CN111399857A (zh) 一种fru数据烧录方法、系统、设备及计算机存储介质
CN112235435A (zh) 一种用于快速编码的方法与设备
CN109144415B (zh) 节点检测方法及共享存储装置
CN113703996B (zh) 基于用户和yang模型分组的访问控制方法、设备及介质
CN108108258B (zh) 一种内存泄露的修复方法和装置
CN111930363B (zh) 区块接口代码生成方法、及装置
CN112000971A (zh) 一种文件权限记录方法、系统及相关装置
US20170075609A1 (en) Optimized Data Layout for Object Store System
CN106254092A (zh) 一种预警方法、装置及系统
CN112073518B (zh) 云存储系统、云存储系统管理方法及中心管理节点
CN114996955A (zh) 一种云原生混沌工程实验的靶场环境构建方法及装置
KR102071107B1 (ko) 데이터 처리를 위한 방법 및 시스템
CN109194500B (zh) 转发表状态切换方法、装置及通信设备
JP5836316B2 (ja) 障害監視システム、障害監視方法、及び障害監視プログラム
CN112162699A (zh) 一种数据读写方法、装置、设备及计算机可读存储介质
CN111880735A (zh) 一种存储系统中数据迁移方法、装置、设备及存储介质
CN107766196B (zh) 对计算设备进行启动检查的方法与设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant