CN112579384A - 一种sas域的节点监控方法、装置、系统及节点 - Google Patents

一种sas域的节点监控方法、装置、系统及节点 Download PDF

Info

Publication number
CN112579384A
CN112579384A CN201910926440.2A CN201910926440A CN112579384A CN 112579384 A CN112579384 A CN 112579384A CN 201910926440 A CN201910926440 A CN 201910926440A CN 112579384 A CN112579384 A CN 112579384A
Authority
CN
China
Prior art keywords
node
nodes
storage
exp
pages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910926440.2A
Other languages
English (en)
Other versions
CN112579384B (zh
Inventor
王腾腾
李庆华
吴海波
张宏海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201910926440.2A priority Critical patent/CN112579384B/zh
Publication of CN112579384A publication Critical patent/CN112579384A/zh
Application granted granted Critical
Publication of CN112579384B publication Critical patent/CN112579384B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供了一种SAS域的节点监控方法、装置、系统及节点。其中,方法应用于多节点SAS域系统中的任一节点,所述多节点SAS域系统中的每个节点包括主机总线适配器HBA、扩展器EXP以及至少一个磁盘HDD,其中,每个节点的EXP用于连接该节点的HBA和HDD,并且每个节点中的EXP存储有存储页,并且每个节点定期更新该节点的所述存储页,所述方法包括:定期读取其他节点的EXP中的所述存储页;确定所述其他节点的所述存储页是否更新;如果所述其他节点的所述存储页未更新,确定所述其他节点处于宕机状态。可以通过能够在节点间共享的EXP的存储页,实现节点间的心跳监控,以准确、及时地发现处于宕机状态的节点。

Description

一种SAS域的节点监控方法、装置、系统及节点
技术领域
本发明涉及SAS域存储集群技术领域,特别是涉及一种SAS域的节点监控方法、装置、系统及节点。
背景技术
SAS(Serial Attached Small computer system interface,串行连接小型计算机系统接口)域系统中可以包括多个存储设备,下文称这些存储设备为SAS域系统中的节点。这些节点通过SAS技术连接,可以实现节点间点对点的数据交互。
但是,SAS域系统中的节点可能出于一些特殊原因导致处于无法工作的宕机状态,导致该节点的磁盘处于缺少管理的状态,造成存储资源的浪费。如何对SAS域系统中的节点的状态进行准确的监控,以及时发现处于宕机状态的节点,以降低对存储资源的浪费,成为亟待解决的技术问题。
发明内容
本发明实施例的目的在于提供一种SAS域的节点监控方法、装置、系统及节点,以实现对多节点SAS域中节点的状态进行监控。具体技术方案如下:
在本发明实施例的第一方面,提供了一种SAS域的节点监控方法,应用于多节点SAS域系统中的任一节点,所述多节点SAS域系统中的每个节点包括主机总线适配器HBA、扩展器EXP以及至少一个磁盘HDD,其中,每个节点的EXP用于连接该节点的HBA和HDD,并且每个节点中的EXP存储有存储页,并且每个节点定期更新该节点的所述存储页,并且所述多节点SAS域系统中的节点间建立有通信连接,所述方法包括:
定期读取其他节点的EXP中的所述存储页;
确定所述其他节点的所述存储页是否更新;
如果所述其他节点的所述存储页未更新,确定所述其他节点处于宕机状态。
结合第一方面,在一种可能的实现方式中,所述方法还包括:
如果所述其他节点的所述存储页已经更新,确定所述其他节点处于正常状态。
结合第一方面,在一种可能的实现方式中,在所述确定所述其他节点宕机后,所述方法还包括:
管理所述其他节点的HDD。
结合第一方面,在一种可能的实现方式中,在所述管理所述其他节点的HDD前,所述方法还包括:
确定所述其他节点的所述存储页中是否存储有接管标识;
如果所述其他节点的所述存储页中没有存储接管标识,在所述其他节点的存储页中写入接管标识;
如果所述其他节点的所述存储页中存储有接管标识,终止执行所述管理所述其他节点的HDD的步骤。
在本发明实施例的第二方面,提供了一种SAS域的节点监控装置,应用于多节点SAS域系统中的任一节点,所述多节点SAS域系统中的每个节点包括主机总线适配器HBA、扩展器EXP以及至少一个磁盘HDD,其中,每个节点的HBA用于通过EXP管理该节点的HDD,并且每个节点中的EXP存储有存储页,并且每个节点定期更新该节点的所述存储页,并且所述多节点SAS域系统中的节点间建立有通信连接,所述装置包括:
页读取模块,用于定期读取其他节点的EXP中的所述存储页;
更新判断模块,用于确定所述其他节点的所述存储页是否更新;
状态判断模块,用于如果所述其他节点的所述存储页未更新,确定所述其他节点处于宕机状态。
结合第二方面,在一种可能的实现方式中,所述状态判断模块,还用于如果所述其他节点的所述存储页已经更新,确定所述其他节点处于正常状态。
结合第二方面,在一种可能的实现方式中,所述装置还包括HDD接管模块,用于在所述确定所述其他节点宕机后,管理所述其他节点的HDD。
结合第二方面,在一种可能的实现方式中,所述HDD接管模块,还用于在所述管理所述其他节点的HDD前,确定所述其他节点的所述存储页中是否存储有接管标识;
如果所述其他节点的所述存储页中没有存储接管标识,在所述其他节点的存储页中写入接管标识;
如果所述其他节点的所述存储页中存储有接管标识,终止执行所述管理所述其他节点的HDD的步骤。
在本发明实施例的第三方面,提供了一种多节点SAS域系统,所述系统包括:
多个节点,所述多个节点中的每个节点包括主机总线适配器HBA、扩展器EXP以及至少一个磁盘HDD,其中,每个节点的HBA用于通过EXP管理该节点的HDD,并且每个节点中的EXP存储有存储页,并且每个节点定期更新该节点的所述存储页,并且所述多个节点间建立有通信连接;
所述多个节点中的每个节点,实现第一方面任一所述的方法步骤。
结合第三方面,在一种可能的实现方式中,所述系统还包括SAS交换机,所述SAS交换机与所述多个节点中每个节点的EXP建立有通信连接;
所述SAS交换机用于实现所述多个节点间的数据交互。
结合第三方面,在一种可能的实现方式中,所述多个节点为两个节点;
所述系统还包括SAS线,所述SAS线的一端连接于所述两个节点中的一个节点,另一端连接于所述两个节点中的另一个节点;
所述SAS线用于实现所述两个节点间的通信连接。
在本发明实施例的第四方面,提供了一种节点,应用于多节点SAS域系统,所述节点包括主机总线适配器HBA、扩展器EXP、至少一个磁盘HDD、处理器、存储器;
所述EXP用于连接所述HBA和所述HDD;
所述EXP中存储有存储页;
所述处理器用于定期更新所述存储页;
所述存储器,用于存放计算机程序;
所述处理器,还用于执行存储器上所存放的程序时,实现上述第一方面任一所述的方法步骤。
在本发明实施例的第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一所述的方法步骤。
本发明实施例提供的SAS域的节点监控方法、装置、系统及节点,可以通过能够在节点间共享的EXP的存储页,实现节点间的心跳监控,以准确、及时地发现多节点SAS域系统中处于宕机状态的节点。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a为本发明实施例提供的多节点SAS域系统的一种结构示意图;
图1b为本发明实施例提供的多节点SAS域系统的另一种结构示意图
图2为本发明实施例提供的SAS域的节点监控方法的一种流程示意图;
图3为本发明实施例提供的HDD接管方法的一种流程示意图;
图4为本发明实施例提供的SAS域的节点监控装置的一种结构示意图;
图5为本发明实施例提供的应用于多节点SAS域系统中的节点的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1a,图1a所示为本发明实施例提供的多节点SAS域系统的一种结构示意图,可以包括节点100和SAS交换机200,其中每个节点100包括主机总线适配器HBA(Host BusAdapter)110、扩展器EXP(Expander)120,以及至少一个磁盘HDD(Hard Disk Drive)130。不同节点中HDD的数目可以相同,也可以不同,示例性的,节点A中可以包括4个HDD,节点B中可以包括6个HDD,本实施例对此不做限制。
EXP120用于连接HBA110和HDD130,并且EXP中存储有存储页(page),每个节点定期更新该节点的存储页。其中,定期更新可以是指周期性的更新,也可以是指按照预设规则或用户指令非周期性的更新。示例性的,可以是每间隔3分钟更新一次存储页,也可以是在每个小时的第10分钟、第20分钟、第40分钟更新存储页。
更新存储页可以是指改变存储页中至少一个内容,以使得更新后的存储页中的内容,与更新前的存储页中的内容不完全一致。示例性的,假设存储页一共包括3个字节,在更新前3个字节分别为0 0 0,则更新后3个字节可以是0 1 0,也可以是1 2 3,本实施例对此不做限制。存储页中所存储的内容根据应用场景的不同可以不同,本实施例对此不做限制。示例性的,存储页中可以存储有一计数,每当更新存储页时将该计数加一,直至到达预设最大值后,再次更新存储页时将该计数归零。
多个节点之间建立有通信连接,该通信连接为基于SAS技术实现的,以图1a所示的实施例为例,可以是通过SAS交互机实现的。在其他应用场景中,也可以是通过其他方式实现的,例如,在多个节点SAS域系统中的节点数目为2个时,可以如图1b所示,通过SAS线300实现两个节点之间的通信连接,该SAS线一端连接在两个节点中的一个节点上,另一端连接在两个节点中的另一个节点上。
图1a和图1b所示的多节点SAS域系统仅为本发明实施例提供的多节点SAS域系统的两种可能的构架,在其他可能的实施例中,多节点SAS域系统也可以是其他构架,本实施例对此不做限制。为描述方便,下面将以图1a所示的构架为例,对本发明实施例提供的SAS域的节点监控方法进行说明,对于图1b所示的构架,以及其他可能的构架的实施例,原理是相同的,因此不再赘述。
可以参见图2,图2所示为本发明实施例提供的SAS域的节点监控方法的一种流程示意图,可以包括:
S201,定期读取其他节点的EXP中的存储页。
该方法可以应用于多节点SAS域系统中的任一节点,其他节点可以是指多节点SAS域系统中除该任一节点外的所有或部分节点。示例性,假设多节点SAS域系统中包括节点A、节点B、节点C以及节点D,并且该方法应用于节点A,则其他节点可以指节点B、节点C以及节点D,在其他可能的应用场景中,也可以是指这三个节点中的一个或两个节点,如节点B,或者,节点B和节点C。可以理解的是,由于节点间建立有基于SAS技术的通信连接,因此对于任意节点可以访问其他节点的EXP,并读取其中的存储页。
定期读取可以是指周期性的读取,也可以是指按照预设规则或用户指令非周期性的读取。参见前述关于定期更新的描述,在本发明实施例中,任意两次定期读取的间隔中,至少包含一次定期更新。示例性的,可以是每间隔3分钟更新一次存储页,并且每间隔3分钟读取其他节点的存储页,并且读取存储页与更新存储页存在一分钟的时延,例如,在t=0min时,各个节点更新存储页,t=1min时,读取其他节点的存储页,t=3min时,各个节点再次更新存储页,t=4min时,再次读取其他节点的存储页,依次类推。又例如,也可以是在每个小时的第10分钟、第20分钟、第40分钟更新存储页,并在每个小时的第11分钟、第21分钟、第41分钟读取存储页。
S202,确定其他节点的存储页是否更新。
其中,存储页更新是指相比于上次读取到的存储页,本次读取到的存储页中的内容存在差异。可以理解的是,对于第一次读取存储页,由于不存在上次读取到的存储页,存储页更新可以是指相比于预设初始内容,本次读取到的存储页中的内容存在差异。
根据应用场景的不同,确定其他节点的存储页是否更新的方式可以不同。示例性,可以是对比本次读取到的存储页,与上次读取到的存储页,如果本次读取到的存储页与上次读取到的存储页之间存在差异,则确定其他节点的存储页已经更新,如果本次读取到的存储页与上次读取到的存储页之间不存在差异,则确定其他节点的存储页未更新。
在其他可能的应用场景中,存储页中也可以存储有用于表示最近一次更新的时间的信息,则可以是根据读取到的该信息确定存储页最近一次更新的时间,如果该时间晚于上次读取存储页的时间,则确定读取到的存储页更新。示例性的,假设上次读取存储页的时间为t=1min,本次读取存储页的时间为t=4min,如果根据存储页中的信息确定存储页最近一次更新是在t=3min时,则可以确定该存储页已经更新,如果根据存储页中的信息确定存储页最近一次更新是在t=0min时,则可以确定该存储页未更新。
S203,如果其他节点的存储页未更新,确定其他节点处于宕机状态。
参见前述关于存储页的描述,可以理解的是,如果其他节点处于正常状态,则其他节点理论上会定期更新存储页,因此如果其他节点的存储页未更新,则可以确定其他节点处于宕机状态。如果其他节点的存储页已经更新,则可以认为其他节点处于正常状态。
示例性的,以多节点SAS域系统中包括节点A、节点B、节点C以及节点D为例,假设节点A读取到节点B、节点C以及节点D的存储页后,确定节点B、节点C的存储页已经更新,而节点D的存储页未更新,则可以确定节点B、节点C处于正常状态,节点D处于宕机状态。
选用该实施例,可以通过能够在节点间共享的EXP的存储页,实现节点间的心跳监控,以准确、及时地发现多节点SAS域系统中处于宕机状态的节点。
再次参见图1a所示的实施例(对于图1b所示的实施例,以及其他可能的实施例原理是相同,不再赘述),如果一个节点处于宕机状态,则该节点的HDD处于无管理状态,造成硬件资源的浪费。有鉴于此,可以参见图3,图3所示为本发明实施例提供的HDD接管方法的一种流程示意图,可以包括:
S301,定期读取其他节点的EXP中的存储页。
该步骤与S201相同,可以参见前述S201中的相关描述,在此不再赘述。
S302,确定其他节点的存储页是否更新,如果其他节点的存储页已经更新,执行S303,如果其他节点的存储页未更新,执行S304。
S303,确定其他节点处于正常状态,并返回执行S301。
S304,确定其他节点处于宕机状态。
该步骤与S203相同,可以参见前述S203的相关描述,在此不再赘述。
S305,确定其他节点的存储页中是否存储有接管标识。
接管标识根据应用场景的不同,表示的形式可以不同。示例性的,在一种可能的实施例中,可以是将存储页中指定的位置进行置位,作为接管标识。则确定存储页中是否存储有接管标识,可以是确定存储页中指定的位置的值是否为1,如果该指定的位置的值为1,则确定存储页中存储有接管标识,如果该指定的位置的值为0,则确定存储页中没有存储接管标识。
S306,如果其他节点的存储页中没有接管标识,在其他节点的存储页中写入接管标识。
在该实施例中,如果其他节点的存储页中没有接管标识,可以认为处于宕机状态的其他节点的HDD尚未被接管,处于无管理状态,因此可以对这些HDD进行接管。为避免多个节点同时对这些HDD接管,可以在接管前先在存储页中写入接管标识,以使得其他准备接管这些HDD的节点在确定到存储页中的接管标识后,不再继续准备接管这些HDD。
S307,管理其他节点的HDD。
为更清楚的对本发明实施例提供的HDD接管方法进行说明,下面将以多节点SAS域系统中包括节点A、节点B、节点C以及节点D为例,结合具体应用场景进行说明。假设这四个节点以3分钟为周期,周期性的更新存储页,并且以3分钟为周期,周期性的读取其他节点的存储页,其中节点A、节点B以及节点C一直处于正常状态,节点D在t=2min时宕机,则HDD接管的时序可以如下所示:
t=0min时,节点A更新节点A的存储页,节点B更新节点B的存储页,节点C更新节点C的存储页,节点D更新节点D的存储页。
t=1min时,节点A读取节点B、节点C、节点D的存储页,节点B读取节点A、节点C、节点D的存储页,节点C读取节点A、节点B、节点D的存储页,节点D读取节点A、节点B、节点C的存储页。
节点A分别确定节点B、节点C、节点D的存储页是否更新,节点B分别确定节点A、节点C、节点D的存储页是否更新,节点C分别确定节点A、节点B、节点D的存储页是否更新,节点D分别确定节点A、节点B、节点C的存储页是否更新。
由于在t=0min时,各个节点均处于正常状态,并更新各自的存储页,因此对于每个节点,所有其他节点的存储页均已经更新,无需接管其他节点的HDD。
t=3min时,由于节点D已经宕机,因此节点A更新节点A的存储页,节点B更新节点B的存储页,节点C更新节点C的存储页。
t=4min时,节点A读取节点B、节点C、节点D的存储页,节点B读取节点A、节点C、节点D的存储页,节点C读取节点A、节点B、节点D的存储页。
节点A分别确定节点B、节点C、节点D的存储页是否更新,节点B分别确定节点A、节点C、节点D的存储页是否更新,节点C分别确定节点A、节点B、节点D的存储页是否更新。
由于在t=3min时,节点D并未更新节点D的存储页,因此对于节点A、节点B以及节点C,可以确定节点D的存储页未更新,并进而确定需要阶段节点D的HDD。
假设节点A的响应速度较快,则对于节点A,确定节点D的存储页中是否存储有接管标识,此时由于尚未有节点对节点D的HDD进行接管,因此节点A可以确定节点D的存储页中没有存储接管标识。因此节点A可以向节点D写入接管标识,并管理节点D的HDD。
由于响应速度较慢,对于节点B、节点C,确定节点D的存储页中是否存储有接管标识,此时节点A已经在节点D的存储页中写入接管标识,因此节点B、节点C可以确定节点D的存储页中存储有接管标识。因此节点B、节点C不会对节点D的HDD进行接管。即实现了由节点A在节点D宕机后,对节点D的HDD进行接管。
参见图4,图4所示为本发明实施例提供的SAS域的节点监控装置的一种结构示意图,该装置应用于多节点SAS域系统中的任一节点,多节点SAS域系统中的每个节点包括主机总线适配器HBA、扩展器EXP以及至少一个磁盘HDD,其中,每个节点的HBA用于通过EXP管理该节点的HDD,并且每个节点中的EXP存储有存储页,并且每个节点定期更新该节点的存储页,并且多节点SAS域系统中的节点间建立有通信连接,该装置可以包括:
页读取模块401,用于定期读取其他节点的EXP中的存储页;
更新判断模块402,用于确定其他节点的存储页是否更新;
状态判断模块403,用于如果其他节点的存储页未更新,确定其他节点处于宕机状态。
在一种可能的实施例中,状态判断模块403,还用于如果其他节点的存储页已经更新,确定其他节点处于正常状态。
在一种可能的实施例中,装置还包括HDD接管模块,用于在确定其他节点宕机后,管理其他节点的HDD。
在一种可能的实施例中,HDD接管模块,还用于在管理其他节点的HDD前,确定其他节点的存储页中是否存储有接管标识;
如果其他节点的存储页中没有存储接管标识,在其他节点的存储页中写入接管标识;
如果其他节点的存储页中存储有接管标识,终止执行管理其他节点的HDD的步骤。
本发明实施例还提供了一种节点,应用于多节点SAS域系统,节点可以如图5所示,包括主机总线适配器HBA110、扩展器EXP120、至少一个磁盘HDD130、处理器140、存储器150。
EXP120用于连接HBA110和HDD130;
EXP120中存储有存储页;
处理器140,用于定期更新存储页;
存储器150,用于存放计算机程序;
处理器140,还用于执行存储器150上所存放的程序时,实现如下步骤:
定期读取其他节点的EXP中的存储页;
确定其他节点的存储页是否更新;
如果其他节点的存储页未更新,确定其他节点处于宕机状态。
在一种可能的实施例中,方法还包括:
如果其他节点的存储页已经更新,确定其他节点处于正常状态。
在一种可能的实施例中,在确定其他节点宕机后,方法还包括:
管理其他节点的HDD。
在一种可能的实施例中,在管理其他节点的HDD前,方法还包括:
确定其他节点的存储页中是否存储有接管标识;
如果其他节点的存储页中没有存储接管标识,在其他节点的存储页中写入接管标识;
如果其他节点的存储页中存储有接管标识,终止执行管理其他节点的HDD的步骤。
上述节点提到的存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一SAS域的节点监控方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一SAS域的节点监控方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、系统、节点、计算机可读存储介质以及计算机程序产品的实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (13)

1.一种SAS域的节点监控方法,其特征在于,应用于多节点SAS域系统中的任一节点,所述多节点SAS域系统中的每个节点包括主机总线适配器HBA、扩展器EXP以及至少一个磁盘HDD,其中,每个节点的EXP用于连接该节点的HBA和HDD,并且每个节点中的EXP存储有存储页,并且每个节点定期更新该节点的所述存储页,并且所述多节点SAS域系统中的节点间建立有通信连接,所述方法包括:
定期读取其他节点的EXP中的所述存储页;
确定所述其他节点的所述存储页是否更新;
如果所述其他节点的所述存储页未更新,确定所述其他节点处于宕机状态。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述其他节点的所述存储页已经更新,确定所述其他节点处于正常状态。
3.根据权利要求1所述的方法,其特征在于,在所述确定所述其他节点宕机后,所述方法还包括:
管理所述其他节点的HDD。
4.根据权利要求3所述的方法,其特征在于,在所述管理所述其他节点的HDD前,所述方法还包括:
确定所述其他节点的所述存储页中是否存储有接管标识;
如果所述其他节点的所述存储页中没有存储接管标识,在所述其他节点的存储页中写入接管标识;
如果所述其他节点的所述存储页中存储有接管标识,终止执行所述管理所述其他节点的HDD的步骤。
5.一种SAS域的节点监控装置,其特征在于,应用于多节点SAS域系统中的任一节点,所述多节点SAS域系统中的每个节点包括主机总线适配器HBA、扩展器EXP以及至少一个磁盘HDD,其中,每个节点的HBA用于通过EXP管理该节点的HDD,并且每个节点中的EXP存储有存储页,并且每个节点定期更新该节点的所述存储页,并且所述多节点SAS域系统中的节点间建立有通信连接,所述装置包括:
页读取模块,用于定期读取其他节点的EXP中的所述存储页;
更新判断模块,用于确定所述其他节点的所述存储页是否更新;
状态判断模块,用于如果所述其他节点的所述存储页未更新,确定所述其他节点处于宕机状态。
6.根据权利要求5所述的装置,其特征在于,所述状态判断模块,还用于如果所述其他节点的所述存储页已经更新,确定所述其他节点处于正常状态。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括HDD接管模块,用于在所述确定所述其他节点宕机后,管理所述其他节点的HDD。
8.根据权利要求7所述的装置,其特征在于,所述HDD接管模块,还用于在所述管理所述其他节点的HDD前,确定所述其他节点的所述存储页中是否存储有接管标识;
如果所述其他节点的所述存储页中没有存储接管标识,在所述其他节点的存储页中写入接管标识;
如果所述其他节点的所述存储页中存储有接管标识,终止执行所述管理所述其他节点的HDD的步骤。
9.一种多节点SAS域系统,其特征在于,所述系统包括:
多个节点,所述多个节点中的每个节点包括主机总线适配器HBA、扩展器EXP以及至少一个磁盘HDD,其中,每个节点的HBA用于通过EXP管理该节点的HDD,并且每个节点中的EXP存储有存储页,并且每个节点定期更新该节点的所述存储页,并且所述多个节点间建立有通信连接;
所述多个节点中的每个节点,实现权力要求1-4任一所述的方法步骤。
10.根据权利要求9所述的系统,其特征在于,所述系统还包括SAS交换机,所述SAS交换机与所述多个节点中每个节点的EXP建立有通信连接;
所述SAS交换机用于实现所述多个节点间的数据交互。
11.根据权利要求9所述的系统,其特征在于,所述多个节点为两个节点;
所述系统还包括SAS线,所述SAS线的一端连接于所述两个节点中的一个节点,另一端连接于所述两个节点中的另一个节点;
所述SAS线用于实现所述两个节点间的通信连接。
12.一种节点,其特征在于,应用于多节点SAS域系统,所述节点包括主机总线适配器HBA、扩展器EXP、至少一个磁盘HDD、处理器、存储器;
所述EXP用于连接所述HBA和所述HDD;
所述EXP中存储有存储页;
所述处理器用于定期更新所述存储页;
所述存储器,用于存放计算机程序;
所述处理器,还用于执行存储器上所存放的程序时,实现权利要求1-4任一所述的方法步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法步骤。
CN201910926440.2A 2019-09-27 2019-09-27 一种sas域的节点监控方法、装置、系统及节点 Active CN112579384B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910926440.2A CN112579384B (zh) 2019-09-27 2019-09-27 一种sas域的节点监控方法、装置、系统及节点

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910926440.2A CN112579384B (zh) 2019-09-27 2019-09-27 一种sas域的节点监控方法、装置、系统及节点

Publications (2)

Publication Number Publication Date
CN112579384A true CN112579384A (zh) 2021-03-30
CN112579384B CN112579384B (zh) 2023-07-04

Family

ID=75110040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910926440.2A Active CN112579384B (zh) 2019-09-27 2019-09-27 一种sas域的节点监控方法、装置、系统及节点

Country Status (1)

Country Link
CN (1) CN112579384B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102325163A (zh) * 2011-07-18 2012-01-18 福建星网锐捷网络有限公司 一种路由更新方法、装置及相关设备
CN103475695A (zh) * 2013-08-21 2013-12-25 华为数字技术(成都)有限公司 存储系统互联方法及装置
CN104657316A (zh) * 2015-03-06 2015-05-27 北京百度网讯科技有限公司 服务器
CN105843557A (zh) * 2016-03-24 2016-08-10 天津书生云科技有限公司 冗余存储系统、冗余存储方法和冗余存储装置
CN105912666A (zh) * 2016-04-12 2016-08-31 中国科学院软件研究所 一种面向云平台的混合结构数据高性能存储、查询方法
CN107046575A (zh) * 2017-04-18 2017-08-15 南京卓盛云信息科技有限公司 一种云存储系统及其高密度存储方法
CN109582213A (zh) * 2017-09-29 2019-04-05 杭州海康威视系统技术有限公司 数据重构方法及装置、数据存储系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3326669B2 (ja) * 1995-06-30 2002-09-24 ソニー株式会社 データ再生装置
CN108762987A (zh) * 2018-05-30 2018-11-06 上海顺舟智能科技股份有限公司 用于双备份单片机闪存的数据恢复方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102325163A (zh) * 2011-07-18 2012-01-18 福建星网锐捷网络有限公司 一种路由更新方法、装置及相关设备
CN103475695A (zh) * 2013-08-21 2013-12-25 华为数字技术(成都)有限公司 存储系统互联方法及装置
CN104657316A (zh) * 2015-03-06 2015-05-27 北京百度网讯科技有限公司 服务器
CN105843557A (zh) * 2016-03-24 2016-08-10 天津书生云科技有限公司 冗余存储系统、冗余存储方法和冗余存储装置
CN105912666A (zh) * 2016-04-12 2016-08-31 中国科学院软件研究所 一种面向云平台的混合结构数据高性能存储、查询方法
CN107046575A (zh) * 2017-04-18 2017-08-15 南京卓盛云信息科技有限公司 一种云存储系统及其高密度存储方法
CN109582213A (zh) * 2017-09-29 2019-04-05 杭州海康威视系统技术有限公司 数据重构方法及装置、数据存储系统

Also Published As

Publication number Publication date
CN112579384B (zh) 2023-07-04

Similar Documents

Publication Publication Date Title
CN114020482A (zh) 数据写入的方法和设备
US20130166672A1 (en) Physically Remote Shared Computer Memory
CN103338243A (zh) Web节点的缓存数据更新方法和系统
RU2653254C1 (ru) Способ, узел и система управления данными для кластера базы данных
US10795579B2 (en) Methods, apparatuses, system and computer program products for reclaiming storage units
US11237761B2 (en) Management of multiple physical function nonvolatile memory devices
CN115599747A (zh) 一种分布式存储系统的元数据同步方法、系统及设备
CN107577775B (zh) 一种读取数据方法、装置、电子设备及可读存储介质
US8738816B2 (en) Management of detected devices coupled to a host machine
CN112579384B (zh) 一种sas域的节点监控方法、装置、系统及节点
CN111078418A (zh) 操作同步方法、装置、电子设备及计算机可读存储介质
US20150135004A1 (en) Data allocation method and information processing system
US11150847B2 (en) Shingled magnetic recording drive mapping using nonvolatile random access memory for persistent updates
CN110083509B (zh) 一种日志数据的规整方法及装置
EP2916231B1 (en) Directory maintenance method and apparatus
JP2013186765A (ja) バッチ処理システム、進捗状況確認装置、進捗状況確認方法、及びプログラム
US10866756B2 (en) Control device and computer readable recording medium storing control program
JP6988178B2 (ja) 情報処理装置、ログ管理プログラム及びログ管理方法
JP6542172B2 (ja) ジョブ実行制御装置およびプログラム
CN111708783A (zh) 数据存储和数据恢复方法、装置及电子设备
CN107209882B (zh) 对于处在管理之下的设备的多阶段撤销注册
US20230244390A1 (en) Collecting quality of service statistics for in-use child physical functions of multiple physical function non-volatile memory devices
CN114731326B (zh) 区块链系统、程序及网络连接装置
CN112543213B (zh) 一种数据处理方法及装置
US10853188B2 (en) System and method for data retention in a decentralized system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant