CN107171865A - 一种多节点存储系统以及LUN ownernode切换方法 - Google Patents

一种多节点存储系统以及LUN ownernode切换方法 Download PDF

Info

Publication number
CN107171865A
CN107171865A CN201710522567.9A CN201710522567A CN107171865A CN 107171865 A CN107171865 A CN 107171865A CN 201710522567 A CN201710522567 A CN 201710522567A CN 107171865 A CN107171865 A CN 107171865A
Authority
CN
China
Prior art keywords
node
lun
ownernode
storage system
malfunctioning node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710522567.9A
Other languages
English (en)
Inventor
范聪聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710522567.9A priority Critical patent/CN107171865A/zh
Publication of CN107171865A publication Critical patent/CN107171865A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明公开了一种多节点存储系统以及多节点存储系统LUN ownernode切换方法,其中切换方法,包括:步骤1,判断存储系统中的存储节点是否发生故障;若是,步骤2,将与故障存储节点相邻的partnernode作为所述故障节点LUN ownernode。通过有节点发生故障时,将相邻的partnernode作为所述故障节点LUN ownernode,以确保LUN的缓存数据可以正常下刷到后端磁盘,故障节点重新上线后,根据记录的信息,将LUN重新交换上线节点后,将原故障节点的LUN ownernode重新设为新上线接点,无需将所有的LUN进行重新分配,保证了整个存储系统的效率。

Description

一种多节点存储系统以及LUN ownernode切换方法
技术领域
本发明涉及多节点存储技术领域,特别是涉及一种多节点存储系统以及LUNownernode切换方法。
背景技术
现有双节点存储系统中,节点失效或者节点重新上线都会引起LUNownernode的切换。在双节点系统中,节点失效则LUNownernode均切换为当前在线节点;失效节点重新上线时,则会根据均衡策略重新选择ownernode。
多节点存储系统中,正常情况下各节点会缓存以自己为ownernode和partnernode的LUN的数据。当其中一个节点出现故障时(假设Node1发生故障),此时Node0上LUN0数据和Node2上LUN1数据只有一份。为了确保数据安全,Node0上LUN0数据和Node2上LUN1数据需要下刷。在现有策略中需要由ownernode做下刷动作,因此LUN0的缓存数据可以直接由Node0进行下刷;LUN1此时ownernode处于故障状态,当故障节点(Node1)重新上线时,由于所有LUN均处于ownernode在线的情况,如果将所有的LUN重新分配ownernode,效率将会很低。
发明内容
本发明的目的是提供了一种多节点存储系统LUN ownernode切换方法,在故障节点重新上线后无需重新将所有的LUN进行分配,提高了存储系统的效率。
为解决上述技术问题,本发明实施例提供了一种多节点存储系统LUN ownernode切换方法,包括:
步骤1,判断存储系统中的存储节点是否发生故障;
若是,步骤2,将与故障存储节点相邻的partnernode作为所述故障节点LUNownernode;
步骤3,判断所述故障节点是否重新上线;
若是,步骤4,将重新上线的所述故障节点的LUN ownernode由所述partnernode修改为原所述故障节点所在的LUN ownernode,将原所述故障节点的prepartnernode和原所述故障节点的partnernode中与原所述故障节点对应的缓存数据进行下刷。
其中,步骤3还包括:
将所述故障节点重新上线的信息进行记录、存储和输出。
其中,所述步骤2,还包括:
将所述故障节点的名称、发生故障时间进行记录、存储和输出。
其中,在所述步骤4之后,还包括:
步骤5,将所述存储节点的下刷数据的时间和下刷目的存储节点进行记录。
其中,在所述步骤5之后,还包括:
统计并输出在预定时间段内的故障节点的位置和数量信息。
除此之外,本发明实施例还提供了一种多节点存储系统,包括多个顺序连接的存储节点和LUN切换模块,所述存储节点存储本存储节点的缓存数据和上一个相邻所述存储节点的缓存数据,所述LUN切换模块用于在所述存储节点发生故障成为故障节点,将与所述故障节点相邻的所述存储节点作为所述故障节点LUN ownernode,在所述故障节点重新上线后,将重新上线的所述故障节点的LUN ownernode由所述partnernode修改为原所述故障节点所在的LUN ownernode,将原所述故障节点的prepartnernode和原所述故障节点的partnernode中与原所述故障节点对应的缓存数据进行下刷。
其中,还包括与所述LUN切换模块连接的日志模块,用于记录所述故障模块发生故障的时间和重新上线的时间以及所述存储节点的数据下刷信息。
其中,还包括与所述日志模块连接的统计模块,用于统计在预定时间段内发生故障节点的位置和数量信息。
本发明实施例所提供的多节点存储系统以及LUN ownernode切换方法,与现有技术相比,具有以下优点:
本发明实施例提供的多节点存储系统LUN ownernode切换方法,包括:
步骤1,判断存储系统中的存储节点是否发生故障;
若是,步骤2,将与故障存储节点相邻的partnernode作为所述故障节点LUNownernode;
步骤3,判断所述故障节点是否重新上线;
若是,步骤4,将重新上线的所述故障节点的LUN ownernode由所述partnernode修改为原所述故障节点所在的LUN ownernode,将原所述故障节点的prepartnernode和原所述故障节点的partnernode中与原所述故障节点对应的缓存数据进行下刷。
本发明实施例提供的多节点存储系统,包括多个顺序连接的存储节点和LUN切换模块,所述存储节点存储本存储节点的缓存数据和上一个相邻所述存储节点的缓存数据,所述LUN切换模块用于在所述存储节点发生故障成为故障节点,将与所述故障节点相邻的所述存储节点作为所述故障节点LUN ownernode,在所述故障节点重新上线后,将重新上线的所述故障节点的LUN ownernode由所述partnernode修改为原所述故障节点所在的LUNownernode,将原所述故障节点的prepartnernode和原所述故障节点的partnernode中与原所述故障节点对应的缓存数据进行下刷。
所述多节点存储系统以及LUN ownernode切换方法,通过有节点发生故障时,将相邻的partnernode作为所述故障节点LUN ownernode,以确保LUN的缓存数据可以正常下刷到后端磁盘,故障节点重新上线后,根据记录的信息,将LUN重新交换上线节点后,将原故障节点的LUN ownernode重新设为新上线接点,无需将所有的LUN进行重新分配,保证了整个存储系统的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的多节点存储系统LUN ownernode切换方法的一种具体实施方式的步骤流程示意图;
图2为本发明实施例提供的多节点存储系统LUN ownernode切换方法的另一种具体实施方式的步骤流程示意图;
图3为本发明实施例多节点存储系统的一种具体实施方式的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1~图3,图1为本发明实施例提供的多节点存储系统LUN ownernode切换方法的一种具体实施方式的步骤流程示意图;图2为本发明实施例提供的多节点存储系统LUN ownernode切换方法的另一种具体实施方式的步骤流程示意图;图3为本发明实施例多节点存储系统的一种具体实施方式的结构示意图。
在一种具体实施方式中,所述多节点存储系统LUN ownernode切换方法,包括:
步骤1,判断存储系统中的存储节点是否发生故障;
若是,步骤2,将与故障存储节点相邻的partnernode作为所述故障节点LUNownernode;
步骤3,判断所述故障节点是否重新上线;
若是,步骤4,将重新上线的所述故障节点的LUN ownernode由所述partnernode修改为原所述故障节点所在的LUN ownernode,将原所述故障节点的prepartnernode和原所述故障节点的partnernode中与原所述故障节点对应的缓存数据进行下刷。
通过有节点发生故障时,将相邻的partnernode作为所述故障节点LUNownernode,以确保LUN的缓存数据可以正常下刷到后端磁盘,故障节点重新上线后,根据记录的信息,将LUN重新交换上线节点后,将原故障节点的LUN ownernode重新设为新上线接点,无需将所有的LUN进行重新分配,保证了整个存储系统的效率。
为了进一步方便对多节点存储系统进行管理,步骤3还包括:
将所述故障节点重新上线的信息进行记录、存储和输出。
通过对故障节点重新上线的信息进行记录,实时反映当前的存储系统的状态,方便进行管理。
而由于在多节点存储系统的工作过程中,可能有节点会发生工作故障,为了方便快速维护,在本发明的一个实施例中,所述步骤2,还包括:
将所述故障节点的名称、发生故障时间进行记录、存储和输出。
由于在故障节点恢复之后重新上下之后,是没有数据存储的,需要相邻的存储节点进行数据下刷之后才能够正常使用,为了保证存储系统的使用可靠性,在所述步骤4之后,还包括:
步骤5,将所述存储节点的下刷数据的时间和下刷目的存储节点进行记录。
通过记录数据下刷的时间,避免了在存储节点刚上线,但是还没有被下刷数据的情况下被操作的可能性,使得整个多节点存储系统有序运行。
为了方便维护人员对存储系统的维护,在本发明一个实施例中,在所述步骤5之后,还包括:
统计并输出在预定时间段内的故障节点的位置和数量信息。
通过统计和输出在预定时间段内的故障节点的位置和数量信息,即方便进行维护,也使得在进行相应的存储操作时,通过该方式计算不同的存储节点的工作可靠性,实现不同的功能。
除此之外,本发明实施例还提供了一种多节点存储系统,包括多个顺序连接的存储节点和LUN切换模块10,所述存储节点存储本存储节点的缓存数据和上一个相邻所述存储节点的缓存数据,所述LUN切换模块用于在所述存储节点发生故障成为故障节点,将与所述故障节点相邻的所述存储节点作为所述故障节点LUN ownernode,在所述故障节点重新上线后,将重新上线的所述故障节点的LUN ownernode由所述partnernode修改为原所述故障节点所在的LUN ownernode,将原所述故障节点的prepartnernode和原所述故障节点的partnernode中与原所述故障节点对应的缓存数据进行下刷。
在本发明的一个实施例中,具有多个存储节点,Node0~Node3,节点(Node1)出现故障时,故障节点的LUN ownernode需要切换为故障节点的partnernode,以保障LUN1缓存数据可以正常下刷,同时集群保存LUN1原ownernode信息,Node0 20下刷LUN0数据,Node240下刷LUN1数据;Node1 30重新上线后,需要根据集群中LUN1原ownernode信息将LUN1 30的ownernode修改为Node1 30,保证了整个存储系统的效率。节点重新上线时,先由Node2 40将LUN1数据进行下刷,然后将LUN1ownernode修改为Node1 30。
为了方便后续对故障节点进行维护管理,提高存储系统的工作可靠性,在本发明一个实施例中,所述多节点存储系统还包括与所述LUN切换模块连接的日志模块,用于记录所述故障模块发生故障的时间和重新上线的时间以及所述存储节点的数据下刷信息。
为了方便维护人员对存储系统的维护和管理,提高存储系统的应用可靠性,所述多节点存储系统还包括与所述日志模块连接的统计模块,用于统计在预定时间段内发生故障节点的位置和数量信息。通过统计和输出在预定时间段内的故障节点的位置和数量信息,即方便进行维护,也使得在进行相应的存储操作时,通过该方式计算不同的存储节点的工作可靠性,实现不同的功能。
综上所述,本发明实施例提供的多节点存储系统以及LUN ownernode切换方法,通过有节点发生故障时,将相邻的partnernode作为所述故障节点LUN ownernode,以确保LUN的缓存数据可以正常下刷到后端磁盘,故障节点重新上线后,根据记录的信息,将LUN重新交换上线节点后,将原故障节点的LUN ownernode重新设为新上线接点,无需将所有的LUN进行重新分配,保证了整个存储系统的效率。
以上对本发明所提供的多节点存储系统以及LUN ownernode切换方法进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (8)

1.一种多节点存储系统LUN ownernode切换方法,其特征在于,包括:
步骤1,判断存储系统中的存储节点是否发生故障;
若是,步骤2,将与故障存储节点相邻的partnernode作为所述故障节点LUNownernode;
步骤3,判断所述故障节点是否重新上线;
若是,步骤4,将重新上线的所述故障节点的LUN ownernode由所述partnernode修改为原所述故障节点所在的LUN ownernode,将原所述故障节点的prepartnernode和原所述故障节点的partnernode中与原所述故障节点对应的缓存数据进行下刷。
2.如权利要求1所述多节点存储系统LUN ownernode切换方法,其特征在于,步骤3还包括:
将所述故障节点重新上线的信息进行记录、存储和输出。
3.如权利要求2所述多节点存储系统LUN ownernode切换方法,其特征在于,所述步骤2,还包括:
将所述故障节点的名称、发生故障时间进行记录、存储和输出。
4.如权利要求3所述多节点存储系统LUN ownernode切换方法,其特征在于,在所述步骤4之后,还包括:
步骤5,将所述存储节点的下刷数据的时间和下刷目的存储节点进行记录。
5.如权利要求4所述多节点存储系统LUN ownernode切换方法,其特征在于,在所述步骤5之后,还包括:
统计并输出在预定时间段内的故障节点的位置和数量信息。
6.一种多节点存储系统,其特征在于,包括多个顺序连接的存储节点和LUN切换模块,所述存储节点存储本存储节点的缓存数据和上一个相邻所述存储节点的缓存数据,所述LUN切换模块用于在所述存储节点发生故障成为故障节点,将与所述故障节点相邻的所述存储节点作为所述故障节点LUN ownernode,在所述故障节点重新上线后,将重新上线的所述故障节点的LUN ownernode由所述partnernode修改为原所述故障节点所在的LUNownernode,将原所述故障节点的prepartnernode和原所述故障节点的partnernode中与原所述故障节点对应的缓存数据进行下刷。
7.如权利要求6所述多节点存储系统,其特征在于,还包括与所述LUN切换模块连接的日志模块,用于记录所述故障模块发生故障的时间和重新上线的时间以及所述存储节点的数据下刷信息。
8.如权利要求7所述多节点存储系统,其特征在于,还包括与所述日志模块连接的统计模块,用于统计在预定时间段内发生故障节点的位置和数量信息。
CN201710522567.9A 2017-06-30 2017-06-30 一种多节点存储系统以及LUN ownernode切换方法 Pending CN107171865A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710522567.9A CN107171865A (zh) 2017-06-30 2017-06-30 一种多节点存储系统以及LUN ownernode切换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710522567.9A CN107171865A (zh) 2017-06-30 2017-06-30 一种多节点存储系统以及LUN ownernode切换方法

Publications (1)

Publication Number Publication Date
CN107171865A true CN107171865A (zh) 2017-09-15

Family

ID=59827358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710522567.9A Pending CN107171865A (zh) 2017-06-30 2017-06-30 一种多节点存储系统以及LUN ownernode切换方法

Country Status (1)

Country Link
CN (1) CN107171865A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109445996A (zh) * 2018-11-09 2019-03-08 郑州云海信息技术有限公司 一种分配io流的方法、系统及相关组件

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080147942A1 (en) * 2004-12-20 2008-06-19 Emc Corporation Method to Perform Parallel Data Migration in a Clustered Storage Environment
CN102158540A (zh) * 2011-02-18 2011-08-17 广州从兴电子开发有限公司 分布式数据库实现系统及方法
CN105260259A (zh) * 2015-09-16 2016-01-20 长安大学 一种基于系统最小存储再生码的局部性修复编码方法
CN105635310A (zh) * 2016-01-20 2016-06-01 杭州宏杉科技有限公司 一种存储资源的访问方法及装置
CN106331166A (zh) * 2016-10-11 2017-01-11 杭州宏杉科技有限公司 一种存储资源的访问方法及装置
WO2017039625A1 (en) * 2015-08-31 2017-03-09 Hewlett Packard Enterprise Development Lp Storage area network management

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080147942A1 (en) * 2004-12-20 2008-06-19 Emc Corporation Method to Perform Parallel Data Migration in a Clustered Storage Environment
CN102158540A (zh) * 2011-02-18 2011-08-17 广州从兴电子开发有限公司 分布式数据库实现系统及方法
WO2017039625A1 (en) * 2015-08-31 2017-03-09 Hewlett Packard Enterprise Development Lp Storage area network management
CN105260259A (zh) * 2015-09-16 2016-01-20 长安大学 一种基于系统最小存储再生码的局部性修复编码方法
CN105635310A (zh) * 2016-01-20 2016-06-01 杭州宏杉科技有限公司 一种存储资源的访问方法及装置
CN106331166A (zh) * 2016-10-11 2017-01-11 杭州宏杉科技有限公司 一种存储资源的访问方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109445996A (zh) * 2018-11-09 2019-03-08 郑州云海信息技术有限公司 一种分配io流的方法、系统及相关组件
CN109445996B (zh) * 2018-11-09 2022-02-18 郑州云海信息技术有限公司 一种分配io流的方法、系统及相关组件

Similar Documents

Publication Publication Date Title
WO2014054075A1 (en) System management method, and computer system
CN105187249B (zh) 一种故障恢复方法及装置
CN105681074B (zh) 一种增强双机集群可靠、可用性的方法及装置
CN104362757B (zh) 一种基于iec61850的变电站在线监测系统
CN102355368B (zh) 一种网络设备的故障处理方法及系统
CN101404568A (zh) 双网卡热备冗余方法
CN105224888A (zh) 一种基于安全预警技术的磁盘阵列数据保护系统
CN102209957A (zh) 包括raid组的存储系统
CN106569751A (zh) 一种多控制器缓存镜像方法及系统
CN106888116A (zh) 一种双控制器集群共享资源的调度方法
CN108011699A (zh) 反应堆计算机监控系统网络构架方法
CN101938523A (zh) 一种iSCSI与FCP协议融合方法及其在容灾中的应用
CN107918570A (zh) 一种双活系统共享仲裁盘的方法
CN104182306A (zh) 一种低成本的云主机智能故障瞬时切换方法
CN107465562A (zh) 一种ctdb自定义分配虚拟ip的方法、装置、设备
CN110535940A (zh) 一种bmc的连接管理方法、系统、设备及存储介质
CN107748946A (zh) 电力光传输设备状态检测评价系统
CN109933478A (zh) 一种存储系统的故障处理方法和存储系统
CN107168830A (zh) 一种基于虚拟化平台的容灾系统、方法
CN107171865A (zh) 一种多节点存储系统以及LUN ownernode切换方法
CN109726151A (zh) 用于管理输入输出栈的方法、设备和计算机程序产品
CN104639358B (zh) 批量网络端口切换方法及切换系统
CN102484603A (zh) 自动冗余逻辑连接
CN105119765B (zh) 一种智能处理故障体系架构
CN107271804A (zh) 电力系统的故障录波方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170915