CN106254490A - 一种分布式存储故障转移方法以及分布式存储系统 - Google Patents

一种分布式存储故障转移方法以及分布式存储系统 Download PDF

Info

Publication number
CN106254490A
CN106254490A CN201610674968.1A CN201610674968A CN106254490A CN 106254490 A CN106254490 A CN 106254490A CN 201610674968 A CN201610674968 A CN 201610674968A CN 106254490 A CN106254490 A CN 106254490A
Authority
CN
China
Prior art keywords
distributed
handle
application program
cluster
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610674968.1A
Other languages
English (en)
Inventor
臧琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201610674968.1A priority Critical patent/CN106254490A/zh
Publication of CN106254490A publication Critical patent/CN106254490A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/566Grouping or aggregating service requests, e.g. for unified processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种分布式存储故障转移方法,当应用程序在业务操作时,分布式存储客户端实时检测所连接的分布式文件存储集群的状态;当检测到分布式文件存储集群出现故障后,暂停业务操作;重新连接分布式文件存储集群,连接成功后,重新打开正在操作的文件,并将新的文件句柄映射到故障之前反馈给应用程序的句柄上。本申请分布式存储客户端会随时检测所连接的集群状态,一旦出现了集群的故障后,会暂停业务操作,然后重新连接集群,连接成功后,重新打开正在操作的文件,并把新的文件句柄映射到之前反馈给应用程序的句柄上,保证应用程序在无感知的情况下进行集群故障的转移。此外,本发明还提供了一种具有上述技术优点的分布式存储系统。

Description

一种分布式存储故障转移方法以及分布式存储系统
技术领域
本发明涉及分布式存储技术领域,特别是涉及一种分布式存储故障转移方法及分布式存储系统。
背景技术
在使用分布式存储服务时,一般使用多个服务器节点组成一个集群,统一向用户提供数据存储服务。当集群中的某个节点出现故障时,集群会重新选择一个在线的完好的节点继续向用户提供服务。
虽然集群中的多个服务节点间是一种热备的关系,而且在发生故障时,集群可以检测到并作出重新选择新的节点继续提供服务,但是对于正在使用该集群提供的数据存储服务的客户端来说,会出现服务停止响应、业务异常中断等现象,造成客户正在读写的数据出现异常,严重的情况下,比较复杂的连续的业务需要重新开始,给用户造成非常大的损失。
发明内容
本发明的目的是提供一种分布式存储故障转移方法及分布式存储系统,以解决业务过程中因服务节点宕机造成服务停止响应或业务中断的问题。
为解决上述技术问题,本发明提供一种分布式存储故障转移方法,包括:
当应用程序在业务操作时,分布式存储客户端实时检测所连接的分布式文件存储集群的状态;
当检测到所述分布式文件存储集群出现故障后,暂停业务操作;
重新连接所述分布式文件存储集群,连接成功后,重新打开正在操作的文件,并将新的文件句柄映射到故障之前反馈给应用程序的句柄上。
可选地,在当应用程序在业务操作时,分布式存储客户端实时检测所连接的分布式文件存储集群的状态之前还包括:
在操作分布式存储的文件时,所述分布式存储客户端连接所述分布式文件存储集群,并保持连接句柄;
所述分布式存储客户端打开文件后,持有文件句柄,并将映射的新的句柄反馈至应用程序。
可选地,所述分布式存储客户端存储有socket连接句柄;分别包括真实文件句柄和应用程序句柄。
本发明还提供了一种分布式存储系统,包括:
分布式存储客户端以及分布式文件存储集群;
其中,所述分布式存储客户端用于当应用程序在业务操作时,实时检测所连接的所述分布式文件存储集群的状态;当检测到所述分布式文件存储集群出现故障后,暂停业务操作;重新连接所述分布式文件存储集群,连接成功后,重新打开正在操作的文件,并将新的文件句柄映射到故障之前反馈给应用程序的句柄上。
可选地,所述分布式存储客户端还用于:
在操作分布式存储的文件时,连接所述分布式文件存储集群,并保持连接句柄;打开文件后,持有文件句柄,并将映射的新的句柄反馈至应用程序。
可选地,所述分布式存储客户端放在操作系统的内核,用户开发的应用程序采用文件操作接口。
可选地,所述分布式存储客户端存储有socket连接句柄;分别包括真实文件句柄和应用程序句柄。
本发明所提供的分布式存储故障转移方法,当应用程序在业务操作时,分布式存储客户端实时检测所连接的分布式文件存储集群的状态;当检测到分布式文件存储集群出现故障后,暂停业务操作;重新连接分布式文件存储集群,连接成功后,重新打开正在操作的文件,并将新的文件句柄映射到故障之前反馈给应用程序的句柄上。本申请应用程序在连续的业务操作期间,分布式存储客户端会随时检测所连接的集群状态,一旦出现了集群的故障后,会暂停业务操作,然后重新连接集群,连接成功后,重新打开正在操作的文件,并把新的文件句柄映射到之前反馈给应用程序的句柄上,保证应用程序在无感知的情况下进行集群故障的转移。此外,本发明还提供了一种具有上述技术优点的分布式存储系统。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的分布式存储故障转移方法的一种具体实施方式的流程图;
图2为本发明实施例提供的分布式存储系统的一种具体实施方式的结构框图;
图3为本发明所提供的分布式存储系统的一种具体实施方式的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所提供的分布式存储故障转移方法的一种具体实施方式的流程图如图1所示,该方法包括:
步骤S101:当应用程序在业务操作时,分布式存储客户端实时检测所连接的分布式文件存储集群的状态;
步骤S102:当检测到所述分布式文件存储集群出现故障后,暂停业务操作;
步骤S103:重新连接所述分布式文件存储集群,连接成功后,重新打开正在操作的文件,并将新的文件句柄映射到故障之前反馈给应用程序的句柄上。
本发明所提供的分布式存储故障转移方法,当应用程序在业务操作时,分布式存储客户端实时检测所连接的分布式文件存储集群的状态;当检测到分布式文件存储集群出现故障后,暂停业务操作;重新连接分布式文件存储集群,连接成功后,重新打开正在操作的文件,并将新的文件句柄映射到故障之前反馈给应用程序的句柄上。本申请应用程序在连续的业务操作期间,分布式存储客户端会随时检测所连接的集群状态,一旦出现了集群的故障后,会暂停业务操作,然后重新连接集群,连接成功后,重新打开正在操作的文件,并把新的文件句柄映射到之前反馈给应用程序的句柄上,保证应用程序在无感知的情况下进行集群故障的转移。
在上述实施例的基础上,本发明所提供的分布式存储故障转移方法中,在当应用程序在业务操作时,分布式存储客户端实时检测所连接的分布式文件存储集群的状态之前还可以包括:
在操作分布式存储的文件时,所述分布式存储客户端连接所述分布式文件存储集群,并保持连接句柄;
所述分布式存储客户端打开文件后,持有文件句柄,并将映射的新的句柄反馈至应用程序。
其中,分布式存储客户端存储有socket连接句柄;分别包括真实文件句柄和应用程序句柄。
本发明所提供的分布式存储故障转移方法,分布式存储客户端集成在操作系统内核,对应用开发没有影响;且应用程序持有的不是真实文件句柄,故障恢复后重新映射不影响继续使用;另外本申请能够保证连续的业务不中断,减小了业务中断造成严重的影响。
下面对本发明实施例提供的分布式存储系统进行介绍,下文描述的分布式存储系统与上文描述的分布式存储故障转移方法可相互对应参照。
图2为本发明实施例提供的分布式存储系统的一种具体实施方式的结构框图,参照图2分布式存储系统可以包括:
分布式存储客户端1以及分布式文件存储集群2;
其中,所述分布式存储客户端1用于当应用程序在业务操作时,实时检测所连接的所述分布式文件存储集群的状态;当检测到所述分布式文件存储集群2出现故障后,暂停业务操作;重新连接所述分布式文件存储集群,连接成功后,重新打开正在操作的文件,并将新的文件句柄映射到故障之前反馈给应用程序的句柄上。
在上述实施例的基础上,本发明所提供的分布式存储系统中,分布式存储客户端还用于:
在操作分布式存储的文件时,连接所述分布式文件存储集群,并保持连接句柄;打开文件后,持有文件句柄,并将映射的新的句柄反馈至应用程序。
可选地,所述分布式存储客户端放在操作系统的内核,用户开发的应用程序采用文件操作接口。
作为一种具体实施方式,所述分布式存储客户端存储有socket连接句柄;分别包括真实文件句柄和应用程序句柄。
如图3本发明所提供的分布式存储系统的一种具体实施方式的示意图所示,应用程序在连续的业务操作期间,分布式存储客户端会随时检测所连接的集群状态,一旦出现了集群的故障后,会暂停业务操作,然后重新连接集群,连接成功后,重新打开正在操作的文件,并把新的文件句柄映射到之前反馈给应用程序的句柄上,保证应用程序在无感知的情况下进行集群故障的转移。
本发明所提供的分布式存储系统,分布式存储客户端集成在操作系统内核,对应用开发没有影响;且应用程序持有的不是真实文件句柄,故障恢复后重新映射不影响继续使用;另外本申请能够保证连续的业务不中断,减小了业务中断造成严重的影响。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的分布式存储故障转移方法及分布式存储系统进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (7)

1.一种分布式存储故障转移方法,其特征在于,包括:
当应用程序在业务操作时,分布式存储客户端实时检测所连接的分布式文件存储集群的状态;
当检测到所述分布式文件存储集群出现故障后,暂停业务操作;
重新连接所述分布式文件存储集群,连接成功后,重新打开正在操作的文件,并将新的文件句柄映射到故障之前反馈给应用程序的句柄上。
2.如权利要求1所述的分布式存储故障转移方法,其特征在于,在当应用程序在业务操作时,分布式存储客户端实时检测所连接的分布式文件存储集群的状态之前还包括:
在操作分布式存储的文件时,所述分布式存储客户端连接所述分布式文件存储集群,并保持连接句柄;
所述分布式存储客户端打开文件后,持有文件句柄,并将映射的新的句柄反馈至应用程序。
3.如权利要求1或2所述的分布式存储故障转移方法,其特征在于,所述分布式存储客户端存储有socket连接句柄;分别包括真实文件句柄和应用程序句柄。
4.一种分布式存储系统,其特征在于,包括:
分布式存储客户端以及分布式文件存储集群;
其中,所述分布式存储客户端用于当应用程序在业务操作时,实时检测所连接的所述分布式文件存储集群的状态;当检测到所述分布式文件存储集群出现故障后,暂停业务操作;重新连接所述分布式文件存储集群,连接成功后,重新打开正在操作的文件,并将新的文件句柄映射到故障之前反馈给应用程序的句柄上。
5.如权利要求4所述的分布式存储系统,其特征在于,所述分布式存储客户端还用于:
在操作分布式存储的文件时,连接所述分布式文件存储集群,并保持连接句柄;打开文件后,持有文件句柄,并将映射的新的句柄反馈至应用程序。
6.如权利要求4或5所述的分布式存储系统,其特征在于,所述分布式存储客户端放在操作系统的内核,用户开发的应用程序采用文件操作接口。
7.如权利要求6所述的分布式存储系统,其特征在于,所述分布式存储客户端存储有socket连接句柄;分别包括真实文件句柄和应用程序句柄。
CN201610674968.1A 2016-08-16 2016-08-16 一种分布式存储故障转移方法以及分布式存储系统 Pending CN106254490A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610674968.1A CN106254490A (zh) 2016-08-16 2016-08-16 一种分布式存储故障转移方法以及分布式存储系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610674968.1A CN106254490A (zh) 2016-08-16 2016-08-16 一种分布式存储故障转移方法以及分布式存储系统

Publications (1)

Publication Number Publication Date
CN106254490A true CN106254490A (zh) 2016-12-21

Family

ID=57593201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610674968.1A Pending CN106254490A (zh) 2016-08-16 2016-08-16 一种分布式存储故障转移方法以及分布式存储系统

Country Status (1)

Country Link
CN (1) CN106254490A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102624542A (zh) * 2010-12-10 2012-08-01 微软公司 在文件系统中提供透明故障切换
CN105828017A (zh) * 2015-10-20 2016-08-03 广东亿迅科技有限公司 一种面向视频会议的云存储接入系统及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102624542A (zh) * 2010-12-10 2012-08-01 微软公司 在文件系统中提供透明故障切换
CN105828017A (zh) * 2015-10-20 2016-08-03 广东亿迅科技有限公司 一种面向视频会议的云存储接入系统及方法

Similar Documents

Publication Publication Date Title
CN103262054B (zh) 用于自动提交存储器的装置、系统和方法
CN106339058B (zh) 动态管理电力供应的方法和系统
CN105589776B (zh) 一种故障定位方法及服务器
CN103077242B (zh) 一种实现数据库服务器双机热备的方法
CN104036043B (zh) 一种mysql高可用的方法及管理节点
CN104331254A (zh) 一种基于双活逻辑卷的存储双活系统设计方法
CN107911238A (zh) 一种基于ipsan服务器双机备份方法和系统
CN105337780B (zh) 一种服务器节点配置方法及物理节点
CN104317803B (zh) 数据库集群的数据存取系统和方法
CN103346903A (zh) 一种双机备份的方法和装置
CN102855163B (zh) 一种内存数据库双机热备方法及主机
CN101408855A (zh) 连续数据保护系统在远程备份设备临时异常时的保护方法
CN107153571A (zh) 一种虚拟化管理节点的部署方法及装置
CN104424275A (zh) 数据库系统以及数据同步方法
CN106155943A (zh) 一种双控存储设备的掉电保护的方法及装置
CN107463468A (zh) 缓存管理方法及其设备
CN107995318A (zh) 一种网络云盘的高可用系统
CN106383756A (zh) 一种实现存储容灾切换Linux系统业务不中断的方法
CN107656847A (zh) 基于分布式集群的节点管理方法、系统、装置及存储介质
CN102664757A (zh) 一种存储设备的级联方法及装置
CN103297264A (zh) 一种云平台故障恢复方法和系统
CN103810038A (zh) 一种ha集群中虚拟机存储文件迁移方法及其装置
CN106254490A (zh) 一种分布式存储故障转移方法以及分布式存储系统
CN103235746B (zh) 服务器一体机自动恢复方法
JP2009116474A (ja) ストレージシステムおよびストレージサブシステム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161221