CN107819619A - 一种实现网络文件系统的访问不间断的方法 - Google Patents

一种实现网络文件系统的访问不间断的方法 Download PDF

Info

Publication number
CN107819619A
CN107819619A CN201711064499.2A CN201711064499A CN107819619A CN 107819619 A CN107819619 A CN 107819619A CN 201711064499 A CN201711064499 A CN 201711064499A CN 107819619 A CN107819619 A CN 107819619A
Authority
CN
China
Prior art keywords
nfs
pacemaker
softwares
server
backup server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711064499.2A
Other languages
English (en)
Inventor
王冬冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201711064499.2A priority Critical patent/CN107819619A/zh
Publication of CN107819619A publication Critical patent/CN107819619A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/50Address allocation
    • H04L61/5007Internet protocol [IP] addresses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • H04L63/101Access control lists [ACL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种实现网络文件系统的访问不间断的方法,应用了集群和故障转移的概念,由网络文件系统中服务端的文件系统的故障转移功能和Pacemaker软件共同作用。实现网络文件系统的故障转移,并且能避免传统单机版的网络文件系统因网络问题或者机器自身问题而导致服务中断,通过此方法并将此故障的网络文件系统所有的空间转移到其他机器上,此过程通过pacemaker实现管理,并可安全高效的实现的故障转移,并保证数据的不丢失。本发明实现网络文件系统能在现有的成本上,实现高可用,减少因网络文件系统故障引起的数据灾难。

Description

一种实现网络文件系统的访问不间断的方法
技术领域
本发明涉及网络文件系统领域,具体涉及一种实现网络文件系统的访问不间断的方法。
背景技术
网络文件系统容量增大,相应访问主机数量增多,无可避免的会造成很大的网络开销以及服务器开销,开销的增加导致了网络的压力以及IO节点的压力的成倍增加,相应网络文件系统服务出故障的几率会增加,并且如果有部分数据正好是用户要读取的内容,则可能会导致客户无法读取源数据,进而无法进行相关数据的提取,导致同步中断。
发明内容
为解决上述问题,本发明提供一种实现网络文件系统的访问不间断的方法。
本发明的技术方案为:一种实现网络文件系统的访问不间断的方法,包括以下步骤:
将存储映射给激活服务器和备份服务器;激活服务器和备份服务器上均配置Linux系统和挂载网络文件系统;
将存储格式化为XFS文件系统,格式化后增加网络文件系统共享目录及权限;
在激活服务器和备份服务器上均安装Pacemaker软件和Corosync软件;
将网络文件系统加入到Pacemaker高可用集群,并设置心跳IP地址;
将激活服务器和备份服务器的资源加入到各自的Pacemaker软件中;
将网络文件系统的启动与暂停加入到Pacemaker软件中;
启动Pacemaker软件和Corosync软件;
对网络文件系统进行故障转移测试,模拟失败节点;节点指激活服务器和备份服务器;
查看激活服务器和备份服务器是否发生资源切换;查看客户端是否发生IO暂停或存储异常挂载;
修复失败节点,进行激活服务器和备份服务器资源切换。
进一步地,所述格式化后增加网络文件系统共享目录及权限通过修改Linux的/etc/exports文件实现。
进一步地,将激活服务器和备份服务器的资源加入到各自的Pacemaker软件中,通过在Pacemaker软件的命令行中添加网络文件系统资源实现。
本发明提供的实现网络文件系统的访问不间断的方法,能实现网络文件系统的故障转移,并且能避免传统单机版的网络文件系统因网络问题或者机器自身问题而导致服务中断,通过此方法并将此故障的网络文件系统所有的空间转移到其他机器上,此过程通过pacemaker实现管理,并可安全高效的实现的故障转移,并保证数据的不丢失。本发明实现网络文件系统能在现有的成本上,实现高可用,减少因网络文件系统故障引起的数据灾难。
附图说明
图1是本发明具体实施例结构示意图。
具体实施方式
下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
本发明应用了集群和故障转移的概念,由网络文件系统中服务端的文件系统的故障转移功能和Pacemaker软件共同作用。网络文件系统文件系统的故障转移模块提供的服务端具有Activer/Standby的模式,正常情况下是Active的服务器提供一切服务,Standby的服务器处理待机状态。当Active服务器宕机后,Standby的服务器自动接管所有服务,使整个文件系统提供的服务不中断。而Pacemaker软件的功能则是进行节点的实效检测。
本方法基于如图1所示的结构实现,包括存储端3、服务端2和客户端1。服务端2分别与存储端3、客户端1连接。服务端2包括激活服务器和备份服务器,客户端可以是小型机、集群和多媒体设备等。
本发明的方法具体包括以下步骤:
S1:将存储映射给激活服务器和备份服务器;激活服务器和备份服务器上均配置Linux系统和挂载网络文件系统;
需要说明的是,激活服务器和备份服务器为两个IO节点,存储映射应保证两个IO节点都能看得到映射的存储。
S2:将存储格式化为XFS文件系统,格式化后增加网络文件系统共享目录及权限;
需要说明的是,通过修改Linux系统的/etc/exports文件增加网络文件系统共享目录及权限。
S3:在激活服务器和备份服务器上均安装Pacemaker软件和Corosync软件。
S4:将网络文件系统加入到Pacemaker高可用集群,并设置心跳IP地址。
S5:将激活服务器和备份服务器的资源加入到各自的Pacemaker软件中;
需要说明的是,通过在Pacemaker软件的命令行中增加网络文件系统资源实现该步骤。
S6:将网络文件系统的启动与暂停加入到Pacemaker软件中;
需要说明的是,该步骤使网络文件系统服务的启停与资源结合。
S7:启动Pacemaker软件和Corosync软件。
S8:对网络文件系统进行故障转移测试,模拟失败节点;节点指激活服务器和备份服务器。
S9:查看激活服务器和备份服务器是否发生资源切换;查看客户端是否发生IO暂停或存储异常挂载。
S10:修复失败节点,进行激活服务器和备份服务器资源切换。
本发明实现网络文件系统的故障转移,并且能避免传统单机版的网络文件系统因网络问题或者机器自身问题而导致服务中断,通过此方法并将此故障的网络文件系统所有的空间转移到其他机器上,此过程通过pacemaker实现管理,并可安全高效的实现的故障转移,并保证数据的不丢失。实现网络文件系统能在现有的成本上,实现高可用,减少因网络文件系统故障引起的数据灾难。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。

Claims (3)

1.一种实现网络文件系统的访问不间断的方法,其特征在于,包括以下步骤:
将存储映射给激活服务器和备份服务器;激活服务器和备份服务器上均配置Linux系统和挂载网络文件系统;
将存储格式化为XFS文件系统,格式化后增加网络文件系统共享目录及权限;
在激活服务器和备份服务器上均安装Pacemaker软件和Corosync软件;
将网络文件系统加入到Pacemaker高可用集群,并设置心跳IP地址;
将激活服务器和备份服务器的资源加入到各自的Pacemaker软件中;
将网络文件系统的启动与暂停加入到Pacemaker软件中;
启动Pacemaker软件和Corosync软件;
对网络文件系统进行故障转移测试,模拟失败节点;节点指激活服务器和备份服务器;
查看激活服务器和备份服务器是否发生资源切换;查看客户端是否发生IO暂停或存储异常挂载;
修复失败节点,进行激活服务器和备份服务器资源切换。
2.根据权利要求1所述的实现网络文件系统的访问不间断的方法,其特征在于,所述格式化后增加网络文件系统共享目录及权限通过修改Linux的/etc/exports文件实现。
3.根据权利要求1或2所述的实现网络文件系统的访问不间断的方法,其特征在于,将激活服务器和备份服务器的资源加入到各自的Pacemaker软件中,通过在Pacemaker软件的命令行中添加网络文件系统资源实现。
CN201711064499.2A 2017-11-02 2017-11-02 一种实现网络文件系统的访问不间断的方法 Pending CN107819619A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711064499.2A CN107819619A (zh) 2017-11-02 2017-11-02 一种实现网络文件系统的访问不间断的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711064499.2A CN107819619A (zh) 2017-11-02 2017-11-02 一种实现网络文件系统的访问不间断的方法

Publications (1)

Publication Number Publication Date
CN107819619A true CN107819619A (zh) 2018-03-20

Family

ID=61603975

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711064499.2A Pending CN107819619A (zh) 2017-11-02 2017-11-02 一种实现网络文件系统的访问不间断的方法

Country Status (1)

Country Link
CN (1) CN107819619A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126940A (zh) * 2019-11-22 2020-05-08 泰康保险集团股份有限公司 业务申请的处理方法、装置、设备及计算机可读存储介质
CN111756578A (zh) * 2020-06-24 2020-10-09 苏州浪潮智能科技有限公司 一种用户态网络文件系统的故障恢复方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103713974A (zh) * 2014-01-07 2014-04-09 浪潮(北京)电子信息产业有限公司 一种高性能作业调度管理节点双机加固方法及设备
CN104023061A (zh) * 2014-06-10 2014-09-03 浪潮电子信息产业股份有限公司 一种lustre的oss高可用集群方案
US20160283335A1 (en) * 2015-03-24 2016-09-29 Xinyu Xingbang Information Industry Co., Ltd. Method and system for achieving a high availability and high performance database cluster

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103713974A (zh) * 2014-01-07 2014-04-09 浪潮(北京)电子信息产业有限公司 一种高性能作业调度管理节点双机加固方法及设备
CN104023061A (zh) * 2014-06-10 2014-09-03 浪潮电子信息产业股份有限公司 一种lustre的oss高可用集群方案
US20160283335A1 (en) * 2015-03-24 2016-09-29 Xinyu Xingbang Information Industry Co., Ltd. Method and system for achieving a high availability and high performance database cluster

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126940A (zh) * 2019-11-22 2020-05-08 泰康保险集团股份有限公司 业务申请的处理方法、装置、设备及计算机可读存储介质
CN111756578A (zh) * 2020-06-24 2020-10-09 苏州浪潮智能科技有限公司 一种用户态网络文件系统的故障恢复方法和装置
CN111756578B (zh) * 2020-06-24 2022-05-13 苏州浪潮智能科技有限公司 一种用户态网络文件系统的故障恢复方法和装置

Similar Documents

Publication Publication Date Title
US11422908B2 (en) Non-disruptive controller replacement in a cross-cluster redundancy configuration
US11163653B2 (en) Storage cluster failure detection
CN107391294B (zh) 一种ipsan容灾系统的建立方法及装置
CN103226502B (zh) 一种数据灾备控制系统及数据恢复方法
US7962915B2 (en) System and method for preserving state for a cluster of data servers in the presence of load-balancing, failover, and fail-back events
US8949828B2 (en) Single point, scalable data synchronization for management of a virtual input/output server cluster
US8595546B2 (en) Split brain resistant failover in high availability clusters
US20140244578A1 (en) Highly available main memory database system, operating method and uses thereof
CN105262820A (zh) 一种基于Linux操作系统的集群多机互备的方法
CN111949444A (zh) 一种基于分布式服务集群的数据备份与恢复系统及方法
CN111130835A (zh) 数据中心双活系统、切换方法、装置、设备及介质
CN105302661A (zh) 一种实现虚拟化管理平台高可用的系统和方法
CN113783765B (zh) 一种实现云内网和云外网互通的方法、系统、设备和介质
CN102523118A (zh) 一种局域网内多套控制计算机构成的冗余控制系统与方法
US20190268237A1 (en) Computer system and method for dynamically adapting a software-defined network
CN104023246A (zh) 一种视频数据私有云存储系统和视频数据私有云存储方法
CN106325768B (zh) 一种双机存储系统及方法
CN105389231A (zh) 一种数据库双机备份方法及系统
CN107357800A (zh) 一种数据库高可用零丢失解决方法
CN107819619A (zh) 一种实现网络文件系统的访问不间断的方法
JP5798056B2 (ja) 呼処理情報の冗長化制御システムおよびこれに利用する予備保守サーバ
CN114301763A (zh) 分布式集群故障的处理方法及系统、电子设备及存储介质
CN107483257A (zh) 一种基于x86和arm混合环境的应用系统部署方法及架构
CN112202601B (zh) 副本集模式运行的两物理节点mongo集群的应用方法
CN107590032A (zh) 存储集群故障转移的方法及存储集群系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180320