CN107819619A - 一种实现网络文件系统的访问不间断的方法 - Google Patents
一种实现网络文件系统的访问不间断的方法 Download PDFInfo
- Publication number
- CN107819619A CN107819619A CN201711064499.2A CN201711064499A CN107819619A CN 107819619 A CN107819619 A CN 107819619A CN 201711064499 A CN201711064499 A CN 201711064499A CN 107819619 A CN107819619 A CN 107819619A
- Authority
- CN
- China
- Prior art keywords
- nfs
- pacemaker
- softwares
- server
- backup server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1095—Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1456—Hardware arrangements for backup
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1458—Management of the backup or restore process
- G06F11/1464—Management of the backup or restore process for networked environments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2033—Failover techniques switching over of hardware resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0668—Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
- H04L61/50—Address allocation
- H04L61/5007—Internet protocol [IP] addresses
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/10—Network architectures or network communication protocols for network security for controlling access to devices or network resources
- H04L63/101—Access control lists [ACL]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- Hardware Redundancy (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种实现网络文件系统的访问不间断的方法,应用了集群和故障转移的概念,由网络文件系统中服务端的文件系统的故障转移功能和Pacemaker软件共同作用。实现网络文件系统的故障转移,并且能避免传统单机版的网络文件系统因网络问题或者机器自身问题而导致服务中断,通过此方法并将此故障的网络文件系统所有的空间转移到其他机器上,此过程通过pacemaker实现管理,并可安全高效的实现的故障转移,并保证数据的不丢失。本发明实现网络文件系统能在现有的成本上,实现高可用,减少因网络文件系统故障引起的数据灾难。
Description
技术领域
本发明涉及网络文件系统领域,具体涉及一种实现网络文件系统的访问不间断的方法。
背景技术
网络文件系统容量增大,相应访问主机数量增多,无可避免的会造成很大的网络开销以及服务器开销,开销的增加导致了网络的压力以及IO节点的压力的成倍增加,相应网络文件系统服务出故障的几率会增加,并且如果有部分数据正好是用户要读取的内容,则可能会导致客户无法读取源数据,进而无法进行相关数据的提取,导致同步中断。
发明内容
为解决上述问题,本发明提供一种实现网络文件系统的访问不间断的方法。
本发明的技术方案为:一种实现网络文件系统的访问不间断的方法,包括以下步骤:
将存储映射给激活服务器和备份服务器;激活服务器和备份服务器上均配置Linux系统和挂载网络文件系统;
将存储格式化为XFS文件系统,格式化后增加网络文件系统共享目录及权限;
在激活服务器和备份服务器上均安装Pacemaker软件和Corosync软件;
将网络文件系统加入到Pacemaker高可用集群,并设置心跳IP地址;
将激活服务器和备份服务器的资源加入到各自的Pacemaker软件中;
将网络文件系统的启动与暂停加入到Pacemaker软件中;
启动Pacemaker软件和Corosync软件;
对网络文件系统进行故障转移测试,模拟失败节点;节点指激活服务器和备份服务器;
查看激活服务器和备份服务器是否发生资源切换;查看客户端是否发生IO暂停或存储异常挂载;
修复失败节点,进行激活服务器和备份服务器资源切换。
进一步地,所述格式化后增加网络文件系统共享目录及权限通过修改Linux的/etc/exports文件实现。
进一步地,将激活服务器和备份服务器的资源加入到各自的Pacemaker软件中,通过在Pacemaker软件的命令行中添加网络文件系统资源实现。
本发明提供的实现网络文件系统的访问不间断的方法,能实现网络文件系统的故障转移,并且能避免传统单机版的网络文件系统因网络问题或者机器自身问题而导致服务中断,通过此方法并将此故障的网络文件系统所有的空间转移到其他机器上,此过程通过pacemaker实现管理,并可安全高效的实现的故障转移,并保证数据的不丢失。本发明实现网络文件系统能在现有的成本上,实现高可用,减少因网络文件系统故障引起的数据灾难。
附图说明
图1是本发明具体实施例结构示意图。
具体实施方式
下面结合附图并通过具体实施例对本发明进行详细阐述,以下实施例是对本发明的解释,而本发明并不局限于以下实施方式。
本发明应用了集群和故障转移的概念,由网络文件系统中服务端的文件系统的故障转移功能和Pacemaker软件共同作用。网络文件系统文件系统的故障转移模块提供的服务端具有Activer/Standby的模式,正常情况下是Active的服务器提供一切服务,Standby的服务器处理待机状态。当Active服务器宕机后,Standby的服务器自动接管所有服务,使整个文件系统提供的服务不中断。而Pacemaker软件的功能则是进行节点的实效检测。
本方法基于如图1所示的结构实现,包括存储端3、服务端2和客户端1。服务端2分别与存储端3、客户端1连接。服务端2包括激活服务器和备份服务器,客户端可以是小型机、集群和多媒体设备等。
本发明的方法具体包括以下步骤:
S1:将存储映射给激活服务器和备份服务器;激活服务器和备份服务器上均配置Linux系统和挂载网络文件系统;
需要说明的是,激活服务器和备份服务器为两个IO节点,存储映射应保证两个IO节点都能看得到映射的存储。
S2:将存储格式化为XFS文件系统,格式化后增加网络文件系统共享目录及权限;
需要说明的是,通过修改Linux系统的/etc/exports文件增加网络文件系统共享目录及权限。
S3:在激活服务器和备份服务器上均安装Pacemaker软件和Corosync软件。
S4:将网络文件系统加入到Pacemaker高可用集群,并设置心跳IP地址。
S5:将激活服务器和备份服务器的资源加入到各自的Pacemaker软件中;
需要说明的是,通过在Pacemaker软件的命令行中增加网络文件系统资源实现该步骤。
S6:将网络文件系统的启动与暂停加入到Pacemaker软件中;
需要说明的是,该步骤使网络文件系统服务的启停与资源结合。
S7:启动Pacemaker软件和Corosync软件。
S8:对网络文件系统进行故障转移测试,模拟失败节点;节点指激活服务器和备份服务器。
S9:查看激活服务器和备份服务器是否发生资源切换;查看客户端是否发生IO暂停或存储异常挂载。
S10:修复失败节点,进行激活服务器和备份服务器资源切换。
本发明实现网络文件系统的故障转移,并且能避免传统单机版的网络文件系统因网络问题或者机器自身问题而导致服务中断,通过此方法并将此故障的网络文件系统所有的空间转移到其他机器上,此过程通过pacemaker实现管理,并可安全高效的实现的故障转移,并保证数据的不丢失。实现网络文件系统能在现有的成本上,实现高可用,减少因网络文件系统故障引起的数据灾难。
以上公开的仅为本发明的优选实施方式,但本发明并非局限于此,任何本领域的技术人员能思之的没有创造性的变化,以及在不脱离本发明原理前提下所作的若干改进和润饰,都应落在本发明的保护范围内。
Claims (3)
1.一种实现网络文件系统的访问不间断的方法,其特征在于,包括以下步骤:
将存储映射给激活服务器和备份服务器;激活服务器和备份服务器上均配置Linux系统和挂载网络文件系统;
将存储格式化为XFS文件系统,格式化后增加网络文件系统共享目录及权限;
在激活服务器和备份服务器上均安装Pacemaker软件和Corosync软件;
将网络文件系统加入到Pacemaker高可用集群,并设置心跳IP地址;
将激活服务器和备份服务器的资源加入到各自的Pacemaker软件中;
将网络文件系统的启动与暂停加入到Pacemaker软件中;
启动Pacemaker软件和Corosync软件;
对网络文件系统进行故障转移测试,模拟失败节点;节点指激活服务器和备份服务器;
查看激活服务器和备份服务器是否发生资源切换;查看客户端是否发生IO暂停或存储异常挂载;
修复失败节点,进行激活服务器和备份服务器资源切换。
2.根据权利要求1所述的实现网络文件系统的访问不间断的方法,其特征在于,所述格式化后增加网络文件系统共享目录及权限通过修改Linux的/etc/exports文件实现。
3.根据权利要求1或2所述的实现网络文件系统的访问不间断的方法,其特征在于,将激活服务器和备份服务器的资源加入到各自的Pacemaker软件中,通过在Pacemaker软件的命令行中添加网络文件系统资源实现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711064499.2A CN107819619A (zh) | 2017-11-02 | 2017-11-02 | 一种实现网络文件系统的访问不间断的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711064499.2A CN107819619A (zh) | 2017-11-02 | 2017-11-02 | 一种实现网络文件系统的访问不间断的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107819619A true CN107819619A (zh) | 2018-03-20 |
Family
ID=61603975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711064499.2A Pending CN107819619A (zh) | 2017-11-02 | 2017-11-02 | 一种实现网络文件系统的访问不间断的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107819619A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126940A (zh) * | 2019-11-22 | 2020-05-08 | 泰康保险集团股份有限公司 | 业务申请的处理方法、装置、设备及计算机可读存储介质 |
CN111756578A (zh) * | 2020-06-24 | 2020-10-09 | 苏州浪潮智能科技有限公司 | 一种用户态网络文件系统的故障恢复方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103713974A (zh) * | 2014-01-07 | 2014-04-09 | 浪潮(北京)电子信息产业有限公司 | 一种高性能作业调度管理节点双机加固方法及设备 |
CN104023061A (zh) * | 2014-06-10 | 2014-09-03 | 浪潮电子信息产业股份有限公司 | 一种lustre的oss高可用集群方案 |
US20160283335A1 (en) * | 2015-03-24 | 2016-09-29 | Xinyu Xingbang Information Industry Co., Ltd. | Method and system for achieving a high availability and high performance database cluster |
-
2017
- 2017-11-02 CN CN201711064499.2A patent/CN107819619A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103713974A (zh) * | 2014-01-07 | 2014-04-09 | 浪潮(北京)电子信息产业有限公司 | 一种高性能作业调度管理节点双机加固方法及设备 |
CN104023061A (zh) * | 2014-06-10 | 2014-09-03 | 浪潮电子信息产业股份有限公司 | 一种lustre的oss高可用集群方案 |
US20160283335A1 (en) * | 2015-03-24 | 2016-09-29 | Xinyu Xingbang Information Industry Co., Ltd. | Method and system for achieving a high availability and high performance database cluster |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126940A (zh) * | 2019-11-22 | 2020-05-08 | 泰康保险集团股份有限公司 | 业务申请的处理方法、装置、设备及计算机可读存储介质 |
CN111756578A (zh) * | 2020-06-24 | 2020-10-09 | 苏州浪潮智能科技有限公司 | 一种用户态网络文件系统的故障恢复方法和装置 |
CN111756578B (zh) * | 2020-06-24 | 2022-05-13 | 苏州浪潮智能科技有限公司 | 一种用户态网络文件系统的故障恢复方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11422908B2 (en) | Non-disruptive controller replacement in a cross-cluster redundancy configuration | |
US11163653B2 (en) | Storage cluster failure detection | |
CN107391294B (zh) | 一种ipsan容灾系统的建立方法及装置 | |
CN103226502B (zh) | 一种数据灾备控制系统及数据恢复方法 | |
US7962915B2 (en) | System and method for preserving state for a cluster of data servers in the presence of load-balancing, failover, and fail-back events | |
US8949828B2 (en) | Single point, scalable data synchronization for management of a virtual input/output server cluster | |
US8595546B2 (en) | Split brain resistant failover in high availability clusters | |
US20140244578A1 (en) | Highly available main memory database system, operating method and uses thereof | |
CN105262820A (zh) | 一种基于Linux操作系统的集群多机互备的方法 | |
CN111949444A (zh) | 一种基于分布式服务集群的数据备份与恢复系统及方法 | |
CN111130835A (zh) | 数据中心双活系统、切换方法、装置、设备及介质 | |
CN105302661A (zh) | 一种实现虚拟化管理平台高可用的系统和方法 | |
CN113783765B (zh) | 一种实现云内网和云外网互通的方法、系统、设备和介质 | |
CN102523118A (zh) | 一种局域网内多套控制计算机构成的冗余控制系统与方法 | |
US20190268237A1 (en) | Computer system and method for dynamically adapting a software-defined network | |
CN104023246A (zh) | 一种视频数据私有云存储系统和视频数据私有云存储方法 | |
CN106325768B (zh) | 一种双机存储系统及方法 | |
CN105389231A (zh) | 一种数据库双机备份方法及系统 | |
CN107357800A (zh) | 一种数据库高可用零丢失解决方法 | |
CN107819619A (zh) | 一种实现网络文件系统的访问不间断的方法 | |
JP5798056B2 (ja) | 呼処理情報の冗長化制御システムおよびこれに利用する予備保守サーバ | |
CN114301763A (zh) | 分布式集群故障的处理方法及系统、电子设备及存储介质 | |
CN107483257A (zh) | 一种基于x86和arm混合环境的应用系统部署方法及架构 | |
CN112202601B (zh) | 副本集模式运行的两物理节点mongo集群的应用方法 | |
CN107590032A (zh) | 存储集群故障转移的方法及存储集群系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180320 |