CN109189487A - Ceph分布式存储系统的重启方法、系统及相关组件 - Google Patents

Ceph分布式存储系统的重启方法、系统及相关组件 Download PDF

Info

Publication number
CN109189487A
CN109189487A CN201810921398.0A CN201810921398A CN109189487A CN 109189487 A CN109189487 A CN 109189487A CN 201810921398 A CN201810921398 A CN 201810921398A CN 109189487 A CN109189487 A CN 109189487A
Authority
CN
China
Prior art keywords
restarting
distributed memory
unloading
memory system
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810921398.0A
Other languages
English (en)
Other versions
CN109189487B (zh
Inventor
赵晓鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810921398.0A priority Critical patent/CN109189487B/zh
Publication of CN109189487A publication Critical patent/CN109189487A/zh
Application granted granted Critical
Publication of CN109189487B publication Critical patent/CN109189487B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4411Configuring for operating with peripheral devices; Loading of device drivers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44594Unloading

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • Retry When Errors Occur (AREA)
  • Stored Programmes (AREA)

Abstract

本申请公开了一种Ceph分布式存储系统的重启方法,所述重启方法包括当接收到重启指令时,根据所述重启指令停止客户端的读写程序并生成卸载信息;根据所述卸载信息卸载Ceph分布式存储系统的fuse挂载点;当所有所述fuse挂载点被卸载后,停止所述Ceph分布式存储系统的文件系统服务并生成重定向信息;根据所述重定向信息将所述重启指令重定向至重启服务,以便重启所述Ceph分布式存储系统。本方法能够避免出现Cep分布式存储系统重新启动时出现节点卡死的现象,提高Cept分布式存储系统的稳定性。本申请还公开了一种Ceph分布式存储系统的重启系统、一种计算机可读存储介质及一种电子设备,具有以上有益效果。

Description

Ceph分布式存储系统的重启方法、系统及相关组件
技术领域
本发明涉及数据存储领域,特别涉及一种Ceph分布式存储系统的重启方法、系统、一种计算机可读存储介质及一种电子设备。
背景技术
Ceph是一种分布式存储系统,它可以将多台服务器组成一个超大集群,将这些机器中的磁盘资源进行整合形成一个大的资源池(PB级别),然后按需分配给应用使用。在Ceph中,如果要写数据只能向主OSD写,然后再由主OSD向从OSD同步地写,只有当从OSD返回结果给主OSD后,主OSD才会向客户端报告写入完成的消息。如果要读数据,不会使用读写分离,而是也需要先向主OSD发请求,以保证数据的强一致性。
但是由于Ceph是集群系统,当客户端与Ceph文件系统融合时,在读写过程中,若全部存储节点重新启动,会出现部分节点重启卡死现象。
因此,如何避免出现Cep分布式存储系统重新启动时出现节点卡死的现象,提高Cept分布式存储系统的稳定性是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种Ceph分布式存储系统的重启方法、系统、一种计算机可读存储介质及一种电子设备,能够避免出现Cep分布式存储系统重新启动时出现节点卡死的现象,提高Cept分布式存储系统的稳定性。
为解决上述技术问题,本申请提供一种Ceph分布式存储系统的重启方法,该重启方法包括:
当接收到重启指令时,根据所述重启指令停止客户端的读写程序并生成卸载信息;
根据所述卸载信息卸载Ceph分布式存储系统的fuse挂载点;
当所有所述fuse挂载点被卸载后,停止所述Ceph分布式存储系统的文件系统服务并生成重定向信息;
根据所述重定向信息将所述重启指令重定向至重启服务,以便重启所述Ceph分布式存储系统。
可选的,根据所述重启指令停止客户端的读写程序包括:
根据所述重启指令清除所述客户端的元数据服务会话,并停止所述客户端的smt业务写入。
可选的,根据所述卸载信息卸载Ceph分布式存储系统的fuse挂载点包括:
根据所述卸载信息卸载Ceph分布式存储系统的所述fuse挂载点并记录卸载操作的执行时长;
判断所述执行时长是否大于预设值;
若是,则强制卸载所述fuse挂载点并对fuse进程执行kill操作,以便卸载所述fuse挂载点。
可选的,在根据所述重启指令停止客户端的读写程序并生成卸载信息之前,还包括:
将操作系统下的reboot系统文件改名为reboot_os;
相应的,根据所述重定向信息将所述重启指令重定向至重启服务包括:
根据所述重定向信息将所述重启指令重定向至reboot_os进入操作系统的重启服务,以便重启所述Ceph分布式存储系统。
可选的,根据所述重启指令清除所述客户端的元数据服务会话之后,还包括:
返回空的脚本程序日志。
本申请还提供了一种Ceph分布式存储系统的重启系统,该重启系统包括:
读写停止模块,用于当接收到重启指令时,根据所述重启指令停止客户端的读写程序并生成卸载信息;
挂载点卸载模块,用于根据所述卸载信息卸载Ceph分布式存储系统的fuse挂载点;
CephFS服务停止模块,用于当所有所述fuse挂载点被卸载后,停止所述Ceph分布式存储系统的文件系统服务并生成重定向信息;
重启模块,用于根据所述重定向信息将所述重启指令重定向至重启服务,以便重启所述Ceph分布式存储系统。
可选的,读写停止模块具体为根据所述重启指令清除所述客户端的元数据服务会话,并停止所述客户端的smt业务写入,生成所述卸载信息的模块。
可选的,挂载点卸载模块包括:
第一卸载单元,用于根据所述卸载信息卸载Ceph分布式存储系统的所述fuse挂载点并记录卸载操作的执行时长;
判断单元,用于判断所述执行时长是否大于预设值;
第二卸载单元,用于当所述执行时长大于所述预设值时,强制卸载所述fuse挂载点并对fuse进程执行kill操作,以便卸载所述fuse挂载点。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序执行时实现上述Ceph分布式存储系统的重启方法执行的步骤。
本申请还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现上述Ceph分布式存储系统的重启方法执行的步骤。
本发明提供了一种Ceph分布式存储系统的重启方法,包括当接收到重启指令时,根据所述重启指令停止客户端的读写程序并生成卸载信息;根据所述卸载信息卸载Ceph分布式存储系统的fuse挂载点;当所有所述fuse挂载点被卸载后,停止所述Ceph分布式存储系统的文件系统服务并生成重定向信息;根据所述重定向信息将所述重启指令重定向至重启服务,以便重启所述Ceph分布式存储系统。
由于现有技术中出现部分节点重启卡死的原因在于:在执行重新启动服务时,依旧存在Ceph分布式存储系统的文件系统服务。因此本申请采用在执行重新启动服务之前优先退出Ceph分布式存储系统的文件系统服务进程的思想,避免了出现重新启动时仍有Ceph分布式存储系统的文件系统的服务进程正在运行的情况。本申请能够避免出现Cep分布式存储系统重新启动时出现节点卡死的现象,提高Cept分布式存储系统的稳定性,实现了Cept分布式存储系统的正常并快速的重启。本申请同时还提供了一种Ceph分布式存储系统的重启系统、一种计算机可读存储介质和一种电子设备,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种Ceph分布式存储系统的重启方法的流程图;
图2为本申请实施例所提供的另一种Ceph分布式存储系统的重启方法的流程图;
图3为本申请实施例所提供的一种Ceph分布式存储系统的重启系统的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面请参见图1,图1为本申请实施例所提供的一种Ceph分布式存储系统的重启方法的流程图。
具体步骤可以包括:
S101:当接收到重启指令时,根据所述重启指令停止客户端的读写程序并生成卸载信息;
其中,本实施例中接收到重启方法的适用于Ceph分布式存储系统的任意工作状态,可以在客户端与Ceph分布式存储系统的文件系统融合时进行重启操作。当接收到重启指令时,首先停止与Ceph分布式存储系统存在数据读写业务的客户端的读写程序。本实施例默认存在,当客户端的所有读写程序均停止后,生成卸载信息的操作。需要说明的是,卸载信息是用来表示客户端读写程序均已被停止,可以卸载fuse挂载点的信息。先停止客户端的数据读写程序在卸载fuse挂载点可以避免出现文件损坏的情况。
fuse是Filesystem in Userspace的简写,意为用户空间文件系统,用户空间文件系统是Linux中用于挂载某些网络空间(如SSH)到本地文件系统的模块,fuse挂载点就是用户空间文件系统挂载某些网络空间的位置。
S102:根据所述卸载信息卸载Ceph分布式存储系统的fuse挂载点;
其中,本步骤建立在S101已经将所有的读写程序停止的基础上,卸载Ceph分布式存储系统的fuse挂载点。可以理解的是,在执行正常的卸载fuse挂载点操作时,可能会出现卸载超时的情况,因此作为一种优选的实施方案:可以在在步骤中,先对fuse挂载点进行正常的卸载操作,并记录执行卸载操作的持续时间,若该持续时间超过预设时长时判定卸载超时,对fuse挂载点进行强制卸载操作并kill掉fuse进程以便卸载Ceph分布式存储系统的fuse挂载点。
需要说明的是,在Ceph分布式存储系统中可以存在有多个fuse挂载点,在本步骤中可以串行的逐个卸载各个fuse挂载点,也可以并行地卸载所有fuse挂载点。
S103:当所有所述fuse挂载点被卸载后,停止所述Ceph分布式存储系统的文件系统服务并生成重定向信息;
其中,本步骤实际上默认存在判断是否所有fuse挂载点均已经被卸载,若是则停止停止所述Ceph分布式存储系统的文件系统服务并生成重定向信息的操作。现有技术中存在部分节点reboot卡死现象的根本原因是:没有在重新启动Ceph分布式存储系统之前,先停止Ceph分布式存储系统的文件系统服务。故本实施例采用了优先退去ceph进程的思想,在Ceph分布式存储系统执行重新启动操作之前,先停止文件系统服务,即先停止ceph服务进程,再重新启动Ceph分布式存储系统。
需要说明的是,本步骤实际上是在停止了所有Ceph分布式存储系统的文件系统服务后立即生成重定向信息,以便执行S104中的相关操作。本实施例S101、S102和S103中的操作,实际上是在接收到重启指令后先不执行重启操作,先执行S101、S102和S103所描述的顺序的操作,再进行重置操作。因此,实际上重定向信息就是用于通知执行重新启动服务的操作的信息。
S104:根据所述重定向信息将所述重启指令重定向至重启服务,以便重启所述Ceph分布式存储系统。
其中,本步骤在已经停止了Ceph分布式存储系统的文件系统服务后,将重启指令重定向到重启服务对应的系统文件,以便执行该系统文件对应的重启操作,重启Ceph分布式存储系统。需要说明的是,本实施例默认存在S101之前先将操作系统下的关于重新启动操作的系统文件/usr/sbin/reboot进行改名为reboot_os,将S101、S102和S103操作对应的脚本存储在/usr/sbin/下并命名为reboot,当接收到重启指令时执行reboot中脚本对应的S101、S102和S103操作,当S101、S102和S103均执行完毕后,将重启指令重定向到/usr/sbin/reboot_os,以便启动重启服务,重启所述Ceph分布式存储系统。作为一种优选的实施方案,可以采用shell脚本编写S101至S104中的操作。值得注意的是,在将系统文件/usr/sbin/reboot进行改名为reboot_os之前,系统文件/usr/sbin/reboot中存有重新启动对应的程序,改名后/usr/sbin/reboot_os中存有重新启动对应的程序。进一步由于将S101、S102和S103操作对应的脚本存储/usr/sbin/下并命名为reboot,当接收到重启指令后,本实施例先会执行/usr/sbin/reboot对应的S101、S102和S103操作,再将重启指令重定向到/usr/sbin/reboot_os,启动真正的重启程序或重启服务。
由于现有技术中出现部分节点重启卡死的原因在于:在执行重新启动服务时,依旧存在Ceph分布式存储系统的文件系统服务。因此本实施例采用在执行重新启动服务之前优先退出Ceph分布式存储系统的文件系统服务进程的思想,避免了出现重新启动时仍有Ceph分布式存储系统的文件系统的服务进程正在运行的情况。本实施例能够避免出现Cep分布式存储系统重新启动时出现节点卡死的现象,提高Cept分布式存储系统的稳定性,实现了Cept分布式存储系统的正常并快速的重启。
下面请参见图2,图2为本申请实施例所提供的另一种Ceph分布式存储系统的重启方法的流程图;
具体步骤可以包括:
S201:当接收到重启指令时,根据所述重启指令清除所述客户端的元数据服务会话,并停止所述客户端的smt业务写入,生成卸载信息;
其中,需要说明的是“根据所述重启指令清除所述客户端的元数据服务会话,并停止所述客户端的smt业务写入”就相当于停止客户端的读写程序。smt为实时获取视频流的应用程序。
S202:根据所述卸载信息卸载Ceph分布式存储系统的所述fuse挂载点并记录卸载操作的执行时长;
S203:判断所述执行时长是否大于预设值;若是,则进入S204;若否,则进入S205;
其中,该预设时长可以为10秒。
S204:强制卸载所述fuse挂载点并对fuse进程执行kill操作,以便卸载所述fuse挂载点,进入S205;
S205:当所有所述fuse挂载点被卸载后,停止所述Ceph分布式存储系统的文件系统服务并生成重定向信息;
S206:根据所述重定向信息将所述重启指令重定向至reboot_os进入操作系统的重启服务,以便重启所述Ceph分布式存储系统。
下面通过一个实际应用中的实施例说明上面两个实施例的具体过程:
首先,将Linux操作系统下的/usr/sbin/reboot进行改名为reboot_os。
然后,将优化的reboot脚本放在/usr/sbin/下面,命名为reboot。
Reboot优化方法步骤:
步骤(1)、清理所有client的mds的session,并将日志返回空,方法为ceph mdstell all injectconfig'--mds_session_auto_evict true'>/dev/null 2>&1;
mds(Metadata Service):元数据服务,提供元数据的各种访问操作。
将日志返回空,目的是不在命令行窗口打印脚本程序的日志,给用户一种好的体验。因为linux系统在执行reboot重启的时候是不会打印信息的。
步骤(2)、停止前端的smt业务写入,servie stop smt;
步骤(3)、卸载fuse挂载点/mnt/ceph,并进行超时判断,超过10s无法卸载退出,脚本命令为timeout 10 umount/mnt/ceph;
步骤(4)、若步骤(3)无法卸载,进行强制卸载并kill掉fuse进程,脚本命令为umount-l/mnt/ceph;killall-9ceph-fuse;
步骤(5)、停止cephFS的服务service stop ceph.target;
步骤(6)、重定向到reboot_os进入操作系统的重启服务,脚本命令为reboot_os$*。
请参见图3,图3为本申请实施例所提供的一种Ceph分布式存储系统的重启系统的结构示意图;
该系统可以包括:
读写停止模块100,用于当接收到重启指令时,根据所述重启指令停止客户端的读写程序并生成卸载信息;
挂载点卸载模块200,用于根据所述卸载信息卸载Ceph分布式存储系统的fuse挂载点;
CephFS服务停止模块300,用于当所有所述fuse挂载点被卸载后,停止所述Ceph分布式存储系统的文件系统服务并生成重定向信息;
重启模块400,用于根据所述重定向信息将所述重启指令重定向至重启服务,以便重启所述Ceph分布式存储系统。
进一步的,读写停止模块100具体为根据所述重启指令清除所述客户端的元数据服务会话,并停止所述客户端的smt业务写入,生成所述卸载信息的模块
进一步的,挂载点卸载模块200包括:
第一卸载单元,用于根据所述卸载信息卸载Ceph分布式存储系统的所述fuse挂载点并记录卸载操作的执行时长;
判断单元,用于判断所述执行时长是否大于预设值;
第二卸载单元,用于当所述执行时长大于所述预设值时,强制卸载所述fuse挂载点并对fuse进程执行kill操作,以便卸载所述fuse挂载点。
由于现有技术中出现部分节点重启卡死的原因在于:在执行重新启动服务时,依旧存在Ceph分布式存储系统的文件系统服务。因此本实施例采用在执行重新启动服务之前优先退出Ceph分布式存储系统的文件系统服务进程的思想,避免了出现重新启动时仍有Ceph分布式存储系统的文件系统的服务进程正在运行的情况。本实施例能够避免出现Cep分布式存储系统重新启动时出现节点卡死的现象,提高Cept分布式存储系统的稳定性,实现了Cept分布式存储系统的正常并快速的重启
由于系统部分的实施例与方法部分的实施例相互对应,因此系统部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本申请还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请还提供了一种电子设备,可以包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然所述电子设备还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种Ceph分布式存储系统的重启方法,其特征在于,包括:
当接收到重启指令时,根据所述重启指令停止客户端的读写程序并生成卸载信息;
根据所述卸载信息卸载Ceph分布式存储系统的fuse挂载点;
当所有所述fuse挂载点被卸载后,停止所述Ceph分布式存储系统的文件系统服务并生成重定向信息;
根据所述重定向信息将所述重启指令重定向至重启服务,以便重启所述Ceph分布式存储系统。
2.根据权利要求1所述重启方法,其特征在于,根据所述重启指令停止客户端的读写程序包括:
根据所述重启指令清除所述客户端的元数据服务会话,并停止所述客户端的smt业务写入。
3.根据权利要求1所述重启方法,其特征在于,根据所述卸载信息卸载Ceph分布式存储系统的fuse挂载点包括:
根据所述卸载信息卸载Ceph分布式存储系统的所述fuse挂载点并记录卸载操作的执行时长;
判断所述执行时长是否大于预设值;
若是,则强制卸载所述fuse挂载点并对fuse进程执行kill操作,以便卸载所述fuse挂载点。
4.根据权利要求1所述重启方法,其特征在于,在根据所述重启指令停止客户端的读写程序并生成卸载信息之前,还包括:
将操作系统下的reboot系统文件改名为reboot_os;
相应的,根据所述重定向信息将所述重启指令重定向至重启服务包括:
根据所述重定向信息将所述重启指令重定向至reboot_os进入操作系统的重启服务,以便重启所述Ceph分布式存储系统。
5.根据权利要求1所述重启方法,其特征在于,根据所述重启指令清除所述客户端的元数据服务会话之后,还包括:
返回空的脚本程序日志。
6.一种Ceph分布式存储系统的重启系统,其特征在于,包括:
读写停止模块,用于当接收到重启指令时,根据所述重启指令停止客户端的读写程序并生成卸载信息;
挂载点卸载模块,用于根据所述卸载信息卸载Ceph分布式存储系统的fuse挂载点;
CephFS服务停止模块,用于当所有所述fuse挂载点被卸载后,停止所述Ceph分布式存储系统的文件系统服务并生成重定向信息;
重启模块,用于根据所述重定向信息将所述重启指令重定向至重启服务,以便重启所述Ceph分布式存储系统。
7.根据权利要求6所述重启系统,其特征在于,所述读写停止模块具体为根据所述重启指令清除所述客户端的元数据服务会话,并停止所述客户端的smt业务写入,生成所述卸载信息的模块。
8.根据权利要求6所述重启系统,其特征在于,所述挂载点卸载模块包括:
第一卸载单元,用于根据所述卸载信息卸载Ceph分布式存储系统的所述fuse挂载点并记录卸载操作的执行时长;
判断单元,用于判断所述执行时长是否大于预设值;
第二卸载单元,用于当所述执行时长大于所述预设值时,强制卸载所述fuse挂载点并对fuse进程执行kill操作,以便卸载所述fuse挂载点。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述的Ceph分布式存储系统的重启方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的Ceph分布式存储系统的重启方法的步骤。
CN201810921398.0A 2018-08-14 2018-08-14 Ceph分布式存储系统的重启方法、系统及相关组件 Active CN109189487B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810921398.0A CN109189487B (zh) 2018-08-14 2018-08-14 Ceph分布式存储系统的重启方法、系统及相关组件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810921398.0A CN109189487B (zh) 2018-08-14 2018-08-14 Ceph分布式存储系统的重启方法、系统及相关组件

Publications (2)

Publication Number Publication Date
CN109189487A true CN109189487A (zh) 2019-01-11
CN109189487B CN109189487B (zh) 2021-08-31

Family

ID=64921412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810921398.0A Active CN109189487B (zh) 2018-08-14 2018-08-14 Ceph分布式存储系统的重启方法、系统及相关组件

Country Status (1)

Country Link
CN (1) CN109189487B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110045929A (zh) * 2019-04-19 2019-07-23 苏州浪潮智能科技有限公司 一种挂载点管理方法及相关装置
CN110489173A (zh) * 2019-07-31 2019-11-22 广州微算互联信息技术有限公司 一种ceph镜像块设备卸载方法、系统及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6725392B1 (en) * 1999-03-03 2004-04-20 Adaptec, Inc. Controller fault recovery system for a distributed file system
CN1904852A (zh) * 2006-08-01 2007-01-31 西安西电捷通无线网络通信有限公司 一种计算机应用程序的监控及异常处理方法
CN105787093A (zh) * 2016-03-17 2016-07-20 清华大学 一种基于LSM-Tree结构的日志文件系统的构建方法
CN107608738A (zh) * 2017-10-12 2018-01-19 郑州云海信息技术有限公司 启动对象存储设备的方法、装置及计算机可读存储介质
CN107948334A (zh) * 2018-01-09 2018-04-20 无锡华云数据技术服务有限公司 基于分布式存储系统的数据处理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6725392B1 (en) * 1999-03-03 2004-04-20 Adaptec, Inc. Controller fault recovery system for a distributed file system
CN1904852A (zh) * 2006-08-01 2007-01-31 西安西电捷通无线网络通信有限公司 一种计算机应用程序的监控及异常处理方法
CN105787093A (zh) * 2016-03-17 2016-07-20 清华大学 一种基于LSM-Tree结构的日志文件系统的构建方法
CN107608738A (zh) * 2017-10-12 2018-01-19 郑州云海信息技术有限公司 启动对象存储设备的方法、装置及计算机可读存储介质
CN107948334A (zh) * 2018-01-09 2018-04-20 无锡华云数据技术服务有限公司 基于分布式存储系统的数据处理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110045929A (zh) * 2019-04-19 2019-07-23 苏州浪潮智能科技有限公司 一种挂载点管理方法及相关装置
CN110045929B (zh) * 2019-04-19 2020-06-19 苏州浪潮智能科技有限公司 一种挂载点管理方法及相关装置
CN110489173A (zh) * 2019-07-31 2019-11-22 广州微算互联信息技术有限公司 一种ceph镜像块设备卸载方法、系统及存储介质
CN110489173B (zh) * 2019-07-31 2023-10-03 广州微算互联信息技术有限公司 一种ceph镜像块设备卸载方法、系统及存储介质

Also Published As

Publication number Publication date
CN109189487B (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
US9817734B2 (en) Virtual machine recovery on non-shared storage in a single virtual infrastructure management instance
CN107357688B (zh) 分布式系统及其故障恢复方法和装置
CN101470645B (zh) 一种高速缓存数据恢复的方法和装置
CN113656149B (zh) 一种应用处理方法、装置及相关设备
CN111338844A (zh) 一种数据库备份管理的方法及电子设备
CN109558260A (zh) Kubernetes故障排除系统、方法、设备及介质
CN109189342A (zh) 一种磁盘挂载方法、装置、设备及存储介质
CN108776579A (zh) 一种分布式存储集群扩容方法、装置、设备及存储介质
CN109189487A (zh) Ceph分布式存储系统的重启方法、系统及相关组件
US11500812B2 (en) Intermediate file processing method, client, server, and system
JP2007133544A (ja) 障害情報解析方法及びその実施装置
CN105718330A (zh) 一种Linux系统备份数据的恢复方法及装置
CN104216771A (zh) 软件程序的重启方法及装置
CN115858086A (zh) 数据恢复方法、数据恢复系统、设备及存储介质
CN110008004B (zh) 一种电力系统计算分析应用虚拟化方法、装置和设备
CN113190256B (zh) 一种升级方法、装置及设备
CN113946471A (zh) 基于对象存储的分布式文件级备份方法及系统
CN112965783A (zh) 一种使用存储快照备份虚拟机的系统及方法
WO2024077863A1 (zh) 一种全闪存储系统的恢复方法及相关装置
US20070234114A1 (en) Method, apparatus, and computer program product for implementing enhanced performance of a computer system with partially degraded hardware
CN103699681A (zh) 数据回滚的处理方法和装置
CN110502238A (zh) 一种前后端联调的方法及装置
CN111176886A (zh) 一种数据库模式的切换方法、装置及电子设备
CN108984356A (zh) 一种it产品测试方法及装置
CN115391106A (zh) 一种备端资源池化的方法、系统及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant