CN107451257A - 一种基于分布式文件系统的可维护性系统和方法 - Google Patents

一种基于分布式文件系统的可维护性系统和方法 Download PDF

Info

Publication number
CN107451257A
CN107451257A CN201710639356.3A CN201710639356A CN107451257A CN 107451257 A CN107451257 A CN 107451257A CN 201710639356 A CN201710639356 A CN 201710639356A CN 107451257 A CN107451257 A CN 107451257A
Authority
CN
China
Prior art keywords
thread
caching
maintainable
distributed file
semaphore
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710639356.3A
Other languages
English (en)
Inventor
王小梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710639356.3A priority Critical patent/CN107451257A/zh
Publication of CN107451257A publication Critical patent/CN107451257A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Multi Processors (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于分布式文件系统的可维护性方法和系统,其中,方法包括:步骤1,开始运行系统,并启动系统的第一线程和第二线程;步骤2,将第一线程加锁进入等待状态;步骤3,判断是否出现由安装在系统中的致命信息发生模块根据系统出现异常时发出的致命信号;若是,步骤4,第二线程对致命信号进行捕获,并向第一线程输出第一信号量后进行加锁;步骤5,第一线程被第一信号量触发并激活,并输出缓存中的重要信息。通过在系统启动之后,开启的两个线程中一个处于加锁等待状态,在系统出现异常时,第二线程捕获致命信号,第一线程被第一信号量触发并激活,并输出缓存中的重要信息,避免了重要信息数据的丢失,同时也通过重要数据定位问题。

Description

一种基于分布式文件系统的可维护性系统和方法
技术领域
本发明涉及分布式文件技术领域,特别是涉及一种基于分布式文件系统的可维护性系统和方法。
背景技术
计算机通过文件系统管理、存储数据,而在信息爆炸时代,人们可以获取的数据成指数倍的增长,单纯通过增加硬盘个数来扩展计算机文件系统的存储容量的方式,在容量大小、容量增长速度、数据备份、数据安全等方面的表现都差强人意。分布式文件系统可以有效解决数据的存储和管理难题:将固定于某个地点的某个文件系统,扩展到任意多个地点/多个文件系统,众多的节点组成一个文件系统网络。每个节点可以分布在不同的地点,通过网络进行节点间的通信和数据传输。人们在使用分布式文件系统时,无需关心数据是存储在哪个节点上、或者是从哪个节点从获取的,只需要像使用本地文件系统一样管理和存储文件系统中的数据。
由于分布式文件系统具有高容错性、可扩展性等优点,越来越被广大用户所青睐。然而当分布式文件系统发生异常或者崩溃时,通常需要花费大量的时间定位并解决问题,而这会导致用户的业务不能正常运行,从而给用户带来巨大的经济损失。
发明内容
本发明的目的是提供了基于分布式文件系统的可维护性方法和系统,快速定位问题,减少经济损失。
为解决上述技术问题,本发明实施例提供了一种基于分布式文件系统的可维护性方法,包括:
步骤1,开始运行系统,并启动所述系统的第一线程和第二线程;
步骤2,将所述第一线程加锁进入等待状态;
步骤3,判断是否出现由安装在所述系统中的致命信息发生模块根据所述系统出现异常时发出的致命信号;
若是,步骤4,所述第二线程对所述致命信号进行捕获,并向所述第一线程输出第一信号量后进行加锁;
步骤5,所述第一线程被所述第一信号量触发并激活,并输出缓存中的重要信息。
其中,所述输出缓存中的重要信息,包括:
将所述缓存中的重要信息打印输出。
其中,所述输出缓存中的重要信息,还包括:
将所述缓存中的重要信息存储至指定的存储设备。
其中,在所述步骤5之后,还包括:
步骤6,根据所述致命信号分析判断出所述系统出现异常的原因并输出。
其中,在所述步骤5之后,还包括:
步骤7,判断所述第二线程是否处于加锁状态;
若是,步骤8,所述第一线程解锁后向所述第二线程发送第二信号量;
步骤8,所述第二线程在接收到所述第二信号,之后进行解锁操作。
除此之外,本发明实施例还提供了一种基于分布式文件系统的可维护性系统,包括致命信号触发模块、线程启动模块、信号量输出模块和定位输出模块,所述线程启动模块用于在系统开始运行之后,启动第一线程和第二线程,所述第一线程自动进入加锁等待状态,在所述系统出现异常时,所述致命信号触发模块输出致命信号,所述第二线程对从所述致命信号进行捕获,并发送到所述信号量输出模块,由所述信号量输出模块内存的预定的统一的信号处理函数处理后,控制所述第二线程向所述第一线程发送第一信号量,所述第一线程接收所述第一信号量后被所述第一信号量触发激活并进行解锁后,将缓存中的重要信息发送到所述定位输出模块,由所述定位输出模块输出。
其中,所述定位输出模块包括打印单元,用于将所述缓存中的重要信息打印输出。
其中,还包括与所述定位输出模块连接的日志模块,用于存储所述定位输出模块输出的所述缓存中的重要信息。
其中,还包括与所述定位输出模块连接的故障分析模块,用于根据所述缓存中的重要信息分析判断所述系统出现故障的原因。
本发明实施例所提供的基于分布式文件系统的可维护性方法和系统,与现有技术相比,具有以下优点:
本发明实施例提供的基于分布式文件系统的可维护性方法,包括:
步骤1,开始运行系统,并启动所述系统的第一线程和第二线程;
步骤2,将所述第一线程加锁进入等待状态;
步骤3,判断是否出现由安装在所述系统中的致命信息发生模块根据所述系统出现异常时发出的致命信号;
若是,步骤4,所述第二线程对所述致命信号进行捕获,并向所述第一线程输出第一信号量后进行加锁;
步骤5,所述第一线程被所述第一信号量触发并激活,并输出缓存中的重要信息。
本发明实施例还提供的基于分布式文件系统的可维护性系统,包括致命信号触发模块、线程启动模块、信号量输出模块和定位输出模块,所述线程启动模块用于在系统开始运行之后,启动第一线程和第二线程,所述第一线程自动进入加锁等待状态,在所述系统出现异常时,所述致命信号触发模块输出致命信号,所述第二线程对从所述致命信号进行捕获,并发送到所述信号量输出模块,由所述信号量输出模块内存的预定的统一的信号处理函数处理后,控制所述第二线程向所述第一线程发送第一信号量,所述第一线程接收所述第一信号量后被所述第一信号量触发激活并进行解锁后,将缓存中的重要信息发送到所述定位输出模块,由所述定位输出模块输出。
所述基于分布式文件系统的可维护性方法和系统,通过在系统启动之后,开启的两个线程中一个处于加锁等待状态,在系统出现异常时,第二线程捕获致命信号,第一线程被第一信号量触发并激活,并输出缓存中的重要信息,避免了重要信息数据的丢失,同时也通过重要数据定位问题,提高了定位问题的效率,减少了系统出现异常造成的经济损失,提高了维护效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于分布式文件系统的可维护性方法的一种具体实施方式的步骤流程示意图;
图2为本发明实施例提供的基于分布式文件系统的可维护性方法的另一种具体实施方式的步骤流程示意图;
图3为本发明实施例提供的基于分布式文件系统的可维护性系统的一种具体实施方式的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1~3,图1为本发明实施例提供的基于分布式文件系统的可维护性方法的一种具体实施方式的步骤流程示意图;图2为本发明实施例提供的基于分布式文件系统的可维护性方法的另一种具体实施方式的步骤流程示意图;图3为本发明实施例提供的基于分布式文件系统的可维护性系统的一种具体实施方式的结构示意图。
在一种具体实施方式中,所述基于分布式文件系统的可维护性方法,包括:
步骤1,开始运行系统,并启动所述系统的第一线程和第二线程;
步骤2,将所述第一线程加锁进入等待状态;
步骤3,判断是否出现由安装在所述系统中的致命信息发生模块根据所述系统出现异常时发出的致命信号;
若是,步骤4,所述第二线程对所述致命信号进行捕获,并向所述第一线程输出第一信号量后进行加锁;
步骤5,所述第一线程被所述第一信号量触发并激活,并输出缓存中的重要信息。
需要指出的是,在系统启动之后,并不一定只有启动第一线程和第二线程,还可以启动其它的线程,而本发明中的第一线程和第二线程的作用是专门用来对系统出现异常之后进行快速定位的。
通过在系统启动之后,开启的两个线程中一个处于加锁等待状态,在系统出现异常时,第二线程捕获致命信号,第一线程被第一信号量触发并激活,并输出缓存中的重要信息,避免了重要信息数据的丢失,同时也通过重要数据定位问题,提高了定位问题的效率,减少了系统出现异常造成的经济损失,提高了维护效率。
而输出缓存中的重要信息有多种方式,包括:将所述缓存中的重要信息打印输出。通过将缓存中的重要信息打印出来,更加直观,节省成本。这时因为系统出现异常,很可能是崩溃的前兆,系统将在不久之后不能正常工作,缓存中的重要信息很可能会发生丢失。
需要指出的是,本发明对于缓存中的重要信息不做具体限定,可以有用户预先自行设置,可以是针对某些应用,即将某一些应用的工作过程中的数据信息作为重要信息。
本发明中输出缓存中的重要信息,除了打印之外,还包括:
将所述缓存中的重要信息存储至指定的存储设备。
即预先指定存储设备,只要系统发生异常,就将缓存中的重要信息存储到指定的存储设备,优点是无需进行打印以及信息的在此录入,节省了维护时间和成本,提高了系统的维护效率。
为了更进一步快速对问题系统进行定位,在所述步骤5之后,还包括:
步骤6,根据所述致命信号分析判断出所述系统出现异常的原因并输出。
由于大数据以及云计算的不断发展,如果系统故障发生在大数据中心,如果需要打印、存储等人工方式进行定位,就会浪费很多时间,通过在致命信号出现之后,输出至指定的处理器进行分析,进行定位和异常分析,提高了系统的维护效率。
本发明中的第一线程和第二线程在系统出现异常之后,第二线程捕获致命信号后,进入信号处理函数,然后向第一线程输出第一信号量之后进行自加锁,此时,第一线程由于被第一信号量触发解锁,在输出缓存中的重要数据之后,等待第二线程是否进行加锁。
在系统恢复之后,第一线程向加锁的第二线程发送第二信号量,第二线程接收到之后进行解锁,恢复正常,而第一线程会进行自加锁。
即在所述步骤5之后,还包括:
步骤7,判断所述第二线程是否处于加锁状态;
若是,步骤8,所述第一线程解锁后向所述第二线程发送第二信号量;
步骤8,所述第二线程在接收到所述第二信号,之后进行解锁操作。
这样就会使得系统处在,中有一个线程处于解锁状态,另一个处于加锁状态,正常时第一线程加锁,异常时第二线程加锁,通过第一信号量解锁第一线程,加锁第二线程;系统正常时,第二信号量加锁第一线程解锁第二线程。
需要指出的是,本发明中主要针对的是基于linux作为分布式文件系统的在系统出现异常时,进行缓存输出保护的方法,也适用于其它操作系统的分布式文件系统在系统异常时的应对方法。
除此之外,本发明实施例还提供了一种基于分布式文件系统的可维护性系统,包括致命信号触发模块10、线程启动模块20、信号量输出模块30和定位输出模块40,所述线程启动模块20用于在系统开始运行之后,启动第一线程和第二线程,所述第一线程自动进入加锁等待状态,在所述系统出现异常时,所述致命信号触发模块10输出致命信号,所述第二线程对从所述致命信号进行捕获,并发送到所述信号量输出模块30,由所述信号量输出模块30内存的预定的统一的信号处理函数处理后,控制所述第二线程向所述第一线程发送第一信号量,所述第一线程接收所述第一信号量后被所述第一信号量触发激活并进行解锁后,将缓存中的重要信息发送到所述定位输出模块40,由所述定位输出模块40输出。
为了节约成本和快速定位问题,所述定位输出模块40包括打印单元,用于将所述缓存中的重要信息打印输出。
通过将缓存中的重要信息进行打印输出,用户可以根据打印出的缓存数据进行快速问题定位。
为了减少打印带来的问题,同时也能够快速定位问题,所述基于分布式文件系统的可维护性系统还包括与所述定位输出模块40连接的日志模块,用于存储所述定位输出模块40输出的所述缓存中的重要信息。
为了进一步提高定位效率,提高系统的维护效率,所述基于分布式文件系统的可维护性方法和系统与所述定位输出模块40连接的故障分析模块,用于根据所述缓存中的重要信息分析判断所述系统出现故障的原因。
综上所述,本发明实施例提供的基于分布式文件系统的可维护性方法和系统,通过在系统启动之后,开启的两个线程中一个处于加锁等待状态,在系统出现异常时,第二线程捕获致命信号,第一线程被第一信号量触发并激活,并输出缓存中的重要信息,避免了重要信息数据的丢失,同时也通过重要数据定位问题,提高了定位问题的效率,减少了系统出现异常造成的经济损失,提高了维护效率。
以上对本发明所提供的基于分布式文件系统的可维护性方法和系统进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (9)

1.一种基于分布式文件系统的可维护性方法,其特征在于,包括:
步骤1,开始运行系统,并启动所述系统的第一线程和第二线程;
步骤2,将所述第一线程加锁进入等待状态;
步骤3,判断是否出现由安装在所述系统中的致命信息发生模块根据所述系统出现异常时发出的致命信号;
若是,步骤4,所述第二线程对所述致命信号进行捕获,并向所述第一线程输出第一信号量后进行加锁;
步骤5,所述第一线程被所述第一信号量触发并激活,并输出缓存中的重要信息。
2.如权利要求1所述基于分布式文件系统的可维护性方法,其特征在于,所述输出缓存中的重要信息,包括:
将所述缓存中的重要信息打印输出。
3.如权利要求2所述基于分布式文件系统的可维护性方法,其特征在于,所述输出缓存中的重要信息,还包括:
将所述缓存中的重要信息存储至指定的存储设备。
4.如权利要求3所述基于分布式文件系统的可维护性方法,其特征在于,在所述步骤5之后,还包括:
步骤6,根据所述致命信号分析判断出所述系统出现异常的原因并输出。
5.如权利要求1所述基于分布式文件系统的可维护性方法,其特征在于,在所述步骤5之后,还包括:
步骤7,判断所述第二线程是否处于加锁状态;
若是,步骤8,所述第一线程解锁后向所述第二线程发送第二信号量;
步骤9,所述第二线程在接收到所述第二信号,之后进行解锁操作。
6.一种基于分布式文件系统的可维护性系统,其特征在于,包括致命信号触发模块、线程启动模块、信号量输出模块和定位输出模块,所述线程启动模块用于在系统开始运行之后,启动第一线程和第二线程,所述第一线程自动进入加锁等待状态,在所述系统出现异常时,所述致命信号触发模块输出致命信号,所述第二线程对从所述致命信号进行捕获,并发送到所述信号量输出模块,由所述信号量输出模块内存的预定的统一的信号处理函数处理后,控制所述第二线程向所述第一线程发送第一信号量,所述第一线程接收所述第一信号量后被所述第一信号量触发激活并进行解锁后,将缓存中的重要信息发送到所述定位输出模块,由所述定位输出模块输出。
7.如权利要求6所述基于分布式文件系统的可维护性系统,其特征在于,所述定位输出模块包括打印单元,用于将所述缓存中的重要信息打印输出。
8.如权利要求7所述基于分布式文件系统的可维护性系统,其特征在于,还包括与所述定位输出模块连接的日志模块,用于存储所述定位输出模块输出的所述缓存中的重要信息。
9.如权利要求8所述基于分布式文件系统的可维护性系统,其特征在于,还包括与所述定位输出模块连接的故障分析模块,用于根据所述缓存中的重要信息分析判断所述系统出现故障的原因。
CN201710639356.3A 2017-07-31 2017-07-31 一种基于分布式文件系统的可维护性系统和方法 Pending CN107451257A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710639356.3A CN107451257A (zh) 2017-07-31 2017-07-31 一种基于分布式文件系统的可维护性系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710639356.3A CN107451257A (zh) 2017-07-31 2017-07-31 一种基于分布式文件系统的可维护性系统和方法

Publications (1)

Publication Number Publication Date
CN107451257A true CN107451257A (zh) 2017-12-08

Family

ID=60489909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710639356.3A Pending CN107451257A (zh) 2017-07-31 2017-07-31 一种基于分布式文件系统的可维护性系统和方法

Country Status (1)

Country Link
CN (1) CN107451257A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1605987A (zh) * 2004-11-17 2005-04-13 中兴通讯股份有限公司 一种多线程系统中实现实时监控各线程状态的方法
CN1694095A (zh) * 2004-04-30 2005-11-09 微软公司 实时文件系统修复
US20090144519A1 (en) * 2007-12-03 2009-06-04 Qualcomm Incorporated Multithreaded Processor with Lock Indicator
CN103942113A (zh) * 2013-11-21 2014-07-23 小米科技有限责任公司 系统重启原因的检测方法、装置及终端设备
CN104331463A (zh) * 2014-10-30 2015-02-04 深圳市锐明视讯技术有限公司 一种文件系统多线程实现的方法及装置
CN105511969A (zh) * 2015-11-25 2016-04-20 中国船舶工业系统工程研究院 一种跨进程的线程间进行互斥的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1694095A (zh) * 2004-04-30 2005-11-09 微软公司 实时文件系统修复
CN1605987A (zh) * 2004-11-17 2005-04-13 中兴通讯股份有限公司 一种多线程系统中实现实时监控各线程状态的方法
US20090144519A1 (en) * 2007-12-03 2009-06-04 Qualcomm Incorporated Multithreaded Processor with Lock Indicator
CN103942113A (zh) * 2013-11-21 2014-07-23 小米科技有限责任公司 系统重启原因的检测方法、装置及终端设备
CN104331463A (zh) * 2014-10-30 2015-02-04 深圳市锐明视讯技术有限公司 一种文件系统多线程实现的方法及装置
CN105511969A (zh) * 2015-11-25 2016-04-20 中国船舶工业系统工程研究院 一种跨进程的线程间进行互斥的方法

Similar Documents

Publication Publication Date Title
CN101039498B (zh) 带有分布式告警处理的基站系统及其告警处理方法
CN205068381U (zh) 一种用于轨道交通的安全计算机平台
CN101145946B (zh) 一种基于消息日志的容错集群系统和方法
WO2016188100A1 (zh) 信息系统故障场景信息收集方法及系统
CN101582787A (zh) 一种双机备份系统及备份方法
CN103064731A (zh) 一种提高消息队列系统性能的装置及其方法
CN103237059B (zh) 交通信息数据与命令交互方法
CN102467508A (zh) 提供数据库服务的方法及数据库系统
CN103995868A (zh) 面向分布式系统的全局事务管理器及事务处理方法
CN109274761A (zh) 一种nas集群节点、系统以及数据访问方法
CN104750596A (zh) 一种告警信息处理方法及服务子系统
CN102404139A (zh) 一种提高容错服务器应用层级容错性能的方法
CN107563713A (zh) 一种电子公文系统及其运行监控的方法
CN102075341A (zh) 一种主备同步方法及系统
CN103365963B (zh) 数据库稽核系统合规性快速检验方法
CN103984622B (zh) 基于Linux的GPON ONU设备的日志管理方法及装置
CN104734895B (zh) 业务监控系统及业务监控方法
CN107451257A (zh) 一种基于分布式文件系统的可维护性系统和方法
CN105871849A (zh) 一种防火墙系统架构
CN116302862B (zh) 一种微服务架构下监控告警方法和系统
CN103500140A (zh) 一种快速获知分布式集群节点失效的方法
CN103268567B (zh) 面向制造行业管理系统的高效大规模事件侦测与处理方法
CN107682166A (zh) 基于大数据的安全运维服务平台远程数据采集的实现方法
CN109120647A (zh) 一种安全交换系统
CN110350662A (zh) 一种变电站接地线实时监测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171208