CN114020399A - 一种交换机操作系统服务故障侦测方法及装置 - Google Patents

一种交换机操作系统服务故障侦测方法及装置 Download PDF

Info

Publication number
CN114020399A
CN114020399A CN202111151442.2A CN202111151442A CN114020399A CN 114020399 A CN114020399 A CN 114020399A CN 202111151442 A CN202111151442 A CN 202111151442A CN 114020399 A CN114020399 A CN 114020399A
Authority
CN
China
Prior art keywords
fault
service
operating system
switch operating
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202111151442.2A
Other languages
English (en)
Inventor
赖羿廷
廖伟杰
徐于晋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111151442.2A priority Critical patent/CN114020399A/zh
Publication of CN114020399A publication Critical patent/CN114020399A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45587Isolation or security of virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供了一种交换机操作系统服务故障侦测方法及装置,其中,该方法包括如下步骤:获取交换机操作系统中的系统服务信息;判断所述系统服务信息是否满足一种或多种服务故障条件,若所述系统服务信息满足一种或多种服务故障条件,根据所述系统服务信息所满足的服务故障条件确定系统服务的故障类型;根据所述系统服务的故障类型确定故障处理方法,执行所述故障处理方法。通过执行本发明,能够及时发现交换机系统中的系统服务存在的故障,并及时消除故障,而不是由交换机操作系统出现严重故障后才对故障进行处理,并且,对系统服务进行故障处理的过程对交换机操作系统产生的影响较小,提高了交换机操作系统的可靠性。

Description

一种交换机操作系统服务故障侦测方法及装置
技术领域
本发明涉及交换机操作系统领域,具体涉及一种交换机操作系统服务故障侦测及装置。
背景技术
Docker是一种软件平台,可让用户快速地建立、测试和部署应用程序,Docker将软件封装到名为容器的标准化单位,其中包含链接库、系统工具、程序代码和运行时间等执行软件所需的所有项目。在交换机系统架构下,每一项服务或是网络协议,分别运行于不同的docker容器上,docker容器间相互沟通合作实现一个成熟的网络交换机系统。
由于现有技术中无法及时感知和检测交换机操作系统中各系统服务的运行状态,当系统服务出现故障时无法及时解决,只有在系统服务的故障影响到交换机操作系统的正常运行时,才能发现故障的存在,但是当故障影响到交换机操作系统的正常运行后,对交换机操作系统的恢复过程时间较长,且会对数据的转发产生较大的影响。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中的无法及时发现并解决交换机操作系统中的系统服务的故障的缺陷,从而提供一种交换机操作系统服务故障侦测及装置。
本发明第一方面提供了一种交换机操作系统服务故障侦测方法,包括如下步骤:获取交换机操作系统中的系统服务信息;判断所述系统服务信息是否满足一种或多种服务故障条件,若所述系统服务信息满足一种或多种服务故障条件,根据所述系统服务信息所满足的服务故障条件确定系统服务的故障类型;根据所述系统服务的故障类型确定故障处理方法,执行所述故障处理方法。
可选地,在本发明提供的交换机操作系统服务故障侦测方法中,交换机操作系统中包括多种类型的系统服务信息,不同类型的系统服务信息分别对应有各自的故障侦测表,所述故障侦测表中包括至少一种服务故障条件,以及与所述服务故障条件相对应的故障类型;判断所述系统服务信息是否满足一种或多种服务故障条件,包括:将所述系统服务信息分别与对应的故障侦测表中的各服务故障条件做比较,判断所述系统服务信息是否满足一种或多种服务故障条件。
可选地,在本发明提供的交换机操作系统服务故障侦测方法中,交换机操作系统中包括多种系统服务,不同的系统服务满足相同的服务故障条件时,不同的系统服务对应的故障处理方法不同。
可选地,在本发明提供的交换机操作系统服务故障侦测方法中,在执行所述故障处理方法后,还包括:获取与所述故障类型对应的当前系统服务信息;判断所述当前系统服务信息是否满足所述故障类型对应的服务故障条件,若所述当前系统服务信息满足所述故障类型对应的服务故障条件,判定所述交换机操作系统故障,执行系统故障处理方法。
可选地,本发明提供的交换机操作系统服务故障侦测方法还包括:获取所述交换机操作系统的系统信息;若所述系统信息满足系统故障条件,判定所述交换机操作系统故障,执行系统故障处理方法。
可选地,在本发明提供的交换机操作系统服务故障侦测方法中,执行系统故障处理方法,包括:对所述交换机操作系统进行热重启;为热重启后的交换机操作系统配置二层MAC地址转发表和路由表,所述二层MAC地址转发表和路由表由所述交换机操作系统中的系统服务动态存储。
可选地,本发明提供的交换机操作系统服务故障侦测方法还包括:根据所述系统服务信息、故障类型、执行所述故障处理方法后的执行结果,形成错误信息;通过所述交换机操作系统中的标准网络协议向管理终端发送所述错误信息。
本发明第二方面提供了一种交换机操作系统服务故障侦测装置,包括:信息获取模块,用于获取交换机操作系统中的系统服务信息;条件判断模块,用于判断所述系统服务信息是否满足一种或多种服务故障条件,故障类型确定模块,若所述系统服务信息满足一种或多种服务故障条件,所述故障类型确定模块用于根据所述系统服务信息所满足的服务故障条件确定系统服务的故障类型;故障处理模块,用于根据所述系统服务的故障类型确定故障处理方法,执行所述故障处理方法。
本发明第三方面提供了一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,从而执行如本发明第一方面提供的交换机操作系统服务故障侦测方法。
本发明第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如本发明第一方面提供的交换机操作系统服务故障侦测方法。
本发明技术方案,具有如下优点:
本发明提供的交换机操作系统服务故障侦测方法及装置,在获取到交换机操作系统中的系统服务信息后,判断系统服务信息是否满足服务故障条件,当满足服务故障条件时,确定系统服务的故障类型,并根据故障类型确定合适的故障处理方法排除故障,通过执行本发明,能够及时发现交换机系统中的系统服务存在的故障,并及时消除故障,而不是由交换机操作系统出现严重故障后才对故障进行处理,并且,对系统服务进行故障处理的过程对交换机操作系统产生的影响较小,提高了交换机操作系统的可靠性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的交换机操作系统服务故障侦测方法的一个具体示例的流程图;
图2为本发明实施例中提供的交换机操作系统的一个具体示例的架构示意图;
图3为本发明实施例提供的交换机操作系统服务故障侦测装置的一个具体示例的原理框图;
图4为本发明实施例提供的计算机设备的一个具体示例的原理框图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本发明实施例提供了一种交换机操作系统服务故障侦测方法,如图1所示,包括如下步骤:
步骤S11:获取交换机操作系统中的系统服务信息。
在一可选实施例中,交换机操作系统中包括一个或多个系统服务,其中,路由服务为核心服务,还包括有其他服务,不同的服务用于执行不同的功能。在具体实施例中,可以只侦测其中一个或多个系统服务。
交换机操作系统中的系统服务的故障能够通过不同的系统服务信息所体现,因此,为了对交换机操作系统中的系统服务的故障进行侦测,所获取的系统服务信息包括多种:交换机操作系统中有关各系统服务的指令信息、交换机操作系统产生的系统日志中有关各系统服务的信息、文件系统中出现的core dump文件等。在对不同的系统服务的故障进行侦测时,可以选择性地获取与待侦测的系统服务关联性较强的系统服务信息。
步骤S12:判断系统服务信息是否满足一种或多种服务故障条件,若系统服务信息满足一种或多种服务故障条件,执行步骤S13、步骤S14,若系统服务信息不满足所有服务故障条件,则判定系统服务运行正常,不存在故障。
在一可选实施例中,服务故障条件是根据交换机操作系统中的系统服务可能发生的异常状况设定的,可以根据实际需求进行设置,将服务故障条件配置在交换机操作系统中,在对交换机操作系统中的系统服务进行侦测时,可以根据配置信息确定服务故障条件,从而结合服务故障条件对系统服务进行侦测。
步骤S13:根据系统服务信息所满足的故障条件确定系统服务的故障类型。
示例性地,当系统服务信息为交换机操作系统中有关系统服务的指令信息时,若待侦测系统服务无法接收指令,或,在较长的时间内未发出指令,则判定待侦测系统服务的故障类型为异常终止。
步骤S14:根据系统服务的故障类型确定故障处理方法,执行故障处理方法。
在一可选实施例中,当系统服务信息满足多条服务故障条件时,系统服务可能同时具备多种故障类型,此时需要根据各故障类型分别确定不同的故障处理方法,然后依次执行各故障处理方法。
在一可选实施例中,可以在对交换机操作系统处于运行状态下对交换机操作系统中的某一个或几个系统服务执行故障处理方法,故障处理过程对交换机操作系统的影响很小,可忽略不计。
本发明实施例提供的交换机操作系统服务故障侦测方法,在获取到交换机操作系统中的系统服务信息后,判断系统服务信息是否满足服务故障条件,当满足服务故障条件时,确定系统服务的故障类型,并根据故障类型确定合适的故障处理方法排除故障,通过执行本发明,能够及时发现交换机系统中的系统服务存在的故障,并及时消除故障,而不是由交换机操作系统出现严重故障后才对故障进行处理,并且,对系统服务进行故障处理的过程对交换机操作系统产生的影响较小,提高了交换机操作系统的可靠性。
在一可选实施例中,可以将故障类型分为不同的层级,通过层级的划分表征故障类型的严重性,示例性地,可以按照严重性从低到高的顺序将故障类型分为WARING,ERROR,CRITICAL三种层级。
当故障类型属于CRITICAL层级时,表示此类故障将会影响到系统的正常运作,例如,数据库停止服务、底层芯片沟通服务中断等都可划分到CRITICAL层级中;
当故障类型属于ERROR层级时,表示此类故障为一些不会影响系统运作的服务中断;
当故障类型属于WARNING层级时,表示此类故障为服务未中断,但从系统日志抓到一些运作异常的错误。
在一可选实施例中,当同一时间段内同时检测到交换机操作系统中存在多种不同的故障类型时,对各故障的处理顺序可以按照各故障所属的层级确定,所属层级越高,被处理的优先级越高。
在一可选实施例中交换机操作系统中包括多种类型的系统服务信息,不同类型的系统服务信息分别对应有各自的故障侦测表,故障侦测表中包括至少一种服务故障条件,以及与服务故障条件相对应的故障类型,在本发明实施例中,在执行上述步骤S12时,将系统服务信息分别与对应的故障侦测表中的各服务故障条件做比较,判断系统服务信息是否满足一种或多种服务故障条件。
示例性地,当系统服务信息包括交换机操作系统中有关各系统服务的指令信息、交换机操作系统产生的系统日志中有关各系统服务的信息、文件系统中出现的core dump文件时,可为上述三种不同类型的系统服务信息建立三种故障侦测表,在获取到交换机操作系统中有关各系统服务的指令信息时,将指令信息与该信息对应的故障侦测表中的各服务故障条件作比较;在获取到系统日志中有关系统服务的信息时,将信息与该信息对应的故障侦测表中的各服务故障条件作比较;在文件系统中出现core dump文件时,将coredump文件与对应的故障侦测信息表中的各服务故障条件做比较。
通过本发明实施例,为不同类型的系统服务信息分别建立故障侦测表,在获取到系统服务信息后,只需要将系统服务信息与对应故障侦测表中的服务故障条件作比较即可,参与比较的数据较少,提高了确定故障的效率。
在一可选实施例中,将所有类型的系统服务信息与故障类型整合到一个故障侦测表中时,能够结合多种系统服务信息共同建立与故障类型相对应的服务故障条件,例如,当与某一系统服务相关的指令信息和系统日志中与该系统服务有关的信息同时满足某一条件时,表征系统服务存在特定的故障,这种情况下,若将所有系统服务信息与故障类型整合到一个故障侦测表中时,能够在故障侦测表中构建完整的表征该故障的服务故障条件。
通过本发明实施例,能够更精准地侦测交换机操作系统中的系统服务存在的故障。
在一可选实施例中,交换机操作系统中包括多种系统服务,在本发明实施例提供的交换机操作系统服务故障侦测方法中,不同的系统服务满足相同的服务故障条件时,对应的故障处理方法不同。
示例性地,交换机操作系统中的系统服务包括路由服务,负责提供交换机操作系统路由的功能,若通过该系统服务的系统服务信息判定该系统服务的故障类型为异常终止,则执行的故障处理方法为迅速重启该系统服务,若经过数次重启失败,则重启交换机操作系统。
由于交换机操作系统的主要职能为路由,且重启路由服务并不会对该服务产生额外的不良影响,因此,在路由服务出现异常终止时需要立即重启该服务。当发生异常终止的系统服务为交换机操作系统中重要程度较低的服务,或,重启操作会对服务本身产生较大影响时,可以通过其他方式排除故障。
在一可选实施例中,在本发明实施例提供的交换机操作系统服务故障侦测方法中,在执行上述步骤S14后,还包括:
首先,获取与故障类型对应的当前系统服务信息。在本发明实施例中,当前系统服务信息是指对出现故障的系统服务执行故障处理操作后,再次获取的该系统服务的信息,通过当前系统服务信息判断系统服务的故障是否被解决。
然后,判断当前系统服务信息是否满足故障类型对应的服务故障条件,若当前系统服务信息满足故障类型对应的服务故障条件,判定交换机操作系统故障,执行系统故障处理方法;若当前系统服务信息不满足故障类型对应的服务故障条件,判定系统服务的故障被解决。
在本发明实施例中,参与判断的服务故障条件是指上述步骤S12中判定系统服务存在故障时,系统服务信息所满足的服务故障条件。
在一可选实施例中,可以在执行一次故障处理方法但系统服务的故障未被解决后,执行系统故障处理方法,也可以在执行多次故障处理方法但系统服务的故障仍未被解决后,再执行系统故障处理方法。
在一可选实施例中,本发明实施例提供的交换机操作系统服务故障侦测方法还包括:
获取交换机操作系统的系统信息,若系统信息满足系统故障条件,判定交换机操作系统故障,执行系统故障处理方法。
交换机操作系统的系统信息可以是根据系统日志等信息提取的,系统故障条件是根据能够影响交换机操作系统正常运行的状况定义的。
在一可选实施例中,执行系统故障处理方法的步骤具体包括:
首先,对交换机操作系统进行热重启。
然后,为热重启后的交换机操作系统配置二层MAC地址转发表和路由表,二层MAC地址转发表和路由表由交换机操作系统中的系统服务动态存储。
交换机操作系统中的系统服务会定时将交换机操作系统上的当前二层MAC地址转发表和路由表存入档案内,在对交换机操作系统进行热重启后,原本配置在交换机操作系统中的二层MAC地址转发表和路由表会被清除,因此,在完成对交换机操作系统进行热重启后,需要重新将预先存储的二层MAC地址转发表和路由表配置到交换机操作系统中,便于交换机操作系统根据二层MAC地址转发表和路由表完成执行路由功能。
在一可选实施例中,在执行上述步骤S14后,本发明实施例提供的交换机操作系统服务故障侦测方法还包括:
首先,根据系统服务信息、故障类型、执行故障处理方法后的执行结果,形成错误信息,在具体实施例中,可以按照一定顺序将系统服务信息、故障类型、执行故障处理方法后的执行结果进行排列,并进行格式转换,形成错误信息。
然后,通过交换机操作系统中的标准网络协议向管理终端发送错误信息。管理人员可以通过管理终端获取错误信息,并结合错误信息对交换机操作系统的运行状态进行分析。
在一具体实施例中,本发明实施例提供的交换机操作系统服务故障侦测方法可以应用于如图2所示的交换机操作系统中,交换机操作系统包括多个系统服务、注册单元、异常侦测单元、故障处理单元、主动通报单元,在注册单元中完成对各系统服务的注册后,异常侦测单元执行步骤S11-步骤S13完成对系统服务的异常侦测,故障处理执行上述步骤S14对系统服务中出现的故障进行处理,主动通报单元对系统服务的故障信息进行上报,交换机操作系统中各单元的详细执行过程参见上述实施例中对交换机操作系统服务故障侦测方法的描述,在此不再赘述。
本发明实施例还提供了一种交换机操作系统服务故障侦测装置,如图3所示,包括:
信息获取模块21,用于获取交换机操作系统中的系统服务信息,详细内容参见上述方法实施例中的描述,在此不再赘述。
条件判断模块22,用于判断系统服务信息是否满足一种或多种服务故障条件,详细内容参见上述方法实施例中的描述,在此不再赘述。
故障类型确定模块23,若系统服务信息满足一种或多种服务故障条件,故障类型确定模块23用于根据系统服务信息所满足的故障条件确定系统服务的故障类型,详细内容参见上述方法实施例中的描述,在此不再赘述。
故障处理模块24,用于根据系统服务的故障类型确定故障处理方法,执行故障处理方法,详细内容参见上述方法实施例中的描述,在此不再赘述。
本发明实施例提供的交换机操作系统服务故障侦测装置,在获取到交换机操作系统中的系统服务信息后,判断系统服务信息是否满足服务故障条件,当满足服务故障条件时,确定系统服务的故障类型,并根据故障类型确定合适的故障处理方法排除故障,通过执行本发明实施例,能够及时发现交换机系统中的系统服务存在的故障,并及时消除故障,而不是由交换机操作系统出现严重故障后才对故障进行处理,并且,对系统服务进行故障处理的过程对交换机操作系统产生的影响较小,提高了交换机操作系统的可靠性。
在一可选实施例中,交换机操作系统中包括多种类型的系统服务信息,不同类型的系统服务信息分别对应有各自的故障侦测表,故障侦测表中包括至少一种服务故障条件,以及与服务故障条件相对应的故障类型,在本发明实施例中,条件判断模块22用于将系统服务信息分别与对应的故障侦测表中的各服务故障条件做比较,判断系统服务信息是否满足一种或多种服务故障条件,详细内容参见上述方法实施例中的描述,在此不再赘述。
在一可选实施例中,在本发明实施例提供的交换机操作系统服务故障侦测装置中,不同的系统服务满足相同的服务故障条件时,不同的系统服务对应的故障处理方法不同,详细内容参见上述方法实施例中的描述,在此不再赘述。
在一可选实施例中,本发明实施例提供的交换机操作系统服务故障侦测装置还包括:
当前信息获取模块,用于获取与故障类型对应的当前系统服务信息,详细内容参见上述方法实施例中的描述,在此不再赘述。
检查模块,用于判断当前系统服务信息是否满足故障类型对应的服务故障条件,详细内容参见上述方法实施例中的描述,在此不再赘述。
故障升级处理模块,若当前系统服务信息满足故障类型对应的服务故障条件,故障升级处理模块用于判定交换机操作系统故障,执行系统故障处理方法,详细内容参见上述方法实施例中的描述,在此不再赘述。
在一可选实施例中,本发明实施例提供的交换机操作系统服务故障侦测装置还包括:
系统信息获取模块,用于获取交换机操作系统的系统信息,详细内容参见上述方法实施例中的描述,在此不再赘述。
故障升级处理模块,若系统信息满足系统故障条件,故障升级处理模块用于判定交换机操作系统故障,执行系统故障处理方法。
在一可选实施例中,本发明实施例提供的交换机操作系统服务故障侦测装置中,故障升级处理模块具体包括:
热重启子模块,用于对交换机操作系统进行热重启,详细内容参见上述方法实施例中的描述,在此不再赘述。
转发信息表配置子模块,用于为热重启后的交换机操作系统配置二层MAC地址转发表和路由表,二层MAC地址转发表和路由表由交换机操作系统中的系统服务动态存储,详细内容参见上述方法实施例中的描述,在此不再赘述。
在一可选实施例中,本发明实施例提供的交换机操作系统服务故障侦测装置还包括:
错误信息生成模块,用于根据系统服务信息、故障类型、执行故障处理方法后的执行结果,形成错误信息,详细内容参见上述方法实施例中的描述,在此不再赘述。
错误信息上报模块,用于通过交换机操作系统中的标准网络协议向管理终端发送错误信息,详细内容参见上述方法实施例中的描述,在此不再赘述。
本发明实施例提供了一种计算机设备,如图4所示,该计算机设备主要包括一个或多个处理器31以及存储器32,图4中以一个处理器31为例。
该计算机设备还可以包括:输入装置33和输出装置34。
处理器31、存储器32、输入装置33和输出装置34可以通过总线或者其他方式连接,图4中以通过总线连接为例。
处理器31可以为中央处理器(Central Processing Unit,CPU)。处理器31还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。存储器32可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据交换机操作系统服务故障侦测装置的使用所创建的数据等。此外,存储器32可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器32可选包括相对于处理器31远程设置的存储器,这些远程存储器可以通过网络连接至交换机操作系统服务故障侦测装置。输入装置33可接收用户输入的计算请求(或其他数字或字符信息),以及产生与交换机操作系统服务故障侦测装置有关的键信号输入。输出装置34可包括显示屏等显示设备,用以输出计算结果。
本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储计算机指令,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的交换机操作系统服务故障侦测方法。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-StateDrive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (10)

1.一种交换机操作系统服务故障侦测方法,其特征在于,包括如下步骤:
获取交换机操作系统中的系统服务信息;
判断所述系统服务信息是否满足一种或多种服务故障条件,
若所述系统服务信息满足一种或多种服务故障条件,根据所述系统服务信息所满足的服务故障条件确定系统服务的故障类型;
根据所述系统服务的故障类型确定故障处理方法,执行所述故障处理方法。
2.根据权利要求1所述的交换机操作系统服务故障侦测方法,其特征在于,所述交换机操作系统中包括多种类型的系统服务信息,不同类型的系统服务信息分别对应有各自的故障侦测表,所述故障侦测表中包括至少一种服务故障条件,以及与所述服务故障条件相对应的故障类型;
判断所述系统服务信息是否满足一种或多种服务故障条件,包括:
将所述系统服务信息分别与对应的故障侦测表中的各服务故障条件做比较,判断所述系统服务信息是否满足一种或多种服务故障条件。
3.根据权利要求1或2所述的交换机操作系统服务故障侦测方法,其特征在于,所述交换机操作系统中包括多种系统服务,
不同的系统服务满足相同的服务故障条件时,对应的故障处理方法不同。
4.根据权利要求1所述的交换机操作系统服务故障侦测方法,其特征在于,在执行所述故障处理方法后,还包括:
获取与所述故障类型对应的当前系统服务信息;
判断所述当前系统服务信息是否满足所述故障类型对应的服务故障条件,
若所述当前系统服务信息满足所述故障类型对应的服务故障条件,判定所述交换机操作系统故障,执行系统故障处理方法。
5.根据权利要求1所述的交换机操作系统服务故障侦测方法,其特征在于,还包括:
获取所述交换机操作系统的系统信息;
若所述系统信息满足系统故障条件,判定所述交换机操作系统故障,执行系统故障处理方法。
6.根据权利要求4或5所述的交换机操作系统服务故障侦测方法,其特征在于,执行系统故障处理方法,包括:
对所述交换机操作系统进行热重启;
为热重启后的交换机操作系统配置二层MAC地址转发表和路由表,所述二层MAC地址转发表和路由表由所述交换机操作系统中的系统服务动态存储。
7.根据权利要求1所述的交换机操作系统服务故障侦测方法,其特征在于,还包括:
根据所述系统服务信息、故障类型、执行所述故障处理方法后的执行结果,形成错误信息;
通过所述交换机操作系统中的标准网络协议向管理终端发送所述错误信息。
8.一种交换机操作系统服务故障侦测装置,其特征在于,包括:
信息获取模块,用于获取交换机操作系统中的系统服务信息;
条件判断模块,用于判断所述系统服务信息是否满足一种或多种服务故障条件,
故障类型确定模块,若所述系统服务信息满足一种或多种服务故障条件,所述故障类型确定模块用于根据所述系统服务信息所满足的服务故障条件确定系统服务的故障类型;
故障处理模块,用于根据所述系统服务的故障类型确定故障处理方法,执行所述故障处理方法。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,从而执行如权利要求1-7中任一项所述的交换机操作系统服务故障侦测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如权利要求1-7中任一项所述的交换机操作系统服务故障侦测方法。
CN202111151442.2A 2021-09-29 2021-09-29 一种交换机操作系统服务故障侦测方法及装置 Withdrawn CN114020399A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111151442.2A CN114020399A (zh) 2021-09-29 2021-09-29 一种交换机操作系统服务故障侦测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111151442.2A CN114020399A (zh) 2021-09-29 2021-09-29 一种交换机操作系统服务故障侦测方法及装置

Publications (1)

Publication Number Publication Date
CN114020399A true CN114020399A (zh) 2022-02-08

Family

ID=80055282

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111151442.2A Withdrawn CN114020399A (zh) 2021-09-29 2021-09-29 一种交换机操作系统服务故障侦测方法及装置

Country Status (1)

Country Link
CN (1) CN114020399A (zh)

Similar Documents

Publication Publication Date Title
CN110178121B (zh) 一种数据库的检测方法及其终端
JP2017517060A (ja) 障害処理方法、関連装置、およびコンピュータ
CN114884838B (zh) Kubernetes组件的监控方法及服务器
US20210105179A1 (en) Fault management method and related apparatus
CN113608908B (zh) 服务器故障处理方法、系统、设备及可读存储介质
CN112068935A (zh) kubernetes程序部署监控方法、装置以及设备
CN114528350A (zh) 集群脑裂的处理方法、装置、设备及可读存储介质
CN112486718B (zh) 数据库故障自动切换方法、装置和计算机存储介质
CN116319421A (zh) 基于云平台的故障检测方法、装置、故障检测系统及介质
CN111966520A (zh) 数据库高可用切换方法、设备及系统
CN114020399A (zh) 一种交换机操作系统服务故障侦测方法及装置
CN113778763B (zh) 一种三方接口服务故障智能切换方法及系统
CN116719657A (zh) 一种固件故障日志生成方法、装置、服务器及可读介质
CN115964218A (zh) 高速串行计算机扩展总线设备故障的识别方法及装置
CN112286797B (zh) 一种服务监控方法、装置、电子设备及存储介质
CN109408123B (zh) 一种配置文件重新加载的方法及装置
CN114217925A (zh) 一种实现异常自动重启的业务程序运行监控方法及系统
CN107783855B (zh) 虚拟网元的故障自愈控制装置及方法
CN110795291A (zh) 一种数据库处理方法及装置
CN118312340A (zh) 虚拟操作系统os故障分析方法、装置及相关设备
CN115484267B (zh) 多集群部署处理方法、装置、电子设备和存储介质
CN115048244B (zh) 一种服务器的硬件修复方法、系统、计算机设备及介质
CN106339285A (zh) 一种linux系统意外重启的分析方法
US7305497B2 (en) Performing resource analysis on one or more cards of a computer system wherein a plurality of severity levels are assigned based on a predetermined criteria
CN115080337A (zh) 数据监控方法、装置、系统、服务器及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20220208