CN105512000A - 一种操作系统异常信息收集方法、装置及计算机 - Google Patents

一种操作系统异常信息收集方法、装置及计算机 Download PDF

Info

Publication number
CN105512000A
CN105512000A CN201410495257.9A CN201410495257A CN105512000A CN 105512000 A CN105512000 A CN 105512000A CN 201410495257 A CN201410495257 A CN 201410495257A CN 105512000 A CN105512000 A CN 105512000A
Authority
CN
China
Prior art keywords
operating system
abnormal information
information
abnormal
triggering command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410495257.9A
Other languages
English (en)
Other versions
CN105512000B (zh
Inventor
蒋彪
王亮
蔡衢
谈虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201410495257.9A priority Critical patent/CN105512000B/zh
Priority to PCT/CN2014/091189 priority patent/WO2015131549A1/zh
Publication of CN105512000A publication Critical patent/CN105512000A/zh
Application granted granted Critical
Publication of CN105512000B publication Critical patent/CN105512000B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种操作系统异常信息收集方法、装置及计算机,解决收集异常信息不准确,不具备通用性且无法收集详细信息的问题。其中所述操作系统异常信息收集方法,包括:获取原始操作系统中预先设定的新操作系统的预设配置信息,新操作系统是原始操作系统所运行的计算机的物理内存中预先存储的一操作系统内核;获取在原始操作系统异常时,所述计算机的电源按键被按下所触发的原始操作系统进程中断的触发指令;根据触发指令,按照预设配置信息对原始操作系统的异常信息进行收集,并存储异常信息到指定的存储介质中。这样不需额外硬件设备,也不需特殊的硬件设计支持,具有很强的通用性,并能有效增强系统的可维护性,有效的收集异常信息。

Description

一种操作系统异常信息收集方法、装置及计算机
技术领域
本发明涉及计算机操作系统技术领域,特别是一种操作系统异常信息收集方法、装置及计算机。
背景技术
随着计算机应用程序的日渐复杂和数量剧增,而作为这些应用程序的运行环境,操作系统的运行压力也随之与日俱增,加上支撑操作系统运行的硬件环境也日趋复杂,在实际应用中,系统死机故障经常发生,导致系统死机的原因有很多,相应的外在表现也不尽相同,其中如下系统死机故障是非常典型的一种类型,此类系统死机故障发生时,具有如下表现:
1)本机接键盘、鼠标无响应或者无法正常登陆。
2)无法通过远程控制工具登陆问题主机。
3)系统日志无法记录到有效的故障信息
4)操作系统还能响应中断,但无法正常处理其它任何事务。
导致此类的死机故障的原因可能为:
1)操作系统发生死锁导致无法正常调度或处理其它事务。
2)操作系统负荷过重导致系统挂死(比如内存不足)。
3)硬盘硬件或固件故障导致操作系统挂死。此时由于硬盘故障导致系统I/O(输入/输出)挂死,无法记录日志,同时也无法正常登陆系统。
此时的故障环境犹如一个孤岛,无法获知系统的准确运行状态,现有手段无法收集到有效信息,用于此类故障的分析定位。
针对此类系统死机故障,现有的异常收集方法如:本机接键盘和鼠标登陆系统收集信息、通过远程控制工具登陆系统收集信息、通过操作系统自身的日志功能收集信息,在这种情况下都无法收集到有效的故障信息。
此外,可以在本机接显示器,通过显示器来收集系统的异常打印信息,但是存在如下问题:
1)在此类故障发生时,多数情况下,由于显示器显示相关的处理流程太长,导致显示器也无法正常记录到异常信息。
2)如果显示器休眠或者系统当前控制台处于图形模式下,显示器也无法记录异常信息。
3)即使在文本模式下且显示器不休眠,显示器对应的控制台能记录到异常信息,但由于此时无法滚屏,记录的信息也严重不足,通常不足以定位此类死机故障。
另外一种可用的信息收集方法为配置一个专业化的监测设备,比如串口设备,用于实时捕获被监测设备的异常信息。但是,该方法由于额外配置了监测设备,因此不具备通用性;同时,此类设备收集的信息也比较有限,只能收集到故障发生前的系统打印信息,无法收集更详细的信息,比如系统故障时的内存镜像信息等,不利于问题的分析定位。
发明内容
本发明的目的在于提供一种操作系统异常信息收集方法、装置及计算机,解决收集异常信息不准确,不具备通用性且无法收集详细信息的问题。
为了解决上述技术问题,本发明实施例提供的一种操作系统异常信息收集方法,其中,包括:
获取原始操作系统中预先设定的新操作系统的预设配置信息,所述新操作系统是所述原始操作系统所运行的计算机的物理内存中预先存储的一操作系统内核;
获取在所述原始操作系统异常时,所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令;
根据所述触发指令,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的存储介质中。
进一步的,获取在所述原始操作系统异常时,所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令的步骤包括:
获取通过所述电源按键触发的中断上报到基本输入输出系统BIOS的系统控制中断SCI中的触发指令。
进一步的,获取通过所述电源按键触发的中断上报到基本输入输出系统BIOS的系统控制中断SCI中的触发指令的步骤包括:
在原始操作系统异常且当前电源按键支持所述ACPI时,获取通过电源按键触发的中断上报到所述BIOS的所述SCI中的触发指令。
进一步的,获取在所述原始操作系统异常时,所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令的步骤包括:
在所述原始系统异常时且当前电源按键不支持ACPI时,直接获取所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令。
进一步的,根据所述触发指令,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的存储介质中的步骤包括:
根据所述触发指令,同步中断所述原始操作系统中的程序运行并获取一启动所述新操作系统,收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集。
进一步的,根据所述触发指令,同步中断所述原始操作系统中的程序运行并获取一启动所述新操作系统收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集的步骤包括:
根据所述触发指令,同步中断所述原始操作系统中的程序运行,
控制指针指向所述新操作系统并启动所述新操作系统,收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集。
进一步的,根据所述触发指令,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的存储介质中的步骤包括:
根据所述触发指令,获取到所述预设配置信息的写入方式为裸写或者通过文件系统接口写入;
按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的本地的存储介质中。
进一步的,根据所述触发指令,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的存储介质中的步骤包括:
根据所述触发指令,获取到所述预设配置信息的预先启动预设远端主机;
按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到预先启动预设远端主机的存储介质中。
其中,所述的操作系统异常信息收集方法还包括:根据所述预设配置信息,控制关机或者复位。
进一步的,所述预设配置信息包括:控制系统异常信息收集功能启动/关闭的信息及信息收集的时限信息。
为了解决上述技术问题,本发明实施例还提供一种操作系统异常信息收集装置,其中,包括:
第一获取模块,用于获取原始操作系统中预先设定的新操作系统的预设配置信息,所述新操作系统是所述原始操作系统所运行的计算机的物理内存中预先存储的一操作系统内核;
第二获取模块,用于获取在所述原始操作系统异常时,所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令;
处理模块,用于根据所述触发指令,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的存储介质中。
进一步的,所述第二获取模块包括:
第一获取子模块,用于获取通过所述电源按键触发的中断上报到基本输入输出系统BIOS的系统控制中断SCI中的触发指令。
进一步的,所述第一获取子模块包括:
获取单元,用于在原始操作系统异常且当前电源按键支持所述ACPI时,获取通过电源按键触发的中断上报到所述BIOS的所述SCI中的触发指令。
进一步的,所述第二获取模块包括:
第二获取子模块,用于在所述原始系统异常时且当前电源按键不支持ACPI时,直接获取所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令。
进一步的,所述处理模块的步骤包括:
第一处理子模块,用于根据所述触发指令,同步中断所述原始操作系统中的程序运行并获取一启动所述新操作系统,收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集。
进一步的,所述第一处理子模块包括:
处理单元,用于根据所述触发指令,同步中断所述原始操作系统中的程序运行,控制指针指向所述新操作系统并启动所述新操作系统,收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集。
进一步的,所述处理模块包括:
第二获取子模块,用于根据所述触发指令,获取到所述预设配置信息的写入方式为裸写或者通过文件系统接口写入;
第二处理子模块,用于按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的本地的存储介质中。
进一步的,所述处理模块包括:
第三获取子模块,用于根据所述触发指令,获取到所述预设配置信息的预先启动预设远端主机;
第三处理子模块,用于按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到预先启动预设远端主机的存储介质中。
其中,所述的操作系统异常信息收集装置还包括:控制模块,用于根据所述预设配置信息,控制关机或者复位。
进一步的,所述预设配置信息包括:控制系统异常信息收集功能启动/关闭的信息及信息收集的时限信息。
为了解决上述技术问题,本发明实施例还提供一种计算机,包括在所运行的计算机的物理内存中预先存储的一操作系统内核,所述操作系统内核具有如上述的操作系统异常信息收集装置。
本发明的上述技术方案的有益效果如下:
本发明的方案中,在原始操作系统发生异常后,通过硬件电源按键触发中断,硬件触发中断上报到新操作系统中,然后新操作系统获取到硬件触发中断的触发指令,按照预设配置信息进行异常信息的收集及存储,从而完成异常信息的收集。这样通过通用硬件电源按键来触发另一预先配置好的新操作系统完成异常信息的有效收集,用于后续的故障分析和定位,不需额外硬件设备,也不需特殊的硬件设计支持,具有很强的通用性,并能有效增强系统的可维护性,有效地收集异常信息。
附图说明
图1为本发明实施例的操作系统异常信息收集方法进行实施的步骤示意图;
图2为本发明实施例在支持ACPI的环境中电源按键中断处理的步骤示意图;
图3为本发明实施例在不支持ACPI的环境中电源按键中断处理的步骤示意图;
图4为本发明实施例的系统异常信息收集的工作流程示意图;
图5为本发明实施例的通过本地存储的工作流程示意图;
图6为本发明实施例通过网络存储的工作流程示意图;
图7为本发明实施例操作系统异常信息收集方法的实现流程的步骤流程图;
图8为本发明实施例的操作系统异常信息收集装置的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
为了供下文更详细的描述容易参考,需要说明的是传统硬件平台中自带的电源按键通常的用途是长按电源按键可实现关机功能,该功能通常由硬件实现,软件无法截获处理;而本方案的传统硬件平台中自带的电源按键通常的用途是短按电源按键可以产生中断,然后由软件进行相关中断,实现软件关机操作,通常是先停止系统中的各种进程、然后同步文件系统,最后发起关机操作。
本发明针对现有技术中系统死机无法收集到有效故障的异常信息,同时传统的收集方法不具备通用性,无法收集详细的信息的问题,提供一种操作系统异常信息收集方法、装置及计算机,通过预先设定的新操作系统的预设配置信息,在原始操作系统发生异常时,通过通用硬件触发新操作系统,由新操作系统完成异常信息的收集,不需额外硬件设备,也不需特殊的硬件设计支持,即可实现异常信息的有效收集,具有很强的通用性,并能有效增强系统的可维护性。
如图1至图8所示,本发明实施例的操作系统异常信息收集方法,包括:
步骤101,获取原始操作系统中预先设定的新操作系统的预设配置信息,所述新操作系统是所述原始操作系统所运行的计算机的物理内存中预先存储的一操作系统内核;
其中所述预先配置信息包括:所述预设配置信息包括:控制系统异常信息收集功能启动/关闭的信息、信息收集的时限信息,配置文件、系统或库函数调用和系统启动参数。通过用户配置,控制系统异常信息收集过程,同时能提升本发明提出方法的灵活性。向用户提供的接口可以采用多种方式,
配置内容包括但不限于:a)是否开启基于电源按键的系统异常信息收集功能;b)信息收集完成后的动作;c)信息收集的时限;d)为用于收集信息的新内核保留的物理内存的起始地址和大小;e)系统异常信息存储方式等。
具体的,a)是否开启基于电源按键的系统异常信息收集功能。开启后启用相关功能,关闭时,仍按系统原有电源按键流程处理,通过此开关能提高该功能的灵活性,可以根据实际情况,由用户按需决定是否开启。
b)信息收集完成后的动作,可选动作为关机或重启。通常情况下,电源按键的默认操作最终都是发起关机,但在需要提高业务连续性时,可能会需要在系统出现异常时,能自动恢复业务,所以,这里提供关机和重启的选项,供用户选择。
c)信息收集的时限。为提高业务的连续性,尽量减少业务中断的时间,提供此配置选项,供用户控制系统异常时业务中断时间,如果指定时间内信息未收集完成,则直接发起关机或复位。
d)用于收集信息的新内核保留的物理内存的起始地址和大小。用于指定新内核加载的物理内存区域。由于不同硬件环境的物理地址空间分布可能不同,同时,不同的操作系统内核占用的内存大小也可能不同,提供此配置项,能使本发明更灵活、更具通用性。
e)系统异常信息存储方式。可选的方式如本地存储和网络存储方式。
本地存储意为将信息保存到本机环境中的存储介质中,常见的如本地磁盘,同时,写磁盘的具体方式也可有多种选择,比如裸写或者通过文件系统写的方式,这些均可通过配置决定。
其中所述电源按键被按下是指短按电源按键,所述短是指大于一秒小于三秒的时间长度,通常是根据需求进行设定的,有别于现有技术的按键长度且能实现本发明实施例的触发中断,上报到新操作系统的技术效果均属于本发明实施例的保护范围。
其中所述物理内存中预先保留一段区域,用于加载用作收集信息的新内存,在原始操作系统启动后,将新内核加载到保留的内存区域中,然后在原始操作系统异常后,跳转到新内核运行,在新内核中完成信息收集。
步骤102,获取在所述原始操作系统异常时,所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令;
其中电源按键被按下所触发的所述原始操作系统进程中断的流程分为两种情况,如果当前环境支持ACPI(AdvancedConfigurationandPowerManagementInterface的简写,高级配置和电源管理接口),则电源按键触发的中断将先上报到BIOS(BasicInputOutputSystem的简写,基本输入输出系统),然后由BIOS通过SCI(SystemControlInterrupt的简写,系统控制中断。专门用于ACPI电源管理的一个IRQ(InterruptRequest的简写,中断请求)中断的方式上报到操作系统;如果当前环境不支持ACPI,则中断直接上报给操作系统。
其中通过预先注册的中断服务程序可以获取所述的触发指令,进行信息的收集。
步骤103,根据所述触发指令,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的存储介质中。
通过步骤101获取到相关的预设配置信息后,在原始操作系统异常时,然后通过步骤102获取到触发电源按键的触发指令,触发新操作系统,再然后经过步骤103收集异常信息的存储所述异常信息到指定的存储介质中。这样在原始系统异常信息收集工作不能依赖于原有的系统日志模块进行异常信息收集时,通过新操作系统的调度保证在原始系统异常时,能有效收集到需要的信息,并且通过硬件的电源按键中断原始操作系统触发新操作系统具有通用性,有效收集到关键信息,对此类故障的分析定位有极大的帮助。
获取中断的触发信令的方式可以设置为多种,如通过其他介质进行获取,因此本发明实施例的操作系统异常信息收集方法中,步骤102包括:
步骤120,获取通过所述电源按键触发的中断上报到基本输入输出系统BIOS的系统控制中断SCI中的触发指令。
在电源按键具备特定的条件时才能通过其他介质,让新操作系统获取触发信令,因此本发明实施例的操作系统异常信息收集方法中,步骤102包括:
步骤121,在原始操作系统异常且当前电源按键支持所述ACPI时,获取通过电源按键触发的中断上报到所述BIOS的所述SCI中的触发指令。
为了保证中断原始操作系统的有效性,触发指令的准确中断原始操作系统,触发新操作系统的开启来收集系统异常信息。
如图2所示,本发明的具体的电源按键支持ACPI时实现流程的举例如下。
步骤21,用户手工短按电源按键,触发中断。
步骤22,根据ACPI规范,相应中断上报给BIOS。
步骤23,BIOS进行相应处理后,向新操作系统上报SCI中断。
步骤24,新操作系统在SCI中断流程中进行相应处理。
本发明的又一实施例的操作系统异常信息收集方法中,步骤102包括:步骤122,在所述原始系统异常时且当前电源按键不支持ACPI时,直接获取所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令。
如果不支持ACPI时,直接获取触发指令,节约了触发新操作系统的时间,同时提高了该系统异常信息收集的灵活性,可以通过多种方式实现触发。
如图3所示,本发明的具体的电源按键不支持ACPI的实现流程的举例如下。
步骤31,在新操作系统中预先注册电源按键触发的中断的中断向量和中断服务程序。
步骤32,用户手工短按电源按键,触发中断。
步骤33,新操作系统截获相应中断,并在相应的中断服务程序中进行相应处理。
本发明的又一实施例的操作系统异常信息收集方法中,步骤103的步骤包括:
步骤131,根据所述触发指令,同步中断所述原始操作系统中的程序运行并获取一启动所述新操作系统,收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集。
具体的,本发明的又一实施例的操作系统异常信息收集方法中,步骤131包括:步骤1311,根据所述触发指令,同步中断所述原始操作系统中的程序运行,控制指针指向所述新操作系统并启动所述新操作系统,收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集。
如图4所示,本发明的具体的收集过程的实现流程的举例如下。
步骤41,原始操作系统启动时,保留一段物理内存,用于存放收集信息用的新内核。新内核中,包括所有跟异常信息收集相关的硬件驱动和功能模块,比如:如果最终需要使用硬盘来保存异常信息的话,则新内核中需要包括相应的硬盘驱动,同理,如果需要通过网络来保存异常信息的话,则新内核中需要包括相应的网卡驱动。此外,保留的物理内存区域的起始地址和大小可以配置。
步骤42,原始操作系统启动后,将用于收集信息的新内核加载到之前保留的物理内存中。
步骤43,在原始操作系统异常后,由用户手工通过短按电源按键触发相应中断。然后由新操作系统截获相应的中断。
步骤44,在相应的中断处理流程中,进行同步处理,比如向所有其它的CPU发送核间中断,通知它们停止运行。
步骤45,使当前指令指针跳转到之前加载到保留内存中的内核的起始地址,从而实现加载新内核运行。
步骤46,新内核启动后,收集系统异常信息,比如系统的内存镜像信息,并将其存储到指定的存储介质上,比如通过本地磁盘或者网络。
本发明的又一实施例的操作系统异常信息收集方法中,步骤103包括:步骤311,根据所述触发指令,获取到所述预设配置信息的写入方式为裸写或者通过文件系统接口写入;
步骤312,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的本地的存储介质中。
本地存储方便快捷,节约时间,方便实现系统异常信息的收集。
如图5所示,本发明的具体存储到本地的实现流程的举例如下。
步骤51,预先通过配置控制模块,配置信息存储方式为本地存储,同时设置具体的写入方式:裸写或通过文件系统接口。
步骤52,用于收集原始操作系统异常信息的新内核中包含本地存储相应的硬件驱动,和文件系统模块支持,并加载到指定的内存区域。
步骤53,原始操作系统异常后,在电源按键的中断处理流程中,跳转到新内核运行,新内核启动后加载相应的驱动,并创建相应的设备文件。在完成系统异常信息收集后,调用新操作系统提供的相应接口(裸写或文件系统),将信息写入指定存储介质。
本发明的又一实施例的操作系统异常信息收集方法中,步骤103包括:
步骤313,根据所述触发指令,获取到所述预设配置信息的预先启动预设远端主机;
其中通过预先启动预设远端主机实现通过网络存储的方式,需要另一台主机作为网络存储的服务端,本机作为客户端。将信息通过网络保存到远程主机上的存储介质中。网络传输方式上也可有多种选择,如:ftp(FileTransferProtocol的简称,文件传输协议)、nfs(NetworkFileSystem的简称,网络文件系统)、httpd(全球网服务器软件、服务器,Apache超文本传输协议(HTTP)服务器的主程序方式等,相关配置包括网络传输方式,网络存储服务端的IP地址及相关路由信息等。
步骤314,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到预先启动预设远端主机的存储介质中。
提供多种信息存储方式,提升操作系统异常信息收集方法的可用性和灵活性。
如图6所示,本发明的具体存储到本地的实现流程的举例如下。
步骤61,预先通过配置控制模块,配置信息存储方式为网络存储,设置具体的网络传输方式:ftp、nfs或httpd,同时设置网络存储服务端的IP地址及相关路由信息等。
步骤62,预先配置并启动另一台主机的相关服务(ftp、nfs或httpd),作为网络存储的服务端。
步骤63,用于收集原始操作系统异常信息的新内核中包含网络存储使用的网卡硬件驱动,和相应的客户端模块支持,并加载到指定的内存区域。
步骤64,原始操作系统异常后,在电源按键的中断处理流程中,跳转到新内核运行,新内核启动后加载相应的驱动,并创建相应的设备文件。在完成系统异常信息收集后,调用相应网络传输方式的客户端接口,将信息写入预设远端主机的存储介质中。
本发明的又一实施例的操作系统异常信息收集方法中,还包括:
根据所述预设配置信息,控制关机或者复位。
通常情况下,电源按键的默认操作最终都是发起关机,但在需要提高业务连续性时,可能会需要在系统出现异常时,能自动恢复业务,所以,这里提供关机和重启的选项,供用户选择。
如图7所示,本发明的具体的操作系统异常信息收集方法的实现流程的举例如下。
步骤71,通过配置控制模块,预先设置好相关配置,控制原始操作系统异常信息收集过程。
步骤72,原始操作系统异常后,用户通过手工短按电源按键,触发中断。
步骤73,中断上报到新操作系统,由新操作系统中预先注册的中断服务程序处理。
步骤74,在中断服务程序中进行原始操作系统异常信息收集。
步骤75,将收集到的信息通过信息存储模块,存储到指定的存储介质中。
步骤76,根据配置控制模块中的配置,发起关机或复位。
如图8所示,相应的,为了解决上述技术问题,本发明实施例还提供一种操作系统异常信息收集装置,其中,包括:
第一获取模块801,用于获取原始操作系统中预先设定的新操作系统的预设配置信息,所述新操作系统是所述原始操作系统所运行的计算机的物理内存中预先存储的一操作系统内核;
第二获取模块802,用于获取在所述原始操作系统异常时,所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令;
处理模块803,用于根据所述触发指令,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的存储介质中。
其中此处存储异常信息可以通过信息存储模块完成。
通过第一获取模块801获取到相关的预设配置信息后,在原始操作系统异常时,第二获取模块802通过获取到触发电源按键的触发指令,触发新操作系统,然后再经过处理模块803,收集异常信息的存储所述异常信息到指定的存储介质中。这样在原始系统异常信息收集工作不能依赖于原有的系统日志模块进行异常信息收集时,通过所述原始操作系统所运行的计算机的物理内存中预先存储的一操作系统内核,通过新操作系统的调度保证在原始系统异常时,能有效收集到需要的信息,并且通过硬件的电源按键中断原始操作系统触发新操作系统具有通用性,有效收集到关键信息,对此类故障的分析定位有极大的帮助。
本发明的又一实施例的操作系统异常信息收集装置中,所述第二获取模块802包括:
第一获取子模块,用于获取通过所述电源按键触发的中断上报到基本输入输出系统BIOS的系统控制中断SCI中的触发指令。
本发明的又一实施例的操作系统异常信息收集装置中,所述第一获取子模块包括:
获取单元,用于在原始操作系统异常且当前电源按键支持所述ACPI时,获取通过电源按键触发的中断上报到所述BIOS的所述SCI中的触发指令。
本发明的又一实施例的操作系统异常信息收集装置中,所述第二获取模块802包括:
第二获取子模块,用于在所述原始系统异常时且当前电源按键不支持ACPI时,直接获取所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令。
本发明的又一实施例的操作系统异常信息收集装置中,所述处理模块803的步骤包括:
第一处理子模块,用于根据所述触发指令,同步中断所述原始操作系统中的程序运行并获取一启动所述新操作系统,收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集。
本发明的又一实施例的操作系统异常信息收集装置中,所述第一处理子模块包括:
处理单元,用于根据所述触发指令,同步中断所述原始操作系统中的程序运行,控制指针指向所述新操作系统并启动所述新操作系统,收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集。
本发明的又一实施例的操作系统异常信息收集装置中,所述处理模块803包括:
第二获取子模块,用于根据所述触发指令,获取到所述预设配置信息的写入方式为裸写或者通过文件系统接口写入;
第二处理子模块,用于按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的本地的存储介质中。
本发明的又一实施例的操作系统异常信息收集装置中,所述处理模块803包括:
第三获取子模块,用于根据所述触发指令,获取到所述预设配置信息的预先启动预设远端主机;
第三处理子模块,用于按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到预先启动预设远端主机的存储介质中。
本发明的又一实施例的操作系统异常信息收集装置中还包括:控制模块,用于根据所述预设配置信息,控制关机或者复位。
本发明的又一实施例的操作系统异常信息收集装置中,所述预设配置信息包括:控制系统异常信息收集功能启动/关闭的信息及信息收集的时限信息。
需要说明的是,本发明提供的装置是应用上述操作系统异常信息收集方法的装置,则上述操作系统异常信息收集方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
为了解决上述技术问题,本发明实施例还提供一种计算机,包括在所运行的计算机的物理内存中预先存储的一操作系统内核,所述操作系统内核具有如上述的操作系统异常信息收集装置。
相应的由于本发明实施例的操作系统异常信息收集装置,应用于计算机,因此,本发明实施例提供的计算机,其中,上述操作系统异常信息收集装置的所述实现实施例均适用于该计算机的实施例中,也能达到相同的技术效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (21)

1.一种操作系统异常信息收集方法,其特征在于,包括:
获取原始操作系统中预先设定的新操作系统的预设配置信息,所述新操作系统是所述原始操作系统所运行的计算机的物理内存中预先存储的一操作系统内核;
获取在所述原始操作系统异常时,所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令;
根据所述触发指令,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的存储介质中。
2.根据权利要求1所述的操作系统异常信息收集方法,其特征在于,获取在所述原始操作系统异常时,所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令的步骤包括:
获取通过所述电源按键触发的中断上报到基本输入输出系统BIOS的系统控制中断SCI中的触发指令。
3.根据权利要求2所述的操作系统异常信息收集方法,其特征在于,获取通过所述电源按键触发的中断上报到基本输入输出系统BIOS的系统控制中断SCI中的触发指令的步骤包括:
在原始操作系统异常且当前电源按键支持所述ACPI时,获取通过电源按键触发的中断上报到所述BIOS的所述SCI中的触发指令。
4.根据权利要求1所述的操作系统异常信息收集方法,其特征在于,获取在所述原始操作系统异常时,所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令的步骤包括:
在所述原始系统异常时且当前电源按键不支持ACPI时,直接获取所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令。
5.根据权利要求1所述的操作系统异常信息收集方法,其特征在于,根据所述触发指令,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的存储介质中的步骤包括:
根据所述触发指令,同步中断所述原始操作系统中的程序运行并获取一启动所述新操作系统,收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集。
6.根据权利要求5所述的操作系统异常信息收集方法,其特征在于,根据所述触发指令,同步中断所述原始操作系统中的程序运行并获取一启动所述新操作系统收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集的步骤包括:
根据所述触发指令,同步中断所述原始操作系统中的程序运行,控制指针指向所述新操作系统并启动所述新操作系统,收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集。
7.根据权利要求1所述的操作系统异常信息收集方法,其特征在于,根据所述触发指令,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的存储介质中的步骤包括:
根据所述触发指令,获取到所述预设配置信息的写入方式为裸写或者通过文件系统接口写入;
按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的本地的存储介质中。
8.根据权利要求1所述的操作系统异常信息收集方法,其特征在于,根据所述触发指令,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的存储介质中的步骤包括:
根据所述触发指令,获取到所述预设配置信息的预先启动预设远端主机;
按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到预先启动预设远端主机的存储介质中。
9.根据权利要求1所述的操作系统异常信息收集方法,其特征在于,还包括:根据所述预设配置信息,控制关机或者复位。
10.根据权利要求1所述的操作系统异常信息收集方法,其特征在于,所述预设配置信息包括:控制系统异常信息收集功能启动/关闭的信息及信息收集的时限信息。
11.一种操作系统异常信息收集装置,其特征在于,包括:
第一获取模块,用于获取原始操作系统中预先设定的新操作系统的预设配置信息,所述新操作系统是所述原始操作系统所运行的计算机的物理内存中预先存储的一操作系统内核;
第二获取模块,用于获取在所述原始操作系统异常时,所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令;
处理模块,用于根据所述触发指令,按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的存储介质中。
12.根据权利要求11所述的操作系统异常信息收集装置,其特征在于,所述第二获取模块包括:
第一获取子模块,用于获取通过所述电源按键触发的中断上报到基本输入输出系统BIOS的系统控制中断SCI中的触发指令。
13.根据权利要求12所述的操作系统异常信息收集装置,其特征在于,所述第一获取子模块包括:
获取单元,用于在原始操作系统异常且当前电源按键支持所述ACPI时,获取通过电源按键触发的中断上报到所述BIOS的所述SCI中的触发指令。
14.根据权利要求11所述的操作系统异常信息收集装置,其特征在于,所述第二获取模块包括:
第二获取子模块,用于在所述原始系统异常时且当前电源按键不支持ACPI时,直接获取所述计算机的电源按键被按下所触发的所述原始操作系统进程中断的触发指令。
15.根据权利要求11所述的操作系统异常信息收集装置,其特征在于,所述处理模块的步骤包括:
第一处理子模块,用于根据所述触发指令,同步中断所述原始操作系统中的程序运行并获取一启动所述新操作系统,收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集。
16.根据权利要求15所述的操作系统异常信息收集装置,其特征在于,所述第一处理子模块包括:
处理单元,用于根据所述触发指令,同步中断所述原始操作系统中的程序运行,控制指针指向所述新操作系统并启动所述新操作系统,收集所述原始操作系统的异常信息的指令,进行所述异常信息的收集。
17.根据权利要求11所述的操作系统异常信息收集装置,其特征在于,所述处理模块包括:
第二获取子模块,用于根据所述触发指令,获取到所述预设配置信息的写入方式为裸写或者通过文件系统接口写入;
第二处理子模块,用于按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到指定的本地的存储介质中。
18.根据权利要求11所述的操作系统异常信息收集装置,其特征在于,所述处理模块包括:
第三获取子模块,用于根据所述触发指令,获取到所述预设配置信息的预先启动预设远端主机;
第三处理子模块,用于按照所述预设配置信息对所述原始操作系统的异常信息进行收集,并存储所述异常信息到预先启动预设远端主机的存储介质中。
19.根据权利要求11所述的操作系统异常信息收集装置,其特征在于,还包括:控制模块,用于根据所述预设配置信息,控制关机或者复位。
20.根据权利要求11所述的操作系统异常信息收集装置,其特征在于,所述预设配置信息包括:控制系统异常信息收集功能启动/关闭的信息及信息收集的时限信息。
21.一种计算机,其特征在于,包括在所运行的计算机的物理内存中预先存储的一操作系统内核,所述操作系统内核包括如权利要求11至20任一项的所述的操作系统异常信息收集装置。
CN201410495257.9A 2014-09-24 2014-09-24 一种操作系统异常信息收集方法、装置及计算机 Active CN105512000B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410495257.9A CN105512000B (zh) 2014-09-24 2014-09-24 一种操作系统异常信息收集方法、装置及计算机
PCT/CN2014/091189 WO2015131549A1 (zh) 2014-09-24 2014-11-14 一种操作系统异常信息收集方法、装置及计算机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410495257.9A CN105512000B (zh) 2014-09-24 2014-09-24 一种操作系统异常信息收集方法、装置及计算机

Publications (2)

Publication Number Publication Date
CN105512000A true CN105512000A (zh) 2016-04-20
CN105512000B CN105512000B (zh) 2020-04-24

Family

ID=54054434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410495257.9A Active CN105512000B (zh) 2014-09-24 2014-09-24 一种操作系统异常信息收集方法、装置及计算机

Country Status (2)

Country Link
CN (1) CN105512000B (zh)
WO (1) WO2015131549A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480052A (zh) * 2017-07-21 2017-12-15 广东虹勤通讯技术有限公司 一种定位宕机时bios代码的方法及装置
WO2018036318A1 (zh) * 2016-08-26 2018-03-01 中兴通讯股份有限公司 一种在操作系统启动阶段收集异常信息的方法及装置
CN108021407A (zh) * 2017-12-06 2018-05-11 锐捷网络股份有限公司 基于网络设备的业务处理方法及装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112015600A (zh) * 2019-05-28 2020-12-01 阿里巴巴集团控股有限公司 日志信息处理系统、日志信息处理方法及装置和交换机
CN111367769B (zh) * 2020-03-30 2023-07-21 浙江大华技术股份有限公司 应用故障处理方法及电子设备
CN114219231B (zh) * 2021-11-19 2022-09-23 广东工业大学 电力系统的性能评估方法、电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1940884A (zh) * 2005-09-30 2007-04-04 联想(北京)有限公司 计算机系统、计算机网络及其方法
CN101025709A (zh) * 2006-02-22 2007-08-29 联想(北京)有限公司 一种计算机操作系统故障现场信息获取的系统和方法
CN101038561A (zh) * 2006-03-14 2007-09-19 联想(北京)有限公司 一种计算机远程控制方法及系统
CN102163167A (zh) * 2011-03-02 2011-08-24 奇智软件(北京)有限公司 系统拯救的方法及装置
CN103902316A (zh) * 2012-12-27 2014-07-02 联想(北京)有限公司 切换方法和电子设备
CN103986623A (zh) * 2014-05-28 2014-08-13 山东超越数控电子有限公司 一种基于国产操作系统的硬件设备自动监控系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007507779A (ja) * 2003-10-01 2007-03-29 ジャルナ エスアー オペレーティングシステム
KR101259391B1 (ko) * 2006-10-31 2013-05-02 에스케이텔레콤 주식회사 통신망의 트러블 티켓 운용 시스템
CN103136046A (zh) * 2011-11-24 2013-06-05 林振慧 操作系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1940884A (zh) * 2005-09-30 2007-04-04 联想(北京)有限公司 计算机系统、计算机网络及其方法
CN101025709A (zh) * 2006-02-22 2007-08-29 联想(北京)有限公司 一种计算机操作系统故障现场信息获取的系统和方法
CN101038561A (zh) * 2006-03-14 2007-09-19 联想(北京)有限公司 一种计算机远程控制方法及系统
CN102163167A (zh) * 2011-03-02 2011-08-24 奇智软件(北京)有限公司 系统拯救的方法及装置
CN103902316A (zh) * 2012-12-27 2014-07-02 联想(北京)有限公司 切换方法和电子设备
CN103986623A (zh) * 2014-05-28 2014-08-13 山东超越数控电子有限公司 一种基于国产操作系统的硬件设备自动监控系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018036318A1 (zh) * 2016-08-26 2018-03-01 中兴通讯股份有限公司 一种在操作系统启动阶段收集异常信息的方法及装置
CN107480052A (zh) * 2017-07-21 2017-12-15 广东虹勤通讯技术有限公司 一种定位宕机时bios代码的方法及装置
CN108021407A (zh) * 2017-12-06 2018-05-11 锐捷网络股份有限公司 基于网络设备的业务处理方法及装置
CN108021407B (zh) * 2017-12-06 2021-01-15 锐捷网络股份有限公司 基于网络设备的业务处理方法及装置

Also Published As

Publication number Publication date
CN105512000B (zh) 2020-04-24
WO2015131549A1 (zh) 2015-09-11

Similar Documents

Publication Publication Date Title
CN105512000A (zh) 一种操作系统异常信息收集方法、装置及计算机
US10871985B2 (en) Displaying media files between changes in states of an application client
US10545807B2 (en) Method and system for acquiring parameter sets at a preset time interval and matching parameters to obtain a fault scenario type
JP4609380B2 (ja) 仮想サーバ管理システムおよびその方法ならびに管理サーバ装置
US20130081001A1 (en) Immediate delay tracker tool
CN106959866A (zh) 一种日志收集客户端及其升级方法
CN105898554A (zh) 实时转码的监控方法和实时转码系统
CN112073262B (zh) 一种云平台监控方法、装置、设备及系统
CN111966465B (zh) 一种实时修改宿主机配置参数的方法、系统、设备及介质
CN104636435A (zh) 云终端录屏方法
CN109684038B (zh) Docker服务容器日志的处理方法、装置和电子设备
CN103488793A (zh) 一种基于信息检索的用户行为监控方法
CN103491165A (zh) 自动检测屏蔽的通用分布式爬虫系统
US20140189103A1 (en) System for monitoring servers and method thereof
CN112506755A (zh) 日志采集方法、装置、计算机设备和存储介质
WO2020238860A1 (zh) 分布式文件批处理方法、装置、与可读存储介质
CN101562545A (zh) 网络唤醒的测试方法
CN103178994A (zh) 自动检测多台服务器的方法
CN106557395B (zh) 应用性能监控管理方法、系统及系统的应用方法
CN112463550A (zh) 一种终端设备状态的远程监控方法、装置及设备
CN104123217A (zh) 一种业务服务器执行命令的捕获方法及系统
CN103457771B (zh) 一种ha的虚拟机集群的管理方法和设备
CN106155859B (zh) 一种监控管理系统、信息处理方法及高密度服务器
JP2000047912A (ja) ネットワークサービス監視方法および装置とネットワークサービス監視プログラムを記録した記録媒体
CN113849356A (zh) 一种设备测试方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant