CN100472468C - 计算机系统、计算机网络及其方法 - Google Patents

计算机系统、计算机网络及其方法 Download PDF

Info

Publication number
CN100472468C
CN100472468C CNB2005101074291A CN200510107429A CN100472468C CN 100472468 C CN100472468 C CN 100472468C CN B2005101074291 A CNB2005101074291 A CN B2005101074291A CN 200510107429 A CN200510107429 A CN 200510107429A CN 100472468 C CN100472468 C CN 100472468C
Authority
CN
China
Prior art keywords
information
computer
operating system
critical conditions
deadlock
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2005101074291A
Other languages
English (en)
Other versions
CN1940884A (zh
Inventor
席振新
张怡
田宏萍
周建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CNB2005101074291A priority Critical patent/CN100472468C/zh
Publication of CN1940884A publication Critical patent/CN1940884A/zh
Application granted granted Critical
Publication of CN100472468C publication Critical patent/CN100472468C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种计算机系统、计算机网络及其方法。该计算机系统包括:死机状态检测模块、临界状态转换模块以及死机状态信息记录模块。其中,该死机状态检测模块用于判断计算机是否处于死机状态,当计算机被判断为处于死机状态时,激活临界状态转换模块,并设置一个临界状态的标志位;临界状态转换模块,当其被激活后,进行重启过程,读取死机状态检测模块设置的临界状态的标志位,当发现该标志位有效后,在特定的内存空间将BIOS或EFI初始化到能够满足应用程序执行的条件;死机状态信息记录模块记录计算机死机时的各种状态信息。本发明在不对计算机进行完全复位的情况下获取计算机的各种静态信息和动态信息,进而分析出计算机的死机原因。

Description

计算机系统、计算机网络及其方法
技术领域
本发明涉及计算机系统、计算机网络及其方法,特别是可以获取计算机死机状态信息的计算机系统、计算机网络及其方法。
背景技术
计算机系统的稳定可靠对任何使用人员和管理人员来说都是一个非常重要的问题,尤其是对于长时间运行的服务器的使用者来说,系统的稳定运行是至关重要的。各个技术厂商都在考虑采用各种方法来提高产品质量,使得自己的系统能够稳定、可靠地运行,但是总是会出现各种各样的问题。例如,由于产品质量、黑客程序、使用不当等问题,都可能导致系统出现死机、崩溃、蓝屏等现象。在系统出现问题以后,用户除了看到屏幕上的蓝屏提示信息外,就无法做其他事情,例如不能了解系统死机情况下的运行环境,也就很难找到系统出现问题的原因。
目前,寻找解决系统死机的办法主要是重新启动计算机,进入操作系统的保护模式或者进入上次正常启动的配置环境,在操作系统的环境下通过查找新安装的硬件、新安装的软件、以及硬件配置的更改来分析上次出现故障的原因。由于计算机系统死机、崩溃的原因千变万化,例如,可能在特殊情况下执行某种指令出错、或者是在正常执行过程中某个黑客程序导致系统出错、或者是内存耗尽等等。由于系统完全复位后,计算机的各种动态运行信息和死机时的内存就全部消失了,从而在完全系统复位后,仅靠管理人员的经验和各种诊断工具很难分析出这些原因。
由于计算机是顺序执行指令的设备,出现死机故障、崩溃还是有其必然性的。要查找出计算机系统出现死机的原因,最好的方式就是能够获取计算机死机时的运行环境,并对这些运行环境的信息进行系统地分析。这些运行环境的信息包括:计算机的静态信息和各种运行的动态信息,例如,物理内存状况、虚拟内存使用状况、硬盘执行情况、硬盘的系统区是否有故障、当前执行过的进程和线程、每个进程和线程的资源占用情况、当前运行的设备的信息、当前运行设备驱动的状态等等。但是如果按照现有的诊断方式,必须要重启计算机,重启计算机系统以后,计算机就被完全复位,计算机死机时的各种运行执行环境数据就全部丢失了,没有这些数据信息,就缺少了很好的手段来分析计算机系统的死机原因。
为了解决上述问题,需要提供一种获取计算机死机状态信息的计算机系统以及方法,该计算机系统和方法可以在计算机死机以后获取计算机死机时的各种静态信息和运行状态信息,这些信息有助于分析计算机死机的原因。
发明内容
本发明的目的在于,提供一种可以获取计算机死机状态信息的计算机系统及其方法。
本发明的另一目的在于,提供一种可以获取计算机死机状态信息的计算机网络及其方法。
一种计算机系统,包括:死机状态检测模块、临界状态转换模块以及死机状态信息记录模块。其中,该死机状态检测模块用于判断计算机是否处于死机状态,当计算机被判断为处于死机状态时,激活临界状态转换模块,并设置一个临界状态的标志位,使计算机进入到一种临界状态的重启状态;临界状态转换模块,当其被激活后,进行重启过程,在重启过程中读取死机状态检测模块设置的临界状态的标志位,当发现该标志位有效后,在操作系统不能使用的内存空间将BIOS或EFI初始化到能够满足应用程序执行的条件;以及,死机状态信息记录模块在BOIS或EFI临界状态启动后记录计算机死机时的各种状态信息,以供分析。
一种在计算机系统中获取计算机死机状态信息的方法,包括以下步骤:
1)判断计算机是否处于死机状态,当计算机被判断为处于死机状态时,设置一个临界状态的标志位,使计算机进入到一种临界状态的重启状态;
2)在重启过程中读取上述临界状态的标志位,当发现该标志位有效后,在操作系统不能使用的内存空间将BIOS或EFI初始化到能够满足应用程序执行的条件;以及
3)记录计算机死机时的各种状态信息。
一种计算机网络,包括远程管理服务器以及至少一计算机系统,该远程管理服务器具有远程管理模块,该计算机系统包括状态信息监控模块、临界状态转换模块、死机状态信息记录模块,并且该计算机系统支持带外管理方式。
其中,状态信息监控模块,用于定时检测、收集和保存操作系统运行时的各种数据信息,并且为远程管理模块提供作为判断计算机是否处于死机状态的接口;远程管理模块,用于在发现该计算机死机后,通过带外管理方式远程地设置一GPIO标志,作为临界状态的标志位,并发送临界状态转换模块的启动命令;临界状态转换模块,用于通过带外管理方式接收该启动命令,读取远程管理模块设置的临界状态的标志位,当发现该标志位有效后,将BIOS或EFI在操作系统不能使用的内存空间内进行初始化到能够满足应用程序执行的条件;死机状态信息记录模块,用于在BOIS或EFI临界状态启动后记录计算机死机时的各种状态信息,并将这些状态信息发送到远程管理服务器。
一种在上述的计算机网络中获取计算机系统死机状态信息的方法,其包括以下步骤:
1)状态信息监控模块定时检测、收集和保存操作系统运行时的各种数据信息,作为判断计算机是否处于死机状态和分析死机原因的依据;
2)远程管理模块在发现计算机死机后,设置临界状态的标志位,并发送启动命令;
3)临界状态转换模块接收该启动命令,读取临界状态的标志位,当发现该标志位有效后,将BIOS或EFI在操作系统不能使用的内存空间内进行初始化到能够满足应用程序执行的条件;
4)死机状态信息记录模块记录计算机死机时的各种状态信息。
本发明的有益效果是:本发明的计算机系统、计算机网络及其方法能够在计算机死机以后,在不对计算机进行完全复位的情况下获取计算机的各种静态信息和动态信息,从而在这些信息中分析出一些可能的死机原因。
附图说明
图1为本发明的获取计算机死机状态信息的计算机系统的一种结构示意图。
图2为本发明的获取计算机死机状态信息的计算机系统的另一种结构示意图。
图3为在本地计算机系统获取死机状态信息的流程图。
图4为在本地计算机系统获取死机状态信息的另一流程图。
图5为本发明获取计算机死机状态信息的计算机网络的结构图。
图6为远程管理服务器获取死机状态信息的流程图。
具体实施方式
以下将结合附图说明本发明的获取计算机死机状态信息的计算机系统、计算机网络及其获取死机状态信息的方法。
图1为本发明的获取计算机死机状态信息的计算机系统的一种结构示意图。其中,在现有计算机系统配置的基础上,该计算机系统进一步包括:状态信息监控模块1、死机状态检测模块2、临界状态转换模块3、死机状态信息记录模块4以及存储装置5。
其中,状态信息监控模块1运行在操作系统上面,用于定时检测、收集和保存操作系统运行时的各种数据信息(包括计算机的各种静态配置信息和各种动态运行信息),并且为死机状态检测提供接口,作为判断计算机是否处于死机状态的接口。
其中,上述静态信息主要包括:各种软硬件列表、软硬件的各种配置信息等,上述动态信息主要包括CPU的使用情况、内存的使用情况、网络的使用情况、服务、进程和线程的运行信息、驱动程序运行状态、硬盘状态等。
该接口可以通过多种方式实现,例如:在保留内存里面设置标志位;以及调用BIOS或者EFI的驻留服务(Runtime Service)直接和死机状态检测模块2进行通信等。
状态信息监控模块1每隔一段时间进行一次操作系统运行时的各种数据信息的检测、收集和保存。通常情况下,要求两次收集信息的间隔尽可能短,这样可以收集到更接近计算机死机时的现场信息,从而更利于分析死机原因并且分析结果更真实。
该死机状态检测模块2用于通过状态信息监控模块1的接口判断计算机是否处于死机状态,当计算机被判断为处于死机状态时,死机状态检测模块2将激活临界状态转换模块3,并设置一个临界状态的标志位,使计算机进入到一种临界状态的启动状态。
死机状态检测模块2可以通过以下方式工作:
1)该死机状态检测模块2可以是计算机的硬件中的一个寄存器,当在一段预定时间内没有接收到状态信息监控模块1的发送信号时,则将计算机判断为处于死机状态。然后,其自动激活临界状态转换模块3,并设置一个临界状态的标志位,使计算机进入到一种临界状态的启动状态。
2)该死机状态检测模块2也可以在检测到操作系统相关的某些数据、内存符合死机条件的情况下,将计算机判断为处于死机状态,然后,自动激活临界状态转换模块3,并设置一个临界状态的标志位,使计算机进入到一种临界状态的启动状态。
3)该死机状态检测模块2也可以是按键,如为该计算机增设的进行临界启动的按键、或键盘上特定键(或者特定键的组合),当用户或者管理人员发现计算机处于死机状态时,手动按下特定增设的临界启动键来给计算机发送一个系统管理中断(SMI),使计算机进入系统管理模式(SMM),从而转入SMI处理程序,通过SMI处理程序设置一个临界状态的标志位,使计算机进入到一种临界状态的启动状态。这时,该计算机系统中可以省略状态信息监控模块1。
4)该死机状态检测模块2也可以是RESET键,并在计算机启动后及时按下键盘上的特定键,来设置临界状态的标志位,使计算机进入到一种临界状态的启动状态。这时,该计算机系统中可以省略状态信息监控模块1。
临界状态转换模块3是在计算机系统底层固件中的模块,可以是BIOS模块,也可以是EFI模块。当临界状态转换模块3被激活后,其将完成一种特殊的重启过程,也就是,在重启过程中读取死机状态检测模块2设置的临界状态的标志位,当发现该标志位有效后,就把BIOS或EFI以特定方式进行初始化。该特定方式是指:只在特定的内存空间,例如,ACPI配置表里面的ARR(AddressRangeReserved)的空间内进行初始化,即在BIOS或EFI初始化时涉及内存的分配和管理只限于ACPI配置表里面的ARR的内存,因为这段内存是操作系统不能使用的内存。
在能够满足应用程序执行的条件,如可以使EFI的应用程序执行所必需的DXE环境初始化完成的时候,该特殊的重启过程完成。这种临界状态的启动,不会影响计算机操作系统死机时的内存数据。此时,计算机系统从临界状态转换到BIOS或EFI应用程序阶段,可以提供一个执行环境,例如EFI下的shell环境。这样就可以执行多种命令以及借助用户诊断工具来辅助分析计算机系统的各种状态信息。
然后,死机状态信息记录模块4在BIOS或EFI在临界状态启动以后,记录计算机死机时的各种状态信息,这些状态信息主要包括操作系统死机时的内存状态信息和屏幕显示信息等。利用死机状态信息记录模块4保存的屏幕显示信息可以进行屏幕重现,如将屏幕信息在用于分析这些状态信息的计算机的屏幕上重现。
这些状态信息可以保存在该计算机系统的存储装置5(硬盘、内存等)中供管理人员分析时使用。也可以是,在实时处理这些状态信息时,可以不用将其存储到存储装置5中,而是由管理人员直接对其进行分析。
为了更方面管理人员的分析,可以为该计算机系统增设一个死机状态分析模块,该死机状态分析模块对这些状态信息进行分析,从而得到计算机死机时的各种静态信息、操作系统运行信息和操作系统死机时的内存信息等等。
为了更有利于管理人员分析出死机原因,可以对上述计算机系统做进一步的改进。
图2为本发明的获取计算机死机状态信息的计算机系统的另一种结构示意图。与图1相比不同的是,在图2中,状态信息监控模块1将定时地将操作系统运行时的各种数据信息的检测、收集和保存在存储装置5中,作为管理人员在进行死机原因分析时的另一份文件。这样,利用状态信息监控模块1提供的各种数据信息和死机状态信息记录模块4记录的各种状态信息,管理人员可以分析出更真实的死机原因。
以下,将以符合EFI规范的计算机系统为例,分别针对在本地计算机系统获取死机状态信息,说明本发明的获取死机状态信息的方法的具体步骤。
图3为在本地计算机系统获取死机状态信息的流程图。在这种方式下,该计算机系统包括:死机状态检测模块2、临界状态转换模块3、死机状态信息记录模块4以及存储装置5,其中,该死机状态检测模块2为预定的按键例如该计算机增设的进行临界启动的按键、或键盘上特定键(或者特定键的组合)。相应地,本发明的获取死机状态信息的方法包括以下步骤:
1)在管理人员发现计算机系统处于死机状态时,按下预定的按键,触发系统管理中断,计算机系统进入系统管理模式,SMI处理程序设置一个临界状态的标志位,使计算机进入到一种临界状态的启动状态。
2)当临界状态转换模块3被激活后,读取死机状态检测模块2设置的临界状态的标志位,当发现该标志位有效后,就把BIOS或EFI在特定的内存空间内进行初始化。在能够满足应用程序执行的条件时,重启过程完成。
3)死机状态信息记录模块4记录计算机死机时的各种状态信息,并将这些状态信息发送给管理人员直接进行分析(这时,可以省略存储装置5),或者可以保存在该计算机系统的存储装置5(硬盘、内存等)中,由管理人员从中读取出来进行分析。
图4为在本地计算机系统获取死机状态信息的另一流程图。在这种方式下,该计算机系统包括:状态信息监控模块1、死机状态检测模块2、临界状态转换模块3、死机状态信息记录模块4以及存储装置5,其中,该死机状态检测模块2可以为计算机系统主板上芯片组中的寄存器。相应地,本发明的获取死机状态信息的方法包括以下步骤:
1)状态信息监控模块1运行在操作系统上,定时检测、收集和保存操作系统运行时的各种数据信息,并且通过接口向死机状态检测模块发送信号。
2)当在一段预定时间内没有接收到状态信息监控模块1的发送信号时或者在检测到操作系统相关数据符合死机条件的情况下,该死机状态检测模块2将计算机判断为处于死机状态,自动激活临界状态转换模块3,并设置一个临界状态的标志位,使计算机进入到一种临界状态的启动状态。
3)当临界状态转换模块3被激活后,读取死机状态检测模块2设置的临界状态的标志位,当发现该标志位有效后,就把BIOS或EFI在特定的内存空间内进行初始化。在能够满足应用程序执行的条件时,重启过程完成。
4)死机状态信息记录模块4记录计算机死机时的各种状态信息,并将这些状态信息发送给管理人员直接进行分析(这时,可以省略存储装置5),或者可以保存在该计算机系统的存储装置5(硬盘、内存等)中,由管理人员从中读取出来进行分析。
进一步,为了更好地分析计算机死机的原因,该状态信息监控模块1可以将定时检测、收集和保存的操作系统运行时的各种数据信息发送给管理人员直接进行分析(这时,可以省略存储装置5),或者可以保存在该计算机系统的存储装置5中,由管理人员从中读取出来进行分析。
图5为本发明获取计算机死机状态信息的计算机网络的结构图。该计算机网络包括远程管理服务器6和至少一计算机系统,其中,该远程管理服务器6中具有远程管理模块61(相当于上述的死机状态检测模块2)和存储装置62(相当于上述存储装置5),该计算机系统包括状态信息监控模块1、临界状态转换模块3、死机状态信息记录模块4。其中,该计算机网络中所增加的模块的功能大致同图4相同。进一步,为了实现远程管理,该计算机系统支持带外管理方式,如IPMI(智能平台管理接口)规范或者是外置有带网络功能的远程监控卡,在操作系统死机的时候仍然能够进行管理。
如图6所示,在这种方式下,该远程管理服务器获取死机状态信息的方法包括以下步骤:
1)状态信息监控模块1定时检测、收集和保存操作系统运行时的各种数据信息,将这些数据信息通过网络发送给远程管理服务器6,其中,发送方式可以为周期性地发送心跳信号等。
2)在远程管理模块61发现该计算机死机以后,其通过带外(Out of Band,OOB)管理方式(例如在计算机带上符合IPMI规范的管理系统),就可以远程地给GPIO设置GPIO的标志位,作为临界状态的标志位,并发送临界状态转换模块3的启动命令。其中,符合IMPI规范的管理系统可以以外插管理卡或者是在计算机主板上集成该功能的方式实现。
3)计算机系统的远程监控卡接收该启动命令,并将其发送到临界状态转换模块3。当临界状态转换模块3被激活后,读取远程管理模块61设置的临界状态的标志位,当发现该标志位有效后,就把BIOS或EFI在特定的内存空间内进行初始化。在能够满足应用程序执行的条件时,重启过程完成。
4)死机状态信息记录模块4记录计算机死机时的各种状态信息,并将这些状态信息发送到远程管理服务器6的远程管理模块61,由远程管理模块61将其存储在存储装置62中,供管理人员分析时使用。也可以是,在实时处理这些状态信息时,可以不用将其存储到存储装置62中,而是由管理人员直接对其进行分析。
为了更方面管理人员的分析,可以为该远程管理服务器6增设一个死机状态分析模块,该死机状态分析模块对这些状态信息进行分析,从而得到计算机死机时的各种静态信息、操作系统运行信息和操作系统死机时的内存信息等等。
为了更有利于管理人员分析出死机原因,可以对上述计算机系统做进一步的改进。即,计算机系统中的状态信息监控模块1将定时地将操作系统运行时的各种数据信息的检测、收集和保存发送到远程管理服务器的远程管理模块61,由远程管理模块61将其存储在存储装置62中,作为管理人员在进行死机原因分析时的另一份文件。这样,利用状态信息监控模块1提供的各种数据信息和死机状态信息记录模块4记录的各种状态信息,管理人员可以分析出更真实的死机原因。
通过本发明的计算机系统、计算机网络及其方法,可以在计算机死机之后,获取计算机死机时的各种信息,包括操作系统运行时的各种静态信息和动态信息,尤其更重要的是死机时的内存信息和屏幕显示信息,这些信息都能够为管理人员查找死机原因,解决死机问题提供非常大的帮助。并且本发明通过不同的方式,使管理人员在本地或者远端服务器中都可以获取这些关键信息,因而大大提高解决问题的效率。

Claims (26)

1.一种计算机系统,其特征在于,包括:死机状态检测模块、临界状态转换模块以及死机状态信息记录模块,其中,
该死机状态检测模块用于判断计算机是否处于死机状态,当计算机被判断为处于死机状态时,激活临界状态转换模块,并设置一个临界状态的标志位,使计算机进入到一种临界状态的重启状态;
临界状态转换模块,当其被激活后,进行重启过程,在重启过程中读取死机状态检测模块设置的临界状态的标志位,当发现该标志位有效后,在操作系统不能使用的内存空间将BIOS或EFI初始化到能够满足应用程序执行的条件;以及
死机状态信息记录模块在BOIS或EFI临界状态启动后记录计算机死机时的各种状态信息。
2.如权利要求1所述的计算机系统,其特征在于,上述状态信息包括操作系统死机时的内存状态信息和屏幕显示信息。
3.如权利要求2所述的计算机系统,其特征在于,该死机状态检测模块为按键,当用户或者管理人员发现计算机处于死机状态时,按下该按键来设置一个临界状态的标志位,使计算机进入到一种临界状态的启动状态。
4.如权利要求3所示的计算机系统,其特征在于,该按键按下后发送系统管理中断,使计算机进入系统管理模式,通过系统管理中断处理程序设置一个临界状态的标志位。
5.如权利要求2所述的计算机系统,其特征在于进一步包括状态信息监控模块,用于定时检测、收集和保存操作系统运行时的各种数据信息,并且为死机状态检测提供作为判断计算机是否处于死机状态的接口。
6.如权利要求5所述的计算机系统,其特征在于,所述数据信息包括计算机的各种静态配置信息和各种动态运行信息。
7.如权利要求6所述的计算机系统,其特征在于,所述静态配置信息包括各种软硬件列表、软硬件的各种配置信息,上述动态运行信息包括CPU的使用情况、内存的使用情况、网络的使用情况、服务、进程和线程的运行信息、驱动程序运行状态以及硬盘状态。
8.如权利要求2所述的计算机系统,其特征在于进一步包括存储装置,该存储装置用于保存上述状态信息。
9.如权利要求7所述的计算机系统,其特征在于进一步包括存储装置,该存储装置用于保存上述状态信息和数据信息。
10.如权利要求8或者9所述的计算机系统,其特征在于进一步包括死机状态分析模块,用于对存储装置中的信息进行分析,从而得到计算机死机时的各种静态信息、操作系统运行信息和操作系统死机时的内存信息。
11.一种在计算机系统中获取计算机死机状态信息的方法,其特征在于,包括以下步骤:
1)判断计算机是否处于死机状态,当计算机被判断为处于死机状态时,设置一个临界状态的标志位,使计算机进入到一种临界状态的重启状态;
2)在重启过程中读取上述临界状态的标志位,当发现该标志位有效后,在操作系统不能使用的内存空间将BIOS或EFI初始化到能够满足应用程序执行的条件;以及
3)记录计算机死机时的各种状态信息。
12.如权利要求11所述的方法,其特征在于,上述状态信息包括操作系统死机时的内存状态信息和屏幕显示信息。
13.如权利要求12所述的方法,其特征在于,在步骤1)之前进一步包括步骤:定时检测、收集和保存操作系统运行时的各种数据信息,作为判断计算机是否处于死机状态的依据。
14.如权利要求13所述的方法,其特征在于,所述数据信息包括计算机的各种静态配置信息和各种动态运行信息。
15.如权利要求14所述的方法,其特征在于,所述静态配置信息包括各种软硬件列表、软硬件的各种配置信息,上述动态运行信息包括CPU的使用情况、内存的使用情况、网络的使用情况、服务、进程和线程的运行信息、驱动程序运行状态以及硬盘状态。
16.如权利要求12所述的方法,其特征在于,在步骤3)之后进一步包括对记录的信息进行分析的步骤,从而得到计算机死机时的各种静态信息、操作系统运行信息和操作系统死机时的内存信息。
17.如权利要求15所述的方法,其特征在于,在步骤3)中进一步记录上述数据信息。
18.如权利要求17所述的方法,其特征在于,在步骤3)之后进一步包括对记录的信息进行分析的步骤,从而得到计算机死机时的各种静态信息、操作系统运行信息和操作系统死机时的内存信息。
19.一种计算机网络,包括远程管理服务器以及至少一计算机系统,其特征在于,该远程管理服务器具有远程管理模块,该计算机系统包括状态信息监控模块、临界状态转换模块、死机状态信息记录模块,并且该计算机系统支持带外管理方式,其中,
状态信息监控模块,用于定时检测、收集和保存操作系统运行时的各种数据信息,并且为远程管理模块提供作为判断计算机是否处于死机状态的接口:
远程管理模块,用于在发现该计算机死机后,通过带外管理方式远程地设置一GPIO标志,作为临界状态的标志位,并发送临界状态转换模块的启动命令;
临界状态转换模块,用于通过带外管理方式接收该启动命令,读取远程管理模块设置的临界状态的标志位,当发现该标志位有效后,将BIOS或EFI在操作系统不能使用的内存空间内进行初始化到能够满足应用程序执行的条件;
死机状态信息记录模块,用于在BOIS或EFI临界状态启动后记录计算机死机时的各种状态信息,并将这些状态信息发送到远程管理服务器。
20.如权利要求19所述的计算机网络,其特征在于,该远程管理服务器进一步包括存储装置,用于存储发送到远程管理服务器的状态信息。
21.如权利要求20所述的计算机网络,其特征在于,该远程管理服务器进一步包括死机状态分析模块,用于对存储装置中存储的状态信息进行分析,得到计算机死机时的各种静态信息、操作系统运行信息和操作系统死机时的内存信息。
22.如权利要求20所述的计算机网络,其特征在于,该状态信息监控模块定时将操作系统运行时的各种数据信息发送到远程管理服务器的存储装置中。
23.如权利要求22所述的计算机网络,其特征在于,该远程管理服务器进一步包括死机状态分析模块,用于对存储装置中存储的状态信息和数据信息进行分析,得到计算机死机时的各种静态信息、操作系统运行信息和操作系统死机时的内存信息。
24.一种在权利要求19所述的计算机网络中获取计算机系统死机状态信息的方法,其包括以下步骤:
1)状态信息监控模块定时检测、收集和保存操作系统运行时的各种数据信息,作为判断计算机是否处于死机状态和分析死机原因的依据;
2)远程管理模块在发现计算机死机后,设置临界状态的标志位,并发送启动命令;
3)临界状态转换模块接收该启动命令,读取临界状态的标志位,当发现该标志位有效后,将BIOS或EFI在操作系统不能使用的内存空间内进行初始化到能够满足应用程序执行的条件;
4)死机状态信息记录模块记录计算机死机时的各种状态信息。
25.如权利要求24所述的方法,其特征在于,进一步包括远程管理服务器对所述状态信息进行分析的步骤,得到计算机死机时的各种静态信息、操作系统运行信息和操作系统死机时的内存信息。
26.如权利要求24所述的方法,其特征在于,进一步包括远程管理服务器对状态信息和数据信息进行分析的步骤,得到计算机死机时的各种静态信息、操作系统运行信息和操作系统死机时的内存信息。
CNB2005101074291A 2005-09-30 2005-09-30 计算机系统、计算机网络及其方法 Expired - Fee Related CN100472468C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005101074291A CN100472468C (zh) 2005-09-30 2005-09-30 计算机系统、计算机网络及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005101074291A CN100472468C (zh) 2005-09-30 2005-09-30 计算机系统、计算机网络及其方法

Publications (2)

Publication Number Publication Date
CN1940884A CN1940884A (zh) 2007-04-04
CN100472468C true CN100472468C (zh) 2009-03-25

Family

ID=37959091

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005101074291A Expired - Fee Related CN100472468C (zh) 2005-09-30 2005-09-30 计算机系统、计算机网络及其方法

Country Status (1)

Country Link
CN (1) CN100472468C (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2471480A (en) * 2009-06-30 2011-01-05 Nokia Corp Preventing boot crashes due to new files
CN102236621B (zh) * 2010-04-28 2014-12-24 国网浙江富阳市供电公司 计算机接口信息配置系统及方法
CN101980444A (zh) * 2010-08-05 2011-02-23 上海闻泰电子科技有限公司 让电池供电的系统在不拆除电池的情况下强制复位的电路
CN103164318B (zh) 2011-12-13 2016-07-20 中国银联股份有限公司 联机系统的自动化健康检查方法和装置
CN103729318B (zh) * 2012-10-15 2016-10-19 北京百度网讯科技有限公司 获取服务器屏幕输出信息的系统
CN105512000B (zh) * 2014-09-24 2020-04-24 中兴通讯股份有限公司 一种操作系统异常信息收集方法、装置及计算机
CN104991832A (zh) * 2015-06-20 2015-10-21 成都彬鸿科技有限公司 嵌入式处理器宕机的处理方法
CN105955838A (zh) * 2016-05-24 2016-09-21 天脉聚源(北京)传媒科技有限公司 一种系统死机的原因查看方法及装置
CN106339213B (zh) * 2016-08-16 2020-09-22 Tcl移动通信科技(宁波)有限公司 一种移动终端开机防止烧卡的控制方法及系统
CN106502846A (zh) * 2016-10-14 2017-03-15 合肥联宝信息技术有限公司 一种电脑故障检测方法及装置
CN110333985B (zh) * 2019-06-12 2023-04-28 东北石油大学 记录移动终端操作信息的方法和装置

Also Published As

Publication number Publication date
CN1940884A (zh) 2007-04-04

Similar Documents

Publication Publication Date Title
CN100472468C (zh) 计算机系统、计算机网络及其方法
CN100388231C (zh) 分析从崩溃得到的数据的方法和数据处理系统
CN105938450B (zh) 自动除错信息收集的方法及系统
CN105357038B (zh) 监控虚拟机集群的方法和系统
US6021437A (en) Process and system for real-time monitoring of a data processing system for its administration and maintenance support in the operating phase
US6957364B2 (en) Computing system in which a plurality of programs can run on the hardware of one computer
TWI450103B (zh) 伺服器之遠端管理系統及方法,及其電腦程式產品
TWI261748B (en) Policy-based response to system errors occurring during OS runtime
CN107885635B (zh) 黑屏检测方法、移动终端及计算机可读存储介质
CN105264511A (zh) 用于usb异步通知能力的主机检测的系统和方法
CN105204977A (zh) 一种系统异常的捕获方法、主系统、影子系统及智能设备
CN109426606A (zh) 内核故障诊断信息处理方法、装置、存储介质及电子设备
JPH0727445B2 (ja) コンピュータプロセッサ動作用ユーザインターフェイス
CN112199249A (zh) 监控数据的处理方法、装置、设备和介质
CN103778024A (zh) 服务器系统及其讯息处理方法
CN102957563B (zh) Linux集群故障自动恢复方法和Linux集群故障自动恢复系统
CN117806857B (zh) 故障定位信息生成方法、装置、电子设备及存储介质
WO2024131133A1 (zh) 电子设备数据处理方法、装置、电子设备和存储介质
CN115599617B (zh) 总线检测方法、装置、服务器及电子设备
US7356683B2 (en) System and method for monitoring BIOS messages of remote computers by a local server
KR102550886B1 (ko) 시스템 온 칩 및 그 동작 방법
CN101751283A (zh) 虚拟机监视器,虚拟机系统及客户操作系统状态获取方法
CN108459942A (zh) 一种数据处理方法、装置及存储介质
JP4495248B2 (ja) 情報処理装置、障害処理方法
CN114153642A (zh) 一种系统检测方法及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090325

Termination date: 20200930

CF01 Termination of patent right due to non-payment of annual fee