CN101025709A - 一种计算机操作系统故障现场信息获取的系统和方法 - Google Patents

一种计算机操作系统故障现场信息获取的系统和方法 Download PDF

Info

Publication number
CN101025709A
CN101025709A CN 200610057602 CN200610057602A CN101025709A CN 101025709 A CN101025709 A CN 101025709A CN 200610057602 CN200610057602 CN 200610057602 CN 200610057602 A CN200610057602 A CN 200610057602A CN 101025709 A CN101025709 A CN 101025709A
Authority
CN
China
Prior art keywords
operating system
module
memory
information
running time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610057602
Other languages
English (en)
Other versions
CN100472471C (zh
Inventor
周涛
周建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CNB2006100576026A priority Critical patent/CN100472471C/zh
Publication of CN101025709A publication Critical patent/CN101025709A/zh
Application granted granted Critical
Publication of CN100472471C publication Critical patent/CN100472471C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

一种计算机操作系统故障现场信息获取的系统和方法,包括EFI BIOS和运行在EFI BIOS上的操作系统,以及操作系统监视模块(2),计数器(4)和硬件狗模块(5);EFI BIOS还包括内存分配模块(1)和运行时间服务模块(3);系统上电后,EFI BIOS初始化内存时,内存分配模块(1)将物理内存分为操作系统内存和故障分析系统内存;操作系统运行时,启动并驻留操作系统监视模块(2),操作系统监视模块(2)收集操作系统现场信息;当操作系统崩溃,将操作系统崩溃的事件通知EFI BIOS的运行时间服务模块(3);运行时间服务模块(3)建立获取操作系统故障现场信息的故障分析系统环境,获取操作系统故障现场信息。其能够保证操作系统在出现故障的现场对系统进行分析和诊断,获取故障现场的信息。

Description

一种计算机操作系统故障现场信息获取的系统和方法
技术领域
本发明涉及计算机领域,特别是涉及一种计算机操作系统故障现场信息获取的系统和方法。
背景技术
目前计算机操作系统(Operation System,OS),特别是多任务操作系统,如Windows操作系统都较为复杂,一个完备的操作系统在运行的过程中,由于多个应用程序或者新程序的运行,可能会出现新的故障。一般地,现有的操作系统都有一些操作系统诊断和维护方法,可以监控操作系统的工作状况,并在有可能出现问题的时候提前向用户报警。但在操作系统发生一些致命错误时(如内存错误、应用程序越界访问等),操作系统会崩溃,包括死循环(即死机)或产生无法识别的错误(蓝屏),这时通常的做法是将计算机机器重新启动。然而这时所有的计算机故障现场信息将全部丢失,无法进行进一步进行故障分析,也就无法找到问题的根本原因。而不排除机器的问题,隐患依旧存在,系统的稳定性得不到保证,性能得不到保障,可能在制约条件满足的时候再次发生故障,用户对其信任度就会下降。因此,如何在计算机操作系统中,如果在操作系统死机或者崩溃时,获取故障现场信息,已经成为业界迫切需要解决的问题。
现有的处理操作系统致命错误的方法有以下几种:
1、操作系统(如Windows操作系统)崩溃后,由操作系统的dump进程进行转储(dump),现有的3种转储的模式分别为小内存转储(64K);核心内存转储;完全内存转储,然后才通过分析工具程序对转储文件进行分析。
但这3种处理操作系统致命错误的方法都存在如下缺陷:
这3种处理操作系统致命错误的转储模式的转变需要在操作系统下进行设置,如果要进行全内存转储需要占用大量的核心存储空间,但如果太少(小内存转储)又会丢失很多的信息,当然,用户可以根据不同的应用和崩溃可能会适用不同的的转储模式,但在计算机操作系统崩溃时只能按照设定好的转储模式进行转储,而不能再变更为别的转储模式。另一方面,这种方法仍旧需要依赖于操作系统下的转储进行,如果在出现严重的操作系统故障情况,如转储进行也崩溃的情况下,或者操作系统本地存储的内存出现故障的情况下,将无法进行现场信息的保存。
2、计算机操作系统在发生致命错误时,由系统管理员或者操作系统开发人员在现场进行重启、获取故障现场信息,进行计算机故障的诊断和维护等操作工作。
但这种处理方法的缺点也是显而易见的,其主要缺点是需要系统管理员或者操作系统开发人员到现场进行操作,这样需要占用系统管理员或者操作系统开发人员的大量时间和精力来进行操作系统的诊断和维护。而由于没有计算机崩溃时的现场,因此系统管理员或者操作系统开发人员就无法准确定位故障,而只能凭借经验和大量的分析工具程序长时间的运行来发现问题,获取现场故障信息,其效率十分低下,而能够真正查找出计算机操作系统故障的现场信息的概率也较低。因此,这一方法在现实应用中不可能得到普遍的应用。
发明内容
本发明的目的在于克服上述缺陷而提供的一种计算机故障现场信息获取的系统和方法,其能够保证操作系统在出现故障的现场对系统进行分析和诊断,获取故障现场的信息,包括内存信息等。
为实现本发明目的而提供的一种计算机操作系统故障现场信息获取的系统,包括EFI BIOS和运行在EFI BIOS上的操作系统
以及操作系统监视模块,所述EFI BIOS还包括内存分配模块和运行时间服务模块;
所述内存分配模块,用于在计算机系统上电以后,EFI BIOS在预引导阶段,EFI BIOS对内存初始化时,将将物理内存分为操作系统内存和故障分析系统内存;
所述操作系统监视模块,运行并驻留在所述操作系统中,用于在操作系统正常运行时收集操作系统现场信息并保存;同时在操作系统崩溃时,将操作系统崩溃的事件通知EFI BIOS的运行时间服务模块,建立获取操作系统故障现场信息的故障分析系统环境,获取操作系统故障现场信息。
所述运行时间服务模块,用于对获取操作系统故障信息的故障分析系统文件进行初始化,提供分析系统支持环境,选择操作系统故障现场信息和保存位置,并保存信息内容到该位置。
本发明的系统还可以包括计数器和硬件狗模块;
所述计数器,用于定时计算机运行时间;操作系统监视模块定时改写计数器,防止计数器溢出;当计数器溢出时,则产生中断,触发EFI BIOS中断管理程序,启动硬件狗模块;
硬件狗模块,用于将系统程序的指针调整到EFI BIOS内存空间中的运行时间服务模块,从而使计算机系统的控制权转到EFI BIOS的运行时间服务模块中。
所述操作系统为Windows操作系统。
本发明还提供一种计算机操作系统故障现场信息获取的方法,其特征在于,包括下列步骤:
步骤A)系统上电后,EFI BIOS初始化内存时,内存分配模块将物理内存分为操作系统内存和故障分析系统内存;
步骤B)操作系统运行时,启动并驻留操作系统监视模块,操作系统监视模块收集操作系统现场信息;当操作系统崩溃,将操作系统崩溃的事件通知EFI BIOS的运行时间服务模块;
步骤C)运行时间服务模块建立获取操作系统故障现场信息的故障分析系统环境,获取操作系统故障现场信息。
所述步骤B)还包括下列步骤:
步骤B1)操作系统运行时,启动并驻留操作系统监视模块,操作系统监视模块定时写计数器;
步骤B2)当操作系统崩溃,进入EFI BIOS系统管理模式时,硬件狗模块将系统程序指针指向运行时间服务模块,启动运行时间服务模块。
所述步骤C)包括下列步骤:
步骤C1)运行时间服务模块上载基于EFI的设备驱动;
步骤C2)分析工具选择操作系统故障现场的的内存内容,存储位置,记录并保存现场的信息。
所述步骤C1)还包括下列步骤:
运行时间服务模块加载EFI web服务,建立基于网络连接,在加载网卡驱动以后,通过网络向控制端发出系统警告,通知控制端系统本操作系统目前状态。
所述设备驱动包括网卡驱动,IDE/SCSI设备驱动,USB设备驱动,PCI设备驱动。
所述现场信息包括CPU利用率信息,内存使用率信息,寄存器内容信息和进程信息中的一类或者多类信息组合。
本发明的有益效果是:本发明利用EFI BIOS完成对操作系统死机的分析,在计算机操作系统出现故障时,利用独立于操作系统的内存空间和分析操作环境对计算机操作系统崩溃的原因进行分析,获取故障现场信息。其判断保存计算机操作系统当前状态,并在操作系统出现故障时进入独立的内存空间而不破坏操作系统的内存区域和内存状态,并在分析环境下对操作系统的内存区域和内存状态进行分析并结合对硬件系统的底层诊断,来获取机器故障的现场信息,获取计算机操作系统发生故障的原因。
附图说明
图1是本发明计算机操作系统故障现场信息获取的系统结构示意图;
图2是图1中监控模块工作过程流程图;
图3是本发明计数器中断模块流程图;
图4是本发明EFI BIOS运行时间服务模块流程图。
具体实施方式
下面结合附图1~4进一步详细说明本发明的一种计算机操作系统故障现场信息获取的系统和方法。
本发明克服现有的基本输入输出系统(Basic Input/Output System,BIOS)的弱点,利用EFI BIOS在这运行时间(runtime)功能和预引导(pre-boot)功能两方面的改进和提高,解决了在计算机操作系统崩溃时获取计算机故障现场信息的问题。
本发明将涉及可扩展固件接口(EFI)技术,下面我们先对其进行介绍:
可扩展固件接口(Extensible Firmware Interface,EFI)是1999年出现的用以取代沿用多年的基本输入输出系统(BIOS)的新一代接口程序,关于可扩展固件接口的介绍,详见UEFI论坛关于EFI技术的介绍http://www.UEFI.org。EFI BIOS介于硬件设备以及操作系统(比如Windows或者Linux)之间。与传统的BIOS不同,EFI BIOS使用全球最广泛的高级语言C语言进行编写,其提供了既具有传统BIOS的功能又有优于传统BIOS的扩展功能,在设计机制和架构上也有别于传统BIOS的实现,是下一代BIOS接口规范,这就意味着有更多的工程师可以参与EFI BIOS的开发工作,添加许多更有价值的功能。
EFI BIOS具备的基本功能为:
硬件平台初始化;
支持启动操作系统;
脱离操作系统的平台管理工具。
EFI BIOS的工作模式可以简单归纳为:启动系统,标准固件平台初始化,接着从加载EFI驱动程序库以及及执行相关程序,在EFI BIOS系统启动菜单中选取所要进入的系统并向EFI BIOS提交启动引导代码,正常则进入系统,否则将中止启动服务并返回EFI BIOS系统启动菜单。
在本发明的对计算机操作系统的故障现场信息获取方法中,特别是以Windows操作系统而进行的描述,但本发明同样适用除了Windows操作系统之外的操作系统的情况。
如图1所示,本发明计算机操作系统故障现场信息获取的系统,包括有:
(一)内存分配模块1,用于在支持EFI BIOS的硬件架构中,在计算机系统上电(Power on)以后,EFI BIOS在预引导(pre-boot)阶段,EFI BIOS对内存初始化时,将一部分内存进行保留,此时,EFI BIOS向Windows操作系统提供的内存大小就是系统物理内存大小减去保留内存的大小。
同时,内存分配模块1将用于获取操作系统故障信息的故障分析系统文件放入保留内存区域,以供在发生操作系统崩溃时进入。
在系统上电(Power on)以后,EFI BIOS在预引导(pre-boot)阶段将内存进行初始化,启动内存分配模块1,内存分配模块1将内存分为两部分:
一部分为操作系统内存,用于Windows操作系统在进入操作系统安装(OS load)阶段以后,操作系统对这一部分内存进行控制,分配给操作系统及在操作系统上运行的各个进程程序使用。
另一部分为保留为故障分析系统内存,在EFI BIOS启动时其初始化为故障分析系统环境预留内存空间,此保留内存空间只分配给故障分析系统文件,Windows操作系统在启动后不能发现和使用此部分空间。在此预留空间中运行EFI BIOS的运行时间(runtime)服务模块3,此模块的主要功能是建立获取故障信息所必需的操作环境,如加载EFI网卡(NIC)的驱动,加载分析工具(diagnostic tool)并且保存Windows操作系统故障信息的内容。
(二)操作系统监视模块2,用于在操作系统运行时收集操作系统现场信息;同时在发现操作系统不能响应应用程序的操作请求,出现操作系统崩溃时,将操作系统崩溃的事件通知EFI BIOS的运行时间(runtime)服务模块3。
(三)计数器(Timer)4,用于定时计算机运行时间;操作系统监视模块2定时改写计数器4,防止计数器4溢出;当计数器4溢出时,则产生中断,触发EFI BIOS中断管理程序,启动硬件狗模块5。
当操作系统正常运行时,操作系统监视模块2定时改写计算机硬件中的南桥ICH芯片(I/O Controller HUB)中计数器4的计数寄存器,从而保证计数器4不会溢出而产生溢出中断;当操作系统崩溃时,则驻留并运行在操作系统中的监视模块2也无法正常运行,因此不能定时写南桥计数器4的计数寄存器,从而导致计数器4没有定时重置,计数器4溢出,产生中断,触发了EFI BIOS中断管理程序,启动硬件狗模块5。
(四)硬件狗模块5,用于将系统程序的指针调整到EFI BIOS内存空间中的运行时间(runtime)服务模块3,从而使计算机系统的控制权转到EFIBIOS的运行时间(runtime)服务模块3中。
(五)EFI BIOS的运行时间(runtime)服务模块3,用于对获取操作系统故障信息的分析环境的部件进行初始化,在进入运行时间服务模块3时需要对硬件系统进行的初始化,使其建立起生故障分析系统环境,提供分析系统支持环境,如加载EFI NIC的驱动程序,加载分析工具(diagnostic tool),选择操作系统故障现场信息和保存位置,并保存信息内容到该位置。
在Windows操作系统崩溃时,分析工具6通过读取操作系统崩溃时的内存、寄存器内容等信息,结合对系统硬件的底层诊断来获取系统故障的信息,诊断操作系统发生故障的具体原因。然后选择操作系统故障现场信息和保存位置,并保存信息内容到该位置。
Windows操作系统启动后,在正常运行的情况下,操作系统监视模块2运行并驻留在操作系统时,收集Windows操作系统的现场信息,包括CPU利用率,内存使用率,寄存器内容,进程信息,并写入到操作系统管理的内存固定内存空间中去。
同时,操作系统监视模块2定时改写南桥计数器4的计数寄存器,保证计数器4不会溢出而产生溢出中断。
如果操作系统崩溃,则驻留并运行在操作系统中的监视模块2也无法正常运行,因此不能定时改写南桥计数器4的计数寄存器,从而导致计数器4没有定时重置,计数器4溢出,产生中断,触发了EFI BIOS中断管理程序,进入到EFI BIOS系统管理模式(System Management,SM),启动硬件狗模块5,硬件狗模块5将系统程序指针指向EFI BIOS内存空间中的运行时间(runtime)服务模块3,从而使系统控制权转到EFI BIOS的运行时间(runtime)服务模块3中。
运行时间(runtime)服务模块3首先上载基于EFI的设备驱动,包括网卡(NIC),IDE/SCSI设备驱动,USB设备驱动,PCI设备驱动,通过上载以上驱动,使得EFI BIOS获得相应设备的控制权,可以进行I/O设备的操作;然后,加载EFI web服务(service),建立基于网络连接,较佳地,是基于http的网络连接,在加载网卡(NIC)驱动以后,通过网络向某一控制端发出系统警告,通知远端管理员系统本操作系统目前状态;最后,分析工具(diagnostictool)6根据远程控制台的指令,如选择转储(dump)的内存内容,存储位置,如USB存储,网络存储,或者本地硬盘存储,从而记录下现场的信息。
下面结合上述系统进一步详细说明本发明的一种计算机故障现场信息获取的方法:
步骤A:系统上电后,在预引导(pro-boot)阶段中,EFI BIOS初始化内存时,内存分配模块1将物理内存分为操作系统内存和故障分析系统内存。
在系统上电(Power on)以后,EFI BIOS在预引导(pre-boot)阶段将内存进行初始化,启动内存分配模块1,内存分配模块1将内存分为两部分:
一部分为操作系统内存,用于Windows操作系统在进入操作系统安装(OS load)阶段以后,操作系统对这一部分内存进行控制,分配给操作系统及在操作系统上运行的各个进程程序使用。
另一部分为保留为故障分析系统内存,其初始化为在EFI BIOS启动时故障分析系统环境预留内存空间,此保留内存空间只分配给故障分析系统环境,Windows操作系统在启动后不能发现和使用此部分空间。并在此预留空间中运行EFI BIOS的运行时间(runtime)服务模块3,运行时间服务模块3建立获取故障信息所必需的操作环境,如加载EFI NIC的驱动,加载分析工具(diagnostic tool)6并且保存Windows操作系统故障信息的内容。
步骤B:操作系统运行时,启动并驻留操作系统监视模块2,收集操作系统现场信息,并定时改写计数器4;当操作系统崩溃,将操作系统崩溃的事件通知EFI BIOS的运行时间服务模块3。
步骤B1:操作系统运行时,启动并驻留操作系统监视模块2,收集操作系统现场信息并保存,并定时改写计数器4。
如图2所示,Windows操作系统启动后,在正常运行的情况下,操作系统监视模块5运行并驻留在操作系统时,收集Windows操作系统的现场信息,包括CPU利用率信息,内存使用率信息,寄存器内容信息,进程信息,并写入到操作系统管理的内存固定空间中去。
同时,操作系统监视模块2定时改写南桥计数器4的计数寄存器,保证计数器4不会溢出而产生溢出中断。
步骤B2:当操作系统崩溃,进入EFI BIOS系统管理模式时,硬件狗模块5将系统程序指针指向运行时间(runtime)服务模块3,启动运行时间(runtime)服务模块3。
如图3所示,如果操作系统崩溃,如系统死机蓝屏等,则驻留并运行在操作系统中的监视模块2也无法正常运行,因此不能定时写南桥计数器4的计数寄存器,从而导致计数器4没有定时重置,计数器4溢出,产生中断,触发了EFI BIOS中断管理程序,进入到EFI BIOS系统管理模式(SystemManagement,SM),并将系统程序指针指向EFI BIOS内存空间中的运行时间(runtime)服务模块3,从而使系统控制权转到EFI BIOS的运行时间(runtime)服务模块3中。
步骤C:运行时间服务模块3建立获取操作系统故障现场信息的故障分析系统环境,获取操作系统故障现场信息。
当运行时间服务模块3启动后,其上载设备驱动,建立网络连接,启动分析工具,选择并存储故障现场信息。
操作系统监视模块2在操作系统崩溃时,不能定时写计数器4的计数寄存器,定时器4溢出,触发EFI BIOS的中断管理程序,进入到EFI BIOS的系统管理模式(SM),启动硬件狗模块5,硬件狗模块5将系统程序的指针指向运行时间(runtime)服务模块3。
运行时间(runtime)服务模块3首先上载基于EFI的设备驱动,包括网卡(NIC),IDE/SCSI设备驱动,USB设备驱动,PCI设备驱动,通过上载以上驱动,使得EFI BIOS获得相应设备的控制权,可以进行I/O设备的操作;
然后,运行时间服务模块3加载EFI web服务(service),建立基于网络连接,较佳地,是基于http的网络连接,在加载网卡(NIC)驱动以后,通过网络向某一控制端发出系统警告,通知远端管理员系统本操作系统目前状态;
最后,分析工具(diagnostic tool)6根据远程控制台的指令,如选择转储(dump)的内存内容,存储位置,如USB存储,网络存储,或者本地硬盘存储,记录并保存现场的信息。
本发明利用EFI BIOS在运行时间(runtime)和预引导(pre-boot)运行环境,完成对操作系统崩溃时不依赖于操作系统而获取现场故障信息,其运行并驻留在操作系统中的监视模块2获取操作系统现场信息,判断操作系统当前状态,在发生操作系统崩溃时进入分析环境,不破坏windows的内存区域,并在分析环境下对操作系统的内存区域进行分析并结合对硬件系统的底层诊断,来获取机器故障的信息,并可以结合现有的操作系统故障分析工具查明操作系统出现故障的原因,保证操作系统运行时的稳定性。
本实施例是为了更好地理解本发明进行的详细的描述,并不是对本发明所保护的范围的限定,因此,本领域普通技术人员不脱离本发明的主旨未经创造性劳动而对本明所做的改变在本发明的保护范围内。

Claims (10)

1.一种计算机操作系统故障现场信息获取的系统,包括EFI BIOS和运行在EFI BIOS上的操作系统,其特征在于:
还包括操作系统监视模块(2),所述EFI BIOS还包括内存分配模块(1)和运行时间服务模块(3);
所述内存分配模块(1),用于在计算机系统上电以后,EFI BIOS在预引导阶段,EFI BIOS对内存初始化时,将将物理内存分为操作系统内存和故障分析系统内存;
所述操作系统监视模块(2),运行并驻留在所述操作系统中,用于在操作系统正常运行时收集操作系统现场信息并保存;同时在操作系统崩溃时,将操作系统崩溃的事件通知EFI BIOS的运行时间服务模块(3),建立获取操作系统故障现场信息的故障分析系统环境,获取操作系统故障现场信息;
所述运行时间服务模块(3),用于对获取操作系统故障信息的故障分析系统文件进行初始化,提供分析系统支持环境,选择操作系统故障现场信息和保存位置,并保存信息内容到该位置。
2.根据权利要求1所述的计算机操作系统故障现场信息获取的系统,其特征在于,还包括计数器(4)和硬件狗模块(5);
所述计数器(4),用于定时计算机运行时间;操作系统监视模块(2)定时改写计数器(4),防止计数器(4)溢出;当计数器(4)溢出时,则产生中断,触发EFI BIOS中断管理程序,启动硬件狗模块(5);
硬件狗模块(5),用于将系统程序的指针调整到EFI BIOS内存空间中的运行时间服务模块(3),从而使计算机系统的控制权转到EFI BIOS的运行时间服务模块(3)中。
3.根据权利要求1或2所述的计算机操作系统故障现场信息获取的系统,其特征在于,所述操作系统为Windows操作系统。
4.根据权利要求1或2所述的计算机操作系统故障现场信息获取的系统,其特征在于,所述现场信息包括CPU利用率信息,内存使用率信息,寄存器内容信息和进程信息中的一类或者多类信息组合。
5.一种计算机操作系统故障现场信息获取的方法,其特征在于,包括下列步骤:
步骤A)系统上电后,EFI BIOS初始化内存时,内存分配模块(1)将物理内存分为操作系统内存和故障分析系统内存;
步骤B)操作系统运行时,启动并驻留操作系统监视模块(2),操作系统监视模块(2)收集操作系统现场信息;当操作系统崩溃,将操作系统崩溃的事件通知EFI BIOS的运行时间服务模块(3);
步骤C)运行时间服务模块(3)建立获取操作系统故障现场信息的故障分析系统环境,获取操作系统故障现场信息。
6.根据权利要求5所述的计算机操作系统故障现场信息获取的方法,其特征在于,所述步骤B)还包括下列步骤:
步骤B1)操作系统运行时,启动并驻留操作系统监视模块(2),操作系统监视模块(2)定时写计数器(4);
步骤B2)当操作系统崩溃,进入EFI BIOS系统管理模式时,硬件狗模块(5)将系统程序指针指向运行时间服务模块(3),启动运行时间服务模块(3)。
7.根据权利要求5或6所述的计算机操作系统故障现场信息获取的方法,其特征在于,所述现场信息包括CPU利用率信息,内存使用率信息,寄存器内容信息和进程信息中的一类或者多类信息组合。
8.根据权利要求5或6所述的计算机操作系统故障现场信息获取的方法,其特征在于,所述步骤C)包括下列步骤:
步骤C1)运行时间服务模块(3)上载基于EFI的设备驱动;
步骤C2)分析工具(6)选择操作系统故障现场的的内存内容,存储位置,记录并保存现场的信息。
9.根据权利要求8所述的计算机操作系统故障现场信息获取的方法,其特征在于,所述步骤C1)还包括下列步骤:
运行时间服务模块(3)加载EFI web服务,建立基于网络连接,在加载网卡驱动以后,通过网络向控制端发出系统警告,通知控制端系统本操作系统目前状态。
10.根据权利要求8所述的计算机操作系统故障现场信息获取的方法,其特征在于,所述设备驱动包括网卡驱动,IDE/SCSI设备驱动,USB设备驱动,PCI设备驱动。
CNB2006100576026A 2006-02-22 2006-02-22 一种计算机操作系统故障现场信息获取的系统和方法 Active CN100472471C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100576026A CN100472471C (zh) 2006-02-22 2006-02-22 一种计算机操作系统故障现场信息获取的系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100576026A CN100472471C (zh) 2006-02-22 2006-02-22 一种计算机操作系统故障现场信息获取的系统和方法

Publications (2)

Publication Number Publication Date
CN101025709A true CN101025709A (zh) 2007-08-29
CN100472471C CN100472471C (zh) 2009-03-25

Family

ID=38744028

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100576026A Active CN100472471C (zh) 2006-02-22 2006-02-22 一种计算机操作系统故障现场信息获取的系统和方法

Country Status (1)

Country Link
CN (1) CN100472471C (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567550A (zh) * 2011-12-31 2012-07-11 曙光信息产业股份有限公司 操作系统os中应急事件的数据采集方法和装置
CN102622322A (zh) * 2012-02-24 2012-08-01 华为技术有限公司 一种利用黑匣子获取崩溃信息的方法、黑匣子及服务器
CN102637144A (zh) * 2012-03-31 2012-08-15 奇智软件(北京)有限公司 一种系统故障的处理方法和装置
CN103631706A (zh) * 2012-08-27 2014-03-12 腾讯科技(深圳)有限公司 一种浏览器测试方法和装置
CN104035871A (zh) * 2014-06-27 2014-09-10 腾讯科技(深圳)有限公司 基于地理位置的应用程序的故障处理方法及装置
CN104699615A (zh) * 2012-03-31 2015-06-10 北京奇虎科技有限公司 一种系统故障的处理方法和装置
CN105204977A (zh) * 2014-06-30 2015-12-30 中兴通讯股份有限公司 一种系统异常的捕获方法、主系统、影子系统及智能设备
CN105512000A (zh) * 2014-09-24 2016-04-20 中兴通讯股份有限公司 一种操作系统异常信息收集方法、装置及计算机
CN106681771A (zh) * 2016-12-30 2017-05-17 合网络技术(北京)有限公司 一种系统重装方法及装置
CN106997315A (zh) * 2016-01-25 2017-08-01 阿里巴巴集团控股有限公司 一种用于虚拟机的内存转储的方法和装置
CN107025146A (zh) * 2016-01-30 2017-08-08 华为技术有限公司 一种文件生成方法、装置和系统
CN108319530A (zh) * 2018-02-06 2018-07-24 合肥联宝信息技术有限公司 计算机硬件的诊断方法、装置、终端及介质
CN108431877A (zh) * 2016-01-05 2018-08-21 金泰克斯公司 车用通信系统
CN111158982A (zh) * 2019-12-26 2020-05-15 联想(北京)有限公司 电子设备、第一运行系统、数据处理方法及存储介质
CN111341434A (zh) * 2020-03-02 2020-06-26 北京医维星科技有限公司 一种医疗设备远程故障诊断及维护系统及其构建方法
CN113064747A (zh) * 2021-03-26 2021-07-02 山东英信计算机技术有限公司 一种服务器启动过程中的故障定位方法、系统及装置
CN114064132A (zh) * 2021-09-30 2022-02-18 中科创达软件股份有限公司 一种系统宕机恢复方法、装置、设备和系统
CN116302646A (zh) * 2023-02-24 2023-06-23 荣耀终端有限公司 一种故障定位方法、系统、电子设备及存储介质

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567550A (zh) * 2011-12-31 2012-07-11 曙光信息产业股份有限公司 操作系统os中应急事件的数据采集方法和装置
CN102622322B (zh) * 2012-02-24 2015-09-09 华为技术有限公司 一种利用黑匣子获取崩溃信息的方法、黑匣子及服务器
CN102622322A (zh) * 2012-02-24 2012-08-01 华为技术有限公司 一种利用黑匣子获取崩溃信息的方法、黑匣子及服务器
CN102637144A (zh) * 2012-03-31 2012-08-15 奇智软件(北京)有限公司 一种系统故障的处理方法和装置
CN104699615B (zh) * 2012-03-31 2017-09-22 北京奇虎科技有限公司 一种系统故障的处理方法和装置
CN102637144B (zh) * 2012-03-31 2015-05-06 北京奇虎科技有限公司 一种系统故障的处理方法和装置
CN104699615A (zh) * 2012-03-31 2015-06-10 北京奇虎科技有限公司 一种系统故障的处理方法和装置
CN103631706A (zh) * 2012-08-27 2014-03-12 腾讯科技(深圳)有限公司 一种浏览器测试方法和装置
CN104035871A (zh) * 2014-06-27 2014-09-10 腾讯科技(深圳)有限公司 基于地理位置的应用程序的故障处理方法及装置
CN105204977A (zh) * 2014-06-30 2015-12-30 中兴通讯股份有限公司 一种系统异常的捕获方法、主系统、影子系统及智能设备
CN105512000A (zh) * 2014-09-24 2016-04-20 中兴通讯股份有限公司 一种操作系统异常信息收集方法、装置及计算机
CN105512000B (zh) * 2014-09-24 2020-04-24 中兴通讯股份有限公司 一种操作系统异常信息收集方法、装置及计算机
CN108431877B (zh) * 2016-01-05 2021-11-26 金泰克斯公司 车用通信系统
CN108431877A (zh) * 2016-01-05 2018-08-21 金泰克斯公司 车用通信系统
CN106997315B (zh) * 2016-01-25 2021-01-26 阿里巴巴集团控股有限公司 一种用于虚拟机的内存转储的方法和装置
CN106997315A (zh) * 2016-01-25 2017-08-01 阿里巴巴集团控股有限公司 一种用于虚拟机的内存转储的方法和装置
CN107025146B (zh) * 2016-01-30 2019-10-18 华为技术有限公司 一种文件生成方法、装置和系统
CN107025146A (zh) * 2016-01-30 2017-08-08 华为技术有限公司 一种文件生成方法、装置和系统
CN106681771A (zh) * 2016-12-30 2017-05-17 合网络技术(北京)有限公司 一种系统重装方法及装置
CN106681771B (zh) * 2016-12-30 2020-12-29 阿里巴巴(中国)有限公司 一种系统重装方法及装置
CN108319530A (zh) * 2018-02-06 2018-07-24 合肥联宝信息技术有限公司 计算机硬件的诊断方法、装置、终端及介质
CN111158982A (zh) * 2019-12-26 2020-05-15 联想(北京)有限公司 电子设备、第一运行系统、数据处理方法及存储介质
CN111158982B (zh) * 2019-12-26 2022-06-28 联想(北京)有限公司 电子设备、第一运行系统、数据处理方法及存储介质
CN111341434A (zh) * 2020-03-02 2020-06-26 北京医维星科技有限公司 一种医疗设备远程故障诊断及维护系统及其构建方法
CN111341434B (zh) * 2020-03-02 2024-05-28 北京医维星科技有限公司 一种医疗设备远程故障诊断及维护系统及其构建方法
CN113064747A (zh) * 2021-03-26 2021-07-02 山东英信计算机技术有限公司 一种服务器启动过程中的故障定位方法、系统及装置
CN114064132A (zh) * 2021-09-30 2022-02-18 中科创达软件股份有限公司 一种系统宕机恢复方法、装置、设备和系统
CN116302646A (zh) * 2023-02-24 2023-06-23 荣耀终端有限公司 一种故障定位方法、系统、电子设备及存储介质
CN116302646B (zh) * 2023-02-24 2024-03-29 荣耀终端有限公司 一种故障定位方法、系统、电子设备及存储介质

Also Published As

Publication number Publication date
CN100472471C (zh) 2009-03-25

Similar Documents

Publication Publication Date Title
CN100472471C (zh) 一种计算机操作系统故障现场信息获取的系统和方法
JP6530774B2 (ja) ハードウェア障害回復システム
US9158628B2 (en) Bios failover update with service processor having direct serial peripheral interface (SPI) access
ES2667322T3 (es) Método de tratamiento de fallos, dispositivo relacionado y ordenador
CN101377750B (zh) 一种用于机群容错的系统和方法
JP5120664B2 (ja) サーバシステム及びクラッシュダンプ採取方法
US6502208B1 (en) Method and system for check stop error handling
US20120110378A1 (en) Firmware recovery system and method of baseboard management controller of computing device
US20070006049A1 (en) Preservation of error data on a diskless platform
US7434042B2 (en) Apparatus, method and recording medium for starting up data processing system
JP2002014939A (ja) マルチパーティション・コンピュータ・システム
CN106776128A (zh) 一种保障Linux操作系统正常启动的方法
CN104254840A (zh) 在计算机系统中的存储器转储和分析
CN100472468C (zh) 计算机系统、计算机网络及其方法
US20140108859A1 (en) Core diagnostics and repair
CN109032901A (zh) 一种远程带外ssd的监控方法、装置及受控终端
US20190384666A1 (en) Capturing video data and serial data during an information handling system failure
JP2009104412A (ja) ストレージ装置及びその制御方法
US7917804B2 (en) Systems and methods for CPU repair
TW202223655A (zh) 可自我監視及恢復作業系統運作的電腦系統及方法
CN104360935A (zh) 一种服务器系统崩溃转储收集的方法
US20070234114A1 (en) Method, apparatus, and computer program product for implementing enhanced performance of a computer system with partially degraded hardware
JP4558376B2 (ja) コントローラ
US7673171B2 (en) Systems and methods for CPU repair
CN103123603A (zh) 调试系统及执行调试系统操作的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant