CN104636221A - 一种计算机系统故障处理方法和装置 - Google Patents

一种计算机系统故障处理方法和装置 Download PDF

Info

Publication number
CN104636221A
CN104636221A CN201310559604.5A CN201310559604A CN104636221A CN 104636221 A CN104636221 A CN 104636221A CN 201310559604 A CN201310559604 A CN 201310559604A CN 104636221 A CN104636221 A CN 104636221A
Authority
CN
China
Prior art keywords
computer system
bios
temperature
peripheral hardware
duty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310559604.5A
Other languages
English (en)
Other versions
CN104636221B (zh
Inventor
李耀彬
窦红权
梁婧宇
杨明舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yanxiang Smart Iot Technology Co ltd
Original Assignee
EVOC Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EVOC Intelligent Technology Co Ltd filed Critical EVOC Intelligent Technology Co Ltd
Priority to CN201310559604.5A priority Critical patent/CN104636221B/zh
Publication of CN104636221A publication Critical patent/CN104636221A/zh
Application granted granted Critical
Publication of CN104636221B publication Critical patent/CN104636221B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种计算机系统故障处理方法和装置,方法包括:S1、BIOS检测计算机系统外设的工作状态;S2、判断外设工作状态是否正常,是则执行其他工作,否则执行S3:BIOS检测计算机系统温度;S4、判断系统温度是否属于不正常的外设的正常工作环境温度范围,否则执行S5,是则执行S6;S5、BIOS等待预设时间间隔后执行S6;S6、BIOS全面复位计算机系统。装置包括工作状态检测模块、工作状态判断模块、系统温度检测模块、温度判断模块、延时模块和全面复位模块。通过在BIOS初始化过程中判断外设工作状态及侦测系统环境温度,使不正常的外设重新初始化,提高计算机自修复的能力,减少在维护成本上的支出。

Description

一种计算机系统故障处理方法和装置
技术领域
本发明涉及计算机系统,更具体地说,涉及一种计算机系统故障处理方法和装置。
背景技术
计算机系统由硬件和软件两大部分组成,硬件包括输入设备、输出设备、存储器、运算器以及控制器等,软件包括系统软件和应用软件。基本输入输出系统(Basic Input Output System,BIOS)是一组固化到计算机内主板上一个ROM芯片上的程序,它保存着计算机最重要的基本输入输出的程序、系统设置信息、开机后自检程序和系统自启动程序。
目前BIOS中对各个计算机系统外设(计算机系统中,除了CPU以外的所有设备,包括主板上的其他芯片)的初始化仅仅是在一段有限的时间内进行,过了这段时间后就再也不会对计算机系统外设进行检查。在工控行业中,计算机的使用环境通常都比较恶劣,如低温环境等,环境温度完全无法满足某些计算机系统外设的使用要求,比如某些机械硬盘要求在0℃到60℃之间才能正常工作。另外一种情况就是某些计算机系统外设在当前使用中出现故障,不能正常使用,但是该计算机系统外设并没有损坏,当重新初始化一次后,又能正常使用。由于现有技术中无法对此类故障进行排除,当上述情况发生时,需要维修人员到现场进行查看和维修,而且上述情况中,计算机系统外设并没有损坏,维修人员到现场后只是重启计算机就能够将计算机系统恢复到正常状态,造成人力和资源的浪费。
发明内容
本发明针对现有技术无法对计算机系统外设发生假故障的情况进行排除和处理的缺陷,假故障包括计算机系统外设当前的工作环境温度无法满足其要求而导致该外设无法正常工作的情况,以及计算机系统外设由于自身原因而导致初始化不成功的情况,提供一种计算机系统故障处理方法和装置,能够在计算机系统外设发生假故障时,自动完成修复,降低维护成本。
本发明解决其技术问题采用的技术方案是:提供一种计算机系统故障处理方法,包括以下几个步骤:
S1、通过基本输入输出系统BIOS检测计算机系统外设的工作状态,所述计算机系统外设为计算机系统中除了CPU以外的所有设备;
S2、判断计算系统外设的工作状态是否为正常,若是则执行其他工作,若否则执行步骤S3;
S3、BIOS检测当前计算机系统的温度;
S4、判断检测到的温度是否属于工作状态为不正常的计算机系统外设的正常工作环境温度范围,若否则执行步骤S5,若是则执行步骤S6;
S5、BIOS等待预设时间间隔后执行步骤S6;
S6、BIOS全面复位计算机系统。
优选地,步骤S6包括以下子步骤:
S61、BIOS判断当前的复位次数是否大于或者等于复位次数阈值,若是则执行其他工作,若否则执行子步骤S62;
S62、记录复位次数,并全面复位计算机系统。
优选地,步骤S6还包括以下子步骤:
S63、若当前的复位次数大于或者等于复位次数阈值,则提示外设故障。
优选地,步骤S5包括以下子步骤:
S51、BIOS判断当前的等待次数是否大于或者等于等待次数阈值,若是则执行其他工作,若否则执行子步骤S52;
S52、BIOS记录等待次数,并在等待预设时间间隔后执行步骤S6。
优选地,步骤S5还包括以下子步骤:
S53、若当前的等待次数大于或者等于等待次数阈值,则报警和/或提示当前计算机系统的温度超过计算机系统外设的正常工作环境温度范围。
提供一种计算机系统故障处理装置,包括:
工作状态检测模块,用于通过基本输入输出系统BIOS检测计算机系统外设的工作状态,所述计算机系统外设为计算机系统中除了CPU以外的所有设备;
工作状态判断模块,用于判断计算机系统外设的工作状态是否为正常;
系统温度检测模块,用于在计算机系统外设的工作状态为不正常时,通过BIOS检测当前计算机系统的温度;
温度判断模块,用于判断检测到的温度是否属于工作状态为不正常的计算机系统外设的正常工作环境温度范围;
延时模块,用于在检测到的温度超出工作状态为不正常的计算机系统外设的正常工作环境温度范围时,通过BIOS等待预设时间间隔;
全面复位模块,用于在检测到的温度属于工作状态为不正常的计算机系统外设的正常工作环境温度范围时,或者BIOS等待预设时间间隔后,通过BIOS全面复位计算机系统。
优选地,所述全面复位模块包括:
复位次数判断单元,用于通过BIOS判断当前的复位次数是否大于或者等于复位次数阈值;
全面复位单元,用于在当前的复位次数小于复位次数阈值时,记录复位次数,并全面复位计算机系统。
优选地,所述全面复位模块还包括:
第一提示单元,用于在当前的复位次数大于或者等于复位次数阈值时,提示外设故障。
优选地,所述延时模块包括:
等待次数判断单元,用于通过BIOS判断当前的等待次数是否大于或者等于等待次数阈值;
延时单元,用于在当前的等待次数小于等待次数阈值时,记录等待次数,并通过BIOS等待预设时间间隔。
优选地,所述延时模块还包括:
报警单元,用于在当前的等待次数大于或者等于等待次数阈值时报警;和/或
第二提示单元,用于在当前的等待次数大于或者等于等待次数阈值时,提示当前计算机系统的温度超过计算机系统外设的正常工作环境温度范围。
本发明的计算机系统故障处理方法和装置具有以下有益效果:在BIOS初始化过程中增加对计算机系统外设的工作状态的判断,以及计算机系统环境温度的侦测,然后根据温度侦测的结果对于有温度要求的计算机系统外设做进一步的处理,使其重新初始化,从而有效地解决了因环境温度问题而导致计算机系统外设运行出现故障的问题以及计算机系统外设因自身原因而导致初始化不成功的问题,提高计算机自修复的能力,减少在维护成本上的支出。
附图说明
图1为本发明的计算机系统故障处理方法第一实施例的流程图;
图2为本发明的计算机系统故障处理方法第二实施例的流程图;
图3为本发明的计算机系统故障处理方法第三实施例的流程图;
图4为本发明的计算机系统故障处理装置第一实施例的功能框图;
图5为本发明的计算机系统故障处理装置第一实施例的工作流程图。
具体实施方式
以下结合附图和实施例对本发明做进一步的解释说明。
图1为本发明的计算机系统故障处理方法第一实施例的流程图,如图1所示,在本实施例中,计算机系统故障处理方法包括以下几个步骤:
S1、通过BIOS检测计算机系统外设的工作状态,计算机系统外设为计算机系统中除了CPU以外的所有设备;
S2、判断计算系统外设的工作状态是否为正常,若是则执行其他工作,若否则执行步骤S3;
S3、BIOS检测当前计算机系统的温度;
S4、判断检测到的温度是否属于工作状态为不正常的计算机系统外设的正常工作环境温度范围,若否则执行步骤S5,若是则执行步骤S6;
S5、BIOS等待预设时间间隔后执行步骤S6;
S6、BIOS全面复位计算机系统。
从功能上看,BIOS分为三个部分:第一个部分是用于计算机刚接通电源时对硬件部分的检测,也叫做加电自检(Power On Self Test,简称POST),功能是检查计算机是否良好;第二个部分是初始化,包括创建中断向量、设置寄存器、对一些外部设备进行初始化和检测等;第三个部分是引导程序,功能是引导DOS、Linux或其他操作系统。在计算机操作系统OS启动成功后,BIOS的任务就完成了。在本实施例中,通过在BIOS的第二部分功能处添加相应的代码来实现对上述两种外设假故障的情况进行排除和处理。
在步骤S1中,BIOS在计算机开机过程中检测计算机系统外设的工作状态。计算机系统外设的寄存器中存储有该外设的工作状态标志位,工作状态标志位用于指示该外设处于正常的工作状态还是非正常的工作状态。在步骤S2中,BIOS在计算机开机过程中侦测计算机系统外设的寄存器,通过该外设的工作状态标志位来判断该外设当前的工作状态。以硬盘为例,硬盘的控制器中,BSY(Busy)寄存器用来存储硬盘的工作状态标志位——BSY位,在BIOS过程中,当BSY位为1,则表示硬盘工作状态为不正常,当BSY位为0,则表示硬盘正常工作。若检测到的计算机系统外设的工作状态为正常,则执行其他工作,例如执行BIOS的其他代码。
在步骤S2中,若判断出计算系统外设的工作状态为正常,BIOS则执行其他工作,若判断出计算机系统外设的工作状态为不正常,则执行步骤S3,在步骤S3中,BIOS侦测当前计算机系统的温度。随后,在步骤S4中,BIOS通过将检测到的当前计算机系统的温度与工作状态为不正常的计算机系统外设的正常工作环境温度范围(已知)进行比较,来判断检测到的温度是否属于工作状态为不正常的计算机系统外设的正常工作环境温度范围,若否则执行步骤S5,若是则执行步骤S6。
将计算机系统外设当前的工作环境温度无法满足其要求而导致该外设无法正常工作的情况称为第一类假故障,将计算机系统外设由于自身原因而导致初始化不成功的情况称为第二类假故障。若检测到的当前计算机系统的温度属于工作状态为不正常的计算机系统外设的正常工作环境温度范围,则判断该外设可能发生了第二类假故障,执行步骤S6,在步骤S6中BIOS全面复位(FullReset)计算机系统。FullReset为一种计算机的重启方式,在计算机系统中由相应的指令来实现,当进行FullReset时,整个计算机系统先断电一段时间(约为几秒),然后重启。以普通机械硬盘为例,其工作环境温度一般在0℃到60℃之间,若检测到的当前计算机系统的温度在0℃到60℃之间,则判断检测到的当前计算机系统的温度属于工作状态为不正常的计算机系统外设的正常工作环境温度范围。
若检测到的温度超出工作状态为不正常的计算机系统外设的正常工作环境温度范围,则判断该外设可能发生了第一类假故障,执行步骤S5,在步骤S5中,BIOS等待预设时间间隔,之后执行步骤S6,全面复位计算机系统。以普通机械硬盘为例,其正常工作环境温度范围为0℃到60℃,若检测到的当前计算机系统的温度小于0℃或者大于60℃,则判断检测到的当前计算机系统的温度超出工作状态为不正常的计算机系统外设的正常工作环境温度范围。对于检测到的温度低于工作状态为不正常的计算机系统外设的正常工作环境温度范围的下限值的情况,通过等待预设时间间隔后,由于CPU等主要芯片在运行中发热,会提升计算机机箱内的温度,计算机系统的温度将处于原来工作状态为不正常的计算机系统外设的正常工作环境温度范围之内,全面复位计算机系统后,原来发生第一类假故障的计算机系统外设能够正常工作。对于检测到的温度高于工作状态为不正常的计算机系统外设的正常工作环境温度范围的上限值的情况,由于BIOS等待了预定时间间隔后执行全面复位,等待期间计算机系统温度下降,计算机系统温度将在原来工作状态为不正常的计算机系统外设的正常工作环境温度范围之内,全面复位计算机系统后,原来发生第一类假故障的计算机系统外设能够正常工作。
在本实施例中,无论是计算机系统的温度低于工作状态为不正常的计算机系统外设的正常工作环境温度范围的下限,还是计算机系统的温度高于工作状态为不正常的计算机系统外设的正常工作环境温度范围的上限,BIOS等待的预设时间间隔相同。
在本发明的其他实施例中,计算机系统的温度低于工作状态为不正常的计算机系统外设的正常工作环境温度范围的下限,BIOS等待第一预设时间间隔。计算机系统的温度高于工作状态为不正常的计算机系统外设的正常工作环境温度范围的上限,BIOS等待第二预设时间间隔。第一预设时间间隔与第二预设时间间隔不相等。
在本实施例中,在执行步骤S6之后,计算机系统断电一段时间后重启,随之将返回步骤S1执行,BIOS再次检测计算机系统外设的工作状态,一般而言,对于发生第一类和第二类的假故障的外设,重启之后便能正常工作,即工作状态标志位变为有效,例如变为0,之后将执行其他工作,例如,继续执行BIOS的剩余代码,完成BIOS的所有任务。
本发明的计算机系统故障处理方法第一实施例中,在BIOS初始化过程中增加对计算机系统外设的工作状态的判断,以及计算机系统环境温度的侦测,然后根据温度侦测的结果对有温度要求的计算机系统外设做进一步的处理,使其重新初始化,从而有效地解决了因环境温度问题而导致计算机系统外设运行出现故障的问题以及计算机系统外设因自身原因而导致初始化不成功的问题,提高计算机自修复的能力,减少在维护成本上的支出。
本发明的计算机系统故障处理方法第一实施例可以在BIOS或者UEFI(Unified Extensible Firmware Interface,统一可扩展固件接口)的开发阶段实现;可以根据用户的实际使用情况,针对用户关注的计算机系统外设进行方案设计;可以满足计算机在工控行业的高度可靠性的自检要求,降低计算机开机自检假故障的维修率;增强主板及计算机整机在进入用户系统之前的自诊断功能,保证计算机系统整体的可靠性;在现有的计算机硬件基础上,仅需要更改BIOS,即可实现。
图2为本发明的计算机系统故障处理方法第二实施例的流程图,如图2所示,在本实施例中,计算机系统故障处理方法包括以下步骤:
S1、通过BIOS检测计算机系统外设的工作状态,所述计算机系统外设为计算机系统中除了CPU以外的所有设备;
S2、判断计算系统外设的工作状态是否为正常,若是则执行其他工作,若否则执行步骤S3;
S3、BIOS检测当前计算机系统的温度;
S4、判断检测到的温度是否属于工作状态为不正常的计算机系统外设的正常工作环境温度范围,若否则执行步骤S5,若是则执行步骤S6;
S5、BIOS等待预设时间间隔后执行步骤S6;
S6、BIOS全面复位计算机系统。
本实施例与计算机系统故障处理方法第一实施例的区别在于,步骤S6包括以下子步骤:
S61、BIOS判断当前的复位次数是否大于或者等于复位次数阈值,若是则执行其他工作,若否则记录复位次数并执行子步骤S62;
S62、并全面复位计算机系统。
步骤S5包括以下子步骤:
S51、BIOS判断当前的等待次数是否大于或者等于等待次数阈值,若是则执行其他工作,若否则执行子步骤S52;
S52、BIOS记录等待次数,并在等待预设时间间隔后执行步骤S6。
具体地,在子步骤S61中,当BIOS判断出当前的复位次数大于或者等于复位次数阈值时,执行的其他工作可以包括继续执行BIOS的剩余代码,完成BIOS的所有任务。一般而言,对于发生第一类和第二类的假故障的外设,重启之后便能正常工作,对于当前的复位次数大于或者等于复位次数阈值,但工作状态仍然为不正常的外设,将被认为是发生了实际的故障,执行的其他工作还可以包括提示外设故障(S63)。在子步骤S61中,当BIOS判断出当前的复位次数小于复位次数阈值时,执行子步骤S62,在子步骤S62中记录复位次数,例如复位次数+1,然后全面复位计算机系统。
具体地,在子步骤S51中,当BIOS判断出当前的等待次数大于或者等于等待次数阈值时,执行的其他工作可以包括继续执行BIOS的剩余代码,完成BIOS的所有任务。另外,当BIOS判断出当前的等待次数大于或者等于等待次数阈值时,表明经过多次等待及全面复位后,计算机系统温度仍然超出了工作状态为不正常的计算机系统外设的正常工作温度范围,执行的其他工作还可以包括报警和/或提示当前计算机系统的温度超过计算机系统外设的正常工作环境温度范围(S53)。在子步骤S51中,当BIOS判断出当前的等待次数小于等待次数阈值时,执行子步骤S52,在子步骤S52中BIOS记录等待次数,例如,等待次数+1,并在等待预设时间间隔后执行步骤S61。
在本发明的其他实施例中,计算机系统的温度低于工作状态为不正常的计算机系统外设的正常工作环境温度范围的下限,BIOS等待第一预设时间间隔。计算机系统的温度高于工作状态为不正常的计算机系统外设的正常工作环境温度范围的上限,BIOS等待第二预设时间间隔。第一预设时间间隔与第二预设时间间隔不相等。另外,当计算机系统的温度低于工作状态为不正常的计算机系统外设的正常工作环境温度范围的下限时,且当前等待次数未超过等待次数阈值,则进一步计算检测到的计算机系统的温度与下限值的差值,并根据差值的大小,选择一相应的调整系数来调整第一预设时间间隔,记录等待次数,等待调整后的第一预设时间间隔后,全面复位计算机系统。当计算机系统的温度高于工作状态为不正常的计算机系统外设的正常工作环境温度范围的上限时,且当前等待次数未超过等待次数阈值,则进一步计算检测到的计算机系统的温度与上限值的差值,并根据差值的大小,选择一相应的调整系数来调整第二预设时间间隔,记录等待次数,等待调整后的第二预设时间间隔后,全面复位计算机系统。差值与调整系数的对应关系可以预先建立并存储于计算机中。
本发明的计算机系统故障处理方法第二实施例中,循环执行步骤S1-S6,在BIOS初始化过程中增加对计算机系统外设的工作状态的判断,以及计算机系统环境温度的侦测,然后根据温度侦测的结果对有温度要求的计算机系统外设做进一步的处理,使其重新初始化,从而有效地解决了因环境温度问题而导致计算机系统外设运行出现故障的问题以及计算机系统外设因自身原因而导致初始化不成功的问题,提高计算机自修复的能力,减少在维护成本上的支出。
图3为本发明的计算机系统故障处理方法第三实施例的流程图,如图3所示,在本实施例中,本发明的计算机系统故障处理方法包括以下步骤:
S1、通过BIOS检测计算机系统外设的工作状态,所述计算机系统外设为计算机系统中除了CPU以外的所有设备;
S2、判断计算系统外设的工作状态是否为正常,若是则执行其他工作,若否则执行步骤S3;
S3、BIOS检测当前计算机系统的温度;
S4、判断检测到的温度是否属于工作状态为不正常的计算机系统外设的正常工作环境温度范围,若否则执行步骤S5,若是则执行步骤S6;
S5、BIOS等待预设时间间隔后执行步骤S3;
S6、BIOS全面复位计算机系统。
本实施例与计算机系统故障处理方法第二实施例的区别在于,在本实施例中,当步骤S4中判断出检测到的温度超出工作状态为不正常的计算机系统外设的正常工作环境温度范围,且在子步骤S51中,BIOS判断出当前的等待次数小于等待次数阈值时,执行子步骤S52,在子步骤S52中记录等待次数,例如将等待次数+1,然后BIOS等待预定时间间隔后执行步骤S3。在步骤S3中,BIOS检测当前计算机系统的温度,随后在步骤S4中,将检测到的温度与工作状态为不正常的计算机系统外设的正常工作环境温度范围进行比较,若等待预设时间间隔后,计算机系统的温度已经处于工作状态为不正常的计算机系统外设的正常工作环境温度范围之内,则执行子步骤S61,在子步骤S61中,判断此时复位次数是否大于或者等于复位次数阈值,若否则执行子步骤S62,在子步骤S62中BIOS全面复位计算机系统,若此时复位次数超过复位次数阈值,则执行其他工作,例如报警和/或提示设备故障的信息。若等待预设时间间隔后,计算机系统的温度仍然超出原来工作状态为不正常的计算机系统外设的正常工作环境温度范围,若当前等待次数还未超过等待次数阈值,BIOS则再次等待预设时间间隔后执行步骤S3,若当前等待次数超过了等待次数阈值,则执行其他工作。
在本发明的计算机系统故障处理方法第三实施例中,考虑到等待预设时间间隔后,计算机系统的温度仍然可能超出工作状态为不正常的计算机系统外设的正常工作环境温度范围,因此,在等待预设时间间隔后,首先检测当前的计算机系统的温度,并与工作状态为不正常的计算机系统外设的正常工作环境温度范围进行比较,当当前的计算机系统温度处于工作状态为不正常的计算机系统外设的正常工作环境温度范围之中时,且全面复位的次数未超出复位次数阈值时,进行全面复位,在解决了因环境温度问题而导致计算机系统外设运行出现故障的问题以及计算机系统外设因自身原因而导致初始化不成功的问题的同时,还降低了对计算机系统外设的损坏。
图4为本发明的计算机系统故障处理装置第一实施例的功能框图,如图2所示,在本实施例中,计算机系统故障处理装置200包括:
工作状态检测模块210,用于通过BIOS检测计算机系统外设的工作状态,所述计算机系统外设为计算机系统中除了CPU以外的所有设备;
工作状态判断模块220,用于判断计算机系统外设的工作状态是否为正常;
系统温度检测模块230,用于在计算机系统外设的工作状态为不正常时,通过BIOS检测当前计算机系统的温度;
温度判断模块240,用于判断检测到的温度是否属于工作状态为不正常的计算机系统外设的正常工作环境温度范围;
延时模块250,用于在检测到的温度超出工作状态为不正常的计算机系统外设的正常工作环境温度范围时,通过BIOS等待预设时间间隔;
全面复位模块260,用于在检测到的温度属于工作状态为不正常的计算机系统外设的正常工作环境温度范围时,或者BIOS等待预设时间间隔后,通过BIOS全面复位计算机系统。
在本实施例中,全面复位模块260包括:
复位次数判断单元261,用于通过BIOS判断当前的复位次数是否大于或者等于复位次数阈值;
全面复位单元262,用于在当前的复位次数小于复位次数阈值时,记录复位次数,并全面复位计算机系统;以及
第一提示单元263,用于在当前的复位次数大于或者等于复位次数阈值时,提示外设故障。
延时模块250包括:
等待次数判断单元251,用于通过BIOS判断当前的等待次数是否大于或者等于等待次数阈值;
延时单元252,用于在当前的等待次数小于等待次数阈值时,记录等待次数,并通过BIOS等待预设时间间隔;
报警单元253,用于在当前的等待次数大于或者等于等待次数阈值时报警;和/或
第二提示单元254,用于在当前的等待次数大于或者等于等待次数阈值时,提示当前计算机系统的温度超过计算机系统外设的正常工作环境温度范围。
以下结合图4和图5,以机械硬盘为例来详细说明计算机系统故障处理装置200第一实施例的工作原理。普通机械硬盘的正常工作环境温度范围为0℃到60℃,这种硬盘在低于0℃或者高于60℃的环境温度下都不能正常工作。但在实际使用环境中,存在环境温度低于0℃或者高于60℃的情况。若计算机运行一段时间后,因CPU等主要芯片在运行过程中发热,会提升计算机机箱内的温度,此时虽然外部的环境温度低于0℃,但是计算机机箱内部的环境温度已经能满足硬盘的工作温度,因此在此种情况下,机械硬盘也能正常工作。在硬盘控制器中,BSY(Busy)寄存器用来标示硬盘的状态:在BIOS过程中,当BSY位为1时,表示硬盘工作不正常;当BSY位为0时表示硬盘正常工作。
工作状态检测模块210通过BIOS在开机过程中首先侦测一次BSY寄存器,工作状态判断模块220基于状态监测模块210的检测结果,判断计算机系统外设的工作状态是否为正常,如果BSY位为0时,则不执行后面的过程,按照之前的流程继续执行剩下的BIOS代码。如果BSY位为1时,系统温度检测模块230通过BIOS读取一次计算机系统温度,温度判断模块240将检测到的计算机系统温度与硬盘的正常工作环境温度范围(0℃到60℃)进行比较,以判断检测到的计算机系统温度是否属于工作状态为不正常的计算机系统外设的正常工作环境温度范围。如果计算机系统温度处于在0℃到60℃之间,全面复位模块260的复位次数判断单元261通过BIOS判断当前的FullReset的次数是否大于或者等于2(复位次数阈值),若当前的FullReset的次数小于2,全面复位单元262记录FullReset的次数并进行一次FullReset。当FullReset的次数大于或者等于2时,则继续执行剩下的BIOS代码并通过第一提示单元263提示硬盘已经损坏,请用户更换此硬盘(用户可以根据实际的需要自行设定提示的内容,本发明不限定第一提示单元263所提示的内容)。如果温度小于0℃或者大于60℃时,等待次数判断单元251通过BIOS判断当前的等待次数是否大于或者等于1(等待次数阈值),若是则执行剩下的BIOS代码,并通过报警单元253进行报警,和/或通过第二提示单元254提示用户环境温度过低或者过高,请等待至少半小时之后再重新测试,同时在等待过程中不要关闭计算机(用户可以根据实际的需要自行设定提示的内容,本发明不限定第二提示单元254所提示的内容)。若当前的等待次数小于等待次数阈值时,延时单元252记录等待次数,并在当前侦测时间的基础上等待10分钟(预设时间间隔),随后复位次数判断单元261通过BIOS判断当前的FullReset的次数是否大于或者等于2(复位次数阈值),若当前的FullReset的次数小于2,全面复位单元(262)记录FullReset的次数并进行一次FullReset。
在本实施例中,无论是计算机系统的温度低于工作状态为不正常的计算机系统外设的正常工作环境温度范围的下限,还是计算机系统的温度高于工作状态为不正常的计算机系统外设的正常工作环境温度范围的上限,BIOS等待的预设时间间隔相同。
在本发明的计算机系统故障处理装置200的其他实施例中,计算机系统的温度低于工作状态为不正常的计算机系统外设的正常工作环境温度范围的下限,BIOS等待第一预设时间间隔。计算机系统的温度高于工作状态为不正常的计算机系统外设的正常工作环境温度范围的上限,BIOS等待第二预设时间间隔。第一预设时间间隔与第二预设时间间隔不相等。另外,当温度判断模块240的判断结果为计算机系统的温度低于工作状态为不正常的计算机系统外设的正常工作环境温度范围的下限时,等待次数判断单元251通过BIOS判断当前的等待次数是否大于或者等于等待次数阈值,若是则执行其他工作,若否延时模块250则进一步计算检测到的计算机系统的温度与下限值的差值,并根据差值的大小,选择一相应的调整系数来调整第一预设时间间隔,延时单元252记录等待次数,等待调整后的第一预设时间间隔后,复位次数判断单元261通过BIOS判断当前的FullReset的次数是否大于或者等于复位次数阈值,若否则全面复位单元262记录FullReset的次数并进行一次FullReset。
全面复位计算机系统。当温度判断模块240的判断结果为计算机系统的温度高于工作状态为不正常的计算机系统外设的正常工作环境温度范围的上限时,等待次数判断单元251通过BIOS判断当前的等待次数是否大于或者等于等待次数阈值,若是则执行其他工作,若否延时模块250则进一步计算检测到的计算机系统的温度与上限值的差值,并根据差值的大小,选择一相应的调整系数来调整第二预设时间间隔,延时单元252记录等待次数,等待调整后的第二预设时间间隔后,复位次数判断单元261通过BIOS判断当前的FullReset的次数是否大于或者等于复位次数阈值,若否则全面复位单元262记录FullReset的次数并进行一次FullReset。差值与调整系数的对应关系可以预先建立并存储于计算机中。
本发明的计算机系统故障处理装置200第一实施例,在BIOS初始化过程中增加对计算机系统外设的工作状态的判断,以及计算机系统环境温度的侦测,然后根据温度侦测的结果对于有温度要求的计算机系统外设做进一步的处理,使其重新初始化,从而有效地解决了因环境温度问题而导致计算机系统外设运行出现故障的问题以及计算机系统外设因自身原因而导致初始化不成功的问题,提高计算机自修复的能力,减少在维护成本上的支出。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种计算机系统故障处理方法,其特征在于,包括以下几个步骤:
S1、通过基本输入输出系统BIOS检测计算机系统外设的工作状态,所述计算机系统外设为计算机系统中除了CPU以外的所有设备;
S2、判断计算系统外设的工作状态是否为正常,若是则执行其他工作,若否则执行步骤S3;
S3、BIOS检测当前计算机系统的温度;
S4、判断检测到的温度是否属于工作状态为不正常的计算机系统外设的正常工作环境温度范围,若否则执行步骤S5,若是则执行步骤S6;
S5、BIOS等待预设时间间隔后执行步骤S6;
S6、BIOS全面复位计算机系统。
2.根据权利要求1所述的计算机系统故障处理方法,其特征在于,步骤S6包括以下子步骤:
S61、BIOS判断当前的复位次数是否大于或者等于复位次数阈值,若是则执行其他工作,若否则执行子步骤S62;
S62、记录复位次数,并全面复位计算机系统。
3.根据权利要求2所述的计算机故障处理方法,其特征在于,步骤S6还包括以下子步骤:
S63、若当前的复位次数大于或者等于复位次数阈值,则提示外设故障。
4.根据权利要求1所述的计算机系统故障处理方法,其特征在于,步骤S5包括以下子步骤:
S51、BIOS判断当前的等待次数是否大于或者等于等待次数阈值,若是则执行其他工作,若否则执行子步骤S52;
S52、BIOS记录等待次数,并在等待预设时间间隔后执行步骤S6。
5.根据权利要求4所述的计算机系统故障处理方法,其特征在于,步骤S5还包括以下子步骤:
S53、若当前的等待次数大于或者等于等待次数阈值,则报警和/或提示当前计算机系统的温度超过计算机系统外设的正常工作环境温度范围。
6.一种计算机系统故障处理装置,其特征在于,包括:
工作状态检测模块(210),用于通过基本输入输出系统BIOS检测计算机系统外设的工作状态,所述计算机系统外设为计算机系统中除了CPU以外的所有设备;
工作状态判断模块(220),用于判断计算机系统外设的工作状态是否为正常;
系统温度检测模块(230),用于在计算机系统外设的工作状态为不正常时,通过BIOS检测当前计算机系统的温度;
温度判断模块(240),用于判断检测到的温度是否属于工作状态为不正常的计算机系统外设的正常工作环境温度范围;
延时模块(250),用于在检测到的温度超出工作状态为不正常的计算机系统外设的正常工作环境温度范围时,通过BIOS等待预设时间间隔;
全面复位模块(260),用于在检测到的温度属于工作状态为不正常的计算机系统外设的正常工作环境温度范围时,或者BIOS等待预设时间间隔后,通过BIOS全面复位计算机系统。
7.根据权利要求6所述的计算机系统故障处理装置,其特征在于,所述全面复位模块(260)包括:
复位次数判断单元(261),用于通过BIOS判断当前的复位次数是否大于或者等于复位次数阈值;
全面复位单元(262),用于在当前的复位次数小于复位次数阈值时,记录复位次数,并全面复位计算机系统。
8.根据权利要求7所述的计算机系统故障处理装置,其特征在于,所述全面复位模块(260)还包括:
第一提示单元(263),用于在当前的复位次数大于或者等于复位次数阈值时,提示外设故障。
9.根据权利要求6所述的计算机系统故障处理装置,其特征在于,所述延时模块(250)包括:
等待次数判断单元(251),用于通过BIOS判断当前的等待次数是否大于或者等于等待次数阈值;
延时单元(252),用于在当前的等待次数小于等待次数阈值时,记录等待次数,并通过BIOS等待预设时间间隔。
10.根据权利要求9所述的计算机系统故障处理装置,其特征在于,所述延时模块(250)还包括:
报警单元(253),用于在当前的等待次数大于或者等于等待次数阈值时报警;和/或
第二提示单元(254),用于在当前的等待次数大于或者等于等待次数阈值时,提示当前计算机系统的温度超过计算机系统外设的正常工作环境温度范围。
CN201310559604.5A 2013-11-12 2013-11-12 一种计算机系统故障处理方法和装置 Active CN104636221B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310559604.5A CN104636221B (zh) 2013-11-12 2013-11-12 一种计算机系统故障处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310559604.5A CN104636221B (zh) 2013-11-12 2013-11-12 一种计算机系统故障处理方法和装置

Publications (2)

Publication Number Publication Date
CN104636221A true CN104636221A (zh) 2015-05-20
CN104636221B CN104636221B (zh) 2020-03-17

Family

ID=53215008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310559604.5A Active CN104636221B (zh) 2013-11-12 2013-11-12 一种计算机系统故障处理方法和装置

Country Status (1)

Country Link
CN (1) CN104636221B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105760247A (zh) * 2016-02-05 2016-07-13 浪潮(北京)电子信息产业有限公司 一种硬盘故障处理系统和方法
CN106257372A (zh) * 2015-06-18 2016-12-28 中兴通讯股份有限公司 单板过温处理方法及装置
CN107506251A (zh) * 2017-07-25 2017-12-22 青岛海信电器股份有限公司 对智能设备进行复位的方法及装置
CN107589732A (zh) * 2016-07-06 2018-01-16 深圳市祈飞科技有限公司 一种终端控制机的故障检测方法及系统
CN108008800A (zh) * 2017-11-29 2018-05-08 锐捷网络股份有限公司 一种复位请求处理方法、装置和设备
CN108204334A (zh) * 2016-12-20 2018-06-26 北京金风科创风电设备有限公司 风力发电机组的复位方法和装置
CN109581985A (zh) * 2018-12-17 2019-04-05 同济大学 一种用于海洋仪器接口标准化的水下智能物联装置及方法
CN109726086A (zh) * 2017-10-30 2019-05-07 北京京东尚科信息技术有限公司 测试服务器性能的方法和装置
CN111143120A (zh) * 2019-11-20 2020-05-12 贵州电网有限责任公司 一种计算机故障监测自愈装置
CN111367720A (zh) * 2020-03-04 2020-07-03 北京字节跳动网络技术有限公司 数据保护方法、装置、电子设备及计算机可读存储介质
CN112346430A (zh) * 2019-08-06 2021-02-09 株洲中车时代电气股份有限公司 列车故障保护逻辑的测试方法及装置
CN112783070A (zh) * 2021-01-20 2021-05-11 深圳市雷能混合集成电路有限公司 一种单片机上电处理方法及装置
CN113608912A (zh) * 2021-08-05 2021-11-05 武汉趣慕科技有限公司 一种计算机设备执行系统维护的方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050055474A1 (en) * 2003-09-08 2005-03-10 Chien-Hsin Yang Monitor apparatus for computer system
CN101996122A (zh) * 2009-08-21 2011-03-30 研祥智能科技股份有限公司 一种计算机温度报警方法、装置和计算机系统
CN102141942A (zh) * 2011-04-01 2011-08-03 奇智软件(北京)有限公司 一种设备的监控保护方法及装置
CN102262569A (zh) * 2010-05-26 2011-11-30 深圳华北工控股份有限公司 一种防止cmos设置不当而导致系统bios不稳定的控制方法
CN102693180A (zh) * 2012-05-21 2012-09-26 北京网御星云信息技术有限公司 一种硬件状态的监测方法和系统
CN103345425A (zh) * 2013-05-28 2013-10-09 山东超越数控电子有限公司 一种通过smi中断实现系统风扇转速控制的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050055474A1 (en) * 2003-09-08 2005-03-10 Chien-Hsin Yang Monitor apparatus for computer system
CN101996122A (zh) * 2009-08-21 2011-03-30 研祥智能科技股份有限公司 一种计算机温度报警方法、装置和计算机系统
CN102262569A (zh) * 2010-05-26 2011-11-30 深圳华北工控股份有限公司 一种防止cmos设置不当而导致系统bios不稳定的控制方法
CN102141942A (zh) * 2011-04-01 2011-08-03 奇智软件(北京)有限公司 一种设备的监控保护方法及装置
CN102693180A (zh) * 2012-05-21 2012-09-26 北京网御星云信息技术有限公司 一种硬件状态的监测方法和系统
CN103345425A (zh) * 2013-05-28 2013-10-09 山东超越数控电子有限公司 一种通过smi中断实现系统风扇转速控制的方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106257372A (zh) * 2015-06-18 2016-12-28 中兴通讯股份有限公司 单板过温处理方法及装置
CN105760247A (zh) * 2016-02-05 2016-07-13 浪潮(北京)电子信息产业有限公司 一种硬盘故障处理系统和方法
CN107589732A (zh) * 2016-07-06 2018-01-16 深圳市祈飞科技有限公司 一种终端控制机的故障检测方法及系统
CN108204334B (zh) * 2016-12-20 2019-11-05 北京金风科创风电设备有限公司 风力发电机组的复位方法和装置
CN108204334A (zh) * 2016-12-20 2018-06-26 北京金风科创风电设备有限公司 风力发电机组的复位方法和装置
CN107506251A (zh) * 2017-07-25 2017-12-22 青岛海信电器股份有限公司 对智能设备进行复位的方法及装置
CN107506251B (zh) * 2017-07-25 2021-07-06 海信视像科技股份有限公司 对智能设备进行复位的方法及装置
CN109726086A (zh) * 2017-10-30 2019-05-07 北京京东尚科信息技术有限公司 测试服务器性能的方法和装置
CN108008800A (zh) * 2017-11-29 2018-05-08 锐捷网络股份有限公司 一种复位请求处理方法、装置和设备
CN109581985A (zh) * 2018-12-17 2019-04-05 同济大学 一种用于海洋仪器接口标准化的水下智能物联装置及方法
CN112346430A (zh) * 2019-08-06 2021-02-09 株洲中车时代电气股份有限公司 列车故障保护逻辑的测试方法及装置
CN112346430B (zh) * 2019-08-06 2022-03-08 株洲中车时代电气股份有限公司 列车故障保护逻辑的测试方法及装置
CN111143120A (zh) * 2019-11-20 2020-05-12 贵州电网有限责任公司 一种计算机故障监测自愈装置
CN111367720A (zh) * 2020-03-04 2020-07-03 北京字节跳动网络技术有限公司 数据保护方法、装置、电子设备及计算机可读存储介质
CN112783070A (zh) * 2021-01-20 2021-05-11 深圳市雷能混合集成电路有限公司 一种单片机上电处理方法及装置
CN112783070B (zh) * 2021-01-20 2024-05-07 深圳市雷能混合集成电路有限公司 一种单片机上电处理方法及装置
CN113608912A (zh) * 2021-08-05 2021-11-05 武汉趣慕科技有限公司 一种计算机设备执行系统维护的方法和装置

Also Published As

Publication number Publication date
CN104636221B (zh) 2020-03-17

Similar Documents

Publication Publication Date Title
CN104636221A (zh) 一种计算机系统故障处理方法和装置
CN107122321B (zh) 硬件修复方法、硬件修复系统以及计算机可读取存储装置
US20240086269A1 (en) Method, Apparatus and System for Locating Fault of Server, and Computer-readable Storage Medium
US20120136502A1 (en) Fan speed control system and fan speed reading method thereof
TWI632462B (zh) 開關裝置及偵測積體電路匯流排之方法
CN107111595B (zh) 用于检测早期引导错误的方法、设备及系统
TWI668567B (zh) 伺服器及自動檢修基板管理控制器的方法
US7783872B2 (en) System and method to enable an event timer in a multiple event timer operating environment
US10275330B2 (en) Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus
CN104899109A (zh) 一种操作系统下获取cpu温度的方法
CN110704228B (zh) 一种固态硬盘异常处理方法及系统
US20170091017A1 (en) Fault detecting device and method
CN111897686A (zh) 服务器集群硬盘故障处理方法、装置、电子设备及存储介质
CN104081311A (zh) 用于管理移动设备的操作的装置和方法
CN107133130B (zh) 计算机运行监测方法和装置
US9411666B2 (en) Anticipatory protection of critical jobs in a computing system
US20130198575A1 (en) System error response
CN107818034B (zh) 监测计算机设备中的进程的运行空间的方法以及装置
CN110471800B (zh) 服务器及自动检修基板管理控制器的方法
CN103109265B (zh) 在计算设备中执行系统维护的方法和系统
US11204634B2 (en) Power monitoring and reduction
CN114637644A (zh) 设备异常重启检测方法、装置、计算机设备和介质
CN107179911A (zh) 一种重启管理引擎的方法和设备
CN113590203A (zh) 基板管理控制器失效处理方法及系统、存储介质及单片机
CN110781517A (zh) 一种bios与bmc沟通实现数据交互的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230705

Address after: 518000 1701, Yanxiang Science and Technology Building, No. 31, High-tech Middle 4th Road, Maling Community, Yuehai Street, Nanshan District, Shenzhen, Guangdong Province

Patentee after: Yanxiang smart IOT Technology Co.,Ltd.

Address before: 518057 Guangdong city of Shenzhen province Nanshan District high in the four EVOC Technology Building No. 31

Patentee before: EVOC INTELLIGENT TECHNOLOGY Co.,Ltd.