CN101106441A - 减少业务中断时间的方法和装置 - Google Patents

减少业务中断时间的方法和装置 Download PDF

Info

Publication number
CN101106441A
CN101106441A CNA2007101357514A CN200710135751A CN101106441A CN 101106441 A CN101106441 A CN 101106441A CN A2007101357514 A CNA2007101357514 A CN A2007101357514A CN 200710135751 A CN200710135751 A CN 200710135751A CN 101106441 A CN101106441 A CN 101106441A
Authority
CN
China
Prior art keywords
equipment
ecc
internal memory
memory
ecc internal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101357514A
Other languages
English (en)
Other versions
CN101106441B (zh
Inventor
张志龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Xiaoguo Information Service Co., Ltd.
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2007101357514A priority Critical patent/CN101106441B/zh
Publication of CN101106441A publication Critical patent/CN101106441A/zh
Application granted granted Critical
Publication of CN101106441B publication Critical patent/CN101106441B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

本发明实施例公开的一种减少业务中断时间的方法为,当设备因故障而无法正常启动时,判断所述故障是否是由该设备的ECC内存引发,若是,则关闭所述ECC内存的运行;触发设备重新启动,以在启动后恢复业务运行。同时,本发明实施例还公开了一种对设备ECC内存故障检测的方法及装置。本发明能够在当设备发生故障时,及时将检测到出现故障的ECC内存关闭,从而使得设备再启动后,能够恢复业务运行。从而避免了设备业务的长时间中断,减少了设备的业务中断时间。

Description

减少业务中断时间的方法和装置
技术领域
本发明涉及通信技术领域,尤其涉及一种减少业务中断时间的方法和装置。
背景技术
软失效是基于带RAM(Random Access Memory,随机存储器)等存储内存器件特有的失效模式,和硬失效相对应,硬失效是器件的硬件本身发生故障,除此之外,对于器件不能正常运行的情况都称为软失效。通常,器件的工作电压越低,工艺线宽越窄,或者器件工作环境所处的位置海拔越高时,器件的软失效概率越大。例如,采用0.13微米技术的存储器,其软失效的概率高达每兆位10000~100000FITs(Failures In Time,菲特),相当于平均几个月或者几个星期就可能会出现一次软失效。
目前,为了减小由于器件的软失效带来的严重性,一般会在单板等设备上增加一片或多片存储内存用于检测器件软失效,为了方便说明,本申请将增加的所述用于检测器件软失效的内存统称为ECC(Error Checking andCorrecting,检错或纠错)内存,所述ECC内存能够检测设备上的一个或多个器件。单板在每次启动或复位时,所述ECC内存都要对该单板中的器件进行检测,当所述ECC内存检测出单板故障时,单板会重新启动或复位,然后重新进行检测,直到检测正常。
然而,在进行本发明创造过程中,发明人发现现有技术中至少存在如下问题:
由于ECC内存在每次单板启动或重启时,对单板上的RAM器件进行检测,当出现故障,则重新启动该单板。现有技术中无论这种故障是单板上的器件导致还是ECC内存本身出现故障,只要检测不通过,则会重复启动。
因此,如果是由于ECC内存本身出现的故障,而设备单板除ECC内存外的其他器件完全正常,即能够正常执行业务,那么也会由于该ECC内存故障,而导致该单板的业务中断。而这时,只能通过更换设备的单板或者通过冗余系统的倒换等方式,才能使中断的业务恢复正常。因此增大了MTTR(MeanTime To Repair,平均故障修复时间),降低了设备的可用度和运行的可靠性。
发明内容
本发明一个或多个实施例的目的在于提供一种减少业务中断时间的方法和装置,以达到通过及时检测出ECC内存故障,而减少设备业务中断时间的目的。
为解决上述问题,本发明实施例提供了一种减少业务中断时间的方法,包括:
当设备因故障而无法正常启动时,判断所述故障是否是由该设备的ECC内存引发,若是,则关闭所述ECC内存的运行;
触发设备重新启动,以在启动后恢复业务运行。
基于上述技术方案,本发明实施例还提供了一种对设备ECC内存故障检测的方法,包括:
当设备因故障而无法正常启动时,关闭设备中ECC内存的运行;
触发设备重新启动,并
检验该设备是否能够正常启动,若是,则确定该设备的ECC内存发生故障。
基于上述技术方案,本发明实施例还提供了一种用于减少业务中断时间的装置,包括:
触发单元,用于当获知设备因故障而无法正常启动时,向判断单元发送触发信号;
判断单元,用于在收到所述触发信号后,判断所述故障是否是由该设备的ECC内存引发,若是,则判断得到ECC内存故障消息;
ECC内存控制单元,用于在收到所述ECC内存故障消息后,关闭所述ECC内存的运行,并触发设备重新启动,以在启动后恢复业务运行。
基于上述技术方案,本发明实施例还提供了一种用于检测设备ECC内存故障的装置,包括:
触发单元,用于当获知设备因故障而无法正常启动时,向ECC内存控制单元发送触发信号;
所述ECC内存控制单元,用于在收到所述触发信号后,关闭所述ECC内存的运行,并触发设备重新启动,同时通知检验单元进行检验;
检验单元,用于在收到所述通知后,检验该设备是否能够正常启动,若是,则确定该设备的ECC内存发生故障。
与现有技术相比,本发明实施例具有以下优点:
本发明在当设备发生故障时,能够及时将检测到出现故障的ECC内存关闭,从而使得设备再启动后,能够不运行故障的ECC内存,而正常启动,并且恢复业务运行。本发明能够在设备出现故障时,排查故障,并尽可能地克服设备故障,保证设备的正常运行,从而避免了设备业务的长时间中断,减少了设备的业务中断时间。
附图说明
图1为本发明减少业务中断时间的一种方法实施例的流程图;
图2为本发明减少业务中断时间的另一种方法实施例的流程图;
图3为本发明减少业务中断时间的另一种方法实施例的流程图;
图4为本发明减少业务中断时间的另一种方法实施例的流程图;
图5为本发明用于减少业务中断时间的一种装置实施例的结构框图;
图6为本发明用于减少业务中断时间的另一种装置实施例的结构框图;
图7为本发明用于减少业务中断时间的另一种装置实施例的结构框图;
图8为本发明用于检测设备ECC内存故障的一种装置实施例的结构框图。
具体实施方式
本发明实施例提供的一种减少业务中断时间的方法为,当设备因故障而无法正常启动时,例如,设备反复重启,此时判断所述故障是否是由该设备的ECC内存引发,若是,则关闭所述ECC内存的运行;并在关闭后,触发设备重新启动,以在启动后恢复业务运行。
其中,所述判断所述故障是否是由该设备的ECC内存引发的具体实现包括,可通过单独对所述设备的ECC内存进行故障检测,或者通过对设备中除了所述ECC内存外的其他所有RAM存储芯片进行故障检测,通过故障排查,从而得知ECC内存状态,或者通过其他常用手段来检测所述ECC内存的工作状态,其中,采用的任何对所述ECC内存的故障检测方法都不影响对本发明的实现。
本发明在当设备发生故障时,能够及时将检测到出现故障的ECC内存关闭,从而使得设备再启动后,能够不运行故障的ECC内存,而正常启动,并且恢复业务运行。本发明能够在设备出现故障时,排查故障,并尽可能地克服设备故障,保证设备的正常运行,从而避免了设备业务的长时间中断,减少了设备的业务中断时间。
基于上述技术方案,本发明提供的一种对设备ECC内存故障检测的方法,该方法包括以下步骤:
当收到设备因故障而无法正常启动的指令后,关闭设备中的RAM存储内存的运行;
触发设备重新启动,并
检验该设备中的ECC内存是否能够正常工作,若不能,则确定该设备的ECC内存发生故障。
下面结合附图,详细阐述一下采用本发明提供的检测ECC内存故障的方法,来如何实现减少设备的业务中断时间。
如图1所示,为本发明减少业务中断时间的一种方法实施例,该方法当设备单板无法正常启动时,首先检查是否ECC内存发生故障,并将出现故障的ECC内存关闭,以恢复设备的正常业务运行。该方法包括以下步骤:
步骤101:设备的单板启动或复位。其中,所述启动或复位可以发生在该设备的单板上电时,或者是该设备的单板由于在运行中出现了故障,而执行的重新启动或复位。
步骤102:所述单板中的ECC内存检测该单板中的待检测的所有RAM存储芯片是否能正常工作(即是否软失效),如果正常,则执行步骤103;否则,执行步骤104。
步骤103:所述单板在启动后执行业务。并结束本流程。
步骤104:关闭所述单板中的所有待检测的RAM存储芯片的运行,并且重启该单板。其中,所述关闭设置可通过人工手动将单板上的用于控制所述RAM存储芯片运行的使能开关关闭,或由所述单板在重启时自动关闭所述RAM存储芯片的运行,或者其他停止所述RAM存储芯片运行的方法都不影响本发明实施例的实现。
步骤105:所述单板在重启后,检验所述ECC内存是否能正常工作,若正常,则执行步骤106;否则,执行步骤107。
步骤106:确定为该单板上的除所述ECC内存外的其他RAM存储芯片发生故障。此时,所述单板会由于该单板上的RAM存储芯片的故障,而无法正常启动,因此无法正常执行相关业务。此时,则只能通过更换单板来恢复业务。结束本流程。
步骤107:确定为该单板上的ECC内存发生故障。此时,关闭所述单板的ECC内存,使得所述ECC内存在每次该板重启后不会运行,同时,开启所述单板中的所有待检测的RAM存储芯片。之后,再执行步骤108。
步骤108:所述单板重新启动,此时,由于所述单板已经将出现故障的ECC内存关闭了,即暂时消除了单板的故障,所以在重启时,所述单板可正常启动,并在启动后恢复相关的业务正常运行。结束本流程。此外,如果所述单板在重新启动后,仍然不能正常启动,则确定所述单板的RAM存储芯片也出现了故障,此时,只能通知维护人员更换单板。
本发明能够在设备出现故障时,检测是否是设备的ECC内存出现故障,并将出现故障的ECC内存关闭,使得设备在重新启动时,能够不运行发生故障的ECC内存,而正常启动,并且恢复业务运行,避免了设备因ECC内存出现故障而导致单板的业务中断,减少了业务中断的时间。
此外,如图2所示,在上述实施例的基础上,该方法在所述步骤107和步骤108之间,还可包括:
步骤209:所述单板分析所述ECC内存发生故障的原因,并将故障原因保存在该单板的存储单元上。其中,所述存储单元包括但不限于FLASH、BOOTROM。或者,还可直接将所述故障原因写入存储单元的某寄存器中。
并且,在执行完上述实施例中的步骤108之后,还可包括:
步骤210:所述单板根据所记录的ECC内存的故障原因,生成故障报告或者故障日志,并以告警的形式上报。设备维护人员可以通过所述告警及时得知所述单板的故障状态及原因,进行相应的维护。
上述实施例单板能够在确定ECC内存发生故障后,记录ECC内存的故障原因,并在单板重启后,将所述故障原因上报。以便维护人员能够及时了解到所述设备的运行情况,并当发现单板出现故障时,能够及时赶赴现场进行处理。尤其是对于单板的ECC内存故障,由于已将发生故障的ECC内存关闭,单板不启动ECC内存,就能够正常执行业务。维护人员可以根据实际的业务量,选择在夜间或业务量较小的时候,更换单板。从而能够尽大可能地维护业务的正常运行,减少业务中断的时间,及业务中断带来的不利影响。
与此同时,本发明还提供了另一种对设备ECC内存故障检测的方法,该方法包括以下步骤:
当设备因故障而无法正常启动时,关闭设备中ECC内存的运行;
触发设备重新启动,并
检验该设备的RAM存储芯片能够正常工作,以至于使得所述单板能够正常启动,若是,则确定该设备的ECC内存发生故障。
其中,判断所述存储芯片能否正常工作的方法可以为:设备在启动时,设备的CPU通过读取所述RAM存储芯片中的数据,来判断所述存储芯片的状态,当所述RAM存储芯片中的数据能够全部被所述CPU正常读到时,则认为该存储芯片能正常工作。当然,现有的其他对所述RAM存储芯片是否正常的检测手段也同样适用于本发明。
下面结合附图,详细阐述一下采用本发明提供的上述检测ECC内存故障的方法,来如何实现减少设备的业务中断时间。
如图3所示,为本发明减少业务中断时间的另一种方法实施例,与上述实施例不同的是,本实施例在检查是否ECC内存发生故障时,不是直接对ECC内存进行检测,而是通过对单板上除了ECC内存外的其他所有待检测的RAM存储芯片的状态检测,来排查ECC内存状态。该实施例包括以下步骤:
步骤301:设备的单板启动或复位。其中,所述启动或复位可以发生在该设备的单板上电时,或者是该设备的单板由于在运行中出现了故障,而进行的重新启动或复位。
步骤302:所述单板中的ECC内存检测该单板中的待检测的所有RAM存储芯片是否能正常工作(即是否软失效),如果正常,则执行步骤303;否则,执行步骤304。
步骤303:所述单板在启动后执行业务。并结束本流程。
步骤304:关闭所述单板中的ECC内存的运行,使得在重启时不再运行所述ECC内存。重启该单板。其中,所述关闭设置可通过人工手动将单板上的用于控制所述RAM存储芯片运行的使能开关关闭,或由所述单板在重启时自动关闭所述RAM存储芯片的运行,或者其他停止所述RAM存储芯片运行的方法都不影响本发明实施例的实现。
步骤305:所述单板在重启后,检验所述单板上的所有待检测的RAM存储芯片是否能正常工作,以至于使得所述单板能够正常启动,并且进行业务运行,若单板能够正常启动,则执行步骤306;否则,执行步骤307。
步骤306:确定为该单板上的ECC内存发生故障。此时,由于所述单板已经将出现故障的ECC内存关闭了,即暂时消除了故障,所以在重启时,所述单板上的ECC内存不会再对单板上的RAM存储单元进行检测,使得所述单板可正常启动,并在启动后执行相关的业务。结束本流程。
步骤307:确定为该单板上的除所述ECC内存外的其他RAM存储芯片发生故障。此时,所述单板会由于该单板上的RAM存储芯片的故障,而无法正常启动,因此无法正常执行相关业务。此时,则只能通过更换单板来恢复业务。结束本流程。
本发明能够通过在单板首次启动失败时,关闭ECC内存的检测功能,并在之后的单板重新启动中,判断单板是否能够正常启动,从而确定了单板的故障,同时,由于已将出现故障的ECC内存关闭了,使得单板能够正常启动,从而避免了设备因ECC内存出现故障而导致单板的业务中断,减少了业务中断的时间。
此外,如图4所示,在上述实施例的基础上,该方法在所述步骤306之后,还可包括步骤409和步骤410,其中,
步骤409:所述单板分析所述ECC内存发生故障的原因,并将所述原因保存在该单板的存储单元上。其中,所述存储单元包括但不限于FLASH、BOOTROM。或者,还可直接将所述故障原因写入存储单元的某寄存器中。
步骤410:所述单板根据所记录的ECC内存的故障原因,生成故障报告或者故障日志,并以告警的形式上报。设备维护人员可以通过所述告警及时得知所述单板的故障状态及原因,进行相应的维护。
上述实施例单板能够在确定是ECC内存发生故障时,生成ECC内存的故障原因,并将所述故障原因上报,使得维护人员能够及时获知单板故障的原因,并且能够尽可能地在不影响业务的情况下维修故障,从而能够尽大可能地维护业务的正常运行,减少业务中断的时间,及业务中断带来的不利影响。
此外,本发明实施例中所述的设备ECC内存的故障检测方法以及减少业务中断时间的方法并不只针对单板,还同样适用于设备、设备中的功能模块、或者系统中,其检测的方法雷同,因此不再赘述。
基于上述技术方案,本发明实施例还公开了一种用于减少业务中断时间的装置,如图5所示,所述装置包括:触发单元501、判断单元502、ECC内存控制单元503,其中,
所述触发单元501,用于当获知设备因故障而无法正常启动时,向所述判断单元502发送触发信号;
所述判断单元502,用于在收到所述触发信号后,判断所述故障是否是由该设备的ECC内存(图中未示出)引发,若是,则判断得到ECC内存故障消息;
所述ECC内存控制单元503,用于在收到所述判断单元502的ECC内存故障消息后,关闭所述ECC内存(图中未示出)的运行,并触发设备重新启动,以在启动后恢复业务运行。
上述实施例所述触发单元501能够当获知设备无法正常启动时,触发所述判断单元502检测是否是ECC内存(图中未示出)故障导致,所述判断单元502在判断得知所述设备的故障是有ECC(图中未示出)内存引发时,指令所述ECC内存控制单元503关闭所述ECC内存(图中未示出)的运行。从而使得设备在重新启动后,能够不运行发生故障的ECC内存(图中未示出),而正常启动,并且恢复业务运行。本发明能够在设备出现故障时,排查故障,并尽可能地克服设备故障,保证设备的正常运行,从而避免了设备业务的长时间中断,减少了设备的业务中断时间。
此外,如图6所示,其为本发明第二种用于减少业务中断时间的装置实施例的结构框图,该装置包括:触发单元601、判断单元602、ECC内存控制单元603,其中,所述判断单元602中具体包括:RAM存储内存控制单元6021、ECC内存检验单元6022。
所述触发单元601,用于当获知设备因故障而无法正常启动时,发送触发信号;
所述RAM存储内存控制单元6021,用于在收到所述触发单元601的触发信号后,关闭设备中的RAM存储内存(图中未示出)的运行,并触发设备重新启动;
所述ECC内存检验单元6022,用于在所述设备启动中检验该设备中的ECC内存604是否能够正常工作,若否,则向所述RAM存储内存控制单元6021和所述ECC内存控制单元603输出ECC内存故障消息;
所述RAM存储内存控制单元6021,还用于在收到所述ECC内存故障消息后,开启设备中的RAM存储内存(图中未示出)的运行,并向所述ECC内存控制单元603发送触发指令。
所述ECC内存控制单元603,用于在收到所述ECC内存故障消息后,关闭所述ECC内存604的运行,并在收到所述RAM存储内存控制单元6021的触发指令后,触发设备重新启动,以在启动后恢复业务运行。
上述实施例能够在设备出现故障时,所述ECC内存检验单元6022检测是否是设备的ECC内存604出现故障,并在确定ECC内存604出现故障时,指令所述ECC内存控制单元6021将出现故障的ECC内存604关闭,使设备能够在重新启动后,能够不运行发生故障的ECC内存,而正常启动,并且恢复业务运行,避免了设备因ECC内存出现故障而导致单板的业务中断,减少了业务中断的时间。
与此同时,如图7所示,在上述第二个装置实施例的基础上,所述装置还可包括:告警单元701,用于在所述设备重新正常启动后,生成有关ECC内存604的故障原因的故障报告,并将所述故障报告以告警的形式通过发送单元702上报。
此外,所述告警单元701不仅可应用于上述图6所示的第二个装置实施例中,还可应用于上述图5所示的第一个装置实施例中,以及其他可实现本发明方法的等同装置实施例中。
上述实施例单板能够在确定是ECC内存发生故障时,生成ECC内存的故障原因,并将所述故障原因上报,使得维护人员能够及时获知单板故障的原因,并且能够尽可能地在不影响业务的情况下维修故障,从而能够尽大可能地维护业务的正常运行,减少业务中断的时间,及业务中断带来的不利影响。
基于上述技术方案,本发明实施例还公开了一种用于检测设备ECC内存故障的装置,如图8所示,所述装置包括:触发单元801、ECC内存控制单元802、判断单元803,其中,
所述触发单元801,用于当获知设备因故障而无法正常启动时,向所述ECC内存控制单元802发送触发信号;
所述ECC内存控制单元802,用于在收到所述触发信号后,关闭所述ECC内存的运行,并触发设备重新启动,同时通知所述检验单元803进行检验;
所述检验单元803,用于在收到所述通知后,检验该设备是否能够正常启动,若是,则确定该设备的ECC内存发生故障。
上述实施例所述触发单元801能够在设备发生故障时,触发所述ECC内存控制单元802关闭设备的ECC内存,使得在设备重现启动后,所述检验单元803能够检验该设备是否能够正常启动,以便进一步判定该设备故障是否由ECC内存故障引起,方便维护人员及时了解设备的运行状态。同时,由于已经将发生故障的ECC内存关闭,使所述设备能够在重新启动时,恢复业务运行,避免了设备因ECC内存出现故障而导致单板的业务中断,减少了业务中断的时间。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种减少业务中断时间的方法,其特征在于,包括:
当设备因故障而无法正常启动时,判断所述故障是否是由该设备的ECC内存引发,若是,则关闭所述ECC内存的运行;
触发设备重新启动,以在启动后恢复业务运行。
2.如权利要求1所述的减少业务中断时间的方法,其特征在于,判断所述故障是否是由该设备的ECC内存引发具体包括:
关闭设备中的RAM存储内存的运行;及
触发设备重新启动;
检验该设备中的ECC内存是否能够正常工作,若不能,则确定该设备的ECC内存发生故障;
在确定该设备的ECC内存发生故障之后,所述方法还包括:
开启所述设备中的RAM存储内存的运行。
3.如权利要求1或2所述的减少业务中断时间的方法,其特征在于,在确定该设备的ECC内存发生故障之后,该方法还包括:
记录ECC内存的故障原因,并将所述故障原因以告警的形式上报。
4.一种对设备ECC内存故障检测的方法,其特征在于,包括:
当设备因故障而无法正常启动时,关闭设备中ECC内存的运行;
触发设备重新启动,并
检验该设备是否能够正常启动,若是,则确定该设备的ECC内存发生故障。
5.一种用于减少业务中断时间的装置,其特征在于,包括:
触发单元,用于当获知设备因故障而无法正常启动时,向判断单元发送触发信号;
判断单元,用于在收到所述触发信号后,判断所述故障是否是由该设备的ECC内存引发,若是,则判断得到ECC内存故障消息;
ECC内存控制单元,用于在收到所述ECC内存故障消息后,关闭所述ECC内存的运行,并触发设备重新启动,以在启动后恢复业务运行。
6.如权利要求5所述的用于减少业务中断时间的装置,其特征在于,所述判断单元包括:
RAM存储内存控制单元,用于在收到所述触发信号后,关闭设备中的RAM存储内存的运行,并触发设备重新启动,同时通知ECC内存检验单元进行检验;
所述ECC内存检验单元,用于在收到所述通知后,检验该设备中的ECC内存在设备启动时能否正常工作,若否,则输出ECC内存故障消息;
所述RAM存储内存控制单元,还用于在收到所述ECC内存故障消息后,开启设备中的RAM存储内存的运行,并指令所述ECC内存控制单元执行触发设备重新启动功能。
7.如权利要求5或6所述的用于减少业务中断时间的装置,其特征在于,该装置还包括:
告警单元,用于在所述设备重新正常启动后,生成有关ECC内存故障原因的故障报告,并将所述故障报告以告警的形式通过发送单元上报。
8.一种用于检测设备ECC内存故障的装置,其特征在于,包括:
触发单元,用于当获知设备因故障而无法正常启动时,向ECC内存控制单元发送触发信号;
所述ECC内存控制单元,用于在收到所述触发信号后,关闭所述ECC内存的运行,并触发设备重新启动,同时通知检验单元进行检验;
检验单元,用于在收到所述通知后,检验该设备是否能够正常启动,若是,则确定该设备的ECC内存发生故障。
CN2007101357514A 2007-08-10 2007-08-10 减少业务中断时间的方法和装置 Expired - Fee Related CN101106441B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101357514A CN101106441B (zh) 2007-08-10 2007-08-10 减少业务中断时间的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101357514A CN101106441B (zh) 2007-08-10 2007-08-10 减少业务中断时间的方法和装置

Publications (2)

Publication Number Publication Date
CN101106441A true CN101106441A (zh) 2008-01-16
CN101106441B CN101106441B (zh) 2011-05-04

Family

ID=39000148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101357514A Expired - Fee Related CN101106441B (zh) 2007-08-10 2007-08-10 减少业务中断时间的方法和装置

Country Status (1)

Country Link
CN (1) CN101106441B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108255633A (zh) * 2016-12-28 2018-07-06 旺宏电子股份有限公司 存储控制方法、存储装置
US10430260B2 (en) 2016-12-05 2019-10-01 Huawei Technologies Co., Ltd. Troubleshooting method, computer system, baseboard management controller, and system
CN111277469A (zh) * 2020-02-19 2020-06-12 杜义平 网络诊断处理方法、装置、网络系统及服务器
CN117472291A (zh) * 2023-12-27 2024-01-30 苏州元脑智能科技有限公司 数据块的校验方法和装置、存储介质及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1170221C (zh) * 2002-11-18 2004-10-06 威盛电子股份有限公司 可使用除错系统开机的方法及计算机系统
CN100370747C (zh) * 2004-12-02 2008-02-20 华为技术有限公司 一种通信设备及其内部链路故障的定位方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10430260B2 (en) 2016-12-05 2019-10-01 Huawei Technologies Co., Ltd. Troubleshooting method, computer system, baseboard management controller, and system
CN108255633A (zh) * 2016-12-28 2018-07-06 旺宏电子股份有限公司 存储控制方法、存储装置
CN108255633B (zh) * 2016-12-28 2021-07-30 旺宏电子股份有限公司 存储控制方法、存储装置
CN111277469A (zh) * 2020-02-19 2020-06-12 杜义平 网络诊断处理方法、装置、网络系统及服务器
CN117472291A (zh) * 2023-12-27 2024-01-30 苏州元脑智能科技有限公司 数据块的校验方法和装置、存储介质及电子设备
CN117472291B (zh) * 2023-12-27 2024-03-22 苏州元脑智能科技有限公司 数据块的校验方法和装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN101106441B (zh) 2011-05-04

Similar Documents

Publication Publication Date Title
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
CN100450251C (zh) 基站故障检测方法及故障检测系统
CN110427303A (zh) 一种故障告警方法及装置
US20060212754A1 (en) Multiprocessor system
CN101110663A (zh) 实现链路故障处理的方法、系统及装置
CN101106441B (zh) 减少业务中断时间的方法和装置
CN105259863A (zh) 一种plc温备份冗余方法及系统
US7953016B2 (en) Method and system for telecommunication apparatus fast fault notification
CN111031341A (zh) 一种基于心跳的双机热备方法
CN101964724A (zh) 通信单板的节能方法和一种通信单板
CN104283718A (zh) 网络设备及用于网络设备的硬件故障诊断方法
US7664980B2 (en) Method and system for automatic attempted recovery of equipment from transient faults
CN110139153B (zh) 一种视频播放状态检测及播放控制方法与系统
US20070030595A1 (en) Abnormal state determination method and apparatus
CN107391036B (zh) 一种存储的vpd信息访问方法及系统
CN102981925A (zh) 应用于通讯设备的寄存器巡检校验控制方法
CN108335721B (zh) 一种实时检测随机存取存储器地址线故障的方法及系统
US20030233603A1 (en) Method for detecting fault between storage devices, and storage device used for the same
US20220284704A1 (en) Anomaly detection method and system for image signal processor
CN100349125C (zh) 一种对寄存器进行巡检校验的方法
CN103297357A (zh) 网络中继装置
CN115686951A (zh) 一种数据库服务器的故障处理方法和装置
Cisco Troubleshooting the Router
Cisco Troubleshooting the Router
Cisco Troubleshooting the Router

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: CHANGZHOU XIAOGUO INFORMATION SERVICE CO., LTD.

Free format text: FORMER OWNER: HUAWEI TECHNOLOGY CO., LTD.

Effective date: 20140321

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518129 SHENZHEN, GUANGDONG PROVINCE TO: 213164 CHANGZHOU, JIANGSU PROVINCE

TR01 Transfer of patent right

Effective date of registration: 20140321

Address after: 213164 building C, building 407-2-6, Tian An Digital City, 588 Chang Wu Road, Wujin hi tech Industrial Development Zone, Changzhou, Jiangsu, China

Patentee after: Changzhou Xiaoguo Information Service Co., Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: Huawei Technologies Co., Ltd.

C56 Change in the name or address of the patentee
CP02 Change in the address of a patent holder

Address after: 225300 Taizhou City, Jiangsu Province, Gaogang City Road, No. 58

Patentee after: Changzhou Xiaoguo Information Service Co., Ltd.

Address before: 213164 building C, building 407-2-6, Tian An Digital City, 588 Chang Wu Road, Wujin hi tech Industrial Development Zone, Changzhou, Jiangsu, China

Patentee before: Changzhou Xiaoguo Information Service Co., Ltd.

C56 Change in the name or address of the patentee
CP02 Change in the address of a patent holder

Address after: 213164 building C, building 407-2-6, Tian An Digital City, 588 Chang Wu Road, Wujin hi tech Industrial Development Zone, Changzhou, Jiangsu, China

Patentee after: Changzhou Xiaoguo Information Service Co., Ltd.

Address before: 225300 Jiangsu City, Gaogang District, city road, No. 58, No.

Patentee before: Changzhou Xiaoguo Information Service Co., Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110504

Termination date: 20160810