CN101154170A - 信息处理设备及其控制设备、控制方法和控制程序 - Google Patents

信息处理设备及其控制设备、控制方法和控制程序 Download PDF

Info

Publication number
CN101154170A
CN101154170A CNA2007101028875A CN200710102887A CN101154170A CN 101154170 A CN101154170 A CN 101154170A CN A2007101028875 A CNA2007101028875 A CN A2007101028875A CN 200710102887 A CN200710102887 A CN 200710102887A CN 101154170 A CN101154170 A CN 101154170A
Authority
CN
China
Prior art keywords
messaging device
initialization process
power supply
handled
outage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101028875A
Other languages
English (en)
Other versions
CN100545814C (zh
Inventor
谷村洋一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN101154170A publication Critical patent/CN101154170A/zh
Application granted granted Critical
Publication of CN100545814C publication Critical patent/CN100545814C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2284Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by power-on test, e.g. power-on self test [POST]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Power Sources (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种信息处理设备及其控制设备、控制方法和控制程序。其中,在启动该信息处理设备中的电源时通过对每一硬件部件进行初始化处理来执行硬件诊断处理,该信息处理设备包括:断电初始化处理部,其在该信息处理设备中的电源被切断时执行硬件诊断处理;和断电时机控制部,其控制该信息处理设备中的电源切断时机,以使得在结束由所述断电初始化处理部执行的硬件诊断处理和故障通知处理之后执行该信息处理设备中的电源切断。

Description

信息处理设备及其控制设备、控制方法和控制程序
技术领域
本发明涉及一种信息处理设备及其控制设备、控制方法和使得计算机执行该控制方法的控制程序,尤其涉及一种用于即使在信息处理设备的硬件中发生故障时也能避免妨碍正常运行的情况的信息处理设备及其控制设备、控制方法和使得计算机执行该控制方法的控制程序。
背景技术
例如,对于被称为主机的计算机来说,考虑到应用领域的特点,应避免运行中断的情况,其中所述主机为用以进行与银行等的ATM(即,自动柜员机)相关的信息处理的信息处理设备。
在这种类型的信息处理设备中,在正常运行期间,当仅在电源启动处理期间(即,系统初始化处理和在其中执行硬件诊断处理期间)运行的硬件组件中出现故障时,在进行电源启动处理之前不能检测到该硬件组件中的故障。具体地,例如,在信息处理设备的运行在年底停止时使得该信息处理设备关闭后,在下一年的开始再重新启动该信息处理设备时,才检测到硬件组件的故障。在这种情况下,在下一年开始对该处理设备开始运行之前才能立即检测到硬件组件中的故障。考虑到系统初始化处理所需的时间,通常,根据正式调度的运行启动时间来确定在信息处理设备中启动电源启动处理的实际时间。因此,当在电源启动处理期间检测到硬件组件中的故障时,以及当由于恢复故障而需要替换某些有缺陷的组件时,这些处理需要相应的时间,可出现有故障的情况。即,运行启动可能不会达到上述正式调度的运行启动时间,或者在最坏的情况下,在启动系统之后会出现系统失灵。
图1和图2示出用于说明在现有技术中在启动信息处理设备中的电源时执行的系统启动处理的运行流程图。
在图1中,当在步骤S1中,启动信息处理设备中的电源时,在步骤S2中,根据预定的过程自动执行系统启动处理。当正常结束系统启动处理时,在步骤S3中,完成电源启动处理。
之后,在步骤S4,启动信息处理设备的OS(操作系统)、IPL(初始程序载入程序)等,因此,开始运行信息处理设备。
然后,当在预定关闭期间(例如年底等时间)停止信息处理设备的运行时,在步骤S5,停止OS等,在步骤S6,启动预定电源切断处理,从而在步骤S7,终止信息处理设备的运行。
然后,在关闭期间过去之后,再次开始信息处理设备的运行,在步骤S11,执行电源启动处理。然后,类似地,在步骤S12,执行系统初始化处理。然后,当在步骤S13中为是,即正常结束系统初始化处理时,在步骤S14,开始信息处理设备的正常运行。
然而,当在步骤S13中为否,即在系统初始化处理中的预定系统诊断处理期间检测到硬件中的故障时,在步骤S15,通知远处监控中心的CE(客户工程师),以解决该故障。此外,在步骤S16,响应于硬件故障的检测,在信息处理设备中执行电源切断处理。
当在步骤S15通知远处监控中心时,在图2的步骤S17,CE进行适当的安排,以获得用于替换的必要组件,在步骤S18,实际上执行替换组件的工作。
之后,再次执行信息处理设备中的电源启动处理,在步骤S20,通过步骤S11至S14开始信息处理设备的运行。
假设,在电源切断处理之后终止系统运行的时间为晚上23点,而在下一天系统运行开始的正式调度时间为早上8点。在这种情况下,电源启动处理在例如6点开始,以正常实现上述的早上8点的系统运行开始。
然而,在步骤S12,当在电源启动处理中在系统初始化处理期间检测到硬件故障时,在步骤S17,为获得解决该故障的必要替换组件而进行安排所需的时间需要相当多时间,因此在正式安排的时间(即,早上8点)可能不会实现系统正常运行的启动。因此,实际上,正常运行的启动会因为出现故障而延迟4小时,例如至早上12点。因此,根据现有技术,则难以有效降低系统停止的时间。
特别的,在某些情况,例如在银行中使用的信息处理设备基本上连续运行24小时,仅在年底至下一年初的几天或几个小时才会停止系统运行。在这种情况下,在系统关闭之后的系统运行启动的时间被严格管理。此外,对于例如每年仅能够使系统关闭1次的情况,实际上电源启动处理也是每年仅能执行1次。在这种情况下,很少有机会检测到这种仅在系统初始化处理期间才能发现的故障。因此,当如上所述在系统关闭之后的运行启动时间被延迟时,可能出现例如停止银行中ATM功能的故障。
以下,结合对于电源启动处理唯一的响应错误事件,列出仅在电源启动处理中的系统初始化处理期间运行的硬件组件故障的实例,包括:
1)硬件运行模式寄存器故障:由于用以设置硬件运行模式的寄存器的错误而引起;
2)时钟调谐故障:由于用以保存调谐数据(相位调节数据)的EEPROM(电可擦写可编程ROM)中的错误而引起;
3)微程序/设置文件/时钟调谐文件存储介质故障:由于在SVP(服务处理器)的硬盘驱动器中的错误而引起。
SVP指的是一种控制设备,其是具有用以监控信息处理设备的状态和运行的专用处理器,其通过与执行信息处理设备的基本功能的第一CPU分开配置的第二CPU来实现。对于这种信息处理设备特别配置SVP作为主机,或者作为相对扮演重要角色的装置,以保证信息处理设备的连续运行。
日本特开No.2001-142839公开一种与本发明相关的现有技术。
发明内容
考虑到上述问题,设计出本发明,本发明的一个目的在于提供一种信息处理设备、及其控制设备、控制方法和使得计算机执行该控制方法的程序,使得该信息处理设备被配置为,即使仅在进行电源启动处理中的初始化处理期间可发现的硬件故障出现时,也可以避免运行停止。
为了实现上述目的,根据本发明,在该信息处理设备中的电源被切断时执行系统初始化处理;和控制该信息处理设备中的电源切断的实际时机,以使得在结束硬件诊断处理和故障通知处理之后执行该信息处理设备中的电源切断。
根据本发明的第一方案,提供一种信息处理设备,其在启动该信息处理设备中的电源时执行初始化处理中的硬件诊断处理,该信息处理设备包括:断电初始化处理部,其在该信息处理设备中的电源被切断时执行硬件诊断处理;和断电时机控制部,其控制该信息处理设备中的电源切断时机,以使得在结束由所述断电初始化处理部执行的硬件诊断处理和故障通知处理之后执行该信息处理设备中的电源切断。
根据本发明的第二方案,提供一种用于监控信息处理设备的状态和运行的控制设备,包括:通电初始化处理部,其在该信息处理设备中的电源被启动时执行在初始化处理中的硬件诊断处理;断电初始化处理部,其在该信息处理设备中的电源被切断时执行硬件诊断处理;和断电时机控制部,其控制该信息处理设备中的电源切断时机,以使得在结束由所述断电初始化处理部执行的硬件诊断处理和故障通知处理之后执行该信息处理设备中的电源切断。
根据本发明的第三方案,提供一种用于监控信息处理设备的状态和运行的控制方法,包括如下步骤:通电初始化处理步骤,当该信息处理设备中的电源被启动时执行初始化处理中的硬件诊断处理;断电初始化处理步骤,当该信息处理设备中的电源被切断时执行硬件诊断处理;和断电时机控制步骤,其中控制该信息处理设备中的电源切断时机,以使得在结束由所述断电初始化处理步骤执行的硬件诊断处理和故障通知处理之后执行该信息处理设备中的电源切断。
根据本发明的第四方案,提供一种配置有多个组件的信息处理设备,包括:初始化部,其在该信息处理设备中的电源被切断时执行该信息处理设备的初始化处理;和确定部,在初始化处理中确定所述多个组件中是否有任一个组件出现故障。
根据本发明的第五方案,提供一种配置有多个组件的信息处理设备的控制方法,包括如下步骤:初始化步骤,在该信息处理设备中的电源被切断时执行该信息处理设备的初始化处理;和确定步骤,在初始化处理中确定所述多个组件中是否有任一个组件出现故障。
因此,在停止该信息处理设备时,即在切断电源时,也可以发现在现有技术中在该信息处理设备的运行开始时执行的系统初始化处理中的硬件诊断处理期间发现的硬件故障。
因此,即使对于需要时间进行必要配置以获取为了解决硬件故障而用以替换的组件,也可以在机器关闭期间执行该替换处理。因此,能够有效避免由于硬件故障而在系统运行开始之后发生的系统关闭的问题。
因此,根据本发明,可有效避免在现有技术中由于仅在切断电源时可发现的这种硬件故障而发生的信息处理设备中的运行停止。
附图说明
当结合附图阅读以下详细说明时,本发明的其他目的和进一步特点将变得更加清楚,其中:
图1和图2示出用于说明在现有技术中的问题的运行流程图;
图3示出在本发明一实施例中的信息处理设备(服务器)的硬件配置的实例;
图4示出用于说明在图3中示出的SVP子系统的电源启动功能的功能框图;
图5示出用于说明在图3中示出的SVP子系统的电源切断功能的功能框图;
图6、图7、图8和图9示出用于说明在图3中示出的SVP子系统的电源启动/切断运行的运行流程图;和
图10示出硬件诊断有效/无效设置页的配置示图。
具体实施方式
以下,将描述本发明的实施例。
在本发明的实施例中,当信息处理设备中的电源被切断时,执行用以实施硬件运行诊断的系统初始化处理。因此,则能够快速检测到对于初始化处理独有(即,对于电源启动处理独有)的、任何可能的硬件故障。由此当信息处理设备中的电源切断时能够找到故障。一般地,根据上述预定系统运行正式调度,在再次启动信息处理设备的电源之前有几个小时或几天。因此,能够进行适当配置,以获得为解决故障而替换的必要组件。因此,在实际开始系统运行之后能够避免发生其它方式的信息处理设备的系统失灵。
应注意的是,为了与现有技术中执行的在启动信息处理设备的电源时实施的硬件诊断处理区分,以下在本发明的实施例中,将电源切断时执行的硬件诊断处理称为“电源切断诊断处理”。
在电源切断诊断处理中,当信息处理设备中的电源启动时,在现有技术中实现的这些项目中,系统初始化处理的所有项目(除用以连接至SSU(以下描述)的处理)在启动信息处理设备中的电源时执行。
当在电源切断诊断处理中发现硬件故障时,将该故障通知给远处监控中心,然后进行必要的安排以获得用于替换的组件,并在正式调度的系统运行启动时间之前的关闭时间内完成相应的组件替换。因此,能够避免在开始系统运行之后出现的系统关闭的故障情况。
此外,必须防止上述向远程监控中心的通知未被完全执行,这种情况是由于在通知错误期间切断在信息处理设备中的电源而引起的。为此,配置这样的结构,使得在完成通知错误之后执行在信息处理设备中的电源的实际切断。因此,能够确定地完成到远程监控中心的通知。
由多个信息处理设备经由通信网络来共享上述SSU(系统存储单元)。当其中一个信息处理设备中的电源被切断时,该信息处理设备执行处理,以从SSU断开。根据本发明实施例,在执行从SSU断开的处理之后执行电源切断诊断处理。因此,如果与启动信息处理设备中的电源时所执行的启动处理完全相同的启动处理也在电源切断诊断处理中执行,则执行连接至SSU的处理,该处理包括在启动信息处理设备中的电源时执行的初始化处理中。因此,断开的SSU再次连接至信息处理设备。此外,在电源切断诊断处理之后,在信息处理设备中的电源在已经执行了从SSU断开处理的情况下将被切断。因此,在信息处理设备中的电源将有问题地切断,同时SSU却保持与信息处理设备的连接。为了避免这种问题情况,优选地,在本发明实施例的电源切断诊断处理中不包括至SSU的连接的处理(即,为用以连接至SSU而配置的组件的初始化处理的相应项目)。
本发明的优选实施例具有以下特点:
1)当信息处理设备中的电源被切断时,在系统初始化处理中执行硬件诊断。因此,则能够快速诊断出任何可能的故障,从而在正式调度的系统运行开始时间之前能够实现恢复。
2)上述系统初始化处理与I/O(外部接口电路)电源切断处理并行执行。因此,与现有技术相比,能够最小化在信息处理设备中电源切断时额外执行系统初始化处理所需的额外所需时间。
3)此外,仅当正确完成了在信息处理设备中的供电开始时所执行的系统初始化处理时,才随后实际执行在信息处理设备中的供电切断时所执行的系统初始化处理。即,当没有正确完成在信息处理设备中的供电开始时所执行的系统初始化处理时,则已经发出预定故障通知。如果在这种情况下在信息处理设备中的供电切断时也执行系统初始化处理,则系统初始化处理将不再会正确完成,因此,将再次向远程监控中心重复通知相同的故障。
4)此外,优选地,为上述向远程监控中心通知故障而提供通信处理时间(固定值)。然后,优选地,在经过通信处理时间之后,切断电源。因此,能够绝对保证通知故障所需的必要时间。
5)此外,在切断电源时执行上述系统初始化处理对于以下情况并不是必要的:例如,在信息处理设备等的实际运行之前进行的试运行。在这种情况下,优选地,提供预定设置信息和设置测量(即,在显示设备上显示的预定页面上的用户操作),以随意防止实际执行在切断信息处理设备的电源时所执行的初始化处理。因此,能够省略在切断信息处理设备中的电源时执行的系统初始化处理的实际执行。
根据本发明的实施例,能够通过预先检测在现有技术中为了开始系统运行而开启信息处理设备中的电源时可检测的硬件故障,避免在开始系统运行之后可能出现的系统关闭。
接下来,将详细描述本发明实施例的配置。
图3示出根据本发明实施例的服务器500的实例的硬件结构框图。
如图3所示,服务器500包括主系统100和SVP子系统200。
主系统100是用以执行服务器500的基本功能的处理器部。例如,主系统100执行关于银行业务、ATM等的信息处理功能。另一方面,SVP子系统200是用以监控和控制主系统100的运行的另一处理部,以保证主系统100正确执行预定操作,例如对应于上述基本功能的操作。
主系统100包括:CPU 101,用以通过执行在给定程序中写入的指令来执行各种操作;输入部(也称操作部)102,例如键盘、鼠标等,用以由用户输入操作内容或数据;显示部103,例如CRT、液晶显示设备等,用以向用户显示CPU 101的处理进程、处理结果;存储器104,例如ROM、RAM等,用以存储待由CPU 101执行的程序,或者可用作CPU 101的工作区;硬盘驱动器105,用于存储程序、数据等;CD-ROM驱动器106,用以通过使用CD-ROM 107作为信息记录介质来从外部加载程序或数据;通信单元108,用以经由通信网络300(例如互联网、LAN、WAN等)与外部服务器进行通信;和外部接口电路(IF)110,用以向/从外部设备400输入/输出信号。
类似地,SVP子系统200包括:CPU 201,用以通过执行在给定程序中写入的指令来执行各种操作;输入部202,例如键盘、鼠标等,用以由用户输入操作内容或数据;显示部203,例如CRT、液晶显示设备等,用以向用户显示CPU 201的处理进程、处理结果;存储器204,例如ROM、RAM等,用以存储待由CPU 201执行的程序,或者可用作CPU 201的工作区;硬盘驱动器205,用于存储程序、数据等;CD-ROM驱动器206,用以通过使用CD-ROM 207作为信息记录介质来从外部加载程序或数据;和通信单元208,用以经由通信网络300(例如互联网、LAN、WAN等)与外部服务器进行通信。
在本发明实施例中,如以下参照图4至图10所述,SVP子系统200经由CD-ROM 207或经由通信网络300加载或卸载包含CPU 201指令的程序,以执行用于信息处理设备的控制方法。然后,将该程序安装在硬盘驱动器205中,从存储器204中正确加载该程序,以及由CPU 201来执行该程序。由此,实现在本发明实施例中的信息处理设备的控制方法。
图4示出作为SVP子系统200的功能块的电源启动控制部10的框图;图5示出作为SVP子系统200的另一功能块的电源切断控制部20的框图。由CPU 201根据程序来执行电源启动控制部10和电源切断控制部20的功能。
电源启动控制部10包括:初始化处理启动部11、初始化处理部12、初始化处理结果确定部13、通知部14、运行启动部15和电源启动故障结束部16。
初始化处理启动部11从外部接收预定设备电源启动指令,并启动预定系统初始化处理。初始化处理部12根据初始化处理启动部11的指令执行包含初始化诊断的系统初始化处理(随后将参照图9描述)。
初始化处理结果确定部13确定是否已经正确结束由初始化处理部12执行的系统初始化处理。作为初始化处理结果确定部13的确定结果,当确定未正确结束初始化处理,并且已经检测到故障时,通知部14向远程监控中心的CE通知发生故障。应注意的是,通知部14还具有向远程监控中心通知对于相应情况已经正确结束初始化处理的功能。此外,当初始化处理结果确定部13已经检测到故障时,电源启动故障结束部16停止具有故障的服务器500。这表示,由于存在故障,服务器500结束其运行,但是并不一定表示服务器500中的电源被切断。因此,在这种情况下,服务器500可以在电源开启的情况下结束其运行。
当初始化处理结果确定部13的确定结果表示已经正确结束初始化处理时,运行启动部15输出这种指令至主系统100,以启动预定常规处理。
图5中所示的电源切断控制部20包括:初始化处理启动部21、初始化处理部22、初始化处理结果确定部23、通知部24、延迟部25和电源切断部26。
初始化处理启动部21从外部接收预定设备电源启动指令,并启动预定系统初始化处理。初始化处理部22根据初始化处理启动部21的指令执行系统初始化处理(随后将参照图9描述;并且在这种情况下,如上所述,系统初始化处理不包括连接SSU的处理)。
初始化处理结果确定部23确定是否已经正确结束由初始化处理部22执行的系统初始化处理。
作为初始化处理结果确定部23的确定结果,当确定未正确结束初始化处理,并且已经检测到故障时,通知部24向远程监控中心的CE通知发生故障。
在初始化处理结果确定部23输出确定结果之后,或者进而在通知部24执行上述通知处理时经过由延迟部25设置的预定延迟时间之后,电源切断部26切断服务器500中的核心电源,即切断对参照图3所述的服务器500中除外部接口电路110之外的各部件(即,CPU 101、201、存储器104、204等)的电源。
与系统初始化处理部22执行系统初始化处理并行,电源切断部26执行处理以切断在外部接口电路110中的电源。
延迟部25延迟由电源切断部26执行的电源切断处理某一时间段,在该延迟时间段期间可确定地完成由通知部24执行的上述通知处理。由此,通知部24可以在不受由电源被切断产生的干扰的情况下正确执行通知处理。
接下来,参照图6至图8,将描述由SVP子系统200执行的操作流程。
当SVP子系统200从外部接收预定设备电源启动指令时,在步骤S31,由电源启动控制部10开始电源启动处理。应注意的是,在本发明实施例中,假设电源启动处理在上午6点开始。然后,在步骤S32,初始化处理启动部11开始系统初始化处理,初始化处理部12实际执行系统初始化处理。
然后,在步骤S33,初始化处理结果确定部13确定是否已经正确结束系统初始化处理。当确定结果为在系统初始化处理中已经检测到故障(否)时,则在步骤S34,初始化处理结果确定部13具有的预定初始化状态标记被设置为“失败”状态。然后,如上所述,通知部14执行通知处理,进而在步骤S34A,电源启动故障结束部16执行预定故障结束处理。
另一方面,当初始化处理结果确定部13表示已经正确结束系统初始化处理时,即步骤S33为是时,则在步骤S35,将上述初始化处理标记设置为“成功”状态,并完成电源启动。然后,运行启动部15提供一指令使得主系统100开始常规运行。在步骤S37,由此接收到该指令的主系统100启动OS(操作系统)、IPL(初始程序载入器)等,并开始常规操作,即例如关于银行的ATM的信息处理。
接下来,当在服务器500的常规操作期间从外部接收到预定设备电源切断指令时,在步骤S38,停止主系统100的OS,在步骤S39,在SVP子系统200中的电源切断控制部20开始电源切断处理。在电源切断处理中,在步骤S40,执行预定系统封锁(lock-out)处理、SSU断开处理等。
接下来,在步骤S42,电源切断控制部20的初始化处理部22在实际启动预定系统初始化处理之前(在这种情况下,不包括与SSU的连接处理)确定预定硬件诊断设置(随后描述)是否有效。此外,在步骤S41,电源切断部26启动电源切断处理,以切断在外部接口电路110中的电源。
上述硬件诊断设置表示对于在实际启动服务器500等的常规操作之前执行的测试运行的情况等使得在电源切断处理中的系统初始化处理无效的信息设置。由CE来执行该设置。例如,从SVP子系统200的显示设备203的显示屏幕上显示的如图10所示的页面,将预定项目(即“IDIAGAT SYSTEM POWER STAND-BY”项目)设置为“D”,从而在电源切断处理中跳过系统初始化处理。
当该硬件诊断设置信息被设置为“D”时,即设置为在电源切断处理中跳过系统初始化处理时,步骤S42的确定结果为否,因此跳过系统初始化处理。然后,电源切断部26执行如上所述的电源切断处理。即,在步骤S41A,服务器500的核心电源(即,如上所述各部件中的电源,即CPU 101、201、存储器104、204等的电源)被切断,因此在步骤S41,如上所述完成外部接口电路110的电源切断处理,从而完成电源切断处理。
另一方面,当在步骤S42的确定结果中硬件诊断设置被设置为“E”时,即,当设置为在电源切断处理中执行系统初始化处理时,步骤S42的确定结果为是。在这种情况下,在步骤S44,初始化处理启动部21读取上述初始化状态标记,以确定在电源启动中的系统初始化处理是否成功。由此,当确定表示已经正确结束电源启动中的初始化处理的“成功”被设置为初始化状态标记时(即,图6的步骤S35,然后图7的步骤S44中为是),在步骤S45,初始化处理部22执行系统初始化处理。然而,在这种情况下,如上所述,执行除了与SSU连接的处理之外的系统初始化处理。
另一方面,当在初始化处理标记中设置为“失败”时,即在步骤S44中为否,这表示在如上所述的电源启动中的系统初始化处理中已经检测到故障,即图6的步骤S34,则如上所述系统初始化处理将不再执行。因此,跳过系统初始化处理,同样,在步骤S41A,切断服务器500的核心电源(即在各部件中的电源,即CPU 101、201、存储器104、204的电源),因此在步骤S41,完成外部接口电路110的电源切断处理,从而完成电源切断处理。
在结束步骤S45中的系统初始化处理之后,初始化处理结果确定部23确定是否正确结束系统初始化处理。当作为确定的结果检测到故障时,即在步骤S46中为否,即,当例如已经检测到CPU运行模式寄存器故障时,在步骤S47,电源切断控制部20的通知部24执行到远程监控中心的CE的通知。进而,在步骤S48,电源切断控制部20的延迟部25将电源切断部26执行的电源切断处理延迟某一预定时间,在该时间期间可确定地完成通知部24的上述通知处理。因此,由于电源被切断,所以通知处理可以在不受干扰的情况下执行。
在步骤S46,初始化处理结果确定部23输出确定结果之后,或者进而在步骤S47和S48,通知部24已经执行上述通知处理时经过由延迟部设置的预定延迟时间之后,在步骤S41A,电源切断部26切断服务器500中的上述核心电源。然后,在步骤S41完成外部接口电路110的电源切断处理,从而完成步骤S43的电源切断处理。
此外,在步骤S49,响应于向远程监控中心的通知,远程监控中心的CE作出必要配置,以获得用以替换的必要组件。于是,在步骤S50执行组件替换处理。之后,在步骤S51执行在服务器500中启动电源的必要操作测试。然后,在步骤S52再次执行电源切断处理。
如图6和图7所示,假设在22:30启动步骤S39的电源切断处理,例如甚至需要5个小时用于进行用以获得替换的组件的上述配置、实际替换处理、在替换之后的运行测试,然后在步骤S45,在系统初始化处理中检测到故障的情况下(在步骤S46为否)的再次电源切断处理,一直到步骤S52所需的所有处理可在第二天上午4点之前结束。因此,在第二天,在图8的步骤S61,在6点启动电源,然后在步骤S62执行与步骤S32相同的系统初始化处理,因此在步骤S63,可以在两小时之后,即对应于上述正式安排的系统启动时间的8点启动系统操作(常规操作)。
因此,根据本发明实施例,即使发生在现有技术中的电源启动处理中检测到的硬件故障时,在电源切断处理中可预先检测到该故障。因此,在正式调度的操作开始时间之后,可有效保证必要处理所需的必要时间,即用以替换组件的配置、实际替换处理和操作验证,因此能够防止已安排的系统操作受到阻碍。
图9示出上述系统初始化处理(步骤S32、S45和S65中的每一个)的操作流程的操作流程图。
如图9所示,例如顺序执行上述系统初始化处理、服务器500的硬件的初始化,即在步骤S71的各寄存器的初始化、在步骤S72的各时钟信号的初始化、在步骤S73的CPU 101和201的初始化和在步骤S74的存储器104和204的初始化。
然后,在步骤S75,确定当前初始化处理是对应于在电源启动处理中执行的初始化处理(图6中的步骤S32和图8中的步骤S62中的每一个)还是在电源切断处理中执行的初始化处理(图7的步骤S45,即上述“电源切断诊断处理”)。在当前初始化处理对应于在电源切断处理中执行的初始化处理时(是),在步骤S75中为是,如上所述,在步骤S76跳过与SSU的连接的处理。
本发明不限于上述实施例,在不脱离本发明以下权利要求所要求的基本概念的情况下可以进行各种修改和改变。
本发明基于并要求2006年9月27日提交的日本专利申请No.2006-263124的优先权,在此通过参考援引其全部内容。

Claims (33)

1.一种信息处理设备,其在启动该信息处理设备中的电源时执行初始化处理中的硬件诊断处理,该信息处理设备包括:
断电初始化处理部,其在该信息处理设备中的电源被切断时执行硬件诊断处理;和
断电时机控制部,其控制该信息处理设备中的电源切断时机,以使得在结束由所述断电初始化处理部执行的硬件诊断处理和故障通知处理之后执行该信息处理设备中的电源切断。
2.如权利要求1所述的信息处理设备,其中所述断电初始化处理部与该信息处理设备的输入/输出部中的电源切断处理并行地执行硬件诊断处理。
3.如权利要求1所述的信息处理设备,其中所述断电初始化处理部确定在启动了该信息处理设备中的电源时执行的硬件诊断处理是否已经正确结束,并且仅当确定结果为确定在启动了该信息处理设备中的电源时执行的硬件诊断处理已经正确结束时,所述断电初始化处理部才在切断该信息处理设备中的电源时执行硬件诊断处理。
4.如权利要求1所述的信息处理设备,还包括:
通知部,当在所述断电初始化处理部切断该信息处理设备中的电源时执行的硬件诊断处理的结果为发现故障时,该通知部向预定远程监控中心发出通知;其中
当所述通知部执行通知处理时,所述断电时机控制部将该信息处理设备中的电源切断时机延迟某一时间段,在该时间段期间能够完成该通知处理。
5.如权利要求1所述的信息处理设备,还包括:
设置操作部,通过由操作者进行预定操作,使得能够在所述断电初始化处理部切断该信息处理设备中的电源时省略硬件诊断处理的执行。
6.如权利要求1所述的信息处理设备,其中所述断电初始化处理部由第二控制部配置,所述第二控制部与为了执行该信息处理设备的基本功能而配置的第一控制部分开配置,所述第二控制部被配置为用以监控该信息处理设备的状态和运行。
7.如权利要求1所述的信息处理设备,其中在该硬件诊断处理中检测到故障时设置用于通知故障的通信处理时间,并且所述断电时机控制部在经过该通信处理时间之后切断该信息处理设备中的电源。
8.如权利要求1所述的信息处理设备,还包括:
配置为用于在切断该信息处理设备中的电源时省略硬件诊断处理的执行的部件。
9.一种用于监控信息处理设备的状态和运行的控制设备,包括:
通电初始化处理部,其在该信息处理设备中的电源被启动时执行在初始化处理中的硬件诊断处理;
断电初始化处理部,其在该信息处理设备中的电源被切断时执行硬件诊断处理;和
断电时机控制部,其控制该信息处理设备中的电源切断时机,以使得在结束由所述断电初始化处理部执行的硬件诊断处理和故障通知处理之后执行该信息处理设备中的电源切断。
10.如权利要求9所述的控制设备,其中所述断电初始化处理部与该信息处理设备的输入/输出部中的电源切断处理并行地执行硬件诊断处理。
11.如权利要求9所述的控制设备,其中所述断电初始化处理部确定在启动了该信息处理设备中的电源时执行的硬件诊断处理是否已经正确结束,并且仅当确定结果为确定在启动了该信息处理设备中的电源时执行的硬件诊断处理已经正确结束时,所述断电初始化处理部才在切断该信息处理设备中的电源时执行硬件诊断处理。
12.如权利要求9所述的控制设备,还包括:
通知部,当在所述断电初始化处理部切断该信息处理设备中的电源时执行的硬件诊断处理的结果为发现故障时,该通知部向预定远程监控中心发出通知;其中
当所述通知部执行通知处理时,所述断电时机控制部将该信息处理设备中的电源切断的时机延迟某一时间段,在该时间段期间能够完成该通知处理。
13.如权利要求9所述的控制设备,还包括:
设置操作部,通过由操作者进行预定操作,使得能够在所述断电初始化处理部切断该信息处理设备中的电源时省略硬件诊断处理的执行。
14.如权利要求9所述的控制设备,其中在该硬件诊断处理中检测到故障时设置用于通知故障的通信处理时间,并且所述断电时机控制部在经过该通信处理时间之后切断该信息处理设备中的电源。
15.如权利要求9所述的控制设备,还包括:
配置为用于在切断该信息处理设备中的电源时省略硬件诊断处理的执行的部件。
16.一种用于监控信息处理设备的状态和运行的控制方法,包括如下步骤:
通电初始化处理步骤,当该信息处理设备中的电源被启动时执行初始化处理中的硬件诊断处理;
断电初始化处理步骤,当该信息处理设备中的电源被切断时执行硬件诊断处理;和
断电时机控制步骤,其中控制该信息处理设备中的电源切断时机,以使得在结束由所述断电初始化处理步骤执行的硬件诊断处理和故障通知处理之后执行该信息处理设备中的电源切断。
17.如权利要求16所述的控制方法,其中所述断电初始化处理步骤与该信息处理设备的输入/输出部中的电源切断处理并行地执行硬件诊断处理。
18.如权利要求16所述的控制方法,其中所述断电初始化处理步骤确定在启动了该信息处理设备中的电源时执行的硬件诊断处理是否已经正确结束,并且仅当确定结果为确定在启动了该信息处理设备中的电源时执行的硬件诊断处理已经正确结束时,所述断电初始化处理步骤才在切断该信息处理设备中的电源时执行硬件诊断处理。
19.如权利要求16所述的控制方法,还包括如下步骤:
通知步骤,当在所述断电初始化处理步骤切断该信息处理设备中的电源时执行的硬件诊断处理的结果为发现故障时,该通知步骤向预定远程监控中心发出通知;其中
当所述通知步骤执行通知处理时,所述断电时机控制步骤延迟该信息处理设备中的电源切断时机,以使得能够完成该通知处理。
20.如权利要求16所述的控制方法,还包括如下步骤:
设置操作步骤,通过由操作者进行预定操作,使得能够在所述切断初始化处理步骤切断该信息处理设备中的电源时省略硬件诊断处理的执行。
21.如权利要求16所述的控制方法,其中所述断电初始化处理步骤由第二控制部来执行,所述第二控制部与为了执行该信息处理设备的基本功能而配置的第一控制部分开配置,所述第二控制部被配置为用以监控该信息处理设备的状态和运行。
22.如权利要求16所述的控制方法,其中在该硬件诊断处理中检测到故障时设置用于通知故障的通信处理时间,并且所述断电时机控制步骤在经过该通信处理时间之后切断该信息处理设备中的电源。
23.如权利要求16所述的控制方法,还包括如下步骤:
用于在切断该信息处理设备中的电源时省略硬件诊断处理的执行的步骤。
24.一种包含有使得计算机执行以下步骤的指令的控制程序,该控制程序被配置为用以控制信息处理设备的运行,所执行的步骤包括:
通电初始化处理步骤,当该信息处理设备中的电源被启动时执行在初始化处理中的硬件诊断处理;
断电初始化处理步骤,当该信息处理设备中的电源被切断时执行硬件诊断处理;和
断电时机控制步骤,其中控制该信息处理设备中的电源切断时机,以使得在结束由所述断电初始化处理步骤执行的硬件诊断处理和故障通知处理之后执行该信息处理设备中的电源切断。
25.一种配置有多个组件的信息处理设备,包括:
初始化部,其在该信息处理设备中的电源被切断时执行该信息处理设备的初始化处理;和
确定部,在初始化处理中确定所述多个组件中是否有任一个组件出现故障。
26.如权利要求25所述的信息处理设备,还包括:
通知部,其在所述确定部确定所述多个组件中有任一个组件出现故障时通知出现了故障。
27.如权利要求25所述的信息处理设备,还包括:
电源控制部,在完成初始化处理之后切断所述信息处理设备中的电源,并在所述通知部执行通知处理时延迟在该信息处理设备中的电源切断,直至完成通知处理。
28.如权利要求25所述的信息处理设备,其中所述初始化部在该信息处理设备中的电源启动时执行该信息处理设备的初始化处理,并且当在电源启动运行中确定在所述组件中出现故障时,所述初始化部在切断所述信息处理设备的电源时不执行初始化处理。
29.一种配置有多个组件的信息处理设备的控制方法,包括如下步骤:
初始化步骤,在该信息处理设备中的电源被切断时执行该信息处理设备的初始化处理;和
确定步骤,在初始化处理中确定所述多个组件中是否有任一个组件出现故障。
30.如权利要求29所述的信息处理设备的控制方法,还包括如下步骤:
通知步骤,在所述确定步骤确定所述多个组件中有任一个组件出现故障时通知出现了故障。
31.如权利要求29所述的信息处理设备的控制方法,还包括如下步骤:
电源控制步骤,在完成初始化处理之后切断所述信息处理设备中的电源,并在所述通知步骤执行通知处理时延迟在该信息处理设备中的电源切断,直至完成通知处理。
32.如权利要求29所述的信息处理设备的控制方法,其中:
所述初始化步骤在该信息处理设备中的电源启动时执行该信息处理设备的初始化处理,并且当在电源启动运行中确定在所述组件中出现故障时,所述初始化步骤在切断所述信息处理设备中的电源时不执行初始化处理。
33.一种包含有使得计算机执行以下步骤的指令的控制程序,该控制程序被配置为用以控制信息处理设备的运行,该信息处理设备配置有多个组件,所执行的步骤包括:
初始化步骤,在该信息处理设备中的电源被切断时执行该信息处理设备的初始化处理;和
确定步骤,在初始化处理中确定所述多个组件中是否有任一个组件出现故障。
CNB2007101028875A 2006-09-27 2007-05-11 信息处理设备及其控制设备、控制方法 Expired - Fee Related CN100545814C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006263124A JP4836732B2 (ja) 2006-09-27 2006-09-27 情報処理装置
JP2006263124 2006-09-27

Publications (2)

Publication Number Publication Date
CN101154170A true CN101154170A (zh) 2008-04-02
CN100545814C CN100545814C (zh) 2009-09-30

Family

ID=38792473

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2007101028875A Expired - Fee Related CN100545814C (zh) 2006-09-27 2007-05-11 信息处理设备及其控制设备、控制方法

Country Status (5)

Country Link
US (1) US7716526B2 (zh)
EP (1) EP1906309A3 (zh)
JP (1) JP4836732B2 (zh)
KR (1) KR100899582B1 (zh)
CN (1) CN100545814C (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107111542A (zh) * 2015-03-23 2017-08-29 株式会社东芝 信息处理装置
CN109949516A (zh) * 2019-03-26 2019-06-28 浪潮金融信息技术有限公司 一种银医设备自动识别子设备端口号的初步检测方法
CN111381535A (zh) * 2018-12-25 2020-07-07 佳能株式会社 信息处理装置及信息处理装置的控制方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI303318B (en) * 2006-10-18 2008-11-21 Asustek Comp Inc Testing apparatus and method for testing boot and shut-down process of computer system
JP5141381B2 (ja) * 2008-06-02 2013-02-13 富士通株式会社 情報処理装置、エラー通知プログラム、エラー通知方法
JP2010176541A (ja) * 2009-01-30 2010-08-12 Hitachi Automotive Systems Ltd 車両用電子制御装置
JP5839018B2 (ja) 2013-11-07 2016-01-06 カシオ計算機株式会社 情報端末、通信システム、サーバ、通信方法及びプログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6431235A (en) * 1987-07-27 1989-02-01 Hitachi Ltd Initial self-diagnosis control device for data processor
JPH0229833A (ja) * 1988-07-20 1990-01-31 Nec Field Service Ltd 保守診断方式
JP3010737B2 (ja) * 1990-11-30 2000-02-21 セイコーエプソン株式会社 情報処理装置のデータ退避復元方式
JPH087011A (ja) * 1994-06-15 1996-01-12 Fujitsu Ltd 自動取引装置
US6467054B1 (en) * 1995-03-13 2002-10-15 Compaq Computer Corporation Self test for storage device
JPH10207733A (ja) 1997-01-24 1998-08-07 Oki Inf Syst 電子装置
JP2001142839A (ja) * 1999-11-18 2001-05-25 Hitachi Ltd 情報処理装置
WO2002095556A1 (en) * 2001-05-18 2002-11-28 Fujitsu Limited Apparatus having stand-by mode, program, and control method for apparatus having stand-by mode
GB0216742D0 (en) * 2002-07-18 2002-08-28 Ricardo Consulting Eng Self-testing watch dog system
US7228457B2 (en) * 2004-03-16 2007-06-05 Arm Limited Performing diagnostic operations upon a data processing apparatus with power down support
US7337368B2 (en) * 2004-06-07 2008-02-26 Dell Products L.P. System and method for shutdown memory testing
JP2006227856A (ja) * 2005-02-17 2006-08-31 Hitachi Ltd アクセス制御装置及びそれに搭載されるインターフェース

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107111542A (zh) * 2015-03-23 2017-08-29 株式会社东芝 信息处理装置
CN111381535A (zh) * 2018-12-25 2020-07-07 佳能株式会社 信息处理装置及信息处理装置的控制方法
CN109949516A (zh) * 2019-03-26 2019-06-28 浪潮金融信息技术有限公司 一种银医设备自动识别子设备端口号的初步检测方法

Also Published As

Publication number Publication date
KR100899582B1 (ko) 2009-05-27
JP2008083996A (ja) 2008-04-10
US20080077823A1 (en) 2008-03-27
CN100545814C (zh) 2009-09-30
EP1906309A3 (en) 2012-01-18
US7716526B2 (en) 2010-05-11
JP4836732B2 (ja) 2011-12-14
KR20080028751A (ko) 2008-04-01
EP1906309A2 (en) 2008-04-02

Similar Documents

Publication Publication Date Title
CN100545814C (zh) 信息处理设备及其控制设备、控制方法
US7716520B2 (en) Multi-CPU computer and method of restarting system
CN112948157A (zh) 服务器故障定位方法、装置、系统及计算机可读存储介质
JP2012178014A (ja) 故障予測・対策方法及びクライアントサーバシステム
JPH0526214B2 (zh)
Mendiratta Reliability analysis of clustered computing systems
US7886202B2 (en) System and methods for recording, displaying, and reconstructing computer-based system and user events
KR100605031B1 (ko) Usb 메모리 장치를 이용한 임베디드 시스템의 장애복구 및 업그레이드 방법
CN111488246A (zh) 一种cpld升级方法、装置、电子设备和可读存储介质
US7533297B2 (en) Fault isolation in a microcontroller based computer
CN115470056A (zh) 服务器硬件上电启动故障排查方法、系统、装置及介质
CN117311769B (zh) 服务器日志生成方法和装置、存储介质及电子设备
CN112181702A (zh) 一种线程监测方法及装置
JP5574364B2 (ja) 生産装置稼働状況管理システム及び生産装置稼働状況管理方法
JP3448197B2 (ja) 情報処理装置
KR101408447B1 (ko) 금융자동화기기의 전원 제어장치와 그 방법
JP2002215261A (ja) 計算機システムのクロック切替方式および方法
CN115344327B (zh) 应用模块的切换方法、装置、电子设备及可读存储介质
CN110476153A (zh) 访问指令sram的方法和电子设备
JP3620984B2 (ja) コンピュータ自動スケジュール制御システム、そのための記録媒体およびコンピュータ自動スケジュール制御方法
TW498276B (en) Method and system for fast on site deployment of computer equipment in a network computer environment
CN117992262A (zh) 故障处理方法、样本分析仪及其计算机可读存储介质
CN117891671A (zh) 医疗服务终端的监管方法、系统、电子设备及存储介质
JP2536386B2 (ja) オンライン情報処理装置
Kularatne The Field Limitations of Diagnostics in Processor-Controlled Industrial Systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090930

Termination date: 20150511

EXPY Termination of patent right or utility model