CN101127580B - 节点装置、控制装置和控制方法 - Google Patents

节点装置、控制装置和控制方法 Download PDF

Info

Publication number
CN101127580B
CN101127580B CN2007101039579A CN200710103957A CN101127580B CN 101127580 B CN101127580 B CN 101127580B CN 2007101039579 A CN2007101039579 A CN 2007101039579A CN 200710103957 A CN200710103957 A CN 200710103957A CN 101127580 B CN101127580 B CN 101127580B
Authority
CN
China
Prior art keywords
data
node
poisoning
section point
repair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007101039579A
Other languages
English (en)
Other versions
CN101127580A (zh
Inventor
山本崇史
石冢孝治
植木俊和
畑井田诚
细川由佳
大胁威
伊藤大介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of CN101127580A publication Critical patent/CN101127580A/zh
Application granted granted Critical
Publication of CN101127580B publication Critical patent/CN101127580B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0078Avoidance of errors by organising the transmitted data in a format specifically designed to deal with errors, e.g. location
    • H04L1/0079Formats for control data
    • H04L1/0082Formats for control data fields explicitly indicating existence of error in data being transmitted, e.g. so that downstream stations can avoid decoding erroneous packet; relays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L2001/0092Error control systems characterised by the topology of the transmission link
    • H04L2001/0097Relays

Abstract

一种控制装置,其管理发送并接收含有错误修复代码的数据的多个节点,该控制装置包括:接收装置,当任一节点从含有错误修复代码的数据中检测到不可修复错误时,接收由检测到该错误的节点发送的信号;判断装置,当从接收第一节点发送的数据的第二节点接收信号时,根据第一节点的检测记录,判断第一节点是否已从发送到第二节点的数据中检测到不可修复错误;以及停止装置,当第一节点已从发送到第二节点的数据中检测到不可修复错误时,停止从第二节点接收信号的处理。

Description

节点装置、控制装置和控制方法
技术领域
本发明涉及一种管理多个节点的控制装置和与该控制装置协同工作的节点装置。
背景技术
在能够识别附着于不可修复数据的中毒数据(poisoning data)的系统中,当现有节点接收到中毒数据时,含有中毒数据的数据包被发送到位于后级的现有节点。因此,提高了故障检测速度,而无需检测不必要的不可修复错误。不可修复数据定义为无法被修复的数据。此外,不可修复错误定义为无法被修复的数据错误。“中毒”意味着当节点接收到不可修复数据时,附着于数据尾部的ECC(错误修复代码)的各个位被转换成指定模式(数据)。即,中毒归入术语“不可修复”的一个类别。
通过使数据包一直流动到系统的末端,可在处于末级的现有节点执行数据处理。图1中,在现有节点A与现有节点B之间的总线1中出现不可修复错误(由图1中的出现UE表示)。在这种情况下,从现有节点A接收不可修复数据的现有节点B检测不可修复错误(由图1中的检测UE表示)。然后,现有节点B执行与附着于不可修复数据的ECC相关的中毒处理,并将含有中毒数据的数据包发送到现有节点C。
现有节点C能够识别附着于不可修复数据的中毒数据,因此,现有节点C即使接收到含有中毒数据的数据包,也检测不到不可修复错误。然后,该现有节点将含有中毒数据的数据包发送到现有节点D。因而,不可修复错误的检测只由现有节点B进行,而这在现有节点C和现有节点D中是不必要的,从而提高了故障检测速度。
在系统的所有节点都能够识别附着于不可修复数据的中毒数据的前提下,目前已有中毒数据识别方法。
在能够识别附着于不可修复数据的中毒数据的系统中,当在系统内的路线上中途识别到中毒数据时,不进行不可修复错误的检测。但是,在将不能识别附着于不可修复数据的中毒数据的通用节点加入系统的情况下,当中毒数据经过该通用节点时,检测不可修复错误。
通常,如果通用节点检测到不可修复错误,则其被指作通用节点中的故障或与通用节点相连的总线中的故障。即使中毒数据附着于经过通用节点的不可修复数据,通用节点也会检测到不可修复错误。即,通用节点检测到的不可修复错误不经历中毒数据是否附着于不可修复数据的判断。
因此,即使通用节点检测到不可修复错误,也无法区分中毒数据是否附着于经过通用节点的不可修复数据。
因而,难以判断是通用节点中的故障、是与通用节点相连的总线中的故障、还是除通用节点之外的部件中的故障。所以,如果附着有中毒数据的不可修复数据经过通用节点,则该通用节点被额外指认为受怀疑部件,从而导致必须额外调换部件的问题。
[专利文献1]日本专利申请特开No.2004-242294
发明内容
本发明的目的在于提供一种在通用节点检测到不可修复错误时,用于区分中毒数据是否附着于经过通用节点的不可修复数据的技术。
为解决上述问题,本发明采用以下装置。即,根据本发明,提供一种控制装置,其管理发送并接收含有错误修复代码和中毒数据的数据的多个节点,其中,所述中毒数据具有的值不同于该错误修复代码能够获取的值,所述多个节点包括第一节点、第二节点和第三节点,该控制装置包括:接收装置,当任一节点从含有错误修复代码的数据检测到不可修复错误时,接收检测到该错误的节点发送的信号;判断装置,当从接收第一节点发送的数据的第二节点接收信号时,根据第一节点的检测记录,判断第一节点是否已从发送到第二节点的数据中检测到不可修复错误;以及停止装置,当第一节点已从发送到第二节点的数据中检测到不可修复错误时,停止从第二节点接收信号的处理,其中,当从所述第一节点接收到含有该中毒数据的数据时,所述第二节点将从所述第一节点接收到的含有该中毒数据的数据发送到所述第三节点,所述第二节点不能识别该中毒数据,当将从所述第一节点接收到的含有该中毒数据的数据发送到所述第三节点时,所述第二节点检测含有该中毒数据的数据的不可修复错误,所述第三节点能够识别该中毒数据,以及当从所述第二节点接收到的数据含有该中毒数据时,所述第三节点不检测关于含有该中毒数据的数据的该不可修复错误。利用这种构造,当从第一节点的检测记录判断出从第一节点发送的数据中检测到不可修复错误时,从第二节点接收的信号可被识别为归因于第一节点将含有不可修复错误的数据发送到第二节点。因此,通过停止从第二节点接收信号的处理,在第一节点与第二节点之间发送并接收的数据中所含的不可修复错误可被识别为没有由于第二节点而出现不可修复错误。
此外,根据本发明的控制装置还可包括控制显示装置的装置,该显示装置显示由任一节点检测到的不可修复错误的检测;其中,信号接收的处理可以是当从第二节点接收信号时,在显示装置上显示由第二节点检测到的不可修复错误的检测的处理。利用这种构造,可以禁止显示单元显示由于第一节点将含有不可修复错误的数据发送到第二节点而使第二节点检测到的不可修复错误。
另外,根据本发明,提供一种节点装置,其与管理包含自身节点的多个节点的控制装置协同工作,该节点装置包括:发送/接收装置,将含有错误修复代码的数据发送到第一节点和第二节点以及从第一节点和第二节点接收含有错误修复代码的数据;检测单元,从发送到所述第一节点的数据中检测不可修复错误;转换装置,当从发送到另一节点的数据中检测到不可修复错误时,将该数据中所含的错误修复代码转换为中毒数据,该中毒数据具有的值不同于该错误修复代码能够获取的值;以及记录控制装置,当发送/接收装置将含有该中毒数据的数据发送到另一节点时,在与控制装置相关的记录装置中记录发送该中毒数据的记录,其中,当从所述第二节点接收到的数据含有该中毒数据时,所述检测单元不检测关于发送到所述第一节点的数据的该不可修复错误。利用这种构造,控制装置参照记录在记录装置中的发送中毒数据的记录,从而能够识别出含有中毒数据的数据已被发送到另一节点。
再者,本发明还可以是一种方法,计算机、其它装置、其它机器等通过该方法执行上述处理。另外,本发明还可以是一种程序,用于使计算机、其它装置、其它机器等实现上述功能。此外,本发明还可以是一种记录介质,记录有计算机等可读的上述程序。
根据本发明,在通用节点检测到不可修复错误时,能够区分中毒数据是否附着于经过通用节点的不可修复数据。
附图说明
图1为示出传统不可修复错误检测系统运行的说明图。
图2为本实施例中系统运行的说明图。
图3为现有节点F的中毒(POISON)检测器12如何在寄存器13中设置位的操作的说明图。
图4为示出本实施例中系统构造的实例的示意图。
图5为本实施例中系统运行的流程图。
具体实施方式
以下参照附图说明根据用于实现本发明的最佳模式(以下称为实施例)的系统。以下实施例中的构造为示例,本发明不限于实施例中的构造。
图2为本实施例中系统运行的说明图。本实施例中的系统包括:现有节点E、F和H,其各自能够区分流经自身节点(self-node)的数据是否附着有中毒数据(能够识别附着于不可修复数据的中毒数据);以及通用节点G,其不能区分流经自身节点的数据是否附着有中毒数据(不能识别附着于不可修复数据的中毒数据)。图2中假定的情况是将通用节点G加入包括所述多个现有节点的系统中。
本实施例中的系统还包括:固件集线器2,其从通用节点G接收中断通知;管理单元3,其管理本实施例中的整个系统;显示单元4,其显示检测到不可修复错误的位置;以及信息集合单元5,其集合与本实施例的系统中出现的不可修复错误相关的所有不可修复错误出现信息。
固件集线器2内部具有CPU(中央处理单元)、RAM(随机存取存储器)等。于是,固件集线器2中包括的CPU根据固件集线器2中设置的RAM上存储的固件程序执行各种处理。管理单元3内部具有CPU、RAM等。于是,管理单元3中包括的CPU根据管理单元3中设置的RAM上存储的程序执行各种处理。固件集线器2和管理单元3对应于根据本发明的控制装置。
信息集合单元5内部具有存储装置,例如RAM和ROM(只读存储器)。信息集合单元5中设置的存储装置存储有不可修复错误出现信息。
显示单元4包括:显示装置,例如由CRT(阴极射线管)、液晶显示器、等离子体显示器等构成;以及输出装置,由诸如扬声器等语音输出装置、打印机装置等构成。
现有节点E和现有节点F经总线6相互连接。现有节点F和通用节点G经总线7相互连接。通用节点G和现有节点H经总线8相互连接。此外,各现有节点E、F、H内部具有发送单元9、接收单元10、转换单元11、中毒检测器12和寄存器13。在图2中,省略了各现有节点E和H中设置的发送单元9、接收单元10、转换单元11、中毒检测器12和寄存器13的图示。
发送单元9将从另一节点接收的数据发送到再一节点。接收单元10从另一节点接收数据。转换单元11在接收到不可修复数据时,将附着于不可修复数据的ECC转换为中毒数据。中毒检测器12检测发送单元9是否发送了中毒数据。寄存器13记录有中毒检测器12的检测结果。
通用节点G内部具有未示出的发送单元、接收单元和检测器。通用节点G的接收单元接收现有节点F发送的数据。通用节点G的发送单元将数据发送到现有节点H。在通用节点G的发送单元将不可修复数据或中毒数据发送到现有节点H时,通用节点G的检测器检测不可修复错误。即,在不可修复或中毒数据经过通用节点G的发送单元时,通用节点G的检测器检测不可修复错误。
现有节点F和固件集线器2经总线14相互连接。此外,现有节点E和现有节点H各自经未示出的总线连接至固件集线器2。
另外,通用节点G和固件集线器2经总线15相互连接。固件集线器2经总线16连接至管理单元3。管理单元3经总线17连接至显示单元4。固件集线器2和信息集合单元5经总线18相互连接。
此外,现有节点E、现有节点F、通用节点G和现有节点H各自经未示出的总线连接至信息集合单元5。因此,信息集合单元5集合现有节点E、现有节点F、通用节点G、现有节点H、总线6、总线7和总线8中出现的与不可修复错误相关的多条信息。
以下说明在出现不可修复错误的情况下本实施例中的系统运行。如果在现有节点E与现有节点F之间的总线6中出现不可修复错误(由图2中的出现UE(1)表示),则现有节点F接收现有节点E发送的数据作为不可修复数据。在这种情况下,现有节点F检测不可修复错误(图2中的检测UE(1))。然后,现有节点F执行与接收到的不可修复数据相关的中毒处理。
ECC(错误修复代码)附着于从现有节点E接收的不可修复数据。在执行与不可修复数据相关的中毒处理的情况下,现有节点F将附着于不可修复数据的ECC转换为中毒数据。中毒数据是现有节点E、现有节点F和现有节点H可识别的唯一数据。此外,中毒数据被转换为不与ECC重叠(overlap)的值。即,中毒数据被转换为除了可由ECC获取的值之外的值。
在本实施例中,执行与不可修复数据相关的中毒处理之后,ECC不再附着于此不可修复数据。另外,在本实施例中,当待发送和接收的数据占据128位时,ECC被设置为16位。本实施例中数据的值和ECC的值为示例,根据本发明的数据和ECC不限于这些值。
现有节点F经总线7将中毒数据发送到通用节点G。当现有节点F的发送单元9已发送了中毒数据时,中毒检测器12检测到中毒数据的发送。即,中毒检测器12检测到中毒数据已经经过了现有节点F。然后,中毒检测器12在寄存器13中设置表示中毒数据经过的位。
这里,将参照图3说明现有节点F的中毒检测器12在寄存器13中设置位的操作。如图3所示,当数据输入至现有节点F时,进行中毒数据检测操作。
在图3中,当现有节点F的数据输入侧出现不可修复错误时(由图3中的出现UE(1)表示),现有节点F执行与输入的不可修复数据相关的中毒处理。中毒检测器12和寄存器13恰好设置在现有节点F的数据输出端之前的位置上。因此,中毒检测器12检测到中毒数据已被发送单元9发送。即,中毒检测器12检测到中毒数据已经经过了发送单元9。
中毒检测器12检测到中毒数据已经经过了发送单元9,则在寄存器13的po位中设置“1”。寄存器13的po位定义为表示中毒数据经过的位。“0”设置为寄存器13的po位中的初值。
再次参照图2来说明本实施例中的系统运行。如图2所示,已经执行了与不可修复数据相关的中毒处理的现有节点F将中毒数据发送到通用节点G。在这种情况下,现有节点F将含有中毒数据的数据包发送到通用节点G。
通用节点G不能识别附着于不可修复数据的中毒数据。因而,通用节点G在将中毒数据发送到现有节点H时,检测不可修复错误(由图2中的检测UE(2)表示)。现有节点H能够识别附着于不可修复数据的中毒数据。因此,即使接收到附着有中毒数据的不可修复数据,现有节点H也不检测不可修复错误。
通用节点G检测到不可修复错误并向固件集线器2发出中断通知。接收中断通知的固件集线器2参照现有节点F的寄存器13。
在参照现有节点F的寄存器13的情况下,固件集线器2向信息集合单元5查询不可修复错误出现信息。信息集合单元5集合系统中出现的不可修复错误的所有不可修复错误出现信息。具体而言,信息集合单元5经总线连接至系统中现有的所有节点,并记录有系统中现有的所有节点的多条位置信息。因此,如果在系统中现有的任何一个节点中检测到不可修复错误,则信息集合单元5记录检测到不可修复错误的节点的位置信息。
固件集线器2向信息集合单元5查询不可修复错误出现信息,从而获取检测到不可修复错误的现有节点F的位置信息。然后,获取现有节点F的位置信息的固件集线器2参照现有节点F的寄存器13。
当确认“1”设置在现有节点F的寄存器13的po位中时,固件集线器2通知管理单元3“1”设置在了现有节点F的寄存器13的po位中。当从固件集线器2接收到表示“1”设置在了现有节点F的寄存器13的po位中的通知时,管理单元3控制显示单元4不显示表示通用节点G检测到的不可修复错误的信息。即,管理单元3经总线17输出控制信号,以不显示已检测到不可修复错误的通用节点G的位置。
显示单元4显示已检测到不可修复错误的通用节点G的位置。管理单元3控制显示单元4,从而禁止显示单元4显示由于通用节点G接收到中毒数据而使通用节点G检测到的不可修复错误。
另一方面,当确认“0”设置在现有节点F的寄存器13的po位中时,固件集线器2通知管理单元3“0”设置在了现有节点F的寄存器13的po位中。当从固件集线器2接收到表示“0”设置在了现有节点F的寄存器13的po位中的通知时,管理单元3控制显示单元4显示表示通用节点G检测到的不可修复错误的信息。即,管理单元3经总线17输出控制信号,以显示已检测到不可修复错误的通用节点G的位置。
如果在将现有节点F和通用节点G相互连接的总线7中出现不可修复错误,则通用节点G接收到的不可修复数据不经过现有节点F。即,通用节点G接收到的不可修复数据不经历现有节点F的中毒处理。因此,现有节点F中设置的寄存器13的po位处于初值“0”的状态。
本实施例已经示例出在将现有节点E和现有节点F相互连接的总线6中出现不可修复错误的情况,还示例出在将现有节点F和通用节点G相互连接的总线7中出现不可修复错误的情况。不可修复错误的出现位置仅为示例,例如,存在不可修复错误可能出现在现有节点F中的情况。而且在这种情况下,以与将现有节点E和现有节点F相互连接的总线6中出现不可修复错误的情况相同的方式,现有节点F的转换单元11执行与待发送到通用节点G的不可修复数据相关的中毒处理。因而,中毒数据附着于现有节点F发送到通用节点G的不可修复数据。因此,当发送单元9发送中毒数据时,将“1”设置在现有节点F中设置的寄存器13的po位中。
另外,例如,如果通用节点G中出现不可修复错误,则通用节点G发送到现有节点H的数据是不可修复数据。在这种情况下,通用节点G发送的不可修复数据不经过现有节点F。因此,以与将现有节点F和通用节点G相互连接的总线7中出现不可修复错误的情况相同的方式,现有节点F中设置的寄存器13的po位处于初值“0”的状态。当通用节点G将不可修复数据发送到现有节点H时,通用节点G检测不可修复错误。
另外,本实施例已示例出包括显示单元4的系统,但是,也可以利用不具有显示单元4的系统。例如,通过将图2所示的总线17改为外部接口,可将显示单元4设置在系统外部。可以使用与Internet或Intranet相连的外部接口。
图4为示出本实施例中系统构造的实例的示意图。以下参照图4说明本实施例中的地址流和数据流。
首先,说明本实施例中的地址流。CPU 21向北桥22发出读取请求(1)。北桥22将地址信息发送到地址总线的交叉开关23(2)。地址总线的交叉开关23将地址信息发送到南桥24(3)。南桥24将地址信息发送到PCI Express芯片25(4)。PCI Express芯片25将地址信息发送到PCI盒26(5)。
接着,说明本实施例中的数据流。接收到地址信息的PCI盒26从与PCI盒26相连的PCI装置(未示出)中读取与该地址相对应的数据,并将读出的数据发送到PCI Express芯片25(6)。PCI Express芯片25将数据发送到南桥24(7)。南桥24将数据发送给数据总线的交叉开关27(8)。数据总线的交叉开关27将数据发送到存储控制器28(9)。存储控制器28将数据发送到北桥22(10)。北桥22将数据发给CPU 21。CPU 21接收读取的数据,从而完成该读取请求(11)。
图4中所示的CPU 21、北桥22、南桥24、PCI Express芯片25、PCI盒26、数据总线的交叉开关27和存储控制器28对应于图2和图3中所示的现有节点E、现有节点F、通用节点G和现有节点H。此外,北桥22、南桥24、PCI Express芯片25、数据总线的交叉开关27和存储控制器28各自包括图2和图3中所示的中毒检测器12。这些构造方案为示例,本实施例中的构造不限于这些构造方案。此外,本实施例中的系统可被实现为安装有LSI(大规模集成电路)的LSI基板。
在本实施例中,ECC附着于PCI装置中存储的数据。此外,图4中所示的CPU 21、北桥22、南桥24、PCI Express芯片25、PCI盒26、数据总线的交叉开关27和存储控制器28各自具有附着ECC的功能。因此,可以附着与附着于PCI装置中存储的数据上的ECC采用不同格式的ECC。
图5为本实施例中系统运行的流程图。图5示出在图2所示的通用节点G已从现有节点F接收到不可修复数据之后,系统如何运行。在S501,从现有节点F接收到不可修复数据的通用节点G在向现有节点H发送不可修复数据时,检测不可修复错误。接着,在S502,通用节点G向固件集线器2通报中断信号。然后,在S503,固件集线器2指向现有节点F的寄存器13,并判断“1”是否设置在寄存器13的po位中。
当“1”设置在现有节点F的寄存器13的po位中时,固件集线器2通知管理单元3“1”设置在了现有节点F的寄存器13的po位中。在S504,管理单元3识别出中毒数据附着于将由通用节点G发送的不可修复数据。
因此,当管理单元3识别出中毒数据附着于将由通用节点G发送的不可修复数据时,则判断通用节点G检测到的不可修复错误既不归因于通用节点G中的故障,也不归因于与通用节点G相连的总线7中的故障。即,可以判断,通用节点G已发送了由于在系统内的任一节点或总线中出现故障而附着有中毒数据的不可修复数据。
而另一方面,如果“1”未被设置在现有节点F的寄存器13的po位中(如果“0”设置在现有节点F的寄存器13的po位中),则固件集线器2通知管理单元3“1”未被设置在现有节点F的寄存器13的po位中。在S505,管理单元3识别出中毒数据未附着于将由通用节点G发送的不可修复数据。
因此,当管理单元3识别出中毒数据未附着于将由通用节点G发送的不可修复数据时,则判断通用节点G检测到的不可修复错误归因于通用节点G中的故障,或者归因于与通用节点G相连的总线7中的故障。
根据本实施例,当固件集线器2从通用节点G接收到中断通知时,固件集线器2参照现有节点F的寄存器13的po位。当固件集线器2识别出“1”设置在现有节点F的寄存器13的po位中时,可以判断,在除了通用节点G和与通用节点G相连的总线7之外的地方出现了不可修复错误。即,可以判断,通用节点G和与通用节点G相连的总线7中都没有出现故障。
因此,即使在通用节点G发送附着有中毒数据的不可修复数据时检测到不可修复数据,也能防止通用节点G和与通用节点G相连的总线7被额外指认为受怀疑部件。因此,可以防止额外调换通用节点G和与通用节点G相连的总线7。
<改型实例>
本实施例已示例出一种构造,其中管理单元3控制显示单元4,从而禁止显示单元4显示由于通用节点G发送附着有中毒数据的不可修复数据而使通用节点G检测到的不可修复错误(以下称为“检测到的波纹错误”)。通用节点G检测到的所有不可修复错误也可显示在显示单元4上。
在这种情况下,可用方案是,管理单元3控制显示单元4,从而以不同模式在显示单元4上显示:由于未附着中毒数据的不可修复数据经过通用节点G而使通用节点G检测到的不可修复错误(以下称为由于通用节点等中的故障而检测到的错误),以及检测到的波纹错误。具体而言,可用方案是,在显示单元4上显示检测到的波纹错误,并且以与检测到的波纹错误的显示模式可区分的显示模式,在显示单元4上显示由于通用节点等中的故障而检测到的错误。
在显示单元4上以不同模式显示由于通用节点等中的故障而检测到的错误和检测到的波纹错误,从而能够识别检测到的波纹错误,并防止检测到波纹错误的通用节点G和与通用节点G相连的总线7被额外指认为受怀疑部件。
另外,将IP地址分配给各安装有包括本系统的LSI基板的个人计算机、移动终端等,从而可实现Web管理。即,各安装有包括本系统的LSI基板的个人计算机、移动终端等经外部接口连接至服务器,由此,用户能够识别Web上检测到的不可修复错误。通过在Web上的服务器中安装Web管理软件,能够实现通过Web上的服务器进行管理。此外,服务器可通过普通的个人计算机、工作站等来实现。在这种情况下,服务器连接至显示单元4,由此,服务器接收的不可修复错误检测信息由浏览器解码,然后显示在显示单元4上。
另外,本实施例中的现有节点E、现有节点F、通用节点G和现有节点H可被能够进行网络通信的个人计算机、移动终端等替换。在这种情况下,总线6、总线7和总线8被能够进行网络通信的信号线、Internet或Intranet替换,由此,使用该网络的系统能够检测不可修复错误。
<计算机可读记录介质>
可以在计算机可读记录介质上记录使计算机执行上述任何功能的程序。通过使计算机从记录介质读入程序并执行,能够提供其功能。这里所述的计算机可读记录介质是指这样一种记录介质,其通过电、磁、光、机械或化学操作来存储诸如数据和程序等信息,并允许从计算机读出存储的信息。这种记录介质中可从计算机分离的记录介质例如包括:软盘,磁光盘、CD-ROM,CD-R/W,DVD,DAT,8-mm磁带,以及存储卡。这种记录介质中固定于计算机的记录介质包括:硬盘和ROM(只读存储器)。

Claims (5)

1.一种控制装置,其管理发送并接收含有错误修复代码和中毒数据的数据的多个节点,其中,所述中毒数据具有的值不同于该错误修复代码能够获取的值,所述多个节点包括第一节点、第二节点和第三节点,该控制装置包括:
接收单元,用于在任一节点检测到含有该错误修复代码的数据或者含有该中毒数据的数据中有不可修复错误时,接收检测到该不可修复错误的节点发送的信号;
判断单元,当从接收第一节点发送的数据的第二节点接收信号时,根据所述第一节点的检测记录,判断所述第一节点是否已检测到发送到所述第二节点的数据中有不可修复错误;
停止单元,用于在所述第一节点已检测到发送到所述第二节点的数据中有不可修复错误时,停止从所述第二节点接收信号的处理,以及
其中,当从所述第一节点接收到含有该中毒数据的数据时,所述第二节点将从所述第一节点接收到的含有该中毒数据的数据发送到所述第三节点,
所述第二节点不能识别该中毒数据,
当将从所述第一节点接收到的含有该中毒数据的数据发送到所述第三节点时,所述第二节点检测含有该中毒数据的数据的不可修复错误,
所述第三节点能够识别该中毒数据,以及
当从所述第二节点接收到的数据含有该中毒数据时,所述第三节点不检测关于含有该中毒数据的数据的该不可修复错误。
2.如权利要求1所述的控制装置,还包括控制显示装置的控制单元,该显示装置显示由任一节点检测到的不可修复错误的检测;
其中,信号接收的处理是当从所述第二节点接收信号时,在所述显示装置上显示由所述第二节点检测到的不可修复错误的检测。
3.一种节点装置,其与管理包含自身节点的多个节点的控制装置协同工作,该节点装置包括:
发送/接收单元,将含有错误修复代码的数据发送到第一节点和第二节点以及从第一节点和第二节点接收含有错误修复代码的数据;
检测单元,从发送到所述第一节点的数据中检测不可修复错误;
转换单元,当检测到发送到所述第一节点的数据中有不可修复错误时,将该数据中所含的错误修复代码转换为中毒数据,该中毒数据具有的值不同于该错误修复代码能够获取的值;以及
记录控制单元,用于在所述发送/接收单元将含有该中毒数据的数据发送到所述另一节点时,在所述控制装置可参照的记录单元中记录发送该中毒数据的记录,
其中,当从所述第二节点接收到的数据含有该中毒数据时,所述检测单元不检测关于发送到所述第一节点的数据的该不可修复错误。
4.一种控制装置的控制方法,该控制装置管理发送并接收含有错误修复代码和中毒数据的数据的多个节点,其中,所述中毒数据具有的值不同于该错误修复代码能够获取的值,所述多个节点包括第一节点、第二节点和第三节点,该控制方法包括以下步骤:
当任一所述节点从含有该错误修复代码的数据或者含有该中毒数据的数据中检测到不可修复错误时,接收由检测到该错误的所述节点发送的信号;
当从接收第一节点发送的数据的第二节点接收信号时,根据所述第一节点的检测记录,判断所述第一节点是否已检测到发送到所述第二节点的数据中有不可修复错误;
当所述第一节点已检测到发送到所述第二节点的数据中有不可修复错误时,停止从所述第二节点接收该信号的处理,以及
其中,当从所述第一节点接收到含有该中毒数据的数据时,所述第二节点将从所述第一节点接收到的含有该中毒数据的数据发送到所述第三节点,
所述第二节点不能识别该中毒数据,
当将从所述第一节点接收到的含有该中毒数据的数据发送到所述第三节点时,所述第二节点检测含有该中毒数据的数据的不可修复错误,
所述第三节点能够识别该中毒数据,以及
当从所述第二节点接收到的数据含有该中毒数据时,所述第三节点不检测关于含有该中毒数据的数据的该不可修复错误。
5.如权利要求4所述的控制装置的控制方法,还包括控制显示装置的步骤,该显示装置显示由任一所述节点检测到的不可修复错误的检测;
其中,信号接收的处理是当从所述第二节点接收该信号时,在所述显示装置上显示由所述第二节点检测到的不可修复错误的检测。
CN2007101039579A 2006-08-18 2007-05-17 节点装置、控制装置和控制方法 Expired - Fee Related CN101127580B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006-223346 2006-08-18
JP2006223346 2006-08-18
JP2006223346A JP4774347B2 (ja) 2006-08-18 2006-08-18 ノード装置、制御装置、制御方法及び制御プログラム

Publications (2)

Publication Number Publication Date
CN101127580A CN101127580A (zh) 2008-02-20
CN101127580B true CN101127580B (zh) 2011-06-22

Family

ID=38814489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101039579A Expired - Fee Related CN101127580B (zh) 2006-08-18 2007-05-17 节点装置、控制装置和控制方法

Country Status (5)

Country Link
US (1) US8065566B2 (zh)
EP (1) EP1890414B1 (zh)
JP (1) JP4774347B2 (zh)
KR (1) KR100918284B1 (zh)
CN (1) CN101127580B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009144799A1 (ja) * 2008-05-29 2009-12-03 富士通株式会社 クロスバスイッチシステム
US8438452B2 (en) * 2008-12-29 2013-05-07 Intel Corporation Poison bit error checking code scheme
US8898511B2 (en) 2010-06-24 2014-11-25 International Business Machines Corporation Homogeneous recovery in a redundant memory system
US8549378B2 (en) 2010-06-24 2013-10-01 International Business Machines Corporation RAIM system using decoding of virtual ECC
US8631271B2 (en) 2010-06-24 2014-01-14 International Business Machines Corporation Heterogeneous recovery in a redundant memory system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512329A (zh) * 2002-12-31 2004-07-14 联想(北京)有限公司 机群自适应的控制方法
CN1719780A (zh) * 2005-07-15 2006-01-11 复旦大学 一种基于移动代理的入侵检测系统和方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0618377B2 (ja) * 1983-09-08 1994-03-09 株式会社日立製作所 伝送系
US4665520A (en) * 1985-02-01 1987-05-12 International Business Machines Corporation Optimistic recovery in a distributed processing system
US5047917A (en) * 1985-07-12 1991-09-10 The California Institute Of Technology Apparatus for intrasystem communications within a binary n-cube including buffer lock bit
US5761413A (en) * 1987-12-22 1998-06-02 Sun Microsystems, Inc. Fault containment system for multiprocessor with shared memory
US5132967A (en) * 1990-10-29 1992-07-21 International Business Machines Corporation Single competitor arbitration scheme for common bus
GB9201126D0 (en) * 1992-01-20 1992-03-11 Madge Networks Ltd Communication system
US5742753A (en) * 1996-06-06 1998-04-21 The Boeing Company Mesh interconnected array in a fault-tolerant computer system
US6519736B1 (en) * 1999-11-30 2003-02-11 International Business Machines Corporation Generating special uncorrectable error codes for failure isolation
US7346825B2 (en) 2001-09-06 2008-03-18 Intel Corporation Error method, system and medium
US7047475B2 (en) 2003-02-04 2006-05-16 Hewlett-Packard Development Company, L.P. CRC encoding scheme for conveying status information
US7353433B2 (en) 2003-12-08 2008-04-01 Intel Corporation Poisoned error signaling for proactive OS recovery
US7296181B2 (en) 2004-04-06 2007-11-13 Hewlett-Packard Development Company, L.P. Lockstep error signaling

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512329A (zh) * 2002-12-31 2004-07-14 联想(北京)有限公司 机群自适应的控制方法
CN1719780A (zh) * 2005-07-15 2006-01-11 复旦大学 一种基于移动代理的入侵检测系统和方法

Also Published As

Publication number Publication date
CN101127580A (zh) 2008-02-20
JP2008048278A (ja) 2008-02-28
US20080046792A1 (en) 2008-02-21
KR20080016434A (ko) 2008-02-21
EP1890414A3 (en) 2008-02-27
EP1890414A2 (en) 2008-02-20
KR100918284B1 (ko) 2009-09-18
US8065566B2 (en) 2011-11-22
JP4774347B2 (ja) 2011-09-14
EP1890414B1 (en) 2013-05-01

Similar Documents

Publication Publication Date Title
US20080065928A1 (en) Technique for supporting finding of location of cause of failure occurrence
US8935576B2 (en) Automated cabling process for a complex environment
CN101127580B (zh) 节点装置、控制装置和控制方法
CN105700510A (zh) Can通信系统的错误分散检测方法及can通信系统
CN102171703A (zh) 用于移动终端的执行功能管理的系统和方法以及程序
CN108683528B (zh) 一种数据传输方法、中心服务器、服务器及数据传输系统
CN102571492A (zh) 检测路由设备故障的方法和装置
US10296746B2 (en) Information processing device, filtering system, and filtering method
CN109254868A (zh) 一种文件检测方法及装置
CN103874998A (zh) 生成预测数据结构
CN113014640B (zh) 请求处理方法、装置、电子设备及存储介质
US7925728B2 (en) Facilitating detection of hardware service actions
CN109698774A (zh) 用于监测设备工作状态的方法及装置
CN115033441A (zh) PCIe设备故障检测方法、装置、设备和存储介质
JP5088738B2 (ja) 障害監視装置及び障害監視方法並びにそのためのプログラム
CN111130941B (zh) 一种网络错误检测方法、装置以及计算机可读存储介质
CN110213667B (zh) 在线视频交互的网络保障方法、系统、设备及存储介质
CN114025014A (zh) 一种资产探测方法、装置、电子设备及存储介质
CN111800286A (zh) 内网资产的探测方法、装置和电子设备
JP4260441B2 (ja) システムヘルスチェックプログラム及びシステムヘルスチェック方法
CN108833914A (zh) Cob拼接墙的故障检测方法和系统
JP4437102B2 (ja) 設備故障判定システム、方法、プログラム、及び記録媒体
JP2751861B2 (ja) ネットワークシステム障害検出処理回路
CN115188177A (zh) 一种动力电池测试数据管理方法、装置、设备和介质
JP2005258791A (ja) 正当性検証装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110622

Termination date: 20200517