JP2007124020A - Information processing system, information processor, and error prevention processing method of interconnect network and information processing system - Google Patents

Information processing system, information processor, and error prevention processing method of interconnect network and information processing system Download PDF

Info

Publication number
JP2007124020A
JP2007124020A JP2005309956A JP2005309956A JP2007124020A JP 2007124020 A JP2007124020 A JP 2007124020A JP 2005309956 A JP2005309956 A JP 2005309956A JP 2005309956 A JP2005309956 A JP 2005309956A JP 2007124020 A JP2007124020 A JP 2007124020A
Authority
JP
Japan
Prior art keywords
interconnect network
information processing
data
route
interconnect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005309956A
Other languages
Japanese (ja)
Inventor
Hisashi Saito
寿 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Computertechno Ltd
Original Assignee
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Computertechno Ltd filed Critical NEC Computertechno Ltd
Priority to JP2005309956A priority Critical patent/JP2007124020A/en
Publication of JP2007124020A publication Critical patent/JP2007124020A/en
Withdrawn legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To reduce a system failure rate when a trouble occurs in an interconnect network without increasing traffic in the interconnect network. <P>SOLUTION: An error prevention processing method is used for an information processing system, where a plurality of information processors are connected via a plurality of interconnect networks. The error prevention processing method includes a step of monitoring a trouble symptom phenomenon, and detecting the trouble symptom phenomenon in data transmitted by the path of the interconnect network; a step of transmitting trouble symptom notification to the information processor of the issue source of the data; and a step of receiving the trouble symptom phenomenon notification before changing the path of a current active system interconnect network to that of other interconnect networks for further data transmission. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は高可用性と装置間伝送路の高信頼性を実現する情報処理システム及び情報処理システムのエラー予防処理方法に関し、特に二重化インタコネクトネットワーク情報処理システム及びそのエラー予防処理方法に関する。   The present invention relates to an information processing system and an error prevention processing method for an information processing system that realize high availability and high reliability of an inter-device transmission path, and more particularly to a duplex interconnect network information processing system and an error prevention processing method thereof.

本発明が関係する二重化インタコネクトネットワークコンピュータは、特にコンピュータの高可用性と処理装置間伝送路の高信頼性を実現するコンピュータに用いられている。   The duplex interconnect network computer to which the present invention relates is particularly used in computers that realize high availability of computers and high reliability of transmission paths between processing devices.

この二重化インタコネクトネットワークコンピュータに関し、インタコネクトネットワーク障害に起因するコンピュータ障害の障害耐性を向上させる方法には、コンピュータ間のネットワーク(代表例ではインターネット)の障害に起因するコンピュータ間データ伝送障害の障害耐性を向上させる方法を採用できる可能性がある。よって、コンピュータ間データ伝送の障害耐性向上方法も含めて、従来技術を考察する。   With regard to this dual interconnect network computer, there is a method for improving the fault tolerance of the computer fault caused by the interconnect network fault. The fault tolerance of the inter-computer data transmission fault caused by the fault of the network between computers (the Internet in the typical example). There is a possibility that a method for improving the above can be adopted. Therefore, the prior art including a method for improving the fault tolerance of data transmission between computers will be considered.

コンピュータ内インタコネクトネットワーク或いはコンピュータ間ネットワーク障害に起因するデータ伝送の障害耐性向上方法として、下記の方法がある。   The following methods are available as methods for improving the fault tolerance of data transmission caused by an intra-computer interconnect network or inter-computer network failure.

第一の方法は、特許文献1に記載されている方法である。この方法は、データ発行元装置からデータを送信する際、2つのネットワークに同一データを送信し、データ宛先装置では、2つのネットワークから同一データを受信するが、どちらか片方のデータを拾い込み、他方のデータを破棄する方法である。この方法の場合、片系ネットワークにて回復不能な障害が発生しても、他系ネットワークだけでデータ伝送を継続することができるという利点がある。   The first method is the method described in Patent Document 1. In this method, when transmitting data from the data issuing source device, the same data is transmitted to the two networks, and the data destination device receives the same data from the two networks, but picks one of the data, This is a method of discarding the other data. This method has an advantage that even if an unrecoverable failure occurs in one network, data transmission can be continued only in the other network.

特開2002−229965号公報JP 2002-229965 A

しかし、特許文献1で開示された技術では、同一データを2つのネットワークに送信するため、ネットワークのトラフィックが2倍に増大するという問題がある。   However, the technique disclosed in Patent Document 1 has a problem that the traffic of the network increases twice because the same data is transmitted to two networks.

別の方法として、片系ネットワークを運用系、他系ネットワークを待機系とし、運用系ネットワークにて回復不能な障害が発生した場合、待機系ネットワークを運用系に切り替えてデータ伝送を継続する方法もある。この方法の場合、運用系ネットワークにて回復不能障害が発生したタイミングから経路切り替えが行われるまでの間に、データ発行元装置から現運用系ネットワークに送信されたデータは消失してしまう。   Another method is to use one network as the active system and the other network as the standby system, and if an unrecoverable failure occurs in the active network, switch the standby network to the active system and continue data transmission. is there. In the case of this method, the data transmitted from the data issuing source device to the current active network is lost between the timing when the unrecoverable failure occurs in the active network and the time when the path is switched.

そこで、このデータ伝送の制御を司っているドライバ等のソフトウェアが、正常にデータ伝送できたことが確認できている処理ポイントまでロールバックし、そこからデータ伝送をやり直すことが行われている。インターネット等のコンピュータ間データ伝送で使用されているTCP/IPはこの方法を採用している。しかし、コンピュータ内部でのデータ伝送方法にこの方法を用いた場合、ソフトウェアによるデータ伝送再試行(リトライ)が行えないものがあるため、エラーリカバリが行えずシステムダウンしてしまうという問題がある。   Therefore, software such as a driver that controls the data transmission is rolled back to a processing point where it has been confirmed that data transmission has been normally performed, and data transmission is performed again from there. TCP / IP used for data transmission between computers such as the Internet adopts this method. However, when this method is used as a data transmission method inside a computer, there is a problem that data transmission cannot be retried by software, so that error recovery cannot be performed and the system goes down.

例えば、コンピュータ内部におけるデータのコヒーレンシーを制御するためのデータ伝送等においてこの問題が生ずる。複数のCPU(Central Processor Unit)チップを備えるコンピュータシステムにおいて、各CPU内にキャッシュを持っているケースを考える。このケースでは、あるキャッシュ内のデータが更新された場合、データのコヒーレンシー(データの一貫性)を保つために、更新されたデータのコピーを持っている別のキャッシュ内データも更新する必要があり、このときキャッシュ間でデータ伝送を行う。   For example, this problem occurs in data transmission for controlling data coherency in a computer. Consider a case in which a computer system having a plurality of CPU (Central Processor Unit) chips has a cache in each CPU. In this case, if data in one cache is updated, another cached data that has a copy of the updated data must also be updated to maintain data coherency. At this time, data is transmitted between the caches.

この様なデータ伝送は、オペレーティングシステム等のソフトウェアが関与しないデータ伝送であるため、当然、ソフトウェアによるデータ伝送再試行は行えないという問題がある。   Since such data transmission is data transmission that does not involve software such as an operating system, there is a problem that data transmission cannot be retried by software.

本発明の目的は、上述した従来の課題である、インタコネクトネットワークのトラフィックを増大させることなく、インタコネクトネットワークにおける回復不能な障害の発生時のシステムダウンを解決する情報処理システムおよびエラー予防処理方法を提供することにある。   SUMMARY OF THE INVENTION An object of the present invention is an information processing system and an error prevention processing method for solving a system down at the time of occurrence of an unrecoverable failure in an interconnect network without increasing the traffic of the interconnect network, which is the conventional problem described above. Is to provide.

本発明の情報処理システムのエラー予防処理方法は、複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムのエラー予防処理方法であり、 障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知するステップと、そのデータの発行元の情報処理装置に障害予兆通知を送信するステップと、障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行うステップとを含むことを特徴とする。   An error prevention processing method for an information processing system according to the present invention is an error prevention processing method for an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks. A step of detecting a failure predictor phenomenon of data transmitted through a network path, a step of transmitting a failure predictor notification to an information processing apparatus that issued the data, and a current active interconnect network after receiving the failure predictor notification And switching the other route to another interconnect network route and performing subsequent data transmission.

本発明の情報処理システムのエラー予防処理方法は、障害予兆通知を受け取った発行元情報処理装置が一時、データ宛先情報処理装置へのデータ送信を中止し、データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付するステップと、前記データ宛先情報処理装置において、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせるステップとをさらに含んでもよい。   In the error prevention processing method of the information processing system according to the present invention, the issuer information processing apparatus that has received the failure sign notification temporarily stops data transmission to the data destination information processing apparatus and is currently operating toward the data destination information processing apparatus. A route change notification is simultaneously sent to each of the system interconnect network and the current standby interconnect network, and the data destination information processing apparatus first receives the route change notification from the current standby interconnect network. In this case, the method may further include a step of waiting for data reception from the current standby interconnect network until a route change notification is received from the current active interconnect network.

本発明のエラー予防処理方法は、発行元情報処理装置が現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付するステップのあと、現待機系インタコネクトネットワークを運用系インタコネクトネットワークとして用いるように切り替えてデータ送信の再開をするステップをさらに含んでもよい。   In the error prevention processing method of the present invention, the issuing information processing apparatus uses the current active interconnect network and the current standby interconnect network to simultaneously send a route change notification to each, and then the current standby interface. The method may further include a step of switching the connection network to be used as an operational interconnect network and restarting data transmission.

本発明の情報処理システムのエラー予防処理方法は、データ宛先情報処理装置が現運用系インタコネクトネットワークから経路変更通知を受信した場合、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えてそのデータ受信を再開するステップをさらに含んでもよい。   According to the error prevention processing method of the information processing system of the present invention, when the data destination information processing apparatus receives a route change notification from the current active interconnect network, the current standby interconnect network is used as the active interconnect network. It may further include a step of switching and restarting the data reception.

本発明の情報処理システムのエラー予防処理方法は、前記データ宛先情報処理装置が現待機系インタコネクトネットワークから先に経路変更通知を受信しなかった場合、現待機系インタコネクトネットワークから経路変更通知を受信した後に、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えるステップとをさらに含んでもよい。   In the error prevention processing method for an information processing system according to the present invention, when the data destination information processing apparatus does not receive a route change notification from the current standby interconnect network, a route change notification is sent from the current standby interconnect network. After receiving, the method may further include a step of switching the current standby interconnect network to use as the active interconnect network.

本発明の情報処理システムは、複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムであり、インタコネクトネットワークには、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、そのデータの発行元の情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、発行元の情報処理装置には、障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備えることを特徴とする。   The information processing system according to the present invention is an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks. The interconnect network monitors a predictive failure phenomenon, and uses an interconnect network path. A failure sign phenomenon detection unit that detects a failure sign phenomenon of transmitted data, and an interface control unit that transmits a failure sign notification to the information processing apparatus that issued the data. A path switching control unit is provided for switching the path of the current active interconnect network to a path of another interconnect network after receiving the failure sign notification and performing subsequent data transmission.

本発明の情報処理システムは、複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムであり、インタコネクトネットワークには、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、そのデータの発行元の情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、
前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後、一時的にデータ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付し、その後、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備え、
データ宛先情報処理装置には、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせる経路切り換え制御部を備えてもよい。
The information processing system according to the present invention is an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks. The interconnect network monitors a predictive failure phenomenon, and uses an interconnect network path. A failure sign phenomenon detection unit that detects a failure sign phenomenon of transmitted data, and an interface control unit that transmits a failure sign notification to the information processing apparatus that issued the data,
After receiving the failure sign notification, the issuing information processing device temporarily stops data transmission to the data destination information processing device, and sends the current active interconnect to the data destination information processing device. Send a route change notification to each of the network and the current standby interconnect network at the same time, and then switch the route of the current active interconnect network to the route of the other interconnect network to transmit subsequent data With a route switching control unit,
If the data destination information processing device first receives a route change notification from the current standby interconnect network, it receives data from the current standby interconnect network until it receives a route change notification from the current active interconnect network. A path switching control unit that waits for

本発明情報処理システムは、発行元情報処理装置における経路切り換え制御部は、現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付したあと、現待機系インタコネクトネットワークを運用系インタコネクトネットワークとして用いるように切り替えてデータ送信の再開をしてもよい。   In the information processing system of the present invention, the path switching control unit in the issuing information processing apparatus sends a path change notification to each of the current active interconnect network and the current standby interconnect network at the same time, and then Data transmission may be resumed by switching the system interconnect network to be used as the operational interconnect network.

本発明の情報処理システムは、データ宛先情報処理装置における経路切り換え制御部は、現運用系インタコネクトネットワークから経路変更通知を受信した場合、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えてそのデータ受信を再開してもよい。   In the information processing system of the present invention, when the path switching control unit in the data destination information processing apparatus receives a path change notification from the current active interconnect network, the current standby interconnect network is used as the active interconnect network. The data reception may be resumed by switching to.

本発明の情報処理システムは、データ宛先情報処理装置における経路切り換え制御部は、現待機系インタコネクトネットワークから先に経路変更通知を受信しなかった場合、現待機系インタコネクトネットワークから経路変更通知を受信した後に、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えてもよい。   In the information processing system of the present invention, when the path switching control unit in the data destination information processing apparatus does not receive a path change notification from the current standby interconnect network, it sends a path change notification from the current standby interconnect network. After reception, the current standby interconnect network may be switched to be used as the active interconnect network.

本発明の情報処理装置は、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する複数のインタコネクトネットワークを介して情報処理装置が接続された情報処理システムを構成する情報処理装置であり、
障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備えることを特徴とする。
An information processing apparatus according to the present invention is an information processing system in which information processing apparatuses are connected via a plurality of interconnect networks for monitoring a failure predictor phenomenon and detecting a failure predictor phenomenon of data transmitted through an interconnect network path Is an information processing apparatus that constitutes
A path switching control unit is provided for switching the path of the current active interconnect network to a path of another interconnect network after receiving the failure sign notification and performing subsequent data transmission.

本発明の情報処理装置は、前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後、一時的にデータ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付し、その後、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備え、データ宛先の情報処理装置には、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせる経路切り換え制御部を備えてもよい。   The information processing apparatus of the present invention temporarily stops data transmission to the data destination information processing apparatus after receiving the failure sign notification to the information processing apparatus of the issuing source, and the data destination information processing apparatus Send a route change notification to each of the current active interconnect network and the current standby interconnect network at the same time, and then change the route of the current active interconnect network to the route of the other interconnect network. A path switching control unit is provided to perform subsequent data transmission after switching, and when the data destination information processing apparatus first receives a path change notification from the current standby interconnect network, it changes the path from the current active interconnect network. Wait for data reception from the current standby interconnect network until a notification is received It may include a path switching control unit for.

本発明のインタコネクトネットワークは、複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムを構成するインタコネクトネットワークであり、インタコネクトネットワークは、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、そのデータの発行元の情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、発行元の情報処理装置は、障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行うことを特徴とする。   The interconnect network of the present invention is an interconnect network that constitutes an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks. Issuer information is provided with a failure sign phenomenon detection unit that detects a failure sign phenomenon of data transmitted through the path of the connect network, and an interface control unit that sends a failure sign notification to the information processing apparatus that issued the data. The processing apparatus is characterized in that after receiving the failure sign notification, the route of the current active interconnect network is switched to the route of another interconnect network and subsequent data transmission is performed.

本発明のインタコネクトネットワークは、複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムを構成するインタコネクトネットワークであり、インタコネクトネットワークは、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、そのデータの発行元の情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後、一時的にデータ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付し、その後、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備え、データ宛先情報処理装置は、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせる経路切り換え制御部を備えることを特徴とする。   The interconnect network of the present invention is an interconnect network that constitutes an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks. A failure predictor detection unit that detects a failure predictor phenomenon of data transmitted through the path of the connect network, and an interface control unit that transmits a failure predictor notification to the information processing apparatus that issued the data; After receiving the failure sign notification, the information processing apparatus temporarily stops data transmission to the data destination information processing apparatus, and the current active interconnect network and the current standby are directed to the data destination information processing apparatus. Route change notifications simultaneously to each other After that, the data destination information processing apparatus includes a path switching control unit that switches the path of the current active interconnect network to the path of another interconnect network and transmits subsequent data. When a route change notification is received from the connect network, a route switching control unit is provided that waits for data reception from the current standby interconnect network until a route change notification is received from the current active interconnect network.

本発明はインタコネクトネットワークのトラフィックを増大させることなく、インタコネクトネットワークにおける障害発生時のシステムダウン率を低減させることができるという効果を有する。その理由は 障害予兆現象を検知すると、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行うからである。   The present invention has an effect of reducing the system down rate when a failure occurs in the interconnect network without increasing the traffic of the interconnect network. The reason is that when a failure predictor phenomenon is detected, the route of the current active interconnect network is switched to the route of another interconnect network, and subsequent data transmission is performed.

次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。   Next, the best mode for carrying out the present invention will be described in detail with reference to the drawings.

本発明による二重化インタコネクトネットワークコンピュータの実施形態を説明する前に、本発明の前提となる技術である、ネットワークにおける一般的なデータ伝送について図9を用いて説明する。処理装置間は、パケットと呼ばれる単位でデータ伝送される。パケットには、該パケットの宛先処理装置を識別するDstIDフィールド(Destination ID Field)、該パケットの発行元処理装置を識別するSrcIDフィールド(Source ID Field)、動作種別(リード動作、ライト動作等)を表すCmdフィールド(Command Field)、パケットの長さを表すLenフィールド(Length field)及び受け渡しするデータを格納するDataフィールド(Data Field)等から構成される。   Before describing an embodiment of a duplex interconnect network computer according to the present invention, general data transmission in a network, which is a premise of the present invention, will be described with reference to FIG. Data is transmitted between the processing devices in units called packets. The packet includes a DstID field (Destination ID Field) for identifying the destination processing device of the packet, a SrcID field (Source ID Field) for identifying the source processing device of the packet, and an operation type (read operation, write operation, etc.). A Cmd field (Command Field) that represents the packet, a Len field (Length field) that represents the length of the packet, a Data field (Data Field) that stores data to be transferred, and the like.

パケット発行元処理装置では、これら各フィールドを適切な値に設定してパケットを発行する。発行されたパケットは、データ伝送路においてDstIDフィールドが参照され、パケット宛先処理装置までルーティングされる。   The packet issuer processing device issues a packet with these fields set to appropriate values. The issued packet is routed to the packet destination processing device with reference to the DstID field in the data transmission path.

例えば、図1における処理装置100から処理装置105へパケットを発行する場合、処理装置100では、DstIDフィールドを処理装置105とし、SrcIDフィールドを自身である処理装置100としてパケットを発行する。すると、インタコネクトネットワーク102或いは103では、DstIDフィールドを参照してパケット宛先処理装置105まで該パケットをルーティングする。   For example, when a packet is issued from the processing device 100 in FIG. 1 to the processing device 105, the processing device 100 issues the packet with the DstID field as the processing device 105 and the SrcID field as its own processing device 100. Then, the interconnect network 102 or 103 routes the packet to the packet destination processing device 105 with reference to the DstID field.

次に、本発明にかかる二重化インタコネクトネットワークコンピュータの一実施形態の構成について説明する。図1を参照すると、本発明の実施形態としての二重化インタコネクトネットワークコンピュータが示されている。   Next, the configuration of an embodiment of the duplex interconnect network computer according to the present invention will be described. Referring to FIG. 1, there is shown a duplex interconnect network computer as an embodiment of the present invention.

処理装置100,101,104,105は、情報処理装置であり、より具体的には中央処理装置或いは入出力処理装置であり、パケット発行元或いはパケット宛先処理装置となる。本発明では、中央処理装置と入出力処理装置とを区別する必要が無いため、両者を単に処理装置と称す。これら全ての処理装置内には、2つのインタフェース制御部110,111或いは112、113と、1つの経路切り替え制御部120或いは121を有している。   The processing devices 100, 101, 104, and 105 are information processing devices, more specifically, a central processing device or an input / output processing device, and serve as a packet issuer or a packet destination processing device. In the present invention, since there is no need to distinguish between the central processing unit and the input / output processing unit, both are simply referred to as a processing unit. All these processing apparatuses have two interface control units 110, 111, 112, and 113 and one path switching control unit 120 or 121.

インタフェース制御部110、111或いは112、113は、インタコネクトネットワーク102,103とのインタフェース制御を司る。経路切り替え制御部120或いは121は、2つのインタフェース制御部110、111或いは112、113へのパケット送信制御とインタフェース制御部110、111或いは112、113からのパケット受信制御を司る。尚、本発明に関わる処理装置100,101,104,105内の構成及び動作は全て同じであるため、以降、処理装置内について説明する場合は、処理装置100のみ用いることとする。   The interface control units 110, 111, 112, and 113 manage interface control with the interconnect networks 102 and 103. The path switching control unit 120 or 121 controls packet transmission control to the two interface control units 110, 111, 112, and 113 and packet reception control from the interface control units 110, 111, 112, and 113. Since the configurations and operations in the processing apparatuses 100, 101, 104, and 105 related to the present invention are all the same, only the processing apparatus 100 will be used in the following description of the processing apparatus.

2つのインタコネクトネットワーク102,103は、互いに独立したネットワークであり、処理装置100,101,104,105と相互接続される。   The two interconnect networks 102 and 103 are networks independent from each other, and are interconnected with the processing apparatuses 100, 101, 104, and 105.

2つのインタコネクトネットワークのうち1つを運用系と他の1つを待機系に割り当て、障害予兆現象が生じない通常時には運用系インタコネクトネットワークのみを使用してデータ送受信を行う。運用系インタコネクトネットワーク内にて障害予兆現象を監視し、予兆現象を検知したならば、ソフトウェアでの処理を必要とせずハードウェアのみで、自律的且つ即座に待機系インタコネクトネットワークへ経路変更できることを可能にするものである。   One of the two interconnect networks is assigned to the active system and the other one to the standby system, and data transmission / reception is performed using only the active interconnect network at normal times when no failure sign phenomenon occurs. If a failure predictor phenomenon is monitored in the active interconnect network and the predictor phenomenon is detected, it is possible to change the route to the standby interconnect network autonomously and immediately by hardware alone without the need for software processing. Is possible.

尚、2つのインタコネクトネットワークのうち1つを運用系と他の1つを待機系に割り当てて構成するコンピュータを二重化インタコネクトネットワークコンピュータと称する。   A computer configured by assigning one of the two interconnect networks to the active system and the other to the standby system is referred to as a duplex interconnect network computer.

尚、インタコネクトネットワーク102,103は構成及び動作が同じであるため、以降、インタコネクトネットワーク内について説明する場合は、インタコネクトネットワーク102のみ用いることとする。   Since the interconnect networks 102 and 103 have the same configuration and operation, only the interconnect network 102 will be used in the following description of the interconnect network.

図2を参照すると、本発明の一実施形態としてのインタコネクトネットワーク102が示されている。インタコネクトネットワーク102は1つのスイッチ装置200から構成され、4つの外部インタフェース150,152,160,162を有する。これら4つの外部インタフェースは、処理装置100,101,104,105と接続される。   Referring to FIG. 2, an interconnect network 102 is shown as one embodiment of the present invention. The interconnect network 102 includes one switch device 200 and includes four external interfaces 150, 152, 160, and 162. These four external interfaces are connected to the processing devices 100, 101, 104, and 105.

インタコネクトネットワーク102に接続させる処理装置数が多くなれば、図6、図7、図8に記載されている様に、上記スイッチ装置200を複数接続させてインタコネクトネットワーク102を構成する。尚、図6、図7、図8に記載したインタコネクトネットワーク構成も一実施例であり、これ以外の構成を採った場合でも、本発明は適用できる。   If the number of processing devices connected to the interconnect network 102 increases, the interconnect network 102 is configured by connecting a plurality of the switch devices 200 as described in FIGS. 6, 7, and 8. The interconnect network configurations shown in FIGS. 6, 7, and 8 are also examples, and the present invention can be applied even when other configurations are adopted.

図3を参照すると、本発明の一実施例としてのスイッチ装置200が示されている。インタフェース制御部310,311,312,313は、スイッチ装置外とのインタフェース制御を司り、図1記載の処理装置100内に在るインタフェース制御部110,111と同一構成及び同一動作するものである。よって、以降、インタフェース制御部内について説明する場合は、インタフェース制御部310を用いることとする。   Referring to FIG. 3, a switch device 200 as an embodiment of the present invention is shown. The interface control units 310, 311, 312, and 313 are responsible for interface control with the outside of the switch device, and have the same configuration and the same operation as the interface control units 110 and 111 in the processing apparatus 100 illustrated in FIG. 1. Therefore, hereinafter, when describing the inside of the interface control unit, the interface control unit 310 is used.

完全クロスバー300は、4つのインタフェース制御部310、311,312,313を完全クロスバー(完全網)で接続しているものである。即ち、単なる接続線の集合体である。完全クロスバーとは任意のひとつの端子が他の任意の端子と1対1で接続できるものをいう。   The complete crossbar 300 has four interface controllers 310, 311, 312, and 313 connected by a complete crossbar (complete network). That is, it is simply a collection of connection lines. A complete crossbar means that any one terminal can be connected to any other terminal on a one-to-one basis.

図4を参照すると、本発明の重要な構成要素であるインタフェース制御部310の一実施形態が示されている。障害制御部400は、インタフェース制御部310自身の障害予兆、及びインタフェース150、350の障害予兆を監視する機能を有する。   Referring to FIG. 4, an embodiment of an interface control unit 310 that is an important component of the present invention is shown. The failure control unit 400 has a function of monitoring a failure sign of the interface control unit 310 itself and a failure sign of the interfaces 150 and 350.

障害予兆とは訂正可能なエラーのみが出ている状態をいい、まだ回復不能な障害までには至っていないが、回復不能な障害に至る前段階の状態をいう。障害予兆検知の方法については、一例を挙げると、ECC(Error Correction Code)によりエラー検出およびエラー訂正を行った場合に検知したと判断することが考えられるが、これに限られるわけではない。エラー訂正の具体的な構成動作は当業者の周知技術であるのでその詳細な説明は省略する。   A failure sign is a state in which only a correctable error has occurred, and is a state in the previous stage of reaching an unrecoverable failure that has not yet reached an unrecoverable failure. As an example of the failure sign detection method, it may be determined that error detection and error correction are performed using ECC (Error Correction Code). However, the method is not limited to this. Since the specific operation of error correction is a well-known technique for those skilled in the art, detailed description thereof is omitted.

障害予兆監視機能は、インタフェース350からインタフェース150方向の経路において障害予兆現象を検知した場合、検知以降インタフェース350から受信したパケットをインタフェース150に送信すると共に、該パケット情報から障害予兆通知を生成し、選択回路B411を経由させインタフェース350に送信する。同様に、インタフェース150からインタフェース350方向の経路において障害予兆現象を検知した場合、検知以降インタフェース150から受信したパケットをインタフェース350に送信すると共に、該パケット情報から障害予兆通知を生成し、選択回路A410を経由させインタフェース150に送信する。   When the failure sign monitoring function detects a failure sign phenomenon in the path from the interface 350 to the interface 150, the failure sign monitoring function transmits a packet received from the interface 350 after the detection to the interface 150 and generates a failure sign notification from the packet information. The data is transmitted to the interface 350 via the selection circuit B411. Similarly, when a failure sign phenomenon is detected in the path from the interface 150 to the interface 350, a packet received from the interface 150 after the detection is transmitted to the interface 350, a failure sign notification is generated from the packet information, and the selection circuit A410. To the interface 150.

尚、予兆現象を検知した段階では、該予兆現象発生箇所はまだ動作継続可能である。   It should be noted that at the stage where the sign phenomenon is detected, the operation where the sign phenomenon occurs can still be continued.

また、障害予兆現象検知以降、インタフェース350から経路変更通知を受信した場合、インタフェース150に送信すると共に、該経路変更通知から経路変更通知リプライを生成し、選択回路B411を経由させインタフェース350に送信する。同様に、インタフェース150から経路変更通知を受信した場合、インタフェース350に送信すると共に、該経路変更通知から経路変更通知リプライを生成し、選択回路A410を経由させインタフェース150に送信する。   In addition, when a path change notification is received from the interface 350 after the failure sign phenomenon is detected, it is transmitted to the interface 150, a path change notification reply is generated from the path change notification, and is transmitted to the interface 350 via the selection circuit B411. . Similarly, when a route change notification is received from the interface 150, it is transmitted to the interface 350, and a route change notification reply is generated from the route change notification and transmitted to the interface 150 via the selection circuit A410.

障害予兆監視機能におけるデータ伝送パケットから障害予兆通知を生成する方法を、図10に示す。データ伝送パケット内のDstIDフィールド値を障害予兆通知内のSrcIDフィールドに埋め込み、データ伝送パケット内のSrcIDフィールド値を障害予兆通知内のDstIDフィールドに埋め込み、障害予兆通知内のCmdフィールドに障害予兆通知であることを示す値を埋め込み、障害予兆通知内のLenフィールドは適切な値を埋め込む。   FIG. 10 shows a method of generating a failure sign notification from a data transmission packet in the failure sign monitoring function. The DstID field value in the data transmission packet is embedded in the SrcID field in the failure sign notification, the SrcID field value in the data transmission packet is embedded in the DstID field in the failure sign notification, and the Cmd field in the failure sign notification is A value indicating that it is present is embedded, and an appropriate value is embedded in the Len field in the failure predictor notification.

これにより、障害予兆通知を、データ伝送パケットを発行した処理装置に送ることができる。尚、経路変更通知から経路変更通知リプライを生成する場合も、上記同様の方法で生成する。   As a result, the failure sign notification can be sent to the processing apparatus that has issued the data transmission packet. Note that when a route change notification reply is generated from the route change notification, it is generated by the same method as described above.

図5を参照すると、本発明の重要な構成要素である経路切り替え制御部120の一実施例が示されている。   Referring to FIG. 5, there is shown an embodiment of a path switching control unit 120 that is an important component of the present invention.

送信制御部500は、処理装置100内部からのパケットを、処理装置100の外部インタフェースである180或いは181へのパケット発行を制御する。パケットの発行は、宛先処理装置毎にいづれか一方のインタフェースに送信する。例えば、図1における処理装置100から処理装置104にパケットを発行する場合はインタフェース180に送信し、処理装置105にパケットを発行する場合はインタフェース181に送出(送信)するという様に制御する。パケットを発行するインタフェースが、該宛先処理装置に対する運用系インタフェースとなる。   The transmission control unit 500 controls packet issuance from the inside of the processing apparatus 100 to a packet 180 or 181 that is an external interface of the processing apparatus 100. The packet issuance is transmitted to one of the interfaces for each destination processing apparatus. For example, when the packet is issued from the processing device 100 to the processing device 104 in FIG. 1, the packet is transmitted to the interface 180, and when the packet is issued to the processing device 105, the packet is transmitted (transmitted) to the interface 181. An interface that issues a packet is an operational interface for the destination processing apparatus.

このパケット送信切り替えは、障害予兆フラグ、送信経路識別フラグと呼ばれる2つのフラグで制御する。これら2つのフラグは、パケット宛先処理装置毎に在る。送信経路識別フラグは、パケット宛先処理装置に対する運用系のインタコネクトネットワークを示す。   This packet transmission switching is controlled by two flags called a failure sign flag and a transmission path identification flag. These two flags exist for each packet destination processing device. The transmission path identification flag indicates an active interconnect network for the packet destination processing apparatus.

障害予兆フラグは、同一宛先処理装置からの2つ目以降の障害予兆通知を破棄するために使用されるフラグであり、本フラグが値0であるときに対応する宛先処理装置を示した障害予兆通知を受信した場合、該障害予兆通知を有効と判断すると共に本フラグを値1にセットする。本フラグが値1であるときに対応する宛先処理装置を示した障害予兆通知を受信した場合、該障害予兆通知を無効と判断し破棄する。同一経路で2つ目以降の障害予兆通知を受信しても、パケット発行元装置は、何のアクションも起こさないようにするためである。   The failure sign flag is a flag used for discarding the second and subsequent failure sign notifications from the same destination processing device, and indicates a corresponding failure processing device when this flag is 0. When the notification is received, it is determined that the failure sign notification is valid, and this flag is set to a value of 1. When the failure predictor notification indicating the corresponding destination processing apparatus when the flag is 1 is received, the failure predictor notification is determined to be invalid and discarded. This is to prevent the packet issuing source device from taking any action even if the second and subsequent failure predictor notifications are received on the same route.

また、経路変更通知に対するリプライである経路変更通知リプライを受信した場合、宛先処理装置に対応した本フラグを値0にリセットする。   When a route change notification reply, which is a reply to the route change notification, is received, this flag corresponding to the destination processing apparatus is reset to 0.

受信制御部501は、処理装置100の外部インタフェースである180或いは181からのパケット受信を制御する。受信制御では、2つのインタフェース180、181に対し、発行元処理装置毎に運用系インタフェースを切り替えることができる。例えば、図1における処理装置100において、発行元処理装置が処理装置104である場合は、インタフェース180を運用系とし、発行元処理装置が処理装置105である場合は、インタフェース181を運用系とすることができる。   The reception control unit 501 controls packet reception from 180 or 181 which is an external interface of the processing apparatus 100. In the reception control, for the two interfaces 180 and 181, the operational interface can be switched for each issuer processing device. For example, in the processing apparatus 100 in FIG. 1, when the issuing source processing apparatus is the processing apparatus 104, the interface 180 is the active system, and when the issuing source processing apparatus is the processing apparatus 105, the interface 181 is the operating system. be able to.

どちらのインタフェースを運用系とするかは、対応する発行元処理装置内送信制御部500と整合が取れていなければならない。このパケット受信経路切り替えは、パケット発行元処理装置におけるパケット発行順序と、パケット受信側処理装置におけるパケット受信順序とを保証(一致)しつつ受信経路を切り替える必要がある。そのため、経路変更フラグ、受信経路識別フラグと呼ばれる2つのフラグを持ち、下記の通り動作する。   Which interface is to be used as an operational system must be consistent with the corresponding in-issuer processor transmission control unit 500. In this packet reception path switching, it is necessary to switch the reception path while guaranteeing (matching) the packet issuing order in the packet issuing source processing apparatus and the packet receiving order in the packet receiving processing apparatus. Therefore, it has two flags called a route change flag and a reception route identification flag, and operates as follows.

1.経路変更フラグが値0であり、且つ受信経路識別フラグが経路変更通知を受信したインタフェースを示している場合、経路変更フラグを値1にセットする。   1. If the route change flag has a value of 0 and the received route identification flag indicates an interface that has received the route change notification, the route change flag is set to a value of 1.

2.経路変更フラグが値0であり、且つ受信経路識別フラグが経路変更通知を受信したインタフェースを示していない場合、経路変更フラグを値1にセットすると共に、経路変更通知を受信したインタフェースにおいて、経路変更通知内SrcIDフィールドで示される処理装置発行のパケット受信を一時停止する。   2. When the route change flag has a value of 0 and the received route identification flag does not indicate the interface that has received the route change notification, the route change flag is set to a value of 1, and the route change is performed at the interface that has received the route change notification. The reception of the packet issued by the processing device indicated by the SrcID field in the notification is temporarily stopped.

3.経路変更フラグが値1であり、且つ受信経路識別フラグが経路変更通知を受信したインタフェースを示している場合、経路変更フラグを値0にリセットすると共に、受信経路識別フラグを別インタフェースを示す様に更新する。さらに、別インタフェースで一時停止させている対応処理装置発行のパケット受信を再開する。   3. When the route change flag has a value of 1 and the received route identification flag indicates an interface that has received the route change notification, the route change flag is reset to a value of 0 and the received route identification flag indicates another interface. Update. Furthermore, the reception of the packet issued by the corresponding processing apparatus that is temporarily stopped by another interface is resumed.

4.経路変更フラグが値1であり、且つ受信経路識別フラグが経路変更通知を受信したインタフェースを示していない場合、経路変更フラグを値0にリセットすると共に、受信経路識別フラグを別インタフェースを示す様に更新する。   4). When the route change flag has a value of 1 and the received route identification flag does not indicate the interface that has received the route change notification, the route change flag is reset to a value of 0, and the reception route identification flag indicates another interface. Update.

次に、本発明の一実施形態における動作について、図1、図4、図5、図11及び図12を用いて説明する。   Next, the operation in one embodiment of the present invention will be described with reference to FIG. 1, FIG. 4, FIG. 5, FIG.

まず、本発明にかかる動作を説明するに当たり、それ以前の動作状態(初期状態)について述べる。図1における二重化インタコネクトネットワークコンピュータでは、処理装置100から処理装置105に発行するパケットは、インタコネクトネットワーク102を運用系とし、処理装置101から処理装置105に発行するパケットは、インタコネクトネットワーク103を運用系として稼動していると仮定する。   First, in describing the operation according to the present invention, the operation state (initial state) before that will be described. In the redundant interconnect network computer shown in FIG. 1, packets issued from the processing device 100 to the processing device 105 use the interconnect network 102 as an active system, and packets issued from the processing device 101 to the processing device 105 use the interconnect network 103. Assume that it is operating as an active system.

よって、処理装置100内の経路切り替え制御部120内の送信制御部500に在る処理装置105に対応した送信経路識別フラグは、インタコネクトネットワーク102を運用系であると示している。また、処理装置105内の経路切り替え制御部121内の受信制御部501に在る処理装置100に対応した受信経路識別フラグも、インタコネクトネットワーク102を運用系であると示している。また、この状態で、インタコネクトネットワーク102内において、処理装置100から処理装置105へのパケットが経由する箇所で、障害予兆現象を検知したものと仮定する。   Therefore, the transmission route identification flag corresponding to the processing device 105 in the transmission control unit 500 in the route switching control unit 120 in the processing device 100 indicates that the interconnect network 102 is an active system. Further, the reception route identification flag corresponding to the processing device 100 in the reception control unit 501 in the route switching control unit 121 in the processing device 105 also indicates that the interconnect network 102 is an active system. In this state, it is assumed that a failure sign phenomenon is detected at a location where a packet from the processing device 100 to the processing device 105 passes in the interconnect network 102.

次に、上記動作状態における本発明の動作について、図11と図12をもとに下記4つの動作に分けて説明する。
1.障害予兆現象を検知したインタコネクトネットワーク102内の動作
2.障害予兆通知を受信した処理装置100内の動作
3.経路変更通知を受信したインタコネクトネットワーク102内の障害予兆現象検知箇所の動作
4.経路変更通知リプライを受信した処理装置100内の動作
5.経路変更通知を受信した処理装置105内の動作
第一に、障害予兆現象を検知したインタコネクトネットワーク102内の動作について、図4と図11を用いて説明する。インタコネクトネットワーク102内において、処理装置100から処理装置105へのパケットが経由する図4記載のインタフェース制御部310は、障害制御部400内の障害予兆監視機能により、インタフェース150からインタフェース350方向の障害予兆現象を検知する(ステップ1111)。
Next, the operation of the present invention in the above operation state will be described by dividing it into the following four operations based on FIG. 11 and FIG.
1. 1. Operation in the interconnect network 102 that has detected a failure sign phenomenon 2. Operation in the processing apparatus 100 that has received the failure predictor notification 3. Operation of the failure sign phenomenon detection location in the interconnect network 102 that received the route change notification 4. Operation in the processing apparatus 100 that has received the route change notification reply Operation in Processing Device 105 Receiving Route Change Notification First, the operation in the interconnect network 102 that has detected the failure sign phenomenon will be described with reference to FIGS. 4 and 11. In the interconnect network 102, the interface control unit 310 shown in FIG. 4 through which a packet from the processing device 100 to the processing device 105 passes is used to detect a failure in the direction from the interface 150 to the interface 350 by the failure sign monitoring function in the failure control unit 400. A predictive phenomenon is detected (step 1111).

検知以降インタフェース150から受信したパケットをインタフェース350に送信する(ステップ1112)。そしてインタフェース162を経由して処理装置5に送られ、処理装置105がパケットを受信する(ステップ1121)。   A packet received from the interface 150 after detection is transmitted to the interface 350 (step 1112). Then, it is sent to the processing device 5 via the interface 162, and the processing device 105 receives the packet (step 1121).

これらと共に、インタフェース制御部310は該パケット情報から障害予兆通知を生成し、選択回路A410を経由させインタフェース150に送信する(ステップ1113)。インタフェース150に送信された障害予兆通知は、インタコネクトネットワーク102内をルーティングされ、処理装置100に伝送される。   Together with these, the interface control unit 310 generates a failure sign notification from the packet information, and transmits it to the interface 150 via the selection circuit A410 (step 1113). The failure sign notification transmitted to the interface 150 is routed through the interconnect network 102 and transmitted to the processing device 100.

第二に、障害予兆通知を受信した処理装置100内の動作について、図1と図5と図11を用いて説明する。図1記載のインタフェース150から送られてくる障害予兆通知は、処理装置100内のインタフェース制御部110を経由して経路切り替え制御部120に送られる。図5記載の経路切り替え制御部120では、インタフェース180から障害予兆通知を受信すると、受信制御部501を経由して送信制御部500に送られる。   Secondly, the operation in the processing apparatus 100 that has received the failure sign notification will be described with reference to FIGS. 1, 5, and 11. FIG. The failure sign notification sent from the interface 150 shown in FIG. 1 is sent to the path switching control unit 120 via the interface control unit 110 in the processing apparatus 100. In the path switching control unit 120 illustrated in FIG. 5, when a failure sign notification is received from the interface 180, the notification is sent to the transmission control unit 500 via the reception control unit 501.

送信制御部500では、受信経路部501から受信したパケット内のCmdフィールドを参照し、受信パケットが障害予兆通知であることを知る(ステップ1101)。また、SrcIDフィールドを参照し、処理装置105行きの経路にて障害予兆現象が検知されたことを知り、下記動作を行う。   The transmission control unit 500 refers to the Cmd field in the packet received from the reception path unit 501 and knows that the received packet is a failure sign notification (step 1101). In addition, referring to the SrcID field, knowing that a failure sign phenomenon has been detected on the route to the processing device 105, the following operation is performed.

1.処理装置105に対応した障害予兆フラグを値1にセットする。これにより、SrcIDフィールドが処理装置105を示している後続の障害予兆通知を破棄する(ステップ1102)。   1. A failure predictor flag corresponding to the processing device 105 is set to a value of 1. As a result, the subsequent failure sign notification in which the SrcID field indicates the processing device 105 is discarded (step 1102).

2.処理装置105宛のパケット発行を一時停止し、インタフェース180と181の両方に経路変更通知を発行する(ステップ1103)。この経路変更通知は、DstIDフィールドを処理装置105、SrcIDフィールドを処理装置100とする。   2. Issuing packets addressed to the processing device 105 is temporarily stopped, and a route change notification is issued to both the interfaces 180 and 181 (step 1103). This route change notification uses the DstID field as the processing device 105 and the SrcID field as the processing device 100.

3.経路変更通知を発行後、処理装置105に対応した送信経路識別フラグを、インタコネクトネットワーク103が運用系となる様に書き換え、一時停止していた処理装置105宛のパケット発行を再開する(ステップ1104)。   3. After issuing the route change notification, the transmission route identification flag corresponding to the processing device 105 is rewritten so that the interconnect network 103 becomes the active system, and issuance of the packet addressed to the processing device 105 that has been suspended is resumed (step 1104). ).

第三に、経路変更通知を受信したインタコネクトネットワーク102内の障害予兆現象検知箇所の動作について、図4、図11を用いて説明する。まず障害予兆現象を検知したインタフェース制御部310では、インタフェース150から経路変更通知を受信すると、該経路変更通知をインタフェース350に送信する(ステップ1114)。   Third, the operation of the failure sign phenomenon detection location in the interconnect network 102 that has received the route change notification will be described with reference to FIGS. First, upon receiving a route change notification from the interface 150, the interface control unit 310 that has detected the failure sign phenomenon transmits the route change notification to the interface 350 (step 1114).

これと共に、該経路変更通知から経路変更通知リプライを生成し、選択回路A410を経由させインタフェース150に送信する(ステップ1115)。インタフェース150に送信された経路変更通知リプライは、インタコネクトネットワーク102内をルーティングされ、処理装置100に伝送される。   At the same time, a route change notification reply is generated from the route change notification and transmitted to the interface 150 via the selection circuit A410 (step 1115). The route change notification reply sent to the interface 150 is routed through the interconnect network 102 and transmitted to the processing device 100.

第四に、経路変更通知リプライを受信した処理装置100内の動作について、図1と図5と図11を用いて説明する。まず図1において、インタフェース150から送られてくる経路変更通知リプライは、処理装置100内のインタフェース制御部110を経由して経路切り替え制御部120に送られる。   Fourth, the operation in the processing apparatus 100 that has received the route change notification reply will be described with reference to FIGS. 1, 5, and 11. FIG. First, in FIG. 1, the route change notification reply sent from the interface 150 is sent to the route switching control unit 120 via the interface control unit 110 in the processing apparatus 100.

図5記載の経路切り替え制御部120では、インタフェース180から経路変更通知リプライを受信すると、受信制御部501を経由して送信制御部500に送られる。送信制御部500では、受信経路部501から受信したパケット内のCmdフィールドを参照し、受信パケットが経路変更通知リプライであることを知る(ステップ1105)。   In the path switching control unit 120 illustrated in FIG. 5, when a path change notification reply is received from the interface 180, it is sent to the transmission control unit 500 via the reception control unit 501. The transmission control unit 500 refers to the Cmd field in the packet received from the reception path unit 501 and knows that the received packet is a path change notification reply (step 1105).

また、SrcIDフィールドを参照し、処理装置105行きの経路変更通知リプライであることを知り、処理装置105に対応した障害予兆フラグを値0にリセットし、以降処理装置105に対する障害予兆通知を有効として扱える様にする(ステップ1106)。尚、経路変更通知リプライを受信した後は、障害予兆現象が検知されたインタコネクトネットワーク102から処理装置105に対する障害予兆通知を受信することはない。   Also, referring to the SrcID field, knowing that the reply is a route change notification reply to the processing device 105, resets the failure predictor flag corresponding to the processing device 105 to a value of 0, and subsequently enables the failure predictor notification to the processing device 105. It can be handled (step 1106). Note that after receiving the route change notification reply, no failure indication notification for the processing device 105 is received from the interconnect network 102 in which the failure indication phenomenon is detected.

第五に、経路変更通知を受信した処理装置105内の動作について、図1、図5、図11、図12を用いて説明する。まず図1において、処理装置105は、処理装置100発行のパケットをインタフェース162から受信している状態になっている。   Fifth, the operation in the processing device 105 that has received the route change notification will be described with reference to FIGS. 1, 5, 11, and 12. First, in FIG. 1, the processing device 105 is in a state of receiving a packet issued by the processing device 100 from the interface 162.

その状態で、インタフェース162と163から処理装置100が発行した経路変更通知を受信することになる。インタフェース162或いは163から受信した経路変更通知は、インタフェース制御部112或いは113を経由して経路切り替え制御部121に送られる。   In this state, the route change notification issued by the processing device 100 is received from the interfaces 162 and 163. The route change notification received from the interface 162 or 163 is sent to the route switching control unit 121 via the interface control unit 112 or 113.

次に、経路切り替え制御部121の動作について、図5、図11、図12を用いて説明する。尚、図5では、経路切り替え制御部120と記載されているが、ここでは経路切り替え制御部121と読み替えるものとする。経路切り替え制御部121では、インタフェース180と181から処理装置100が発行した経路変更通知を受信制御部501で受信することになる(ステップ1122)。   Next, the operation of the path switching control unit 121 will be described with reference to FIGS. 5, 11, and 12. In FIG. 5, the path switching control unit 120 is described, but here it is read as the path switching control unit 121. In the path switching control unit 121, the reception control unit 501 receives the path change notification issued by the processing apparatus 100 from the interfaces 180 and 181 (step 1122).

処理装置100の経路切り換え制御部120のインタフェース180を経由した経路変更通知はインタコネクトネットワーク102、インタフェース162、インタフェース制御部112、経路切り換え制御部120のインタフェース180を経ることにより処理装置105へ送られる。同様に処理装置100の経路切り換え制御部120のインタフェース181を経由した経路変更通知はインタコネクトネットワーク103、インタフェース163、インタフェース制御部113、経路切り換え制御部121のインタフェース181を経ることにより処理装置105へ送られることになる。   The route change notification via the interface 180 of the route switching control unit 120 of the processing device 100 is sent to the processing device 105 via the interconnect network 102, the interface 162, the interface control unit 112, and the interface 180 of the route switching control unit 120. . Similarly, a route change notification via the interface 181 of the route switching control unit 120 of the processing device 100 is sent to the processing device 105 via the interconnect network 103, the interface 163, the interface control unit 113, and the interface 181 of the route switching control unit 121. Will be sent.

受信制御部501では、インタフェース180或いは181から受信したパケット内のCmdフィールドを参照し、受信パケットが経路変更通知であることを知る。また、SrcIDフィールドを参照し、処理装置100との間の経路変更通知であることを知る(ステップ1122)。   The reception control unit 501 refers to the Cmd field in the packet received from the interface 180 or 181 and knows that the received packet is a route change notification. Further, the SrcID field is referred to and it is known that this is a route change notification with the processing apparatus 100 (step 1122).

その後、インタフェース180と181からの経路変更通知をどちらが先に受信したかを判断し、その先後(タイミング)により、下記2つのうちのいづれかの動作を行う(ステップ1202)。   Thereafter, it is determined which of the path change notifications from the interfaces 180 and 181 is received first, and one of the following two operations is performed depending on the destination (timing) (step 1202).

まず、インタフェース180から先に経路変更通知を受信制御部501が受信した場合(ステップ1202YES)の動作を説明する。インタフェース180から経路変更通知を受信する前、経路変更フラグは値0であり、受信経路識別フラグはインタフェース180を示している。即ち、インタフェース180が運用系となっている。   First, the operation when the reception control unit 501 receives a route change notification from the interface 180 first (step 1202 YES) will be described. Before the route change notification is received from the interface 180, the route change flag has a value of 0, and the received route identification flag indicates the interface 180. That is, the interface 180 is an operational system.

この状態で受信制御部501がインタフェース180から先に経路変更通知を受信すると、経路変更フラグが値0であり且つ受信経路識別フラグが自インタフェースである180を示しているため、経路変更フラグを値1にセットする(ステップ1203)。   In this state, when the reception control unit 501 first receives a route change notification from the interface 180, the route change flag indicates the value 0 and the reception route identification flag indicates 180 that is the own interface. It is set to 1 (step 1203).

その後、インタフェース181から経路変更通知を受信する(ステップ1204)と、経路変更フラグが値1であり且つ受信経路識別フラグが別インタフェースである180を示している。このため、経路変更フラグを値0にリセットすると共に、受信経路識別フラグをインタフェース181を示す様に更新する。即ちインタフェース181を運用系とする(ステップ1205)。   Thereafter, when a route change notification is received from the interface 181 (step 1204), the route change flag has a value of 1 and the received route identification flag indicates 180 which is another interface. Therefore, the route change flag is reset to 0, and the reception route identification flag is updated to indicate the interface 181. That is, the interface 181 is set as an active system (step 1205).

これにより、受信経路変更通知の後に処理装置100から発行された処理装置105宛のパケットを、インタフェース181から受信することができる(ステップ1206)。   Thereby, the packet addressed to the processing device 105 issued from the processing device 100 after the reception path change notification can be received from the interface 181 (step 1206).

次に、インタフェース181から先に経路変更通知を受信した場合(ステップ1202NO)の動作を説明する。インタフェース181から経路変更通知を受信する前、経路変更フラグは値0であり、受信経路識別フラグはインタフェース180を示している。即ち、インタフェース180が運用系となっている。     Next, the operation when the route change notification is received first from the interface 181 (NO in step 1202) will be described. Before receiving a route change notification from the interface 181, the route change flag has a value of 0, and the received route identification flag indicates the interface 180. That is, the interface 180 is an operational system.

この状態でインタフェース181から先に経路変更通知を受信すると、経路変更フラグが値0であり且つ受信経路識別フラグが別インタフェースである180を示している。このため、経路変更フラグを値1にセットする(ステップ1207)と共に、インタフェース181において、処理装置100発行のパケット受信を一時停止させる(ステップ1208)。   When a route change notification is received first from the interface 181 in this state, the route change flag indicates the value 0, and the reception route identification flag indicates 180 which is another interface. Therefore, the route change flag is set to 1 (step 1207), and the interface 181 temporarily stops receiving the packet issued by the processing device 100 (step 1208).

ここで、パケット受信の一時停止に当たっては、そのパケットを一時保持しておく必要があり、具体的には、例えば、インタフェース制御部113内にある図示しないバッファ内にパケットを一時保持しておくことができる。   Here, when the packet reception is suspended, it is necessary to temporarily hold the packet. Specifically, for example, the packet is temporarily held in a buffer (not shown) in the interface control unit 113. Can do.

その後、インタフェース180から経路変更通知を受信するまでの間に、インタフェース180を経由して受信制御部501に到達するパケットがあればそのパケットの受信を行う。インタフェース180から経路変更通知を受信した後、バッファ内に一時保持しておいたパケットを順次受信する。すなわち、インタフェース180がインタフェース181よりも遅れが生じた場合、遅れた経路変更通知が到着するまで進んでいるパケットの一時待ち合わせを行うことにより、両インタフェースの同期をとり時間軸の修正を行っている。   Thereafter, if there is a packet that reaches the reception control unit 501 via the interface 180 before the route change notification is received from the interface 180, the packet is received. After receiving the route change notification from the interface 180, the packets temporarily stored in the buffer are sequentially received. In other words, when the interface 180 is delayed from the interface 181, the time axis is corrected by synchronizing both interfaces by temporarily waiting for the packet that has been advanced until the delayed route change notification arrives. .

またパケット受信経路を切り替えることにより、パケット発行元処理装置におけるパケット発行順序と、パケット受信側処理装置におけるパケット受信順序との一致を保証しつつ受信経路を切り替えることができる。   Further, by switching the packet reception path, it is possible to switch the reception path while guaranteeing a match between the packet issue order in the packet issuing source processing apparatus and the packet reception order in the packet receiving side processing apparatus.

これにより、インタフェース181から経路変更通知を受信した後、インタフェース180から経路変更通知を受けるまでに受信すべきパケットが受信できず捨てられることを防止できる。   As a result, it is possible to prevent a packet to be received from being received before the path change notification is received from the interface 180 after being received from the interface 181 from being discarded.

その後、インタフェース180から経路変更通知を受信する(ステップ1209)と、経路変更フラグが値1であり且つ受信経路識別フラグが自インタフェースである180を示している。このため、経路変更フラグを値0にリセットすると共に、受信経路識別フラグをインタフェース181を示す様に更新する。即ちインタフェース181を運用系とする(ステップ1210)。   Thereafter, when a route change notification is received from the interface 180 (step 1209), the route change flag has a value of 1 and the received route identification flag indicates 180 that is the own interface. Therefore, the route change flag is reset to 0, and the reception route identification flag is updated to indicate the interface 181. That is, the interface 181 is set as the active system (step 1210).

さらに、インタフェース181において、一時停止させている処理装置100発行のパケット受信を再開させる(ステップ1211)。これにより、処理装置100からインタコネクトネットワーク102に発行された処理装置105宛のパケットを先に処理し、その後、処理装置100からインタコネクトネットワーク103に発行された処理装置105宛のパケットを処理することができる。   Further, the interface 181 restarts the reception of the packet issued by the processing apparatus 100 that has been suspended (step 1211). Thus, the packet addressed to the processing device 105 issued from the processing device 100 to the interconnect network 102 is processed first, and then the packet addressed to the processing device 105 issued from the processing device 100 to the interconnect network 103 is processed. be able to.

従って受信経路変更通知発行タイミング前に処理装置100から処理装置102に発行された処理装置105宛のパケットAが到着しないうちに、処理装置100からインタコネクトネットワーク103に発行された処理装置105宛のパケットBが到着することになる結果、処理装置100からインタコネクトネットワーク103に発行された処理装置102に発行された処理装置105宛のパケットが到着できずに捨てられるという事態を防ぐことができる。すなわちデータ消失を防ぐことができるという効果がある。   Therefore, before the packet A addressed to the processing device 105 issued from the processing device 100 to the processing device 102 arrives before the reception path change notification issuance timing, the address addressed to the processing device 105 issued from the processing device 100 to the interconnect network 103 is reached. As a result of arrival of the packet B, it is possible to prevent a situation where a packet addressed to the processing device 105 issued to the processing device 102 issued from the processing device 100 to the interconnect network 103 cannot arrive and is discarded. That is, there is an effect that data loss can be prevented.

次にインタフェース180とインタフェース180とから同時に経路変更通知を受信制御部501が受信した場合の動作を説明する。   Next, an operation when the reception control unit 501 receives a route change notification from the interface 180 and the interface 180 simultaneously will be described.

インタフェース180或いは181から経路変更通知を受信する前、経路変更フラグは値0であり、受信経路識別フラグはインタフェース180を示している。即ち、インタフェース180が運用系となっている。   Before receiving a route change notification from the interface 180 or 181, the route change flag has a value of 0, and the received route identification flag indicates the interface 180. That is, the interface 180 is an operational system.

この状態でインタフェース180から経路変更通知を受信すると、経路変更フラグが値0であり且つ受信経路識別フラグが自インタフェースである180を示しているため、経路変更フラグを値1にセットする。   When a route change notification is received from the interface 180 in this state, the route change flag is set to the value 1 because the route change flag indicates the value 0 and the received route identification flag indicates 180 that is the own interface.

また同時に(同タイミングにて)インターフェース181からも経路変更通知を受信するので、経路変更フラグが値1であり且つ受信経路識別フラグが別インタフェースである180を示している。このため経路変更フラグを値0にリセットすると共に、受信経路識別フラグをインタフェース181を示す様に更新する。   At the same time (at the same timing), since the route change notification is also received from the interface 181, the route change flag indicates the value 1 and the reception route identification flag indicates 180 which is another interface. Therefore, the route change flag is reset to 0, and the reception route identification flag is updated to indicate the interface 181.

即ちインタフェース181を運用系とする。これにより、受信経路変更通知の後に処理装置100から発行された処理装置105宛のパケットを、インタフェース181から受信することができる。   In other words, the interface 181 is used as an operational system. Thereby, the packet addressed to the processing device 105 issued from the processing device 100 after the reception path change notification can be received from the interface 181.

以上説明した動作により、インタコネクトネットワークにおいて障害予兆現象を検知した場合、ソフトウェアでの処理を必要とせず、ハードウェアのみで自律的且つ即座に経路変更を行うことができる。このため、この動作はエラー予防処理として位置づけることができインタコネクトネットワーク障害に起因するシステムダウンを低減させることができる。   According to the operation described above, when a failure sign phenomenon is detected in the interconnect network, it is possible to change the route autonomously and immediately using only hardware without requiring software processing. For this reason, this operation can be positioned as error prevention processing, and system down due to an interconnect network failure can be reduced.

情報処理機器において利用できる。   It can be used in information processing equipment.

本発明の二重化インタコネクトネットワークシステムの構成図。1 is a configuration diagram of a duplexed interconnect network system of the present invention. 本発明のインタコネクトネットワークの構成図。The block diagram of the interconnect network of this invention. 本発明のスイッチ装置の構成図。The block diagram of the switch apparatus of this invention. 本発明のインタフェース制御部の構成図。The block diagram of the interface control part of this invention. 本発明の経路切り替え制御部の構成図。The block diagram of the path | route switching control part of this invention. 本発明の他のインタコネクトネットワークの構成図。The block diagram of the other interconnect network of this invention. 本発明の他のインタコネクトネットワークの構成図。The block diagram of the other interconnect network of this invention. 本発明の他のインタコネクトネットワークの構成図。The block diagram of the other interconnect network of this invention. ネットワークで伝送されるパケットの構成図。The block diagram of the packet transmitted in a network. 障害予兆監視機能におけるデータ伝送パケットから障害予兆通知を生成する方法をしめる図。The figure which shows the method of producing | generating the failure sign notification from the data transmission packet in a failure sign monitoring function. 本発明の実施例の動作を示すフローチャート。The flowchart which shows operation | movement of the Example of this invention. 本発明の実施例の動作のうち経路変更通知を受信した処理装置の動作を示すフローチャート。The flowchart which shows operation | movement of the processing apparatus which received the path | route change notification among operation | movement of the Example of this invention.

符号の説明Explanation of symbols

100 処理装置
105 処理装置
102 インタコネクトネットワーク
103 インタコネクトネットワーク
110 インタフェース制御部
111 インタフェース制御部
112 インタフェース制御部
113 インタフェース制御部
120 経路切り換え制御部
121 経路切り換え制御部
200 スイッチ装置
300 完全クロスバー
310 インタフェース制御部
311 インタフェース制御部
400 障害制御部
410 選択回路A
411 選択回路B
500 送信制御部
501 受信制御部
DESCRIPTION OF SYMBOLS 100 Processing apparatus 105 Processing apparatus 102 Interconnect network 103 Interconnect network 110 Interface control part 111 Interface control part 112 Interface control part 113 Interface control part 120 Path switching control part 121 Path switching control part 200 Switch apparatus 300 Complete crossbar 310 Interface control Unit 311 interface control unit 400 fault control unit 410 selection circuit A
411 Selection circuit B
500 Transmission control unit 501 Reception control unit

Claims (14)

複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムのエラー予防処理方法であり、
障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知するステップと、
そのデータの発行元の前記情報処理装置に障害予兆通知を送信するステップと、
前記障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行うステップとを含むことを特徴とする情報処理システムのエラー予防処理方法。
An error prevention processing method for an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks,
Monitoring a failure predictor and detecting a failure predictor of data transmitted through the interconnect network path;
Transmitting a failure sign notification to the information processing apparatus that issued the data;
An error prevention processing method for an information processing system, comprising: a step of switching a route of a current active interconnect network to a route of another interconnect network after receiving the failure sign notification and performing subsequent data transmission .
請求項1記載のエラー予防処理方法であり、
前記障害予兆通知を受け取った発行元情報処理装置が一時、データ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付するステップと、
前記データ宛先情報処理装置において、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせるステップとをさらに含むことを特徴とする情報処理システムのエラー予防処理方法。
An error prevention processing method according to claim 1,
The issuer information processing apparatus that has received the failure sign notification temporarily stops data transmission to the data destination information processing apparatus, and the current active interconnect network and the current standby interconnect network are directed to the data destination information processing apparatus. Sending a route change notification to each simultaneously using and
In the data destination information processing apparatus, when a route change notification is received from the current standby interconnect network first, data is received from the current standby interconnect network until a route change notification is received from the current active interconnect network. An error prevention processing method for an information processing system, further comprising a step of waiting for the information processing system.
請求項2記載のエラー予防処理方法であり、
発行元情報処理装置が現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付するステップのあと、
現待機系インタコネクトネットワークを運用系インタコネクトネットワークとして用いるように切り替えてデータ送信の再開をするステップをさらに含むことを特徴とする請求項7記載の情報処理システムのエラー予防処理方法。
An error prevention processing method according to claim 2,
After the step in which the issuing information processor uses the current active interconnect network and the current standby interconnect network to send a route change notification to each simultaneously,
8. The error prevention processing method for an information processing system according to claim 7, further comprising the step of switching the current standby interconnect network to be used as the active interconnect network and restarting data transmission.
請求項2または3記載のエラー予防処理方法であり、
前記データ宛先情報処理装置が現運用系インタコネクトネットワークから経路変更通知を受信した場合、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えてそのデータ受信を再開するステップをさらに含むことを特徴とする情報処理システムのエラー予防処理方法。
An error prevention processing method according to claim 2 or 3,
When the data destination information processing apparatus receives a route change notification from the current active interconnect network, the data destination information processing apparatus further includes a step of switching the current standby interconnect network to be used as the active interconnect network and restarting the data reception. An error prevention processing method for an information processing system.
請求項2または3記載のエラー予防処理方法であり、
前記データ宛先情報処理装置が現待機系インタコネクトネットワークから先に経路変更通知を受信しなかった場合、現待機系インタコネクトネットワークから経路変更通知を受信した後に、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えるステップとをさらに含むことを特徴とする情報処理システムのエラー予防処理方法。
An error prevention processing method according to claim 2 or 3,
If the data destination information processing device does not receive a route change notification from the current standby interconnect network first, after receiving the route change notification from the current standby interconnect network, the current destination interconnect network An error prevention processing method for an information processing system, further comprising a step of switching to use as an interconnect network.
複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムであり、
前記インタコネクトネットワークには、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、
そのデータの発行元の前記情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、
前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備えることを特徴とする情報処理システム。
An information processing system in which a plurality of information processing devices are connected via a plurality of interconnect networks,
In the interconnect network, a failure sign phenomenon detection unit that monitors a failure sign phenomenon and detects a failure sign phenomenon of data transmitted through the route of the interconnect network;
An interface control unit for transmitting a failure sign notification to the information processing apparatus that issued the data,
The information processing apparatus of the issuing source includes a path switching control unit that switches a path of the current active interconnect network to a path of another interconnect network after receiving the failure sign notification and performs subsequent data transmission An information processing system characterized by this.
複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムであり、
前記インタコネクトネットワークには、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、
そのデータの発行元の前記情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、
前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後、一時的にデータ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付し、その後、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備え、
前記データ宛先情報処理装置には、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせる経路切り換え制御部を備えることを特徴とする情報処理システム。
An information processing system in which a plurality of information processing devices are connected via a plurality of interconnect networks,
In the interconnect network, a failure sign phenomenon detection unit that monitors a failure sign phenomenon and detects a failure sign phenomenon of data transmitted through the route of the interconnect network;
An interface control unit for transmitting a failure sign notification to the information processing apparatus that issued the data,
After receiving the failure sign notification, the issuing information processing device temporarily stops data transmission to the data destination information processing device, and sends the current active interconnect to the data destination information processing device. Send a route change notification to each of the network and the current standby interconnect network at the same time, and then switch the route of the current active interconnect network to the route of the other interconnect network to transmit subsequent data With a route switching control unit,
When the data destination information processing apparatus previously receives a route change notification from the current standby interconnect network, data from the current standby interconnect network is received until a route change notification is received from the current active interconnect network. An information processing system comprising a path switching control unit that waits for reception.
請求項7記載の情報処理システムであり、
発行元情報処理装置における経路切り換え制御部は、現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付したあと、現待機系インタコネクトネットワークを運用系インタコネクトネットワークとして用いるように切り替えてデータ送信の再開をすることを特徴とする情報処理システム。
The information processing system according to claim 7,
The path switching control unit in the issuing information processing device uses the current active interconnect network and the current standby interconnect network to send route change notifications to the active standby network and the active standby interconnect network. An information processing system, wherein data transmission is resumed by switching to use as an interconnect network.
請求項7または8記載の情報処理システムであり、
前記データ宛先情報処理装置における経路切り換え制御部は、現運用系インタコネクトネットワークから経路変更通知を受信した場合、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えてそのデータ受信を再開することを特徴とする情報処理システム。
An information processing system according to claim 7 or 8,
When the path switching control unit in the data destination information processing apparatus receives a path change notification from the current active interconnect network, the path switching control unit switches the current standby interconnect network to be used as the active interconnect network and receives the data. An information processing system characterized by restarting.
請求項7または8記載の情報処理システムであり、
前記データ宛先情報処理装置における経路切り換え制御部は、現待機系インタコネクトネットワークから先に経路変更通知を受信しなかった場合、現待機系インタコネクトネットワークから経路変更通知を受信した後に、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えることを特徴とする情報処理システム。
An information processing system according to claim 7 or 8,
If the path switching control unit in the data destination information processing apparatus does not receive the path change notification from the current standby interconnect network, the path switching control unit receives the path change notification from the current standby interconnect network, An information processing system characterized by switching to use an interconnect network as an operational interconnect network.
障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する複数のインタコネクトネットワークを介して情報処理装置が接続された情報処理システムを構成する情報処理装置であり、
前記障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備えることを特徴とする情報処理装置。
It is an information processing device that constitutes an information processing system in which information processing devices are connected via a plurality of interconnect networks that monitor the failure predictor phenomenon and detect the failure predictor phenomenon of data transmitted through the route of the interconnect network ,
An information processing apparatus comprising: a path switching control unit configured to switch a path of a current active interconnect network to a path of another interconnect network after receiving the failure sign notification and perform subsequent data transmission.
請求項11記載の情報処理装置であり、
前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後、一時的にデータ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付し、その後、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備え、
前記データ宛先の前記情報処理装置には、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせる経路切り換え制御部を備えることを特徴とする情報処理装置。
An information processing apparatus according to claim 11,
After receiving the failure sign notification, the issuing information processing device temporarily stops data transmission to the data destination information processing device, and sends the current active interconnect to the data destination information processing device. Send a route change notification to each of the network and the current standby interconnect network at the same time, and then switch the route of the current active interconnect network to the route of the other interconnect network to transmit subsequent data With a route switching control unit,
If the information processing apparatus of the data destination has previously received a route change notification from the current standby interconnect network, the information processing device from the current standby interconnect network until receiving a route change notification from the current active interconnect network. An information processing apparatus comprising a path switching control unit that waits for data reception.
複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムを構成するインタコネクトネットワークであり、
前記インタコネクトネットワークは、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、
そのデータの発行元の前記情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、
前記発行元の前記情報処理装置は、前記障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行うことを特徴とするインタコネクトネットワーク。
An interconnect network constituting an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks,
The interconnect network monitors a failure predictor phenomenon and detects a failure predictor phenomenon of data transmitted through the interconnect network path,
An interface control unit for transmitting a failure sign notification to the information processing apparatus that issued the data,
The information processing apparatus of the issuing source performs subsequent data transmission by switching the path of the current active interconnect network to a path of another interconnect network after receiving the failure sign notification network.
複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムを構成するインタコネクトネットワークであり、
前記インタコネクトネットワークは、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、
そのデータの発行元の前記情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、
前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後、一時的にデータ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付し、その後、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備え、
前記データ宛先情報処理装置は、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせる経路切り換え制御部を備えることを特徴とするインタコネクトネットワーク。
An interconnect network constituting an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks,
The interconnect network monitors a failure predictor phenomenon and detects a failure predictor phenomenon of data transmitted through the interconnect network path,
An interface control unit for transmitting a failure sign notification to the information processing apparatus that issued the data,
After receiving the failure sign notification, the issuing information processing device temporarily stops data transmission to the data destination information processing device, and sends the current active interconnect to the data destination information processing device. Send a route change notification to each of the network and the current standby interconnect network at the same time, and then switch the route of the current active interconnect network to the route of the other interconnect network to transmit subsequent data With a route switching control unit,
If the data destination information processing apparatus previously receives a route change notification from the current standby interconnect network, it receives data from the current standby interconnect network until it receives a route change notification from the current active interconnect network. An interconnect network comprising a path switching control unit that waits for
JP2005309956A 2005-10-25 2005-10-25 Information processing system, information processor, and error prevention processing method of interconnect network and information processing system Withdrawn JP2007124020A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005309956A JP2007124020A (en) 2005-10-25 2005-10-25 Information processing system, information processor, and error prevention processing method of interconnect network and information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005309956A JP2007124020A (en) 2005-10-25 2005-10-25 Information processing system, information processor, and error prevention processing method of interconnect network and information processing system

Publications (1)

Publication Number Publication Date
JP2007124020A true JP2007124020A (en) 2007-05-17

Family

ID=38147412

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005309956A Withdrawn JP2007124020A (en) 2005-10-25 2005-10-25 Information processing system, information processor, and error prevention processing method of interconnect network and information processing system

Country Status (1)

Country Link
JP (1) JP2007124020A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016100838A (en) * 2014-11-25 2016-05-30 Necプラットフォームズ株式会社 Data transfer circuit and transfer method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016100838A (en) * 2014-11-25 2016-05-30 Necプラットフォームズ株式会社 Data transfer circuit and transfer method

Similar Documents

Publication Publication Date Title
US7844852B2 (en) Data mirror cluster system, method and computer program for synchronizing data in data mirror cluster system
KR20070116102A (en) Dma controller, node, data transfer control method, and program
JP4369470B2 (en) Data relay apparatus, storage apparatus, and response delay monitoring method
KR20080101787A (en) Intelligent failover in a load-balanced networking environment
JP2008283608A (en) Computer, program and method for switching redundant communication path
JP2007058708A (en) Multiplex system
US7043574B2 (en) Computer system and frame transmitting method
JP2008046996A (en) Data processor, and mode management device and method
JP5381109B2 (en) Communication apparatus and control program thereof
JP2006338374A (en) Network connection management device and network connection management method
JP2007124020A (en) Information processing system, information processor, and error prevention processing method of interconnect network and information processing system
JP4541241B2 (en) Plant control system
JPWO2020090032A1 (en) Communication systems, communication devices and programs
JP4572138B2 (en) Server apparatus, server system, and system switching method in server system
JP3917467B2 (en) Power system monitoring control system and program
CN112217718A (en) Service processing method, device, equipment and storage medium
JP2008009518A (en) Dual operation system
JP5516569B2 (en) Information processing apparatus and control method
WO2008062511A1 (en) Multiprocessor system
JP5145860B2 (en) Redundant memory system and information processing apparatus
JP2013254333A (en) Multiple system control system and control method therefor
JP2019168739A (en) Parallel computation system
WO2023197972A1 (en) Optical transmission device, service device, and service transmission method and system
JP2007072980A (en) Computer control system
WO2010070713A1 (en) Information processing device and control method

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20090106