JP2007124020A - Information processing system, information processor, and error prevention processing method of interconnect network and information processing system - Google Patents
Information processing system, information processor, and error prevention processing method of interconnect network and information processing system Download PDFInfo
- Publication number
- JP2007124020A JP2007124020A JP2005309956A JP2005309956A JP2007124020A JP 2007124020 A JP2007124020 A JP 2007124020A JP 2005309956 A JP2005309956 A JP 2005309956A JP 2005309956 A JP2005309956 A JP 2005309956A JP 2007124020 A JP2007124020 A JP 2007124020A
- Authority
- JP
- Japan
- Prior art keywords
- interconnect network
- information processing
- data
- route
- interconnect
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
Description
本発明は高可用性と装置間伝送路の高信頼性を実現する情報処理システム及び情報処理システムのエラー予防処理方法に関し、特に二重化インタコネクトネットワーク情報処理システム及びそのエラー予防処理方法に関する。 The present invention relates to an information processing system and an error prevention processing method for an information processing system that realize high availability and high reliability of an inter-device transmission path, and more particularly to a duplex interconnect network information processing system and an error prevention processing method thereof.
本発明が関係する二重化インタコネクトネットワークコンピュータは、特にコンピュータの高可用性と処理装置間伝送路の高信頼性を実現するコンピュータに用いられている。 The duplex interconnect network computer to which the present invention relates is particularly used in computers that realize high availability of computers and high reliability of transmission paths between processing devices.
この二重化インタコネクトネットワークコンピュータに関し、インタコネクトネットワーク障害に起因するコンピュータ障害の障害耐性を向上させる方法には、コンピュータ間のネットワーク(代表例ではインターネット)の障害に起因するコンピュータ間データ伝送障害の障害耐性を向上させる方法を採用できる可能性がある。よって、コンピュータ間データ伝送の障害耐性向上方法も含めて、従来技術を考察する。 With regard to this dual interconnect network computer, there is a method for improving the fault tolerance of the computer fault caused by the interconnect network fault. The fault tolerance of the inter-computer data transmission fault caused by the fault of the network between computers (the Internet in the typical example). There is a possibility that a method for improving the above can be adopted. Therefore, the prior art including a method for improving the fault tolerance of data transmission between computers will be considered.
コンピュータ内インタコネクトネットワーク或いはコンピュータ間ネットワーク障害に起因するデータ伝送の障害耐性向上方法として、下記の方法がある。 The following methods are available as methods for improving the fault tolerance of data transmission caused by an intra-computer interconnect network or inter-computer network failure.
第一の方法は、特許文献1に記載されている方法である。この方法は、データ発行元装置からデータを送信する際、2つのネットワークに同一データを送信し、データ宛先装置では、2つのネットワークから同一データを受信するが、どちらか片方のデータを拾い込み、他方のデータを破棄する方法である。この方法の場合、片系ネットワークにて回復不能な障害が発生しても、他系ネットワークだけでデータ伝送を継続することができるという利点がある。
The first method is the method described in
しかし、特許文献1で開示された技術では、同一データを2つのネットワークに送信するため、ネットワークのトラフィックが2倍に増大するという問題がある。
However, the technique disclosed in
別の方法として、片系ネットワークを運用系、他系ネットワークを待機系とし、運用系ネットワークにて回復不能な障害が発生した場合、待機系ネットワークを運用系に切り替えてデータ伝送を継続する方法もある。この方法の場合、運用系ネットワークにて回復不能障害が発生したタイミングから経路切り替えが行われるまでの間に、データ発行元装置から現運用系ネットワークに送信されたデータは消失してしまう。 Another method is to use one network as the active system and the other network as the standby system, and if an unrecoverable failure occurs in the active network, switch the standby network to the active system and continue data transmission. is there. In the case of this method, the data transmitted from the data issuing source device to the current active network is lost between the timing when the unrecoverable failure occurs in the active network and the time when the path is switched.
そこで、このデータ伝送の制御を司っているドライバ等のソフトウェアが、正常にデータ伝送できたことが確認できている処理ポイントまでロールバックし、そこからデータ伝送をやり直すことが行われている。インターネット等のコンピュータ間データ伝送で使用されているTCP/IPはこの方法を採用している。しかし、コンピュータ内部でのデータ伝送方法にこの方法を用いた場合、ソフトウェアによるデータ伝送再試行(リトライ)が行えないものがあるため、エラーリカバリが行えずシステムダウンしてしまうという問題がある。 Therefore, software such as a driver that controls the data transmission is rolled back to a processing point where it has been confirmed that data transmission has been normally performed, and data transmission is performed again from there. TCP / IP used for data transmission between computers such as the Internet adopts this method. However, when this method is used as a data transmission method inside a computer, there is a problem that data transmission cannot be retried by software, so that error recovery cannot be performed and the system goes down.
例えば、コンピュータ内部におけるデータのコヒーレンシーを制御するためのデータ伝送等においてこの問題が生ずる。複数のCPU(Central Processor Unit)チップを備えるコンピュータシステムにおいて、各CPU内にキャッシュを持っているケースを考える。このケースでは、あるキャッシュ内のデータが更新された場合、データのコヒーレンシー(データの一貫性)を保つために、更新されたデータのコピーを持っている別のキャッシュ内データも更新する必要があり、このときキャッシュ間でデータ伝送を行う。 For example, this problem occurs in data transmission for controlling data coherency in a computer. Consider a case in which a computer system having a plurality of CPU (Central Processor Unit) chips has a cache in each CPU. In this case, if data in one cache is updated, another cached data that has a copy of the updated data must also be updated to maintain data coherency. At this time, data is transmitted between the caches.
この様なデータ伝送は、オペレーティングシステム等のソフトウェアが関与しないデータ伝送であるため、当然、ソフトウェアによるデータ伝送再試行は行えないという問題がある。 Since such data transmission is data transmission that does not involve software such as an operating system, there is a problem that data transmission cannot be retried by software.
本発明の目的は、上述した従来の課題である、インタコネクトネットワークのトラフィックを増大させることなく、インタコネクトネットワークにおける回復不能な障害の発生時のシステムダウンを解決する情報処理システムおよびエラー予防処理方法を提供することにある。 SUMMARY OF THE INVENTION An object of the present invention is an information processing system and an error prevention processing method for solving a system down at the time of occurrence of an unrecoverable failure in an interconnect network without increasing the traffic of the interconnect network, which is the conventional problem described above. Is to provide.
本発明の情報処理システムのエラー予防処理方法は、複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムのエラー予防処理方法であり、 障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知するステップと、そのデータの発行元の情報処理装置に障害予兆通知を送信するステップと、障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行うステップとを含むことを特徴とする。 An error prevention processing method for an information processing system according to the present invention is an error prevention processing method for an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks. A step of detecting a failure predictor phenomenon of data transmitted through a network path, a step of transmitting a failure predictor notification to an information processing apparatus that issued the data, and a current active interconnect network after receiving the failure predictor notification And switching the other route to another interconnect network route and performing subsequent data transmission.
本発明の情報処理システムのエラー予防処理方法は、障害予兆通知を受け取った発行元情報処理装置が一時、データ宛先情報処理装置へのデータ送信を中止し、データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付するステップと、前記データ宛先情報処理装置において、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせるステップとをさらに含んでもよい。 In the error prevention processing method of the information processing system according to the present invention, the issuer information processing apparatus that has received the failure sign notification temporarily stops data transmission to the data destination information processing apparatus and is currently operating toward the data destination information processing apparatus. A route change notification is simultaneously sent to each of the system interconnect network and the current standby interconnect network, and the data destination information processing apparatus first receives the route change notification from the current standby interconnect network. In this case, the method may further include a step of waiting for data reception from the current standby interconnect network until a route change notification is received from the current active interconnect network.
本発明のエラー予防処理方法は、発行元情報処理装置が現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付するステップのあと、現待機系インタコネクトネットワークを運用系インタコネクトネットワークとして用いるように切り替えてデータ送信の再開をするステップをさらに含んでもよい。 In the error prevention processing method of the present invention, the issuing information processing apparatus uses the current active interconnect network and the current standby interconnect network to simultaneously send a route change notification to each, and then the current standby interface. The method may further include a step of switching the connection network to be used as an operational interconnect network and restarting data transmission.
本発明の情報処理システムのエラー予防処理方法は、データ宛先情報処理装置が現運用系インタコネクトネットワークから経路変更通知を受信した場合、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えてそのデータ受信を再開するステップをさらに含んでもよい。 According to the error prevention processing method of the information processing system of the present invention, when the data destination information processing apparatus receives a route change notification from the current active interconnect network, the current standby interconnect network is used as the active interconnect network. It may further include a step of switching and restarting the data reception.
本発明の情報処理システムのエラー予防処理方法は、前記データ宛先情報処理装置が現待機系インタコネクトネットワークから先に経路変更通知を受信しなかった場合、現待機系インタコネクトネットワークから経路変更通知を受信した後に、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えるステップとをさらに含んでもよい。 In the error prevention processing method for an information processing system according to the present invention, when the data destination information processing apparatus does not receive a route change notification from the current standby interconnect network, a route change notification is sent from the current standby interconnect network. After receiving, the method may further include a step of switching the current standby interconnect network to use as the active interconnect network.
本発明の情報処理システムは、複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムであり、インタコネクトネットワークには、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、そのデータの発行元の情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、発行元の情報処理装置には、障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備えることを特徴とする。 The information processing system according to the present invention is an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks. The interconnect network monitors a predictive failure phenomenon, and uses an interconnect network path. A failure sign phenomenon detection unit that detects a failure sign phenomenon of transmitted data, and an interface control unit that transmits a failure sign notification to the information processing apparatus that issued the data. A path switching control unit is provided for switching the path of the current active interconnect network to a path of another interconnect network after receiving the failure sign notification and performing subsequent data transmission.
本発明の情報処理システムは、複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムであり、インタコネクトネットワークには、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、そのデータの発行元の情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、
前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後、一時的にデータ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付し、その後、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備え、
データ宛先情報処理装置には、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせる経路切り換え制御部を備えてもよい。
The information processing system according to the present invention is an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks. The interconnect network monitors a predictive failure phenomenon, and uses an interconnect network path. A failure sign phenomenon detection unit that detects a failure sign phenomenon of transmitted data, and an interface control unit that transmits a failure sign notification to the information processing apparatus that issued the data,
After receiving the failure sign notification, the issuing information processing device temporarily stops data transmission to the data destination information processing device, and sends the current active interconnect to the data destination information processing device. Send a route change notification to each of the network and the current standby interconnect network at the same time, and then switch the route of the current active interconnect network to the route of the other interconnect network to transmit subsequent data With a route switching control unit,
If the data destination information processing device first receives a route change notification from the current standby interconnect network, it receives data from the current standby interconnect network until it receives a route change notification from the current active interconnect network. A path switching control unit that waits for
本発明情報処理システムは、発行元情報処理装置における経路切り換え制御部は、現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付したあと、現待機系インタコネクトネットワークを運用系インタコネクトネットワークとして用いるように切り替えてデータ送信の再開をしてもよい。 In the information processing system of the present invention, the path switching control unit in the issuing information processing apparatus sends a path change notification to each of the current active interconnect network and the current standby interconnect network at the same time, and then Data transmission may be resumed by switching the system interconnect network to be used as the operational interconnect network.
本発明の情報処理システムは、データ宛先情報処理装置における経路切り換え制御部は、現運用系インタコネクトネットワークから経路変更通知を受信した場合、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えてそのデータ受信を再開してもよい。 In the information processing system of the present invention, when the path switching control unit in the data destination information processing apparatus receives a path change notification from the current active interconnect network, the current standby interconnect network is used as the active interconnect network. The data reception may be resumed by switching to.
本発明の情報処理システムは、データ宛先情報処理装置における経路切り換え制御部は、現待機系インタコネクトネットワークから先に経路変更通知を受信しなかった場合、現待機系インタコネクトネットワークから経路変更通知を受信した後に、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えてもよい。 In the information processing system of the present invention, when the path switching control unit in the data destination information processing apparatus does not receive a path change notification from the current standby interconnect network, it sends a path change notification from the current standby interconnect network. After reception, the current standby interconnect network may be switched to be used as the active interconnect network.
本発明の情報処理装置は、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する複数のインタコネクトネットワークを介して情報処理装置が接続された情報処理システムを構成する情報処理装置であり、
障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備えることを特徴とする。
An information processing apparatus according to the present invention is an information processing system in which information processing apparatuses are connected via a plurality of interconnect networks for monitoring a failure predictor phenomenon and detecting a failure predictor phenomenon of data transmitted through an interconnect network path Is an information processing apparatus that constitutes
A path switching control unit is provided for switching the path of the current active interconnect network to a path of another interconnect network after receiving the failure sign notification and performing subsequent data transmission.
本発明の情報処理装置は、前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後、一時的にデータ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付し、その後、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備え、データ宛先の情報処理装置には、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせる経路切り換え制御部を備えてもよい。 The information processing apparatus of the present invention temporarily stops data transmission to the data destination information processing apparatus after receiving the failure sign notification to the information processing apparatus of the issuing source, and the data destination information processing apparatus Send a route change notification to each of the current active interconnect network and the current standby interconnect network at the same time, and then change the route of the current active interconnect network to the route of the other interconnect network. A path switching control unit is provided to perform subsequent data transmission after switching, and when the data destination information processing apparatus first receives a path change notification from the current standby interconnect network, it changes the path from the current active interconnect network. Wait for data reception from the current standby interconnect network until a notification is received It may include a path switching control unit for.
本発明のインタコネクトネットワークは、複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムを構成するインタコネクトネットワークであり、インタコネクトネットワークは、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、そのデータの発行元の情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、発行元の情報処理装置は、障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行うことを特徴とする。 The interconnect network of the present invention is an interconnect network that constitutes an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks. Issuer information is provided with a failure sign phenomenon detection unit that detects a failure sign phenomenon of data transmitted through the path of the connect network, and an interface control unit that sends a failure sign notification to the information processing apparatus that issued the data. The processing apparatus is characterized in that after receiving the failure sign notification, the route of the current active interconnect network is switched to the route of another interconnect network and subsequent data transmission is performed.
本発明のインタコネクトネットワークは、複数の情報処理装置が複数のインタコネクトネットワークを介して接続された情報処理システムを構成するインタコネクトネットワークであり、インタコネクトネットワークは、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、そのデータの発行元の情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後、一時的にデータ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付し、その後、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備え、データ宛先情報処理装置は、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせる経路切り換え制御部を備えることを特徴とする。 The interconnect network of the present invention is an interconnect network that constitutes an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks. A failure predictor detection unit that detects a failure predictor phenomenon of data transmitted through the path of the connect network, and an interface control unit that transmits a failure predictor notification to the information processing apparatus that issued the data; After receiving the failure sign notification, the information processing apparatus temporarily stops data transmission to the data destination information processing apparatus, and the current active interconnect network and the current standby are directed to the data destination information processing apparatus. Route change notifications simultaneously to each other After that, the data destination information processing apparatus includes a path switching control unit that switches the path of the current active interconnect network to the path of another interconnect network and transmits subsequent data. When a route change notification is received from the connect network, a route switching control unit is provided that waits for data reception from the current standby interconnect network until a route change notification is received from the current active interconnect network.
本発明はインタコネクトネットワークのトラフィックを増大させることなく、インタコネクトネットワークにおける障害発生時のシステムダウン率を低減させることができるという効果を有する。その理由は 障害予兆現象を検知すると、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行うからである。 The present invention has an effect of reducing the system down rate when a failure occurs in the interconnect network without increasing the traffic of the interconnect network. The reason is that when a failure predictor phenomenon is detected, the route of the current active interconnect network is switched to the route of another interconnect network, and subsequent data transmission is performed.
次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。 Next, the best mode for carrying out the present invention will be described in detail with reference to the drawings.
本発明による二重化インタコネクトネットワークコンピュータの実施形態を説明する前に、本発明の前提となる技術である、ネットワークにおける一般的なデータ伝送について図9を用いて説明する。処理装置間は、パケットと呼ばれる単位でデータ伝送される。パケットには、該パケットの宛先処理装置を識別するDstIDフィールド(Destination ID Field)、該パケットの発行元処理装置を識別するSrcIDフィールド(Source ID Field)、動作種別(リード動作、ライト動作等)を表すCmdフィールド(Command Field)、パケットの長さを表すLenフィールド(Length field)及び受け渡しするデータを格納するDataフィールド(Data Field)等から構成される。 Before describing an embodiment of a duplex interconnect network computer according to the present invention, general data transmission in a network, which is a premise of the present invention, will be described with reference to FIG. Data is transmitted between the processing devices in units called packets. The packet includes a DstID field (Destination ID Field) for identifying the destination processing device of the packet, a SrcID field (Source ID Field) for identifying the source processing device of the packet, and an operation type (read operation, write operation, etc.). A Cmd field (Command Field) that represents the packet, a Len field (Length field) that represents the length of the packet, a Data field (Data Field) that stores data to be transferred, and the like.
パケット発行元処理装置では、これら各フィールドを適切な値に設定してパケットを発行する。発行されたパケットは、データ伝送路においてDstIDフィールドが参照され、パケット宛先処理装置までルーティングされる。 The packet issuer processing device issues a packet with these fields set to appropriate values. The issued packet is routed to the packet destination processing device with reference to the DstID field in the data transmission path.
例えば、図1における処理装置100から処理装置105へパケットを発行する場合、処理装置100では、DstIDフィールドを処理装置105とし、SrcIDフィールドを自身である処理装置100としてパケットを発行する。すると、インタコネクトネットワーク102或いは103では、DstIDフィールドを参照してパケット宛先処理装置105まで該パケットをルーティングする。
For example, when a packet is issued from the
次に、本発明にかかる二重化インタコネクトネットワークコンピュータの一実施形態の構成について説明する。図1を参照すると、本発明の実施形態としての二重化インタコネクトネットワークコンピュータが示されている。 Next, the configuration of an embodiment of the duplex interconnect network computer according to the present invention will be described. Referring to FIG. 1, there is shown a duplex interconnect network computer as an embodiment of the present invention.
処理装置100,101,104,105は、情報処理装置であり、より具体的には中央処理装置或いは入出力処理装置であり、パケット発行元或いはパケット宛先処理装置となる。本発明では、中央処理装置と入出力処理装置とを区別する必要が無いため、両者を単に処理装置と称す。これら全ての処理装置内には、2つのインタフェース制御部110,111或いは112、113と、1つの経路切り替え制御部120或いは121を有している。
The
インタフェース制御部110、111或いは112、113は、インタコネクトネットワーク102,103とのインタフェース制御を司る。経路切り替え制御部120或いは121は、2つのインタフェース制御部110、111或いは112、113へのパケット送信制御とインタフェース制御部110、111或いは112、113からのパケット受信制御を司る。尚、本発明に関わる処理装置100,101,104,105内の構成及び動作は全て同じであるため、以降、処理装置内について説明する場合は、処理装置100のみ用いることとする。
The
2つのインタコネクトネットワーク102,103は、互いに独立したネットワークであり、処理装置100,101,104,105と相互接続される。
The two
2つのインタコネクトネットワークのうち1つを運用系と他の1つを待機系に割り当て、障害予兆現象が生じない通常時には運用系インタコネクトネットワークのみを使用してデータ送受信を行う。運用系インタコネクトネットワーク内にて障害予兆現象を監視し、予兆現象を検知したならば、ソフトウェアでの処理を必要とせずハードウェアのみで、自律的且つ即座に待機系インタコネクトネットワークへ経路変更できることを可能にするものである。 One of the two interconnect networks is assigned to the active system and the other one to the standby system, and data transmission / reception is performed using only the active interconnect network at normal times when no failure sign phenomenon occurs. If a failure predictor phenomenon is monitored in the active interconnect network and the predictor phenomenon is detected, it is possible to change the route to the standby interconnect network autonomously and immediately by hardware alone without the need for software processing. Is possible.
尚、2つのインタコネクトネットワークのうち1つを運用系と他の1つを待機系に割り当てて構成するコンピュータを二重化インタコネクトネットワークコンピュータと称する。 A computer configured by assigning one of the two interconnect networks to the active system and the other to the standby system is referred to as a duplex interconnect network computer.
尚、インタコネクトネットワーク102,103は構成及び動作が同じであるため、以降、インタコネクトネットワーク内について説明する場合は、インタコネクトネットワーク102のみ用いることとする。
Since the
図2を参照すると、本発明の一実施形態としてのインタコネクトネットワーク102が示されている。インタコネクトネットワーク102は1つのスイッチ装置200から構成され、4つの外部インタフェース150,152,160,162を有する。これら4つの外部インタフェースは、処理装置100,101,104,105と接続される。
Referring to FIG. 2, an
インタコネクトネットワーク102に接続させる処理装置数が多くなれば、図6、図7、図8に記載されている様に、上記スイッチ装置200を複数接続させてインタコネクトネットワーク102を構成する。尚、図6、図7、図8に記載したインタコネクトネットワーク構成も一実施例であり、これ以外の構成を採った場合でも、本発明は適用できる。
If the number of processing devices connected to the
図3を参照すると、本発明の一実施例としてのスイッチ装置200が示されている。インタフェース制御部310,311,312,313は、スイッチ装置外とのインタフェース制御を司り、図1記載の処理装置100内に在るインタフェース制御部110,111と同一構成及び同一動作するものである。よって、以降、インタフェース制御部内について説明する場合は、インタフェース制御部310を用いることとする。
Referring to FIG. 3, a
完全クロスバー300は、4つのインタフェース制御部310、311,312,313を完全クロスバー(完全網)で接続しているものである。即ち、単なる接続線の集合体である。完全クロスバーとは任意のひとつの端子が他の任意の端子と1対1で接続できるものをいう。
The
図4を参照すると、本発明の重要な構成要素であるインタフェース制御部310の一実施形態が示されている。障害制御部400は、インタフェース制御部310自身の障害予兆、及びインタフェース150、350の障害予兆を監視する機能を有する。
Referring to FIG. 4, an embodiment of an
障害予兆とは訂正可能なエラーのみが出ている状態をいい、まだ回復不能な障害までには至っていないが、回復不能な障害に至る前段階の状態をいう。障害予兆検知の方法については、一例を挙げると、ECC(Error Correction Code)によりエラー検出およびエラー訂正を行った場合に検知したと判断することが考えられるが、これに限られるわけではない。エラー訂正の具体的な構成動作は当業者の周知技術であるのでその詳細な説明は省略する。 A failure sign is a state in which only a correctable error has occurred, and is a state in the previous stage of reaching an unrecoverable failure that has not yet reached an unrecoverable failure. As an example of the failure sign detection method, it may be determined that error detection and error correction are performed using ECC (Error Correction Code). However, the method is not limited to this. Since the specific operation of error correction is a well-known technique for those skilled in the art, detailed description thereof is omitted.
障害予兆監視機能は、インタフェース350からインタフェース150方向の経路において障害予兆現象を検知した場合、検知以降インタフェース350から受信したパケットをインタフェース150に送信すると共に、該パケット情報から障害予兆通知を生成し、選択回路B411を経由させインタフェース350に送信する。同様に、インタフェース150からインタフェース350方向の経路において障害予兆現象を検知した場合、検知以降インタフェース150から受信したパケットをインタフェース350に送信すると共に、該パケット情報から障害予兆通知を生成し、選択回路A410を経由させインタフェース150に送信する。
When the failure sign monitoring function detects a failure sign phenomenon in the path from the
尚、予兆現象を検知した段階では、該予兆現象発生箇所はまだ動作継続可能である。 It should be noted that at the stage where the sign phenomenon is detected, the operation where the sign phenomenon occurs can still be continued.
また、障害予兆現象検知以降、インタフェース350から経路変更通知を受信した場合、インタフェース150に送信すると共に、該経路変更通知から経路変更通知リプライを生成し、選択回路B411を経由させインタフェース350に送信する。同様に、インタフェース150から経路変更通知を受信した場合、インタフェース350に送信すると共に、該経路変更通知から経路変更通知リプライを生成し、選択回路A410を経由させインタフェース150に送信する。
In addition, when a path change notification is received from the
障害予兆監視機能におけるデータ伝送パケットから障害予兆通知を生成する方法を、図10に示す。データ伝送パケット内のDstIDフィールド値を障害予兆通知内のSrcIDフィールドに埋め込み、データ伝送パケット内のSrcIDフィールド値を障害予兆通知内のDstIDフィールドに埋め込み、障害予兆通知内のCmdフィールドに障害予兆通知であることを示す値を埋め込み、障害予兆通知内のLenフィールドは適切な値を埋め込む。 FIG. 10 shows a method of generating a failure sign notification from a data transmission packet in the failure sign monitoring function. The DstID field value in the data transmission packet is embedded in the SrcID field in the failure sign notification, the SrcID field value in the data transmission packet is embedded in the DstID field in the failure sign notification, and the Cmd field in the failure sign notification is A value indicating that it is present is embedded, and an appropriate value is embedded in the Len field in the failure predictor notification.
これにより、障害予兆通知を、データ伝送パケットを発行した処理装置に送ることができる。尚、経路変更通知から経路変更通知リプライを生成する場合も、上記同様の方法で生成する。 As a result, the failure sign notification can be sent to the processing apparatus that has issued the data transmission packet. Note that when a route change notification reply is generated from the route change notification, it is generated by the same method as described above.
図5を参照すると、本発明の重要な構成要素である経路切り替え制御部120の一実施例が示されている。
Referring to FIG. 5, there is shown an embodiment of a path switching
送信制御部500は、処理装置100内部からのパケットを、処理装置100の外部インタフェースである180或いは181へのパケット発行を制御する。パケットの発行は、宛先処理装置毎にいづれか一方のインタフェースに送信する。例えば、図1における処理装置100から処理装置104にパケットを発行する場合はインタフェース180に送信し、処理装置105にパケットを発行する場合はインタフェース181に送出(送信)するという様に制御する。パケットを発行するインタフェースが、該宛先処理装置に対する運用系インタフェースとなる。
The
このパケット送信切り替えは、障害予兆フラグ、送信経路識別フラグと呼ばれる2つのフラグで制御する。これら2つのフラグは、パケット宛先処理装置毎に在る。送信経路識別フラグは、パケット宛先処理装置に対する運用系のインタコネクトネットワークを示す。 This packet transmission switching is controlled by two flags called a failure sign flag and a transmission path identification flag. These two flags exist for each packet destination processing device. The transmission path identification flag indicates an active interconnect network for the packet destination processing apparatus.
障害予兆フラグは、同一宛先処理装置からの2つ目以降の障害予兆通知を破棄するために使用されるフラグであり、本フラグが値0であるときに対応する宛先処理装置を示した障害予兆通知を受信した場合、該障害予兆通知を有効と判断すると共に本フラグを値1にセットする。本フラグが値1であるときに対応する宛先処理装置を示した障害予兆通知を受信した場合、該障害予兆通知を無効と判断し破棄する。同一経路で2つ目以降の障害予兆通知を受信しても、パケット発行元装置は、何のアクションも起こさないようにするためである。 The failure sign flag is a flag used for discarding the second and subsequent failure sign notifications from the same destination processing device, and indicates a corresponding failure processing device when this flag is 0. When the notification is received, it is determined that the failure sign notification is valid, and this flag is set to a value of 1. When the failure predictor notification indicating the corresponding destination processing apparatus when the flag is 1 is received, the failure predictor notification is determined to be invalid and discarded. This is to prevent the packet issuing source device from taking any action even if the second and subsequent failure predictor notifications are received on the same route.
また、経路変更通知に対するリプライである経路変更通知リプライを受信した場合、宛先処理装置に対応した本フラグを値0にリセットする。 When a route change notification reply, which is a reply to the route change notification, is received, this flag corresponding to the destination processing apparatus is reset to 0.
受信制御部501は、処理装置100の外部インタフェースである180或いは181からのパケット受信を制御する。受信制御では、2つのインタフェース180、181に対し、発行元処理装置毎に運用系インタフェースを切り替えることができる。例えば、図1における処理装置100において、発行元処理装置が処理装置104である場合は、インタフェース180を運用系とし、発行元処理装置が処理装置105である場合は、インタフェース181を運用系とすることができる。
The
どちらのインタフェースを運用系とするかは、対応する発行元処理装置内送信制御部500と整合が取れていなければならない。このパケット受信経路切り替えは、パケット発行元処理装置におけるパケット発行順序と、パケット受信側処理装置におけるパケット受信順序とを保証(一致)しつつ受信経路を切り替える必要がある。そのため、経路変更フラグ、受信経路識別フラグと呼ばれる2つのフラグを持ち、下記の通り動作する。
Which interface is to be used as an operational system must be consistent with the corresponding in-issuer processor
1.経路変更フラグが値0であり、且つ受信経路識別フラグが経路変更通知を受信したインタフェースを示している場合、経路変更フラグを値1にセットする。 1. If the route change flag has a value of 0 and the received route identification flag indicates an interface that has received the route change notification, the route change flag is set to a value of 1.
2.経路変更フラグが値0であり、且つ受信経路識別フラグが経路変更通知を受信したインタフェースを示していない場合、経路変更フラグを値1にセットすると共に、経路変更通知を受信したインタフェースにおいて、経路変更通知内SrcIDフィールドで示される処理装置発行のパケット受信を一時停止する。 2. When the route change flag has a value of 0 and the received route identification flag does not indicate the interface that has received the route change notification, the route change flag is set to a value of 1, and the route change is performed at the interface that has received the route change notification. The reception of the packet issued by the processing device indicated by the SrcID field in the notification is temporarily stopped.
3.経路変更フラグが値1であり、且つ受信経路識別フラグが経路変更通知を受信したインタフェースを示している場合、経路変更フラグを値0にリセットすると共に、受信経路識別フラグを別インタフェースを示す様に更新する。さらに、別インタフェースで一時停止させている対応処理装置発行のパケット受信を再開する。 3. When the route change flag has a value of 1 and the received route identification flag indicates an interface that has received the route change notification, the route change flag is reset to a value of 0 and the received route identification flag indicates another interface. Update. Furthermore, the reception of the packet issued by the corresponding processing apparatus that is temporarily stopped by another interface is resumed.
4.経路変更フラグが値1であり、且つ受信経路識別フラグが経路変更通知を受信したインタフェースを示していない場合、経路変更フラグを値0にリセットすると共に、受信経路識別フラグを別インタフェースを示す様に更新する。 4). When the route change flag has a value of 1 and the received route identification flag does not indicate the interface that has received the route change notification, the route change flag is reset to a value of 0, and the reception route identification flag indicates another interface. Update.
次に、本発明の一実施形態における動作について、図1、図4、図5、図11及び図12を用いて説明する。 Next, the operation in one embodiment of the present invention will be described with reference to FIG. 1, FIG. 4, FIG. 5, FIG.
まず、本発明にかかる動作を説明するに当たり、それ以前の動作状態(初期状態)について述べる。図1における二重化インタコネクトネットワークコンピュータでは、処理装置100から処理装置105に発行するパケットは、インタコネクトネットワーク102を運用系とし、処理装置101から処理装置105に発行するパケットは、インタコネクトネットワーク103を運用系として稼動していると仮定する。
First, in describing the operation according to the present invention, the operation state (initial state) before that will be described. In the redundant interconnect network computer shown in FIG. 1, packets issued from the
よって、処理装置100内の経路切り替え制御部120内の送信制御部500に在る処理装置105に対応した送信経路識別フラグは、インタコネクトネットワーク102を運用系であると示している。また、処理装置105内の経路切り替え制御部121内の受信制御部501に在る処理装置100に対応した受信経路識別フラグも、インタコネクトネットワーク102を運用系であると示している。また、この状態で、インタコネクトネットワーク102内において、処理装置100から処理装置105へのパケットが経由する箇所で、障害予兆現象を検知したものと仮定する。
Therefore, the transmission route identification flag corresponding to the
次に、上記動作状態における本発明の動作について、図11と図12をもとに下記4つの動作に分けて説明する。
1.障害予兆現象を検知したインタコネクトネットワーク102内の動作
2.障害予兆通知を受信した処理装置100内の動作
3.経路変更通知を受信したインタコネクトネットワーク102内の障害予兆現象検知箇所の動作
4.経路変更通知リプライを受信した処理装置100内の動作
5.経路変更通知を受信した処理装置105内の動作
第一に、障害予兆現象を検知したインタコネクトネットワーク102内の動作について、図4と図11を用いて説明する。インタコネクトネットワーク102内において、処理装置100から処理装置105へのパケットが経由する図4記載のインタフェース制御部310は、障害制御部400内の障害予兆監視機能により、インタフェース150からインタフェース350方向の障害予兆現象を検知する(ステップ1111)。
Next, the operation of the present invention in the above operation state will be described by dividing it into the following four operations based on FIG. 11 and FIG.
1. 1. Operation in the
検知以降インタフェース150から受信したパケットをインタフェース350に送信する(ステップ1112)。そしてインタフェース162を経由して処理装置5に送られ、処理装置105がパケットを受信する(ステップ1121)。
A packet received from the
これらと共に、インタフェース制御部310は該パケット情報から障害予兆通知を生成し、選択回路A410を経由させインタフェース150に送信する(ステップ1113)。インタフェース150に送信された障害予兆通知は、インタコネクトネットワーク102内をルーティングされ、処理装置100に伝送される。
Together with these, the
第二に、障害予兆通知を受信した処理装置100内の動作について、図1と図5と図11を用いて説明する。図1記載のインタフェース150から送られてくる障害予兆通知は、処理装置100内のインタフェース制御部110を経由して経路切り替え制御部120に送られる。図5記載の経路切り替え制御部120では、インタフェース180から障害予兆通知を受信すると、受信制御部501を経由して送信制御部500に送られる。
Secondly, the operation in the
送信制御部500では、受信経路部501から受信したパケット内のCmdフィールドを参照し、受信パケットが障害予兆通知であることを知る(ステップ1101)。また、SrcIDフィールドを参照し、処理装置105行きの経路にて障害予兆現象が検知されたことを知り、下記動作を行う。
The
1.処理装置105に対応した障害予兆フラグを値1にセットする。これにより、SrcIDフィールドが処理装置105を示している後続の障害予兆通知を破棄する(ステップ1102)。
1. A failure predictor flag corresponding to the
2.処理装置105宛のパケット発行を一時停止し、インタフェース180と181の両方に経路変更通知を発行する(ステップ1103)。この経路変更通知は、DstIDフィールドを処理装置105、SrcIDフィールドを処理装置100とする。
2. Issuing packets addressed to the
3.経路変更通知を発行後、処理装置105に対応した送信経路識別フラグを、インタコネクトネットワーク103が運用系となる様に書き換え、一時停止していた処理装置105宛のパケット発行を再開する(ステップ1104)。
3. After issuing the route change notification, the transmission route identification flag corresponding to the
第三に、経路変更通知を受信したインタコネクトネットワーク102内の障害予兆現象検知箇所の動作について、図4、図11を用いて説明する。まず障害予兆現象を検知したインタフェース制御部310では、インタフェース150から経路変更通知を受信すると、該経路変更通知をインタフェース350に送信する(ステップ1114)。
Third, the operation of the failure sign phenomenon detection location in the
これと共に、該経路変更通知から経路変更通知リプライを生成し、選択回路A410を経由させインタフェース150に送信する(ステップ1115)。インタフェース150に送信された経路変更通知リプライは、インタコネクトネットワーク102内をルーティングされ、処理装置100に伝送される。
At the same time, a route change notification reply is generated from the route change notification and transmitted to the
第四に、経路変更通知リプライを受信した処理装置100内の動作について、図1と図5と図11を用いて説明する。まず図1において、インタフェース150から送られてくる経路変更通知リプライは、処理装置100内のインタフェース制御部110を経由して経路切り替え制御部120に送られる。
Fourth, the operation in the
図5記載の経路切り替え制御部120では、インタフェース180から経路変更通知リプライを受信すると、受信制御部501を経由して送信制御部500に送られる。送信制御部500では、受信経路部501から受信したパケット内のCmdフィールドを参照し、受信パケットが経路変更通知リプライであることを知る(ステップ1105)。
In the path switching
また、SrcIDフィールドを参照し、処理装置105行きの経路変更通知リプライであることを知り、処理装置105に対応した障害予兆フラグを値0にリセットし、以降処理装置105に対する障害予兆通知を有効として扱える様にする(ステップ1106)。尚、経路変更通知リプライを受信した後は、障害予兆現象が検知されたインタコネクトネットワーク102から処理装置105に対する障害予兆通知を受信することはない。
Also, referring to the SrcID field, knowing that the reply is a route change notification reply to the
第五に、経路変更通知を受信した処理装置105内の動作について、図1、図5、図11、図12を用いて説明する。まず図1において、処理装置105は、処理装置100発行のパケットをインタフェース162から受信している状態になっている。
Fifth, the operation in the
その状態で、インタフェース162と163から処理装置100が発行した経路変更通知を受信することになる。インタフェース162或いは163から受信した経路変更通知は、インタフェース制御部112或いは113を経由して経路切り替え制御部121に送られる。
In this state, the route change notification issued by the
次に、経路切り替え制御部121の動作について、図5、図11、図12を用いて説明する。尚、図5では、経路切り替え制御部120と記載されているが、ここでは経路切り替え制御部121と読み替えるものとする。経路切り替え制御部121では、インタフェース180と181から処理装置100が発行した経路変更通知を受信制御部501で受信することになる(ステップ1122)。
Next, the operation of the path switching
処理装置100の経路切り換え制御部120のインタフェース180を経由した経路変更通知はインタコネクトネットワーク102、インタフェース162、インタフェース制御部112、経路切り換え制御部120のインタフェース180を経ることにより処理装置105へ送られる。同様に処理装置100の経路切り換え制御部120のインタフェース181を経由した経路変更通知はインタコネクトネットワーク103、インタフェース163、インタフェース制御部113、経路切り換え制御部121のインタフェース181を経ることにより処理装置105へ送られることになる。
The route change notification via the
受信制御部501では、インタフェース180或いは181から受信したパケット内のCmdフィールドを参照し、受信パケットが経路変更通知であることを知る。また、SrcIDフィールドを参照し、処理装置100との間の経路変更通知であることを知る(ステップ1122)。
The
その後、インタフェース180と181からの経路変更通知をどちらが先に受信したかを判断し、その先後(タイミング)により、下記2つのうちのいづれかの動作を行う(ステップ1202)。
Thereafter, it is determined which of the path change notifications from the
まず、インタフェース180から先に経路変更通知を受信制御部501が受信した場合(ステップ1202YES)の動作を説明する。インタフェース180から経路変更通知を受信する前、経路変更フラグは値0であり、受信経路識別フラグはインタフェース180を示している。即ち、インタフェース180が運用系となっている。
First, the operation when the
この状態で受信制御部501がインタフェース180から先に経路変更通知を受信すると、経路変更フラグが値0であり且つ受信経路識別フラグが自インタフェースである180を示しているため、経路変更フラグを値1にセットする(ステップ1203)。
In this state, when the
その後、インタフェース181から経路変更通知を受信する(ステップ1204)と、経路変更フラグが値1であり且つ受信経路識別フラグが別インタフェースである180を示している。このため、経路変更フラグを値0にリセットすると共に、受信経路識別フラグをインタフェース181を示す様に更新する。即ちインタフェース181を運用系とする(ステップ1205)。
Thereafter, when a route change notification is received from the interface 181 (step 1204), the route change flag has a value of 1 and the received route identification flag indicates 180 which is another interface. Therefore, the route change flag is reset to 0, and the reception route identification flag is updated to indicate the
これにより、受信経路変更通知の後に処理装置100から発行された処理装置105宛のパケットを、インタフェース181から受信することができる(ステップ1206)。
Thereby, the packet addressed to the
次に、インタフェース181から先に経路変更通知を受信した場合(ステップ1202NO)の動作を説明する。インタフェース181から経路変更通知を受信する前、経路変更フラグは値0であり、受信経路識別フラグはインタフェース180を示している。即ち、インタフェース180が運用系となっている。
Next, the operation when the route change notification is received first from the interface 181 (NO in step 1202) will be described. Before receiving a route change notification from the
この状態でインタフェース181から先に経路変更通知を受信すると、経路変更フラグが値0であり且つ受信経路識別フラグが別インタフェースである180を示している。このため、経路変更フラグを値1にセットする(ステップ1207)と共に、インタフェース181において、処理装置100発行のパケット受信を一時停止させる(ステップ1208)。
When a route change notification is received first from the
ここで、パケット受信の一時停止に当たっては、そのパケットを一時保持しておく必要があり、具体的には、例えば、インタフェース制御部113内にある図示しないバッファ内にパケットを一時保持しておくことができる。
Here, when the packet reception is suspended, it is necessary to temporarily hold the packet. Specifically, for example, the packet is temporarily held in a buffer (not shown) in the
その後、インタフェース180から経路変更通知を受信するまでの間に、インタフェース180を経由して受信制御部501に到達するパケットがあればそのパケットの受信を行う。インタフェース180から経路変更通知を受信した後、バッファ内に一時保持しておいたパケットを順次受信する。すなわち、インタフェース180がインタフェース181よりも遅れが生じた場合、遅れた経路変更通知が到着するまで進んでいるパケットの一時待ち合わせを行うことにより、両インタフェースの同期をとり時間軸の修正を行っている。
Thereafter, if there is a packet that reaches the
またパケット受信経路を切り替えることにより、パケット発行元処理装置におけるパケット発行順序と、パケット受信側処理装置におけるパケット受信順序との一致を保証しつつ受信経路を切り替えることができる。 Further, by switching the packet reception path, it is possible to switch the reception path while guaranteeing a match between the packet issue order in the packet issuing source processing apparatus and the packet reception order in the packet receiving side processing apparatus.
これにより、インタフェース181から経路変更通知を受信した後、インタフェース180から経路変更通知を受けるまでに受信すべきパケットが受信できず捨てられることを防止できる。
As a result, it is possible to prevent a packet to be received from being received before the path change notification is received from the
その後、インタフェース180から経路変更通知を受信する(ステップ1209)と、経路変更フラグが値1であり且つ受信経路識別フラグが自インタフェースである180を示している。このため、経路変更フラグを値0にリセットすると共に、受信経路識別フラグをインタフェース181を示す様に更新する。即ちインタフェース181を運用系とする(ステップ1210)。
Thereafter, when a route change notification is received from the interface 180 (step 1209), the route change flag has a value of 1 and the received route identification flag indicates 180 that is the own interface. Therefore, the route change flag is reset to 0, and the reception route identification flag is updated to indicate the
さらに、インタフェース181において、一時停止させている処理装置100発行のパケット受信を再開させる(ステップ1211)。これにより、処理装置100からインタコネクトネットワーク102に発行された処理装置105宛のパケットを先に処理し、その後、処理装置100からインタコネクトネットワーク103に発行された処理装置105宛のパケットを処理することができる。
Further, the
従って受信経路変更通知発行タイミング前に処理装置100から処理装置102に発行された処理装置105宛のパケットAが到着しないうちに、処理装置100からインタコネクトネットワーク103に発行された処理装置105宛のパケットBが到着することになる結果、処理装置100からインタコネクトネットワーク103に発行された処理装置102に発行された処理装置105宛のパケットが到着できずに捨てられるという事態を防ぐことができる。すなわちデータ消失を防ぐことができるという効果がある。
Therefore, before the packet A addressed to the
次にインタフェース180とインタフェース180とから同時に経路変更通知を受信制御部501が受信した場合の動作を説明する。
Next, an operation when the
インタフェース180或いは181から経路変更通知を受信する前、経路変更フラグは値0であり、受信経路識別フラグはインタフェース180を示している。即ち、インタフェース180が運用系となっている。
Before receiving a route change notification from the
この状態でインタフェース180から経路変更通知を受信すると、経路変更フラグが値0であり且つ受信経路識別フラグが自インタフェースである180を示しているため、経路変更フラグを値1にセットする。
When a route change notification is received from the
また同時に(同タイミングにて)インターフェース181からも経路変更通知を受信するので、経路変更フラグが値1であり且つ受信経路識別フラグが別インタフェースである180を示している。このため経路変更フラグを値0にリセットすると共に、受信経路識別フラグをインタフェース181を示す様に更新する。
At the same time (at the same timing), since the route change notification is also received from the
即ちインタフェース181を運用系とする。これにより、受信経路変更通知の後に処理装置100から発行された処理装置105宛のパケットを、インタフェース181から受信することができる。
In other words, the
以上説明した動作により、インタコネクトネットワークにおいて障害予兆現象を検知した場合、ソフトウェアでの処理を必要とせず、ハードウェアのみで自律的且つ即座に経路変更を行うことができる。このため、この動作はエラー予防処理として位置づけることができインタコネクトネットワーク障害に起因するシステムダウンを低減させることができる。 According to the operation described above, when a failure sign phenomenon is detected in the interconnect network, it is possible to change the route autonomously and immediately using only hardware without requiring software processing. For this reason, this operation can be positioned as error prevention processing, and system down due to an interconnect network failure can be reduced.
情報処理機器において利用できる。 It can be used in information processing equipment.
100 処理装置
105 処理装置
102 インタコネクトネットワーク
103 インタコネクトネットワーク
110 インタフェース制御部
111 インタフェース制御部
112 インタフェース制御部
113 インタフェース制御部
120 経路切り換え制御部
121 経路切り換え制御部
200 スイッチ装置
300 完全クロスバー
310 インタフェース制御部
311 インタフェース制御部
400 障害制御部
410 選択回路A
411 選択回路B
500 送信制御部
501 受信制御部
DESCRIPTION OF
411 Selection circuit B
500
Claims (14)
障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知するステップと、
そのデータの発行元の前記情報処理装置に障害予兆通知を送信するステップと、
前記障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行うステップとを含むことを特徴とする情報処理システムのエラー予防処理方法。 An error prevention processing method for an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks,
Monitoring a failure predictor and detecting a failure predictor of data transmitted through the interconnect network path;
Transmitting a failure sign notification to the information processing apparatus that issued the data;
An error prevention processing method for an information processing system, comprising: a step of switching a route of a current active interconnect network to a route of another interconnect network after receiving the failure sign notification and performing subsequent data transmission .
前記障害予兆通知を受け取った発行元情報処理装置が一時、データ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付するステップと、
前記データ宛先情報処理装置において、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせるステップとをさらに含むことを特徴とする情報処理システムのエラー予防処理方法。 An error prevention processing method according to claim 1,
The issuer information processing apparatus that has received the failure sign notification temporarily stops data transmission to the data destination information processing apparatus, and the current active interconnect network and the current standby interconnect network are directed to the data destination information processing apparatus. Sending a route change notification to each simultaneously using and
In the data destination information processing apparatus, when a route change notification is received from the current standby interconnect network first, data is received from the current standby interconnect network until a route change notification is received from the current active interconnect network. An error prevention processing method for an information processing system, further comprising a step of waiting for the information processing system.
発行元情報処理装置が現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付するステップのあと、
現待機系インタコネクトネットワークを運用系インタコネクトネットワークとして用いるように切り替えてデータ送信の再開をするステップをさらに含むことを特徴とする請求項7記載の情報処理システムのエラー予防処理方法。 An error prevention processing method according to claim 2,
After the step in which the issuing information processor uses the current active interconnect network and the current standby interconnect network to send a route change notification to each simultaneously,
8. The error prevention processing method for an information processing system according to claim 7, further comprising the step of switching the current standby interconnect network to be used as the active interconnect network and restarting data transmission.
前記データ宛先情報処理装置が現運用系インタコネクトネットワークから経路変更通知を受信した場合、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えてそのデータ受信を再開するステップをさらに含むことを特徴とする情報処理システムのエラー予防処理方法。 An error prevention processing method according to claim 2 or 3,
When the data destination information processing apparatus receives a route change notification from the current active interconnect network, the data destination information processing apparatus further includes a step of switching the current standby interconnect network to be used as the active interconnect network and restarting the data reception. An error prevention processing method for an information processing system.
前記データ宛先情報処理装置が現待機系インタコネクトネットワークから先に経路変更通知を受信しなかった場合、現待機系インタコネクトネットワークから経路変更通知を受信した後に、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えるステップとをさらに含むことを特徴とする情報処理システムのエラー予防処理方法。 An error prevention processing method according to claim 2 or 3,
If the data destination information processing device does not receive a route change notification from the current standby interconnect network first, after receiving the route change notification from the current standby interconnect network, the current destination interconnect network An error prevention processing method for an information processing system, further comprising a step of switching to use as an interconnect network.
前記インタコネクトネットワークには、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、
そのデータの発行元の前記情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、
前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備えることを特徴とする情報処理システム。 An information processing system in which a plurality of information processing devices are connected via a plurality of interconnect networks,
In the interconnect network, a failure sign phenomenon detection unit that monitors a failure sign phenomenon and detects a failure sign phenomenon of data transmitted through the route of the interconnect network;
An interface control unit for transmitting a failure sign notification to the information processing apparatus that issued the data,
The information processing apparatus of the issuing source includes a path switching control unit that switches a path of the current active interconnect network to a path of another interconnect network after receiving the failure sign notification and performs subsequent data transmission An information processing system characterized by this.
前記インタコネクトネットワークには、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、
そのデータの発行元の前記情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、
前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後、一時的にデータ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付し、その後、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備え、
前記データ宛先情報処理装置には、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせる経路切り換え制御部を備えることを特徴とする情報処理システム。 An information processing system in which a plurality of information processing devices are connected via a plurality of interconnect networks,
In the interconnect network, a failure sign phenomenon detection unit that monitors a failure sign phenomenon and detects a failure sign phenomenon of data transmitted through the route of the interconnect network;
An interface control unit for transmitting a failure sign notification to the information processing apparatus that issued the data,
After receiving the failure sign notification, the issuing information processing device temporarily stops data transmission to the data destination information processing device, and sends the current active interconnect to the data destination information processing device. Send a route change notification to each of the network and the current standby interconnect network at the same time, and then switch the route of the current active interconnect network to the route of the other interconnect network to transmit subsequent data With a route switching control unit,
When the data destination information processing apparatus previously receives a route change notification from the current standby interconnect network, data from the current standby interconnect network is received until a route change notification is received from the current active interconnect network. An information processing system comprising a path switching control unit that waits for reception.
発行元情報処理装置における経路切り換え制御部は、現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付したあと、現待機系インタコネクトネットワークを運用系インタコネクトネットワークとして用いるように切り替えてデータ送信の再開をすることを特徴とする情報処理システム。 The information processing system according to claim 7,
The path switching control unit in the issuing information processing device uses the current active interconnect network and the current standby interconnect network to send route change notifications to the active standby network and the active standby interconnect network. An information processing system, wherein data transmission is resumed by switching to use as an interconnect network.
前記データ宛先情報処理装置における経路切り換え制御部は、現運用系インタコネクトネットワークから経路変更通知を受信した場合、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えてそのデータ受信を再開することを特徴とする情報処理システム。 An information processing system according to claim 7 or 8,
When the path switching control unit in the data destination information processing apparatus receives a path change notification from the current active interconnect network, the path switching control unit switches the current standby interconnect network to be used as the active interconnect network and receives the data. An information processing system characterized by restarting.
前記データ宛先情報処理装置における経路切り換え制御部は、現待機系インタコネクトネットワークから先に経路変更通知を受信しなかった場合、現待機系インタコネクトネットワークから経路変更通知を受信した後に、現待機系インタコネクトネットワークを運用系インタコクトネットワークとして用いるように切り替えることを特徴とする情報処理システム。 An information processing system according to claim 7 or 8,
If the path switching control unit in the data destination information processing apparatus does not receive the path change notification from the current standby interconnect network, the path switching control unit receives the path change notification from the current standby interconnect network, An information processing system characterized by switching to use an interconnect network as an operational interconnect network.
前記障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備えることを特徴とする情報処理装置。 It is an information processing device that constitutes an information processing system in which information processing devices are connected via a plurality of interconnect networks that monitor the failure predictor phenomenon and detect the failure predictor phenomenon of data transmitted through the route of the interconnect network ,
An information processing apparatus comprising: a path switching control unit configured to switch a path of a current active interconnect network to a path of another interconnect network after receiving the failure sign notification and perform subsequent data transmission.
前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後、一時的にデータ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付し、その後、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備え、
前記データ宛先の前記情報処理装置には、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせる経路切り換え制御部を備えることを特徴とする情報処理装置。 An information processing apparatus according to claim 11,
After receiving the failure sign notification, the issuing information processing device temporarily stops data transmission to the data destination information processing device, and sends the current active interconnect to the data destination information processing device. Send a route change notification to each of the network and the current standby interconnect network at the same time, and then switch the route of the current active interconnect network to the route of the other interconnect network to transmit subsequent data With a route switching control unit,
If the information processing apparatus of the data destination has previously received a route change notification from the current standby interconnect network, the information processing device from the current standby interconnect network until receiving a route change notification from the current active interconnect network. An information processing apparatus comprising a path switching control unit that waits for data reception.
前記インタコネクトネットワークは、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、
そのデータの発行元の前記情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、
前記発行元の前記情報処理装置は、前記障害予兆通知を受信した後に現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行うことを特徴とするインタコネクトネットワーク。 An interconnect network constituting an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks,
The interconnect network monitors a failure predictor phenomenon and detects a failure predictor phenomenon of data transmitted through the interconnect network path,
An interface control unit for transmitting a failure sign notification to the information processing apparatus that issued the data,
The information processing apparatus of the issuing source performs subsequent data transmission by switching the path of the current active interconnect network to a path of another interconnect network after receiving the failure sign notification network.
前記インタコネクトネットワークは、障害予兆現象を監視し、インタコネクトネットワークの経路で送信されたデータの障害予兆現象を検知する障害予兆現象検知部と、
そのデータの発行元の前記情報処理装置に障害予兆通知を送信するインタフェース制御部とを備え、
前記発行元の前記情報処理装置には、前記障害予兆通知を受信した後、一時的にデータ宛先情報処理装置へのデータ送信を中止し、前記データ宛先情報処理装置へ向けて現運用系インタコネクトネットワークと現待機系インタコネクトネットワークとを使用してそれぞれに同時に経路変更通知を送付し、その後、現運用系インタコネクトネットワークの経路を他のインタコネクトネットワークの経路に切り替えて以降のデータ送信を行う経路切り換え制御部を備え、
前記データ宛先情報処理装置は、先に現待機系インタコネクトネットワークから経路変更通知を受信した場合、現運用系インタコネクトネットワークから経路変更通知を受信するまで、現待機系インタコネクトネットワークからのデータ受信を待ち合わせる経路切り換え制御部を備えることを特徴とするインタコネクトネットワーク。
An interconnect network constituting an information processing system in which a plurality of information processing apparatuses are connected via a plurality of interconnect networks,
The interconnect network monitors a failure predictor phenomenon and detects a failure predictor phenomenon of data transmitted through the interconnect network path,
An interface control unit for transmitting a failure sign notification to the information processing apparatus that issued the data,
After receiving the failure sign notification, the issuing information processing device temporarily stops data transmission to the data destination information processing device, and sends the current active interconnect to the data destination information processing device. Send a route change notification to each of the network and the current standby interconnect network at the same time, and then switch the route of the current active interconnect network to the route of the other interconnect network to transmit subsequent data With a route switching control unit,
If the data destination information processing apparatus previously receives a route change notification from the current standby interconnect network, it receives data from the current standby interconnect network until it receives a route change notification from the current active interconnect network. An interconnect network comprising a path switching control unit that waits for
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005309956A JP2007124020A (en) | 2005-10-25 | 2005-10-25 | Information processing system, information processor, and error prevention processing method of interconnect network and information processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005309956A JP2007124020A (en) | 2005-10-25 | 2005-10-25 | Information processing system, information processor, and error prevention processing method of interconnect network and information processing system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007124020A true JP2007124020A (en) | 2007-05-17 |
Family
ID=38147412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005309956A Withdrawn JP2007124020A (en) | 2005-10-25 | 2005-10-25 | Information processing system, information processor, and error prevention processing method of interconnect network and information processing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007124020A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016100838A (en) * | 2014-11-25 | 2016-05-30 | Necプラットフォームズ株式会社 | Data transfer circuit and transfer method |
-
2005
- 2005-10-25 JP JP2005309956A patent/JP2007124020A/en not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016100838A (en) * | 2014-11-25 | 2016-05-30 | Necプラットフォームズ株式会社 | Data transfer circuit and transfer method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7844852B2 (en) | Data mirror cluster system, method and computer program for synchronizing data in data mirror cluster system | |
KR20070116102A (en) | Dma controller, node, data transfer control method, and program | |
JP4369470B2 (en) | Data relay apparatus, storage apparatus, and response delay monitoring method | |
KR20080101787A (en) | Intelligent failover in a load-balanced networking environment | |
JP2008283608A (en) | Computer, program and method for switching redundant communication path | |
JP2007058708A (en) | Multiplex system | |
US7043574B2 (en) | Computer system and frame transmitting method | |
JP2008046996A (en) | Data processor, and mode management device and method | |
JP5381109B2 (en) | Communication apparatus and control program thereof | |
JP2006338374A (en) | Network connection management device and network connection management method | |
JP2007124020A (en) | Information processing system, information processor, and error prevention processing method of interconnect network and information processing system | |
JP4541241B2 (en) | Plant control system | |
JPWO2020090032A1 (en) | Communication systems, communication devices and programs | |
JP4572138B2 (en) | Server apparatus, server system, and system switching method in server system | |
JP3917467B2 (en) | Power system monitoring control system and program | |
CN112217718A (en) | Service processing method, device, equipment and storage medium | |
JP2008009518A (en) | Dual operation system | |
JP5516569B2 (en) | Information processing apparatus and control method | |
WO2008062511A1 (en) | Multiprocessor system | |
JP5145860B2 (en) | Redundant memory system and information processing apparatus | |
JP2013254333A (en) | Multiple system control system and control method therefor | |
JP2019168739A (en) | Parallel computation system | |
WO2023197972A1 (en) | Optical transmission device, service device, and service transmission method and system | |
JP2007072980A (en) | Computer control system | |
WO2010070713A1 (en) | Information processing device and control method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20090106 |