JP7283314B2

JP7283314B2 - スイッチ装置及び情報処理システム

Info

Publication number: JP7283314B2
Application number: JP2019159595A
Authority: JP
Inventors: 靖牧山
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-09-02
Filing date: 2019-09-02
Publication date: 2023-05-30
Anticipated expiration: 2039-09-02
Also published as: JP2021040215A

Description

本発明は、スイッチ装置及び情報処理システムに関する。

ネットワークスイッチは、受信したデータの宛先に応じて接続された各機器へデータを転送する機能を内蔵したネットワーク機器である。以下では、ネットワークスイッチを単にスイッチと言う。

スイッチは、以下の２つの機能を有するものが一般的である。１つは、スイッチが単独で動作することで実現される機能である。具体的には、ネットワークに関する処理受信フレームの宛先アドレスを参照して、宛先の機器が繋がる他のポートに転送する処理がこの機能に該当する。

もう１つは、スイッチが自己に搭載されたＣＰＵ（Central Processing Unit）によるソフトウェア的な処理と連携して動作して処理を行うことで実現される機能である。この機能としては、例えば、スパニングツリープロトコルのＢＰＤＵ（Bridge Protocol Data Unit）パケット処理やマルチキャストのＩＧＭＰ（Internet Group Management Protocol）スヌービングが該当する。他にも、この機能としては、リンクアグリゲーションのＬＡＣＰ（Link Aggregation Control Protocol）パケット処理やＳＮＭＰ（Simple Network Management Protocol）やＳＳＨ（Secure Shell）などのスイッチ管理機能が該当する。

ここで、スイッチで発生する故障の１つに、スイッチに搭載されたＣＰＵに異常が発生し、ＣＰＵ以外の機構では障害が発生していないといった事象がある。この故障の要因には、ハードウェアの不具合、動作するファームウェアの問題又はファームウェアが使用するメモリ領域の枯渇などが考えられる。

ＣＰＵの異常が発生し上述した状態になった場合、ＣＰＵを使用する機能は動作しなくなるが、スイッチチップ単独の転送機能は動作が継続する。そのため、ＣＰＵを使用した機能に依存する信号の転送は行われなくなるが、スイッチチップ単独の転送機能により一部の信号は転送される。

なお、情報処理システムにおける障害発生時の機能として以下のような技術が提案されている。例えば、スイッチ上で指定したリンクに障害が発生すると、関連付けたリンクを強制的にダウンさせる従来技術がある。また、制御装置まで冗長化したネットワーク構成において、従系の制御装置でＣＰＵの障害が発生した場合にリンクダウンを発生させて主系の制御装置に検知させる従来技術がある。また、プロセスを監視する装置が、監視対象で動作するプロセスの異常を検知した場合に、プロセスの再起動を所定回数繰り返させ、所定回数を超えた場合に監視対象を再起動させる従来技術がある。また、監視対象のプロセスが自己の稼働状態を示す情報を共有メモリに書き込み、プロセスの異常を検出する異常検出部が、共有メモリの情報を読み出して異常発生を判定する従来技術がある。

特開２０１５－１２７９２６号公報特開２０１２－２５６２２７号公報特開２０１０－１６５０３６号公報

"Teaming"，[online]，ネットワークエンジニアとして［令和１年６月４日検索］，インターネット＜URL: https://www.infraexpert.com/study/etherchannel1.html＞

しかしながら、ＣＰＵに異常が発生した状態で、スイッチチップ単独の転送機能により一部の信号が転送される場合、実際にはＣＰＵで異常が発生しているにもかかわらず、スイッチの障害を検知することが困難になる場合がある。この場合、ＣＰＵを使用した機能に依存する信号の転送は行われなくなるため、スイッチ装置の機能を十全に使用できる状態ではないため、適切なデータ転送を保証することは難しい。このようにスイッチで発生した障害への対応が遅れることで、ネットワークの信頼性を損なうおそれがある。

開示の技術は、上記に鑑みてなされたものであって、ネットワークの信頼性を向上させるスイッチ装置及び情報処理システムを提供することを目的とする。

本願の開示するスイッチ装置及び情報処理システムの一つの態様において、制御部は、自装置の統括制御を実行する実行部と、前記実行部を動作させるプロセスを含む自装置において動作する複数のプロセスからビーコンを受信し、前記複数のプロセスの中にタイムアウト時間内に前記ビーコンを受信しない第１プロセスが存在する場合、前記第１プロセスを再起動させ、前記第１プロセスの再起動が所定回数を超えた場合に異常を検知し、且つ、前記複数のプロセスそれぞれについてメモリ使用量を監視して、メモリ使用量が閾値を超える第２プロセスが存在する場合、前記第２プロセスを再起動させ、前記第２プロセスの再起動が所定回数を越えた場合に異常を検知し、異常の検知を通知する管理部とを有する。転送処理部は、信号の転送を実行し、且つ、前記制御部で異常が発生した場合にも信号の転送を継続する。監視部は、前記制御部を監視し、前記管理部から異常の検知が通知された場合に前記転送処理部の動作を停止させる。

１つの側面では、本発明は、ネットワークの信頼性を向上させることができる。

図１は、実施例１に係る情報処理システムのブロック図である。図２は、受信フレームのフォーマットの一例を表す図である。図３Ａは、実施例１に係る情報処理システムにおけるＣＰＵ障害発生時の動作のシーケンス図である。図３Ｂは、実施例１に係る情報処理システムにおけるＣＰＵ障害発生時の動作のシーケンス図である。図４は、実施例２に係る情報処理システムのブロック図である。図５は、リセット回数記録テーブルの一例の図である。図６Ａは、実施例２に係る情報処理システムにおけるＣＰＵ障害発生時の動作のシーケンス図である。図６Ｂは、実施例２に係る情報処理システムにおけるＣＰＵ障害発生時の動作のシーケンス図である。

以下に、本願の開示するスイッチ装置及び情報処理システムの実施例を図面に基づいて詳細に説明する。なお、以下の実施例により本願の開示するスイッチ装置及び情報処理システムが限定されるものではない。

図１は、実施例１に係る情報処理システムのブロック図である。情報処理システム１００は、スイッチ装置１及び２、情報処理装置であるサーバ３、並びに、外部ネットワーク４を有する。情報処理システム１００は、サーバ３と外部ネットワーク４とを接続する冗長化されたネットワーク構成を有する。冗長化されたネットワークのそれぞれに、スイッチ装置１とスイッチ装置２とが配置される。

スイッチ装置１とスイッチ装置２とは、同様の機能を有する装置である。ただし、図１では、図示の都合上、スイッチ装置２の通信ポート２１及び２２以外の構成及び機能を省略した。スイッチ装置１は、通常時にサーバ３と外部ネットワーク４との間の通信の中継を実行するアクティブ側スイッチである。一方、スイッチ装置２は、スイッチ装置１に接続するサーバ３の通信ポート３１がリンクダウンした場合に、スイッチ装置１に代わってサーバ３と外部ネットワーク４との間の通信の中継を実行するスタンバイ側スイッチである。スイッチ装置１が、「第１スイッチ装置」の一例にあたる。また、スイッチ装置２が、「第２スイッチ装置」の一例にあたる。

スイッチ装置１は、通信ポート１１及び１２、メモリ１３、ＣＰＵ１４、並びに、スイッチチップ１５を有する。ＣＰＵ１４は、Ｉ２Ｃ（Inter Integrated Circuit）などの内部接続バス１６によりメモリ１３及びスイッチチップ１５と接続される。また、スイッチチップ１５は、通信ポート１１及び１２と接続される。ここで、本実施例では、スイッチ装置１が通信ポート１１及び１２という２つのポートを有する場合で説明したが、このポートの数に特に制限は無い。また、以下では、冗長構成をとるスイッチ装置１とスイッチ装置２の組において、一方に対して他方を冗長スイッチと呼ぶ場合がある。

通信ポート１１は、外部ネットワーク４に繋がるネットワークポートである。通信ポート１１は、外部ネットワーク４から受信した信号をスイッチチップ１５へ出力する。また、通信ポート１１は、スイッチチップ１５から入力された信号を外部ネットワーク４へ送信する。

通信ポート１２は、サーバ３に繋がるネットワークポートである。通信ポート１２は、サーバ３から受信した信号をスイッチチップ１５へ出力する。また、通信ポート１２は、スイッチチップ１５から入力された信号をサーバ３へ送信する。

メモリ１３は、記憶媒体である。メモリ１３は、ファームウェア設定ファイル１３１及び冗長スイッチ稼働情報１３２を有する。

ファームウェア設定ファイル１３１は、ＣＰＵ１４がソフトウェアを実行することで動作するファームウェア１４０の動作時の設定情報が登録されたファイルである。本実施例では、ファームウェア設定ファイル１３１は、少なくともキープアライブのタイムアウト時間の情報が登録される。

冗長スイッチ稼働情報１３２は、冗長スイッチであるスイッチ装置２の稼働状態の情報が格納される。冗長スイッチ稼働情報１３２には、ＣＰＵ１４によりスイッチ装置２の稼働状態の情報が書き込まれる。

ＣＰＵ１４は、ファームウェア１４０を起動し動作させる。このＣＰＵ１４が、「制御部」の一例にあたる。ファームウェア１４０は、起動後にメインプロセス１４１を起動させる。

メインプロセス１４１は、ファームウェア１４０の起動後に起動する。そして、メインプロセス１４１は、ファームウェア設定ファイル１３１に登録された設定情報を読み込む。その後、メインプロセス１４１は、読み込んだ設定情報にしたがって、主機能プロセス１４２及びキープアライブ送信プロセス１４３を起動させる。

また、メインプロセス１４１は、例えば、外部ネットワーク４、通信ポート１１及びスイッチチップ１５を介してスイッチ装置２のメインプロセス１４１との間で通信を行い、相互に稼働状態の情報の送受信を行う。その後、メインプロセス１４１は、取得した冗長スイッチの稼働状態の情報を冗長スイッチ稼働情報１３２に登録する。

また、メインプロセス１４１は、読み込んだ設定情報からキープアライブのタイムアウト時間の情報を取得して、スイッチチップ１５へ出力する。このメインプロセス１４１が、「管理部」の一例にあたる。

主機能プロセス１４２は、メインプロセス１４１により起動される。主機能プロセス１４２は、ソフトウェア的な処理を実行して、スイッチチップ１５と協調して動作する。具体的には、主機能プロセス１４２は、スパニングツリープロトコルのＢＰＤＵパケット処理、マルチキャストのＩＧＭＰスヌーピング、リンクアグリゲーションのＬＡＣＰパケット処理及びＳＮＭＰやＳＳＨなどのスイッチ管理を制御する。例えば、主機能プロセス１４２は、図２に記載した受信フレーム２００の宛先ＭＡＣ（Media Access Control）アドレス以外の情報を用いて受信した信号の転送を制御する。

図２は、受信フレームのフォーマットの一例を表す図である。スイッチ装置１が受信する信号である受信フレーム２００は、図２に示すように、プリアンブル、宛先ＭＡＣアドレス、送信元ＭＡＣアドレス、タイプ、データ及びＦＣＳ（Frame Check Sequence）を有する。例えば、主機能プロセス１４２は、受信フレーム２００のフォーマットを有する信号からプリアンブル、宛先ＭＡＣアドレス、送信ＭＡＣアドレス及びタイプに格納された情報を取得する。そして、主機能プロセス１４２は、取得した情報を用いて信号の転送を制御する。

例えば、ＩＧＭＰスヌーピングであれば、主機能プロセス１４２は、取得した情報から特定のグループへの転送であることを確認し、その特定のグループに対してスイッチチップ１５に信号を送信させる。主機能プロセス１４２は、実行する各処理においてメモリ１３を使用する場合がある。この主機能プロセス１４２が、「実行部」の一例にあたる。

キープアライブ送信プロセス１４３は、メインプロセス１４１により起動される。キープアライブ送信プロセス１４３は、ＣＰＵ１４が正常に動作中していることを表すキープアライブ信号を定期的にＣＰＵ異常監視処理部１５３へ出力する。キープアライブ送信プロセス１４３は、ＣＰＵ１４における異常発生などによりキープアライブ信号の送信を停止する。このキープアライブ送信プロセス１４３が、「通知部」の一例にあたる。そして、キープアライブ信号が、「生存通知」の一例にあたる。また、メインプロセス１４１、主機能プロセス１４２及びキープアライブ送信プロセス１４３が実行する処理が、「自装置の動作の統括制御」の一例にあたる。

スイッチチップ１５は、ＭＡＣ制御機構、スイッチングエンジン及びパケットバッファをチップ化した回路であり、ＬＳＩ（Large Scale Integration）などで実現される。スイッチチップ１５は、転送処理部１５１、設定記憶部１５２及びＣＰＵ異常監視処理部１５３を有する。

転送処理部１５１は、サーバ３から送出された信号の入力を通信ポート１２から受ける。そして、転送処理部１５１は、取得した信号の図２に示す宛先ＭＡＣアドレスを確認し、その宛先ＭＡＣアドレスを有する機器に向けて通信ポート１１を介して信号を外部ネットワーク４へ送信する。逆に、転送処理部１５１は、外部ネットワーク４から受信した信号の入力を通信ポート１１から受ける。そして転送処理部１５１は、取得した信号の宛先ＭＡＣアドレスを確認し、通信ポート１２を介して信号をサーバ３へ送信する。さらに、転送処理部１５１は、主機能プロセス１４２からの指示を受けて、他の機器やサーバ３に対する信号の送信を制御する。

ここで、本実施例では、転送処理部１５１が宛先ＭＡＣアドレスを用いてデータ転送を行い、主機能プロセス１４２は受信フレーム２００の宛先ＭＡＣアドレス以外の情報も用いて受信した信号の転送を制御する場合で説明した。ただし、この転送処理部１５１が転送に用いる情報は他の転送先アドレスを示す情報でもよく、例えば、ＩＰ（Internet Protocol）アドレスや装置アドレスであってもよい。

さらに、転送処理部１５１は、動作停止の指示をＣＰＵ異常監視処理部１５３から受ける。そして、転送処理部１５１は、ＣＰＵ異常監視処理部１５３からの指示にしたがい、信号の転送処理の動作を停止する。

設定記憶部１５２は、スイッチチップ１５が有する記憶領域である。設定記憶部１５２は、ＣＰＵ異常監視処理部１５３から入力されたキープアライブのタイムアウト時間を格納して保持する。

ＣＰＵ異常監視処理部１５３は、キープアライブのタイムアウト時間の入力をメインプロセス１４１から受ける。そして、ＣＰＵ異常監視処理部１５３は、取得したキープアライブのタイムアウト時間を設定記憶部１５２へ出力して記憶させる。

また、ＣＰＵ異常監視処理部１５３は、キープアライブ受信待ちタイマを有する。ＣＰＵ異常監視処理部１５３は、キープアライブのタイムアウト時間の設定記憶部１５２への格納後に、自己が有するキープアライブ受信待ちタイマを開始する。その後、ＣＰＵ異常監視処理部１５３は、キープアライブ送信プロセス１４３からキープアライブ信号を受信するまで、又は、キープアライブ受信待ちタイマが設定記憶部１５２に格納されたキープアライブのタイムアウト時間に達するまで待機する。

キープアライブ送信プロセス１４３からキープアライブ信号を受信した場合、ＣＰＵ異常監視処理部１５３は、キープアライブ受信待ちタイマをリセットして、キープアライブ信号の受信を待つ状態に戻る。

これに対して、キープアライブ信号を受信しない状態でキープアライブ受信待ちタイマがキープアライブのタイムアウト時間に達した場合、ＣＰＵ異常監視処理部１５３は、ＣＰＵ１４に異常が発生したと判定する。次に、ＣＰＵ異常監視処理部１５３は、メモリ１３に格納された冗長スイッチ稼働情報１３２を参照して、冗長スイッチであるスイッチ装置２が稼働しているか否かを判定する。

スイッチ装置２が稼働していない場合、ＣＰＵ異常監視処理部１５３は、動作停止の指示は送らずに、転送処理部１５１の動作を継続させる。この場合、スイッチ装置２が動作していない状態で転送処理部１５１の動作を停止すると、サーバ３と外部ネットワーク４との間の通信が完全に停止する。そのような事態を避けるために、スイッチ装置１としてはＣＰＵ１４を用いた信号転送の制御機能は使用困難な状態であるが、ＣＰＵ異常監視処理部１５３は、少なくとも転送処理部１５１による宛先ＭＡＣアドレスを用いた信号の転送を継続させる。

一方、スイッチ装置２が稼働中の場合、ＣＰＵ異常監視処理部１５３は、転送処理部１５１に動作の停止を指示する。これにより、転送処理部１５１の動作が停止し、通信ポート１２との間の信号の送受信が行われなくなる。これにより、サーバ３においてリンクダウンを強制的に発生させることができる。

サーバ３は、通信ポート３１及び３２、並びに、冗長制御部３３を有する。通信ポート３１は、スイッチ装置１の通信ポート１２に接続される。また、通信ポート３２は、スイッチ装置２の通信ポート２２に接続される。

冗長制御部３３は、例えば、サーバ３のＣＰＵがチーミングソフトを実行することで実現される機能である。本実施例では、冗長制御部３３は、通信ポート３１をアクティブ側とし、通信ポート３２をスタンバイ側とする。その後、冗長制御部３３は、通信ポート３１におけるリンクの確立状態を監視する。

冗長制御部３３は、通信ポート３１とスイッチ装置１との間の信号の送受信が停止した場合、通信ポート３１のリンクダウンが発生したと判定する。そして、通信ポート３１がリンクダウンすると、冗長制御部３３は、通信ポート３１の動作を停止し、通信ポート３２をスタンバイ状態からアクティブ状態に変える。これにより、スイッチ装置２がアクティブとなり、サーバ３は、スイッチ装置２を介して外部ネットワーク４と通信を行う。

次に、図３Ａ及び３Ｂを参照して、本実施例に係る情報処理システム１００におけるＣＰＵ障害発生時の動作について説明する。図３Ａ及び３Ｂは、実施例１に係る情報処理システムにおけるＣＰＵ障害発生時の動作のシーケンス図である。

ファームウェア１４０は、ＣＰＵ１４により起動される。そして、ファームウェア１４０が起動すると、メインプロセス１４１が起動する（ステップＳ１０１）。

次に、メインプロセス１４１は、メモリ１３に格納されたファームウェア設定ファイル１３１を読み込む（ステップＳ１０２）。

次に、メインプロセス１４１は、ファームウェア設定ファイル１３１にしたがって各プロセスを起動させる（ステップＳ１０３）。

キープアライブ送信プロセス１４３は、メインプロセス１４１により起動される（ステップＳ１０４）。

次に、メインプロセス１４１は、スイッチ装置２との間で稼働状態を相互に確認する（ステップＳ１０５）。この時、スイッチ装置２も、同様に稼働状態の相互確認を実行する（ステップＳ１０６）。

次に、メインプロセス１４１は、メモリ１３の冗長スイッチ稼働情報１３２にスイッチ装置２の稼働状態の情報を書き込む（ステップＳ１０７）。メモリ１３の冗長スイッチ稼働情報１３２は、スイッチ装置２の稼働状態の情報を保持する（ステップＳ１０８）。

次に、メインプロセス１４１は、キープアライブのタイムアウト時間をスイッチチップ１５のＣＰＵ異常監視処理部１５３に通知する（ステップＳ１０９）。

ＣＰＵ異常監視処理部１５３は、キープアライブのタイムアウト時間をメインプロセス１４１から取得する。そして、ＣＰＵ異常監視処理部１５３は、取得したキープアライブのタイムアウト時間を設定記憶部１５２に格納してキープアライブのタイムアウト時間を設定する（ステップＳ１１０）。

その後、ＣＰＵ異常監視処理部１５３は、自己が有するキープアライブ受信待ちタイマを開始する（ステップＳ１１１）。

そして、ＣＰＵ異常監視処理部１５３は、キープアライブ信号の受信待ち状態で待機する（ステップＳ１１２）。

キープアライブ送信プロセス１４３は、ＣＰＵ１４に異常が発生していなければキープアライブ信号をＣＰＵ異常監視処理部１５３へ送信する（ステップＳ１１３）。ただし、ＣＰＵ１４に異常が発生し、キープアライブ送信プロセス１４３がキープアライブ信号を送信することが困難な状態になる場合もある。

ＣＰＵ異常監視処理部１５３は、キープアライブ信号をキープアライブ送信プロセス１４３から受信したか否かを判定する（ステップＳ１１４）。キープアライブ信号を受信した場合（ステップＳ１１４：肯定）、ＣＰＵ異常監視処理部１５３は、ステップＳ１１１へ戻る。

これに対して、キープアライブ信号を受信しない場合（ステップＳ１１４：否定）、ＣＰＵ異常監視処理部１５３は、キープアライブのタイムアウト時間が経過したか否かを判定する（ステップＳ１１５）。キープアライブのタイムアウト時間が経過していない場合（ステップＳ１１５：否定）、ＣＰＵ異常監視処理部１５３は、ステップＳ１１２へ戻る。

一方、キープアライブのタイムアウト時間が経過した場合（ステップＳ１１５：肯定）、ＣＰＵ異常監視処理部１５３は、ＣＰＵ１４で異常が発生したと判定する（ステップＳ１１６）。

次に、ＣＰＵ異常監視処理部１５３は、冗長スイッチ稼働情報１３２からスイッチ装置２の稼働状態の情報を取得する（ステップＳ１１７）。

そして、ＣＰＵ異常監視処理部１５３は、取得したスイッチ装置２の稼働状態の情報から、冗長スイッチであるスイッチ装置２が動作しているか否かを判定する（ステップＳ１１８）。

冗長スイッチが動作していない場合（ステップＳ１１８：否定）、ＣＰＵ異常監視処理部１５３は、動作の停止を指示せずに、転送処理部１５１の信号転送処理の動作を継続させる（ステップＳ１１９）。

これに対して、冗長スイッチが動作している場合（ステップＳ１１８：肯定）、ＣＰＵ異常監視処理部１５３は、動作の停止を転送処理部１５１に指示する（ステップＳ１２０）。

転送処理部１５１は、ＣＰＵ異常監視処理部１５３からの指示を受けて、信号の転送処理の動作を停止する（ステップＳ１２１）。

転送処理部１５１の信号の転送処理の動作が停止することで、サーバ３の通信ポート３１で、リンクダウンが発生する（ステップＳ１２２）。

冗長制御部３３は、通信ポート３１のリンクダウンを検出する（ステップＳ１２３）。

その後、冗長制御部３３は、フェイルオーバー処理を実行する（ステップＳ１２４）。

通信ポート３１は、冗長制御部３３のフェイルオーバー処理により動作を停止する（ステップＳ１２５）。

通信ポート３２は、冗長制御部３３のフェイルオーバー処理により、スタンバイ状態からアクティブ状態へ変化する（ステップＳ１２６）。

通信ポート３２がアクティブ状態に変化すると、スイッチ装置２は、アクティブ状態に遷移する（ステップＳ１２７）。

以上に説明したように、本実施例に係るスイッチ装置は、ＣＰＵに異常が発生した場合に、スイッチチップがＣＰＵの異常発生を検出して転送処理の動作を停止する。これにより、サーバとＣＰＵに異常が発生したスイッチ装置との間のリンクダウンを強制的に発生させることができる。転送処理の動作が停止するとサーバのチーミングソフトがリンクダウンを検出して、信号の転送処理を冗長スイッチが行うように信号の転送経路が切り替えられる。これにより、ＣＰＵに異常が発生した状態で、スイッチチップ単独の転送機能により一部の信号が転送される場合でも、迅速にスイッチの障害を検知することができ、ネットワークの信頼性を向上させることが可能となる。

また、例えば、チーミングソフトによる冗長構成を有する情報処理システムにおいて、ＣＰＵに異常が発生したがスイッチチップの転送機能の動作が継続する場合、一部のフレームは正常に転送されるが、通信ポートのリンクダウンは発生しない。この場合、チーミングソフトはアクティブな経路が使用困難になったことを検知しないため、経路の切り替えが発生しない。そのため、ＣＰＵを使用する機能は停止したままとなり、スイッチ装置は正常動作を行えず、ネットワークの信頼性が損なわれてしまう。

さらに、例えば、チーミングソフトには通信ポートのリンクダウンによる障害検知の他に、チーミングソフトから通信相手にｐｉｎｇを送信して、接続先からの応答の有無によりアクティブな経路の状態を確認する方式がある。しかし、ＣＰＵ異常が発生してもスイッチの転送機能が動作していれば、スイッチチップによりｐｉｎｇの送受信は行われるため、ｐｉｎｇにより経路状態の確認を行う方式であっても、アクティブな経路が使えなくなったことを検知することは困難である。

また、指定したリンクの障害に応じて他のリンクをダウンさせる従来技術を用いても、スイッチの転送機能が生きた状態でのＣＰＵの障害発生の検知を行うことはないため、ネットワークの信頼性を向上させることは困難である。また、従系の制御装置でＣＰＵの障害が発生した場合にリンクダウンを発生させる従来技術を用いても、スイッチ内部のＣＰＵの障害の検知は行わないため経路の切り替えは行われず、ネットワークの信頼性を向上させることは困難である。また、プロセスの所定回数再起動後に装置を再起動させる従来技術や、共有メモリの情報を基に異常発生を判定する従来技術では、スイッチのＣＰＵの障害による経路切り替えについては考慮されておらず、ネットワークの信頼性を向上させることは困難である。

これに対して、本実施例に係るスイッチ装置は、ＣＰＵ異常が発生した場合に転送経路を強制的に切り替える。これにより、ＣＰＵに異常が発生し宛先ＭＡＣアドレス以外の情報を加えた信号の転送処理が行えない状態で、冗長スイッチへの切り替えが発生せずに、宛先ＭＡＣアドレスを用いた転送処理が継続することを回避できる。したがって、一部の機能が停止した状態のスイッチの使用を回避して、宛先ＭＡＣアドレス以外の情報を加えた信号の転送処理を含むスイッチ装置の各機能を使用した通信を継続することができ、ネットワークの信頼性を向上させることができる。

図４は、実施例２に係る情報処理システムのブロック図である。本実施例に係る情報処理システム１００は、各プロセスに異常が発生してもリセットを行い、正常状態に復帰可能であるかを確かめることが実施例１と異なる。以下の説明では、実施例１と同様の各部の機能については説明を省略する。

メモリ１３は、図５に示すリセット回数記録テーブル１３３を有する。図５は、リセット回数記録テーブルの一例の図である。リセット回数記録テーブル１３３は、メインプロセス１４１以外のプロセス毎にリセット回数を登録可能なテーブルである。本実施例では、主機能プロセス１４２に含まれる詳細なプロセス毎にリセット回数が登録される場合を記載した。ＳＴＰは、スパニングツリープロトコル（Spanning Tree Protocol）を実行するプロセスを表す。マルチキャストは、マルチキャストで通信を行うためのプロセスを表す。ただし、リセット回数記録テーブル１３３は、主機能プロセス１４２を１つの項目として取り扱ってもよい。本実施例では、主機能プロセス１４２に含まれる詳細な各プロセス及びキープアライブ送信プロセス１４３をまとめて監視プロセスと呼ぶ場合がある。

図４に戻って説明を続ける。メインプロセス１４１は、ファームウェア設定ファイル１３１から設定情報を取得する。ファームウェア設定ファイル１３１には、キープアライブのタイムアウト時間、ビーコンのタイムアウト時間及びプロセスリセットの最大回数として予め決められた所定回数が含まれる。さらに、ファームウェア設定ファイル１３１には、ファームウェア１４０によるメモリ１３の使用量の閾値、各監視プロセスによるメモリ１３の使用量の閾値が含まれる。

メインプロセス１４１は、ビーコン受信待ちタイマを起動させた監視プロセス毎に有する。メインプロセス１４１は、監視プロセスを起動後、各監視プロセスのビーコン受信待ちタイマを開始する。その後、メインプロセス１４１は、各監視プロセスからのビーコンの受信待ち状態で待機する。

各監視プロセスからビーコンを受信した場合、メインプロセス１４１は、ビーコンを受信した監視対象プロセスのビーコン受信待ちタイマをリセットして再開する。そして、メインプロセス１４１は、各監視プロセスからのビーコンの受信待ち状態に戻る。

これに対して、ビーコンの受信が行われずにビーコンのタイムアウト時間が経過した監視プロセスが存在する場合、メインプロセス１４１は、その監視プロセスに障害が発生したと判定する。そして、メインプロセス１４１は、メモリ１３のリセット回数記録テーブル１３３を参照して、その監視プロセスのリセットが所定回数行われたか否かを判定する。その監視プロセスのリセット回数が所定回数未満の場合、メインプロセス１４１は、障害が発生したと判定した監視プロセスをリセットする。次に、メインプロセス１４１は、リセット回数記録テーブル１３３における障害が発生したと判定した監視プロセスのリセット回数を１つインクリメントする。その後、メインプロセス１４１は、リセットした監視プロセスのビーコン受信待ちタイマをリセットして再開する。そして、メインプロセス１４１は、各監視プロセスからのビーコンの受信待ち状態に戻る。

また、メインプロセス１４１は、ビーコンの受信待ち状態でファームウェア１４０及び各監視プロセスのメモリ使用量を定期的に取得する。ここで、ファームウェア１４０及び各監視プロセスのメモリ使用量は、ファームウェア１４０のＯＳ（Operating System）が管理しており、メインプロセス１４１は、ＯＳからそれらの情報を取得することができる。

ファームウェア１４０のメモリ使用量が予め決められたファームウェア１４０のメモリ使用量の閾値であるファームウェア閾値を超えている場合、メインプロセス１４１は、メモリ１３が枯渇状態と判定する。メモリ１３が枯渇した場合には処理を継続することが困難なため、メインプロセス１４１は、各監視プロセスを停止させる。

これに対して、ファームウェア１４０のメモリ１３の使用量がファームウェア閾値を超えていない場合、メインプロセス１４１は、各監視プロセスのメモリ使用量がそれぞれのプロセスのメモリ使用量の閾値であるプロセス閾値を超えているか否かを判定する。このプロセス閾値が、「所定閾値」の一例にあたる。メモリ使用量がプロセス閾値を超えた監視プロセスが存在する場合、メインプロセス１４１は、メモリ１３のリセット回数記録テーブル１３３を参照して、その監視プロセスのリセットが所定回数行われたか否かを判定する。ここで、本実施例で使用する使用量は、実際の量を示す実量であってもよいし、割合を示す使用率であってもよい。

その監視プロセスのリセット回数が所定回数未満の場合、メインプロセス１４１は、その監視プロセスをリセットする。次に、メインプロセス１４１は、リセット回数記録テーブル１３３における障害が発生したと判定した監視プロセスのリセット回数を１つインクリメントする。その後、メインプロセス１４１は、リセットした監視プロセスのビーコン受信待ちタイマをリセットして再開する。そして、メインプロセス１４１は、各監視プロセスからのビーコンの受信待ち状態に戻る。

これに対して、その監視プロセスのリセット回数が所定回数に達した場合、メインプロセス１４１は、全ての監視プロセスを停止する。これにより、キープアライブ送信プロセス１４３も停止する。

主機能プロセス１４２に属する各監視プロセスは、定期的にビーコンをメインプロセス１４１へ出力する。ただし、主機能プロセス１４２に属する監視プロセスのいずれかで障害が発生した場合には、その障害が発生した主機能プロセス１４２は、ビーコンの送信を行わない場合がある。主機能プロセス１４２に含まれる各プロセスのうちメインプロセス１４１からリセットの指示を受けた監視プロセスは、自己のリセットを行い再起動して、ビーコンを送信する状態に戻る。

また、リセットが所定回数を超えた場合、主機能プロセス１４２に属する各監視プロセスは、メインプロセス１４１から動作停止の制御を受ける。そして、主機能プロセス１４２に含まれる詳細な各プロセスは、自己の動作を停止する。

キープアライブ送信プロセス１４３は、定期的にビーコンをメインプロセス１４１へ出力する。ただし、障害が発生した場合には、キープアライブ送信プロセス１４３は、ビーコンの送信が困難となることがある。その後、キープアライブ送信プロセス１４３は、メインプロセス１４１からリセットの指示を受けて、自己のリセットを行い再起動して、ビーコンを送信する状態に戻る。

また、リセットが所定回数を超えた場合、キープアライブ送信プロセス１４３は、メインプロセス１４１から動作停止の制御を受ける。そして、キープアライブ送信プロセス１４３は、自己の動作を停止する。これにより、キープアライブ送信プロセス１４３は、キープアライブ信号のＣＰＵ異常監視処理部１５３への送信を停止する。

次に、図６Ａ及び６Ｂを参照して、実施例に係る情報処理システム１００におけるＣＰＵ障害発生時の動作の流れを説明する。図６Ａ及び６Ｂは、実施例２に係る情報処理システムにおけるＣＰＵ障害発生時の動作のシーケンス図である。

ファームウェア１４０は、ＣＰＵ１４により起動される。そして、ファームウェア１４０が起動すると、メインプロセス１４１が起動する（ステップＳ２０１）。

次に、メインプロセス１４１は、メモリ１３に格納されたファームウェア設定ファイル１３１を読み込む（ステップＳ２０２）。

次に、メインプロセス１４１は、ファームウェア設定ファイル１３１にしたがって各プロセスを起動させる（ステップＳ２０３）。

主機能プロセス１４２は、メインプロセス１４１により起動される（ステップＳ２０４）。キープアライブ送信プロセス１４３は、メインプロセス１４１により起動される（ステップＳ２０５）。

次に、メインプロセス１４１は、スイッチ装置２との間で稼働状態を相互に確認する（ステップＳ２０６）。この時、スイッチ装置２も、同様に稼働状態の相互確認を実行する（ステップＳ２０７）。

次に、メインプロセス１４１は、メモリ１３の冗長スイッチ稼働情報１３２にスイッチ装置２の稼働状態の情報を書き込む（ステップＳ２０８）。メモリ１３の冗長スイッチ稼働情報１３２は、スイッチ装置２の稼働状態の情報を保持する（ステップＳ２０９）。

次に、メインプロセス１４１は、キープアライブのタイムアウト時間をスイッチチップ１５のＣＰＵ異常監視処理部１５３に通知する（ステップＳ２１０）。

ＣＰＵ異常監視処理部１５３は、キープアライブのタイムアウト時間をメインプロセス１４１から取得する。そして、ＣＰＵ異常監視処理部１５３は、取得したキープアライブのタイムアウト時間を設定記憶部１５２に格納してキープアライブのタイムアウト時間を設定する（ステップＳ２１１）。

メインプロセス１４１は、監視プロセス毎のビーコンの受信待ちタイマを開始する（ステップＳ２１２）。そして、メインプロセス１４１は、ビーコンの受信待ち状態で待機する（ステップＳ２１３）。

主機能プロセス１４２に含まれる各監視プロセスは、ビーコンをメインプロセス１４１へ送信する（ステップＳ２１４）。ただし、異常が発生した監視プロセスは、ビーコンが送信困難となる場合がある。

キープアライブ送信プロセス１４３は、ビーコンをメインプロセス１４１へ送信する（ステップＳ２１５）。ただし、異常が発生した場合には、キープアライブ送信プロセス１４３からのビーコン送信が困難となる場合がある。

ＣＰＵ異常監視処理部１５３は、自己が有するキープアライブ受信待ちタイマを開始する（ステップＳ２１６）。

そして、ＣＰＵ異常監視処理部１５３は、キープアライブ信号の受信待ち状態で待機する（ステップＳ２１７）。

キープアライブ送信プロセス１４３は、メインプロセス１４１により動作が停止されていなければキープアライブ信号をＣＰＵ異常監視処理部１５３へ送信する（ステップＳ２１８）。

メインプロセス１４１は、ファームウェア１４０及び各監視プロセスのメモリ使用量を取得する（ステップＳ２１９）。

次に、メインプロセス１４１は、ファームウェア１４０のメモリ使用量がファームウェア閾値以上か否かを判定する（ステップＳ２２０）。ファームウェア１４０のメモリ使用量がファームウェア閾値以上の場合（ステップＳ２２０：肯定）、メインプロセス１４１は、ステップＳ２３２へ進む。

これに対して、ファームウェア１４０のメモリ使用量がファームウェア閾値未満の場合（ステップＳ２２０：否定）、メインプロセス１４１は、各監視プロセスのメモリ１３のメモリ使用量がそれぞれのプロセス閾値以上か否かを判定する（ステップＳ２２１）。

メモリ使用量がプロセス閾値以上である監視プロセスが存在する場合（ステップＳ２２１：肯定）、メインプロセス１４１は、ステップＳ２２５へ進む。

これに対して、メモリ使用量がプロセス閾値以上となる監視プロセスが存在しない場合（ステップＳ２２１：否定）、メインプロセス１４１は、全ての監視プロセスからビーコンを受信したか否かを判定する（ステップＳ２２２）。全ての監視プロセスからビーコンを受信した場合（ステップＳ２２２：肯定）、メインプロセス１４１は、ステップＳ２１２へ戻る。

これに対して、ビーコンを受信していない監視プロセスが存在する場合（ステップＳ２２２：否定）、メインプロセス１４１は、その監視プロセスのビーコンの受信待ちタイムアウト時間が経過したか否かを判定する（ステップＳ２２３）。ビーコンの受信待ちタイムアウト時間が経過していない場合（ステップＳ２２３：否定）、メインプロセス１４１は、ステップＳ２１３へ戻る。

これに対して、ビーコンの受信待ちタイムアウト時間が経過した場合（ステップＳ２２３：肯定）、メインプロセス１４１は、ビーコンを受信せずにビーコンの受信待ちタイムアウト時間が経過したプロセスに異常が発生したと判定する（ステップＳ２２４）。

次に、メインプロセス２２３は、メモリ１３のリセット回数記録テーブル１３３を参照して、異常が発生した監視プロセス及びメモリ１３の使用量が閾値を超えた各監視プロセスについてリセットが所定回数実行されたか否かを判定する（ステップＳ２２５）。

リセットが所定回数実行された監視プロセスが存在しない場合（ステップＳ２２５：否定）、メインプロセス２２３は、異常が発生した監視プロセス及びメモリ１３の使用量が閾値を超えた各監視プロセスのリセット処理を実行する（ステップＳ２２６）。その後、メインプロセス１４１は、ステップＳ２１２へ戻る。

主機能プロセス１４２に属する各監視プロセスは、メインプロセス１４１からリセット指示を受信したか否かを判定する（ステップＳ２２７）。リセット指示を受信していない場合（ステップＳ２２７：否定）、主機能プロセス１４２に属する各監視プロセスは、ステップＳ２３３へ進む。

これに対して、リセット指示を受信した場合（ステップＳ２２７：肯定）、主機能プロセス１４２に属する各監視プロセスは、自己のリセットを実行する（ステップＳ２２８）。

また、キープアライブ送信プロセス１４３は、メインプロセス１４１からリセット指示を受信したか否かを判定する（ステップＳ２２９）。リセット指示を受信していない場合（ステップＳ２２９：否定）、キープアライブ送信プロセス１４３は、ステップＳ２３５へ進む。

これに対して、リセット指示を受信した場合（ステップＳ２２９：肯定）、キープアライブ送信プロセス１４３は、自己のリセットを実行する（ステップＳ２３０）。

一方、リセットが所定回数実行された監視プロセスが存在する場合（ステップＳ２２５：肯定）、メインプロセス２２３は、その監視プロセスが起動不可と判定する（ステップＳ２３１）。

メインプロセス２２３は、起動不可と判定したプロセスが存在する場合又はファームウェア１４０のメモリ１３の使用量がファームウェア閾値以上であれば、監視プロセスを停止する（ステップＳ２３２）。

主機能プロセス１４２に属する各監視プロセスは、メインプロセス１４１から停止指示を受信したか否かを判定する（ステップＳ２３３）。停止指示を受信していない場合（ステップＳ２３３：否定）、主機能プロセス１４２に属する各監視プロセスは、ステップＳ２１４へ戻る。

これに対して、停止指示を受信した場合（ステップＳ２３３：肯定）、主機能プロセス１４２に属する各監視プロセスは、自己の動作を停止する（ステップＳ２３４）。

また、キープアライブ送信プロセス１４３は、メインプロセス１４１から停止指示を受信したか否かを判定する（ステップＳ２３５）。停止指示を受信していない場合（ステップＳ２３５：否定）、キープアライブ送信プロセス１４３は、ステップＳ２１５へ戻る。

これに対して、停止指示を受信した場合（ステップＳ２３５：肯定）、キープアライブ送信プロセス１４３は、自己の動作を停止する（ステップＳ２３６）。

その後、メインプロセス１４１は、自己の動作を停止する（ステップＳ２３７）。

以上の処理により、キープアライブ送信プロセス１４３は、キープアライブ信号の送信を停止する（ステップＳ２３８）。

ＣＰＵ異常監視処理部１５３は、キープアライブ信号をキープアライブ送信プロセス１４３から受信したか否かを判定する（ステップＳ２３９）。キープアライブ信号を受信した場合（ステップＳ２３９：肯定）、ＣＰＵ異常監視処理部１５３は、ステップＳ２１６へ戻る。

これに対して、キープアライブ信号を受信しない場合（ステップＳ２３９：否定）、ＣＰＵ異常監視処理部１５３は、キープアライブのタイムアウト時間が経過したか否かを判定する（ステップＳ２４０）。キープアライブのタイムアウト時間が経過していない場合（ステップＳ２４０：否定）、ＣＰＵ異常監視処理部１５３は、ステップＳ２１７へ戻る。

一方、キープアライブのタイムアウト時間が経過した場合（ステップＳ２４０：肯定）、ＣＰＵ異常監視処理部１５３は、ＣＰＵ１４で異常が発生したと判定する（ステップＳ２４１）。

次に、ＣＰＵ異常監視処理部１５３は、冗長スイッチ稼働情報１３２からスイッチ装置２の稼働状態の情報を取得する（ステップＳ２４２）。

そして、ＣＰＵ異常監視処理部１５３は、取得したスイッチ装置２の稼働状態の情報から、冗長スイッチであるスイッチ装置２が動作しているか否かを判定する（ステップＳ２４３）。

冗長スイッチが動作していない場合（ステップＳ２４３：否定）、ＣＰＵ異常監視処理部１５３は、動作の停止を指示せずに、転送処理部１５１の信号転送処理の動作を継続させる（ステップＳ２４４）。

これに対して、冗長スイッチが動作している場合（ステップＳ２４３：肯定）、ＣＰＵ異常監視処理部１５３は、動作の停止を転送処理部１５１に指示する（ステップＳ２４５）。

転送処理部１５１は、ＣＰＵ異常監視処理部１５３からの指示を受けて、信号の転送処理の動作を停止する（ステップＳ２４６）。

転送処理部１５１の新党の転送処理の動作が停止することで、サーバ３の通信ポート３１で、リンクダウンが発生する（ステップＳ２４７）。

冗長制御部３３は、通信ポート３１のリンクダウンを検出する（ステップＳ２４８）。

その後、冗長制御部３３は、フェイルオーバー処理を実行する（ステップＳ２４９）。

通信ポート３１は、冗長制御部３３のフェイルオーバー処理により動作を停止する（ステップＳ２５０）。

通信ポート３２は、冗長制御部３３のフェイルオーバー処理により、スタンバイ状態からアクティブ状態へ変化する（ステップＳ２５１）。

通信ポート３２がアクティブ状態に変化すると、スイッチ装置２は、アクティブ状態に遷移する（ステップＳ２５２）。

以上に説明したように、本実施例に係るスイッチ装置は、ビーコンで管理プロセスの異常を検出し、異常が発生した管理プロセスのリセットを行って正常な状態に復帰するかを試す。また、各管理プロセスのメモリの使用量が多い場合にも、管理プロセスのリセットを行ってメモリの使用量が適切な使用量に収まるかを試行する。正常な状態に戻らない場合及びメモリの使用量が適切な量に収まらない場合、スイッチ装置は、ＣＰＵの異常発生を検出して転送処理の動作を停止する。また、ファームウェアによるメモリの使用量が大きい場合も、スイッチ装置は、転送処理の動作を停止する。転送処理の動作が停止するとチーミングソフトがリンクダウンを検出して、信号の転送処理を冗長スイッチが行うように信号の転送経路が切り替えられる。

このように、プロセスをリセットして正常な状態に復帰させる試みをすることで、復帰する可能性があるプロセスを助けて、切り替えを回避することができる。すなわち、プロセスに異常が発生した場合にも、正常な状態に復帰できれば、冗長構成を維持することができる。したがって、ネットワークの信頼性をより向上させることができる。また、メモリの状態を監視することで、メモリの枯渇による異常の発生も回避することができる。

ここで、本実施例では、プロセスのリセットに加えてメモリの異常の検知を行ったが、冗長性維持を目的とする場合、メモリの異常の検知は行わなくてもよい。また、メモリの異常の検知において、ファームウェアの使用状態と各管理プロセスの使用状態とを監視したが、いずれか一方を監視する構成であってもよい。

１，２スイッチ装置
３サーバ
４外部ネットワーク
１１，１２通信ポート
１３メモリ
１４ＣＰＵ
１５スイッチチップ
１６内部接続バス
２１，２２通信ポート
３１，３２通信ポート
３３冗長制御部
１３１ファームウェア設定ファイル
１３２冗長スイッチ稼働情報
１３３リセット回数記録テーブル
１４０ファームウェア
１４１メインプロセス
１４２主機能プロセス
１４３キープアライブ送信プロセス
１５１転送処理部
１５２設定記憶部
１５３ＣＰＵ異常監視処理部

Claims

自装置の動作の統括制御を実行する実行部と、前記実行部を動作させるプロセスを含む自装置において動作する複数のプロセスからビーコンを受信し、前記複数のプロセスの中にタイムアウト時間内に前記ビーコンを受信しない第１プロセスが存在する場合、前記第１プロセスを再起動させ、前記第１プロセスの再起動が所定回数を超えた場合に異常を検知し、且つ、前記複数のプロセスそれぞれについてメモリ使用量を監視して、メモリ使用量が閾値を超える第２プロセスが存在する場合、前記第２プロセスを再起動させ、前記第２プロセスの再起動が所定回数を越えた場合に異常を検知し、異常の検知を通知する管理部とを有する行う制御部と、
信号の転送を実行し、且つ、前記制御部で異常が発生した場合にも信号の転送を継続する転送処理部と、
前記制御部を監視し、前記管理部から異常の検知が通知された場合に前記転送処理部の動作を停止させる監視部と
を備えたことを特徴とするスイッチ装置。
前記転送処理部は、前記信号に含まれる転送先アドレスを用いて前記転送を実行し、
前記制御部は、前記信号に含まれる前記転送先アドレス以外の前記信号の送受信に関する送受信情報を基に前記統括制御を実行する
ことを特徴とする請求項１に記載のスイッチ装置。
前記監視部は、前記スイッチ装置を冗長化する冗長スイッチ装置の稼働状態を表す冗長スイッチ稼働情報を参照し、前記冗長スイッチ装置が稼働可能な状態の場合、前記転送処理部の動作を停止させ、前記冗長スイッチ装置が非稼働の場合、前記転送処理部の動作を継続させることを特徴とする請求項１又は２に記載のスイッチ装置。
前記制御部は、生存通知を前記監視部に定期的に送信し、前記生存通知の送信の停止により動作停止を通知する通知部を有し、
前記監視部は、前記通知部からの前記生存通知の送信が停止した場合に前記異常を検出する
ことを特徴とする請求項１～３の何れか一つに記載のスイッチ装置。
前記制御部は、前記統括制御を実行する実行部及び前記実行部の動作を管理する管理部をさらに有し、
前記管理部は、前記実行部の動作異常を検出した場合、前記実行部を再起動し、所定回数の前記再起動を行っても前記実行部に前記動作異常が検出される場合、前記通知部による生存通知を停止させる
ことを特徴とする請求項４に記載のスイッチ装置。
前記実行部が前記統括制御を実行する際に使用するメモリをさらに有し、
前記管理部は、前記実行部の前記メモリの使用量が予め決められた所定閾値を超えた場合、前記実行部を再起動し、所定回数の前記再起動を行っても前記実行部に前記動作異常が検出される場合、前記通知部による生存通知を停止させる
ことを特徴とする請求項５に記載のスイッチ装置。
情報処理装置と所定ネットワークとを接続する異なる経路にそれぞれ接続された第１スイッチ装置及び第２スイッチ装置を有する情報処理システムであって、
前記第１スイッチ装置は、
自装置の動作の統括制御を実行する実行部と、前記実行部を動作させるプロセスを含む自装置において動作する複数のプロセスからビーコンを受信し、前記複数のプロセスの中にタイムアウト時間内に前記ビーコンを受信しない第１プロセスが存在する場合、前記第１プロセスを再起動させ、前記第１プロセスの再起動が所定回数を超えた場合に異常を検知し、且つ、前記複数のプロセスそれぞれについてメモリ使用量を監視して、メモリ使用量が閾値を超える第２プロセスが存在する場合、前記第２プロセスを再起動させ、前記第２プロセスの再起動が所定回数を越えた場合に異常を検知し、異常の検知を通知する管理部とを有する第１制御部と、
前記情報処理装置と前記所定ネットワークとの間で送受信される信号の転送を実行し、且つ、前記第１制御部で異常が発生した場合にも信号の転送を継続する第１転送処理部と、
前記第１制御部を監視し、前記管理部から異常の検知が通知された場合に前記第１転送処理部の動作を停止させる監視部とを備え
前記第２スイッチ装置は、
前記情報処理装置と前記所定ネットワークとの間で送受信される信号の転送を実行する第２転送処理部と、
自装置の動作の統括制御を行う第２制御部とを備え、
前記情報処理装置は、
前記第１転送処理部による前記信号の転送が停止した場合に前記第２スイッチ装置における前記第２転送処理部及び前記第２制御部の動作を開始させる経路切替部を備えた
ことを特徴とする情報処理システム。