JPWO2008050456A1 - コンピュータシステム、データ中継装置およびコンピュータシステム制御方法 - Google Patents

コンピュータシステム、データ中継装置およびコンピュータシステム制御方法 Download PDF

Info

Publication number
JPWO2008050456A1
JPWO2008050456A1 JP2008540870A JP2008540870A JPWO2008050456A1 JP WO2008050456 A1 JPWO2008050456 A1 JP WO2008050456A1 JP 2008540870 A JP2008540870 A JP 2008540870A JP 2008540870 A JP2008540870 A JP 2008540870A JP WO2008050456 A1 JPWO2008050456 A1 JP WO2008050456A1
Authority
JP
Japan
Prior art keywords
data
dummy
information
mirror
system board
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008540870A
Other languages
English (en)
Inventor
孝 小口
孝 小口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2008050456A1 publication Critical patent/JPWO2008050456A1/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2005Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication controllers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

データクロスバのミラーAおよびミラーBは、システムボード#0から通知される非縮退信号に基づいて、自己が接続されているミラーが縮退していないものと判断している場合には、システムボード#0から受信したデータパケットを送信するように制御する一方で、システムボード#0から通知される非縮退信号に基づいて、自己が接続されているミラーが縮退しているものと判断している場合には、生成したダミー情報をデータパケットとして送信するように制御する。

Description

この発明は、二重化された各装置を配置して構成される各システムボードをデータ中継装置により接続し、当該データ中継装置を介して同期させたデータのやり取りを行うコンピュータシステム、二重化された各装置を配置して構成される各システムボードに接続され、各システムボードから送信される同期されたデータの転送を制御するデータ中継装置および二重化された各装置を配置して構成される各システムボードをデータ中継装置により接続し、当該データ中継装置を介して同期させたデータのやり取りを制御するコンピュータシステム制御方法に関する。
従来より、情報処理装置などのコンピュータシステムにおいて、その信頼性などを向上させるための技術が開示されている(例えば、特許文献1参照)。
また、図7に例示するように、主制御部として機能するCPU(Central Proccessing Unit)、記憶部として機能するメモリ、メモリコントローラおよびシステムコントローラを配置したシステムボードをデータクロスバおよびアドレスクロスバで複数接続して構成されるコンピュータシステムにおいては、システムボード上のメモリやメモリコントローラなどの各装置を2重化した構成にすることで、システムの信頼性向上を図るのが一般的である。
特許第3050148号公報
しかしながら、上記したようなシステムボード上に配置される各装置が2重化されたコンピュータシステムでは、故障していないシステムボード上の装置について縮退の必要があり、システムの可用性が低いという問題点があった。
この問題点について簡単に説明すると、図8に例示するように、各システムボード(#0〜2)上に配置されている装置とデータクロスバは、ミラーAおよびミラーBの単位で2重化され、ミラーAおよびミラーBを互いに同期動作させる。ここで、仮に、システムボード#0のミラーAを構成する装置に故障が発生すると、システムボード#0のミラーAは閉塞されて、システムボード#0のミラーAからデータクロスバのミラーAに対するデータの送信が途絶えてしまい、各システムボード間のデータ転送を行うデータクロスバは、ミラーAおよびミラーBのそれぞれから受信したデータを同期させて転送する同期動作を継続することができなくなる。他のシステムボードは、ミラーAおよびミラーBで同期したデータを受信することができないと、受信データの正当性が判断できないため、正常に機能する自らのミラーAを閉塞することで縮退しなくてはならない。
そこで、この発明は、上述した従来技術の課題を解決するためになされたものであり、故障が発生していないシステムボードについて縮退する必要がなく、システムの可用性を向上させることが可能なコンピュータシステムを提供することを目的とする。
上述した課題を解決し、目的を達成するため、請求項1に係る発明は、二重化された各装置を配置して構成される各システムボードをデータ中継装置により接続し、当該データ中継装置を介して同期させたデータのやり取りを行うコンピュータシステムであって、前記二重化を構成する片系および他方の片系ごとに前記各システムボードから送信される信号に基づいて、当該片系ごとに縮退しているか否か判断する縮退判断手段と、前記縮退判断手段により縮退しているものと判断された片系と二重化を構成する他方の片系から、前記システムボードからのデータリクエストに応じて送信される正規のデータの先頭を示す識別情報および当該データの宛先を示す宛先情報に、ダミーデータを付加したダミー情報を生成するダミー情報生成手段と、前記縮退判断手段により縮退しているものと判断された片系と二重化を構成する他方の片系から前記データリクエストに応じて送信された正規の情報、および前記ダミー情報生成手段により生成された前記ダミー情報を同期させたデータとして送信するデータ送信手段と、を備えたことを特徴とする。
また、請求項2に係る発明は、上記の発明において、前記ダミー情報生成手段は、誤り検出符号による復号結果からダミーであると認識されるポイゾニングデータを前記ダミーデータとして採用し、前記識別情報および前記宛先情報に、当該ポイゾニングデータを付加してダミー情報を生成することを特徴とする。
また、請求項3に係る発明は、上記の発明において、前記ダミー情報生成手段は、前記識別情報、前記宛先情報および前記ダミーデータにダミーであることを示す情報を付加して前記ダミー情報を生成することを特徴とする。
また、請求項4に係る発明は、二重化された各装置を配置して構成される各システムボードに接続され、各システムボードから送信される同期されたデータの転送を制御するデータ中継装置であって、前記二重化を構成する片系および他方の片系ごとに前記各システムボードから送信される信号に基づいて、片系ごとに縮退を確認する縮退判断手段と、前記縮退判断手段により縮退しているものと判断された片系と二重化を構成する他方の片系から、前記システムボードからのデータリクエストに応じて送信される正規のデータの先頭を示す識別情報および当該データの宛先を示す宛先情報に、ダミーデータを付加したダミー情報を生成するダミー情報生成手段と、前記縮退判断手段により縮退しているものと判断された片系と二重化を構成する他方の片系から前記データリクエストに応じて送信された正規の情報、および前記ダミー情報生成手段により生成された前記ダミー情報を同期させたデータとして送信するデータ送信手段と、を備えたことを特徴とする。
また、請求項5に係る発明は、上記の発明において、前記ダミー情報生成手段は、誤り検出符号による復号結果からダミーであると認識されるポイゾニングデータを前記ダミーデータとして採用し、前記識別情報および前記宛先情報に、当該ポイゾニングデータを付加してダミー情報を生成することを特徴とする。
また、請求項6に係る発明は、上記の発明において、前記ダミー情報生成手段は、前記識別情報、前記宛先情報および前記ダミーデータにダミーであることを示す情報を付加して前記ダミー情報を生成することを特徴とする。
また、請求項7に係る発明は、二重化された各装置を配置して構成される各システムボードをデータ中継装置により接続し、当該データ中継装置を介して同期させたデータのやり取りを制御するコンピュータシステム制御方法であって、前記二重化を構成する片系および他方の片系ごとに前記各システムボードから送信される信号に基づいて、当該片系ごとに縮退を確認する縮退確認工程と、前記縮退確認工程により縮退しているものと判断された片系と二重化を構成する他方の片系から、前記システムボードからのデータリクエストに応じて送信される正規のデータの先頭を示す識別情報および当該データの宛先を示す宛先情報に、ダミーデータを付加したダミー情報を生成するダミー情報生成工程と、前記縮退確認工程により縮退しているものと判断された片系と二重化を構成する他方の片系から前記データリクエストに応じて送信された正規の情報、および前記ダミー情報生成工程により生成された前記ダミー情報を同期させたデータとして送信するデータ送信手段と、を含んだことを特徴とする。
また、請求項8に係る発明は、上記の発明において、前記ダミー情報生成工程は、誤り検出符号による復号結果からダミーであると認識されるポイゾニングデータを前記ダミーデータとして採用し、前記識別情報および前記宛先情報に、当該ポイゾニングデータを付加してダミー情報を生成することを特徴とする。
また、請求項9に係る発明は、上記の発明において、前記ダミー情報生成工程は、前記識別情報、前記宛先情報および前記ダミーデータにダミーであることを示す情報を付加して前記ダミー情報を生成することを特徴とする。
本発明によれば、システムボードにおいて、二重化を構成する片系および他方の片系ごとに各システムボードから送信される信号に基づいて片系ごとに縮退しているか否か判断し(例えば、システムボードの各片系から送信される縮退していないことを示す信号を常に監視することにより縮退を判断し)、縮退しているものと判断された片系と二重化を構成する他方の片系(縮退していない他方の片系)から、システムボードからのデータリクエストに応じて送信される正規のデータ(データリクエストに対応するデータ)の先頭を示す識別情報(データパケットの先頭を示す情報)、および、この正規のデータの宛先を示す宛先情報(データの宛先であるシステムボードを示す情報)に、ダミーデータ(正規のデータではないデータ)を付加したダミー情報を生成して、縮退しているものと判断された片系と二重化を構成する他方の片系から送信される正規の情報とともに、生成されたダミー情報をデータリクエストに応じて送信するので、故障が発生していないシステムボードについて縮退する必要がない。このため、装置故障などが発生しておらず、二重化を構成する片系が縮退されていないシステムボード間では、引き続きデータの二重化が継続されるので、システムの可用性を向上させることが可能である。
また、本発明によれば、誤り訂正符号による復号結果からダミーであると認識されるポイゾニングデータ(コレクタブルエラーあるいはアンコレクタブルエラーとして検出されず、かつ正規のデータともならないデータ)をダミーデータとして採用し、識別情報と前記宛先情報とポイゾニングデータとからなるダミー情報を生成するので、例えば、ECC(Error Correcting Code)などを誤り訂正符号として採用するコンピュータシステムでは、従来の構成を生かしつつダミーデータを生成して同期動作を継続させることができ、効率的にシステムの可用性を向上させることが可能である。
また、本発明によれば、識別情報、宛先情報およびダミーデータにダミーであることを示す情報を付加して(例えば、ダミーであることを示す情報をデータパケットのヘッダ部分に1ビット付加するなどして)ダミー情報を生成するので、ポイゾニングデータを作成、および確認する機能を備えていない場合であっても、簡易な構成でダミー情報を生成することができ、システムの可用性を向上させることが可能である。
図1は、実施例1に係るコンピュータシステムの概要および特徴を説明するための図である。 図2は、実施例1に係るコンピュータシステムの構成を示すブロック図である。 図3は、実施例1に係るデータパケットの構成例を示す図である。 図4は、実施例1に係るデータクロスバの構成を示すブロック図である。 図5は、実施例1に係るデータクロスバのINポート部の構成を示すブロック図である。 図6は、実施例1に係るデータクロスバのINポート部の処理の流れを示すフローチャートである。 図7は、従来技術を説明するための図である。 図8は、従来技術を説明するための図である。
符号の説明
10 システムボード
11 メモリ
12 メモリコントローラ
13 システムコントローラ
20 データクロスバ
21 INポート
21a データパケット送信制御回路
21b ダミーデータパケット生成回路
21c パケットヘッダ検出回路
22 OUTポート
23 クロスバースイッチ
30 信号バス
40 データバス
50 ダミーデータ作成情報通知バス
以下に添付図面を参照して、この発明に係るコンピュータシステム、データ中継装置およびコンピュータシステム制御方法の実施例を詳細に説明する。なお、以下では、実施例1に係るコンピュータシステムを実施例1として説明した後に、この発明に含まれる他の実施例を説明する。
以下の実施例1では、実施例1に係るコンピュータシステムの概要および特徴、コンピュータシステムの構成および処理を順に説明し、最後に実施例1による効果を説明する。
[コンピュータシステムの概要および特徴(実施例1)]
まず最初に、図1を用いて、実施例1に係るコンピュータシステムの概要および特徴を説明する。図1は、実施例1に係るコンピュータシステムの概要および特徴を説明するための図である。
実施例1に係るコンピュータシステムは、2重化された各装置を配置して構成される各システムボードをデータ中継装置により接続し、データ中継装置を介して同期させたデータのやり取りを行うことを概要とするが、故障が発生していないシステムボードについて縮退する必要がなく、同期動作を継続させることができ、システムの可用性を向上させることが可能である点に主たる特徴がある。
この主たる特徴について具体的に説明すると、図1に例示するように、実施例1に係るコンピュータシステムは、メモリやメモリコントローラなどの各装置を2重化したミラーAおよびミラーBで構成される各システムボード(システムボード#0〜#2)をデータ中継装置として機能するデータクロスバで接続して構成される。
また、データクロスバは、各システムボードのミラーAから受信したデータを転送するミラーAと、各システムボードのミラーBから受信したデータを転送するミラーBとから構成される。
また、各システムボード上のミラーAおよびミラーBは、縮退されていないことを示す非縮退信号(例えば、ALIVEを示す信号)を通知するための信号バス、およびデータの送受信を行うためのデータバスでデータクロスバのミラーAおよびミラーBとそれぞれ接続される一方で、各システムボード上のミラーAおよびミラーBは、ダミーデータを作成するためのダミーデータ作成情報を通知するためのダミーデータ作成情報通知バスでデータクロスバのミラーBおよびミラーAとそれぞれ接続される。
ここで、故障の発生などを原因として、システムボード#0のミラーAが縮退されている場合を例に挙げて説明する。
コンピュータシステムを構成するシステムボード#0のミラーBは、システムボード#1からのデータリクエストに応じて、リクエストに対応するデータのデータパケット、およびダミーデータ作成情報を送信する。具体的には、システムボード#0のミラーBは、データバスを介してリクエストに対応するデータのデータパケットの先頭を示す識別情報(例えば、「DATA_VALID」)、データパケットの送信先のシステムボードを示す宛先情報(例えば、「DIST_BORAD_ID」)およびデータ本体からなるデータパケットをデータクロスバのミラーBに送信する。
これと同時に、システムボード#0のミラーBは、ダミーデータ作成情報として、リクエストに対応するデータパケットの先頭を示す識別情報(例えば、「OTHER_DATA_VALID」)、およびデータパケットの送信先のシステムボードを示す宛先情報(例えば、「OTHER_DIST_BORAD_ID」)をデータクロスバのミラーAにダミーデータ作成情報通知バスを介して送信する。
そして、データクロスバは、システムボード#0から通知される非縮退信号に基づいて、自己が接続されているシステムボード#0のミラーが縮退していないものと判断している場合には、システムボード#0から受信したデータパケットを送信するように制御する一方で、システムボード#0から通知される非縮退信号に基づいて、自己が接続されているミラーが縮退しているものと判断している場合には、生成したダミー情報をデータパケットとして送信するように制御する。
具体的には、システムボード#0のミラーAが縮退されている場合を例に挙げると、データクロスバのミラーBは、自己が接続されているシステムボード#0のミラーBからの非縮退信号を確認できる場合には、自己が接続されているシステムボード#0のミラーBは縮退していないものと判断して、自己が接続されているシステムボード#0のミラーBから受信したデータパケットに含まれる宛先情報に基づいて宛先であるシステムボードを決定して、データパケットを送信する。
一方、データクロスバのミラーAは、システムボード#0のミラーBから受信したダミーデータ作成情報を用いてダミー情報を生成する。具体的には、システムボード#0のミラーBから受信したダミーデータ作成情報に、ダミーデータとして採用するポイゾニングデータ(コレクタブルエラーあるいはアンコレクタブルエラーとして検出されず、かつ正規のデータともならないデータ)を付加したダミー情報を生成する。そして、データクロスバのミラーAは、システムボード#0のミラーAからの非縮退信号を確認できない場合には、ミラーAは縮退しているものと判断して、生成したダミー情報に含まれる宛先情報に基づいて宛先であるシステムボードを決定し、ダミー情報をデータパケットとして送信する。
すなわち、データクロスバは、システムボード#0のミラーBから受信されるデータパケットと、縮退を原因として、システムボード#0のミラーAから受信されないデータパケットの代わりとして、ミラーBから受信したダミーデータ作成情報に基づいて生成したダミー情報からなるデータパケットとを、宛先として決定したシステムボード(例えば、システムボート#1)へ同期させて送信する。
このようなことから、上述してきたように、実施例1によれば、ミラーAとミラーBの同期動作を継続させることができ、故障が発生していないシステムボードについて縮退する必要がなく、二重化が継続されるため、システムの可用性を向上させることが可能である。
[コンピュータシステムの構成(実施例1)]
次に、図2を用いて、実施例1に係るコンピュータシステムの構成を説明する。図2は、実施例1に係るコンピュータシステムの構成を示すブロック図である。
同図に示すように、実施例1に係るコンピュータシステムは、メモリ11、メモリコントローラ12およびシステムコントローラ13などの各装置を2重化したミラーAおよびミラーBで構成される各システムボード10(システムボード#0〜#2)を、各システムボード10のミラーAから受信したデータを転送するミラーAと、各システムボード10のミラーBから受信したデータを転送するミラーBとから構成されるデータクロスバ20で接続して構成される。
また、実施例1に係るコンピュータシステムは、各システムボード10上のミラーAおよびミラーBがそれぞれ縮退されていないことを示す非縮退信号(例えば、ALIVEを示す信号)を通知するための信号バス30と、各システムボード10上のミラーAおよびミラーBがそれぞれデータの送受信を行うためのデータバス40と、各システムボード10上のミラーAおよびミラーBがそれぞれダミーデータを作成するためのダミーデータ作成情報を通知するためのダミーデータ作成情報通知バス50とを備える。
そして、実施例1に係るコンピュータシステムは、各システムボード10上のミラーAとデータクロスバ20のミラーA、および各システムボード10上のミラーBとデータクロスバ20のミラーBを信号バス30およびデータバス40を介して接続する。一方、各システムボード10上のミラーAとデータクロスバ20のミラーB、および各システムボード10上のミラーBとデータクロスバ20のミラーAをダミーデータ作成情報通知バス50を介して接続する。
システムボード10は、メモリ11、メモリコントローラ12やシステムコントローラ13、図示を省略したCPUなどの各装置を配置して構成され、各種情報処理を制御するボードである。メモリ11は、各種情報処理に必要なデータおよびプログラムを記憶する記憶部である。
メモリコントローラ12は、メモリ11へのアクセスを制御する装置であり、システムボード10とデータクロスバ20とのI/Oポートとしての機能も備える。また、メモリコントローラ12は、システムボード#1からのデータリクエストに応じて、リクエストに対応するデータのデータパケット、およびダミーデータ作成情報を送信する。
具体的には、各システムボード(例えば、システムボード#0)に配置されているメモリコントローラ12は、自己が備えるメモリ11で管理するデータについてリクエストを受け付けた場合には、データバス40を介してリクエストに対応するデータのデータパケットの先頭を示す識別情報(例えば、「DATA_VALID」)、およびデータパケットの送信先のシステムボードを示す宛先情報(例えば、「DIST_BORAD_ID」)をデータクロスバ20の対応ミラー(例えば、システムボード#0のミラーAであれば、データクロスバ20のミラーA)に送信する。
これと同時に、ダミーデータ作成情報として、リクエストに対応するデータパケットの先頭を示す識別情報(例えば、「OTHER_DATA_VALID」)、およびデータパケットの送信先のシステムボードを示す宛先情報(例えば、「OTHER_DIST_BORAD_ID」)をデータクロスバ20の対応ミラーと2重化を構成するもう一方のミラー(例えば、例えば、システムボード#0のミラーAであれば、データクロスバ20のミラーB)にダミーデータ作成情報通知バス50を介して送信する。
システムコントローラ13は、メモリ11等へのデータ転送などの各種情報処理に関してシステム全体を制御する装置であり、誤り訂正符号としてECC(Error Correcting Code)を採用する。
データクロスバ20は、システムボード10間でやり取りするデータパケットの転送を行う中継装置である。このデータパケットの構成について簡単に説明すると、図3に例示するように、データパケットの情報を示すパケットヘッダと複数のデータ部(例えば、データ部1〜データ部n)から構成されるデータ本体とで構成され、パケットヘッダは、データパケットの先頭を示す識別情報(例えば、「DATA_VALID」若しくは「OTHER_DATA_VALID」)、データパケットの送信先のシステムボードを示す宛先情報(例えば、「DIST_BORAD_ID」若しくは「OTHER_DIST_BORAD_ID」)、および必要な制御情報から構成される。
また、図4および図5を用いて、データクロスバ20の構成を詳細に説明する。図4は、実施例1に係るデータクロスバの構成を示すブロック図である。図5は、実施例1に係るデータクロスバのINポート部の構成を示すブロック図である。
図4に示すように、データクロスバ20は、各システムボード10の出力データバスに接続されるINポート21と、各システムボードの入力データバスに接続されるOUTポート22と、INポート21とOUTポート22とを相互に接続するクロスバースイッチ23とで構成される。また、クロスバースイッチ23は、後に詳述するINポート21から受け付けたデータパケット、またはダミー情報からなるデータパケットを同期させてOUTポート22へ送信する。
図5に示すように、データクロスバ20のINポート21は、データパケット送信制御回路21aと、ダミーデータパケット生成回路21bと、パケットヘッダ検出回路21cとで構成される。
データパケット送信制御回路21aは、システムボード10から通知される非縮退信号に基づいて、自己が接続されているシステムボード10のミラーが縮退していないものと判断している場合には、システムボード10から受信したデータパケットを送信するように制御する一方で、システムボード10から通知される非縮退信号に基づいて、自己が接続されているシステムボード10のミラーが縮退しているものと判断している場合には、生成したダミー情報をデータパケットとして送信するように制御する制御回路である。
具体的には、システムボード#0のミラーAが縮退されている場合を例に挙げると、データクロスバ20のミラーBを構成するデータパケット送信制御回路21aは、自己が接続されているシステムボード#0のミラーBから非縮退信号(例えば、ALIVE信号)が通知されているか否か常時監視して、自己が接続されているシステムボード#0のミラーBからの非縮退信号を確認できる場合(例えば、信号通知が「ON」である場合)には、自己が接続されているシステムボード#0のミラーBは縮退していないものと判断して、システムボード#0からデータバス40を介して、データパケットの先頭を示す識別情報(例えば、「DATA_VALID」)を受信すると、そのデータパケットにさらに含まれる宛先情報(例えば、「DIST_BORAD_ID」)に基づいて宛先であるシステムボードを決定して、受信したデータパケットをクロスバースイッチ23に送信するように制御する。
一方、データクロスバ20のミラーAを構成するデータパケット送信制御回路21aは、自己が接続されているシステムボード#0のミラーAから非縮退信号(例えば、ALIVE信号)が通知されているか否か常時監視して、自己が接続されているシステムボード#0のミラーAからの非縮退信号を確認できない場合(例えば、信号通知が「ON」ではない場合)には、自己が接続されているシステムボード#0のミラーAは縮退しているものと判断して、システムボード#0からダミーデータ作成情報通知バス50を介して、データパケット先頭を示す識別情報(例えば、「OTHER_DATA_VALID」)を含んだダミーデータ作成情報を受信すると、そのダミーデータ作成情報にさらに含まれる宛先情報(例えば、「OTHER_DIST_BORAD_ID」)に基づいて決定した宛先となるシステムボードに対して、後述するダミーデータパケット生成回路21bにより生成されたダミー情報をデータパケットとしてクロスバースイッチ23に送信するように制御する。
ここで、データパケット送信制御回路21aは、自己が接続されているシステムボード10のミラー(例えば、ミラーA)から送信されたデータパケットの先頭を示す識別情報(例えば、「DATA_VALID」)を後述するパケットヘッダ検出回路21cから受信し、自己が接続されているシステムボード10のミラーと2重化を構成するミラー(例えば、ミラーB)から、ダミーデータ作成情報通知バス50を介して送信されたダミーデータ作成情報に含まれるデータパケットの先頭を示す識別情報(例えば、「OTHER_DATA_VALID」)を受信する。
ダミーデータパケット生成回路21bは、ダミーデータ作成情報通知バス50を介して受信したダミーデータ作成情報を用いてダミー情報を生成する回路である。具体的には、自己が接続されているシステムボード10(例えば、システムボード#0)のミラー(例えば、ミラーA)と2重化を構成するミラー(例えば、ミラーB)から、パケット先頭を示す識別情報(例えば、「OTHER_DATA_VALID」)およびパケットの送信先を示す宛先情報(例えば、「OTHER_DIST_BORAD_ID」)からなるダミーデータ作成情報を受信すると、このダミーデータ作成情報にダミーデータとしてデータ本体に採用するポイゾニングデータ(コレクタブルエラーあるいはアンコレクタブルエラーとして検出されず、かつ正規のデータともならないデータ)を付加してダミー情報を生成する。
パケットヘッダ検出回路21cは、システムボード10から受信したデータパケットのパケットヘッダを検出する検出回路であり、検出したパケットヘッダをデータパケット送信制御回路21aに送信する。
すなわち、データクロスバ20は、自己が接続されているシステムボード10のミラーから非縮退信号が確認でき、ミラーが縮退していないものと判断している場合には、受信したデータパケットに含まれるデータパケットの先頭を示す識別情報(例えば、「DATA_VALID」)が有効になったタイミング(例えば、クロスバースイッチ23のキューバッファがデータ受信を許容するタイミング)で、自己が接続されているミラーから受信するデータパケットを宛先であるシステムボート10に送信する一方で、自己が接続されているシステムボード10のミラーから非縮退信号が確認できず、ミラーが縮退しているものと判断している場合には、受信したダミーデータ作成情報に含まれるデータパケットの先頭を示す識別情報(例えば、「OTHER_DATA_VALID」)が有効になったタイミングで、生成したダミー情報をデータパケットとして宛先であるシステムボート10に送信する。
[コンピュータシステムの処理(実施例1)]
続いて、図6を用いて、実施例1に係るコンピュータシステムを構成するデータクロスバのINポート部の処理を説明する。図6は、実施例1に係るデータクロスバのINポート部の処理の流れを示すフローチャートである。
同図に示すように、データパケット送信制御回路21aは、自己が接続されているシステムボート10のミラーから通知される非縮退信号(例えば、ALIVE信号)を常時監視して、非縮退信号が通知されているか(例えば、信号通知が「ON」であるか)否かを確認する(ステップS601)。
確認の結果、非縮退信号を確認できる場合(例えば、信号通知が「ON」である場合)には(ステップS601肯定)、データパケット送信制御回路21aは、自己が接続されているシステムボード10のミラーは縮退されていないものと判断する。そして、自己が接続されているミラーは縮退されていないものと判断している場合には、受信したデータパケット(ステップS602)に含まれるデータパケットの先頭を示す識別情報(例えば、「DATA_VALID」)を受信すると、データパケットに含まれる宛先情報(例えば、「DIST_BORAD_ID」)に基づいて宛先であるシステムボードを決定して(ステップS603)、受信したデータパケットをクロスバースイッチ23に送信する(ステップS604)。
一方、確認の結果、非縮退信号を確認できない場合(例えば、信号通知が「ON」ではない場合)には(ステップS601否定)、データパケット送信制御回路21aは、自己が接続されているシステムボートのミラーは縮退されているものと判断する。
また、ダミーデータパケット生成回路21bは、ダミーデータ作成情報通知バス50を介して受信したダミーデータ作成情報を用いてダミー情報を生成する(ステップS605)。具体的には、システムボード10(例えば、システムボード#0)において、自己が接続されているシステムボート10のミラー(例えば、ミラーA)と2重化を構成するミラー(例えば、ミラーB)から、パケット先頭を示す識別情報(例えば、「OTHER_DATA_VALID」)およびパケットの送信先を示す宛先情報(例えば、「OTHER_DIST_BORAD_ID」)からなるダミーデータ作成情報を受信すると、このダミーデータ作成情報にダミーデータとしてデータ本体に採用するポイゾニングデータ(コレクタブルエラーあるいはアンコレクタブルエラーとして検出されず、かつ正規のデータともならないデータ)を付加してダミー情報を生成する。
そして、自己が接続されているシステムボートのミラーは縮退されているものと判断している場合(ステップS601否定の場合)において、データパケット送信制御回路21aは、システムボード#0からダミーデータ作成情報通知バス50を介して、データパケット先頭を示す識別情報(例えば、「OTHER_DATA_VALID」)を含んだダミーデータ作成情報を受信すると、そのダミーデータ作成情報にさらに含まれる宛先情報(例えば、「OTHER_DIST_BORAD_ID」)に基づいて宛先であるシステムボードを決定し(ステップS603)、決定した宛先となるシステムボードに対して、ダミーデータパケット生成回路21bにより生成されたダミー情報をデータパケットとしてクロスバースイッチ23に送信する(ステップS604)。
[実施例1の効果]
上述してきたように、実施例1によれば、システムボード10において、二重化を構成する片系(例えば、ミラーA)および他方の片系(例えば、ミラーB)ごとに各システムボード10から送信される信号に基づいて片系ごとに縮退しているか否か判断し(例えば、システムボードの各片系から送信される縮退していないことを示す信号を常に監視することにより縮退を判断し)、縮退しているものと判断された片系と二重化を構成する他方の片系(縮退していない他方の片系)から、システムボード10からのデータリクエストに応じて送信される正規のデータ(データリクエストに対応するデータ)の先頭を示す識別情報(データパケットの先頭を示す情報)、および、この正規のデータの宛先を示す宛先情報(データの宛先であるシステムボードを示す情報)に、ダミーデータ(正規のデータではないデータ)を付加したダミー情報を生成して、縮退しているものと判断された片系と二重化を構成する他方の片系から送信される正規の情報とともに、生成されたダミー情報をデータリクエストに応じて送信するので、故障が発生していないシステムボードについて縮退する必要がない。このため、装置故障などが発生しておらず、二重化を構成する片系が縮退されていないシステムボード間では、引き続きデータの二重化が継続されるので、システムの可用性を向上させることが可能である。
また、誤り検出符号による復号結果からダミーであると認識されるポイゾニングデータ(コレクタブルエラーあるいはアンコレクタブルエラーとして検出されず、かつ正規のデータともならないデータ)をダミーデータとして採用し、識別情報と前記宛先情報とポイゾニングデータとからなるダミー情報を生成するので、例えば、ECC(Error Correcting Code)などを誤り検出符号として採用するコンピュータシステムでは、従来の構成を生かしつつダミーデータを生成して同期動作を継続させることができ、効率的にシステムの可用性を向上させることが可能である。
さて、これまで本発明の実施例1について説明したが、本発明は上述した実施例1以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下では、本発明に含まれる他の実施例を説明する。
(1)ダミーであることを示す情報を付加してダミー情報を生成
上記の実施例1では、ダミーデータパケット生成回路21bが、ダミーデータ作成情報およびデータ本体に採用するポイゾニングデータを用いてダミー情報を生成する場合を説明したが、本発明はこれに限定されるものではなく、パケット先頭を示す識別情報、パケットの送信先を示す宛先情報およびデータ本体となるダミーデータに、ダミーであることを示す情報(例えば、ダミーであることを示す情報をデータパケットのヘッダ部分に1ビット付加するなどして)を付加してダミー情報を生成するようにしてもよい。
このようなことから、ポイゾニングデータを作成、および確認する機能を備えていない場合であっても、簡易な構成でダミー情報を生成することができ、システムの可用性を向上させることが可能である。
(2)装置構成等
また、図5に示した実施例1に係るデータクロスバ20のINポート21の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、INポート21の分散・統合の具体的形態は図示のものに限られず、例えば、データパケット送信制御回路21aおよびパケットヘッダ検出回路21cを統合するなど、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
さらに、データクロスバ20が実現する各処理機能(データパケット送信制御機能、ダミーデータパケット生成機能およびパケットヘッダ検出機能、図6等参照)は、データクロスバ20が実現する場合に限られるものではなく、例えば、各システムボード10に配置された各メモリコントローラ12に所定の回路等を備えて、縮退していないメモリコントローラ12において生成したダミー情報をデータパケットとしてデータクロスバ20へ送信することで、各種機能を実現するようにしてもよい。
以上のように、本発明に係るコンピュータシステム、データ中継装置およびコンピュータシステム制御方法は、二重化された各装置を配置して構成される各システムボードをデータ中継装置により接続し、当該データ中継装置を介して同期させたデータのやり取りを行う場合に有用であり、特に、故障が発生していないシステムボードについて縮退する必要がなく、システムの可用性を向上させることに適する。

Claims (9)

  1. 二重化された各装置を配置して構成される各システムボードをデータ中継装置により接続し、当該データ中継装置を介して同期させたデータのやり取りを行うコンピュータシステムであって、
    前記二重化を構成する片系および他方の片系ごとに前記各システムボードから送信される信号に基づいて、当該片系ごとに縮退しているか否か判断する縮退判断手段と、
    前記縮退判断手段により縮退しているものと判断された片系と二重化を構成する他方の片系から、前記システムボードからのデータリクエストに応じて送信される正規のデータの先頭を示す識別情報および当該データの宛先を示す宛先情報に、ダミーデータを付加したダミー情報を生成するダミー情報生成手段と、
    前記縮退判断手段により縮退しているものと判断された片系と二重化を構成する他方の片系から前記データリクエストに応じて送信された正規の情報、および前記ダミー情報生成手段により生成された前記ダミー情報を同期させたデータとして送信するデータ送信手段と、
    を備えたことを特徴とするコンピュータシステム。
  2. 前記ダミー情報生成手段は、誤り検出符号による復号結果からダミーであると認識されるポイゾニングデータを前記ダミーデータとして採用し、前記識別情報および前記宛先情報に、当該ポイゾニングデータを付加してダミー情報を生成することを特徴とする請求項1に記載のコンピュータシステム。
  3. 前記ダミー情報生成手段は、前記識別情報、前記宛先情報および前記ダミーデータにダミーであることを示す情報を付加して前記ダミー情報を生成することを特徴とする請求項1に記載のコンピュータシステム。
  4. 二重化された各装置を配置して構成される各システムボードに接続され、各システムボードから送信される同期されたデータの転送を制御するデータ中継装置であって、
    前記二重化を構成する片系および他方の片系ごとに前記各システムボードから送信される信号に基づいて、片系ごとに縮退しているか否か判断する縮退判断手段と、
    前記縮退判断手段により縮退しているものと判断された片系と二重化を構成する他方の片系から、前記システムボードからのデータリクエストに応じて送信される正規のデータの先頭を示す識別情報および当該データの宛先を示す宛先情報に、ダミーデータを付加したダミー情報を生成するダミー情報生成手段と、
    前記縮退判断手段により縮退しているものと判断された片系と二重化を構成する他方の片系から前記データリクエストに応じて送信された正規の情報、および前記ダミー情報生成手段により生成された前記ダミー情報を同期させたデータとして送信するデータ送信手段と、
    を備えたことを特徴とするデータ中継装置。
  5. 前記ダミー情報生成手段は、誤り検出符号による復号結果からダミーであると認識されるポイゾニングデータを前記ダミーデータとして採用し、前記識別情報および前記宛先情報に、当該ポイゾニングデータを付加してダミー情報を生成することを特徴とする請求項4に記載のデータ中継装置。
  6. 前記ダミー情報生成手段は、前記識別情報、前記宛先情報および前記ダミーデータにダミーであることを示す情報を付加して前記ダミー情報を生成することを特徴とする請求項4に記載のデータ中継装置。
  7. 二重化された各装置を配置して構成される各システムボードをデータ中継装置により接続し、当該データ中継装置を介して同期させたデータのやり取りを制御するコンピュータシステム制御方法であって、
    前記二重化を構成する片系および他方の片系ごとに前記各システムボードから送信される信号に基づいて、当該片系ごとに縮退しているか否か判断する縮退判断工程と、
    前記縮退判断工程により縮退しているものと判断された片系と二重化を構成する他方の片系から、前記システムボードからのデータリクエストに応じて送信される正規のデータの先頭を示す識別情報および当該データの宛先を示す宛先情報に、ダミーデータを付加したダミー情報を生成するダミー情報生成工程と、
    前記縮退確認工程により縮退しているものと判断された片系と二重化を構成する他方の片系から前記データリクエストに応じて送信された正規の情報、および前記ダミー情報生成工程により生成された前記ダミー情報を同期させたデータとして送信するデータ送信手段と、
    を含んだことを特徴とするコンピュータシステム制御方法。
  8. 前記ダミー情報生成工程は、誤り検出符号による復号結果からダミーであると認識されるポイゾニングデータを前記ダミーデータとして採用し、前記識別情報および前記宛先情報に、当該ポイゾニングデータを付加してダミー情報を生成することを特徴とする請求項7に記載のコンピュータシステム制御方法。
  9. 前記ダミー情報生成工程は、前記識別情報、前記宛先情報および前記ダミーデータにダミーであることを示す情報を付加して前記ダミー情報を生成することを特徴とする請求項7に記載のコンピュータシステム制御方法。
JP2008540870A 2006-10-27 2006-10-27 コンピュータシステム、データ中継装置およびコンピュータシステム制御方法 Withdrawn JPWO2008050456A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/321567 WO2008050456A1 (fr) 2006-10-27 2006-10-27 Système informatique, dispositif de relais de données, et procédé de commande de système informatique

Publications (1)

Publication Number Publication Date
JPWO2008050456A1 true JPWO2008050456A1 (ja) 2010-02-25

Family

ID=39324269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008540870A Withdrawn JPWO2008050456A1 (ja) 2006-10-27 2006-10-27 コンピュータシステム、データ中継装置およびコンピュータシステム制御方法

Country Status (3)

Country Link
US (1) US20090210610A1 (ja)
JP (1) JPWO2008050456A1 (ja)
WO (1) WO2008050456A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2007096987A1 (ja) * 2006-02-24 2009-07-09 富士通株式会社 エラー制御装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5897764A (ja) * 1981-12-04 1983-06-10 Hitachi Ltd 多重化演算処理システムの制御方式
JPH05284166A (ja) * 1992-04-03 1993-10-29 Daikin Ind Ltd 情報伝送装置
JPH0836551A (ja) * 1994-07-21 1996-02-06 Hitachi Ltd 並列プロセッサ
US20030217211A1 (en) * 2002-05-14 2003-11-20 Rust Robert A. Controller communications over an always-on controller interconnect

Also Published As

Publication number Publication date
US20090210610A1 (en) 2009-08-20
WO2008050456A1 (fr) 2008-05-02

Similar Documents

Publication Publication Date Title
US7944818B2 (en) High-availability communication system
US7821919B2 (en) Data processing apparatus and data processing method
JP5593530B2 (ja) フォールトトレラントなタイムトリガ方式のリアルタイム通信のための方法および装置
WO2007148462A1 (ja) 制御装置
US20150171893A1 (en) Reliable, Low Latency Hardware And Software Inter-Process Communication Channel For Safety Critical System
JP5772911B2 (ja) フォールトトレラントシステム
JP2006209593A (ja) 情報処理装置および情報処理方法
US9497099B2 (en) Voting architecture for safety and mission critical systems
JP2006178615A (ja) フォールトトレラントシステム、これで用いる制御装置、アクセス制御方法、及び制御プログラム
JP5154648B2 (ja) ネットワークにおいて、分散型方式からマスタ/スレーブ型方式へ切換える方法。
JP2008046996A (ja) データ処理装置、モード管理装置、及びモード管理方法
JP2008146236A (ja) 二重化制御装置、及びその制御権設定信号の冗長化方法
JP2009075719A (ja) 冗長構成装置及びその自己診断方法
JPWO2008050456A1 (ja) コンピュータシステム、データ中継装置およびコンピュータシステム制御方法
CN114326364B (zh) 用于高可用性工业控制器中的安全连接的系统和方法
EP1988469B1 (en) Error control device
US8625585B2 (en) Switch apparatus
JP2004007930A (ja) 電力系統監視制御システムおよびプログラム
US8639967B2 (en) Controlling apparatus, method for controlling apparatus and information processing apparatus
JP6394727B1 (ja) 制御装置、制御方法、及び、フォールトトレラント装置
JP5145860B2 (ja) メモリ二重化システム及び情報処理装置
JP5604799B2 (ja) フォールトトレラントコンピュータ
JP5458863B2 (ja) データ伝送装置及びデータ伝送方法
JP2007142782A (ja) プロトコル変換装置とこれを用いた二重化データ伝送システム
JP4423402B2 (ja) 冗長構成を有する伝送装置

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20110826