JP7188895B2 - 通信システム - Google Patents

通信システム Download PDF

Info

Publication number
JP7188895B2
JP7188895B2 JP2018050469A JP2018050469A JP7188895B2 JP 7188895 B2 JP7188895 B2 JP 7188895B2 JP 2018050469 A JP2018050469 A JP 2018050469A JP 2018050469 A JP2018050469 A JP 2018050469A JP 7188895 B2 JP7188895 B2 JP 7188895B2
Authority
JP
Japan
Prior art keywords
data
error detection
unit
test
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018050469A
Other languages
English (en)
Other versions
JP2019165273A (ja
Inventor
和彦 渡邊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2018050469A priority Critical patent/JP7188895B2/ja
Publication of JP2019165273A publication Critical patent/JP2019165273A/ja
Application granted granted Critical
Publication of JP7188895B2 publication Critical patent/JP7188895B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Communication Control (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Description

本発明は、通信装置における故障を特定する技術に関する。
交通管制、金融、証券、医療等の基幹業務において使用されるサーバは、社会生活の基盤を担っており、高い信頼性と高い耐故障性とが求められる。又、企業の業務サーバにおいても故障によるサービスの停止が大きな営業的損失を招く恐れがある。このように、幅広い分野において、高信頼性サーバの需要が高まっている。
サーバのシリアルバスにおいてエラーが多発すると、サーバの性能が低下することがある。高速シリアルバスの規格であるPCI-Expressでは、コレクタブルエラーについてはハードウェア等によって自動的に回復処理が行われる。又、PCI-Expressでは、ノンフェイタルエラーについてはソフトウェア等によって自動的に回復処理が行われる。そのため、ユーザがこれらのエラーの多発に気づかない結果、サーバの性能低下が発生することがある。
サーバの性能低下を防止する技術の一例が、特許文献1に開示されている。特許文献1の画像形成装置は、ユーザ回路と、割り込みメイン回路とを含む。ユーザ回路は、カウンタ回路を含む。ユーザ回路は、コレクタブルエラー及びノンフェイタルエラーをカウンタ回路によってカウントする。割り込みメイン回路は、所定の回数のエラーが発生した場合に、割り込み通知を行う。上記構成の結果、特許文献1の画像形成装置では、割り込み通知によってユーザにパフォーマンスの低下を通知する。
特許文献1の技術では、PCI-Expressにおけるフェイタルエラー等の、ハードウェアに起因するエラーには対処できない。
一方、フォールトトレラント(FT)サーバは、CPU(Central Processing Unit)、メモリ、ハードディスク、及び電源等の大部分のハードウェアを冗長化し、何れかのハードウェアが故障してもサービスを継続できる。
特開2009-140246号公報
ところが、ハードウェアを冗長化したサーバであっても、ハードウェアにおいて故障が発生したために冗長性が失われた際に、故障したハードウェアの交換やシステムの再構成のために人手を必要とする。そのため、ハードウェアを冗長化したサーバであっても、冗長性を失った状態でシステムを稼動させなければならないことがある。冗長性を失った状態におけるサーバの稼動は、サーバがダウンする危険性を有するので、可能な限り避けられるべきである。
FTサーバでは、例えば、ハードウェアが二重化された、CPUサブシステムとIO(Input and Output)サブシステムとの間が高速なシリアルバスによって接続される。例えば、PCI-Expressでは、データの送受信におけるエラーの検出は、レシーバ側(受信側)で行われ、ドライバ側(送信側)では行われない。そのため、データの送受信においてエラーが検出された際に、ドライバ側とレシーバ側とのどちらが故障しているかを判別することができない。つまり、故障が疑われる(被疑)ハードウェアとして切り離されたサブシステムが実際には故障していないことがある。従って、PCI-Expressを利用するFTサーバでは、被疑サブシステムが交換されるまでの間、二重化されていない状態が不必要に継続する可能性がある。
一般的に、高速化されたシリアルデータ通信線では、負荷が信号品質に重大な影響を及ぼすため、ドライバとレシーバとの間は一対一で接続され、且つ差動信号が用いられる。そのため、ドライバに故障検出用の回路を別途接続できず、ドライバ側における物理的又は電気的な故障は、レシーバ側でしか検出されない。
本発明は、上記の課題に鑑みてなされたもので、データの送受信を行うハードウェアに故障が発生した場合に、送信側のハードウェアと受信側のハードウェアとの何れに故障が発生したのかを特定することを主たる目的とする。
本発明の一態様において、通信システムは、対向装置、及び対向装置に接続され、通常データ、テストデータ、及び制御データを表す信号を送信する送信部と、通常データ及び制御データを表す信号を受信する受信部と、受信機能に関する故障が発生した可能性があることを示す制御データを表す信号であるレシーバエラー検出通知信号を、受信部によって対向装置から受信した際に、送信部がテストデータを表す信号を入力することを実行させ、送信部に入力されたテストデータを表す信号に応じて送信部によって出力された出力信号が正常であるか否かを検証するループバックテストを実行するループバックテスト部とを含む通信装置を備える。
本発明の一態様において、通信装置は、対向装置に接続され、通常データ、テストデータ、及び制御データを表す信号を送信する送信部と、通常データ及び制御データを表す信号を受信する受信部と、受信機能に関する故障が発生した可能性があることを示すレシーバエラー検出通知信号を、受信部によって対向装置から受信した際に、送信部がテストデータを表す信号を入力することを実行させ、送信部に入力されたテストデータを表す信号に応じて送信部によって出力された出力信号が正常であるか否かを検証するループバックテストを実行するループバックテスト部とを備える。
本発明の一態様において、通信装置のテスト制御方法は、対向装置に接続され、通常データ、テストデータ、及び制御データを表す信号を送信する送信部と、通常データ及び制御データを表す信号を受信する受信部とを備えた通信装置のテスト制御方法であって、受信機能に関する故障が発生した可能性があることを示すレシーバエラー検出通知信号を、受信部によって対向装置から受信した際に、送信部がテストデータを表す信号を入力することを実行させ、送信部に入力されたテストデータを表す信号に応じて送信部によって出力された出力信号が正常であるか否かを検証するループバックテストを実行する。
本発明の一態様において、通信装置のテスト制御プログラムは、対向装置に接続され、通常データ、テストデータ、及び制御データを表す信号を送信する送信部と、通常データ及び制御データを表す信号を受信する受信部とを備えた通信装置が備えるコンピュータに、受信機能に関する故障が発生した可能性があることを示すレシーバエラー検出通知信号を、受信部によって対向装置から受信した際に、送信部がテストデータを表す信号を入力することを実行させ、送信部に入力されたテストデータを表す信号に応じて送信部によって出力された出力信号が正常であるか否かを検証するループバックテストを実行するループバックテスト処理を実行させる。
本発明によれば、データの送受信を行うハードウェアに故障が発生した場合に、送信側のハードウェアと受信側のハードウェアとの何れに故障が発生したのかを特定できるという効果がある。
本発明の第1の実施形態における通信システムの構成の一例を示すブロック図である。 本発明の第1の実施形態における通信システムの動作を示すフローチャートである。 本発明の第2の実施形態におけるFTサーバの構成の一例を示すブロック図である。 本発明の第2の実施形態におけるエラー検出部の構成の一例を示すブロック図である。 本発明の第2の実施形態におけるエラー検出部の動作を示すフローチャートである。 本発明の各実施形態における切替部を実現可能なハードウェア構成の一例を示すブロック図である。
以下、本発明の実施形態について、図面を参照して詳細に説明する。尚、全ての図面において、同等の構成要素には同じ符号を付し、適宜説明を省略する。
(第1の実施形態)
本発明の各実施形態の基本である、本発明の第1の実施形態について説明する。
本実施形態における構成について説明する。
図1は、本発明の第1の実施形態における通信システムの構成の一例を示すブロック図である。
本実施形態における通信システム305は、1対以上の、通信装置105と対向装置125との対を含む。
通信装置105は、対向装置125に接続される。通信装置105は、送信部250と、受信部270と、ループバックテスト部260とを含む。
送信部250は、通常データ、テストデータ、及び制御データを表す信号を送信する。
受信部270は、通常データ及び前記制御データを表す信号を受信する。
ループバックテスト部260は、レシーバエラー検出通知信号を、受信部270によって対向装置125から受信した際に、以下のループバックテストを実行する。ここで、レシーバエラー検出通知信号とは、受信機能に関する故障が発生した可能性があることを示す制御データを表す信号であることとする。
(i)ループバックテスト部260は、送信部250がテストデータを表す信号を入力することを実行させる(指示する)。
(ii)ループバックテスト部260は、送信部250に入力されたテストデータを表す信号に応じて送信部250によって出力された出力信号が、正常であるか否かを検証する。
本実施形態における動作について説明する。
図2は、本発明の第1の実施形態における通信システムの動作を示すフローチャートである。具体的には、図2は、対向装置125が受信におけるエラーを検出してから、通信装置105がループバックテストを実行するまでの動作を表す。尚、図2に示すフローチャート及び以下の説明は一例であり、適宜求める処理に応じて、処理順等を入れ替えたり、処理を戻したり、又は処理を繰り返したりしてもよい。
まず、対向装置125は、通信装置105からのデータ受信において、エラーを検出する(ステップS110)。
次に、対向装置125は、レシーバエラー検出通知信号を通信装置105へ送信する(ステップS120)。
続いて、通信装置105の受信部270は、対向装置125からレシーバエラー検出通知信号を受信する(ステップS130)。
続いて、通信装置105のループバックテスト部260は、通信装置105の送信部250に関するループバックテストを実行する(ステップS140)。
以上説明したように、本実施形態における通信システム305では、対向装置125は、通信装置105からのデータ受信において、エラーを検出すると(ステップS110)、レシーバエラー検出通知信号を通信装置105へ送信する(ステップS120)。そして、通信装置105は、対向装置125からレシーバエラー検出通知信号を受信すると(ステップS130)、通信装置105の送信部250に関するループバックテストを実行する(ステップS140)。そして、ループバックテストにおいてエラーが発生すれば、通信装置105の送信部250において故障が発生したことを特定でき、ループバックテストにおいてエラーが発生しなければ、対向装置125において故障が発生したことを特定できる。従って、本実施形態における通信システム305には、データの送受信を行うハードウェア(通信装置105の送信部250、又は対向装置125)に故障が発生した場合に、送信側のハードウェア(送信部250)と受信側のハードウェア(対向装置125)との何れに故障が発生したのかを特定できるという効果がある。
尚、本実施形態における通信システム305では、対向装置125は、レシーバエラー検出通知信号を通信装置105へ送信する際に、通常データを表す信号の受信を中止してもよい。そして、ループバックテスト部260は、レシーバエラー検出通知信号を受信した際に、送信部250に通常データを表す信号の送信を中止させてもよい。受信と送信との両方を中止させた場合には、通信システム305では、故障が発生した可能性がある、対向装置125における通常データを表す信号の受信と、送信部250における通常データを表す信号の送信に起因する、更なるエラーの発生を抑制できるという効果がある。
又、本実施形態における通信システム305では、ループバックテスト部260は、ループバックテストにおいて出力信号が正常である場合に、送信部250に通常データを表す信号の送信を再開させてもよい。この場合には、通信システム305には、故障していない送信部250が不必要に切り離されている時間を短縮できるという効果がある。
又、本実施形態における通信システム305では、ループバックテスト部260は、ループバックテストにおいて出力信号が正常でない場合に、送信部250において故障が発生したことを示す制御データを表す信号であるドライバエラー検出通知信号を対向装置125へ送信してもよい。そして、対向装置125は、ドライバエラー検出通知信号を受信した際に、故障が発生していない他の通信装置105から、通常データを表す信号の受信を再開してもよい。この場合には、通信システム305には、故障していない対向装置125が不必要に切り離されている時間を短縮できるという効果がある。
又、本実施形態における通信システム305では、ループバックテストにおいて出力信号が伝送されるループバック経路は、ループバックテストが行われていない場合に、送信部250から電気的に切断されていることが望ましい。この場合には、通信システム305には、ループバック経路が、通常データを表す信号の品質を低下させ難いという効果がある。
又、本実施形態における通信システム305では、ループバック経路は、ループバック経路における出力信号の信号品質の低下(信号における歪やノイズ等)が発生しないほど短いことが望ましい。この場合には、通信システム305には、送信部250における故障を誤検出し難いという効果がある。
(第2の実施形態)
次に、本発明の第1の実施形態を基本とする、本発明の第2の実施形態について説明する。本実施形態の通信システムは、各々が通信装置と対向装置との対であるエラー検出部を含む4つのサブシステムを含む、フォールトトレラント(FT)サーバである。又、本実施形態では、通信システムの構成及び動作についてより詳細に説明する。
本実施形態における構成について説明する。
図3は、本発明の第2の実施形態におけるFTサーバの構成の一例を示すブロック図である。
本実施形態におけるFTサーバ300は、ハードウェアが二重化されている。FTサーバ300は、第1系を構成する、CPUサブシステム100及びIOサブシステム110、並びに第2系を構成する、CPUサブシステム120及びIOサブシステム130を含む。CPUサブシステム100とIOサブシステム130との間、及びCPUサブシステム120とIOサブシステム110との間のそれぞれは、第1系と第2系との間(以下、「系間」と称す)の双方向データ転送用の高速シリアル通信経路140と、系間の制御に利用される低速通信用経路141との両方によって接続される。CPUサブシステム100とIOサブシステム110との間、及びCPUサブシステム120とIOサブシステム130との間のそれぞれは、第1系又は第2系内(以下、「系内」と称す)の双方向データ転送用の高速シリアル通信経路151又は152によって接続される。CPUサブシステム100、IOサブシステム110、CPUサブシステム120、及びIOサブシステム130のそれぞれを「サブシステム」と称することとする。
CPUサブシステム100は、主記憶101と、CPU102と、CPU側FT制御部103と、エラー検出部104とを含む。
IOサブシステム110は、IO側FT制御部111と、IOデバイス112と、エラー検出部104とを含む。
CPUサブシステム120は、主記憶101と、CPU102と、CPU側FT制御部103と、エラー検出部104とを含む。
主記憶101は、CPU102によってデータを読み書きされる。
CPU102は、CPUサブシステム100又は120の全体を管理する。
CPU側FT制御部103は、CPU102とIOデバイス112との間におけるデータの送受信を行う。又、CPU側FT制御部103は、IOサブシステム110とIOサブシステム130との間で、CPU102によって利用されるIOサブシステムの切替を行う。
IOサブシステム130は、IO側FT制御部111と、IOデバイス112と、エラー検出部104とを含む。
IO側FT制御部111は、CPUサブシステム100とCPUサブシステム120との間で、IO側FT制御部111が利用されるCPUサブシステムの切替を行う。
IOデバイス112は、CPUサブシステム100又はCPUサブシステム120によるIO命令を処理する。IOデバイス112は、例えば、ハードディスクドライブ、ディスプレイ、又はネットワークカードである。
CPUサブシステム100のエラー検出部104とIOサブシステム130のエラー検出部104との間、及びCPUサブシステム120のエラー検出部104とIOサブシステム110のエラー検出部104との間はそれぞれ、双方向データ転送用の高速シリアル通信経路140と系間の制御に利用される低速通信用経路141との両方によって接続される。
図4は、本発明の第2の実施形態におけるエラー検出部の構成の一例を示すブロック図である。
エラー検出部104は、データ送信側エラー検出部200と、データ受信側エラー検出部220とを含む。但し、図4の右端における、データ送信側エラー検出部200とデータ受信側エラー検出部220との間の接続関係(「外部接続」間を繋ぐ線)は、異なるサブシステム間の接続関係(図3における経路140、141等)を示している。即ち、図4において、外部接続は、対向するサブシステムとの接続を意味する。外部接続間を繋ぐ線は、本来、同じサブシステム内における接続関係ではない。信号の流れを説明する都合上、1つのサブシステムにおける1つのエラー検出部104を図示した図4を流用して、外部接続間を繋ぐ線も合わせて図示している。
データ送信側エラー検出部200は、エラー検出制御部202と、ドライバ209と、切断及び接続部203と、レシーバ208と、テストパタン送出部204と、データ送信切替部205と、テストパタン検出部206とを含む。
エラー検出制御部202は、データ受信側エラー検出部220から送信されたレシーバエラー検出通知信号201を受信し、受信したレシーバエラー検出通知信号201に基づいて、データ送信側におけるテスト(エラーチェック)を制御する。
ドライバ209は、入力に応じて、通常データ信号又はデストデータ信号を送信する。
切断及び接続部203は、通常時に通常データ信号と電気的に切断されており、エラーが検出された際の制御(エラー検出制御)時にレシーバ208に電気的に接続される。つまり、通常時に、切断及び接続部203に接続された信号路は、通常データ信号に影響を与えない。
レシーバ208は、切断及び接続部203によって切り替えられたテストデータ信号を受信する。
テストパタン送出部204は、ドライバ209へテストデータ信号を出力する。
データ送信切替部205は、テストデータ信号と通常データ信号とを切り替える。
テストパタン検出部206は、ドライバ209を経由した後に内部に戻されたテストデータ信号を検証し、ドライバエラー検出通知信号207を出力する。ここで、ドライバエラー検出通知信号207は、ドライバ209におけるエラー検出をデータ受信側へ通知するための信号である。
つまり、データ送信側エラー検出部200は、テストパタン送出部204と、データ送信切替部205と、ドライバ209と、切断及び接続部203と、レシーバ208と、テストパタン検出部206とによって、ドライバ209からテストパタン検出部206へのループバック経路を実現する。データ送信側エラー検出部200は、このループバック経路においてテストデータ信号におけるエラーの有無を検出すること(ループバックテスト)によって、ドライバ209における故障を検出する。尚、ループバック経路を構成する各要素は、テストデータ信号の品質が低下しないために十分なだけ経路が短くなるように、互いに近くに配置されることとする。
データ受信側エラー検出部220は、レシーバ223と、エラー検出制御部221とを含む。
レシーバ223は、データ送信側エラー検出部200から通常データ信号及びドライバエラー検出通知信号207を受信する。
エラー検出制御部221は、受信データにおけるエラーを検出した際に、レシーバエラー検出通知信号222を送信する。ここで、レシーバエラー検出通知信号222は、レシーバ223におけるエラー検出をデータ送信側へ通知するための信号である。
FTサーバ300の他の構成については、当業者に広く知られているので、ここでは詳述しない。
本実施形態における他の構成は、第1の実施形態における構成と同じである。即ち、エラー検出部104は、第1の実施形態における、通信装置105の機能と、対向装置125の機能とを含む。
本実施形態における動作について説明する。
データ受信側エラー検出部220が受信データエラーを検出した場合におけるエラー検出部104の動作の一例について説明する。
図5は、本発明の第2の実施形態におけるエラー検出部の動作を示すフローチャートである。尚、図5に示すフローチャート及び以下の説明は一例であり、適宜求める処理に応じて、処理順等を入れ替えたり、処理を戻したり、又は処理を繰り返したりしてもよい。
まず、エラー検出制御部221は、レシーバ223によって受信データにおけるエラーを検出する(ステップS210)。
次に、エラー検出制御部221は、レシーバエラー検出通知信号201をデータ送信側エラー検出部200へ送信し、通常データの受信を停止する(ステップS220)。
続いて、エラー検出制御部202は、レシーバエラー検出通知信号201を受信する(ステップS230)。
続いて、エラー検出制御部202は、切断及び接続部203に通常データ信号の外部接続を切断させ、切断及び接続部203にドライバ209の出力をレシーバ208へ接続させることによって、テストパタン検出部206へのループバックテストを可能にする(ステップS240)。
続いて、エラー検出制御部202は、データ送信切替部205に、通常データ信号の出力を、テストパタン送出部204からのテストデータ信号の出力へ切り替えさせる(ステップS250)。
続いて、エラー検出制御部202は、テストパタン送出部204に、テストデータ信号をドライバ209へ送信させる(ステップS260)。
続いて、エラー検出制御部202は、テストパタン検出部206に、ドライバ209を経由したテストデータ信号を検証させる(ステップS270)。
ドライバエラーが発生すれば(ステップS280におけるYes)、エラー検出制御部202は、ドライバエラー検出通知信号207をデータ受信側エラー検出部220へ送信させる(ステップS290)。
そして、エラー検出制御部221は、ドライバエラー検出通知信号207を受信すると、故障が発生していないデータ送信側エラー検出部200から、通常データ信号の受信を再開し(ステップS300)、処理を終了する。
一方、ドライバエラーが発生しなければ(ステップS280におけるNo)、エラー検出制御部202は、ループバックテストを終了し、切断及び接続部203に通常データ信号の外部接続を接続させ(ステップS310)、処理を終了する。
つまり、各CPUサブシステム100、120及びIOサブシステム110、130のそれぞれ(サブシステム)におけるエラー検出部104は、エラーの発生を検出し、ドライバエラーが検出された場合に、データ送信側のサブシステムを切り離す。一方、サブシステムにおけるエラー検出部104はそれぞれ、ドライバエラーが検出されなかった場合に、データ受信側のサブシステムを切り離す。つまり、FTサーバ300は、故障していないサブシステムが不必要に切り離されている時間を短縮できる。
本実施形態における他の動作は、第1の実施形態における動作と同じである。
以上説明したように、本実施形態におけるFTサーバ300では、各サブシステムはエラー検出部104を含む。エラー検出部104は、データ送信側エラー検出部200と、データ受信側エラー検出部220とを含む。データ送信側エラー検出部200は、ループバック経路においてループバックテストを実行することによって、ドライバ209における故障の有無を検出可能である。そして、データ送信側エラー検出部200は、データ受信側エラー検出部220においてエラーが検出された際に、データ送信側エラー検出部200自身における故障の有無を検出する。ここで、ループバックは、通常時には、ドライバ209に対して電気的に切断されており、通常データ信号に影響を与えない。従って、本実施形態におけるFTサーバ300には、データの送受信を行うハードウェアに故障が発生した場合に、送信側のハードウェアと受信側のハードウェアとの何れに故障が発生したのかを特定できるという効果がある。
又、本実施形態におけるFTサーバ300では、各サブシステムのエラー検出部114は、通常データの送受信を行う。そして、データ受信側エラー検出部220においてエラーを検出し、更にデータ送信側エラー検出部200においてドライバエラーが検出された場合に、データ送信側のサブシステムを切り離し、ドライバエラーが検出されなかった場合に、データ受信側のサブシステムを切り離す。従って、本実施形態におけるFTサーバ300には、故障していないサブシステムが不必要に切り離されている時間を短縮できるという効果がある。即ち、本実施形態におけるFTサーバ300では、ハードウェアの冗長性が失われている時間を短縮し、システムの可用性を向上できる。
尚、上述の説明では、エラー検出部104が各サブシステム内に設置される場合について説明した。しかしながら、本実施形態におけるFTサーバ300では、同系(第1系同士(又は第2系同士))のCPUサブシステム100(120)とIOサブシステム110(130)とが一体に形成され、各エラー検出部104において、エラー検出制御部202、221、テストパタン送出部204、及びテストパタン検出部206が、1つの回路を共有して実現されてもよい。
図6は、本発明の各実施形態における、通信装置を実現可能なハードウェア構成の一例を示すブロック図である。
通信装置又はサブシステム(以下、通信装置と称す)907は、記憶装置902と、CPU(Central Processing Unit)903と、キーボード904と、モニタ905と、I/O(Input/Output)装置908とを備え、これらが内部バス906によって接続されている。記憶装置902は、ループバックテスト部260、エラー検出部104等のCPU903の動作プログラムを格納する。CPU903は、通信装置907の全体を制御し、記憶装置902に格納された動作プログラムを実行し、I/O装置908によってループバックテスト部260、エラー検出部104等のプログラムの実行やデータの送受信を行なう。尚、上記の通信装置907の内部構成は一例である。通信装置907は、必要に応じて、キーボード904、モニタ905を接続する装置構成であってもよい。
上述した本発明の各実施形態における通信装置907は、専用の装置によって実現してもよいが、I/O装置908が外部との通信を実行するハードウェアの動作以外は、コンピュータ(情報処理装置)によっても実現可能である。本発明の各実施形態において、I/O装置908は、例えば、対向装置125、他のサブシステム等との入出力部である。この場合、係るコンピュータは、記憶装置902に格納されたソフトウェア・プログラムをCPU903に読み出し、読み出したソフトウェア・プログラムをCPU903において実行する。上述した各実施形態の場合、係るソフトウェア・プログラムには、上述したところの、図1及び3に示した、通信装置105、サブシステムの各部の機能を実現可能な記述がなされていればよい。但し、これらの各部には、適宜ハードウェアを含むことも想定される。そして、このような場合、係るソフトウェア・プログラム(コンピュータ・プログラム)は、本発明を構成すると捉えることができる。更に、係るソフトウェア・プログラムを格納した、コンピュータ読み取り可能な記憶媒体も、本発明を構成すると捉えることができる。
以上、本発明を、上述した各実施形態およびその変形例によって例示的に説明した。しかしながら、本発明の技術的範囲は、上述した各実施形態およびその変形例に記載した範囲に限定されない。当業者には、係る実施形態に対して多様な変更又は改良を加えることが可能であることは明らかである。そのような場合、係る変更又は改良を加えた新たな実施形態も、本発明の技術的範囲に含まれ得る。そしてこのことは、特許請求の範囲に記載した事項から明らかである。
本発明は、サーバ、コンピュータ周辺機器等の電子装置に含まれる、IO装置、通信装置等における故障を特定する用途において利用できる。
105 通信装置
125 対向装置
250 送信部
260 ループバックテスト部
270 受信部
305 通信システム
100、120 CPUサブシステム
110、130 IOサブシステム
101 主記憶
102 CPU
103 CPU側FT制御部
104 エラー検出部
111 IO側FT制御部
112 IOデバイス
140 高速シリアル通信経路
141 低速通信用経路
200 データ送信側エラー検出部
201 レシーバエラー検出通知信号
202 エラー検出制御部
203 切断及び接続部
204 テストパタン送出部
205 データ送信切替部
206 テストパタン検出部
207 ドライバエラー検出通知信号
208 レシーバ
209 ドライバ
220 データ受信側エラー検出部
221 エラー検出制御部
223 レシーバ
300 FTサーバ
902 記憶装置
903 CPU
904 キーボード
905 モニタ
906 内部バス
907 通信装置
908 I/O装置

Claims (2)

  1. 対向装置、及び、前記対向装置と接続された通信装置を備える通信システムであって、
    前記通信装置は、
    通常データ、テストデータ、及び制御データを表す信号を送信する送信部と、
    前記対向装置からの信号を受信する受信部と、
    前記対向装置の受信機能に関する故障が発生した可能性があることを示す前記制御データを表す信号であるレシーバエラー検出通知信号を、前記受信部によって前記対向装置から受信した際に、
    前記送信部に前記テストデータを表す信号を入力し、
    前記送信部から出力された前記テストデータを表す信号が正常であるか否かを検証するループバックテストを実行する
    ループバックテスト部と、
    を含み、
    前記対向装置は、前記レシーバエラー検出通知信号を前記通信装置へ送信する際に、前記通常データを表す信号の受信を中止し、
    前記ループバックテスト部は、前記レシーバエラー検出通知信号を受信した際に、前記送信部に前記通常データを表す信号の送信を中止させ、
    前記ループバックテスト部は、前記ループバックテストにおいて前記送信部から出力された前記テストデータを表す信号が正常でない場合に、前記送信部において故障が発生したことを示す前記制御データを表す信号であるドライバエラー検出通知信号を前記対向装置へ送信し、
    前記対向装置は、前記ドライバエラー検出通知信号を受信した際に、故障が発生していない他の通信装置から、前記通常データを表す信号の受信を再開する、
    通信システム。
  2. 前記ループバックテスト部は、前記ループバックテストにおいて前記送信部から出力された前記テストデータを表す信号が正常である場合に、前記送信部に前記通常データを表す信号の送信を再開させる、
    請求項1に記載の通信システム。
JP2018050469A 2018-03-19 2018-03-19 通信システム Active JP7188895B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018050469A JP7188895B2 (ja) 2018-03-19 2018-03-19 通信システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018050469A JP7188895B2 (ja) 2018-03-19 2018-03-19 通信システム

Publications (2)

Publication Number Publication Date
JP2019165273A JP2019165273A (ja) 2019-09-26
JP7188895B2 true JP7188895B2 (ja) 2022-12-13

Family

ID=68066119

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018050469A Active JP7188895B2 (ja) 2018-03-19 2018-03-19 通信システム

Country Status (1)

Country Link
JP (1) JP7188895B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7205112B2 (ja) 2018-08-24 2023-01-17 大同特殊鋼株式会社 浸炭窒化用鋼

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000039916A (ja) 1998-07-24 2000-02-08 Nissin Electric Co Ltd 遠方監視制御システム
JP2007005947A (ja) 2005-06-22 2007-01-11 Nec Corp 伝送試験システム、ネットワーク機器及びそれらに用いる被疑箇所切分け方法
JP2012063828A (ja) 2010-09-14 2012-03-29 Nec Corp 耐故障システム、マスタft制御lsi、スレーブft制御lsiおよび耐故障制御方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2888283B2 (ja) * 1996-04-12 1999-05-10 日本電気株式会社 全2重データ通信装置および全2重データ伝送システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000039916A (ja) 1998-07-24 2000-02-08 Nissin Electric Co Ltd 遠方監視制御システム
JP2007005947A (ja) 2005-06-22 2007-01-11 Nec Corp 伝送試験システム、ネットワーク機器及びそれらに用いる被疑箇所切分け方法
JP2012063828A (ja) 2010-09-14 2012-03-29 Nec Corp 耐故障システム、マスタft制御lsi、スレーブft制御lsiおよび耐故障制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7205112B2 (ja) 2018-08-24 2023-01-17 大同特殊鋼株式会社 浸炭窒化用鋼

Also Published As

Publication number Publication date
JP2019165273A (ja) 2019-09-26

Similar Documents

Publication Publication Date Title
US7802138B2 (en) Control method for information processing apparatus, information processing apparatus, control program for information processing system and redundant comprisal control apparatus
JP2008097164A (ja) 複数の機能要素から構成されるシステムの故障監視方法
US10298520B2 (en) Relay apparatus
KR101560497B1 (ko) 락스텝으로 이중화된 프로세서 코어들의 리셋 제어 방법 및 이를 이용하는 락스텝 시스템
JP2006285519A (ja) データ転送システムの障害診断方法、データ転送システム及びデータ記憶装置
JP2014191401A (ja) 処理装置、制御プログラム、及び制御法
JP7188895B2 (ja) 通信システム
US8576699B2 (en) Method for operating a network having a ring topology
JP2024108417A (ja) ネットワークインターフェースカード、および送信性能監視方法
US20080310314A1 (en) Method for Detecting a Message Interface Fault in a Communication Device
JP5176914B2 (ja) 伝送装置及び冗長構成部の系切替え方法
JP6089766B2 (ja) 情報処理システム、及び情報処理装置の障害処理方法
JP6654662B2 (ja) サーバ装置およびサーバシステム
US20120307650A1 (en) Multiplex system
JP6288609B2 (ja) 二重化制御装置
JP2014164488A (ja) 制御装置、制御方法、及び制御プログラム
US20120331334A1 (en) Multi-cluster system and information processing system
JP4593135B2 (ja) コンピュータシステムおよび周辺装置並びに周辺装置の試験方法
JP2002132535A (ja) 分散型計算機システムにおける計算機診断方式
JP5061739B2 (ja) データ処理装置、二重化装置、その障害時系切替方法および障害時系切替プログラム
JP2007026038A (ja) パス監視システム,パス監視方法,およびパス監視プログラム
CN107733683A (zh) 基于物联网的数据备份的方法和装置
KR0176085B1 (ko) 병렬처리 컴퓨터 시스템에서의 프로세서 노드 및 노드연결망의 에러 검출방법
WO2010070713A1 (ja) 情報処理装置、制御方法
JPH04305748A (ja) 高信頼性バス

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211019

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20211110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221201

R151 Written notification of patent or utility model registration

Ref document number: 7188895

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151