JP6859672B2 - 情報処理装置および情報処理装置の障害検出方法 - Google Patents
情報処理装置および情報処理装置の障害検出方法 Download PDFInfo
- Publication number
- JP6859672B2 JP6859672B2 JP2016222987A JP2016222987A JP6859672B2 JP 6859672 B2 JP6859672 B2 JP 6859672B2 JP 2016222987 A JP2016222987 A JP 2016222987A JP 2016222987 A JP2016222987 A JP 2016222987A JP 6859672 B2 JP6859672 B2 JP 6859672B2
- Authority
- JP
- Japan
- Prior art keywords
- communication
- test
- detected
- route
- path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/142—Reconfiguring to eliminate the error
- G06F11/1423—Reconfiguring to eliminate the error by reconfiguration of paths
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2205—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
- G06F11/221—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test buses, lines or interfaces, e.g. stuck-at or open line faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/15—Interconnection of switching modules
- H04L49/1515—Non-blocking multistage, e.g. Clos
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/55—Prevention, detection or correction of errors
- H04L49/552—Prevention, detection or correction of errors by ensuring the integrity of packets received through redundant connections
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/55—Prevention, detection or correction of errors
- H04L49/555—Error detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/55—Prevention, detection or correction of errors
- H04L49/557—Error correction, e.g. fault recovery or fault tolerance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/85—Active fault masking without idle spares
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Maintenance And Management Of Digital Transmission (AREA)
- Debugging And Monitoring (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
Description
(付記1)
複数の第1通信路の各々を介して情報を相互に通信する第1通信部および第2通信部と、前記第1通信部、前記第2通信部または前記複数の第1通信路で発生する障害の検出を制御する検出制御部とを有する情報処理装置において、
前記第1通信部および前記第2通信部の各々は、
前記複数の第1通信路にそれぞれ接続される複数の第2通信路と、
前記複数の第2通信路に跨って設けられ、前記複数の第2通信路のいずれかに伝達される情報の伝達経路を切り替える複数のマトリックススイッチとを備え、
前記検出制御部は、
前記複数の第2通信路のいずれかにおいて通信エラーが検出された場合、
前記複数のマトリックススイッチを、通信エラーが検出された第2通信路に伝達される情報を折り返す折り返し状態に順次切り替えたテストである第1折り返しテストを実行し、
前記第1折り返しテストでエラーが検出された場合、前記複数のマトリックススイッチを、エラーが検出された個所を他の第2通信路に迂回させる迂回状態に切り替えた後、前記第1折り返しテストを継続すること
を特徴とする情報処理装置。
(付記2)
前記検出制御部は、前記第1折り返しテストでエラーが検出された場合、
障害が発生した第2通信路の往路と復路の一方を他の第2通信路に迂回させて第2折り返しテストを実行し、
前記第2折り返しテストによりエラーが検出されない場合に往路と復路の前記一方の異常を検出し、あるいは、前記第2折り返しテストによりエラーが検出された場合に、障害が発生した第2通信路の往路と復路の他方を更に他の第2通信路に迂回させて第3折り返しテストを実行し、
前記第3折り返しテストによりエラーが検出されない場合に往路と復路の前記他方の異常を検出し、あるいは、前記第3折り返しテストによりエラーが検出された場合に往路と復路の両方の異常を検出し、
異常を検出した経路を迂回により避けて、前記第1折り返しテストを継続すること
を特徴とする付記1記載の情報処理装置。
(付記3)
前記検出制御部は、前記第1通信部内に設けられること
を特徴とする付記1または付記2記載の情報処理装置。
(付記4)
前記検出制御部は、前記複数の第2通信路のいずれかを使用して、前記第2通信部の前記複数のマトリックススイッチを制御する制御情報を前記第2通信部に送信すること
を特徴とする付記3記載の情報処理装置。
(付記5)
前記第1通信部および前記第2通信部の各々は、前記複数のマトリックススイッチのうち、互いに隣接する2つのマトリックススイッチの間に配置され、情報の送信処理または受信処理を実行する通信処理部を備えること
を特徴とする付記1ないし付記4のいずれか1項記載の情報処理装置。
(付記6)
前記第1通信部および前記第2通信部は、前記複数の第2通信路に情報を送信するとともに、前記複数の第2通信路から情報を受信する通信制御部を備え、
前記検出制御部は、前記複数の第2通信路のいずれかにおいて通信エラーが検出された場合、前記通信制御部の一方に、テストデータを出力させ、前記複数のマトリックススイッチのいずれかから折り返されるテストデータに基づいて前記第1折り返しテストのエラーを検出させること
を特徴とする付記1ないし付記5のいずれか1項記載の情報処理装置。
(付記7)
前記第1通信部および前記第2通信部の各々は、ラックに搭載される基板に搭載され、
前記複数の第1通信路は、前記ラックに設けられ、前記基板が接続されるバックプレーンに含まれること
を特徴とする付記1ないし付記6のいずれか1項記載の情報処理装置。
(付記8)
複数の第1通信路の各々を介して情報を相互に通信する第1通信部および第2通信部を備え、前記第1通信部および前記第2通信部の各々が、前記複数の第1通信路にそれぞれ接続される複数の第2通信路と、前記複数の第2通信路に跨って設けられ、前記複数の第2通信路のいずれかに伝達される情報の伝達経路を切り替える複数のマトリックススイッチとを備える情報処理装置の障害検出方法において、
前記情報処理装置が有する検出制御部が、
前記複数の第2通信路のいずれかにおいて通信エラーが検出された場合、
前記複数のマトリックススイッチを、通信エラーが検出された第2通信路に伝達される情報を折り返す折り返し状態に順次切り替えたテストである第1折り返しテストを実行し、
前記第1折り返しテストでエラーが検出された場合、前記複数のマトリックススイッチを、エラーが検出された個所を他の第2通信路に迂回させる迂回状態に切り替えた後、前記第1折り返しテストを継続することで、前記第1通信部、前記第2通信部または前記複数の第1通信路で発生した障害を検出すること
を特徴とする情報処理装置の障害検出方法。
Claims (5)
- 複数の第1通信路の各々を介して情報を相互に通信する第1通信部および第2通信部と、前記第1通信部、前記第2通信部または前記複数の第1通信路で発生する障害の検出を制御する検出制御部とを有する情報処理装置において、
前記第1通信部および前記第2通信部の各々は、
前記複数の第1通信路にそれぞれ接続される複数の第2通信路と、
前記複数の第2通信路に跨って設けられ、前記複数の第2通信路のいずれかに伝達される情報の伝達経路を切り替える複数のマトリックススイッチとを備え、
前記検出制御部は、
前記複数の第2通信路のいずれかにおいて通信エラーが検出された場合、
前記複数のマトリックススイッチを、通信エラーが検出された第2通信路に伝達される情報を折り返す折り返し状態に順次切り替えたテストである第1折り返しテストを実行し、
前記第1折り返しテストでエラーが検出された場合、
障害が発生した第2通信路の往路と復路の一方を他の第2通信路に迂回させて第2折り返しテストを実行し、
前記第2折り返しテストによりエラーが検出されない場合に往路と復路の前記一方の異常を検出し、あるいは、前記第2折り返しテストによりエラーが検出された場合に、障害が発生した第2通信路の往路と復路の他方を更に他の第2通信路に迂回させて第3折り返しテストを実行し、
前記第3折り返しテストによりエラーが検出されない場合に往路と復路の前記他方の異常を検出し、あるいは、前記第3折り返しテストによりエラーが検出された場合に往路と復路の両方の異常を検出し、
異常を検出した経路を迂回により避けて、前記第1折り返しテストを継続すること
を特徴とする情報処理装置。 - 前記検出制御部は、前記第1通信部内に設けられること
を特徴とする請求項1記載の情報処理装置。 - 前記検出制御部は、前記複数の第2通信路のいずれかを使用して、前記第2通信部の前記複数のマトリックススイッチを制御する制御情報を前記第2通信部に送信すること
を特徴とする請求項2記載の情報処理装置。 - 前記第1通信部および前記第2通信部の各々は、前記複数のマトリックススイッチのうち、互いに隣接する2つのマトリックススイッチの間に配置され、情報の送信処理または受信処理を実行する通信処理部を備えること
を特徴とする請求項1ないし請求項3のいずれか1項記載の情報処理装置。 - 複数の第1通信路の各々を介して情報を相互に通信する第1通信部および第2通信部を備え、前記第1通信部および前記第2通信部の各々が、前記複数の第1通信路にそれぞれ接続される複数の第2通信路と、前記複数の第2通信路に跨って設けられ、前記複数の第2通信路のいずれかに伝達される情報の伝達経路を切り替える複数のマトリックススイッチとを備える情報処理装置の障害検出方法において、
前記情報処理装置が有する検出制御部が、
前記複数の第2通信路のいずれかにおいて通信エラーが検出された場合、
前記複数のマトリックススイッチを、通信エラーが検出された第2通信路に伝達される情報を折り返す折り返し状態に順次切り替えたテストである第1折り返しテストを実行し、
前記第1折り返しテストでエラーが検出された場合、
障害が発生した第2通信路の往路と復路の一方を他の第2通信路に迂回させて第2折り返しテストを実行し、
前記第2折り返しテストによりエラーが検出されない場合に往路と復路の前記一方の異常を検出し、あるいは、前記第2折り返しテストによりエラーが検出された場合に、障害が発生した第2通信路の往路と復路の他方を更に他の第2通信路に迂回させて第3折り返しテストを実行し、
前記第3折り返しテストによりエラーが検出されない場合に往路と復路の前記他方の異常を検出し、あるいは、前記第3折り返しテストによりエラーが検出された場合に往路と復路の両方の異常を検出し、
異常を検出した経路を迂回により避けて、前記第1折り返しテストを継続することで、前記第1通信部、前記第2通信部または前記複数の第1通信路で発生した障害を検出すること
を特徴とする情報処理装置の障害検出方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016222987A JP6859672B2 (ja) | 2016-11-16 | 2016-11-16 | 情報処理装置および情報処理装置の障害検出方法 |
US15/792,868 US10409686B2 (en) | 2016-11-16 | 2017-10-25 | Apparatus and method to determine plural locations in communication circuits at which failures have occurred |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016222987A JP6859672B2 (ja) | 2016-11-16 | 2016-11-16 | 情報処理装置および情報処理装置の障害検出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018082301A JP2018082301A (ja) | 2018-05-24 |
JP6859672B2 true JP6859672B2 (ja) | 2021-04-14 |
Family
ID=62108531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016222987A Active JP6859672B2 (ja) | 2016-11-16 | 2016-11-16 | 情報処理装置および情報処理装置の障害検出方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10409686B2 (ja) |
JP (1) | JP6859672B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6885237B2 (ja) * | 2017-07-11 | 2021-06-09 | 富士通株式会社 | ノード間通信装置、並列処理装置及びノード間通信経路制御方法 |
JP6649416B2 (ja) * | 2018-02-02 | 2020-02-19 | ファナック株式会社 | 障害分類装置、障害分類方法及び障害分類プログラム |
JP6705845B2 (ja) | 2018-02-08 | 2020-06-03 | ファナック株式会社 | 障害部位特定装置、障害部位特定方法及び障害部位特定プログラム |
US11091169B2 (en) * | 2018-03-23 | 2021-08-17 | Infineon Technologies Ag | Advanced driver assistance systems test-interface for automated driving sensors |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4394541A (en) * | 1981-01-02 | 1983-07-19 | Seiden Lewis J | Three stage minimum configuration conditionally non-blocking matrix |
US4725835A (en) * | 1985-09-13 | 1988-02-16 | T-Bar Incorporated | Time multiplexed bus matrix switching system |
US4975909A (en) * | 1988-10-14 | 1990-12-04 | Compunetics, Inc. | Broadcast network |
US5287491A (en) * | 1989-04-10 | 1994-02-15 | International Business Machines Corporation | Network rearrangement method and system |
US5321813A (en) * | 1991-05-01 | 1994-06-14 | Teradata Corporation | Reconfigurable, fault tolerant, multistage interconnect network and protocol |
JP2820005B2 (ja) | 1992-11-04 | 1998-11-05 | 日本電気株式会社 | クロスコネクト方式 |
US7388872B2 (en) * | 2001-04-06 | 2008-06-17 | Montgomery Jr Charles D | Dynamic communication channel allocation method and system |
-
2016
- 2016-11-16 JP JP2016222987A patent/JP6859672B2/ja active Active
-
2017
- 2017-10-25 US US15/792,868 patent/US10409686B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US10409686B2 (en) | 2019-09-10 |
JP2018082301A (ja) | 2018-05-24 |
US20180137008A1 (en) | 2018-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6859672B2 (ja) | 情報処理装置および情報処理装置の障害検出方法 | |
EP3104277B1 (en) | Mixed redundancy scheme for inter-die interconnects in a multichip package | |
US20080074998A1 (en) | Self-healing chip-to-chip interface | |
CN1667579A (zh) | 定制和监视多个接口并实现容错和隔离功能的装置和方法 | |
JP3574425B2 (ja) | 耐多重障害ネットワーク構造を利用したパケット処理方法 | |
US7073088B2 (en) | Data bus arrangement and control method for efficiently compensating for faulty signal lines | |
JP3588936B2 (ja) | フレキシブル高速多重化リモート入出力システム | |
JP4024607B2 (ja) | 光クロスコネクト装置 | |
US7170908B2 (en) | System and method of selecting sources for a network element having redundant sources | |
US11411861B2 (en) | Routing messages in an integrated circuit chip device using a crosslinked tree structure | |
JP6052150B2 (ja) | 中継装置 | |
JP7208060B2 (ja) | 情報処理プログラム、情報処理装置、および、情報処理方法 | |
US7187674B2 (en) | Method and apparatus for using adaptive switches for providing connections to point-to-point interconnection fabrics | |
JP2006135723A (ja) | 情報中継装置、情報中継方法、プログラム、情報通信システム | |
JP3616306B2 (ja) | 半導体集積回路 | |
JP2006197095A (ja) | 光クロスコネクトおよびこれを用いた光ネットワーク経路監視システム | |
JPH0213095A (ja) | データ経路検査装置及び方法 | |
JP2518514B2 (ja) | 自動障害検出システム | |
JPH10243008A (ja) | 多重化伝送装置 | |
KR0140302B1 (ko) | 전전자 교환기의 패킷 통합시험장치 및 방법 | |
JP2003032284A (ja) | パケット交換装置 | |
CN115047789A (zh) | 机台感测电路板及其运作方法 | |
US20050027856A1 (en) | Signaling method for line terminal equipment health and status | |
JP2019021957A (ja) | ノード間通信装置、並列処理装置及びノード間通信経路制御方法 | |
SU928335A1 (ru) | Устройство дл отключени внешних устройств от линий св зи,соедин ющих внешние устройства с ЦВМ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20170803 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20170803 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20170804 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20180214 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20180219 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20180219 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190807 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200811 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210202 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210309 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6859672 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |