JP6780536B2 - 情報処理装置及び障害情報送信要否判定方法 - Google Patents
情報処理装置及び障害情報送信要否判定方法 Download PDFInfo
- Publication number
- JP6780536B2 JP6780536B2 JP2017031057A JP2017031057A JP6780536B2 JP 6780536 B2 JP6780536 B2 JP 6780536B2 JP 2017031057 A JP2017031057 A JP 2017031057A JP 2017031057 A JP2017031057 A JP 2017031057A JP 6780536 B2 JP6780536 B2 JP 6780536B2
- Authority
- JP
- Japan
- Prior art keywords
- failure
- channel
- node
- housing
- optical signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B10/00—Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
- H04B10/07—Arrangements for monitoring or testing transmission systems; Arrangements for fault measurement of transmission systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B10/00—Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
- H04B10/03—Arrangements for fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B10/00—Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
- H04B10/03—Arrangements for fault recovery
- H04B10/035—Arrangements for fault recovery using loopbacks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B10/00—Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
- H04B10/40—Transceivers
- H04B10/43—Transceivers using a single component as both light source and receiver, e.g. using a photoemitter as a photoreceiver
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
Description
まず、実施形態の情報処理装置を実装するスーパーコンピュータについて図12を用いて説明する。スーパーコンピュータ120は、多数のノードと呼ばれる計算機をインターコネクトと呼ばれるネットワークに接続した構成をとる。インターコネクトとは、半導体チップや電子回路間を接続し、信号やデータを相互に送受信できるようにすることを言う。なお、ここでのノードは、例えばCentral Processor Unit(CPU、中央演算処理装置)やメモリが搭載された計算機であり、1つの筐体121に複数のノードが搭載されている。
図14に示すように、ラック140に搭載された筐体141内にはBaseboard Management Controller(BMC)142と呼ばれるコントローラ(サービスプロセッサとも言う)が搭載され、各筐体141のBMC142は障害情報を管理する障害管理サーバ(以下、障害管理装置とも言う)143に接続されている。なお、この例では1つのBMC142が1つの筐体141を管理しているが、1つのBMCが複数の筐体を管理するようにしてもよい。デバイス(BMC)上で動作するファームウェア(以降、BMCファームと言う)によって筐体141内のハードウェア制御やイベント(エラーの発生や電源操作のログなど)の記録が行われる。
また、ノード間通信制御部11は、システムへの影響を最小限に抑えるため、障害が発生した接続先ノードとのリンクを無効化する。ノード間通信制御部11は、障害が発生したことを伝える障害発生の通知(Link無効化完了通知)を光モジュール制御部13へ送信する。このとき、ノード間通信制御部11は光モジュールの発光停止も行う。リンクの無効化により、そのリンクは無効化が解除されるまで使用されることはない。ノード間通信制御部11による上記処理はICC22が実行する処理である。
障害情報送信判定部14はBMC24への障害情報送信の要否の判定を行う。受光レベル採取部33によって採取されたRx−Ch0の受光素子の受光レベル及びRx−Ch1の受光素子の受光レベルの情報は、障害情報送信判定部14の受光有無判定回路37に送られる。受光有無判定回路37は、受信した受光レベルとあらかじめ用意された受光有無判定閾値を比較し、光信号が届いているか否かの判定を行う。具体的には図6に示すように、受光有無判定回路37は、Rx−Ch0の受光素子の受光レベルと、それに対応する受光有無判定閾値との大小を比較し、例えばRx−Ch0の受光素子の受光レベルの方が受光有無判定閾値より大きい場合にRx−Ch0に受光有りと判定する。Rx−Ch1についても同様にして受光の有無の判定を行う。
(付記1)障害情報を障害管理装置へ送信する情報処理装置における前記障害情報の送信要否を判定する障害情報送信要否判定方法において、
外部ノードとのノード間通信に障害が発生したことを検出し、
前記障害の発生を通知する障害発生通知を受信すると、ノードを収容する筐体の電源即断時に第1チャンネルで受信した信号を第2チャンネルへ返送する光通信部の前記第1チャンネルを発光させる制御を前記光通信部へ行い、前記第2チャンネルにおいて光信号が受光できるか判断し、前記判断に基づいて前記外部ノードの電源が落ちているか否かを判定し、
前記外部ノードの電源が落ちていた場合には、前記障害管理装置への障害通知を選定する、
ことを特徴とする障害情報送信要否判定方法。
(付記2)前記第1チャンネルにおける前記光信号の受光も判断し、前記第1チャネルにおける前記光信号の受光判断及び前記第2チャネルにおける前記光信号の受光判断に基づいて、前記外部ノードの電源が落ちているか否かを判定することを特徴とする付記1に記載の障害情報送信要否判定方法。
(付記3)前記第1チャネルにおける前記光信号の受光レベル及び前記第2チャネルにおける前記光信号の受光レベルと、受光の有無を判定する受光有無判定閾値とをそれぞれ比較し、比較結果に基づいて各チャネルにおける前記光信号の受光判断を行うことを特徴とする付記2に記載の障害情報送信要否判定方法。
(付記4)前記光通信部は、KTN結晶を有し、前記KTN結晶への印加電圧をなしとすることにより前記第1チャンネルで受信した信号を前記第2チャンネルへ返送することを特徴とする付記1乃至3のいずれかに記載の障害情報送信要否判定方法。
10 光通信部
11 ノード間通信制御部
12 光通信制御部
13 光モジュール制御部
14 障害情報送信判定部
15 障害情報制御部
20 CPU
21 メモリ
22、132(132a、132b) ICC
23(23a、23b)、130(130a、130b) 光モジュール
24、142 BMC
25 バス
30(30a、30b) KTN結晶
31(31a、31b)、133(133a、133b) ミラー
32 発光指示部
33 受光レベル採取部
34 設定レジスタ
35 ステータス・レジスタ
37 受光有無判定回路
38 送信要否判定回路
120 スーパーコンピュータ
121、141 筐体
122、140 ラック
123 インターコネクトケーブル
131 ファイバーケーブル
143 障害管理サーバ
Claims (5)
- 外部ノードとのノード間通信に障害が発生したことを検出するノード間通信制御部と、
ノードを収容する筐体の電源即断時に第1チャンネルで受信した信号を第2チャンネルへ返送する光通信部と、
前記ノード間通信制御部による障害発生通知を受信すると、前記第1チャンネルを発光させる制御を前記光通信部へ行い、前記第2チャンネルにおいて光信号が受光できるか判断し、前記判断に基づいて前記外部ノードの電源が落ちているか否かを判定する光通信制御部と、
前記外部ノードの電源が落ちていた場合には、障害管理装置への障害通知を選定する障害情報制御部とを、
有することを特徴とする情報処理装置。 - 前記光通信制御部は、前記第1チャンネルにおける前記光信号の受光も判断し、前記第1チャネルにおける前記光信号の受光判断及び前記第2チャネルにおける前記光信号の受光判断に基づいて、前記外部ノードの電源が落ちているか否かを判定することを特徴とする請求項1に記載の情報処理装置。
- 前記光通信制御部は、前記第1チャネルにおける前記光信号の受光レベル及び前記第2チャネルにおける前記光信号の受光レベルと、受光の有無を判定する受光有無判定閾値とをそれぞれ比較し、比較結果に基づいて各チャネルにおける前記光信号の受光判断を行うことを特徴とする請求項2に記載の情報処理装置。
- 前記光通信部は、KTN結晶を有し、前記KTN結晶への印加電圧をなしとすることにより前記第1チャンネルで受信した信号を前記第2チャンネルへ返送することを特徴とする請求項1乃至3のいずれかに記載の情報処理装置。
- 障害情報を障害管理装置へ送信する情報処理装置における前記障害情報の送信要否を判定する障害情報送信要否判定方法において、
外部ノードとのノード間通信に障害が発生したことを検出し、
前記障害の発生を通知する障害発生通知を受信すると、ノードを収容する筐体の電源即断時に第1チャンネルで受信した信号を第2チャンネルへ返送する光通信部の前記第1チャンネルを発光させる制御を前記光通信部へ行い、前記第2チャンネルにおいて光信号が受光できるか判断し、前記判断に基づいて前記外部ノードの電源が落ちているか否かを判定し、
前記外部ノードの電源が落ちていた場合には、前記障害管理装置への障害通知を選定する、
ことを特徴とする障害情報送信要否判定方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017031057A JP6780536B2 (ja) | 2017-02-22 | 2017-02-22 | 情報処理装置及び障害情報送信要否判定方法 |
US15/893,893 US10270525B2 (en) | 2017-02-22 | 2018-02-12 | Information processing apparatus and a method of determining whether or not to transmit failure information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017031057A JP6780536B2 (ja) | 2017-02-22 | 2017-02-22 | 情報処理装置及び障害情報送信要否判定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018137623A JP2018137623A (ja) | 2018-08-30 |
JP6780536B2 true JP6780536B2 (ja) | 2020-11-04 |
Family
ID=63167483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017031057A Active JP6780536B2 (ja) | 2017-02-22 | 2017-02-22 | 情報処理装置及び障害情報送信要否判定方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10270525B2 (ja) |
JP (1) | JP6780536B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10536235B2 (en) * | 2017-05-04 | 2020-01-14 | Ciena Corporation | Logical control seams in optical networks to improve restoration speed or timing for capacity adds |
CN114265489B (zh) * | 2020-09-16 | 2023-10-27 | 富联精密电子(天津)有限公司 | 电源故障监测方法、装置、电子设备及存储介质 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03213023A (ja) * | 1990-01-18 | 1991-09-18 | Fujitsu Ltd | 電源断情報転送方式 |
JPH0595357A (ja) | 1991-10-02 | 1993-04-16 | Shikoku Nippon Denki Software Kk | 障害情報の待ち合わせによる対象外情報の削除方式 |
JPH07147574A (ja) | 1993-06-18 | 1995-06-06 | Nec Corp | 階層的障害報告方式 |
JP3681634B2 (ja) * | 2000-11-30 | 2005-08-10 | 株式会社日立インフォメーションテクノロジー | 障害通報処理方法および監視装置 |
JP2003229820A (ja) | 2002-02-01 | 2003-08-15 | Sumitomo Electric Ind Ltd | 電源断通知機能を有するコンバータ |
JP4087179B2 (ja) * | 2002-07-29 | 2008-05-21 | 富士通株式会社 | 加入者線端局装置 |
JP5173153B2 (ja) | 2006-06-14 | 2013-03-27 | 日本電信電話株式会社 | 電気光学素子 |
JP2008147849A (ja) * | 2006-12-07 | 2008-06-26 | Mitsubishi Electric Corp | 光伝送システムおよび光伝送システムの電源断通知方法 |
WO2011093012A1 (ja) * | 2010-02-01 | 2011-08-04 | パナソニック株式会社 | ネットワーク装置 |
US8830989B2 (en) * | 2011-12-06 | 2014-09-09 | Cisco Technology, Inc. | Automatic configuration of packet network services over dense wavelength division multiplex communication links using optical transport network frames |
WO2013145651A1 (ja) * | 2012-03-28 | 2013-10-03 | 日本電気株式会社 | データ伝送システムにおける通信装置およびその省電力化方法 |
JP2015095839A (ja) * | 2013-11-13 | 2015-05-18 | 日本電信電話株式会社 | 光無線通信システム及び光無線通信方法 |
-
2017
- 2017-02-22 JP JP2017031057A patent/JP6780536B2/ja active Active
-
2018
- 2018-02-12 US US15/893,893 patent/US10270525B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018137623A (ja) | 2018-08-30 |
US20180241466A1 (en) | 2018-08-23 |
US10270525B2 (en) | 2019-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0455442A2 (en) | Fault detection in link-connected systems | |
US7502669B1 (en) | Apparatus and method for graphically displaying disk drive enclosures and cabling in a data storage system | |
CN100474258C (zh) | 计算机可读介质、错误恢复方法和装置、计算机系统 | |
JP6780536B2 (ja) | 情報処理装置及び障害情報送信要否判定方法 | |
JP2006178720A (ja) | ストレージシステム | |
KR101179782B1 (ko) | 원자력 발전소 안전계통의 안전등급 통신 스위치 | |
JP2008299481A (ja) | ストレージシステム及び複数拠点間でのデータコピー方法 | |
CN104598341A (zh) | 用于确定在互连/控制器之间的故障的位置的方法和系统 | |
US20140068352A1 (en) | Information processing apparatus and fault processing method for information processing apparatus | |
RU2458471C2 (ru) | Устройство и способ магистральной передачи данных, содержащие встроенную в устройство функцию подавления тревоги | |
JP6820473B2 (ja) | 影響範囲特定プログラム、影響範囲特定方法、および影響範囲特定装置 | |
US6625745B1 (en) | Network component failure identification with minimal testing | |
JP2016046702A (ja) | 通信システム,異常制御装置および異常制御方法 | |
JP5966181B2 (ja) | 二重化装置および電源停止方法 | |
JP2016100843A (ja) | 中継装置 | |
CN107888405B (zh) | 管理设备和信息处理系统 | |
US20210234613A1 (en) | Optical transceiver monitoring system | |
JP5573118B2 (ja) | ディスクアレイ装置の故障診断システム、故障診断方法、故障診断プログラムおよびディスク装置 | |
JP2008176477A (ja) | 計算機システム | |
JP2001060160A (ja) | 制御装置のcpu二重化システム | |
JP2010245589A (ja) | 通信システム、通信装置、被疑箇所の特定方法及びプログラム | |
JP5722167B2 (ja) | 障害監視判定装置、障害監視判定方法、及びプログラム | |
JP2009110218A (ja) | 仮想化スイッチおよびそれを用いたコンピュータシステム | |
JP6582523B2 (ja) | ストレージ装置、制御装置、制御プログラム | |
JP2007266708A (ja) | ケーブル誤接続検出装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200904 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200915 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6780536 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |