JP5422490B2 - 計算機システム及びi/o故障カード特定方法 - Google Patents
計算機システム及びi/o故障カード特定方法 Download PDFInfo
- Publication number
- JP5422490B2 JP5422490B2 JP2010126429A JP2010126429A JP5422490B2 JP 5422490 B2 JP5422490 B2 JP 5422490B2 JP 2010126429 A JP2010126429 A JP 2010126429A JP 2010126429 A JP2010126429 A JP 2010126429A JP 5422490 B2 JP5422490 B2 JP 5422490B2
- Authority
- JP
- Japan
- Prior art keywords
- card
- information
- computer
- management
- pci
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
以下、本発明を適用した第1の形態を、図面に基づいて詳細に説明する。
以下、本発明を実施するための第2の形態を図面に基づいて詳細に説明する。
1300 計算機、1400 I/Oカード拡張装置、1500 管理PC
Claims (15)
- 第一の通信制御部及び第一の記憶部を有する管理PCと、第一のI/Oカードスロット及び第二の通信制御部を有する計算機と、スイッチ、前記スイッチと接続された第二のI/Oカードスロット、及び第三の通信制御部を有するI/Oカード拡張装置とを備え、前記第一の通信制御部が前記第二の通信制御部及び前記第三の通信制御部と接続された計算機システムにおけるI/Oカード故障特定方法であって、
前記第一のI/Oカードスロットのうち少なくとも1つには、接続モジュールが搭載され、
前記計算機は、前記接続モジュールと接続される前記スイッチを介して、前記I/Oカード拡張装置の前記第二のI/Oカードスロットと接続され、
前記第一の記憶部には、前記計算機の固有情報と前記I/Oカード拡張装置の固有情報とが管理される管理情報が保持され、
前記I/Oカードの故障発生情報の前記管理PCに対する入力を契機に、
前記管理PCから前記故障発生情報の送信元へ故障通知制御要求を出力し、
前記管理PCから出力された前記故障通知制御要求に基き、故障したI/Oカードを搭載する前記送信元のI/Oカードスロットを特定することを特徴とするI/Oカード故障特定方法。 - 前記管理情報は、I/Oカード故障の発生した計算機の固有情報と、I/Oカード故障の発生したI/Oカード拡張装置の固有情報とを管理する故障サーバ情報であり、
前記I/Oカードの故障発生情報の前記管理PCに対する入力を契機に、
前記管理PCにおける前記故障発生情報の受信時刻または送信元における前記故障発生情報の送信時刻の何れか一方の時刻を保持し、
前記送信元が前記計算機である場合、
前記故障サーバ情報から、記録時刻が最新であるI/Oカード拡張装置の固有情報を検索し、
前記記録時刻が最新であるI/Oカード拡張装置の固有情報に関連する計算機の固有情報の記録の有無を判定し、
関連する計算機の固有情報の記録が有る場合、前記計算機の固有情報及び前記保持した時刻を、新たな情報として前記故障サーバ情報に記録し、
関連する計算機の固有情報の記録が無い場合、前記計算機の固有情報及び前記保持した時刻を、前記記録時刻が最新であるI/Oカード拡張装置の固有情報に対応づけて前記故障サーバ情報に記録し、
前記送信元が前記I/Oカード拡張装置である場合、
前記故障サーバ情報から、記録時刻が最新である計算機の固有情報を検索し、
前記記録時刻が最新である計算機の固有情報に関連するI/Oカード拡張装置の固有情報の記録の有無を判定し、
関連するI/Oカード拡張装置の固有情報の記録が有る場合、前記I/Oカード拡張装置の固有情報及び前記保持した時刻を、新たな情報として前記故障サーバ情報に記録し、
関連するI/Oカード拡張装置の固有情報の記録が無い場合、前記I/Oカード拡張装置の固有情報及び前記保持した時刻を、前記記録時刻が最新である計算機の固有情報に対応づけて前記故障サーバ情報に記録し、
前記故障サーバに記録した前記時刻に関する情報を故障通知制御要求に含めて、前記故障発生情報の送信元へ出力することを特徴とする請求項1記載のI/Oカード故障特定方法。 - 前記I/Oカード故障の発生した計算機の固有情報は、計算機のIPアドレス、バス番号、デバイス番号及びファンクション番号を含み、
前記I/Oカード故障の発生したI/Oカード拡張装置の固有情報は、I/Oカード拡張装置のIPアドレス、故障したI/Oカードの搭載位置、及び故障したI/Oカードのスロット位置を含むことを特徴とする請求項2記載のI/Oカード故障特定方法。 - 前記スイッチは、PCI Expressスイッチであり、
前記接続モジュールは、PCI Express接続モジュールであることを特徴とする請求項2記載のI/Oカード故障特定方法。 - 前記計算機はPCI管理情報、及びPCI内蔵デバイス情報を有し、
前記PCI管理情報には、前記計算機に接続されているPCIデバイスについて、行番号、バス番号、デバイス番号、ファンクション番号、前記PCIデバイスの接続元のPCIデバイスが存在する場合には接続元のPCIデバイスの行番号、及び搭載位置の情報が格納されており、
前記PCI内蔵デバイス情報には、前記計算機に内蔵されているPCIデバイスについて、行番号、バス番号、デバイス番号、ファンクション番号、前記PCIデバイスの接続元のPCIデバイスが存在する場合には接続元のPCIデバイスの行番号、搭載位置が内蔵という情報が格納されていること
を特徴とする請求項4記載のI/Oカード故障特定方法。 - 前記故障通知制御要求は、光源点灯要求であり、
前記管理PCから出力された前記光源点灯要求に基き、故障したI/Oカードを搭載する前記計算機のI/Oカードスロットの光源を点灯し、
前記管理PCから出力された前記光源点灯要求に基き、故障したI/Oカードを搭載する前記I/Oカード拡張装置のI/Oカードスロットの光源を点灯することを特徴とする請求項2記載のI/Oカード故障特定方法。 - 前記I/Oカードの故障発生情報の前記管理PCに対する入力を契機に、
前記故障発生情報を前記管理PCへ出力した計算機に対し、前記管理PCから故障通知制御要求を出力し、
前記管理PCから出力された前記故障通知制御要求に基き、故障したI/Oカードを搭載する前記計算機のI/Oカードスロットを特定し、
前記故障通知制御要求を入力された計算機の固有情報を、前記第一の記憶部に保持される管理情報から検索し、
前記検索により発見した管理情報における計算機の固有情報に関連する前記I/Oカード拡張装置の固有情報の有無を判断し、
前記関連するI/Oカード拡張装置の固有情報がない場合、
新たなI/Oカードの故障発生情報の前記管理PCへの入力を待ち、
前記関連するI/Oカード拡張装置の固有情報がある場合、
前記固有情報を有するI/Oカード拡張装置に対し、前記管理PCから前記故障通知制御要求を出力し、
前記管理PCから出力された故障通知制御要求に基き、故障したI/Oカードを搭載する前記I/Oカード拡張装置のI/Oカードスロットを特定することを特徴とする請求項1記載のI/Oカード故障特定方法。 - 前記スイッチは、PCI Expressスイッチであり、
前記接続モジュールは、PCI Express接続モジュールであることを特徴とする請求項7記載のI/Oカード故障特定方法。 - 前記計算機はPCI管理情報、及びPCI内蔵デバイス情報を有し、
前記PCI管理情報には、前記計算機に接続されているPCIデバイスについて、行番号、バス番号、デバイス番号、ファンクション番号、及び前記PCIデバイスの接続元のPCIデバイスが存在する場合には接続元のPCIデバイスのバス番号が格納され、
前記PCI内蔵デバイス情報には、前記計算機に内蔵されているPCIデバイスについて、行番号、バス番号、デバイス番号、ファンクション番号、前記PCIデバイスの接続元のPCIデバイスが存在する場合には接続元のPCIデバイスのバス番号、及び前記計算機のI/Oカードスロットに搭載されたI/Oカードの場合には計算機スロット番号が格納されていること
を特徴とする請求項8記載のI/Oカード故障特定方法。 - 前記管理PCは、
前記計算機から取得したPCI管理情報及びPCI内蔵デバイス情報に基づき、サーバ管理情報を生成し、
前記サーバ管理情報には、前記管理PCが管理する前記計算機に接続された前記PCIデバイスについて、行番号、前記計算機のIPアドレス、バス番号、デバイス番号、ファンクション番号、前記PCIデバイスの接続元のPCIデバイスが存在する場合には接続元のPCIデバイスのバス番号、I/Oカード拡張装置が接続された計算機スロット番号、I/Oカード拡張装置のIPアドレス、及びI/Oカード拡張装置のスロット番号が格納されていることを特徴とする請求項9記載のI/Oカード故障特定方法。 - 前記故障通知制御要求は、光源点灯要求であり、
前記管理PCから出力された前記光源点灯要求に基き、故障したI/Oカードを搭載する前記計算機のI/Oカードスロットの光源を点灯し、
前記管理PCから出力された前記光源点灯要求に基き、故障したI/Oカードを搭載する前記I/Oカード拡張装置のI/Oカードスロットの光源を点灯することを特徴とする請求項7記載のI/Oカード故障特定方法。 - 第一の通信制御部及び第一の記憶部を有する管理PCと、第一のI/Oカードスロット及び第二の通信制御部を有する計算機と、スイッチ、前記スイッチと接続された第二のI/Oカードスロット、及び第三の通信制御部を有するI/Oカード拡張装置とを備え、前記第一の通信制御部が前記第二の通信制御部及び前記第三の通信制御部と接続された計算機システムにおいて、
前記第一のI/Oカードスロットのうち少なくとも1つには、接続モジュールが搭載され、
前記計算機は、前記接続モジュールと接続される前記スイッチを介して、前記I/Oカード拡張装置の前記第二のI/Oカードスロットと接続され、
前記第一の記憶部には、前記計算機の固有情報と前記I/Oカード拡張装置の固有情報とが管理される管理情報が保持され、
前記管理PCは、前記I/Oカードの故障発生情報の前記管理PCに対する入力を契機に、
前記故障発生情報の送信元へ故障通知制御要求を出力し、
前記送信元は、前記管理PCから出力された前記故障通知制御要求に基き、故障したI/Oカードを搭載するI/Oカードスロットを特定することを特徴とする計算機システム。 - 前記管理情報は、I/Oカード故障の発生した計算機の固有情報と、I/Oカード故障の発生したI/Oカード拡張装置の固有情報とを管理する故障サーバ情報であり、
前記I/Oカードの故障発生情報の前記管理PCに対する入力を契機に、前記管理PCは、
前記管理PCにおける前記故障発生情報の受信時刻または送信元における前記故障発生情報の送信時刻の何れか一方の時刻を保持し、
前記送信元が前記計算機である場合、
前記故障サーバ情報から、記録時刻が最新であるI/Oカード拡張装置の固有情報を検索し、
前記記録時刻が最新であるI/Oカード拡張装置の固有情報に関連する計算機の固有情報の記録の有無を判定し、
関連する計算機の固有情報の記録が有る場合、前記計算機の固有情報及び前記保持した時刻を、新たな情報として前記故障サーバ情報に記録し、
関連する計算機の固有情報の記録が無い場合、前記計算機の固有情報及び前記保持した時刻を、前記記録時刻が最新であるI/Oカード拡張装置の固有情報に対応づけて前記故障サーバ情報に記録し、
前記送信元が前記I/Oカード拡張装置である場合、
前記故障サーバ情報から、記録時刻が最新である計算機の固有情報を検索し、
前記記録時刻が最新である計算機の固有情報に関連するI/Oカード拡張装置の固有情報の記録の有無を判定し、
関連するI/Oカード拡張装置の固有情報の記録が有る場合、前記I/Oカード拡張装置の固有情報及び前記保持した時刻を、新たな情報として前記故障サーバ情報に記録し、
関連するI/Oカード拡張装置の固有情報の記録が無い場合、前記I/Oカード拡張装置の固有情報及び前記保持した時刻を、前記記録時刻が最新である計算機の固有情報に対応づけて前記故障サーバ情報に記録し、
前記故障サーバに記録した前記時刻に関する情報を故障通知制御要求に含めて、前記故障発生情報の送信元へ出力することを特徴とする請求項12記載の計算機システム。 - 前記I/Oカードの故障発生情報の前記管理PCに対する入力を契機に、前記管理PCは、
前記故障発生情報を前記管理PCへ出力した計算機に対し、前記管理PCから故障通知制御要求を出力し、
前記管理PCから出力された前記故障通知制御要求に基き、故障したI/Oカードを搭載する前記計算機のI/Oカードスロットを特定し、
前記故障通知制御要求を入力された計算機の固有情報を、前記第一の記憶部に保持される管理情報から検索し、
前記検索により発見した管理情報における計算機の固有情報に関連する前記I/Oカード拡張装置の固有情報の有無を判断し、
前記関連するI/Oカード拡張装置の固有情報がない場合、
新たなI/Oカードの故障発生情報の、前記管理PCへの入力を待ち、
前記関連するI/Oカード拡張装置の固有情報がある場合、
前記固有情報を有するI/Oカード拡張装置に対し、前記管理PCから前記故障通知制御要求を出力し、
前記管理PCから出力された故障通知制御要求に基き、故障したI/Oカードを搭載する前記I/Oカード拡張装置のI/Oカードスロットを特定することを特徴とする請求項12記載の計算機システム。 - 前記管理PCは、状態を判定するためのサーバ状態判定命令列を有することを特徴とする請求項12記載の計算機システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010126429A JP5422490B2 (ja) | 2010-06-02 | 2010-06-02 | 計算機システム及びi/o故障カード特定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010126429A JP5422490B2 (ja) | 2010-06-02 | 2010-06-02 | 計算機システム及びi/o故障カード特定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011253332A JP2011253332A (ja) | 2011-12-15 |
JP5422490B2 true JP5422490B2 (ja) | 2014-02-19 |
Family
ID=45417231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010126429A Expired - Fee Related JP5422490B2 (ja) | 2010-06-02 | 2010-06-02 | 計算機システム及びi/o故障カード特定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5422490B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014076842A1 (ja) | 2012-11-19 | 2014-05-22 | 富士通株式会社 | 情報処理装置、プログラムおよびログ出力方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06242984A (ja) * | 1993-02-16 | 1994-09-02 | Nec Field Service Ltd | コンピュータの障害処理装置 |
US7257659B2 (en) * | 2003-12-31 | 2007-08-14 | Intel Corporation | Method for signaling PCI/PCI-X standard hot-plug controller (SHPC) command status |
JP2006268515A (ja) * | 2005-03-24 | 2006-10-05 | Nec Corp | Pciカ−ド障害管理方式 |
JP5096905B2 (ja) * | 2007-12-20 | 2012-12-12 | 株式会社日立製作所 | サーバ装置及びそのリンク回復処理方法 |
-
2010
- 2010-06-02 JP JP2010126429A patent/JP5422490B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011253332A (ja) | 2011-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9760468B2 (en) | Methods and arrangements to collect data | |
US9513998B2 (en) | Management of microcode errors in a storage operation | |
US20150263909A1 (en) | System and method for monitoring a large number of information processing devices in a communication network | |
WO2009110111A1 (ja) | サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム | |
US8914495B2 (en) | Automatically detecting and locating equipment within an equipment rack | |
US20150032773A1 (en) | Monitoring a monitoring-target process | |
TW201709081A (zh) | 自動修復映像檔的方法及伺服器系統 | |
US20150169310A1 (en) | Maintaining firmware | |
US10275330B2 (en) | Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus | |
JP2016085728A (ja) | デバイス故障後のコンソールメッセージ回収方法およびシステム | |
JPWO2016013199A1 (ja) | 仮想化基盤管理装置、仮想化基盤管理システム、仮想化基盤管理方法、及び、仮想化基盤管理プログラム | |
US9160867B2 (en) | Information processing system for preventing job process from being redundantly performed, information processing apparatus, and program | |
US9454485B2 (en) | Sharing local cache from a failover node | |
US10956038B2 (en) | Non-volatile memory drive partitions within microcontrollers | |
US9594622B2 (en) | Contacting remote support (call home) and reporting a catastrophic event with supporting documentation | |
JP5422490B2 (ja) | 計算機システム及びi/o故障カード特定方法 | |
CN110764962A (zh) | 日志处理方法和装置 | |
JPWO2011051999A1 (ja) | 情報処理装置及び情報処理装置の制御方法 | |
JP2014006772A (ja) | 故障監視型通信機器、通信機器用故障監視記録方法、及びそのプログラム | |
WO2019241199A1 (en) | System and method for predictive maintenance of networked devices | |
US8655845B2 (en) | Reducing duplicate information when reporting system incidents | |
US8423584B2 (en) | Conditional inclusion of resources in a computer system configuration | |
WO2019144555A1 (zh) | 容灾数据的在线同步装置、方法及计算机可读存储介质 | |
US20240272973A1 (en) | Capturing and using dynamic information to manage field replace units | |
CN117093402A (zh) | 设备掉电后psu ac丢失事件的记录方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120417 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130903 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131004 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131125 |
|
LAPS | Cancellation because of no payment of annual fees |