JP6823276B1 - 情報処理システム、情報処理装置およびプログラム - Google Patents
情報処理システム、情報処理装置およびプログラム Download PDFInfo
- Publication number
- JP6823276B1 JP6823276B1 JP2020021124A JP2020021124A JP6823276B1 JP 6823276 B1 JP6823276 B1 JP 6823276B1 JP 2020021124 A JP2020021124 A JP 2020021124A JP 2020021124 A JP2020021124 A JP 2020021124A JP 6823276 B1 JP6823276 B1 JP 6823276B1
- Authority
- JP
- Japan
- Prior art keywords
- log information
- communication interface
- communication
- control unit
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 69
- 238000004891 communication Methods 0.000 claims abstract description 160
- 238000012545 processing Methods 0.000 claims abstract description 53
- 230000005856 abnormality Effects 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 abstract description 10
- 238000000034 method Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 16
- 230000015654 memory Effects 0.000 description 14
- 230000003287 optical effect Effects 0.000 description 7
- 230000004913 activation Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
さらに、コンピュータに上記情報処理システムと同様の制御を実行させるプログラムが提供される。
[第1の実施の形態]
図1は第1の実施の形態の情報処理システムの一例を説明するための図である。第1の実施の形態の情報処理システム1−1は、情報処理装置1a、中継装置1b、および演算処理装置1c−1、・・・、1c−nを含む演算処理装置群1cを備える。
〔ステップS1〕制御部1a1は、演算処理装置群1cを動作させる第1のソフトウェアを通じてログ情報を取得できるか否かを判定する。第1のソフトウェアは、例えば、演算処理装置群1cを動作させるOSに相当する。第1のソフトウェアを通じてログ情報を取得できる場合はステップS2に処理が進み、取得が困難な場合はステップS3に処理が進む。
〔ステップS3〕制御部1a1は、中継装置1bの拡張バスを介して、駆動信号を通信部1b1に送信して通信部1b1を駆動させる。
〔ステップS6〕制御部1a1は、第2の通信インタフェースに対応する第2のソフトウェアでログ情報を取得する。すなわち、第2の通信インタフェースでメッセージ情報を収集、保存可能な第2のソフトウェアでログ情報を取得する。なお、第2のソフトウェアは、第1のソフトウェアとは異なり、情報処理装置1aを動作させるOSである。
次に第2の実施の形態について説明する。第2の実施の形態は、拡張バスの一例であるPCIeを用いた情報処理システムに本発明を適用したものである。また、本発明の情報処理システムは、一部装置のOSとして、Linux(第1のソフトウェア)を有するものとする。最初に、一般的なLinuxの起動の流れについて説明する。
〔ステップS11〕所定装置の電源がオンする。
〔ステップS12〕所定装置の構成デバイスの初期化処理等を行うプログラムデータであるBIOS(Basic Input Output System)が起動して、MBR(Master Boot Record)からブートローダが起動する。
〔ステップS14〕Linuxカーネルが起動し、Linuxカーネルは、メモリの初期化やシステムクロック等の設定を行う。
〔ステップS16〕ブートが完了すると、Linuxへのログインプロンプトが画面に表示され、起動処理が完了する。
したがって、ステップS15の手前で起動処理が何らかの原因で止まってしまうと(例えば、syslogデーモンが起動する前にカーネルクラッシュ等の障害が生じる場合等)、syslogデーモンが起動する前のログ情報を取得することが困難になる。
例えば、本発明では、図2のステップS12からステップS14の処理区間におけるログ情報を、シリアルコンソールへの出力メッセージとして、Windows(登録商標)等の汎用OSで取得できるように制御する。
図3は第2の実施の形態の情報処理システムの機能ブロックの一例を示す図である。第2の実施の形態の情報処理システム1−2は、メインボード10、ブリッジボード20およびコプロボード(拡張ボード)30−1、・・・、30−6を備える。
図4は情報処理装置のハードウェア構成の一例を示す図である。情報処理装置10aは、プロセッサ(コンピュータ)100によって全体制御されている。プロセッサ100は、制御部11の機能を実現する。
プロセッサ100は、マルチプロセッサであってもよい。プロセッサ100は、例えば、CPU、MPU、DSP、ASIC、またはPLDである。またプロセッサ100は、CPU、MPU、DSP、ASIC、PLDのうちの2以上の要素の組み合わせであってもよい。
図5はシリアルコンソールログを取得する際の動作の一例を説明するための図である。情報処理システム1−2では、コプロボード30−1、・・・、30−6のLinuxの起動が正常に行われた場合、制御部11は、syslogデーモンでコプロボード30−1、・・・、30−6のログ情報を取得する。また、Linuxの起動が正常に行われず、syslogデーモンによってログ情報が困難になる場合は、以下に示すような動作でログ情報の取得が行われる。
〔ステップS22〕制御部11は、BIOSによりUART通信IC22を駆動するための駆動信号(UART_ON)を、PCIeコネクタ4を介してブリッジボード20へ出力する。
〔ステップS24〕UART通信IC22は、駆動状態になると、コプロボード30−1、・・・、30−6から出力されるログ情報と、ブリッジコントローラ21から出力されるログ情報(中継装置用ログ情報)とを制御部11へ送信するためのスイッチ切替を行う。
なお、UART通信IC22は、データフロー制御を行うために、送信データ(TX)および受信データ(RX)の他に、CTS(Clear To Send)およびRTS(Request To Send)と呼ばれる信号を有している。CTSは、通信相手から来たデータ送信の許可信号を受け取るための信号であり、RTSは、通信相手にデータ送信を許可するための信号である。また、受信したこれらのログ情報は、PCIeコネクタ4を介して制御部11にUARTインタフェースで送信される。
このような制御により、コプロボード30−1、・・・、30−6のログ情報だけでなく、ブリッジコントローラ21(ブリッジボード20)のログ情報もシリアルコンソールログとして取得することができる。
次に図6から図8を用いて、システム立ち上げ時の動作シーケンスについて説明する。 図6から図8はシステム立ち上げ時の動作シーケンスの一例を示す図である。
〔ステップS31〕制御部11、ブリッジボード20およびコプロボード30は、ACPI(Advanced Configuration and Power Interface)の電力状態として、G2・S5のソフトオフ状態にある。
〔ステップS33〕電源制御部23は、電源状態の確認を行い、PSU24に対して電力出力指示を行う。具体的には、電源制御部23は、PSU24からアクティブ電力の12Vが現在出力していないことを確認すると、PSU24に対して12Vの出力指示を送信する。
〔ステップS36〕電源制御部23は、冷却用ファン(FAN)の動作チェックを行う。
〔ステップS38〕電源制御部23は、メインボード10の接続チェック等を行う。
〔ステップS40〕制御部11は、メインボード10内の電源をオンして、BIOSを起動する。
〔ステップS42〕UART通信IC22は、制御部11から駆動信号を受信して駆動する。
〔ステップS44〕制御部11は、POST処理が終了するまで待ち合わせる。
〔ステップS46〕電源制御部23は、コプロボード30に起動オン/オフ信号を送信して電源オンを行う。
〔ステップS47〕コプロボード30は、Linuxを起動する。
〔ステップS49〕制御部11は、仮想LANドライバ3aをロードする。
〔ステップS50〕コプロボード30は、仮想LANドライバ3aをロードする。
〔ステップS52〕コプロボード30は、サービス起動完了の通知を電源制御部23に送信する。
〔ステップS53〕電源制御部23は、状態表示部23aの電源LEDを点灯させる(起動完了で点灯)。
上記のシーケンスにおいて、コプロボード30がソフトオフ(ステップS31)になってからサービス起動完了通知(ステップS52)が行われる間の動作範囲H1のコプロボード30の起動ログが、制御部11が取得するコプロボード30のログ情報である。
次に図9、図10を用いて、コプロボード再起動時の動作シーケンスについて説明する。図9および図10はコプロボード再起動時の動作シーケンスの一例を示す図である。
〔ステップS61〕情報処理システム1−2は、S0(Working)の通常の運用状態にある。
〔ステップS64〕UART通信IC22は、制御部11から駆動信号を受信して駆動する。
〔ステップS66〕電源制御部23は、再起動要求を受けると、所定コプロボード30の接続チェック等を行う。
〔ステップS68〕所定コプロボード30は、G3(ハードオフ)の状態になる。
〔ステップS70〕所定コプロボード30は、Linuxを起動する。
〔ステップS71〕所定コプロボード30は、仮想LANドライバ3aをロードする。
〔ステップS73〕電源制御部23は、所定コプロボード30が再起動したことの通知(再起動通知)を制御部11に送信する。
〔ステップS75〕情報処理システム1−2は、S0(Working)の通常の運用状態になる。
次に図11から図13のフローチャートを用いて動作について説明する。図11はシステム立ち上げ時の動作フローチャートの一例を示す図である。
〔ステップS81〕電源制御部23は、PSU24に電力出力指示を送信し、PSU24は、電力出力指示にもとづいて、12Vを電源制御部23、制御部11およびブリッジボード20上の各デバイスに供給する。
〔ステップS83〕メインボード10が起動する。
〔ステップS84〕制御部11は、ログ収集サービス(ログ収集部11dの機能)を起動する。
〔ステップS87〕UART通信IC22は、リセットを解除して駆動状態になる。
〔ステップS88〕制御部11は、シリアルポート通信部11d2(COMポート)と通信を行う。
〔ステップS90〕電源制御部23は、コプロボード30の起動制御を行う。
〔ステップS91〕コプロボード30は、Linuxを起動する。
〔ステップS93〕仮想LANがリンクアップ状態で有効の場合はステップS94に処理が進み、仮想LANが無効の場合はステップS93の判定処理を繰り返す。
〔ステップS101〕コプロボード30の電源再起動制御が行われる。
〔ステップS102〕コプロボード30のLinuxがシャットダウンを開始する。
〔ステップS103〕仮想LANドライバ3aは、仮想LANのリンク状態を検出し、リンクダウン状態であることを制御部11に通知する。
〔ステップS107〕制御部11は、シャットダウンに関するログ情報をロギングする。
〔ステップS108〕コプロボード30はLinuxの起動を開始する。
〔ステップS109〕仮想LANドライバ3aは、仮想LANのリンク状態を検出し、リンクアップ状態であることを制御部11に通知する。
〔ステップS111〕仮想LANがリンクアップ状態で有効の場合はステップS112に処理が進み、仮想LANが無効の場合はステップS111の判定処理を繰り返す。
〔ステップS112〕制御部11は、ロギングを停止する。
〔ステップS121〕電源制御部23は、PSU24に電力出力指示を送信し、PSU24は、電力出力指示にもとづいて、12Vを電源制御部23、制御部11およびブリッジボード20上の各デバイスに供給する。
〔ステップS123〕メインボード10が起動する。
〔ステップS124〕制御部11は、ログ収集サービス(ログ収集部11dの機能)を起動する。
〔ステップS127〕UART通信IC22は、リセットを解除して駆動状態になる。
〔ステップS129〕制御部11は、UART通信IC22から送信されたログ情報をUSBインタフェースに変換して、シリアルポート通信部11d2からログ情報を取得してロギングを開始する。
〔ステップS131〕制御部11は、特定文字列のメッセージを検出すると、エラーメッセージのエラーコードを表示する。エラーコードは、例えば、図3に示した状態表示部23aを通じて、または図5に示した入出力インタフェース102を通じて表示される。
1a 情報処理装置
1a1 制御部
1b 中継装置
1b1 通信部
1c 演算処理装置群
1c−1、・・・、1c−n 演算処理装置
Claims (8)
- 複数の演算処理装置を含む演算処理装置群と、
駆動信号にもとづいて、前記演算処理装置群から出力されるログ情報を第1の通信インタフェースで通信を行う通信部を含み、拡張バスを介した中継通信を行う中継装置と、
前記演算処理装置群を動作させる第1のソフトウェアを通じて前記ログ情報を取得し、前記第1のソフトウェアによる前記ログ情報の取得が不可の場合は、前記拡張バスを介して、前記駆動信号を送信して前記通信部を駆動させて前記通信部から送信される前記第1の通信インタフェースの前記ログ情報を受信し、前記第1の通信インタフェースを第2の通信インタフェースに変換して、前記第2の通信インタフェースに対応する第2のソフトウェアで前記ログ情報を取得する制御部を含む情報処理装置と、
を有する情報処理システム。 - 前記制御部は、前記第1の通信インタフェースの前記ログ情報をシリアルポートから出力させるための前記第2の通信インタフェースに変換し、前記第2のソフトウェアで前記シリアルポートにシリアルコンソール接続して、前記ログ情報をシリアルコンソールログとして取得する請求項1記載の情報処理システム。
- 前記制御部は、前記第1の通信インタフェースから前記第2の通信インタフェースへの変換として、非同期シリアルバス通信インタフェースをシリアルバス通信インタフェースに変換する請求項1記載の情報処理システム。
- 前記制御部は、システム立ち上げ時または前記演算処理装置の異常を検知した場合に、前記駆動信号を前記通信部に送信する請求項1記載の情報処理システム。
- 前記通信部は、前記駆動信号にもとづいて、前記中継通信を行う中継制御部から出力される中継装置用ログ情報を前記第1の通信インタフェースで通信を行い、
前記制御部は、前記拡張バスを介して、前記駆動信号を送信して前記通信部を駆動させて前記通信部から送信される前記第1の通信インタフェースの前記中継装置用ログ情報を受信し、前記第1の通信インタフェースを前記第2の通信インタフェースに変換して、前記第2の通信インタフェースに対応する前記第2のソフトウェアで前記中継装置用ログ情報を取得する、
請求項1記載の情報処理システム。 - 前記演算処理装置群と前記情報処理装置は、前記中継装置を介したネットワークで接続され、
前記制御部は、前記ネットワークのリンクアップ状態を検出した場合は、前記駆動信号の送信を行わずに、前記ネットワークを介して前記ログ情報を前記第1のソフトウェアで取得し、前記ネットワークのリンクダウン状態を検出した場合は、前記駆動信号を送信して前記通信部を駆動させて、前記ログ情報を前記第2のソフトウェアにより取得する、
請求項1記載の情報処理システム。 - 複数の演算処理装置を含む演算処理装置群から出力されるログ情報を、前記演算処理装置群を動作させる第1のソフトウェアを通じて取得し、前記第1のソフトウェアによる前記ログ情報の取得が不可の場合は、第1の通信インタフェースで前記ログ情報の通信を行う通信部を含む中継装置の拡張バスを介して、前記通信部に駆動信号を送信して前記通信部を駆動させて前記通信部から送信される前記第1の通信インタフェースの前記ログ情報を受信し、前記第1の通信インタフェースを第2の通信インタフェースに変換して、前記第2の通信インタフェースに対応する第2のソフトウェアで前記ログ情報を取得する制御部、
を有する情報処理装置。 - コンピュータに、
複数の演算処理装置を含む演算処理装置群から出力されるログ情報を、前記演算処理装置群を動作させる第1のソフトウェアを通じて取得し、
前記第1のソフトウェアによる前記ログ情報の取得が不可の場合は、第1の通信インタフェースで前記ログ情報の通信を行う通信部を含む中継装置の拡張バスを介して、前記通信部に駆動信号を送信して前記通信部を駆動させて前記通信部から送信される前記第1の通信インタフェースの前記ログ情報を受信し、
前記第1の通信インタフェースを第2の通信インタフェースに変換して、前記第2の通信インタフェースに対応する第2のソフトウェアで前記ログ情報を取得する、
処理を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020021124A JP6823276B1 (ja) | 2020-02-12 | 2020-02-12 | 情報処理システム、情報処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020021124A JP6823276B1 (ja) | 2020-02-12 | 2020-02-12 | 情報処理システム、情報処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6823276B1 true JP6823276B1 (ja) | 2021-02-03 |
JP2021128396A JP2021128396A (ja) | 2021-09-02 |
Family
ID=74228016
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020021124A Active JP6823276B1 (ja) | 2020-02-12 | 2020-02-12 | 情報処理システム、情報処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6823276B1 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10271185A (ja) * | 1997-03-27 | 1998-10-09 | Toshiba Corp | 通信システム及びその障害管理方式 |
JP3838992B2 (ja) * | 2003-05-21 | 2006-10-25 | エヌイーシーシステムテクノロジー株式会社 | 障害検出方法及び情報処理システム |
JP2014182676A (ja) * | 2013-03-21 | 2014-09-29 | Nec Corp | ログ採取装置、演算装置、およびログ採取方法 |
JP2016170621A (ja) * | 2015-03-12 | 2016-09-23 | 株式会社リコー | 画像処理装置、画像処理方法、及びプログラム |
-
2020
- 2020-02-12 JP JP2020021124A patent/JP6823276B1/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2021128396A (ja) | 2021-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI446161B (zh) | 處理一多處理器資訊處理系統之一故障處理器的裝置及方法 | |
JP6530774B2 (ja) | ハードウェア障害回復システム | |
US7447934B2 (en) | System and method for using hot plug configuration for PCI error recovery | |
US8010843B2 (en) | System and method for debugging a target computer using SMBus | |
US6438622B1 (en) | Multiprocessor system including a docking system | |
US11797367B2 (en) | Displaying pre-boot error messages | |
JP3974288B2 (ja) | 周辺装置をコンピュータに登録する方法及び装置 | |
US20070055740A1 (en) | System and method for interacting with a remote computer | |
US11199890B2 (en) | Peripheral device expansion card system | |
US10210842B2 (en) | Techniques of displaying host data on a monitor connected to a service processor during pre-boot initialization stage | |
US11314578B2 (en) | Information handling system and method to detect and recover from spurious resets of PCIe devices | |
JP2004318883A (ja) | コンピュータシステム、インターフェースカードおよびインターフェースカードの設定方法 | |
US20200209947A1 (en) | Information processing system with a plurality of platforms | |
CN117555760B (zh) | 服务器监测方法及装置、基板控制器及嵌入式系统 | |
JP6823276B1 (ja) | 情報処理システム、情報処理装置およびプログラム | |
US20200387468A1 (en) | Information Processing System And Computer-Readable Recording Medium Storing Program | |
JP6691312B1 (ja) | 情報処理システム、情報処理装置およびプログラム | |
TWI782614B (zh) | 協調式初始化系統、資訊處置系統及用於協調計算系統中之多個子系統之初始化之方法 | |
JP6856884B1 (ja) | 情報処理システム、情報処理装置およびプログラム | |
JP6802511B1 (ja) | 情報処理装置、およびプログラム | |
US20210064108A1 (en) | Information processing system | |
JP6802512B1 (ja) | 情報処理装置、プログラム、および情報処理システム | |
CN118642979A (zh) | 适用不同类型PCIe Switch连接设备的统一排序方法及系统 | |
KR100631738B1 (ko) | 컴퓨터 시스템 진단 방법 및 장치 | |
JP6089543B2 (ja) | 試験方法および処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200305 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200305 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200811 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201221 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6823276 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |