JP2017162337A - 情報処理装置および制御プログラム - Google Patents
情報処理装置および制御プログラム Download PDFInfo
- Publication number
- JP2017162337A JP2017162337A JP2016048034A JP2016048034A JP2017162337A JP 2017162337 A JP2017162337 A JP 2017162337A JP 2016048034 A JP2016048034 A JP 2016048034A JP 2016048034 A JP2016048034 A JP 2016048034A JP 2017162337 A JP2017162337 A JP 2017162337A
- Authority
- JP
- Japan
- Prior art keywords
- cpu
- log
- processor
- log output
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims description 23
- 238000012545 processing Methods 0.000 claims abstract description 131
- 238000012546 transfer Methods 0.000 claims abstract description 110
- 230000006870 function Effects 0.000 claims abstract description 51
- 230000007704 transition Effects 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims description 61
- 230000008569 process Effects 0.000 claims description 57
- 230000005856 abnormality Effects 0.000 claims description 24
- 239000000872 buffer Substances 0.000 description 49
- 230000015654 memory Effects 0.000 description 25
- 238000012790 confirmation Methods 0.000 description 16
- 238000004886 process control Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 238000011835 investigation Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Landscapes
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
図1は実施形態の一例としてのコンピュータシステムのハードウェア構成を示す図、図2はその機能構成を示す図である。
以下、CPUを示す符号としては、複数のCPUのうち1つを特定する必要があるときには符号10−1〜10−4を用いるが、任意のCPUを指すときには符号10を用いる。
移管元のCPU10において、ログ出力処理制御部103は、CPU負荷収集部105が前回採取した自CPU10のCPU負荷情報をCPU負荷情報格納領域113から取得する。また、ログ出力処理制御部103は、CPU負荷収集部105に現在のCPU負荷情報を収集させる。
ログ出力処理制御部103は、ログ出力部102に、ログ出力対象情報114として保存されたCPU番号が示すCPU10に対応するログバッファ111に格納されたログ情報をログ用ディスク領域121に格納させる。
ログ出力処理制御部103は、CPU負荷情報格納領域113を参照して他CPU10のCPU負荷をそれぞれ取得し、負荷が最も低い(最低負荷)のCPU10を特定する。そして、この最低負荷のCPU10のCPU番号を代替CPU情報115に保存する。すなわち、負荷が最も低いCPU10をログ出力の移管先として決定する。
ログ出力処理制御部103は、代替CPU情報115として保存されたCPU番号が示すCPU10(移管先CPU10)に対して、移管していたログ出力の取り戻しを行なう旨のメッセージを通知する。このログ出力の取り戻しを行なう旨のメッセージは、移管先のCPU10に対して、ログ出力の移管を解除することを通知する。以下、ログ出力の取り戻しを行なう旨のメッセージの通知を移管解除通知という場合がある。また、ログ出力を取り戻すことを、ログ出力対象番号を取り戻すと表現する場合がある。
何も処理せず、処理を終了する。
移管先のCPU10において、ログ出力の移管解除通知を受信した場合、すなわち、ログ出力を取り戻す旨のメッセージ(取り戻し要求)を受信した場合には、ログ出力処理制御部103は、ログ出力対象情報(第2のログ出力対象情報)114から取り戻し要求の送信元のCPU10のCPU番号を削除する。これにより、当該CPU10のログ出力部102によるログ出力対象から、取り戻し要求の送信元のCPU10のログ情報が除外される。すなわち、当該CPU10に対するログ出力の移管が解消される。
先ず、上述の如く構成された実施形態の一例としてのコンピュータシステム1におけるログ出力の概要を、図7を用いて説明する。
また、ステップA6における確認の結果、ログ出力実行カウンタのカウンタ値が100未満である場合にも(ステップA6のNoルート参照)、ステップA9に移行する。
また、CPU#2は低負荷状態であるものとする。
また、CPU#3は低負荷状態であるものとする。
なお、図15においても、便宜上、CPU#1〜#3だけを例示している。
このように、本発明の一実施形態としてのコンピュータシステム1によれば、SMPカーネルの動作環境化において、ICEやHWシミュレータ等を用いることなくログ情報を収集することができ、カーネルや仮想化ソフトの障害調査が可能となる。
複数のCPU10のうちいずれかのCPU10において何らかの異常が発生した場合に、各CPU10で実行される詳細ログ収集部104のうち、最初にこの異常発生を検知した詳細ログ収集部104が、自CPU10と当該異常が発生しているCPU10とを除いた、他のCPU10を停止させる。これにより、リングバッファ構成を有するログバッファ111のログ情報が、これらのCPU10の動作に伴って生成されるログ情報により上書き消去されてしまうことを阻止することができる。
そして、開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成及び各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
(付記1)
複数のプロセッサを備える情報処理装置であって、
前記複数のプロセッサのうちの第1のプロセッサが、
当該第1のプロセッサの動作履歴情報を収集してログ記憶部に格納するログ収集部と、
前記ログ記憶部に格納された前記動作履歴情報を、不揮発性の記憶装置に移動させるログ出力部と、
当該第1のプロセッサが低負荷状態から高負荷状態に遷移した場合に、前記複数のプロセッサのうち最も低負荷の第2のプロセッサに、前記ログ出力部としての機能を移管させる移管処理部と
しての機能を実行することを特徴とする、情報処理装置。
前記移管処理部は、前記第1プロセッサが高負荷状態から低負荷状態に遷移した場合に、前記ログ出力部としての機能を移管した前記第2のプロセッサに対して、前記ログ出力部としての機能の移管を解除する通知を送信する
ことを特徴とする、付記1記載の情報処理装置。
前記第1のプロセッサが、
前記第1のプロセッサによって実行される前記ログ出力部が前記記憶装置に移動させる前記動作履歴情報に対応するプロセッサを示す第1のログ出力対象情報と、
前記第1のプロセッサによって実行されるログ出力部としての機能の移管先の前記第2のプロセッサを示す移管先プロセッサ情報とを備え、
前記移管処理部が、
前記第2のプロセッサに前記ログ出力部としての機能を移管させる際に、前記第1のログ出力対象情報から前記第1のプロセッサの登録を削除するとともに、前記移管先プロセッサ情報に前記第2のプロセッサを追加する
ことを特徴とする、付記2記載の情報処理装置。
前記移管処理部が、
前記第2のプロセッサに前記ログ出力部としての機能の移管を解除する通知を送信する際に、前記第1のログ出力対象情報に前記第1のプロセッサを追加するとともに、前記移管先プロセッサ情報から前記第2のプロセッサの登録を削除する
ことを特徴とする、付記3記載の情報処理装置。
前記第2のプロセッサが、
前記第2のプロセッサによって実行されるログ出力部が前記記憶装置に移動させる前記動作履歴情報に対応するプロセッサを示す第2のログ出力対象情報を備え、
前記第1のプロセッサから前記ログ出力部としての機能を移管させる通知を受信すると、前記第2のログ出力対象情報に前記第1のプロセッサを追加する
ことを特徴とする、付記2〜4のいずれか1項に記載の情報処理装置。
前記第2のプロセッサが、
前記第1のプロセッサから前記ログ出力部としての機能の移管を解除する通知を受信すると、前記第2のログ出力対象情報から前記第1のプロセッサの登録を削除する
ことを特徴とする、付記5記載の情報処理装置。
前記複数のプロセッサのうち第3のプロセッサに異常が検出された場合に、前記複数のプロセッサのうち前記第1プロセッサおよび第3のプロセッサ以外のプロセッサの動作を停止させる停止処理部
を備えることを特徴とする、付記1〜6のいずれか1項に記載の情報処理装置。
複数のプロセッサを備える情報処理装置において、
前記複数のプロセッサのうちの第1のプロセッサに、
当該第1のプロセッサの動作履歴情報を収集してログ記憶部に格納する処理と、
前記ログ記憶部に格納された前記動作履歴情報を不揮発性の記憶装置に移動させる処理と、
当該第1のプロセッサが低負荷状態から高負荷状態に遷移した場合に、前記複数のプロセッサのうち最も低負荷の第2のプロセッサに、前記動作履歴情報を不揮発性の記憶装置に移動させる処理を移管させる処理と
を実行させる制御プログラム。
前記第1プロセッサが高負荷状態から低負荷状態に遷移した場合に、前記動作履歴情報を不揮発性の記憶装置に移動させる機能を移管した前記第2のプロセッサに対して、前記移管を解除する通知を送信する
処理を前記第1のプロセッサに実行させることを特徴とする、付記8記載の制御プログラム。
前記第1のプロセッサが、前記第1のプロセッサによって実行される前記動作履歴情報を不揮発性の記憶装置に移動させる処理が移動させる前記動作履歴情報に対応するプロセッサを示す第1のログ出力対象情報と、前記第1のプロセッサによって実行される前記動作履歴情報を不揮発性の記憶装置に移動させる処理の移管先の前記第2のプロセッサを示す移管先プロセッサ情報とを備え、
前記第2のプロセッサに前記動作履歴情報を不揮発性の記憶装置に移動させる処理を移管させる際に、前記第1のログ出力対象情報から前記第1のプロセッサの登録を削除するとともに、前記移管先プロセッサ情報に前記第2のプロセッサを追加する
処理を前記第1のプロセッサに実行させることを特徴とする、付記9記載の制御プログラム。
前記第2のプロセッサに前記移管を解除する通知を送信する際に、前記第1のログ出力対象情報に前記第1のプロセッサを追加するとともに、前記移管先プロセッサ情報から前記第2のプロセッサの登録を削除する
処理を前記第1のプロセッサに実行させることを特徴とする、付記10記載の制御プログラム。
前記第2のプロセッサが、前記第2のプロセッサによって実行される前記動作履歴情報を不揮発性の記憶装置に移動させる処理が前記記憶装置に移動させる前記動作履歴情報に対応するプロセッサを示す第2のログ出力対象情報を備え、
前記第1のプロセッサから前記動作履歴情報を不揮発性の記憶装置に移動させる処理を移管させる通知を受信すると、前記第2のログ出力対象情報に前記第1のプロセッサを追加する
処理を前記第2のプロセッサに実行させることを特徴とする、付記9〜11のいずれか1項に記載の制御プログラム。
前記第1のプロセッサから前記移管を解除する通知を受信すると、前記第2のログ出力対象情報から前記第1のプロセッサの登録を削除する
処理を前記第2のプロセッサに実行させることを特徴とする、付記12記載の制御プログラム。
前記複数のプロセッサのうち第3のプロセッサに異常が検出された場合に、前記複数のプロセッサのうち前記第1プロセッサおよび第3のプロセッサ以外のプロセッサの動作を停止させる処理
を前記第1のプロセッサに実行させることを特徴とする、付記8〜13のいずれか1項に記載の制御プログラム。
10−1〜10−4,10 CPU
101 ログ収集部
1011 割込みコントローラ
1012 割込みハンドラ
102 ログ出力部
103 ログ出力処理制御部
104 詳細ログ収集部
105 CPU負荷収集部
11 メモリ
111 ログバッファ
112 デバッグカーネル動作用領域
113 CPU負荷情報格納領域
114 ログ出力対象情報
115 代替CPU情報
12 記憶装置
121 ログ用ディスク領域
Claims (8)
- 複数のプロセッサを備える情報処理装置であって、
前記複数のプロセッサのうちの第1のプロセッサが、
当該第1のプロセッサの動作履歴情報を収集してログ記憶部に格納するログ収集部と、
前記ログ記憶部に格納された前記動作履歴情報を、不揮発性の記憶装置に移動させるログ出力部と、
当該第1のプロセッサが低負荷状態から高負荷状態に遷移した場合に、前記複数のプロセッサのうち最も低負荷の第2のプロセッサに、前記ログ出力部としての機能を移管させる移管処理部と
しての機能を実行することを特徴とする、情報処理装置。 - 前記移管処理部は、前記第1プロセッサが高負荷状態から低負荷状態に遷移した場合に、前記ログ出力部としての機能を移管した前記第2のプロセッサに対して、前記ログ出力部としての機能の移管を解除する通知を送信する
ことを特徴とする、請求項1記載の情報処理装置。 - 前記第1のプロセッサが、
前記第1のプロセッサによって実行される前記ログ出力部が前記記憶装置に移動させる前記動作履歴情報に対応するプロセッサを示す第1のログ出力対象情報と、
前記第1のプロセッサによって実行されるログ出力部としての機能の移管先の前記第2のプロセッサを示す移管先プロセッサ情報とを備え、
前記移管処理部が、
前記第2のプロセッサに前記ログ出力部としての機能を移管させる際に、前記第1のログ出力対象情報から前記第1のプロセッサの登録を削除するとともに、前記移管先プロセッサ情報に前記第2のプロセッサを追加する
ことを特徴とする、請求項2記載の情報処理装置。 - 前記移管処理部が、
前記第2のプロセッサに前記ログ出力部としての機能の移管を解除する通知を送信する際に、前記第1のログ出力対象情報に前記第1のプロセッサを追加するとともに、前記移管先プロセッサ情報から前記第2のプロセッサの登録を削除する
ことを特徴とする、請求項3記載の情報処理装置。 - 前記第2のプロセッサが、
前記第2のプロセッサによって実行されるログ出力部が前記記憶装置に移動させる前記動作履歴情報に対応するプロセッサを示す第2のログ出力対象情報を備え、
前記第1のプロセッサから前記ログ出力部としての機能を移管させる通知を受信すると、前記第2のログ出力対象情報に前記第1のプロセッサを追加する
ことを特徴とする、請求項2〜4のいずれか1項に記載の情報処理装置。 - 前記第2のプロセッサが、
前記第1のプロセッサから前記ログ出力部としての機能の移管を解除する通知を受信すると、前記第2のログ出力対象情報から前記第1のプロセッサの登録を削除する
ことを特徴とする、請求項5記載の情報処理装置。 - 前記複数のプロセッサのうち第3のプロセッサに異常が検出された場合に、前記複数のプロセッサのうち前記第1プロセッサおよび第3のプロセッサ以外のプロセッサの動作を停止させる停止処理部
を備えることを特徴とする、請求項1〜6のいずれか1項に記載の情報処理装置。 - 複数のプロセッサを備える情報処理装置において、
前記複数のプロセッサのうちの第1のプロセッサに、
当該第1のプロセッサの動作履歴情報を収集してログ記憶部に格納する処理と、
前記ログ記憶部に格納された前記動作履歴情報を不揮発性の記憶装置に移動させる処理と、
当該第1のプロセッサが低負荷状態から高負荷状態に遷移した場合に、前記複数のプロセッサのうち最も低負荷の第2のプロセッサに、前記動作履歴情報を不揮発性の記憶装置に移動させる処理を移管させる処理と
を実行させる制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016048034A JP6617618B2 (ja) | 2016-03-11 | 2016-03-11 | 情報処理装置および制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016048034A JP6617618B2 (ja) | 2016-03-11 | 2016-03-11 | 情報処理装置および制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017162337A true JP2017162337A (ja) | 2017-09-14 |
JP6617618B2 JP6617618B2 (ja) | 2019-12-11 |
Family
ID=59857953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016048034A Active JP6617618B2 (ja) | 2016-03-11 | 2016-03-11 | 情報処理装置および制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6617618B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019152995A (ja) * | 2018-03-01 | 2019-09-12 | オムロン株式会社 | コンピュータおよびその制御方法 |
WO2020235088A1 (ja) * | 2019-05-23 | 2020-11-26 | 三菱電機株式会社 | 制御装置および分散処理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0227449A (ja) * | 1988-07-15 | 1990-01-30 | Nec Corp | ソフトウェア障害時の情報収集方式 |
JP2006085372A (ja) * | 2004-09-15 | 2006-03-30 | Toshiba Corp | 情報処理システム |
WO2012004854A1 (ja) * | 2010-07-06 | 2012-01-12 | 三菱電機株式会社 | プロセッサ装置及びプログラム |
JP2014010711A (ja) * | 2012-06-29 | 2014-01-20 | Fujitsu Ltd | ストレージシステムおよびストレージシステムの制御方法 |
JP2014206786A (ja) * | 2013-04-10 | 2014-10-30 | 富士通株式会社 | 性能データ収集プログラム、装置、及び方法 |
-
2016
- 2016-03-11 JP JP2016048034A patent/JP6617618B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0227449A (ja) * | 1988-07-15 | 1990-01-30 | Nec Corp | ソフトウェア障害時の情報収集方式 |
JP2006085372A (ja) * | 2004-09-15 | 2006-03-30 | Toshiba Corp | 情報処理システム |
WO2012004854A1 (ja) * | 2010-07-06 | 2012-01-12 | 三菱電機株式会社 | プロセッサ装置及びプログラム |
JP2014010711A (ja) * | 2012-06-29 | 2014-01-20 | Fujitsu Ltd | ストレージシステムおよびストレージシステムの制御方法 |
JP2014206786A (ja) * | 2013-04-10 | 2014-10-30 | 富士通株式会社 | 性能データ収集プログラム、装置、及び方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019152995A (ja) * | 2018-03-01 | 2019-09-12 | オムロン株式会社 | コンピュータおよびその制御方法 |
US11023335B2 (en) | 2018-03-01 | 2021-06-01 | Omron Corporation | Computer and control method thereof for diagnosing abnormality |
WO2020235088A1 (ja) * | 2019-05-23 | 2020-11-26 | 三菱電機株式会社 | 制御装置および分散処理方法 |
JP6808090B1 (ja) * | 2019-05-23 | 2021-01-06 | 三菱電機株式会社 | 制御装置および分散処理方法 |
CN113841119A (zh) * | 2019-05-23 | 2021-12-24 | 三菱电机株式会社 | 控制装置及分散处理方法 |
US11340954B2 (en) | 2019-05-23 | 2022-05-24 | Mitsubishi Electric Corporation | Control device and distributed processing method |
CN113841119B (zh) * | 2019-05-23 | 2022-12-27 | 三菱电机株式会社 | 控制装置及分散处理方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6617618B2 (ja) | 2019-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI528172B (zh) | 機器檢查摘要暫存器 | |
KR101944874B1 (ko) | 오류 처리 방법, 관련 장치 및 컴퓨터 | |
CN100504792C (zh) | 在用户空间中进行系统调用截取的方法和系统 | |
US8612937B2 (en) | Synchronously debugging a software program using a plurality of virtual machines | |
US7765526B2 (en) | Management of watchpoints in debuggers | |
US10990468B2 (en) | Computing system and error handling method for computing system | |
CN104704478A (zh) | 输入/输出错误遏制事件后的恢复 | |
US9436583B1 (en) | Minimally disruptive debugging in a production environment | |
US20170212815A1 (en) | Virtualization substrate management device, virtualization substrate management system, virtualization substrate management method, and recording medium for recording virtualization substrate management program | |
US11960366B2 (en) | Live migrating virtual machines to a target host upon fatal memory errors | |
US10514972B2 (en) | Embedding forensic and triage data in memory dumps | |
JP6617618B2 (ja) | 情報処理装置および制御プログラム | |
JP2009176146A (ja) | マルチプロセッサシステム、障害検出方法および障害検出プログラム | |
US20110202903A1 (en) | Apparatus and method for debugging a shared library | |
US9009671B2 (en) | Crash notification between debuggers | |
US9678823B2 (en) | Information processing apparatus, information processing method, and information processing system | |
JP5452336B2 (ja) | 周辺機器障害模擬システム、周辺機器障害模擬方法および周辺機器障害模擬プログラム | |
TWI469573B (zh) | 系統錯誤處理方法與使用其之伺服器系統 | |
JP2006039763A (ja) | ゲストosデバッグ支援方法及び仮想計算機マネージャ | |
Cerveira | Evaluating and improving cloud computing dependability | |
JP7312878B1 (ja) | 管理システム、情報処理装置、プログラム、及び情報処理方法 | |
US11977431B2 (en) | Memory error prevention by proactive memory poison recovery | |
US11392438B2 (en) | Responding to unresponsive processing circuitry | |
JP6896035B2 (ja) | 監視システム、監視SaaS提供装置、管理装置、及びプログラム | |
Fengler | Monitoring FreeBSD Systems What to (Not) Monitor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181210 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190607 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190911 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191028 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6617618 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |