JP2012069032A - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP2012069032A JP2012069032A JP2010214806A JP2010214806A JP2012069032A JP 2012069032 A JP2012069032 A JP 2012069032A JP 2010214806 A JP2010214806 A JP 2010214806A JP 2010214806 A JP2010214806 A JP 2010214806A JP 2012069032 A JP2012069032 A JP 2012069032A
- Authority
- JP
- Japan
- Prior art keywords
- monitoring
- unit
- failure information
- information management
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/0757—Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0721—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0787—Storage of error reports, e.g. persistent data storage, storage using memory protection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
【解決手段】情報処理装置8は、ソフトウェアを実行するCPU1と、ソフトウェアの動作を監視するウォッチドッグタイマ2と、ハードウェアの状態を監視するハードウェア監視デバイス4と、その監視結果を管理する障害情報管理用LSI3と、障害情報を保存する不揮発性メモリ6とを備える。ウォッチドッグタイマ2は、一定時間内にウォッチドッグトグルがない場合、CPU1に対してノンマスカブルの割り込み信号を通知して2回目のスタートを行う。CPU1は障害情報管理用LSI3から障害情報を収集する。収集が完了した場合はColdリセットを行って再起動し、収集が未完了の場合はHotリセットを行って再起動する。Hotリセットの場合、再起動後に障害情報を収集する。
【選択図】図1
Description
すなわち本発明は、情報処理装置としての動作に必要なソフトウェアを実行する処理部と、起動後に初回の監視用タイマをスタートさせた状態でソフトウェアを実行中の処理部から監視用の通知を受け取り、この通知に基づいてソフトウェアの動作を監視する動作監視部と、情報処理装置に内蔵されたハードウェアの状態を監視し、その監視結果を障害情報として管理する障害情報管理部と、障害情報管理部により管理される障害情報を保存する保存部とを備える。
図1は、一実施形態の情報処理装置8の構成を概略的に示すブロック図である。この情報処理装置8は、エンベデッドシステム(Embedded system)として特定の電子機器(例えばネットワーク中継機器、メディアコンバータ、スイッチングハブ等)に組み込まれるコンピュータハードウェアである。
また障害情報管理用LSI3は、ハードウェア監視デバイス4からの監視結果を常時管理し、通知された監視結果を内部のレジスタ(図示していない)に取り込む。
また不揮発性メモリ6は、障害発生時にCPU1が障害情報管理用LSI3から収集した障害情報を保存する。
情報処理装置8が起動すると、先ずウォッチドッグタイマ2は、初期状態でのリセットのタイプを「Hotリセット」に設定する(ステップS1)。これにより、例えば突然の情報処理装置8の再起動が発生した場合であっても、障害情報を残すことが可能になる。
これに対し、意図的な操作ではなく、情報処理装置8内で何らかの障害が発生した場合、本実施形態では以下の特徴的なプロセスが実行される。
CPU1による障害情報の収集プロセスが正常に完了すると、障害情報管理用LSI3はCPU1に収集完了を通知する(ステップS11:Yes)。続いてCPU1はウォッチドッグトグルの出力を停止する(ステップS13)。そして一定時間の経過後、ウォッチドッグタイマ2は「Coldリセット」をCPU1及び障害情報管理LSIに対して出力する(ステップS14)。
これに対し、2回目のウォッチドッグタイマ2がスタートした後、障害情報管理用LSI3から収集完了の通知がある前(ステップS11:No)に、一定時間にわたりウォッチドッグトグルが停止した場合(ステップS12:Yes)、ウォッチドッグタイマ2は「Hotリセット」をCPU1及び障害情報管理LSI3に対して出力する(ステップS17)。なお、障害情報の収集プロセスに進む前に一定時間にわたりウォッチドッグトグルが停止した場合(ステップS9:Yes)も同様である(接続記号A→A:図3へ)。
本実施形態においてCPU1の再起動後、前回のリセット命令のタイプが「Coldリセット」であったか、それとも「Hotリセット」であったかによって、以下のように処理の内容が異なる。
すなわち再起動後、CPU1は、障害情報管理LSI3の内部に保存されている情報に基づき、前回の再起動時に実行されたリセット命令のタイプを確認する(ステップS20)。このとき、リセット命令のタイプが「Coldリセット」であった場合、CPU1は障害情報の収集の処理を行わない(ステップS21:No)。そして、情報処理装置8の起動後から処理が再開される(接続記号C→C:図2のステップS1へ戻る)。この場合、既に障害情報の収集プロセスは完了しているため、再起動時に余分なソフトウェア処理が実行される手間を省略し、処理負荷を軽減してソフトウェアの通常動作を早期に再開することができる。
一方、リセット命令のタイプが「Hotリセット」であって(ステップS21:Yes)、かつ、ウォッチドッグタイマ2が満了したことが再起動の要因であった場合(ステップS22:Yes)、CPU1は障害情報の収集が未完了であると判断し、障害情報管理LS13の内部の障害情報を収集する(ステップS23)。そして、情報処理装置8の起動後から処理が再開される(接続記号C→C:図2のステップS1へ戻る)。これにより、障害情報を完全に収集せずにCPU1が再起動した場合であっても、再起動後に障害情報の収集を可能とした。
2 ウォッチドッグタイマ
3 障害情報管理用LSI
4 ハードウェア監視デバイス
5 フラッシュROM
6 不揮発性メモリ
7 DRAM
8 情報処理装置
Claims (4)
- 情報処理装置としての動作に必要なソフトウェアを実行する処理部と、
起動後に初回の監視用タイマをスタートさせた状態で前記ソフトウェアを実行中の前記処理部から監視用の通知を受け取り、この通知に基づいて前記ソフトウェアの動作を監視する動作監視部と、
情報処理装置に内蔵されたハードウェアの状態を監視し、その監視結果を障害情報として管理する障害情報管理部と、
前記障害情報管理部により管理される前記障害情報を保存する保存部とを備え、
前記動作監視部は、
一定時間内に前記監視用の通知を受け取らなかった場合、前記処理部に対して割り込み信号を通知するとともに、2回目の前記監視用タイマを改めてスタートさせ、
前記処理部は、
前記動作監視部から前記割り込み信号の通知を受けると、前記障害情報管理部から障害情報を収集して前記保存部に保存する収集プロセスを開始し、
前記処理部による前記収集プロセスが完了した場合、前記障害情報管理部から前記処理部に対して収集完了を通知する一方、この収集完了の通知を受け取った前記処理部は前記監視用の通知を止め、一定時間後、前記動作監視部から前記処理部及び前記障害情報管理部に対して第1のリセット命令を出力することで前記処理部を再起動させ、
前記処理部による前記収集プロセスが完了する前に、前記動作監視部に対して一定時間内に前記監視用の通知がなくなった場合、前記動作監視部から前記処理部及び前記障害情報管理部に対して第2のリセット命令を出力することで前記処理部を再起動させ、
前記処理部は再起動に際して、
前記第1のリセット命令が出力された場合は前記障害情報管理部から前記障害情報を収集することなく再起動を行う一方、前記第2のリセット命令が出力された場合は前記障害情報管理部から収集した前記障害情報を前記保存部に保存した上で再起動を行うことを特徴とする情報処理装置。 - 請求項1に記載の情報処理装置において、
前記障害情報管理部は、
前記ハードウェアの状態を常時監視して、その結果を障害情報として常時管理することを特徴とする情報処理装置。 - 請求項1又は2に記載の情報処理装置において、
前記動作監視部は、
一定時間内に前記監視用の通知がなかった場合、前記処理部に対してマスク不能な割り込み信号を通知し、
前記処理部は、
前記マスク不能な割り込み信号の通知を受けると、改めて前記動作監視部に前記監視用の通知を行うことで、前記動作監視部に2回目の前記監視用タイマをスタートさせることを特徴とする情報処理装置。 - 請求項1から3のいずれかに記載の情報処理装置において、
前記障害情報管理部は、
情報処理装置に内蔵されたハードウェアの状態を監視する監視デバイスと、
前記監視デバイスによる監視結果を管理する障害情報管理用LSIとを含むことを特徴とする情報処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010214806A JP2012069032A (ja) | 2010-09-27 | 2010-09-27 | 情報処理装置 |
US13/246,450 US8677185B2 (en) | 2010-09-27 | 2011-09-27 | Information processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010214806A JP2012069032A (ja) | 2010-09-27 | 2010-09-27 | 情報処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012069032A true JP2012069032A (ja) | 2012-04-05 |
Family
ID=45871927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010214806A Pending JP2012069032A (ja) | 2010-09-27 | 2010-09-27 | 情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8677185B2 (ja) |
JP (1) | JP2012069032A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015230521A (ja) * | 2014-06-03 | 2015-12-21 | 富士通株式会社 | 障害情報取得方法および情報処理装置 |
JP2019117662A (ja) * | 2019-04-12 | 2019-07-18 | Necプラットフォームズ株式会社 | 情報処理装置、故障検出方法、及びそのためのプログラム |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009099045A1 (ja) * | 2008-02-04 | 2009-08-13 | Nec Corporation | トレース・障害観測システム、トレース・障害観測方法及びトレース・障害観測プログラム |
US10289661B2 (en) | 2012-09-12 | 2019-05-14 | Flipboard, Inc. | Generating a cover for a section of a digital magazine |
US9165314B2 (en) * | 2012-09-12 | 2015-10-20 | Flipboard, Inc. | Interactions for sharing content items in a digital magazine |
US10061760B2 (en) | 2012-09-12 | 2018-08-28 | Flipboard, Inc. | Adaptive layout of content in a digital magazine |
US9037592B2 (en) | 2012-09-12 | 2015-05-19 | Flipboard, Inc. | Generating an implied object graph based on user behavior |
CN104331357B (zh) * | 2014-10-10 | 2018-07-10 | 北京金山安全软件有限公司 | 应用程序异常的检测方法、装置和移动终端 |
CN104899125B (zh) * | 2015-06-04 | 2019-01-29 | 新华三技术有限公司 | 一种单板系统的运行信息获取方法和装置 |
US10127095B2 (en) * | 2015-11-04 | 2018-11-13 | Quanta Computer Inc. | Seamless automatic recovery of a switch device |
US10761938B2 (en) * | 2016-09-30 | 2020-09-01 | Intel Corporation | System and method for granular reset management without reboot |
JP6737701B2 (ja) * | 2016-12-13 | 2020-08-12 | Necプラットフォームズ株式会社 | 周辺装置、ホスト装置、保守装置、情報処理システム、方法およびプログラム |
US10978020B2 (en) | 2017-12-20 | 2021-04-13 | Samsung Electronics Co., Ltd. | Display apparatus and method of operating the same |
GB2569792B (en) * | 2017-12-21 | 2020-04-08 | Canon Kk | Method and device for resetting at least one processing device |
CN109783266B (zh) * | 2019-01-02 | 2022-02-22 | 西安微电子技术研究所 | 一种面向空间计算机引导区的多模冗余与数据维护系统 |
JPWO2020217928A1 (ja) * | 2019-04-25 | 2020-10-29 | ||
CN114730281A (zh) * | 2019-11-26 | 2022-07-08 | 微芯片技术股份有限公司 | 具有引脚自主浮动的定时器电路和相关系统、方法和装置 |
CN113535448B (zh) * | 2021-06-30 | 2024-04-26 | 浙江中控技术股份有限公司 | 一种多重看门狗控制方法及其控制系统 |
CN117130832B (zh) * | 2023-10-25 | 2024-02-23 | 南京芯驰半导体科技有限公司 | 多核异构系统的监控复位方法、系统、芯片及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1153225A (ja) * | 1997-07-31 | 1999-02-26 | Hitachi Ltd | 障害処理装置 |
JPH1165898A (ja) * | 1997-08-21 | 1999-03-09 | Hitachi Ltd | 電子計算機の保守方式 |
JPH11161519A (ja) * | 1997-11-26 | 1999-06-18 | Nippon Signal Co Ltd:The | リセット装置 |
JP2003330575A (ja) * | 2002-05-17 | 2003-11-21 | Nissan Motor Co Ltd | マイクロコンピュータのリセット装置 |
JP2007094537A (ja) * | 2005-09-27 | 2007-04-12 | Hitachi Ltd | メモリダンプ装置及びメモリダンプ採取方法 |
JP2008293420A (ja) * | 2007-05-28 | 2008-12-04 | Denso Corp | 電子制御装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3824548B2 (ja) * | 2001-12-20 | 2006-09-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報処理装置、電源制御装置、情報処理装置制御方法、プログラム、及び記録媒体 |
US20040003317A1 (en) * | 2002-06-27 | 2004-01-01 | Atul Kwatra | Method and apparatus for implementing fault detection and correction in a computer system that requires high reliability and system manageability |
US20080270827A1 (en) * | 2007-04-26 | 2008-10-30 | International Business Machines Corporation | Recovering diagnostic data after out-of-band data capture failure |
JP2009211625A (ja) | 2008-03-06 | 2009-09-17 | Ricoh Co Ltd | 情報処理装置の起動ログ保存方法 |
-
2010
- 2010-09-27 JP JP2010214806A patent/JP2012069032A/ja active Pending
-
2011
- 2011-09-27 US US13/246,450 patent/US8677185B2/en not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1153225A (ja) * | 1997-07-31 | 1999-02-26 | Hitachi Ltd | 障害処理装置 |
JPH1165898A (ja) * | 1997-08-21 | 1999-03-09 | Hitachi Ltd | 電子計算機の保守方式 |
JPH11161519A (ja) * | 1997-11-26 | 1999-06-18 | Nippon Signal Co Ltd:The | リセット装置 |
JP2003330575A (ja) * | 2002-05-17 | 2003-11-21 | Nissan Motor Co Ltd | マイクロコンピュータのリセット装置 |
JP2007094537A (ja) * | 2005-09-27 | 2007-04-12 | Hitachi Ltd | メモリダンプ装置及びメモリダンプ採取方法 |
JP2008293420A (ja) * | 2007-05-28 | 2008-12-04 | Denso Corp | 電子制御装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015230521A (ja) * | 2014-06-03 | 2015-12-21 | 富士通株式会社 | 障害情報取得方法および情報処理装置 |
JP2019117662A (ja) * | 2019-04-12 | 2019-07-18 | Necプラットフォームズ株式会社 | 情報処理装置、故障検出方法、及びそのためのプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20120079328A1 (en) | 2012-03-29 |
US8677185B2 (en) | 2014-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012069032A (ja) | 情報処理装置 | |
WO2022198972A1 (zh) | 一种服务器启动过程中的故障定位方法、系统及装置 | |
CN111800304A (zh) | 进程运行的监测方法、存储介质和虚拟装置 | |
JP2006157482A (ja) | プログラマブル・ロジック・デバイス、情報処理装置、プログラマブル・ロジック・デバイスの制御方法 | |
JP4886558B2 (ja) | 情報処理装置 | |
CN115237644A (zh) | 系统故障处理方法、中央运算单元以及车辆 | |
JP6599725B2 (ja) | 情報処理装置およびログ管理方法、並びにコンピュータ・プログラム | |
JP2004302731A (ja) | 情報処理装置および障害診断方法 | |
TWI786871B (zh) | 電腦和系統啓動方法 | |
JP2013061841A (ja) | 情報処理装置および情報処理装置の試験方法 | |
JP2009211625A (ja) | 情報処理装置の起動ログ保存方法 | |
JP2007172096A (ja) | 情報処理装置、および、その起動制御方法 | |
JP2002149437A (ja) | ソフトウェア再起動方法 | |
TWI461905B (zh) | 可遠端當機復原的運算裝置、用於運算裝置之遠端當機復原之方法及電腦可讀取媒體 | |
JP5422426B2 (ja) | 情報処理装置 | |
JP5716396B2 (ja) | 情報処理装置及び情報処理方法 | |
WO2014112039A1 (ja) | 情報処理装置、情報処理装置制御方法及び情報処理装置制御プログラム | |
JP2002236503A (ja) | 車両用電子制御装置 | |
JP2012108848A (ja) | 動作ログ収集システム及びプログラム | |
JP6835422B1 (ja) | 情報処理装置及び情報処理方法 | |
JP2002182951A (ja) | 情報処理装置のメンテナンス方法および情報処理装置 | |
JP2006323494A (ja) | 障害復旧方法およびマイクロコンピュータ | |
JP2003242044A (ja) | マイクロコンピュータ回路 | |
JP7001236B2 (ja) | 情報処理装置、障害監視方法及び障害監視用コンピュータプログラム | |
JPS6312013A (ja) | デ−タ処理装置の再起動方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20111222 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120925 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120926 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130205 |