JP5275715B2 - エラー通知方法、情報処理装置および通信システム - Google Patents

エラー通知方法、情報処理装置および通信システム Download PDF

Info

Publication number
JP5275715B2
JP5275715B2 JP2008198169A JP2008198169A JP5275715B2 JP 5275715 B2 JP5275715 B2 JP 5275715B2 JP 2008198169 A JP2008198169 A JP 2008198169A JP 2008198169 A JP2008198169 A JP 2008198169A JP 5275715 B2 JP5275715 B2 JP 5275715B2
Authority
JP
Japan
Prior art keywords
error
control unit
information
post
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008198169A
Other languages
English (en)
Other versions
JP2010039519A (ja
Inventor
致訓 日野
裕之 黒澤
栄吾 田中
涼一 尾上
朝史 嘉陽田
Original Assignee
株式会社日本デジタル研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日本デジタル研究所 filed Critical 株式会社日本デジタル研究所
Priority to JP2008198169A priority Critical patent/JP5275715B2/ja
Publication of JP2010039519A publication Critical patent/JP2010039519A/ja
Application granted granted Critical
Publication of JP5275715B2 publication Critical patent/JP5275715B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、情報通信装置においてOSが起動するまでに生じたエラーを処理する通信システムに関するものである。
PCなどの情報通信装置の起動時に障害が発生した場合における起動を確保するための様々な方法が、従来から提案されている。たとえば、下記特許文献1では、電源やPOST(Power On Self Test)のエラーを監視し、リトライを行う技術が開示されている。この技術によれば、偶発故障によるシステムダウンを防止できる。
特開2002−073362号公報
しかしながら、上記従来の技術は、主に回路の偶発故障を想定しており、あくまでリトライを目的としているため、情報通信装置が完全に止まった状態には対応できない。また、リトライによって正常起動を確保できてしまうことで、潜在的には不具合があるにも関わらず、ユーザが見過ごしてしまう、という問題があった。また、不具合が見過ごされた結果、その不具合が非常に重くなり、リトライが不能になるまで放置されることともなり、メンテナンスコストが増大する、という問題があった。
本発明は、上記に鑑みてなされたものであって、ハードウェア障害等の重篤なエラーも含めて、起動時に発生するエラーを監視することができ、かつエラーの内容を管理者に通知できるエラー通知方法、情報処理装置および通信システムを得ることを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、外部ネットワークを介して接続された管理端末との間で通信を行う通信制御部と、自端末の状態を監視する監視制御部と、を備えたクライアント端末におけるエラー通知方法であって、前記監視制御部が実行する処理として、起動時に実行されるPOSTのPOSTコードを取得し、POSTの進行状況を監視するPOST監視ステップと、前記監視中に最終のPOSTコード以外のPOSTコードで処理が停止したと判断した場合に、POSTを実行中に処理が停止した旨およびその時点のPOSTコードをエラー情報として保持するPOSTエラー保持ステップと、保持しておいたエラー情報を前記通信制御部に送信するエラー情報送信ステップと、を含み、前記通信制御部が実行する処理として、受信したエラー情報に基づいて、前記管理端末に対してエラーの内容を通知するためのファイルであるエラー通知ファイルを生成するファイル生成ステップと、前記エラー通知ファイルを前記管理端末に向けて送信するファイル送信ステップと、を含むことを特徴とする。
また、本発明にかかるエラー通知方法は、前記監視制御部が、POSTを実行中に処理が停止することなく正常にPOSTが終了したと判断した後に、最終のPOSTコードが所定時間にわたって変化していないと判断した場合に、OSの起動に失敗したと判断し、OSの起動が失敗した旨および最終のPOSTコードをエラー情報として保持するOS起動エラー保持ステップ、を含むことを特徴とする。
また、本発明にかかるエラー通知方法は、前記監視制御部が、前記POST監視ステップを実行する前に、給電の状況を監視し、正常に給電が行われていない箇所がある場合に、その旨および正常に給電が行われていない箇所への給電系統をエラー情報として保持する給電エラー保持ステップ、を含むことを特徴とする。
また、本発明にかかるエラー通知方法において、前記エラー情報送信ステップでは、前記エラー情報をまとめて送信するために必要な時間であるエラー情報保持タイムアウト時間を設定し、当該エラー情報保持タイムアウト時間が経過した時点で、保存されているすべてのエラー情報を前記通信制御部に送信することを特徴とする。
また、本発明にかかるエラー通知方法は、前記監視制御部がCPUの温度情報を取得する温度取得ステップ、をさらに含み、前記エラー情報送信ステップでは、前記温度取得ステップで取得した温度情報をエラー情報とともに前記通信制御部に送信し、前記ファイル生成ステップでは、前記エラー通知ファイルに温度情報を含めることを特徴とする。
また、本発明にかかるエラー通知方法は、前記給電エラー保持ステップにおいて前記通信制御部への給電が正常でないと判断された場合、前記監視制御部は、前記エラー情報送信ステップを実行せずに、保持しているエラー情報および温度情報を不揮発性メモリに記憶することを特徴とする。
また、本発明は、外部ネットワークを介して接続された管理端末との間で通信を行う通信制御部と、自装置の状態を監視する監視制御部とを備えた、クライアント端末として動作する情報処理装置であって、前記監視制御部が、起動時に実行されるPOSTのPOSTコードを取得することによりPOSTの進行状況を監視し、監視中に最終のPOSTコード以外のPOSTコードで処理が停止したと判断した場合に、POSTを実行中に処理が停止した旨およびその時点のPOSTコードをエラー情報として出力する監視部と、エラー情報を保持し、所定のタイミングで、保持しておいたエラー情報を前記通信制御部に送信するエラー通知制御部と、を備え、前記通信制御部が、受信したエラー情報に基づいて、前記管理端末に対してエラーの内容を通知するためのファイルであるエラー通知ファイルを生成し、当該エラー通知ファイルを前記管理端末に向けて送信することを特徴とする。
また、本発明にかかる情報処理装置において、前記監視部は、さらに、POSTを実行中に処理が停止することなく正常にPOSTが終了したと判断した後に、最終のPOSTコードが所定時間にわたって変化していないと判断した場合に、OSの起動に失敗したと判断し、OSの起動が失敗した旨および最終のPOSTコードをエラー情報として出力することを特徴とする。
また、本発明にかかる情報処理装置において、前記監視部は、さらに、前記POSTの進行状況を監視する前に、給電の状況を監視し、正常に給電が行われていない箇所がある場合に、その旨および正常に給電が行われていない箇所への給電系統をエラー情報として出力することを特徴とする。
また、本発明にかかる情報処理装置において、前記エラー通知制御部は、前記エラー情報をまとめて送信するために必要な時間であるエラー情報保持タイムアウト時間を設定し、当該エラー情報保持タイムアウト時間が経過した前記所定のタイミングで、保存されているすべてのエラー情報を前記通信制御部に送信することを特徴とする。
また、本発明にかかる情報処理装置において、前記監視部は、さらに、CPUの温度情報を取得し、取得した温度情報をエラー情報とともに出力し、前記エラー通知制御部は、エラー情報に加えて温度情報を前記通信制御部に送信し、前記通信制御部は、前記エラー通知ファイルにさらに温度情報を含めることを特徴とする。
また、本発明にかかる情報処理装置は、前記監視部が前記通信制御部への給電が正常でないと判断した場合、前記エラー通知制御部は、前記通信制御部への送信処理を実行せずに、保持しているエラー情報および温度情報を不揮発性メモリに記憶することを特徴とする。
また、本発明は、請求項7〜12のいずれか一つに記載のクライアント端末とネットワークを介して接続された、管理端末として動作する情報処理装置であって、POSTコードに対応した故障部位および故障原因を登録したエラー集計テーブルと、前記クライアント端末からエラー通知ファイルを受信した場合に、当該エラー通知ファイルに含まれるPOSTコードをキーに前記エラー集計テーブルから故障部位および故障原因を抽出し、得られた故障部位および故障原因を含む原因通知メッセージを生成し、当該原因通知メッセージを所定の端末に通知する制御部と、を備えることを特徴とする。
また、本発明にかかる情報処理装置において、前記エラー集計テーブルには、さらに、POSTコードと故障部位および故障原因との組合せに対する総発生件数を登録することとし、前記制御部は、前記原因通知メッセージに当該総発生件数をさらに含めることを特徴とする。
また、本発明にかかる情報処理装置において、前記制御部は、さらに、前記エラー通知ファイルによって正常に給電が行われていない箇所がある旨が通知された場合、その旨および正常に給電が行われていない箇所への給電系統を含む原因通知メッセージを生成することを特徴とする。
また、本発明にかかる情報処理装置は、前記所定の端末を、メンテナンスを担当する端末とすることを特徴とする。
また、本発明にかかる情報処理装置において、前記原因通知メッセージの通知は、電子メール、ファイル転送または所定のサーバへのアップロードにより実施することを特徴とする。
また、本発明にかかる通信システムは、請求項7〜12のいずれか一つに記載のクライアント端末と、請求項13〜17のいずれか1つに記載の管理端末と、を備えることを特徴とする。
本発明によれば、起動時に発生するエラーを監視し、エラーの内容を管理者に通知することとしたので、メンテナンス作業の効率を大幅に改善することができる、という効果を奏する。
以下に、本発明にかかる通信システムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
図1は、本発明にかかる情報処理装置の構成例を示す図である。図1の情報処理装置は、外部ネットワークとの間で情報の送受信を行う通信制御部1と、電源制御部2と、ユーザによるメイン電源を投入する操作を受け付けるPowerスイッチ3と、情報処理装置内の各部へ電源を供給する電源部4と、CPUやメモリなどから構成される中央処理装置5と、HDDなどから構成される記憶装置6とを備える。また、図1の点線は、各構成部へ電源を供給するためのパワーラインを表している。
また、中央処理装置5は、演算処理や制御処理などを行うCPU7と、アドレスバスおよびデータバスを制御するバス制御部8と、BIOS ROM9と、メインメモリ10とを備え、各部間はバスで接続されている。なお、図1では、データバスのみを示している。BIOS ROM9は、BIOS(Basic Input Output System)を格納する。BIOSは、情報処理装置内の各ハードウェアの初期化およびOSのロードなどを行うためのプログラムであって、POSTを実行するためのプログラム部分を含む。CPU7は、BIOSの記述にしたがい、POSTを含む処理を実行する。また、POSTが実行されると、バス制御部8が保持するレジスタ(図示せず)に、随時POSTコードが書き込まれる。メインメモリ10は、ランダムアクセスメモリであって、CPU7がPOSTを実行する際にメモリテストの対象となり、POST内のメモリテストが終了した後には、CPU7のワークメモリとして用いられる。また、CPU7がPOSTをすべて終了した場合には、OSを起動する際のワークメモリとして用いられる。
バス制御部8は、アドレスバス(図示せず)およびデータバス(以下、単に「バス」)を制御し、その際、データバスについては送信側と受信側を切り替える制御を行う。ここでは、CPU7とバスによって接続されたバス制御部8のみを示しているが、CPU7と記憶装置6との間にもバス制御部(IO制御部)(図示せず)が存在する。このバス制御部は、CPU7がPOSTにおいて記憶装置6をテストする場合は、CPU7と記憶装置6とが接続されるようにバスを切り替える。また、バス制御部8は、自身が保持するレジスタを随時参照して現在のPOSTコードを取得し、電源制御部2に対して接続されたバス(たとえばLPC(Low Pin Count)バス)に出力する。また、バス制御部8は、CPU7の近傍に設置された温度センサ(図示せず)から通知される温度情報を取得し、電源制御部2に対して接続された別のバス(たとえばUSB(Universal Serial Bus)バス)に出力する。なお、温度センサからバス制御部8への温度情報の通知は、たとえば、CPU7が温度情報をバス制御部8の所定のポートに書き込む方法でもよく、CPU7からバス制御部8へシリアルバスで送る方法でもよい。
図2は、電源制御部2の構成例を示すブロック図である。図2の電源制御部2は、制御部21と、記憶部22と、ハードウェア監視部23とを備える。制御部21は、通信制御部1との間で通信を行うエラー通知制御部24と、各部への電源の供給を行うよう電源部4を制御する給電制御部25と、を備える。記憶部22は、不揮発性メモリ26と、RAM(Random Access Memory)27とを備える。ハードウェア監視部23は、電源監視部28と、エラー監視部29とを備え、制御部21からの制御にしたがって電源に関する不具合および様々なエラーを監視する。たとえば、電源監視部28は、Powerスイッチ3の投入を監視するスイッチ監視部30と、電源部4より各構成部への電源の供給を監視する電圧・電流監視部31とを備える。また、エラー監視部29は、POSTコードおよび温度情報を制御部21に通知する。また、制御部21にはタイマ32が接続され、制御部21のエラー通知制御部24は、タイマ32からの通知を受けると、制御部21に通知されたエラーを通信制御部1に通知する。
つづいて、上記のように構成された情報処理装置を用いた通信システムにおけるエラー発生時の動作について説明する。図3は、本実施例の情報処理装置を用いた通信システムの構成例を示す図である。この通信システムは、上記情報処理装置を適用したクライアント端末50−m−n(m,n=1,2,…)と、営業所端末50−mと、ネットワーク51と、管理端末52とを備える。各クライアント端末は、事業者が提供するサービスのクライアントであるユーザが管理する端末である。なお、図3では、クライアント端末を、営業所“m”が管轄する端末“n”として示す。
営業所端末50−mは、クライアント端末50−m−nを管轄する営業所に設置される端末である。各営業所は、管轄するクライアント端末のメンテナンス(修理や問合せなど)を担当する。
管理端末52は、事業者が管理する端末であって、たとえばリモートメンテナンスセンタなどに設置される。図4は、図3の通信システムにおける管理端末52の構成例を示す図である。管理端末52は、制御部61および記憶部62を備え、記憶部62は、エラーの原因および件数等を含むテーブルであるエラー集計テーブル63を備える。管理端末52の制御部61は、内部ネットワークおよび外部ネットワーク(ネットワーク51)との間で送受信を行い、クライアント端末からエラーの発生および内容を通知するファイルであるエラー通知ファイルを受信し、また、クライアント端末および該当する営業所端末に対しエラー原因を通知する。ここで、営業所端末とクライアント端末との対応関係は、一例として、以下のように管理する。たとえば、クライアント端末を一意に示すコードが営業所端末を示すコードを含むコード体系とし、クライアント端末の不揮発性メモリ26にクライアント端末コード(たとえば、50−m−n)を記録しておくことで、クライアント端末コードから営業所コード(たとえば、50−m)を判別できるようにする。または、クライアント端末のMACアドレス(Media Access Control Address)や製造番号を、管理端末52の不揮発性メモリ(図示せず)に記録しておき、管理端末52において、営業所コード(たとえば、50−m)との対応をテーブルで保持する。
以下、クライアント端末50−1−2が起動する場合を例に、クライアント端末のエラー発生時の動作を詳細に説明する。
図5は、クライアント端末の起動時のエラー通知動作を示すフローチャートである。なお、クライアント端末が立ち上がっていない状態においても、クライアント端末の電源制御部2には通電されていることを前提とする。
電源制御部2のスイッチ監視部30は、Powerスイッチ3が投入されたことを検出すると(ステップS1)、その旨を制御部21に通知する。制御部21の給電制御部25は、これを受けて、クライアント端末内の各部に対して電源を供給するように電源部4を制御する。電源部4は、電源制御部2の制御にしたがい、通信制御部1,中央処理装置5,記憶装置6等の各構成部に対して電源を供給する。
電源制御部2の電圧・電流監視部31は、各構成部への給電系統(パワーライン)に対応して電源部4に搭載された電流・電圧センサ(図示せず)からの信号によって、電圧が適正に印加され特定の電流が検出されたか否かを監視する(ステップS2)。
たとえば、正常に給電されていない構成部(電源オンが失敗した構成部)があると判断した場合(ステップS2:Yes)、電圧・電流監視部31は、電源オンが失敗した旨および電源オンが失敗した給電系統を、制御部21に通知する(ステップS3)。そして、制御部21のエラー通知制御部24では、上記電源オンの失敗によって通知された情報(以下、エラー情報という)を、RAM27に保存する。なお、ここでのエラー情報は、電源オンが失敗した旨および電源オンが失敗した給電系統、である。
そして、上記ステップS3の処理において、中央処理装置5の電源オンが失敗してエラー情報を制御部21に通知した場合は(ステップS4:No)、以後のCPU7の起動処理は行われないので、制御部21のエラー通知制御部24は、所定のエラー情報保持タイムアウト時間の経過待ち状態に移行する。
また、上記ステップS2においてすべての構成部が正常に給電されていると判断した場合(ステップS2:No)、または、正常に給電されていない構成部はあるが中央処理装置5の電源オンが成功している場合は(ステップS4:Yes)、CPU7がBIOS ROM9にアクセスしBIOSを実行するので、電源制御部2のエラー監視部29では、以降、POSTの監視を行う(ステップS5)。
具体的には、POSTが実行されると、CPU7は、バス制御部8内のレジスタに、随時、POSTコードを書き込み、バス制御部8が、自身の保持するレジスタを随時参照して現在のPOSTコードを取得し、そのPOSTコードを電源制御部2に接続されたLPCバスに出力する。そして、電源制御部2のエラー監視部29では、出力されたPOSTコードを取得し、POSTの進行状況を監視する。
たとえば、上記監視中に取得したPOSTコードが最終のPOSTコードではなく、かつ、そのPOSTコードが予め規定された一定時間にわたって変化しなかった場合、エラー監視部29は、POSTを実行中に処理が停止したと判断し(ステップS5:Yes)、POSTを実行中に処理が停止した旨およびそのときのPOSTコード(エラー情報)を、制御部21に通知する(ステップS6)。ここで、処理が停止する具体的なケースとしては、たとえば、POST実行中にCPU7が停止(ハングアップ)することでPOSTが停止してしまう場合や、メインメモリ10のメモリテストなどでエラーが発生したことで、BIOSの制御において、システム起動に重大な障害があるためPOSTの続行に意味がないとしてPOSTが停止される場合などがある。制御部21のエラー通知制御部24では、このエラー情報をRAM27に保存し、その後、所定のエラー情報保持タイムアウト時間の経過待ち状態に移行する。
一方、電源制御部2のエラー監視部29によりPOSTを実行中に処理が停止したと判断されることなく、正常にPOSTが終了した場合(ステップS5:No)、CPU7は、OSの起動処理に入る(ステップS7)。CPU7は、BIOSに記述されたプログラムコードにしたがって、自身のアクセス先を、BIOS ROM9から、記憶装置6よりロードしたメインメモリ10上のOS起動プログラムの先頭に移す。ここで、電源制御部2のエラー監視部29は、バス制御部8から最終のPOSTコードが出力され、かつ、所定の時間(OSが起動するまでの妥当な時間)にわたってそのPOSTコードが変化しなかった場合、OSの起動に失敗したと判断する(ステップS8:Yes)。そして、OS起動が失敗した旨および最終のPOSTコード(エラー情報)を、制御部21に通知する(ステップS9)。制御部21のエラー通知制御部24では、このエラー情報をRAM27に保存し、その後、所定のエラー情報保持タイムアウト時間の経過待ち状態に移行する。
そして、制御部21のエラー通知制御部24では、エラー情報保持タイムアウト時間が経過した時点で(ステップS10)、RAM27に保存されているすべてのエラー情報を通信制御部1に送信する(ステップS11)。なお、上記エラー情報保持タイムアウト時間を設定する理由は、起動時に通知された複数のエラー情報をまとめて同時に通知するためである。したがって、上記エラー情報保持タイムアウト時間は、上記複数のエラー情報をまとめて通知するために必要となる十分な時間が設定される。たとえば、記憶装置6への電源オンのみが失敗した場合は(ステップS4:Yes)、CPU7がPOSTを実行していく中で、他のエラーによりPOSTが停止する(ステップS5:Yes)可能性がある。このような場合は、電源供給が失敗したことによるエラー情報(ステップS3)と、POST停止によるエラー情報(S6)とが通知されることになる。すなわち、エラー通知制御部24では、エラーの発生状況に応じて、ステップS3,ステップS6,ステップS9によるエラー情報のうちのいずれか一つ、ステップS3およびステップS6によるエラー情報、または、ステップS3およびステップS9によるエラー情報、を送信する場合がある。
なお、たとえば図1および図2の構成において、CPU7が正常に動作している場合、電源制御部2のエラー監視部29は、バス制御部8からUSBバスを通じて出力されるCPU7の温度情報を常時取得している。そして、エラー監視部29は、取得した温度情報を適宜処理して、常時、制御部21に通知する。具体的には、エラー監視部29は、温度情報を所定の閾値と比較し、たとえば、CPU7付近の温度が「高い/中温/低い」または「正常/異常」である旨を制御部21に通知している。これらの処理は、CPU7の動作中は継続して行われる。以下、この処理結果を温度ステータスと呼ぶ。そこで、本実施例では、電源制御部2の制御部21が、読み出したエラー情報を通信制御部1に送信する際に、上記で得られる温度ステータスについても同時に送信する。
また、上記ステップS2による監視で、通信制御部1への給電が正常でないと判断された場合には、電源制御部2は通信制御部1と通信を行うことができない。したがって、電源制御部2のエラー通知制御部24は、電圧・電流監視部31から通信制御部1の電源オンが失敗した旨を通知された場合、通信制御部1へエラー情報および温度ステータスを送信する代わりに、たとえば、記憶部22内の不揮発性メモリ26の所定の箇所に、上記送信すべきエラー情報および温度ステータスを書き込む。これにより、通信が不可能な場合であっても、メンテナンス担当者は、不揮発性メモリ26に書きこまれた内容を調べることでエラーの原因を知ることができる。
つぎに、通信制御部1は、管理端末52に対してエラー通知を行うために、受信したエラー情報等に基づいてエラー通知ファイルを作成する。
図6は、エラー通知ファイルの構成例を示す図である。図6のエラー通知ファイルは、一例として、「日時」,「識別番号」,「電源オンの成否」,「給電不可能系統の識別子」,「POSTコード」,「温度ステータス」,「エラーメッセージ」といった項目を含む。日時はシステム日付から取得される。識別番号は、クライアント端末を特定するためのシリアルナンバーであって、たとえば、電源制御部2の不揮発性メモリ26などから取得される。また、エラーメッセージは、エラーの原因と推測される内容を示すメッセージであって、通信制御部1が、POSTコードまたは電源オンの成否、に対応させてセットする。管理端末52の管理者は、単にPOSTコードを送られる場合、別途POSTコード表などを参照しなければ具体的な故障部位や故障原因を把握することは困難であるが、エラーメッセージを通知される場合は、これに比較して、即座に状況を把握できる。
そして、クライアント端末50−1−2の通信制御部1は、以上のように作成したエラー通知ファイルを管理端末52に対して送信する(ステップS12)。なお、エラー通知ファイルは、管理端末52に対して送信する代わりに、クライアント端末50−1−2を管轄する営業所端末50−1に対して送信してもよい。また、クライアント端末50−1−2の通信制御部1は、エラー通知ファイルを送信する代わりに、エラーの内容を特定のWebページにアップロードしてもよい。
なお、上記起動時の動作においてエラーが発生しなかった場合、すなわち、上記ステップS8の判断処理において、上記所定の時間(OSが起動するまでの妥当な時間)が経過する前にバス制御部8内のレジスタがクリアされ、OSの起動に成功したと判断した場合(ステップS8:No)、電源制御部2のエラー監視部29では、起動時の動作に異常がないと判断して(ステップS13)、図5のエラー通知処理を終了する。
以上のようにして送信されたエラー通知ファイルを受信すると、管理端末52の制御部61は、受信したエラー通知ファイルを「識別番号」単位にマージし、記憶部62内に保存する。
管理端末52の制御部61は、エラー通知ファイルの到着を随時または定期的にチェックする。制御部61は、エラー通知ファイルが到着していた場合、エラー集計テーブル63を参照してエラーの原因を特定する。図7は、エラー集計テーブル63の項目およびデータの一例を示す図である。図7のエラー集計テーブル63は、「エラーコード」,「故障部位」,「原因」,「現象」,「総発生件数」といった項目を備え、これまでのエラーを解析・集計した結果のデータが登録されている。
エラーコードには、POSTコードがセットされる。故障部位および原因には、実際に技術者などが解析を行って解明された結果が登録される。なお、故障部位および原因の解析では、エラー通知ファイルにおける「電源オンの成否」および「給電不可能系統の識別子」や、「温度ステータス」を参考にできる。現象は、そのクライアント端末に発生した現象であって、エラーコードによって特定される。すなわち、エラーコードが、最終のPOSTコード以外であれば「BIOS起動中停止」であり、最終のPOSTコードであれば「OS起動中停止」である。総発生件数は、同一の「エラーコード,故障部位,原因」の組合せに対して発生した、エラーの件数を集計した値である。
エラー集計テーブル63には、解析され登録されなければ原因が特定できないエラーが登録されている。POSTまで至らずに電源オンが失敗した場合は、その旨および給電不可能系統の識別子によって、即座に原因が特定できる。
管理端末52の制御部61は、エラー集計テーブル63を参照し、通知されたPOSTコードと一致するエラーコードについて、エントリを全て抽出する。そして、各エントリから「故障部位」,「原因」,「総発生件数」の値を取得し、これらにしたがってエラー原因を通知する。
たとえば、クライアント端末50−1−2からのエラー通知ファイルにおいて、エラーコード「52」が通知された場合を想定する。図7のデータ例では、エラーコードが「52」であるエントリは2件登録されている。したがって、管理端末52の制御部61は、エラー原因を通知するための原因通知メッセージとして、「CPU,BGAクラック,総発生件数5件」および「メモリ,コネクタ接触不良,総発生件数26件」を作成する。そして、制御部61は、作成した原因通知メッセージを営業所端末50−1に通知する。ここで、クライアント端末を管轄する営業所端末の特定(すなわち営業所端末と、クライアント端末との対応関係)は、エラー通知ファイルによって通知される「識別番号」と営業所端末の識別子との関連をメンテナンスセンタ側で管理することによって行う。なお、クライアント端末を納品する際に担当営業所を示す識別子を不揮発性メモリに書き込んでおき、その識別子をエラー通知ファイルに含めてもよい。
また、管理端末52の制御部61は、作成した原因通知メッセージをクライアント端末50−1−2に通知することもできる。なお、クライアント端末50−1−2へ通知を行うのは、クライアント端末内の通信制御部1が起動している可能性があるためである。すなわち、クライアント端末は、通信制御部1が起動している場合には原因通知メッセージを受信するので、これを自身内の不揮発性メモリ26に記録できる。これにより、担当営業所端末にかかるカストマ担当者が、クライアント端末のメンテナンスに出向いたときにその情報を参照できる。この際、たとえば、クライアントユーザがリトライを繰り返し、別のエラーが発生した場合には、カストマ担当者がメンテナンスに出向いたタイミングによっては、参照できる情報が増える可能性があるため、メンテナンス作業に有用である。なお、原因通知メッセージを受信したクライアント端末は、その内容をそのまま自身の画面に表示させてもよい。また、制御部61は、そのクライアント端末が接続されたLAN内の、別のクライアント端末に対して、原因通知メッセージを通知してもよい。
なお、電源オンが失敗した場合は、原因が明確であるので、その旨および給電不可能系統の識別子をそのまま搭載した原因通知メッセージを作成し、通知する。たとえば、「電源オン失敗,(識別子)」といった原因通知メッセージである。
また、図7の例では、エラー集計テーブル63にはPOST開始後のエラーについて登録し、POST開始後のエラーとPOST開始前のエラー(電源オンが失敗)とで、原因通知メッセージの作成方法を別としたが、エラー集計テーブル63は、POST開始前のエラー(電源オンが失敗)も登録する構成としてもよい。この構成の場合、エラーコードとして、POSTコードの他にも、給電不可能を示すコードなどを使用する。故障部位には、電源部4または、給電不可能系統であったハードウェアなどを登録する。こうしたエラー集計テーブル63を用いる場合、原因通知メッセージは、上述したPOST開始後のエラーについて用いた方法で統一的に作成できる。
営業所端末50−1に原因通知メッセージが到着することで、その営業所では、自身が管轄するクライアント端末の故障の原因を予め把握することができる。上記の例では、総発生件数からみて、「メモリコネクタ接触不良」である可能性が高く、ついで「CPUのBGAクラック」である可能性が高いことを把握することができる。これにより、メンテナンス作業の負担を軽減することができ、また、メンテナンス作業を実行する前から必要部品の準備,作業時間の見積もりなどが可能になるため、効率のよいメンテナンスが実現できる。
また、クライアント端末50−1−2に原因通知メッセージが到着することで、クライアント端末のユーザは、故障の程度を把握でき、一定の安心感を得られる。また、故障の重篤さを知ることで、業務への影響を把握することも可能となる。
このように、上記通信システムでは、担当営業所端末にかかるカストマ担当者が、エラーの発生したクライアント端末の所在および原因と推測される不具合を、実際にメンテナンス作業に出向く前に速やかに知ることができるので、保守用部品の準備などに資することができる。特に、本発明が主にターゲットとする重篤なハードウェア障害が発生した場合には、端末が全く利用できない状態であることが多い。ここで、たとえば、会計事務所のような、多くの顧問先を抱え、かつ税務申告など時期的に業務が集中する業種では、端末の起動不良は非常に重大な問題であり、メンテナンス完了までのレスポンス時間が特に短いことが要請される。したがって、こうした業種での利用形態では、本発明の有用性は非常に高くなる。
また、クライアント端末および営業所端末への原因通知メッセージの通知は、電子メール,ファイル転送,所定のサーバへのアップロードなど、どのような手段であってもよい。また、通知方法は、クライアント端末と営業所端末で異なっていても構わない。
なお、本実施例では、クライアント端末が直接ネットワークに接続されるように通信システムを構成したが、これに限らず、クライアント端末がそれぞれの所属する営業所の営業所端末に接続される構成としてもよい。図8は、本実施例の情報処理装置を用いた通信システムの、別の構成例を示す図である。図8では、ネットワーク51に対して接続された営業所端末50−mの配下に、各営業所端末が管轄するクライアント端末50−m−nが接続される場合を示している。この場合、クライアント端末からのエラー通知ファイルは必ず営業所端末を経由するので、営業所端末はリアルタイムにクライアント端末の状況を把握できる。また、営業所端末がクライアント端末への通知を行うこととなるので、管理端末52(メンテナンスセンタ側)の負担を軽減できる。
以上説明したように、本実施例の通信システムでは、クライアント端末である情報処理装置が、起動時に発生するエラーについて発生状況を網羅的に監視し、その内容を、ネットワークを介して管理端末に通知する構成とした。また、管理端末は、過去に発生したエラーの原因を集計したテーブルを保持し、このテーブルを参照して、推測される原因をクライアント端末または営業所端末に通知するとした。これにより、メンテナンス作業の効率を大幅に改善することができる。
以上のように、本発明にかかる情報処理装置は、起動時にエラー監視を行うクライアント端末として有用であり、特に、メンテナンスなど、サポート体制の強化が必要なシステムに適している。
本発明にかかる情報処理装置の構成例を示す図である。 電源制御部の構成例を示すブロック図である。 情報処理装置を用いた通信システムの構成例を示す図である。 図3の通信システムにおける管理端末の構成例を示す図である。 クライアント端末の起動時のエラー通知動作を示すフローチャートである。 エラー通知ファイルの構成例を示す図である。 エラー集計テーブルの項目およびデータの一例を示す図である。 情報処理装置を用いた通信システムの別の構成例を示す図である。
符号の説明
1 通信制御部
2 電源制御部
3 Powerスイッチ
4 電源部
5 中央処理装置
6 記憶装置
7 CPU
8 バス制御部
9 BIOS ROM
10 メインメモリ
21 制御部
22 記憶部
23 ハードウェア監視部
24 エラー通知制御部
25 給電制御部
26 不揮発性メモリ
27 RAM
28 電源監視部
29 エラー監視部
30 スイッチ監視部
31 電圧・電流監視部
32 タイマ
50−m 営業所端末
50−m−n クライアント端末
51 ネットワーク
52 管理端末
61 制御部
62 記憶部
63 エラー集計テーブル

Claims (18)

  1. 外部ネットワークを介して接続された管理端末との間で通信を行う通信制御部と、自端末の状態を監視する監視制御部と、を備えたクライアント端末におけるエラー通知方法であって、
    前記監視制御部が実行する処理として、
    起動時に実行されるPOST(Power On Self Test)のPOSTコードを取得し、POSTの進行状況を監視するPOST監視ステップと、
    前記監視中に最終のPOSTコード以外のPOSTコードで処理が停止したと判断した場合に、POSTを実行中に処理が停止した旨およびその時点のPOSTコードをエラー情報として保持するPOSTエラー保持ステップと、
    保持しておいたエラー情報を前記通信制御部に送信するエラー情報送信ステップと、
    を含み、
    前記通信制御部が実行する処理として、
    受信したエラー情報に基づいて、前記管理端末に対してエラーの内容を通知するためのファイルであるエラー通知ファイルを生成するファイル生成ステップと、
    前記エラー通知ファイルを前記管理端末に向けて送信するファイル送信ステップと、
    を含むことを特徴とするエラー通知方法。
  2. 前記監視制御部が、POSTを実行中に処理が停止することなく正常にPOSTが終了したと判断した後に、最終のPOSTコードが所定時間にわたって変化していないと判断した場合に、OSの起動に失敗したと判断し、OSの起動が失敗した旨および最終のPOSTコードをエラー情報として保持するOS起動エラー保持ステップ、
    を含むことを特徴とする請求項1に記載のエラー通知方法。
  3. 前記監視制御部が、前記POST監視ステップを実行する前に、給電の状況を監視し、正常に給電が行われていない箇所がある場合に、その旨および正常に給電が行われていない箇所への給電系統をエラー情報として保持する給電エラー保持ステップ、
    を含むことを特徴とする請求項1または2に記載のエラー通知方法。
  4. 前記エラー情報送信ステップでは、前記エラー情報をまとめて送信するために必要な時間であるエラー情報保持タイムアウト時間を設定し、当該エラー情報保持タイムアウト時間が経過した時点で、保存されているすべてのエラー情報を前記通信制御部に送信することを特徴とする請求項3に記載のエラー通知方法。
  5. 前記監視制御部がCPUの温度情報を取得する温度取得ステップ、
    をさらに含み、
    前記エラー情報送信ステップでは、前記温度取得ステップで取得した温度情報をエラー情報とともに前記通信制御部に送信し、
    前記ファイル生成ステップでは、前記エラー通知ファイルに温度情報を含めることを特徴とする請求項3または4に記載のエラー通知方法。
  6. 前記給電エラー保持ステップにおいて前記通信制御部への給電が正常でないと判断された場合、前記監視制御部は、前記エラー情報送信ステップを実行せずに、保持しているエラー情報および温度情報を不揮発性メモリに記憶することを特徴とする請求項5に記載のエラー通知方法。
  7. 外部ネットワークを介して接続された管理端末との間で通信を行う通信制御部と、自装置の状態を監視する監視制御部とを備えた、クライアント端末として動作する情報処理装置であって、
    前記監視制御部が、
    起動時に実行されるPOST(Power On Self Test)のPOSTコードを取得することによりPOSTの進行状況を監視し、監視中に最終のPOSTコード以外のPOSTコードで処理が停止したと判断した場合に、POSTを実行中に処理が停止した旨およびその時点のPOSTコードをエラー情報として出力する監視部と、
    エラー情報を保持し、所定のタイミングで、保持しておいたエラー情報を前記通信制御部に送信するエラー通知制御部と、
    を備え、
    前記通信制御部が、受信したエラー情報に基づいて、前記管理端末に対してエラーの内容を通知するためのファイルであるエラー通知ファイルを生成し、当該エラー通知ファイルを前記管理端末に向けて送信することを特徴とする情報処理装置。
  8. 前記監視部は、さらに、
    POSTを実行中に処理が停止することなく正常にPOSTが終了したと判断した後に、最終のPOSTコードが所定時間にわたって変化していないと判断した場合に、OSの起動に失敗したと判断し、OSの起動が失敗した旨および最終のPOSTコードをエラー情報として出力することを特徴とする請求項7に記載の情報処理装置。
  9. 前記監視部は、さらに、
    前記POSTの進行状況を監視する前に、給電の状況を監視し、正常に給電が行われていない箇所がある場合に、その旨および正常に給電が行われていない箇所への給電系統をエラー情報として出力することを特徴とする請求項7または8に記載の情報処理装置。
  10. 前記エラー通知制御部は、
    前記エラー情報をまとめて送信するために必要な時間であるエラー情報保持タイムアウト時間を設定し、当該エラー情報保持タイムアウト時間が経過した前記所定のタイミングで、保存されているすべてのエラー情報を前記通信制御部に送信することを特徴とする請求項9に記載の情報処理装置。
  11. 前記監視部は、さらに、CPUの温度情報を取得し、取得した温度情報をエラー情報とともに出力し、
    前記エラー通知制御部は、エラー情報に加えて温度情報を前記通信制御部に送信し、
    前記通信制御部は、前記エラー通知ファイルにさらに温度情報を含めることを特徴とする請求項9または10に記載の情報処理装置。
  12. 前記監視部が前記通信制御部への給電が正常でないと判断した場合、前記エラー通知制御部は、前記通信制御部への送信処理を実行せずに、保持しているエラー情報および温度情報を不揮発性メモリに記憶することを特徴とする請求項11に記載の情報処理装置。
  13. 請求項7〜12のいずれか一つに記載のクライアント端末とネットワークを介して接続された、管理端末として動作する情報処理装置であって、
    POSTコードに対応した故障部位および故障原因を登録したエラー集計テーブルと、
    前記クライアント端末からエラー通知ファイルを受信した場合に、当該エラー通知ファイルに含まれるPOSTコードをキーに前記エラー集計テーブルから故障部位および故障原因を抽出し、得られた故障部位および故障原因を含む原因通知メッセージを生成し、当該原因通知メッセージを所定の端末に通知する制御部と、
    を備えることを特徴とする情報処理装置。
  14. 前記エラー集計テーブルには、さらに、POSTコードと故障部位および故障原因との組合せに対する総発生件数を登録することとし、
    前記制御部は、前記原因通知メッセージに当該総発生件数をさらに含めることを特徴とする請求項13に記載の情報処理装置。
  15. 前記制御部は、さらに、
    前記エラー通知ファイルによって正常に給電が行われていない箇所がある旨が通知された場合、その旨および正常に給電が行われていない箇所への給電系統を含む原因通知メッセージを生成することを特徴とする請求項13または14に記載の情報処理装置。
  16. 前記所定の端末を、当該エラー通知を送信したクライアント端末に対応する営業所端末とすることを特徴とする請求項13、14または15に記載の情報処理装置。
  17. 前記原因通知メッセージの通知は、電子メール、ファイル転送または所定のサーバへのアップロードにより実施することを特徴とする請求項13〜16のいずれか一つに記載の情報処理装置。
  18. 請求項7〜12のいずれか一つに記載のクライアント端末と、
    請求項13〜17のいずれか1つに記載の管理端末と、
    を備えることを特徴とする通信システム。
JP2008198169A 2008-07-31 2008-07-31 エラー通知方法、情報処理装置および通信システム Expired - Fee Related JP5275715B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008198169A JP5275715B2 (ja) 2008-07-31 2008-07-31 エラー通知方法、情報処理装置および通信システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008198169A JP5275715B2 (ja) 2008-07-31 2008-07-31 エラー通知方法、情報処理装置および通信システム

Publications (2)

Publication Number Publication Date
JP2010039519A JP2010039519A (ja) 2010-02-18
JP5275715B2 true JP5275715B2 (ja) 2013-08-28

Family

ID=42012043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008198169A Expired - Fee Related JP5275715B2 (ja) 2008-07-31 2008-07-31 エラー通知方法、情報処理装置および通信システム

Country Status (1)

Country Link
JP (1) JP5275715B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110307746A1 (en) * 2010-06-07 2011-12-15 Sullivan Jason A Systems and Methods for Intelligent and Flexible Management and Monitoring of Computer Systems
JP5328720B2 (ja) * 2010-06-10 2013-10-30 株式会社コンテック 情報処理装置
JP5529686B2 (ja) * 2010-09-03 2014-06-25 萩原電気株式会社 コンピュータ装置の異常検査方法及びそれを用いたコンピュータ装置
JP5773775B2 (ja) 2011-06-24 2015-09-02 キヤノン株式会社 情報処理装置、印刷装置及び監視方法
WO2013021742A1 (ja) * 2011-08-05 2013-02-14 日本電気株式会社 設定情報複製範囲作成装置、設定情報複製範囲作成方法、およびプログラム
US10146657B2 (en) * 2014-03-26 2018-12-04 Intel Corporation Initialization trace of a computing device
WO2015194651A1 (ja) * 2014-06-20 2015-12-23 Necフィールディング株式会社 障害通知装置、障害通知方法及びプログラム
JP2017084207A (ja) * 2015-10-30 2017-05-18 Necプラットフォームズ株式会社 情報処理装置及びその診断方法、並びにコンピュータ・プログラム
JP6723400B1 (ja) * 2019-02-26 2020-07-15 レノボ・シンガポール・プライベート・リミテッド 情報処理装置および情報処理方法
JP7204543B2 (ja) * 2019-03-13 2023-01-16 株式会社東芝 情報処理装置、情報処理方法、プログラム、および電子機器
CN111258868B (zh) * 2020-01-16 2023-04-18 四川九州电子科技股份有限公司 一种自动监测和获取设备数据的方法及系统
JP7426269B2 (ja) 2020-03-27 2024-02-01 株式会社コンテック 情報処理装置および情報処理システム
CN112346928A (zh) * 2020-10-23 2021-02-09 深圳市中诺通讯有限公司 一种自动开关机测试设备和测试方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073362A (ja) * 2000-09-01 2002-03-12 Nec Software Shikoku Ltd 情報処理装置および起動エラーリトライ方法。
JP2006019802A (ja) * 2004-06-30 2006-01-19 Canon Inc Http通信装置

Also Published As

Publication number Publication date
JP2010039519A (ja) 2010-02-18

Similar Documents

Publication Publication Date Title
JP5275715B2 (ja) エラー通知方法、情報処理装置および通信システム
KR101540129B1 (ko) 원격 액세스 진단 디바이스 및 이의 방법들
CN112019370B (zh) 一种设备故障处理方法及系统
US20150311952A1 (en) Server Information Handling System NFC Management Sideband Feedback
TWI261748B (en) Policy-based response to system errors occurring during OS runtime
US10055004B2 (en) Redundant system and redundant system management method
US10069988B2 (en) Image forming apparatus, computer readable recording medium stored with computer program for controlling image forming apparatus, and method for controlling image forming apparatus
US8423162B2 (en) Control method for information processing system, information processing system, and program
JP5773775B2 (ja) 情報処理装置、印刷装置及び監視方法
JP5444739B2 (ja) 管理装置および管理システムおよび管理プログラム
JP2001005692A (ja) 計算機システムおよびその保守管理システム並びに障害通知方法
CN115599617B (zh) 总线检测方法、装置、服务器及电子设备
US20040024659A1 (en) Method and apparatus for integrating server management and parts supply tools
US8810842B2 (en) Printing system, printer, and non-transitory computer-readable medium storing printing control program
CN115080132A (zh) 信息处理方法、装置、服务器及存储介质
JP2000056868A (ja) 周辺装置の電源監視方法、電源監視装置、電源監視システム及び情報記録媒体
US20050188260A1 (en) Computer system maintenance and diagnostics techniques
JP6222759B2 (ja) 障害通知装置、障害通知方法及びプログラム
CN109634252B (zh) 一种根因诊断的方法、装置
JP4208494B2 (ja) ネットワークサーバへの負荷テストシステム
JP2005085078A (ja) 省電力対応装置を含むネットワークシステム
CN112084085B (zh) 系统断电记录方法
JP2009123108A (ja) 情報処理装置
CN114003426A (zh) 故障处理方法、系统和电子设备
JP2002157358A (ja) 障害対処方法、データ処理方法および装置、電化製品、情報記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130516

R150 Certificate of patent or registration of utility model

Ref document number: 5275715

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees