JP2004199423A - 処理監視装置 - Google Patents

処理監視装置 Download PDF

Info

Publication number
JP2004199423A
JP2004199423A JP2002367512A JP2002367512A JP2004199423A JP 2004199423 A JP2004199423 A JP 2004199423A JP 2002367512 A JP2002367512 A JP 2002367512A JP 2002367512 A JP2002367512 A JP 2002367512A JP 2004199423 A JP2004199423 A JP 2004199423A
Authority
JP
Japan
Prior art keywords
task
unit
monitoring
started
wireless communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002367512A
Other languages
English (en)
Inventor
Yasuhiro Matsuzaka
康宏 松坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Priority to JP2002367512A priority Critical patent/JP2004199423A/ja
Publication of JP2004199423A publication Critical patent/JP2004199423A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】タスクを実行するコンピュータの高負荷状態を検出する。
【解決手段】最優先で周期的に起動されるタスク34−1が起動されると、監視部38は、タスク34−1が前回、起動されてから、今回、起動されるまでの間に、1回以上、最下位の優先で起動されるタスク34−nが起動されたか否かを判断する。監視部38は、起動された場合には、エラーカウンタ部42のエラー回数をリセットし、起動されなかった場合には、エラーカウンタ部42のエラー回数をインクリメントする。監視部38は、エラー回数が上限値に達した場合には異常処理32を起動し、異常処理32は、異常処理を行う。
【選択図】 図6

Description

【0001】
【発明の属する技術分野】
本発明は、起動に優先順位が付された複数の処理(タスク)の動作を監視する処理監視装置に関する。
【0002】
【従来の技術】
従来から、ウオッチドグタイマ(Watch Dog Timer)と呼ばれるタイマを用いて、装置制御用コンピュータにおけるタスク実行を監視する方法が、一般的に用いられてきた。
例えば、特許文献1は、ウオッチドグタイマを用いたタスク実行監視方法を開示する。
【0003】
従来のウオッチドグタイマを用いたタスク実行監視は、タスクを実行するコンピュータのCPU、OSあるいはスケジューラに発生する重大な異常を検出することができる。
しかしながら、このウオッチドグタイマを用いた方法は、コンピュータが高負荷状態にあることを検出することができず、高負荷状態に起因する障害を回避したり、この障害に伴う異常処理を起動したりするために用いられえない。
【0004】
【特許文献1】特開平9−244923号公報
【0005】
【発明が解決しようとする課題】
本発明は、上述した背景からなされたものであり、タスクを実行するコンピュータの高負荷状態を検出することができる処理監視装置を提供することを目的とする。
また、本発明は、コンピュータの高負荷状態に起因する障害を回避したり、この障害に伴う異常処理を起動したりできる処理監視装置を提供することを目的とする。
【0006】
【課題を解決するための手段】
上記目的を達成するために、本発明にかかる処理監視装置は、起動順位に優先度が付された複数の処理の動作を監視する処理監視装置であって、最上位以外の前記優先度が付された第1の処理が起動されるたびに、前記第1の処理が起動されたことを示す起動情報の内容を、変更して保持する起動情報変更手段と、前記第1の処理よりも高い優先順位で起動され、前記起保持された動情報に基づいて、前記第1の処理の起動に対する監視を行う起動監視手段と、前記第1の処理の起動に対する監視の結果に基づいて、前記複数の処理の動作に異常が生じているか否かを判定する異常判定手段とを有する。
【0007】
【発明の実施の形態】
[第1実施形態]
以下、本発明の第1の実施形態を説明する。
図1は、本発明が適応される無線通信ネットワーク100の構成を例示する図である。
図1に示すように、無線通信ネットワーク100は、複数の無線通信装置1−1〜1−m(図1にはm=3の場合を例示)および制御センタ102が、伝送路ネットワーク104および通信ネットワーク106を介して接続された構成を採る。
【0008】
伝送路ネットワーク104は、これら無線通信装置1−1〜1−3による伝送の対象となる情報・音声などの伝送データを伝送する複数の伝送路を含む。
通信ネットワーク106は、無線通信装置1−1〜1−3と制御センタ102との間で、無線通信装置1−1〜1−3の監視および制御などに必要なデータを送受信する。
なお、伝送路ネットワーク104と通信ネットワーク106は、一体に構成されうる。
また、無線通信装置1−1〜1−3など、複数ある構成部分は、以下、単に無線通信装置1などと略記されることがある。
【0009】
[無線通信装置1]
図2は、図1および図2に示した無線通信装置1のハードウェア的な構成を示す図である。
無線通信装置1は、例えば、W−CDMA方式により通信を行う装置であって、図2に示すように、CPUおよびその周辺回路・メモリ120・記録装置122・ハードウェアタイマ(HWタイマ)126などを含む制御回路12、制御回路12に接続されたアラームランプ(ALM)128、アンテナ140と接続される無線回路14、ユーザインターフェース回路(UI回路)16、LCDディスプレイ装置、キーボードおよびマウスなどを含む表示・入力装置160、ネットワークインターフェース(ネットワークIF)18などから構成される。
【0010】
無線回路14は、伝送路ネットワーク104の伝送路と無線通信回線との間でデータを伝送する。
ネットワークIF18は、無線通信装置1と通信ネットワーク106との間のインターフェース機能を提供し、無線通信装置1と制御センタ102との間のデータの伝送を行う。
UI回路16は、表示・入力装置160のディスプレイ装置などに制御回路12から入力された情報を出力し、また、表示・入力装置160に対するユーザの操作を受け入れて、制御回路12に対して出力する。
【0011】
HWタイマ126は、例えば、制御回路12のCPUの動作クロックをハードウェア的にカウントし、カウント値を制御回路12に対して出力する。
また、HWタイマ126は、制御回路12上で動作するタスク(図4などを参照して後述)などの設定に従って、そのカウント値に基づき、所定の時間周期を示す信号を制御回路12に対して出力する。
また、HWタイマ126は、制御回路12上で動作するタスクなどの制御に従って、そのカウント値を0クリア(リセット)する。
【0012】
図3は、図1に示した無線通信装置1の外形を例示する図である。
図3に例示するように、無線通信装置1の各構成部分は、アンテナ140および表示・入力装置160などを除いて、バスケット型の筐体にカードとして収容され、筐体の全面のカードカバーには、図14に示したアラームランプ128用のLEDなどが配設されている。
無線通信装置1は、これらの構成部分により、伝送路ネットワーク104と無線通信回線との間で伝送する。
【0013】
[通信制御ソフトウェア2]
図4は、図2に示した無線通信装置1の制御回路12により実行される第1の通信制御ソフトウェア2の構成を示す図である。
図4に示すように、第1の通信制御ソフトウェア2は、CTRONなどのOS20上で動作する複数のタスク26−1〜26−n(n≧2)、カウンタ制御部22および異常処理部24から構成される。
通信制御ソフトウェア2は、例えば、記録媒体124(図2)を介して制御回路12に供給され、制御センタ102にロードされて実行される。
通信制御ソフトウェア2は、これらの構成部分により、無線通信回線と伝送路ネットワーク104などとの間のデータ伝送に必要な通信制御を行う。
また、通信制御ソフトウェア2は、これらの構成部分により処理監視を実現する。
【0014】
カウンタ制御部22は、HWタイマ126(図2)のカウント値を示すカウント値データを異常処理部24に対して出力する。
また、カウンタ制御部22は、タスク26−1などからの要求に応じて、HWタイマ126のカウント値をリセットする。
【0015】
異常処理部24は、カウンタ制御部22から入力されるカウント値データが、異常処理を起動するために設定された上限値を示す場合に、無線回路14の動作停止(通信停止)、通信制御の中止、アラームランプ128の点灯、表示・入力装置160への異常発生の表示、高負荷状態に伴って発生する障害の回避、このような障害による被害を最小限にするためのデータの退避、および、制御センタ102への異常発生の通知などの異常処理を行う。
なお、実際には、異常処理部24は、OS20を介して起動され、OS20を介してデータのやりとりを行うが、図示の簡略化・明確化のために、図4および以下の図には、通信制御ソフトウェアの各構成部分が、直接、必要なデータを受け渡す場合が示されている。
【0016】
通信制御ソフトウェア2は、OS20により起動され、通信制御、無線通信装置1の装置管理などの処理を実行する。
通信制御ソフトウェア2のタスク26−1〜26−nそれぞれには、その起動およびその実行に、第1位〜第n位の優先順位それぞれの優先順位が付されている。
【0017】
OS20は、この優先順位に従って、例えば、タスク26−1が最優先で起動および実行し、その次にタスク26−2を優先的に起動および実行し、タスク26−nを、最も低い優先順位で起動および実行する。
つまり、OS20は、第i位のタスク26−iを、第i番目の優先順位で起動および実行する。
なお、タスク26−1には、タスク26−1が起動したときに、カウンタ制御部22に対してHWタイマ126(図2)のカウント値のリセットを要求するリセット部260が含まれている。
【0018】
[通信制御ソフトウェア2の動作]
以下、通信制御ソフトウェア2の動作を説明する。
図5は、図4に示した通信制御ソフトウェア2の動作(S10)を示すフローチャートである。
図5に示すように、ステップ104(S104)において、タスク26−1(図4)が起動されるたびに、タスク26−1のリセット部260は、カウンタ制御部22に対してHWタイマ126のリセットを要求する。
リセット部260からの要求を受けると、カウンタ制御部22は、HWタイマ126のカウント値をリセットする。
【0019】
ステップ100(S100)において、異常処理部24は、カウンタ制御部22から入力されるカウント値データが示すHWタイマ126のカウント値が、異常処理起動のための上限値以上であるか否かを判断する。
通信制御ソフトウェア2は、カウント値≧上限値の場合にはS102の処理に進み、これ以外の場合にはS102の処理に進む。
【0020】
ステップ102(S102)において、異常処理部24は、制御回路12が、高負荷で、適切な時間周期あるいはタイミングで、タスク26−1〜26−nが起動および実行されていない状態にあること(動作異常)を検出し、さらに、上述したような異常処理を行う。
なお、制御回路12の処理負荷が適切で、最上位の優先順位が付された無線通信装置1が、適切な時間間隔で起動される場合には、異常処理部24に対するカウント値データが示すカウント値が、異常処理起動のための上限値に達することはない。
なお、リセット部260とタスク26−1とが、別々に通信制御ソフトウェア2に含まれていてもよい。
【0021】
[第2実施形態]
以下、本発明の第2の実施形態を説明する。
図6は、図2に示した無線通信装置1の制御回路12において、図4に示した第1の通信制御ソフトウェア2の代わりに実行される第2の通信制御ソフトウェア3の構成を示す図である。
図6に示すように、通信制御ソフトウェア3は、OS20、周期起動制御部30、異常処理32、複数のタスク34−1〜34−n、タスク34−nに含まれるカウント部36、タスク34−1に含まれる監視部38、監視用カウンタ部40およびエラーカウンタ部42から構成される。
【0022】
第2の通信制御ソフトウェア3も、第1の通信制御ソフトウェア2(図4)と同様に、記録媒体124(図2)を介して制御回路12に供給される。
第2の通信制御ソフトウェア3は、これらの構成部分により、第1の通信制御ソフトウェア2と同様に、無線通信回線と伝送路ネットワーク104(図1)などとの間のデータ伝送に必要な通信制御を行う。
また、通信制御ソフトウェア2は、これらの構成部分により処理監視を実現する。
【0023】
なお、同様に、監視部38は、最下位以外であって、カウント部36を含むタスク34−jよりも高い第k位の優先順位のタスク34−k(j>k)に含まれてもよく、カウント部36は、最上位以外であって、監視部38を含むタスク34−kよりも低い第j位の優先順位のタスク34−jに含まれていればよい。
また、カウント部36および監視部38それぞれは、必ずしもタスク34−n、34−1それぞれに含まれなくてもよく、独立したタスクとされてもよい。
この場合には、監視部38には、最下位以外であって、カウント部36よりも高い第k位の優先順位が付されればよく、また、カウント部36には、最上位以外であって、監視部38よりも低い第j位の優先順位が付されればよい。
【0024】
タスク34−1〜34−nは、タスク26−1〜26−n(図4)と同様に、OS20により起動され、通信制御、無線通信装置1の装置管理などの処理を実行する。
タスク34−1〜34−nそれぞれには、タスク26−1〜26−nそれぞれと同様に、タスク34−1を最上位とし、タスク34−nを最下位とする第1位〜第n位の優先順位が付されており、OS20は、この優先順位に従って、タスク34−1〜34−nを起動および実行する。
なお、以下、タスク34−1が周期起動制御部30により、周期的に起動される場合を具体例とする。
【0025】
周期起動制御部30は、HWタイマ126(図2)のカウンタ値に基づいて、タスク34−1を、予め定められた時間間隔で起動する。
また、周期起動制御部300は、各タスク34および監視部38などからの要求に応じて、HWタイマ126のカウント値をリセットする。
【0026】
カウント部36は、タスク34−nが起動されるたびに、監視用カウンタ部40のカウント値を1つず増加させる(カウントアップする)。
【0027】
監視部38は、タスク34−1が起動されるたびに、監視用カウンタ部40のカウント値をチェックし、監視用カウンタ部40のカウント値が、前回と異なるか(カウントアップされているか)否かを判断する。
監視部38は、監視用カウンタ部40のカウント値が、最新のチェック時と、前回のチェック時とで同じ場合には、エラーカウンタ部42のカウント値(エラー回数)を1つず増加させる(カウントアップする)。
【0028】
また、監視部38は、監視用カウンタ部40のカウント値(エラー回数)が、異常処理を起動するために予め定められた上限値を超えたか否かを判断し、監視用カウンタ部40のカウント値(エラー回数)が上限値を超えた場合には、異常の発生を異常処理32に通知し、これ以外の場合には、監視用カウンタ部40のカウント値を0クリア(リセットする)。
つまり、監視部38は、タスク34−1が起動されるタイミングで、周期的に、最下位の優先順位で起動および実行されるタスク34−nが起動されたか否かを判断し、タスク34−nが起動されないままでいる期間が異常の発生を示すほどに長くなった場合に、制御回路12の負荷が過大で異常が発生していると判断し、異常処理32を起動する。
【0029】
異常処理32は、監視部38から異常発生を通知されたときに、第1の通信制御ソフトウェア2の異常処理部24と同様な異常処理を行う。
【0030】
[通信制御ソフトウェア3の動作]
以下、通信制御ソフトウェア3の動作を説明する。
図7は、図6に示した通信制御ソフトウェア3の動作(S20)を示すフローチャートである。
図7に示すように、ステップ200(S200)において、タスク34−1が起動されると、監視部38は、タスク34−1の周期的な起動に用いられるHWタイマ126(図2)のカウント値のリセットを、周期起動制御部30に対して要求する。
周期起動制御部30は、この要求に応じて、HWタイマ126のカウント値を0クリア(リセット)する。
【0031】
ステップ202(S202)において、監視部38は、監視用カウンタ部40のカウント値をチェックし、前回のチェックと今回のチェックとで、監視用カウンタ部40のカウント値が変化したか否かを判断する。
つまり、監視部38は、タスク34−1が前回、起動されてから、今回、起動されるまでの間に、1回以上、最下位の優先順位のタスク34−nが起動されたか否かを判断する。
通信制御ソフトウェア3は、監視用カウンタ部40のカウント値が変化した場合にはS204の処理に進み、これ以外の場合にはS210の処理に進む。
【0032】
ステップ204(S204)において、監視部38は、エラーカウンタ部42のカウント値(エラー回数)をリセットする。
【0033】
ステップ206(S206)において、監視部38は、次回の処理のために、監視用カウンタ部40のカウント値を記憶する。
【0034】
ステップ210(S210)において、監視部38は、エラーカウンタ部42のカウント値(エラー回数)をインクリメントする。
【0035】
ステップ212(S212)において、監視部38は、エラーカウンタ部42のカウント値(エラー回数)が上限値に達したか否かを判断する。
通信制御ソフトウェア3は、エラー回数が上限値に達した場合にはS214の処理に進み、これ以外の場合にはS220の処理に進む。
【0036】
ステップ214(S214)において、監視部38は、異常処理32を起動し、異常処理32は、異常処理を行う。
【0037】
ステップ220(S220)において、通信制御ソフトウェア3は、次回、周期起動制御部30により起動されるまで、処理を停止する。
【0038】
【発明の効果】
異常説明したように、本発明にかかる処理監視装置によれば、タスクを実行するコンピュータの高負荷状態を検出することができる。
また、本発明にかかる処理監視装置によれば、コンピュータの高負荷状態に起因する障害を回避したり、この障害に伴う異常処理を起動したりできる。
【図面の簡単な説明】
【図1】本発明が適応される無線通信ネットワークの構成を例示する図である。
【図2】図1および図2に示した無線通信装置のハードウェア的な構成を示す図である。
【図3】図1に示した無線通信装置の外形を例示する図である。
【図4】図2に示した無線通信装置の制御回路により実行される第1の通信制御ソフトウェアの構成を示す図である。
【図5】図4に示した通信制御ソフトウェアの動作(S10)を示すフローチャートである。
【図6】図2に示した無線通信装置の制御回路において、図4に示した第1の通信制御ソフトウェアの代わりに実行される第2の通信制御ソフトウェアの構成を示す図である。
【図7】図6に示した通信制御ソフトウェアの動作(S20)を示すフローチャートである。
【符号の説明】
100・・・無線通信ネットワーク、
102・・・制御センタ、
104・・・伝送路ネットワーク、
106・・・通信ネットワーク、
1・・・無線通信装置、
12・・・制御回路、
120・・・メモリ、
122・・・記録装置、
124・・・記録媒体、
126・・・HWタイマ、
128・・・アラームランプ、
14・・・無線回路、
140・・・アンテナ、
16・・・UI回路、
160・・・表示・入力装置、
18・・・ネットワークIF、
2,3・・・通信制御ソフトウェア、
20・・・OS、
22・・・カウンタ制御部、
24,32・・・異常処理、
26,34・・・タスク、
260・・・リセット部、
36・・・カウント部、
38・・・監視部、
40・・・監視用カウンタ部、
42・・・エラーカウンタ部、

Claims (1)

  1. 起動順位に優先度が付された複数の処理の動作を監視する処理監視装置であって、
    最上位以外の前記優先度が付された第1の処理が起動されるたびに、前記第1の処理が起動されたことを示す起動情報の内容を、変更して保持する起動情報変更手段と、
    前記第1の処理よりも高い優先順位で起動され、前記起保持された動情報に基づいて、前記第1の処理の起動に対する監視を行う起動監視手段と、
    前記第1の処理の起動に対する監視の結果に基づいて、前記複数の処理の動作に異常が生じているか否かを判定する異常判定手段と
    を有する処理監視装置。
JP2002367512A 2002-12-19 2002-12-19 処理監視装置 Pending JP2004199423A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002367512A JP2004199423A (ja) 2002-12-19 2002-12-19 処理監視装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002367512A JP2004199423A (ja) 2002-12-19 2002-12-19 処理監視装置

Publications (1)

Publication Number Publication Date
JP2004199423A true JP2004199423A (ja) 2004-07-15

Family

ID=32764374

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002367512A Pending JP2004199423A (ja) 2002-12-19 2002-12-19 処理監視装置

Country Status (1)

Country Link
JP (1) JP2004199423A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006121667A (ja) * 2004-09-27 2006-05-11 Matsushita Electric Ind Co Ltd パケット受信制御装置及びパケット受信制御方法
JP2008154067A (ja) * 2006-12-19 2008-07-03 Hitachi Kokusai Electric Inc デジタル無線通信システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006121667A (ja) * 2004-09-27 2006-05-11 Matsushita Electric Ind Co Ltd パケット受信制御装置及びパケット受信制御方法
JP2008154067A (ja) * 2006-12-19 2008-07-03 Hitachi Kokusai Electric Inc デジタル無線通信システム

Similar Documents

Publication Publication Date Title
US7318171B2 (en) Policy-based response to system errors occurring during OS runtime
US20180278497A1 (en) Systems for monitoring application servers
JP2003173272A (ja) 情報処理システム,情報処理装置及び保守センタ
US20140068354A1 (en) Apparatus and method for determining a state of a mobile terminal
JP2004199423A (ja) 処理監視装置
JP5517301B2 (ja) データ処理システム
JP2006227962A (ja) アプリケーションタスク監視システムおよび方法
JP4313858B2 (ja) 計算機
JP2004070582A (ja) イベント通知タスク制御処理方式及び方法並びにプログラム
JPH10269110A (ja) 計算機システムのハングアップ回避方法並びにこの方法を用いた計算機システム。
JP3137025B2 (ja) データ処理システムの暴走検出方法
JP2677175B2 (ja) コンピュータシステムの外部イベント検出方式
JP2005182594A (ja) コンピュータ及びプログラム
JP4983806B2 (ja) 二重化タイマを用いたシステム監視装置、および監視方法
JP2003256243A (ja) プロセスストール監視方法及び監視システム
JPH11327959A (ja) プロセッサの異常監視方法及び装置
JPH01183744A (ja) プロセッサストール監視装置
CN117544584A (zh) 基于双cpu架构的控制方法、装置、交换机及介质
JP2004078665A (ja) タスク制御装置、及びタスク制御方法
CN114647540A (zh) 嵌入式调度器故障恢复方法、嵌入式系统及存储介质
JP2010134689A (ja) 組込みシステム、その再構成方法及びプログラム
KR100497893B1 (ko) 교환기의 장애 처리 방법 및 장치
WO2017037863A1 (ja) 計算機装置及び制御方法及び制御プログラム
JPH0756773A (ja) 制御装置診断方法
JP2001238237A (ja) 構内交換システム