JPH0798667A - Remote monitor system - Google Patents

Remote monitor system

Info

Publication number
JPH0798667A
JPH0798667A JP5242785A JP24278593A JPH0798667A JP H0798667 A JPH0798667 A JP H0798667A JP 5242785 A JP5242785 A JP 5242785A JP 24278593 A JP24278593 A JP 24278593A JP H0798667 A JPH0798667 A JP H0798667A
Authority
JP
Japan
Prior art keywords
monitoring
communication control
message
communication
software
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5242785A
Other languages
Japanese (ja)
Inventor
Yasuo Tanaka
靖男 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5242785A priority Critical patent/JPH0798667A/en
Publication of JPH0798667A publication Critical patent/JPH0798667A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE:To improve the stability of a remote monitor operation when the faul of a channel occurs and to precisely specify a fault occuring point on a remote monitor system. CONSTITUTION:A monitored system 15 provided with a software monitor means 11 monitoring the normality of the processing of software, a communication control means 13 controlling the communication of the duplexed channel and repeating-processing the duplexed channel and monitoring normality by the procedure and a notice means judging the presence or absence of the fault on a bidirectional loop-formed path between the duplexed channel and the software monitor means 11 through the communication control means 13, adding the result to a message received under communication control and returning it, and a monitor center 18 provided with a transmission means 16 which individually transmits the messages to the duplexed channel and a fault occurring period specification means 17 specifying a fault occurr: period based on the combination of the contents of the returned messages and the constitution of the path are provided.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、通信路を介してコンピ
ュータシステムが正常に動作しているか否かを監視する
遠隔監視システムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a remote monitoring system for monitoring whether a computer system is operating normally via a communication path.

【0002】[0002]

【従来の技術】遠隔地に設置されて無人運転されるコン
ピュータシステム等では、障害の発生を早期に検出して
効率的に復旧策を施すために、そのコンピュータシステ
ムに通信回線を介してアクセスすることにより動作が正
常であるか否かが遠隔監視される。
2. Description of the Related Art In a computer system or the like installed in a remote place and operated unattended, the computer system is accessed via a communication line in order to detect the occurrence of a failure at an early stage and effectively implement a recovery measure. As a result, whether or not the operation is normal is remotely monitored.

【0003】図9は、従来の遠隔監視システムの構成例
を示す図である。図において、監視センタ91は、モデ
ム921 、公衆通信網93、モデム92 2 およびサービ
スプロセッサ(SVP)94を介して監視対象の中央処
理装置(CPU)95に接続される。中央処理装置95
に要求される機能を実現するソフトウエアは、資源の統
括な管理・制御を行うオペレーティングシステム(以
下、単に「OS」という。)96と、上述した機能を実
現するアプリケーションソフトウエア(以下、単に「A
P」という。)97とから構成される。サービスプロセ
ッサ94は、所定のハードウエアを介してOS96に密
結合される。
FIG. 9 shows an example of the configuration of a conventional remote monitoring system.
FIG. In the figure, the monitoring center 91 is a model
Mu 921, Public communication network 93, modem 92 2And service
A central processing unit to be monitored via a processor (SVP) 94.
It is connected to the processing device (CPU) 95. Central processing unit 95
Software that realizes the functions required for
Operating system for comprehensive management and control (below
Below, it is simply called "OS". ) 96 and the above function
Appearing application software (hereinafter simply "A
P ”. ) 97 and. Service process
The server 94 is tightly coupled to the OS 96 via predetermined hardware.
Be combined.

【0004】このような構成の遠隔監視システムでは、
監視センタ91は、予め決められた周期でモデム9
1 、公衆通信網93およびモデム922 を介してサー
ビスプロセッサ94に、図10に示すフォーマットのメ
ッセージを送出する。このようなメッセージには、その
メッセージの識別情報ID(=1)、発生した障害の内容
を示す障害識別情報、障害発生の検出点を示す検出点識
別情報(SVP、OS、AP、監視センタ、…)、障害
の発生時刻およびこれらの情報全体のチェックサム(S
UM)が含まれる。
In the remote monitoring system having such a configuration,
The monitoring center 91 uses the modem 9 at a predetermined cycle.
2 1, the service processor 94 via the public communication network 93 and modem 92 2, sends a message in the format shown in FIG. 10. In such a message, the identification information ID (= 1) of the message, the fault identification information indicating the content of the fault that occurred, the detection point identification information indicating the detection point of the fault occurrence (SVP, OS, AP, monitoring center, …), Time of failure and checksum (S
UM) is included.

【0005】サービスプロセッサ94は、上述したメッ
セージを受信するとそのメッセージをOS96を介して
AP97に転送する。AP97は、このようなメッセー
ジを取り込んでOS96およびサービスプロセッサ94
を介して監視センタ91に返送する。
Upon receiving the above-mentioned message, the service processor 94 transfers the message to the AP 97 via the OS 96. The AP 97 captures such a message and stores it in the OS 96 and the service processor 94.
It is sent back to the monitoring center 91 via.

【0006】ところで、このようなメッセージの返送
(ループバック)の過程では、サービスプロセッサ94
およびOS96は、それぞれOS96およびAP97に
転送したメッセージと返送されて来たメッセージとの識
別情報フィールドを比較することにより返送すべきメッ
セージを決定し、さらに、このようなメッセージにその
比較の結果と予め決められた判断基準(例えば、タイム
アウト、チェックサムエラー、ハードウエアエラー)に
基づいて個別に検出した障害の識別情報とを盛り込む。
なお、以下では、このようなメッセージの編集・更新処
理を通報処理という。
By the way, in the process of returning (loopback) such a message, the service processor 94
And OS 96 determine the message to be returned by comparing the identification information field of the message transferred to OS 96 and the message returned to AP 97, respectively, and further determine the message to be returned with such message and the result of the comparison beforehand. The identification information of the failure individually detected based on the determined criteria (for example, timeout, checksum error, hardware error) is included.
In the following, such message edit / update processing is referred to as notification processing.

【0007】監視センタ91は、サービスプロセッサ9
4に先行して送出されたメッセージと返送されて来たメ
ッセージとの識別情報フィールドを比較し、その比較の
結果と予め決められた判断基準(例えば、タイムアウ
ト、チェックサムエラー、ハードウエアエラー)に基づ
いて検出した障害の識別情報とを盛り込んで総合的な監
視結果を示すメッセージを生成する。
The monitoring center 91 includes the service processor 9
4. Compare the identification information fields of the message sent before 4 and the message returned, and compare the result of the comparison with a predetermined criterion (eg, timeout, checksum error, hardware error). A message indicating the comprehensive monitoring result is generated by incorporating the identification information of the failure detected based on the information.

【0008】さらに、監視センタ91は、このようにし
て生成されたメッセージについて、先行して送出された
メッセージと識別情報フィールドの内容が一致し、かつ
その他のフィールドに何ら障害の検出を示す情報が含ま
れない場合には、所定の端末を介して担当者に正常であ
る旨の通知を行い、反対にこれらの何れかの条件が成立
しない場合には、生成されたメッセージの内容で与えら
れる障害の内容を同様にして通知する。
Further, the monitoring center 91 has the contents of the identification information field of the message thus generated and the contents of the identification information field, and the other fields contain information indicating the detection of a failure. If it is not included, the person in charge is notified that it is normal via a predetermined terminal, and conversely, if any of these conditions is not satisfied, the failure given by the content of the generated message Will be notified in the same way.

【0009】したがって、監視センタ91では、公衆通
信網93を介して遠隔地点に設置された中央処理装置9
5がOS96およびAP97の処理の下で正常に動作し
ているか否かを監視できる。
Therefore, in the monitoring center 91, the central processing unit 9 installed at a remote location via the public communication network 93.
5 can monitor whether or not it is operating normally under the processing of OS 96 and AP 97.

【0010】なお、このような従来の遠隔監視システム
では、上述したようにサービスプロセッサ94の監視下
で検出される中央処理装置95やOS96の障害だけで
はなく、サービスプロセッサ94や中央処理装置95が
自発的にマシンチェック割り込み、入出力完了割り込
み、プログラムチェック割り込み、タイマ監視その他に
基づいて検出する障害も併せて監視される。
In such a conventional remote monitoring system, not only the failure of the central processing unit 95 and the OS 96 detected under the monitoring of the service processor 94 as described above, but also the service processor 94 and the central processing unit 95 are detected. Faults detected spontaneously based on machine check interrupts, I / O completion interrupts, program check interrupts, timer monitoring, etc. are also monitored.

【0011】[0011]

【発明が解決しようとする課題】ところで、このような
従来の遠隔監視システムでは、例えば、モデム921
922 や公衆通信網93に何らかの障害が生じて監視セ
ンタ91とサービスプロセッサ94との間に通信路が形
成されない場合には、監視センタ91は、代替えの通信
路を形成できないために遠隔監視を続行不可能な状態に
陥り、さらに、このような通信路が正常に形成されて
も、何らかの障害により上述した通報処理およびその処
理に基づくメッセージの返送が正常に行われない場合に
は、障害の発生点を識別することはできなかった。
By the way, in such a conventional remote monitoring system, for example, the modem 92 1 ,
When a communication path is not formed between the monitoring center 91 and the service processor 94 due to some failure in the communication network 92 2 or the public communication network 93, the monitoring center 91 cannot perform the remote communication because the alternative communication path cannot be formed. Even if such a communication path is normally formed even if such a communication path is normally formed, if the above-mentioned notification processing and message return based on the processing are not normally executed due to some kind of failure, a failure will occur. The point of origin could not be identified.

【0012】本発明は、通信路の障害時における遠隔監
視動作の安定性を高め、かつ精度よく障害の発生点を特
定できる遠隔監視システムを提供することを目的とす
る。
It is an object of the present invention to provide a remote monitoring system which enhances the stability of the remote monitoring operation at the time of a failure of a communication path and can specify the occurrence point of the failure with high accuracy.

【0013】[0013]

【課題を解決するための手段】図1は、本発明の原理ブ
ロック図である。本発明は、所望の機能を実現するソフ
トウエアについて、そのソフトウエアの処理の正常性を
監視するソフトウエア監視手段11と、二重化された通
信路12 1、122の通信制御を行い、その通信制御の手
順に基づきこれらの通信路について中継処理と正常性の
監視とを行う通信制御手段131,132と、通信路12
1から通信制御手段131 、ソフトウエア監視手段11
および通信制御手段132を介して通信路122 に至る
双方向のループ状の経路について、ソフトウエア監視手
段11および通信制御手段131,132が行った監視の
結果から障害の有無を判定し、その判定の結果を通信制
御の下で通信路121、122から受信されたメッセージ
に付加して返送する通報手段14とを有する被監視シス
テム15と、通信路121、122に個別にメッセージを
送信する送信手段16と、通信路12 1、122を介して
個別に返送されるメッセージの内容の組合せと、経路の
構成とに基づいてその経路上における障害の発生区間を
特定する障害発生区間特定手段17とを有する監視セン
タ18とを備えたことを特徴とする。
FIG. 1 shows the principle of the present invention.
It is a lock figure. The present invention is a software that realizes a desired function.
Software, check the normality of the processing of that software.
The software monitoring means 11 for monitoring and the redundant communication
Faith 12 1, 122Communication control of the
Based on the order, relay processing and normal
Communication control means 13 for monitoring1, 132And the communication path 12
1To communication control means 131 , Software monitoring means 11
And communication control means 132Through the communication path 122Leading to
A software monitoring tool is available for bidirectional loop paths.
Stage 11 and communication control means 131, 132Of the monitoring done by
The presence or absence of a fault is determined from the result, and the result of the determination is controlled by communication.
Under the communication path 121, 122Message received from
To be monitored and attached to
System 15 and communication path 121, 122Individual message to
Transmission means 16 for transmitting and communication path 12 1, 122Through
The combination of message contents returned individually and the route
Based on the configuration and the fault occurrence section on the route
A monitoring sensor having a failure occurrence section specifying means 17 for specifying
And a switch 18 are provided.

【0014】[0014]

【作用】本発明にかかわる遠隔監視システムでは、通報
手段14は、それぞれ送信手段16からループ状の経路
の双方向に送信されたメッセージを通信制御手段1
1、132 を介して取り込み、そのメッセージにソフ
トウエア監視手段11および通信制御手段131,132
が取得した監視結果を付加して返送する。
In the remote monitoring system according to the present invention, the notifying means 14 sends the messages transmitted from the transmitting means 16 in both directions along the loop path to the communication control means 1.
3 1 and 13 2 are taken in, and the software monitoring means 11 and communication control means 13 1 and 13 2 are included in the message.
The monitoring result acquired by is added and returned.

【0015】このような監視結果が付加された2つのメ
ッセージについては、通信路121、122 および通信
制御手段131、132が共に正常であるときには何れも
上述したループ状の経路を介して監視センタ18に返送
され、反対に通信路121 、122 や通信制御手段13
1、132の何れか一方に障害が発生したときには、上述
したループ状の経路上でその障害の発生点の手前から折
り返して監視センタ18に返送される 障害発生区間特定手段17は、このようにして返送され
たメッセージを受信し、これらの内容の組合せと上述し
たループ状の経路の構成とに基づいてその経路上におけ
る障害の発生区間を特定するので、通信路の障害時にお
ける遠隔監視動作の安定性と障害の発生区間の特定確度
とが高められる。
With respect to the two messages to which such a monitoring result is added, when both the communication paths 12 1 and 12 2 and the communication control means 13 1 and 13 2 are normal, they are both routed through the above loop-shaped path. And sent back to the monitoring center 18, and on the contrary, the communication paths 12 1 and 12 2 and the communication control means 13
When a failure occurs in any one of 1 and 13 2, the failure occurrence section specifying means 17 returns from the point before the occurrence point of the failure on the above-mentioned loop route and returns it to the monitoring center 18. The message sent back to the device is received, and the faulty section on the route is specified based on the combination of these contents and the configuration of the loop-shaped route described above. Stability and accuracy of identifying a faulty section are improved.

【0016】[0016]

【実施例】以下、図面に基づいて本発明の実施例につい
て詳細に説明する。図2は、本発明の一実施例を示す図
である。
Embodiments of the present invention will now be described in detail with reference to the drawings. FIG. 2 is a diagram showing an embodiment of the present invention.

【0017】本実施例と図9に示す従来例との相違点
は、従来の機能に併せて後述の機能を有する監視センタ
21およびオペレーティングシステム(OS)22をそ
れぞれ監視センタ91およびOS96に代えて備え、O
S22と公衆通信網93との間に縦続接続された通信制
御装置(CCP)23およびモデム923 を備え、従来
の中央処理装置95に代えて、通信制御装置23にバス
を介して密結合する中央処理装置24を備えた点にあ
る。なお、図9に示すものと機能および構成が同じもの
については、同じ参照番号を付与して示し、ここではそ
の説明を省略する。
The difference between this embodiment and the conventional example shown in FIG. 9 is that the monitoring center 21 and the operating system (OS) 22 having the functions described below in addition to the conventional functions are replaced by the monitoring center 91 and the OS 96, respectively. Prepare, O
S22 and comprising a cascade connected communication control unit (CCP) 23 and a modem 92 3 between the public communication network 93, instead of the conventional central processing unit 95 will be tightly coupled through a bus to the communication control device 23 The central processing unit 24 is provided. It should be noted that parts having the same functions and configurations as those shown in FIG. 9 are designated by the same reference numerals, and the description thereof will be omitted here.

【0018】なお、本実施例と図1に示すブロック図と
の対応関係については、OS22およびAP97はソフ
トウエア監視手段11に対応し、公衆通信網93は通信
路121 、122 に対応し、サービスプロセッサ94
(モデム922 を含む。)および通信制御装置23(モ
デム923 を含む。)は通信制御手段131 、132
対応し、サービスプロセッサ94、通信制御装置23、
OS22およびAP97は通報手段14に対応し、中央
処理装置24、サービスプロセッサ94、通信制御装置
23およびモデム922 、923 は非監視システム15
に対応し、監視センタ21およびモデム921 は送信手
段16、障害発生区間特定手段17および監視センタ1
8に対応する。
Regarding the correspondence between this embodiment and the block diagram shown in FIG. 1, OS 22 and AP 97 correspond to the software monitoring means 11, and public communication network 93 corresponds to the communication paths 12 1 and 12 2. , Service processor 94
The communication control device 23 (including the modem 92 2 ) and the communication control device 23 (including the modem 92 3 ) correspond to the communication control means 13 1 and 13 2 , and include the service processor 94, the communication control device 23, and the communication control device 23.
OS22 and AP97 correspond to the reporting unit 14, the central processing unit 24, the service processor 94, the communication control unit 23 and a modem 92 2, 92 3 is non-monitoring system 15
Corresponding to the monitoring center 21 and the modem 92 1 transmitting unit 16, a faulty segment identifying means 17 and monitoring center 1
Corresponds to 8.

【0019】図3は、本実施例の動作フローチャートで
ある。図4は、本実施例の動作を説明する図(1)であ
る。図5は、本実施例の動作を説明する図(2)であ
る。
FIG. 3 is an operation flowchart of this embodiment. FIG. 4 is a diagram (1) for explaining the operation of this embodiment. FIG. 5 is a diagram (2) for explaining the operation of this embodiment.

【0020】図6は、本実施例の動作を説明する図
(3)である。以下、図2〜図6を参照して本実施例の
動作を説明する。監視センタ21とサービスプロセッサ
94との間にはモデム921 、公衆通信網93およびモ
デム922 を介して第一の通信路が設定され、かつ監視
センタ21と通信制御装置23との間にはモデム9
1 、公衆通信網93およびモデム923 を介して第二
の通信路が設定される。
FIG. 6 is a diagram (3) for explaining the operation of this embodiment. The operation of this embodiment will be described below with reference to FIGS. A first communication path is set between the monitoring center 21 and the service processor 94 via the modem 92 1 , the public communication network 93 and the modem 92 2 , and between the monitoring center 21 and the communication control device 23. Modem 9
2 1, second channel through the public communication network 93 and modem 92 3 is set.

【0021】監視センタ21では、監視タクスが起動さ
れ、その監視タスクは、第一の伝送経路(監視センタ2
1→モデム921 →公衆通信網93→モデム922 →サ
ービスプロセッサ94→OS22→AP97→OS22
→通信制御装置23→モデム923 →公衆通信網93→
モデム921 →監視センタ21)を示す情報「a」を識
別情報フィールドに設定して(図7)構成されたメッ
セージaを第一の通信路を介してサービスプロセッサ9
4に送信する(図3、図4(a)、図8(1))。
In the monitoring center 21, a monitoring task is activated, and its monitoring task executes the first transmission path (monitoring center 2).
1 → modem 92 1 → public communication network 93 → modem 92 2 → service processor 94 → OS22 → AP97 → OS22
→ communication control device 23 → modem 92 3 → public communication network 93 →
The message “a” indicating the modem 92 1 → the monitoring center 21) is set in the identification information field (FIG. 7), and the constructed message a is sent to the service processor 9 via the first communication path.
4 (FIG. 3, FIG. 4 (a), FIG. 8 (1)).

【0022】サービスプロセッサ94はこのようなメッ
セージをOS22に送出し(図8(2))、OS22はその
メッセージをAP97に送出する(図8(3))。さらに、
AP97は、このようなメッセージに通報処理を施して
OS22に返送し(図8(4))、OS22はそのメッセー
ジに通報処理を施して通信制御装置23に転送する(図
8(5))。通信制御装置23は、このようにして転送され
たメッセージに通報処理を施して返送メッセージa′を
生成し、モデム923 、公衆通信網93およびモデム9
1 を介して監視センタ21に返送する(図4(a)、図
8(6))。
The service processor 94 sends such a message to the OS 22 (FIG. 8 (2)), and the OS 22 sends the message to the AP 97 (FIG. 8 (3)). further,
The AP 97 performs notification processing on such a message and returns it to the OS 22 (FIG. 8 (4)), and the OS 22 performs notification processing on the message and transfers it to the communication control device 23 (FIG. 8 (5)). The communication control device 23 generates the thus returned subjected to notification process to the transferred message message a ', a modem 92 3, public communication network 93 and modem 9
Through the 2 1 returns to the monitoring center 21 (FIG. 4 (a), the 8 (6)).

【0023】監視タスクは、このような返送メッセージ
a′が一定時間内に受信されると、その返送メッセージ
に対応したステータス情報を何ら発せずに、第二の伝送
経路(監視センタ21→モデム921 →公衆通信網93
→モデム923 →通信制御装置23→OS22→AP9
7→OS22→サービスプロセッサ94→モデム92 2
→公衆通信網93→モデム921 →監視センタ21)を
示す情報「b」を識別情報フィールドに設定して(図7
)構成されたメッセージbを第二の通信路を介して通
信制御装置23に送信する(図3、図4(b)、図8
(7))。
The monitoring task is responsible for such return messages.
If a'is received within a certain time, its return message
Second transmission without issuing any status information corresponding to
Route (monitoring center 21 → modem 921→ Public communication network 93
→ Modem 923→ communication control device 23 → OS22 → AP9
7 → OS 22 → Service Processor 94 → Modem 92 2
→ Public communication network 93 → Modem 921→ Monitoring center 21)
Information "b" shown is set in the identification information field (see FIG. 7).
) Pass the constructed message b via the second communication path.
To the communication control device 23 (FIG. 3, FIG. 4 (b), FIG.
(7)).

【0024】通信制御装置23はこのようなメッセージ
をOS22に送出し(図8(8))、OS22はそのメッセ
ージをAP97に送出する(図8(9))。さらに、AP9
7は、このようなメッセージに通報処理を施してOS2
2に返送し(図8(10)) 、OS22はそのメッセージに
通報処理を施してサービスプロセッサ94に転送する
(図8(11)) 。サービスプロセッサ94は、このように
して転送されたメッセージに通報処理を施して返送メッ
セージb′を生成し、モデム922 、公衆通信網93お
よびモデム921 を介し監視センタ21に返送する(図
4(b)、図8(12)) 。
The communication control device 23 sends such a message to the OS 22 (FIG. 8 (8)), and the OS 22 sends the message to the AP 97 (FIG. 8 (9)). Furthermore, AP9
7 sends the message to such a message, and OS2
Then, the message is sent back to the service processor 94 (FIG. 8 (10)), and the OS 22 performs notification processing on the message and transfers it to the service processor 94 (FIG. 8 (11)). The service processor 94 performs notification processing on the message thus transferred to generate a return message b ', and returns it to the monitoring center 21 via the modem 92 2 , the public communication network 93 and the modem 92 1 (FIG. 4). (b), Figure 8 (12)).

【0025】監視タスクは、このような返送メッセージ
b′が一定時間内に受信されると、その返送メッセージ
に対応したステータス情報を何ら発せずに検定タスクを
起動する。
When such a return message b'is received within a fixed time, the monitoring task activates the verification task without issuing any status information corresponding to the return message.

【0026】検定タスクは、上述したステータス情報が
監視タスクから発せられず、返送メッセージa′、b′
の内容に検出点識別情報が含まれず、さらに、チェック
サムフィールドの内容が識別情報フィールド、障害識別
情報フィールド、検出点識別情報フィールド、障害発生
時刻フィールドの内容に対応して正規であることを認識
すると、何ら警報を送出せずに処理を終了する。
In the verification task, the above-mentioned status information is not issued from the monitoring task, and the return messages a'and b '
The contents of the checksum field do not include the detection point identification information, and it is recognized that the contents of the checksum field are authentic corresponding to the contents of the identification information field, the failure identification information field, the detection point identification information field, and the failure occurrence time field. Then, the process is terminated without sending any alarm.

【0027】しかし、上述したように各部が正常に作動
している場合とは異なり、例えば、OS22側に何らか
の障害が発生した場合には、サービスプロセッサ94
は、その障害を認識するとメッセージaにその障害を示
す情報を付加する(検出点識別情報として「OS(対S
VP)」を設定し、障害識別情報として認識された障害
の態様(例えば、チェックサムエラー)を設定する。)
通報処理を施し、モデム922 、公衆通信網93および
モデム921 を介して監視センタ21に返送する(図5
(a)、図8(13)) 。
However, unlike the case where the respective parts are normally operating as described above, for example, when some failure occurs on the OS 22 side, the service processor 94
When the fault is recognized, the information indicating the fault is added to the message a (“OS (to S
VP) ”is set, and the mode (for example, checksum error) of the fault recognized as the fault identification information is set. )
The notification process is performed and the information is returned to the monitoring center 21 via the modem 92 2 , the public communication network 93 and the modem 92 1 (FIG. 5).
(a), Figure 8 (13)).

【0028】監視タスクは、このような場合には上述し
た返送メッセージa′が一定時間内に受信されないの
で、その旨を示すステータス情報aを発し(図3)、
第二の通信路を介して通信制御装置23に上述したメッ
セージbを送出する(図3、図8(7))。
In such a case, since the above-mentioned return message a'is not received within a fixed time, the monitoring task issues status information a to that effect (FIG. 3).
The above message b is sent to the communication control device 23 via the second communication path (FIG. 3, FIG. 8 (7)).

【0029】このようなメッセージbは、図8(8)〜(9)
に示されるようにAP97に伝達される。AP97は、
予め決められた処理手順に基づいてOS22にアクセス
し、そのアクセスの過程において応答時間や相互に受け
渡されるステータス情報を監視して何らかの障害を認識
し、メッセージbにその障害を示す情報を付加する(検
出点識別情報として「OS(対CCP)」を設定し、障
害識別情報として認識された障害の態様(例えば、タイ
ムアウトエラー)を設定する。)通報処理を施し、OS
22、通信制御装置23、モデム923 、公衆通信網9
3およびモデム921 を介して監視センタ21に返送す
る(図5(b)、(図8(14)) 。
Such a message b is shown in FIGS. 8 (8) to (9).
Is transmitted to AP97. AP97 is
The OS 22 is accessed based on a predetermined processing procedure, response time and status information passed to each other are monitored in the course of the access to recognize any failure, and information indicating the failure is added to the message b. ("OS (to CCP)" is set as the detection point identification information, and the mode of the recognized failure (for example, a timeout error) is set as the failure identification information.) Notification processing is performed and the OS
22, the communication control unit 23, a modem 92 3, public communication network 9
3 and the modem 92 1 to the monitoring center 21 (FIG. 5 (b), (FIG. 8 (14)).

【0030】監視タスクは、このような場合には上述し
た返送メッセージb′が一定時間内に受信されないの
で、その旨を示すステータス情報bを発し(図3)、
検定タスクを起動する。
In such a case, since the above-mentioned return message b'is not received within a fixed time, the monitoring task issues status information b indicating this (FIG. 3).
Start the verification task.

【0031】検定タスクは、上述したステータス情報
a、bの有無を判定し(図3)、これらのステータス
が共にある場合には、メッセージa、bに応じて監視セ
ンタ21に返送された各メッセージの内容(障害識別情
報、検出点識別情報の各フィールドに設定された情報)
に、図2に示すシステム構成に基づいて予め決められた
アルゴリズムを適用することにより障害の発生点(ここ
では、簡単のため「OS22」とする。)を識別する
(図3)。さらに、検定タスクは、このような識別の
結果に併せて、該当する障害の態様および発生時刻(障
害発生時刻フィールドによって与えられる。)を含む警
報メッセージを生成し、そのメッセージを所定の端末装
置に出力することにより監視担当者に対して障害の発生
を通報する(図3)。
The verification task determines the presence or absence of the above-mentioned status information a and b (FIG. 3). If both statuses are present, each message returned to the monitoring center 21 according to the message a and b. Content (information set in each field of fault identification information and detection point identification information)
By applying a predetermined algorithm based on the system configuration shown in FIG. 2, the point of failure (here, “OS22” for simplicity) is identified (FIG. 3). Further, the verification task, together with the result of such identification, generates an alarm message including the mode and occurrence time of the corresponding failure (given by the failure occurrence time field), and sends the message to a predetermined terminal device. The output informs the person in charge of the occurrence of a failure (Fig. 3).

【0032】また、図6に示すように、上述した第一の
通信路および第二の通信路の何れか一方に障害が発生し
た場合には、メッセージaがサービスプロセッサ94に
伝達されなかったり、メッセージbが通信制御装置23
に伝達されなかったりする。監視センタ21は、所定の
時間内にメッセージa′やメッセージb′が受信されな
いことを認識してこのような状態を把握し、障害が発生
しなかった他方の通信路を介して従来例と同様の遠隔監
視動作を行う。
Further, as shown in FIG. 6, when a failure occurs in one of the above-mentioned first communication path and second communication path, the message a is not transmitted to the service processor 94, The message b is the communication control device 23
May not be transmitted to. The monitoring center 21 recognizes that the message a ′ and the message b ′ are not received within a predetermined time, grasps such a state, and performs the same communication as the conventional example via the other communication path in which no failure has occurred. Remote monitoring operation of.

【0033】このように本実施例では、監視対象のコン
ピュータシステムと監視センタ21との間にリング状に
冗長構成された通信路を形成し、メッセージに通報処理
を施して個々の通信路を介し返送することにより、通信
路の何れかに障害が発生した場合に残りの通信路を介し
て安定に遠隔監視を続行し、かつ返送された2つメッセ
ージに通報処理によって盛り込まれた情報に基づいて障
害の発生点を確度よく認識することができる。
As described above, in the present embodiment, a ring-shaped redundant communication path is formed between the computer system to be monitored and the monitoring center 21, and the message is notified through the individual communication paths. By returning, if a failure occurs in one of the communication paths, remote monitoring is continued stably via the remaining communication paths, and based on the information included in the two messages returned by the notification process. It is possible to accurately recognize the point of failure.

【0034】なお、本実施例では、監視センタ21は、
サービスプロセッサ94宛に先行してメッセージを送出
した後に、通信制御装置23にメッセージを送出してい
るが、本発明では、このような方法に限定されず、双方
のメッセージが各部で確実に識別可能であれば、例え
ば、サービスプロセッサ94および通信制御装置23宛
に同時にメッセージを送出してもよい。
In this embodiment, the monitoring center 21 is
Although the message is sent to the communication control device 23 after the message is sent to the service processor 94 in advance, the present invention is not limited to such a method, and both messages can be reliably identified by each part. In that case, for example, the message may be simultaneously sent to the service processor 94 and the communication control device 23.

【0035】また、本実施例では、OS22は、サービ
スプロセッサ94からOS22、AP97およびOS2
2を介して通信制御装置23に至る双方向の経路におい
て、メッセージの中継処理および通報処理を行っている
が、本発明は、このような方法に限定されず、例えば、
OS22がサービスプロセッサ94からOS22、AP
97およびOS22を介してサービスプロセッサ94に
戻る第一の折り返し経路と、通信制御装置23からOS
22、AP97およびOS22を介して通信制御装置2
3に戻る第二の折り返し経路とについて、同様に中継処
理および通報処理を行ってもよい。
Further, in this embodiment, the OS 22 includes the service processor 94, the OS 22, the AP 97 and the OS 2.
Although the message relay processing and the notification processing are performed in the bidirectional route to the communication control device 23 via the communication route 2, the present invention is not limited to such a method.
OS22 is from service processor 94 to OS22, AP
First return path returning to the service processor 94 via 97 and the OS 22, and the OS from the communication control device 23.
22, the communication control device 2 via the AP 97 and the OS 22
The relay process and the notification process may be similarly performed for the second return route returning to 3.

【0036】さらに、本実施例では、サービスプロセッ
サ94、OS22、AP97および通信制御装置23
は、各部が正常であるときには、上述したリング状の通
信路の一定方向についてメッセージの中継処理および通
報処理を行っているが、本発明では、このような方法に
限定されず、監視センタ21に対するメッセージの返送
が正常な通信路を介して確実に可能であるならば、例え
ば、上述した一定方向へのメッセージの転送時には通報
処理を施さず、かつその通報処理が施されたメッセージ
については適宜通信路を逆に遡るようにして監視センタ
21に返送してもよい。
Further, in this embodiment, the service processor 94, the OS 22, the AP 97 and the communication control device 23.
Performs a message relay process and a message process in a certain direction of the ring-shaped communication path when each unit is normal, but the present invention is not limited to such a method, and the monitoring center 21 If it is possible to reliably return the message via a normal communication path, for example, when the message is forwarded in the above-described direction, the notification process is not performed, and the message for which the notification process is performed is appropriately communicated. The route may be reversed and returned to the monitoring center 21.

【0037】また、本実施例では、監視センタ21と監
視対象の中央処理装置24との間が二重化された通信路
を介して接続されているが、本発明では、このような構
成の通信路に限定されず、例えば、3つ以上の冗長構成
された通信路を用い、これらの通信路の動作状況を逐次
監視することにより通報処理が施されたメッセージの監
視センタ21に対する正常な伝送経路を2つ以上の確保
したり、このようなメッセージの伝送路をさらに冗長化
してもよい。
Further, in the present embodiment, the monitoring center 21 and the central processing unit 24 to be monitored are connected via a duplicated communication path, but in the present invention, the communication path having such a configuration is used. However, the normal transmission route of the message for which the notification process is performed to the monitoring center 21 is performed by using three or more redundant communication channels and sequentially monitoring the operating conditions of these communication channels. It is also possible to secure two or more or make the transmission lines for such messages further redundant.

【0038】さらに、本実施例では、サービスプロセッ
サ94、OS22および通信制御装置23は、それぞれ
メッセージの中継処理および通報処理に先行して独自の
判断基準で下位の装置やソフトウエアの動作を監視して
いるが、本発明では、このような方法に限定されず、例
えば、上述した中継処理や通報処理に同期して同様の監
視を行ってもよい。
Further, in this embodiment, the service processor 94, the OS 22 and the communication control device 23 monitor the operation of the lower devices and software according to their own judgment criteria prior to the message relay processing and the message processing. However, the present invention is not limited to such a method, and for example, similar monitoring may be performed in synchronization with the above-described relay processing and notification processing.

【0039】また、本実施例では、監視センタ21にお
いて遠隔監視の周期で監視タスクと検定タスクとが直列
に起動されているが、本発明では、このようなソフトウ
エアの構成に限定されず、例えば、これらのタスクと等
化な処理を行う如何なる構成のソフトウエアを用いても
よい。
Further, in the present embodiment, the monitoring task and the verification task are activated in series at the remote monitoring cycle in the monitoring center 21, but the present invention is not limited to such a software configuration. For example, software of any configuration that performs equalization processing with these tasks may be used.

【0040】さらに、本実施例では、公衆通信網93の
アナログ伝送方式に適応したモデム921 〜923 を用
いたが、本発明では、監視センタ21と中央処理装置2
4との間に上述した冗長構成の通信路が確実に形成され
るならば、例えば、私設の通信回線を用いたり、通信路
の伝送方式として如何なる方式を採用してもよい。
[0040] Further, in this embodiment uses a modem 92 1-92 3 adapted for analog transmission of the public communication network 93, in the present invention, the monitoring center 21 and the central processing unit 2
If the redundant communication path described above is reliably formed between the communication path and the communication channel 4, the private communication line may be used, or any method may be adopted as the transmission method of the communication path.

【0041】[0041]

【発明の効果】以上説明したように本発明では、監視セ
ンタと被監視システムとの間を二重化された通信路を介
して接続し、さらに、その被監視システムにおいて、こ
れらの通信路を介する伝送とソフトウエア上の処理とに
関する障害を監視し、その監視の結果を監視センタから
受信されたメッセージに付加して返送する。
As described above, according to the present invention, the monitoring center and the monitored system are connected to each other via a duplicated communication path, and the monitored system transmits data via these communication paths. And the process related to the software are monitored, and the result of the monitoring is added to the message received from the monitoring center and returned.

【0042】すなわち、監視センタでは、このような監
視結果を含むメッセージが上述した通信路の何れか一方
に障害が発生した状態においても確実に返送されるの
で、通信路の障害時における遠隔監視動作の安定性が高
められ、かつこれらのメッセージの内容の組合せと被監
視システムの構成とに基づいて障害の発生区間を確度よ
く特定することが可能となる。
That is, at the monitoring center, a message including such a monitoring result is reliably returned even when a failure occurs in any one of the above-mentioned communication paths, so that the remote monitoring operation at the time of failure of the communication path is performed. It is possible to improve the stability of the system and to accurately specify the faulty section based on the combination of the contents of these messages and the configuration of the monitored system.

【0043】したがって、本発明を適用した遠隔監視シ
ステムでは、高い信頼性で監視結果が得られ、その監視
結果に基づいて的確な障害回復をはかることが可能とな
る。
Therefore, in the remote monitoring system to which the present invention is applied, the monitoring result can be obtained with high reliability, and accurate failure recovery can be achieved based on the monitoring result.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理ブロック図である。FIG. 1 is a principle block diagram of the present invention.

【図2】本発明の一実施例を示す図である。FIG. 2 is a diagram showing an embodiment of the present invention.

【図3】本実施例の動作フローチャートである。FIG. 3 is an operation flowchart of this embodiment.

【図4】本実施例の動作を説明する図(1)である。FIG. 4 is a diagram (1) explaining the operation of the present embodiment.

【図5】本実施例の動作を説明する図(2)である。FIG. 5 is a diagram (2) explaining the operation of the present embodiment.

【図6】本実施例の動作を説明する図(3)である。FIG. 6 is a diagram (3) explaining the operation of the present embodiment.

【図7】本実施例におけるメッセージの構成を示す図で
ある。
FIG. 7 is a diagram showing the structure of a message in this embodiment.

【図8】障害発生点の特定方法を説明する図である。FIG. 8 is a diagram illustrating a method of identifying a failure occurrence point.

【図9】従来の遠隔監視システムの構成例を示す図であ
る。
FIG. 9 is a diagram showing a configuration example of a conventional remote monitoring system.

【図10】従来例におけるメッセージの構成を示す図で
ある。
FIG. 10 is a diagram showing a structure of a message in a conventional example.

【符号の説明】[Explanation of symbols]

11 ソフトウエア監視手段 12 通信路 13 通信制御手段 14 通報手段 15 被監視システム 16 送信手段 17 障害発生区間特定手段 18,21,91 監視センタ 22,96 オペレーティングシステム(OS) 23 通信制御装置(CCP) 24,95 中央処理装置(CPU) 92 モデム 93 公衆通信網 94 サービスプロセッサ(SVP) 97 アプリケーションプログラム(AP) 11 software monitoring means 12 communication path 13 communication control means 14 reporting means 15 monitored system 16 sending means 17 failure occurrence section specifying means 18, 21, 91 monitoring center 22, 96 operating system (OS) 23 communication control device (CCP) 24, 95 Central Processing Unit (CPU) 92 Modem 93 Public Communication Network 94 Service Processor (SVP) 97 Application Program (AP)

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 所望の機能を実現するソフトウエアにつ
いて、そのソフトウエアの処理の正常性を監視するソフ
トウエア監視手段(11)と、 二重化された通信路(121、122)の通信制御を行い、
その通信制御の手順に基づきこれらの通信路について中
継処理と正常性の監視とを行う通信制御手段(131
132)と、 前記通信路(121)から通信制御手段(131)、ソフト
ウエア監視手段(11)および通信制御手段(132)を介
して通信路(122)に至る双方向のループ状の経路につ
いて、前記ソフトウエア監視手段(11)および前記通信
制御手段(131、132)が行った監視の結果から障害の
有無を判定し、その判定の結果を前記通信制御の下で前
記通信路(121、122)から受信されたメッセージに付
加して返送する通報手段(14)とを有する被監視システ
ム(15)と、 前記通信路(121、122)に個別に前記メッセージを送
信する送信手段(16)と、 前記通信路(121、122)を介して個別に返送されるメ
ッセージの内容の組合せと、前記経路の構成とに基づい
てその経路上における障害の発生区間を特定する障害発
生区間特定手段(17)とを有する監視センタ(18)とを
備えたことを特徴とする遠隔監視システム。
1. Software for realizing a desired function, software monitoring means (11) for monitoring the normality of processing of the software, and communication control of duplex communication paths (12 1 , 12 2 ). And then
Communication control means (13 1 , which performs relay processing and normality monitoring for these communication paths based on the communication control procedure)
13 and 2), the communication control unit from the communication passage (12 1) (13 1), the software monitoring means (11) and the communication control means (13 2) channel via a (12 2) to reach the two-way For the looped route, the presence or absence of a fault is determined from the results of the monitoring performed by the software monitoring means (11) and the communication control means (13 1 , 13 2 ), and the result of the determination is determined by the communication control. in the monitored system (15) having a notification means (14) to return in addition to messages received from the communication channel (12 1, 12 2), said channel (12 1, 12 2) to the individual Based on the combination of the sending means (16) for sending the message to the client, the contents of the messages individually returned via the communication paths (12 1 , 12 2 ) and the configuration of the path, Failure occurrence section identification hand to identify the failure occurrence section A remote monitoring system comprising: a monitoring center (18) having a stage (17).
JP5242785A 1993-09-29 1993-09-29 Remote monitor system Withdrawn JPH0798667A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5242785A JPH0798667A (en) 1993-09-29 1993-09-29 Remote monitor system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5242785A JPH0798667A (en) 1993-09-29 1993-09-29 Remote monitor system

Publications (1)

Publication Number Publication Date
JPH0798667A true JPH0798667A (en) 1995-04-11

Family

ID=17094258

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5242785A Withdrawn JPH0798667A (en) 1993-09-29 1993-09-29 Remote monitor system

Country Status (1)

Country Link
JP (1) JPH0798667A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040016207A (en) * 2002-08-16 2004-02-21 삼성전자주식회사 Method and system for system-apu's interactive communication

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040016207A (en) * 2002-08-16 2004-02-21 삼성전자주식회사 Method and system for system-apu's interactive communication

Similar Documents

Publication Publication Date Title
JPH0312772A (en) Real-time control type computer-network-system having automatic trouble discrimination and bypass function
WO2006080431A1 (en) Information processing device and information processing method
JPH01293450A (en) Troubled device specifying system
JPS6177447A (en) Transmission line fault information system
Deb et al. Tele-diagnosis: Remote monitoring of large-scale systems
JPH0798667A (en) Remote monitor system
JPH06175944A (en) Network monitoring method
EP0962862B1 (en) Apparatus and method for remote diagnostic of data processing units
JPH05225161A (en) Network monitoring system
JP3166135B2 (en) Redundant system
JPH07111504A (en) Communicating function maintenance diagnostic system
JPH10107792A (en) Server monitor
JP2751861B2 (en) Network system fault detection processing circuit
JPH07154401A (en) Diagnostic method for duplex communication system
JPH09160875A (en) Multi-agent mutual back-up system
JPH0435251A (en) Fault monitor system for ring network
JPH053486A (en) Data transmitter system
JPH02279040A (en) Fault detection system for multi-processor system
JPH01166638A (en) Communication system with fault cut-dividing function
JPS6359041A (en) Data transmission test control system
JPH1051980A (en) Monitoring control system
JPH04318722A (en) Test system for data link for maintenance test
JPS6146647A (en) Data transmission system
JPH04179687A (en) Remote control device for elevator
JPS62274957A (en) Diagnostic method for indefectible state of plant monitor device

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20001226