JP2000293451A - Distributed data distribution control system and distribution monitoring method - Google Patents
Distributed data distribution control system and distribution monitoring methodInfo
- Publication number
- JP2000293451A JP2000293451A JP11099445A JP9944599A JP2000293451A JP 2000293451 A JP2000293451 A JP 2000293451A JP 11099445 A JP11099445 A JP 11099445A JP 9944599 A JP9944599 A JP 9944599A JP 2000293451 A JP2000293451 A JP 2000293451A
- Authority
- JP
- Japan
- Prior art keywords
- monitoring
- computer
- countermeasure
- information
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
Landscapes
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Maintenance And Management Of Digital Transmission (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、複数回線を用いて
データを配信する分散データ配信管理システムに関する
ものであり、特に、衛星回線を用いたデータ配信の監視
を行う分散データ配信管理システム、およびその配信監
視方法に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a distributed data distribution management system for distributing data using a plurality of lines, and more particularly to a distributed data distribution management system for monitoring data distribution using a satellite line. It relates to the distribution monitoring method.
【0002】[0002]
【従来の技術】以下、従来の分散データ配信管理システ
ムについて説明する。例えば、従来の分散データ配信管
理システムに関する文献としては、特開平10−161
952号公報に示す「コンピュータ障害監視方法及びそ
のシステム」がある。このシステムは、図12に示すよ
うに、複数のコンピュータがネットワーク(WAN)を
介して通信でき、さらに、前記複数のコンピュータが複
数のグループ(例えば、グループ101,102,10
3)に分割された構成とし、前記分割された各グループ
にそれそれ代表コンピュータを定める。2. Description of the Related Art A conventional distributed data distribution management system will be described below. For example, as a document concerning a conventional distributed data distribution management system, Japanese Patent Application Laid-Open No. H10-161
No. 952 discloses a “computer fault monitoring method and system thereof”. In this system, as shown in FIG. 12, a plurality of computers can communicate via a network (WAN), and the plurality of computers are connected to a plurality of groups (for example, groups 101, 102, 10).
The configuration is divided into 3), and a representative computer is defined for each of the divided groups.
【0003】そして、図中の監視用コンピュータから前
記各代表コンピュータに指示を与え、各代表コンピュー
タにて、対応するグループ内コンピュータの通信負荷情
報の収集を含む障害監視を行わせ、その監視結果を監視
用コンピュータに送信する。一方、監視用コンピュータ
では、受け取った各グループ内各コンピュータの通信負
荷情報に基づき、必要な場合に代表コンピュータの変更
を行う。[0005] The monitoring computer shown in FIG. 1 gives an instruction to each of the representative computers, and causes each of the representative computers to perform fault monitoring including collection of communication load information of the corresponding computers in the group. Send to monitoring computer. On the other hand, the monitoring computer changes the representative computer when necessary based on the received communication load information of each computer in each group.
【0004】このように、図12におけるシステムは、
監視の負荷分散を図ることにより、通信負荷をある特定
のコンピュータだけに偏らせることなく、適切に障害監
視を行う、というものである。As described above, the system shown in FIG.
By distributing the monitoring load, failure monitoring is appropriately performed without biasing the communication load only to a specific computer.
【0005】また、他の従来の分散データ配信管理シス
テムに関する文献としては、例えば、特開昭63−28
0537号公報に示す「障害状況報告方式」がある。こ
のシステムは、図13に示すように、多重化装置111
と112が地上の高速ディジタル回線114および衛星
回線117にて接続され、多重化装置111と113が
地上の回線115にて接続され、多重化装置112と1
13が地上の回線116にて接続され、さらに、各多重
化装置における加入者回線側に計算機等が接続される構
成とし、前記各計算機が相互に通信を行っている。ここ
では、1回のポーリングによる障害箇所の推定処理を早
期に行うようにし、障害発生時の回線切り替えを効率良
く迅速に実施している。[0005] Other documents related to the conventional distributed data distribution management system include, for example, Japanese Patent Application Laid-Open No. Sho 63-28.
There is a “failure status reporting method” disclosed in Japanese Patent No. 0537. This system includes a multiplexing device 111 as shown in FIG.
And 112 are connected by a terrestrial high-speed digital line 114 and a satellite line 117, and multiplexing devices 111 and 113 are connected by a terrestrial line 115.
Reference numeral 13 is connected by a ground line 116, and further, a computer or the like is connected to the subscriber line side of each multiplexer, and the computers communicate with each other. Here, the process of estimating the failure location by one polling is performed early, and the line switching at the time of failure occurrence is efficiently and promptly performed.
【0006】このように、図13における方式は、ポー
リング方式(図に示すセンターからの要求を受けて監視
を行う方式)における障害監視の応用であり、特に、障
害発生から障害検知までの時間を短くすることを目的と
した障害監視方式である。As described above, the method shown in FIG. 13 is an application of fault monitoring in a polling method (a method in which a monitoring is performed in response to a request from the center shown in the figure). This is a fault monitoring method aimed at shortening.
【0007】また、他の従来の分散データ配信管理シス
テムに関する文献としては、例えば、特開平8−693
96号公報に示す「ネットワーク事象カウンタ管理方法
及び装置」がある。このシステムは、図14に示すよう
に、任意のコンピュータ121,122が、通信インタ
ーフェースである通信アダプタ124,125を介して
接続され、各コンピュータ相互の通信を行う。また、こ
れらのコンピュータは、当該ネットワークに配置された
ネットワーク管理システム123とも、相互に通信を行
う。そして、ネットワーク管理システム123では、各
コンピュータから送信されてくる結合手段126に関す
る事象情報を収集し、当該ネットワークを制御し維持す
る。[0007] Other documents relating to the conventional distributed data distribution management system include, for example, Japanese Patent Application Laid-Open No. 8-693.
No. 96, entitled “Network Event Counter Management Method and Apparatus”. In this system, as shown in FIG. 14, arbitrary computers 121 and 122 are connected via communication adapters 124 and 125, which are communication interfaces, and communicate with each other. These computers also communicate with each other with the network management system 123 disposed on the network. Then, the network management system 123 collects event information on the combining unit 126 transmitted from each computer, and controls and maintains the network.
【0008】このように、図14における方法および装
置は、単一ネットワークシステムにおいて、監視項目の
閾値を決定することを目的とした方式である。[0008] As described above, the method and apparatus shown in FIG. 14 are systems for determining a threshold value of a monitoring item in a single network system.
【0009】また、他の従来の分散データ配信管理シス
テムに関する文献としては、例えば、特開平9−186
780号公報に示す「網障害検出装置と方法」がある。
このシステムは、図15に示すように、配信結果の成否
を通信完了状態情報として収集する収集手段131と、
収集した通信完了状態情報を蓄積して記憶する記憶手段
132と、記憶した通信完了状態情報を予め定められた
時間間隔で集計を行いその集計結果に基づいて回線網の
障害の発生を監視する監視手段133と、回線網に障害
の発生を検出したときにオペレータに通知する警報手段
134から構成され、回線網を通して複数の通信先にデ
ータを配信する場合に、前記通信完了状態情報の統計処
理結果に基づいて、回線と網の障害を検出する。[0009] Other documents related to the conventional distributed data distribution management system include, for example, Japanese Patent Application Laid-Open No. Hei 9-186.
There is a “network fault detection device and method” disclosed in Japanese Patent Application Publication No. 780.
As shown in FIG. 15, the system includes a collection unit 131 that collects the success or failure of the distribution result as communication completion state information,
A storage unit 132 for accumulating and storing the collected communication completion state information; and a monitoring unit for totalizing the stored communication completion state information at predetermined time intervals and monitoring the occurrence of a failure in the network based on the totalization result. Means 133 and an alarming means 134 for notifying the operator when a fault has been detected in the network, and when data is distributed to a plurality of communication destinations through the network, the statistical processing result of the communication completion state information is obtained. And detects line and network failures.
【0010】このように、図15における方法および装
置は、公衆回線・ISDN等の交換回線におけるネット
ワーク障害の早期発見により、サービス性の向上を図る
ことを目的とした装置および方法である。As described above, the method and apparatus in FIG. 15 are intended to improve serviceability by early detection of a network failure in a switched line such as a public line or ISDN.
【0011】また、他の従来の分散データ配信管理シス
テムに関する文献としては、例えば、特開平9−835
14号公報に示す「ネットワークシステム及びネットワ
ークシステムに適用される障害監視方法」がある。この
システムは、図16に示すように、ネットワーク管理ス
テーション142が障害発生の要因に関係する特定アド
レス情報を発行し、その後、中継装置141が、発信元
(各ステーション)から送信されたデータを受信したと
きに、その送信データに付加された発信元のアドレス情
報と先に発行されたアドレス情報とを比較し、その結果
が一致した場合、その旨を含む通知情報をネットワーク
管理ステーション142に送信する。そして、管理ステ
ーション142では、受け取った通知情報に基づいて、
障害発生の要因となるデータの発信元または中継装置の
位置を特定する。[0011] Other documents related to the conventional distributed data distribution management system include, for example, Japanese Patent Application Laid-Open No. 9-835.
No. 14, there is a "network system and a fault monitoring method applied to the network system". In this system, as shown in FIG. 16, the network management station 142 issues specific address information related to the cause of the failure, and then the relay device 141 receives data transmitted from the transmission source (each station). Then, the address information of the transmission source added to the transmission data is compared with the previously issued address information, and if the result matches, the notification information including the fact is transmitted to the network management station 142. . Then, the management station 142, based on the received notification information,
Identify the location of the data transmission source or relay device that causes the failure.
【0012】このように、図16におけるシステムは、
情報を発信した発信元を識別するための特定アドレスを
設定することにより、障害の発生要因となるデータの発
信元や中継位置を監視する処理を効率的に実現すること
を目的とするシステムである。Thus, the system in FIG.
This system aims at efficiently realizing a process of monitoring a data transmission source and a relay position that may cause a failure by setting a specific address for identifying a transmission source of information. .
【0013】[0013]
【発明が解決しようとする課題】しかしながら、上記、
従来の複数回線を使用したデータ配信システムにおいて
は、何らかの障害が起こった場合、それがどのような障
害なのか、それがどこで起こっているか、等の判断が困
難であり、さらに、システム管理者が、その障害の適切
な解決法を決定するために手作業で解析を行っているた
め、時間およびコストがかかるとともに、専門的な知識
も必要となる。SUMMARY OF THE INVENTION However,
In a conventional data distribution system using a plurality of lines, when a failure occurs, it is difficult to determine what the failure is and where it is occurring. However, because the analysis is performed manually to determine an appropriate solution to the obstacle, it is time-consuming and costly, and requires specialized knowledge.
【0014】詳細には、例えば、特開平10−1619
52号公報の発明では、図12に示すように、大規模ネ
ットワークにおいて、ルータを介した各拠点毎にグルー
プ化を行い、物理的構成によるグループ化によって監視
コストの軽減を図ろうとしている。そのため、この方法
では、衛星を使用したデータ配信システムのように、送
信側と受信側の物理的な距離が大きく、かつ受信側での
障害原因が送信側にあった場合に、適切な対応できな
い、という問題点があった。For details, see, for example, Japanese Patent Application Laid-Open No. 10-1619.
In the invention of Japanese Patent No. 52, as shown in FIG. 12, in a large-scale network, grouping is performed for each site via a router, and the monitoring cost is reduced by grouping based on a physical configuration. Therefore, in this method, when the physical distance between the transmitting side and the receiving side is large and the cause of the failure on the receiving side is the transmitting side as in a data distribution system using satellites, it is not possible to appropriately cope with the problem. , There was a problem.
【0015】また、例えば、特開昭63−280537
号公報の発明は、前記ポーリング方式において、障害発
生から障害検知までの時間をより短くすることを目的と
した方式であるが、障害発生から検知までの時間の短縮
に限界があり、障害が発生した場合、瞬時に対応する必
要があるシステムにおいて有効性が低い、という問題点
があった。Further, for example, Japanese Patent Application Laid-Open No. Sho 63-28037
The invention of Japanese Patent Laid-Open Publication No. H11-157,751 is a method aiming at shortening the time from the occurrence of a failure to the detection of a failure in the polling method. In such a case, there is a problem that the effectiveness is low in a system that needs to respond immediately.
【0016】また、例えば、特開平8−69396号公
報の発明では、ネットワーク回線が一つの場合をターゲ
ットにしているため、その回線が切断し、かつその原因
がネットワークを介した相手側にある場合に、この障害
に対する対策を行うことができない、という問題点があ
った。また、ネットワークの転送性能が低下した場合、
それを伝えるために、性能の低下したネットワークを使
用しなければならず、障害を報告するための時間が長く
なり、最悪、障害報告ができなくなる、という問題点が
あった。Also, for example, in the invention of Japanese Patent Application Laid-Open No. 8-69396, since the case where the network line is one is targeted, when the line is disconnected and the cause is on the other side through the network. However, there is a problem that it is not possible to take measures against this obstacle. Also, if the transfer performance of the network decreases,
In order to convey this, a network with reduced performance must be used, and the time required to report a failure increases, and in the worst case, the failure cannot be reported.
【0017】また、例えば、特開平9−186780号
公報の発明では、使用回線を公衆回線やISDNのよう
な交換回線に限定しているため、衛星回線やWAN等の
回線の障害を検知することができない、という問題点が
あった。Further, for example, in the invention of Japanese Patent Application Laid-Open No. 9-186780, since the used line is limited to a switched line such as a public line or ISDN, it is necessary to detect a failure of a line such as a satellite line or a WAN. There was a problem that it was not possible.
【0018】また、例えば、特開平9−83514号公
報の発明では、発信元に特定アドレスを設定するため、
発信元が変更された場合には、新たに特定アドレスを設
定し直す必要があり、また、ネットワーク内の任意の計
算機が発信元になる場合には、すべての計算機に対して
特定アドレスを設定する必要がある。そのため、衛星ネ
ットワークのような数千〜数万の計算機からなる大規模
ネットワークに対してこの方法を適用するには、特定ア
ドレスの設定を行う計算機の負荷が非常に高くなる、と
いう問題があった。また、受信局に問題があった場合に
障害を検知することができない、という問題もあった。[0018] For example, in the invention of Japanese Patent Application Laid-Open No. 9-83514, a specific address is set for a transmission source.
When the source is changed, it is necessary to set a new specific address, and when any computer in the network becomes the source, the specific address is set for all computers. There is a need. Therefore, when this method is applied to a large-scale network including thousands to tens of thousands of computers such as a satellite network, there is a problem that a load of a computer for setting a specific address becomes extremely high. . There is also a problem that a failure cannot be detected when there is a problem in the receiving station.
【0019】本発明は、上記に鑑みてなされたものであ
って、例えば、障害が発生した際に、自動的に、障害内
容および発生位置を知ること、さらに適切な障害の解決
法を決定することができ、該障害に対する修復作業を効
率よく実施可能な分散データ配信管理システム、および
その配信監視方法を得ることを目的とする。The present invention has been made in view of the above. For example, when a failure has occurred, the contents and location of the failure are automatically known, and a more appropriate solution to the failure is determined. It is an object of the present invention to obtain a distributed data distribution management system capable of efficiently performing a repair work for the failure and a distribution monitoring method thereof.
【0020】[0020]
【課題を解決するための手段】上述した課題を解決し、
目的を達成するために、本発明にかかる分散データ配信
管理システムにあっては、衛星回線と地上回線が混在す
るネットワークシステムを用いてデータの配信を行う構
成とし、さらに、データの配信状態を監視する配信監視
手段を含む複数の第1の計算機(後述する実施の形態の
計算機1に相当)と、前記データ配信において障害が発
生した場合に、前記各第1の計算機から送信される監視
結果に基づいて、その障害に対する最適な対策を決定す
る対策決定手段を含む第2の計算機(計算機2に相当)
と、前記第2の計算機から送信される対策情報に基づい
て、その情報に適合した対策を実行する対策実行手段を
含む第3の計算機(計算機3に相当)と、を備え、前記
第3の計算機にて実行される対策により、発生した障害
を修復することを特徴とする。Means for Solving the Problems The above-mentioned problems are solved,
In order to achieve the object, a distributed data distribution management system according to the present invention is configured to distribute data using a network system in which satellite lines and terrestrial lines coexist, and further monitors a data distribution state. And a plurality of first computers (equivalent to a computer 1 in an embodiment described later) including a distribution monitoring unit that performs transmission and monitoring, when a failure occurs in the data distribution, a monitoring result transmitted from each of the first computers. A second computer (corresponding to the computer 2) including a countermeasure determining means for determining an optimum countermeasure against the failure based on the error
And a third computer (corresponding to the computer 3) including a countermeasure executing means for executing a countermeasure adapted to the information based on the countermeasure information transmitted from the second computer, and the third computer It is characterized in that a fault that has occurred is repaired by a countermeasure executed by the computer.
【0021】この発明によれば、第1の計算機,第2の
計算機,および第3の計算機を有することにより、障害
が発生した際に、自動的に、障害内容の収集、障害発生
位置の推定、障害対策の選択、および障害対策の実行が
行われることから、該発生した障害が最適な方法で自動
的に修復される。これにより、システム管理者の負荷を
大幅に軽減することが可能となるとともに、システム管
理者に専門的な知識を要求しない高信頼のシステムを構
築できる。また、該障害に対する修復作業が効率よく実
施可能となる。According to the present invention, by having the first computer, the second computer, and the third computer, when a failure occurs, the contents of the failure are automatically collected and the location of the failure occurrence is automatically estimated. Since a fault measure is selected and a fault measure is executed, the fault that has occurred is automatically repaired in an optimal manner. As a result, the load on the system administrator can be greatly reduced, and a highly reliable system that does not require specialized knowledge from the system administrator can be constructed. In addition, the repair work for the failure can be efficiently performed.
【0022】つぎの発明にかかる分散データ配信管理シ
ステムにあっては、前記各第1の計算機、前記第2の計
算機、および前記第3の計算機のそれぞれが、各計算機
の機能として含む前記各手段の他に、前記配信監視手
段、前記対策決定手段、および前記対策実行手段の、少
なくともいずれか一つの手段をさらに含むことを特徴と
する。[0022] In the distributed data distribution management system according to the next invention, each of the first computer, the second computer, and the third computer includes each of the means included as a function of each computer. In addition to the above, at least one of the distribution monitoring unit, the countermeasure determining unit, and the countermeasure executing unit is further included.
【0023】この発明によれば、各計算機が標準的に備
えていた機能の他に、さらに一つ以上の機能を備えるこ
とになる。これにより、ネットワークおよびユーザの事
情に依存しない自由な構成で高信頼システムを構築でき
る。According to the present invention, each computer has one or more functions in addition to the functions normally provided. As a result, a highly reliable system can be constructed with a free configuration that does not depend on the circumstances of the network and the user.
【0024】つぎの発明にかかる分散データ配信管理シ
ステムにおいて、前記各第1の計算機は、前記監視に関
する項目と、データ配信に関する障害を判別するための
該項目に対応する基準値(後述する実施の形態の参照用
基準偏差値に相当)と、を設定するための第1のテーブ
ル(配信監視項目テーブルに設定)と、前記監視結果が
どの程度の水準にあるかを表す偏差値を保存する第2の
テーブル(監視状態テーブルに相当)と、を備え、前記
第1のテーブル上の配信監視項目に記載された処理を実
行し、さらに、過去の統計から得られる標準偏差に基づ
いて前記偏差値を計算し、その偏差値を前記第2のテー
ブルに保存し、その後、前記第1のテーブルに設定され
た基準値と、前記第2のテーブルに保存された偏差値
と、を比較し、前記偏差値が、前記基準値より小さい場
合に、その配信監視項目に対応する監視結果を正常と判
断し、一方、前記偏差値が、前記基準値より大きい場合
に、その配信監視項目に対応する監視結果を異常と判断
することを特徴とする。In the distributed data distribution management system according to the next invention, each of the first computers includes an item relating to the monitoring and a reference value corresponding to the item for judging a failure relating to the data distribution. And a first table (set in the distribution monitoring item table) for setting the standard deviation value for reference, and a deviation value indicating the level of the monitoring result. 2 (corresponding to a monitoring state table), execute the processing described in the distribution monitoring item on the first table, and further, based on a standard deviation obtained from past statistics, Is calculated, and the deviation value is stored in the second table. Thereafter, the reference value set in the first table is compared with the deviation value stored in the second table, When the difference value is smaller than the reference value, the monitoring result corresponding to the distribution monitoring item is determined to be normal. On the other hand, when the deviation value is larger than the reference value, monitoring corresponding to the distribution monitoring item is determined. The result is determined to be abnormal.
【0025】この発明によれば、第1の計算機が、第1
のテーブルから、配信監視項目を自動的に指定する。こ
れにより、管理者は、その監視結果を確認するだけでよ
く、本システム全体を効率よく管理することができるよ
うになる。また、この発明によれば、第1の計算機が、
配信監視項目の正常/異常の判断を標準値に基づいて決
定するため、システムチェック回数が増えるほど、精度
の高い標準偏差が得られる。これにより、異常チェック
の信頼度を向上させることができる。また、この発明に
よれば、第1の計算機が、自動的に異常を検知するとと
もに、正常時の状態も管理する。これにより、障害発生
時の原因究明の手助けとなるデータ、および再発防止の
ためのデータ等を得ることができる。また、この発明に
よれば、配信監視項目を自由に変更および追加可能とな
る。これにより、さらに信頼性の高いシステムを構築で
きる。According to the present invention, the first computer executes the first computer
Automatically specify distribution monitoring items from the table. As a result, the administrator only needs to confirm the monitoring result, and can efficiently manage the entire system. Further, according to the present invention, the first computer includes:
Since the determination of normal / abnormal of the distribution monitoring item is determined based on the standard value, the more accurate the system check, the higher the standard deviation can be obtained. Thereby, the reliability of the abnormality check can be improved. Further, according to the present invention, the first computer automatically detects an abnormality and manages a normal state. As a result, it is possible to obtain data that assists in investigating the cause when a failure occurs, data for preventing recurrence, and the like. Further, according to the present invention, the distribution monitoring items can be freely changed and added. Thereby, a more reliable system can be constructed.
【0026】つぎの発明にかかる分散データ配信管理シ
ステムにおいて、前記各第1の計算機は、前記監視に関
する項目と、データ配信に関する障害を判別するための
該項目に対応するしきい値と、を設定するためのテーブ
ル(後述する実施の形態の配信監視項目テーブルに相
当)を備え、前記テーブル上の配信監視項目に記載され
た処理を実行し、その後、前記テーブルに設定されたし
きい値と、前記監視結果と、を比較し、前記監視結果
が、前記しきい値より小さい場合に、その配信監視項目
に対応する監視結果を正常と判断し、一方、前記監視結
果が、前記しきい値より大きい場合に、その配信監視項
目に対応する監視結果を異常と判断することを特徴とす
る。In the distributed data distribution management system according to the next invention, each of the first computers sets an item relating to the monitoring and a threshold value corresponding to the item for determining a failure relating to data distribution. (Corresponding to a distribution monitoring item table according to an embodiment to be described later) for executing the processing described in the distribution monitoring item on the table, and thereafter, a threshold value set in the table, The monitoring result is compared with the monitoring result, and when the monitoring result is smaller than the threshold value, the monitoring result corresponding to the distribution monitoring item is determined to be normal, while the monitoring result is smaller than the threshold value. When the size is larger, the monitoring result corresponding to the distribution monitoring item is determined to be abnormal.
【0027】この発明によれば、計算機1が、テーブル
から、配信監視項目を自動的に指定する。これにより、
管理者は、その監視結果を確認するだけでよく、本シス
テム全体を効率よく管理することができるようになる。
また、この発明によれば、監視を行う第1の計算機毎
に、個別のテーブルを持つことが可能となる。これによ
り、各第1の計算機が位置するネットワークに適した最
適なしきい値を指定(設定)することができるようにな
り、さらに、この最適なしきい値に基づいて、より精度
の高い監視を行うことができる。According to the present invention, the computer 1 automatically specifies a distribution monitoring item from a table. This allows
The administrator only needs to confirm the monitoring result, and can efficiently manage the entire system.
Further, according to the present invention, it is possible to have a separate table for each first computer to be monitored. This makes it possible to specify (set) an optimum threshold value suitable for the network in which each first computer is located, and to perform more accurate monitoring based on the optimum threshold value. be able to.
【0028】つぎの発明にかかる分散データ配信管理シ
ステムにおいて、前記第2の計算機は、前記すべての第
1の計算機から通知される監視結果を受信し、かつその
監視結果の少なくとも一つに異常通知が含まれている場
合、その監視結果に含まれるアドレス情報に基づいて、
異常が発生した第1の計算機の位置または通信路を推定
することを特徴とする。In the distributed data distribution management system according to the next invention, the second computer receives monitoring results notified from all the first computers, and notifies at least one of the monitoring results of an abnormality notification. Is included, based on the address information included in the monitoring result,
The position or communication path of the first computer in which the abnormality has occurred is estimated.
【0029】この発明によれば、第2の計算機が、大規
模ネットワークの各計算機から多くの監視結果を集計す
る。これにより、従来のようなネットワーク内の計算機
が多いほど障害位置の特定が難しくなる、という傾向が
改善され、さらにネットワークが大きくなるほど監視結
果も多く集計できることから、障害発生位置の確定の信
頼度をより高くすることができる。According to the present invention, the second computer compiles a large number of monitoring results from each computer in the large-scale network. This improves the tendency that the more computers in the network, the more difficult it is to identify the fault location, and the larger the network, the more monitoring results can be aggregated. Can be higher.
【0030】つぎの発明にかかる分散データ配信管理シ
ステムにおいて、前記第2の計算機は、さらに、前記推
定した位置または通信路に基づいて、障害に対する修復
を行うための第3の計算機を決定し、その決定した第3
の計算機に対して、障害を修復するための対策情報を送
信することを特徴とする。In the distributed data distribution management system according to the next invention, the second computer further determines a third computer for repairing a failure based on the estimated position or communication path, The decided third
Characterized in that countermeasure information for repairing a failure is transmitted to the computer.
【0031】この発明によれば、より信頼性の高い障害
発生位置が得られる。これにより、最適な第3の計算機
を選択することができる。According to the present invention, a more reliable fault occurrence position can be obtained. As a result, an optimal third computer can be selected.
【0032】つぎの発明にかかる分散データ配信管理シ
ステムにおいて、前記第2の計算機は、さらに、障害情
報とその対策情報を記憶する対策管理テーブル(後述す
る実施の形態の対策管理テーブルに相当)を備え、前記
対策管理テーブルの中から、通知される監視結果に含ま
れる障害情報と適合する対策情報を選択し、その後、前
記決定した第3の計算機に対して、その対策情報を送信
することを特徴とする。[0032] In the distributed data distribution management system according to the next invention, the second computer further includes a countermeasure management table (corresponding to a countermeasure management table according to an embodiment described later) for storing fault information and countermeasure information thereof. And selecting, from the countermeasure management table, countermeasure information that matches the fault information included in the notified monitoring result, and then transmitting the countermeasure information to the determined third computer. Features.
【0033】この発明によれば、第2の計算機が、対策
管理テーブルの中から、通知される監視結果に含まれる
障害情報と適合する対策情報を選択する。これにより、
さらに効率よく最適な対策情報の決定を行うことができ
る。また、この発明によれば、第2の計算機毎に対策管
理テーブルを持つことができるようになる。これによ
り、第2の計算機が位置するネットワークに最適な対策
情報を決定することができる。According to the present invention, the second computer selects, from the countermeasure management table, countermeasure information that matches the fault information included in the notified monitoring result. This allows
Further, optimal countermeasure information can be determined more efficiently. Further, according to the present invention, a countermeasure management table can be provided for each second computer. This makes it possible to determine optimal countermeasure information for the network where the second computer is located.
【0034】つぎの発明にかかる分散データ配信管理シ
ステムにおいて、前記第2の計算機は、さらに、障害情
報と、修復の実行優先度を示す優先順位が含まれた少な
くとも一つの対策情報を記憶する対策管理テーブルを備
え、前記対策管理テーブルの中から、通知される監視結
果に含まれる障害情報と適合する少なくとも一つの対策
情報を選択し、その後、前記決定した第3の計算機に対
して、その対策情報を送信し、前記第3の計算機は、前
記第2の計算機から送信される対策情報に基づいて、そ
の情報に適合した対策を前記優先順位の順に実行するこ
とを特徴とする。In the distributed data distribution management system according to the next invention, the second computer further stores at least one piece of countermeasure information including fault information and a priority indicating a repair execution priority. A management table, at least one piece of countermeasure information compatible with the fault information included in the notified monitoring result is selected from the countermeasure management table, and then the countermeasure is provided to the determined third computer. The information is transmitted, and the third computer executes, based on the countermeasure information transmitted from the second computer, countermeasures adapted to the information in the order of the priority.
【0035】この発明によれば、第2の計算機が、一つ
の障害に対して複数の対策を優先度指定で行える。これ
により、第3の計算機では、より確実な障害対策を行う
ことができる。また、この発明によれば、第2の計算機
毎に対策管理テーブルを所持することができるようにな
る。これにより、個々のネットワークに最適な対策を決
定できる。According to the present invention, the second computer can perform a plurality of countermeasures for one failure by designating the priority. As a result, the third computer can take more reliable countermeasures. Further, according to the present invention, it is possible to have a countermeasure management table for each second computer. As a result, an optimal measure can be determined for each network.
【0036】つぎの発明にかかる分散データ配信管理シ
ステムにおいて、前記第3の計算機は、さらに、前記実
行したすべての対策の有効性を測定し、その測定結果を
各対策の有効性情報として第2の計算機に送信し、前記
第2の計算機は、さらに、前記第3の計算機から送信さ
れる有効性情報を、前記対策管理テーブルに反映するこ
とを特徴とする。In the distributed data distribution management system according to the next invention, the third computer further measures the validity of all the executed measures, and uses the measurement result as validity information of each measure in the second computer. And the second computer further reflects the validity information transmitted from the third computer in the countermeasure management table.
【0037】この発明によれば、第3の計算機が、実行
したすべての対策の有効性を測定し、その測定結果を各
対策の有効性情報として第2の計算機に送信し、さら
に、第2の計算機が、第3の計算機から送信される有効
性情報を、対策管理テーブルに反映する。これにより、
障害が発生するほど、対策管理テーブルが最適な状態と
なり、より効果のある対策をたてることができ、さら
に、この対策を優先順位に応じて第3の計算機にて実行
可能となるため、より高信頼な障害対策を行うことがで
きる。According to the present invention, the third computer measures the effectiveness of all executed measures, transmits the measurement result to the second computer as effectiveness information of each measure, Reflects the validity information transmitted from the third computer in the countermeasure management table. This allows
The more failures occur, the more optimally the countermeasure management table becomes, so that more effective countermeasures can be taken. Further, this countermeasure can be executed by the third computer according to the priority order. Highly reliable failure countermeasures can be taken.
【0038】つぎの発明にかかる配信監視方法にあって
は、衛星回線と地上回線が混在するネットワークシステ
ムを用いてデータの配信を行う分散データ配信管理シス
テムにおいて、データの配信状態を監視する配信監視ス
テップ(後述する実施の形態のステップS1〜ステップ
S8,ステップS11〜ステップS16に相当)と、前
記データ配信において障害が発生した場合に、前記配信
監視ステップにて送信する監視結果に基づいて、その障
害に対する最適な対策を決定する対策決定ステップ(ス
テップS21〜ステップS28,ステップ31〜ステッ
プS39,ステップS41〜ステップS49に相当)
と、前記対策決定ステップにて送信する対策情報に基づ
いて、その情報に適合した対策を実行する対策実行ステ
ップ(ステップS61〜ステップS69に相当)と、を
含み、前記対策実行ステップにて実行される対策によ
り、発生した障害を修復することを特徴とする。In the distribution monitoring method according to the next invention, in a distributed data distribution management system for distributing data using a network system in which satellite lines and terrestrial lines coexist, a distribution monitoring method for monitoring a data distribution state. Steps (corresponding to Steps S1 to S8 and Steps S11 to S16 in the embodiment described later) and, when a failure occurs in the data distribution, based on the monitoring result transmitted in the distribution monitoring step, Countermeasure determination step for determining an optimum countermeasure for a failure (corresponding to steps S21 to S28, steps 31 to S39, and steps S41 to S49)
And a countermeasure execution step (corresponding to steps S61 to S69) for executing a countermeasure adapted to the information based on the countermeasure information transmitted in the countermeasure determination step. In this case, the trouble that has occurred is repaired by taking appropriate measures.
【0039】この発明によれば、各計算機がそれぞれ、
配信監視ステプ,対策決定ステップ,および対策実行ス
テップを有することにより、障害が発生した際に、自動
的に、障害内容の収集、障害発生位置の推定、障害対策
の選択、および障害対策の実行が行われることから、該
発生した障害が最適な方法で自動的に修復される。これ
により、システム管理者の負荷を大幅に軽減することが
可能となるとともに、システム管理者に専門的な知識を
要求しない高信頼のシステムを構築できる。また、該障
害に対する修復作業が効率よく実施可能となる。According to the present invention, each computer
By having a distribution monitoring step, a countermeasure determination step, and a countermeasure execution step, when a fault occurs, it is possible to automatically collect the details of the fault, estimate the location of the fault, select a fault measure, and execute the fault measure. As a result, the fault that has occurred is automatically repaired in an optimal manner. As a result, the load on the system administrator can be greatly reduced, and a highly reliable system that does not require specialized knowledge from the system administrator can be constructed. In addition, the repair work for the failure can be efficiently performed.
【0040】つぎの発明にかかる配信監視方法におい
て、前記配信監視ステップでは、前記監視に関する項目
と、データ配信に関する障害を判別するための該項目に
対応する基準値と、を設定するための第1のテーブル
と、前記監視結果がどの程度の水準にあるかを表す偏差
値を保存する第2のテーブルと、を用いて、前記第1の
テーブル上の配信監視項目に記載された処理を実行し、
さらに、過去の統計から得られる標準偏差に基づいて前
記偏差値を計算し、その偏差値を前記第2のテーブルに
保存し、その後、前記第1のテーブルに設定された基準
値と、前記第2のテーブルに保存された偏差値と、を比
較し、前記偏差値が、前記基準値より小さい場合に、そ
の配信監視項目に対応する監視結果を正常と判断し、一
方、前記偏差値が、前記基準値より大きい場合に、その
配信監視項目に対応する監視結果を異常と判断すること
を特徴とする(後述する実施の形態のステップS2〜ス
テップS7に相当)。In the distribution monitoring method according to the next invention, in the distribution monitoring step, a first value for setting an item relating to the monitoring and a reference value corresponding to the item for determining a failure relating to data distribution is set. And a second table that stores a deviation value indicating the level of the monitoring result, and executes the process described in the distribution monitoring item on the first table. ,
Further, the deviation value is calculated based on a standard deviation obtained from past statistics, the deviation value is stored in the second table, and thereafter, the reference value set in the first table and the second And comparing the deviation value stored in the table of 2 with the deviation value, when the deviation value is smaller than the reference value, determine that the monitoring result corresponding to the distribution monitoring item is normal, while the deviation value is When the value is larger than the reference value, the monitoring result corresponding to the distribution monitoring item is determined to be abnormal (corresponding to Steps S2 to S7 in an embodiment described later).
【0041】この発明によれば、配信監視ステップに
て、第1のテーブルから、配信監視項目を自動的に指定
する。これにより、管理者は、その監視結果を確認する
だけでよく、本システム全体を効率よく管理することが
できるようになる。また、この発明によれば、配信監視
ステップにて、配信監視項目の正常/異常の判断を標準
値に基づいて決定するため、システムチェック回数が増
えるほど、精度の高い標準偏差が得られる。これによ
り、異常チェックの信頼度を向上させることができる。
また、この発明によれば、配信監視ステップにて、自動
的に異常を検知するとともに、正常時の状態も管理す
る。これにより、障害発生時の原因究明の手助けとなる
データ、および再発防止のためのデータ等を得ることが
できる。また、この発明によれば、配信監視項目を自由
に変更および追加可能となる。これにより、さらに信頼
性の高いシステムを構築できる。According to the present invention, in the distribution monitoring step, a distribution monitoring item is automatically designated from the first table. As a result, the administrator only needs to confirm the monitoring result, and can efficiently manage the entire system. Further, according to the present invention, in the distribution monitoring step, the judgment of normal / abnormal of the distribution monitoring item is determined based on the standard value, so that the more accurate the system deviation is, the higher the standard deviation is obtained. Thereby, the reliability of the abnormality check can be improved.
Further, according to the present invention, in the distribution monitoring step, an abnormality is automatically detected, and a normal state is managed. As a result, it is possible to obtain data that assists in investigating the cause when a failure occurs, data for preventing recurrence, and the like. Further, according to the present invention, the distribution monitoring items can be freely changed and added. Thereby, a more reliable system can be constructed.
【0042】つぎの発明にかかる配信監視方法におい
て、前記配信監視ステップでは、前記監視に関する項目
と、データ配信に関する障害を判別するための該項目に
対応するしきい値と、を設定するためのテーブルを用い
て、前記テーブル上の配信監視項目に記載された処理を
実行し、その後、前記テーブルに設定されたしきい値
と、前記監視結果と、を比較し、前記監視結果が、前記
しきい値より小さい場合に、その配信監視項目に対応す
る監視結果を正常と判断し、一方、前記監視結果が、前
記しきい値より大きい場合に、その配信監視項目に対応
する監視結果を異常と判断することを特徴とする(後述
する実施の形態のステップS12からステップS15に
相当)。In the distribution monitoring method according to the next invention, in the distribution monitoring step, a table for setting an item relating to the monitoring and a threshold value corresponding to the item for determining a failure relating to data distribution. To execute the processing described in the delivery monitoring item on the table, and then compare the threshold value set in the table with the monitoring result, and determine whether the monitoring result is the threshold. When the value is smaller than the threshold value, the monitoring result corresponding to the distribution monitoring item is determined to be normal. On the other hand, when the monitoring result is greater than the threshold value, the monitoring result corresponding to the distribution monitoring item is determined to be abnormal. (Corresponding to steps S12 to S15 in the embodiment described later).
【0043】この発明によれば、配信監視ステップに
て、テーブルから、配信監視項目を自動的に指定する。
これにより、管理者は、その監視結果を確認するだけで
よく、本システム全体を効率よく管理することができる
ようになる。また、この発明によれば、監視を行う計算
機毎に、個別のテーブルを持つことが可能となる。これ
により、各計算機が位置するネットワークに適した最適
なしきい値を指定(設定)することができるようにな
り、さらに、この最適なしきい値に基づいて、より精度
の高い監視を行うことができる。According to the present invention, in the distribution monitoring step, the distribution monitoring item is automatically designated from the table.
As a result, the administrator only needs to confirm the monitoring result, and can efficiently manage the entire system. Further, according to the present invention, it is possible to have a separate table for each computer to be monitored. This makes it possible to specify (set) an optimum threshold value suitable for the network in which each computer is located, and to perform more accurate monitoring based on the optimum threshold value. .
【0044】つぎの発明にかかる配信監視方法におい
て、前記対策決定ステップでは、前記配信監視ステップ
にて通知される複数の監視結果を受信し、かつその監視
結果の少なくとも一つに異常通知が含まれている場合、
その監視結果に含まれるアドレス情報に基づいて、異常
が発生した計算機の位置または通信路を推定することを
特徴とする(後述する実施の形態のステップS22〜ス
テップS27,ステップS31〜ステップS37,ステ
ップS41〜ステップS47に相当)。In the distribution monitoring method according to the next invention, in the measure determining step, a plurality of monitoring results notified in the distribution monitoring step are received, and at least one of the monitoring results includes an abnormality notification. If
Based on the address information included in the monitoring result, the position or communication path of the computer where the abnormality has occurred is estimated (steps S22 to S27, S31 to S37, S41 to step S47).
【0045】この発明によれば、対策決定ステップに
て、大規模ネットワークの各計算機からの多くの監視結
果を集計する。これにより、従来のようなネットワーク
内の計算機が多いほど障害位置の特定が難しくなる、と
いう傾向が改善され、さらにネットワークが大きくなる
ほど監視結果も多く集計できることから、障害発生位置
の確定の信頼度をより高くすることができる。According to the present invention, in the countermeasure determining step, many monitoring results from each computer of the large-scale network are totaled. This improves the tendency that the more computers in the network, the more difficult it is to identify the fault location, and the larger the network, the more monitoring results can be aggregated. Can be higher.
【0046】つぎの発明にかかる配信監視方法におい
て、前記対策決定ステップでは、さらに、前記推定した
位置または通信路に基づいて、障害に対する修復を行う
ための計算機を決定し、その決定した計算機に対して、
障害を修復するための対策情報を送信することを特徴と
する(後述する実施の形態のステップS28,ステップ
S39,ステップS49に相当)。In the distribution monitoring method according to the next invention, in the countermeasure determining step, a computer for repairing a failure is further determined based on the estimated position or communication path, and the determined computer is hand,
It is characterized by transmitting countermeasure information for repairing a failure (corresponding to step S28, step S39, and step S49 in the embodiment described later).
【0047】この発明によれば、対策決定ステップに
て、より信頼性の高い障害発生位置が得られる。これに
より、対策を実行する最適な計算機を選択することがで
きる。According to the present invention, a more reliable failure occurrence position can be obtained in the measure determination step. As a result, it is possible to select an optimum computer for executing the countermeasure.
【0048】つぎの発明にかかる配信監視方法におい
て、前記対策決定ステップでは、さらに、障害情報とそ
の対策情報を記憶する対策管理テーブルを用いて、通知
される監視結果に含まれる障害情報と適合する対策情報
を選択し、その後、前記決定した計算機に対して、その
対策情報を送信することを特徴とする(後述する実施の
形態のステップS38に相当)。[0048] In the distribution monitoring method according to the next invention, in the measure deciding step, the measure information is further matched with the trouble information included in the notified monitoring result by using a measure management table storing the trouble information and the measure information. It is characterized in that countermeasure information is selected, and then the countermeasure information is transmitted to the determined computer (corresponding to step S38 in an embodiment described later).
【0049】この発明によれば、対策決定ステップに
て、対策管理テーブルの中から、通知される監視結果に
含まれる障害情報と適合する対策情報を選択する。これ
により、さらに効率よく最適な対策情報の決定を行うこ
とができる。また、この発明によれば、対策決定ステッ
プを実行する計算機毎に対策管理テーブルを持つことが
できるようになる。これにより、各計算機が位置するネ
ットワークに最適な対策情報を決定することができる。According to the present invention, in the countermeasure determination step, the countermeasure information that matches the fault information included in the notified monitoring result is selected from the countermeasure management table. This makes it possible to more efficiently determine optimal countermeasure information. Further, according to the present invention, a countermeasure management table can be provided for each computer that executes the countermeasure determination step. This makes it possible to determine optimal countermeasure information for the network in which each computer is located.
【0050】つぎの発明にかかる配信監視方法におい
て、前記対策決定ステップでは、さらに、障害情報と、
修復の実行優先度を示す優先順位が含まれた少なくとも
一つの対策情報を記憶する対策管理テーブルを用いて、
通知される監視結果に含まれる障害情報と適合する少な
くとも一つの対策情報を選択し、その後、前記決定した
計算機に対して、その対策情報を送信し(後述する実施
の形態のステップS48〜ステップS49に相当)、前
記決定された計算機における前記対策実行ステップで
は、前記対策決定ステップにて送信される対策情報に基
づいて、その情報に適合した対策を前記優先順位の順に
実行することを特徴とする(ステップS61〜ステップ
S63に相当)。In the distribution monitoring method according to the next invention, the measure determining step further includes:
Using a countermeasure management table that stores at least one countermeasure information including a priority indicating a repair execution priority,
At least one piece of countermeasure information that matches the fault information included in the notified monitoring result is selected, and then the countermeasure information is transmitted to the determined computer (steps S48 to S49 of an embodiment described later). In the countermeasure execution step in the determined computer, based on the countermeasure information transmitted in the countermeasure determination step, countermeasures adapted to the information are executed in the order of the priority. (Corresponding to steps S61 to S63).
【0051】この発明によれば、対策決定ステップに
て、一つの障害に対して複数の対策を優先度指定で送信
する。これにより、対策を実行する計算機では、より確
実な障害対策を行うことができる。また、この発明によ
れば、対策決定ステップを実行する計算機毎に対策管理
テーブルを所持することができるようになる。これによ
り、個々のネットワークに最適な対策を決定できる。According to the present invention, in the countermeasure determination step, a plurality of countermeasures are transmitted for one fault with a specified priority. As a result, the computer executing the countermeasure can take a more reliable countermeasure. Further, according to the present invention, it is possible to have a countermeasure management table for each computer that executes the countermeasure determination step. As a result, an optimal measure can be determined for each network.
【0052】つぎの発明にかかる配信監視方法におい
て、前記対策実行ステップでは、さらに、前記実行した
すべての対策の有効性を測定し、その測定結果を各対策
の有効性情報として前記対策決定ステップを実行する計
算機に対して送信し(後述する実施の形態のステップS
64〜ステップS66に相当)、前記対策決定ステップ
では、さらに、前記対策実行ステップにて送信される有
効性情報を、前記対策管理テーブルに反映することを特
徴とする(ステップS50〜ステップS51)。[0052] In the distribution monitoring method according to the next invention, in the countermeasure execution step, the effectiveness of all the executed countermeasures is measured, and the measurement result is used as the effectiveness information of each countermeasure. It is transmitted to the computer to be executed (Step S in the embodiment described later).
64-corresponding to step S66), wherein the measure determining step further reflects the validity information transmitted in the measure executing step in the measure management table (steps S50 to S51).
【0053】この発明によれば、対策実行ステップを実
行する計算機が、実行したすべての対策の有効性を測定
し、その測定結果を各対策の有効性情報として対策決定
ステップを実行する計算機に送信し、さらに、この計算
機が、受け取った有効性情報を、対策管理テーブルに反
映する。これにより、障害が発生するほど、対策管理テ
ーブルが最適な状態となり、より効果のある対策をたて
ることができ、さらに、この対策を優先順位に応じて実
行可能となるため、より高信頼な障害対策を行うことが
できる。According to the present invention, the computer executing the countermeasure execution step measures the effectiveness of all executed countermeasures, and transmits the measurement result to the computer executing the countermeasure determination step as the effectiveness information of each countermeasure. Then, the computer reflects the received validity information in the countermeasure management table. As a result, the more the failure occurs, the more optimally the countermeasure management table becomes, so that more effective countermeasures can be taken. Further, since the countermeasures can be executed in accordance with the priority order, a more reliable Trouble measures can be taken.
【0054】[0054]
【発明の実施の形態】以下に、本発明にかかる分散デー
タ配信管理システムおよび配信監視方法の実施の形態を
図面に基づいて詳細に説明する。なお、この実施の形態
によりこの発明が限定されるものではない。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, embodiments of a distributed data distribution management system and a distribution monitoring method according to the present invention will be described in detail with reference to the drawings. The present invention is not limited by the embodiment.
【0055】図1は、この発明にかかる分散データ配信
管理システムにおける実施の形態の構成図を示すもので
ある。図1において、1はデータの配信状態を監視する
複数の計算機であり(配信監視手段を含む)、2は各計
算機間の通信において障害が発生した場合に、各計算機
1から受信した監視情報に基づいて、その障害に対する
最適な対策を決定する計算機であり(対策決定手段を含
む)、3は計算機2から受信した前記対策情報に基づい
て、該情報に適合した対策を実行する計算機であり(対
策実行手段を含む)、4は送信局からアップリンクされ
る衛星電波であり、5は通信衛星であり、6は通信衛星
5から受信局にダウンリンクされる衛星電波であり、7
はLAN等の公衆回線である。FIG. 1 is a block diagram showing an embodiment of a distributed data distribution management system according to the present invention. In FIG. 1, reference numeral 1 denotes a plurality of computers for monitoring a data distribution state (including a distribution monitoring means). Reference numeral 2 denotes monitoring information received from each computer 1 when a failure occurs in communication between the computers. Based on the countermeasure information received from the computer 2, a computer 3 executes a countermeasure adapted to the information based on the countermeasure information received from the computer 2. 4 is a satellite radio wave uplinked from the transmitting station, 5 is a communication satellite, 6 is a satellite radio wave downlinked from the communication satellite 5 to the receiving station, and 7
Is a public line such as a LAN.
【0056】なお、本発明にかかる分散データ配信管理
システムにおいては、図2に示すように、前記各計算機
1、計算機2、および計算機3のそれぞれが、先に説明
した各計算機の機能の他に、前記配信監視手段、前記対
策決定手段、および前記対策実行手段の、少なくともい
ずれか一つの機能をさらに有することとしてもよい。具
体的にいうと、例えば、計算機1´が計算機1および3
の機能を有し、計算機2´が計算機1および2の機能を
有し、計算機3´が計算機1,2および3の機能を有す
るような、図2に示す一例があげられる。In the distributed data distribution management system according to the present invention, as shown in FIG. 2, each of the computers 1, 2 and 3 has functions other than the functions of each computer described above. And at least one of the distribution monitoring unit, the countermeasure determination unit, and the countermeasure execution unit. More specifically, for example, the computer 1 ′ is
FIG. 2 shows an example in which the computer 2 'has the functions of the computers 1 and 2 and the computer 3' has the functions of the computers 1, 2 and 3.
【0057】以下、上記のように構成される分散データ
配信管理システムの動作を、フローチャートに基づいて
詳細に説明する。図3は、本発明にかかる分散データ配
信管理システムを構成する各計算機1の動作を示すフロ
ーチャートである。なお、ここでは、一つの計算機1の
動作について説明するが、他の計算機1についても同様
に動作するものとする。Hereinafter, the operation of the distributed data distribution management system configured as described above will be described in detail with reference to flowcharts. FIG. 3 is a flowchart showing the operation of each computer 1 constituting the distributed data distribution management system according to the present invention. Here, the operation of one computer 1 will be described, but it is assumed that the other computers 1 operate similarly.
【0058】まず、計算機1は、常駐プログラム等(タ
イマーの設定等)により、データ配信に関する監視時間
であるかどうかを確認する(ステップS1)。このと
き、まだ監視時間に到達していない場合(ステップS
1,No)、計算機1では、監視時間に達するまで(ス
テップS1,Yes)この確認処理を行う。First, the computer 1 checks whether or not it is the monitoring time for data distribution by using a resident program or the like (setting of a timer or the like) (step S1). At this time, if the monitoring time has not yet arrived (step S
1, No), the computer 1 performs this confirmation processing until the monitoring time has been reached (step S1, Yes).
【0059】監視時間に達すると、計算機1は、例え
ば、図4(a)に示すような予め設定しておいた配信監
視項目テーブルに記載された配信監視項目(回線速度、
コリジョン等)を取得し(ステップS2)、その配信監
視項目に記載された処理を実行する(ステップS3)。
そして、その実行結果を、例えば、図4(b)に示す監
視状態テーブルに記載し(ステップS4)、さらに、過
去の統計から得られる標準偏差に基づいて、前記実行結
果がどの程度の水準にあるかを表す数値(以後、偏差値
と呼ぶ)を計算し、その計算結果を監視状態テーブルに
保存しておく(ステップS5)。When the monitoring time has been reached, Calculator 1 sends, for example, the delivery monitoring items (line speed, line speed, etc.) described in the delivery monitoring item table set in advance as shown in FIG.
(Step S2), and executes the process described in the distribution monitoring item (Step S3).
Then, the execution result is described in, for example, a monitoring state table shown in FIG. 4B (step S4), and further based on a standard deviation obtained from past statistics, A numerical value representing the presence (hereinafter, referred to as a deviation value) is calculated, and the calculation result is stored in the monitoring state table (step S5).
【0060】その後、計算機1では、予め用意しておい
た配信監視項目テーブルに記載の参照用基準偏差値と、
先に計算により求めて保存しておいた偏差値とを、図4
(a)に示す比較値に基づいて比較する処理を行う(ス
テップS6)。その際、計算機1では、先に保存してお
いた偏差値が、予め用意しておいた参照用基準偏差値
(図4(a)の配信監視項目テーブルに記載)に対する
比較値どおりの場合(ステップS7,Yes)は、その
配信監視項目に対応する監視結果を正常と判断し、この
動作を一定時間間隔で繰り返し行う(ステップS1から
ステップS7)。一方、保存しておいた偏差値が、予め
用意しておいた参照用基準偏差値に対する比較値と異な
る場合(ステップS7,No)は、その配信監視項目に
対応する監視結果を異常と判断し、その旨を計算機2に
通知する(ステップS8)。Thereafter, in the computer 1, the reference deviation value for reference described in the distribution monitoring item table prepared in advance,
FIG. 4 shows the deviation value obtained by calculation and stored.
A comparison process is performed based on the comparison value shown in (a) (step S6). At this time, in the computer 1, when the previously stored deviation value is the same as the comparison value with the reference deviation value for reference prepared in advance (described in the distribution monitoring item table of FIG. 4A) ( In step S7, Yes), the monitoring result corresponding to the distribution monitoring item is determined to be normal, and this operation is repeated at regular time intervals (step S1 to step S7). On the other hand, if the stored deviation value is different from the comparison value for the reference deviation value prepared in advance (step S7, No), the monitoring result corresponding to the distribution monitoring item is determined to be abnormal. Then, the fact is notified to the computer 2 (step S8).
【0061】なお、偏差値を計算する際に使用される標
準偏差の値は、配信監視項目の監視処理(ステップS1
〜ステップS7)を行った後に、その都度反映され更新
される。また、各計算機1では、監視結果を異常と判断
した場合だけではなく、正常と判断した場合において
も、その旨を計算機2に通知する。また、比較値が、例
えば、図4(a)に示すような”<”の場合は、監視結
果、すなわち、保存しておいた偏差値が参照用基準偏差
値よりも大きいときに、”Yes”、と判断され、”
>”の場合は、保存しておいた偏差値が参照用基準偏差
値よりも小さいときに、”Yes”、と判断される。ま
た、比較値には、上記”>”、”<”以外に、例え
ば、”≦(以上)”,”≧(以下)”,”|≦|(絶対
値以上)”,”|≧|(絶対値以上)”,”=(同
一)”,”≠(相違)”,等があり、さらに、その他、
比較値として判断可能なものであれば、これ以外のもの
であってもよい。It should be noted that the standard deviation value used in calculating the deviation value is determined by monitoring the distribution monitoring item (step S1).
After performing step S7), the information is reflected and updated each time. Each computer 1 notifies the computer 2 not only when the monitoring result is determined to be abnormal but also when it is determined to be normal. When the comparison value is “<” as shown in FIG. 4A, for example, when the monitored result, that is, the stored deviation value is larger than the reference deviation value for reference, “Yes” ”
>>, it is determined as “Yes” when the stored deviation value is smaller than the reference standard deviation value, and the comparison value is other than “>” and “<”. For example, for example, “≦ (or more)”, “≧ (or less)”, “| ≦ | (absolute value or more)”, “| ≧ | (absolute value or more)”, “= (identical)”, “≠ ( Difference) ”, etc.
Other values may be used as long as they can be determined as comparison values.
【0062】以上のように、計算機1では、図4に示す
配信監視項目テーブルから、配信監視項目を自動的に指
定するため、管理者は、その監視結果を確認するだけで
よく、本システム全体を効率よく管理することができ
る。また、計算機1は、配信監視項目の正常/異常の判
断を標準値により決定するため、システムチェック回数
が増えるほど、精度の高い標準偏差が得られ、それに伴
って信頼度の高い異常チェックを行うことができる。As described above, in the computer 1, the distribution monitoring item is automatically specified from the distribution monitoring item table shown in FIG. Can be managed efficiently. In addition, since the computer 1 determines the normal / abnormal judgment of the distribution monitoring item based on the standard value, a higher standard deviation is obtained as the number of system checks increases, and accordingly, an abnormality check with higher reliability is performed. be able to.
【0063】従って、この発明にかかる分散データ配信
管理システムでは、自動的に異常を検知するとともに、
正常時の状態も管理しているため、障害発生時の原因究
明の手助けとなるデータ、および再発防止のためのデー
タ等を得ることができる。また、正常または異常の判断
を、得られる監視結果ではなく、その監視結果から求め
られる偏差値を用いて行うため、監視時間が長いほど、
すなわち、監視により得られるデータが多いほど、信頼
性の高いシステムを構築できる。また、配信監視項目を
自由に変更および追加できるため、より信頼性の高いシ
ステムを得ることができる。Therefore, the distributed data distribution management system according to the present invention automatically detects abnormalities,
Since the normal state is also managed, it is possible to obtain data for helping to determine the cause when a failure occurs, data for preventing recurrence, and the like. In addition, since the determination of normal or abnormal is performed using the deviation value obtained from the monitoring result instead of the obtained monitoring result, the longer the monitoring time,
That is, the more data obtained by monitoring, the more reliable the system can be constructed. In addition, since the distribution monitoring items can be freely changed and added, a more reliable system can be obtained.
【0064】また、図5は、前記図3とは異なる、本発
明にかかる分散データ配信管理システムを構成する各計
算機1の動作を示すフローチャートである。なお、ここ
では、一つの計算機1の動作について説明するが、他の
計算機1についても同様に動作するものとする。FIG. 5 is a flowchart showing the operation of each computer 1 constituting the distributed data distribution management system according to the present invention, which is different from FIG. Here, the operation of one computer 1 will be described, but it is assumed that the other computers 1 operate similarly.
【0065】まず、計算機1は、常駐プログラム等(タ
イマーの設定等)により、データ配信に関する監視時間
であるかどうかを確認する(ステップS11)。このと
き、まだ監視時間に到達していない場合(ステップS1
1,No)、計算機1では、監視時間に達するまで(ス
テップS11,Yes)この確認処理を行う。First, the computer 1 checks whether or not it is a monitoring time for data distribution by using a resident program or the like (setting of a timer or the like) (step S11). At this time, if the monitoring time has not yet arrived (step S1)
1, No), the computer 1 performs this confirmation processing until the monitoring time is reached (step S11, Yes).
【0066】監視時間に達すると、計算機1は、例え
ば、図6に示すような予め設定しておいた配信監視項目
テーブルに記載された配信監視項目(回線速度、コリジ
ョン等)を取得し(ステップS12)、その配信監視項
目に記載された処理を実行する(ステップS13)。そ
して、その実行結果を、先に説明した図4(b)に示す
監視状態テーブルに記載し、その後、計算機1では、予
め用意しておいた配信監視項目テーブルに記載の参照用
しきい値と、先に記載しておいた監視結果とを、比較す
る処理を行う(ステップS14)。When the monitoring time is reached, the computer 1 obtains, for example, distribution monitoring items (line speed, collision, etc.) described in a preset distribution monitoring item table as shown in FIG. S12), and execute the processing described in the distribution monitoring item (step S13). Then, the execution result is described in the monitoring status table shown in FIG. 4B described above, and thereafter, in the computer 1, the reference threshold value described in the distribution monitoring item table prepared in advance is used. Then, a process of comparing the above-described monitoring result with the monitoring result is performed (step S14).
【0067】その際、計算機1では、前記監視結果が、
予め用意しておいた参照用しきい値(図6の配信監視項
目テーブルに記載)に対する比較値どおりの場合(ステ
ップS15,Yes)は、その配信監視項目に対応する
監視結果を正常と判断し、この動作を一定時間間隔で繰
り返し行う(ステップS11からステップS15)。一
方、前記監視結果が、予め用意しておいた参照用しきい
値に対する比較値と異なる場合(ステップS15,N
o)は、その配信監視項目に対応する監視結果を異常と
判断し、その旨を計算機2に通知する(ステップS1
6)。なお、各計算機1では、監視結果を異常と判断し
た場合だけではなく、正常と判断した場合においても、
その旨を計算機2に通知する。また、ここでいう比較値
も、先に一例としてあげた比較値と同様、さまざまな種
類がある。At this time, in the computer 1, the monitoring result is
In the case where the comparison value with the prepared reference threshold value (described in the distribution monitoring item table of FIG. 6) is the same as that of the comparison (step S15, Yes), the monitoring result corresponding to the distribution monitoring item is determined to be normal. This operation is repeated at regular time intervals (steps S11 to S15). On the other hand, when the monitoring result is different from the comparison value for the reference threshold prepared in advance (step S15, N
o), the monitoring result corresponding to the distribution monitoring item is determined to be abnormal, and the fact is notified to the computer 2 (step S1).
6). In each computer 1, not only when the monitoring result is determined to be abnormal, but also when it is determined to be normal,
This is notified to the computer 2. Also, there are various types of comparison values here as well as the comparison values described above as an example.
【0068】以上のように、計算機1では、図6に示す
配信監視項目テーブルから、配信監視項目を自動的に指
定するため、管理者は、その監視結果を確認するだけで
よく、図3による動作と同様に、本システム全体を効率
よく管理することができる。また、計算機1は、監視を
行う計算機1毎に、個別の配信監視項目テーブルを持つ
ことが可能であるため、各計算機1が位置するネットワ
ークに適したしきい値を指定(設定)することができ
る。As described above, in the computer 1, the distribution monitoring item is automatically designated from the distribution monitoring item table shown in FIG. 6, so that the administrator only needs to confirm the monitoring result, and FIG. Like the operation, the entire system can be managed efficiently. Further, since the computer 1 can have an individual distribution monitoring item table for each computer 1 to be monitored, it is possible to specify (set) a threshold suitable for the network in which each computer 1 is located. it can.
【0069】従って、この発明にかかる分散データ配信
管理システムでは、各計算機1が位置するネットワーク
に適したしきい値に基づいて、より精度の高い監視を行
うことができる。Therefore, in the distributed data distribution management system according to the present invention, more accurate monitoring can be performed based on the threshold value suitable for the network in which each computer 1 is located.
【0070】図7は、本発明にかかる分散データ配信管
理システムを構成する計算機2の動作を示すフローチャ
ートである。図7に基づいて計算機2の動作を説明す
る。まず、待ち受け状態(ステップS21)の計算機2
は、各計算機1から通知される監視結果を受信し(ステ
ップS22)、受け取った複数の監視結果の集計を行う
(ステップS23)。その際、計算機2では、受け取っ
た複数の監視結果から異常通知の有無を確認する(ステ
ップS24)。例えば、異常通知がなかった場合(ステ
ップ24,Yes)、計算機2は、再び監視結果の待ち
受け状態にはいる(ステップS21)。FIG. 7 is a flowchart showing the operation of the computer 2 constituting the distributed data distribution management system according to the present invention. The operation of the computer 2 will be described based on FIG. First, the computer 2 in the standby state (step S21)
Receives the monitoring result notified from each computer 1 (step S22), and totals the received plurality of monitoring results (step S23). At this time, the computer 2 confirms the presence or absence of an abnormality notification from the received plurality of monitoring results (step S24). For example, when there is no abnormality notification (Step 24, Yes), the computer 2 enters the monitoring result waiting state again (Step S21).
【0071】一方、異常があった場合(ステップS2
4,No)、計算機2は、異常を通知した計算機1に対
応するアドレスを格納し(ステップS25)、その後、
すべての計算機1からの監視結果を受け取るまで、上記
ステップS21〜ステップS25の処理を繰り返し行う
(ステップS26)。そして、すべての計算機1から監
視結果を受け取った後、計算機2は、異常を通知した計
算機1(一つである必要はない)のアドレスに基づい
て、異常が発生した計算機1の位置(または通信路)を
推定する(ステップS27)。On the other hand, when there is an abnormality (step S2
4, No), the computer 2 stores the address corresponding to the computer 1 that has notified the abnormality (step S25), and thereafter,
Until the monitoring results from all the computers 1 are received, the processing of the above-described steps S21 to S25 is repeated (step S26). Then, after receiving the monitoring results from all the computers 1, the computer 2 determines the position (or communication) of the computer 1 in which the abnormality has occurred based on the address of the computer 1 (not necessarily one) that has notified the abnormality. Road) is estimated (step S27).
【0072】その後、計算機2は、推定した位置(アド
レス)に基づいて、異常(障害)に対する修復(応急措
置)を行うための計算機3を選択し、選択された該計算
機3に対して、その障害を修復するための対策情報を送
付して(ステップS28)、再び監視結果の待ち受け状
態にはいる。After that, the computer 2 selects a computer 3 for performing a repair (first aid measure) for an abnormality (failure) based on the estimated position (address), and sends the selected computer 3 to the selected computer 3. The countermeasure information for repairing the failure is sent (step S28), and the apparatus is again in a state of waiting for the monitoring result.
【0073】以上のように、本発明の分散データ配信管
理システムにおいては、計算機2を有することにより、
従来のような、ネットワーク内の計算機が多いほど障害
位置の特定が難しくなる、という傾向が改善され、ネッ
トワークが大きくなるほど監視結果も多く集計できるこ
とから、障害発生位置の確定の信頼度をより高くするこ
とができる。また、より信頼性の高い障害発生位置が得
られれば、それに伴って、より適切な計算機3を選択す
ることもできる。As described above, in the distributed data distribution management system of the present invention, by having the computer 2,
As in the past, the tendency that the more computers in the network, the more difficult it is to identify the fault location is improved, and the larger the network, the more monitoring results can be aggregated, so the reliability of determining the fault location is increased. be able to. If a more reliable failure occurrence position is obtained, a more appropriate computer 3 can be selected accordingly.
【0074】図8は、図7とは異なる、本発明にかかる
分散データ配信管理システムを構成する計算機2の動作
を示すフローチャートである。図8に基づいて計算機2
の動作を説明する。なお、図8のフローチャートにおい
ては、ステップS38以外の処理が図7のフローチャー
トにおけるステップS21からステップS28の処理と
同一であるため、それらの処理に関しては説明を省略す
る。FIG. 8 is a flowchart different from FIG. 7 showing the operation of the computer 2 constituting the distributed data distribution management system according to the present invention. Computer 2 based on FIG.
Will be described. In the flowchart of FIG. 8, processing other than step S38 is the same as the processing of steps S21 to S28 in the flowchart of FIG. 7, and a description thereof will be omitted.
【0075】まず、計算機2は、すべての計算機1から
の監視結果を受け取るまで、ステップS31〜ステップ
S36の処理を繰り返し行い、そして、すべての計算機
1から監視結果を受け取った後、異常を通知した計算機
1(一つである必要はない)のアドレスに基づいて、異
常が発生した計算機1の位置(または通信路)を推定す
る(ステップS37)。First, the computer 2 repeats the processing of steps S31 to S36 until the monitoring results from all the computers 1 are received, and notifies the abnormality after receiving the monitoring results from all the computers 1. Based on the address of the computer 1 (there is no need to be one), the position (or communication channel) of the computer 1 in which the abnormality has occurred is estimated (step S37).
【0076】ここで、計算機2は、障害内容とその対策
内容が示された、例えば、図9に示す対策管理テーブル
を用いて、通知される監視結果に含まれる障害情報と適
合する対策内容を選択する(ステップS38)。その
後、計算機2は、推定した位置(アドレス)に基づい
て、障害に対する修復(応急措置)を行うための計算機
3を選択し、選択された該計算機3に対して、その障害
を修復するための対策情報、すなわち、対策管理テーブ
ルから選択された対策情報を送付して(ステップS3
9)、再び監視結果の待ち受け状態にはいる。なお、上
記図9に示す対策管理テーブルには、障害内容とそれに
対する対策内容とを保持するテーブルがあり、例えば、
衛星回線を使用中に、「衛生回線がつながらない」、と
いう障害が発生した場合には、「地上回線を使用す
る」、という処理にて対策を行う。従って、図示の障害
内容については、いつでも自動的に対策可能であり、さ
らに図示の障害内容以外の障害については、いつでも追
加可能である。また、図9に示す対策管理テーブルは、
計算機2毎に有することとしてもよいが、例えば、ある
特定の計算機上にマスターとして格納しておき、それを
各計算機2が参照することとしてもよい。Here, the computer 2 uses the countermeasure management table shown in FIG. 9 in which the content of the fault and the countermeasure thereof are indicated. Select (step S38). Thereafter, the computer 2 selects a computer 3 for performing a repair (emergency measure) for the failure based on the estimated position (address), and for the selected computer 3 for repairing the failure. The countermeasure information, that is, the countermeasure information selected from the countermeasure management table is sent (step S3).
9), it is in a state of waiting for the monitoring result again. Note that the countermeasure management table shown in FIG. 9 includes a table that holds the content of a fault and the content of a countermeasure against the fault.
If a failure such as "the satellite line is not connected" occurs while using the satellite line, a countermeasure is taken by processing "use the ground line". Accordingly, it is possible to automatically take measures against the failure contents shown in the figure at any time, and to add failures other than the failure contents shown in the figure at any time. The countermeasure management table shown in FIG.
Although it may be provided for each computer 2, for example, it may be stored as a master on a specific computer and each computer 2 may refer to it.
【0077】以上のように、本発明の分散データ配信管
理システムにおいて、計算機2は、図9に示す対策管理
テーブルを使用することが可能となり、これにより、障
害に対する対策を決定するため、さらに効率よく対策情
報の決定を行うことができる。また、計算機2毎に対策
管理テーブルを持つことができるため、計算機2が位置
するネットワークに最適な対策情報を決定することがで
きる。As described above, in the distributed data distribution management system of the present invention, it becomes possible for the computer 2 to use the countermeasure management table shown in FIG. It is often possible to determine countermeasure information. Further, since a countermeasure management table can be provided for each computer 2, it is possible to determine optimum countermeasure information for the network where the computer 2 is located.
【0078】図10は、図9とは異なる、本発明にかか
る分散データ配信管理システムを構成する計算機2の動
作を示すフローチャートと、計算機3の動作を示すフロ
ーチャートである。図10に基づいて計算機2および計
算機3の動作を説明する。なお、図10のフローチャー
トにおいては、ステップS48〜ステップS51以外の
処理が図8のフローチャートにおけるステップS31か
らステップS37の処理と同一であるため、それらの処
理に関しては説明を省略する。FIG. 10 is a flowchart different from FIG. 9 showing the operation of the computer 2 constituting the distributed data distribution management system according to the present invention, and the flowchart showing the operation of the computer 3. The operation of the computer 2 and the computer 3 will be described based on FIG. In the flowchart of FIG. 10, the processes other than Steps S48 to S51 are the same as the processes of Steps S31 to S37 in the flowchart of FIG. 8, and thus description thereof will be omitted.
【0079】まず、計算機2は、すべての計算機1から
の監視結果を受け取るまで、ステップS41〜ステップ
S46の処理を繰り返し行い、そして、すべての計算機
1から監視結果を受け取った後、異常を通知した計算機
1(一つである必要はない)のアドレスに基づいて、異
常が発生した計算機1の位置(または通信路)を推定す
る(ステップS47)。First, the computer 2 repeats the processing of steps S41 to S46 until the monitoring results from all the computers 1 are received, and notifies the abnormality after receiving the monitoring results from all the computers 1. Based on the address of the computer 1 (there is no need to be one), the position (or communication channel) of the computer 1 in which the abnormality has occurred is estimated (step S47).
【0080】ここで、計算機2は、障害内容と、その障
害内容に対応する少なくとも一つの対策内容が示され
た、例えば、図11に示す対策管理テーブルを用いて、
通知される監視結果に含まれる障害情報と最も適合する
少なくとも一つの対策内容を選択する(ステップS4
8)。Here, the computer 2 uses, for example, a countermeasure management table shown in FIG. 11 in which the content of the fault and at least one countermeasure corresponding to the fault are shown.
At least one countermeasure content that best matches the fault information included in the notified monitoring result is selected (step S4).
8).
【0081】その後、計算機2は、推定した位置(アド
レス)に基づいて、障害に対する修復(応急措置)を行
うための計算機3を選択し、選択された該計算機3に対
して、その障害を修復するための対策情報、すなわち、
図11に示す対策管理テーブルから選択された対策情報
を送信する(ステップS49)。なお、上記障害内容に
対応する少なくとも一つの対策内容には、それぞれ修復
の実行優先度を示す優先順位が含まれている。具体的に
は、上記図11に示す対策管理テーブルには、障害内容
とそれに対する少なくとも1つの対策内容(優先順位を
含む)とを保持するテーブルがあり、例えば、衛星回線
を使用中に、「衛生回線がつながらない」、という障害
が発生した場合には、「地上回線を使用する」、「管理
者に連絡する」、または「再送する」、…、という処理
の中から、最も点数(優先順位)の高い順に対策を行
う。従って、図示の障害内容については、いつでも最適
な対策が選択可能であり、さらに、図示の障害内容以外
の障害、およびその他の処理内容については、いつでも
追加可能である。また、図11に示す対策管理テーブル
は、計算機2毎に有することとしてもよいが、例えば、
ある特定の計算機上にマスターとして格納しておき、そ
れを各計算機2が参照することとしてもよい。Thereafter, the computer 2 selects a computer 3 for performing a repair (emergency measure) for the failure based on the estimated position (address), and repairs the failure for the selected computer 3. Action information,
The countermeasure information selected from the countermeasure management table shown in FIG. 11 is transmitted (step S49). It should be noted that at least one countermeasure content corresponding to the failure content includes a priority indicating a repair execution priority. Specifically, the countermeasure management table shown in FIG. 11 includes a table that holds the content of a fault and at least one content of a countermeasure (including a priority) for the fault. If a fault such as "sanitary line is not connected" occurs, the highest score (priority order) from the processes of "use terrestrial line", "contact the administrator", or "retransmit". Take countermeasures in descending order. Therefore, an optimum countermeasure can be selected at any time with respect to the illustrated failure content, and a failure other than the illustrated failure content and other processing content can be added at any time. Further, the countermeasure management table shown in FIG. 11 may be provided for each computer 2, but for example,
It may be stored as a master on a specific computer, and each computer 2 may refer to it.
【0082】対策情報を受け取った(ステップS61)
計算機3は、その情報に含まれる優先順位を加味して対
策を決定し、そして、順に実行する(ステップS62,
ステップS63)。対策を実行した計算機3では、それ
らの対策の有効性を確認(測定)し(ステップS6
4)、さらに、各対策の有効性を測定結果に応じて採点
し(ステップS65)、最後に、その点数を各対策の有
効性情報として計算機2に送信する(ステップS6
6)。The countermeasure information has been received (step S61).
The computer 3 determines a countermeasure in consideration of the priority included in the information, and sequentially executes the countermeasures (step S62,
Step S63). The computer 3 that has executed the countermeasures confirms (measures) the effectiveness of those countermeasures (step S6).
4) Further, the effectiveness of each measure is scored according to the measurement result (step S65), and finally, the score is transmitted to the computer 2 as the effectiveness information of each measure (step S6).
6).
【0083】その後、各対策の有効性情報を受け取った
(ステップS50)計算機2では、その点数を図11に
示す対策管理テーブルの各対策の点数欄に加え、対策管
理テーブルの更新を行い(ステップS51)、再び監視
結果の待ち受け状態にはいる。なお、図11において
は、点数によって優先度を表現しているが、これに限ら
ず、優先順位が判別できるものであれば、特に点数であ
る必要はない。また、各対策の優先順位については、例
えば、点数が高いほど優先順位が高い対策となり、さら
に、点数については、例えば、「大変有効である」、
「有効である」、「あまり有効でない」、「全く有効で
ない」等の段階に分け、それぞれ5、3、1、0点を各
テーブルに加算する。また、有効性については、例え
ば、「本体策のみで障害が解決した」、「他の対策も必
要であるが本対策も必要であった」、「しないよりした
方がよい程度」等の判断基準を設けることとする。After that, the computer 2 having received the validity information of each measure (Step S50) adds the score to the score column of each measure in the measure management table shown in FIG. 11, and updates the measure management table (Step S50). S51), and again enters a state of waiting for the monitoring result. In FIG. 11, the priority is expressed by the score, but the present invention is not limited to this, and the score does not need to be particularly scored as long as the priority can be determined. Also, regarding the priority of each measure, for example, the higher the score, the higher the priority is the measure. Further, for the score, for example, "very effective",
It is divided into stages such as "effective", "not very effective", and "not effective at all", and points 5, 3, 1, and 0 are added to each table. In addition, for effectiveness, for example, judgments such as "the problem was solved only by the main measures", "other measures were necessary but this measure was necessary", "it is better to not do" Standards will be set.
【0084】以上のように、計算機2が一つの障害に対
して複数の対策を優先度指定で行えるので、本発明の分
散データ配信管理システムにおいては、より確実な障害
対策を行うことができる。また、計算機2毎に対策管理
テーブルを所持することができるため、個々のネットワ
ークに最適な対策を決定できる。また、障害が発生する
ほど、より効果のある対策をたてることができ、この対
策を優先順位に応じて計算機3にて実行可能となるた
め、より高信頼な障害対策を行うことができる。As described above, since the computer 2 can perform a plurality of countermeasures for one fault by specifying the priority, the distributed data distribution management system of the present invention can perform more reliable fault countermeasures. In addition, since a countermeasure management table can be possessed for each computer 2, an optimum countermeasure can be determined for each network. In addition, as a failure occurs, a more effective measure can be taken, and this measure can be executed by the computer 3 according to the priority order, so that a more reliable measure can be taken.
【0085】以上、本実施の形態において説明したよう
に、本発明の分散データ配信管理システムにおいては、
計算機1,計算機2,および計算機3を有することによ
り、障害が発生した際に、自動的に、障害内容の収集、
障害発生位置の推定、障害対策の選択、および障害対策
の実行が行われることから、システム管理者の負荷を大
幅に軽減することが可能となるとともに、システム管理
者に専門的な知識を要求しない高信頼のシステムを構築
できる。また、図2に示すような構成であれば、さら
に、ネットワークおよびユーザの事情に依存しない自由
な構成で高信頼システムを構築できる。As described above, in the distributed data distribution management system of the present invention,
By having the computer 1, the computer 2, and the computer 3, when a failure occurs, the content of the failure is automatically collected,
Estimation of the fault occurrence location, selection of fault countermeasures, and execution of fault countermeasures can greatly reduce the load on the system administrator, and does not require specialized knowledge from the system administrator. A highly reliable system can be constructed. In addition, with the configuration shown in FIG. 2, a highly reliable system can be constructed with a free configuration that does not depend on the circumstances of the network and the user.
【0086】なお、特開平10−161952号公報の
発明では、衛星を使用したデータ配信システムのよう
に、送信側と受信側の物理的な距離が大きく、かつ受信
側での障害原因が送信側にあった場合に、適切な対応で
きない、という問題点があったが、本発明においては、
グループを行っていないため、受信側での障害原因が送
信側にあった場合でも適切な対応ができる。In the invention disclosed in Japanese Patent Application Laid-Open No. 10-161952, the physical distance between the transmitting side and the receiving side is large, and the cause of the failure on the receiving side is the transmitting side, as in a data distribution system using satellites. However, in the case of the above, there was a problem that it was not possible to appropriately respond, but in the present invention,
Since no grouping is performed, appropriate measures can be taken even if the cause of failure on the receiving side is on the transmitting side.
【0087】また、特開昭63−280537号公報の
発明では、前記ポーリング方式を採用し、障害発生から
検知までの時間の短縮に限界があり、障害が発生した場
合、瞬時に対応する必要があるシステムにおいて有効性
が低い、という問題点があったが、本発明においては、
各計算機が特定のタイミングで監視結果を送信するた
め、障害が発生した場合、瞬時に対応することができ
る。In the invention of Japanese Patent Application Laid-Open No. 63-280537, the polling method is adopted, and there is a limit in shortening the time from the occurrence of a failure to the detection. When a failure occurs, it is necessary to respond immediately. Although there was a problem that the effectiveness was low in a certain system, in the present invention,
Since each computer transmits the monitoring result at a specific timing, it is possible to respond instantaneously when a failure occurs.
【0088】また、特開平8−69396号公報の発明
では、ネットワーク回線が一つの場合をターゲットにし
ているため、その回線が切断しかつその原因がネットワ
ークを介した相手側にある場合に、この障害に対する対
策を行うことができない、という問題点と、ネットワー
クの転送性能が低下した場合、それを伝えるために性能
の低下したネットワークを使用しなければならず、障害
を報告するための時間が長くなり、障害報告ができなく
なる、という問題点があったが、本発明においては、複
数の回線(衛星回線,地上回線)を共有するため、適切
な対策を行うことができる。Further, in the invention of Japanese Patent Application Laid-Open No. 8-69396, since the case where the network line is one is targeted, when the line is disconnected and the cause is on the other side through the network, this method is performed. The inability to take countermeasures against failures and the fact that if the transfer performance of the network is degraded, a network with reduced performance must be used to communicate this, and the time to report the failure is long. However, in the present invention, since a plurality of lines (satellite lines and terrestrial lines) are shared, appropriate measures can be taken.
【0089】また、特開平9−186780号公報の発
明では、使用回線を公衆回線やISDNのような交換回
線に限定しているため、衛星回線やWAN等の回線の障
害を検知することができない、という問題点があった
が、本発明においては、衛星回線や地上回線を使用する
ため、適切な対策を行うことができる。Further, in the invention disclosed in Japanese Patent Application Laid-Open No. 9-186780, since the used line is limited to a switched line such as a public line or ISDN, a failure of a line such as a satellite line or a WAN cannot be detected. However, in the present invention, since a satellite line or a terrestrial line is used, appropriate measures can be taken.
【0090】また、特開平9−83514号公報の発明
では、衛星ネットワークのような数千〜数万の計算機か
らなる大規模ネットワークに対して、特定アドレスの設
定を行う計算機の負荷が非常に高くなる、という問題が
あったが、本発明においては、各計算機が障害発生の要
因に関係する特定アドレス情報を発行する処理を行わな
いため、計算機の負荷が高くならない。Also, in the invention of Japanese Patent Application Laid-Open No. 9-83514, the load of a computer for setting a specific address on a large-scale network including thousands to tens of thousands of computers such as a satellite network is extremely high. However, according to the present invention, the load on the computers does not increase because each computer does not perform the process of issuing the specific address information related to the cause of the failure.
【0091】[0091]
【発明の効果】以上、説明したとおり、この発明によれ
ば、第1の計算機,第2の計算機,および第3の計算機
を有することにより、障害が発生した際に、自動的に、
障害内容の収集、障害発生位置の推定、障害対策の選
択、および障害対策の実行が行われることから、該発生
した障害が最適な方法で自動的に修復される。これによ
り、システム管理者の負荷を大幅に軽減することが可能
となるとともに、システム管理者に専門的な知識を要求
しない高信頼のシステムを構築できる、という効果を奏
する。また、該障害に対する修復作業が効率よく実施可
能となる、という効果を奏する。As described above, according to the present invention, by having the first computer, the second computer, and the third computer, when a failure occurs, the first computer, the second computer, and the third computer are automatically set up.
Since the contents of the failure are collected, the location of the failure occurrence is estimated, the failure countermeasure is selected, and the failure countermeasure is executed, the generated failure is automatically repaired in an optimal manner. As a result, it is possible to greatly reduce the load on the system administrator, and it is possible to construct a highly reliable system that does not require specialized knowledge from the system administrator. In addition, there is an effect that the repair work for the failure can be efficiently performed.
【0092】つぎの発明によれば、各計算機が標準的に
備えていた機能の他に、さらに一つ以上の機能を備える
ことになる。これにより、ネットワークおよびユーザの
事情に依存しない自由な構成で高信頼システムを構築で
きる、という効果を奏する。According to the next invention, each computer has one or more functions in addition to the functions normally provided. As a result, there is an effect that a highly reliable system can be constructed with a free configuration that does not depend on the circumstances of the network and the user.
【0093】つぎの発明によれば、第1の計算機が、第
1のテーブルから、配信監視項目を自動的に指定する。
これにより、管理者は、その監視結果を確認するだけで
よく、本システム全体を効率よく管理することができる
ようになる、という効果を奏する。また、この発明によ
れば、第1の計算機が、配信監視項目の正常/異常の判
断を標準値に基づいて決定するため、システムチェック
回数が増えるほど、精度の高い標準偏差が得られる。こ
れにより、異常チェックの信頼度を向上させることがで
きる、という効果を奏する。また、この発明によれば、
第1の計算機が、自動的に異常を検知するとともに、正
常時の状態も管理する。これにより、障害発生時の原因
究明の手助けとなるデータ、および再発防止のためのデ
ータ等を得ることができる、という効果を奏する。ま
た、この発明によれば、配信監視項目を自由に変更およ
び追加可能となる。これにより、さらに信頼性の高いシ
ステムを構築できる、という効果を奏する。According to the next invention, the first computer automatically specifies a distribution monitoring item from the first table.
This has the effect that the administrator only needs to check the monitoring result and can efficiently manage the entire system. Further, according to the present invention, since the first computer determines the normal / abnormal judgment of the distribution monitoring item based on the standard value, the more accurate the system deviation, the higher the standard deviation. As a result, there is an effect that the reliability of the abnormality check can be improved. According to the invention,
The first computer automatically detects the abnormality and also manages the normal state. As a result, it is possible to obtain data for helping to determine the cause when a failure occurs, data for preventing recurrence, and the like. Further, according to the present invention, the distribution monitoring items can be freely changed and added. Thereby, there is an effect that a more reliable system can be constructed.
【0094】つぎの発明によれば、計算機1が、テーブ
ルから、配信監視項目を自動的に指定する。これによ
り、管理者は、その監視結果を確認するだけでよく、本
システム全体を効率よく管理することができるようにな
る、という効果を奏する。また、この発明によれば、監
視を行う第1の計算機毎に、個別のテーブルを持つこと
が可能となる。これにより、各第1の計算機が位置する
ネットワークに適した最適なしきい値を指定(設定)す
ることができるようになり、さらに、この最適なしきい
値に基づいて、より精度の高い監視を行うことができ
る、という効果を奏する。According to the next invention, the computer 1 automatically specifies the distribution monitoring items from the table. This has the effect that the administrator only needs to check the monitoring result and can efficiently manage the entire system. Further, according to the present invention, it is possible to have a separate table for each first computer to be monitored. This makes it possible to specify (set) an optimum threshold value suitable for the network in which each first computer is located, and to perform more accurate monitoring based on the optimum threshold value. The effect is that it can be done.
【0095】つぎの発明によれば、第2の計算機が、大
規模ネットワークの各計算機から多くの監視結果を集計
する。これにより、従来のようなネットワーク内の計算
機が多いほど障害位置の特定が難しくなる、という傾向
が改善され、さらにネットワークが大きくなるほど監視
結果も多く集計できることから、障害発生位置の確定の
信頼度をより高くすることができる、という効果を奏す
る。According to the next invention, the second computer compiles a large number of monitoring results from each computer in the large-scale network. This improves the tendency that the more computers in the network, the more difficult it is to identify the fault location, and the larger the network, the more monitoring results can be aggregated. This has the effect of being able to be higher.
【0096】つぎの発明によれば、より信頼性の高い障
害発生位置が得られる。これにより、最適な第3の計算
機を選択することができる、という効果を奏する。According to the next invention, a more reliable fault occurrence position can be obtained. Thereby, there is an effect that an optimum third computer can be selected.
【0097】つぎの発明によれば、第2の計算機が、対
策管理テーブルの中から、通知される監視結果に含まれ
る障害情報と適合する対策情報を選択する。これによ
り、さらに効率よく最適な対策情報の決定を行うことが
できる、という効果を奏する。また、この発明によれ
ば、第2の計算機毎に対策管理テーブルを持つことがで
きるようになる。これにより、第2の計算機が位置する
ネットワークに最適な対策情報を決定することができ
る、という効果を奏する。According to the next invention, the second computer selects, from the countermeasure management table, countermeasure information that matches the fault information included in the notified monitoring result. As a result, there is an effect that the optimum countermeasure information can be determined more efficiently. Further, according to the present invention, a countermeasure management table can be provided for each second computer. As a result, there is an effect that optimal countermeasure information can be determined for the network where the second computer is located.
【0098】つぎの発明によれば、第2の計算機が、一
つの障害に対して複数の対策を優先度指定で行える。こ
れにより、第3の計算機では、より確実な障害対策を行
うことができる、という効果を奏する。また、この発明
によれば、第2の計算機毎に対策管理テーブルを所持す
ることができるようになる。これにより、個々のネット
ワークに最適な対策を決定できる、という効果を奏す
る。According to the next invention, the second computer can perform a plurality of countermeasures for one failure by designating the priority. As a result, the third computer has an effect that more reliable countermeasures can be taken. Further, according to the present invention, it is possible to have a countermeasure management table for each second computer. As a result, there is an effect that an optimum measure can be determined for each network.
【0099】つぎの発明によれば、第3の計算機が、実
行したすべての対策の有効性を測定し、その測定結果を
各対策の有効性情報として第2の計算機に送信し、さら
に、第2の計算機が、第3の計算機から送信される有効
性情報を、対策管理テーブルに反映する。これにより、
障害が発生するほど、対策管理テーブルが最適な状態と
なり、より効果のある対策をたてることができ、さら
に、この対策を優先順位に応じて第3の計算機にて実行
可能となるため、より高信頼な障害対策を行うことがで
きる、という効果を奏する。According to the next invention, the third computer measures the effectiveness of all executed measures, transmits the measurement result as validity information of each measure to the second computer, and furthermore, The second computer reflects the validity information transmitted from the third computer in the countermeasure management table. This allows
The more failures occur, the more optimally the countermeasure management table becomes, so that more effective countermeasures can be taken. Further, this countermeasure can be executed by the third computer according to the priority order. This has the effect that highly reliable fault measures can be taken.
【0100】つぎの発明によれば、各計算機がそれぞ
れ、配信監視ステプ,対策決定ステップ,および対策実
行ステップを有することにより、障害が発生した際に、
自動的に、障害内容の収集、障害発生位置の推定、障害
対策の選択、および障害対策の実行が行われることか
ら、該発生した障害が最適な方法で自動的に修復され
る。これにより、システム管理者の負荷を大幅に軽減す
ることが可能となるとともに、システム管理者に専門的
な知識を要求しない高信頼のシステムを構築できる、と
いう効果を奏する。また、該障害に対する修復作業が効
率よく実施可能となる、という効果を奏する。According to the next invention, each computer has a distribution monitoring step, a countermeasure determining step, and a countermeasure execution step.
Since the contents of the fault, the location of the fault occurrence, the selection of the fault countermeasure, and the execution of the fault countermeasure are automatically performed, the fault that has occurred is automatically repaired in an optimal manner. As a result, it is possible to greatly reduce the load on the system administrator, and it is possible to construct a highly reliable system that does not require specialized knowledge from the system administrator. In addition, there is an effect that the repair work for the failure can be efficiently performed.
【0101】つぎの発明によれば、配信監視ステップに
て、第1のテーブルから、配信監視項目を自動的に指定
する。これにより、管理者は、その監視結果を確認する
だけでよく、本システム全体を効率よく管理することが
できるようになる、という効果を奏する。また、この発
明によれば、配信監視ステップにて、配信監視項目の正
常/異常の判断を標準値に基づいて決定するため、シス
テムチェック回数が増えるほど、精度の高い標準偏差が
得られる。これにより、異常チェックの信頼度を向上さ
せることができる、という効果を奏する。また、この発
明によれば、配信監視ステップにて、自動的に異常を検
知するとともに、正常時の状態も管理する。これによ
り、障害発生時の原因究明の手助けとなるデータ、およ
び再発防止のためのデータ等を得ることができる、とい
う効果を奏する。また、この発明によれば、配信監視項
目を自由に変更および追加可能となる。これにより、さ
らに信頼性の高いシステムを構築できる、という効果を
奏する。According to the next invention, in the distribution monitoring step, a distribution monitoring item is automatically designated from the first table. This has the effect that the administrator only needs to check the monitoring result and can efficiently manage the entire system. Further, according to the present invention, in the distribution monitoring step, the judgment of normal / abnormal of the distribution monitoring item is determined based on the standard value, so that the more accurate the system deviation is, the higher the standard deviation is obtained. As a result, there is an effect that the reliability of the abnormality check can be improved. Further, according to the present invention, in the distribution monitoring step, an abnormality is automatically detected, and a normal state is managed. As a result, it is possible to obtain data for helping to determine the cause when a failure occurs, data for preventing recurrence, and the like. Further, according to the present invention, the distribution monitoring items can be freely changed and added. Thereby, there is an effect that a more reliable system can be constructed.
【0102】つぎの発明によれば、配信監視ステップに
て、テーブルから、配信監視項目を自動的に指定する。
これにより、管理者は、その監視結果を確認するだけで
よく、本システム全体を効率よく管理することができる
ようになる、という効果を奏する。また、この発明によ
れば、監視を行う計算機毎に、個別のテーブルを持つこ
とが可能となる。これにより、各計算機が位置するネッ
トワークに適した最適なしきい値を指定(設定)するこ
とができるようになり、さらに、この最適なしきい値に
基づいて、より精度の高い監視を行うことができる、と
いう効果を奏する。According to the next invention, in the distribution monitoring step, the distribution monitoring item is automatically designated from the table.
This has the effect that the administrator only needs to check the monitoring result and can efficiently manage the entire system. Further, according to the present invention, it is possible to have a separate table for each computer to be monitored. This makes it possible to specify (set) an optimum threshold value suitable for the network in which each computer is located, and to perform more accurate monitoring based on the optimum threshold value. The effect is as follows.
【0103】つぎの発明によれば、対策決定ステップに
て、大規模ネットワークの各計算機からの多くの監視結
果を集計する。これにより、従来のようなネットワーク
内の計算機が多いほど障害位置の特定が難しくなる、と
いう傾向が改善され、さらにネットワークが大きくなる
ほど監視結果も多く集計できることから、障害発生位置
の確定の信頼度をより高くすることができる、という効
果を奏する。According to the next invention, in the measure determining step, a large number of monitoring results from each computer of the large-scale network are totaled. This improves the tendency that the more computers in the network, the more difficult it is to identify the fault location, and the larger the network, the more monitoring results can be aggregated. This has the effect of being able to be higher.
【0104】つぎの発明によれば、対策決定ステップに
て、より信頼性の高い障害発生位置が得られる。これに
より、対策を実行する最適な計算機を選択することがで
きる、という効果を奏する。According to the next invention, a more reliable failure occurrence position can be obtained in the measure determination step. As a result, there is an effect that an optimum computer for executing the countermeasure can be selected.
【0105】つぎの発明によれば、対策決定ステップに
て、対策管理テーブルの中から、通知される監視結果に
含まれる障害情報と適合する対策情報を選択する。これ
により、さらに効率よく最適な対策情報の決定を行うこ
とができる、という効果を奏する。また、この発明によ
れば、対策決定ステップを実行する計算機毎に対策管理
テーブルを持つことができるようになる。これにより、
各計算機が位置するネットワークに最適な対策情報を決
定することができる、という効果を奏する。According to the next invention, in the countermeasure determination step, countermeasure information matching the fault information included in the notified monitoring result is selected from the countermeasure management table. As a result, there is an effect that the optimum countermeasure information can be determined more efficiently. Further, according to the present invention, a countermeasure management table can be provided for each computer that executes the countermeasure determination step. This allows
This has the effect that optimal countermeasure information can be determined for the network in which each computer is located.
【0106】つぎの発明によれば、対策決定ステップに
て、一つの障害に対して複数の対策を優先度指定で送信
する。これにより、対策を実行する計算機では、より確
実な障害対策を行うことができる、という効果を奏す
る。また、この発明によれば、対策決定ステップを実行
する計算機毎に対策管理テーブルを所持することができ
るようになる。これにより、個々のネットワークに最適
な対策を決定できる、という効果を奏する。According to the next invention, in the countermeasure determination step, a plurality of countermeasures are transmitted for one fault by designating the priority. As a result, there is an effect that the computer that executes the countermeasure can take more reliable countermeasures. Further, according to the present invention, it is possible to have a countermeasure management table for each computer that executes the countermeasure determination step. As a result, there is an effect that an optimum measure can be determined for each network.
【0107】つぎの発明によれば、対策実行ステップを
実行する計算機が、実行したすべての対策の有効性を測
定し、その測定結果を各対策の有効性情報として対策決
定ステップを実行する計算機に送信し、さらに、この計
算機が、受け取った有効性情報を、対策管理テーブルに
反映する。これにより、障害が発生するほど、対策管理
テーブルが最適な状態となり、より効果のある対策をた
てることができ、さらに、この対策を優先順位に応じて
実行可能となるため、より高信頼な障害対策を行うこと
ができる、という効果を奏する。According to the next invention, the computer that executes the countermeasure execution step measures the effectiveness of all the executed countermeasures, and uses the measurement result as the information on the effectiveness of each countermeasure to the computer that executes the countermeasure determination step. The computer transmits the information and reflects the received validity information in the countermeasure management table. As a result, the more the failure occurs, the more optimally the countermeasure management table becomes, so that more effective countermeasures can be taken. Further, since the countermeasures can be executed in accordance with the priority order, a more reliable This has the effect of taking measures against obstacles.
【図1】 本発明にかかる分散データ配信管理システム
における実施の形態を示す構成図である。FIG. 1 is a configuration diagram showing an embodiment of a distributed data distribution management system according to the present invention.
【図2】 本発明にかかる分散データ配信管理システム
における実施の形態を示す他の構成図である。FIG. 2 is another configuration diagram showing an embodiment of the distributed data distribution management system according to the present invention.
【図3】 本発明にかかる分散データ配信管理システム
を構成する各計算機1の動作を示すフローチャートであ
る。FIG. 3 is a flowchart showing an operation of each computer 1 constituting the distributed data distribution management system according to the present invention.
【図4】 配信監視項目テーブルの内容の一例を示す図
である。FIG. 4 is a diagram showing an example of the contents of a distribution monitoring item table.
【図5】 本発明にかかる分散データ配信管理システム
を構成する各計算機1の動作を示すフローチャートであ
る。FIG. 5 is a flowchart showing an operation of each computer 1 constituting the distributed data distribution management system according to the present invention.
【図6】 配信監視項目テーブルの内容の一例を示す図
である。FIG. 6 is a diagram showing an example of the contents of a distribution monitoring item table.
【図7】 本発明にかかる分散データ配信管理システム
を構成する計算機2の動作を示すフローチャートであ
る。FIG. 7 is a flowchart showing the operation of the computer 2 configuring the distributed data distribution management system according to the present invention.
【図8】 本発明にかかる分散データ配信管理システム
を構成する計算機2の動作を示すフローチャートであ
る。FIG. 8 is a flowchart showing the operation of the computer 2 constituting the distributed data distribution management system according to the present invention.
【図9】 対策管理テーブルの内容の一例を示す図であ
る。FIG. 9 is a diagram showing an example of the contents of a countermeasure management table.
【図10】 本発明にかかる分散データ配信管理システ
ムを構成する計算機2と計算機3の動作を示すフローチ
ャートである。FIG. 10 is a flowchart showing the operation of the computers 2 and 3 constituting the distributed data distribution management system according to the present invention.
【図11】 対策管理テーブルの内容の一例を示す図で
ある。FIG. 11 is a diagram showing an example of the contents of a countermeasure management table.
【図12】 従来における分散データ配信管理システム
の構成を示す図である。FIG. 12 is a diagram showing a configuration of a conventional distributed data distribution management system.
【図13】 従来における分散データ配信管理システム
の構成を示す図である。FIG. 13 is a diagram showing a configuration of a conventional distributed data distribution management system.
【図14】 従来における分散データ配信管理システム
の構成を示す図である。FIG. 14 is a diagram showing a configuration of a conventional distributed data distribution management system.
【図15】 従来における分散データ配信管理システム
の構成を示す図である。FIG. 15 is a diagram showing a configuration of a conventional distributed data distribution management system.
【図16】 従来における分散データ配信管理システム
の構成を示す図である。FIG. 16 is a diagram illustrating a configuration of a conventional distributed data distribution management system.
1,2,3,1´,2´,3´ 計算機、4,6 衛星
電波、5 通信衛星、7 公衆回線。1,2,3,1 ', 2', 3 'computer, 4,6 satellite radio wave, 5 communication satellite, 7 public line.
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B042 GA12 GA39 GB09 JJ07 JJ15 JJ29 KK15 KK17 MC28 5B089 GA02 GA21 GB02 HA01 HA11 JA11 JA40 KA01 KA06 KA12 KB01 KB06 LB14 MC08 ME00 5K030 GA12 HC01 HD06 JA10 JL02 JT06 KA05 KA13 LA01 MA01 MB01 MD01 5K035 AA01 AA03 CC08 CC10 DD01 EE01 FF01 JJ02 LL11 LL17 MM04 ──────────────────────────────────────────────────続 き Continued on the front page F term (reference) MD01 5K035 AA01 AA03 CC08 CC10 DD01 EE01 FF01 JJ02 LL11 LL17 MM04
Claims (17)
ークシステムを用いてデータの配信を行う分散データ配
信管理システムにおいて、 データの配信状態を監視する配信監視手段を含む複数の
第1の計算機と、 前記データ配信において障害が発生した場合に、前記各
第1の計算機から送信される監視結果に基づいて、その
障害に対する最適な対策を決定する対策決定手段を含む
第2の計算機と、 前記第2の計算機から送信される対策情報に基づいて、
その情報に適合した対策を実行する対策実行手段を含む
第3の計算機と、 を備え、 前記第3の計算機にて実行される対策により、発生した
障害を修復することを特徴とする分散データ配信管理シ
ステム。1. A distributed data distribution management system for distributing data using a network system in which satellite lines and terrestrial lines coexist. In a distributed data distribution management system, a plurality of first computers including distribution monitoring means for monitoring a data distribution state; A second computer including a measure deciding means for deciding an optimal measure for the failure based on a monitoring result transmitted from each of the first computers when a failure occurs in the data distribution; Based on the countermeasure information sent from the computer of
A third computer including a countermeasure executing means for executing a countermeasure adapted to the information, wherein a fault that has occurred is repaired by the countermeasure executed by the third computer. Management system.
機、および前記第3の計算機のそれぞれが、 各計算機の機能として含む前記各手段の他に、前記配信
監視手段、前記対策決定手段、および前記対策実行手段
の、少なくともいずれか一つの手段をさらに含むことを
特徴とする請求項1に記載の分散データ配信管理システ
ム。2. Each of the first computer, the second computer, and the third computer includes, in addition to the units included as functions of the computers, the distribution monitoring unit and the countermeasure determining unit. 2. The distributed data distribution management system according to claim 1, further comprising at least one of the following means:
別するための該項目に対応する基準値と、を設定するた
めの第1のテーブルと、 前記監視結果がどの程度の水準にあるかを表す偏差値を
保存する第2のテーブルと、 を備え、 前記第1のテーブル上の配信監視項目に記載された処理
を実行し、 さらに、過去の統計から得られる標準偏差に基づいて前
記偏差値を計算し、その偏差値を前記第2のテーブルに
保存し、 その後、前記第1のテーブルに設定された基準値と、前
記第2のテーブルに保存された偏差値と、を比較し、 前記偏差値が、前記基準値より小さい場合に、その配信
監視項目に対応する監視結果を正常と判断し、一方、前
記偏差値が、前記基準値より大きい場合に、その配信監
視項目に対応する監視結果を異常と判断することを特徴
とする請求項1または2に記載の分散データ配信管理シ
ステム。3. The first computer includes: a first table for setting an item related to the monitoring and a reference value corresponding to the item for determining a failure related to data distribution; And a second table for storing a deviation value indicating the level of the result. The processing described in the delivery monitoring item on the first table is performed. The deviation value is calculated based on the obtained standard deviation, the deviation value is stored in the second table, and thereafter, the reference value set in the first table and stored in the second table. If the deviation value is smaller than the reference value, it is determined that the monitoring result corresponding to the distribution monitoring item is normal, and if the deviation value is larger than the reference value. In the delivery monitoring section Distributed data distribution management system according to claim 1 or 2, characterized in that it is determined that abnormality monitoring results corresponding to.
別するための該項目に対応するしきい値と、を設定する
ためのテーブルを備え、 前記テーブル上の配信監視項目に記載された処理を実行
し、 その後、前記テーブルに設定されたしきい値と、前記監
視結果と、を比較し、 前記監視結果が、前記しきい値より小さい場合に、その
配信監視項目に対応する監視結果を正常と判断し、一
方、前記監視結果が、前記しきい値より大きい場合に、
その配信監視項目に対応する監視結果を異常と判断する
ことを特徴とする請求項1または2に記載の分散データ
配信管理システム。4. Each of the first computers includes a table for setting an item relating to the monitoring and a threshold value corresponding to the item for determining a failure relating to data distribution. Executing the processing described in the delivery monitoring item, and then comparing the threshold value set in the table with the monitoring result, and when the monitoring result is smaller than the threshold value, It is determined that the monitoring result corresponding to the delivery monitoring item is normal, while the monitoring result is larger than the threshold,
3. The distributed data distribution management system according to claim 1, wherein a monitoring result corresponding to the distribution monitoring item is determined to be abnormal.
信し、かつその監視結果の少なくとも一つに異常通知が
含まれている場合、その監視結果に含まれるアドレス情
報に基づいて、異常が発生した第1の計算機の位置また
は通信路を推定することを特徴とする請求項3または4
に記載の分散データ配信管理システム。5. The second computer receives a monitoring result notified from all the first computers, and, if at least one of the monitoring results includes an abnormality notification, the monitoring result And estimating a position or a communication path of the first computer in which the abnormality has occurred, based on the address information included in the information.
2. The distributed data distribution management system according to 1.
る修復を行うための第3の計算機を決定し、その決定し
た第3の計算機に対して、障害を修復するための対策情
報を送信することを特徴とする請求項5に記載の分散デ
ータ配信管理システム。6. The second computer further determines a third computer for repairing a failure based on the estimated position or communication path, and determines a third computer for the determined third computer. 6. The distributed data distribution management system according to claim 5, wherein countermeasure information for repairing the failure is transmitted.
備え、 前記対策管理テーブルの中から、通知される監視結果に
含まれる障害情報と適合する対策情報を選択し、その
後、前記決定した第3の計算機に対して、その対策情報
を送信することを特徴とする請求項6に記載の分散デー
タ配信管理システム。7. The second computer further includes a countermeasure management table for storing fault information and countermeasure information, and matches the fault information included in the notified monitoring result from the countermeasure management table. 7. The distributed data distribution management system according to claim 6, wherein the countermeasure information is selected, and thereafter, the countermeasure information is transmitted to the determined third computer.
た少なくとも一つの対策情報を記憶する対策管理テーブ
ルを備え、 前記対策管理テーブルの中から、通知される監視結果に
含まれる障害情報と適合する少なくとも一つの対策情報
を選択し、その後、前記決定した第3の計算機に対し
て、その対策情報を送信し、 前記第3の計算機は、 前記第2の計算機から送信される対策情報に基づいて、
その情報に適合した対策を前記優先順位の順に実行する
ことを特徴とする請求項6に記載の分散データ配信管理
システム。8. The countermeasure management table which stores fault information and at least one countermeasure information including a priority indicating a repair execution priority, wherein the countermeasure management table includes: Selecting at least one piece of countermeasure information that is compatible with the fault information included in the notified monitoring result, and transmitting the countermeasure information to the determined third computer; Is based on the countermeasure information transmitted from the second computer,
7. The distributed data distribution management system according to claim 6, wherein measures suitable for the information are executed in the order of the priority.
結果を各対策の有効性情報として第2の計算機に送信
し、 前記第2の計算機は、さらに、 前記第3の計算機から送信される有効性情報を、前記対
策管理テーブルに反映することを特徴とする請求項8に
記載の分散データ配信管理システム。9. The third computer further measures the effectiveness of all of the executed measures, transmits the measurement result to a second computer as effectiveness information of each measure, and The distributed data distribution management system according to claim 8, wherein the computer further reflects the validity information transmitted from the third computer in the countermeasure management table.
ワークシステムを用いてデータの配信を行う分散データ
配信管理システムの配信監視方法において、 データの配信状態を監視する配信監視ステップと、 前記データ配信において障害が発生した場合に、前記配
信監視ステップにて送信する監視結果に基づいて、その
障害に対する最適な対策を決定する対策決定ステップ
と、 前記対策決定ステップにて送信する対策情報に基づい
て、その情報に適合した対策を実行する対策実行ステッ
プと、 を含み、 前記対策実行ステップにて実行される対策により、発生
した障害を修復することを特徴とする配信監視方法。10. A distribution monitoring method for a distributed data distribution management system that distributes data using a network system in which satellite lines and terrestrial lines coexist; a distribution monitoring step of monitoring a data distribution state; When a failure occurs, based on the monitoring result transmitted in the distribution monitoring step, a measure determining step for determining an optimal measure for the failure, and based on the measure information transmitted in the measure determining step, A delivery monitoring method, comprising: a countermeasure execution step of executing a countermeasure adapted to the information; and repairing a fault that has occurred by the countermeasure executed in the countermeasure execution step.
別するための該項目に対応する基準値と、を設定するた
めの第1のテーブルと、 前記監視結果がどの程度の水準にあるかを表す偏差値を
保存する第2のテーブルと、 を用いて、 前記第1のテーブル上の配信監視項目に記載された処理
を実行し、 さらに、過去の統計から得られる標準偏差に基づいて前
記偏差値を計算し、その偏差値を前記第2のテーブルに
保存し、 その後、前記第1のテーブルに設定された基準値と、前
記第2のテーブルに保存された偏差値と、を比較し、 前記偏差値が、前記基準値より小さい場合に、その配信
監視項目に対応する監視結果を正常と判断し、一方、前
記偏差値が、前記基準値より大きい場合に、その配信監
視項目に対応する監視結果を異常と判断することを特徴
とする請求項10に記載の配信監視方法。11. The distribution monitoring step includes: a first table for setting an item related to the monitoring and a reference value corresponding to the item for determining a failure related to data distribution; Using a second table that stores a deviation value indicating the level of the level, and executing a process described in a delivery monitoring item on the first table, using a second table. Calculating the deviation value based on the standard deviation obtained, storing the deviation value in the second table, and then storing the reference value set in the first table and the reference value set in the second table. And comparing the deviation value, if the deviation value is smaller than the reference value, it is determined that the monitoring result corresponding to the distribution monitoring item is normal, while if the deviation value is larger than the reference value, The arrangement Delivery monitoring method according to claim 10, characterized in that to determine the monitoring result corresponding to the monitoring items and abnormality.
別するための該項目に対応するしきい値と、を設定する
ためのテーブルを用いて、 前記テーブル上の配信監視項目に記載された処理を実行
し、 その後、前記テーブルに設定されたしきい値と、前記監
視結果と、を比較し、 前記監視結果が、前記しきい値より小さい場合に、その
配信監視項目に対応する監視結果を正常と判断し、一
方、前記監視結果が、前記しきい値より大きい場合に、
その配信監視項目に対応する監視結果を異常と判断する
ことを特徴とする請求項10に記載の配信監視方法。12. In the distribution monitoring step, a table for setting an item relating to the monitoring and a threshold value corresponding to the item for determining a failure relating to data distribution is used. The process described in the distribution monitoring item is executed. Thereafter, the threshold value set in the table is compared with the monitoring result. If the monitoring result is smaller than the threshold value, the distribution is performed. When the monitoring result corresponding to the monitoring item is determined to be normal, while the monitoring result is larger than the threshold value,
The distribution monitoring method according to claim 10, wherein a monitoring result corresponding to the distribution monitoring item is determined to be abnormal.
受信し、かつその監視結果の少なくとも一つに異常通知
が含まれている場合、その監視結果に含まれるアドレス
情報に基づいて、異常が発生した計算機の位置または通
信路を推定することを特徴とする請求項11または12
に記載の配信監視方法。13. The countermeasure deciding step, wherein, when a plurality of monitoring results notified in the distribution monitoring step are received, and at least one of the monitoring results includes an abnormality notification, the monitoring result includes 13. The computer according to claim 11, wherein a position or a communication path of the computer in which the abnormality has occurred is estimated based on the included address information.
Delivery monitoring method described in.
る修復を行うための計算機を決定し、その決定した計算
機に対して、障害を修復するための対策情報を送信する
ことを特徴とする請求項13に記載の配信監視方法。14. The countermeasure determining step further includes: determining a computer for performing a repair on the failure based on the estimated position or the communication path; and performing a repair on the determined computer for repairing the failure. 14. The distribution monitoring method according to claim 13, wherein countermeasure information is transmitted.
用いて、通知される監視結果に含まれる障害情報と適合
する対策情報を選択し、その後、前記決定した計算機に
対して、その対策情報を送信することを特徴とする請求
項14に記載の配信監視方法。15. The countermeasure determination step further includes selecting countermeasure information that matches the fault information included in the notified monitoring result by using a countermeasure management table that stores the fault information and the countermeasure information. 15. The distribution monitoring method according to claim 14, wherein the countermeasure information is transmitted to the determined computer.
た少なくとも一つの対策情報を記憶する対策管理テーブ
ルを用いて、通知される監視結果に含まれる障害情報と
適合する少なくとも一つの対策情報を選択し、その後、
前記決定した計算機に対して、その対策情報を送信し、 前記決定された計算機における前記対策実行ステップで
は、 前記対策決定ステップにて送信される対策情報に基づい
て、その情報に適合した対策を前記優先順位の順に実行
することを特徴とする請求項14に記載の配信監視方
法。16. The monitoring result notified using the countermeasure management table that stores fault information and at least one countermeasure information including a priority indicating a repair execution priority in the countermeasure determining step. Select at least one countermeasure information that matches the failure information contained in
The countermeasure information is transmitted to the determined computer, and in the countermeasure execution step in the determined computer, based on the countermeasure information transmitted in the countermeasure determination step, a countermeasure adapted to the information is provided. 15. The distribution monitoring method according to claim 14, wherein the distribution monitoring is performed in the order of priority.
結果を各対策の有効性情報として前記対策決定ステップ
を実行する計算機に対して送信し、 前記対策決定ステップでは、さらに、 前記対策実行ステップにて送信される有効性情報を、前
記対策管理テーブルに反映することを特徴とする請求項
16に記載の配信監視方法。17. The countermeasure execution step further measures the effectiveness of all the executed countermeasures, and transmits the measurement result as effectiveness information of each countermeasure to a computer that executes the countermeasure determination step. 17. The distribution monitoring method according to claim 16, wherein in the countermeasure determination step, the validity information transmitted in the countermeasure execution step is reflected in the countermeasure management table.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11099445A JP2000293451A (en) | 1999-04-06 | 1999-04-06 | Distributed data distribution control system and distribution monitoring method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11099445A JP2000293451A (en) | 1999-04-06 | 1999-04-06 | Distributed data distribution control system and distribution monitoring method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000293451A true JP2000293451A (en) | 2000-10-20 |
Family
ID=14247582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11099445A Abandoned JP2000293451A (en) | 1999-04-06 | 1999-04-06 | Distributed data distribution control system and distribution monitoring method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000293451A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100496958B1 (en) * | 2001-12-28 | 2005-06-27 | 삼성에스디에스 주식회사 | System hindrance integration management method |
JP2005276098A (en) * | 2004-03-26 | 2005-10-06 | Fujitsu Ltd | Error correction support program, and recording medium therefor, error correction support device, and error correction support method |
JP2009076103A (en) * | 2008-12-22 | 2009-04-09 | Nec Corp | Fault restoration device, fault restoration method, and program |
JP2010282348A (en) * | 2009-06-03 | 2010-12-16 | Nec System Technologies Ltd | Information collection device and information collection method |
JP2012216893A (en) * | 2011-03-31 | 2012-11-08 | Nec Corp | Information processing system, information processor, information processing method, and information processing program |
JP2018133688A (en) * | 2017-02-15 | 2018-08-23 | 日本電信電話株式会社 | Service restoration device and service restoration method |
-
1999
- 1999-04-06 JP JP11099445A patent/JP2000293451A/en not_active Abandoned
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100496958B1 (en) * | 2001-12-28 | 2005-06-27 | 삼성에스디에스 주식회사 | System hindrance integration management method |
JP2005276098A (en) * | 2004-03-26 | 2005-10-06 | Fujitsu Ltd | Error correction support program, and recording medium therefor, error correction support device, and error correction support method |
JP2009076103A (en) * | 2008-12-22 | 2009-04-09 | Nec Corp | Fault restoration device, fault restoration method, and program |
JP2010282348A (en) * | 2009-06-03 | 2010-12-16 | Nec System Technologies Ltd | Information collection device and information collection method |
JP2012216893A (en) * | 2011-03-31 | 2012-11-08 | Nec Corp | Information processing system, information processor, information processing method, and information processing program |
JP2018133688A (en) * | 2017-02-15 | 2018-08-23 | 日本電信電話株式会社 | Service restoration device and service restoration method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7725774B2 (en) | Methods, systems, and media to correlate errors associated with a cluster | |
US5872911A (en) | Method and system of service impact analysis in a communications network | |
US6691244B1 (en) | System and method for comprehensive availability management in a high-availability computer system | |
US5699403A (en) | Network vulnerability management apparatus and method | |
EP2081325B1 (en) | Supervisory control method and supervisory control device | |
WO1997024839A9 (en) | Fault impact analysis | |
CN100394394C (en) | Fault tolerant duplex computer system and its control method | |
CN109067597A (en) | A kind of distributed system dynamic and intelligent service administering method | |
CN102045192A (en) | Apparatus and system for estimating network configuration | |
JP2010526352A (en) | Performance fault management system and method using statistical analysis | |
CN101777951B (en) | Method and system for data monitoring | |
CN103914354A (en) | Method and system for database fault recovery | |
JP2000293451A (en) | Distributed data distribution control system and distribution monitoring method | |
US20030115397A1 (en) | Computer system with dedicated system management buses | |
EP1653662A2 (en) | Protection switch logging methods and systems | |
CN117453036A (en) | Method, system and device for adjusting power consumption of equipment in server | |
JP3339985B2 (en) | Building group remote management device | |
JP4879823B2 (en) | Supervisory control system | |
KR101015251B1 (en) | Management system of network system and method therefor | |
KR100224315B1 (en) | Method for detecting multiple error at service controlling system | |
KR20180081204A (en) | System and method for fault recovery of controller in separated SDN controller | |
KR100235570B1 (en) | The method of the cluster management for the cluster management master system of the parallel ticom | |
JP3753496B2 (en) | Fault detection apparatus and method in data communication switching system | |
KR0134704B1 (en) | Signal message exchanger | |
CN102811137A (en) | Monitoring device and method and computer system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040609 |
|
A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20050421 |