JP2010271905A - Operation management/maintenance support system of it equipment, and method for the same - Google Patents

Operation management/maintenance support system of it equipment, and method for the same Download PDF

Info

Publication number
JP2010271905A
JP2010271905A JP2009123006A JP2009123006A JP2010271905A JP 2010271905 A JP2010271905 A JP 2010271905A JP 2009123006 A JP2009123006 A JP 2009123006A JP 2009123006 A JP2009123006 A JP 2009123006A JP 2010271905 A JP2010271905 A JP 2010271905A
Authority
JP
Japan
Prior art keywords
information
computer
computer peripheral
operating
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009123006A
Other languages
Japanese (ja)
Inventor
Kenji Yamanouchi
賢二 山之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Fielding Ltd
Original Assignee
NEC Fielding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Fielding Ltd filed Critical NEC Fielding Ltd
Priority to JP2009123006A priority Critical patent/JP2010271905A/en
Publication of JP2010271905A publication Critical patent/JP2010271905A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an operation management/maintenance support system of IT equipment and a method for the operation management/maintenance support system of IT equipment, in which parameters specific to respective devices are taken into account. <P>SOLUTION: The operation management/maintenance support system includes: a monitored site 10 in which each device of a computer 101, computer peripheral device 102, and an additional facility 103 operates; a monitoring device 20 for monitoring operating situations of the monitored site 10, and collecting information about the operating situation; an analyzing device 30 for obtaining information about the operating situations from the monitoring device 20, and analyzing and accumulating the obtained information; and an operation device 40 for operating the monitored site 10, the monitoring device 20, and the analyzing device 30. The analyzing device 30 includes: a monitoring database 302 for accumulating information about the operating situations; a case database 303 for accumulating information which includes failure history information recording history of failures occurred in the past of the respective devices; a device database 304 for accumulating information including devices various source information writing down various source values at a design stage of the respective devices; and a computer for analyzing information obtained with reference to the case database 303 and the device database 304 to determine whether or not there is abnormality. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、コンピュータ機器及びプリンタIT機器の設置環境を含む稼働環境を分析し、起こり得る障害の部位や規模を予測するとともに、管理者に通報するIT機器の運用管理・保守支援システム及びその方法に関する。   The present invention analyzes an operating environment including an installation environment of a computer device and a printer IT device, predicts the location and scale of a possible failure, and notifies an administrator of an IT device operation management / maintenance support system and method About.

老朽化した装置が更新の計画もないまま稼働を続けていたり、UPS(無停電電源装置)及びCVCF(定電圧定周波数電源)のバッテリ並びにプリンタの用紙搬送ローラ等の定期的に交換すべき有寿命部品が交換されないまま放置されたりした結果、重大な障害を引き起こす原因となった事例は多数存在する。   Aged devices continue to operate without plans for renewal, UPS (uninterruptible power supply) and CVCF (constant voltage constant frequency power supply) batteries, printer paper transport rollers, etc. should be replaced periodically There are many cases in which, as a result of leaving a life-long part without being replaced, it causes a serious failure.

そのため、運用管理システムで、各ハードウェアを管理することを要するが、一般的な運用管理システムは、ジョブの制御等主にソフトウェアの状況を監視・管理することが主目的であって、ハードウェアは表面的な状態の監視にとどまっており、装置の老朽化や有寿命部品の劣化が原因となる障害を予測し得ない場合がある。   For this reason, it is necessary to manage each piece of hardware with an operation management system. The general purpose of an operation management system is mainly to monitor and manage the software status such as job control. However, there is a case where it is impossible to predict a failure caused by aging of a device or deterioration of a component having a limited life.

IT機器を含む電子機器は、設置場所の温度及び湿度等の環境条件によって障害が発生する確率が変化することが知られており、稼働品質の向上策として環境の改善は有効な手段であるが、その効果を前もって予測することが困難であった。   Electronic equipment including IT equipment is known to change the probability of failure depending on environmental conditions such as temperature and humidity at the installation location, and improving the environment is an effective measure for improving operational quality. It was difficult to predict the effect in advance.

又、稼働品質を測る指標としては障害率等が用いられているが、個々の稼働環境を併せて見る方法がなく、コンピュータ機器の設置されている地域(気候)や環境(設置場所の温度)、稼働期間(老朽化)によって稼働品質に差異があることは分かるが、相関をつかむことが困難であった。   In addition, failure rate is used as an index to measure operation quality, but there is no way to see the individual operation environment together, and the area (climate) and environment (temperature of the installation location) where computer equipment is installed. Although it can be seen that there is a difference in operation quality depending on the operation period (aging), it was difficult to grasp the correlation.

そこで、特許文献1には、各種施設や工場等に設置される設備機器を監視制御する端末装置、通信回線を介して管理監視する中央処理装置を有する遠隔保守管理システムが開示されている。   Therefore, Patent Document 1 discloses a remote maintenance management system having a terminal device that monitors and controls equipment installed in various facilities, factories, and the like, and a central processing unit that performs management and monitoring via a communication line.

特開2003−023681号公報JP 2003-023681 A

しかしながら、特許文献1に開示されている発明は、機器の稼働状況を示す累積的な情報を基に遠隔保守管理を行っているものの、個々の機器に固有の情報、例えば故障率等の情報とも考慮した総合的な判断がなされていないという問題点がある。   However, although the invention disclosed in Patent Document 1 performs remote maintenance management based on cumulative information indicating the operation status of the device, information unique to each device, for example, information such as a failure rate is also included. There is a problem that the comprehensive judgment in consideration is not made.

本発明は上記に鑑みてなされたものであり、機器の累積的な運転状況の情報のみならず、各機器に固有のパラメータをも考慮したIT機器の運用管理・保守支援システム及びその方法を提供することを目的とする。   The present invention has been made in view of the above, and provides an IT equipment operation management / maintenance support system and method that take into consideration not only the cumulative operating status information of the equipment but also parameters unique to each equipment. The purpose is to do.

上述の問題を解決するため、本発明に係る運用管理・保守支援システムは、コンピュータ、コンピュータ周辺機器及び付帯設備の稼働状況を通信回線を介して監視する運用管理・保守支援システムであって、監視の対象となる前記コンピュータ、前記コンピュータ周辺機器及び前記付帯設備が稼働する被監視サイトと、前記被監視サイトの稼働状況を監視し、該稼働状況に係る情報を収集する監視装置と、前記稼働状況に係る情報を前記監視装置から取得し、該取得した情報を解析及び蓄積する解析装置と、前記被監視サイト、前記監視装置及び前記解析装置の操作の用に供する操作装置と、を備え、前記通信回線は、前記被監視サイトと、監視装置と、解析装置と、操作装置とを結び、前記解析装置は、前記稼働状況に係る情報を蓄積する監視データベースと、前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備の過去に生じた障害の履歴を記載した障害履歴情報を含む情報を蓄積する事例データベースと、前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備の設計段階での諸元値を記載した装置諸元情報及び前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備が有する部品の環境条件である基準温度、想定される寿命、想定されている稼働状況及び想定されている故障率の一覧である部品仕様とを蓄積する装置データベースと、前記事例データベース及び前記装置データベースを参照して前記取得した情報を解析し、異常の有無を判断するコンピュータと、を含むことを特徴とする。   In order to solve the above-mentioned problems, an operation management / maintenance support system according to the present invention is an operation management / maintenance support system that monitors the operation status of computers, computer peripheral devices, and incidental facilities via a communication line. The monitored site on which the computer, the computer peripheral device, and the incidental equipment that are the targets of the operation, the monitoring device that monitors the operating status of the monitored site, and collects information related to the operating status, and the operating status An analysis device that acquires the information related to the monitoring device, analyzes and accumulates the acquired information, and an operation device that is used for operation of the monitored site, the monitoring device, and the analysis device, and The communication line connects the monitored site, the monitoring device, the analysis device, and the operation device, and the analysis device accumulates information relating to the operation status. Visual database, case database for storing information including failure history information describing the history of failures that occurred in the past in the computer, the computer peripheral device, and the auxiliary equipment, the computer, the computer peripheral device, and the auxiliary equipment Equipment specification information describing the specification values at the design stage and the reference temperature which is the environmental condition of the parts of the computer, the computer peripheral device and the auxiliary equipment, the assumed life, the assumed operation status and A device database that stores a component specification that is a list of assumed failure rates, and a computer that analyzes the acquired information with reference to the case database and the device database to determine whether there is an abnormality. It is characterized by that.

上述の問題を解決するため、本発明に係る運用管理・保守支援の方法は、コンピュータ、コンピュータ周辺機器及び付帯設備の稼働状況を通信回線を介して監視する運用管理・保守支援の方法であって、監視の対象となる前記コンピュータ、前記コンピュータ周辺機器及び前記付帯設備が稼働する被監視サイトの稼働状況を監視する手順と、該稼働状況に係る情報を収集する手順と、前記稼働状況に係る情報を解析及び蓄積する手順と、を備え、前記稼働状況に係る情報を解析及び蓄積する手順は、前記稼働状況に係る情報を蓄積する監視データベース手順と、前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備の過去に生じた障害の履歴を記載した障害履歴情報を含む情報を蓄積する事例データベース手順と、前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備の設計段階での諸元値を記載した装置諸元情報及び前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備が有する部品の環境条件である基準温度、想定される寿命、想定されている稼働状況及び想定されている故障率の一覧である部品仕様とを蓄積する装置データベース手順と、前記事例データベース手順及び前記装置データベース手順で蓄積したデータを参照して前記取得した情報を解析し、異常の有無を判断する手順と、を含むことを特徴とする。   In order to solve the above-described problems, the operation management / maintenance support method according to the present invention is an operation management / maintenance support method for monitoring the operation status of computers, computer peripheral devices, and incidental facilities via a communication line. , A procedure for monitoring the operation status of the monitored site where the computer, the computer peripheral device and the incidental equipment to be monitored are operated, a procedure for collecting information relating to the operation status, and the information regarding the operation status A procedure for analyzing and accumulating information relating to the operation status, a monitoring database procedure for accumulating information relating to the operation status, the computer, the computer peripheral device, and the incidental equipment A case database procedure for storing information including failure history information describing a history of failures that occurred in the past, and the computer , Device specification information describing specification values at the design stage of the computer peripheral device and the incidental equipment, and a reference temperature which is an environmental condition of parts of the computer, the computer peripheral device and the auxiliary equipment, is assumed The device database procedure for accumulating the lifespan, the assumed operating situation and the component specification that is a list of the assumed failure rates, and the data obtained by referring to the data accumulated in the case database procedure and the device database procedure. And a procedure for analyzing the information and determining the presence or absence of an abnormality.

本発明によれば、設計段階での各機器の諸元値等の各機器に固有のパラメータをも考慮したIT機器の運用管理・保守支援システム及びその方法を提供することが出来る。   According to the present invention, it is possible to provide an IT equipment operation management / maintenance support system and method that take into account parameters unique to each equipment such as specification values of each equipment at the design stage.

本発明の実施の形態に係る運用管理・保守支援システムの構成図である。1 is a configuration diagram of an operation management / maintenance support system according to an embodiment of the present invention. FIG. 本発明の実施の形態に係る運用管理・保守支援システムの動作に関するフローチャートである。It is a flowchart regarding operation | movement of the operation management and maintenance assistance system which concerns on embodiment of this invention. 本発明の実施の形態に係る状態データベースに登録される装置管理情報の一例を示す図である。It is a figure which shows an example of the apparatus management information registered into the state database which concerns on embodiment of this invention. 本発明の実施の形態に係る状態データベースに登録される稼働環境情報の一例である。It is an example of the operating environment information registered in the state database according to the embodiment of the present invention. 本発明の実施の形態に係る事例データベースに登録される障害履歴情報の一例である。It is an example of the failure history information registered in the case database according to the embodiment of the present invention. 本発明の実施の形態に係る事例データベースに登録される稼働実績の一例を示す図である。It is a figure which shows an example of the operation performance registered into the case database which concerns on embodiment of this invention. 本発明の実施の形態に係る事例データベースに登録される環境条件補正値の一例を示す図である。It is a figure which shows an example of the environmental condition correction value registered into the case database which concerns on embodiment of this invention. 本発明の実施の形態に係る事例データベースに登録される遠隔操作指示定義の一例を示す図である。It is a figure which shows an example of the remote operation instruction | indication definition registered into the case database which concerns on embodiment of this invention. 本発明の実施の形態に係る装置データベースに登録される装置性能諸元の一例を示す図である。It is a figure which shows an example of the apparatus performance specification registered into the apparatus database which concerns on embodiment of this invention. 本発明の実施の形態に係る装置データベースに登録される部品仕様の一例を示す図である。It is a figure which shows an example of the components specification registered into the apparatus database which concerns on embodiment of this invention. 本発明の実施の形態に係る操作装置が確認する解析装置が解析した結果の一例を示す図である。It is a figure which shows an example of the result analyzed by the analyzer which the operating device which concerns on embodiment of this invention confirms.

次に、本発明の実施の形態について図面を参照して詳細に説明する。ここで、図1は、本発明の実施の形態に係る運用管理・保守支援システムの構成図である。   Next, embodiments of the present invention will be described in detail with reference to the drawings. Here, FIG. 1 is a configuration diagram of an operation management / maintenance support system according to the embodiment of the present invention.

図1に示すように、本実施の形態は監視の対象となる装置が稼働する被監視サイト10と、被監視サイト10の稼働状況を監視し、その稼働状況に係る情報を収集し、収集した情報を解析装置30へ送付する監視装置20と、監視装置20から送付されてくる情報を収集、解析及び蓄積する解析装置30と、各装置の操作を行う操作装置40とが、それぞれ通信回線50で接続されている。   As shown in FIG. 1, the present embodiment monitors the monitored site 10 in which the device to be monitored operates and the operating status of the monitored site 10, collects information related to the operating status, and collects information A monitoring device 20 that sends information to the analysis device 30, an analysis device 30 that collects, analyzes and stores information sent from the monitoring device 20, and an operation device 40 that operates each device are respectively connected to a communication line 50. Connected with.

被監視サイト10は、図1に示すように、一箇所若しくは複数個所のコンピュータ室又はデータセンタや事務所等の場所であり、監視対象となるコンピュータ101と、プリンタ等のコンピュータ周辺装置102と、空調及び電源等の付帯設備102とが設置されている。   As shown in FIG. 1, the monitored site 10 is a place such as a computer room or a data center or an office in one place or a plurality of places, a computer 101 to be monitored, a computer peripheral device 102 such as a printer, Ancillary facilities 102 such as an air conditioner and a power source are installed.

監視対象となるコンピュータ101は、サーバ及びそのクライアントであるパソコンであり、その本体のみならず、液晶ディスプレイ等の出力装置並びに、マウス及びキーボード等の入力機器も含まれる。   The computer 101 to be monitored is a personal computer that is a server and its client, and includes not only its main body but also an output device such as a liquid crystal display and input devices such as a mouse and a keyboard.

監視装置20は、図1に示すように、被監視サイト10に設置されたコンピュータ101、コンピュータ周辺装置102及び付帯設備103とのインタフェースを持ち、情報を収集及び監視する装置で、前述のインタフェースを介して稼働状況に係る情報を収集し、かつ収集した稼働状況に係る情報の送受信を行うコンピュータ201と、コンピュータ101、コンピュータ周辺装置102及び付帯設備103が新設された日、撤去された日及びコンピュータ201が取得した稼働状況に係る情報の履歴を格納する状態データベース202を有する。   As shown in FIG. 1, the monitoring device 20 has an interface with the computer 101, the computer peripheral device 102 and the incidental equipment 103 installed in the monitored site 10, and is a device for collecting and monitoring information. The computer 201 that collects information related to the operating status and transmits / receives information related to the collected operating status, the date when the computer 101, the computer peripheral device 102 and the incidental equipment 103 are newly installed, the date when the computer is removed, and the computer 201 has a state database 202 that stores a history of information related to the operation status acquired by the system 201.

状態データベース202は、図3に示すように、稼働状況に係る情報として装置毎に稼働を開始してからの日数である経過日数、積算時間計による累積の稼働時間及び各装置に固有の管理情報、例えばプリンタでは総印字枚数、冷却ファンでは毎分の回転数といった機器及び設備の稼働状況及びメンテナンス等の管理に係る情報を記載した機器管理情報と、図4に示すように、監視装置20が取得した、被監視サイト10に設置されたコンピュータ101、コンピュータ周辺装置102及び付帯設備103が稼働している環境の情報である、温度、湿度、稼働時間、内部温度、入力電圧、出力電圧、ファン回転数及びHDD稼働時間の情報を時系列で保持する稼働環境情報とを有する。   As shown in FIG. 3, the state database 202 includes the number of days that have elapsed since the start of operation for each device as information related to the operation status, the accumulated operation time by the integrated hour meter, and management information unique to each device. For example, device management information describing information related to management such as operation status and maintenance of devices and equipment such as the total number of printed sheets for a printer and the number of revolutions per minute for a cooling fan, and a monitoring device 20 as shown in FIG. The acquired information of the environment in which the computer 101, the computer peripheral device 102 and the incidental equipment 103 installed in the monitored site 10 are operating, temperature, humidity, operating time, internal temperature, input voltage, output voltage, fan And operating environment information for holding information on the rotational speed and HDD operating time in time series.

なお、これらの情報は、解析装置30にも送信される。   These pieces of information are also transmitted to the analysis device 30.

解析装置30は、図1に示すように、監視装置20から送信された被監視サイト10の状態を分析した後、その結果を監視装置20へ返信するコンピュータ301を有する。   As shown in FIG. 1, the analysis device 30 includes a computer 301 that analyzes the state of the monitored site 10 transmitted from the monitoring device 20 and returns the result to the monitoring device 20.

解決すべき問題があれば解析装置30は、操作装置40へ異常を通報するとともに被監視サイト10に設置されたコンピュータ101、コンピュータ周辺装置102及び付帯設備103に対して操作を行う。   If there is a problem to be solved, the analysis device 30 notifies the operation device 40 of the abnormality and operates the computer 101, the computer peripheral device 102, and the incidental equipment 103 installed in the monitored site 10.

監視データベース302は、複数の被監視サイトを同時に監視する場合を想定したもので、複数の被監視サイトに設置された監視装置20が持つ状態データベース202と同様の情報を保持する。   The monitoring database 302 is assumed to monitor a plurality of monitored sites at the same time, and holds the same information as the state database 202 of the monitoring device 20 installed at the plurality of monitored sites.

事例データベース303は、図5に示す被監視サイト10に設置されたコンピュータ101、コンピュータ周辺装置102及び付帯設備103の過去に生じた障害の履歴を記載した障害履歴情報と、図6に示す被監視サイト10に設置された全ての装置の台数、稼働時間、故障回数、平均故障間隔及び故障率等の稼働実績と、図7に示すように稼働環境である温度と稼働実績である経年とから求められた故障率の補正値を記録した環境条件補正値と、図8に示すように異常時に遠隔指示する操作の内容である遠隔操作指示定義と、を有する。   The case database 303 includes failure history information that describes the history of failures that occurred in the past in the computer 101, the computer peripheral device 102, and the incidental equipment 103 installed in the monitored site 10 shown in FIG. Obtained from the operation results such as the number, operation time, number of failures, average failure interval, failure rate, etc. of all the devices installed at the site 10, and the operating environment temperature and operation results as shown in FIG. The environmental condition correction value in which the corrected value of the failure rate is recorded, and the remote operation instruction definition that is the content of the remote instruction at the time of abnormality as shown in FIG.

装置データベース304は、図9に示す、コンピュータ101、コンピュータ周辺装置102及び付帯設備103を設計する段階で決定されている諸元値を記載した装置諸元情報と、図10に示す、装置が有する部品毎の環境条件である基準温度、想定される寿命、想定されている稼働状況及び想定されている故障率の一覧である部品仕様とを有する。   The device database 304 includes device specification information describing specification values determined at the stage of designing the computer 101, the computer peripheral device 102, and the incidental equipment 103 shown in FIG. 9, and the device shown in FIG. It has a reference temperature, which is an environmental condition for each part, an assumed life, an assumed operating condition, and a part specification which is a list of assumed failure rates.

ここで、図9の装置諸元情報は、具体的には、コンピュータ101、コンピュータ周辺装置102及び付帯設備103についての上限及び下限の温度情報、上限及び下限の湿度情報、寿命並びに想定される故障率である。   Here, the device specification information of FIG. 9 is specifically the upper and lower temperature information, the upper and lower humidity information, the lifespan and the assumed failure of the computer 101, the computer peripheral device 102 and the incidental equipment 103. Rate.

また、図10の部品仕様で記載対象となる部品は、バッテリ、ハードディスク、冷却ファン、液晶バックライト及び用紙送りローラ等である。   Also, the parts to be described in the part specification of FIG. 10 are a battery, a hard disk, a cooling fan, a liquid crystal backlight, a paper feed roller, and the like.

操作装置40は、図1に示すように、被監視サイト10、監視装置20及び解析装置30を運用するため、コンピュータ401を用いて被監視サイト10、監視装置20及び解析装置30の状態の確認や操作を行う。   As shown in FIG. 1, the operating device 40 operates the monitored site 10, the monitoring device 20, and the analysis device 30, and therefore checks the status of the monitored site 10, the monitoring device 20, and the analysis device 30 using a computer 401. And perform operations.

コンピュータ401では、図11に示す通り、被監視サイト10に設置されたコンピュータ101、コンピュータ周辺装置102及び付帯設備103の情報を解析装置30で解析した結果を確認することができる。   As shown in FIG. 11, the computer 401 can confirm the result of analyzing the information of the computer 101, the computer peripheral device 102, and the incidental equipment 103 installed in the monitored site 10 by the analysis device 30.

[実施の形態の動作]
次に、図1及び図2のフローチャートを参照して本発明の実施の形態の動作について詳細に説明する。
[Operation of the embodiment]
Next, the operation of the embodiment of the present invention will be described in detail with reference to the flowcharts of FIGS.

まず、平常時は監視装置20があらかじめ設定された時間間隔で被監視サイト10に設置されたコンピュータ101、コンピュータ周辺装置102及び付帯設備103に対して情報の送出を要求(ステップS1)し、要求を受信(ステップS2)したコンピュータ101、コンピュータ周辺装置102及び付帯設備103は、自身の持つセンサや積算時間計の値を送出(ステップS3)する。   First, during normal times, the monitoring device 20 requests the computer 101, the computer peripheral device 102, and the incidental equipment 103 installed at the monitored site 10 at predetermined time intervals to send information (step S1). (Step S2), the computer 101, the computer peripheral device 102, and the incidental equipment 103 send out the values of their own sensors and integrated time meters (step S3).

又、各々のコンピュータ101、コンピュータ周辺装置102及び付帯設備103が異常を検出した場合には、コンピュータ101、コンピュータ周辺装置102及び付帯設備103は監視装置20に対してアラーム情報を送出して異常を通知する(ステップS4)。なお、情報を取得・送信する方法は既存の一般的な技術を用いることとする。   In addition, when each computer 101, computer peripheral device 102, and incidental equipment 103 detect an abnormality, the computer 101, computer peripheral device 102, and incidental equipment 103 send alarm information to the monitoring device 20 to detect the abnormality. Notification is made (step S4). Note that an existing general technique is used as a method for acquiring and transmitting information.

次に、監視装置20は取得した情報を状態データベース202へ蓄積するとともに、解析装置30に対して解析要求を送信する(ステップS5)。   Next, the monitoring device 20 accumulates the acquired information in the state database 202 and transmits an analysis request to the analysis device 30 (step S5).

解析要求を受けた解析装置30(ステップS6)は、監視データベース302に受信した情報を蓄積(ステップS7)するとともに、事例データベース303と装置データベース304とを参照しながら受信した情報を解析(ステップS8)し、事例データベース303の持つ実績値を更新(ステップS9)した後、異常の有無を判断(ステップS10)する。   Upon receiving the analysis request, the analysis device 30 (step S6) accumulates the received information in the monitoring database 302 (step S7) and analyzes the received information with reference to the case database 303 and the device database 304 (step S8). Then, after updating the actual value of the case database 303 (step S9), it is determined whether or not there is an abnormality (step S10).

異常が認められない場合には監視装置20へ結果を返却し、監視装置20が状態データベースを更新(ステップS11)した後に通常の監視体制へ遷移(ステップS12)して一連の動作は終了する。   If no abnormality is recognized, the result is returned to the monitoring device 20, and after the monitoring device 20 updates the state database (step S11), the normal monitoring system is transitioned (step S12), and the series of operations ends.

異常が発生していると判断した場合は、操作装置40へ異常を通報(ステップS13)するとともに、事例データベース303が持つ遠隔操作指示定義に従い、監視装置20に対して遠隔指示する操作の内容を送出(ステップS14)する。
遠隔操作指示を受けた監視装置20(ステップS15)は、自らの持つインタフェースを通じて被監視サイト10の機器・設備に対して操作を行い(ステップS16)、その後に通常の監視体制へ遷移(ステップS17)して一連の動作を終了する。
If it is determined that an abnormality has occurred, the controller 40 is notified of the abnormality (step S13), and the contents of the operation to remotely instruct the monitoring device 20 according to the remote operation instruction definition of the case database 303 are indicated. Sending out (step S14).
Upon receiving the remote operation instruction, the monitoring device 20 (step S15) operates the equipment / equipment of the monitored site 10 through its own interface (step S16), and then transitions to a normal monitoring system (step S17). ) To complete a series of operations.

なお、本発明は、装置であるシステムの発明のみならず、方法の発明としても実施できる。   The present invention can be implemented not only as a system invention as a device but also as a method invention.

本発明は、コンピュータの運用管理に適用でき、コンピュータの設計、製造、保守を行う事業者におけるコンピュータの品質管理にも応用することができる。   The present invention can be applied to the operation management of computers, and can also be applied to the quality management of computers in businesses that design, manufacture, and maintain computers.

10 被監視サイト
20 監視装置
30 解析装置
40 操作装置
50 通信回線
101 コンピュータ
102 コンピュータ周辺機器
103 付帯設備
201 コンピュータ
202 状態データベース
301 コンピュータ
302 監視データベース
303 事例データベ−ス
304 装置データベース
401 コンピュータ
DESCRIPTION OF SYMBOLS 10 Monitoring site 20 Monitoring apparatus 30 Analysis apparatus 40 Operation apparatus 50 Communication line 101 Computer 102 Computer peripheral equipment 103 Attached equipment 201 Computer 202 Status database 301 Computer 302 Monitoring database 303 Case database 304 Apparatus database 401 Computer

Claims (10)

コンピュータ、コンピュータ周辺機器及び付帯設備の稼働状況を通信回線を介して監視する運用管理・保守支援システムであって、
監視の対象となる前記コンピュータ、前記コンピュータ周辺機器及び前記付帯設備が稼働する被監視サイトと、
前記被監視サイトの稼働状況を監視し、該稼働状況に係る情報を収集する監視装置と、
前記稼働状況に係る情報を前記監視装置から取得し、該取得した情報を解析及び蓄積する解析装置と、
前記被監視サイト、前記監視装置及び前記解析装置の操作の用に供する操作装置と、
を備え、
前記通信回線は、前記被監視サイトと、監視装置と、解析装置と、操作装置とを結び、
前記解析装置は、
前記稼働状況に係る情報を蓄積する監視データベースと、
前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備の過去に生じた障害の履歴を記載した障害履歴情報を含む情報を蓄積する事例データベースと、
前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備の設計段階での諸元値を記載した装置諸元情報及び前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備が有する部品の環境条件である基準温度、想定される寿命、想定されている稼働状況及び想定されている故障率の一覧である部品仕様とを蓄積する装置データベースと、
前記事例データベース及び前記装置データベースを参照して前記取得した情報を解析し、異常の有無を判断するコンピュータと、
を含むことを特徴とする運用管理・保守支援システム。
An operation management / maintenance support system for monitoring the operation status of computers, computer peripheral devices and incidental facilities via a communication line,
The monitored site where the computer to be monitored, the computer peripheral device and the incidental equipment operate;
A monitoring device that monitors the operating status of the monitored site and collects information related to the operating status;
An analysis device that acquires information on the operating status from the monitoring device, analyzes and accumulates the acquired information,
An operating device provided for operation of the monitored site, the monitoring device and the analysis device;
With
The communication line connects the monitored site, a monitoring device, an analysis device, and an operation device,
The analysis device includes:
A monitoring database for accumulating information on the operating status;
A case database for storing information including failure history information describing a history of failures that occurred in the past of the computer, the computer peripheral device, and the incidental equipment;
Device specification information describing specification values at the design stage of the computer, the computer peripheral device, and the incidental equipment, and a reference temperature that is an environmental condition of parts of the computer, the computer peripheral device, and the auxiliary equipment, and an assumption A device database that stores a component specification that is a list of expected lifetimes, expected operating conditions and expected failure rates;
Analyzing the acquired information with reference to the case database and the device database, and determining whether there is an abnormality,
Operation management and maintenance support system characterized by including
前記事例データベースは、前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備の台数、稼働時間、故障回数、平均故障間隔及び故障率を含む稼働実績と、稼働環境である温度と稼働実績である経年とから求められた故障率の補正値を記録した環境条件補正値と、異常時に遠隔指示する操作の内容である遠隔操作指示定義と、を更に蓄積し、
前記解析装置のコンピュータは、異常ありと判断した場合に、その旨を前記操作装置に通報し、かつ前記遠隔操作指示定義に従い、前記監視装置に対して前記遠隔指示する操作の内容を送出し、
前記監視装置は、前記遠隔指示する操作の内容に従って前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備を操作することを特徴とする請求項1に記載の運用管理・保守支援システム。
The case database is based on the operation results including the number of computers, the computer peripheral devices, and the incidental equipment, the operation time, the number of failures, the average failure interval, and the failure rate, and the temperature and the operation results that are the operation environment. The environmental condition correction value in which the correction value of the calculated failure rate is recorded, and the remote operation instruction definition that is the content of the operation that is remotely instructed in the event of an abnormality are further accumulated,
When the computer of the analysis device determines that there is an abnormality, it notifies the operation device to that effect, and according to the remote operation instruction definition, sends out the content of the operation to perform the remote instruction to the monitoring device,
The operation management / maintenance support system according to claim 1, wherein the monitoring device operates the computer, the computer peripheral device, and the incidental equipment according to the content of the remote instruction operation.
前記稼働状況に係る情報は、前記コンピュータ、前記コンピュータ周辺機器及び前記付帯設備である各装置についての、稼働を開始してからの日数である経過日数、累積の稼働時間及び各装置に固有の管理情報であり、
前記監視装置は、前記稼働状況に係る情報の履歴を格納する状態データベースを有することを特徴とする請求項1又は2に記載の運用管理・保守支援システム。
The information related to the operating status is the number of days that have elapsed since the start of operation, the cumulative operating time, and the management specific to each device, for each device that is the computer, the computer peripheral device, and the incidental equipment. Information,
The operation management / maintenance support system according to claim 1, wherein the monitoring device has a state database that stores a history of information related to the operation status.
前記各装置に固有の管理情報は、前記コンピュータ周辺機器に含まれるプリンタでは総印字枚数であり冷却ファンでは毎分の回転数である機器管理情報と、前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備が稼働している環境の情報である、温度、湿度、稼働時間、内部温度、入力電圧、出力電圧、ファン回転数及びHDD稼働時間の情報を時系列で保持する稼働環境情報とであることを特徴とする請求項3に記載の運用管理・保守支援システム。   The management information unique to each device is device management information that is the total number of prints in the printer included in the computer peripheral device and the number of revolutions per minute in the cooling fan, the computer, the computer peripheral device, and the incidental equipment. Is the operating environment information that holds information on the temperature, humidity, operating time, internal temperature, input voltage, output voltage, fan speed, and HDD operating time in time series, which is information on the environment in which 4. The operation management / maintenance support system according to claim 3, wherein 前記付帯設備は、空調及び電源であることを特徴とする請求項1乃至4のいずれか1項に記載の運用管理・保守支援システム。   The operation management / maintenance support system according to any one of claims 1 to 4, wherein the incidental facilities are air conditioning and a power source. コンピュータ、コンピュータ周辺機器及び付帯設備の稼働状況を通信回線を介して監視する運用管理・保守支援の方法であって、
監視の対象となる前記コンピュータ、前記コンピュータ周辺機器及び前記付帯設備が稼働する被監視サイトの稼働状況を監視する手順と、
該稼働状況に係る情報を収集する手順と、
前記稼働状況に係る情報を解析及び蓄積する手順と、
を備え、
前記稼働状況に係る情報を解析及び蓄積する手順は、
前記稼働状況に係る情報を蓄積する監視データベース手順と、
前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備の過去に生じた障害の履歴を記載した障害履歴情報を含む情報を蓄積する事例データベース手順と、
前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備の設計段階での諸元値を記載した装置諸元情報及び前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備が有する部品の環境条件である基準温度、想定される寿命、想定されている稼働状況及び想定されている故障率の一覧である部品仕様とを蓄積する装置データベース手順と、
前記事例データベース手順及び前記装置データベース手順で蓄積したデータを参照して前記取得した情報を解析し、異常の有無を判断する手順と、
を含むことを特徴とする運用管理・保守支援の方法。
An operation management / maintenance support method for monitoring the operation status of computers, computer peripheral devices and incidental equipment via a communication line,
A procedure for monitoring the operating status of the monitored site where the computer, the computer peripheral device and the incidental equipment to be monitored are operated;
A procedure for collecting information relating to the operation status;
A procedure for analyzing and accumulating information relating to the operating status;
With
The procedure for analyzing and accumulating information related to the operating status is as follows:
A monitoring database procedure for accumulating information relating to the operating status;
A case database procedure for storing information including failure history information describing a history of failures occurring in the past of the computer, the computer peripheral device and the incidental equipment;
Device specification information describing specification values at the design stage of the computer, the computer peripheral device, and the incidental equipment, and a reference temperature that is an environmental condition of parts of the computer, the computer peripheral device, and the auxiliary equipment, and an assumption Equipment database procedure for storing the lifespan, expected operating conditions and component specifications that are a list of expected failure rates;
Analyzing the acquired information with reference to the data accumulated in the case database procedure and the device database procedure, and determining the presence or absence of an abnormality,
An operation management / maintenance support method characterized by including:
前記事例データベース手順は、前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備の台数、稼働時間、故障回数、平均故障間隔及び故障率を含む稼働実績と、稼働環境である温度と稼働実績である経年とから求められた故障率の補正値を記録した環境条件補正値と、異常時に遠隔指示する操作の内容である遠隔操作指示定義と、を更に蓄積し、
前記取得した情報を解析し、異常の有無を判断する手順で、異常ありと判断される場合は、前記遠隔操作指示定義に従い、前記遠隔指示する操作の内容を送出する手順と、
前記遠隔指示する操作の内容に従って前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備を操作する手順を更に備えることを特徴とする請求項6に記載の運用管理・保守支援の方法。
The case database procedure includes the number of the computer, the computer peripheral device and the incidental equipment, the operation time, the number of failures, the operation result including the average failure interval and the failure rate, and the temperature and the operation result as the operation environment. The environmental condition correction value in which the correction value of the failure rate obtained from the above is recorded, and the remote operation instruction definition that is the content of the remote instruction in the event of an abnormality are further accumulated,
In the procedure of analyzing the acquired information and determining the presence or absence of an abnormality, if it is determined that there is an abnormality, according to the remote operation instruction definition, a procedure for sending out the content of the operation to be remotely instructed;
The operation management / maintenance support method according to claim 6, further comprising a procedure of operating the computer, the computer peripheral device, and the incidental equipment according to the content of the remote instruction operation.
前記稼働状況に係る情報は、前記コンピュータ、前記コンピュータ周辺機器及び前記付帯設備である各装置についての、稼働を開始してからの日数である経過日数、累積の稼働時間及び各装置に固有の管理情報であり、
前記稼働状況に係る情報を収集する手順は、前記稼働状況に係る情報の履歴を格納することを特徴とする請求項6又は7に記載の運用管理・保守支援の方法。
The information related to the operating status is the number of days that have elapsed since the start of operation, the cumulative operating time, and the management specific to each device, for each device that is the computer, the computer peripheral device, and the incidental equipment. Information,
8. The operation management / maintenance support method according to claim 6 or 7, wherein the procedure of collecting information related to the operating status stores a history of information related to the operating status.
前記各装置に固有の管理情報は、前記コンピュータ周辺機器に含まれるプリンタでは総印字枚数であり冷却ファンでは毎分の回転数である機器管理情報と、前記コンピュータ、前記コンピュータ周辺装置及び前記付帯設備が稼働している環境の情報である、温度、湿度、稼働時間、内部温度、入力電圧、出力電圧、ファン回転数及びHDD稼働時間の情報を時系列で保持する稼働環境情報とであることを特徴とする請求項8に記載の運用管理・保守支援の方法。   The management information unique to each device is device management information that is the total number of prints in the printer included in the computer peripheral device and the number of revolutions per minute in the cooling fan, the computer, the computer peripheral device, and the incidental equipment. Is the operating environment information that holds information on the temperature, humidity, operating time, internal temperature, input voltage, output voltage, fan speed, and HDD operating time in time series, which is information on the environment in which 9. The operation management / maintenance support method according to claim 8, wherein 前記付帯設備は、空調及び電源であることを特徴とする請求項6乃至9のいずれか1項に記載の運用管理・保守支援の方法。   The operation management / maintenance support method according to any one of claims 6 to 9, wherein the incidental facilities are air conditioning and a power source.
JP2009123006A 2009-05-21 2009-05-21 Operation management/maintenance support system of it equipment, and method for the same Pending JP2010271905A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009123006A JP2010271905A (en) 2009-05-21 2009-05-21 Operation management/maintenance support system of it equipment, and method for the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009123006A JP2010271905A (en) 2009-05-21 2009-05-21 Operation management/maintenance support system of it equipment, and method for the same

Publications (1)

Publication Number Publication Date
JP2010271905A true JP2010271905A (en) 2010-12-02

Family

ID=43419882

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009123006A Pending JP2010271905A (en) 2009-05-21 2009-05-21 Operation management/maintenance support system of it equipment, and method for the same

Country Status (1)

Country Link
JP (1) JP2010271905A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014228895A (en) * 2013-05-17 2014-12-08 富士通株式会社 Replacement time calculation program, information processing apparatus, and replacement time calculation method

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0370069A (en) * 1989-08-09 1991-03-26 Oki Electric Ind Co Ltd Reliability and property value calculating device
JP2002132995A (en) * 2000-10-30 2002-05-10 Denso Corp Management system for communication facilities
JP2002182728A (en) * 2000-12-13 2002-06-26 Oki Electric Ind Co Ltd Production managing system for maintenance parts
JP2003178157A (en) * 2002-10-07 2003-06-27 Canon Inc Information processing device and method and program storage medium
JP2004274844A (en) * 2003-03-06 2004-09-30 Tokyo Electric Power Co Inc:The Support method and system for planning maintenance program
JP2005011327A (en) * 2003-05-29 2005-01-13 Tokyo Electric Power Co Inc:The Repair plan making support device and method
JP2006202171A (en) * 2005-01-24 2006-08-03 Chugoku Electric Power Co Inc:The Maintenance cost distribution system and maintenance cost distribution method
JP2007323148A (en) * 2006-05-30 2007-12-13 Hitachi Ltd Management support device, program and management support method
JP2009048316A (en) * 2007-08-16 2009-03-05 Nec Fielding Ltd Parts management system

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0370069A (en) * 1989-08-09 1991-03-26 Oki Electric Ind Co Ltd Reliability and property value calculating device
JP2002132995A (en) * 2000-10-30 2002-05-10 Denso Corp Management system for communication facilities
JP2002182728A (en) * 2000-12-13 2002-06-26 Oki Electric Ind Co Ltd Production managing system for maintenance parts
JP2003178157A (en) * 2002-10-07 2003-06-27 Canon Inc Information processing device and method and program storage medium
JP2004274844A (en) * 2003-03-06 2004-09-30 Tokyo Electric Power Co Inc:The Support method and system for planning maintenance program
JP2005011327A (en) * 2003-05-29 2005-01-13 Tokyo Electric Power Co Inc:The Repair plan making support device and method
JP2006202171A (en) * 2005-01-24 2006-08-03 Chugoku Electric Power Co Inc:The Maintenance cost distribution system and maintenance cost distribution method
JP2007323148A (en) * 2006-05-30 2007-12-13 Hitachi Ltd Management support device, program and management support method
JP2009048316A (en) * 2007-08-16 2009-03-05 Nec Fielding Ltd Parts management system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014228895A (en) * 2013-05-17 2014-12-08 富士通株式会社 Replacement time calculation program, information processing apparatus, and replacement time calculation method

Similar Documents

Publication Publication Date Title
JP6301902B2 (en) Maintenance time prediction system and maintenance time prediction device
JP6450961B2 (en) Information communication system, information processing apparatus, and information providing method
JP2015148788A (en) Fault prediction system, fault prediction apparatus, and program
JP2007172131A (en) Failure prediction system, failure prediction method and failure prediction program
JP2011154526A (en) Preventive maintenance system for transaction processors, and preventive maintenance server
US9619189B2 (en) Information processing apparatus, information communication system, and service providing method
US20170356665A1 (en) Method and apparatus for providing equipment maintenance via a network
JP2008014521A (en) Control device
JP2013109483A (en) Failure prediction system, failure prediction device, and program
JP2013125509A (en) Equipment maintenance support system
JP4648961B2 (en) Apparatus maintenance system, method, and information processing apparatus
JP2006245993A (en) Network diagnostic equipment
JP2013033149A (en) Image quality abnormality predicting system and program
JP2008059413A (en) Failure management support system and its information management method
JP2010271905A (en) Operation management/maintenance support system of it equipment, and method for the same
JP2014002660A (en) Maintenance component production management device and maintenance component production management method
US20210245495A1 (en) Inkjet Recording Device Management System and Inkjet Recording Device
JP2007165040A (en) Maintenance control method of secondary battery
JP5896272B2 (en) Plant monitoring control device and plant monitoring control method
JP2008134691A (en) Maintenance management system
JP2009216557A (en) Gas detector, and periodical maintenance inspection time management system of gas detector
JP2011150586A (en) Management system for failure history
JP2009205221A (en) Maintenance management system and maintenance management method
JP2010198410A (en) Server failure prediction system
JP2010044780A (en) Method and system for analyzing operating condition

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120402

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120730

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130920