JP2012221045A - Information processing device and information processing program - Google Patents

Information processing device and information processing program Download PDF

Info

Publication number
JP2012221045A
JP2012221045A JP2011083741A JP2011083741A JP2012221045A JP 2012221045 A JP2012221045 A JP 2012221045A JP 2011083741 A JP2011083741 A JP 2011083741A JP 2011083741 A JP2011083741 A JP 2011083741A JP 2012221045 A JP2012221045 A JP 2012221045A
Authority
JP
Japan
Prior art keywords
node
information processing
failure
possibility
failure possibility
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011083741A
Other languages
Japanese (ja)
Inventor
Yujiro Imada
裕二郎 今田
Nobuo Sakiyama
伸夫 崎山
Hideki Yoshida
英樹 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011083741A priority Critical patent/JP2012221045A/en
Publication of JP2012221045A publication Critical patent/JP2012221045A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To allocate processing objects in consideration of failure possibility.SOLUTION: An information processing device relating to an embodiment is used in an information processing system including: a plurality of nodes for executing processing of processing objects; and an information processing device for determining a node on which processing is executed. The information processing device includes: failure possibility calculation means which calculates failure possibilities for each of the plurality of nodes and outputs failure possibility data in which an identifier of the node and the calculated failure possibility are associated with each other; and node allocating means which, when a new processing object is inputted, reads out the failure possibility data and allocates the new processing object to a node with less failure possibility.

Description

本発明の実施形態は、情報処理装置および情報処理プログラムに関する。   Embodiments described herein relate generally to an information processing apparatus and an information processing program.

一般的に、複数の情報処理装置を備える情報処理システムが知られている。この複数の情報処理装置は、LANなどの通信ネットワークを介して相互に通信可能に接続される。情報処理システム全体として多数の処理対象を処理するため、複数の情報処理装置のいずれかに処理を割り当てて、分散化する方法がある。この分散化において、処理対象の重要度や、各情報処理装置の処理負荷などが考慮される。   In general, an information processing system including a plurality of information processing apparatuses is known. The plurality of information processing apparatuses are connected to be communicable with each other via a communication network such as a LAN. In order to process a large number of processing targets as the entire information processing system, there is a method of assigning processing to any of a plurality of information processing apparatuses and distributing the processing. In this distribution, the importance of the processing target, the processing load of each information processing apparatus, and the like are taken into consideration.

ここで、情報処理システムにおいて、故障した情報処理装置には、処理が割り当てられず、稼働している情報処理装置のみに、処理が割り当てられる。   Here, in the information processing system, a process is not assigned to a failed information processing apparatus, and a process is assigned only to an operating information processing apparatus.

特開2008−4046号公報JP 2008-4046 A

しかしながら、一般的な分散化においては、処理対象の重要度や、情報処理装置の処理負荷などが考慮されていたものの、情報処理装置のハードウェアそのものの故障可能性については言及されていない。   However, in general decentralization, the importance of the processing target and the processing load of the information processing apparatus are taken into consideration, but the possibility of failure of the hardware of the information processing apparatus itself is not mentioned.

従って本発明の目的は、故障可能性を考慮して処理対象を割り当てる情報処理装置および情報処理プログラムを提供することである。   Accordingly, an object of the present invention is to provide an information processing apparatus and an information processing program that allocate processing targets in consideration of the possibility of failure.

上記課題を解決するために、実施形態に係る情報処理装置は、処理対象の処理を実行する複数のノードと、処理を実行するノードを決定する情報処理装置と、を備える情報処理システムに用いられる。情報処理装置は、複数のノードのそれぞれについて故障可能性を算出し、ノードの識別子と算出した故障可能性と、を対応づけた故障可能性データを出力する故障可能性算出手段と、新たな処理対象が入力されると、故障可能性データを読み出して、故障可能性の低いノードに、当該新たな処理対象を割り当てるノード割り当て手段と、を備える。   In order to solve the above-described problem, an information processing apparatus according to an embodiment is used in an information processing system including a plurality of nodes that execute a process to be processed and an information processing apparatus that determines a node that executes the process. . The information processing apparatus calculates a failure possibility for each of a plurality of nodes, outputs a failure possibility calculation unit that associates the node identifier with the calculated failure possibility, and a new process When a target is input, a node assigning unit that reads out failure possibility data and assigns the new processing target to a node with a low possibility of failure is provided.

実施の形態に係る情報処理システムのシステム構成を説明する図である。It is a figure explaining the system configuration | structure of the information processing system which concerns on embodiment. 実施の形態に係る情報処理装置のハードウェア構成を説明する図である。It is a figure explaining the hardware constitutions of the information processing apparatus which concerns on embodiment. 実施の形態に係る情報処理装置の機能ブロックを説明する図である。It is a figure explaining the functional block of the information processing apparatus which concerns on embodiment. 実施の形態に係るセンサ閾値データのデータ構造とデータの一例を説明する図である。It is a figure explaining an example of data structure and data of sensor threshold value data concerning an embodiment. 実施の形態に係るノード位置データのデータ構造とデータの一例を説明する図である。It is a figure explaining an example of the data structure and data of node position data concerning an embodiment. 実施の形態に係る故障可能性データのデータ構造とデータの一例を説明する図である。It is a figure explaining an example of the data structure and data of failure possibility data concerning an embodiment. 実施の形態に係る内的故障可能性算出手段による処理を説明するフローチャートである。It is a flowchart explaining the process by the internal failure possibility calculation means which concerns on embodiment. 実施の形態に係る外的故障可能性算出手段による処理を説明するフローチャートである。It is a flowchart explaining the process by the external failure possibility calculation means which concerns on embodiment. 変形例に係る情報処理システムのシステム構成を説明する図である。It is a figure explaining the system configuration | structure of the information processing system which concerns on a modification. 変形例に係る情報処理装置の機能ブロックを説明する図である。It is a figure explaining the functional block of the information processing apparatus which concerns on a modification.

次に、図面を参照して、実施の形態を説明する。以下の図面の記載において、同一または類似の部分には同一または類似の符号を付している。   Next, embodiments will be described with reference to the drawings. In the following description of the drawings, the same or similar parts are denoted by the same or similar reference numerals.

(実施の形態)
実施の形態に係る情報処理システム5は、図1に示すように、処理を実行するノードを決定するノード割り付け機能を備える情報処理装置1と、処理対象の処理を実行する複数のノード2a、2b、2c、2d…を備えるクラスタシステムである。情報処理装置1、ノード2a、2b、2cおよび2dは、一般的なコンピュータに、所定の処理を実行するプログラムがインストールされ実行されることによって実現される。情報処理装置1、ノード2a、2b、2cおよび2dは、通信ネットワーク6により、相互に通信可能に接続されている。通信ネットワーク6は、LAN等の相互に通信可能なネットワークである。
(Embodiment)
As shown in FIG. 1, the information processing system 5 according to the embodiment includes an information processing apparatus 1 having a node allocation function for determining a node to execute a process, and a plurality of nodes 2 a and 2 b that execute a process to be processed. 2c, 2d... The information processing apparatus 1 and the nodes 2a, 2b, 2c, and 2d are realized by installing and executing a program that executes a predetermined process in a general computer. The information processing apparatus 1 and the nodes 2a, 2b, 2c, and 2d are connected to each other via a communication network 6 so that they can communicate with each other. The communication network 6 is a network such as a LAN that can communicate with each other.

ここで処理対象は、CPU時間、記憶装置などのコンピュータのリソースを消費して、所定の処理が実行される。処理対象を処理するコンピュータの負荷は、この処理対象の処理内容によって異なる。   Here, the processing target consumes computer resources such as CPU time and storage device, and predetermined processing is executed. The load on the computer that processes the processing target varies depending on the processing content of the processing target.

図1に示す例では、情報処理システム5が、ノード割り付け機能を備える一つの情報処理装置1と、ノード割り付け機能を備えない4つのノード2a、2b、2cおよび2dを備える場合を説明するが、それぞれこの数に限られない。ここで、ノード2a、2b、2cおよび2dを特に区別しない場合には、単にノード2と記載する場合もある。   In the example illustrated in FIG. 1, a case where the information processing system 5 includes one information processing apparatus 1 having a node allocation function and four nodes 2a, 2b, 2c, and 2d that do not have a node allocation function will be described. Each is not limited to this number. Here, when the nodes 2a, 2b, 2c, and 2d are not particularly distinguished, they may be simply referred to as the node 2.

情報処理システム5は、多数の処理対象を分散して処理するクラスタシステムである。ノード割り付け機能を備える情報処理装置1が、処理対象をいずれのノード2a、2b、2cおよび2dで実行するかを割り当て、割り当てあられたノード2a、2b、2cおよび2dが、処理対象の処理を実行する。ここで、実施の形態に係る情報処理装置1は、新たな処理対象が入力されると、ノード2の性能と、ノード2で実行される処理対象の負荷とともに、ノード2の故障可能性に基づいて、処理対象を実行するノードを決定する。また情報処理装置1は、さらに、入力される処理対象の優先度に基づいて、処理対象を実行するノードを決定しても良い。   The information processing system 5 is a cluster system that distributes and processes a large number of processing targets. The information processing apparatus 1 having a node allocation function assigns which node 2a, 2b, 2c, and 2d executes the processing target, and the assigned node 2a, 2b, 2c, and 2d executes the processing target process. To do. Here, when a new processing target is input, the information processing apparatus 1 according to the embodiment is based on the failure possibility of the node 2 together with the performance of the node 2 and the load of the processing target executed by the node 2. The node that executes the processing target is determined. The information processing apparatus 1 may further determine a node that executes the processing target based on the input priority of the processing target.

実施の形態に係るノード2には、温度計、湿度計などの各種センサが設けられている。ノード2は、各センサの測定値を周期的に情報処理装置1に送信する。ノード2に設置されるセンサは、例えば、ノードの温度、ノードの湿度、振動、光度、外気温度、外気湿度などを測定するためのセンサである。   The node 2 according to the embodiment is provided with various sensors such as a thermometer and a hygrometer. The node 2 periodically transmits the measurement value of each sensor to the information processing apparatus 1. The sensor installed in the node 2 is, for example, a sensor for measuring the temperature of the node, the humidity of the node, the vibration, the luminous intensity, the outside air temperature, the outside air humidity, and the like.

図2に示すように、実施の形態に係る情報処理装置1は、中央処理制御装置101、ROM(Read Only Memory)102、RAM(Random Access Memory)103および入出力インタフェース109が、バス110を介して接続されている。入出力インタフェース109には、入力装置104、表示装置105、通信制御装置106、記憶装置107およびリムーバブルディスク108が接続されている。   As shown in FIG. 2, the information processing apparatus 1 according to the embodiment includes a central processing control device 101, a ROM (Read Only Memory) 102, a RAM (Random Access Memory) 103, and an input / output interface 109 via a bus 110. Connected. An input device 104, a display device 105, a communication control device 106, a storage device 107, and a removable disk 108 are connected to the input / output interface 109.

中央処理制御装置101は、入力装置104からの入力信号に基づいてROM102から情報処理装置1を起動するためのブートプログラムを読み出して実行し、さらに記憶装置107に記憶されたオペレーティングシステムを読み出す。さらに中央処理制御装置101は、入力装置104や通信制御装置106などの入力信号に基づいて、各種装置の制御を行ったり、RAM103や記憶装置107などに記憶されたプログラムおよびデータを読み出してRAM103にロードするとともに、RAM103から読み出されたプログラムのコマンドに基づいて、データの計算または加工など、後述する一連の処理を実現する処理装置である。   The central processing control apparatus 101 reads out and executes a boot program for starting up the information processing apparatus 1 from the ROM 102 based on an input signal from the input apparatus 104, and further reads out an operating system stored in the storage apparatus 107. Further, the central processing control device 101 controls various devices based on input signals from the input device 104, the communication control device 106, etc., and reads programs and data stored in the RAM 103, the storage device 107, etc. into the RAM 103. A processing device that loads and implements a series of processing described later, such as data calculation or processing, based on a program command read from the RAM 103.

入力装置104は、操作者が各種の操作を入力するキーボード、マウスなどの入力デバイスにより構成されており、操作者の操作に基づいて入力信号を作成し、入出力インタフェース109およびバス110を介して中央処理制御装置101に送信される。表示装置105は、CRT(Cathode Ray Tube)ディスプレイや液晶ディスプレイなどであり、中央処理制御装置101からバス110および入出力インタフェース109を介して表示装置105において表示させる出力信号を受信し、例えば中央処理制御装置101の処理結果などを表示する装置である。通信制御装置106は、LANカードやモデムなどの装置であり、情報処理装置1をインターネットやLANなどの通信ネットワークに接続する装置である。通信制御装置106を介して通信ネットワークと送受信したデータは入力信号または出力信号として、入出力インタフェース109およびバス110を介して中央処理制御装置101に送受信される。   The input device 104 includes input devices such as a keyboard and a mouse through which an operator inputs various operations. The input device 104 generates an input signal based on the operation of the operator, and inputs via the input / output interface 109 and the bus 110. It is transmitted to the central processing control apparatus 101. The display device 105 is a CRT (Cathode Ray Tube) display, a liquid crystal display, or the like, and receives an output signal to be displayed on the display device 105 from the central processing control device 101 via the bus 110 and the input / output interface 109. It is a device that displays the processing result of the control device 101 and the like. The communication control device 106 is a device such as a LAN card or a modem, and is a device that connects the information processing device 1 to a communication network such as the Internet or a LAN. Data transmitted / received to / from the communication network via the communication control device 106 is transmitted / received to / from the central processing control device 101 via the input / output interface 109 and the bus 110 as an input signal or an output signal.

記憶装置107は半導体記憶装置や磁気ディスク装置であって、中央処理制御装置101で実行されるプログラムやデータが記憶されている。リムーバブルディスク108は、光ディスクやフレキシブルディスクのことであり、ディスクドライブによって読み書きされた信号は、入出力インタフェース109およびバス110を介して中央処理制御装置101に送受信される。   The storage device 107 is a semiconductor storage device or a magnetic disk device, and stores programs and data executed by the central processing control device 101. The removable disk 108 is an optical disk or a flexible disk, and signals read / written by the disk drive are transmitted / received to / from the central processing control apparatus 101 via the input / output interface 109 and the bus 110.

実施の形態に係る情報処理装置1の記憶装置107には、情報処理プログラムが記憶される。図3に示すように、記憶装置107は、センサログデータ記憶部21、センサ閾値データ記憶部22、ノード位置データ記憶部23、故障可能性データ記憶部24およびノード割り当てデータ記憶部25を備える。また、情報処理プログラムが情報処理装置1の中央処理制御装置101に読み込まれ実行されることによって、センサ測定値受信手段11、故障可能性算出手段12、ノード割り当て手段15が、情報処理装置1に実装される。   An information processing program is stored in the storage device 107 of the information processing apparatus 1 according to the embodiment. As illustrated in FIG. 3, the storage device 107 includes a sensor log data storage unit 21, a sensor threshold data storage unit 22, a node position data storage unit 23, a failure possibility data storage unit 24, and a node assignment data storage unit 25. Further, when the information processing program is read and executed by the central processing control device 101 of the information processing apparatus 1, the sensor measurement value receiving means 11, the failure possibility calculating means 12, and the node assignment means 15 are added to the information processing apparatus 1. Implemented.

センサログデータ記憶部21は、記憶装置107のうち、センサログデータ21aが記憶された記憶領域である。センサログデータ21aは、情報処理システム5の各ノードにから受信したセンサの測定値のログデータである。センサログデータ21aは、測定日時、ノード識別子、センサ識別子およびそのセンサの測定値を関連づけたデータである。センサログデータ21aには、所定期間のセンサの測定値が蓄積される。またセンサログデータ21aには、ノード識別子、センサ識別子およびそのセンサの一定期間の測定値の平均値のデータを保持しても良い。この一定期間の測定値は、後述の内的故障可能性算出手段13により参照される。   The sensor log data storage unit 21 is a storage area in the storage device 107 in which the sensor log data 21a is stored. The sensor log data 21 a is log data of sensor measurement values received from each node of the information processing system 5. The sensor log data 21a is data in which measurement date / time, node identifier, sensor identifier, and measurement value of the sensor are associated. In the sensor log data 21a, sensor measurement values for a predetermined period are accumulated. Further, the sensor log data 21a may hold data of a node identifier, a sensor identifier, and an average value of measured values of the sensor for a certain period. The measured value for a certain period is referred to by an internal failure possibility calculation means 13 described later.

センサ閾値データ記憶部22は、記憶装置107のうち、センサ閾値データ22aが記憶された記憶領域である。センサ閾値データ22aは、ノードに設置された各種センサについて、その測定値が異常か否かを判定するために参照されるデータである。センサ閾値データ22aは、予め作成され記憶装置107に記憶されるデータである。   The sensor threshold data storage unit 22 is a storage area in the storage device 107 in which sensor threshold data 22a is stored. The sensor threshold value data 22a is data that is referred to in order to determine whether or not the measured value of each sensor installed in the node is abnormal. The sensor threshold data 22 a is data that is created in advance and stored in the storage device 107.

センサ閾値データ22aは、例えば図4に示すように、センサ種別と、閾値と、を対応づけたデータである。センサ種別は、ノード2に設置されるセンサの種別である。閾値は、そのノード2が正常であることを示すセンサの測定値の範囲である。例えば、センサ種別が「温度(装置)」の場合、ノード2に設置されたノード2自身の温度を測定するセンサの測定値が「5℃」から「35℃」の範囲内の場合、そのノード2自身の温度は正常であることがわかる。   The sensor threshold value data 22a is data in which a sensor type and a threshold value are associated with each other, for example, as shown in FIG. The sensor type is a type of sensor installed in the node 2. The threshold value is a range of sensor measurement values indicating that the node 2 is normal. For example, when the sensor type is “temperature (apparatus)” and the measured value of the sensor that measures the temperature of the node 2 itself installed in the node 2 is within the range of “5 ° C.” to “35 ° C.”, the node It can be seen that the temperature of 2 itself is normal.

ノード位置データ記憶部23は、記憶装置107のうち、ノード位置データ23aが記憶された記憶領域である。ノード位置データ23aは、図5に示すように、ノード2の識別子と、そのノードの位置情報と、が対応づけられたデータである。ノード2の位置情報は、例えば、ノード2が設置されたデータセンタにおける座標情報である。ノード位置データ23aは、予め作成され記憶装置107に記憶されるデータである。   The node position data storage unit 23 is a storage area in the storage device 107 in which the node position data 23a is stored. As shown in FIG. 5, the node position data 23a is data in which the identifier of the node 2 is associated with the position information of the node. The position information of the node 2 is, for example, coordinate information in the data center where the node 2 is installed. The node position data 23 a is data that is created in advance and stored in the storage device 107.

故障可能性データ記憶部24は、記憶装置107のうち、故障可能性データ24aが記憶された記憶領域である。故障可能性データ24aは、実施の形態に係る故障可能性算出手段12によって出力されるデータである。故障可能性データ24aは、図6に示すように、ノード2の識別子と、そのノード2の故障可能性と、を対応づけたデータである。図6に示す例では、ノード識別子「ND001」のノードは、故障可能性が「高」であることがわかる。図6に示す例では、ノードの故障可能性を、「高」、「中」、「低」の3段階で表記しているが、この表記に限らない。例えば、レベル5などのレベルで表記しても良いし、30%などの百分率で表記しても良い。   The failure possibility data storage unit 24 is a storage area in the storage device 107 in which failure possibility data 24a is stored. The failure possibility data 24a is data output by the failure possibility calculation means 12 according to the embodiment. The failure possibility data 24a is data in which the identifier of the node 2 is associated with the failure possibility of the node 2 as shown in FIG. In the example illustrated in FIG. 6, it is understood that the node with the node identifier “ND001” has a high possibility of failure. In the example illustrated in FIG. 6, the possibility of failure of a node is described in three stages of “high”, “medium”, and “low”, but is not limited to this notation. For example, it may be expressed by a level such as level 5 or a percentage such as 30%.

ノード割り当てデータ記憶部25は、記憶装置107のうち、ノード割り当てデータ25aが記憶された記憶領域である。ノード割り当てデータ25aは、実施の形態に係るノード割り当て手段15によって出力されるデータである。ノード割り当てデータ25aには、処理対象の識別子と、その処理対象を処理するノードの識別子と、を対応づけたデータである。情報処理装置1は、このノード割り当てデータ25aを参照して、ノード2に、そのノード2が処理するべき処理対象の情報を入力し、そのノードに割り当てた処理対象を処理させる。   The node allocation data storage unit 25 is a storage area in the storage device 107 in which the node allocation data 25a is stored. The node assignment data 25a is data output by the node assignment unit 15 according to the embodiment. The node assignment data 25a is data in which an identifier of a processing target is associated with an identifier of a node that processes the processing target. The information processing apparatus 1 refers to the node assignment data 25a, inputs information about a processing target to be processed by the node 2 to the node 2, and processes the processing target assigned to the node.

センサ測定値受信手段11は、複数のノード2に設置されたセンサから得た測定値を受信して、センサログデータ21aに記録する。センサ測定受信手段11は、ノード2からセンサの測定値を受信すると、測定日時、ノード識別子、センサ識別子およびそのセンサの測定値を関連づけたレコードを生成し、センサログデータ21aに記憶する。   The sensor measurement value receiving means 11 receives the measurement values obtained from the sensors installed in the plurality of nodes 2 and records them in the sensor log data 21a. Upon receiving the sensor measurement value from the node 2, the sensor measurement receiving unit 11 generates a record in which the measurement date / time, the node identifier, the sensor identifier, and the measurement value of the sensor are associated with each other, and stores the record in the sensor log data 21a.

実施の形態においては、ノード2からセンサ測定値を自発的に受信する場合について説明するが、この方法に限られない。例えば、情報処理装置1に新たな処理対象の情報が入力され、この処理対象のノードへの割り当て処理が発生する度に、実施の形態に係る情報処理装置1が、ノード2にセンサ測定値を問い合わせ、センサ測定値受信手段11が、その応答としてセンサ測定値を受信しても良い。   In the embodiment, a case where the sensor measurement value is spontaneously received from the node 2 will be described, but the present invention is not limited to this method. For example, when information on a new processing target is input to the information processing apparatus 1 and an allocation process to the processing target node occurs, the information processing apparatus 1 according to the embodiment sends a sensor measurement value to the node 2. The inquiry and sensor measurement value receiving means 11 may receive the sensor measurement value as a response.

故障可能性算出手段12は、複数のノード2のそれぞれについて故障可能性を算出し、ノードの識別子と算出した故障可能性と、を対応づけた故障可能性データ24aを出力する。故障可能性算出手段12は、後述の方法により各ノード2について故障可能性を算出して、故障可能性データ23aを算出する。故障可能性算出手段12は、内的故障可能性算出手段13および外的故障可能性算出手段14を備える。   The failure possibility calculation means 12 calculates the failure possibility for each of the plurality of nodes 2, and outputs failure possibility data 24a in which the node identifier is associated with the calculated failure possibility. The failure possibility calculation means 12 calculates the failure possibility for each node 2 by the method described later, and calculates failure possibility data 23a. The failure possibility calculation means 12 includes an internal failure possibility calculation means 13 and an external failure possibility calculation means 14.

ここで、故障可能性算出手段12は、(1)内的故障可能性算出手段13による内的故障可能性を、ノード2の故障可能性とする場合、(2)外的故障可能性算出手段14による外的故障可能性を、ノード2の故障可能性データとする場合、および(3)内的故障可能性算出手段13による内的故障可能性と、外的故障可能性算出手段14による外的故障可能性に基づいて、ノード2の故障可能性とする方法のいずれかの場合が考えられる。(3)の場合、故障可能性算出手段12は、例えば、ノード2の内的故障可能性および外的故障可能性を算出し、そのいずれか高い方を、このノード2の故障可能性とする。具体的には故障可能性算出手段12は、ノード2の内的故障可能性が「中」で、外的故障可能性が「小」の場合、このノード2の故障可能性を「中」と判断して、故障可能性データ24aに記憶する。   Here, the failure possibility calculation means 12 is (1) When the possibility of internal failure by the internal failure possibility calculation means 13 is the failure possibility of the node 2, (2) External failure possibility calculation means 14 is used as the failure possibility data of the node 2, and (3) the possibility of internal failure by the internal failure possibility calculation means 13 and the external possibility by the external failure possibility calculation means 14 Any of the methods for determining the possibility of failure of the node 2 is considered based on the possibility of static failure. In the case of (3), the failure possibility calculation means 12 calculates, for example, the possibility of internal failure and the possibility of external failure of the node 2, and the higher one is set as the possibility of failure of this node 2. . Specifically, the failure possibility calculation means 12 determines that the failure possibility of the node 2 is “medium” when the internal failure possibility of the node 2 is “medium” and the external failure possibility is “small”. It judges and memorize | stores in the failure possibility data 24a.

内的故障可能性算出手段13および外的故障可能性算出手段14の各処理を説明する。   Each process of the internal failure possibility calculation means 13 and the external failure possibility calculation means 14 will be described.

内的故障可能性算出手段13は、ノード2の内的要因による故障可能性を算出する。実施の形態において、ノード2の内的要因とは、ノード2のハードウェアなどに基づくノードの異常である。例えばノード2の温度、湿度、振動が正常値にない場合、現在はノード2に不具合を生じていない場合でも、将来的に故障する可能性が高いと考えられる。また、ノード2の光度が高いなど、明るい光を浴びている場合や、外気の温度および湿度が正常値にない場合も、将来的に故障する可能性が高いと考えられる。内的故障可能性算出手段13は、このようなノード2に設置したセンサから、ノード2のハードウェアなどに基づく将来的な異常を察知し、その故障可能性を算出する。   The internal failure possibility calculation means 13 calculates a failure possibility due to an internal factor of the node 2. In the embodiment, the internal factor of the node 2 is a node abnormality based on the hardware of the node 2 or the like. For example, when the temperature, humidity, and vibration of the node 2 are not normal values, it is considered that there is a high possibility of failure in the future even if the node 2 is not currently malfunctioning. In addition, it is considered that there is a high possibility of failure in the future even when the node 2 is exposed to bright light such as high light intensity or when the temperature and humidity of the outside air are not normal values. The internal failure possibility calculation means 13 detects a future abnormality based on the hardware of the node 2 from the sensor installed in the node 2 and calculates the failure possibility.

内的故障可能性算出手段13は、センサ閾値データ22aを参照して、センサ測定値受信手段11によって受信された任意のノード2の測定値と、センサ閾値データ22aの閾値との乖離度に応じて、このノード2の内的故障可能性を算出する。ここで内的故障可能性算出手段13は、任意のノード2について得られた全てのセンサ種別の所定期間の測定値について、センサ閾値データ22aの閾値との乖離度に応じた内的故障可能性を算出することが好ましい。   The internal failure possibility calculation means 13 refers to the sensor threshold value data 22a and corresponds to the degree of divergence between the measured value of any node 2 received by the sensor measurement value receiving means 11 and the threshold value of the sensor threshold value data 22a. Thus, the internal failure possibility of this node 2 is calculated. Here, the internal failure possibility calculation means 13 has a possibility of internal failure according to the degree of deviation from the threshold value of the sensor threshold data 22a for the measured values of all sensor types obtained for any node 2 for a predetermined period. Is preferably calculated.

図7を参照して、内的故障可能性算出手段13による内的故障可能性算出処理を説明する。   With reference to FIG. 7, the internal failure possibility calculation process by the internal failure possibility calculation means 13 will be described.

まずステップS1において内的故障可能性算出手段13は、センサ測定値の入力を待機する。このセンサ測定値には、全てのノードの全てのセンサによる測定値が含まれ、センサログデータ21aに記録される。センサ測定値が入力されると、内的故障可能性算出手段13は、全てのノードについて、ステップS102ないしステップS104の処理を繰り返す。   First, in step S1, the internal failure possibility calculation means 13 waits for input of sensor measurement values. The sensor measurement values include the measurement values of all the sensors of all the nodes and are recorded in the sensor log data 21a. When the sensor measurement value is input, the internal failure possibility calculation means 13 repeats the processing from step S102 to step S104 for all nodes.

任意のノード2に設置された全てのセンサについて、ステップS102およびステップS103の処理を繰り返す。ステップS102において内的故障可能性算出手段13は、任意のノード2の任意のセンサについて、センサ閾値データ22aからそのセンサ種別に基づいて、正常値を示す閾値を取得し、受信した測定値との差分を算出する。さらにステップS103において内的故障可能性算出手段13は、ステップS102で算出した差分と、センサログデータ21aとから、現時点から一定期間の差分の平均値を算出する。ここで、センサログデータ21aに、一定期間の差分の平均値が記録されていない場合、例えば、今回新に取得した測定値と、1時間などの一定期間の過去のセンサの測定値とから、一定期間の差分の平均値を算出しても良い。   The process of step S102 and step S103 is repeated for all sensors installed in any node 2. In step S <b> 102, the internal failure possibility calculation means 13 acquires a threshold value indicating a normal value from the sensor threshold data 22 a based on the sensor type for an arbitrary sensor of an arbitrary node 2, and compares it with the received measurement value. Calculate the difference. Furthermore, in step S103, the internal failure possibility calculation means 13 calculates the average value of the difference over a certain period from the present time from the difference calculated in step S102 and the sensor log data 21a. Here, when the average value of the difference for a certain period is not recorded in the sensor log data 21a, for example, from the measurement value newly acquired this time and the measurement value of the past sensor for a certain period such as 1 hour, You may calculate the average value of the difference of a fixed period.

任意のノード2について、この任意のノード2に設置された全てのセンサについて、ステップS102およびステップS103の処理を繰り返す。任意のノード2に設置された全てのセンサについて、ステップS102およびステップS103の処理が終了すると、ステップS104において内的故障可能性算出手段13は、ステップS103において算出された各センサの差分の平均値を加算した値に基づいて、当該ノード2の内的故障可能性として出力する。   For an arbitrary node 2, the processes in steps S102 and S103 are repeated for all the sensors installed in the arbitrary node 2. When the processing of step S102 and step S103 is completed for all sensors installed in any node 2, the internal failure possibility calculation means 13 in step S104 calculates the average value of the differences of the sensors calculated in step S103. Is output as the possibility of internal failure of the node 2.

例えば、任意のノード2の全てのセンサの値が正常値の範囲内である場合、ステップS104で算出される和は0となり、内的故障可能性算出手段13は、この任意のノード2の内的故障可能性を「低」として出力する。この和が大きくなるほど、内的故障可能性算出手段13は、この任意のノード2の内的故障可能性を「中」、「大」と大きく設定して出力する。   For example, when the values of all the sensors of any node 2 are within the normal value range, the sum calculated in step S104 is 0, and the internal failure possibility calculation means 13 Output the possibility of mechanical failure as “low”. As this sum increases, the internal failure possibility calculation means 13 sets the internal failure possibility of this arbitrary node 2 to “medium” and “large” and outputs it.

図7に示す例では、各センサの測定値と閾値との差分の評価を均一にする場合について説明したが、センサ種別、測定日時などに応じて、差分の評価を重みづけしても良い。例えば、湿度は、天候や季節によって変化しやすいことが一般的に知られている。そこで、湿度10%の差分より、温度10℃の差分の方が、内的故障可能性に大きく反映されるように重みづけしても良い。   In the example illustrated in FIG. 7, the case where the evaluation of the difference between the measurement value of each sensor and the threshold value is uniformed has been described. However, the evaluation of the difference may be weighted according to the sensor type, the measurement date, and the like. For example, it is generally known that humidity is likely to change depending on the weather and season. Therefore, the difference of the temperature of 10 ° C. may be weighted so as to largely reflect the possibility of internal failure rather than the difference of 10% humidity.

外的故障可能性算出手段14は、ノード2の外的要因による故障可能性を算出する。実施の形態において、ノード2の外的要因とは、火災、浸水、空調不足、日射、風雪などのノード2の外部の異常である。このような外的要因は、ノードの設置場所によってその被害の度合いが異なると考えられる。例えば同じ室内に設置された複数のノードでも、外的要因による被害を受けやすい位置と、受けにくい位置とがある。従って、外的要因で故障した近くに設置されるノードは、後々同様の外的要因で故障する可能性が高いと考えられる。   The external failure possibility calculation means 14 calculates the possibility of failure due to an external factor of the node 2. In the embodiment, the external factors of the node 2 are abnormalities outside the node 2 such as fire, flooding, lack of air conditioning, solar radiation, wind and snow. Such external factors are considered to have different levels of damage depending on the location of the node. For example, even in a plurality of nodes installed in the same room, there are positions that are easily damaged by external factors and positions that are not easily received. Therefore, it is considered that a node installed near a failure due to an external factor is likely to fail later due to the same external factor.

そこで、外的故障可能性算出手段14は、複数のノード2のいずれかが、外的要因により故障した場合、ノード位置データ23aを参照して、その故障したノードと任意のノードとの距離に応じて、ノードの外的故障可能性を算出する。故障可能性算出手段14は、外的要因により故障したノードの識別子が入力されると、ノード位置データ23aから、そのノードの位置情報を取得するとともに、故障したノードと、これ以外のノードとの距離を算出する。外的故障可能性算出手段14は、この距離が小さいノードの外的故障可能性を「高」とし、この距離が大きいノードの外的故障可能性を「小」として出力する。   Therefore, when any of the plurality of nodes 2 fails due to an external factor, the external failure possibility calculation means 14 refers to the node position data 23a and determines the distance between the failed node and an arbitrary node. In response, the possibility of external failure of the node is calculated. When the identifier of the node that has failed due to an external factor is input, the failure possibility calculation means 14 acquires the position information of the node from the node position data 23a, and at the same time, Calculate the distance. The possibility of external failure calculation means 14 outputs the possibility of external failure of a node having a small distance as “high” and the possibility of external failure of a node having a large distance as “low”.

図8を参照して、外的故障可能性算出手段14による外的故障可能性算出処理を説明する。   With reference to FIG. 8, the external failure possibility calculation process by the external failure possibility calculation means 14 will be described.

ステップS201において外的故障可能性算出手段14は、故障ノードの情報が入力されるのを待機する。ここで故障ノードは、情報処理システム5の複数のノード2のうち、外的要因により故障したノードである。故障ノードの情報は例えば、故障ノードの識別子である。故障ノードの情報は、通信ネットワーク6を介して管理端末(図示せず)から入力されても良いし、情報処理装置1の入力装置104から入力されても良い。故障ノードの情報が入力されると、外的故障可能性算出手段14は、ノード位置データ23aからこの故障ノードの位置情報を取得する。   In step S201, the external failure possibility calculation means 14 waits for information on the failed node to be input. Here, the failed node is a node that has failed due to an external factor among the plurality of nodes 2 of the information processing system 5. The failure node information is, for example, an identifier of the failure node. The information on the failed node may be input from a management terminal (not shown) via the communication network 6, or may be input from the input device 104 of the information processing apparatus 1. When the information on the failed node is input, the external failure possibility calculating means 14 acquires the location information on the failed node from the node location data 23a.

故障ノードの位置情報を取得すると、外的故障可能性算出手段14は、故障ノード以外のノードについて、ステップS202およびステップS203を繰り返す。   When the location information of the failed node is acquired, the external failure possibility calculating means 14 repeats Step S202 and Step S203 for nodes other than the failed node.

まずステップS202において外的故障可能性算出手段14は、ノード位置データ23aから、故障ノードでない任意のノード2の位置情報を取得する。さらに外的故障可能性算出手段14は、ステップS201で取得した故障ノードの位置情報に基づいて、この任意のノード2と故障ノードとの距離を算出する。   First, in step S202, the external failure possibility calculation means 14 acquires position information of an arbitrary node 2 that is not a failure node from the node position data 23a. Further, the external failure possibility calculation means 14 calculates the distance between this arbitrary node 2 and the failure node based on the location information of the failure node acquired in step S201.

さらにステップS203において外的故障可能性算出手段14は、ステップS202で算出した距離から、外的故障可能性を算出する。例えば、外的故障可能性を、「高」、「中」および「低」と3段階で出力する場合、予め3段階に適用する距離の閾値を設定する。この閾値は、通信処理システム5の規模などに応じて設定されることが好ましい。外的故障可能性算出手段14は、ステップS202で算出した距離から、いずれの段階に当てはまるかを判定し、外的故障可能性を出力する。   Further, in step S203, the external failure possibility calculation means 14 calculates the external failure possibility from the distance calculated in step S202. For example, when the possibility of external failure is output in three stages of “high”, “medium”, and “low”, a threshold of distance applied in three stages is set in advance. This threshold is preferably set according to the scale of the communication processing system 5 or the like. The external failure possibility calculation means 14 determines which stage is applicable from the distance calculated in step S202, and outputs the external failure possibility.

ここでは、故障可能性算出手段12が、センサ測定値を受信する度に、または、故障ノードの情報が入力される度に、故障可能性データ24aを出力する場合について説明したが、これは一例である。例えば故障可能性算出手段12は、センサ測定値の受信や故障ノードの情報の入力と非同期に、故障可能性データ24aを算出しても良い。また故障可能性算出手段12は、情報処理装置1に新たな処理対象の情報が入力され、この処理対象のノードへの割り当て処理が発生する度に、故障可能性データ24aを算出しても良い。   Here, a case has been described in which the failure possibility calculation means 12 outputs the failure possibility data 24a every time a sensor measurement value is received or every time failure node information is input. This is an example. It is. For example, the failure possibility calculation means 12 may calculate the failure possibility data 24a asynchronously with reception of sensor measurement values or input of failure node information. The failure possibility calculation means 12 may calculate the failure possibility data 24a each time new processing target information is input to the information processing apparatus 1 and allocation processing to the processing target node occurs. .

ノード割り当て手段15は、新たな処理対象が入力されると、故障可能性データ24aを読み出して、故障可能性の低いノードに、当該新たな処理対象を割り当てる。   When a new processing target is input, the node allocation unit 15 reads out the failure possibility data 24a and allocates the new processing target to a node having a low possibility of failure.

ここで、ノード割り当て手段15は、ノード2それぞれの負荷の情報と、新たな処理対象の負荷の情報とを保持する。例えば、ノード2aが最も故障可能性が低く、ノード2aの負荷が80%で、新たな処理対象の負荷が30%の場合、このノードではこの新たな処理対象を処理できない。そこで、ノード割り当て手段15は、その次に故障可能性の低いノードに割り当てを試みる。ノード割り当て手段15は、ノードの故障可能性の低い順に、各ノードの負荷に応じて、新たな処理対象を処理するノードを決定し、その決定したノードに新たな処理対象を処理させる。ノード割り当て手段15によるノードの割り当て手法は、様々な手法が考えられる。 Here, the node allocating unit 15 holds information on the load of each node 2 and information on a new load to be processed. For example, when the node 2a has the lowest possibility of failure, the load on the node 2a is 80%, and the load on the new processing target is 30%, this node cannot process this new processing target. Therefore, the node allocation means 15 tries to allocate to the next node with the lowest possibility of failure. The node allocation unit 15 determines a node to process a new processing target according to the load of each node in order from the low possibility of failure of the node, and causes the determined node to process the new processing target. Various methods of node allocation by the node allocation unit 15 can be considered.

例えば新たな処理対象の重要度に応じて、ノードを割り当てる方法もある。新たな処理対象の情報として、処理対象の重要度も与えられる場合、ノード割り当て手段15は、入力された新たな処理対象の重要度が高い場合に、故障可能性が低いノードに新たな処理対象を割り当て、重要度が低い場合に、故障可能性の高いノードに、新たな処理対象を割り当てても良い。例えば処理対象の重要度は、ストリーミング配信など、データが欠損しても問題ない処理対象は低く、マスタテーブルの更新などは高いことが一般的に知られている。そこで、故障可能性が高いノードに重要度の低い処理対象を割り当て、故障可能性の低いノードに重要度の高い処理対象を割り当てることにより、故障可能性が高くてもまだ稼働しているノードも有効に活用しつつ、情報処理システム5全体で、安定して処理対象を処理することができる。   For example, there is a method of assigning nodes according to the importance of a new processing target. When the importance of the processing target is also given as the new processing target information, the node allocating unit 15 sets the new processing target to the node having a low possibility of failure when the input importance of the new processing target is high. And a new processing target may be assigned to a node having a high possibility of failure. For example, it is generally known that the degree of importance of a processing target is low for a processing target that does not cause a problem even if data is lost, such as streaming distribution, and that the update of a master table is high. Therefore, by assigning a processing target with a low importance level to a node with a high possibility of failure and assigning a processing target with a high importance level to a node with a low possibility of failure, a node that is still operating even if it has a high possibility of failure. The processing target can be stably processed in the entire information processing system 5 while being effectively used.

他にも、処理対象が消費または供給するリソースの割り当てを入札方式で決定する方法がある。この方法では、CPUの消費量が他の処理対象より小さい処理対象によって供給されるリソースに対する入札値が、他の処理対象より大きな値になるように、入札値が調整される。さらにこの調整された入札値に基づいて、処理対象を処理するノードを決定する。   In addition, there is a method of determining allocation of resources consumed or supplied by a processing target by a bid method. In this method, the bid price is adjusted such that the bid price for the resource supplied by the processing target whose CPU consumption is smaller than the other processing target is larger than that of the other processing target. Furthermore, based on the adjusted bid price, a node that processes the processing target is determined.

このように、ノード割り当て手段15によるノードの割り当て処理は、様々な方法が考えられる。ここで、従来の方法に実施の形態に係る故障可能性をさらに考慮することで、さらに安定した情報処理システム5の運用が期待される。   As described above, various methods can be considered for the node allocation processing by the node allocation means 15. Here, by further considering the possibility of failure according to the embodiment in the conventional method, a more stable operation of the information processing system 5 is expected.

(変形例)
実施の形態に係る情報処理システム5は、処理対象の処理を実行する複数のノード2と、処理を実行するノードを決定する情報処理装置1と、を備える場合について説明した。変形例おいて、処理対象の処理を実行するとともに、処理を実行するノードを決定する複数の情報処理装置3を備える情報処理システム5aを説明する。
(Modification)
The information processing system 5 according to the embodiment has been described with respect to the case where the information processing system 5 includes the plurality of nodes 2 that execute the process to be processed and the information processing apparatus 1 that determines the node that executes the process. In a modified example, an information processing system 5a including a plurality of information processing devices 3 that execute a process to be processed and determine a node to execute the process will be described.

図9に示すように、変形例に係る情報処理システム5aは、複数のノード割り付け機能を備える情報処理装置3a、3b、3c、3dおよび3eを備える。ここで、情報処理装置3a、3b、3c、3dおよび3eを特に区別しない場合には、単に情報処理装置3と記載する場合もある。   As shown in FIG. 9, the information processing system 5a according to the modification includes information processing apparatuses 3a, 3b, 3c, 3d, and 3e having a plurality of node allocation functions. Here, when the information processing devices 3a, 3b, 3c, 3d, and 3e are not particularly distinguished, they may be simply referred to as the information processing device 3.

図10を参照して、変形例に係る情報処理装置3を説明する。変形例に係る情報処理装置3は、図3を参照して説明した実施の形態に係る情報処理装置1と比べて、ノード割り当て手段15aの処理が異なる。変形例に係るノード割り当て手段15aは、新たな処理対象が入力されると、故障可能性データ24aを読み出して、故障可能性の低い情報処理装置3に、当該新たな処理対象を割り当てる。ノード割り当て手段15aは、変形例に係る情報処理システム5aの全ての情報処理装置3a、3b、3c、3dおよび3eのいずれかに、処理対象を割り当てる。   With reference to FIG. 10, an information processing apparatus 3 according to a modification will be described. The information processing apparatus 3 according to the modification is different from the information processing apparatus 1 according to the embodiment described with reference to FIG. When a new processing target is input, the node assignment unit 15a according to the modification reads the failure possibility data 24a and assigns the new processing target to the information processing apparatus 3 with a low possibility of failure. The node assignment unit 15a assigns a processing target to any of the information processing apparatuses 3a, 3b, 3c, 3d, and 3e of the information processing system 5a according to the modification.

変形例に係る情報処理装置3は、さらに、図3を参照して説明した実施の形態に係る情報処理装置1と比べて、記憶装置107が処理データ記憶部26を備え、中央処理制御装置101に処理実行手段16が実装される点が異なる。   Compared to the information processing apparatus 1 according to the embodiment described with reference to FIG. 3, the information processing apparatus 3 according to the modified example further includes a processing data storage unit 26 and a central processing control apparatus 101. Is different in that the processing execution means 16 is mounted.

処理データ記憶部26は、記憶装置107のうち処理データ26aが記憶された記憶領域である。処理データ26aは、情報処理装置3に入力される処理対象の処理で参照または更新されるデータである。処理データ26aは、情報処理装置3の記憶装置107に記憶されても良いし、通信制御装置106を介して接続されるデータベースサーバ等の記憶装置に記憶されても良い。   The processing data storage unit 26 is a storage area in which processing data 26 a is stored in the storage device 107. The processing data 26 a is data that is referred to or updated in the processing target process input to the information processing apparatus 3. The processing data 26a may be stored in the storage device 107 of the information processing device 3, or may be stored in a storage device such as a database server connected via the communication control device 106.

処理実行手段16は、情報処理装置3に入力される処理対象を処理する手段である。処理実行手段16は、処理データ26aを参照または更新して、所定の処理を実行する。ここで、処理実行手段16は、情報処理装置3のリソースがある限り、複数の処理対象を処理する場合もある。処理実行手段16は、情報処理装置3自身のノード割り当て手段15aにより割り当てられた処理対象を処理する場合もあるし、情報処理システム5aの他の情報処理装置によって割り当てられた処理対象を処理する場合もある。   The process execution unit 16 is a unit that processes a process target input to the information processing apparatus 3. The process execution means 16 refers to or updates the process data 26a and executes a predetermined process. Here, as long as there is a resource of the information processing apparatus 3, the process execution unit 16 may process a plurality of processing targets. The process execution unit 16 may process the processing target allocated by the node allocation unit 15a of the information processing apparatus 3 itself, or may process the processing target allocated by another information processing apparatus of the information processing system 5a. There is also.

このように、処理対象を割り当てるノードでさらに、処理対象を処理する場合もある。また、変形例においては、情報処理システム5aの全てのコンピュータで、処理対象を処理するノードを割りてるとともに、割り当てられた処理対象を処理する場合を説明したが、この形態に限られない。例えば、ノード割り当てを処理するコンピュータを、故障可能性の低いノードのみに限っても良い。   In this way, the processing target may be further processed at the node to which the processing target is assigned. Further, in the modified example, a case has been described in which all computers of the information processing system 5a allocate nodes to be processed and process the assigned processing targets, but the present invention is not limited to this form. For example, the computer that processes the node assignment may be limited to only a node having a low possibility of failure.

以上説明した少なくとも一つの実施の形態に係る情報処理装置は、故障可能性を考慮して処理対象を割り当てることができる。   The information processing apparatus according to at least one embodiment described above can assign a processing target in consideration of the possibility of failure.

いくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   Although several embodiments have been described, these embodiments have been presented by way of example and are not intended to limit the scope of the invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.

1、3 情報処理装置
2 ノード
5 情報処理システム
6 通信ネットワーク
11 センサ測定値受信手段
12 故障可能性算出手段
13 内的故障可能性算出手段
14 外的故障可能性算出手段
15 ノード割り当て手段
16 処理データ記憶部
21 センサログデータ記憶部
22 センサ閾値データ記憶部
23 ノード位置データ記憶部
24 故障可能性データ記憶部
25 ノード割り当てデータ記憶部
26 処理実行手段
101 中央処理制御装置
102 ROM
103 RAM
104 入力装置
105 表示装置
106 通信制御装置
107 記憶装置
108 リムーバブルディスク
109 入出力インタフェース
110 バス
DESCRIPTION OF SYMBOLS 1, 3 Information processing apparatus 2 Node 5 Information processing system 6 Communication network 11 Sensor measured value receiving means 12 Failure possibility calculation means 13 Internal failure possibility calculation means 14 External failure possibility calculation means 15 Node allocation means 16 Process data Storage unit 21 Sensor log data storage unit 22 Sensor threshold data storage unit 23 Node position data storage unit 24 Failure possibility data storage unit 25 Node allocation data storage unit 26 Process execution means 101 Central processing control device 102 ROM
103 RAM
104 Input Device 105 Display Device 106 Communication Control Device 107 Storage Device 108 Removable Disk 109 Input / Output Interface 110 Bus

Claims (8)

処理対象の処理を実行する複数のノードと、前記処理を実行するノードを決定する情報処理装置と、を備える情報処理システムに用いられる情報処理装置であって、
前記複数のノードのそれぞれについて故障可能性を算出し、ノードの識別子と算出した故障可能性と、を対応づけた故障可能性データを出力する故障可能性算出手段と、
新たな処理対象が入力されると、前記故障可能性データを読み出して、前記故障可能性の低いノードに、当該新たな処理対象を割り当てるノード割り当て手段と、
を備えることを特徴とする情報処理装置。
An information processing apparatus used in an information processing system comprising a plurality of nodes that execute a process to be processed and an information processing apparatus that determines a node that executes the process,
A failure possibility calculating means for calculating a failure possibility for each of the plurality of nodes, and outputting failure possibility data in which the identifier of the node and the calculated failure possibility are associated;
When a new processing target is input, node allocation means for reading the failure possibility data and allocating the new processing target to the node having a low possibility of failure;
An information processing apparatus comprising:
前記複数のノードに設置されたセンサから得た測定値を受信して、センサログデータに記録するセンサ測定値受信手段を備え、
前記故障可能性算出手段は、内的故障可能性算出手段を備え、
前記内的故障可能性算出手段は、前記センサの正常値を示す閾値を含むセンサ閾値データを参照して、前記センサ測定値受信手段によって受信された任意のノードの測定値と、前記閾値との乖離度に応じて、当該任意のノードの故障可能性を算出する
ことを特徴とする請求項1に記載の情報処理装置。
Sensor measurement value receiving means for receiving measurement values obtained from sensors installed in the plurality of nodes and recording the sensor log data,
The failure possibility calculation means includes an internal failure possibility calculation means,
The internal failure possibility calculation means refers to sensor threshold value data including a threshold value indicating a normal value of the sensor, and obtains a measurement value of an arbitrary node received by the sensor measurement value reception means, and the threshold value. The information processing apparatus according to claim 1, wherein a failure possibility of the arbitrary node is calculated according to the degree of divergence.
前記故障可能性算出手段は、外的故障可能性算出手段を備え、
前記外的故障可能性算出手段は、前記複数のノードのいずれかが、外的要因により故障した場合、前記複数のノードの位置情報を含むノード位置データを参照して、その故障したノードと任意のノードとの距離に応じて、当該任意のノードの故障可能性を算出する
ことを特徴とする請求項1に記載の情報処理装置。
The failure possibility calculation means includes an external failure possibility calculation means,
When any of the plurality of nodes fails due to an external factor, the external failure possibility calculation means refers to node position data including position information of the plurality of nodes, and arbitrarily selects the failed node. The information processing apparatus according to claim 1, wherein a failure possibility of the arbitrary node is calculated according to a distance from the node.
前記複数のノードに設置されたセンサから得た測定値を受信して、センサログデータに記録するセンサ測定値受信手段を備え、
前記故障可能性算出手段は、内的故障可能性算出手段および外的故障可能性算出手段を備え、
前記内的故障可能性算出手段は、前記センサの正常値を示す閾値を含むセンサ閾値データを参照して、前記センサ測定値受信手段によって受信された任意のノードの測定値と、前記閾値との乖離度に応じて、当該任意のノードの内的故障可能性を算出し、
前記外的故障可能性算出手段は、前記複数のノードのいずれかが、外的要因により故障した場合、前記複数のノードの位置情報を含むノード位置データを参照して、その故障したノードと任意のノードとの距離に応じて、当該任意のノードの外的故障可能性を算出し、
前記故障可能性算出手段は、前記任意のノードの内的故障可能性および外的故障可能性に基づいて、当該任意のノードの故障可能性を算出する
ことを特徴とする請求項1に記載の情報処理装置。
Sensor measurement value receiving means for receiving measurement values obtained from sensors installed in the plurality of nodes and recording the sensor log data,
The failure possibility calculation means includes an internal failure possibility calculation means and an external failure possibility calculation means,
The internal failure possibility calculation means refers to sensor threshold value data including a threshold value indicating a normal value of the sensor, and obtains a measurement value of an arbitrary node received by the sensor measurement value reception means, and the threshold value. Depending on the degree of divergence, calculate the possibility of internal failure of the arbitrary node,
When any of the plurality of nodes fails due to an external factor, the external failure possibility calculation means refers to node position data including position information of the plurality of nodes, and arbitrarily selects the failed node. The possibility of external failure of any given node is calculated according to the distance from the node,
The failure possibility calculation means calculates the failure possibility of the arbitrary node based on the internal failure possibility and the external failure possibility of the arbitrary node. Information processing device.
前記ノード割り当て手段は、入力された新たな処理対象の重要度が高い場合に、前記故障可能性が低いノードに当該新たな処理対象を割り当て、重要度が低い場合に、前記故障可能性の高いノードに、当該新たな処理対象を割り当てる
ことを特徴とする請求項1ないし4のいずれか1項に記載の情報処理装置。
The node assigning unit assigns the new processing target to a node having a low possibility of failure when the importance of the input new processing target is high, and the failure possibility is high when the importance is low. The information processing apparatus according to any one of claims 1 to 4, wherein the new processing target is assigned to a node.
処理対象の処理を実行するとともに、前記処理を実行するノードを決定する複数の情報処理装置を備える情報処理システムに用いられる情報処理装置であって、
前記複数のノードのそれぞれについて故障可能性を算出し、ノードの識別子と算出した故障可能性と、を対応づけた故障可能性データを出力する故障可能性算出手段と、
新たな処理対象が入力されると、前記故障可能性データを読み出して、前記故障可能性の低い情報処理装置に、当該新たな処理対象を割り当てるノード割り当て手段と、
当該情報処理装置に割り当てられた処理対象の処理を実行する処理実行手段
を備えることを特徴とする情報処理装置。
An information processing apparatus used for an information processing system including a plurality of information processing apparatuses that execute a process to be processed and determine a node that executes the process,
A failure possibility calculating means for calculating a failure possibility for each of the plurality of nodes, and outputting failure possibility data in which the identifier of the node and the calculated failure possibility are associated;
When a new processing target is input, node allocation means for reading the failure possibility data and allocating the new processing target to the information processing apparatus having a low possibility of failure;
An information processing apparatus comprising: a process execution unit that executes a process to be processed assigned to the information processing apparatus.
処理対象の処理を実行する複数のノードと、前記処理を実行するノードを決定する情報処理装置と、を備える情報処理システムの情報処理装置に用いられる情報処理プログラムであって、
コンピュータを、
前記複数のノードのそれぞれについて故障可能性を算出し、ノードの識別子と算出した故障可能性と、を対応づけた故障可能性データを出力する故障可能性算出手段と、
新たな処理対象が入力されると、前記故障可能性データを読み出して、前記故障可能性の低いノードに、当該新たな処理対象を割り当てるノード割り当て手段
として機能させるための情報処理プログラム。
An information processing program used for an information processing apparatus of an information processing system comprising a plurality of nodes that execute a process to be processed and an information processing apparatus that determines a node that executes the process,
Computer
A failure possibility calculating means for calculating a failure possibility for each of the plurality of nodes, and outputting failure possibility data in which the identifier of the node and the calculated failure possibility are associated;
An information processing program for reading out the failure possibility data when a new process target is input and causing the node to be assigned with the new process target to a node with a low possibility of failure.
処理対象の処理を実行するとともに、前記処理を実行するノードを決定する複数の情報処理装置を備える情報処理システムの情報処理装置に用いられる情報処理プログラムであって、
コンピュータを、
前記複数のノードのそれぞれについて故障可能性を算出し、ノードの識別子と算出した故障可能性と、を対応づけた故障可能性データを出力する故障可能性算出手段と、
新たな処理対象が入力されると、前記故障可能性データを読み出して、前記故障可能性の低い情報処理装置に、当該新たな処理対象を割り当てるノード割り当て手段と、
当該情報処理装置に割り当てられた処理対象の処理を実行する処理実行手段
として機能させるための情報処理プログラム。
An information processing program used for an information processing apparatus of an information processing system that includes a plurality of information processing apparatuses that execute a process to be processed and determine a node that executes the process,
Computer
A failure possibility calculating means for calculating a failure possibility for each of the plurality of nodes, and outputting failure possibility data in which the identifier of the node and the calculated failure possibility are associated;
When a new processing target is input, node allocation means for reading the failure possibility data and allocating the new processing target to the information processing apparatus having a low possibility of failure;
An information processing program for functioning as a process execution unit that executes a process to be processed assigned to the information processing apparatus.
JP2011083741A 2011-04-05 2011-04-05 Information processing device and information processing program Withdrawn JP2012221045A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011083741A JP2012221045A (en) 2011-04-05 2011-04-05 Information processing device and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011083741A JP2012221045A (en) 2011-04-05 2011-04-05 Information processing device and information processing program

Publications (1)

Publication Number Publication Date
JP2012221045A true JP2012221045A (en) 2012-11-12

Family

ID=47272537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011083741A Withdrawn JP2012221045A (en) 2011-04-05 2011-04-05 Information processing device and information processing program

Country Status (1)

Country Link
JP (1) JP2012221045A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015170211A (en) * 2014-03-07 2015-09-28 富士通株式会社 Information processing program, information processing method and information processing apparatus
JP2016053781A (en) * 2014-09-03 2016-04-14 日本電信電話株式会社 Dispersion application arrangement system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015170211A (en) * 2014-03-07 2015-09-28 富士通株式会社 Information processing program, information processing method and information processing apparatus
JP2016053781A (en) * 2014-09-03 2016-04-14 日本電信電話株式会社 Dispersion application arrangement system

Similar Documents

Publication Publication Date Title
US9906589B2 (en) Shared management service
US10318279B2 (en) Autonomous upgrade of deployed resources in a distributed computing environment
KR102456900B1 (en) Data analysis system based on edge computing and method thereof
US20190220313A1 (en) Computing system with resource management mechanism and method of operation thereof
US9338928B2 (en) Optimizing free cooling of data centers through weather-based intelligent control
US10627265B2 (en) Sensor assignment apparatus and sensor diagnostic apparatus
US10282272B2 (en) Operation management apparatus and operation management method
US20150261577A1 (en) Controlling placement of virtual machines on physical host machines and placement of physical host machines in cabinets
JP6683920B2 (en) Parallel processing device, power coefficient calculation program, and power coefficient calculation method
US20170054592A1 (en) Allocation of cloud computing resources
US11068317B2 (en) Information processing system and resource allocation method
US20220147021A1 (en) Control system, setting device and setting program
JP6624780B2 (en) Positioning method, server and program
JP2012221045A (en) Information processing device and information processing program
JP2021086604A (en) Method and apparatus for processing service of abnormal server
US20220342676A1 (en) Method and system for a semi-dictatorial determination of stackable system roles in an information handling system
US20220345449A1 (en) Method and system for securely applying a stackable system role to an information handling system
EP4116632A1 (en) Air-conditioning system, management device, air conditioner, sensor data acquisition method, and program
CN114090201A (en) Resource scheduling method, device, equipment and storage medium
US8561075B2 (en) Load balancing servers
JP6237055B2 (en) License management system, apparatus, method and program
US20190361744A1 (en) Information processing apparatus and non-transitory computer-readable recording medium storing control program
KR20200060135A (en) Docker based building energy control point manageemnt
CN110221869B (en) Method and device for configuring data center operating environment
CN111104134B (en) Method and device for updating management unit of programmable device and storage medium

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140701