WO2018168606A1 - 情報処理装置、情報処理方法およびプログラム記録媒体 - Google Patents

情報処理装置、情報処理方法およびプログラム記録媒体 Download PDF

Info

Publication number
WO2018168606A1
WO2018168606A1 PCT/JP2018/008757 JP2018008757W WO2018168606A1 WO 2018168606 A1 WO2018168606 A1 WO 2018168606A1 JP 2018008757 W JP2018008757 W JP 2018008757W WO 2018168606 A1 WO2018168606 A1 WO 2018168606A1
Authority
WO
WIPO (PCT)
Prior art keywords
failure
information processing
sign
hdd
degree
Prior art date
Application number
PCT/JP2018/008757
Other languages
English (en)
French (fr)
Inventor
円 小松原
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Publication of WO2018168606A1 publication Critical patent/WO2018168606A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management

Definitions

  • the present invention relates to an information processing apparatus, an information processing method, and a program recording medium.
  • Patent Document 1 discloses a technique for calculating the number of required maintenance parts from the maintenance part failure rate results and performing maintenance part ordering processing.
  • Patent Document 2 discloses a technique for instructing production of maintenance parts in accordance with a change in the number of failures.
  • Patent Document 3 discloses a technique for detecting a failure or a sign of failure, determining the necessity of maintenance, and temporarily holding a maintenance component when it is determined that maintenance is necessary.
  • Patent Document 4 discloses a technique for arranging necessary maintenance parts based on an estimated predicted time until failure of a part in which a failure sign is detected.
  • An object of the present invention is to provide a technique for solving the above-described problems.
  • an information processing apparatus provides: A sign detection means for detecting a sign of a device failure; When the sign detection unit detects the sign, a failure degree determination unit that determines a degree of failure of the device; Necessity determining means for determining whether or not it is necessary to arrange spare parts of the device based on the determined degree of failure; Equipped with.
  • an information processing method includes: A predictive detection step for detecting a predictive failure of the device; In the sign detection step, when the sign is detected, a failure degree determination step of determining a degree of failure of the device; A necessity determination step for determining whether or not it is necessary to arrange spare parts for the device based on the determined failure degree; including.
  • a program recording medium provides: A predictive detection step for detecting a predictive failure of the device; In the sign detection step, when the sign is detected, a failure degree determination step of determining a degree of failure of the device; A necessity determination step for determining whether or not it is necessary to arrange spare parts for the device based on the determined failure degree; An information processing program for causing a computer to execute is recorded.
  • the information processing apparatus 100 is an apparatus that arranges spare parts by detecting a sign of a device failure.
  • the information processing apparatus 100 includes a sign detection unit 101, a failure degree determination unit 102, and a necessity determination unit 103.
  • the sign detection unit 101 detects a sign of a device failure.
  • the degree-of-failure determination unit 102 determines the degree of device failure.
  • the necessity determination unit 103 determines whether it is necessary to arrange a spare part of the device based on the determined degree of failure.
  • FIG. 2 is a flowchart for explaining a spare part arrangement processing procedure in the prerequisite technology of the information processing apparatus 300 according to the present embodiment.
  • FIG. 2 shows a spare part management flow at the time of a general HDD failure such as sendback repair.
  • step S201 a failure occurs in the HDD of the apparatus.
  • step S203 after an HDD failure occurs, the stock HDD is replaced.
  • step S205 since the inventory of spare HDDs is exhausted in step S203, a spare HDD is ordered.
  • step S207 delivery of the ordered spare HDD is awaited.
  • step S209 the spare HDD is delivered and the spare HDD is completely replenished.
  • FIG. 3 is a block diagram illustrating a configuration of the information processing apparatus 300 according to the present embodiment.
  • the information processing apparatus 300 includes a sign detection unit 301, a failure degree determination unit 302, an alternative device presence / absence determination unit 303, an application type determination unit 304, and a necessity determination unit 305.
  • the sign detection unit 301 detects a sign of an HDD failure.
  • the sign detection unit 301 is, for example, an S.E. M.M. A. R. T.A.
  • a self-diagnosis function such as a (Self-Monitoring, Analysis and Reporting Technology) function is used to detect a sign of an HDD failure.
  • This SMART function performs self-diagnosis of the state of the HDD in real time and records the diagnosis result in numerical form.
  • Items diagnosed by the SMART function include, for example, the current temperature of the HDD, the number of times the HDD is turned on or off, and the like. Based on these diagnostic items, the sign detection unit 301 detects a sign before a failure or failure actually occurs in the HDD. The sign detection is performed by, for example, the sign detection unit 301 monitoring the numerical values of these diagnostic items.
  • the failure degree determination unit 302 determines the degree of failure or failure that may occur due to the sign.
  • the degree of failure or failure is, for example, high urgency or low urgency, but is not limited thereto.
  • a highly urgent failure or failure is a failure or failure that needs to be quickly recovered, and a less urgent failure or failure does not need to be recovered immediately, but in the near future. A failure or failure that needs to be restored.
  • the alternative device presence / absence determination unit 303 determines whether there is an alternative device in the device in which a failure or a failure sign is detected. For example, the alternative device presence / absence determining unit 303 determines whether there is a redundant HDD (redundant HDD) or a redundant server (redundant server) for the HDD in which the failure sign is detected. .
  • a redundant HDD redundant HDD
  • a redundant server redundant server
  • the failure level determination unit 302 determines that the failure is less urgent. When there is no redundant HDD or redundant server, the failure level determination unit 302 determines that the failure level is urgent. judge.
  • the failure degree determination unit 302 determines that the degree of failure is a highly urgent failure. To do.
  • the application type determination unit 304 determines, for example, whether an application stored and executed in the HDD is an application that requires high reliability or an application that does not require high reliability. Then, the application type determination unit 304 determines, for example, the type of application as a high-reliability application that requires high reliability and a type that does not require high reliability as a low-reliability application.
  • the necessity determination unit 305 determines whether it is necessary to arrange spare parts for the HDD in which the sign of the failure is detected based on the determined failure level, presence / absence of an alternative device, application type, and the like. For example, the necessity determination unit 305 determines that it is necessary to prepare a spare part of the HDD in which a failure sign is detected when the failure level determined by the failure level determination unit 302 is a highly urgent failure level. To do.
  • the necessity determination unit 305 determines whether there is a spare part regardless of the determination result of the degree of failure, that is, whether the failure is highly urgent or less urgent. Judge that arrangement is necessary.
  • the application reliability Arrange spare parts to ensure safety. Arrangement of spare parts is performed by, for example, a method of ordering spare parts from a dealer or entrusting the production of spare parts, but is not limited thereto.
  • FIG. 4 is a diagram illustrating an example of the device management table 401 included in the information processing apparatus 300 according to the present embodiment.
  • the device management table 401 stores an alternative device 412, a failure level 413, an application type 414, and an arrangement 415 in association with the device ID (Identifier) 411.
  • the device ID 411 is an identifier for identifying a device such as an HDD to be monitored by the information processing apparatus 300. For example, a unique value is assigned to each device.
  • the substitute device 412 indicates whether there is a substitute device for a device such as an HDD in which a failure sign is detected.
  • the substitute device 412 is information regarding whether a redundant HDD or a redundant server exists.
  • the failure degree 413 indicates whether or not the failure that is expected to occur with the detected failure sign is a failure that needs to be dealt with immediately.
  • the failure degree is high or the failure is low. Classified into degree.
  • the failure degree 413 is not limited to the method of classifying according to the level of urgency, and may be classified according to rank or numerical value.
  • the application type 414 indicates whether the application recorded and executed in the HDD is a high-reliability application that requires high reliability or a low-reliability application that does not require high reliability. is there. Note that the type of application is not limited to the method of classifying according to the level of reliability. For example, the reliability may be classified by rank or numerical value.
  • the arrangement 415 indicates whether or not it is necessary to arrange a spare part of the HDD in which the failure sign is detected.
  • the information processing apparatus 300 refers to the device management table 401 and determines whether or not it is necessary to arrange spare parts.
  • FIG. 5 is a block diagram illustrating a hardware configuration of the information processing apparatus 300 included in the information processing system according to the present embodiment.
  • a CPU (Central Processing Unit) 510 is a processor for arithmetic control, and implements a functional component of the information processing apparatus 300 in FIG. 3 by executing a program.
  • the CPU 510 may include a plurality of processors and execute different programs, modules, tasks, threads, and the like in parallel.
  • a ROM (Read Only Memory) 520 stores fixed data such as initial data and programs and other programs.
  • the network interface 530 communicates with other devices via the network. Note that the number of CPUs 510 is not limited to one, and a plurality of CPUs may be included, or a GPU (Graphics Processing Unit) for image processing may be included.
  • GPU Graphics Processing Unit
  • the network interface 530 preferably includes a CPU independent of the CPU 510 and writes or reads transmission / reception data in a RAM (Random Access Memory) 540 area. Also, it is desirable to provide a DMAC (Direct Memory Access Controller) that transfers data between the RAM 540 and the storage 550 (not shown). Furthermore, the input / output interface 560 preferably has a CPU independent of the CPU 510 and writes or reads input / output data in the RAM 540 area. Therefore, the CPU 510 recognizes that the data has been received or transferred to the RAM 540 and processes the data. Further, the CPU 510 prepares the processing result in the RAM 540 and leaves the subsequent transmission or transfer to the network interface 530, the DMAC, or the input / output interface 560.
  • a CPU independent of the CPU 510 and writes or reads transmission / reception data in a RAM (Random Access Memory) 540 area.
  • DMAC Direct Memory Access Controller
  • the RAM 540 is a random access memory used by the CPU 510 as a temporary storage work area. In the RAM 540, an area for storing data necessary for realizing the present embodiment is secured.
  • the device ID 541 is an identifier that identifies a device to be monitored by the information processing apparatus 300.
  • the substitute device 542 is information regarding a redundant device when a replaceable device exists, for example, when a device having redundancy exists, for a device for which a failure sign is detected.
  • the failure degree 543 is information indicating the degree of failure.
  • the application type 544 indicates whether the application being executed is an application that requires high reliability or an application that does not require high reliability.
  • the necessity for arrangement 545 indicates whether it is necessary to arrange spare parts. These data are expanded from the device management table 401, for example.
  • the input / output data 546 is data input / output via the input / output interface 560.
  • Transmission / reception data 547 is data transmitted / received via the network interface 530.
  • the RAM 540 includes an application execution area 548 for executing various application modules.
  • the storage 550 stores a database, various parameters, or the following data or programs necessary for realizing the present embodiment.
  • the storage 550 stores a device management table 401.
  • the device management table 401 is a table for managing the relationship between the device ID 411 and the arrangement 415 shown in FIG.
  • the storage 550 further stores a sign detection module 551, a failure degree determination module 552, an alternative device presence / absence determination module 553, an application type determination module 554, and a necessity determination module 555.
  • the sign detection module 551 is a module that detects a sign of a device failure.
  • the failure degree determination module 552 is a module for determining the type of device failure.
  • the alternative device presence / absence determination module 553 is a module that determines whether there is an alternative device.
  • the application type determination module 554 determines the type of application being executed.
  • the necessity determination module 555 is a module that determines whether or not it is necessary to arrange spare parts based on the determined degree of failure, application type, and the like. These modules 551 to 555 are read by the CPU 510 into the application execution area 548 of the RAM 540 and executed.
  • the control program 556 is a program for controlling the entire information processing apparatus 300.
  • the input / output interface 560 interfaces input / output data with input / output devices.
  • a display unit 561 and an operation unit 562 are connected to the input / output interface 560.
  • a storage medium 564 may be further connected to the input / output interface 560.
  • a speaker 563 that is an audio output unit, a microphone (not shown) that is an audio input unit, or a GPS position determination unit may be connected.
  • the RAM 540 and the storage 550 shown in FIG. 5 do not show programs and data related to general-purpose functions and other realizable functions that the information processing apparatus 300 has.
  • FIG. 6 is a flowchart for explaining the processing procedure of the information processing apparatus 300 according to the present embodiment. This flowchart is executed by the CPU 510 of FIG. 5 using the RAM 540, and implements the functional components of the information processing apparatus 300 of FIG.
  • step S601 the information processing apparatus 300 determines whether or not a sign of a device failure has been detected. When the failure sign of the device is not detected (NO in step S601), the information processing apparatus 300 waits for the detection of the trouble sign. If a failure sign of the device is detected (YES in step S601), the information processing apparatus 300 proceeds to the next step S603.
  • step S603 the information processing apparatus 300 determines whether there is an alternative device. When there is an alternative device (YES in step S603), the information processing apparatus 300 waits for detection of a failure sign. If there is no alternative device (NO in step S603), the information processing apparatus 300 proceeds to the next step S605.
  • step S605 the information processing apparatus 300 determines whether the type of application being executed, for example, the reliability required for the application is high. When the application is not a high-reliability application (NO in step S605), the information processing apparatus 300 waits for detection of a failure sign. If the application is a highly reliable application (YES in step S605), the information processing apparatus 300 proceeds to the next step S607.
  • step S607 the information processing apparatus 300 arranges a spare part of the device in which the failure sign is detected.
  • the necessary spare parts have already been replenished.
  • the necessary spare parts have been replenished, so that the risk of spare part exhaustion can be reduced.
  • FIG. 7 is a diagram for explaining the configuration of the information processing apparatus according to the present embodiment.
  • the information processing apparatus according to the present embodiment is different from the second embodiment in that it includes a device reliability determination unit. Since other configurations and operations are the same as those of the second embodiment, the same configurations and operations are denoted by the same reference numerals, and detailed description thereof is omitted.
  • the information processing apparatus 700 includes a device reliability determination unit 701.
  • the device reliability determination unit 701 determines whether a device such as an HDD that has detected a failure sign is a device that requires reliability. For example, when the data or application recorded in the HDD is important data or application, the device reliability determination unit 701 determines that the device requires reliability.
  • the necessity determination unit 305 determines that a spare part needs to be arranged regardless of the determination result of the degree of failure. That is, even if the failure level is low in urgency, if the device is a device that requires reliability, the necessity determination unit 305 determines that a spare part needs to be arranged.
  • FIG. 8 is a diagram illustrating an example of a device management table 801 included in the information processing apparatus 700 according to the present embodiment.
  • the device management table 801 stores device reliability 811 in association with the device ID 411.
  • the device reliability 811 indicates whether the device in which the failure sign is detected is a device that requires reliability.
  • the information processing apparatus 700 refers to the device management table 801 and determines whether or not it is necessary to arrange spare parts.
  • FIG. 9 is a block diagram illustrating a hardware configuration of the information processing apparatus 700 according to the present embodiment.
  • the RAM 940 is a random access memory used by the CPU 510 as a temporary storage work area. In the RAM 940, an area for storing data necessary for realizing the present embodiment is secured.
  • the device reliability 941 is data indicating whether or not the device in which the failure sign is detected is a device that requires reliability. This data is expanded from the device management table 801, for example.
  • the storage 950 stores a database, various parameters, or the following data or programs necessary for realizing the present embodiment.
  • the storage 950 stores a device management table 801.
  • the device management table 801 is a table for managing the relationship between the device ID 411 and the device reliability 941 shown in FIG.
  • the storage 950 further stores a device reliability determination module 951.
  • the device reliability determination module 951 is a module that determines whether or not a device in which a failure sign is detected is a device that requires reliability.
  • the module 951 is read by the CPU 510 into the application execution area 548 of the RAM 540 and executed.
  • FIG. 10 is a flowchart for explaining the processing procedure of the information processing apparatus 700 according to this embodiment. This flowchart is executed by the CPU 510 in FIG. 9 using the RAM 540, and implements the functional components of the information processing apparatus 700 in FIG.
  • step S1001 the information processing apparatus 700 determines whether the device in which the failure sign is detected is a device that requires reliability. If the device does not require reliability (NO in step S1001), the information processing apparatus 700 returns to step S601. If the device is required to be reliable (YES in step S1001), the information processing apparatus 700 proceeds to step S607.
  • a device in which a failure sign is detected is a device that requires reliability
  • spare parts are arranged based on the degree of failure and the reliability of the device. Can contribute to the stable operation of the system.
  • FIG. 11 is a diagram for explaining a configuration of a spare part management system according to the present embodiment.
  • the spare part management system according to the present embodiment is different from the second and third embodiments in that it has a machine room, a server, a management server, and a parts sales site.
  • the spare part management system 1100 includes a machine room 1110, a server 1120, a management server 1130, and a parts sales site 1140.
  • the server 1120 has an HDD 1121, and a plurality of servers 1120 are installed in the machine room 1110. In the machine room 1110, a certain number of spare HDDs 1111 are placed as stock.
  • the management server 1130 includes an HDD redundancy configuration management device 1131, a server redundancy configuration management device 1132, and an APL (Application) type management function 1133.
  • the management server 1130 collects HDD failure sign information (SMART) 1123 from each server 1120.
  • the management server 1130 includes an HDD redundancy configuration management device 1131 that manages HDD redundancy configuration information, a server redundancy configuration management device 1132 that manages server redundancy configuration information, and an APL type management function 1133 that manages application types.
  • the APL type management function 1133 manages whether the application is a mission critical system.
  • the HDD redundant configuration management device 1131, the server redundant configuration management device 1132, and the APL type management function 1133 information necessary for system construction is registered.
  • the HDD redundancy configuration management device 1131 When the management server 1130 receives HDD failure sign occurrence information, the HDD redundancy configuration management device 1131 first checks whether a redundant HDD exists in the corresponding HDD. Then, the HDD redundant configuration management device 1131 determines that it is a low risk failure sign when there is a redundant HDD. Also, the HDD redundant configuration management device 1131 determines that a high-risk failure sign is present when there is no redundant HDD.
  • the server redundancy configuration management device 1132 confirms whether there is a redundancy server in the server 1120 on which the corresponding HDD is mounted.
  • the server redundant configuration management device 1132 changes the determination to a low risk failure sign even if the HDD redundant configuration management device 1131 determines that the risk predicts a high risk failure.
  • the management server 1130 automatically performs the parts sales site 1140. To access. Then, the management server 1130 places an order for spare HDD (order for replacement member) 1134 and replenishes the spare HDD 1111.
  • the APL type management function 1133 checks the application type. . In the case of a mission critical HDD that requires high reliability, it is determined that a spare HDD 1111 is necessary, and the management server 1130 automatically accesses the parts sales site 1140 and places an order for a replacement member (spare HDD 1111). I do.
  • the parts sales site 1140 includes an order management unit 1141, a shipping unit 1142, and an inventory management unit 1143.
  • the order management unit 1141 manages the order (1134) of the spare HDD from the management server 1130.
  • the dispatch unit 1142 dispatches the ordered spare HDD and delivers it (1144).
  • the inventory management unit 1143 monitors the inventory of the spare HDD 1111 placed in the machine room 1110 (1145).
  • FIG. 12 is a flowchart for explaining the processing procedure of the management server of the spare part management system according to this embodiment.
  • the management server 1130 detects a failure sign of the HDD 1121 of the server 1120.
  • the HDD has SMART information indicating a failure sign, and the SMART information is used to monitor the sign before an actual failure.
  • step S1203 the management server 1130 determines whether there is a redundant HDD. In step S1205, the management server 1130 determines whether there is a redundant server. In step S1207, the type of application is determined. In step S1209, the management server 1130 determines whether it is necessary to place an order for the spare HDD based on whether there are other redundant devices. For example, when there are other redundant devices, the management server 1130 determines that the urgency is low, and does not place an order for the spare HDD (no need for step S1209).
  • step S1211 the management server 1130 performs an advance order for a spare HDD. .
  • step S1213 the management server 1130 waits for delivery of the ordered spare HDD.
  • step S1215 when the spare HDD is delivered, the management server 1130 performs an additional supplement process for the spare HDD.
  • step S ⁇ b> 1217 the management server 1130 detects the occurrence of a failure in the HDD 1121, not a sign of a failure in the HDD 1121.
  • step S1219 when the HDD has been replaced, the management server 1130 executes the HDD replacement process, and executes the stock removal process of the spare HDD 1111.
  • the management server 1130 replenishes the spare HDD 1111 according to the redundant configuration environment and the application type before the HDD 1121 actually fails.
  • the necessary spare HDD is already replenished, and the risk of the spare parts being exhausted can be reduced.
  • the present invention may be applied to a system composed of a plurality of devices, or may be applied to a single device. Furthermore, the present invention can also be applied to a case where an information processing program that implements the functions of the embodiments is supplied directly or remotely to a system or apparatus. Therefore, in order to realize the functions of the present invention on a computer, a program installed on the computer, a medium storing the program, and a WWW (World Wide Web) server that downloads the program are also included in the scope of the present invention. . In particular, at least a non-transitory computer readable medium storing a program for causing a computer to execute the processing steps included in the above-described embodiments is included in the scope of the present invention.

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Hardware Redundancy (AREA)

Abstract

システムの安定運用に貢献すること。 情報処理装置であって、予兆検出部と、障害程度判定部と、要否判断部と、を備えている。そして、情報処理装置の予兆検出部は、デバイスの障害の予兆を検出する。情報処理装置の障害程度判定部は、予兆検出部により、予兆を検出した場合、デバイスの障害の程度を判定する。情報処理装置の要否判断部は、判定された障害程度に基づいて、デバイスの予備品の手配の要否を判断する。

Description

情報処理装置、情報処理方法およびプログラム記録媒体
 本発明は、情報処理装置、情報処理方法およびプログラム記録媒体に関する。
 上記技術分野において、特許文献1には、保守部品別障害率実績から保守部品所要数を算出して、保守部品の発注処理を行う技術が開示されている。特許文献2には、故障件数の変化に応じて保守部品の生産を指示する技術が開示されている。特許文献3には、障害または障害の予兆を検出し、保守の必要性を判定し、保守が必要であると判定すると、保守部品を仮押さえする技術が開示されている。特許文献4には、故障予兆が検出された部品の故障までの想定予測時間に基づいて、必要な保守部品を手配する技術が開示されている。
特開2007-34771号公報 特開2007-86908号公報 特開2011-213453号公報 特開2014-2660号公報
 しかしながら、上記文献に記載の技術では、システムの安定運用に貢献することができなかった。
 本発明の目的は、上述の課題を解決する技術を提供することにある。
 上記目的を達成するため、本発明に係る情報処理装置は、
 デバイスの障害の予兆を検出する予兆検出手段と、
 前記予兆検出手段により、前記予兆を検出した場合、前記デバイスの障害の程度を判定する障害程度判定手段と、
 判定された障害程度に基づいて、前記デバイスの予備品の手配の要否を判断する要否判断手段と、
 を備えた。
 上記目的を達成するため、本発明に係る情報処理方法は、
 デバイスの障害の予兆を検出する予兆検出ステップと、
 前記予兆検出ステップにおいて、前記予兆を検出した場合、前記デバイスの障害の程度を判定する障害程度判定ステップと、
 判定された障害程度に基づいて、前記デバイスの予備品の手配の要否を判断する要否判断ステップと、
 を含む。
 上記目的を達成するため、本発明に係るプログラム記録媒体は、
 デバイスの障害の予兆を検出する予兆検出ステップと、
 前記予兆検出ステップにおいて、前記予兆を検出した場合、前記デバイスの障害の程度を判定する障害程度判定ステップと、
 判定された障害程度に基づいて、前記デバイスの予備品の手配の要否を判断する要否判断ステップと、
 をコンピュータに実行させる情報処理プログラムを記録する。
 本発明によれば、システムの安定運用に貢献することができる。
本発明の第1実施形態に係る情報処理装置の構成を示すブロック図である。 本発明の第2実施形態に係る情報処理装置の前提技術における予備品手配の処理手順を説明するフローチャートである。 本発明の第2実施形態に係る情報処理装置の構成を示すブロック図である。 本発明の第2実施形態に係る情報処理装置の備えるデバイス管理テーブルの一例を示す図である。 本発明の第2実施形態に係る情報処理装置のハードウェア構成を示すブロック図である。 本発明の第2実施形態に係る情報処理装置の処理手順を説明するフローチャートである。 本発明の第3実施形態に係る情報処理装置の構成を示すブロック図である。 本発明の第3実施形態に係る情報処理装置の備えるデバイス管理テーブルの一例を示す図である。 本発明の第3実施形態に係る情報処理装置のハードウェア構成を示すブロック図である。 本発明の第3実施形態に係る情報処理装置の処理手順を説明するフローチャートである。 本発明の第4実施形態に係る予備品管理システムの構成を示すブロック図である。 本発明の第4実施形態に係る予備品管理システムの管理サーバの処理手順を説明するフローチャートである。
 以下に、本発明を実施するための形態について、図面を参照して、例示的に詳しく説明記載する。ただし、以下の実施の形態に記載されている、構成、数値、処理の流れ、機能要素などは一例に過ぎず、その変形や変更は自由であって、本発明の技術範囲を以下の記載に限定する趣旨のものではない。
 [第1実施形態]
 本発明の第1実施形態としての情報処理装置100について、図1を用いて説明する。
情報処理装置100は、デバイスの障害の予兆を検出して予備品の手配を行う装置である。
 図1に示すように、情報処理装置100は、予兆検出部101と、障害程度判定部102と、要否判断部103と、を含む。予兆検出部101は、デバイスの障害の予兆を検出する。障害程度判定部102は、予兆検出部101により、予兆を検出した場合、デバイスの障害の程度を判定する。要否判断部103は、判定された障害程度に基づいて、デバイスの予備品の手配の要否を判断する。
 本実施形態によれば、システムの安定運用に貢献することができる。
 [第2実施形態]
 次に本発明の第2実施形態に係る情報処理装置300について、図2乃至6を用いて説明する。なお、以下の説明では、障害の予兆を検出するデバイスとして、HDD(Hard Disk Drive)を例に説明をする。図2は、本実施形態に係る情報処理装置300の前提技術における予備品手配の処理手順を説明するフローチャートである。図2は、センドバック修理のような一般的なHDD故障時の予備品管理フローを示している。
 ステップS201において、装置のHDDに故障が発生する。ステップS203において、HDD故障発生後、在庫のHDDで交換を行う。ステップS205において、ステップS203で予備品であるHDDの在庫を消化したので、予備用のHDDを発注する。ステップS207において、発注した予備用HDDの納品を待つ。ステップS209において、予備用HDDが納品され、予備用HDDの補充が完了する。
 しかしながら、このような予備品管理フローでは、納品待ちの期間に他のHDDの故障が重なると、予備用HDDの不足により故障したHDDの交換ができなくなるというリスクがあった。また、システムを運用する側としては、故障したHDDの交換をするために、最低限の数のHDDの在庫を保有しておかなければならず、一般的なHDD販売フローである先払いモデルでは、初期コストが発生していた。
 図3は、本実施形態に係る情報処理装置300の構成を示すブロック図である。情報処理装置300は、予兆検出部301と、障害程度判定部302と、代替デバイス有無判断部303と、アプリケーション種別判定部304と、要否判断部305と、を備える。
 予兆検出部301は、HDDの障害の予兆を検出する。予兆検出部301は、例えば、HDDに搭載されているS.M.A.R.T.(Self-Monitoring, Analysis and Reporting Technology)機能などの自己診断機能を利用して、HDDの障害の予兆を検出する。
このSMART機能は、HDDの状態をリアルタイムで自己診断し、診断結果を数値化するなどして記録する。
 SMART機能により診断される項目は、例えば、HDDの現在の温度や、HDDの電源をONまたはOFFした回数などである。そして、予兆検出部301は、これらの診断項目に基づいて、実際にHDDに故障や障害が発生する前の予兆を検出する。予兆の検出は、例えば、予兆検出部301が、これらの診断項目の数値を監視することにより行われる。
 障害程度判定部302は、予兆検出部301が予兆を検出した場合、その予兆により発生する可能性のある故障や障害の程度を判定する。故障や障害の程度は、例えば、緊急性の高いものか、または、緊急性の低いものかであるが、これらには限定されない。ここで、緊急性の高い故障や障害は、故障や障害を早急に復旧させる必要のある故障や障害であり、緊急性の低い故障や障害は、早急に復旧させる必要はないが、近い将来に復旧させる必要のある故障や障害である。
 代替デバイス有無判断部303は、故障や障害の予兆が検出されたデバイスに代替デバイスがあるか否かを判断する。例えば、代替デバイス有無判断部303は、障害予兆が検出されたHDDについて、冗長性を有するHDD(冗長HDD)が存在するか、冗長性を有するサーバ(冗長サーバ)が存在するかなどを判断する。
 そして、冗長HDDや冗長サーバが存在する場合、障害程度判定部302は、緊急性の低い障害と判定し、冗長HDDや冗長サーバが存在しない場合、障害程度判定部302は、緊急性の障害と判定する。
 このように、代替デバイスがある場合、予兆が検出されたデバイスに障害などが発生しても、一定期間は代替デバイスにより、発生した障害に対処することができるので、障害程度判定部302は、障害の程度を緊急性の低い障害と判定する。一方、代替デバイスがない場合、発生した障害に対処することができず、システムの運用が停止する可能性が高くなるので、障害程度判定部302は、障害の程度を緊急性の高い障害と判定する。
 アプリケーション種別判定部304は、例えば、HDDに記憶され、実行されているアプリケーションが高い信頼性を必要とするアプリケーションであるのか、高い信頼性を必要としないアプリケーションであるのかを判定する。そして、アプリケーション種別判定部304は、例えば、アプリケーションの種別として、高い信頼性が要求されるアプリケーションを高信頼性アプリケーション、高い信頼性が要求されないアプリケーションを低信頼性アプリケーションなどとして種別を判定する。
 要否判断部305は、判定された障害程度や、代替デバイスの有無、アプリケーション種別などに基づいて、障害の予兆が検知されたHDDの予備品の手配の要否を判断する。
要否判断部305は、例えば、障害程度判定部302が判定した障害程度が、緊急性の高い障害程度の場合に、障害の予兆が検知されたHDDの予備品の手配が必要であると判断する。
 また、要否判断部305は、例えば、アプリケーション種別が高信頼性アプリケーションである場合は、障害程度の判定結果、すなわち、緊急性の高い障害か緊急性の低い障害かにかかわらず、予備品の手配が必要であると判断する。つまり、例えば、HDDに記録され、実行されているアプリケーションが、高い信頼性を要求されるアプリケーションである場合、HDDの障害予兆が、緊急性を要求される障害予兆でなくても、アプリケーションの信頼性を確保するために、予備品の手配を行う。予備品の手配は、例えば、販売店に予備品の発注を行ったり、予備品の製造を委託したりするなどの方法で行われるが、これらには限定されない。
 図4は、本実施形態に係る情報処理装置300の備えるデバイス管理テーブル401の一例を示す図である。デバイス管理テーブル401は、デバイスID(Identifier)411に関連付けて、代替デバイス412、障害程度413、アプリケーション種別414および手配415を記憶する。
 デバイスID411は、情報処理装置300が監視対象とするHDDなどのデバイスを識別する識別子であり、例えば、各デバイスに一意の値が割り当てられる。
 代替デバイス412は、障害予兆が検知されたHDDなどのデバイスに代替するデバイスがあるか否かを示すものであり、例えば、冗長HDDや冗長サーバが存在するか否かに関する情報である。
 障害程度413は、検知された障害予兆で発生が予想される障害が、早急に対処しなければならない障害か否かを示すものであり、緊急性の高い障害程度、または、緊急性の低い障害程度に分類される。なお、障害程度413は、緊急性の高低で分類する方法には限定されず、ランク別に分類してもよいし、数値別に分類してもよい。
 アプリケーション種別414は、HDDに記録され、実行されるアプリケーションが高い信頼性を要求されるアプリケーションである高信頼性アプリケーションか、高い信頼性を要求されないアプリケーションである低信頼性アプリケーションか、を示すものである。なお、アプリケーションの種別は、信頼性の高低で分類する方法には限定されず、例えば、信頼性をランクや数値で分類してもよい。手配415は、障害予兆を検出されたHDDの予備品の手配が必要か否かを示すものである。情報処理装置300は、例えば、デバイス管理テーブル401を参照して、予備品の手配が必要か否かを判断する。
 図5は、本実施形態に係る情報処理システムに含まれる情報処理装置300のハードウェア構成を説明するブロック図である。CPU(Central Processing Unit)510は、演算制御用のプロセッサであり、プログラムを実行することで図3の情報処理装置300の機能構成部を実現する。CPU510は複数のプロセッサを有し、異なるプログラムやモジュール、タスク、スレッドなどを並行して実行してもよい。ROM(Read Only Memory)520は、初期データおよびプログラムなどの固定データおよびその他のプログラムを記憶する。また、ネットワークインタフェース530は、ネットワークを介して他の装置などと通信する。なお、CPU510は1つに限定されず、複数のCPUであっても、あるいは画像処理用のGPU(Graphics Processing Unit)を含んでもよい。また、ネットワークインタフェース530は、CPU510とは独立したCPUを有して、RAM(Random Access Memory)540の領域に送受信データを書き込みあるいは読み出しするのが望ましい。また、RAM540とストレージ550との間でデータを転送するDMAC(Direct Memory Access Controller)を設けるのが望ましい(図示なし)。さらに、入出力インタフェース560は、CPU510とは独立したCPUを有して、RAM540の領域に入出力データを書き込みあるいは読み出しするのが望ましい。したがって、CPU510は、RAM540にデータが受信あるいは転送されたことを認識してデータを処理する。また、CPU510は、処理結果をRAM540に準備し、後の送信あるいは転送はネットワークインタフェース530やDMAC、あるいは入出力インタフェース560に任せる。
 RAM540は、CPU510が一時記憶のワークエリアとして使用するランダムアクセスメモリである。RAM540には、本実施形態の実現に必要なデータを記憶する領域が確保されている。デバイスID541は、情報処理装置300が監視対象とするデバイスを識別する識別子である。代替デバイス542は、障害予兆を検出されたデバイスについて、代替可能なデバイスが存在する場合、例えば、冗長性を有するデバイスなどが存在する場合の、冗長デバイスに関する情報である。障害程度543は、障害の程度を示す情報である。アプリケーション種別544は、実行されているアプリケーションが高信頼性が要求されるアプリケーションか、高信頼性が要求されないアプリケーションかを示すものである。手配要否545は、予備品の手配が必要か否かを示すものである。これらのデータは、例えば、デバイス管理テーブル401から展開される。
 入出力データ546は、入出力インタフェース560を介して入出力されるデータである。送受信データ547は、ネットワークインタフェース530を介して送受信されるデータである。また、RAM540は、各種アプリケーションモジュールを実行するためのアプリケーション実行領域548を有する。
 ストレージ550には、データベースや各種のパラメータ、あるいは本実施形態の実現に必要な以下のデータまたはプログラムが記憶されている。ストレージ550は、デバイス管理テーブル401を格納する。デバイス管理テーブル401は、図4に示した、デバイスID411と、手配415などとの関係を管理するテーブルである。
 ストレージ550は、さらに、予兆検出モジュール551、障害程度判定モジュール552、代替デバイス有無判断モジュール553、アプリケーション種別判定モジュール554および要否判断モジュール555を格納する。
 予兆検出モジュール551は、デバイスの障害の予兆を検出するモジュールである。障害程度判定モジュール552は、デバイスの障害の種別を判定するモジュールである。代替デバイス有無判断モジュール553は、代替デバイスが存在するか否かを判断するモジュールである。アプリケーション種別判定モジュール554は、実行されているアプリケーションの種別を判定する。要否判断モジュール555は、判定された障害程度や、アプリケーション種別などに基づいて、予備品の手配の要否を判断するモジュールである。これらのモジュール551~555は、CPU510によりRAM540のアプリケーション実行領域548に読み出され、実行される。制御プログラム556は、情報処理装置300の全体を制御するためのプログラムである。
 入出力インタフェース560は、入出力機器との入出力データをインタフェースする。
入出力インタフェース560には、表示部561、操作部562、が接続される。また、入出力インタフェース560には、さらに、記憶媒体564が接続されてもよい。さらに、音声出力部であるスピーカ563や、音声入力部であるマイク(図示せず)、あるいは、GPS位置判定部が接続されてもよい。なお、図5に示したRAM540やストレージ550には、情報処理装置300が有する汎用の機能や他の実現可能な機能に関するプログラムやデータは図示されていない。
 図6は、本実施形態に係る情報処理装置300の処理手順を説明するフローチャートである。このフローチャートは、図5のCPU510がRAM540を使用して実行し、図3の情報処理装置300の機能構成部を実現する。
 ステップS601において、情報処理装置300は、デバイスの障害の予兆を検出したか否かを判断する。デバイスの障害予兆を検出していない場合(ステップS601のNO)、情報処理装置300は、障害予兆の検出を待機する。デバイスの障害予兆を検出した場合(ステップS601のYES)、情報処理装置300は、次のステップS603に進む。
 ステップS603において、情報処理装置300は、代替デバイスが存在するか否かを判断する。代替デバイスが存在する場合(ステップS603のYES)、情報処理装置300は、障害予兆の検出を待機する。代替デバイスが存在しない場合(ステップS603のNO)、情報処理装置300は、次のステップS605に進む。
 ステップS605において、情報処理装置300は、実行されているアプリケーションの種別、例えば、アプリケーションに要求される信頼性が高いか否かを判断する。アプリケーションが高信頼性アプリケーションではない場合(ステップS605のNO)、情報処理装置300は、障害予兆の検出を待機する。アプリケーションが高信頼性アプリケーションである場合(ステップS605のYES)、情報処理装置300は、次のステップS607に進む。
 ステップS607において、情報処理装置300は、障害予兆を検出されたデバイスの予備品を手配する。
 本実施形態によれば、実際にデバイスに障害が発生する前に、冗長性を有する代替デバイスの存在の有無や、アプリケーション種別を判定して、予備品を手配するので、デバイスに障害が発生した場合には、既に必要な予備品の補充が完了している。また、デバイスの障害が発生した場合には、必要な予備品の補充が完了しているので、予備品枯渇のリスクを低減することができる。
 [第3実施形態]
 次に本発明の第3実施形態に係る情報処理装置について、図7乃至10を用いて説明する。図7は、本実施形態に係る情報処理装置の構成を説明するための図である。本実施形態に係る情報処理装置は、上記第2実施形態と比べると、デバイス信頼性判定部を有する点で異なる。その他の構成および動作は、第2実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。
 情報処理装置700は、デバイス信頼性判定部701を有する。デバイス信頼性判定部701は、障害の予兆を検出されたHDDなどのデバイスが、信頼性が要求されるデバイスか否かを判定する。例えば、HDDに記録されているデータや、アプリケーションなどが、重要なデータやアプリケーションなどである場合に、デバイス信頼性判定部701は、信頼性が要求されるデバイスであると判断する。
 そして、要否判断部305は、信頼性が要求されるデバイスと判断された場合、障害程度の判定結果に関わらず、予備品の手配が必要と判断する。つまり、緊急性の低い障害程度であったとしても、デバイスが信頼性の要求されるデバイスであれば、要否判断部305は、予備品の手配が必要と判断する。
 図8は、本実施形態に係る情報処理装置700の備えるデバイス管理テーブル801の一例を示す図である。デバイス管理テーブル801は、デバイスID411に関連付けて、デバイス信頼性811を記憶する。デバイス信頼性811は、障害予兆が検出されたデバイスが、信頼性の要求されるデバイスか否かを示す。情報処理装置700は、例えば、デバイス管理テーブル801を参照して、予備品の手配が必要か否かを判断する。
 図9は、本実施形態に係る情報処理装置700のハードウェア構成を示すブロック図である。
 RAM940は、CPU510が一時記憶のワークエリアとして使用するランダムアクセスメモリである。RAM940には、本実施形態の実現に必要なデータを記憶する領域が確保されている。デバイス信頼性941は、障害予兆が検出されたデバイスが、信頼性の要求されるデバイスであるか否かを示すデータである。このデータは、例えば、デバイス管理テーブル801から展開される。
 ストレージ950には、データベースや各種のパラメータ、あるいは本実施形態の実現に必要な以下のデータまたはプログラムが記憶されている。ストレージ950は、デバイス管理テーブル801を格納する。デバイス管理テーブル801は、図8に示した、デバイスID411と、デバイス信頼性941などとの関係を管理するテーブルである。
 ストレージ950は、さらに、デバイス信頼性判定モジュール951を格納する。デバイス信頼性判定モジュール951は、障害予兆が検出されたデバイスが、信頼性の要求されるデバイスか否かを判定するモジュールである。このモジュール951は、CPU510によりRAM540のアプリケーション実行領域548に読み出され、実行される。
 図10は、本実施形態に係る情報処理装置700の処理手順を説明するフローチャートである。このフローチャートは、図9のCPU510がRAM540を使用して実行し、図7の情報処理装置700の機能構成部を実現する。
 情報処理装置700は、ステップS1001において、障害の予兆が検出されたデバイスが信頼性の要求されるデバイスであるか否かを判断する。信頼性の要求されないデバイスである場合(ステップS1001のNO)、情報処理装置700は、ステップS601へ戻る。信頼性の要求されるデバイスである場合(ステップS1001のYES)、情報処理装置700は、ステップS607に進む。
 本実施形態によれば、障害予兆が検出されたデバイスが信頼性が要求されるデバイスであれば、障害程度およびデバイスの信頼性に基づいて予備品の手配をするので、予備品を迅速に手配でき、システムの安定運用に貢献することができる。
 [第4実施形態]
 次に本発明の第4実施形態に係る予備品管理システムについて、図11および図12を用いて説明する。図11は、本実施形態に係る予備品管理システムの構成を説明するための図である。本実施形態に係る予備品管理システムは、上記第2実施形態および第3実施形態と比べると、マシン室、サーバ、管理サーバおよび部品販売サイトを有する点で異なる。
 予備品管理システム1100は、マシン室1110と、サーバ1120と、管理サーバ1130と、部品販売サイト1140と、を有する。
 サーバ1120は、HDD1121を有し、マシン室1110内に複数台設置されている。そして、マシン室1110には、在庫として、一定数の予備用HDD1111が置かれている。
 管理サーバ1130は、HDD冗長構成管理装置1131と、サーバ冗長構成管理装置1132と、APL(アプリケーション:Application)種別管理機能1133と、を有する。管理サーバ1130は、各サーバ1120からHDD障害予兆情報(SMART)1123を収集する。
 管理サーバ1130は、HDDの冗長構成情報を管理するHDD冗長構成管理装置1131、サーバの冗長構成情報を管理するサーバ冗長構成管理装置1132、アプリケーションの種別を管理するAPL種別管理機能1133を有する。APL種別管理機能1133は、アプリケーションがミッションクリティカル系か否かを管理する。HDD冗長構成管理装置1131、サーバ冗長構成管理装置1132およびAPL種別管理機能1133には、システム構築時に必要な情報が登録される。
 管理サーバ1130が、HDD障害予兆の発生情報を受信した場合は、HDD冗長構成管理装置1131は、まず該当HDDに冗長用HDDが存在するかを確認する。そして、HDD冗長構成管理装置1131は、冗長用HDDが存在する場合は、低リスク障害予兆と判定する。また、HDD冗長構成管理装置1131は、冗長用HDDが存在しない場合は、高リスク障害予兆と判定する。
 次に、サーバ冗長構成管理装置1132は、該当HDDが搭載されたサーバ1120に冗長用サーバが存在するかを確認する。冗長用サーバが存在する場合は、サーバ冗長構成管理装置1132は、HDD冗長構成管理装置1131で高リスク障害予兆と判定された場合であっても、低リスク障害予兆に判定を変更する。
 そして、HDD冗長構成管理装置1131およびサーバ冗長構成管理装置において、冗長用HDDも冗長用サーバも存在せず、高リスク障害予兆と判定された場合は、管理サーバ1130が自動的に部品販売サイト1140にアクセスする。そして、管理サーバ1130は、予備用HDDの発注(交換部材の発注)1134を行い、予備用HDD1111の補充しておく。
 一方、HDD冗長構成管理装置1131またはサーバ冗長構成管理装置1132において、冗長用HDDや冗長用サーバが存在し低リスク障害予兆と判定された場合でも、APL種別管理機能1133において、アプリケーション種別を確認する。そして、高信頼が要求されるミッションクリティカル系のHDDの場合は、予備用HDD1111が必要と判断し、管理サーバ1130から自動的に部品販売サイト1140へアクセスし、交換部材(予備用HDD1111)の発注を行う。
 部品販売サイト1140は、受注管理部1141、発送部1142および在庫管理部1143を有する。受注管理部1141は、管理サーバ1130からの予備用HDDの発注(1134)を管理する。発送部1142は、管理サーバ1130からの発注に基づいて、発注された予備用HDDを発送して、納品する(1144)。在庫管理部1143は、例えば、マシン室1110に置かれている予備用HDD1111の在庫を監視する(1145)。
 図12は、本実施形態に係る予備品管理システムの管理サーバの処理手順を説明するフローチャートである。ステップS1201において、管理サーバ1130は、サーバ1120のHDD1121の障害予兆を検出する。HDDには、障害予兆を示すSMART情報があり、このSMART情報を活用し、実際に故障する前の予兆を監視する。
 HDDに障害予兆を検出した場合、ステップS1203において、管理サーバ1130は、冗長HDDの有無を判断する。ステップS1205において、管理サーバ1130は、冗長サーバの有無を判断する。また、ステップS1207において、アプリケーションの種別を判断する。ステップS1209において、管理サーバ1130は、他に冗長装置が存在するか否かに基づいて、予備用HDDの発注の要否を判定する。管理サーバ1130は、例えば、他に冗長装置が存在する場合は、緊急性が低いと判断し、予備用HDDの先行発注を実施しない(ステップS1209の不要)。
 冗長HDDおよび冗長サーバが存在し、実行しているアプリケーションが高信頼性が求められるアプリケーションの場合は(ステップS1209の要)、ステップS1211において、管理サーバ1130は、予備用HDDの先行発注を実施する。
 ステップS1213において、管理サーバ1130は、発注した予備用HDDの納品を待つ。ステップS1215において、管理サーバ1130は、予備用HDDが納品された場合、予備用HDDの追加補充処理を行う。ステップS1217において、管理サーバ1130は、HDD1121の障害の予兆ではなく、HDD1121の故障発生を検出する。ステップS1219において、管理サーバ1130は、HDDの交換が行われた場合は、HDDの交換処理を実行し、予備用HDD1111の在庫消化処理を実行する。
 このように、管理サーバ1130は、実際にHDD1121に故障が発生する前に、冗長構成環境やアプリケーション種別に応じ、予備用HDD1111を補充する。
 本実施形態によれば、HDD故障が発生した時には、既に必要な予備用HDDが補充済みとなり、予備品枯渇のリスクを低減することができる。
 [他の実施形態]
 以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。
 また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるWWW(World Wide Web)サーバも、本発明の範疇に含まれる。特に、少なくとも、上述した実施形態に含まれる処理ステップをコンピュータに実行させるプログラムを格納した非一時的コンピュータ可読媒体(non-transitory computer readable medium)は本発明の範疇に含まれる。
 この出願は、2017年3月13日に出願された日本出願特願2017-047136を基礎とする優先権を主張し、その開示のすべてをここに取り込む。

Claims (8)

  1.  デバイスの障害の予兆を検出する予兆検出手段と、
     前記予兆検出手段により、前記予兆を検出した場合、前記デバイスの障害の程度を判定する障害程度判定手段と、
     判定された障害程度に基づいて、前記デバイスの予備品の手配の要否を判断する要否判断手段と、
     を備えた情報処理装置。
  2.  前記障害程度判定手段は、前記予兆が検出されたデバイスの代替デバイスの有無を判断する代替デバイス有無判断手段をさらに備え、
     前記要否判断手段は、前記代替デバイスの有無に基づいて、前記予備品の手配が必要と判断する請求項1に記載の情報処理装置。
  3.  前記代替デバイスは、冗長HDD(Hard Disk Drive)を含む請求項2に記載の情報処理装置。
  4.  前記障害程度判定手段は、実行されているアプリケーションの種別を判定するアプリケーション種別判定手段をさらに備え、
     前記要否判断手段は、さらに、前記アプリケーションの種別に基づいて、前記予備品の手配の要否を判断する請求項1乃至3のいずれか1項に記載の情報処理装置。
  5.  前記障害程度判定手段は、前記予兆が検出されたデバイスが、信頼性の要求されるデバイスか否かを判定するデバイス信頼性判定手段をさらに備え、
     前記要否判断手段は、前記障害程度の判定結果およびデバイス信頼性判定手段の判定結果に基づいて、前記予備品の手配が必要と判断する請求項1乃至4のいずれか1項に記載の情報処理装置。
  6.  前記デバイスは、HDDを含む請求項1乃至5のいずれか1項に記載の情報処理装置。
  7.  デバイスの障害の予兆を検出し、
     前記予兆を検出した場合、前記デバイスの障害の程度を判定し、
     判定された障害程度に基づいて、前記デバイスの予備品の手配の要否を判断する
     情報処理方法。
  8.  デバイスの障害の予兆を検出する処理と、
     前記予兆を検出した場合、前記デバイスの障害の程度を判定する処理と、
     判定された障害程度に基づいて、前記デバイスの予備品の手配の要否を判断する処理と、
     をコンピュータに実行させる情報処理プログラムを記録するプログラム記録媒体。
PCT/JP2018/008757 2017-03-13 2018-03-07 情報処理装置、情報処理方法およびプログラム記録媒体 WO2018168606A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017047136A JP2020098369A (ja) 2017-03-13 2017-03-13 情報処理装置、情報処理方法および情報処理プログラム
JP2017-047136 2017-03-13

Publications (1)

Publication Number Publication Date
WO2018168606A1 true WO2018168606A1 (ja) 2018-09-20

Family

ID=63522270

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/008757 WO2018168606A1 (ja) 2017-03-13 2018-03-07 情報処理装置、情報処理方法およびプログラム記録媒体

Country Status (2)

Country Link
JP (1) JP2020098369A (ja)
WO (1) WO2018168606A1 (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012038362A (ja) * 2010-08-03 2012-02-23 Nippon Telegr & Teleph Corp <Ntt> ハードディスク故障予兆検出方法
JP2012073923A (ja) * 2010-09-29 2012-04-12 Ricoh Co Ltd 管理装置、管理システムおよび管理方法
JP2012181594A (ja) * 2011-02-28 2012-09-20 Brother Ind Ltd 修理支援サーバ
JP2013239076A (ja) * 2012-05-16 2013-11-28 Nec Corp サーバ制御装置、サーバ冷却システム及びサーバ冷却方法
JP2014002660A (ja) * 2012-06-20 2014-01-09 Hitachi Ltd 保守部品生産管理装置及び保守部品生産管理方法
JP2014026415A (ja) * 2012-07-26 2014-02-06 Hitachi Ltd 発注支援装置、発注支援方法および生産管理システム
JP2015036808A (ja) * 2013-08-16 2015-02-23 富士ゼロックス株式会社 保守判定装置、保守判定システム、保守判定プログラム及び保守判定方法
JP2016071871A (ja) * 2014-09-30 2016-05-09 株式会社リコー システム、情報処理装置、サービス決定方法及びプログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012038362A (ja) * 2010-08-03 2012-02-23 Nippon Telegr & Teleph Corp <Ntt> ハードディスク故障予兆検出方法
JP2012073923A (ja) * 2010-09-29 2012-04-12 Ricoh Co Ltd 管理装置、管理システムおよび管理方法
JP2012181594A (ja) * 2011-02-28 2012-09-20 Brother Ind Ltd 修理支援サーバ
JP2013239076A (ja) * 2012-05-16 2013-11-28 Nec Corp サーバ制御装置、サーバ冷却システム及びサーバ冷却方法
JP2014002660A (ja) * 2012-06-20 2014-01-09 Hitachi Ltd 保守部品生産管理装置及び保守部品生産管理方法
JP2014026415A (ja) * 2012-07-26 2014-02-06 Hitachi Ltd 発注支援装置、発注支援方法および生産管理システム
JP2015036808A (ja) * 2013-08-16 2015-02-23 富士ゼロックス株式会社 保守判定装置、保守判定システム、保守判定プログラム及び保守判定方法
JP2016071871A (ja) * 2014-09-30 2016-05-09 株式会社リコー システム、情報処理装置、サービス決定方法及びプログラム

Also Published As

Publication number Publication date
JP2020098369A (ja) 2020-06-25

Similar Documents

Publication Publication Date Title
US8839032B2 (en) Managing errors in a data processing system
CN102597962B (zh) 用于虚拟计算环境中的故障管理的方法和系统
JP4717079B2 (ja) コンピュータ・システムにおける障害の診断および保守のための方法およびシステム(疑わしいコンポーネントの履歴ベースの優先順位付け)
US8713350B2 (en) Handling errors in a data processing system
JP5593838B2 (ja) 電算機室空調システム、その冗長コントローラ
CN100394394C (zh) 容错双工计算机系统及其控制方法
JP5083051B2 (ja) 監視システム、監視装置、被監視装置、監視方法
US8694827B2 (en) Job migration in response to loss or degradation of a semi-redundant component
US8099634B2 (en) Autonomic component service state management for a multiple function component
JP5975094B2 (ja) 交換候補提示方法、情報処理装置、及びプログラム
JP2007299213A (ja) Raid制御装置および障害監視方法
JP5440073B2 (ja) 情報処理装置,情報処理装置の制御方法および制御プログラム
JP5104479B2 (ja) 情報処理装置
WO2018168606A1 (ja) 情報処理装置、情報処理方法およびプログラム記録媒体
JP6596287B2 (ja) プラント保全支援システム
JP2007257581A (ja) 故障解析装置
JP2006344061A (ja) シナリオ適用支援方法、管理サーバおよび管理プログラム
JP6828558B2 (ja) 管理装置、管理方法及び管理プログラム
JP4768574B2 (ja) 電源制御システム及び方法、電子装置、プログラム
JP2014215622A (ja) プラント監視システム及びプラント監視方法
JP2009026182A (ja) プログラム実行システム及び実行装置
JP2014078067A (ja) データベースシステム、データベース装置、データベースの障害回復方法およびプログラム
US9864669B1 (en) Managing data center resources
JP5696492B2 (ja) 故障検出装置、故障検出方法、及び、故障検出プログラム
JP2010113463A (ja) 診断システム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18768352

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18768352

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP