JP2022138311A - Information processing apparatus, system, program, and control method - Google Patents

Information processing apparatus, system, program, and control method Download PDF

Info

Publication number
JP2022138311A
JP2022138311A JP2021038118A JP2021038118A JP2022138311A JP 2022138311 A JP2022138311 A JP 2022138311A JP 2021038118 A JP2021038118 A JP 2021038118A JP 2021038118 A JP2021038118 A JP 2021038118A JP 2022138311 A JP2022138311 A JP 2022138311A
Authority
JP
Japan
Prior art keywords
information
event
determination
information processing
corresponds
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021038118A
Other languages
Japanese (ja)
Other versions
JP7235346B2 (en
Inventor
水貴 梶濱
Mizuki Kajihama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2021038118A priority Critical patent/JP7235346B2/en
Publication of JP2022138311A publication Critical patent/JP2022138311A/en
Application granted granted Critical
Publication of JP7235346B2 publication Critical patent/JP7235346B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

To provide an information processing apparatus, a system, a program, and a control method capable of notifying a sign of various failures.SOLUTION: An information processing apparatus includes: acquisition means that acquires discrimination information based on an event and correction information indicating a processing content when corresponding to the discrimination information; discrimination means that refers to an event occurring in a RAID-configurated hard disk drive stored by the event storage means and discriminates whether or not to correspond to the discrimination information of the correction information acquired by the acquisition means; and notification means that notifies that there is a sign that a failure occurs when discriminating to correspond to the discrimination information by the discrimination means.SELECTED DRAWING: Figure 4

Description

本発明は、情報処理装置、システム、プログラムおよび制御方法に関する。 The present invention relates to an information processing device, system, program, and control method.

情報処理装置の障害に関する技術として、特許文献1には、機器における既知の問題に対する運用の情報を得るために必要な時間を短縮できる情報処理技術が開示されている。特許文献2には、コンピュータ端末における障害発生を、当該コンピュータ端末で実行しているアプリケーションの重要性に応じて予測し、警告などを行う障害発生予測システムが開示されている。 As a technology related to information processing device failures, Patent Document 1 discloses an information processing technology capable of shortening the time required to obtain operational information for a known problem in a device. Patent Literature 2 discloses a failure prediction system that predicts the occurrence of a failure in a computer terminal according to the importance of an application running on the computer terminal and issues a warning or the like.

特開2017-182169号公報JP 2017-182169 A 特開2008-210151号公報JP 2008-210151 A

特許文献1には、ユーザ機器構成情報を送ることで、既知問題を特定し、既知問題特定にかかる時間を短縮することが開示されている。しかし、障害箇所、障害内容が多種多様であることから、機器構成情報から既知問題を特定することは困難である。特に、装置で発生したイベントは重要な要素であるところ、これを考慮していないため、多種多様な障害に対応できない。 Japanese Patent Laid-Open No. 2002-200001 discloses that known problems are identified by sending user device configuration information, and the time required to identify known problems is shortened. However, it is difficult to identify the known problem from the device configuration information because the location of the failure and the details of the failure are diverse. In particular, an event occurring in the device is an important factor, but since this is not taken into account, it is not possible to deal with a wide variety of failures.

また、特許文献2には、ハードウェア機器から不具合情報提供システムに対し不具合情報を送信し、該当がある場合にハードウェア機器側にフィードバックし重要度を算出、結果に応じて予兆アラートを上げることが開示されている。 In addition, in Patent Document 2, defect information is sent from a hardware device to a defect information provision system, and if there is a corresponding defect, it is fed back to the hardware device side, the degree of importance is calculated, and a predictive alert is raised according to the result. is disclosed.

しかし、ユーザ装置で発生した不具合情報を、不具合情報システムに照会する内容のため、既知の事例に対する障害予兆としては的を絞り切れておらず、既知の事例に結びつかないケースが考えられる。また、特許文献2に開示された技術では、ハードウェア機器からの報告、検索、およびフィードバックとステップ数が多く、処理時間もそれなりに要することが考えられる。また、特許文献2に開示された技術は、ハードウェア機器側が重要度を算出せず、不具合情報提供システム側で重要度を算出している。 However, since the problem information system is referred to the problem information system for the problem information that occurred in the user device, it is not possible to narrow down the target as a failure sign for known cases, and there may be cases where it is not connected to known cases. In addition, the technology disclosed in Patent Document 2 requires a large number of reporting, searching, and feedback from hardware devices, and a large number of steps, which may require a considerable amount of processing time. Further, in the technique disclosed in Patent Document 2, the hardware device side does not calculate the importance level, but the defect information providing system side calculates the importance level.

このように、関連技術では、多種多様な障害に対応できず、また他装置が予兆について判断するものであった。 As described above, the related art cannot cope with various types of failures, and another device judges the signs.

そこでこの発明は、上述の課題を解決する情報処理装置、システム、プログラム、および制御方法を提供することを目的としている。 SUMMARY OF THE INVENTION Accordingly, it is an object of the present invention to provide an information processing apparatus, system, program, and control method that solve the above problems.

上記目的を達成するために、本発明は、イベントに基づく判別情報と、当該判別情報に該当した場合の処置内容とを示す修正情報を取得する取得手段と、イベント記憶手段により記憶された、RAID構成されたハードディスクドライブにおいて生じたイベントを参照し、前記取得手段により取得された修正情報の判別情報に該当するか否かを判別する判別手段と、前記判別手段により判別情報に該当すると判別された場合に、障害が発生する予兆があることを通知する通知手段と、を備えた。 In order to achieve the above object, the present invention provides a RAID system, which is stored by an acquisition means for acquiring discrimination information based on an event and correction information indicating the action to be taken when the discrimination information is met; and an event storage means. determining means for referring to an event occurring in the configured hard disk drive and determining whether or not the modification information obtained by the obtaining means corresponds to the identification information; and notification means for notifying that there is a sign that a failure will occur.

上記目的を達成するために、本発明の別の態様によれば、RAID構成されたハードディスクドライブを備えた情報処理装置と、前記情報処理装置に、イベントに基づく判別情報と、当該判別情報に該当した場合の処置内容を示す修正情報を通知する管理装置とを備えたシステムであって、前記情報処理装置は、前記管理装置から修正情報を取得する取得手段と、イベント記憶手段により記憶された、RAID構成されたハードディスクドライブにおいて生じたイベントを参照し、前記取得手段により取得された修正情報の判別情報に該当するか否かを判別する判別手段と、前記判別手段により判別情報に該当すると判別された場合に、障害が発生する予兆があることを通知する通知手段と、を備えた。 In order to achieve the above object, according to another aspect of the present invention, an information processing apparatus having a RAID-configured hard disk drive; A system comprising: a management device for notifying correction information indicating details of actions to be taken in a case where the information processing device includes acquisition means for acquiring correction information from the management device; determining means for referring to an event occurring in a RAID-configured hard disk drive and determining whether or not it corresponds to the determination information of the correction information acquired by the acquisition means; and notification means for notifying that there is a sign that a failure will occur.

上記目的を達成するために、本発明の別の態様によれば、コンピュータに、イベントに基づく判別情報と、当該判別情報に該当した場合の処置内容とを示す修正情報を取得する取得ステップと、イベント記憶手段により記憶された、RAID構成されたハードディスクドライブにおいて生じたイベントを参照し、前記取得ステップにより取得された修正情報の判別情報に該当するか否かを判別する判別ステップと、前記判別ステップにより判別情報に該当すると判別された場合に、障害が発生する予兆があることを通知する通知ステップと、を実行させるためのプログラムである。 In order to achieve the above object, according to another aspect of the present invention, an acquisition step of acquiring, in a computer, determination information based on an event and correction information indicating the action to be taken when the determination information is met; a determination step of referring to an event that occurred in a RAID-configured hard disk drive and stored by an event storage means, and determining whether or not it corresponds to the determination information of the correction information acquired in the acquisition step; and a notification step of notifying that there is a sign of occurrence of a failure when it is determined that the information corresponds to the determination information.

上記目的を達成するために、本発明の別の態様によれば、情報処理装置の制御方法であって、イベントに基づく判別情報と、当該判別情報に該当した場合の処置内容とを示す修正情報を取得する取得ステップと、イベント記憶手段により記憶された、RAID構成されたハードディスクドライブにおいて生じたイベントを参照し、前記取得ステップにより取得された修正情報の判別情報に該当するか否かを判別する判別ステップと、前記判別ステップにより判別情報に該当すると判別された場合に、障害が発生する予兆があることを通知する通知ステップと、を有する。 In order to achieve the above object, according to another aspect of the present invention, there is provided a control method for an information processing apparatus, comprising determination information based on an event, and correction information indicating the action to be taken when the determination information is met. and referring to the event that occurred in the hard disk drive configured in the RAID and stored by the event storage means, and determining whether or not the correction information acquired by the acquiring step corresponds to the discrimination information. a determination step; and a notification step of notifying that there is a sign of failure when the determination step determines that the information corresponds to the determination information.

本発明によれば、多種多様な障害が発生する予兆を通知可能という効果が得られる。 ADVANTAGE OF THE INVENTION According to this invention, the effect of being able to notify the sign which various failure|failures generate|occur|produce can be acquired.

本発明の一実施形態の構成を示すシステムの構成例を示す図である。1 is a diagram showing a configuration example of a system showing the configuration of an embodiment of the present invention; FIG. 情報処理装置と管理装置の構成を示すブロック図である。It is a block diagram which shows the structure of an information processing apparatus and a management apparatus. 修正情報の一例を示す図である。It is a figure which shows an example of correction information. 情報処理装置の処理の流れを示すフローチャートである。4 is a flow chart showing the flow of processing of the information processing apparatus; 障害発生予兆通知画面の一例を示す図である。It is a figure which shows an example of the notification screen of a sign of failure occurrence. 本実施形態による情報処理装置の最小構成を示す図である。It is a figure which shows the minimum structure of the information processing apparatus by this embodiment.

以下、本発明の一実施形態によるシステムを図面を参照して説明する。図1は、本発明の一実施形態の構成を示すシステム10の構成例を示す図である。 A system according to an embodiment of the present invention will now be described with reference to the drawings. FIG. 1 is a diagram showing a configuration example of a system 10 showing the configuration of one embodiment of the present invention.

システム10は、情報処理装置100-1、100-2、100-n、および管理装置200を含む。以下、情報処理装置100-1、100-2、100-nのそれぞれを特に区別しない場合には任意の1台を情報処理装置100と表現する。なお、nは1以上の整数である。n=1の場合には、システム10における情報処理装置は、情報処理装置100-1のみとなる。 The system 10 includes information processing devices 100-1, 100-2, 100-n, and a management device 200. FIG. Hereinafter, any one of the information processing apparatuses 100-1, 100-2, and 100-n will be referred to as the information processing apparatus 100 unless otherwise distinguished. Note that n is an integer of 1 or more. When n=1, the information processing device in system 10 is only information processing device 100-1.

情報処理装置100と管理装置200は、ネットワーク300を介して通信可能である。情報処理装置100は、RAID(Redundant Arrays of Inexpensive Disks)構成されたハードディスクドライブを備える。管理装置200は、後述する修正情報を情報処理装置100に通知する。 Information processing apparatus 100 and management apparatus 200 can communicate via network 300 . The information processing apparatus 100 includes hard disk drives configured as RAID (Redundant Arrays of Inexpensive Disks). The management device 200 notifies the information processing device 100 of correction information, which will be described later.

図2は、情報処理装置100と管理装置200の構成を示すブロック図である。情報処理装置100は、OS(Operating System)110、RAIDコントローラ120、および論理ドライブ130で構成される。OS110は、イベント管理部111、および修正情報取得管理部112を備える。イベント管理部111は、後述する判別情報に該当したことなどがRAIDコントローラ120から通知される。またイベント管理部111は、判別情報に該当した場合に、ユーザに障害が発生する予兆があることを通知する。イベント管理部111は、通知手段の一例である。修正情報取得管理部112は、管理装置200から修正情報、更新情報、および更新モジュールなどを取得し、RAIDコントローラ120に修正情報、更新情報、および更新モジュールなどを通知する。修正情報取得管理部112は、取得部の一例である。 FIG. 2 is a block diagram showing the configuration of the information processing device 100 and the management device 200. As shown in FIG. The information processing apparatus 100 includes an OS (Operating System) 110 , a RAID controller 120 and a logical drive 130 . The OS 110 includes an event manager 111 and a correction information acquisition manager 112 . The event management unit 111 is notified from the RAID controller 120 that it corresponds to determination information described later. Further, the event management unit 111 notifies the user that there is a sign that a failure will occur if the event corresponds to the determination information. The event management unit 111 is an example of notification means. The correction information acquisition management unit 112 acquires correction information, update information, update modules, and the like from the management device 200 and notifies the RAID controller 120 of the correction information, update information, update modules, and the like. The correction information acquisition management unit 112 is an example of an acquisition unit.

RAIDコントローラ120は、ログ通知部121、ログ管理部122、修正情報ベリファイ部123、ログイベントトレース探査部124、およびエラーチェックベリファイ部125を備える。ログ通知部121は、ログ管理部122に管理されている内容をイベント管理部111に通知する。また、ログ通知部121は、判別情報に該当したこともイベント管理部111に通知する。 The RAID controller 120 includes a log notification unit 121 , a log management unit 122 , a correction information verification unit 123 , a log event trace search unit 124 and an error check verification unit 125 . The log notification unit 121 notifies the event management unit 111 of the contents managed by the log management unit 122 . The log notification unit 121 also notifies the event management unit 111 that the determination information is met.

ログ管理部122は、各種イベントを記憶装置(例えばSSD(Solid State Drive))に記憶する。イベントには、ハードディスクドライブなどのハードウェア情報機器に関するエラー、OS110に通知されたエラーなどがあり、それらをログとして記憶する。また、ログ管理部122は、ハードディスクドライブなどのハードウェアでの処理のランタイムログなどの各種ログなども記憶する。ログ管理部122は、記憶手段301の一例である。 The log management unit 122 stores various events in a storage device (for example, SSD (Solid State Drive)). Events include errors related to hardware information devices such as hard disk drives, errors notified to the OS 110, and the like, which are stored as logs. The log management unit 122 also stores various logs such as runtime logs of processing in hardware such as a hard disk drive. The log manager 122 is an example of the storage means 301 .

修正情報ベリファイ部123は、ログ管理部122に記憶されたイベントを参照し、修正情報取得管理部112から通知された修正情報に該当するか否かを判別する。また、修正情報ベリファイ部123は、修正情報に該当した場合に、後述する処置を実行可能である。修正情報ベリファイ部123は、判別手段および実行手段の一例である。 The correction information verification unit 123 refers to the event stored in the log management unit 122 and determines whether or not it corresponds to the correction information notified from the correction information acquisition management unit 112 . Further, the correction information verifying unit 123 can execute a process described later when the correction information is found. Correction information verification unit 123 is an example of determination means and execution means.

ログイベントトレース探査部124は、ログ管理部122に記憶されたログに含まれるイベントを参照しすることで各ログをトレースする。エラーチェックベリファイ部125は、接続されたハードディスクドライブに対する、不良ブロックの検出や整合性チェックを行い、異常予兆を未然に防止するための診断機能を備える。 The log event trace search unit 124 traces each log by referring to events included in the log stored in the log management unit 122 . The error check/verify unit 125 has a diagnostic function for detecting a bad block and checking the integrity of the connected hard disk drive to prevent anomaly signs.

上記構成において、修正情報ベリファイ部123による修正情報に該当するか否かを判別は、エラーチェックベリファイ部125により行われる不良ブロックの検出や整合性チェックと並行して行われる。 In the above configuration, the correction information verifying unit 123 determines whether or not it corresponds to the correction information in parallel with the detection of the bad block and the consistency check performed by the error check verifying unit 125 .

論理ドライブは、ディスク130-1、130-2、…、130-mを備える。なお、mは1以上の整数である。m=1の場合には、論理ドライブはディスク130-1のみで構成される。 The logical drive comprises disks 130-1, 130-2, . . . , 130-m. Note that m is an integer of 1 or more. When m=1, the logical drive consists only of disk 130-1.

管理装置200は、修正情報探索部201、および修正情報通知部202を備える。修正情報探索部201は、各情報処理装置100に対応する修正情報を探索する。修正情報通知部202は、修正情報取得管理部112に修正情報を通知する。 The management device 200 includes a correction information search section 201 and a correction information notification section 202 . The correction information search unit 201 searches for correction information corresponding to each information processing apparatus 100 . The correction information notification unit 202 notifies the correction information acquisition management unit 112 of the correction information.

図3は、修正情報の一例を示す図である。修正情報は、判別情報と、処置内容とで構成される。判別情報は、イベントに基づく。処置内容は、判別情報に該当した場合の処置内容を示す。例えば、図3に示されるように、判別情報として「エラーAの発生後にエラーBが発生した」があり、当該判別情報に対応する処置内容として「ファームウェアバージョンXを適用」がある。この場合、修正情報ベリファイ部123は、ログ管理部122に記憶されたイベントを参照し、「エラーAの発生後にエラーBが発生した」と判別されると、ログ通知部121を介してイベント管理部111に判別情報に該当したことを通知する。修正情報ベリファイ部123は、OS110から処置内容に示される処置の実行が要求されると、RAIDコントローラ120にファームウェアバージョンXを適用する。 FIG. 3 is a diagram showing an example of correction information. The correction information is composed of determination information and action details. Discrimination information is based on events. The content of action shows the content of action when it corresponds to determination information. For example, as shown in FIG. 3, there is "error B occurred after error A occurred" as determination information, and "apply firmware version X" as the action content corresponding to the determination information. In this case, the correction information verification unit 123 refers to the event stored in the log management unit 122, and when it is determined that “error B occurred after error A”, the event management unit 123 It notifies the unit 111 that it corresponds to the determination information. The correction information verifying unit 123 applies the firmware version X to the RAID controller 120 when the OS 110 requests execution of the action indicated by the action content.

また、判別情報として「エラーCの発生回数が10回/1h以上(1時間に10回以上)である」があり、当該判別情報に対応する処置内容として「BIOSバージョンYを適用」がある。この場合、修正情報ベリファイ部123は、ログ管理部122に記憶されたイベントを参照し、「エラーCの発生回数が10回/1h以上である」と判別されると、ログ通知部121を介してイベント管理部111に判別情報に該当したことを通知する。修正情報ベリファイ部123は、OS110から処置内容に示される処置の実行が要求されると、BIOSバージョンYを適用する。 Further, there is "the number of occurrences of error C is 10 times/1h or more (10 times or more per hour)" as determination information, and "apply BIOS version Y" as the action content corresponding to the determination information. In this case, the correction information verifying unit 123 refers to the event stored in the log managing unit 122, and when it is determined that “the number of occurrences of error C is 10/1h or more”, the log notification unit 121 Then, the event management unit 111 is notified that it corresponds to the discrimination information. The correction information verifying unit 123 applies the BIOS version Y when the OS 110 requests execution of the action indicated by the action content.

判別情報は、上述したようなイベントの出現パターン、イベント発生回数に加え、エラーチェックベリファイ部125による診断結果や、例えばイベントを示すIDなどの識別情報があれば、それを用いたものであってもよい。 In addition to the occurrence pattern of events and the number of occurrences of events as described above, the determination information uses the diagnosis result of the error check verifying unit 125 and identification information such as an ID indicating an event, if any. good too.

また、判別情報ごとに、後述する通知内容を示す情報も管理装置200から情報処理装置に通知される。例えば、「エラーAの発生後にエラーBが発生した」には「障害αが発生する予兆が確認されました」という通知内容を示す情報が通知され、「エラーCの発生回数が10回/1h以上である」には「障害βが発生する予兆が確認されました」という通知内容を示す情報が通知される。情報処理装置100は、該当した判別情報に対応する通知内容をユーザに通知する。 In addition, the management device 200 also notifies the information processing device of information indicating the content of notification, which will be described later, for each determination information. For example, for "error B occurred after error A", information indicating the content of the notification "a sign of occurrence of failure α was confirmed" is notified, and "error C occurred 10 times/1h "This is the above" is notified of the information indicating the content of the notification "A sign of occurrence of failure β has been confirmed". The information processing apparatus 100 notifies the user of notification content corresponding to the relevant determination information.

このように、従来より行われている更新ファームウェアなどの提供に加え、イベントに基づく条件を設けることで、より多種多様な障害に対応できる。例えば、更新ファームウェアは、同一機種全てに適用するものだけではなく、特殊な環境や使用状況にある機種のみに対して適用可能なものもある。そこで、本実施形態のようにイベントに基づく条件を用いることで、より多種多様な障害に対応できる。 In this way, in addition to the conventional provision of updated firmware, etc., by setting event-based conditions, it is possible to deal with a wider variety of failures. For example, update firmware is applicable not only to all models of the same model, but also to models in special environments and usage situations. Therefore, by using conditions based on events as in the present embodiment, it is possible to deal with a wider variety of failures.

次に、情報処理装置100の処理の流れをフローチャートを用いて説明する。図4は、情報処理装置100の処理の流れを示すフローチャートである。なお、図4のフローチャートでは、本実施形態に関する修正情報の取得とイベントの発生についての処理を示しており、本実施形態に直接関係しない処理については省略している。 Next, the flow of processing of the information processing apparatus 100 will be described using a flowchart. FIG. 4 is a flow chart showing the processing flow of the information processing apparatus 100. As shown in FIG. Note that the flowchart of FIG. 4 shows processing for acquiring correction information and generating an event related to this embodiment, and processing that is not directly related to this embodiment is omitted.

情報処理装置100は、修正情報取得管理部112が管理装置200から修正情報を取得したか否かを判定する(ステップS101)。情報処理装置100は、修正情報を取得したと判定した場合(ステップS101:YES)、情報処理装置100の修正情報ベリファイ部123は、ログ管理部122に記憶されたイベントを参照し(ステップS102)、修正情報取得管理部112から通知された修正情報に該当するか否かを判別する(ステップS103)。 The information processing apparatus 100 determines whether or not the correction information acquisition management unit 112 has acquired correction information from the management apparatus 200 (step S101). When the information processing apparatus 100 determines that correction information has been acquired (step S101: YES), the correction information verifying unit 123 of the information processing apparatus 100 refers to the event stored in the log management unit 122 (step S102). , whether or not it corresponds to the correction information notified from the correction information acquisition management unit 112 (step S103).

修正情報に該当しない場合(ステップS103:NO)、情報処理装置100は、今回取得した修正情報に関する処理を終了する。修正情報に該当する場合(ステップS103:YES)、修正情報ベリファイ部123は、ログ通知部121を介してイベント管理部111に判別情報に該当したことを通知する。これにより、情報処理装置100は、ユーザに対して、図5に示す画面を表示して、障害が発生する予兆があることを通知する(ステップS104)。 If the information does not correspond to the correction information (step S103: NO), the information processing apparatus 100 ends the processing related to the correction information acquired this time. If it corresponds to the correction information (step S103: YES), the correction information verification unit 123 notifies the event management unit 111 via the log notification unit 121 that it corresponds to the discrimination information. As a result, the information processing apparatus 100 displays the screen shown in FIG. 5 to notify the user that there is a sign of failure (step S104).

図5は、障害発生予兆通知画面の一例を示す図である。図5では、処置内容がファームウェアの適用する場合の画面例を示している。図5に示される画面には、障害が発生する予兆が確認されたこと、ファームウェアを更新することで障害を回避可能なこと、またファームウェアを更新するか否かの問い合わせが表示される。 FIG. 5 is a diagram illustrating an example of a failure occurrence sign notification screen. FIG. 5 shows an example of the screen when the content of the action is to apply firmware. The screen shown in FIG. 5 displays a message that a sign of failure has been confirmed, that the failure can be avoided by updating the firmware, and an inquiry as to whether or not to update the firmware.

ユーザは、「はい」、または「いいえ」を選択可能である。「はい」が選択された場合には、ファームウェアの更新処理が実行される。「いいえ」が選択された場合には、現時点ではファームウェアの更新処理が実行されないが、所定期間後(例えば1日後)、再びこの画面が表示される。 The user can select "yes" or "no". If "Yes" is selected, firmware update processing is executed. If "No" is selected, the firmware update process will not be executed at this time, but this screen will be displayed again after a predetermined period of time (for example, one day later).

図4のフローチャートに戻り、情報処理装置100は、図5の画面において、処置の実行が選択されたか否か(「はい」が選択されたか否か)を判定する。処置の実行が選択されなかった場合には(ステップS105:NO)、情報処理装置100は、今回取得した修正情報に関する処理を終了する。この場合、上述したように、情報処理装置100は、所定期間後に再び通知する。 Returning to the flowchart of FIG. 4, the information processing apparatus 100 determines whether or not execution of a treatment has been selected (whether "Yes" has been selected) on the screen of FIG. If execution of the action is not selected (step S105: NO), the information processing apparatus 100 terminates the processing regarding the correction information acquired this time. In this case, as described above, the information processing apparatus 100 notifies again after a predetermined period of time.

処置の実行が選択された場合には(ステップS105:YES)、修正情報ベリファイ部123は、処置内容に示される処置を実行し(ステップS106)、今回取得した修正情報に関する処理を終了する。 If execution of the action is selected (step S105: YES), the correction information verifying unit 123 executes the action indicated in the action content (step S106), and ends the processing regarding the correction information acquired this time.

ステップS101において、情報処理装置100は、修正情報を取得したと判定しなかった場合(ステップS101:NO)、イベントが発生したか否かを判定する(ステップS107)。イベントが発生していない場合には(ステップS107:NO)、情報処理装置100は、処理を終了する。イベントが発生した場合には(ステップS107:YES)、ログ管理部122は、イベントを記憶装置に記憶して(ステップS108)、今回発生したイベントに関する本処理を終了する。 When the information processing apparatus 100 does not determine in step S101 that correction information has been acquired (step S101: NO), it determines whether an event has occurred (step S107). If no event has occurred (step S107: NO), the information processing apparatus 100 terminates the process. If an event has occurred (step S107: YES), the log management unit 122 stores the event in the storage device (step S108), and terminates this process regarding the event that has occurred this time.

以上説明した実施形態では、図5の障害発生予兆通知画面に示されるように、「障害が発生する予兆が確認されました」などと表示される。関連技術では、単に「ファームウェアを更新できます」といった程度であったため、ユーザは漠然とした印象しかもたなかったり、具体性が認識されにくいことにより、早期に処置内容を実行しないことがある。その結果、システムダウンなどの重大障害を引き起こすことがあった。
そこで、イベントに基づき「障害αが発生する予兆が確認されました」などと表示することで、関連技術と比較して、システムに及ぼす影響度合いや範囲などを考慮した多種多様な障害が発生する予兆を通知可能となるだけではなく、具体的な障害内容(例えば障害αなど)もわかりやすいことから、処置内容の早期の実行をより促すことができる。
In the embodiment described above, as shown in the failure occurrence sign notification screen of FIG. In the related art, it is only a matter of saying "firmware can be updated", so the user may have only a vague impression, or may not be able to recognize the concreteness, and may not execute the action content early. As a result, serious failures such as system failures may occur.
Therefore, by displaying a message such as "A sign that a failure α will occur has been confirmed" based on the event, a wide variety of failures can occur, taking into consideration the extent and extent of their impact on the system compared to related technologies. Not only is it possible to notify of a sign, but the specific content of failure (for example, failure α) is easy to understand, so early implementation of treatment content can be further encouraged.

図6は本実施形態による情報処理装置100の最小構成を示す図である。本実施形態による情報処理装置100は少なくとも取得手段301と、判別手段302と、通知手段303とを有していればよい。 FIG. 6 is a diagram showing the minimum configuration of the information processing apparatus 100 according to this embodiment. The information processing apparatus 100 according to the present embodiment only needs to have at least the acquisition means 301 , the determination means 302 and the notification means 303 .

取得手段301は、イベントに基づく判別情報と、当該判別情報に該当した場合の処置内容とを示す修正情報を取得する。判別手段302は、イベント記憶手段により記憶された、RAID構成されたハードディスクドライブにおいて生じたイベントを参照し、前記取得手段により取得された修正情報の判別情報に該当するか否かを判別する。通知手段303は、前記判別手段により判別情報に該当すると判別された場合に、障害が発生する予兆があることを通知する。 Acquisition means 301 acquires determination information based on an event and correction information indicating the content of the action to be taken when the determination information is met. The discriminating means 302 refers to the event that occurred in the hard disk drives configured in the RAID and stored by the event storing means, and discriminates whether or not the event corresponds to the discrimination information of the correction information acquired by the acquiring means. The notifying means 303 notifies that there is a sign of failure occurrence when the determining means determines that the information corresponds to the determination information.

上述の情報処理装置100は内部に、コンピュータシステムを有している。そして、上述した図4に示される処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。 The information processing apparatus 100 described above has a computer system inside. The process shown in FIG. 4 described above is stored in a computer-readable recording medium in the form of a program, and the above process is performed by reading and executing this program by a computer. Here, the computer-readable recording medium refers to magnetic disks, magneto-optical disks, CD-ROMs, DVD-ROMs, semiconductor memories, and the like. Alternatively, the computer program may be distributed to a computer via a communication line, and the computer receiving the distribution may execute the program.

また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。 Further, the program may be for realizing part of the functions described above. Further, it may be a so-called difference file (difference program) that can realize the above-described functions in combination with a program already recorded in the computer system.

本発明は、情報処理装置、システム、プログラム及び制御方法に関する。 The present invention relates to an information processing device, system, program, and control method.

100、100-1、100-2、100-n 情報処理装置
110 OS
111 イベント管理部
112 修正情報取得管理部
120 RAIDコントローラ
121 ログ通知部
122 ログ管理部
123 修正情報ベリファイ部
124 ログイベントトレース探査部
125 エラーチェックベリファイ部
130 論理ドライブ
130-1、130-2、…、130-m ディスク
200 管理装置
201 修正情報探索部
202 修正情報通知部
300 ネットワーク
301 取得手段
302 判別手段
303 通知手段
100, 100-1, 100-2, 100-n information processing device 110 OS
111 event management unit 112 correction information acquisition management unit 120 RAID controller 121 log notification unit 122 log management unit 123 correction information verification unit 124 log event trace search unit 125 error check verification unit 130 logical drives 130-1, 130-2, . 130-m disk 200 management device 201 correction information search unit 202 correction information notification unit 300 network 301 acquisition means 302 determination means 303 notification means

Claims (7)

イベントに基づく判別情報と、当該判別情報に該当した場合の処置内容とを示す修正情報を取得する取得手段と、
イベント記憶手段により記憶された、RAID構成されたハードディスクドライブにおいて生じたイベントを参照し、前記取得手段により取得された修正情報の判別情報に該当するか否かを判別する判別手段と、
前記判別手段により判別情報に該当すると判別された場合に、障害が発生する予兆があることを通知する通知手段と、
を備えた情報処理装置。
Acquisition means for acquiring determination information based on an event and correction information indicating the action to be taken when the determination information is met;
determining means for determining whether or not the event corresponds to the determination information of the correction information acquired by the acquiring means by referring to the event occurring in the hard disk drive configured in the RAID and stored by the event storing means;
a notification means for notifying that there is a sign of failure when the determination means determines that the information corresponds to the determination information;
Information processing device with
前記通知手段は、前記判別手段により該当する判別情報に対応する処置内容に示される処置の実行を促すことをさらに通知する請求項1に記載の情報処理装置。 2. The information processing apparatus according to claim 1, wherein said notifying means further notifies that said discriminating means prompts the user to perform the action indicated by the action content corresponding to the relevant discrimination information. 処置内容に示される処置を実行する実行手段をさらに備えた請求項1または請求項2に記載の情報処理装置。 3. The information processing apparatus according to claim 1, further comprising execution means for executing the action indicated by the action content. 前記イベントは、ハードディスクドライブに関連した発生したエラーであり、
前記判別情報は、前記イベントの発生パターン、または前記イベントの発生回数を示す情報である請求項1から請求項3のいずれか1項に記載の情報処理装置。
the event is an error that occurred relating to a hard disk drive;
4. The information processing apparatus according to any one of claims 1 to 3, wherein the determination information is information indicating an occurrence pattern of the event or the number of occurrences of the event.
RAID構成されたハードディスクドライブを備えた情報処理装置と、前記情報処理装置に、イベントに基づく判別情報と、当該判別情報に該当した場合の処置内容を示す修正情報を通知する管理装置とを備えたシステムであって、
前記情報処理装置は、
前記管理装置から修正情報を取得する取得手段と、
イベント記憶手段により記憶された、RAID構成されたハードディスクドライブにおいて生じたイベントを参照し、前記取得手段により取得された修正情報の判別情報に該当するか否かを判別する判別手段と、
前記判別手段により判別情報に該当すると判別された場合に、障害が発生する予兆があることを通知する通知手段と、
を備えたシステム。
An information processing device having RAID-configured hard disk drives; and a management device for notifying the information processing device of determination information based on an event and correction information indicating the action to be taken when the determination information is met. a system,
The information processing device is
Acquisition means for acquiring correction information from the management device;
determining means for determining whether or not the event corresponds to the determination information of the correction information acquired by the acquiring means by referring to the event occurring in the hard disk drive configured in the RAID and stored by the event storing means;
notification means for notifying that there is a sign of failure when the determination means determines that the information corresponds to the determination information;
system with.
コンピュータに、
イベントに基づく判別情報と、当該判別情報に該当した場合の処置内容とを示す修正情報を取得する取得ステップと、
イベント記憶手段により記憶された、RAID構成されたハードディスクドライブにおいて生じたイベントを参照し、前記取得ステップにより取得された修正情報の判別情報に該当するか否かを判別する判別ステップと、
前記判別ステップにより判別情報に該当すると判別された場合に、障害が発生する予兆があることを通知する通知ステップと、
を実行させるためのプログラム。
to the computer,
an acquisition step of acquiring determination information based on an event and correction information indicating the action to be taken when the determination information is met;
a determination step of referring to an event that occurred in a RAID-configured hard disk drive stored by an event storage means, and determining whether or not it corresponds to the determination information of the correction information acquired in the acquisition step;
a notification step of notifying that there is a sign that a failure will occur if the determination step determines that the information corresponds to the determination information;
program to run the
情報処理装置の制御方法であって、
イベントに基づく判別情報と、当該判別情報に該当した場合の処置内容とを示す修正情報を取得する取得ステップと、
イベント記憶手段により記憶された、RAID構成されたハードディスクドライブにおいて生じたイベントを参照し、前記取得ステップにより取得された修正情報の判別情報に該当するか否かを判別する判別ステップと、
前記判別ステップにより判別情報に該当すると判別された場合に、障害が発生する予兆があることを通知する通知ステップと、
を有する制御方法。
A control method for an information processing device,
an acquisition step of acquiring determination information based on an event and correction information indicating the action to be taken when the determination information is met;
a determination step of referring to an event that occurred in a RAID-configured hard disk drive stored by an event storage means, and determining whether or not it corresponds to the determination information of the correction information acquired in the acquisition step;
a notification step of notifying that there is a sign of occurrence of a failure when it is determined by the determination step that it corresponds to the determination information;
A control method with
JP2021038118A 2021-03-10 2021-03-10 System and control method Active JP7235346B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021038118A JP7235346B2 (en) 2021-03-10 2021-03-10 System and control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021038118A JP7235346B2 (en) 2021-03-10 2021-03-10 System and control method

Publications (2)

Publication Number Publication Date
JP2022138311A true JP2022138311A (en) 2022-09-26
JP7235346B2 JP7235346B2 (en) 2023-03-08

Family

ID=83399151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021038118A Active JP7235346B2 (en) 2021-03-10 2021-03-10 System and control method

Country Status (1)

Country Link
JP (1) JP7235346B2 (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007034739A (en) * 2005-07-27 2007-02-08 Nec Corp Management support system, management support method and management support program
JP2007257645A (en) * 2007-03-26 2007-10-04 Fujitsu Ltd Computer system for integrated management of property information
WO2013140608A1 (en) * 2012-03-23 2013-09-26 株式会社日立製作所 Method and system that assist analysis of event root cause
JP2013196124A (en) * 2012-03-16 2013-09-30 Sharp Corp Image processing device
JP2016012287A (en) * 2014-06-30 2016-01-21 富士通株式会社 Storage control unit and storage control program
JP2018063518A (en) * 2016-10-12 2018-04-19 株式会社日立製作所 Management server, management method and program thereof
JP2020030628A (en) * 2018-08-23 2020-02-27 富士通株式会社 Monitoring system, monitoring method, and monitoring program

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007034739A (en) * 2005-07-27 2007-02-08 Nec Corp Management support system, management support method and management support program
JP2007257645A (en) * 2007-03-26 2007-10-04 Fujitsu Ltd Computer system for integrated management of property information
JP2013196124A (en) * 2012-03-16 2013-09-30 Sharp Corp Image processing device
WO2013140608A1 (en) * 2012-03-23 2013-09-26 株式会社日立製作所 Method and system that assist analysis of event root cause
JP2016012287A (en) * 2014-06-30 2016-01-21 富士通株式会社 Storage control unit and storage control program
JP2018063518A (en) * 2016-10-12 2018-04-19 株式会社日立製作所 Management server, management method and program thereof
JP2020030628A (en) * 2018-08-23 2020-02-27 富士通株式会社 Monitoring system, monitoring method, and monitoring program

Also Published As

Publication number Publication date
JP7235346B2 (en) 2023-03-08

Similar Documents

Publication Publication Date Title
US10884837B2 (en) Predicting, diagnosing, and recovering from application failures based on resource access patterns
CN106716972B (en) Semi-automatic failover
CN105518629B (en) Cloud deployment base structural confirmation engine
JP4576923B2 (en) Storage system storage capacity management method
US8108724B2 (en) Field replaceable unit failure determination
KR101036702B1 (en) Method, system, and apparatus for providing custom product support for a software program based upon states of program execution instability
WO2020046261A1 (en) Systematic prognostic analysis with dynamic causal model
CN108021505B (en) Data online method and device and computer equipment
US8689187B2 (en) Predictive run testing
US11449376B2 (en) Method of determining potential anomaly of memory device
WO2023226380A1 (en) Disk processing method and system, and electronic device
JP6794805B2 (en) Failure information management program, start-up test method and parallel processing device
KR20150007913A (en) Failure Prediction Device
JP7235346B2 (en) System and control method
US7457990B2 (en) Information processing apparatus and information processing recovery method
JPWO2012131868A1 (en) Computer system management method and management apparatus
CN112286909B (en) Execution state determining method, device, server and storage medium
CN114064435A (en) Database test method, device, medium and electronic equipment
CN111488232B (en) Out-of-box solution level configuration and diagnostic logging and reporting systems and methods
JP2010003132A (en) Information processor, and fault detection method of input/output device thereof, and program thereof
CN117407207B (en) Memory fault processing method and device, electronic equipment and storage medium
JP3342039B2 (en) Processing unit that manages files
JP2023067014A (en) Determination program, determination method, and information processing apparatus
US20220342992A1 (en) Authorising component updates
CN116126702A (en) Code testing method, device and system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230216

R151 Written notification of patent or utility model registration

Ref document number: 7235346

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151