JP5733515B2 - Embedded equipment with RAS function - Google Patents

Embedded equipment with RAS function Download PDF

Info

Publication number
JP5733515B2
JP5733515B2 JP2011098181A JP2011098181A JP5733515B2 JP 5733515 B2 JP5733515 B2 JP 5733515B2 JP 2011098181 A JP2011098181 A JP 2011098181A JP 2011098181 A JP2011098181 A JP 2011098181A JP 5733515 B2 JP5733515 B2 JP 5733515B2
Authority
JP
Japan
Prior art keywords
abnormality
logical
logic
processing
ras function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011098181A
Other languages
Japanese (ja)
Other versions
JP2012230533A (en
Inventor
正太 植原
正太 植原
大野 毅
毅 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yokogawa Electric Corp
Original Assignee
Yokogawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yokogawa Electric Corp filed Critical Yokogawa Electric Corp
Priority to JP2011098181A priority Critical patent/JP5733515B2/en
Publication of JP2012230533A publication Critical patent/JP2012230533A/en
Application granted granted Critical
Publication of JP5733515B2 publication Critical patent/JP5733515B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、複数のアプリケーションが、システムソフトウェアのデバイスドライバを介してハードウェアを構成する複数の物理デバイスを利用すると共に、前記アプリケーションおよびハードウェアに対するRAS機能を実装する、RAS機能を備える組み込み機器に関するものである。   The present invention relates to an embedded device having a RAS function, in which a plurality of applications use a plurality of physical devices constituting hardware via a device driver of system software and implement a RAS function for the application and hardware. Is.

RAS( Reliability Availability Serviceability)は、システムの信頼性、可用性、および保守性、の独立した意味を持つ3つの機能を合わせた概念であり、組み込み機器への実装は周知の技術である。特許文献1には、コンピュータシステムにバス接続されたRAS機能付きインターフェースによって、コンピュータに接続されるデバイスの異常を監視する技術が開示されている。   RAS (Reliability Availability Serviceability) is a concept that combines three functions having independent meanings of system reliability, availability, and maintainability, and is implemented in an embedded device. Patent Document 1 discloses a technique for monitoring an abnormality of a device connected to a computer using an interface with a RAS function connected to the computer system by a bus.

RAS機能は、コンピュータシステムが障害で停止することを極力防止することを目的に、システムの監視、異常の早期発見、故障状態の判断、および短時間での修理回復を提供する機能を指す。RAS機能は、以下のような機能を提供する。   The RAS function refers to a function that provides system monitoring, early detection of an abnormality, determination of a failure state, and repair and recovery in a short time in order to prevent the computer system from stopping due to a failure as much as possible. The RAS function provides the following functions.

(1)システムの異常監視
(a)アプリケーションを動作させるために必要なハードウェアの動作監視。
(i)アプリケーションが直接使用するハードウェアの監視。例えば、CPU、S DRAM、CFカード、シリアル通信の動作監視など。
(ii)ハードウェアの動作に悪影響を及ぼす環境の監視。例えば、電源バッテリ の電圧、電流、周囲温度、塵埃、腐食度の監視など。
(b)ウォッチドッグタイマ(Watch Dog Timer、以下WDT)による、ソフトウェアの動作監視。
(2)異常時の、システムの動作状態の記録。
(3)システム異常時の対応処理。例えば、I/Oデバイスの再起動、システムの停止な ど。
(1) System abnormality monitoring (a) Hardware operation monitoring necessary for operating an application.
(I) Monitor hardware used directly by applications. For example, operation monitoring of CPU, SDRAM, CF card, serial communication, etc.
(Ii) Monitoring the environment that adversely affects the operation of the hardware. For example, monitoring the voltage, current, ambient temperature, dust, and corrosion level of the power battery.
(B) Software operation monitoring by a watch dog timer (hereinafter referred to as WDT).
(2) Recording of the operating state of the system at the time of abnormality.
(3) Response processing when the system is abnormal. For example, I / O device restart, system shutdown, etc.

図10は、従来のRAS機能を備える組み込み機器の構成例を示す機能ブロック図であり、ハードウェア100、システムソフトウェア200、アプリケーションソフトウェア300を基本構成要素として備える。   FIG. 10 is a functional block diagram showing a configuration example of an embedded device having a conventional RAS function, and includes hardware 100, system software 200, and application software 300 as basic components.

ハードウェア100は、CPUを含む複数の物理デバイス群101を含む。システムソフトウェア200は、ブートローダ210とOS220を含む。アプリケーションソフトウェア300は、物理デバイスを使用するアプリケーション301〜30Nを含む。   The hardware 100 includes a plurality of physical device groups 101 including a CPU. The system software 200 includes a boot loader 210 and an OS 220. The application software 300 includes applications 301 to 30N that use physical devices.

初期化時診断プログラム213は、ブートローダ210が持つデバイスドライバA211に実装され、デバイス初期化手段212で起動されるハードウェアの初期化を行う際に物理デバイスの診断処理を実行する。   The initialization diagnostic program 213 is installed in the device driver A 211 of the boot loader 210 and executes a physical device diagnostic process when the hardware activated by the device initialization unit 212 is initialized.

初期化時診断プログラム213は、初期化時診断が必要な物理デバイスごとに固有の診断処理を行う。異常検出時は、異常対応処理プログラムA214により、初期化時診断に対応する異常対応処理を実行する。   The initialization diagnosis program 213 performs a unique diagnosis process for each physical device that requires initialization diagnosis. When an abnormality is detected, an abnormality handling process corresponding to the initialization diagnosis is executed by the abnormality handling program A214.

OS220が持つデバイスドライバB221に実装された使用時異常検出プログラム223は、物理デバイスを使用するアプリケーション301〜30Nからの要求を受ける物理デバイス使用時にアクセス手段222により起動され、アプリケーションが物理デバイスを使用するタイミングでの異常検出処理を実行する。異常検出時は、異常対応処理プログラムB224により、デバイス使用時診断に対応する異常対応処理を実行する。   The in-use abnormality detection program 223 installed in the device driver B 221 of the OS 220 is activated by the access unit 222 when using a physical device that receives a request from the applications 301 to 30N that use the physical device, and the application uses the physical device. Anomaly detection processing at timing is executed. When an abnormality is detected, an abnormality handling process corresponding to the device use diagnosis is executed by the abnormality handling process program B224.

OS220が持つデバイスドライバB221に実装される定周期診断プログラム231は、OS220に実装されているタイマ230により定周期で起動され、アプリケーションが直接使用しない、もしくは使用頻度の低い物理デバイスに対して定周期診断が必要な物理デバイスごとに固有の診断処理を実行する。異常検出時は、異常対応処理プログラムC232により、異常対応処理を実行する。   The fixed-cycle diagnostic program 231 installed in the device driver B 221 of the OS 220 is started at a fixed cycle by the timer 230 mounted on the OS 220, and the fixed-cycle is used for physical devices that are not used directly by the application or are used less frequently. Execute unique diagnostic processing for each physical device that needs to be diagnosed. When an abnormality is detected, an abnormality handling process is executed by the abnormality handling program C232.

デバイスドライバB221は、ハードウェア100に実装されているWDT102にアクセスするためのWDTドライバ240を備えている。   The device driver B 221 includes a WDT driver 240 for accessing the WDT 102 mounted on the hardware 100.

ハードウェア100に実装されている物理WDT102は、WDTドライバ240を介して監視対象アプリケーション310の監視機能を実現するために実装されている。物理WDT102は、監視対象となるアプリケーション310自身に実装されるWDTリセット手段310Aにより、WDTドライバ240を介して定周期でリセットされる。   The physical WDT 102 mounted on the hardware 100 is mounted to realize the monitoring function of the monitoring target application 310 via the WDT driver 240. The physical WDT 102 is reset at regular intervals via the WDT driver 240 by the WDT reset unit 310A installed in the application 310 itself to be monitored.

次に、動作の概要を説明する。RAS機能は、組み込み機器を構成するハードウェア、およびアプリケーションについて動作状態を診断、監視することで、システムに対して信頼性、確実性を向上させる機能を提供する。   Next, an outline of the operation will be described. The RAS function provides a function for improving the reliability and certainty of the system by diagnosing and monitoring the operating state of hardware and applications constituting the embedded device.

診断、監視により異常が検出された場合、異常が発生した物理デバイス、アプリケーションとその異常の程度に応じて、個別に実装された対応処理を行う。RAS機能は、以下に示す4つのタイミング(1)〜(4)で動作する。   When an abnormality is detected by diagnosis and monitoring, individually implemented response processing is performed according to the physical device and application in which the abnormality has occurred and the degree of the abnormality. The RAS function operates at the following four timings (1) to (4).

(1)システム立ち上げ時の物理デバイス初期化時におけるハードウェアの診断は、時間のかかる診断や、システムがオンライン状態であるときに行うとシステムに悪影響を及ぼす診断(例えば、メモリの全領域ゼロクリアなど)を実行する。 (1) Hardware diagnosis when initializing a physical device at the time of system start-up is a time-consuming diagnosis or a diagnosis that adversely affects the system when the system is online (for example, clearing all memory areas to zero Etc.).

初期化時診断処理は、ブートローダ210のデバイスドライバに実装される初期化診断プログラム213で実行される。ブートローダ210は、立ち上げ時に診断が必要なデバイスに対して、各物理デバイス個別に実装された初期化時診断処理を行う。異常が検出された際は、検出された異常の箇所と程度に応じて、異常処理対応プログラムA214で個別に異常対応処理を行う。   The initialization diagnosis process is executed by the initialization diagnosis program 213 installed in the device driver of the boot loader 210. The boot loader 210 performs a diagnosis process at initialization mounted on each physical device for a device that needs diagnosis at the time of startup. When an abnormality is detected, abnormality handling processing is individually performed by the abnormality processing handling program A214 in accordance with the location and degree of the detected abnormality.

(2)アプリケーションが物理デバイスを使用する時に実行されるハードウェアの診断は、システムがオンライン状態であるため、システムに悪影響を及ぼさない診断に限られる。 (2) Hardware diagnosis executed when an application uses a physical device is limited to diagnosis that does not adversely affect the system because the system is online.

使用時異常検出処理は、OS220に組み込まれるデバイスドライバB221に実装される使用時異常検出プログラム223により実行される。アプリケーションから物理デバイスへのアクセスがあると、デバイスドライバA221はアプリケーションがアクセスする各物理デバイスに対して個別に使用時異常検出処理を行う。異常が検出された際は、検出された異常の箇所と程度に応じて、異常処理対応プログラムB224で個別に異常対応処理を行う。   The in-use abnormality detection process is executed by the in-use abnormality detection program 223 installed in the device driver B 221 incorporated in the OS 220. When an application accesses a physical device, the device driver A 221 performs an in-use abnormality detection process for each physical device accessed by the application. When an abnormality is detected, abnormality handling processing is individually performed by the abnormality processing handling program B224 in accordance with the location and degree of the detected abnormality.

(3)定周期によるハードウェアの動作環境の診断は、アプリケーションからの使用頻度が低いデバイスや、システムに対して悪影響を及ぼす周囲環境について一定周期で診断を行う。 (3) The hardware operating environment is diagnosed at regular intervals for devices that are not frequently used by applications and the surrounding environment that adversely affects the system.

定周期診断処理は、OS220が持つタイマ230により、一定周期でデバイスドライバ221に実装された定周期診断処理プログラム231を呼び出し、各物理デバイスや環境センサ(温度センサなど)を診断する。異常が検出された際は、検出された異常の箇所と程度に応じて、異常処理対応プログラムC232で個別に異常対応処理を行う。   In the fixed period diagnosis process, the timer 230 of the OS 220 calls the fixed period diagnosis process program 231 installed in the device driver 221 at a fixed period to diagnose each physical device and environmental sensor (temperature sensor or the like). When an abnormality is detected, the abnormality handling processing is individually performed by the abnormality processing handling program C232 in accordance with the location and degree of the detected abnormality.

(4)ソフトウェアの動作監視は、アプリケーションが正常に動作しているかどうかを、ハードウェア100に実装された物理WDT102を用いて監視処理を行う。OSは、WDTドライバ240より提供される。WDTを用いた監視処理の実現手段となるWDTリセット手段310Aは、監視対象となるアプリケーション310自身に実装される。 (4) In the operation monitoring of software, whether or not the application is operating normally is monitored using the physical WDT 102 mounted on the hardware 100. The OS is provided from the WDT driver 240. The WDT resetting means 310A, which is a means for realizing monitoring processing using WDT, is implemented in the application 310 itself to be monitored.

アプリケーション310は、WDTドライバ240を介して、一定周期で物理WDT102のカウンタをリセットする。アプリケーション310に異常が発生し物理WDT102のリセットが行われなくなると、物理WDT102はタイムアップし、ハードウェアの強制的リセットなどハードウェアによる対応処理が行われる。   The application 310 resets the counter of the physical WDT 102 at regular intervals via the WDT driver 240. When an abnormality occurs in the application 310 and the physical WDT 102 is no longer reset, the physical WDT 102 is timed up and a hardware response process such as a forced hardware reset is performed.

特開2009−015472号公報JP 2009-015472 A

従来構成のRAS機能を備える組み込み機器では、次のような問題がある。
(1)RAS機能は、システムに散在して実装される。RAS機能は、同じ物理デバイスに対する診断であっても、必要とされる診断のタイミングや診断の内容によって処理が異なる。
The embedded device having the RAS function of the conventional configuration has the following problems.
(1) The RAS function is distributed and implemented in the system. The RAS function is processed differently depending on the required diagnosis timing and diagnosis contents, even if the diagnosis is for the same physical device.

そのため、RAS機能を呼び出すブートローダやOSなどのシステムソフトウェアの各種モジュールは、各々固有のRAS機能を実装する必要がある。これにより、RAS機能はモジュール間で一部機能が重複する場合も個別に開発され、各々のモジュールに散在して実装される。   For this reason, each of various modules of system software such as a boot loader and an OS that calls the RAS function needs to have a unique RAS function. As a result, the RAS function is individually developed even when a part of the functions overlaps between modules, and is scattered and implemented in each module.

(2)RAS機能は、搭載される組み込み機器専用の機能として、機器ごとに実装される。
RAS機能に対する要求は、各々の機器の使用目的や運用方針によって異なる。具体的には、機器に搭載される物理デバイスが異なれば、監視対象とする物理デバイスや異常検出および対応の処理が異なる。
(2) The RAS function is implemented for each device as a function dedicated to the embedded device to be mounted.
The request for the RAS function varies depending on the purpose of use and the operation policy of each device. Specifically, if the physical device mounted on the device is different, the physical device to be monitored and abnormality detection and corresponding processing are different.

また、異常検出された場合の対応処理は、異常部分を分離してシステムの動作を実行する(稼働率を重視する運用)、小さな異常でも検出されれば即時停止する(安全性を重視する運用)、など運用方針によっても異なる。   In addition, when an abnormality is detected, the response processing is performed by separating the abnormal part and executing the system operation (operation that emphasizes the operating rate), and immediately stops if a small abnormality is detected (operation that emphasizes safety) ), Etc.

RAS機能の実装は、機種(物理デバイスのハードウェア仕様)に依存する。異常検出や異常対応処理の処理手順が同じであっても、物理デバイス毎にアクセス手続きが異なるため、実装される処理は異なるものになる。   The implementation of the RAS function depends on the model (physical device hardware specifications). Even if the processing procedure of abnormality detection and abnormality handling processing is the same, the access procedure is different for each physical device, so that the implemented processing is different.

(3)WDTを用いたアプリケーションの監視では、監視対象、および対応処理が制限される。ハードウェアが提供する1つのWDTを用いたアプリケーション監視の対象は、1つのアプリケーション処理に限られる。WDTにより監視対象のアプリケーションの異常が検出された場合、対応処理はCPUのリセットなど、ハードウェアによる対応処理に限られる。 (3) In the application monitoring using WDT, the monitoring target and the corresponding processing are limited. The object of application monitoring using one WDT provided by hardware is limited to one application process. When an abnormality of an application to be monitored is detected by WDT, the response process is limited to a hardware response process such as a CPU reset.

(4)異常が検出された際の対応処理が、その検出箇所だけに限られたものとなる。異常検出処理は、各物理デバイスで個別に実装されるため、複合的に発生した異常を検知することができない。 (4) Corresponding processing when an abnormality is detected is limited to the detected location. Since the abnormality detection process is individually implemented in each physical device, it is not possible to detect a complex abnormality.

異常対応処理は各物理デバイスの異常検出処理に対応し、ハードウェアの仕様に依存して個別に実装されるため、複数のハードウェアおよびソフトウェアに対する統合的な異常対応処理を行うことができない。   Since the abnormality handling process corresponds to the abnormality detection process of each physical device and is individually implemented depending on the hardware specifications, it is not possible to perform an integrated abnormality handling process for a plurality of hardware and software.

本発明の目的の第1は、課題(1)の問題を解決し、ブートローダ、OS、およびアプリケーションがRAS機能にできる限り依存しない構成を実現する。このとき、RAS機能を一箇所にまとめて実装することにより、RAS機能の信頼性、確実性の向上を図ることにある。   The first object of the present invention is to solve the problem (1) and realize a configuration in which the boot loader, the OS, and the application do not depend on the RAS function as much as possible. At this time, the reliability and certainty of the RAS function are improved by mounting the RAS function in one place.

本発明の目的の第2は、課題(2)の問題を解決し、RAS機能を搭載する組み込み機器の機種に依存しない共通の枠組みを用いてRAS機能に対する要求を満たすことにある。   A second object of the present invention is to solve the problem (2) and satisfy the requirements for the RAS function by using a common framework that does not depend on the type of embedded device having the RAS function.

本発明の目的の第3は、課題(3)の問題を解決し、複数のアプリケーションについての監視を可能にすると共に、各々のアプリケーションについて異常検出時の対応処理を個別に規定することを可能にすることにある。   The third object of the present invention is to solve the problem (3), to enable monitoring of a plurality of applications, and to individually define the response processing at the time of abnormality detection for each application. There is to do.

本発明の目的の第4は、課題(4)の問題を解決し、複合的に発生した異常への対応処理を行う、統合的な異常対応処理機能を実現することにある。   A fourth object of the present invention is to solve the problem (4) and to realize an integrated abnormality response processing function for performing a response process for complexly generated abnormalities.

このような課題を達成するために、本発明は次の通りの構成になっている。
複数のアプリケーションが、システムソフトウェアのデバイスドライバを介してハードウェアを構成する複数の物理デバイスを利用すると共に、前記アプリケーションおよびハードウェアに対するRAS機能を実装する、RAS機能を備える組み込み機器において、
前記システムソフトウェアと前記ハードウェア間に介在させたハイパーバイザ層内に、前記複数のアプリケーションおよびハードウェアのRAS機能を統合して一元管理する、論理RAS機能部を実装し、
前記論理RAS機能部は、前記複数の物理デバイスを所定個数に分類した論理デバイスに対する論理デバイス異常検出ロジックを備え、
前記論理デバイス異常検出ロジックは、
前記システムソフトウェアのブートローダからの前記物理デバイスの初期化時および前記システムソフトウェアのOSのデバイスドライバからのアクセス時に起動され、前記論理デバイスに対する異常検出診断を実行することを特徴とするRAS機能を備える組み込み機器。
In order to achieve such a subject, the present invention has the following configuration.
In an embedded device having a RAS function, in which a plurality of applications use a plurality of physical devices constituting hardware via a device driver of system software, and implement a RAS function for the application and hardware.
In the hypervisor layer interposed between the system software and the hardware, a logical RAS function unit that integrates and centrally manages the RAS functions of the plurality of applications and hardware is implemented .
The logical RAS function unit includes a logical device abnormality detection logic for a logical device obtained by classifying the plurality of physical devices into a predetermined number,
The logic device abnormality detection logic is
Embedded with RAS function, which is activated when the physical device is initialized from the system software boot loader and when the system software is accessed from the OS device driver, and performs abnormality detection diagnosis for the logical device machine.

2)前記論理デバイス異常検出ロジックからの異常検出情報を取得し、前記ハードウェアの物理デバイスの異常を検出する異常検出処理手段と、
前記論理デバイス異常検出ロジックからの異常検出情報と、前記アプリケーションの異常検出情報とを統合化して異常処理を実行する、統合化異常対応処理ロジックと、
前記統合化異常対応処理ロジックからの異常対応情報に基づいて前記ハードウェアの物理デバイスの異常対応処理を実行する異常対応処理手段と、
を備えることを特徴とする(1)に記載のRAS機能を備える組み込み機器。
( 2) Anomaly detection processing means for obtaining anomaly detection information from the logic device anomaly detection logic and detecting an anomaly of the hardware physical device;
Integrated abnormality response processing logic that integrates abnormality detection information from the logic device abnormality detection logic and abnormality detection information of the application to execute abnormality processing;
An abnormality handling processing means for executing an abnormality handling process of the hardware physical device based on anomaly handling information from the integrated malfunction handling processing logic;
An embedded device having a RAS function as described in ( 1) .

3)前記論理RAS機能部は、前記複数のアプリケーションに対応した論理ウォッチドッグタイマ群およびソフトウェア処理異常検出ロジックを備え、
前記論理ウォッチドッグタイマ群は、前記複数のアプリケーションに実装された定周期リセット要求手段からのリセット要求によりリセットされることにより前記複数のアプリケーションを監視し、
タイムアップした論理ウォッチドッグタイマ情報を前記ソフトウェア処理異常検出ロジックに出力し、
前記ソフトウェア処理異常検出ロジックは、前記統合化異常対応処理ロジックに対して異常対応処理を依頼することを特徴とする(2)に記載のRAS機能を備える組み込み機器。
( 3) The logical RAS function unit includes a logical watchdog timer group and software processing abnormality detection logic corresponding to the plurality of applications,
The logical watchdog timer group monitors the plurality of applications by being reset by a reset request from a fixed period reset request means implemented in the plurality of applications.
Output time-up logic watchdog timer information to the software processing abnormality detection logic,
The software processing abnormality detection logic requests an abnormality handling process from the integrated abnormality handling processing logic, and the embedded device having the RAS function according to ( 2) .

4)前記統合化異常対応処理ロジックは、前記ソフトウェア処理異常検出ロジックからの異常情報を取得したときに、前記システムソフトウェアのアプリケーション管理手段に通知して対応処理を依頼することを特徴とする(3)に記載のRAS機能を備える組み込み機器。
( 4) The integrated abnormality response processing logic, when acquiring abnormality information from the software processing abnormality detection logic, notifies the application management means of the system software and requests response processing ( An embedded device having the RAS function described in 3) .

5)前記統合化異常対応処理ロジックは、夫々複数種類が定義された異常個所に対する異常レベルと異常対応処理に基づき、異常発生箇所に対し異常レベルと異常対応処理の対応付けを設定すると共に、デバイス・ソフトウェアの依存関係および複合的な異常対応処理を設定することを特徴とする(2)乃至(4)のいずれかに記載のRAS機能を備える組み込み機器。
( 5) The integrated abnormality handling processing logic sets the correspondence between the abnormality level and the abnormality handling processing for the abnormality occurrence location based on the abnormality level and the abnormality handling processing for each of the abnormal locations for which a plurality of types are defined, An embedded device having the RAS function according to any one of ( 2) to ( 4), wherein device software dependency and complex abnormality handling processing are set.

6)
前記論理RAS機能部は、前記論理デバイス異常検出ロジック対するデバイス定周期診断用タイマおよび前記ハードウェアに設けたウォッチドッグタイマに対する物理ウォッチドッグタイマリセット手段を備えることを特徴とする(1)乃至(5)のいずれかに記載のRAS機能を備える組み込み機器。
( 6)
It said logic RAS function unit is characterized in that it comprises a physical watchdog timer reset means watchdog timer provided in the device periodic diagnosis timer and the hardware against the logic device abnormality detection logic (1) to ( 5) An embedded device having the RAS function described in any one of 5) .

7)前記論理デバイス異常検出ロジックおよび前記論理ウォッチドッグ用タイマに対して論理RAS機能設定情報を与える第1データベースと、
前記論理デバイス異常検出ロジックおよび前記ソフトウェア処理異常検出ロジックに対して過去の異常履歴情報を与える第2データベースと、
を備える(3)または(4)に記載のRAS機能を備える組み込み機器。
( 7) a first database that provides logical RAS function setting information to the logical device abnormality detection logic and the logical watchdog timer;
A second database that provides past abnormality history information to the logic device abnormality detection logic and the software processing abnormality detection logic;
( 3) or an embedded device having the RAS function according to (4) .

(8)前記統合化異常対応処理ロジックの異常処理内容は、前記第2データベースの異常履歴に記録されることを特徴とする(7)に記載のRAS機能を備える組み込み機器。
(8) The embedded device having the RAS function according to (7) , wherein the abnormality processing content of the integrated abnormality handling processing logic is recorded in an abnormality history of the second database.

本発明によれば、次のような効果を期待することができる。
(1)RAS機能を論理RAS機能部で統合的に提供することにより、RAS機能の一元管理を実現できる。従来、個々のアプリケーションに散在していた処理を、ハイパーバイザ層の論理RAS機能部へ一元化することで、物理デバイスを使用する上位層のアプリケーションに対する修正を減らし、RAS機能の実装を容易にできる環境を実現することができる。
According to the present invention, the following effects can be expected.
(1) By providing the RAS function in an integrated manner using the logical RAS function unit, unified management of the RAS function can be realized. An environment that can easily implement the RAS function by reducing the modification to the upper layer application that uses the physical device by centralizing the processing that has been scattered in the individual applications into the logical RAS function unit of the hypervisor layer. Can be realized.

(2)物理デバイスを機能的に分類された論理デバイスに抽象化することで、機種ごとの差分を吸収できる。RAS機能の実装が必要な物理デバイスを、図2のテーブル1に示す5種類の論理デバイスに抽象化し、物理デバイスの差に依存しない論理デバイスの論理機能に対するRAS機能を提供することで、RAS機能を個々の機種専用に実装する必要がなくなる。 (2) By abstracting physical devices into functionally categorized logical devices, differences for each model can be absorbed. By abstracting the physical device that needs to implement the RAS function into the five types of logical devices shown in Table 1 of FIG. 2 and providing the RAS function for the logical function of the logical device that does not depend on the difference between the physical devices, the RAS function is provided. Need not be implemented for individual models.

各物理デバイスに対するRAS機能を、論理デバイスの論理ロジックと物理デバイス固有の処理に切り分けることで、診断ロジックの共通化と物理デバイス固有処理の一元化を図ることができる。   By dividing the RAS function for each physical device into the logical logic of the logical device and the processing specific to the physical device, the diagnosis logic can be shared and the physical device specific processing can be unified.

抽象化した5種類の論理デバイスに対するRAS機能へ単純化させたことにより、OSやROMモニタなどの仕組みを必要とすることなく、RAS機能をハイパーバイザ層で実現することが可能となる。   By simplifying the RAS function for five types of abstracted logical devices, the RAS function can be realized in the hypervisor layer without requiring a mechanism such as an OS or a ROM monitor.

(3)論理WDT群により、複数のアプリケーション処理の監視を実現することができる。論理RAS機能部により複数の論理WDT群を提供することにより、複数のアプリケーション処理について監視を行うことができる。 (3) A plurality of application processes can be monitored by the logical WDT group. By providing a plurality of logical WDT groups by the logical RAS function unit, it is possible to monitor a plurality of application processes.

統合化異常対応処理ロジックとの組み合わせにより、ハードウェアのリセット以外にもきめ細かな異常対応処理を行うことができる。また、論理WDT群をハイパーバイザ層で実現することにより、ソフトウェアタイマの信頼性に影響するソフトウェアを僅かな部分に限定することができる。   By combining with the integrated abnormality response processing logic, it is possible to perform detailed abnormality response processing in addition to hardware reset. Further, by realizing the logical WDT group in the hypervisor layer, software that affects the reliability of the software timer can be limited to a small portion.

(4)統合化異常対応処理ロジックにより、複合的な異常対応処理を実現することができる。異常発生箇所に対する異常のレベルとして、図2のテーブル3に示す3種類の異常レベルを定義し、これに対応付ける異常対応処理項目を図2のテーブル4に示す4種類に統一することで、異常対応処理ロジックの共通化と物理デバイス固有処理の一元化を行うことができる。 (4) Complex abnormality handling processing can be realized by the integrated abnormality handling processing logic. By defining the three types of abnormality levels shown in Table 3 in FIG. 2 as the abnormality level for the location where an abnormality has occurred, and by unifying the abnormality handling processing items associated with them into the four types shown in Table 4 in FIG. Processing logic can be shared and physical device specific processing can be unified.

異常個所に対する異常レベルと異常対応処理項目の組み合わせにより、きめ細かな異常対応処理が行える。また、異常レベルと異常対応処理の種類を限定して処理を単純化することにより、RAS機能をハイパーバイザ層で実現することが可能となる。更に、異常対応処理を統合化することにより、依存関係をもつ複数のデバイスおよびアプリケーションに対して複合的な異常対応処理を行うことができる。   Detailed abnormality response processing can be performed by combining the abnormality level and abnormality response processing items for the abnormal part. Further, by simplifying the processing by limiting the abnormality level and the type of abnormality handling processing, the RAS function can be realized in the hypervisor layer. Further, by integrating the abnormality handling processing, it is possible to perform complex abnormality handling processing for a plurality of devices and applications having dependency relationships.

本発明を適用したRAS機能を備えた組み込み機器の一実施例を示す機能ブロック図である。It is a functional block diagram which shows one Example of the embedded apparatus provided with the RAS function to which this invention is applied. 論理RAS設定情報を示すテーブル1乃至テーブル4である。3 is Table 1 to Table 4 showing logical RAS setting information. 論理RAS設定情報を示すテーブル5乃至テーブル8および過去の異常履歴例を示すテーブル9、異常時のシステム状態例を示すテーブル10である。They are Table 5 to Table 8 showing logical RAS setting information, a table 9 showing an example of a past abnormality history, and a table 10 showing an example of a system state at the time of abnormality. 物理デバイス初期化処理における異常検出ロジックへの遷移を示すフローチャートである。It is a flowchart which shows the transition to the abnormality detection logic in a physical device initialization process. 物理デバイスへのアクセスから異常検出ロジックへの遷移を示すフローチャートである。It is a flowchart which shows the transition from the access to a physical device to an abnormality detection logic. 論理デバイスに対する異常検出ロジックの動作を示すフローチャートである。It is a flowchart which shows operation | movement of the abnormality detection logic with respect to a logic device. ソフトウェア処理監視と異常検出ロジックの動作を示すフローチャートである。It is a flowchart which shows operation | movement of a software process monitoring and abnormality detection logic. 統合された異常対応ロジックの動作を示すフローチャートである。It is a flowchart which shows operation | movement of the integrated abnormality response logic. 異常対応処理項目検索の動作を示すフローチャートである。It is a flowchart which shows the operation | movement of an abnormality handling process item search. 従来のRAS機能を備えた組み込み機器の構成例を示す機能ブロック図である。It is a functional block diagram which shows the structural example of the embedded apparatus provided with the conventional RAS function.

以下本発明を、図面を用いて詳細に説明する。図1は、本発明を適用したRAS機能を備えた組み込み機器の一実施例を示す機能ブロック図である。図10で説明した従来構成と同一要素には同一符号を付して説明を省略する。   Hereinafter, the present invention will be described in detail with reference to the drawings. FIG. 1 is a functional block diagram showing an embodiment of an embedded device having a RAS function to which the present invention is applied. The same elements as those of the conventional configuration described with reference to FIG.

図1において、アプリケーションソフトウェア400のアプリケーション401、402、403、404は、システムソフトウェア500のデバイスドライバを介してハードウェア100の物理デバイス群101を利用する。   In FIG. 1, applications 401, 402, 403, and 404 of the application software 400 use the physical device group 101 of the hardware 100 via a device driver of the system software 500.

本発明の構成上の特徴は、システムソフトウェア500のブートローダ510及びOS520とハードウェア100との間にハイパーバイザ層600を介在させ、このハイパーバイザ層に実装した論理RAS機能部620により、アプリケーションソフトウェアおよびハードウェアのRAS機能を一元管理する仕組みを提供した点にある。   The constitutional feature of the present invention is that the hyperloader layer 600 is interposed between the boot loader 510 and OS 520 of the system software 500 and the hardware 100, and the application software and the logical RAS function unit 620 mounted on the hypervisor layer are provided. The point is that a mechanism for centrally managing the RAS function of the hardware is provided.

以下、本発明の論理RAS機能に関連する要素の構成と動作を説明する。ハイパーバイザ層600内の物理デバイス中継インタフェース610は、システムソフトウェア500を経由した物理デバイス群101へのアクセスを監視し、必要なタイミングに応じて論理RAS機能を実行させるための機能ブロックであり、以下に述べる2種類のインタフェース(1)及び(2)を、物理デバイスを使用する上位層のソフトウェアへ提供する。   The configuration and operation of elements related to the logical RAS function of the present invention will be described below. The physical device relay interface 610 in the hypervisor layer 600 is a functional block for monitoring access to the physical device group 101 via the system software 500 and executing a logical RAS function according to necessary timing. The two types of interfaces (1) and (2) described in (1) are provided to the upper layer software using the physical device.

(1)物理デバイス初期化インタフェース611:
物理デバイスを初期化する際に使用するインタフェースであり、物理デバイスの初期化において異常が発生した場合、論理RAS機能の実行へ遷移する。図4は、物理デバイス初期化処理における異常検出ロジックへの遷移を示すフローチャートである。
(1) Physical device initialization interface 611:
This interface is used when initializing a physical device. When an abnormality occurs during initialization of a physical device, the logical RAS function is executed. FIG. 4 is a flowchart showing a transition to the abnormality detection logic in the physical device initialization process.

ステップS1の処理開始で、システムソフトウェア500のブートローダ510における各種デバイスドライバ511内のデバイス初期化ドライバ512からの信号cを物理デバイス初期化インタフェース611が取得して、ステップS2でハードウェア100の物理デバイス群101に初期化信号kを出力する。   At the start of the processing in step S1, the physical device initialization interface 611 acquires the signal c from the device initialization driver 512 in the various device drivers 511 in the boot loader 510 of the system software 500, and in step S2, the physical device of the hardware 100 An initialization signal k is output to the group 101.

ステップS3のチェックで初期化時に異常が発生した場合は、信号jを後述する論理デバイス異常検出ロジック621に送りステップS4で異常検出ロジックを実行させ、ステップS5で物理デバイス初期化処理を終了する。ステップS3のチェックで初期化時に異常が発生ない場合は、ステップS5にスキップして物理デバイス初期化処理を終了する。   If an abnormality occurs during initialization in the check in step S3, the signal j is sent to a logic device abnormality detection logic 621 described later, the abnormality detection logic is executed in step S4, and the physical device initialization process is terminated in step S5. If there is no abnormality during initialization in the check in step S3, the process skips to step S5 and ends the physical device initialization process.

(2)物理デバイスアクセスインタフェース612:
アプリケーションが物理デバイスへアクセスする際に使用するインタフェースである。アプリケーション401、402、403からの物理デバイス使用要求aが、ソフトウェア500内のOS520が備える各種デバイスドライバ511で受け付けられると、デバイスアクセス手段521より使用要求信号eが物理デバイスアクセスインタフェース612に送信され、デバイスごとに決められたタイミングで論理RAS機能部620の実行へ遷移する。
(2) Physical device access interface 612:
An interface used when an application accesses a physical device. When the physical device use request a from the applications 401, 402, and 403 is received by the various device drivers 511 provided in the OS 520 in the software 500, a use request signal e is transmitted from the device access unit 521 to the physical device access interface 612. Transition is made to execution of the logical RAS function unit 620 at a timing determined for each device.

図5は、物理デバイスへのアクセスから異常検出ロジックへの遷移を示すフローチャートである。ステップS1で要求信号eが物理デバイスアクセスインタフェース612に送信され、ステップS2で物理デバイスへのアクセスが開始されるが、事前のチェックステップS3でアクセスを行う前に異常検出が必要な場合には、信号hを論理デバイス異常検出ロジック621に出力して異常検出を実行させた後、信号lを物理デバイス群101に出力し、ステップS5で物理デバイスに対して要求された処理を実行する。   FIG. 5 is a flowchart showing a transition from access to a physical device to abnormality detection logic. In step S1, a request signal e is transmitted to the physical device access interface 612, and access to the physical device is started in step S2. However, if it is necessary to detect an abnormality before accessing in the prior check step S3, After the signal h is output to the logical device abnormality detection logic 621 and abnormality detection is executed, the signal l is output to the physical device group 101, and processing requested for the physical device is executed in step S5.

チェックステップS3で、異常検出が必要ない場合には、ステップS4をスキップして信号lを物理デバイス群101に出力し、ステップS5で物理デバイスに対して要求された処理を実行する。   If it is not necessary to detect abnormality in the check step S3, step S4 is skipped and the signal l is output to the physical device group 101, and the processing requested for the physical device is executed in step S5.

更に、チェックステップS6でアクセスを行った後に異常検出が必要な場合には、信号hを論理デバイス異常検出ロジック621に出力して異常検出を実行させた後、信号lを物理デバイス群101に出力し、ステップS7で物理デバイスに対して要求された処理を実行し、ステップS8で処理を終了する。チェックステップS6で、異常検出が必要ない場合には、ステップS7をスキップしてステップS8で処理を終了する。   Further, if abnormality detection is necessary after the access is made in the check step S6, the signal h is output to the logical device abnormality detection logic 621 to execute abnormality detection, and then the signal l is output to the physical device group 101. In step S7, the requested process is executed for the physical device, and the process ends in step S8. If it is not necessary to detect abnormality in check step S6, step S7 is skipped and the process ends in step S8.

次に、本発明の主要部を成す論理RAS機能部620につき説明する。論理RAS機能部620は、ハイパーバイザ層600において、論理的なRAS機能を提供する機能ブロックである。   Next, the logical RAS function unit 620 constituting the main part of the present invention will be described. The logical RAS function unit 620 is a functional block that provides a logical RAS function in the hypervisor layer 600.

論理RAS機能部620は、物理デバイス群101を、論理的な複数種類のデバイスに分類した論理デバイスに対する異常検出ロジック621、タイマ管理手段622、ソフトウェア処理異常検出ロジック626、および統合化異常対応処理ロジック627を備えている。   The logical RAS function unit 620 includes an abnormality detection logic 621, a timer management unit 622, a software processing abnormality detection logic 626, and an integrated abnormality response processing logic for logical devices that classify the physical device group 101 into a plurality of types of logical devices. 627.

論理デバイス異常検出ロジック621は、論理RAS機能の実行を要求する物理デバイスを、図2のテーブル1に示すように、論理CPU,論理メモリ、論理ファイル、論理I/O、論理センサの5種類に分類し、各論理デバイスに対して定義された診断や検査を実行する。   The logical device abnormality detection logic 621 includes five types of physical devices that request execution of the logical RAS function: a logical CPU, a logical memory, a logical file, a logical I / O, and a logical sensor as shown in Table 1 of FIG. Classify and execute diagnostics and tests defined for each logical device.

論理デバイスは、図2のテーブル2に示す論理機能を有するデバイスとして抽象化されたデバイスであり、それぞれの論理機能に対し、正常性を検証するための診断・検査項目が定義される。異常が検出された際は、異常の状態と過去の異常履歴から図2のテーブル3に示す3種類の異常レベル、レベル1、レベル2、レベル3を判定し、統合化異常対応処理ロジック627へ信号p1で異常検出情報を伝達する。   The logical device is a device abstracted as a device having a logical function shown in Table 2 of FIG. 2, and diagnostic / inspection items for verifying normality are defined for each logical function. When an abnormality is detected, three types of abnormality levels, Level 1, Level 2, and Level 3 shown in Table 3 of FIG. 2 are determined from the abnormality state and past abnormality history, and the integrated abnormality response processing logic 627 is performed. The abnormality detection information is transmitted by the signal p1.

タイマ管理手段622は、論理WDT群623、定周期診断を行うデバイス定周期診断タイマ624、および物理WDTリセットタイマ625を実装する。論理WDT群623は、ハイパーバイザ層600で論理的なWDT機能を複数のソフトウェアタイマで実現し、ソフトウェア処理の監視機能として提供する。異常が検出された際は、ソフトウェア処理異常検出ロジック626へ、ソフトウェアの異常情報信号nで伝達する。   The timer management unit 622 includes a logical WDT group 623, a device fixed period diagnosis timer 624 that performs fixed period diagnosis, and a physical WDT reset timer 625. The logical WDT group 623 implements a logical WDT function in the hypervisor layer 600 with a plurality of software timers, and provides it as a monitoring function for software processing. When an abnormality is detected, a software abnormality information signal n is transmitted to the software processing abnormality detection logic 626.

デバイス定周期診断タイマ624は、ハードウェアの定周期診断を行うトリガとなるタイマであり、論理デバイス異常検出ロジック621へ一定周期で物理デバイスの診断を要求する信号mを送信する。   The device fixed period diagnosis timer 624 is a timer that serves as a trigger for performing hardware fixed period diagnosis, and transmits a signal m requesting physical device diagnosis to the logical device abnormality detection logic 621 at a constant period.

タイマ管理手段622は、ソフトウェア監視の中核を担う機能ブロックであるため、タイマ管理手段自身で物理WDT102を用いた異常の監視を行う。これは、物理WDTリセットタイマ625により、一定周期で物理WDT102のリセットを要求する信号qを出力することで実現する。信号qは、後述する物理デバイス固有処理手段630内の物理WDTリセット手段633に渡され、この物理WDTリセット処理手段633からの信号uにより、ハードウェア100の物理WDT102をリセットする。   Since the timer management unit 622 is a functional block that plays a central role in software monitoring, the timer management unit itself monitors an abnormality using the physical WDT 102. This is realized by outputting a signal q requesting resetting of the physical WDT 102 at a constant cycle by the physical WDT reset timer 625. The signal q is transferred to a physical WDT reset unit 633 in a physical device specific processing unit 630 described later, and the physical WDT 102 of the hardware 100 is reset by a signal u from the physical WDT reset processing unit 633.

ソフトウェア処理異常検出ロジック626は、論理WDT群623により異常検出されたソフトウェアの異常情報信号nと、第2データベース629を検索した過去の異常履歴データd5から、図2のテーブル3に示すレベル1、レベル2、レベル3の3種類の異常レベルを判定し、その異常検出情報を信号p2で統合化異常対応処理ロジック627へ伝達する。   The software processing abnormality detection logic 626 uses the level 1 shown in the table 3 of FIG. 2 from the abnormality information signal n of software detected abnormally by the logical WDT group 623 and the past abnormality history data d5 retrieved from the second database 629. Three types of abnormality levels of level 2 and level 3 are determined, and the abnormality detection information is transmitted to the integrated abnormality response processing logic 627 by a signal p2.

統合化異常対応処理ロジック627は、論理デバイス異常検出ロジック621およびソフトウェア処理異常検出ロジック626から、異常検出箇所と異常レベルの情報を信号p1およびp2で受信し、異常対応処理を実行する機能を備える。   The integrated abnormality handling processing logic 627 has a function of receiving abnormality detection location and abnormality level information from signals p1 and p2 from the logic device abnormality detection logic 621 and the software processing abnormality detection logic 626, and executing abnormality handling processing. .

統合化異常対応処理ロジック627は、受信した複数の異常検出情報p1,p2と第1データベース628にアクセスして得られる論理RAS機能設定データd3から、異常発生箇所、異常発生箇所と依存関係にあるデバイス、ソフトウェア、および異常の同時性を判断し、複合的に異常対応処理ロジックを実行する。異常対応処理は、図2のテーブル4に示す、4種類の異常対応処理1乃至4を提供する。   The integrated abnormality handling processing logic 627 is dependent on the abnormality occurrence location and the abnormality occurrence location from the received plurality of abnormality detection information p1, p2 and the logical RAS function setting data d3 obtained by accessing the first database 628. Judgment of device, software, and abnormality simultaneity and complex execution of abnormality handling logic. The abnormality handling process provides four types of abnormality handling processes 1 to 4 shown in the table 4 of FIG.

第1データベース628は、論理RAS機能を実現するための設定情報が格納された記憶領域である。図2のテーブル1に示す物理デバイスと論理デバイスの対応付け、図2のテーブル2に示す各論理デバイスと物理デバイス固有処理の対応付け、図3のテーブル5に示すデバイス・ソフトウェアの依存関係、図3のテーブル6に示す異常発生箇所の異常レベルと異常対応処理項目の対応付け、図3のテーブル7に示す複合的な異常対応処理項目の対応付け、および図3のテーブル8に示す論理WDT用タイマ623のタイムアップ時間についての設定情報を保持する。   The first database 628 is a storage area in which setting information for realizing the logical RAS function is stored. Correspondence between physical devices and logical devices shown in Table 1 in FIG. 2, correspondence between each logical device and physical device specific processing shown in Table 2 in FIG. 2, device / software dependency shown in Table 5 in FIG. 3 is associated with the abnormality level and abnormality handling processing item of the abnormality occurrence location shown in the table 6, the association of the complex abnormality handling processing item shown in the table 7 of FIG. 3, and the logical WDT shown in the table 8 of FIG. 3. The setting information about the time-up time of the timer 623 is held.

第2データベース629は、図3のテーブル9に示す過去に異常が検出された時の異常検出履歴、および、図3のーブル10に示す異常時のシステムの状態を記録する記憶領域である。異常検出履歴は異常検出時に異常レベルを判定するための情報として使用される。異常時のシステムの状態は、メンテナンス作業者などが異常の発生するシステムの状態を参照するために使用される。   The second database 629 is a storage area for recording an abnormality detection history when an abnormality is detected in the past shown in the table 9 of FIG. 3, and a system state at the time of abnormality shown in the table 10 of FIG. The abnormality detection history is used as information for determining an abnormality level when an abnormality is detected. The system state at the time of abnormality is used for a maintenance worker or the like to refer to the state of the system where the abnormality occurs.

物理デバイス固有処理部630は、各物理デバイスに対する異常検出処理手段631、および異常対応処理手段632を実装する機能ブロックである。異常検出処理手段631は、論理デバイス異常検出ロジック621からの信号oに対応した物理デバイス固有処理を実行する。異常対応処理手段632は、統合化異常対応処理ロジック627からの信号rにより伝達された異常対応情報に対応した物理デバイス固有処理を実行する。   The physical device specific processing unit 630 is a functional block that implements an abnormality detection processing unit 631 and an abnormality handling processing unit 632 for each physical device. The abnormality detection processing unit 631 executes physical device specific processing corresponding to the signal o from the logical device abnormality detection logic 621. The abnormality handling processing unit 632 executes physical device specific processing corresponding to the abnormality handling information transmitted by the signal r from the integrated abnormality handling processing logic 627.

次に本発明組み込み機器の動作を、以下の(1)項乃至(4)項で説明する。
(1)ソフトウェアに対する論理RAS機能実行のインタフェース:
論理RAS機能の実行は、アプリケーションソフトウェア400の処理からハイパーバイザ層600の物理デバイス中継インタフェース610へアクセスすることによって行われる。
Next, the operation of the embedded device of the present invention will be described in the following items (1) to (4).
(1) Logical RAS function execution interface to software:
The execution of the logical RAS function is performed by accessing the physical device relay interface 610 of the hypervisor layer 600 from the processing of the application software 400.

物理デバイス中継インタフェース610は、物理デバイス初期化インタフェース611および物理デバイスアクセスインタフェース612の2種類のインタフェースを持ち、夫々、既に説明した図4、図5に示す動作フローにより論理RAS機能が実行される。   The physical device relay interface 610 has two types of interfaces, a physical device initialization interface 611 and a physical device access interface 612, and the logical RAS function is executed according to the operation flows shown in FIGS. 4 and 5, respectively.

(2)論理デバイスに対する異常検出ロジック:
図6は、論理デバイスに対する異常検出ロジックの動作を示すフローチャートである。ステップS1で処理が開始されると、ステップS2で信号h,j,mを論理デバイス異常検出ロジック621が受け取る。
(2) Anomaly detection logic for logic devices:
FIG. 6 is a flowchart showing the operation of the abnormality detection logic for the logical device. When the process is started in step S1, the logic device abnormality detection logic 621 receives the signals h, j, and m in step S2.

論理デバイス異常検出ロジック621は、ステップS3で、第1データベース628にアクセスして取得したデータd1を参照し、論理RAS機能の実行を要求する物理デバイスについて、論理RAS機能設定情報に記録された対応付けにより、5種類の論理デバイスに分類する。   In step S3, the logical device abnormality detection logic 621 refers to the data d1 acquired by accessing the first database 628, and the correspondence recorded in the logical RAS function setting information for the physical device that requests execution of the logical RAS function. This is classified into 5 types of logical devices.

次に、ステップS4でデータd1を参照し、各論理デバイスの論理機能に対応した診断、検査項目を参照し、実行する必要のある診断、検査項目を選出する。これは、論理RAS機能実行の要求元、すなわち物理デバイス中継インタフェース610で提供される2種類のインタフェースによって、実行する異常検出ロジックが異なるためである。   Next, in step S4, the data d1 is referred to, the diagnosis and inspection items corresponding to the logical function of each logical device are referred to, and the diagnosis and inspection items that need to be executed are selected. This is because the abnormality detection logic to be executed differs depending on the request source of the logical RAS function execution, that is, the two types of interfaces provided by the physical device relay interface 610.

この対応付けは、図2のテーブル2の例に示すような情報として論理RAS機能設定情報に記録されている。実行する必要のある診断、検査項目については、信号oを出力し、ステップS5で夫々対応する物理デバイス固有の異常検出処理手段631を呼び出し、信号sにより物理デバイス群101の異常検出処理を実行する。   This association is recorded in the logical RAS function setting information as information as shown in the example of the table 2 in FIG. For diagnosis and inspection items that need to be executed, a signal o is output, the corresponding physical device specific abnormality detection processing means 631 is called in step S5, and the abnormality detection processing of the physical device group 101 is executed by the signal s. .

ステップS6のチェックで異常が検出された場合は、ステップS7で異常の程度と第2データベース629にアクセスして取得したデータd4を参照し、過去の異常検出履歴から異常レベルを判定し、ステップS8でデータd4で異常履歴を更新したうえで、ステップS9で異常検出箇所と異常レベルの情報を、信号p1で統合化異常対応処理ロジック627に伝達し、ステップS10で論理デバイス異常検出ロジックの処理を終了する。ステップS6のチェックで異常が検出されない場合は、ステップS10にスキップして処理を終了する。   If an abnormality is detected in the check of step S6, the abnormality level and the data d4 acquired by accessing the second database 629 are referred to in step S7, the abnormality level is determined from the past abnormality detection history, and step S8. After updating the abnormality history with the data d4 in step S9, the abnormality detection location and abnormality level information is transmitted to the integrated abnormality response processing logic 627 in step S9, and the logic device abnormality detection logic is processed in step S10. finish. If no abnormality is detected in the check in step S6, the process skips to step S10 and ends.

具体例として、デバイス・ソフトウェアAIO(Analog Input Output)アクセス時の異常検出ロジックの動作を記述する。AIOの物理デバイスアクセスインタフェース612にアクセスがあると、論理RAS機能部620に実行の要求が伝達される。論理デバイス異常検出ロジック621は、図2のテーブル1からAIOを論理I/Oであると分類し、図2のテーブル2に従ってAIOの診断、検査項目を選定し、AIO固有処理を呼び出して診断を行う。   As a specific example, the operation of the abnormality detection logic when the device software AIO (Analog Input Output) is accessed will be described. When access is made to the AIO physical device access interface 612, an execution request is transmitted to the logical RAS function unit 620. The logical device abnormality detection logic 621 classifies the AIO as a logical I / O from the table 1 in FIG. 2, selects the AIO diagnosis and inspection items according to the table 2 in FIG. 2, calls the AIO specific process, and performs the diagnosis. Do.

ここで致命的な異常が検出された場合、図3のテーブル9にアクセスして記録された過去の異常検出履歴を参照し、過去に異常検出がないことから、異常レベルをレベル2(致命的、再現性無し)と判定して、異常検査履歴を更新のうえ信号p1を統合化異常対応処理ロジック627へ伝達する。   If a fatal abnormality is detected here, the previous abnormality detection history recorded by accessing the table 9 in FIG. 3 is referred to, and since no abnormality has been detected in the past, the abnormality level is set to level 2 (fatal , No reproducibility), the abnormality inspection history is updated, and the signal p1 is transmitted to the integrated abnormality response processing logic 627.

(3)ソフトウェア処理監視と異常検出ロジック:
図7は、ソフトウェア処理監視と異常検出ロジックの動作を示すフローチャートである。論理RAS機能部620のタイマ管理手段622は、複数のソフトウェアタイマで構成された論理WDT群623を実装して上位のソフトウェア処理に提供し、これにより複数のソフトウェア処理の監視を実現する。
(3) Software processing monitoring and abnormality detection logic:
FIG. 7 is a flowchart showing the operation of the software process monitoring and abnormality detection logic. The timer management unit 622 of the logical RAS function unit 620 implements a logical WDT group 623 composed of a plurality of software timers and provides it to the upper software processing, thereby realizing monitoring of the plurality of software processing.

論理WDT群623のスタートとリセット機能は、監視対象となるアプリケーション402、403、404自身が定周期WDTリセット要求手段402A、403A、404Aを実装し、タイマ管理手段622はこれら定周期WDTリセット要求手段を呼び出す。   The start and reset functions of the logical WDT group 623 are such that the applications 402, 403, and 404 themselves to be monitored implement the fixed-cycle WDT reset request means 402A, 403A, and 404A. Call.

ステップS1でソフトウェア処理の監視が開始されると、OS520内のWDTリセット手段522からの信号f1、またはブートローダ510内のWDTリセット手段513からの信号f2により、ステップS2で論理WDT群623がスタートする。   When monitoring of software processing is started in step S1, the logical WDT group 623 is started in step S2 by the signal f1 from the WDT reset unit 522 in the OS 520 or the signal f2 from the WDT reset unit 513 in the boot loader 510. .

論理WDT群623は、ステップS3で第1データベース628へアクセスしたデータd2から、設定されたタイムアップ時間を論理RAS機能設定情報より取得し、ステップS4で論理WDT群のタイマのカウントを開始する。   The logical WDT group 623 obtains the set time-up time from the logical RAS function setting information from the data d2 accessed to the first database 628 in step S3, and starts counting the timer of the logical WDT group in step S4.

アプリケーション402、403、404は、正常に動作している場合には、定周期WDTリセット要求手段402A、403A、404Aにより、カウンタがタイムアップしない周期でカウンタをクリアする。   When the applications 402, 403, and 404 are operating normally, the counters are cleared at a cycle in which the counters do not time up by the fixed cycle WDT reset requesting means 402A, 403A, and 404A.

ステップS5のチェックでソフトウェアの異常により論理WDT群623のいずれかがタイムアップした場合は、ステップS6でソフトウェアの異常情報が信号nでソフトウェア処理異常検出ロジック626に伝達される。ステップS1からS6までの処理が論理WDT群623の処理範囲(A)である。   If any of the logical WDT groups 623 is timed up due to a software abnormality in the check in step S5, the software abnormality information is transmitted to the software processing abnormality detection logic 626 as a signal n in step S6. The processing from step S1 to S6 is the processing range (A) of the logical WDT group 623.

ソフトウェア処理異常検出ロジック626は、ステップS7で第2データベース629にアクセスしたデータd5により、過去の異常検出履歴を参照することにより異常レベルを判定する。   The software processing abnormality detection logic 626 determines the abnormality level by referring to the past abnormality detection history based on the data d5 accessed to the second database 629 in step S7.

更に、ステップS8で、データd5で第2データベース629の異常検出履歴を更新したうえで、ステップS9で異常検出箇所と異常レベルの情報を、信号p2で統合化異常対応処理ロジック627に伝達し、ステップS10でソフトウェア処理の監視を終了する。ステップS7からS9までの処理がソフトウェア処理異常検出ロジック626の処理範囲(B)である。   Further, in step S8, the abnormality detection history of the second database 629 is updated with the data d5, and in step S9, the information of the abnormality detection location and the abnormality level is transmitted to the integrated abnormality handling processing logic 627 by the signal p2. In step S10, the monitoring of the software process ends. The processing from step S7 to S9 is the processing range (B) of the software processing abnormality detection logic 626.

具体例として、アプリケーションとしてインストールされている(図示されていない)デバイス・ソフトウェである、図3のテーブル5に定義されているHTTPサーバの監視処理について記述する。   As a specific example, a monitoring process of an HTTP server defined in the table 5 of FIG. 3 which is device software (not shown) installed as an application will be described.

HTTPサーバ自身には、論理WDT群623のスタートとリセット処理が実装される。HTTPサーバが論理WDT群623をスタートさせると、論理WDT群623は、図3テーブル8の例のようなタイムアップ時間の設定からタイムアップ時間60秒を取得し、カウントを開始する。   In the HTTP server itself, the start and reset processing of the logical WDT group 623 is implemented. When the HTTP server starts the logical WDT group 623, the logical WDT group 623 acquires a time-up time of 60 seconds from the setting of the time-up time as in the example of FIG. 3 table 8, and starts counting.

HTTPサーバは、正常時には60秒を超えない周期で論理WDT群623をリセットする。HTTPサーバに異常があった場合、論理WDT群623はタイムアップし、ソフトウェアの異常情報を信号nでソフトウェア処理異常検出ロジック626に伝達する。   The HTTP server resets the logical WDT group 623 at a period not exceeding 60 seconds when normal. When there is an abnormality in the HTTP server, the logical WDT group 623 is timed up and transmits software abnormality information to the software processing abnormality detection logic 626 by a signal n.

ソフトウェア処理異常検出ロジック626では、データd5により、第2データベース629へのアクセスでテーブル9の異常検出履歴を参照し、過去にも異常が発生していることから、異常レベルをレベル3(致命的、再現性あり)と判定し、異常検出履歴を更新のうえ情報を信号p2により統合化異常対応処理ロジック627へ伝達する。   The software processing abnormality detection logic 626 refers to the abnormality detection history of the table 9 by accessing the second database 629 based on the data d5, and an abnormality has occurred in the past. Therefore, the abnormality level is set to level 3 (Fatal). And the abnormality detection history is updated, and the information is transmitted to the integrated abnormality response processing logic 627 by the signal p2.

(4)統合化異常対応処理ロジック627:
図8は、統合された異常対応ロジックの動作を示すフローチャートである。ステップS1で異常対応処理ロジックが開始されると、ステップS2で統合化異常対応ロジック627は、論理デバイス異常検出ロジック621からの異常情報信号p1またはソフトウェア異常検出ロジック626からの異常情報信号p2により、異常検出箇所と異常レベルの情報を受信する。
(4) Integrated abnormality response processing logic 627:
FIG. 8 is a flowchart showing the operation of the integrated abnormality handling logic. When the abnormality handling processing logic is started in step S1, the integrated abnormality handling logic 627 in step S2 receives the abnormality information signal p1 from the logic device abnormality detection logic 621 or the abnormality information signal p2 from the software abnormality detection logic 626. Receives information on anomaly detection locations and anomaly levels.

ステップS3で異常検出箇所と異常レベルに対応した異常対応処理を検索する。まず、検索では、異常発生箇所に対し異常レベルに従った対応処理を、データd3で第1データベース268にアクセスし、論理RAS機能設定情報から検索(異常対応処理項目検索の動作フローは、図9で説明する)し、項目を選出する。   In step S3, an abnormality handling process corresponding to the abnormality detection location and the abnormality level is searched. First, in the search, the correspondence processing according to the abnormality level for the location where the abnormality has occurred is accessed from the first database 268 with the data d3 and searched from the logical RAS function setting information (the operation flow of the abnormality handling processing item search is shown in FIG. And select an item.

ステップS4のチェックで物理デバイスに対する異常処理がある場合には、信号rを出力して、ステップS5で物理デバイス固有処理部630内の異常対応処理手段632を起動し、信号tで物理デバイス群101により該当する物理デバイス固有の異常対応処理を実行する。   If there is an abnormality process for the physical device in the check in step S4, the signal r is output, the abnormality response processing means 632 in the physical device specific processing unit 630 is activated in step S5, and the physical device group 101 is received by the signal t. To execute the error handling process specific to the corresponding physical device.

次に、ステップS6のチェックでソフトウェア処理に異常がある場合には、OS520内のアプリケーション管理手段523に信号gを通知し、ステップS7でソフトウェの管理機能へ異常対応処理を要求する。   Next, if there is an abnormality in the software processing in the check in step S6, the signal g is notified to the application management means 523 in the OS 520, and an abnormality handling process is requested to the software management function in step S7.

ステップS8でデータd6を第2データベース629に送信し、テーブル9およびテーブル10に過去の異常履歴に異常時のシステムの状態を記録し、ステップS9で異常対応処理ロジックを終了する。   In step S8, the data d6 is transmitted to the second database 629, the system state at the time of abnormality is recorded in the past abnormality history in the tables 9 and 10, and the abnormality handling processing logic is terminated in step S9.

図9は、統合化異常対応処理ロジック627による異常対応処理項目検索の動作を示すフローチャートである。ステップS1で異常対応処理検索が開始されると、ステップS2では統合化異常対応処理ロジック627は、データd3で第1データベース628にアクセスし、テーブル6を参照して異常個所の異常レベルに従った異常対応処理項目を検索する。   FIG. 9 is a flowchart showing the operation of abnormality handling process item search by the integrated abnormality handling processing logic 627. When the abnormality response processing search is started in step S1, the integrated abnormality response processing logic 627 accesses the first database 628 with the data d3 and follows the abnormality level of the abnormal part with reference to the table 6 in step S2. Search for error handling items.

ステップS3では、第1データベース628にアクセスしたデータd3で、テーブル5を参照し、異常発生箇所と依存関係にあるデバイス・ソフトウェアを検索する。ステップS4のチェックで依存するデバイス・ソフトウェアがある場合には、ステップS5のチェックに進み、依存する部分で異常が検出されていなければ、ステップS6でデータd3により第1データベース628にアクセスし、依存する部分への統合的な異常対応処理を検索する。   In step S3, the data d3 that has accessed the first database 628 is referred to the table 5 to search for device software that is dependent on the location where the abnormality occurred. If there is device software that depends on the check in step S4, the process proceeds to the check in step S5. If no abnormality is detected in the dependent part, the first database 628 is accessed by the data d3 in step S6. Search the integrated error handling process to the part to be.

次に、ステップS7のチェックで統合的な異常処理の必要性がある場合には、ステップS8で依存する部分の異常対応を処理項目に追加し、ステップS9で異常対応処理検索を
終了する。
Next, if there is a need for integrated abnormality processing in the check in step S7, the abnormality handling of the dependent part is added to the processing item in step S8, and the abnormality handling processing search is terminated in step S9.

ステップS5のチェックで、依存する部分で異常検出されている場合には、ステップS8にスキップして、依存する部分の異常対応を処理項目に追加する。ステップS4のチェックで、依存するデバイス・ソフトウェアがない場合には、ステップS9にスキップして異常対応処理検索を終了する。   If an abnormality is detected in the dependent part in the check in step S5, the process skips to step S8 and adds the abnormality corresponding to the dependent part to the processing item. If there is no dependent device software in the check in step S4, the process skips to step S9 and ends the abnormality handling process search.

図8、図9の処理フローで明らかなように、統合化異常対応処理ロジック627は、異常発生箇所と依存関係にあるデバイス・ソフトウェアを論理RAS機能設定情報から検索する。依存する部分については、その部分において異常検出されている場合、もしくは複合的な異常対応処理が論理RAS機能設定情報に定義されている場合に、対応処理を項目として追加する。   As is apparent from the processing flows of FIGS. 8 and 9, the integrated abnormality handling processing logic 627 searches the logical RAS function setting information for device software that is dependent on the abnormality occurrence location. For the dependent part, if an abnormality is detected in that part, or if a complex abnormality handling process is defined in the logical RAS function setting information, the handling process is added as an item.

検索された異常対応処理ロジックの処理項目のうち、物理デバイスに対する処理は、対応する固有の異常対応処理手段632を呼び出して処理を実行する。ソフトウェアに対する処理は、OSが持つソフトウェアの管理機能であるアプリケーション管理手段523に対して異常対応処理の要求を行う。そして最後に、異常が発生した時のシステムの状態を過去の異常履歴に記録する。   Of the processing items of the detected abnormality handling processing logic, the processing for the physical device calls the corresponding unique abnormality handling processing means 632 and executes the processing. In the process for software, an abnormality handling process is requested to the application management unit 523 which is a software management function of the OS. Finally, the state of the system when an abnormality occurs is recorded in the past abnormality history.

具体例として、AIOの異常(異常レベル2)が単独で検出された際の異常対応処理を記述する。統合化異常対応処理ロジック627は、異常情報信号p1を受信すると、テーブル6の例に示す異常対応処理の対応付けの情報を参照し、AIOに対する異常レベル2の異常対応処理1(AIOの再起動)を処理項目として選出する。   As a specific example, an abnormality handling process when an AIO abnormality (abnormal level 2) is detected alone will be described. When the integrated abnormality response processing logic 627 receives the abnormality information signal p1, the integrated abnormality response processing logic 627 refers to the information on the association of the abnormality response processing shown in the example of Table 6, and the abnormality response processing 1 (AIO restart of the AIO) is performed. ) Is selected as a processing item.

次に、テーブル5の例に示す依存関係の情報より、制御アプリケーションが依存関係にあることを把握する。ここで、制御アプリケーションでも異常が検出されていれば、その異常対応処理を処理項目に加える。   Next, it is grasped from the dependency relationship information shown in the example of Table 5 that the control application has a dependency relationship. Here, if an abnormality is detected in the control application, the abnormality handling process is added to the process item.

この例では、AIO単独の異常としているため、テーブル7の例に示す複合的な異常対応処理の検索に移る。ここでは、依存する制御アプリケーションの異常対応処理、および条件が設定されているため、異常対応処理1(制御アプリケーションの再起動)を処理項目に加える。   In this example, since the abnormality is AIO alone, the process proceeds to a search for a complex abnormality handling process shown in the example of Table 7. Here, since the abnormality handling process and conditions of the dependent control application are set, the abnormality handling process 1 (reactivation of the control application) is added to the process item.

以上により異常対応処理の処理項目が列挙されるため、処理項目に従ってAIO固有の異常対応処理、および制御アプリケーション再起動の要求を行う。そして最後に、テーブル10に示す例のように、異常が発生した時のシステムの状態を記録する。   Since the processing items of the abnormality handling process are enumerated as described above, an abnormality handling process unique to AIO and a request for restarting the control application are performed according to the processing item. Finally, as in the example shown in Table 10, the system state when an abnormality occurs is recorded.

以上説明した本発明のRAS機能は、次のような拡張応用が可能である。
(1)組み込み機器に着脱可能なフォールトトレラント機能装置への応用:
信頼性を向上させることを目的として、論理RAS機能に対して、RAS機能に加えて論理的なフォールトトレラント機能を実装する。
The RAS function of the present invention described above can be extended as follows.
(1) Application to fault-tolerant functional devices that can be attached to and detached from embedded devices:
For the purpose of improving reliability, a logical fault tolerant function is implemented in addition to the RAS function for the logical RAS function.

ブートローダやOSなどの上位のソフトウェアは、ハードウェアの冗長化構成やシングル構成を意識する必要がない。従って、ハイパーバイザ層で実現する冗長化制御機能は、論理化された多重化CPUボードの制御を行い、物理CPUへアクセスする際にハードウェアに依存する機能へマッピングする。   Higher-level software such as a boot loader and OS does not need to be aware of a redundant configuration of hardware or a single configuration. Therefore, the redundancy control function realized in the hypervisor layer controls the logically multiplexed CPU board and maps it to a function depending on hardware when accessing the physical CPU.

(2)抽象化、単純化を行った論理RAS機能をFPGAへ実装することが可能である。プログラマブルなICにRAS機能を実装することにより、より信頼性の高いRAS機能を着脱可能な形態で組み込み機器に提供することができる。 (2) An abstracted and simplified logical RAS function can be implemented in an FPGA. By mounting the RAS function on a programmable IC, a more reliable RAS function can be provided to an embedded device in a detachable form.

(3)CPUとしてマルチコアCPUを採用する場合には、ハイパーバイザー層600に実装された論理RAS機能部620、物理デバイス中継インターフェース610、物理デバイス固有処理部630を、専用のコアCPUに割り当てることによりRAS機能に係る信号処理の高速化を実現することができる。 (3) When a multi-core CPU is adopted as a CPU, the logical RAS function unit 620, the physical device relay interface 610, and the physical device specific processing unit 630 implemented in the hypervisor layer 600 are allocated to a dedicated core CPU. Speeding up of signal processing related to the RAS function can be realized.

100 ハードウェア
101 物理デバイス群
102 物理ウォッチドッグタイマ(WDT)
400 アプリケーションソフトウェア
401〜404 アプリケーション
402A〜404A 定周期WDTリセット要求手段
500 システムソフトウェア
510 ブートローダ
511 デバイスドライバ
512 デバイス初期化ドライバ
513 WDTリセット手段
520 OS
521 デバイスアクセス手段
522 WDTリセット手段
523 アプリケーション管理手段
600 ハイパーバイザ層
610 物理デバイス中継インタフェース
611 物理デバイス初期化インタフェース
612 物理デバイスアクセスインタフェース
620 論理RAS機能部
621 論理デバイス異常検出ロジック
622 タイマ管理手段
623 論理WDT群
624 デバイス定周期診断タイマ
625 物理WDTリセットタイマ
626 ソフトウェア処理異常検出ロジック
627 統合化異常対応処理ロジック
628 第1データベース
629 第2データベース
630 物理デバイス固有処理部
631 異常検出処理手段
632 異常対応処理手段
633 物理WDTリセット手段
100 Hardware 101 Physical Device Group 102 Physical Watchdog Timer (WDT)
400 Application software 401-404 Application 402A-404A Fixed period WDT reset request means 500 System software 510 Boot loader 511 Device driver 512 Device initialization driver 513 WDT reset means 520 OS
521 Device access unit 522 WDT reset unit 523 Application management unit 600 Hypervisor layer 610 Physical device relay interface 611 Physical device initialization interface 612 Physical device access interface 620 Logical RAS function unit 621 Logical device abnormality detection logic 622 Timer management unit 623 Logical WDT Group 624 Device fixed period diagnosis timer 625 Physical WDT reset timer 626 Software processing abnormality detection logic 627 Integrated abnormality response processing logic 628 First database 629 Second database 630 Physical device specific processing unit 631 Anomaly detection processing means 632 Anomaly response processing means 633 Physical WDT reset means

Claims (8)

複数のアプリケーションが、システムソフトウェアのデバイスドライバを介してハードウェアを構成する複数の物理デバイスを利用すると共に、前記アプリケーションおよびハードウェアに対するRAS機能を実装する、RAS機能を備える組み込み機器において、
前記システムソフトウェアと前記ハードウェア間に介在させたハイパーバイザ層内に、前記複数のアプリケーションおよびハードウェアのRAS機能を統合して一元管理する、論理RAS機能部を実装し、
前記論理RAS機能部は、前記複数の物理デバイスを所定個数に分類した論理デバイスに対する論理デバイス異常検出ロジックを備え、
前記論理デバイス異常検出ロジックは、
前記システムソフトウェアのブートローダからの前記物理デバイスの初期化時および前記システムソフトウェアのOSのデバイスドライバからのアクセス時に起動され、前記論理デバイスに対する異常検出診断を実行することを特徴とするRAS機能を備える組み込み機器。
In an embedded device having a RAS function, in which a plurality of applications use a plurality of physical devices constituting hardware via a device driver of system software, and implement a RAS function for the application and hardware.
In the hypervisor layer interposed between the system software and the hardware, a logical RAS function unit that integrates and centrally manages the RAS functions of the plurality of applications and hardware is implemented.
The logical RAS function unit includes a logical device abnormality detection logic for a logical device obtained by classifying the plurality of physical devices into a predetermined number,
The logic device abnormality detection logic is
Embedded with RAS function, which is activated when the physical device is initialized from the system software boot loader and when the system software is accessed from the OS device driver, and performs abnormality detection diagnosis for the logical device machine.
前記論理デバイス異常検出ロジックからの異常検出情報を取得し、前記ハードウェアの物理デバイスの異常を検出する異常検出処理手段と、
前記論理デバイス異常検出ロジックからの異常検出情報と、前記アプリケーションの異常検出情報とを統合化して異常処理を実行する、統合化異常対応処理ロジックと、
前記統合化異常対応処理ロジックからの異常対応情報に基づいて前記ハードウェアの物理デバイスの異常対応処理を実行する異常対応処理手段と、
を備えることを特徴とする請求項1に記載のRAS機能を備える組み込み機器。
Anomaly detection processing means for obtaining anomaly detection information from the logic device anomaly detection logic and detecting an anomaly of the physical device of the hardware;
Integrated abnormality response processing logic that integrates abnormality detection information from the logic device abnormality detection logic and abnormality detection information of the application to execute abnormality processing;
An abnormality handling processing means for executing an abnormality handling process of the hardware physical device based on anomaly handling information from the integrated malfunction handling processing logic;
The embedded device having the RAS function according to claim 1.
前記論理RAS機能部は、前記複数のアプリケーションに対応した論理ウォッチドッグタイマ群およびソフトウェア処理異常検出ロジックを備え、
前記論理ウォッチドッグタイマ群は、前記複数のアプリケーションに実装された定周期リセット要求手段からのリセット要求によりリセットされることにより前記複数のアプリケーションを監視し、
タイムアップした論理ウォッチドッグタイマ情報を前記ソフトウェア処理異常検出ロジックに出力し、
前記ソフトウェア処理異常検出ロジックは、前記統合化異常対応処理ロジックに対して異常対応処理を依頼することを特徴とする請求項2に記載のRAS機能を備える組み込み機器。
The logical RAS function unit includes a logical watchdog timer group and software processing abnormality detection logic corresponding to the plurality of applications,
The logical watchdog timer group monitors the plurality of applications by being reset by a reset request from a fixed period reset request means implemented in the plurality of applications.
Output time-up logic watchdog timer information to the software processing abnormality detection logic,
The embedded device having a RAS function according to claim 2, wherein the software processing abnormality detection logic requests the integrated abnormality response processing logic to perform an abnormality response process.
前記統合化異常対応処理ロジックは、前記ソフトウェア処理異常検出ロジックからの異常情報を取得したときに、前記システムソフトウェアのアプリケーション管理手段に通知して対応処理を依頼することを特徴とする請求項3に記載のRAS機能を備える組み込み機器。   4. The integrated abnormality response processing logic, when acquiring abnormality information from the software processing abnormality detection logic, notifies an application management means of the system software and requests response processing. Embedded device having the described RAS function. 前記統合化異常対応処理ロジックは、夫々複数種類が定義された異常個所に対する異常レベルと異常対応処理に基づき、異常発生箇所に対し異常レベルと異常対応処理の対応付けを設定すると共に、デバイス・ソフトウェアの依存関係および複合的な異常対応処理を設定することを特徴とする請求項2乃至4のいずれかに記載のRAS機能を備える組み込み機器。   The integrated abnormality handling processing logic sets the correspondence between the abnormality level and the abnormality handling process for the abnormality occurrence location based on the abnormality level and the abnormality handling processing for each of the plurality of types of abnormality locations, and device software The embedded device having the RAS function according to any one of claims 2 to 4, wherein dependency relations and complex abnormality handling processes are set. 前記論理RAS機能部は、前記論理デバイス異常検出ロジックに対するデバイス定周期診断用タイマおよび前記ハードウェアに設けたウォッチドッグタイマに対する物理ウォッチドッグタイマリセット手段を備えることを特徴とする請求項1乃至5のいずれかに記載のRAS機能を備える組み込み機器。   6. The logical RAS function unit includes a device fixed period diagnosis timer for the logical device abnormality detection logic and a physical watchdog timer reset unit for a watchdog timer provided in the hardware. An embedded device having the RAS function described in any one of the above. 前記論理デバイス異常検出ロジックおよび前記論理ウォッチドッグ用タイマに対して論理RAS機能設定情報を与える第1データベースと、
前記論理デバイス異常検出ロジックおよび前記ソフトウェア処理異常検出ロジックに対して過去の異常履歴情報を与える第2データベースと、
を備える請求項3または4に記載のRAS機能を備える組み込み機器。
A first database for providing logical RAS function setting information to the logical device abnormality detection logic and the logical watchdog timer;
A second database that provides past abnormality history information to the logic device abnormality detection logic and the software processing abnormality detection logic;
An embedded device having a RAS function according to claim 3 or 4.
前記統合化異常対応処理ロジックの異常処理内容は、前記第2データベースの異常履歴に記録されることを特徴とする請求項に記載のRAS機能を備える組み込み機器。 The embedded device having the RAS function according to claim 7 , wherein the abnormality processing content of the integrated abnormality handling processing logic is recorded in an abnormality history of the second database.
JP2011098181A 2011-04-26 2011-04-26 Embedded equipment with RAS function Active JP5733515B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011098181A JP5733515B2 (en) 2011-04-26 2011-04-26 Embedded equipment with RAS function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011098181A JP5733515B2 (en) 2011-04-26 2011-04-26 Embedded equipment with RAS function

Publications (2)

Publication Number Publication Date
JP2012230533A JP2012230533A (en) 2012-11-22
JP5733515B2 true JP5733515B2 (en) 2015-06-10

Family

ID=47432032

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011098181A Active JP5733515B2 (en) 2011-04-26 2011-04-26 Embedded equipment with RAS function

Country Status (1)

Country Link
JP (1) JP5733515B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5895906B2 (en) 2013-07-24 2016-03-30 横河電機株式会社 Process control device and system, and soundness determination method thereof
JP2017045303A (en) * 2015-08-27 2017-03-02 ファナック株式会社 Controller that can detect causes of abnormalities in functions of personal computer

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004030214A (en) * 2002-06-25 2004-01-29 Moritex Corp Computer application system having communication function
JP2007233687A (en) * 2006-03-01 2007-09-13 Nec Corp Virtual computer system, control method of virtual computer, and virtual computer program
JP4969258B2 (en) * 2007-01-30 2012-07-04 株式会社日立製作所 I / O device failure processing method for virtual machine system

Also Published As

Publication number Publication date
JP2012230533A (en) 2012-11-22

Similar Documents

Publication Publication Date Title
EP2518627B1 (en) Partial fault processing method in computer system
TWI522834B (en) System and method for operating system agnostic hardware validation
US20100162042A1 (en) Multiprocessor system and control method thereof
US10496495B2 (en) On demand remote diagnostics for hardware component failure and disk drive data recovery using embedded storage media
WO2014198464A1 (en) Multicore processor fault detection for safety critical software applications
US20110161739A1 (en) Generate diagnostic data for overdue thread in a data processing system
JP6009089B2 (en) Management system for managing computer system and management method thereof
JPH08297598A (en) Computer system analytic device
US20210124655A1 (en) Dynamic Configurable Microcontroller Recovery
US8621118B1 (en) Use of service processor to retrieve hardware information
CN116775141A (en) Abnormality detection method, abnormality detection device, computer device, and storage medium
US7506215B1 (en) Method for health monitoring with predictive health service in a multiprocessor system
EP3534259B1 (en) Computer and method for storing state and event log relevant for fault diagnosis
JP5733515B2 (en) Embedded equipment with RAS function
US8793538B2 (en) System error response
CN107133130B (en) Computer operation monitoring method and device
Chen et al. Design and Evaluation of an Online Anomaly Detector for Distributed Storage Systems.
JP4558376B2 (en) controller
US10802901B2 (en) Obtaining state information of threads of a device
JP6256087B2 (en) Dump system and dump processing method
JP7389877B2 (en) Network optimal boot path method and system
US20060230196A1 (en) Monitoring system and method using system management interrupt
US20230004476A1 (en) Application failure tracking features
JP2011179996A (en) Apparatus and method for diagnosing system
JP2012059127A (en) Information processor, watch dog timer and abnormality detection method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140401

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141211

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150218

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150331

R150 Certificate of patent or registration of utility model

Ref document number: 5733515

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250