WO2000031639A1 - Monitor component of a data processing system - Google Patents

Monitor component of a data processing system Download PDF

Info

Publication number
WO2000031639A1
WO2000031639A1 PCT/EP1999/009055 EP9909055W WO0031639A1 WO 2000031639 A1 WO2000031639 A1 WO 2000031639A1 EP 9909055 W EP9909055 W EP 9909055W WO 0031639 A1 WO0031639 A1 WO 0031639A1
Authority
WO
WIPO (PCT)
Prior art keywords
applications
aem
availability
component
compliant
Prior art date
Application number
PCT/EP1999/009055
Other languages
German (de)
French (fr)
Inventor
Markus Lautenbacher
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Priority to EP99959313A priority Critical patent/EP1133729A1/en
Publication of WO2000031639A1 publication Critical patent/WO2000031639A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)

Abstract

The aim of the invention is to provide data processing systems which offer an especially high degree of availability in their entirety, that is in the combination of hardware, operating and network transport system and network and the applications supported by said system for certain applications, for example, telecommunication services that require such systems. To this end, the invention provides a monitor component which is embedded on a software level between the applications and hardware, operating and network transport system and network.

Description

Beschreibungdescription
Überwachungs-Komponente eines Rechnersystems Ov erwachungs component of a computer system
In Datenverarbeitungsanlagen (Rechnersystemen) für I n data processing systems (computer systems) for
Telekommunikationsdienste (z.B. Service Nodes) , für sog. Mission Critical Applications (z.B. Transaktionen im Finanzbereich) oder für multimediale, interaktive quasi- Echtzeit Netzwerkdienste ist es erforderlich, daß die Kombination aus Rechnerplattform (Hardware, Operating & Network Transport System [2] und Netzwerk) und darauf laufenden Applikationen, also einer Datenverarbeitungsanlage als Ganzes, eine besonderes hohe Verfügbarkeit bietet.Tele k ommunikationsdienste (eg service nodes), for so-called. Mission Critical Applications (eg transactions in the financial sector) or for multimedia, interactive quasi-real-time network services, it is necessary that the combination of computer platform (hardware, operating & Network Transport System [2] and network) and the applications running on it, i.e. a data processing system as a whole, offers particularly high availability.
Dabei soll die Verfügbarkeit gewährleistet sein gegen Probleme wieThe availability should be guaranteed against problems such as
• Hardware Ausfälle• Hardware failures
• Interne Softwarefehler in Applikationen (Endlos-Schleifen, Speicherlecks, unsaubere Dateizugriffe,...), die zu einem Performance-Verlust des Gesamtsystems führen• Internal software errors in applications (endless loops, memory leaks, dirty file access, ...), which lead to a loss of performance of the overall system
• Externe, fehlerhafte Ereignisse (unterbrochene Netzwerkverbindungen, Verbindungsüberlastung, ... )• External, faulty events (broken network connections, connection overload, ...)
• Ressourcenkonflikte zwischen den einzelnen (u.U. von verschiedenen Benutzern eingebrachten) Applikationen, die gleichzeitig auf einem System ablaufen• Resource conflicts between the individual applications (which may have been brought in by different users) that run simultaneously on one system
• Performance-Verlust des Gesamtsystems (bis zum Denial-of- Service) wegen Überlastung durch die Gesamtheit der momentan aktiven Applikationen• Loss of performance of the entire system (up to the denial of service) due to overloading by all of the currently active applications
In bisherigen Lösungen werden die genannten Probleme durch Einsatz von hoch spezieller Hard- u. Software gelöst. Bekannte Ansätze sind z.B. die Dopplung von Hardware und die Spiegelung von Daten im Parallelbetrieb oder im Hot/Cold- Stand-By.In previous solutions, the problems mentioned have been solved by using highly specialized hardware and. Software solved. Known approaches are e.g. the duplication of hardware and the mirroring of data in parallel operation or in hot / cold standby.
Die Nachteile solcher Ansätze sind • eine doppelte Bereitstellung und Wartung von IT- Infrastruktur (Hard- und Software)The disadvantages of such approaches are • a double provision and maintenance of IT infrastructure (hardware and software)
• inflexible Kombination von Spezialhardware mit hoch speziellen, proprietären Betriebssystemen • die dadurch erzwungene Verwendung von ebenfalls extrem plattformgebundenen, nicht portierbaren Applikationen und die Bindung an deren Hersteller• inflexible combination of special hardware with highly specialized, proprietary operating systems • the forced use of also extremely platform-bound, non-portable applications and the binding to their manufacturers
• die mangelnde Interoperabilität zu allgemein verfügbaren ( off-the-shelf") Hard- u. Softwarekomponenten aufgrund fehlender quasi-standard Interfaces• the lack of interoperability with generally available (off-the-shelf ") hardware and software components due to the lack of quasi-standard interfaces
Insgesamt führen o.g. Nachteile zu einer extrem unbefriedigenden Wirtschaftlichkeit herkömmlicher, hochverfügbarer Systeme. Gleichzeitig lassen sich derartige Systeme nur sehr schwer an den rasanten technologischen Fortschritt im IT-Bereich anpassen.Overall, the above Disadvantages to an extremely unsatisfactory economy of conventional, highly available systems. At the same time, such systems are very difficult to adapt to the rapid technological progress in the IT area.
Der Erfindung liegt die Aufgabe zugrunde, die genannten Nachteile zu überwinden.The invention has for its object to overcome the disadvantages mentioned.
Diese Aufgabe wird durch die Erfindung gelöst.This object is achieved by the invention.
Im folgenden wird die Erfindung anhand der Zeichnung näher beschrieben, wobei die Zeichnung drei Figuren umfaßt.The invention is described in more detail below with reference to the drawing, the drawing comprising three figures.
Die im folgenden beschriebene Überwachungs-Komponente (Availability Enhancing Middleware AEM) bietet eine hochverfügbare Service Infrastruktur wie sie in Bereichen wie der Telekommunikation, im Finanzbereich, oder bei interaktiven Multimedia Netzdiensten notwendig ist.The monitoring component described below (Availability Enhancing Middleware AEM) offers a highly available service infrastructure as is necessary in areas such as telecommunications, finance, or interactive multimedia network services.
Fig. 1 zeigt das Prinzip wie sich die AEM [3] in ein Rechnersystem zwischen die Rechnerplattform (Standard Operating & Network Transport System [2], Netzwerk und Hardware [1]) und die Applikationen [4] einfügt. Die AEM [3] stellt eine reine Softwarelösung dar, die als neuer Middleware Layer zwischen das Standard Operating & Network Transport System [2] inklusive Hardware [1] und die Applikationen [4] in den Rechner eingebracht wird. Der Middleware-Layer Ansatz für die softwaretechnische Realisierung der AEM erlaubt dabei, die AEM zu einem inhärenten Teil eines neu entwickelten Rechnersystems zu machen, ermöglicht gleichzeitig aber auch die Nachrüstung in ein existierendes Rechnersystem. Durch entsprechende Kommunikationskanäle (bezeichnet mit (l)-(7) in Fig. 2 und 3) schiebt sich die AEM quasi zwischen die normalerweise direkte Kommunikation der Komponenten [1], [2] und [4] in Fig. 1. Die AEM[3] kontrolliert dabei die Wechselwirkung (Interaktion) von Applikationen [4] mit Operating & Network Transport System [2], Netzwerk und Hardware [1], und korrigiert ggf. Aktionen der Applikationen [4] mit der Zielsetzung, eine erhöhte Verfügbarkeit des gesamten Rechnersystems (Hardware, Netzwerk, Operating System, Applikationen) zu gewährleisten.1 shows the principle of how the AEM [3] fits into a computer system between the computer platform (Standard Operating & Network Transport System [2], network and hardware [1]) and the applications [4]. The A EM [3] is a pure software solution that is introduced into the computer as a new middleware layer between the standard operating & network transport system [2] including hardware [1] and the applications [4]. The middleware layer approach for the software implementation of the AEM allows the AEM to be made an inherent part of a newly developed computer system, but also enables retrofitting into an existing computer system. Corresponding communication channels (denoted by (1) - (7) in FIGS. 2 and 3) effectively push the AEM between the normally direct communication of components [1], [2] and [4] in FIG. 1. The AEM [3] controls the interaction (interaction) of applications [4] with the Operating & Network Transport System [2], network and hardware [1], and corrects any actions of the applications [4] with the aim of increasing the availability of the entire computer system (hardware, network, operating system, applications).
Die AEM ist zum einen in der Lage bereits existierende Applikationen (sog. nicht AEM-konforme Applikationen) zu integrieren (vor allem solche existierende Applikationen, die nur in Binärform vorliegen) und stellt zum anderen ein eigenes Application Programming Interface (API) für speziell auf die Vorteile des AEM-Ansatzes zugeschnitteneOn the one hand, the AEM is able to integrate already existing applications (so-called non-AEM-compliant applications) (especially those existing applications that are only available in binary form) and on the other hand it has its own application programming interface (API) for special applications tailored the benefits of the AEM approach
Applikationen (sog. AEM-konforme Applikationen) zur Verfügung, um diesen Applikationen optimalen Zugriff auf die Möglichkeiten des AEM zu bieten.Applications (so-called AEM-compliant applications) are available to offer these applications optimal access to the possibilities of the AEM.
Ein besonderer Vorteil der Erfindung besteht in derA particular advantage of the invention is that
Erreichung der erhöhten Verfügbarkeit durch einen Middleware- Ansatz auf Standard Hard- und Software unter Verwendung von offenen IT-Standards. Der bisherige Ansatz einer erhöhten Verfügbarkeit für Applikationen durch eine enge Integration von spezieller Hard- und Software wird ersetzt durch die Verlagerung dieser Funktionalität in eine intelligente Softwarezwischenschicht . Fig. 2 zeigt schematisch ein Ausführungsbeispiel des AEM Middleware Ansatzes aus Fig. 1 zur Erhöhung der Verfügbarkeit von Datenverarbeitungsanlagen. AEM-Architekturelemente sind mit [l]-[5] bezeichnet, Kommunikationsverbindungen zwischen diesen Elementen mit (l)-(7).Achieving increased availability through a middleware approach to standard hardware and software using open IT standards. The previous approach of increased availability for applications through the close integration of special hardware and software is being replaced by the relocation of this functionality to an intelligent software intermediate layer. FIG. 2 schematically shows an embodiment of the AEM middleware approach from FIG. 1 to increase the availability of data processing systems. AEM architecture elements are designated with [ l ] - [5], communication connections between these elements with (l) - (7).
Die Behandlung von AEM-konformen [4a] und nicht AEM-konformen Applikationen [4b] zur Erhöhung der Verfügbarkeit des Gesamtsystems [5] (bestehend aus Hardware [1], Operating &Treatment of AEM-compliant [4a] and non-AEM-compliant applications [4b] to increase the availability of the overall system [5] (consisting of hardware [1], operating &
Network Transport System [2], AEM [3], mehreren AEM-konformen [4a] und mehreren nicht AEM-konformen Applikationen [4b]) erfolgt dabei folgendermaßen:Network Transport System [2], AEM [3], several AEM-compliant [4a] and several non-AEM-compliant applications [4b]) are carried out as follows:
AEM-konforme Applikationen [4a] kommunizieren (1) über ein von der AEM zur Verfügung gestelltes, offenes API [3a] . Das API vermittelt (2) dabei als Schnittstelle zwischen den AEM- konformen Applikationen [4a] dem entsprechenden Subsystem [3b] des AEM [3] . Die AEM als Ganzes [3] prüft und bewertet den von der AEM-konformen Applikation [4a] eingehendenAEM-compliant applications [4a] communicate (1) via an open API provided by AEM [3a]. The API mediates (2) as an interface between the AEM-compliant applications [4a] and the corresponding subsystem [3b] of the AEM [3]. The AEM as a whole [3] checks and evaluates the incoming from the AEM-compliant application [4a]
Informationsstrom (Status- und Fehlermeldungen, Ressource- Anforderungen an Operating & Network Transport System [2], Zugriffe auf Dateisystem und Devices,...) auf Konsistenz, auf mögliche Konflikte mit anderen Applikationen und auf die Verträglichkeit mit der Verfügbarkeit des Gesamtsystems [5] .Information flow (status and error messages, resource requirements for the Operating & Network Transport System [2], access to file system and devices, ...) on consistency, on possible conflicts with other applications and on compatibility with the availability of the overall system [5 ].
Nach erfolgreicher Prüfung in der AEM [3] wird der Informationsstrom der AEM-konformen Applikation [4a] an das Operating & Network Transport System [2] weitergegeben (3) . Eventuelle Rückmeldungen (3) des Operating & NetworkAfter a successful check in the AEM [3], the information flow of the AEM-compliant application [4a] is passed on to the Operating & Network Transport System [2] (3). Any feedback (3) from the Operating & Network
Transport Systems [3] werden wieder im zugehörigen AEM Subsystem [3b] überwacht und an die AEM-konforme Applikation [4a] weitergeben (6) . Entdeckt die AEM [3] Konflikte oder Probleme so wird dies ebenfalls der AEM-konformen Applikation [4a] zurücksignalisiert (6) . AEM-konforme Applikationen decken die Behandlung solcher Rückmeldungen intern über die Software Standardtechnik eines sog. "Event Händlers" ab und verzögern dann z.B. eine Speicheranforderung entsprechend bis die Verfügbarkeit des Gesamtsystems [5] dies wieder zuläßt.Transport systems [3] are again monitored in the associated AEM subsystem [3b] and passed on to the AEM-compliant application [4a] (6). If the AEM [3] detects conflicts or problems, this is also signaled back to the AEM-compliant application [4a] (6). AEM-compliant applications cover the handling of such feedback internally via the software standard technology of a so-called "event dealer" and delay then, for example, a memory request corresponding to the availability are of the overall system [5], this allows again.
Nicht AEM- onforme Applikationen [4b] benutzten nicht den Umweg über die AEM [3], sondern greifen (4) direkt auf die Ressourcen des Operating & Network Transport System [2] zu. Das entsprechende Subsystem der AEM [3c] überwacht diese Systemaufrufe (z.B. durch die "trace" Systemroutine des UNIX Operating Systems) und dadurch erzeugte Systemmeldungen (5) . Analog zu den AEM-konformen Applikationen [4a] wird die so über die nicht AEM-konformen Applikationen [4b] gewonnene Information im Hinblick auf mögliche Konflikte mit anderen Applikationen und die Verträglichkeit mit der Verfügbarkeit des Gesamtsystems [5] von der AEM [3] als Ganzes geprüft. Erkennt die AEM [3] entsprechende Probleme, so wird versucht, diese durch Anhalten bzw. Terminieren (z.B. UNIX Signal "STOP" bzw. "KILL") der entsprechenden nicht AEM-konformen Applikation [4b] zu beseitigen (7) .Applications that do not conform to AEM [4b] do not use the detour via AEM [3], but instead access (4) the resources of the Operating & Network Transport System [2]. The corresponding AEM subsystem [3c] monitors these system calls (e.g. through the "trace" system routine of the UNIX operating system) and the system messages generated thereby (5). Analogous to the AEM-compliant applications [4a], the information obtained in this way about the non-AEM-compliant applications [4b] is considered by AEM [3] with regard to possible conflicts with other applications and compatibility with the availability of the overall system [5]. checked as a whole. If the AEM [3] detects corresponding problems, an attempt is made to eliminate them by stopping or terminating (e.g. UNIX signal "STOP" or "KILL") of the corresponding non-AEM-compliant application [4b] (7).
Fig. 3 zeigt basierend auf Fig. 1 und 2 eine detaillierte3 shows a detailed based on FIGS. 1 and 2
Architektur für ein Ausführungsbeispiel des AEM-Ansatzes zur Erhöhung der Verfügbarkeit von Datenverarbeitungsanlagen.Architecture for an embodiment of the AEM approach to increase the availability of data processing systems.
Die Funktionsweise der Architekturelemente [l]-[5] und der AEM-Kommunikation (l)-(7) aus Fig. 2 wird unverändert übernommen. Fig. 3 führt zusätzlich das AEM API [3a], die interne Architektur der AEM Subsysteme [3b] und [3c] und die zugehörige AEM-interne Kommunikation (il)-(i4) weiter aus.The functioning of the architectural elements [1] - [5] and the AEM communication (1) - (7) from FIG. 2 is adopted unchanged. FIG. 3 also executes the AEM API [3a], the internal architecture of the AEM subsystems [3b] and [3c] and the associated AEM internal communication (il) - (i4).
Das AEM API [3a] bietet für AEM-konforme Applikationen [4a] eine hinsichtlich Gesamtverfügbarkeit abgesicherte Schnittstelle zur Anforderung von sog. Passiven Objekten (PO) , Dateizugriffen, Speicherbehandlung, Network Communication, etc. Das API bietet entsprechende sog. "Stubs" aus der objektorientierten Programmierung an. Im Sinne der Objektorientierung sind die Schnittstellen zu Standard Operating System Services wie z.B. FTP, TELNET,... als Passive Objekte innerhalb der AEM [3] realisiert) .For AEM-compliant applications [4a], the AEM API [3a] offers an interface that is secured with regard to overall availability for requesting so-called passive objects (PO), file access, memory handling, network communication, etc. The API offers corresponding so-called "stubs" object-oriented programming. In terms of object orientation, the interfaces are standard O perating system services such as FTP, TELNET, ... implemented as passive objects within the AEM [3]).
Die AEM [3] hält Informationen über den momentanen Zustand des Gesamtsystems [5] in folgenden Zentraleinheiten:The A EM [3] holds information about the current state of the overall system [5] in the following central units:
Passive Objekte (PO) Management:Passive objects (PO) management:
Diese Einheit verwaltet die Laufzeitumgebung der PO. Alle AEM-konformen Applikationen sind nach objektorientierten Methoden aus PO Einzelbausteinen aufgebaut.This unit manages the runtime environment of the PO. All AEM-compliant applications are built from PO individual components using object-oriented methods.
Distribution Component:Distribution component:
Diese Einheit hat die Aufgabe, im Falle eines vernetztenThis unit has the task of being networked
Verbunds von nach dem AEM-Ansatz arbeitenden Datenverarbeitungsanlagen, die Ressourcen innerhalb dieses Verbunds nach einstellbaren Kriterien auszunutzen (z.B. gleichmäßige Lastverteilung auf alle Maschinen) und so einzelne Maschinen vor Ausfall durch lokale Überlastung zu schützen. Dazu werden z.B. PO zwischen den verschiedenen Datenverarbeitungsanlagen migriert oder entsprechendeNetwork of data processing systems working according to the AEM approach, to use the resources within this network according to adjustable criteria (e.g. even load distribution on all machines) and thus to protect individual machines from failure due to local overload. For this, e.g. PO migrated between the various data processing systems or equivalent
Anforderungen von lokalen POs zu entsprechenden POs auf andere Datenverarbeitungsanlagen im Netzwerk delegiert.Delegated requests from local POs to corresponding POs on other data processing systems in the network.
Security Management: Daten und Programm-Code unterschiedlicher Applikationen innerhalb des Gesamtsystems sollen voneinander getrennt gehalten und Übergriffe verhindert werden. Diese Aufgabe übernimmt die Security Management Einheit.Security management: Data and program code of different applications within the overall system should be kept separate from one another and attacks should be prevented. The security management unit takes on this task.
Information Base:Information base:
Diese Einheit ist eine Datenbank in der persistente und temporäre systemrelevante Informationen gehalten werden; dazu zählen Informationen über die momentane Systemkonfiguration bzgl. Hard- und Software, die Maximalwerte der verfügbaren Systemressourcen, Ressource-Profiles die zulässigenThis unit is a database in which persistent and temporary system-relevant information is kept; this includes information about the current system configuration with regard to hardware and software, the maximum values of the available system resources, and the resource profiles that are permitted
Ressource-Anforderungen per Applikation festlegen, sowie die aktuelle Systeminformation über aktive Applikationen. Resource Management:Define resource requirements per application, as well as the current system information about active applications. Resource management:
Diese Einheit hat die Aufgabe der Verwaltung lokaler Ressourcen. Das Resource Management beinhaltet die Aufdeckung von Ressource-Mißbrauch durch einzelne Applikationen und die Optimierung konkurrierender Ressource-Anforderungen durch unterschiedliche Applikationen. Zu den überwachten Ressourcen zählen insbesondere CPU, Speicher, Festplattenbelegung, Netzwerkverbindungen (network connections) .This unit is responsible for managing local resources. Resource management includes the detection of resource misuse by individual applications and the optimization of competing resource requirements by different applications. The monitored resources include in particular CPU, memory, hard disk allocation, network connections.
Die Aktualisierung dieser Zustandsinformation erfolgt über den Austausch (2), der über das AEM API [3a] via (1) mit den AEM-konformen Applikationen [4a] erfolgt, sowie intern (il) über die Monitor Einheit.This status information is updated via the exchange (2), which takes place via the AEM API [3a] via (1) with the AEM-compliant applications [4a], and internally (il) via the monitor unit.
Der Monitor wirkt als zentrale Sammel- undThe monitor acts as a central collection and
Überwachungseinheit der Informationen zum Gesamtsystemstatus sowie als eine Art Bussystem für den Informationsfluß innerhalb des AEM Subsystems [3b] . Über den Monitor wird erstens die Kommunikation (3) des für AEM-konforme Applikationen [4a] zuständigen AEM Subsystems [3b] mit dem Operating & Network Transport System [2] abgewickelt. Daher kann der Monitor die AEM-konforme Applikationen [4a] betreffenden Informationen zum Systemzustand an o.g. Zentraleinheiten weiterleiten. Der Monitor erhält zweitens auch indirekt (i2) Zustandsinformation über die Sensor Einheit, die sich im für nicht AEM-konforme Applikationen [4b] zuständigen AEM Subsystem [3c] befindet. Auch diese Zustandsinformationen leitet der Monitor an o.g. Zentraleinheiten weiter. Der Sensor überwacht Systemaufrufe (z.B. durch die "trace" Systemroutine des UNIX Operating Systems) und dadurch erzeugte Systemmeldungen (5) , die durch nicht AEM-konforme Applikationen [4b] bei direkten Zugriff (4) auf die Ressourcen des Operating & Network Transport System [2] erzeugt werden. Weicht der im Monitor ermittelte Ist-Wert des Gesamtsystemstatus von einem einstellbaren Soll-Profil (z.B. bzgl. der Anzahl der aktiven Applikationen, Maschinenauslastung, Speicherbelegung, Fehlerhäufigkeit, Netzwerkstatus, ) ab, so übergibt (i3) der Monitor denMonitoring unit for information on the overall system status and as a type of bus system for the flow of information within the AEM subsystem [3b]. Firstly, the monitor (3) communicates with the Operating & Network Transport System [2] of the AEM subsystem [3b] responsible for AEM-compliant applications [4a]. The monitor can therefore forward the AEM-compliant applications [4a] regarding the system status to the above-mentioned central units. Secondly, the monitor also receives indirect (i2) status information via the sensor unit, which is located in the AEM subsystem [3c] responsible for non-AEM-compliant applications [4b]. The monitor also forwards this status information to the above-mentioned central units. The sensor monitors system calls (eg through the "trace" system routine of the UNIX operating system) and system messages (5) generated thereby, which are generated by non-AEM-compliant applications [4b] with direct access (4) to the resources of the Operating & Network Transport System [2] can be generated. Deviates the detected in the monitor actual value of G esamtsystemstatus from an adjustable set-profile (eg respect. The number of active applications, machine load, memory usage, error rate, network status), so passes (i3) of the monitor the
Ist-Gesamtsystemstatus an die sog. "Decision Maker" Einheit zur weiteren Behandlung der Abweichung.Actual overall system status to the so-called "decision maker" unit for further treatment of the deviation.
Die Decision Maker Einheit analysiert den vom Monitor angezeigten Konflikt zwischen Ist- und Soll-Wert im Hinblick auf die Systemverfügbarkeit und trifft nach geeigneten, einstellbaren Kriterien (z.B. durch regel- oder fallbasierte Programmierung) eine Entscheidung zur Lösung des Konflikts, um den Systemstatus und damit die Verfügbarkeit des Gesamtsystem [5] wieder in den zulässigen Bereich zu überführen.The decision maker unit analyzes the conflict between actual and target value displayed by the monitor with regard to the system availability and makes a decision based on suitable, adjustable criteria (e.g. through rule- or case-based programming) to resolve the conflict, the system status and thus to bring the availability of the overall system [5] back into the permissible range.
Der Decision Maker informiert (i4) daraufhin die sog. "Decision Enforcement" Einheit über die getroffene Entscheidung zur Sicherstellung der Verfügbarkeit desThe decision maker then informs (i4) the so-called "decision enforcement" unit of the decision made to ensure the availability of the
Gesamtsystems [5] . Aufgabe der Decision Enforcement Einheit ist es, diese Gegenmaßnahme gegenüber den betroffenen Applikationen zu realisieren. Dazu wird eine entsprechende Meldung an die als Verursacher für die eingeschränkte Verfügbarkeit ausgemachte Applikation geschickt. Bei nicht AEM-konformen Applikationen [4b] direkt (7) als System Signal, bei AEM-konformen Applikationen [4a] indirekt (6) als AEM API Meldung.Overall system [5]. The task of the decision enforcement unit is to implement this countermeasure against the applications concerned. For this purpose, a corresponding message is sent to the application identified as the cause of the limited availability. For non-AEM-compliant applications [4b] direct (7) as a system signal, for AEM-compliant applications [4a] indirectly (6) as AEM API message.
Damit eine Applikation auf eine entsprechende Meldung derSo that an application can respond to a corresponding message from
Decision Enforcement Einheit ausreichend reagiert, muß diese Einheit mit entsprechenden Systemprioritäten ausgestattet sein (z.B. dem UNIX owner "root" zugehörig und mit ausreichend hoher Process/Task Priorität, die wiederum über das "nice" UNIX Systemkommando einstellbar ist.). Fallbeispiele:If the decision enforcement unit responds adequately, this unit must be equipped with appropriate system priorities (eg belonging to the UNIX owner "root" and with a sufficiently high process / task priority, which in turn can be set using the "nice" UNIX system command.). Case studies:
AEM-konforme Applikation:AEM-compliant application:
Eine AEM-konforme Applikation [4a] fordert (1,2) über das AEM API [3a] mehr realen Speicher (RAM) an. Die AEM [3] kommt zu dem Schluß, daß dies die Verfügbarkeit des Gesamtsystems in nicht vertretbarem Rahmen beeinträchtigen würde und weist die Anforderung durch eine entsprechende AEM API Rückmeldung (6) ab. Die AEM-konforme Applikation [4a] reagiert mit ihrem Event Handler auf diese Rückmeldung, indem sie statt dem schnellen realen Speicher (RAM) , den langsameren virtuellen Speicher (in UNIX Terminologie "Swap Space") benutzt (nachdem dies vorher von der AEM genehmigt bzw. u.U. bereits als Teil der ersten AEM Rückmeldung (6) als Alternative vorgeschlagen wurde) .An AEM-compliant application [4a] requests (1,2) more real memory (RAM) via the AEM API [3a]. The AEM [3] concludes that this would impair the availability of the overall system to an unacceptable extent and rejects the request with an appropriate AEM API response (6). The AEM-compliant application [4a] responds to this feedback with its event handler by using the slower virtual memory (in UNIX terminology "swap space") instead of the fast real memory (RAM) (after this has been previously approved by the AEM or may already have been proposed as part of the first AEM feedback (6) as an alternative).
Nicht AEM-konforme Applikation:Application not conforming to AEM:
Eine nicht AEM-konforme Applikation [4b] belegt an der AEM [3] vorbei über direkten Systemaufruf erhebliche Netzwerk- Ressourcen und droht die Verfügbarkeit des Gesamtsystems [5] bzgl. der Verfügbarkeit von Netzwerk-Ressourcen (Network Connectivity) zu gefährden, da gleichzeitig alle anderen Applikationen auch Netzwerkdienste benötigen. Die AEM [3] erkennt in ihrem Ressourcen Management diesen Konflikt und die Gefahr eines Eskalierens der Anforderungen durch eine bestimmte nicht AEM-konforme Applikation [4b] zu Lasten der übrigen Applikationen [4a,b] . Über die Decision Maker und Decision Enforcement Einheiten wird daher die problematische nicht AEM-konforme Applikation [4b] temporär angehalten (z.B. über das UNIX System Signal "STOP") bis die zulässigen Anforderungen nach Netzwerkressourcen durch die übrigen Applikationen eine derart maximale Belegung durch eine einzelne Applikation erlauben. Bei einer nicht AEM-konformen Applikation bzw. einer nicht AEM-konformen Interaktion einer Applikation, die die Verfügbarkeit des Gesamtsystems in nicht vertretbarem Maße beeinträchtigen würden, bleibt somit als einziges Mittel vor ihrer endgültigen Terminierung nur ein temporäres Anhalten als Alternativmaßnahme, um die Systemverfügbarkeit sicherzustellen. AEM-konforme Applikationen bzw AEM-konforme Interaktionen einer Applikation können dagegen in solchen Fällen über ihren Event Handler optimaler reagieren (z.B. mit reduzierten Anforderungen nach Netzwerk-Ressourcen) . Durch die optimale wechselseitige Kommunikation (1,2,6) zwischen AEM [3] und AEM-konformen Applikationen [4a] lassen sich derart radikale Maßnahmen wie das für nicht AEM-konforme Applikationen [4b] notwendige temporäre Anhalten oder gar die endgültige Terminierung umgehen. Anhalten bzw. Terminierung zur Gewährleistung der Systemverfügbarkeit kommen für AEM- konforme Applikationen [4a] erst zum Einsatz, wenn die Behandlung über den Event Handler kein ausreichendes Ergebnis erbringt .A non-AEM-compliant application [4b] bypasses the AEM [3] by using a direct system call and threatens to jeopardize the availability of the overall system [5] with regard to the availability of network resources (network connectivity) because at the same time all other applications also require network services. The AEM [3] recognizes this conflict in its resource management and the risk that the requirements may escalate due to a certain non-AEM-compliant application [4b] at the expense of the other applications [4a, b]. The problematic, non-AEM-compliant application [4b] is therefore temporarily stopped via the decision maker and decision enforcement units (eg via the UNIX system signal "STOP") until the permissible requests for network resources by the other applications result in such a maximum occupancy by an individual Allow application. In an AEM-compliant application or a non-AEM-compliant interaction of an application, the availability are of the overall system in an unacceptable extent b eeinträchtigen would not, thus remains as a single agent before its final termination only a temporary stop as an alternative measure to the Ensure system availability. AEM-compliant applications or AEM-compliant interactions of an application, on the other hand, can react more optimally in such cases via their event handler (eg with reduced requirements for network resources). The optimal two-way communication (1,2,6) between AEM [3] and AEM-compliant applications [4a] can be used to avoid radical measures such as the temporary stopping necessary for non-AEM-compliant applications [4b] or even the final termination . Stopping or scheduling to ensure system availability are only used for AEM-compliant applications [4a] if the treatment via the event handler does not produce a sufficient result.
Das AEM Subsystem [3c] kann selbstverständlich auch die genannte Interaktion AEM-konformer Applikationen zusätzlich auf die Verwendung nicht AEM-konformer Methoden und Systemaufrufe hin überwachen oder die genannte Interaktion solcher Applikationen überwachen, die z.B unter Zuhilfenahme einer älteren Version des AEM-API programmiert wurden und nunmehr (d.h. wenn man über ein neues API programmierte Applikationen zum Vergleich betrachtet) nur noch zum Teil AEM-konform sind.The AEM subsystem [3c] can of course also monitor the above-mentioned interaction of AEM-compliant applications for the use of non-AEM-compliant methods and system calls, or monitor the aforementioned interaction of those applications that have been programmed, for example, with the aid of an older version of the AEM-API and now (ie if you look at applications programmed for comparison via a new API) are only partially AEM-compliant.
Abschließend zusammengefaßt weist die Erfindung zur Sicherung der Hochverfügbarkeit in Datenverarbeitungsanlagen folgende Merkmale/Vorteile auf:In conclusion, the invention has the following features / advantages for ensuring high availability in data processing systems:
• basierend auf allgemein verfügbarer, infolge• based on generally available, as a result
Massenproduktion sehr preiswerter ("off-the-shelf") Hard- und Software, Verwendung von de-facto Standards im Bereich Hard- und Software (soweit als möglich),Mass production of very inexpensive ("off-the-shelf") hardware and Software, use of de facto standards in the area of hardware and software (as far as possible),
• Portierbarkeit, d.h. keine konzeptionelle Bindung an eine bestimmte Hard- oder Softwareplattform,Portability, i.e. no conceptual link to a specific hardware or software platform,
• Wegfall des Konzepts der "Verfügbarkeit durch Redundanz", d.h. z.B. der Hardware-Dopplung, Daten-Spiegelung,Elimination of the concept of "availability through redundancy", i.e. e.g. hardware duplication, data mirroring,
• leichte Integration in existierende Systeme unter Verwendung bereits vorhandener Applikationen, d.h. Wiederverwendung der sog. "Installed Base".Easy integration into existing systems using existing applications, i.e. Reuse of the so-called "installed base".
Abkürzungen:Abbreviations:
AEM Availability Enhancing Middleware API Application Programming Interface IT Informationstechnik AEM Availability Enhancing Middleware API Application Programming Interface IT Information Technology

Claims

Patentansprüche claims
1. Überwachungs-Komponente eines Rechnersystems, die Interaktionen von Applikationen [4] mit der Rechnerplattform überwacht und die Abwehrmaßnahmen ergreift, wenn durch eine Interaktion die Verfügbarkeit des gesamten Rechnersystems beeinträchtigt wird bzw. würde.1. Ü berwachungs component of a computer system, the interactions of A pplications [4] with the computer platform ü b awakens and the defense take measures if the entire computer system is affected by an interaction of the availability or would.
2. Überwachungs-Komponente nach Anspruch 1, gekennzeichnet durch ein Application Programming Interface (API), über das Applikationen mit der Rechnerplattform interagieren können.2. Monitoring component according to claim 1, characterized by an application programming interface (API) via which applications can interact with the computer platform.
3. Überwachungs-Komponente nach Anspruch 1 oder 2, gekennzeichnet durch einen Sensor, der die Interaktion von Applikationen [4] mit dem System aufnimmt, indem er Systemaufrufe von Applikationen und/oder dadurch erzeugte Systemmeldungen (5) aufnimmt.3. Monitoring component according to claim 1 or 2, characterized by a sensor which records the interaction of applications [4] with the system by recording system calls from applications and / or system messages (5) generated thereby.
4. Überwachungs-Komponente nach Anspruch 1, dadurch gekennzeichnet, daß die Überwachungs-Komponente die Eigenschaft einer Middleware4. Monitoring component according to claim 1, characterized in that the monitoring component has the property of a middleware
Layer Komponente zwischen Rechnerplattform und ApplikationenLayer component between computer platform and applications
[4] aufweist.[4].
5. Überwachungs-Komponente nach einem der Ansprüche 1 bis 4, gekennzeichnet durch5. Monitoring component according to one of claims 1 to 4, characterized by
- mindestens eine Zustandsspeicher-Komponente, die Informationen über den momentanen Zustand des Gesamtsystems speichert,at least one state memory component, which stores information about the current state of the overall system,
- eine Monitor-Komponente, die aus einer Interaktion Zustandsänderungsinformationen gewinnt, diese der mindestens einen Zustandsspeicher-Komponente zur Aktualisierung mitteilt, und anhand der in der mindestens einen Zustandsspeicher-Komponente gespeichertena monitor component that obtains state change information from an interaction, communicates this to the at least one state memory component for updating, and uses the information stored in the at least one state memory component
Zustandsinformationen den Gesamtsystemzustand ermittelt, - eine Entscheidungs-Komponente, die den Gesamtsystemzustand analysiert und entscheidet, ob und wenn ja, welche Maßnahmen zur Aufrechterhaltung der Verfügbarkeit ergriffen werden.Status information determines the overall system status, - a decision component that analyzes the overall system status and decide whether and if so, what are Ma SS measures for maintaining the availability taken.
6. Verfahren zur Steigerung der Verfügbarkeit eines Rechnersystems, demgemäß6. Procedure for increasing the availability of a computer system, accordingly
Interaktionen von Applikationen [4] mit der Rechnerplattform überwacht und Abwehrmaßnahmen ergriffent werden, wenn durch eine Interaktion die Verfügbarkeit des gesamten Rechnersystems beeinträchtigt wird bzw. würde.Interactions of applications [4] with the computer platform are monitored and countermeasures are taken if an interaction interferes with the availability of the entire computer system.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet , daß Interaktionen von Applikationen mit der Rechnerplattform über ein Application Programming Interface (API) abgewickelt werden.7. The method according to claim 6, characterized in that interactions of applications with the computer platform are processed via an application programming interface (API).
8. Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, daß8. The method according to claim 6 or 7, characterized in that
Interaktionen von Applikationen [4 ] mit der Rechnerplattform aufgenommen werden, indem Systemaufrufe von Applikationen und/oder dadurch erzeugte Systemmeldungen (5) überwacht werden. Interactions of applications [4] with the computer platform are recorded by monitoring system calls of applications and / or system messages (5) generated thereby.
PCT/EP1999/009055 1998-11-24 1999-11-23 Monitor component of a data processing system WO2000031639A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP99959313A EP1133729A1 (en) 1998-11-24 1999-11-23 Monitor component of a data processing system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP98122303.5 1998-11-24
EP98122303 1998-11-24

Publications (1)

Publication Number Publication Date
WO2000031639A1 true WO2000031639A1 (en) 2000-06-02

Family

ID=8233027

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP1999/009055 WO2000031639A1 (en) 1998-11-24 1999-11-23 Monitor component of a data processing system

Country Status (3)

Country Link
EP (1) EP1133729A1 (en)
CN (1) CN1328667A (en)
WO (1) WO2000031639A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010116441A1 (en) * 2009-03-30 2010-10-14 富士通株式会社 Wireless power supply system, wireless power transmission device, and wireless power receiving device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101221615B (en) * 2008-02-05 2011-08-17 北京飞天诚信科技有限公司 Method for monitoring objective software and intelligent cryptographic key device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996032675A1 (en) * 1995-04-11 1996-10-17 Talati Kirit K Automated enforcement of behavior in application program
EP0827077A1 (en) * 1996-07-01 1998-03-04 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server failure reporting process

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996032675A1 (en) * 1995-04-11 1996-10-17 Talati Kirit K Automated enforcement of behavior in application program
EP0827077A1 (en) * 1996-07-01 1998-03-04 Sun Microsystems, Inc. Object-oriented system, method and article of manufacture for a client-server failure reporting process

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010116441A1 (en) * 2009-03-30 2010-10-14 富士通株式会社 Wireless power supply system, wireless power transmission device, and wireless power receiving device

Also Published As

Publication number Publication date
CN1328667A (en) 2001-12-26
EP1133729A1 (en) 2001-09-19

Similar Documents

Publication Publication Date Title
DE60220418T2 (en) Method and provider for system synchronization
DE60207251T2 (en) METHOD FOR ENSURING THE OPERATION OF A GROUPNAMENTAL SERVER AUTHORIZED DURING NODE FAILURES AND NETWORK ALLOCATIONS
DE69811148T2 (en) Membership in an unreliable distributed computing system
DE60318468T2 (en) METHOD FOR SOLVING DECISION-FREE POSSIBILITIES IN A CLUSTER COMPUTER SYSTEM
DE602005002713T2 (en) Information processing system with redundant paths and access methods
DE10321454B4 (en) System and method for power management in a computer system with multiple power networks
DE2740056A1 (en) MULTIPROCESSOR COMPUTER SYSTEM
DE2908316A1 (en) MULTICONFIGURABLE MODULAR PROCESSING SYSTEM INTEGRATED WITH A PRE-PROCESSING SYSTEM
DE112011102242T5 (en) Apparatus for processing a batch processing unit
EP0959588A2 (en) Network element with control device and control method
WO2005050437A2 (en) Method for the installation and configuration of software components
DE112011103443T5 (en) Intelligent interface for a decentralized control system
EP3929740A1 (en) Method for orchestrating a container-based application on a terminal
DE102016219854A1 (en) Computer system and method for dynamically customizing a software-defined network
WO2005073852A1 (en) Method for operating an arrangement of several computers in case of a computer failure
DE4429969A1 (en) Process for exchanging program packages in a multi-computer system and computer therefor
DE102009004726A1 (en) Systems and methods for tracking instruction pointers and data access
EP1798892A1 (en) Method for loading a list of alarms from an alarm application
DE602004002241T2 (en) Protection of a program waiting for execution in a memory for a microprocessor
EP0433350A1 (en) Operating programme for a data processor
WO2000031639A1 (en) Monitor component of a data processing system
EP0862827B1 (en) Method for checking a data exchange based on a communication protocol
DE102007005207A1 (en) Software duplication
WO1997010683A1 (en) Operational environment system for communication network service applications
EP1536328B1 (en) Data processing system with automatable management and method for automated management of a data processing system

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 99813681.6

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): BR CN ID US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 1999959313

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 09856629

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 1999959313

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: 1999959313

Country of ref document: EP