DE69017542T2 - Verarbeitungsverfahren bei dem kontinuierlicher Betrieb eines Übertragungssteuerungsprogramms erhalten wird. - Google Patents

Verarbeitungsverfahren bei dem kontinuierlicher Betrieb eines Übertragungssteuerungsprogramms erhalten wird.

Info

Publication number
DE69017542T2
DE69017542T2 DE69017542T DE69017542T DE69017542T2 DE 69017542 T2 DE69017542 T2 DE 69017542T2 DE 69017542 T DE69017542 T DE 69017542T DE 69017542 T DE69017542 T DE 69017542T DE 69017542 T2 DE69017542 T2 DE 69017542T2
Authority
DE
Germany
Prior art keywords
active
communication
shared memory
active process
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69017542T
Other languages
English (en)
Other versions
DE69017542D1 (de
Inventor
Masayuki Kasukawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Application granted granted Critical
Publication of DE69017542D1 publication Critical patent/DE69017542D1/de
Publication of DE69017542T2 publication Critical patent/DE69017542T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • G06F11/1482Generic software techniques for error detection or fault masking by means of middleware or OS functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2043Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share a common memory address space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)
  • Hardware Redundancy (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf ein Verarbeitungsverfahren, durch welches eine kontinuierliche Operation eines Kommunikationssteuerprogramms in einem Computersystem erhalten wird, das mit einem gemeinsamen Speicher versehen ist, auf den ein aktiver Prozeß und ein Standby- Prozeß zum Ausführen des Kommunikationssteuerprogramms zugreifen können.
  • Wenn in einem Computersystem das von einem Kommunikationssteuerprogramm betriebene Kommunikationszugriffsverfahren auf Grund einer Hardware-Fehlfunktion oder eines Software-Ausfalls im Computersystem nicht eingesetzt werden kann, kann ein Benutzer, der das Kommunikationssteuerprogramm (Anwendungsprogramm oder Datenstationsbediener) verwendet, das System auf Grund dieser Fehlfunktion oder dieses Ausfalls nicht kontinuierlich betreiben. Demgemäß muß der Benutzer eine logische Verknüpfung mit einer Kommunikationsstation wiederherstellen, und muß den Betrieb zur Fortsetzung derselben neu starten. Der Benutzer muß nämlich die folgenden komplizierten Schritte ausführen: Neustarten des Kommunikationszugriffsverfahrens; Wiederherstellen der logischen Verknüpfung; Untersuchen der Wirkungen und Wiederherstellen des Prozesses; und Neustarten des Betriebs, wenn das Kommunikationszugriffsverfahren nicht funktioniert.
  • In einem möglichen Verfahren zur Lösung der sich daraus rgebenden, involvierten Probleme wird das Kommunikationssteuerprogramm durch einen aktiven Prozeß und einen Standby- Prozeß dupliziert. Der aktive Prozeß arbeitet während des Normalbetriebs, und der Standby-Prozeß, der vom Ausfall des aktiven Prozesses nicht beeinflußt wird, wird vom Standby- Zustand zum kontinuierlichen Betreiben des Programms gebracht, wenn der aktive Prozeß nicht betrieben werden kann.
  • Unter Verwendung eines gemeinsamen Speichers, auf den sowohl der aktive Prozeß als auch der Standby-Prozeß Zugriff haben, und durch das Heranziehen aller Daten der operationalen Verbindungsumgebung oder Übertragung sowie der Empfangssignale, die vom aktiven Prozeß verwendet werden, kann der Standby-Prozeß die Operation fortsetzen, wenn der aktive Prozeß versagt.
  • Ein kontinuierlicher Betrieb kann nämlich durch die folgenden Schritte erhalten werden. Wenn die Verbindung hergestellt ist, wird zuerst die operationale Verbindungsumgebung im gemeinsamen Speicher gespeichert; wenn Daten empfangen werden, werden die empfangenen Daten im gemeinsamen Speicher gespeichert; die Daten werden übertragen, und bei der Vollendung davon werden die empfangenen Daten aus dem gemeinsamen Speicher gelöscht; und, wenn der aktive Prozeß nicht betreibbar wird, werden die operationale Umgebung und die empfangenen Daten vom Standby-Prozeß aus dem Speicher entnommen, und der Betrieb wird fortgesetzt.
  • In der obigen Verarbeitung beeinflußt jedoch das Speichern der empfangenen Daten im gemeinsamen Speicher oder das Löschen der Daten die Leistung des Normalbetriebs. Da alle empfangenen Daten gespeichert werden, ist ferner ein gemeinsamer Speicher mit großer Kapazität erforderlich. Demgemäß sind die obigen Schritte keine praktische Lösung für dieses Problem.
  • Die vorliegende Erfindung soll die obigen Probleme lösen.
  • Die EP-A-0 319 034 offenbart ein Verarbeitungsverfahren gemäß dem Oberbegriff des beigeschlossenen Anspruchs 1. Das heißt, sie offenbart ein Verfahren vom oben beschriebenen Typ, bei welchem ein Hauptsteuerprogramm durch einen aktiven Prozeß und einen Standby-Prozeß dupliziert wird, und im Fall eines Aus falls des aktiven Prozesses der Standby-Prozeß unter Verwendung der in einem gemeinsamen Speicher gespeicherten Informationen übernimmt.
  • Gemäß der vorliegenden Erfindung ist ein Verarbeitungsverfahren vorgesehen, durch welches eine kontinuierliche Operation eines Kommunikationssteuerprogramms in einem Computersystem erhalten wird, bei welchem ein das Kommunikationssteuerprogramm aus führender Prozeß durch einen aktiven Prozeß und einen Standby-Prozeß multiplexiert wird, und ein gemeinsamer Speicher, auf den der aktive Prozeß und der Standby-Prozeß zugreifen können, vorgesehen ist;
  • wobei der aktive Prozeß eine erste Prozeßstufe umfaßt, zum Einsetzen operationaler Umgebungsinformationen einer logischen Verknüpfung zwischen einem Anwendungsprogramm und einer Benutzerstation im genannten gemeinsamen Speicher; und
  • wobei der genannte Standby-Prozeß eine zweite Prozeßstufe umfaßt, zum Lesen des genannten gemeinsamen Speichers und zum Aufnehmen der operationalen Umgebungsinformationen aus dem aktiven Prozeß in jeder logischen Verknüpfung im voraus oder dann, wenn eine Ausfallwarnung der Operation des aktiven Prozesses erfolgt;
  • dadurch gekennzeichnet, daß:-
  • der genannte aktive Prozeß ferner eine dritte Prozeßstufe umfaßt, zum Speichern, wenn der aktive Prozeß eine Fehlfunktion aufweist, und ein Ereignis auftritt, bei dem der Standby-Prozeß die Kommunikation nicht fortsetzt, einer in-Verarbeitung-Flagge im genannten gemeinsamen Speicher, und, wenn die Verarbeitung des Ereignisses vollendet ist, zum Löschen der in-Verarbeitung-Flagge in jeder logischen Verknüpfung; und daß:-
  • der genannte Standby-Prozeß ferner eine vierte Prozeßstufe umfaßt, nur zur Warnung, daß eine Abnormität in bezug auf die logische Verknüpfung, für die die in-Verarbeitung- Flagge im genannten gemeinsamen Speicher gesetzt ist, aufgetreten ist, wenn eine Operation durch den aktiven Prozeß zu übernehmen ist.
  • Demgemäß kann eine Ausführungsform der vorliegenden Erfindung ein Verarbeitungsverfahren vorsehen, durch welches eine kontinuierliche Operation bei geringen Kosten für den Benutzer vorgesehen wird, indem eine Kommunikation spezifiziert wird, die durch eine Fehlfunktion eines Kommunikationssteuerprogramms während einer aktiven Operation beeinflußt wird.
  • Nun wird anhand von Beispielen auf die beigeschlossenen Zeichnungen bezuggenommen, in denen:-
  • Fig.1 ein Blockbild ist, das ein Kommunikationssteuerprogramm in einem System erläutert, in dem Benutzerstationen durch ein Kommunikationsnetz mit einem Computersystem verbunden sind;
  • Fig.2 ein Blockbild ist, das ein mögliches Beispiel eines Weges zur Lösung von im System in Fig.1 auftretenden Problemen erläutert;
  • Fig.3 ein Blockbild ist, das eine Ausführungsform gemäß der vorliegenden Erfindung zusammenfaßt;
  • Fig.4 ein Blockbild ist, das eine Operation der Ausführungsform in Fig.3 erläutert;
  • Fig.5 ein Blockbild ist, das einen aktiven Prozeß der Ausführungsform gemäß der vorliegenden Erfindung erläutert;
  • Fig.6 ein Blockbild ist, das einen Standby-Prozeß der Ausführungsform in Fig.5 erläutert;
  • Fig.7 ein Flußdiagramm der Verarbeitung des aktiven Prozesses im Kommunikationssteuerprogramm der Ausführungsform der vorliegenden Erfindung ist;
  • Fig.8 ein weiteres Flußdiagramm der Verarbeitung des Standby-Prozesses und ähnlich Fig.7 ist; und
  • Fig.9 eine erläuternde Darstellung ist, die eine operationale Umgebung der logischen Verknüpfung zeigt.
  • Vor einer Erläuterung einer Ausführungsform der vorliegenden Erfindung werden ein früherer Vorschlag und eine mögliche Lösung für die im früheren Vorschlag auftretenden Probleme mit Bezugnahme auf die Zeichnungen erklärt.
  • Das vorgeschlagene Verfahren wird mit Bezugnahme auf Fig.1 erläutert. Wenn in einem Computersystem 10 das von einem Kommunikationssteuerprogramm betriebene Kommunikationszugriffsverfahren 20 auf Grund einer Hardware-Fehlfunktion oder eines Software-Ausfalls im Computersystem 10 nicht arbeiten kann, kann ein Benutzer, der das Kommunikationssteuerprogramm (Anwendungsprogramm 11 oder Datenstationsbediener) verwendet, das System auf Grund der Fehlfunktion oder des Ausfalls nicht kontinuierlich betreiben. Demgemäß muß der Benutzer eine logische Verknüpfung 23 mit einer Kommunikationsstation wiederherstellen, und muß den Betrieb zum Fortsetzen derselben neu starten. Der Benutzer muß nämlich die folgenden komplizierten Schritte ausführen, wie in Fig.1 gezeigt, wenn das Kommunikationszugriffsverfahren ausfällt (nicht funktioniert oder zusammenbricht):
  • (1) Neustarten des Kommunikationszugriffsverfahrens 20;
  • (2) Wiederherstellen der logischen Verknüpfung 23;
  • (3) Untersuchen der Wirkungen und Wiederherstellen des Prozesses; und
  • (4) Neustarten des Betriebs.
  • Eine mögliche Lösung für die in diesem Verfahren auftretenden Probleme wird mit Bezugnahme auf Fig.2 erläutert. Bei diesem Verfahren wird das Kommunikationssteuerprogramm durch den aktiven Prozeß 13 und den Standby-Prozeß 14 dupliziert. Der aktive Prozeß 13 arbeitet während des Normalbetriebs, und der Standby-Prozeß 14, der vom Ausfall des aktiven Prozesses nicht beeinflußt wird, wird vom Standby- Zustand zum kontinuierlichen Betreiben des Programms gebracht, wenn der aktive Prozeß 13 ausfällt.
  • Unter Verwendung eines gemeinsamen Speichers 15, auf den sowohl der aktive Prozeß 13 als auch der Standby-Prozeß 14 Zugriff haben, und durch das Heranziehen aller Daten der operationalen Verbindungsumgebung oder Übertragung sowie der Empfangssignale, die vom aktiven Prozeß 13 verwendet werden, kann der Standby-Prozeß die Operation fortsetzen, wenn der aktive Prozeß 13 versagt.
  • Wie in Fig.2 dargestellt, kann nämlich ein kontinuierlicher Betrieb durch die folgenden Schritte erhalten werden.
  • (1) Wenn die Verbindung hergestellt ist, wird zuerst die operationale Verbindungsumgebung im gemeinsamen Speicher gespeichert.
  • (2) Wenn Daten empfangen werden, werden die empfangenen Daten im gemeinsamen Speicher 15 gespeichert.
  • (3) Die Daten werden übertragen, und bei der Vollendung davon werden die empfangenen Daten aus dem gemeinsamen Speicher 15 gelöscht.
  • (4) Wenn der aktive Prozeß 13 nicht betreibbar wird, werden die operationale Umgebung und die empfangenen Daten vom Standby-Prozeß 14 aus dem Speicher 15 entnommen, und der Betrieb wird fortgesetzt.
  • In der obigen Verarbeitung beeinflußt jedoch das Speichern der empfangenen Daten im gemeinsamen Speicher 15 oder das Löschen der Daten die Leistung des Normalbetriebs. Da alle empfangenen Daten gespeichert werden, ist ferner ein gemeinsamer Speicher 15 mit großer Kapazität erforderlich. Demgemäß ist der kontinuierliche Betrieb, wie in Fig.2 gezeigt, keine praktische Lösung für die obigen Probleme.
  • Als nächstes wird eine Ausführungsform gemäß der vorliegenden Erfindung mit Bezugnahme auf Fig.3 und 4 zusammengefaßt.
  • In Fig.3 ist 10 ein Computersystem, das einen oder eine Vielzahl von Prozessoren (CPU) vorsieht, 11 bedeutet ein Anwendungsprogramm, das Prozesse ausführt, die von die Datenkommunikation verwendenden Benutzern angefordert werden, 12 ist ein Kommunikationssteuerprogramm, das ein Kommunikationszugriffsverfahren realisiert, 13 stellt einen aktiven Prozeß dar, 14 ist ein Standby-Prozeß, l5 bedeutet einen gemeinsamen Speicher, auf den sowohl der aktive Prozeß 13 als auch der Standby-Prozeß l4 zugreifen können, und 16 ist ein operationaler Umgebungsinformations-Speicherteil zum Speichern operationaler Umgebungsinformationen, die vom Standby- Prozeß 14 aus dem aktiven Prozeß l3 entnommen werden.
  • Im Computersystem 10 wird der das Kommunikationssteuerprogramm 12 aus führende Prozeß durch den aktiven Prozeß 13 und den Standby-Prozeß 14 multiplexiert.
  • Der aktive Prozeß 13 operiert während des Normalbetriebs, und der Standby-Prozeß 14 wird vom Standby-Zustand zum kontinuierlichen Betreiben des Programms gebracht, wenn der aktive Prozeß 13 ausfällt.
  • Der aktive Prozeß 13 führt die Verarbeitungsstufen P1 und P2 aus. In der Verarbeitungsstufe P1 wird eine operationale Umgebung einer logischen Verknüpfung zwischen dem Anwendungsprogramm 11 für die Kommunikation und der Benutzerstation, mit der die Kommunikation zu erfolgen hat, gebildet, und die operationalen Umgebungsinformationen werden im gemeinsamen Speicher 15 gespeichert.
  • In der Verarbeitungsstufe P2 wird, wenn ein Ereignis auftritt, durch das der Standby-Prozeß 14 die Kommunikation nicht fortsetzen kann, während der aktive Prozeß 13 betreibbar ist, eine in-Verarbeitung-Flagge im gemeinsamen Speicher 15 in jeder logischen Verknüpfung gespeichert, und, wenn die Verarbeitung des Ereignisses vollendet ist, wird die in-Verarbeitung-Flagge gelöscht. In einem Datenübertragungsund Empfangsprozeß und dgl. wird nämlich beim Start der Verarbeitung eine Kennzeichnung der Verarbeitung in dem Teil eingesetzt, welcher der logischen Verknüpfung im Teil 16 zum Speichern operationaler Umgebungsinformationen im gemeinsamen Speicher 15 entspricht, und die Kennzeichnung der Verarbeitung wird am Ende der Verarbeitung gelöscht.
  • Der Standby-Prozeß 14 führt die Verarbeitungsstufen P3 und P4 aus. In der Verarbeitungsstufe P3 wird auf den Teil 16 zum Speichern operationaler Umgebungsinformationen im gemeinsamen Speicher 15 zugegriffen, und die operationalen Umgebungsinformationen in jeder logischen Verknüpfung werden aus dem aktiven Prozeß 13 im voraus oder dann, wenn eine Warnung erfolgt, daß der aktiven Prozeß nicht betreibbar ist, entnommen.
  • In der Verarbeitungsstufe P4 erfolgt, wenn die Informationen im aktiven Prozeß 13 herangezogen werden, eine Suche nach der in-Verarbeitung-Flagge im gemeinsamen Speicher 15. Wenn diese Flagge im gemeinsamen Speicher 15 gespeichert ist, wird die logische Verknüpfung mit der Flagge getrennt, und es erfolgt eine Warnung, daß eine Abnormität in bezug auf die logische Verknüpfung aufgetreten ist. Die Operationen für die anderen logischen Verknüpfungen, für die keine Flagge gesetzt wird, werden vom Kommunikationsprogramm 12 fortgesetzt.
  • Allgemein zeigt der Kommunikationsprozeß im Computersystem 10 die folgenden Merkmale:
  • (1) Im Fall entweder einer Datenübertragungsanforderung oder einer Datenempfangsanforderung während des Normalbetriebs wird die Anforderung von der CPU sofort verarbeitet. Die Anforderung wird nämlich nicht im Kommunikationssteuerprogramm 12 gehalten.
  • (2) Der Prozeß des Kommunikationssteuerprogramms 12 ist ein Fluß aufeinanderfolgender Steuerungen vom Start des Prozesses bis zu seinem Ende.
  • Angesichts dieser Merkmale wird, wenn das Kommunikationssteuerprogramm 12 eine Fehlfunktion aufweist, da die Fälle, in denen das Kommunikationssteuerprogramm 12 tatsächlich Übertragungs- oder Empfangsdaten der Kommunikation verarbeitet, rar sind, der Betrieb durch den Ausfall des Kommunikationssteuerprogramms 12 nur geringfügig beeinflußt.
  • In der vorliegenden Erfindung werden angesichts der obigen Merkmale die logischen Verknüpfungen zwischen dem Anwendungsprogramm 11 und den Benutzerstationen, die durch den Ausfall des Kommunikationssteuerprogramms 12 beeinflußt werden, spezifiziert, nur das Anwendungsprogramm 11 und die Benutzerstationen, die beeinträchtigt werden, empfangen die Warnung einer Abnormität in bezug auf die Kommunikation, und das Anwendungsprogramm ll und die Benutzerstationen, die vom Ausfall nicht betroffen sind, werden nicht informiert und können kontinuierlich operieren.
  • Fig.4 ist eine erläuternde Darstellung des Betriebs. Wie im oberen Teil in Fig.4 gezeigt, wird angenommen, daß, wenn eine Verbindung 23 zwischen dem Anwendungsprogramm 11 und der Station 22 erfolgt, und die Kommunikation durch ein Kommunikationsnetz 21 vom Kommunikationszugriffsverfahren 20 ausgeführt wird, eine Fehlfunktion des Kommunikationszugriffsverfahrens 20 aufgetreten ist. Zu dieser Zeit kann, wenn das Kommunikationszugriffsverfahren 20 eine tatsächliche Datenübertragung, einen Empfang oder dgl. nicht verarbeitet, wie im linken unteren Teil in Fig.4 dargestellt, das vom Standby-Prozeß betriebene Kommunikationszugriffsverfahren 20 die Kommunikation unter Verwendung der operationalen Umgebung wie zuvor durch die vorherige Verbindung 23 fortsetzen.
  • Wenn das Kommunikationszugriffsverfahren 20 eine Fehlfunktion während einer tatsächlichen Datenverarbeitung aufweist, trennt das Kommunikationszugriffsverfahren 20 in diesem Fall, wie im unteren rechten Teil in Fig.4 gezeigt, die Verbindung 23 und sendet ein Signal, welches das Auftreten einer Abnormität im Anwendungsprogramm 11 oder dgl. kennzeichnet.
  • Im früheren Vorschlag wird auch in dem Fall, der im unteren linken Teil in Fig.4 dargestellt ist, die Verbindung 23 getrennt, und der Betrieb kann nicht fortgesetzt werden. Gemäß der vorliegenden Erfindung wird jedoch die Verbindung 23 nur in dem Fall getrennt, der im unteren rechten Teil in Fig.4 gezeigt ist, und so wird die Wirkung der Fehlfunktion reduziert.
  • Die oben angegebene Ausführungsform wird detailliert erläutert. Fig.5 und 6 sind Blockbilder der Ausführungsform gemäß dieser Erfindung, Fig.7 ist ein Prozeßflußdiagramm des aktiven Prozesses dieser Ausführungsform, und Fig.8 ist ein Prozeßflußdiagramm des Standby-Prozesses dieser Ausführungsform.
  • Fig.5 zeigt einen Betrieb des aktiven Prozesses 13, und Fig.6 zeigt einen Betrieb des Standby-Prozesses 14. In diesen Figuren sind C1 bis C3 Verbindungen (logische Verknüpfungen), und T1 bis T3 stellen Stationen dar.
  • (1) Betrieb des aktiven Prozesses
  • A. Der aktive Prozeß 13 speichert sequentiell die operationale Umgebung der Verbindungen C1 bis C3 im gemeinsamen Speicher 15.
  • B. Wenn ein Ereignis zwischen dem Anwendungsprogramm 11 und den Benutzerstationen T1 bis T3 auftritt, wird die Kennzeichnung (Flagge) im Laufe der Datenverarbeitung (schwarzer Kreis in Fig.5 und 6) zu den operationalen Umgebungsinformationen, die vom aktiven Prozeß 13 verwaltet werden, und den im gemeinsamen Speicher 15 gespeicherten Informationen hinzugefügt.
  • Das Ereignis, für das die Flagge (während der Datenverarbeitung) gesetzt werden muß, ist wie folgt. Sofern nämlich der Prozeß des auftretenden Ereignisses gestartet wird, wenn der aktive Prozeß 13 während der Verarbeitung eine Fehlfunktion aufweist, und der Standby-Prozeß 14 den Betrieb übernimmt, kann die Konsistenz des Prozesses bei dem Ereignis nicht für das Anwendungsprogramm 11 oder ein Protokoll der Benutzerstationen aufrechterhalten werden. Beispielsweise fallen ein Verlust von Übertragungs- oder Empfangsdaten zwischen dem Anwendungsprogramm 11 und der Benutzerstation, die Erzeugung einer Inkonsistenz des Kommunikationsprotokolls oder dgl. darunter. Nachdem die Verarbeitung dieses Ereignisses vollendet ist, wird die Daten-in-Verarbeitung-Flagge gelöscht.
  • (2) Betrieb des Standby-Prozesses
  • C. Die operationale Umgebung des aktiven Prozesses 13 wird im Standby-Prozeß 14 durch die aus dem gemeinsamen Speicher 15 gelesenen Informationen gebildet.
  • D. Die logischen Verknüpfungen zwischen dem Anwendungsprogramm 11 und den Benutzerstationen werden untersucht, und die im aktiven Prozeß 13 gespeicherte Daten-in- Verarbeitung-Flagge wird untersucht.
  • In den Verbindungen C2 und C3, in denen keine Daten in Verarbeitung sind, setzt der Standby-Prozeß 14 den Betrieb fort.
  • In der Verbindung C1, worin die Daten-in-Verarbeitung-Flagge gespeichert wird, wenn der Standby-Prozeß 14 den Betrieb fortsetzt, da ein Fehlerbetrieb zwischen dem Anwendungsprogramm 11 und der Benutzerstation T1 auftreten kann, wird eine Warnung einer Abnormität sowohl an das Anwendungsprogramm 11 als auch die Benutzerstation T1 gesendet.
  • Wie vorstehend erläutert, ist die Beziehung zwischen dem Anwendungsprogramm und dem Benutzer wie folgt.
  • Wenn die Daten nicht verarbeitet werden, erfolgt keine Warnung an den Benutzer, und der Betrieb wird fortgesetzt, und nur dann, wenn die Daten verarbeitet werden, erfolgt eine derartige Warnung an den Benutzer. Durch diese Warnung kann der Benutzer erforderlichenfalls zum Wiederherstellungsprozeß gehen.
  • Das Verarbeitungsflußdiagramm des aktiven Prozesses 13 ist beispielsweise in Fig.7 gezeigt. Nachstehend werden die Verarbeitungsschritte S1 bis S7 in Fig.7 erläutert.
  • S1: Die operationale Umgebung des Kommunikationszugriffsverfahrens wird durch den Start des Kommunikationszugriffsverfahrens gebildet. In dieser Ausführungsform wird in diesem Schritt der gemeinsame Speicher vorgesehen und der Standby-Prozeß gestartet.
  • S2: Der Prozeß der Aktivierung des Netzwerkelements wird durchgeführt. Die Netzwerkelementumgebung wird im gemeinsamen Speicher gespeichert.
  • S3: Die operationale Umgebung der logischen Verknüpfung wird bei einer Anforderung zum Öffnen der logischen Verknüpfung vom Anwendungsprogramm oder von der Benutzerstation gebildet. An dieser Stelle wird, wenn eine Fehlfunktion auftritt, der aktive Prozeß durch den Standby-Prozeß ersetzt, und die normalerweise zur Benutzerstation kommunizierten Informationen, beispielsweise Kommunikationsprotokollinformationen oder dgl., werden im gemeinsamen Speicher gespeichert.
  • S4: Die Daten-in-Verarbeitung-Flagge wird im gemeinsamen Speicher für die Datenübertragung zum bzw. zur oder den Empfang vom Anwendungsprogramm bzw. von der Benutzerstation gespeichert.
  • S5: Der Datenübertragungs- oder Empfangsprozeß wird gemäß dem Kommunikationsprotokoll durchgeführt. Wenn die Informationen, beispielsweise zu entnehmende Informationen oder dgl., erforderlich sind, werden die Informationen im gemeinsamen Speicher gespeichert.
  • S6: Im Datennotiz/Übertragungsprozeß wird, wenn das Kommunikationssteuerprogramm über die Daten informiert oder diese überträgt, die Daten-in-Verarbeitung-Flagge gelöscht.
  • S7: Die Informationen der logischen Verknüpfung im gemeinsamen Speicher werden bei einer Anforderung zum Trennen der logischen Verknüpfung vom Anwendungsprogramm oder von der Benutzerstation getrennt.
  • Das Prozeßflußdiagramm des Standby-Prozesses 14 ist beispielsweise in Fig.8 gezeigt. Nachstehend werden die Schritte S11 bis S19 in Fig.8 erläutert.
  • S11: Nachdem der Standby-Prozeß vom aktiven Prozeß betrieben wird, wird die operationale Umgebung des Kommunikationszugriffsverfahrens gebildet. Ferner wird der gemeinsame Speicher vorgesehen, um aus dem aktiven Prozeß zu entnehmende Informationen zu erhalten.
  • S12: Der Prozeß, worin die operationale Umgebung des aktiven Prozesses im voraus eingesetzt wird, wird in einem vorherbestimmten Zeitraum durchgeführt. In jeder logischen Verknüpfung wird nämlich die operationale Umgebung durch die aus dem gemeinsamen Speicher gelesenen Informationen gebildet. Die Voreinstellung wird verwendet, um die Neustartzeit im Standby-Prozeß zu verkürzen, wenn der aktive Prozeß eine Fehlfunktion aufweist, und daher ist die Voreinstellung nicht immer notwendig. Die Einstellung kann durchgeführt werden, wenn der Standby-Prozeß vom aktiven Prozeß übernimmt.
  • S13: Wenn eine Warnung des Ausfalls des aktiven Prozesses erfolgt, wird die operationale Umgebung des aktiven Prozesses gebildet. Die operationale Umgebung (Netzwerkelement, logische Verknüpfungsumgebung oder dgl.) des aktiven Prozesses wird gelesen, und die Umgebung, in welcher der aktive Prozeß operiert, wird aus dem gemeinsamen Speicher gebildet. Wenn in Schritt S12 die Umgebung voreingestellt wird, wird die Bildungszeit verkürzt.
  • S14 bis S18: Die logischen Verknüpfungen, die auf Grund des Aus falls des aktiven Prozesses getrennt werden müssen, werden unter allen logischen Verknüpfungen untersucht. Wenn die Daten-in-Verarbeitung-Flagge nicht in einer logischen Verknüpfung gespeichert ist, wird die logische Verknüpfung durch die Fehlfunktion nicht beeinflußt, und dann wird die nächste logische Verknüpfung untersucht. Die logische Verknüpfung mit der Flagge wird durch die Fehlfunktion beeinträchtigt, und demgemäß wird die logische Verknüpfung getrennt und der Bereich im gemeinsamen Speicher gelöscht. Bei dieser Trennung der Verbindung erfolgt eine Abnormitätswarnung an einen Kommunikationsanforderungsteil. Die obigen Prozesse werden für alle logischen Verknüpfungen wiederholt.
  • S19: Der Prozeß von Schritt S14 wird für alle logischen Verknüpfungen verwendet, der Standby-Prozeß wird der neue aktive Prozeß, und der Normalbetrieb wird gestartet.
  • Als nächstes wird die operationale Umgebung der logischen Verknüpfung mit Bezugnahme auf Fig.9 erläutert. Die operationale Umgebung umf aßt die folgenden Informationen.
  • (1) Zum Anwendungsprogramm zu kommunizierende Informationen
  • Die zum Adreßraum des Anwendungsprogramms zu kommunizierenden Informationen, beispielsweise Adreßrauminformationen zum Übertragen oder Empfangen von Daten.
  • (2) Zu den Benutzerstationen zu kommunizierende Informationen
  • Zur Benutzerstation zu kommunizierende Harware-Informationen, beispielsweise Zeilenadressen, Stationsadressen oder dgl.
  • (3) Operationale Umgebung der Verbindung
  • Umgebungsinformationen, so daß die Verbindung im Kommunikationszugriffsverfahren operiert, beispielsweise exklusive Informationen oder dgl.
  • (4) Kommunikationsprotokollinformationen
  • Zur Benutzerstation zu sendende Kommunikationsprotokollinformationen, beispielsweise Zielreferenz, Quellenreferenz, Protokollklasse, TPDU-Größe, TPDU-Sendesequenznummer, Sequenznummer, welche die nächste erwartete DT TPDU Nummer anzeigt, oder dgl. (Einzelheiten siehe ISO OSI 8073 Transportschichtprotokoll).
  • Die obigen Informationen werden in jeder Benutzerstation gebildet und im Speicherraum des aktiven Prozesses gespeichert. Diese Informationen werden auch im gemeinsamen Speicher gespeichert. Der Standby-Prozeß liest die obigen Informationen aus dem gemeinsamen Speicher und bildet die gleiche Umgebung im Speicherraum des Standby-Prozesses.
  • Im Kommunikationsprozeß unter Verwendung des Kommunikationssteuerprogramms wird üblicherweise die Anforderung von der CPU nur in den Fällen sowohl einer Datenübertragungsanforderung als auch einer Datenempfangsanforderung sofort verarbeitet. Die Anforderung wird nämlich nicht im Kommunikationssteuerprogramm gehalten. Ferner ist der Prozeß des Kommunikationssteuerprogramms ein fortlaufender Fluß vom Start des Prozesses bis zu seinem Ende.
  • Im obigen Prozeß ist die Wirkung bei der Fehlfunktion des Kommunikationssteuerprogramms wie folgt.
  • Wenn in einem System mit einer CPU das Kommunikationssteuerprogramm eine Fehlfunktion aufweist, existiert nur eine oder keine Kommunikation in der Verarbeitung zwischen dem Anwendungsprogramm und der Benutzerstation.
  • Wenn der Ausfall auftritt, besteht manchmal eine Kommunikation zwischen dem Anwendungsprogramm und der Benutzerstation in der Verarbeitung durch das Kommunikationssteuerprogramm.
  • Wenn der Ausfall auftritt, besteht manchmal eine Kommunikation zwischen dem Anwendungsprogramm und der Benutzerstation, die auf die Verarbeitung des Kommunikationssteuerprogramms wartet.
  • Daher wird angenommen, daß das Ausmaß dieser Kommunikation zwischen dem Anwendungsprogramm und der Benutzerstation, die durch die Fehlfunktion des Kommunikationssteuerprogramms beeinflußt werden, in einem üblichen System beispielsweise weniger als 10 % beträgt.
  • Im früheren Vorschlag werden alle Kommunikationen zwischen dem Anwendungsprogramm und den Benutzerstationen, die das Kommunikationssteuerprogramm verwenden, beeinflußt, und das Wiederherstellungsverfahren muß vom Benutzer durchgeführt werden. Andererseits können durch die Verwendung dieser Erfindung mehr als 90 % der Kommunikationen zwischen dem Anwendungsprogramm und den Benutzerstationen, die durch den Ausfall des Kommunikationssteuerprogramms nicht beeinflußt werden, wie vorher fortgesetzt werden. Demgemäß muß der Benutzer das Wiederherstellungsverfahren nur bei weniger als 10 % der Kommunikationen durchführen.

Claims (5)

1. Verarbeitungsverfahren, durch welches eine kontinuierliche Operation eines Kommunikationssteuerprogramms in einem Computersystem (10) erhalten wird, bei welchem ein das Kommunikationssteuerprogramm (12) ausführender Prozeß durch einen aktiven Prozeß (13) und einen Standby-Prozeß (14) multiplexiert wird, und ein gemeinsamer Speicher (15), auf den der aktive Prozeß und der Standby-Prozeß zugreifen können, vorgesehen ist;
wobei der aktive Prozeß eine erste Prozeßstufe (P1) umfaßt, zum Einsetzen operationaler Umgebungsinformationen einer logischen Verknüpfung zwischen einem Anwendungsprogramm (11) und einer Benutzerstation im genannten gemeinsamen Speicher; und
wobei der genannte Standby-Prozeß eine zweite Prozeßstufe (P3) umfaßt, zum Lesen des genannten gemeinsamen Speichers und zum Aufnehmen der operationalen Umgebungsinformationen aus dem aktiven Prozeß in jeder logischen Verknüpfung im voraus oder dann, wenn eine Ausfallwarnung der Operation des aktiven Prozesses erfolgt;
dadurch gekennzeichnet, daß:-
der genannte aktive Prozeß ferner eine dritte Prozeßstufe (P2) umfaßt, zum Speichern, wenn der aktive Prozeß eine Fehlfunktion aufweist, und ein Ereignis auftritt, bei dem der Standby-Prozeß die Kommunikation nicht fortsetzt, einer in-Verarbeitung-Flagge im genannten gemeinsamen Speicher, und, wenn die Verarbeitung des Ereignisses vollendet ist, zum Löschen der in-Verarbeitung-Flagge in jeder logischen Verknüpfung; und daß:-
der genannte Standby-Prozeß ferner eine vierte Prozeßstufe (P4) umfaßt, nur zur Warnung, daß eine Abnormität in bezug auf die logische Verknüpfung, für die die in-Verarbeitung-Flagge im genannten gemeinsamen Speicher gesetzt ist, aufgetreten ist, wenn eine Operation durch den aktiven Prozeß zu übernehmen ist.
2. Verarbeitungsverfahren nach Anspruch 1, welches ferner einen Schritt umfaßt: Speichern, im genannten gemeinsamen Speicher (15), operationaler Umgebungsinformationen, die an das Anwendungsprogramm (11) zu kommunizierende Informationen; andere, an die Benutzerstationen zu kommunizierende Informationen; eine operationale Umgebung der logischen Verknüpfung; und Kommunikationsprotokollinformationen enthalten.
3. Verarbeitungsverfahren nach Anspruch 1 oder 2, welches ferner einen Schritt umfaßt Speichern, im genannten gemeinsamen Speicher (15), zu übernehmender Informationen und der in-Verarbeitung-Flagge.
4. Verarbeitungsverfahren nach Anspruch 1, 2 oder 3, bei welchem, wenn der genannte aktive Prozeß (13) zwischen dem Start und Ende eines Datenübertragungs- oder Empfangsprozesses im aktiven Prozeß eine Fehlfunktion aufweist, das genannte Ereignis, bei dem der Standby-Prozeß (14) die Kommunikation nicht fortsetzt, bestimmt wird.
5. Verarbeitungsverfahren nach einem der vorhergehenden Ansprüche, bei welchem die genannte logische Verknüpfung der Kommunikation, an die eine Warnung des Auftretens einer Abnormität gesendet wird, getrennt wird.
DE69017542T 1989-07-20 1990-07-19 Verarbeitungsverfahren bei dem kontinuierlicher Betrieb eines Übertragungssteuerungsprogramms erhalten wird. Expired - Fee Related DE69017542T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1188273A JP2755437B2 (ja) 1989-07-20 1989-07-20 通信制御プログラムの連続運転保証処理方法

Publications (2)

Publication Number Publication Date
DE69017542D1 DE69017542D1 (de) 1995-04-13
DE69017542T2 true DE69017542T2 (de) 1995-07-06

Family

ID=16220780

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69017542T Expired - Fee Related DE69017542T2 (de) 1989-07-20 1990-07-19 Verarbeitungsverfahren bei dem kontinuierlicher Betrieb eines Übertragungssteuerungsprogramms erhalten wird.

Country Status (5)

Country Link
US (1) US5600808A (de)
EP (1) EP0409604B1 (de)
JP (1) JP2755437B2 (de)
AU (1) AU622819B2 (de)
DE (1) DE69017542T2 (de)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2846047B2 (ja) * 1990-03-29 1999-01-13 株式会社東芝 シャドウプロセス生成方式
JP3189903B2 (ja) * 1991-06-03 2001-07-16 富士通株式会社 ケーパビリティの退避・復元機構を持つ装置
US6144961A (en) * 1995-08-31 2000-11-07 Compuware Corporation Method and system for non-intrusive measurement of transaction response times on a network
JP3398681B2 (ja) * 1998-08-06 2003-04-21 エヌイーシーシステムテクノロジー株式会社 通信処理システム
DE69927223T2 (de) * 1998-09-08 2006-07-13 Fujitsu Services Ltd. Ausfallsicherheit eines Mehrrechnersystems
GB2359386B (en) 2000-02-16 2004-08-04 Data Connection Ltd Replicated control block handles for fault-tolerant computer systems
WO2002047318A1 (fr) * 2000-12-04 2002-06-13 Mitsubishi Denki Kabushiki Kaisha Controleur de communication et procede
US6795889B2 (en) 2002-01-09 2004-09-21 International Business Machines Corporation Method and apparatus for multi-path data storage and retrieval
AU2002241195A1 (en) * 2002-03-08 2003-09-22 Nokia Corporation Method and deice for providing a representation of applications for display on an electronic device
DE602006007825D1 (de) * 2006-05-16 2009-08-27 Saab Ab Fehlertolerantes Steuersystem
US8656396B2 (en) * 2009-08-11 2014-02-18 International Business Machines Corporation Performance optimization based on threshold performance measure by resuming suspended threads if present or by creating threads within elastic and data parallel operators
JP2013225208A (ja) * 2012-04-20 2013-10-31 Toyota Motor Corp 情報処理装置、情報処理方法、及びプログラム
US9063788B2 (en) * 2012-08-27 2015-06-23 International Business Machines Corporation Stream processing with runtime adaptation
US9106391B2 (en) 2013-05-28 2015-08-11 International Business Machines Corporation Elastic auto-parallelization for stream processing applications based on a measured throughput and congestion
JP2021014986A (ja) * 2017-09-06 2021-02-12 株式会社村田製作所 電流センサ及び電流センサの製造方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1119003B (it) * 1979-06-25 1986-03-03 Riv Officine Di Villar Perosa Dispositivo smagnetizzatore
US4453213A (en) * 1981-07-30 1984-06-05 Harris Corporation Error reporting scheme
US4610013A (en) * 1983-11-08 1986-09-02 Avco Corporation Remote multiplexer terminal with redundant central processor units
US4823256A (en) * 1984-06-22 1989-04-18 American Telephone And Telegraph Company, At&T Bell Laboratories Reconfigurable dual processor system
JPS6272248A (ja) * 1985-09-25 1987-04-02 Hitachi Ltd デ−タ伝送システムの現用予備切替方法
US5155678A (en) * 1985-10-29 1992-10-13 International Business Machines Corporation Data availability in restartable data base system
US4710926A (en) * 1985-12-27 1987-12-01 American Telephone And Telegraph Company, At&T Bell Laboratories Fault recovery in a distributed processing system
JPS6375963A (ja) * 1986-09-19 1988-04-06 Hitachi Ltd システム回復方式
JPH07117863B2 (ja) * 1987-06-26 1995-12-18 株式会社日立製作所 オンラインシステムの再立上げ方式
US5121486A (en) * 1987-11-20 1992-06-09 Hitachi, Ltd Network control system for dynamically switching a logical connection between an identified terminal device and an indicated processing unit
JPH01147727A (ja) * 1987-12-04 1989-06-09 Hitachi Ltd オンラインプログラムの障害回復方法
US5027269A (en) * 1989-04-27 1991-06-25 International Business Machines Corporation Method and apparatus for providing continuous availability of applications in a computer network
JP2560510B2 (ja) * 1990-03-06 1996-12-04 日本電気株式会社 ネットワーク管理マネージャ切り替え方式
JPH04101201A (ja) * 1990-08-21 1992-04-02 Toshiba Corp プラント監視制御システム
US5341496A (en) * 1990-08-29 1994-08-23 The Foxboro Company Apparatus and method for interfacing host computer and computer nodes using redundant gateway data lists of accessible computer node data

Also Published As

Publication number Publication date
AU622819B2 (en) 1992-04-16
JPH0352049A (ja) 1991-03-06
AU5910090A (en) 1991-01-24
EP0409604B1 (de) 1995-03-08
US5600808A (en) 1997-02-04
JP2755437B2 (ja) 1998-05-20
EP0409604A2 (de) 1991-01-23
EP0409604A3 (en) 1992-01-02
DE69017542D1 (de) 1995-04-13

Similar Documents

Publication Publication Date Title
DE69017542T2 (de) Verarbeitungsverfahren bei dem kontinuierlicher Betrieb eines Übertragungssteuerungsprogramms erhalten wird.
DE69322549T2 (de) Verteilte Transaktionsverarbeitung mit einem Zwei-Phasen-Bindungsprotokoll mit erwarteter Bindung ohne Aufzeichnungspflicht
DE4235193C2 (de) Netzwerksystem und zugehöriges Softwareverwaltungsverfahren
DE69228819T2 (de) Konfigurations- und Betriebsverfahren eines Telekommunikationsgeräts
DE3689664T2 (de) Verfahren und Gerät zur Verwaltung von veralteten Datenobjekten.
DE3942661C2 (de)
DE3854481T2 (de) Datenverarbeitungsverfahren in einem dezentralisierten Verarbeitungssystem.
DE2908316C2 (de) Modular aufgebaute Multiprozessor-Datenverarbeitungsanlage
DE3222390C2 (de)
DE10112941A1 (de) System und Verfahren für das parallele Lesen von primären und sekundären Sicherungen zur Wiederherstellung mehrerer gemeinsam benutzter Datenbankdateien
DE3686335T2 (de) Verbindungsanlage fuer eine programmierbare steuerung.
DE19938105A1 (de) Auflösung von Ereignissen, die während der Verwendung eines Produkts auftreten
EP0966169B1 (de) Sicherungsverfahren für Betriebsdaten eines Netzelementes und Steuerungseinrichtung für ein Netzelement
DE602004006224T2 (de) Verfahren und Vorrichtung zur Datensynchronisierung eines verteilten Datenbanksystems
EP0170336A2 (de) Anordnung zur Informationsübertragung mit Rekonfiguration
EP1430369A1 (de) Dynamischer zugriff auf automatisierungsressourcen
DE602004005666T2 (de) Speichervorrichtung für asynchrone entfernte Datenspiegelung
DE69125879T2 (de) Vorrichtung und Benutzung dieser Vorrichtung in einem Verfahren zum Karten-Auswechseln
DE19803697C2 (de) Verfahren zum Aufrüsten eines Softwaresystems und Vorrichtung zur Durchführung des Verfahrens
EP0698847A1 (de) Verfahren für einen Programmpaketaustausch in einem Mehrrechnersystem und Rechner dafür
DE69027827T2 (de) Verfahren und Anordnung zur On-line-Verarbeitung von Transaktionsdaten
DE3016452A1 (de) Steuereinrichtung, insbesondere fuer fernsprechvermittlungsanlagen
DE69128706T2 (de) Einrichtung zur automatischen Fernladung
DE102020213407A1 (de) Steuerkommunikationssystem
DE19843048C2 (de) Verfahren für einen Softwarezugriffswechsel in einem Netzwerkknoten eines Telekommunikationsnetzwerkes sowie ein zum Durchführen eines solchen Verfahrens geeigneter Netzwerkknoten

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee