EP0722583A1

EP0722583A1 - Prozessor für zeichenketten variabler länge

Info

Publication number: EP0722583A1
Application number: EP94928335A
Authority: EP
Inventors: Wilhelm Ernst Haller; Klaus Jörg GETZLAFF; Herbert Chilinski; Ralph KÖSTER
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1993-10-08
Filing date: 1994-09-12
Publication date: 1996-07-24
Also published as: DE4334294C1; JPH09503327A; US5761521A; WO1995010803A1; JP3183669B2

Abstract

Ein Prozessor für Zeichenketten A, B variabler Länge dient zur schnellen Feststellung von Übereinstimmungen, Nichtübereinstimmungen und Größer/Kleiner-Abweichungen. Die Zeichenketten, deren Längen durch Zeichenkettenende-Kennzeichen begrenzt sind, werden in aufeinanderfolgende Teilketten mit einer der Datenflußbreite entsprechenden Bytezahl zerlegt und zur Feststellung einer Übereinstimmung, einer Nichtübereinstimmung und eines Kettenende-Kennzeichens verarbeitet. Jede Teilkette wird über Operandenregister (16, 18) parallel einer arithmetischen Einheit (20), einer logischen Einheit (22) und mit Vergleichseinheit (24) zugeführt und simultan verarbeitet. In der arithmetischen Einheit (20) wird die eine Teilkette von der anderen Teilkette subtrahiert, in der logischen Einheit (22) werden beide Teilketten miteinander verglichen und in der Vergleichseinheit (24) werden die Bytes beider Teilketten mit dem Inhalt eines zuvor auf das Kettenende-Kennzeichen eingestellten Kennzeichenregisters (26) verglichen. Diese Operationen werden in einem Maschinenzyklus ausgeführt. Ausgangssignale der Vergleichseinheit dienen als Anzeige für die Gleichheit beider Teilketten, Ausgangssignale der logischen Einheit dienen als Anzeige für die Ungleichheit beider Teilketten und ein Übertragssignal aus der arithmetischen Einheit dient zugleich als Anzeige dafür, welche der beiden Teilketten größer oder kleiner ist.

Description

B e s c h r e i b u n g

PROZESSOR FÜR ZEICHENKETTEN VARIABLER LÄNGE

Die Erfindung bezieht sich auf einen Prozessor für Zeichenketten variabler Länge mit einem System von Speichereinheiten zur Speicherung von Zeichenketten, die durch Programmbefehle paarweise adressierbar sind und aus denen der Datenflußbreite entsprechende Teilketten in zwei Operandenregister übertragen werden, mit einer Arithmetik/Logik-Einheit zur Ausführung von Verarbeitungsoperationen, mit einer Bedingungscode- Schaltung, die aus den Verarbeitungsergebnissen abgeleitete Signale speichert, die zur Steuerung von Programmverzweigungen dienen, und mit einer Steuereinheit, die nacheinander die Teilketten der Zeichenkettenpaare in der Speichereinheit adressiert und in aufeinanderfolgenden Maschinenzyklen die Operation der Einheiten und Übertragungen zwischen den Einheiten steuert.

Computeranwendungen zur Datenbankabfrage, Anwendungen im Bereich der Textverarbeitung und die Unterstützung höherer Programmiersprachen erfordern in hohem Maße die Verarbeitung von Zeichenketten. Allgemein ausgedrückt ist eine Zeichenkette ein Datenelement, das aus einer Bytefolge mit einer variablen Länge besteht. Die Länge einer Zeichenkette kann von einem Byte bis zu einer Anzahl von Bytes reichen, die lediglich durch die Größe einer Speichereinheit begrenzt ist. Sie kann durch einen Längencode bestimmt sein oder durch ein Sonderzeichen, welches in der Zeichenkette enthalten ist und das Ende der Kette anzeigt. Für Zeichenkettenbefehle ist es ein Normalfall, daß die zu verarbeitenden Zeichenketten unterschiedlich lang sind. Häufige Arten der Verarbeitung sind der Vergleich von zwei Zeichenketten und die Ermittlung des ersten übereinstimmenden oder voneinander abweichenden Bytepaares, die Ermittlung eines Kettenendzeichens in einer Zeichenkette A und in einer Zeichenkette B, die Suche einer Teilkette innerhalb einer Zeichenkette oder die Verschiebung einer Zeichenkette auf eine andere Speicherposition.

Komplexe Zeichenkettenbefehle haben drei Operanden: die Adresse einer ersten Zeichenkette A, die Adresse einer zweiten Zeichenkette B, wobei A und B variable Länge haben, und als dritten Operanden die Adresse eines Kettenende-Bytes, die das Ende der Zeichenketten A und B markieren. Die Ausführung eines solchen Befehls erfordert eine Reihe von Operationen. Die den ersten Operanden darstellende Zeichenkette wird byteweise von links nach rechts mit der den zweiten Operanden darstellenden Zeichenkette verglichen, bis ein nichtübereinstimmendes Bytepaar oder ein Kettenende- Byte festgestellt wird. Beide Zeichenketten sind gleich, wenn das Kettenende-Byte in beiden Zeichenketten in der gleichen Bitposition gefunden wird. Wird das Kettenende-Byte in nur einer der beiden Zeichenketten festgestellt, ist diese Zeichenkette die kürzere und wird als die kleinere angesehen. Wenn dagegen anstelle eines Kettenende-Bytes ein nichtübereinstimmendes Bytepaar festgestellt wird, sind diese beiden Bytes miteinander zu vergleichen, um zu ermitteln, welcher der beiden Operanden der kleinere ist. Die Befehlsausführung umfaßt daher folgende Phasen: Suche nach dem Kettenende-Byte in der Zeichenkette A, Suche nach dem Kettenende-Byte der Zeichenkette B, Vergleich beider Zeichenketten auf Nichtübereinstimmung, Subtraktion der einen Zeichenkette von der anderen zur Bestimmung, welche Zeichenkette die kleinere ist. Die Ausführung dieser verschiedenen Operationen erfordert einen erheblichen Aufwand an Mikroprogramm-Steuerung und Verarbeitungszeit.

Es ist bekannt, die Ausführung von

Zeichenkettenbefehlen dadurch zu beschleunigen, daß Schaltungen vorgehen sind, die einen parallelen Vergleich einer Anzahl von Bytes gestatten (US- PS 4 896 133). Mit einer solchen Anordnung ist es möglich, ein bestimmtes Steuerzeichen in einer Zeichenkette durch eine Vergleichsoperation festzustellen, in dem Kopien dieses Steuerzeichens in allen Bytepositionen eines Operandenregisters eingespeichert werden und gleichzeitig mit acht Bytes der Kette verglichen werden. Wenn eine Übereinstimmung festgestellt wird, erfolgt eine durch Mikroprogramm gesteuerte Verzweigung zum nächsten Programmbefehl. Im anderen Falle wird der Vergleich mit einer weiteren Zeichenkette wiederholt. Die Vergleichsoperationen können durch eine Bank von EXCLUSIV-NOR-Schaltungen oder durch die arithmetische und logische Einheit des Prozessors, in dem diese Anordnung verwendet wird, ausgeführt werden. Die Anordnung ist jedoch nur zur parallelen Ausführung eines Teils der vorausgehend erläuterten Operationsphasen geeignet.

Es gehört auch zum Stand der Technik, in einem konventionellen Datenverarbeitungssystem besondere Zeichenkettenbefehle vorzusehen, die durch Mikroprogramm unter Verwendung der vorhandenen Einrichtungen des zentralen Prozessors ausgeführt werden (US-PS 4 556 951). Bei diesen Befehlen wird die Länge der zu verarbeitenden Zeichenketten durch einen in den Befehlen enthaltenen Längenkode angegeben, der die Zahl der Bytes repräsentiert, über die sich die Kette erstreckt. Die Zeichenvergleiche werden durch Operationen der arithmetischen und logischen Einheit des Prozessors ausgeführt. Hierbei werden die in einem solchen System als Teil der Ergebnisse erzeugten Bedingungskodes zur Anzeige der Übereinstimmung bzw. Nichtübereinstimmung von Zeichenketten, Teilketten oder Einzelzeichen verwendet und zur Steuerung der Verzweigungen zu nachfolgenden Programmteilen. Auch diese Anordnung erfordert einen erheblichen Zeitaufwand für die zahlreichen zur Ausführung der eingangs erläuterten Operationsphasen notwendigen Mikroprogrammschritte.

Die Erfindung liegt die Aufgabe zugrunde, einen verbesserten Prozessor für Zeichenketten anzugeben, der diese Nachteile vermeidet und der in erhöhtem Maße vom Prinzip der Parallelverarbeitung Gebrauch macht. Die Merkmale der Erfindung zur Lösung dieser Aufgabe sind im Patentanspruch 1 gekennzeichnet. Die Ansprüche 2 bis 7 geben vorteilhafte Ausgestaltungen und Weiterbildungen der Erfindung an.

Nachfolgend ist ein bevorzugtes Ausführungsbeispiel der Erfindung anhand von Zeichnungen beschrieben. Es zeigen:

Figur 1 ein Blockdiagram eines Zeichenketten- Prozessors in Übereinstimmung mit der Erfindung,

Figur 2 eine Tabelle der Übereinstimmungs- und

Nichtübereinstimmungsbedingungen bei der Verarbeitung von Zeichenketten zur Erläuterung der Arbeitsweise der Anordnung von Figur 1, Figur 3 ein Blockdiagramm der Resultat-Auswertelogik zur Verwendung in der Anordnung von Figur 1, und

Figur 4 ein Flußdiagramm eines Mikroprogramms, wie es in der Steuereinheit des Prozessors von Figur 1 Verwendung findet.

Der Prozessor von Figur 1 enthält einen lokalen Speicher 10, eine arithmetische Einheit 20 und eine Steuereinheit 40. Diese Einheiten sind in herkömmlicher Weise aufgebaut und daher hier nicht näher dargestellt. Der Speicher 10 ist ein schneller Speicher begrenzter Kapazität, der auf dem Prozessor-Chip angeordnet ist und der über einen Multiplexer 13 mit einer Speichereinheit 12 verbunden ist, die in herkömmlicher Weise aus separaten Halbleiterchips besteht. Die Speichereinheit 12 enthält eine große Anzahl von Zeichenketten, die z.B. in ihrer Gesamtheit eine Datenbank bilden. Jede dieser Zeichenketten (strings) besteht aus einer Anzahl Bytes, von denen jedes ein Zeichen (character) darstellt. Es kann aber auch eine andere Zuordnung zwischen Zeichen und Bytes gewählt werden, z.B. die Darstellung von zwei Zeichen durch ein Byte. Die Anzahl der zu einer Zeichenkette gehörenden Zeichen ist variabel und kann in weiten Grenzen frei gewählt werden. Eine Begrenzung stellt lediglich die Kapazität des Speicher dar. Die Länge einer Zeichenkette wird durch ein Kettenendzeichen bestimmt, das durch das letzte Byte der Kette dargestellt wird und während der Verarbeitung das Ende der Kette anzeigt. Die Verarbeitung erfolgt durch im jeweiligen Anwendungsprogramm enthaltene Zeichenkettenbefehle, die üblicherweise zwei miteinander in Beziehung zu setzende unterschiedlich lange Zeichenketten adressieren und deren Verarbeitung steuern. Typische Verarbeitungsformen sind die Prüfung auf Gleichheit oder Ungleichheit, die Bestimmung, welche Zeichenkette die größere oder die kleinere ist bzw. in einem vorgegebenen Ordungsschema, wie z.B. eine alphabetische Ordnung vor der anderen Zeichenketten steht. Hierbei sind die einzelnen Bytes beider Zeichenketten paarweise zu prüfen, um festzustellen, in welcher Byteposition in der Rangordnung von links nach rechts die erste Byteposition mit voneinander abweichenden Bytes ist. Die Zeichenkettenbefehle haben drei Operanden*: die Adresse einer ersten Zeichenkette A, die Adresse einer zweiten Zeichenkette B und als dritten Operanden die Adresse eines Kettenende-Bytes, nach Wahl des Anwendungsprogrammierers das in den beiden in der Regel unterschiedlich langen Zeichenketten deren Ende markiert. Ein die Zeichenkettenbefehle enthaltendes Anwendungsprogramm ist im Speicher 12 gespeichert. Das Mikroprogramm, das den Zeichenkettenbefehl ausführt, befindet sich in einem nicht dargestellten Kontrollspeicher, der Teil der Steuereinheit 40 ist. Der lokale Speicher 10 wird sukzessive mit jeweils einem Teil der Zeichenketten vom Speicher 12 geladen.

Der Ausgang des Speichers 10 ist über Sammelleitungen 14, 15 mit Operandenregistern 16, 18 verbunden, von denen jedes zur Aufnahme einer Teilkette von vier Bytes ausgebildet ist. Die Register 16, 18 werden unter der Steuerung der Steuereinheit 40 gleichzeitig in einem Maschinenzyklus geladen, beginnend jeweils mit den ersten Teilketten von zwei zu verarbeitenden Zeichenketten A und B, die durch die Operandenadressen im jeweiligen Zeichenkettenbefehl adressiert werden. In der nachfolgenden Beschreibung werden diese Teilketten ebenfalls A und B genannt, wobei die Teilkette A im Register 16 und die Teilkette B im Register 18 gespeichert wird. An die Ausgänge dieser Operandenregister 16, 18 sind über Sammelleitungen 17 und 19 die arithmetische Einheit 20, eine logische Einheit 22 und eine Vergleichseinheit 24 parallel zueinander angeschlossen. Diese Einheiten erhalten über die Sammelleitungen 17, 19 jeweils die in den Registern gespeicherten Teilketten A und B gleichzeitig zugeführt.

Die Vergleichseinheit 24 weist einen dritten Eingang auf, der mit dem Ausgang eines weiteren Registers 26 verbunden, in das in einer vorbereitenden Operation vom Speicher 10 über das Register 16 und die Sammelleitung 17 das durch den Zeichenkettenbefehl als dritten Operanden angegebene Kettenende-Kennzeichen eingespeichert wird. Dies geschieht vor der Zuführung der Operanden-Teilketten zu den Einheiten 20, 22, 24. Die Vergleichseinheit 24 führt einen parallelen Mehrfachvergleich durch. Sie vergleicht das im Register 26 befindliche Kennzeichen zugleich mit allen Bytes der Teilkette A und mit allen Bytes der Teilkette B. Diese Vergleichsoperationen erfolgen mit Hilfe von nicht dargestellten EXCLUSIV-ODER-Schaltungen. Die Vergleichseinheit 24 weist zwei Ausgänge 28, 30 mit je vier Leitungen auf. Auf den Ausgangsleitungen 28 erscheint jeweils ein Signal EA(0), EA(1), EA(2) oder EA(3), wenn eines der vier Bytes der Teilkette A mit dem Kettenende-Kennzeichen im Register 26 übereinstimmt. Jedes dieser Signale ist einer Byteposition in der Teilkette A zugeordnet und liefert eine Anzeige, daß das in dieser Position der Einheit 24 zugeführte Byte mit dem Kettenende-Kennzeichen übereinstimmt. Ebenso erscheint auf den Ausgangsleitungen 30 jeweils ein Signal EB(0), EB(1), EB(2) oder EB(3), wenn eines der vier Bytes der Teilkette B mit dem Kettenende-Kennzeichen im Register 26 übereinstimmt. Auch hier zeigt das Signal die Übereinstimmung für die zugeordnete Byteposition in der Teilkette B an.

Die logische Einheit 22 führt wahlweise unterschiedliche logische Operandenverknüpfungen wie AND, ODER, EXCLUSIV ODER durch. Hier interessiert nur die Vergleichsoperation zur Feststellung einer fehlenden Übereinstimmung der zugeführten Operandenbytes. Verglichen werden der Inhalt der vier Bytepositionen des Operanden A mit dem Inhalt der vier entsprechenden Bytepositionen des Operanden B. Auch dieser Vergleich geschieht parallel. Da Nichtübereinstimmung festgestellt werden soll, eignet sich zur Ausführung des Vergleichs die EXCLUSIV-ODER- Operation, die für jedes Operandenbitpaar ein Ausgangssignal liefert, wenn die beiden Bits ungleich sind. Bezogen auf ein Operandenbyte bedeutet dies, daß das Ausgangssignal einer Bitposition genügt, um eine Nichtübereinstimmung für das betreffende Operndenbytepaar anzuzeigen. Die logische Einheit 22 liefert auf einem Ausgang 32 vier Signale MC(0), MC(1), MC(2) und MC(3), von denen jedes einer Byteposition zugeordnet der beiden Operanden A und B zugeordnet ist. Wenn eines oder mehrere dieser Signale auftreten, wird damit angezeigt, daß die Operandenbytes der zugeordneten Position ungleich sind.

Die arithmetische Einheit 20 führt die Subtraktion B - A durch. Dies geschieht durch Addition des Zweierkomplements der Teilkette A zur Teilkette B. Hierzu wird die Teilkette A aus dem Register 16 über eine Komplementierschaltung 36 dem Operand-A-Eingang der arithmetischen Einheit 20 zugeführt. Eine mit dem Operand-B-Eingang verbundene Komplementierschal¬ tung 38 bleibt dabei unwirksam. Die arithmetische Einheit 20 weist ein Übertragsausgangsleitung 34 in der höchsten Byteposition auf. Dies ist das Ausgangssignal der Einheit 20, das im vorliegenden Zusammenhang interessiert. Ein Übertragssignal "1" auf Leitung 34 zeigt an, daß der Operand A kleiner ist als der Operand B und das Fehlen eines solchen Signals zeigt an, daß der Operand A größer ist als der Operand B. Für die Operation der arithmetischen Einheit 20 werden die Teilketten A und B als arithmetische Operanden verstanden. Die folgende Beispiele erläutern die Operation der arithmetischen Einheit 52 bei der Erzeugung dieser Signale.

Byte

Kette B 'hex' 00 AA 07 XX

Kette A 'hex' 00 AA 06 XX

Kette B 'binär' 0000 0000 1010 1010 0000 Olli xxxx xxxx Kette A 'binär' 00000000 1010 10100000 0110 xxxx xxxx

NU Byte 2

Kette B 'binär' 0000 0000 1010 1010 0000 Olli xxxx xxxx Kette A 'binär' 1111 1111 0101 0101 1111 1001 xxxx xxxx

Überträge 1 1 1 1

Ü(0) Ü in Ü in 2er

Byte(θ) Byte(θ) Kompl.

Die oberste Zeile des Beispiels gibt die Byteposition der der Zeichenketten (Teilketten) A und B des Beispiels an, die in den nächsten beiden Zeilen in hexadezimaler Darstellung und in den beiden Zeilen darunter in binärer Darstellung wiedergegeben sind. Die "x" in der Bitposition 3 bedeutet, daß die Bytes in dieser Position keinen Einfluß auf das Ergebnis haben und daher dort beliebige Zeichen stehen können. Es ist ersichtlich, daß in Byteposition 2 beider Ketten eine Nichtübereinstimmung (MC) vorliegt und daß der Wert der Kette A in dieser Position kleiner ist als der entsprechende Wert in Kette B. Die Binärdarstellung der Kette B ist in der drittletzten Zeile wiederholt, während die vorletzte Zeile die Kette A in Zweierkomplement-Darstellung wiedergeben ist, so wie sie dem Operandeneingang A der arithmetischen Einheit zur Ausführung einer Addition zugeführt wird. Die letzte Zeile zeigt die Übertrage, die während der Addition auftreten. Zunächst wird der niedrigsten Byteposition, d.h. dem Byte 3 ein Übertrag als Teil der Zweierkomplementbildung zugeführt. Dies geschieht in bekannter Weise durch ein Signal von der Steuereinheit 40 auf Leitung 48, das auch die arithmetische Einheit 20 zur Ausführung einer Subtraktion steuert. In der Byteposition 2 wird ein Übertrag erzeugt, die in die Byteposition 1 läuft und von dort auch in die Position 0, die ihrerseits einen Übertrag auf Leitung 34 erzeugt. Dieser Übertrag dient als Anzeige dafür, daß die Kette A kleiner ist als die Kette B. Zur gleichen Zeit hat die logische Einheit 22 Ketten A und B verglichen, die ihr in echter, d.h. nicht komplementierter Binärdasteilung gemäß Zeilen 4 und 5 des obigen Beispiels zugeführt worden sind. Als Ergebnis dieses Vergleichs liefert die logische Einheit 22 auf ihrer Ausgangsleitung 32 ein MC(2) Signal, das anzeigt, daß die Bytes der Position 2 ungleich sind. Diese Anzeige und der Übertrag auf Leitung 34 sind unabhängig von den in der Byteposition 3 befindlichen Bytes. Wenn diese Position im obigen Beispiel keinen Übertrag erzeugt, dann ist das Ergebnis wie dargestellt. Daran ändert sich nichts, wenn angenommen wird, daß in Position 3 ein Übertrag auftritt. In diesem Fall wird zwar das Byte der Kette B in Position 2 um eins erhöht. Dies ändert jedoch nichts daran, daß in dieser Position dennoch ein Übertrag erzeugt wird, der zu einem Übertragssignal auf Leitung 34 führt. Auch wenn die Bytes in Position 3 ungleich sind und in der logischen Einheit 22 ein Ausgangssignal MC(3) zur Folge haben, das neben dem erläuterten Signal MC(2) auftritt, hat dies keinen Einfluß, da es nur auf das Nichtübereinstimmungssignal von der Byteposition ankommt, die dem Kettenanfang am nächsten liegt. Es ist daher ersichtlich, daß die Bytes, die sich rechts von der eine Nichtübereinstimmung ergebenden Position befinden, keinen Einfluß auf das Ergebnis der Operation der Einheiten 20 und 22 haben. Es bleibt nachzutragen, daß die regulären Ergebnisse, die an den Ausgängen der Einheiten 20 und 22 auftreten, d.h. die algebraische Differenz A - B und die EXCLUSIV-ODER-Verknüpfung der Ketten A und B für die Anordnung gemäß der Erfindung nicht von Bedeutung sind. Bei den regulären Operationen der beiden Einheiten 20 und 22 werden diese Ergebnisse über einen Multiplexer 39, eine Sammelleitung 42 und den Multiplexer 13 zum lokalen Speicher übertragen und dort gespeichert.

Die Operationen der Anordnung gemäß Figur 1 werden von der Steuereinheit 40 gesteuert. Diese Einheit erzeugt Steuersignale auf Leitungen 46 bis 51, die zu den einzelnen Einheiten führen. Diese Signale werden zu vorgegebenen Taktzeiten erzeugt. Über eine Sammelleitung 46 erfolgt ein Zugriff zum Speicher 10, um die Register 16 und 18 mit je vier Bytes der Zeichenketten A und B zu laden. Ein Steuersignale auf der Leitungen 47 veranlaßt eine Übertragung dieser Bytes zu den Einheiten 20, 22 und 24 sowie ein Aktivierung der Komplementierschaltung 36. Gleichzeitig tritt auf der Leitung 48 ein Subtraktionssteuersignal SUB B-A auf sowie auf der Leitung 49 ein Steuersignal VGL(A,B), das die logische Einheit zur Ausführung einer EXCLUSIV-ODER-Operation aktiviert, sowie auf der Leitung 50 ein Steuersignal VGL EZ(A,B), das die Übertragung des Kettenende-Kennzeichens EZ vom Register 26 zur Vergleichseinheit überträgt und diese zur Ausführung des oben erläuterten Mehrfachvergleichs aktiviert. Die von den Steuersignalen auf den Leitungen 47 bis 50 ausgelösten Operationen nehmen einen Maschinenzyklus in Anspruch. Am Ende dieses Zyklus liegt das Ergebnis der Verarbeitung der Teilketten A und B in Form der Anzeigesignale EA(0..3), EB(0..3), MC(0..3) und ÜBERTR(O) auf den Leitungen 28, 30, 32 und 34 vor. Diese Signale gelangen zu einer Anzeigeschaltung 60, die anhand der Figuren 2 und 3 erläutert wird.

Im linken Teil der Tabelle von Figur 2 sind die möglichen Kombinationen der Signale MC, EA und EB schematisch dargestellt und im rechten Teil die Auswahl der wirksamen Signalkombinatio-nen. Die Anzeigelogik 60 weist eine Schaltung 62 zur Verkürzung der wirksamen Teilketten auf, die eine fehlende oder falsche Ausrichtung der Teilketten berücksichtigt, wie sie bei Überschreitung einer physikalischen Speichergrenze beim Zugriff auf die Zeichenketten im Speicher 12 auftreten kann. Die Anzeigelogik 60 weist des weiteren eine Schaltung 64 zur Prioritätsbestimmung sowie eine durch das Übertragssignal auf Leitung 34 gesteuerte Auswahlschaltung 66 auf.

Die Schaltung 62 zur Verkürzung der wirksamen Teilketten besteht aus UND-Schaltungen 72, 73, 74, die über eine Sammelleitung 70 selektiv konditioniert werden. Jede der vier Leitungen in den Sammelleitungen 28, 30, 32 vom Ausgang der Einheiten 24 und 22 sind an je eine der UND-Schaltungen 72, 73, 74 angeschlossen, die den Signalen auf diesen Leitungen entsprechende Ausgangssignale an eine Sammelleitung 76 abgeben, wenn auf der Sammelleitung 70 für alle vier in diesen Einheiten verarbeiteten Bytes ein

Konditionierungssignal erscheint. Wenn dagegen ein Speicherzugriff nur eine unvollständige Teilkette A,B in die Register 16,18 geladen hat, weil der Adressierte Speicherbereich eine Speichergrenze überschreitet, unterdrückt die Steuereinheit 40 ein

Konditionierungssignal auf den Adern der Sammelleitung, die den Bytepositionen entsprechen, in denen kein signifikantes Byte verarbeitet wurde. Dies können beispielsweise die Bytes 2 und 3 sein, denen die Adern 71 zugeordnet sind, so daß deren UND-Schaltungen 72, 73 74 kein Signal an die Sammelleitung 70 abgeben. An der Sammelleitung 70 sind die eingangsseitigen Anschlüsse mit AO bis A3, B0 bis B3 und MO bis M3 bezeichnet, wobei die Anschlüsse A0 bis A3 den Leitungen 28, die Anschlüsse B0 bis B3 den Leitungen 30 und die Anschlüsse MO bis M3 den Leitungen 32 zugeordnet sind. In der Prioritätslogik 64 wird ermittelt, in welcher Byteposition ein Kettenende-Zeichen in den Teilketten A oder B angezeigt wird und in welcher Byteposition eine Nichtübereinstimmung zwischen diesen Teilketten angezeigt wird. Dies geschieht durch UND-Schaltungen 82 bis 85, denen Inverter 78 bis 80 vorgeschaltet sind. Hierbei wurde aus Gründen der Darstellung ein Teil der UND-Schaltungen und Inverter weggelassen. Die UND- Schaltung 82 erhält von der Sammelleitung ein Eingangssignal MO, das eine Nichtübereinstimmung in Byteposition 0 anzeigt. Dieses Signal wird nur dann zu einer Sammelleitung übertragen, wenn keine Signale A0, B0 vorliegen, d.h. wenn in der gleichen Byteposition kein Kettenende-Zeichen angezeigt wird. In diesem Fall wird die UND-Schaltung 82 durch Ausgangssignale der ihr vorgeschalteten Inverter 78 konditioniert. Ebenso überträgt die UND-Schaltung 83 ein Nichtüberein¬ stimmungssignal Ml zur Sammelleitung 88, wenn weder in Byteposition 0 noch in Byteposition 1 ein Kettenende- Zeichen angezeigt wird und in Byteposition 0 keine Nichtübereinstimmung angezeigt wird. In der gleichen Weise werden die Nichtübereinstimmungssignale M2 und M3 durch nicht dargestellte UND-Schaltungen zur Sammelleitung 88 übertragen. Die Signale AO und B0 führen von der Sammelleitung 76 direkt zur Sammelleitung 88. Die UND-Schaltung 84 überträgt das Signal AI zur Sammelleitung 88, wenn für Bytepositionen 0 weder ein Kettenende-Zeichen noch eine Nichtübereinstimmung angezeigt wird. Eine entsprechende Übertragung des Signals Bl findet über die UND- Schaltung 85 statt. Ebenso werden die übrigen Kettenende-Anzeigesignale A2, A3 und B2, B3 über nichtdargestellte UND-Schaltungen zur Sammelleitung 88 übertragen, wenn jeweils keine der niedrigeren Bytepositionen ein Kettenende-Zeichen oder eine Nichtübereinstimmung anzeigt. Durch ODER-Schaltungen 89 werden jeweils die Signale AO bis A3, B0 bis B3 und MO bis M3 von der Sammelleitung 88 zu Signalen EA, EB und MC kombiniert, die über eine weitere Sammelleitung 90 der Übertrags-Auswertelogik 66 zugeführt werden, welche auch mit der Übertragsleitung 34 von der höchsten Byteposition der arithmetischen Einheit 20 verbunden ist. Die Übertrags-Auswertelogik 66 weist UND- Schaltungen 91, 93, 94 und einen Inverter 92 auf und zeigt jeweils auf Leitungen 95 und 96 an, welche der beiden Teilketten A, B die größere bzw. die kleinere ist. Hierzu Überträgt die UND-Schaltung 91 das Signal MC zur Leitung 95, wenn sie durch ein Übertragsignal auf Leitung 34 konditioniert worden ist. Das Ausgangssignal auf Leitung 95 zeigt an, daß die Teilkette A kleiner ist als die Teilkette B und dient zur Einstellung des Bedingungscodes CC=01 in einer nicht dargestellten Verriegelungsschaltung. Das Signal MC wird des weiteren über die UND-Schaltung 93 zur Leitung 96 übertragen, wenn kein Übertragssignal vorliegt und der Inverter 92 ein Konditionierungssignal an die UND-Schaltung 93 liefert. Das Ausgangssignal auf Leitung 96 zeigt an, daß die Teilkette B kleiner ist als die Teilkette A und dient zur Einstellung des Bedingungscodes CC=10. Die UND-Schaltung 94 liefert zudem ein Ausgangssignal auf Leitung 97, wenn auf der Sammelleitung 90 die Signale EA und EB gemeinsam auftreten, d.h. wenn ein Kettenende-Zeichen sowohl in der Teilkette A als auch in der Teilkette B festgestellt wurde. Das Signal auf Leitung 97 dient zur Einstellung des Bedingungscodes CC=00 zur Anzeige dafür, daß beide Teilketten gleich sind. Von der Sammelleitung 90 werden des weiteren die Signale EA und EB den Leitungen 98 und 99 zugeführt zur Einstellung der Bedingungscodes CC=01 und CC=10. Beide Signale zeigen Kettenende in der Teilkette A bzw. B an. Es ist ersichtlich, daß diese Signale zur Einstellung der gleichen Bedingungscodes wie die Signale auf den Leitungen 95 und 96 dienen, d.h. daß das Ende der Teilkette A zugleich anzeigt, daß diese kleiner ist als die Teilkette B und daß das Ende der Teilkette B zugleich anzeigt, daß diese kleiner ist als die Teilkette A. Zur gleichen Zeit wird auf einer mit der Sammelleitung 88 verbundenen Sammelleitung 100 die Byteposition angezeigt, für die während der letzten Teilketten-Verarbeitung eine Übereinstimmung festgestellt wurde. Diese Anzeige, die sich unmittelbar aus den Eingangssignalen A0 bis A3 und B0 bis B3 der Sammelleitung 88 ergibt, wird in einem nicht dargestellten Register zur Verwendung bei der Ausführung nachfolgender Programmbefehle zwischengespeichert.

Die Figur 4 zeigt in vereinfachter Darstellung die die wesentlichen Schritte der Mikroprogramm-Routine, die in der Steuerschaltung 40 wiederholt wirksam wird, wenn zwei Zeichenketten A und B zu verarbeiten sind. Diese Mikroprogramm-Routine ist als Teil des Mikroprogramms des Prozessors in einem nicht dargestellten Speicher der Steuereinheit gespeichert. Im Schritte 101 werden, beginnend mit der Startadresse, die vom jeweils auszuführenden Zeichenkettenbefehl angegeben wird, die ersten acht Bytes der Zeichenkette A aus der Speichereinheit 12 in den lokalen Datenspeicher 10 übertragen. Zugleich wird die Startadresse um acht erhöht. Im Schritt 102 erfolgt der gleiche Vorgang für die Zeichenkette B. Im Schritt 103 werden von den in der Speichereinheit 103 befindlichen Bytes der Zeichenketten A und B jeweils die ersten vier in die Register 16 und 18 übertragen. Diese Übertragung erfolgt in einem Maschinenzyklus. Daraufhin werden im Schritt 104 die in den Registern 16, 18 stehenden Teilketten von A und B in den Einheiten 20, 22 und 24 in der beschriebenen Weise parallel verarbeitet. Auch diese Verarbeitung erfolgt in nur einem Maschinenzyklus. Der Schritt 105 lädt die zweiten vier Bytes der Zeichenketten A und B aus dem Speicher 10 als neue Teilketten von A und B in die Register 16, 18. Hiernach erfolgt ein erneuter Verarbeitungsschritt 106, der dem Schritt 104 entspricht. In einem Verzweigungsschritt 107 wird abgefragt, ob in den Schritten 104 oder 106 ein Ausgangssignal EA, EB oder MC festgestellt worden ist.

Dies geschieht durch Abtastung des Signalzustandes der Leitungen 97, 98 und 99 (Fig. 3). Liegt kein Ausgangssignal EA, EB oder MC vor, verzweigt das Mikroprogramm zurück zum Schritt 101, mit dem auf die nächsten acht Bytes in der Speichereinheit 12 zugegriffen wird. Wenn dagegen ein solches Ausgangssignal festgestellt wurde, bedeutet dies, daß die Verarbeitung der Zeichenketten A und B beendet ist. Üblicherweise wird dies nicht bereits nach dem ersten Durchlauf der Mikroprogramm-Routine gemäß Figur 4 der Fall sein, sondern er werden mehrere solche Durchläufe notwendig sein, um längere Zeichenketten zu verarbeiten. Unabhängig davon, wieviele Durchläufe notwendig sind, wird durch ein JA-Ergebnis im Schritt 107 zum Schritt 108 verzweigt, der die Bedingungscodes CC entsprechend dem Signalzustand der Leitungen 95 bis 99 einstellt. Der folgende Schritt 109 beendet das Mikroprogramm und zugleich die Ausführung des Zeichenkettenbefehls. Der nächste Befehl des jeweiligen Anwendungsbefehls kann ein Verzweigungsbefehl sein, der die zuvor eingestellten Bedingungscodes CC benutzt, um eine Programmverzweigung zu einem Programmabschnitt durchzuführen, in dem das Verarbeitungsergebnis des ausgeführten Zeichenkettenverarbeitungsbefehls einschließlich der auf der Ausgangssammelleitung 100 angezeigten Adresse der eine Übereinstimmung anzeigenden Byteposition weiterverwendet wird.

Claims

18

P a t e n t a n s p r ü c h e

Prozessor für Zeichenketten variabler Länge mit einem System von Speichereinheiten zur Speicherung von Zeichenketten, die durch Programmbefehle paarweise adressierbar sind und aus denen der Datenflußbreite entsprechende Teilketten in zwei Operandenregister übertragen werden, mit einer Arithmetik/Logik-Einheit zur Ausführung von Verarbeitungsoperationen, mit einer Bedingungscode-Schaltung, die aus den Verarbeitungs-ergebnissen abgeleitete Signale speichert, die zur Steuerung von Programmverzweigungen dienen, und mit einer Steuereinheit, die nacheinander die Teilketten der Zeichenkettenpaare in der Speichereinheit adressiert und in aufeinanderfolgenden Maschinenzyklen die Operation der Einheiten sowie Übertragungen zwischen den Einheiten steuert, dadurch gekennzeichnet, daß die Operandenregister (16, 18) mit einer arithmetischen Einheit (20), mit einer logischen Einheit (22) und mit einer Vergleichseinheit (24) parallel verbunden sind, daß ein mit einem Kettenende-Kennzeichen (E) ladbares Kennzeichenregister (26) mit einem weiteren Eingang der Vergleichseinheit (24) verbunden ist, daß die in den Operandenregistern (16, 18) gespeicherten Teilketten gleichzeitig der arithmetischen Einheit (20) zur Subtraktion der einen Teilkette von der anderen Teilkette, der logischen Einheit (22) zum Vergleich der beiden Teilketten und der Vergleichseinheit (24) zum Vergleich der Zeichen beider Teilketten mit dem Inhalt des Kennzeichenregisters (26) zugeführt werden und daß Ausgangssignale dieser Einheiten innerhalb des gleichen Maschinenzyklus verfügbar sind und Ausgangssignale der Vergleichseinheit als Anzeige für die Gleichheit beider Zeichenketten oder Teilketten dienen, Ausgangssignale der logischen Einheit als Anzeige für die Ungleichheit beider Zeichenketten oder Teilketten dienen, und ein Übertragssignal aus der arithmetischen Einheit als Anzeige dafür dient, welche der beiden Zeichenketten oder Teilketten die Größere oder die Kleinere ist.

2. Prozessor nach Anspruch 1, worin die Zeichen durch Bytes dargestellt werden, dadurch gekennzeichnet, daß die Vergleichseinheit (24) zur parallelen Ausführung eines Mehrfachvergleichs des Inhalts des Kennzeichenregister (26) mit allen Bytes beider Teilketten ausgebildet ist und für jede Teilkette (A, B) eine Ausgangsleitung (28, 30) aufweist, auf der ein Kettenende-Signal (EA, EB) erzeugt wird, wenn der Inhalt des Kennzeichenregisters mit einem Byte der Teilketten übereinstimmt.

3. Prozessor nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die logische Einheit (22) für einen parallelen Vergleich der Bytes gleicher Position in den beiden Teilketten (A, B) ausgebildet ist und für jedes Bytepaar eine Ausgangsleitung (32) aufweist, auf der ein Nichtübereinstimmungssignal (MC) erzeugt wird, wenn die Bytes voneinander abweichen.

4. Prozessor nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die arithmetische Einheit (20) für eine parallele Addition der Bytes gleicher Position in den beiden Teilketten (A, B) ausgebildet ist und an einem ihrer Eingänge eine Komplementierschaltung (16) sowie in ihrer höchsten Byteposition eine Übertragsausgangsleitung (34) aufweist, auf der ein Übertragssignal erscheint, wenn die über die aktivierte Komplementierschaltung (16) zugeführte Teilkette (A) in den Binärwerten ihrer Bytes größer ist als die andere Teilkette (B) und die im anderen Falle durch Fehlen eines solchen Übertragssignals anzeigt, daß die andere Teilkette größer ist.

5. Prozessor nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß eine Resultat- Auswertelogik (60) eine Schaltung (64) zur Bestimmung der Priorität unter den Ausgangssignalen (EA, EB, MC) von der Vergleichseinheit (24) und der logischen Einheit (22) aufweist, die jeweils die niedrigste Byteposition anzeigt, in der für die eine oder die andere Teilkette (A oder B) oder für beide Teilketten eine Übereinstimmung mit dem Kettenende-Zeichen (E) festgestellt wird, und die auf einer Ausgangssammelleitung (100) jeweils die niedrigste Byteposition anzeigt, in der eine Nichtübereinstimmung festgestellt wurde.

6. Prozessor nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß eine Ubertragsauswertelogik (66) vorgesehen ist, die durch Übertragssignale von der arithmetischen Einheit gesteuerte Auswahlschaltungen (91, 92, 93) enthält zu Erzeugung von Signalen A KLEINER B und B KLEINER A auf Ausgangsleitungen (95, 96) .

Prozessor nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß die Ausgangssignale EA, EB, EAB, A KLEINER B und B KLEINER A auf Ausgangsleitungen (98, 99, 97, 95, 96) zur Einstellung von Bedingungscodes (CC) dienen, die zusammen mit der auf der AusgangsSammel¬ leitung (100) angezeigten Byteposition zur Weiterverwendung durch dem ausgeführten Zeichenkettenbefehl nachfolgende Programmbefehle gespeichert werden.