DE2630304A1

DE2630304A1 - Einrichtung zur ueberpruefung der gueltigkeit von alphabetischen eingangszeichen

Info

Publication number: DE2630304A1
Application number: DE19762630304
Authority: DE
Inventors: Walter Steven Rosenbaum
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1975-07-16
Filing date: 1976-07-06
Publication date: 1977-01-20
Also published as: JPS5214331A; FR2318462A1; GB1508735A; BE842971A; JPS5711065B2; SE7608132L; US3995254A; IT1063722B; FR2318462B1; SE418021B; CA1066422A

Description

Einrichtung zur überprüfung der Gültigkeit von alphabetischen !Eingangs zeichen

Die Erfindung betrifft eine Einrichtung mit einer digitalen Referenzmatrix zur überprüfung der Gültigkeit von alphabetischen Eingangszeichen als gültige linguistische Ausdrücke.

Sie ist anwendbar auf dem Gebiet der Datenverarbeitung zur Machverarbeitung der Ausgangsdatenströme von Eingabetastaturen, Zeichenerkennungsrnaschinen und Sprachanalysatoren. Ein wichtiges Problem bei dieser Nachverarbeitung ist darin zu sehen,- daß ain ,Ausgabewort auf sehr schnelle Weise mit einem Verzeichnis (Wörterbuch) zu vergleichen ist und dabei ein Anzeigesignal !gewonnen werden muß, welches das Vorliegen oder Nichtvorliegen 'eines annähmefähigen Wortes angibt.

So wurden bereits Anstrengungen gemacht, die durch ein alpha-Ibetisches Wort gegebene Information in eine signifikante Speicher-! .adresse umzuwandeln, um mit dieser Adresse aus dem Speicher j !information abzurufen, die Auskunft darüber gibt, ob das Ausgabewort tatsächlich ein korrektes Wort ist. So ist beispielsweise Iin den "IEEE Transactions on Engineering Writing and Speech, Vol. EWS-12, Nr. 2, Dezember 1967, Seite 67" ein Artikel "Spelling, Correction by Vector Representation Using a Digital Computer" von ' J.J. Giangardello erschienen, in dem ein Verfahren beschrieben wor-f den ist, das eine Vektordarstellung für alphabetische Wörter be-

609883/0932

nutzt, indem den Buchstaben "A" bis "Z" die Zahlen 1 bis 26 zugeordnet werden, woraus ein Vektorbetrag und ein Winkel für den Zugriff eines Wortes aus einem Speicher in einem Allzweckrechner errechnet werden.

Von Nachteil hierbei ist eine für fast alle bekannten Lösungen typische Unsicherheit, die sich daraus ergibt, daß die Umwandlung eines zu überprüfenden verstümmelten Wortes in eine Schlüsseladresse zu einem nicht eindeutigen Speicherzugriff führt. Die erzeugte Vektoradresse kann v/ahlfrei eine besetzte oder gültige Adresse eines oder mehrerer Wörterbuchwörter ansteuern, ohne daß das Wörterbuchwort mit dem gewünschten Wort übereinstiiumt, da das gewünschte Wort in seiner verstümmelten Form untersucht wird. Die Darstellungen, die für gültige Wörter hier gewonnen werden, sind also nicht eindeutig für jedes gültige Viörterbuchwort. Es ist daher notwendig, eine Einrichtung zu schaffen, die für die zu prüfenden Worte Vektoradressen erzeugt, die eindeutig sind, wobei aber gleichzeitig die Größe des Referenzmatrixspeichers in vernünftigen Grenzen gehalten werden soll.

Es ist daher die Aufgabe der vorliegenden Erfindung, für die Überprüfung von Ausgabewörtern aus datenverarbeitenden Einrichtungen auf gültige linguistische Ausdrücke, eine Lösung anzugeben, bei der durch eindeutige Zuordnung der zu überprüfenden Ausgabewörter zu den in einer Speichermatrix gespeicherten Liste gültiger Wörter, eine eindeutige Überprüfung möglich ist, wobei die Belegung des Speichers in einer besonders ökonomischen Weise erfolgen soll.

Gelöst v/ird diese Aufgabe der Erfindung durch die im Hauptanspruch angegebenen Merkmale. Weitere Merkmale, vorteilhafte Ausgestaltungen und Weiterbildungen des Gegenstandes der Erfindung sind den Unteransprüchen zu entnehmen.

WA 975 003

809883/0931

Durch konsequente Anwendung der Lehre der Erfindung ergibt sich für die Nachverarbeitung von Ausgabedatenströmen aus Tastaturen, Zeichenlesern und Sprachanalysatoren der Vorteil einer äußerst zuverlässigen und wirtschaftlichen überprüfung alphabetischer Wörter auf gültige linguistische Ausdrücke.

Im folgenden wird ein Ausführungsbeispiel der Erfindung anhand der Figuren erläutert.

Es zeigen:

Fig. 1 das Blockschaltbild einer Einrichtung mit einer

binären Referenzmatrix zur überprüfung von alphabetischen Eingangszeichen auf gültige linguistische Ausdrücke und

Fig. 2 eine Darstellung der internen Organisation der

digitalen Referenzmatrix.

Die digitale Referenzmatrix (DRM) ist eine sehr wirksame Einrichtung, dl« wenig Speicherraum benötigt, um festzustellen, ob ein Wort richtig geschrieben, getippt, gesprochen oder gelesen wurde. In logischer Hinsicht muß die DRM in irgendeiner Form eine Darstellung aller Wörter enthalten, die auf Dokumente mit Hilfe •iner Tastatur aufgebracht, von einem optischen Zeichenleser abge tastet oder von einer Sprachverarbeitungseinrichtung gesprochen wurden· Die Liste gültiger linguistischer Ausdrücke kann zuweilen sogar umfangreicher sein, als der bekannte "Webster Dictionary¹¹ für die englische Sprache. Daher sind konventionelle ßpeicherzugriffs- und -euchtechniken hinsichtlich eines solchen Wörterbuches nicht mehr brauchbar, was insbesondere für Echt sei ^anwendungen gilt. Das Ziel von Verifizierungstechniken be steht darin, die Speicher- und Suchzeiten für große Wörterbücher, dl· für bestimmte Anwendungen erforderlich sind, möglichst klein zu halten.

WA 975 003

109883/0932

,Die DRM ist eine spezialisierte Anwendung der Alpha-Wort-Daristellungstechnik (AWVR). Die Mechanik dieser Technik ist in

•Tabelle 1 dargestellt.

Tabelle 1 Numerische Extraktion des Alpha-Feldes

A = 1, B = 2, C = 3, D = 4, E = 5, F = 6, ' G = 7, H = 8, I = 9, J = 10, ..., Z = 26

Schritt 1

j Vektor Abbildung CORNWALL + (3, 15, 18, 14, ! 23, 1, 12, 12)

Schritt 2

Vektor Attribute (3, 15, 18, 14, 23, 1,

12, 12) ·* Betrag, Winkel

Betrag = Funktion des Zeichens im Wort

Σ L² = (3)₂ ² + (15)₂ ² + (18)₂ ² + (14)² + (23)²

W=I

+ (1) + (12) + (12) = 1572 = Y² Winkel = Funktion der Zeichenposition

= see"¹ = 83,7392 Grad

Hierin bedeuten R der Referenzvektor für jede Wortlänge (N), !bestehend aus einem "N"-fachen von linear unabhängigen Ausdrücken, die der Position jedes Buchstabens in dem Wort entsprechen, z. B. V2, VJ, Vif, V?", ...,Vj oder log 3, log 5, log 7, log 10, ..., log K, wobei J irrational und K eine

Primärzahl ist und wobei

|r| = V(V2)² + (73)² + (Y5)² + ... (Vj)², usw. ist.

WA 975 OO3

109883/0932

i - 5 -

Prinzipiell besteht die zugrunde liegende Rationalzahl des Ai¹JVR !darin, daß jedes Wort oder jeder Zeichenstrang mittels einer Vektordarstellung angegeben werden kann, indem jedem Buchstaben des Alphabets ein eindeutiger numerischer Wert zugeordnet wird. Eins der direktesten und intuitivsten Zuteilungsschemen ist folgendes: A=I, B = 2, C = 3, ..., Z = 26. Jede Vektordarstellung eines auf diese Weise erzeugten Wortes würde ihrerseits eindeutig in Termen der linearen algebraischen Vektorzuteilungen von Betrag und Winkel rekonstuierbar sein. Hierin reflektiert der Betrag den Zeicheninhalt und der Winkel die relative Lage des Zeichens innerhalb eines Wortes.

Es sei an dieser Stelle erwähnt, das gerade durch die Verwendung einer Betrag/Winkel-Darstellung ein alphabetisches Wort belieger Länge eindeutig mit nur vier Speicherbytes dargestellt werden kann.

Eine beträchtliche Verdichtung wurde hier auch schon bei Alpha-Wörtern beliebiger Länge eindeutig durch die Verwendung eines Zahlenpaars möglich gemacht. Die endgültige Form der Verifizierung bringt jedoch diese Verdichtung um einen Schritt weiter, indem die Betrag-/Winkelpaare unter Verwendung der digitalen Referenziuatrix (DRM) gespeichert werden.

Fig. 2 zeigt die interne Organisation der DRM. In einer DRM ist ,

i .der Satz gültiger Betrag-/Winkelpaare in Run-Längencodierung

!gespeichert· Dieses Vorgehen bringt den Vorteil der Bündelung !

' I

!über bestimmte Betragsbereiche mit sich, über den man verfügen kann, wenn eine große Wortliste in einer Betrag/Winkel-Darstel- ; lung unter Zuhilfenahme der AWVR abgebildet werden soll. Wenn daher mehrere Verifizierungs-Wörterbucheintragungen den gleichen Betrag erzeugt haben, und sie sich nur hinsichtlich ihrer je- ι v/eiligen Winkelzuteilungen unterscheiden, dann wird ihr Be- | tragszeiger nur einmal gespeichert und aufeinander folgende

legale Winkelwerte zu Ketten zusammengefaßt, indem ihr hoch- !

WA 975 OO3

609883/0932

stelliges iJit eingeschaltet und die Kette legaler Winkel (logisch) rechtsbündig neben dem Betragszeiger gespeichert wird.

Der Speicherplatzbedarf, der für die DRM-Betragszeiger benötigt wird, kann sogar selbst verringert werden, indem eine Modulo 256 Vereinbarung und eine Indextabelle verwendet wird, um die Betragsachse der Matrix zu beschreiben. Die Indextabelle liefert absolute Abweichungen für jeden Betrags-Run von 256 Einheiten. Auf diese Weise benötigt man zur Speicherung jedes Amplitudenzeigers noiitinell gerade 1 Byte (vgl. unteren Teil von Fig. 2).

Die Wirksamkeit der Komprimierung der digitalen Referenzmatrix ist von dem Grad der Bündelbildung abhängig, die in der Verteilung legaler Beträge vorliegt. Das alphanumerische äquivallenzschema (vgl. Fig. 2 oben) kann manipuliert werden, um Betragsdichtecharakteristiken in die AWVR-Abbildung des Verifizierungswörterbuches in die Vektordarstellung einzuführen. Bei der Anwendung stellt die digitale Referenzmatrix jeden Eintrag in der Verifizierungswortliste dar, indem sie im Mittel 1,16 bis 1,25 Bytes je Eintragung benutzt, wobei dieser Wert unabhängig von der Zahl der Buchstaben ist, die sich im Originalwort befinden. So könnte beispielsweise ein Verifizierungsvokabular von 10 OOO Wörtern in einem 11,6 k bis 12,5 k Bytes großen Speicher gespeichert werden. Bekannte alphabetische, d. h. Buches tabenspeichertechniken, erfordern für den gleichen Zweck einen Speicher mit der Kapazität von 80 k Bytes. Darüberhinaus sind die DRM-Maschinenoperationen, die sich auf die Verifizierung beziehen, etwa eine Größenordnung schneller als Tabellensuchioperationen nach Buchstabenketten in einer nichtverdichteten Wortliste.

Eine zweite DRM-Verdichtungsmethode, die duale Runlängencodierung für den Vektorbetrag und seinen Winkel verwendet, ist in Tabelle 2 dargestellt.

WA 975 003

609883/0931

Vektorwortliste Betrag Winkel

123	.16.72°	Segment
123	30.10°
123	42.36°
123	82.60°
123	88.83°
125	12.31°
125	60.20°
126	7.72°
126	12.23°
126	19.12°
126	33.31°
126	40.05°
126	49.91°
126	70.79°
126	75.23°
126	82.96°
127 M B m	27.28° • • •
DRM

1 1	0 1	16.72"	30.10°	42	.36°	82.60°	88.83"	i	33.31°	40.05° 49.91°	70.79° 75.23°i I
125		0 0 10	12.31°	60	.20°
1 1	1 1	7.72°	12.23	19	.12	mit dualer Run-Längencodierung
126		0 0 0 1	82.96°
	DRM Organisation und Winkel



Tabelle 2 von Betrag

WA 975 003

609883/0932

Ein volles Byte (3 Bits) dient der Speicherung des Winkels, wodurch sich eine Auflösung von 256 Einheiten ergibt. Alle Winkel, die den gleichen Betrag haben,· werden linksbündig kontinuierlich nebeneinander gespeichert, wobei dem am weitesten links stehenden Winkelbyte ein vier Bit breites Kopffeld voran steht. Die drei niedrigstelligen Bits des Kopffeldes geben an, wieviele Winkelwerte unter diesem Betrag zu einer Kette zusammengefaßt sind. Das hochstellige Bit des vier Bit breiten Kopffeldes gibt an, ob der nächste Betragswert um eine Einheit von dem betrachteten Betragswert entfernt liegt. So ist beispielsweise das hochtstelligste Bit des vier Bit breiten Kopffeldes ausgeschaltet, d. h. auf Null gesetzt, wenn der gerade betrachtete Betragswert 98 und der nächste Betragswert 99 ist. Der nächste Betragswert ist in diesem Schema inplizit enthalten und erfordert keine diskrete Darstellung.

Das höchststellige Bit des Vierbit-Kopffeldes wird eingeschaltet, ,d. h. auf Eins gesetzt, wenn der nächste Betragswert außerhalb einer Folge liegt, wenn beispielsweise dem betrachteten Betrag 103 der Betrag 105 folgt. Das höchststellige Bit des Kopffeldes jwird daher auf Eins gesetzt, wenn ein Betrag über mehr als acht zugeordnete Winkelwerte verfügt. Nachdem der erste Run von acht Winkelwerten gespeichert wurde, erfordern die zusätzlichen Winkel (überlauf), daß der Originalbetragswert wieder aufgelistet wird. Auf diese Weise wird der Zuwachs des Betrags urn eine Einheit unterbrochen.

Wenn das höchststellige Bit des Kopffeldes eingeschaltet ist, ,ist das Byte, das seinem angehängten Winkel folgt, betragsbezogen zu dem nächsten Run von Winkelbytes. Die Werte dieses [Bytes, addiert zu der Abweichung (Verschiebung) dieses Abschnitts der digitalen Referenzmatrix bezüglich ihres Eintragungspunktes in die Indextabelle, ergibt in absoluten Termen iden Betragswert für den nächsten Run von Winkelbytes. Dieses (Byte wird als Betragsindex-Eichbyte (MICB) bezeichnet. Die Ver-

WA 975 003

609883/0932

Wendung der Indextabelle zur Bestimmung absoluter Betragswerte wurde oben erläutert.

Ein fakultativer Aspekt der DRM-Organisation besteht darin, in die DRIl alle 50 oder 100 Bytes ein MICB einzufügen. Dieses gestattet der DRM-Betragsachse, daß sie binär abgesucht werden kann, uia so dicht wie möglich an die gewünschte Stelle gesteuert zu werden, bevor die Betragssuche. Betrag um Betrag, beginnt. Dieses Vorgehen im Zusammenhang mit der digitalen Differenzmatrix veriaeidet die sonst notwendige Forderung, daß jedes höchtstellige Bit eines Winkels nach einem Kettungskennzeichen untersucht werden muß. Somit ist es nur noch erforderlich, daß ein Betragswert diskret gespeichert v/erden rauß, der außerhalb der Reihenfolge liegt. Die mittlere Speicherung je Wörterbucheintrag ist bei diesem Format etwa 9 Bits.

"wenn eine digitale Referenzmatrix einmal aufgebaut ist, dann erfolgt die Verifizierung (überprüfung) eines Eingangswortes dadurch, daß die Betrags- und Winkelzuteilungen für das Wort errechnet und die digitale Referenzmatrix bei dem Betrag des Eingangswortes angesteuert und dann nur noch nach dem passenden Winkel gesucht wird.

Fig. 1 zeigt also, wie bereits gesagt, eine überprüfungseinrichtung unter Verwendung einer digitalen Referenzroatrix. Ein kombinierter Strom alphanumerischer Zeichen, der als Ausgang einer Tastatur, eines Zeichenlesers oder eines Sprachanalysators betrachtet werden kann, wird über die Leitung 2 der Einrichtung in Fig. 1 eingegeben. Ein Worttrennungsdetektor 4 ist mit der Eingangsleitung 2 verbunden und stellt das Auftreten eines Worttrennungssymbols fest, das den Anfang eines neuen viortes angibt. Da sowohl alphabetiscne als auch numerische Seichen in dem Zeicheneingangsstrom vorhanden sein können, ist ein Sahlendetektor 6 vorgesehen, der ebenfalls an die Eingangsleitung 2 angeschlossen ist, und feststellt, ob ein Eingangszeichen ein alphabetisches .

WA 975 003

609883/0932

oder ein numerisches Zeichen (ein Buchstabe oder eine Zahl) ist. Der Zahlendetektor 6 aktiviert ein Tor 8, das nur den Buchstaben den Durchtritt zu dem Umwandlungsspeicher 10 ermöglicht. Der üiiiwandlungsspeicher 10 enthält das alphanumerische ilquivalenzscheraa, das sich auf alphabetische Zeichen mit gewichteten numerischen Werten bezieht. Der numerische Wichtungswert für ein Zeichen ⁿd" wird mit L bezeichnet. Der umwandlungsspeicher 10 gibt diesen Wichtungswert L über die Datensamrcielleitung aus.

Der Zugriff siiifechanismus für die Adressierung der Betrags liste in deid Speicher 33 besteht aus einem Multiplizierer 12, einem Addierer 14, einem Register 16 sowie einem Betragsregister Der Viert L.. auf der Datensairanelleitung 11 wird in dem Multiplizierer 12 quadriert und zu der Summe des zuvor quadrierten Wertes von L, des alphabetischen Wortes unter Mitwirkung des Addierers 14 und dt-s Registers 16 addiert. Das Verfahren zur

2 Errechnung des Viertes der Summe von L wird solange vorgeführt, bis der Worttrennungsdetektor 4 das Worttrennungssymbol auf der Hingangsleitung 2 feststellt. Wenn dieser Zeitpunkt gekommen

ist, wird der endgültige Wert der Summe von L„ in einen Betragsregister 17 als Adresse des Betrags eines Wortes im Speicher 38 eingegeben, wobei dieses Wort auf den Werten von I^ basiert, die den Zeichen zugeordnet sind, aus denen das eingegebene alphabetische Wort zusammengesetzt ist.

Die Einrichtung zur Berechnung des Winkels für das Eingabewort besteht aus einem Zähler 18, einem Zeichenpositionsdecodxerer 19, einem Multiplizierer 20, einem Addierer 22, einem Register 24, einem weiteren Multiplizierer 26, einem Teiler 28, einem Rechner 29 zur Berechnung des Arcus Sekans, einem Multiplizierer 30, einem Addierer 32, einem Register 34, einem Quadratwurzelrechner 27 und einem weiteren Quadratwurzelrechner 36» Der Zähler 18 zählt die Position der Zeichen in jedem alphabetischen Wort, das von der Einrichtung verarbeitet wird. Das Ausgangs-

WA 975 003

609883/0932

signal des Zählers 18 wird von dem Zeichenpositionsdecodierer 19 decodiert, um einen Voreinsteilungswert von R^ an den Multiplizierer 20 abzugeben. Wie im vorstellenden theoretischen Teil des Betriebsablaufes der Einrichtung bereits erwähnt wurde, ist der Wert von R. für jede Buchstabenpostion in einem Wort eine linear unabhängige Zahl. Der Wert L auf der Datensammelleitung 11 wird zu dem Multiplizierer 20 übertragen und mit dem gegenwärtigen Wert Rj. multipliziert, und anschießend das Produkt zu dem Addierer 22 übertragen. Der Addierer 22 und das Register 24 erstellen die laufende Summe des Produktes L^ mal IL, für das gerade analysierte Alphawort. Wenn der Worttrennungsdetektor 4 das nächste Worttrennungssymbol auf der Eingangsleitung 2 feststellt, dann gibt das Register 24 die endgültige Summe von L„ mal R^ an den Teiler 28 weiter. Der gegenwärtige Zeichenpositionswert R_n wird vom Zeichenpositionsdecodierer 19 zu dem Multiplizierer 30 übertragen, der den Wert R,^^ erzeugt, der dann an den Addierer 32 weitergegeben wird. Der Addierer 32 und das Register 34 enthalten die laufende Summe der Quadrate von R_n, und wenn der Worttrennungsdetektor 4 das nächste Worttrennungssymbol im Eingangsdatenstrom 2 feststellt,

2
dann wird die endgültige Summe von R_n an den Quadratwurzelrechner 36 ausgegeben. Der Quadratwurzelrechner 36 berechnet die Quadratwurzel der Summe der R-v-Quadrate, so daß sich ein Wert |R| ergibt, der an den Multiplizierer 26 weitergegeben wird. Der Quadratwurzelrechner 27 berechnet die Quadratwurzel der Summe der L-j-Quadrate, die mit I Y| bezeichnet ist. Der Multiplizierer 26 multipliziert den Wert des Betrages Y mit dem Betrag R des Quadratwurzelrechners 36 und gibt das Produkt als den Zähler des Bruches zu dem Teiler 28. Der Wert der Summe von L_n mal R_n, der vom Register 24 zu dem Teiler 28 übertragen wird, dient als Zähler des Bruches. Der Quotient wird dann von dem Arcus Sekans-Rechner 29 weiter verarbeitet. Der Winkelwert, der von dem Arcus Sekans-Rechner 29 ausgegeben wird, wird in das Winkelvergleichsregister 41 geladen.

WA 975 003

609883/0932

Die Organisation des Speichers 38 basiert auf der Zeichenübertragungsfunktion der Maschine, deren Ausgangszeichenstrom zu analysieren ist. Diese Organisation basiert weiter auf der Alphawort-Vektordarstellung (AWVR-Technik), die ebenfalls zuvor erläutert wurde. Alle gültigen Beträge, denen für jedes gültige Wörterbuchwort eindeutige Winkelwerte zugeordnet sind, sind in dem Speicher 38 gespeichert, wie es Fig. 2 zeigt. Die äußerst rechte Position jedes Winkelbytes ist als Indikator reserviert, der angibt, ob zusätzliche Winkel für den betrachteten Betrag nachfolgen. Der errechnete Betrag für das in dem Betragsregister 17 gespeicherte Eingangswort dient als Zugriffsadresse für den Speicher 38, also als Adresse für das Auslesen eines darin gespeicherten zugeordneten Betrags. Wenn keine Übereinstimmung festgestellt wird, dann überträgt das Tor 39 diesen errechneten Betrag in das Null-Betragsregister 40, das den Flip-Flop 42 auf "Null" setzt, wodurch angegeben wird, daß das Eingangswort ungültig ist.

Wenn der errechnete Wert des Betrages eines Eingangswortes mit einem Betrag im Speicher 38 übereinstimmt, dann überträgt das Tor 39 alle Winkelwerte, die zu dieser Speicheradresse gehören, ;in den Winkelspeicherpuffer 45. Die Winkel in diesem Winkel-Ispeicherpuffer 45 werden dann mit Hilfe des Winkelvergleichs- ;registers 41 mit dem Winkel für das Eingangswort verglichen, ■der von dem Arcus Sekans-Rechner 29 errechnet wurde. Wenn eine 'Übereinstimmung festgestellt wird, dann setzt das Ausgangs- !signal des Tores 43 den Flip-Flop 42 auf "Eins", die auf der Leitung 44 dann feststellbar ist, wodurch angezeigt wird, daß das Eingangswort ein gültiges Wort ist. Eine "Null", die auf j der Leitung 44 festgestellt wird, gibt hingegen an, daß das !Eingangswort ein ungültiges Wort ist. Die Ausgangssignale der digitalen Referenzmatrix können auch dazu dienen, der Bedienungsperson an einer Tastatur mitzuteilen, daß ein Tippfehler !vorgekommen ist oder, wenn es sich um eine vorgeschaltete automatische Einrichtung handelt, dieser vorgeschalteten Einrichtung

WA 975 003

609883/0932

- 13 mitzuteilen, daß sie in den Wiederholungsbetrieb übergehen soll.

Die Operation der Wortgültigkeitsprüfeinrichtung sei im folgenden anhand disr Fig. 1 näher erläutert. Wann immer ein alphabetisches Wort im Eingangsdatenstrom auf dor Leitung 2 zu der digitalen Referenzmatrixsinrichtung festgestellt wird, dann aktiviert der Zahlendetektor 6 das Tor 8 damit dieses die Buchstaben des Wortes in den Umwandlungsspeicher 10 überträgt. Der Umwandlungsspeieher 10 wandelt sequentiel jeden einzelnen Buchstaben des alphabetischen Wortes in einen vorgegebenen numerischen viert L,. Die numerischen Darstellungen L... für die Buchstaben des Eingangswortes werden von dem Uiawandlungsspeicher seriell auf die Datensammelleitung 11 ausgegeben. Jede numerische-. Darstellung L_1x wird von dem Kultiplizierer 12 empfangen, der diesen Ivert mit sich selbst multipliziert, um das Quadrat von L zu bilden. Das Ausgangssignal des Multi-

2
plizierers, L , wird mit Hilfe des Addierers 14 zu dem Inhalt des Registers 16 addiert, um die laufende Summe des Quadrats der numerischen Darstellungen für die Buchstaben des Eingangswortes zu bilden. Die endgültige Summe der numerischen Darstellungen für die Buchstaben in dem VJort wird im Betragsregister 17 gespeichert und sie definiert eine Adresse im Speicher 38. Mit dem Inhalt des Betragsregisters 17 wird der Speicher 38 mit Hilfe einer Adresse angesteuert, die dem errechneten Betrags-

vektor, ZL-, , des Eingangswortes entspricht. Wenn keine entsprechende Adresse im Speicher 38 aufgefunden wird, dann wird über das Tor 39 das Wullbetragsregister 40 angesteuert, das den Flip-Flop 42 auf "Null" setzt, so daß dieses Signal auf der Leitung 44 angibt, daß es sich bei dem Eingabewort um ein nicht gültiges Wörterbuchwort handelt.

Gleichzeitig mit der Erzeugung des Betragsvektors für das Eingangsalphawort wird ein korrespondierender Vektorwinkel erzeugt. Der Zähler 18 zählt die Position des Buchstabens im Eingangswort und aktiviert den Seichenpositiondecodierer 19, um einen

WA 975 003

609883/0932

eindeutigen Buchstabenpositionswert IL für jede Buchstabenposition iia Wort zu erzeugen. Das Aus gangs signal R,, des Zeichenpositionsdecodierers IS für jeden Buchstaben in dem Eingangsalphawort wird von dem Multiplizierer 22 empfangen und mit der numerischen Darstellung für den entsprechenden Buchstaben L·, von dem Umwandlungsspeicher 10 multipliziert und im Addierer 22 zu dem Inhalt des Registers 24 addiert, um die laufende Summe der numerischen Darstellung der Buchstaben mal der Position des Zeichens in dem Wort zu liefern. Die Buchstabenpositionsnummer R^ wird zu dem Multiplizierer 30 übertragen, wo sie mit sich selbst multipliziert und vom Addierer 32 zu dem Inhalt des Registers 34 addiert wird, um eine laufende Summe der Quadrate von R. zu bilden. Wenn der Worttrennungsdetektor 4 das nächste Trennungssymbol in dem Eingangsdatenstrom 2 erkennt, wird die endgültige Summe der Quadrate von R., zu dem Quadratwurzelrechner 36 übertragen, ferner wird der Inhalt des Betragsregisters 17 zu dem Quadratwurzelrechner 27 und der Inhalt des Registers 24 zu dem Teiler 28 übertragen. Der Quadratwurzelrechner 36 erzeugt die Quadratwurzel der Summe der R^-Quadrate, die den Vektorbetrag R bildet, wo hingegen der Quadratwurzelrechner 27 die Quadratwurzel des Betrags bestimrat, der sich als Summe der L^-Quadrate ergibt und den Vektorbetrag Y darstellt. Der Multiplizierer 26 multipliziert den Betragsvektor R mit dem Betragsvektor Y und gibt das Produkt als Zähler an den Teiler 28 weiter. Der Wert der Summe von L_ mal R^, wird von dem Register 24 als Nenner zu deiji Teiler 23 übertragen wird, der den Quotienten bildet. Der sich ergebende Quotient wird anschließend zu dem Arcus Sekans-Rechner 29 übertragen. Der Arcus Sekans-Rechner 29 errechnet den Winkelwert für diesen Quotienten und gibt den Winkelwert zu dem Winkelvergleichsregister 41.

Wenn während des Zugriffs zu dem Speicher 38 mit Hilfe des im Betragsregister 17 gespeicherten Wertes eine entsprechende Adresse gefunden wird, dann wird der unter dieser Adresse im Speicher 38 gespeicherte Winkel über das Tor 39 in den Winkelspeicherpuffer 45 übertragen. Der Inhalt des Winkelspeicher-

ViA 975 003

609883/0932

i - is - :

puffers wird nun mit dem errechneten Winkel, der im Winkelvergleichsregister 41 gespeichert ist, verglichen. Wenn eine über- ; einstimmung festgestellt wird, dann triggert das Ausgangssignal ^: des Tores 43 den Flip-Flop 42, so daß dieser auf seiner Ausgangs- j leitung 44 ein der binären Eins entsprechendes Signal erzeugt,
das angibt, daß es sich bei dem Eingangswort um ein gültiges
Wörterbuchwort handelt.

Die digitale Referenzmatrixeinrichtung kann auch zur überprüfung
der Gültigkeit von Wörtern verwendet werden, die sowohl spezielle _: Zeichen als auch Alphawort enthalten, wenn nur den speziellen ! Zeichen bestimmte Umwandlungscodes zugeteilt werden, wobei die
entsprechenden Betrag/Winkelpaare im Speicher 38 gespeichert
werden. ;

WA 975 003

$09883/0932

Claims

PATENTANSPRÜCHE

Einrichtung mit einer digitalen Referenzmatrix zur überprüfung der Gültigkeit von alphabetischen Eingangszeichen als gültige linguistische Ausdrücke, gekennzeichnet durch einen Zahlendetektor (6; Fig. 1) und ein Tor (39) zur Trennung von Buchstaben und Zahlen im Eingangsdatenstrom und zur Weiterleitung nur der Buchstaben zur Gültigkeitsprüfung, durch eine Recheneinrichtung, die an einen Umv/andlungsspeicher (10) zur Umwandlung eines alphabetischen Wortes in einen Vektor des Betrags

2 ^M 2

Y - Σ L*

N=I ^w

wobei L der im Umwandlungsspeieher gespeicherte, jedem Buchstaben irn Wort eindeutig zugeordnete numerische Wert ist und des Winkels

β = sec'¹

M
ISI=I

wobei R_n eine eindeutige Zahl ist, welche die Position eines Buchstabens im Wort und |R| ein Vektor ist, dessen Elemente R_n sind, angeschlossen ist, ferner durch einen Speicher (38), der ein Verzeichnis (Wörterbuch) gültiger, nach obiger Vorschrift codierter Wörter in Vektorbetrag- und -Winkeldarstellung enthält, durch eine Speicherzu- : griffseinrichtung (17), die mit dem errechneten Vektor-ι betrag als Adresse den Speicher ansteuert, durch ein

Winkelvergleichsregister (44), in dem der errechnete Winkel ; mit dem unter dem zugehörigen Betrag gespeicherte Winkel des Verzeichnisses verglichen wird und schließlich durch eine Anzeigeeinrichtung (40, 42), die mit dem Speicher

WA 975 003

609883/0932

(33) und dem WinkelVergleichsregister verbunden ist und bei einem positiven Vergleich ein Signal liefert, das die Gültigkeit eines Eingangswortes anzeigt.
2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß der Speicher (38; Fig. 1) die Beträge der Vektoren, die

^! ein Verzeichnis gültiger Worte darstellen, in Run-Längencodierung enthält, woboi jeweils einem Betrag die zugeordneten absoluten eindeutigen Winkel folgen und ein weiteres Bit vorgesehen ist, das angibt, ob dem gleichen Betrag ein weiterer absoluter eindeutiger Winkel noch nachfolgt.
3. Einrichtung nach Anspruch 1 und/oder 2, dadurch gekennzeichnet, daß im Speicher (33; Fig. 1) vor jedem Vektorwinkelfeld ein Kopffeld gespeichert ist, das angibt, ob der nächste Betragswert um einen Faktor 1 sequentiell ist und wieviele absolute eindeutige Winkelwerte nachfolgen.

WA 975 003

609883/0932