DE1221042B - Verfahren und Anordnung zum Erkennen von Zeichenkombinationen - Google Patents
Verfahren und Anordnung zum Erkennen von ZeichenkombinationenInfo
- Publication number
- DE1221042B DE1221042B DEJ26971A DEJ0026971A DE1221042B DE 1221042 B DE1221042 B DE 1221042B DE J26971 A DEJ26971 A DE J26971A DE J0026971 A DEJ0026971 A DE J0026971A DE 1221042 B DE1221042 B DE 1221042B
- Authority
- DE
- Germany
- Prior art keywords
- word
- words
- circuit
- character
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Description
DEUTSCHES
PATENTAMT
AUSLEGESCHRIFT
Int. CL:
GO6k
Deutsche Kl.: 43 a - 41/03'
Nummer: 1 221 042
Aktenzeichen: J 26971IX c/43 a
Anmeldetag: 25. November 1964
Auslegetag: 14. Juli 1966
V1 ßM
2 9. 12.65
Die Erfindung betrifft ein Verfahren und eine Anordnung zum Erkennen von redundanten Zeichenkombinationen,
wie z. B. geschriebenen Wörtern.
Es ist oft notwendig, Daten aus einer zur Verfügung stehenden Form in eine für die automatische
Verarbeitung, z. B. in Rechenmaschinen und Sprachübersetzungsanlagen, gebräuchliche Form umzuwandeln.
Diese Daten liegen meist in schriftlicher Form vor, können aber auch z. B. als gesprochene Wörter
zur Verfügung stehen. Die benötigte Umwandlung mußte bisher mit größter Sorgfalt durch handbediente
Eingabevorrichtungen durchgeführt werden. Es sind in letzter Zeit viele Versuche unternommen worden,
diese Tätigkeit zu automatisieren, insbesondere in Verbindung mit Zeichenerkennungsvorrichtungen,
die die Eingabeinformationen von bedruckten oder beschriebenen Unterlagen ablesen und in einen für
Maschinen brauchbaren Code umwandeln. Obwohl die automatischen Zeichenerkennungsmaschinen wesentlich schneller arbeiten als der Mensch, so sind
diese Maschinen doch nicht in der Lage, Fehler in den Unterlagen zu erkennen. Zusätzliche Fehler werden
manchmal durch die Erkennungsmaschinen hervorgerufen, wenn die Zeichen verschmutzt, schlecht
ausgerichtet oder in sonstiger Hinsicht fehlerhaft sind und wenn das Aufzeichnungsmaterial selber von
schlechter Qualität, verschmutzt, beschädigt usw. ist. Der Mensch ist dagegen im allgemeinen in der Lage,
solche Fehler zu erkennen, besonders wenn es sich um Wortfolgen oder Sätze handelt. Wenn z. B. in
einem Satz das Wort »ZOLI« vorkommt, kann aus dem Inhalt des Satzes erkannt werden, daß es sich
um das Wort »ZOLL« handelt, und der Fehler kann dann korrigiert werden.
Die Erfindung macht Gebrauch von der einer Sprache anhaftenden Redundanz, um eine automatische
Fehlerkorrektur durchzuführen. Nur ein sehr kleiner Prozentsatz der verfügbaren Anzahl von
Buchstabenfolgen bildet gültige Wörter. Die englische Sprache besitzt insgesamt etwa 500 000 Wörter,
und nur ein sehr geringer Teil davon bildet Wörter mit fünf Buchstaben, obwohl theoretisch aus fünf
Buchstaben mehr als 10 Millionen (265) mögliche Kombinationen aus sechsundzwanzig Buchstaben des
Alphabets gebildet werden können.
Es wurde gefunden, daß eine große Anzahl Fehler und Zurückweisungen bei Lesemaschinen ihre Ursache
in leicht verwechslungsfähigen Buchstaben haben, z. B. »H« und »N«. Diese Buchstaben können
leicht verwechselt werden, wenn der Verbindungssteg zwischen den beiden senkrechten Schriftzeichenteilen
unsauber geführt ist. Viele Wörter können
Verfahren und Anordnung zum Erkennen
von Zeichenkombinationen
von Zeichenkombinationen
Anmelder:
International Business Machines Corporation,
Armonk,N.Y. (V. St. A.)
Vertreter:
Dipl.-Ing. H. E. Böhmer, Patentanwalt,
Böblingen, Sindelfinger Str. 49
Als Erfinder benannt:
Herbert Bernard Baskin, Mohegan Lake, N. Y.;
Raymond Eugene Bonner, Yorktown Heights,
N. Y. (V. St. A.)
Raymond Eugene Bonner, Yorktown Heights,
N. Y. (V. St. A.)
Beanspruchte Priorität:
V. St. v. Amerika vom 4. Dezember 1963
(327 916)
V. St. v. Amerika vom 4. Dezember 1963
(327 916)
ohne Unterscheidung dieser beiden Buchstaben erkannt
werden. Als Beispiel sei das Wort »SCHNEE« (»SCNNEE« und »SCHHEE») genannt. In der vorliegenden
Erfindung werden verwechslungsfähige Buchstaben nicht voneinander unterschieden, ausgenommen
in den seltenen Fällen, wo die Unterscheidung benötigt wird, um Zweideutigkeiten zu vermeiden.
Eine Zweideutigkeit, die eine Unterscheidung zwischen den Buchstaben »H« und »N« erforderlich
macht, liegt z. B. bei den Wörtern »KAHN« und »KANN« vor. In diesem Fall ist die Wiedergabe von
K, A, H oder N, H oder N zweideutig, und die Erkennungsschaltung muß in diesem Fall die relativ
schwierige Unterscheidung zwischen »H« und »N« durchführen.
Durch das IBM Technical Disclosure Bulletin, Vol. 4, Nr. 10, März 1962, S. 15 ist bereits ein Verfahren bekannt, welches die Redundanz dazu ausnutzt, Wörter auch dann noch zu erkennen, wenn ein oder mehrere Zeichen eines Wortes nicht richtig erkannt oder von der Erkennungsvorrichtung zurückgewiesen worden sind. Bei diesem Verfahren werden nacheinander die wahrscheinlichsten Zeichenkombinationen mit Bezugswörtern verglichen.
Durch das IBM Technical Disclosure Bulletin, Vol. 4, Nr. 10, März 1962, S. 15 ist bereits ein Verfahren bekannt, welches die Redundanz dazu ausnutzt, Wörter auch dann noch zu erkennen, wenn ein oder mehrere Zeichen eines Wortes nicht richtig erkannt oder von der Erkennungsvorrichtung zurückgewiesen worden sind. Bei diesem Verfahren werden nacheinander die wahrscheinlichsten Zeichenkombinationen mit Bezugswörtern verglichen.
609 589/125
Das erfindungsgemäße Verfahren benutzt ebenfalls das Prinzip des Vergleichs mit Bezugswörtern. Die
Erfindung gibt hierzu eine technische Lösung an. Beim erfindungsgemäßen Verfahren werden die Wörter,
die leicht verwechselbare Zeichen enthalten, derart in Wörter geringerer Redundanz umgewandelt,
daß leicht verwechselbaren Zeichen ein gemeinsames Codesignal zugeordnet wird. Die Codesignale
der Wörter mit geringerer Redundanz bilden die Adressen eines Speichers, in dem die Bezugswörter
gespeichert sind.
Die Erfindung betrifft ein Verfahren zum Erkennen von redundanten Zeichenkombinationen (Wörtern),
bei welchem Wörter, deren Zeichen nicht eindeutig erkannt worden sind, mit gespeicherten Bezugs-Wörtern
verglichen werden.
Gekennzeichnet ist die Erfindung dadurch, daß die Wörter dadurch in Wörter mit geringerer Redundanz
umgewandelt werden, daß ähnliche Zeichen ein gemeinsames Codesignal zugeordnet wird, daß durch
die Codesignale der Wörter mit geringerer Redundanz Speicherplätze adressiert werden, die die zugeordneten
Bezugswörter enthalten, daß die eingegebenen Wörter mit den zugeordneten Bezugswörtern
verglichen werden und daß das übereinstimmende Bezugswort oder bei fehlender Übereinstimmung
sämtliche zugeordneten Bezugswörter oder das Bezugswort mit den meisten übereinstimmenden Zeichen
der Ausgabevorrichtung zugeleitet wird/werden.
Vorteilhafterweise wird mit der Weiterbildung des Bezugswortes bzw. der Bezugswörter an die Ausgabevorrichtung
die volle Übereinstimmung bzw. der Übereinstimmungsgrad angezeigt. Weitere Merkmale
der Erfindung sind in den Unteransprüchen enthalten.
Das Verfahren und eine Anordnung zur Durchführung des Verfahrens wird nunmehr an Hand der
Zeichnungen beschrieben. Es zeigt
F i g. 1 ein Blockschaltbild der Anordnung gemäß der Erfindung,
Fig. 2a bis 2h Einzelblockschaltbilder der An-Ordnung
gemäß F i g. 1 und
F i g. 3 ein ausführliches Blockschaltbild des Vergleichers in F i g. 2 e.
Wie F i g. 1 zeigt, werden die Ausgangssignale einer Zeichenerkennungsmaschine 1 in ein Eingangsregister
2 eingeführt. Nach beendeter Worteingabe wird die Maschine durch ein Signal informiert und
nimmt keine weiteren Leseoperationen vor, bis das Wort erkannt ist. Eine Steuerschaltung 4 verarbeitet
alle Signale, die für die zeitliche Steuerung des Systems nötig sind. Das im Eingangsregister gespeicherte
Wort (Eingangssymbolkombmation mit größerer Redundanz) wird dann zu einer Codierschaltung
6 übertragen, in der es in den kompakten Satz von Codesymbolen (Symbolkombinationen mit geringerer
Redundanz) umgewandelt wird. Jedes Symbol des codierten Satzes entspricht einem oder mehreren
Symbolen in der ursprünglichen (konventionellen) Darstellung. Jedes ursprüngliche Symbol wird
in ein bestimmtes Codesymbol übersetzt, wobei jedoch für die Symbole jedes Verwechslungssatzes
nur ein einzelnes Codesymbol verwendet wird.
Verwechslungssätze sind: A und R; D und O; F und P; H und N; I, L und T, und die nachstehende
Tabelle führt die jedem Zeichen entsprechenden Codesymbole auf. Daneben sind noch der »6-Bit-Code«,
der »Lochkartencode« und der »l-aus-20-Code« angegeben.
Zeichen | B | 6-Bit-Code A 8 4 2 |
1 | Loch karten code |
l-aus-20- Code |
Kompakt code |
A R |
1 1 |
10 0 0 0 10 0 |
1 1 |
12-1 11-9 |
1 | 00001 |
B | 1 | 10 0 1 | 0 | 12-2 | 2 | 00010 |
C | 1 | 10 0 1 | 1 | 12-3 | 3 | 00011 |
D 0 |
1 1 |
10 10 0 0 11 |
0 0 |
12-4 11-6 |
4 | 00100 |
E | 1 | 10 10 | 1 | 12-5 | 5 | 00101 |
F P |
1 1 |
10 11 0 0 11 |
0 1 |
12-6 11-7 |
6 | 00110 |
G | 1 | 10 11 | 1 | 12-7 | 7 | 00111 |
H N |
1 1 |
110 0 0 0 10 |
0 1 |
12-8 11-5 |
8 | 01000 |
I | 1 | 110 0 | 1 | 12-9 | ||
L | 1 | 0 0 0 1 | 1 | 11-3 | 9 | 01001 |
T | 0 | 10 0 1 | 1 | 0-3 | ||
J | 1 | 0 0 0 0 | 1 | 11-1 | 10 | 01010 |
K | 1 | 0 0 0 1 | 0 | 11-2 | 11 | 01011 |
M | 1 | 0 0 10 | 0 | 11-4 | 12 | 01100 |
Q | 1 | 0 10 0 | 0 | 11-8 | 13 | 01101 |
S | 0 | 10 0 1 | 0 | 0-2 | 14 | OHIO |
U | 0 | 10 10 | 0 | 0-4 | 15 | 01111 |
V | 0 | 10 10 | 1 | 0-5 | 16 | 10000 |
W | 0 | 10 11 | 0 | 0-6 | 17 | 10001 |
X | 0 | 10 11 | 1 | 0-7 | 18 | 10010 |
Y | 0 | 110 0 | 0 | 0-8 | 19 | 10011 |
Z | 0 | 110 0 | 1 | 0-9 | 20 | 10100 |
0 | 0 | 0 10 1 | 0 | 0 | ||
1 | 0 | 0 0 0 0 | 1 | 1 | — | |
9 | 0 0 0 1 0 0 0 1 |
η | 9 | |||
3 | U 0 |
0 0 10 | U 1 |
Δ 3 |
||
4 | 0 | 0 0 10 | 0 | 4 | — | |
5 | 0 | 0 0 11 | 1 | 5 | — | |
6 | 0 | 0 0 11 | 0 | 6 | ||
7 | 0 | oioo | 1 | 7 | — | |
8 | 0 | 0 10 0 | 0 | 8 | — | |
9 | 0 | 1 | 9 | — | ||
Gemäß F i g. 1 werden die Ausgangssignale dei Codierschaltung einem Magnettrommel-Wörterbuch £
als Eingangssignale zugeführt, wo das Codewort mil den nach demselben Kompaktcode gespeicherten Bezugswörtern
verglichen wird. Mit Hilfe des linker Symbols des Codewortes wird ein Teil des Wörterbuchs
ausgewählt (entweder ein Abschnitt eine) Trommel oder eine von mehreren Trommeln). De]
Rest des Codewortes dient zum Suchen innerhalb des ausgewählten Teils des Wörterbuchs.
Wenn das durchsuchte Feld des Wörterbuchs dem zugeführten Codewort entspricht, wird das Bezugswort bzw. werden die Bezugswörter (in echter, unverschlüsselter
Form), die dem Codewort entsprechen, aus dem Wörterbuch in ein Ausgangsregister 10
übertragen. Dieses Register enthält mehrere Speicherplätze, von denen jeder groß genug ist, um ein Wori
maximaler Länge aufzunehmen. Wenn nur ein echtes Wort dem Codewort entspricht (wie bei dem vorgenannten
Beispiel für »SCHNEE«), wird nur ein Wort dem Ausgangsregister 10 zugeführt, und dei
größere Teil des Registers bleibt leer. Wenn zwei oder mehr Wörter dem Codewort entsprechen (wie
bei dem obengenannten Beispiel »KANN« und »KAHN«), werden alle entsprechenden Wörter in
das .Ausgangsregister 10 eingeführt. Jetzt veranlaß!
die Steuerschaltung 4, daß die nichtverschlüsselten Daten im ersten Feld (Wort) des Ausgangsregisters
10 über einen Nulldetektor 12 einer Vergleichsschaltung 14 zugeführt werden. Das nicht verschlüsselte
Wort im Eingangsregister 2 wird Buchstabe für Buchstabe mit dem ersten Wort im Ausgangsregister
10 verglichen, und bei einer vollständigen Übereinstimmung wird ein Signal über die Steuerschaltung 4
zu einer UND-Schaltung 16 übertragen, die ihrerseits dieses Wort über eine ODER-Schaltung 18 einer
Ausgabevorrichtung 17 zuleitet. Wenn keine vollkommene Übereinstimmung erlangt wird, wird die
Operation für die in den übrigen Feldern des Ausgangsregisters gespeicherten Wörter wiederholt (ein
Wort zu einer Zeit). Nach Vergleich aller Wörter ohne Erlangung einer vollkommenen Übereinstimmung
wird ein Signal aus dem Nulldetektor 12 zur Steuerschaltung 4 geschickt, und alle im Ausgangsregister
10 gespeicherten Wörter werden der Ausgabevorrichtung 17 zugeführt. Meistens befindet sich
jedoch nur ein Wort im Ausgangsregister 10, und daher wird der Ausgabevorrichtung 17 nur ein Wort
zugeleitet. Im weniger üblichen Fall werden zwei oder mehr Wörter zur Ausgabevorrichtung übertragen.
Das geschieht nur, wenn Buchstaben in zwei oder mehr Verwechslungssätzen im gleichen Wort enthalten
sind und kein Bezugswort genau mit dem Wort im Eingangsregister übereinstimmt. Als Beispiel
dafür wird (s. vorstehende Tabelle), wenn die Zeichenerkennungsmaschine das Wort ARID als
RRID liest, die Codesymbolfolge 00001, 00001, 01001, 00100 erzeugt. Das Wörterbuch weist auf
zwei Möglichkeiten hin, nämlich ARID und RAID, die beide nicht genau mit RRID übereinstimmen. In
diesem Falle werden sowohl ARID als auch RAID der Ausgabevorrichtung zugeführt, und das richtige
Wort muß vom Benutzer ausgewählt werden.
Wenn das Eingangsregister numerische Daten enthält, wird die ganze Operation umgangen, da die
Steuereinheit eine UND-Schaltung 20 wirksam macht, die die numerischen Daten direkt der Ausgabevorrichtung
über die ODER-Schaltung 18 zuführt.
Die Wirkungsweise des Verfahrens wird im einzelnen in Verbindung mit bestimmten Beispielen für
die verschiedenen Situationen, die auftreten können, beschrieben.
Das erste Beispiel betrifft den eindeutigen Fall, dargestellt durch das Wort DIG, das so verschlüsselt
ist: 00100, 01001, 00111. Alle anderen Zeichenkombinationen mit dieser Codedarstellung sind ungültige
Wörter, nämlich DLG, DTB, OIG, OLG und OTG. In diesem ersten Beispielsfall speichert das Wörterbuch
nur das Wort DIG an der durch 00100, 01001, 00111 bezeichneten Adresse, und da dieses Wort
genau mit dem Eingangswort übereinstimmt, wird es der Ausgabevorrichtung zugeführt.
Das zweite Beispiel ist der Fall, daß die Zeichenerkennungsmaschine
eine Buchstabenfolge erzeugt, die genau mit der ersten von mehreren im Wörterbuch
gespeicherten Möglichkeiten übereinstimmt. In diesem Beispielsfall wird von der Zeichenerkennungsmaschine
das Wort FILL gebildet und dafür der Code 00110, 01001, 01001, 01001 erzeugt. Von den
vielen Buchstabenfolgen, die diesem Code entsprechen, sind nur FILL und PILL gültige Wörter, und
das Wörterbuch enthält diese beiden Wörter in alphabetischer Reihenfolge an der angegebenen Adresse.
Da das erste der gespeicherten Wörter mit dem Eingangswort übereinstimmt, ist es das einzige Wort, das
verglichen werden muß, bevor es der Ausgabevorrichtung zugeführt wird.
Das dritte Beispiel gleicht dem zweiten mit der Ausnahme, daß das zweite der gespeicherten Wörter
genau mit der von der Zeichenerkennungsmaschine gebildeten Buchstabenfolge übereinstimmt (PILL im
vorstehenden Beispiel). In diesem Falle ist das Ergebnis des ersten Vergleichs eine Nichtübereinstimmung,
ίο und es sind zwei Vergleiche nötig.
Das vierte Beispiel gleicht dem zweiten und dem dritten Beispiel mit der Ausnahme, daß die Ausgangssignale
des Erkennungssystems (FILL) mit keinem der gespeicherten Wörter (FILL und PILL)
genau übereinstimmt. Daher versagen beide Vergleiche, und beide gespeicherten Wörter werden der
Ausgabevorrichtung zugeleitet.
Im fünften Beispielsfall liefert das Zeichenerkennungssystem numerische Daten, und das Wörterbuch,
die Vergleichsschaltung usw. sind nicht nötig, da die numerischen Daten der Ausgabevorrichtung direkt
zugeführt werden.
In diesem Fall liest die Zeichenerkennungsmaschine das Wort DIG richtig und führt dieses
Wort in das Eingangsregister 2 ein (F i g. 1).
Gemäß F i g. 1 wird das Wort (DIG) vom Eingangsregister 2 aus der Codierschaltung 6 zugeführt
und dort in den Kompaktcode übersetzt (00100, 01001, 00111). Im bevorzugten Ausführungsbeispiel
werden zwanzig Magnettrommeln im Wörterbuch verwendet, und jede Trommel enthält alle Codewörter
(und ihre Übersetzungen), die mit einem der zwanzig Codesymbole beginnen. Das heißt, die Trommel
1 enthält alle mit A oder R (Code 00001) beginnenden Wörter, Trommel 2 enthält alle mit B
(Codewort 00010) beginnenden Wörter usf. Im vorliegenden Fall wird mit Hilfe des ersten Codesymbols
(00100) die Trommel 4 im Wörterbuch ausgewählt. Mit den übrigen Codesymbolen (01001, 00111) werden
die auf dieser ausgewählten Trommel gespeicherten Daten adressiert. Wenn diese Adresse gefunden
ist, ist das einzige gültige Wort DIG zugänglich, und dieses Wort wird in das Ausgangsregister 10 eingegeben.
Dies ist das einzige gültige Wort, das dem Kompaktcode entspricht. Dann wird das Wort DIG
aus dem Register 10 zur Ausgabevorrichtung übertragen. Nach erfolgter Übertragung wird die Zeichenerkennungsmaschine
durch ein Signal angewiesen, das nächste Wort zu lesen.
Entsprechend den detaillierten Diagrammen von Fig. 2 werden mehrere bistabile Kippschaltungen
verwendet. Sie werden in der Beschreibung und den Zeichnungen mit den Buchstaben FF (Flip-Flop) bezeichnet.
Bevor nun die Wirkungsweise des Systems beschrieben wird, soll der Anfangszustand dieser Vorrichtungen
untersucht werden.
Vor der Operation wird ein Schalter 22 (Fig. 2d)
kurz gedrückt. Dieser Schalter sendet ein Rückstellsignal zu mehreren bistabilen Kippschaltungen (FF)
wie folgt: Über die ODER-Schaltung 24 wird das FF 26 in den Linkszustand gebracht, über die ODER-Schaltung
28 gelangen die FF 30 und 32 in den Linkszustand, über die ODER-Schaltungen 34 und 36
wird das FF 38 in den Linkszustand gebracht, und über die ODER-Schaltungen 34 und 40 gelangen die
FF 42 und 44 in den Rechtszustand. Außerdem stellt
dieses Signal über die ODER-Schaltungen 34, 40 und 46 die Ringzähler 48 (Fig. 2d) und 49 (Fig. 2h)
zurück, so daß sie Ausgangssignale auf ihren »1«- Leitungen erzeugen.
Wenn die Ausgabevorrichtung das Aufzeichnen eines Wortes abgeschlossen hat, wird ein »Auslesenbeendet«-Signal
-auf Leitung 182 über die ODER-Schaltung 28 (Fig. 2d), die UND-Schaltung 50 und
die ODER-Schaltung 36 dem FF 38 zugeführt und bringt sie in den Linkszustand. (Im ersten Betriebsumlauf geschieht dies durch den Schalter 22, wie
oben erläutert.) Ein auf Leitung 52 erzeugtes »Eingäbe«-Signal wird als »Lochen-erfolgt«-Signal der
Zeichenerkennungsmaschine zugeführt. Durch dieses Signal wird die Zeichenerkennungsmaschine veranlaßt,
das nächste Wort zeichenweise zu lesen.
Im vorliegenden Beispiel ist das erste von der Zeichenerkennungsmaschine gelesene Zeichen ein D,
und es entsteht ein Signal am Ausgang der Maschine. Dieses Signal wird über eine der Leitungen 54
(Fig. 2a) in das »Zeichen-1«-Feld eines Registers56
eingegeben. Das geschieht mittels eines Ringzählers 58, der vorher durch ein »Leerschritte-Signal aus der
Zeichenerkennungsmaschine rückgestellt wird und ein Signal an seinem »1 «-Ausgang auf Leitung 60 liefert,
das eine mehrfache UND-Schaltung 62 erregt. (Diese besteht aus einer Gruppe herkömmlicher UND-Schaltungen,
die durch ein gemeinsames Signal erregt werden.) Diese UND-Schaltungen leiten die Signale
aus einer Gruppe von ODER-Schaltungen 64 weiter, welche eine Codeumwandlung in einen 6-Bit-Code
gemäß der vorstehenden Tabelle bewirken. Da ein D gelesen wird, werden Signale von den B, A, Έ, 4, 2
und T entsprechenden ODER-Schaltungen erzeugt, und der Wert 110100 wird in das Zeichen-1-Feld
eines Registers 56 eingeführt. Infolge der Verwendung einer Echt- und Komplement-Bitstruktur ist es
unnötig, das Register 56 vor der Eingabe eines Wortes zu löschen.
Kurz nach der Eingabe des D in diese Anordnung erzeugt die Zeichenerkennungsmaschine ein Zeichenendesignal
(Xc), das den Ringzähler 58 in die Stellung 2 weiterschiebt und dadurch eine mehrfache
UND-Schaltung 66 erregt, so daß diese das nächste Zeichen in die zweite Stelle des Registers 56 leitet.
Die Zeichenerkennungsmaschine liest dann die folgenden Zeichen I und G, die in den 6-Bit-Code übersetzt
und in die zweite und die dritte Stelle des Registers 56 eingeführt werden. Nach dem Lesen des
Zeichens G erzeugt die Zeichenerkennungsmaschine ein »Leerschritt«-Signal, durch das der Ringzähler
58 als Vorbereitung für das nächste Eingangswort in seine »1 «-Stellung rückgestellt wird. Dieses Signal aus
der Zeichenerkennungsmaschine wird außerdem^ als »Eingabe-beendet«-Signal über die Leitung 184
dem FF 38 zugeführt und bringt es in den Rechtszustand.
Während der Eingabe der Zeichen aus der Zeichenerkennüngsmaschine in das Register 56 (F i g. 2 a)
wird bestimmt, um welchen Zeichentyp es sich handelt. Wenn das Wort ganz alphabetisch ist, werden
das Wörterbuch und die zugeordneten Schaltungen verwendet, aber wenn irgendein Zeichen numerisch
ist, werden diese Schaltungen umgangen, und das Eingangswort wird direkt der Ausgabevorrichtung zugeleitet.
Durch die ursprüngliche Einstellung des FF38 (Fig. 2d) in den Linkszustand gelangt über
die Leitung 52 ein Eingabesignal zu einer monostabilen Kippschaltung MK 70 (F i g. 2 a), die einen Impuls
erzeugt. Dieser Impuls bringt ein FF 72 in den Linkszustand, wodurch eine UND-Schaltung 74 erregt
und eine andere UND-Schaltung 76 gesperrt werden. Wenn irgendein Zeichen im Eingangswort
numerisch ist, erzeugt eine ODER-Schaltung 78 ein Signal, das das FF 72 in den Rechtszustand schaltet
und dadurch die Signale zu den UND-Schaltungen 74 und 76 umkehrt (UND-Schaltung 74 wird gesperrt
ίο und UND-Schaltung 76 erregt). Wie schon beschrieben,
wird, wenn das Eingangswort vollständig in das Register 56 eingegeben ist, das FF38 (Fig. 2d) in
den Rechtszustand geschaltet. Dieses erzeugt ein Signal, das eine monostabile Kippschaltung 80 anstößt.
Diese wiederum sendet einen Ausgangsimpuls zu den UND-Schaltungen 74 und 76 (F i g. 2 a). Wenn
das eingegebene Wort ganz alphabetisch ist, wird der Impuls von der UND-Schaltung 74 durchgelassen;
wenn irgendein Zeichen darin numerisch ist, wird der
zo Impuls von der UND-Schaltung 76 durchgelassen. Die Ausgangssignale dieser UND-Schaltungen steuern
den Zustand eines FF 82., das in den Rechtszustand
gelangt, für alphabetische Zeichen und in den Linkszustand für numerische. Im vorliegenden Beispielsfall
werden alphabetische Daten zugeführt, so daß die rechte Seite des FF 82 ein Ausgangssignal erzeugt,
das über einen Kondensator 84 (Fig. 2e) einem FF 86 zugeführt wird, das dadurch in den
Linkszustand gelangt. Die Funktion dieser Schaltung wird weiter unten beschrieben.
Jedes Zeichen wird bei seinem Erscheinen im Eingangsregister 56 (F i g. 2 a) durch die Codierschaltung
6 (Fig. 2b) in den Kompaktcode übersetzt. Der 6-Bit-Code im Register 56 wird zunächst in den
Lochkartencode, dann in einen l-aus-20-Code und danach in den 5-Bit-Kompaktcode umgewandelt. Die
vorstehende Tabelle zeigt die Übereinstimmung zwischen den verschiedenen Systemen. Zwanzig Symbole
des Kompaktcodes genügen zur Darstellung der sechsundzwanzig alphabetischen Zeichen, weil die
Verwechslungssätze in Einzelsymbole im Kompaktcode umgewandelt werden.
Jedem Feld des Registers 56 ist eine Codierschaltung zugeordnet. Eine solche Codierschaltung ist in
Fig. 2b dargestellt; sie ist mit dem »Zeichen-1«- FeId verbunden. Da dieser Teil des Registers in diesem Fall ein D enthält, wird er durch die Codierschaltung
über die in Fig. 2b dick gezeichneten Signalpfade in 00100 übersetzt. Die vorstehende Tabelle
zeigt, daß in dem Kompaktcode sowohl das D als auch das O durch 001000 dargestellt werden.
Hätte die Maschine O statt D gelesen, würde das O die Codierschaltung steuern, wie es die dicken gestrichelten
Linien erkennen lassen. Die Codierschaltung besteht aus mehreren herkömmlichen passiven
logischen Schaltungen (UND-Schaltungen, ODER-Schaltungen und Invertern, dargestellt durch die
Symbole /\, V bzw. I).
Die aus der oberen Zeile der UND-Schaltungen
88 kommenden Leitungen enthalten Signale, die das Zeichen im Lochkartencode darstellen, die Signale
auf den Leitungen in Kabel 90 stellen das Zeichen im l-aus-20-Code dar, und die Signale auf den Leitungen
im Kabel 92 stellen das Zeichen im Kompaktcode dar. Die Signalpfade (dicke undi gestrichelte
Linien) treffen am Ausgang der ODER-Schaltung 94 zusammen (im l-aus-20-Code), und ein Signal 00100
für D und O erscheint am Ausgang der Codier-
9 10
schaltung. Ebensolche Codierschaltungen, die der Register nicht gelöscht zu werden braucht. Wenn bei
zweiten und der dritten Stelle des Registers 56 ent- dem Beispiel die Anordnung eine Übereinstimmung
sprechen, erzeugen die Codes 01001 bzw. 00111 für für die Codezeichen 01001 und 00111 bestimmt,
I und G, wenn diese in das Register eingegeben wird das Wort DIG in Register 110 eingeführt. Nur
werden. 5 dieses einzige Wort wird dem Register 110 zuge-
Wenn nun das Wort DIG im Eingangsregister 56 leitet, weil es das einzige gültige Wort ist, das der
steht und die verschlüsselten Darstellungen des Wor- Codekombination entspricht.
tes DIG an den Ausgängen der Codierschaltungen 6 Die Vergleichsschaltung 104 (Fig. 2e) ist in
(Fig. 2b) liegen, ist die Anordnung bereit zum Ab- Fig. 3 für ein einzelnes Zeichen genauer dargestellt,
fragen des Trommelwörterbuches 8 (Fig. 2e), um io Für die 16-Zeichen-Wörter in dem bevorzugten Ausnach
den entsprechenden gültigen Wörtern zu führungsbeispiel sind fünfzehn solche Schaltungen
suchen. Zu diesem Zweck wird auf Grund des nötig, je eine für jedes Zeichen mit Ausnahme des
ersten Symbols des Codewortes eine von zwanzig ersten Zeichens, das nur für die Auswahl einer
Trommeln 96 ausgewählt. Die Ausgangssignale der Trommel benutzt wird. Jedes entsprechende Datenl-aus-20-Codierschaltung
(in diesem Falle »4«) wer- 15 element in den Kabeln 92 und 112 wird einer UND-den
über ein Kabel 90 einer mehrfachen UND- Schaltung 114 zugeführt (in Echt- und Komplement-Schaltung
98 (Fig. 2e) zugeführt. Es ist also ein form). Wenn die entsprechenden Datenelemente
Signal auf der vierten Leitung der zwanzig Leitungen übereinstimmen, erzeugen die UND-Schaltungen 114
im Kabel 90 vorhanden. Die UND-Schaltung wird Ausgangssignale, die durch ODER-Schaltungen 116
durch ein Signal aus dem FF 86 erregt, das im 20 eine andere Gruppe von UND-Schaltungen 118
Linkszustand ist, wie oben erläutert. Die UND- erregen. Ein Signal aus einer Quelle 120 wird von
Schaltung 98 leitet das Eingangssignal auf Kabel 90 allen UND-Schaltungen 18 nur dann weitergeleitet,
weiter, um die mehrfachen UND-Schaltungen 100 wenn eine genaue Übereinstimmung zwischen den
und 102 zu steuern. Es werden nur die UND-Schal- Zeichen vorliegt. Die Übereinstimmungsanzeige auf
tungen 100 und 102 erregt, die der Trommel 4 zu- 25 Leitung 106 wird der folgenden Vergleichsschaltung
geordnet sind. Diese Trommel wird nun durch die 104 zugeführt und besetzt dort die Spannungsquelle
übrigen Codezeichen (01001 und 00111) adressiert 120, so daß alle Vergleichsschaltungen tandemartig
(durchsucht). Die auf jeder Trommel gemachten Ein- angeordnet sind, und ein Ausgangssignal wird von
tragungen können in beliebiger Reihenfolge, auch in der letzten Vergleichsschaltung der Reihe (auf Leizufälliger
Folge, angeordnet sein. Die dem zweiten 30 tung 106) nur dann erzeugt, wenn jedes Zeichen auf
bis sechzehnten Zeichen des Eingangswortes ent- Kabel 92 genau mit dem entsprechenden Zeichen auf
sprechenden Daten aus den restlichen fünfzehn Kabel 112 übereinstimmt.
Codierschaltungen 6 (des in Fig. 2 b gezeigten Typs) Jetzt vergleicht die Anordnung (auf alphabetischer
werden einer Vergleichsschaltung 104 (Fig. 2e) Basis) das Wort im Ausgangsregister 110 (Fig. 2g)
über Kabel 92 zugeführt. Die Vergleichsschaltung 35 mit dem Wort im Eingangsregister 56 (Fig. 2a). Das
wird noch an Hand von F i g. 3 genauer beschrieben. Signal, das das FF 86 liefert (F i g. 2 e), wenn die
Da das Wort DIG nur drei Zeichen umfaßt, senden Vergleichsschaltung 104 eine Übereinstimmung andie
dem vierten bis sechzehnten Zeichen entsprechen- zeigt, wird über einen Kondensator 122 (der das
den Codierschaltungen Null-Ausgangssignale zu der Signal in einen Impuls umwandelt), dem FF 42
Vergleichsschaltung. Die Codierschaltung für Zei- 4° (F i g. 2 d) zugeführt und bringt es in den Linkschen
1 des Eingangswortes liefert nur auf Kabel 90 zustand. Das Ausgangssignal des FF 42 erregt einen
brauchbare Daten, um die richtige Trommel aus- Impulsgenerator 124, der auf seinen A- und B-Auszuwählen,
und die Codierschaltungen für Zeichen 2 gangsleitungen eine Reihe von abwechselnden Taktbis
16 liefern nur auf Kabel 92 brauchbare Daten impulsen erzeugt, wobei als erster ein /i-Impuls entfür
Vergleichszwecke. Der andere Eingang der Ver- 45 steht. Die Impulse werden den UND-Schaltungen
gleichsschaltung 104 empfängt die Codezeichen für 126 und 128 zugeführt, die durch die FF 26 bzw. 30
das zweite bis sechzehnte Zeichen der Codewörtei gesteuert werden. Die FF 26 und 28 werden zunächst
auf Trommel 4, welche alle Codezeichenfolgen für beide durch den Schalter 22 rückgestellt, ■ wie oben
die mit D und O beginnenden gültigen Wörter ent- beschrieben ist. Der erste y4-Impuls wird jeder der
hält mit Ausnahme des ersten Codesymbols (das 50 sechzehn Zeichenvergleichsschaltungen 14 (von
zum Suchen der Trommel verwendet worden ist). denen eine in Fig. 2c gezeigt ist) zugeleitet. Ein
Jedes vollständige Trommelwort umfaßt außer den Zeichen des Eingangswortes im Register 56 wird mit
Codezeichenfolgen alle entsprechenden gültigen dem entsprechenden Zeichen eines gültigen Wortes
Wörter. im Register 110 (F i g. 2 g) in jeder Vergleichseinheit
Nur das Codezeichenfeld wird der Vergleichs- 55 verglichen. Im vorliegenden Beispielsfall wird das
schaltung 104 zugeführt. Bei der Drehung der Trom- Zeichen D (im 6-Bit-Code) aus dem Zeichen-1-Feld
mel in die richtige Position werden gleiche Daten des Registers 56 zu einer Gruppe von UND-Schalbeiden
Eingängen der Vergleichsschaltung zugeführt, tungen 130 in der Vergleichsschaltung 14 (F i g. 2 c)
und es entsteht ein Signal auf Leitung 106. Dieses übertragen. Gleichzeitig wird das erste Zeichen im
Signal schaltet das FF 88 in den Rechtszustand und 60 ersten Wort (W-I) im Register 110 durch eine mehrtrennt
dadurch das Erregungssignal für die UND- fache UND-Schaltung 132 und eine ODER-Schal-Schaltungen
98 ab, so daß die UND-Schaltungen 100 tung 134 über die Nullfeststellschaltung 12 (F i g. 2 f)
und 102 gesperrt werden. Während das Codefeld zu den UND-Schaltungen 130 (F i g. 2 c) übertragen,
verglichen wird, werden die restlichen die gültigen Als erstes wird das Wort 1 aus dem Register 110
Wörter enthaltenden Felder über die UND-Schaltun- 65 (Fig. 2g) ausgewählt, weil die ihm entsprechende
gen 102 und' das Kabel 108 dem Register 110 UND-Schaltung 132 durch ein Signal vom »1«-Aus-(Fig.
2g) zugeführt. Echt- und Komplementbits im gang des Ringzählers 48 (Fig. 2d) erregt ist. Die
6-Bit-Code werden parallel zugeführt, damit dieses den Wörtern 2 bis N entsprechenden UND-Schaltun-
gen 132 (Fig. 2g) werden während dieses ersten
Vergleichsumlaufs nicht erregt. Die dicken Linien in F i g. 2 c stellen die Signalpfade dar, wenn, wie im
vorliegenden Fall, zwei D verglichen werden. Wenn der Vergleichsschaltung gleiche Daten zugeführt
werden, liegt ein Signal an jedem Ausgang einer Gruppe von ODER-Schaltungen 136, wodurch eine
Gruppe von UND-Schaltungen 138 erregt wird. Der ^4-Impuls durchläuft diese Folge von UND-Schaltungen
und erzeugt das M-(Übereinstimmung-) Signal auf einer Leitung 140. Wenn die Zeichen nicht übereinstimmen,
wird! ein Signal von einem oder mehreren Inverternl42 erzeugt und durch eine entsprechende
UND-Schaltung 144 zu einer ODER-Schaltung 146 weitergeleitet. Da jedes Zeichen im Eingangswort
mit jedem Zeichen in den gespeicherten Wörtern verglichen wird, wird das »Ubereinstimmung«-Signal
auf Leitung 140 (statt des ^4-Impulses)
den restlichen Vergleichsschaltungen zugeführt, die in Reihe geschaltet sind. Wenn die beiden zugeführten
Wörter genau übereinstimmen, liegt ein Signal auf Leitung 140 vor (M). Wenn ein Signal aus· einer
beliebigen ODER-Schaltung 146 eine Nichtübereinstimmung anzeigt, erzeugt eine ODER-Schaltung 148
(Fig. 2c) ein »Nichtübereinstimmung«-Signal Ή..
Bei diesem Beispiel für eine vollständige Übereinstimmung mit dem ersten (und einzigen) Wort, das
im Wörterbuch für die entsprechende Kampaktcodezeichenfolge gespeichert ist, wird das Übereinstimmungssignal
auf Leitung 140 über eine ODER-Schaltung 150 (Fig. 2d) einer UND-Schaltung 152 zugeleitet.
Wenn die Nullfeststellschaltung 12 (Fig. 2f)
kein Signal auf Leitung 154 erzeugt und damit anzeigt, daß ein Wort in dem abgefühlten Feld des
Registers 110 gespeichert ist, erregt ein Inverter 156 (Fig. 2d) durch ein Ausgangssignal die UND-Schaltung
152. Dies ist während des ersten Vergleichsumlaufs stets der Fall, da mindestens ein Wort
im Register 110 gespeichert sein muß. Die Nullfeststellschaltung wird bei Beispiel 4 noch genauer erläutert.
Die UND-Schaltung 152 leitet, wenn sie erregt wird, das Übereinstimmungssignal aus der ODER-Schaltung
150 zu einer ODER-Schaltung 158 weiter, die ihrerseits das »Nehmen«-Signal erzeugt, das über
eine Leitung 160 den Schaltungen in Fig. 2h zugeführt
wird. Dieses Signal zeigt an, daß das System darauf vorbereitet ist, ein Wort zur Ausgabevorrichtung
zu übertragen. Außerdem wir das Signal aus der UND-Schaltung 152 einem FF 32 zugeführt und
bringt es in den Rechtszustand. Das von dieser bistabilen Kippschaltung erzeugte Ausgangssignal
erregt eine UND-Schaltung 16 (Fig. 2g), die das ausgewählte Wort aus dem Register 110 über eine
ODER-Schaltung 18 zur Ausgabevorrichtung überträgt.
Außerdem wird das Ausgangssignal der UND-Schaltung 152 (Fig. 2d) den FF26 und 30 zugeführt,
um sie in den Rechtszustand zu bringen und aufeinanderfolgende A- und B-Impulse zu sperren,
bis die Ausgabevorrichtung das ihr zugeführte Wort übernommen hat. Es wird dann ein »Entnahmebeendet«-Signal
aus den Schaltungen von Fig. 2h über die ODER-Schaltung28 (Fig. 2d) dem FF30
zugeleitet und bringt es in den Linkszustand, und außerdem schaltet es über die UND-Schaltung 50
(Fig. 2d) (durch FF44 erregt) und die ODER-Schaltung
36 das FF 38 in den Linkszustand zurück.
Der erste nach dem »Auslesen-beendet«-Signal auftretende 2?-Impuls bringt über die UND-Schaltung
128 und die ODER-Schaltung 24 das FF 26 in den Linkszustand. Außerdem wird dieser 5-Impuls
einer UND-Schaltung 162 zugeführt. Das vorhergegangene Übereinstimrnungssignal (M) auf Leitung
140 bringt außerdem ein FF164 in den Rechtszustand,
so daß es ein Signal zur Erregung der UND-Schaltung 162 erzeugt. Die UND-Schaltung 162 leitet
ίο daher den ß-Impuls über die ODER-Schaltung 40
zum FF 42 weiter, um es rückzustellen, und über die ODER-Schaltungen 40 und 46 zum Ringzähler 48,
der in die »1 «-Stellung rückgestellt wird. Alle Schaltungen sind also nun rückgestellt als Vorbereitung
für das nächste Wort aus der Zeichenerkennungsmaschine.
Die Entnahmeschaltungen sind in Fig. 2h im einzelnen dargestellt. Jedes Zeichen in dem ausgewählten
Wort aus dem Ausgangsregister wird von der ODER-Schaltung 18 (Fig. 2g) aus UND-Schaltungen
165 (Fig. 2h) zugeleitet. Die Zeichen werden
nacheinander durch Ausgangssignale des Ringzählers 49 abgetastet und über eine ODER-Schaltung 167
einer Magnetbandeinheit zugeführt, die im bevorzugten Ausführungsbeispiel als Ausgabeeinheit dient.
Der Ringzähler wird zunächst durch ein Signal aus der ODER-Schaltung 46 (F i g. 2 d) über eine ODER-Schaltung
169 rückgestellt. Beim Abtasten des letzten Zeichens in jedem Wort wird das Ausgangssignal
des Ringzählers (Abschnitt »16«) über die ODER-Schaltung 169 weitergeleitet, um den Zähler
zu löschen. Außerdem "wird dieses Signal als »Auslesen-beendet«-Signal
über eine Leitung 182 der ODER-Schaltung 28 (Fig. 2d) zugeführt. Die
Schiebeimpulse werden dem Ringzähler 49 (F i g. 2 h) von einem Impulsgenerator 171 über eine UND-Schaltung
173 unter der Steuerung eines FF175 zugeführt.
Das FF gelangt in den Linkszustand durch das »Nehmen«-Signal, das auf Leitung 160 erscheint,
wenn die Ausgabevorrichtung ein Wort aufnehmen soll. Das FF175 wird rückgestellt durch das »Auslesen-beendet«-Signal
auf Leitung 182 (Fig. 2h), nachdem das Wort der Ausgabevorrichtung zugeführt worden ist. Die UND-Schaltung 173 läßt
daher zur entsprechenden Zeit Schiebeimpulse durch, die den Ringzähler 49 durch einen Arbeitsumlauf
hindurchschieben, wenn ein Wort entnommen und in die Ausgabevorrichtung übertragen werden soll.
In diesem Fall wird1 die Wirkungsweise des
Systems analysiert, wenn die Zeichenerkennungsmaschine eine Buchstabenfolge richtig erkennt, die
genau mit dem ersten von zwei gültigen Wörtern, welche im Trommelwörterbuch gespeichert sind,
übereinstimmt. In diesem Beispielsfall wird das Wort FILL in die Codesymbolfolge 00110, 01001,
01001, 01001 umgewandelt (s. Tabelle). Das erste Symbol (00110) wählt die Trommel 6 aus, und die
nachfolgenden Symbole adressieren diese Trommel. Hier sind zwei gültige Wörter, nämlich FILL und
PILL, an der ausgewählten Adresse gespeichert. Das System veranlaßt den Vergleich von FILL mit der
zugeführten Zeichenfolge, und es wird eine vollständige Übereinstimmung erzielt. Daher wird das
Wort FILL der Ausgabevorrichtung zugeführt. In diesem Beispiel arbeitet das System genauso, wie es
für Beispiel 1 beschrieben worden ist, nur werden
zwei Wörter aus dem Trommelwörterbuch zum Ausgaberegister übertragen. Da aber das erste Wort eine
vollkommene Übereinstimmung ergibt, wird der Betrieb des Systems durch das zweite Wort nicht beeinflußt.
Dieses Beispiel ist eine Erweiterung des Beispiels 2. Hier wird das Wort PILL richtig von der ZeichenerkerHiungsmaschine
geliefert. Das System arbeitet in der für Beispiel 1 beschriebenen Weise, bis das zugefjihrte
Wort (PILL) mit dem ersten gespeicherten Wert (FILL) verglichen und ein »Nichtübereinstimmungssignal«
~M aus der ODER-Schaltung 146 (Fig. 2c) angezeigt wird. In diesem Falle liegt kein
Übereinstimmungssignal M auf Leitung 140, und daher ist die UND-Schaltung 152 (Fig. 2d) gesperrt.
Das erste gespeicherte Wort (FILL) kann daher der Aufgabevorrichtung nicht zugeführt werden, weil das
FF 32 im Linkszustand bleibt und kein Erregungssignal auf seiner Ausgangsleitung 166 zu den UND-Schaltungen
16 (Fig. 2g) gelangt.
Das Nichtübereinstimmungssignal M bringt das
FF 164 (F i g. 2 d) in den Linkszustand und sendet
ein Erregungssignal zu einer UND-Schaltung 168, wodurch bewirkt wird, daß der nachfolgende
B-Impuls des Impulsgenerators 124 aus der UND-Schaltung 128 den Ringzähler 48 in seine zweite
Stellung schiebt. Wenn also das erste Wort Wl im Register 110 (Fig. 2g) nicht mit den Daten im Register
56 (F i g. 2 a) übereinstimmt, wird das zweite Wort W 2 im Register 110 der Zeichenvergleichsschaltung
14 (Fig. 2c) zugeführt. In diesem Fall stimmt das zweite Wort (PILL) genau mit den Eingangsdaten
. überein, und durch den nächsten A-Impuls wird ein Übereinstimmungssignal M auf
Leitung 140 erzeugt. Dieses Signal steuert über die ODER-Schaltung 150 und die UND-Schaltung 152
das FF 32 so, daß das zweite Wort im Register 110 in die Ausgabevorrichtung übertragen wird.
Dies ist eine Erweiterung der Beispiele 2 und 3, aber es wird nun angenommen, daß die Zeichenerkennungsmaschine
die ungültige Buchstabenfolge FILL erzeugt hat. Das System arbeitet in der für Beispiel 3 beschriebenen Weise, nur stimmt weder
das erste noch das zweite Wort (FILL und PILL) im Register 110 mit der Eingangsbuchstabenfolge
überein. In diesem Fall überträgt das System beide so
Wörter FILL und PILL zur Ausgabevorrichtung. Es werden Nichtübereinstimmungssignale Ή von der
Zeichenvergleichsschaltung 14 erzeugt, wenn ihr das erste und das zweite Wort aus dem Register 110
zugeleitet werden. Jedes dieser Nichtübereinstimmungssignale schiebt den Ringzähler 48 weiter, so
daß er in die dritte Stellung gelangt, und die Daten aus dem dritten Feld des Registers 110 werden der
Zeichenvergleichsschaltung 14 zugeführt. Da jedoch nur zwei gültige Wörter im Trommelwörterbuch
stehen, ist das dritte Feldes im Register 110
(F i g. 2 g) leer. Die Nullfeststellschaltung 12 (F i g. 2f) fühlt dies ab und erzeugt ein Signal auf Leitung 154.
Die Nullfeststellschaltung enthält sechzehn Abschnitte, je einen für jedes Zeichen in dem Wort
maximaler Länge. Jeder Abschnitt (in Fig. 2f sind drei dargestellt) enthält sechs UND-Schaltungen 170,
die jede auf ein »O«-Bit in dem zugeführten 6-Bit-Wort ansprechen. Ein Signal wird aus einer Quelle
172 durch alle UND-Schaltungen 170 hindurchgeleitet, wenn alle durch »O«-Bits erregt sind. Wenn
irgendein Bit in dem zugeführten Wort nicht gleich »0« ist, wird dieses Signal gesperrt. Es erscheint also
nur dann ein Signal auf der Ausgangsleitung 154, wenn das der Nullfeststellschaltung zugeführte Wort
lauter Nullen enthält (d. h., wenn das Wort nicht vorhanden ist).
Das Signal, das die Nullfeststellschaltung auf Leitung
154 abgibt, wenn das dritte Feld des Registers 110 (Fig. 2g) abgefragt wird (im vorliegenden Fall,
wo nur zwei Felder des Registers 110 Wörter enthalten), wird über den Inverter 156 (Fig. 2d) weitergeleitet
und sperrt die UND-Schaltung 152. Außerdem erregt dieses Signal zwei UND-Schaltungen
174 und 176. Der erste A-Impuls, der auftritt, nachdem der Ringzähler 48 in die dritte Stellung
weitergeschoben worden ist (was zu einer .B-Impulszeit erfolgt ist), wird auch der UND-Schaltung 174
zugeführt. Das dritte Eingangssignal für diese UND-Schaltung (von der linken Seite des FF 44) liegt
jedoch nicht vor, und daher bleibt die Schaltung gesperrt. Der nächste B-Impuls wird der UND-Schaltung
176 (die erregt worden ist) zugeführt, und es entsteht ein Ausgangssignal, das das FF 44 in den
Linkszustand bringt. Das daraufhin vom FF 44 erzeugte Ausgangssignal erregt die UND-Schaltung
178, so daß aufeinanderfolgende A -Impulse zur ODER-Schaltung 150 weitergeleitet werden. Diese
^4-Impulse ersetzen die der ODER-Schaltung 150
zugeführten Übereinstimmungssignale, um die Entnahme von Wörtern aus dem Register 110 und ihre
Übertragung zur Ausgabevorrichtung selbst dann zu ermöglichen, wenn diese Wörter nicht mit dem zugeführten
Wort übereinstimmen. Das Ausgangssignal von der linken Seite des FF 44 (F i g. 2 d) wird außerdem
durch einen Kondensator 180 in einen Impuls umgewandelt und stellt über die ODER-Schaltung 46
den Ringzähler 48 in die erste Stellung zurück. Jetzt ist das System darauf vorbereitet, alle im Register
110 gespeicherten Wörter zur Ausgabevorrichtung zu übertragen, weil kein Wort genau mit dem angelegten
Wort im Register 56 übereinstimmt.
Der nächste A-Impuls bewirkt, daß das erste Wort
im Register 110 der Ausgabevorrichtung zugeführt wird, da die UND-Schaltung 152 (Fig. 2d) durch
das Fehlen eines Ausgangssignals der Nullfeststellschaltung zu diesem Zeitpunkt erregt ist. Das Ausgangssignal
der UND-Schaltung 152 schaltet außerdem die FF 26, 30 und 32 in den Rechtszustand,
um zu verhindern, daß A- und B-Impulse durch die UND-Schaltung 126 und 128 gelangen, während das
erste Wort aus dem Register 110 zur Ausgabeschaltung übertragen wird. Bei Beendigung dieser Operation
stellt das »Auslesen-beendet«-Signal auf Leitung 182 (Fig. 2d) die FF30 und 32 in den Linkszustand
zurück (ohne das FF 26 zu beeinflussen). Der folgende B-Impuls aus dem Impulsgenerator 124
wird von der UND-Schaltung 128 und der UND-Schaltung 168 (die durch das Signal von der linken
Seite des FF 164 infolge der Nichtübereinstimmung
erregt ist) durchgelassen, um den Ringzähler 48 in die zweite Stellung zu schieben. Außerdem bringt
dieser B-Impuls über die ODER-Schaltung 24 das FF 26 in den Linkszustand, damit der folgende
A -Impuls von der UND-Schaltung 126 durchgelassen und über die UND-Schaltung 178 und dann durch
Claims (1)
15 16
die ODER-Schaltung 150 übertragen werden kann, (knappe Entscheidung), während die Wahrscheinlich-
um die Entnahme des zweiten Wortes im Register keit, daß das zweite Zeichen ein R ist, gleich 0,8
110 und seine Übertragung zur Ausgabevorrichtung und die Wahrscheinlichkeit, daß es ein A ist, gleich
einzuleiten. 0,1 ist (deutliche Unterscheidung). In diesem Falle
Dieser Umlauf wird wiederholt, bis alle Wörter 5 ist die Wahrscheinlichkeit, daß die Zeichenfolge
im Register 110 zur Ausgabevorrichtung gelangt RRID dem Wort ARID entspricht, hoch (0,35 · 0,8)
sind. Im vorliegenden Fall werden der Ausgabevor- und die Wahrscheinlichkeit, daß sie dem Wort RAID
richtung zwei Wörter (FILL und PILL) zugeführt. entspricht, gering (0,5-0,1). Es wird daher ARID
Nach der Entnahme aller gültigen Wörter erzeugt die für die Weiterleitung zur Ausgabevorrichtung aus-
Nullfeststellschalturig 12 (Fig. 2f) ein Signal auf io gewählt. Eine weitere verwendbare Wahrscheinlich-
Leitung 154, um die UND-Schaltung 152 (F i g. 2 d) keit steht in Beziehung zur Auftrittshäufigkeit der
zu sperren. Dieses Signal wird auch der UND- verschiedenen Zeichen in der Sprache. Wenn das
Schaltung 174 zugeführt (die durch das FF 44 er- Auftreten von A wahrscheinlicher ist als das von R,
regt ist), und diese läßt den nächsten B-Impuls können knappe Entscheidungen durch die Zeichen-
durch, um das System rückzustellen. Das Ausgangs- 15 erkennungsmaschine zum A hin beeinflußt werden,
signal der UND-Schaltung 174 stellt zurück: das Das heißt, bei den vorgenannten Wahrscheinlichkei-
FF 38 (über die ODER-Schaltung 34 und 36), den ten kann das erste Zeichen richtig als A gelesen
Ringzähler 48 (über die ODER-Schaltungen 34, 40 werden, ohne einen Fehler beim Lesen des zweiten
und 46) und die FF 42 und 44 (über die ODER- Zeichens einzuführen, indem A statt R immer dann
Schaltungen 34 und 40). Die Rückstellung des FF 42 20 gewählt wird, wenn das Unterscheidungsverhältnis
verhindert, daß der Impulsgenerator 124 arbeitet. unter einem konstanten· Wert (z. B. 2) liegt. Außer-
Die FF 30 und 32 sind vorher durch das letzte »Aus- dem kann das Wörterbuch die relative Wahrschein-
lesen-beendet«-Signal in den Linkszustand gebracht lichkeit des Auftretens der gültigen Wörter speichern,
worden, und der folgende 5-Impuls hat das FF 26 Wenn z. B. das Wort ARID in der Sprache häufiger
in den Linkszustand geschaltet. 25 auftritt als das Wort RAID, kann ARID gewählt
Das System läßt sich natürlich dahingehend ver- werden, wenn eine Zweideutigkeit besteht. Natürlich
ändern, daß eins der gültigen Wörter auf der Grund- kann jede beliebige Kombination der vorgenannten
lage verschiedener Entscheidungskriterien ausgewählt Kriterien verwendet werden, um die Worterkennung
wird. Als einfaches Beispiel dafür kann das gültige zu verbessern.
Wort mit der höchsten Zahl von übereinstimmenden 3° Auf Wunsch können auch alle Wörter der Aus-Zeichen
ausgewählt werden. Im Beispielsfall 4 gabevorrichtung zusammen mit einem Hinweis auf
stimmt das Eingangswort FLLL und FILL bei nur das wahrscheinlichste Wort zugeführt werden,
einem Fehlerzeichen überein, während seine Über- _ . . . ,
einstimmung mit PILL zwei Fehlerzeichen enthält. Beispiel 5
Daher kann FILL als beste Übereinstimmung aus- 35 In diesem Fall wird die Wirkung von numerischen gewählt werden, da tatsächlich das ILL in FILL und oder alphanumerischen »Wörtern« in dem Betrieb PILL nichts zur Unterscheidung beiträgt; nur das des Systems beschrieben.
einem Fehlerzeichen überein, während seine Über- _ . . . ,
einstimmung mit PILL zwei Fehlerzeichen enthält. Beispiel 5
Daher kann FILL als beste Übereinstimmung aus- 35 In diesem Fall wird die Wirkung von numerischen gewählt werden, da tatsächlich das ILL in FILL und oder alphanumerischen »Wörtern« in dem Betrieb PILL nichts zur Unterscheidung beiträgt; nur das des Systems beschrieben.
erste Zeichen ist informativ. Das System kann auch Bevor ein Wort aus der Zeichenerkennungsdahingehend
abgeändert werden, daß es diese Ent- maschine übertragen wird, wird das FF72 (Fig. 2a)
scheidung trifft, indem es entweder Nichtüberein- 4° in den Linkszustand gebracht, wie es oben in Verstimmungen
zählt oder Zeichen ohne Unterschei- bindung mit Beispiel 1 beschrieben worden ist. Wenn
dungskraft speichert (im vorliegenden Beispiel ILL) ein »Zeichen« in dem gelesenen Wort numerisch ist,
zusammen mit einem »Egal«-Symbol, so daß die gelangt ein Signal durch die ODER-Schaltung 78
Zeichenvergleichsschaltung bei Anlegen eines »Egal«- hindurch und bringt das FF 72 in den Rechtszustand,
Symbols keine Nichtübereinstimmung anzeigt. Das 45 wodurch die UND-Schaltung 76 erregt wird. Nach
heißt, die »Egal«-Signale können verwendet werden, dem Einlesen des ganzen Wortes schaltet das »Einum
die entsprechenden Zeichenvergleichseinheiten gabe-beendet«-Signal auf Leitung 184 (F i g. 2 d) das
vollständig zu umgehen und eine Übereinstimmung FF38 (Fig. 2d) in den Rechtszustand, und dessen
anzuzeigen. Ausgangssignal wird durch die monostabile Kipp-
Selbst mit diesen sich aufdrängenden Erweiterun- 5° schaltung 80 in einen Impuls umgewandelt. Dieser
gen ist das System nicht imstande, eine Eingangs- Impuls schaltet über die UND-Schaltung 76
Zeichenfolge, wie z.B. RRID, unter den gültigen (Fig. 2a) das FF82 (Fig. 2d) in den Linkszustand.
Wörtern ARID und RAID herauszuerkennen, da Dadurch wird das Tätigwerden des Wörterbuches
jedes gültige Wort sich von der Eingangszeichenfolge verhindert und eine Gruppe von mehrfachen UND-
durch nur ein Zeichen unterscheidet und das Zei- 55 Schaltungen20 erregt, von denen eine in Fig. 2d
chen nicht in die »Egak-Klasse fällt. Es sind noch gezeigt ist. Diese UND-Schaltungen leiten das
weitere offensichtliche Erweiterungen möglich, die »Wort« im Register 56 (Fig. 2a) direkt zur ODER-
das System in den Stand setzen, eine Auswahl zu Schaltung 18 (Fig. 2g) und dann zur Ausgabevor-
treflen. Die Zeichenerkennungsmaschine kann Stabi- richtung weiter. Der durch die UND-Schaltung 76
litäts- (oder Wahrscheinlichkeits-) Daten liefern, die 60 (Fig. 2a) gelangte Impuls wird außerdem durch die
auf die beim Erkennen der Zeichen auftretende ODER-Schaltung 158 (F i g. 2 d) hindurch als »Neh-
Schwierigkeit hinweisen, und diese Wahrscheinlich- men«-Signal der Ausgabevorrichtung zugeführt,
keiten können multipliziert werden, wobei das
keiten können multipliziert werden, wobei das
höchste Produkt das beste Wort darstellt. Zum Bei- Patentansprüche:
spiel kann die Zeichenleseeinrichtung anzeigen, daß 65
in der Zeichenfolge RRID die Wahrscheinlichkeit, 1. Verfahren zum Erkennen von redundanten
daß das erste Zeichen ein R ist, gleich 0,5 ist und die Zeichenkombinationen (Wörtern), bei welchem
Wahrscheinlichkeit, daß es ein A ist, gleich 0,35 ist Wörter, deren Zeichen nicht eindeutig erkannt
worden sind, mit gespeicherten Bezugswörtem verglichen werden, dadurch gekennzeichnet,
daß die Wörter dadurch in Wörter mit geringerer Redundanz umgewandelt werden, daß
ähnlichen Zeichen ein gemeinsames Codesignal 5 zugeordnet wird, daß durch die Codesignale der
Wörter mit geringerer Redundanz Speicherplätze adressiert werden, die die zugeordneten Bezugswörter enthalten, daß die eingegebenen Wörter
mit den zugeordneten Bezugswörtem verglichen werden und daß das übereinstimmende Bezugswort oder bei fehlender Übereinstimmung sämtliche
zugeordneten Bezugswörter oder das Bezugswort mit den meisten übereinstimmenden Zeichen der Ausgabevorrichtung zugeleitet wird/
werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß mit der Weiterleitung des Bezugswortes
bzw. der Bezugswörter an die Ausgabevorrichtung die volle Übereinstimmung bzw. der Übereinstimmungsgrad angezeigt wird.
3. Anordnung zur Durchführung des Verfahrens nach den Ansprüchen 1 und 2, dadurch
gekennzeichnet, daß ein Eingangsregister (2) für die Einspeicherung der eingegebenen Wörter
über eine Codierschaltung (6) für Wörter mit geringerer Redundanz mit einer die Bezugswörter
enthaltenden Speichervorrichtung (8) verbunden ist, daß ein Ausgangsregister (10) für die Übernahme
von Bezugswörtem aus der Speichervorrichtung (8) und eine Vergleichsschaltung (14)
zum Vergleich der im Eingangsregister (2) eingespeicherten Wörter mit den im Ausgangsregister
(10) eingespeicherten Bezugswörtern vorgesehen ist, daß eine Ausgabevorrichtung (17)
über logische Schaltungen (16,18) mit dem Ausgangsregister
(10) verbunden ist.
4. Anordnung nach Anspruch 3, dadurch gekennzeichnet, daß logische Schaltungen (18, 20)
zur direkten Übertragung numerischer Daten vom Eingangsregister (2) zum Ausgangsregister (10)
vorgesehen, sind.
5. Anordnung nach Anspruch 3 oder 4, dadurch gekennzeichnet, daß die Speichervorrichtung
(8) aus einer Anzahl von Speichereinheiten (96) besteht, die der Anzahl der Zeichen der
Wörter mit geringerer Redundanz entspricht, und daß die Speichereinheiten jeweils die Bezugswörter
enthalten, die mit dem der Speichereinheit zugeordneten Zeichen beginnen.
In Betracht gezogene Druckschriften:
IBM Technical Disclosure Bulletin, Vol. 4, Nr. 10, März 1962, S. 15.
IBM Technical Disclosure Bulletin, Vol. 4, Nr. 10, März 1962, S. 15.
Hierzu 4 Blatt Zeichnungen
609 589/125 7.66 © Bundesdruckerei Berlin
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US327916A US3273130A (en) | 1963-12-04 | 1963-12-04 | Applied sequence identification device |
Publications (1)
Publication Number | Publication Date |
---|---|
DE1221042B true DE1221042B (de) | 1966-07-14 |
Family
ID=23278638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DEJ26971A Pending DE1221042B (de) | 1963-12-04 | 1964-11-25 | Verfahren und Anordnung zum Erkennen von Zeichenkombinationen |
Country Status (4)
Country | Link |
---|---|
US (1) | US3273130A (de) |
AT (1) | AT250709B (de) |
DE (1) | DE1221042B (de) |
GB (1) | GB1028288A (de) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USRE26429E (en) * | 1964-12-08 | 1968-08-06 | Information retrieval system and method | |
US3408631A (en) * | 1966-03-28 | 1968-10-29 | Ibm | Record search system |
US3469241A (en) * | 1966-05-02 | 1969-09-23 | Gen Electric | Data processing apparatus providing contiguous addressing for noncontiguous storage |
US3422403A (en) * | 1966-12-07 | 1969-01-14 | Webb James E | Data compression system |
US3492653A (en) * | 1967-09-08 | 1970-01-27 | Ibm | Statistical error reduction in character recognition systems |
US3656178A (en) * | 1969-09-15 | 1972-04-11 | Research Corp | Data compression and decompression system |
JPS5729745B2 (de) * | 1974-09-25 | 1982-06-24 | ||
JPS5970593A (ja) * | 1982-10-15 | 1984-04-21 | Canon Inc | 文書処理装置 |
US4553261A (en) * | 1983-05-31 | 1985-11-12 | Horst Froessl | Document and data handling and retrieval system |
-
1963
- 1963-12-04 US US327916A patent/US3273130A/en not_active Expired - Lifetime
-
1964
- 1964-11-25 DE DEJ26971A patent/DE1221042B/de active Pending
- 1964-11-25 AT AT997264A patent/AT250709B/de active
- 1964-11-26 GB GB48029/64A patent/GB1028288A/en not_active Expired
Non-Patent Citations (1)
Title |
---|
None * |
Also Published As
Publication number | Publication date |
---|---|
US3273130A (en) | 1966-09-13 |
GB1028288A (en) | 1966-05-04 |
AT250709B (de) | 1966-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2946857C2 (de) | Wortspeichergerät | |
DE3135483C2 (de) | Verfahren und Schaltungsanordnung zur Erkennung einer alphanumerischen Eingangszeichenkette | |
DE10342594B4 (de) | Verfahren und System zum Erfassen von Daten aus mehreren maschinell lesbaren Dokumenten | |
DE2541204C3 (de) | Einrichtung zur Fehlerkorrektur | |
DE2755875C2 (de) | ||
DE3042508C2 (de) | Elektronisches Sprachübersetzungsgerät | |
DE2640537A1 (de) | Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen | |
DE3545125C2 (de) | ||
DE2822522A1 (de) | Datenverarbeitungsanlage, die das geheimnis vertraulicher informationen schuetzt | |
DE3034509A1 (de) | Elektronisches uebersetzungsgeraet | |
DE3034510C2 (de) | Elektronisches Übersetzungsgerät | |
DE2435889B2 (de) | Verfahren und einrichtung zur unterscheidung von zeichengruppen | |
DE1221042B (de) | Verfahren und Anordnung zum Erkennen von Zeichenkombinationen | |
DE2005806C3 (de) | Datenspeicherungs- und Sichtvorrichtung | |
DE1213651B (de) | Verfahren und Anordnung zur Identifizierung von Informationen | |
DE2939919A1 (de) | Anordnung zum codieren von ideographischen zeichen | |
DE2654815A1 (de) | Verfahren zur unterscheidung von gross- und kleinbuchstaben | |
DE1212758B (de) | Verfahren und Schaltungsanordnung zur maschinellen Erkennung von Schriftzeichen | |
DE1474163A1 (de) | Anordnung zur Fehlerermittlung mit Korrektureinrichtung fuer Schriftzeichenlesegeraete u.dgl. | |
DE1260532B (de) | Speicher mit Kenn-Wert-Aufruf | |
DE1250165B (de) | Verfahren und Anordnung zum maschinellen Erkennen von Zeichen | |
DE4210109C2 (de) | Sortiervorrichtung zum Sortieren von Daten und Sortierverfahren | |
DE102014105218A1 (de) | Suchvorrichtung mit Verwendung von endlichen Automaten für Teilworte | |
DE1205743B (de) | Verfahren und Vorrichtung zur maschinellen Zeichenerkennung | |
DE1562051B2 (de) | Schaltungsanordnung zur erzeugung einer eindeutigen gruppe von m x n bits |