DE1221042B - Verfahren und Anordnung zum Erkennen von Zeichenkombinationen - Google Patents

Verfahren und Anordnung zum Erkennen von Zeichenkombinationen

Info

Publication number
DE1221042B
DE1221042B DEJ26971A DEJ0026971A DE1221042B DE 1221042 B DE1221042 B DE 1221042B DE J26971 A DEJ26971 A DE J26971A DE J0026971 A DEJ0026971 A DE J0026971A DE 1221042 B DE1221042 B DE 1221042B
Authority
DE
Germany
Prior art keywords
word
words
circuit
character
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DEJ26971A
Other languages
English (en)
Inventor
Herbert Bernard Baskin
Raymond Eugene Bonner
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE1221042B publication Critical patent/DE1221042B/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Description

BUNDESREPUBLIK DEUTSCHLAND
DEUTSCHES
PATENTAMT
AUSLEGESCHRIFT
Int. CL:
GO6k
Deutsche Kl.: 43 a - 41/03'
Nummer: 1 221 042
Aktenzeichen: J 26971IX c/43 a
Anmeldetag: 25. November 1964
Auslegetag: 14. Juli 1966
V1 ßM
2 9. 12.65
Die Erfindung betrifft ein Verfahren und eine Anordnung zum Erkennen von redundanten Zeichenkombinationen, wie z. B. geschriebenen Wörtern.
Es ist oft notwendig, Daten aus einer zur Verfügung stehenden Form in eine für die automatische Verarbeitung, z. B. in Rechenmaschinen und Sprachübersetzungsanlagen, gebräuchliche Form umzuwandeln. Diese Daten liegen meist in schriftlicher Form vor, können aber auch z. B. als gesprochene Wörter zur Verfügung stehen. Die benötigte Umwandlung mußte bisher mit größter Sorgfalt durch handbediente Eingabevorrichtungen durchgeführt werden. Es sind in letzter Zeit viele Versuche unternommen worden, diese Tätigkeit zu automatisieren, insbesondere in Verbindung mit Zeichenerkennungsvorrichtungen, die die Eingabeinformationen von bedruckten oder beschriebenen Unterlagen ablesen und in einen für Maschinen brauchbaren Code umwandeln. Obwohl die automatischen Zeichenerkennungsmaschinen wesentlich schneller arbeiten als der Mensch, so sind diese Maschinen doch nicht in der Lage, Fehler in den Unterlagen zu erkennen. Zusätzliche Fehler werden manchmal durch die Erkennungsmaschinen hervorgerufen, wenn die Zeichen verschmutzt, schlecht ausgerichtet oder in sonstiger Hinsicht fehlerhaft sind und wenn das Aufzeichnungsmaterial selber von schlechter Qualität, verschmutzt, beschädigt usw. ist. Der Mensch ist dagegen im allgemeinen in der Lage, solche Fehler zu erkennen, besonders wenn es sich um Wortfolgen oder Sätze handelt. Wenn z. B. in einem Satz das Wort »ZOLI« vorkommt, kann aus dem Inhalt des Satzes erkannt werden, daß es sich um das Wort »ZOLL« handelt, und der Fehler kann dann korrigiert werden.
Die Erfindung macht Gebrauch von der einer Sprache anhaftenden Redundanz, um eine automatische Fehlerkorrektur durchzuführen. Nur ein sehr kleiner Prozentsatz der verfügbaren Anzahl von Buchstabenfolgen bildet gültige Wörter. Die englische Sprache besitzt insgesamt etwa 500 000 Wörter, und nur ein sehr geringer Teil davon bildet Wörter mit fünf Buchstaben, obwohl theoretisch aus fünf Buchstaben mehr als 10 Millionen (265) mögliche Kombinationen aus sechsundzwanzig Buchstaben des Alphabets gebildet werden können.
Es wurde gefunden, daß eine große Anzahl Fehler und Zurückweisungen bei Lesemaschinen ihre Ursache in leicht verwechslungsfähigen Buchstaben haben, z. B. »H« und »N«. Diese Buchstaben können leicht verwechselt werden, wenn der Verbindungssteg zwischen den beiden senkrechten Schriftzeichenteilen unsauber geführt ist. Viele Wörter können
Verfahren und Anordnung zum Erkennen
von Zeichenkombinationen
Anmelder:
International Business Machines Corporation,
Armonk,N.Y. (V. St. A.)
Vertreter:
Dipl.-Ing. H. E. Böhmer, Patentanwalt,
Böblingen, Sindelfinger Str. 49
Als Erfinder benannt:
Herbert Bernard Baskin, Mohegan Lake, N. Y.;
Raymond Eugene Bonner, Yorktown Heights,
N. Y. (V. St. A.)
Beanspruchte Priorität:
V. St. v. Amerika vom 4. Dezember 1963
(327 916)
ohne Unterscheidung dieser beiden Buchstaben erkannt werden. Als Beispiel sei das Wort »SCHNEE« (»SCNNEE« und »SCHHEE») genannt. In der vorliegenden Erfindung werden verwechslungsfähige Buchstaben nicht voneinander unterschieden, ausgenommen in den seltenen Fällen, wo die Unterscheidung benötigt wird, um Zweideutigkeiten zu vermeiden. Eine Zweideutigkeit, die eine Unterscheidung zwischen den Buchstaben »H« und »N« erforderlich macht, liegt z. B. bei den Wörtern »KAHN« und »KANN« vor. In diesem Fall ist die Wiedergabe von K, A, H oder N, H oder N zweideutig, und die Erkennungsschaltung muß in diesem Fall die relativ schwierige Unterscheidung zwischen »H« und »N« durchführen.
Durch das IBM Technical Disclosure Bulletin, Vol. 4, Nr. 10, März 1962, S. 15 ist bereits ein Verfahren bekannt, welches die Redundanz dazu ausnutzt, Wörter auch dann noch zu erkennen, wenn ein oder mehrere Zeichen eines Wortes nicht richtig erkannt oder von der Erkennungsvorrichtung zurückgewiesen worden sind. Bei diesem Verfahren werden nacheinander die wahrscheinlichsten Zeichenkombinationen mit Bezugswörtern verglichen.
609 589/125
Das erfindungsgemäße Verfahren benutzt ebenfalls das Prinzip des Vergleichs mit Bezugswörtern. Die Erfindung gibt hierzu eine technische Lösung an. Beim erfindungsgemäßen Verfahren werden die Wörter, die leicht verwechselbare Zeichen enthalten, derart in Wörter geringerer Redundanz umgewandelt, daß leicht verwechselbaren Zeichen ein gemeinsames Codesignal zugeordnet wird. Die Codesignale der Wörter mit geringerer Redundanz bilden die Adressen eines Speichers, in dem die Bezugswörter gespeichert sind.
Die Erfindung betrifft ein Verfahren zum Erkennen von redundanten Zeichenkombinationen (Wörtern), bei welchem Wörter, deren Zeichen nicht eindeutig erkannt worden sind, mit gespeicherten Bezugs-Wörtern verglichen werden.
Gekennzeichnet ist die Erfindung dadurch, daß die Wörter dadurch in Wörter mit geringerer Redundanz umgewandelt werden, daß ähnliche Zeichen ein gemeinsames Codesignal zugeordnet wird, daß durch die Codesignale der Wörter mit geringerer Redundanz Speicherplätze adressiert werden, die die zugeordneten Bezugswörter enthalten, daß die eingegebenen Wörter mit den zugeordneten Bezugswörtern verglichen werden und daß das übereinstimmende Bezugswort oder bei fehlender Übereinstimmung sämtliche zugeordneten Bezugswörter oder das Bezugswort mit den meisten übereinstimmenden Zeichen der Ausgabevorrichtung zugeleitet wird/werden.
Vorteilhafterweise wird mit der Weiterbildung des Bezugswortes bzw. der Bezugswörter an die Ausgabevorrichtung die volle Übereinstimmung bzw. der Übereinstimmungsgrad angezeigt. Weitere Merkmale der Erfindung sind in den Unteransprüchen enthalten.
Das Verfahren und eine Anordnung zur Durchführung des Verfahrens wird nunmehr an Hand der Zeichnungen beschrieben. Es zeigt
F i g. 1 ein Blockschaltbild der Anordnung gemäß der Erfindung,
Fig. 2a bis 2h Einzelblockschaltbilder der An-Ordnung gemäß F i g. 1 und
F i g. 3 ein ausführliches Blockschaltbild des Vergleichers in F i g. 2 e.
Wie F i g. 1 zeigt, werden die Ausgangssignale einer Zeichenerkennungsmaschine 1 in ein Eingangsregister 2 eingeführt. Nach beendeter Worteingabe wird die Maschine durch ein Signal informiert und nimmt keine weiteren Leseoperationen vor, bis das Wort erkannt ist. Eine Steuerschaltung 4 verarbeitet alle Signale, die für die zeitliche Steuerung des Systems nötig sind. Das im Eingangsregister gespeicherte Wort (Eingangssymbolkombmation mit größerer Redundanz) wird dann zu einer Codierschaltung 6 übertragen, in der es in den kompakten Satz von Codesymbolen (Symbolkombinationen mit geringerer Redundanz) umgewandelt wird. Jedes Symbol des codierten Satzes entspricht einem oder mehreren Symbolen in der ursprünglichen (konventionellen) Darstellung. Jedes ursprüngliche Symbol wird in ein bestimmtes Codesymbol übersetzt, wobei jedoch für die Symbole jedes Verwechslungssatzes nur ein einzelnes Codesymbol verwendet wird.
Verwechslungssätze sind: A und R; D und O; F und P; H und N; I, L und T, und die nachstehende Tabelle führt die jedem Zeichen entsprechenden Codesymbole auf. Daneben sind noch der »6-Bit-Code«, der »Lochkartencode« und der »l-aus-20-Code« angegeben.
Zeichen B 6-Bit-Code
A 8 4 2
1 Loch
karten
code
l-aus-20-
Code
Kompakt
code
A
R
1
1
10 0 0
0 10 0
1
1
12-1
11-9
1 00001
B 1 10 0 1 0 12-2 2 00010
C 1 10 0 1 1 12-3 3 00011
D
0
1
1
10 10
0 0 11
0
0
12-4
11-6
4 00100
E 1 10 10 1 12-5 5 00101
F
P
1
1
10 11
0 0 11
0
1
12-6
11-7
6 00110
G 1 10 11 1 12-7 7 00111
H
N
1
1
110 0
0 0 10
0
1
12-8
11-5
8 01000
I 1 110 0 1 12-9
L 1 0 0 0 1 1 11-3 9 01001
T 0 10 0 1 1 0-3
J 1 0 0 0 0 1 11-1 10 01010
K 1 0 0 0 1 0 11-2 11 01011
M 1 0 0 10 0 11-4 12 01100
Q 1 0 10 0 0 11-8 13 01101
S 0 10 0 1 0 0-2 14 OHIO
U 0 10 10 0 0-4 15 01111
V 0 10 10 1 0-5 16 10000
W 0 10 11 0 0-6 17 10001
X 0 10 11 1 0-7 18 10010
Y 0 110 0 0 0-8 19 10011
Z 0 110 0 1 0-9 20 10100
0 0 0 10 1 0 0
1 0 0 0 0 0 1 1
9 0 0 0 1
0 0 0 1
η 9
3 U
0
0 0 10 U
1
Δ
3
4 0 0 0 10 0 4
5 0 0 0 11 1 5
6 0 0 0 11 0 6
7 0 oioo 1 7
8 0 0 10 0 0 8
9 0 1 9
Gemäß F i g. 1 werden die Ausgangssignale dei Codierschaltung einem Magnettrommel-Wörterbuch £ als Eingangssignale zugeführt, wo das Codewort mil den nach demselben Kompaktcode gespeicherten Bezugswörtern verglichen wird. Mit Hilfe des linker Symbols des Codewortes wird ein Teil des Wörterbuchs ausgewählt (entweder ein Abschnitt eine) Trommel oder eine von mehreren Trommeln). De] Rest des Codewortes dient zum Suchen innerhalb des ausgewählten Teils des Wörterbuchs.
Wenn das durchsuchte Feld des Wörterbuchs dem zugeführten Codewort entspricht, wird das Bezugswort bzw. werden die Bezugswörter (in echter, unverschlüsselter Form), die dem Codewort entsprechen, aus dem Wörterbuch in ein Ausgangsregister 10 übertragen. Dieses Register enthält mehrere Speicherplätze, von denen jeder groß genug ist, um ein Wori maximaler Länge aufzunehmen. Wenn nur ein echtes Wort dem Codewort entspricht (wie bei dem vorgenannten Beispiel für »SCHNEE«), wird nur ein Wort dem Ausgangsregister 10 zugeführt, und dei größere Teil des Registers bleibt leer. Wenn zwei oder mehr Wörter dem Codewort entsprechen (wie bei dem obengenannten Beispiel »KANN« und »KAHN«), werden alle entsprechenden Wörter in das .Ausgangsregister 10 eingeführt. Jetzt veranlaß!
die Steuerschaltung 4, daß die nichtverschlüsselten Daten im ersten Feld (Wort) des Ausgangsregisters 10 über einen Nulldetektor 12 einer Vergleichsschaltung 14 zugeführt werden. Das nicht verschlüsselte Wort im Eingangsregister 2 wird Buchstabe für Buchstabe mit dem ersten Wort im Ausgangsregister 10 verglichen, und bei einer vollständigen Übereinstimmung wird ein Signal über die Steuerschaltung 4 zu einer UND-Schaltung 16 übertragen, die ihrerseits dieses Wort über eine ODER-Schaltung 18 einer Ausgabevorrichtung 17 zuleitet. Wenn keine vollkommene Übereinstimmung erlangt wird, wird die Operation für die in den übrigen Feldern des Ausgangsregisters gespeicherten Wörter wiederholt (ein Wort zu einer Zeit). Nach Vergleich aller Wörter ohne Erlangung einer vollkommenen Übereinstimmung wird ein Signal aus dem Nulldetektor 12 zur Steuerschaltung 4 geschickt, und alle im Ausgangsregister 10 gespeicherten Wörter werden der Ausgabevorrichtung 17 zugeführt. Meistens befindet sich jedoch nur ein Wort im Ausgangsregister 10, und daher wird der Ausgabevorrichtung 17 nur ein Wort zugeleitet. Im weniger üblichen Fall werden zwei oder mehr Wörter zur Ausgabevorrichtung übertragen. Das geschieht nur, wenn Buchstaben in zwei oder mehr Verwechslungssätzen im gleichen Wort enthalten sind und kein Bezugswort genau mit dem Wort im Eingangsregister übereinstimmt. Als Beispiel dafür wird (s. vorstehende Tabelle), wenn die Zeichenerkennungsmaschine das Wort ARID als RRID liest, die Codesymbolfolge 00001, 00001, 01001, 00100 erzeugt. Das Wörterbuch weist auf zwei Möglichkeiten hin, nämlich ARID und RAID, die beide nicht genau mit RRID übereinstimmen. In diesem Falle werden sowohl ARID als auch RAID der Ausgabevorrichtung zugeführt, und das richtige Wort muß vom Benutzer ausgewählt werden.
Wenn das Eingangsregister numerische Daten enthält, wird die ganze Operation umgangen, da die Steuereinheit eine UND-Schaltung 20 wirksam macht, die die numerischen Daten direkt der Ausgabevorrichtung über die ODER-Schaltung 18 zuführt.
Die Wirkungsweise des Verfahrens wird im einzelnen in Verbindung mit bestimmten Beispielen für die verschiedenen Situationen, die auftreten können, beschrieben.
Das erste Beispiel betrifft den eindeutigen Fall, dargestellt durch das Wort DIG, das so verschlüsselt ist: 00100, 01001, 00111. Alle anderen Zeichenkombinationen mit dieser Codedarstellung sind ungültige Wörter, nämlich DLG, DTB, OIG, OLG und OTG. In diesem ersten Beispielsfall speichert das Wörterbuch nur das Wort DIG an der durch 00100, 01001, 00111 bezeichneten Adresse, und da dieses Wort genau mit dem Eingangswort übereinstimmt, wird es der Ausgabevorrichtung zugeführt.
Das zweite Beispiel ist der Fall, daß die Zeichenerkennungsmaschine eine Buchstabenfolge erzeugt, die genau mit der ersten von mehreren im Wörterbuch gespeicherten Möglichkeiten übereinstimmt. In diesem Beispielsfall wird von der Zeichenerkennungsmaschine das Wort FILL gebildet und dafür der Code 00110, 01001, 01001, 01001 erzeugt. Von den vielen Buchstabenfolgen, die diesem Code entsprechen, sind nur FILL und PILL gültige Wörter, und das Wörterbuch enthält diese beiden Wörter in alphabetischer Reihenfolge an der angegebenen Adresse. Da das erste der gespeicherten Wörter mit dem Eingangswort übereinstimmt, ist es das einzige Wort, das verglichen werden muß, bevor es der Ausgabevorrichtung zugeführt wird.
Das dritte Beispiel gleicht dem zweiten mit der Ausnahme, daß das zweite der gespeicherten Wörter genau mit der von der Zeichenerkennungsmaschine gebildeten Buchstabenfolge übereinstimmt (PILL im vorstehenden Beispiel). In diesem Falle ist das Ergebnis des ersten Vergleichs eine Nichtübereinstimmung,
ίο und es sind zwei Vergleiche nötig.
Das vierte Beispiel gleicht dem zweiten und dem dritten Beispiel mit der Ausnahme, daß die Ausgangssignale des Erkennungssystems (FILL) mit keinem der gespeicherten Wörter (FILL und PILL) genau übereinstimmt. Daher versagen beide Vergleiche, und beide gespeicherten Wörter werden der Ausgabevorrichtung zugeleitet.
Im fünften Beispielsfall liefert das Zeichenerkennungssystem numerische Daten, und das Wörterbuch, die Vergleichsschaltung usw. sind nicht nötig, da die numerischen Daten der Ausgabevorrichtung direkt zugeführt werden.
Beispiel 1
In diesem Fall liest die Zeichenerkennungsmaschine das Wort DIG richtig und führt dieses Wort in das Eingangsregister 2 ein (F i g. 1).
Gemäß F i g. 1 wird das Wort (DIG) vom Eingangsregister 2 aus der Codierschaltung 6 zugeführt und dort in den Kompaktcode übersetzt (00100, 01001, 00111). Im bevorzugten Ausführungsbeispiel werden zwanzig Magnettrommeln im Wörterbuch verwendet, und jede Trommel enthält alle Codewörter (und ihre Übersetzungen), die mit einem der zwanzig Codesymbole beginnen. Das heißt, die Trommel 1 enthält alle mit A oder R (Code 00001) beginnenden Wörter, Trommel 2 enthält alle mit B (Codewort 00010) beginnenden Wörter usf. Im vorliegenden Fall wird mit Hilfe des ersten Codesymbols
(00100) die Trommel 4 im Wörterbuch ausgewählt. Mit den übrigen Codesymbolen (01001, 00111) werden die auf dieser ausgewählten Trommel gespeicherten Daten adressiert. Wenn diese Adresse gefunden ist, ist das einzige gültige Wort DIG zugänglich, und dieses Wort wird in das Ausgangsregister 10 eingegeben. Dies ist das einzige gültige Wort, das dem Kompaktcode entspricht. Dann wird das Wort DIG aus dem Register 10 zur Ausgabevorrichtung übertragen. Nach erfolgter Übertragung wird die Zeichenerkennungsmaschine durch ein Signal angewiesen, das nächste Wort zu lesen.
Entsprechend den detaillierten Diagrammen von Fig. 2 werden mehrere bistabile Kippschaltungen verwendet. Sie werden in der Beschreibung und den Zeichnungen mit den Buchstaben FF (Flip-Flop) bezeichnet. Bevor nun die Wirkungsweise des Systems beschrieben wird, soll der Anfangszustand dieser Vorrichtungen untersucht werden.
Vor der Operation wird ein Schalter 22 (Fig. 2d) kurz gedrückt. Dieser Schalter sendet ein Rückstellsignal zu mehreren bistabilen Kippschaltungen (FF) wie folgt: Über die ODER-Schaltung 24 wird das FF 26 in den Linkszustand gebracht, über die ODER-Schaltung 28 gelangen die FF 30 und 32 in den Linkszustand, über die ODER-Schaltungen 34 und 36 wird das FF 38 in den Linkszustand gebracht, und über die ODER-Schaltungen 34 und 40 gelangen die FF 42 und 44 in den Rechtszustand. Außerdem stellt
dieses Signal über die ODER-Schaltungen 34, 40 und 46 die Ringzähler 48 (Fig. 2d) und 49 (Fig. 2h) zurück, so daß sie Ausgangssignale auf ihren »1«- Leitungen erzeugen.
Wenn die Ausgabevorrichtung das Aufzeichnen eines Wortes abgeschlossen hat, wird ein »Auslesenbeendet«-Signal -auf Leitung 182 über die ODER-Schaltung 28 (Fig. 2d), die UND-Schaltung 50 und die ODER-Schaltung 36 dem FF 38 zugeführt und bringt sie in den Linkszustand. (Im ersten Betriebsumlauf geschieht dies durch den Schalter 22, wie oben erläutert.) Ein auf Leitung 52 erzeugtes »Eingäbe«-Signal wird als »Lochen-erfolgt«-Signal der Zeichenerkennungsmaschine zugeführt. Durch dieses Signal wird die Zeichenerkennungsmaschine veranlaßt, das nächste Wort zeichenweise zu lesen.
Im vorliegenden Beispiel ist das erste von der Zeichenerkennungsmaschine gelesene Zeichen ein D, und es entsteht ein Signal am Ausgang der Maschine. Dieses Signal wird über eine der Leitungen 54 (Fig. 2a) in das »Zeichen-1«-Feld eines Registers56 eingegeben. Das geschieht mittels eines Ringzählers 58, der vorher durch ein »Leerschritte-Signal aus der Zeichenerkennungsmaschine rückgestellt wird und ein Signal an seinem »1 «-Ausgang auf Leitung 60 liefert, das eine mehrfache UND-Schaltung 62 erregt. (Diese besteht aus einer Gruppe herkömmlicher UND-Schaltungen, die durch ein gemeinsames Signal erregt werden.) Diese UND-Schaltungen leiten die Signale aus einer Gruppe von ODER-Schaltungen 64 weiter, welche eine Codeumwandlung in einen 6-Bit-Code gemäß der vorstehenden Tabelle bewirken. Da ein D gelesen wird, werden Signale von den B, A, Έ, 4, 2 und T entsprechenden ODER-Schaltungen erzeugt, und der Wert 110100 wird in das Zeichen-1-Feld eines Registers 56 eingeführt. Infolge der Verwendung einer Echt- und Komplement-Bitstruktur ist es unnötig, das Register 56 vor der Eingabe eines Wortes zu löschen.
Kurz nach der Eingabe des D in diese Anordnung erzeugt die Zeichenerkennungsmaschine ein Zeichenendesignal (Xc), das den Ringzähler 58 in die Stellung 2 weiterschiebt und dadurch eine mehrfache UND-Schaltung 66 erregt, so daß diese das nächste Zeichen in die zweite Stelle des Registers 56 leitet. Die Zeichenerkennungsmaschine liest dann die folgenden Zeichen I und G, die in den 6-Bit-Code übersetzt und in die zweite und die dritte Stelle des Registers 56 eingeführt werden. Nach dem Lesen des Zeichens G erzeugt die Zeichenerkennungsmaschine ein »Leerschritt«-Signal, durch das der Ringzähler 58 als Vorbereitung für das nächste Eingangswort in seine »1 «-Stellung rückgestellt wird. Dieses Signal aus der Zeichenerkennungsmaschine wird außerdem^ als »Eingabe-beendet«-Signal über die Leitung 184 dem FF 38 zugeführt und bringt es in den Rechtszustand.
Während der Eingabe der Zeichen aus der Zeichenerkennüngsmaschine in das Register 56 (F i g. 2 a) wird bestimmt, um welchen Zeichentyp es sich handelt. Wenn das Wort ganz alphabetisch ist, werden das Wörterbuch und die zugeordneten Schaltungen verwendet, aber wenn irgendein Zeichen numerisch ist, werden diese Schaltungen umgangen, und das Eingangswort wird direkt der Ausgabevorrichtung zugeleitet. Durch die ursprüngliche Einstellung des FF38 (Fig. 2d) in den Linkszustand gelangt über die Leitung 52 ein Eingabesignal zu einer monostabilen Kippschaltung MK 70 (F i g. 2 a), die einen Impuls erzeugt. Dieser Impuls bringt ein FF 72 in den Linkszustand, wodurch eine UND-Schaltung 74 erregt und eine andere UND-Schaltung 76 gesperrt werden. Wenn irgendein Zeichen im Eingangswort numerisch ist, erzeugt eine ODER-Schaltung 78 ein Signal, das das FF 72 in den Rechtszustand schaltet und dadurch die Signale zu den UND-Schaltungen 74 und 76 umkehrt (UND-Schaltung 74 wird gesperrt
ίο und UND-Schaltung 76 erregt). Wie schon beschrieben, wird, wenn das Eingangswort vollständig in das Register 56 eingegeben ist, das FF38 (Fig. 2d) in den Rechtszustand geschaltet. Dieses erzeugt ein Signal, das eine monostabile Kippschaltung 80 anstößt. Diese wiederum sendet einen Ausgangsimpuls zu den UND-Schaltungen 74 und 76 (F i g. 2 a). Wenn das eingegebene Wort ganz alphabetisch ist, wird der Impuls von der UND-Schaltung 74 durchgelassen; wenn irgendein Zeichen darin numerisch ist, wird der
zo Impuls von der UND-Schaltung 76 durchgelassen. Die Ausgangssignale dieser UND-Schaltungen steuern den Zustand eines FF 82., das in den Rechtszustand gelangt, für alphabetische Zeichen und in den Linkszustand für numerische. Im vorliegenden Beispielsfall werden alphabetische Daten zugeführt, so daß die rechte Seite des FF 82 ein Ausgangssignal erzeugt, das über einen Kondensator 84 (Fig. 2e) einem FF 86 zugeführt wird, das dadurch in den Linkszustand gelangt. Die Funktion dieser Schaltung wird weiter unten beschrieben.
Jedes Zeichen wird bei seinem Erscheinen im Eingangsregister 56 (F i g. 2 a) durch die Codierschaltung 6 (Fig. 2b) in den Kompaktcode übersetzt. Der 6-Bit-Code im Register 56 wird zunächst in den Lochkartencode, dann in einen l-aus-20-Code und danach in den 5-Bit-Kompaktcode umgewandelt. Die vorstehende Tabelle zeigt die Übereinstimmung zwischen den verschiedenen Systemen. Zwanzig Symbole des Kompaktcodes genügen zur Darstellung der sechsundzwanzig alphabetischen Zeichen, weil die Verwechslungssätze in Einzelsymbole im Kompaktcode umgewandelt werden.
Jedem Feld des Registers 56 ist eine Codierschaltung zugeordnet. Eine solche Codierschaltung ist in Fig. 2b dargestellt; sie ist mit dem »Zeichen-1«- FeId verbunden. Da dieser Teil des Registers in diesem Fall ein D enthält, wird er durch die Codierschaltung über die in Fig. 2b dick gezeichneten Signalpfade in 00100 übersetzt. Die vorstehende Tabelle zeigt, daß in dem Kompaktcode sowohl das D als auch das O durch 001000 dargestellt werden. Hätte die Maschine O statt D gelesen, würde das O die Codierschaltung steuern, wie es die dicken gestrichelten Linien erkennen lassen. Die Codierschaltung besteht aus mehreren herkömmlichen passiven logischen Schaltungen (UND-Schaltungen, ODER-Schaltungen und Invertern, dargestellt durch die Symbole /\, V bzw. I).
Die aus der oberen Zeile der UND-Schaltungen 88 kommenden Leitungen enthalten Signale, die das Zeichen im Lochkartencode darstellen, die Signale auf den Leitungen in Kabel 90 stellen das Zeichen im l-aus-20-Code dar, und die Signale auf den Leitungen im Kabel 92 stellen das Zeichen im Kompaktcode dar. Die Signalpfade (dicke undi gestrichelte Linien) treffen am Ausgang der ODER-Schaltung 94 zusammen (im l-aus-20-Code), und ein Signal 00100 für D und O erscheint am Ausgang der Codier-
9 10
schaltung. Ebensolche Codierschaltungen, die der Register nicht gelöscht zu werden braucht. Wenn bei zweiten und der dritten Stelle des Registers 56 ent- dem Beispiel die Anordnung eine Übereinstimmung sprechen, erzeugen die Codes 01001 bzw. 00111 für für die Codezeichen 01001 und 00111 bestimmt, I und G, wenn diese in das Register eingegeben wird das Wort DIG in Register 110 eingeführt. Nur werden. 5 dieses einzige Wort wird dem Register 110 zuge-
Wenn nun das Wort DIG im Eingangsregister 56 leitet, weil es das einzige gültige Wort ist, das der steht und die verschlüsselten Darstellungen des Wor- Codekombination entspricht.
tes DIG an den Ausgängen der Codierschaltungen 6 Die Vergleichsschaltung 104 (Fig. 2e) ist in
(Fig. 2b) liegen, ist die Anordnung bereit zum Ab- Fig. 3 für ein einzelnes Zeichen genauer dargestellt, fragen des Trommelwörterbuches 8 (Fig. 2e), um io Für die 16-Zeichen-Wörter in dem bevorzugten Ausnach den entsprechenden gültigen Wörtern zu führungsbeispiel sind fünfzehn solche Schaltungen suchen. Zu diesem Zweck wird auf Grund des nötig, je eine für jedes Zeichen mit Ausnahme des ersten Symbols des Codewortes eine von zwanzig ersten Zeichens, das nur für die Auswahl einer Trommeln 96 ausgewählt. Die Ausgangssignale der Trommel benutzt wird. Jedes entsprechende Datenl-aus-20-Codierschaltung (in diesem Falle »4«) wer- 15 element in den Kabeln 92 und 112 wird einer UND-den über ein Kabel 90 einer mehrfachen UND- Schaltung 114 zugeführt (in Echt- und Komplement-Schaltung 98 (Fig. 2e) zugeführt. Es ist also ein form). Wenn die entsprechenden Datenelemente Signal auf der vierten Leitung der zwanzig Leitungen übereinstimmen, erzeugen die UND-Schaltungen 114 im Kabel 90 vorhanden. Die UND-Schaltung wird Ausgangssignale, die durch ODER-Schaltungen 116 durch ein Signal aus dem FF 86 erregt, das im 20 eine andere Gruppe von UND-Schaltungen 118 Linkszustand ist, wie oben erläutert. Die UND- erregen. Ein Signal aus einer Quelle 120 wird von Schaltung 98 leitet das Eingangssignal auf Kabel 90 allen UND-Schaltungen 18 nur dann weitergeleitet, weiter, um die mehrfachen UND-Schaltungen 100 wenn eine genaue Übereinstimmung zwischen den und 102 zu steuern. Es werden nur die UND-Schal- Zeichen vorliegt. Die Übereinstimmungsanzeige auf tungen 100 und 102 erregt, die der Trommel 4 zu- 25 Leitung 106 wird der folgenden Vergleichsschaltung geordnet sind. Diese Trommel wird nun durch die 104 zugeführt und besetzt dort die Spannungsquelle übrigen Codezeichen (01001 und 00111) adressiert 120, so daß alle Vergleichsschaltungen tandemartig (durchsucht). Die auf jeder Trommel gemachten Ein- angeordnet sind, und ein Ausgangssignal wird von tragungen können in beliebiger Reihenfolge, auch in der letzten Vergleichsschaltung der Reihe (auf Leizufälliger Folge, angeordnet sein. Die dem zweiten 30 tung 106) nur dann erzeugt, wenn jedes Zeichen auf bis sechzehnten Zeichen des Eingangswortes ent- Kabel 92 genau mit dem entsprechenden Zeichen auf sprechenden Daten aus den restlichen fünfzehn Kabel 112 übereinstimmt.
Codierschaltungen 6 (des in Fig. 2 b gezeigten Typs) Jetzt vergleicht die Anordnung (auf alphabetischer
werden einer Vergleichsschaltung 104 (Fig. 2e) Basis) das Wort im Ausgangsregister 110 (Fig. 2g) über Kabel 92 zugeführt. Die Vergleichsschaltung 35 mit dem Wort im Eingangsregister 56 (Fig. 2a). Das wird noch an Hand von F i g. 3 genauer beschrieben. Signal, das das FF 86 liefert (F i g. 2 e), wenn die Da das Wort DIG nur drei Zeichen umfaßt, senden Vergleichsschaltung 104 eine Übereinstimmung andie dem vierten bis sechzehnten Zeichen entsprechen- zeigt, wird über einen Kondensator 122 (der das den Codierschaltungen Null-Ausgangssignale zu der Signal in einen Impuls umwandelt), dem FF 42 Vergleichsschaltung. Die Codierschaltung für Zei- 4° (F i g. 2 d) zugeführt und bringt es in den Linkschen 1 des Eingangswortes liefert nur auf Kabel 90 zustand. Das Ausgangssignal des FF 42 erregt einen brauchbare Daten, um die richtige Trommel aus- Impulsgenerator 124, der auf seinen A- und B-Auszuwählen, und die Codierschaltungen für Zeichen 2 gangsleitungen eine Reihe von abwechselnden Taktbis 16 liefern nur auf Kabel 92 brauchbare Daten impulsen erzeugt, wobei als erster ein /i-Impuls entfür Vergleichszwecke. Der andere Eingang der Ver- 45 steht. Die Impulse werden den UND-Schaltungen gleichsschaltung 104 empfängt die Codezeichen für 126 und 128 zugeführt, die durch die FF 26 bzw. 30 das zweite bis sechzehnte Zeichen der Codewörtei gesteuert werden. Die FF 26 und 28 werden zunächst auf Trommel 4, welche alle Codezeichenfolgen für beide durch den Schalter 22 rückgestellt, ■ wie oben die mit D und O beginnenden gültigen Wörter ent- beschrieben ist. Der erste y4-Impuls wird jeder der hält mit Ausnahme des ersten Codesymbols (das 50 sechzehn Zeichenvergleichsschaltungen 14 (von zum Suchen der Trommel verwendet worden ist). denen eine in Fig. 2c gezeigt ist) zugeleitet. Ein Jedes vollständige Trommelwort umfaßt außer den Zeichen des Eingangswortes im Register 56 wird mit Codezeichenfolgen alle entsprechenden gültigen dem entsprechenden Zeichen eines gültigen Wortes Wörter. im Register 110 (F i g. 2 g) in jeder Vergleichseinheit
Nur das Codezeichenfeld wird der Vergleichs- 55 verglichen. Im vorliegenden Beispielsfall wird das schaltung 104 zugeführt. Bei der Drehung der Trom- Zeichen D (im 6-Bit-Code) aus dem Zeichen-1-Feld mel in die richtige Position werden gleiche Daten des Registers 56 zu einer Gruppe von UND-Schalbeiden Eingängen der Vergleichsschaltung zugeführt, tungen 130 in der Vergleichsschaltung 14 (F i g. 2 c) und es entsteht ein Signal auf Leitung 106. Dieses übertragen. Gleichzeitig wird das erste Zeichen im Signal schaltet das FF 88 in den Rechtszustand und 60 ersten Wort (W-I) im Register 110 durch eine mehrtrennt dadurch das Erregungssignal für die UND- fache UND-Schaltung 132 und eine ODER-Schal-Schaltungen 98 ab, so daß die UND-Schaltungen 100 tung 134 über die Nullfeststellschaltung 12 (F i g. 2 f) und 102 gesperrt werden. Während das Codefeld zu den UND-Schaltungen 130 (F i g. 2 c) übertragen, verglichen wird, werden die restlichen die gültigen Als erstes wird das Wort 1 aus dem Register 110 Wörter enthaltenden Felder über die UND-Schaltun- 65 (Fig. 2g) ausgewählt, weil die ihm entsprechende gen 102 und' das Kabel 108 dem Register 110 UND-Schaltung 132 durch ein Signal vom »1«-Aus-(Fig. 2g) zugeführt. Echt- und Komplementbits im gang des Ringzählers 48 (Fig. 2d) erregt ist. Die 6-Bit-Code werden parallel zugeführt, damit dieses den Wörtern 2 bis N entsprechenden UND-Schaltun-
gen 132 (Fig. 2g) werden während dieses ersten Vergleichsumlaufs nicht erregt. Die dicken Linien in F i g. 2 c stellen die Signalpfade dar, wenn, wie im vorliegenden Fall, zwei D verglichen werden. Wenn der Vergleichsschaltung gleiche Daten zugeführt werden, liegt ein Signal an jedem Ausgang einer Gruppe von ODER-Schaltungen 136, wodurch eine Gruppe von UND-Schaltungen 138 erregt wird. Der ^4-Impuls durchläuft diese Folge von UND-Schaltungen und erzeugt das M-(Übereinstimmung-) Signal auf einer Leitung 140. Wenn die Zeichen nicht übereinstimmen, wird! ein Signal von einem oder mehreren Inverternl42 erzeugt und durch eine entsprechende UND-Schaltung 144 zu einer ODER-Schaltung 146 weitergeleitet. Da jedes Zeichen im Eingangswort mit jedem Zeichen in den gespeicherten Wörtern verglichen wird, wird das »Ubereinstimmung«-Signal auf Leitung 140 (statt des ^4-Impulses) den restlichen Vergleichsschaltungen zugeführt, die in Reihe geschaltet sind. Wenn die beiden zugeführten Wörter genau übereinstimmen, liegt ein Signal auf Leitung 140 vor (M). Wenn ein Signal aus· einer beliebigen ODER-Schaltung 146 eine Nichtübereinstimmung anzeigt, erzeugt eine ODER-Schaltung 148 (Fig. 2c) ein »Nichtübereinstimmung«-Signal Ή..
Bei diesem Beispiel für eine vollständige Übereinstimmung mit dem ersten (und einzigen) Wort, das im Wörterbuch für die entsprechende Kampaktcodezeichenfolge gespeichert ist, wird das Übereinstimmungssignal auf Leitung 140 über eine ODER-Schaltung 150 (Fig. 2d) einer UND-Schaltung 152 zugeleitet. Wenn die Nullfeststellschaltung 12 (Fig. 2f) kein Signal auf Leitung 154 erzeugt und damit anzeigt, daß ein Wort in dem abgefühlten Feld des Registers 110 gespeichert ist, erregt ein Inverter 156 (Fig. 2d) durch ein Ausgangssignal die UND-Schaltung 152. Dies ist während des ersten Vergleichsumlaufs stets der Fall, da mindestens ein Wort im Register 110 gespeichert sein muß. Die Nullfeststellschaltung wird bei Beispiel 4 noch genauer erläutert.
Die UND-Schaltung 152 leitet, wenn sie erregt wird, das Übereinstimmungssignal aus der ODER-Schaltung 150 zu einer ODER-Schaltung 158 weiter, die ihrerseits das »Nehmen«-Signal erzeugt, das über eine Leitung 160 den Schaltungen in Fig. 2h zugeführt wird. Dieses Signal zeigt an, daß das System darauf vorbereitet ist, ein Wort zur Ausgabevorrichtung zu übertragen. Außerdem wir das Signal aus der UND-Schaltung 152 einem FF 32 zugeführt und bringt es in den Rechtszustand. Das von dieser bistabilen Kippschaltung erzeugte Ausgangssignal erregt eine UND-Schaltung 16 (Fig. 2g), die das ausgewählte Wort aus dem Register 110 über eine ODER-Schaltung 18 zur Ausgabevorrichtung überträgt.
Außerdem wird das Ausgangssignal der UND-Schaltung 152 (Fig. 2d) den FF26 und 30 zugeführt, um sie in den Rechtszustand zu bringen und aufeinanderfolgende A- und B-Impulse zu sperren, bis die Ausgabevorrichtung das ihr zugeführte Wort übernommen hat. Es wird dann ein »Entnahmebeendet«-Signal aus den Schaltungen von Fig. 2h über die ODER-Schaltung28 (Fig. 2d) dem FF30 zugeleitet und bringt es in den Linkszustand, und außerdem schaltet es über die UND-Schaltung 50 (Fig. 2d) (durch FF44 erregt) und die ODER-Schaltung 36 das FF 38 in den Linkszustand zurück.
Der erste nach dem »Auslesen-beendet«-Signal auftretende 2?-Impuls bringt über die UND-Schaltung 128 und die ODER-Schaltung 24 das FF 26 in den Linkszustand. Außerdem wird dieser 5-Impuls einer UND-Schaltung 162 zugeführt. Das vorhergegangene Übereinstimrnungssignal (M) auf Leitung 140 bringt außerdem ein FF164 in den Rechtszustand, so daß es ein Signal zur Erregung der UND-Schaltung 162 erzeugt. Die UND-Schaltung 162 leitet
ίο daher den ß-Impuls über die ODER-Schaltung 40 zum FF 42 weiter, um es rückzustellen, und über die ODER-Schaltungen 40 und 46 zum Ringzähler 48, der in die »1 «-Stellung rückgestellt wird. Alle Schaltungen sind also nun rückgestellt als Vorbereitung für das nächste Wort aus der Zeichenerkennungsmaschine.
Die Entnahmeschaltungen sind in Fig. 2h im einzelnen dargestellt. Jedes Zeichen in dem ausgewählten Wort aus dem Ausgangsregister wird von der ODER-Schaltung 18 (Fig. 2g) aus UND-Schaltungen 165 (Fig. 2h) zugeleitet. Die Zeichen werden nacheinander durch Ausgangssignale des Ringzählers 49 abgetastet und über eine ODER-Schaltung 167 einer Magnetbandeinheit zugeführt, die im bevorzugten Ausführungsbeispiel als Ausgabeeinheit dient. Der Ringzähler wird zunächst durch ein Signal aus der ODER-Schaltung 46 (F i g. 2 d) über eine ODER-Schaltung 169 rückgestellt. Beim Abtasten des letzten Zeichens in jedem Wort wird das Ausgangssignal des Ringzählers (Abschnitt »16«) über die ODER-Schaltung 169 weitergeleitet, um den Zähler zu löschen. Außerdem "wird dieses Signal als »Auslesen-beendet«-Signal über eine Leitung 182 der ODER-Schaltung 28 (Fig. 2d) zugeführt. Die Schiebeimpulse werden dem Ringzähler 49 (F i g. 2 h) von einem Impulsgenerator 171 über eine UND-Schaltung 173 unter der Steuerung eines FF175 zugeführt. Das FF gelangt in den Linkszustand durch das »Nehmen«-Signal, das auf Leitung 160 erscheint, wenn die Ausgabevorrichtung ein Wort aufnehmen soll. Das FF175 wird rückgestellt durch das »Auslesen-beendet«-Signal auf Leitung 182 (Fig. 2h), nachdem das Wort der Ausgabevorrichtung zugeführt worden ist. Die UND-Schaltung 173 läßt daher zur entsprechenden Zeit Schiebeimpulse durch, die den Ringzähler 49 durch einen Arbeitsumlauf hindurchschieben, wenn ein Wort entnommen und in die Ausgabevorrichtung übertragen werden soll.
Beispiel 2
In diesem Fall wird1 die Wirkungsweise des Systems analysiert, wenn die Zeichenerkennungsmaschine eine Buchstabenfolge richtig erkennt, die genau mit dem ersten von zwei gültigen Wörtern, welche im Trommelwörterbuch gespeichert sind, übereinstimmt. In diesem Beispielsfall wird das Wort FILL in die Codesymbolfolge 00110, 01001, 01001, 01001 umgewandelt (s. Tabelle). Das erste Symbol (00110) wählt die Trommel 6 aus, und die nachfolgenden Symbole adressieren diese Trommel. Hier sind zwei gültige Wörter, nämlich FILL und PILL, an der ausgewählten Adresse gespeichert. Das System veranlaßt den Vergleich von FILL mit der zugeführten Zeichenfolge, und es wird eine vollständige Übereinstimmung erzielt. Daher wird das Wort FILL der Ausgabevorrichtung zugeführt. In diesem Beispiel arbeitet das System genauso, wie es für Beispiel 1 beschrieben worden ist, nur werden
zwei Wörter aus dem Trommelwörterbuch zum Ausgaberegister übertragen. Da aber das erste Wort eine vollkommene Übereinstimmung ergibt, wird der Betrieb des Systems durch das zweite Wort nicht beeinflußt.
Beispiel 3
Dieses Beispiel ist eine Erweiterung des Beispiels 2. Hier wird das Wort PILL richtig von der ZeichenerkerHiungsmaschine geliefert. Das System arbeitet in der für Beispiel 1 beschriebenen Weise, bis das zugefjihrte Wort (PILL) mit dem ersten gespeicherten Wert (FILL) verglichen und ein »Nichtübereinstimmungssignal« ~M aus der ODER-Schaltung 146 (Fig. 2c) angezeigt wird. In diesem Falle liegt kein Übereinstimmungssignal M auf Leitung 140, und daher ist die UND-Schaltung 152 (Fig. 2d) gesperrt. Das erste gespeicherte Wort (FILL) kann daher der Aufgabevorrichtung nicht zugeführt werden, weil das FF 32 im Linkszustand bleibt und kein Erregungssignal auf seiner Ausgangsleitung 166 zu den UND-Schaltungen 16 (Fig. 2g) gelangt.
Das Nichtübereinstimmungssignal M bringt das FF 164 (F i g. 2 d) in den Linkszustand und sendet ein Erregungssignal zu einer UND-Schaltung 168, wodurch bewirkt wird, daß der nachfolgende B-Impuls des Impulsgenerators 124 aus der UND-Schaltung 128 den Ringzähler 48 in seine zweite Stellung schiebt. Wenn also das erste Wort Wl im Register 110 (Fig. 2g) nicht mit den Daten im Register 56 (F i g. 2 a) übereinstimmt, wird das zweite Wort W 2 im Register 110 der Zeichenvergleichsschaltung 14 (Fig. 2c) zugeführt. In diesem Fall stimmt das zweite Wort (PILL) genau mit den Eingangsdaten . überein, und durch den nächsten A-Impuls wird ein Übereinstimmungssignal M auf Leitung 140 erzeugt. Dieses Signal steuert über die ODER-Schaltung 150 und die UND-Schaltung 152 das FF 32 so, daß das zweite Wort im Register 110 in die Ausgabevorrichtung übertragen wird.
Beispiel 4
Dies ist eine Erweiterung der Beispiele 2 und 3, aber es wird nun angenommen, daß die Zeichenerkennungsmaschine die ungültige Buchstabenfolge FILL erzeugt hat. Das System arbeitet in der für Beispiel 3 beschriebenen Weise, nur stimmt weder das erste noch das zweite Wort (FILL und PILL) im Register 110 mit der Eingangsbuchstabenfolge überein. In diesem Fall überträgt das System beide so Wörter FILL und PILL zur Ausgabevorrichtung. Es werden Nichtübereinstimmungssignale Ή von der Zeichenvergleichsschaltung 14 erzeugt, wenn ihr das erste und das zweite Wort aus dem Register 110 zugeleitet werden. Jedes dieser Nichtübereinstimmungssignale schiebt den Ringzähler 48 weiter, so daß er in die dritte Stellung gelangt, und die Daten aus dem dritten Feld des Registers 110 werden der Zeichenvergleichsschaltung 14 zugeführt. Da jedoch nur zwei gültige Wörter im Trommelwörterbuch stehen, ist das dritte Feldes im Register 110 (F i g. 2 g) leer. Die Nullfeststellschaltung 12 (F i g. 2f) fühlt dies ab und erzeugt ein Signal auf Leitung 154. Die Nullfeststellschaltung enthält sechzehn Abschnitte, je einen für jedes Zeichen in dem Wort maximaler Länge. Jeder Abschnitt (in Fig. 2f sind drei dargestellt) enthält sechs UND-Schaltungen 170, die jede auf ein »O«-Bit in dem zugeführten 6-Bit-Wort ansprechen. Ein Signal wird aus einer Quelle 172 durch alle UND-Schaltungen 170 hindurchgeleitet, wenn alle durch »O«-Bits erregt sind. Wenn irgendein Bit in dem zugeführten Wort nicht gleich »0« ist, wird dieses Signal gesperrt. Es erscheint also nur dann ein Signal auf der Ausgangsleitung 154, wenn das der Nullfeststellschaltung zugeführte Wort lauter Nullen enthält (d. h., wenn das Wort nicht vorhanden ist).
Das Signal, das die Nullfeststellschaltung auf Leitung 154 abgibt, wenn das dritte Feld des Registers 110 (Fig. 2g) abgefragt wird (im vorliegenden Fall, wo nur zwei Felder des Registers 110 Wörter enthalten), wird über den Inverter 156 (Fig. 2d) weitergeleitet und sperrt die UND-Schaltung 152. Außerdem erregt dieses Signal zwei UND-Schaltungen 174 und 176. Der erste A-Impuls, der auftritt, nachdem der Ringzähler 48 in die dritte Stellung weitergeschoben worden ist (was zu einer .B-Impulszeit erfolgt ist), wird auch der UND-Schaltung 174 zugeführt. Das dritte Eingangssignal für diese UND-Schaltung (von der linken Seite des FF 44) liegt jedoch nicht vor, und daher bleibt die Schaltung gesperrt. Der nächste B-Impuls wird der UND-Schaltung 176 (die erregt worden ist) zugeführt, und es entsteht ein Ausgangssignal, das das FF 44 in den Linkszustand bringt. Das daraufhin vom FF 44 erzeugte Ausgangssignal erregt die UND-Schaltung 178, so daß aufeinanderfolgende A -Impulse zur ODER-Schaltung 150 weitergeleitet werden. Diese ^4-Impulse ersetzen die der ODER-Schaltung 150 zugeführten Übereinstimmungssignale, um die Entnahme von Wörtern aus dem Register 110 und ihre Übertragung zur Ausgabevorrichtung selbst dann zu ermöglichen, wenn diese Wörter nicht mit dem zugeführten Wort übereinstimmen. Das Ausgangssignal von der linken Seite des FF 44 (F i g. 2 d) wird außerdem durch einen Kondensator 180 in einen Impuls umgewandelt und stellt über die ODER-Schaltung 46 den Ringzähler 48 in die erste Stellung zurück. Jetzt ist das System darauf vorbereitet, alle im Register 110 gespeicherten Wörter zur Ausgabevorrichtung zu übertragen, weil kein Wort genau mit dem angelegten Wort im Register 56 übereinstimmt.
Der nächste A-Impuls bewirkt, daß das erste Wort im Register 110 der Ausgabevorrichtung zugeführt wird, da die UND-Schaltung 152 (Fig. 2d) durch das Fehlen eines Ausgangssignals der Nullfeststellschaltung zu diesem Zeitpunkt erregt ist. Das Ausgangssignal der UND-Schaltung 152 schaltet außerdem die FF 26, 30 und 32 in den Rechtszustand, um zu verhindern, daß A- und B-Impulse durch die UND-Schaltung 126 und 128 gelangen, während das erste Wort aus dem Register 110 zur Ausgabeschaltung übertragen wird. Bei Beendigung dieser Operation stellt das »Auslesen-beendet«-Signal auf Leitung 182 (Fig. 2d) die FF30 und 32 in den Linkszustand zurück (ohne das FF 26 zu beeinflussen). Der folgende B-Impuls aus dem Impulsgenerator 124 wird von der UND-Schaltung 128 und der UND-Schaltung 168 (die durch das Signal von der linken Seite des FF 164 infolge der Nichtübereinstimmung erregt ist) durchgelassen, um den Ringzähler 48 in die zweite Stellung zu schieben. Außerdem bringt dieser B-Impuls über die ODER-Schaltung 24 das FF 26 in den Linkszustand, damit der folgende A -Impuls von der UND-Schaltung 126 durchgelassen und über die UND-Schaltung 178 und dann durch

Claims (1)

15 16
die ODER-Schaltung 150 übertragen werden kann, (knappe Entscheidung), während die Wahrscheinlich-
um die Entnahme des zweiten Wortes im Register keit, daß das zweite Zeichen ein R ist, gleich 0,8
110 und seine Übertragung zur Ausgabevorrichtung und die Wahrscheinlichkeit, daß es ein A ist, gleich
einzuleiten. 0,1 ist (deutliche Unterscheidung). In diesem Falle
Dieser Umlauf wird wiederholt, bis alle Wörter 5 ist die Wahrscheinlichkeit, daß die Zeichenfolge
im Register 110 zur Ausgabevorrichtung gelangt RRID dem Wort ARID entspricht, hoch (0,35 · 0,8)
sind. Im vorliegenden Fall werden der Ausgabevor- und die Wahrscheinlichkeit, daß sie dem Wort RAID
richtung zwei Wörter (FILL und PILL) zugeführt. entspricht, gering (0,5-0,1). Es wird daher ARID
Nach der Entnahme aller gültigen Wörter erzeugt die für die Weiterleitung zur Ausgabevorrichtung aus-
Nullfeststellschalturig 12 (Fig. 2f) ein Signal auf io gewählt. Eine weitere verwendbare Wahrscheinlich-
Leitung 154, um die UND-Schaltung 152 (F i g. 2 d) keit steht in Beziehung zur Auftrittshäufigkeit der
zu sperren. Dieses Signal wird auch der UND- verschiedenen Zeichen in der Sprache. Wenn das
Schaltung 174 zugeführt (die durch das FF 44 er- Auftreten von A wahrscheinlicher ist als das von R,
regt ist), und diese läßt den nächsten B-Impuls können knappe Entscheidungen durch die Zeichen-
durch, um das System rückzustellen. Das Ausgangs- 15 erkennungsmaschine zum A hin beeinflußt werden,
signal der UND-Schaltung 174 stellt zurück: das Das heißt, bei den vorgenannten Wahrscheinlichkei-
FF 38 (über die ODER-Schaltung 34 und 36), den ten kann das erste Zeichen richtig als A gelesen
Ringzähler 48 (über die ODER-Schaltungen 34, 40 werden, ohne einen Fehler beim Lesen des zweiten
und 46) und die FF 42 und 44 (über die ODER- Zeichens einzuführen, indem A statt R immer dann
Schaltungen 34 und 40). Die Rückstellung des FF 42 20 gewählt wird, wenn das Unterscheidungsverhältnis
verhindert, daß der Impulsgenerator 124 arbeitet. unter einem konstanten· Wert (z. B. 2) liegt. Außer-
Die FF 30 und 32 sind vorher durch das letzte »Aus- dem kann das Wörterbuch die relative Wahrschein-
lesen-beendet«-Signal in den Linkszustand gebracht lichkeit des Auftretens der gültigen Wörter speichern,
worden, und der folgende 5-Impuls hat das FF 26 Wenn z. B. das Wort ARID in der Sprache häufiger
in den Linkszustand geschaltet. 25 auftritt als das Wort RAID, kann ARID gewählt
Das System läßt sich natürlich dahingehend ver- werden, wenn eine Zweideutigkeit besteht. Natürlich
ändern, daß eins der gültigen Wörter auf der Grund- kann jede beliebige Kombination der vorgenannten
lage verschiedener Entscheidungskriterien ausgewählt Kriterien verwendet werden, um die Worterkennung
wird. Als einfaches Beispiel dafür kann das gültige zu verbessern.
Wort mit der höchsten Zahl von übereinstimmenden 3° Auf Wunsch können auch alle Wörter der Aus-Zeichen ausgewählt werden. Im Beispielsfall 4 gabevorrichtung zusammen mit einem Hinweis auf stimmt das Eingangswort FLLL und FILL bei nur das wahrscheinlichste Wort zugeführt werden,
einem Fehlerzeichen überein, während seine Über- _ . . . ,
einstimmung mit PILL zwei Fehlerzeichen enthält. Beispiel 5
Daher kann FILL als beste Übereinstimmung aus- 35 In diesem Fall wird die Wirkung von numerischen gewählt werden, da tatsächlich das ILL in FILL und oder alphanumerischen »Wörtern« in dem Betrieb PILL nichts zur Unterscheidung beiträgt; nur das des Systems beschrieben.
erste Zeichen ist informativ. Das System kann auch Bevor ein Wort aus der Zeichenerkennungsdahingehend abgeändert werden, daß es diese Ent- maschine übertragen wird, wird das FF72 (Fig. 2a) scheidung trifft, indem es entweder Nichtüberein- 4° in den Linkszustand gebracht, wie es oben in Verstimmungen zählt oder Zeichen ohne Unterschei- bindung mit Beispiel 1 beschrieben worden ist. Wenn dungskraft speichert (im vorliegenden Beispiel ILL) ein »Zeichen« in dem gelesenen Wort numerisch ist, zusammen mit einem »Egal«-Symbol, so daß die gelangt ein Signal durch die ODER-Schaltung 78 Zeichenvergleichsschaltung bei Anlegen eines »Egal«- hindurch und bringt das FF 72 in den Rechtszustand, Symbols keine Nichtübereinstimmung anzeigt. Das 45 wodurch die UND-Schaltung 76 erregt wird. Nach heißt, die »Egal«-Signale können verwendet werden, dem Einlesen des ganzen Wortes schaltet das »Einum die entsprechenden Zeichenvergleichseinheiten gabe-beendet«-Signal auf Leitung 184 (F i g. 2 d) das vollständig zu umgehen und eine Übereinstimmung FF38 (Fig. 2d) in den Rechtszustand, und dessen anzuzeigen. Ausgangssignal wird durch die monostabile Kipp-
Selbst mit diesen sich aufdrängenden Erweiterun- 5° schaltung 80 in einen Impuls umgewandelt. Dieser
gen ist das System nicht imstande, eine Eingangs- Impuls schaltet über die UND-Schaltung 76
Zeichenfolge, wie z.B. RRID, unter den gültigen (Fig. 2a) das FF82 (Fig. 2d) in den Linkszustand.
Wörtern ARID und RAID herauszuerkennen, da Dadurch wird das Tätigwerden des Wörterbuches
jedes gültige Wort sich von der Eingangszeichenfolge verhindert und eine Gruppe von mehrfachen UND-
durch nur ein Zeichen unterscheidet und das Zei- 55 Schaltungen20 erregt, von denen eine in Fig. 2d
chen nicht in die »Egak-Klasse fällt. Es sind noch gezeigt ist. Diese UND-Schaltungen leiten das
weitere offensichtliche Erweiterungen möglich, die »Wort« im Register 56 (Fig. 2a) direkt zur ODER-
das System in den Stand setzen, eine Auswahl zu Schaltung 18 (Fig. 2g) und dann zur Ausgabevor-
treflen. Die Zeichenerkennungsmaschine kann Stabi- richtung weiter. Der durch die UND-Schaltung 76
litäts- (oder Wahrscheinlichkeits-) Daten liefern, die 60 (Fig. 2a) gelangte Impuls wird außerdem durch die
auf die beim Erkennen der Zeichen auftretende ODER-Schaltung 158 (F i g. 2 d) hindurch als »Neh-
Schwierigkeit hinweisen, und diese Wahrscheinlich- men«-Signal der Ausgabevorrichtung zugeführt,
keiten können multipliziert werden, wobei das
höchste Produkt das beste Wort darstellt. Zum Bei- Patentansprüche:
spiel kann die Zeichenleseeinrichtung anzeigen, daß 65
in der Zeichenfolge RRID die Wahrscheinlichkeit, 1. Verfahren zum Erkennen von redundanten
daß das erste Zeichen ein R ist, gleich 0,5 ist und die Zeichenkombinationen (Wörtern), bei welchem
Wahrscheinlichkeit, daß es ein A ist, gleich 0,35 ist Wörter, deren Zeichen nicht eindeutig erkannt
worden sind, mit gespeicherten Bezugswörtem verglichen werden, dadurch gekennzeichnet, daß die Wörter dadurch in Wörter mit geringerer Redundanz umgewandelt werden, daß ähnlichen Zeichen ein gemeinsames Codesignal 5 zugeordnet wird, daß durch die Codesignale der Wörter mit geringerer Redundanz Speicherplätze adressiert werden, die die zugeordneten Bezugswörter enthalten, daß die eingegebenen Wörter mit den zugeordneten Bezugswörtem verglichen werden und daß das übereinstimmende Bezugswort oder bei fehlender Übereinstimmung sämtliche zugeordneten Bezugswörter oder das Bezugswort mit den meisten übereinstimmenden Zeichen der Ausgabevorrichtung zugeleitet wird/ werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß mit der Weiterleitung des Bezugswortes bzw. der Bezugswörter an die Ausgabevorrichtung die volle Übereinstimmung bzw. der Übereinstimmungsgrad angezeigt wird.
3. Anordnung zur Durchführung des Verfahrens nach den Ansprüchen 1 und 2, dadurch gekennzeichnet, daß ein Eingangsregister (2) für die Einspeicherung der eingegebenen Wörter über eine Codierschaltung (6) für Wörter mit geringerer Redundanz mit einer die Bezugswörter
enthaltenden Speichervorrichtung (8) verbunden ist, daß ein Ausgangsregister (10) für die Übernahme von Bezugswörtem aus der Speichervorrichtung (8) und eine Vergleichsschaltung (14) zum Vergleich der im Eingangsregister (2) eingespeicherten Wörter mit den im Ausgangsregister (10) eingespeicherten Bezugswörtern vorgesehen ist, daß eine Ausgabevorrichtung (17) über logische Schaltungen (16,18) mit dem Ausgangsregister (10) verbunden ist.
4. Anordnung nach Anspruch 3, dadurch gekennzeichnet, daß logische Schaltungen (18, 20) zur direkten Übertragung numerischer Daten vom Eingangsregister (2) zum Ausgangsregister (10) vorgesehen, sind.
5. Anordnung nach Anspruch 3 oder 4, dadurch gekennzeichnet, daß die Speichervorrichtung (8) aus einer Anzahl von Speichereinheiten (96) besteht, die der Anzahl der Zeichen der Wörter mit geringerer Redundanz entspricht, und daß die Speichereinheiten jeweils die Bezugswörter enthalten, die mit dem der Speichereinheit zugeordneten Zeichen beginnen.
In Betracht gezogene Druckschriften:
IBM Technical Disclosure Bulletin, Vol. 4, Nr. 10, März 1962, S. 15.
Hierzu 4 Blatt Zeichnungen
609 589/125 7.66 © Bundesdruckerei Berlin
DEJ26971A 1963-12-04 1964-11-25 Verfahren und Anordnung zum Erkennen von Zeichenkombinationen Pending DE1221042B (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US327916A US3273130A (en) 1963-12-04 1963-12-04 Applied sequence identification device

Publications (1)

Publication Number Publication Date
DE1221042B true DE1221042B (de) 1966-07-14

Family

ID=23278638

Family Applications (1)

Application Number Title Priority Date Filing Date
DEJ26971A Pending DE1221042B (de) 1963-12-04 1964-11-25 Verfahren und Anordnung zum Erkennen von Zeichenkombinationen

Country Status (4)

Country Link
US (1) US3273130A (de)
AT (1) AT250709B (de)
DE (1) DE1221042B (de)
GB (1) GB1028288A (de)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE26429E (en) * 1964-12-08 1968-08-06 Information retrieval system and method
US3408631A (en) * 1966-03-28 1968-10-29 Ibm Record search system
US3469241A (en) * 1966-05-02 1969-09-23 Gen Electric Data processing apparatus providing contiguous addressing for noncontiguous storage
US3422403A (en) * 1966-12-07 1969-01-14 Webb James E Data compression system
US3492653A (en) * 1967-09-08 1970-01-27 Ibm Statistical error reduction in character recognition systems
US3656178A (en) * 1969-09-15 1972-04-11 Research Corp Data compression and decompression system
JPS5729745B2 (de) * 1974-09-25 1982-06-24
JPS5970593A (ja) * 1982-10-15 1984-04-21 Canon Inc 文書処理装置
US4553261A (en) * 1983-05-31 1985-11-12 Horst Froessl Document and data handling and retrieval system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
None *

Also Published As

Publication number Publication date
US3273130A (en) 1966-09-13
GB1028288A (en) 1966-05-04
AT250709B (de) 1966-11-25

Similar Documents

Publication Publication Date Title
DE2946857C2 (de) Wortspeichergerät
DE3135483C2 (de) Verfahren und Schaltungsanordnung zur Erkennung einer alphanumerischen Eingangszeichenkette
DE10342594B4 (de) Verfahren und System zum Erfassen von Daten aus mehreren maschinell lesbaren Dokumenten
DE2541204C3 (de) Einrichtung zur Fehlerkorrektur
DE2755875C2 (de)
DE3042508C2 (de) Elektronisches Sprachübersetzungsgerät
DE2640537A1 (de) Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen
DE3545125C2 (de)
DE2822522A1 (de) Datenverarbeitungsanlage, die das geheimnis vertraulicher informationen schuetzt
DE3034509A1 (de) Elektronisches uebersetzungsgeraet
DE3034510C2 (de) Elektronisches Übersetzungsgerät
DE2435889B2 (de) Verfahren und einrichtung zur unterscheidung von zeichengruppen
DE1221042B (de) Verfahren und Anordnung zum Erkennen von Zeichenkombinationen
DE2005806C3 (de) Datenspeicherungs- und Sichtvorrichtung
DE1213651B (de) Verfahren und Anordnung zur Identifizierung von Informationen
DE2939919A1 (de) Anordnung zum codieren von ideographischen zeichen
DE2654815A1 (de) Verfahren zur unterscheidung von gross- und kleinbuchstaben
DE1212758B (de) Verfahren und Schaltungsanordnung zur maschinellen Erkennung von Schriftzeichen
DE1474163A1 (de) Anordnung zur Fehlerermittlung mit Korrektureinrichtung fuer Schriftzeichenlesegeraete u.dgl.
DE1260532B (de) Speicher mit Kenn-Wert-Aufruf
DE1250165B (de) Verfahren und Anordnung zum maschinellen Erkennen von Zeichen
DE4210109C2 (de) Sortiervorrichtung zum Sortieren von Daten und Sortierverfahren
DE102014105218A1 (de) Suchvorrichtung mit Verwendung von endlichen Automaten für Teilworte
DE1205743B (de) Verfahren und Vorrichtung zur maschinellen Zeichenerkennung
DE1562051B2 (de) Schaltungsanordnung zur erzeugung einer eindeutigen gruppe von m x n bits