DE1953451A1

DE1953451A1 - Verfahren und Vorrichtung zur maschinellen Zeichenerkennung

Info

Publication number: DE1953451A1
Application number: DE19691953451
Authority: DE
Inventors: Alexandre Dubinsky; Winchester Titman Peter James
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1968-10-23
Filing date: 1969-10-23
Publication date: 1970-06-04
Also published as: US3626381A; DE1953451B2; GB1230834A; FR2021332A1; CA944081A; DE1953451C3

Description

22. Oktober 1969 Docket UE 968 005 Dr.Schie/E

Anmelderin: International Business Machines Corporation, Armonk, N. X. 10504 (V. St. A.)

Vertreter: Patentanwalt Dr.-Ing. Rudolf Schiering, 703 Böblingen/Württ., Westerwaldweg 4-

Verfahren und Vorrichtung zur maschinellen Zeichenerkennung

Die Erfindung "betrifft ein Verfahren und eine Vorrichtung zur maschinellen Zeichenerkennung, und zwar zum Erkennen einer Zeichenform, wenn die Zeichenform durch einen Satz von d Mnären symmetrischen Zahlen, das heißt von Zahlen dargestellt ist, welche nur die Werte 1 oder - 1 haben können.

Das Problem der Erkennung einer Zeichenform, welche durch einen Zahlensatz repräsentiert ist, ist das Problem der Zuordnung des Zahlensatzes zu einer Klasse, welche alle Zahlensätze enthält, die das gleiche Zeichen repräsentieren. Mit anderen Worten ausgedrückt, das Problem der Zuordnung ist im vorliegenden Falle ein Problem der Klassifizierung des Zahlensatzes.

Die Erfindung besteht in einem Verfahren zum Klassifizieren eines Satzes von d binären symmetrischen Zahlen unter

— 2 — 009823/1646

Verwendung mindestens eines assoziativen digitalen Datenspeichers, welcher als Belastung einen assoziativen Speicher mit einer ersten Tabelle enthält und dessen Eingänge Koeffizienten darstellen, welche auf einen Bereich der Werte 1, 0 und -1 beschränkt sind. Im d-Raum sind Ebenen vorhanden, welche den Raum in Raumteile aufteilen, so daß im wesentlichen alle.Punkte desselben Raumteiles binäre, symmetrische Zahlen innerhalb derselben Klasse repräsentieren, womit ein assoziativer Speicher mit einer zweiten Tabelle belastet wird, bei dem jeder Eingang mittels eines Bezeichnungssatzes einen Raumteil bestimmt, welcher vorschreibt, auf welcher Seite jeder in die erste Tabelle eingeschlossenen Ebene sich irgendein Punkt des Raumteiles befindet, welcher mit Hilfe einer ersten Tabellensuch-Operation in der ersten Tabelle bestimmt, auf welcher Seite jeder Ebene der Punkt gelegen ist, welcher den zu klassifizierenden Satz von Zahlen repräsentiert. Das Resultat der ersten Tabellensuch-Operation wird in einer zweiten Tabellensuchijteration in der zweiten Tabelle verwendet, um den Raumteil zu bestimmen, in welchem der erwähnte Punkt liegt, und damit die Klasse zu bestimmen, zu welcher die Zahl gehört.

Größere Speicher werden bekanntlich in Speicherzellen unterteilt, welche meist der Speicherung von jeweils einem Wort dienen. Zur Organisation des Speichers denkt man sich die Speicherzellen entweder in ihrer räumlichen Reihenfolge durchnumeriert oder man kennzeichnet ihre Lage eindeutig durch ganzzahlige Koordinatenwerte. In den bekannten, sogenannten assoziativen Speichern schreibt man in einen Teil jeder Speicherzelle eine unabhänig von der räumlichen Zellenanordnung wählbare Kennung vor (Karl Steinbuch "Taschenbuch der Nachrichtenverarbeitung", Springer Verlag 1962, S.522, S.653).

Durch die britische Patentschrift 985 705 ist bereits ein

- 3 009823/1646

elektronischer Vergleicher zum Vergleichen von Wörtern bekanntgeworden, bei dem eine Anzahl von Speicherelementen nach Zeilen "und Spalten in zwei Dimensionen aufgebaut sind. Die genannte Patentschrift zeigt die Verwendung einer 3-Zustands-Zelle in einer Vergleicheroperation.

Durch die britische Patentschrift 1 098 895 ist ein Zeichenerkennungssystem bekanntgeworden, bei welchem eine Konvertierung von Zeichen aus verschiedenen Klassen in einen entsprechenden digitalen Code stattfindet und bei welchem eine Prüfung dieses Codes auf das Vorhandensein ausgewählter Worte vorgesehen ist, welche eine kürzere Länge aufweisen als die individuellen Codes. Diese Patentschrift beschreibt die Verwendung von Hyperebenen, welche den Zeichenraum in Raumteile aufteilen.

Die Erfindung besteht auch in einer Vorrichtung zur Durchführung des oben beschriebenen Verfahrens.

Die Erfindung sei nachstehend an Hand der Zeichnungen für eine beispielsweise Ausführungsform näher beschrieben.

Fig. 1 ist ein Diagramm, welches zur Erläuterung der Theorie des Verfahrens nach der Erfindung dient.

Fig. 2 ist ein Blockschaltbild eines assoziativen Speichers, der für die Durchführung des Verfahrens nach der Erfindung eingerichtet ist.

Fig. 3 ist eine Detailzeichnung der Steuerschaltung für den in Fig. 2 gezeigten Speicher.

Fig. 4 zeigt zwei typische Bitspeicherzellen des in Fig. 2 gezeigten Speichers.

009823/1646

Fig. 5 enthält ein Schema, das zur Erläuterung der Durchführung des Verfahrens nach der Erfindung gedacht ist.

Es ist an sich bekannt, daß ein Zeichen durch einen geordneten Zahlensatz von d Ziffern dargestellt werden kann. So fällt zum Beispiel das Bild eines Zeichens auf eine rechteckige Fläche von d Photodetektoren. Wenn ein Photodetektor durch das Zeichen maskiert wird, läßt sich der resultierende Zustand des Photodetektors durch die Zahl 1 darstellen. Im anderen Falle laßt sich der resultierende Zustand des Photodetektors durch die Zahl 0 darstellen. Der Zahlensatz (b.), ψ b. = 1 oder 0, i = 1 bis d ist eine Darstellung des Zeichens, welches auf den Photodetektoren abgebildet wird. Bei der Darstellung der Zustände eines Photodetektors durch die binären, symmetrischen Werte 1,-1 gibt es erklärlicherweise im allgemeinen keine Verluste.

Das Problem der Erkennung des Zeichens ist das Problem der Zuordnung einer Ze_*henbeSchreibung, eines Klassennamens. Dieses Problem ist äquivalent der Zuordnung des Zahlensatzes, welcher das Zeichen repräsentiert, zu einer Klasse. Im idealen Falle hat jede Klasse nur ein Glied, so daß ein gegeb^ " Zeichen eine Steigerung auf nur einen Zahlensatz gibt, welcher sofort seiner Klasse zuordbar ist.

In der Praxis gibt es gedoch diesen Idealzustand nicht. Sogar die Zeichen auf einer gedruckten Seite sind wegen der unterschiedlichen Absorption der Tinte in verschiedenen Bereiches des Papieres nicht regelmäßig gedruckt. Das Erkennen von handgeschriebenen Zeichen ist ein Beispiel hierfür. Es ist klar, dass eine einzelne Klasse eine große und unterschiedliche Zahl von Zahlensätzen enthält.

Die Betrachtung des zuletzt erwähnten Anwendungsbeispieles, führt zu dem Ergebnis, daß das Schlüsselproblem der Zeichen-

- 5— 009823/1646

_ 5 —

erkennung in der Bestimmung des Umfanges der Klassen liegt. Dieses Problem ist bisher nur durch Annäherung erreicht oder ziemlich stark umgangen worden, indem man spezielle Schriftformen gestaltet hat, in welchen die Zeichen unterscheidbar sind und zwar auch dann, wenn sie ganz besonders vielseitig sind.

E. M. Braverman hat in einer Veröffentlichung "Experiments in Machine Learning to Recognize Visual Patterns" Automatika i Telemekhanika, Band 23, Heft 3, März 1962, (Übersetzung wurde im September 1962 veröffentlicht), ein algorithmisch.es Verfahren vorgeschlagen, um in lehrenden Automaten visuelle Zeichen zu unterscheiden.

Eine Anzahl von d Ziffern, bzw. ein Zahlensatz aus d Ziffern, soll nachstehend betrachtet werden bei der Identifizierung eines Punktes in einem Raum mit d Dimensionen. Die Maschine ist mit einer Übungsgruppe von Zahlensätzen präsentiert, wobei jeder Zahlensatz einer bekannten Klasse angehört. Ferner sind Hyperebenen, nachstehend als Ebenen bezeichnet, zur Trennung des Raumes in Raumteile gezogen, wobei jeder Raumteil alle (oder praktisch die meisten) jene Punkte enthält, welche derselben Klasse angehören. Am Ende der Ausbildung werden die zu klassifizierenden Zahlensätze in die Maschine gegeben. Durch Bestimmung auf welcher Seite jeder Ebene der Punkt liegt, welcher einen Zahlensatz repräsentiert, kann man finden, in welchem Teil des Raumes der Punkt angeordnet ist. Damit findet man die Klasse zu welcher der Zahlensatz gehört.

Der Braverman-Algorithmus ist von großer Allgemeinheit und hängt erfolgreich nur von der zuverdichtenden Klasse ab. Dies bedeutet, .daß sich nicht zu viele Punkte einer Klasse mit Punkten anderer Klassen vermengen, wodurch das Ziehen von Ebenen mit ausreichend getrennten Klassen genügend verhindert wird. In einem besonderen Falle kann es schwierig

- 6 009823/1646

sein, einen repräsentativen Übungssatz zu bestimmen, was aber die Allgemeinheit der Theorie nicht beeinträchtigte

Die Gleichung einer Ebene, welche durch den Ursprung eines Raumes von d Dimensionen verläuft, ist gegeben durch W₁X₁ + w₂x₂ + + w_dx_d = 0 (1)

Um zwei bekannte Punkte zu trennen, welche verschiedenen Klassen angehören, bildet Braverman d-1 Koeffizienten w^ durch eine Pseudo-Zugriffs-Zahlenfolge und berechnet dann den letzten Koeffizienten.

Man hat gefunden, daß durch Beschränkung des Zahlenfeldes, zu welchem die Koordinaten x. gehören, auf das binäre, symmetrische Feld (-1, 1) (in dem gegebenen Beispiel repräsentiert ein nichtmaskierter Photodetektor den Wert -1) und durch Wahl jeder trennenden Ebene, der art, daß sie vereinbar ist mit allen Punkten, welche äquidistant sind mit den zu trennenden Punkten, die Berechnungen sehr stark vereinfacht werden. Die Zeichenerkennung kann dann durchgeführt werden mit nur zwei Tabellenablese-Operationen an einem assoziativen Speicher.

In der Tat, wenn die beiden Punkte (Y. ) und (y^) sind, dann ist i * 1 bis d und die Gleichung der Ebene, welche alle äquidistanten Punkte zu den beiden Punkten enthält', ist d d

\ 1(T₁- T₁) X₁ - 0

i - 1 i - 1

Es ist klar,dass die Koeffizienten W₁ nur die Werte -1, 0 oder 1 haben können.

Um zu bestimmen, auf welcher Seite der Ebene (1) ein Punkt liegt, werden die Koordinaten des Punktes substituiert um

- 7 -009823/1646

das χ. auf der linken Seite von (1). Das ausgewertete Resultat kann positiv sein oder eine negative Zahl sein oder Null sein. Alle Punkte deren Koordinaten einen Zuwachs ergeben gegenüber den Ergebnissen mit denselben Vorzeichen, liegen auf derselben Seite der Ebene, oder mit anderen Worten, das Vorzeichen des ausgewerteten Resultates zeigt die Seite der Ebene an auf welcher ein Punkt liegt. Infolge der den Koeffizienten x. und'w. auferlegten Beschränkungen schließt der Ansatz jedes Ausdruckes von (1) ein (a) eine Multiplikation von +1 mit +1 oder von -1 mit -1; oder (b) eine Multiplikation von +1 mit -1; oder (c) eine Multiplikation mit Null (w^ =0)·

Die Operation (c) trägt zur Bestimmung des Vorzeichens des Ausdruckes, welcher durch einfaches Zählen der entsprechenden Anzahl von durchzuführenden Operationen (a) und (b) in einfacher Weise gefunden werden kann, nichts bei und vermerkt, welche Zahl die größere ist. Wenn (a) des öfteren erfolgt, ist das Vorzeichen positiv, wenn (b) des öfteren erfolgt, dann ist das Vorzeichen negativ.

Der Ansatz kann in einer Suchoperation gemacht werden, in welcher eine Modifikation des assoziativen Speichers verwendet wird, wie sie zum Beispiel in der noch schwebenden britischen Patentanmeldung 4-54-32/67 beschrieben ist.

Der Speicher ist derart eingerichtet, daß der Grad der Fehl anpassung eines Suraargumentes zum Inhalt eines Registers dargestellt wird durch die Größe des Stromes in einem Fehlanpassungsleiter, der dem Register zugeordnet ist« Die Datenspeicherzellen, welche in den Wortregistern enthalten sind, können drei stabile Zustände annehmen, die mit 1, 0 und X bezeichnet sind. Der X-Zustand ist derart, daß durch eine Zelle im X-Zustand kein Fehlanpassungssignal erzeugt wird, unabhängig vom Abfragesignal. Jeder Befehl

009823/1646

oder jede Stelle des Suchargumentes ist binär und kann zur Bildung eines a 1 Abfragesignales oder eines 0 Abfragesignales führen.

Der Zahlensatz, welcher einen Punkt in dem Raum mit den d Dimensionen repräsentiert, wird als Suchargument behandelt.

Wenn ein Glied des Satzes den Wert 1 hat, dann wird ein 1 Abfragesignal den Wortregistern des Speichers zugeführt.

Wenn ein Glied des Satzes den Wert -1 hat, dann wird ein 0 Abfragesignal den Wortregistern des Speichers zugeführt.

Die Wortregister dienen zum Speichern der Koeffizienten w., des Wertes 1, welcher durch den stabilen Zustand 1 der Datenzellen repräsentiert wird, ferner zur Speicherung des Wertes -1, welcher durch den stabilen Zustand 0 repräsentiert wird, und zur Speicherung des Wertes 0, welcher durch den stabilen Zustand X repräsentiert wird.

In einem ersten Wortregister des Speichers werden die wahren Werte von w^ und in einem zweiten Wortregister die Komplemente von w. gespeichert, womit definiert ist, daß das Komplement von 0 gleich 0 ist, das Komplement von 1 gleich -1 ist und das Komplement von -1 gleich 1 ist. Wenn eine Fehlanpassung zwischen einer Stelle des Suchargumentes und dem Inhalt einer Speicherzelle auftritt, dann ist eine Einheit. des Stromes von der Zelle auf den Fehlanpaßleiter gerichtet· Die Größe des Stromes auf einem Fehlanpaßleiter ist deshalb direkt proportional dem Grade einer Fehlanpassung zwischen einem Suchargument und den Inhalten der Zellen des Wortregisters, welches jenem Fehlanpaßleiter zugeordnet ist. Unter diesen Umständen wird eine Fehlanpaßoperation zwischen einem Zahlensatz (xj), wobei das x. die Werte 1 oder -1 haben kann, und dem ersten Wortregister, welches die wahren Werte von w^ enthält, ein Anwachsen eines Stromes im ersten

- 9 -009823/1646

Wortregister-Fehlanpaßleiter geben., welcher die Anzahl von Operationen repräsentiert, die oben mit (b) bezeichnet sind. Damit ist die Auswertung der linken Seite der Gleichung (1) durchgeführt. Eine Anpaßoperation zwischen dem Zahlensatz (x.) und dem zweiten Wortregister, welches die Komplementwerte enthält, führt zu einem Zuwachs mit einem Strom auf dem zweiten Wortregister-Anpaßleiter. Dieser repräsentiert die Anzahl der Operationen (a) bei der Durchführung der Auswertung der linken Seite der Gleichung (1). Ein Vergleich der Ströme auf den Pehlanpaßleitern gibt dann das Vorzeichen des ausgewerteten Resultates· Wenn der Strom im ersten Wortregister-Fehlanpaßleiter größer ist, ist das Vorzeichen negativ. Wenn die Ströme gleich sind, ist das Resultat der Auswertung gleich NuIl. Damit ist die Gleichung (1) erfüllt unter Einbeziehung der Tatsache, daß der Punkt, welcher durch den Zahlensatz repräsentiert wird, auf der Ebene liegt.

Als Beispiel sei eine Ebene für den 9-Dimensionsraum angenommen:

X₁-X₂-Xz + Xc + Xr₇ - Xg - Xq = 0 (2)

Das erste Wortregister wird die folgenden Eingänge enthalten:

+1 -1 -1 O +10-1 -1

und das zweite Wortregister wird die folgenden Eingänge enthalten:

-1 +1 +10-10 -1 +1 +1

Man nehme den Zahlensatz

(1, -1, -1, I₁ 1, 1, 1, 1, -1, 1) (3)

und passe ihn den Inhalten des ersten und des zweiten Registers an. Die Anzahl von Fehlanpassungen mit dem Inhalt des ersten Registers ist eins. Dies gibt einen Anstieg der Einereinheit des Stromes auf dem ersten Register-Fehlanpaßleiter. Die Anzahl der Fehlanpassungen mit dem Inhalt des zweiten Registers ist sechs. Dies gibt einen Anstieg

-10 -

009823/1646

um sechs Einheiten des Stromes auf dem zweiten Register-Fehlanpaßleiter. Der Punkt im 9-Dimensionsraum, welcher durch den Zahlensatz (3) repräsentiert ist, "befindet sich auf der positiven Seite der Ebene (2), so daß diese ein Glied von jenem Satz von Punkten darstellt, welches einen positiven Wert gibt, wenn deren Koordinaten durch x. auf der linken Seite der Gleichung (2) substituiert werden. Zur Prüfung ergibt die Substituierung des Zahlensatzes (3) auf der linken Seite der Gleichung (2): 1+1+1+1+1+1-1, was positiv ist.

Hat man bestimmt, auf welcher Seite jeder Ebene ein Punkt liegt, dann kann der Raumteil des Raumes, in welchem der Punkt liegt, leicht durch eine einzelne Anpaßoperation gefunden werden. Es ist klar, daß jeder Raumteil durch Auslisten auf welcher Seite von jeder Ebene der Raumteil gelegen ist, jeder Raumteil einheitlich spezifiziert wird» Dieser Fall ist in Figur 1 für einen Raum mit zwei Dimensionen dargestellt, in welchem die Ebenen die Geraden a bis d sind und wobei die Raumteile Flächenbereiche sind. Jede Ebene teilt den Raum in zwei Halbräume, welche auf der positiven bzw. auf der negativen Seite der Geraden liegen.

Wenn ein Raumteil im positiven Halbraum liegt, ist der Raumteil mit 1 bezeichnet. Wenn er im negativen Raumhälftenteil liegt, ist der Raumteil mit 0 bezeichnet. Die Punkte in der Ebene muß man sich in der positiven Raumhälfte angeordnet vorstellen. Die Raumteile sind in Bezug auf jede Ebene gekennzeichnet, wodurch eine einheitliche Spezifizierung jedes Raumteiles entsteht.

In Figur 1 ist der Raumteil ABDE durch den Bezeichnungssatz (1,0,0,1), der Raumteil BGD durch den Bezeichnungssatz (1,1,0,1) spezifiziert. Es folgt daraus, daß durch Vergleich der Resultate der ersten Operation, welche ergab,

- 11 009823/1648

ORIGINAL INSPECTED

- li -

auf welcher Seite von jeder Ebene ein Punkt liegt, mit dem Beschriftungssatz von allen Raumteilen gefunden werden kann, in welchem Raumteil der Punkt liegt und daher gefunden werden kann, zu welcher Klasse der Zahlensatz, welcher durch den Punkt repräsentiert ist, gehört. Dieser Vergleich kann in einem assoziativen Speicher in einem einzigen Anpaßoperationsgang durchgeführt werden.

Nachstehend sei jetzt der assoziative Speicher näher beschrieben, der zur Durchführung des vorstehend beschriebenen Verfahrens vorteilhaft geeignet ist· Der in Figur 2 gezeigte assoziative Speicher 20 enthält ein Eingang/Ausgang-Register 21, ein Maskenregisber 22 und eine Anzahl von Wortspeicherregistern 2$, 24, 25 Jedes Wortregister hat eine Fehlanpaßleitung 26, welche einen Eingang zur Anpaßlogik 27 liefert.

Eine Sammelleitung 28 enthält eine Anzahl von Leitern,über die eine Datenübertragung von oder zum Register 21 vorgesehen ist. Eine Ausgangssammelleitung 29 von der Anpaßlogik 27 ist an die Sammelleitung 28 angeschlossen.

Wie in einem konventionellen assoziativen Speicher werden die Inhalte gewisser Felder des Registers 21 mit den Inhalten derselben Felder der Wortregister 23, 24.... verglichen. Diejenigen Register, welche infolge der Anpaßoperation keinen Strom an die Fehlanpaßleitung 26 abgeben, werden als ausgewählt bezeichnet. Ein WaI "trigger (in Figur 2 nicht besonders dargestellt) bildet einen Teil der Anpaßlogik 27 und ist jedem solchen Register zugeordnet. Er wird eingestellt und markiert dadurch das Register für eine folgende Zugriffsoperation. Die Felder, welche verglichen werden, sind abhängig von der Einstellung des Maskenregisters 22, welches durch nicht besonders dargestellte konventionelle Mittel selektiv einstellbar ist, um irgendeine Stelle des Registers 21 zu

- 12 009823/1646

den Wortregistern zu maskieren. Jedes Wortregister des assoziativen Speichers enthält Speicherzellen 41 (Figur 4), jede zwei stabile Schaltungen enthaltend, so daß vier mögliche stabile Zustände möglich sind, von denen nur drei bei der vorliegenden Anwendung gebraucht werden. Die drei stabilen Zustände sind: binare 1, Doppel-Emitter-Transistor 42 leitend; binäre 0, Doppel-Emitter-Transistor 43 leitend; und X oder "Nichtwarte"-Zustand, kein Doppel-Emitter-3fcansistor leitend. Die Bitleitungen 44 und 45 sind an den Emitter der entsprechenden Transistoren 42 bzw. 43 angeschlossen " und werden beide zur Datenübertragung in die Zelle und aus der Zelle und für den Abfragezustand der Zelle verwendet.

Wenn eine Zelle abgefragt wird, dann sind auf den Bitleitungen Spannungen plaziert, welche einen Steuerstrom auf der Fehlanpaßleitung 26 erzeugen, wenn die Zelle nicht in dem Zustande ist, für welche sie abgefragt ist. Wenn daher die Abfragung eine binäre 1 betrifft, dann wird eine niedere Spannung auf der Bitleitung 44 und eine höhere Spannung auf der Bitleitung 45 gebildet. Wenn die Zelle im 1 Zustand ist, dann fließt im Transistor 42 Strom und die niedere Spannung auf der Leitung 44 zieht diesen Gesamtstrom in die Leitung 44, so daß auf der Leitung 26 kein Strom erscheint.

Wenn die Zelle im O-Zustand ist, dann fließt der Strom im Transistor 43, und die höhere Spannung auf der Leitung 45 steuert den Gesamtstrom zur Fehlanpaßleitung 26. Wenn die Zelle im X-Zustande ist ist keiner der Transistoren 42 und 43 im leitenden Zustande und eine Fehlanpassung kann nicht auftreten.

Da die Zellen 41 in ihrer Konstruktion identisch sind, ist der Betrag des Stromes, der in jedem Transistor 42 bzw. 43 fließt, derselbe. Es folgt daraus, daß der Strom auf der

- 13 009823/1646

Leitung 26 in seiner Starke ein Maß ist für die Anzahl jener Zellen, "bei denen eine Fehlanpassung vorlag.

Figur 3 zeigt den Teil der Anpaßlogik 27, welche einem Paar von Wortregistern 23 und 24 zugeordnet ist. Die Wortregister sind paarweise gruppiert, um eine entsprechende Speicherung der wahren und der komplementären Werte der Koeffizienten einer entsprechenden Ebene zu haben. Jedes Paar ist mit einer Logik ausgerüstet, die identisch ist mit jener bereits beschriebenen, welche einen Ausgangswert zur Sammelleitung 29 liefert.

Die Fehlanpaßleitung 26 des Registers 23 ist mit dem Eingang der beiden Und-Schaltungen 31 und 32 verbunden. In ähnlicher Weise ist die Fehlanpaßleitung 26 des Registers 24 mit den Und-Schaltungen 33 und 34· verbunden. Die anderen Eingänge zu den Und-Schaltungen 31 und 34> sind durch die Leitungen gegeben, welche durch ein Signal 0P2 erregt werden. Die anderen Eingänge zu den Und-Schaltungen 32 und 33 sind Leitungen, welche durch ein Signal OPl erregt werden.

Die Und-Schaltungen 32 und 33 sind nicht einfache logische Und-Schaltungen. Wenn sie jedoch durch das OPl Signal aktiviert werden, dann liefern sie Ausgangswerte, welche analog zu dem Betrag der Ströme auf den entsprechenden Fehlanpaßleitungen 26 sind, mit denen sie verbunden sind.

Die Ausgänge der Und-Schaltungen 31 und 34 werden nach der Inversion durch die Inverter 35 und 37 auf den Satz von Eingängen der Auswahl-Trigger 36 bzw. 38 gegeben. Die Ausgänge der Und-Schaltungen 32 und 33 werden auf entsprechende Eingänge eines Differentialverstärkers 39 übertragen.

Der Ausgang des Verstärkers 39 ist an den Satz Eingänge eines Triggers 40 angeschlossen, dessen Ausgang mit der Sanmel-

- 14 009823/1646

leitung 29 verbunden ist. Die Anordnung des Verstärkers 39 und des Triggers 40 ist derart getroffen, daß bei Signalabgabe durch die Und-Schaltungen 32 und 33 der Strom auf der Fehlanpaßleitung des Registers 23 größer ist als der Strom auf der Fehlanpaßleitung des Registers 24. Dann wird der Ausgang des Verstärkers erregt und der Trigger 40 geschaltet. Der Verstärker 39 ist derart vorgespannt, daß im Falle gleicher Fehlanpaßströme der Trigger 40 zurückgestellt wird. Dies ist äquivalent zu dem Einschließen eines Punktes in eine trennende Ebene im positiven Halbraum, welcher durch die Ebene definiert wird.

Um eine unnötige Komplizierung der Beschreibung zu vermeiden, sind in den Zeichnungen die konventionellen Taktgeberschaltungen und die Vorrichtungen zur Erzeugung der Steuersignale, zum Beispiel der Signale OPl und 0P2, weggelassen. Derartige untergeordnete Schaltungen sind an sich bekannt.

Nachstehend sei die Durchführung des Verfahrens nach der Erfindung mit der Vorrichtung nach den Figuren 2 bis 4 an Hand der Figur 5 näher erläutert. In Figur 5 bezeichnet 51 den Inhalt der Wortregister des assoziativen Speichers 20 nach Figur 2. Mit 52 ist der Inhalt des Registers 21 bei der Operation 1 bezeichnet. 53 ist eine Darstellung der Inhalte des Registers während der Operation 2. Diese Wortregister enthalten 2 Datentabellen. Die Eingänge der Tabelle 1 enthalten eine Tabelle des Erkennungsschlüssels und entsprechende Paare von benachbarten Wortregistern für die Koeffizienten w^ der entsprechenden Ebenen in echter Form und in komplementärer Form.

Es sei daran erinnert, daß jeder Koeffizient die Werte 1, 0 oder -1 annehmen kann, und daß die Zellen des Speichers die mit 1, 0 und X bezeichneten stabilen Zustände besitzen können. Der Wert 1 ist in der Tabelle 1 durch den Zustand 1

- 15 -

009823/1648

dargestellt. Der Wert O ist durch den Zustand X und der Wert -1 durch den Zustand O wiedergegeben. Die !Tabelle 2 enthält drei Felder. Jeder Eingang der Tabelle enthält einen Tabellenerkennungsschlüssel, einen Raumteil-Identifizierer und den Namen des Raumteiles, welcher durch den Identifizierer repräsentiert wird.

Der Raumteil-Identifizierer enthält eine Reihe von binären Zahlen, welche die Position des Raumteiles im Räume relativ zu den Ebenen wiedergeben.

Wenn ein Raumteil auf der positiven (negativen) Seite einer gegebenen Ebene liegt, dann besetzt eine binäre 1 (0) eine gegebene Stelle des Identifizierers.

Das dritte Feld in der Tabelle 2 enthält den Namen von jedem Raumteil. Im Bedarfsfalle ist eine beliebige Zuordnung möglich. Verschiedene Identifizierer können denselben Namen haben, entweder wegen der Anforderungen des Bedieners, der zum Beispiel die Unterscheidung zwischen einem oberen Fall und einem unteren Fall für die Zeichen unbeachtet lassen kann, oder wegen des Übungsprozesses, bei dem sich dieselbe Zeichenklasse in der Darstellung durch Punkte in verschiedenen Raumteilen ergeben hat.

Während der Operation 1 ist das Register mit dem Schlüssel der Tabelle 1 belastet und betrifft den Zahlensatz, welcher das zu erkennende Zeichen repräsentiert. Ein Signal der Operation 1 wird den Und-Schaltnmgen 32, 33 (Figur 3) der Wortregisterpaare aufgeprägt, welche die Tabelle 1 enthalten. Gleichzeitig findet eine Anpaßoperation des gesamten Inhalts des Eingang/Ausgang-Registers mit den Registern des assoziativen Speichers statt. Wie bereits erklärt, wird das Ausmaß der Fehlanpassung zwischen den Inhalten des Eingang/ Ausgang-Registers und der Wortregister durch die Größe der

- 16 009823/1646

Ströme wiedergegeben, welche in den Register-Fehlanpaßleitungen fließen. Die Fehlanpassungen in den Eegisterpaaren der Tabelle 1 werden verglichen in den Different!alverstärkern 39· Wenn die Fehlanpassung im oberen Register 23 (Figur 3) die größere ist, dann wird der Trigger 40 geschaltet, im anderen Falle bleibt er, wie bereits erklärt, im zurückgestellten Zustand. Die Zustände der Trigger werden über die Sammelleitung 29 auf das Eingang/Ausgang-Register zu Beginn der Operation 2 übertragen und zeigen an, auf welcher Seite jeder Ebene der Punkt liegt, welcher durch den Zahlensatz dargestellt wird.

Zu Beginn der Operation 2 ist das Eingang/Ausgang-Register mit dem Schlüssel der Tabelle 2 belastet und mit Hilfe der Sammelleitung 29 mit den Zuständen der Trigger 40. Ein Signal der Operation 2 wird allen Und-Schaltungen 31 und 34 des assoziativen Speichers aufgeprägt, und eine Anpaßoperation wird mit den Inhalten der beiden Felder des Eingang/ Ausgang-Registers und denselben Stellen der Wortregister durchgeführt. Kur die Eingänge der Tabelle 2 werden den Schlüssel der Tabelle 2 anpassen, und nur der Identifizierer des Raumteiles, zu welchem der Punkt gehört, der durch den in der Operation 1 verwendeten Zahlensatz repräsentiert wird, wird das zweite Feld des Eingang/Ausgang-Registers anpassen. Nur ein Register wird einen Fehlanpaßstrom nicht liefern, was zur Folge hat, daß der Trigger 36 (oder 38) geschaltet wird. Um das Register, welches die Inhalte der Suchargumentfelder des Eingang/Ausgang-Registers angepaßt hat, auszuwählen, und um das Namensfeld jenes Registers auf das Eingang/Ausgang-Register zu übertragen, können konventionelle Schaltungen zum Einstellen der Trigger 36 (38) verwendet werden.

Das Ergebnis der Operationen 1 und 2 einschließlich von nur zwei Arbeitszyklen des assoziativen Speichers ist ein Zeichen,

- 17 009823/1646

welches durch einen benannten Zahlensatz repräsentiert ist.

Bei der Beschreibung der Operation ist nichts darüber angegeben worden, wie die Schaltungen 32 und 33 > denen das OPl Signal zuzuführen ist, ausgewählt werden. Eine Methode besteht darin, einen dritten Eingang zu diesen Schaltungen einzuschließen, welcher in Übereinstimmung mit der Einstellung eines manuell kontrollierbaren Schalters erregt wird. Am Ende der Übung wird die Größe der Tabelle 1 dem Bediener beispielsweise durch Ausdrucken der Inhalte des Speichers bekanntgemacht. Der Bediener kann dann eine Schaltereinstellung auswählen, welche nicht zur Erregung der dritten Eingänge der Schaltungen führt, die der Tabelle 2 zugeordnet sind.

Eine andere Methode besteht darin, eine Anpassungsoperation durchzuführen, bei der der Schlüssel der Tabelle 1 am Ende der Übung verwendet wird. Diese wird, dies sei bemerkt, nicht anders direkt verwendet wie ein Suchargument. Die Trigger 36 (38) aller Register, welche die Tabelle 1 enthalten, werden eingestellt und können verwendet werden, um aufeinanderfolgende Anwendung der 0P2 Signale, zum Beispiel durch Einstellung der Tortrigger im 0P2 Signalgenerator zu steuern.

Ein Alternatiwerfahren für die Durchführung der Operation 1 besteht in der Schaffung eines reversiblen Zählers für jedes Paar der Wortregister 23» 24. Die Register der Tabelle 1, welche die echten Werte von w. enthalten, werden von den Registern, welche die Komplementwerte von Wj enthalten durch einen unterschiedlichen Bit in einer Stelle des Schlüssels der Tabelle 1 unterscheidbar gemacht.

Die Register, welche die Komplementwerte enthalten, werden zuerst ausgewählt, und die Koeffizienten w^ werden serien-

- 18 009823/1646

weise mit den bestimmten Gliedern des abzufragenden Zahlensatzes verglichen. Jedesmal, wenn eine Fehlanpassung auftritt, wird der Zähler, welcher dem Register zugeordnet ist, welches die Fehlanpassung erzeugt, um Eins weitergeschaltet. Am Ende dieses Teiles der Operation halten die Zähler die Anzahl der Operationen (a) zur Durchführung der Bewertung des Ausdruckes (1)'. Die Operation wird an den Registern wiederholt, welche die echten Werte der Koeffizienten halten, ausgenommen, wenn eine Fehlanpassung auftritt, bei welcher der zugeordnete Zähler des Registers, welcher die Fehl-. " anpassung liefert, um eine Eins weitergeschaltet wird. Am Ende dieses Teils der Operation, wenn das Vorzeichen der vom Zähler gehaltenen Zahl positiv (negativ) ist, wird das Vorzeichen des ausgewerteten Ausdruckes (1) positiv (negativ). Die Polarität des Zahlerbetrages kann dazu verwendet werden, um einen Eingangswert für die Operation 2 zu liefern und zwar in der Weise, wie es an Hand der Figuren 2 bis 5 bei der relativen Polarität der Fehlanpaßströme bereits beschrieben wurde.

An Stelle der Verwendung eines einzelnen assoziativen Speichers können auch zwei Speicher verwendet werden, und zwar der erste mit der Tabelle 1 und der zweite mit der Tabelle 2. Das Ergebnis der Operation 1 wird auf den zweiten Speicher übertragen, während der Zahlensatz, welcher ein neues Zeichen repräsentiert, auf das Eingang/Ausgang-Register des ersten Speichers gegeben wird. Auf diese Weise wird die Zeit zur Identifizierung einer Folge von Zeichen herabgesetzt.

Patentansprüche

009823/1648

Claims

- 19 Patentansprüche

(lj) Verfahren zur maschinellen Zeichenerkennung, bei dem das Zeichen durch einen geordneten Zahlensatz von d Ziffern darstellbar ist, dadurch gekennzeichnet, daß ein Satz von d binär symmetrischen Zahlen unter Verwendung eines assoziativen, digitalen Datenspeichers klassifiziert wird, welcher als Belastung einen· assoziativen Speicher mit einer ersten Tabelle enthält und dessen Eingänge Koeffizienten darstellen, welche auf einen Bereich der Werte 1, 0 und -1 beschränkt sind, daß im d-Raum Ebenen vorhanden sind, welche den Raum in Raumteile aufteilen, so daß im wesentlichen alle Punkte desselben Raumteiles binäre, symmetrische Zahlen innerhalb derselben Klasse repräsentieren, wobei ein assoziativer Speicher mit einer zweiten Tabelle belastet ist, bei dem jeder Eingang mit Hilfe eines Bezeichnungssatzes einen Raumteil bestimmt, welcher vorschreibt, auf welcher Seite jeder ^_n ^j__{e ers}te Tabelle eingeschlossenen Ebene sich irgendein Punkt des Raumteiles befindet, welcher mit Hilfe einer ersten Tabellensuchoperation in der ersten Tabelle bestimmt, auf welcher Seite jeder Ebene der Punkt gelegen ist, welcher den zu klassifizierenden Satz von Zahlen repräsentiert und daß das Resultat der ersten Tabellensuchoperation in einer zweiten Tabellensuchoperation in der zweiten Tabelle verwendet wird, um den Raumteil zu bestimmen, in welchem der erwähnte Punkt liegt und um damit die Klasse zu bestimmen, zu welcher die Zahl gehört.
2.) Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die erste Tabelle ein Paar von Eingängen enthält, daß jedes Paar einen ersten Eingang enthält, in welchem die Koeffizienten einer Ebene in der echten Form dargestellt sind und daß in einem zweiten Eingang die Koeffizienten derselben Ebene in inverser Form dargestellt sind, wobei die erste Tabellensuchoperation in der Bestimmung liegt, welcher der Eingänge jedes Paares dem zu klassifizierenden Zahlen-

satz mehr angepaßt ist. - 20 -

009823/1646
3.) Verfahren nach den Ansprüchen 1 und 2, dadurch gekennzeichnet, daß jeder Eingang der zweiten Tabelle einen Schlüssel für einen Bezeichnungssatz enthält, wobei die Benennung in einem Namen digitaler Form besteht und die zweite Tabellensuchoperation in einem Vergleich der Resultate der ersten Tabelsuchoperation mit den Schlüsseln besteht, wobei vom Speicher der Name in den Eingang gegeben wird, dessen Schlüssel mit den genannten Resultaten identisch ist.
4.) Verfahren nach den Ansprüchen 1 bis 3> dadurch gekenn- W zeichnet, daß zwei assoziative Speicher vorgesehen sind, wobei die erste Tabelle den einen Speicher belastet und die zweite Tabelle den anderen Speicher belastet und daß die Operationen des ersten und des zweiten Tabellensuchens gleichzeitig in den entsprechenden Speichern in Bezug auf verschiedene Sätze zu klassifizierender Zahlen stattfinden.
5.) Verfahren nach den Ansprüchen 1 bis 4, dadurch gekennzeichnet, daß der Satz von Zahlen in Zeichenform darstellbar ist.
6.) Vorrichtung zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 5» dadurch gekennzeichnet, daß der assoziative Speicher eine Anzahl von Wortregistern enthält, welche zu Paaren gruppiert sind und daß eine Einrichtung bestimmt, welches Wortregister jedes Paares einen Dateninhalt aufweist, welcher ungleich ist einem dem Speicher präsentierten Suchargument.

- 21 -

009823/1646
7.) Vorrichtung nach Anspruch 6, dadurch gekennzeichnet, daß jedes Wortregister eine Fehlanpaßleitung und eine Anzahl von assoziativen Bitspeicherzellen enthält, von denen jede ein Signal vorbestimmten Betrages abgibt, wenn der Inhalt der Zelle nicht übereinstimmt mit einem entsprechenden Bit eines dem Speicher präsentierten Suchargumentes.
8.) Vorrichtung nach Anspruch 7» dadurch gekennzeichnet, daß die Fehlanpaßleitungen eines Paares der Wortregister zu Eingängen eines DifferentialVerstärkers gemacht sind, welcher dem Paar zugeordnet ist.

009823/1646

Leerseite