DE1953451A1 - Verfahren und Vorrichtung zur maschinellen Zeichenerkennung - Google Patents
Verfahren und Vorrichtung zur maschinellen ZeichenerkennungInfo
- Publication number
- DE1953451A1 DE1953451A1 DE19691953451 DE1953451A DE1953451A1 DE 1953451 A1 DE1953451 A1 DE 1953451A1 DE 19691953451 DE19691953451 DE 19691953451 DE 1953451 A DE1953451 A DE 1953451A DE 1953451 A1 DE1953451 A1 DE 1953451A1
- Authority
- DE
- Germany
- Prior art keywords
- memory
- register
- numbers
- space
- pair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Description
22. Oktober 1969 Docket UE 968 005 Dr.Schie/E
Anmelderin: International Business Machines Corporation, Armonk, N. X. 10504 (V. St. A.)
Vertreter: Patentanwalt Dr.-Ing. Rudolf Schiering, 703 Böblingen/Württ., Westerwaldweg 4-
Die Erfindung "betrifft ein Verfahren und eine Vorrichtung
zur maschinellen Zeichenerkennung, und zwar zum Erkennen einer Zeichenform, wenn die Zeichenform durch einen Satz
von d Mnären symmetrischen Zahlen, das heißt von Zahlen dargestellt ist, welche nur die Werte 1 oder - 1 haben können.
Das Problem der Erkennung einer Zeichenform, welche durch einen Zahlensatz repräsentiert ist, ist das Problem der
Zuordnung des Zahlensatzes zu einer Klasse, welche alle Zahlensätze enthält, die das gleiche Zeichen repräsentieren.
Mit anderen Worten ausgedrückt, das Problem der Zuordnung ist im vorliegenden Falle ein Problem der Klassifizierung
des Zahlensatzes.
Die Erfindung besteht in einem Verfahren zum Klassifizieren eines Satzes von d binären symmetrischen Zahlen unter
— 2 — 009823/1646
Verwendung mindestens eines assoziativen digitalen Datenspeichers,
welcher als Belastung einen assoziativen Speicher mit einer ersten Tabelle enthält und dessen Eingänge
Koeffizienten darstellen, welche auf einen Bereich der Werte 1, 0 und -1 beschränkt sind. Im d-Raum sind Ebenen vorhanden,
welche den Raum in Raumteile aufteilen, so daß im wesentlichen alle.Punkte desselben Raumteiles binäre, symmetrische
Zahlen innerhalb derselben Klasse repräsentieren, womit ein assoziativer Speicher mit einer zweiten Tabelle
belastet wird, bei dem jeder Eingang mittels eines Bezeichnungssatzes einen Raumteil bestimmt, welcher vorschreibt,
auf welcher Seite jeder in die erste Tabelle eingeschlossenen Ebene sich irgendein Punkt des Raumteiles befindet,
welcher mit Hilfe einer ersten Tabellensuch-Operation in der ersten Tabelle bestimmt, auf welcher Seite jeder Ebene
der Punkt gelegen ist, welcher den zu klassifizierenden Satz von Zahlen repräsentiert. Das Resultat der ersten Tabellensuch-Operation
wird in einer zweiten Tabellensuchijteration
in der zweiten Tabelle verwendet, um den Raumteil zu bestimmen, in welchem der erwähnte Punkt liegt, und damit die Klasse zu bestimmen, zu welcher die Zahl gehört.
Größere Speicher werden bekanntlich in Speicherzellen unterteilt,
welche meist der Speicherung von jeweils einem Wort dienen. Zur Organisation des Speichers denkt man sich die
Speicherzellen entweder in ihrer räumlichen Reihenfolge durchnumeriert oder man kennzeichnet ihre Lage eindeutig
durch ganzzahlige Koordinatenwerte. In den bekannten, sogenannten assoziativen Speichern schreibt man in einen Teil
jeder Speicherzelle eine unabhänig von der räumlichen Zellenanordnung wählbare Kennung vor (Karl Steinbuch "Taschenbuch
der Nachrichtenverarbeitung", Springer Verlag 1962, S.522, S.653).
Durch die britische Patentschrift 985 705 ist bereits ein
- 3 009823/1646
elektronischer Vergleicher zum Vergleichen von Wörtern bekanntgeworden,
bei dem eine Anzahl von Speicherelementen nach Zeilen "und Spalten in zwei Dimensionen aufgebaut sind.
Die genannte Patentschrift zeigt die Verwendung einer 3-Zustands-Zelle
in einer Vergleicheroperation.
Durch die britische Patentschrift 1 098 895 ist ein Zeichenerkennungssystem
bekanntgeworden, bei welchem eine Konvertierung von Zeichen aus verschiedenen Klassen in einen
entsprechenden digitalen Code stattfindet und bei welchem eine Prüfung dieses Codes auf das Vorhandensein ausgewählter
Worte vorgesehen ist, welche eine kürzere Länge aufweisen als die individuellen Codes. Diese Patentschrift beschreibt
die Verwendung von Hyperebenen, welche den Zeichenraum in Raumteile aufteilen.
Die Erfindung besteht auch in einer Vorrichtung zur Durchführung des oben beschriebenen Verfahrens.
Die Erfindung sei nachstehend an Hand der Zeichnungen für eine beispielsweise Ausführungsform näher beschrieben.
Fig. 1 ist ein Diagramm, welches zur Erläuterung der Theorie des Verfahrens nach der Erfindung dient.
Fig. 2 ist ein Blockschaltbild eines assoziativen Speichers, der für die Durchführung des Verfahrens nach der Erfindung
eingerichtet ist.
Fig. 3 ist eine Detailzeichnung der Steuerschaltung für den in Fig. 2 gezeigten Speicher.
Fig. 4 zeigt zwei typische Bitspeicherzellen des in Fig. 2
gezeigten Speichers.
009823/1646
Fig. 5 enthält ein Schema, das zur Erläuterung der Durchführung
des Verfahrens nach der Erfindung gedacht ist.
Es ist an sich bekannt, daß ein Zeichen durch einen geordneten
Zahlensatz von d Ziffern dargestellt werden kann. So fällt zum Beispiel das Bild eines Zeichens auf eine rechteckige
Fläche von d Photodetektoren. Wenn ein Photodetektor durch das Zeichen maskiert wird, läßt sich der resultierende
Zustand des Photodetektors durch die Zahl 1 darstellen. Im anderen Falle laßt sich der resultierende Zustand des Photodetektors
durch die Zahl 0 darstellen. Der Zahlensatz (b.), ψ b. = 1 oder 0, i = 1 bis d ist eine Darstellung des Zeichens,
welches auf den Photodetektoren abgebildet wird. Bei der Darstellung der Zustände eines Photodetektors durch die binären,
symmetrischen Werte 1,-1 gibt es erklärlicherweise im allgemeinen
keine Verluste.
Das Problem der Erkennung des Zeichens ist das Problem der Zuordnung einer Ze_*henbeSchreibung, eines Klassennamens.
Dieses Problem ist äquivalent der Zuordnung des Zahlensatzes, welcher das Zeichen repräsentiert, zu einer Klasse. Im idealen
Falle hat jede Klasse nur ein Glied, so daß ein gegeb^ "
Zeichen eine Steigerung auf nur einen Zahlensatz gibt, welcher sofort seiner Klasse zuordbar ist.
In der Praxis gibt es gedoch diesen Idealzustand nicht. Sogar die Zeichen auf einer gedruckten Seite sind wegen der unterschiedlichen
Absorption der Tinte in verschiedenen Bereiches des Papieres nicht regelmäßig gedruckt. Das Erkennen von
handgeschriebenen Zeichen ist ein Beispiel hierfür. Es ist klar, dass eine einzelne Klasse eine große und unterschiedliche
Zahl von Zahlensätzen enthält.
Die Betrachtung des zuletzt erwähnten Anwendungsbeispieles, führt zu dem Ergebnis, daß das Schlüsselproblem der Zeichen-
- 5— 009823/1646
_ 5 —
erkennung in der Bestimmung des Umfanges der Klassen liegt.
Dieses Problem ist bisher nur durch Annäherung erreicht oder
ziemlich stark umgangen worden, indem man spezielle Schriftformen gestaltet hat, in welchen die Zeichen unterscheidbar
sind und zwar auch dann, wenn sie ganz besonders vielseitig sind.
E. M. Braverman hat in einer Veröffentlichung "Experiments in Machine Learning to Recognize Visual Patterns" Automatika
i Telemekhanika, Band 23, Heft 3, März 1962, (Übersetzung wurde im September 1962 veröffentlicht), ein algorithmisch.es
Verfahren vorgeschlagen, um in lehrenden Automaten visuelle Zeichen zu unterscheiden.
Eine Anzahl von d Ziffern, bzw. ein Zahlensatz aus d Ziffern, soll nachstehend betrachtet werden bei der Identifizierung
eines Punktes in einem Raum mit d Dimensionen. Die Maschine ist mit einer Übungsgruppe von Zahlensätzen präsentiert, wobei
jeder Zahlensatz einer bekannten Klasse angehört. Ferner sind Hyperebenen, nachstehend als Ebenen bezeichnet, zur Trennung
des Raumes in Raumteile gezogen, wobei jeder Raumteil alle (oder praktisch die meisten) jene Punkte enthält, welche
derselben Klasse angehören. Am Ende der Ausbildung werden die zu klassifizierenden Zahlensätze in die Maschine gegeben.
Durch Bestimmung auf welcher Seite jeder Ebene der Punkt liegt, welcher einen Zahlensatz repräsentiert, kann man finden,
in welchem Teil des Raumes der Punkt angeordnet ist. Damit findet man die Klasse zu welcher der Zahlensatz gehört.
Der Braverman-Algorithmus ist von großer Allgemeinheit und hängt erfolgreich nur von der zuverdichtenden Klasse ab.
Dies bedeutet, .daß sich nicht zu viele Punkte einer Klasse mit Punkten anderer Klassen vermengen, wodurch das Ziehen
von Ebenen mit ausreichend getrennten Klassen genügend verhindert wird. In einem besonderen Falle kann es schwierig
- 6 009823/1646
sein, einen repräsentativen Übungssatz zu bestimmen, was aber die Allgemeinheit der Theorie nicht beeinträchtigte
Die Gleichung einer Ebene, welche durch den Ursprung eines Raumes von d Dimensionen verläuft, ist gegeben durch
W1X1 + w2x2 + + wdxd = 0 (1)
Um zwei bekannte Punkte zu trennen, welche verschiedenen Klassen angehören, bildet Braverman d-1 Koeffizienten w^
durch eine Pseudo-Zugriffs-Zahlenfolge und berechnet dann den letzten Koeffizienten.
Man hat gefunden, daß durch Beschränkung des Zahlenfeldes,
zu welchem die Koordinaten x. gehören, auf das binäre, symmetrische Feld (-1, 1) (in dem gegebenen Beispiel repräsentiert
ein nichtmaskierter Photodetektor den Wert -1) und durch Wahl jeder trennenden Ebene, der art, daß sie vereinbar
ist mit allen Punkten, welche äquidistant sind mit den zu trennenden Punkten, die Berechnungen sehr stark vereinfacht
werden. Die Zeichenerkennung kann dann durchgeführt werden mit nur zwei Tabellenablese-Operationen an
einem assoziativen Speicher.
In der Tat, wenn die beiden Punkte (Y. ) und (y^) sind, dann
ist i * 1 bis d und die Gleichung der Ebene, welche alle
äquidistanten Punkte zu den beiden Punkten enthält', ist d d
\ 1(T1- T1) X1 - 0
i - 1 i - 1
Es ist klar,dass die Koeffizienten W1 nur die Werte -1, 0
oder 1 haben können.
Um zu bestimmen, auf welcher Seite der Ebene (1) ein Punkt liegt, werden die Koordinaten des Punktes substituiert um
- 7 -009823/1646
das χ. auf der linken Seite von (1). Das ausgewertete Resultat
kann positiv sein oder eine negative Zahl sein oder Null sein. Alle Punkte deren Koordinaten einen Zuwachs ergeben
gegenüber den Ergebnissen mit denselben Vorzeichen, liegen auf derselben Seite der Ebene, oder mit anderen Worten,
das Vorzeichen des ausgewerteten Resultates zeigt die Seite der Ebene an auf welcher ein Punkt liegt. Infolge
der den Koeffizienten x. und'w. auferlegten Beschränkungen
schließt der Ansatz jedes Ausdruckes von (1) ein (a) eine Multiplikation von +1 mit +1 oder von -1 mit -1;
oder (b) eine Multiplikation von +1 mit -1; oder (c) eine Multiplikation mit Null (w^ =0)·
Die Operation (c) trägt zur Bestimmung des Vorzeichens des Ausdruckes, welcher durch einfaches Zählen der entsprechenden
Anzahl von durchzuführenden Operationen (a) und (b) in einfacher Weise gefunden werden kann, nichts bei und vermerkt,
welche Zahl die größere ist. Wenn (a) des öfteren erfolgt, ist das Vorzeichen positiv, wenn (b) des öfteren
erfolgt, dann ist das Vorzeichen negativ.
Der Ansatz kann in einer Suchoperation gemacht werden, in welcher eine Modifikation des assoziativen Speichers verwendet
wird, wie sie zum Beispiel in der noch schwebenden britischen Patentanmeldung 4-54-32/67 beschrieben ist.
Der Speicher ist derart eingerichtet, daß der Grad der Fehl anpassung eines Suraargumentes zum Inhalt eines Registers dargestellt wird durch die Größe des Stromes in
einem Fehlanpassungsleiter, der dem Register zugeordnet ist« Die Datenspeicherzellen, welche in den Wortregistern enthalten
sind, können drei stabile Zustände annehmen, die mit 1, 0 und X bezeichnet sind. Der X-Zustand ist derart, daß
durch eine Zelle im X-Zustand kein Fehlanpassungssignal erzeugt wird, unabhängig vom Abfragesignal. Jeder Befehl
009823/1646
oder jede Stelle des Suchargumentes ist binär und kann zur
Bildung eines a 1 Abfragesignales oder eines 0 Abfragesignales
führen.
Der Zahlensatz, welcher einen Punkt in dem Raum mit den d Dimensionen repräsentiert, wird als Suchargument behandelt.
Wenn ein Glied des Satzes den Wert 1 hat, dann wird ein 1 Abfragesignal den Wortregistern des Speichers zugeführt.
Wenn ein Glied des Satzes den Wert -1 hat, dann wird ein 0 Abfragesignal den Wortregistern des Speichers zugeführt.
Die Wortregister dienen zum Speichern der Koeffizienten w.,
des Wertes 1, welcher durch den stabilen Zustand 1 der Datenzellen
repräsentiert wird, ferner zur Speicherung des Wertes -1, welcher durch den stabilen Zustand 0 repräsentiert
wird, und zur Speicherung des Wertes 0, welcher durch den stabilen Zustand X repräsentiert wird.
In einem ersten Wortregister des Speichers werden die wahren Werte von w^ und in einem zweiten Wortregister die Komplemente
von w. gespeichert, womit definiert ist, daß das Komplement von 0 gleich 0 ist, das Komplement von 1 gleich -1
ist und das Komplement von -1 gleich 1 ist. Wenn eine Fehlanpassung zwischen einer Stelle des Suchargumentes und dem
Inhalt einer Speicherzelle auftritt, dann ist eine Einheit. des Stromes von der Zelle auf den Fehlanpaßleiter gerichtet·
Die Größe des Stromes auf einem Fehlanpaßleiter ist deshalb direkt proportional dem Grade einer Fehlanpassung zwischen
einem Suchargument und den Inhalten der Zellen des Wortregisters, welches jenem Fehlanpaßleiter zugeordnet ist. Unter
diesen Umständen wird eine Fehlanpaßoperation zwischen einem Zahlensatz (xj), wobei das x. die Werte 1 oder -1 haben
kann, und dem ersten Wortregister, welches die wahren Werte von w^ enthält, ein Anwachsen eines Stromes im ersten
- 9 -009823/1646
Wortregister-Fehlanpaßleiter geben., welcher die Anzahl von
Operationen repräsentiert, die oben mit (b) bezeichnet sind. Damit ist die Auswertung der linken Seite der Gleichung (1)
durchgeführt. Eine Anpaßoperation zwischen dem Zahlensatz (x.) und dem zweiten Wortregister, welches die Komplementwerte enthält, führt zu einem Zuwachs mit einem Strom auf
dem zweiten Wortregister-Anpaßleiter. Dieser repräsentiert die Anzahl der Operationen (a) bei der Durchführung der Auswertung
der linken Seite der Gleichung (1). Ein Vergleich der Ströme auf den Pehlanpaßleitern gibt dann das Vorzeichen
des ausgewerteten Resultates· Wenn der Strom im ersten Wortregister-Fehlanpaßleiter größer ist, ist das Vorzeichen
negativ. Wenn die Ströme gleich sind, ist das Resultat der Auswertung gleich NuIl. Damit ist die Gleichung (1) erfüllt
unter Einbeziehung der Tatsache, daß der Punkt, welcher durch den Zahlensatz repräsentiert wird, auf der Ebene liegt.
Als Beispiel sei eine Ebene für den 9-Dimensionsraum angenommen:
X1-X2-Xz + Xc + Xr7 - Xg - Xq = 0 (2)
Das erste Wortregister wird die folgenden Eingänge enthalten:
+1 -1 -1 O +10-1 -1
und das zweite Wortregister wird die folgenden Eingänge enthalten:
-1 +1 +10-10 -1 +1 +1
Man nehme den Zahlensatz
(1, -1, -1, I1 1, 1, 1, 1, -1, 1) (3)
und passe ihn den Inhalten des ersten und des zweiten Registers an. Die Anzahl von Fehlanpassungen mit dem Inhalt
des ersten Registers ist eins. Dies gibt einen Anstieg der Einereinheit des Stromes auf dem ersten Register-Fehlanpaßleiter.
Die Anzahl der Fehlanpassungen mit dem Inhalt des zweiten Registers ist sechs. Dies gibt einen Anstieg
-10 -
009823/1646
um sechs Einheiten des Stromes auf dem zweiten Register-Fehlanpaßleiter.
Der Punkt im 9-Dimensionsraum, welcher durch den Zahlensatz (3) repräsentiert ist, "befindet sich
auf der positiven Seite der Ebene (2), so daß diese ein Glied von jenem Satz von Punkten darstellt, welches einen
positiven Wert gibt, wenn deren Koordinaten durch x. auf der linken Seite der Gleichung (2) substituiert werden.
Zur Prüfung ergibt die Substituierung des Zahlensatzes (3) auf der linken Seite der Gleichung (2):
1+1+1+1+1+1-1, was positiv ist.
Hat man bestimmt, auf welcher Seite jeder Ebene ein Punkt liegt, dann kann der Raumteil des Raumes, in welchem der
Punkt liegt, leicht durch eine einzelne Anpaßoperation gefunden werden. Es ist klar, daß jeder Raumteil durch Auslisten
auf welcher Seite von jeder Ebene der Raumteil gelegen ist, jeder Raumteil einheitlich spezifiziert wird»
Dieser Fall ist in Figur 1 für einen Raum mit zwei Dimensionen dargestellt, in welchem die Ebenen die Geraden a bis
d sind und wobei die Raumteile Flächenbereiche sind. Jede Ebene teilt den Raum in zwei Halbräume, welche auf der positiven
bzw. auf der negativen Seite der Geraden liegen.
Wenn ein Raumteil im positiven Halbraum liegt, ist der Raumteil
mit 1 bezeichnet. Wenn er im negativen Raumhälftenteil liegt, ist der Raumteil mit 0 bezeichnet. Die Punkte in der
Ebene muß man sich in der positiven Raumhälfte angeordnet vorstellen. Die Raumteile sind in Bezug auf jede Ebene gekennzeichnet,
wodurch eine einheitliche Spezifizierung jedes Raumteiles entsteht.
In Figur 1 ist der Raumteil ABDE durch den Bezeichnungssatz
(1,0,0,1), der Raumteil BGD durch den Bezeichnungssatz (1,1,0,1) spezifiziert. Es folgt daraus, daß durch Vergleich
der Resultate der ersten Operation, welche ergab,
- 11 009823/1648
ORIGINAL INSPECTED
- li -
auf welcher Seite von jeder Ebene ein Punkt liegt, mit dem
Beschriftungssatz von allen Raumteilen gefunden werden kann, in welchem Raumteil der Punkt liegt und daher gefunden werden
kann, zu welcher Klasse der Zahlensatz, welcher durch den Punkt repräsentiert ist, gehört. Dieser Vergleich kann in
einem assoziativen Speicher in einem einzigen Anpaßoperationsgang durchgeführt werden.
Nachstehend sei jetzt der assoziative Speicher näher beschrieben,
der zur Durchführung des vorstehend beschriebenen Verfahrens vorteilhaft geeignet ist· Der in Figur 2 gezeigte
assoziative Speicher 20 enthält ein Eingang/Ausgang-Register 21, ein Maskenregisber 22 und eine Anzahl von Wortspeicherregistern
2$, 24, 25 Jedes Wortregister hat eine Fehlanpaßleitung
26, welche einen Eingang zur Anpaßlogik 27 liefert.
Eine Sammelleitung 28 enthält eine Anzahl von Leitern,über
die eine Datenübertragung von oder zum Register 21 vorgesehen ist. Eine Ausgangssammelleitung 29 von der Anpaßlogik
27 ist an die Sammelleitung 28 angeschlossen.
Wie in einem konventionellen assoziativen Speicher werden die Inhalte gewisser Felder des Registers 21 mit den Inhalten
derselben Felder der Wortregister 23, 24.... verglichen. Diejenigen Register, welche infolge der Anpaßoperation keinen
Strom an die Fehlanpaßleitung 26 abgeben, werden als ausgewählt bezeichnet. Ein WaI "trigger (in Figur 2 nicht besonders
dargestellt) bildet einen Teil der Anpaßlogik 27 und ist jedem solchen Register zugeordnet. Er wird eingestellt und markiert
dadurch das Register für eine folgende Zugriffsoperation.
Die Felder, welche verglichen werden, sind abhängig von der Einstellung des Maskenregisters 22, welches durch
nicht besonders dargestellte konventionelle Mittel selektiv einstellbar ist, um irgendeine Stelle des Registers 21 zu
- 12 009823/1646
den Wortregistern zu maskieren. Jedes Wortregister des assoziativen Speichers enthält Speicherzellen 41 (Figur 4),
jede zwei stabile Schaltungen enthaltend, so daß vier mögliche stabile Zustände möglich sind, von denen nur drei bei
der vorliegenden Anwendung gebraucht werden. Die drei stabilen Zustände sind: binare 1, Doppel-Emitter-Transistor 42
leitend; binäre 0, Doppel-Emitter-Transistor 43 leitend; und X oder "Nichtwarte"-Zustand, kein Doppel-Emitter-3fcansistor
leitend. Die Bitleitungen 44 und 45 sind an den Emitter
der entsprechenden Transistoren 42 bzw. 43 angeschlossen " und werden beide zur Datenübertragung in die Zelle und aus
der Zelle und für den Abfragezustand der Zelle verwendet.
Wenn eine Zelle abgefragt wird, dann sind auf den Bitleitungen Spannungen plaziert, welche einen Steuerstrom auf
der Fehlanpaßleitung 26 erzeugen, wenn die Zelle nicht in dem Zustande ist, für welche sie abgefragt ist. Wenn daher
die Abfragung eine binäre 1 betrifft, dann wird eine niedere Spannung auf der Bitleitung 44 und eine höhere Spannung
auf der Bitleitung 45 gebildet. Wenn die Zelle im 1 Zustand ist, dann fließt im Transistor 42 Strom und die niedere
Spannung auf der Leitung 44 zieht diesen Gesamtstrom in die Leitung 44, so daß auf der Leitung 26 kein Strom erscheint.
Wenn die Zelle im O-Zustand ist, dann fließt der Strom im
Transistor 43, und die höhere Spannung auf der Leitung 45
steuert den Gesamtstrom zur Fehlanpaßleitung 26. Wenn die Zelle im X-Zustande ist ist keiner der Transistoren 42 und
43 im leitenden Zustande und eine Fehlanpassung kann nicht
auftreten.
Da die Zellen 41 in ihrer Konstruktion identisch sind, ist der Betrag des Stromes, der in jedem Transistor 42 bzw. 43
fließt, derselbe. Es folgt daraus, daß der Strom auf der
- 13 009823/1646
Leitung 26 in seiner Starke ein Maß ist für die Anzahl jener Zellen, "bei denen eine Fehlanpassung vorlag.
Figur 3 zeigt den Teil der Anpaßlogik 27, welche einem Paar
von Wortregistern 23 und 24 zugeordnet ist. Die Wortregister sind paarweise gruppiert, um eine entsprechende Speicherung
der wahren und der komplementären Werte der Koeffizienten einer entsprechenden Ebene zu haben. Jedes Paar ist mit einer
Logik ausgerüstet, die identisch ist mit jener bereits beschriebenen, welche einen Ausgangswert zur Sammelleitung
29 liefert.
Die Fehlanpaßleitung 26 des Registers 23 ist mit dem Eingang der beiden Und-Schaltungen 31 und 32 verbunden. In ähnlicher
Weise ist die Fehlanpaßleitung 26 des Registers 24 mit den
Und-Schaltungen 33 und 34· verbunden. Die anderen Eingänge
zu den Und-Schaltungen 31 und 34>
sind durch die Leitungen gegeben, welche durch ein Signal 0P2 erregt werden. Die anderen
Eingänge zu den Und-Schaltungen 32 und 33 sind Leitungen, welche durch ein Signal OPl erregt werden.
Die Und-Schaltungen 32 und 33 sind nicht einfache logische
Und-Schaltungen. Wenn sie jedoch durch das OPl Signal aktiviert
werden, dann liefern sie Ausgangswerte, welche analog zu dem Betrag der Ströme auf den entsprechenden Fehlanpaßleitungen
26 sind, mit denen sie verbunden sind.
Die Ausgänge der Und-Schaltungen 31 und 34 werden nach der
Inversion durch die Inverter 35 und 37 auf den Satz von Eingängen
der Auswahl-Trigger 36 bzw. 38 gegeben. Die Ausgänge
der Und-Schaltungen 32 und 33 werden auf entsprechende Eingänge
eines Differentialverstärkers 39 übertragen.
Der Ausgang des Verstärkers 39 ist an den Satz Eingänge eines Triggers 40 angeschlossen, dessen Ausgang mit der Sanmel-
- 14 009823/1646
leitung 29 verbunden ist. Die Anordnung des Verstärkers 39 und des Triggers 40 ist derart getroffen, daß bei Signalabgabe
durch die Und-Schaltungen 32 und 33 der Strom auf der
Fehlanpaßleitung des Registers 23 größer ist als der Strom auf der Fehlanpaßleitung des Registers 24. Dann wird der
Ausgang des Verstärkers erregt und der Trigger 40 geschaltet.
Der Verstärker 39 ist derart vorgespannt, daß im Falle gleicher Fehlanpaßströme der Trigger 40 zurückgestellt
wird. Dies ist äquivalent zu dem Einschließen eines Punktes in eine trennende Ebene im positiven Halbraum, welcher durch
die Ebene definiert wird.
Um eine unnötige Komplizierung der Beschreibung zu vermeiden, sind in den Zeichnungen die konventionellen Taktgeberschaltungen
und die Vorrichtungen zur Erzeugung der Steuersignale, zum Beispiel der Signale OPl und 0P2, weggelassen.
Derartige untergeordnete Schaltungen sind an sich bekannt.
Nachstehend sei die Durchführung des Verfahrens nach der Erfindung
mit der Vorrichtung nach den Figuren 2 bis 4 an Hand der Figur 5 näher erläutert. In Figur 5 bezeichnet 51 den
Inhalt der Wortregister des assoziativen Speichers 20 nach Figur 2. Mit 52 ist der Inhalt des Registers 21 bei der Operation
1 bezeichnet. 53 ist eine Darstellung der Inhalte des Registers während der Operation 2. Diese Wortregister enthalten
2 Datentabellen. Die Eingänge der Tabelle 1 enthalten eine Tabelle des Erkennungsschlüssels und entsprechende Paare
von benachbarten Wortregistern für die Koeffizienten w^
der entsprechenden Ebenen in echter Form und in komplementärer Form.
Es sei daran erinnert, daß jeder Koeffizient die Werte 1, 0 oder -1 annehmen kann, und daß die Zellen des Speichers
die mit 1, 0 und X bezeichneten stabilen Zustände besitzen können. Der Wert 1 ist in der Tabelle 1 durch den Zustand 1
- 15 -
009823/1648
dargestellt. Der Wert O ist durch den Zustand X und der Wert
-1 durch den Zustand O wiedergegeben. Die !Tabelle 2 enthält drei Felder. Jeder Eingang der Tabelle enthält einen Tabellenerkennungsschlüssel,
einen Raumteil-Identifizierer und den Namen des Raumteiles, welcher durch den Identifizierer repräsentiert
wird.
Der Raumteil-Identifizierer enthält eine Reihe von binären Zahlen, welche die Position des Raumteiles im Räume relativ
zu den Ebenen wiedergeben.
Wenn ein Raumteil auf der positiven (negativen) Seite einer gegebenen Ebene liegt, dann besetzt eine binäre 1 (0) eine
gegebene Stelle des Identifizierers.
Das dritte Feld in der Tabelle 2 enthält den Namen von jedem
Raumteil. Im Bedarfsfalle ist eine beliebige Zuordnung möglich.
Verschiedene Identifizierer können denselben Namen haben, entweder wegen der Anforderungen des Bedieners, der zum
Beispiel die Unterscheidung zwischen einem oberen Fall und einem unteren Fall für die Zeichen unbeachtet lassen kann,
oder wegen des Übungsprozesses, bei dem sich dieselbe Zeichenklasse in der Darstellung durch Punkte in verschiedenen
Raumteilen ergeben hat.
Während der Operation 1 ist das Register mit dem Schlüssel der Tabelle 1 belastet und betrifft den Zahlensatz, welcher
das zu erkennende Zeichen repräsentiert. Ein Signal der Operation 1 wird den Und-Schaltnmgen 32, 33 (Figur 3) der Wortregisterpaare
aufgeprägt, welche die Tabelle 1 enthalten. Gleichzeitig findet eine Anpaßoperation des gesamten Inhalts
des Eingang/Ausgang-Registers mit den Registern des assoziativen Speichers statt. Wie bereits erklärt, wird das
Ausmaß der Fehlanpassung zwischen den Inhalten des Eingang/ Ausgang-Registers und der Wortregister durch die Größe der
- 16 009823/1646
Ströme wiedergegeben, welche in den Register-Fehlanpaßleitungen fließen. Die Fehlanpassungen in den Eegisterpaaren
der Tabelle 1 werden verglichen in den Different!alverstärkern
39· Wenn die Fehlanpassung im oberen Register 23
(Figur 3) die größere ist, dann wird der Trigger 40 geschaltet, im anderen Falle bleibt er, wie bereits erklärt,
im zurückgestellten Zustand. Die Zustände der Trigger werden über die Sammelleitung 29 auf das Eingang/Ausgang-Register
zu Beginn der Operation 2 übertragen und zeigen an, auf welcher Seite jeder Ebene der Punkt liegt, welcher
durch den Zahlensatz dargestellt wird.
Zu Beginn der Operation 2 ist das Eingang/Ausgang-Register mit dem Schlüssel der Tabelle 2 belastet und mit Hilfe der
Sammelleitung 29 mit den Zuständen der Trigger 40. Ein Signal der Operation 2 wird allen Und-Schaltungen 31 und 34
des assoziativen Speichers aufgeprägt, und eine Anpaßoperation wird mit den Inhalten der beiden Felder des Eingang/
Ausgang-Registers und denselben Stellen der Wortregister durchgeführt. Kur die Eingänge der Tabelle 2 werden den
Schlüssel der Tabelle 2 anpassen, und nur der Identifizierer des Raumteiles, zu welchem der Punkt gehört, der durch
den in der Operation 1 verwendeten Zahlensatz repräsentiert wird, wird das zweite Feld des Eingang/Ausgang-Registers
anpassen. Nur ein Register wird einen Fehlanpaßstrom nicht liefern, was zur Folge hat, daß der Trigger 36 (oder 38)
geschaltet wird. Um das Register, welches die Inhalte der Suchargumentfelder des Eingang/Ausgang-Registers angepaßt
hat, auszuwählen, und um das Namensfeld jenes Registers auf
das Eingang/Ausgang-Register zu übertragen, können konventionelle
Schaltungen zum Einstellen der Trigger 36 (38) verwendet werden.
Das Ergebnis der Operationen 1 und 2 einschließlich von nur zwei Arbeitszyklen des assoziativen Speichers ist ein Zeichen,
- 17 009823/1646
welches durch einen benannten Zahlensatz repräsentiert ist.
Bei der Beschreibung der Operation ist nichts darüber angegeben
worden, wie die Schaltungen 32 und 33 > denen das OPl Signal zuzuführen ist, ausgewählt werden. Eine Methode
besteht darin, einen dritten Eingang zu diesen Schaltungen einzuschließen, welcher in Übereinstimmung mit der Einstellung
eines manuell kontrollierbaren Schalters erregt wird. Am Ende der Übung wird die Größe der Tabelle 1 dem Bediener
beispielsweise durch Ausdrucken der Inhalte des Speichers bekanntgemacht. Der Bediener kann dann eine Schaltereinstellung
auswählen, welche nicht zur Erregung der dritten Eingänge der Schaltungen führt, die der Tabelle 2 zugeordnet
sind.
Eine andere Methode besteht darin, eine Anpassungsoperation durchzuführen, bei der der Schlüssel der Tabelle 1 am Ende
der Übung verwendet wird. Diese wird, dies sei bemerkt, nicht anders direkt verwendet wie ein Suchargument. Die
Trigger 36 (38) aller Register, welche die Tabelle 1 enthalten, werden eingestellt und können verwendet werden,
um aufeinanderfolgende Anwendung der 0P2 Signale, zum Beispiel durch Einstellung der Tortrigger im 0P2 Signalgenerator
zu steuern.
Ein Alternatiwerfahren für die Durchführung der Operation 1 besteht in der Schaffung eines reversiblen Zählers
für jedes Paar der Wortregister 23» 24. Die Register der Tabelle 1, welche die echten Werte von w. enthalten, werden
von den Registern, welche die Komplementwerte von Wj
enthalten durch einen unterschiedlichen Bit in einer Stelle des Schlüssels der Tabelle 1 unterscheidbar gemacht.
Die Register, welche die Komplementwerte enthalten, werden zuerst ausgewählt, und die Koeffizienten w^ werden serien-
- 18 009823/1646
weise mit den bestimmten Gliedern des abzufragenden Zahlensatzes
verglichen. Jedesmal, wenn eine Fehlanpassung auftritt, wird der Zähler, welcher dem Register zugeordnet ist,
welches die Fehlanpassung erzeugt, um Eins weitergeschaltet.
Am Ende dieses Teiles der Operation halten die Zähler die Anzahl der Operationen (a) zur Durchführung der Bewertung
des Ausdruckes (1)'. Die Operation wird an den Registern wiederholt, welche die echten Werte der Koeffizienten halten,
ausgenommen, wenn eine Fehlanpassung auftritt, bei welcher der zugeordnete Zähler des Registers, welcher die Fehl-.
" anpassung liefert, um eine Eins weitergeschaltet wird. Am Ende dieses Teils der Operation, wenn das Vorzeichen der
vom Zähler gehaltenen Zahl positiv (negativ) ist, wird das Vorzeichen des ausgewerteten Ausdruckes (1) positiv (negativ).
Die Polarität des Zahlerbetrages kann dazu verwendet werden, um einen Eingangswert für die Operation 2 zu liefern und
zwar in der Weise, wie es an Hand der Figuren 2 bis 5 bei der relativen Polarität der Fehlanpaßströme bereits beschrieben
wurde.
An Stelle der Verwendung eines einzelnen assoziativen Speichers können auch zwei Speicher verwendet werden, und zwar
der erste mit der Tabelle 1 und der zweite mit der Tabelle 2. Das Ergebnis der Operation 1 wird auf den zweiten Speicher
übertragen, während der Zahlensatz, welcher ein neues Zeichen repräsentiert, auf das Eingang/Ausgang-Register des
ersten Speichers gegeben wird. Auf diese Weise wird die Zeit zur Identifizierung einer Folge von Zeichen herabgesetzt.
009823/1648
Claims (8)
- - 19 Patentansprüche(lj) Verfahren zur maschinellen Zeichenerkennung, bei dem das Zeichen durch einen geordneten Zahlensatz von d Ziffern darstellbar ist, dadurch gekennzeichnet, daß ein Satz von d binär symmetrischen Zahlen unter Verwendung eines assoziativen, digitalen Datenspeichers klassifiziert wird, welcher als Belastung einen· assoziativen Speicher mit einer ersten Tabelle enthält und dessen Eingänge Koeffizienten darstellen, welche auf einen Bereich der Werte 1, 0 und -1 beschränkt sind, daß im d-Raum Ebenen vorhanden sind, welche den Raum in Raumteile aufteilen, so daß im wesentlichen alle Punkte desselben Raumteiles binäre, symmetrische Zahlen innerhalb derselben Klasse repräsentieren, wobei ein assoziativer Speicher mit einer zweiten Tabelle belastet ist, bei dem jeder Eingang mit Hilfe eines Bezeichnungssatzes einen Raumteil bestimmt, welcher vorschreibt, auf welcher Seite jeder ^n ^j_e erste Tabelle eingeschlossenen Ebene sich irgendein Punkt des Raumteiles befindet, welcher mit Hilfe einer ersten Tabellensuchoperation in der ersten Tabelle bestimmt, auf welcher Seite jeder Ebene der Punkt gelegen ist, welcher den zu klassifizierenden Satz von Zahlen repräsentiert und daß das Resultat der ersten Tabellensuchoperation in einer zweiten Tabellensuchoperation in der zweiten Tabelle verwendet wird, um den Raumteil zu bestimmen, in welchem der erwähnte Punkt liegt und um damit die Klasse zu bestimmen, zu welcher die Zahl gehört.
- 2.) Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die erste Tabelle ein Paar von Eingängen enthält, daß jedes Paar einen ersten Eingang enthält, in welchem die Koeffizienten einer Ebene in der echten Form dargestellt sind und daß in einem zweiten Eingang die Koeffizienten derselben Ebene in inverser Form dargestellt sind, wobei die erste Tabellensuchoperation in der Bestimmung liegt, welcher der Eingänge jedes Paares dem zu klassifizierenden Zahlen-satz mehr angepaßt ist. - 20 -009823/1646
- 3.) Verfahren nach den Ansprüchen 1 und 2, dadurch gekennzeichnet, daß jeder Eingang der zweiten Tabelle einen Schlüssel für einen Bezeichnungssatz enthält, wobei die Benennung in einem Namen digitaler Form besteht und die zweite Tabellensuchoperation in einem Vergleich der Resultate der ersten Tabelsuchoperation mit den Schlüsseln besteht, wobei vom Speicher der Name in den Eingang gegeben wird, dessen Schlüssel mit den genannten Resultaten identisch ist.
- 4.) Verfahren nach den Ansprüchen 1 bis 3> dadurch gekenn- W zeichnet, daß zwei assoziative Speicher vorgesehen sind, wobei die erste Tabelle den einen Speicher belastet und die zweite Tabelle den anderen Speicher belastet und daß die Operationen des ersten und des zweiten Tabellensuchens gleichzeitig in den entsprechenden Speichern in Bezug auf verschiedene Sätze zu klassifizierender Zahlen stattfinden.
- 5.) Verfahren nach den Ansprüchen 1 bis 4, dadurch gekennzeichnet, daß der Satz von Zahlen in Zeichenform darstellbar ist.
- 6.) Vorrichtung zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 5» dadurch gekennzeichnet, daß der assoziative Speicher eine Anzahl von Wortregistern enthält, welche zu Paaren gruppiert sind und daß eine Einrichtung bestimmt, welches Wortregister jedes Paares einen Dateninhalt aufweist, welcher ungleich ist einem dem Speicher präsentierten Suchargument.- 21 -009823/1646
- 7.) Vorrichtung nach Anspruch 6, dadurch gekennzeichnet, daß jedes Wortregister eine Fehlanpaßleitung und eine Anzahl von assoziativen Bitspeicherzellen enthält, von denen jede ein Signal vorbestimmten Betrages abgibt, wenn der Inhalt der Zelle nicht übereinstimmt mit einem entsprechenden Bit eines dem Speicher präsentierten Suchargumentes.
- 8.) Vorrichtung nach Anspruch 7» dadurch gekennzeichnet, daß die Fehlanpaßleitungen eines Paares der Wortregister zu Eingängen eines DifferentialVerstärkers gemacht sind, welcher dem Paar zugeordnet ist.009823/1646Leerseite
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB5020268 | 1968-10-23 |
Publications (3)
Publication Number | Publication Date |
---|---|
DE1953451A1 true DE1953451A1 (de) | 1970-06-04 |
DE1953451B2 DE1953451B2 (de) | 1973-10-31 |
DE1953451C3 DE1953451C3 (de) | 1974-05-30 |
Family
ID=10455055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE1953451A Expired DE1953451C3 (de) | 1968-10-23 | 1969-10-23 | Verfahren und Vorrichtung zur maschinellen Zeichenerkennung |
Country Status (5)
Country | Link |
---|---|
US (1) | US3626381A (de) |
CA (1) | CA944081A (de) |
DE (1) | DE1953451C3 (de) |
FR (1) | FR2021332A1 (de) |
GB (1) | GB1230834A (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6085650A (en) * | 1998-02-13 | 2000-07-11 | Man Roland Druckmaschinen Ag | Printing unit for a web-fed rotary printing machine |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040042650A1 (en) * | 2002-08-30 | 2004-03-04 | Lockheed Martin Corporation | Binary optical neural network classifiers for pattern recognition |
US9070011B2 (en) * | 2010-06-18 | 2015-06-30 | Csr Imaging Us, Lp | Automated segmentation tuner |
US11875320B1 (en) | 2020-02-28 | 2024-01-16 | The Pnc Financial Services Group, Inc. | Systems and methods for managing a financial account in a low-cash mode |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL255217A (de) * | 1959-08-28 | |||
BE630286A (de) * | 1962-03-28 | |||
US3167746A (en) * | 1962-09-20 | 1965-01-26 | Ibm | Specimen identification methods and apparatus |
NL124767C (de) * | 1964-01-02 | 1900-01-01 | ||
US3348200A (en) * | 1964-08-13 | 1967-10-17 | Rca Corp | Character reader that quadrantizes characters |
US3402394A (en) * | 1964-08-31 | 1968-09-17 | Bunker Ramo | Content addressable memory |
US3389377A (en) * | 1965-07-06 | 1968-06-18 | Bunker Ramo | Content addressable memories |
US3430205A (en) * | 1966-03-24 | 1969-02-25 | Ibm | Range associative memory with ordered retrieval |
US3533085A (en) * | 1968-07-11 | 1970-10-06 | Ibm | Associative memory with high,low and equal search |
-
1968
- 1968-10-23 GB GB5020268A patent/GB1230834A/en not_active Expired
-
1969
- 1969-09-16 FR FR6932241A patent/FR2021332A1/fr not_active Withdrawn
- 1969-09-29 CA CA063,330A patent/CA944081A/en not_active Expired
- 1969-10-20 US US867694A patent/US3626381A/en not_active Expired - Lifetime
- 1969-10-23 DE DE1953451A patent/DE1953451C3/de not_active Expired
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6085650A (en) * | 1998-02-13 | 2000-07-11 | Man Roland Druckmaschinen Ag | Printing unit for a web-fed rotary printing machine |
Also Published As
Publication number | Publication date |
---|---|
US3626381A (en) | 1971-12-07 |
DE1953451B2 (de) | 1973-10-31 |
GB1230834A (de) | 1971-05-05 |
FR2021332A1 (de) | 1970-07-24 |
CA944081A (en) | 1974-03-19 |
DE1953451C3 (de) | 1974-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2909153C2 (de) | Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern | |
DE2607107C2 (de) | Wortorganisiertes Speichersystem | |
DE1549833C2 (de) | Verfahren zum Erkennen von Zeichen | |
DE69030310T2 (de) | Beschränkungsabhängig gesteuerte on-line Erkennung von handgeschriebenen Zeichen und Symbolen | |
DE3650156T2 (de) | Auf regeln basiertes datenwiederauffindverfahren und anordnung. | |
DE1075354B (de) | Verfahren und Anordnung zur automatischen Erkennung von Zeichen | |
DE2640537A1 (de) | Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen | |
DE3501272A1 (de) | Adaptives, selbstausbesserndes prozessorfeld | |
DE2943749A1 (de) | Lernende anordnung zum erkennen von mustern digitaler signale | |
DE68927625T2 (de) | Folgenkollationierungssystem zum Suchen nach einer Charakterfolge willkürlicher Länge innerhalb eines gegebenen Abstands einer Referenzfolge | |
DE4031136C2 (de) | ||
DE2532125C2 (de) | Modularbaustein für Datenverarbeitungsanlagen | |
DE1199524B (de) | Anordnung zum Auswaehlen von digitalen Datenwoertern aus einem Speicher | |
DE4129561C2 (de) | Informationsverarbeitungssystem | |
DE1953451A1 (de) | Verfahren und Vorrichtung zur maschinellen Zeichenerkennung | |
DE4210109C2 (de) | Sortiervorrichtung zum Sortieren von Daten und Sortierverfahren | |
DE2538329A1 (de) | Additionssteuersystem | |
DE2057587A1 (de) | Inhaltsadressierter Speicher | |
CH646805A5 (de) | Optisches handlesegeraet fuer maschinelle zeichenerkennung. | |
DE1234064B (de) | Vorrichtung zum maschinellen Erkennen von Zeichen mit einem Autokorrelations-funktionsgenerator | |
DE1813044A1 (de) | Verfahren zur Zeichenerkennung und Anordnung zur Durchfuehrung des Verfahrens | |
DE2033709A1 (de) | Assoziativspeicheranlage | |
AT387099B (de) | Einrichtung zur digitalen analyse von bildoder zeichenmustern | |
DE102021004193A1 (de) | Verfahren zum Domänentransfer von domänen-adaptiven Objektdetektoren | |
DE1222297B (de) | Vorrichtung zur maschinellen Zeichenerkennung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
SH | Request for examination between 03.10.1968 and 22.04.1971 | ||
C3 | Grant after two publication steps (3rd publication) | ||
E77 | Valid patent as to the heymanns-index 1977 | ||
EHJ | Ceased/non-payment of the annual fee |