DE2253193A1 - Verfahren und system zum erkennen von zeichen - Google Patents
Verfahren und system zum erkennen von zeichenInfo
- Publication number
- DE2253193A1 DE2253193A1 DE2253193A DE2253193A DE2253193A1 DE 2253193 A1 DE2253193 A1 DE 2253193A1 DE 2253193 A DE2253193 A DE 2253193A DE 2253193 A DE2253193 A DE 2253193A DE 2253193 A1 DE2253193 A1 DE 2253193A1
- Authority
- DE
- Germany
- Prior art keywords
- character
- codes
- characters
- code
- segments
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 43
- 230000015654 memory Effects 0.000 claims description 49
- 238000003672 processing method Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 15
- 239000011159 matrix material Substances 0.000 description 15
- 238000012545 processing Methods 0.000 description 14
- 238000004590 computer program Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000010921 in-depth analysis Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/421—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation by analysing segments intersecting the pattern
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
i*AI JiJM IANWAIiT Ο Ο ζ *? 1 Q "3 TBMSFON (0811) 114337 η.
S MÜNCHEN 26 - POSTFACH Sl Λ. Δ Ό O \
Ό \J
TELBOBAHMADBBSSBi
(VBBBV BBX BBUTIOHKV »ATBVTAXT) TBtKX «-M4M
J>0 . Oktober 1972
IA-2975 Beschreibung
zu der Patentanmeldung OGR SYSTEMS, INC.
Horsham, Pennsylvania, USA betreffend
Verfahren und System zum Erkennen von Zeichen
Die Erfindung bezieht sich auf automatische Schriftzeichen-Erkennungssysteme
und betrifft insbesondere zur optischen Zeichenerkennung dienende, mit analytischen Verfahren
arbeitende Maschinensysteme.
Bei bekannten Zeichenerkennungssystemen ist es üblich,
eine Videosignaldarstellung des betreffenden, in ein Rechteck eingeschlossenen Zeichens festzulegen und dann zu
versuchen, eine Signalübereinstimmung bezüglich verschiedener Bereiche oder Teilbereiche der VideosignaldarBtellung
mit einem Satz von Masken oder Schablonen herbeizuführen. Ein solches System kann als ein synthetisches System be- "
zeichnet werden, da bei ihm eine Synthese von Masken oder Merkmalen oder Schablonen, d.h. von Mustern innerhalb von
Teilbereichen des das Zeichen umschließenden Rechtecks herbeigeführt wird. Zur Konstruktion eines solchen Maskenvergleichssystems
und der Wahl der Masken, aus denen sich die verschiedenen Zeichen zusammensetzen, ist ein großer
Aufwand an Denkarbeit erforderlich. Sollen bestimmte Kosten nicht überschritten werden, ergeben sich bei einem solchen
30 9 819/0814
I POIIICHICIKOITO XUVCHBV «»1» - BATBKIIOHB HTVOTHBKBV- V. WBOHIBI.BAVK Xt)VCHBB «/·····
BBVTIOHB BAVK XOVOHBV »O/I· «00 - BATBKIIOHB TBKBIViBAVK Ht)VOHBV ····*·
2753193
System mit hoher Wahrscheinlichkeit Beschränkungen bezüglich der Schriftarten, bei denen es sich anwenden läßt.
Daher bietet dieses System nur geringe Möglichkeiten bezüglich seiner Realisierung und bezüglich eines Vorgehens,
das zu einem allgemein verwendbaren System führen würde, das sich bei den verschiedensten Schriftarten, verschiedenen
Alphabeten, verschiedenen Druckbildern sowie bei handschriftlichen Zeichen anwenden läßt·
Der Erfindung liegt die Aufgabe zugrunde, ein neuartiges und verbessertes Zeichenerkennungssystem zu
schaffen. Ferner wird durch die Erfindung ein auf analytischen Verfahren basierendes Zeichenerkennungssystem geschaffen.
Weiterhin soll ein neuartiges und verbessertes Zeichenerkennungssystem geschaffen werden, das bei einer
großen Anzahl verschiedener Schriftarten und Alphabete anwendbar ist. Schließlich soll ein System der genannten
Art geschaffen werden, das auf eine solche Weise anpassungsfähig ist, daß bestimmte Schriftarten und Alphabete
"gelernt" werden können, um eine Sammlung von Bezugsinformationen anzulegen, mit denen unbekannte Schriftzeichen
verglichen werden können.
Bei einer Ausführungsform der Erfindung basiert die Wirkungsweise eines Maschinensystems zum automatischen
Erkennen von Zeichen auf einer Analyse geometrischer Formen, die in einem Rechteck enthalten sind, durch das
das zu erkennende Zeichen abgegrenzt wird; mit Hilfe dieser Analyse werden den geometrischen Formen entsprechende
numerische Kodes aufgestellt. Mit anderen Worten, bei dem erfindungsgemäßen Maschinensystem wird eine zweidimensionale
Anordnung von Elementen des als Muster dienenden Zeichens gebildet, innerhalb welcher jedes Element eine solche Fläche
einnimmt, daß es sich einem einzigen Auflösungsvorgang zuordnen läßt; diese Elemente können mit Hilfe digitaler
Informationssignale festgelegt werden. Innerhalb jeder Reihe oder Zeile der Anordnung von Elementen werden zusammenhängende
Folgen von schwarzen Elementen als Segmente bezeich-
30981 9/08U
net bzw. identifiziert. Hierbei werden Kodes aufgestellt, die Art und Anzahl der Segmente und danach Folgen ähnlicher
Arten von Segmenten in aufeinander folgenden Keinen identifizieren. Bei dieser Ausführungsform werden auch, die
Dauer und die Orientierung der Folgen von Elementen bzw. Segmenten verschlüsselt.
Die Kodes unbekannter Musterzeichen werden mit denen
bekannter Bezugszeichen verglichen, um die Musterbuchstaben zu identifizieren. Dieses System kann sowohl nach einem
"Lernverfahren" als auch nach einem "Verarbeitungsverfahren" betrieben werden. Bei dem Lernverfahren werden dem Zeichenerkennungssystem
Proben bekannter Schriftzeichen zusammen mit ihrer Kennung als bestimmtes alphabetisches oder numerisches
Zeichen dargeboten. Bei diesem Lernverfahren werden die in den die Zeichen umschließenden Rechtecken enthaltenen
geometrischen Formen analysiert und verschlüsselt, und die geometrischen Kodes werden im Maschinenaufzeichnungsformat
zusammen mit einer Kennung des sie darstellenden Musterzeichens gespeichert, um die Sammlung von Bezugsdaten aufzubauen.
Bei dem Verarbeitungsverfahren werden die unbekannten
Musterzeichen zur Analyse dieser Zeichen in der gleichen Weise vorgegangen, wie bei dem Lernverfahren, und
Kodes werden auf ähnliche Weise entwickelt. Wenn die bestimmte geometrische Form eines unbekannten Musterzeichens
vorher während der Anwendung des' Lernverfahrens analysiert
worden ist, können die Kodes dieses Zeichens zusammen mit den Kennungen der Bezugszeichen im Maschinenspeicher aufgefunden
werden, und wenn eine Eindeutigkeit festgestellt wird, wird das unbekannte Zeichnen entsprechend identifiziert
oder erkannt.
Die Erfindung und vorteilhafte Einzelheiten der Erfindung
werden im folgenden anhand schematischer Zeichnungen
an Ausführungsbeispielen näher erläutert. Es zeigt:
Fig. 1 in einem Blockschaltbild eine Ausführungeform eines optischen Zeichenerkennungssystems;
309819/08U
2253Ί93
_ 4 —
Fig. 2 schematisch eine Ausführungsform eines in
Verbindung mit dem System nach Fig. 1 zu benutzenden optischen Detektors;
Fig. 3 in einer graphischen Darstellung die Speicherung
eines Zeichens bei dem System nach Fig. 1;
Fig. 4 in einem Fließbild ein analytisches Zeichenerkennungssystem
und veranschaulicht ein bei dem System nach Fig. 1 anwendbares Verfahren; und
Fig. 5 in einem Blockschaltbild eine Abwandlung des analytischen Zeichenerkennungssystems nach Fig. 4 zum
Betrieb nach einem Lernverfahren.
In den Figuren sind einander entsprechende Teile jeweils mit gleichen Bezugszahlen bezeichnet.
Bei dem in Fig. 1 dargestellten, insgesamt mit 10 bezeichneten System zum optischen Erkennen von Zeichen
wird ein Dokument oder ein anderer, Zeichen aufweisender Informationsträger 12 mit einer Folge von Zeichen 14, 15,
16 an einer Zeichendetektoreinrichtung 18 vorbeigeführt, die einen Satz von Signalen, und zwar bei der optischen
Zeichenerkennung einen Satz von Videosignalen erzeugt, welche die aufeinander folgenden Zeichen repräsentieren. Diese
Videosignale erscheinen in elektrischer Form in einer Leitung 20, über die sie einem Pufferspeicher 21 zugeführt
werden, der durch eine Zentraleinheit 22 eines Datenverarbeitungssystems oder eines Digitalrechners gesteuert wird.
Zu der Zentraleinheit gehört auch der Speicher 24 mit einem Adressenwähler 26, der ebenfalls durch die Zentraleinheit
22 gesteuert wird. Die Zentraleinheit liefert die dem Speicher 24 einzugebenden Datensignale über eine Vielfachleitung
28, und die dem Speicher 24 entnommenen Datensignale werden der Zentraleinheit über eine Vielfachleitung 29
zugeführt. Der Pufferspeicher 21 kann sich aus Sätzen von Registern zusammensetzen, die dazu dienen, digitale Darstellungen
der Videosignale eines Satzes von Zeichen zu
3 0 f* 8 1 9 / 0 8 U
speichern, die mit Hilfe der Detektorexnriclitung 18 abgetastet worden sind.
An die steuernde Zentraleinheit 22 sind eine Eingabeeinrichtung
30, z.B. eine Tastatur, insbesondere eine Schreibmaschinentastatur,, und eine Ausgabeeinrichtung 32,
z.B. ein Drucker, eine Schreibmaschine oder eine Steuereinrichtung, angeschlossen, damit der Zentraleinheit Eingangssignale zugeführt und Ausgangssignale entnommen werden
können. Die Zentraleinheit 22 ist über einen Wählschalter 34-mit
Klemmen der Eingabeeinrichtung 30 und der Ausgabeeinrichtung
32 verbindbar; hierbei kommt der Schalter 34- nach
Art eines einpoligen Umschalters zur Wirkung. Bei der einen Stellung des Schalters 34- arbeitet das System nach einem
Lernverfahren, bei dem Signale, die Zeichen identifizieren, welche gerade gelesen und durch die Detektoreinrichtung
18 ermittelt werden, durch einen Operator identifi- " ziert und dem System mit Hilfe der Tastatur 30 eingegeben
werden. Befindet sich der Schalter 34- in seiner anderen
Stellung, dient das Zeichen, das mit Hilfe der Detektoreinrichtung 18 ermittelt und durch die Zentraleinheit 22
zum Zweck der Zeichenanalyse und Verschlüsselung verarbeitet worden ist, dazu, das Zeichen zu identifizieren und das
identifizierte bzw. erkannte Zeichen auszugeben, z.B. das maschinell verschlüsselte Zeichen auf einem Magnetband aufzuzeichnen.
Anstelle der Erzeugung eines Ausgangssignals oder zusätzlich dazu kann der Zeichenerkennungsvorgang
zur Durchführung eines Steuervorgangs dienen; beispielsweise können in einem Postamt Briefe nach den Postleitzahlen
sortiert werden.
Das System nach Fig. 1 ist bei den verschiedensten Arten von Zeichensystemen anwendbar, und es erweist sich als
besonders vorteilhaft beim Erkennen von Zeichen, die auf das Schriftstück 12 aufgedruckt sind und optisch nachgewiesen
werden· Es sind bereits verschiedene Konstruktionen von Videodetektoren bzw. optischen Detektoren bekannt, die
bei dem System nach Fig. 1 verwendbar sind. Bei einem
309819/0814
solchen System wird gemäß Fig. 1 ein Teil des Schriftstücks 12 beleuchtet, der in Fig. 1 durch ein gestrichelt gezeichnetes
Rechteck 56 abgegrenzt ist, dessen Höhe größer ist als die Höhe der zu lesenden Zeichen, und das Schriftstück
12 wird an der Detektoreinrichtung 18 vorbeigeführt, um durch sie abgetastet zu werden. Die Detektoreinrichtung 18
liefert das Licht zum Beleuchten des Rechtecks 56 auf dem Schriftstück, und sie weist außerdem eine geradlinige
Reihe 38 (Fig. 2) von Photozellen, z.B. mit 4-8 oder 64
Photodioden oder Phototransistoren, auf, die so angeordnet sind, daß sie einen schmalen senkrechten Ausschnitt des
Zeichens abtasten, der in dem beleuchteten Rechteck 36 erscheint,
wie es in Fig. 2 schematisch dargestellt ist.
Während des Betriebs des Systems werden die Zeichen 14, 15 und 16 nacheinander abgetastet, und die Verarbeitung wird
jeweils für ein einzelnes Zeichen durchgeführt. Das Schriftstück 12 kann mechanisch schrittweise oder kontinuierlich
bewegt werden, und hierbei tasten die Dioden 40 aufeinander folgende schmale Ausschnitte des betreffenden Zeichens ab,
um Signale zu erzeugen, die die geometrische Form des Zeichens repräsentieren. Die Detektoreinrichtung 18 arbeitet
mit der.Zentraleinheit 22 und dem Pufferspeicher 21 zusammen,
um in einem Teil des Rifferspeichers eine zweidimensionale Anordnung von Signalen festzulegen, die dem
optischen Bild jedes Zeichens entspricht. Die Zentraleinheit verarbeitet die in dem Pufferspeicher 21 gespeicherten
Signale jeweils für ein vollständiges Zeichen, und um dies zu ermöglichen, werden die Zeichensignale aus dem Puffer«
speicher 21 in einem Zwischenspeicher 42 überführt. Fig. 3 zeigt den Zwischenspeicher 42 schematisch für den Fall, daß
verschiedene Elemente seiner rechteckigen Matrix digitale Signale enthalten, welche die Zahl 6 repräsentiere^ die
abgetastet worden ist. Mit anderen Worten, einige Matrix-
3098 1 9/08U
elemente enthalten binäre Bits, z.B. 1-Bits, die das
Zahlzeichen 6 repräsentieren und in Fig. 5 als Punkte von
großem Durchmesser dargestellt sind, während die übrigen Speicherelemente der Matrix Bits enthalten, die die das
Zeichen auf dem Schriftstück 12 umgebende weiße Fläche repräsentieren, bei denen es sich z.B. um O-Bits handelt, und
die in Fig. 3 nur durch die Schnittpunkte der sich kreuzenden
waagerechten und senkrechten Linien bezeichnet sind. ■ Die-durch die Photozellen 4-0 erzeugten Signale werden dem
Pufferspeicher 21 für die einzelnen Ausschnitte in der richtigen zeitlichen Beziehung und in Abhängigkeit von der
Bewegung des Schriftstücks .12 zugeführt, so daß"die aufeinander fplgenden Spalten in dem Pufferspeicher 21 und
danach in der Matrix 42 die Videoinformationen enthalten, die einander benachbarten Ausschnitten des Zeichens 16
entsprechen. Bei einer Ausführungsform der Erfindung begrenzen die Matrixelemente auf dem Schriftstück eine Fläche,
deren Höhe sich nach dem Abmessungen der Photodioden richtet, und deren Breite durch die Abtastgeschwindigkeit bestimmt
ist; jedes dieser Flächenelemente ist ein Quadrat mit
einer Seitenlänge von etwa 0,15 mm. Es wird mit einem
Schwellwertsignal gearbeitet, das so eingestellt ist, daß es die Größe einer mit schwarzer Farbe bedruckten Fläche festlegt,
die durch ein 1-Bit dargestellt werden soll. Der Ausdruck "schwarz" bezeichnet Teile des gedruckten Schrift-Zeichens
im Gegensatz zur unbedruckten Fläche des Schriftstücks; natürlich beschränkt sich die Anwendbarkeit der
Erfindung nicht auf eine bestimmte Farbe oder Druckart«
Systeme und Verfahren, die es in der beschriebenen
Weise ermöglichen, das Zeichen 16 in Form einer Matrix aus digitalen Informationssignalen so darzustellen, daß es
wahlfrei zugänglich in einer zweidimensionalen Speicheranordnung untergebracht werden kann, sind bereits bekannt.
Bei der geraden Reihe von Photozellen 40 handelt es sich lediglich um ein Beispiel für die Anwendung solcher Verfahren;
es ist nicht erforderlich, das Schriftstück 12 auf
3 OS 8 1 9 / 0 R 1 Z,
mechanischem Wege zu bewegen; vielmehr lassen sich auch verschiedene andere optische Abtastverfahren anwenden#
Beispielsweise kann man einen Lichtpunkt benutzen, um über jedem Zeichen einen Raster abzutasten und eine zweidimensionale
Anordnung von Informationssignalen in der Speichermatrix 42 zu gewinnen. Eine solche Abtasteinrichtung kann
so gesteuert werden, daß sie sich nacheinander über die einzelnen Zeichen des Schriftstücks 12 hinweg bewegt. Dieses
System beschränkt sich nicht auf einen bestimmten Satz von Zeichen oder Zeichenformen, die abgetastet werden können,
noch auf eine bestimmte Anordnung der Zeichen auf dem Schriftstück. Vielmehr läßt sich die Erfindung sowohl bei
alphabetischen und numerischen Zeichen sowie bei verschiedenen Schriftarten als auch bei verschiedenen Alphabeten
und Zahlensystemen anwenden, die sich von dem üblichen Alphabet und dem gebräuchlichen arabischen Zahlensystem unterscheiden.
Gemäß dem in Fig. 4 dargestellten Fließbild besteht der erste Arbeitsschritt, wie durch den Diagrammblock 44
angedeutet, darin, daß das Schriftstück optisch abgetastet wird; dieser Arbeitsschritt ist mit dem Betrieb des Pufferspeichers
21 koordiniert, so daß die Signale gemäß dem Diagrammblock 46 gespeichert werden können; hierbei werden die
gequantelten, aus der gedruckten Vorlage gewonnenen Videosignale einer zweidimensionalen Anordnung ähnlich der in
Fig. 3 dargestellten eingegeben. Bei dem System nach Fig. ist angenommen, daß mehrere Zeichen des gesamten Zeichensatzes
des Schriftstücks 12 abgetastet und gespeichert werden, und daß danach die einzelnen Zeichen zum Zweck der
Analyse verarbeitet werden. In der Praxis, d.h. wenn ein schnell arbeitender Universalrechnerspeicher in Verbindung
mit bestimmten logischen Schaltungen und einer zentralen Einheit benutzt wird, werden die beiden Arbeitsschritte des
Abtastens und Analysierens in einem gewissen Ausmaß unabhängig voneinander und gleichzeitig durchgeführt, so daß
sie sich zeitlich überschneiden.
9 ti I 0 / ü P 1 U
Der nächste, in Pig. 4 durch den Diagrammblock 48 bezeichnete Arbeitsschritt besteht im Wählen und Abgrenzen
des Videosignals des nächsten zu erkennenden Zeichens, und dieser Arbeitsschritt spielt sich ab, nachdem die Signale
in den Zwischenspeicher 42 überführt worden sind, was bei der Beendigung durch, den Diagrammblock 46 bezeichneten
Speicherung des Videosignals oder bei der Beendigung der Analyse des vorangehenden Zeichens geschieht, wie es in
Fig. 4 durch den Buchstaben A angedeutet ist, der die Übertragung eines Steuersignals zu der Einrichtung 48 andeutet.
Das Wählen und Abgrenzen eines Zeichens kann mit Hilfe eines beliebigen der hierfür verfügbaren bekannten
Verfahren durchgeführt werden. Eines dieser anwendbaren Verfahren besteht darin, daß eine Silhouette der senkrechten
und der waagerechten "Ansichten" des Zeichens in der Matrix 42 erzeugt wird. Mit anderen· Worten, das Eechteck 36j
innerhalb dessen ,jedes Zeichen 16 beleuchtet wird, erstreckt sich über einen Abschnitt des Schriftstücks, der eine Länge
hat, die größer ist als die bekannte Länge des zu ermittelnden Zeichens. Entsprechend hat auch die Seihe 38 von
Photozellen 40 eine größere Länge bzw. Höhe als das Zeichen 16, und diese Höhe kann bis zum Dreifachen der Höhe des Zeichens
betragen. Bei dem als Arbeitsspeicher benutzten Zwischenspeicher 42 handelt es sich um eine Speichermatrix,
der die Videosignale für das Zeichen in Form einer zweidimensionalen Anordnung eingegeben werden können; die Abmessungen
der Speichermatrix sind größer als die Abmessungen des Zeichens, so daß es sich bei den Zeicheninformationen
praktisch um eine Anordnung aus 1-Bits handelt, die von O-Bits umgeben ist. Die Silhouettierung zum Abgrenzen des
Zeichens wird zuerst in einer bestimmten Richtung durchgeführt, z.B. in der Richtung der Bitreihen«, Sämtliche Reihen
der Arbeitsfläche der Matrix 42 werden nacheinander ausgegeben und in einem Register, z.B. dem A-Register
eines Universalrechners, gesammelt. Mit anderen Worten, sämtliche 1- und O-Bits, die in der Matrix 42 die erste
X-Adresse haben, werden auf einer logischen Oder-Basis
30981 9/08U
- ίο -
in einer Zelle des Registers kombiniert, die Bits mit der nächsten X-Adresse werden wiederum auf einer Oder-Basis
in der nächsten Zelle des Registers kombiniert usw., wobei jede Gruppe von Bits, welche die gleiche X-Adresse
aufweist, der gleichen Registerzelle eingegeben wird. Das Register enthält dann eine Folge von 1-Bits, die auf der
linken Seite von einer Folge von O-Bits und auf der rechten Seite ebenfalls durch eine Folge von O-Bits flankiert ist.
Das in dem Register am weitesten links stehende 1-Bit bezeichnet die linke Einzelbildadresse des Zeichens und das
am weitesten rechts stehende 1-Bit die rechte Einzelbildadresse; wenn irgendwelche 1-Bits außerhalb der Hauptgruppe
von 1-Bits und von ihr durch O-Bits getrennt auftreten, kann man annehmen, daß es sich um Störsignale handelt, die
gelöscht werden können. Auf ähnliche Weise wird die senkrechte Silhouette dadurch gebildet, daß man auf einer logischen
Oder-Basis in dem Register sämtliche Spalten von Bits kombiniert,, Diejenigen Bits innerhalb jeder Spalte,
die die gleiche !-Adresse haben, werden in entsprechenden Registerzellen kombiniert. Die an den Enden stehenden
1-Bits bilden die oberen und unteren Einzelbildabgrenzungsbits der senkrechten Silhouette, die für das gesamte Zeichen
gilt. Dieses Verfahren zum Abgrenzen jedes Zeichens bildet nicht einen Gegenstand der Erfindung. Die Einzelbildadressen
werden gespeichert und während der gesamten Analyse des Zeichens nutzbar gemacht, und die waagerechte
Silhouette dient als Parameter, der die Breite des Zeichens bestimmt, während die senkrechte Silhouette als Parameter
festgehalten wird, der die Höhe des Zeichens bestimmt. Man kann spezielle logische Schaltungen in der Zentraleinheit
22 verwenden, um diesen Zeichenabgrenzungsvorgang durchzuführen.
Nach dem Festlegen der X- und Y-Begrenzungsadressen des Zeichens wird die Videoinformation, die sich auf das
gesamte innerhalb des Begrenzungsrechtecks befindliche Zeichen bezieht, gebildet, in Form von 1- und O-Bits innerhalb
elementarer Flächen gequantelt und so behandelt^ als
3098 1 9/08 U
ob innerhalb jedes Flächenelements ausschließlich eine
Schwarzinformation oder ausschließlich eine Weißinformation
vorhanden wäre, die einem Auflösungselement der Detektoreinrichtung, d.h. einer der Dioden 40, entspricht. Die
Detektoreinrichtung bestimmt auf bekannte Weise eine Signalschwelle derart, daß das durch eine bestimmte Photodiode
40 erzeugte Signal einem bestimmten Menge von von schwarzer
Färbung in dem zugehörigen Flächenelement des Schriftstücks entsprechen muß, damit dieses Flächenelement als ein 1-Bit
identifiziert wird. Die zwischen den X- und T-Begrenzungsadressen
liegende Zeichenmatrix besteht aus waagerechten schmalen Ausschnitten oder Reihen, die jeweils die Dicke
eines Auflösungselements haben, und deren Breite der »Breite
des Zeichens längs der betreffenden Reihe entspricht» Jede solche Reihe enthält eine Kombination von 1- und O-Bits,
die den schwarzen bzw. weißen Segmenten innerhalb der betreffenden Reihe entsprechen, oder sie kann sich ausschließlich
aus 1-Bits zusammensetzen, was einer durchgehenden schwarzen Linie in der betreffenden Reihe entspricht.
Man kann diese Analyse in de? senkrechten Richtung erweitern, so daß man schmale senkrechte Ausschnitte oder Spalten
mit der Breite eines Auflösungselements erhält, deren Höhe gleich der Höhe des Zeichens ist. Auf dieses Verfahren der
Analyse wird im folgenden näher eingegangen.
Beginnt man mit der Reihenanalyse des Zeichens gemäß Fig. 4, besteht die einleitende Operation in der in Fig. 4
durch den Diagrammblock 50 bezeichneten Operation, die dazu
dient, Signale für die Begrenzungen und Längen der Reihensegmente zu erzeugen. Ein Segment ist als eine lückenlose
Folge schwarzer Elemente definiert, die durch 1-Bits dargestellt wird. Die Op-eration entsprechend dem Diagrammblock
50 dient dazu, Daten zu ermitteln, die für die Anfangs-
und End-X-Adressen jedes Segments in jeder Reihe
und damit für die Länge jedes Segments gelten« Geht man beim Analysieren einer Reihe von dem ersten 1-Bit auf der
linken Seite aus, so bestimmt dieses Bit die linke Begrenzung eines Segments, und das letzte 1-Bit einer lückenlosen
3 0 Γ: H I 9 / 0 M 4
Folge von 1-Bits, auf die ein O-Bit folgt, bestimmt die
rechte Begrenzung des betreffenden Segments. Die Differenz zwischen den X-Adressen der linken und der rechten Begrenzung
bestimmt die Länge des Segments. Handelt es sich bei einem Segment um ein in der Mitte zwischen, den Enden einer
Reihe liegendes Segment, wird dieses Segment dadurch identifiziert, daß es auf beiden Seiten von O-Bits flankiert
ist; handelt es sich um ein endständiges Segment, wird es dadurch identifiziert, daß es auf einer Seite ein O-Bit
aufweist, während das auf der anderen Seite stehende Bit der Begrenzungsadresse entspricht.
Bei der als Beispiel gewählten Matrix 42 nach Fig. weist das unterste Segment des Zeichens, d.h. die Reihe
mit der Adresse Y-2, auf der linken Seite eine Begrenzung auf, die mit der Adresse X-4 beginnt, während die Begrenzung
auf der rechten Seite der Adresse X-10 entspricht; somit hat dieses Segment eine Länge von 7 aufeinander folgenden
1-Bits. Bei der nächsten Reihe mit der Adresse Y-3 liegt die linke Begrenzung bei X-3 und die rechte Begrenzung
bei X-11, d.h. es ist eine waagerechte Folge von neun
1-Bits für dieses Segment vorhanden. Bei der Reihe mit der Adresse Y-4 liegt die linke Begrenzung bei X-2, die rechte
Begrenzung des ersten Segments bei X--6, die nächste linke Grenze bei X-9 und die darauf folgende rechte Begrenzung
bei X-12. Somit sind in der Reihe Y-4 zwei Segmente identifiziert.
Bei jeder der vier nächsten Reihen werden zwei Segmente auf ähnliche Weise identifiziert. Danach enthält
jede der nächsten Reihen T~9 und Y-10 jeweils nur ein Segment,
und diese Segmente unterscheiden sich bezüglich ihrer Länge; in den Reihen Y-9 und Y-10 sind die Segmente
lang, während sie bei den weiteren, sich nach oben anschließenden Reihen Y-11 bis Y-16 kurz sind.
Hierauf wird der in Fig. 4 durch den Diagrammblock angedeutete Arbeitsschritt durchgeführt, der darin besteht,
daß eine Reihensegment-Kodetabelle nach Anzahl und Länge aufgestellt wird. Beim Analysieren einer großen Auswahl
3 Ü b 8 1 9 / Ü ΓΪ 1 L
verschiedener Schriftarten sowohl bei alphabetischen Zeichen als auch bei Zahlzeichen hat es sich gezeigt, daß
sich zwei Merkmale der Segmente ausnutzen lassen, und zwar einerseits die Anzahl der Segmente-und andererseits die
Länge der Segmente. Die Datenverarbeitungsanlage wird so betrieben, daß maschinenlesbare Aufzeichnungen und den
Kategorien der Segmente entsprechende Maschinensignale erzeugt werden. Außerdem werden Kodes in Form kombinatorischer
Signale in digitaler Gestalt benutzt, um die Informationen in einer maschinell verarbeitbaren Form festzulegen.
Nachstehend ist eine Form eines Kodes angegeben, der zum Klassifizieren der Segmente dient, und bei dem es sich
gezeigt hat, daß er bei den verschiedensten Schriftarten, und zwar sowohl bei maschinell gedruckten Zeichen als auch bei
handgeschriebenen Druckbuchstaben, anwendbar istj
0: eine Reihe mit einem einzigen kurzen Segment;
1: eine Reihe mit einer beliebigen Anzahl von Segmenten, bei denen das längste Segment als "lang"
zu bezeichnen ist, da seine Länge z.B« die halbe Breite des Zeichens überschreitet;
2: eine Reihe mit zwei kurzen Segmenten; und 3: eine Reihe mit drei oder mehr kurzen Segmenten»
Die Erfahrung hat gezeigt, daß nur eine sehr geringe Informationsmenge verloren geht, wenn man keine Unterscheidung
zwischen drei oder mehr als drei Segmenten trifft. Hierbei handelt es sich jedoch zum Teil um eine willkürliche
Maßnahme bei der Kpnstruktion der analytischen Steuereinrichtung, die in bestimmten Fällen variiert werden kann.
Auch bezüglich der Länge der in einer Reihe enthaltenen Segmente hat die Erfahrung gezeigt, daß es nur erforderlich
ist, zwischen "langen" Segmenten, deren Länge z.B. die halbe Zeichenbreite überschreitet, und "kurzen" Segmenten zu
unterscheiden, die eine geringere Länge haben. Bei manchen Schriftarten oder bestimmten anderen Alphabeten oder Zeichensystemen
kann es sich jedoch als zweckmäßiger erweisen, eine Unterteilung in kurze, mittellange und lange Segmente
vorzunehmen, und eine solche Unterteilung, hat sich tat-
30981 9/08U
sächlich bei der im folgenden beschriebenen Spaltenanalyse als vorteilhaft erwiesen. Die Analyse wird möglichst weitgehend
unabhängig von den absoluten Abmessungen der Zeichen durchgeführt, und im Hinblick hierauf werden die Abmessungen
jedes Segments dadurch in Beziehung zu den Gesamtabmessungen
des Zeichens gebracht, daß der Parameter der Zeichenbreite als Basis für den Vergleich bei jedem Reihensegment
benutzt wird. Mit anderen Worten, bei dieser Reihenanalyse und dem durch den Diagrammblock 52 angedeuteten Verschlüseelungsvorgang
wird jedes Segment mit einer Hälfte der Zeichenbreite verglichen, und wenn das betreffende Segment
die gleiche Länge hat wie die Zeichenbreite oder eine größere Länge, wird es als langes Segment identifiziert; anderenfalls
wird das Segment als kurzes Segment identifiziert.
Auf der Basis der bis jetzt gewonnenen Informationen wird eine Reihensegment-Kodetabelle (siehe folgende Tabelle I)
aufgestellt und von bestimmten Teilen des Speichers zusammen mit einem Kode für jede Reihe aufgenommen. In der Tabelle
I sind die Reihenadressen der Deutlichkeit halber als die Y-Adressen des Zeichens "6" nach Fig. 3 angegeben, d.h.
nicht in Form der Maschinenadressen des Speichers, die bei dem betriebsfähigen System tatsächlich benutzt würdeno
Außerdem sind Kodebezeichnungen angegeben, um dem Leser die Identifizierung der in der Tabelle I aufgeführten Kodes
zu erleichtern·
3098 13/08U
2253 | 193 | - 15 | - |
■Tabelle I | |||
Kode | Kodebezeichnung | ||
Reihe | 1 | langes Segment | |
Υ-2 | 1 | langes Segment | |
Y-3 | 2 | zwei kurze Segmente | |
Υ-4 | 2 | zwei kurze Segmente | |
■ ϊ-5 | 2 | zwei kurze Segmente | |
Υ-6 | 2 | zwei kurze Segmente. | |
Υ-7 | 2 | zwei kurze Segmente | |
Υ-8 | 1 · | langes Segment | |
Υ-9 | 1 | langes Segment | |
Υ-10 | 0 | kurzes Einzelse^ient | |
Υ-11 | 0 | kurzes Einzelsegment | |
Υ-12 | 0 | kurzes Einzelsegment | |
Υ-13 | 0 | kurzes Einzelsegment | |
Υ-14- | 1 | langes Segment | |
Υ-15 | 0 | kurzes Einzelsegment | |
Υ-16 |
Nach der Fertigstellung der Reihensegment-Kodetabelle wird der in Fig. 4 durch aan Diagrammblock 5^ angedeutete
Arbeitsschritt durchgeführt, der darin besteht, daß eine Kodetabfeelle für Folgen von Reihen, Zeitdauern und Orientierungen
aufgestellt wird. Die Zentraleinheit 22 identifiziert Folgen von Reihen, die den gleichen Segmenttyp aufweisen
bzw. durch den gleichen Kode bezeichnet sind. Gemäß der vorstehenden Tabelle I der Reihensegmentkodes ist den
Reihen mit den Adressen Y-2 und Y-3 jeweils der Kode 1 zugewiesen, eo. daß sich eine Folge von zwei Reihen mit langen
Segmenten ergibt. Die Reihen Y-4 bis Y-8 bilden eine Folge von Reihen mit dem Kode 2, von denen jede zwei kurze Segmente
enthält, so daß sich eine Folge von fünf solchen Reihen ergibt. Für die Reihen Y-9 und Υ-1Θ gilt der Kode 1,
d.h. es ergibt sich eine Folge mit der Dauer 2S die zwei
Reihen mit langen Segmenten entspricht. Für die Reihen Y-11
bis Y-14- gilt der Kode 0 und die Dauer 4·» Bei der Reihe
Y-15 handelt es sich um eine einzige Reihe mit dem, Kode 1,
so daß sich eine Folge m±\; der Dauer 1 ergibt» Die Reihe
3 0 9 8 1 9 / 0 8
Y-16 ist eine einzige Reihe mit dem Kode 0, die somit eine
Folge mit der Dauer 1 bildet.
Wenn man für den Augenblick die Dauer der Folgen unberücksichtigt läßt, ergibt sich die nachstehende Folge von
Kodes:
12 10 10
Dieses Kodesystem wird in der Praxis dazu benutzt, Informationen festzulegen, die sich auf Dauerfolgen beziehen,
d.h. Folgen, die zwei oder mehr Reihen mit dem gleichen Kodetyp umfassen. Außerdem wird eine einzelne
Reihe, deren längstes Segment als langes Segment betrachtet wird, als Dauerfolge behandelt, während jede einzelne
isolierte Reihe, die kein langes Segment enthält, nicht als Dauerfolge betrachtet wird. Immer dann, wenn auf eine Dauerfolge
eine solche unterbrochene Folge folgt, wird die Dauer der Dauerfolge um 1 erhöht, und die unterbrochene Folge
wird fallen gelassen. Somit legt der Verfahrensschritt 5M-die
Information in Form der nachstehenden Tabelle von revidierten Reihenfolgekodes fest, in der die entsprechenden
revidierten Dauerwerte unter den zugehörigen Kodeziffern erscheinen:
12 10 1
2 5 2 4 2
2 5 2 4 2
Es hat sich gezeigt, daß man die genauen Werte der Folgendauer durch relative Dauerwerte ersetzen kann, wobei
die Zeichenhöhe die Vergleichsbasis bildet. Mit anderen Worten, die Reihendauerwerte werden als "lange Folgen"
kodiert und durch 1-Bits dargestellt, während die "kurzen Folgen" durch 0-rBits dargestellt werden. Ein geeignetes
Konstruktionskriterium für kurze Segmentfolgen mit dem Kodetyp 0 oder 2 oder 3 besteht darin, daß es sich um eine
"lange Folge" handelt, wenn ihre Dauer gleich einem Drittel oder mehr der Zeichenhöhe ist. Eine Reihen-Folge von langen
Segmenten wird als Folge von langer Dauer betrachtet, wenn
3098 1 9/081A
ihre Dauer gleich 3 oder mehr ist. Bei dem in Fig. 3 als Beispiel dargestellten Zeichen "6" mit der Zeichenhöhe 15»
bei dem ein Drittel der Zeichenhöhe gleich 5 ist, kann man die nachstehenden Reihendauerkodes dem vorstehenden Beispiel
zuordnen:
12 10 1 Reihen-Folge-Kode
2 5 2 4 2 Reihendauerwerte
0 1 0 0 0 Reihendauerkode
Ferner wird ein Folgeorientierungskode benutzt, da es sich gezeigf hat, das bedeutsame Informationen, die die
Geometrie eines Zeichens charakterisieren, in der Orientierung der Folgen kurzer Reihensegmente enthalten sind. Beispielsweise
beginnt bei dem Zeichen "Z" ein Schrägstrich, der einer Folge von kurzen Segmenten entspricht, am linken
unteren Ende des Zeichens,,, und diese Folge endet am rechten
oberen Ende des Zeichens. Das Zeichen "S" weist eine Folge von kurzen Segmenten auf, die auf der rechten Seite nahe dem
unteren Ende beginnt und auf der linken Seite nahe dem oberen Ende endet. Das Zeichen 11L" weist eine Folge von kurzen
Segmenten auf, die auf der linken Seite am unteren Ende bedingt und sich auf der linken Seite bis zum oberen Ende
fortsetzt. Analytische Kode werden festgelegt, die von absoluten Abmessungen unabhängig sind, indem Abschnitte der
Zeichenbreite festgelegt werden, innerhalb welcher die verschiedenen Begrenzungen der Segmente liegen können. Bei
einer Ausführungsform der Erfindung werden die Kodes so festgesetzt, daß dann, wenn irgendein Teil eines kurzen
Segments im linken Drittel der Zeichenbreite liegt, dieses Segment für die Zwecke der Orientierungskodifizierung als
nach links gerichtet betrachtet wird; ist dies nicht der Fall, wird dann festgestellt, ob irgendein Abschnitt des
kurzen Segments im mittleren Drittel der Zeichenbreite liegt, woraufhin das Segment als mittenorientiert behandelt
wird; ist auch dies nicht der Fall, befindet sich das Segment im rechten Drittel der Zeichenbreite, und daher wird
es als nach rechts orientiert behandelt. Bei den nachste-
309819/08U
henden Kriterien für den Orientierungskode wird die Orientierung
des untersten Segments einer Folge mit derjenigen des obersten Segments der Folge von kleinen Segmenten wie
folgt verglichen:
O: von links nach links
1: von links zur Mitte
2: von links nach rechts
3: von der Mitte nach links
4·: von der Mitte zur Mitte
5: von der Mitte nach rechts
6: von rechts nach links
7J von rechts zur Mitte
8: von rechts nach rechts
Bei dem gemäß Fig. 3 als Beispiel gewählten Zeichen "6" gilt der Orientierungskode 1 für eine Folge von Reihen
mit kurzen Segmenten für die Folge, die an der Adresse Y-11 im linken Drittel der Zeichenbreite beginnt und sich bis
zur Adresse Y-14 fortsetzt, wo das betreffende Segment im
mittleren Drittel der Zeichenbreite liegt. Mit anderen Worten, diese Folge von kurzen Segmenten verläuft von links
zur Mitte.
Zusammenfassend ist festzustellen, daß der Verfahrensschritt 54- bewirkt, daß eine Kodetabelle (siehe Tabelle
III weiter unten) aufgestellt wird, die drei Kodes enthält, und zwar erstens einen Reihen-Folge-Kc.de, zweitens einen
Dauerkode für die Folgen von Reihen und drittens einen Orientierungskode für etwa vorhandene Folgen von Reihen mit
kurzen einzelnen Segmenten. Die Ergebnisse dieser Reihenanalyse und der Verschlüsselung des Zeichens "6" nach
Fig. 3 sind in der folgenden Tabelle II zusammengestellt.
12 10 1 Reihen-Folge-Kode
0 10 0 0 Dauerkode _ _ _ ι _ Orientierungskode
309819/08U
Nach dem Fertigstellen der Reihen-Folge-Kodetabelle (Tabelle II) im Verlauf des Arbeitsschritts 54 führt die
Maschine den nächsten Arbeitsschritt $6 nach Fig. 4 durch,
der darin besteht, daß Reihenkodes als Speicheradressen festgelegt werden. Die Reihen-Folge-Kodes nach der Tabelle
II repräsentieren ein bestimmtes Zeichen, und die Zuordnung dieser Kodes zu den betreffenden Zeichen wird in dem einen
wahlfreien Zugriff ermöglichenden Hauptspeicher 24 des Rechners gespeichert. Wegen der zahlreichen möglichen Abweichungen
bei gedruckten Zeichen sowie wegen der regellosen und verschiedenartigen Effekte, die bei der Verarbeitung und
dem Nachweisen von Videosignalen auftreten, könrte sich eine übermäßig große Anzahl von Kodes ergeben, so daß man einen
unerwünscht großen Speicher benötigen und sich die Verarbeitungszeit übermäßig verlängern würde.
Das Speichersystem, 'von dem es sich gezeigt hat, daß es sich als geeignet erweist, die große Anzahl von Kodes
zu verarbeiten, die jeweils einem bestimmten Zeichen zugeordnet sind, und die sich aus der großen Anzahl von Abweichungen
ergeben, welche bei jedem Zeichen auftreten können, basiert auf der Verwendung der in der Tabelle II
aufgeführten Folgekodes zum Festlegen der Speicheradres- ,
sen. Mit anderen Worten, das System macht Gebrauch von einem Hechnerwort, das an einer bestimmten Adresse gespeichert
ist, wo das Rechner- oder Maschinenwort alle einem Kode zugeordneten Zeichen identifiziert, während die Adresse den
betreffenden geometrischen Kode identifiziert. Beispielsweise hat ein Wort mit 10 Bits eine Bitstelle für jede der
Ziffern 0 bis 9, und wenn ein Bit den Wert "1" hat,
trifft der Kode für die zugehörige Ziffer in der nachstehend
gezeigten Weise zu:
Bitstelle 9 87 6 545 210
00010 0 0000
Dieses Maschinenwort repräsentiert einen Kode, der für das Zeichen "6" und nur für dieses zutrifft.
30981 9/08U
2253Ί93
Die Speieheradreseen basieren auf den drei folgenden
Kriterien:
a) Die Anzahl der Folgen in dem Folgekode; beispielsweise würde eine mit der Hand nur als senkrechter Strich
gezeichnete"1" nur eine einzige Folge aufweisen; ein "U"
könnte zwei Folgen enthalten; bei einem "0" kämen drei Folgen in F^age usw., und bei dem Beispiel des Zeichens
"6" nach Fig. 3 wurden sich fünf Folgen ergeben; bei verschiedenen
anderen Zeichen würde die Anzahl der Folgen noch größer sein; es hat sich als zweckmäßig erwiesen, bis zu
acht Folgen vorzusehen;
b) die bestimmte Folge des für mehrere Folgen geltenden Kodes, die adressiert wird, so daß festgelegt wird, ob es
sich um die erste, die zweite, die dritte usw. Folge handelt;
c) der Kode, z.B. 0, 1, 2 oder 3, der für jede bestimmte Folge gilt.
Bei dem Beispiel des Zahlzeichens "6" nach Fig. 3» für das die Kodes nach der Tabelle II gelten, gibt es
eine Serie von Basisadressen B^. für ein Zeichen mit einer
Reihengeometrie von fünf Folgen; die gleiche Basisadresse gilt auch für Jede andere Reihengeometrie von 5 Folgen.
Die Basisadresse der ersten Reihen-Folge lautet Bcq, und
hierbei handelt es sich um die Adresse für die Kode-0, wenn dieser bei der ersten Reihen-Folge angewendet wird.
Die Adresse Bc0 + 1 ist die Adresse für die erste Reihen-Folge
mit dem Kode 1; die Adresse B1-Q + 2 ist die Adresse
für die erste Reihen-Folge mit dem Kode 2, und die Adresse + 3 ist die Adresse für die erste Reihen-Folge mit dem
Kode 3· Entsprechend ist eine Basisadresse B1-/, für die
zweite Reihen-Folge vorhanden, und die Adresse B1-,, wird
für den Kode 0 verwendet, während die Adresse Br/, + 1 für
den Kode 1 verwendet wird, usw.; zu den weiteren Adressen gehören eine Basisadresse Β,-ρ und drei Zwischenadressen
30981 9/08U
für die dritten Reihen-Folgen mit den Kodes 0 bis 3> eine Basisadresse B,-* und drei Zwischenadressen für die vierten
Reihen-Folgen mit den Kodes 0 "bis 3 sowie die Basisadresse B,-^. und drei Zwischenadressen für die fünften Reihen-Folgen
mit den Kodes 0 bis 3· Bei der Basisadresse kann es sich um eine beliebige geeignete echte Speicheradresse
handeln, aus der sich die übrigen Adressen in der beschriebenen Weise leicht ableiten lassen.
In der Praxis wird B^. als Basisadresse der i-Folge
benutzt, wobei i die Gesamtzahl von Folgen, z.B. von 1 bis 8, bezeichnet, während j eine bestimmte Folge der Gruppe
identifiziert, und zwar bei diesem Beispiel fünf Folgen vom Reihentyp. Bei dem in der Tabelle II angegebenen Kode
für das Zeichen "6" ergeben sich für die fünf Folgekodes die Speicheradressen Bcq + 1, B1-,, + 2, B1-O + 1» B53 + O
und Bn^. + 1» die den Kodes 1, 2, 1, O, 1 für diese fünf
Folgen entsprechen.
Untersuchen wir den Inhalt der Speicheradresse Bcq +' 1, erwarten wir, daß folgende Folgenbezeichnungswort
zu finden:
1101101000
Mit anderen Worten, an den Bitstellen 3» 5f 6, 8 und
befinden sich 1-Bits und an den übrigen Bitstelle.n O-Bits.
Diese Speicherdarstellung zeigt an, daß die Zeichen 3» 5» 6, 8 und 9 unter der Annahme, daß ,jedes Zeichen eine Geometrie
mit fünf Folgen aufweist, jeweils in ihrer untersten Reihe eine lange Segmentfolge mit dem Kode 1 aufweisen.
Die übrigen Zeichen O, 1, 2, 4- und 7 haben geometrische
Verhältnisse, die nicht zu einem Kode für fünf Folgen führen, oder ihre erste oder unterste Reihen-Folge wird nicht
durch den Kode 1 bezeichnet·
Zur Handhabung des Dauerkodes nach der Tabelle II wird für jede Klasse von Reihen-Folgen eine andere Basisadresse
festgelegt, z.B. die Basisadresse Dc0 für die
309819/08U
für das Zeichen "6" geltende, fünf Folgen umfassende Klasse vom Beihentyp. Der Dauerkode, bei dem es sich um einen Kode
mit fünf Bits für die Gruppe von Folgen mit fünf Reihen handelt, bedingt das Vorhandensein von 32 möglichen Adres-r
sen, die dieser Anzahl der möglichen Kodekombinationen entsprechen. Alternativ und vorzugsweise wird das Adressiersystem
angewendet, das für die Reihen-Folge-Kodes vorgesehen ist, und für jede der Reihen-Folge-Dauern wird mit einer
gesonderten zusätzlichen Basisadresse gearbeitet. Mit anderen Worten, für die fünf Dauerwerte einer Gruppe mit fünf
Folgen werden fünf zusätzliche Basisadressen D1-,., Dcp»
Vcxi ^5/f» D55 verwendet. Die Basisadresse entspricht der
Dauer des Kodes 0, und die nächste Zwischenadresse entspricht
der Dauer des Kodes 1, wobei man die Zwischenadresse durch Addieren von 1 zu der zugehörigen Basisadresse
erhält.
Zur Handhabung der Orientierungskodes nach der Tabelle
Il wird vorzugsweise eine Basisadresse P für alle Orientierungskodes
ohne Rücksicht auf die Anzahl der Folgen benutzt, und dies gilt auch für den Orientierungskode 0 für
die betreffende Folge. Außerdem werden acht Zwischenadressen für jede Reihen-Folge benutzt, um die Kodes 1 bis 8
zu handhaben. Man kann ohne Rücksicht auf die tatsächliche Anzahl der vorhandenen Reihen-Folgen auch nur drei oder vier
Folgen von kurzen Segmenten vorsehen, da im allgemeinen ein Zeichen höchstens zwei solche Folgen enthalten kann.
Das Vorhandensein einer kurzen Folge wird durch den Kode für den Reihen-Folge-Kode angezeigt, der erkannt und als
Vorbedingung für das Festlegen der Speicheradressen für die Orientierungskodes benutzt wird. Bei dem als Beispiel
gewählten Zeichen "6" und den Kodes nach der Tabelle II gilt der Orientierungskode somit nur für die vierte Folge,
und die Adresse für diese Kode-1 lautet PfL-
Bei dem soeben beschriebenen Speicheradressiersystem
hat es sich als möglich erwiesen, ein Speichersystem aufzubauen, bei dem etwa 500 Bezeichnungswörter für ein
3 0 9 8 1 9 / 0 8 U
Zeichenkodiersystem benötigt werden, bei dem maximal
sieben oder acht Folgen vorkommen. Zwar ist die Anzahl der
benutzbaren Folgen grundsätzlich nicht begrenzt, doch hat es sich gezeigt, daß sieben oder acht Folgen .für zahlreiche
Maschinenschriftarten ausreichen« Die tatsächliche Anzahl
der Kodes, die durch ein solches Kodiersystem ermöglicht wird, liegt im Bereich von Millionen oder dem Zehnfachen
davon, doch würden die meisten dieser Kodes praktisch unbenutzt bleiben. Somit ermöglicht dieses ßpeicheradressiersystem
die Benutzung von Speichern zweckmäßiger Größe zum Verarbeiten der Kodes, die in der Praxis tatsächlich aufgestellt werden. <?
Nach dem Festlegen der Eeihenkodes als Speicheradressen wird der Arbeiteschritt 58 nach Fig. 4- durchgeführt, der
dazu dient, dem Speicher die Zeichenbezeichnungswörter zu entnehmen. Jede der durch den Verfahrensschritt 56 entsprechend
den Reihenkodes festgelegten Speicheradressen wird benutzt, um d,em Speicher ein entsprechendes Zeichenbezeichnungswort
zu entnehmen. Dieser Satz von Bezeichnungswörtern
repräsentiert durch die verschiedenen darin enthaltenen 1-Bits sämtliche Zeichen, die einen beliebigen Reihenkode
oder mehrere der Reihenkodes enthalten, die durch den Arbeitsschritt 5^ festgelegt worden sind. Gemäß Fig. 4- wird
dann mit diesen Daten der nächste Arbeitsschritt 60 durchgeführt, der dazu dient, den logischen Schnittpunkt zwischen
Zeichenbezeichnungen zu ermitteln. Mit anderen Worten, bei allen entsprechenden Bitstelleti. der Bezeichnungswortregister
werden die Ausgangssignale gleichzeitig bezüglich ihrer
logischen Schnittpunkte geprüft. Wird ein Universalrechner benutzt, besteht ein hierzu geeignetes Verfahren darin,
den Und-Befehl des Rechners zu benutzen, so daß eine logische Und-Funktion im Α-Register des Rechners bezüglich
der entsprechenden Bits der beiden ersten Bezeichnungswörter und danach bezüglich des Ergebnisses mit dem nächsten
Bezeichnungswort durchgeführt wird usw. Dieser Arbeitsschritt 60 wird bei jedem Bezeichnungswort für jeden Iteihen-Folge-Kode,
jeden Dauerkode und jeden Orientierungskode
.309819/081 k
- 24 durchgeführt.
Hierauf wird gemäß Fig. 4 durch den Arbeitsschritt 62 festgestellt, ob nur eine einzige Bitstelle des resultierenden,
in dem Α-Register benutzten Schnittpunktes ein 1-Bit ist. Wenn dies der Fall ist, wird gemäß Fig. 4 die
Durchführung des nächsten Arbeitsschritts 64 zum Dekodieren des Bezeichnungswort-Schnittpunktes durchgeführt, und
hierdurch wird das betreffende Zeichen aus der Bitstellung des das einzige 1-Bit enthaltenden Bezeichnungsworts ermittelt.
Der nachfolgende Verfahrensschritt 66 liefert ein Ausgangssignal, das den Namen oder das Symbol des Zeichens
bezeichnet oder die Durchführung eines bestimmten zugehörigen Steuervorgangs bewirkt. Nunmehr bewirkt die Steuereinrichtung
A, daß der Rechner zu dem anfänglichen Arbeitsschritt 48 zurückkehrt, der dazu dient, die Video- und
Begrenzungsinformationen für das nächste Zeichen auszuwählen, woraufhin sich sämtliche vorstehend beschriebenen
Arbeitsschritte bezüglich dieses nächsten Zeichens wiederholen.
Wird festgestellt, daß die Reihenanalyse gemäß dem Arbeitsschritt 62 nicht zu einem einzelnen bezeichneten
Zeichen führt, wird gemäß Fig. 4- eine Spaltenanalyse mit Hilfe des Arbeitsschritts 68 durchgeführt, durch den die
Spaltensegmentbegrenzungen festgelegt werden; dieser Arbeitsschritt ähnelt dem Arbeitsschritt 50» abgesehen davon,
daß die Segmente in den Spalten analysiert werden, um ihre obere und ihre untere Begrenzung und damit auch ihre Länge
zu ermitteln.
Hierauf wird gemäß Fig. 4 der Arbeitsschritt 70 durchgeführt,
um eine Spaltensegment-Kodetabelle nach Anzahl und L^nge aufzustellen. Der Arbeitsschritt 70 ähnelt dem
Arbeitsschritt 55» abgesehen davon, daß sich ein abgeänderter Kode bei maschinellem Druck von arabischen Zahlen
und Buchstaben des Alphabets als besser geeignet erwiesen hat. Mit anderen Worten, die Spaltenkodes 0, 1, 2 und 5
haben den gleichen Aufbau wie die Kodes für die Reihen, nb-
3 Π ti 8 1 9 I 0 8 1 U
gesehen davon, daß ein langes Spaltensegment als ein solches
definiert ist, dessen Höhe drei Vierteln der Spaltenhöhe oder mehr entspricht. Außerdem werden Kodes 4 und 5 bei
einer Spalte benutzt, die ein oder mehr Segmente enthält, wobei das längste-Segment eine "mittlere" Länge hat, und
wobei der Mittelpunkt des Segments in der unteren Hälfte der Spaltenhöhe (Kode 4). liegt, oder wobei der Mittelpunkt
in der oberen Hälfte der Spaltenhöhe (Kode 5) liegt. Der Ausdruck "mittlere Länge" wird bei Längen benutzt, die der
halben Höhe des Zeichens entsprechen, zu denen jedoch keine Segmente gehören, die drei Viertel der Spaltenhöhe einnehmen.
Anstelle der Bezeichnungen "mittlere Länge" oder "große Länge" für die Segmente kann man auch andere relative
Größenbezeichnungen verwenden.
Bei dem in Fig. 3 als Beispiel dargestellten Zeichen
"6" ist zu erkennen, daß die erste Spalte auf der linken Seite bei der Adresse X-2 ein kurzes Segment enthält,
dessen Länge kleiner ist als die halbe Zeichenhöhe, während sich in der zweiten Spalte bei der Adresse X-3 ein Segment·
von mittlerer Länge befindet, dessen Länge etwas größer ist als die halbe Zeichenhöhe. Der Mittelpunkt dieses Segments
von mittlerer Länge liegt in der unteren Hälfte des Rechtecks 42, und daher wird diesem Segment der Kode 4 zugewiesen,
Die für die Spaltensegmente geltenden Kodes sind in der folgenden Tabelle III zusammengestellt:
Tabelle | III | 1 U |
Spalte | Kode | |
X-2 | O; | |
X-3 | 4 | |
X-4 | 1 | |
X-5 | 2 | |
X-6 | 2 | |
X-7 | 3 | |
X-8 | 3 | |
X-9 | 3 | |
X-10 | 3 | |
X-11 | O | |
X-12 | O | |
309819/08 |
Nunmehr wird gemäß Fig. 4 der Arbeitsschritt 72 durchgeführt, der dazu dient, eine Kodetabelle für Spaltenfolgen,
Dauerwerte und Orientierungen aufzustellen· Dieser Arbeitsschritt ähnelt dem beschriebenen Arbeitsschritt 54
zum Aufstellen einer Kodetabelle für die Reihen-Folgen.
Es ist ersichtlich, daß die in der Tabelle III angegebenen Segmente die Gestalt der nachstehenden Kodefolgen annehmen:
0 4 12 3 0
Da das erste kurze Spaltensegment nicht aufrechterhalten wird, während die beiden nächsten Segmente eine mittlere
bzw. eine große Länge haben, wird die kurze, nicht aufrechterhaltene Folge fallen gelassen, während die Segmente
mit der mittleren bzw. der großen Längs festgehalten werden, um den nachstehenden Folgekode zu erzeugen, unter
dem die entsprechenden Werte für die Dauer angegeben sind.
4 12 3 0
112 4 2
112 4 2
Mit Ausnahme der Kode-3-Folge sind alle diese Folgen
kurz, so daß sich der nachstehende Dauerkode ergibt:
0 0 0 10
Auch bei den Spaltenfolgen wird ein Folgeorientierungskode benutzt, der ähnlich aufgebaut ist wie der bei den
Reihen angewendete Orientierungskode für Folgen kurzer Segmente, abgesehen davon, daß die Spalten so behandelt
werden, als ob sie untere, mittlere oder obere Segmente enthielten (im Gegensatz zu den linken, mittleren oder
rechten Segmenten innerhalb der Reihen), und der Zeichenhöhenparameter
wird benutzt, um festzustellen, in welchem Drittel der Zeichenhöhe der Mittelpunkt des betreffenden
Segments liegt. Befindet sich der Mittelpunkt eines Segments im unteren Drittel ist das Segment nach unten orientiert;
liegt der Mittelpunkt des Segments im mittleren Drittel, ist ein auf die Mitte orientiertes Segment vorhan-
3098 1 9/08
und wenn der Mittelpunkt des Segments im oberen Drittel
liqejt, wird von einem nach oben orientierten Segment gesprochen.
Hieraus ergibt sich der nachstehende Spaltenorientierungskode :
O: von unten nach unten
1: von unten zur Mitte
2: von unten nach oben
3: von der Mitte nach unten
4: von der.Mitte zur Mitte
5: von der Mitte nach oben
6: von oben nach unten
7! von oben zur Mitte
8: von oben nach oben.
Bei dem in Fig. 3 als Beispiel dargestellten Zeichen "6" liegen bei der kurzen Folge von Segmenten in den
Spalten X-11 und X-12 beide Mittelpunkte im unteren Drittel
der Zeichenhöhe, so daß diesen Segmenten der Orientierungskode O zugewiesen wird. Somit wird die Spaltenfolgekodetabelle
auf ähnliche Weise aufgestellt, wie es weiter oben bezüglich der Reihen-Folgen beschrieben istj für das gemäß
Fig. 3 als Beispiel gewählte Zeichen "6" lauten daher die
Kodes wie folgt: -
4 1 2 3 O
0 0 0 10
0 0
0 0 0 10
0 0
Dann werden gemäß Fig. 4 die Arbeitsschritte 74 zum
Festlegen der Spaltenkodes als Speicheradressen und 76
zum Entnehmen der Zeichenbezeichnungswörter aus dem Speicher auf ähnliche Weise durchgeführt, wie es weiter oben
bezüglich der Arbeitsschritte 56 und 58 für die Reihen beschrieben
ist, abgesehen davon, daß diese Arbeitsschritte nicht an Reihenkodes, sondern an Spaltenkodes durchgeführt
werden. Hierauf dient der Arbeitsschritt 78 dazu, den logischen
Schnittpunkt der Bezeichnungswörter dadurch zu
3 0 9 8 1 9 / 0 8 U
erhalten, daß bezüglich Bezeichnungswörtern mit ähnlichen Bitstellungen Und-Arbeitsschritte durchgeführt werden·
Gemäß Fig. 4 dient dann eine Entscheidungseinrichtung 80 dazu, festzustellen, oh das Ergebnis der Und-Operation zur
Bezeichnung eines einzigen Zeichens geführt hat; ist dies der Fall, wird durch den Verfahrensschritt 82 das bezeichnete
Zeichen dekodiert, woraufhin der Arbeitsschritt 84 bewirkt, daß der Name oder das Symbol des Zeichens ausgedruckt
wird; nunmehr wird für das nächste Zeichen erneut mit dem Arbeitsschritt 48 begonnen» Stellt die Entscheidungseinrichtung 80 fest, daß es sich nicht um ein einzelnes
Zeichen handelt, kann gemäß Fig. 4 der nächste Arbeitsschritt 86 lediglich dazu dienen, ein Signal sichtbar zu
machen oder auszudrucken, das eine Nichterkennung eines Zeichens anzeigt. Alternativ kann man gemäß Fig. 4 eine weitere
Entscheidungseinrichtung 88 benutzen, um festzustellen, ob ein Kode für die betreffenden Reihen- und Spalten-Folgen
gefehlt hat, um gegebenenfalls mit Hilfe des Arbeitsschritts
86 das Nichterkennen eines Zeichens anzuzeigen. Zeigt das Ergebnis des Arbeitsschritts 88 an, daß mehrere Kodes vorhanden
sind, kommt gemäß Fig. 4 eine Trenneinrichtung 90 zur Wirkung, um festzustellen, ob es möglich ist, eine
Analyse auf einer verfeinerten Basis durchzuführen, um das Zeichen zu identifizieren.
Als Beispiel für einen Satz von Zeichen, bei dem es sich als schwierig erweisen kann, die Zeichen mit Hilfe des
vorstehend beschriebenen Kodierungssystems zu unterscheiden, seien die beiden Zeichen "D" und "0" genannt. Mit anderen
Worten, bei bestimmten Schriftarten würden sowohl die Keihenals
auch die Spaltenkodes für diese beiden alphabetischen Zeichen die gleichen sein. Wenn beide Zeichen während des
Verarbeitungsbetriebs gelesen werden, würden daher mehrere Kodes auftreten, die dann durch die Entscheidungseinrichtung
88 identi.fi ziert werden. Die Einrichtung 88 würde nicht
nur anzeigen, daß mehz'ere Kodes vorhanden sind, sondern sie würde auch die Art der mehrfachen Kodierung anzeigen, und
bei dem System würde an einer bekannten Adresse in dem
8 ι <)/ 0 8
Speicher 24 eine besondere Routineeinrichtung zur Verfügung
stehen, die dazu dient, die erforderliche eingehendere Analyse durchzuführen, um eine Unterscheidung zwischen den
Zeichen "D" und "0" zu treffen. Bei diesen beiden alphabetischen
Zeichen könnte diese Unterscheidung z.B. darauf beruhen, daß bei dem Zeichen "0" auf der linken Seite abgerundete
"Ecken" vorhanden sind, während das Zeichen "D" im Gegensatz hierzu nahezu rechtwinklige Ecken aufweist.
Die Trennung wird durchgeführt, indem im einzelnen der
Aufbau der Matrix aus Videosignalen in diesen beiden Ecken eines bestimmten Zeichens geprüft wird, damit das Zeichen
entweder als "D" oder als "0" identifiziert wird. Beispielsweise wird die Differenz zwischen der linken Begrenzungsadresse (jedes Zeichens und der linken Kante des Segments
der oberen Reihe ermittelt, und diese Differenz, die ein Maß für den leeren Raum an der Ecke ist, wird bei .einigen
nachfolgenden Reihen erneut bestimmt; hierbei werden die Differenzen kumulativ addiert. Da der Eckenraum ein Maß
für die Krümmung ist, wird dann, wenn die Differenz über einem bestimmten Schwellwert liegt, das gekrümmte Zeichen
11O" identifiziert, und dieses Zeichen wird auf diese Weise
durch die Trenneinrichtung erkannt; liegt die Summe dieser Differenzen unter einem zweiten Schwellwert, wird das Zeichen
als "D" identifiziert; liegt die Differenz zwischen
den beiden Schwellwerten, wird eine Nichterkennung angezeigt.
Die Benutzung von Routineprogrammen zum Trennen von Zeichen ermöglicht es, mit relativ einfachen Kodes der vorstehend
beschriebenen Art zu arbeiten, für die man nur einen relativ minimalen Speicherraum für die gelernten Bezugszeichen benötigt, so daß sich eine relativ schnelle Analyse
der meisten geometrischen Zeichen durchführen läßt, Bei der relativ kleinen Anzahl von Situationen, die sich bei
zweideutigen Zeichen ergeben, wie es bei einer bestimmten Schriftart geschehen kann, lassen sich die Routine-Trennprogramme
einzeln aufstellen, und hierbei kann man die
30981 9/08 U
Software oder den Aufbau des Rechnerprogramins, das bei dem
Maschinensystem benutzt wird, dazu ausnutzen, bei einer auftretenden Zweideutigkeit eine Unterscheidung zu bewirken,
so daß das betreffende Zeichen genau identifiziert werden kann. Somit ist es erwünscht, mit einem Routinetrennverfahren
zu arbeiten, um eine genaue Identifizierung auch dann zu gewährleisten, wenn möglicherweise eine Zweideutigkeit
auftritt; solche Verfahren können in der Praxis so abgeändert werden, daß eine Anpassung an Fälle erzielt
wird, in denen beim Erkennen von Zeichen Zweideutigkeiten auftreten.
Wie aus Fig. 4 ersichtlich, spielt sich der "Lernvorgang"
allgemein ebenso ab wie der Verarbeitungsvorgang*· Abgesehen von den Arbeitsschritten, die bei der Reihenanalyse
auf den Arbeitsschritt ^-8 folgen, besteht dann, wenn
die Bezeichnungswörter dem Speicher entnommen und dem Α-Register eingegeben worden sind, der nächste Arbeitsschritt 92 nach Fig. 5 darin, daß den Bezeichnungswörtern
an den betreffenden Bit- oder Zeichenstellen Kodes beigefügt werden, die einen Inhalt von 1 Bit haben. Dieser
Arbeitsschritt läßt sich durch einen Rechner leicht mittels
einer logischen Oder-Operation durchführen, die am Inhalt des Α-Registers nacheinander an den entsprechenden Inhalten
der Bezeichnungswörter durchgeführt wird, Nach dieser Analyse und dem Einfügen der Kodes für die Reihen entsprechen
die nächsten Arbeitsschritten den anhand von Fig. 4 beschriebenen Arbeitsschritten 68, 70, 72, 74 und 76, die
an den Spalten durchgeführt werden, und auf die der Arbeitsschritt 94 folgt, bei dem die Spaltenbits in diezugehörigen
Bezeichnungswörter eingefügt und dem Speicher
wieder zugeführt werden. Sobald dieser Arbeitsschritt beendet ist, werden die Videoinformationen für das nächste
Zeichen ausgewählt und abgegrenzt, und das beschriebene Verfahren wird erneut angewendet.
In der Praxis wird während des Lernvorgangs eine große Auswahl von Beispielen für jedes zu erkennende Zeichen
30 9 819/Q8U
dem Rechner zugeführt und zur weiteren Verarbeitung identifiziert.
Man kann dem Eechner tausende von Beispielen jedes Zeichens zuführen, und aus den Abweichungstoleranzen
bezüglich der Lage des Zeichens innerhalb der Zeichennachweiseinrichtung, aus den Abweichungen bei der Verarbeitung
der Videosignale, d.h. den Quantelungsfehlern, sowie aus .den Abweichungen zwischen den Abdrucken der verschiedenen
Beispiele jedes Zeichens wird eine erhebliche Menge von Bezugsdaten gesammelt, .die dazu dienen, eine Kodierung sowohl
bezüglich der Reihen als auch der Spalten durchzuführen. In der Praxis hat es sich gezeigt, daß ein anfänglicher
Lernprozeß dieser Art dazu führt, daß der Rechner die überwiegende Mehrzahl der vorkommenden Fälle einer bestimmten
Schriftart und ihrer alphabetischen und numerischen Zeichen "lernt", so daß sich die Erkennung der meisten Einzelzeichen
leicht durchführen läßt. Wenn sich Zweideutigkeiten infolge einer Vielfachkodierung ergeben oder ein Zeichen aus
anderen Gründen nicht erkannt wird, kann der Operator den Rechner mit Bezugsdaten für solche Fälle versehen, oder er
kann diesen Fällen angepaßte Trennprogramme aufstellen.
Das in Fig. 1, 3 und 4- dargestellte Zeichenerkennungssystem
nach der Erfindung läßt sich in der verschiedensten Weise ausbilden. Bei einer Ausführungsform benutzt man einen
Universaldigitalrechner als Zentraleinheit 22 und Speicher 24 in Verbindung mit einem Softwaresystem für die
Steuerlogik zum Betreiben der Zentraleinheit; diese Steuerlogik wurde vorstehend anhand der Diagrammblöcke ^O bis
90 beschrieben. Diese Rechnerprogrammform einer Steuerlogik
bietet den Vorteil, daß man ein System zur Verfügung hat, das sich im Laufe der Zeit abändern, verbessern und
revidieren und Änderungen bezüglich der an das System gestellten Anforderungen anpassen läßt. Eine andere Ausführungsform
der Erfindung basiert auf der Benutzung von •Steuerschaltungen für große Teile der verwendeten Steuerlogik.
Ferner ist bei den mit Hilfe der Einrichtung 90 durchzuführenden
Vorgängen, denen gemäß der vorstehenden Beschreibung im Rahmen der Erfindung eine erhebliche Bedeutung
3 0 9 8 ι 9 / 0 8 U
zukommt, ein so großer Aufwand an logischen Schaltungen erforderlich,
daß auch in diesem Fall mit einer nach einem Eechnerprogramm arbeitenden Ausführungsform gearbeitet wird,
denn eine Ausführungsform in Gestalt logischer Schaltungen würde beim gegenwärtigen Stand der Technik übermäßig kompliziert
und teuer. Für jeden Fachmann ist aus der vorstehenden Beschreibung der Arbeitsschritte 50 bis 88 ohne
weiteres ersichtlich, auf welche Weise jeder Teil der Anlage als durch ein Rechnerprogramm gesteuerte Einrichtung oder
als logische Schaltung ausgebildet werden kann. Ferner können verschiedene technische Überlegungen dazu führen,
daß man sich entschließt, bestimmte Funktionen der Steuerlogik durch feste Schaltungen oder sogenannte "Hardware"
durchführen zu lassen, während andere Arbeitsschritte mit Hilfe von Rechnerprogramnien bzw. sogenannter Software
durchgeführt werden. Ein Beispiel hierfür besteht in dem Arbeitsschritt 90 nach Fig. 4, der sich zweckmäßiger unter
Einsatz von Software durchführen läßt; dies gilt insbesondere dann, wenn die Programme für einzelne Anwendungen und
verschiedene Schriftarten und Druckgütegrade aufgestellt werden. Einige der logischen Steuervorgänge zum Festlegen
von Kodes werden gemäß der Beschreibung durch logische Schaltungen durchgeführt, um eine höhere Arbeitsgeschwindigkeit
zu erzielen; andere Teile des Arbeitsvorgangs, bei denen zahlreiche komplizierte Entscheidungen getroffen werden
müssen, werden durch den Einsatz von Software durchgeführt, um die Anlage anpassungsfähiger und vielseitiger verwendbar
zu machen. Wenn es sich um einfache Kodierungsaufgaben handelt, die sich wiederholen und sehr häufig durchgeführt
werden müssen, z.B. um das Kodieren von Segmenten in Keinen und Spalten, ist es naheliegend, daß man den Einsatz von
logischer Hardware vorzieht; dies hat seinen Grund insbesondere darin, daß man einen großen Teil der Schaltung sowohl
bei den Reihen als auch bei den Spalten benutzen kann.
Wie für jeden Fachmann ersichtlich, kann das beschriebene Kodierungssystem nach der Erfindung mehrere verschiedene
Formen annehmen. Wie bereits angedeutet, kann sich
3 0 f.i 8 1 9 / 0 8 U
ferner die Spaltenkodierung von der Reihenkodierung unterscheiden. Die Reihen- und Spaltenkodierungen können gemäß
der Beschreibung im wesentlichen voneinander unabhängig sein, oder sie können in Verbindung miteinander benutzt
werden, so daß die Kodes der Spaltenkodierung auf einer logischen TJnd-Basis mit den Kodes der Reihen kombiniert
werden, wenn die Reihenkodierung nicht zur Erkennung eines Zeichens führt. Eine solche kombinierte Spalten- und Reihenkodierung
kann sich unter bestimmten Umständen als vorteilhaft erweisen. Ferner kann der Arbeitsschritt 60 zum Ermitteln
des logischen Schnittpunktes der Bezeichnungswörter durchgeführt werden, nachdem eine bestimmte Mindestzahl
von Kodes, die kleiner ist als die Gesamtzahl, aufgestellt worden ist und die zugehörigen Beschreibungswörter festgelegt
worden sind. Hierauf wird die Prüfung gemäß dem Diagrammblock 62 durchgeführt, um festzustellen, ob die resultierende
Kodekombination eindeutig ist. Besteht keine Eindeutigkeit, wird der nächste Reihenkode festgelegt, seine
Bezeichnung wird ermittelt, und die Bezeichnung wird, mit dem vorangehenden Schnittpunkt auf der gleichen logischen
TJnd-Basis kombiniert* Dieses Ergebnis wird erneut auf seine Eindeutigkeit geprüft, und die Verarbeitung wird wiederholt,
bis ein eindeutiger Kode angetroffen wird, oder es werden sämtliche Kodes verarbeitet, so daß man als Ergebnis einen
Vielfachkode erhält. Für jeden Fachmann ergeben sich aus der vorstehenden Beschreibung weitere Abwandlungs- und
Abänderungsmöglichkeiten.
ViTIe aus der vorstehenden Beschreibung ersichtlich,
ist durch die Erfindung ein verbessertes Zeichenerkennungssystem
geschaffen worden, das auf einer analytischen und systematischen maschinellen Verarbeitung beruht. Das Maschinensystem
ist anpassungsfähig, so daß verschiedene Schriftarten und Alphabete "gelernt" werden können, worauf es
ermöglicht wird, eine Sammlung von Bezugsdaten zusammenzustellen, mit denen unbekannte Zeichen verglichen werden.
Somit läßt sich das System bei den verschiedensten Schriftarten und Alphabeten anwenden.
30 9 8 1 9 / 0 8 U
2253Ί93
Alle in den Unterlagen enthaltenen Angaben und Merkmale werden, soweit sie einzeln oder in Kombination gegenüber
dem Stand der Technik neu sind, als erfindungswesentlich beansprucht.
Ansprüche
t
3098 1 9/08U
Claims (6)
- ANSPRÜCHEZeichenerkennungssystem, dadurch gekennzeichnet, daß eine Einrichtung (18) vorhanden ist, die dazu dient, digitale Informationssignale zu erzeugen, die einer zweidimensional en Anordnung (4-2) von Elementen entsprechen, welche ein Zeichen eines Satzes von Zeichen bilden, das erkannt werden soll, daß die Größe der Elemente annähernd der Dicke der dünnsten Linie der Zeichen entspricht, daß Einrichtungen vorhanden sind, die dazu dienen, Kodes festzulegen, die die geometrische Porm von Reihen der. Zeichenelemente repräsentieren, daß ein Speicher (24-) vorhanden ist, daß Steuereinrichtungen vorhanden sind, die nach einem Lernverfahren betreibbar sind, um in dem Speicher Informationssignale entsprechend den geometrischen Kodes und den repräsentativen Zeichen zu speichern, und daß zu den Steuereinrichtungen Vorrichtungen gehören, die nach einem Verarbeitungsverfahren betreibbar sind9 um dem Speicher die Informationssignale entsprechend den geometrischen Kodes zu entnehmen und so die repräsentativen Zeichen zu identifi- ■ zieren, die den für Musterzeichen festgelegten entsprechenden geometrischen Kodes zugeordnet
- 2. Zeichenerkennungssystem nach Anspruch 1, dadurch gekennzeichnet , daß zu den Einrichtungen zum Festlegen der Kodes eine Vorrichtung (68) gehört, die dazu dient, Kodes festzulegen, die die geometrische Form von Spalten der Zeichenelemente repräsentieren, und daß zu den Steuereinrichtungen eine Vorrichtung gehört, die entsprechend den Reihen- und Spalten-Geometriekodes sowohl nach einem Lernverfahren als auch nach einem Verarbeitungsverfahren betreibbar ist.
- 3. System zum maschinellen Erkennen zweidimensionaler Zeichen, gekennzeichnet durch eine Einrichtung zum3098 19/08UQWOfNAl INSPECTED2253Ί93Erzeugen digitaler Informationssignale, die einer zweidimensionalen Anordnung von Elementen mit einer annähernd einzelnen Auflösungsgröße entsprechen, welche ein zu erkennendes Musterzeichen bilden, eine Einrichtung zum Festlegen von Kodes entsprechend verschiedenen Arten von Reihen- und Spaltensegmenten der Zeichenelemente sowie entsprechend querliegenden Folgen ähnlicher Segmente, sowie durch eine Einrichtung, die die Kodes mit Kodes bekannter Bezugszeichen vergleicht, um ein Musterzeichen zu identifizieren.
- 4. System nach Anspruch J, dadurch gekennzeichnet, daß die Striche der Zeichen eine dicke Form haben, die annähernd einer Mehrzahl der Zeichenelemente entspricht.
- 5. System nach Anspruch 3, dadurch gekennzeichnet, daß zu der Einrichtung zum Festlegen von Kodes eine Vorrichtung gehört, die dazu dient, Kodes für die Dauer bzw. Länge der Segmentfolgen und die Lage bestimmter querliegender Folgen innerhalb der Anordnung festzulegen.
- 6. Verfahren zum Betreiben eines Systems zur maschinellen Erkennung zweidimensionaler Zeichen, dadurch gekennzeichnet, daß digitale Informationssignale erzeugt werden, die einer zweidimensionalen Anordnung von Elementen von annähernd einfacher Auflösungsgröße entsprechen, welche ein zu erkennendes Musterzeichen bildei, daß Kodes entsprechend verschiedenen Arten von Reihensegmenten der Zeichenelemente sowie entsprechend querliegenden Folgen ähnlicher Segmente festgelegt werden, und daß diese Kodes mit Kodes bekannter Bezugszeichen verglichen werden, um das betreffende Zeichen zu identifizieren.309819/0BU
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US19441471A | 1971-11-01 | 1971-11-01 |
Publications (1)
Publication Number | Publication Date |
---|---|
DE2253193A1 true DE2253193A1 (de) | 1973-05-10 |
Family
ID=22717516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2253193A Pending DE2253193A1 (de) | 1971-11-01 | 1972-10-30 | Verfahren und system zum erkennen von zeichen |
Country Status (3)
Country | Link |
---|---|
JP (1) | JPS4853637A (de) |
DE (1) | DE2253193A1 (de) |
FR (1) | FR2159919A5 (de) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2301051A1 (fr) * | 1975-02-14 | 1976-09-10 | Anvar | Procede et dispositifs de reconnaissance de formes |
-
1972
- 1972-10-30 FR FR7238444A patent/FR2159919A5/fr not_active Expired
- 1972-10-30 DE DE2253193A patent/DE2253193A1/de active Pending
- 1972-10-31 JP JP47108578A patent/JPS4853637A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JPS4853637A (de) | 1973-07-27 |
FR2159919A5 (de) | 1973-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3716787C2 (de) | ||
DE68915950T2 (de) | Verfahren zum Trennen von Zeichen. | |
DE3633743C2 (de) | ||
DE69123083T2 (de) | Dokumentverarbeitung | |
DE3440377C2 (de) | ||
DE2909153C2 (de) | Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern | |
DE3926327C2 (de) | Verfahren und System zum Erkennen von Zeichen auf einem Medium | |
EP0096079B1 (de) | Verfahren zur Aufbereitung von Punktrasterdaten für Zeichen- und/oder Bilddarstellungen | |
DE3879254T2 (de) | Unterscheidungsvorrichtung für handgeschriebene und maschinengedruckte Buchstaben. | |
DE2431451C3 (de) | Verfahren zur Normierung der Strichstärke von abgetasteten Schriftzeichen sowie Einrichtung zur Durchführung des Verfahrens | |
DE69830383T2 (de) | Kodierverfahren | |
DE2432129C3 (de) | Verfahren zum maschinellen Lesen von Zeichen und Vorrichtung zur Durchführung des Verfahrens | |
DE4427992C2 (de) | Verfahren zum Erzeugen einer Dokumenten-Darstellung aus einem Bitmap-Bild eines Dokuments | |
DE2640814A1 (de) | Schaltung zur erzeugung eines zeichens durch in einem matrixmuster vorliegende bildelemente | |
DE68924606T2 (de) | Dokumentenbildverarbeitungsgerät. | |
DE2657631A1 (de) | Verfahren zur codierten darstellung einer information, insbesondere von chinesischen zeichen | |
DE2234109B2 (de) | Leseapparat | |
DE3241673C2 (de) | Verfahren zum Verdichten von Daten Zwei-wertiger Bilddarstellungen | |
DE2515245A1 (de) | Musteranalysiersystem | |
DE112021000371T5 (de) | Digitale bildbearbeitung | |
DE2003849C3 (de) | Verfahren zum Speichern von elektronischen Typensätzen in einem Lichtsetzgerät | |
EP0107083B1 (de) | Belegverarbeitungseinrichtung mit Korrekturschaltung und Datensichtgerät | |
DE68925312T2 (de) | Verfahren zur Pixelfarbenwahrscheinlichkeitsbestimmung zur Verwendung in OCR-Logik | |
DE2928378C2 (de) | Verfahren und Einrichtung zur elektronischen Erzeugung einer gerasterten Halbtonaufzeichnung eines Originalbildes | |
DE2118791A1 (de) | Verfahren und Anordnung zur Erkennung von Zeichen, insbesondere von alphanumerischen Zeichen |