DE2253193A1 - Verfahren und system zum erkennen von zeichen - Google Patents

Verfahren und system zum erkennen von zeichen

Info

Publication number
DE2253193A1
DE2253193A1 DE2253193A DE2253193A DE2253193A1 DE 2253193 A1 DE2253193 A1 DE 2253193A1 DE 2253193 A DE2253193 A DE 2253193A DE 2253193 A DE2253193 A DE 2253193A DE 2253193 A1 DE2253193 A1 DE 2253193A1
Authority
DE
Germany
Prior art keywords
character
codes
characters
code
segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE2253193A
Other languages
English (en)
Inventor
Theodore H Levine
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OCR Systems Inc Japan
Original Assignee
OCR Systems Inc Japan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OCR Systems Inc Japan filed Critical OCR Systems Inc Japan
Publication of DE2253193A1 publication Critical patent/DE2253193A1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/421Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation by analysing segments intersecting the pattern

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

BB. EBIGH NEUGBBAÜBB PATENTANWALT * MÜNCHEN
i*AI JiJM IANWAIiT Ο Ο ζ *? 1 Q "3 TBMSFON (0811) 114337 η.
S MÜNCHEN 26 - POSTFACH Sl Λ. Δ Ό O \ Ό \J TELBOBAHMADBBSSBi
ZWB IB B Ü C K B N β TB A 8 β Xl IO BAVABiAPATBNT
(VBBBV BBX BBUTIOHKV »ATBVTAXT) TBtKX «-M4M
J>0 . Oktober 1972 IA-2975 Beschreibung
zu der Patentanmeldung OGR SYSTEMS, INC.
Horsham, Pennsylvania, USA betreffend
Verfahren und System zum Erkennen von Zeichen
Die Erfindung bezieht sich auf automatische Schriftzeichen-Erkennungssysteme und betrifft insbesondere zur optischen Zeichenerkennung dienende, mit analytischen Verfahren arbeitende Maschinensysteme.
Bei bekannten Zeichenerkennungssystemen ist es üblich, eine Videosignaldarstellung des betreffenden, in ein Rechteck eingeschlossenen Zeichens festzulegen und dann zu versuchen, eine Signalübereinstimmung bezüglich verschiedener Bereiche oder Teilbereiche der VideosignaldarBtellung mit einem Satz von Masken oder Schablonen herbeizuführen. Ein solches System kann als ein synthetisches System be- " zeichnet werden, da bei ihm eine Synthese von Masken oder Merkmalen oder Schablonen, d.h. von Mustern innerhalb von Teilbereichen des das Zeichen umschließenden Rechtecks herbeigeführt wird. Zur Konstruktion eines solchen Maskenvergleichssystems und der Wahl der Masken, aus denen sich die verschiedenen Zeichen zusammensetzen, ist ein großer Aufwand an Denkarbeit erforderlich. Sollen bestimmte Kosten nicht überschritten werden, ergeben sich bei einem solchen
30 9 819/0814
I POIIICHICIKOITO XUVCHBV «»1» - BATBKIIOHB HTVOTHBKBV- V. WBOHIBI.BAVK Xt)VCHBB «/····· BBVTIOHB BAVK XOVOHBV »O/I· «00 - BATBKIIOHB TBKBIViBAVK Ht)VOHBV ····*·
2753193
System mit hoher Wahrscheinlichkeit Beschränkungen bezüglich der Schriftarten, bei denen es sich anwenden läßt. Daher bietet dieses System nur geringe Möglichkeiten bezüglich seiner Realisierung und bezüglich eines Vorgehens, das zu einem allgemein verwendbaren System führen würde, das sich bei den verschiedensten Schriftarten, verschiedenen Alphabeten, verschiedenen Druckbildern sowie bei handschriftlichen Zeichen anwenden läßt·
Der Erfindung liegt die Aufgabe zugrunde, ein neuartiges und verbessertes Zeichenerkennungssystem zu schaffen. Ferner wird durch die Erfindung ein auf analytischen Verfahren basierendes Zeichenerkennungssystem geschaffen. Weiterhin soll ein neuartiges und verbessertes Zeichenerkennungssystem geschaffen werden, das bei einer großen Anzahl verschiedener Schriftarten und Alphabete anwendbar ist. Schließlich soll ein System der genannten Art geschaffen werden, das auf eine solche Weise anpassungsfähig ist, daß bestimmte Schriftarten und Alphabete "gelernt" werden können, um eine Sammlung von Bezugsinformationen anzulegen, mit denen unbekannte Schriftzeichen verglichen werden können.
Bei einer Ausführungsform der Erfindung basiert die Wirkungsweise eines Maschinensystems zum automatischen Erkennen von Zeichen auf einer Analyse geometrischer Formen, die in einem Rechteck enthalten sind, durch das das zu erkennende Zeichen abgegrenzt wird; mit Hilfe dieser Analyse werden den geometrischen Formen entsprechende numerische Kodes aufgestellt. Mit anderen Worten, bei dem erfindungsgemäßen Maschinensystem wird eine zweidimensionale Anordnung von Elementen des als Muster dienenden Zeichens gebildet, innerhalb welcher jedes Element eine solche Fläche einnimmt, daß es sich einem einzigen Auflösungsvorgang zuordnen läßt; diese Elemente können mit Hilfe digitaler Informationssignale festgelegt werden. Innerhalb jeder Reihe oder Zeile der Anordnung von Elementen werden zusammenhängende Folgen von schwarzen Elementen als Segmente bezeich-
30981 9/08U
net bzw. identifiziert. Hierbei werden Kodes aufgestellt, die Art und Anzahl der Segmente und danach Folgen ähnlicher Arten von Segmenten in aufeinander folgenden Keinen identifizieren. Bei dieser Ausführungsform werden auch, die Dauer und die Orientierung der Folgen von Elementen bzw. Segmenten verschlüsselt.
Die Kodes unbekannter Musterzeichen werden mit denen bekannter Bezugszeichen verglichen, um die Musterbuchstaben zu identifizieren. Dieses System kann sowohl nach einem "Lernverfahren" als auch nach einem "Verarbeitungsverfahren" betrieben werden. Bei dem Lernverfahren werden dem Zeichenerkennungssystem Proben bekannter Schriftzeichen zusammen mit ihrer Kennung als bestimmtes alphabetisches oder numerisches Zeichen dargeboten. Bei diesem Lernverfahren werden die in den die Zeichen umschließenden Rechtecken enthaltenen geometrischen Formen analysiert und verschlüsselt, und die geometrischen Kodes werden im Maschinenaufzeichnungsformat zusammen mit einer Kennung des sie darstellenden Musterzeichens gespeichert, um die Sammlung von Bezugsdaten aufzubauen. Bei dem Verarbeitungsverfahren werden die unbekannten Musterzeichen zur Analyse dieser Zeichen in der gleichen Weise vorgegangen, wie bei dem Lernverfahren, und Kodes werden auf ähnliche Weise entwickelt. Wenn die bestimmte geometrische Form eines unbekannten Musterzeichens vorher während der Anwendung des' Lernverfahrens analysiert worden ist, können die Kodes dieses Zeichens zusammen mit den Kennungen der Bezugszeichen im Maschinenspeicher aufgefunden werden, und wenn eine Eindeutigkeit festgestellt wird, wird das unbekannte Zeichnen entsprechend identifiziert oder erkannt.
Die Erfindung und vorteilhafte Einzelheiten der Erfindung werden im folgenden anhand schematischer Zeichnungen an Ausführungsbeispielen näher erläutert. Es zeigt:
Fig. 1 in einem Blockschaltbild eine Ausführungeform eines optischen Zeichenerkennungssystems;
309819/08U
2253Ί93
_ 4 —
Fig. 2 schematisch eine Ausführungsform eines in Verbindung mit dem System nach Fig. 1 zu benutzenden optischen Detektors;
Fig. 3 in einer graphischen Darstellung die Speicherung eines Zeichens bei dem System nach Fig. 1;
Fig. 4 in einem Fließbild ein analytisches Zeichenerkennungssystem und veranschaulicht ein bei dem System nach Fig. 1 anwendbares Verfahren; und
Fig. 5 in einem Blockschaltbild eine Abwandlung des analytischen Zeichenerkennungssystems nach Fig. 4 zum Betrieb nach einem Lernverfahren.
In den Figuren sind einander entsprechende Teile jeweils mit gleichen Bezugszahlen bezeichnet.
Bei dem in Fig. 1 dargestellten, insgesamt mit 10 bezeichneten System zum optischen Erkennen von Zeichen wird ein Dokument oder ein anderer, Zeichen aufweisender Informationsträger 12 mit einer Folge von Zeichen 14, 15, 16 an einer Zeichendetektoreinrichtung 18 vorbeigeführt, die einen Satz von Signalen, und zwar bei der optischen Zeichenerkennung einen Satz von Videosignalen erzeugt, welche die aufeinander folgenden Zeichen repräsentieren. Diese Videosignale erscheinen in elektrischer Form in einer Leitung 20, über die sie einem Pufferspeicher 21 zugeführt werden, der durch eine Zentraleinheit 22 eines Datenverarbeitungssystems oder eines Digitalrechners gesteuert wird. Zu der Zentraleinheit gehört auch der Speicher 24 mit einem Adressenwähler 26, der ebenfalls durch die Zentraleinheit 22 gesteuert wird. Die Zentraleinheit liefert die dem Speicher 24 einzugebenden Datensignale über eine Vielfachleitung 28, und die dem Speicher 24 entnommenen Datensignale werden der Zentraleinheit über eine Vielfachleitung 29 zugeführt. Der Pufferspeicher 21 kann sich aus Sätzen von Registern zusammensetzen, die dazu dienen, digitale Darstellungen der Videosignale eines Satzes von Zeichen zu
3 0 f* 8 1 9 / 0 8 U
speichern, die mit Hilfe der Detektorexnriclitung 18 abgetastet worden sind.
An die steuernde Zentraleinheit 22 sind eine Eingabeeinrichtung 30, z.B. eine Tastatur, insbesondere eine Schreibmaschinentastatur,, und eine Ausgabeeinrichtung 32, z.B. ein Drucker, eine Schreibmaschine oder eine Steuereinrichtung, angeschlossen, damit der Zentraleinheit Eingangssignale zugeführt und Ausgangssignale entnommen werden können. Die Zentraleinheit 22 ist über einen Wählschalter 34-mit Klemmen der Eingabeeinrichtung 30 und der Ausgabeeinrichtung 32 verbindbar; hierbei kommt der Schalter 34- nach Art eines einpoligen Umschalters zur Wirkung. Bei der einen Stellung des Schalters 34- arbeitet das System nach einem Lernverfahren, bei dem Signale, die Zeichen identifizieren, welche gerade gelesen und durch die Detektoreinrichtung 18 ermittelt werden, durch einen Operator identifi- " ziert und dem System mit Hilfe der Tastatur 30 eingegeben werden. Befindet sich der Schalter 34- in seiner anderen Stellung, dient das Zeichen, das mit Hilfe der Detektoreinrichtung 18 ermittelt und durch die Zentraleinheit 22 zum Zweck der Zeichenanalyse und Verschlüsselung verarbeitet worden ist, dazu, das Zeichen zu identifizieren und das identifizierte bzw. erkannte Zeichen auszugeben, z.B. das maschinell verschlüsselte Zeichen auf einem Magnetband aufzuzeichnen. Anstelle der Erzeugung eines Ausgangssignals oder zusätzlich dazu kann der Zeichenerkennungsvorgang zur Durchführung eines Steuervorgangs dienen; beispielsweise können in einem Postamt Briefe nach den Postleitzahlen sortiert werden.
Das System nach Fig. 1 ist bei den verschiedensten Arten von Zeichensystemen anwendbar, und es erweist sich als besonders vorteilhaft beim Erkennen von Zeichen, die auf das Schriftstück 12 aufgedruckt sind und optisch nachgewiesen werden· Es sind bereits verschiedene Konstruktionen von Videodetektoren bzw. optischen Detektoren bekannt, die bei dem System nach Fig. 1 verwendbar sind. Bei einem
309819/0814
solchen System wird gemäß Fig. 1 ein Teil des Schriftstücks 12 beleuchtet, der in Fig. 1 durch ein gestrichelt gezeichnetes Rechteck 56 abgegrenzt ist, dessen Höhe größer ist als die Höhe der zu lesenden Zeichen, und das Schriftstück 12 wird an der Detektoreinrichtung 18 vorbeigeführt, um durch sie abgetastet zu werden. Die Detektoreinrichtung 18 liefert das Licht zum Beleuchten des Rechtecks 56 auf dem Schriftstück, und sie weist außerdem eine geradlinige Reihe 38 (Fig. 2) von Photozellen, z.B. mit 4-8 oder 64 Photodioden oder Phototransistoren, auf, die so angeordnet sind, daß sie einen schmalen senkrechten Ausschnitt des Zeichens abtasten, der in dem beleuchteten Rechteck 36 erscheint, wie es in Fig. 2 schematisch dargestellt ist.
Während des Betriebs des Systems werden die Zeichen 14, 15 und 16 nacheinander abgetastet, und die Verarbeitung wird jeweils für ein einzelnes Zeichen durchgeführt. Das Schriftstück 12 kann mechanisch schrittweise oder kontinuierlich bewegt werden, und hierbei tasten die Dioden 40 aufeinander folgende schmale Ausschnitte des betreffenden Zeichens ab, um Signale zu erzeugen, die die geometrische Form des Zeichens repräsentieren. Die Detektoreinrichtung 18 arbeitet mit der.Zentraleinheit 22 und dem Pufferspeicher 21 zusammen, um in einem Teil des Rifferspeichers eine zweidimensionale Anordnung von Signalen festzulegen, die dem optischen Bild jedes Zeichens entspricht. Die Zentraleinheit verarbeitet die in dem Pufferspeicher 21 gespeicherten Signale jeweils für ein vollständiges Zeichen, und um dies zu ermöglichen, werden die Zeichensignale aus dem Puffer« speicher 21 in einem Zwischenspeicher 42 überführt. Fig. 3 zeigt den Zwischenspeicher 42 schematisch für den Fall, daß verschiedene Elemente seiner rechteckigen Matrix digitale Signale enthalten, welche die Zahl 6 repräsentiere^ die abgetastet worden ist. Mit anderen Worten, einige Matrix-
3098 1 9/08U
elemente enthalten binäre Bits, z.B. 1-Bits, die das Zahlzeichen 6 repräsentieren und in Fig. 5 als Punkte von großem Durchmesser dargestellt sind, während die übrigen Speicherelemente der Matrix Bits enthalten, die die das Zeichen auf dem Schriftstück 12 umgebende weiße Fläche repräsentieren, bei denen es sich z.B. um O-Bits handelt, und die in Fig. 3 nur durch die Schnittpunkte der sich kreuzenden waagerechten und senkrechten Linien bezeichnet sind. ■ Die-durch die Photozellen 4-0 erzeugten Signale werden dem Pufferspeicher 21 für die einzelnen Ausschnitte in der richtigen zeitlichen Beziehung und in Abhängigkeit von der Bewegung des Schriftstücks .12 zugeführt, so daß"die aufeinander fplgenden Spalten in dem Pufferspeicher 21 und danach in der Matrix 42 die Videoinformationen enthalten, die einander benachbarten Ausschnitten des Zeichens 16 entsprechen. Bei einer Ausführungsform der Erfindung begrenzen die Matrixelemente auf dem Schriftstück eine Fläche, deren Höhe sich nach dem Abmessungen der Photodioden richtet, und deren Breite durch die Abtastgeschwindigkeit bestimmt ist; jedes dieser Flächenelemente ist ein Quadrat mit einer Seitenlänge von etwa 0,15 mm. Es wird mit einem Schwellwertsignal gearbeitet, das so eingestellt ist, daß es die Größe einer mit schwarzer Farbe bedruckten Fläche festlegt, die durch ein 1-Bit dargestellt werden soll. Der Ausdruck "schwarz" bezeichnet Teile des gedruckten Schrift-Zeichens im Gegensatz zur unbedruckten Fläche des Schriftstücks; natürlich beschränkt sich die Anwendbarkeit der Erfindung nicht auf eine bestimmte Farbe oder Druckart«
Systeme und Verfahren, die es in der beschriebenen Weise ermöglichen, das Zeichen 16 in Form einer Matrix aus digitalen Informationssignalen so darzustellen, daß es wahlfrei zugänglich in einer zweidimensionalen Speicheranordnung untergebracht werden kann, sind bereits bekannt. Bei der geraden Reihe von Photozellen 40 handelt es sich lediglich um ein Beispiel für die Anwendung solcher Verfahren; es ist nicht erforderlich, das Schriftstück 12 auf
3 OS 8 1 9 / 0 R 1 Z,
mechanischem Wege zu bewegen; vielmehr lassen sich auch verschiedene andere optische Abtastverfahren anwenden# Beispielsweise kann man einen Lichtpunkt benutzen, um über jedem Zeichen einen Raster abzutasten und eine zweidimensionale Anordnung von Informationssignalen in der Speichermatrix 42 zu gewinnen. Eine solche Abtasteinrichtung kann so gesteuert werden, daß sie sich nacheinander über die einzelnen Zeichen des Schriftstücks 12 hinweg bewegt. Dieses System beschränkt sich nicht auf einen bestimmten Satz von Zeichen oder Zeichenformen, die abgetastet werden können, noch auf eine bestimmte Anordnung der Zeichen auf dem Schriftstück. Vielmehr läßt sich die Erfindung sowohl bei alphabetischen und numerischen Zeichen sowie bei verschiedenen Schriftarten als auch bei verschiedenen Alphabeten und Zahlensystemen anwenden, die sich von dem üblichen Alphabet und dem gebräuchlichen arabischen Zahlensystem unterscheiden.
Gemäß dem in Fig. 4 dargestellten Fließbild besteht der erste Arbeitsschritt, wie durch den Diagrammblock 44 angedeutet, darin, daß das Schriftstück optisch abgetastet wird; dieser Arbeitsschritt ist mit dem Betrieb des Pufferspeichers 21 koordiniert, so daß die Signale gemäß dem Diagrammblock 46 gespeichert werden können; hierbei werden die gequantelten, aus der gedruckten Vorlage gewonnenen Videosignale einer zweidimensionalen Anordnung ähnlich der in Fig. 3 dargestellten eingegeben. Bei dem System nach Fig. ist angenommen, daß mehrere Zeichen des gesamten Zeichensatzes des Schriftstücks 12 abgetastet und gespeichert werden, und daß danach die einzelnen Zeichen zum Zweck der Analyse verarbeitet werden. In der Praxis, d.h. wenn ein schnell arbeitender Universalrechnerspeicher in Verbindung mit bestimmten logischen Schaltungen und einer zentralen Einheit benutzt wird, werden die beiden Arbeitsschritte des Abtastens und Analysierens in einem gewissen Ausmaß unabhängig voneinander und gleichzeitig durchgeführt, so daß sie sich zeitlich überschneiden.
9 ti I 0 / ü P 1 U
Der nächste, in Pig. 4 durch den Diagrammblock 48 bezeichnete Arbeitsschritt besteht im Wählen und Abgrenzen des Videosignals des nächsten zu erkennenden Zeichens, und dieser Arbeitsschritt spielt sich ab, nachdem die Signale in den Zwischenspeicher 42 überführt worden sind, was bei der Beendigung durch, den Diagrammblock 46 bezeichneten Speicherung des Videosignals oder bei der Beendigung der Analyse des vorangehenden Zeichens geschieht, wie es in Fig. 4 durch den Buchstaben A angedeutet ist, der die Übertragung eines Steuersignals zu der Einrichtung 48 andeutet. Das Wählen und Abgrenzen eines Zeichens kann mit Hilfe eines beliebigen der hierfür verfügbaren bekannten Verfahren durchgeführt werden. Eines dieser anwendbaren Verfahren besteht darin, daß eine Silhouette der senkrechten und der waagerechten "Ansichten" des Zeichens in der Matrix 42 erzeugt wird. Mit anderen· Worten, das Eechteck 36j innerhalb dessen ,jedes Zeichen 16 beleuchtet wird, erstreckt sich über einen Abschnitt des Schriftstücks, der eine Länge hat, die größer ist als die bekannte Länge des zu ermittelnden Zeichens. Entsprechend hat auch die Seihe 38 von Photozellen 40 eine größere Länge bzw. Höhe als das Zeichen 16, und diese Höhe kann bis zum Dreifachen der Höhe des Zeichens betragen. Bei dem als Arbeitsspeicher benutzten Zwischenspeicher 42 handelt es sich um eine Speichermatrix, der die Videosignale für das Zeichen in Form einer zweidimensionalen Anordnung eingegeben werden können; die Abmessungen der Speichermatrix sind größer als die Abmessungen des Zeichens, so daß es sich bei den Zeicheninformationen praktisch um eine Anordnung aus 1-Bits handelt, die von O-Bits umgeben ist. Die Silhouettierung zum Abgrenzen des Zeichens wird zuerst in einer bestimmten Richtung durchgeführt, z.B. in der Richtung der Bitreihen«, Sämtliche Reihen der Arbeitsfläche der Matrix 42 werden nacheinander ausgegeben und in einem Register, z.B. dem A-Register eines Universalrechners, gesammelt. Mit anderen Worten, sämtliche 1- und O-Bits, die in der Matrix 42 die erste X-Adresse haben, werden auf einer logischen Oder-Basis
30981 9/08U
- ίο -
in einer Zelle des Registers kombiniert, die Bits mit der nächsten X-Adresse werden wiederum auf einer Oder-Basis in der nächsten Zelle des Registers kombiniert usw., wobei jede Gruppe von Bits, welche die gleiche X-Adresse aufweist, der gleichen Registerzelle eingegeben wird. Das Register enthält dann eine Folge von 1-Bits, die auf der linken Seite von einer Folge von O-Bits und auf der rechten Seite ebenfalls durch eine Folge von O-Bits flankiert ist. Das in dem Register am weitesten links stehende 1-Bit bezeichnet die linke Einzelbildadresse des Zeichens und das am weitesten rechts stehende 1-Bit die rechte Einzelbildadresse; wenn irgendwelche 1-Bits außerhalb der Hauptgruppe von 1-Bits und von ihr durch O-Bits getrennt auftreten, kann man annehmen, daß es sich um Störsignale handelt, die gelöscht werden können. Auf ähnliche Weise wird die senkrechte Silhouette dadurch gebildet, daß man auf einer logischen Oder-Basis in dem Register sämtliche Spalten von Bits kombiniert,, Diejenigen Bits innerhalb jeder Spalte, die die gleiche !-Adresse haben, werden in entsprechenden Registerzellen kombiniert. Die an den Enden stehenden 1-Bits bilden die oberen und unteren Einzelbildabgrenzungsbits der senkrechten Silhouette, die für das gesamte Zeichen gilt. Dieses Verfahren zum Abgrenzen jedes Zeichens bildet nicht einen Gegenstand der Erfindung. Die Einzelbildadressen werden gespeichert und während der gesamten Analyse des Zeichens nutzbar gemacht, und die waagerechte Silhouette dient als Parameter, der die Breite des Zeichens bestimmt, während die senkrechte Silhouette als Parameter festgehalten wird, der die Höhe des Zeichens bestimmt. Man kann spezielle logische Schaltungen in der Zentraleinheit 22 verwenden, um diesen Zeichenabgrenzungsvorgang durchzuführen.
Nach dem Festlegen der X- und Y-Begrenzungsadressen des Zeichens wird die Videoinformation, die sich auf das gesamte innerhalb des Begrenzungsrechtecks befindliche Zeichen bezieht, gebildet, in Form von 1- und O-Bits innerhalb elementarer Flächen gequantelt und so behandelt^ als
3098 1 9/08 U
ob innerhalb jedes Flächenelements ausschließlich eine Schwarzinformation oder ausschließlich eine Weißinformation vorhanden wäre, die einem Auflösungselement der Detektoreinrichtung, d.h. einer der Dioden 40, entspricht. Die Detektoreinrichtung bestimmt auf bekannte Weise eine Signalschwelle derart, daß das durch eine bestimmte Photodiode 40 erzeugte Signal einem bestimmten Menge von von schwarzer Färbung in dem zugehörigen Flächenelement des Schriftstücks entsprechen muß, damit dieses Flächenelement als ein 1-Bit identifiziert wird. Die zwischen den X- und T-Begrenzungsadressen liegende Zeichenmatrix besteht aus waagerechten schmalen Ausschnitten oder Reihen, die jeweils die Dicke eines Auflösungselements haben, und deren Breite der »Breite des Zeichens längs der betreffenden Reihe entspricht» Jede solche Reihe enthält eine Kombination von 1- und O-Bits, die den schwarzen bzw. weißen Segmenten innerhalb der betreffenden Reihe entsprechen, oder sie kann sich ausschließlich aus 1-Bits zusammensetzen, was einer durchgehenden schwarzen Linie in der betreffenden Reihe entspricht. Man kann diese Analyse in de? senkrechten Richtung erweitern, so daß man schmale senkrechte Ausschnitte oder Spalten mit der Breite eines Auflösungselements erhält, deren Höhe gleich der Höhe des Zeichens ist. Auf dieses Verfahren der Analyse wird im folgenden näher eingegangen.
Beginnt man mit der Reihenanalyse des Zeichens gemäß Fig. 4, besteht die einleitende Operation in der in Fig. 4 durch den Diagrammblock 50 bezeichneten Operation, die dazu dient, Signale für die Begrenzungen und Längen der Reihensegmente zu erzeugen. Ein Segment ist als eine lückenlose Folge schwarzer Elemente definiert, die durch 1-Bits dargestellt wird. Die Op-eration entsprechend dem Diagrammblock 50 dient dazu, Daten zu ermitteln, die für die Anfangs- und End-X-Adressen jedes Segments in jeder Reihe und damit für die Länge jedes Segments gelten« Geht man beim Analysieren einer Reihe von dem ersten 1-Bit auf der linken Seite aus, so bestimmt dieses Bit die linke Begrenzung eines Segments, und das letzte 1-Bit einer lückenlosen
3 0 Γ: H I 9 / 0 M 4
Folge von 1-Bits, auf die ein O-Bit folgt, bestimmt die rechte Begrenzung des betreffenden Segments. Die Differenz zwischen den X-Adressen der linken und der rechten Begrenzung bestimmt die Länge des Segments. Handelt es sich bei einem Segment um ein in der Mitte zwischen, den Enden einer Reihe liegendes Segment, wird dieses Segment dadurch identifiziert, daß es auf beiden Seiten von O-Bits flankiert ist; handelt es sich um ein endständiges Segment, wird es dadurch identifiziert, daß es auf einer Seite ein O-Bit aufweist, während das auf der anderen Seite stehende Bit der Begrenzungsadresse entspricht.
Bei der als Beispiel gewählten Matrix 42 nach Fig. weist das unterste Segment des Zeichens, d.h. die Reihe mit der Adresse Y-2, auf der linken Seite eine Begrenzung auf, die mit der Adresse X-4 beginnt, während die Begrenzung auf der rechten Seite der Adresse X-10 entspricht; somit hat dieses Segment eine Länge von 7 aufeinander folgenden 1-Bits. Bei der nächsten Reihe mit der Adresse Y-3 liegt die linke Begrenzung bei X-3 und die rechte Begrenzung bei X-11, d.h. es ist eine waagerechte Folge von neun 1-Bits für dieses Segment vorhanden. Bei der Reihe mit der Adresse Y-4 liegt die linke Begrenzung bei X-2, die rechte Begrenzung des ersten Segments bei X--6, die nächste linke Grenze bei X-9 und die darauf folgende rechte Begrenzung bei X-12. Somit sind in der Reihe Y-4 zwei Segmente identifiziert. Bei jeder der vier nächsten Reihen werden zwei Segmente auf ähnliche Weise identifiziert. Danach enthält jede der nächsten Reihen T~9 und Y-10 jeweils nur ein Segment, und diese Segmente unterscheiden sich bezüglich ihrer Länge; in den Reihen Y-9 und Y-10 sind die Segmente lang, während sie bei den weiteren, sich nach oben anschließenden Reihen Y-11 bis Y-16 kurz sind.
Hierauf wird der in Fig. 4 durch den Diagrammblock angedeutete Arbeitsschritt durchgeführt, der darin besteht, daß eine Reihensegment-Kodetabelle nach Anzahl und Länge aufgestellt wird. Beim Analysieren einer großen Auswahl
3 Ü b 8 1 9 / Ü ΓΪ 1 L
verschiedener Schriftarten sowohl bei alphabetischen Zeichen als auch bei Zahlzeichen hat es sich gezeigt, daß sich zwei Merkmale der Segmente ausnutzen lassen, und zwar einerseits die Anzahl der Segmente-und andererseits die Länge der Segmente. Die Datenverarbeitungsanlage wird so betrieben, daß maschinenlesbare Aufzeichnungen und den Kategorien der Segmente entsprechende Maschinensignale erzeugt werden. Außerdem werden Kodes in Form kombinatorischer Signale in digitaler Gestalt benutzt, um die Informationen in einer maschinell verarbeitbaren Form festzulegen. Nachstehend ist eine Form eines Kodes angegeben, der zum Klassifizieren der Segmente dient, und bei dem es sich gezeigt hat, daß er bei den verschiedensten Schriftarten, und zwar sowohl bei maschinell gedruckten Zeichen als auch bei handgeschriebenen Druckbuchstaben, anwendbar istj
0: eine Reihe mit einem einzigen kurzen Segment;
1: eine Reihe mit einer beliebigen Anzahl von Segmenten, bei denen das längste Segment als "lang" zu bezeichnen ist, da seine Länge z.B« die halbe Breite des Zeichens überschreitet;
2: eine Reihe mit zwei kurzen Segmenten; und 3: eine Reihe mit drei oder mehr kurzen Segmenten»
Die Erfahrung hat gezeigt, daß nur eine sehr geringe Informationsmenge verloren geht, wenn man keine Unterscheidung zwischen drei oder mehr als drei Segmenten trifft. Hierbei handelt es sich jedoch zum Teil um eine willkürliche Maßnahme bei der Kpnstruktion der analytischen Steuereinrichtung, die in bestimmten Fällen variiert werden kann. Auch bezüglich der Länge der in einer Reihe enthaltenen Segmente hat die Erfahrung gezeigt, daß es nur erforderlich ist, zwischen "langen" Segmenten, deren Länge z.B. die halbe Zeichenbreite überschreitet, und "kurzen" Segmenten zu unterscheiden, die eine geringere Länge haben. Bei manchen Schriftarten oder bestimmten anderen Alphabeten oder Zeichensystemen kann es sich jedoch als zweckmäßiger erweisen, eine Unterteilung in kurze, mittellange und lange Segmente vorzunehmen, und eine solche Unterteilung, hat sich tat-
30981 9/08U
sächlich bei der im folgenden beschriebenen Spaltenanalyse als vorteilhaft erwiesen. Die Analyse wird möglichst weitgehend unabhängig von den absoluten Abmessungen der Zeichen durchgeführt, und im Hinblick hierauf werden die Abmessungen jedes Segments dadurch in Beziehung zu den Gesamtabmessungen des Zeichens gebracht, daß der Parameter der Zeichenbreite als Basis für den Vergleich bei jedem Reihensegment benutzt wird. Mit anderen Worten, bei dieser Reihenanalyse und dem durch den Diagrammblock 52 angedeuteten Verschlüseelungsvorgang wird jedes Segment mit einer Hälfte der Zeichenbreite verglichen, und wenn das betreffende Segment die gleiche Länge hat wie die Zeichenbreite oder eine größere Länge, wird es als langes Segment identifiziert; anderenfalls wird das Segment als kurzes Segment identifiziert.
Auf der Basis der bis jetzt gewonnenen Informationen wird eine Reihensegment-Kodetabelle (siehe folgende Tabelle I) aufgestellt und von bestimmten Teilen des Speichers zusammen mit einem Kode für jede Reihe aufgenommen. In der Tabelle I sind die Reihenadressen der Deutlichkeit halber als die Y-Adressen des Zeichens "6" nach Fig. 3 angegeben, d.h. nicht in Form der Maschinenadressen des Speichers, die bei dem betriebsfähigen System tatsächlich benutzt würdeno Außerdem sind Kodebezeichnungen angegeben, um dem Leser die Identifizierung der in der Tabelle I aufgeführten Kodes zu erleichtern·
3098 13/08U
2253 193 - 15 -
■Tabelle I
Kode Kodebezeichnung
Reihe 1 langes Segment
Υ-2 1 langes Segment
Y-3 2 zwei kurze Segmente
Υ-4 2 zwei kurze Segmente
■ ϊ-5 2 zwei kurze Segmente
Υ-6 2 zwei kurze Segmente.
Υ-7 2 zwei kurze Segmente
Υ-8 1 · langes Segment
Υ-9 1 langes Segment
Υ-10 0 kurzes Einzelse^ient
Υ-11 0 kurzes Einzelsegment
Υ-12 0 kurzes Einzelsegment
Υ-13 0 kurzes Einzelsegment
Υ-14- 1 langes Segment
Υ-15 0 kurzes Einzelsegment
Υ-16
Nach der Fertigstellung der Reihensegment-Kodetabelle wird der in Fig. 4 durch aan Diagrammblock 5^ angedeutete Arbeitsschritt durchgeführt, der darin besteht, daß eine Kodetabfeelle für Folgen von Reihen, Zeitdauern und Orientierungen aufgestellt wird. Die Zentraleinheit 22 identifiziert Folgen von Reihen, die den gleichen Segmenttyp aufweisen bzw. durch den gleichen Kode bezeichnet sind. Gemäß der vorstehenden Tabelle I der Reihensegmentkodes ist den Reihen mit den Adressen Y-2 und Y-3 jeweils der Kode 1 zugewiesen, eo. daß sich eine Folge von zwei Reihen mit langen Segmenten ergibt. Die Reihen Y-4 bis Y-8 bilden eine Folge von Reihen mit dem Kode 2, von denen jede zwei kurze Segmente enthält, so daß sich eine Folge von fünf solchen Reihen ergibt. Für die Reihen Y-9 und Υ-1Θ gilt der Kode 1, d.h. es ergibt sich eine Folge mit der Dauer 2S die zwei Reihen mit langen Segmenten entspricht. Für die Reihen Y-11 bis Y-14- gilt der Kode 0 und die Dauer 4·» Bei der Reihe Y-15 handelt es sich um eine einzige Reihe mit dem, Kode 1, so daß sich eine Folge m±\; der Dauer 1 ergibt» Die Reihe
3 0 9 8 1 9 / 0 8
Y-16 ist eine einzige Reihe mit dem Kode 0, die somit eine Folge mit der Dauer 1 bildet.
Wenn man für den Augenblick die Dauer der Folgen unberücksichtigt läßt, ergibt sich die nachstehende Folge von Kodes:
12 10 10
Dieses Kodesystem wird in der Praxis dazu benutzt, Informationen festzulegen, die sich auf Dauerfolgen beziehen, d.h. Folgen, die zwei oder mehr Reihen mit dem gleichen Kodetyp umfassen. Außerdem wird eine einzelne Reihe, deren längstes Segment als langes Segment betrachtet wird, als Dauerfolge behandelt, während jede einzelne isolierte Reihe, die kein langes Segment enthält, nicht als Dauerfolge betrachtet wird. Immer dann, wenn auf eine Dauerfolge eine solche unterbrochene Folge folgt, wird die Dauer der Dauerfolge um 1 erhöht, und die unterbrochene Folge wird fallen gelassen. Somit legt der Verfahrensschritt 5M-die Information in Form der nachstehenden Tabelle von revidierten Reihenfolgekodes fest, in der die entsprechenden revidierten Dauerwerte unter den zugehörigen Kodeziffern erscheinen:
12 10 1
2 5 2 4 2
Es hat sich gezeigt, daß man die genauen Werte der Folgendauer durch relative Dauerwerte ersetzen kann, wobei die Zeichenhöhe die Vergleichsbasis bildet. Mit anderen Worten, die Reihendauerwerte werden als "lange Folgen" kodiert und durch 1-Bits dargestellt, während die "kurzen Folgen" durch 0-rBits dargestellt werden. Ein geeignetes Konstruktionskriterium für kurze Segmentfolgen mit dem Kodetyp 0 oder 2 oder 3 besteht darin, daß es sich um eine "lange Folge" handelt, wenn ihre Dauer gleich einem Drittel oder mehr der Zeichenhöhe ist. Eine Reihen-Folge von langen Segmenten wird als Folge von langer Dauer betrachtet, wenn
3098 1 9/081A
ihre Dauer gleich 3 oder mehr ist. Bei dem in Fig. 3 als Beispiel dargestellten Zeichen "6" mit der Zeichenhöhe 15» bei dem ein Drittel der Zeichenhöhe gleich 5 ist, kann man die nachstehenden Reihendauerkodes dem vorstehenden Beispiel zuordnen:
12 10 1 Reihen-Folge-Kode 2 5 2 4 2 Reihendauerwerte 0 1 0 0 0 Reihendauerkode
Ferner wird ein Folgeorientierungskode benutzt, da es sich gezeigf hat, das bedeutsame Informationen, die die Geometrie eines Zeichens charakterisieren, in der Orientierung der Folgen kurzer Reihensegmente enthalten sind. Beispielsweise beginnt bei dem Zeichen "Z" ein Schrägstrich, der einer Folge von kurzen Segmenten entspricht, am linken unteren Ende des Zeichens,,, und diese Folge endet am rechten oberen Ende des Zeichens. Das Zeichen "S" weist eine Folge von kurzen Segmenten auf, die auf der rechten Seite nahe dem unteren Ende beginnt und auf der linken Seite nahe dem oberen Ende endet. Das Zeichen 11L" weist eine Folge von kurzen Segmenten auf, die auf der linken Seite am unteren Ende bedingt und sich auf der linken Seite bis zum oberen Ende fortsetzt. Analytische Kode werden festgelegt, die von absoluten Abmessungen unabhängig sind, indem Abschnitte der Zeichenbreite festgelegt werden, innerhalb welcher die verschiedenen Begrenzungen der Segmente liegen können. Bei einer Ausführungsform der Erfindung werden die Kodes so festgesetzt, daß dann, wenn irgendein Teil eines kurzen Segments im linken Drittel der Zeichenbreite liegt, dieses Segment für die Zwecke der Orientierungskodifizierung als nach links gerichtet betrachtet wird; ist dies nicht der Fall, wird dann festgestellt, ob irgendein Abschnitt des kurzen Segments im mittleren Drittel der Zeichenbreite liegt, woraufhin das Segment als mittenorientiert behandelt wird; ist auch dies nicht der Fall, befindet sich das Segment im rechten Drittel der Zeichenbreite, und daher wird es als nach rechts orientiert behandelt. Bei den nachste-
309819/08U
henden Kriterien für den Orientierungskode wird die Orientierung des untersten Segments einer Folge mit derjenigen des obersten Segments der Folge von kleinen Segmenten wie folgt verglichen:
O: von links nach links
1: von links zur Mitte
2: von links nach rechts
3: von der Mitte nach links
4·: von der Mitte zur Mitte
5: von der Mitte nach rechts
6: von rechts nach links
7J von rechts zur Mitte
8: von rechts nach rechts
Bei dem gemäß Fig. 3 als Beispiel gewählten Zeichen "6" gilt der Orientierungskode 1 für eine Folge von Reihen mit kurzen Segmenten für die Folge, die an der Adresse Y-11 im linken Drittel der Zeichenbreite beginnt und sich bis zur Adresse Y-14 fortsetzt, wo das betreffende Segment im mittleren Drittel der Zeichenbreite liegt. Mit anderen Worten, diese Folge von kurzen Segmenten verläuft von links zur Mitte.
Zusammenfassend ist festzustellen, daß der Verfahrensschritt 54- bewirkt, daß eine Kodetabelle (siehe Tabelle III weiter unten) aufgestellt wird, die drei Kodes enthält, und zwar erstens einen Reihen-Folge-Kc.de, zweitens einen Dauerkode für die Folgen von Reihen und drittens einen Orientierungskode für etwa vorhandene Folgen von Reihen mit kurzen einzelnen Segmenten. Die Ergebnisse dieser Reihenanalyse und der Verschlüsselung des Zeichens "6" nach Fig. 3 sind in der folgenden Tabelle II zusammengestellt.
Tabelle II
12 10 1 Reihen-Folge-Kode 0 10 0 0 Dauerkode _ _ _ ι _ Orientierungskode
309819/08U
Nach dem Fertigstellen der Reihen-Folge-Kodetabelle (Tabelle II) im Verlauf des Arbeitsschritts 54 führt die Maschine den nächsten Arbeitsschritt $6 nach Fig. 4 durch, der darin besteht, daß Reihenkodes als Speicheradressen festgelegt werden. Die Reihen-Folge-Kodes nach der Tabelle II repräsentieren ein bestimmtes Zeichen, und die Zuordnung dieser Kodes zu den betreffenden Zeichen wird in dem einen wahlfreien Zugriff ermöglichenden Hauptspeicher 24 des Rechners gespeichert. Wegen der zahlreichen möglichen Abweichungen bei gedruckten Zeichen sowie wegen der regellosen und verschiedenartigen Effekte, die bei der Verarbeitung und dem Nachweisen von Videosignalen auftreten, könrte sich eine übermäßig große Anzahl von Kodes ergeben, so daß man einen unerwünscht großen Speicher benötigen und sich die Verarbeitungszeit übermäßig verlängern würde.
Das Speichersystem, 'von dem es sich gezeigt hat, daß es sich als geeignet erweist, die große Anzahl von Kodes zu verarbeiten, die jeweils einem bestimmten Zeichen zugeordnet sind, und die sich aus der großen Anzahl von Abweichungen ergeben, welche bei jedem Zeichen auftreten können, basiert auf der Verwendung der in der Tabelle II aufgeführten Folgekodes zum Festlegen der Speicheradres- , sen. Mit anderen Worten, das System macht Gebrauch von einem Hechnerwort, das an einer bestimmten Adresse gespeichert ist, wo das Rechner- oder Maschinenwort alle einem Kode zugeordneten Zeichen identifiziert, während die Adresse den betreffenden geometrischen Kode identifiziert. Beispielsweise hat ein Wort mit 10 Bits eine Bitstelle für jede der Ziffern 0 bis 9, und wenn ein Bit den Wert "1" hat, trifft der Kode für die zugehörige Ziffer in der nachstehend gezeigten Weise zu:
Bitstelle 9 87 6 545 210
00010 0 0000
Dieses Maschinenwort repräsentiert einen Kode, der für das Zeichen "6" und nur für dieses zutrifft.
30981 9/08U
2253Ί93
Die Speieheradreseen basieren auf den drei folgenden Kriterien:
a) Die Anzahl der Folgen in dem Folgekode; beispielsweise würde eine mit der Hand nur als senkrechter Strich gezeichnete"1" nur eine einzige Folge aufweisen; ein "U" könnte zwei Folgen enthalten; bei einem "0" kämen drei Folgen in F^age usw., und bei dem Beispiel des Zeichens "6" nach Fig. 3 wurden sich fünf Folgen ergeben; bei verschiedenen anderen Zeichen würde die Anzahl der Folgen noch größer sein; es hat sich als zweckmäßig erwiesen, bis zu acht Folgen vorzusehen;
b) die bestimmte Folge des für mehrere Folgen geltenden Kodes, die adressiert wird, so daß festgelegt wird, ob es sich um die erste, die zweite, die dritte usw. Folge handelt;
c) der Kode, z.B. 0, 1, 2 oder 3, der für jede bestimmte Folge gilt.
Bei dem Beispiel des Zahlzeichens "6" nach Fig. 3» für das die Kodes nach der Tabelle II gelten, gibt es eine Serie von Basisadressen B^. für ein Zeichen mit einer Reihengeometrie von fünf Folgen; die gleiche Basisadresse gilt auch für Jede andere Reihengeometrie von 5 Folgen. Die Basisadresse der ersten Reihen-Folge lautet Bcq, und hierbei handelt es sich um die Adresse für die Kode-0, wenn dieser bei der ersten Reihen-Folge angewendet wird. Die Adresse Bc0 + 1 ist die Adresse für die erste Reihen-Folge mit dem Kode 1; die Adresse B1-Q + 2 ist die Adresse für die erste Reihen-Folge mit dem Kode 2, und die Adresse + 3 ist die Adresse für die erste Reihen-Folge mit dem
Kode 3· Entsprechend ist eine Basisadresse B1-/, für die zweite Reihen-Folge vorhanden, und die Adresse B1-,, wird für den Kode 0 verwendet, während die Adresse Br/, + 1 für den Kode 1 verwendet wird, usw.; zu den weiteren Adressen gehören eine Basisadresse Β,-ρ und drei Zwischenadressen
30981 9/08U
für die dritten Reihen-Folgen mit den Kodes 0 bis 3> eine Basisadresse B,-* und drei Zwischenadressen für die vierten Reihen-Folgen mit den Kodes 0 "bis 3 sowie die Basisadresse B,-^. und drei Zwischenadressen für die fünften Reihen-Folgen mit den Kodes 0 bis 3· Bei der Basisadresse kann es sich um eine beliebige geeignete echte Speicheradresse handeln, aus der sich die übrigen Adressen in der beschriebenen Weise leicht ableiten lassen.
In der Praxis wird B^. als Basisadresse der i-Folge benutzt, wobei i die Gesamtzahl von Folgen, z.B. von 1 bis 8, bezeichnet, während j eine bestimmte Folge der Gruppe identifiziert, und zwar bei diesem Beispiel fünf Folgen vom Reihentyp. Bei dem in der Tabelle II angegebenen Kode für das Zeichen "6" ergeben sich für die fünf Folgekodes die Speicheradressen Bcq + 1, B1-,, + 2, B1-O + 1» B53 + O und Bn^. + 1» die den Kodes 1, 2, 1, O, 1 für diese fünf Folgen entsprechen.
Untersuchen wir den Inhalt der Speicheradresse Bcq +' 1, erwarten wir, daß folgende Folgenbezeichnungswort zu finden:
Bitstellung 9876343210
1101101000
Mit anderen Worten, an den Bitstellen 3» 5f 6, 8 und befinden sich 1-Bits und an den übrigen Bitstelle.n O-Bits. Diese Speicherdarstellung zeigt an, daß die Zeichen 3» 5» 6, 8 und 9 unter der Annahme, daß ,jedes Zeichen eine Geometrie mit fünf Folgen aufweist, jeweils in ihrer untersten Reihe eine lange Segmentfolge mit dem Kode 1 aufweisen. Die übrigen Zeichen O, 1, 2, 4- und 7 haben geometrische Verhältnisse, die nicht zu einem Kode für fünf Folgen führen, oder ihre erste oder unterste Reihen-Folge wird nicht durch den Kode 1 bezeichnet·
Zur Handhabung des Dauerkodes nach der Tabelle II wird für jede Klasse von Reihen-Folgen eine andere Basisadresse festgelegt, z.B. die Basisadresse Dc0 für die
309819/08U
für das Zeichen "6" geltende, fünf Folgen umfassende Klasse vom Beihentyp. Der Dauerkode, bei dem es sich um einen Kode mit fünf Bits für die Gruppe von Folgen mit fünf Reihen handelt, bedingt das Vorhandensein von 32 möglichen Adres-r sen, die dieser Anzahl der möglichen Kodekombinationen entsprechen. Alternativ und vorzugsweise wird das Adressiersystem angewendet, das für die Reihen-Folge-Kodes vorgesehen ist, und für jede der Reihen-Folge-Dauern wird mit einer gesonderten zusätzlichen Basisadresse gearbeitet. Mit anderen Worten, für die fünf Dauerwerte einer Gruppe mit fünf Folgen werden fünf zusätzliche Basisadressen D1-,., Dcp» Vcxi ^5/f» D55 verwendet. Die Basisadresse entspricht der Dauer des Kodes 0, und die nächste Zwischenadresse entspricht der Dauer des Kodes 1, wobei man die Zwischenadresse durch Addieren von 1 zu der zugehörigen Basisadresse erhält.
Zur Handhabung der Orientierungskodes nach der Tabelle Il wird vorzugsweise eine Basisadresse P für alle Orientierungskodes ohne Rücksicht auf die Anzahl der Folgen benutzt, und dies gilt auch für den Orientierungskode 0 für die betreffende Folge. Außerdem werden acht Zwischenadressen für jede Reihen-Folge benutzt, um die Kodes 1 bis 8 zu handhaben. Man kann ohne Rücksicht auf die tatsächliche Anzahl der vorhandenen Reihen-Folgen auch nur drei oder vier Folgen von kurzen Segmenten vorsehen, da im allgemeinen ein Zeichen höchstens zwei solche Folgen enthalten kann. Das Vorhandensein einer kurzen Folge wird durch den Kode für den Reihen-Folge-Kode angezeigt, der erkannt und als Vorbedingung für das Festlegen der Speicheradressen für die Orientierungskodes benutzt wird. Bei dem als Beispiel gewählten Zeichen "6" und den Kodes nach der Tabelle II gilt der Orientierungskode somit nur für die vierte Folge, und die Adresse für diese Kode-1 lautet PfL-
Bei dem soeben beschriebenen Speicheradressiersystem hat es sich als möglich erwiesen, ein Speichersystem aufzubauen, bei dem etwa 500 Bezeichnungswörter für ein
3 0 9 8 1 9 / 0 8 U
Zeichenkodiersystem benötigt werden, bei dem maximal sieben oder acht Folgen vorkommen. Zwar ist die Anzahl der benutzbaren Folgen grundsätzlich nicht begrenzt, doch hat es sich gezeigt, daß sieben oder acht Folgen .für zahlreiche Maschinenschriftarten ausreichen« Die tatsächliche Anzahl der Kodes, die durch ein solches Kodiersystem ermöglicht wird, liegt im Bereich von Millionen oder dem Zehnfachen davon, doch würden die meisten dieser Kodes praktisch unbenutzt bleiben. Somit ermöglicht dieses ßpeicheradressiersystem die Benutzung von Speichern zweckmäßiger Größe zum Verarbeiten der Kodes, die in der Praxis tatsächlich aufgestellt werden. <?
Nach dem Festlegen der Eeihenkodes als Speicheradressen wird der Arbeiteschritt 58 nach Fig. 4- durchgeführt, der dazu dient, dem Speicher die Zeichenbezeichnungswörter zu entnehmen. Jede der durch den Verfahrensschritt 56 entsprechend den Reihenkodes festgelegten Speicheradressen wird benutzt, um d,em Speicher ein entsprechendes Zeichenbezeichnungswort zu entnehmen. Dieser Satz von Bezeichnungswörtern repräsentiert durch die verschiedenen darin enthaltenen 1-Bits sämtliche Zeichen, die einen beliebigen Reihenkode oder mehrere der Reihenkodes enthalten, die durch den Arbeitsschritt 5^ festgelegt worden sind. Gemäß Fig. 4- wird dann mit diesen Daten der nächste Arbeitsschritt 60 durchgeführt, der dazu dient, den logischen Schnittpunkt zwischen Zeichenbezeichnungen zu ermitteln. Mit anderen Worten, bei allen entsprechenden Bitstelleti. der Bezeichnungswortregister werden die Ausgangssignale gleichzeitig bezüglich ihrer logischen Schnittpunkte geprüft. Wird ein Universalrechner benutzt, besteht ein hierzu geeignetes Verfahren darin, den Und-Befehl des Rechners zu benutzen, so daß eine logische Und-Funktion im Α-Register des Rechners bezüglich der entsprechenden Bits der beiden ersten Bezeichnungswörter und danach bezüglich des Ergebnisses mit dem nächsten Bezeichnungswort durchgeführt wird usw. Dieser Arbeitsschritt 60 wird bei jedem Bezeichnungswort für jeden Iteihen-Folge-Kode, jeden Dauerkode und jeden Orientierungskode
.309819/081 k
- 24 durchgeführt.
Hierauf wird gemäß Fig. 4 durch den Arbeitsschritt 62 festgestellt, ob nur eine einzige Bitstelle des resultierenden, in dem Α-Register benutzten Schnittpunktes ein 1-Bit ist. Wenn dies der Fall ist, wird gemäß Fig. 4 die Durchführung des nächsten Arbeitsschritts 64 zum Dekodieren des Bezeichnungswort-Schnittpunktes durchgeführt, und hierdurch wird das betreffende Zeichen aus der Bitstellung des das einzige 1-Bit enthaltenden Bezeichnungsworts ermittelt. Der nachfolgende Verfahrensschritt 66 liefert ein Ausgangssignal, das den Namen oder das Symbol des Zeichens bezeichnet oder die Durchführung eines bestimmten zugehörigen Steuervorgangs bewirkt. Nunmehr bewirkt die Steuereinrichtung A, daß der Rechner zu dem anfänglichen Arbeitsschritt 48 zurückkehrt, der dazu dient, die Video- und Begrenzungsinformationen für das nächste Zeichen auszuwählen, woraufhin sich sämtliche vorstehend beschriebenen Arbeitsschritte bezüglich dieses nächsten Zeichens wiederholen.
Wird festgestellt, daß die Reihenanalyse gemäß dem Arbeitsschritt 62 nicht zu einem einzelnen bezeichneten Zeichen führt, wird gemäß Fig. 4- eine Spaltenanalyse mit Hilfe des Arbeitsschritts 68 durchgeführt, durch den die Spaltensegmentbegrenzungen festgelegt werden; dieser Arbeitsschritt ähnelt dem Arbeitsschritt 50» abgesehen davon, daß die Segmente in den Spalten analysiert werden, um ihre obere und ihre untere Begrenzung und damit auch ihre Länge zu ermitteln.
Hierauf wird gemäß Fig. 4 der Arbeitsschritt 70 durchgeführt, um eine Spaltensegment-Kodetabelle nach Anzahl und L^nge aufzustellen. Der Arbeitsschritt 70 ähnelt dem Arbeitsschritt 55» abgesehen davon, daß sich ein abgeänderter Kode bei maschinellem Druck von arabischen Zahlen und Buchstaben des Alphabets als besser geeignet erwiesen hat. Mit anderen Worten, die Spaltenkodes 0, 1, 2 und 5 haben den gleichen Aufbau wie die Kodes für die Reihen, nb-
3 Π ti 8 1 9 I 0 8 1 U
gesehen davon, daß ein langes Spaltensegment als ein solches definiert ist, dessen Höhe drei Vierteln der Spaltenhöhe oder mehr entspricht. Außerdem werden Kodes 4 und 5 bei einer Spalte benutzt, die ein oder mehr Segmente enthält, wobei das längste-Segment eine "mittlere" Länge hat, und wobei der Mittelpunkt des Segments in der unteren Hälfte der Spaltenhöhe (Kode 4). liegt, oder wobei der Mittelpunkt in der oberen Hälfte der Spaltenhöhe (Kode 5) liegt. Der Ausdruck "mittlere Länge" wird bei Längen benutzt, die der halben Höhe des Zeichens entsprechen, zu denen jedoch keine Segmente gehören, die drei Viertel der Spaltenhöhe einnehmen. Anstelle der Bezeichnungen "mittlere Länge" oder "große Länge" für die Segmente kann man auch andere relative Größenbezeichnungen verwenden.
Bei dem in Fig. 3 als Beispiel dargestellten Zeichen "6" ist zu erkennen, daß die erste Spalte auf der linken Seite bei der Adresse X-2 ein kurzes Segment enthält, dessen Länge kleiner ist als die halbe Zeichenhöhe, während sich in der zweiten Spalte bei der Adresse X-3 ein Segment· von mittlerer Länge befindet, dessen Länge etwas größer ist als die halbe Zeichenhöhe. Der Mittelpunkt dieses Segments von mittlerer Länge liegt in der unteren Hälfte des Rechtecks 42, und daher wird diesem Segment der Kode 4 zugewiesen, Die für die Spaltensegmente geltenden Kodes sind in der folgenden Tabelle III zusammengestellt:
Tabelle III 1 U
Spalte Kode
X-2 O;
X-3 4
X-4 1
X-5 2
X-6 2
X-7 3
X-8 3
X-9 3
X-10 3
X-11 O
X-12 O
309819/08
Nunmehr wird gemäß Fig. 4 der Arbeitsschritt 72 durchgeführt, der dazu dient, eine Kodetabelle für Spaltenfolgen, Dauerwerte und Orientierungen aufzustellen· Dieser Arbeitsschritt ähnelt dem beschriebenen Arbeitsschritt 54 zum Aufstellen einer Kodetabelle für die Reihen-Folgen. Es ist ersichtlich, daß die in der Tabelle III angegebenen Segmente die Gestalt der nachstehenden Kodefolgen annehmen:
0 4 12 3 0
Da das erste kurze Spaltensegment nicht aufrechterhalten wird, während die beiden nächsten Segmente eine mittlere bzw. eine große Länge haben, wird die kurze, nicht aufrechterhaltene Folge fallen gelassen, während die Segmente mit der mittleren bzw. der großen Längs festgehalten werden, um den nachstehenden Folgekode zu erzeugen, unter dem die entsprechenden Werte für die Dauer angegeben sind.
4 12 3 0
112 4 2
Mit Ausnahme der Kode-3-Folge sind alle diese Folgen kurz, so daß sich der nachstehende Dauerkode ergibt:
0 0 0 10
Auch bei den Spaltenfolgen wird ein Folgeorientierungskode benutzt, der ähnlich aufgebaut ist wie der bei den Reihen angewendete Orientierungskode für Folgen kurzer Segmente, abgesehen davon, daß die Spalten so behandelt werden, als ob sie untere, mittlere oder obere Segmente enthielten (im Gegensatz zu den linken, mittleren oder rechten Segmenten innerhalb der Reihen), und der Zeichenhöhenparameter wird benutzt, um festzustellen, in welchem Drittel der Zeichenhöhe der Mittelpunkt des betreffenden Segments liegt. Befindet sich der Mittelpunkt eines Segments im unteren Drittel ist das Segment nach unten orientiert; liegt der Mittelpunkt des Segments im mittleren Drittel, ist ein auf die Mitte orientiertes Segment vorhan-
3098 1 9/08
und wenn der Mittelpunkt des Segments im oberen Drittel liqejt, wird von einem nach oben orientierten Segment gesprochen. Hieraus ergibt sich der nachstehende Spaltenorientierungskode :
O: von unten nach unten
1: von unten zur Mitte
2: von unten nach oben
3: von der Mitte nach unten
4: von der.Mitte zur Mitte
5: von der Mitte nach oben
6: von oben nach unten
7! von oben zur Mitte
8: von oben nach oben.
Bei dem in Fig. 3 als Beispiel dargestellten Zeichen "6" liegen bei der kurzen Folge von Segmenten in den Spalten X-11 und X-12 beide Mittelpunkte im unteren Drittel der Zeichenhöhe, so daß diesen Segmenten der Orientierungskode O zugewiesen wird. Somit wird die Spaltenfolgekodetabelle auf ähnliche Weise aufgestellt, wie es weiter oben bezüglich der Reihen-Folgen beschrieben istj für das gemäß Fig. 3 als Beispiel gewählte Zeichen "6" lauten daher die Kodes wie folgt: -
Tabelle IV
4 1 2 3 O
0 0 0 10
0 0
Dann werden gemäß Fig. 4 die Arbeitsschritte 74 zum Festlegen der Spaltenkodes als Speicheradressen und 76 zum Entnehmen der Zeichenbezeichnungswörter aus dem Speicher auf ähnliche Weise durchgeführt, wie es weiter oben bezüglich der Arbeitsschritte 56 und 58 für die Reihen beschrieben ist, abgesehen davon, daß diese Arbeitsschritte nicht an Reihenkodes, sondern an Spaltenkodes durchgeführt werden. Hierauf dient der Arbeitsschritt 78 dazu, den logischen Schnittpunkt der Bezeichnungswörter dadurch zu
3 0 9 8 1 9 / 0 8 U
erhalten, daß bezüglich Bezeichnungswörtern mit ähnlichen Bitstellungen Und-Arbeitsschritte durchgeführt werden· Gemäß Fig. 4 dient dann eine Entscheidungseinrichtung 80 dazu, festzustellen, oh das Ergebnis der Und-Operation zur Bezeichnung eines einzigen Zeichens geführt hat; ist dies der Fall, wird durch den Verfahrensschritt 82 das bezeichnete Zeichen dekodiert, woraufhin der Arbeitsschritt 84 bewirkt, daß der Name oder das Symbol des Zeichens ausgedruckt wird; nunmehr wird für das nächste Zeichen erneut mit dem Arbeitsschritt 48 begonnen» Stellt die Entscheidungseinrichtung 80 fest, daß es sich nicht um ein einzelnes Zeichen handelt, kann gemäß Fig. 4 der nächste Arbeitsschritt 86 lediglich dazu dienen, ein Signal sichtbar zu machen oder auszudrucken, das eine Nichterkennung eines Zeichens anzeigt. Alternativ kann man gemäß Fig. 4 eine weitere Entscheidungseinrichtung 88 benutzen, um festzustellen, ob ein Kode für die betreffenden Reihen- und Spalten-Folgen gefehlt hat, um gegebenenfalls mit Hilfe des Arbeitsschritts 86 das Nichterkennen eines Zeichens anzuzeigen. Zeigt das Ergebnis des Arbeitsschritts 88 an, daß mehrere Kodes vorhanden sind, kommt gemäß Fig. 4 eine Trenneinrichtung 90 zur Wirkung, um festzustellen, ob es möglich ist, eine Analyse auf einer verfeinerten Basis durchzuführen, um das Zeichen zu identifizieren.
Als Beispiel für einen Satz von Zeichen, bei dem es sich als schwierig erweisen kann, die Zeichen mit Hilfe des vorstehend beschriebenen Kodierungssystems zu unterscheiden, seien die beiden Zeichen "D" und "0" genannt. Mit anderen Worten, bei bestimmten Schriftarten würden sowohl die Keihenals auch die Spaltenkodes für diese beiden alphabetischen Zeichen die gleichen sein. Wenn beide Zeichen während des Verarbeitungsbetriebs gelesen werden, würden daher mehrere Kodes auftreten, die dann durch die Entscheidungseinrichtung 88 identi.fi ziert werden. Die Einrichtung 88 würde nicht nur anzeigen, daß mehz'ere Kodes vorhanden sind, sondern sie würde auch die Art der mehrfachen Kodierung anzeigen, und bei dem System würde an einer bekannten Adresse in dem
8 ι <)/ 0 8
Speicher 24 eine besondere Routineeinrichtung zur Verfügung stehen, die dazu dient, die erforderliche eingehendere Analyse durchzuführen, um eine Unterscheidung zwischen den Zeichen "D" und "0" zu treffen. Bei diesen beiden alphabetischen Zeichen könnte diese Unterscheidung z.B. darauf beruhen, daß bei dem Zeichen "0" auf der linken Seite abgerundete "Ecken" vorhanden sind, während das Zeichen "D" im Gegensatz hierzu nahezu rechtwinklige Ecken aufweist.
Die Trennung wird durchgeführt, indem im einzelnen der Aufbau der Matrix aus Videosignalen in diesen beiden Ecken eines bestimmten Zeichens geprüft wird, damit das Zeichen entweder als "D" oder als "0" identifiziert wird. Beispielsweise wird die Differenz zwischen der linken Begrenzungsadresse (jedes Zeichens und der linken Kante des Segments der oberen Reihe ermittelt, und diese Differenz, die ein Maß für den leeren Raum an der Ecke ist, wird bei .einigen nachfolgenden Reihen erneut bestimmt; hierbei werden die Differenzen kumulativ addiert. Da der Eckenraum ein Maß für die Krümmung ist, wird dann, wenn die Differenz über einem bestimmten Schwellwert liegt, das gekrümmte Zeichen 11O" identifiziert, und dieses Zeichen wird auf diese Weise durch die Trenneinrichtung erkannt; liegt die Summe dieser Differenzen unter einem zweiten Schwellwert, wird das Zeichen als "D" identifiziert; liegt die Differenz zwischen den beiden Schwellwerten, wird eine Nichterkennung angezeigt.
Die Benutzung von Routineprogrammen zum Trennen von Zeichen ermöglicht es, mit relativ einfachen Kodes der vorstehend beschriebenen Art zu arbeiten, für die man nur einen relativ minimalen Speicherraum für die gelernten Bezugszeichen benötigt, so daß sich eine relativ schnelle Analyse der meisten geometrischen Zeichen durchführen läßt, Bei der relativ kleinen Anzahl von Situationen, die sich bei zweideutigen Zeichen ergeben, wie es bei einer bestimmten Schriftart geschehen kann, lassen sich die Routine-Trennprogramme einzeln aufstellen, und hierbei kann man die
30981 9/08 U
Software oder den Aufbau des Rechnerprogramins, das bei dem Maschinensystem benutzt wird, dazu ausnutzen, bei einer auftretenden Zweideutigkeit eine Unterscheidung zu bewirken, so daß das betreffende Zeichen genau identifiziert werden kann. Somit ist es erwünscht, mit einem Routinetrennverfahren zu arbeiten, um eine genaue Identifizierung auch dann zu gewährleisten, wenn möglicherweise eine Zweideutigkeit auftritt; solche Verfahren können in der Praxis so abgeändert werden, daß eine Anpassung an Fälle erzielt wird, in denen beim Erkennen von Zeichen Zweideutigkeiten auftreten.
Wie aus Fig. 4 ersichtlich, spielt sich der "Lernvorgang" allgemein ebenso ab wie der Verarbeitungsvorgang*· Abgesehen von den Arbeitsschritten, die bei der Reihenanalyse auf den Arbeitsschritt ^-8 folgen, besteht dann, wenn die Bezeichnungswörter dem Speicher entnommen und dem Α-Register eingegeben worden sind, der nächste Arbeitsschritt 92 nach Fig. 5 darin, daß den Bezeichnungswörtern an den betreffenden Bit- oder Zeichenstellen Kodes beigefügt werden, die einen Inhalt von 1 Bit haben. Dieser Arbeitsschritt läßt sich durch einen Rechner leicht mittels einer logischen Oder-Operation durchführen, die am Inhalt des Α-Registers nacheinander an den entsprechenden Inhalten der Bezeichnungswörter durchgeführt wird, Nach dieser Analyse und dem Einfügen der Kodes für die Reihen entsprechen die nächsten Arbeitsschritten den anhand von Fig. 4 beschriebenen Arbeitsschritten 68, 70, 72, 74 und 76, die an den Spalten durchgeführt werden, und auf die der Arbeitsschritt 94 folgt, bei dem die Spaltenbits in diezugehörigen Bezeichnungswörter eingefügt und dem Speicher wieder zugeführt werden. Sobald dieser Arbeitsschritt beendet ist, werden die Videoinformationen für das nächste Zeichen ausgewählt und abgegrenzt, und das beschriebene Verfahren wird erneut angewendet.
In der Praxis wird während des Lernvorgangs eine große Auswahl von Beispielen für jedes zu erkennende Zeichen
30 9 819/Q8U
dem Rechner zugeführt und zur weiteren Verarbeitung identifiziert. Man kann dem Eechner tausende von Beispielen jedes Zeichens zuführen, und aus den Abweichungstoleranzen bezüglich der Lage des Zeichens innerhalb der Zeichennachweiseinrichtung, aus den Abweichungen bei der Verarbeitung der Videosignale, d.h. den Quantelungsfehlern, sowie aus .den Abweichungen zwischen den Abdrucken der verschiedenen Beispiele jedes Zeichens wird eine erhebliche Menge von Bezugsdaten gesammelt, .die dazu dienen, eine Kodierung sowohl bezüglich der Reihen als auch der Spalten durchzuführen. In der Praxis hat es sich gezeigt, daß ein anfänglicher Lernprozeß dieser Art dazu führt, daß der Rechner die überwiegende Mehrzahl der vorkommenden Fälle einer bestimmten Schriftart und ihrer alphabetischen und numerischen Zeichen "lernt", so daß sich die Erkennung der meisten Einzelzeichen leicht durchführen läßt. Wenn sich Zweideutigkeiten infolge einer Vielfachkodierung ergeben oder ein Zeichen aus anderen Gründen nicht erkannt wird, kann der Operator den Rechner mit Bezugsdaten für solche Fälle versehen, oder er kann diesen Fällen angepaßte Trennprogramme aufstellen.
Das in Fig. 1, 3 und 4- dargestellte Zeichenerkennungssystem nach der Erfindung läßt sich in der verschiedensten Weise ausbilden. Bei einer Ausführungsform benutzt man einen Universaldigitalrechner als Zentraleinheit 22 und Speicher 24 in Verbindung mit einem Softwaresystem für die Steuerlogik zum Betreiben der Zentraleinheit; diese Steuerlogik wurde vorstehend anhand der Diagrammblöcke ^O bis 90 beschrieben. Diese Rechnerprogrammform einer Steuerlogik bietet den Vorteil, daß man ein System zur Verfügung hat, das sich im Laufe der Zeit abändern, verbessern und revidieren und Änderungen bezüglich der an das System gestellten Anforderungen anpassen läßt. Eine andere Ausführungsform der Erfindung basiert auf der Benutzung von •Steuerschaltungen für große Teile der verwendeten Steuerlogik. Ferner ist bei den mit Hilfe der Einrichtung 90 durchzuführenden Vorgängen, denen gemäß der vorstehenden Beschreibung im Rahmen der Erfindung eine erhebliche Bedeutung
3 0 9 8 ι 9 / 0 8 U
zukommt, ein so großer Aufwand an logischen Schaltungen erforderlich, daß auch in diesem Fall mit einer nach einem Eechnerprogramm arbeitenden Ausführungsform gearbeitet wird, denn eine Ausführungsform in Gestalt logischer Schaltungen würde beim gegenwärtigen Stand der Technik übermäßig kompliziert und teuer. Für jeden Fachmann ist aus der vorstehenden Beschreibung der Arbeitsschritte 50 bis 88 ohne weiteres ersichtlich, auf welche Weise jeder Teil der Anlage als durch ein Rechnerprogramm gesteuerte Einrichtung oder als logische Schaltung ausgebildet werden kann. Ferner können verschiedene technische Überlegungen dazu führen, daß man sich entschließt, bestimmte Funktionen der Steuerlogik durch feste Schaltungen oder sogenannte "Hardware" durchführen zu lassen, während andere Arbeitsschritte mit Hilfe von Rechnerprogramnien bzw. sogenannter Software durchgeführt werden. Ein Beispiel hierfür besteht in dem Arbeitsschritt 90 nach Fig. 4, der sich zweckmäßiger unter Einsatz von Software durchführen läßt; dies gilt insbesondere dann, wenn die Programme für einzelne Anwendungen und verschiedene Schriftarten und Druckgütegrade aufgestellt werden. Einige der logischen Steuervorgänge zum Festlegen von Kodes werden gemäß der Beschreibung durch logische Schaltungen durchgeführt, um eine höhere Arbeitsgeschwindigkeit zu erzielen; andere Teile des Arbeitsvorgangs, bei denen zahlreiche komplizierte Entscheidungen getroffen werden müssen, werden durch den Einsatz von Software durchgeführt, um die Anlage anpassungsfähiger und vielseitiger verwendbar zu machen. Wenn es sich um einfache Kodierungsaufgaben handelt, die sich wiederholen und sehr häufig durchgeführt werden müssen, z.B. um das Kodieren von Segmenten in Keinen und Spalten, ist es naheliegend, daß man den Einsatz von logischer Hardware vorzieht; dies hat seinen Grund insbesondere darin, daß man einen großen Teil der Schaltung sowohl bei den Reihen als auch bei den Spalten benutzen kann.
Wie für jeden Fachmann ersichtlich, kann das beschriebene Kodierungssystem nach der Erfindung mehrere verschiedene Formen annehmen. Wie bereits angedeutet, kann sich
3 0 f.i 8 1 9 / 0 8 U
ferner die Spaltenkodierung von der Reihenkodierung unterscheiden. Die Reihen- und Spaltenkodierungen können gemäß der Beschreibung im wesentlichen voneinander unabhängig sein, oder sie können in Verbindung miteinander benutzt werden, so daß die Kodes der Spaltenkodierung auf einer logischen TJnd-Basis mit den Kodes der Reihen kombiniert werden, wenn die Reihenkodierung nicht zur Erkennung eines Zeichens führt. Eine solche kombinierte Spalten- und Reihenkodierung kann sich unter bestimmten Umständen als vorteilhaft erweisen. Ferner kann der Arbeitsschritt 60 zum Ermitteln des logischen Schnittpunktes der Bezeichnungswörter durchgeführt werden, nachdem eine bestimmte Mindestzahl von Kodes, die kleiner ist als die Gesamtzahl, aufgestellt worden ist und die zugehörigen Beschreibungswörter festgelegt worden sind. Hierauf wird die Prüfung gemäß dem Diagrammblock 62 durchgeführt, um festzustellen, ob die resultierende Kodekombination eindeutig ist. Besteht keine Eindeutigkeit, wird der nächste Reihenkode festgelegt, seine Bezeichnung wird ermittelt, und die Bezeichnung wird, mit dem vorangehenden Schnittpunkt auf der gleichen logischen TJnd-Basis kombiniert* Dieses Ergebnis wird erneut auf seine Eindeutigkeit geprüft, und die Verarbeitung wird wiederholt, bis ein eindeutiger Kode angetroffen wird, oder es werden sämtliche Kodes verarbeitet, so daß man als Ergebnis einen Vielfachkode erhält. Für jeden Fachmann ergeben sich aus der vorstehenden Beschreibung weitere Abwandlungs- und Abänderungsmöglichkeiten.
ViTIe aus der vorstehenden Beschreibung ersichtlich, ist durch die Erfindung ein verbessertes Zeichenerkennungssystem geschaffen worden, das auf einer analytischen und systematischen maschinellen Verarbeitung beruht. Das Maschinensystem ist anpassungsfähig, so daß verschiedene Schriftarten und Alphabete "gelernt" werden können, worauf es ermöglicht wird, eine Sammlung von Bezugsdaten zusammenzustellen, mit denen unbekannte Zeichen verglichen werden. Somit läßt sich das System bei den verschiedensten Schriftarten und Alphabeten anwenden.
30 9 8 1 9 / 0 8 U
2253Ί93
Alle in den Unterlagen enthaltenen Angaben und Merkmale werden, soweit sie einzeln oder in Kombination gegenüber dem Stand der Technik neu sind, als erfindungswesentlich beansprucht.
Ansprüche t
3098 1 9/08U

Claims (6)

  1. ANSPRÜCHE
    Zeichenerkennungssystem, dadurch gekennzeichnet, daß eine Einrichtung (18) vorhanden ist, die dazu dient, digitale Informationssignale zu erzeugen, die einer zweidimensional en Anordnung (4-2) von Elementen entsprechen, welche ein Zeichen eines Satzes von Zeichen bilden, das erkannt werden soll, daß die Größe der Elemente annähernd der Dicke der dünnsten Linie der Zeichen entspricht, daß Einrichtungen vorhanden sind, die dazu dienen, Kodes festzulegen, die die geometrische Porm von Reihen der. Zeichenelemente repräsentieren, daß ein Speicher (24-) vorhanden ist, daß Steuereinrichtungen vorhanden sind, die nach einem Lernverfahren betreibbar sind, um in dem Speicher Informationssignale entsprechend den geometrischen Kodes und den repräsentativen Zeichen zu speichern, und daß zu den Steuereinrichtungen Vorrichtungen gehören, die nach einem Verarbeitungsverfahren betreibbar sind9 um dem Speicher die Informationssignale entsprechend den geometrischen Kodes zu entnehmen und so die repräsentativen Zeichen zu identifi- ■ zieren, die den für Musterzeichen festgelegten entsprechenden geometrischen Kodes zugeordnet
  2. 2. Zeichenerkennungssystem nach Anspruch 1, dadurch gekennzeichnet , daß zu den Einrichtungen zum Festlegen der Kodes eine Vorrichtung (68) gehört, die dazu dient, Kodes festzulegen, die die geometrische Form von Spalten der Zeichenelemente repräsentieren, und daß zu den Steuereinrichtungen eine Vorrichtung gehört, die entsprechend den Reihen- und Spalten-Geometriekodes sowohl nach einem Lernverfahren als auch nach einem Verarbeitungsverfahren betreibbar ist.
  3. 3. System zum maschinellen Erkennen zweidimensionaler Zeichen, gekennzeichnet durch eine Einrichtung zum
    3098 19/08U
    QWOfNAl INSPECTED
    2253Ί93
    Erzeugen digitaler Informationssignale, die einer zweidimensionalen Anordnung von Elementen mit einer annähernd einzelnen Auflösungsgröße entsprechen, welche ein zu erkennendes Musterzeichen bilden, eine Einrichtung zum Festlegen von Kodes entsprechend verschiedenen Arten von Reihen- und Spaltensegmenten der Zeichenelemente sowie entsprechend querliegenden Folgen ähnlicher Segmente, sowie durch eine Einrichtung, die die Kodes mit Kodes bekannter Bezugszeichen vergleicht, um ein Musterzeichen zu identifizieren.
  4. 4. System nach Anspruch J, dadurch gekennzeichnet, daß die Striche der Zeichen eine dicke Form haben, die annähernd einer Mehrzahl der Zeichenelemente entspricht.
  5. 5. System nach Anspruch 3, dadurch gekennzeichnet, daß zu der Einrichtung zum Festlegen von Kodes eine Vorrichtung gehört, die dazu dient, Kodes für die Dauer bzw. Länge der Segmentfolgen und die Lage bestimmter querliegender Folgen innerhalb der Anordnung festzulegen.
  6. 6. Verfahren zum Betreiben eines Systems zur maschinellen Erkennung zweidimensionaler Zeichen, dadurch gekennzeichnet, daß digitale Informationssignale erzeugt werden, die einer zweidimensionalen Anordnung von Elementen von annähernd einfacher Auflösungsgröße entsprechen, welche ein zu erkennendes Musterzeichen bildei, daß Kodes entsprechend verschiedenen Arten von Reihensegmenten der Zeichenelemente sowie entsprechend querliegenden Folgen ähnlicher Segmente festgelegt werden, und daß diese Kodes mit Kodes bekannter Bezugszeichen verglichen werden, um das betreffende Zeichen zu identifizieren.
    309819/0BU
DE2253193A 1971-11-01 1972-10-30 Verfahren und system zum erkennen von zeichen Pending DE2253193A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US19441471A 1971-11-01 1971-11-01

Publications (1)

Publication Number Publication Date
DE2253193A1 true DE2253193A1 (de) 1973-05-10

Family

ID=22717516

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2253193A Pending DE2253193A1 (de) 1971-11-01 1972-10-30 Verfahren und system zum erkennen von zeichen

Country Status (3)

Country Link
JP (1) JPS4853637A (de)
DE (1) DE2253193A1 (de)
FR (1) FR2159919A5 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2301051A1 (fr) * 1975-02-14 1976-09-10 Anvar Procede et dispositifs de reconnaissance de formes

Also Published As

Publication number Publication date
JPS4853637A (de) 1973-07-27
FR2159919A5 (de) 1973-06-22

Similar Documents

Publication Publication Date Title
DE3716787C2 (de)
DE68915950T2 (de) Verfahren zum Trennen von Zeichen.
DE3633743C2 (de)
DE69123083T2 (de) Dokumentverarbeitung
DE3440377C2 (de)
DE2909153C2 (de) Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern
DE3926327C2 (de) Verfahren und System zum Erkennen von Zeichen auf einem Medium
EP0096079B1 (de) Verfahren zur Aufbereitung von Punktrasterdaten für Zeichen- und/oder Bilddarstellungen
DE3879254T2 (de) Unterscheidungsvorrichtung für handgeschriebene und maschinengedruckte Buchstaben.
DE2431451C3 (de) Verfahren zur Normierung der Strichstärke von abgetasteten Schriftzeichen sowie Einrichtung zur Durchführung des Verfahrens
DE69830383T2 (de) Kodierverfahren
DE2432129C3 (de) Verfahren zum maschinellen Lesen von Zeichen und Vorrichtung zur Durchführung des Verfahrens
DE4427992C2 (de) Verfahren zum Erzeugen einer Dokumenten-Darstellung aus einem Bitmap-Bild eines Dokuments
DE2640814A1 (de) Schaltung zur erzeugung eines zeichens durch in einem matrixmuster vorliegende bildelemente
DE68924606T2 (de) Dokumentenbildverarbeitungsgerät.
DE2657631A1 (de) Verfahren zur codierten darstellung einer information, insbesondere von chinesischen zeichen
DE2234109B2 (de) Leseapparat
DE3241673C2 (de) Verfahren zum Verdichten von Daten Zwei-wertiger Bilddarstellungen
DE2515245A1 (de) Musteranalysiersystem
DE112021000371T5 (de) Digitale bildbearbeitung
DE2003849C3 (de) Verfahren zum Speichern von elektronischen Typensätzen in einem Lichtsetzgerät
EP0107083B1 (de) Belegverarbeitungseinrichtung mit Korrekturschaltung und Datensichtgerät
DE68925312T2 (de) Verfahren zur Pixelfarbenwahrscheinlichkeitsbestimmung zur Verwendung in OCR-Logik
DE2928378C2 (de) Verfahren und Einrichtung zur elektronischen Erzeugung einer gerasterten Halbtonaufzeichnung eines Originalbildes
DE2118791A1 (de) Verfahren und Anordnung zur Erkennung von Zeichen, insbesondere von alphanumerischen Zeichen