DE2538796A1 - Verfahren und erkennungssystem fuer zeichen im schriftverband - Google Patents

Verfahren und erkennungssystem fuer zeichen im schriftverband

Info

Publication number
DE2538796A1
DE2538796A1 DE19752538796 DE2538796A DE2538796A1 DE 2538796 A1 DE2538796 A1 DE 2538796A1 DE 19752538796 DE19752538796 DE 19752538796 DE 2538796 A DE2538796 A DE 2538796A DE 2538796 A1 DE2538796 A1 DE 2538796A1
Authority
DE
Germany
Prior art keywords
line
elements
recognition
register
vertical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE19752538796
Other languages
English (en)
Inventor
Juergen Fraikin
Wilfried Goerner
Lothar Hartmann
Joachim Machold
Rolf Uhlig
Manfred Zweynert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robotron VEB
Original Assignee
Robotron VEB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robotron VEB filed Critical Robotron VEB
Publication of DE2538796A1 publication Critical patent/DE2538796A1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

  • Verfahren und Erkennungssystem für Zeichen im Schriftverband Die Erfindung betrifft ein Verfahren und ein Erkennungssystem für Schriftzeichen mehrerer Schriftarten, die infolge von Berührungen mit den @achbarzeichen nicht in jedem Falle voneinander separierbar und damit zentrierbar sind.
  • Um auf der Grundlage herkömmlicher Erkennungsverfahren relativ billiger Lesegeräte liefern zu können, wurden die sogenannten OCR-Schriften eingeführt. Diese besitzen neben dez: relativ guten visuellen LEsbarkeit folgende Eigenschaften, die die maschinelle Erkennung wesentlich vereinfachen: - Die Zeichen sind grundsätzlich einfach strukturiert.
  • - An eine der ähnlichen Klassen werden Merkmale vor£esehen, die eine sichere Unterscheidung ermöglichen.
  • - Die Zeichen sind so schmal, daß unter keinen Umständen Berührungen mit den Nachbarzeichen auftreten können.
  • Unabhängig von diesen Standardisierungsbestrebungen wurde laufend nach leistungsfähigeren Erkennungsverfahren gesucht. Neben den zahlreichen Maskenverfahren, auf die hier nicht weiter eingegangen werden muß, entstanden dabie vor allem Formelemente-Verfahren (FEV). Das theoretisch Modell für eine Einrichtung nach einem i'EV ist ein Mehrschichtsystem, mit dem ein Klassifikator mit beliebigen Nichtlinearitäten realisiert werden kann.
  • Diese Nichtlinearitäten sind Voraussetzung zur Lösung schwieriger Erkennungsaufgaben. Die Extraktion von 3-Formelementen in einer ersten Systemstufe und ihre Kombination zu Klassenprototypen in einer zweiten Systemstufe ( dem eigentlichen Klassifikator, wenn die Formelemente als Merkmale betrachtet werden) sichert aus folgenden Gründen ein besonders günstiges Verhältnis von techischem Aufwand zu Leistung: - Ein Formelement entspricht einem Zeichenteil, das auch der Mensch, der sich die Schriftzeichen geschaffen hat, als unterschiedliches Merkmal benutzt.
  • - Es ist möglich, die Formelemente als Grundbausteine verschiedener Klassen und verschiedener Schriftarten in unterschiedlichen Positionen im Zeichen zu benutzen, do h. es ist möglich, mit einem relativ kleinen Satz von Formelementen ein großes Spektrum von Erkennungsaufgaben zu lösen.
  • - Die flächenmäßige Begrenzung der Foimelemente verschafft die Möglichkeit, Zeichenteile, die zur Unterscheidung von Klassen besonders wichtig sind, unabhängig von den anderen Teilen zu beschreiben. Normalerweise wird von einer binär quantisierten Rasterdarstellung der Zeichen ausgegangen, d. h. die lokale Begrenzung der Formelemente impliziert hier eine Verrinnerung der Zahl der Eingangsvariablen für die Merkmaldetektoren, was wiederum die Möglichkeit verschafft, extrem leistungsfähige Detektoren zu konstruieren.
  • - Das Mehrschriftproblem kann mit geringem Aufwand gelöst werden, wenn sich die Zeichen einer Klasse in den verschiedenen Schriftarten nicht inihrer Gesamtheit, sondern nur in Teilen unterscheiden.
  • Derartige Verfahren lassen sich mittels ausgefeilter Konstruktionsalgorithmen zu hohen Leistungen hochzüchten, so daß die ersten beiden erwähnten Vorteile von OCR-Schriften an Bedeutung verlieren. Dagegen sind die meisten Verfahren immer noch auf eine deutlich meßbare Bücke zwischen benachbarten Zeichen angewiesen. Es existieren jedoch auch Verfahren, die sich berührende Zeichen verarbeiten können Diese arbeiten im eigentlichen Erkennungsschritt wie die erwähnten, doh. sie benutzen zentrierte Zeichen. Die Abtrennung der Zeichen aus dem Schriftverband geschieht durch besonderte Detektoren, die den Formelemente-Detektoren stark ähneln und der Erkennungseinrichtung vorgeschaltet sind. Nach ihrer Entscheidung werden die Zeichengrenzen definiert, das Zeichen wird dementsprechend aus dem Schriftverband abgetrennt und als Einzelzeichen der Erkennungseinrichtung zugeführt. Es ist nun eine Tatsache, daß schlecht zentrierte Zeichen mit Verfahren, die auf eine Zentrierung angewiesen sind, unzureichend erkannt werden. Die Genauigkeit der Zentrierung hängt jedoch von der zuverlässigen Arbeitsweise der Segmentierungsdetektoren ab. Während bei der Erkennung des zentrierten Zeichens das Vorhandensein von neist mehr als fUnf Formelementen gefordert wird, verläßt man sich bei einer derartigen Segmentierung auf ein oder zwei Detektoren. Die Folge dieser Vorgehensweise ist, daß die Erkennungssicherheit bei sich beruhrenden Zeichen nicht die extrem hohen Werte erreicht, die an getrennten Einzelzeichen erreichbar sind.
  • Zweck der Erfindung ist es, ein Verfahren und ein Erkennungssystem zu schaffen, die auch an miteinander verbundenen Zeichen die Fehler- und Rückweisungsraten erreichen, die sonst nur bei getrennten Einzelzeichen erreicht werden, die für Mehrschrifterkennung mit und ohne Umschaltung der Schriftart geeignet sind und die unempfindlich gegenüber Störungen, z. B. Schwa'rzungsänderungen, Unterbrechungen der Linien, Höhenversatz der Zeichen, gewisse Verdrehungen der Zeichen, Blecken auf dem Papier usw. sind.
  • Der Erfindung liegt die Aufgabe zugrunde, ein aufwandsoptimales Verfahren und ein lilehrschriSt Brkelmungssystem auf der Grundlage des Formelemente-Gedankens zu entwickeln, das den Schriftverband einer Zeile ohne störungsanfällige vorherige Segmentierung klassifiziert und das dabei Unterscheidungsfunktionen und Nummern der ähnlichsten Klasse in jeder möglichen Position der Erkennungsschablone über der Zeile abgibt, so daß daraus durch eine nachfolgende, dem Stand der Technik entsprechende Segmentierun.gseinrichtung die richtige Zeichenfolge in der Zeile mit großer Sicherheit ermittelt werden kann.
  • Erfindungsgemäß wird die Aufgabe durch ein Verfahren gelöst, bei dem eine den Zeichenabmessungen entsprechende Erkennungsschablone, in der die entsprechenden Formelemente-Detektoren justiert sind, in kleinen diskreten Schritten über den Schriftverband einer Zeile geführt wird. Die Informationsübernahme aus der Schriftzeile erfolgt durch eine spaltenweise gerasterte optisch-elektronische Abtastung, wobei die Grauwert binär quantisiert werden. Die vertikale Grobposition der Schablone über der Zeile wird festgelegt durch vorherige Anwendung eines Standardverfahrens zur Bestimmung der Grundlinie der Schriftzeile0 Da diese Messung einen vertikalen Versatz von Einzel zeichen nicht berücksichtigen kann, ist zusätzlich eine vertikale Verschiebung der Erkennungsschablone einschließlich der darin justierten Sounelemerte erforderlich, wobei der Segmentierungseinrichtung nur das Maximum der Unterscheidungsfunktionen, das in mindestens zwei Vertikalverschiebungen innerhalb einer festen Horizontalposition erreicht wurde, zugeführt wird. Um mit dem Verfahren eine hohe Leistung bei mehreren Schriftarten und den eingangs erwähnten Störungen zu erreichen, muß das Erkennungssystem hochgradig nichtlinear sein. Diese Nichtlinearität wird hier problembezogen durch Verwendung von Formelementen als Merkmale erreicht, deren Extraktionsstufe die vorletzte Stufe im Mehrstufensystem darstellte Erfindungsgemäß kann ein und derselben Formelemente-Typ bei der Zerlegung der Schriftzeichen in unterschiedlichen Positionen benutzt werden. Es zeigt sich, daß zum Erzielt der notwendigen Leistungen die Formelemente-Detektoren eine relativ komplizierte logisch-arithsetische Funktion innerhalb eines Gebietes von etwa 100 bis 200 Rasterpunkten realisieren müssen. Der dazu notwendige Aufwand verbietet es, solch komplizierte Detektoren in allen benötigten Portionen vorzusehen. Das erfundene Verfahren des vollständigen Durchlaufs der Eingangsinformation und der daraus transformierten Information verbunden mit der Klassifikation in mehreren Positionen verlangt jedoch, daß dem Klassifikator Merkmale angeboten werden, die außer dem richtigen Typ auch die richtige Position in der Erkennungsschablone besitzen. Die extrahierten Merkmale müssen also, wenn sie nicht in jeder Schablonenposition neu extrahiert werden sollen, ebenso wie die Primärmerkmale in Schieberegistern unter der Erkennungsschablone hinweg geschoben werden. Die Extraktion aller Formelemente in einer einzigen Bezugssposition bzw. in einigen wenigen Positionen und ihre Speicherung bis zu dem Zeitpunkt (auf Grund der kontinuierlich durchlaufenden Information werden räumliche Beziehungen zwischen Formelementen in zeitliche transformiert) an dem sie benötigt werden, bietet nun weiterhin den aufwandsreduzierenden Vorteil, daß die Formelemente in gewisse Grundbausteine, die sogenannten Linienelemente zerlegt werden können. Diese Linienelemente müssen nur einmal extrahiert werden und können dairn in mehreren Formelemente-Detektoren verwendet werden, d.h. der technische Aufwand reduziert sich wesentlicht Als Linienelemente existieren schwarze und weiße Linienstücke verschiedener Länge und Grundri chtung, die bei linienförmigen Objekten universell verwendbar sind.
  • Bei dieser Vorgehensweise sinkt der technische Aufwand für die Bormelemente-DeteXtoren insgesamt wesentlich unter den für die zugehörigen Formelemente-Speicher, obwohl diese aus folgendem Grunde wesentlich verkürzt werden könnens Im Interesse der erstrebten Varianz des Verfahrens ist es nicht sinnvoll, die Bezugspunkte der Formelemente innerhalb der Erkennungsschablone auf einem Rasterpunkt genau zu fixieren. Es werden deshalb Punktgruppen von zwei Punkten Breite und fünf Punkten Höhe zu einer Formelemente-Position disjunktiv zusammengefaßt, wobei auch die Nachbarpunkte der Punktgruppe berücksichtigt werden. Auf diese Weise werden die Pormelemente-Speicher um den Faktor 10 verkürzt. Die Folge davon ist, daß natürlich die Erkennungsschablone auch nicht mehr im Einerschritt über den Schriftverband geschoben werden muß, sondern daß horizontal eine Schrittweite von zwei und vertikal eine Schrittweite von fünf Punkten notwendig ist.
  • Weiterhin ist es unrentabel, alle Formelemente, auch die die in der linken oberen Ecke des Zeichens benötigt werden, sofort beim Belaufen der Information in der rechten unteren Ecke der Erkennungsschablone zu messen. Es erweist sich als optimale Lösung, erst in der Position aller benotigten zu messen, die am weitesten rechts liegt, und es nur für den Fall zu speichern, daß es weiter links von dieser noch einmal benötigt wird. In vertikaler Richtung wird ebenfalls kein vollständiges Speicherregister benötigt. Der zur Verfügung stehende Takt der Zeilengrundlinien erlaubt es, die entsprechenden Formelemente-Detektoren nur in den in Frage kommenden Relativpositionen durchzusteuern und entsprechend die Information in den Formelemente-Speichern nur zu diesen Zeitpunkten weiterzuschieben. Die vertikale Ausdehnung der Speicherregister muß also nur so groß sein wie die Summe aus zulässigem Vertikal versatz von Zeichen in der Zeile und Ungenauigkeit der GrundlinienmessungO Das Netzwerk zur Extraktion der Formelemente ist somit über die ganze Breite des unteren Teils der Erkennungsschablone ausgedehnt, was bedeutet, daß ein gleicher Linienelement-Typ in relativ vielen Positionen benötigt wird. (Bedingung für diese AnordnunG ist, daß die Information von unten nach oben und von rechts nach links unten der Erkennungsschablone hinwegläuft.) Zur optimalen technischen Lösung dieses Problems wird deshalb eine Kombination von mehreren Linienelemente-Detektoren in verschiedenen Positionen und andererseits von Lini enel ement e-Sp eichern, wenn diese Positionen dicht beieinanderliegen, benutzt.
  • Die dritte Systemstufe realisiert einen linearen Klassifikator mit der Besonderheit, daß nicht jeder Klassenschaltung der gleiche Merkmalvektor zugeführt wird, sondern daß jede Klasse einen klassentypischen Merkmalvektor besitzt. Bei der simultanen Klassifikation mehrerer Schriftarten besteht die liöglichkeit, für jede Schriftart jeder Klasse eine gesonderte Klassenschaltung vorzusehen, wenn nur wenige Formelemente unterschiedlich sind, können aber auch nur diese vor der gemeinsamen Schaltung desjunktiv verknüpft werden. Wenn die Möglichkeit besteht, die zu lesende Schriftart vorher zu bestimmen, kann die Erkennungssicherheit des Systems erhöht werden indem nicht in Trage kommende Klassenschaltungen abgeschaltet werden.
  • Die Werte der Unterscheidungsfunktionen werden einer Extremwertschaltung zugeführt, die das Maximum und die zugehörige Klasse über alle Klassen und alle Vertikalverschiebungen bestimmt und diese Werte an die nachgeschaltete Segmentierunrseinrichtung übergibt.
  • Das erfundene Verfahren und das Erkennungssystem besitzen gegenüber herkömmlichen Formel ement e-Verfahren und deren Einrichtungen den Vorteil, daß es in Zusammenschaltung mit einer dem technischen Stand entsprechenden Segmenti erungs einrichtung unzentrierte Zeichen mit hoher Erkennungssicherheit verarbeiten kann. Die Segmentierung muß nicht vor der Erkennung durch störanfällige Bückendetektoren geschehen, sondern sie kann nach der Erkennung auf der Grundlage der ermittelten Erkennungswerte in jeder Horizontalverschiebung erfolgen. Mit dem aufwandsoptimalem Erkennungssystem können also in Verbindung mit einer geeigneten Segmentierungseinrichtung sich berührende Zeichen mit der gleichen Sicherheit klassifiziert werden wie getrennte Binzelzeichen.
  • Die Erfindung soll nachstehend an einem Ausführungsbeispiel näher erläutert werden. In den zugehörigen Zeichnungen zeigen: Fig. 1: Einrichtung zur Erkennung von Schriftzeichen gemäß der Erfindung Fig. 2: Formelement "linke obere Ecke" Fig. 3: Lagebezeichnungen der Formelemente, die einen Repräsentanten der Klasse nun bilden Fig. 4: Zusammenschaltung von Linienelement-Detektor; Linienelement-Speicher; Formelement-Detektor Fig. 5: Zeichenfeld und reduziertes Zeichenfeld Fig. 6: Schaltung zur Horizontal- und Vertikaltransformation der Formelemente Fig. 7: Modifikation der horizontalen Reduktionstufe Wie aus BaigO 1 zu erkennen ist, weist das ein Eigangsschieberegister 10 einen gestrichelt gezeichneten Schieberegisterausschnitt 11 auf. Die gesamte binär quantisierte Helligkeitsinformation des Repräsentanten läuft kontinuierlich unter dem Schieberegisterausschnitt 11 durch.
  • Jedem Rasterpunkt RP des Zeichenfeldes wird der Helligkeitswert xji#{0,1} mit i = 1,2, ..., N und j = zugeordnet, je nachdem ob das Zeichen an dieser Stelle weiß (Helligkeitswert "0") oder schwarz (Helligkeitswert t'1") ist.
  • Die aus den Helligkeitswerten des angebotenen binär quantisierten Zeichens abgeleiteten binären elektrischen Signale werden seriell einem mit der Takt folge T1 getriggerten Eingangschieberegister 10 zugeführt, des die technische Nachbildung des Zeichenfeldes darstellt. Jedem Rasterpunkt RP des Zeichenfeldes entspricht eine gleichliegende Speicherstelle des Eingangsschieberegisters 10.
  • An den Schieberegisterausschnitt 11 sind logische Netzwerke zur Extraktion der Menge der Linienelemente LE, sog. lIinienelement-Detektoren 21 bis 25 angeschaltet.
  • Aus Teilmengen der Linienelemente-Menge werden Formelemenete FE gebildet. Die Linienelemente LE, die ein Formelement FE bilden, stehen in einer festen Lagebeziehung zueinander.
  • In Fig. 2 wird als Beispiel das Formelement PE "linke obere Ecke" dargestellt. Es setzt sich aus dem waagerechten LEb und den sekrechten LEa, LEc; schwarzen LEa, LEb und weiBen LEc Linienelementen LE zusammen, deren Bezugspunkte BP, wie aus Fig. 2 ersichtlich, die Lage dieser Linienelemente BE im Formelement FE fixieren.
  • Innerhalb eines Zeichens wird ein Linienelement LE i.a.
  • an verschiedenen Positionen, verschiedene Linienelemente LE; werden innerhalb eines Zeichens i. a. in unterschiedlich vielen Positionen gemessen.
  • Je nach Kompliziertheit der Erkennungsaufgabe werden 20 bis 35 verschiedene Linienelemente LE definiert. Jedes Linienelement ISE wird innerhalb eines Zeichens in allen Spalten, in denen es gemessen wird, gebildet.
  • Wird z. B. ein Linienelement LE innerhalb eines Zeichens in fünf Spalten gemessen, dann wird für jede der fünf Spalten ein Linienelement-Detektor 21 zur Extraktion dieses Linienelementes LE vorgesehen.
  • Tritt ein Linienelement BE innerhalb einer Rasterspalte in mehr als einer Position auf, dann wird es in der von der Unterkante des Zeichenfeldes ZF ausgerechneten untersten benötigten Positionen der Spalte gebildet und für die übrigen benötigten Vertikalpositionen dieser Spalte in einem Linienelement-Speicher 31 bis 35 gespeichert.
  • Mit der untersten Spaltenposition, in der ein Linienelement LE innerhalb einer Spalte über der Menge der Formelmente FE gemessen wird, liegt somit der Speicherbereich des Schieberregisterausschnittes 11 fest, an den der dem Linienelement LE entsprechende Linienelement-Detektor 21 bis 25 anzuschaiten ist. Wie aus Fig. 1 ersichtlich, ist jedem Linienelement-Detektor 21 bis 25 ein Linienelement-Speicher 31 bis 35 nachgeschaltet, dessen Taktfolgefrequenz wie beim Eingangsschieberegister 10 f1 = 1 beträgt.
  • T1 In Fig. 3 wird das Formelement FEx aus den zwei Linienelementen LEa und LEb zusammengesetzt. Die Linienelemente LEa und LEb werden in den Positionen P1LEa und P1LEb gebildet, d. h. ihre Linienelement-Detektoren 21; 23 sind an die entsprechenden Speicherbereiche des Schieberegisterausschnittes 11 anzuschalten.
  • Werden die Linienelemente LE a bzw, LEb in weiteren Vertikalpositionen der gleichen Horizontalposition benötigt, dann erfolgt ihre Speicherung in den Linienelement-Speichern 31. bzw. 33.
  • Die Bildung der Formelemente FE erfolgt in kombinatorischen binären Netzwerken, den Formelement-Detektoren, die in Fig. 1 mit 41 bis 45 gekennzeichnet sind. Die Singangssignale eines Formelement-Detektors 41 bis 45 werden aus den zugeordneten Linienelement-Detektoren 21 bis 25 bzw. den diesen nachgeschalteten Linienelement-Speichern 31 bis 35 abgefragt, Für das in Fig. 3 dargestellte Formelement FEx zeigt Fig. 4 die Zusammenschaltung von Linienelement-Detektor 21, Linienelement-Speicher 31 und Linienelement-Detektor 23, Linienelement-Speicher 33 mit dem Formelement-Detektor 41, in dem die Verknüpfung der Linienelemente LEa und LEb zum Formelement FEX erfolgt.
  • Das Formelement SEx kann also erstmalig gebildet werden, wenn das Linienelement LEa in der Position P1LEa und das Linienelement LEb in der Position P1LEb zur Verfügung stehen. Die diesen Positionen zugeordneten und mit dem Formelement-Detektor 41 verschalteten Speicherstellen sind in Fig. 4 mit P1 gekennzeichnet. Dabei wird angenommen, daß das Formelement FEx in keiner weiter rechts liegenden Horizontalposition benötigt wird.
  • Auf die Menge der zu erkennenden Zeichen wird eine bestimmte Menge von Formelementen FE definiert. Weiterhin wird jede Zeichenklasse nur durch eine echte Teilmenge von gleichen und/oder verschiedenen Formelementen FE in verschiedenen Positionen beschrieben. Diese Beschreibung wird als Prototyp bezeichnet. Ein Formelement FE kann in mehreren Prototypen auftreten.
  • Innerhalb eines Prototyps stehen die Pormelemente BE in einer festen Lagebeziehung zueinander.
  • Wie oben erwähnt, wird jedes Pormelement FE in der am weitesten rechts liegenden Horizontalposition seines Auftretens, bezogen auf die Menge alle Zeichen, extrahiert. In Fig. 3 wird das Formelement PBx in der Position P1 FEx gemessen. Tatsächlich wird das Formelement FEx innerhalb des Zeichens "H" in den Positionen P2 PBx benötigt. Dabei wird das Formelement FEx in der Position P1 FEx gebildet und in einem Speicherregister 512 (Taktfolge T1, s. Fig. 6) gespeichert. Mit Hilfe dieses Speicherregisters 512 erfolgt die Vertikalverschiebung des Formelementes FEx in die Position P2 FEx (und evtl.
  • weiterer Vertikalpositionen dieser Horizontalposition).
  • Eine weitere horizontale Verschiebung innerhalb des Speicherregisters 512 transformiert das Pormelement RZx von der Position P2 FEx in die Position P3 FEx.
  • Die Abfrage der PE-Information aus dem Speicherregister 512 muß wieder so erfolgen, daß bei der Zusammensetzung der Zeichen aus den extrahierten Pormelementen FE die richtige Lagebeziehung der Formelemente FE innerhalb des Zeichens erhalten bleibt.
  • Für das Verfahren gemäß der Erfindung ist es nicht notwendig, die Lage der Formelemente FE auf den Rasterpunkt genau zu positionieren. Vielmehr genügt es, die Positionen in horizontaler Richtung auf 2 Rasterpunkte und in vertikaler Richtung auf 5 Rasterpunkte genau anzugeben.
  • Daraus folgt, daß das Zeichenfeld ZF mit 50 Zeilen und 24 Spalten auf ein reduziertes Zeichenfeld ZFR mit 10 Zeilen und 12 Spalten abgebildet wird. Alle weiteren Betrachtungen zur Erfindung beziehen sich, soweit nichts anderes vereinbart wird, auf das reduzierte Zeichenfeld ZFR.
  • Fig. 5.1. zeigt einen Ausschnitt des ursprünglichen Zeichenfeldes ZF, Fig. 5.2. zeigt das reduzierte Zeichenfeld ZFR. Der stark umrandete Zeichenfeldbereich aus Fig. 5.1. wird gemäß obiger Darlegung auf den Rasterpunkt RPR in Fig. 5.2. abgebildet.
  • Fig. 6 zeigt die Schaltung, mit der u. a. die Zusammenfassung der Information der Rasterpunkte RP des Zeichenfeldes ZF in vertikaler und horizontaler Richtung zum Rasterpunkt RPR des reduzierten Zeichenfeldes ZFR erfolgt.
  • Dazu werden in eine eertikalen Reduktionsstufe 511, in der ein Speicherregister 512, eine ODER-Schaltung 513 und eine UND-Schaltung 514 hintereinander geschaltet sind, eine Taktleitung 71 mit dem Speicherregister 512 und eine Taktleitung 72 mit der UND-Schaltung 514 verbunden sind, zunächst die Informationen von fünf aufeinanderfolgenden Rasterpunkten in vertikaler Richtung einer Spalteeinschließlich die der beiden (wahlweise auch mehr) benachbarten Rasterpunkte Serien-parallel gewandelt und disjunktiv verknüpft. Mit dem Speicherflipflop 518 in der horizontalen Reduktionsstufe 515 erfolgt dann neben der Speicherung der PE-Information die Zusammenfassung der Spalteninformation in horizontaler Richtung.
  • Am Beispiel des in Fig. 3 dargestellten Repräsentanten des Zeichens H soll die Transformation des Formelementes FEx aus der Position P1FEx, in der das Pormelement FEx extrahiert wird, in die Position P2FEX, und P3FEx, in denen das Pormelement FEx zur Bildung der Klasse, der der Repräsentant II angehört, benötigt wird, erläutert werden.
  • Analoge Betrachtungen gelten für alle anderen Formelemente FEx in beliebigen Positionen.
  • Gemäß der Erfindung zeigt Fig. 6 in der Horizontalen Reduktionsstufe 515 ein Register 516, das als Umlaufregister arbeitet, und all das die Taktleitung 72 angeschlossen ist, synchron mit der Abtastung der Rasterpunkte RPRj,1 (j = 1,2..., 12 vlg. Fig. 5.2) läuft im Register 516 am Eingang 517 die Information "L" ein und wird mit dem Takt T2 = 5 . T1 durch das Register 516 geschoben. Dieses Register 516 kann als technische Nachbildung einer Rasterspalte des reduzierten Zeichenfeldes ZFR aufgefaßt werden, d.h. die Zahl seiner Speicherstellen entspricht der Anzahl der Rasterpunkte einer Spalte des Zeichenfeldes ZER. Das Register 516 wird genau an den Stellen angezapft, die die Vertikalpositionen Z8-präsentieren, in denen die Formelemente FE im Zeichen vorkommen.
  • Gemäß Fig. 3 wird das Formelement FEx in der Vertikalposition P2 FEx benötigt, also ist das Register 516 gemäß Fig. 6 in der 6. Registerstelle anzuzapfen. Kommt es zur Koinzidenz der Formelement-Information Ph mit der umlaufenden Information "L" im Register 516, so wird die Formelement-Information REg in den Speicherflipflop 518 übernommen, der der vertikalen Reduktionsstufe 511 und dem Register 516 nachgeschaltet ist.
  • Vom Speicherflipflop 518, der, wie oben bereits ausgeführt, die disjunktive Verknüpfung der Informationen zweier Spalten realisiert, wird die Formelement-Information FEx mit dem Takt T3 = 100 . T1 in das nachgeschaltete Speicherregister 519 übernommen. Dort kann sie an der mit P2 FEx bezeichneten Registerstelle für die Klassenbildung abgefragt werden.
  • Da wie aus Fig. 3 ersichtlich, das Formelement FEx auch noch in der Position P3 FEx benötigt wird, wobei die Positionen P2 FEx und P3 FEx in der gleichen Zeile liegen, erfolgt seine Speicherung im Speicherregister und wird an der mit P3 FEx bezeichneten Registerstellte für die Klassenbildung abgefragt.
  • Würde das Formelement FEx, gezählt über alle Klassen, in weiteren Vetikalpositionen gebraucht werden, müßten für das Formelement FE@ weitere Speicherflipflop 518 und Speicherregister 519 vorgesehen werden. Alle Speicherregister 519 liegen an einer Taktleitung 73 mit dem Takt 23 = 100 . T1 (vgl. Fig1), Bei der Erkennung realer Zeichen im Schriftverband kann es vorkommen, daß Zeichen gegeneinander in der Höhe versetzt sind. Das führt dazu, daß die Ist-Vertikalpositionen der Formelemente des versetzten Zeichens gegenüber den Soll-Positionen nach oben und unten verschoben sind.
  • Um dieses Vertikalversatz auszugleichen, werden nicht nur die Soll-Positionen der Formelemente abgefragt, sondern auch die jeweils nächsten beiden Nachbarpositionen.
  • Fig. 7 illustriert diesen Tatbestand an dem in Fig. 6 dargestellten Beispiel. Für das Formelement SEx sind jetzt fünf Speicherflipflop 518 und fünf Speicherregister 519 vorzusehen, deren jedes eine der fünf genannten Vertikalpositionen realisiert, wobei die Position der mittleren Zeile des Registers 516 der Sollposition zuzuordnen ist. Wie aus Fig. 7 ersichtlich, stehen die den fünf Vertikalpositionen zuzuordnenden Informationen parallel, d. h. gleichzeitig an den fünf Registerzeilen des Speicherregisters 519 zur Verfügung. Für die weitere Verarbeitung wandelt ein Parallel-Serien-Wandler 520 der den Speicherregistern 519 nachgeschaltet ist und mit einer Taktleitung 74 verbunden ist in Fig. 7 die fünf parallel bereitstehenden Formelement-Informationen FE in eine x serielle Informationsfolge mit der Pulsfolgefrequenz 4 = 1 = 1 = f1 um. Diese Informationsfolge wird T4 20T1 20 einer Klassifizierungsschaltung 6o zugeführt (s. Fig. 1).
  • In einer bekannten Klassifizierschaltung 60 (z.B analoge und digitale Klassifizierschaltung) werden aus den Formelementen FE Prototypen der Klassen gebildet. Jeder Prototyp bildet eine Kombination der Elemente der Formelementemenge, Die zu erkennenden realen Zeichen werden mit diesen Prototypen verglichen, Als Ergebnis dieses Vergleichs entsteht ein Erkennungswert E, dessen Größe ein Iiiaß für die Übereinstimmung zwischen Prototyp und realem Zeichen ist. Liegen alle Erkennungswerte unterhalb einer bestimmten Schwelle oder sind zwei oder mehr Erkennungswerte gleich, dann kann das angebotene Zeichen keiner Klasse eindeutig zugeordnet werden. Eine Rückweisungsschaltung 67 liefert dann ein Rückweisungssignal R.
  • Liefert die Klassifiziersohaltung 60 einen Erkennungswert, der aus der Menge aller Erkennungswerte (über alle Klassen) eindeutig als maximaler Erkennungswert Emax einer Extremwertschaltung 66 separiert werden konnte, dann erscheint an ihrem Ausgang neben diesen Erkennungswert Emax eine der Klasse zuzuordnende in einer A/D-Wandlerstufe erzeugte Binärkombination (Klassenwort).
  • Erkennungswort und Klassenwort werden einer nachfolgenden Segmentierungseinrichtung zugeführt.
  • Sämtliche in der Einrichtung gemäß der Erfindung benötigten Takte werden von einer Takteinheit 70 über die Taktleitungen 71, 72, 73, 74 (siehe Fig. 1) bereitgestellt.

Claims (10)

  1. Patentansprüche
    Verfahren zur erkennung von Zeichen im Schriftverbad, bei dem eine Extraktion von Formelementen (SG) in den ersten zwei Systemstufen und ihre Kombination zu Klassenprototypen in einer dritten Systemstufe durchgeführt wird, dadurch gekennzeichnet, daß ein Erkennungswert als Maximum über mindestens zwei Vertikalverschie bungen einer Erkennungsschablone in jeder Spaltenposition ermittelt wird, daß das Gesamtzeichen durch eine Linearkombination von Formelementen (FE) zusammengesetzt wird, deren relative Lage zueinander mit Toleranzen fixiert ist und die so extrahiert werden, daß ein kontinuierlicher Informationsfluß erzielt wird und daß pro Horizontalposition der Brkennungsschablone ein Erkennungswert mit zugehöriger Klasse an eine SegGlentierungseinrichtung abgegeben wird, die daraus eine sichere Erkennung ermöglicht.
  2. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Formelemente (PE) nur in einer Vertikalposition gemessen werden und mit Hilfe einer zeitlichen Taktung mit der Zeilengrundlinie als Bezugsakt seriell in Spetherregister (519) eingeschrieben werden, die der richtigen Vertikalpositionentsprechen und aus denen die Formelemente (FE) in jeder der nötigen Vertikalverschiebungen der Erkennungsschablone parallel ausgelesen werden können.
  3. 3. Verfahren nach Anspruch 1 und 2 dadurch gekennzeichnet, daß die Formelemente (?X) die jeweils in der Horizontalposition gemessen werden, in der sie bei irgendeiner Klasse am weitesten rechts benötigt werden und dann in dem Speicherregister (519) solange gespeichert bleiben, solange sie noch beim Durchlauf der Information von rechts nach links durch die Zrkennungsschablone benötigt werden.
  4. 4. Verfahren nach Anspruch 1 bis 3 dadurch gekenngeichnet, daß die Erkennungsschablone horizontal in einer Schrittweite von zwei und vertikal in einer Schrittweite von fünf Rasterpunkten über den Schriftverband einer Zeile geführt wird.
  5. 5. Verfahren nach Anspruch 1 bis 3 gekennzeichnet dadurch, daß die Linienelemente (IS) als Grundbausteine der Formelemente (yS) wie die Formelemente (FE) selbst im unteren Schablonenteil gemessen werden und daß dabei eine aufwands optimale Kombination zwischen dem Vorsehen von mehreren Linienelemente-Detektoren (21 bis 25) für einen Linienelemente-Typ in jeder Spalte, in der das Linienelement (LE) auftritt und dem Vorsehen entsprechender BE-Speicher (31 bis 35) für die übrigen Zeilenpositionen in einer Spalte, verwendet wird.
  6. 6. Verfahren nach Anspruch 1, 2, 3 und 5 gekennzeichnet dadurch, daß die Linienelemente (LE) als logische Funktionen der binären Informationen der Rasterpunkte gebildet werden und daß einzelne Terme dieser Funktion so bestimmt und in Form von Schichten eines Netzwerkes so realisiert werden, daß sie mehrfach verwendet werden können.
  7. 7. Verfahren nach Abspruch 1 gekennzeichnet dadurch-, daß in der linearen Elassifizierung.mschaltung (60) als letzte Systemstufe für jede Klasse ein gesonderter Merkmalvektor zugeführt wird, der bei simultaner erkennung mehrerer Schriftarten durch disjunktive Verknüpfung unterschiedlicher Merkmale gewonnen werden kann, wenn der Aufwand für eine spezielle Klassenschaltung zu groß ist und bei dem es möglich ist, wenn die Schriftart vor der Erkennung bestimmt werden kann, zur Erhöhung der Erkennungssicherheit nicht benötigte Klassen schaltungen anderer nicht in Frage kommender Schriftarten abzuschalten.
  8. 8. Erkennungssystem für Zeichen im Schriftverband, in dem einem Eingangsschieberegister (10), das einen Schieberegisterausschnitt (11) enthält, Linienelement-Detektoren (21 bis 25) und diesen Formelement-Detektoren (41 bis 45) nachgeschaltet sind, die mit einer Klassifizierungsschaltung (60) verbunden sind, dadurch gekennzeichnet, daß den Liniendetektoren (21 bis 25) Linienelemente-Speicher (31 bis 35) nachgeschaltet sind, deren Ausgänge mit dem Formelemente-Detektoren (41 bis 45) in der Weise verbunden sind, daß eine Anordnung von Linienelementen (LE) entsteht, die dem Schwarz-Weiß-Euster des Zeichens in dem Gebiet entspricht, auf welchem das Formelement CFE) angewandt werden soll, daß den Pormelement-Detektoren (41 bis 45) Formelemente-Speicher (51 bis 55) nachgeschaltet sind, denen die Klassifizierungsschaltung (60) und dieser eine Segmentierungseinrichtung nachgeordnet ist.
  9. 9. Erkennungssystem nach Anspruch 8, dadurch gekennzeichnet, daß die PE-Speicher Ausschnitte aus einem gegenüber dem Eingaberaster vergröberten Raster darstellen, wobei die Vergröberung z. B. um den Faktor 10 bei Zusammenfassung von 5 Punkten vertikal und 2 Punkten horizontal dadurch geschieht, daß die Outputs der PE-Detektoren für diese 10 Punkte und die umliegenden 18 Randpunkte disjunktiv verknüpft sind.
  10. 10. Erkennungssystem nach Anspruch 9, dadurch gekennzeichnet, daß jeder Formelement-Speicher (51 bis 55) eine vertikale Reduktionsstufe (515) enthält, in der ein Speicherregister (512), eine ODER-Schaltung (513) und eine UND-Schaltung (514) hintereinander geschaltet sind, daß die Taktleitung (71) mit dem Speicherregister (512) und die Taktleitung (72) mit der WffD-Schaltung (514) verbunden ist, daß weiterhin eine horizontale Reduktionsstufe (515) nachgeordnet ist, in der einem vertikalen Register (516) ein Speicherflipflop (518) nachgeschaltet ist, daß die vertikale Reduktionsstufe (511) außerdem mit dem Speicherflipflop (518) verbunden ist, dem ein Speicherregister (519) nachgeschaltet ist, daß die Taktleitung (72) mit dem Register (516) und die Taktleitung (73) mit de Speicherregister (519) verbunden ist.
DE19752538796 1974-11-14 1975-09-01 Verfahren und erkennungssystem fuer zeichen im schriftverband Pending DE2538796A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DD182352A DD117290A1 (de) 1974-11-14 1974-11-14

Publications (1)

Publication Number Publication Date
DE2538796A1 true DE2538796A1 (de) 1976-05-26

Family

ID=5498064

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19752538796 Pending DE2538796A1 (de) 1974-11-14 1975-09-01 Verfahren und erkennungssystem fuer zeichen im schriftverband

Country Status (4)

Country Link
BG (1) BG29544A1 (de)
DD (1) DD117290A1 (de)
DE (1) DE2538796A1 (de)
SU (1) SU605222A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2386867A1 (fr) * 1977-04-08 1978-11-03 Energy Conversion Devices Inc Dispositif de stockage et de restitution d'informations

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2386867A1 (fr) * 1977-04-08 1978-11-03 Energy Conversion Devices Inc Dispositif de stockage et de restitution d'informations

Also Published As

Publication number Publication date
BG29544A1 (en) 1980-12-12
SU605222A1 (ru) 1978-04-30
DD117290A1 (de) 1976-01-05

Similar Documents

Publication Publication Date Title
DE2801536C2 (de) Zeichenformkodiervorrichtung
DE3689416T2 (de) Mustermerkmalextraktion.
DE2909153C2 (de) Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern
DE3629104C2 (de)
DE3326583C2 (de)
DE2752421A1 (de) Anordnung fuer die abtastung und digitalisierung von grafischen darstellungen oder daten
DE2247942A1 (de) Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen
EP0048941A2 (de) Verfahren zum Verkleinern von grafischen Mustern
EP0301384B1 (de) Schaltungsanordnung zur Aufbereitung von schrägstehenden, insbesondere handgeschriebenen Zeichen
DE2940691C2 (de) Schaltung zur Erzeugung eines Fadenkreuz-Cursors auf dem gesamten Schirm einer Anzeige des Rasterabtasttyps
AT223668B (de) Verfahren und Schaltungsanordnung zur automatischen Erkennung von Schriftzeichen
DE2410306B2 (de) Anordnung zur Einstellung eines Abtastrasters oder einer Erkennungslogik auf die Schräglage von abzutastenden bzw. zu erkennenden Zeichen
EP0107083B1 (de) Belegverarbeitungseinrichtung mit Korrekturschaltung und Datensichtgerät
DE68913475T2 (de) Verfahren zum Durchsuchen einer Matrix binärer Daten.
DE1499394A1 (de) Anordnung zum Messen der Groesse von Zeichen
DE2817341C2 (de) Optisches Handlesegerät für die maschinelle Zeichenerkennung
DE1524416A1 (de) Anordnung zur Auswahl von Datenreferenzen zum Quervergleich mit einem unbekannten Datensatz
EP0206214B1 (de) Verfahren zur einheitlichen symbolischen Beschreibung von Dokumentenmustern in Form von Datenstrukturen in einem Automaten
DE1524409B2 (de) Zeichenerkennungsgeraet
DE2538796A1 (de) Verfahren und erkennungssystem fuer zeichen im schriftverband
DE2054547B2 (de) Optischer Zeichenleser
EP0220467B1 (de) Verfahren zur einheitlichen symbolischen Beschreibung von Dokumentmustern in einem Automat
DE2007577A1 (de) Datenverarbeitungseinrichtung·
DE2445138A1 (de) Verfahren zum spaltenweisen abtasten von automatisch zu erkennenden schriftzeichen
DE1123852B (de) Verfahren und Anordnung zur Ermittlung der Lage von Schriftzeichen

Legal Events

Date Code Title Description
OHJ Non-payment of the annual fee