DE69219346T2 - Zeichenortung für die Zeichenerkennung - Google Patents

Zeichenortung für die Zeichenerkennung

Info

Publication number
DE69219346T2
DE69219346T2 DE69219346T DE69219346T DE69219346T2 DE 69219346 T2 DE69219346 T2 DE 69219346T2 DE 69219346 T DE69219346 T DE 69219346T DE 69219346 T DE69219346 T DE 69219346T DE 69219346 T2 DE69219346 T2 DE 69219346T2
Authority
DE
Germany
Prior art keywords
character
corner
directions
frame
tracing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69219346T
Other languages
English (en)
Other versions
DE69219346D1 (de
Inventor
Paul Barron
Wayne Bentley
John Currie
Steve Krebs
Roger Ridl
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisys Corp
Original Assignee
Unisys Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisys Corp filed Critical Unisys Corp
Publication of DE69219346D1 publication Critical patent/DE69219346D1/de
Application granted granted Critical
Publication of DE69219346T2 publication Critical patent/DE69219346T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

    HINTERGRUND DER ERFINDUNG
  • Diese Erfindung betrifft im allgemeinen Zeichenerkennungs- Systeme und -verfahren und im besonderen verbesserte Mittel und Verfahren zur Ortung von Zeichen auf einem Dokument als Vorbereitung für die Anwendung von Zeichenerkennungs-Methoden auf die georteten Zeichen.
  • Bei vielen Zeichenerkennungs-Systemen liegt ein kritisches Problem in der Ortung von Zeichen, die unter Verwendung von Zeichenerkennungs-Methoden automatisch gelesen werden sollen. Dieses Problem wird besonders ernst, wenn es sich um einen Druck von schlechter Qualität handelt, wie zum Beispiel unvollständige Zeichen oder Papierrauschen.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Es ist demgemäß eine generelle Aufgabe der vorliegenden Erfindung, verbesserte Mittel und Verfahren zur Ortung von Zeichen in einem Zeichenerkennungs-System vorzusehen.
  • Eine spezifischere Aufgabe der Erfindung besteht darin, verbesserte Mittel und Verfahren zur Ortung von Zeichen vorzusehen, wenn es sich um einen Druck von schlechter Qualität handelt.
  • Eine andere Aufgabe der Erfindung gemäß den vorangehenden Aufgaben besteht darin, für die Implementierung von Zeichenortung in einer relativ einfachen und ökonomischen Weise zu sorgen.
  • In einer bestimmten bevorzugten Ausführungsform der Erfindung werden Zeichen unter Verwendung einer neuartigen Herangehensweise geortet, bei der ein Bild, das potentielle Zeichenelemente enthält, in Richtung nach oben, nach unten, nach links und nach rechts verschmiert (nachstehend auch nachgezogen) wird. Das resultierende nachgezogene Bild wird dann verwendet, um Kandidat-Zeichenrahmen zu erzeugen, die auf der Grundlage davon, wie gut sie der Zeichengröße entsprechen, bewertet werden. Diese Kandidat-Zeichenrahmen werden dann auf der Grundlage davon, ob sie sich an korrekten Orten befinden, zum Zweck der Auswahl der zur Zeichenerkennung vorzulegenden bestimmten Zeichenrahmen weiter bewertet.
  • Die spezifische Beschaffenheit der Erfindung sowie andere Aufgaben, Merkmale, Verwendungen und Vorteile werden aus der folgenden detaillierten Beschreibung ersichtlich werden, wenn sie in Verbindung mit den beiliegenden Zeichnungen betrachtet wird.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Fig. 1 ist ein Gesamtblockschaltbild eines Zeichenerkennungs-Systems, in das die Erfindung integriert ist.
  • Fig. 2. ist ein Blockschaltbild, das eine bevorzugte Ausführungsform des in Fig. 1 gezeigten Zeichen-Orters 12 veranschaulicht.
  • Fig. 3 ist eine Prinzipskizze, die eine Reihe von Zeichen auf einem Dokument sowie ein Abtastband, das im typischen Fall zur Abtastung dieser Zeichen verwendet wird, veranschaulicht.
  • Fig. 4 ist ein Diagramm, das veranschaulicht, wie ein Pixelbild, das das Zeichen "6" enthält, im typischen Fall gemäß der Erfindung in Richtung nach oben und nach links nachgezogen werden kann.
  • Fig. 5 ist eine mit Fig. 4 verbundene Legende.
  • Fig. 6 ist ein Blockschaltbild, das eine bevorzugte Ausführungsform der Rahmen-Vorrichtung 26 in Fig. 2 zeigt.
  • Fig. 7 ist eine Tabelle, die typische horizontale Koordinaten veranschaulicht, die für die durch die in Fig. 6 veranschaulichte Rahmen-Vorrichtung gelieferte Paarung gelten.
  • Fig. 8 veranschaulicht ein Bevorzugter-Zustand-Diagramm für die Rahmen-Vorrichtungs-Ausgangssteuerung 48 in Fig. 6.
  • Fig. 9 ist eine Tabelle, die die Bedeutungen verschiedener in Fig. 8 verwendeter Abkürzungen darlegt.
  • Fig. 10 veranschaulicht ein Bild, das einen gültigen langen vertikalen Markierer (LVM) enthält.
  • Fig. 11 veranschaulicht ein Bild, das einen ungültigen langen vertikalen Markierer (LVM) enthält.
  • Fig. 12 ist ein Blockschaltbild, das eine bevorzugte Ausführungsform der Ausgangs-Entscheidungs-Schaltkreise 50 in Fig. 2 veranschaulicht.
  • Fig. 13 ist ein Ablaufdiagramm, das relevante typische Außen-Feld-Funktionen, die durch die Ausgangs-Entscheidungs- Schaltkreise 50 in Fig. 12 ausgeführt werden, allgemein veranschaulicht.
  • Fig. 14 ist ein Ablaufdiagramm, das relevante typische Feld-interne Funktionen, die durch die Ausgangs-Entscheidungs- Schaltkreise 50 in Fig. 12 ausgeführt werden, allgemein veranschaulicht.
  • DETAILLIERTE BESCHREIBUNG
  • Gleiche Kennziffern beziehen sich bei allen Figuren der Zeichnungen auf gleiche Elemente.
  • Es soll allgemein verstanden werden, daß hier beschriebene Vorrichtungen und Verfahren, sofern nicht anders angegeben, so aufgebaut werden und so arbeiten, wie zur Zeit im Stand der Technik bekannt.
  • Bezugnehmend anfangs auf Fig. 1: Bild-Erfassungs-Modul 10 liefert Videobilder 10a, die der Abtastung einer Reihe von Zeichen, die auf einem Dokument enthalten sind, entsprechen. Diese Videobilder 10a werden einem Zeichen-Orter 12 zugeführt. Der Grundbetrieb des Zeichen-Orters 12 besteht darin, Zeichen in den zugeführten Videobildern 10a zu orten und Signale 12a an Zeichenerkennungs-Schaltkreise 14 zur Erkennung der georteten Zeichen zu senden. Außerdem liefert Bild-Erfassungs-Modul 10 Signale 10b, die Dokument-Anwesenheit und verschiedene Bild- Eigenschaften, wie zum Beispiel Kontrast, angeben, an Zeichen- Orter 12. Der Leser wird verstehen, daß das Bild-Erfassungs- Modul 10 und die Erkennungs-Schaltkreise 14 herkömmlicher Art sein können und demgemäß hier nicht weiter beschrieben werden sollen.
  • Die durch die Zeichenerkennungs-Schaltkreise 14 erkannten Zeichen werden im typischen Fall an eine Computer-Verarbeitungs- Einheit (CPU) 15 geliefert, wie in Fig. 1 gezeigt. Die CPU 15 liefert außerdem im typischen Fall Initialisierungs- und andere Signale 15b, wie zum Beispiel Zeichengröße, Schrifttypen usw., an den Zeichen-Orter 12. Der Zeichen-Orter 12 liefert außerdem Ausgangssignale 12b, die besondere Zeichen-Ort-Eigenschaften angeben, an die CPU 15.
  • Das durch das Bild-Erfassungs-Modul 10 gelieferte Videobild 10a kann im typischen Fall pro Abtastung 128 "aktive" Pixels und mindestens 14 "inaktive" Pixels enthalten. Ein Pixel stellt im typischen Fall eine Bildfläche dar, die 4,6875 Mil ( 119 mm) hoch mal 4,26 Mil ( 108 mm) breit ist.
  • Fig. 2 veranschaulicht eine bevorzugte Ausführungsform des in Fig. 1 gezeigten Zeichen-Orters 12. Es ist aus Fig. 2 zu ersehen, daß das Videobild 10a aus dem Bild-Erfassungs-Modul 10 in Fig. 1 an eine Dynamisches-Abtastband-Schaltung 16 geliefert wird, die im typischen Fall ein Abtastband liefert, das 0.6 Zoll (15,24 mm) hoch ist und in vertikaler Richtung 128 Pixels umfaßt. Wie gut bekannt ist, steuert die Dynamisches-Abtastband- Schaltung 16 die Höhe des Abtastbands (Abtaster-Blickfeld), die im typischen Fall so gewählt wird, daß verhindert wird, daß eventuell vorhandene schwarze Markierungen nahe den Randzonen des Abtastbands die Ortsermittlung stören. Im typischen Fall geschieht dies, indem alle Pixels außerhalb eines vorbestimmten Bereichs des Interesses auf Weiß geschaltet werden. Die Höhe des Abtastbands kann durch CPU-Ausgabe 16a (Fig. 1) oder durch die Ausgabe 50b aus Ausgangs-Entscheidungs-Schaltkreisen 50, die im folgenden beschrieben werden sollen, gesteuert werden.
  • Ein Abtastungs-Puffer 18 in Fig. 2 speichert und aktualisiert sechsunddreißig Abtastungen, die von der Dynamisches- Abtastband-Schaltung 16 empfangen werden, kontinuierlich, wobei jede Abtastung 128 Pixels in der vertikalen (Spalten-) Richtung umfaßt. Fig. 3 veranschaulicht typische Rechts-nach-links- Spaltenabtastung eines Dokuments 11, die durch Abtastungs-Puffer 18 geliefert wird. Zu jeder Pixel-Zeit wird eine ganze Zeile des Abtastungs-Puffers 18, die ein Pixel von jeder der gespeicherten sechsunddreißig Abtastungen darstellt, als eine Puffer-Ausgabe 18a zur Verfügung gestellt.
  • Die Abtastungs-Puffer-Ausgabe 18a wird einer Nachzieh- Schaltung 20 zugeführt, die so arbeitet, daß sie im Bild enthaltene schwarze Pixels (potentielle Zeichenelemente) in vier Richtungen, nach oben, nach unten, nach links und nach links, nachzieht. Das durch die Nachzieh-Schaltung 20 gelieferte Nachziehen erstreckt sich vorzugsweise im typischen Fall um eine Zeichenhöhe nach oben und nach unten und um eine Zeichenbreite nach links und nach rechts.
  • Fig. 4 veranschaulicht das Nachziehen von Pixels, die ein Zeichen "6" bilden, in Richtung nach oben und nach links. Obwohl sie in Fig. 4 nicht gezeigt ist, geschieht das Nachziehen in Richtung nach unten und nach rechts in einer ähnlichen Weise. Wie aus Fig. 4 ersichtlich sein wird, wird das Nachziehen bewerkstelligt, indem die m aufeinanderfolgenden Pixels, die, in der Richtung des Nachziehens gesehen, auf ein schwarzes Pixel folgen, auf Schwarz gestellt werden, wobei m die Länge des Nachziehens ist. Fig. 5 ist eine Legende, die für Fig. 4 gilt.
  • Das durch die Nachzieh-Schaltung 20 in Fig. 2 erzeugte resultierende in 4 Richtungen nachgezogene Bild 20a wird einer Ecken-Ermittlungs-Schaltung 22 zur Ermittlung des oberen, des unteren, des linken und des rechten Rands eines Zeichens zugeführt. Dies wird bewerkstelligt, indem das Nach-oben- Nachziehen und das Nach-unten-Nachziehen verwendet werden, um einen linken und einen rechten Rand zu erzeugen, und indem das Nach-links-Nachziehen und das Nach-rechts-Nachziehen verwendet werden, um einen oberen und einen unteren Rand zu erzeugen. Zum Beispiel veranschaulicht Fig. 4, wie ein linker Rand und ein oberer Rand bei einem Nach-oben-Nachziehen und bei einem Nach- links-Nachziehen des Zeichens "6" bestimmt werden. Bei jeder Zeile des nach oben nachgezogenen Bilds wird eine vertikale Linie 24 in die am weitesten links befindliche Spalte, die ein schwarzes Pixel enthält, gesetzt. Der linke Rand des nachgezogenen Bilds ist dann die am weitesten links befindliche vertikale Linie 24'. Bei jeder Spalte des nach links nachgezogenen Bilds wird eine horizontale Linie 26 in die oberste Zeile, die ein schwarzes Pixel enthält, gesetzt. Der obere Rand ist dann die oberste horizontale Linie 26'.
  • Die Ecken-Ermittlungs-Schaltung 22 ermittelt eine Ecke auf der Grundlage der Schnittpunkte der Ränder der nachgezogenen Zeichenpixels. Zum Beispiel wird dies in Fig. 4 durch die obere linke Ecke 28 veranschaulicht, die durch den Schnittpunkt des linken Rands 24' und des oberen Rands 26' gebildet wird. Der Leser wird verstehen, daß die anderen drei Ecken in einer ähnlichen Art und Weise gefunden werden.
  • Spezifischer ausgedrückt, die Ecken-Ermittlungs-Schaltung 22 sorgt in der folgenden Weise für die Ermittlung von Ecken an Hand der Schnittpunkte von Rändern:
  • Obere linke Ecken (TLCs) sind die Schnittpunkte von an Hand des Nach-links-Nachziehens gefundenen oberen Rändern mit an Hand des Nach-oben-Nachziehens gefundenen linken Rändern.
  • Obere rechte Ecken (TRCs) sind die Schnittpunkte von an Hand des Nach-rechts-Nachziehens gefundenen oberen Rändern mit an Hand des Nach-oben-Nachziehens gefundenen rechten Rändern.
  • Untere linke Ecken ((BLCs) sind die Schnittpunkte von an Hand des Nach-links-Nachziehens gefundenen unteren Rändern mit an Hand des Nach-unten-Nachziehens gefundenen linken Rändern.
  • Untere rechte Ecken (BRCs) sind die Schnittpunkte von an Hand des Nach-rechts-Nachziehens gefundenen unteren Randern mit an Hand des Nach-unten-Nachziehens gefundenen rechten Rändern.
  • Boolesche Funktionen, um Ecken zu finden, sind unten angegeben, wobei:
  • m = Zeilen-Ort des Pixels
  • n = Spalten-Ort des Pixels
  • U = nach oben nachgezogenes Bild
  • D = nach unten nachgezogenes Bild
  • R = nach rechts nachgezogenes Bild
  • L = nach links nachgezogenes Bild
  • HR = um halbe Breite nach rechts nachgezogenes Bild
  • HRE = Freigabe für Nachziehen um eine halbe Breite nach rechts
  • HL = um halbe Breite nach links nachgezogenes Bild
  • HLE = Freigabe für Nachziehen um eine halbe Breite nach links
  • ' = Komplement des Pixelwerts
  • Obere rechte Ecken:
  • TRCmn = (Umn U'm(n+1)) (Rmn R'(m+1)n + HRmn HR'(m+1)n HRE) = Umn U'm(n+1) Rmn R'(m+1)n + Umn U'm(n+1) Hrmn HR'(m+1)n HRE
  • Obere linke Ecken:
  • TLCmn = (Umn U'm(n-1)) (Lmn L'(m+1)n + HLmn HL'(m+1)n HLE) = Umn U'm(n-1) Lmn L'(m+1)n + Umn U'm(n-1) HLmn HL'(m+1)n HLE
  • Untere rechte Ecken:
  • BRCmn = (Dmn D'm(n+1)) (Rmn R'(m-1)n + HRmn HR'(m-1)n HRE) = Dmn D'm(n+1) Rmn R'(m-1)n + Dmn D'm(n+1) HRmn HR'(m-1)n HRE
  • Untere linke Ecken:
  • BLCmn = (Dmn D'm(n-1)) (Lmn L'(m-1)n + HLmn HL'(m-1)n HLE) = Dmn D'm(n-1) Lmn L'(m-1)n + Dmn D'm(n-1) HLmn HL'(m-1)n HLE
  • Um mit der Beschreibung der bevorzugten Ausführungsform des Zeichen-Orters 12 in Fig. 2 fortzufahren: Die Ausgabe 22a der Ecken-Ermittlungs-Schaltung 22 wird zusammen mit der Abtastungs- Puffer-Ausgabe 18a einem Eckenfilter 25 zugeführt, das eine Dichtekontrolle in bezug auf mindestens eine ermittelte Ecke durchführt, um zu bestimmen, ob die Ecke gültig ist. Dies kann im typische Fall bewerkstelligt werden, indem bestimmt wird, ob eine Schwellen-Anzahl von Pixels (die auf das Vorhandensein eines Zeichens hindeutet) innerhalb eines rechteckigen Bereichs, der durch die Ecke begrenzt wird und der der Größe eines Zeichens in etwa entspricht, enthalten ist, um dadurch zu verhindern, daß Störrauschen die Ermittlung einer gültigen Ecke ergibt. Zum Beispiel kann mit Bezug auf Fig. 4 ein typischer für diese Schwellen (Dichte) -Messung verwendeter rechteckiger Bereich 18 x 24 Pixel umfassen (ungefähr die Größe eines Zeichens), die durch die durch den Schnittpunkt des linken Rands 24' und des oberen Rands 26' gebildete Ecke begrenzt sind.
  • Wie in Fig. 2 veranschaulicht, empfängt eine Rahmen- Vorrichtung 26 die Ausgabe 25a vom Eckenfilter 25 und die Ausgabe 22a von der Ecken-Ermittlungs-Schaltung 22a. Ecken, die die Dichtekontrolle des Eckenfilters 25 nicht bestehen, werden verworfen. Der Zweck der Rahmen-Vorrichtung 26 besteht darin, gültige Ecken, die durch Ecken-Ermittlungs-Schaltung 24 ermittelt werden, zu verwenden, um gültige Rahmen zu erzeugen, die auf der Grundlage von Zeichengröße bewertet werden und dann über die Rahmen-Vorrichtungs-Ausgabe 26a den Ausgangs- Entscheidungs-Schaltkreisen 50 als bewertete Kandidat- Zeichenrahmen übermittelt werden. Zur Rahmen-Vorrichtungs- Ausgabe 26a gehören auch Positions- und Status-Informationen (wie zum Beispiel Dokument-Anwesenheit und Schrifttyp) in der Form von Abtastungs-Separatoren. Eine bevorzugte Ausführungsform der Rahmen-Vorrichtung 26 wird in Fig. 6 veranschaulicht.
  • Mit Bezug auf die in der Fig. 6 gezeigten bevorzugten Ausführungsform der Rahmen-Vorrichtung 26: Informationen über die obere linke Ecke (TLC) und über die untere rechte Ecke (BRC) werden einer Rahmen-Vorrichtungs-Eingangssteuerung 40 zugeführt. Von dort aus werden BRC-Koordinaten und Separatoren im Untererechte-Ecke-FIFO-Speicher 42 geschrieben, und potentielle zugehörige TLC-Koordinaten werden gleichzeitig im Obere-linke- Ecke-FIFO-Speicher Nr. 1 (44) und im Obere-linke-Ecke-FIFO- Speicher Nr. 2 (46) geschrieben. Die horizontale Komponente aller Koordinaten muß nur 6 Bits einer auf den rechten Rand des Dokuments 11 (Fig. 3) bezogenen absoluten Abtastungszahl enthalten. Die Rahmen-Vorrichtungs-Eingangssteuerung 40 liefert auch zweckentsprechende Rücksetz- und Schreibsignale für die FIFO-Speicher 42, 44 und 46, wie in Fig. 6 gezeigt.
  • Die Rahmen-Vorrichtungs-Ausgangssteuerung 48 liest BRCs und Separatoren vom BRC-FIFO-Speicher 42. Separatoren werden direkt an die Ausgangs-Entscheidungs-Schaltung 50 (Fig. 2) gesandt. Jede BRC wird mit jeder im zweckentsprechenden TLC-FIFO-Speicher 44 oder 46 enthaltenen TLC einzeln gepaart. Typische horizontale Koordinaten werden in Fig. 7 veranschaulicht.
  • Es ist in Fig. 7 zu beachten, daß eine BRC bei den ersten 32 Abtastungen (Hexadezimal-Abtastungen 00 bis einschließlich 1F) allen im TLC-FIFO-Speicher Nr. 1 (TL1) enthaltenen TLCs angepaßt wird, während eine BRC aus den nächsten 32 Abtastungen (Hexadezimal-Abtastungen 20 bis einschließlich 3F) allen im TLC- FIFO-Speicher Nr. 2 (TL2) enthaltenen TLCs angepaßt wird. Falls ein gegebenes BRC/TLC-Paar einen Rahmen der korrekten Höhe und Breite für eine bestimmte Schriftart bildet und falls die gegenüberliegenden Ecken BLC und TRC existieren, dann erzeugt das Paar einen gültigen Rahmen. Es ist auch in bezug auf Fig. 7 zu beachten, daß die Ecken in TL1 und TL2 alle 40 Hexadezimal- Abtastungen gelöscht werden, wobei TL1 bei den Hexadezimal- Abtastungen 0, 40 usw. zuruckgesetzt wird und TL2 bei den Hexadezimal-Abtastungen 20, 60 usw. zurückgesetzt wird.
  • Zusammenfassend dient die Rahmen-Vorrichtungs-Ausgangssteuerung 48 in Fig. 6 dazu: (1) Abtastungs-Separatoren an die Ausgangs-Entscheidungs-Schaltung 50 in Fig. 2 zu übermitteln, (2) jede untere rechte Ecke (BRC) mit jeweiligen oberen linken Ecken (TLCs) vom ausgewählten FIFO-Speicher 44 oder 46 zu paaren, (3) potentiell gültige Rahmen an Hand von TLC-und-BRC- Ecken-Paaren, die eine zulässige Breite und Höhe für die ausgewählte Schriftart aufweisen, zu bestimmen, (4) gültige Rahmen aus diesen potentiell gültigen Rahmen auf der Grundlage des Vorhandenseins der anderen zwei Ecken BLC und TRC des Rahmens auszuwählen, (5) diese gültigen Rahmen auf der Grundlage davon, wie gut sie der Zeichengröße entsprechen, zu bewerten und (6) diese bewerteten gültigen Rahmen als Kandidat-Zeichenrahmen an die Ausgangs-Entscheidungs-Schaltkreise (50) (Fig. 2) zu senden. Wie in Fig. 6 gezeigt, liefert die Rahmen-Vorrichtungs- Ausgangssteuerung 48 zweckentsprechende Lese- und Weiterübertragungssignale an die FIFO-Speicher 42, 44 und 46 zur Steuerung der Zuleitung von TLC-, BRC- und Abtastungs-Separatorsignalen zu diesen, während die FIFO-Speicher 42, 44 und 46 zweckentsprechende Datenvorhandenseinssignale an die Rahmen-Vorrichtungs- Ausgangssteuerung 48 liefern, um anzugeben, wenn Daten vorhanden sind, wie auch in Fig. 6 gezeigt, und die Rahmen-Vorrichtungs- Eingangssteuerung 40 Auswählsignale 40a an die Rahmen-Vorrichtungs-Ausgangssteuerung 48 zur Verwendung durch diese bei der Auswahl des korrekten oberen linken FIFO-Speichers 44 oder 46 liefert.
  • Ein Bevorzugter-Zustand-Diagramm für die Rahmen-Vorrichtungs-Ausgangssteuerung 48 in Fig. 6 wird in Fig. 8 veranschaulicht. Fig. 9 ist eine Tabelle, die die Bedeutungen von verschiedenen in Fig. 8 verwendeten Abkürzungen darlegt. Die Bewertung von gültigen Rahmen kann im typischen Fall gemäß der folgenden Gleichung erfolgen:
  • Bewertung = 100 - [2 * abs (Schriftbreite - Rahmenbreite) + 3 * abs (Schrifthöhe - Rahmenhöhe)]
  • Um auf Fig. 2 zurückzukommen, ist zu ersehen, daß die Ausgabe 26a der soeben erwähnten Rahmen-Vorrichtung 26 der Ausgangs-Entscheidungs-Schaltung 50 zugeführt wird. Der Ausgangs- Entscheidungs-Schaltung 50 zugeführt werden auch Ausgaben aus einen Rückweisungs-Kennzeichner 52, einem Strichbreitenmesser 54 und einem Lange-Vertikale-Markierung-Detektor 56. Diese Komponenten 52, 54 und 56 werden zusammen mit den durch die Rahmen- Vorrichtung 26 gelieferten bewerteten Kandidat-Zeichenrahmen zur Verwendung durch die Ausgangs-Entscheidungs-Schaltung 50 bei der Bestimmung, welche Zeichenrahmen letztlich an die Zeichenerkennungs-Schaltkreise 14 (Fig. 1) gesandt werden, und auch bei der Bestimmung der bestimmten Signale, die an die CPU (Fig. 1) gesandt werden sollen, geliefert.
  • Der Rückweisungs-Kennzeichner 52 in Fig. 2 arbeitet als Reaktion auf die Abtastungs-Puffer-Ausgabe 18a und auf die Nachzieh-Schaltungsausgabe 20b, um Markierungen zu kennzeichnen, die viel größer sind als eine erwartete Zeichengröße und deshalb unter Verwendung der vorstehend beschriebenen Nachziehen- Herangehensweise vielleicht keinen gültigen Zeichenrahmen erzeugen würden. Um diese Markierungen zu ermitteln, verwendet der Kennzeichner 52 ein Fenster mit den Abmessungen 1 Pixel breit mal die nicht-lesbare Minimalhöhe (die Höhe des kleinsten Zeichens im Zeichensatz). Dieses 1-Pixel-breite Fenster wird über jede Spalte eines (durch Nachzieh-Schaltungsausgabe 20b gelieferten) nach rechts nachgezogenen Bilds nach oben geführt. Falls das Fenster irgendwann mit einer Schwellen-Anzahl von schwarzen Pixels gefüllt ist, wird die betreffende Spalte gekennzeichnet. Außerdem wird bei jeder gekennzeichneten Spalte beim ersten und beim letzten Mal, daß das Fenster die Schwellen- Anzahl von schwarzen Pixels enthielt, die oberste Zeile des Fensters gespeichert. Eine Kennzeichner-Ausgabe 52a liefert die Resultate dieser Operationen an die Ausgangs-Entscheidungs- Schaltkreise 50 zur Verwendung bei der Bestimmung, welche der Zeichenrahmen an die Zeichenerkennungs-Schaltkreise 14 (Fig. 1) gesandt werden sollen.
  • Der Strichbreitenmesser 54 in Fig. 2 ist vorgesehen, um Situationen zu handhaben, bei denen ein gültiger Rahmen wegen des Vorhandenseins übermäßigen Papierrauschens (unerwünschter Markierungen) vielleicht nicht erkannt wird oder bei denen mehrere Zeichen miteinander verbunden sind oder bei denen sich eine unerwartete Markierung, wie zum Beispiel eine Unterschrift, ins Feld der Zeichen erstreckt. Der Grundzweck des Strichbreitenmessers 54 besteht darin, zu bestimmen, ob ein Zeichen vorhanden ist, obwohl es von der Rahmen-Vorrichtung 26 nicht gefunden wurde. Der Strichbreitenmesser 54 bestimmt, ob ein Zeichen vorhanden sein könnte, indem er bestimmt, ob es Markierungen innerhalb eines Rahmens gibt, die Strichbreiten aufweisen, die auf das Vorhandensein eines Zeichens hindeuten. Ein Beispiel einer Möglichkeit, das Vorhandensein solcher Strichbreiten zu bestimmen, besteht darin, ein Fenster mit den Abmessungen zwei Pixel hoch mal ein Pixel breit vorzusehen, das über jede Abtastung nach oben bewegt wird. Immer wenn zwei aufeinanderfolgende schwarze Pixels (die minimale Zeichenstrichbreite) dazu führen, daß das Fenster gefüllt wird, wird ein Zähler zurückgesetzt und eine Null für den Pixel-Ort gespeichert, der dem oberen Ende des Fensters entspricht. Falls das Fenster nicht zwei schwarze Pixels enthält, wird der Zähler erhöht und sein Wert gespeichert. Jeder gespeicherte Pixel-Ort enthält dann die Distanz über der nächsten strichbreitengroßen Markierung (dem nächsten schwarzen Fleck) in der Abtastung. Diese gespeicherten Werte erlauben die Durchführung einer Bestimmung, ob ein Zeichen vorhanden ist. Eine Strichbreitenmesser-Ausgabe 54a liefert die Resultate dieser Operationen an die Ausgangs-Entscheidungs- Schaltkreise 50, die diese Resultate verwenden, um auf der Grundlage von Zeichenmittenabstand und Vorherige-Zeichen-Informationen einen entsprechenden Zeichenrahmen an die Zeichenerkennungs-Schaltkreise 14 (Fig. 1) zu senden.
  • Der Lange-Vertikale-Markierung-Detektor 56 in Fig. 2 arbeitet an der nicht nachgezogenen Abtastungs-Puffer-Ausgabe 18a vom Abtastungs-Puffer 18, um lange vertikale Markierungen (LVM) zu ermitteln, die wegen ihrer Geometrie unter Verwendung der vorstehend beschriebenen Nachziehen-Herangehensweise vielleicht keine Ecken liefern würden, die auf einen gültigen Rahmen hindeuten. Eine LVM kann im typischen Fall wie folgt definiert werden: (1) Sie enthält zwischen zwei und neun aufeinanderfolgende schwarze Spalten; (2) sie weist in den vier Spalten, die an ihren rechten Rand angrenzen, sowie in den vier Spalten, die an ihren linken Rand angrenzen, mindestens eine weiße Spalte auf. Eine schwarze Spalte, zum Beispiel, ist eine, die einen schwarzen Bereich aufweist, der 30 Pixels in einem 32-Pixel- Fenster enthält. Eine weiße Spalte, zum Beispiel, ist eine, die keine zwei aufeinanderfolgenden schwarzen Pixels zwischen dem höchsten oberen Ende und dem niedrigsten unteren Ende der schwarzen Bereiche in den schwarzen Spalten aufweist. Fig 10 veranschaulicht ein Beispiel einer gültigen LVM, während Fig. 11 eine ungültige LVM veranschaulicht. Der Lange-Vertikale- Markierung-Detektor 56 liefert eine Ausgabe 56a an die Ausgangs- Entscheidungs-Schaltkreise 50, die ermittelte LVM angibt.
  • Die Ausgangs-Entscheidungs-Schaltkreise 50 in Fig. 2 sollen nun eingehender betrachtet werden. Es soll verstanden werden, daß der primäre Zweck der Ausgangs-Entscheidungs-Schaltkreise 50 darin besteht, als Reaktion auf die durch die Rahmen-Vorrichtung 26 gelieferten bewerteten Kandidat-Zeichenrahmen und auf die Ausgaben 52a, 54a und 56a des Rückweisungs-Kennzeichners 52, des Strichbreitenmessers 54 bzw. des Lange-Vertikale-Markierung- Detektors 56 Endbestimmungen von Zeichenrahmen, die an die Zeichenerkennungs-Schaltkreise 14 (Fig. 1) gesandt werden sollen, durchzuführen. Eine bevorzugte Ausführungsform der Ausgangs-Entscheidungs-Schaltkreise 50 soll als nächstes mit Bezug auf das in Fig. 12 gezeigte Block- und Prinzipschaltbild beschrieben werden.
  • Die Ausgangs-Entscheidungs-Schaltkreise 50 weisen zwei Grundbetriebsmodi auf: (1) einen Außen-Feld-Modus (out-of field Modus) und (2) einen Feld-internen Modus (in-field Modus). Der Außen-Feld-Modus entspricht der Situation, in der noch kein gültiger Zeichenrahmen gefunden worden ist. Der Feld-interne Modus entspricht der Situation, in der mindestens ein gültiger Zeichenrahmen gefunden worden ist. Der Betrieb der Ausgangs- Entscheidungs-Schaltkreise 50 in bezug auf diese Modi wird durch einen Digital-Signal-Prozessor (DPS) 60 gesteuert. Zu den Entscheidungs-Ausgangs-Schaltkreisen 50 gehören auch ein Dualport- SRAM 66, ein Orter-FIFO-Speicher 68, ein Rahmen-Vorrichtungs- Daten-vorhanden-Anschluß 70, ein Programm-Speicher 72, ein Datenspeicher 74, ein Befehl/Antwort-Register 76, ein Dynamisches-Abtastband-Anschluß 78 und ein Zeichenerkennungs-Schaltkreise-Anschluß 80. Der Betrieb der bevorzugten Ausführungsform der in Fig. 12 gezeigten Ausgangs-Entscheidungs-Schaltkreise 50 in jedem Modus wird nun im Detail betrachtet.
  • Außen-Feld-Modus
  • Das höchstwertige Bit eines in der Rahmen-Vorrichtungs- Ausgabe 26a gelieferten Daten-vorhanden-Signals wird überwacht. Falls sein Wert gleich eins ist, liest der DSP 60 ein Wort vom Rahmen-Vorrichtungs-FIFO-Speicher-Anschluß 62. Bit 15 dieses Worts gibt an, ob die restlichen Bits Status-Informationen über die aktuelle Abtastung enthalten (WT = 1) oder ob sie Informationen über einen in der aktuellen Abtastung gefundenen Rahmen enthalten (WT = 0). Im ersteren Fall gibt Bit 12 an, welche Schriftartparameter für die Abtastung gelten (F = 0, falls erste Schriftart, F = 1, falls zweite Schriftart), und Bit 13 gibt an, ob sich die aktuelle Abtastung innerhalb eines Dokuments befindet (DP = 1); im letzteren Fall geben Bits 0 bis einschließlich 6 die y-Koordinate der unteren rechten Ecke eines in der aktuellen Abtastung gefundenen Rahmens an, und Bits 7 bis einschließlich 13 enthalten die Grundbewertung dieses Rahmens. Ein Wort, das Status-Informationen enthält, wird am Anfang jeder Abtastung einmal vorkommen, wohingegen ein Wort, das Rahmen- Informationen enthält, bei jedem neuen, in der aktuellen Abtastung durch die Rahmen-Vorrichtung gefundenen Rahmen einmal vorkommen wird.
  • Der Rahmen-Vorrichtungs-FIFO-Speicher-Anschluß 64 enthält ein zusätzliches Wort für jedes im Anschluß 61 gefundene Rahmen- Informationen-Wort. Bits 0 bis einschließlich 6 dieses Worts enthalten die y-Koordinate der oberen linken Ecke des Rahmens, und Bits 7 bis einschließlich 12 enthalten die horizontale Distanz zwischen der unteren rechten und der oberen rechten Ecke. Jedesmal wenn ein Rahmen-Vorrichtungs-Informationen-Wort aus dem Anschluß 62 gelesen wird, wird Rahmen-Vorrichtungs- Anschluß 64 gelesen, um eine eins-zu-eins Zuordnung unter diesen Wörtern aufrechtzuerhalten.
  • Falls in der aktuellen Abtastung ein Kandidat-Zeichenrahmen gefunden wurde, dann werden die nächsten zehn Abtastungen nach dem besten Rahmen abgesucht, und das Verfahren tritt in den Feld-internen Modus (im folgenden beschrieben). Der Rahmen mit der höchsten Grundbewertung wird zentriert und über Ausgabe 50a zusammen mit der entsprechenden Abtastungs-Puffer-Ausgabe 18a an die Zeichenerkennungs-Schaltkreise 14 gesandt, wie in Fig. 2 angegeben.
  • Falls kein Kandidat-Zeichenrahmen gefunden wurde, wird eine Kontrolle durchgeführt, um zu bestimmen, ob eine lange vertikale Markierung (LVM) ermittelt wurde. Dies wird bewerkstelligt, indem das SRAM 66 kontrolliert wird. Das SRAM 66 speichert Informationen, die die Ermittlung einer LVM durch den Lange- Vertikale-Markierung-Detektor 56 (Fig. 2) bei den vorherigen 64 Abtastungen angeben. Jede Abtastung erzeugt 128 Bytes Informationen. Bit 7 des ersten Bytes in einer Abtastung enthält eine Kennzeichnung (Flag R), die angibt, ob sich die Abtastung nahe zeichengroßen Daten befindet oder nicht (d. h. R = 1, falls sich irgendwo innerhalb der nächsten Nachzieh-Breite-Anzahl von Abtastungen etwas befindet, das so hoch ist wie das Zeichen mit der kleinsten Höhe bei der aktuellen Schriftart). Die restlichen 7 Bits geben den vertikalen Ort des oberen Endes des Rückweisungs-Minimalhöhe-Fensters an, wenn es zum ersten Mal mit einer Schwellen (Rückweisungs-Störabstand) -Anzahl von schwarzen Pixels gefüllt wird. Dieser Wert wird verwendet, um das ungefähre untere Ende des Rückweisungs-Bereichs zu finden. Das zweite Byte in einer Abtastung enthält in Bits 0 bis einschließlich 6 das absolute obere Ende des Rückweisungs- Bereichs, Bit 7 enthält eine Kennzeichnung (Flag L), die immer gesetzt wird, wenn die Abtastung Teil einer LVM ist. Bytes 2 bis einschließlich 127 enthalten in den niederwertigen 7 Bits einen Wert, der die vertikale Distanz über dem nächsten Vorkommen zweier aufeinanderfolgender schwarze Pixels in der betreffenden Spalte angibt. Das höchstwertige Bit enthält den eigentlichen Pixelwert, die Adressenbits 7 bis einschließlich 12 geben die Abtastungszahl an, und Bits 0 bis einschließlich 6 geben die Byte-Zahl innerhalb der Abtastung an.
  • Falls eine LVM-Kennzeichnung in der Abtastung von Interesse gefunden wurde, wird über Ausgabe 50c (Fig. 2) ein LVM-Code an die CPU 15 (Fig. 1) gesandt. Die Suche nach einem potentiellen Rahmen wird dann im Außen-Feld-Modus am linken Rand der LVM weitergeführt.
  • Falls weder ein potentieller Rahmen noch eine LVM gefunden wurde, sucht der DSP 60 das SRAM 66 ab, um zu bestimmen, ob eine Rückweisung durch den Rückweisungs-Kennzeichner 52 (Fig. 2) gekennzeichnet wurde, wobei das Resultat über Ausgabe 12a an die CPU 15 (Fig. 1) gesandt wird. Die Suche nach einem potentiellen Rahmen wird dann in der nächsten Spalte weitergeführt.
  • Fig. 13 ist ein Ablaufdiagramm, das relevante typische Außen-Feld-Funktionen, die durch die Ausgangs-Entscheidungs- Schaltkreise 50 ausgeführt werden, allgemein veranschaulicht.
  • Feld-interner Modus
  • Alle Kandidat-Zeichenrahmen werden auf die beste Bewertung hin geprüft, wobei dies in Spalten ab dem Ende des vorherigen Zeichens bis kurz nach der erwarteten Mitte des nächsten Zeichens geschieht. In Abhängigkeit von der Position der Rahmen in bezug auf das vorherige Zeichen werden Bonuspunkte zur Bewertung addiert. Die Schlußbewertung eines Kandidat- Zeichenrahmens wird somit die Summe der durch die Rahmen- Vorrichtung 26 gelieferten Bewertung, die auf der Zeichengröße basiert, und der durch die Ausgangs-Entscheidungs-Schaltkreise 50 gelieferten Bewertung, die darauf basiert, ob sich der Rahmen an seinem erwarteten Ort befindet (d. h. die auf dem Zeichenmittenabstand basiert), sein.
  • Der resultierende höchstbewertete Kandidat-Zeichenrahmen wird dann gewählt, und alle nötigen Änderungen an seiner Höhe oder Breite werden unter Verwendung von Vorherige-Zeichen- Informationen durchgeführt. Rahmen werden in einem für die Zeichenerkennungs-Schaltkreise 14 zweckentsprechenden Kasten zentriert. Die Kastengrößen sind im typischen Fall in allen vier Richtungen 2 Pixel größer als die Schablonengröße, so daß die Erkennungs-Schaltkreise 14 das Zeichen um zwei Pixel nach oben, nach unten, nach links und nach rechts verschieben können.
  • Eine LVM wird unabhängig von den Zeichenerkennungs- Schaltkreisen 14 erkannt. Falls der höchstbewertete Rahmen den Abmessungen einer LVM entspricht, wird der Rahmen als eine LVM erkannt. Falls ein Rahmen gefunden wird und seine Abmessungen denen einer LVM nicht entsprechen, wird das Gebiet zwischen dem linken Rand des vorherigen Zeichens und dem rechten Rand des aktuellen Zeichens auf eine LVM-Kennzeichnung hin kontrolliert. Falls kein Rahmen gefunden wird, dann wird das gesamte Suchgebiet auf das Vorhandensein einer LVM-Kennzeichnung hin kontrolliert. In all diesen Fällen, in denen eine LVM ermittelt wird, wird nur die CPU 15 (Fig. 1) benachrichtigt.
  • Falls weder ein Rahmen noch eine LVM gefunden wurde, wird unter Verwendung des Mittenabstands und Informationen über das obere Ende und das untere Ende des vorherigen Rahmens ein potentieller Rahmen gebildet. Die durch den Strichbreitenmesser 54 (Fig. 2) gelieferte und im SRAM 66 gespeicherte Schwarze- Fleck-Zahl wird dann verwendet, um zu bestimmen, ob es in diesem Bereich strichbreitengroße Markierungen gibt. Falls es solche gibt, wird der Rahmen an die Erkennungs-Schaltkreise 14 gesandt. Anderenfalls wird der Feld-interne Modus aktiviert.
  • Fig. 14 ist ein Ablaufdiagramm, das relevante typische Feld-interne Funktionen, die durch die Ausgangs-Entscheidungs- Schaltkreise 50 ausgeführt werden, allgemein veranschaulicht.
  • Der Leser wird verstehen, daß die hier beschriebene bevorzugte Ausführungsform der Erfindung nur als Beispiel dient und daß die Erfindung viele Modifikationen und Variationen des Aufbaus, der Anordnung und der Verwendung zuläßt. Demgemäß soll für die vorliegende Erfindung gelten, daß sie alle Modifikationen und Variationen enthält, die im Schutzumfang der Erfindung, wie sie durch die angehängten Ansprüche definiert wird, liegen.

Claims (13)

1. Zeichenortungsvorrichtung zur Verwendung in einem Zeichenerkennungs-System zur Erkennung einer Reihe von Zeichen, wobei die Vorrichtung folgendes umfaßt:
Bild-Erfassungs-Mittel, das Bilder liefert, die der Abtastung einer Reihe von Zeichen entsprechen, wobei eines oder mehrere der Bilder Zeichenelemente enthalten;
ein Abtastungs-Puffer zur aufeinanderfolgenden Speicherung von durch das Bild-Erfassungs-Mittel erzeugten Bildern;
eine an den Abtastungs-Puffer gekoppelte Nachzieh-Schaltung zum Nachziehen von Zeichenelementen in einem Bild in einer ersten und einer zweiten Richtung, wobei die erste Richtung parallel zur Reihe ist und die zweite Richtung senkrecht zur Reihe ist;
eine an die Nachzieh-Schaltung gekoppelte Ecken-Ermittlungs-Schaltung zur Ermittlung einer Ecke auf der Grundlage des Schnittpunkts der Ränder der nachgezogenen Zeichenelemente in der ersten und der zweiten Richtung,
ein an die Ecken-Ermittlungs-Schaltung gekoppeltes Eckenfilter zur Durchführung einer Dichtekontrolle in bezug auf eine durch die Ecken-Ermittlungs-Schaltung ermittelte Ecke, um zu bestimmen, ob die Ecke gültig ist,
eine an das Eckenfilter gekoppelter Rahmen-Vorrichtung zur Erzeugung von Kandidat-Zeichenrahmen als Reaktion auf durch die Ecken-Ermittlungs-Schaltung ermittelte gültige Ecken; und
an die Rahmen-Vorrichtung gekoppelte Entscheidungsschaltkreise zur Bestimmung, welcher der Kandidat-Zeichenrahmen für die Zeichenerkennung vorgelegt werden sollen.
2. Die Vorrichtung des Anspruchs 1, wobei die Nachzieh- Schaltung auch für das Nachziehen in einer dritten und einer vierten Richtung sorgt, wobei die dritte Richtung parallel und entgegengesetzt zur ersten Richtung ist und die vierte Richtung parallel und entgegengesetzt zur zweiten Richtung ist, wobei die Ecken-Ermittlungs-Schaltung Ecken auf der Grundlage des Schnittpunkts der Ränder der in der dritten und der vierten Richtung nachgezogenen Zeichenelemente ermittelt, und wobei die Rahmen-Vorrichtung einen Kandidat-Zeichenrahmen erzeugt, indem sie eine als Reaktion auf das Nachziehen in der ersten und der zweiten Richtung ermittelte Ecke zu einer als Reaktion auf das Nachziehen in der dritten und der vierten Richtung ermittelten Ecke anpaßt.
3. Die Vorrichtung des Anspruchs 2, wobei die Rahmen- Vorrichtung Kandidat-Zeichenrahmen auf der Grundlage ihrer Beziehung zur Zeichengröße bewertet und die Bewertungen den Entscheidungsschaltkreisen zuführt, und wobei die Entscheidungsschaltkreise die Bewertungen verwenden, um zu bestimmen, welche Zeichenrahmen für die Zeichenerkennung vorgelegt werden sollen.
4. Die Vorrichtung des Anspruchs 3, wobei die Entscheidungsschaltkreise zu einem Kandidat-Zeichenrahmen in Abhängigkeit davon, ob er sich an einem erwarteten Ort befindet, eine Bonusbewertung addieren, wobei der resultierende höchst-bewertete Kandidat-Zeichenrahmen für die Zeichenerkennung vorgelegt wird.
5. Die Vorrichtung des Anspruchs 2 einschließlich eines an den Abtastungs-Puffer gekoppelten Strichbreitendetektors zur Bestimmung des potentiellen Vorhandenseins eines Zeichens auf der Grundlage der Bestimmung, ob ein Bild Markierungen enthält, die Strichbreiten aufweisen, die auf das Vorhandensein eines Zeichens hindeuten, wobei die Ausgabe des Strichbreitendetektors den Entscheidungsschaltkreisen zugeführt wird.
6. Die Vorrichtung des Anspruchs 2 einschließlich eines an den Abtastungs-Puffer gekoppelten Lange-Vertikale-Markierung- Detektors zur Ermittlung langer vertikaler Markierungen, wobei die Ausgabe des Vertikale-Markierung-Detektors den Entscheidungsschaltkreisen zugeführt wird.
7. Die Vorrichtung des Anspruchs 2 einschließlich eines an die Nachzieh-Schaltung gekoppelten Rückweisungs-Kennzeichners zur Kennzeichnung von Markierungen, die viel größer sind als eine erwartete Zeichengröße, wobei die Ausgabe des Rückweisungs- Kennzeichners den Entscheidungsschaltkreisen zugeführt wird.
8. Ein elektronisch implementiertes Verfahren zur Ortung eines Zeichens in einer Reihe von Zeichen in einem Zeichenerkennungs-System, das folgendes umfaßt:
Abtastung der Reihe, um Bilder zu liefern, die Zeichenelemente enthalten;
Speicherung der Zeichenelemente;
Nachziehen der gespeicherten Elemente in mindestens einer ersten und einer zweiten Richtung, die unterschiedlich sind, wobei die erste Richtung parallel zur Reihe ist und die zweite Richtung senkrecht zur Reihe ist;
Ermittlung einer Ecke eines Zeichens auf der Grundlage des Schnittpunkts der Ränder der nachgezogenen Zeichenelemente in der ersten und der zweiten Richtung;
Filterung ermittelter Ecken, indem eine Dichtekontrolle in bezug auf eine ermittelte Ecke durchgeführt wird, um zu bestimmen, ob die Ecke gültig ist;
Erzeugung von Kandidat-Zeichenrahmen als Reaktion auf gültige ermittelte Ecken; und
Bestimmung, welche Zeichenrahmen für die Zeichenerkennung vorgelegt werden sollen, auf der Grundlage der Wahrscheinlichkeit, daß der Zeichenrahmen ein Zeichen enthält.
9. Das Verfahren des Anspruchs 8, wobei das Nachziehen die Zeichenelemente auch in einer dritten und einer vierten Richtung nachzieht, die sich von der ersten und der zweiten Richtung unterscheiden
10. Das Verfahren des Anspruchs 9, wobei die Zeichen in einer Reihe angeordnet sind, wobei die erste und die dritte Richtung parallel zur Reihe und zueinander entgegengesetzt sind, wobei die zweite und die vierte Richtung senkrecht zur Reihe und zueinander entgegengesetzt sind, wobei die Ermittlung eine Ecke auch auf der Grundlage des Schnittpunkts der Ränder der nachgezogenen Zeichenelemente in der dritten und der vierten Richtung ermittelt, und wobei die Erzeugung die Anpassung einer als Reaktion auf das Nachziehen in der ersten und der zweiten Richtung ermittelten Ecke zu einer als Reaktion auf das Nachziehen in der dritten und der vierten Richtung ermittelten Ecke einschließt.
11. Das Verfahren des Anspruchs 10, wobei das Nachziehen in der zweiten und der vierten Richtung circa eine Zeichenhöhe und in der ersten und der dritten Richtung circa eine Zeichenbreite beträgt.
12. Das Verfahren des Anspruchs 10, wobei die Erzeugung die Bewertung von Kandidat-Zeichenrahmen auf der Grundlage von Zeichengröße einschließt und bei dem die Bestimmung einen Zeichenrahmen zur Vorlage bei der Zeichenerkennung auf der Grundlage der Bewertung auswählt.
13. Das Verfahren des Anspruchs 12, wobei die Bestimmung das Addieren einer Bonusbewertung zu einem Kandidat-Zeichenrahmen in Abhängigkeit davon, ob er sich an einem erwarteten Ort befindet, einschließt.
DE69219346T 1991-09-06 1992-09-01 Zeichenortung für die Zeichenerkennung Expired - Fee Related DE69219346T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/755,722 US5267325A (en) 1991-09-06 1991-09-06 Locating characters for character recognition
PCT/US1992/007405 WO1993005607A1 (en) 1991-09-06 1992-09-01 Locating characters for character recognition

Publications (2)

Publication Number Publication Date
DE69219346D1 DE69219346D1 (de) 1997-05-28
DE69219346T2 true DE69219346T2 (de) 1997-11-20

Family

ID=25040369

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69219346T Expired - Fee Related DE69219346T2 (de) 1991-09-06 1992-09-01 Zeichenortung für die Zeichenerkennung

Country Status (5)

Country Link
US (1) US5267325A (de)
EP (1) EP0602180B1 (de)
JP (1) JP3209746B2 (de)
DE (1) DE69219346T2 (de)
WO (1) WO1993005607A1 (de)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0609474A1 (de) * 1993-02-03 1994-08-10 International Business Machines Corporation Verfahren und Vorrichtung zum Umsetzen eines Bildes zur Klassifizierung oder Mustererkennung
JP3237975B2 (ja) * 1993-09-20 2001-12-10 富士通株式会社 画像処理装置
EP0667533A3 (de) * 1994-02-14 1996-06-12 Hewlett Packard Co Signalverlustdetektor.
US5638459A (en) * 1994-09-20 1997-06-10 Neopath, Inc. Method and apparatus for detecting a microscope slide coverslip
JP2007503641A (ja) * 2003-08-25 2007-02-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 画像強調
KR100657915B1 (ko) * 2004-11-26 2006-12-14 삼성전자주식회사 코너 검출 방법 및 코너 검출 장치
US20070071324A1 (en) * 2005-09-27 2007-03-29 Lexmark International, Inc. Method for determining corners of an object represented by image data
KR100833346B1 (ko) 2007-01-03 2008-05-28 (주)폴리다임 디스플레이 장치에 표시된 문자 이미지의 픽셀 단위 가로폭 측정 방법
US20130156288A1 (en) * 2011-12-19 2013-06-20 De La Rue North America Inc. Systems And Methods For Locating Characters On A Document
US11010768B2 (en) * 2015-04-30 2021-05-18 Oracle International Corporation Character-based attribute value extraction system
CN111563512B (zh) * 2020-04-30 2024-03-08 广东小天才科技有限公司 一种答案自动涂抹的方法、装置、电子设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4517607A (en) * 1981-11-09 1985-05-14 Ricoh Company, Ltd. Method of and apparatus for compensating image in image reproduction system
US4897806A (en) * 1985-06-19 1990-01-30 Pixar Pseudo-random point sampling techniques in computer graphics
US4748507A (en) * 1986-10-17 1988-05-31 Kenneth Gural Solid state imaging device having means to shift the image between scans and associated circuitry to improve the scanned image
US5144682A (en) * 1987-03-05 1992-09-01 Ricoh Company, Ltd. Method and an apparatus for isolating an area corresponding to a character or word
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
JPH01168163A (ja) * 1987-12-23 1989-07-03 Fuji Xerox Co Ltd 画像処理装置
JPH06101049B2 (ja) * 1988-03-25 1994-12-12 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 文字列検出方法
US5038381A (en) * 1988-07-11 1991-08-06 New Dest Corporation Image/text filtering system and method
US5048100A (en) * 1988-12-15 1991-09-10 Michael Kuperstein Self organizing neural network method and system for general classification of patterns
JP2597006B2 (ja) * 1989-04-18 1997-04-02 シャープ株式会社 矩形座標抽出方法
US5142273A (en) * 1990-09-20 1992-08-25 Ampex Corporation System for generating color blended video signal

Also Published As

Publication number Publication date
JP3209746B2 (ja) 2001-09-17
US5267325A (en) 1993-11-30
WO1993005607A1 (en) 1993-03-18
DE69219346D1 (de) 1997-05-28
EP0602180B1 (de) 1997-04-23
EP0602180A1 (de) 1994-06-22
JPH06510387A (ja) 1994-11-17

Similar Documents

Publication Publication Date Title
DE2801536C2 (de) Zeichenformkodiervorrichtung
DE3926327C2 (de) Verfahren und System zum Erkennen von Zeichen auf einem Medium
DE3615906C2 (de)
DE69535098T2 (de) Verfahren und -vorrichtung zur Suche von Bildern in einer Datenbank
DE3785440T2 (de) Optische abtastvorrichtung mit ortungsfuehlern.
DE3883578T2 (de) Verfahren und Gerät zur Erkennung von gedruckten Zeichen auf einem Beleg.
DE3013833C2 (de) Vorrichtung zur Prüfung eines auf einem Gegenstand befindlichen Musters auf Fehler
DE69219346T2 (de) Zeichenortung für die Zeichenerkennung
DE3722444A1 (de) Verfahren und vorrichtung zum erzeugen von entwurfsmusterdaten
DE19500382A1 (de) Verfahren und Einrichtung zum Kompensieren von Substratverzerrungen in einem automatischen optischen Prüfsystem für Leiterplatten
DE19960555A1 (de) Verfahren zum Auffinden und Lesen eines zweidimensionalen Strichcodes
DE3879609T2 (de) Verfahren und Vorrichtung zum Erkennen von kennzeichnenden Unterschieden in einem Blattmaterial.
DE2624185A1 (de) Lichtgriffel fuer gasentladungsanzeigen
DE2410306C3 (de) Anordnung zur Einstellung eines Abtastrasters oder einer Erkennungslogik auf die Schräglage von abzutastenden bzw. zu erkennenden Zeichen
EP0301384A2 (de) Schaltungsanordnung zur Aufbereitung von schrägstehenden, insbesondere handgeschriebenen Zeichen
DE3239938C2 (de)
DE68913475T2 (de) Verfahren zum Durchsuchen einer Matrix binärer Daten.
EP1578609B1 (de) Verfahren und vorrichtung zur echzeitkontrolle von druckbildern
DE4107020A1 (de) Verfahren zur zweidimensionalen speicherung von daten auf einem bedruckbaren oder fotografisch entwickelbaren medium
DE3414455C2 (de) Verfahren und Vorrichtung zum Lesen und Verarbeiten von Information, die aus dekodierbarer Schriftinformation und/oder nichtdekodierbarer Graphikinformation besteht
DE2064469A1 (de) Mustererkennungseinrichtung
DE3128794A1 (de) Verfahren zum auffinden und abgrenzen von buchstaben und buchstabengruppen oder woertern in textbereichen einer vorlage, die ausser textbereichen auch graphik-und/oder bildbereiche enthalten kann.
DE3823622C2 (de)
DE3830990C2 (de)
DE69122915T2 (de) Verfahren zur Aufbereitung von Matrixzeichen mit kleinen Abmessungen mittels verbundener Pixelreihen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee