DE69219346T2 - Zeichenortung für die Zeichenerkennung - Google Patents
Zeichenortung für die ZeichenerkennungInfo
- Publication number
- DE69219346T2 DE69219346T2 DE69219346T DE69219346T DE69219346T2 DE 69219346 T2 DE69219346 T2 DE 69219346T2 DE 69219346 T DE69219346 T DE 69219346T DE 69219346 T DE69219346 T DE 69219346T DE 69219346 T2 DE69219346 T2 DE 69219346T2
- Authority
- DE
- Germany
- Prior art keywords
- character
- corner
- directions
- frame
- tracing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 claims description 16
- 238000000034 method Methods 0.000 claims description 14
- 239000012723 sample buffer Substances 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims 1
- 238000009432 framing Methods 0.000 claims 1
- 238000005070 sampling Methods 0.000 claims 1
- 239000000523 sample Substances 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 230000015654 memory Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 3
- 206010027146 Melanoderma Diseases 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
- Diese Erfindung betrifft im allgemeinen Zeichenerkennungs- Systeme und -verfahren und im besonderen verbesserte Mittel und Verfahren zur Ortung von Zeichen auf einem Dokument als Vorbereitung für die Anwendung von Zeichenerkennungs-Methoden auf die georteten Zeichen.
- Bei vielen Zeichenerkennungs-Systemen liegt ein kritisches Problem in der Ortung von Zeichen, die unter Verwendung von Zeichenerkennungs-Methoden automatisch gelesen werden sollen. Dieses Problem wird besonders ernst, wenn es sich um einen Druck von schlechter Qualität handelt, wie zum Beispiel unvollständige Zeichen oder Papierrauschen.
- Es ist demgemäß eine generelle Aufgabe der vorliegenden Erfindung, verbesserte Mittel und Verfahren zur Ortung von Zeichen in einem Zeichenerkennungs-System vorzusehen.
- Eine spezifischere Aufgabe der Erfindung besteht darin, verbesserte Mittel und Verfahren zur Ortung von Zeichen vorzusehen, wenn es sich um einen Druck von schlechter Qualität handelt.
- Eine andere Aufgabe der Erfindung gemäß den vorangehenden Aufgaben besteht darin, für die Implementierung von Zeichenortung in einer relativ einfachen und ökonomischen Weise zu sorgen.
- In einer bestimmten bevorzugten Ausführungsform der Erfindung werden Zeichen unter Verwendung einer neuartigen Herangehensweise geortet, bei der ein Bild, das potentielle Zeichenelemente enthält, in Richtung nach oben, nach unten, nach links und nach rechts verschmiert (nachstehend auch nachgezogen) wird. Das resultierende nachgezogene Bild wird dann verwendet, um Kandidat-Zeichenrahmen zu erzeugen, die auf der Grundlage davon, wie gut sie der Zeichengröße entsprechen, bewertet werden. Diese Kandidat-Zeichenrahmen werden dann auf der Grundlage davon, ob sie sich an korrekten Orten befinden, zum Zweck der Auswahl der zur Zeichenerkennung vorzulegenden bestimmten Zeichenrahmen weiter bewertet.
- Die spezifische Beschaffenheit der Erfindung sowie andere Aufgaben, Merkmale, Verwendungen und Vorteile werden aus der folgenden detaillierten Beschreibung ersichtlich werden, wenn sie in Verbindung mit den beiliegenden Zeichnungen betrachtet wird.
- Fig. 1 ist ein Gesamtblockschaltbild eines Zeichenerkennungs-Systems, in das die Erfindung integriert ist.
- Fig. 2. ist ein Blockschaltbild, das eine bevorzugte Ausführungsform des in Fig. 1 gezeigten Zeichen-Orters 12 veranschaulicht.
- Fig. 3 ist eine Prinzipskizze, die eine Reihe von Zeichen auf einem Dokument sowie ein Abtastband, das im typischen Fall zur Abtastung dieser Zeichen verwendet wird, veranschaulicht.
- Fig. 4 ist ein Diagramm, das veranschaulicht, wie ein Pixelbild, das das Zeichen "6" enthält, im typischen Fall gemäß der Erfindung in Richtung nach oben und nach links nachgezogen werden kann.
- Fig. 5 ist eine mit Fig. 4 verbundene Legende.
- Fig. 6 ist ein Blockschaltbild, das eine bevorzugte Ausführungsform der Rahmen-Vorrichtung 26 in Fig. 2 zeigt.
- Fig. 7 ist eine Tabelle, die typische horizontale Koordinaten veranschaulicht, die für die durch die in Fig. 6 veranschaulichte Rahmen-Vorrichtung gelieferte Paarung gelten.
- Fig. 8 veranschaulicht ein Bevorzugter-Zustand-Diagramm für die Rahmen-Vorrichtungs-Ausgangssteuerung 48 in Fig. 6.
- Fig. 9 ist eine Tabelle, die die Bedeutungen verschiedener in Fig. 8 verwendeter Abkürzungen darlegt.
- Fig. 10 veranschaulicht ein Bild, das einen gültigen langen vertikalen Markierer (LVM) enthält.
- Fig. 11 veranschaulicht ein Bild, das einen ungültigen langen vertikalen Markierer (LVM) enthält.
- Fig. 12 ist ein Blockschaltbild, das eine bevorzugte Ausführungsform der Ausgangs-Entscheidungs-Schaltkreise 50 in Fig. 2 veranschaulicht.
- Fig. 13 ist ein Ablaufdiagramm, das relevante typische Außen-Feld-Funktionen, die durch die Ausgangs-Entscheidungs- Schaltkreise 50 in Fig. 12 ausgeführt werden, allgemein veranschaulicht.
- Fig. 14 ist ein Ablaufdiagramm, das relevante typische Feld-interne Funktionen, die durch die Ausgangs-Entscheidungs- Schaltkreise 50 in Fig. 12 ausgeführt werden, allgemein veranschaulicht.
- Gleiche Kennziffern beziehen sich bei allen Figuren der Zeichnungen auf gleiche Elemente.
- Es soll allgemein verstanden werden, daß hier beschriebene Vorrichtungen und Verfahren, sofern nicht anders angegeben, so aufgebaut werden und so arbeiten, wie zur Zeit im Stand der Technik bekannt.
- Bezugnehmend anfangs auf Fig. 1: Bild-Erfassungs-Modul 10 liefert Videobilder 10a, die der Abtastung einer Reihe von Zeichen, die auf einem Dokument enthalten sind, entsprechen. Diese Videobilder 10a werden einem Zeichen-Orter 12 zugeführt. Der Grundbetrieb des Zeichen-Orters 12 besteht darin, Zeichen in den zugeführten Videobildern 10a zu orten und Signale 12a an Zeichenerkennungs-Schaltkreise 14 zur Erkennung der georteten Zeichen zu senden. Außerdem liefert Bild-Erfassungs-Modul 10 Signale 10b, die Dokument-Anwesenheit und verschiedene Bild- Eigenschaften, wie zum Beispiel Kontrast, angeben, an Zeichen- Orter 12. Der Leser wird verstehen, daß das Bild-Erfassungs- Modul 10 und die Erkennungs-Schaltkreise 14 herkömmlicher Art sein können und demgemäß hier nicht weiter beschrieben werden sollen.
- Die durch die Zeichenerkennungs-Schaltkreise 14 erkannten Zeichen werden im typischen Fall an eine Computer-Verarbeitungs- Einheit (CPU) 15 geliefert, wie in Fig. 1 gezeigt. Die CPU 15 liefert außerdem im typischen Fall Initialisierungs- und andere Signale 15b, wie zum Beispiel Zeichengröße, Schrifttypen usw., an den Zeichen-Orter 12. Der Zeichen-Orter 12 liefert außerdem Ausgangssignale 12b, die besondere Zeichen-Ort-Eigenschaften angeben, an die CPU 15.
- Das durch das Bild-Erfassungs-Modul 10 gelieferte Videobild 10a kann im typischen Fall pro Abtastung 128 "aktive" Pixels und mindestens 14 "inaktive" Pixels enthalten. Ein Pixel stellt im typischen Fall eine Bildfläche dar, die 4,6875 Mil ( 119 mm) hoch mal 4,26 Mil ( 108 mm) breit ist.
- Fig. 2 veranschaulicht eine bevorzugte Ausführungsform des in Fig. 1 gezeigten Zeichen-Orters 12. Es ist aus Fig. 2 zu ersehen, daß das Videobild 10a aus dem Bild-Erfassungs-Modul 10 in Fig. 1 an eine Dynamisches-Abtastband-Schaltung 16 geliefert wird, die im typischen Fall ein Abtastband liefert, das 0.6 Zoll (15,24 mm) hoch ist und in vertikaler Richtung 128 Pixels umfaßt. Wie gut bekannt ist, steuert die Dynamisches-Abtastband- Schaltung 16 die Höhe des Abtastbands (Abtaster-Blickfeld), die im typischen Fall so gewählt wird, daß verhindert wird, daß eventuell vorhandene schwarze Markierungen nahe den Randzonen des Abtastbands die Ortsermittlung stören. Im typischen Fall geschieht dies, indem alle Pixels außerhalb eines vorbestimmten Bereichs des Interesses auf Weiß geschaltet werden. Die Höhe des Abtastbands kann durch CPU-Ausgabe 16a (Fig. 1) oder durch die Ausgabe 50b aus Ausgangs-Entscheidungs-Schaltkreisen 50, die im folgenden beschrieben werden sollen, gesteuert werden.
- Ein Abtastungs-Puffer 18 in Fig. 2 speichert und aktualisiert sechsunddreißig Abtastungen, die von der Dynamisches- Abtastband-Schaltung 16 empfangen werden, kontinuierlich, wobei jede Abtastung 128 Pixels in der vertikalen (Spalten-) Richtung umfaßt. Fig. 3 veranschaulicht typische Rechts-nach-links- Spaltenabtastung eines Dokuments 11, die durch Abtastungs-Puffer 18 geliefert wird. Zu jeder Pixel-Zeit wird eine ganze Zeile des Abtastungs-Puffers 18, die ein Pixel von jeder der gespeicherten sechsunddreißig Abtastungen darstellt, als eine Puffer-Ausgabe 18a zur Verfügung gestellt.
- Die Abtastungs-Puffer-Ausgabe 18a wird einer Nachzieh- Schaltung 20 zugeführt, die so arbeitet, daß sie im Bild enthaltene schwarze Pixels (potentielle Zeichenelemente) in vier Richtungen, nach oben, nach unten, nach links und nach links, nachzieht. Das durch die Nachzieh-Schaltung 20 gelieferte Nachziehen erstreckt sich vorzugsweise im typischen Fall um eine Zeichenhöhe nach oben und nach unten und um eine Zeichenbreite nach links und nach rechts.
- Fig. 4 veranschaulicht das Nachziehen von Pixels, die ein Zeichen "6" bilden, in Richtung nach oben und nach links. Obwohl sie in Fig. 4 nicht gezeigt ist, geschieht das Nachziehen in Richtung nach unten und nach rechts in einer ähnlichen Weise. Wie aus Fig. 4 ersichtlich sein wird, wird das Nachziehen bewerkstelligt, indem die m aufeinanderfolgenden Pixels, die, in der Richtung des Nachziehens gesehen, auf ein schwarzes Pixel folgen, auf Schwarz gestellt werden, wobei m die Länge des Nachziehens ist. Fig. 5 ist eine Legende, die für Fig. 4 gilt.
- Das durch die Nachzieh-Schaltung 20 in Fig. 2 erzeugte resultierende in 4 Richtungen nachgezogene Bild 20a wird einer Ecken-Ermittlungs-Schaltung 22 zur Ermittlung des oberen, des unteren, des linken und des rechten Rands eines Zeichens zugeführt. Dies wird bewerkstelligt, indem das Nach-oben- Nachziehen und das Nach-unten-Nachziehen verwendet werden, um einen linken und einen rechten Rand zu erzeugen, und indem das Nach-links-Nachziehen und das Nach-rechts-Nachziehen verwendet werden, um einen oberen und einen unteren Rand zu erzeugen. Zum Beispiel veranschaulicht Fig. 4, wie ein linker Rand und ein oberer Rand bei einem Nach-oben-Nachziehen und bei einem Nach- links-Nachziehen des Zeichens "6" bestimmt werden. Bei jeder Zeile des nach oben nachgezogenen Bilds wird eine vertikale Linie 24 in die am weitesten links befindliche Spalte, die ein schwarzes Pixel enthält, gesetzt. Der linke Rand des nachgezogenen Bilds ist dann die am weitesten links befindliche vertikale Linie 24'. Bei jeder Spalte des nach links nachgezogenen Bilds wird eine horizontale Linie 26 in die oberste Zeile, die ein schwarzes Pixel enthält, gesetzt. Der obere Rand ist dann die oberste horizontale Linie 26'.
- Die Ecken-Ermittlungs-Schaltung 22 ermittelt eine Ecke auf der Grundlage der Schnittpunkte der Ränder der nachgezogenen Zeichenpixels. Zum Beispiel wird dies in Fig. 4 durch die obere linke Ecke 28 veranschaulicht, die durch den Schnittpunkt des linken Rands 24' und des oberen Rands 26' gebildet wird. Der Leser wird verstehen, daß die anderen drei Ecken in einer ähnlichen Art und Weise gefunden werden.
- Spezifischer ausgedrückt, die Ecken-Ermittlungs-Schaltung 22 sorgt in der folgenden Weise für die Ermittlung von Ecken an Hand der Schnittpunkte von Rändern:
- Obere linke Ecken (TLCs) sind die Schnittpunkte von an Hand des Nach-links-Nachziehens gefundenen oberen Rändern mit an Hand des Nach-oben-Nachziehens gefundenen linken Rändern.
- Obere rechte Ecken (TRCs) sind die Schnittpunkte von an Hand des Nach-rechts-Nachziehens gefundenen oberen Rändern mit an Hand des Nach-oben-Nachziehens gefundenen rechten Rändern.
- Untere linke Ecken ((BLCs) sind die Schnittpunkte von an Hand des Nach-links-Nachziehens gefundenen unteren Rändern mit an Hand des Nach-unten-Nachziehens gefundenen linken Rändern.
- Untere rechte Ecken (BRCs) sind die Schnittpunkte von an Hand des Nach-rechts-Nachziehens gefundenen unteren Randern mit an Hand des Nach-unten-Nachziehens gefundenen rechten Rändern.
- Boolesche Funktionen, um Ecken zu finden, sind unten angegeben, wobei:
- m = Zeilen-Ort des Pixels
- n = Spalten-Ort des Pixels
- U = nach oben nachgezogenes Bild
- D = nach unten nachgezogenes Bild
- R = nach rechts nachgezogenes Bild
- L = nach links nachgezogenes Bild
- HR = um halbe Breite nach rechts nachgezogenes Bild
- HRE = Freigabe für Nachziehen um eine halbe Breite nach rechts
- HL = um halbe Breite nach links nachgezogenes Bild
- HLE = Freigabe für Nachziehen um eine halbe Breite nach links
- ' = Komplement des Pixelwerts
- TRCmn = (Umn U'm(n+1)) (Rmn R'(m+1)n + HRmn HR'(m+1)n HRE) = Umn U'm(n+1) Rmn R'(m+1)n + Umn U'm(n+1) Hrmn HR'(m+1)n HRE
- TLCmn = (Umn U'm(n-1)) (Lmn L'(m+1)n + HLmn HL'(m+1)n HLE) = Umn U'm(n-1) Lmn L'(m+1)n + Umn U'm(n-1) HLmn HL'(m+1)n HLE
- BRCmn = (Dmn D'm(n+1)) (Rmn R'(m-1)n + HRmn HR'(m-1)n HRE) = Dmn D'm(n+1) Rmn R'(m-1)n + Dmn D'm(n+1) HRmn HR'(m-1)n HRE
- BLCmn = (Dmn D'm(n-1)) (Lmn L'(m-1)n + HLmn HL'(m-1)n HLE) = Dmn D'm(n-1) Lmn L'(m-1)n + Dmn D'm(n-1) HLmn HL'(m-1)n HLE
- Um mit der Beschreibung der bevorzugten Ausführungsform des Zeichen-Orters 12 in Fig. 2 fortzufahren: Die Ausgabe 22a der Ecken-Ermittlungs-Schaltung 22 wird zusammen mit der Abtastungs- Puffer-Ausgabe 18a einem Eckenfilter 25 zugeführt, das eine Dichtekontrolle in bezug auf mindestens eine ermittelte Ecke durchführt, um zu bestimmen, ob die Ecke gültig ist. Dies kann im typische Fall bewerkstelligt werden, indem bestimmt wird, ob eine Schwellen-Anzahl von Pixels (die auf das Vorhandensein eines Zeichens hindeutet) innerhalb eines rechteckigen Bereichs, der durch die Ecke begrenzt wird und der der Größe eines Zeichens in etwa entspricht, enthalten ist, um dadurch zu verhindern, daß Störrauschen die Ermittlung einer gültigen Ecke ergibt. Zum Beispiel kann mit Bezug auf Fig. 4 ein typischer für diese Schwellen (Dichte) -Messung verwendeter rechteckiger Bereich 18 x 24 Pixel umfassen (ungefähr die Größe eines Zeichens), die durch die durch den Schnittpunkt des linken Rands 24' und des oberen Rands 26' gebildete Ecke begrenzt sind.
- Wie in Fig. 2 veranschaulicht, empfängt eine Rahmen- Vorrichtung 26 die Ausgabe 25a vom Eckenfilter 25 und die Ausgabe 22a von der Ecken-Ermittlungs-Schaltung 22a. Ecken, die die Dichtekontrolle des Eckenfilters 25 nicht bestehen, werden verworfen. Der Zweck der Rahmen-Vorrichtung 26 besteht darin, gültige Ecken, die durch Ecken-Ermittlungs-Schaltung 24 ermittelt werden, zu verwenden, um gültige Rahmen zu erzeugen, die auf der Grundlage von Zeichengröße bewertet werden und dann über die Rahmen-Vorrichtungs-Ausgabe 26a den Ausgangs- Entscheidungs-Schaltkreisen 50 als bewertete Kandidat- Zeichenrahmen übermittelt werden. Zur Rahmen-Vorrichtungs- Ausgabe 26a gehören auch Positions- und Status-Informationen (wie zum Beispiel Dokument-Anwesenheit und Schrifttyp) in der Form von Abtastungs-Separatoren. Eine bevorzugte Ausführungsform der Rahmen-Vorrichtung 26 wird in Fig. 6 veranschaulicht.
- Mit Bezug auf die in der Fig. 6 gezeigten bevorzugten Ausführungsform der Rahmen-Vorrichtung 26: Informationen über die obere linke Ecke (TLC) und über die untere rechte Ecke (BRC) werden einer Rahmen-Vorrichtungs-Eingangssteuerung 40 zugeführt. Von dort aus werden BRC-Koordinaten und Separatoren im Untererechte-Ecke-FIFO-Speicher 42 geschrieben, und potentielle zugehörige TLC-Koordinaten werden gleichzeitig im Obere-linke- Ecke-FIFO-Speicher Nr. 1 (44) und im Obere-linke-Ecke-FIFO- Speicher Nr. 2 (46) geschrieben. Die horizontale Komponente aller Koordinaten muß nur 6 Bits einer auf den rechten Rand des Dokuments 11 (Fig. 3) bezogenen absoluten Abtastungszahl enthalten. Die Rahmen-Vorrichtungs-Eingangssteuerung 40 liefert auch zweckentsprechende Rücksetz- und Schreibsignale für die FIFO-Speicher 42, 44 und 46, wie in Fig. 6 gezeigt.
- Die Rahmen-Vorrichtungs-Ausgangssteuerung 48 liest BRCs und Separatoren vom BRC-FIFO-Speicher 42. Separatoren werden direkt an die Ausgangs-Entscheidungs-Schaltung 50 (Fig. 2) gesandt. Jede BRC wird mit jeder im zweckentsprechenden TLC-FIFO-Speicher 44 oder 46 enthaltenen TLC einzeln gepaart. Typische horizontale Koordinaten werden in Fig. 7 veranschaulicht.
- Es ist in Fig. 7 zu beachten, daß eine BRC bei den ersten 32 Abtastungen (Hexadezimal-Abtastungen 00 bis einschließlich 1F) allen im TLC-FIFO-Speicher Nr. 1 (TL1) enthaltenen TLCs angepaßt wird, während eine BRC aus den nächsten 32 Abtastungen (Hexadezimal-Abtastungen 20 bis einschließlich 3F) allen im TLC- FIFO-Speicher Nr. 2 (TL2) enthaltenen TLCs angepaßt wird. Falls ein gegebenes BRC/TLC-Paar einen Rahmen der korrekten Höhe und Breite für eine bestimmte Schriftart bildet und falls die gegenüberliegenden Ecken BLC und TRC existieren, dann erzeugt das Paar einen gültigen Rahmen. Es ist auch in bezug auf Fig. 7 zu beachten, daß die Ecken in TL1 und TL2 alle 40 Hexadezimal- Abtastungen gelöscht werden, wobei TL1 bei den Hexadezimal- Abtastungen 0, 40 usw. zuruckgesetzt wird und TL2 bei den Hexadezimal-Abtastungen 20, 60 usw. zurückgesetzt wird.
- Zusammenfassend dient die Rahmen-Vorrichtungs-Ausgangssteuerung 48 in Fig. 6 dazu: (1) Abtastungs-Separatoren an die Ausgangs-Entscheidungs-Schaltung 50 in Fig. 2 zu übermitteln, (2) jede untere rechte Ecke (BRC) mit jeweiligen oberen linken Ecken (TLCs) vom ausgewählten FIFO-Speicher 44 oder 46 zu paaren, (3) potentiell gültige Rahmen an Hand von TLC-und-BRC- Ecken-Paaren, die eine zulässige Breite und Höhe für die ausgewählte Schriftart aufweisen, zu bestimmen, (4) gültige Rahmen aus diesen potentiell gültigen Rahmen auf der Grundlage des Vorhandenseins der anderen zwei Ecken BLC und TRC des Rahmens auszuwählen, (5) diese gültigen Rahmen auf der Grundlage davon, wie gut sie der Zeichengröße entsprechen, zu bewerten und (6) diese bewerteten gültigen Rahmen als Kandidat-Zeichenrahmen an die Ausgangs-Entscheidungs-Schaltkreise (50) (Fig. 2) zu senden. Wie in Fig. 6 gezeigt, liefert die Rahmen-Vorrichtungs- Ausgangssteuerung 48 zweckentsprechende Lese- und Weiterübertragungssignale an die FIFO-Speicher 42, 44 und 46 zur Steuerung der Zuleitung von TLC-, BRC- und Abtastungs-Separatorsignalen zu diesen, während die FIFO-Speicher 42, 44 und 46 zweckentsprechende Datenvorhandenseinssignale an die Rahmen-Vorrichtungs- Ausgangssteuerung 48 liefern, um anzugeben, wenn Daten vorhanden sind, wie auch in Fig. 6 gezeigt, und die Rahmen-Vorrichtungs- Eingangssteuerung 40 Auswählsignale 40a an die Rahmen-Vorrichtungs-Ausgangssteuerung 48 zur Verwendung durch diese bei der Auswahl des korrekten oberen linken FIFO-Speichers 44 oder 46 liefert.
- Ein Bevorzugter-Zustand-Diagramm für die Rahmen-Vorrichtungs-Ausgangssteuerung 48 in Fig. 6 wird in Fig. 8 veranschaulicht. Fig. 9 ist eine Tabelle, die die Bedeutungen von verschiedenen in Fig. 8 verwendeten Abkürzungen darlegt. Die Bewertung von gültigen Rahmen kann im typischen Fall gemäß der folgenden Gleichung erfolgen:
- Bewertung = 100 - [2 * abs (Schriftbreite - Rahmenbreite) + 3 * abs (Schrifthöhe - Rahmenhöhe)]
- Um auf Fig. 2 zurückzukommen, ist zu ersehen, daß die Ausgabe 26a der soeben erwähnten Rahmen-Vorrichtung 26 der Ausgangs-Entscheidungs-Schaltung 50 zugeführt wird. Der Ausgangs- Entscheidungs-Schaltung 50 zugeführt werden auch Ausgaben aus einen Rückweisungs-Kennzeichner 52, einem Strichbreitenmesser 54 und einem Lange-Vertikale-Markierung-Detektor 56. Diese Komponenten 52, 54 und 56 werden zusammen mit den durch die Rahmen- Vorrichtung 26 gelieferten bewerteten Kandidat-Zeichenrahmen zur Verwendung durch die Ausgangs-Entscheidungs-Schaltung 50 bei der Bestimmung, welche Zeichenrahmen letztlich an die Zeichenerkennungs-Schaltkreise 14 (Fig. 1) gesandt werden, und auch bei der Bestimmung der bestimmten Signale, die an die CPU (Fig. 1) gesandt werden sollen, geliefert.
- Der Rückweisungs-Kennzeichner 52 in Fig. 2 arbeitet als Reaktion auf die Abtastungs-Puffer-Ausgabe 18a und auf die Nachzieh-Schaltungsausgabe 20b, um Markierungen zu kennzeichnen, die viel größer sind als eine erwartete Zeichengröße und deshalb unter Verwendung der vorstehend beschriebenen Nachziehen- Herangehensweise vielleicht keinen gültigen Zeichenrahmen erzeugen würden. Um diese Markierungen zu ermitteln, verwendet der Kennzeichner 52 ein Fenster mit den Abmessungen 1 Pixel breit mal die nicht-lesbare Minimalhöhe (die Höhe des kleinsten Zeichens im Zeichensatz). Dieses 1-Pixel-breite Fenster wird über jede Spalte eines (durch Nachzieh-Schaltungsausgabe 20b gelieferten) nach rechts nachgezogenen Bilds nach oben geführt. Falls das Fenster irgendwann mit einer Schwellen-Anzahl von schwarzen Pixels gefüllt ist, wird die betreffende Spalte gekennzeichnet. Außerdem wird bei jeder gekennzeichneten Spalte beim ersten und beim letzten Mal, daß das Fenster die Schwellen- Anzahl von schwarzen Pixels enthielt, die oberste Zeile des Fensters gespeichert. Eine Kennzeichner-Ausgabe 52a liefert die Resultate dieser Operationen an die Ausgangs-Entscheidungs- Schaltkreise 50 zur Verwendung bei der Bestimmung, welche der Zeichenrahmen an die Zeichenerkennungs-Schaltkreise 14 (Fig. 1) gesandt werden sollen.
- Der Strichbreitenmesser 54 in Fig. 2 ist vorgesehen, um Situationen zu handhaben, bei denen ein gültiger Rahmen wegen des Vorhandenseins übermäßigen Papierrauschens (unerwünschter Markierungen) vielleicht nicht erkannt wird oder bei denen mehrere Zeichen miteinander verbunden sind oder bei denen sich eine unerwartete Markierung, wie zum Beispiel eine Unterschrift, ins Feld der Zeichen erstreckt. Der Grundzweck des Strichbreitenmessers 54 besteht darin, zu bestimmen, ob ein Zeichen vorhanden ist, obwohl es von der Rahmen-Vorrichtung 26 nicht gefunden wurde. Der Strichbreitenmesser 54 bestimmt, ob ein Zeichen vorhanden sein könnte, indem er bestimmt, ob es Markierungen innerhalb eines Rahmens gibt, die Strichbreiten aufweisen, die auf das Vorhandensein eines Zeichens hindeuten. Ein Beispiel einer Möglichkeit, das Vorhandensein solcher Strichbreiten zu bestimmen, besteht darin, ein Fenster mit den Abmessungen zwei Pixel hoch mal ein Pixel breit vorzusehen, das über jede Abtastung nach oben bewegt wird. Immer wenn zwei aufeinanderfolgende schwarze Pixels (die minimale Zeichenstrichbreite) dazu führen, daß das Fenster gefüllt wird, wird ein Zähler zurückgesetzt und eine Null für den Pixel-Ort gespeichert, der dem oberen Ende des Fensters entspricht. Falls das Fenster nicht zwei schwarze Pixels enthält, wird der Zähler erhöht und sein Wert gespeichert. Jeder gespeicherte Pixel-Ort enthält dann die Distanz über der nächsten strichbreitengroßen Markierung (dem nächsten schwarzen Fleck) in der Abtastung. Diese gespeicherten Werte erlauben die Durchführung einer Bestimmung, ob ein Zeichen vorhanden ist. Eine Strichbreitenmesser-Ausgabe 54a liefert die Resultate dieser Operationen an die Ausgangs-Entscheidungs- Schaltkreise 50, die diese Resultate verwenden, um auf der Grundlage von Zeichenmittenabstand und Vorherige-Zeichen-Informationen einen entsprechenden Zeichenrahmen an die Zeichenerkennungs-Schaltkreise 14 (Fig. 1) zu senden.
- Der Lange-Vertikale-Markierung-Detektor 56 in Fig. 2 arbeitet an der nicht nachgezogenen Abtastungs-Puffer-Ausgabe 18a vom Abtastungs-Puffer 18, um lange vertikale Markierungen (LVM) zu ermitteln, die wegen ihrer Geometrie unter Verwendung der vorstehend beschriebenen Nachziehen-Herangehensweise vielleicht keine Ecken liefern würden, die auf einen gültigen Rahmen hindeuten. Eine LVM kann im typischen Fall wie folgt definiert werden: (1) Sie enthält zwischen zwei und neun aufeinanderfolgende schwarze Spalten; (2) sie weist in den vier Spalten, die an ihren rechten Rand angrenzen, sowie in den vier Spalten, die an ihren linken Rand angrenzen, mindestens eine weiße Spalte auf. Eine schwarze Spalte, zum Beispiel, ist eine, die einen schwarzen Bereich aufweist, der 30 Pixels in einem 32-Pixel- Fenster enthält. Eine weiße Spalte, zum Beispiel, ist eine, die keine zwei aufeinanderfolgenden schwarzen Pixels zwischen dem höchsten oberen Ende und dem niedrigsten unteren Ende der schwarzen Bereiche in den schwarzen Spalten aufweist. Fig 10 veranschaulicht ein Beispiel einer gültigen LVM, während Fig. 11 eine ungültige LVM veranschaulicht. Der Lange-Vertikale- Markierung-Detektor 56 liefert eine Ausgabe 56a an die Ausgangs- Entscheidungs-Schaltkreise 50, die ermittelte LVM angibt.
- Die Ausgangs-Entscheidungs-Schaltkreise 50 in Fig. 2 sollen nun eingehender betrachtet werden. Es soll verstanden werden, daß der primäre Zweck der Ausgangs-Entscheidungs-Schaltkreise 50 darin besteht, als Reaktion auf die durch die Rahmen-Vorrichtung 26 gelieferten bewerteten Kandidat-Zeichenrahmen und auf die Ausgaben 52a, 54a und 56a des Rückweisungs-Kennzeichners 52, des Strichbreitenmessers 54 bzw. des Lange-Vertikale-Markierung- Detektors 56 Endbestimmungen von Zeichenrahmen, die an die Zeichenerkennungs-Schaltkreise 14 (Fig. 1) gesandt werden sollen, durchzuführen. Eine bevorzugte Ausführungsform der Ausgangs-Entscheidungs-Schaltkreise 50 soll als nächstes mit Bezug auf das in Fig. 12 gezeigte Block- und Prinzipschaltbild beschrieben werden.
- Die Ausgangs-Entscheidungs-Schaltkreise 50 weisen zwei Grundbetriebsmodi auf: (1) einen Außen-Feld-Modus (out-of field Modus) und (2) einen Feld-internen Modus (in-field Modus). Der Außen-Feld-Modus entspricht der Situation, in der noch kein gültiger Zeichenrahmen gefunden worden ist. Der Feld-interne Modus entspricht der Situation, in der mindestens ein gültiger Zeichenrahmen gefunden worden ist. Der Betrieb der Ausgangs- Entscheidungs-Schaltkreise 50 in bezug auf diese Modi wird durch einen Digital-Signal-Prozessor (DPS) 60 gesteuert. Zu den Entscheidungs-Ausgangs-Schaltkreisen 50 gehören auch ein Dualport- SRAM 66, ein Orter-FIFO-Speicher 68, ein Rahmen-Vorrichtungs- Daten-vorhanden-Anschluß 70, ein Programm-Speicher 72, ein Datenspeicher 74, ein Befehl/Antwort-Register 76, ein Dynamisches-Abtastband-Anschluß 78 und ein Zeichenerkennungs-Schaltkreise-Anschluß 80. Der Betrieb der bevorzugten Ausführungsform der in Fig. 12 gezeigten Ausgangs-Entscheidungs-Schaltkreise 50 in jedem Modus wird nun im Detail betrachtet.
- Das höchstwertige Bit eines in der Rahmen-Vorrichtungs- Ausgabe 26a gelieferten Daten-vorhanden-Signals wird überwacht. Falls sein Wert gleich eins ist, liest der DSP 60 ein Wort vom Rahmen-Vorrichtungs-FIFO-Speicher-Anschluß 62. Bit 15 dieses Worts gibt an, ob die restlichen Bits Status-Informationen über die aktuelle Abtastung enthalten (WT = 1) oder ob sie Informationen über einen in der aktuellen Abtastung gefundenen Rahmen enthalten (WT = 0). Im ersteren Fall gibt Bit 12 an, welche Schriftartparameter für die Abtastung gelten (F = 0, falls erste Schriftart, F = 1, falls zweite Schriftart), und Bit 13 gibt an, ob sich die aktuelle Abtastung innerhalb eines Dokuments befindet (DP = 1); im letzteren Fall geben Bits 0 bis einschließlich 6 die y-Koordinate der unteren rechten Ecke eines in der aktuellen Abtastung gefundenen Rahmens an, und Bits 7 bis einschließlich 13 enthalten die Grundbewertung dieses Rahmens. Ein Wort, das Status-Informationen enthält, wird am Anfang jeder Abtastung einmal vorkommen, wohingegen ein Wort, das Rahmen- Informationen enthält, bei jedem neuen, in der aktuellen Abtastung durch die Rahmen-Vorrichtung gefundenen Rahmen einmal vorkommen wird.
- Der Rahmen-Vorrichtungs-FIFO-Speicher-Anschluß 64 enthält ein zusätzliches Wort für jedes im Anschluß 61 gefundene Rahmen- Informationen-Wort. Bits 0 bis einschließlich 6 dieses Worts enthalten die y-Koordinate der oberen linken Ecke des Rahmens, und Bits 7 bis einschließlich 12 enthalten die horizontale Distanz zwischen der unteren rechten und der oberen rechten Ecke. Jedesmal wenn ein Rahmen-Vorrichtungs-Informationen-Wort aus dem Anschluß 62 gelesen wird, wird Rahmen-Vorrichtungs- Anschluß 64 gelesen, um eine eins-zu-eins Zuordnung unter diesen Wörtern aufrechtzuerhalten.
- Falls in der aktuellen Abtastung ein Kandidat-Zeichenrahmen gefunden wurde, dann werden die nächsten zehn Abtastungen nach dem besten Rahmen abgesucht, und das Verfahren tritt in den Feld-internen Modus (im folgenden beschrieben). Der Rahmen mit der höchsten Grundbewertung wird zentriert und über Ausgabe 50a zusammen mit der entsprechenden Abtastungs-Puffer-Ausgabe 18a an die Zeichenerkennungs-Schaltkreise 14 gesandt, wie in Fig. 2 angegeben.
- Falls kein Kandidat-Zeichenrahmen gefunden wurde, wird eine Kontrolle durchgeführt, um zu bestimmen, ob eine lange vertikale Markierung (LVM) ermittelt wurde. Dies wird bewerkstelligt, indem das SRAM 66 kontrolliert wird. Das SRAM 66 speichert Informationen, die die Ermittlung einer LVM durch den Lange- Vertikale-Markierung-Detektor 56 (Fig. 2) bei den vorherigen 64 Abtastungen angeben. Jede Abtastung erzeugt 128 Bytes Informationen. Bit 7 des ersten Bytes in einer Abtastung enthält eine Kennzeichnung (Flag R), die angibt, ob sich die Abtastung nahe zeichengroßen Daten befindet oder nicht (d. h. R = 1, falls sich irgendwo innerhalb der nächsten Nachzieh-Breite-Anzahl von Abtastungen etwas befindet, das so hoch ist wie das Zeichen mit der kleinsten Höhe bei der aktuellen Schriftart). Die restlichen 7 Bits geben den vertikalen Ort des oberen Endes des Rückweisungs-Minimalhöhe-Fensters an, wenn es zum ersten Mal mit einer Schwellen (Rückweisungs-Störabstand) -Anzahl von schwarzen Pixels gefüllt wird. Dieser Wert wird verwendet, um das ungefähre untere Ende des Rückweisungs-Bereichs zu finden. Das zweite Byte in einer Abtastung enthält in Bits 0 bis einschließlich 6 das absolute obere Ende des Rückweisungs- Bereichs, Bit 7 enthält eine Kennzeichnung (Flag L), die immer gesetzt wird, wenn die Abtastung Teil einer LVM ist. Bytes 2 bis einschließlich 127 enthalten in den niederwertigen 7 Bits einen Wert, der die vertikale Distanz über dem nächsten Vorkommen zweier aufeinanderfolgender schwarze Pixels in der betreffenden Spalte angibt. Das höchstwertige Bit enthält den eigentlichen Pixelwert, die Adressenbits 7 bis einschließlich 12 geben die Abtastungszahl an, und Bits 0 bis einschließlich 6 geben die Byte-Zahl innerhalb der Abtastung an.
- Falls eine LVM-Kennzeichnung in der Abtastung von Interesse gefunden wurde, wird über Ausgabe 50c (Fig. 2) ein LVM-Code an die CPU 15 (Fig. 1) gesandt. Die Suche nach einem potentiellen Rahmen wird dann im Außen-Feld-Modus am linken Rand der LVM weitergeführt.
- Falls weder ein potentieller Rahmen noch eine LVM gefunden wurde, sucht der DSP 60 das SRAM 66 ab, um zu bestimmen, ob eine Rückweisung durch den Rückweisungs-Kennzeichner 52 (Fig. 2) gekennzeichnet wurde, wobei das Resultat über Ausgabe 12a an die CPU 15 (Fig. 1) gesandt wird. Die Suche nach einem potentiellen Rahmen wird dann in der nächsten Spalte weitergeführt.
- Fig. 13 ist ein Ablaufdiagramm, das relevante typische Außen-Feld-Funktionen, die durch die Ausgangs-Entscheidungs- Schaltkreise 50 ausgeführt werden, allgemein veranschaulicht.
- Alle Kandidat-Zeichenrahmen werden auf die beste Bewertung hin geprüft, wobei dies in Spalten ab dem Ende des vorherigen Zeichens bis kurz nach der erwarteten Mitte des nächsten Zeichens geschieht. In Abhängigkeit von der Position der Rahmen in bezug auf das vorherige Zeichen werden Bonuspunkte zur Bewertung addiert. Die Schlußbewertung eines Kandidat- Zeichenrahmens wird somit die Summe der durch die Rahmen- Vorrichtung 26 gelieferten Bewertung, die auf der Zeichengröße basiert, und der durch die Ausgangs-Entscheidungs-Schaltkreise 50 gelieferten Bewertung, die darauf basiert, ob sich der Rahmen an seinem erwarteten Ort befindet (d. h. die auf dem Zeichenmittenabstand basiert), sein.
- Der resultierende höchstbewertete Kandidat-Zeichenrahmen wird dann gewählt, und alle nötigen Änderungen an seiner Höhe oder Breite werden unter Verwendung von Vorherige-Zeichen- Informationen durchgeführt. Rahmen werden in einem für die Zeichenerkennungs-Schaltkreise 14 zweckentsprechenden Kasten zentriert. Die Kastengrößen sind im typischen Fall in allen vier Richtungen 2 Pixel größer als die Schablonengröße, so daß die Erkennungs-Schaltkreise 14 das Zeichen um zwei Pixel nach oben, nach unten, nach links und nach rechts verschieben können.
- Eine LVM wird unabhängig von den Zeichenerkennungs- Schaltkreisen 14 erkannt. Falls der höchstbewertete Rahmen den Abmessungen einer LVM entspricht, wird der Rahmen als eine LVM erkannt. Falls ein Rahmen gefunden wird und seine Abmessungen denen einer LVM nicht entsprechen, wird das Gebiet zwischen dem linken Rand des vorherigen Zeichens und dem rechten Rand des aktuellen Zeichens auf eine LVM-Kennzeichnung hin kontrolliert. Falls kein Rahmen gefunden wird, dann wird das gesamte Suchgebiet auf das Vorhandensein einer LVM-Kennzeichnung hin kontrolliert. In all diesen Fällen, in denen eine LVM ermittelt wird, wird nur die CPU 15 (Fig. 1) benachrichtigt.
- Falls weder ein Rahmen noch eine LVM gefunden wurde, wird unter Verwendung des Mittenabstands und Informationen über das obere Ende und das untere Ende des vorherigen Rahmens ein potentieller Rahmen gebildet. Die durch den Strichbreitenmesser 54 (Fig. 2) gelieferte und im SRAM 66 gespeicherte Schwarze- Fleck-Zahl wird dann verwendet, um zu bestimmen, ob es in diesem Bereich strichbreitengroße Markierungen gibt. Falls es solche gibt, wird der Rahmen an die Erkennungs-Schaltkreise 14 gesandt. Anderenfalls wird der Feld-interne Modus aktiviert.
- Fig. 14 ist ein Ablaufdiagramm, das relevante typische Feld-interne Funktionen, die durch die Ausgangs-Entscheidungs- Schaltkreise 50 ausgeführt werden, allgemein veranschaulicht.
- Der Leser wird verstehen, daß die hier beschriebene bevorzugte Ausführungsform der Erfindung nur als Beispiel dient und daß die Erfindung viele Modifikationen und Variationen des Aufbaus, der Anordnung und der Verwendung zuläßt. Demgemäß soll für die vorliegende Erfindung gelten, daß sie alle Modifikationen und Variationen enthält, die im Schutzumfang der Erfindung, wie sie durch die angehängten Ansprüche definiert wird, liegen.
Claims (13)
1. Zeichenortungsvorrichtung zur Verwendung in einem
Zeichenerkennungs-System zur Erkennung einer Reihe von Zeichen,
wobei die Vorrichtung folgendes umfaßt:
Bild-Erfassungs-Mittel, das Bilder liefert, die der
Abtastung einer Reihe von Zeichen entsprechen, wobei eines oder
mehrere der Bilder Zeichenelemente enthalten;
ein Abtastungs-Puffer zur aufeinanderfolgenden Speicherung
von durch das Bild-Erfassungs-Mittel erzeugten Bildern;
eine an den Abtastungs-Puffer gekoppelte Nachzieh-Schaltung
zum Nachziehen von Zeichenelementen in einem Bild in einer
ersten und einer zweiten Richtung, wobei die erste Richtung
parallel zur Reihe ist und die zweite Richtung senkrecht zur
Reihe ist;
eine an die Nachzieh-Schaltung gekoppelte
Ecken-Ermittlungs-Schaltung zur Ermittlung einer Ecke auf der Grundlage des
Schnittpunkts der Ränder der nachgezogenen Zeichenelemente in
der ersten und der zweiten Richtung,
ein an die Ecken-Ermittlungs-Schaltung gekoppeltes
Eckenfilter zur Durchführung einer Dichtekontrolle in bezug auf
eine durch die Ecken-Ermittlungs-Schaltung ermittelte Ecke, um
zu bestimmen, ob die Ecke gültig ist,
eine an das Eckenfilter gekoppelter Rahmen-Vorrichtung zur
Erzeugung von Kandidat-Zeichenrahmen als Reaktion auf durch die
Ecken-Ermittlungs-Schaltung ermittelte gültige Ecken; und
an die Rahmen-Vorrichtung gekoppelte
Entscheidungsschaltkreise zur Bestimmung, welcher der Kandidat-Zeichenrahmen für
die Zeichenerkennung vorgelegt werden sollen.
2. Die Vorrichtung des Anspruchs 1, wobei die Nachzieh-
Schaltung auch für das Nachziehen in einer dritten und einer
vierten Richtung sorgt, wobei die dritte Richtung parallel und
entgegengesetzt zur ersten Richtung ist und die vierte Richtung
parallel und entgegengesetzt zur zweiten Richtung ist, wobei die
Ecken-Ermittlungs-Schaltung Ecken auf der Grundlage des
Schnittpunkts der Ränder der in der dritten und der vierten
Richtung nachgezogenen Zeichenelemente ermittelt, und wobei die
Rahmen-Vorrichtung einen Kandidat-Zeichenrahmen erzeugt, indem
sie eine als Reaktion auf das Nachziehen in der ersten und der
zweiten Richtung ermittelte Ecke zu einer als Reaktion auf das
Nachziehen in der dritten und der vierten Richtung ermittelten
Ecke anpaßt.
3. Die Vorrichtung des Anspruchs 2, wobei die Rahmen-
Vorrichtung Kandidat-Zeichenrahmen auf der Grundlage ihrer
Beziehung zur Zeichengröße bewertet und die Bewertungen den
Entscheidungsschaltkreisen zuführt, und wobei die
Entscheidungsschaltkreise die Bewertungen verwenden, um zu bestimmen, welche
Zeichenrahmen für die Zeichenerkennung vorgelegt werden sollen.
4. Die Vorrichtung des Anspruchs 3, wobei die
Entscheidungsschaltkreise zu einem Kandidat-Zeichenrahmen in
Abhängigkeit davon, ob er sich an einem erwarteten Ort befindet, eine
Bonusbewertung addieren, wobei der resultierende
höchst-bewertete Kandidat-Zeichenrahmen für die Zeichenerkennung vorgelegt
wird.
5. Die Vorrichtung des Anspruchs 2 einschließlich eines an
den Abtastungs-Puffer gekoppelten Strichbreitendetektors zur
Bestimmung des potentiellen Vorhandenseins eines Zeichens auf
der Grundlage der Bestimmung, ob ein Bild Markierungen enthält,
die Strichbreiten aufweisen, die auf das Vorhandensein eines
Zeichens hindeuten, wobei die Ausgabe des Strichbreitendetektors
den Entscheidungsschaltkreisen zugeführt wird.
6. Die Vorrichtung des Anspruchs 2 einschließlich eines an
den Abtastungs-Puffer gekoppelten Lange-Vertikale-Markierung-
Detektors zur Ermittlung langer vertikaler Markierungen, wobei
die Ausgabe des Vertikale-Markierung-Detektors den
Entscheidungsschaltkreisen
zugeführt wird.
7. Die Vorrichtung des Anspruchs 2 einschließlich eines an
die Nachzieh-Schaltung gekoppelten Rückweisungs-Kennzeichners
zur Kennzeichnung von Markierungen, die viel größer sind als
eine erwartete Zeichengröße, wobei die Ausgabe des Rückweisungs-
Kennzeichners den Entscheidungsschaltkreisen zugeführt wird.
8. Ein elektronisch implementiertes Verfahren zur Ortung
eines Zeichens in einer Reihe von Zeichen in einem
Zeichenerkennungs-System, das folgendes umfaßt:
Abtastung der Reihe, um Bilder zu liefern, die
Zeichenelemente enthalten;
Speicherung der Zeichenelemente;
Nachziehen der gespeicherten Elemente in mindestens einer
ersten und einer zweiten Richtung, die unterschiedlich sind,
wobei die erste Richtung parallel zur Reihe ist und die zweite
Richtung senkrecht zur Reihe ist;
Ermittlung einer Ecke eines Zeichens auf der Grundlage des
Schnittpunkts der Ränder der nachgezogenen Zeichenelemente in
der ersten und der zweiten Richtung;
Filterung ermittelter Ecken, indem eine Dichtekontrolle in
bezug auf eine ermittelte Ecke durchgeführt wird, um zu
bestimmen, ob die Ecke gültig ist;
Erzeugung von Kandidat-Zeichenrahmen als Reaktion auf
gültige ermittelte Ecken; und
Bestimmung, welche Zeichenrahmen für die Zeichenerkennung
vorgelegt werden sollen, auf der Grundlage der
Wahrscheinlichkeit, daß der Zeichenrahmen ein Zeichen enthält.
9. Das Verfahren des Anspruchs 8, wobei das Nachziehen die
Zeichenelemente auch in einer dritten und einer vierten Richtung
nachzieht, die sich von der ersten und der zweiten Richtung
unterscheiden
10. Das Verfahren des Anspruchs 9, wobei die Zeichen in
einer Reihe angeordnet sind, wobei die erste und die dritte
Richtung parallel zur Reihe und zueinander entgegengesetzt sind,
wobei die zweite und die vierte Richtung senkrecht zur Reihe und
zueinander entgegengesetzt sind, wobei die Ermittlung eine Ecke
auch auf der Grundlage des Schnittpunkts der Ränder der
nachgezogenen Zeichenelemente in der dritten und der vierten
Richtung ermittelt, und wobei die Erzeugung die Anpassung einer
als Reaktion auf das Nachziehen in der ersten und der zweiten
Richtung ermittelten Ecke zu einer als Reaktion auf das
Nachziehen in der dritten und der vierten Richtung ermittelten
Ecke einschließt.
11. Das Verfahren des Anspruchs 10, wobei das Nachziehen in
der zweiten und der vierten Richtung circa eine Zeichenhöhe und
in der ersten und der dritten Richtung circa eine Zeichenbreite
beträgt.
12. Das Verfahren des Anspruchs 10, wobei die Erzeugung die
Bewertung von Kandidat-Zeichenrahmen auf der Grundlage von
Zeichengröße einschließt und bei dem die Bestimmung einen
Zeichenrahmen zur Vorlage bei der Zeichenerkennung auf der
Grundlage der Bewertung auswählt.
13. Das Verfahren des Anspruchs 12, wobei die Bestimmung
das Addieren einer Bonusbewertung zu einem
Kandidat-Zeichenrahmen in Abhängigkeit davon, ob er sich an einem erwarteten Ort
befindet, einschließt.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/755,722 US5267325A (en) | 1991-09-06 | 1991-09-06 | Locating characters for character recognition |
PCT/US1992/007405 WO1993005607A1 (en) | 1991-09-06 | 1992-09-01 | Locating characters for character recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69219346D1 DE69219346D1 (de) | 1997-05-28 |
DE69219346T2 true DE69219346T2 (de) | 1997-11-20 |
Family
ID=25040369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69219346T Expired - Fee Related DE69219346T2 (de) | 1991-09-06 | 1992-09-01 | Zeichenortung für die Zeichenerkennung |
Country Status (5)
Country | Link |
---|---|
US (1) | US5267325A (de) |
EP (1) | EP0602180B1 (de) |
JP (1) | JP3209746B2 (de) |
DE (1) | DE69219346T2 (de) |
WO (1) | WO1993005607A1 (de) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0609474A1 (de) * | 1993-02-03 | 1994-08-10 | International Business Machines Corporation | Verfahren und Vorrichtung zum Umsetzen eines Bildes zur Klassifizierung oder Mustererkennung |
JP3237975B2 (ja) * | 1993-09-20 | 2001-12-10 | 富士通株式会社 | 画像処理装置 |
EP0667533A3 (de) * | 1994-02-14 | 1996-06-12 | Hewlett Packard Co | Signalverlustdetektor. |
US5638459A (en) * | 1994-09-20 | 1997-06-10 | Neopath, Inc. | Method and apparatus for detecting a microscope slide coverslip |
JP2007503641A (ja) * | 2003-08-25 | 2007-02-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 画像強調 |
KR100657915B1 (ko) * | 2004-11-26 | 2006-12-14 | 삼성전자주식회사 | 코너 검출 방법 및 코너 검출 장치 |
US20070071324A1 (en) * | 2005-09-27 | 2007-03-29 | Lexmark International, Inc. | Method for determining corners of an object represented by image data |
KR100833346B1 (ko) | 2007-01-03 | 2008-05-28 | (주)폴리다임 | 디스플레이 장치에 표시된 문자 이미지의 픽셀 단위 가로폭 측정 방법 |
US20130156288A1 (en) * | 2011-12-19 | 2013-06-20 | De La Rue North America Inc. | Systems And Methods For Locating Characters On A Document |
US11010768B2 (en) * | 2015-04-30 | 2021-05-18 | Oracle International Corporation | Character-based attribute value extraction system |
CN111563512B (zh) * | 2020-04-30 | 2024-03-08 | 广东小天才科技有限公司 | 一种答案自动涂抹的方法、装置、电子设备及存储介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4517607A (en) * | 1981-11-09 | 1985-05-14 | Ricoh Company, Ltd. | Method of and apparatus for compensating image in image reproduction system |
US4897806A (en) * | 1985-06-19 | 1990-01-30 | Pixar | Pseudo-random point sampling techniques in computer graphics |
US4748507A (en) * | 1986-10-17 | 1988-05-31 | Kenneth Gural | Solid state imaging device having means to shift the image between scans and associated circuitry to improve the scanned image |
US5144682A (en) * | 1987-03-05 | 1992-09-01 | Ricoh Company, Ltd. | Method and an apparatus for isolating an area corresponding to a character or word |
JPS63268081A (ja) * | 1987-04-17 | 1988-11-04 | インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション | 文書の文字を認識する方法及び装置 |
JPH01168163A (ja) * | 1987-12-23 | 1989-07-03 | Fuji Xerox Co Ltd | 画像処理装置 |
JPH06101049B2 (ja) * | 1988-03-25 | 1994-12-12 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 文字列検出方法 |
US5038381A (en) * | 1988-07-11 | 1991-08-06 | New Dest Corporation | Image/text filtering system and method |
US5048100A (en) * | 1988-12-15 | 1991-09-10 | Michael Kuperstein | Self organizing neural network method and system for general classification of patterns |
JP2597006B2 (ja) * | 1989-04-18 | 1997-04-02 | シャープ株式会社 | 矩形座標抽出方法 |
US5142273A (en) * | 1990-09-20 | 1992-08-25 | Ampex Corporation | System for generating color blended video signal |
-
1991
- 1991-09-06 US US07/755,722 patent/US5267325A/en not_active Expired - Lifetime
-
1992
- 1992-09-01 EP EP92920092A patent/EP0602180B1/de not_active Expired - Lifetime
- 1992-09-01 DE DE69219346T patent/DE69219346T2/de not_active Expired - Fee Related
- 1992-09-01 WO PCT/US1992/007405 patent/WO1993005607A1/en active IP Right Grant
- 1992-09-01 JP JP50537593A patent/JP3209746B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP3209746B2 (ja) | 2001-09-17 |
US5267325A (en) | 1993-11-30 |
WO1993005607A1 (en) | 1993-03-18 |
DE69219346D1 (de) | 1997-05-28 |
EP0602180B1 (de) | 1997-04-23 |
EP0602180A1 (de) | 1994-06-22 |
JPH06510387A (ja) | 1994-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2801536C2 (de) | Zeichenformkodiervorrichtung | |
DE3926327C2 (de) | Verfahren und System zum Erkennen von Zeichen auf einem Medium | |
DE3615906C2 (de) | ||
DE69535098T2 (de) | Verfahren und -vorrichtung zur Suche von Bildern in einer Datenbank | |
DE3785440T2 (de) | Optische abtastvorrichtung mit ortungsfuehlern. | |
DE3883578T2 (de) | Verfahren und Gerät zur Erkennung von gedruckten Zeichen auf einem Beleg. | |
DE3013833C2 (de) | Vorrichtung zur Prüfung eines auf einem Gegenstand befindlichen Musters auf Fehler | |
DE69219346T2 (de) | Zeichenortung für die Zeichenerkennung | |
DE3722444A1 (de) | Verfahren und vorrichtung zum erzeugen von entwurfsmusterdaten | |
DE19500382A1 (de) | Verfahren und Einrichtung zum Kompensieren von Substratverzerrungen in einem automatischen optischen Prüfsystem für Leiterplatten | |
DE19960555A1 (de) | Verfahren zum Auffinden und Lesen eines zweidimensionalen Strichcodes | |
DE3879609T2 (de) | Verfahren und Vorrichtung zum Erkennen von kennzeichnenden Unterschieden in einem Blattmaterial. | |
DE2624185A1 (de) | Lichtgriffel fuer gasentladungsanzeigen | |
DE2410306C3 (de) | Anordnung zur Einstellung eines Abtastrasters oder einer Erkennungslogik auf die Schräglage von abzutastenden bzw. zu erkennenden Zeichen | |
EP0301384A2 (de) | Schaltungsanordnung zur Aufbereitung von schrägstehenden, insbesondere handgeschriebenen Zeichen | |
DE3239938C2 (de) | ||
DE68913475T2 (de) | Verfahren zum Durchsuchen einer Matrix binärer Daten. | |
EP1578609B1 (de) | Verfahren und vorrichtung zur echzeitkontrolle von druckbildern | |
DE4107020A1 (de) | Verfahren zur zweidimensionalen speicherung von daten auf einem bedruckbaren oder fotografisch entwickelbaren medium | |
DE3414455C2 (de) | Verfahren und Vorrichtung zum Lesen und Verarbeiten von Information, die aus dekodierbarer Schriftinformation und/oder nichtdekodierbarer Graphikinformation besteht | |
DE2064469A1 (de) | Mustererkennungseinrichtung | |
DE3128794A1 (de) | Verfahren zum auffinden und abgrenzen von buchstaben und buchstabengruppen oder woertern in textbereichen einer vorlage, die ausser textbereichen auch graphik-und/oder bildbereiche enthalten kann. | |
DE3823622C2 (de) | ||
DE3830990C2 (de) | ||
DE69122915T2 (de) | Verfahren zur Aufbereitung von Matrixzeichen mit kleinen Abmessungen mittels verbundener Pixelreihen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |