DE69228965T2 - Gerät und Verfahren zur Bildverarbeitung - Google Patents

Gerät und Verfahren zur Bildverarbeitung

Info

Publication number
DE69228965T2
DE69228965T2 DE69228965T DE69228965T DE69228965T2 DE 69228965 T2 DE69228965 T2 DE 69228965T2 DE 69228965 T DE69228965 T DE 69228965T DE 69228965 T DE69228965 T DE 69228965T DE 69228965 T2 DE69228965 T2 DE 69228965T2
Authority
DE
Germany
Prior art keywords
character
image
extracted
outline
starting point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69228965T
Other languages
English (en)
Other versions
DE69228965D1 (de
Inventor
Toru Niki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Application granted granted Critical
Publication of DE69228965D1 publication Critical patent/DE69228965D1/de
Publication of DE69228965T2 publication Critical patent/DE69228965T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

  • Die Erfindung betrifft ein Bildverarbeitungsverfahren und -gerät, das gewünschte Informationen aus eingegebenen Bildinformationen korrekt extrahieren und die extrahierten Teilinformationen erkennen kann.
  • Ein herkömmliches Gerät, das Zeichen aus Bildinformationen erkennen kann, ist gemäß Fig. 12 aufgebaut. Bezugszeichen 41 kennzeichnet eine Abtasteinrichtung zur Umwandlung eines Zeichenbildes eines zu lesenden Objektes in ein analoges elektrisches Signal, 42 kennzeichnet einen Vorbereitungs-Signalprozessor zur Binärisierung des analogen Signals und zur Beseitigung des Rauschens des Signals, 43 kennzeichnet eine Zeichenextrahiereinrichtung zur Trennung einer Zeichenkette nach jedem bzw. je Zeichen, 44 kennzeichnet eine Merkmalextrahiereinrichtung zum Extrahieren eines dem Zeichen eigenen Merkmals und zum Erzeugen eines Merkmalvektors entsprechend einem vorbestimmten Algorithmus, 45 kennzeichnet ein Erkennungsverzeichnis bzw. ein Erkennungswörterbuch zur Speicherung statistischer Werte (Mittelwert, Verteilung und dergleichen) des Merkmalvektors eines jeden Zeichentyps, 46 kennzeichnet einen Komparator zum Vergleich des von dem eingegebenen Zeichenbild erhaltenen Merkmalvektors mit dem Erkennungswörterbuch, wodurch der optimale Kandidat ausgewählt wird, 47 kennzeichnet ein Textverzeichnis bzw. ein Textwörterbuch zur Speicherung der Ergebnisse einer Textumwandlung bzw. Textübersetzung, 48 kennzeichnet eine Verzeichnis- bzw. Wörterbuch- Wiedergewinnungseinheit zum Extrahieren des entsprechenden übersetzten Wortes aus der erkannten Zeichen kette unter Bezug auf das Textwörterbuch und 49 kennzeichnet eine Anzeigeeinrichtung zum Anzeigen des übersetzten Wortes.
  • Die vorstehend angeführte herkömmliche Technik weist jedoch die nachstehend beschriebenen Nachteile auf.
  • (1) Auf einem schwarzen Hintergrund mit weißer Farbe geschriebene sogenannte unausgefüllte Zeichen können nicht erkannt werden. Die Fig. 7 und 10 zeigen Beispiele von derartigen unausgefüllten Zeichen.
  • Als eine herkömmliche Technik ist ein Verfahren bekannt, bei dem ein Verhältnis anhand einer Zählung der schwarzen Bildpunkte im gesamten Bildpuffer ermittelt wird und sofern das Verhältnis gleich oder größer als ein vorbestimmter Wert ist, wird auf unausgefüllte Zeichen geschlossen, die Zeichen werden von weiß zu schwarz invertiert und eine Erkennungsverarbeitung wird ausgeführt. Jedoch weist ein derartiges Verfahren einen derartigen Nachteil auf, daß es lange dauert, die Anzahl der schwarzen Bildelemente zu zählen, und daß sich dadurch die Gesamtverarbeitungszeit verlängert. Wenn andererseits gemäß einem in Fig. 9 gezeigten Beispiel die Zeichen- Strichdicke sehr dick ist, werden diese Zeichen irrtümlicherweise für unausgefüllte Zeichen gehalten bzw. als unausgefüllte Zeichen angesehen. Es kann auch wie in Fig. 10 gezeigt passieren, daß obwohl die Zeichen tatsächlich unausgefüllte Zeichen sind, sie nicht als unausgefüllte Zeichen bewertet bzw. beurteilt werden können, da eine große Anzahl von weißen Bildelementen vorhanden ist. Folglich ist ein derartiger Nachteil vorhanden, daß eine korrekte Bewertung bzw. Beurteilung nicht immer möglich ist.
  • (2) Wenn wie in Fig. 11 gezeigt eine regelmäßige bzw. gezogene Linie vor einer zu erkennenden Zeichenkette vorhanden ist, können die Zeichen des dort gezeigten "take" nicht extrahiert werden.
  • Bisher ist es so, daß wenn die Bedienperson versucht, Zeicheninformationen durch Verfolgen eines Umrisses der Zeicheninformationen unter Verwendung eines bestimmten Punktes in einem Eingabebild als Startposition zu extrahieren, das Verfolgen von einem Startpunkt aus beginnt und am Rand des Eingabebildes endet, wenn die gezogene Linie gemäß Fig. 11 vorhanden ist, wird der Umriß-Verfolgevorgang an einem derartigen Ende ebenfalls beendet. Daher erreicht der Umriß-Verfolgevorgang nicht die Zeichenkette "take" und "take" kann ebenfalls nicht extrahiert werden.
  • In der Veröffentlichung mit dem Titel "A Model Building Approach To Property Measurement In Black And White Pictures" von Robert L. Stafford, in Computer Graphics and Image Processing (1973), Band 2, Seiten 39-59, ist ein Bildverarbeitungsverfahren zum Extrahieren des Bildes eines Zeichens bzw. des Zeichenbildes aus einem Eingabebild offenbart. Das Eingabebild wird abgetastet, um Anordnungen von Punkten zu finden, die identisch mit gespeicherten Punktmustern sind. Dieses Verfahren wird verwendet, um die Eckpunkte der Bilder zu finden und dadurch eine Umrißlinienkarte zu erzeugen.
  • Zusammenfassung der Erfindung
  • Gemäß einer ersten Ausgestaltung der vorliegenden Erfindung ist ein Bildverarbeitungsverfahren bereitgestellt, mit den Schritten:
  • Bereitstellen eines Eingabebildes mit einem zu extrahierenden Zeichen, und Extrahieren des Zeichens aus dem bereitgestellten Eingabebild, gekennzeichnet durch die folgenden Schritte:
  • Verfolgen eines Umrisses des Zeichens von einem ersten Startpunkt des Eingabebildes an, und Verschieben des Startpunktes, wenn der Umriß einen Rand des Eingabebildes erreicht, ohne irgendwelche Zeicheninformationen zu extrahieren, sowie einen zweiten Verfolgeschritt des Verfolgens des Umrisses von dem verschobenen Startpunkt an, und Wiederholen des Verfolge- und des Verschiebeschrittes bis Zeicheninformationen in dem zweiten Verfolgeschritt extrahiert werden können.
  • Gemäß einer bevorzugten Ausgestaltung der Erfindung werden die Anzahl der Verschiebungen des Startpunktes gezählt, wenn der Extrahier- und der Verschiebeschritt wiederholt werden, und der Wert der Bildelemente des Bildes wird invertiert, wenn der Zählwert (Progression) einen vorherbestimmten Wert überschreitet.
  • Das Verfahren kann den Schritt des Vergleichens des extrahierten Zeichens mit einem gespeicherten Zeichen enthalten, wobei dadurch eine Identifizierung des extrahierten Zeichens erfolgt.
  • Gemäß einer zweiten Ausgestaltung der vorliegenden Erfindung ist ein Bildverarbeitungsgerät bereitgestellt, mit einer Eingabeeinrichtung zur Eingabe eines Eingabebildes mit einem zu extrahierenden Zeichen, und einer Extrahiereinrichtung zum Extrahieren des Zeichens aus dem bereitgestellten Eingabebild, gekennzeichnet durch eine Verfolgeeinrichtung zum Verfolgen eines Umrisses des Zeichens von einem ersten Startpunkt des Eingabebildes an, eine Einrichtung zum Verschieben des Startpunktes, wenn der Umriß einen Rand des Eingabebildes erreicht, ohne irgendwelche Zeicheninformationen zu extrahieren, wobei die Verfolgeeinrichtung dazu dient, den Umriß von dem verschobenen Startpunkt an zu verfolgen, und eine Einrichtung zum Wiederholen des Verfolgens und des Verschiebens, bis Zeicheninformationen extrahiert werden können.
  • Bei einer bevorzugten Ausgestaltung der Erfindung umfaßt das Gerät eine Einrichtung zum Wiederholen des Verfolgens und des Verschiebens, eine Zähleinrichtung zum Zählen der Anzahl von Verschiebungen des Startpunktes, und eine Invertiereinrichtung zum Invertieren des Wertes der Bildelemente des Bildes, wenn der Zählwert (Progression) einen vorherbestimmten Wert überschreitet.
  • Das Gerät kann eine Einrichtung zum Vergleich des extrahierten Zeichens mit einem gespeicherten Zeichen umfassen, wobei dadurch eine Identifizierung des extrahierten Zeichens erfolgt.
  • Kurzbeschreibung der Zeichnung
  • Es zeigen:
  • Fig. 1 ein Blockschaltbild eines Ausführungsbeispiels,
  • Fig. 2 eine Außenansicht eines Gerätes des Ausführungsbeispiels,
  • Fig. 3 eine Darstellung eines Speicherverfahrens eines Bildpuffers,
  • Fig. 4 ein Flußdiagramm einer Gesamtverarbeitung,
  • Fig. 5 ein Flußdiagramm einer Extrahierverarbeitung,
  • Fig. 6 eine Darstellung zur Beschreibung einer Zeichenextrahierung durch einen Umriß-Verfolgeablauf bzw. einen Umrißverfolgevorgang,
  • Fig. 7 ein Beispiel unausgefüllter Zeichen,
  • Fig. 8 ein Beispiel gewöhnlicher Zeichen,
  • Fig. 9 ein Beispiel gewöhnlicher Zeichen (fette Zeichen),
  • Fig. 10 ein Beispiel unausgefüllter Zeichen,
  • Fig. 11 ein Beispiel unausgefüllter Zeichen mit einer gezogenen Linie, und
  • Fig. 12 ein Beispiel eines Aufbaus eines herkömmlichen elektronischen Wörterbuches der Erkennungsbauart.
  • Ausführliche Beschreibung der bevorzugten Ausführungsbeispiele
  • Fig. 1 stellt ein Blockschaltbild eines Ausführungsbeispiels gemäß der Erfindung dar und zeigt einen Aufbau eines elektronischen Wörterbuches der Erkennungsbauart, wobei ein Schriftstück mit einem englischen Text durch einen Hand-Lesevorgang gelesen wird, Zeichen erkannt werden und eine japanische Übersetzung eines Wortes durch Durchsuchen des Wörterbuches unter Verwendung des Ergebnisses der Zeichenerkennung angezeigt wird.
  • In der Darstellung kennzeichnet Bezugszeichen 1 eine Abtasteinrichtung zum Umwandeln von Bildinformationen eines zu lesenden Objektes in analoge Signale, 2 einen Binärwandler zum Umwandeln des von der Abtasteinrichtung 1 erzeugten analogen Signals in ein binäres digitales Signal, 3 einen Kodierer, der synchron rotiert wird, wenn das Objekt durch eine Hand-Abtastung gelesen wird und der ein mit der manuellen Abtastung synchronisierte Signal durch Erfassung der Kodierer-Rotation mittels eines Fotounterbrechers erzeugt, 4 einen Reed-Schalter zum Überwachen eines Betätigungszustandes einer Rolle bzw. Walze, um die Rotation an den Kodierer weiterzuleiten und das Ende des Lesevorgangs zu erfassen, und 10 eine Zentraleinheit (CPU) mit einer hochintegrierten Schaltung (LSI) einschließlich eines Unterbrechungseingabeanschlusses, einer Unterbrechungssteuerschaltung, einem Taktsignalgenerator, eines Anweisungsdekodierers, Register, einer ALU (arithmetische Logikeinheit), eines Eingabeanschlusses, eines Ausgabeanschlusses und eines Bildeingabe-Schieberegisters. Bezugszeichen 11 kennzeichnet einen Speicher mit wahlfreiem Zugriff (RAM) mit einem lesbaren und einem beschreibbaren Speicherabschnitt, auf die jeweils mit einer Adresse zugegriffen werden kann. Als Funktionen des Speicherabschnittes kann eine Speicherfunktion zum Speichern von Daten, eine nachstehend als Flagfunktion bezeichnete Zustandsmerkerfunktion zum Speichern des Ergebnisses der Unterscheidung, eine Zählfunktion zum Speichern eines Zustandes durch einen Zählwert, eine Registerfunktion zum zeitweiligen Speichern und dergleichen erwähnt werden. Bezugszeichen 12 kennzeichnet einen Nur-Lese-Speicher (ROM), in dem sequentiell durch die CPU 10 ausgeführte Mikroprogramme, ein Erkennungswörterbuch, ein Englisch- Japanisch-Wörterbuch und für verschiedene Arten von Unterscheidungen verwendete Konstanten oder dergleichen kodiert und gespeichert wurden. Bezugszeichen 13 kennzeichnet eine Ansteuereinrichtung einer Flüssigkristall-Anzeigeeinrichtung (LCD-Ansteuereinrichtung) zum Empfang von Ausgabedaten und zum Erzeugen eines Signals, für die Anzeige auf einer Flüssigkristall-Anzeigeeinrichtung (LCD) 14, 15 eine Tastatur und 16 eine äußere Busleitung einschließlich eines äußeren Adreßbusses und eines äußeren Datenbusses. Die Adressierung des ROMs und des RAMs, die Übertragung und der Empfang von Daten und dergleichen wird durch die äußere Busleitung 16 ausgeführt.
  • Fig. 2 stellt eine Darstellung einer äußeren Ansicht eines Gerätes des Ausführungsbeispiels dar. Das Bezugszeichen 21 kennzeichnet ein oberes Gehäuse, 22 ein unteres Gehäuse, 23 eine Eingabetaste, 24 eine Flüssigkristall-Anzeigeeinrichtung, 25 eine Walze zur Weiterleitung einer Rotation an den Kodierer, 26 eine Leseeinheit, 27 eine Markierung für das Lesen, 28 eine Aushöhlung für einen Daumen zur Verbesserung des Haltes.
  • Als erstes sind in dem RAM bereitgestellte Bildpuffer mit Bezug auf Fig. 3 nachstehend beschrieben. Eine in diesem Ausführungsbeispiel verwendete Abtasteinrichtung ist ein eindimensionaler Zeilensensor und liest Bilddaten zeilenweise aus. Die Erfindung kann ebenfalls auf einen Zeilen sensor angewandt werden, der Bilddaten mehrerer Zeilen auslesen kann. Bezugszeichen 31 kennzeichnet in dem RAM 11 bereitgestellte Bildpuffer, dabei wird die x-Richtung als Zeile und die y-Richtung als Spalte bezeichnet. Die Bilddaten einer gelesenen Zeile werden sequentiell von der nullten Zeile an von links nach rechts gespeichert. Da die Bilddaten bereits von dem Binärwandler 2 binärisiert wurden, entspricht das Bezugszeichen "1" in dem Bildpuffer einem schwarzen Bildelement und "0" entspricht einem weißen Bildelement.
  • Fig. 4 stellt ein Flußdiagramm sämtlicher Verarbeitsabläufe des Ausführungsbeispiels dar. Die Verarbeitungen werden unter Steuerung der CPU 10 entsprechend den in dem ROM 12 gespeicherten Programmen ausgeführt. Ein Zeichenbild wird in Schritt S401 von der Abtasteinrichtung gelesen. In Schritt S402 wird eine sogenannte Zeichenextrahierung durch die CPU 10 ausgeführt, um einen rechteckigen Bereich jedes Zeichens zu bestimmen. In Schritt S403 wird ein Prüfverfahren für jeden rechteckigen Bereich durch die CPU 10 ausgeführt. In Schritt S404 durchsucht die CPU 10 das Wörterbuch in dem ROM 12 unter Verwendung der erhaltenen Zeichenkette. In Schritt S405 werden die Übersetzungsergebnisse durch die LCD 14 angezeigt.
  • Die Extrahierverarbeitung in Schritt S402 ist nachstehend ausführlich entsprechend einem Flußdiagramm gemäß Fig. 5 beschrieben. Verarbeitungen in dem Flußdiagramm gemäß Fig. 5 werden unter Steuerung der CPU 10 entsprechend dem in dem ROM 12 gespeicherten Programm ausgeführt.
  • Im ersten Schritt, S501, werden die Daten in dem RAM 11 mit Anfangswerten initialisiert. D. h., ein Wert einer Variable p zum Speichern der x-Koordinate der Extrahier- Startposition, ein Wert einer Variable cline, die die Anzahl der durch die weißen Bildelementen ersetzten Zeilen anzeigt, und ein Wert des Zustandsmerkers bzw. der Kennung rflag, die anzeigt, daß der gesamte Bildpuffer invertiert wurde, wird auf "0" gesetzt. Die erste Zeile des Bildpuffers wird auf weiße Bildelemente eingestellt, um die Extrahierung durch Umrißverfolgung durchzuführen. Fig. 6 zeigt ein Beispiel von in den Bildpuffern in dem RAM 11 gespeicherten Zeichenbildern. In Schritt S502 wird ein Zeichen durch Umrißverfolgung von einem Punkt a&sub1;, der sich am Mittelpunkt des linken Rand des Bildpuffers befindet, an nach rechts hin extrahiert. Die Bildelemente werden von dem Punkt a&sub1; an nach rechts hin untersucht. Die Umrißverfolgung wird von einem Punkt aus, an dem die Umrißverfolgung zuerst auf ein schwarzes Bildelement trifft, durchgeführt. Ein durch Umrißverfolgung erhaltener rechteckiger Bereich, der durch die Minimalwerte (x&sub1;, y&sub1;) und die Maximalwerte (x&sub2;, y&sub2;) der Umrißkoordinaten gegeben ist, wird als ein Bereich eines Zeichens gesetzt. Ein Algorithmus der Umrißverfolgung ist eine bekannte Technik. In Schritt S502 wird jedesmal, wenn die Umrißverfolgung begonnen wird, die x-Koordinate in p gesetzt. Nachdem der Bereich eines Zeichens erhalten wurde, werden die Bildelemente von einer Position a&sub2; mit den Koordinaten (x = x&sub2;, (y = y&sub1;+y&sub2;)/2) an nach rechts hin untersucht, um das nächsten Zeichen zu extrahieren, und ähnliche wie vorstehend angeführte Verarbeitungen werden durchgeführt.
  • Bei unausgefüllten Zeichen gemäß Fig. 7 oder 10 oder bei einer gezogenen Linie vor einem zu lesenden Wort gemäß Fig. 11 erreicht die Umrißverfolgeposition während des Umrißverfolgevorgangs den unteren/oberen oder den linken/rechten Rand des Bildpuffers, und die Umrißverfolgung kann danach nicht mehr ausgeführt werden. Bei gewöhnlichen Zeichen gemäß Fig. 8 erreicht die Umrißverfolgeposition ebenfalls nach Extrahierung aller Zeichen schließlich den rechten Rand des Bildpuffers, so daß die Unterscheidung durch die CPU 10 hinsichtlich einer erfolgreichen oder erfolglosen Extrahierung in Schritt 5503 durchgeführt wird. D. h., wenn die Umrißverfolgeposition nach Extrahierung eines oder mehrerer Zeichen den Rand erreicht, wird die Umrißverfolgung rückgesetzt. Wenn sie den Rand ohne Extrahierung eines Zeichens erreicht, schreitet der Verarbeitungsablauf zu Schritt S504 voran. Wenn in Schritt S504 der Wert der Variable cline in dem RAM 11 gleich oder kleiner als ein vorbestimmter Schwellwert N ist, folgt Schritt S505. Falls er größer als N ist, folgt Schritt S509. In Schritt S505 wird der Wert p der x-Koordinate, bei dem die Umrißverfolgung begonnen wurde, lediglich um einen vorbestimmten Wert d erhöht. In Schritt S506 werden die Werte der Zeile von x = p in den Zeilenspeicherpuffern gespeichert, die an anderen Adressen als die der Bildpuffer in dem RAM 11 eingerichtet sind. Der Zeilenspeicherpuffer kann die Daten von N Zeilen speichern. In Schritt S507 werden alle Werte von x = p in dem Bildpuffer auf "0" gesetzt. In Schritt S508 wird der Wert der Variable cline in dem RAM 11 um "1" erhöht, wonach der Verarbeitungsablauf zu Schritt S502 zurückkehrt und die Extrahierverarbeitung erneut ausgeführt wird.
  • Wenn eine gezogene Linie gemäß Fig. 7 eingeschlossen ist, werden einmal die Verarbeitungen der Schritten S505 bis S508 zum Setzen aller Werte einer Zeile in den Bildpuffern auf "0" durchgeführt, wenn die gezogene Linie eine dünne Linie ist. Diese Verarbeitungen werden aber auch einige Male durchgeführt, wenn eine derartige Linie eine dicke Linie ist. Aufgrund dessen kann die Umrißverfolgeposition über die gezogene Linie hinweg gelangen, so daß das der gezogenen Linie nachfolgende Wort genau extrahiert werden kann.
  • Wenn andererseits in Schritt S504 die Variable cline in dem RAM 11 größer als N ist, folgt Schritt S509. Wenn die Variable rflag in dem RAM 11 gleich 1 ist, folgt Schritt S510 und die Daten von in Schritt S506 gespeicherten N Zeilen werden in die Bildpuffer zurückgegeben und die ursprünglichen Bilddaten werden rekonstruiert. In Schritt S511 werden alle Werte in den Bildpuffern invertiert. D. h., "0" wird zu "1" und "1" wird zu "0" invertiert. Durch die vorstehend angeführte Verarbeitung werden die unausgefüllten Zeichen gemäß Fig. 7 oder Fig. 10 ebenfalls invertiert und können auf eine ähnlichen Weise wie bei gewöhnlichen Zeichen erkannt werden.
  • Zum Festhalten, daß die Invertierverarbeitung ausgeführt wurde, wird in Schritt S512 eine "1" in die Variable rflag in dem RAM 11 gesetzt. Danach folgt Schritt S502 und die Extrahierverarbeitung wird erneut begonnen. In Schritt S512 werden die beiden Variablen cline und p in dem RAM 11 auf "0" rückgesetzt.
  • Wenn in Schritt S509 die Variable rflag in dem RAM 11 gleich 1 ist, bedeutet dies, daß die Invertierverarbeitung bereits einmal ausgeführt wurde. Es ergibt somit keinen Sinn, eine Invertierung nochmals auszuführen. Daher bestimmt die CPU 10, daß das Eingabebild ein nicht zu erkennendes Bild ist. Der Verarbeitungsablauf ist damit beendet.
  • Bei dem Ausführungsbeispiel wird die Extrahierverarbeitung begonnen, nachdem die Bilddaten in den gesamten Bildpuffern gespeichert wurden. Die Extrahierverarbeitung kann aber auch parallel zu der Übertragung der Bilddaten von der Abtasteinrichtung ausgeführt werden. Wenn dabei angenommen wird, daß die Bilddaten bereits bis x = x&sub1; zu einem bestimmten Zeitpunkt t übertragen wurden, ist es notwendig, auf die Ausführung der jeweiligen Verarbeitungen in den Schritten S502, S505 und S511 in dem Flußdiagramm gemäß Fig. 5 zu warten, so daß x = xp nicht überschritten wird.
  • Obwohl bei dem Ausführungsbeispiel die Daten zeilenweise von der Abtasteinrichtung in den Bildpuffer übertragen werden, kann die Datenübertragung ebenfalls spaltenweise ausgeführt werden.
  • Bei dem Ausführungsbeispiel wird ein englisches Wort gelesen und das ins Japanische übersetzte Wort wird angezeigt. Jedoch ist die Erfindung nicht auf diese Sprache beschränkt, sofern nur Abstände (getrennt geschriebene Zeichen) in der Sprache des zu lesenden Objektes vorhanden sind.
  • Die Erfindung ist ebenfalls nicht von dem Erkennungsalgorithmus und dem Wortextrahier-Algorithmus abhängig, sondern kann ebenfalls effektiv auf andere Algorithmen angewandt werden.

Claims (6)

1. Bildverarbeitungsverfahren mit den Schritten
Bereitstellen eines Eingabebildes mit einem zu extrahierenden Zeichen (S401), und
Extrahieren des Zeichens aus dem bereitgestellten Eingabebild (S402),
gekennzeichnet durch die folgenden Schritte:
Verfolgen eines Umrisses des Zeichens von einem ersten Startpunkt (x&sub1;, y&sub1;) des Eingabebildes an, und
Verschieben des Startpunktes (x&sub2;, y&sub2;), wenn der Umriß einen Rand des Eingabebildes (S505) erreicht, ohne irgendwelche Zeicheninformationen zu extrahieren, sowie
einen zweiten Verfolgeschritt des Verfolgens des Umrisses von dem verschobenen Startpunkt (x&sub2;, y&sub2;) an, und
Wiederholen des Verfolge- und des Verschiebeschrittes bis Zeicheninformationen in dem zweiten Verfolgeschritt extrahiert werden können.
2. Verfahren nach Anspruch 1, wobei die Anzahl der Verschiebungen des Startpunktes gezählt werden, wenn der Extrahier- und der Verschiebeschritt wiederholt werden, und wobei der Wert der Bildelemente des Bildes invertiert wird (511), wenn der Zählwert (Progression) einen vorherbestimmten Wert (N) überschreitet.
3. Verfahren nach einem der vorstehenden Ansprüche, mit dem Schritt des Vergleichens des extrahierten Zeichens mit einem gespeicherten Zeichen (S404), wobei dadurch eine Identifizierung des extrahierten Zeichens (S405) erfolgt.
4. Bildverarbeitungsgerät mit
einer Eingabeeinrichtung (1-3) zur Eingabe eines Eingabebildes mit einem zu extrahierenden Zeichen (S401), und
einer Extrahiereinrichtung (10, 11, 12) zum Extrahieren des Zeichens aus dem bereitgestellten Eingabebild (S402),
gekennzeichnet durch
eine Verfolgeeinrichtung zum Verfolgen eines Umrisses des Zeichens von einem ersten Startpunkt (x&sub1;, y&sub1;) des Eingabebildes an,
eine Einrichtung zum Verschieben des Startpunktes (x&sub2;, y&sub2;), wenn der Umriß einen Rand des Eingabebildes (S505) erreicht, ohne irgendwelche Zeicheninformationen zu extrahieren,
wobei die Verfolgeeinrichtung dazu dient, den Umriß von dem verschobenen Startpunkt (x&sub2;, y&sub2;) an zu verfolgen, und
eine Einrichtung zum Wiederholen des Verfolgens und des Verschiebens, bis Zeicheninformationen extrahiert werden können.
5. Gerät nach Anspruch 4 mit einer Einrichtung zum Wiederholen des Verfolgens und des Verschiebens, einer Zähleinrichtung (11) zum Zählen der Anzahl von Verschiebungen des Startpunktes, und eine Invertiereinrichtung zum Invertieren des Wertes der Bildelemente des Bildes, wenn der Zählwert (Progression) einen vorherbestimmten Wert (N) überschreitet.
6. Gerät nach Anspruch 4 oder 5, mit einer Einrichtung (10) zum Vergleich des extrahierten Zeichens mit einem gespeicherten Zeichen (S404), wobei dadurch eine Identifizierung des extrahierten Zeichens (S405) erfolgt.
DE69228965T 1991-07-23 1992-07-21 Gerät und Verfahren zur Bildverarbeitung Expired - Fee Related DE69228965T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3182505A JPH0528317A (ja) 1991-07-23 1991-07-23 画像処理方法及び装置

Publications (2)

Publication Number Publication Date
DE69228965D1 DE69228965D1 (de) 1999-05-27
DE69228965T2 true DE69228965T2 (de) 1999-10-07

Family

ID=16119475

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69228965T Expired - Fee Related DE69228965T2 (de) 1991-07-23 1992-07-21 Gerät und Verfahren zur Bildverarbeitung

Country Status (4)

Country Link
US (1) US5335294A (de)
EP (1) EP0524797B1 (de)
JP (1) JPH0528317A (de)
DE (1) DE69228965T2 (de)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3062382B2 (ja) * 1993-12-09 2000-07-10 キヤノン株式会社 画像処理装置及び方法
JPH07288722A (ja) * 1994-04-15 1995-10-31 Canon Inc 撮像装置
JP3108979B2 (ja) * 1994-07-28 2000-11-13 セイコーエプソン株式会社 画像処理方法および画像処理装置
JP2939147B2 (ja) * 1994-12-29 1999-08-25 シャープ株式会社 手書き文字入力表示装置および方法
JP3601658B2 (ja) * 1997-12-19 2004-12-15 富士通株式会社 文字列抽出装置及びパターン抽出装置
JP4077919B2 (ja) * 1998-01-30 2008-04-23 キヤノン株式会社 画像処理方法及び装置及びその記憶媒体
US7119772B2 (en) * 1999-04-30 2006-10-10 E Ink Corporation Methods for driving bistable electro-optic displays, and apparatus for use therein
JP3950777B2 (ja) * 2002-09-30 2007-08-01 キヤノン株式会社 画像処理方法、画像処理装置および画像処理プログラム
US7385606B2 (en) * 2002-12-18 2008-06-10 Microsoft Corporation International font measurement system and method
US7271806B2 (en) * 2002-12-18 2007-09-18 Microsoft Corporation International automatic line height system and method
US20040119714A1 (en) * 2002-12-18 2004-06-24 Microsoft Corporation International automatic font size system and method
IL157235A0 (en) * 2003-08-04 2004-02-19 Assistec Ltd Apparatus for detection of objects and image/color identification
KR102421856B1 (ko) * 2017-12-20 2022-07-18 삼성전자주식회사 영상의 상호작용 처리 방법 및 장치

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4183013A (en) * 1976-11-29 1980-01-08 Coulter Electronics, Inc. System for extracting shape features from an image
US4189711A (en) * 1977-11-08 1980-02-19 Bell Telephone Laboratories, Incorporated Multilevel processing of image signals
GB8311813D0 (en) * 1983-04-29 1983-06-02 West G A W Coding and storing raster scan images
JPS6073793A (ja) * 1983-09-29 1985-04-25 Fujitsu Ltd 光学文字読取装置
US4791676A (en) * 1985-09-12 1988-12-13 International Business Machines Corporation Method and means for efficiently handling boundary conditions in connected component labeling
JPS6381574A (ja) * 1986-09-25 1988-04-12 Toshiba Corp 図形デ−タベ−ス入力装置
DE3815869A1 (de) * 1987-05-08 1988-11-17 Ricoh Kk Verfahren zum extrahieren von merkmalsmengen eines zeichens

Also Published As

Publication number Publication date
EP0524797A2 (de) 1993-01-27
DE69228965D1 (de) 1999-05-27
EP0524797B1 (de) 1999-04-21
EP0524797A3 (en) 1993-08-18
US5335294A (en) 1994-08-02
JPH0528317A (ja) 1993-02-05

Similar Documents

Publication Publication Date Title
DE69604481T2 (de) Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern
DE69527487T2 (de) Verfahren zum erlemmem von handgeschriebenen eingaben
DE3633743C2 (de)
DE69228965T2 (de) Gerät und Verfahren zur Bildverarbeitung
DE69130469T2 (de) Gerät und Verfahren zur Bildverarbeitung
DE69428475T2 (de) Verfahren und Gerät zur automatischen Spracherkennung
DE69715076T2 (de) Vorrichtung zur Erzeugung eines Binärbildes
DE69230635T2 (de) Verfahren und Gerät zur Bild-/Handmarkierungsbestimmung
DE69516751T2 (de) Bildvorverarbeitung für Zeichenerkennungsanlage
US4750209A (en) System for processing an image having both letter and photographic information
DE3689416T2 (de) Mustermerkmalextraktion.
DE19960555B4 (de) Verfahren zum Auffinden und Lesen eines zweidimensionalen Strichcodes
DE69230631T2 (de) Verfahren zum Vergleichen von Wortgestalten
DE69519323T2 (de) System zur Seitensegmentierung und Zeichenerkennung
DE3485953T2 (de) Verfahren und anlage zur on-line-erkennung handgeschriebener muster.
DE2740483C2 (de) Vorrichtung zur Feststellung von Merkmalen
EP0063454B1 (de) Verfahren zum Erkennen von maschinell kodierten Zeichen
DE68924612T2 (de) Bildverarbeitungsmethode zur Gestalterkennung.
DE69523137T2 (de) Verfahren zur handschrift-eingangsverbindung
DE19530829C2 (de) Verfahren zum elektronischen Wiederauffinden von einem Dokument hinzugefügter Information
DE2829808A1 (de) Verfahren und vorrichtung zum lesen von zeichen
DE3718620C2 (de)
Hasan et al. An image processing oriented optical mark reader based on modify multi-connect architecture mmca
DE69813416T2 (de) Vorrichtungen zur Linienrichtungsbestimmung, Bildschrägeerfassung und Bildschrägekorrektur.
DE69728469T2 (de) Gerät und Verfahren zur Ermittlung der Zeichenlinie mittels vereinfachter Projektionsinformation; Zeichenerkennungsgerät und Verfahren

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee