DE69125777T2 - Verfahren und Gerät zur Trennung von Bildbereichen - Google Patents

Verfahren und Gerät zur Trennung von Bildbereichen

Info

Publication number
DE69125777T2
DE69125777T2 DE69125777T DE69125777T DE69125777T2 DE 69125777 T2 DE69125777 T2 DE 69125777T2 DE 69125777 T DE69125777 T DE 69125777T DE 69125777 T DE69125777 T DE 69125777T DE 69125777 T2 DE69125777 T2 DE 69125777T2
Authority
DE
Germany
Prior art keywords
image
character
distance
question
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69125777T
Other languages
English (en)
Other versions
DE69125777D1 (de
Inventor
Toru Niki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of DE69125777D1 publication Critical patent/DE69125777D1/de
Application granted granted Critical
Publication of DE69125777T2 publication Critical patent/DE69125777T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

  • Die Erfindung betrifft ein Verfahren und ein Gerät zur Trennung benachbarter Bildbereiche.
  • In den letzten Jahren wurde Geräte vorgeschlagen, die optisch und unmittelbar Zeicheninformationen unter Verwendung optischer Einrichtungen wie Bildabtastvorrichtungen eingeben können. Derartige Geräte sind sehr nützlich, da sie die Eingabe von Zeicheninformationen aus handgeschriebenen, gedruckten oder gesetzten Zeichen ermöglichen. Bei Verwendung dieser Geräte wird jedoch die Erkennung einzelner Zeichen durch die Tatsache behindert, daß aufgrund verschiedener Gründe wie einer praktischen Grenze der Auflösung der Bildabtastvorrichtung, Flecken auf dem Vorlagendokument usw. die optisch gelesenen Bilder zweier oder mehrerer Zeichen bei der Vorlage unerwünscht ein durchgehendes Muster erzeugen, das aus den einander benachbarten und miteinander verbundenen Zeichen besteht.
  • Zur Trennung derartiger benachbarter Bilder oder Muster in einzelne Zeichenbilder sind zu Ermöglichung einer Zeichenerkennung Verfahren vorgeschlagen worden, unter denen das am meisten verbreitete Verfahren eines ist, das ein Histogramm einer Projektion des Bildes in Richtung der Zeichenfolge (der Richtung der Schriftzeile) verwendet.
  • Dieses bekannte Zeichentrennverfahren ist nachstehend unter Bezug auf Fig. 7 und 8 beschrieben. Es sei dabei angenommen, daß die Zeichen "a" und "c" einer Vorlage optisch gelesen wurden und daß wie in Fig. 7 gezeigt ein zusammengesetztes Bild erhalten worden ist, das aus einander benachbarten Bildem der Zeichen "a" und "c" besteht. Wenn das Verhältnis der Höhe zur Breite eines einhüllenden Rechtecks 201 dieses zusammengesetzten Bildes gleich oder unter einem bestimmten Wert ist, d.h. wenn dieses zusammengesetzte Bild horizontal sehr verlängert ist, wird bestimmt, daß das Bild ein zusammengesetztes Bild ist, das aus aufeinanderfolgenden, einander benachbarten Zeichen besteht, und daß ein Bedarf zur Trennung dieses zusammengesetzten Bildes in Bilder der einzelnen Zeichen "a" und "c" vorhanden ist. Zur Befriedigung dieses Bedarfes wird ein Bereich 202, in dem die Trennung durchzuführen ist, auf der Grundlage der das einhüllende Rechteck 201 betreffenden Informationen bestimmt, wobei schwarze Bildelemente, die dieses zusammengesetzte Bild erzeugen, auf der x- Achse eines Koordinatensystems derart projiziert werden, daß wie in Fig. 8 gezeigt ein Histogramm 203 erhalten wird, das die Häufigkeit des Auftretens schwarzer Bildelemente entlang der Zeichenfolge darstellt. Dann wird wie in Fig. 8 gezeigt eine x-Koordinate XC bestimmt, die innerhalb des vorstehend erwähnten Bereichs 202 liegt und einen Histogrammwert d(x) aufweist, der nicht größer als ein vorbestimmter Schwellwert d0 ist. Wenn eine Vielzahl derartiger x-Koordinaten XC auftreten, wird der gemittelte Wert als die Koordinate XC bestimmt.
  • Das zusammengesetzte Bild wird dann an dem der x-Koordinate XC entsprechenden Abschnitt in getrennte Zeichenbilder "geschnitten" bzw. durchtrennt. Somit wird, wenn das Verhältnis der Höhe zur Breite gleich oder unter einem vorbestimmten Wert ist, das gelesene zusammengesetzte Bild derart bestimmt, daß es eine Kombination aus Bildern aufeinanderfolgender Zeichen ist, und der Bereich 202, in dem das zusammengesetzte Zeichen zu durchtrennen ist, auf der Grundlage der Form des zusammengesetzten Bildes eingestellt. Dann wird das zusammengesetzte Bild in getrennte Zeichenbilder bei einem Abschnitt davon durchtrennt, bei dem die Häufigkeit des Auftretens von schwarzen Bildelementen innerhalb des eingestellten Bereichs am größten ist, d.h. bei dem Abschnitt, bei dem der Grad der Verbindung zwischen einer Vielzahl von Bildelementgruppen am schwächsten ist.
  • Dieses bekannte Verfahren wird jedoch durch den Nachteil be einträchtigt, daß die Trennung der Zeichenbilder häufig durch den Einfluß von Rauschen behindert wird, da die Position, an der das zusammengesetzte Bild "geschnitten" bzw. durchtrennt wird, auf der Grundlage des Histogramms der schwarzen Bildelemente bestimmt wird.
  • Beispielsweise wird ein in Fig. 10 gezeigtes Histogramm erhalten, wenn ein Fleck auf dem Vorlagenbild zur Ausbildung eines in Fig. 9 gezeigten Bildes 204 optisch gelesen wird, oder wenn Zeichen der unmittelbar der gerade gelesenen Zeile vorangehenden Zeile sich genügend weit bei dem abgetasteten Nanuskript oder dergleichen nach unten erstrecken, so daß diese mitgelesen werden.
  • Das Bild 204 des Flecks vergrößert die Zahl der schwarzen Bildelemente auf der x-Koordinate XC auf einen Wert, der größer als der Schwellwert d&sub0; ist. Anders ausgedrückt gibt es keine x-Koordinate, bei der die Projektion der schwarzen Bildelemente gleich oder unter dem Schwellwert d&sub0; liegt (vergl. Fig. 10). Folglich kann das aus zusammengesetzte Bild, das aus einander benachbarten Zeichenbildern besteht, nicht korrekt in getrennte Zeichenbilder getrennt werden, weshalb es unmöglich ist, diese Zeichen zu erkennen.
  • Der Artikel "Recognition of isolated and simply connected handwritten numerals" von M. Shridar & A. Badrelin in der "Pattern Recognition", Band 19, Nr. 1, 1986, Elmsford, New York, USA, Seiten 1 - 12, offenbart einen Vorgang zur Trennung verbundener Zahlen.
  • Dementsprechend liegt der Erfindung die Aufgabe zugrunde, ein Verfahren und ein Gerät zur Trennung von Bildbereichen zu schaffen, die es ermöglichen, daß ein zusammengesetzter Bildbereich in getrennte oder diskrete Bildbereiche entsprechend beispielsweise getrennten oder diskreten Zeichen durchtrennt werden kann, wodurch die vorstehend beschriebenen Nachteile gemäß dem Stand der Technik überwunden werden.
  • Gemäß einer ersten Ausgestaltung der Erfindung ist ein in Patentanspruch 1 dargelegtes Bildtrenngerät geschaffen.
  • Gemäß einer zweiten Ausgestaltung der Erfindung ist ein wie in Patentanspruch 7 dargelegtes Bildtrennverfahren geschaffen.
  • KURZBESCHREIBUNG DER ZEICHNUNG
  • Fig. 1 zeigt ein Blockschaltbild eines erfindungsgemäß aufgebauten Zeichnerkennungsgeräts,
  • Fig. 2 zeigt ein Flußdiagramm, das einen gemäß einem ersten Ausführungsbeispiel der Erfindung durchgeführten Zeichentrennvorgang darstellt,
  • Fig. 3 zeigt eine Darstellung eines zusammengesetzten Bildes, bei dem Bilder zweier Zeichen einander benachbart sind,
  • Fig. 4(A) zeigt eine Darstellung einer Anordnung des zusammengesetzten Bildes, das durch Koordinaten des oberen und des unteren Randes des zusammengesetzten Bildes definiert ist,
  • Fig. 4(B) zeigt eine Darstellung der Verteilung der Differenz zwischen den Koordinaten des oberen und des unteren Endes,
  • Fig. 5 zeigt ein Flußdiagramm, daß einen Zeichentrennvorgang zeigt, der gemäß einem zweiten Ausführungsbeispiel der Erfindung angewendet wird,
  • Fig. 6 zeigt ein Flußdiagramm, das einen gemäß einem dritten Ausführungsbeispiel der Erfindung angewendeten Zeichentrennvorgang darstellt,
  • Fig. 7 bis 10 zeigen Darstellungen der Grundzüge eines herkömmlichen Zeichentrennvorgangs und
  • Fig. 11 zeigt eine Darstellung des Prinzips des Vorgangs gemäß dem zweiten Ausführungsbeispiel der Erfindung.
  • BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSBEISPIELE
  • Die Erfindung wird nachstehend unter Bezugnahme auf die beiliegende Zeichnung näher beschrieben.
  • Gemäß Fig. 1 weist ein die Erfindung verkörperndes Zeichenerkennungsgerät eine Haupteinheit 100 mit einer Zentraleinheit (CPU) 1 zur Steuerung der Funktion des gesamten Geräts, einem Festspeicher (ROM) 2, der Programme von durch die Zentraleinheit 1 auszuführenden, in den Flußdiagrammen gemäß Fig. 2, 5 und 6 gezeigten Vorgängen speichert, einem Speicher mit wahlfreiem Zugriff (RAM) 3, der als Arbeitsbereich für die Zentraleinheit 1 dient, einer Bildleseeinrichtung 4, die das Bild einer Vorlage liest, und einem Bildspeicher 5 auf, der das gelesene Bild entwickelt. Das Gerät weist außerdem eine Erkennungseinheit 5 zur Erkennung von Bildmustern eines Zeichens auf, das aus den in dem Bildspeicher 6 entwickelten Bilddaten durchtrennt worden ist, eine Nachschlageeinheit 7, auf die sich die Erkennungseinheit 6 während der Erkennungsverarbeitung bezieht, und eine Ausgabeeinheit auf, durch die das Ergebnis der Erkennung ausgegeben wird.
  • Der Ablauf einer durch das Zeichenerkennungsgerät durchgeführten Verarbeitung ist nachstehend unter Bezug auf Fig. 2 beschrieben. Ein Vorlagenbild ist durch die Bildleseeinrichtung 4 gelesen und in dem Bildspeicher 5 als binäres Bild entwickelt worden.
  • Bei einem Schritt S1 wird das entwickelte Bild aus dem Bildspeicher 5 empfangen. Bei einem Schritt S2 wird die Form (der Umriß) des Zeichens durch ein bekanntes Verfahren nachgefolgt, das typischerweise ein Verfahren ist, das den Bildelemente eines nach dem anderen nachfolgt. Fig. 3 zeigt die durch das Nachfolgen (tracing) bestimmte Form. Das Nachfolgen wird bei einem Punkt 101 begonnen und nach Bestimmen der Form 103 bei dem Punkt 101 beendet. Gemäß diesem Ausführungsbeispiel ist es nicht notwendig, den inneren Umriß 104 des Bildes zu gewinnen. Gemäß Fig. 4(A) ist der äußere Umriß allein dargestellt.
  • Bei einem Schritt S3 wird ein das Bild einhüllendes Rechteck 102 auf der Grundlage der bei dem Schritt S2 erhaltenen Figu reninformationen bestimmt. Bei einem Schritt S4 wird das Verhältnis R der Höhe zu der Länge des einhüllenden Rechtecks 102 bestimmt und ob das Verhältnis R gleich oder kleiner als ein vorbestimmter Schwellwert R&sub0; ist, d.h. ob das Bild horizontal zu einem derartigen Ausmaß verlängert ist, daß zu ver muten ist, daß es sich bei dem Bild um ein zusammengesetztes Bild handelt, das aus zwei oder mehreren einander benachbarten und miteinander verbundenen Zeichen besteht. Somit läßt R > R&sub0; vermuten, daß das Bild ein einzelnes Zeichen darstellt. Wenn diese Bedingung erfüllt wird, schreitet die Ver arbeitung zu einem Schritt S5 weiter, bei dem die Bilddaten ohne Durchführung einer Zeichentrennung der Erkennungseinheit 6 zugeführt werden. Demgegenüber läßt R ≤ R&sub0; vermuten, daß das gelesene Bild ein zusammengesetztes Bild ist, das aus einer Vielzahl von einander benachbarten Zeichen besteht. In diesem Fall schreitet die Verarbeitung zu einem Schritt S6 weiter, bei dem ein Vorgang zur Bestimmung des Bereichs ausgeführt wird, bei dem die Trennung, d.h. das Durchtrennen, des Bildes in getrennte Zeichenbilder durchzuführen ist. Fig. 3 veranschaulicht das Verfahren zur Bestimmung des Bereichs, in dem die Trennung durchzuführen ist. Gemäß dieser Figur entspricht die x-Achse bzw. Abszisse der Richtung der Zeichenfolge. Der x-Koordinatenwert 0 fällt mit dem linken Rand des einhüllenden Rechtecks zusammen. Die x-Koordinaten X&sub1; und X&sub2; des Bereichs 105, bei dem die Trennung durchzuführen ist, werden derart bestimmt, daß sie die nachstehenden Bedingungen erfüllen:
  • XC = W/2
  • X&sub1; = XC - α
  • X&sub2; = Xc + α
  • α = γ h,
  • wobei W und h jeweils die Breite (bzw. die Länge) und die Höhe des einhüllenden Rechtecks darstellen, während γ eine vorbestimmte Konstante ist.
  • Wie aus Fig. 4(A) hervorgeht, ist die Form 103 des Bildes durch zwei Formlinien bestimmt, nämlich eine obere Formlinie Y&sub2; und eine untere Formlinie Y&sub1;, die in der Richtung senkrecht zu der Datenfolge voneinander beabstandet sind. Bei einem Schritt S7 werden diese (gemäß Fig. 3 als untere und obere Ränder bezeichnete) Formlinien bezüglich der x-Koordinaten als zwei Funktionen Y&sub2;(x) und Y&sub1;(x) bestimmt.
  • Bei einem Schritt S8 wird die Differenz S(x) zwischen der oberen und der unteren Formlinie wie nachstehend beschrieben entlang der x-Achse bestimmt:
  • S(x) = Y&sub2;(x) - Y&sub1;(x)
  • Bei einem Schritt S9 wird der Wert S(x) der Differenz bei jeder in den Trennungsbereich 105 fallenden x-Koordinate mit einem vorbestimmten Schwellwert S&sub0; verglichen. Die x-Koordinate, die einem die Bedingung S(x) < S0 erfüllenden Differenzwert S(x) entspricht, wird als x-Koordinate XC bestimmt, bei der das Durchtrennen bzw. Trennen durchzuführen ist. Wenn eine Vielzahl von x-Koordinaten die vorstehend beschriebene Bedingung erfüllen, wird der Mittelwert dieser x-Koordinaten als die x-Koordinate XC verwendet, bei der das Bild zu trennen ist. Fig. 4(B) zeigt das Histogramm des Differenzwertes S(x).
  • Das Durchtrennen oder die Trennung ist nicht möglich, wenn keine x-Koordinate die Bedingung S(x) < S&sub0; erfüllt. In einem derartigen Fall schreitet die Verarbeitung zu einem Schritt S10 weiter, bei dem das ganze zu untersuchende Bild der Erkennungseinheit 6 zugeführt wird, oder es wird ein geeignetes Unterprogramm zur Behandlung dieses Bildes als ein nicht zu identifizierendes Bild gestartet.
  • Wenn die x-Koordinate XC bestimmt ist, bei der das Bild zu durchtrennen ist, schreitet die Verarbeitung zu einem Schritt S11 weiter, bei dem zum Durchtrennen des Bildes in ein Bild eines ersten Zeichens links der x-Koordinate XC und ein Bild eines Zeichens rechts der x-Koordinate XC alle Bildelemente bei der x-Koordinate XC in den weißen Zustand verändert werden. Diese durch die beschriebene Trennverarbeitung erhaltenen getrennten Zeichen werden bei einem Schritt S12 nacheinander der Erkennungseinheit 6 zugeführt.
  • Nachstehend ist unter Bezug auf ein in Fig. 5 gezeigtes Flußdiagramm ein zweites Ausführungsbeispiel beschrieben. Gemäß diesem Ausführungsbeispiel werden die Koordinaten des oberen und des unteren Randes, d.h. der oberen und der unteren Formlinie des Bildes gleichzeitig während des Verlaufs der Bestimmung der Formlinie bestimmt.
  • Ein ausreichend, kleiner Wert wird als obere Randkoordinate Y&sub2;(x) für alle Zeichen bestimmt. Ahnlich werden ausreichend große Koordinaten als die untere Randkoordinate Y&sub1;(x) für alle Zeichen bestimmt. Die x-Koordinate x wechselt von 0 auf 1, 1 auf 2 und schließlich auf W, die der Breite bzw. der Länge des Rechtecks, d.h. der x-Koordinate des rechten Rands des Rechtecks entspricht.
  • Bei einem Schritt S22 wird der Wert y der xy-Koordinaten jedes Bildelements auf der nachgefolgten Formlinie bzw. Profillinie des Zeichens mit den vorstehend erwähnten gespeicherten Koordinaten Y&sub2;(x) und Y&sub1;(x) verglichen. Falls die Bedingung y > Y&sub2;(x) erfüllt wird, wird der Koordinatenwert Y&sub2;(x) dadurch aktualisiert, daß er durch den Wert y ersetzt wird. Annlich wird der Koordinatenwert Y&sub1;(x) dadurch aktualisiert, daß er durch y ersetzt wird, wenn die Bedingung y < Y&sub1;(x) erfüllt wird. Folglich sind alle Werte Y&sub1;(x) und Y&sub2;(x) erhalten, wenn das Nachfolgen der Formlinie beendet ist.
  • Diese Verarbeitung ist unter Bezug auf Fig. 11 näher beschrieben.
  • Während des Nachfolgens der Form 50 eines Zeichenbildes erscheinen mehr als zwei Punkte, beispielsweise wie in Fig. 11 veranschaulicht 4 Punkte A&sub1; bis A&sub4; für eine gegebene x Koordinate. Gemäß diesem Ausführungsbeispiel werden die Koordinaten der Punkte A&sub1; und A&sub4; als die Koordinaten des oberen und des unteren Rands betrachtet, wobei ein wie in Fig. 11 gezeigtes Muster 51 erhalten wird. Dabei werden wie vorstehend beschrieben der Wert y der xy-Koordinaten jedes während des Nachfolgens aufeinanderfolgend auf der Formlinie erfaßten Bildelements mit jeder oberen Randkoordinate Y&sub2;(x) verglichen, die vorab an derselben x-Koordinate x erhalten worden ist, wobei, wenn die Bedingung y > Y&sub2;(x) erfüllt wird, der Wert der oberen Randkoordinate Y&sub2;(x) durch den Wert y ersetzt wird. Folglich wird der Wert y der Koordinaten des Punktes A1 als die obere Randkoordinate Y&sub2;(x) für die vorstehend beschriebene x-Koordinate übernommen. Die untere Randkoordinate Y&sub1;(x) wird ebenfalls durch dasselbe Prinzip wie vorstehend beschrieben bestimmt.
  • Gemäß dem zweiten Ausführungsbeispiel sind die Schritte von S23 aufwärts dieselben wie die gemäß dem ersten Ausführungsbeispiel, so daß deren Beschreibung entfällt.
  • Gemäß einem dritten Ausführungsbeispiel der Erfindung wird die Position, an der das zusammengesetzte Bild zu durchtrennen ist, durch Veränderung des Schwellwerts S0 des Differenzwerts S(x) bestimmt.
  • Gemäß dem dritten Ausführungsbeispiel wird eine Verarbeitung angewendet, die durch ein Flußdiagramm gemäß Fig. 6 dargestellt ist. Genauer zeigt dieses Flußdiagramm lediglich Schritte, die den in Fig. 2 gezeigten Schritten S9 bis S12 gemäß dem ersten Ausführungsbeispiel entsprechen. Andere Abschnitte der Verarbeitung sind nicht beschrieben, da sie im wesentlichen identisch zu denen gemäß dem ersten Ausführungsbeispiel sind. Gemäß dem vorstehend beschriebenen Ausfüh rungsbeispiel wird dort ein einfaches, die Unmöglichkeit einer Zeichentrennung angebenes Zeichen gegeben, wenn keine x- Koordinate die Bedingung S(x) &le; S&sub0; erfüllt. Demgegenüber wird gemäß dem dritten Ausführungsbeispiel der Trennvorgang nach Veränderung des Schwellwerts S0 und der Breite XC ± &alpha; des Bereichs wiederholt durchgeführt, bei dem das Bild zu durchtrennen ist.
  • Bei einem Schritt S41 wird eine Steuervariable i auf 1 eingestellt. Bei einem Schritt S42 werden der Schwellwert S&sub0; und der Schwellwertfaktor &alpha; jeweils auf Si bzw. &alpha;i eingestellt. Gemäß dem veranschaulichten Ausführungsbeispiel wird die Steuervariable i als i = 1, 2 und 3 verändert, wobei eine Vielzahl von Schwellwertkombinationen (S1, &alpha;1), (S2, &alpha;2) und (S3, &alpha;3) vor der Verarbeitung unter den Bedingungen S1 < S2 < S3 und &alpha;1 > &alpha;2 > &alpha;3 bestimmt wird.
  • Bei einem Schritt S43 wird nach jeder x-Koordinate x gesucht, die in den Bereich zwischen X&sub1; und X&sub2; fallen, die wie nachstehend beschrieben bestimmt ist und die Bedingung S(x) &le; Si erfüllt. Eine derartige x-Koordinate x wird, falls vorhanden, als x-Koordinate XC verwendet, bei der das Bild zu durchtrennen ist. Die Verarbeitung schreitet dann zu einem Schritt S44 weiter, bei dem das Bild in zwei Abschnitte durchtrennt wird, die jeweils Bilder zweier einzelner Zeichen sind. Die getrennten Zeichenbilder werden dann einem bei einem Schritt S45 ausgeführten Erkennungsvorgang unterzogen. Falls es keine x-Koordinate gibt, die die vorstehend beschriebenen Bedingungen erfüllt, schreitet die Verarbeitung zu einem Schritt S46 weiter, bei dem die Variable i für jeden der Schwellwerte S&sub0; und &alpha; um eins erhöht wird. Bei einem Schritt S47 wird der Wert der Variablen i untersucht. Wenn der Wert größer als 3 ist (i > 3), schreitet die Verarbeitung zu einem Schritt S48 weiter, bei dem das zu untersuchende Bild der Erkennungseinheit 6 zugeführt wird, ohne daß es durchtrennt worden ist. Jedoch kehrt, falls der Wert der Variablen i nicht größer als 3 ist (i &le; 3), die Verarbeitung zu dem Schritt S42 zur Wiederholung des beschriebenen Vorgangs zurück.
  • Gemäß dem dritten Ausführungsbeispiel wird deshalb zunächst eine Suche innerhalb eines breiten Bereichs für eine Verbindung zwischen zwei Zeichenbildern durchgeführt und dann, wenn keine derartige Verbindung gefunden wird, die Suche über einen engeren Bereich erneut durchgeführt. Wenn eine derartige Verbindung in dem eingeengten Bereich der Suche erfaßt wird, wird die Zeichentrennung bei einer Position einer derartigen Verbindung durchgeführt, selbst wenn die Verbindung eher stark ausgeprägt ist.
  • Gemäß den vorstehend beschriebenen ersten bis dritten Ausführungsbeispielen werden durch eine Bildleseeinrichtung 4 gelesene Zeichen bei einem Vorlagentext erkannt und die Ergebnisse der Erkennung zu einer geeigneten externen Einrichtung ausgegeben. Eine derartige Verwendung des Erkennungsergebnisses ist lediglich veranschaulichend. Das heißt, daß die Erkennungsergebnisse zu einer Anzeigeeinrichtung zur Anzeige der erkannten Zeichen oder zu einer Einrichtung gesendet werden können, die die aus den erkannten Zeichen zusammengesetzten Worte verarbeiten kann.
  • Es ist ebenfalls verständlich, daß die Erfindung auch auf einen Fall angewandt werden kann, bei dem die Zeichen in vertikalen Folgen angeordnet sind, obwohl die Erkennung von hon zontale Folgen bildenden Zeichen besonders beschrieben worden ist. Das erfindungsgemäße Gerät ist, wenn es bei vertikalen Zeichenfolgen angewendet wird, zur Bestimmung der Trennposition auf der Grundlage von Verteilungen der größten und kleinsten Koordinatenwerte x entlang einer Achse y ausgelegt, die parallel zu der Richtung der vertikalen Zeichenfolgen verläuft. Weiterhin ist es verständlich, daß die Erfindung nicht auf die Verwendung schwarzer Zeichen auf einem weißen Hintergrund beschränkt ist, sondern auf alle digitalisiert eingegebenen Zeichendaten anwendbar ist, die durch Farbe oder Abstufung bzw. Gradation vom Hintergrund unterscheidbar sind.
  • Wie aus der vorstehenden Beschreibung verständlich ist, wird erfindungsgemäß die Bestimmung der Position, an der ein nicht identifiziertes Bild zu durchtrennen ist, auf der Grundlage der Verteilung der Abstände zwischen dem oberen und dem unteren Rand der Formlinie durchgeführt, im Gegensatz zu dem herkömmlichen Verfahren, das einfach auf die Häufigkeit des Auftretens schwarzer Bildelemente beruht. Deshalb ist es möglich, jedes schwarze Bildelement oder Bildelemente auszuschließen, die nicht mit der kontinuierlich nachgefolgten Formlinie verbunden sind und als Folge beispielsweise eines Flecks auf der Vorlage oder irrtümlichen Lesens einer benach barten Zeile erzeugt werden. Somit wird erfindungsgemäß die Glaubwürdigkeit und die Verläßlichkeit der Trennung von Zeichenbildern durch die Wirkung der Beseitigung von Störungen verbessert, die durch das Vorhandensein eines Flecks auf der Vorlage oder durch ein irrtümliches Lesen einer benachbarten Zeile verursacht werden, und somit die Fähigkeit zur Erkennung und Identifizierung von gelesenen Zeichen deutlich verbessert.

Claims (11)

1. Bildtrenngerät zur Trennung von einander benachbarten Zeichen mit
einer Erfassungseinrichtung (CPU1, 5) zur Erfassung von Koordinateninformationen bezüglich eines oberen Umrisses (Y&sub2;) und eines unteren Umrisses (Y&sub1;) eines betreffenden Zeichenbildes bei aus einer Vorlage eingegebenen Bildinformationen,
gekennzeichnet durch
eine Abstandsberechnungseinrichtung, die auf der Grundlage der durch die Erfassungseinrichtung erhaltenen Koordinateninformationen
Abstandsinformationen (s(x)) berechnet, die sich auf den Abstand zwischen jedem Punkt an dem oberen Umriß (Y&sub2;) und einem entsprechenden Punkt an dem unteren Umriß (Y&sub1;) beziehen, die jeweils in einer Richtung senkrecht zu der durch die Bildinformationen dargestellten Zeichenfolge gemessen werden,
eine Vergleichseinrichtung zum Vergleich der Abstandsinformationen (s(x)) mit einem vorbestimmten Schwellwert (s0) und
eine Trennbereichs-Bestimmungseinrichtung zur Bestimmung einer Position (Xc), bei der das betreffende Zeichenbild in getrennte Zeichenbilder zu durchtrennen ist, auf der Grundlage der Vergleichsergebnisse.
2. Gerät nach Anspruch 1, gekennzeichnet durch eine Einrichtung zur Bestimmung, ob das betreffende Zeichenbild in getrennte Zeichenbilder zu durchtrennen ist, auf der Grundlage des Verhältnisses der Höhe zu der Breite eines einhüllenden Rechtecks (102) um das betreffende Zeichen, wobei die Abstandsberechnungseinrichtung nur dann aktiviert wird, wenn die Bestimmungseinrichtung bestimmt hat, daß das betreffende Zeichenbild in getrennte Bilder zu durchtrennen ist.
3. Gerät nach Anspruch 1, gekennzeichnet durch eine Bereichsberechnungseinrichtung zur Berechnung eines Bereichs (x&sub1;-x&sub2;), bei dem das Durchtrennen des betreffenden Bildes in getrennte Bilder durchzuführen ist, auf der Grundlage des Verhältnisses der Höhe zu der Breite eines einhül lenden Rechtecks um das betreffende Zeichen, wobei die Trennpositions-Bestimmungseinrichtung die Position innerhalb des durch die Bereichsberechnungseinrichtung berechneten Bereichs bestimmt.
4. Gerät nach Anspruch 1, dadurch gekennzeichnet, daß die Trennpositions-Bestimmungseinrichtung eine Position, bei der die durch die Abstandsbestimmungseinrichtung berechneten Abstandsinformationen (S(x)) gleich oder kleiner als der vorbestimmte Schwellwert sind, als die Position bestimmt, an der das betreffende Bild zu durchtrennen ist.
5. Gerät nach Anspruch 4, dadurch gekennzeichnet, daß, wenn keine durch die Abstandsberechnungseinrichtung berechneten Abstandsinformationen gleich oder kleiner als der vorbestimmte Schwellwert sind, die Trennpositions-Bestimmungseinrichtung den Positionsbestimmungsvorgang nach Veränderung des vorbestimmten Schwellwerts erneut durchführt.
6. Gerät nach einem der vorangehenden Ansprüche, gekennzeichnet durch eine Bildleseeinrichtung zur Eingabe eines Bildes der Vorlage als Bildinformationen.
7. Bildtrennverfahren zum Trennen von einander benachbarten Zeichen, mit den Schritten:
Erfassen (s2) von Koordinateninformationen, die den oberen Umriß (Y&sub2;) und den unteren Umriß (Y&sub1;) eines betreffenden Zeichenbildes bei aus einer Vorlage eingegebenen Bildinformationen betreffen,
gekennzeichnet durch
Berechnen (s8) des Abstands (s(x)) zwischen jedem Punkt an dem oberen Umriß (Y&sub2;) und einem entsprechenden Punkt an dem unteren Umriß (Y&sub1;), die jeweils in einer Richtung senkrecht zu der durch die Bildinformationen dargestellte Zeichenfolge gemessen werden,
Vergleichen (s9) der berechneten Abstände (s(x)) mit ei-, nem vorbestimmten Schwellwert (s0) und
Bestimmen einer Position (Xc), bei der das betreffende Zeichenbild in getrennte Zeichenbilder zu durchtrennen ist, auf der Grundlage der Vergleichsergebnisse.
8. Verfahren nach Anspruch 7, gekennzeichnet durch den Schritt Berechnen (s6) eines Bereichs (x&sub1;-x&sub2;), bei dem das Durchtrennen des betreffenden Zeichenbildes in getrennte Bilder durchzuführen ist, auf der Grundlage des Verhältnisses der Höhe zu der Breite eines einhüllenden Rechtecks (102) um das betreffende Zeichenbild, wobei der Schritt Bestimmen der Position, bei der das Bild zu durchtrennen ist, zur Bestimmung der Position innerhalb des durch den Bereichsberechnungsschritts (s6) berechneten Bereichs durchgeführt wird.
9. Verfahren nach Anspruch 7 oder 8, dadurch gekennzeichnet, daß die Position, bei der das betreffende Bild zu durchtrennen ist, als eine Position bestimmt wird, bei der der bei dem Schritt Abstandsberechnen berechnete Abstand gleich oder kleiner als der vorbestimmte Schwellwert (s0) ist.
10. Verfahren nach einem der Ansprüche 7 bis 9, dadurch gekennzeichnet, daß wenn kein bei dem Schritt Abstandsberechnen berechneter Abstand gleich oder kleiner als der Schwellwert ist, der Schritt Erfassen der Position, an der das betreffende Bild zu durchtrennen ist, erneut durchgeführt wird, nachdem der Schwellwert verändert worden ist.
11. Verfahren nach einem der Ansprüche 7 oder 10, dadurch gekennzeichnet, daß das Zeichenbild ein binäres Bild ist.
DE69125777T 1990-09-03 1991-08-30 Verfahren und Gerät zur Trennung von Bildbereichen Expired - Lifetime DE69125777T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2230600A JP2868134B2 (ja) 1990-09-03 1990-09-03 画像処理方法及び装置

Publications (2)

Publication Number Publication Date
DE69125777D1 DE69125777D1 (de) 1997-05-28
DE69125777T2 true DE69125777T2 (de) 1997-10-09

Family

ID=16910286

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69125777T Expired - Lifetime DE69125777T2 (de) 1990-09-03 1991-08-30 Verfahren und Gerät zur Trennung von Bildbereichen

Country Status (4)

Country Link
US (1) US5535287A (de)
EP (1) EP0476873B1 (de)
JP (1) JP2868134B2 (de)
DE (1) DE69125777T2 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0632402B1 (de) * 1993-06-30 2000-09-06 International Business Machines Corporation Verfahren zum Segmentieren von Bildern und Klassifizieren von Bildelementen zur Dokumentverarbeitung
JPH08235310A (ja) * 1995-02-24 1996-09-13 Nec Corp 接触文字切り出し装置
JP3155499B2 (ja) * 1997-11-26 2001-04-09 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 光ディスクのビット変換の方法、復調方法および装置
JP2000181993A (ja) * 1998-12-16 2000-06-30 Fujitsu Ltd 文字認識方法および装置
JP3880044B2 (ja) * 2002-02-22 2007-02-14 富士通株式会社 手書き文字入力支援装置及び方法
JP2004038321A (ja) * 2002-06-28 2004-02-05 Fujitsu Ltd 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4206442A (en) * 1974-07-03 1980-06-03 Nippon Electric Co., Ltd. Letter segmenting apparatus for OCR comprising multi-level segmentor operable when binary segmenting fails
JPS5814281A (ja) * 1981-07-17 1983-01-27 Toshiba Corp 光学的文字読取装置
JPS59158479A (ja) * 1983-03-01 1984-09-07 Nec Corp 文字分離装置
JPS61105680A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 光学文字読取装置の文字切出し方法
US5046114A (en) * 1985-10-01 1991-09-03 The Palantir Corporation Method and structure for separating joined patterns for use in pattern and character recognition system
US4769849A (en) * 1985-12-19 1988-09-06 The Palantir Corporation Method and apparatus for separating overlapping patterns
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法

Also Published As

Publication number Publication date
EP0476873B1 (de) 1997-04-23
US5535287A (en) 1996-07-09
DE69125777D1 (de) 1997-05-28
JP2868134B2 (ja) 1999-03-10
EP0476873A3 (en) 1993-10-13
EP0476873A2 (de) 1992-03-25
JPH04112283A (ja) 1992-04-14

Similar Documents

Publication Publication Date Title
DE69226846T2 (de) Verfahren zur Bestimmung von Wortgrenzen im Text
DE69230632T2 (de) Optische Worterkennung durch Wortgestaltuntersuchung
DE69230631T2 (de) Verfahren zum Vergleichen von Wortgestalten
DE69230633T2 (de) Verfahren zur Ermittlung von Wortformen zum folgenden Vergleich
DE69130469T2 (de) Gerät und Verfahren zur Bildverarbeitung
DE69926205T2 (de) Artefaktentfernungstechnik für schiefenkorrigierte bilder
DE4311172C2 (de) Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes
DE69032344T2 (de) Verfahren zum Messen von Neigungswinkeln
DE3881392T2 (de) System und Verfahren für automatische Segmentierung.
DE69129520T2 (de) Verbessertes Segmentierungsverfahren für das maschinelle Lesen von handgeschriebener Information
DE69600461T2 (de) System und Verfahren zur Bewertung der Abbildung eines Formulars
DE3633743C2 (de)
DE69715076T2 (de) Vorrichtung zur Erzeugung eines Binärbildes
DE69618068T2 (de) Verfahren und Vorrichtung zum Durchführen von Text und Bildsegmentation
DE68923650T2 (de) Bildverarbeitungsverfahren.
DE69425084T2 (de) Verfahren und Gerät zur Erkennung von Textzeilen, Wörtern und räumlichen Merkmalen von Zeichenzellen
DE69225540T2 (de) Bildverarbeitungsvorrichtungen
DE69521184T2 (de) Gerät zur Bildverarbeitung gemäss einem lokal ermittelten Bildregionentyp
DE69029594T2 (de) Ermittlung von Linienabschnitten und von vorbestimmten Mustern in einem optisch abgetasteten Dokument
DE68928703T2 (de) Buchstabenerkennungsvorrichtung
DE69925354T2 (de) Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren
DE3716787A1 (de) Zeichenerkennungsverfahren
DE19956158A1 (de) Bild-Binärisierungsverfahren auf Bereichsbasis
DE69013378T2 (de) Anordnung zur Umsetzung von Bildumrissdaten in Bildpunkte darstellende Punktdaten.
DE69627424T2 (de) Bildverarbeitungsverfahren und Gerät

Legal Events

Date Code Title Description
8364 No opposition during term of opposition