DE69125777T2 - Verfahren und Gerät zur Trennung von Bildbereichen - Google Patents
Verfahren und Gerät zur Trennung von BildbereichenInfo
- Publication number
- DE69125777T2 DE69125777T2 DE69125777T DE69125777T DE69125777T2 DE 69125777 T2 DE69125777 T2 DE 69125777T2 DE 69125777 T DE69125777 T DE 69125777T DE 69125777 T DE69125777 T DE 69125777T DE 69125777 T2 DE69125777 T2 DE 69125777T2
- Authority
- DE
- Germany
- Prior art keywords
- image
- character
- distance
- question
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 20
- 238000000926 separation method Methods 0.000 claims description 26
- 238000001514 detection method Methods 0.000 claims 2
- 239000002131 composite material Substances 0.000 description 21
- 238000010586 diagram Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
- Die Erfindung betrifft ein Verfahren und ein Gerät zur Trennung benachbarter Bildbereiche.
- In den letzten Jahren wurde Geräte vorgeschlagen, die optisch und unmittelbar Zeicheninformationen unter Verwendung optischer Einrichtungen wie Bildabtastvorrichtungen eingeben können. Derartige Geräte sind sehr nützlich, da sie die Eingabe von Zeicheninformationen aus handgeschriebenen, gedruckten oder gesetzten Zeichen ermöglichen. Bei Verwendung dieser Geräte wird jedoch die Erkennung einzelner Zeichen durch die Tatsache behindert, daß aufgrund verschiedener Gründe wie einer praktischen Grenze der Auflösung der Bildabtastvorrichtung, Flecken auf dem Vorlagendokument usw. die optisch gelesenen Bilder zweier oder mehrerer Zeichen bei der Vorlage unerwünscht ein durchgehendes Muster erzeugen, das aus den einander benachbarten und miteinander verbundenen Zeichen besteht.
- Zur Trennung derartiger benachbarter Bilder oder Muster in einzelne Zeichenbilder sind zu Ermöglichung einer Zeichenerkennung Verfahren vorgeschlagen worden, unter denen das am meisten verbreitete Verfahren eines ist, das ein Histogramm einer Projektion des Bildes in Richtung der Zeichenfolge (der Richtung der Schriftzeile) verwendet.
- Dieses bekannte Zeichentrennverfahren ist nachstehend unter Bezug auf Fig. 7 und 8 beschrieben. Es sei dabei angenommen, daß die Zeichen "a" und "c" einer Vorlage optisch gelesen wurden und daß wie in Fig. 7 gezeigt ein zusammengesetztes Bild erhalten worden ist, das aus einander benachbarten Bildem der Zeichen "a" und "c" besteht. Wenn das Verhältnis der Höhe zur Breite eines einhüllenden Rechtecks 201 dieses zusammengesetzten Bildes gleich oder unter einem bestimmten Wert ist, d.h. wenn dieses zusammengesetzte Bild horizontal sehr verlängert ist, wird bestimmt, daß das Bild ein zusammengesetztes Bild ist, das aus aufeinanderfolgenden, einander benachbarten Zeichen besteht, und daß ein Bedarf zur Trennung dieses zusammengesetzten Bildes in Bilder der einzelnen Zeichen "a" und "c" vorhanden ist. Zur Befriedigung dieses Bedarfes wird ein Bereich 202, in dem die Trennung durchzuführen ist, auf der Grundlage der das einhüllende Rechteck 201 betreffenden Informationen bestimmt, wobei schwarze Bildelemente, die dieses zusammengesetzte Bild erzeugen, auf der x- Achse eines Koordinatensystems derart projiziert werden, daß wie in Fig. 8 gezeigt ein Histogramm 203 erhalten wird, das die Häufigkeit des Auftretens schwarzer Bildelemente entlang der Zeichenfolge darstellt. Dann wird wie in Fig. 8 gezeigt eine x-Koordinate XC bestimmt, die innerhalb des vorstehend erwähnten Bereichs 202 liegt und einen Histogrammwert d(x) aufweist, der nicht größer als ein vorbestimmter Schwellwert d0 ist. Wenn eine Vielzahl derartiger x-Koordinaten XC auftreten, wird der gemittelte Wert als die Koordinate XC bestimmt.
- Das zusammengesetzte Bild wird dann an dem der x-Koordinate XC entsprechenden Abschnitt in getrennte Zeichenbilder "geschnitten" bzw. durchtrennt. Somit wird, wenn das Verhältnis der Höhe zur Breite gleich oder unter einem vorbestimmten Wert ist, das gelesene zusammengesetzte Bild derart bestimmt, daß es eine Kombination aus Bildern aufeinanderfolgender Zeichen ist, und der Bereich 202, in dem das zusammengesetzte Zeichen zu durchtrennen ist, auf der Grundlage der Form des zusammengesetzten Bildes eingestellt. Dann wird das zusammengesetzte Bild in getrennte Zeichenbilder bei einem Abschnitt davon durchtrennt, bei dem die Häufigkeit des Auftretens von schwarzen Bildelementen innerhalb des eingestellten Bereichs am größten ist, d.h. bei dem Abschnitt, bei dem der Grad der Verbindung zwischen einer Vielzahl von Bildelementgruppen am schwächsten ist.
- Dieses bekannte Verfahren wird jedoch durch den Nachteil be einträchtigt, daß die Trennung der Zeichenbilder häufig durch den Einfluß von Rauschen behindert wird, da die Position, an der das zusammengesetzte Bild "geschnitten" bzw. durchtrennt wird, auf der Grundlage des Histogramms der schwarzen Bildelemente bestimmt wird.
- Beispielsweise wird ein in Fig. 10 gezeigtes Histogramm erhalten, wenn ein Fleck auf dem Vorlagenbild zur Ausbildung eines in Fig. 9 gezeigten Bildes 204 optisch gelesen wird, oder wenn Zeichen der unmittelbar der gerade gelesenen Zeile vorangehenden Zeile sich genügend weit bei dem abgetasteten Nanuskript oder dergleichen nach unten erstrecken, so daß diese mitgelesen werden.
- Das Bild 204 des Flecks vergrößert die Zahl der schwarzen Bildelemente auf der x-Koordinate XC auf einen Wert, der größer als der Schwellwert d&sub0; ist. Anders ausgedrückt gibt es keine x-Koordinate, bei der die Projektion der schwarzen Bildelemente gleich oder unter dem Schwellwert d&sub0; liegt (vergl. Fig. 10). Folglich kann das aus zusammengesetzte Bild, das aus einander benachbarten Zeichenbildern besteht, nicht korrekt in getrennte Zeichenbilder getrennt werden, weshalb es unmöglich ist, diese Zeichen zu erkennen.
- Der Artikel "Recognition of isolated and simply connected handwritten numerals" von M. Shridar & A. Badrelin in der "Pattern Recognition", Band 19, Nr. 1, 1986, Elmsford, New York, USA, Seiten 1 - 12, offenbart einen Vorgang zur Trennung verbundener Zahlen.
- Dementsprechend liegt der Erfindung die Aufgabe zugrunde, ein Verfahren und ein Gerät zur Trennung von Bildbereichen zu schaffen, die es ermöglichen, daß ein zusammengesetzter Bildbereich in getrennte oder diskrete Bildbereiche entsprechend beispielsweise getrennten oder diskreten Zeichen durchtrennt werden kann, wodurch die vorstehend beschriebenen Nachteile gemäß dem Stand der Technik überwunden werden.
- Gemäß einer ersten Ausgestaltung der Erfindung ist ein in Patentanspruch 1 dargelegtes Bildtrenngerät geschaffen.
- Gemäß einer zweiten Ausgestaltung der Erfindung ist ein wie in Patentanspruch 7 dargelegtes Bildtrennverfahren geschaffen.
- Fig. 1 zeigt ein Blockschaltbild eines erfindungsgemäß aufgebauten Zeichnerkennungsgeräts,
- Fig. 2 zeigt ein Flußdiagramm, das einen gemäß einem ersten Ausführungsbeispiel der Erfindung durchgeführten Zeichentrennvorgang darstellt,
- Fig. 3 zeigt eine Darstellung eines zusammengesetzten Bildes, bei dem Bilder zweier Zeichen einander benachbart sind,
- Fig. 4(A) zeigt eine Darstellung einer Anordnung des zusammengesetzten Bildes, das durch Koordinaten des oberen und des unteren Randes des zusammengesetzten Bildes definiert ist,
- Fig. 4(B) zeigt eine Darstellung der Verteilung der Differenz zwischen den Koordinaten des oberen und des unteren Endes,
- Fig. 5 zeigt ein Flußdiagramm, daß einen Zeichentrennvorgang zeigt, der gemäß einem zweiten Ausführungsbeispiel der Erfindung angewendet wird,
- Fig. 6 zeigt ein Flußdiagramm, das einen gemäß einem dritten Ausführungsbeispiel der Erfindung angewendeten Zeichentrennvorgang darstellt,
- Fig. 7 bis 10 zeigen Darstellungen der Grundzüge eines herkömmlichen Zeichentrennvorgangs und
- Fig. 11 zeigt eine Darstellung des Prinzips des Vorgangs gemäß dem zweiten Ausführungsbeispiel der Erfindung.
- Die Erfindung wird nachstehend unter Bezugnahme auf die beiliegende Zeichnung näher beschrieben.
- Gemäß Fig. 1 weist ein die Erfindung verkörperndes Zeichenerkennungsgerät eine Haupteinheit 100 mit einer Zentraleinheit (CPU) 1 zur Steuerung der Funktion des gesamten Geräts, einem Festspeicher (ROM) 2, der Programme von durch die Zentraleinheit 1 auszuführenden, in den Flußdiagrammen gemäß Fig. 2, 5 und 6 gezeigten Vorgängen speichert, einem Speicher mit wahlfreiem Zugriff (RAM) 3, der als Arbeitsbereich für die Zentraleinheit 1 dient, einer Bildleseeinrichtung 4, die das Bild einer Vorlage liest, und einem Bildspeicher 5 auf, der das gelesene Bild entwickelt. Das Gerät weist außerdem eine Erkennungseinheit 5 zur Erkennung von Bildmustern eines Zeichens auf, das aus den in dem Bildspeicher 6 entwickelten Bilddaten durchtrennt worden ist, eine Nachschlageeinheit 7, auf die sich die Erkennungseinheit 6 während der Erkennungsverarbeitung bezieht, und eine Ausgabeeinheit auf, durch die das Ergebnis der Erkennung ausgegeben wird.
- Der Ablauf einer durch das Zeichenerkennungsgerät durchgeführten Verarbeitung ist nachstehend unter Bezug auf Fig. 2 beschrieben. Ein Vorlagenbild ist durch die Bildleseeinrichtung 4 gelesen und in dem Bildspeicher 5 als binäres Bild entwickelt worden.
- Bei einem Schritt S1 wird das entwickelte Bild aus dem Bildspeicher 5 empfangen. Bei einem Schritt S2 wird die Form (der Umriß) des Zeichens durch ein bekanntes Verfahren nachgefolgt, das typischerweise ein Verfahren ist, das den Bildelemente eines nach dem anderen nachfolgt. Fig. 3 zeigt die durch das Nachfolgen (tracing) bestimmte Form. Das Nachfolgen wird bei einem Punkt 101 begonnen und nach Bestimmen der Form 103 bei dem Punkt 101 beendet. Gemäß diesem Ausführungsbeispiel ist es nicht notwendig, den inneren Umriß 104 des Bildes zu gewinnen. Gemäß Fig. 4(A) ist der äußere Umriß allein dargestellt.
- Bei einem Schritt S3 wird ein das Bild einhüllendes Rechteck 102 auf der Grundlage der bei dem Schritt S2 erhaltenen Figu reninformationen bestimmt. Bei einem Schritt S4 wird das Verhältnis R der Höhe zu der Länge des einhüllenden Rechtecks 102 bestimmt und ob das Verhältnis R gleich oder kleiner als ein vorbestimmter Schwellwert R&sub0; ist, d.h. ob das Bild horizontal zu einem derartigen Ausmaß verlängert ist, daß zu ver muten ist, daß es sich bei dem Bild um ein zusammengesetztes Bild handelt, das aus zwei oder mehreren einander benachbarten und miteinander verbundenen Zeichen besteht. Somit läßt R > R&sub0; vermuten, daß das Bild ein einzelnes Zeichen darstellt. Wenn diese Bedingung erfüllt wird, schreitet die Ver arbeitung zu einem Schritt S5 weiter, bei dem die Bilddaten ohne Durchführung einer Zeichentrennung der Erkennungseinheit 6 zugeführt werden. Demgegenüber läßt R ≤ R&sub0; vermuten, daß das gelesene Bild ein zusammengesetztes Bild ist, das aus einer Vielzahl von einander benachbarten Zeichen besteht. In diesem Fall schreitet die Verarbeitung zu einem Schritt S6 weiter, bei dem ein Vorgang zur Bestimmung des Bereichs ausgeführt wird, bei dem die Trennung, d.h. das Durchtrennen, des Bildes in getrennte Zeichenbilder durchzuführen ist. Fig. 3 veranschaulicht das Verfahren zur Bestimmung des Bereichs, in dem die Trennung durchzuführen ist. Gemäß dieser Figur entspricht die x-Achse bzw. Abszisse der Richtung der Zeichenfolge. Der x-Koordinatenwert 0 fällt mit dem linken Rand des einhüllenden Rechtecks zusammen. Die x-Koordinaten X&sub1; und X&sub2; des Bereichs 105, bei dem die Trennung durchzuführen ist, werden derart bestimmt, daß sie die nachstehenden Bedingungen erfüllen:
- XC = W/2
- X&sub1; = XC - α
- X&sub2; = Xc + α
- α = γ h,
- wobei W und h jeweils die Breite (bzw. die Länge) und die Höhe des einhüllenden Rechtecks darstellen, während γ eine vorbestimmte Konstante ist.
- Wie aus Fig. 4(A) hervorgeht, ist die Form 103 des Bildes durch zwei Formlinien bestimmt, nämlich eine obere Formlinie Y&sub2; und eine untere Formlinie Y&sub1;, die in der Richtung senkrecht zu der Datenfolge voneinander beabstandet sind. Bei einem Schritt S7 werden diese (gemäß Fig. 3 als untere und obere Ränder bezeichnete) Formlinien bezüglich der x-Koordinaten als zwei Funktionen Y&sub2;(x) und Y&sub1;(x) bestimmt.
- Bei einem Schritt S8 wird die Differenz S(x) zwischen der oberen und der unteren Formlinie wie nachstehend beschrieben entlang der x-Achse bestimmt:
- S(x) = Y&sub2;(x) - Y&sub1;(x)
- Bei einem Schritt S9 wird der Wert S(x) der Differenz bei jeder in den Trennungsbereich 105 fallenden x-Koordinate mit einem vorbestimmten Schwellwert S&sub0; verglichen. Die x-Koordinate, die einem die Bedingung S(x) < S0 erfüllenden Differenzwert S(x) entspricht, wird als x-Koordinate XC bestimmt, bei der das Durchtrennen bzw. Trennen durchzuführen ist. Wenn eine Vielzahl von x-Koordinaten die vorstehend beschriebene Bedingung erfüllen, wird der Mittelwert dieser x-Koordinaten als die x-Koordinate XC verwendet, bei der das Bild zu trennen ist. Fig. 4(B) zeigt das Histogramm des Differenzwertes S(x).
- Das Durchtrennen oder die Trennung ist nicht möglich, wenn keine x-Koordinate die Bedingung S(x) < S&sub0; erfüllt. In einem derartigen Fall schreitet die Verarbeitung zu einem Schritt S10 weiter, bei dem das ganze zu untersuchende Bild der Erkennungseinheit 6 zugeführt wird, oder es wird ein geeignetes Unterprogramm zur Behandlung dieses Bildes als ein nicht zu identifizierendes Bild gestartet.
- Wenn die x-Koordinate XC bestimmt ist, bei der das Bild zu durchtrennen ist, schreitet die Verarbeitung zu einem Schritt S11 weiter, bei dem zum Durchtrennen des Bildes in ein Bild eines ersten Zeichens links der x-Koordinate XC und ein Bild eines Zeichens rechts der x-Koordinate XC alle Bildelemente bei der x-Koordinate XC in den weißen Zustand verändert werden. Diese durch die beschriebene Trennverarbeitung erhaltenen getrennten Zeichen werden bei einem Schritt S12 nacheinander der Erkennungseinheit 6 zugeführt.
- Nachstehend ist unter Bezug auf ein in Fig. 5 gezeigtes Flußdiagramm ein zweites Ausführungsbeispiel beschrieben. Gemäß diesem Ausführungsbeispiel werden die Koordinaten des oberen und des unteren Randes, d.h. der oberen und der unteren Formlinie des Bildes gleichzeitig während des Verlaufs der Bestimmung der Formlinie bestimmt.
- Ein ausreichend, kleiner Wert wird als obere Randkoordinate Y&sub2;(x) für alle Zeichen bestimmt. Ahnlich werden ausreichend große Koordinaten als die untere Randkoordinate Y&sub1;(x) für alle Zeichen bestimmt. Die x-Koordinate x wechselt von 0 auf 1, 1 auf 2 und schließlich auf W, die der Breite bzw. der Länge des Rechtecks, d.h. der x-Koordinate des rechten Rands des Rechtecks entspricht.
- Bei einem Schritt S22 wird der Wert y der xy-Koordinaten jedes Bildelements auf der nachgefolgten Formlinie bzw. Profillinie des Zeichens mit den vorstehend erwähnten gespeicherten Koordinaten Y&sub2;(x) und Y&sub1;(x) verglichen. Falls die Bedingung y > Y&sub2;(x) erfüllt wird, wird der Koordinatenwert Y&sub2;(x) dadurch aktualisiert, daß er durch den Wert y ersetzt wird. Annlich wird der Koordinatenwert Y&sub1;(x) dadurch aktualisiert, daß er durch y ersetzt wird, wenn die Bedingung y < Y&sub1;(x) erfüllt wird. Folglich sind alle Werte Y&sub1;(x) und Y&sub2;(x) erhalten, wenn das Nachfolgen der Formlinie beendet ist.
- Diese Verarbeitung ist unter Bezug auf Fig. 11 näher beschrieben.
- Während des Nachfolgens der Form 50 eines Zeichenbildes erscheinen mehr als zwei Punkte, beispielsweise wie in Fig. 11 veranschaulicht 4 Punkte A&sub1; bis A&sub4; für eine gegebene x Koordinate. Gemäß diesem Ausführungsbeispiel werden die Koordinaten der Punkte A&sub1; und A&sub4; als die Koordinaten des oberen und des unteren Rands betrachtet, wobei ein wie in Fig. 11 gezeigtes Muster 51 erhalten wird. Dabei werden wie vorstehend beschrieben der Wert y der xy-Koordinaten jedes während des Nachfolgens aufeinanderfolgend auf der Formlinie erfaßten Bildelements mit jeder oberen Randkoordinate Y&sub2;(x) verglichen, die vorab an derselben x-Koordinate x erhalten worden ist, wobei, wenn die Bedingung y > Y&sub2;(x) erfüllt wird, der Wert der oberen Randkoordinate Y&sub2;(x) durch den Wert y ersetzt wird. Folglich wird der Wert y der Koordinaten des Punktes A1 als die obere Randkoordinate Y&sub2;(x) für die vorstehend beschriebene x-Koordinate übernommen. Die untere Randkoordinate Y&sub1;(x) wird ebenfalls durch dasselbe Prinzip wie vorstehend beschrieben bestimmt.
- Gemäß dem zweiten Ausführungsbeispiel sind die Schritte von S23 aufwärts dieselben wie die gemäß dem ersten Ausführungsbeispiel, so daß deren Beschreibung entfällt.
- Gemäß einem dritten Ausführungsbeispiel der Erfindung wird die Position, an der das zusammengesetzte Bild zu durchtrennen ist, durch Veränderung des Schwellwerts S0 des Differenzwerts S(x) bestimmt.
- Gemäß dem dritten Ausführungsbeispiel wird eine Verarbeitung angewendet, die durch ein Flußdiagramm gemäß Fig. 6 dargestellt ist. Genauer zeigt dieses Flußdiagramm lediglich Schritte, die den in Fig. 2 gezeigten Schritten S9 bis S12 gemäß dem ersten Ausführungsbeispiel entsprechen. Andere Abschnitte der Verarbeitung sind nicht beschrieben, da sie im wesentlichen identisch zu denen gemäß dem ersten Ausführungsbeispiel sind. Gemäß dem vorstehend beschriebenen Ausfüh rungsbeispiel wird dort ein einfaches, die Unmöglichkeit einer Zeichentrennung angebenes Zeichen gegeben, wenn keine x- Koordinate die Bedingung S(x) ≤ S&sub0; erfüllt. Demgegenüber wird gemäß dem dritten Ausführungsbeispiel der Trennvorgang nach Veränderung des Schwellwerts S0 und der Breite XC ± α des Bereichs wiederholt durchgeführt, bei dem das Bild zu durchtrennen ist.
- Bei einem Schritt S41 wird eine Steuervariable i auf 1 eingestellt. Bei einem Schritt S42 werden der Schwellwert S&sub0; und der Schwellwertfaktor α jeweils auf Si bzw. αi eingestellt. Gemäß dem veranschaulichten Ausführungsbeispiel wird die Steuervariable i als i = 1, 2 und 3 verändert, wobei eine Vielzahl von Schwellwertkombinationen (S1, α1), (S2, α2) und (S3, α3) vor der Verarbeitung unter den Bedingungen S1 < S2 < S3 und α1 > α2 > α3 bestimmt wird.
- Bei einem Schritt S43 wird nach jeder x-Koordinate x gesucht, die in den Bereich zwischen X&sub1; und X&sub2; fallen, die wie nachstehend beschrieben bestimmt ist und die Bedingung S(x) ≤ Si erfüllt. Eine derartige x-Koordinate x wird, falls vorhanden, als x-Koordinate XC verwendet, bei der das Bild zu durchtrennen ist. Die Verarbeitung schreitet dann zu einem Schritt S44 weiter, bei dem das Bild in zwei Abschnitte durchtrennt wird, die jeweils Bilder zweier einzelner Zeichen sind. Die getrennten Zeichenbilder werden dann einem bei einem Schritt S45 ausgeführten Erkennungsvorgang unterzogen. Falls es keine x-Koordinate gibt, die die vorstehend beschriebenen Bedingungen erfüllt, schreitet die Verarbeitung zu einem Schritt S46 weiter, bei dem die Variable i für jeden der Schwellwerte S&sub0; und α um eins erhöht wird. Bei einem Schritt S47 wird der Wert der Variablen i untersucht. Wenn der Wert größer als 3 ist (i > 3), schreitet die Verarbeitung zu einem Schritt S48 weiter, bei dem das zu untersuchende Bild der Erkennungseinheit 6 zugeführt wird, ohne daß es durchtrennt worden ist. Jedoch kehrt, falls der Wert der Variablen i nicht größer als 3 ist (i ≤ 3), die Verarbeitung zu dem Schritt S42 zur Wiederholung des beschriebenen Vorgangs zurück.
- Gemäß dem dritten Ausführungsbeispiel wird deshalb zunächst eine Suche innerhalb eines breiten Bereichs für eine Verbindung zwischen zwei Zeichenbildern durchgeführt und dann, wenn keine derartige Verbindung gefunden wird, die Suche über einen engeren Bereich erneut durchgeführt. Wenn eine derartige Verbindung in dem eingeengten Bereich der Suche erfaßt wird, wird die Zeichentrennung bei einer Position einer derartigen Verbindung durchgeführt, selbst wenn die Verbindung eher stark ausgeprägt ist.
- Gemäß den vorstehend beschriebenen ersten bis dritten Ausführungsbeispielen werden durch eine Bildleseeinrichtung 4 gelesene Zeichen bei einem Vorlagentext erkannt und die Ergebnisse der Erkennung zu einer geeigneten externen Einrichtung ausgegeben. Eine derartige Verwendung des Erkennungsergebnisses ist lediglich veranschaulichend. Das heißt, daß die Erkennungsergebnisse zu einer Anzeigeeinrichtung zur Anzeige der erkannten Zeichen oder zu einer Einrichtung gesendet werden können, die die aus den erkannten Zeichen zusammengesetzten Worte verarbeiten kann.
- Es ist ebenfalls verständlich, daß die Erfindung auch auf einen Fall angewandt werden kann, bei dem die Zeichen in vertikalen Folgen angeordnet sind, obwohl die Erkennung von hon zontale Folgen bildenden Zeichen besonders beschrieben worden ist. Das erfindungsgemäße Gerät ist, wenn es bei vertikalen Zeichenfolgen angewendet wird, zur Bestimmung der Trennposition auf der Grundlage von Verteilungen der größten und kleinsten Koordinatenwerte x entlang einer Achse y ausgelegt, die parallel zu der Richtung der vertikalen Zeichenfolgen verläuft. Weiterhin ist es verständlich, daß die Erfindung nicht auf die Verwendung schwarzer Zeichen auf einem weißen Hintergrund beschränkt ist, sondern auf alle digitalisiert eingegebenen Zeichendaten anwendbar ist, die durch Farbe oder Abstufung bzw. Gradation vom Hintergrund unterscheidbar sind.
- Wie aus der vorstehenden Beschreibung verständlich ist, wird erfindungsgemäß die Bestimmung der Position, an der ein nicht identifiziertes Bild zu durchtrennen ist, auf der Grundlage der Verteilung der Abstände zwischen dem oberen und dem unteren Rand der Formlinie durchgeführt, im Gegensatz zu dem herkömmlichen Verfahren, das einfach auf die Häufigkeit des Auftretens schwarzer Bildelemente beruht. Deshalb ist es möglich, jedes schwarze Bildelement oder Bildelemente auszuschließen, die nicht mit der kontinuierlich nachgefolgten Formlinie verbunden sind und als Folge beispielsweise eines Flecks auf der Vorlage oder irrtümlichen Lesens einer benach barten Zeile erzeugt werden. Somit wird erfindungsgemäß die Glaubwürdigkeit und die Verläßlichkeit der Trennung von Zeichenbildern durch die Wirkung der Beseitigung von Störungen verbessert, die durch das Vorhandensein eines Flecks auf der Vorlage oder durch ein irrtümliches Lesen einer benachbarten Zeile verursacht werden, und somit die Fähigkeit zur Erkennung und Identifizierung von gelesenen Zeichen deutlich verbessert.
Claims (11)
1. Bildtrenngerät zur Trennung von einander benachbarten
Zeichen mit
einer Erfassungseinrichtung (CPU1, 5) zur Erfassung von
Koordinateninformationen bezüglich eines oberen Umrisses (Y&sub2;)
und eines unteren Umrisses (Y&sub1;) eines betreffenden
Zeichenbildes bei aus einer Vorlage eingegebenen Bildinformationen,
gekennzeichnet durch
eine Abstandsberechnungseinrichtung, die auf der
Grundlage der durch die Erfassungseinrichtung erhaltenen
Koordinateninformationen
Abstandsinformationen (s(x)) berechnet, die sich auf den
Abstand zwischen jedem Punkt an dem oberen Umriß (Y&sub2;) und
einem entsprechenden Punkt an dem unteren Umriß (Y&sub1;) beziehen,
die jeweils in einer Richtung senkrecht zu der durch die
Bildinformationen dargestellten Zeichenfolge gemessen werden,
eine Vergleichseinrichtung zum Vergleich der
Abstandsinformationen (s(x)) mit einem vorbestimmten Schwellwert (s0)
und
eine Trennbereichs-Bestimmungseinrichtung zur Bestimmung
einer Position (Xc), bei der das betreffende Zeichenbild in
getrennte Zeichenbilder zu durchtrennen ist, auf der
Grundlage der Vergleichsergebnisse.
2. Gerät nach Anspruch 1,
gekennzeichnet durch
eine Einrichtung zur Bestimmung, ob das betreffende
Zeichenbild in getrennte Zeichenbilder zu durchtrennen ist, auf der
Grundlage des Verhältnisses der Höhe zu der Breite eines
einhüllenden Rechtecks (102) um das betreffende Zeichen, wobei
die Abstandsberechnungseinrichtung nur dann aktiviert wird,
wenn die Bestimmungseinrichtung bestimmt hat, daß das
betreffende Zeichenbild in getrennte Bilder zu durchtrennen ist.
3. Gerät nach Anspruch 1,
gekennzeichnet durch
eine Bereichsberechnungseinrichtung zur Berechnung eines
Bereichs (x&sub1;-x&sub2;), bei dem das Durchtrennen des betreffenden
Bildes in getrennte Bilder durchzuführen ist, auf der
Grundlage des Verhältnisses der Höhe zu der Breite eines einhül
lenden Rechtecks um das betreffende Zeichen, wobei die
Trennpositions-Bestimmungseinrichtung die Position innerhalb des
durch die Bereichsberechnungseinrichtung berechneten Bereichs
bestimmt.
4. Gerät nach Anspruch 1,
dadurch gekennzeichnet, daß
die Trennpositions-Bestimmungseinrichtung eine Position, bei
der die durch die Abstandsbestimmungseinrichtung berechneten
Abstandsinformationen (S(x)) gleich oder kleiner als der
vorbestimmte Schwellwert sind, als die Position bestimmt, an der
das betreffende Bild zu durchtrennen ist.
5. Gerät nach Anspruch 4,
dadurch gekennzeichnet, daß,
wenn keine durch die Abstandsberechnungseinrichtung
berechneten Abstandsinformationen gleich oder kleiner als der
vorbestimmte Schwellwert sind, die
Trennpositions-Bestimmungseinrichtung den Positionsbestimmungsvorgang nach Veränderung des
vorbestimmten Schwellwerts erneut durchführt.
6. Gerät nach einem der vorangehenden Ansprüche,
gekennzeichnet durch
eine Bildleseeinrichtung zur Eingabe eines Bildes der Vorlage
als Bildinformationen.
7. Bildtrennverfahren zum Trennen von einander benachbarten
Zeichen, mit den Schritten:
Erfassen (s2) von Koordinateninformationen, die den
oberen Umriß (Y&sub2;) und den unteren Umriß (Y&sub1;) eines betreffenden
Zeichenbildes bei aus einer Vorlage eingegebenen
Bildinformationen betreffen,
gekennzeichnet durch
Berechnen (s8) des Abstands (s(x)) zwischen jedem Punkt
an dem oberen Umriß (Y&sub2;) und einem entsprechenden Punkt an
dem unteren Umriß (Y&sub1;), die jeweils in einer Richtung
senkrecht zu der durch die Bildinformationen dargestellte
Zeichenfolge gemessen werden,
Vergleichen (s9) der berechneten Abstände (s(x)) mit ei-,
nem vorbestimmten Schwellwert (s0) und
Bestimmen einer Position (Xc), bei der das betreffende
Zeichenbild in getrennte Zeichenbilder zu durchtrennen ist,
auf der Grundlage der Vergleichsergebnisse.
8. Verfahren nach Anspruch 7,
gekennzeichnet durch
den Schritt Berechnen (s6) eines Bereichs (x&sub1;-x&sub2;), bei dem
das Durchtrennen des betreffenden Zeichenbildes in getrennte
Bilder durchzuführen ist, auf der Grundlage des Verhältnisses
der Höhe zu der Breite eines einhüllenden Rechtecks (102) um
das betreffende Zeichenbild, wobei der Schritt Bestimmen der
Position, bei der das Bild zu durchtrennen ist, zur
Bestimmung der Position innerhalb des durch den
Bereichsberechnungsschritts (s6) berechneten Bereichs durchgeführt wird.
9. Verfahren nach Anspruch 7 oder 8,
dadurch gekennzeichnet, daß
die Position, bei der das betreffende Bild zu durchtrennen
ist, als eine Position bestimmt wird, bei der der bei dem
Schritt Abstandsberechnen berechnete Abstand gleich oder
kleiner als der vorbestimmte Schwellwert (s0) ist.
10. Verfahren nach einem der Ansprüche 7 bis 9,
dadurch gekennzeichnet, daß
wenn kein bei dem Schritt Abstandsberechnen berechneter
Abstand gleich oder kleiner als der Schwellwert ist, der
Schritt Erfassen der Position, an der das betreffende Bild zu
durchtrennen ist, erneut durchgeführt wird, nachdem der
Schwellwert verändert worden ist.
11. Verfahren nach einem der Ansprüche 7 oder 10,
dadurch gekennzeichnet, daß
das Zeichenbild ein binäres Bild ist.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2230600A JP2868134B2 (ja) | 1990-09-03 | 1990-09-03 | 画像処理方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69125777D1 DE69125777D1 (de) | 1997-05-28 |
DE69125777T2 true DE69125777T2 (de) | 1997-10-09 |
Family
ID=16910286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69125777T Expired - Lifetime DE69125777T2 (de) | 1990-09-03 | 1991-08-30 | Verfahren und Gerät zur Trennung von Bildbereichen |
Country Status (4)
Country | Link |
---|---|
US (1) | US5535287A (de) |
EP (1) | EP0476873B1 (de) |
JP (1) | JP2868134B2 (de) |
DE (1) | DE69125777T2 (de) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0632402B1 (de) * | 1993-06-30 | 2000-09-06 | International Business Machines Corporation | Verfahren zum Segmentieren von Bildern und Klassifizieren von Bildelementen zur Dokumentverarbeitung |
JPH08235310A (ja) * | 1995-02-24 | 1996-09-13 | Nec Corp | 接触文字切り出し装置 |
JP3155499B2 (ja) * | 1997-11-26 | 2001-04-09 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 光ディスクのビット変換の方法、復調方法および装置 |
JP2000181993A (ja) * | 1998-12-16 | 2000-06-30 | Fujitsu Ltd | 文字認識方法および装置 |
JP3880044B2 (ja) * | 2002-02-22 | 2007-02-14 | 富士通株式会社 | 手書き文字入力支援装置及び方法 |
JP2004038321A (ja) * | 2002-06-28 | 2004-02-05 | Fujitsu Ltd | 文書レイアウト解析プログラム、文書レイアウト解析装置および文書レイアウト解析方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4206442A (en) * | 1974-07-03 | 1980-06-03 | Nippon Electric Co., Ltd. | Letter segmenting apparatus for OCR comprising multi-level segmentor operable when binary segmenting fails |
JPS5814281A (ja) * | 1981-07-17 | 1983-01-27 | Toshiba Corp | 光学的文字読取装置 |
JPS59158479A (ja) * | 1983-03-01 | 1984-09-07 | Nec Corp | 文字分離装置 |
JPS61105680A (ja) * | 1984-10-29 | 1986-05-23 | Hitachi Ltd | 光学文字読取装置の文字切出し方法 |
US5046114A (en) * | 1985-10-01 | 1991-09-03 | The Palantir Corporation | Method and structure for separating joined patterns for use in pattern and character recognition system |
US4769849A (en) * | 1985-12-19 | 1988-09-06 | The Palantir Corporation | Method and apparatus for separating overlapping patterns |
JP2822189B2 (ja) * | 1988-05-19 | 1998-11-11 | ソニー株式会社 | 文字認識装置及び方法 |
-
1990
- 1990-09-03 JP JP2230600A patent/JP2868134B2/ja not_active Expired - Fee Related
-
1991
- 1991-08-30 DE DE69125777T patent/DE69125777T2/de not_active Expired - Lifetime
- 1991-08-30 EP EP91307988A patent/EP0476873B1/de not_active Expired - Lifetime
-
1994
- 1994-02-28 US US08/203,483 patent/US5535287A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0476873B1 (de) | 1997-04-23 |
US5535287A (en) | 1996-07-09 |
DE69125777D1 (de) | 1997-05-28 |
JP2868134B2 (ja) | 1999-03-10 |
EP0476873A3 (en) | 1993-10-13 |
EP0476873A2 (de) | 1992-03-25 |
JPH04112283A (ja) | 1992-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69226846T2 (de) | Verfahren zur Bestimmung von Wortgrenzen im Text | |
DE69230632T2 (de) | Optische Worterkennung durch Wortgestaltuntersuchung | |
DE69230631T2 (de) | Verfahren zum Vergleichen von Wortgestalten | |
DE69230633T2 (de) | Verfahren zur Ermittlung von Wortformen zum folgenden Vergleich | |
DE69130469T2 (de) | Gerät und Verfahren zur Bildverarbeitung | |
DE69926205T2 (de) | Artefaktentfernungstechnik für schiefenkorrigierte bilder | |
DE4311172C2 (de) | Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes | |
DE69032344T2 (de) | Verfahren zum Messen von Neigungswinkeln | |
DE3881392T2 (de) | System und Verfahren für automatische Segmentierung. | |
DE69129520T2 (de) | Verbessertes Segmentierungsverfahren für das maschinelle Lesen von handgeschriebener Information | |
DE69600461T2 (de) | System und Verfahren zur Bewertung der Abbildung eines Formulars | |
DE3633743C2 (de) | ||
DE69715076T2 (de) | Vorrichtung zur Erzeugung eines Binärbildes | |
DE69618068T2 (de) | Verfahren und Vorrichtung zum Durchführen von Text und Bildsegmentation | |
DE68923650T2 (de) | Bildverarbeitungsverfahren. | |
DE69425084T2 (de) | Verfahren und Gerät zur Erkennung von Textzeilen, Wörtern und räumlichen Merkmalen von Zeichenzellen | |
DE69225540T2 (de) | Bildverarbeitungsvorrichtungen | |
DE69521184T2 (de) | Gerät zur Bildverarbeitung gemäss einem lokal ermittelten Bildregionentyp | |
DE69029594T2 (de) | Ermittlung von Linienabschnitten und von vorbestimmten Mustern in einem optisch abgetasteten Dokument | |
DE68928703T2 (de) | Buchstabenerkennungsvorrichtung | |
DE69925354T2 (de) | Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren | |
DE3716787A1 (de) | Zeichenerkennungsverfahren | |
DE19956158A1 (de) | Bild-Binärisierungsverfahren auf Bereichsbasis | |
DE69013378T2 (de) | Anordnung zur Umsetzung von Bildumrissdaten in Bildpunkte darstellende Punktdaten. | |
DE69627424T2 (de) | Bildverarbeitungsverfahren und Gerät |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |