DE69831032T2 - Verfahren und Vorrichtung zur Zeichenerkennung - Google Patents

Verfahren und Vorrichtung zur Zeichenerkennung Download PDF

Info

Publication number
DE69831032T2
DE69831032T2 DE69831032T DE69831032T DE69831032T2 DE 69831032 T2 DE69831032 T2 DE 69831032T2 DE 69831032 T DE69831032 T DE 69831032T DE 69831032 T DE69831032 T DE 69831032T DE 69831032 T2 DE69831032 T2 DE 69831032T2
Authority
DE
Germany
Prior art keywords
character
validity
character recognition
candidates
tilt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69831032T
Other languages
English (en)
Other versions
DE69831032D1 (de
Inventor
Takafumi Minato-ku Koshinaka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of DE69831032D1 publication Critical patent/DE69831032D1/de
Application granted granted Critical
Publication of DE69831032T2 publication Critical patent/DE69831032T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

  • Diese Erfindung betrifft ein Verfahren und eine Vorrichtung zur Zeichenerkennung, bei denen eine auf Papier geschriebene Zeichenkette oder eine handgeschriebene Zeichenkette aus Worten und so weiter von einem Lichtsensor optisch eingelesen werden, und ein Aufzeichnungsmedium, auf dem ein Zeichenerkennungsprogramm zur Ausführung des Zeichenerkennungsverfahrens aufgezeichnet ist.
  • Um ein Zeichen richtig aus einer Zeichenkette auszuschneiden oder um ein stabiles Merkmal aus einem Zeichenbild zu extrahieren und das Zeichen richtig zu erkennen, wird in einer Zeichenerkennungsvorrichtung der erwähnten Art herkömmlicherweise auf der Grundlage irgendeiner Bewertung, die eine Neigung des Zeichens, welche einer der wichtigen Faktoren der Formveränderung des Zeichens ist, indirekt anzeigt, eine Neigungskorrekturverarbeitung für das Zeichen durchgeführt. Zum Beispiel wird in einer Zeichenerkennungsvorrichtung der Art, die eine Neigungskorrekturverarbeitung durchführt, die Ausrichtung eines Zeichens unter Verwendung eines Kettencode-Histogramms geprüft, und die Richtung, welche die größte Häufigkeit aufweist, wird als eine Neigungsrichtung des Zeichens bestimmt. Dann wird die Neigung des Zeichens auf der Grundlage der Richtung korrigiert. Eine andere Zeichenerkennungsvorrichtung ist in der offengelegten japanischen Patentanmeldung Nr. Heisei 5-114046 unter dem Titel "Method and Apparatus für Normalizing the Characteristic Slant Angle of a Hand-Written Character" (Verfahren und Vorrichtung zur Normierung des charakteristischen Neigungswinkels eines handgeschriebenen Zeichens) offenbart. In dem Verfahren und der Vorrichtung, die in dem Dokument offenbart werden, wird die Entropie eines Projektionshistogramms eines Eingangsbilds bezüglich einer vorhergesagten Neigungsrich tung berechnet, und es wird der Neigungswinkel, bei dem die Entropie einen Minimalwert zeigt, bestimmt. Dann wird die Lage des Eingangsbildes um einen Winkel umgeformt, der gleich dem Neigungswinkel ist, um die Neigung des Zeichens zu korrigieren.
  • Die herkömmliche Neigungskorrekturverarbeitung verwendet jedoch im wesentlichen eine Strategie, in der angenommen wird, daß in einem Eingangsbild eine große Anzahl von Strichen in eine Richtung senkrecht zur Richtung einer Zeichenkette (auf die hier im weiteren als vertikale Richtung Bezug genommen wird) vorhanden ist, und das Bild wird so korrigiert, daß eine große Anzahl vorhandener vertikaler Striche in die vertikale Richtung gerichtet werden kann. Die Korrektur wird mit anderen Worten unter Verwendung einer derartigen Bewertung durchgeführt, die in der vertikalen Richtung hoch ist.
  • Wenn ein derartiges Zeichenbild, das, wie in 3 gezeigt, viele vertikale Striche enthält, eingegeben wird, kann folglich die Berechnung des Neigungswinkels genau durchgeführt werden und eine geeignete Korrektur kann durchgeführt werden, da die Bewertungen, wie in 4 zu sehen, nur in unmittelbarer Nähe eines tatsächlichen Neigungswinkels X hohe Werte aufweisen.
  • Wenn jedoch ein Zeichenbild, das, wie in 5 zu sehen, keine sehr große Anzahl an vertikalen Strichen enthält, eingegeben wird, gibt es ein Problem in der Hinsicht, daß bei der Berechnung des Neigungswinkels ein Fehler auftritt und keine geeignete Korrektur durchgeführt werden kann, weil die Bewertungen in der Nähe des tatsächlichen Neigungswinkels X, wie in 6 zu sehen, nicht immer deutliche Werte zeigen. Zum Beispiel passiert es, wie in 7 zu sehen, manchmal, daß als Ergebnis eines Fehlers bei der Berechnung des Neigungswinkels eine Korrektur durchgeführt wird, welche die Neigung vergrößert.
  • Insbesondere, wenn die Bewertung, die eine Zeichenneigung anzeigt, nicht nur in der Nähe eines bestimmten Winkels keinen deutlichen Wert annimmt, sondern selbst wenn der Winkel verändert wird, keine sehr deutliche Veränderung auftritt, gibt es ein Problem in der Hinsicht, daß es schwierig ist, den Neigungswinkel des Zeichens zu berechnen, und es wahrscheinlich ist, daß eine falsche Neigungskorrektur durchgeführt wird. Eine derartige ungeeignete Korrektur hat einen schlechten Einfluß auf die spätere Zeichenfragmentierung, Merkmalsextraktion und Unterscheidung.
  • EP-A-0 601 730 offenbart eine Bildverarbeitungsvorrichtung zur Zeichenneigungskorrektur, die aufweist: eine Abtastlogik zum Abtasten eines Wortbilds und Anwenden einer lokalen Neigungsprüfung auf jeden Bildpunkt, um zu bestimmen, ob es in dem Bild an dem Bildpunkt links oder rechts oder weder noch ein lokales Zeichen gibt, und Speichern eines entsprechenden lokalen Neigungskennzeichens; eine Logik zum Kombinieren der lokalen Neigungskennzeichen für die Bildpunkte in jeder Reihe und Anwenden einer Signifikanzprüfung auf das Ergebnis, um für die Reihe ein Reihen-Neigungskennzeichen zu erhalten, das anzeigt, ob es in der Reihe eine größere Anzahl von Bildpunkten gibt, die eine lokale Zeichenneigung nach rechts haben, ob es in der Reihe eine größere Anzahl von Bildpunkten gibt, die eine lokale Zeichenneigung nach links haben, oder weder noch; eine Logik zum Kombinieren der Reihen-Neigungskennzeichen für alle Reihen, um einen Scherparameter zu bestimmen; und eine Logik, um entsprechend dem Scherparameter eine Schertransformation auf das Bild anzuwenden.
  • EP-A-0 476 806 offenbart ein verbessertes maschinelles Verfahren zur Erkennung des Übergangspunkts zwischen Buchstaben und Ziffern in handschriftlichem Text. Das Manuskript, Ziffern und/oder Buchstaben, wird auf eine Bildpunktmatrix abgebildet. Die Entropie für jede Spalte eines Bereichs angenommener Neigungswinkel wird analysiert, um den Winkel zu bestimmen, in dem die Winkelentropie ein Minimum hat. Durch Umkehrverschiebung der Bildpunktanordnung um einen Betrag gleich diesem Winkel wird die Neigungskomponente des Manuskripts vertikalisiert und der folgende Fragmentierungsschritt genauer ausgeführt.
  • Es ist eine Aufgabe der vorliegenden Erfindung zur Verfügung zu stellen: ein Verfahren und eine Vorrichtung zur Zeichenerkennung, wobei das Auftreten einer falschen Korrektur bei der Neigungskorrekturverarbeitung weniger wahrscheinlich ist und die falsche Erkennung minimiert wird, und ein Aufzeichnungsmedium, auf das ein Zeichenerkennungsprogramm zur Ausführung des Zeichenerkennungsverfahrens aufgezeichnet ist.
  • Gemäße der vorliegenden Erfindung wird die weiter oben beschriebene Aufgabe durch die Merkmale der Patentansprüche gelöst. Es wird ein Verfahren beschrieben, das aufweist: Berechnen eines Neigungswinkels eines Zeichens, Berechnen einer Bewertung, die eine Gültigkeit des Neigungswinkel-Berechnungswerts, anzeigt, das heißt eine Bewertung, die anzeigt, in welchem Maß der berechnete Wert für den Neigungswinkel zuverlässig ist, und Anpassen eines Neigungskorrekturbetrags auf der Grundlage der Bewertung. Wenn die Bewertung hoch ist, wird bestimmt, daß der Neigungswinkel-Berechnungswert zuverlässig ist, und der berechnete Wert für den Neigungswinkel wird als der Korrekturbetrag verwendet, aber wenn die Bewertung niedrig ist, wird bestimmt, daß der berechnete Wert für den Neigungswinkel nicht zuverlässig ist, und der Korrekturbetrag wird entsprechend der Größe der Bewertung angepaßt. Die Korrektur wird auf der Grundlage des auf diese Weise erhaltenen Korrekturbetrags durchgeführt, und danach wird die Zeichenerkennung für das neigungskorrigierte Zeichen durchgeführt.
  • Insbesondere gemäß eines Aspekts der vorliegenden Erfindung wird ein Verfahren zur Zeichenerkennung zur Verfügung gestellt, bei dem ein Neigungswinkel eines Zeichens korrigiert wird, um das Zeichen zu erkennen, das die folgenden Schritte aufweist: Berechnen eines Neigungswinkels eines Zeichens, Bewerten einer Gültigkeit des Neigungswinkel-Berechnungswerts, Bestimmen eines Neigungskorrekturbetrags aus dem Neigungswinkel-Berechnungswert und der Gültigkeitsbewertung und Durchführen der Neigungskorrektur des Zeichens auf der Grundlage des Neigungskorrekturbetrags und dann Durchführen der Zeichenerkennung des Zeichens.
  • Gemäß eines anderen Aspekts der vorliegenden Erfindung wird ein Verfahren zur Zeichenerkennung zur Verfügung gestellt, bei dem ein Neigungswinkel eines Zeichens korrigiert wird, um das Zeichen zu erkennen, das die folgenden Schritte aufweist: Berechnen eines Neigungswinkels eines Zeichens, Bewerten einer Gültigkeit des Neigungswinkel-Berechnungswerts, Bestimmen eines Neigungskorrekturbetrags aus dem Neigungswinkel-Berechnungswert und der Gültigkeitsbewertung, Durchführen einer Neigungskorrektur des Zeichens auf der Grundlage des Neigungskorrekturbetrags und dann Durchführen der Zeichenerkennung des Zeichens, um Kandidaten für die Zeichenerkennung zu extrahieren, und Unterscheiden auf der Grundlage der Gültigkeitsbewertung, ob eine Strichgruppe in einem Zeichenbild eine feste Ausrichtung hat, um die Kandidaten für die Zeichenerkennung selektiv zu übernehmen, um die Anzahl de Kandidaten zu verringern.
  • Gemäß eines weiteren Aspekts der vorliegenden Erfindung wird eine Vorrichtung zur Zeichenerkennung zur Verfügung gestellt, bei der ein Neigungswinkel eines Zeichens korrigiert wird, um das Zeichen zu erkennen, die aufweist eine Zeichenneigungs-Berechnungseinrichtung zum Berechnen und Ausgeben eines Zeichen-Berechnungswerts, eine Berechnungswert-Bewertungseinrichtung zum Berechnen und Ausgeben einer Bewertung, die eine Gültigkeit für den Berechnungswert darstellt, und eine Neigungskorrektureinrichtung zum Bestimmen eines Zeichenneigungs-Korrekturbetrags auf der Grundlage von Ausgaben der Zeichenneigungs-Berechnungseinrichtung und der Berechnungswert-Bewertungseinrichtung, um eine Neigungskorrektur des Zeichens zu bewirken.
  • Die Zeichenneigungs-Berechnungseinrichtung kann mehrere Neigungswinkelkandidaten bestimmen, Bewertungen berechnen, welche Korrektheitsgrade für die Neigungswinkelkandidaten darstellen, auf der Grundlage der Bewertungen, welche die Korrektheitsgrade darstellen, einen Neigungswinkel-Berechnungswert berechnen und den Neigungswinkel-Berechnungs wert zusammen mit der Bewertung, die den Korrektheitsgrad darstellt, ausgeben.
  • Wenn der Neigungswinkel-Berechnungswert auf der Grundlage der Bewertungen, welche den Korrektheitsgrad darstellen, berechnet werden soll, kann die Zeichenneigungs-Berechnungseinrichtung nach dem höchsten Wert für die Bewertungen, die die Korrektheitsgrade darstellen, suchen und einen der Neigungswinkelkandidaten, der dem höchsten Wert entspricht, als den Neigungswinkel-Berechnungswert bestimmen.
  • Die Berechnungswert-Bewertungseinrichtung kann einen Informationsbetrag berechnen und ausgeben, daß die ganzen von der Zeichenneigungs-Berechnungseinrichtung ausgegebenen Bewertungen, die die Korrektheitsgrade darstellen, eine Bewertung haben, der eine Gültigkeit für den von der Zeichenneigungs-Berechnungseinrichtung ausgegebenen berechneten Neigungswert darstellt.
  • Die Berechnungswert-Bewertungseinrichtung kann eine Quadratsumme, ein Quadratintegral oder eine Abweichung der von der Zeichenneigungs-Berechnungseinrichtung ausgegebenen Berechnungswerte, die die Korrektheitsgrade anzeigen, als die Bewertung, die die Gültigkeit des von der Zeichenneigungs-Berechnungseinrichtung ausgegebenen Neigungswinkel-Berechnungswerte darstellt, berechnen und ausgeben.
  • Die Neigungskorrektureinrichtung kann die von der Berechnungswert-Bewertungseinrichtung ausgegebene Bewertung, die die Gültigkeit mit einem Wert von 0 bis 1 anzeigt, unter Verwendung einer monotonen nicht fallenden Funktion normieren und den normierten Wert als einen Koeffizienten für die Einstellung der Größe des Neigungskorrekturbetrags verwenden.
  • Eine S-Funktion, eine lineare Funktion oder eine lineare Abschnittsfunktion können als die monotone und nicht fallende Funktion verwendet werden.
  • Die Vorrichtung zur Zeichenerkennung kann ferner eine Erkennungskandidaten-Verringerungseinrichtung aufweisen, um auf der Grundlage der Ausgabe der Berechnungswert-Bewertungseinrichtung zu unterscheiden, ob eine Strichgruppe in einem Zeichenbild eine feste Ausrichtung hat oder nicht, um die Zeichenerkennungskandidaten selektiv zu übernehmen, um die Anzahl von Kandidaten zu verringern.
  • Gemäß noch einem weiteren Aspekt der vorliegenden Erfindung wird ein Aufzeichnungsmedium zur Verfügung gestellt, auf dem ein Erkennungsprogramm, das auf einem Computer arbeitet, aufgezeichnet ist, wobei das Zeichenerkennungsprogramm bewirkt, daß der Computer die folgenden Schritte ausführt: Berechnen eines Neigungswinkels eines Zeichens, Bewerten einer Gültigkeit des Neigungswinkel-Berechungswerts, Bestimmen eines Neigungskorrekturbetrags aus dem Neigungswinkel-Berechnungswert und der Gültigkeitsbewertung und Durchführen der Neigungskorrektur für das Zeichen auf der Grundlage des Neigungskorrekturbetrags und dann Durchführen der Zeichenerkennung des Zeichens.
  • Mit den Verfahren und der Vorrichtung zur Zeichenerkennung und dem Aufzeichnungsmedium kann der Neigungskorrekturbetrag ansprechend auf den Informationsbetrag, den eine Bewertung hat, die einen Korrektheitsgrad eines Neigungswinkels, das heißt einen Korrektheitsgrad des Neigungswinkel-Berechnungswerts, anzeigt, adaptiv angepaßt werden, und eine derartige Situation, daß eine falsche Korrektur durchgeführt wird, kann auch vermieden werden, wenn es, wie in 8 zu sehen, schwierig ist, einen Neigungswinkel zu berechnen, und eine Zeichenfragmentierung, Merkmalsextraktion und Erkennung können mit einem höheren Grad an Stabilität durchgeführt werden, und eine Zeichenerkennung, die wenige Fehler aufweist, kann realisiert werden. Ferner wird durch die Verringerung der Anzahl von Zeichenerkennungskandidaten auf der Grundlage der Gültigkeit, die darauffolgende Auswahl eines Erkennungsergebnisses, bei der Sprachwissen verwendet wird, erleichtert. Mit anderen Worten kann die notwendige Zeit, um eine linguistisch passende Zeichenkette zu suchen, verringert werden, und auch die Möglichkeit, daß eine falsche Zeichenkette als eine richtige Antwort ausgewählt werden kann, kann gering gehalten werden.
  • Die obige und andere Aufgaben, Merkmale und Vorteile der vorliegenden Erfindung werden aus der folgenden Beschreibung und den beigefügten Ansprüchen deutlich, wenn sie in Verbindung mit den beigefügten Zeichnungen genommen werden, in denen gleiche Teile oder Elemente mit gleichen Bezugszeichen bezeichnet sind.
  • Kurze Beschreibung der Zeichnungen
  • 1 ist ein Blockschaltbild, das einen funktionalen Aufbau einer Vorrichtung zur Zeichenerkennung zeigt, auf welche die vorliegende Erfindung angewendet ist;
  • 2 ist eine ähnliche Ansicht, die jedoch einen funktionalen Aufbau einer anderen Vorrichtung zur Zeichenerkennung zeigt, auf welche die vorliegende Erfindung angewendet ist;
  • 3 ist eine schematische Ansicht, die ein Beispiel für ein Zeichenbild zeigt, für das die Neigungskorrekturverarbeitung vergleichsweise einfach durchgeführt werden kann;
  • 4 ist ein Diagramm, das ein Ergebnis einer Bewertungsberechung darstellt, wenn das Zeichenbild von 3 eingegeben wird;
  • 5 ist eine schematische Ansicht, die ein Beispiel für ein Zeichenbild zeigt, für das die Neigungskorrekturverarbeitung nicht leicht durchgeführt werden kann;
  • 6 ist ein Diagramm, das ein Ergebnis einer Bewertungsberechung darstellt, wenn das Zeichenbild von 3 eingegeben wird;
  • 7 ist eine schematische Ansicht, die ein Beispiel für ein Zeichenbild darstellt, das dafür anfällig ist, daß durch eine herkömmliche Vorrichtung zur Zeichenerkennung eine falsche Neigungskorrektur durchgeführt wird;
  • 8 ist eine schematische Ansicht, die ein Beispiel für ein Zeichenbild darstellt, für das durch die vorliegende Erfindung eine falsche Neigungskorrektur verhindert wird; und
  • 9 ist ein Blockschaltbild, das ein Anwendungssystem der vorliegenden Erfindung zeigt.
  • Beschreibung der bevorzugten Ausführungsformen
  • Zuerst ist Bezug nehmend auf 1 eine Vorrichtung zur Zeichenerkennung gezeigt, auf welche die vorliegende Erfindung angewendet ist. Die Vorrichtung zur Zeichenerkennung umfaßt einen Bildspeicherabschnitt 1 zum Speichern eines Zeichenbilds, einen Zeichenneigungs-Berechnungsabschnitt 21 zum Berechnen und Ausgeben eines Berechnungswerts für den Neigungswinkel eines Zeichens, einen Berechnungswert-Bewertungsabschnitt 22 zum Berechnen und Ausgeben eines Berechnungswerts, der eine Gültigkeit des Berechnungswerts anzeigt, einen Neigungskorrekturabschnitt 23 zur Bestimmung eines Zeichenneigungs-Korrekturbetrags auf der Grundlage der Ausgaben des Zeichenneigungs-Berechnungsabschnitts 21 und des Berechnungswert-Bewertungsabschnitts 22, um die Neigungskorrektur des Zeichens um den Zeichenneigungs-Korrekturbetrag durchzuführen, und einen Zeichenerkennungsabschnitt 3 zum Erkennen und Ausgeben des neigungskorrigierten Zeichens.
  • Es ist zu beachten, daß, wenn eine Zeichenerkennung durchgeführt werden soll, es üblicherweise der Fall ist, daß eine Vorverarbeitung für ein Eingangsbild durchgeführt wird und für die Vorverarbeitung die Binarisierung zur Umwandlung eines Graustufenbilds in ein Binärbild, das einfacher als das Graustufenbild zu handhaben ist, eine Normierungsverarbeitung zum Normieren der Größe eines Zeichens, des Abstands zwischen Strichen und so weiter, um das Zeichen zu formen, eine Rauschentfernungsverarbeitung zum Entfernen von Rauschen, wie etwa feinen Flecken oder Unschärfen in einem Bild und so weiter verfügbar sind. Wenngleich in 1 nicht gezeigt, kann eine derartige Vorverarbeitung, wenn notwendig, durchgeführt werden. Ferner kann eine derartige Vorverarbeitung ungeachtet dessen verwendet werden, ob sie vor oder nach der Neigungskorrekturverarbeitung stattfindet.
  • Ein Bild wird von einer Abtastvorrichtung oder einer ähnlichen Vorrichtung optisch eingegeben, in den Bildspeicherabschnitt 1 gespeichert und dann an den Zeichenneigungs-Berechnungsabschnitt 21 und den Neigungskorrekturabschnitt 23 gesendet.
  • Der Zeichenneigungs-Berechnungsabschnitt 21 nimmt mehrere Neigungswinkel einer Zeichenkette in einem Zeichenkettenbild, wie x1, x2, ..., xn an, berechnet Bewertungen y1, y2, ..., yn, die die Korrektheitsgrade der Neigungswinkel anzeigen, und gibt die Bewertungen y1, y2, ..., yn an den Berechnungswert-Bewertungsabschnitt 22 aus. 4 oder 6 zeigen die Bewertungen y1, y2, ..., yn in der Form einer Kurve. Danach wird der Neigungswinkel xi, bei dem die Bewertung yi den höchsten Wert zeigt, ausgewählt, und der Wert xi wird als der Berechnungswert x des Neigungswinkels des Zeichens an den Berechnungswert-Bewertungsabschnitt 22 und den Neigungskorrekturabschnitt 23 ausgegeben.
  • Für die Berechnung der Bewertung yi werden zum Beispiel Quadratsummen des Projektionshistogramms von dem Winkel xi verwendet. Insbesondere, wenn das Projektionshistogramm des Zeichenbilds von der Richtung des Winkels xi durch eine Zahlenfolge h1(xi), h2(xi), ..., hj(xi), ... dargestellt wird, wird die Bewertung yi durch den folgenden Ausdruck dargestellt. yi = Σ j{hj(xi)}2
  • Der Neigungswinkel, der einer der Bewertungen y1, y2, ..., yn entspricht, die den höchsten Wert aufweist, wird aus x1, x2, ..., xn ausgewählt und als ein Berechnungswert X des Neigungswinkel des Zeichens ausgegeben.
  • Als ein anderes Berechnungsverfahren für die Bewertung yi wird ein Kettencode verwendet, der einen Übergangsprozeß der Umrißrichtungen eines Zeichens darstellt. Aus einem Kettencode werden Umrißelemente für einzelne Richtungen gezählt, um ein Histogramm (eine Frequenzverteilung) für die einzelnen Richtungen zu erzeugen. Das Histogramm wird als die Bewertungen y1, y2, ..., yn des Neigungswinkels verwendet. Auf diese Weise wird aus x1, x2, ..., xn der Neigungswinkel, bei dem das Histogramm den höchsten Wert aufweist, ausgewählt und als der Berechnungswert X des Neigungswinkels des Zeichens ausgegeben. Da auch, wenn ein Graustufenbild gehandhabt wird, unter Verwendung eines dynamischen Umrißextraktionsverfahrens, wie etwa eines Snake-Verfahrens, das in "Snakes: Active Contour Models" (Snakes: Aktive Umrißmodelle), Michael Kasset et al., International Journal of Computer Vision, 1988, S. 321–331 offenbart ist, Umrisse extrahiert werden können, ist zu bemerken, daß eine ähnliche Bewertungsberechnung angewendet werden kann. Neben den Verfahren, bei denen die Richtung eines Strichs aus einem Umriß gemessen wird, kann ferner ein anderes Verfahren verwendet werden, bei dem die Richtung auf der Grundlage des Verhältnisses oder der endlichen Differenz in Laufrichtung verbundener Bestandteile von schwarzen Bildpunkten in verschiedenen Richtungen, einschließlich der vertikalen, horizontalen und schrägen Richtungen, spezifiziert wird.
  • Der Berechnungswert-Bewertungsabschnitt 22 empfängt den Neigungswinkel-Berechnungswert X und den Satz von Bewertungen y1, y2, ..., yn von dem Zeichenneigungs-Berechnungsabschnitt 21, berechnet die Gültigkeit R des Berechnungswerts X und gibt ihn an den Neigungskorrekturabschnitt 23 aus.
  • Hier wird zum Beispiel als die Gültigkeit R des Berechnungswerts X der Informationsbetrag, den der Satz von Bewertungen y1, y2, ..., yn hat, oder ein anderer dem Informationsbetrag angemessener Wert verwendet. Zum Beispiel wird die Gültigkeit R des Berechnungswerts X gemäß R = Σ iyilogyi berechnet. Es wird unterschieden, daß die Gültigkeit des Berechnungswerts x höher wird, wenn der Wert R zunimmt.
  • Hier kann für die Berechnung von R auch ein Realisie rungsverfahren verwendet werden, bei dem die Bewertungen y1, y2, ..., yn geeignet normiert werden. Insbesondere, um den Bereich der Gültigkeit R des Berechnungswerts zu erweitern und die Gültigkeit R detaillierter zu überprüfen, werden die Bewertungen y1, y2, ..., yn mit einer geeigneten Konstante p multipliziert, und dann wird eine andere geeignete Konstante q von den Summen subtrahiert, woraufhin die Gültigkeit des Berechnungswerts gemäß R = Σ i(pyi – q)log(pyi – q)berechnet wird.
  • Alternativ kann R zum Beispiel gemäß R = Σ iyi 2 berechnet werden. In diesem Fall wird auch bestimmt, daß die Gültigkeit des Berechnungswerts höher wird, wenn R zunimmt.
  • Für die Berechnung von R kann auch ein Realisierungs verfahren verwendet werden, bei dem die Werte der Bewertungen y1, y2, ..., yn geeignet normiert werden. Insbesondere, um den Bereich der Gültigkeit des Berechnungswerts zu erweitern und die Gültigkeit detaillierter zu überprüfen, werden die Bewertungen y1, y2, ..., yn mit einer geeigneten Konstante p multipliziert, und dann wird eine andere geeignete Konstante q von den Summen subtrahiert, woraufhin die Gültigkeit des Berechnungswerts gemäß R = Σ i (pyi – q)2 berechnet wird.
  • Ferner kann für R zum Beispiel möglicherweise auch eine Realisierungsform verwendet werden, bei der eine Abweichung der Bewertungen verwendet wird. Insbesondere, wenn eine Operation für die Berechnung eines Mittelwerts durch E(*) dargestellt wird, darin kann die Gültigkeit des Berechnungswerts gemäß R = E(yi2) – E(yi)2 berechnet werden.
  • Der Neigungskorrekturabschnitt 23 empfängt das Zeichenbild von dem Bildspeicherabschnitt 1, empfängt den Berechnungswert X von dem Zeichenneigungs-Berechnungsabschnitt 21 und empfängt die Gültigkeit R des Berechnungswerts von dem Berechnungswert-Bewertungsabschnitt 22. Der Neigungskorrekturabschnitt 23 berechnet unter Verwendung der empfangenen Werte einen Neigungskorrekturbetrag X*, um die Neigungskorrektur zu bewirken. Dann gibt der Neigungskorrekturabschnitt 23 nach der Korrektur das Bild an den Zeichenerkennungsabschnitt 3 aus. Für das konkrete Verfahren zur Neigungskorrektur ist zum Beispiel ein Verfahren verfügbar, bei dem das Zeichenbild um –X* scherverformt wird. Als ein anderes Verfahren, bei dem das Zeichenbild zum Beispiel um –X* mittels Drehung umgewandelt wird, ist verfügbar. Die Verfahren werden detaillierter beschrieben. Wenn das Bild zum Beispiel scherverformt werden soll, werden Bildpunkte an höheren Positionen in einer horizontalen Richtung um größere Beträge bewegt, so daß ein Quadrat in ein Parallelogramm verformt werden kann. Ein Bildpunkt an der Position (x, y) sollte durch die Scherverformung um –X* (Bildpunkte) auf (xXxy/h, y) bewegt werden. Indessen sollte das Bild für die Umwandlung mittels Drehung gedreht werden. In diesem Fall wird ein Bildpunkt an der Position (x, y) durch die Drehung um –X* (Winkel) zu (xcosX* – ysinX*, ycosX* + xsinX*) bewegt.
  • Der Neigungswinkel-Korrekturbetrag X* wird gemäß X* = f(R)xXberechnet, wobei f(R) eine monoton fallende Funktion ist, die einen Wert von 0 bis 1 annimmt und zum Beispiel durch eine S-Funktion f(R) = 1/(1 + e(–aR+b))realisiert wird, wobei a, b Konstanten sind und a > 0. Alternativ kann f(R) zum Beispiel durch eine lineare Funktion f(R) = aR + brealisiert werden, wobei a, b Konstanten sind und a > 0. Wo die Gültigkeit R des Berechnungswerts hoch ist, wird die Neigung des Bilds entsprechend dem berechneten Neigungswinkel erheblich korrigiert, aber wo die Gültigkeit R des Berechnungswerts niedrig ist, wird nur eine Korrektur um einen kleinen Betrag ausgeführt, um eine fehlerhafte Korrektur zu vermeiden.
  • Der Zeichenerkennungsabschnitt 3 führt eine derartige Verarbeitung, wie eine Zeichenfragmentierung, eine Merkmalsextraktion oder eine Unterscheidung, für das Bild durch und gibt ein Erkennungsergebnis für Zeichen aus. Insbesondere bei der Zeichenfragmentierung, bei der die Zeichenkette zum Beispiel eine horizontale Zeichenkette ist, wird ein Projektionshistogramm in der vertikalen Richtung berechnet, und mehrere Positionen des Histogramms, bei dem die Frequenz niedrig ist, werden ermittelt, und die Zeichenkette wird an den Positionen ausgeschnitten, um Zeichen auszuschneiden. Bei der Merkmalsextraktion wird das Zeichenbild in kleine Sätze von Merkmalswerten umgewandelt, die für die Erkennung der Zeichen notwendig sind. Bei der Unterscheidung werden Sätze von Merkmalswerten, für welche korrekte Antworten bekannt sind, das heißt Vorlagen, im voraus vorbereitet, und die Vorlagen werden mit den Sätzen von Merkmalswerten verglichen, die aus dem Eingangsbild extrahiert wurden, um die Vorlage auszuwählen, die nahe der Eingabe ist, und dann wird ein der Vorlage entsprechender Zeichencode ausgegeben.
  • Nun Bezug nehmend auf 2 ist eine andere Vorrichtung zur Zeichnerkennung, auf welche die vorliegende Erfindung angewendet ist, in einem Blockdiagramm gezeigt. Die gezeigte Vorrichtung zu Zeichenerkennung umfaßt einen Bildspeicherabschnitt 1 zum Speichern eines Zeichenbilds, einen Zeichenneigungs-Berechnungsabschnitt 21 zum Berechnen und Ausgeben eines Berechnungswerts für den Neigungswinkel eines Zeichens, einen Berechnungswert-Bewertungsabschnitt 22 zum Berechnen und Ausgeben eines Berechnungswerts, der die Gültigkeit des Berechnungswerts anzeigt, einen Neigungskorrekturabschnitt 23 zur Bestimmung eines Zeichenneigungs-Korrekturbetrags auf der Grundlage der Ausgaben des Zeichenneigungs-Berechnungsabschnitts 21 und des Berechnungswert-Bewertungsabschnitts 22 und Ausführen der Neigungskorrektur unter Verwendung des Zeichenneigungs-Korrekturbetrags, einen Zeichenerkennungsabschnitt 3 zum Erkennen und Ausgeben des Zeichens und einen Abschnitt 4 zur Verringerung der Erkennungskandidaten zum selektiven Übernehmen von mehreren von dem Zeichenerkennungsabschnitt 3 ausgegebenen Erkennungskandidaten, wobei die Ausgabe des Berechnungswert-Bewertungsabschnitts 22 verwendet wird, um die Anzahl von Kandidaten zu verringern. Obwohl hier in 2 kein Vorverarbeitungsabschnitt für die Umwandlungsverarbeitung in ein Binärbild und so weiter gezeigt ist, kann dieser, ebenso wie der weiter oben unter Bezug auf 1 beschriebenen Vorrichtung zur Zeichenerkennung, falls notwendig, verwendet werden.
  • Der Bildspeicherabschnitt 1 gibt ebenso wie in der Vorrichtung zu Zeichnerkennung von 1 ein Zeichenbild an den Zeichenneigungs-Berechnungsabschnitt 21 und den Neigungskorrekturabschnitt 23 aus.
  • Der Zeichenneigungs-Berechnungsabschnitt 21 gibt ebenso wie in der Vorrichtung zur Zeichenerkennung von 1 einen Berechnungswert X für den Neigungswinkel der Zeichen und den Satz von Bewertungen y1, y2, ..., yn, welcher die Korrektheitsgrade der Neigungswinkel anzeigt, an den Berechnungswert-Bewertungsabschnitt 22 aus.
  • Der Berechnungswert-Bewertungsabschnitt 22 berechnet die Gültigkeit R des Berechnungswerts in einer ähnlichen Weise wie in der weiter oben beschriebenen Vorrichtung zur Zeichenerkennung von 1 und gibt den Wert R an den Neigungskorrekturabschnitt 23 und den Abschnitt 4 zur Verringerung der Erkennungskandidaten aus.
  • Der Neigungskorrekturabschnitt 23 berechnet in einer ähnlichen Weise wie in der weiter oben beschriebenen Vorrichtung zur Zeichenerkennung von 1 einen Neigungskorrekturbetrag X*, führt die Neigungskorrektur des Bilds durch und gibt das Bild nach der Korrektur an den Zeichenerkennungsabschnitt 3 aus.
  • Der Zeichenerkennungsabschnitt 3 erkennt Zeichen in einer ähnlichen Weise wie in der weiter oben beschriebenen Vorrichtung zur Zeichenerkennung von 1 und gibt keine Zeichencodes selbst, sondern eine Kandidatenliste eines Erkennungsergebnisses an den Abschnitt 4 zur Verringerung der Erkennungskandidaten aus. In der Kandidatenliste des Erkennungsergebnisses ist eine feste Anzahl von Erkennungskandidaten zum Beispiel in einer absteigenden Reihenfolge des Abstands zu der Vorlage in einem Merkmal-Werteraum aufgelistet.
  • Der Abschnitt 4 zur Verringerung der Erkennungskandidaten verändert die Inhalte der Kandidatenliste des Erkennungsergebnisses auf der Grundlage der Gültigkeit R des von dem Berechnungswert-Bewertungsabschnitt 22 empfangenen Berechnungswerts und gibt die Kandidatenliste mit den geänderten Inhalten aus. Insbesondere wo R niedrig ist, wird bestimmt, daß die Strichgruppe in dem Eingangsbild keine feste Ausrichtung hat und Kandidaten aus dem Kanji werden in der Kandidatenliste des Erkennungsergebnisses entfernt. Wenn R hoch ist, wird andererseits bestimmt, daß die Strichgruppe in dem Eingangsbild eine feste Ausrichtung hat und andere Kandidaten als Kandidaten aus dem Kanji werden in der Kandidatenliste des Erkennungsergebnisses entfernt. Dies nutzt die wesentliche Eigenschaft, daß, andere Zeichen als Kanji-Zeichen keine feste Ausrichtung haben, während die Strichgruppe von Kanji-Zeichen im allgemeinen eine feste Ausrichtung hat.
  • Während der Abschnitt 4 zur Verringerung der Erkennungskandidaten eine Einrichtung für die Unterscheidung von Kandidaten aus dem Kanji und Kandidaten, die nicht mit dem Kanji dargestellt werden, unter den Kandidaten des Erkennungsergebnisses, in dem verschiedene Zeichen enthalten sein können, realisiert, ist die vorliegende Erfindung nicht auf die Realisierung beschränkt, in der Kanji- und Nicht-Kanji-Zeichen voneinander unterschieden werden. Da gemäß der vorliegenden Erfindung eine Zeichengruppe in einem Zeichenbild, in dem eine Strichgruppe eine feste Ausrichtung hat, und eine andere Zeichengruppe, bei der eine Zeichengruppe keine feste Ausrichtung hat, voneinander unterschieden werden können, kann die Kandidatenverringerung des Erkennungsergebnisses durch Unterscheidung beliebiger Zeichengruppen mit derartigen wesentlichen Eigenschaften, ob die Strichgruppe eine Ausrichtung hat oder nicht, realisiert werden. Zum Beispiel kann die Vorrichtung zur Zeichenerkennung derart aufgebaut werden, daß eine Gruppe von Ziffern 1, 4, 7 und 9, bei denen die Strichgruppe eine feste Ausrichtung hat, und eine andere Gruppe von Ziffern 2, 3, 5, 6 und 8, bei denen die Strichgruppe keine feste Ausrichtung hat, voneinander unterschieden werden, um die Kandidaten für das Erkennungsergebnis zu verringern.
  • Nun bezug nehmend auf 9 ist ein Beispiel für ein Anwendungssystem der vorliegenden Erfindung gezeigt. Das Anwendungssystem umfaßt ein Aufzeichnungsmedium 5, auf das ein Zeichenerkennungsprogramm zum Ausführen des Verfahrens zur Zeichenerkennung gemäß der vorliegenden Erfindung aufgezeichnet ist. Das Aufzeichnungsmedium 5 kann eine CD-ROM, eine Magnetplatte, ein Halbleiterspeicher oder irgendein anderes Aufzeichnungsmedium sein und umfaßt die Kommunikation mit einem Netzwerk.
  • Das Zeichenerkennungsprogramm wird von dem Aufzeichnungsmedium 5 in eine Datenverarbeitungsvorrichtung 6 eingelesen und steuert den Betrieb der Datenverarbeitungsvorrichtung 6. Die Datenverarbeitungsvorrichtung 6 berechnet unter der Steuerung durch das Zeichenerkennungsprogramm den Neigungswinkel eines Zeichens, bewertet die Gültigkeit des Neigungswinkel-Berechnungswerts, bestimmt einen Neigungswinkel-Korrekturbetrag aus dem Neigungswinkel-Berechnungswert und der Gültigkeitsbewertung, führt auf der Grundlage des Korrekturbetrags die Neigungskorrektur durch und führt dann die Zeichenerkennung durch. In einer anwendbaren Form führt die Datenverarbeitungsvorrichtung 6 unter der Steuerung des Zeichenerkennungsprogramms die gleiche Verarbeitung aus wie die Verarbeitung des Zeichenneigungs-Berechnungsabschnitts 21, des Berechnungswert-Bewertungsabschnitts 22, des Neigungskorrekturabschnitts 23 und des Zeichenerkennungsabschnitts 3 der Vorrichtung zur Zeichenerkennung von 1. Indessen führt die Datenverarbeitungsvorrichtung 6 in einer anderen anwendbaren Form unter der Steuerung des Zeichenerkennungsprogramms die gleiche Verarbeitung aus wie die Verarbeitung des Zeichenneigungs-Berechnungsabschnitts 21, des Berechnungswert-Bewertungsabschnitts 22, des Neigungskorrekturabschnitts 23, des Zeichenerkennungsabschnitts 3 und des Abschnitts 4 zur Verringerung der Erkennungskandidaten in der zweiten Ausführungsform.

Claims (10)

  1. Verfahren zur Zeichenerkennung, bei dem ein Neigungswinkel eines Zeichens korrigiert wird, das die folgenden Schritt aufweist: Festlegen mehrerer Neigungswinkelkandidaten; Berechnen einer Bewertung, die einen Korrektheitsgrad für jeden Neigungswinkelkandidaten anzeigt, aus Bildsignalen, die das Zeichen darstellen; Suchen nach dem höchsten Wert der Bewertungen und Bestimmen des Neigungswinkelkandidaten mit der höchsten Bewertung als den Neigungsschätzwert; Berechnen und Ausgeben einer Gültigkeitsbewertung für den bestimmten Neigungsschätzwert auf der Grundlage des gesamten Satzes von Bewertungen für die Neigungswinkelkandidaten; Bestimmen eines Neigungskorrekturbetrags auf der Grundlage des Neigungswinkel-Schätzwerts und der Gültigkeitsbewertung; und Durchführen der Neigungskorrektur des Zeichens auf der Grundlage des Neigungskorrekturbetrags und dann Durchführen der Zeichenerkennung des Zeichens.
  2. Verfahren zur Zeichenerkennung wie in Anspruch 1 dargelegt, das ferner die folgenden Schritte aufweist: Durchführen der Zeichenerkennung des Zeichens, um Zeichenerkennungskandidaten zu extrahieren; und Unterscheiden, ob Strichgruppen vorhanden sind, in denen jeweils jeder Strich eine zu den anderen Strichen ähnliche Richtung hat oder nicht, auf der Grundlage der Gültigkeitsbewertung, um die Zeichenerkennungskandidaten selektiv zu übernehmen, um die Anzahl von Kandidaten zu verringern.
  3. Vorrichtung zur Zeichenerkennung, bei der ein Neigungswinkel eines Zeichens korrigiert wird, um das Zeichen zu erkennen, die aufweist: eine Zeichenneigungs-Schätzeinrichtung (21) zum Berechnen und Ausgeben eines Schätzwerts für ein Zeichen; eine Gültigkeitsbewertungseinrichtung (22) zum Berechnen und Ausgeben einer Bewertung, die eine Gültigkeit des Schätzwerts anzeigt, und eine Neigungskorrektureinrichtung (23) zur Bestimmung eines Zeichenneigungs-Korrekturbetrags auf der Grundlage der Ausgaben der Zeichenneigungs-Schätzeinrichtung (21) und der Gültigkeitsbewertungseinrichtung (22), um die Neigungskorrektur des Zeichens zu bewirken, wobei die Zeichenneigungs-Schätzeinrichtung (21) derart eingerichtet ist, daß sie aus Bildsignalen, die das Zeichen darstellen, mehrere Neigungswinkelkandidaten festlegt und eine Bewertung, die einen Korrektheitsgrad für jeden der Neigungswinkelkandidaten anzeigt, berechnet und den höchsten Wert der Bewertungen, die die Korrektheitsgrade anzeigen, sucht und den Neigungswinkelkandidaten, der dem höchsten Wert entspricht, als den Neigungswinkel-Berechnungswert bestimmt, und die Gültigkeitsbewertungseinrichtung (22) derart eingerichtet ist, daß sie auf der Grundlage des gesamten Satzes von Bewertungen für die Neigungswinkelkandidaten eine Gültigkeitsbewertung für den bestimmten Neigungsschätzwert berechnet und ausgibt.
  4. Vorrichtung zur Zeichenerkennung wie in Anspruch 3 dargelegt, dadurch gekennzeichnet, daß die Gültigkeitsbewertungseinrichtung (22) eine Quadratsumme, eine Quadratintegral oder eine Abweichung der Bewertungen, welche die von der Zeichenneigungs-Schätzeinrichtung (21) ausgegebenen Korrektheitsgrade anzeigen, als die Bewertung, die die Gültigkeit des von der Zeichenneigungs-Schätzeinrichtung (21) ausgegebenen Schätzwerts darstellt, berechnet und ausgibt.
  5. Vorrichtung zur Zeichenerkennung wie in Anspruch 3 oder 4 dargelegt, dadurch gekennzeichnet, daß die Neigungskorrektureinrichtung (23) die von der Gültigkeitsbewertungseinrichtung (22) ausgegebene Gültigkeitsbewertung, die die Gültigkeit mit einem Wert von 0 bis 1 anzeigt, unter Verwendung einer monoton nicht fallenden Funktion normiert und den normierten Wert als einen Koeffizienten zur Anpassung der Größe des Neigungskorrekturbetrags verwendet.
  6. Vorrichtung zur Zeichenerkennung wie in Anspruch 5 dargelegt, dadurch gekennzeichnet, daß eine S-Funktion als die monotone nicht fallende Funktion verwendet wird.
  7. Vorrichtung zur Zeichenerkennung wie in Anspruch 5 dargelegt, dadurch gekennzeichnet, daß eine lineare Funktion oder eine lineare Abschnittsfunktion als die monotone nicht fallende Funktion verwendet wird.
  8. Vorrichtung wie in einem der Ansprüche 3 bis 7 dargelegt, die ferner eine Einrichtung (4) zur Verringerung der Erkennungskandidaten aufweist, um auf der Grundlage der Gültigkeit des von der Gültigkeitsbewertungseinrichtung (22) erhaltenen Neigungswinkel-Schätzwerts zu unterscheiden, ob Strichgruppen vorhanden sind oder nicht, in denen jeder Strich die zu den anderen Strichen ähnliche Richtung hat, um die Zeichenerkennungskandidaten selektiv zu übernehmen, um die Anzahl von Kandidaten zu verringern.
  9. Vorrichtung zur Zeichenerkennung wie in Anspruch 8 dargelegt, dadurch gekennzeichnet, daß die Einrichtung (4) zur Verringerung der Erkennungskandidaten auf der Grundlage der Gültigkeit des von der Gültigkeitsbewertungseinrichtung (22) erhaltenen Neigungswinkel-Schätzswerts eine Unterscheidung zwischen Kanji- und Nicht-Kanji durchführt.
  10. Aufzeichnungsmedium, auf dem ein Erkennungsprogramm, das auf einem Computer arbeitet, aufgezeichnet ist, wobei das Zeichenerkennungsprogramm den Computer veranlaßt, die folgenden Schritte auszuführen: Festlegen mehrerer Neigungswinkelkandidaten; Berechnen einer Bewertung, die einen Korrektheitsgrad für jeden Neigungswinkelkandidaten anzeigt, aus Bildsignalen, die das Zeichen darstellen; Suchen nach dem höchsten Wert der Bewertungen und Bestimmen des Neigungswinkelkandidaten mit der höchsten Bewertung als den Schätzwert; Berechnen und Ausgeben einer Gültigkeitsbewertung für den bestimmten Neigungsschätzwert auf der Grundlage des gesamten Satzes von Bewertungen für die Neigungswinkelkandidaten; Bestimmen eines Neigungskorrekturbetrags auf der Grundlage des Neigungswinkel-Schätzwerts und der Gültigkeitsbewertung; und Durchführen der Neigungskorrektur des Zeichens auf der Grundlage des Neigungskorrekturbetrags und dann Durchführen der Zeichenerkennung des Zeichens.
DE69831032T 1997-05-07 1998-05-06 Verfahren und Vorrichtung zur Zeichenerkennung Expired - Fee Related DE69831032T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP11697897 1997-05-07
JP09116978A JP3099771B2 (ja) 1997-05-07 1997-05-07 文字認識方法、装置及び文字認識プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
DE69831032D1 DE69831032D1 (de) 2005-09-08
DE69831032T2 true DE69831032T2 (de) 2006-07-13

Family

ID=14700472

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69831032T Expired - Fee Related DE69831032T2 (de) 1997-05-07 1998-05-06 Verfahren und Vorrichtung zur Zeichenerkennung

Country Status (5)

Country Link
US (1) US6115506A (de)
EP (1) EP0877335B1 (de)
JP (1) JP3099771B2 (de)
AU (1) AU753499B2 (de)
DE (1) DE69831032T2 (de)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3196755B2 (ja) 1999-02-23 2001-08-06 日本電気株式会社 文字の傾き検出補正方法ならびに装置
US7119923B1 (en) * 1999-07-23 2006-10-10 Fuji Photo Film Co., Ltd. Apparatus and method for image processing
US7031553B2 (en) 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
US6823084B2 (en) 2000-09-22 2004-11-23 Sri International Method and apparatus for portably recognizing text in an image sequence of scene imagery
AU2001293001A1 (en) * 2000-09-22 2002-04-02 Sri International Method and apparatus for portably recognizing text in an image sequence of scene imagery
JP3554271B2 (ja) * 2000-12-13 2004-08-18 パナソニック コミュニケーションズ株式会社 情報通信装置
WO2003023696A1 (en) 2001-09-12 2003-03-20 Auburn University System and method of handwritten character recognition
US8189961B2 (en) * 2010-06-09 2012-05-29 Microsoft Corporation Techniques in optical character recognition
KR101905426B1 (ko) * 2012-01-11 2018-10-10 한국전자통신연구원 자연영상에서 추출된 문자 정보의 순서화 방법 및 시스템
JP5821994B2 (ja) 2014-04-21 2015-11-24 富士ゼロックス株式会社 画像処理装置、画像形成装置およびプログラム
JP6624877B2 (ja) * 2015-10-15 2019-12-25 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
KR102622349B1 (ko) * 2018-04-02 2024-01-08 삼성전자주식회사 전자 장치 및 그 제어 방법

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59153268A (ja) * 1983-02-22 1984-09-01 Nec Corp 手書き文字認識方式
JPS6249593A (ja) * 1985-08-29 1987-03-04 Ricoh Co Ltd 文字認識装置
JPS6333195A (ja) * 1986-07-26 1988-02-12 Kobe Steel Ltd ろう付用高耐蝕性、高強度アルミニウム合金複合材
US4941189A (en) * 1987-02-25 1990-07-10 Lundy Electronics & Systems, Inc. Optical character reader with skew recognition
JPS6482286A (en) * 1987-09-25 1989-03-28 Toshiba Corp Image inclination detector
JPH03225578A (ja) * 1990-01-31 1991-10-04 Toshiba Corp 文字の検切り方法
US5101439A (en) * 1990-08-31 1992-03-31 At&T Bell Laboratories Segmentation process for machine reading of handwritten information
JPH04276888A (ja) * 1991-03-04 1992-10-01 Sumitomo Electric Ind Ltd 文字読取装置
US5452374A (en) * 1992-04-06 1995-09-19 Ricoh Corporation Skew detection and correction of a document image representation
JP3253356B2 (ja) * 1992-07-06 2002-02-04 株式会社リコー 文書画像の領域識別方法
JP3013618B2 (ja) * 1992-08-07 2000-02-28 株式会社デンソー サイン認識装置
JPH0668304A (ja) * 1992-08-17 1994-03-11 Fujitsu Ltd 手書き文字正規化方式
JPH0668302A (ja) * 1992-08-19 1994-03-11 Fujitsu Ltd 傾き正規化装置
GB2273383A (en) * 1992-12-10 1994-06-15 Ibm Character recognition
US5583956A (en) * 1993-01-12 1996-12-10 The Board Of Trustees Of The Leland Stanford Junior University Estimation of skew angle in text image
JPH0737103A (ja) * 1993-07-23 1995-02-07 Olympus Optical Co Ltd 傾き角度検出装置
JPH07192088A (ja) * 1993-12-27 1995-07-28 Toshiba Corp 画像処理方法及び装置
JP3338537B2 (ja) * 1993-12-27 2002-10-28 株式会社リコー 画像傾き検出装置
JPH07311814A (ja) * 1994-05-18 1995-11-28 Oki Electric Ind Co Ltd 文書画像傾き角推定方法
JP3108979B2 (ja) * 1994-07-28 2000-11-13 セイコーエプソン株式会社 画像処理方法および画像処理装置
US5668891A (en) * 1995-01-06 1997-09-16 Xerox Corporation Methods for determining font attributes of characters
US5692069A (en) * 1995-03-17 1997-11-25 Eastman Kodak Company Apparatus for performing character segmentation using slant histograms

Also Published As

Publication number Publication date
DE69831032D1 (de) 2005-09-08
JPH10307889A (ja) 1998-11-17
JP3099771B2 (ja) 2000-10-16
EP0877335B1 (de) 2005-08-03
AU753499B2 (en) 2002-10-17
EP0877335A2 (de) 1998-11-11
EP0877335A3 (de) 2000-02-23
AU6476498A (en) 1998-11-12
US6115506A (en) 2000-09-05

Similar Documents

Publication Publication Date Title
DE60204005T2 (de) Verfahren und einrichtung zur erkennung eines handschriftlichen musters
DE60224128T2 (de) Vorrichtung und Verfahren zum Erkennen von Zeichen und mathematischen Ausdrücken
DE69932167T2 (de) Zeichenerkennung
DE69831032T2 (de) Verfahren und Vorrichtung zur Zeichenerkennung
EP0040796B1 (de) Verfahren zum automatischen Klassifizieren von Bild- und Text- oder Graphikbereichen auf Druckvorlagen
DE69530566T2 (de) Hough-Transform mit Fuzzy-Gradient und Wahl
DE19547812C2 (de) Lesegerät für Schriftzeichenketten
DE60225170T2 (de) Verfahren und vorrichtung zum dekodieren handschriftlicher zeichen
DE19705757C2 (de) Verfahren zum Erkennen eines Eingabemusters und zum Erzeugen einer Datenbank sowie Zeichenerkennungssystem
EP1491879A2 (de) Verfahren zur adaptiven Fehlererkennung auf einer strukturierten Oberfläche
DE10346690B4 (de) Verfahren und Vorrichtung zum Detektieren eines Linearobjekts
DE146351T1 (de) Vorlageverarbeitungseinrichtung und -verfahren.
DE3937950A1 (de) Verfahren zum pruefen optischer oberflaechen
Satyawan et al. Citizen ID card detection using image processing and optical character recognition
DE19511472C1 (de) Verfahren zur dynamischen Verifikation eines Schriftzuges anhand eines Referenzschriftzuges
EP0402868B1 (de) Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen
DE3718620C2 (de)
DE102022112299A1 (de) Methode zur extraktion von kammlinien aus polsar-bildern auf der basis eines pyramid-attention-networks
DE4119091A1 (de) Verfahren und einrichtung zum erkennen von zeichen
Hamida et al. New database of French computer science words handwritten vocabulary
DE69728469T2 (de) Gerät und Verfahren zur Ermittlung der Zeichenlinie mittels vereinfachter Projektionsinformation; Zeichenerkennungsgerät und Verfahren
DE60024535T2 (de) Verfahren zur Zeichentrennung
EP0749613B1 (de) Wissensbasierte unschärfe auswahl für erkennungssystem mit mehreren erkennungseinheiten
DE102005025220A1 (de) Gerät, Verfahren und Programm zum Beseitigen von Poren
DE102021203796A1 (de) Strassenoberflächenerfassungsvorrichtung, strassenoberflächenerfassungssystem, fahrzeug, und strassenoberflächenerfassungsverfahren

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee