DE3716787C2 - - Google Patents

Info

Publication number
DE3716787C2
DE3716787C2 DE3716787A DE3716787A DE3716787C2 DE 3716787 C2 DE3716787 C2 DE 3716787C2 DE 3716787 A DE3716787 A DE 3716787A DE 3716787 A DE3716787 A DE 3716787A DE 3716787 C2 DE3716787 C2 DE 3716787C2
Authority
DE
Germany
Prior art keywords
character
pixels
codes
subdivision
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE3716787A
Other languages
English (en)
Other versions
DE3716787A1 (de
Inventor
Gen Yokohama Kanagawa Jp Sato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP61114042A external-priority patent/JPS62269286A/ja
Priority claimed from JP61249159A external-priority patent/JPS63103392A/ja
Priority claimed from JP61251537A external-priority patent/JPH0795335B2/ja
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of DE3716787A1 publication Critical patent/DE3716787A1/de
Application granted granted Critical
Publication of DE3716787C2 publication Critical patent/DE3716787C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

Die Erfindung betrifft ein Zeichenerkennungsverfahren nach dem Oberbegriff des Anspruches 1.
Ein derartiges Zeichenerkennungsverfahren ist aus der US-PS 42 54 400 bekannt. Gemäß diesem bekannten Zeichenerkennungs­ verfahren wird von einem zu erkennenden Zeichen ein binäres Zeichenabbild hergestellt, in dem das binäre Zeichen in eine Vielzahl von Regionen unterteilt wird. Diese Unterteilung des binären Zeichenabbilds in Unterbereiche basiert auf der Er­ kenntnis, daß es schwierig ist, direkt die gesamten Daten zu speichern und zu vergleichen, da die zu verarbeitende Daten­ menge enorm hoch ist. Bei diesem bekannten Verfahren werden ferner die Daten jedes Unterbereiches mit Daten verglichen, die zu einem früheren Zeitpunkt durch einen ähnlichen Prozeß extrahiert und abgespeichert wurden. Die für Vergleichszwecke verwendeten Daten werden in Form einer Vielzahl von Signal­ paaren von Bildelementen gewonnen und werden mit abgespei­ cherten Daten verglichen, um dadurch eine Zeichenerkennung durchzuführen.
Aus der DE 28 01 536 C2 ist eine Zeichenformkodierungsvor­ richtung mit einem Abtaster zum Abtasten von auf einem Hintergrundmedium angeordneten Mustern und mit einer Digi­ talisierungseinrichtung bekannt, welche aus den abgetaste­ ten Signalen Digitalsignale erzeugt, welche den Musterele­ mentbereichen und Hintergrundelementbereichen entsprechen. Eine sogenannte Verdünnungseinrichtung verarbeitet die Di­ gitalsignale, die in Bildspeichern abgespeichert werden. Diese Bildsignale entsprechen einem Grenzlinienmuster, welches weniger Musterelementbereiche aufweist als das durch die genannten Digitalsignale wiedergegebene Muster. Der Bildspeicher speichert somit verdünnte Musterdaten, die das genannte Grenzlinienmuster darstellen, wobei eine Verarbeitungseinheit die verdünnten Musterdaten verarbei­ tet. Es werden Vektordarstellungen aus Liniensegmenten ge­ bildet, die die aufeinanderfolgenden Grenzlinien-Datenele­ mente der verdünnten Musterdaten, die in dem Bildspeicher gespeichert sind, verbinden, wobei die Vektordarstellungen in Binärform kodiert sind und eine erste Folge von Binär­ zahlen bilden. Das wesentliche dieser bekannten Vorrich­ tung besteht darin, daß die Verarbeitungseinrichtung Hö­ hen- und Breitenspeicher besitzt, die eine Darstellung der Höhe und Breite der Grenzlinienmuster speichert, sowie einen Zeichenbit-Speicher zum Speichern des Produkts aus Höhe und Breite als zweite Folge von Binärzahlen und daß ferner ein Vergleicher vorgesehen ist, in dem die Anzahl der Binärziffern in der ersten und zweiten Folge von Bi­ närzahlen verglichen und die Folge von Binärzahlen mit der kleineren Zahl von Binärziffern angezeigt wird. Bei diesem bekannten System werden somit für eine Zeichenkodierung lediglich Grenzlinienmusterdaten abgespeichert, wodurch sehr viel Speicherkapazität eingespart werden kann.
Aus der US-PS 37 55 780 ist ein Verfahren zur Erkennung eines digitalisierten Zeichens bekannt, wobei die Gestalt eines Zeichens durch die Zahl, die Position und die Ge­ stalt von abwechselnden Konturkrümmungen, insbesondere Konvexkrümmungen wiedergegeben wird, wenn das Zeichen von zwei Seiten betrachtet wird. Die Artengruppe eines Zei­ chens wird dabei durch die Anzahl und die Positionen der konvexen Krümmungen bestimmt, wobei insgesamt neun Arten­ gruppen in dem System Verwendung finden. Jeder Artengruppe wird ein getrennter linearer logischer Diskriminationstest zugeordnet, und zwar für jedes Paar der Zeichen, welche die Artengruppe gemeinsam haben. In Abhängigkeit von der Artengruppe des zu erkennenden Zeichens werden die zuge­ ordneten paarweisen Diskriminantentests durchgeführt und die Zeichenklasse, welche eine bestimmte Anzahl dieser Tests überdauert hat, wird dann schließlich als die Klasse des Zeichens identifiziert, die zu erkennen war.
Bei der praktischen Realisierung dieses bekannten Verfah­ rens wird auch ein Histogramm gebildet, und zwar ein lin­ kes Histogramm und ein rechtes Histogramm, wobei das Hi­ stogramm dadurch definiert ist, daß Adressen gesammelt werden, bei denen ein erster schwarzer Bildpunkt in jeder der Abtastzellen auftritt.
Aus der US-PS 38 03 553 ist ein Zeichenerkennungsgerät be­ kannt, bei welchem Projektionsmuster mit einer Anzahl von genormten Projektionsmustern verglichen werden und wobei die Projektionsmuster dadurch erhalten werden, indem eine Dichteverteilung eines gedruckten Zeichens auf zwei sich orthogonal schneidenden Achsen projiziert wird. Die ge­ normten Projektionsmuster werden mit Hilfe eines ähnlichen Verfahrens gebildet und werden getrennt aufgezeichnet bzw. gespeichert.
Bei der maschinellen Erkennung von handgeschriebenen, ma­ schinengeschriebenen oder gedruckten Zeichen wird das zu erkennende Zeichen zunächst von einem Abtaster optisch ge­ lesen, d. h. abgetastet, um ein binäres Abbild des Zeichens zu definieren, und anschließend wird ein Zeichenbereich, der darin das so definierte binäre Abbild enthält, in eine Mehrzahl von Unterbereichen unterteilt, woran sich das Extrahieren von Merkmalen für jeden der Unterbereiche an­ schließt. Bei der bekannten Zeichenerkennungstechnologie wurde die Bereichsunterteilung unter Verwendung fester Un­ terteilungspunkte ausgeführt, wie in der JP-OS 56-1 10 191 beschrieben, oder durch variable Bestimmung von Unterteil­ lungspunkten, wobei ein Schwerpunkt der Konturverteilung des zu erkennenden Zeichens verwendet wird, wie in "Oki Electric Research and Development", Dezember 1983, 121, Band 50, Nr. 3, Seiten 77 bis 82, beschrieben. Bei dem erstgenannten Verfahren hat sich jedoch gezeigt, daß die festen Unterteilungspunkte häufig ungeeignet sind, da in einem zu erkennenden Zeichen Verformungen vorhanden sind, so daß Zeichenmerkmale nicht richtig extrahiert werden konnten, wodurch die Zeichenerkennungsfähigkeit herab­ gesetzt wurde. Das Verfahren mit solchen Festpunkten für die Unterteilung ist daher nicht geeignet, Verformungen in den zu erkennenden Zeichen Rechnung zu tragen. Das zweit­ genannte Verfahren, das den Schwerpunkt eines Zeichens ver­ wendet, ist auf Zeichenverformungen weniger empfindlich. Der für die Unterteilungen eines Zeichenbereiches erfor­ derliche Berechnungsaufwand ist jedoch enorm, da dieses Verfahren den Schwerpunkt der Konturverteilung des Zei­ chens verwendet, so daß dieses Verfahren im allgemeinen sehr langsam abläuft.
Um die oben beschriebenen Probleme zu überwinden, ist be­ reits ein Zeichenerkennungsverfahren vorgeschlagen worden, das in der japanischen Patentanmeldung 59-2 17 716 seinen Niederschlag gefunden hat und die meisten der oben be­ schriebenen Nachteile beseitigt. Dennoch bleiben noch im­ mer Forderungen zu erfüllen, die sich aus der Unterschei­ dung einander ähnlicher Zeichen und der Erkennung verform­ ter Zeichen oder gedruckter oder handgeschriebener Zeichen geringer Qualität ergeben.
Der Erfindung liegt daher die Aufgabe zugrunde, die Nach­ teile des oben beschriebenen Standes der Technik zu über­ winden und ein verbessertes Zeichenerkennungsverfahren anzugeben, das in der Lage ist, auch schlecht dargestellte, insbesondere handgeschriebene verformte Zeichen mit größe­ rer Sicherheit zu erkennen.
Diese Aufgabe wird durch die im Kennzeichnungsteil des An­ spruches 1 aufgeführten Merkmale gelöst.
Besonders vorteilhafte Ausgestaltungen und Weiterbildungen der Erfindung ergeben sich aus den Unteransprüchen 2 bis 11.
Im folgenden wird die Erfindung anhand von Ausführungsbei­ spielen unter Hinweis auf die Zeichnung näher erläutert. Es zeigt:
Fig. 1 ein Flußdiagramm des Verfahrensablauf zur automatischen Erkennung eines Eingabezeichens in Übereinstimmung mit einer Ausführungsform mit Merkmalen nach der vorliegenden Erfindung;
Fig. 2 ein Blockdiagramm, das schematisch den Gesamtaufbau eines optischen Zeichenerkennungssystems zur Ausführung der Schritte in Fig. 1 zeigt;
Fig. 3 eine Darstellung, die ein Beispiel eines binären Zeichenabbildes in Form einer Punktmatrix zeigt, die durch optische Abtastung des Buchstabens "B" erhalten wird;
Fig. 4 eine Darstellung, die das Ergebnis zeigt, wenn eine Zeilenverbreiterung auf das binäre Zeichenabbild nach Fig. 3 angewendet worden ist;
Fig. 5 eine Darstellung des Ergebnisses, wenn mehrere vorbestimmte Richtungskodes selektiv der Kontur des verbreiterten binären Zeichenkodes nach Fig. 4 zugeordnet worden sind. Weiterhin zeigt Fig. 5 das Ergebnis der Unterteilungen des Abbildes;
Fig. 6 eine schematische Darstellung, die die Korrespondenz zwischen mehreren Richtungskodes, die selektiv den weißen Umrißpixeln eines binären Zeichenabbildes zuzuordnen sind, und Pixelmustern zeigt;
Fig. 7 ein Flußdiagramm des Ablaufs der Schritte in einem Verfahren zur Zeichenunterteilung, das zur Anwendung auf das Zeichenerkennungsverfahren nach Fig. 1 geeignet ist;
Fig. 8 ein Flußdiagramm, das die Schrittablauffolge eines Zeichenerkennungsvorganges in Übereinstimmung mit einer anderen Ausführungsform mit Merkmalen nach der vorliegenden Erfindung zeigt;
Fig. 9 ein Blockdiagramm, das den Aufbau eines optischen Zeichenerkennungssystems zur Ausführung des Verfahrens nach Fig. 8 zeigt;
Fig. 10 eine schematische Darstellung, daß die Korrespondenzen zwischen mehreren Richtungskodes, die selektiv weißen Umrißpixeln eines binären Zeichenabbildes zuzuordnen sind, und Pixelmustern zeigt;
Fig. 11 eine Darstellung, die ein binäres Zeichenabbild für ein handgeschriebenes japanisches Katakana-Zeichen "a" nach der Vorverarbeitung zeigt;
Fig. 12 eine Darstellung, die die Ergebnisse zeigt, wenn ein Satz von Richtungskodes für schwarze Umrißpixel selektiv den Umriß-Schwarzpixeln des binären Zeichenabbildes nach Fig. 11 zugeordnet worden ist;
Fig. 13 eine Darstellung, die das Ergebnis zeigt, wenn ein Satz Richtungskodes für weiße Umrißpixel selektiv den Umriß-Weißpixeln des binären Zeichenabbildes nach Fig. 11 zugeordnet worden ist;
Fig. 14 eine Darstellung, die ein Beispiel von X- und Y- Histogrammen für ein binäres Zeichenabbild zeigt, dessen Umriß ein Satz von Richtungskodes selektiv zugeordnet worden ist;
Fig. 15 ein Flußdiagramm, das die Schrittablauffolge in einem Zeichenunterteilungsverfahren zeigt, das vorteilhafterweise auf das Zeichenerkennungsverfahren nach Fig. 8 angewendet werden kann;
Fig. 16 eine Darstellung, die die Ergebnisse einer Zeichenunterteilung zeigt, die mit dem Verfahren nach Fig. 15 ausgeführt worden ist;
Fig. 17 ein Flußdiagramm, das die Schrittablauffolge eines anderen Zeichenunterteilungsverfahrens zeigt, das ebenfalls vorteilhafterweise auf das Zeichenerkennungsverfahren nach Fig. 8 angewendet werden kann;
Fig. 18 eine Darstellung der Ergebnisse einer Zeichenunterteilung, die nach dem Verfahren nach Fig. 17 ausgeführt wird;
Fig. 19 ein Flußdiagramm, das die Schrittablauffolge eines weiteren Zeichenunterteilungsverfahrens zeigt, das ebenfalls vorteilhafterweise auf das Zeichenerkennungsverfahren nach Fig. 8 anwendbar ist;
Fig. 20 eine Darstellung des Ergebnisses einer Zeichenunterteilung, die nach dem Verfahren nach Fig. 19 abläuft;
Fig. 21 ein Schema, wie die Fig. 21a und 21b zusammenzusetzen sind;
Fig. 21a und 21b zusammen ein Flußdiagramm, das die Schrittablauffolge eines Zeichenunterteilungsverfahrens zeigt, das in Übereinstimmung mit einer Ausführungsform mit Merkmalen nach der vorliegenden Erfindung gestaltet ist und vorteilhafterweise auf ein Zeichenerkennungsverfahren anwendbar ist;
Fig. 22 eine Darstellung einer Mehrzahl von Richtungskodes, die grundsätzlich den Richtungskodes nach Fig. 6 entsprechen;
Fig. 23 eine Darstellung eines Beispiels eines Histogrammes für die Merkmalspixel eines binären Zeichenabbildes;
Fig. 24a und 24b Darstellungen der Ergebnisse von Zeichenunterteilungen, wenn diese durch das Verfahren nach den Fig. 21a und 21b ausgeführt werden;
Fig. 25 eine schematische Darstellung, wie die Fig. 25a und 25b zusammenzusetzen sind;
Fig. 25a und 25b zusammen ein Flußdiagramm, das die Schrittablauffolge eines weiteren Zeichenunterteilungsverfahrens zeigt, das gemäß einem weiteren Ausführungsbeispiel mit Merkmalen nach der vorliegenden Erfindung gestaltet ist und ebenfalls vorteilhaft auf ein Zeichenerkennungsverfahren angewendet werden kann;
Fig. 26a und 26b Darstellungen der Ergebnisse einer Zeichenunterteilung, die nach den Verfahren nach den Fig. 21a und 21b bzw. 25a und 25b ausgeführt worden sind;
Fig. 27 eine schematische Darstellung, wie die Fig. 27a und 27b zusammenzusetzen sind;
Fig. 27a und 27b zusammen ein Flußdiagramm hinsichtlich der Schrittablauffolge eines weiteren Zeichenunterteilungsverfahrens, das in Übereinstimmung mit einem weiteren Ausführungsbeispiel mit Merkmalen nach der vorliegenden Erfindung aufgebaut ist und ebenfalls vorteilhaft bei einem Zeichenerkennungsverfahren angewandt werden kann;
Fig. 28a und 28b die Ergebnisse von Zeichenunterteilungen, die nach den Verfahren nach den Fig. 25a und 25b bzw. 27a und 27b ausgeführt worden sind;
Fig. 29 ein Blockschaltbild, das den Aufbau eines Zeichenunterteilungssystems zeigt, das in der Lage ist, die Zeichenunterteilungsverfahren nach den Fig. 21a und 21b bzw. 25a und 25b bzw. 27a und 27b auszuführen, und
Fig. 30a und 30b Darstellungen der Ergebnisse einer Unterteilung eines japanischen Katakana-Zeichens "wu", die unter Verwendung fester Unterteilungsstellen ausgeführt worden sind.
Fig. 1 zeigt im Flußdiagramm ein Zeichenerkennungsverfahren, das in Übereinstimmung mit einer Ausführungsform mit Merkmalen nach der vorliegenden Erfindung gestaltet ist. Fig. 2 zeigt andererseits in Blockform einen optischen Zeichenleser (OCR) oder optisches Zeichenerkennungssystem zur Ausführung des Zeichenerkennungsverfahrens nach Fig. 1. Im ersten Schritt wird ein handgeschriebenes oder gedrucktes Eingabezeichen, das zu erkennen ist, d. h. ein unbekanntes Zeichen, optisch von einem Zeichenabtaster 11 gelesen, wobei das unbekannte Zeichen in ein binäres Zeichenabbild umgewandelt wird, in welchem ein Zeichenteil durch eines von zwei Binärdaten, d. h. von "1ern" dargestellt wird, und der übrige Hintergrundbereich durch das andere der zwei Binärdaten, d. h. von "0en" dargestellt wird. Es sei hervorgehoben, daß eine Originalvorlage typischerweise eine Anzahl Zeichen enthält, die von dem Abtaster 11 Zeile für Zeile abgetastet werden. Man erhält daher üblicherweise eine Serie von binären Zeichenabbildern, die dann einer Zeichenextraktionseinheit 12 zugeführt werden, wo die Serien von binären Zeichenabbildern voneinander getrennt werden.
Ein so von den anderen Abbildern getrenntes Zeichenabbild wird dann einer Verbreiterungseinheit 13 zugeführt, wo ein Zeilenverbreiterungsvorgang an dem einzelnen binären Zeichenabbild ausgeführt wird (Schritt 1 in Fig. 1).
Das Zeilenverbreiterungsverfahren ist in einer Form ein Verfahren, bei welchem die zwei weißen Pixel zu den linken und rechten Seiten eines schwarzen Pixels im binären Zeichenabbild in schwarze Pixel umgewandelt werden, um dadurch die Zeile zu verbreitern, die das binäre Zeichenabbild bildet.
Fig. 3 zeigt ein binäres Zeichenabbild des lateinischen Großbuchstabens "B" in Form einer 5 × 7-Punktmatrix, wenn es optisch mit einer Auflösung von 12 Zeilen pro Millimeter gelesen wird. Es sei hervorgehoben, daß in Fig. 3 das Symbol "$" einem schwarzen Pixel entspricht. Wenn das oben beschriebene Zeilenverbreiterungsverfahren auf dieses binäre Zeichenabbild angewendet wird, dann erhält man das Zeilen-verbreiterte binäre Zeichenabbild, das in Fig. 4 dargestellt ist. Wie man sogleich erkennt, werden die Zwischenräume zwischen Punkten durch Punkte ausgefüllt, so daß das Zeilen-verbreiterte binäre Zeichenabbild weniger durch eine Verschiebung in der Punktposition und durch Streuung im Punkt-zu- Punkt-Abstand beinträchtigt wird. Die späteren Schritte der Zeichenunterteilung und der Merkmalsextraktion können daher bei einem solchen Zeilen-verbreiterten binären Zeichenabbild stabiler ausgeführt werden. Wenn die Auflösung des Abtasters 11 höher ist, beispielsweise 16 Zeilen/mm beträgt, dann kann die Wirkung des oben beschriebenen Zeilenverbreiterungsschemas wegen des wachsenden Punkt-zu-Punkt-Abstandes eines binären Zeichenabbildes nicht ausreichend sein. In diesem Falle kann man das Zeilenverbreiterungsschema so ausgestalten, daß nicht nur die linken und rechten weißen Pixel eines schwarzen Pixels, sondern auch die oberen und unteren weißen Pixel benachbart des schwarzen Pixels jeweils in schwarze Pixel umgeändert werden. In diesem Falle werden daher vier benachbarte weiße Pixel, d. h. die linken und rechten, oberen und unteren Pixel jeweils in schwarze Pixel geändert, während es beim vorangehend erläuterten Beispiel nur zwei Pixel waren, die verändert wurden.
Das Zeilen-verbreiterte binäre Zeichenabbild wird dann einer Richtungskode-Zuordnungseinheit 14 zugeführt, wo mehrere vorbestimmte Richtungskodes, die in Fig. 6 dargestellt sind, selektiv den weißen Pixeln, die der Kontur des binären Zeichenabbildes benachbart sind, zugeordnet werden (Schritt 2). Wie Fig. 6 zeigt, gibt es neun unterschiedliche Richtungskodes "0" bis "8", die jeweils einem bestimmten Muster einer Pixelanordnung zugeordnet sind. Das zugehörige Pixelanordnungsmuster besteht aus fünf Pixeln, die ein mittleres Pixel als das interessierende Pixel, ein Paar Pixel zur rechten und linken Seite des mittleren Pixels und ein Paar obere und untere Pixel oberhalb und unterhalb des mittleren Pixels aufweisen. Jedes Pixel wird daher durch ein kleines Quadrat dargestellt. Ein schraffiertes Quadrat stellt ein schwarzes Pixel dar, und ein unschraffiertes Quadrat stellt ein weißes Pixel dar. Es sei auch angemerkt, daß es acht mögliche Muster für Richtungskodes "0" gibt, während jeder der anderen Richtungskodes "1" bis "8" eine ganz bestimmte einzigartige Pixelanordnung aufweist.
Die Zuordnung eines Richtungskodes zu jedem der weißen Pixel, die der Kontur eines binären Zeichenabbildes benachbart sind, wird in folgender Weise ausgeführt. Das Zeilen-verbreiterte binäre Zeichenabbild wird abgetastet, wobei jedes der weißen Pixel, die die Kontur des Zeilen-verbreiterten binären Zeichenabbildes begrenzen, zusammen mit den oberen und unteren, sowie rechten und linken benachbarten Pixeln mit jedem der Muster verglichen wird, die in Fig. 6 dargestellt sind. Wenn somit ein Pixelmuster, das die gleiche Anordnung von schwarzen und weißen Pixeln aufweist, ermittelt worden ist, dann wird der zugehörige Richtungskode dem fraglichen weißen Pixel zugeordnet. Nach Abschluß der Zuordnung von Richtungskodes zu den weißen Pixeln benachbart der Kontor des Zeilen-verbreiterten binären Zeichenabbildes nach Fig. 5 erhält man ein Zeichen, dessen Kontur durch die Richtungskodes definiert ist.
In dem oben beschriebenen Beispiel ist ein Satz Richtungskodes selektiv den weißen Pixeln zugeordnet worden, die der Kontur des Zeilen-verbreiterten binären Zeichenabbildes benachbart sind. Andererseits sei noch festgehalten, daß ein anderer Satz von Richtungskodes, wie er in Fig. 10 dargestellt ist, ebenfalls verwendet werden könnte, in welchem Falle die selektive Zuordnung der Richtungskodes nach Fig. 10 an den schwarzen Pixeln ausgeführt wird, die die Kontur des Zeilen-verbreiterten binären Zeichenabbildes definieren.
Das Zeichenabbild mit den zugeordneten Kodes wird dann einer Merkmalextraktionseinheit 15 zugeführt, wo das vorgenannte, die zugeordneten Kodes enthaltende Zeichenabbild abgetastet wird, um die Richtungskodes zu zählen, und es werden auf der Grundlage des gezählten Wertes Unterteilungsstellen bestimmt, wodurch die Höhe und die Breite des Zeichenabbildes in vier Sektionen unterteilt wird, so daß man Unterbereiche mit 4 × 4 Maschen erhält (Schritt 3). Das Verfahren der variablen Unterteilung eines Zeichenabbildes oder Bereiches in Abhängigkeit von dem gezählten Wert der Richtungskodes wird im Detail später erläutert. Das die zugeordneten Kodes enthaltende Zeichenabbild wird dann nochmals abgetastet und die individuellen Richtungskodes werden für jeden der unterteilten Bereiche oder Unterbereiche gezählt, und ein Histogramm in bezug auf die Richtungskodes wird für jeden der Unterbereiche erzeugt (Schritt 4). Diese Histogramminformation wird dann einer Identifizierungseinheit 16 als ein Merkmal eines eingegebenen oder unbekannten zu erkennenden Zeichens zugeführt. Die Identifizierungseinheit 16 ist weiterhin mit einer Bibliothek 17 verbunden, um von dieser Informationen aufzunehmen. In der Bibliothek 17 sind ähnliche Histogramme für eine Anzahl bekannter Zeichen gespeichert. Bei Empfang einer Histogramminformation für ein unbekanntes eingegebenes Zeichen vergleicht die Identifizierungseinheit 16 daher diese Information mit jedem der in der Bibliothek gespeicherten Histogrammdaten, um herauszufinden, welche derselben am besten mit der Histogramminformation des unbekannten Zeichens übereinstimmen, um dadurch das unbekannte, eingegebene Zeichen als dasjenige der gespeicherten Zeichen zu identifizieren oder zu erkennen, das die am besten übereinstimmenden Histogrammdaten aufweist.
Bei diesem Identifizierungsschritt wird eine Distanz zwischen den Histogrammdaten des unbekannten Zeichens und der Histogrammdaten eines der in der Bibliothek 17 gespeicherten Zeichen berechnet (Schritt 5). Solch eine Distanz kann eine einfache Euklid'sche Distanz sein. Das heißt durch Anzeige eines Histogramms eines Richtungskodes k für einen Unterbereich (i, j) eines eingegebenen Zeichens durch Hkÿ und eines Histogramms eines Richtungskodes k für einen Unterbereich (i, j) eines in der Bibliothek 17 gespeicherten bekannten Zeichens durch Dkÿ läßt sich dann eine Distanz d zwischen diesen zwei Histogrammen durch folgende Gleichung berechnen:
Sodann wird das bekannte Zeichen, das in der Bibliothek 17 gespeichert ist und das die kleinste berechnete Distanz gemäß der obigen Gleichung aufweist, nun ausgewählt und als ein Ausgang abgegeben (Schritt 6).
Es wird das Zeichenunterteilungsverfahren im Schritt im Detail unter Bezugnahme auf Fig. 7 erläutert. Es sei hervorgehoben, daß das Flußdiagramm in Fig. 7 eine Folge von Schritten zu Bestimmung von Unterteilungsstellen längs der X-Achse angibt. Die Unterteilungsstellen längs der Y-Achse können jedoch ebenfalls durch einen vergleichbaren Vorgang bestimmt werden. Es sei fernerhin hervorgehoben, daß das Zeichenunterteilungsverfahren, das nachfolgend erläutert wird, an der Merkmalsextraktionseinheit 15 ausgeführt wird. Die Funktion der Merkmalsextraktionseinheit 15 wird typischerweise durch eine Kombination aus Hardware aus beispielsweise einem Mikroprozessor und einem Speicher und einem Softwareprogramm ausgeführt. Es besteht kein Zweifel daran, daß der Fachmann eine solche Kombination zur Ausführung des vorliegenden Zeichenunterteilungsverfahrens ohne Schwierigkeit aufbauen kann. Es sei fernerhin angemerkt, daß solche Elemente, wie beispielsweise ein Zähler und ein Register, die in der nachfolgenden Beschreibung erwähnt werden, einem internen Register eines Mikroprozessors oder einem Register eines Speichers entsprechen können, und daß der Bestimmungsschritt durch einen Mikroprozessor ausgeführt werden kann.
An erster Stelle wird eine Beschreibung der Unterteilungen in der X-Richtung gegeben. Das die zugeordneten Kodes aufweisende Zeichenabbild, das in einem Speicher gespeichert ist, wird abgetastet und die Gesamtzahl PE der zugeordneten Richtungskodes, d. h. die Anzahl von Pixeln, die die Kontur einer Zeichenzeile definieren, wird gezählt (Schritt 21 in Fig. 7). Sodann wird der Anfangswert von "1" in einen Zähler n eingegeben, wobei die Anzahl der Unterteilungen in der X-Richtung (im vorliegenden Beispiel 4) in einen Zähler N eingegeben wird, wobei der Umfang der Überlappung von Unterbereichen in ein Register T eingegeben wird und ein Richtungskodezähler Px und X-Adressenzähler gelöscht werden (Schritt 22). Nach Abschluß dieses vorbereitenden Schrittes wird das die zugeordneten Kodes aufweisende Zeichenabbild in Y-Richtung als der Hauptabtastrichtung und in X-Richtung als einer Hilfsabtastrichtung senkrecht zur Y-Richtung abgetastet, während welchen Abtastungen die Richtungskodes gezählt werden, um die Unterteilungsstellen in X-Richtung nacheinander zu bestimmen.
Diesbezüglich sei folgendes im einzelnen erläutert. Der X-Adresszähler zur Bezeichnung einer Abtastzeile wird im Schritt 24 um 1 erhöht und dann, während die durch den Zählwert des X-Zählers bestimmte Zeile in Y-Richtung abgetastet wird, wird der Zählwert eines Richtungskodeszählers Px immer dann erhöht, wenn ein Richtungskode ermittelt worden ist (Schritt 25). Nach Abschluß der Abtastung einer Zeile wird ermittelt, ob der Zählwert des Richtungskodezählers Px, d. h. ob die Anzahl der Richtungskodes zwischen der Anfangszeile entsprechend X = 1 und der laufenden, durch den X-Adresszähler bezeichneten Zeile gleich oder größer als (PE/N) Xn ist, oder nicht (Schritt 26). Wenn das Ergebnis negativ ist, dann geht der Verfahrensablauf zu Schritt 24 zurück, um die nächste Zeile abzutasten und erneut die Richtungskodes zu zählen, wenn solche ermittelt werden. Wenn andererseits das Ergebnis im Schritt 26 positiv ist, dann wird die Zeile, die durch die laufende Zählung im X-Adreßzähler angegeben wird, als ein Endpunkt oder als eine Stelle einer n-ten Unterteilung in X-Richtung bestimmt (d. h. eine rechtsliegende Stelle einer Unterteilung). Außerdem wird die Zeile, die durch einen Wert angegeben wird, den man durch Abziehen des Wertes eines Registers T vom laufenden Zählwert im X-Adresszähler erhält, als ein Startpunkt oder Startstelle des nächsten Unterbereiches bestimmt (d. h. linke Stelle einer Unterteilung). Sodann wird der Zählerstand des Zählers n um 1 erhöht (Schritt 28), und anschließend geht der Ablauf zum Schritt 23 zurück, um einen gleichartigen Verfahrensablauf zu wiederholen.
Auf diese Weise wird die Zeilenposition (X-Adresse), an der die Zahl Px der Richtungskodes den Wert von PE/4 erreicht hat, als ein Endpunkt für den ersten Unterbereich definiert, und eine Zeile, die um T Zeilen von dieser Position liegt, wird als ein Startpunkt für den zweiten Unterbereich definiert. Wenn die Anzahl Px der Richtungskodes den Wert PE/2 erreicht hat, dann wird ihre Zeilenposition als ein Endpunkt des zweiten Unterbereiches definiert, und die um T Zeilen vor dieser Zeile liegende Zeile wird als ein Startpunkt für den dritten Unterbereich definiert. Wenn die Zählung Px der Richtungskodes den Wert PEX 3/4 erreicht hat, dann wird darüber hinaus diese Zeilenposition als ein Endpunkt des dritten Unterbereiches definiert, und die Zeilenposition, die um T Zeilen vor dieser Zeile liegt, wird als ein Startpunkt für den vierten Unterbereich definiert. Es sei festgehalten, daß der Startpunkt des ersten Unterbereiches der linken Seite eines Zeichenrahmens entspricht, und der Endpunkt des vierten Unterbereiches der rechten Seite des Zeichenrahmens entspricht. Bei Bestimmung des Endpunktes des dritten Unterbereiches und des Startpunktes des vierten Unterbereiches wird das Bestimmungsergebnis beim Schritt 23 negativ, so daß die Schritte zur Bestimmung der Unterteilungsstellen in X-Richtung beendet werden.
Sodann wird die Bestimmung der Unterteilungsstellen in Y-Richtung in gleicher Weise ausgeführt. Da die Gesamtzahl PE der Richtungskodes jedoch schon bestimmt worden ist, wird dieser Schritt nicht wiederholt. In diesem Falle wird der Abtastbetrieb zur Bestimmung der Unterteilungsstellen mit der X-Richtung als Hauptabtastrichtung und der Y-Richtung als der Unterabtastrichtung ausgeführt. Der Startpunkt des ersten Unterbereiches in Y-Richtung entspricht der Oberseite des Zeichenrahmens, und der Endpunkt des vierten Unterbereiches in Y-Richtung entspricht der Unterseite des Zeichenrahmens. Auf diese Weise wird unter Verwendung der so bestimmten Unterteilungsstellen (d. h. der End- und Startpunkte) in X- und Y-Richtung das Kode-zugeordnete Zeichen oder ein durch den Rahmen des Kode-zugeordneten Zeichens definierter Bereich in ein 4 × 4-Netz von Unterbereichen unterteilt. Ein solcher Netz von 4 × 4-Unterbereichen ist in Fig. 5 mit dünnen Linien eingezeichnet. Es sei auch angemerkt, daß in diesem Falle der Bereichsüberlappungsumfang T auf Null eingestellt ist.
Wie oben beschrieben, werden die Unterteilungsstellen Stelle für Stelle in Abhängigkeit von der Stellenverteilung der Richtungskodes bestimmt, so daß die Zeichenunterteilung an Stellen ausgeführt werden kann, die für das Ausmaß von Verformungen eines Buchstabens geeignet sind, was zur Verbesserung der Erkennungsrate beiträgt. Ein solches Verfahren, die Unterteilungsstellen eines Zeichens variabel zu gestalten, kann die Probleme beseitigen, die den bekannten Verfahren eigen waren, die mit festen Unterteilungsstellen arbeiteten, wobei dennoch bei der Erfindung kein komplizierter Rechenvorgang erforderlich ist. Das oben beschriebene Zeichenunterteilungsverfahren nach der vorliegenden Erfindung ist im Vergleich zu den bekannten Verfahren schnell und einfach. Wenn jedoch, wie oben beschrieben, ein binäres Zeichenabbild eines Punktmatrixzeichens niedriger Qualität, wie in Fig. 3 gezeigt, verarbeitet wird, ohne einen Zeilenverbreiterungsschritt auszuführen, dann könnte sich aufgrund der Punktverschiebung und Schwankung des Punkt-zu-Punkt-Abstandes ein Problem ergeben. Es wird daher zunächst ein Zeilenverbreiterungsschritt an einem binären Zeichenabbild ausgeführt, bevor die Richtungskodes zugeordnet werden. Das Verfahren nach der vorliegenden Erfindung wird daher durch eine geringe Qualität eines binären Zeichenabbildes, wie beispielsweise durch eine Verschiebung der Punktposition und durch eine Schwankung des Punkt-zu-Punkt-Abstandes nicht nachteilig beeinflußt. Als Folge davon kann man gemäß diesem Aspekt der vorliegenden Erfindung selbst für Punktmatrixzeichen relativ geringer Qualtiät, wie beispielsweise bei Zeichen, die von einer 5 × 7-Punktmatrix angegeben werden, eine ausreichend hohe Erkennungsrate erzielen.
Es sei weiterhin angemerkt, daß der Zeilenverbreiterungsvorgang relativ einfach abläuft und in einer sehr kurzen Zeitdauer ausgeführt werden kann, so daß keine Wahrscheinlichkeit besteht, daß die Zeichenerkennungszeitdauer merklich verlängert wird. Es ist ferner festzuhalten, daß der Zeilenverbreiterungsvorgang auch jede andere Form annehmen kann, als oben beschrieben.
Es sei nun ein weiterer Aspekt der vorliegenden Erfindung unter Bezugnahme auf die Fig. 8 bis 20 erläutert. Fig. 8 zeigt ein Flußdiagramm, das die Schrittablauffolge eines Zeichenerkennungsverfahrens zeigt, das in Übereinstimmung mit einer Ausführungsform dieses Aspektes der Erfindung aufgebaut ist, und Fig. 9 zeigt in Blockform den Aufbau eines optischen Zeichenlesers (OCR) oder eines optischen Zeichenerkennungssystems, das zur Ausführung des Zeichenerkennungsverfahrens nach Fig. 8 eingerichtet ist.
Bezugnehmend auf Fig. 9 werden geschriebene oder gedruckte Zeichen, beispielsweise Buchstaben oder Symbole, als Original optisch von einem Abtaster 31 gelesen, und die optisch gelesene Zeicheninformation wird dann in eine binäre Zeicheninformation von einer Vorverarbeitungseinheit 32 umgewandelt, die auch die binäre Zeicheninformation in einzelne Zeichendaten trennt, die Daten normiert und dann glättet. Es ergibt sich daher ein einzelnes binäres Zeichenabbild, das normiert und geglättet worden ist, und dieses wird einer Merkmalsextraktionseinheit 31 zugeführt, wo mehrere vorbestimmte Richtungskodes der Kontur eines solchen binären Zeichenabbildes selektiv zugeordnet werden. Wie zuvor beschrieben, gibt es zwei Sätze solcher Richtungskodes, ein Satz für die Anwendung auf weiße Pixel, wie in Fig. 6 gezeigt, und der andere Satz zur Anwendung auf schwarze Pixel, wie in Fig. 10 gezeigt. Es sei weiterhin angemerkt, daß in dem Falle, in welchem ein Satz Richtungskodes zur Anwendung auf schwarze Pixel verwendet wird, solche Richtungskodes jeweils einem von zwei Pixeln in Zeilenbreitenrichtung zugeordnet werden, wenn eine Zeichenzeile eine Zeilenbreite von 2 oder mehr aufweist. Wenn andererseits die Zeilenbreite gleich 1 ist, dann ist nur ein Pixel zur Definition einer Zeichenzeile vorhanden, so daß nur ein Richtungskode zugeordnet wird, so daß die Anzahl zugeordneter Richtungskodes die Hälfte derjenigen ist, die sich ergeben würde, wenn die Zeilenbreite gleich 2 oder mehr wäre. Was dies angibt, ist die Tatsache, daß die Merkmalsdaten instabil würden, wenn ein Satz von Richtungskodes für schwarze Pixel auf eine schmale Zeile angewendet würde, deren Zeilenbreite gleich 1 ist. Ein solches Problem erwächst andererseits nicht, wenn von einem Satz Richtungskodes für weiße Pixel im Falle einer solchen schmalen Zeile Gebrauch gemacht wird. Wenn andererseits ein Zeilen-zu-Zeilen-Abstand relativ klein ist, dann kann ein solcher Abstand durch Anwendung eines Richtungskodes für weiße Pixel verschwinden. In diesem Falle erwächst jedoch ein solches Problem nicht, wenn man von einem Satz Richtungskodes für schwarze Pixel Gebrauch macht. Dementsprechend sollte der passende Satz aus den Richtungskodes in Abhängigkeit von Anwendungsfall ausgewählt werden.
Fig. 11 zeigt ein binäres Zeichenabbild eines japanischen Katakana-Zeichens "a", das wie der englische Vokal "a" ausgesprochen wird. Dieses Zeichen wird von der Vorverarbeitungseinheit 32 der Merkmalsextraktionseinheit 33 zugeführt. Wenn ein Satz Richtungskodes für schwarze Pixel den schwarzen Pixeln zugeordnet wird, die die Kontur des binären Zeichenabbildes in Fig. 11 definieren, dann erhält man ein Kodezugeordnetes Zeichenabbild, das in Fig. 12 dargestellt ist. Wenn andererseits ein Satz Richtungskodes für weiße Pixel den weißen Pixeln zugeordnet wird, die die Kontur des binären Zeichenabbildes nach Fig. 11 definieren, dann erhält man ein Kode-zugeordnetes Zeichenabbild, das in Fig. 13 dargestellt ist.
Wie später erläutert, wird gleichzeitig mit der Zuordnung der Richtungskodes die Gesamtzahl der Pixel, denen Richtungskodes zugeordnet worden sind, und ein auf eine X-Achse und/oder eine Y-Achse projiziertes Histogramm erhalten und gespeichert. Es ist wahr, daß das Zählen einer solchen Gesamtzahl Pixel und das Bilden einer solchen Histogrammtafel oder -tafeln unabhängig auch im Anschluß an die Richtungskodezuordnung ausgeführt werden kann. Die gleichzeitige Ausführung ist jedoch vorzuziehen, weil man einige Vorteile dadurch erhält, wie beispielsweise einer Verminderung der Verarbeitungszeit beispielsweise aufgrund einer Verminderung der Anzahl von Abtastoperationen eines Zeichenbildes.
Anschließend wird in der Merkmalsextrahierungseinheit 33 das Kode-zugeordnete Zeichenbild in eine Mehrzahl von N × N Netzunterbereiche in X- und Y-Richtung unterteilt. Wie später im Detail erläutert wird, werden die Unterteilungsstellen längs der X- und Y-Achsen derart bestimmt, daß jeder dieser M × M Netzunterbereiche im wesentlichen die gleiche Anzahl von Pixeln aufweist, denen Richtungskodes zugeordnet worden sind. Mit einem solchen Aufbau können Unterteilungen eines Zeichenabbildes in weitgehender Anpassung an das Ausmaß von Deformationen oder Abweichungen eines Zeichenabbildes von der Standardgestalt ausgeführt werden. Eine solche variable Zeichenunterteilung ist gegenüber den bekannten Unterteilungsverfahren, die feste Unterteilungsstellen verwenden, weit vorteilhafter.
Als nächstes wird in der Merkmalsextrahierungseinheit 33 für jeden (i, j) der in Form eines Netzes unterteilten Unterbereiche ein Histogramm Hkÿ als Funktion der Richtungskodes erzeugt. Hier gibt der Suffix k einen der Richtungskodes 1 bis 8 an.
In der Identifikationseinheit 34 wird unter Verwendung des Histogramms als Funktion der Richtungskodes, die aus der Merkmalsextrahierungseinheit 33 aus dem unbekannten eingegebenen Zeichen extrahiert worden ist, und unter Verwendung der vergleichbaren Histogramme, die in der Bibliothek für bekannte, registrierte Zeichen gespeichert sind, eine Distanz zwischen dem unbekannten eingegebenen Zeichen und jedem der registrierten Zeichen berechnet. Sodann wird das registrierte Zeichen, das die kürzeste berechnete Distanz aufweist, ausgewählt und als ein Zeichen entsprechend dem unbekannten eingegebenen Zeichen ausgegeben. Zu diesem Zweck kann von einer einfachen Euklid'schen Distanz Gebrauch gemacht werden, in welchem Falle eine Distanz dl eines Zeichens l zwischen einem Histogramm Dkÿl des eingegebenen Zeichens und einem Histogramm Hkÿ des eingegebenen Zeichens durch die folgende Gleichung ausgedrückt werden kann:
Es werden nun spezifische Beispiele dieses Aspektes der vorliegenden Erfindung erläutert.
Beispiel 1
Ein binäres Eingabezeichenabbild wird einem Vorverarbeitungs­ schritt unterworfen und dann einem Richtungskodezuordnungs­ schritt in Übereinstimmung mit einem vorbestimmten Algorithmus. Gleichzeitig wird die Gesamtzahl PE der Pixel, denen Richtungskodes zugeordnet worden sind, gezählt, und ein auf die X-Achse projiziertes Histogramm HXi und ein auf die Y-Achse projiziertes Histogramm HYj der Kode-zugeordneten Pixel werden erhalten. Ein spezielles Beispiel eines solchen Histogrammpaares ist in Fig. 14 dargestellt. In dieser Figur ist ein Kode-zugeordnetes Zeichenabbild 40, das aus einem Buchstaben "c" gebildet ist, dargestellt, und eine Serie von Zahlen, die an der Oberseite angeordnet sind, zeigen das unterste Bit der X-Adresse, eine Serie von Zahlen an der linken Seite zeigen die Y-Adresse, und der Rest der Zahlen geben die Richtungskodes an, die der Kontur des eingegebenen Zeichens "c" zugeordnet worden sind. Es sei angemerkt, daß in diesem Beispiel und auch in den letztgenannten Beispielen die horizontale Richtung als die X-Achse angenommen wird und die vertikale Richtung als die Y-Achse angenommen wird. Diese Relation kann jedoch, sofern gewünscht, umgekehrt werden.
In Fig. 14 sind ein Histogramm HXi der Anzahl der Richtungskodes des Kode-zugeordneten Zeichenabbildes 40, das auf die X-Achse projiziert ist, und ein Histogramm HYj der Anzahl der Richtungskodes des Abbildes 40 auf der Y-Achse in Form von Tabellen 41 bzw. 42 gespeichert. Anschließend wird das Zeichenabbild 40 in N Sektionen in X-Richtung und in M-Sektionen in Y-Richtungen unterteilt, wodurch sich eine Anzahl von unterteilten Unterbereichen in einer M × N-Netzform ergibt.
Fig. 15 zeigt ein Flußdiagramm eines Verfahrens zur Bestimmung der Unterteilungsstellen in X-Richtung, und dieses Verfahren wird nachfolgend im Detail erläutert. Nach der Initialisierung von Zählern n und i und des Registers P (Schritt 50 von Fig. 15), wird der Zähler i erhöht (Schritt 54), und dann wird der Wert entsprechend dieses Zählwertes des Zählers i aus dem Histogramm HXi ausgelesen und dem Wert des Registers P hinzuaddiert, wodurch der Wert des Registers P rückgestellt wird (Schritt 56). Anschließend wird geprüft, ob der Wert P des Registers P den Wert von (PE/N) Xn überschritten hat (Schritt 58). Wenn das Ergebnis negativ ist, dann geht der Ablauf zurück zum Schritt 54, um einen gleichen Ablauf zu wiederholen. Im wesentlichen wird in Übereinstimmung mit diesen Schritten bei der Erhöhung der X-Adresse um 1 das Zeichen rastermäßig abgetastet, um die Anzahl p von Pixeln zu zählen, denen Richtungskodes zugeordnet worden sind, und um die Zählung mit einem vorbestimmten Wert von (PE/N) Xn zu vergleichen. Die Wiederholung einer solchen Rasterabtastung und weiterhin einer Rasterabtastung zur Bestimmung der Gesamtanzahl PE ist jedoch redundant und daher nicht sehr effizient. Unter diesen Umständen wird in Übereinstimmung mit diesem Beispiel bei der Zuordnung der Richtungskodes zu der Kontur eines Zeichenabbildes, was eine rasterhafte Abtastung verlangt, die Gesamtzahl PE gleichzeitig mit dem projizierten Histogrammen HXi und HYj erhalten, und diese Daten werden dazu verwendet, eine unnötige Wiederholung einer Rasterabtastung zu vermeiden.
Wenn nun die Bedingung, daß P gleich oder größer als (PE/N) Xn erreicht worden ist, dann wird der laufende Zählwert des Zählers e als eine X-Adresse eines Endpunktes des n-ten Unterbereiches in X-Richtung gespeichert, und eine weitere X-Adresse, die man durch Abziehen eines vorbestimmten Bereichsüberlappungsbetrages T von dieser X-Adresse erhält, wird als eine X-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung gespeichert (Schritt 60). Es sei hervorgehoben, daß der Startpunkt des ersten Unterbereiches in X-Richtung mit der linken Seite (X = 0) des Zeichenabbildes oder Rahmens zusammenfällt und der Endpunkt des letzten und N-ten Unterbereiches in X-Richtung mit der rechten Seite des Zeichenabbildes oder Rahmens zusammenfällt.
Im Anschluß an den Schritt 60 wird der Zähler n erhöht (Schritt 62), und der Ablauf geht auf Schritte über, die die nächste Unterteilungsstelle bestimmen. Dieses Verfahren wird beendet, wenn die Bedingung n = N im Schritt 52 erreicht worden ist.
Die Unterteilungsstellen in Y-Richtung können in gleicher Weise erhalten werden. Das heißt, in diesem Falle wird an Stelle eines Zählers i ein Zähler j entsprechend der Y-Adresse verwendet, und es wird auf ein projiziertes Histogramm HYj entsprechend der Y-Achse Bezug genommen. Außerdem sei angemerkt, daß der Startpunkt für den ersten Unterbereich in Y-Richtung der Oberseite des Zeichenabbildes oder Rahmens und der Endpunkt für den M-ten Unterbereich in Y-Richtung der Unterseite des Zeichenabbildes oder Rahmens entspricht. Auf diese Weise sind die Unterteilungsstellen in X- und Y-Richtung ermittelt worden, so daß das Zeichenabbild in N×M- Unterbereiche in X- und Y-Richtung unterteilt ist.
Fig. 16 zeigt ein Beispiel einer netzartigen Unterteilung eines handgeschriebenen japanischen Katakana-Zeichens "nu", wobei der Bereichsüberlappungsbetrag auf 1 eingestellt ist. Japanische Katakana-Zeichen "nu" und "su" sind ähnlich in der Gestalt wie die lateinischen Buchstaben "E" und "F", der einzige Unterschied zwischen "nu" und "su" liegt in der Tatsache, daß "nu" einen zusätzlichen Strich aufweist, der von links oben nach rechts unten verläuft, wie in Fig. 16 dargestellt. Um die Unterscheidung zwischen "nu" und "su" zu treffen, ist es wichtig, daß dieses Merkmal, d. h. die Anwesenheit eines zusätzlichen Striches, der von links oben nach rechts unten verläuft, durch Unterbereiche in geeigneter Weise widergespiegelt wird, die in Form von Netzmaschen abgeteilt sind. Das vorliegende Beispiel erfüllt dieses Erfordernis und ist daher in der Lage, "nu" von "su" und anderen ähnlichen Zeichen klar zu unterscheiden.
Beispiel 2
Bei diesem Beispiel wird gleichzeitig mit der Richtungskodezuordnung die Gesamtzahl PE von Pixeln, denen Richtungskodes zugeordnet worden sind, und ein Histogramm HYj von Pixeln, denen Richtungskodes zugeordnet worden sind, das auf die Y-Achse projiziert ist, erhalten. Sodann wird in einer Weise ähnlich dem oben beschriebenen Beispiel 1 das Zeichenabbild in M Sektionen in Y-Richtung unterteilt. Sodann wird während der Rasterabtastung eines jeden der in Y-abgestellten Bereiche dieser Bereich auch in N Sektionen in X-Richtung unterteilt. Fig. 17 ist ein Flußdiagramm, das den Ablauf zur weiteren Unterteilung einer der in Y-Richtung abgeteilten M Sektionen in N Sektionen in X-Richtung zeigt.
Diesbezüglich sei zur weiteren Erläuterung auf Fig. 17 Bezug genommen. Nach Initialisierung der Zähler n und i und des Registers P (Schritt 70) wird der Zähler i erhöht (Schritt 74), und das Zeichenabbild wird in Y-Richtung auf die X-Adresse entsprechend dem inkrementierten i-Raster abgetastet, wodurch die Anzahl von Pixeln, denen Richtungskodes zugeordnet worden sind, in dieser Zeile gezählt wird, und ihr Wert Pi wird dem Register P hinzuaddiert (Schritt 78). Sodann wird geprüft, ob der Wert P des Registers P einen vorbestimmten Wert von (PE/NXM) Xn überschritten hat (Schritt 80). Wenn das Ergebnis negativ ist, dann geht der Ablauf zum Schritt 74 zurück und wiederholt sich auf gleiche Weise. Wenn andererseits P als gleich oder größer als (PE/NXM) Xn ermittelt worden ist, dann wird der laufende Zählwert des Zählers i als eine X-Adresse eines Endpunktes für den n-ten Unterbereich in X-Richtung gespeichert, und eine weitere Adresse erhält man, indem man eine vorbestimmte Bereichsüberlappungsbreite T von jener X-Adresse abzieht. Diese weitere X-Adresse wird als X-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung gespeichert (Schritt 82). Es sei angemerkt, daß der Startpunkt des ersten Unterbereiches in X-Richtung der linken Seite (X = 0) des Zeichenabbildes oder Rahmens entspricht und der Endpunkt des letzten und daher N-ten Unterbereiches in X-Richtung der rechten Seite des Zeichenabbildes oder Rahmens entspricht. Nach dem Schritt 82 wird der Zähler n erhöht (Schritt 84), und es werden als nächstes Schritte zur Bestimmung der nächsten Unterteilungsstelle ausgeführt. Dieser Vorgang wird beendet, sobald die Bedingung n = N im Schritt 72 erreicht worden ist.
Auf diese Weise erhält man die Unterteilungsstellen in X- und Y-Richtung, und das Zeichenabbild oder der Rahmen wird in mehrere Unterbereiche in Form eines M × N-Maschennetzes in den X- und Y-Richtungen unterteilt. Ein Beispiel solcher Unterteilungen eines japanischen Katakana-Zeichens "nu" ist in Fig. 18 dargestellt. Es ist anzumerken, daß in Fig. 18 nur Unterteilungen in X-Richtung für die abgeteilten Zwischenbereiche in Y-Richtung angegeben sind. Es sei auch angemerkt, daß die Bedingung T = 0 in Fig. 18 angenommen wird.
In dem oben beschriebenen Beispiel 2 werden die Unterteilungen in Y-Richtung durch das im Beispiel 1 beschriebene Schema ausgeführt. Sie kann jedoch auch derart ausgeführt werden, daß nach der Ausführung der Unterteilungen in X-Richtung Unterteilungen in X-Richtung für jede der Unterteilungen in Y-Richtung ausgeführt werden können.
Beispiel 3
Wenn die Pixels, denen die Richtungskodes zugeordnet worden sind, in einem Bereichsüberlappungsabschnitt konzentriert sind, dann wird eine vergrößerte Streuung in der Pixelanzahl innerhalb Unterbereichen in jeder der X- und Y-Richtungen erzeugt. Wenn in diesem Falle die Unterteilungsstellen unter Verwendung von PE/(NXM) als Bezug wie beim oben beschriebenen Beispiel 2 bestimmt werden, dann würde eine Situation eintreten, in denen die Unterteilungen ungeeignet sind. Dieses Beispiel 3 ist daher darauf gerichtet, einen solchen Nachteil zu vermeiden.
In Übereinstimmung mit diesem Beispiel 3 werden gleichzeitig mit der Zuordnung der Richtungskodes die Gesamtzahl PE der Pixels, denen Richtungskodes zugeordnet worden sind, gezählt und ein Histogramm HYj der mit Kodes versehenen Pixel, projiziert auf die Y-Adresse, erhalten, und anschließend wird das Zeichenabbild in M-Sektionen in Y-Richtung in einer Weise ähnlich der im obigen Beispiel 1 beschriebenen unterteilt. Während dieser Unterteilungen in Y-Richtung wird Bezug genommen auf das Histogramm HYj, und die Anzahl Pm der mit Kodes versehen Pixel in jeder der Unterteilungen wird erhalten. Während der Rasterabtastung einer jeden der Unterteilungen in Y-Richtung wird jede der Unterteilungen weiter in N Unterteilungen in X-Richtung geteilt. Fig. 19 zeigt ein Flußdiagramm, das ein Verfahren zum Teilen einer der Unterteilungen, geteilt in Y-Richtung, in N Unterteilungen in X-Richtung darstellt.
Wie man aus Fig. 19 erkennt, wird nach Initialisierung der Zähler n und i und des Registers P (Schritt 90) der Zähler i erhöht (Schritt 94), und das Zeichenabbild wird in Y-Richtung für die X-Adresse rastermäßig abgetastet, die jenem Zählwert i entspricht, wodurch die Anzahl der mit Kodes versehenen Pixel in jener Zeile gezählt wird, und ihr Zählwert Pi wird dem Register P hinzuaddiert (Schritt 98). Dann wird der Wert P des Registers P geprüft, um zu ermitteln, ob er einen vorbestimmten Wert (PmN) Xn überschritten hat, oder nicht (Schritt 100). Wenn das Ergebnis negativ ist, dann geht der Ablauf zum Schritt 94 zurück, um die genannten Schritte in gleicher Weise zu wiederholen. Wenn andererseits die Bedingung erfüllt ist, daß P gleich oder größer als (Pm/N) Xn ist, dann wird der laufende Zählwert des Zählers i als eine X-Adresse eines Endpunktes für den n-ten Unterbereich in X-Richtung gespeichert, und darüber hinaus wird eine weitere X-Adresse, die man durch Abziehen einer Bereichsüberlappungsbreite T von jener X-Adresse erhält, als eine X-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung gespeichert (Schritt 102). Es sei angemerkt, daß der Startpunkt des ersten Unterbereiches in X-Richtung der linken Seite (X = 0) des Zeichenabbildes entspricht, und daß der Endpunkt des letzten und daher N-ten Unterbereiches in X-Richtung der rechten Seite des Zeichenabbildes entspricht. Im Anschluß an den Schritt 102 wird der Zähler n erhöht (Schritt 104) und der Ablauf geht auf Schritte über, mit denen der nächste Unterteilungspunkt bestimmt wird. Dieses Verfahren wird beim Erreichen der Bedingung n = N beendet.
Unter Verwendung der so erhaltenen Unterteilungspunkte in X-Richtung werden auch die in Y-Richtung unterteilten Sektionen in N Sektionen in X-Richtung unterteilt, so daß das Zeichenabbild in ein Netz von N×M Unterbereiche unterteilt wird. Fig. 20 zeigt ein Beispiel, das man durch Unterteilung des Kode-zugeordneten Zeichenabbildes eines handgeschriebenen japanischen Katakanazeichens "nu" in ein Netz aus Unterbereichen mit T = 1 erhalten hat. Es sei angemerkt, daß die Unterteilungen in X-Richtungen nur für die mittleren unterteilten Sektionen in Y-Richtung angegeben sind.
Beispiel 4
Die gleichen Verfahrensschritte wie jene, die beim Beispiel 1 verwendet worden sind, werden hier angewandt mit der Ausnahme, daß ein Satz von Richtungskodes für schwarze Pixel für jene schwarzen Pixel verwendet wird, die die Kontur eines binären Zeichenabbildes definieren.
Beispiel 5
Die gleichen Verfahrensschritte wie jene, die im Beispiel 2 verwendet worden sind, werden hier angewendet mit der Ausnahme, daß ein Satz von Richtungskodes für schwarze Pixel für jene schwarzen Pixel angewendet wird, die die Kontur eines binären Zeichenabbildes angeben.
Beispiel 6
Dieselben Verfahrensschritte wie jene, die im Beispiel 3 verwendet wurden, werden hier angewandt mit der Ausnahme, daß ein Satz Richtungskodes für schwarze Pixel für jene schwarze Pixel Anwendung findet, die die Kontur eines binären Zeichenabbildes definieren.
Es ist anzumerken, daß jeder der oben beschriebenen Verfahrensschritte mit diesem Aspekt der vorliegenden Erfindung sehr einfach entweder durch Software oder durch Hardware oder durch eine Kombination beider ausgeführt werden können, und dies sollte für einen Fachmann auszuführen sein.
Es wird nun ein weiterer Aspekt der vorliegenden Erfindung unter spezielle Bezugnahme auf die Fig. 21 bis 30 beschrieben. Dieser Aspekt der vorliegenden Erfindung ist speziell auf ein Zeichenunterteilungsschema gerichtet, das zur Verwendung bei der Merkmalsextrahierung in einem Zeichenerkennungsverfahren und -system insbesondere nach der Erfindung geeignet ist. Wie bereits ausgeführt, ist es wichtig, daß ein Zeichenabbild in Abhängigkeit vom Zustand desselben optimal unterteilt wird, damit ein gewünschtes Merkmal ohne Fehler extrahiert wird. Fig. 30a zeigt ein Zeichenabbild aus Kodezuordnungen, das man erhalten hat, indem ein Satz Richtungskodes nach Fig. 22 der Kontur eines binären Zeichenabbildes für ein japanisches Katakana-Zeichen "wu" zugeordnet hat. Fig. 30b ist hingegen ein ähnliches Zeichenabbild aus Kodezuordnungen für dasselbe japanische Katakana-Zeichen "wu" bei geringer Änderung der Gestalt. Es sei zunächst der Fall betrachtet, in welchem beide Zeichenabbilder nach den Fig. 30a und 30b in ein 3×3-Netz unter Verwendung fester Unterteilungsstellen unterteilt werden und ein Histogramm als Funktion von Richtungskodes für jede der Unterteilungen gebildet wird, um einen Merkmalsvektor zu erzeugen.
Unter den japanischen Katakana-Zeichen gibt es die Zeichen "wu" und "nu", die in der Gestalt ähnlich sind, wobei "wu" von "nu" sich nur dadurch unterscheidet, daß ein sich vertikal erstreckender oberer mittlerer Strich vorhanden ist. Um "wu" von "nu" richtig zu unterscheiden, ist es daher wichtig, daß die Information, die sich auf diesen oben mittleren Strich bezieht, durch Zeichenunterteilungen in geeigneter Weise extrahiert und in einem Merkmalsvektor in geeigneter Weise widergespiegelt wird. Betrachtet man den oberen linken Unterbereich in jedem der Zeichenabbilder nach den Fig. 30a und 30b genauer, dann sieht man, daß die Information, die sich auf den oberen mittleren Strich bezieht, in dem Zeichenabbild in Fig. 30a verlorengegangen ist, während diese Information in dem Zeichenabbild nach Fig. 30b vorhanden ist. Wenn die Unterteilungspunkte an festen Stellen angeordnet sind, dann kann auf diese Weise die Situation eintreten; in der eine Merkmalsextraktion, die das wesentliche Merkmal eines Zeichens verläßlich widerspiegelt, nicht ausgeführt werden kann. Dieser dritte Aspekt der Erfindung ist speziell auf die Beseitigung dieses Problems gerichtet und auf die Angabe eines Verfahrens zur optimalen Bestimmung von Unterteilungspunkten eines Zeichenabbildes, die es ermöglichen, die Merkmalsextraktion stabil jederzeit auszuführen.
Die Fig. 21a und 21b zeigen zusammen ein Flußdiagramm der Schrittablauffolge eines Unterteilungsverfahrens für einen Zeichenbereich (Rahmen) gemäß einer Ausführungsform dieses Aspektes der vorliegenden Erfindung. Wie zuvor angegeben, sei festgehalten, daß dieses Zeichenunterteilungsverfahren speziell vortteilhaft ist, wenn es auf ein Zeichenerkennungsverfahren angewendet wird.
Wie die Fig. 21a und 21b zeigen, wird im Schritt 110 ein Zeichenabbild, das typischerweise durch Abtastung eines gedruckten oder handgeschriebenen Zeichens erhalten wird, verarbeitet, um ihm ein vorbestimmtes Merkmal zuzuordnen. Durch diesen Merkmalszuordnungsschritt werden mehrere Richtungskodes, wie in Fig. 22 gezeigt, selektiv den weißen Pixeln zugeordnet, die die Kontur des Zeichenabbildes begrenzen. Wie zuvor erläutert, kann ein anderer Satz Richtungskodes dazu verwendet werden, selektiv den schwarzen Pixeln zugeordnet zu werden, die die Kontur des Zeichenabbildes definieren. Ein solcher Merkmalszuordnungsschritt wird typischerweise durch Prüfung eines Pixelmusters ausgeführt, das durch ein interessierendes Pixel, zwei zur rechten und linken Seite gelegene Pixel und zwei oberhalb und unterhalb des interessierenden Pixels gelegene Pixel definiert wird, während die Rasterabtastung des Zeichenabbildes stattfindet. Simultan dazu werden die Gesamtzahl PE der Kode-zugeordneten Pixel (Merkmalspixel) und auf die X- und Y-Achsen projizierten Histogramme HXi und HYj erhalten und in Tabellen gespeichert. Ein Beispiel solcher Tabellen ist in Fig. 23 dargestellt.
In Fig. 23 ist ein Zeichenabbild 140 gezeigt, den bereits mehrere vorbestimmte Richtungskodes selektiv zugeordnet worden sind. Eine Serie von Zahlen am Kopf von Fig. 23 gibt das niedrigste Bit einer X-Adresse an, und eine Serie von Zahlen am linken Rand von Fig. 23 gibt die Y-Adresse an. Ein Histogramm HXi der Merkmalspixel des Zeichenabbildes 140 auf der X-Achse und ein vergleichbares Histogramm HYj auf der Y-Achse sind in Tabellen 142 bzw. 144 gespeichert. Das Zählen der Gesamtzahl solcher Merkmalspixel und die Bildung solcher Histogrammtabellen kann nach Abschluß des Merkmalszuordnungsschrittes ausgeführt werden. Vorzugsweise wird dies jedoch gleichzeitig mit dem Merkmalszuordnungsschritt ausgeführt, weil dadurch eine Verringerung der Anzahl der Abtastungen des Zeichenabbildes möglich wird, was die Verarbeitungszeitdauer verkürzt.
Anschließend wird das Zeichenabbild in N Sektionen in X-Richtung unterteilt (Schritt 112 bis 124) und in M Sektionen in Y-Richtung unterteilt (Schritte 126 bis 128), wodurch das Zeichenabbild in ein Netz N × M Unterbereiche unterteilt wird, von denen jeder soweit wie möglich gleichmäßig Merkmalspixel enthält. Hierdurch kann die Unterteilung eines Zeichenabbildes optimal in Abhängigkeit vom Grad der Verformung des Zeichenabbildes gegenüber der Standardform ausgeführt werden.
Dieses Zeichenunterteilungsverfahren wird nachfolgend im Detail näher erläutert. Nach Initialisierung der Zähler n und i und des Registers P (Schritt 112) wird der Zähler i erhöht (Schritt 116), und der Wert des Histogramms HXi entsprechend diesem Wert i wird aus der Tabelle ausgelesen und dem laufenden Wert des Registers P hinzuaddiert, wodurch der Wert des Registers P rückgesetzt wird (Schritt 118). Anschließend wird geprüft, ob der Wert des Registers P einen vorbestimmten Wert von (PE/N) Xm überschritten hat, oder nicht (Schritt 120). Wenn das Ergebnis negativ ist, dann geht der Ablauf zurück zum Schritt 114, um die genannten Schritte zu wiederholen. Tatsächlich wird bei dieser Routine während der Erhöhung der X-Adresse um 1 das Zeichenabbild rastermäßig abgetastet, um die Anzahl von P von Merkmalspixeln zu zählen, und dieses Zählergebnis wird mit (PE/N) Xn verglichen. Die Wiederholung einer solchen rastermäßigen Abtastung und darüber hinaus der rastermäßigen Abtastung zur Zählung der Gesamtzahl PE ist jedoch nicht effizient. Unter diesen Umständen werden während des Merkmalszuordnungsschrittes, der die rastermäßige Abtastung notwendig macht, Histogramme HXi und HXj und die Gesamtzahl PE gleichzeitig erhalten, und diese Daten in geeigneter Weise in der Routine verwendet, um dadurch die Notwendigkeit einer wiederholten Rasterabtastung zu vermeiden und dadurch die Effizienz des Verfahrens zu steigern.
Wenn die Bedingung, daß P gleich oder größer als (PE/N) Xn erhalten worden ist, dann wird der laufende Zählwert des Zählers e als eine X-Adresse eines Endpunktes des n-ten Unterbereiches in X-Richtung gespeichert, und eine weitere X-Adresse, die man durch Abziehen einer Bereichsüberlappungsbreite T von jener X-Adresse erhält, wird als eine X-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung gespeichert (Schritt 122). Es sei festgehalten, daß der Startpunkt des ersten Unterbereiches in X-Richtung der linken Seite X=0) des Zeichenabbildes entspricht, und daß der Endpunkt des letzten und daher N-ten Unterbereiches in X-Richtung der rechten Seite des Zeichenabbildes entspricht.
Anschließend an den Schritt 122 wird der Zähler n erhöht (Schritt 124), und die Verarbeitung zur Ermittlung des nächsten Unterteilungspunktes wird ausgeführt. Diese Verarbeitung wird beendet, sobald die Bedingung n = N im Schritt 112 erreicht worden ist. Die Verfahrensschritte 126 bis 138 für die Unterteilungen in Y-Richtung sind ähnlich den Schritten 112 bis 124, die oben beschrieben wurden. An Stelle eines Zählers i, der der X-Adresse zugeordnet ist, wird jedoch von einem Zähler j Gebrauch gemacht, der der Y-Adresse zugeordnet ist (Schritte 126, 130, 136). Außerdem wird an Stelle eines Histogramms HXi auf ein Histogramm HYj Bezug genommen (Schritt 132), und die Anzahl von Unterteilungen im Schritt 134 wird auf M eingestellt. Wenn das Ergebnis der Ermittlung beim Schritt 134 positiv ist, dann geht der Verfahrensablauf zum Schritt 136 über, wo der laufende Zählwert j des Zählers j als Y-Adresse eines Endpunktes des n-ten Unterbereiches in Y-Richtung eingestellt wird, und ein Wert, der durch Subtraktion einer Bereichsüberlappungsbreite T von jener Y-Adresse erhalten wird, wird als Y-Adresse eines Startpunktes des (n+1)-ten Unterbereiches in Y-Richtung bestimmt. Es sei angemerkt, daß der Startpunkt des ersten Unterbereiches in Y-Richtung mit der Oberseite des Zeichenabbildes übereinstimmt und der Endpunkt des M-ten Unterbereiches in Y-Richtung der Unterseite des Zeichenbildes entspricht. Da die Unterteilungspunkte in X- und Y-Richtung auf diese Weise bestimmt worden sind, wird das Zeichenabbild dann in ein Netz von N × M Unterbereiche in X- und Y-Richtung auf der Grundlage dieser Unterteilungspunkte unterteilt.
In Übereinstimmung mit der vorliegenden Ausführungsform werden die Zeichenabbilder, die in Fig. 30a und 30b dargestellt sind, so unterteilt, wie in den Fig. 24a bzw. 24b dargestellt ist. Es ist angemerkt, daß die Bedingungen M 3 und T = 0 angenommen worden sind. Eine schnelle Prüfung des oberen linken Unterbereiches in Fig. 24a zeigt die Anwesenheit einer Information über den oberen mittleren Strich des Zeichens "wu" an, was jedoch nicht der Fall ist, wenn die Verarbeitung unter Verwendung des bekannten Schemas mit festen Unterteilungspunkten erfolgt. Das gleiche gilt für den Fall, der in Fig. 24b dargestellt ist.
Unter Bezugnahme auf die Fig. 25a und 25b wird nun eine weitere Ausführungsform mit Merkmalen nach der vorliegenden Erfindung beschrieben. Schritt 150 dieser Ausführungsform entspricht dem Schritt 110 der vorangehend beschriebenen Ausführungsform. Im Schritt 150 erhält man jedoch, soweit Histogramme betroffen sind, nur HYj und nicht HXi. Der Verfahrensablauf geht dann zum Schritt 152 über, wo das Zeichenabbild in M Sektionen in Y-Richtung unterteilt wird, und dieser Schritt entspricht einer Folge von Schritten 126 bis 138 der vorangehend erläuterten Ausführungsform. Die Schritte 154 bis 168 werden zur Unterteilung des Zeichenabbildes in N Sektionen in X-Richtung ausgeführt. Jeder dieser Schritte wird nachfolgend im Detail erläutert.
Nach Initialisierung der Zähler n und i des Registers P (Schritt 154) wird der Zähler i erhöht (Schritt 156), und das Zeichenabbild wird in Y-Richtung für die X-Adresse entsprechend dem Zählwert i rastermäßig abgetastet, wodurch die Anzahl der Pixel in jeder Zeile gezählt wird (Schritt 160), denen Kodes zugeordnet sind, und dieser Wert Pi wird im Register P gespeichert (Schritt 162). Sodann wird geprüft, ob der Wert P des Registers P einen vorbestimmten Wert von (PE/(NXM) Xn) überschritten hat (Schritt 164). Wenn das Ergebnis negativ ist, dann geht der Verfahrensablauf zurück zum Schritt 158, um die genannten Schritte zu wiederholen. Wenn andererseits die Bedingung, daß P gleich oder größer als (PE/(NMX) Xn) erhalten worden ist, dann wird der laufende Zählwert i als eine X-Adresse eines Endpunktes des n-ten Unterbereiches in X-Richtung gespeichert, und eine weitere X-Adresse, die man durch Abziehen eines Bereichsüberlappungsbetrages T von jener X-Adresse erhalten hat, wird als eine X-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung gespeichert (Schritt 166). Es sei ebenfalls angemerkt, daß der Startpunkt des ersten Unterbereiches in X-Richtung der linken Seite (X = 0) des Zeichenabbildes entspricht und der Endpunkt des letzten und daher M-ten Unterbereiches in X-Richtung der rechten Seite des Zeichenabbildes entspricht.
Im Anschluß an den Schritt 166 wird der Zählwert des Zählers n erhöht (Schritt 168), und das Verfahren geht auf Schritte über, mit denen der nächste Unterteilungspunkt bestimmt wird. Dieses Verfahren wird beendet, wenn die Bedingung n = N beim Schritt 156 erreicht worden ist. Auf diese Weise werden Unterteilungspunkte in X- und Y-Richtung bestimmt, so daß das Zeichenabbild in ein Netz aus N × m Unterbereiche in X- und Y-Richtung unterteilt ist.
Wie zuvor ausgeführt worden ist, sind die japanischen Katakana-Zeichen "nu" und "su" in der Gestalt einander ähnlich, wobei sich "nu" durch einen zusätzlichen Strich auszeichnet, der von links oben nach rechts unten in der Mitte verläuft. Um diese zwei Zeichen voneinander zu unterscheiden, spielt dieser zusätzliche Strich eine Schlüsselrolle. Wenn das Zeichen "nu" durch das Verfahren nach den Fig. 21a und 21b unterteilt wird, dann ergibt sich das in Fig. 26a dargestellte Unterteilungsergebnis. Eine Prüfung des linken Zwischenunterbereiches (1, 2) im Zeichenabbild von Fig. 26a zeigt die Tatsache, daß die Information bezüglich der geneigten Lage des zusätzlichen Striches in diesem Unterbereich nicht vorhanden ist. Andererseits zeigt Fig. 26b das Ergebnis, wenn dasselbe Zeichen "nu" einer Unterteilung nach dem vorliegenden Verfahren unterzogen worden ist, das in den Fig. 25a und 25b dargestellt ist. Es ist anzumerken, daß in Fig. 26b nur die Unterteilungen in X-Richtung für den mittleren Unterbereich in Y-Richtung dargestellt sind und die Bedingung T = 0 angenommen worden ist. Ein schneller Blick auf den linken Zwischen-Unterbereich (1, 2) genügt, um zu verstehen, daß der Unberbereich (1, 2) Informationen enthält, die in ausreichender Weise die Anwesenheit des geneigten zusätzlichen Striches angeben. Auf diese Weise kann die vorliegende Erfindung die Nachteile in der unter Bezugnahme auf die Fig. 21a und 21b beschriebenen Ausführungsform überwinden.
In der obigen Beschreibung sind Unterteilungen in Y-Richtung nach dem Verfahren entsprechend der vorangehenden Ausführungsform ausgeführt worden. Es sei jedoch angemerkt, daß nach den Unterteilungen in X-Richtung die Unterteilungen in Y-Richtung mit einem Verfahren ausgeführt werden können, das ähnlich dem in den Fig. 25a und 25b dargestellten Verfahren ist, um jede der Unterteilungen in X-Richtung auszuführen.
In der soeben beschriebenen Ausführungsform nach den Fig. 25a und 25b ergibt sich eine größere Streuung in der Anzahl von Pixeln zwischen den unterteilten Unterbereichen in den X- und Y-Richtungen im Falle, daß Merkmalspixel (d. h. Pixel, denen Kodes zugeordnet sind) in einem Bereichsüberlappungsabschnitt konzentriert sind, wenn Unterteilungspunkte unter Verwendung von PE/(NXM) als Bezug bestimmt werden. Die Fig. 27a und 27b zeigen eine weitere Ausführungsform mit Merkmalen nach der vorliegenden Erfindung, die in der Lage ist, dieses Problem zu überwinden. In dem Flußdiagramm nach den Fig. 27a und 27b entspricht der Schritt 170 dem Schritt 110 in den Fig. 21a und 21b. Der Verfahrensablauf geht dann zum Schritt 172 über, in welchem ein Zeichenabbild in Y-Richtung unterteilt wird. Dies entspricht einer Folge von Schritten 126 bis 138 in der in den Fig. 21a und 21b gezeigten Ausführungsform. Im Schritt 172 wird jedoch gleichzeitig mit den Unterteilungen in Y-Richtung auf das Histogramm HYj Bezug genommen und die Anzahl Pm der Merkmalspixel in jedem der Unterbereiche in Y-Richtung wird ermittelt. Der Verfahrensablauf geht dann zu einer Folge von Schritten 174 bis 188 über, die der Bestimmung von Unterteilungen in X-Richtung dienen. Diese Schritte 174 bis 188 werden nachfolgend im Detail erläutert.
Nach Initialisierung der Zähler n und i und des Registers P (Schritt 174) wird der Zählwert des Zählers i erhöht (Schrit 178) und dann wird für die X-Adresse entsprechend diesem Zählwert des Zählers i das Zeichenabbild rastermäßig in Y-Richtung abgetastet, wodurch die Anzahl von Pixeln in dieser Zeile gezählt wird (Schritt 180), denen Kodes zugeordnet sind, und dieser Wert Pi wird dem laufenden Zählwert des Registers P hinzuaddiert (Schritt 182). Sodann wird geprüft, ob der Wert P des Registers P einen vorbestimmten Wert von (Pm/N) Xn im Schritt 184 überschritten hat, oder nicht. Wenn das Ergebnis negativ ist, dann geht der Verfahrensablauf zurück zum Schritt 178, um die gleichen Schritte zu wiederholen. Ist andererseits die Bedingung, daß P gleich oder größer als (Pm/N) Xn ist, erreicht worden, dann wird der laufende Zählwert des Zählers i als eine X-Adresse eines Endpunktes des n-ten Unterbereiches in X-Richtung gespeichert, und eine weitere X-Adresse, die durch Abziehen einer Bereichsüberlappungsgröße T von jener X-Adresse ermittelt worden ist, wird als eine X-Adresse eines Startpunktes des (n +1)-ten Unterbereiches in X-Richtung gespeichert (Schritt 186). Wie zuvor, sei auch hier angemerkt, daß der Startpunkt des ersten Unterbereiches in X-Richtung der linken Seite (X = 0) des Zeichenabbildes entspricht, während der Endpunkt des letzten und daher N-ten Unterbereiches in X-Richtung der rechten Seite des Zeichenabbildes entspricht.
Nach dem Schritt 186 geht der Verfahrensablauf zum Schritt 188 über, wo der Zählwert des Zählers n erhöht wird, so daß zu einer weiteren Folge von Schritten zur Bestimmung des nächsten Unter­ teilungspunktes übergegangen wird. Dieser Verfahrensablauf wird beendet, sobald die Bedingung n = N im Schritt 176 erreicht worden ist. Auf diese Weise werden Unterteilungsstellen in X-Richtung für jede der in Y-Richtung unterteilten Sektionen bestimmt, so daß das Zeichenabbild als Ganzes in ein Netz von N × M Unterbereiche unterteilt wird.
Fig. 28a zeigt das Ergebnis, wenn das Zeichen "nu" in Übereinstimmung mit dem unter Bezugnahme auf die Fig. 25a und 25b beschriebenen Verfahren und unter der Annahme T = 1 unterteilt wird. Andererseits zeigt Fig. 28b das Ergebnis, wenn dasselbe Zeichen "nu" in Übereinstimmung mit der vorliegenden Erfindung unterteilt wird, wie sie soeben unter Bezugnahme auf die Fig. 27a bund 27b beschrieben worden ist, wieder mit der Annahme, daß T = 1. In beiden Fällen werden Unterteilungen zunächst in Y-Richtung ausgeführt, und sodann werden Unterteilungen in X-Richtung ausgeführt. Es sei auch angemerkt, daß Unterteilungen in X-Richtung nur in den mittleren Sektionen solcher in Y-Richtung unterteilten dargestellt sind. Ein Vergleich zwischen den zwei Ergebnissen, die in den Fig. 28a und 28b dargestellt sind, läßt schließen, daß der linke untere Zwischenunterbereich (1, 2) des Zeichenabbildes in Fig. 28b Informationen enthält, die die geneigte Gestalt des zusätzlichen Striches in der Mitte des Zeichens besser widerspiegelt. Auf diese Weise ergibt sich selbst bei einer Anhäufung von Merkmalspixeln an einer Unterteilungsstelle die Möglichkeit, Unterteilungen in geeigneter Weise und optimal in Übereinstimmung mit der vorliegenden Erfindung jederzeit auszuführen.
Fig. 29 zeigt in Blockform ein System, das zur Ausführung eines jeden der oben beschriebenen Zeichenunterteilungsverfahren geeignet ist. Wie dargestellt, enthält das System einen Abbildspeicher 190 zur Speicherung eines zu verarbeitenden Zeichenabbildes mit Merkmalszuordnungen. In dem System ist weiterhin eine zentrale Prozessoreinheit (CPU) 192 und ein Hauptspeicher 194 angegeben, der ein Programm für jedes der obigen Verfahren und Tabellen für die beschriebenen Histogramme speichert, sowie die oben beschriebenen Zähler enthält. Die CPU 192 hat Zugang zum Bildspeicher 190, einer Abtastschaltung 191 und auch zum Hauptspeicher 194 über einen Bus 195, und umgekehrt. Im Betrieb führt die CPU 192, während sie Zugang zum Bildspeicher 190 hat, den Merkmalszuordnungsbetrieb sowie das Zählen der Gesamtzahl der Merkmalspixel und die Erzeugung von Histogrammen sämtlich zur gleichen Zeit aus. Das verarbeitete Zeichenabbild, dem Merkmale zugeordnet worden sind, wird in dem Bildspeicher 190 gespeichert, hingegen werden die Daten über die Gesamtzahl von Merkmalspixeln und die Histogramme im Hauptspeicher 194 gespeichert. Während der nachfolgenden Verarbeitung zur Bestimmung der Unterteilungsstellen führt die CPU 192 dann eine vorbestimmte Routine aus, bei der sie auf die Gesamtzahl der Merkmalspixel und auf die Histogrammtabellen Bezug nimmt, die in dem Hauptspeicher 194 gespeichert sind, sowie, soweit notwendig, auf das Zeichenabbild mit den Merkmalszuordnungen, das im Bildspeicher 190 gespeichert ist, und sodann wird das Ergebnis der so bestimmten Unterteilungsstellen in einem speziellen Speicherbereich des Hauptspeichers 194 gespeichert. Das System nach Fig. 29 ist daher als Teil eines Zeichenerkennungssystems in hohem Maße vorteilhaft.
Die obige Beschreibung ist anhand von verschiedenen Ausführungsformen der Erfindung gegeben worden, von denen ggf. abgewichen werden kann, ohne den Grundgedanken der Erfindung zu verlassen. Beispielsweise ist von Richtungskodes als einem Zeichenabbild zuzuordnenden Merkmalen Gebrauch gemacht worden. Es können jedoch auch andere spezifische Arten von Merkmalen verwendet werden.

Claims (11)

1. Zeichenerkennungsverfahren, wonach ein zu erkennendes Zeichen optisch abgetastet wird und in ein binäres Zeichen­ abbild umgewandelt wird, den die Kontur des Zeichens festlegen­ den Bildpunkten Richtungskodes zugeordnet werden, ein das Zeichen enthaltender Flächenbereich in kleinere Unterbereiche aufgeteilt wird und aus den in den einzelnen Unterbereichen vorhandenen Richtungskodes Histogramme gebildet werden, die mit vorher abgespeicherten Histogrammen verglichen werden, dadurch gekennzeichnet, daß
  • a) nach der Zuordnung von Richtungskodes die Gesamtzahl der Richtungskodes gezählt wird,
  • b) daran anschließend ein erstes Histogramm durch Projektion der zugeordneten Richtungskodes auf eine erste vorbestimmte Achse gebildet wird und ein zweites Histogramm durch Projektion der zugeordneten Richtungskodes auf eine zweite vorbestimmte Achse gebildet wird und
  • c) auf der Grundlage des Zählergebnisses und unter Verwendung der zwei Histogramme Unterteilungsstellen innerhalb des Flächenbereiches zur Festlegung der Lage und der Größe der kleinen Unterbereiche derart bestimmt werden, daß jeder der genannten kleinen Unterbereiche im wesentlichen die gleiche Zahl an Richtungskodes aufweist.
2. Verfahren nach Anspruch 1, dadurch gekenn­ zeichnet, daß vor der Zuordnung der Richtungs­ kodes das Zeichenabbild in X- und/oder Y-Richtung verbrei­ tert wird.
3. Verfahren nach Anspruch 1 oder 2, dadurch ge­ kennzeichnet, daß die Positionen der Unter­ teilungen in Y-Richtung aus Y-Adressen (Y=i) bestehen, die dem kumulativen Wert des Histogramms (HYi) entsprechen, welches einem ganzzahligen Vielfachen der Anzahl von Unter­ teilungs-Bezugsbildpunkten (PE/N) entspricht, das heißt (PE/N)X 1, (PE/N)X 2, . . ., (PE/N)×(N-1), wobei PE die Gesamtzahl der Merkmalsbildpunkte ist und N die Zahl der Unterteilungen ist.
4. Verfahren nach Anspruch 1 oder 2, dadurch ge­ kennzeichnet, daß die Aufteilung in eine Vielzahl von Unterbereichen derart durchgeführt wird, daß, während der Zuordnung der Richtungskodes, die kumulative Zahl der Merkmalsbildpunkte, denen die Richtungskodes zu­ geordnet wurden, in Histogramm (HYi) in Y-Richtung und ein Histogramm (HXi) in X-Richtung bestimmt werden und die Zahl der Unterteilungs-Bezugsbildpunkte, die bestimmt ist durch die Gesamtzahl der Richtungskodes, und eine vor­ bestimmte Anzahl von Unterteilungen mit dem genannten Histo­ gramm (HYi) und dem Histogramm (HXi) verglichen wird, um dadurch die Positionen der Unterteilungen des binären Zeichen­ abbildes in Y- und X-Richtung zu bestimmen.
5. Verfahren nach Anspruch 4, dadurch gekenn­ zeichnet, daß die Gesamtzahl der Merkmalsbild­ punkte bezeichnet wird (durch PE), ferner die Anzahl der Unterteilungen in der Y-Richtung bezeichnet wird (durch N) und die Anzahl der Unterteilungen in der X-Richtung be­ zeichnet wird (M), wobei die Position der Unterteilung in der Y-Richtung aus einer Y-Adresse (Y=i) besteht, die dem kumulativen Wert des Histogramms (HYi) entsprechend einem ganzzahligen Vielfachen der Anzahl von Unterteilungs- Bezugsbildpunkten PE/N) entspricht, das heißt (PE/N)X 1, (PE/N)X 2, . . ., (PE/N)×(N-1), wobei die Position der Unterteilung in der X-Richtung aus einer X-Adresse (X=i) besteht, die einem ganzzahligen Vielfachen der Zahl der Unterteilungs-Bezugsbildpunkte entspricht (PE/M), das heißt (PE/M)X 1, (PE/M)X 2, . . ., (PE/M)×(M-1).
6. Verfahren nach Anspruch 1 oder 2, dadurch ge­ kennzeichnet, daß die Unterteilung in eine Vielzahl von Unterbereichen derart durchgeführt wird, daß während der Zuordnung der Richtungskodes die kumulative Zahl der Merkmalsbildpunkte, denen die Richtungskodes zu­ geordnet wurden, vorgesehen wird und ein Histogramm (HYi) in der Y-Richtung erzeugt wird, ferner die Anzahl der Unterteilungs-Bezugsbildpunkte in der Y-Richtung, die durch die Gesamtzahl der Merkmalsbildpunkte bzw. Richtungskodes bestimmt ist, und eine vorbestimmte Anzahl von Untertei­ lungen in der Y-Richtung mit den Werten des Histogramms (HYi) verglichen wird, daß dann eine Aufteilung in der Y-Richtung auf der Grundlage der so erhaltenen Positionen der Unterteilung in der Y-Richtung in dem binären Zeichen­ abbild durchgeführt wird, dann die Merkmalsbildpunkte ge­ zählt werden, während jede der Unterbereiche entsprechend der Unterteilung in der Y-Richtung in der Y-Richtung ab­ getastet wird, der so gezählte Wert mit der Gesamtzahl der Merkmalsbildpunkte verglichen wird und mit der Anzahl der Unterteilungs-Bezugsbildpunkte in der X-Richtung, die bestimmt ist durch die Gesamtzahl der Merkmals-Bildpunkte, und einer vorbestimmten Anzahl von Unterteilungen in der X-Richtung verglichen wird, und dann eine Aufteilung in der X-Richtung auf der Grundlage der so bestimmten Posi­ tion der Unterteilungen in der X-Richtung in dem der Unterbereiche, die in der Y-Richtung aufgeteilt sind, durch­ geführt wird.
7. Verfahren nach Anspruch 1 oder 2, dadurch ge­ kennzeichnet, daß die Zahl der Unterteilungs- Bezugsbildpunkte in der Y-Richtung gleich ist (PE/N) und daß die Zahl der Unterteilungs-Bezugsbildpunkte in der X-Richtung gleich ist (PE/(NXM)).
8. Verfahren nach Anspruch 1 oder 2, dadurch ge­ kennzeichnet, daß die Unterteilung in eine Vielzahl von Unterbereichen dadurch ausgeführt wird, daß während der Zuordnung der Richtungskodes die kumulative Anzahl von Merkmals-Bildpunkten gebildet wird, denen Rich­ tungskodes zugeordnet werden und daß ein Histogramm (HYi) in der X-Richtung gebildet wird, die Anzahl der Untertei­ lungs-Bezugsbildpunkte in der Y-Richtung, die bestimmt ist durch die Gesamtzahl der Merkmalsbildpunkte, und eine vor­ bestimmte Anzahl von Unterteilungen in der Y-Richtung mit den Werten des Histogramms (HYi) verglichen wird, daß dann eine Unterteilung in der Y-Richtung auf der Grundlage der so bestimmten Position der Unterteilungspunkte in der Y-Richtung des binären Zeichenabbilds vorgenommen wird, die Merkmalsbildpunkte während einer Abtastung in der Y-Richtung jedes der Unterbereiche, die in der Y-Richtung unterteilt sind, gezählt werden, der so erhaltene Zählwert mit der Anzahl der Unterteilungs-Bezugsbildpunkte in der X-Richtung, die bestimmt ist durch die Gesamtzahl der Merkmalspunkte in jedem der Unterbereiche in der Y-Rich­ tung, und einer vorbestimmten Anzahl von Unterabteilungen in der X-Richtung verglichen wird und dann eine Untertei­ lung in der X-Richtung auf der Grundlage der so ermittel­ ten Position der Unterteilung in der X-Richtung vorgenom­ men wird.
9. Verfahren nach Anspruch 8, dadurch gekenn­ zeichnet, daß die Anzahl der Unterteilungs- Bezugsbildpunkte in der Y-Richtung gleich ist (PE/N) und daß die Anzahl der Unterteilungs-Bezugsbildpunkte in der X-Richtung entweder einen der Werte von (PE′1/M), (PE′2/M), . . ., (PE′N/M) für jeden der Unterbereiche ent­ sprechend der Aufteilung in der Y-Richtung ist, deren Gesamt­ zahl von Merkmalsbildpunkten jeweils ist PE′1, PE′2, . . ., PE′N.
10. Verfahren nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, daß die Unterteilung in eine Vielzahl von Unterbereichen derart durchgeführt wird, daß zwei benachbarte Unterbereiche einen sich überlappen­ den Abschnitt aufweisen.
11. Verfahren nach einem der Ansprüche 1 bis 10, dadurch gekennzeichnet, daß das binäre Zeichenabbild dadurch erzeugt wird, indem zuerst schwarze Bildpunkte in einem provisorischen binären Zeichenabbild aufgefun­ den werden, welches durch photoelektrische Umwandlung der optischen Abtastsignale des zu erkennenden Zeichens erhal­ ten wird und in dem dann wenigstens einige der Weißbild­ punkte, die den schwarzen Bildpunkten benachbart sind, in schwarze Bildpunkte umgewandelt werden, um dadurch die Zeichenzeile des provisorischen binären Zeichenabbilds zu verbreitern.
DE19873716787 1986-05-19 1987-05-19 Zeichenerkennungsverfahren Granted DE3716787A1 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP61114042A JPS62269286A (ja) 1986-05-19 1986-05-19 文字認識方式
JP61249159A JPS63103392A (ja) 1986-10-20 1986-10-20 文字認識方式
JP61251537A JPH0795335B2 (ja) 1986-10-22 1986-10-22 領域分割方法

Publications (2)

Publication Number Publication Date
DE3716787A1 DE3716787A1 (de) 1987-11-26
DE3716787C2 true DE3716787C2 (de) 1990-09-06

Family

ID=27312638

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19873716787 Granted DE3716787A1 (de) 1986-05-19 1987-05-19 Zeichenerkennungsverfahren

Country Status (3)

Country Link
US (1) US4903312A (de)
DE (1) DE3716787A1 (de)
GB (1) GB2190778B (de)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5504822A (en) * 1986-09-19 1996-04-02 Holt; Arthur W. Character recognition system
US4905295A (en) * 1986-11-13 1990-02-27 Ricoh Company, Ltd. Code sequence matching method and apparatus
DE3815869A1 (de) * 1987-05-08 1988-11-17 Ricoh Kk Verfahren zum extrahieren von merkmalsmengen eines zeichens
US4959870A (en) * 1987-05-26 1990-09-25 Ricoh Company, Ltd. Character recognition apparatus having means for compressing feature data
JPH07120385B2 (ja) * 1987-07-24 1995-12-20 シャープ株式会社 光学的読取り方法
US5046115A (en) * 1987-10-26 1991-09-03 Kabushiki Kaishakomatsu Seisakusho Method of processing image data on crack
US5031225A (en) * 1987-12-09 1991-07-09 Ricoh Company, Ltd. Character recognition method for recognizing character in an arbitrary rotation position
US5247587A (en) * 1988-07-15 1993-09-21 Honda Giken Kogyo Kabushiki Kaisha Peak data extracting device and a rotary motion recurrence formula computing device
JPH0229886A (ja) * 1988-07-20 1990-01-31 Ricoh Co Ltd 特徴量抽出方法
US5195147A (en) * 1989-05-02 1993-03-16 Ricoh Company, Ltd. Image forming apparatus
US5054094A (en) * 1990-05-07 1991-10-01 Eastman Kodak Company Rotationally impervious feature extraction for optical character recognition
JP2542947B2 (ja) * 1990-05-09 1996-10-09 大日本スクリーン製造株式会社 画像処理装置
US5020121A (en) * 1990-08-16 1991-05-28 Hewlett-Packard Company Neighborhood block prediction bit compression
US5121440A (en) * 1990-08-30 1992-06-09 Monolithic Resources Corporation Analog video character recognition system
US5428692A (en) * 1991-11-18 1995-06-27 Kuehl; Eberhard Character recognition system
US5307424A (en) * 1990-12-12 1994-04-26 Eberhard Kuehl Character recognition system
CA2077970C (en) * 1991-11-19 1999-02-23 Daniel P. Huttenlocher Optical word recognition by examination of word shape
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
CA2077969C (en) * 1991-11-19 1997-03-04 Daniel P. Huttenlocher Method of deriving wordshapes for subsequent comparison
US5515455A (en) * 1992-09-02 1996-05-07 The Research Foundation Of State University Of New York At Buffalo System for recognizing handwritten words of cursive script
JP3106021B2 (ja) * 1992-11-30 2000-11-06 キヤノン株式会社 パターンデータの圧縮方法及び装置と出力方法及び装置
JPH06203165A (ja) * 1993-01-07 1994-07-22 Canon Inc 画像情報処理方法及び装置
US5491758A (en) * 1993-01-27 1996-02-13 International Business Machines Corporation Automatic handwriting recognition using both static and dynamic parameters
JPH06348800A (ja) * 1993-06-02 1994-12-22 Canon Inc 画像処理方法及び装置
US5444793A (en) * 1993-06-15 1995-08-22 Ncr Corporation Method for detecting machine printed monetary amounts in binary images
JPH07129720A (ja) * 1993-11-04 1995-05-19 Matsushita Electric Ind Co Ltd 文字認識装置
JP3027321B2 (ja) * 1994-09-27 2000-04-04 財団法人工業技術研究院 拘束のない手書き英数字のオンライン認識の方法及び装置
JPH08194780A (ja) * 1994-11-18 1996-07-30 Ricoh Co Ltd 特徴抽出方法
US5802207A (en) * 1995-06-30 1998-09-01 Industrial Technology Research Institute System and process for constructing optimized prototypes for pattern recognition using competitive classification learning
JP4305971B2 (ja) * 1998-06-30 2009-07-29 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US7221810B2 (en) * 2000-11-13 2007-05-22 Anoto Group Ab Method and device for recording of information
JP4161659B2 (ja) * 2002-02-27 2008-10-08 日本電気株式会社 画像認識システム及びその認識方法並びにプログラム
CA2375355A1 (en) * 2002-03-11 2003-09-11 Neo Systems Inc. Character recognition system and method
JP4047090B2 (ja) * 2002-07-31 2008-02-13 キヤノン株式会社 画像処理方法及び画像処理装置
US7190834B2 (en) * 2003-07-22 2007-03-13 Cognex Technology And Investment Corporation Methods for finding and characterizing a deformed pattern in an image
US7388990B2 (en) * 2003-09-22 2008-06-17 Matrox Electronics Systems, Ltd. Local mass distribution partitioning for object recognition
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US8620083B2 (en) * 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US7525034B2 (en) * 2004-12-17 2009-04-28 Nease Joseph L Method and apparatus for image interpretation into sound
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US8749839B2 (en) 2005-03-24 2014-06-10 Kofax, Inc. Systems and methods of processing scanned data
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
JP2009070226A (ja) * 2007-09-14 2009-04-02 Ricoh Co Ltd マッチング装置
TWI374658B (en) * 2007-09-29 2012-10-11 Htc Corp Image process method
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9349046B2 (en) 2009-02-10 2016-05-24 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9165188B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
JP2016517587A (ja) 2013-03-13 2016-06-16 コファックス, インコーポレイテッド モバイル装置を用いて取込まれたデジタル画像におけるオブジェクトの分類
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
DE202014011407U1 (de) 2013-05-03 2020-04-20 Kofax, Inc. Systeme zum Erkennen und Klassifizieren von Objekten in durch Mobilgeräte aufgenommenen Videos
JP2016538783A (ja) 2013-11-15 2016-12-08 コファックス, インコーポレイテッド モバイル映像データを用いて長尺文書の合成画像を生成するためのシステムおよび方法
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US10163004B2 (en) 2017-03-30 2018-12-25 Konica Minolta Laboratory U.S.A., Inc. Inferring stroke information from an image
US10579893B2 (en) 2017-02-28 2020-03-03 Konica Minolta Laboratory U.S.A., Inc. Inferring stroke information from an image
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3755780A (en) * 1971-06-28 1973-08-28 Pattern Analysis & Recognition Method for recognizing characters
US3803553A (en) * 1972-06-14 1974-04-09 Hitachi Ltd Character recognition apparatus
US4087788A (en) * 1977-01-14 1978-05-02 Ncr Canada Ltd - Ncr Canada Ltee Data compression system
JPS5418632A (en) * 1977-07-12 1979-02-10 Nippon Telegr & Teleph Corp <Ntt> Character identification system
US4162482A (en) * 1977-12-07 1979-07-24 Burroughs Corporation Pre-processing and feature extraction system for character recognition
US4229768A (en) * 1978-03-30 1980-10-21 Canon Kabushiki Kaisha Information processing apparatus
JPS596421B2 (ja) * 1978-08-28 1984-02-10 肇産業株式会社 パタ−ン情報処理方法
JPS5579590A (en) * 1978-12-13 1980-06-16 Hitachi Ltd Video data processor
US4300122A (en) * 1979-04-02 1981-11-10 Sperry Corporation Apparatus for processing digital data representative of a two-dimensional image
US4688088A (en) * 1984-04-20 1987-08-18 Canon Kabushiki Kaisha Position detecting device and method

Also Published As

Publication number Publication date
DE3716787A1 (de) 1987-11-26
GB2190778B (en) 1990-04-25
GB8711738D0 (en) 1987-06-24
GB2190778A (en) 1987-11-25
US4903312A (en) 1990-02-20

Similar Documents

Publication Publication Date Title
DE3716787C2 (de)
DE3633743C2 (de)
DE3485953T2 (de) Verfahren und anlage zur on-line-erkennung handgeschriebener muster.
DE3689416T2 (de) Mustermerkmalextraktion.
DE68915950T2 (de) Verfahren zum Trennen von Zeichen.
DE69721941T2 (de) Gerät und Verfahren zum Extrahieren von Mustern
DE2909153C2 (de) Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern
DE3806223C2 (de) Verfahren zur Erzeugung von Zeichenmustern
DE3926327C2 (de) Verfahren und System zum Erkennen von Zeichen auf einem Medium
DE19960555B4 (de) Verfahren zum Auffinden und Lesen eines zweidimensionalen Strichcodes
DE4311172C2 (de) Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes
DE4005492C2 (de) Bildcodierverfahren
DE3425449A1 (de) Verfahren und vorrichtung zur alphanumerischen handschriftenerkennung
DE19814075A1 (de) Verfahren zum Abtasten und Erkennen mehrerer Fotografien und zum Beseitigen von Randfehlern
DE60204005T2 (de) Verfahren und einrichtung zur erkennung eines handschriftlichen musters
DE3326725A1 (de) Verfahren zur datenkomprimierung fuer zweidimensionale zeichenbilder
DE4427992C2 (de) Verfahren zum Erzeugen einer Dokumenten-Darstellung aus einem Bitmap-Bild eines Dokuments
DE3322443C2 (de)
EP0402868B1 (de) Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen
DE3342947A1 (de) Verfahren zur behandlung der daten eines binaeren grafischen musters und system dafuer
DE3815869C2 (de)
DE2829808A1 (de) Verfahren und vorrichtung zum lesen von zeichen
DE102008013789A1 (de) Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen
DE19531392C1 (de) Verfahren zur Erzeugung einer Graphrepräsentation von Bildvorlagen
DE112021000371T5 (de) Digitale bildbearbeitung

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee