-
TECHNISCHES
GEBIET
-
Die
vorliegende Erfindung betrifft ein Verfahren zur Zeichenerkennung
für ein
effektives Erkennen von Zeichen wie z. B. Buchstaben, numerischen Zeichen
und Symbolen, mit einer Genauigkeit, selbst bei einem unklaren Bild
oder einem Bild, das Störungen
enthält,
und eine Vorrichtung für
ein solches Verfahren.
-
STAND DER
TECHNIK
-
In
der Vergangenheit wurde die Erkennung von Zeichen in einem Objektbild
durch Vergleich des Objektbildes mit einem Bezugsbild, das in einem Speicher
gespeichert war, durchgeführt.
Zum Beispiel gibt es, wie in der Japanischen Patentanmeldung [kokai]
Nr. 8-212290 offenbart, ein Verfahren zum Erkennen von Buchstaben,
die in einem Originalbild enthalten sind, welches die Schritte des
Binarisierens der zu erkennenden Buchstaben, das Durchführen einer
Normalisierungsbehandlung beim erhaltenen Binärbild und das Eingeben der
normalisierten Daten in ein neurales Netzwerk umfaßt. Gemäß dieses
Verfahrens ist es möglich,
Buchstaben und/oder numerische Zeichen selbst aus einem Kennzeichen
eines sich bewegenden Fahrzeuges genau zu erkennen.
-
Bei
diesem Verfahren kommt es jedoch vor, daß genaue Erkennungsergebnisse
nicht erzielt werden können,
wenn das Originalbild Störungen und/oder
eine Unschärfe
enthält.
Insbesondere wenn eine Qualität
des Originalbildes relativ schlecht ist, zum Beispiel wenn das Originalbild
einige Zeichen wie z. B. numerische Zeichen enthält, von denen jedes aus mehreren
Elementen besteht, und/oder unerwünschte Punkte um die Zeichen
im Hintergrund vorhanden sind, wie in 1A gezeigt,
besteht die Befürchtung,
daß die
Zeit, die für
das Erkennen der Zeichen erforderlich ist, trotz einer Abnahme der
Erkennungsgenauigkeit deutlich zunimmt.
-
KURZE DARSTELLUNG
DER ERFINDUNG
-
Daher
besteht eine Aufgabe der Erfindung darin, ein Verfahren zur Zeichentrennung
für ein
effizientes Erkennen von Zeichen wie z. B. Buchstaben, numerische
Zeichen und Symbole, die in einem Originalbild enthalten sind, mit
einer Genauigkeit zur Verfügung
zu stellen, selbst wenn wenigstens eines der in dem Originalbild
enthaltenen Zeichen aus mehreren Elementen besteht.
-
Somit
umfaßt
das Verfahren zur Zeichentrennung zum Einsatz in der Erkennung folgende Schritte:
- (I) Aufnehmen eines ersten Bildes, welches
ein Zeichen umfaßt,
das aus mehreren Elementen zusammengesetzt ist;
- (II) Herauslösen
der mehreren Elemente in dem ersten Bild, um ein zweites Bild zu
erhalten, in dem jedes der mehreren Elemente von einem rechteckigen
Rahmen umschlossen ist;
- (III) Bilden eines zusammengesetzten Bildes aus einer Kombination
der rechteckigen Rahmen in dem zweiten Bild;
- (IV) Berechnen eines charakteristischen Betrages der Elemente,
die in dem zusammengesetzten Bild enthalten sind;
- (V) Eingeben des charakteristischen Betrages in ein trainiertes
Back-Propagation-Netzwerk, um einen Übereinstimmungsgrad zwischen
dem charakteristischen Betrag des zusammengesetzten Bildes und dem
Bezugszeichen zu liefern; und
- (VI) Bestimmen des zusammengesetzten Bildes, welches einen höchsten Übereinstimmungsgrad zwischen
dem charakteristischen Betrag des zusammengesetzten Bildes und des
Bezugszeichens aufweist, aus Ergebnissen, die durch Wiederholen
der Schritte (III) bis (V) bezüglich
verschiedener Kombinationen der rechteckigen Rahmen in dem zweiten
Bild erhalten werden, um es als ein getrenntes Zeichen zur Erkennung
auszugeben.
-
In
dem oben genannten Verfahren zur Zeichentrennung wird vorzugsweise
eine unten beschriebene Vorbehandlung durchgeführt, wenn das erste Bild wenigstens
zwei Zeichen, die aneinander gekoppelt sind, enthält. Dabei
umfaßt
die Vorbehandlung folgende Schritte:
Aufbereiten eines binären Bildes,
welches die wenigstens zwei Zeichen umfaßt;
Bestimmen eines Profils,
welches eine Verteilungsstärke
in einer Ausrichtungsrichtung der wenigstens zwei Zeichen aus dem
binären
Bild zeigt;
Setzen einer Schwelle oder einer Schwellenlinie, welche
eine vorbestimmte Verteilungsstärke
in dem Profil aufweist;
Entfernen einer ersten Region des Profils
aus dem Profil, in der die Verteilungsstärke niedriger als die Schwelle
oder Schwellenlinie ist, um ein kompensiertes Bild zu erhalten,
in dem die wenigstens zwei Zeichen getrennt voneinander sind; und
Verwenden
des kompensierten Bildes als das erste Bild.
-
Insbesondere
wird bevorzugt, daß die
oben beschriebene Vorbehandlung folgende Schritte umfaßt:
Teilen
der ersten Region nach dem Entfernen der ersten Region aus dem Profil
in zwei Bereiche, an einer Stelle, welche eine minimale Verteilungsstärke des
Profils in der ersten Region aufweist; und
Zufügen der
zwei Bereiche jeweils in ein Paar zweiter Regionen des Profils,
welche sich auf beiden Seiten der ersten Region befinden, in der
die Verteilungsstärke
größer als
die Schwellenlinie ist, um das kompensierte Bild zu erhalten.
-
Ferner
wird in dem oben angeführten
Verfahren zur Zeichentrennung bevorzugt, eine unten beschriebene
Vorbehandlung durchzuführen,
wenn das erste Bild ein Zeichen umfaßt, das aus mehreren Punkten
besteht. Dabei umfaßt
die Vorbehandlung folgende Schritte:
Aufbereiten eines binären Bildes,
welches das Zeichen der Punkte umfaßt;
Ausdehnen jedes Punktes
des Zeichens in einer horizontalen Richtung in dem binären Bild,
um ein kompensiertes Bild zu erhalten, in dem jeder der ausgedehnten
Punkte mit einem nahegelegenen ausgedehnten Punkt verbunden ist,
und
Verwenden des kompensierten Bildes als das erste Bild.
-
Insbesondere
wird bevorzugt, daß die
Vorbehandlung folgende Schritte umfaßt:
Aufbereiten eines
binären
Bildes, welches das Zeichen der Punkte umfaßt;
Ausdehnen jedes der
Punkte des Zeichens in horizontaler und vertikaler Richtung in dem
binären
Bild, um ein kompensiertes Bild zu erhalten, in dem jeder der ausgedehnten
Punkte mit einem nahegelegenen ausgedehnten Punkt verbunden ist;
und
Verwenden des kompensierten Bildes als das erste Bild.
-
Eine
weitere Aufgabe der vorliegenden Erfindung besteht darin, eine Vorrichtung
zur Zeichentrennung zum Einsatz in der Erkennung bereitzustellen, welches
die Fähigkeit
aufweist, die bemerkenswerten Effekte des oben beschriebenen Verfahrens
zur Zeichentrennung zu erzielen.
-
Die
Vorrichtung zur Zeichentrennung der vorliegenden Erfindung umfaßt:
eine
Bildaufnahmevorrichtung zur Aufnahme eines ersten Bildes;
einen
Bildelementteiler zum Herauslösen
mehrerer Elemente, die sich zu einem Zeichen zusammensetzen, welche
in dem ersten Bild enthalten sind, um ein zweites Bild zu erhalten,
in dem jedes der Elemente von einem rechteckigen Rahmen umschlossen
ist;
einen Erzeuger eines zusammengesetzten Bildes zum Bilden
eines zusammengesetzten Bildes aus einer Kombination der rechteckigen
Rahmen in dem zweiten Bild;
eine Rechnervorrichtung für einen
charakteristischen Betrag zum Bestimmen eines charakteristischen
Betrages der Elemente, die in dem zusammengesetzten Bild enthalten
sind;
ein trainiertes Back-Propagation-Netzwerk, um einen Übereinstimmungsgrad
zwischen dem charakteristischen Betrag des zusammengesetzten Bildes
und des Bezugszeichens zu liefern, wenn der charakteristische Betrag
in das Back-Propagation-Netzwerk eingegeben wird; und
einen
Bildanalysator zum Bestimmen des zusammengesetzten Bildes, welches
einen höchsten Übereinstimmungsgrad
zwischen dem charakteristischen Betrag des zusammengesetzten Bildes
und des Bezugszeichens aufweist, aus Ergebnissen, die von dem Back-Propagation-Netzwerk
bezüglich
verschiedener Kombinationen der rechteckigen Rahmen in dem zweiten
Bild geliefert werden, um es als ein getrenntes Zeichen zur Erkennung
auszugeben.
-
Diese
und weitere Aufgaben und Vorteile der vorliegenden Erfindung werden
aus der besten Ausführungsform
der Erfindung hervorgehen, die unten unter Bezugnahme auf die beiliegenden
Zeichnungen beschrieben wird.
-
KURZE ERKLÄRUNG DER
ZEICHNUNGEN
-
1A bis 1D sind
Bilder, welche ein Verfahren zur Zeichentrennung zum Einsatz in
der Erkennung gemäß einer
ersten Ausführungsform
der vorliegenden Erfindung zeigen;
-
2 ist
ein schematisches Diagramm, das Anordnungen von rechteckigen Innenrahmen
in einem punktierten Kreis von 1B darstellt;
-
3A und 3B sind
schematische Diagramme, die Beispiele von rechteckigen Außenrahmen
darstellen;
-
4 ist
ein Bild, das ein Beispiel eines ersten zusammengesetzten Bildes
zeigt, das über
einen Bereichsprüfschritt
(II) geliefert wird;
-
5 ist
ein Flussdiagramm einer ersten Phase des Verfahrens zur Zeichentrennung
zum Einsatz in der Erkennung der ersten Ausführungsform;
-
6A und 6B sind
schematische Diagramme, die Beispiele einer zweiten Phase des Verfahrens
zur Zeichentrennung der ersten Ausführungsform darstellen;
-
7 ist
ein Flussdiagramm der zweiten Phase des Verfahrens zur Zeichentrennung;
-
8 ist
ein Flussdiagramm einer dritten Phase des Verfahrens zur Zeichentrennung
der ersten Ausführungsform;
-
9 ist
ein Bild, das ein Beispiel des ersten zusammengesetzten Bildes zeigt,
das über
die zweite Phase des Verfahrens zur Zeichentrennung geliefert wird;
-
10A und 10B sind
schematische Diagramme, die Beispiele von zweiten zusammengesetzten
Bildern darstellen;
-
11A bis 11F sind
schematische Diagramme, die das Aufbereiten von Daten für das neurale
Netzwerk aus dem zweiten zusammengesetzten Bild darstellen;
-
12 ist
ein Bild, das ein Beispiel für
die Erkennungsergebnisse des Verfahrens zur Zeichentrennung der
Ausführungsform
zeigt;
-
13A bis 13E sind
Bilder, die eine Vorbehandlung zeigen, die vor dem Verfahren zur Zeichentrennung
gemäß einer
zweiten Ausführungsform
der vorliegenden Erfindung durchgeführt wird;
-
14A und 14B sind
schematische Diagramme, welche diese Vorbehandlung darstellen;
-
15 ist
ein Originalbild mit einer schlechten Qualität;
-
16A bis 16D sind
Bilder, die eine Vorbehandlung zeigen, die vor dem Verfahren zur Zeichentrennung
gemäß einer
dritten Ausführungsform
der vorliegenden Erfindung durchgeführt wird; und
-
17A bis 17D sind
Bilder, die eine Vorbehandlung zeigen, die vor dem Verfahren zur Zeichentrennung
gemäß einer
dritten Ausführungsform
der vorliegenden Erfindung durchgeführt wird.
-
BESTE AUSFÜHRUNGSFORM
DER ERFINDUNG
-
Erste Ausführungsform
-
Als
eine bevorzugte Ausführungsform
des Verfahrens der vorliegenden Erfindung zur Zeichentrennung zum
Einsatz in der Erkennung wird unten im Detail ein Verfahren zum
wirksamen und genauen Erkennen einer Anordnung von numerischen Zeichen aus
einem Originalbild, in 1A gezeigt, erklärt, das
durch Verwendung einer Bildaufnahmeeinheit, beispielsweise durch
eine Fernsehkamera oder eine Digitalkamera, erhalten wird.
-
In
dem Originalbild von 1A setzt sich zum Beispiel das
numerische Zeichen „1" aus einem oberen
und einem unteren Element (11, 12) zusammen, da
ein Mittelabschnitt des numerischen Zeichens „1" verloren gegangen ist. In ähnlicher
Weise ist das numerische Zeichen „2" aus vier Elementen (21, 22, 23, 24)
zusammengesetzt, und es gibt unerwünschte Punkte (25, 26)
als Störungen
an oberen und unteren Seiten des numerischen Zeichens „2".
-
Bei
dem Verfahren zur Zeichentrennung dieser Ausführungsform wird jedes der Elemente,
die in dem Originalbild enthalten sind, das heißt jedes der Elemente (11, 12, 21, 22,
...), aus denen sich die jeweiligen numerischen Zeichen („1", „2", ...) und die unerwünschten
Punkte (25, 26, ...) zusammensetzen, die als Störungen in
dem Originalbild enthalten sind, herausgelöst und dann von einem rechteckigen Innenrahmen 30 umschlossen,
um ein zweites Bild zu erhalten, das in 1B und 2 gezeigt
wird. Das heißt,
in dem zweiten Bild ist jeder der rechteckigen Rahmen 30 so
angeordnet, daß er
das jeweilige Element oder den jeweiligen Punkt umschreibt. Das zweite
Bild kann durch eine Rahmenverteilungseinheit für das Herauslösen der
mehreren Elemente erhalten werden, aus denen sich das Zeichen in
dem Originalbild zusammensetzt, und durch Anordnen der rechteckigen
Innenrahmen 30, so daß jeder
der rechteckigen Innenrahmen das jeweilige Element umschreibt.
-
Als
nächstes
wird eine Kombination aus den rechteckigen Innenrahmen 30 in
dem zweiten Bild freiwillig ausgewählt und ein erstes zusammengesetztes
Bild 100 durch einen Rahmensynthesizer gemäß dieser
Kombination aufbereitet. Zum Beispiel kann das erste zusammengesetzte
Bild 100 in bezug auf zwei rechteckige Rahmen 30 aufbereitet
werden, welche die Elemente 11, 12 des darin enthaltenen numerischen
Zeichens „1" umschließen, wie
in 3A gezeigt, und ein weiteres erstes zusammengesetztes
Bild 100 kann in bezug auf fünf rechteckige Rahmen 30 aufbereitet
werden, welche die Elemente 21 bis 24 des numerischen
Zeichens „2" und den unerwünschten
Punkt 24 darin umschließen, wie in 3B gezeigt.
Somit wird das erste zusammengesetzte Bild 100 durch einen
rechteckigen Außenrahmen 40 definiert,
der mehrere der rechteckigen Innenrahmen 30 umschreibt.
In dem zweiten Bild wird die X-Achse
in einer Ausrichtungsrichtung der numerischen Zeichen und die Y-Achse
in einer Höhenrichtung
der numerischen Zeichen definiert.
-
Als
nächstes
wird ein Bereich des rechteckigen Außenrahmens 40 dieses
ersten zusammengesetzten Bildes 100 berechnet. Zum Beispiel
kann – wie
in 3A gezeigt – der
Bereich des rechteckigen Außenrahmens 40 einfach
gemäß den Koordinaten der
oberen linken Ecke (x1, y1) und der unteren rechten Ecke (x2, y2)
des rechteckigen Außenrahmens berechnet
werden. Danach wird der berechnete Bereich des rechteckigen Außenrahmens 40 mit
einem erforderlichen Wert, der zuvor in einem Back-Propagation-Netzwerk
gespeichert wurde, verglichen, zum Beispiel zwei Mal ein Durchschnitt
von Breiten von numerischen Zeichen, die in dem Back-Propagation-Netzwerk
gespeichert sind. Wenn der Bereich gleich oder kleiner als der erforderliche
Wert ist, fährt das
Verfahren zur Zeichentrennung zum nächsten Schritt fort. Auf der
anderen Seite wird, wenn der Bereich größer als der erforderliche Wert
ist, das erste zusammengesetzte Bild gelöscht und eine andere Kombination
der rechteckigen Innenrahmen 30 in dem zweiten Bild ausgewählt, um
ein anderes erstes zusammengesetztes Bild 100 zu erzeugen.
Der Bereich des rechteckigen Außenrahmens
eines anderen ersten zusammengesetzten Bildes wird gemäß der oben
beschriebenen Weise geprüft.
In dieser Ausführungsform
wird dieser Schritt als Bereichsprüfschritt (I) bezeichnet.
-
Nach
dem Bereichsprüfschritt
(I) wird ein Abstand zwischen den rechteckigen Innenrahmen in dem
ersten zusammengesetzten Bild berechnet. Zum Beispiel kann, wie
in 3 gezeigt, dieser Abstand d leicht
gemäß Koordinaten
der oberen linken Ecken (x1, y1), (x3, y3) der zwei rechteckigen
Innenrahmen 30 bestimmt werden. Danach wird der berechnete
Abstand mit einem erforderlichen Wert, der zuvor im Back-Propagation-Netzwerk
gespeichert wurde, verglichen, zum Beispiel 40% eines Durchschnitts
von Spaltbreiten der numerischen Zeichen, die in dem Back-Propagation-Netzwerk
gespeichert sind. Wenn der Abstand gleich oder kleiner als der erforderliche
Wert ist, fährt
das Verfahren zur Zeichentrennung zum nächsten Schritt fort. Wenn der
Abstand jedoch größer als
der erforderliche Wert ist, wird das erste zusammengesetzte Bild 100 gelöscht und
eine andere Kombination der rechteckigen Innenrahmen in dem zweiten
Bild ausgewählt,
um ein anderes erstes zusammengesetztes Bild zu erzeugen. Der Abstand
zwischen den rechteckigen Innenrahmen in einem anderen ersten zusammengesetzten
Bild wird gemäß der oben
beschriebenen Weise geprüft.
In dieser Ausführungsform
wird dieser Schritt als Abstandsprüfschritt (I) bezeichnet.
-
Nach
dem Abstandsprüfschritt
(I) wird der Bereich des rechteckigen Außenrahmens 40 des
ersten zusammengesetzten Bildes 100 mit einem erforderlichen
Wert verglichen, der zuvor in dem Back-Propagation-Netzwerk gespeichert
wurde, zum Beispiel einer Hälfte
eines Durchschnitts von Breiten von numerischen Zeichen, die in
dem Back-Propagation-Netzwerk gespeichert wurden. Wenn der Bereich
gleich oder größer als
der erforderliche Wert ist, fährt
das Verfahren zur Zeichentrennung zum nächsten Schritt fort. Wem der
Bereich hingegen größer als der
erforderliche Wert ist, wird ein anderer rechteckiger Innenrahmen
in dem zweiten Bild ausgewählt und
zum ersten zusammengesetzten Bild hinzugefügt, so daß ein anderes erstes zusammengesetztes Bild,
das einen vergrößerten Bereich
aufweist, erzeugt wird. Ein Bereich des rechteckigen Außenrahmens 100 eines
anderen ersten zusammengesetzten Bildes wird gemäß der oben beschriebenen Weise geprüft. Somit
können
durch Wiederholen dieses Verfahrens bis zur Erfüllung der oben genannten Bedingung
mehrere rechteckige Innenrahmen in einem einzelnen rechteckigen
Außenrahmen
umschlossen werden, wie in 3B gezeigt.
In dieser Ausführungsform
wird dieser Schritt als Bereichsprüfschritt (II) bezeichnet.
-
Wie
in 1C gezeigt, wird das über den Bereichsprüfschritt
(II) gelieferte erste zusmmengesetzte Bild 100 als ein
verlässliches
Kandidatenbild in einem Speicher gespeichert. Ein Beispiel des ersten zusammengesetzten
Bildes 100, das über
den Bereichsprüfschritt
(II) geliefert wird, ist in 4 zu sehen.
In dieser Figur sollte – obwohl
mehrere der Elemente und der Punkte in dem ersten zusammengesetzten
Bild 100 enthalten sind – festgehalten werden, daß alle Elemente,
aus denen sich das numerische Zeichen „3" zusammensetzt, in dem ersten zusammengesetzten
Bild 100 enthalten sind. Es gibt jedoch einen Fall, bei
dem nicht alle Elemente, aus denen sich das numerische Zeichen zusammensetzt,
in dem ersten zusammengesetzten Bild enthalten sind. Daher ist es – wenn ein
solches nutzloses erstes zusammengesetztes Bild gefunden und vor
den nachfolgenden wichtigen Schritten des Verfahrens zur Zeichentrennung
der vorliegenden Erfindung gelöscht
werden kann – möglich, eine
Gesamtanzahl der ersten zusammengesetzten Bilder zu verringern, um
die Bilderkennung wirksamer durchzuführen. Daher ist eine zweite
Phase des Verfahrens zur Zeichentrennung dieser Ausführungsform
eine optionale Phase für
das Erreichen dieses Zwecks, d. h. „Datenreduktion". Daher kann die
zweite Phase erforderlichenfalls ausgelassen werden.
-
Vor
der Erklärung
der zweiten Phase wird die oben erklärte erste Phase des Verfahrens
zur Zeichentrennung dieser Ausführungsform
gemäß des in 5 gezeigten
Flussdiagramms zusammengefaßt. Das
heißt,
jeder der rechteckigen Innenrahmen 30, der das jeweilige
Element oder den jeweiligen Punkt in dem zweiten Punkt umschreibt,
wird als ein Kombinationsbasiselement in Reihenfolge (Schritt 50) ausgewählt. Zudem
wird ein weiterer rechteckiger Innenrahmen 30, der mit
dem Kombinationsbasiselement zu kombinieren ist, ausgewählt (Schritt 51),
um dadurch das erste zusammengesetzte Bild 100 aufzubereiten,
das den rechteckigen Außenrahmen 40 aufweist,
der die ausgewählten
rechteckigen Innenrahmen 30 (Schritt 52) umschreibt.
-
Danach
wird der Bereich des rechteckigen Außenrahmens 40 des
ersten zusammengesetzten Bildes 100 berechnet (Schritt 53),
und es werden der Bereichsprüfschritt
(I), der Abstandsprüfschritt
(I) und der Bereichsprüfschritt
(II) in Reihenfolge ausgeführt (Schritte 54– 56).
Wenn das erste zusammengesetzte Bild 100 als „Nicht
gut (NG)" in entweder
dem Bereichprüfschritt
(I) oder dem Abstandprüfschritt
(I) befunden wird, wird es gelöscht,
und ein neuer rechteckiger Innenrahmen, der mit dem rechteckigen
Innenrahmen des Kombinationsbasiselementes zu kombinieren ist, wird
ausgewählt
(Schritt 51), um dadurch ein anderes erstes zusammengesetztes
Bild zu erzeugen.
-
Wem
hingegen das erste zusammengesetzte Bild 100 als „Nicht
gut (NG)" in dem
Bereichsprüfschritt
(II) befunden wird, wird ein zusätzlicher
rechteckiger Innenrahmen 30 ausgewählt und zu dem ersten zusammengesetzten
Bild 30 hinzugefügt,
um den Gesamtbereich davon zu vergrößern. Daher wird das erste
zusammengesetzte Bild 100, selbst wenn es als „NG" in dem Bereichsprüfschritt
(II) befunden wird, nicht gelöscht.
-
Wie
oben beschrieben, wird das erste zusammengesetzte Bild 100 (z.
B. 4), das über
den Bereichsprüfschritt
(I), den Abstandsprüfschritt
(I) und den Bereichsprüfschritt
(II) geliefert wird, als das verlässliche Kandidatenbild in dem
Speicher (Schritt 57) gespeichert. Nebenbei sei bemerkt,
daß – wem das
erste zusammengesetzte Bild 100 als das verlässliche
Zeichen zur Erkennung in dem Speicher gespeichert wird – ein nächstes erstes
zusammengesetztes Bild aufbereitet wird, indem ein anderer rechteckiger
Innenrahmen als ein neues Kombinationsbasiselement ausgewählt wird,
mit wenigstens einem der restlichen rechteckigen Innenrahmen, abgesehen
von dem/den rechteckigen Innenrahmen, der oder die bereits als das Kombinationsbasiselement verwendet
wurde/n. Auf diese Weise fährt – wenn alle rechteckigen
Innenrahmen in dem zweiten Bild als das Kombinationsbasiselement
(Schritt 58) verwendet werden – das Verfahren zur Zeichentrennung
der vorliegenden Erfindung zur zweiten Phase fort, das ist die Datenreduktionsbehandlung,
wie in einem Flussdiagramm von 6 gezeigt.
-
Die
zweite Phase des Verfahrens zur Zeichentrennung dieser Ausführungsform
ist eine Datenreduktionsbehandlung, bei der überlappende erste zusammengesetzte
Bilder gelöscht
werden, um eine Verbesserung bei der Erkennungsgeschwindigkeit zu
erhalten. Das heißt,
daß – wie in
dem Flussdiagramm von 7 gezeigt – eines der ersten zusammengesetzten
in dem Speicher gespeicherten Bilder und ein anderes erstes zusammengesetztes
Bild, das mit dem ausgewählten
ersten zusammengesetzten Bild zu vergleichen ist, ausgewählt werden,
so daß ein
Vergleich zwischen den beiden durchgeführt wird. Zum Beispiel wird – wie in 6A gezeigt – wenn das
erste zusammengesetzte Bild 100' vollständig in dem anderen ersten
zusammengesetzten Bild 100 (Schritt 60) umschlossen
ist, das erste zusammengesetzte Bild 100' gelöscht (Schritt 62).
-
Wenn
hingegen – wie
in 6B gezeigt – das
erste zusammengesetzte Bild 100 teilweise mit dem anderen
ersten zusammengesetzten Bild 100' überlappt ist, wird ein Überlappungsbereich
zwischen diesen ersten zusammengesetzten Bildern (100, 100') berechnet.
Wenn der Überlappungsbereich
80% oder mehr von einem der ersten zusammengesetzten Bilder (Schritt 63)
ausmacht, werden die ersten zusammengesetzten Bilder (100, 100') aneinander
gekoppelt, um ein neues erstes zusammengesetztes Bild 100'' (Schritt 64) zu erhalten.
Wenn der Überlappungsbereich
weniger als 80% ausmacht, wird jedes der ersten zusammengesetzten Bilder
für sich
alleine beibehalten, ohne an das andere erste zusammengesetzte Bild
gekoppelt zu werden. Wenn alle ersten zusammengesetzten Bilder in dem
Speicher in der zweiten Phase (Schritt 65) überprüft wurden,
geht das Verfahren zur Zeichentrennung dieser Ausführungsform
zu der dritten Phase über.
-
In
der dritten Phase des Verfahrens zur Zeichentrennung werden – wie in
einem Flussdiagramm von 8 gezeigt – Schritte, die dem Bereichsprüfschritt
(I), dem Abstandsprüfschritt
(I) und dem Bereichsprüfschritt
(II) der ersten Phase ähnlich
sind, im wesentlichen in bezug auf mehrere der rechteckigen Innenrahmen 30 wiederholt,
die in dem rechteckigen Außenrahmen 40 des
ersten zusammengesetzten Bilds 100 enthalten sind, das
aus der zweiten Phase geliefert wird. Mit anderen Worten, die erste
Phase dient dazu, eine grobe (breite) Region (= erstes zusammengesetztes
Bild) zu bestimmen, einschließlich der
Elemente des numerischen Zeichens, das zu erkennen ist, während die
dritte Phase dazu dient, eine feine (schmale) Region (= zweites
zusammengesetztes Bild, das später
beschrieben wird) zu bestimmen, das im wesentlichen nur die Elemente
des zu erkennenden numerischen Zeichens enthält, und die Bilderkennung gemäß des zweiten
zusammengesetzten Bildes zu erreichen.
-
In
der dritten Phase wird – wie
in 9 und 10A gezeigt – eine Kombination
der rechteckigen Innenrahmen 30 in dem ersten zusammengesetzten
Bild 100 freiwillig ausgewählt und ein zweites zusammengesetztes
Bild 200 gemäß dieser
Kombination durch die im wesentlichen selbe Weise wie in der ersten
Phase aufbereitet. Dieses zweite zusammengesetzte Bild 200 wird
durch einen rechteckigen Außenrahmen 70 definiert,
der die ausgewählten rechteckigen
Innenrahmen 30 umschreibt.
-
Als
nächstes
wird in bezug auf das zweite zusammengesetzte Bild 200 ein
Bereich des rechteckigen Außenrahmens 70 berechnet,
zum Beispiel auf die im wesentlichen selbe Weise wie in der ersten Phase.
Der berechnete Bereich des rechteckigen Außenrahmens 70 wird
mit einem erforderlichen Wert verglichen, der zuvor in dem Back-Propagation-Netzwerk
gespeichert worden war, zum Beispiel 1,2 Mal ein Durchschnitt von
Breiten der numerischen Zeichen, die in dem Back-Propagation-Netzwerk
gespeichert sind. In der dritten Phase wird dieser Vergleich unter
einer strengeren Bedingung als in der ersten Phase durchgeführt (z.
B. zwei Mal der Durchschnitt von Breiten der numerischen Zeichen,
die in dem Back-Propagation-Netzwerk gespeichert sind). Wenn der
Bereich gleich oder kleiner als der erforderliche Wert ist, geht
das Verfahren zur Zeichentrennung auf den nächsten Schritt der dritten
Phase über. Wenn
der Bereich hingegen größer als
der erforderliche Wert ist, wird das zweite zusammengesetzte Bild gelöscht und
eine andere Kombination der rechteckigen Innenrahmen 30 in
dem ersten zusammengesetzten Bild 100 ausgewählt, um
ein anderes zweites zusammengesetztes Bild 200 zu erzeugen.
Der Bereich des rechteckigen Außenrahmens 70 eines
anderen zweiten zusammengesetzten Bilds wird gemäß der oben beschriebenen Weise
geprüft.
In dieser Ausführungsform
wird dieser Schritt als ein Bereichsprüfschritt (III) bezeichnet.
-
Nach
dem Bereichsprüfschritt
(III) wird ein Abstand zwischen den rechteckigen Innenrahmen 30 in
dem zweiten zusammengesetzten Bild 200 berechnet, zum Beispiel
auf die im wesentlichen selbe Weise wie in der ersten Phase. Danach
wird der berechnete Abschnitt mit einem erforderlichen Wert verglichen,
der zuvor in dem Back-Propagation-Netzwerk gespeichert wurde, zum
Beispiel 40% eines Durchschnitts von Spaltbreiten der numerischen
Zeichen, die in dem Back-Propagation-Netzwerk gespeichert sind.
Wenn der Abstand gleich oder kleiner als der erforderliche Wert
ist, geht das Verfahren zur Zeichentrennung auf den nächsten Schritt
des dritten Bildes über.
Wenn hingegen der Abstand größer als der
erforderliche Wert ist, wird das zweite zusammengesetzte Bild 200 gelöscht und
eine andere Kombination der rechteckigen Innenrahmen 30 in dem
ersten zusammengesetzten Bild 100 ausgewählt, um
ein anderes zweites zusammengesetztes Bild 200 zu erzeugen.
Der Abstand zwischen den rechteckigen Innenrahmen 30 in
einem anderen zweiten zusammengesetzten Bild 200 wird gemäß der oben
beschriebenen Weise geprüft.
In dieser Ausführungsform
wird der Schritt als Abstandsprüfschritt
(II) bezeichnet.
-
Nach
dem Abstandsprüfschritt
(II) wird der Bereich des rechteckigen Außenrahmens 70 dieses zweiten
zusammengesetzten Bildes 200 mit einem erforderlichen Wert
verglichen, der zuvor in dem Back-Propagation-Netzwerk gespeichert
wurde, zum Beispiel 0,8 Mal ein Durchschnitt von Breiten der numerischen
Zeichen, die in dem Back-Propagation-Netzwerk gespeichert sind.
In der dritten Phase wird der Vergleich unter einer strengeren Bedingung durchgeführt als
in der ersten Phase (z. B. eine Hälfte eines Durchschnitts von
Breiten der numerischen Zeichen, die in dem Back-Propagation-Netzwerk
gespeichert sind). Wenn der Bereich gleich oder größer als
der erforderliche Wert ist, geht das Verfahren zur Zeichentrennung
der vorliegenden Erfindung auf den nächsten Schritt der dritten
Phase über.
Wenn der Bereich hingegen größer als
der erforderliche Wert ist, wird ein anderer rechteckiger Innenrahmen 30 in dem
ersten zusammengesetzten Bild 100 ausgewählt und
zu dem zweiten zusammengesetzten Bild hinzugefügt, so daß ein neues zweites zusammengesetztes
Bild erzeugt wird, das einen vergrößerten Bereich aufweist. Ein
Bereich des rechteckigen Außenrahmens 70 des
neuen zweiten zusammengesetzten Bildes 200 wird gemäß der oben
beschriebenen Weise geprüft.
Somit können
durch Wiederholen dieses Verfahrens bis zur Erfüllung der oben genannten Bedingung
mehrere rechteckige Innenrahmen 30 in dem ersten zusammengesetzten
Bild 100 in einem einzelnen rechteckigen Außenrahmen 70 des
zweiten zusammengesetzten Bildes 200 umschlossen werden,
wie in 10B gezeigt. In dieser Ausführungsform
wird dieser Schritt als Bereichsprüfschritt (IV) bezeichnet.
-
Das
Flussdiagramm, das in 8 gezeigt wird, faßt die dritte
Phase des Verfahrens zur Zeichentrennung dieser Ausführungsform
bis hierher zusammen. Das heißt,
jeder der rechteckigen Innenrahmen 30, welche die Elemente
oder Punkte in dem ersten zusammengesetzten Bild 100 umschließen, wird
als ein Kombinationsbasiselement in Reihenfolge (Schritt 80)
ausgewählt.
Zudem wird ein anderer rechteckiger Innenrahmen 30, der
mit dem rechteckigen Innenrahmen des Kombinationsbasiselements zu
kombinieren ist, ausgewählt
(Schritt 81), um dadurch das zweite zusammengesetzte Bild 200 zu
erhalten, das den rechteckigen Außenrahmen 70 aufweist,
der diese ausgewählten
rechteckigen Innenrahmen 30 (Schritt 82) umschreibt,
wie in 10A gezeigt.
-
Danach
wird der Bereich des rechteckigen Außenrahmens 70 des
zweiten zusammengesetzten Bildes 200 berechnet (Schritt 83),
und der Bereichsprüfschritt
(III), der Abstandsprüfschritt
(II) und der Bereichsprüfschritt
(IV) werden in Reihenfolge ausgeführt (Schritt 85–87).
-
Wenn
das zweite zusammengesetzte Bild 200 entweder in dem Bereichsprüfschritt
(III) oder dem Abstandsprüfschritt
(II) für „Nicht
gut (NG)" befunden
wird, wird es gelöscht
und ein anderer rechteckiger Innenrahmen 30, der mit dem
rechteckigen Innenrahmen des Kombinationsbasiselements zu kombinieren
ist, wird ausgewählt
(Schritt 81), um dadurch ein anderes zweites zusammengesetztes
Bild 200 (Schritt 82) zu erzeugen. Wenn hingegen
das zweite zusammengesetzte Bild 200 in dem Bereichsprüfschritt
(IV) als „Nicht
gut (NG)" befunden
wird, wird ein zusätzlicher
rechteckiger Innenrahmen 30 ausgewählt und zu dem zweiten zusammengesetzten
Bild, das als „NG" befunden wird, hinzugefügt, so daß ein neues
zweites zusammengesetztes Bild 200 mit einem vergrößerten Bereich
erzeugt wird. Daher wird das zweite zusammengesetzte Bild, das in
dem Bereichsprüfschritt
(II) für „NG" befunden wird, nicht gelöscht. Nebenbei
sei bemerkt, daß die
dritte Phase einen Schritt 84 umfaßt, bei dem geprüft wird,
ob die nachfolgende(n) Behandlung(en), z. B. der Bereichsprüfschritt
(III), bei dem zweiten zusammengesetzten Bild 200 bereits
durchgeführt
wurde. Falls ja, wird das zweite zusammengesetzte Bild gelöscht, um
eine unnötige
Wiederholung derselben Behandlung zu vermeiden.
-
Als
nächstes
wird ein Längenverhältnis, d.
h. vertikale Breite/horizontale Breite, des rechteckigen Außenrahmens 70 des
zweiten zusammengesetzten Bildes 200, das über den
Bereichsprüfschritt
(IV) geliefert wird, berechnet und mit einem vorbestimmten Wert
verglichen, der in dem Back-Propagation-Netzwerk (Schritt 88)
gespeichert ist. In dieser Ausführungsform
wird dieser Schritt, der als ein Längenverhältnisprüfschritt (I) bezeichnet wird,
ausgeführt,
um festzustellen, ob das Längenverhältnis innerhalb
eines Bereichs von 0,5 Mal bis 1,5 Mal eines Mindestwertes der Längenverhältnisse
der numerischen Zeichen ist, die in dem Back-Propagation-Netzwerk gespeichert sind.
Wenn sich das Längenverhältnis innerhalb
dieses Bereichs befindet, geht das Verfahren zur Zeichentrennung
auf den nächsten
Schritt der dritten Phase über.
Wenn das Längenverhältnis außerhalb
dieses Bereichs liegt, wird das zweite zusammengesetzte Bild gelöscht und
ein anderer rechteckiger Innenrahmen 30 in dem ersten zusammengesetzten
Bild 100 ausgewählt,
um ein neues zweites zusammengesetztes Bild 200 zu erzeugen.
-
Als
nächstes
werden Daten, die in das neurale Netzwerk einzugeben sind, aus dem
zweiten zusammengesetzten Bild 200, das in dem Längenverhältnis-Prüfschritt
(I) für „OK" befunden wird, aufbereitet.
Zuerst werden die Elemente, die in dem zweiten zusammnengesetzten
Bild 200 enthalten sind, herausgelöst. In dieser Ausführungsform
werden zum Beispiel – wie
in 11A gezeigt – die
zwei Elemente, aus denen sich das numerische Zeichen „4" zusammensetzt – aus dem
zweiten zusammengesetzten Bild 200 herausgelöst. Als
nächstes
wird eine Bildgröße des herausgelösten Bildes
normalisiert. Zum Beispiel wird die Normalisierung so durchgeführt, daß eine längere („Ly" in 11A) der X-Achsen- und Y-Achsen-Längen (Lx,
Ly) des herausgelösten
Bildes 40 Pixel beträgt.
-
Als
nächstes
wird in bezug auf jedes der Pixel auf Randlinien der Elemente des
normalisierten Bildes eine Außenlinienrichtung
berechnet. In dieser Ausführungsform
werden – wie
in 11B gezeigt – vier
Außenlinienrichtungen
(D1 bis D4) gesetzt. Zum Beispiel wird in der Region, die in 11B durch einen Kreis angezeigt wird, in dem Fall,
in dem die Außenlinienrichtung
eines Zielpixels Pt als eine Richtung einer geraden Linie definiert
wird, die sich zwischen dem Zielpixel Pt und einem Bezugspixel Ps
erstreckt, das nur 1 Pixel hinter dem Zielpixel Pt angeordnet ist,
angenommen, daß das
Zielpixel Pt eine Außenlinienrichtung
D2 aufweist, die eine schräge Richtung
ist. Dieses Ergebnis stimmt jedoch nicht mit dem Umstand überein,
daß eine
korrekte Außenlinienrichtung
des Zielpixels Pt als D3 betrachtet werden sollte. In dieser Ausführungsform
wird angenommen, da die Außenlinienrichtung
des Zielpixels Pt als eine Richtung einer geraden Linie definiert
wird, die sich zwischen dem Zielpixel Pt und einem Bezugspixel Ps' erstreckt, das 6
Pixel hinter dem Zielpixel angeordnet ist, daß das Zielpixel Pt die Außenlinienrichtung
D3 aufweist, die eine vertikale Richtung ist. Dieses Ergebnis stimmt
mit dem Umstand überein,
daß die
korrekte Außenlinienrichtung
D3 ist, wie oben beschrieben.
-
Als
nächstes,
wie in 11E gezeigt, wird ein Gittermuster 45 so
angeordnet, daß die
Elemente des normalisierten Bildes darin enthalten sind. In dieser
Ausführungsform
ist das Gittermuster 45 in einer quadratischen Form von
40 × 40
Pixel konfiguriert. Die Anzahl von Gittern des Gittermusters 45 beträgt 36. In
bezug auf die Pixel auf der Randlinie, die in jedem der Gitter enthalten
ist, wird ein Histogramm der Außenlinienrichtungen
aufbereitet, wie in 11F gezeigt. Nachdem eine Behandlung
zum Teilen einer Höhe
von jeder der Außenlinienrichtungen
durch die maximale Höhe
der Außenlinienrichtung
in bezug auf jedes der Histogramme durchgeführt wurde, werden die resultierenden
Daten in das neurale Netzwerk eingegeben (Schritt 91).
In dieser Ausführungsform sind
die Eingabeabmessungen des neuralen Netzwerkes 144, wobei
dies dadurch erhalten wird, daß die
Anzahl von Außenlinienrichtungen
(= 4 Abmessungen) mit der Anzahl von Gittern (= 36 Abmessungen)
multipliziert wird. Die Berechnung des neuralen Netzwerkes weist
ein Erkennungsergebnis auf, bei dem das numerische Zeichen, das
in dem zusammengesetzten Bild 200 enthalten ist, „4" ist (Schritt 92).
-
Um
das Erkennungsergebnis mit der größten Genauigkeit zu erhalten,
wird das Längenverhältnis des
erkannten numerischen Zeichens (zum Beispiel „4") berechnet und mit einem Bezugslängenverhältnis (zum
Beispiel dem Bezugslängenverhältnis von „4"), das in dem Back-Propagation-Netzwerk
gespeichert ist, verglichen, um einen Übereinstimmungsgrad zwischen
den beiden zu prüfen
(Schritt 93). In dieser Ausführungsform wird dies als Längenverhältnis-Prüfschritt
(II) bezeichnet. Wenn ein Erkennungsergebnis mit einem Übereinstimmungsgrad
zwischen den beiden erhalten wird, wird es vorübergehend in dem Speicher gespeichert.
Danach werden die Daten, falls ein neues Erkennungsergebnis mit
einem höheren Übereinstimmungsgrad
zwischen den beiden erzielt wird, erneuert (Schritt 94 und 95).
Durch das Wiederholen dieses Vorgangs kann das Erkennungsergebnis
mit dem höchsten Übereinstimmungsgrad
zwischen den beiden erhalten werden. In dieser Ausführungsform
hat zum Beispiel – wie
in 12 gezeigt – die
Kombination aus den zwei Elementen, die durch das Bezugszeichen 4 gekennzeichnet
sind – einen
höheren Übereinstimmungsgrad
des Längenverhältnisses
als jede Kombination, welche den Punkt/die Punkte aufweist, der
bzw. die mit „X" gekennzeichnet sind.
Daher wird die Kombination der rechteckigen Innenrahmen 30 mit
dem höchsten Übereinstimmungsgrad
als eine korrekte Kombination der Elemente ausgegeben, aus denen sich
das numerische Zeichen „4" zusammensetzt.
-
Der
Schritt 96 der dritten Phase besteht darin, zu prüfen, ob
alle rechteckigen Innenrahmen 30 in dem ersten zusammengesetzten
Bild 100, das aus der zweiten Phase geliefert wurde, als
das Kombinationsbasiselement in der dritten Phase verwendet wurden.
Falls ja, geht das Verfahren zur Zeichentrennung dieser Ausführungsform
auf den nächsten Schritt 97 über, der
darin besteht, zu prüfen,
ob die Erkennung aller numerischen Zeichen in dem Originalbild von 1A abgeschlossen
worden ist. Als Ergebnis kann – wie
in 1D gezeigt – das
Verfahren zur Zeichentrennung der vorliegenden Erfindung ein Bild
liefern, welches die rechteckigen Außenrahmen 70 der zweiten
zusammengesetzten Bilder 200 enthält, in denen jeweils nur die
Elemente, aus denen sich das numerische Zeichen zusammensetzt, umschlossen
sind.
-
Nebenbei
sei bemerkt, daß in
dieser Ausführungsform
die charakteristischen Beträge
wie Bereich, Abstand und Längenverhältnis durch
Einheiten zur Berechnung des charakteristischen Betrags bestimmt
werden können.
Außerdem
kann der Übereinstimmungsrad
des charakteristischen Betrags durch einen Bildanalysator bestimmt
werden. Daher stellt die vorliegende Ausführungsform auch eine Vorrichtung
oder ein System zur Zeichentrennung zum Einsatz in der Erkennung
bereit, um das oben beschriebene Verfahren zur Zeichentrennung auszuführen.
-
Zweite Ausführungsform
-
Diese
Ausführungsform
stellt eine Vorbehandlung bereit, die vorzugsweise vor dem Verfahren zur
Zeichentrennung der ersten Ausführungsform durchgeführt wird,
zum Beispiel wenn ein zu erkennendes Originalbild eine Anordnung
von numerischen Zeichen enthält,
in der naheliegende numerische Zeichen teilweise aneinander gekoppelt
sind, wie in 13A gezeigt, weil das Originalbild
unter einer schlechten Bedingung aufbereitet wird. Daher wird auf
eine nochmalige Erklärung
des Verfahrens zur Zeichentrennung der ersten Ausführungsform, das
nach der Vorbehandlung durchgeführt
wird, verzichtet.
-
Zuerst
wird, wie in 13B gezeigt, ein binäres Bild
des Originalbilds von 13A aufbereitet. Danach
wird ein Profil, das die Verteilungsstärke in einer Ausrichtungsrichtung
(X-Achsen-Richtung)
der numerischen Zeichen aus dem binären Bild anzeigt, bestimmt,
wie in 13C gezeigt. 13D ist eine Draufsicht des Profils von 13C, wobei jede der hellen Regionen eine hohe
Verteilungsstärke
des numerischen Zeichens anzeigt. Wenn die Region dunkel wird, bedeutet
dies, daß die
Verteilungsstärke
des numerischen Zeichens kleiner oder Null ist (= die Region zwischen
naheliegenden numerischen Zeichen).
-
Als
Beispiel wird ein Verfahren zum Bestimmen des Profils besprochen.
Zuerst werden die Regionen des numerischen Zeichens in dem binären Bild (13B) auf einer Achse projiziert, die als Projektionsachse
(= x-Achse) bezeichnet wird und sich parallel zu der Ausrichtungsrichtung
der numerischen Zeichen erstreckt. In dieser Projektionsbehandlung wird ein
Abtastvorgang in einer Richtung (Y-Achse) durchgeführt, die
zu der Projektionsachse senkrecht verläuft, um die Anzahl an Pixeln
auf der Abtastlinie zu zählen.
Zum Beispiel wird, wie in 13B gezeigt, wenn
die Pixel von weißen
Regionen, welche die numerischen Zeichen anzeigen, einen Konzentrationswert „1" liefern und die
Pixel von schwarzen Regionen, welche den Hintergrund anzeigen, einen
Konzentrationswert „0" zeigen, die Anzahl
an Pixeln, welche den Konzentrationswert „1" aufweisen, gezählt. Dadurch, daß die Anzahl
an Pixeln mit dem Konzentrationswert „1" auf der Abtastlinie, die sich von jedem Punkt
der Projektionsachse erstreckt, als ein Projektionswert festgelegt
wird, kann das Profil der Verteilungsstärke erhalten werden, wie in 13C gezeigt.
-
Nebenbei
sei bemerkt, daß es – wenn naheliegende
numerische Zeichen (z. B. „9" und „0") aneinander durch
einen relativ großen
Bereich gekoppelt sind, wie in 13B gezeigt – erforderlich
ist, die weiße
Region der Kopplungsregion von den weißen Regionen zu unterscheiden,
aus denen sich das numerische Zeichen zusammensetzt. In diesem Verfahren
ist es durch Multiplexing des Projektionswertes mit der Anzahl an
Inselregionen auf der Abtastlinie, in denen jeweils die Pixel, welche
den Konzentrationswert „1" aufweisen, nacheinander
angeordnet sind, möglich,
die Pixel mit dem Konzentrationswert „1" des numerischen Zeichens von den Pixeln
mit dem Konzentrationswert „1" der Kopplungsregion
zu unterscheiden. Zum Beispiel ist in 13B die
Anzahl von Pixeln „1" auf der Abtastlinie
Ls1, die an der Kopplungsregion vorbeiführt, ungefähr gleich der Anzahl von Pixeln „1" auf der Abtastlinie
Ls2, welche am numerischen Zeichen „0" vorbeiführt. Durch die oben beschriebene
Multiplexing-Behandlung wird die Verteilungsstärke an der Abtastlinie Ls1
jedoch geringer als die Verteilungsstärke an der Abtastlinie Ls2,
wie durch die quadratischen Regionen „Q1", „Q2" in 13C gezeigt.
-
Als
nächstes
wird – wie
in 13C gezeigt – eine
Schwellenlinie L mit einer vorbestimmten Verteilungsstärke in dem
Profil gesetzt. Zum Beispiel wird in dem Fall, in dem eine untere
Region S2 des Profils, wo die Verteilungsstärke geringer als die Schwellenlinie
L ist, zwischen einem Paar von oberen Regionen (S1L, S1R) des Profils
angeordnet wird, wo die Verteilungsstärke größer als die Schwellenlinie
L ist, die untere Region S2 in die zwei Bereiche (S2L, S2R) an einer
Position „Pm" geteilt, welche
eine Mindestverteilungsstärke
des Profils innerhalb der unteren Region aufweist. 13E ist eine Unteransicht des Profils von 13C, in der jede der weißen Linien, die sich in der
Y-Achsen-Richtung erstrecken, die Position „Pm" der Mindestverteilungsstärke in der
jeweiligen unteren Region S2 des Profils bezeichnet.
-
Wie
in 14A und 14B gezeigt,
werden diese Bereiche (S2L, S2R) aus dem Profil entfernt und danach
jeweils zu den naheliegenden oberen Regionen (S1L, S1R) hinzugefügt, so daß die obere
Region S1L' von
der naheliegenden oberen Region S1R' getrennt wird. Somit wird ein kompensiertes
Bild erhalten, in dem die naheliegenden numerischen Zeichen des
Originalbilds voneinander getrennt werden. Durch Ausführen des
Verfahrens zur Zeichentrennung der ersten Ausführungsform bei diesem kompensierten
Bild können
die rechteckigen Innenrahmen so angeordnet werden, daß jeder
der rechteckigen Rahmen in sich ein einzelnes numerisches Zeichen
umschließt.
Daher ist es möglich,
das Auftreten eines Nachteils zu vermeiden, der darin besteht, daß die naheliegenden
numerischen Zeichen, die aneinander gekoppelt sind, in einem einzelnen rechteckigen
Rahmen umschlossen sind, was zu einer Verringerung der Erkennungsgenauigkeit
führen könnte.
-
Die
Schwellenlinie L kann wie folgt bestimmt werden. Eine obere Region
des Profils wird zuerst in dem Fall herausgelöst, in dem die Schwellenlinie
auf eine Position „0" gesetzt wird. Danach
wird ein Längenverhältnis dieser
oberen Region mit einem vorbestimmten Wert verglichen, zum Beispiel
einem durchschnittlichen Längenverhältnis der
numerischen Zeichen, die zuvor in dem Back-Propagation-Netzwerk gespeichert
wurden. Wenn das Längenverhältnis der oberen
Region größer als
das durchschnittliche Längenverhältnis ist,
wird die Schwellenlinie verwendet. Wenn diese Bedingung jedoch nicht
erfüllt
ist, werden die oben angeführten
Vorgänge
wiederholt, indem die Position der Schwellenlinie geändert wird, um
die Schwellenlinie zu bestimmen, welche die oben genannte Bedingung
erfüllt.
Als Alternative kann eine durchschnittliche Breite in der horizontalen Richtung
der Zeichen anstatt des durchschnittlichen Längenverhältnisses verwendet werden.
-
Somit
ist es gemäß des Verfahrens
zur Zeichentrennung der vorliegenden Erfindung mit der Vorbehandlung
der zweiten Ausführungsform
möglich,
die Zeichen wie numerische Zeichen und Buchstaben genau und wirksam
zu erkennen, selbst aus einem Originalbild mit schlechter Qualität, zum Beispiel
wie in 15 gezeigt, in der einige der
Zeichen in mehrere Elemente (z. B. „8" und „9") aufgeteilt werden, unerwünschte Punkte
um die Zeichen herum angeordnet und einige der Zeichen aneinander
gekoppelt (z. B. „S" und „H") sind.
-
Dritte Ausführungsform
-
Diese
Ausführungsform
stellt eine Vorbehandlung bereit, die vorzugsweise vor dem Verfahren zur
Zeichentrennung durchgeführt
wird, zum Beispiel wenn ein zu erkennendes Originalbild eine Anordnung
von Zeichen enthält,
wie numerische Zeichen und Buchstaben, von denen jedes aus mehreren Punkten
zusammengesetzt ist, wie in 16A gezeigt.
Daher wird auf eine nochmalige Erklärung des Verfahrens zur Zeichentrennung
der ersten Ausführungsform,
das nach der Vorbehandlung durchgeführt wird, verzichtet.
-
In
dieser Vorbehandlung wird zuerst, wie in 16B gezeigt,
ein binäres
Bild des Originalbilds von 16A aufbereitet.
Danach wird jeder der Punkte der Zeichen in zwei Richtungen ausgedehnt, d.
h. in eine horizontale und eine vertikale Richtung des binären Bildes,
um ein kompensiertes Bild zu erhalten, wie in 16C gezeigt, wobei jeder der ausgedehnten Punkte
mit einem naheliegenden ausgedehnten Punkt verbunden wird. Diese
Ausdehnungsbehandlung kann durchgeführt werden, indem Pixel mit
dem Wert „0" um den jeweiligen
Punkt herum durch die Pixel mit dem Wert „1" in der bezeichneten Richtung des binären Bildes
ersetzt werden. In dem so erhaltenen kompensierten Bild setzt sich
jedes der Zeichen aus einem einzelnen Element zusammen.
-
Wenn
das Verfahren zur Zeichentrennung der vorliegenden Erfindung bei
dem Originalbild von 16A ausgeführt wird, besteht die Befürchtung, daß die Zeit,
die für
die Bilderkennung erforderlich ist, zunimmt, weil der rechteckige
Innenrahmen in bezug auf jeden der Punkte der Zeichen so angeordnet
ist, daß die
Gesamtzahl der rechteckigen Innenrahmen beträchtlich steigt. Außerdem kann
dies zu einer Verschlechterung der Erkennungsgenauigkeit führen. Wenn
jedoch das Verfahren zur Zeichentrennung der vorliegenden Erfindung
bei dem kompensierten Bild von 16C durchgeführt wird,
kann die Gesamtanzahl von rechteckigen Innenrahmen, die anzuordnen sind,
beträchtlich
reduziert werden, wie in 16D gezeigt.
Daher ist es möglich,
eine Verbesserung der Erkennungsgenauigkeit zu erreichen und die
für die Bilderkennung
erforderliche Zeit zu reduzieren. Nebenbei sei angemerkt, daß es einen
Fall gibt, in dem naheliegende Zeichen in diesem kompensierten Bild aneinander
gekoppelt sind. In einem solchen Fall kam die in der zweiten Ausführungsform
erläuterte Vorbehandlung
bei dem kompensierten Bild von 16C durchgeführt werden.
-
Vierte Ausführungsform
-
Diese
Ausführungsform
stellt eine Vorbehandlung bereit, die vorzugsweise vor dem Verfahren zur
Zeichentrennung der ersten Ausführungsform durchgeführt wird,
zum Beispiel wenn ein Kopplungsbereich zwischen naheliegenden Zeichen
in einem Originalbild, wie in 17A gezeigt,
viel größer ist als
im Fall des Originalbildes von 13A,
so daß es sein
kann, daß keine
ausreichende Erkennungsgenauigkeit durch die Vorbehandlung der zweiten Ausführungsform
erreicht wird. Daher wird auf eine nochmalige Erklärung des
Verfahrens zur Zeichentrennung der ersten Ausführungsform, das nach der Vorbehandlung
durchgeführt
wird, verzichtet.
-
In
dieser Ausführungsform
werden, wenn rechteckige Innenrahmen in einem in 17A gezeigten Originalbild angeordnet werden,
zwei naheliegende Zeichen („2" und „3" in 17A), die aneinander gekoppelt sind, in einem
einzelnen großen rechteckigen
Innenrahmen umschlossen. Danach wird dieser große rechteckige Innenrahmen
zwangsweise in mehrere Regionen aufgeteilt, von denen jede einen
vorbestimmten Bereich aufweist, um ein kompensiertes Bild zu erhalten.
Zum Beispiel wird der große
rechteckige Innenrahmen in mehrere kleine rechteckige Innenrahmen
aufgeteilt, so daß jeder der
kleinen rechteckigen Innenrahmen eine Seite aufweist, die im wesentlichen
gleich einer Hälfte
der Mindestbreite in der horizontalen und der vertikalen Richtung
der Zeichen ist, die zuvor in dem Back-Propagation-Netzwerk gespeichert wurden.
In 17C wird der einzelne große rechteckige Innenrahmen
in 16 (= 4 × 4)
kleine rechteckige Innenrahmen aufgeteilt.
-
Durch
das Ausführen
des Verfahrens zur Zeichentrennung der ersten Ausführungsform
bei dem erhaltenen kompensierten Bild ist es möglich, die Zeichen – wie numerische
Zeichen und Buchstaben – genau
und wirksam zu erkennen, wie in 17D gezeigt,
und dies sogar bei einem Originalbild (z. B. 17A)
mit schlechter Qualität,
bei dem der Kopplungsbereich zwischen den naheliegenden Zeichen relativ
groß ist.
Nebenbei sei angemerkt, daß – wenn der
Bereich des großen
rechteckigen Innenrahmens kleiner als ein vorbestimmter Wert ist,
zum Beispiel 1,2 Mal ein Durchschnittsbereich der Zeichen, die zuvor
in dem Back-Propagation-Netzwerk gespeichert wurden – vorzugsweise
das Verfahren zur Zeichentrennung der vorliegenden Erfindung ohne
diese Vorbehandlung durchgeführt
wird.
-
GEWERBLICHE
ANWENDBARKEIT
-
Gemäß der vorliegenden
Erfindung ist es möglich,
ein verlässliches
Verfahren zur Zeichentrennung zum Einsatz in der Erkennung bereitzustellen, selbst
wenn ein Originalbild nicht genau mit Hilfe einer herkömmlichen
Binarisierung oder Projektionsbehandlung erkannt werden kann, weil
das Originalbild Zeichen wie Buchstaben und numerische Zeichen aufweist,
die jeweils aus mehreren Elementen oder unerwünschten Punkten um die Zeichen
herum zusammengesetzt sind. Außerdem
besteht ein Vorteil darin, daß das
Problem einer verringerten Bilderkennung gelöst wird, zum Beispiel wenn
die zu erkennenden Zeichen einen Unterstrich aufweisen oder es schwierig
ist, die Zeichen von dem Hintergrund zu trennen, weil die Druckoberfläche eine
satinierte Oberfläche
ist. Ferner besteht ein weiterer Vorteil in der Milderung eines
Nachteils, der darin besteht, daß genaue Erkennungsergebnisse
nicht wirksam mit Erkennungsgenauigkeit erhalten werden können, wenn
das Originalbild Störungen
im Hintergrund und/oder Zeichen aufweist, die jeweils aus mehreren
Punkten zusammengesetzt sind, z. B. Buchstaben, die durch einen
Tintenstrahldrucker gedruckt werden.
-
Somit
wird eine breite Anwendung des Verfahrens zur Zeichentrennung zum
Einsatz in der Erkennung der vorliegenden Erfindung erwartet, da
es wirksam Zeichen genau erkennen kann, selbst bei einem Originalbild
mit schlechter Qualität.