DE3322443C2

DE3322443C2 -

Info

Publication number: DE3322443C2
Application number: DE3322443A
Authority: DE
Inventors: Yasuo Hino Tokio/Tokyo Jp Hongo
Original assignee: Fuji Electric Co Ltd
Current assignee: Fuji Electric Co Ltd
Priority date: 1982-06-28
Filing date: 1983-06-22
Publication date: 1992-12-10
Also published as: JPS59790A; JPH0467234B2; DE3322443A1; US4556985A

Description

Die Erfindung betrifft eine Mustererkennungsvorrichtung nach dem Oberbegriff des Patentanspruchs.

Anhand von Fig. 1 sei zunächst ein bekanntes Verfahren zur Mustererkennung beschrieben, das als "Matrix-Matching"- Verfahren bezeichnet wird.

Bei diesem Verfahren wird ein als Gewichtsmuster bezeichneter Merkmalssatz für jedes zu erkennende Zeichen festgelegt. Fig. 1 zeigt ein solches Gewichtsmuster für den Buchstaben "B". Ein den Buchstaben enthaltender Bereich wird in eine Vielzahl von Teilbereichen unterteilt, die gewichtet werden, wie dies durch die Zahlen dargestellt ist. Verschiedene Zeichen werden verschieden gewichtet. Durch Vergleich des Gewichtsmusters (Eingangsmuster) eines zu erkennenden Zeichens mit dem Gewichtsmuster eines Referenzzeichens kann daher jedes Zeichen erkannt werden.

Dieses bekannte Verfahren ist insofern nachteilig, als infolge einer gegenseitigen Positionsverschiebung zwischen dem Gewichtsmuster eines Referenzzeichens und dem des zu erkennenden Zeichens sowie infolge von Schwankungen der Breite von Zeichenstrichen das Ausmaß der Ausrichtung bzw. Übereinstimmung zwischen Zeichen variabel und instabil wird. Zur Vermeidung dieser Schwierigkeit ist ein Verfahren zur Zeichenerkennung unter Verwendung einer Formmatrix entwickelt worden (japanische Patentanmeldung 56-1 75 709 = JP-OS 58 78 273). Bei diesem Verfahren wird jedes Zeichen in 9×8 Teilbereiche aufgeteilt und eine Formmatrix für jedes Zeichen aufgrund der Entscheidung aufgestellt, ob ein Muster in einem jeweiligen Teilbereich "vorhanden" ist oder nicht. Die Zeichenerkennung wird durch Vergleich der Formmatrix mit einer Standardmatrix ausgeführt. Wenn jedoch ein gestempeltes Zeichen gelesen werden soll, kann die Formmatrix des Zeichens infolge eines Schnitts in der Oberfläche, auf die das Zeichen gestempelt ist, sowie infolge von Schmutz, etwa Ruß, auf der Oberfläche variieren, was die richtige Zeichenerkennung schwierig macht. Die 9×8-Formmatrix besitzt darüber hinaus den Nachteil, daß keine große Zahl von Zeichen (nicht mehr als 10) erkannt werden kann.

Aus der US 41 83 013 ist eine Einrichtung zum Gewinnen von Formelementen aus einem Bild bekannt. Mit Hilfe dieser Vorrichtung lassen sich Anzahl der Muster in einem Bild, Umfang, Flächengröße und dergleichen erkennen. Eine Bewertung eines Musters mit Hilfe beispielsweise einer Standardmatrix, wie sie oben erläutert wurde, erfolgt nicht.

Aus der US 36 18 016 ist ein Zeichenerkennungssystem bekannt, das mit einer Maske arbeitet. Ein abgetastetes Muster wird einer von mehreren Klassen zugeordnet. Die Abtastung des Musters erfolgt spaltenweise zur Erstellung einer Matrix, von der aus eine Verbindung zu einer logischen Kombinationsschaltung besteht. Für einzelne Zeichen sind Zähler vorhanden, die an die Kombinationsschaltung angeschlossen sind. Die Kombinationsschaltung arbeitet als Maske, um bestimmte Mustermerkmale zu erkennen. Falls diese Mustermerkmale erkannt werden, wird ein zugehöriger Zähler hochgezählt.

Eine Entscheidung, d. h. eine Musteridentifizierung, erfolgt dadurch, daß die einzelnen Zählerstände überprüft werden. Die Zähler werden nach der Abtastung und Maskierung gleichmäßig hochgezählt, und es wird festgestellt, welcher Zähler zuerst überläuft. Nur wenn ein einziger Zähler als erstes überläuft, wird das diesem Zähler zugeordnete Zeichen als das abgetastete Zeichen erkannt. Weitere, spezielle Unterscheidungskriterien werden nicht angewendet.

Aus der DE 27 46 969 A1 ist eine Vorrichtung zum Vergleichen von Mustern bekannt, die einen aus mehreren Bildelementen bestehenden Bildschirm abtastet, die abgetastete Information komprimiert und dann anhand der komprimierten Information einen Vergleich durchführt. Für jede zu erkennende Ziffer wird ein Soll-Rasterbild vorgegeben und dann mit einem Ist- Rasterbild verglichen. Sämtliche Rasterpunkte werden in Gruppen unterteilt, und für jedes zu erkennende Zeichen wird eine Soll-Anzahl von beispielsweise dunklen Punkten vorgegeben. Nach der Abtastung eines Bildes wird für jede Gruppe geprüft, ob Übereinstimmung oder annähernde Übereinstimmung mit dem Soll-Wert einer jeweiligen Gruppe besteht.

Aufgabe der Erfindung ist es, eine Vorrichtung der eingangs angegebenen Art zu schaffen, die ein hohes Erkennungsvermögen, das heißt eine hohe Rate richtiger Zeichenerkennung bei hoher Lesegeschwindigkeit, auch dann besitzt, wenn Zeichen in schlechtem Zustand gedruckt oder gestempelt sind.

Diese Aufgabe wird erfindungsgemäß durch eine Vorrichtung mit den Merkmalen des Patentanspruchs gelöst.

Die Erfindung wird nachfolgend anhand eines Ausführungsbeispiels unter Bezug auf die Zeichnung näher erläutert. Es zeigt

Fig. 1 eine Darstellung zur Erläuterung eines herkömmlichen Verfahrens zur Zeichenerkennung unter Verwendung eines Gewichtsmusters,

Fig. 2 ein Blockschaltbild einer Ausführungsform der Erfindung,

Fig. 3 das nach Binärumwandlung erhaltene Bild des Buchstabens "W",

Fig. 4 das Bild von Fig. 3 in segmentierter Form,

Fig. 5 eine Darstellung verschiedener Informationen von Merkmalen, die der Segmentinformation entnommen wurden,

Fig. 6 ein Blockschaltbild eines Merkmalsgenerators,

Fig. 7 eine Darstellung zur Erläuterung der Stricheinheitszahl der Segmente,

Fig. 8 eine Darstellung eines Registers für Stricheinheitszahlen,

Fig. 9 eine Darstellung des Zusammenhangs zwischen den Stricheinheitszahlen und den Stricheinheitsflächen eines Musters,

Fig. 10 eine Darstellung von Sätzen von Stricheinheitszahlen sowie von Stricheinheit- und Strichverbund-Dateien für das Muster von Fig. 9,

Fig. 11 ein Flußdiagramm eines Programms zur Erstellung der Stricheinheit-Datei,

Fig. 12 eine Flußdiagramm eines Programms zur Erstellung der Strichverbund-Datei,

Fig. 13 eine Darstellung zur Erläuterung der Art, in der ein Zeichenmuster definiert wird,

Fig. 14 ein quantisiertes Bild eines Zeichenmusters und einen um dieses gelegten Rahmen,

Fig. 15 eine Bitmatrix des quantisierten Bildes von Fig. 14 und

Fig. 16 eine Standardbitmatrix entsprechend dem Muster von Fig. 14.

Fig. 2 zeigt ein Blockschaltbild einer Ausführungsform der vorliegenden Erfindung. Darin ist mit 1 eine nachfolgend als Kamera bezeichnete Festkörperbildaufnahmevorrichtung in Form eines MOS-Transistors oder einer ladungsgekoppelten Einrichtung bezeichnet. 2 ist ein Binärumsetzer, 3 eine Schaltung zur Merkmalsextrahierung (nachfolgend Merkmalgenerator genannt), 4 ein Bilddatenspeicher (RAM1), 5 eine arithmetische Einheit, etwa ein Mikroprozessor, 6 ein Speicher in Form eines PROMs besonders zur Speicherung eines Programms, 7 ein Speicher (RAM2), der hauptsächlich der Speicherung von Daten dient, und 8 eine Entscheidungsausgabeeinheit.

Ein zu erkennendes Zeichen bzw. eine zu erkennende Figur wird mittels der Kamera 1 in horizontaler Richtung X und in vertikaler Richtung Y abgetastet. Die bei der horizontalen Abtastung erzeugten Videosignale werden von dem Binärumsetzer 2 mittels eines Schwellenwertes in Binärwerte umgesetzt. Das entsprechende binäre Bild ist schematisch in Fig. 3 gezeigt. Es sei angenommen, daß Bereiche, in denen Musterteile des Zeichens existieren, durch den logischen Wert "1" ausgedrückt werden und daß eine Reihe von logischen Werten "1", wo Zeichenmuster auf horizontalen Abtastlinien (Zeilen) liegen, "Segment" genannt wird. Das Zeichenmuster kann in Segmente SE₈₁, SE₈₂, SE_ÿ, SE_kl, . . . auf den Zeilen SC₈, SC₉, SC_i, SC_k, . . . unterteilt werden, wie dies in Fig. 4 gezeigt ist. Das Zeichenmuster kann daher durch ein Bündel bzw. eine Häufung solcher Segmente ausgedrückt werden. Damit erkannt werden kann, daß diese Segmente zum selben Zeichenmuster gehören, muß für jedes Segment ein Koordinatenvergleich durchgeführt werden. Wenn beispielsweise die Zeile SC₉ abgetastet wird, kann das Segment SE₉₁ auf der Zeile SC₉ als zum selben Muster wie das Segment SE₈₁ auf der vorhergehenden Zeile SC₈ gehörig betrachtet werden, wenn die Y-Koordinate des Segments auf der gegenwärtigen Zeile SC₉ sich um eins von der des Segments auf der vorangegangenen Zeile SC₈ unterscheidet und sich außerdem die X-Koordinaten der Segmente SE₈₁, SE₉₁ wenigstens teilweise überlappen. Zum klaren Verständnis des Vorangehenden soll jedes Segment im Hinblick auf eine Start-Information, eine sogenannte Joint-Information und eine sogenannte Connection-Information betrachtet werden. Die Start-Information wird einem Segment zugeordnet, das sich nicht mit irgendeinem Segment auf einer vorangehenden Zeile überlappt, also einem Segment, das auf der laufenden Zeile erstmalig erscheint. Die Segmente mit einer solchen Start-Information sind in Fig. 4 SE₈₁, SE₈₂ und SE_ÿ. Die Connection-Information kennzeichnet die Folge, in welcher die Segmente jeweils auf den Zeilen liegen. Die Joint-Information drückt den Grad der Überlappung von Segmenten aus und kennzeichnet zwei oder mehr Segmente auf einer vorangehenden Zeile, die auf der laufenden Zeile vereinigt sind. Solche Segmente, die mit Segmenten der Start-Information vereinigt oder verbunden sind, werden als zu denselben "Stricheinheiten" gehörig betrachtet. Den Segmenten SE₈₁, SE₈₂ und SE_ÿ sind die Stricheinheitzahlen 1, 2 bzw. 3 zugeordnet. Dem Segment SE_k+1 zum Beispiel, dem eine Joint-Information zugeordnet ist, wird dieselbe Stricheinheitzahl wie dem rechten Segment SE_k2 auf der vorhergehenden Zeile gegeben.

Die in Fig. 5 dargestellten Merkmale können den segmentierten Bilddaten entnommen werden. Fig. 5 zeigt bei (a) die Stricheinheitzahlen der Segmente, bei (b) die Koordinaten der rechten Enden der Segmente, bei (c) die Y- Koordianten (die Anzahl von Zeilen), bei (d) die Segmentlängen, bei (e) und (f) Sätze vereinigter Stricheinheitzahlen, bei (b) die Gesamtanzahl von Segmenten, bei (h) die Anzahl von Segmentvereinigungen und bei (i) die Anzahl von Stricheinheiten. Diese Merkmale sind im gezeigten Muster im Speicher 4 (Fig. 2) gespeichert. Die Segmentlänge A wird als (X_R-X_L+1) ausgedrückt, das heißt als Summe der Differenz zwischen der X-Koordinate X_R des rechten Endes und der X-Koordinate X_L des linken Endes einerseits und +1 andererseits. +1 wird deshalb hinzuaddiert, weil die Segmentlänge Null würde und dies unvorteilhaft wäre, wenn die Koordinaten des rechten Endes und des linken Endes gleich wären.

Fig. 6 zeigt in Blockform die Schaltung eines Merkmalgenerators, der die vorgenannten Merkmale extrahiert.

Der Merkmalgenerator umfaßt einen 3×3 lokalen Speicher 9 zur Speicherung der Binärsignale von drei Zeilen, das heißt der laufenden Zeile, der vorigen Zeile und der vorvorigen Zeile. Der Merkmalgenerator enthält ferner einen Detektor 10 zum Erfassen von Startsegmenten, einen Zähler 11 für die Stricheinheitzahl, ein Register 12 für die Stricheinheitzahl, einen Detektor 13 für das rechte Ende der Segmente, einen X-Koordinanten-Generator 14, einen Y-Koordinaten-Generator 15, einen Segmentlängenzähler 16, einen Detektor 17 zur Feststellung von Segmentvereinigungen, einen Zähler 18 zum Zählen solcher Vereinigungen und einen Zähler 19 zum Zählen der Anzahl der Segmente.

Die nach Bearbeitung durch den Binärumsetzer abgegebenen binären Videosignale werden dem Speicher 9 geliefert. Der Detektor 10 ermittelt anhand der Ausgabe vom Speicher 9 die Startsegmente, die vom Zähler 11 gezählt werden, welcher die auf den neuesten Stand gebrachte Stricheinheitzahl in das Register 12 einschreibt. Der Detektor 13 dient dazu, die Positionen der rechtsliegenden Endpunkte der Segmente zu erfassen. Zu einem mit der Erfassung eines rechten Endpunkts durch den Detektor 13 in zeitlicher Beziehung stehenden Zeitpunkt werden die Koordinaten X_R, Y vom Y-Koordinatengenerator 14 und vom Y-Koordinatengenerator 15 in den Speicher 4 (Fig. 2) eingeschrieben. Der Zähler 16 zählt die Bereiche, in denen das Binärsignal den logischen Wert "1" hat. Der Zählerstand des Zählers 16 wird als Segmentlänge A ausgegeben. Der Detektor 17 erfaßt anhand der Ausgabe vom Speicher 9 eine Segmentvereinigung und liefert dies an den Zähler 18, der die Anzahl N_TJ von Vereinigungen zählt, sowie außerdem an das Register 12 für die Stricheinheitzahl. Wenn das Register 12 eine solche Joint-Information erhält, gibt es Stricheinheit-Informationen E₁, E₂, die vereinigt sind, sowie für jede Stricheinheit-Information eine Stricheinheitzahl N_S aus. Der Zähler 19 zählt die vom Detektor 13 festgestellten rechten Endpunkte und gibt die Gesamtzahl N_TS an Segmenten ab.

Fig. 7 zeigt die Stricheinheitzahlen der Segmente und Fig. 8 den Inhalt des Registers 12 in Fig. 6 zur vorübergehenden Speicherung der Stricheinheitszahlen.

Wie unter Bezug auf die Fig. 4 und 5 beschrieben, wird der Buchstabe "W" in Segmente unterteilt, und die Segmente werden mit Stricheinheitzahlen numeriert, und zwar auf der Basis einerseits der Folge, in welcher die Segmente auf den Zeilen auftreten, und andererseits der Start-Information. Der Buchstabe "W" kann als eine Kombination von Segmenten angesehen werden, denen, wie in Fig. 7 gezeigt, die Stricheinheitzahlen "1", "2" und "3" zugewiesen sind. Es seien nun die Segmentfolge bzw. die Stricheinheitszahlen der Segmente auf den Zeilen SC₁₉ (Y=19) und SC₂₀ (Y=20) betrachtet. Die Stricheinheitzahlen auf der Zeile SC₁₉ sind 1, 3, 3 und 2, während diejenigen auf der Zeile SC₂₀ 3 und 2 sind. Diese Informationen werden im Register 12 in dem in Fig. 8 gezeigten Muster gespeichert. Durch Überprüfung des Inhalts dieses Registers können die Anzahl N_SS von Stricheinheiten sowie die Sätze miteinander vereinigter Stricheinheitszahlen E₁, E₂ gewonnen werden. Da ein Zeichenmuster als ein Bündel von Segmenten, denen Stricheinheitszahlen zugeordnet sind, aufgefaßt werden kann, können aus dem Zeichenmuster mittels des Merkmalgenerators Merkmale extrahiert werden. Die Merkmale jeglicher Zeichenmuster sind in dem Speicher 4 (Fig. 2) gespeichert, und die arithmetische Einheit 5 führt zur Erkennung des Zeichenmusters anhand der gespeicherten Merkmalsinformation und dem im Speicher 6 gespeicherten Programm vorgeschriebene arithmetische Operationen aus.

Beim vorangehenden Ausführungsbeispiel wurde die Erfindung unter Bezug auf ein einfaches Zeichenmuster beschrieben. Komplexe Zeichen- und Figurmuster können auf gleiche Weise verarbeitet werden. Eine solche Verarbeitung soll nachfolgend beschrieben werden.

Fig. 9 zeigt den Zusammenhang zwischen Stricheinheiten eines beliebigen Musters und den Stricheinheitszahlen. Bei einem zu erkennenden Muster einer komplexen Gestalt wie in Fig. 9 werden den Segmenten, wie dargestellt, auf der Basis der Start-Information in oben beschriebener Weise Stricheinheitzahlen 1 bis 18 zugeteilt. Die Bereiche der Stricheinheiten sind in Fig. 9 durch gestrichelte Linien klar abgegrenzt. Sätze von vereinigten Stricheinheitszahlen E₁, E₂, wie sie bei (a) in Fig. 10 gezeigt sind, können aus der Joint-Information jeder Stricheinheit bestimmt werden. Die Datei von E₁, E₂ wird zur Ableitung einer Datei von Stricheinheiten R_S, wie sie bei (b) in Fig. 10 gezeigt ist, und einer Datei von Strichverbunden (ein Verbund von Stricheinheiten) R_C, die bei (c) in Fig. 10 gezeigt ist, verwendet. Die Stricheinheit-Datei R_S wird durch Entfernung von sich gegenseitig überlappenden und redundanten Stricheinheitszahlen aus den Sätzen E₁, E₂ vereinigter Stricheinheitszahlen gewonnen. Fig. 11 zeigt ein Programm zur Bildung einer solchen Stricheinheit-Datei. Die Strichverbund- Datei R_C wird dadurch geschaffen, daß die Stricheinheit- Datei R_S so angeordnet wird, daß die Nummer eines jeweiligen Strichverbundes (entsprechend den Mustern der zu erkennenden Zeichen oder Figuren), bei denen es sich um eine Kombination vereinigter Stricheinheiten handelt, den Stricheinheiten zugeteilt wird. Dieser Prozeß wird entsprechend dem in Fig. 12 dargestellten Programm ausgeführt. Die Anzahl N_CS von Strichverbunden in Fig. 9, das heißt die Anzahl von Mustern ist "3". Die in den Fig. 11 und 12 gezeigten Programme sind in FORTRAN geschrieben, wobei das Sinnbild (▭) eine Operation bedeutet. X=Y bedeutet zum Beispiel, daß X durch Y zu ersetzen ist. Das Sinnbild (⇔) steht für eine Verzweigung. (≠) bedeutet "ungleich", und (<) bedeutet "größer als". Die Programmablaufpläne der Fig. 11 und 12 sind aus sich verständlich und brauchen daher nicht weiter verläutert zu werden. Mit E₁, E₂ sind Sätze von vereinigten Stricheinheiten bezeichnet. N_TJ ist die Anzahl der Vereinigungen. N_SS ist die Gesamtanzahl von Stricheinheiten. N_CS ist die Gesamtanzahl von Strichverbunden. F_T ist eine Zwischendatei, die zur Prüfung benutzt wird, ob die Stricheinheiten sich überlappen oder nicht. R_S ist eine Datei, deren Größe von der Gesamtanzahl N_SS der Stricheinheiten bestimmt wird. R_C ist eine Datei, deren Größe von der Gesamtanzahl N_CS von Strichverbunden benutzt wird, und i, j, k, l und m sind Laufzahlen für die Dateien. Die Dateien R_S, R_C werden vor Durchführung des Programms auf Null gesetzt. Die Fläche A_C, die Breite W_C, die Höhe H_C, das Maximum X und das Minimum Y der linken und rechten Endpunkte, die Koordinaten X_R, X_L, Y_T, Y_B des Maximums X und des Minimums Y und die zentralen Koordinaten X_C, Y_C hiervon können alle für jeden der Doppelstriche oder Muster bestimmt werden.

Der Prozeß der Erkennung des Zeichenmusters auf der Basis der beschriebenen Merkmale soll nun anhand der Fig. 13 bis 16 beschrieben werden.

Es werden zwei Wege betrachtet, ein Zeichenmuster zu definieren.

(1) Wenn ein Zeichenmuster lokal schmal oder abschnitten ist, wie bei einem eingeprägten oder gestempelten Zeichen, oder wenn infolge von Schnitten, Öl, Ruß oder anderem Schmutz kleine Störmuster gebildet werden können, wird das auf Schmutz oder einem Kratzer beruhende Muster entsprechend der Fläche, Breite oder Höhe entfernt und ein der Größe des Zeichens entsprechendes Muster von den verbleibenden Mustern gewonnen. Wenn das Zentrum P_C eines Musters entsprechend einer Zeichengröße gemäß Darstellung in Fig. 13 als Bezug dient, dann wird das Zeichenzentrum P_C auf der Basis des Abstands D_P zwischen dem Zeichenzentrum un dem Zentrum eines anderen Zeichens extrapoliert. Ein in einem Suchrahmen (mit einer Breite W_A und einer Höhe H_A) enthaltenes Zeichen vorgegebener Größe wird als Musterzeichen betrachtet. Das Zeichen "A" in Fig. 13 ist frei von Störmustern, während das Zeichen "B" durch ein Störmuster N_P beeinträchtigt ist. Wenn ein solches Störmuster N_P vorhanden ist, sollte der Zeichenrahmen auf einen Bereich mit einer oberen Grenze H_B für die Zeichenhöhe beschränkt werden und jeder Teil jenseits der Obergrenze vernachlässigt werden. Der Zeichenrahmen für ein einzelnes zu erkennendes Zeichenmuster kann allerdings nicht extrapoliert werden.

(2) Wenn ein Zeichenmuster klar ist und kein Störmuster vorhanden zu sein scheint, wird ein Muster in einem Zeichenrahmen, der durch eine Höhe H_U (obere Grenze), eine Höhe H_L (untere Grenze), eine Breite W_U (obere Grenze) und eine Breite W_L (untere Grenze) definiert ist, als ein Zeichenmuster bestimmt, anders ausgedrückt also ein Muster, das folgenden Bedingungen genügt:

W_L≦W_C≦W_U, H_L≦H_C≦H_U

wobei W_C und H_C die Breite und die Höhe des Zeichenmusters sind.

Ein Zeichenrahmen wird also definiert, um ein Zeichenmuster zu extrahieren. Fig. 14 zeigt das Zeichen "5" und einen Zeichenrahmen L, wo die Maximumkoordinaten X und Y und die Minimumkoordinaten X und Y X_FR, Y_FB bzw. X_FL, Y_FT sind. Obwohl das Zeichenmuster horizontal ausgerichtet dargestellt ist, spielt es keine Rolle, ob die Zeichenmuster horizontal oder vertikal liegen.

Der auf die vorgenannte Weise definierte Zeichenrahmen wird in X-Richtung in 24 Teilbereiche und in Y-Richtung in 12 Teilbereiche unterteilt. Wenn in einem Teilbereich ein Zeichenmuster vorhanden ist, wird dieser Teilbereich durch den logischen Wert "1" ausgedrückt, während der logische Wert "0" zur Kennzeichnung von Teilbereichen dient, in denen kein Zeichenmuster vorhanden ist. Die durch logische Werte ausgedrückten Teilbereiche sind als Matrix in Fig. 15 gezeigt und werden nachfolgend als Bitmatrix B bezeichnet. Die freien Teilbereiche in Fig. 15 stehen für den logischen Wert "0".

Jedes Zeichen wird vorher zur Bestimmung seiner Bitmatrix gemessen, und die Elemente der Bitmatrix werden in vier Arten von Bits oder Elementen in nachstehender Weise klassifiziert:

(a) Musterbit, ein Element das immer "1" ist;
(b) freies Bit, ein Element das immer "0" ist;
(c) Maskenbit, ein Element das zwischen "1" und "0" variabel ist und
(d) Deformationsbit, eine horizontale oder vertikale Kette von Bits, die in ihrer Gesamtheit als "1" bestimmt werden können, falls irgendeines dieser Bits "1" ist.

Fig. 16 zeigt ein Beispiel einer vorher für das Zeichen "5" gemessenen Bitmatrix. Die Bits sind durch Symbole gekennzeichnet. Die freien Bereiche kennzeichnen freie Bits, das Symbol (∆) Maskenbits und das Symbol (-) Deformationsbits. Die dargestellte Bitmatrix enthält kein Musterbit.

Die Bitmatrix B wird für alle zu erkennenden Zeichen- und Figurmuster gemessen, und die Elemente der Bitmatrix werden in die vier Bitgruppen klassifiziert, so daß für jedes Zeichen K eine Standardbitmatrix B und eine Maskenbitmatrix B definiert werden und außerdem ein Deformationsoperator D^K, der auf die gemessene Bitmatrix B einwirkt, definiert wird.

Ein Abstand D^K zwischen einem gegebenen Zeichen K und einem durch eine Bitmatrix B ausgedrückten unbekannten Zeichenmuster ist durch folgende Gleichung definiert:

In dem in Fig. 16 gezeigten Beispiel ist M=12 und N=24. Das Zeichen () bedeutet eine Exklusiv-ODER-Verknüpfung, und das Zeichen (∧) eine UND-Verknüpfung.

Der Abstand {D^K} wird für alle Zeichenmuster bestimmt und der kleinste Abstand D₁ sowie der zweitkleinste Abstand D₂ werden ermittelt. Im Fall eines Musters K₁ mit dem Minimum D₁ wird das unbekannte Muster als Muster K₁ bestimmt, wenn folgende Voraussetzungen erfüllt sind:

D₁ D_U (vorgegebener Wert)

D₂ - D₁ D_L (vorgegebener Wert)

Die vorgegebenen Werte D_U, D_L werden zum Zeichenlesen und zum Zeichenprüfen verschieden festgelegt.

Wie oben beschrieben, werden bei der vorliegenden Erfindung Anordnungen zur Stricheinheitverarbeitung und zur Strichverbundverarbeitung eingesetzt, so daß ein Zeichen ohne größere Beeinflussung durch Störmuster und durch Positionsverschiebung eines Eingangsmusters und somit einen Abstand zwischen Mustern definiert werden kann. Durch Einführung des Konzepts eines Deformationsoperators und einer Maskenbitmatrix kann ein Schutz gegen Schwankungen der Zeichendefinition infolge von Veränderungen der Breite von Zeichenstrichen und kleinen Störmustern erreicht werden. Der Zeichenerkennungsprozeß kann mit hoher Geschwindigkeit unter Verwendung eines Stricheinheit- und Strichverbund-Verarbeitungsalgorithmus durchgeführt werden.

Obwohl die vorliegende Erfindung in Anwendung auf das Erkennen von eingeprägten, gestempelten oder gedruckten Zeichen beschrieben wurde, ist sie auch anwendbar auf das Erkennen spezieller Symbole, etwa solcher auf einem Schreibmaschinentastenfeld.

Claims

Mustererkennungsvorrichtung, umfassend:
eine Einrichtung zur Bildung einer M×N-Bitmustermatrix B (i,j), die das Vorhandensein und die Gestalt eines abgetasteten unbekannten Musters in Unterzonen eines das Muster einschließenden Rahmens darstellt, sowie zur Festlegung der Mitte eines Musters und zur Erzeugung eines Rahmens bestimmter Größe, zentriert auf die Mitte des Musters, wobei jedes Bit innerhalb des Musters einen "Muster-Vorhanden-Wert" aufweist, wenn das abgetastete Muster zumindest teilweise in die zugehörige Unterzone fällt oder einen "Muster-Fehlt-Wert" aufweist, wenn das abgetastete Muster nicht in die zugehörige Unterzone fällt,
eine Einrichtung zum Vergleichen der Bitmustermatrix mit mehreren vorab ermittelten Bitmustermatrizen B (i,j) für mehrere bekannte Referenzmuster K, sowie zum Ausgeben eines Vergleichswertes D^K für jedes Referenzmuster K, wobei die Amplitude des Wertes D^K das Ausmaß der Übereinstimmung zwischen der Bitmustermatrix B (i,j) für das unbekannte Muster einerseits und die Bitmustermatrix B (i,j) für jedes Referenzmuster K gemäß folgender Formel repräsentiert: wobei D^K ein Deformationsmatrixoperator für das Referenzmuster K ist, welcher einen "Muster-Fehlt-Wert" in B (i,j) ersetzt durch einen "Muster-Vorhanden-Wert" für sämtliche Unterzonen-Bits innerhalb jeder Bitkette, wenn mindestens eines der Bits in der betreffenden, das gerade betrachtete Bit enthaltenden Bitkette einen "Muster-Vorhanden-Wert" aufweist,B (i,j) eine Maskenbitmatrix für das Referenzmuster K ist, die "Muster-Fehlt- Werte" in solchen Positionen enthält, die nicht wesentlich zur Unterscheidung des Musters K von anderen Mustern beitragen, so daß bei der Mustererkennung der Wert dieses direkt durch die Abtastung erhaltenen Bits ignoriert werden kann, undB (i,j) eine Standardbitmatrix für das Referenzmuster K ist, die "Muster-Vorhanden- Bits" an solchen Stellen enthält, an denen ein ideales Referenzmuster K mindestens teilweise die entsprechenden Unterzonen belegen würde, und die "Muster- Fehlt-Bits" dort enthält, wo ein ideales Referenzmuster K überhaupt nicht die entsprechenden Unterzonen belegen würde, und
eine Einrichtung zum Auswählen des niedrigsten und des zweitniedrigsten Vergleichswertes sowie zum Ausgeben eines Musteridentifizierungssignals, welches das unbekannte Muster als das Bezugsmuster identifiziert, welches dem niedrigsten Vergleichswert entspricht, falls dieser niedrigste Vergleichswert kleiner als ein erster voreingestellter Wert, und falls die Differenz zwischen dem niedrigsten und dem zweitniedrigsten Vergleichswert größer ist als ein zweiter vorbestimmter Wert, wobei die Vergleichswerte allgemein umgekehrt proportional zu dem Maß der Entsprechung zwischen dem Bitmatrixmuster und den Referenzmustermatrizen sind.