DE3322443C2 - - Google Patents

Info

Publication number
DE3322443C2
DE3322443C2 DE3322443A DE3322443A DE3322443C2 DE 3322443 C2 DE3322443 C2 DE 3322443C2 DE 3322443 A DE3322443 A DE 3322443A DE 3322443 A DE3322443 A DE 3322443A DE 3322443 C2 DE3322443 C2 DE 3322443C2
Authority
DE
Germany
Prior art keywords
pattern
bit
value
matrix
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE3322443A
Other languages
English (en)
Other versions
DE3322443A1 (de
Inventor
Yasuo Hino Tokio/Tokyo Jp Hongo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Original Assignee
Fuji Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd filed Critical Fuji Electric Co Ltd
Publication of DE3322443A1 publication Critical patent/DE3322443A1/de
Application granted granted Critical
Publication of DE3322443C2 publication Critical patent/DE3322443C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

Die Erfindung betrifft eine Mustererkennungsvorrichtung nach dem Oberbegriff des Patentanspruchs.
Anhand von Fig. 1 sei zunächst ein bekanntes Verfahren zur Mustererkennung beschrieben, das als "Matrix-Matching"- Verfahren bezeichnet wird.
Bei diesem Verfahren wird ein als Gewichtsmuster bezeichneter Merkmalssatz für jedes zu erkennende Zeichen festgelegt. Fig. 1 zeigt ein solches Gewichtsmuster für den Buchstaben "B". Ein den Buchstaben enthaltender Bereich wird in eine Vielzahl von Teilbereichen unterteilt, die gewichtet werden, wie dies durch die Zahlen dargestellt ist. Verschiedene Zeichen werden verschieden gewichtet. Durch Vergleich des Gewichtsmusters (Eingangsmuster) eines zu erkennenden Zeichens mit dem Gewichtsmuster eines Referenzzeichens kann daher jedes Zeichen erkannt werden.
Dieses bekannte Verfahren ist insofern nachteilig, als infolge einer gegenseitigen Positionsverschiebung zwischen dem Gewichtsmuster eines Referenzzeichens und dem des zu erkennenden Zeichens sowie infolge von Schwankungen der Breite von Zeichenstrichen das Ausmaß der Ausrichtung bzw. Übereinstimmung zwischen Zeichen variabel und instabil wird. Zur Vermeidung dieser Schwierigkeit ist ein Verfahren zur Zeichenerkennung unter Verwendung einer Formmatrix entwickelt worden (japanische Patentanmeldung 56-1 75 709 = JP-OS 58 78 273). Bei diesem Verfahren wird jedes Zeichen in 9×8 Teilbereiche aufgeteilt und eine Formmatrix für jedes Zeichen aufgrund der Entscheidung aufgestellt, ob ein Muster in einem jeweiligen Teilbereich "vorhanden" ist oder nicht. Die Zeichenerkennung wird durch Vergleich der Formmatrix mit einer Standardmatrix ausgeführt. Wenn jedoch ein gestempeltes Zeichen gelesen werden soll, kann die Formmatrix des Zeichens infolge eines Schnitts in der Oberfläche, auf die das Zeichen gestempelt ist, sowie infolge von Schmutz, etwa Ruß, auf der Oberfläche variieren, was die richtige Zeichenerkennung schwierig macht. Die 9×8-Formmatrix besitzt darüber hinaus den Nachteil, daß keine große Zahl von Zeichen (nicht mehr als 10) erkannt werden kann.
Aus der US 41 83 013 ist eine Einrichtung zum Gewinnen von Formelementen aus einem Bild bekannt. Mit Hilfe dieser Vorrichtung lassen sich Anzahl der Muster in einem Bild, Umfang, Flächengröße und dergleichen erkennen. Eine Bewertung eines Musters mit Hilfe beispielsweise einer Standardmatrix, wie sie oben erläutert wurde, erfolgt nicht.
Aus der US 36 18 016 ist ein Zeichenerkennungssystem bekannt, das mit einer Maske arbeitet. Ein abgetastetes Muster wird einer von mehreren Klassen zugeordnet. Die Abtastung des Musters erfolgt spaltenweise zur Erstellung einer Matrix, von der aus eine Verbindung zu einer logischen Kombinationsschaltung besteht. Für einzelne Zeichen sind Zähler vorhanden, die an die Kombinationsschaltung angeschlossen sind. Die Kombinationsschaltung arbeitet als Maske, um bestimmte Mustermerkmale zu erkennen. Falls diese Mustermerkmale erkannt werden, wird ein zugehöriger Zähler hochgezählt.
Eine Entscheidung, d. h. eine Musteridentifizierung, erfolgt dadurch, daß die einzelnen Zählerstände überprüft werden. Die Zähler werden nach der Abtastung und Maskierung gleichmäßig hochgezählt, und es wird festgestellt, welcher Zähler zuerst überläuft. Nur wenn ein einziger Zähler als erstes überläuft, wird das diesem Zähler zugeordnete Zeichen als das abgetastete Zeichen erkannt. Weitere, spezielle Unterscheidungskriterien werden nicht angewendet.
Aus der DE 27 46 969 A1 ist eine Vorrichtung zum Vergleichen von Mustern bekannt, die einen aus mehreren Bildelementen bestehenden Bildschirm abtastet, die abgetastete Information komprimiert und dann anhand der komprimierten Information einen Vergleich durchführt. Für jede zu erkennende Ziffer wird ein Soll-Rasterbild vorgegeben und dann mit einem Ist- Rasterbild verglichen. Sämtliche Rasterpunkte werden in Gruppen unterteilt, und für jedes zu erkennende Zeichen wird eine Soll-Anzahl von beispielsweise dunklen Punkten vorgegeben. Nach der Abtastung eines Bildes wird für jede Gruppe geprüft, ob Übereinstimmung oder annähernde Übereinstimmung mit dem Soll-Wert einer jeweiligen Gruppe besteht.
Aufgabe der Erfindung ist es, eine Vorrichtung der eingangs angegebenen Art zu schaffen, die ein hohes Erkennungsvermögen, das heißt eine hohe Rate richtiger Zeichenerkennung bei hoher Lesegeschwindigkeit, auch dann besitzt, wenn Zeichen in schlechtem Zustand gedruckt oder gestempelt sind.
Diese Aufgabe wird erfindungsgemäß durch eine Vorrichtung mit den Merkmalen des Patentanspruchs gelöst.
Die Erfindung wird nachfolgend anhand eines Ausführungsbeispiels unter Bezug auf die Zeichnung näher erläutert. Es zeigt
Fig. 1 eine Darstellung zur Erläuterung eines herkömmlichen Verfahrens zur Zeichenerkennung unter Verwendung eines Gewichtsmusters,
Fig. 2 ein Blockschaltbild einer Ausführungsform der Erfindung,
Fig. 3 das nach Binärumwandlung erhaltene Bild des Buchstabens "W",
Fig. 4 das Bild von Fig. 3 in segmentierter Form,
Fig. 5 eine Darstellung verschiedener Informationen von Merkmalen, die der Segmentinformation entnommen wurden,
Fig. 6 ein Blockschaltbild eines Merkmalsgenerators,
Fig. 7 eine Darstellung zur Erläuterung der Stricheinheitszahl der Segmente,
Fig. 8 eine Darstellung eines Registers für Stricheinheitszahlen,
Fig. 9 eine Darstellung des Zusammenhangs zwischen den Stricheinheitszahlen und den Stricheinheitsflächen eines Musters,
Fig. 10 eine Darstellung von Sätzen von Stricheinheitszahlen sowie von Stricheinheit- und Strichverbund-Dateien für das Muster von Fig. 9,
Fig. 11 ein Flußdiagramm eines Programms zur Erstellung der Stricheinheit-Datei,
Fig. 12 eine Flußdiagramm eines Programms zur Erstellung der Strichverbund-Datei,
Fig. 13 eine Darstellung zur Erläuterung der Art, in der ein Zeichenmuster definiert wird,
Fig. 14 ein quantisiertes Bild eines Zeichenmusters und einen um dieses gelegten Rahmen,
Fig. 15 eine Bitmatrix des quantisierten Bildes von Fig. 14 und
Fig. 16 eine Standardbitmatrix entsprechend dem Muster von Fig. 14.
Fig. 2 zeigt ein Blockschaltbild einer Ausführungsform der vorliegenden Erfindung. Darin ist mit 1 eine nachfolgend als Kamera bezeichnete Festkörperbildaufnahmevorrichtung in Form eines MOS-Transistors oder einer ladungsgekoppelten Einrichtung bezeichnet. 2 ist ein Binärumsetzer, 3 eine Schaltung zur Merkmalsextrahierung (nachfolgend Merkmalgenerator genannt), 4 ein Bilddatenspeicher (RAM1), 5 eine arithmetische Einheit, etwa ein Mikroprozessor, 6 ein Speicher in Form eines PROMs besonders zur Speicherung eines Programms, 7 ein Speicher (RAM2), der hauptsächlich der Speicherung von Daten dient, und 8 eine Entscheidungsausgabeeinheit.
Ein zu erkennendes Zeichen bzw. eine zu erkennende Figur wird mittels der Kamera 1 in horizontaler Richtung X und in vertikaler Richtung Y abgetastet. Die bei der horizontalen Abtastung erzeugten Videosignale werden von dem Binärumsetzer 2 mittels eines Schwellenwertes in Binärwerte umgesetzt. Das entsprechende binäre Bild ist schematisch in Fig. 3 gezeigt. Es sei angenommen, daß Bereiche, in denen Musterteile des Zeichens existieren, durch den logischen Wert "1" ausgedrückt werden und daß eine Reihe von logischen Werten "1", wo Zeichenmuster auf horizontalen Abtastlinien (Zeilen) liegen, "Segment" genannt wird. Das Zeichenmuster kann in Segmente SE₈₁, SE₈₂, SEÿ, SEkl, . . . auf den Zeilen SC₈, SC₉, SCi, SCk, . . . unterteilt werden, wie dies in Fig. 4 gezeigt ist. Das Zeichenmuster kann daher durch ein Bündel bzw. eine Häufung solcher Segmente ausgedrückt werden. Damit erkannt werden kann, daß diese Segmente zum selben Zeichenmuster gehören, muß für jedes Segment ein Koordinatenvergleich durchgeführt werden. Wenn beispielsweise die Zeile SC₉ abgetastet wird, kann das Segment SE₉₁ auf der Zeile SC₉ als zum selben Muster wie das Segment SE₈₁ auf der vorhergehenden Zeile SC₈ gehörig betrachtet werden, wenn die Y-Koordinate des Segments auf der gegenwärtigen Zeile SC₉ sich um eins von der des Segments auf der vorangegangenen Zeile SC₈ unterscheidet und sich außerdem die X-Koordinaten der Segmente SE₈₁, SE₉₁ wenigstens teilweise überlappen. Zum klaren Verständnis des Vorangehenden soll jedes Segment im Hinblick auf eine Start-Information, eine sogenannte Joint-Information und eine sogenannte Connection-Information betrachtet werden. Die Start-Information wird einem Segment zugeordnet, das sich nicht mit irgendeinem Segment auf einer vorangehenden Zeile überlappt, also einem Segment, das auf der laufenden Zeile erstmalig erscheint. Die Segmente mit einer solchen Start-Information sind in Fig. 4 SE₈₁, SE₈₂ und SEÿ. Die Connection-Information kennzeichnet die Folge, in welcher die Segmente jeweils auf den Zeilen liegen. Die Joint-Information drückt den Grad der Überlappung von Segmenten aus und kennzeichnet zwei oder mehr Segmente auf einer vorangehenden Zeile, die auf der laufenden Zeile vereinigt sind. Solche Segmente, die mit Segmenten der Start-Information vereinigt oder verbunden sind, werden als zu denselben "Stricheinheiten" gehörig betrachtet. Den Segmenten SE₈₁, SE₈₂ und SEÿ sind die Stricheinheitzahlen 1, 2 bzw. 3 zugeordnet. Dem Segment SEk+1 zum Beispiel, dem eine Joint-Information zugeordnet ist, wird dieselbe Stricheinheitzahl wie dem rechten Segment SEk2 auf der vorhergehenden Zeile gegeben.
Die in Fig. 5 dargestellten Merkmale können den segmentierten Bilddaten entnommen werden. Fig. 5 zeigt bei (a) die Stricheinheitzahlen der Segmente, bei (b) die Koordinaten der rechten Enden der Segmente, bei (c) die Y- Koordianten (die Anzahl von Zeilen), bei (d) die Segmentlängen, bei (e) und (f) Sätze vereinigter Stricheinheitzahlen, bei (b) die Gesamtanzahl von Segmenten, bei (h) die Anzahl von Segmentvereinigungen und bei (i) die Anzahl von Stricheinheiten. Diese Merkmale sind im gezeigten Muster im Speicher 4 (Fig. 2) gespeichert. Die Segmentlänge A wird als (XR-XL+1) ausgedrückt, das heißt als Summe der Differenz zwischen der X-Koordinate XR des rechten Endes und der X-Koordinate XL des linken Endes einerseits und +1 andererseits. +1 wird deshalb hinzuaddiert, weil die Segmentlänge Null würde und dies unvorteilhaft wäre, wenn die Koordinaten des rechten Endes und des linken Endes gleich wären.
Fig. 6 zeigt in Blockform die Schaltung eines Merkmalgenerators, der die vorgenannten Merkmale extrahiert.
Der Merkmalgenerator umfaßt einen 3×3 lokalen Speicher 9 zur Speicherung der Binärsignale von drei Zeilen, das heißt der laufenden Zeile, der vorigen Zeile und der vorvorigen Zeile. Der Merkmalgenerator enthält ferner einen Detektor 10 zum Erfassen von Startsegmenten, einen Zähler 11 für die Stricheinheitzahl, ein Register 12 für die Stricheinheitzahl, einen Detektor 13 für das rechte Ende der Segmente, einen X-Koordinanten-Generator 14, einen Y-Koordinaten-Generator 15, einen Segmentlängenzähler 16, einen Detektor 17 zur Feststellung von Segmentvereinigungen, einen Zähler 18 zum Zählen solcher Vereinigungen und einen Zähler 19 zum Zählen der Anzahl der Segmente.
Die nach Bearbeitung durch den Binärumsetzer abgegebenen binären Videosignale werden dem Speicher 9 geliefert. Der Detektor 10 ermittelt anhand der Ausgabe vom Speicher 9 die Startsegmente, die vom Zähler 11 gezählt werden, welcher die auf den neuesten Stand gebrachte Stricheinheitzahl in das Register 12 einschreibt. Der Detektor 13 dient dazu, die Positionen der rechtsliegenden Endpunkte der Segmente zu erfassen. Zu einem mit der Erfassung eines rechten Endpunkts durch den Detektor 13 in zeitlicher Beziehung stehenden Zeitpunkt werden die Koordinaten XR, Y vom Y-Koordinatengenerator 14 und vom Y-Koordinatengenerator 15 in den Speicher 4 (Fig. 2) eingeschrieben. Der Zähler 16 zählt die Bereiche, in denen das Binärsignal den logischen Wert "1" hat. Der Zählerstand des Zählers 16 wird als Segmentlänge A ausgegeben. Der Detektor 17 erfaßt anhand der Ausgabe vom Speicher 9 eine Segmentvereinigung und liefert dies an den Zähler 18, der die Anzahl NTJ von Vereinigungen zählt, sowie außerdem an das Register 12 für die Stricheinheitzahl. Wenn das Register 12 eine solche Joint-Information erhält, gibt es Stricheinheit-Informationen E₁, E₂, die vereinigt sind, sowie für jede Stricheinheit-Information eine Stricheinheitzahl NS aus. Der Zähler 19 zählt die vom Detektor 13 festgestellten rechten Endpunkte und gibt die Gesamtzahl NTS an Segmenten ab.
Fig. 7 zeigt die Stricheinheitzahlen der Segmente und Fig. 8 den Inhalt des Registers 12 in Fig. 6 zur vorübergehenden Speicherung der Stricheinheitszahlen.
Wie unter Bezug auf die Fig. 4 und 5 beschrieben, wird der Buchstabe "W" in Segmente unterteilt, und die Segmente werden mit Stricheinheitzahlen numeriert, und zwar auf der Basis einerseits der Folge, in welcher die Segmente auf den Zeilen auftreten, und andererseits der Start-Information. Der Buchstabe "W" kann als eine Kombination von Segmenten angesehen werden, denen, wie in Fig. 7 gezeigt, die Stricheinheitzahlen "1", "2" und "3" zugewiesen sind. Es seien nun die Segmentfolge bzw. die Stricheinheitszahlen der Segmente auf den Zeilen SC₁₉ (Y=19) und SC₂₀ (Y=20) betrachtet. Die Stricheinheitzahlen auf der Zeile SC₁₉ sind 1, 3, 3 und 2, während diejenigen auf der Zeile SC₂₀ 3 und 2 sind. Diese Informationen werden im Register 12 in dem in Fig. 8 gezeigten Muster gespeichert. Durch Überprüfung des Inhalts dieses Registers können die Anzahl NSS von Stricheinheiten sowie die Sätze miteinander vereinigter Stricheinheitszahlen E₁, E₂ gewonnen werden. Da ein Zeichenmuster als ein Bündel von Segmenten, denen Stricheinheitszahlen zugeordnet sind, aufgefaßt werden kann, können aus dem Zeichenmuster mittels des Merkmalgenerators Merkmale extrahiert werden. Die Merkmale jeglicher Zeichenmuster sind in dem Speicher 4 (Fig. 2) gespeichert, und die arithmetische Einheit 5 führt zur Erkennung des Zeichenmusters anhand der gespeicherten Merkmalsinformation und dem im Speicher 6 gespeicherten Programm vorgeschriebene arithmetische Operationen aus.
Beim vorangehenden Ausführungsbeispiel wurde die Erfindung unter Bezug auf ein einfaches Zeichenmuster beschrieben. Komplexe Zeichen- und Figurmuster können auf gleiche Weise verarbeitet werden. Eine solche Verarbeitung soll nachfolgend beschrieben werden.
Fig. 9 zeigt den Zusammenhang zwischen Stricheinheiten eines beliebigen Musters und den Stricheinheitszahlen. Bei einem zu erkennenden Muster einer komplexen Gestalt wie in Fig. 9 werden den Segmenten, wie dargestellt, auf der Basis der Start-Information in oben beschriebener Weise Stricheinheitzahlen 1 bis 18 zugeteilt. Die Bereiche der Stricheinheiten sind in Fig. 9 durch gestrichelte Linien klar abgegrenzt. Sätze von vereinigten Stricheinheitszahlen E₁, E₂, wie sie bei (a) in Fig. 10 gezeigt sind, können aus der Joint-Information jeder Stricheinheit bestimmt werden. Die Datei von E₁, E₂ wird zur Ableitung einer Datei von Stricheinheiten RS, wie sie bei (b) in Fig. 10 gezeigt ist, und einer Datei von Strichverbunden (ein Verbund von Stricheinheiten) RC, die bei (c) in Fig. 10 gezeigt ist, verwendet. Die Stricheinheit-Datei RS wird durch Entfernung von sich gegenseitig überlappenden und redundanten Stricheinheitszahlen aus den Sätzen E₁, E₂ vereinigter Stricheinheitszahlen gewonnen. Fig. 11 zeigt ein Programm zur Bildung einer solchen Stricheinheit-Datei. Die Strichverbund- Datei RC wird dadurch geschaffen, daß die Stricheinheit- Datei RS so angeordnet wird, daß die Nummer eines jeweiligen Strichverbundes (entsprechend den Mustern der zu erkennenden Zeichen oder Figuren), bei denen es sich um eine Kombination vereinigter Stricheinheiten handelt, den Stricheinheiten zugeteilt wird. Dieser Prozeß wird entsprechend dem in Fig. 12 dargestellten Programm ausgeführt. Die Anzahl NCS von Strichverbunden in Fig. 9, das heißt die Anzahl von Mustern ist "3". Die in den Fig. 11 und 12 gezeigten Programme sind in FORTRAN geschrieben, wobei das Sinnbild (▭) eine Operation bedeutet. X=Y bedeutet zum Beispiel, daß X durch Y zu ersetzen ist. Das Sinnbild (⇔) steht für eine Verzweigung. (≠) bedeutet "ungleich", und (<) bedeutet "größer als". Die Programmablaufpläne der Fig. 11 und 12 sind aus sich verständlich und brauchen daher nicht weiter verläutert zu werden. Mit E₁, E₂ sind Sätze von vereinigten Stricheinheiten bezeichnet. NTJ ist die Anzahl der Vereinigungen. NSS ist die Gesamtanzahl von Stricheinheiten. NCS ist die Gesamtanzahl von Strichverbunden. FT ist eine Zwischendatei, die zur Prüfung benutzt wird, ob die Stricheinheiten sich überlappen oder nicht. RS ist eine Datei, deren Größe von der Gesamtanzahl NSS der Stricheinheiten bestimmt wird. RC ist eine Datei, deren Größe von der Gesamtanzahl NCS von Strichverbunden benutzt wird, und i, j, k, l und m sind Laufzahlen für die Dateien. Die Dateien RS, RC werden vor Durchführung des Programms auf Null gesetzt. Die Fläche AC, die Breite WC, die Höhe HC, das Maximum X und das Minimum Y der linken und rechten Endpunkte, die Koordinaten XR, XL, YT, YB des Maximums X und des Minimums Y und die zentralen Koordinaten XC, YC hiervon können alle für jeden der Doppelstriche oder Muster bestimmt werden.
Der Prozeß der Erkennung des Zeichenmusters auf der Basis der beschriebenen Merkmale soll nun anhand der Fig. 13 bis 16 beschrieben werden.
Es werden zwei Wege betrachtet, ein Zeichenmuster zu definieren.
(1) Wenn ein Zeichenmuster lokal schmal oder abschnitten ist, wie bei einem eingeprägten oder gestempelten Zeichen, oder wenn infolge von Schnitten, Öl, Ruß oder anderem Schmutz kleine Störmuster gebildet werden können, wird das auf Schmutz oder einem Kratzer beruhende Muster entsprechend der Fläche, Breite oder Höhe entfernt und ein der Größe des Zeichens entsprechendes Muster von den verbleibenden Mustern gewonnen. Wenn das Zentrum PC eines Musters entsprechend einer Zeichengröße gemäß Darstellung in Fig. 13 als Bezug dient, dann wird das Zeichenzentrum PC auf der Basis des Abstands DP zwischen dem Zeichenzentrum un dem Zentrum eines anderen Zeichens extrapoliert. Ein in einem Suchrahmen (mit einer Breite WA und einer Höhe HA) enthaltenes Zeichen vorgegebener Größe wird als Musterzeichen betrachtet. Das Zeichen "A" in Fig. 13 ist frei von Störmustern, während das Zeichen "B" durch ein Störmuster NP beeinträchtigt ist. Wenn ein solches Störmuster NP vorhanden ist, sollte der Zeichenrahmen auf einen Bereich mit einer oberen Grenze HB für die Zeichenhöhe beschränkt werden und jeder Teil jenseits der Obergrenze vernachlässigt werden. Der Zeichenrahmen für ein einzelnes zu erkennendes Zeichenmuster kann allerdings nicht extrapoliert werden.
(2) Wenn ein Zeichenmuster klar ist und kein Störmuster vorhanden zu sein scheint, wird ein Muster in einem Zeichenrahmen, der durch eine Höhe HU (obere Grenze), eine Höhe HL (untere Grenze), eine Breite WU (obere Grenze) und eine Breite WL (untere Grenze) definiert ist, als ein Zeichenmuster bestimmt, anders ausgedrückt also ein Muster, das folgenden Bedingungen genügt:
WL≦WC≦WU, HL≦HC≦HU
wobei WC und HC die Breite und die Höhe des Zeichenmusters sind.
Ein Zeichenrahmen wird also definiert, um ein Zeichenmuster zu extrahieren. Fig. 14 zeigt das Zeichen "5" und einen Zeichenrahmen L, wo die Maximumkoordinaten X und Y und die Minimumkoordinaten X und Y XFR, YFB bzw. XFL, YFT sind. Obwohl das Zeichenmuster horizontal ausgerichtet dargestellt ist, spielt es keine Rolle, ob die Zeichenmuster horizontal oder vertikal liegen.
Der auf die vorgenannte Weise definierte Zeichenrahmen wird in X-Richtung in 24 Teilbereiche und in Y-Richtung in 12 Teilbereiche unterteilt. Wenn in einem Teilbereich ein Zeichenmuster vorhanden ist, wird dieser Teilbereich durch den logischen Wert "1" ausgedrückt, während der logische Wert "0" zur Kennzeichnung von Teilbereichen dient, in denen kein Zeichenmuster vorhanden ist. Die durch logische Werte ausgedrückten Teilbereiche sind als Matrix in Fig. 15 gezeigt und werden nachfolgend als Bitmatrix B bezeichnet. Die freien Teilbereiche in Fig. 15 stehen für den logischen Wert "0".
Jedes Zeichen wird vorher zur Bestimmung seiner Bitmatrix gemessen, und die Elemente der Bitmatrix werden in vier Arten von Bits oder Elementen in nachstehender Weise klassifiziert:
  • (a) Musterbit, ein Element das immer "1" ist;
  • (b) freies Bit, ein Element das immer "0" ist;
  • (c) Maskenbit, ein Element das zwischen "1" und "0" variabel ist und
  • (d) Deformationsbit, eine horizontale oder vertikale Kette von Bits, die in ihrer Gesamtheit als "1" bestimmt werden können, falls irgendeines dieser Bits "1" ist.
Fig. 16 zeigt ein Beispiel einer vorher für das Zeichen "5" gemessenen Bitmatrix. Die Bits sind durch Symbole gekennzeichnet. Die freien Bereiche kennzeichnen freie Bits, das Symbol (∆) Maskenbits und das Symbol (-) Deformationsbits. Die dargestellte Bitmatrix enthält kein Musterbit.
Die Bitmatrix B wird für alle zu erkennenden Zeichen- und Figurmuster gemessen, und die Elemente der Bitmatrix werden in die vier Bitgruppen klassifiziert, so daß für jedes Zeichen K eine Standardbitmatrix B und eine Maskenbitmatrix B definiert werden und außerdem ein Deformationsoperator DK, der auf die gemessene Bitmatrix B einwirkt, definiert wird.
Ein Abstand DK zwischen einem gegebenen Zeichen K und einem durch eine Bitmatrix B ausgedrückten unbekannten Zeichenmuster ist durch folgende Gleichung definiert:
In dem in Fig. 16 gezeigten Beispiel ist M=12 und N=24. Das Zeichen () bedeutet eine Exklusiv-ODER-Verknüpfung, und das Zeichen (∧) eine UND-Verknüpfung.
Der Abstand {DK} wird für alle Zeichenmuster bestimmt und der kleinste Abstand D₁ sowie der zweitkleinste Abstand D₂ werden ermittelt. Im Fall eines Musters K₁ mit dem Minimum D₁ wird das unbekannte Muster als Muster K₁ bestimmt, wenn folgende Voraussetzungen erfüllt sind:
D₁ DU (vorgegebener Wert)
D₂ - D₁ DL (vorgegebener Wert)
Die vorgegebenen Werte DU, DL werden zum Zeichenlesen und zum Zeichenprüfen verschieden festgelegt.
Wie oben beschrieben, werden bei der vorliegenden Erfindung Anordnungen zur Stricheinheitverarbeitung und zur Strichverbundverarbeitung eingesetzt, so daß ein Zeichen ohne größere Beeinflussung durch Störmuster und durch Positionsverschiebung eines Eingangsmusters und somit einen Abstand zwischen Mustern definiert werden kann. Durch Einführung des Konzepts eines Deformationsoperators und einer Maskenbitmatrix kann ein Schutz gegen Schwankungen der Zeichendefinition infolge von Veränderungen der Breite von Zeichenstrichen und kleinen Störmustern erreicht werden. Der Zeichenerkennungsprozeß kann mit hoher Geschwindigkeit unter Verwendung eines Stricheinheit- und Strichverbund-Verarbeitungsalgorithmus durchgeführt werden.
Obwohl die vorliegende Erfindung in Anwendung auf das Erkennen von eingeprägten, gestempelten oder gedruckten Zeichen beschrieben wurde, ist sie auch anwendbar auf das Erkennen spezieller Symbole, etwa solcher auf einem Schreibmaschinentastenfeld.

Claims (1)

  1. Mustererkennungsvorrichtung, umfassend:
    eine Einrichtung zur Bildung einer M×N-Bitmustermatrix B (i,j), die das Vorhandensein und die Gestalt eines abgetasteten unbekannten Musters in Unterzonen eines das Muster einschließenden Rahmens darstellt, sowie zur Festlegung der Mitte eines Musters und zur Erzeugung eines Rahmens bestimmter Größe, zentriert auf die Mitte des Musters, wobei jedes Bit innerhalb des Musters einen "Muster-Vorhanden-Wert" aufweist, wenn das abgetastete Muster zumindest teilweise in die zugehörige Unterzone fällt oder einen "Muster-Fehlt-Wert" aufweist, wenn das abgetastete Muster nicht in die zugehörige Unterzone fällt,
    eine Einrichtung zum Vergleichen der Bitmustermatrix mit mehreren vorab ermittelten Bitmustermatrizen B (i,j) für mehrere bekannte Referenzmuster K, sowie zum Ausgeben eines Vergleichswertes DK für jedes Referenzmuster K, wobei die Amplitude des Wertes DK das Ausmaß der Übereinstimmung zwischen der Bitmustermatrix B (i,j) für das unbekannte Muster einerseits und die Bitmustermatrix B (i,j) für jedes Referenzmuster K gemäß folgender Formel repräsentiert: wobei DK ein Deformationsmatrixoperator für das Referenzmuster K ist, welcher einen "Muster-Fehlt-Wert" in B (i,j) ersetzt durch einen "Muster-Vorhanden-Wert" für sämtliche Unterzonen-Bits innerhalb jeder Bitkette, wenn mindestens eines der Bits in der betreffenden, das gerade betrachtete Bit enthaltenden Bitkette einen "Muster-Vorhanden-Wert" aufweist,B (i,j) eine Maskenbitmatrix für das Referenzmuster K ist, die "Muster-Fehlt- Werte" in solchen Positionen enthält, die nicht wesentlich zur Unterscheidung des Musters K von anderen Mustern beitragen, so daß bei der Mustererkennung der Wert dieses direkt durch die Abtastung erhaltenen Bits ignoriert werden kann, undB (i,j) eine Standardbitmatrix für das Referenzmuster K ist, die "Muster-Vorhanden- Bits" an solchen Stellen enthält, an denen ein ideales Referenzmuster K mindestens teilweise die entsprechenden Unterzonen belegen würde, und die "Muster- Fehlt-Bits" dort enthält, wo ein ideales Referenzmuster K überhaupt nicht die entsprechenden Unterzonen belegen würde, und
    eine Einrichtung zum Auswählen des niedrigsten und des zweitniedrigsten Vergleichswertes sowie zum Ausgeben eines Musteridentifizierungssignals, welches das unbekannte Muster als das Bezugsmuster identifiziert, welches dem niedrigsten Vergleichswert entspricht, falls dieser niedrigste Vergleichswert kleiner als ein erster voreingestellter Wert, und falls die Differenz zwischen dem niedrigsten und dem zweitniedrigsten Vergleichswert größer ist als ein zweiter vorbestimmter Wert, wobei die Vergleichswerte allgemein umgekehrt proportional zu dem Maß der Entsprechung zwischen dem Bitmatrixmuster und den Referenzmustermatrizen sind.
DE19833322443 1982-06-28 1983-06-22 Mustererkennungsvorrichtung Granted DE3322443A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57109746A JPS59790A (ja) 1982-06-28 1982-06-28 パタ−ン識別装置

Publications (2)

Publication Number Publication Date
DE3322443A1 DE3322443A1 (de) 1983-12-29
DE3322443C2 true DE3322443C2 (de) 1992-12-10

Family

ID=14518193

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19833322443 Granted DE3322443A1 (de) 1982-06-28 1983-06-22 Mustererkennungsvorrichtung

Country Status (3)

Country Link
US (1) US4556985A (de)
JP (1) JPS59790A (de)
DE (1) DE3322443A1 (de)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6033675A (ja) * 1983-08-04 1985-02-21 Fuji Electric Co Ltd 文字読取装置
JPS60204086A (ja) * 1984-03-28 1985-10-15 Fuji Electric Co Ltd 物体識別装置
US4610025A (en) * 1984-06-22 1986-09-02 Champollion Incorporated Cryptographic analysis system
KR900001696B1 (ko) * 1984-11-09 1990-03-19 가부시기가이샤 히다찌세이사꾸쇼 화상처리장치의 제어방법
JPS61145690A (ja) * 1984-12-19 1986-07-03 Matsushita Electric Ind Co Ltd 顔の特徴部分の認識装置
JPS61208185A (ja) * 1985-03-12 1986-09-16 Matsushita Electric Ind Co Ltd 顔の特徴部分の認識装置
EP0204516A3 (de) * 1985-06-04 1990-01-31 Adept Technology, Inc. Sichtanlage zum Unterscheiden sich berührender Teile
JPH0715703B2 (ja) * 1986-05-16 1995-02-22 富士電機株式会社 文字読取方式
JPS6332386A (ja) * 1986-07-25 1988-02-12 Honda Denshi Giken:Kk 超音波を用いた物体感知装置
US5159474A (en) * 1986-10-17 1992-10-27 E. I. Du Pont De Nemours And Company Transform optical processing system
US5078501A (en) * 1986-10-17 1992-01-07 E. I. Du Pont De Nemours And Company Method and apparatus for optically evaluating the conformance of unknown objects to predetermined characteristics
JPS63109386A (ja) * 1986-10-28 1988-05-14 Honda Denshi Giken:Kk 超音波センサの温度補償方法
US5020112A (en) * 1989-10-31 1991-05-28 At&T Bell Laboratories Image recognition method using two-dimensional stochastic grammars
US6320977B1 (en) * 1990-04-04 2001-11-20 Matsushita Electric Industrial Co., Ltd Method and apparatus for positional detection using pattern matching process
US5367578A (en) * 1991-09-18 1994-11-22 Ncr Corporation System and method for optical recognition of bar-coded characters using template matching
DE4312010A1 (de) * 1993-04-13 1994-10-20 Henkel Kgaa Enzymatisches Waschmittel
US5530652A (en) * 1993-08-11 1996-06-25 Levi Strauss & Co. Automatic garment inspection and measurement system
DE69410191T2 (de) * 1993-08-26 1998-09-24 Canon Kk Auf Übergangspegeldaten basierte OCR-Klassifikation
US5774586A (en) * 1994-05-04 1998-06-30 Ncr Corporation Method and apparatus for standardization of inputs to word recognition systems
US6094506A (en) * 1995-10-25 2000-07-25 Microsoft Corporation Automatic generation of probability tables for handwriting recognition systems
JP3333721B2 (ja) * 1997-09-05 2002-10-15 技術研究組合医療福祉機器研究所 領域検出装置
US6185332B1 (en) * 1999-04-22 2001-02-06 Faxtrieve, Inc. Character recognition technique
US20050094861A1 (en) * 2003-10-31 2005-05-05 International Business Machines Corporation Positional synchronization in a multivoting character recognition environment
US8768895B2 (en) * 2007-04-11 2014-07-01 Emc Corporation Subsegmenting for efficient storage, resemblance determination, and transmission

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3178688A (en) * 1962-12-20 1965-04-13 Control Data Corp Character recognition by feature selection
US3601802A (en) * 1966-09-09 1971-08-24 Kokusai Denshin Denwa Co Ltd Pattern matching character recognition system
USB618016I5 (de) * 1968-11-29
US3576534A (en) * 1969-08-11 1971-04-27 Compuscan Inc Image cross correlator
JPS48102926A (de) * 1972-04-07 1973-12-24
JPS5911152B2 (ja) * 1976-10-19 1984-03-13 肇産業株式会社 パタ−ンマツチング方法及びその実施装置
US4183013A (en) * 1976-11-29 1980-01-08 Coulter Electronics, Inc. System for extracting shape features from an image
US4110737A (en) * 1977-08-22 1978-08-29 The Singer Company Character recognition apparatus for serially comparing an unknown character with a plurality of reference characters
US4162482A (en) * 1977-12-07 1979-07-24 Burroughs Corporation Pre-processing and feature extraction system for character recognition
US4398256A (en) * 1981-03-16 1983-08-09 Hughes Aircraft Company Image processing architecture

Also Published As

Publication number Publication date
JPS59790A (ja) 1984-01-05
JPH0467234B2 (de) 1992-10-27
DE3322443A1 (de) 1983-12-29
US4556985A (en) 1985-12-03

Similar Documents

Publication Publication Date Title
DE3322443C2 (de)
DE3633743C2 (de)
DE3879254T2 (de) Unterscheidungsvorrichtung für handgeschriebene und maschinengedruckte Buchstaben.
DE3716787C2 (de)
DE68915950T2 (de) Verfahren zum Trennen von Zeichen.
DE68923650T2 (de) Bildverarbeitungsverfahren.
DE1549930C3 (de) Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen
DE3875451T2 (de) Verfahren zum optischen lesen von strichcodes.
DE2909153C2 (de) Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern
EP0925682B1 (de) Verfahren zur detektion von kanten in einem bildsignal
DE3916323A1 (de) Verfahren zum erkennen eines zeichens und dabei verwendbares zeichenerkennungssystem
DE3786472T2 (de) Vorrichtung für optische Zeichenerkennung.
DE3923449A1 (de) Verfahren zum bestimmen von kanten in bildern
DE10025332A1 (de) Verfahren zum Lesen eines zweidimensionalen Barcodes
DE102007040070B4 (de) Bilddichteumwandlungsverfahren, Bildverbesserungsverarbeitungseinrichtung und dafür geeignetes Programm
DE2829808A1 (de) Verfahren und vorrichtung zum lesen von zeichen
DE102008013789A1 (de) Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen
DE2435982A1 (de) Verfahren und vorrichtung zur verarbeitung von durch abtastung eines mehrfarbigen musters erhaltenen informationen
EP0550511B1 (de) Verfahren zur extrahierung von einzelzeichen aus rasterbildvorlagen einer gelesenen hand- oder maschinenschriftlichen zeichenfolge freier teilung
DE60024535T2 (de) Verfahren zur Zeichentrennung
DE3026055C2 (de) Schaltungsanordnung zur maschinellen Zeichererkennung
DE69028970T2 (de) Bildverarbeitungsgerät
DE2333202A1 (de) Zeichenerkennungsanordnung
DE68910625T2 (de) Verfahren zum Erkennen eines Musters in einem Feld mit einer Mehrwertamplitude, Anordnung zum Durchführen eines derartigen Verfahrens.
DE69531412T2 (de) Bildkodierung beruhend auf Bildbereichen und deren segmentierten Randlinien

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee