DE3322443C2 - - Google Patents
Info
- Publication number
- DE3322443C2 DE3322443C2 DE3322443A DE3322443A DE3322443C2 DE 3322443 C2 DE3322443 C2 DE 3322443C2 DE 3322443 A DE3322443 A DE 3322443A DE 3322443 A DE3322443 A DE 3322443A DE 3322443 C2 DE3322443 C2 DE 3322443C2
- Authority
- DE
- Germany
- Prior art keywords
- pattern
- bit
- value
- matrix
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000011159 matrix material Substances 0.000 claims description 31
- 238000003909 pattern recognition Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 description 9
- 239000002131 composite material Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004071 soot Substances 0.000 description 2
- 101100325756 Arabidopsis thaliana BAM5 gene Proteins 0.000 description 1
- 102100031584 Cell division cycle-associated 7-like protein Human genes 0.000 description 1
- 101000777638 Homo sapiens Cell division cycle-associated 7-like protein Proteins 0.000 description 1
- 101150046378 RAM1 gene Proteins 0.000 description 1
- 101100476489 Rattus norvegicus Slc20a2 gene Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/32—Normalisation of the pattern dimensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
Die Erfindung betrifft eine Mustererkennungsvorrichtung
nach dem Oberbegriff des Patentanspruchs.
Anhand von Fig. 1 sei zunächst ein bekanntes Verfahren
zur Mustererkennung beschrieben, das als "Matrix-Matching"-
Verfahren bezeichnet wird.
Bei diesem Verfahren wird ein als Gewichtsmuster bezeichneter
Merkmalssatz für jedes zu erkennende Zeichen
festgelegt. Fig. 1 zeigt ein solches Gewichtsmuster für
den Buchstaben "B". Ein den Buchstaben enthaltender Bereich
wird in eine Vielzahl von Teilbereichen unterteilt,
die gewichtet werden, wie dies durch die Zahlen dargestellt
ist. Verschiedene Zeichen werden verschieden gewichtet.
Durch Vergleich des Gewichtsmusters (Eingangsmuster)
eines zu erkennenden Zeichens mit dem Gewichtsmuster
eines Referenzzeichens kann daher jedes Zeichen
erkannt werden.
Dieses bekannte Verfahren ist insofern nachteilig, als
infolge einer gegenseitigen Positionsverschiebung
zwischen dem Gewichtsmuster eines Referenzzeichens und
dem des zu erkennenden Zeichens sowie infolge von Schwankungen
der Breite von Zeichenstrichen das Ausmaß der
Ausrichtung bzw. Übereinstimmung zwischen Zeichen variabel
und instabil wird. Zur Vermeidung dieser Schwierigkeit
ist ein Verfahren zur Zeichenerkennung unter Verwendung
einer Formmatrix entwickelt worden (japanische Patentanmeldung
56-1 75 709 = JP-OS 58 78 273). Bei diesem Verfahren wird jedes
Zeichen in 9×8 Teilbereiche aufgeteilt und eine Formmatrix
für jedes Zeichen aufgrund der Entscheidung aufgestellt,
ob ein Muster in einem jeweiligen Teilbereich
"vorhanden" ist oder nicht. Die Zeichenerkennung wird
durch Vergleich der Formmatrix mit einer Standardmatrix
ausgeführt. Wenn jedoch ein gestempeltes Zeichen gelesen
werden soll, kann die Formmatrix des Zeichens infolge
eines Schnitts in der Oberfläche, auf die das Zeichen
gestempelt ist, sowie infolge von Schmutz, etwa Ruß,
auf der Oberfläche variieren, was die richtige Zeichenerkennung
schwierig macht. Die 9×8-Formmatrix besitzt
darüber hinaus den Nachteil, daß keine große Zahl von
Zeichen (nicht mehr als 10) erkannt werden kann.
Aus der US 41 83 013 ist eine Einrichtung zum Gewinnen von
Formelementen aus einem Bild bekannt. Mit Hilfe dieser Vorrichtung
lassen sich Anzahl der Muster in einem Bild, Umfang,
Flächengröße und dergleichen erkennen. Eine Bewertung eines
Musters mit Hilfe beispielsweise einer Standardmatrix, wie
sie oben erläutert wurde, erfolgt nicht.
Aus der US 36 18 016 ist ein Zeichenerkennungssystem bekannt,
das mit einer Maske arbeitet. Ein abgetastetes Muster wird
einer von mehreren Klassen zugeordnet. Die Abtastung des Musters
erfolgt spaltenweise zur Erstellung einer Matrix, von
der aus eine Verbindung zu einer logischen Kombinationsschaltung
besteht. Für einzelne Zeichen sind Zähler vorhanden, die
an die Kombinationsschaltung angeschlossen sind. Die Kombinationsschaltung
arbeitet als Maske, um bestimmte Mustermerkmale
zu erkennen. Falls diese Mustermerkmale erkannt werden,
wird ein zugehöriger Zähler hochgezählt.
Eine Entscheidung, d. h. eine Musteridentifizierung, erfolgt
dadurch, daß die einzelnen Zählerstände überprüft werden. Die
Zähler werden nach der Abtastung und Maskierung gleichmäßig
hochgezählt, und es wird festgestellt, welcher Zähler zuerst
überläuft. Nur wenn ein einziger Zähler als erstes überläuft,
wird das diesem Zähler zugeordnete Zeichen als das abgetastete
Zeichen erkannt. Weitere, spezielle Unterscheidungskriterien
werden nicht angewendet.
Aus der DE 27 46 969 A1 ist eine Vorrichtung zum Vergleichen
von Mustern bekannt, die einen aus mehreren Bildelementen bestehenden
Bildschirm abtastet, die abgetastete Information
komprimiert und dann anhand der komprimierten Information
einen Vergleich durchführt. Für jede zu erkennende Ziffer
wird ein Soll-Rasterbild vorgegeben und dann mit einem Ist-
Rasterbild verglichen. Sämtliche Rasterpunkte werden in Gruppen
unterteilt, und für jedes zu erkennende Zeichen wird eine
Soll-Anzahl von beispielsweise dunklen Punkten vorgegeben.
Nach der Abtastung eines Bildes wird für jede Gruppe geprüft,
ob Übereinstimmung oder annähernde Übereinstimmung mit dem
Soll-Wert einer jeweiligen Gruppe besteht.
Aufgabe der Erfindung ist es,
eine Vorrichtung der eingangs angegebenen
Art zu schaffen, die ein hohes Erkennungsvermögen,
das heißt eine hohe Rate richtiger Zeichenerkennung bei
hoher Lesegeschwindigkeit, auch dann besitzt, wenn Zeichen
in schlechtem Zustand gedruckt oder gestempelt sind.
Diese Aufgabe wird erfindungsgemäß durch eine Vorrichtung
mit den Merkmalen des Patentanspruchs gelöst.
Die Erfindung wird nachfolgend anhand eines Ausführungsbeispiels
unter Bezug auf die Zeichnung näher erläutert.
Es zeigt
Fig. 1 eine Darstellung zur Erläuterung eines
herkömmlichen Verfahrens zur Zeichenerkennung
unter Verwendung eines Gewichtsmusters,
Fig. 2 ein Blockschaltbild einer Ausführungsform
der Erfindung,
Fig. 3 das nach Binärumwandlung erhaltene Bild
des Buchstabens "W",
Fig. 4 das Bild von Fig. 3 in segmentierter
Form,
Fig. 5 eine Darstellung verschiedener Informationen
von Merkmalen, die der Segmentinformation
entnommen wurden,
Fig. 6 ein Blockschaltbild eines Merkmalsgenerators,
Fig. 7 eine Darstellung zur Erläuterung der
Stricheinheitszahl der Segmente,
Fig. 8 eine Darstellung eines Registers für
Stricheinheitszahlen,
Fig. 9 eine Darstellung des Zusammenhangs
zwischen den Stricheinheitszahlen und
den Stricheinheitsflächen eines Musters,
Fig. 10 eine Darstellung von Sätzen von Stricheinheitszahlen
sowie von Stricheinheit-
und Strichverbund-Dateien für das Muster
von Fig. 9,
Fig. 11 ein Flußdiagramm eines Programms zur
Erstellung der Stricheinheit-Datei,
Fig. 12 eine Flußdiagramm eines Programms zur
Erstellung der Strichverbund-Datei,
Fig. 13 eine Darstellung zur Erläuterung der
Art, in der ein Zeichenmuster definiert
wird,
Fig. 14 ein quantisiertes Bild eines Zeichenmusters
und einen um dieses gelegten
Rahmen,
Fig. 15 eine Bitmatrix des quantisierten Bildes
von Fig. 14 und
Fig. 16 eine Standardbitmatrix entsprechend
dem Muster von Fig. 14.
Fig. 2 zeigt ein Blockschaltbild einer Ausführungsform
der vorliegenden Erfindung. Darin ist mit 1 eine nachfolgend
als Kamera bezeichnete Festkörperbildaufnahmevorrichtung
in Form eines MOS-Transistors oder einer ladungsgekoppelten
Einrichtung bezeichnet. 2 ist ein Binärumsetzer,
3 eine Schaltung zur Merkmalsextrahierung
(nachfolgend Merkmalgenerator genannt), 4 ein Bilddatenspeicher
(RAM1), 5 eine arithmetische Einheit, etwa ein
Mikroprozessor, 6 ein Speicher in Form eines PROMs besonders
zur Speicherung eines Programms, 7 ein Speicher
(RAM2), der hauptsächlich der Speicherung von Daten dient,
und 8 eine Entscheidungsausgabeeinheit.
Ein zu erkennendes Zeichen bzw. eine zu erkennende Figur
wird mittels der Kamera 1 in horizontaler Richtung X und
in vertikaler Richtung Y abgetastet. Die bei der horizontalen
Abtastung erzeugten Videosignale werden von dem
Binärumsetzer 2 mittels eines Schwellenwertes in Binärwerte
umgesetzt. Das entsprechende binäre Bild ist
schematisch in Fig. 3 gezeigt. Es sei angenommen, daß
Bereiche, in denen Musterteile des Zeichens existieren,
durch den logischen Wert "1" ausgedrückt werden und daß
eine Reihe von logischen Werten "1", wo Zeichenmuster auf
horizontalen Abtastlinien (Zeilen) liegen, "Segment"
genannt wird. Das Zeichenmuster kann in Segmente SE₈₁,
SE₈₂, SEÿ, SEkl, . . . auf den Zeilen SC₈, SC₉, SCi, SCk, . . .
unterteilt werden, wie dies in Fig. 4 gezeigt ist. Das
Zeichenmuster kann daher durch ein Bündel bzw. eine
Häufung solcher Segmente ausgedrückt werden. Damit erkannt
werden kann, daß diese Segmente zum selben Zeichenmuster
gehören, muß für jedes Segment ein Koordinatenvergleich
durchgeführt werden. Wenn beispielsweise die Zeile SC₉
abgetastet wird, kann das Segment SE₉₁ auf der Zeile SC₉
als zum selben Muster wie das Segment SE₈₁ auf der vorhergehenden
Zeile SC₈ gehörig betrachtet werden, wenn die
Y-Koordinate des Segments auf der gegenwärtigen Zeile SC₉
sich um eins von der des Segments auf der vorangegangenen
Zeile SC₈ unterscheidet und sich außerdem die X-Koordinaten
der Segmente SE₈₁, SE₉₁ wenigstens teilweise überlappen.
Zum klaren Verständnis des Vorangehenden soll jedes Segment
im Hinblick auf eine Start-Information, eine sogenannte
Joint-Information und eine sogenannte Connection-Information
betrachtet werden. Die Start-Information wird einem
Segment zugeordnet, das sich nicht mit irgendeinem Segment
auf einer vorangehenden Zeile überlappt, also einem Segment,
das auf der laufenden Zeile erstmalig erscheint.
Die Segmente mit einer solchen Start-Information sind
in Fig. 4 SE₈₁, SE₈₂ und SEÿ. Die Connection-Information
kennzeichnet die Folge, in welcher die Segmente jeweils
auf den Zeilen liegen. Die Joint-Information drückt den
Grad der Überlappung von Segmenten aus und kennzeichnet
zwei oder mehr Segmente auf einer vorangehenden Zeile,
die auf der laufenden Zeile vereinigt sind. Solche Segmente,
die mit Segmenten der Start-Information vereinigt
oder verbunden sind, werden als zu denselben "Stricheinheiten"
gehörig betrachtet. Den Segmenten SE₈₁, SE₈₂ und
SEÿ sind die Stricheinheitzahlen 1, 2 bzw. 3 zugeordnet.
Dem Segment SEk+1 zum Beispiel, dem eine Joint-Information
zugeordnet ist, wird dieselbe Stricheinheitzahl wie dem
rechten Segment SEk2 auf der vorhergehenden Zeile gegeben.
Die in Fig. 5 dargestellten Merkmale können den segmentierten
Bilddaten entnommen werden. Fig. 5 zeigt bei (a)
die Stricheinheitzahlen der Segmente, bei (b) die Koordinaten
der rechten Enden der Segmente, bei (c) die Y-
Koordianten (die Anzahl von Zeilen), bei (d) die Segmentlängen,
bei (e) und (f) Sätze vereinigter Stricheinheitzahlen,
bei (b) die Gesamtanzahl von Segmenten, bei (h)
die Anzahl von Segmentvereinigungen und bei (i) die Anzahl
von Stricheinheiten. Diese Merkmale sind im gezeigten
Muster im Speicher 4 (Fig. 2) gespeichert. Die Segmentlänge
A wird als (XR-XL+1) ausgedrückt, das heißt als
Summe der Differenz zwischen der X-Koordinate XR des
rechten Endes und der X-Koordinate XL des linken Endes
einerseits und +1 andererseits. +1 wird deshalb hinzuaddiert,
weil die Segmentlänge Null würde und dies unvorteilhaft
wäre, wenn die Koordinaten des rechten Endes
und des linken Endes gleich wären.
Fig. 6 zeigt in Blockform die Schaltung eines Merkmalgenerators,
der die vorgenannten Merkmale extrahiert.
Der Merkmalgenerator umfaßt einen 3×3 lokalen Speicher
9 zur Speicherung der Binärsignale von drei Zeilen, das
heißt der laufenden Zeile, der vorigen Zeile und der
vorvorigen Zeile. Der Merkmalgenerator enthält ferner
einen Detektor 10 zum Erfassen von Startsegmenten, einen
Zähler 11 für die Stricheinheitzahl, ein Register 12 für
die Stricheinheitzahl, einen Detektor 13 für das rechte
Ende der Segmente, einen X-Koordinanten-Generator 14, einen
Y-Koordinaten-Generator 15, einen Segmentlängenzähler 16,
einen Detektor 17 zur Feststellung von Segmentvereinigungen,
einen Zähler 18 zum Zählen solcher Vereinigungen
und einen Zähler 19 zum Zählen der Anzahl der Segmente.
Die nach Bearbeitung durch den Binärumsetzer abgegebenen
binären Videosignale werden dem Speicher 9 geliefert. Der
Detektor 10 ermittelt anhand der Ausgabe vom Speicher 9
die Startsegmente, die vom Zähler 11 gezählt werden,
welcher die auf den neuesten Stand gebrachte Stricheinheitzahl
in das Register 12 einschreibt. Der Detektor 13
dient dazu, die Positionen der rechtsliegenden Endpunkte
der Segmente zu erfassen. Zu einem mit der Erfassung
eines rechten Endpunkts durch den Detektor 13 in zeitlicher
Beziehung stehenden Zeitpunkt werden die Koordinaten
XR, Y vom Y-Koordinatengenerator 14 und vom Y-Koordinatengenerator
15 in den Speicher 4 (Fig. 2) eingeschrieben.
Der Zähler 16 zählt die Bereiche, in denen das Binärsignal
den logischen Wert "1" hat. Der Zählerstand des
Zählers 16 wird als Segmentlänge A ausgegeben. Der Detektor
17 erfaßt anhand der Ausgabe vom Speicher 9 eine
Segmentvereinigung und liefert dies an den Zähler 18,
der die Anzahl NTJ von Vereinigungen zählt, sowie außerdem
an das Register 12 für die Stricheinheitzahl. Wenn
das Register 12 eine solche Joint-Information erhält,
gibt es Stricheinheit-Informationen E₁, E₂, die vereinigt
sind, sowie für jede Stricheinheit-Information eine
Stricheinheitzahl NS aus. Der Zähler 19 zählt die vom
Detektor 13 festgestellten rechten Endpunkte und gibt die
Gesamtzahl NTS an Segmenten ab.
Fig. 7 zeigt die Stricheinheitzahlen der Segmente und
Fig. 8 den Inhalt des Registers 12 in Fig. 6 zur vorübergehenden
Speicherung der Stricheinheitszahlen.
Wie unter Bezug auf die Fig. 4 und 5 beschrieben, wird
der Buchstabe "W" in Segmente unterteilt, und die Segmente
werden mit Stricheinheitzahlen numeriert, und zwar
auf der Basis einerseits der Folge, in welcher die Segmente
auf den Zeilen auftreten, und andererseits der
Start-Information. Der Buchstabe "W" kann als eine Kombination
von Segmenten angesehen werden, denen, wie in
Fig. 7 gezeigt, die Stricheinheitzahlen "1", "2" und "3"
zugewiesen sind. Es seien nun die Segmentfolge bzw. die
Stricheinheitszahlen der Segmente auf den Zeilen SC₁₉
(Y=19) und SC₂₀ (Y=20) betrachtet. Die Stricheinheitzahlen
auf der Zeile SC₁₉ sind 1, 3, 3 und 2, während
diejenigen auf der Zeile SC₂₀ 3 und 2 sind. Diese Informationen
werden im Register 12 in dem in Fig. 8 gezeigten
Muster gespeichert. Durch Überprüfung des Inhalts dieses
Registers können die Anzahl NSS von Stricheinheiten sowie
die Sätze miteinander vereinigter Stricheinheitszahlen E₁,
E₂ gewonnen werden. Da ein Zeichenmuster als ein Bündel
von Segmenten, denen Stricheinheitszahlen zugeordnet sind,
aufgefaßt werden kann, können aus dem Zeichenmuster mittels
des Merkmalgenerators Merkmale extrahiert werden. Die
Merkmale jeglicher Zeichenmuster sind in dem Speicher 4
(Fig. 2) gespeichert, und die arithmetische Einheit 5
führt zur Erkennung des Zeichenmusters anhand der gespeicherten
Merkmalsinformation und dem im Speicher 6 gespeicherten
Programm vorgeschriebene arithmetische
Operationen aus.
Beim vorangehenden Ausführungsbeispiel wurde die Erfindung
unter Bezug auf ein einfaches Zeichenmuster beschrieben.
Komplexe Zeichen- und Figurmuster können auf
gleiche Weise verarbeitet werden. Eine solche Verarbeitung
soll nachfolgend beschrieben werden.
Fig. 9 zeigt den Zusammenhang zwischen Stricheinheiten
eines beliebigen Musters und den Stricheinheitszahlen.
Bei einem zu erkennenden Muster einer komplexen Gestalt
wie in Fig. 9 werden den Segmenten, wie dargestellt, auf
der Basis der Start-Information in oben beschriebener
Weise Stricheinheitzahlen 1 bis 18 zugeteilt. Die Bereiche
der Stricheinheiten sind in Fig. 9 durch gestrichelte
Linien klar abgegrenzt. Sätze von vereinigten Stricheinheitszahlen
E₁, E₂, wie sie bei (a) in Fig. 10 gezeigt
sind, können aus der Joint-Information jeder Stricheinheit
bestimmt werden. Die Datei von E₁, E₂ wird zur Ableitung
einer Datei von Stricheinheiten RS, wie sie bei
(b) in Fig. 10 gezeigt ist, und einer Datei von Strichverbunden
(ein Verbund von Stricheinheiten) RC, die bei (c) in Fig. 10 gezeigt ist, verwendet.
Die Stricheinheit-Datei RS wird durch Entfernung
von sich gegenseitig überlappenden und redundanten Stricheinheitszahlen
aus den Sätzen E₁, E₂ vereinigter Stricheinheitszahlen
gewonnen. Fig. 11 zeigt ein Programm zur
Bildung einer solchen Stricheinheit-Datei. Die Strichverbund-
Datei RC wird dadurch geschaffen, daß die Stricheinheit-
Datei RS so angeordnet wird, daß die Nummer eines
jeweiligen Strichverbundes (entsprechend den Mustern der
zu erkennenden Zeichen oder Figuren), bei denen es sich
um eine Kombination vereinigter Stricheinheiten handelt,
den Stricheinheiten zugeteilt wird. Dieser Prozeß wird
entsprechend dem in Fig. 12 dargestellten Programm ausgeführt.
Die Anzahl NCS von Strichverbunden in Fig. 9,
das heißt die Anzahl von Mustern ist "3". Die in den
Fig. 11 und 12 gezeigten Programme sind in FORTRAN geschrieben,
wobei das Sinnbild (▭) eine Operation bedeutet.
X=Y bedeutet zum Beispiel, daß X durch Y zu ersetzen
ist. Das Sinnbild (⇔) steht für eine Verzweigung.
(≠) bedeutet "ungleich", und (<) bedeutet "größer als".
Die Programmablaufpläne der Fig. 11 und 12 sind aus sich
verständlich und brauchen daher nicht weiter verläutert
zu werden. Mit E₁, E₂ sind Sätze von vereinigten Stricheinheiten
bezeichnet. NTJ ist die Anzahl der Vereinigungen.
NSS ist die Gesamtanzahl von Stricheinheiten. NCS
ist die Gesamtanzahl von Strichverbunden. FT ist eine
Zwischendatei, die zur Prüfung benutzt wird, ob die
Stricheinheiten sich überlappen oder nicht. RS ist eine
Datei, deren Größe von der Gesamtanzahl NSS der Stricheinheiten
bestimmt wird. RC ist eine Datei, deren Größe
von der Gesamtanzahl NCS von Strichverbunden benutzt
wird, und i, j, k, l und m sind Laufzahlen für die Dateien.
Die Dateien RS, RC werden vor Durchführung des Programms
auf Null gesetzt. Die Fläche AC, die Breite WC, die Höhe
HC, das Maximum X und das Minimum Y der linken und rechten
Endpunkte, die Koordinaten XR, XL, YT, YB des Maximums X
und des Minimums Y und die zentralen Koordinaten XC, YC
hiervon können alle für jeden der Doppelstriche oder
Muster bestimmt werden.
Der Prozeß der Erkennung des Zeichenmusters auf der Basis
der beschriebenen Merkmale soll nun anhand der Fig. 13
bis 16 beschrieben werden.
Es werden zwei Wege betrachtet, ein Zeichenmuster zu
definieren.
(1) Wenn ein Zeichenmuster lokal schmal oder abschnitten
ist, wie bei einem eingeprägten oder gestempelten
Zeichen, oder wenn infolge von Schnitten, Öl, Ruß oder
anderem Schmutz kleine Störmuster gebildet werden können,
wird das auf Schmutz oder einem Kratzer beruhende Muster
entsprechend der Fläche, Breite oder Höhe entfernt und
ein der Größe des Zeichens entsprechendes Muster von den
verbleibenden Mustern gewonnen. Wenn das Zentrum PC
eines Musters entsprechend einer Zeichengröße gemäß Darstellung
in Fig. 13 als Bezug dient, dann wird das
Zeichenzentrum PC auf der Basis des Abstands DP zwischen
dem Zeichenzentrum un dem Zentrum eines anderen Zeichens
extrapoliert. Ein in einem Suchrahmen (mit einer Breite
WA und einer Höhe HA) enthaltenes Zeichen vorgegebener
Größe wird als Musterzeichen betrachtet. Das Zeichen "A"
in Fig. 13 ist frei von Störmustern, während das Zeichen
"B" durch ein Störmuster NP beeinträchtigt ist. Wenn ein
solches Störmuster NP vorhanden ist, sollte der Zeichenrahmen
auf einen Bereich mit einer oberen Grenze HB für
die Zeichenhöhe beschränkt werden und jeder Teil jenseits
der Obergrenze vernachlässigt werden. Der Zeichenrahmen
für ein einzelnes zu erkennendes Zeichenmuster
kann allerdings nicht extrapoliert werden.
(2) Wenn ein Zeichenmuster klar ist und kein Störmuster
vorhanden zu sein scheint, wird ein Muster in einem
Zeichenrahmen, der durch eine Höhe HU (obere Grenze), eine
Höhe HL (untere Grenze), eine Breite WU (obere Grenze)
und eine Breite WL (untere Grenze) definiert ist, als ein
Zeichenmuster bestimmt, anders ausgedrückt also ein Muster,
das folgenden Bedingungen genügt:
WL≦WC≦WU, HL≦HC≦HU
wobei WC und HC die Breite und die Höhe des Zeichenmusters
sind.
Ein Zeichenrahmen wird also definiert, um ein Zeichenmuster
zu extrahieren. Fig. 14 zeigt das Zeichen "5" und
einen Zeichenrahmen L, wo die Maximumkoordinaten X und Y
und die Minimumkoordinaten X und Y XFR, YFB bzw. XFL, YFT
sind. Obwohl das Zeichenmuster horizontal ausgerichtet
dargestellt ist, spielt es keine Rolle, ob die Zeichenmuster
horizontal oder vertikal liegen.
Der auf die vorgenannte Weise definierte Zeichenrahmen
wird in X-Richtung in 24 Teilbereiche und in Y-Richtung
in 12 Teilbereiche unterteilt. Wenn in einem Teilbereich
ein Zeichenmuster vorhanden ist, wird dieser Teilbereich
durch den logischen Wert "1" ausgedrückt, während der
logische Wert "0" zur Kennzeichnung von Teilbereichen
dient, in denen kein Zeichenmuster vorhanden ist. Die
durch logische Werte ausgedrückten Teilbereiche sind als
Matrix in Fig. 15 gezeigt und werden nachfolgend als
Bitmatrix B bezeichnet. Die freien Teilbereiche in Fig.
15 stehen für den logischen Wert "0".
Jedes Zeichen wird vorher zur Bestimmung seiner Bitmatrix
gemessen, und die Elemente der Bitmatrix werden in vier
Arten von Bits oder Elementen in nachstehender Weise
klassifiziert:
- (a) Musterbit, ein Element das immer "1" ist;
- (b) freies Bit, ein Element das immer "0" ist;
- (c) Maskenbit, ein Element das zwischen "1" und "0" variabel ist und
- (d) Deformationsbit, eine horizontale oder vertikale Kette von Bits, die in ihrer Gesamtheit als "1" bestimmt werden können, falls irgendeines dieser Bits "1" ist.
Fig. 16 zeigt ein Beispiel einer vorher für das Zeichen
"5" gemessenen Bitmatrix. Die Bits sind durch Symbole
gekennzeichnet. Die freien Bereiche kennzeichnen freie
Bits, das Symbol (∆) Maskenbits und das Symbol (-)
Deformationsbits. Die dargestellte Bitmatrix enthält
kein Musterbit.
Die Bitmatrix B wird für alle zu erkennenden Zeichen-
und Figurmuster gemessen, und die Elemente der Bitmatrix
werden in die vier Bitgruppen klassifiziert, so
daß für jedes Zeichen K eine Standardbitmatrix B und eine
Maskenbitmatrix B definiert werden und außerdem ein
Deformationsoperator DK, der auf die gemessene Bitmatrix
B einwirkt, definiert wird.
Ein Abstand DK zwischen einem gegebenen Zeichen K und
einem durch eine Bitmatrix B ausgedrückten unbekannten
Zeichenmuster ist durch folgende Gleichung definiert:
In dem in Fig. 16 gezeigten Beispiel ist M=12 und N=24.
Das Zeichen () bedeutet eine Exklusiv-ODER-Verknüpfung,
und das Zeichen (∧) eine UND-Verknüpfung.
Der Abstand {DK} wird für alle Zeichenmuster bestimmt und
der kleinste Abstand D₁ sowie der zweitkleinste Abstand
D₂ werden ermittelt. Im Fall eines Musters K₁ mit dem
Minimum D₁ wird das unbekannte Muster als Muster K₁ bestimmt,
wenn folgende Voraussetzungen erfüllt sind:
D₁ DU (vorgegebener Wert)
D₂ - D₁ DL (vorgegebener Wert)
Die vorgegebenen Werte DU, DL werden zum Zeichenlesen
und zum Zeichenprüfen verschieden festgelegt.
Wie oben beschrieben, werden bei der vorliegenden Erfindung
Anordnungen zur Stricheinheitverarbeitung und zur
Strichverbundverarbeitung eingesetzt, so daß ein Zeichen
ohne größere Beeinflussung durch Störmuster und durch
Positionsverschiebung eines Eingangsmusters und somit
einen Abstand zwischen Mustern definiert werden kann.
Durch Einführung des Konzepts eines Deformationsoperators
und einer Maskenbitmatrix kann ein Schutz gegen Schwankungen
der Zeichendefinition infolge von Veränderungen
der Breite von Zeichenstrichen und kleinen Störmustern
erreicht werden. Der Zeichenerkennungsprozeß kann mit
hoher Geschwindigkeit unter Verwendung eines Stricheinheit-
und Strichverbund-Verarbeitungsalgorithmus durchgeführt
werden.
Obwohl die vorliegende Erfindung in Anwendung auf das
Erkennen von eingeprägten, gestempelten oder gedruckten
Zeichen beschrieben wurde, ist sie auch anwendbar auf
das Erkennen spezieller Symbole, etwa solcher auf einem
Schreibmaschinentastenfeld.
Claims (1)
- Mustererkennungsvorrichtung, umfassend:
eine Einrichtung zur Bildung einer M×N-Bitmustermatrix B (i,j), die das Vorhandensein und die Gestalt eines abgetasteten unbekannten Musters in Unterzonen eines das Muster einschließenden Rahmens darstellt, sowie zur Festlegung der Mitte eines Musters und zur Erzeugung eines Rahmens bestimmter Größe, zentriert auf die Mitte des Musters, wobei jedes Bit innerhalb des Musters einen "Muster-Vorhanden-Wert" aufweist, wenn das abgetastete Muster zumindest teilweise in die zugehörige Unterzone fällt oder einen "Muster-Fehlt-Wert" aufweist, wenn das abgetastete Muster nicht in die zugehörige Unterzone fällt,
eine Einrichtung zum Vergleichen der Bitmustermatrix mit mehreren vorab ermittelten Bitmustermatrizen B (i,j) für mehrere bekannte Referenzmuster K, sowie zum Ausgeben eines Vergleichswertes DK für jedes Referenzmuster K, wobei die Amplitude des Wertes DK das Ausmaß der Übereinstimmung zwischen der Bitmustermatrix B (i,j) für das unbekannte Muster einerseits und die Bitmustermatrix B (i,j) für jedes Referenzmuster K gemäß folgender Formel repräsentiert: wobei DK ein Deformationsmatrixoperator für das Referenzmuster K ist, welcher einen "Muster-Fehlt-Wert" in B (i,j) ersetzt durch einen "Muster-Vorhanden-Wert" für sämtliche Unterzonen-Bits innerhalb jeder Bitkette, wenn mindestens eines der Bits in der betreffenden, das gerade betrachtete Bit enthaltenden Bitkette einen "Muster-Vorhanden-Wert" aufweist,B (i,j) eine Maskenbitmatrix für das Referenzmuster K ist, die "Muster-Fehlt- Werte" in solchen Positionen enthält, die nicht wesentlich zur Unterscheidung des Musters K von anderen Mustern beitragen, so daß bei der Mustererkennung der Wert dieses direkt durch die Abtastung erhaltenen Bits ignoriert werden kann, undB (i,j) eine Standardbitmatrix für das Referenzmuster K ist, die "Muster-Vorhanden- Bits" an solchen Stellen enthält, an denen ein ideales Referenzmuster K mindestens teilweise die entsprechenden Unterzonen belegen würde, und die "Muster- Fehlt-Bits" dort enthält, wo ein ideales Referenzmuster K überhaupt nicht die entsprechenden Unterzonen belegen würde, und
eine Einrichtung zum Auswählen des niedrigsten und des zweitniedrigsten Vergleichswertes sowie zum Ausgeben eines Musteridentifizierungssignals, welches das unbekannte Muster als das Bezugsmuster identifiziert, welches dem niedrigsten Vergleichswert entspricht, falls dieser niedrigste Vergleichswert kleiner als ein erster voreingestellter Wert, und falls die Differenz zwischen dem niedrigsten und dem zweitniedrigsten Vergleichswert größer ist als ein zweiter vorbestimmter Wert, wobei die Vergleichswerte allgemein umgekehrt proportional zu dem Maß der Entsprechung zwischen dem Bitmatrixmuster und den Referenzmustermatrizen sind.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57109746A JPS59790A (ja) | 1982-06-28 | 1982-06-28 | パタ−ン識別装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3322443A1 DE3322443A1 (de) | 1983-12-29 |
DE3322443C2 true DE3322443C2 (de) | 1992-12-10 |
Family
ID=14518193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19833322443 Granted DE3322443A1 (de) | 1982-06-28 | 1983-06-22 | Mustererkennungsvorrichtung |
Country Status (3)
Country | Link |
---|---|
US (1) | US4556985A (de) |
JP (1) | JPS59790A (de) |
DE (1) | DE3322443A1 (de) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6033675A (ja) * | 1983-08-04 | 1985-02-21 | Fuji Electric Co Ltd | 文字読取装置 |
JPS60204086A (ja) * | 1984-03-28 | 1985-10-15 | Fuji Electric Co Ltd | 物体識別装置 |
US4610025A (en) * | 1984-06-22 | 1986-09-02 | Champollion Incorporated | Cryptographic analysis system |
KR900001696B1 (ko) * | 1984-11-09 | 1990-03-19 | 가부시기가이샤 히다찌세이사꾸쇼 | 화상처리장치의 제어방법 |
JPS61145690A (ja) * | 1984-12-19 | 1986-07-03 | Matsushita Electric Ind Co Ltd | 顔の特徴部分の認識装置 |
JPS61208185A (ja) * | 1985-03-12 | 1986-09-16 | Matsushita Electric Ind Co Ltd | 顔の特徴部分の認識装置 |
EP0204516A3 (de) * | 1985-06-04 | 1990-01-31 | Adept Technology, Inc. | Sichtanlage zum Unterscheiden sich berührender Teile |
JPH0715703B2 (ja) * | 1986-05-16 | 1995-02-22 | 富士電機株式会社 | 文字読取方式 |
JPS6332386A (ja) * | 1986-07-25 | 1988-02-12 | Honda Denshi Giken:Kk | 超音波を用いた物体感知装置 |
US5159474A (en) * | 1986-10-17 | 1992-10-27 | E. I. Du Pont De Nemours And Company | Transform optical processing system |
US5078501A (en) * | 1986-10-17 | 1992-01-07 | E. I. Du Pont De Nemours And Company | Method and apparatus for optically evaluating the conformance of unknown objects to predetermined characteristics |
JPS63109386A (ja) * | 1986-10-28 | 1988-05-14 | Honda Denshi Giken:Kk | 超音波センサの温度補償方法 |
US5020112A (en) * | 1989-10-31 | 1991-05-28 | At&T Bell Laboratories | Image recognition method using two-dimensional stochastic grammars |
US6320977B1 (en) * | 1990-04-04 | 2001-11-20 | Matsushita Electric Industrial Co., Ltd | Method and apparatus for positional detection using pattern matching process |
US5367578A (en) * | 1991-09-18 | 1994-11-22 | Ncr Corporation | System and method for optical recognition of bar-coded characters using template matching |
DE4312010A1 (de) * | 1993-04-13 | 1994-10-20 | Henkel Kgaa | Enzymatisches Waschmittel |
US5530652A (en) * | 1993-08-11 | 1996-06-25 | Levi Strauss & Co. | Automatic garment inspection and measurement system |
DE69410191T2 (de) * | 1993-08-26 | 1998-09-24 | Canon Kk | Auf Übergangspegeldaten basierte OCR-Klassifikation |
US5774586A (en) * | 1994-05-04 | 1998-06-30 | Ncr Corporation | Method and apparatus for standardization of inputs to word recognition systems |
US6094506A (en) * | 1995-10-25 | 2000-07-25 | Microsoft Corporation | Automatic generation of probability tables for handwriting recognition systems |
JP3333721B2 (ja) * | 1997-09-05 | 2002-10-15 | 技術研究組合医療福祉機器研究所 | 領域検出装置 |
US6185332B1 (en) * | 1999-04-22 | 2001-02-06 | Faxtrieve, Inc. | Character recognition technique |
US20050094861A1 (en) * | 2003-10-31 | 2005-05-05 | International Business Machines Corporation | Positional synchronization in a multivoting character recognition environment |
US8768895B2 (en) * | 2007-04-11 | 2014-07-01 | Emc Corporation | Subsegmenting for efficient storage, resemblance determination, and transmission |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3178688A (en) * | 1962-12-20 | 1965-04-13 | Control Data Corp | Character recognition by feature selection |
US3601802A (en) * | 1966-09-09 | 1971-08-24 | Kokusai Denshin Denwa Co Ltd | Pattern matching character recognition system |
USB618016I5 (de) * | 1968-11-29 | |||
US3576534A (en) * | 1969-08-11 | 1971-04-27 | Compuscan Inc | Image cross correlator |
JPS48102926A (de) * | 1972-04-07 | 1973-12-24 | ||
JPS5911152B2 (ja) * | 1976-10-19 | 1984-03-13 | 肇産業株式会社 | パタ−ンマツチング方法及びその実施装置 |
US4183013A (en) * | 1976-11-29 | 1980-01-08 | Coulter Electronics, Inc. | System for extracting shape features from an image |
US4110737A (en) * | 1977-08-22 | 1978-08-29 | The Singer Company | Character recognition apparatus for serially comparing an unknown character with a plurality of reference characters |
US4162482A (en) * | 1977-12-07 | 1979-07-24 | Burroughs Corporation | Pre-processing and feature extraction system for character recognition |
US4398256A (en) * | 1981-03-16 | 1983-08-09 | Hughes Aircraft Company | Image processing architecture |
-
1982
- 1982-06-28 JP JP57109746A patent/JPS59790A/ja active Granted
-
1983
- 1983-06-14 US US06/504,263 patent/US4556985A/en not_active Expired - Fee Related
- 1983-06-22 DE DE19833322443 patent/DE3322443A1/de active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS59790A (ja) | 1984-01-05 |
JPH0467234B2 (de) | 1992-10-27 |
DE3322443A1 (de) | 1983-12-29 |
US4556985A (en) | 1985-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3322443C2 (de) | ||
DE3633743C2 (de) | ||
DE3879254T2 (de) | Unterscheidungsvorrichtung für handgeschriebene und maschinengedruckte Buchstaben. | |
DE3716787C2 (de) | ||
DE68915950T2 (de) | Verfahren zum Trennen von Zeichen. | |
DE68923650T2 (de) | Bildverarbeitungsverfahren. | |
DE1549930C3 (de) | Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen | |
DE3875451T2 (de) | Verfahren zum optischen lesen von strichcodes. | |
DE2909153C2 (de) | Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern | |
EP0925682B1 (de) | Verfahren zur detektion von kanten in einem bildsignal | |
DE3916323A1 (de) | Verfahren zum erkennen eines zeichens und dabei verwendbares zeichenerkennungssystem | |
DE3786472T2 (de) | Vorrichtung für optische Zeichenerkennung. | |
DE3923449A1 (de) | Verfahren zum bestimmen von kanten in bildern | |
DE10025332A1 (de) | Verfahren zum Lesen eines zweidimensionalen Barcodes | |
DE102007040070B4 (de) | Bilddichteumwandlungsverfahren, Bildverbesserungsverarbeitungseinrichtung und dafür geeignetes Programm | |
DE2829808A1 (de) | Verfahren und vorrichtung zum lesen von zeichen | |
DE102008013789A1 (de) | Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen | |
DE2435982A1 (de) | Verfahren und vorrichtung zur verarbeitung von durch abtastung eines mehrfarbigen musters erhaltenen informationen | |
EP0550511B1 (de) | Verfahren zur extrahierung von einzelzeichen aus rasterbildvorlagen einer gelesenen hand- oder maschinenschriftlichen zeichenfolge freier teilung | |
DE60024535T2 (de) | Verfahren zur Zeichentrennung | |
DE3026055C2 (de) | Schaltungsanordnung zur maschinellen Zeichererkennung | |
DE69028970T2 (de) | Bildverarbeitungsgerät | |
DE2333202A1 (de) | Zeichenerkennungsanordnung | |
DE68910625T2 (de) | Verfahren zum Erkennen eines Musters in einem Feld mit einer Mehrwertamplitude, Anordnung zum Durchführen eines derartigen Verfahrens. | |
DE69531412T2 (de) | Bildkodierung beruhend auf Bildbereichen und deren segmentierten Randlinien |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |