DE2438200C3 - Anordnung zur Erkennung von Bildmustern - Google Patents
Anordnung zur Erkennung von BildmusternInfo
- Publication number
- DE2438200C3 DE2438200C3 DE2438200A DE2438200A DE2438200C3 DE 2438200 C3 DE2438200 C3 DE 2438200C3 DE 2438200 A DE2438200 A DE 2438200A DE 2438200 A DE2438200 A DE 2438200A DE 2438200 C3 DE2438200 C3 DE 2438200C3
- Authority
- DE
- Germany
- Prior art keywords
- image
- patterns
- circuit
- standard variation
- equation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
Description
Die Erfindung betrifft eine Anordnung zur Erkennung
von Bildmustern gemäß Oberbegriff des Anspruchs 1. Diese Anordnung ist aus der DE-OS 20 54 546 bekannt.
Es sind bereits eine Vielzahl von Anordnungen zur Bildmustererkennung bekannt geworden. Von diesen
Systemen ist ein Bildanpassungsverfahren oder ein einfaches auf der Ähnlichkeit basierendes Verfahren
bekanntgeworden, durch die eine relativ gute Erkennung möglich ist Gemäß diesem Verfahren wird eine
Erkennung dadurch erzielt, indem man sicherstellt, in
welchem Ausmaß ein gegebenes Eingangs-Bildmuster Ähnlichkeit mit einem Bezugs-Bildmuster besitzt
Ein Bildmuster läßt sich in einer zweidimensionalen
Ebene beschreiben, und es können eine unendliche Zahl von Bildmustern in dieser Ebene dargestellt werden.
Diese Bildmuster stellen einen unendlichen Satz oder Menge dar. Bei dem zuvor erwähnten Erkennungsverfahren
wird ein Satz von Punkten, der eine 1 :1-Übereinstimmung ermöglicht, gegenüber einem einzelnen
Bildmuster betrachtet, wobei dies als Bildmusterraum definiert wird. In dem Bildmusterraum wird die
Ähnlichkeit durch Vektoren bestimmt, die dem Bildmuster
entsprechen.
Fig. IA zeigt eine Beziehung zwischen einem Satz
von Bildern und einem Bildraum. In dieser Figur entspricht der Ursprung der Vektoren in dem Bildraum
einem weißen Muster, und die Länge jedes Vektors entspricht der Dichte jedes der anderen Muster in dem
Bildsatz oder der Bildmenge.
Das jeweilige Bild wird als Funktion f(x) ausgedrückt, die e-nen Positionsvektor χ betrifft, der in einer
zweidimensionalen Zone R definiert ist
Wenn ein gleichmäßiges Bild f(x) in eine geeignete Anzahl von Quadraten L aufgeteilt wird, wie dies in
F i g. 1B gezeigt ist, und die Dichten der Quadrate durch
Mittelwerte f\, h,... fr,... h dargestellt werden, die die
Dichte jedes Quadrates wiedergeben, so läßt sich das Bild f(x)durch die Vektoren /ί, fz,...fr.. .4 ausdrücken,
' die einer Zahl L von Werten entsprechen.
Das Prinzip des zuvor erwähnten einfachen Ähnlichkeits-Verfahrens soll im folgenden mehr im einzelnen
erläutert werden.
Wird ein Eingabebild durch f(x) dargestellt und ein Bezugsbild durch fo(x), so läßt sich der Grad der
Ähnlichkeit S[f, f0] des Eingabebildes f(x) mit dem
Bezugsbild fa(x) wie folgt definieren:
(Lf0)
11/11 ll/oll
(i)
wobei (f, fo) ein inneres Produkt bedeutet, welches
zwischen f(x) und fo(x) berechnet wird und wie folgt ausgedrückt wird:
(2)
wobei χ in der Zone R definiert ist.
||/|| wird als Norm von f(x) bezeichnet und hat einen
positiven Wert, der definiert ist zu:
(3)
In ähnlicher Weise wird f0 als die Norm von fo(x)
bezeichnet. Die Norm ||/j| stellt den Abstand des Bildes . f(x)da.r, und zwar gemessen vom Ursprung im Bildraum,
und die Norm ||/0|| stellt den Abstand des Bildes /o/tydar,
und zwar gemessen vom Ursprung im Bildraum. Ein Bild fo(x) — 0, welches dem weißen Bildmuster entspricht,
stellt den Ursprung des Bildraumes dar. Θ stellt einen Winkel zwischen zwei Vektoren dar, die vom Ursprung
aus zu f(x)\ina k(x)gezogen sind, so daß die so definierte
Ähnlichkeit S[f, fd\ dem Cosinus Θ entspricht und einen
bestimmten Wert in einem Bereich
annimmt
Wenn speziell f(x) exakt identiscn mit k(x) ist, so wird
Wenn speziell f(x) exakt identiscn mit k(x) ist, so wird
Ux)SUJ0] = 1
Bei ε> 0 (ε ist eine positive Zahl kleiner als oder gleich
1), und wenn die Beziehung
SCZJ0]
befriedigt ist, so kann das Bild f(x) als zu dem Bild fo(xj
gehörig identifiziert werden, und wenn diese Beziehung nicht befriedigt ist, kann das Bild f(x) als nicht zu dem
Bild /oßrjgehörend identifiziert werden.
Das zuvor geschilderte Verfahren zur Bestimmung der Ähnlichkeit eines Eingabebildes mit einem Bezugsbild unter Verwendung der Gleichung (1) wird als das
einfache Ähnlichkeitsverfahren bezeichnet
Die Ähnlichkeit S[f, F0] bleibt unbeeinflußt, wenn die
Dichte der Dichtefunktion f(x) als Ganzes gleich A, multipliziert mit der ursprünglichen Dichte, beträgt,
wobei diese letztere Dichte als Af(x) ausgedrückt wird, wobei A eine beliebige Konstante darstellt. Demzufolge
läßt sich das zuvor erwähnte einfache Ähnlichkeitsverfahren günstig dort einsetzen, wenn ein Bild {χ. Β. ein
Buchstabe) mit solcher Gestalt identifiziert werden soll, daß selbst dann, wenn das Bild Dichte-Schwankungen
aufweist, eine f(x) zugehörige Kategorie nicht geändert wird.
Ein normales Bild ist jedoch aus vielerlei Gründen in
gewissem Ausmaß deformierbar, und zwar zusätzlich zu Dichteschwankungen. Dort, wo beispielsweise die
Position für das Bezugsbild versetzt ist, wird die einfache Ähnlichkeit 5 direkt beeinflußt, und sie stellt
einen Wert dar, der von einem wahren Verfahren abweicht
Hierdurch wird einer Verbesserung der Erkennung eine Grenze gesetzt, die auf dem einfachen Ähnlichkeitsverfahren
basiert. Um diese Nachteile zu beseitigen, wurden bereits viele ähnliche Verfahren vorgeschlagen.
Bei dem Vielfach-Ähnlichkeitsverfahren wird eine Zahl M von Bildern Φ\(χ), Φι(χ), ■ ■. &m(x), die eine
orthogonale Beziehung zueinander besitzen, als Bezugsbilder vorbereitet und zwar an Stelle eines einzelnen
Bezugsbildes fo(x), welches eine bestimmte Kategorie darstellt Wenn ein Eingangsbild oder Eingabebild f(x)
gegeben ist wird eine Zahl M von Ähnlichkeiten S[f, Φη,]
(m = 1,2,..., M) zwischen dem EingabebilJ f(x) und der
Zahl Mder Bezugsbilder berechnet Hieraus läßt sich
s* LZ] =/Σί s [/, φ J }2
erhalten.
In diesem Fall wird die Erkennung von der Tatsache abhängig erreicht ob der Wert von 5*[/j die folgende
Ungleichung befriedigt oder nicht:
S*[Z3
Vielfach-Ähnlichkeit S\f] bleibt selbst dann unbeeinflußt
wenn die Position des Bezugsbildes im Bildraum verschoben ist Aus Fig.2 läßt sich erkennen (eine
Ansicht zur Erläuterung eines Unterschiedes zwischen dem einfachen Ähnlichkeitsverfahren und dem Vielfach-Ähnlichkeitsverfahren),
daß Θ* einen Winkel darstellt der zwischen dem Eingabebild f(x) und derjenigen
Komponente von f(x) vorhanden ist die auf eine Hiper-Ebene C (hiperplane) projiziert ist wobei diese
Ebene durch die Bewegung des Bezugsbildes geformt ist Der Wert 5* [/], wie er auf der Grundlage des
Vielfach-Ähnlichkeitsverfahrens erhalten wird, entspricht dem cos Θ. Dies bedeutet daß die Ähnlichkeit
des Eingabebildes f(x) mit dem Bezugsbild, welches bewegt werden kann, beurteilt werden kann.
Die eingangs erwähnte Anordnung nach der DE-OS 20 54 546 arbeitet nach diesem Vielfach-Ähnlichkeitsverfahren
und erbringt durch die besondere Art der Weiterverarbeitung der skalaren Produkte sich klar
unterscheidende Werte, aus denen dann mit hoher Genauigkeit dasjenige Bezugsmuster ermittelt werden
kann, welches fcm Eingangsmuster entspricht wobei
diese Genauigkeit insbesondere nicht durch Positionsverschiebungen des Eingangsmusters auf dem Rasterzerlegungsfeld
beeinflußt wird. Die Praxis hat jedoch gezeigt, daß es trotz der hohen Allgemeinsicherheit
dieser vorbekannten Anordnung es dann doch noch zu Schwierigkeiten und damit Fehlerkennungen kommen
kann, wenn es um die Unterscheidung zweier sehr ähnlicher Bezugsmuster geht, etwa der Unterscheidung
zwischen dem Buchstaben »1« und der Ziffer »1« bei manchen Schreibmaschinenschriften.
Aufgabe der Erfindung ist es deshalb, die erwähnte vorbekannte Anordnung in der Weise zu verbessern,
daß eine zusätzliche Sicherheit der Erkennung auch solcher Muster erreicht wird, die einander äußerst
ähnlich sind. Die Lösung dieser Aufgabe ist im Kennzeichen des Anspruchs 1 angegeben.
Nachfolgend sollen nun einige technische Erläuterungen zum Problem der Unterscheidung zwischen zwei
unterschiedlichen Mustern, also Mustern unterschiedlicher »Kategorie« gegeben werden, unter besonderer
Berücksichtigung des Falles, daß diese Muster unterschiedlicher Kategorie einander sehr ähnlich sind.
Es sei eine Zahl K von Kategorien betrachtet, auf welche ein Bild zum Zwecke der Erkennung bezogen ist
Eine Zahl von M von Bezugsbildern Φι (k>(x), Φ2(^(χ), ■ ■ ■
Φ\/ν(χ) wird einleitend für irgendeine Zahl K von
Kategorien beispielsweise die k'te Kategorie vorbereitet.
Es sei hervorgehoben, daß diese Bezugsbilder eine orthonormale Beziehung befriedigen.
(Φ,/1, 0jk)) = Hm = m')
0(m =Sf m')
0(m =Sf m')
Der durch Gleichung (7) definierte Wert der Der Ausdruck »orthonormal« wird hier in der
mathematischen Sprache verwendet und unterscheidet sich von »Normalisierung«, welcher Ausdruck in der
Bilderkennung verwendet wird. Die in der Bilderkennung verwendete Bezeichnung »Normalisierung« bedeutet,
daß beispielsweise ein verschobenes Buchstabenbild mit einer Bezugslage oder -position ausgerichtet
wird und ein handgeschriebener Buchstabe, der von Person zu Person unterschiedlich ist wird auf eine
vorbestimmte Größe vergrößert oder verkleinert.
(10)
eine orthonormale Beziehung befriedigt:
x) ψ M) =
W, ν. )
(η,η' = 1,2 ... N)
und eine orthogonale Beziehung
(0jk\'Fn lk)) = 0
(m=l,2...M;n=l,2...JV)
und eine orthogonale Beziehung
(0jk\'Fn lk)) = 0
(m=l,2...M;n=l,2...JV)
zum Bezugsbild {ΦπΡΊζχ^.
Φ^1 und !PnW sind so bestimmt, daß sie die
Beziehungen (9), (10) und (11) befriedigen. Φ^>υηά Ψ Jk>,
die diese Beziehungen befriedigen, existieren in unendlicher Zahl. Demzufolge läßt sich hinsichtlich der
Komponenten, die am besten die Verteilung des Men Bildes $i(k), Φι(Ι() ... Φ^ν ausdrucken, diese Komponenten
zuerst durch Verwendung der Gleichung (9) bestimmen. Dann kann Ψ\(1(), Ψ 4k) unter Verwendung
der Gleichung (10) und (11) bestimmt werden.
Die Zahl von M, N wird in Abhängigkeit von der Natur der Bilder, die erkannt werden sollen, bestimmt.
Normalerweise wird M so ausgewählt daß sie 3 oder mehr entspricht und N wird so ausgewählt daß es der
Zahl der Bilder entspricht die in jeder Kategorie enthalten sind, die eine Ähnlichkeit mit einem speziellen
Bild besitzt Beispielsweise hat der englische Buchstabe »O« eine Ähnlichkeit mit einer numerischen Figur »0«
und dem englischen Buchstaben »D« und »Q«, und in diesem Fall wird N so ausgewählt daß es 3 entspricht.
Eine numerische Zahl »7« besitzt eine Ähnlichkeit mit einer numerischen Zahl »9«, und in diesem Fall wird N
so ausgewählt daß es 1 entspricht
Daher läßt sich ein gegebenes Bild f(x) in die Form erweitern:
Für die Me Kategorie wird außerdem eine Zahl N
von Bezugsbildern Ψ^)(χ), <P2M(x), ■ ■ ■ ff/V(x) vorbereitet,
wobei diese Komponenten eine orthogonale Beziehung zu dem Bezugsbild [Φ^)(χ^ aufweisen, die in
solchen Bildern enthalten sind, die eine relativ große Ähnlichkeit mit der Men Kategorie besitzen und als zu
einer unterschie<ilichen Kategorie gehörend betrachtet
werden. Es sei hervorgehoben, daß die Zahl TV der Bezugsbilder
+Σ
10 Das innere Produkt kann geschrieben werden als: (f(x),0jk)) = am + (Ιι*\χ),Φη«\χ))
wobei die Forderung nach einer Orthogonalität wie in den Gleichungen (9) und (11) ausgedrückt, in Betracht
gezogen werden muß.
Bei dem Ausdruck (13) ergibt sich:
Bei dem Ausdruck (13) ergibt sich:
20 ähnlich
(14a)
(14b)
Es kann gesagt werden, daß der Rest hfk>(x) die
Gleichungen (14a) und (14b) befriedigt
Aus einem inneren Produkt zwischen f(x) und f(x) läßt
sich der quadratische Wert einer Norm wie folgt ausdrücken:
45
so
Il/IF | = (/(χ | )J(x)) | N )+Σ* π = 1 |
, M
= Σ< \m=I |
4 + Σ | ||
/ M | α Φ '% | Ji=I | |
tn = | I | ||
-ti
m=\ m' |
= 1 | ||
ra=l«=l
+ Σ am(4>Jkl(x),hik)(x))
m=1
m-' " = 1 (12)
wobei i,0m'k){x)} und \'l'n <k)(x)} verwendet werden, in
welchen die Erweiterungskoeffizienten {am}, {b„} jeweils
gegeben sind als:
55
am=(f,0m (k)) (m=l,
60
(13)
Ein inneres Produkt zwischen der rechten Seite der Gleichung (12) und 0„m ist wie folgt ausgedrückt:
- Σ Jl
η = ]m = 1
Λ1
π= ΐπ^Ί
π= ΐπ^Ί
+Σ K(lK<k)(
+Σ am{hm(x),0jk)(x))
Aus der Gleichung (9) wird der erste Ausdruck auf der dritte, sechste, siebente und achte Ausdruck zu Null; und
rechten Seite der zuvor erläuterten Gleichheit zu aus Gleichung (10) wird der fünfte Ausdruck zu
m=l
ΣΚ2.
5
π =
aus Gleichung (11) werden der zweite und der vierte Somit läßt sich die zuvor erwähnte Gleichung wie
Ausdruck zu Null. Aus der Gleichung (14) werden der folgt schreiben:
?+\\ΐιΜ\ΐ (15)
Nun läßt sich die Ähnlichkeit Ok[/] — im folgenden welches zur Men Kategorie gehört, wie folgt
als »eine gemischte Ähnlichkeit« bezeichnet — definieren:
irgendeines Eingabebildes f(x) zu einem Bezugsbild, 15
irgendeines Eingabebildes f(x) zu einem Bezugsbild, 15
n=1
(16)
wobei die Parameter Xm, μπ reale Zahlen sind und folgenden Bereich umfassen:
il = A2 ^ A2 ^ ... 1 lM
> 0 [l ^ /J1 ^ /i2
> ... > uN > 0 Durch Substitution der Gleichung (1) in Gleichung (16) erhält man:
(17)
Von den Ausdrücken (9) und (13) erhält man:
(18)
Die Gleichung (16) läßt sich auch wie folgt ausdrücken:
Aus Gleichung (15) erhält man:
Λ_
Λί
m=1 |
- | j | = im +a | I1Z=A2 | 2 | n=l | ~Σ (i +/0^n2 71=1 |
|
ILrIP J | * | ,V 'm2 +Σ |
Tb2 | |||||
m- | -1" - | |||||||
II*»IP |
M
Σ/ |
>.'-£ | ||||||
ll/IP J | M | |||||||
Πγλ | ||||||||
ILTlP J | m=l m |
(19)
Wie sich aus Gleichung (16) erkennen läßt, nimmt die gemischte Ähnlichkeit Ök)[f2 irgendeine reale
Zahl ein, und zwar in dem Bereich von:
Insbesondere gilt, wenn das Eingabebild gleich ist:
da aus Gleichung (12), N = 0, M = 1 und h(k)(x) = 0 und dann
= λ,
Da aus Gleichung (17) A1 = 1, ergibt sich
= i.
= i.
Die Ausdrücke | am | und | bm |, die in den Gleichungen
(12) und (15) enthalten sind, stellen die Größe der Projektionskomponenten des Eingabebildes f(x) dar,
welches Φ^>(χ), 1PJ* betrifft. Dies kann leicht in
Verbindung mit der Gleichung (3) gegebenen Erklärung verstanden werden.
Andererseits |[ h(k)\\ die Größe eines Restes dar, der
unterschiedlich ist zu
Es kann demzufolge gesagt werden, daß Gleichung (19) den Weg zeigt, auf welche Weise diese Komponenten
den Wert der gemischten Ähnlichkeit Ok{f\ beeinflussen.
Der erste Ausdruck aus der rechten Seite von Gleichung (19) zeigt nämlich den durch ||AW||
bewirkten Effekt, und der zweite Ausdruck auf der rechten Seite dieser Gleichung zeigt die durch {| am |},
j| b„ \\ bewirkten Einflüsse. Somit gilt:
(\-?.m)am
(22)
Gleichung (19) zeigt, daß \am\ als kleiner als das
Ausmaß bewertet wird, bis zu welchem der Parameter tatsächlich einer Deformation unterworfen wird, während
I b„ I als größer als das Ausmaß bewertet wird, bis
zu welchen der Parameter tatsächlich einer Deformation unterworfen wird. Mit anderen Worten, besitzt die
gemischte Ähnlichkeit Qk>[f\ eine Charakteristik, daß
hinsichtlich der Deformationskomponenten, die für die in Rede stehende Me Kategorie zulässig sind, eine
zulässige Diskriminier-Auswertung durchgeführt wird und daß hinsichtlich der leicht verwechse'.barsn
Komponenten siine schwerwiegende Diskriminier-Auswertung
ausgeführt wird.
Es soll die Bedeutung im folgenden qualitativ erklärt werden, und zwar unter Verwendung eines Beispielfalles,
bei dem das Eingabebild aus einer numerischen Figur »0« besteht und das Bezugsbüd ein englischer
Buchstabe »O« ist Diese Bilder »0« und »O« sind auf
Grund der großen Ähnlichkeit untereinander verwechselbar, wenn irgendeines dieser Bilder einer Deformation
unterworfen wird. Wenn jedoch diese Bilder einer Dichteveränderang als Ganzes unterworfen werden,
oder unter Beibehaltung einer »Ähnlichkeitsentsprechend« verändert werden, so besteht kein Risiko einer
Verwechslung. Wird die numerische Figur »0« in der Breite deformiert bzw. vergrößert, so hört jegliche
(21)
Unterscheidungsmöglichkeit zwischen »0« und »O« auf.
Es soll nun an Hand eines ai.deren Beispiels der Fall
betrachtet werden, bei dem das Eingabebild aus einer numerischen Figur »1« besteht und das Bezugsbüd aus
einem englischen Buchstaben »I«. Diese Bilder sind verwechselbar, wenn der seitliche Balken oder Vorsprung
am Kopf des »I« oder »1« geändert wird. Dies bedeutet daß die numerische Figur »1« erkannt wird,
wenn kein seitlicher Balken zur rechten Seite hin am Kopf abschnitt des Bildes »1« absteht Der englische
Buchstabe »I« kann erkannt werden, wenn ein seitlicher Balken oder Querbalken zur rechten Seite am
Kopfabschnitt des Bildes »I« ragt Es kann auch eine Erkennung vorgenommen werden in Abhängigkeit
davon, ob der Querbalken am Kopfabschnitt des Bildes »1« oder »I« geneigt abfällt oder nicht. In diesem Fall
kann eine Unterscheidung zwischen »I« und »1« selbst
dann erzielt werden, wenn ein Querbalken am unteren Abschnitt des numerischen Zeichens »1« einer Deformation
unterworfen ist In dieser Weise gibt es zwei Typen von Komponenten: der eine Typ, der selbst dann
identifizierbar ist wenn die genannte Deformation zwischen Bildern auftritt die ähnlich untereinander sind,
jedoch einer unterschiedlichen Kategorie zugehören; und der andere Typ, der nicht unterschieden werden
kann, wenn diese Deformation stattfindet Gemäß dem gemischten Ahnlichkeitsverfahren nach der Erfindung
wird eine zulässige Unterscheidungsauswertung hinsichtlich des früheren Typs der Komponente durchgeführt
und es wird eine schwerwiegende Unterscheidungswertung hinsichtlich des letzten Typs der Komponente
durchgeführt, d. h. jegliche Deformation wird so ausgewertet als ob keine größere Deformation
stattgefunden hat
Es sei nun angenommen, daß bei 1 >
ε > Q (s ist eine positive Zahl) die Beziehung
(23)
gegeben ist Dann wird unabhängig davon, ob das
Eingabebild f(x) zur Jt'ten Kategorie gehört oder nicht
diese in Abhängigkeit davon bestimmt, ob die Beziehung befriedigt wird oder nicht In diesem Fall,
wird die Bestimmung unter der zuvor erwähnten Auswertung durchgeführt Bei dem zuvor erwähnten
gemischten Ähnlichkeitsverfahren gut, wenn N=Q ist:
Bei \m = 1 und am = (/,<Pm (k)) läßt sich die zuvor angeschriebene
Gleichung in folgender Weise ausdrücken :
IM
M (f φ »ψ
Durch Multiplizieren des Nenners der rechten Seite der zuvor angeschriebenen Gleichung mit
11<i>„jf2 = 1 ergibt sich:
Wenn die uadratwurzel der rechten Seite der zuvor angeschriebenen Gleichung als S*[/] betrachtet
wird, so ergibt sich:
(24)
was der Vielfachähnlichkeit von Gleichung (7) entspricht.
Für M = 1 gilt:
S*ifl = \ Si f.Φι? = S[/, Φi]
Wenn (P1 = /0, wird
was mit der einfachen Ähnlichkeit, die in Gleichung (1)
wiedergegeben ist, identisch ist.
Aus der vorangegangenen Beschreibung läßt sich erkennen, daß das gemischte Ähnlichkeitsverfahren
eine Erweiterung des einfachen und Vielfach-Ähnlichkeitsverfahrens darstellt.
Das gemischte Ähnlichkeitsverfahren wurde in theoretischer Hinsicht erläutert. Bei den Idenlifikationssystem
wird die Vorbereitung eines Musters oder einer Probe durchgeführt Ein gleichmäßiges Eingabebild f(x)
wird in Form von Dichtewerten an einer Zahl L von Probepunkten ausgedrückt, und f(x) wird in Form von
(fu f2 ... fr fr, ■■■ fi) gegeben. Dann wird ein inneres
Produkt zwischen den zwei Bildern F(x) und g(x) nicht in
integraler Form ausgedrückt, wie diese durch Gleichung
(2) definiert ist, sondern in folgender Form:
(25)
Es ist wohlbekannt, daß Gleichung (2) in der Multiplizier-Addierform. wie in Gleichung (25) gezeigt
ist, umgeschrieben werden kann, und zwar unter Verwendung eines bekannten Probe-Theorems. Wenn
irgendein Eingabebild als Vektorkomponenten (f\, f% .. fL) ausgedrückt werden kann und das innere Produkt
der Gleichung (25) definierbar ist, so gelten alle Erläuterungen in Verbindung mit dem gemischten
Ähnlichkeitsverfahren.
Die Gleichung des gemischten Ähnlichkeitsverfahrens kann reduziert werden auf:
σ σ,
m=l
-σ υ,
χι - e) Hy IP,
(26)
die durch Substitution der Gleichung (18) in Gleichung
(23) und unter Verwendung der Gleichung (13) erhalten
werden kann.
In der Gleichung (26) werden die Parameter Xm, μη
einleitend als bekannte Größen vorbereitet.
Es ist daher lediglich erforderlich, eine Anordnung zur Bildmustererkennung zu realisieren, welches bestimmen kann, ob die zuvor erwähnten Parameter die Gleichung (26) hinsichtlich des Hingabebildes / befriedigen oder nicht.
Es ist daher lediglich erforderlich, eine Anordnung zur Bildmustererkennung zu realisieren, welches bestimmen kann, ob die zuvor erwähnten Parameter die Gleichung (26) hinsichtlich des Hingabebildes / befriedigen oder nicht.
ίο Im folgenden wird die Erfindung an Hand eines
Ausführungsbeispiels unter Hinweis auf die Zeichnungen näher erläutert. Es zeigt
F i g. 1A die Positionubeziehung in einem Bildraum
von Bildern oder Bildrnustern, die einer bestimmten Kategorie zugehören,
F i g. 1B eine numerische Figur »7«, die durch die sich
ändernde Dichte einer Vielzahl von Quadraten dargestellt ist,
F i g. 2 eine relative Beziehung zwischen einem einfachen Ähnlichkeitsverfahren und einem Vielfach-Ähnlichkeits
verfahren,
F i g. 3 ein Blockschallbild der grundlegenden Anordnung
gemäß einer Ausführungsform zur Bildmustererkennung nach der Erfindung,
F i g. 4 ein Blockschaltbild, welches schematisch eine gemischte Ähnlichkeit-Rechenschaltung aus Fig. 3
zeigt,
F i g. 5 ein Blockschaltbild gemäß einer detaillierten Anordnung einer Rechen/Vergleichsschaltung von
Fig.4,
F i g. 6 ein Blockschaltbild zur Berechnung der Norm Il /||2einer Eingangssignalwertfolge oder -zuges,
Fig. 7 ein Blockschaltbild einer Multiplizier-Summier-Schaltung,
um die Summe der inneren Produkte von zwei Bildfunktion zu erhalten;
Fig.8 eine detaillierte Schaltungsanordnung der Multiplizier-Summier-Schaltung von F i g. 7.
F i g. 9 eine Schaltung zur Durchführung der Annäherung einer Spannung-Strom-Charakteristik an die
charakteristische Kurve der Quadrate mit unterbrochen gezeichneter Linie,
Fig. 10 eine Ausführungsform einer Quadrierschaltung in F i g. 5,
F i g. 11 eine detaillierte Schaltungsanordnung einer
Ausführungsform einer Vergleichsschaltung in F i g. 5,
Fig. 12 ein Blockschaltbild einer anderen Ausführungsform
einer Gernischtähnlichkeits-Rechenschaltung, die bei der Bildmustererkennung nach der
Erfindung verwendet wird,
F i g. 13 eine schematische Darstellung einer weiteren
Ausführungsform nach der Erfindung,
Fig. 14(a)—14(c) drei Beispiele eines orthonormalen
Bildes, welches beim Gegenstand der Erfindung verwendet wird und Fig. 14(d) ein Bezugsbild, welches
einer Men Kategorie zugehört; und
F i g. 15 ein Blockschaltbild einer Schaltung zur Vorbereitung der Bilder von den Fig. 14(a)—14{c) aus
dem Bild von F i g. 14{d).
In F i g. 3 wird ein Eingabebild 1, beispielsweise eine numerische Figur »7«, «die auf weißes Papier geschrieben
ist, durch einen photoelektrischen Wandler 2 abgetastet, der mit einer Abtastvorrichtung wie
beispielsweise einem Iichtpunkt-Abtaster ausgestattet ist, und es wird ein elektrisches Signal Si, welches dem
Schatten des Bildes t entspricht, durch den Abtaster erhalten. Das elektrische Signal Si wird einer Vorverarbeitungs-Vorrichtung
3 zugeleitet, in der das Signal vorbearbeitet wird, und zwar hinsichtlich der NormaE-
sation der Position und der Dirke des Eingabebildes und
des Bezugsbildes. Ein Ausgangssignal S2 der vorverarbeitenden
Vorrichtung gelangt zu einer Mischähnlichkeit-Rechenschaltung 5 der Anordnung zur Erkennung
von Bildmustern. Das Ausgangssignal der Rechenschaltung 5 gelangt zu einer Identifikationsschaltung, in
welcher das Eingabebild identifiziert wird. Der photoelektrische Wandler 2 und die vorbearbeitende
Schaltung 3 können in herkömmlicher Weise ausgeführt sein.
F i g. 4 zeigt ein Blockschaltbild einer Gemischtähnlichkeit-Rechenschaltung,
die in F i g. 3 gezeigt ist. Das Ausgangssignal S2, d. h. das Eingabebild / der
vorverarbeitenden Schaltung wird einer Zahl K von Rechen-Vergleichsschaltungen 501, 502, ... 50/C zugeführt,
in den Rechen-Vergleichsschaltungen wird ein Vergleich zwischen den Eingabebildern /und der Zahl K
der Kategorien, die einleitend für eine Vergleichung vorbereitet wurden, durchgeführt, und die Identifikation
wird hinsichtlich der Kategorie durchgeführt, zu welcher das Eingabebild /gehört
F i g. 5 zeigt ein Blockschaltbild mit einer k'ten
Schaltung [5Qk), die als repräsentatives Beispiel für die
Rechen-Vergleichsschaltungen von Fig.4 ausgewählt wurde. Das Eingabebild /wird einer Anzahl Λ/νοη das
innere Produkt berechnenden Schaltungen 511, 512,... 51Λί zugeführt, die eine erste Gruppe darstellen, und es
werden innere Produktrechnungen zwischen dem Eingabebild /und
I T^ (h M \ \ rft M
Die Differentialschaltung 154 ist so ausgelegt, daß sie
die Differenz zwischen zwei benachbarten Punkten zu jeweils der x- und der y-Richtung des kanonischen
Bildes erfaßt und diese speichert. Die so erhaltenen Differentialbilder fj» (x-Richtung) und ψ>
fy-Richtung) werden an die Betriebsschaltungen 155-2 und 155-3
abgegeben. Die Betriebsschaltung 155-1 empfängt das BezugsbUd fa und führt folgende Rechnung durch:
ll/ol
(33)
Die Betriebsschaltung 1S5-2 empfängt die Differentialbilder fx und fy und führt die folgende
Rechnung durch:
(34)
Die Betriebsschaltung 155-3 empfängt die Differentialbilder
fx und/,, und führt folgende Rechnung
aus:
durchgeführt.
Die Fig. 14(a)—(c) zeigen drei Beispiele von
orthogonalen Bildern Φ^Ι <P2 fk>. ... Φ^>. In diesen
Figuren bezeichnet ein fester schwarzer Punkt einen positiven Dichtewert, während ein schattierter Punkt
einen negativen Dichtewert bezeichnet. Die Größe dieser Punkte gibt die Größe dieser Werte an. Diese
drei Bilder befriedigen jeweils die Gleichung (9), und wenn hinsichtlich zweier dieser drei Bilder die
Dichtewerte von entsprechenden Punkten multipliziert und summiert werden, so erhält man eine Null. Die drei
orthogonalen Bilder, die in den Fig. 14(a)—(c) gezeigt
sind, werden vorbereitet, und zwar auf der Grundlage des Bezugsbildes, welches repräsentativ ist für die Me
Kategorie, die in F i g. 14(d) gezeigt ist. Der Vorgang der Vorbereitung der Bilder von Fig. 14(a)—(c) aus dem
Bild von Fig. 14(d) soll unter Hinweis auf dadurch Fig. 15 erläutert werden. In Fig. 15 wird ein Abtastsignal,
welches über die gesamte Fläche des Bildes von Fig. 14(d) gefahren ist, einem Anschluß 151 zugeführt
und gelangt dann zu einer Probeentnahmeschaltung 152. Die Probeentnahmeschaltung ist, wie allgemein
bekannt, so ausgelegt, daß sie das Eingabebild in ein aus Proben bestehendes Bild umwandelt, welches eine
vorher bestimmte Zahl von Probeentnahmepunkten aufweist, und zwar bei diesem Ausführungsbeispiel
16 χ 16 Punkte. Die Ausgangsgröße der Probeentnahmeschaltung 152 gelangt zu einer Schaltung 153, in der
der gemittelte Dichtewert des Bildes von dem Dichtewert abgezogen wird, der jedem Punkt des so
vorbereiteten Probebildes entspricht. Demzufolge stellt ein Bild, welches aus der Schaltung 153 erhalten wird,
ein Bild Z0W dar, welches für eine Abweichung vom
gemittelten Dichtewert repräsentativ ist. Die Ausgangsgröße der Schaltung 153 wird einer Differentialschaltung
154 und einer Betriebsschaltung 155-1 eingespeist.
ι 1 Λ Λ
1/2(1-/) \\\fx Il II/,
(35)
In den Gleichungen (34) und (35) ist / wie folgt gegeben:
J =
ll/JIII/,11
(36)
Die Normgrößen || Φι<*·Ί|, ||Φ/*·Ί| und || Φβ)\\ der
Bilder ΦιW, Φ2Μ und Φ^>
sind alle 1, und ein inneres Produkt zwischen Φ\, Φ2; Φ2, Φ3 und Φ3, Φι sind alle 0,
wobei eine orthonormale Beziehung befriedigt wird.
Die so erhaltenen drei orthonormalen Bilder sind in den Fig. 14(a)—(c) gezeigt, und sie werden als
Bezugsbilder verwendet
Gemäß Fig.5 werden die Ausgangssignale a\, a2...
Sm der das innere Produkt berechnenden Schaltungen
einer Anzahl M von Quadrierschaltungen 521, 522, ... 52Λ/zugeführt, in denen
berechnet wird. Die Ausgangssignale Ci, C2,... Cm der
Quadrierschaltungen werden einer ersten Summierschaltung 53 zugeführt, um eine Summenausgangsgröße
ik zu erzeugen. Das bedeutet, daß die Ausgangsgröße /Jt identisch ist mit:
was der erste Ausdruck auf der linken Seite der Ungleichung (26) ist.
Das Eingabebild / wird gleichzeitig der N-Zahl der
das innere Produkt berechnenden Schaltungen 541,542, ... 54N zugeführt, die eine zweite Gruppe darstellen, in
der innere-Produkt-Berechnungen zwischen dem Eingabebild /und
durchgeführt werden.
Hier werden die Bezugsbilder ^P1W, !P2W, ...
durch denselben Vorgang erhalten wie im Fall von Φ
durch denselben Vorgang erhalten wie im Fall von Φ
Die Ausgangssignale b\, bi, ... ö/v der das innere
Produkt berechnenden Schaltungen gelangen zu einer Anzahl N von Quadrierschaltungen 551,552,... 55N, in
denen
W Ι
berechnet wird. Die Ausgangssignale d\, dz,... d^ der
Quadrierschaltungen werden einer zweiten Summierschaltung 56 zugeführt, um eine Summenausgangsgröße
jkzu erzeugen. Das bedeutet, daß die Ausgangsgröße,//:
identisch ist mit:
welches den zweiten Ausdruck auf der linken Seite der
Ungleichung (26) darstellt
Das Eingabebild /wird gleichzeitig der anderen das innere Produkt berechnenden Schaltung 57 eingespeist
bzw. aufgedrückt, in der || /||2 berechnet wird. Da das Eingabebild /als Folge von einer Zahl L von Werten (f\,
4 ... fL) zugeführt wird, beträgt der Recheninhalt von
H /Ipgleich:
II/ IF= V /r 2 (27)
r = I
Die detaillierte Schaltungsanordnung zur Durchführung der Berechnung von Gleichung (27) soll im
folgenden erläutert werden.
Das Ausgangssignal e der das innere Produkt berechnenden Schaltung 57 wird einer Koeffizient-Multiplizierschaltung
58 zugeführt, in der dieses Signal mit einem Koeffizienten (1 —ε) multipliziert wird.
Die Ausgangsgröße Ik der Koeffizient-Multiplizierschaltung
und die Ausgangsgröße jk der zweiten Summierschaltung werden einer weiteren Addierschaltung
59 zugeführt, in welcher eine Berechnung von jk + Ik ausgeführt wird. Die Ausgangsgröße pk der
Addierschaltung 59 besteht aus einem Wert, der durch Transponieren des zweiten Ausdrucks der linken Seite
der Ungleichung (26) auf die rechte Seite derselben erhalten wird.
Die Ausgangsgröße ik der ersten Summierschaltung 53 und die Ausgangsgröße pk der Addierschaltung 59
gelangen zu einer Vergleichsschaltung 60, in der ein Vergleich zwischen ik und pk vorgenommen wird.
Wenn ik > pk befriedigt wird, so erscheint eine Ausgangsgröße qk an der Vergleichsschaltung 60. Dies
bedeutet, daß dann, wenn die Ungleichung (26) befriedigt ist, die Ausgangsgröße qk aus der Vergleichsschaltung
erscheint. Das Erscheinen der Ausgangsgröße qk zeigt, daß das Eingabebild /zu der Men Kategorie
einer Anzahl K von vorbereiteten Kategorien gehört.
F i g. 6 zeigt ein Blockschaltbild einer Schaltung zur
Durchführung der Rechnung gemäß der zuvor erwähnten Gleichung (27). Eine Zahl L von Eingangssignalen /j,
4... /r... //. werden den Quadrierschaltungen 601,602,
.. .6Or... 6OL jeweils zugeführt. Nachdem ή2, /2 2... /r 2...
Fl2 berechnet sind, gelangen die Ausgangsgrößen der
Quadrierschaltungen zu einer Summierschaltung 61.
F i g. 7 zeigt ein Blockschaltbild zur Durchführung der Rechnung gemäß der zuvor erwähnten Gleichung (25).
Eine Anzahl L von Eingangssignalen f\, /2... 4 werden
einer Muliiplizier-Summier-Schaltung 70 zugeführt, in
der eine Multiplizier-Summier-Rechnung elektrisch zwischen fu f>
... 4 und g\, gi ... gu g\, gi ■·· gL
durchgeführt wird. gL kann dadurch erhalten werden,
indem man das Verhältnis zweier elektrischer Widerstände, die an späterer Stelle beschrieben werden sollen,
bestimmt
Fig.8 zeigt eine Schaltungsanordnung eines Beispiels
einer Multiplizier-Summier-Schaltung 70. Es werden Spannungen, die zu den Eingangssignalen /1—/r
jeweils proportional sind, den Eingangsanschlüssen h—L· der Multiplizier-Summier-Schaltung 70 eingespeist
Ein Verhältnis RpIRr eines Rückkopplungswiderstands
Rf zu irgendeinem beispielsweise zu Rr der
Widerstände R\—Rl wird als ein bekannter Wert gr
genommen. Wenn ein Operationsverstärker A so ausgewählt und ausgelegt wird, daß er einen ausreichend
hohen Verstärkungsfaktor besitzt, so wird eine Spannung
2j D 2j SrJr
r=I
(28)
als Ausgangsgröße vom Ausgangsanschluß / der Multiplizier-Summier-Schaltung 70 abgeleitet, und zwar
basierend auf dem Prinzip einer gut bekannten analogen Multiplizier-Summier-Schaitung. Die Multiplizier-Summier-Schaltung
von F i g. 8 kann mit einer Anzahl M von das innere Produkt berechnenden Schaltungen 511,512,
... 51Mverbunden sein (die ersteGruppe) und kann mit einer Zahl N von das innere Produkt berechnenden
Schaltungen 541, 542, ... 54N (die zweite Gruppe) verbunden sein, die beide in F i g. 5 gezeigt sind. Dies
bedeutet, daß die Werte
l/W", IA2*Λ
und
nur als das Verhältnis RrfRr des Widerstandes Rf zum
Widerstand Rr umgeschrieben zu werden brauchen. Die
in F i g. 8 gezeigte Multiplizier-Summier-Schaltung kann nicht nur als Rechenschaltung für das innere
Produkt verwendet werden, sondern auch als Summierschaltung für
Σ/γ
r= I
r= I
(vorausgesetzt, daß g\ = gi — ■■■ = gi = 1). Diese
Größe kann der ersten und der zweiten Summierschaltung 53 und 56 von Fig.5 zugeführt werden. Es sei
angenommen L = 1 und g\ = 1. Dann kann die Multiplizier-Summierschaltung von F i g. 8 ebenso als
Schaltung verwendet werden, um eine Ausgangsgröße -/1 zu erhalten, bei welcher das Vorzeichen eines
Eingangswertes /1 umgedreht ist.
Fig.9 zeigt eine detaillierte Schaltungsanordnung
entsprechend einem Beispiel einer Zahl M von Quadrierschaltungen 521, 522, ... 52M (die erste
Gruppe) und eine Anzahl N von Quadrierschaltungen 551,552,... 55N(die zweite Gruppe), wie dies in F i g. 5
gezeigt ist. Bei der Schaltungsanordnung von Fig.9 sind eine Zahl N von Dioden D\ — D„ zwischen einem
Paar von Eingangs- und Ausgangsanschlüssen in Reihe geschaltet. Ein Ende der Widerstände R ist mit einem
Verbindungspunkt zwischen benachbarten Dioden verbunden, und das andere Ende ist mit einer Leitung
zwischen dem anderen Paar der Eingangs- und Ausgangsanschlüsse verbunden, wobei ein Kompensationswiderstand
2R (mit einem Widerstandswert, der doppelt so groß ist als derjenige der anderen
Widerstände) zwischen die Eingangsanschlüsse geschaltet ist Bei der gezeigten Schaltungsanordnung sei eine
Eingangsspannung durch E dargestellt; ebenso ein elektrischer Strom durch den Eingangsanschluß, durch /
dargestellt; und eine vorwärts vorspannende Spannung jeder Diode durch Ed. Dann läßt sich die folgende
Beziehung anstellen:
E = nEd
(29)
Ed
η Ed (η-I)Ed
IR R "■ R
Aus der Gleichung (29) ergibt sich:
2R
H1Ed
2R
(30)
Wenn η aus den Gleichungen (29) und (30) eliminiert wird, dann ergibt sich
(31)
Hieraus läßt sich erkennen, daß der elektrische Strom / proportional zum Quadrat der Eingangsspannung ist.
Dies bedeutet eine Annäherung der charakteristischen Kurve der Quadrate mit gebrochenen Linien. Tatsächlich
besitzen die Dioden jedoch nicht ideale gebrochene Linien-Eigenschaften, sondern exponentielle Funktionseigenschaften,
so daß die Quadrierschaltung einen noch besseren Grad an Annäherung besitzt. Gemäß Fig. 10
läßt sich ein quadrierter Ausgangsspannungswert von — E2 gegenüber einem Eingangsspannungswert von E
dadurch erhalten, indem man an die nachfolgende Stufe der Quadrierschaltung 100, die in F i g. 9 gezeigt ist,
einen Rückkopplungsverstärker A anordnet, dessen Rückkopplungswiderstand RF so ausgewählt ist, daß er
einen Widerstandswert von 2/?£ybesitzt.
F i g. 11 zeigt eine detaillierte Schaltungsanordnung
gemäß einem Beispiel der Vergleichsschaltung, die in F i g. 5 gezeigt ist
Die Vergleichsschaltung besteht aus einem bekannten Differentialverstärkerabschnitt 101 und einer bekannten
Schmidt-Schaltung 102. Zwischen den Eingangsanschlüssen h und h des Differentialverstärkers 101 wird
ein Differenzsignal gewonnen und verstärkt In dem Schmidt-Schaltungsabschnitt 102 erscheint an einem
ίο Ausgangsanschluß q, wenn ein Differenzsignal von
/ι — h positiv ist, ein Ausgangssignal von »1«, die auf ein
positives Potential gesättigt ist. Wenn umgekehrt das Differenzsignal negativ ist so erscheint ein Ausgangssignal
von »0« am Ausgangsanschluß q, welches auf einem Null-Potential liegt
In dieser Weise sind die jeweiligen Blöcke von F i g. 5 so ausgeführt, wie dies in den F i g. 8—12 gezeigt ist, und
es wird die Berechnung gemäß Gleichung (26) durchgeführt
Die Ausgangsgröße der Gemischtenähnlichkeit-Rechenschaltung
5, d. h. die Ausgangsgröße qk der Vergleichsschaltung 60 wird zusammen mit anderen
Ausgangsgrößen qi, q2..., wie dies in F i g. 4 gezeigt ist,
der Erkennungsschaltung 6 zugeführt Die Erkennungsschaltung 6 führt nach dem Empfang von irgendeiner
der Ausgangsgrößen qi — qfC der Rechen-Vergleichsschaltungen 501 —50K, eine Erkennung hinsichtlich der
Kategorie durch, zu welcher diese gehört Die Erkennung kann einfach dadurch ausgeführt werden,
indem man die Ausgangsgrößen q\ — qK in kodierter Form darstellt.
Fig. 12 zeigt ein Blockschaltbild einer anderen Ausführungsform der Gemischtenähnlichkeit-Rechenschaltung
5 der Anerkennung zur Bildmustererkennung nach der Erfindung. Bei dieser Ausführungsform von
F i g. 5 wird die Erkennung dahingehend durchgeführt, ob die Ungleichung (26) befriedigt werden kann oder
nicht Da jedoch offensichtlich ist, daß der Wert, d. h. (1—ε) P der linken Seite der Gleichung (26) keine
Bedeutung für k hat, wenn k so gewählt ist, daß der Wert:
15
20
25
30
m = 1
fi = 1
(32)
der linken Seite der Gleichung (26) ein Maximum wird, kann die Erkennung gemacht werden, daß das
Eingabebild / zur Men Kategorie gehört. Das Blockschaltbild gemäß Fig. 12 ist auf diesem Konzept
basierend aufgebaut.
Dies bedeutet, daß das Eingabebild /einer Schaltung zugeführt wird, um die Berechnung durchzuführen von
n=l
m=\
■ Σ(
m=1
Σ(
N
N
iV
f, fc1/·^21)2, . . . Σ(/. )if*nll'nk)?>
···!](/' π = 1 η =
Die Berechnung von
Σ (L
m=l
521— 52M und der Summierschaltung 53 durchgeführt, während die Berechnung von
65 N
wird in den das innere Produkt berechnenden "='
Schaltungen 511— 5\M, den Quadrierschaltungen in den Rechenschaltungen 541—54N, den Quadrier-
schaltungen 551 —55N und der Summierschaltung 56
durchgeführt wird.
Demzufolge können die Ausgangsgrößen il—lK der
Rechenschaltungen 1211 —121JC jeweils der Ausgangsgröße
ik der Nummierschaltung 53 entsprechen, die in
Fi g. 5 gezeigt ist, während die Ausgangsgrößen jil—JK
der Rechenschaltungen 1221 — 122K jeweils der Ausgangsgröße.//:
entsprechen können.
Aus den Ausgangsgrößen JI—iK und ß—jK können
entsprechende Ausgangsgrößen, die die gleiche Nachsilbe haben, den Subtrahierschaltungen 1231, 1232, ...
123Jt, ... 123/C zugeführt werden, in denen eine
Differenz zwischen il—ik und ß—jk gebildet wird. Die
Ausgangsgrößen P\ fi\ ... /W,... tfK) der Subtrahierschaltungen
1231,1232,... 123Jt.. ■ 123.K werden einer
Maximum-Bestimmungsschaltung 124 zugeführt, in welcher ein maximaler Wert t(k>
einer Zahl K von Werten bestimmt wird. Die Schaltung 124 erzeugt ein Ausgangssignal /, welches durch Kodierung der
Kategorie k entsprechend dem Maximalwert iPO
erhalten wird. Eine derartige Maximum bestimmende Schaltung ist bereits bekannt
Wie bereits erläutert wurde, wird ein elektrisches Signal, welches irgendehem abgetasteten Bild oder
Bildmuster entspricht, nachdem es vorverarbeitet wurde, einer Identifikationsschaltung zugeführt, in der
für jede von .K-Nummern von voreingestellten Nummern,
M-Nummern der Bezugsbilder {Φη(χ)ι vorgesehen
sind, die eine orthonormale Beziehung befriedigen, und eine Zahl N von Bezugsbildern \Ψβ>(χ}[ vorgesehen
sind, deren Komponenten eine orthogonale Beziehung zu dem Bezugsbild aufweisen und die orthogonale
Beziehung zueinander bzw. untereinander befriedigen, die in diesen Bildern vorhanden sind, die eine relativ
hohe Ähnlichkeit mit der £'ten Kategorie der Anzahl K von Kategorien zeigen und als zu einer unterschiedlichen
Kategorie gehörend betrachtet werden. In der Erkennungsschaltung wird die Erkennung durch Berechnung
der Gleichung (26) oder (32) zwischen dem hinsichtlich der Kategorie unbekannten Eingabebild
und dem einzelnen Bezugsbild durchgeführt. Wies dies aus der Erläuterung in Verbindung mit dem Gemischtenähnlichkeitsverfahren
nach dem Prinzip der Erfindung hervorgeht, läßt sich eine weitgehende Unterscheidung
zwischen dem Eingabebild und irgendwelchen leicht verwechselbaren Bildern durch die vorliegende
Erfindung realisieren, wobei diese Bilder zu einer unterschiedlichen Kategorie gehören und wobei diese
Unterscheidung nicht mit Hilfe des bekannten einfachen Ähnlichkeitsverfahrens und mit Hilfe des Vielfachähnlichkeitsverfahrens
erreicht werden kann. Gemäß der Erfindung wird somit eine zulässige Unterscheidungsauswertung hinsichtlich der Deformationskomponenten
durchgeführt, die für das Bild zulässig sind, welches zur ./C'fen in Betracht gezogenen Kategorie gehört, und es
wird eine tiefgreifende Unterscheidungsauswertung hinsichtlich der leicht verwechselbaren Komponenten
gemacht, die zu einer unterschiedlichen Kategorie gehören. Daher läßt sich eine Unterscheidung zwischen
einer numerischen Figur »0« und einem englischen Buchstaben »O«, einer numerischen Figur »1« und
einem englischen Buchstaben »I« usw. mit hoher Genauigkeit durchführen.
Obwohl die Anordnung zur Bildmustererkennung, welche auf dem Gemischtenähnlichkeitsverfahren basiert,
unter Verwendung von elektrischen Schaltungen aufgebaut ist, läßt sich die Anordnung auch mit dem
gleichen Ergebnis und Wirkung unter Verwendung von
optischen Filterschaltungen realisieren.
Gemäß Fig. 13 wird ein Lichtstrahl, der einem Eingabebild / entspricht, nachdem er durch eine
optische Linse 130 fokussiert wurde, unter Verwendung von Halbspiegeln 131a und 1316 aufgeteilt. Bei dem
gezeigten Ausführungsbeispie! ist der Fall veranschaulicht, bei dem M = 2 und N = 1 ist Der durch den
HaJbspiege! hindurchgelangte Lichtstrahl wird den Bezugsbilderp Φ/*·*, Φ^ν, ^\(k) überlagert und wird durch
jeweilige optische Linsen 132a, 1326, 132c auf photoelektrische Wandler 133a, 133/3und 133cgelenkt.
Die Ausgangssignale der photoelektrischen Wandler 133a, 133b und 133c erscheinen am Ausgang, nachdem
zwischen jedem der Bezugsbilder Φ\β), <&2<k>, ΪΊ^ und
dem Eingabebild f die Berechnung eines inneren Produktes durchgeführt wurde, wobei das Eingabebild
beispielsweise den Quadrierschaltungen 521—52Mund
551— 55N von Fig.5 zugeführt werden muß. Die
aufeinanderfolgenden Rechnungen werden gemäß F i g. 5 durchgeführt
Wenn demzufolge die Bezugsbilder Φι<k>, Φι^Κ !P1WaIs
Drehfilter konstruiert sind, um jeweils Φ,Ο—$,W,
Φ2'')—Φ2(Κ>, (P1C)-JP1W abzudecken und wenn die
Drehfilter synchron gedreht werden, so wird der gleiche Effekt wie bei der elektrischen Einrichtung der zuvor
erläuterten Ausführungsform in diesem Fall erzielt. Gemäß diesem Verfahren ist es nicht erforderlich, eine
das innere Produkt berechnende Schaltung vorzusehen, die in der elektrischen Einrichtung dieser Ausfühi ungsform
erforderlich ist.
Obwohl sich die vorangegangenen Erläuterungen auf die Erkennung eine's »figürlichen« Musters oder Bildes
beschränken, so läßt sich der Gegenstand der vorliegenden Erfindung auch bei der Erkennung eines
Klanges verwenden. In diesem Fall wird eine Anzahl K von Bezugsklangmustern oder -bildern einleitend
vorgesehen, und es läßt sich eine Erkennung durchführen, zu welcher Kategorie eine Kategorie des
unbekannten Klangbildes oder -musters gehört. Dies erfolgt mit hoher Genauigkeit, und zwar auf Grund des
Gemischtenähnlichkeitsverfahrens. Dies läßt sich unter Betrachtung der Tatsache einfach verstehen, daß ein
kontinuierlich eingespeistes Klang- oder Schallsignal der Gleichung (24) entspricht.
Hierzu H Blatt Zeichnungen
Claims (3)
1. Anordnung zur Erkennung von Bildmustern, in
welcher ein Eingabemuster durch Rasterzerlegung in eine Vielzahl von Einzelpunkten unterteilt und mit
K ebenfalls zerlegten Bezugsmustern verglichen wird, und zwar in der Weise, daß für jedes der K
Bezugsmuster M Standardvariationsmuster erzeugt werden, die untereinander in solcher Beziehung
stehen, daß samtliche aus jeweils zwei verschiedenen Standardvariationsmustera gebildeten skalaren Produkte
Null sind, daß durch eine erste Multiplikationsvorrichtung aus dem Eingangsmuster einerseits und
sämtlichen M Standardvariationsmustern aller K Bezugsmuster andererseits die skalaren Produkte
gebildet werden, daß diese skalaren Produkte dann in einer Quadriereinrichtung quadriert werden und
daß schließlich in einer ersten Addiervorrichtung für jedes der K Bezugsmuster die Summe aller
quadrierten skaiaren Produkte des Eingangsmusters mit den M Standardvariationsmustern gebildet wird,
dadurch gekennzeichnet, daß zusätzlich N Standardvariationsmuster eines oder mehrer solcher
Bezugsmuster erzeugt werden, die dem ersten Bezugsmuster sehr ähnlich sind, wobei sämtliche
skalare Produkte aus den zusätzlichen Standardvariationsmustern untereinander, sowie aus den ersten
Standardvariationsmustern und den zusätzlichen Standardvariationsmustern Null ergeben, daß die
skalaren Produkte aus dem Eingangsmuster und allen N zusätzlichen Standardvariationsmustern
durch eine zweite Multiplikationseinrichtung (541 bis 54N) gebildet werden, daß diese skalaren
Produkte in einer zweiten Quadriereinrichtung (551 bis 55N) quadriert werden, daß durch eine zweite
Addiervorrichtung (56) für alle K Bezugsmuster die Summe aller quadrierten skalaren Produkte des
Eingangsmusters mit den N Standardvariationsmustern gebildet wird, daß die durch die beiden
Addiervorrichtungen (53,56) gebildeten Summen in eine Vergleichsschaltung (60) gegeben werden, und
daß die Differenzwerte der K Bezugsmuster aller Vergleichsschaltungen (60) in einer Erkennungsschaltung ausgewertet werden.
2. Anordnung zur Erkennung von Bildmustern nach Anspruch 1, dadurch gekennzeichnet, daß die
Erkennungsschaltung einen Vergleichskreis enthält, der den Differenzwert mit einem Wert von (1 — e)
\\{\\2 vergleicht, wobei \\f\\2 das skalare Produkt des
Eingangsmusters darstellt
3. Anordnung zur Erkennung von Bildmustern nach Anspruch 1, dadurch gekennzeichnet, daß die
Erkennungsschaltung einen Maximalwert-Detektor (124) aufweist, welcher den Maximalwert aller K
Eingangswerte feststellt.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8853773A JPS5619656B2 (de) | 1973-08-08 | 1973-08-08 |
Publications (3)
Publication Number | Publication Date |
---|---|
DE2438200A1 DE2438200A1 (de) | 1975-02-20 |
DE2438200B2 DE2438200B2 (de) | 1980-11-13 |
DE2438200C3 true DE2438200C3 (de) | 1981-10-22 |
Family
ID=13945577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2438200A Expired DE2438200C3 (de) | 1973-08-08 | 1974-08-08 | Anordnung zur Erkennung von Bildmustern |
Country Status (5)
Country | Link |
---|---|
US (1) | US3906446A (de) |
JP (1) | JPS5619656B2 (de) |
DE (1) | DE2438200C3 (de) |
FR (1) | FR2240485B1 (de) |
GB (1) | GB1477876A (de) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4153946A (en) * | 1977-10-20 | 1979-05-08 | Upton Howard T | Expandable selection and memory network |
JPS5944667B2 (ja) * | 1978-03-28 | 1984-10-31 | 株式会社東芝 | パタ−ン認識装置 |
JPS55157799A (en) * | 1979-05-29 | 1980-12-08 | Nippon Electric Co | High efficiency pattern matching unit |
JPS5665291A (en) * | 1979-10-31 | 1981-06-02 | Tokyo Shibaura Electric Co | Discriminator for printed matter |
JPS57178578A (en) * | 1981-04-27 | 1982-11-02 | Toshiba Corp | Pattern recognition system |
JPS58129684A (ja) * | 1982-01-29 | 1983-08-02 | Toshiba Corp | パタ−ン認識装置 |
US4543660A (en) * | 1982-04-15 | 1985-09-24 | Tokyo Shibaura Denki Kabushiki Kaisha | Pattern features extracting apparatus and method |
US5297222A (en) * | 1982-05-04 | 1994-03-22 | Hitachi, Ltd. | Image processing apparatus |
DE3481144D1 (de) * | 1983-04-11 | 1990-03-01 | Komatsu Mfg Co Ltd | Verfahren zum identifizieren von objekten. |
JPS6057475A (ja) * | 1983-09-07 | 1985-04-03 | Toshiba Corp | パタ−ン認識方式 |
JPH01183793A (ja) * | 1988-01-18 | 1989-07-21 | Toshiba Corp | 文字認識装置 |
FR2654541B1 (fr) * | 1989-11-15 | 1994-03-04 | Cibiel Jean Yves | Procede de reconnaissance de formes, notamment de reconnaissance vocale multilocuteur du langage naturel, et dispositif pour la mise en óoeuvre de ce procede. |
US5299284A (en) * | 1990-04-09 | 1994-03-29 | Arizona Board Of Regents, Acting On Behalf Of Arizona State University | Pattern classification using linear programming |
EP0656602B1 (de) * | 1993-12-02 | 2001-07-11 | Nippon Telegraph And Telephone Corporation | Bildmusteridentifikations/Erkennungsverfahren |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3492646A (en) * | 1965-04-26 | 1970-01-27 | Ibm | Cross correlation and decision making apparatus |
DE1549928A1 (de) * | 1967-09-20 | 1971-05-13 | Telefunken Patent | Auswerteeinrichtung fuer zeichenlesende Maschinen |
JPS4912778B1 (de) * | 1969-11-05 | 1974-03-27 | ||
DE2026033C3 (de) * | 1970-05-27 | 1979-05-03 | Matth. Hohner Ag, 7218 Trossingen | Rasterverfahren zur Klassifizierung von Schriftzeichen |
JPS518699B1 (de) * | 1970-11-09 | 1976-03-19 |
-
1973
- 1973-08-08 JP JP8853773A patent/JPS5619656B2/ja not_active Expired
-
1974
- 1974-08-07 US US496012A patent/US3906446A/en not_active Expired - Lifetime
- 1974-08-08 GB GB3494674A patent/GB1477876A/en not_active Expired
- 1974-08-08 FR FR7427638A patent/FR2240485B1/fr not_active Expired
- 1974-08-08 DE DE2438200A patent/DE2438200C3/de not_active Expired
Also Published As
Publication number | Publication date |
---|---|
DE2438200A1 (de) | 1975-02-20 |
FR2240485A1 (de) | 1975-03-07 |
DE2438200B2 (de) | 1980-11-13 |
GB1477876A (en) | 1977-06-29 |
FR2240485B1 (de) | 1976-12-31 |
US3906446A (en) | 1975-09-16 |
JPS5039025A (de) | 1975-04-10 |
JPS5619656B2 (de) | 1981-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2438200C3 (de) | Anordnung zur Erkennung von Bildmustern | |
DE2909153C2 (de) | Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern | |
DE4406020C1 (de) | Verfahren zur automatisierten Erkennung von Objekten | |
DE3633743C2 (de) | ||
EP1316057B1 (de) | Auswerten von kantenrichtungsinformation | |
WO2000010119A1 (de) | Verfahren zum erkennen von objekten in digitalisierten abbildungen | |
DE1771422A1 (de) | Geraet fuer die Gewinnung einer Anzeige getrennter Farben | |
EP0312905A1 (de) | Verfahren zur automatischen Zeichenerkennung | |
DE2054546B2 (de) | Anordnung zur Erkennung von Bildmustern | |
DE1129333B (de) | Verfahren und Vorrichtung zum automatischen Erkennen von Kurvenzuegen | |
DE2247942A1 (de) | Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen | |
DE4324296A1 (de) | Fingerabdruck-Abtastvorrichtung für die Identifizierung | |
DE69925354T2 (de) | Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren | |
EP0780002A1 (de) | Verfahren zur rekonstruktion von in rasterform vorliegenden linienstrukturen | |
DE1774672C3 (de) | Einrichtung zur automatischen Zeichenerkennung | |
DE69631845T2 (de) | Musterextrahierungsgerät | |
DE10313040A1 (de) | Messdatenanpassungsverfahren | |
DE3811396C2 (de) | ||
WO2002023492A2 (de) | Verfahren zur klassifizierung von dokumenten | |
EP0780792B1 (de) | Verfahren zur rechnergestützten Bewegungsschätzung für Bildpunkte zeitlich aufeinander folgender Bilder einer Videosequenz | |
DE1294074B (de) | Zeichenerkennungsvorrichtung mit spaltenweiser Abtastung | |
EP0780793B1 (de) | Verfahren zur rechnergestützten Bewegungsschätzung für Bildpunkte zeitlich aufeinanderfolgender Bilder einer Videosequenz | |
EP0742672A2 (de) | Verfahren zur Datenreduktion mittels fraktaler Bildkodierung | |
WO1998031136A1 (de) | Verfahren zur bestimmung der geometriedaten von abtastvorlagen | |
DE3435331A1 (de) | Verfahren und vorrichtung zur verarbeitung von signalreihen, die einen von einem schreibinstrument auf einer schreibunterlage gezogenen strich darstellen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C3 | Grant after two publication steps (3rd publication) | ||
8328 | Change in the person/name/address of the agent |
Free format text: MUENZHUBER, R., DIPL.-PHYS., PAT.-ANW., 8000 MUENCHEN |
|
8327 | Change in the person/name/address of the patent owner |
Owner name: IIJIMA, TAIZO, TANASHI, TOKIO/TOKYO, JP KABUSHIKI |