DE2438200B2 - Anordnung zur Erkennung von Bildmustern - Google Patents
Anordnung zur Erkennung von BildmusternInfo
- Publication number
- DE2438200B2 DE2438200B2 DE2438200A DE2438200A DE2438200B2 DE 2438200 B2 DE2438200 B2 DE 2438200B2 DE 2438200 A DE2438200 A DE 2438200A DE 2438200 A DE2438200 A DE 2438200A DE 2438200 B2 DE2438200 B2 DE 2438200B2
- Authority
- DE
- Germany
- Prior art keywords
- image
- patterns
- pattern
- circuit
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
Description
Die Erfindung betrifft eine Anordnung zur Erkennung von Bildmustern gemäß Oberbegriff des Anspruchs 1.
Diese Anordnung ist aus der DE-OS 20 54 546 bekannt.
_ (/ι Jo)
ΊϊΤΠλΙ
wobei (f, fo) ein inneres Produkt bedeutet, welches
zwischen f(x) und fo(x) berechnet wird und wie folgt
so ausgedrückt wird:
(/,/o) = f*f(x)Mx)dx
wobei Ar in der Zone R definiert ist.
||/|| wird als Norm von /(ty bezeichnet und hat einen
positiven Wert, der definiert ist zu:
I = KfJ)
In ähnlicher Weise wird fo als die Norm von fo(x)
bezeichnet Die Norm ||/|| stellt den Abstand des Bildes f(x)dar, und zwar gemessen vom Ursprung im Bildraum,
und die Norm ||/ό|| stellt den Abstand des Bildes /o(x,ldar,
und zwar gemessen vom Ursprung im Bildraum. Ein Bild fo(x) = 0, welches dem weißen Bildmuster entspricht,
stellt den Ursprung des Bildraumes dar. θ stellt einen Winkel zwischen zwei Vektoren dar, die vom Ursprung
aus zu f(x)und fo(x)gezogen sind, so daß die so definierte
Ähnlichkeit S[f, /b] dem Cosinus θ entspricht und einen
bestimmten Wert in einem Bereich
annimmt
Wenn speziell ffx)exakt identisch mit fo(x) ist, so wird
Wenn speziell ffx)exakt identisch mit fo(x) ist, so wird
Mx)SUJo] = 1
Bei ε > 0 (ε ist eine positive Zahl kleiner als oder gleich
1), und wenn die Beziehung
befriedigt ist, so kann das Bild f(x) als zu dem Bild ^)
gehörig identifiziert werden, und wenn diese Beziehung nicht befriedigt ist, kann das Bild f(x) rls nicht zu dem
Bild/(^gehörend identifiziert werden.
Das zuvor geschilderte Verfahren zur Bestimmung der Ähnlichkeit eines Eingabebildes mit einem Bezugsbild unter Verwendung der Gleichung (1) wird als das
einfache Ähnlichkeitsverfahren bezeichnet
Die Ähnlichkeit S[f, /&] bleibt unbeeinflußt, wenn die
Dichte der Dichtefunktion f[x) als Ganzes gleich A,
multipliziert mit der ursprünglichen Dichte, beträgt, wobei diese letztere Dichte als Af(x) ausgedrückt wird,
wobei A eine beliebige Konstante darstellt Demzufolge läßt sich das zuvor erwähnte einfache Ähnlichkeitsverfahren
günstig dort einsetzen, wenn ein Bild (z. B. ein Buchstabe) mit solcher Gestalt identifiziert werden soll,
daß selbst dann, wenn das Bild Dichte-Schwankungen aufweist, eine f(x) zugehörige Kategorie nicht geändert
wird.
Ein normales Bild ist jedoch aus vielerlei Gründen in gewissem Ausmaß deformierbar, und zwar zusätzlich zu
Dichteschwenkungen. Dort, wo beispielsweise die Position für das Bezugsbild versetzt ist, wird die
einfache Ähnlichkeit 5 direkt beeinflußt, und sie stellt einen Wert dar, der von einem wahren Verfahren
abweicht
Hierdurch wird einer Verbesserung der Erkennung eine Grenze gesetzt, die auf dem einfachen Ähnlichkeitsverfahren
basiert Um diese Nachteile zu beseitigen, wurden bereits viele ähnliche Verfahren vorgeschlagen.
Bei dem Vielfach-Ähnlichkeitsverfahren wird eine Zahl M von Bildern Φ\(χ% Φι(χ), ■ ■ ■ Φμ(χ), die eine
orthogonale Beziehung zueinander besitzen, als Bezugsbilder vorbereitet, und zwar an Stelle eines einzelnen
Bezugsbildes fo(x), welches eine bestimmte Kategorie
darstellt Wenn ein Eingangsbild oder Eingabebild f(x) gegeben ist, wird eine Zahl Af von Ähnlichkeiten S[f, <&m]
(m — 1,2,.., M) zwischen dem Eingabebild /jtyund der
Zahl Mder Bezugsbilder berechnet. Hieraus läßt sich
erhalten.
In diesem Fall wird die Erkennung von der Tatsache abhängig erreicht, ob der Wert von S\f\ die folgende
Ungleichung befriedigt oder nicht:
LJl
Vielfach-Ähnlichkeit S\f\ bleibt selbst dann unbeeinflußt,
wenn die Position des Bezugsbildes im Bildraum verschoben ist Aus Fig.2 läßt sich erkennen (eine
Ansicht zur Erläuterung eines Unterschiedes zwischen dem einfachen Ähnlichkeitsverfahren und dem Vielfach-Ähnlichkeitsverfahren),
daß Θ* einen Winkel darstellt, der zwischen dem Eingabebild f(x) und derjenigen
Komponente von f(x) vorhanden ist, die auf eine
Hiper-Ebene G (hiperplane) projiziert ist, wobei diese
ίο Ebene durch die Bewegung des Bezugsbildes geformt
ist Der Wert S* [/J, wie er auf der Grundlage des
Vielfach-Ähnlichkeitsverfahrens erhalten wird, entspricht dem cos Θ. Dies bedeutet, daß die Ähnlichkeit
des Eingabebildes f(x) mit dem Bezugsbild, welches
bewegt werden kann, beurteilt werden kann.
Die eingangs erwähnte Anordnung nach der DE-OS 20 54 546 arbeitet nach diesem Vielfach-Ähnlichkeitsverfahren
und erbringt durch die besondere Art der Weiterverarbeitung der skalaren Produkte sich klar
unterscheidende Werte, aus denen dann mit hoher Genauigkeit dasjenige Bezugsmuster ermittelt werden
kann, welches dem Eingangsmuster entspricht, wobei diese Genauigkeit insbesondere nicht durch Positionsverschiebungen des Eingangsmusters auf dem Ra-
sterzerlegungsfeld beeinflußt wird. Die Praxis hat
jedoch feezeigt, daß es trotz der hohen Allgemeinsicherheit
dieser vorbekannten Anordnung es dann doch noch zu Schwierigkeiten und damit Fehlerkennungen kommen
kann, wenn es um die Unterscheidung zweier sehr ähnlicher Bezugsmuster geht etwa der Unterscheidung
zwischen dem Buchstaben »1« und der Ziffer »1« bei manchen Schreibmaschinenschriften.
Aufgabe der Erfindung ist es deshalb, die erwähnte vorbekannte Anordnung in der Weise zu verbessern,
daß eine zusätzliche Sicherheit der Erkennung auch solcher Muster erreicht wird, die einander äußerst
ähnlich sind. Die Lösung dieser Aufgabe ist im Kennzeichen des Anspruchs 1 angegeben.
Nachfolgend sollen nun einige technische Erläuterungen zum Problem der Unterscheidung zwischen zwei
unterschiedlichen Mustern, also Mustern unterschiedlicher »Kategorie« gegeben werden, unter besonderer
Berücksichtigung des Falles, daß diese Muster unterschiedlicher Kategorie einander sehr ähnlich sind.
Es sei eine Zahl K von Kategorien betrachtet auf welche ein Bild zum Zwecke der Erkennung bezogen ist
Eine Zahl von M von Bezugsbildern Φι <k)(x), Φ^(χ), ■ ■.
Φ^(χ) wird einleitend für irgendeine Zahl K von
Kategorien beispielsweise die Me Kategorie vorbereitet
Es sei hervorgehoben, daß diese Bezugsbilder eine orthonormale Beziehung befriedigen.
0(m =äf m')
(m,m' = 1,2... M)
Der durch Gleichung (7) definierte Wert der Der Ausdruck »orthonormal« wird hier in der
mathematischen Sprache verwendet und unterscheidet sich von »Normalisierung«, welcher Ausdruck in der
Bilderkennung verwendet wird. Die in der Bilderken· rung verwendete Bezeichnung »Normalisierung« bedeutet,
daß beispielsweise ein verschobenes Buchstabenbild mit einer Bezugslage oder -position ausgerichtet
wird und ein handgeschriebener Buchstabe, der von Person zu Person unterschiedlich ist, wird auf eine
vorbestimmte Größe vererößert oder verkleinert.
Für die Arte Kategorie wird außerdem eine Zahl N von Bezugsbildern Φ\«<)(χ), Ψ^)(χ),... frfVfx) vorbereitet,
wobei diese Komponenten eine orthogonale Beziehung zu dem Bezugsbild {Φπ/ν('χ% aufweisen, die in
solchen Bildern enthalten sind, die eine relativ große Ähnlichkeit mit der Arten Kategorie besitzen und als zu
einer unterschiedlichen Kategorie gehörend betrachtet werden. Es sei hervorgehoben, daß die Zahl N der
Bezugsbilder
eine orthonorrnale Beziehung befriedigt;
(n,n' = 1,2... N)
und eine orthogonale Beziehung
= 0
und eine orthogonale Beziehung
= 0
(m=l,2...M;n =
(10)
(H)
zum Bezugsbild {Φ^(χ}.
Φ,β>
und Ψβ> sind so bestimmt, daß sie die
Beziehungen (9), (10) und (11) befriedigen. Φ „/Wund Ψβ),
die diese Beziehungen befriedigen, existieren in unendlicher Zahl. Demzufolge läßt sich hinsichtlich der
Komponenten, die am besten die Verteilung des Arien Bildes $i(k), Φι(1() ... ΦΛ*) ausdrucken, diese Komponenten
zuerst durch Verwendung der Gleichung (9) bestimmen. Dann kann 9\(k). Ψ 4k>
unter Verwendung der Gleichung (10) und (11) bestimmt werden.
Die Zahl von M, N wird in Abhängigkeit von der
Natur der Bilder, die erkannt werden sollen, bestimmt Normalerweise wird M so ausgewählt, daß sie 3 oder
mehr entspricht, und N wird so ausgewählt daß es der Zahl der Bilder entspricht die in jeder Kategorie
enthalten sind, die eine Ähnlichkeit mit einem speziellen Bild besitzt Beispielsweise hat der ι ngüschc Buchstabe
»O« eine Ähnlichkeit mit einer nun.erischen Figur »0«
und dem englischen Buchstaben »Du und »Q«, und in diesem Fall wird N so ausgewählt, daß es 3 entspricht
Eine numerische Zahl »7« besitzt eine Ähnlichkeit mit einer numerischen Zahl »9«, und in diesem Fall wird N
so ausgewählt, daß es 1 entspricht
Daher läßt sich ein gegebenes Bild fifx) in die Form
erweitern:
£.C.M
η= Ι
+ (hik\x),4>Jk\x)).
Das innere Produkt kann geschrieben werden als:
10 wobei die Forderung nach einer Orthogonalität, wie in
den Gleichungen (9) und (11) ausgedrückt, in Betracht gezogen werden muß.
is Bei dem Ausdruck (13) ergibt sich:
is Bei dem Ausdruck (13) ergibt sich:
(14a)
ähnlich
(14b)
Es kann gesagt werden, daß der Rest Hk>(x) die
Gleichungen (14a) und (14b) befriedigt
Aus einem inneren Produkt zwischen /jtyund f(x) läßt
sich der quadratische Wert einer Norm wie folgt ausdrücken:
30
35
40
45
50 II/ IP = (fix), /(χ))
\m=l
m=l
M M
ΣΣ
IB= IB
(B
fix) =
+Σ b
1
1
(12)
wobei Wjk)(x)} und {Va m(x)} verwendet werden, in
welchen die Erweiterungskoeffizienten (On), {b„} jeweils
gegeben sind als:
55
60
(13)
Ein inneres Produkt zwischen der rechten Seite der Gleichung (12) und 0m m ist wie folgt ausgedrückt:
ΣΣ
B=Im=I
+ΣΑ<
B=I
+ Σ a«(h°
m=l
+Σ Κ
Aus der Gleichung (9) wird der erste Ausdruck auf der dritte, sechste, siebente und achte Ausdruck zu Null; und
rechten Seite der zuvor erläuterten Gleichheit zu aus Gleichung (10) wird der fünfte Ausdruck zu
Σ«-,2;
m=l
aus Gleichung (11) werden der zweite und der vierte Somit läßt sich die zuvor erwähnte Gleichung wie
Ausdruck zu Null. Aus der Gleichung (14) werden der folgt schreiben:
? + lift"» IP (15)
Nun läßt sich die Ähnlichkeit ök{f\ — im folgenden welches zur k\en Kategorie gehört, wie folgt
als »eine gemischte Ähnlichkeit« bezeichnet — definieren:
irgendeines Eingabebildes f(x) zu einem Bezugsbild, is
irgendeines Eingabebildes f(x) zu einem Bezugsbild, is
-S
-σ
(16)
wobei die Parameter An,, μη reale Zahlen sind und folgenden Bereich umfassen:
Durch Substitution der Gleichung (1) in Gleichung (16) erhält man:
(17)
II/IP Ilv.*IP
Von den Ausdrücken (9) und (13) erhält man:
(18)
Die Gleichung (16) läßt sich auch wie folgt ausdrücken:
J, w-£,^F
Aus Gleichung (15) erhält man:
MP
= Λ_ 1Ö
BI=I Π
** , Ar
ν ii/ipy
ι -
(19)
030 146/146
Wie sich aus Gleichung (16) erkennen läßt, nimmt die gemischte Ähnlichkeit C(l)[/] irgendeine reale
Zahl ein, und zwar in dem Bereich von:
Zahl ein, und zwar in dem Bereich von:
Insbesondere gilt, wenn das Eingabebild gleich ist:
da aus Gleichung (12), N= 0, M = 1 und A(*»(x) = 0 und dann
Da aus Gleichung (17) A1 = 1, ergibt sich
Die Ausdrücke | am | und | bm |, die in den Gleichungen
(12) und (15) enthalten sind, stellen die Größe der Projektionskomponenten des Eingabebildes f(x) dar,
welches Φ^>(χ), !P/" betrifft Dies kann leicht in
Verbindung mit der Gleichung (3) gegebenen Erklärung verstanden werden.
Andererseits || AW || die Größe eines Restes dar, der
unterschiedlich ist zu
Es kann demzufolge gesagt werden, daß Gleichung (19)
den Weg zeigt, auf welche Weise diese Komponenten den Wert der gemischten Ähnlichkeit Ok[f\ beeinflussen.
Der erste Ausdruck aus der rechten Seite von Gleichung (19) zeigt nämlich den durch ||AW||
bewirkten Effekt, und der zweite Ausdruck auf der rechten Seite dieser Gleichung zeigt die durch \\ am |),
{| b„ \\ bewirkten Einflüsse. Somit gilt:
(22)
Gleichung (19) zeigt, daß | am | als kleiner als das
Ausmaß bewertet wird, bis zu welchem der Parameter tatsächlich einer Deformation unterworfen wird, während
I b„ I als größer als das Ausmaß bewertet wird, bis
zu welchen der Parameter tatsächlich einer Deformation unterworfen wird. Mit anderen Worten, besitzt die
gemischte Ähnlichkeit CW[Z] eine Charakteristik, daß
hinsichtlich der Deformationskomponenten, die für die in Rede stehende Me Kategorie zulässig sind, eine
zulässige Diskriminier-Auswertung durchgerührt wird und daß hinsichtlich der leicht verwechselbaren
Komponenten eine schwerwiegende Diskriminier-Auswertung ausgeführt wird.
Es soll die Bedeutung im folgenden qualitativ erklärt werden, und zwar unter Verwendung eines Beispielfalles,
bei dem das Eingabebild aus einer numerischen Figur »0« besteht und das Bezugsbild ein englischer
Buchstabe »O« ist Diese Bilder »0« und »O« sind auf Grund der großen Ähnlichkeit untereinander verwechselbar,
wenn irgendeines dieser Bilder einer Deformation unterworfen wird. Wenn jedoch diese Bilder einer
Dichteveränderung als Ganzes unterworfen werden, oder unter Beibehaltung einer »Ähnlichkeitsentsprechend«
verändert werden, so besteht kein Risiko einer Verwechslung. Wird die numerische Figur »0« in der
Breite deformiert bzw. vergrößert, so hört jegliche
Unterscheidungsmöglichkeit zwischen »0« und »O« auf.
Es soll nun an Hand eines anderen Beispiels der Fall betrachtet werden, bei dem das Eingabebild aus einer
numerischen Figur »1« besteht und das Bezugsbild aus einem englischen Buchstaben »I«. Diese Bilder sind
verwechselbar, wenn der seitliche Balken oder Vorsprung am Kopf des »I« oder »1« geändert wird. Dies
bedeutet, daß die numerische Figur »1« erkannt wird, wenn kein seitlicher Balken zur rechten Seite hin am
Kopfabschnitt des Bildes »1« absteht Der englische Buchstabe »I« kann erkannt werden, wenn ein seitlicher
Balken oder Querbalken zur rechten Seite am Kopfabschnitt des Bildes »I« ragt Es kann auch eine
Erkennung vorgenommen werden in Abhängigkeit davon, ob der Querbalken am Kopfabschnitt des Bildes
»1« oder »I« geneigt abfällt oder nicht In diesem Fall kann eine Unterscheidung zwischen »I« und »1« selbst
dann erzielt werden, wenn ein Querbalken am unteren Abschnitt des numerischen Zeichens »1« einer Deformation
unterworfen ist In dieser Weise gibt es zwei Typen von Komponenten: der eine Typ, der selbst dann
identifizierbar ist, wenn die genannte Deformation zwischen Bildern auftritt die ähnlich untereinander sind,
jedoch einer unterschiedlichen Kategorie zugehören; und der andere Typ, der nicht unterschieden werden
kann, wenn diese Deformation stattfindet Gemäß dem gemischten Ähnlichkeitsverfahren nach der Erfindung
wird eine zulässige Unterscheidungsauswertung hinsichtlich des früheren Typs der Komponente durchgeführt,
und es wird eine schwerwiegende Unterscheidungswertung hinsichtlich des letzten Typs der Komponente
durchgeführt, d. h. jegliche Deformation wird so ausgewertet, als ob keine größere Deformation
stattgefunden hat
Es sei nun angenommen, daß bei 1 >· ε
> 0 (ε ist eine positive Zahl) die Beziehung
Ök)U~\>
1-
(23)
gegeben ist Dann wird unabhängig davon, ob das Eingabebild f(x) zur Arien Kategorie gehört oder nicht
diese in Abhängigkeit davon bestimmt ob die Beziehung befriedigt wird oder nicht In diesem Fall
wird die Bestimmung unter der zuvor erwähnten Auswertung durchgeführt Bei dem zuvor erwähnten
gemischten Ähnlichkeitsverfahren gilt, wenn N=O ist:
If
Bei /m = 1 und αψ = (/,<Pj*') läßt sich die zuvor angeschriebene Gleichung in folgender Weise ausdrücken:
Durch Multiplizieren des Nenners der rechten Seite der zuvor angeschriebenen Gleichung mit
IbJP = I ergibt sich:
c»'rn = y
- γ sr f φ
Wenn die uadratwurzel der rechten Seite der zuvor
angeschriebenen Gleichung als S*[/] betrachtet wird, so ergibt sich:
was der Vielfachähnlichkeit von Gleichung (7) entspricht.
Für M = 1 gilt:
Wenn 0t = /0, wird
S = [/Jo]
was mit der einfachen Ähnlichkeit, die in Gleichung (1)
wiedergegeben ist, identisch ist
Aus der vorangegangenen Beschreibung läßt sich erkennen, daß das gemischte Ähnlichkeitsverfahren
eine Erweiterung des einfachen und Vielfach-Ähnlichkeitsverfahrens darstellt
Das gemischte Ähnlichkeitsverfahren wurde in theoretischer Hinsicht erläutert Bei den Identifikationssystem wird die Vorbereitung eines Musters oder einer
Probe durchgeführt Ein gleichmäßiges Eingabebild f(x) wird in Form von Dichtewerten an einer Zahl L von
Probepunkten ausgedrückt, und f(x) wird in Form von
(f\, fi ... fr fr, ·.- fi) gegeben. Dann wird ein inneres
Produkt zwischen den zwei Bildern f(x)xmd g(x) nicht in
integraler Form ausgedrückt, wie diese durch Gleichung
(2) definiert ist, sondern in folgender Form:
Es ist wohlbekannt, daß Gleichung (2) in der Multiplizier-Addierform, wie in Gleichung (25) gezeigt
ist, umgeschrieben werden kann, und zwar unter Verwendung eines bekannten Probe-Theorems. Wenn
irgendein Eingabebild als Vektorkomponenten (f\, /2, ..
fi) ausgedrückt werden kann und das innere Produkt
der Gleichung (25) definierbar ist, so gelten alle Erläuterungen in Verbindung mit dem gemischten
Ähnlichkeitsverfahren.
Die Gleichung des gemischten Ähnlichkeitsverfahrens kann reduziert werden auf:
BI = I
Ύ -ί Cf, l/W)2
> (i - 4 \\f ψ,
11=1
(26) die durch Substitution der Gleichung (18) in Gleichung
(23) und unter Verwendung der Gleichung (13) erhalten werden kann.
In der Gleichung (26) werden die Parameter Xm μη
einleitend als bekannte Größen vorbereitet
s Es ist daher lediglich erforderlich, eine Anordnung zur Bildmustererkennung zu realisieren, welches bestimmen
kann, ob die zuvor erwähnten Parameter die Gleichung (26) hinsichtlich des Hingabebildes /befriedigen odef
nicht
Im folgenden wird die Erfindung an Hand eines Ausführungsbeispiels unter Hinweis auf die Zeichnungen näher erläutert Es zeigt
Fig. IA die Positionsbeziehung in einem Bildraum
von Bildern oder Bildmustern, die einer bestimmten Kategorie zugehören,
F i g. i B eine numerische Figur »7«, die durch die sich ändernde Dichte einer Vielzahl von Quadraten dargestellt ist,
F i g. 2 eine relative Beziehung zwischen einem einfachen Ähnlichkeitsverfahren und einem Vielfach-Ähnlichkeitsverfahren,
F i g. 3 ein Blockschaltbild der grundlegenden Anordnung gemäß einer Ausführungsform zur Bildmustererkennung nach der Erfindung,
F i g. 4 ein Blockschaltbild, welches schematisch eine gemischte Ähnlichkeit-Rechenschaltung aus F i g. 3
zeigt,
F i g. 5 ein Blockschaltbild gemäß einer detaillierten Anordnung einer Rechen/Vergleichsschaltung von
Fig.4,
F i g. 6 ein Blockschaltbild zur Berechnung der Norm Il f\\2 einer Eingangssignalwertfolgeoder-zuges,
Fig.7 ein Blockschaltbild einer Multiplizier-Summier-Schaltung, um die Summe der inneren Produkte
von zwei Bildfunktion zu erhalten;
Fig.8 eine detaillierte Schaltungsanordnung der Multiplizier-Summier-Schaltung von F i g. 7,
F i g. 9 eine Schaltung zur Durchführung der Annäherung einer Spannung-Strom-Charakteristik an die
charakteristische Kurve der Quadrate mit unterbrochen gezeichneter Linie,
Fig. 10 eine Ausführungsform einer Quadrierschaltung in F i g. 5,
Fig. 11 eine detaillierte Schaltungsanordnung einer
Ausführungsform einer Vergleichsschaltung in F i g. 5,
Fig. 12 ein Blockschaltbild einer anderen Ausführungsform einer Gemischtähnlichkeits-Rechenschaltung, die bei der Bildmustererkennung nach der
Erfindung verwendet wird,
F i g. 13 eine schematische Darstellung einer weiteren Ausführungsform nach der Erfindung,
Fig. 14(a)—14(c) drei Beispiele eines orthonormalen
Bildes, weiches beim Gegenstand der Erfindung verwendet wird und Fig. 14(d) ein Bezugsbild, welches
einer Men Kategorie zugehört; und
Fig. 15 ein Blockschaltbild einer Schaltung zur Vorbereitung der Bilder von den Fig. 14(a)—14(c) aus
dem Bild von F i g. 14(d).
In F i g. 3 wird ein Eingabebild 1, beispielsweise eine numerische Figur »7«, die auf weißes Papier geschrieben ist, durch einen photoelektrischen Wandler 2
abgetastet, der mit einer Abtastvorrichtung wie beispielsweise einem Lichtpunkt-Abtaster ausgestattet
ist, und es wird ein elektrisches Signal Si, welches dem
Schatten des Bildes 1 entspricht, durch den Abtaster erhalten. Das elektrische Signal Si wird einer Vorverarbeitungs-Vorrichtung 3 zugeleitet in der das Signal
vorbearbeitet wird, und zwar hinsichtlich der Normali-
durchgeführt
Die Fig. 14(a)—(c) zeigen drei Beispiele von
orthogonalen Bildern Φι^ Φ-ρ<), ... Φ^Μ. In diesen
Figuren, bezeichnet ein fester schwarzer Punkt einen positiven Dichtewert, während ein schattierter Punkt
einen negativen Dichtewert bezeichnet Die Größe dieser Punkte gibt die Größe dieser Werte an. Diese
drei Bilder befriedigen jeweils die Gleichung (9), und wenn hinsichtlich zweier dieser drei Bilder die
Dichtewerte von entsprechenden P inkten multipliziert und summiert werden, so erhält mai eine Null. Die drei
orthogonalen Bilder, die in den Fig. 14(a)—(c) gezeigt
sind, werden vorbereitet, und zwar auf der Grundlage
des Bezugsbildes, welches repräsentativ ist für die k\e Kategorie, die in F i g. 14(d) gezeigt ist Der Vorgang der
Vorbereitung der Bilder von Fig. 14(a)—(c) aus dem
Bild von Fig. 14(d) soll unter Hinweis auf dadurch Fig. 15 erläutert werden. In Fig. 15 wird ein Abtastsignal, welches über die gesamte Fliehe des Bildes von
F i g. 14(d) gefahren ist, einem Anschluß 151 zi geführt
und gelangt dann zu einer Probe entnahmesc haltung
152 Die Probeentnahmeschaltung ist, wie allgemein bekannt, so ausgelegt, daß sie das Eingabebild in ein aus
Proben bestehendes Bild umwandelt, welches eine vorher bestimmte Zahl von Probeeatnahmepunkten
aufweist, und zwar bei diesem Ausführungsbeispiel 16 χ 16 Punkte. Die Ausgangsgröße der Probeentnahmeschaltung 152 gelangt zu einer Schaltung 153, in der
der gemittelte Dichtewert des Bildes von dem Dichtewert abgezogen wird, der jedem Punkt des so
vorbereiteten Probebildes entspricht Demzufolge stellt ein Bild, welches aus der Schaltung 153 erhalten wird,
ein Bild i&W dar, welches für eine Abweichung vorn gemittelten Dichtewert repräsentativ ist. Die Ausgangsgröße der Schaltung 153 wird einer Differentialschaltung 154 und einer Betriebsschaltung 155-1 eingespeist
sation der Position und der Dicke des Eingabebildes und
des Bezugsbildes. Ein Ausgangssignal Si der vorverarbeitenden Vorrichtung gelangt zu einer Mischähnlichkeit-Rechenschaltung 5 der Anordnung zur Erkennung
von Bildmustern. Das Ausgangssignal der Rechenschaltung 5 gelangt zu einer Identifikationsschaltung, in
welcher das Eingabebild identifiziert wird. Der photoelektrische Wandler 2 und die vorbearbeitende
Schaltung 3 können in herkömmlicher Weise ausgeführt sein.
F i g. 4 zeigt ein Blockschaltbild einer Gemischtähnlichkeit-Rechenschaltung, die in F ii g. 3 gezeigt ist Das
Ausgangssignai Sj, d. h. das Eingabebild / der
vorverarbeitenden Schaltung wird einer Zahl K von Rechen-Vergleichsschaltungen 501, 502, ... 5OK zugeführt. In den Rechen-Vergleichsschaltungen wird ein
Vergleich zwischen den Eingabebildern /und der Zahl K der Kategorien, die einleitend für eine Vergleichung
vorbereitet wurden, durchgeführt, und die Identifikation
wird hinsichtlich der Kategorie durchgefühlt, zu welcher das Eingabebild /gehört
Fig.5 zeigt ein Blockschaltbild mit einer k\en
Schaltung (50AJt die als repräsentatives Beispiel für die Rechen-Vergleichsschaltungen von Fig.4 ausgewählt
wurde. Das Eingabebild /wird einer Anzahl Af von das
innere Produkt berechnenden Schaltungen 511,512,...
5 IAf zugeführt, die eine erste Gruppe darstellen, und es
werden innere Produktrechnungen zwischen dem Eingabebild /und
Die Differentialschaltung 154 ist so ausgelegt, daß sie
die Differenz zwischen zwei benachbarten Punkten zu jeweils der x- und der ^-Richtung des kanonischen
Bildes erfaßt und diese speichert Die so erhaltenen Differentialbilder ffi>
(jr-Richtung) und f^>
(^Richtung) werden an die Betriebsschaltungen 155-2 und 155-3
abgegeben. Die Betriebsschaltung 155-1 empfängt das Bezugsbild /o und führt folgende Rechnung durch:
(33)
Wf0
Die Betriebsschaltung 155-2 empfangt die Differentialbilder fx und /, und führt die folgende
is Rechnung durch:
ii/ji1 ιΐ/,ιι
(34)
Die Betriebsschaltung 155-3 empfängt die Differentialbilder Jx und/, und führt folgende Rechnung
aus:
fc(fw) [WfA Wf1W
(35)
In den Gleichungen (34) und (35) ist / wie folgt gegeben:
(36)
II/,
Die Normgrößen ||Φΐ«||, ||Φ^|| und ||Φ^|| der
Bilder ΦιΉ φ^Ν und ΦJ*) sind alle 1, und ein inneres
Produkt zwischen Φι, Φι; Φι, Φι und Φ* Φι sind alle 0,
wobei eine orthonormale Beziehung befriedigt wird.
Die so erhaltenen drei orthonormalen Bilder sind in den Fig. 14(a)—(c) gezeigt und sie werden als
Bezugsbilder verwendet
Gemäß Fig.5 werden die Ausgangssignale au a2...
3m der das innere Produkt berechnenden Schaltungen
einer Anzahl M von Quadrierschaltungen 521, 522,... 52Af zugeführt, in denen
\WV,(f,
berechnet wird. Die Ausgangssiignalt: Q, C;,... Cm der
so Quadrierschaltungen werden einer ersten Summierschaltung 53 zugeführt, um eine Summenausgangsgröße
/Ar zu erzeugen. Das bedeutet, da B die Ausgangsgröße ik
identisch ist mit:
BI=I
was der erste Ausdruck auf der linken Seite der Ungleichung (26) ist
Das Eingabebild / wird gleichzeitig der N-Zahl der
das innere Produkt berechnenden Schaltungen 541,542, ... 54AAzugeführt; die eine zweite Gnippe darstellen, in
der innere-Produkt-Berechnungen zwischen dem Ein
gabebild /und
W» /s" «
durchgeführt werden.
Hier werden die Bezugsbilder (PiW, Φ-pK ..
durch denselben Vorgang erhalten wie im Fall von Φ
Φ
Die Ausgangssignale b\, fc, ... bs der das innere
Produkt berechnenden Schiltungen gelangen zu einer Anzahl N von Quadrierschaltungen S51,552,... 557V, in
denen
berechnet wird. Die Ausgangssignale du di,... on der
Quadrierschaltungen werden einer zweiten Summierschaltung 56 zugeführt, um eine Summenausgaiigsgröße
jk tu erzeugen. Das bedeutet, daß die Ausgangsgröße jk
identisch ist mit:
n=l
welches den zweiten Ausdruck auf der linken Seite der
Ungleichung (26) darstellt
Das Eingabebild /wird gleichzeitig der anderen das innere Produkt berechnenden Schaltung 57 eingespeist
bzw. aufgedrückt, in der || Z||2 berechnet wird. Da das
Eingabebild /als Folge von einer Zahl L von Werten (fu
4 ... fi) zugeführt wird, beträgt der Recheninhalt von
ll2gleich:
(27)
Die detaillierte Schaltungsanordnung zur Durchführung der Berechnung von Gleichung (27) soll im
folgenden erläutert werden.
Das Ausgangssignal e der das innere Produkt berechnenden Schaltung 57 wird einer Koeffizient-Multiplizierschaltung 58 zugeführt, in der dieses Signal mit
einem Koeffizienten (1 —ε) multipliziert wird.
Die Ausgangsgröße Ik der Koeffizient-Multiplizierschaltung und die Ausgangsgröße jk der rweiten
Summierschaltung werden einer weiteren Addierschaltung 59 zugeführt, in welcher eine Berechnung von jk +
Ik ausgeführt wird. Die Ausgangsgröße pk der Addierschaltung 59 besteht aus einem Wert, der durch
Transponieren des zweiten Ausdrucks der linken Seite der Ungleichung (26) auf die rechte Seite derselben
erhalten wird.
Die Ausgangsgröße ik der ersten Summierschaltung 53 und die Ausgangsgröße pk der Addierschaltung 59
gelangen zu einer Vergleichsschaltung 60, in der ein Vergleich zwischen ik und pk vorgenommen wird.
Wenn ik > pk befriedigt wird, so erscheint eine Ausgangsgröße qk an der Vergleichsschaltung 60. Dies
bedeutet, daß dann, wenn die Ungleichung (26) befriedigt ist, die Ausgangsgröße qk aus der Vergleichsschaltung erscheint Das Erscheinen der Ausgangsgröße
qk zeigt daß das Eingabebild /zu der Arten Kategorie einer Anzahl K von vorbereiteten Kategorien gehört
F i g. 6 zeigt ein Blockschaltbild einer Schaltung zur Durchführung der Rechnung gemäß der zuvor erwähnten Gleichung (27). Eine Zahl L von Eingangssignalen Z1,
4 · · ■ Λ · · - 4 werden den Quadrierschaltungen 601,602,
... 6Or... 60Z. jeweils zugeführt Nachdem Zi2, Z2 2... #...
f\} berechnet sind, gelangen die Ausgangsgrößen der Quadrierschaltungen zu einer Summierschaltung 61.
F i g. 7 zeigt ein Blockschaltbild zur Durchführung der Rechnung gemäß der zuvor erwähnten Gleichung (25).
Eine Anzahl L von Eingangssignalen Z1, Z2 · · · 4 werden
einer MuJüplizier-Summier-Schaltung 70 zugeführt in
der eine Multipüzier-Summier-Rechnung elektrisch zwischen Z1, Z2 ... 4 und g\, gi ... gu g\, gi ... gL
durchgeführt wird gL kann dadurch erhalten werden,
indem man das Verhältnis zweier elektrischer Widerstände, die an späterer Stelle beschrieben werden sollen,
bestimmt
Fig.8 zeigt eine Schaltungsanordnung eines Beispiels einer Multiplizier-Summier-Schaltung 70. Es
to werden Spannungen, die zu den Eingangssignalen f\—fr
jeweils proportional sind, den Eingangsanschlüssen Ij-Il der Multiplizier-Summier-Schaltung 70 eingespeist Ein Verhältnis Rf/Rr eines Rückkopplungswiderstands Rf zu irgendeinem beispielsweise zu Rr der
Widerstände R\—Rl wird als ein bekannter Wert gr
genommen. Wenn ein Operationsverstärker A so ausgewählt und ausgelegt wird, daß er einen ausreichend hohen Verstärkungsfaktor besitzt so wird eine
Spannung
(28)
als Ausgangsgröße vom Ausgangsanschluß / der Multiplizier-Summier-Schaltung 70 abgeleitet, und zwar
basierend auf dem Prinzip einer gut bekannten analogen Multiplizier-Summier-Schaltung. Die Multipiizier-Summier-Schaltung von F i g. 8 kann mit einer Anzahl M von
das innere Produkt berechnenden Schaltungen 511,512,
... 51Λ/ verbunden sein (die erste Gruppe) und kann mit
einer Zahl N von das innere Produkt berechnenden Schaltungen 541, 542, ... 54A/ (die zweite Gruppe)
verbunden sein, die beide in F i g. 5 gezeigt sind. Dies
bedeutet, daß die Werte
und
nur als das Verhältnis Rf/Rr des Widerstandes Rf zum
Widerstand Rr umgeschrieben zu werden brauchen. Die
in Fig.8 gezeigte Multiplizier-Summier-Schaltung kann nicht nur als Rechenschaltung für das innere
Produkt verwendet werden, sondern auch als Summierschaltung für
t/r
r=I
(vorausgesetzt daß g\ — g2 = ... = gL = 1). Diese
Größe kann der ersten und der zweiten Summierschaltung 53 und 56 von F i g. 5 zugeführt werden. Es sei
angenommen L « 1 und g, = 1. Dann kann die
Multiplizier-Summierschaltung von Fig.8 ebenso als
Schaltung verwendet werden, um eine Ausgangsgröße -Zi zu erhalten, bei welcher das Vorzeichen eines
Eingangswertes f\ umgedreht ist
Fig.9 zeigt eine detaillierte Schaltungsanordnung
entsprechend einem Beispiel einer Zahl M von Quadrierschaltungen 521, 522, ... 52Af (die erste
Gruppe) und eine Anzahl N von Quadrierschaltungen 551,552,... 55N(die zweite Gruppe), wie dies in F i g. 5
gezeigt ist Bei der Schaltungsanordnung von F i g. 9 sind eine Zahl N von Dioden D\ — D„ zwischen einem
Paar von Eingangs- und Ausgangsanschlüssen in Reihe geschaltet. Ein Ende der Widerstände R ist mit einem
Verbindungspunkt zwischen benachbarten Dioden verbunden, und das andere Ende ist mit einer Leitung
zwischen dem anderen Paar der Eingangs- und Ausgangsanschlüsse verbunden, wobei ein Kompensationswiderstand 2/2 (mit einem Widerstandswert, der
doppelt so groß ist als derjenige der anderen Widerstände) zwischen die Eingangsanschlüsse geschaltet ist Bei der gezeigten Schaltungsanordnung sei eine
Eingangsspannung durch E dargestellt; ebenso ein elektrischer Strom durch den EingangsanschluB, durch /
dargestellt; und eine vorwärts vorspannende Spannung jeder Diode durch Ed. Dann laßt sich die folgende
Beziehung anstellen:
= nEd
nEd (n-l)Ed
2R + R
(29)
Ed
15
20
+2]
Ed ,
ίγϊγ \ η + 2.
(n - I)IfI
H1Ed
2R
(30)
Wenn π aus den Gleichungen (29) und (30) eliminiert
wird, dann ergibt sich
(3D
Hieraus läßt sich erkennen, daß der elektrische Strom / proportional zum Quadrat der Eingangsspannung ist.
Dies bedeutet eine Annäherung der charakteristischen Kurve der Quadrate mit gebrochenen Linien. Tatsächlich besitzen die Dioden jedoch nicht ideale gebrochene
Linien-Eigenschaften, sondern exponentiell Funktionseigenschaften, so daß die Quadrierschaltung einen noch
besseren Grad an Annäherung besitzt. Gemäß Fig. 10
läßt sich ein quadrierter Ausgangsspannungswert von — E2 gegenüber einem Eingangsspannungswert von E
dadurch erhalten, indem man an die nachfolgende Stufe der Quadrierschaltung 100, die in Fig..9 gezeigt ist,
einen Rückkopplungsverstärker A anordnet, dessen Rückkopplungswiderstand Rr so ausgewählt ist, daß er
einen Widerstandswert von 2Ä£c/besitzt
■m?(r
· Σ
π = I
Die Berechnung von
Σ (/, 1''ΑΜΦ (k'f
wird in den das innere Produkt berechnenden Schaltungen 511— 51M, den Quadrierschaltungen
so
65
35
40
45
F i g. 11 zeigt eine detaillierte Schaltungsanordnung
gemäß einem Beispiel der Vergleichsschaltung, die in Fig. 5 gezeigt ist
Die Vergleichsschaltung besteht aus einem bekannten Differentialverstärkerabschnitt 101 und einer bekannten Schmidt-Schaltung 102. Zwischen den Eingangsanschlüssen Λ und h des Differentialverstärkers 101 wird
ein Differenzsignal gewonnen und verstärkt In dem Schmidt-Schaltungsabschnitt 102 erscheint an einem
Ausgangsanschluß q, wann ein Differenzsignal von Ix-k positiv ist, ein Ausgangssignal von »1«, die auf ein
positives Potential gesättigt ist Wenn umgekehrt das Differenzsignal negativ ist, so erscheint ein Ausgangssignal von »0« am Ausgangsanschluß q, welches auf
einem Null-Potential liegt
In dieser Weise sind die jeweiligen Blöcke von F i g. 5 so ausgeführt, wie dies in den F i g. 8—12 gezeigt ist und
es wird die Berechnung gemäß Gleichung (26) durchgeführt
Die Ausgangsgröße der Gemischtenähnlichkeit-Rechenschaltung 5, d. h. die Ausgangsgröße qk der
Vergleichsschaltung 60 wird zusammen mit anderen Ausgangsgrößen q\, ql.., wie dies in F i g. 4 gezeigt ist
der Erkennungsschaltung 6 zugeführt Die Erkennungsschaltung 6 führt nach dem Empfang von irgendeiner
der Ausgangsgrößen qi—qK der Rechen-Vergleichsschaltungen SOl —50K, eine Erkennung hinsichtlich der
Kategorie durch, zu welcher diese gehört Die Erkennung kann einfach dadurch ausgeführt werden,
indem man die Ausgangsgrößen qi—qK in kodierter Form darstellt
Fig. 12 zeigt ein Blockschaltbild einer anderen Ausführungsform der Gemischtenähnlichkeit-Rechenschaltung 5 der Anerkennung zur Bildmustererkennung
nach der Erfindung. Bei dieser Ausführungsform von F i g. 5 wird die Erkennung dahingehend durchgeführt,
ob die Ungleichung (26) befriedigt werden kann oder nicht Da jedoch offensichtlich ist, daß der Wert, d. h.
(1—ε) P der linken Seite der Gleichung (26) keine
Bedeutung für Ar hat wenn Ar so gewählt ist daß der Wert:
tlk) =Σ(
m= I
-Σ
(32)
der linken Seite der Gleichung (26) ein Maximum wird,
kann die Erkennung gemacht werden, daß das Eingabebild / zur Arien Kategorie gehört. Das
Blockschaltbild gemäß Fig. 12 ist auf diesem Konzept basierend aufgebaut.
Dies bedeutet, daß das Eingabebild /einer Schaltung zugeführt wird, um die Berechnung durchzuführen von
521 — 52M und der Summierschaltung 53 durchgeführt,
während die Berechnung von
in den Rechenschaltungen 541— 54N, den Quadrier-
schaltungen 551— 557V und der Summierschaltung 56
durchgeführt wird.
Demzufolge können die Ausgangsgrößen U—iK der
Rechenschaitungen 1211—121K jeweils der Ausgangsgröße
Uc der Nummierschaltung 53 entsprechen, die in
F i g. 5 gezeigt ist, während die Ausgangsgrößen jil—jK
der Rechenschaltungen 1221 —122AT jeweils der Ausgangsgröße
/t entsprechen können.
Aus den Ausgangsgrößen U—iK und ß—jK können
entsprechende Ausgangsgrößen, die die gleiche Nachsilbe
haben, den Subtrahierschaltungen 1231, 1232, ... 123Ä, ... i23K zugeführt werden, in denen eine
Differenz zwischen /7—/Jt und jl—jk gebildet wird. Die
Ausgangsgrößen i0>, 0,... (N,... i(K) der Subtrahierschaltungen
1231,1232,... 123it · · -123* werden einer
Maximum-Bestimmungsschaltung 124 zugeführt, in welcher ein maximaler Wert iftJ einer Zahl K von
Werten bestimmt wird. Die Schaltung 124 erzeugt ein Ausgangssignal / welches durch Kodierung der
Kategorie k entsprechend dem Maximalwert Kk>
erhalten wird. Eine derartige Maximum bestimmende Schaltung ist bereits bekannt
Wie bereits erläutert wurde, wird ein elektrisches Signal, welches irgendeinem abgetasteten Bild oder
Bildmuster entspricht, nachdem es vorverarbeitet wurde, einer Identifikationsschaltung zugeführt, in der
für jede von /T-Nummern von voreingestellten Nummern,
Af-Nummern der Bezugsbilder {Φη(-χ}ί vorgesehen
sind, die eine orthonormale Beziehung befriedigen, und
eine Zahl N von Bezugsbildern \9Jk>(x} vorgesehen
sind, deren Komponenten eine orthogonale üeziehung zu dem Bezugsbild aufweisen und die orthogonale
Beziehung zueinander bzw. untereinander befriedigen, die in diesen Bildern vorhanden sind, die eine relativ
hohe Ähnlichkeit mit der Jtiten Kategorie der Anzahl K
von Kategorien zeigen und als zu einer unterschiedlichen Kategorie gehörend betrachtet werden. In der
Erkennurgsschaltung wird die Erkennung durch Berechnung der Gleichung (26) oder (32) zwischen dem
hinsichtlich der Kategorie unbekannten Eingabebild und dem einzelnen Bezugsbild durchgeführt Wies dies
aus der Erläuterung in Verbindung mit dem Gemischtenähnlichkeitsverfahren nach dem Prinzip der Erfindung
hervorgeht, läßt sich eine weitgehende Unterscheidung zwischen dem Eingabebild und irgendwelchen
leicht verwechselbaren Bildern durch die vorliegende Erfindung realisieren, wobei diese Bilder zu einer
unterschiedlichen Kategorie gehören und wobei diese Unterscheidung nicht mit Hilfe des bekannten einfachen
Ähnlichkeitsverfahrens und mit Hilfe des Vielfachähnlichkeitsverfahrens erreicht werden kann. Gemäß der
Erfindung wird somit eine zulässige Unterscheidungsauswertung hinsichtlich der Deformationskomponenten
durchgeführt, die für das Bild zulässig sind, welches zur K\en in Betracht gezogenen Kategorie gehört, und es
wird eine tiefgreifende Unterscheidungsauswertung hinsichtlich der leicht verwechselbaren Komponenten
gemacht die zu einer unterschiedlichen Kategorie gehören. Daher läßt sich eine Unterscheidung zwischen
einer numerischen Figur »0« und einem englischen Buchstaben »O«, einer numerischen Figur »1« und
einem englischen Buchstaben »I« usw. mit hoher Genauigkeit durchführen.
Obwohl die Anordnung zur Bildmustererkennung, welche auf dem Gemischtenähnlichkei tsverfahren basiert,
unter Verwendung von elektrischen Schaltungen aufgebaut ist, läßt sich die Anordnung auch mit dem
gleichen Ergebnis und Wirkung unter Verwendung von optischen Filterschaltungen realisieren.
Gemäß Fig. 13 wird ein Lichtstrahl, der einem Eingabebild / entspricht, nachdem er durch eine
optische Linse 130 fokussiert wurde, unter Verwendung von Halbspiegeln 131a und 1316 aufgeteilt Bei dem
gezeigten Ausführungsbeispiel ist der Fall veranschaulicht bei dem M = 2 und Af = 1 ist Der durch den
Halbspiegel hindurchgelangte Lichtstrahl wird den Bezugsbildern Φ\Μ, Φ/Η 3Ί W überlagert und wird durch
jeweilige optische Linsen 132a, 132Z>, 532c auf
photoelektrische Wandler 133a, 133Z>und 133cgelenkt
Die Ausgangssignale der photoelektrischen Wandler 133a, 133/3 und 133c erscheinen am Ausgang, nachdem
zwischen jedem der Bezugsbilder Φ ι (XrJt Φ/Μ W^ und
dem Eingabebild f die Berechnung eines inneren Produktes durchgeführt wurde, wobei das Eingabebild
beispielsweise den Quadrierschaltungen 521—52A/und
551— 55/V von Fig.5 zugeführt werden muß. Die
aufeinanderfolgenden Rechnungen werden gemäß F i g. 5 durchgeführt
Wenn demzufolge die Bezugsbilder Φ, W1Φ^), <P,W als
Drehfilter konstruiert sind, um jeweils Φι<·)—Φ^κ),
Φ^)—Φ^κ>, (P1O)-^P1W abzudecken und wenn die
Drehfilter synchron gedreht werden, so wird der gleiche Effekt wie bei der elektrischen Einrichtung der zuvor
erläuterten Ausführungsform in diesem Fall erzielt Gemäß diesem Verfahren ist es nicht erforderlich, eine
das innere Produkt berechnende Schaltung vorzusehen, die in der elektrischen Einrichtung dieser Ausführungsform erforderlich ist
Obwohl sich die vorangegangenen Erläuterungen auf die Erkennung eines »figürlichen« Musters oder Bildes
beschränken, so läßt sich der Gegenstand der vorliegenden Erfindung auch bei der Erkennung eines
Klanges verwenden. In diesem Fall wird eine Anzahl K von Bezugsklangmustern oder -bildern einleitend
vorgesehen, und es läßt sich eine Erkennung durchführen, zu welcher Kategorie eine Kategorie des
unbekannten Klangbildes oder -musters gehört. Dies erfolgt mit hoher Genauigkeit, und zwar auf Grund des
Gemischtenähnlichkeitsverfahrens. Dies läßt sich unter Betrachtung der Tatsache einfach verstehen, daß ein
kontinuierlich eingespeistes Klang- oder Schallsigna] der Gleichung (24) entspricht
Hierzu 8 Blatt Zeichnungen
Claims (3)
1. Anordnung zur Erkennung von Bildmustern, in
welcher ein Eingabemuster durch Rasterzerlegung in eine Vielzahl von Einzelpunkten unterteilt und mit
K ebenfalls zerlegten Bezugsmustern verglichen wird, und zwar in der Weise, daß für jedes der K
Bezugsmuster M Standardvariationsmuster erzeugt werden, die untereinander in solcher Beziehung
stehen, daß samtliche aus jeweils zwei verschiedenen
Standardvariationsmustern gebildeten skalaren Produkte Null sind, daß durch eine erste Multiplikationsvorrichtung aus dem Eingangsmuster einerseits und
sämtlichen M Standardvariationsmustern aller K Bezugsmuster andererseits die skalaren Produkte
gebildet werden, daß diese skalaren Produkte dann in einer Quadriereinrichtung quadriert, werden und
daß schließlich in einer ersten Addiervorrichtung für
jedes der K Bezugsmuster die Summe aller quadrierten skalaren Produkte des Eingangsmusters
mit den M Standardvariationsmustern gebildet wird, dadurch gekennzeichnet, daß zusätzlich N
Standardvariationsmuster eines oder mehrer solcher Bezugsmuster erzeugt werden, die dem ersten
Bezugsmuster sehr ähnlich sind, wobei sämtliche skalare Produkte aus den zusätzlichen Standardvariationsmustern
untereinander sowie aus den ersten Standardvariationsmustern und den zusätzlichen
Standardvariationsmustern Null ergeben, daß die skalaren Produkte aus dem Eingangsmuster und
allen N zusätzlichen Standardvariationsmustern durch eine zweite Multiplikationseinrichtung (541
bis 54N) gebildet werden, daß diese skalaren Produkte in einer zweiten Quadriereinrichtung (551
bis 55N) quadriert werden, daß durch eine zweite Addiervorrichtung (56) für alle K Bezugsmuster die
Summe aller quadrierten skalaren Produkte des Eingangsmusters mit den N Standardvariationsmustern
gebildet wird, daß die durch die beiden Addiervorrichtungen (53, 56) gebildeten Summen in
eine Vergleichsschaltung (60) gegeben werden, und daß die Differenzwerte der K Bezugsmuster aller
Vergleichsschaltungen (60) in einer Erkennungsschaltung ausgewertet werden.
2. Anordnung zur Erkennung von Bildmustern nach Anspruch 1, dadurch gekennzeichnet, daß die
Erkennungsschaltung einen Vergleichskreis enthält, der den Differenzwert mit einem Wert von (1 - e)
\\ψ vergleicht, wobei ||/]|2 das skalare Produkt des
Eingangsmusters darstellt.
3. Anordnung zur Erkennung von Bildmustern nach Anspruch 1, dadurch gekennzeichnet, daß die
Erkennungsschaltung einen Maximalwert-Detektor (124) aufweist, welcher den Maximalwert aller K
Eingangswerte feststellt.
Es sind bereits eine Vielzahl von Anordnungen zur Bildmustererkennung bekannt geworden. Von diesen
Systemen ist ein Bildanpassungsverfahren oder ein
einfaches auf der Ähnlichkeit basierendes Verfahren bekanntgeworden, durch die eine relativ gute Erkennung
möglich ist Gemäß diesem Verfahren wird eine Erkennung dadurch erzielt, indem man sicherstellt, in
welchem Ausmaß ein gegebenes Eingangs-Bildmuster Ähnlichkeit mit einem Bezugs-Bildmuster besitzt
to Ein Bildmuster läßt sich in einer zweidimensionalen
Ebene beschreiben, und es können eine unendliche Zahl von Bildmustern in dieser Ebene dargestellt werden.
Diese Bildmuster stellen einen unendlichen Satz oder Menge dar. Bei dem zuvor erwähnten Erkennungsver-
fahren wird ein Sau von Punkten, der eine 1 :1-Obereinstimmung
ermöglicht, gegenüber einem einzelnen Bildmuster betrachtet, wobei dies als Bildmusterraum
definiert wird. In dem Bildmusterraum wird die Ähnlichkeit durch Vektoren bestimmt, die dem Bildmuster
entsprechen.
Fig. IA zeigt eine Beziehung zwischen einem Satz
von Bildern und einem Bildraum. In dieser Figur entspricht der Ursprung der Vektoren in dem Bildraum
einem weißen Muster, und die Länge jedes Vektors entspricht der Dichte jedes der anderen Muster in dem
Bildsatz oder der Bildmenge.
Das jeweilige Bild wird als Funktion f(x) ausgedrückt,
die einen Positionsvektor χ betrifft, der in einer zweidimensionalen Zone /{definiert ist.
Wenn ein gleichmäßiges Bild f(x) in eine geeignete Anzahl von Quadraten L aufgeteilt wird, wie dies in
F i g. IB gezeigt ist, und die Dichten der Quadrate durch
Mittelwerte f\, f2,... fn ... /t dargestellt werden, die die
Dichte jedes Quadrates wiedergeben, so läßt sich das Bild f(x)durch die Vektoren f\,h,...fr...fL ausdrücken,
die einer Zahl L von Werten entsprechen.
Das Prinzip des zuvor erwähnten einfachen Ähnlichkeits-Verfahrens soll im folgenden mehr im einzelnen
erläutert werden.
Wird ein Eingabebild durch f(x) dargestellt und ein Bezugsbild durch fo(x), so läßt sich der Grad der
Ähnlichkeit S[f, fo] des Eingabebildes f(x) mit dem Bezugsbild fo(x)v/\e folgt definieren:
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8853773A JPS5619656B2 (de) | 1973-08-08 | 1973-08-08 |
Publications (3)
Publication Number | Publication Date |
---|---|
DE2438200A1 DE2438200A1 (de) | 1975-02-20 |
DE2438200B2 true DE2438200B2 (de) | 1980-11-13 |
DE2438200C3 DE2438200C3 (de) | 1981-10-22 |
Family
ID=13945577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE2438200A Expired DE2438200C3 (de) | 1973-08-08 | 1974-08-08 | Anordnung zur Erkennung von Bildmustern |
Country Status (5)
Country | Link |
---|---|
US (1) | US3906446A (de) |
JP (1) | JPS5619656B2 (de) |
DE (1) | DE2438200C3 (de) |
FR (1) | FR2240485B1 (de) |
GB (1) | GB1477876A (de) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4153946A (en) * | 1977-10-20 | 1979-05-08 | Upton Howard T | Expandable selection and memory network |
JPS5944667B2 (ja) * | 1978-03-28 | 1984-10-31 | 株式会社東芝 | パタ−ン認識装置 |
JPS55157799A (en) * | 1979-05-29 | 1980-12-08 | Nippon Electric Co | High efficiency pattern matching unit |
JPS5665291A (en) * | 1979-10-31 | 1981-06-02 | Tokyo Shibaura Electric Co | Discriminator for printed matter |
JPS57178578A (en) * | 1981-04-27 | 1982-11-02 | Toshiba Corp | Pattern recognition system |
JPS58129684A (ja) * | 1982-01-29 | 1983-08-02 | Toshiba Corp | パタ−ン認識装置 |
US4543660A (en) * | 1982-04-15 | 1985-09-24 | Tokyo Shibaura Denki Kabushiki Kaisha | Pattern features extracting apparatus and method |
US5297222A (en) * | 1982-05-04 | 1994-03-22 | Hitachi, Ltd. | Image processing apparatus |
EP0124789B1 (de) * | 1983-04-11 | 1990-01-24 | Kabushiki Kaisha Komatsu Seisakusho | Verfahren zum Identifizieren von Objekten |
JPS6057475A (ja) * | 1983-09-07 | 1985-04-03 | Toshiba Corp | パタ−ン認識方式 |
JPH01183793A (ja) * | 1988-01-18 | 1989-07-21 | Toshiba Corp | 文字認識装置 |
FR2654541B1 (fr) * | 1989-11-15 | 1994-03-04 | Cibiel Jean Yves | Procede de reconnaissance de formes, notamment de reconnaissance vocale multilocuteur du langage naturel, et dispositif pour la mise en óoeuvre de ce procede. |
US5299284A (en) * | 1990-04-09 | 1994-03-29 | Arizona Board Of Regents, Acting On Behalf Of Arizona State University | Pattern classification using linear programming |
EP0656602B1 (de) * | 1993-12-02 | 2001-07-11 | Nippon Telegraph And Telephone Corporation | Bildmusteridentifikations/Erkennungsverfahren |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3492646A (en) * | 1965-04-26 | 1970-01-27 | Ibm | Cross correlation and decision making apparatus |
DE1549928A1 (de) * | 1967-09-20 | 1971-05-13 | Telefunken Patent | Auswerteeinrichtung fuer zeichenlesende Maschinen |
JPS4912778B1 (de) * | 1969-11-05 | 1974-03-27 | ||
DE2026033C3 (de) * | 1970-05-27 | 1979-05-03 | Matth. Hohner Ag, 7218 Trossingen | Rasterverfahren zur Klassifizierung von Schriftzeichen |
JPS518699B1 (de) * | 1970-11-09 | 1976-03-19 |
-
1973
- 1973-08-08 JP JP8853773A patent/JPS5619656B2/ja not_active Expired
-
1974
- 1974-08-07 US US496012A patent/US3906446A/en not_active Expired - Lifetime
- 1974-08-08 DE DE2438200A patent/DE2438200C3/de not_active Expired
- 1974-08-08 GB GB3494674A patent/GB1477876A/en not_active Expired
- 1974-08-08 FR FR7427638A patent/FR2240485B1/fr not_active Expired
Also Published As
Publication number | Publication date |
---|---|
GB1477876A (en) | 1977-06-29 |
JPS5619656B2 (de) | 1981-05-08 |
US3906446A (en) | 1975-09-16 |
DE2438200C3 (de) | 1981-10-22 |
DE2438200A1 (de) | 1975-02-20 |
JPS5039025A (de) | 1975-04-10 |
FR2240485B1 (de) | 1976-12-31 |
FR2240485A1 (de) | 1975-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2438200C3 (de) | Anordnung zur Erkennung von Bildmustern | |
DE2909153C2 (de) | Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern | |
DE3633743C2 (de) | ||
EP0780002B1 (de) | Verfahren und vorrichtung zur rekonstruktion von in rasterform vorliegenden linienstrukturen | |
EP0312905A1 (de) | Verfahren zur automatischen Zeichenerkennung | |
DE1129333B (de) | Verfahren und Vorrichtung zum automatischen Erkennen von Kurvenzuegen | |
EP1316057B1 (de) | Auswerten von kantenrichtungsinformation | |
EP1104570A1 (de) | Verfahren zum erkennen von objekten in digitalisierten abbildungen | |
DE1771422A1 (de) | Geraet fuer die Gewinnung einer Anzeige getrennter Farben | |
DE2054546B2 (de) | Anordnung zur Erkennung von Bildmustern | |
EP0290374A2 (de) | Verfahren und Vorrichtung zum Generieren und zum Reproduzieren von zweidimensionalen graphischen Objekten | |
DE2748558C3 (de) | Vorrichtung zum Prüfen der Echtheit von Banknoten | |
DE102007040070B4 (de) | Bilddichteumwandlungsverfahren, Bildverbesserungsverarbeitungseinrichtung und dafür geeignetes Programm | |
DE3515159A1 (de) | Bildverarbeitungseinrichtung | |
DE10313040A1 (de) | Messdatenanpassungsverfahren | |
DE3811396C2 (de) | ||
DE69631845T2 (de) | Musterextrahierungsgerät | |
DE3306367C2 (de) | ||
DE1294074B (de) | Zeichenerkennungsvorrichtung mit spaltenweiser Abtastung | |
EP0042981A1 (de) | Verfahren zur Codierung von elektrischen Signalen, die bei der Abtastung eines grafischen Musters mit aus Text und Bildern gemischtem Inhalt gewonnen werden | |
EP0742672A2 (de) | Verfahren zur Datenreduktion mittels fraktaler Bildkodierung | |
WO2002023492A2 (de) | Verfahren zur klassifizierung von dokumenten | |
EP0780792B1 (de) | Verfahren zur rechnergestützten Bewegungsschätzung für Bildpunkte zeitlich aufeinander folgender Bilder einer Videosequenz | |
EP0780793A2 (de) | Verfahren zur rechnergestützten Bewegungsschätzung für Bildpunkte zeitlich aufeinander folgender Bilder einer Videosequenz | |
EP1402460B1 (de) | Automatische identifikation und/oder verifikation linienhafter texturen wie fingerabdrücke |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C3 | Grant after two publication steps (3rd publication) | ||
8328 | Change in the person/name/address of the agent |
Free format text: MUENZHUBER, R., DIPL.-PHYS., PAT.-ANW., 8000 MUENCHEN |
|
8327 | Change in the person/name/address of the patent owner |
Owner name: IIJIMA, TAIZO, TANASHI, TOKIO/TOKYO, JP KABUSHIKI |