DE2438200B2 - Anordnung zur Erkennung von Bildmustern - Google Patents

Anordnung zur Erkennung von Bildmustern

Info

Publication number
DE2438200B2
DE2438200B2 DE2438200A DE2438200A DE2438200B2 DE 2438200 B2 DE2438200 B2 DE 2438200B2 DE 2438200 A DE2438200 A DE 2438200A DE 2438200 A DE2438200 A DE 2438200A DE 2438200 B2 DE2438200 B2 DE 2438200B2
Authority
DE
Germany
Prior art keywords
image
patterns
pattern
circuit
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE2438200A
Other languages
English (en)
Other versions
DE2438200C3 (de
DE2438200A1 (de
Inventor
Taizo Tanashi Tokio Iijima
Kenichi Yokohama Mori
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iijima Taizo Tanashi Tokio/tokyo Jp Kabushiki
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Publication of DE2438200A1 publication Critical patent/DE2438200A1/de
Publication of DE2438200B2 publication Critical patent/DE2438200B2/de
Application granted granted Critical
Publication of DE2438200C3 publication Critical patent/DE2438200C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries

Description

Die Erfindung betrifft eine Anordnung zur Erkennung von Bildmustern gemäß Oberbegriff des Anspruchs 1. Diese Anordnung ist aus der DE-OS 20 54 546 bekannt.
_ (/ι Jo)
ΊϊΤΠλΙ
wobei (f, fo) ein inneres Produkt bedeutet, welches zwischen f(x) und fo(x) berechnet wird und wie folgt so ausgedrückt wird:
(/,/o) = f*f(x)Mx)dx
wobei Ar in der Zone R definiert ist.
||/|| wird als Norm von /(ty bezeichnet und hat einen positiven Wert, der definiert ist zu:
I = KfJ)
In ähnlicher Weise wird fo als die Norm von fo(x) bezeichnet Die Norm ||/|| stellt den Abstand des Bildes f(x)dar, und zwar gemessen vom Ursprung im Bildraum, und die Norm ||/ό|| stellt den Abstand des Bildes /o(x,ldar, und zwar gemessen vom Ursprung im Bildraum. Ein Bild fo(x) = 0, welches dem weißen Bildmuster entspricht, stellt den Ursprung des Bildraumes dar. θ stellt einen Winkel zwischen zwei Vektoren dar, die vom Ursprung aus zu f(x)und fo(x)gezogen sind, so daß die so definierte
Ähnlichkeit S[f, /b] dem Cosinus θ entspricht und einen bestimmten Wert in einem Bereich
annimmt
Wenn speziell ffx)exakt identisch mit fo(x) ist, so wird
Mx)SUJo] = 1
Bei ε > 0 (ε ist eine positive Zahl kleiner als oder gleich 1), und wenn die Beziehung
befriedigt ist, so kann das Bild f(x) als zu dem Bild ^) gehörig identifiziert werden, und wenn diese Beziehung nicht befriedigt ist, kann das Bild f(x) rls nicht zu dem Bild/(^gehörend identifiziert werden.
Das zuvor geschilderte Verfahren zur Bestimmung der Ähnlichkeit eines Eingabebildes mit einem Bezugsbild unter Verwendung der Gleichung (1) wird als das einfache Ähnlichkeitsverfahren bezeichnet
Die Ähnlichkeit S[f, /&] bleibt unbeeinflußt, wenn die Dichte der Dichtefunktion f[x) als Ganzes gleich A, multipliziert mit der ursprünglichen Dichte, beträgt, wobei diese letztere Dichte als Af(x) ausgedrückt wird, wobei A eine beliebige Konstante darstellt Demzufolge läßt sich das zuvor erwähnte einfache Ähnlichkeitsverfahren günstig dort einsetzen, wenn ein Bild (z. B. ein Buchstabe) mit solcher Gestalt identifiziert werden soll, daß selbst dann, wenn das Bild Dichte-Schwankungen aufweist, eine f(x) zugehörige Kategorie nicht geändert wird.
Ein normales Bild ist jedoch aus vielerlei Gründen in gewissem Ausmaß deformierbar, und zwar zusätzlich zu Dichteschwenkungen. Dort, wo beispielsweise die Position für das Bezugsbild versetzt ist, wird die einfache Ähnlichkeit 5 direkt beeinflußt, und sie stellt einen Wert dar, der von einem wahren Verfahren abweicht
Hierdurch wird einer Verbesserung der Erkennung eine Grenze gesetzt, die auf dem einfachen Ähnlichkeitsverfahren basiert Um diese Nachteile zu beseitigen, wurden bereits viele ähnliche Verfahren vorgeschlagen.
Bei dem Vielfach-Ähnlichkeitsverfahren wird eine Zahl M von Bildern Φ\(χ% Φι(χ), ■ ■ ■ Φμ(χ), die eine orthogonale Beziehung zueinander besitzen, als Bezugsbilder vorbereitet, und zwar an Stelle eines einzelnen Bezugsbildes fo(x), welches eine bestimmte Kategorie darstellt Wenn ein Eingangsbild oder Eingabebild f(x) gegeben ist, wird eine Zahl Af von Ähnlichkeiten S[f, <&m] (m — 1,2,.., M) zwischen dem Eingabebild /jtyund der Zahl Mder Bezugsbilder berechnet. Hieraus läßt sich
erhalten.
In diesem Fall wird die Erkennung von der Tatsache abhängig erreicht, ob der Wert von S\f\ die folgende Ungleichung befriedigt oder nicht:
LJl
Vielfach-Ähnlichkeit S\f\ bleibt selbst dann unbeeinflußt, wenn die Position des Bezugsbildes im Bildraum verschoben ist Aus Fig.2 läßt sich erkennen (eine Ansicht zur Erläuterung eines Unterschiedes zwischen dem einfachen Ähnlichkeitsverfahren und dem Vielfach-Ähnlichkeitsverfahren), daß Θ* einen Winkel darstellt, der zwischen dem Eingabebild f(x) und derjenigen Komponente von f(x) vorhanden ist, die auf eine Hiper-Ebene G (hiperplane) projiziert ist, wobei diese
ίο Ebene durch die Bewegung des Bezugsbildes geformt ist Der Wert S* [/J, wie er auf der Grundlage des Vielfach-Ähnlichkeitsverfahrens erhalten wird, entspricht dem cos Θ. Dies bedeutet, daß die Ähnlichkeit des Eingabebildes f(x) mit dem Bezugsbild, welches bewegt werden kann, beurteilt werden kann.
Die eingangs erwähnte Anordnung nach der DE-OS 20 54 546 arbeitet nach diesem Vielfach-Ähnlichkeitsverfahren und erbringt durch die besondere Art der Weiterverarbeitung der skalaren Produkte sich klar unterscheidende Werte, aus denen dann mit hoher Genauigkeit dasjenige Bezugsmuster ermittelt werden kann, welches dem Eingangsmuster entspricht, wobei diese Genauigkeit insbesondere nicht durch Positionsverschiebungen des Eingangsmusters auf dem Ra-
sterzerlegungsfeld beeinflußt wird. Die Praxis hat jedoch feezeigt, daß es trotz der hohen Allgemeinsicherheit dieser vorbekannten Anordnung es dann doch noch zu Schwierigkeiten und damit Fehlerkennungen kommen kann, wenn es um die Unterscheidung zweier sehr ähnlicher Bezugsmuster geht etwa der Unterscheidung zwischen dem Buchstaben »1« und der Ziffer »1« bei manchen Schreibmaschinenschriften.
Aufgabe der Erfindung ist es deshalb, die erwähnte vorbekannte Anordnung in der Weise zu verbessern, daß eine zusätzliche Sicherheit der Erkennung auch solcher Muster erreicht wird, die einander äußerst ähnlich sind. Die Lösung dieser Aufgabe ist im Kennzeichen des Anspruchs 1 angegeben.
Nachfolgend sollen nun einige technische Erläuterungen zum Problem der Unterscheidung zwischen zwei unterschiedlichen Mustern, also Mustern unterschiedlicher »Kategorie« gegeben werden, unter besonderer Berücksichtigung des Falles, daß diese Muster unterschiedlicher Kategorie einander sehr ähnlich sind.
Es sei eine Zahl K von Kategorien betrachtet auf welche ein Bild zum Zwecke der Erkennung bezogen ist Eine Zahl von M von Bezugsbildern Φι <k)(x), Φ^(χ), ■ ■. Φ^(χ) wird einleitend für irgendeine Zahl K von Kategorien beispielsweise die Me Kategorie vorbereitet Es sei hervorgehoben, daß diese Bezugsbilder eine orthonormale Beziehung befriedigen.
0(m =äf m')
(m,m' = 1,2... M)
Der durch Gleichung (7) definierte Wert der Der Ausdruck »orthonormal« wird hier in der mathematischen Sprache verwendet und unterscheidet sich von »Normalisierung«, welcher Ausdruck in der Bilderkennung verwendet wird. Die in der Bilderken· rung verwendete Bezeichnung »Normalisierung« bedeutet, daß beispielsweise ein verschobenes Buchstabenbild mit einer Bezugslage oder -position ausgerichtet wird und ein handgeschriebener Buchstabe, der von Person zu Person unterschiedlich ist, wird auf eine vorbestimmte Größe vererößert oder verkleinert.
Für die Arte Kategorie wird außerdem eine Zahl N von Bezugsbildern Φ\«<)(χ), Ψ^)(χ),... frfVfx) vorbereitet, wobei diese Komponenten eine orthogonale Beziehung zu dem Bezugsbild {Φπ/ν('χ% aufweisen, die in solchen Bildern enthalten sind, die eine relativ große Ähnlichkeit mit der Arten Kategorie besitzen und als zu einer unterschiedlichen Kategorie gehörend betrachtet werden. Es sei hervorgehoben, daß die Zahl N der Bezugsbilder
eine orthonorrnale Beziehung befriedigt;
(n,n' = 1,2... N)
und eine orthogonale Beziehung
= 0
(m=l,2...M;n =
(10)
(H)
zum Bezugsbild {Φ^(χ}.
Φ,β> und Ψβ> sind so bestimmt, daß sie die Beziehungen (9), (10) und (11) befriedigen. Φ „/Wund Ψβ), die diese Beziehungen befriedigen, existieren in unendlicher Zahl. Demzufolge läßt sich hinsichtlich der Komponenten, die am besten die Verteilung des Arien Bildes $i(k), Φι(1() ... ΦΛ*) ausdrucken, diese Komponenten zuerst durch Verwendung der Gleichung (9) bestimmen. Dann kann 9\(k). Ψ 4k> unter Verwendung der Gleichung (10) und (11) bestimmt werden.
Die Zahl von M, N wird in Abhängigkeit von der Natur der Bilder, die erkannt werden sollen, bestimmt Normalerweise wird M so ausgewählt, daß sie 3 oder mehr entspricht, und N wird so ausgewählt daß es der Zahl der Bilder entspricht die in jeder Kategorie enthalten sind, die eine Ähnlichkeit mit einem speziellen Bild besitzt Beispielsweise hat der ι ngüschc Buchstabe »O« eine Ähnlichkeit mit einer nun.erischen Figur »0« und dem englischen Buchstaben »Du und »Q«, und in diesem Fall wird N so ausgewählt, daß es 3 entspricht Eine numerische Zahl »7« besitzt eine Ähnlichkeit mit einer numerischen Zahl »9«, und in diesem Fall wird N so ausgewählt, daß es 1 entspricht
Daher läßt sich ein gegebenes Bild fifx) in die Form erweitern:
£.C.M
η= Ι
+ (hik\x),4>Jk\x)).
Das innere Produkt kann geschrieben werden als:
10 wobei die Forderung nach einer Orthogonalität, wie in den Gleichungen (9) und (11) ausgedrückt, in Betracht gezogen werden muß.
is Bei dem Ausdruck (13) ergibt sich:
(14a)
ähnlich
(14b)
Es kann gesagt werden, daß der Rest Hk>(x) die Gleichungen (14a) und (14b) befriedigt
Aus einem inneren Produkt zwischen /jtyund f(x) läßt sich der quadratische Wert einer Norm wie folgt ausdrücken:
30
35
40
45
50 II/ IP = (fix), /(χ))
\m=l
m=l
M M
ΣΣ
IB= IB
(B
fix) =
b
1
(12)
wobei Wjk)(x)} und {Va m(x)} verwendet werden, in welchen die Erweiterungskoeffizienten (On), {b„} jeweils gegeben sind als:
55
60
(13)
Ein inneres Produkt zwischen der rechten Seite der Gleichung (12) und 0m m ist wie folgt ausgedrückt:
ΣΣ
B=Im=I
+ΣΑ<
B=I
+ Σ a«(h°
m=l
Κ
Aus der Gleichung (9) wird der erste Ausdruck auf der dritte, sechste, siebente und achte Ausdruck zu Null; und rechten Seite der zuvor erläuterten Gleichheit zu aus Gleichung (10) wird der fünfte Ausdruck zu
Σ«-,2;
m=l
aus Gleichung (11) werden der zweite und der vierte Somit läßt sich die zuvor erwähnte Gleichung wie
Ausdruck zu Null. Aus der Gleichung (14) werden der folgt schreiben:
? + lift"» IP (15)
Nun läßt sich die Ähnlichkeit ök{f\ — im folgenden welches zur k\en Kategorie gehört, wie folgt als »eine gemischte Ähnlichkeit« bezeichnet — definieren:
irgendeines Eingabebildes f(x) zu einem Bezugsbild, is
-S
(16)
wobei die Parameter An,, μη reale Zahlen sind und folgenden Bereich umfassen:
Durch Substitution der Gleichung (1) in Gleichung (16) erhält man:
(17)
II/IP Ilv.*IP
Von den Ausdrücken (9) und (13) erhält man:
(18)
Die Gleichung (16) läßt sich auch wie folgt ausdrücken:
J, w-£,^F
Aus Gleichung (15) erhält man:
MP
= Λ_ 1Ö
BI=I Π
** , Ar
ν ii/ipy
ι -
(19)
030 146/146
Wie sich aus Gleichung (16) erkennen läßt, nimmt die gemischte Ähnlichkeit C(l)[/] irgendeine reale
Zahl ein, und zwar in dem Bereich von:
Insbesondere gilt, wenn das Eingabebild gleich ist:
da aus Gleichung (12), N= 0, M = 1 und A(*»(x) = 0 und dann
Da aus Gleichung (17) A1 = 1, ergibt sich
Die Ausdrücke | am | und | bm |, die in den Gleichungen (12) und (15) enthalten sind, stellen die Größe der Projektionskomponenten des Eingabebildes f(x) dar, welches Φ^>(χ), !P/" betrifft Dies kann leicht in Verbindung mit der Gleichung (3) gegebenen Erklärung verstanden werden.
Andererseits || AW || die Größe eines Restes dar, der unterschiedlich ist zu
Es kann demzufolge gesagt werden, daß Gleichung (19) den Weg zeigt, auf welche Weise diese Komponenten den Wert der gemischten Ähnlichkeit Ok[f\ beeinflussen. Der erste Ausdruck aus der rechten Seite von Gleichung (19) zeigt nämlich den durch ||AW|| bewirkten Effekt, und der zweite Ausdruck auf der rechten Seite dieser Gleichung zeigt die durch \\ am |), {| b„ \\ bewirkten Einflüsse. Somit gilt:
(22)
Gleichung (19) zeigt, daß | am | als kleiner als das Ausmaß bewertet wird, bis zu welchem der Parameter tatsächlich einer Deformation unterworfen wird, während I b„ I als größer als das Ausmaß bewertet wird, bis zu welchen der Parameter tatsächlich einer Deformation unterworfen wird. Mit anderen Worten, besitzt die gemischte Ähnlichkeit CW[Z] eine Charakteristik, daß hinsichtlich der Deformationskomponenten, die für die in Rede stehende Me Kategorie zulässig sind, eine zulässige Diskriminier-Auswertung durchgerührt wird und daß hinsichtlich der leicht verwechselbaren Komponenten eine schwerwiegende Diskriminier-Auswertung ausgeführt wird.
Es soll die Bedeutung im folgenden qualitativ erklärt werden, und zwar unter Verwendung eines Beispielfalles, bei dem das Eingabebild aus einer numerischen Figur »0« besteht und das Bezugsbild ein englischer Buchstabe »O« ist Diese Bilder »0« und »O« sind auf Grund der großen Ähnlichkeit untereinander verwechselbar, wenn irgendeines dieser Bilder einer Deformation unterworfen wird. Wenn jedoch diese Bilder einer Dichteveränderung als Ganzes unterworfen werden, oder unter Beibehaltung einer »Ähnlichkeitsentsprechend« verändert werden, so besteht kein Risiko einer Verwechslung. Wird die numerische Figur »0« in der Breite deformiert bzw. vergrößert, so hört jegliche
Unterscheidungsmöglichkeit zwischen »0« und »O« auf.
Es soll nun an Hand eines anderen Beispiels der Fall betrachtet werden, bei dem das Eingabebild aus einer numerischen Figur »1« besteht und das Bezugsbild aus einem englischen Buchstaben »I«. Diese Bilder sind verwechselbar, wenn der seitliche Balken oder Vorsprung am Kopf des »I« oder »1« geändert wird. Dies bedeutet, daß die numerische Figur »1« erkannt wird, wenn kein seitlicher Balken zur rechten Seite hin am Kopfabschnitt des Bildes »1« absteht Der englische Buchstabe »I« kann erkannt werden, wenn ein seitlicher Balken oder Querbalken zur rechten Seite am Kopfabschnitt des Bildes »I« ragt Es kann auch eine Erkennung vorgenommen werden in Abhängigkeit davon, ob der Querbalken am Kopfabschnitt des Bildes »1« oder »I« geneigt abfällt oder nicht In diesem Fall kann eine Unterscheidung zwischen »I« und »1« selbst dann erzielt werden, wenn ein Querbalken am unteren Abschnitt des numerischen Zeichens »1« einer Deformation unterworfen ist In dieser Weise gibt es zwei Typen von Komponenten: der eine Typ, der selbst dann identifizierbar ist, wenn die genannte Deformation zwischen Bildern auftritt die ähnlich untereinander sind, jedoch einer unterschiedlichen Kategorie zugehören; und der andere Typ, der nicht unterschieden werden kann, wenn diese Deformation stattfindet Gemäß dem gemischten Ähnlichkeitsverfahren nach der Erfindung wird eine zulässige Unterscheidungsauswertung hinsichtlich des früheren Typs der Komponente durchgeführt, und es wird eine schwerwiegende Unterscheidungswertung hinsichtlich des letzten Typs der Komponente durchgeführt, d. h. jegliche Deformation wird so ausgewertet, als ob keine größere Deformation stattgefunden hat
Es sei nun angenommen, daß bei 1 >· ε > 0 (ε ist eine positive Zahl) die Beziehung
Ök)U~\> 1-
(23)
gegeben ist Dann wird unabhängig davon, ob das Eingabebild f(x) zur Arien Kategorie gehört oder nicht diese in Abhängigkeit davon bestimmt ob die Beziehung befriedigt wird oder nicht In diesem Fall wird die Bestimmung unter der zuvor erwähnten Auswertung durchgeführt Bei dem zuvor erwähnten gemischten Ähnlichkeitsverfahren gilt, wenn N=O ist:
If
Bei /m = 1 und αψ = (/,<Pj*') läßt sich die zuvor angeschriebene Gleichung in folgender Weise ausdrücken:
Durch Multiplizieren des Nenners der rechten Seite der zuvor angeschriebenen Gleichung mit IbJP = I ergibt sich:
c»'rn = y
- γ sr f φ
Wenn die uadratwurzel der rechten Seite der zuvor angeschriebenen Gleichung als S*[/] betrachtet wird, so ergibt sich:
was der Vielfachähnlichkeit von Gleichung (7) entspricht.
Für M = 1 gilt:
Wenn 0t = /0, wird S = [/Jo]
was mit der einfachen Ähnlichkeit, die in Gleichung (1) wiedergegeben ist, identisch ist
Aus der vorangegangenen Beschreibung läßt sich erkennen, daß das gemischte Ähnlichkeitsverfahren eine Erweiterung des einfachen und Vielfach-Ähnlichkeitsverfahrens darstellt
Das gemischte Ähnlichkeitsverfahren wurde in theoretischer Hinsicht erläutert Bei den Identifikationssystem wird die Vorbereitung eines Musters oder einer Probe durchgeführt Ein gleichmäßiges Eingabebild f(x) wird in Form von Dichtewerten an einer Zahl L von Probepunkten ausgedrückt, und f(x) wird in Form von (f\, fi ... fr fr, ·.- fi) gegeben. Dann wird ein inneres Produkt zwischen den zwei Bildern f(x)xmd g(x) nicht in integraler Form ausgedrückt, wie diese durch Gleichung (2) definiert ist, sondern in folgender Form:
Es ist wohlbekannt, daß Gleichung (2) in der Multiplizier-Addierform, wie in Gleichung (25) gezeigt ist, umgeschrieben werden kann, und zwar unter Verwendung eines bekannten Probe-Theorems. Wenn irgendein Eingabebild als Vektorkomponenten (f\, /2, .. fi) ausgedrückt werden kann und das innere Produkt der Gleichung (25) definierbar ist, so gelten alle Erläuterungen in Verbindung mit dem gemischten Ähnlichkeitsverfahren.
Die Gleichung des gemischten Ähnlichkeitsverfahrens kann reduziert werden auf:
BI = I
Ύ -ί Cf, l/W)2 > (i - 4 \\f ψ,
11=1
(26) die durch Substitution der Gleichung (18) in Gleichung
(23) und unter Verwendung der Gleichung (13) erhalten werden kann.
In der Gleichung (26) werden die Parameter Xm μη einleitend als bekannte Größen vorbereitet s Es ist daher lediglich erforderlich, eine Anordnung zur Bildmustererkennung zu realisieren, welches bestimmen kann, ob die zuvor erwähnten Parameter die Gleichung (26) hinsichtlich des Hingabebildes /befriedigen odef nicht
Im folgenden wird die Erfindung an Hand eines Ausführungsbeispiels unter Hinweis auf die Zeichnungen näher erläutert Es zeigt
Fig. IA die Positionsbeziehung in einem Bildraum von Bildern oder Bildmustern, die einer bestimmten Kategorie zugehören,
F i g. i B eine numerische Figur »7«, die durch die sich ändernde Dichte einer Vielzahl von Quadraten dargestellt ist,
F i g. 2 eine relative Beziehung zwischen einem einfachen Ähnlichkeitsverfahren und einem Vielfach-Ähnlichkeitsverfahren,
F i g. 3 ein Blockschaltbild der grundlegenden Anordnung gemäß einer Ausführungsform zur Bildmustererkennung nach der Erfindung, F i g. 4 ein Blockschaltbild, welches schematisch eine gemischte Ähnlichkeit-Rechenschaltung aus F i g. 3 zeigt,
F i g. 5 ein Blockschaltbild gemäß einer detaillierten Anordnung einer Rechen/Vergleichsschaltung von Fig.4,
F i g. 6 ein Blockschaltbild zur Berechnung der Norm Il f\\2 einer Eingangssignalwertfolgeoder-zuges,
Fig.7 ein Blockschaltbild einer Multiplizier-Summier-Schaltung, um die Summe der inneren Produkte von zwei Bildfunktion zu erhalten;
Fig.8 eine detaillierte Schaltungsanordnung der Multiplizier-Summier-Schaltung von F i g. 7,
F i g. 9 eine Schaltung zur Durchführung der Annäherung einer Spannung-Strom-Charakteristik an die charakteristische Kurve der Quadrate mit unterbrochen gezeichneter Linie,
Fig. 10 eine Ausführungsform einer Quadrierschaltung in F i g. 5,
Fig. 11 eine detaillierte Schaltungsanordnung einer Ausführungsform einer Vergleichsschaltung in F i g. 5,
Fig. 12 ein Blockschaltbild einer anderen Ausführungsform einer Gemischtähnlichkeits-Rechenschaltung, die bei der Bildmustererkennung nach der Erfindung verwendet wird,
F i g. 13 eine schematische Darstellung einer weiteren Ausführungsform nach der Erfindung,
Fig. 14(a)—14(c) drei Beispiele eines orthonormalen Bildes, weiches beim Gegenstand der Erfindung verwendet wird und Fig. 14(d) ein Bezugsbild, welches einer Men Kategorie zugehört; und
Fig. 15 ein Blockschaltbild einer Schaltung zur Vorbereitung der Bilder von den Fig. 14(a)—14(c) aus dem Bild von F i g. 14(d).
In F i g. 3 wird ein Eingabebild 1, beispielsweise eine numerische Figur »7«, die auf weißes Papier geschrieben ist, durch einen photoelektrischen Wandler 2 abgetastet, der mit einer Abtastvorrichtung wie beispielsweise einem Lichtpunkt-Abtaster ausgestattet ist, und es wird ein elektrisches Signal Si, welches dem Schatten des Bildes 1 entspricht, durch den Abtaster erhalten. Das elektrische Signal Si wird einer Vorverarbeitungs-Vorrichtung 3 zugeleitet in der das Signal vorbearbeitet wird, und zwar hinsichtlich der Normali-
durchgeführt
Die Fig. 14(a)—(c) zeigen drei Beispiele von orthogonalen Bildern Φι^ Φ-ρ<), ... Φ^Μ. In diesen Figuren, bezeichnet ein fester schwarzer Punkt einen positiven Dichtewert, während ein schattierter Punkt einen negativen Dichtewert bezeichnet Die Größe dieser Punkte gibt die Größe dieser Werte an. Diese drei Bilder befriedigen jeweils die Gleichung (9), und wenn hinsichtlich zweier dieser drei Bilder die Dichtewerte von entsprechenden P inkten multipliziert und summiert werden, so erhält mai eine Null. Die drei orthogonalen Bilder, die in den Fig. 14(a)—(c) gezeigt sind, werden vorbereitet, und zwar auf der Grundlage des Bezugsbildes, welches repräsentativ ist für die k\e Kategorie, die in F i g. 14(d) gezeigt ist Der Vorgang der Vorbereitung der Bilder von Fig. 14(a)—(c) aus dem Bild von Fig. 14(d) soll unter Hinweis auf dadurch Fig. 15 erläutert werden. In Fig. 15 wird ein Abtastsignal, welches über die gesamte Fliehe des Bildes von F i g. 14(d) gefahren ist, einem Anschluß 151 zi geführt und gelangt dann zu einer Probe entnahmesc haltung 152 Die Probeentnahmeschaltung ist, wie allgemein bekannt, so ausgelegt, daß sie das Eingabebild in ein aus Proben bestehendes Bild umwandelt, welches eine vorher bestimmte Zahl von Probeeatnahmepunkten aufweist, und zwar bei diesem Ausführungsbeispiel 16 χ 16 Punkte. Die Ausgangsgröße der Probeentnahmeschaltung 152 gelangt zu einer Schaltung 153, in der der gemittelte Dichtewert des Bildes von dem Dichtewert abgezogen wird, der jedem Punkt des so vorbereiteten Probebildes entspricht Demzufolge stellt ein Bild, welches aus der Schaltung 153 erhalten wird, ein Bild i&W dar, welches für eine Abweichung vorn gemittelten Dichtewert repräsentativ ist. Die Ausgangsgröße der Schaltung 153 wird einer Differentialschaltung 154 und einer Betriebsschaltung 155-1 eingespeist
sation der Position und der Dicke des Eingabebildes und des Bezugsbildes. Ein Ausgangssignal Si der vorverarbeitenden Vorrichtung gelangt zu einer Mischähnlichkeit-Rechenschaltung 5 der Anordnung zur Erkennung von Bildmustern. Das Ausgangssignal der Rechenschaltung 5 gelangt zu einer Identifikationsschaltung, in welcher das Eingabebild identifiziert wird. Der photoelektrische Wandler 2 und die vorbearbeitende Schaltung 3 können in herkömmlicher Weise ausgeführt sein.
F i g. 4 zeigt ein Blockschaltbild einer Gemischtähnlichkeit-Rechenschaltung, die in F ii g. 3 gezeigt ist Das Ausgangssignai Sj, d. h. das Eingabebild / der vorverarbeitenden Schaltung wird einer Zahl K von Rechen-Vergleichsschaltungen 501, 502, ... 5OK zugeführt. In den Rechen-Vergleichsschaltungen wird ein Vergleich zwischen den Eingabebildern /und der Zahl K der Kategorien, die einleitend für eine Vergleichung vorbereitet wurden, durchgeführt, und die Identifikation wird hinsichtlich der Kategorie durchgefühlt, zu welcher das Eingabebild /gehört
Fig.5 zeigt ein Blockschaltbild mit einer k\en Schaltung (50AJt die als repräsentatives Beispiel für die Rechen-Vergleichsschaltungen von Fig.4 ausgewählt wurde. Das Eingabebild /wird einer Anzahl Af von das innere Produkt berechnenden Schaltungen 511,512,... 5 IAf zugeführt, die eine erste Gruppe darstellen, und es werden innere Produktrechnungen zwischen dem Eingabebild /und
Die Differentialschaltung 154 ist so ausgelegt, daß sie die Differenz zwischen zwei benachbarten Punkten zu jeweils der x- und der ^-Richtung des kanonischen Bildes erfaßt und diese speichert Die so erhaltenen Differentialbilder ffi> (jr-Richtung) und f^> (^Richtung) werden an die Betriebsschaltungen 155-2 und 155-3 abgegeben. Die Betriebsschaltung 155-1 empfängt das Bezugsbild /o und führt folgende Rechnung durch:
(33)
Wf0
Die Betriebsschaltung 155-2 empfangt die Differentialbilder fx und /, und führt die folgende is Rechnung durch:
ii/ji1 ιΐ/,ιι
(34)
Die Betriebsschaltung 155-3 empfängt die Differentialbilder Jx und/, und führt folgende Rechnung aus:
fc(fw) [WfA Wf1W
(35)
In den Gleichungen (34) und (35) ist / wie folgt gegeben:
(36)
II/,
Die Normgrößen ||Φΐ«||, ||Φ^|| und ||Φ^|| der Bilder ΦιΉ φ^Ν und ΦJ*) sind alle 1, und ein inneres Produkt zwischen Φι, Φι; Φι, Φι und Φ* Φι sind alle 0, wobei eine orthonormale Beziehung befriedigt wird.
Die so erhaltenen drei orthonormalen Bilder sind in den Fig. 14(a)—(c) gezeigt und sie werden als Bezugsbilder verwendet
Gemäß Fig.5 werden die Ausgangssignale au a2... 3m der das innere Produkt berechnenden Schaltungen einer Anzahl M von Quadrierschaltungen 521, 522,... 52Af zugeführt, in denen
\WV,(f,
berechnet wird. Die Ausgangssiignalt: Q, C;,... Cm der so Quadrierschaltungen werden einer ersten Summierschaltung 53 zugeführt, um eine Summenausgangsgröße /Ar zu erzeugen. Das bedeutet, da B die Ausgangsgröße ik identisch ist mit:
BI=I
was der erste Ausdruck auf der linken Seite der Ungleichung (26) ist
Das Eingabebild / wird gleichzeitig der N-Zahl der das innere Produkt berechnenden Schaltungen 541,542, ... 54AAzugeführt; die eine zweite Gnippe darstellen, in der innere-Produkt-Berechnungen zwischen dem Ein gabebild /und
W» /s" «
durchgeführt werden.
Hier werden die Bezugsbilder (PiW, Φ-pK .. durch denselben Vorgang erhalten wie im Fall von Φ Φ
Die Ausgangssignale b\, fc, ... bs der das innere Produkt berechnenden Schiltungen gelangen zu einer Anzahl N von Quadrierschaltungen S51,552,... 557V, in denen
berechnet wird. Die Ausgangssignale du di,... on der Quadrierschaltungen werden einer zweiten Summierschaltung 56 zugeführt, um eine Summenausgaiigsgröße jk tu erzeugen. Das bedeutet, daß die Ausgangsgröße jk identisch ist mit:
n=l
welches den zweiten Ausdruck auf der linken Seite der Ungleichung (26) darstellt
Das Eingabebild /wird gleichzeitig der anderen das innere Produkt berechnenden Schaltung 57 eingespeist bzw. aufgedrückt, in der || Z||2 berechnet wird. Da das Eingabebild /als Folge von einer Zahl L von Werten (fu 4 ... fi) zugeführt wird, beträgt der Recheninhalt von ll2gleich:
(27)
Die detaillierte Schaltungsanordnung zur Durchführung der Berechnung von Gleichung (27) soll im folgenden erläutert werden.
Das Ausgangssignal e der das innere Produkt berechnenden Schaltung 57 wird einer Koeffizient-Multiplizierschaltung 58 zugeführt, in der dieses Signal mit einem Koeffizienten (1 —ε) multipliziert wird.
Die Ausgangsgröße Ik der Koeffizient-Multiplizierschaltung und die Ausgangsgröße jk der rweiten Summierschaltung werden einer weiteren Addierschaltung 59 zugeführt, in welcher eine Berechnung von jk + Ik ausgeführt wird. Die Ausgangsgröße pk der Addierschaltung 59 besteht aus einem Wert, der durch Transponieren des zweiten Ausdrucks der linken Seite der Ungleichung (26) auf die rechte Seite derselben erhalten wird.
Die Ausgangsgröße ik der ersten Summierschaltung 53 und die Ausgangsgröße pk der Addierschaltung 59 gelangen zu einer Vergleichsschaltung 60, in der ein Vergleich zwischen ik und pk vorgenommen wird. Wenn ik > pk befriedigt wird, so erscheint eine Ausgangsgröße qk an der Vergleichsschaltung 60. Dies bedeutet, daß dann, wenn die Ungleichung (26) befriedigt ist, die Ausgangsgröße qk aus der Vergleichsschaltung erscheint Das Erscheinen der Ausgangsgröße qk zeigt daß das Eingabebild /zu der Arten Kategorie einer Anzahl K von vorbereiteten Kategorien gehört
F i g. 6 zeigt ein Blockschaltbild einer Schaltung zur Durchführung der Rechnung gemäß der zuvor erwähnten Gleichung (27). Eine Zahl L von Eingangssignalen Z1, 4 · · ■ Λ · · - 4 werden den Quadrierschaltungen 601,602, ... 6Or... 60Z. jeweils zugeführt Nachdem Zi2, Z2 2... #... f\} berechnet sind, gelangen die Ausgangsgrößen der Quadrierschaltungen zu einer Summierschaltung 61.
F i g. 7 zeigt ein Blockschaltbild zur Durchführung der Rechnung gemäß der zuvor erwähnten Gleichung (25). Eine Anzahl L von Eingangssignalen Z1, Z2 · · · 4 werden einer MuJüplizier-Summier-Schaltung 70 zugeführt in der eine Multipüzier-Summier-Rechnung elektrisch zwischen Z1, Z2 ... 4 und g\, gi ... gu g\, gi ... gL durchgeführt wird gL kann dadurch erhalten werden, indem man das Verhältnis zweier elektrischer Widerstände, die an späterer Stelle beschrieben werden sollen, bestimmt
Fig.8 zeigt eine Schaltungsanordnung eines Beispiels einer Multiplizier-Summier-Schaltung 70. Es
to werden Spannungen, die zu den Eingangssignalen f\—fr jeweils proportional sind, den Eingangsanschlüssen Ij-Il der Multiplizier-Summier-Schaltung 70 eingespeist Ein Verhältnis Rf/Rr eines Rückkopplungswiderstands Rf zu irgendeinem beispielsweise zu Rr der Widerstände R\—Rl wird als ein bekannter Wert gr genommen. Wenn ein Operationsverstärker A so ausgewählt und ausgelegt wird, daß er einen ausreichend hohen Verstärkungsfaktor besitzt so wird eine Spannung
(28)
als Ausgangsgröße vom Ausgangsanschluß / der Multiplizier-Summier-Schaltung 70 abgeleitet, und zwar basierend auf dem Prinzip einer gut bekannten analogen Multiplizier-Summier-Schaltung. Die Multipiizier-Summier-Schaltung von F i g. 8 kann mit einer Anzahl M von das innere Produkt berechnenden Schaltungen 511,512, ... 51Λ/ verbunden sein (die erste Gruppe) und kann mit einer Zahl N von das innere Produkt berechnenden Schaltungen 541, 542, ... 54A/ (die zweite Gruppe) verbunden sein, die beide in F i g. 5 gezeigt sind. Dies bedeutet, daß die Werte
und
nur als das Verhältnis Rf/Rr des Widerstandes Rf zum Widerstand Rr umgeschrieben zu werden brauchen. Die in Fig.8 gezeigte Multiplizier-Summier-Schaltung kann nicht nur als Rechenschaltung für das innere Produkt verwendet werden, sondern auch als Summierschaltung für
t/r
r=I
(vorausgesetzt daß g\ g2 = ... = gL = 1). Diese Größe kann der ersten und der zweiten Summierschaltung 53 und 56 von F i g. 5 zugeführt werden. Es sei angenommen L « 1 und g, = 1. Dann kann die Multiplizier-Summierschaltung von Fig.8 ebenso als Schaltung verwendet werden, um eine Ausgangsgröße -Zi zu erhalten, bei welcher das Vorzeichen eines Eingangswertes f\ umgedreht ist
Fig.9 zeigt eine detaillierte Schaltungsanordnung entsprechend einem Beispiel einer Zahl M von Quadrierschaltungen 521, 522, ... 52Af (die erste Gruppe) und eine Anzahl N von Quadrierschaltungen 551,552,... 55N(die zweite Gruppe), wie dies in F i g. 5 gezeigt ist Bei der Schaltungsanordnung von F i g. 9 sind eine Zahl N von Dioden D\ — D„ zwischen einem Paar von Eingangs- und Ausgangsanschlüssen in Reihe geschaltet. Ein Ende der Widerstände R ist mit einem
Verbindungspunkt zwischen benachbarten Dioden verbunden, und das andere Ende ist mit einer Leitung zwischen dem anderen Paar der Eingangs- und Ausgangsanschlüsse verbunden, wobei ein Kompensationswiderstand 2/2 (mit einem Widerstandswert, der doppelt so groß ist als derjenige der anderen Widerstände) zwischen die Eingangsanschlüsse geschaltet ist Bei der gezeigten Schaltungsanordnung sei eine Eingangsspannung durch E dargestellt; ebenso ein elektrischer Strom durch den EingangsanschluB, durch / dargestellt; und eine vorwärts vorspannende Spannung jeder Diode durch Ed. Dann laßt sich die folgende Beziehung anstellen:
= nEd
nEd (n-l)Ed 2R + R
(29)
Ed
Aus der Gleichung (29) ergibt sich:
15
20
+2]
Ed , ίγϊγ \ η + 2.
(n - I)IfI
H1Ed 2R
(30)
Wenn π aus den Gleichungen (29) und (30) eliminiert wird, dann ergibt sich
(3D
Hieraus läßt sich erkennen, daß der elektrische Strom / proportional zum Quadrat der Eingangsspannung ist. Dies bedeutet eine Annäherung der charakteristischen Kurve der Quadrate mit gebrochenen Linien. Tatsächlich besitzen die Dioden jedoch nicht ideale gebrochene Linien-Eigenschaften, sondern exponentiell Funktionseigenschaften, so daß die Quadrierschaltung einen noch besseren Grad an Annäherung besitzt. Gemäß Fig. 10 läßt sich ein quadrierter Ausgangsspannungswert von — E2 gegenüber einem Eingangsspannungswert von E dadurch erhalten, indem man an die nachfolgende Stufe der Quadrierschaltung 100, die in Fig..9 gezeigt ist, einen Rückkopplungsverstärker A anordnet, dessen Rückkopplungswiderstand Rr so ausgewählt ist, daß er einen Widerstandswert von 2Ä£c/besitzt
m?(r
· Σ
π = I
Die Berechnung von
Σ (/, 1''ΑΜΦ (k'f
wird in den das innere Produkt berechnenden Schaltungen 511— 51M, den Quadrierschaltungen
so
65
35
40
45 F i g. 11 zeigt eine detaillierte Schaltungsanordnung gemäß einem Beispiel der Vergleichsschaltung, die in Fig. 5 gezeigt ist
Die Vergleichsschaltung besteht aus einem bekannten Differentialverstärkerabschnitt 101 und einer bekannten Schmidt-Schaltung 102. Zwischen den Eingangsanschlüssen Λ und h des Differentialverstärkers 101 wird ein Differenzsignal gewonnen und verstärkt In dem Schmidt-Schaltungsabschnitt 102 erscheint an einem Ausgangsanschluß q, wann ein Differenzsignal von Ix-k positiv ist, ein Ausgangssignal von »1«, die auf ein positives Potential gesättigt ist Wenn umgekehrt das Differenzsignal negativ ist, so erscheint ein Ausgangssignal von »0« am Ausgangsanschluß q, welches auf einem Null-Potential liegt
In dieser Weise sind die jeweiligen Blöcke von F i g. 5 so ausgeführt, wie dies in den F i g. 8—12 gezeigt ist und es wird die Berechnung gemäß Gleichung (26) durchgeführt
Die Ausgangsgröße der Gemischtenähnlichkeit-Rechenschaltung 5, d. h. die Ausgangsgröße qk der Vergleichsschaltung 60 wird zusammen mit anderen Ausgangsgrößen q\, ql.., wie dies in F i g. 4 gezeigt ist der Erkennungsschaltung 6 zugeführt Die Erkennungsschaltung 6 führt nach dem Empfang von irgendeiner der Ausgangsgrößen qi—qK der Rechen-Vergleichsschaltungen SOl —50K, eine Erkennung hinsichtlich der Kategorie durch, zu welcher diese gehört Die Erkennung kann einfach dadurch ausgeführt werden, indem man die Ausgangsgrößen qi—qK in kodierter Form darstellt
Fig. 12 zeigt ein Blockschaltbild einer anderen Ausführungsform der Gemischtenähnlichkeit-Rechenschaltung 5 der Anerkennung zur Bildmustererkennung nach der Erfindung. Bei dieser Ausführungsform von F i g. 5 wird die Erkennung dahingehend durchgeführt, ob die Ungleichung (26) befriedigt werden kann oder nicht Da jedoch offensichtlich ist, daß der Wert, d. h. (1—ε) P der linken Seite der Gleichung (26) keine Bedeutung für Ar hat wenn Ar so gewählt ist daß der Wert:
tlk) =Σ(
m= I
(32)
der linken Seite der Gleichung (26) ein Maximum wird, kann die Erkennung gemacht werden, daß das Eingabebild / zur Arien Kategorie gehört. Das Blockschaltbild gemäß Fig. 12 ist auf diesem Konzept basierend aufgebaut.
Dies bedeutet, daß das Eingabebild /einer Schaltung zugeführt wird, um die Berechnung durchzuführen von
521 — 52M und der Summierschaltung 53 durchgeführt, während die Berechnung von
in den Rechenschaltungen 541— 54N, den Quadrier-
schaltungen 551— 557V und der Summierschaltung 56 durchgeführt wird.
Demzufolge können die Ausgangsgrößen U—iK der Rechenschaitungen 1211—121K jeweils der Ausgangsgröße Uc der Nummierschaltung 53 entsprechen, die in F i g. 5 gezeigt ist, während die Ausgangsgrößen jil—jK der Rechenschaltungen 1221 —122AT jeweils der Ausgangsgröße /t entsprechen können.
Aus den Ausgangsgrößen U—iK und ß—jK können entsprechende Ausgangsgrößen, die die gleiche Nachsilbe haben, den Subtrahierschaltungen 1231, 1232, ... 123Ä, ... i23K zugeführt werden, in denen eine Differenz zwischen /7—/Jt und jl—jk gebildet wird. Die Ausgangsgrößen i0>, 0,... (N,... i(K) der Subtrahierschaltungen 1231,1232,... 123it · · -123* werden einer Maximum-Bestimmungsschaltung 124 zugeführt, in welcher ein maximaler Wert iftJ einer Zahl K von Werten bestimmt wird. Die Schaltung 124 erzeugt ein Ausgangssignal / welches durch Kodierung der Kategorie k entsprechend dem Maximalwert Kk> erhalten wird. Eine derartige Maximum bestimmende Schaltung ist bereits bekannt
Wie bereits erläutert wurde, wird ein elektrisches Signal, welches irgendeinem abgetasteten Bild oder Bildmuster entspricht, nachdem es vorverarbeitet wurde, einer Identifikationsschaltung zugeführt, in der für jede von /T-Nummern von voreingestellten Nummern, Af-Nummern der Bezugsbilder {Φη(-χ}ί vorgesehen sind, die eine orthonormale Beziehung befriedigen, und eine Zahl N von Bezugsbildern \9Jk>(x} vorgesehen sind, deren Komponenten eine orthogonale üeziehung zu dem Bezugsbild aufweisen und die orthogonale Beziehung zueinander bzw. untereinander befriedigen, die in diesen Bildern vorhanden sind, die eine relativ hohe Ähnlichkeit mit der Jtiten Kategorie der Anzahl K von Kategorien zeigen und als zu einer unterschiedlichen Kategorie gehörend betrachtet werden. In der Erkennurgsschaltung wird die Erkennung durch Berechnung der Gleichung (26) oder (32) zwischen dem hinsichtlich der Kategorie unbekannten Eingabebild und dem einzelnen Bezugsbild durchgeführt Wies dies aus der Erläuterung in Verbindung mit dem Gemischtenähnlichkeitsverfahren nach dem Prinzip der Erfindung hervorgeht, läßt sich eine weitgehende Unterscheidung zwischen dem Eingabebild und irgendwelchen leicht verwechselbaren Bildern durch die vorliegende Erfindung realisieren, wobei diese Bilder zu einer unterschiedlichen Kategorie gehören und wobei diese Unterscheidung nicht mit Hilfe des bekannten einfachen Ähnlichkeitsverfahrens und mit Hilfe des Vielfachähnlichkeitsverfahrens erreicht werden kann. Gemäß der Erfindung wird somit eine zulässige Unterscheidungsauswertung hinsichtlich der Deformationskomponenten durchgeführt, die für das Bild zulässig sind, welches zur K\en in Betracht gezogenen Kategorie gehört, und es wird eine tiefgreifende Unterscheidungsauswertung hinsichtlich der leicht verwechselbaren Komponenten gemacht die zu einer unterschiedlichen Kategorie gehören. Daher läßt sich eine Unterscheidung zwischen einer numerischen Figur »0« und einem englischen Buchstaben »O«, einer numerischen Figur »1« und einem englischen Buchstaben »I« usw. mit hoher Genauigkeit durchführen.
Obwohl die Anordnung zur Bildmustererkennung, welche auf dem Gemischtenähnlichkei tsverfahren basiert, unter Verwendung von elektrischen Schaltungen aufgebaut ist, läßt sich die Anordnung auch mit dem gleichen Ergebnis und Wirkung unter Verwendung von optischen Filterschaltungen realisieren.
Gemäß Fig. 13 wird ein Lichtstrahl, der einem Eingabebild / entspricht, nachdem er durch eine optische Linse 130 fokussiert wurde, unter Verwendung von Halbspiegeln 131a und 1316 aufgeteilt Bei dem gezeigten Ausführungsbeispiel ist der Fall veranschaulicht bei dem M = 2 und Af = 1 ist Der durch den Halbspiegel hindurchgelangte Lichtstrahl wird den Bezugsbildern Φ\Μ, Φ/Η 3Ί W überlagert und wird durch jeweilige optische Linsen 132a, 132Z>, 532c auf photoelektrische Wandler 133a, 133Z>und 133cgelenkt
Die Ausgangssignale der photoelektrischen Wandler 133a, 133/3 und 133c erscheinen am Ausgang, nachdem zwischen jedem der Bezugsbilder Φ ι (XrJt Φ/Μ W^ und dem Eingabebild f die Berechnung eines inneren Produktes durchgeführt wurde, wobei das Eingabebild beispielsweise den Quadrierschaltungen 521—52A/und 551— 55/V von Fig.5 zugeführt werden muß. Die aufeinanderfolgenden Rechnungen werden gemäß F i g. 5 durchgeführt
Wenn demzufolge die Bezugsbilder Φ, W1Φ^), <P,W als Drehfilter konstruiert sind, um jeweils Φι<·)—Φ^κ), Φ^)—Φ^κ>, (P1O)-^P1W abzudecken und wenn die Drehfilter synchron gedreht werden, so wird der gleiche Effekt wie bei der elektrischen Einrichtung der zuvor erläuterten Ausführungsform in diesem Fall erzielt Gemäß diesem Verfahren ist es nicht erforderlich, eine das innere Produkt berechnende Schaltung vorzusehen, die in der elektrischen Einrichtung dieser Ausführungsform erforderlich ist
Obwohl sich die vorangegangenen Erläuterungen auf die Erkennung eines »figürlichen« Musters oder Bildes beschränken, so läßt sich der Gegenstand der vorliegenden Erfindung auch bei der Erkennung eines Klanges verwenden. In diesem Fall wird eine Anzahl K von Bezugsklangmustern oder -bildern einleitend vorgesehen, und es läßt sich eine Erkennung durchführen, zu welcher Kategorie eine Kategorie des unbekannten Klangbildes oder -musters gehört. Dies erfolgt mit hoher Genauigkeit, und zwar auf Grund des Gemischtenähnlichkeitsverfahrens. Dies läßt sich unter Betrachtung der Tatsache einfach verstehen, daß ein kontinuierlich eingespeistes Klang- oder Schallsigna] der Gleichung (24) entspricht
Hierzu 8 Blatt Zeichnungen

Claims (3)

Patentansprüche:
1. Anordnung zur Erkennung von Bildmustern, in welcher ein Eingabemuster durch Rasterzerlegung in eine Vielzahl von Einzelpunkten unterteilt und mit K ebenfalls zerlegten Bezugsmustern verglichen wird, und zwar in der Weise, daß für jedes der K Bezugsmuster M Standardvariationsmuster erzeugt werden, die untereinander in solcher Beziehung stehen, daß samtliche aus jeweils zwei verschiedenen Standardvariationsmustern gebildeten skalaren Produkte Null sind, daß durch eine erste Multiplikationsvorrichtung aus dem Eingangsmuster einerseits und sämtlichen M Standardvariationsmustern aller K Bezugsmuster andererseits die skalaren Produkte gebildet werden, daß diese skalaren Produkte dann in einer Quadriereinrichtung quadriert, werden und daß schließlich in einer ersten Addiervorrichtung für jedes der K Bezugsmuster die Summe aller quadrierten skalaren Produkte des Eingangsmusters mit den M Standardvariationsmustern gebildet wird, dadurch gekennzeichnet, daß zusätzlich N Standardvariationsmuster eines oder mehrer solcher Bezugsmuster erzeugt werden, die dem ersten Bezugsmuster sehr ähnlich sind, wobei sämtliche skalare Produkte aus den zusätzlichen Standardvariationsmustern untereinander sowie aus den ersten Standardvariationsmustern und den zusätzlichen Standardvariationsmustern Null ergeben, daß die skalaren Produkte aus dem Eingangsmuster und allen N zusätzlichen Standardvariationsmustern durch eine zweite Multiplikationseinrichtung (541 bis 54N) gebildet werden, daß diese skalaren Produkte in einer zweiten Quadriereinrichtung (551 bis 55N) quadriert werden, daß durch eine zweite Addiervorrichtung (56) für alle K Bezugsmuster die Summe aller quadrierten skalaren Produkte des Eingangsmusters mit den N Standardvariationsmustern gebildet wird, daß die durch die beiden Addiervorrichtungen (53, 56) gebildeten Summen in eine Vergleichsschaltung (60) gegeben werden, und daß die Differenzwerte der K Bezugsmuster aller Vergleichsschaltungen (60) in einer Erkennungsschaltung ausgewertet werden.
2. Anordnung zur Erkennung von Bildmustern nach Anspruch 1, dadurch gekennzeichnet, daß die Erkennungsschaltung einen Vergleichskreis enthält, der den Differenzwert mit einem Wert von (1 - e) \\ψ vergleicht, wobei ||/]|2 das skalare Produkt des Eingangsmusters darstellt.
3. Anordnung zur Erkennung von Bildmustern nach Anspruch 1, dadurch gekennzeichnet, daß die Erkennungsschaltung einen Maximalwert-Detektor (124) aufweist, welcher den Maximalwert aller K Eingangswerte feststellt.
Es sind bereits eine Vielzahl von Anordnungen zur Bildmustererkennung bekannt geworden. Von diesen Systemen ist ein Bildanpassungsverfahren oder ein einfaches auf der Ähnlichkeit basierendes Verfahren bekanntgeworden, durch die eine relativ gute Erkennung möglich ist Gemäß diesem Verfahren wird eine Erkennung dadurch erzielt, indem man sicherstellt, in welchem Ausmaß ein gegebenes Eingangs-Bildmuster Ähnlichkeit mit einem Bezugs-Bildmuster besitzt
to Ein Bildmuster läßt sich in einer zweidimensionalen Ebene beschreiben, und es können eine unendliche Zahl von Bildmustern in dieser Ebene dargestellt werden. Diese Bildmuster stellen einen unendlichen Satz oder Menge dar. Bei dem zuvor erwähnten Erkennungsver-
fahren wird ein Sau von Punkten, der eine 1 :1-Obereinstimmung ermöglicht, gegenüber einem einzelnen Bildmuster betrachtet, wobei dies als Bildmusterraum definiert wird. In dem Bildmusterraum wird die Ähnlichkeit durch Vektoren bestimmt, die dem Bildmuster entsprechen.
Fig. IA zeigt eine Beziehung zwischen einem Satz von Bildern und einem Bildraum. In dieser Figur entspricht der Ursprung der Vektoren in dem Bildraum einem weißen Muster, und die Länge jedes Vektors entspricht der Dichte jedes der anderen Muster in dem Bildsatz oder der Bildmenge.
Das jeweilige Bild wird als Funktion f(x) ausgedrückt, die einen Positionsvektor χ betrifft, der in einer zweidimensionalen Zone /{definiert ist.
Wenn ein gleichmäßiges Bild f(x) in eine geeignete Anzahl von Quadraten L aufgeteilt wird, wie dies in F i g. IB gezeigt ist, und die Dichten der Quadrate durch Mittelwerte f\, f2,... fn ... /t dargestellt werden, die die Dichte jedes Quadrates wiedergeben, so läßt sich das Bild f(x)durch die Vektoren f\,h,...fr...fL ausdrücken, die einer Zahl L von Werten entsprechen.
Das Prinzip des zuvor erwähnten einfachen Ähnlichkeits-Verfahrens soll im folgenden mehr im einzelnen erläutert werden.
Wird ein Eingabebild durch f(x) dargestellt und ein Bezugsbild durch fo(x), so läßt sich der Grad der Ähnlichkeit S[f, fo] des Eingabebildes f(x) mit dem Bezugsbild fo(x)v/\e folgt definieren:
DE2438200A 1973-08-08 1974-08-08 Anordnung zur Erkennung von Bildmustern Expired DE2438200C3 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8853773A JPS5619656B2 (de) 1973-08-08 1973-08-08

Publications (3)

Publication Number Publication Date
DE2438200A1 DE2438200A1 (de) 1975-02-20
DE2438200B2 true DE2438200B2 (de) 1980-11-13
DE2438200C3 DE2438200C3 (de) 1981-10-22

Family

ID=13945577

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2438200A Expired DE2438200C3 (de) 1973-08-08 1974-08-08 Anordnung zur Erkennung von Bildmustern

Country Status (5)

Country Link
US (1) US3906446A (de)
JP (1) JPS5619656B2 (de)
DE (1) DE2438200C3 (de)
FR (1) FR2240485B1 (de)
GB (1) GB1477876A (de)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4153946A (en) * 1977-10-20 1979-05-08 Upton Howard T Expandable selection and memory network
JPS5944667B2 (ja) * 1978-03-28 1984-10-31 株式会社東芝 パタ−ン認識装置
JPS55157799A (en) * 1979-05-29 1980-12-08 Nippon Electric Co High efficiency pattern matching unit
JPS5665291A (en) * 1979-10-31 1981-06-02 Tokyo Shibaura Electric Co Discriminator for printed matter
JPS57178578A (en) * 1981-04-27 1982-11-02 Toshiba Corp Pattern recognition system
JPS58129684A (ja) * 1982-01-29 1983-08-02 Toshiba Corp パタ−ン認識装置
US4543660A (en) * 1982-04-15 1985-09-24 Tokyo Shibaura Denki Kabushiki Kaisha Pattern features extracting apparatus and method
US5297222A (en) * 1982-05-04 1994-03-22 Hitachi, Ltd. Image processing apparatus
EP0124789B1 (de) * 1983-04-11 1990-01-24 Kabushiki Kaisha Komatsu Seisakusho Verfahren zum Identifizieren von Objekten
JPS6057475A (ja) * 1983-09-07 1985-04-03 Toshiba Corp パタ−ン認識方式
JPH01183793A (ja) * 1988-01-18 1989-07-21 Toshiba Corp 文字認識装置
FR2654541B1 (fr) * 1989-11-15 1994-03-04 Cibiel Jean Yves Procede de reconnaissance de formes, notamment de reconnaissance vocale multilocuteur du langage naturel, et dispositif pour la mise en óoeuvre de ce procede.
US5299284A (en) * 1990-04-09 1994-03-29 Arizona Board Of Regents, Acting On Behalf Of Arizona State University Pattern classification using linear programming
EP0656602B1 (de) * 1993-12-02 2001-07-11 Nippon Telegraph And Telephone Corporation Bildmusteridentifikations/Erkennungsverfahren

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3492646A (en) * 1965-04-26 1970-01-27 Ibm Cross correlation and decision making apparatus
DE1549928A1 (de) * 1967-09-20 1971-05-13 Telefunken Patent Auswerteeinrichtung fuer zeichenlesende Maschinen
JPS4912778B1 (de) * 1969-11-05 1974-03-27
DE2026033C3 (de) * 1970-05-27 1979-05-03 Matth. Hohner Ag, 7218 Trossingen Rasterverfahren zur Klassifizierung von Schriftzeichen
JPS518699B1 (de) * 1970-11-09 1976-03-19

Also Published As

Publication number Publication date
GB1477876A (en) 1977-06-29
JPS5619656B2 (de) 1981-05-08
US3906446A (en) 1975-09-16
DE2438200C3 (de) 1981-10-22
DE2438200A1 (de) 1975-02-20
JPS5039025A (de) 1975-04-10
FR2240485B1 (de) 1976-12-31
FR2240485A1 (de) 1975-03-07

Similar Documents

Publication Publication Date Title
DE2438200C3 (de) Anordnung zur Erkennung von Bildmustern
DE2909153C2 (de) Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern
DE3633743C2 (de)
EP0780002B1 (de) Verfahren und vorrichtung zur rekonstruktion von in rasterform vorliegenden linienstrukturen
EP0312905A1 (de) Verfahren zur automatischen Zeichenerkennung
DE1129333B (de) Verfahren und Vorrichtung zum automatischen Erkennen von Kurvenzuegen
EP1316057B1 (de) Auswerten von kantenrichtungsinformation
EP1104570A1 (de) Verfahren zum erkennen von objekten in digitalisierten abbildungen
DE1771422A1 (de) Geraet fuer die Gewinnung einer Anzeige getrennter Farben
DE2054546B2 (de) Anordnung zur Erkennung von Bildmustern
EP0290374A2 (de) Verfahren und Vorrichtung zum Generieren und zum Reproduzieren von zweidimensionalen graphischen Objekten
DE2748558C3 (de) Vorrichtung zum Prüfen der Echtheit von Banknoten
DE102007040070B4 (de) Bilddichteumwandlungsverfahren, Bildverbesserungsverarbeitungseinrichtung und dafür geeignetes Programm
DE3515159A1 (de) Bildverarbeitungseinrichtung
DE10313040A1 (de) Messdatenanpassungsverfahren
DE3811396C2 (de)
DE69631845T2 (de) Musterextrahierungsgerät
DE3306367C2 (de)
DE1294074B (de) Zeichenerkennungsvorrichtung mit spaltenweiser Abtastung
EP0042981A1 (de) Verfahren zur Codierung von elektrischen Signalen, die bei der Abtastung eines grafischen Musters mit aus Text und Bildern gemischtem Inhalt gewonnen werden
EP0742672A2 (de) Verfahren zur Datenreduktion mittels fraktaler Bildkodierung
WO2002023492A2 (de) Verfahren zur klassifizierung von dokumenten
EP0780792B1 (de) Verfahren zur rechnergestützten Bewegungsschätzung für Bildpunkte zeitlich aufeinander folgender Bilder einer Videosequenz
EP0780793A2 (de) Verfahren zur rechnergestützten Bewegungsschätzung für Bildpunkte zeitlich aufeinander folgender Bilder einer Videosequenz
EP1402460B1 (de) Automatische identifikation und/oder verifikation linienhafter texturen wie fingerabdrücke

Legal Events

Date Code Title Description
C3 Grant after two publication steps (3rd publication)
8328 Change in the person/name/address of the agent

Free format text: MUENZHUBER, R., DIPL.-PHYS., PAT.-ANW., 8000 MUENCHEN

8327 Change in the person/name/address of the patent owner

Owner name: IIJIMA, TAIZO, TANASHI, TOKIO/TOKYO, JP KABUSHIKI