DE2438200C3 - Anordnung zur Erkennung von Bildmustern - Google Patents

Anordnung zur Erkennung von Bildmustern

Info

Publication number
DE2438200C3
DE2438200C3 DE2438200A DE2438200A DE2438200C3 DE 2438200 C3 DE2438200 C3 DE 2438200C3 DE 2438200 A DE2438200 A DE 2438200A DE 2438200 A DE2438200 A DE 2438200A DE 2438200 C3 DE2438200 C3 DE 2438200C3
Authority
DE
Germany
Prior art keywords
image
patterns
circuit
standard variation
equation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE2438200A
Other languages
English (en)
Other versions
DE2438200A1 (de
DE2438200B2 (de
Inventor
Kenichi Yokohama Mori
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iijima Taizo Tanashi Tokio/tokyo Jp Kabushiki
Original Assignee
IIJIMA TAIZO TANASHI TOKIO JP
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IIJIMA TAIZO TANASHI TOKIO JP, Tokyo Shibaura Electric Co Ltd filed Critical IIJIMA TAIZO TANASHI TOKIO JP
Publication of DE2438200A1 publication Critical patent/DE2438200A1/de
Publication of DE2438200B2 publication Critical patent/DE2438200B2/de
Application granted granted Critical
Publication of DE2438200C3 publication Critical patent/DE2438200C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries

Description

Die Erfindung betrifft eine Anordnung zur Erkennung von Bildmustern gemäß Oberbegriff des Anspruchs 1. Diese Anordnung ist aus der DE-OS 20 54 546 bekannt.
Es sind bereits eine Vielzahl von Anordnungen zur Bildmustererkennung bekannt geworden. Von diesen Systemen ist ein Bildanpassungsverfahren oder ein einfaches auf der Ähnlichkeit basierendes Verfahren bekanntgeworden, durch die eine relativ gute Erkennung möglich ist Gemäß diesem Verfahren wird eine Erkennung dadurch erzielt, indem man sicherstellt, in welchem Ausmaß ein gegebenes Eingangs-Bildmuster Ähnlichkeit mit einem Bezugs-Bildmuster besitzt
Ein Bildmuster läßt sich in einer zweidimensionalen Ebene beschreiben, und es können eine unendliche Zahl von Bildmustern in dieser Ebene dargestellt werden. Diese Bildmuster stellen einen unendlichen Satz oder Menge dar. Bei dem zuvor erwähnten Erkennungsverfahren wird ein Satz von Punkten, der eine 1 :1-Übereinstimmung ermöglicht, gegenüber einem einzelnen Bildmuster betrachtet, wobei dies als Bildmusterraum definiert wird. In dem Bildmusterraum wird die Ähnlichkeit durch Vektoren bestimmt, die dem Bildmuster entsprechen.
Fig. IA zeigt eine Beziehung zwischen einem Satz von Bildern und einem Bildraum. In dieser Figur entspricht der Ursprung der Vektoren in dem Bildraum einem weißen Muster, und die Länge jedes Vektors entspricht der Dichte jedes der anderen Muster in dem Bildsatz oder der Bildmenge.
Das jeweilige Bild wird als Funktion f(x) ausgedrückt, die e-nen Positionsvektor χ betrifft, der in einer zweidimensionalen Zone R definiert ist
Wenn ein gleichmäßiges Bild f(x) in eine geeignete Anzahl von Quadraten L aufgeteilt wird, wie dies in F i g. 1B gezeigt ist, und die Dichten der Quadrate durch Mittelwerte f\, h,... fr,... h dargestellt werden, die die Dichte jedes Quadrates wiedergeben, so läßt sich das Bild f(x)durch die Vektoren /ί, fz,...fr.. .4 ausdrücken, ' die einer Zahl L von Werten entsprechen.
Das Prinzip des zuvor erwähnten einfachen Ähnlichkeits-Verfahrens soll im folgenden mehr im einzelnen erläutert werden.
Wird ein Eingabebild durch f(x) dargestellt und ein Bezugsbild durch fo(x), so läßt sich der Grad der Ähnlichkeit S[f, f0] des Eingabebildes f(x) mit dem Bezugsbild fa(x) wie folgt definieren:
(Lf0)
11/11 ll/oll
(i)
wobei (f, fo) ein inneres Produkt bedeutet, welches zwischen f(x) und fo(x) berechnet wird und wie folgt ausgedrückt wird:
(2)
wobei χ in der Zone R definiert ist.
||/|| wird als Norm von f(x) bezeichnet und hat einen positiven Wert, der definiert ist zu:
(3)
In ähnlicher Weise wird f0 als die Norm von fo(x) bezeichnet. Die Norm ||/j| stellt den Abstand des Bildes . f(x)da.r, und zwar gemessen vom Ursprung im Bildraum, und die Norm ||/0|| stellt den Abstand des Bildes /o/tydar, und zwar gemessen vom Ursprung im Bildraum. Ein Bild fo(x) — 0, welches dem weißen Bildmuster entspricht, stellt den Ursprung des Bildraumes dar. Θ stellt einen Winkel zwischen zwei Vektoren dar, die vom Ursprung aus zu f(x)\ina k(x)gezogen sind, so daß die so definierte
Ähnlichkeit S[f, fd\ dem Cosinus Θ entspricht und einen bestimmten Wert in einem Bereich
annimmt
Wenn speziell f(x) exakt identiscn mit k(x) ist, so wird
Ux)SUJ0] = 1
Bei ε> 0 (ε ist eine positive Zahl kleiner als oder gleich 1), und wenn die Beziehung
SCZJ0]
befriedigt ist, so kann das Bild f(x) als zu dem Bild fo(xj gehörig identifiziert werden, und wenn diese Beziehung nicht befriedigt ist, kann das Bild f(x) als nicht zu dem Bild /oßrjgehörend identifiziert werden.
Das zuvor geschilderte Verfahren zur Bestimmung der Ähnlichkeit eines Eingabebildes mit einem Bezugsbild unter Verwendung der Gleichung (1) wird als das einfache Ähnlichkeitsverfahren bezeichnet
Die Ähnlichkeit S[f, F0] bleibt unbeeinflußt, wenn die Dichte der Dichtefunktion f(x) als Ganzes gleich A, multipliziert mit der ursprünglichen Dichte, beträgt, wobei diese letztere Dichte als Af(x) ausgedrückt wird, wobei A eine beliebige Konstante darstellt. Demzufolge läßt sich das zuvor erwähnte einfache Ähnlichkeitsverfahren günstig dort einsetzen, wenn ein Bild {χ. Β. ein Buchstabe) mit solcher Gestalt identifiziert werden soll, daß selbst dann, wenn das Bild Dichte-Schwankungen aufweist, eine f(x) zugehörige Kategorie nicht geändert wird.
Ein normales Bild ist jedoch aus vielerlei Gründen in gewissem Ausmaß deformierbar, und zwar zusätzlich zu Dichteschwankungen. Dort, wo beispielsweise die Position für das Bezugsbild versetzt ist, wird die einfache Ähnlichkeit 5 direkt beeinflußt, und sie stellt einen Wert dar, der von einem wahren Verfahren abweicht
Hierdurch wird einer Verbesserung der Erkennung eine Grenze gesetzt, die auf dem einfachen Ähnlichkeitsverfahren basiert. Um diese Nachteile zu beseitigen, wurden bereits viele ähnliche Verfahren vorgeschlagen.
Bei dem Vielfach-Ähnlichkeitsverfahren wird eine Zahl M von Bildern Φ\(χ), Φι(χ), ■ ■. &m(x), die eine orthogonale Beziehung zueinander besitzen, als Bezugsbilder vorbereitet und zwar an Stelle eines einzelnen Bezugsbildes fo(x), welches eine bestimmte Kategorie darstellt Wenn ein Eingangsbild oder Eingabebild f(x) gegeben ist wird eine Zahl M von Ähnlichkeiten S[f, Φη,] (m = 1,2,..., M) zwischen dem EingabebilJ f(x) und der Zahl Mder Bezugsbilder berechnet Hieraus läßt sich
s* LZ] =/Σί s [/, φ J }2
erhalten.
In diesem Fall wird die Erkennung von der Tatsache abhängig erreicht ob der Wert von 5*[/j die folgende Ungleichung befriedigt oder nicht:
S*[Z3
Vielfach-Ähnlichkeit S\f] bleibt selbst dann unbeeinflußt wenn die Position des Bezugsbildes im Bildraum verschoben ist Aus Fig.2 läßt sich erkennen (eine Ansicht zur Erläuterung eines Unterschiedes zwischen dem einfachen Ähnlichkeitsverfahren und dem Vielfach-Ähnlichkeitsverfahren), daß Θ* einen Winkel darstellt der zwischen dem Eingabebild f(x) und derjenigen Komponente von f(x) vorhanden ist die auf eine Hiper-Ebene C (hiperplane) projiziert ist wobei diese Ebene durch die Bewegung des Bezugsbildes geformt ist Der Wert 5* [/], wie er auf der Grundlage des Vielfach-Ähnlichkeitsverfahrens erhalten wird, entspricht dem cos Θ. Dies bedeutet daß die Ähnlichkeit des Eingabebildes f(x) mit dem Bezugsbild, welches bewegt werden kann, beurteilt werden kann.
Die eingangs erwähnte Anordnung nach der DE-OS 20 54 546 arbeitet nach diesem Vielfach-Ähnlichkeitsverfahren und erbringt durch die besondere Art der Weiterverarbeitung der skalaren Produkte sich klar unterscheidende Werte, aus denen dann mit hoher Genauigkeit dasjenige Bezugsmuster ermittelt werden kann, welches fcm Eingangsmuster entspricht wobei diese Genauigkeit insbesondere nicht durch Positionsverschiebungen des Eingangsmusters auf dem Rasterzerlegungsfeld beeinflußt wird. Die Praxis hat jedoch gezeigt, daß es trotz der hohen Allgemeinsicherheit dieser vorbekannten Anordnung es dann doch noch zu Schwierigkeiten und damit Fehlerkennungen kommen kann, wenn es um die Unterscheidung zweier sehr ähnlicher Bezugsmuster geht, etwa der Unterscheidung zwischen dem Buchstaben »1« und der Ziffer »1« bei manchen Schreibmaschinenschriften.
Aufgabe der Erfindung ist es deshalb, die erwähnte vorbekannte Anordnung in der Weise zu verbessern, daß eine zusätzliche Sicherheit der Erkennung auch solcher Muster erreicht wird, die einander äußerst ähnlich sind. Die Lösung dieser Aufgabe ist im Kennzeichen des Anspruchs 1 angegeben.
Nachfolgend sollen nun einige technische Erläuterungen zum Problem der Unterscheidung zwischen zwei unterschiedlichen Mustern, also Mustern unterschiedlicher »Kategorie« gegeben werden, unter besonderer Berücksichtigung des Falles, daß diese Muster unterschiedlicher Kategorie einander sehr ähnlich sind.
Es sei eine Zahl K von Kategorien betrachtet, auf welche ein Bild zum Zwecke der Erkennung bezogen ist Eine Zahl von M von Bezugsbildern Φι (k>(x), Φ2(^(χ), ■ ■ ■ Φ\/ν(χ) wird einleitend für irgendeine Zahl K von Kategorien beispielsweise die k'te Kategorie vorbereitet. Es sei hervorgehoben, daß diese Bezugsbilder eine orthonormale Beziehung befriedigen.
(Φ,/1, 0jk)) = Hm = m')
0(m =Sf m')
Der durch Gleichung (7) definierte Wert der Der Ausdruck »orthonormal« wird hier in der mathematischen Sprache verwendet und unterscheidet sich von »Normalisierung«, welcher Ausdruck in der Bilderkennung verwendet wird. Die in der Bilderkennung verwendete Bezeichnung »Normalisierung« bedeutet, daß beispielsweise ein verschobenes Buchstabenbild mit einer Bezugslage oder -position ausgerichtet wird und ein handgeschriebener Buchstabe, der von Person zu Person unterschiedlich ist wird auf eine vorbestimmte Größe vergrößert oder verkleinert.
(10)
eine orthonormale Beziehung befriedigt:
x) ψ M) = W, ν. )
(η,η' = 1,2 ... N)
und eine orthogonale Beziehung
(0jk\'Fn lk)) = 0
(m=l,2...M;n=l,2...JV)
zum Bezugsbild {ΦπΡΊζχ^.
Φ^1 und !PnW sind so bestimmt, daß sie die Beziehungen (9), (10) und (11) befriedigen. Φ^>υηά Ψ Jk>, die diese Beziehungen befriedigen, existieren in unendlicher Zahl. Demzufolge läßt sich hinsichtlich der Komponenten, die am besten die Verteilung des Men Bildes $i(k), Φι(Ι() ... Φ^ν ausdrucken, diese Komponenten zuerst durch Verwendung der Gleichung (9) bestimmen. Dann kann Ψ\(1(), Ψ 4k) unter Verwendung der Gleichung (10) und (11) bestimmt werden.
Die Zahl von M, N wird in Abhängigkeit von der Natur der Bilder, die erkannt werden sollen, bestimmt. Normalerweise wird M so ausgewählt daß sie 3 oder mehr entspricht und N wird so ausgewählt daß es der Zahl der Bilder entspricht die in jeder Kategorie enthalten sind, die eine Ähnlichkeit mit einem speziellen Bild besitzt Beispielsweise hat der englische Buchstabe »O« eine Ähnlichkeit mit einer numerischen Figur »0« und dem englischen Buchstaben »D« und »Q«, und in diesem Fall wird N so ausgewählt daß es 3 entspricht. Eine numerische Zahl »7« besitzt eine Ähnlichkeit mit einer numerischen Zahl »9«, und in diesem Fall wird N so ausgewählt daß es 1 entspricht
Daher läßt sich ein gegebenes Bild f(x) in die Form erweitern:
Für die Me Kategorie wird außerdem eine Zahl N von Bezugsbildern Ψ^)(χ), <P2M(x), ■ ■ ■ ff/V(x) vorbereitet, wobei diese Komponenten eine orthogonale Beziehung zu dem Bezugsbild [Φ^)(χ^ aufweisen, die in solchen Bildern enthalten sind, die eine relativ große Ähnlichkeit mit der Men Kategorie besitzen und als zu einer unterschie<ilichen Kategorie gehörend betrachtet werden. Es sei hervorgehoben, daß die Zahl TV der Bezugsbilder
10 Das innere Produkt kann geschrieben werden als: (f(x),0jk)) = am + (Ιι*\χ),Φη«\χ))
wobei die Forderung nach einer Orthogonalität wie in den Gleichungen (9) und (11) ausgedrückt, in Betracht gezogen werden muß.
Bei dem Ausdruck (13) ergibt sich:
20 ähnlich
(14a)
(14b)
Es kann gesagt werden, daß der Rest hfk>(x) die Gleichungen (14a) und (14b) befriedigt
Aus einem inneren Produkt zwischen f(x) und f(x) läßt sich der quadratische Wert einer Norm wie folgt ausdrücken:
45
so
Il/IF = (/(χ )J(x)) N
)+Σ*
π = 1
, M
= Σ<
\m=I
4 + Σ
/ M α Φ '% Ji=I
tn = I
-ti
m=\ m'
= 1
ra=l«=l
+ Σ am(4>Jkl(x),hik)(x))
m=1
m-' " = 1 (12)
wobei i,0m'k){x)} und \'l'n <k)(x)} verwendet werden, in welchen die Erweiterungskoeffizienten {am}, {b„} jeweils gegeben sind als:
55
am=(f,0m (k)) (m=l,
60
(13)
Ein inneres Produkt zwischen der rechten Seite der Gleichung (12) und 0„m ist wie folgt ausgedrückt:
- Σ Jl
η = ]m = 1
Λ1
π= ΐπ^Ί
K(lK<k)(
am{hm(x),0jk)(x))
Aus der Gleichung (9) wird der erste Ausdruck auf der dritte, sechste, siebente und achte Ausdruck zu Null; und rechten Seite der zuvor erläuterten Gleichheit zu aus Gleichung (10) wird der fünfte Ausdruck zu
m=l
ΣΚ2.
5 π =
aus Gleichung (11) werden der zweite und der vierte Somit läßt sich die zuvor erwähnte Gleichung wie
Ausdruck zu Null. Aus der Gleichung (14) werden der folgt schreiben:
?+\\ΐιΜ\ΐ (15)
Nun läßt sich die Ähnlichkeit Ok[/] — im folgenden welches zur Men Kategorie gehört, wie folgt als »eine gemischte Ähnlichkeit« bezeichnet — definieren:
irgendeines Eingabebildes f(x) zu einem Bezugsbild, 15
n=1
(16)
wobei die Parameter Xm, μπ reale Zahlen sind und folgenden Bereich umfassen: il = A2 ^ A2 ^ ... 1 lM > 0 [l ^ /J1 ^ /i2 > ... > uN > 0 Durch Substitution der Gleichung (1) in Gleichung (16) erhält man:
(17)
Von den Ausdrücken (9) und (13) erhält man:
(18)
Die Gleichung (16) läßt sich auch wie folgt ausdrücken:
Aus Gleichung (15) erhält man:
Λ_
Λί
m=1
- j = im +a I1Z=A2 2 n=l ~Σ (i +/0^n2
71=1
ILrIP J * ,V
'm2
Tb2
m- -1" -
II*»IP M
Σ/
>.'-£
ll/IP J M
Πγλ
ILTlP J m=l m
(19)
Wie sich aus Gleichung (16) erkennen läßt, nimmt die gemischte Ähnlichkeit Ök)[f2 irgendeine reale Zahl ein, und zwar in dem Bereich von:
Insbesondere gilt, wenn das Eingabebild gleich ist:
da aus Gleichung (12), N = 0, M = 1 und h(k)(x) = 0 und dann
= λ,
Da aus Gleichung (17) A1 = 1, ergibt sich
= i.
Die Ausdrücke | am | und | bm |, die in den Gleichungen (12) und (15) enthalten sind, stellen die Größe der Projektionskomponenten des Eingabebildes f(x) dar, welches Φ^>(χ), 1PJ* betrifft. Dies kann leicht in Verbindung mit der Gleichung (3) gegebenen Erklärung verstanden werden.
Andererseits |[ h(k)\\ die Größe eines Restes dar, der unterschiedlich ist zu
Es kann demzufolge gesagt werden, daß Gleichung (19) den Weg zeigt, auf welche Weise diese Komponenten den Wert der gemischten Ähnlichkeit Ok{f\ beeinflussen. Der erste Ausdruck aus der rechten Seite von Gleichung (19) zeigt nämlich den durch ||AW|| bewirkten Effekt, und der zweite Ausdruck auf der rechten Seite dieser Gleichung zeigt die durch {| am |}, j| b„ \\ bewirkten Einflüsse. Somit gilt:
(\-?.m)am
(22)
Gleichung (19) zeigt, daß \am\ als kleiner als das Ausmaß bewertet wird, bis zu welchem der Parameter tatsächlich einer Deformation unterworfen wird, während I b„ I als größer als das Ausmaß bewertet wird, bis zu welchen der Parameter tatsächlich einer Deformation unterworfen wird. Mit anderen Worten, besitzt die gemischte Ähnlichkeit Qk>[f\ eine Charakteristik, daß hinsichtlich der Deformationskomponenten, die für die in Rede stehende Me Kategorie zulässig sind, eine zulässige Diskriminier-Auswertung durchgeführt wird und daß hinsichtlich der leicht verwechse'.barsn Komponenten siine schwerwiegende Diskriminier-Auswertung ausgeführt wird.
Es soll die Bedeutung im folgenden qualitativ erklärt werden, und zwar unter Verwendung eines Beispielfalles, bei dem das Eingabebild aus einer numerischen Figur »0« besteht und das Bezugsbüd ein englischer Buchstabe »O« ist Diese Bilder »0« und »O« sind auf Grund der großen Ähnlichkeit untereinander verwechselbar, wenn irgendeines dieser Bilder einer Deformation unterworfen wird. Wenn jedoch diese Bilder einer Dichteveränderang als Ganzes unterworfen werden, oder unter Beibehaltung einer »Ähnlichkeitsentsprechend« verändert werden, so besteht kein Risiko einer Verwechslung. Wird die numerische Figur »0« in der Breite deformiert bzw. vergrößert, so hört jegliche (21)
Unterscheidungsmöglichkeit zwischen »0« und »O« auf.
Es soll nun an Hand eines ai.deren Beispiels der Fall betrachtet werden, bei dem das Eingabebild aus einer numerischen Figur »1« besteht und das Bezugsbüd aus einem englischen Buchstaben »I«. Diese Bilder sind verwechselbar, wenn der seitliche Balken oder Vorsprung am Kopf des »I« oder »1« geändert wird. Dies bedeutet daß die numerische Figur »1« erkannt wird, wenn kein seitlicher Balken zur rechten Seite hin am Kopf abschnitt des Bildes »1« absteht Der englische Buchstabe »I« kann erkannt werden, wenn ein seitlicher Balken oder Querbalken zur rechten Seite am Kopfabschnitt des Bildes »I« ragt Es kann auch eine Erkennung vorgenommen werden in Abhängigkeit davon, ob der Querbalken am Kopfabschnitt des Bildes »1« oder »I« geneigt abfällt oder nicht. In diesem Fall kann eine Unterscheidung zwischen »I« und »1« selbst dann erzielt werden, wenn ein Querbalken am unteren Abschnitt des numerischen Zeichens »1« einer Deformation unterworfen ist In dieser Weise gibt es zwei Typen von Komponenten: der eine Typ, der selbst dann identifizierbar ist wenn die genannte Deformation zwischen Bildern auftritt die ähnlich untereinander sind, jedoch einer unterschiedlichen Kategorie zugehören; und der andere Typ, der nicht unterschieden werden kann, wenn diese Deformation stattfindet Gemäß dem gemischten Ahnlichkeitsverfahren nach der Erfindung wird eine zulässige Unterscheidungsauswertung hinsichtlich des früheren Typs der Komponente durchgeführt und es wird eine schwerwiegende Unterscheidungswertung hinsichtlich des letzten Typs der Komponente durchgeführt, d. h. jegliche Deformation wird so ausgewertet als ob keine größere Deformation stattgefunden hat
Es sei nun angenommen, daß bei 1 > ε > Q (s ist eine positive Zahl) die Beziehung
(23)
gegeben ist Dann wird unabhängig davon, ob das Eingabebild f(x) zur Jt'ten Kategorie gehört oder nicht diese in Abhängigkeit davon bestimmt, ob die Beziehung befriedigt wird oder nicht In diesem Fall, wird die Bestimmung unter der zuvor erwähnten Auswertung durchgeführt Bei dem zuvor erwähnten gemischten Ähnlichkeitsverfahren gut, wenn N=Q ist:
Bei \m = 1 und am = (/,<Pm (k)) läßt sich die zuvor angeschriebene Gleichung in folgender Weise ausdrücken :
IM
M (f φ »ψ
Durch Multiplizieren des Nenners der rechten Seite der zuvor angeschriebenen Gleichung mit 11<i>„jf2 = 1 ergibt sich:
Wenn die uadratwurzel der rechten Seite der zuvor angeschriebenen Gleichung als S*[/] betrachtet wird, so ergibt sich:
(24)
was der Vielfachähnlichkeit von Gleichung (7) entspricht.
Für M = 1 gilt:
S*ifl = \ Si f.Φι? = S[/, Φi] Wenn (P1 = /0, wird
was mit der einfachen Ähnlichkeit, die in Gleichung (1) wiedergegeben ist, identisch ist.
Aus der vorangegangenen Beschreibung läßt sich erkennen, daß das gemischte Ähnlichkeitsverfahren eine Erweiterung des einfachen und Vielfach-Ähnlichkeitsverfahrens darstellt.
Das gemischte Ähnlichkeitsverfahren wurde in theoretischer Hinsicht erläutert. Bei den Idenlifikationssystem wird die Vorbereitung eines Musters oder einer Probe durchgeführt Ein gleichmäßiges Eingabebild f(x) wird in Form von Dichtewerten an einer Zahl L von Probepunkten ausgedrückt, und f(x) wird in Form von (fu f2 ... fr fr, ■■■ fi) gegeben. Dann wird ein inneres Produkt zwischen den zwei Bildern F(x) und g(x) nicht in integraler Form ausgedrückt, wie diese durch Gleichung (2) definiert ist, sondern in folgender Form:
(25)
Es ist wohlbekannt, daß Gleichung (2) in der Multiplizier-Addierform. wie in Gleichung (25) gezeigt ist, umgeschrieben werden kann, und zwar unter Verwendung eines bekannten Probe-Theorems. Wenn irgendein Eingabebild als Vektorkomponenten (f\, f% .. fL) ausgedrückt werden kann und das innere Produkt der Gleichung (25) definierbar ist, so gelten alle Erläuterungen in Verbindung mit dem gemischten Ähnlichkeitsverfahren.
Die Gleichung des gemischten Ähnlichkeitsverfahrens kann reduziert werden auf:
σ σ,
m=l
υ,
χι - e) Hy IP,
(26)
die durch Substitution der Gleichung (18) in Gleichung
(23) und unter Verwendung der Gleichung (13) erhalten werden kann.
In der Gleichung (26) werden die Parameter Xm, μη einleitend als bekannte Größen vorbereitet.
Es ist daher lediglich erforderlich, eine Anordnung zur Bildmustererkennung zu realisieren, welches bestimmen kann, ob die zuvor erwähnten Parameter die Gleichung (26) hinsichtlich des Hingabebildes / befriedigen oder nicht.
ίο Im folgenden wird die Erfindung an Hand eines Ausführungsbeispiels unter Hinweis auf die Zeichnungen näher erläutert. Es zeigt
F i g. 1A die Positionubeziehung in einem Bildraum von Bildern oder Bildrnustern, die einer bestimmten Kategorie zugehören,
F i g. 1B eine numerische Figur »7«, die durch die sich ändernde Dichte einer Vielzahl von Quadraten dargestellt ist,
F i g. 2 eine relative Beziehung zwischen einem einfachen Ähnlichkeitsverfahren und einem Vielfach-Ähnlichkeits verfahren,
F i g. 3 ein Blockschallbild der grundlegenden Anordnung gemäß einer Ausführungsform zur Bildmustererkennung nach der Erfindung,
F i g. 4 ein Blockschaltbild, welches schematisch eine gemischte Ähnlichkeit-Rechenschaltung aus Fig. 3 zeigt,
F i g. 5 ein Blockschaltbild gemäß einer detaillierten Anordnung einer Rechen/Vergleichsschaltung von Fig.4,
F i g. 6 ein Blockschaltbild zur Berechnung der Norm Il /||2einer Eingangssignalwertfolge oder -zuges,
Fig. 7 ein Blockschaltbild einer Multiplizier-Summier-Schaltung, um die Summe der inneren Produkte von zwei Bildfunktion zu erhalten;
Fig.8 eine detaillierte Schaltungsanordnung der Multiplizier-Summier-Schaltung von F i g. 7.
F i g. 9 eine Schaltung zur Durchführung der Annäherung einer Spannung-Strom-Charakteristik an die charakteristische Kurve der Quadrate mit unterbrochen gezeichneter Linie,
Fig. 10 eine Ausführungsform einer Quadrierschaltung in F i g. 5,
F i g. 11 eine detaillierte Schaltungsanordnung einer Ausführungsform einer Vergleichsschaltung in F i g. 5,
Fig. 12 ein Blockschaltbild einer anderen Ausführungsform einer Gernischtähnlichkeits-Rechenschaltung, die bei der Bildmustererkennung nach der Erfindung verwendet wird,
F i g. 13 eine schematische Darstellung einer weiteren Ausführungsform nach der Erfindung,
Fig. 14(a)—14(c) drei Beispiele eines orthonormalen Bildes, welches beim Gegenstand der Erfindung verwendet wird und Fig. 14(d) ein Bezugsbild, welches einer Men Kategorie zugehört; und
F i g. 15 ein Blockschaltbild einer Schaltung zur Vorbereitung der Bilder von den Fig. 14(a)—14{c) aus dem Bild von F i g. 14{d).
In F i g. 3 wird ein Eingabebild 1, beispielsweise eine numerische Figur »7«, «die auf weißes Papier geschrieben ist, durch einen photoelektrischen Wandler 2 abgetastet, der mit einer Abtastvorrichtung wie beispielsweise einem Iichtpunkt-Abtaster ausgestattet ist, und es wird ein elektrisches Signal Si, welches dem Schatten des Bildes t entspricht, durch den Abtaster erhalten. Das elektrische Signal Si wird einer Vorverarbeitungs-Vorrichtung 3 zugeleitet, in der das Signal vorbearbeitet wird, und zwar hinsichtlich der NormaE-
sation der Position und der Dirke des Eingabebildes und des Bezugsbildes. Ein Ausgangssignal S2 der vorverarbeitenden Vorrichtung gelangt zu einer Mischähnlichkeit-Rechenschaltung 5 der Anordnung zur Erkennung von Bildmustern. Das Ausgangssignal der Rechenschaltung 5 gelangt zu einer Identifikationsschaltung, in welcher das Eingabebild identifiziert wird. Der photoelektrische Wandler 2 und die vorbearbeitende Schaltung 3 können in herkömmlicher Weise ausgeführt sein.
F i g. 4 zeigt ein Blockschaltbild einer Gemischtähnlichkeit-Rechenschaltung, die in F i g. 3 gezeigt ist. Das Ausgangssignal S2, d. h. das Eingabebild / der vorverarbeitenden Schaltung wird einer Zahl K von Rechen-Vergleichsschaltungen 501, 502, ... 50/C zugeführt, in den Rechen-Vergleichsschaltungen wird ein Vergleich zwischen den Eingabebildern /und der Zahl K der Kategorien, die einleitend für eine Vergleichung vorbereitet wurden, durchgeführt, und die Identifikation wird hinsichtlich der Kategorie durchgeführt, zu welcher das Eingabebild /gehört
F i g. 5 zeigt ein Blockschaltbild mit einer k'ten Schaltung [5Qk), die als repräsentatives Beispiel für die Rechen-Vergleichsschaltungen von Fig.4 ausgewählt wurde. Das Eingabebild /wird einer Anzahl Λ/νοη das innere Produkt berechnenden Schaltungen 511, 512,... 51Λί zugeführt, die eine erste Gruppe darstellen, und es werden innere Produktrechnungen zwischen dem Eingabebild /und
I T^ (h M \ \ rft M
Die Differentialschaltung 154 ist so ausgelegt, daß sie die Differenz zwischen zwei benachbarten Punkten zu jeweils der x- und der y-Richtung des kanonischen Bildes erfaßt und diese speichert. Die so erhaltenen Differentialbilder fj» (x-Richtung) und ψ> fy-Richtung) werden an die Betriebsschaltungen 155-2 und 155-3 abgegeben. Die Betriebsschaltung 155-1 empfängt das BezugsbUd fa und führt folgende Rechnung durch:
ll/ol
(33)
Die Betriebsschaltung 1S5-2 empfängt die Differentialbilder fx und fy und führt die folgende Rechnung durch:
(34)
Die Betriebsschaltung 155-3 empfängt die Differentialbilder fx und/,, und führt folgende Rechnung aus:
durchgeführt.
Die Fig. 14(a)—(c) zeigen drei Beispiele von orthogonalen Bildern Φ^Ι <P2 fk>. ... Φ^>. In diesen Figuren bezeichnet ein fester schwarzer Punkt einen positiven Dichtewert, während ein schattierter Punkt einen negativen Dichtewert bezeichnet. Die Größe dieser Punkte gibt die Größe dieser Werte an. Diese drei Bilder befriedigen jeweils die Gleichung (9), und wenn hinsichtlich zweier dieser drei Bilder die Dichtewerte von entsprechenden Punkten multipliziert und summiert werden, so erhält man eine Null. Die drei orthogonalen Bilder, die in den Fig. 14(a)—(c) gezeigt sind, werden vorbereitet, und zwar auf der Grundlage des Bezugsbildes, welches repräsentativ ist für die Me Kategorie, die in F i g. 14(d) gezeigt ist. Der Vorgang der Vorbereitung der Bilder von Fig. 14(a)—(c) aus dem Bild von Fig. 14(d) soll unter Hinweis auf dadurch Fig. 15 erläutert werden. In Fig. 15 wird ein Abtastsignal, welches über die gesamte Fläche des Bildes von Fig. 14(d) gefahren ist, einem Anschluß 151 zugeführt und gelangt dann zu einer Probeentnahmeschaltung 152. Die Probeentnahmeschaltung ist, wie allgemein bekannt, so ausgelegt, daß sie das Eingabebild in ein aus Proben bestehendes Bild umwandelt, welches eine vorher bestimmte Zahl von Probeentnahmepunkten aufweist, und zwar bei diesem Ausführungsbeispiel 16 χ 16 Punkte. Die Ausgangsgröße der Probeentnahmeschaltung 152 gelangt zu einer Schaltung 153, in der der gemittelte Dichtewert des Bildes von dem Dichtewert abgezogen wird, der jedem Punkt des so vorbereiteten Probebildes entspricht. Demzufolge stellt ein Bild, welches aus der Schaltung 153 erhalten wird, ein Bild Z0W dar, welches für eine Abweichung vom gemittelten Dichtewert repräsentativ ist. Die Ausgangsgröße der Schaltung 153 wird einer Differentialschaltung 154 und einer Betriebsschaltung 155-1 eingespeist.
ι 1 Λ Λ
1/2(1-/) \\\fx Il II/,
(35)
In den Gleichungen (34) und (35) ist / wie folgt gegeben:
J =
ll/JIII/,11
(36)
Die Normgrößen || Φι<*·Ί|, ||Φ/*·Ί| und || Φβ)\\ der Bilder ΦιW, Φ2Μ und Φ^> sind alle 1, und ein inneres Produkt zwischen Φ\, Φ2; Φ2, Φ3 und Φ3, Φι sind alle 0, wobei eine orthonormale Beziehung befriedigt wird.
Die so erhaltenen drei orthonormalen Bilder sind in den Fig. 14(a)—(c) gezeigt, und sie werden als Bezugsbilder verwendet
Gemäß Fig.5 werden die Ausgangssignale a\, a2... Sm der das innere Produkt berechnenden Schaltungen einer Anzahl M von Quadrierschaltungen 521, 522, ... 52Λ/zugeführt, in denen
berechnet wird. Die Ausgangssignale Ci, C2,... Cm der Quadrierschaltungen werden einer ersten Summierschaltung 53 zugeführt, um eine Summenausgangsgröße ik zu erzeugen. Das bedeutet, daß die Ausgangsgröße /Jt identisch ist mit:
was der erste Ausdruck auf der linken Seite der Ungleichung (26) ist.
Das Eingabebild / wird gleichzeitig der N-Zahl der das innere Produkt berechnenden Schaltungen 541,542, ... 54N zugeführt, die eine zweite Gruppe darstellen, in der innere-Produkt-Berechnungen zwischen dem Eingabebild /und
durchgeführt werden.
Hier werden die Bezugsbilder ^P1W, !P2W, ...
durch denselben Vorgang erhalten wie im Fall von Φ
Die Ausgangssignale b\, bi, ... ö/v der das innere Produkt berechnenden Schaltungen gelangen zu einer Anzahl N von Quadrierschaltungen 551,552,... 55N, in denen
W Ι
berechnet wird. Die Ausgangssignale d\, dz,... d^ der Quadrierschaltungen werden einer zweiten Summierschaltung 56 zugeführt, um eine Summenausgangsgröße jkzu erzeugen. Das bedeutet, daß die Ausgangsgröße,//: identisch ist mit:
welches den zweiten Ausdruck auf der linken Seite der Ungleichung (26) darstellt
Das Eingabebild /wird gleichzeitig der anderen das innere Produkt berechnenden Schaltung 57 eingespeist bzw. aufgedrückt, in der || /||2 berechnet wird. Da das Eingabebild /als Folge von einer Zahl L von Werten (f\, 4 ... fL) zugeführt wird, beträgt der Recheninhalt von H /Ipgleich:
II/ IF= V /r 2 (27)
r = I
Die detaillierte Schaltungsanordnung zur Durchführung der Berechnung von Gleichung (27) soll im folgenden erläutert werden.
Das Ausgangssignal e der das innere Produkt berechnenden Schaltung 57 wird einer Koeffizient-Multiplizierschaltung 58 zugeführt, in der dieses Signal mit einem Koeffizienten (1 —ε) multipliziert wird.
Die Ausgangsgröße Ik der Koeffizient-Multiplizierschaltung und die Ausgangsgröße jk der zweiten Summierschaltung werden einer weiteren Addierschaltung 59 zugeführt, in welcher eine Berechnung von jk + Ik ausgeführt wird. Die Ausgangsgröße pk der Addierschaltung 59 besteht aus einem Wert, der durch Transponieren des zweiten Ausdrucks der linken Seite der Ungleichung (26) auf die rechte Seite derselben erhalten wird.
Die Ausgangsgröße ik der ersten Summierschaltung 53 und die Ausgangsgröße pk der Addierschaltung 59 gelangen zu einer Vergleichsschaltung 60, in der ein Vergleich zwischen ik und pk vorgenommen wird. Wenn ik > pk befriedigt wird, so erscheint eine Ausgangsgröße qk an der Vergleichsschaltung 60. Dies bedeutet, daß dann, wenn die Ungleichung (26) befriedigt ist, die Ausgangsgröße qk aus der Vergleichsschaltung erscheint. Das Erscheinen der Ausgangsgröße qk zeigt, daß das Eingabebild /zu der Men Kategorie einer Anzahl K von vorbereiteten Kategorien gehört.
F i g. 6 zeigt ein Blockschaltbild einer Schaltung zur Durchführung der Rechnung gemäß der zuvor erwähnten Gleichung (27). Eine Zahl L von Eingangssignalen /j, 4... /r... //. werden den Quadrierschaltungen 601,602, .. .6Or... 6OL jeweils zugeführt. Nachdem ή2, /2 2... /r 2... Fl2 berechnet sind, gelangen die Ausgangsgrößen der Quadrierschaltungen zu einer Summierschaltung 61.
F i g. 7 zeigt ein Blockschaltbild zur Durchführung der Rechnung gemäß der zuvor erwähnten Gleichung (25). Eine Anzahl L von Eingangssignalen f\, /2... 4 werden
einer Muliiplizier-Summier-Schaltung 70 zugeführt, in der eine Multiplizier-Summier-Rechnung elektrisch zwischen fu f> ... 4 und g\, gi ... gu g\, gi ■·· gL durchgeführt wird. gL kann dadurch erhalten werden, indem man das Verhältnis zweier elektrischer Widerstände, die an späterer Stelle beschrieben werden sollen, bestimmt
Fig.8 zeigt eine Schaltungsanordnung eines Beispiels einer Multiplizier-Summier-Schaltung 70. Es werden Spannungen, die zu den Eingangssignalen /1—/r jeweils proportional sind, den Eingangsanschlüssen h—L· der Multiplizier-Summier-Schaltung 70 eingespeist Ein Verhältnis RpIRr eines Rückkopplungswiderstands Rf zu irgendeinem beispielsweise zu Rr der Widerstände R\—Rl wird als ein bekannter Wert gr genommen. Wenn ein Operationsverstärker A so ausgewählt und ausgelegt wird, daß er einen ausreichend hohen Verstärkungsfaktor besitzt, so wird eine Spannung
2j D 2j SrJr
r=I
(28)
als Ausgangsgröße vom Ausgangsanschluß / der Multiplizier-Summier-Schaltung 70 abgeleitet, und zwar basierend auf dem Prinzip einer gut bekannten analogen Multiplizier-Summier-Schaitung. Die Multiplizier-Summier-Schaltung von F i g. 8 kann mit einer Anzahl M von das innere Produkt berechnenden Schaltungen 511,512, ... 51Mverbunden sein (die ersteGruppe) und kann mit einer Zahl N von das innere Produkt berechnenden Schaltungen 541, 542, ... 54N (die zweite Gruppe) verbunden sein, die beide in F i g. 5 gezeigt sind. Dies bedeutet, daß die Werte
l/W", IA2
und
nur als das Verhältnis RrfRr des Widerstandes Rf zum Widerstand Rr umgeschrieben zu werden brauchen. Die in F i g. 8 gezeigte Multiplizier-Summier-Schaltung kann nicht nur als Rechenschaltung für das innere Produkt verwendet werden, sondern auch als Summierschaltung für
Σ/γ
r= I
(vorausgesetzt, daß g\ = gi — ■■■ = gi = 1). Diese Größe kann der ersten und der zweiten Summierschaltung 53 und 56 von Fig.5 zugeführt werden. Es sei angenommen L = 1 und g\ = 1. Dann kann die Multiplizier-Summierschaltung von F i g. 8 ebenso als Schaltung verwendet werden, um eine Ausgangsgröße -/1 zu erhalten, bei welcher das Vorzeichen eines Eingangswertes /1 umgedreht ist.
Fig.9 zeigt eine detaillierte Schaltungsanordnung entsprechend einem Beispiel einer Zahl M von Quadrierschaltungen 521, 522, ... 52M (die erste Gruppe) und eine Anzahl N von Quadrierschaltungen 551,552,... 55N(die zweite Gruppe), wie dies in F i g. 5 gezeigt ist. Bei der Schaltungsanordnung von Fig.9 sind eine Zahl N von Dioden D\ — D„ zwischen einem Paar von Eingangs- und Ausgangsanschlüssen in Reihe geschaltet. Ein Ende der Widerstände R ist mit einem
Verbindungspunkt zwischen benachbarten Dioden verbunden, und das andere Ende ist mit einer Leitung zwischen dem anderen Paar der Eingangs- und Ausgangsanschlüsse verbunden, wobei ein Kompensationswiderstand 2R (mit einem Widerstandswert, der doppelt so groß ist als derjenige der anderen Widerstände) zwischen die Eingangsanschlüsse geschaltet ist Bei der gezeigten Schaltungsanordnung sei eine Eingangsspannung durch E dargestellt; ebenso ein elektrischer Strom durch den Eingangsanschluß, durch / dargestellt; und eine vorwärts vorspannende Spannung jeder Diode durch Ed. Dann läßt sich die folgende Beziehung anstellen:
E = nEd
(29)
Ed
η Ed (η-I)Ed
IR R "■ R
Aus der Gleichung (29) ergibt sich:
2R
H1Ed 2R
(30)
Wenn η aus den Gleichungen (29) und (30) eliminiert wird, dann ergibt sich
(31)
Hieraus läßt sich erkennen, daß der elektrische Strom / proportional zum Quadrat der Eingangsspannung ist. Dies bedeutet eine Annäherung der charakteristischen Kurve der Quadrate mit gebrochenen Linien. Tatsächlich besitzen die Dioden jedoch nicht ideale gebrochene Linien-Eigenschaften, sondern exponentielle Funktionseigenschaften, so daß die Quadrierschaltung einen noch besseren Grad an Annäherung besitzt. Gemäß Fig. 10 läßt sich ein quadrierter Ausgangsspannungswert von — E2 gegenüber einem Eingangsspannungswert von E dadurch erhalten, indem man an die nachfolgende Stufe der Quadrierschaltung 100, die in F i g. 9 gezeigt ist, einen Rückkopplungsverstärker A anordnet, dessen Rückkopplungswiderstand RF so ausgewählt ist, daß er einen Widerstandswert von 2/?£ybesitzt.
F i g. 11 zeigt eine detaillierte Schaltungsanordnung gemäß einem Beispiel der Vergleichsschaltung, die in F i g. 5 gezeigt ist
Die Vergleichsschaltung besteht aus einem bekannten Differentialverstärkerabschnitt 101 und einer bekannten Schmidt-Schaltung 102. Zwischen den Eingangsanschlüssen h und h des Differentialverstärkers 101 wird ein Differenzsignal gewonnen und verstärkt In dem Schmidt-Schaltungsabschnitt 102 erscheint an einem ίο Ausgangsanschluß q, wenn ein Differenzsignal von /ι — h positiv ist, ein Ausgangssignal von »1«, die auf ein positives Potential gesättigt ist. Wenn umgekehrt das Differenzsignal negativ ist so erscheint ein Ausgangssignal von »0« am Ausgangsanschluß q, welches auf einem Null-Potential liegt
In dieser Weise sind die jeweiligen Blöcke von F i g. 5 so ausgeführt, wie dies in den F i g. 8—12 gezeigt ist, und es wird die Berechnung gemäß Gleichung (26) durchgeführt
Die Ausgangsgröße der Gemischtenähnlichkeit-Rechenschaltung 5, d. h. die Ausgangsgröße qk der Vergleichsschaltung 60 wird zusammen mit anderen Ausgangsgrößen qi, q2..., wie dies in F i g. 4 gezeigt ist, der Erkennungsschaltung 6 zugeführt Die Erkennungsschaltung 6 führt nach dem Empfang von irgendeiner der Ausgangsgrößen qi — qfC der Rechen-Vergleichsschaltungen 501 —50K, eine Erkennung hinsichtlich der Kategorie durch, zu welcher diese gehört Die Erkennung kann einfach dadurch ausgeführt werden, indem man die Ausgangsgrößen q\ — qK in kodierter Form darstellt.
Fig. 12 zeigt ein Blockschaltbild einer anderen Ausführungsform der Gemischtenähnlichkeit-Rechenschaltung 5 der Anerkennung zur Bildmustererkennung nach der Erfindung. Bei dieser Ausführungsform von F i g. 5 wird die Erkennung dahingehend durchgeführt, ob die Ungleichung (26) befriedigt werden kann oder nicht Da jedoch offensichtlich ist, daß der Wert, d. h. (1—ε) P der linken Seite der Gleichung (26) keine Bedeutung für k hat, wenn k so gewählt ist, daß der Wert:
15
20
25
30 m = 1
fi = 1
(32)
der linken Seite der Gleichung (26) ein Maximum wird, kann die Erkennung gemacht werden, daß das Eingabebild / zur Men Kategorie gehört. Das Blockschaltbild gemäß Fig. 12 ist auf diesem Konzept basierend aufgebaut.
Dies bedeutet, daß das Eingabebild /einer Schaltung zugeführt wird, um die Berechnung durchzuführen von
n=l
m=\
Σ(
m=1
Σ(
N N iV
f, fc1/·^21)2, . . . Σ(/. )if*nll'nk)?> ···!](/' π = 1 η =
Die Berechnung von
Σ (L
m=l
521— 52M und der Summierschaltung 53 durchgeführt, während die Berechnung von
65 N
wird in den das innere Produkt berechnenden "='
Schaltungen 511— 5\M, den Quadrierschaltungen in den Rechenschaltungen 541—54N, den Quadrier-
schaltungen 551 —55N und der Summierschaltung 56 durchgeführt wird.
Demzufolge können die Ausgangsgrößen il—lK der Rechenschaltungen 1211 —121JC jeweils der Ausgangsgröße ik der Nummierschaltung 53 entsprechen, die in Fi g. 5 gezeigt ist, während die Ausgangsgrößen jil—JK der Rechenschaltungen 1221 — 122K jeweils der Ausgangsgröße.//: entsprechen können.
Aus den Ausgangsgrößen JI—iK und ß—jK können entsprechende Ausgangsgrößen, die die gleiche Nachsilbe haben, den Subtrahierschaltungen 1231, 1232, ... 123Jt, ... 123/C zugeführt werden, in denen eine Differenz zwischen il—ik und ß—jk gebildet wird. Die Ausgangsgrößen P\ fi\ ... /W,... tfK) der Subtrahierschaltungen 1231,1232,... 123Jt.. ■ 123.K werden einer Maximum-Bestimmungsschaltung 124 zugeführt, in welcher ein maximaler Wert t(k> einer Zahl K von Werten bestimmt wird. Die Schaltung 124 erzeugt ein Ausgangssignal /, welches durch Kodierung der Kategorie k entsprechend dem Maximalwert iPO erhalten wird. Eine derartige Maximum bestimmende Schaltung ist bereits bekannt
Wie bereits erläutert wurde, wird ein elektrisches Signal, welches irgendehem abgetasteten Bild oder Bildmuster entspricht, nachdem es vorverarbeitet wurde, einer Identifikationsschaltung zugeführt, in der für jede von .K-Nummern von voreingestellten Nummern, M-Nummern der Bezugsbilder {Φη(χ)ι vorgesehen sind, die eine orthonormale Beziehung befriedigen, und eine Zahl N von Bezugsbildern \Ψβ>(χ}[ vorgesehen sind, deren Komponenten eine orthogonale Beziehung zu dem Bezugsbild aufweisen und die orthogonale Beziehung zueinander bzw. untereinander befriedigen, die in diesen Bildern vorhanden sind, die eine relativ hohe Ähnlichkeit mit der £'ten Kategorie der Anzahl K von Kategorien zeigen und als zu einer unterschiedlichen Kategorie gehörend betrachtet werden. In der Erkennungsschaltung wird die Erkennung durch Berechnung der Gleichung (26) oder (32) zwischen dem hinsichtlich der Kategorie unbekannten Eingabebild und dem einzelnen Bezugsbild durchgeführt. Wies dies aus der Erläuterung in Verbindung mit dem Gemischtenähnlichkeitsverfahren nach dem Prinzip der Erfindung hervorgeht, läßt sich eine weitgehende Unterscheidung zwischen dem Eingabebild und irgendwelchen leicht verwechselbaren Bildern durch die vorliegende Erfindung realisieren, wobei diese Bilder zu einer unterschiedlichen Kategorie gehören und wobei diese Unterscheidung nicht mit Hilfe des bekannten einfachen Ähnlichkeitsverfahrens und mit Hilfe des Vielfachähnlichkeitsverfahrens erreicht werden kann. Gemäß der Erfindung wird somit eine zulässige Unterscheidungsauswertung hinsichtlich der Deformationskomponenten durchgeführt, die für das Bild zulässig sind, welches zur ./C'fen in Betracht gezogenen Kategorie gehört, und es wird eine tiefgreifende Unterscheidungsauswertung hinsichtlich der leicht verwechselbaren Komponenten gemacht, die zu einer unterschiedlichen Kategorie gehören. Daher läßt sich eine Unterscheidung zwischen einer numerischen Figur »0« und einem englischen Buchstaben »O«, einer numerischen Figur »1« und einem englischen Buchstaben »I« usw. mit hoher Genauigkeit durchführen.
Obwohl die Anordnung zur Bildmustererkennung, welche auf dem Gemischtenähnlichkeitsverfahren basiert, unter Verwendung von elektrischen Schaltungen aufgebaut ist, läßt sich die Anordnung auch mit dem gleichen Ergebnis und Wirkung unter Verwendung von
optischen Filterschaltungen realisieren.
Gemäß Fig. 13 wird ein Lichtstrahl, der einem Eingabebild / entspricht, nachdem er durch eine optische Linse 130 fokussiert wurde, unter Verwendung von Halbspiegeln 131a und 1316 aufgeteilt. Bei dem gezeigten Ausführungsbeispie! ist der Fall veranschaulicht, bei dem M = 2 und N = 1 ist Der durch den HaJbspiege! hindurchgelangte Lichtstrahl wird den Bezugsbilderp Φ/*·*, Φ^ν, ^\(k) überlagert und wird durch jeweilige optische Linsen 132a, 1326, 132c auf photoelektrische Wandler 133a, 133/3und 133cgelenkt.
Die Ausgangssignale der photoelektrischen Wandler 133a, 133b und 133c erscheinen am Ausgang, nachdem zwischen jedem der Bezugsbilder Φ\β), <&2<k>, ΪΊ^ und dem Eingabebild f die Berechnung eines inneren Produktes durchgeführt wurde, wobei das Eingabebild beispielsweise den Quadrierschaltungen 521—52Mund 551— 55N von Fig.5 zugeführt werden muß. Die aufeinanderfolgenden Rechnungen werden gemäß F i g. 5 durchgeführt
Wenn demzufolge die Bezugsbilder Φι<k>, Φι^Κ !P1WaIs Drehfilter konstruiert sind, um jeweils Φ,Ο—$,W, Φ2'')—Φ2(Κ>, (P1C)-JP1W abzudecken und wenn die Drehfilter synchron gedreht werden, so wird der gleiche Effekt wie bei der elektrischen Einrichtung der zuvor erläuterten Ausführungsform in diesem Fall erzielt. Gemäß diesem Verfahren ist es nicht erforderlich, eine das innere Produkt berechnende Schaltung vorzusehen, die in der elektrischen Einrichtung dieser Ausfühi ungsform erforderlich ist.
Obwohl sich die vorangegangenen Erläuterungen auf die Erkennung eine's »figürlichen« Musters oder Bildes beschränken, so läßt sich der Gegenstand der vorliegenden Erfindung auch bei der Erkennung eines Klanges verwenden. In diesem Fall wird eine Anzahl K von Bezugsklangmustern oder -bildern einleitend vorgesehen, und es läßt sich eine Erkennung durchführen, zu welcher Kategorie eine Kategorie des unbekannten Klangbildes oder -musters gehört. Dies erfolgt mit hoher Genauigkeit, und zwar auf Grund des Gemischtenähnlichkeitsverfahrens. Dies läßt sich unter Betrachtung der Tatsache einfach verstehen, daß ein kontinuierlich eingespeistes Klang- oder Schallsignal der Gleichung (24) entspricht.
Hierzu H Blatt Zeichnungen

Claims (3)

Patentansprüche:
1. Anordnung zur Erkennung von Bildmustern, in welcher ein Eingabemuster durch Rasterzerlegung in eine Vielzahl von Einzelpunkten unterteilt und mit K ebenfalls zerlegten Bezugsmustern verglichen wird, und zwar in der Weise, daß für jedes der K Bezugsmuster M Standardvariationsmuster erzeugt werden, die untereinander in solcher Beziehung stehen, daß samtliche aus jeweils zwei verschiedenen Standardvariationsmustera gebildeten skalaren Produkte Null sind, daß durch eine erste Multiplikationsvorrichtung aus dem Eingangsmuster einerseits und sämtlichen M Standardvariationsmustern aller K Bezugsmuster andererseits die skalaren Produkte gebildet werden, daß diese skalaren Produkte dann in einer Quadriereinrichtung quadriert werden und daß schließlich in einer ersten Addiervorrichtung für jedes der K Bezugsmuster die Summe aller quadrierten skaiaren Produkte des Eingangsmusters mit den M Standardvariationsmustern gebildet wird, dadurch gekennzeichnet, daß zusätzlich N Standardvariationsmuster eines oder mehrer solcher Bezugsmuster erzeugt werden, die dem ersten Bezugsmuster sehr ähnlich sind, wobei sämtliche skalare Produkte aus den zusätzlichen Standardvariationsmustern untereinander, sowie aus den ersten Standardvariationsmustern und den zusätzlichen Standardvariationsmustern Null ergeben, daß die skalaren Produkte aus dem Eingangsmuster und allen N zusätzlichen Standardvariationsmustern durch eine zweite Multiplikationseinrichtung (541 bis 54N) gebildet werden, daß diese skalaren Produkte in einer zweiten Quadriereinrichtung (551 bis 55N) quadriert werden, daß durch eine zweite Addiervorrichtung (56) für alle K Bezugsmuster die Summe aller quadrierten skalaren Produkte des Eingangsmusters mit den N Standardvariationsmustern gebildet wird, daß die durch die beiden Addiervorrichtungen (53,56) gebildeten Summen in eine Vergleichsschaltung (60) gegeben werden, und daß die Differenzwerte der K Bezugsmuster aller Vergleichsschaltungen (60) in einer Erkennungsschaltung ausgewertet werden.
2. Anordnung zur Erkennung von Bildmustern nach Anspruch 1, dadurch gekennzeichnet, daß die Erkennungsschaltung einen Vergleichskreis enthält, der den Differenzwert mit einem Wert von (1 — e) \\{\\2 vergleicht, wobei \\f\\2 das skalare Produkt des Eingangsmusters darstellt
3. Anordnung zur Erkennung von Bildmustern nach Anspruch 1, dadurch gekennzeichnet, daß die Erkennungsschaltung einen Maximalwert-Detektor (124) aufweist, welcher den Maximalwert aller K Eingangswerte feststellt.
DE2438200A 1973-08-08 1974-08-08 Anordnung zur Erkennung von Bildmustern Expired DE2438200C3 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8853773A JPS5619656B2 (de) 1973-08-08 1973-08-08

Publications (3)

Publication Number Publication Date
DE2438200A1 DE2438200A1 (de) 1975-02-20
DE2438200B2 DE2438200B2 (de) 1980-11-13
DE2438200C3 true DE2438200C3 (de) 1981-10-22

Family

ID=13945577

Family Applications (1)

Application Number Title Priority Date Filing Date
DE2438200A Expired DE2438200C3 (de) 1973-08-08 1974-08-08 Anordnung zur Erkennung von Bildmustern

Country Status (5)

Country Link
US (1) US3906446A (de)
JP (1) JPS5619656B2 (de)
DE (1) DE2438200C3 (de)
FR (1) FR2240485B1 (de)
GB (1) GB1477876A (de)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4153946A (en) * 1977-10-20 1979-05-08 Upton Howard T Expandable selection and memory network
JPS5944667B2 (ja) * 1978-03-28 1984-10-31 株式会社東芝 パタ−ン認識装置
JPS55157799A (en) * 1979-05-29 1980-12-08 Nippon Electric Co High efficiency pattern matching unit
JPS5665291A (en) * 1979-10-31 1981-06-02 Tokyo Shibaura Electric Co Discriminator for printed matter
JPS57178578A (en) * 1981-04-27 1982-11-02 Toshiba Corp Pattern recognition system
JPS58129684A (ja) * 1982-01-29 1983-08-02 Toshiba Corp パタ−ン認識装置
US4543660A (en) * 1982-04-15 1985-09-24 Tokyo Shibaura Denki Kabushiki Kaisha Pattern features extracting apparatus and method
US5297222A (en) * 1982-05-04 1994-03-22 Hitachi, Ltd. Image processing apparatus
DE3481144D1 (de) * 1983-04-11 1990-03-01 Komatsu Mfg Co Ltd Verfahren zum identifizieren von objekten.
JPS6057475A (ja) * 1983-09-07 1985-04-03 Toshiba Corp パタ−ン認識方式
JPH01183793A (ja) * 1988-01-18 1989-07-21 Toshiba Corp 文字認識装置
FR2654541B1 (fr) * 1989-11-15 1994-03-04 Cibiel Jean Yves Procede de reconnaissance de formes, notamment de reconnaissance vocale multilocuteur du langage naturel, et dispositif pour la mise en óoeuvre de ce procede.
US5299284A (en) * 1990-04-09 1994-03-29 Arizona Board Of Regents, Acting On Behalf Of Arizona State University Pattern classification using linear programming
EP0656602B1 (de) * 1993-12-02 2001-07-11 Nippon Telegraph And Telephone Corporation Bildmusteridentifikations/Erkennungsverfahren

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3492646A (en) * 1965-04-26 1970-01-27 Ibm Cross correlation and decision making apparatus
DE1549928A1 (de) * 1967-09-20 1971-05-13 Telefunken Patent Auswerteeinrichtung fuer zeichenlesende Maschinen
JPS4912778B1 (de) * 1969-11-05 1974-03-27
DE2026033C3 (de) * 1970-05-27 1979-05-03 Matth. Hohner Ag, 7218 Trossingen Rasterverfahren zur Klassifizierung von Schriftzeichen
JPS518699B1 (de) * 1970-11-09 1976-03-19

Also Published As

Publication number Publication date
DE2438200A1 (de) 1975-02-20
FR2240485A1 (de) 1975-03-07
DE2438200B2 (de) 1980-11-13
GB1477876A (en) 1977-06-29
FR2240485B1 (de) 1976-12-31
US3906446A (en) 1975-09-16
JPS5039025A (de) 1975-04-10
JPS5619656B2 (de) 1981-05-08

Similar Documents

Publication Publication Date Title
DE2438200C3 (de) Anordnung zur Erkennung von Bildmustern
DE2909153C2 (de) Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern
DE4406020C1 (de) Verfahren zur automatisierten Erkennung von Objekten
DE3633743C2 (de)
EP1316057B1 (de) Auswerten von kantenrichtungsinformation
WO2000010119A1 (de) Verfahren zum erkennen von objekten in digitalisierten abbildungen
DE1771422A1 (de) Geraet fuer die Gewinnung einer Anzeige getrennter Farben
EP0312905A1 (de) Verfahren zur automatischen Zeichenerkennung
DE2054546B2 (de) Anordnung zur Erkennung von Bildmustern
DE1129333B (de) Verfahren und Vorrichtung zum automatischen Erkennen von Kurvenzuegen
DE2247942A1 (de) Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen
DE4324296A1 (de) Fingerabdruck-Abtastvorrichtung für die Identifizierung
DE69925354T2 (de) Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren
EP0780002A1 (de) Verfahren zur rekonstruktion von in rasterform vorliegenden linienstrukturen
DE1774672C3 (de) Einrichtung zur automatischen Zeichenerkennung
DE69631845T2 (de) Musterextrahierungsgerät
DE10313040A1 (de) Messdatenanpassungsverfahren
DE3811396C2 (de)
WO2002023492A2 (de) Verfahren zur klassifizierung von dokumenten
EP0780792B1 (de) Verfahren zur rechnergestützten Bewegungsschätzung für Bildpunkte zeitlich aufeinander folgender Bilder einer Videosequenz
DE1294074B (de) Zeichenerkennungsvorrichtung mit spaltenweiser Abtastung
EP0780793B1 (de) Verfahren zur rechnergestützten Bewegungsschätzung für Bildpunkte zeitlich aufeinanderfolgender Bilder einer Videosequenz
EP0742672A2 (de) Verfahren zur Datenreduktion mittels fraktaler Bildkodierung
WO1998031136A1 (de) Verfahren zur bestimmung der geometriedaten von abtastvorlagen
DE3435331A1 (de) Verfahren und vorrichtung zur verarbeitung von signalreihen, die einen von einem schreibinstrument auf einer schreibunterlage gezogenen strich darstellen

Legal Events

Date Code Title Description
C3 Grant after two publication steps (3rd publication)
8328 Change in the person/name/address of the agent

Free format text: MUENZHUBER, R., DIPL.-PHYS., PAT.-ANW., 8000 MUENCHEN

8327 Change in the person/name/address of the patent owner

Owner name: IIJIMA, TAIZO, TANASHI, TOKIO/TOKYO, JP KABUSHIKI