DE10050062A1 - Anordnung zum Ermitteln der Position eines Objekts in einem Bild und Verfahren zum Trainieren der Anordnung - Google Patents
Anordnung zum Ermitteln der Position eines Objekts in einem Bild und Verfahren zum Trainieren der AnordnungInfo
- Publication number
- DE10050062A1 DE10050062A1 DE10050062A DE10050062A DE10050062A1 DE 10050062 A1 DE10050062 A1 DE 10050062A1 DE 10050062 A DE10050062 A DE 10050062A DE 10050062 A DE10050062 A DE 10050062A DE 10050062 A1 DE10050062 A1 DE 10050062A1
- Authority
- DE
- Germany
- Prior art keywords
- artificial neurons
- neuron
- artificial
- couplings
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
Die Anordnung weist eine Vielzahl künstlicher Neuronen auf, die über gewichtete Kopplungen miteinander sowie mit einem Synchronisationselement gekoppelt sind sowie ein Dämpfungselement, das die Ausgabe von Ausgabewerten einiger Neuronen dämpfen oder unterdrücken kann.
Description
Die Erfindung betrifft eine Anordnung zum Ermitteln der
Position eines Objekts in einem Bild sowie ein Verfahren zum
Trainieren der Anordnung.
Eine solche Anordnung sowie ein solches Trainingsverfahren
sind aus [1] bekannt.
Die in [1] beschriebene Anordnung weist eine Vielzahl von
gepulsten künstlichen Neuronen auf, um die neurale Aktivität
des primären visuellen Kortex zu simulieren, um auf diese
Weise in einem von einer Kamera aufgenommenen Bild,
beispielsweise ein über ein visuelles Feld aufgenommenes
Bild, welches visuelle Feld gebildet wird durch matrixförmig
angeordnete Neuronen, die Position eines Objekts aus einer
Menge vorgegebener Objekte in dem Bild zu ermitteln.
In [1] ist die Anordnung einem Experiment unterzogen worden,
bei dem das Verhalten der gepulsten künstlichen Neuronen
untersucht worden aufgrund einer Anregung durch
Lichtstreifen, die über das von gepulsten künstlichen
Neuronen gebildeten rezeptive Feld als Bilderfassungselement
erfasst worden sind.
In dieser Anordnung zeigte sich gemäß [1] eine Spalten-
Vorzugsrichtung entsprechend der über die gepulsten
künstlichen Neuronen geführten Lichtstreifen.
Weiterhin sind Grundlagen über gepulste künstliche Neuronen,
insbesondere über sogenannte Integrations-Feuer-Neuronen in
[2] beschrieben.
Der Erfindung liegt das Problem zugrunde, eine Anordnung zum
Ermitteln der Position eines Objekts in einem Bild sowie ein
Verfahren zum Trainieren dieser Anordnung mit einer Vielzahl
künstlicher Neuronen anzugeben, welche die Positionserkennung
basierend auf der modellierten visuellen Wahrnehmung eines
Menschen in verbesserter Weise ermöglicht.
Das Problem wird durch die Anordnung zum Ermitteln der
Position eines Objekts in einem Bild sowie durch das
Verfahren zum Trainieren dieser Anordnung mit den Merkmalen
gemäß den unabhängigen Patentansprüchen gelöst.
Mittels einer Anordnung wird die Position eines Objekts in
einem Bild ermittelt, wobei das Objekt mit mindestens einem
Merkmal, üblicherweise mit einer Mehrzahl oder Vielzahl von
Merkmalen beschrieben wird, wobei jedem Merkmal eine
vorgegebene Anzahl von Merkmalswerten zugeordnet sind.
Die Anordnung weist eine Vielzahl künstlicher Neuronen auf,
denen erfasste elektrische Signale, die zumindest einen Teil
des Bildes beschreiben, zuführbar sind.
Die künstlichen Neuronen, die beispielsweise als künstliche
Neuronen, können insbesondere als Integrations-Feuer-Neuronen
ausgestaltet sind, selbst ein rezeptives Feld bilden, mittels
dem über optische Sensoren Helligkeitsinformation
(Luminanzinformation) und Farbinformation
(Chrominanzinformation) erfasst wird.
Alternativ ist es vorgesehen, mittels einer Kamera,
beispielsweise einer analogen Kamera oder einer digitalen
Kamera, Bildsignale aufzuzeichnen, und aus den Bildsignalen
ein digitalisiertes Bild zu ermitteln, welches eine Vielzahl
von Bildpunkten aufweist, denen Helligkeitsinformation
und/oder Farbinformation zugeordnet ist.
Die künstlichen Neuronen sind zumindest teilweise in
Neuronenschichten angeordnet, wobei jeweils eine
Neuronenschicht vorgesehen ist für jeden Merkmalswert eines
jeweiligen Merkmals.
Anschaulich bedeutet dies, dass bei einer Beschreibung eines
Objekts mit K Merkmalen, wobei jedes Merkmal mit einem
Merkmalsindex k (k = 1, . . ., K) eindeutig bezeichnet wird,
L(k) Merkmalswerte vorgesehen sind.
Wird beispielsweise ein Objekt beschrieben mittels des
Merkmals "Farbe des Objekts", so kann ein Merkmalswert L(k)
des Merkmals "Farbe des Objekts" eine beliebige Farbangabe
sein, beispielsweise die Farbangabe "weiß" oder "schwarz".
Dies bedeutet, dass in diesem Falle die Anzahl von
Merkmalswerten des Merkmals "Farbe des Objekts" L(Farbe) = 2,
mit l = 1 als Merkmalswerteindex (l = 1, . . ., L(k)) für die
Farbe "weiß" und l = 2 als Merkmalswerteindex für die Farbe
"schwarz".
In diesem Fall sind zwei Neuronenschichten für das Merkmal
"Farbe des Objekts" vorgesehen, eine Neuronenschicht, die die
Existenz der Farbe "weiß" charakterisiert und eine
Neuronenschicht zur Charakterisierung der Existenz der Farbe
"schwarz" in dem jeweils erfassten Bildbereich.
Jede Neuronenschicht weist eine vorgebbare Anzahl n von
künstlichen Neuronen auf, die vorzugsweise als Integrations-
Feuer-Neuronen ausgestaltet sind.
Die künstlichen Neuronen sind zumindest teilweise über
gewichtete Kopplungen miteinander gekoppelt, so dass von
einem Neuron ausgegebene Signale über die jeweilige Kopplung
mittels der entsprechenden Gewichtung gewichtet dem jeweils
gekoppelten künstlichen Neuron als Eingangssignal zugeführt
wird.
Ferner ist zur Synchronisation der künstlichen Neuronen ein
Synchronisationselement vorgesehen, welches mit den einzelnen
künstlichen Neuronen über erste gewichtete Kopplungen
gekoppelt ist.
Das Synchronisationselement ist derart eingerichtet, dass in
einer Trainingsphase die gewichteten ersten Kopplungen
zwischen dem Synchronisationselement und den künstlichen
Neuronen abhängig von den einzelnen Trainingsergebnissen, das
heißt insbesondere abhängig von den durch die künstlichen
Neuronen durch Anlegen eines Trainingsobjekts erzeugten
Trainings-Ausgangssignale, das heißt eines Trainingsbildes
als Ausgabewerte der einzelnen Neuronen und durch
entsprechenden Vergleich mit den Zielmerkmalswerten des
Zielobjekts verändert werden können.
Ferner ist in der Anordnung ein Dämpfungselement vorgesehen,
welches über zweite Kopplungen, die ebenfalls gewichtbar
sind, mit den künstlichen Neuronen gekoppelt ist.
Mit dem Dämpfungselement kann zumindest bei einem Teil der
künstlichen Neuronen die Ausgabe eines Ausgabewertes, der
zumindest einen Teil des Ermittlungsergebnisses
repräsentiert, gedämpft oder unterdrückt werden.
Gemäß einer Ausgestaltung der Erfindung ist es vorgesehen,
dass in jeder Neuronenschicht jeweils nur die Ausgabe eines
Ausgabewertes von einem künstlichen Neuron der jeweiligen
Neuronenschicht ungedämpft ermöglicht ist und für die
weiteren künstlichen Neuronen eine Dämpfung oder vollständige
Unterdrückung der Ausgabe des Ausgabewertes der jeweiligen
Neuronen vorgesehen ist.
Durch die oben genannte Struktur der Anordnung ist es
möglich, eine den neuesten Forschungsergebnissen der
Modellierung der visuellen Wahrnehmung im menschlichen Gehirn
zu realisieren.
Die Anordnung ist sehr effizient und die Ermittlung eines
Objekts aufgrund der Merkmale, die mittels der Anordnung
erfasst werden, erfolgt sehr schnell.
Damit ist es möglich ist, selbst komplexe Strukturen, das
heißt Objekte mit sehr vielen unterschiedlichen Merkmalen und
in den Merkmalen mit einer sehr großen Anzahl von
unterschiedlichen Merkmalswerten zu berücksichtigen, und
somit auch eine sehr komplexe Wahrnehmung vielseitiger Bilder
mit einer großen Anzahl unterschiedlicher Objekte im Rahmen
- - des "automatischen Sehens" in der Robotik,
- - einer Textanalyse. oder auch
- - der Medizintechnik, beispielsweise bei der automatisierten Auswertung von Bildaufnahmen eines Patienten, beispielsweise im Rahmen der Tumorerkennung,
- - der Auswertung von Elektroenzephalogrammen oder Elektrokardiogrammen,
zu ermöglichen.
Die Anordnung zeichnet sich insbesondere durch ihre sehr
einfache Struktur aus, mit der es dennoch möglich ist, sehr
effizient grundsätzlich eine beliebige Anzahl von Objekten
mit einer beliebigen Anzahl von Merkmalen und Merkmalswerten
zu verarbeiten.
Das Synchronisationselement ist gemäß einer Ausgestaltung der
Erfindung derart eingerichtet, dass es während der
Trainingsphase zumindest einen Teil der gewichteten ersten
Kopplungen, die zu den künstlichen Neuronen führen, deren
Ausgabewerte mit den entsprechenden Zielmerkmalswerten des
Zielobjekts übereinstimmen, einer stärkeren
Gewichtsveränderung in Konvergenz-Richtung zu den
Zielmerkmalswerten durchgeführt als die Gewichtung der
weiteren ersten Kopplungen der restlichen künstlichen
Neuronen, die während der Trainingsphase zu einem
präsentierten Objekt Ausgabewerte liefern, die nicht mit den
Zielmerkmalswerten des Zielobjekts übereinstimmen.
Gemäß einer weiteren Ausgestaltung der Erfindung ist es
vorgesehen, die Gewichtsveränderung und/oder die Gewichte der
ersten Kopplungen der künstlichen Neuronen jeweils in
gleicher Weise zu verändern bzw. auf einen gleichen Wert zu
verändern, wobei bevorzugt betragsmäßig sowohl für die
gewichteten Kopplungen der künstlichen Neuronen mit den mit
den Zielmerkmalswerten übereinstimmenden Ausgabewerten
erzeugenden Neuronen und die weiteren künstlichen Neuronen zu
verändern, wobei jedoch die beiden Arten der zweiten
Kopplungen jeweils mit unterschiedlichen Vorzeichen in ihrer
Gewichtsveränderung bearbeitet werden.
Anders ausgedrückt bedeutet dies, dass die ersten Kopplungen
von den künstlichen Neuronen, deren Ausgabewerte mit den
Zielmerkmalswerten des Zielobjekts übereinstimmen, jeweils
mit einem ersten Gewichtswert gewichtet werden oder um einen
vorgebbaren ersten Gewichtswert verändert werden und die
weiteren zweiten Kopplungen der weiteren künstlichen
Neuronen, deren Ausgabewerte nicht mit den Zielmerkmalswerten
des Zielobjekts übereinstimmen, auf den negativen ersten
Gewichtswert gesetzt werden bzw. um den negativen ersten
Gewichtswert verändert werden.
Gemäß einer weiteren Ausgestaltung der Erfindung ist es
vorgesehen, innerhalb jeder Neuronenschicht eine vollständige
Verknüpfung der jeweils in einer Neuronenschicht vorhandenen
künstlichen Neuronen vorzusehen.
Durch diese vollständige Verknüpfung der künstlichen Neuronen
innerhalb einer Neuronenschicht wird eine weitere
Beschleunigung des Konvergenzverhaltens während der
Trainingsphase erreicht.
Gemäß einer weiteren Ausgestaltung der Erfindung ist es
vorgesehen, die Gewichtsveränderungen und/oder die
Gewichtungen der zweiten Kopplungen während der
Trainingsphase gleich auszugestalten.
Auf diese Weise wird die Anordnung in ihrer Struktur und in
ihrem Konvergenzverhalten weiter vereinfacht bzw.
beschleunigt.
Wie oben angegeben ist gemäß einer weiteren Ausgestaltung der
Erfindung zumindest ein Teil der künstlichen Neuronen als ein
gepulstes künstliches Neuron, vorzugsweise als ein
Integrations-Feuer-Neuron, ausgestaltet.
Unter einem Integrations-Feuer-Neuron ist ein künstliches
Neuron zu verstehen, dessen dynamisches Verhalten als
Oszillator modelliert wird, mit einer Phase Φ, wobei das
Verhalten des Integrations-Feuer-Neurons folgender Vorschrift
genügt:
Wenn der Wert der Phase Φ = 2.π ist, so wird die Phase Φ
auf den Wert Null zurückgesetzt und der Wert wird erneut
gemäß Vorschrift (1) akkumuliert.
Das Zurücksetzen impliziert das Ereignis des Feuerns des
künstlichen Neutrons und bildet anschaulich das
Membranpotential eines menschlichen biologischen Neurons
nach.
Die Amplitude a(t) repräsentiert die intrinsische Aktivität
des Neurons und die externe Stimulierung des jeweiligen
Neurons.
Gemäß einer weiteren Ausgestaltung der Erfindung ist es
vorgesehen, dass zumindest ein Teil der künstlichen Neuron
einer Neuronenschicht jeweils mit einem künstlichen Neuron
zumindest eines Teils der anderen Neuronenschichten gekoppelt
ist.
Es sind in diesem Zusammenhang jeweils künstliche Neuronen
unterschiedlicher Neuronenschichten miteinander gekoppelt,
die sich innerhalb der jeweiligen Neuronenschichten an der
gleichen örtlichen Position, üblicherweise bezeichnet über
Indizes (i als Zahlenindex und j als Spaltenindex zur
eindeutigen Identifizierung des jeweiligen künstlichen
Neurons innerhalb einer Neuronenschicht, in der sie
matrixförmig angeordnet sind) identifiziert werden.
Bei einem Verfahren zum Trainieren der oben genannten
Anordnung zum Ermitteln der Position eines Objekts in einem
Bild werden beispielsweise über ein rezeptives Feld, gebildet
durch künstliche Neuronen, elektrische Signale,
beispielsweise elektrische Sensorsignale, die
Helligkeitsinformation und/oder Farbinformation der erfassten
Umgebung des optischen Sensors repräsentieren, erfasst.
Aufgrund der erfassten Signale werden von den künstlichen
Neuronen Ausgabewerte erzeugt.
Die Ausgabewerte werden mit den vorgegebenen
Zielmerkmalswerten des Zielobjekts, welches dem rezeptiven
Feld der Anordnung zu dessen Erfassung dargestellt wird, und
aufgrund dessen die erfassten Signale erzeugt werden,
verglichen.
Die Gewichte der ersten Kopplungen der künstlichen Neuronen,
die einen Ausgabewert erzeugen, der mit dem Zielmerkmalswert
des Zielobjekts übereinstimmt, werden verändert.
Ein Computerprogramm-Element ist in dem Speicher eines
Prozessors gespeichert und weist, wenn es durch von einem
Prozessor eines Computers ausgeführt wird, die oben genannten
Schritte zum Ermitteln eines Objekts auf.
Die oben beschriebenen Schritte weist ferner ein in einem
computerlesbaren Speichermedium gespeichertes
Computerprogramm auf, wenn es von einem Prozessor eines
Computers ausgeführt wird.
Die Anordnung kann sowohl durch eine spezielle elektronische
Schaltung in Hardware realisiert sein, wobei die einzelnen
künstlichen Neuronen in diesem Fall als einzelne
elektronische Bauelemente realisiert sein können oder
alternativ mittels eines Computerprogramms in Software.
Ein Ausführungsbeispiel der Erfindung ist in den Figuren
dargestellt und wird im Weiteren näher erläutert.
Es zeigen
Fig. 1 ein Blockdiagramm eines Computers, mit dem das
Ausführungsbeispiel der Erfindung realisiert ist;
Fig. 2 ein Blockdiagramm, welches die Struktur der Anordnung
zum Ermitteln eines Objekts gemäß einem
Ausführungsbeispiel der Erfindung darstellt.
Fig. 1 zeigt eine Computer-Anordnung 100, die eine digitale
Kamera 101 aufweist, die eine vorgegebene Szene 102, in der
während einer Trainingsphase mindestens ein Zielobjekt
enthalten ist, aufnimmt.
Die aufgenommenen Bildpunkte, denen Helligkeitsinformation
und/oder Farbinformation zugeordnet ist, werden als
digitalisiertes Bild 103 von der Kamera 101 über ein erstes
Kabel 104 einem Personal Computer 105 über dessen Eingangs-
/Ausgangs-Schnittstelle 106 zugeführt und in dessen Speicher
107, der mit der Eingangs-/Ausgangs-Schnittstelle 106 über
einen Computerbus 108 gekoppelt ist, gespeichert.
Jedes zu ermittelnde Objekt, welches in der Trainingsphase in
seinen Merkmalen zum Trainieren der im Weiteren beschriebenen
Anordnung dient, wird mit einzelnen Merkmalen beschrieben,
wobei jedem Merkmal eine vorgebbare Anzahl von Merkmalswerten
zugeordnet ist.
Das Tupel (Objekt, Merkmal, Merkmalswert) ist jeweils in dem
Speicher 107 des Personal Computers 105 gespeichert.
Ferner ist die Struktur der im Weiteren beschriebenen
Anordnung in einem Computerprogramm-Element 109, welches
ebenfalls in dem Speicher 107 gespeichert ist, enthalten.
Alternativ kann selbstverständlich die im Weiteren
beschriebene und in Fig. 2 dargestellte Struktur der Anordnung
auch in Hardware mittels einer speziellen elektronischen
Schaltung realisiert werden.
Das Computerprogramm-Element 109 wird mittels eines mit dem
Speicher 107 ebenfalls über den Computerbus 108 gekoppelten
Prozessor 110 ausgeführt.
Weiterhin ist der Personal Computer 105
- - über ein zweites Kabel 111, welches ebenfalls mit der Eingangs-/Ausgangs-Schnittstelle 106 gekoppelt ist, mit einem Bildschirm 112 verbunden,
- - über ein drittes Kabel 113 mit einer Tastatur 114, und
- - über ein viertes Kabel 115 mit einer Computermaus 116.
Im Weiteren wird davon ausgegangen, dass, wie in Fig. 2
gezeigt ist, das aufgenommene Bild, beispielsweise mittels
eines rezeptiven Feldes oder der Kamera 101, wie in Fig. 2
mittels des erfassten Bildes 201 symbolisiert ist, der
Anordnung 200 zum Ermitteln eines Objekts in dem Bild 201
eingegeben.
Es wird gemäß diesem Ausführungsbeispiel davon ausgegangen,
dass die einzelnen künstlichen Neuronen zum Erfassen der
einzelnen Bildpunkte als gepulste künstliche Neuronen, gemäß
diesem Ausführungsbeispiel als Integrations-Feuer-Neuronen,
ausgestaltet sind.
Die einzelnen Bildpunkte werden über einen Zeilenindex i und
einen Spaltenindex j jeweils eindeutig identifiziert, wobei
für jeden Bereich ij jeweils mindestens ein künstliches
Neuron vorgesehen ist, wie im Weiteren beschrieben wird.
Die Dimension der Matrix aller Bildpunkte ist bei S
Bildpunkten pro Zeile i und S Bildpunkten pro Spalte j gleich
S × S, das heißt die Anzahl der dargestellten Bildpunkte, das
heißt ebenfalls die Anzahl der erfassten Bildpunkte, ist S2.
Im Weiteren wird zur einfacheren Darstellung der Erfindung
davon ausgegangen, dass jeweils zwei Bildpunkte, das heißt
zwei Bildelemente pro Spalte und zwei Bildelemente pro Zeile
betrachtet werden.
Dies bedeutet, es sind in diesem Fall vier Bildelemente gemäß
diesem Ausführungsbeispiel zu betrachten.
Allgemein ist jedoch zu bemerken, dass eine grundsätzlich
beliebige Anzahl von Bildpunkten pro Zeile und Spalte
berücksichtigt und verarbeitet werden kann, lediglich
begrenzt durch die zur Verfügung stehende Rechenkapazität.
Jedem Bildelement sind zur Beschreibung eines in dem
Bildelement sich befindenden Objekts K Merkmale definiert.
Jedem Merkmal k (k = 1, . . ., K) eines Objekts ist eine
vorgebbare Anzahl L(k) von Merkmalswerten l (l = 1, . . .,
L(k)) zugeordnet.
Gemäß diesem Ausführungsbeispiel ist ein Merkmal "Farbe des
Objekts" definiert, dem die Merkmalswerte "weiß" und
"schwarz" zugeordnet sind.
Anders ausgedrückt bedeutet dies, dass die Anzahl
L(Farbe des Objekts) gleich 2 ist und l = 1 den Merkmalswert
"weiß" des Objekts und l = 2 den Merkmalswert "schwarz" des
Objektes bezeichnet.
Ein zweites Merkmal ist gemäß diesem Ausführungsbeispiel das
Merkmal "Größe des Objekts".
Dem Merkmal "Größe des Objekts" ist eine Anzahl von
L(Größe des Objekts) = 2 Merkmalswerten zugeordnet mit
- - l = 1 für eine Größe des Objekts "groß", und
- - l = 2 für eine Größe des Objekts "klein".
Für jedes Merkmal sind L(k) Neuronenschichten vorgesehen, die
jeweils die Existenz des jeweiligen Merkmalswerts
beschreiben.
Somit sind in der Anordnung 200 zwei Zeilen 202, 203
vorgesehen, eine erste Zeile 202 von Neuronen für das Merkmal
"Farbe des Objekts" und eine zweite Zeile 203 von Neuronen
für das Merkmal "Größe des Objekts".
In einer ersten Neuronenschicht 204 der ersten Zeile 202 ist
der Merkmalswert "weiß" repräsentiert und in einer zweiten
Neuronenschicht 205 der ersten Zeile 202 der Neuronen ist der
Merkmalswert "schwarz" repräsentiert.
In einer ersten Neuronenschicht 206 der zweiten Zeile 203 ist
der Merkmalswert "groß" repräsentiert und in der zweiten
Neuronenschicht 207 der zweiten Teile 203 von künstlichen
Neuronen ist der Merkmalswert "klein" repräsentiert.
Jede Neuronenschicht 204, 205, 206, 207 wird gebildet durch
eine Spalte von N künstlichen Neuronen, die als Integrations-
Feuer-Neuronen ausgestaltet sind.
Im Weiteren wird das Verhalten eines gepulsten künstlichen
Neurons, wie es im Zusammenhang mit diesem
Ausführungsbeispiel angenommen wird, beschrieben.
Die Dynamik jedes künstlichen Neurons wird mittels einer
Phase Φ modelliert, wobei die Dynamik gemäß folgender
Vorschrift beschrieben wird:
wobei mit
- - Φ die Phase, und
- - a(t) die Amplitude des Signals
bezeichnet wird.
Wenn der Wert der Phase Φ = 2.π ist, so wird die Phase Φ
auf den Wert Null zurückgesetzt und der Wert wird erneut
gemäß Vorschrift (1) akkumuliert.
Das Zurücksetzen impliziert das Ereignis des Feuerns des
künstlichen Neutrons und bildet anschaulich das
Membranpotential eines menschlichen biologischen Neurons
nach.
Die Amplitude a(t) repräsentiert die intrinsische Aktivität
des Neurons und die externe Stimulierung des jeweiligen
Neurons.
Sind zwei künstliche Neuronen miteinander gekoppelt, wobei
ein erstes künstliches Neuron die Phase Φ und ein zweites
künstliches Neuron mittels einer zweiten Phase ϕ beschrieben
wird, interagieren miteinander auf folgende Weise:
Wenn das erste künstliche Neuron feuert, so wird die zweite Phase ϕ des zweiten künstlichen Neurons um einen vorgebbaren Wert ε < 0 erhöht mit der Ausnahme, dass für den Fall, dass ϕ(t) + ε den Wert 2 × π übersteigt, der zweiten Phase ϕ der Wert 2.π zugeordnet wird.
Wenn das erste künstliche Neuron feuert, so wird die zweite Phase ϕ des zweiten künstlichen Neurons um einen vorgebbaren Wert ε < 0 erhöht mit der Ausnahme, dass für den Fall, dass ϕ(t) + ε den Wert 2 × π übersteigt, der zweiten Phase ϕ der Wert 2.π zugeordnet wird.
Anders ausgedrückt interagieren die beiden künstlichen
Neuronen gemäß folgender Vorschrift:
Φ(t) = 2.π ⇒ ϕ(t+) = min(2.π, ϕ(t) + ε). (2)
Auf diese Weise wird gewährleistet, dass symmetrisch
gekoppelte Paare von künstlichen Neuronen in einer endlichen
Zeit perfekt synchronisiert werden.
Sind N identische künstliche Neuronen mit einer vollständigen
gegenseitigen Kopplung miteinander gekoppelt gemäß
wie dies in jeweils einer Neuronenschicht 204, 205, 206, 207
mittels der ersten Kopplungen 208, 209, 210, 211 der Fall
ist, so kann ein solches System ebenfalls in einer endlichen
Zeit perfekt synchronisiert werden.
Bei einem solches System, werden die ersten Kopplungen der
künstlichen Neuronen innerhalb einer Neuronenschicht durch
folgende Vorschriften beschrieben:
Φj(tj) = 0, (5)
wobei mit
- - K eine positive Konstante bezeichnet wird, die die Kopplungsstärke repräsentiert, und
- - ηi ein Rauschen bezeichnet wird, mit statistischer gaussianischer Wahrscheinlichkeitsdichteverteilung gemäß folgender Vorschrift:
ηi
(t) = 0, (6)
ηi(t)ηj(t') = σ2.δij.δ(t - t'), (7)
mit σ2 als Standardabweichung, wobei der letzte Term der
Vorschrift (4) die Dichte der Spikes pro künstlichem Neuron
gemäß folgender Vorschrift bezeichnet:
wobei mit t (k)|j ein Wert bezeichnet wird, der die Zeit des k-
ten Feuerns des j-ten künstlichen Neurons beschreibt.
Das Verhalten eines solchen Systems mit einer Vielzahl
vollständig miteinander gekoppelter künstlicher Neuronen kann
wie folgt zusammengefasst werden:
- - Bei einer kleinen Konstante K erfolgt kein gemeinsames Feuern der miteinander verbundenen künstlichen Neuronen;
- - Für den Fall, dass der Quotient K/σ2 groß ist und der Wert a stark genug ist, um ein wiederholtes Feuern der Neuronen zu gewährleisten, so kann man folgendes Verhalten feststellen:
- - Für einen festen Wert a, der groß genug ist,
verhält sich jedes Neuron als ein Oszillator;
ist der Quotient K/σ2 ausreichend klein, so bleibt die gesamte Aktivität der miteinander gekoppelten künstlichen Neuronen konstant;
ist der Quotient K/σ2 ausreichend groß, so beginnen sich die Phasen der künstlichen Neuronen zu synchronisieren; - - Ist die Konstante K sehr viel größer als σ2, das
heißt wenn gilt
K << σ2, (9)
und wenn der Wert a klein ist, so ist die Wahrscheinlichkeit, dass die Phasen der künstlichen Neuronen den Wert 2.π erreichen, gering;
wenn der Wert a größer wird, so beginnen die künstlichen Neuronen damit, synchron zu feuern.
Zusammenfassend ist somit zu bemerken, dass jede
Neuronenschicht eindeutig über die Indizes ijkl
identifizierbar ist.
Innerhalb jeder Neuronenschicht 204, 205, 206, 207 sind die
jeweils N künstlichen Neuronen vollständig miteinander
verknüpft, das heißt jedes künstliche Neuron ist mit jedem
weiteren künstlichen Neuron der gleichen Neuronenschicht 204,
205, 206, 207 gekoppelt.
Die Kopplungen zwischen den künstlichen Neuronen einer
Neuronenschicht 204, 205, 206, 207 werden im Weiteren als
erste Kopplungen 208, 209, 210, 211 bezeichnet, die mit einem
ersten Gewichtungsfaktor K1 gewichtet sind, das heißt jedes
Signal, welches über eine erste Kopplung 208, 209, 210, 211
angelegt ist, wird dem jeweiligen Neuron am Ende der ersten
Kopplung 208, 209, 210, 211 als mit dem Gewichtungsfaktor K1
multipliziert gewichtet zugeführt.
Ein künstliches Neuron in einer Neuronenschicht 204, 205,
206, 207 an der Position ij ist ferner über eine zweite
Kopplung 212 jeweils gekoppelt mit einem künstlichen Neuron
jeder anderen Neuronenschicht 204, 205, 206, 207, welches
sich an der gleichen örtlichen Position, beschrieben durch
den Spaltenindex j und den Zeilenindex i, das heißt in einer
Neuronenschicht k' ≠ k, gekoppelt.
Die Gewichtung der zweiten Kopplungen 212 erfolgt mittels
eines zweiten Gewichtungsfaktors K2.
Ferner ist ein Synchronisationselement 213, das im Weiteren
auch als zentraler Oszillator bezeichnet wird, enthalten, mit
dem Zielmerkmalswerte des Zielobjekts, das heißt eines
Objekts, welches in einer Trainingsphase der Anordnung 200
präsentiert wird und dessen Merkmale bekannt sind und in dem
Speicher 107 des Personal Computers 105 gespeichert sind,
codiert werden.
Um die Anordnung 200 zu trainieren wird mittels des
Synchronisationselements 213 eine Veränderung von dritten
Gewichtsfaktoren K3, die dritte Kopplungen 214, 215, 216,
217, die eine Kopplung des Synchronisationselements 213 mit
den jeweiligen künstlichen Neuronen bezeichnen verändert.
Die Veränderung erfolgt derart, dass alle künstlichen
Neuronen, die einen Ausgabewert erzeugen, aufgrund des
Zuführens der extrahierten Merkmale aus den erfassen
Bildsignalen mit den jeweiligen Zielmerkmalswert des
Zielobjekts übereinstimmt, eine dritte Kopplung Kattkl auf
den Wert K3 gesetzt werden und die restlichen künstlichen
Neuronen, deren Ausgabewerte nicht dem Zielmerkmalswert
entsprechen, das heißt diejenigen künstlichen Neuronen, für
die gilt l' ≠ l, werden über die dritten Kopplungen mit einem
Gewichtungsfaktor Kattkl' = -K '|3 mit dem
Synchronisationselement 213 gekoppelt.
Weiterhin ist ein Dämpfungselement 218 mit den künstlichen
Neuronen über vierte Kopplungen 219, 220, 221, 222 gekoppelt,
denen jeweils ein vierter Gewichtungsfaktor K4 zugeordnet
ist.
Der vierte Gewichtungsfaktor K4 stellt anschaulich einen
negativen Gewichtungsfaktor dar, um die Aktivität der
jeweiligen gepulsten Neuronen, die mit den entsprechenden
vierten Gewichtungsfaktoren als externe Stimulierung
stimuliert werden, zu dämpfen oder sogar vollständig zu
unterdrücken, so dass mit einer geringeren Wahrscheinlichkeit
ein Ausgabewert überhaupt erzeugt wird, das heißt
anschaulich, dass das künstliche Neuron mit einer geringeren
Wahrscheinlichkeit feuert.
Unter der Annahme, dass eine sogenannte selektive
Aufmerksamkeit aus einem unabhängigen Wettbewerbsmechanismus
entlang der einzelnen Merkmalsdimensionen resultiert, ist
jedes künstliche Neuron über das Dämpfungselement 218 mit dem
negativen Gewichtungsfaktor K4 mit den weiteren künstlichen
Neuronen gekoppelt, die zu der gleichen Neuronenschicht k
gehören.
Anschaulich bedeutet dies, dass aufgrund der vierten Kopplung
219, 220, 221, 222 jeweils gewährleistet wird, dass in einer
Neuronenschicht jeweils nur ein Neuron mit erheblicher
Wahrscheinlichkeit feuert und die Aktivität der weiteren
künstlichen Neuronen der gleichen Neuronenschicht gedämpft
bzw. vollständig unterdrückt wird.
Die oben beschriebene Anordnung 200 wird gemäß folgender
Vorschrift in ihrem Verhalten mittels einer
Differentialgleichung beschrieben:
mit
i, j = 1, . . ., S,
k = 1, . . ., K,
l = 1, . . ., L,
n = 1, . . ., N,
wobei mit
i, j = 1, . . ., S,
k = 1, . . ., K,
l = 1, . . ., L,
n = 1, . . ., N,
wobei mit
- - Aijkln die externe visuelle Eingabe bezeichnet wird, die mittels beispielsweise eines optischen Sensors gemäß dem Ausführungsbeispiel der digitalen Kamera, erfasst wird, die gegeben ist durch einen konstanten Wert ≠ 0, mit dem angegeben wird, dass der Merkmalswert l des Merkmals k an der örtlichen Position, bezeichnet durch die Indizes ij, vorhanden ist und den Wert 0 aufweist, wenn der entsprechende Merkmalswert l des Merkmals k an der Position ij nicht vorhanden ist, und
- - J1 ijkl(t) und jOC die Wahrscheinlichkeitsdichten des Feuerns der künstlichen Neuronen entsprechend einer jeweiligen Neuronenschicht und dem Synchronisationselement gemäß Vorschrift (8) bezeichnet wird.
Die weiteren Wahrscheinlichkeitsdichten sind gegeben durch
folgende Vorschriften:
Die Dynamik des Systems wird durch das
Synchronisationselement 213 gesteuert gemäß folgender
Vorschrift:
mit
n = 1, . . ., N,
wobei mit KOC der Gewichtsfaktor der Kopplung der jeweiligen künstlichen Neuronen einer Neuronenschicht mit dem Synchronisationselement 213 bezeichnet wird.
n = 1, . . ., N,
wobei mit KOC der Gewichtsfaktor der Kopplung der jeweiligen künstlichen Neuronen einer Neuronenschicht mit dem Synchronisationselement 213 bezeichnet wird.
Die Größe J3(t) ergibt sich gemäß folgender Vorschrift:
wobei mit dem Index l der jeweilige Merkmalswert l bezeichnet
wird.
Die Differentialgleichungen gemäß Vorschrift (13) für die n
künstlichen Neuronen werden gelöst und für jede
Neuronenschicht 204, 205, 206, 27 wird deren Aktivierung, die
auch als Ausgabewert der künstlichen Neuronen bezeichnet
wird, berechnet durch Bilden der Summe der entsprechenden
erzeugten Spikes.
Es ist in diesem Zusammenhang anzumerken, dass nur von den
Neuronenschichten 204, 205, 206, 207 eine Aktivität ≠ 0
aufweisen, die entsprechend der trainierten Gewichtung der
einzelnen Kopplungen zwischen den künstlichen Neuronen ein
trainiertes Merkmal bzw. einen trainierten und somit
gespeicherten Merkmalswert erfassen.
Aufgrund der zweiten Kopplungen zwischen den künstlichen
Neuronen unterschiedlicher Neuronenschichten 204, 205, 206,
207, die die gleiche örtliche Position innerhalb des Bildes
201 repräsentieren, jedoch unterschiedliche Merkmale bzw.
Merkmalswerte charakterisieren, wird bei entsprechender
Übereinstimmung, das heißt bei Feuern von Neuronen andere
Neuronenschichten 204, 205, 206, 207 über die zweiten
Kopplungen die Aktivierung der jeweils betrachteten
künstlichen Neuronen weiter erhöht.
Die Neuronenschichten 204, 205, 206, 207 sind, wie oben
beschrieben, mittels dritter Kopplungen 214, 215, 216, 217
mit dem Synchronisationselement 213 gekoppelt, gewichtet mit
dem dritten Gewichtungsfaktor K3, wenn der entsprechende
Merkmalswert mit dem Zielmerkmalswert übereinstimmt und mit
dem negativen dritten Gewichtungsfaktor -K3, wenn dies nicht
der Fall ist, empfangen weiterhin eine Signalverstärkung,
multipliziert mit dem dritten Kopplungsfaktor K3 von dem
Synchronisationselement 213, wobei anzumerken ist, dass die
einzige Neuronenschicht 204, 205, 206, 207 eine solche
Signalverstärkung erfährt, diejenige ist, die den gesuchten
Merkmalswert repräsentiert.
Der angenommene Wettbewerbsmechanismus zwischen den einzelnen
Merkmalsdimensionen ist in der Anordnung gemäß dem
Ausführungsbeispiel dadurch implementiert, dass ein negativer
dritter Gewichtungsfaktor -K3 für die dritten Kopplungen 214,
215, 216, 217 vorgesehen ist.
Ferner ist das Dämpfungselement 218 insbesondere dafür
vorgesehen, dass jeweils die Neuronenaktivität der die
jeweils anderen Merkmalswerte eines Merkmals
repräsentierenden Neuronen gedämpft oder sogar vollständig
unterdrückt wird.
Diejenigen Neuronenschichten 204, 205, 206, 207, die mit dem
Synchronisationselement 213 synchronisiert sind, bestimmen
den sogenannten Aufmerksamkeitsbereich innerhalb des Bildes
201.
Anschaulich bestimmen die einzelnen Gewichtungsfaktoren der
Kopplungen zwischen den künstlichen Neuronen die Parameter,
die die Steuerung, das heißt sowohl die Größe als auch den
tatsächlichen örtlichen Bereich des Aufmerksamkeitsbereichs
innerhalb des Bildes 201.
Diejenigen künstlichen Neuronen, die den entsprechenden
Bereich innerhalb des Bildes 201 bezeichnen, in dem das
gesuchte Objekt innerhalb des Bildes enthalten ist, wird
durch die entsprechenden Aktivität, die von den künstlichen
Neuronen der entsprechenden Neuronenschicht erzeugt werden,
angegeben.
Während der Anwendungsphase wird der jeweilige Ausgabewert
einer Auswerteeinheit 223 zugeführt und die
Koordinatenangabe, das heißt die Bereichsangabe 224
(Position) des Bereichs, in dem sich das gesuchte Objekt
innerhalb des Bildes 201 befindet, wird mittels einer
Bereichsangabe 220 von der Auswerteeinheit ausgegeben,
beispielsweise auf dem Bildschirm 112 des Personal Computers
105.
In diesem Dokument sind folgende Veröffentlichungen zitiert:
[1] T. Chawanya et al., A Model for Feature Linking via Collective Oscillations in the Primary Visual Cortex, Biological Cybernetics, Vol. 68, S. 483-490, 1993
[2] Y. Kuramoto, Collective Synchronization of Pulse-Coupled Oscillators and Excitable Units, Physica D, Vol. 50, S. 15-30, 1991
[1] T. Chawanya et al., A Model for Feature Linking via Collective Oscillations in the Primary Visual Cortex, Biological Cybernetics, Vol. 68, S. 483-490, 1993
[2] Y. Kuramoto, Collective Synchronization of Pulse-Coupled Oscillators and Excitable Units, Physica D, Vol. 50, S. 15-30, 1991
Claims (13)
1. Anordnung zum Ermitteln der Position eines Objekts in
einem Bild, wobei das Objekt mit mindestens einem Merkmal
beschrieben wird, welchem Merkmal vorgegebene Merkmalswerte
zugeordnet sind,
mit einer Vielzahl künstlicher Neuronen, denen erfasste Signale, die zumindest einen Teil des Bildes beschreiben, zuführbar sind,
wobei die künstlichen Neuronen zumindest teilweise in Neuronenschichten angeordnet sind, wobei jeweils eine Neuronenschicht vorgesehen ist für jeden Merkmalswert des Merkmals,
wobei die künstlichen Neuronen zumindest teilweise über gewichtete Kopplungen miteinander gekoppelt sind,
mit einem Synchronisationselement, welches in einer Trainingsphase zumindest einen Teil gewichteter erster Kopplungen mit den künstlichen Neuronen abhängig von einem aus dem Bild erfassten Merkmalswert und einem Zielmerkmalswert eines Zielobjekts verändern kann, und
mit einem mit den künstlichen Neuronen über gewichtete zweite Kopplungen gekoppelten Dämpfungselement, das die Ausgabe eines Ausgabewerts, der zumindest einen Teil des Ermittlungsergebnisses repräsentiert, jeweils nur eines Teils von künstlichen Neuronen ermöglicht und die Ausgabe eines Ausgabewerts aller weiteren künstlichen Neuronen der jeweiligen Neuronenschicht dämpft oder unterdrückt.
mit einer Vielzahl künstlicher Neuronen, denen erfasste Signale, die zumindest einen Teil des Bildes beschreiben, zuführbar sind,
wobei die künstlichen Neuronen zumindest teilweise in Neuronenschichten angeordnet sind, wobei jeweils eine Neuronenschicht vorgesehen ist für jeden Merkmalswert des Merkmals,
wobei die künstlichen Neuronen zumindest teilweise über gewichtete Kopplungen miteinander gekoppelt sind,
mit einem Synchronisationselement, welches in einer Trainingsphase zumindest einen Teil gewichteter erster Kopplungen mit den künstlichen Neuronen abhängig von einem aus dem Bild erfassten Merkmalswert und einem Zielmerkmalswert eines Zielobjekts verändern kann, und
mit einem mit den künstlichen Neuronen über gewichtete zweite Kopplungen gekoppelten Dämpfungselement, das die Ausgabe eines Ausgabewerts, der zumindest einen Teil des Ermittlungsergebnisses repräsentiert, jeweils nur eines Teils von künstlichen Neuronen ermöglicht und die Ausgabe eines Ausgabewerts aller weiteren künstlichen Neuronen der jeweiligen Neuronenschicht dämpft oder unterdrückt.
2. Anordnung nach Anspruch 1,
bei der das Dämpfungselement derart eingerichtet ist, dass es
die Ausgabe eines Ausgabewerts nur von einem künstlichen
Neuron einer Neuronenschicht ermöglicht und die Ausgabe eines
Ausgabewerts aller weiteren künstlichen Neuronen der
jeweiligen Neuronenschicht dämpft oder unterdrückt.
3. Anordnung nach Anspruch 1 oder 2,
bei der in jeder Neuronenschicht pro Merkmalswert eines
Merkmals eine Vielzahl künstlichen Neuronen vorgesehen ist.
4. Anordnung nach einem der Ansprüche 1 bis 3,
bei der das Synchronisationselement derart eingerichtet ist,
dass es in der Trainingsphase zumindest einen Teil der
gewichteten ersten Kopplungen abhängig von einem aus dem Bild
erfassten Merkmalswert und einem Zielmerkmalswert eines
Zielobjekts verändern kann derart, dass diese Veränderung
stärker ist als die Gewichtsveränderung der weiteren ersten
Kopplungen.
5. Anordnung nach Anspruch 4,
bei dem die Gewichtsveränderung und/oder die Gewichte der
ersten Kopplungen der künstlichen Neuronen, die einen
Trainings-Ausgabewert erzeugen, die mit dem Zielmerkmalswert
übereinstimmen, im wesentlichen gleich ist/sind.
6. Anordnung nach Anspruch 5,
bei dem die Gewichtsveränderung und/oder die Gewichte der
ersten Kopplungen der weiteren künstlichen Neuronen den
gleichen Betrag wie die Gewichtsveränderung und/oder die
Gewichte der ersten Kopplungen der künstlichen Neuronen, die
einen Trainings-Ausgabewert erzeugen, die mit dem
Zielmerkmalswert übereinstimmen, aufweisen, jedoch mit
umgekehrten Vorzeichen.
7. Anordnung nach einem der Ansprüche 1 bis 6,
bei dem innerhalb einer Neuronenschicht jedes künstliche
Neuronen mit jedem weiteren künstlichen Neuron derselben
Neuronenschicht über gewichtete zweite Kopplungen gekoppelt
ist.
8. Anordnung nach Anspruch 7,
bei dem die Gewichtsveränderungen und/oder die Gewichtungen
der zweiten Kopplungen gleich sind.
9. Anordnung nach einem der Ansprüche 1 bis 8,
bei der zumindest ein Teil der künstlichen Neuronen jeweils
als ein gepulstes künstliches Neuron ausgestaltet ist.
10. Anordnung nach Anspruch 9,
bei der alle künstlichen Neuronen als gepulste künstliche
Neuronen ausgestaltet sind.
11. Anordnung nach Anspruch 9 oder 10,
bei der die gepulsten künstlichen Neuronen künstliche
Integrations-Feuer-Neuronen sind.
12. Anordnung nach einem der Ansprüche 1 bis 11,
bei der zumindest ein Teil der künstlichen Neuronen einer
Neuronenschicht jeweils mit einem künstlichen Neuron
zumindest eines Teils der anderen Neuronenschichten gekoppelt
ist, das sich innerhalb der beiden jeweiligen
Neuronenschichten an der gleichen örtlichen Position
befindet.
13. Verfahren zum Trainieren einer Anordnung zum Ermitteln
der Position eines Objekts in einem Bild, wobei das Objekt
mit mindestens einem Merkmal beschrieben wird, welchem
Merkmal vorgegebene Merkmalswerte zugeordnet sind, wobei die
Anordnung aufweist:
eine Vielzahl künstlicher Neuronen, denen erfasste Signale, die zumindest ein Teil des Bildes beschreiben, zuführbar sind,
wobei die künstlichen Neuronen zumindest teilweise in Neuronenschichten angeordnet sind, wobei jeweils eine Neuronenschicht vorgesehen ist für jeden Merkmalswert des Merkmals,
wobei die künstlichen Neuronen zumindest, teilweise über gewichtete Kopplungen miteinander gekoppelt sind,
ein Synchronisationselement, welches in einer Trainingsphase zumindest einen Teil gewichteter erster Kopplungen mit den künstlichen Neuronen abhängig von einem aus dem Bild erfassten Merkmalswert und einem Zielmerkmalswert eines Zielobjekts verändern kann, und
ein mit den künstlichen Neuronen über gewichtete zweite Kopplungen gekoppeltes Dämpfungselement, das die Ausgabe eines Ausgabewerts, der zumindest einen Teil des Ermittlungsergebnisses repräsentiert, jeweils nur eines Teils von künstlichen Neuronen ermöglicht und die Ausgabe eines Ausgabewerts aller weiteren künstlichen Neuronen der jeweiligen Neuronenschicht dämpft oder unterdrückt,
wobei das Verfahren folgende Schritte aufweist:
eine Vielzahl künstlicher Neuronen, denen erfasste Signale, die zumindest ein Teil des Bildes beschreiben, zuführbar sind,
wobei die künstlichen Neuronen zumindest teilweise in Neuronenschichten angeordnet sind, wobei jeweils eine Neuronenschicht vorgesehen ist für jeden Merkmalswert des Merkmals,
wobei die künstlichen Neuronen zumindest, teilweise über gewichtete Kopplungen miteinander gekoppelt sind,
ein Synchronisationselement, welches in einer Trainingsphase zumindest einen Teil gewichteter erster Kopplungen mit den künstlichen Neuronen abhängig von einem aus dem Bild erfassten Merkmalswert und einem Zielmerkmalswert eines Zielobjekts verändern kann, und
ein mit den künstlichen Neuronen über gewichtete zweite Kopplungen gekoppeltes Dämpfungselement, das die Ausgabe eines Ausgabewerts, der zumindest einen Teil des Ermittlungsergebnisses repräsentiert, jeweils nur eines Teils von künstlichen Neuronen ermöglicht und die Ausgabe eines Ausgabewerts aller weiteren künstlichen Neuronen der jeweiligen Neuronenschicht dämpft oder unterdrückt,
wobei das Verfahren folgende Schritte aufweist:
- - aufgrund der erfassten Signale von den künstlichen Neuronen werden Ausgabewerte erzeugt,
- - die Ausgabewerte werden mit dem vorgegebenen Zielmerkmalswert des Zielobjekts verglichen,
- - die Gewichte der ersten Kopplungen der künstlichen Neuronen, die einen Ausgabewert erzeugen, der mit dem Zielmerkmalswert des Zielobjekts übereinstimmt, werden verändert.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10050062A DE10050062A1 (de) | 2000-10-10 | 2000-10-10 | Anordnung zum Ermitteln der Position eines Objekts in einem Bild und Verfahren zum Trainieren der Anordnung |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10050062A DE10050062A1 (de) | 2000-10-10 | 2000-10-10 | Anordnung zum Ermitteln der Position eines Objekts in einem Bild und Verfahren zum Trainieren der Anordnung |
Publications (1)
Publication Number | Publication Date |
---|---|
DE10050062A1 true DE10050062A1 (de) | 2002-05-02 |
Family
ID=7659220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10050062A Withdrawn DE10050062A1 (de) | 2000-10-10 | 2000-10-10 | Anordnung zum Ermitteln der Position eines Objekts in einem Bild und Verfahren zum Trainieren der Anordnung |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE10050062A1 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10209082A1 (de) * | 2002-03-01 | 2003-09-18 | Infineon Technologies Ag | Bildsegmentierungs-Einrichtung und Verfahren zum Segmentieren eines Bildes mit einer Vielzahl von Bildpunkten |
-
2000
- 2000-10-10 DE DE10050062A patent/DE10050062A1/de not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10209082A1 (de) * | 2002-03-01 | 2003-09-18 | Infineon Technologies Ag | Bildsegmentierungs-Einrichtung und Verfahren zum Segmentieren eines Bildes mit einer Vielzahl von Bildpunkten |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE68926680T2 (de) | Durch sinnesfunktion gesteuerter regler | |
DE3688178T2 (de) | Verfahren zur Bildextraktion eines sich bewegenden Objekts. | |
DE112018002822T5 (de) | Klassifizieren neuronaler netze | |
DE102019100575A1 (de) | Verfahren und system zum erzeugen eines bereichsbildes unter verwendung von daten mit geringer tiefe | |
DE3938645C1 (de) | ||
DE102019209644A1 (de) | Verfahren zum Trainieren eines neuronalen Netzes | |
EP3977430A1 (de) | Verfahren und vorrichtung zur detektion von rauch | |
WO2021185507A1 (de) | Anonymisierungseinrichtung, überwachungsvorrichtung, verfahren, computerprogramm und speichermedium | |
DE102021201777A1 (de) | Verfahren zur Verhaltenserkennung, Vorrichtung zur Verhaltenserkennung und computerlesbares Aufzeichnungsmedium | |
DE112017007247B4 (de) | Bildverarbeitungsvorrichtung | |
DE4121453C2 (de) | Näherungsschlußfolgerungsvorrichtung | |
DE3511697C2 (de) | ||
DE19611732C1 (de) | Verfahren zur Ermittlung von zur Entfernung geeigneten Gewichten eines neuronalen Netzes mit Hilfe eines Rechners | |
DE10050062A1 (de) | Anordnung zum Ermitteln der Position eines Objekts in einem Bild und Verfahren zum Trainieren der Anordnung | |
EP1145086B1 (de) | Verfahren und anordnung zur ermittlung eines ähnlichkeitsmasses einer ersten struktur mit mindestens einer vorgegebenen zweiten struktur | |
DE10234085A1 (de) | Verfahren zur Analyse von Farbabweichungen von Bildern mit einem Bildsensor | |
EP0978052B1 (de) | Rechnergestütztes verfahren zur auswahl von trainingsdaten für ein neuronales netz | |
EP3518180B1 (de) | Verfahren zur erstellung einer bildstapel-datenstruktur | |
EP3830754B1 (de) | Verfahren und vorrichtung zum ermitteln einer erklärungskarte | |
DE10048308B4 (de) | Verfahren und Vorrichtung zum Klassifizieren von Objekten aus als Pixelmuster vorliegenden eingangsseitigen Bilddaten | |
EP1359539A2 (de) | Neurodynamisches Modell der Verarbeitung visueller Informationen | |
DE19652925A1 (de) | Verfahren und Vorrichtung zur orts- und größenunabhängigen Erfassung von Merkmalen aus einem Bild | |
DE102019218448A1 (de) | Testen von Kombinationen aus Software und Hardware | |
EP1114398B1 (de) | Verfahren zum trainieren eines neuronalen netzes, verfahren zur klassifikation einer folge von eingangsgrössen unter verwendung eines neuronalen netzes, neuronales netz und anordnung zum trainieren eines neuronalen netzes | |
WO2004003782A1 (de) | Verfahren zur erstellung von daten, die für die beurteilung kognitiver oder sensomotorischer leistungsfähigkeiten oder leistungen von testpersonen verwendbar sind |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8139 | Disposal/non-payment of the annual fee |