DE69326522T2 - Bewegungsvektornachweisgerät - Google Patents
BewegungsvektornachweisgerätInfo
- Publication number
- DE69326522T2 DE69326522T2 DE69326522T DE69326522T DE69326522T2 DE 69326522 T2 DE69326522 T2 DE 69326522T2 DE 69326522 T DE69326522 T DE 69326522T DE 69326522 T DE69326522 T DE 69326522T DE 69326522 T2 DE69326522 T2 DE 69326522T2
- Authority
- DE
- Germany
- Prior art keywords
- vector
- data
- memory
- differentiating
- sampling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 title claims description 109
- 238000001514 detection method Methods 0.000 title 1
- 230000015654 memory Effects 0.000 claims description 51
- 238000005070 sampling Methods 0.000 claims description 40
- 230000004069 differentiation Effects 0.000 claims description 21
- 230000002123 temporal effect Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 description 15
- 238000007476 Maximum Likelihood Methods 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000000034 method Methods 0.000 description 6
- 238000009499 grossing Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/269—Analysis of motion using gradient-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/277—Analysis of motion involving stochastic approaches, e.g. using Kalman filters
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
- Picture Signal Circuits (AREA)
- Television Systems (AREA)
Description
- Die vorliegende Erfindung betrifft eine Bewegungsvektorbestimmungsvorrichtung zur Bildcodierung, Rauschverringerung, Gegenstandsverfolgung, usw.
- Eine Technik der Bewegungsvektorbestimmung auf der Grundlage eines Zeit-Raum- Differenzierverfahrens ist bereits bspw. als das Horn-Verfahren vorgeschlagen worden (Horn, B. K. P. und B. G. Shunk: "Determining optical flow", Artifical Intelligence, Bd. 17, S. 185-203, 1981). Bei diesem Verfahren wird von der Helligkeit eines Punktes (x, y) in dem Bild zur Zeit t angenommen, daß sie I(x, y, t) ist, und von einem Gegenstand wird angenommen, daß er sich um Δx auf der x-Achse und um Δy auf der y-Achse während der infinitesimalen Zeit Δt bewegt. Nimmt man an, daß die Helligkeit des gleichen Punkts auf dem Gegenstand konstant ist, ergibt sich die Formel (1).
- I(x, y, t) = I(x + Δx, Y + Δy, t + Δt) (1)
- Durch Entwicklung durch eine Taylor-Reihe der rechten Seite der Formel (1) werden Glieder höherer Ordnung unberücksichtigt gelassen, und, wenn man das Extrem Δt = 0 betrachtet, wird durch Dividieren Δt die Formel (2) gebildet.
- worin u = dΔx/dt, v = dΔy/dt. Nimmt man an, daß (u, v) ein Geschwindigkeitsvektor ist, wird dies durch eine Zeit-Raum-Differenzierung eine Nebenbedingungsgleichung. In dieser Nebenbedingungsgleichung kann eine Gerade, auf der der Bewegungsvektor (u, v) liegt, aus der Zeit-Raum-Differenzierung der Luminanz bestimmt werden kann, wobei aber eine gewisse Bedingung benötigt wird, (u, v) zu bestimmen. Horn wendete unter der Annahme, daß sich (u, v) stetig in dem Bild ändert, eine neue Bedingung an, und bestimmte den Bewegungsvektor. Als Stand der Technik dieser Bewegungsvektorbestimmungsvorrichtung ist ihre schematische Zeichnung in Fig. 1 gezeigt. In Fig. 1 ist das Bezugszeichen 301 ein Analog/Digitalwandler, sind 302, 303 Bildspeicher, ist 304 ein Differenzierfilter für die horizontale Richtung, ist 305 ein Differenzierfilter für die vertikale Richtung, ist 306 ein Differenzierfilter für die Zeitrichtung, ist 307 ein Differenzierbildspeicher für die horizontale Richtung, ist 308 ein Differenzierbildspeicher für die vertikale Richtung, ist 309 ein Differenzierbildspeicher für die Zeitrichtung, ist 310 ein Bewegungsspeicher für die horizontale Richtung, ist 311 ein Bewegungsabschätzteil für die horizontale Richtung, ist 312 ein Bewegungsabschätzteil für die vertikale Richtung, ist 313 ein Bewegungsspeicher für die vertikale Richtung und sind 314, 315 Glättungsfilter.
- Das über den Analog/Digitalwandler eingegebene Bild wird um 1 Bildzeit in dem Bildspeicher 302 verzögert und geht sequentiell durch den Bildspeicher 303 hindurch.
- Das Differenzierfilter 304 für die horizontale Richtung, das Differenzierfilter 305 für die vertikale Richtung und das Differenzierfilter 306 für die Zeitrichtung berechnen die Zeit- Raum-Differenzierung (δl/δx, δl/δy, δl/δt) der Formel (2), die zur Abschätzung des Bewegungsvektors in jedem Pixel notwendig ist.
- Die Berechnungsergebnisse werden jeweils in dem Differenzierbildspeicher 307 für die horizontale Richtung, dem Differenzierbildspeicher 308 für die vertikale Richtung und den Differenzierbildspeicher 309 für die Zeitrichtung aufgezeichnet.
- Da das Bild abgetastet wird, wird die Differenzierberechnung durch Berechnung mit einem Differenzverfahren ersetzt.
- Horn bestimmte unter der Annahme, daß sich (u, v) stetig in dem Bild ändert, den Bewegungsvektor durch eine Minimierungsformel (3).
- E = α²((u, v) - ( , ))² +(uIx + vIy + It)² dxdy (3)
- Nachfolgend wird der Einfachheit halber (δl/δx, δl/δy, δl/δt) ausgedrückt als (Ix, Iy, It). Die Minimierung der Formel (3) kann durch die in Formel (4) gezeigte Wiederholung in einer Form gelöst werden, die Euler-Lagrange Gleichung zu lösen, die durch partielle Differenzierung der Formel (3) erhalten wird. Hier ist ( , ) der Nachbarschaftdurchschnitt des Bewegungsvektors, k ist die Anzahl der Wiederholungen und α ist eine Konstante.
- uk+1 = k - Ix(Ix k + Iyvk + It)/(α² + Ix² + Iy²) vk+1 = k - Ix(Ix k + Iyvk + It)/(α² + Ix² + Iy²) (4)
- (uk+1, vk+1) in Formel (4) wird jeweils in dem Bewegungsabschätzteil 311 für die horizontale Richtung und dem Bewegungsabschätzteil 312 für die vertikale Richtung berechnet und in dem Bewegungsspeicher 310 für die horizontale Richtung und dem Bewegungsspeicher 313 für die vertikale Richtung gespeichert.
- Der Nachbarschaftsdurchschnitt, der zur Berechnung notwendig ist, wird durch die Glättungsfilter 314, 315 berechnet. Somit kann gemäß dieser herkömmlichen Bewegungsvektorbestimmungsvorrichtung der Bewegungsvektor durch Bewegungsabschätzung und Nachbarschaftsglättung bestimmt werden. Jedoch gibt es bei dem vorgenannten Stand der Technik die folgenden Probleme.
- (1) Wiederholte mehrmalige Berechnungen werden im allgemeinen benötigt, und die Verarbeitungszeit ist lang.
- (2) Glätten ist zur Bestimmung des Nachbarschaftsdurchschnitts notwendig, und daher werden unterschiedliche Bewegungsvektoren nahe der Grenze des Gegenstands geglättet und nicht genau bestimmt.
- (3) Der Abschätzungsfehler ist an der Grenze des Gegenstands groß.
- Das zweite und dritte Problem ergeben sich aus der gegenseitigen Abhängigkeit der Abschätzung des Bewegungsvektors und der Bereichssegmentierung des Bildes. Zur Abschätzung des Bewegungsvektors wird eine gewisse Kopplung mit dem Rahmenwerk der Bereichssegmentierung verlangt.
- Es ist deshalb eine vorrangige Zielsetzung der Erfindung, die obigen Probleme zu lösen und die Genauigkeit der Bestimmung des Bewegungsvektors an der Gegenstandsgrenze bei der Bewegungsvektorbestimmungsvorrichtung zu verbessern und die Verarbeitungszeit zu verkürzen.
- Vorrichtung der vorliegenden Erfindung zur Bestimmung von Bewegungsvektoren, die umfaßt:
- a) einen Speicher zur Speicherung von Videosignalen, die codiert und aus Bildern zusammengesetzt sind,
- b) ein horizontales Differenzierfilter zum Auslesen von Luminanzdaten aus dem Speicher und zum Differenzieren oder Bilden von Differenzen in horizontaler Richtung von beliebigen Bildkoordinaten,
- c) ein vertikales Differenzierfilter zum Auslesen von Luminanzdaten aus dem Speicher und zum Differenzieren oder Bilden von Differenzen in vertikaler Richtung von beliebigen Bildkoordinaten
- d) ein Zeitdifferenzierfilter zum Auslesen der Luminanzdaten vorausgehender und nachfolgender Bilder aus dem Speicher und zu Differenzieren oder Bilden von Differenzen in zeitlicher Richtung,
- wobei die Vorrichtung dadurch gekennzeichnet ist, daß sie des weiteren umfaßt:
- e) eine Merkmalsvektor-Kombinationseinrichtung, um einen Luminanzdifferentialvektor (Ix, Iy, It), der Ergebnisse des horizontalen Differenzierfilters, des vertikalen Differenzierfilters und des Zeitdifferenzierfilters umfaßt, und einen Positionsvektor (x, y) der Bildkoordinaten zu kombinieren, um einen Abtastvektor (Ix, Iy, It, x, y) zu erhalten,
- f) einen Speicher, um eine Mehrzahl Abschätzungen eines Bewegungsvektors (u, v) und ein Positionsvektormittelwert ( , ) des Abtastvektors als Klassendaten zu halten,
- g) eine Bestimmungseinrichtung für die naheste Klasse, um einen Abstand zwischen der Klassendate und dem Abtastvektor aus einer Formel "(x- , y- )" und einer Formel "(u*Ix + v*Iy + It)" zu bestimmen und eine Entsprechung zwischen dem Abtastvektor und der nahesten Klassendate zu erreichen, und
- h) eine Klassendaten-Änderungseinrichtung, um die derart bestimmten nahesten Klassendaten in einer Weise zu ändern, daß eine Abstandssumme zwischen den Klassendaten und dem entsprechenden einen oder mehreren Abtastvektoren kleiner wird.
- Gemäß dieser Ausgestaltung wird das Zeit-Raum-Differential (Ix, Iy, It) von dem Speicher, der die Videosignale speichert, die in Bildeinheiten gebildet sind, mittels des horizontalen Differenzierfilters, des vertikalen Differenzierfilters und des Zeitdifferenzierfilters erhalten. Des weiteren sind die Abtastvektorkombinationseinrichtung, der obige (Ix, Iy, It) und der Positionsvektor (x, y) der Bildkoordinaten gekoppelt, um einen Abtastvektor zu erhalten. Dann werden das Positionsvektormittel ( , ) und eine Abschätzung des Bewegungsvektors (u, v) des Abtastvektors in einer Mehrzahl von Klassendaten in dem Speicher gespeichert. Die Bestimmungseinrichtung für die naheste Klasse wählt aus den mehreren Klassendaten in dem Speicher die der Abtastdate naheste auf der Grundlage der Operation von (x- , y- ) und (u*Ix + v*Iy + It) aus, und ihre Entsprechung wird bestimmt. Als Ergebnis wird die Entsprechung mit den Klassendaten hergestellt, die den Bewegungsvektor aufweisen, der die Nebenbedingungsgleichung durch die Zeit-Raum-Differenzierung nahe der Raumposition in dem Bild erfüllt. Von dieser Entsprechung ändert die Klassendaten-Änderungseinrichtung die Klassendaten so, daß die Abstandssumme zu einem oder mehreren Abtastvektoren kleiner wird, d. h. zwischen der nahesten entsprechenden Klassendate und der entsprechenden einen oder mehreren Abtastvektordaten.
- Demgemäß wird die Klassendate so geändert, daß der Abstand zu dem Abtastvektor statistisch kleiner wird, und als Ergebnis kommt die Klassendate dazu, den Bewegungsvektor (u, v) einer gewissen Position ( , ) in dem Bild darzustellen. Auf diese Weise wird, indem mehrere Abtastvektoren aus der Nachbarschaft in dem Bild gesammelt werden, erwartet, daß mehrere Nebenbedingungsgleichungen des Raumdifferentials erhalten werden können und der Bewegungsvektor bestimmt wird. Wenn es eine unterschiedliche Bewegung nahe der Gegenstandsgrenze gibt, wird der Abstand von einem Abtastvektor zu der anderen Klassendate größer, so daß der Nachteil der herkömmlichen Glättung vermieden werden kann.
- Fig. 1 ist ein strukturelles Diagramm einer Bewegungsvektorbestimmungsvorrichtung nach dem Stand der Technik.
- Fig. 2 ist ein strukturelles Diagramm einer ersten Ausführungsform der Bewegungsvektorbestimmungsvorrichtung.
- Fig. 3 ist ein strukturelles Diagramm einer zweiten Ausführungsform der Bewegungsvektorbestimmungsvorrichtung.
- Fig. 4 ist ein Hauptdiagramm zur Abschätzung eines Bewegungsvektors bei der ersten und zweiten Ausführungsform der Bewegungsvektorbestimmungsvorrichtung.
- Bezugnehmend auf die Zeichnungen werden einige Ausführungsformen der Erfindung ausführlich unten beschrieben. Die erste Ausführungsform der Erfindung, die in Anspruch 1 beansprucht ist, wird unter Bezugnahme auf die Fig. 2 und 4 beschrieben.
- Fig. 2 ist ein schematisches Diagramm einer Bewegungsvektorbestimmungsvorrichtung der ersten Ausführungsform der Erfindung. Fig. 4 ist ein Diagramm, das das Prinzip der Abschätzung der Bewegung bei der ersten Ausführungsform zeigt. In Fig. 2 ist das Bezugszeichen 101 ein Analog/Digitalwandler, sind 102, 103 Bildspeicher, ist 104 ein Differenzierfilter für die horizontale Richtung, ist 105 ein Differenzierfilter für die vertikale Richtung, ist 106 ein Differenzierfilter für die Zeitrichtung, ist 107 ein Differentialbildspeicher für die horizontale Richtung, ist 108 ein Differentialbildspeicher für die vertikale Richtung, ist 109 ein Differentialbildspeicher für die Zeitrichtung, ist 110 ein Merkmalsvektor-Kombinationsteil, ist 111 ein Zufallsadressenerzeugungsteil, ist 112 ein Bestim mungsteil für die Klasse mit maximaler Likelihood (maximum likelihood) als Beispiel einer Bestimmungseinrichtung für die naheste Klasse, ist 113 ein Änderungsteil für die Klasse der maximalen Likelihood und ist 114 eine Klassendatenspeicherbank.
- Das über den Analog/Digitalwandler eingegebene Bild wird um 1 Bilddauer in dem Bildspeicher 102 verzögert und geht sequentiell durch den Bildspeicher 103 hindurch.
- Das Differenzierfilter 104 für die horizontale Richtung, das ein Differenzierfilter 105 für die vertikale Richtung und das Differenzierfilter 106 für die Zeitrichtung berechnen die Zeit-Raum-Differenzierung (δl/δx, δl/δy, δl/δt) der Formel (2), die zur Abschätzung des Bewegungsvektors in jedem Pixel notwendig ist. Die Berechnungsergebnisse werden jeweils in dem Differentialbildspeicher 107 für die horizontale Richtung, dem Differentialbildspeicher 108 für die vertikale Richtung und dem Differentialbildspeicher 109 für die Zeitrichtung aufgezeichnet. Da das Bild abgetastet wird, wird die Diffenrenzierberechnung durch eine Differenzberechnung ersetzt.
- Der Zufallsadressenerzeugungsteil 111 erzeugt die horizontale und vertikale Position auf dem Schirm zufällig unter Verwendung von Zufallszahlen. Der Merkmalsvektor- Kombinationsteil 110, der die Bildposition (x, y) erhält, liest den Zeit-Raum-Differentialwert (Ix, Iy, It) an dieser Position aus den Speichern 107, 108, 109 aus und erzeugt den Abtastvektor (Ix, Iy, It, x, y)t [()t ist die transponierte Matrix]. Andererseits sind in der Speicherbank 114 für die Klassendaten n Elemente Klassendaten gespeichert. Bei dieser Ausführungsform umfassen die Klassendaten den Mittelwert des Positionsvektors p = (x, y)t, die Kovarianzmatrix S des Positionsvektors und die Kovarianzmatrix M des Differentialvektors d = (Ix, Iy, It)t bei dem Abtastvektor (Ix, Iy, It, x, y)t.
- Es wird angenommen, daß die Eigenvektoren der Matrix M, die auf 1 normiert sind für den größten der entsprechenden Eigenwerte e1, e2, e3 sind. Der Anfangswert von Klassendaten wird so festgelegt, daß er die gleichen Intervalle auf dem Bildschirm in bezug auf die Position aufweist, und von den Kovarianzmatritzen S und M wird angenommen, daß sie Einheitsmatritzen sind. Zu diesem Zeitpunkt wird der Eigenvektor e3 von M insbesondere definiert zu (0, 0, 1). In dem Bestimmungsteil 112 für die Klasse der maximalen Likelihood wird, wobei der in Formel (5) gezeigte Abstand verwendet wird, der Abtastvektor, der an Zufallspositionen kombiniert wird, dazu gebracht, daß er der Klassendate bei dem kürzesten Abstand von ihm entspricht.
- (p, d si,Si,Mi) = (p - si)tSi&supmin;¹(p - si + In Si + σi&supmin;²(dte3i)² + Inσi², (5)
- worin σi = e3i /e33i,
- Diese Entsprechung ist nicht auf die Verwendung der Form der Formel (5) begrenzt, bei der (e33) eine It Komponente des Eigenvektors e3 ist. Bei dieser Ausführungsform werden, wenn eine Entsprechungsgruppe von Abtastvektor und Klassendaten erhalten wird, die entsprechenden Klassendaten sequentiell in dem Änderungsteil 113 der Klassendaten für die maximale Likelihood geändert. In bezug auf den k-ten Abtastvektor wird von der Kennungsgröße seiner Klassendaten angenommen, daß sie i ist. Die von den Daten i verschiedenen Klassendaten werden nicht geändert, und es wird nur die Date i in den Klassendaten i in den Formel (6), (7), (8) geändert.
- si(k+1) = si(k) + α(p - si(k)), 0.0 ≤ α ≤ 1.0 (6)
- Si(k+1) = (1 - β)Si(k) + β(p - si(k))(p - si(k))t, 0.0 ≤ β ≤ 1.0 (7)
- Mi(k+1) = (1 - γ)Mi(k) + γddt, 0.0 ≤ γ ≤ 1.0 (8)
- Indem die vorgenannte Zufallsadressenerzeugung, die Merkmalsvektorkombination, die Klassenbestimmung für die maximale Likelihood und die Datenänderung der Klasse der maximalen Likelihood auf mehrere Abtastungen angewendet wird, wird die Selbstorganisation der Klassendaten ausgeführt. Das heißt, eine Gruppe Pixel in der Nachbarschaft in dem Bild und die allgemein die Bewegungsnebenbedingung erfüllt, bildet eine Gruppe identischer Klassendaten. Die Zufallsadressenerzeugung soll eine Zeitabweichung zum Ändern der sequentiellen Klassendaten verhindern. Fig. 4 zeigt das Prinzip der Bewegungsabschätzung bei dieser Ausführungsform. Betrachtet man den Merkmalsraum des Luminanz-Differentialvektors d = (Ix, Iy, It)t, so sollten sich, wenn alle Da ten die Nebenbedingungsgleichung der Zeit-Raum-Differenzierung erfüllen, in einer Ebene verteilen, wie es oben in Fig. 4 gezeigt ist. Deshalb spannen der erwartete Wert von ddt, d. h., der erste Eigenvektor und der zweite Eigenvektor der Kovarianzmatrix M diese Ebene auf (bestimmen sie). Der dritte Eigenvektor ist der auf dieser Ebene normale Einheitsvektor, und, wenn angenommen wird, daß seine Komponenten (e31, e32, e33) ist, kann er als (u, v) = (e31/e33, e32/e33) erhalten werden.
- Die Änderung der Kovarianzmatrix, die in der Formel (8) gezeigt ist, in dem Änderungsteil 113 für Klassendaten für die maximale Likelihood entspricht der Drehung der Ebene, wie es oben und unten in Fig. 4 gezeigt ist. Demgemäß wird der dritte Eigenvektor e3 von dem Abtastvektor entfernt eingestellt, und der aus (u*Ix + v*Iy + It) berechnete Abstand wird für einen solchen Abtastvektor verringert.
- Es ist ein Merkmal dieser Ausführungsform, daß der Bewegungsvektor als der Eigenvektor der Kovarianzmatrix abgeschätzt wird. Übrigens ist es, wenn nur e3 bestimmt wird, möglich, sich sequentiell durch Drehung des Unterraums anzunähern, der durch e3 ausgedrückt ist, wie es in Formel (9) gezeigt ist. In der Formel (9) bezeichnet I eine 3 · 3 Einheitsmatrix.
- e3i(k+1) = e3i(k)(I-εddt), 0,0 ≤ ε < 1,0 (9)
- worin ε eine Konstante ist.
- Indem der Eigenvektor der Kovarianzmatrix bestimmt wird, kann die Zuverlässigkeit des bestimmten Bewegungsvektors ausgewertet werden. Der Rang von M ist idealerweise 2, und nimmt man für die Eigenvektoren λ1 > λ2 > λ3 an, ist, wenn der Wert λ2/λ3 groß ist, die Zuverlässigkeit des erhaltenen Bewegungsvektors groß. Bei dieser Ausführungsform wird ferner, da die Klassendaten sequentiell geändert werden, weniger Speicherraum verlangt.
- Die zweite Ausführungsform der Erfindung, wie sie in Anspruch 2 beansprucht ist, ist unten unter Bezugnahme auf Fig. 3 beschrieben. Fig. 3 ist ein schematisches Diagramm einer Bewegungsvektorbestimmungsvorrichtung bei der zweiten Ausführungsform.
- In Fig. 3 ist das Bezugszeichen 201 ein Analog/Digitalwandler, sind 202, 203 Rahmenspeicher, ist 204 ein Differenzierfilter für die horizontale Richtung, ist 205 ein Differenzierfilter für die vertikale Richtung, ist 106 ein Differenzierfilter für die Zeitrichtung, ist 207 ein Differentialbildspeicher für die horizontale Richtung, ist 208 ein Differentialbildspeicher für die vertikale Richtung, ist 209 ein Differentialbildspeicher für die Zeitrichtung, ist 210 ein Merkmalsvektor-Kombinationsteil, ist 211 ein Zufallsadressenerzeugungsteil, ist 212 ein Bestimmungsteil für die Klasse mit maximaler Likelihood (maximum likelihood) als Beispiel einer Bestimmungseinrichtung für die naheste Klasse, ist 213 ein Änderungsteil für die Klasse der maximalen Likelihood und ist 214 eine Klassendatenspeicherbank, ist 215 ein RGB (rot, gelb, blau) Luminanzspeicher und 216 ein Abtaststapel nach Klassen. Bei der zweiten Ausführungsform wird der RGB Farbvektor erneut mit dem Abtastvektor kombiniert. Die Änderung der Klassendaten für die maximale Likelihood wird nicht sequentiell wie bei der ersten Ausführungsform geändert, sondern ist die Wiederholung der folgenden zwei Schritte.
- Schritt 1) Ein Paar aus einem Abtastvektor und Klassendaten wird zumindest durch zehn oder mehr Gruppen für jede Klasse gespeichert.
- Schritt 2) Die Klassendaten werden unmittelbar aus den mehreren Gruppen berechnet.
- Somit sind die Ausdehnung des Abtastvektors und des Änderungsschritts der Klassendaten gegenüber der ersten Ausführungsform verschieden. Diese Unterschiede sind unten beschrieben.
- Der Analog/Digitalwandler 201 codiert den Luminanz- und RGB Wert und der RGB Wert wird in dem RGB Luminanzspeicher 215 gespeichert. Die Arbeitsweise der Einrichtungen 202 bis 209 und 211 ist die gleiche wie die Funktion der entsprechenden Hauptelemente in der ersten Ausführungsform. Der Kombinationsteil 210 für den Merkmalsvektor erhält die zufällig erzeugte Bildposition (x, y) und liest den Zeit-Raum-Differentialwert (Ix, Iy, It), den RGB Wert (r, g, b) aus und erzeugt den Abtastvektor (Ix, Iy, It, x, y, r, g, b)t. Andererseits werden n Elemente Klassendaten in der Klassendatenspeicherbank 214 gespeichert. Bei der zweiten Ausführungsform umfassen die Klassendaten den Mittelwert (t) des Farbpositionsvektors q = (x, y, r, g, b)t, die Kovarianzmatrix Σ des Farbpositionsvektors und die Kovarianzmatrix m des Luminanzdifferentialvektors d = (Ix, Iy, It)t in dem Abtastvektor (Ix, Iy, It, x, y, r, g, b)t. Wie bei der ersten Ausführungsform wird angenommen, daß die Eigenvektoren der Matrix M, die auf 1 normiert sind, e1, e2, e3 von dem größten der entsprechenden Eigenwerte sind. Der Anfangswert der Klassendaten wird so eingestellt, daß er die gleichen Intervalle auf dem Bildschirm in bezug auf die Position aufweist, und die Kovarianzmatritzen Σ und M werden als Einheitsmatritzen angenommen. Zu diesem Zeitpunkt wird der Eigenvektor e3 von M insbesondere definiert als (0, 0,1).
- In dem Bestimmungsteil für die Klasse mit der maximalen Likelihood wird unter Verwendung des in Formel (10) ausgedrückten Abstands eine Entsprechung zwischen dem Abtastvektor, der bei Zufallspositionen kombiniert wird, und den Klassendaten in einem minimalen Abstand davon hergestellt.
- I(q,d ti, Σi, Mi) = (q - ti)tΣi&supmin;¹(q - ti) + In Σi + σi&supmin;²(dte3i)² + Inσi², (10)
- worin σi = e3i /e33,
- Die Kovarianzmatrix Σ ist in einer Weise begrenzt, daß die Kovarianz C über die Farbe und die Kovarianz S über die Position unabhängig sind, wie es in Formel (11) gezeigt ist.
- Bei dieser Ausführungsform wird die Entsprechung des Abtastvektors und der Klassendaten durch eine festgelegte Anzahl von Malen in dem Bestimmungsteil 212 der Klasse für die maximale Likelihood ausgeführt (z. B. Anzahl der Klassen n · ungefähr 100), und die entsprechenden Abtastvektoren werden klassenweise durch jede Klassenkennung in dem Abtaststapel 216 gespeichert. Danach werden auf der Grundlage der in dem Abtaststapel 216 nach Klassen gespeicherten Abtastung die Operationen der Formel (12), (13), (14) durch den Änderungsteil 213 für die Klasse der maximalen Likelihood ausgeführt, und der Mittelwert t(I) des Farbpositionsvektors und seiner Kovarianzmatrix Σ(I) und die Kovarianzmatrix M(I) des Luminanzdifferentialvektors zu t(I+1) und Σ(I+1), M(I+1) aktualisiert.
- In den Formeln (12), (13), (14) ist (mi) die Anzahl der Abtastungen nach der Klasse in dem Stapel, und (I) bezeichnet die Anzahl der Aktualisierungen
- Indem ungefähr I > 10-mal wiederholt wird, werden die Abtastvektoren angehäuft. Indem die Farbinformationen kombiniert werden, wird die Trennung unterschiedlicher Gegenstände verbessert, und die Bestimmungsgenauigkeit des Bewegungsvektors in den Bereich wird verbessert. Es wird eine Bereichssegmentierung, wobei Farbe und Bewegung kombiniert werden, durchgeführt. Bei dieser Ausführungsform ist die Zufallsadressenerzeugung nicht wesentlich, wobei aber eine Abweichung der Abschätzung verhindert werden kann, wenn die Abtastanzahl in dem klassenweisen Abtaststapel die Speichergrenze überschreitet.
- Gemäß der Erfindung werden verglichen mit der herkömmlichen Bewegungsvektorbestimmungsvorrichtung auf der Grundlage des Zeit-Raum-Differentialverfahrens die folgenden Wirkungen erreicht.
- (1) Wiederholungsoperationen sind nicht notwendig und die Verarbeitungszeit ist kürzer.
- (2) Der Bereich kann durch Kombination von Farb- und anderen Informationen segmentiert werden.
- (3) Ein großer Abschätzungsfehler tritt in der Bereichsgrenze nicht auf.
- Daher kann sie vorteilhaft bei der Bildcodierung, der Rauschverringerung und der Gegenstandsverfolgung angewendet werden.
Claims (2)
1. Vorrichtung zur Bestimmung von Bewegungsvektoren, die umfaßt:
a) einen Speicher (102, 103) zur Speicherung von Videosignalen, die codiert und
aus Bildern zusammengesetzt sind,
b) ein horizontales Differenzierfilter (104) zum Auslesen von Luminanzdaten aus
dem Speicher und zum Differenzieren oder Bilden von Differenzen in horizontaler
Richtung von beliebigen Bildkoordinaten,
c) ein vertikales Differenzierfilter (105) zum Auslesen von Luminanzdaten aus dem
Speicher und zum Differenzieren oder Bilden von Differenzen in vertikaler Richtung
von den Bildkoordinaten,
d) ein Zeitdifferenzierfilter (106) zum Auslesen der Luminanzdaten vorausgehender
und nachfolgender Bilder aus dem Speicher und zum Differenzieren oder Bilden von
Differenzen in zeitlicher Richtung,
wobei die Vorrichtung dadurch gekennzeichnet ist, daß sie des weiteren umfaßt:
e) eine Merkmalsvektor-Kombinationseinrichtung (110) zur Kombination eines
Luminanzdifferentialvektors (Ix, Iy, It), der Ergebnisse des horizontalen
Differenzierfilters, des vertikalen Differenzierfilters und des Zeitdifferenzierfilters umfaßt, und
eines Positionsvektors (x, y) der Bildkoordinaten, um einen Abtastvektor (Ix, Iy, It, x,
y) zu erhalten,
f) einen Speicher (114) zur Speicherung einer Mehrzahl von Abschätzungen eines
Bewegungsvektors (u, v) und eines Positionsvektormittelwertes ( , ) des
Abtastvektors als Klassendaten,
g) eine Bestimmungseinrichtung (112) für eine naheste Klasse zur Bestimmung
eines Abstandes zwischen den Klassendaten und dem Abtastvektor aus einer Formel
"(x- , y- )" und einer Formel "(u*Ix + v*Iy + It)" und zur Erreichung einer
Entsprechung zwischen dem Abtastvektor und den nahesten Klassendaten, und
h) eine Klassendaten-Änderungseinrichtung (113) zur Änderung der derart
bestimmten nahesten Klassendaten in einer Weise, daß eine Abstandssumme zwischen den
Klassendaten und dem entsprechenden einen oder den entsprechenden mehreren
Abtastvektoren kleiner wird.
2. Vorrichtung zur Bestimmung von Bewegungsvektoren, die umfaßt:
a) einen Speicher zur Speicherung von Videosignalen, die codiert und αus Bildern
zusammengesetzt sind,
b) ein horizontales Differenzierfilter zum Auslesen vom Luminanzdaten aus dem
Speicher und zum Differenzieren oder Bilden von Differenzen in horizontaler
Richtung von beliebigen Bildkoordinaten,
c) ein vertikales Differenzierfilter (105) zum Auslesen von Luminanzdaten aus dem
Speicher und zum Differenzieren oder Bilden von Differenzen in vertikaler Richtung
von den Bildkoordinaten,
d) ein Zeitdifferenzierfilter (106) zum Auslesen der Luminanzdaten vorausgehender
und nachfolgender Bilder aus dem Speicher und zum Differenzieren oder Bilden von
Differenzen in zeitlicher Richtung,
e) eine Abtastvektor-Kombinationseinrichtung zum Auslesen von Farbdaten aus dem
Speicher, die aus einer Gruppe von einem oder mehreren Luminanzwerten
bestehen, die sich in der Farbe unterscheiden, wobei die Farbdaten, der
Luminanzdifferentialvektor (Ix, Iy, It), der Ergebnisse des horizontalen Differenzierfilters, des
vertikalen Differenzierfilters und des Zeitdifferenzierfilters umfaßt, und ein
Positionsvek
tor (x, y) der Bildkoordinaten kombiniert werden, um einen Abtastvektor (Ix, Iy, It, x,
y) zu erhalten.
f) einen Speicher zur Speicherung einer Mehrzahl von einem
Positionsvektormittelwert ( , ), einer Abschätzung eines Bewegungsvektors (u, v) und eines
Mittelwertes der Farbdaten des Abtastvektors als Klassendaten,
g) eine Bestimmungseinrichtung (112) für die naheste Klasse zur Bestimmung eines
Abstandes zwischen den Klassendaten und dem Abtastvektor aus einer Formel
"(x- , y- )", einer Formel "(u*Ix + v*Iy + It)" und einer Differenz zwischen den
Farbdaten und dem Farbdatenmittelwert und zur Erreichung einer Entsprechung
zwischen dem Abtastvektor und den nahesten Klassendaten, und
h) eine Klassendaten-Änderungseinrichtung zur Änderung der derart bestimmten
nahesten Klassendaten in einer Weise, daß eine Abstandssumme zwischen den
Kassendaten und dem entsprechenden einen oder den entsprechenden mehreren
Abtastvektoren kleiner wird.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29412092A JP2789967B2 (ja) | 1992-11-02 | 1992-11-02 | 動きベクトル検出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69326522D1 DE69326522D1 (de) | 1999-10-28 |
DE69326522T2 true DE69326522T2 (de) | 2000-02-17 |
Family
ID=17803554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69326522T Expired - Fee Related DE69326522T2 (de) | 1992-11-02 | 1993-10-28 | Bewegungsvektornachweisgerät |
Country Status (4)
Country | Link |
---|---|
US (1) | US5479218A (de) |
EP (1) | EP0596409B1 (de) |
JP (1) | JP2789967B2 (de) |
DE (1) | DE69326522T2 (de) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5535302A (en) * | 1994-12-01 | 1996-07-09 | Tsao; Tien-Ren | Method and apparatus for determining image affine flow using artifical neural system with simple cells and lie germs |
KR0171146B1 (ko) * | 1995-03-18 | 1999-03-20 | 배순훈 | 특징점을 이용한 움직임 벡터 검출 장치 |
WO1997023844A1 (en) * | 1995-12-21 | 1997-07-03 | Philips Electronics N.V. | Directional adaptive noise reduction |
GB2311184A (en) * | 1996-03-13 | 1997-09-17 | Innovision Plc | Motion vector field error estimation |
GB2311182A (en) * | 1996-03-13 | 1997-09-17 | Innovision Plc | Improved gradient based motion estimation |
DE19712017A1 (de) * | 1997-03-15 | 1998-09-17 | Gmd Gmbh | Kompaktes Sensorsystem zur optischen Bewegungserkennung in Echtzeit |
US6750900B1 (en) | 1998-07-23 | 2004-06-15 | Eastman Kodak Company | Method and apparatus for computing motion tracking parameters |
SG89282A1 (en) | 1999-05-28 | 2002-06-18 | Kent Ridge Digital Labs | Motion information extraction system |
US6785329B1 (en) * | 1999-12-21 | 2004-08-31 | Microsoft Corporation | Automatic video object extraction |
US7639741B1 (en) * | 2002-12-06 | 2009-12-29 | Altera Corporation | Temporal filtering using object motion estimation |
US7583819B2 (en) * | 2004-11-05 | 2009-09-01 | Kyprianos Papademetriou | Digital signal processing methods, systems and computer program products that identify threshold positions and values |
JP4966945B2 (ja) * | 2008-10-08 | 2012-07-04 | 日本電信電話株式会社 | 時空間画像特徴量検出装置、時空間画像特徴量検出方法および時空間画像特徴量検出プログラム |
WO2013073355A1 (ja) | 2011-11-15 | 2013-05-23 | 日本電気株式会社 | 動きベクトル推定装置、動きベクトル推定方法及び動きベクトル推定用プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2845473B2 (ja) * | 1989-02-13 | 1999-01-13 | 繁 安藤 | 動画像の運動、非運動領域検出装置 |
US5166788A (en) * | 1990-06-29 | 1992-11-24 | Samsung Electronics Co., Ltd. | Motion signal processor |
EP0474276B1 (de) * | 1990-09-03 | 1997-07-23 | Koninklijke Philips Electronics N.V. | Video-Bewegungsvektorabschätzung mit asymmetrischem Aktualisierungsgebiet |
GB2252466B (en) * | 1991-02-04 | 1994-10-19 | Sony Broadcast & Communication | Television standards converters |
KR950009699B1 (ko) * | 1992-06-09 | 1995-08-26 | 대우전자주식회사 | 움직임벡터 검출방법 및 장치 |
-
1992
- 1992-11-02 JP JP29412092A patent/JP2789967B2/ja not_active Expired - Fee Related
-
1993
- 1993-10-26 US US08/141,051 patent/US5479218A/en not_active Expired - Lifetime
- 1993-10-28 EP EP19930117489 patent/EP0596409B1/de not_active Expired - Lifetime
- 1993-10-28 DE DE69326522T patent/DE69326522T2/de not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2789967B2 (ja) | 1998-08-27 |
JPH06150007A (ja) | 1994-05-31 |
EP0596409B1 (de) | 1999-09-22 |
DE69326522D1 (de) | 1999-10-28 |
EP0596409A3 (de) | 1994-12-07 |
US5479218A (en) | 1995-12-26 |
EP0596409A2 (de) | 1994-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69812882T2 (de) | Verfahren zur bewegungskompensierten Mehrhalbbildverbesserung von Videostandbildern | |
DE60036082T2 (de) | Verfahren und vorrichtung zur wiederauffindung von texturbildern | |
DE69623642T2 (de) | Vektorkorrelationssystem zum automatischen auffinden von mustern in einem bild | |
DE69734855T2 (de) | Vorrichtung und Verfahren zur Extraktion eines Objektes in einem Bild | |
DE69218656T2 (de) | Verfahren zur zeitlichen adaptiven Filterung von verrauschten Bildsequenzen | |
DE69326522T2 (de) | Bewegungsvektornachweisgerät | |
DE69828909T2 (de) | Neue perzeptive lokale gradientenbasierte gratbestimmung | |
DE69230629T2 (de) | Verfahren und Vorrichtung zur Bildverbesserung | |
DE60012649T2 (de) | Beseitigung von chromarauschen aus digitalbildern durch verwendung veränderlich geformter pixelnachbarschaftsbereiche | |
DE102018116111A1 (de) | Ein einheitliches tiefes faltendes neuronales Netzwerk für die Abschätzung von Freiraum, die Abschätzung der Objekterkennung und die der Objektstellung | |
DE69624758T2 (de) | Bildsegmentierungssystem und -verfahren | |
DE69705725T2 (de) | Verfahren zur Lokalisierung von Farbbereichen oder von Bereichen mit grossen Helligkeitsänderungen in einem Bild | |
DE60118297T2 (de) | Verfahren zum entfernen von farbwechselartefakten aus digitalen farbbildern | |
EP1104570A1 (de) | Verfahren zum erkennen von objekten in digitalisierten abbildungen | |
DE102011056972A1 (de) | Vorrichtung und Verfahren zur digitalen Bildstabilisierung | |
DE102020118241A1 (de) | Videotiefenschätzung auf der grundlage der temporalen aufmerksamkeit | |
DE60302946T2 (de) | Bildsegmentierungsverfahren und -vorrichtung zur MRC-basierten Darstellung von Dokumenten | |
DE3789091T2 (de) | Bildverarbeitungsverfahren und -system zur Bildrekonstruktion. | |
DE10230112A1 (de) | Verfahren und Vorrichtung zum Verbessern von Bildern unter Verwendung einer Kantenausrichtung | |
DE69029429T2 (de) | Binäres Bildreduzierungsverfahren | |
DE69028033T2 (de) | Bewegungsabhängige Videosignalverarbeitung | |
DE69331542T2 (de) | Ein maschinelles verfahren zur kompensation von nichtlinearen bildwandlungen, z.b. zoom und pan, in einem videobildbewegungskompensierten system | |
DE69612284T2 (de) | Datenverarbeitungsverfahren- und vorrichtung | |
DE60023837T2 (de) | Vorrichtung und verfahren zur filterung | |
DE68922694T2 (de) | Bild-Bewegungsmessung. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |