AT7635U1 - Verfahren und programmlogik zur objekterkennung - Google Patents
Verfahren und programmlogik zur objekterkennung Download PDFInfo
- Publication number
- AT7635U1 AT7635U1 AT0054004U AT5402004U AT7635U1 AT 7635 U1 AT7635 U1 AT 7635U1 AT 0054004 U AT0054004 U AT 0054004U AT 5402004 U AT5402004 U AT 5402004U AT 7635 U1 AT7635 U1 AT 7635U1
- Authority
- AT
- Austria
- Prior art keywords
- jets
- image
- similarity
- pref
- landmarks
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
- G06V10/7515—Shifting the patterns to accommodate for positional errors
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
Ein Verfahren zur Objekterkennung, insbesondere Gesichtserkennung, in einem Objektbild (Pobj) durch Vergleichen von Wavelet-Jets signifikanter Punkte des Objektbildes mit Wavelet-Jets zumindest eines Referenzbildes (Pbib,r, Pref,s), wobeiin einem ersten Schritt im Objektbild (Pobj) die aktuellen Koordinaten (lmobj,i) der signifikanten Punkte (lmi) ermittelt werden, indem jeweils im Umgebungsbereich einer Schätzung (lmest,i) der Koordinaten die Koordinaten jenes Punktes mit der maximalen Ähnlichkeit seines Wavelet-Jets (J'i) zu den Wavelet-Jets (Jbib,i,r) der signifikanten Punkte (lmman,i,r) des Referenzbildes (Pbib,r) ermittelt werden, undin einem zweiten Schritt die Erkennung des Objektes durch Ähnlichkeitsvergleich zwischen den Wavelet-Jets (Jobj,i) der lokalisierten signifikanten Punkte (lmobj,i) des Objektbildes (Pobj) und den Wavelet-Jets (Jref,i,s) der signifikanten Punkte (lmman,i,s) des Referenzbildes (Pref,s) erfolgt,zeichnet sich dadurch aus, daß die Wavelet-Jets (Jest,i, Jbib,i,r, J'i) im ersten Schritt auf Basis von Haar-Wavelets (?H,j; BH) und die Wavelet-Jets (Jobj,i, Jref,i,s) im zweiten Schritt auf Basis von in der Mehrzahl gekrümmten Gabor-Wavelets (?B,j; BB) erzeugt werden.
Description
AT 007 635 U1
Die vorliegende Erfindung betrifft ein Verfahren zur Objekterkennung, insbesondere Gesichtserkennung, in einem Objektbild durch Vergleichen von Wavelet-Jets signifikanter Punkte des Objektbildes mit Wavelet-Jets zumindest eines Referenzbildes, sowie eine entsprechende Programmlogik. 5 Ein derartiges Verfahren ist in der Arbeit von David S. Bolme, „Elastic Bunch Graph Matching“, Thesis MSc, Colorado State University, Sommer 2003, beruhend u.a. auf der Arbeit von Laurenz Wiskott, Jean-Marc Fellous, Norbert Krüger und Christoph von der Malsburg, „Face Recognition by Elastic Bunch Graph Matching“, Tech. Report 96-08, Ruhr-Universität Bochum, April 1996, beschrieben. io Bei den bekannten Verfahren wird als Basis für die Erzeugung der Jets ein Satz von geradlinigen Gabor-Wavelets verwendet, und zwar sowohl im ersten Schritt der Lokalisierung der signifikanten Punkte als auch im zweiten Schritt des Ähnlichkeitsvergleiches mit dem Referenzbild. Es hat sich gezeigt, daß praktische Implementierungen dieser Verfahren eine überaus hohe Rechenleistung erfordern und dennoch eine verhältnismäßig hohe Fehlerrate bei der Objekterkennung 15 aufweisen, was einem breiteren industriellen Einsatz, z.B. in der Sicherheitstechnik, entgegensteht.
Die Erfindung setzt sich zum Ziel, ein Verfahren der genannten Art so weiterzubilden, daß es eine geringere Fehleranfälligkeit und höhere Robustheit besitzt als die bekannten Lösungen, bei gleichzeitig geringerem Rechenleistungsbedarf. Dieses Ziel wird mit einem Verfahren der einleitend genannten Art erreicht, welches sich gemäß der Erfindung dadurch auszeichnet, daß die 20 Wavelet-Jets im ersten Schritt auf Basis von Haar-Wavelets und im zweiten Schritt auf Basis von in der Mehrzahl gekrümmten Gabor-Wavelets erzeugt werden.
Die Erfindung beruht auf der Erkenntnis, daß sowohl die Verarbeitungsgeschwindigkeit als auch die Treffsicherheit der Objekterkennung wesentlich gesteigert werden können, wenn die beiden Schritte des Verfahrens, Lokalisation und Ähnlichkeitsvergleich, auf vollkommen getrennte, 25 jeweils speziell angepaßte Wavelet-Basen abgestellt werden. Der Einsatz von einfachen Haar-Wavelets im Lokalisierungsschritt ermöglicht ein fehlertolerantes, robustes und rasches Auffinden der signifikanten Punkte, während die anschließende Auswertung der aufgefundenen Punkte mit Hilfe von detailreichen gekrümmten Gabor-Wavelets genau und treffsicher erfolgt. Die Fehlerrate des Verfahrens kann damit wesentlich gesenkt werden. Die Jet-Generierung auf Basis von Haar-30 Wavelets benötigt nur äußerst geringe Rechenleistung, wobei die erzielte Einsparung den zusätzlichen Rechenleistungsbedarf für die gesonderte Jet-Extraktion im zweiten Schritt bei weitem überwiegt. Der Rechenbedarf des gesamten Verfahrens ist damit wesentlich geringer als bei den bekannten Verfahren, und dies bei gleichzeitig höherer Treffsicherheit. Der geringe Rechenleistungsbedarf ermöglicht erstmals praktische Realisierungen mit langsamen, lüfterlosen Prozessoren, was 35 einen industriellen Einsatz in breiterem Umfang, beispielsweise für Sicherheitsschleusen oder Schlösser mit Onboard-Prozessoren, in greifbare Nähe rückt.
Eine bevorzugte Ausführungsform der Erfindung zeichnet sich dadurch aus, daß für jeden signifikanten Punkt die Koordinatenermittlung im ersten Schritt durch Ähnlichkeitsvergleich mit einem Bündel von ersten Wavelet-Jets verschiedener Referenzbilder erfolgt. Ein solcher Bündelvergleich 40 ist aus den genannten Arbeiten von Bolme und Wiskott et al. an sich bekannt und verbessert die Lokalisierung der signifikanten Punkte in dem zu untersuchenden Objektbild.
Besonders vorteilhaft ist es, wenn gemäß einem weiteren Merkmal der Erfindung als Haar-Wavelet-Basis eine Lienhart-Maydt-Basis verwendet wird, bevorzugt in mehreren Skalierungsschritten, besonders bevorzugt in 24 Skalierungsschritten. 45 Unter einer Lienhart-Maydt-Basis wird in der vorliegenden Beschreibung der von Rainer Lienhardt und Jochen Maydt in der Arbeit „An Extended Set of Haar-Like Features for Rapid Object Detection“, Intel Laboratories, 2002, vorgeschlagene Satz von 14 bzw. 15 Haar-Funktionen zur schnellen Objekterkennung verstanden, welcher u.a. auf Arbeiten von Papageorgiou et al. und Viola et al. zurückgeht. 50 Bevorzugt wird die Lienhart-Maydt-Basis in mehreren Skalierungsschritten angewandt, um die Genauigkeit der Lokalisierung zu erhöhen, ohne den Rechenleistungsbedarf des gesamten Verfahrens signifikant zu erhöhen. In der Praxis hat sich ein Wert von 24 Skalierungsschritten als besonders günstig erwiesen.
Ein weiteres bevorzugtes Merkmal der Erfindung besteht darin, daß als Gabor-Wavelet-Basis 55 Wavelets der Funktion 2 5 AT 007 635 U1 mit ψ{κ, y,C, 0. λ, φ, σ, γ) = e
<2ΠΗ χ = xcos(0)+ysin(©)+y 2C, y = -xsin(0)+ ycos(0) 10 und dem Parametersatz C = {0,±0.04 +0.07 +0.1},
/1 = (4.4^2.8,8^.16}.
σ = λ, 7 = 1-0, 15 20 verwendet werden. Mit diesem Parametersatz ergibt sich eine Basis von 800 Gabor-Wavelets, 25 von denen 700 gekrümmt sind. Dies führt zu einer äußerst detailreichen, genauen Analyse der Bildbereiche in der Umgebung der signifikanten Punkte. Aufgrund der gewählten Krümmungen ist die erfindungsgemäße Wavelet-Basis an Gesichtskonturen besonders gut angepaßt und damit für die Gesichtserkennung besonders gut geeignet.
Ein weiterer Aspekt der Erfindung ist eine Programmlogik, welche ein Verfahren der vorgestell-30 ten Art implementiert.
Die Erfindung wird nachstehend anhand eines in den beigeschlossenen Zeichnungen dargestellten Ausführungsbeispieles näher erläutert. In den Zeichnungen zeigt
Fig. 1 ein Flußdiagramm des Verfahrens bzw. der Programmlogik der Erfindung,
Fig. 2 eine Lienhart-Maydt-Basis von Haar-Wavelets und 35 Fig. 3 einige beispielhafte Wavelets der Basis von gekrümmten Gabor-Wavelets.
Das in Fig. 1 dargestellte Verfahren bzw. die Programmlogik baut auf den genannten Arbeiten von Bolme, Wiskott et al. und Lienhart-Maydt auf und für eine genaue Erläuterung der theoretischen Grundlagen des Verfahrens wird auf diese Schriften verwiesen. Ziel des Verfahrens ist es, mittels digitaler Bildverarbeitung ein Objekt, z.B. ein Gesicht, ein Fahrzeug usw., in einem Bild Pobj 40 des Objektes zu erkennen, und zwar durch Ähnlichkeitsvergleich mit einem oder mehreren Referenzbildern Pref des Objektes.
Der Ähnlichkeitsvergleich erfolgt nicht durch Vergleichen des gesamten Bildes Pobj mit dem gesamten Referenbild Pref, sondern durch Vergleichen von einzelnen Bildbereichen rund um signifikante Punkte des Objektes, sog. „Landmarks“ Imj. Im Falle der Gesichtserkennung sind geeignete 45 signifikante Punkte bzw. Landmarks Irrii beispielsweise das Zentrum der Pupille des linken Auges, das Zentrum der Pupille des rechten Auges, die Nasenspitze, der linke und rechte Mundwinkel usw. Im weiteren werden M Landmarks Imj (i = 1..M) betrachtet.
Der Bildbereich P rund um einen Landmark Imj wird nicht direkt, sondern mittels Wavelet-Transformation in einem Transformationsraum J ausgewertet. Das Ergebnis der Wavelet-50 Transformation an einem Ort (x,y) wird als Jet J bezeichnet und kann als Vektor 3 55 AT 007 635 U1 c2 J =
CJ
\tNJ 10 dargestellt werden, dessen N komplexe Koeffizienten Cj den Faltungen des Bildes P am Ort (x,y) mit einem Satz von N Wavelets 'Pj entsprechen: 15 20 25 30 35 40 ci=CZ CK*.yV;(*.y>frdy· Die Menge aller N Wavelets Ψ] (] = 1..N) wird als Wavelet-Basis B der Wavelet-Transformation bezeichnet. Zurückkommend auf Fig. 1 ist das im Betrieb ablaufende Verfahren zur Objekterkennung als Ablaufteil A („runtime“) in der rechten Hälfte von Fig. 1 dargestellt und gliedert sich in einen ersten Schritt a), in welchem die Landmarks lm0bj.i im Objektbild Pobj lokalisiert werden, und einen zweiten Schritt b), in welchem Jets J0bjj an den Landmarks lmobj,i extrahiert und mit Jets Jref,i,s eines oder mehrerer Referenzbilder Pref(S verglichen werden, um die Objekterkennung („match“) durchzuführen. In einem vorhergehenden Trainingsteil T des Verfahrens werden die für die Schritte a) und b) des Ablaufteiles A erforderlichen Referenzdaten ermittelt und bereitgestellt. Es versteht sich, daß der Trainingsteil T nur ein Mal für eine Vielzahl von Ablaufteilen A durchlaufen werden muß und auch in großem zeitlichen Abstand zu letzterem liegen kann; zum besseren Verständnis werden die Teile T und A jedoch im weiteren gleichzeitig erläutert. Im Trainingsteil T werden für den Schritt a) in einem Satz von R Referenzbildern Pbibr (r = 1..R) in jedem einzelnen Referenzbild die Koordinaten Irnman.i.r vorgegebener Landmarks Irrij manuell ermittelt, beispielsweise durch manuelles Markieren der Pupillenzentren, der Nasenspitze usw. mit Hilfe eines interaktiven Bildbearbeitungswerkzeuges. Im Block 10 werden aus jedem Referenzbild Pbib,r am Ort jedes Landmarks lmmanij,r Jets Jbib>i,r generiert, und zwar auf Grundlage einer Wavelet-Basis BH aus N Haar-Wavelets ΨΗ^ (j = 1 ..N). Die Haar-Wavelets können an sich aus jeder beliebigen Haar-Funktion aufgebaut sein. Bevorzugt wird jedoch als Haar-Wavelets eine Lienhart-Maydt-Basis von 15 bzw. 14 Haar-Wavelets verwendet, welche in Fig. 2 in ihrer Struktur graphisch dargestellt ist und eine normierte Ausdehnung von 3 x 3 bis 3 x 5 Pixeln besitzt. Die Haar-Wavelets der Lienhart-Maydt-Basis BH von Fig. 2 können in beliebiger Skalierung verwendet werden; bevorzugt werden sie gleichzeitig in mehreren, insbesondere 24 Skalierungsschritten von 1- bis 24-facher Größe eingesetzt, so daß die gesamte Anzahl N an Haar-Wavelets ΨΗ.ί in der Basis BH 14 x 24 = 336 beträgt. Das Ergebnis der Jet-Extraktion von Block 10 wird als Referenzdatensatz Gbjb gespeichert und dem Ablaufteil A zur Verfügung. Der Referenzdatensatz Gbib kann als Matrix 45 50 'Ai A,2 Ar 1 > J1 ,R 'V A,1 A,2 b2 Gbib ~ Al Ar — bi ,Ά,1 JM,R, geschrieben werden und stellt gleichzeitig einen Spaltenvektor von M Bündeln bj (i = 1..M) von Jets, sog. „bunches“, für jeden Landmark Im, dar. Der Referenzdatensatz Gbib wird daher auch als 55 „Bunch Graph“ bezeichnet. 4 AT 007 635 U1
Im Ablaufteil A sind die genauen Koordinaten (x,y) der gewählten Landmarks Ιπη (linkes Pupillenzentrum, rechtes Pupillenzentrum usw.) im Objektbild P0bj zunächst nicht bekannt und werden durch Anfangswerte und/oder Schätzungen lmest.i ersetzt. Im Block 20 werden am Ort der geschätzten Landmarks lmest<i Jets Jesu extrahiert, und zwar auf Grundlage derselben Wavelet-Basis 5 Bh, die im Block 10 zur Erzeugung der Referenzdaten verwendet und anhand von Fig. 2 erläutert wurde.
In einem anschließenden Block 30 werden die tatsächlichen bzw. aktuellen Koordinaten (x,y) der Landmarks Inrij des Objektbildes P0bj lokalisiert. Dazu werden die Jets Jesu an den geschätzten Landmarks lmesu des Objektbildes Pobj mit den Jets Jbib,i,r des Bunch Graphs Gbib verglichen. 10 Soferne mehrere Referenzbilder Pbib,r zugrunde gelegt wurden (R > 1), d.h. der Bunch Graph Gbjb aus Bündeln bj von Jets für jeden Landmark Irrij besteht, wird jeweils der ähnlichste Jet aus einem Bündel bj für einen bestimmten Landmark Ιιτΐ( zum Vergleich herangezogen. Dies kann beispielsweise für den ersten Landmark Im! (z.B. „linkes Pupillenzentrum“) ein vom dritten Referenzbild Pbib,3 stammender Jet J13 sein, für den zweiten Landmark lm2 (z.B. „rechtes Pupillenzent-15 rum“) ein vom ersten Referenzbild Pbib,i stammender Jet J2t1 usw., wodurch für den Vergleich das jeweils „passendste“ Auge, die jeweils „passendste“ Nase usw. herangezogen wird.
Der Vergleich im Block 30 kann auf verschiedene in der Technik bekannte Arten durchgeführt werden, soferne daraus die örtliche Abweichung des tatsächlichen Landmarks lmobjJ vom geschätzten Landmark lmest.i ermittelt werden kann. Beispielsweise könnten die Jets von allen Punkten in 20 einer Umgebung des geschätzten Landmarks aus dem Objektbild extrahiert und mit den entsprechenden Referenz-Jets des Referenzbildes auf maximale Ähnlichkeit verglichen werden.
Ein von Bolme vorgeschlagenes, besonders rasch zu berechnendes Verfahren beruht auf einer
Schätzung des Jets J'j in einem Abstand d vom geschätzten Landmark lmest.j durch Anwendung der Näherung, daß sich ein Jet J' in einem geringen Abstand von einem Jet J vorwiegend in sei-25 nem Phasenversatz unterscheidet:
In Polarkoordinatendarstellung
30 kann ein Jet 35 in einem Abstand 40 von einem vorgegebenen Jet 45 50 angenähert werden zu
Ci J =
KcnJ 5 55 5 mit 10 15 20 25 30 AT 007 635 U1 aj ~ a j tp'j*<Pj+kj-d 2T\cosej' kJ = 2nsin0y und 6j... Orientierung des Wavelets Ψ] Aj... Wellenlänge des Wavelets Ψί. Durch Variieren des Abstandsvektors d solange, bis der Umgebungsjet J’ maximale Ähnlichkeit mit dem Jet J des gesuchten Landmarks Irrij hat, können der Abstandsvektor d und damit die aktuellen Koordinaten lm0bj.i des Landmarks Imj im Objektbild Pobj ermittelt werden. Das Variieren des Abstandsvektors d kann mit allen in der Technik bekannten Suchalgorithmen durchgeführt werden, z.B. mittels Grid-Sample-, Predictive-Step-, Predictive-Iteration-, Fixed-Local-Search- oder Narrowing-Local-Search-Algorithmen, wie z.B. in der Arbeit von Bolme erörtert. Für den Ähnlichkeitsvergleich zweier Jets, wie der Jets J und J\ kann ebenfalls jedes in der Technik bekannte Ähnlichkeitsmaß verwendet werden, beispielsweise ein betragsmäßiges Korrelationsmaß
oder ein auch den Phasenversatz berücksichtigendes Korrelationsmaß 35 Σ"ιa;a'/cos(^-<?';) iEL,aiZ",a'/
Wird in letztere Gleichung die obige Phasenabschätzung für den Umgebungsjet J' im Abstand 40 d eingesetzt, kann letzteres Ähnlichkeitsmaß auch geschrieben werden als 45 bzw. durch Taylorreihenentwicklung noch weiter genähert als
Durch Variieren des Abstandsvektors d mittels der genannten Suchalgorithmen im Hinblick auf eine Maximierung des Ähnlichkeitsmaßes S9 kann somit der Versatz d des geschätzten Ortes lmesU vom richtigen Ort lmobj.i des Landmarks Imi und damit der Landmark lmobjii im Objektbild Pobj 55 lokalisiert werden. 6 5 10 15 20 25 30 35 40 45 50 AT 007 635 U1
Das Ergebnis des Blocks 30 ist somit eine Liste mit allen im Objektbild Pobj lokalisierten Landmarks lmobj i, beispielsweise in der Form lmobjii x-Position y-Position linksaugenmitte 41.047727 49.115525 rechtsaugenmitte 90.913636 49.852737 nasenbrücke 67.162529 38.257454 usw. Auf Grundlage der im Schritt a) lokalisierten Landmarks lmobi,j kann nun im Schritt b) der Ähnlichkeitsvergleich des Objektbildes Pobj mit einem bestimmten Referenzbild Pref („Verifizierung eines Objektes“) oder mit mehreren Referenzbildern Pref s (s = 1..S) („Identifizierung eines Objektes unter mehreren“) erfolgen. Es ist zu beachten, daß die in Schritt b) verwendeten Referenzbilder Pret,s dieselben sein können wie die Referenzbilder Pbib,r von Schritt a) oder auch nicht. So können beide Sätze von Referenzbildern ident sein, oder aber der erste Satz von Referenzbildern Pi)ib,r ist z.B. eine umfangreiche Bibliothek repräsentativer Gesichtsformen, -färben, Brillen- und Bartaccessoires usw., während der zweite Satz von Referenzbildern Pref,s nur das oder die zu verifizierende(n) oder identifizierendein) Objekt(e) umfaßt. im Trainingsteil T werden im Block 40 für den Schritt b) aus den Referenzbildern Pref,s an manuell selektierten Landmarks lmman,i,s Jets Jreus extrahiert, u.zw. auf Grundlage einer Wavelet-Basis Bb, welche einen Satz von Ν' Gabor-Wavelets ΨΒι, umfaßt, von denen die Mehrzahl gekrümmt ist. Unter gekrümmten Gabor-Wavelets („Banana-Wavelets“) werden Wavelets der allgemeinen Gleichung *2+r2y2 f ^ ψ(χ, y, C, Θ,λ,φ,σ,χ) = β 2σ cosl2ri— + φ mit x = xcos(@)+ysin(ö)+y 2C y = -xsin(©)+ ycos(ö) verstanden, wobei C .. Krümmung des Wavelets Θ.. Orientierung des Wavelets λ.. Wellenlänge der Sinusoidfunktion φ.. Phasenverschiebung σ.. Radius der einhüllenden Gaußkurve γ .. Seiten/Höhen-Verhältnis des Wavelets ist. Einige beispielhafte Wavelets ΨΒϋ sind in Fig. 3 gezeigt. Bevorzugt wird zur Erzeugung der Wavelet-Basis Bb der folgende Parametersatz gewählt: C = (0+0.04,±0.07,±0.1}, β-Κ·χ·χ- λ = {4,472,8,872,16},
σ= λ und r= ίο. 7Π ' 8 7 55
Claims (1)
- AT 007 635 U1 Dies führt zu 700 gekrümmten und 100 geradlinigen Gabor-Wavelets, d.h. Ν' = 800, und damit zu einer äußerst detailreichen Bildanalyse. Die Jets Jref.i.s an den Landmarks lmman,i,s der Referenzbilder Pref.s werden in einem Referenzdatensatz Gret für den Ablaufteil A zur Verfügung gestellt. Der Referenzdatensatz Gref umfaßt für jedes 5 Referenzbild P^s einen sogenannten „Face-Graphen“ Gs: 10 Gref = *A,1 *A,2 ^2,1 ^2,2 Ά',1 JM,S = (G1 G2 Gs Gs) 15 Im Ablaufteil A des Verfahrens wird nun im Block 50 für jeden lokalisierten Landmark lmobj.j des Objektbildes P0bj ein Jet J0bj,i extrahiert, und zwar auf Grundlage derselben Gabor-Wavelet-Basis Bb, welche im Extraktionsblock 40 des Trainingsteiles T verwendet und anhand von Fig. 3 erläutert wurde. In einem anschließenden Block 60 wird der Ähnlichkeitsvergleich zwischen den Jets J0bj.· des 20 Objektbildes Pobj und den Jets Jref.i.s des Referenzdatensatzes Gref durchgeführt. Als Ähnlichkeitsmaße für die Bestimmung der Ähnlichkeit zweier Jets Jobj,j und J^.i.s können beliebige Korrelationsmaße herangezogen werden, bevorzugt das obengenannte Phasenmaß 25 {^obj' ^ref) —30bj.jaref.jCOS\Dabei kann ein Gesamtähnlichkeitsmaß Svses zwischen allen Landmarks Inij des Objektbildes 30 Pobj und einem bestimmten Referenzbild Pref,s verwendet werden, beispielsweise durch Mittelwertbildung über die Ähnlichkeitsmaße S<piiiS der Landmarks lm( bezüglich eines bestimmten Referenzbildes Pref,s: 1 M G<p,ges,s =77 Σ^·*' 35 i=1 Älternativ oder zusätzlich könnten auch die geometrischen Abweichungen zwischen den Landmarks eines bestimmten Referenzbildes Pref,s und den Landmarks des Objektbildes Pobj in das Ähnlichkeitsmaß eingehen. 40 Wird das Verfahren zur Verifikation eines Objektes, z.B. Gesichts, eingesetzt, d.h. zum Vergleich mit einem einzigen Referenzbild Pret oder mit einem Satz von verschiedenen Referenzbildern Pref,s ein und desselben Objekts, wird als Ausgang des Blocks 60 eine Verifikation („match“) angezeigt, wenn das im Block 60 ausgewertete Ähnlichkeitsmaß einen vorgegebenen Schwellwert überschreitet. 45 Wird hingegen das Verfahren zur Identifikation eines Objektes unter mehreren möglichen Objekten verwendet, z.B. zur Identifikation des Gesichts eines Benutzers von mehreren möglichen Benutzern, von denen jeweils ein oder auch mehrere Referenzbilder Pref,s vorliegen, wird als Ausgang des Blocks 60 dasjenige Objekt bzw. Gesicht identifiziert („match“), dessen Ähnlichkeitsmaß das aller anderen übersteigt. 50 Die Erfindung ist nicht auf die dargestellten Ausführungsformen beschränkt, sondern umfaßt alle Varianten und Modifikationen, die in den Rahmen der angeschlossenen Ansprüche fallen. 8 55
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| AT0054004U AT7635U1 (de) | 2004-07-28 | 2004-07-28 | Verfahren und programmlogik zur objekterkennung |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| AT0054004U AT7635U1 (de) | 2004-07-28 | 2004-07-28 | Verfahren und programmlogik zur objekterkennung |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| AT7635U1 true AT7635U1 (de) | 2005-06-27 |
Family
ID=34427254
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| AT0054004U AT7635U1 (de) | 2004-07-28 | 2004-07-28 | Verfahren und programmlogik zur objekterkennung |
Country Status (1)
| Country | Link |
|---|---|
| AT (1) | AT7635U1 (de) |
-
2004
- 2004-07-28 AT AT0054004U patent/AT7635U1/de not_active IP Right Cessation
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69833999T2 (de) | Verfahren zur automatischen erkennung menschlicher augen in digitalbildern | |
| DE69914370T2 (de) | Bestimmung von gesichtsunterräumen | |
| Fellous | Gender discrimination and prediction on the basis of facial metric information | |
| DE69333811T2 (de) | Verfahren und Gerät zur Erzeugung und Einstellung eines Neurones | |
| DE102017220896A1 (de) | Verfahren und Vorrichtung zur Sicherheitskontrolle | |
| EP3657440A1 (de) | Verfahren und system zur dreidimensionalen rekonstruktion eines menschlichen kopfes aus mehreren bildern | |
| DE102021201777A1 (de) | Verfahren zur Verhaltenserkennung, Vorrichtung zur Verhaltenserkennung und computerlesbares Aufzeichnungsmedium | |
| DE112019002848T5 (de) | System und verfahren zum auffinden und klassifizieren von mustern in einem bild mit einem bildverarbeitungssystem | |
| DE102022110889A1 (de) | Halbüberwachtes training grober labels bei bildsegmentierung | |
| DE112021003342T5 (de) | Vorrichtung und verfahren zur bestimmung von emotionen | |
| WO2008034646A1 (de) | Verfahren und vorrichtung zum erkennen eines gesichts sowie ein gesichtserkennungsmodul | |
| WO2012013186A2 (de) | Verfahren und vorrichtung zur bestimmung der augentorsion | |
| DE102013206920B4 (de) | Detektion eines komplexen Objekts unter Verwendung einer Kaskade vonKlassifizierungseinrichtungen | |
| DE10260642A1 (de) | Verfahren zur Erstellung einer Referenz für Fingerprints und zum Vergleich von Fingerprints | |
| Shao et al. | Unsupervised trajectory segmentation and promoting of multi-modal surgical demonstrations | |
| AT414311B (de) | Verfahren zur objekterkennung | |
| AT7635U1 (de) | Verfahren und programmlogik zur objekterkennung | |
| DE102018121317A1 (de) | Verfahren und Vorrichtung zur Schätzung einer durch eine Freiraumgeste vermittelten Richtungsinformation zur Bestimmung einer Benutzereingabe an einer Mensch-Maschine-Schnittstelle | |
| EP1402460B1 (de) | Automatische identifikation und/oder verifikation linienhafter texturen wie fingerabdrücke | |
| EP3214602A1 (de) | Verfahren zur dreidimensionalen erfassung von objekten | |
| DE10126375B4 (de) | Verfahren und System zur Erkennung von Objekten | |
| DE102023114634B4 (de) | Trainingsdaten zur erkennung von bildmorphing | |
| Islam et al. | Human authentication process using finger knuckle surface with artificial neural networks based on a hybrid feature selection method | |
| DE102024200029A1 (de) | Fahrzeug, Einrichtung, Computerprogramm und Verfahren zum Einbetten und Bewerten von visuellen Konzepten innerhalb des latenten Merkmalsraums von Objektdetektoren, die auf die Verbesserung der Sicherheit und Zuverlässigkeit autonomer Systeme zielen | |
| DE102012103738A1 (de) | Suche des optimalen Gradienten für die Bildausrichtung |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| MM9K | Lapse due to non-payment of renewal fee |