DE60037497T2 - Verfahren und vorrichtung für anzeige oder auswahl von einem objekt in einem bild oder einem computerlesbaren aufzeichnungsmedium - Google Patents

Verfahren und vorrichtung für anzeige oder auswahl von einem objekt in einem bild oder einem computerlesbaren aufzeichnungsmedium Download PDF

Info

Publication number
DE60037497T2
DE60037497T2 DE60037497T DE60037497T DE60037497T2 DE 60037497 T2 DE60037497 T2 DE 60037497T2 DE 60037497 T DE60037497 T DE 60037497T DE 60037497 T DE60037497 T DE 60037497T DE 60037497 T2 DE60037497 T2 DE 60037497T2
Authority
DE
Germany
Prior art keywords
image
css
representation
images
contour
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60037497T
Other languages
English (en)
Other versions
DE60037497D1 (de
Inventor
Miroslaw Z. Guildford BOBER
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE60037497D1 publication Critical patent/DE60037497D1/de
Application granted granted Critical
Publication of DE60037497T2 publication Critical patent/DE60037497T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Eye Examination Apparatus (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Holo Graphy (AREA)
  • Processing Or Creating Images (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung betrifft die Darstellung eines Objekts, das in einem Einzelbild oder einem Videobild, wie z. B. einem in einer Multimediadatenbank abgelegten Bild, erscheint, insbesondere zu Suchzwecken sowie ein Verfahren und eine Vorrichtung für die Suche eines Objektes unter Verwendung einer solchen Darstellung.
  • STAND DER TECHNIK
  • In Anwendungsfällen wie z. B. Bild- oder Videobibliotheken ist es erstrebenswert, über eine effiziente Darstellung und Speicherung der Kontur oder Form von Objekten oder Teilen von Objekten, die in Einzel- oder Videobildern erscheinen, zu verfügen. Eine bekannte Methode für das Indizieren und Wiederfinden auf Formbasis benutzt eine Darstellung im Krümmungs-Skalenraum („Curvature Scale Space", engl. „CSS"). Einzelheiten zur CSS-Darstellung sind in den Veröffentlichungen „Robust and Efficient Shape Indexing through Curvature Scale Space", Proc. British Machine Vision conference, S. 53–62, Edinburgh, UK, 1996 und „Indexing an Image Database by Shape Content using Curvature Scale Space", Proc. IEE Colloquium an Intelligent Databases, London, 1996, beide von F. Mokhtarian, S. Abbasi und J. Kittler, nachzulesen.
  • Die CSS-Darstellung benutzt eine Krümmungsfunktion für die Kontur des Objekts, ausgehend von einem beliebigen Punkt auf der Kontur. Die Konturform wird durch eine Reihe von Deformationen evolviert, die die Form glätten, und dabei wird die Krümmungsfunktion untersucht. Im Speziellen werden die Nulldurchgänge der Ableitung der mit einer Familie von Gauß-Filtern gefalteten Krümmungsfunktion berechnet. Die Nulldurchgänge werden in einem Schaubild aufgetragen, das man Krümmungs-Skalenraum nennt (engl. „Curvature Scale Space", abgekürzt „CSS"), wobei auf der x-Achse die normierte Bogenlänge der Kurve und auf der y-Achse der Evolutionsparameter, im Speziellen der Parameter des angewendeten Filters, aufgetragen werden. Die Auftragungen in dem Schaubild bilden Schlingen aus, die für die Kontur charakteristisch sind. Jeder konvexe oder konkave Teil der Objektkontur entspricht einer Schlinge in dem CSS-Bild. Die Koordinaten der Spitzen der markantesten Schlingen in dem CSS-Bild werden als Darstellung der Kontur benutzt.
  • Um in Bildern, die in einer Datenbank gespeichert sind, nach Objekten zu suchen, die zu der Form eines eingegebenen Objektes passen, wird die CSS-Darstellung des eingegebenen Objektes berechnet. Die Ähnlichkeit zwischen einer eingegebenen Form und gespeicherten Formen wird bestimmt, indem Position und Höhe der Spitzen in den jeweiligen CSS-Bildern unter Verwendung eines Zuordnungsalgorithmus verglichen werden.
  • Aus der ersten oben genannten Veröffentlichung ist außerdem bekannt, zwei zusätzliche Parameter, die Zirkularität und die Exzentrizität der ursprünglichen Form, zu benutzen, um Formen aus dem Zuordnungsprozess auszuschließen, deren Zirkularitäts- und Exzentrizitätsparameter wesentlich abweichen.
  • Ein Problem mit der obenstehend beschriebenen Darstellung besteht darin, dass die Genauigkeit beim Wiederfinden bisweilen schlecht ist, insbesondere für Kurven mit einer kleinen Anzahl von Konkavitäten oder Konvexitäten. Insbesondere kann die Darstellung nicht zwischen verschiedenen konvexen Kurven unterscheiden.
  • Unter einem Aspekt führt die vorliegende Erfindung ein zusätzliches Mittel zum Beschreiben der Form der „Form des Prototypumrisses" ein. Die Form des Prototypumrisses wird hier vorzugsweise definiert als:
    • 1. die ursprüngliche Form, falls es in dem Umriss keine Konvexitäten oder Konkavitäten gibt (d. h., das CSS-Bild keine Spitzen aufweist), oder
    • 2. der Umriss der Form nach dem Glätten entsprechend der höchsten Spitze im CSS-Bild.
  • Man beachte, dass die Form des Prototypumrisses stets konvex ist.
  • Die Form des Umrisses des Prototyps lässt sich zum Beispiel mit Hilfe der Invarianten auf Basis von Regionsmomenten beschreiben, wie in der Veröffentlichung „Visual Pattern Recognition by Moments Invariants", IEEE Transaction an Information Theory, Bd. IT-8, 179–187, 1962 von M. K. Hu nachzulesen ist, oder sie lässt sich unter Verwendung der Fourierdeskriptoren beschreiben, wie in der Veröffentlichung „On Image Analysis by the Methods of Moments", IEEE Transactions an Pattern Analysis and Machine Intelligence, Bd. 10, Nr. 4, Juli 1988 von Cho-Huak The nachzulesen ist, oder unter Verwendung von Parametern wie Exzentrizität, Zirkularität etc. Bei dem obenstehend erwähnten bekannten Verfahren werden die Exzentrizität und die Zirkularität nur in Bezug auf die ursprüngliche Form benutzt. Hier benutzen wir sie in Bezug auf eine „Prototypform", die bei Kurven mit mindestens einer CSS-Spitze anders ist. Ein weiterer Unterschied ist, dass bei dem bekannten Verfahren die Exzentrizität und die Zirkularität benutzt werden, um bestimmte Formen von dem Ähnlichkeitsvergleich auszuschließen, während wir sie hier (zusätzlich zu den CSS-Spitzen) dazu benutzten, um den Wert des Ähnlichkeitsmaßes abzuleiten. Schließlich weiten wir die zusätzlichen Parameter, die bei dem Vergleichsvorgang benutzt werden, auf die Momenteninvarianten, Fourierdeskriptoren und Zernike-Momente aus.
  • Dank der Erfindung lässt sich die Genauigkeit beim Wiederfinden verbessern.
  • Die Erfindung schafft ein Verfahren zur Darstellung eines Objekts, das in einem Bild oder einer Bildersequenz erscheint, gemäß Anspruch 1.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein Blockdiagramm eines Videodatenbanksystems,
  • 2 ist eine Zeichnung einer Kontur eines Objekts und
  • 3 ist eine CSS-Darstellung der Kontur aus 2.
  • BESTE AUSFÜHRUNGSFORM DER ERFINDUNG
  • Erste Ausführungsform
  • 1 zeigt ein computerisiertes Videodatenbanksystem gemäß einer Ausführungsform der Erfindung. Das System weist eine Steuereinheit 2 in Form eines Computers, eine Anzeigeeinheit 4 in Form eines Monitors, eine Zeigeeinheit 6 in Form einer Maus, eine Bilddatenbank 8 mit gespeicherten Einzel- und Videobildern und eine Deskriptorendatenbank 10 mit gespeicherten Deskriptoren von Objekten oder Teilen von Objekten, die in den Bildern erscheinen, welche in der Bilddatenbank 8 gespeichert sind.
  • Die Steuereinheit 2 leitet Deskriptoren für die Formen der einzelnen, in einem Bild in der Bilddatenbank erscheinenden Zielobjekte ab und speichert sie in der Deskriptorendatenbank 10. Die Steuereinheit 2 leitet die Deskriptoren ab, indem sie unter der Steuerung eines geeigneten Programms arbeitet, welches ein Verfahren wie nachstehend beschrieben implementiert.
  • Zuerst wird für eine gegebene Objektkontur eine CSS-Darstellung der Kontur abgeleitet. Dies erfolgt unter Verwendung des in einer der zuvor erwähnten Veröffentlichungen beschriebenen bekannten Verfahrens.
  • Spezieller wird die Kontur durch eine Darstellung Ψ = {(x(u), y(u), u ∈ [0, 1]} ausgedrückt, wobei u ein normierter Bogenlängenparameter ist.
  • Die Kontur wird geglättet, indem Ψ mit einem 1D-Gaußkern g(u, σ) gefaltet wird, und es wird untersucht, wie sich die Nulldurchgänge der Krümmung der evolvierenden Kurve bei sich änderndem σ verändern. Die Nulldurchgänge werden mit Hilfe des folgenden Ausdrucks für die Krümmung ermittelt:
    Figure 00050001
    wobei X(u, σ) = x(u)*g(u, σ) Y(u, σ) = y(u)*g(u, σ)und Xu(u, σ) = x(u)*gu(u, σ) Xuu(u, σ) = x(u)* guu(u, σ).
  • Oben steht * für eine Faltung, und tiefgestellte Indizes stehen für Ableitungen.
  • Die Anzahl der Nulldurchgänge der Krümmung ändert sich mit sich änderndem σ, und bei hinreichend großem σ wird Ψ zu einer konvexen Kurve ohne Nulldurchgänge.
  • Die Nulldurchgangspunkte (u, σ) werden in einem Schaubild aufgetragen, das als der CSS-Bildraum bekannt ist. Dies ergibt mehrere Kurven, die für die ursprüngliche Kontur charakteristisch sind. Die Spitzen der charakteristischen Kurven werden identifiziert und die zugehörigen Koordinaten extrahiert und gespeichert. Allgemein ausgedrückt erhält man auf diese Weise eine Menge aus n Koordinatenpaaren [(x1, y1), (x2, y2), ... (xn, yn)] mit n: Anzahl der Spitzen; xi: Bogenlängenposition der i-ten Spitze; yi: Höhe der Spitze. Diese Spitzenkoordinaten bilden die CSS-Darstellung.
  • Zusätzlich zu der CSS-Darstellung werden der Form weitere Parameter zugeordnet, um den Formdeskriptor (Shape Descriptor) zu erzeugen. Bei dieser Ausführungsform handelt es sich bei den zusätzlichen Parametern um die Exzentrizität und die Zirkularität der „Prototypregion" für die Form, wobei es sich bei der „Prototypregion" der Form um den Umriss der Form nach dem letzten Glättungsschritt handelt, d. h., an dem Punkt, der dem höchsten Spitzenwert σ äquivalent ist. Es können auch andere Werte für σ für die Prototypregion gewählt werden. Es ergibt sich hierdurch für eine Form S ein Formdeskriptor in der Form: {EPR, ZPR, SPITZEN}, mit: EPR: Exzentrizität der Prototypregion; ZPR: Zirkularität der Prototypregion; SPITZEN: CSS-Darstellung.
  • Es wird nun ein Verfahren zum Suchen nach einem Objekt in einem Bild beschrieben.
  • Die Deskriptorendatenbank 10 des Systems aus 1 speichert hierbei Formdeskriptoren, die gemäß dem oben beschriebenen Verfahren abgeleitet wurden.
  • Der Benutzer startet eine Suche, indem er mit Hilfe einer Zeigevorrichtung eine Objektkontur auf der Anzeige zeichnet. Die Steuereinheit 2 leitet daraufhin auf die obenstehend beschriebene Weise einen Formdeskriptor der einge gebenen Kontur ab. Anschließend führt die Steuereinheit einen Übereinstimmungsvergleich mit den einzelnen Formdeskriptoren aus, die in der Datenbank gespeichert sind.
  • Angenommen, die eingegebene Kontur, Form S1, wird mit einer gespeicherten Form S2 vergleichen, wobei S1 und S2 die jeweiligen Formdeskriptoren sind:
    • S1: {EPR1, ZPR1, SPITZEN1}
    • S2: {EPR2, ZPR2, SPITZEN2}
    mit EPR: Exzentrizität der Prototypregion; ZPR: Zirkularität der Prototypregion; SPITZEN: Menge der Koordinaten der Spitzen im CSS-Bild (die Menge kann leer sein). Das Ähnlichkeitsmaß zweier Formen wird wie folgt berechnet: M = a*abs((EPR2 – EPR1)/(EPR2 + EPR1)) + b*abs((ZPR2 – ZPR1)/((ZPR2 + ZPR1)) + SM(SPITZEN1, SPITZEN2)mit a, b: zwei Koeffizienten; SM: das auf den zwei Spitzenmengen [1] definierte Standard-Ähnlichkeitsmaß; abs: Absolutwert (Betrag). SM wird mit einem bekannten Zuordnungsvergleichsalgorithmus berechnet, etwa kann ein Algorithmus benutzt werden, wie er in den obenstehend erwähnten Veröffentlichungen beschrieben wird. Nachstehend wird kurz die Zuordnungsvergleichsprozedur beschrieben.
  • Ausgehend von zwei geschlossenen Umrissformen, der Bildkurve Ψi und der Modellkurve Ψm und ihren jeweiligen Spitzenmengen {(xi1, yi1), (xi2, yi2), ..., (xin, yin)} und {(xm1, ym1), (xm2, ym2), ..., (xmn, ymn)} wird das Ähnlichkeitsmaß berechnet. Das Ähnlichkeitsmaß ist über die Gesamtkosten der Zuordnung der Spitzen im Modell zu Spitzen im Bild definiert. Mit Hilfe einer dynamischen Programmierung wird diejenige Zuordnung ermittelt, die die Gesamtkosten minimiert. Der Algorithmus ordnet die Spitzen aus dem Modell rekursiv den Spitzen aus dem Bild zu und berech net die Kosten für jede solche Zuordnung. Jede Modellspitze kann nur einer Bildspitze zugeordnet werden, und jede Bildspitze kann nur einer Modellspitze zugeordnet werden. Einige Spitzen aus Bild oder Modell können ohne Übereinstimmung (nicht zugeordnet) übrig bleiben. Für jede solche nicht zugeordnete Spitze fallen zusätzliche Strafkosten an. Zwei Spitzen können zugeordnet werden, wenn ihr horizontaler Abstand kleiner als 0,2 ist. Die Kosten einer Zuordnung entsprechen der Länge der geradlinigen Strecke zwischen den beiden zugeordneten Spitzen. Die Kosten für eine nicht zugeordnete Spitze entsprechen der Höhe dieser Spitze.
  • Genauer gesagt funktioniert der Algorithmus durch Erstellung und Entwicklung einer baumartigen Struktur, wobei Knoten zugeordneten Spitzen entsprechen:
    • 1. Erstelle den Startknoten, der aus dem größten Maximum des Bilds (xik, yik) und dem größten Maximum des Modells (xir, yir) besteht.
    • 2. Erstelle für jede verbleibende Modellspitze, die mindestens 80% des größten Maximums der Bildspitzen erreicht, einen zusätzlichen Startknoten.
    • 3. Initialisiere die Kosten für jeden der in Schritt 1 und 2 erstellten Startknoten auf den Betrag der Differenz zwischen der y-Koordinate der Bildspitze und der Modellspitze, die durch diesen Knoten miteinander verknüpft werden.
    • 4. Berechne für jeden Startknoten in 3 den CSS-Verschiebungsparameter alpha, der als die Differenz der (horizontalen) x-Koordinaten der Modellspitze und der Bildspitze, die in diesem Startknoten einander zugeordnet werden, definiert ist. Für jeden Knoten ergibt sich ein anderer Verschiebungsparameter.
    • 5. Erstelle für jeden Startknoten eine Liste aus Modellspitzen und eine Liste aus Bildspitzen. Die Liste enthalten Informationen darüber, welche Spitzen noch zugeordnet werden müssen. Markiere für jeden Startknoten die in diesem Knoten zugeordneten Spitzen als „zugeordnet" und alle anderen Spitzen als „nicht zugeordnet".
    • 6. Entwickele rekursiv (ausgehend von jedem in den Schritten 1 bis 6 erstellten Knoten, gefolgt von seinen Tochterknoten) einen Knoten mit den geringsten Kosten, bis die Bedingung in Punkt 8 erfüllt ist. Benutze zum Entwickeln eines Knotens die folgende Prozedur:
    • 7. Entwickeln eines Knotens: Falls mindestens eine Bild- und eine Modellspitze übrig sind, die noch nicht zugeordnet wurden: Wähle das größte nicht zugeordnete Skalenbildkurven-CSS-Maximum (xip, yip). Wende den (in Schritt 4 berechneten) Verschiebungsparameter des Startknotens an, um das gewählte Maximum auf das Modell-CSS-Bild abzubilden – jetzt hat die gewählte Spitze die Koordinaten (xip-alpha, yip). Mache die nächstliegende Modellkurvenspitze ausfindig, die nicht zugeordnet ist (xms, yms). Falls der horizontale Abstand zwischen den beiden Spitzen weniger als 0,2 beträgt (d. h., |xip-alpha – xms| < 0,2), ordne die beiden Spitzen einander zu und definiere als Kosten für die Zuordnung die Länge der geradlinigen Strecke zwischen den beiden Spitzen. Füge die Kosten der Zuordnung den Gesamtkosten dieses Knotens hinzu. Entferne die zugeordneten Spitzen durch Markierung als „zugeordnet" aus den betreffenden Listen. Falls der horizontale Abstand zwischen den beiden Spitzen größer als 0,2 ist, kann die Bildspitze (xip, yip) nicht zugeordnet werden. In diesem Falle: Füge ihre Höhe yip den Gesamtkosten hinzu und entferne nur die Spitze (xip, yip) durch Markierung als „zugeordnet" aus der Liste der Bildspitzen. Andernfalls (es sind nur Bildspitzen oder nur Modellspitzen übrig, die nicht zugeordnet sind): Definiere die Kosten der Zuordnung als die Höhe der höchsten nicht zugeordneten Bild- oder Modellspitze, und entferne diese Spitze aus der Liste.
    • 8. Falls nach dem Entwickeln eines Knotens in 7 sowohl in der Bild- als auch in der Modellliste keine nicht zugeordneten Spitzen verblieben sind, wird die Zuordnungsprozedur beendet. Die Kosten dieses Knotens sind das Ähnlichkeitsmaß zwischen der Bildkurve und der Modellkurve. Andernfalls: Gehe zu Punkt 7 und entwickle den Knoten mit den geringsten Kosten.
  • Die Bildkurvenspitzen und die Modellkurvenspitzen werden vertauscht, und die obenstehende Prozedur wird wiederholt. Der endgültige Wert der Zuordnung ist der niedrigere der beiden.
  • Die obenstehenden Schritte werden für jedes Modell in der Datenbank wiederholt.
  • Die Ähnlichkeitsmaße, die sich aus den Zuordnungsvergleichen ergeben, werden sortiert, und die Objekte, die Deskriptoren mit Ähnlichkeitsmaßen entsprechen, welche die beste Übereinstimmung anzeigen (d. h., hier, mit den niedrigsten Ähnlichkeitsmaßen), werden dem Benutzer auf der Anzeigeeinheit 4 angezeigt. Die Anzahl der anzuzeigenden Objekte kann voreingestellt sein oder vom Benutzer ausgewählt werden.
  • Bei einer alternativen Ausführungsform können andere Parameter benutzt werden, um die Form der „Prototypregion" zu beschreiben. Zum Beispiel können drei Fourierkoeffizienten der Kurve benutzt werden. Das Ähnlichkeitsmaß kann wie folgt definiert werden: M = a*EUC(F1, F2) + SM(SPITZEN1, SPITZEN2),mit: EUC: euklidischer Abstand zwischen Vektoren E1 und F2, die aus den drei ersten Fourierkoeffizienten der Modell- und der Bildform gebildet sind; a: Konstante; SM: ein in einem Verfahren im Wesentlichen wie obenstehend beschrieben berechnetes Ähnlichkeitsmaß für die CSS-Spitzen.
  • INDUSTRIELLE ANWENDBARKEIT
  • Ein erfindungsgemäßes System kann zum Beispiel in einer Bilddatenbank vorgesehen werden. Alternativ hierzu können sich die Datenbanken an einem anderen Ort als die Steuereinheit des Systems befinden und mit der Steuereinheit über eine temporäre Verbindung wie z. B. eine Telefonleitung oder ein Netzwerk wie das Internet verbunden sein. Die Bild- und Deskriptordatenbanken können beispielsweise in einem Permanentspeicher oder auf tragbaren Datenspeichermedien wie CD-ROMs oder DVDs bereitgestellt werden.
  • Komponenten des beschriebenen Systems können in Form von Software oder Hardware bereitgestellt werden. Die Erfindung wurde zwar in Form eines Computersysteme beschrieben, könnte aber auch in anderen Formen zum Beispiel unter Verwendung eines dedizierten Chips implementiert werden.
  • Es wurden spezifische Beispiele für Verfahren zur Darstellung einer 2D-Form eines Objekts und für Verfahren zum Berechnen von Werten, welche die Ähnlichkeiten zwischen zwei Formen darstellen, angegeben, es können jedoch alle geeigneten solchen Verfahren benutzt werden.
  • Die Erfindung kann außerdem zum Beispiel zum Vergleichen von Bildern von Objekten zu Verifizierungszwecken oder zum Filtern benutzt werden.

Claims (7)

  1. Verfahren für die Darstellung eines Objekts, das in einem Bild oder einer Sequenz von Bildern erscheint, durch die Verarbeitung von Signalen, die dem Bild oder den Bildern entsprechen, wobei das Verfahren die Ableitung einer Curvature Scale Space(CSS)-Darstellung der Objektkontur durch Glätten der Objektkontur umfasst, gekennzeichnet durch die Ableitung eines zusätzlichen Parameters, bei dem es sich um die Exzentrizität einer geglätteten Version handelt, entsprechend der höchsten Spitze in dem CSS-Bild, der ursprünglichen Objektkontur, und durch die Zuordnung der CSS-Darstellung und des zusätzlichen Parameters zur Bildung eines Formdeskriptors (Shape Descriptor) des Objekts.
  2. Verfahren für die Darstellung mehrerer Objekte, die in einem Bild oder einer Bildsequenz erscheinen, durch die Verarbeitung von Signalen, die dem Bild oder den Bildern entsprechen, wobei das Verfahren für jede Objektkontur die Bestimmung, ob mindestens eine Spitze in dem CSS-Bild vorhanden ist, umfasst, und dann, wenn mindestens eine Spitze in dem CSS-Bild vorhanden ist, die Ableitung eines Formdeskriptors mithilfe eines Verfahrens nach Anspruch 1, und dann, wenn keine Spitzen in dem CSS-Bild vorhanden sind, die Ableitung eines Formdeskriptors umfassend die Exzentrizität der ursprünglichen Objektkontur.
  3. Vorrichtung, die zur Implementierung eines Verfahrens nach Anspruch 1 oder Anspruch 2 geeignet ist.
  4. Vorrichtung nach Anspruch 3 umfassend Mittel (2) zur Ableitung einer Curvature Scale Space(CSS)-Darstellung der Kontur eines Objekts, das in einem Bild oder einer Sequenz von Bildern erscheint, durch die Verarbeitung von Signalen, die dem Bild oder den Bildern entsprechen, Mittel (2) zur Ableitung eines zusätzlichen Parameters, bei dem es sich um die Exzentrizität einer geglätteten Version handelt, entsprechend der höchsten Spitze in dem CSS-Bild, der ursprünglichen Objektkontur und Mittel (2) für die Zuordnung der CSS-Darstellung und des zusätzlichen Parameters zur Bildung eines Formdeskriptors (Shape Descriptor) des Objekts.
  5. Vorrichtung nach Anspruch 4 ferner umfassend Speichermittel (8, 10) zum Speichern von Bildern und/oder Objektdeskriptoren.
  6. Computersystem, das für den Betrieb gemäß eines Verfahrens nach Anspruch 1 oder Anspruch 2 programmiert ist.
  7. Computer-lesbares Speichermedium, das Computerausführbare Prozessschritte zur Implementierung eines Verfahrens nach Anspruch 1 oder 2 speichert.
DE60037497T 1999-07-15 2000-07-12 Verfahren und vorrichtung für anzeige oder auswahl von einem objekt in einem bild oder einem computerlesbaren aufzeichnungsmedium Expired - Lifetime DE60037497T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB9916684 1999-07-15
GB9916684A GB2352076B (en) 1999-07-15 1999-07-15 Method and apparatus for representing and searching for an object in an image
PCT/JP2000/004673 WO2001006457A1 (fr) 1999-07-15 2000-07-12 Procede et dispositif permettant d'afficher ou de chercher un objet dans une image et support de stockage lisible via ordinateur

Publications (2)

Publication Number Publication Date
DE60037497D1 DE60037497D1 (de) 2008-01-31
DE60037497T2 true DE60037497T2 (de) 2008-12-04

Family

ID=10857347

Family Applications (2)

Application Number Title Priority Date Filing Date
DE60037497T Expired - Lifetime DE60037497T2 (de) 1999-07-15 2000-07-12 Verfahren und vorrichtung für anzeige oder auswahl von einem objekt in einem bild oder einem computerlesbaren aufzeichnungsmedium
DE60043171T Expired - Lifetime DE60043171D1 (de) 1999-07-15 2000-07-12 Verfahren und Vorrichtung zum Anzeigen oder Suchen eines Objekts in Bildern und computerlesbaren Speichermedien

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE60043171T Expired - Lifetime DE60043171D1 (de) 1999-07-15 2000-07-12 Verfahren und Vorrichtung zum Anzeigen oder Suchen eines Objekts in Bildern und computerlesbaren Speichermedien

Country Status (11)

Country Link
US (4) US7613342B1 (de)
EP (4) EP1115088B1 (de)
JP (2) JP4727879B2 (de)
KR (4) KR100804326B1 (de)
CN (4) CN101609469B (de)
AT (1) ATE381740T1 (de)
BR (1) BR0006938B1 (de)
DE (2) DE60037497T2 (de)
GB (1) GB2352076B (de)
RU (1) RU2220452C2 (de)
WO (1) WO2001006457A1 (de)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2352076B (en) * 1999-07-15 2003-12-17 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
US6625607B1 (en) 1999-07-22 2003-09-23 Parametric Technology Corporation Method of comparing parts
GB2384095B (en) * 2001-12-10 2004-04-28 Cybula Ltd Image recognition
JP4477468B2 (ja) * 2004-10-15 2010-06-09 富士通株式会社 組み立て図面の装置部品イメージ検索装置
US8281281B1 (en) * 2006-06-07 2012-10-02 Pixar Setting level of detail transition points
US8031947B2 (en) * 2007-04-03 2011-10-04 Jacobsen Kenneth P Method and system for rapid matching of video streams
CN101334780A (zh) * 2007-06-25 2008-12-31 英特维数位科技股份有限公司 人物影像的搜寻方法、系统及存储影像元数据的记录媒体
KR101033366B1 (ko) * 2009-09-17 2011-05-09 고려대학교 산학협력단 효과적인 3차원 객체 인식을 위한 외형 기반 인덱스 구축 및 검색 방법
KR101032533B1 (ko) * 2009-10-14 2011-05-04 중앙대학교 산학협력단 특징값 정제를 통한 모양 기술 장치 및 방법
KR101767269B1 (ko) * 2011-04-25 2017-08-10 한국전자통신연구원 영상 검색 장치 및 방법
ITTO20120602A1 (it) * 2012-07-09 2014-01-10 Sisvel Technology Srl Method for transforming an image descriptor based on a gradient histogram and relative image processing apparatus.
RU2538938C2 (ru) * 2013-04-11 2015-01-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Юго-Западный государственный университет" (ЮЗГУ) Способ формирования двумерного изображения биосигнала и его анализа
US10060749B2 (en) * 2015-02-19 2018-08-28 Here Global B.V. Method and apparatus for creating a clothoid road geometry
CN110737796B (zh) * 2019-10-17 2022-06-10 苏州大学 图像检索方法、装置、设备及计算机可读存储介质
US11941863B2 (en) * 2021-08-04 2024-03-26 Datalogic Ip Tech S.R.L. Imaging system and method using a multi-layer model approach to provide robust object detection

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2170373B (en) * 1984-12-28 1989-03-15 Canon Kk Image processing apparatus
GB9014122D0 (en) * 1990-06-25 1990-08-15 Gersan Ets Shape sorting
US5537494A (en) * 1990-05-29 1996-07-16 Axiom Innovation Limited Video image data encoding and compression system using edge detection and luminance profile matching
US5504318A (en) * 1991-09-13 1996-04-02 Symbol Technologies, Inc. Analog waveform decoder using peak locations
US5579471A (en) * 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
JPH06309465A (ja) 1993-04-21 1994-11-04 Nippon Telegr & Teleph Corp <Ntt> 線図形学習認識方法
JP3574170B2 (ja) * 1994-03-17 2004-10-06 富士通株式会社 分散型画像処理装置
KR100287211B1 (ko) * 1994-08-30 2001-04-16 윤종용 양방향 움직임 추정방법 및 장치
US6014461A (en) * 1994-11-30 2000-01-11 Texas Instruments Incorporated Apparatus and method for automatic knowlege-based object identification
US5751853A (en) * 1996-01-02 1998-05-12 Cognex Corporation Locating shapes in two-dimensional space curves
US6005978A (en) * 1996-02-07 1999-12-21 Cognex Corporation Robust search for image features across image sequences exhibiting non-uniform changes in brightness
JPH09289584A (ja) * 1996-02-21 1997-11-04 Canon Inc 画像処理方法及び装置
US5893095A (en) * 1996-03-29 1999-04-06 Virage, Inc. Similarity engine for content-based retrieval of images
JPH1055447A (ja) 1996-05-21 1998-02-24 Monorisu:Kk オブジェクト認識方法およびその方法を用いた装置
US5974175A (en) * 1997-01-22 1999-10-26 Fujitsu Limited Image processing apparatus and method for detecting a contour of an object from images of a motion picture and extracting the object therefrom
US6055340A (en) * 1997-02-28 2000-04-25 Fuji Photo Film Co., Ltd. Method and apparatus for processing digital images to suppress their noise and enhancing their sharpness
JP3815704B2 (ja) * 1997-10-28 2006-08-30 株式会社リコー 図形分類処理方法、図形検索処理方法、図形分類システム、図形検索システム、図形分類用特徴抽出処理方法、図形分類用表作成処理方法、情報記録媒体、図形間の類似度又は相異度の評価処理方法、図形正規化処理方法、及び、図形間対応付け処理方法
US6029173A (en) * 1997-11-26 2000-02-22 Navigation Technologies Corporation Method and system for representation and use of shape information in geographic databases
US6714679B1 (en) * 1998-02-05 2004-03-30 Cognex Corporation Boundary analyzer
US6240424B1 (en) * 1998-04-22 2001-05-29 Nbc Usa, Inc. Method and system for similarity-based image classification
KR100301113B1 (ko) * 1998-08-05 2001-09-06 오길록 윤곽선 추적에 의한 동영상 객체 분할 방법
US6256409B1 (en) * 1998-10-19 2001-07-03 Sony Corporation Method for determining a correlation between images using multi-element image descriptors
JP2000187731A (ja) * 1998-12-21 2000-07-04 Ricoh Co Ltd 画像特徴抽出方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR100671098B1 (ko) * 1999-02-01 2007-01-17 주식회사 팬택앤큐리텔 모양정보를 이용한 멀티미디어 데이터의 검색 방법 및 장치
GB2375212B (en) * 1999-04-29 2003-06-11 Mitsubishi Electric Inf Tech Method and apparatus for searching for an object using shape
US6400846B1 (en) * 1999-06-04 2002-06-04 Mitsubishi Electric Research Laboratories, Inc. Method for ordering image spaces to search for object surfaces
US6307964B1 (en) * 1999-06-04 2001-10-23 Mitsubishi Electric Research Laboratories, Inc. Method for ordering image spaces to represent object shapes
GB2394349B (en) * 1999-07-05 2004-06-16 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
GB2352076B (en) * 1999-07-15 2003-12-17 Mitsubishi Electric Inf Tech Method and apparatus for representing and searching for an object in an image
US6941323B1 (en) * 1999-08-09 2005-09-06 Almen Laboratories, Inc. System and method for image comparison and retrieval by enhancing, defining, and parameterizing objects in images
JP3316758B2 (ja) * 1999-12-13 2002-08-19 インターナショナル・ビジネス・マシーンズ・コーポレーション モルフィング処理装置、記憶媒体、および動画作成装置
JP4570207B2 (ja) * 2000-06-12 2010-10-27 株式会社富士通長野システムエンジニアリング 3次元モデル解析装置および記録媒体
US6678413B1 (en) * 2000-11-24 2004-01-13 Yiqing Liang System and method for object identification and behavior characterization using video analysis
KR100370220B1 (ko) * 2000-12-27 2003-02-12 삼성전자 주식회사 직선 기반의 영상 정합 방법
US7616818B2 (en) * 2003-02-19 2009-11-10 Agfa Healthcare Method of determining the orientation of an image
CA2521165A1 (en) * 2003-04-03 2004-10-14 Dublin City University Shape matching method for indexing and retrieving multimedia data
US7372977B2 (en) * 2003-05-29 2008-05-13 Honda Motor Co., Ltd. Visual tracking using depth data
US7868900B2 (en) * 2004-05-12 2011-01-11 General Electric Company Methods for suppression of items and areas of interest during visualization
US20050276443A1 (en) * 2004-05-28 2005-12-15 Slamani Mohamed A Method and apparatus for recognizing an object within an image
DE102005049017B4 (de) * 2005-10-11 2010-09-23 Carl Zeiss Imaging Solutions Gmbh Verfahren zur Segmentierung in einem n-dimensionalen Merkmalsraum und Verfahren zur Klassifikation auf Grundlage von geometrischen Eigenschaften segmentierter Objekte in einem n-dimensionalen Datenraum
US8745162B2 (en) * 2006-08-22 2014-06-03 Yahoo! Inc. Method and system for presenting information with multiple views

Also Published As

Publication number Publication date
CN101609467A (zh) 2009-12-23
GB2352076B (en) 2003-12-17
CN101609468A (zh) 2009-12-23
GB2352076A (en) 2001-01-17
JP4727879B2 (ja) 2011-07-20
KR100626261B1 (ko) 2006-09-21
KR100626260B1 (ko) 2006-09-21
EP1115088B1 (de) 2007-12-19
EP2259209A1 (de) 2010-12-08
KR20060054492A (ko) 2006-05-22
RU2220452C2 (ru) 2003-12-27
EP1115088A1 (de) 2001-07-11
US20080065613A1 (en) 2008-03-13
BR0006938B1 (pt) 2013-05-07
JP2011100465A (ja) 2011-05-19
CN101609469A (zh) 2009-12-23
DE60043171D1 (de) 2009-11-26
EP2128796B1 (de) 2012-12-05
KR100436532B1 (ko) 2004-06-22
EP2128796A1 (de) 2009-12-02
US7646920B2 (en) 2010-01-12
WO2001006457A1 (fr) 2001-01-25
DE60037497D1 (de) 2008-01-31
CN101609469B (zh) 2011-10-05
KR20030088465A (ko) 2003-11-19
GB9916684D0 (en) 1999-09-15
KR100804326B1 (ko) 2008-02-15
CN1317126A (zh) 2001-10-10
US7574049B2 (en) 2009-08-11
BR0006938A (pt) 2001-06-26
EP1115088A4 (de) 2003-07-16
KR20010075098A (ko) 2001-08-09
KR20030086321A (ko) 2003-11-07
US20080063311A1 (en) 2008-03-13
EP1901204A1 (de) 2008-03-19
ATE381740T1 (de) 2008-01-15
EP1901204B1 (de) 2009-10-14
US7613342B1 (en) 2009-11-03
US7664327B2 (en) 2010-02-16
US20080063312A1 (en) 2008-03-13
CN100520825C (zh) 2009-07-29

Similar Documents

Publication Publication Date Title
DE60037497T2 (de) Verfahren und vorrichtung für anzeige oder auswahl von einem objekt in einem bild oder einem computerlesbaren aufzeichnungsmedium
DE60037919T2 (de) Verfahren zum Wiederauffinden von Bildtexturen und Vorrichtung dafür
DE112014003563B4 (de) Vorrichtung und Verfahren zur Gestenbestimmung, Gestenbedienungsvorrichtung, Programm und Aufzeichnungsmedium
DE69833999T2 (de) Verfahren zur automatischen erkennung menschlicher augen in digitalbildern
DE19983528B3 (de) Multi-Linearisierungs-Datenstruktur zum Bild-Browsing
DE69721951T2 (de) Verfahren und Gerät zum Fingerabdruckvergleich mit auf lokaler Merkmalübereinstimmung basierter Transformationsparametergruppenbildung
DE69031774T2 (de) Adaptiver Gruppierer
DE69333431T2 (de) Verfahren zum Erkennen von handgeschriebenen Symbolen
DE19708265B4 (de) Verfahren zum Durchsuchen einer Dokument-Bilddatenbank und Dokumentbild-Durchstöberungssystem sowie Verfahren zum Extrahieren eines Merkmalsvektors aus einem elektronisch gespeicherten Bild
DE69731142T2 (de) System zum Wiederauffinden von Dokumenten
EP0780002B1 (de) Verfahren und vorrichtung zur rekonstruktion von in rasterform vorliegenden linienstrukturen
DE102017216821A1 (de) Verfahren zur Erkennung einer Objektinstanz und/oder Orientierung eines Objekts
DE102006045828B4 (de) Verfahren und Vorrichtung zum Erkennen eines Gesichts sowie ein Gesichtserkennungsmodul
DE102012025349B4 (de) Bestimmung eines Ähnlichkeitsmaßes und Verarbeitung von Dokumenten
DE2813157C2 (de) Gerät zur selbsttätigen, lageunabhängigen Mustererkennung
WO2012052106A1 (de) Verfahren zur klassifizierung von mustern in bilddatensätzen
DE69026668T2 (de) Genaue Erkennung von Eingabemustern
DE112013002192T5 (de) Datenverarbeitungsvorrichtung zum Unterscheiden zwischen kombinierten Ergebnissen einer Vielzahl von Elementen, ein Programmprodukt und ein Verfahren für selbige
DE60123852T2 (de) Verfahren zur effizienten Kodierung von formbeschreibenden Parametern
DE112020007889T5 (de) Bildverarbeitungseinrichtung, programm und bildverarbeitungsverfahren
DE3238300A1 (de) Verfahren und vorrichtung zur muster- oder zeichenerkennung
WO2000003311A2 (de) Verfahren und anordnung zur ermittlung eines ähnlichkeitsmasses einer ersten struktur mit mindestens einer vorgegebenen zweiten struktur
DE102014214851A1 (de) Computerimplementiertes Verfahren und Computersystem zur Durchführung einer Ähnlichkeitsanalyse
DE10118485A1 (de) Automatische Identifikation und/oder Verifikation linienhafter Texturen wie Fingerabdrücke
EP2407910B1 (de) Verfahren und Vorrichtung zum Erstellen einer Objekt-Datenbank und zum Auffinden von Objekten

Legal Events

Date Code Title Description
8364 No opposition during term of opposition