DE10160115B4 - Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei - Google Patents

Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei Download PDF

Info

Publication number
DE10160115B4
DE10160115B4 DE10160115A DE10160115A DE10160115B4 DE 10160115 B4 DE10160115 B4 DE 10160115B4 DE 10160115 A DE10160115 A DE 10160115A DE 10160115 A DE10160115 A DE 10160115A DE 10160115 B4 DE10160115 B4 DE 10160115B4
Authority
DE
Germany
Prior art keywords
sub
search
image file
digital image
transformations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE10160115A
Other languages
English (en)
Other versions
DE10160115A1 (de
Inventor
Jens Dipl.-Phys. Pannekamp
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority to DE10160115A priority Critical patent/DE10160115B4/de
Publication of DE10160115A1 publication Critical patent/DE10160115A1/de
Application granted granted Critical
Publication of DE10160115B4 publication Critical patent/DE10160115B4/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • G06V30/1983Syntactic or structural pattern recognition, e.g. symbolic string recognition
    • G06V30/1988Graph matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei unter Zugrundelegung von Informationen über ein Referenzobjekt (O) gekennzeichnet durch folgende Verfahrensschritte:
– Zergliedern des Referenzobjektes (O) in wenigstens zwei räumlich unterscheidbare Teilobjekte (Oi, i = 1, ..N),
– Erfassen eines Satzes von erlaubten Transformationen (Th,i), der angibt wie ein Teilobjekt (Oi) hinsichtlich seiner Lage und Form relativ zu mindestens einem anderen Teilobjekt (Oh) (i ≠ h = 1..N) anzuordnen ist,
– Suchen nach einem einzelnen Teilobjekt (Oi) in der digitalen Bilddatei derart, dass die Suche nach Teilobjekten (Oi) durch ein Objektvergleich zwischen dem zu suchenden Teilobjekt (Oi) und Darstellungsformen in der digitalen Bilddatei erfolgt, wobei die Suche unter Zugrundelegung der erlaubten Transformationen (Th,i) des Teilobjektes (Oi) durchgeführt wird,
– Wiederholen des vorstehenden Suchschrittes bis alle Teilobjekte (Oi) in der digitalen Bilddatei gefunden sind oder ein Abbruchkriterium erreicht wird, und
– Verifizieren des aufgefundenen geometrischen...

Description

  • Technisches Gebiet
  • Die Erfindung bezieht sich auf ein Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei unter Zugrundelegung von Informationen über ein Referenzobjekt.
  • Eines der grundlegenden Probleme in der Bildverarbeitung besteht im Auffinden vorgegebener geometrischer Objekte in digitalen Bilddateien. Das Problem gliedert sich in zwei Teile auf, nämlich in die Beschreibung eines Referenzobjektes, das der Suche zugrundegelegt wird sowie in das Auffinden eines mit dem Referenzobjekt korrespondierenden Objekts in einer Bilddatei, in der das zu suchende Objekt in einer Konfiguration dargestellt sein kann, die nicht abbildungsgetreu dem vorgegebenen Referenzobjekt entspricht.
  • Dem Stand der Technik entsprechen Objektrepräsentationen, die zumeist auf Grauwertschablonen, sogenannten Templates, oder auf Konturmodellen basieren.
  • Grauwertschablonen sind durch Bildausschnitte gegeben, die das relevante Objekt beinhalten. Häufig benutzt werden auch unterabgetastete Bilder oder Bilder, die auf relevante Bildpunkte reduziert worden sind, um den Rechenaufwand zu verringern
  • Konturmodelle werden durch die Extraktion von charakteristischen Objektkonturen gewonnen. Hierzu werden aus dem Grauwertbild Objektkonturen berechnet und als Listen von Konturpunkten abgespeichert. Die Bestimmung der Konturpunkte erfolgt hierbei häufig subpixelgenau.
  • Beiden vorstehenden Darstellungsformen zur Objektrepräsentation ist gemein, dass die Objekte als starre Gebilde angesehen werden. Objektvariationen, wie sie z. B. bei sich verformenden Objekten auftreten, sind in dieser Art der Objektdarstellung nicht vorgesehen. Insbesondere lässt sich die variable Lage von einzelnen Objektteilen zueinander nicht darstellen. So ist bspw. das Abbild eines Hampelmanns nur in einer konkreten räumlichen Erscheinungsform, also in einer Momentaufnahme darstellbar. Möchte man bspw. einen Hampelmann in der Gesamtheit all seiner erlaubten Bewegungsformen als digitales Objektmodell darstellen, so bedarf es einer Vielzahl oder genau genommen einer unendlichen Vielzahl konkreter Momentaufnahmen, die mit den bekannten Repräsentationsformen darzustellen wären. Zweifelsohne bedeutet dies einen zumindest sehr großen Ressourcenaufwand.
  • Neben dem Wunsch nach einem möglichst optimalen, also datenreduzierten Modus zur Darstellung und Speicherung konkreter geometrischer Objekte kommt dem gezielten Auffinden von Objekten in digitalen Bilddateien eine große Bedeutung zu.
  • Das Auffinden des Objektmodells, das sogenannte Matchen, besteht darin, das Objektmodell mit den erlaubten Transformationen wie beispielsweise Translation, Rotation und Skalierung in seiner Lage und Form zu verändern und einen Vergleich des so positionierten und modifizierten Objektmodells mit den Bilddaten durchzuführen. Dieser Anpassvorgang entspricht einem Minimierungsproblem, bei dem die Freiheitsgrade der Lage- und Formanpassung so gewählt werden, dass eine Distanzfunktion ein möglichst globales Minimum annimmt. Die Distanzfunktion quantifiziert dabei die Ähnlichkeit von Objektmodell und betrachtetem Bilddaten.
  • Auf die Leistungsfähigkeit des Anpassvorgangs hat die Wahl des geeigneten Minimierungsverfahrens einen erheblichen Einfluss. Im Weiteren wird die Verfügbarkeit eines geeigneten Mlinimierungsverfahrens vorausgesetzt.
  • Wesentlich für die heute üblichen Anpassverfahren ist die Tatsache, dass die zugelassenen Operationen auf das Objektmodell als Ganzes wirken und in der Regel auf affine Abbildungen beschränkt sind. Typische Operationen sind hierbei Translation, Rotation oder Größenskalierung. Nichtlineare, insbesondere lokal auf Teile des Objektmodells wirkende Operationen, wie z. B. das Abknicken des Armes eines Hampelmannes, sind in dem Funktionsumfang nicht enthalten.
  • Eine Einschränkung der heute üblichen Verfahren zum Auffinden von Objekten in digitalen Bilddateien besteht demzufolge darin, dass Objekte mit variabler Geometrie nicht geeignet repräsentiert und aufgefunden werden können. Soll bspw. das Objekt eines Hampelmannes in all seinen möglichen Erscheinungsformen repräsentiert und anschließend aufgefunden werden, ist dies mit derzeitigen digitalen Bildverarbeitungsverfahren nicht möglich. Das jeweilige Objektmodell beschreibt den Hampelmann lediglich in einer konkreten Konfiguration, also nur in einer speziellen Momentaufnahme. Das Objektmodell und die auf das Modell anwendbaren Operationen gestatten es jedoch nicht, alle gültigen bzw. erlaubten Konfigurationen zu generieren. Eine entsprechende Objektsuche ergibt demzufolge nur eine partielle Übereinstimmung des Objektmodells mit der aktuellen Bilddatei, da nicht eine unbegrenzte Anzahl aller möglichen Erscheinungsformen aufgenommen und abgespeichert werden kann, um die aktuellen Bilddaten mit den gespeicherten Daten zu vergleichen.
  • Aus einem Artikel von P. Haberäcker, „Praxis der digitalen Bildverarbeitung und Mustererkennung, Carl Hanser Verlag München Wien, 1995, Seiten 329–334 ist ein Bild verarbeitendes Verfahren beschrieben, nach dem eine komplexe Objektstruktur in eine Vielzahl einzelner Segmente zergliedert werden kann. Bspw. lassen sich die Teilobjekte eines Verbundobjektes segmentieren, indem Bildpunkte, die einander ähnlich sind, zu Segmenten zusammengefasst werden. Dieser Vorgang wird am Beispiel eines Filzstiftes erklärt, der aus einem schwarzen Griff, einer Halterung und einer roten Verschlusskappe zusammengesetzt ist. Hierbei werden die Klassen der schwarzen und der roten Bildpunkte des Objektes und die Klasse des sehr hellen Bildhintergrundes auf die Objektsegmente „Hintergrund", „Griff", „Halterung" und „Verschlusskappe" zugeordnet. Nach entsprechender Segmentierung und Identifizierung der einzelnen Segmente gilt es im Weiteren zu prüfen, ob die einzelnen Segmente relativ zueinander eine konkrete räumliche Lage einnehmen, die letztlich die Identifikation des Filzstiftes ermöglicht. In diesem Zusammenhang wird geprüft, ob die Lage der Schwerpunkte der einzelnen Segmente zusammenpasst, d. h. ob die Schwerpunkte auf einer Geraden liegen und dass die Abstände innerhalb gewisser Toleranzen liegen. Wenn dies der Fall ist, kann entschieden werden, ob es sich um einen Filzstift eines bestimmten Typs handelt. Mit Hilfe des bekannten Verfahrens kann demzufolge entschieden werden, ob jeweils identifizierte Segmente Teile eines übergeordneten Objektes sind. Als Prüfkriterien gilt es die Schwerpunkte der einzelnen Teile zu bestimmen und ihre Relativlagen zu ermitteln. Sind bestimmte Prüfkriterien erfüllt, so kann von einer Identifikation des Gesamtobjektes ausgegangen werden.
  • Darstellung der Erfindung
  • Es besteht daher die Aufgabe, ein Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei unter Zugrundelegung von Informationen über ein Referenzobjekt derart anzugeben, dass die Objektsuche in digitalen Bilddateien unter Vermeidung ressourcenaufwendiger Suchschritte in Hinblick auf das Auffinden von Objekten, die variable erlaubte Raumformen annehmen können, wie bspw. die Vielzahl von Bewegungszuständen eines Hampelmannes, möglich sein soll. Hierbei gilt es im Besonderen die Zuverlässigkeit und Suchqualität des Suchvorganges entscheidend gegenüber den bisher bekannten Suchverfahren zu verbessern.
  • Die Lösung der der Erfindung zugrundeliegenden Aufgabe ist im Anspruch 1 sowie 2 angegeben. Gegenstand der Unteransprüche sind Merkmale, die den Erfindungsgedanken vorteilhaft weiterbilden. Ebenso sind vorteilhafte, den Erfindungsgedanken weiterbildende Merkmale der Beschreibung unter Bezugnahme auf das Ausführungsbeispiel entnehmbar.
  • Das erfindungsgemäße Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei unter Zugrundelegung von Informationen über ein Referenzobjekt zeichnet sich erfindungsgemäß durch folgende Verfahrensschritte aus:
    Zunächst wird das Referenzobjekt in wenigstens zwei räumlich unterscheidbare Teilobjekte unterteilt, deren Relativlage zueinander sowie deren Form und/oder Größe, ohne dabei die Identität des Referenzobjektes selbst zu verändern, durchaus variabel sein können. In aller Regel, und hiervon wird im folgenden ausgegangen, vermögen die einzelnen Teilobjekte ihre Form und Lage nicht in beliebiger Weise zueinander zu verändern, sondern lediglich in einer, durch ein dem gesamten geometrischen Objekt zugrundeliegenden Funktionsprinzip bestimmten Weise, d.h. die einzelnen Teilobjekte können nur bestimmte, aber im Grenzfall unzählig viele konkrete räumliche Lagen und Formen relativ zueinander annehmen, die allesamt durch entsprechende Transformationsvorschriften definierbar sind. So wird erfindungsgemäß ein Satz von Transformationen bestimmt, der Auskunft darüber gibt, wie ein Teilobjekt hinsichtlich seiner Lage und Form relativ zu einem anderen Teilobjekt in einer zulässigen Weise angeordnet werden kann.
  • Die erlaubten, relativen Lage- und Formtransformationen zwischen zwei Teilobjekten sind durch eine affine Transformation darstellbar, deren Parameter aus Zulässigkeitsgründen auf bestimmte Wertebereiche eingeschränkt sind. Ein einfaches Beispiel für eine derart eingeschränkte Lage- und Formbeziehung zwischen zwei Teilobjekten lautet: Die Lage von Teilobjekt (Oi) geht bezüglich der Lage von Teilobjekt (Oh) durch eine Translation in horizontaler Richtung um x = 1...3 cm hervor. Seine Größenskalierung gegenüber dem Teilobjekt (Oh) darf innerhalb des Bereichs S = 0,8...1,2 liegen.
  • Da jedes der einzelnen Teilobjekte durch ein eigenes Teilobjektmodell, das als selbstständige Entität aufgefasst werden kann, beschrieben und hinterlegt wird sowie das Teilobjekt in seiner Lage durch eine affine Transformation relativ zu dem diesen Teilobjekt übergeordneten Teilobjekt beschreibbar ist, ist eine Beschreibung des Gesamtobjektes möglich, die verglichen zu bekannten Techniken über eine weitaus höhere Anzahl von Freiheitsgraden verfügt, wodurch das Objekt in seiner Gesamtheit nun nicht mehr ausschließlich einer globalen affinen Transformation unterliegt, sondern durch eine geordnete Abfolge von affinen Transformationen jeweils für die einzelnen Teilobjekte darstellbar ist.
  • Die vorstehenden Verfahrensschritte dienen als vorbereitende Maßnahme für den nun folgenden eigentlichen Suchvorgang nach bestimmten Objekten, respektive Teilobjekten, innerhalb vorgegebener digitaler Bilddateien.
  • Die Suche nach einem zum vorgegebenen Referenzobjekt korrespondierenden Objekt innerhalb der Bilddatei erfolgt erfindungsgemäß durch die Suche nach den einzelnen Teilobjekten, die in ihrer Zusammenschau das gesamte geometrische Objekt ergeben.
  • In einem ersten erfindungsgemäßen Lösungsvorschlag sieht der Suchvorgang ganz allgemein die Suche nach allen Teilobjekten in der vorgegebenen digitalen Bilddatei vor, wobei die Suche nach den einzelnen Teilobjekten jeweils unabhängig voneinander erfolgt. Das gesamte Objekt gilt innerhalb der digitalen Bilddatei als detektiert, wenn alle Teilobjekte aufgefunden werden konnten und eine nachträgliche Überprüfung ihrer jeweiligen Formen und Lagebeziehungen untereinander als gültig anzusehen ist, d.h. es wird überprüft, ob die in der digitalen Bilddatei aufgefundenen Teilobjekte nach Form und Lage durch den Satz von Transformationen beschreibbar sind, der alle gültigen Lage- und Formtransformationen des Referenzobjektes enthält.
  • Ein zweiter, alternativer Lösungsvorschlag sieht vor, die Suche nach den einzelnen Teilobjekten hierarchisch durchzuführen. So wird zunächst eine Hierarchie bzw. Reihenfolge festgelegt, nach der die einzelnen Teilobjekte unter Zugrundelegung der Transformationen hinsichtlich ihrer relativen Lage und Form in der digitalen Bilddatei gesucht werden sollen. Vorzugsweise leitet sich die Hierarchie, nach denen einzelne Teilobjekte nacheinander aufgefunden werden sollen, davon ab, in welcher geometrischen Anordnung die einzelnen Teilobjekte innerhalb des Gesamtobjektes miteinander verknüpft sind. Auch sind andere hierarchisch strukturierte Reihenfolgen denkbar, die bspw. durch interaktives Abfragen zusammen mit einem Benutzer oder aufgrund von weiteren Bewertungskriterien generierbar sind.
  • Die Suche erfolgt zunächst nach dem in der Hierarchie an erster Stelle stehenden Teilobjekt innerhalb der digitalen Bilddatei. Ist das Teilobjekt gefunden worden, so erfolgt die Suche nach dem in der Hierarchie folgenden Teilobjekt unter Zugrundelegung der für dieses Teilobjekt erlaubten Transformation hinsichtlich Lage und Form bezüglich des unmittelbar in der Hierarchie zuvor gesuchten und in der digitalen Bilddatei aufgefundenen Teilobjektes. Dieser Suchvorgang wird so oft wiederholt, bis alle Teilobjekte in der digitalen Bilddatei gefunden worden sind. Sollte der Fall auftreten, dass ein Teilobjekt unter Zugrundelegung der jeweilig erlaubten Transformation, ausgehend von dem in der Hierarchie übergeordneten Teilobjekt, nicht aufgefunden werden kann, so ist in diesem Fall vorzugsweise nach folgenden zwei Suchstrategiealternativen vorzugehen: In einer ersten Variante werden die Teilobjekte, die dem fehlenden Teilobjekt in der Hierarchie unmittelbar folgen, unabhängig von der Lage des nicht gefundenen Teilobjekts gesucht.
  • In der zweiten Suchalternative werden die Teilobjekte, die dem fehlenden Teilobjekt in der Hierarchie unmittelbar folgen, gemäß Transformationen gesucht, die sich durch Verknüpfung aller Transformationen ausgehend von dem in der Hierarchie zuletzt aufgefundenen Teilobjekt ergeben.
  • Beide Suchalternativen dienen also dazu, die durch das Nichtauffinden eines Teilobjektes verursachte Lücke in der hierarchischen Anordnung zu überbrücken. In beiden Suchalternativen werden die dem fehlenden Teilobjekt mittelbar folgenden Teilobjekte wieder gemäß der allgemeinen Regel gesucht, d.h. sie werden bezüglich ihres jeweiligen Vorgängers gesucht. Sollten beide vorstehenden alternativen Suchstrategien fehlschlagen, so kann der Suchvorgang als Ganzes abgebrochen werden. Die Suche nach einer Realisierung des Referenzobjektes ist damit fehlgeschlagen.
  • Grundsätzlich bietet das erfindungsgemäße Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei gegenüber dem bisher bekannten, gattungsgemäßen Verfahren den Vorteil, dass geometrische Objekte mit variabler Geometrie einerseits Ressourcen schonend darstellbar sind und andererseits mit einer hohen Zielsicherheit innerhalb einer digitalen Bilddatei aufgefunden werden können. Insbesondere führen die Zergliederung des Gesamtobjektes in entsprechende Teilobjekte und die Beschreibung der Teilobjekte durch ihre räumlichen Relativbeziehungen sowie variable Formen und Größen zu einer erhöhten Flexibilität des Suchvorgangs, werden doch alle erlaubten Erscheinungsformen des Gesamtobjektes innerhalb der digitalen Bilddatei mehr oder weniger auf einmal gesucht. Dem Anwender bietet sich insbesondere die Möglichkeit, die einzelnen Teilobjekte in all ihren Freiheitsgraden in Bezug auf räumliche Lage, Form und Größe genau zu beschrieben. Dies nämlich ist durch die Angabe eines Satzes bzw. einer Schar erlaubter Transformationen möglich, die sowohl als nichtlineare als auch als affine Transformationen alle erlaubten Abbildungen jeweils eines Teilobjektes unter Einschluss von Translation, Rotation sowie Größenskalierung umfassen.
  • Im Unterschied zu Objektbeschreibungen, bei denen es erforderlich ist, eine große Vielzahl einzelner Objektmodelle, die ein und das gleiche Objekt in einer unterschiedlichen Konfiguration beschreiben, vorrätig zu haben, ist es bei dem erfindungsgemäßen Verfahren lediglich nötig, ein einziges Objektmodell vorzusehen, das in eine begrenzte Anzahl von Teilobjekten zergliedert ist, die jeweils über bestimmte, erlaubte Transformationsvorschriften miteinander verknüpfbar sind.
  • Das erfindungsgemäße Verfahren ist unabhängig von der jeweiligen Repräsentationsform, mit der Objekte und Teilobjekte darstellbar sind, anwendbar. Gleichgültig, ob die zu suchenden Objekte in den jeweiligen digitalen Bilddateien bspw. als Grauwertschablonen oder in Form von Konturmodellen vorliegen, ist das erfindungsgemäße Verfahren mit beiden Repräsentationsformen uneingeschränkt kombinierbar. Auch lässt das erfindungsgemäße Verfahren den Einsatz beliebiger Suchalgorithmen bzw. Suchverfahren zu, nach denen Objekte in Bilddateien aufgefunden werden können. So lässt sich insbesondere das eingangs erwähnte Suchverfahren des Auffindens (Matchen) mittels Anpassens (Fit) unter Verwendung des Minimierens einer Distanzfunktion fehlerfrei anwenden.
  • Kurze Beschreibung der Erfindung
  • Die Erfindung wird nachstehend ohne Beschränkung des allgemeinen Erfindungsgedankens anhand von Ausführungsbeispielen unter Bezugnahme auf die Zeichnung exemplarisch beschrieben. Es zeigen:
  • 1 Modellobjekt eines Hampelmanns, sowie
  • 2 Baumstruktur des Modellobjektes „Hampelmann".
  • Wege zur Ausführung der Erfindung, gewerbliche Verwendbarkeit
  • In 1 ist schematisiert eine Momentaufnahme eines Hampelmannes abgebildet. Aus Gründen der Übersichtlichkeit und einer vereinfachten weiteren Beschreibung sei angenommen, dass der Hampelmann aus vier Teilobjekten besteht. So entspricht der Rumpf mit festem Kopf und Beinen einem ersten Teilobjekt (O1), der linke Arm dem zweiten Teilobjekt (O2), der rechte Oberarm dem dritten Teilobjekt (O3) sowie letztlich der Unterarm dem vierten Teilobjekt (O4). Grundsätzlich sei an dieser Stelle angemerkt, dass die Zergliederung eines derartigen Referenzobjektes O in seine entsprechenden Teilobjekte auf unterschiedliche Weise erfolgen kann, beispielsweise interaktiv, d.h. das entsprechende Referenzobjekt kann unter Mitwirkung des Benutzers in individuelle Teilobjekte nach und nach zergliedert werden. Es ist jedoch auch möglich, die Zergliederung rein stochastisch vorzunehmen, häufig erfolgt sie jedoch nach Maßgabe der qualitativen, quantitativen und/oder funktionellen Beschaffenheit des einzelnen Referenzobjektes.
  • Jedes einzelne, auf vorstehende Weise erhaltene Teilobjekt wird als Teilobjektmodell dargestellt und bildet eine einheitliche, abgeschlossene Entität, die beispielsweise als Grauwertschablone oder als Konturmodell beschrieben werden kann. Die zu durchsuchende digitale Bilddatei ist analog der gewählten Repräsentationsform der Teilobjektmodelle darzustellen.
  • Nach der entsprechenden Zergliederung des in der 1 dargestellten Hampelmannes in seine Teilobjekte O1, O2, O3, O4 gilt es im weiteren zu jedem der einzelnen Teilobjekte eine spezifisch erlaubte Transformation bzw. Objekttransformation zu generieren. So beschreibt beispielsweise die zu dem Teilobjekt O1 zugehörige Transformation T1 eine Schar von affinen Transformationen, die das Teilobjekt O1 in seiner Gesamtheit von Konfigurationen hinsichtlich Lage und Form bezüglich der Objektwurzel festlegt. Die Objektwurzel stellt dabei einen Referenzpunkt im zu durchsuchenden Bild dar, beispielsweise die linke obere Ecke des Bildes.
  • In gleicher Weise enthält die Transformation T2 entsprechende Abbildungsvorschriften für das Teilobjekt O2 relativ zu der Lage von O1. Analog beschreiben die Transformation T3 bzw. T4 die Abbildungsvorschriften für O3 bzw. O4 bezüglich O1 bzw. O3.
  • Auf diese Weise ist für jedes Teilobjekt ein zugehöriges Teilobjektmodell Oi mit i = 1 bis 4 und eine spezifisch erlaubte Objekttransformation Ti gegenüber dem jeweiligen Vorgängerknoten bzw. Vorgängerobjekt definiert. Durch die funktionelle Zusammenfügung der einzelnen Teilobjekte innerhalb des Gesamtobjektes „Hampelmann" kann eine hierarchische Beschreibungsform bezüglich der einzelnen miteinander zusammenhängenden Teilobjekte festgelegt werden, nach der der im Weiteren durchzuführende Suchschritt durchgeführt wird. Zur besseren Veranschaulichung der hierarchischen Ordnung hinsichtlich der einzelnen Teilobjekte dient die in der 2 dargestellte Baumstruktur bezüglich des Gesamtobjektes „Hampelmann" mit den jeweiligen Teilobjekten O1 bis O4 sowie den jeweils dazugehörigen erlaubten Transformationen T1 bis T4.
  • Ausgangspunkt für die in 2 dargestellte Baumstruktur ist die sogenannte Objektwurzel R. Die Verbindungslinien bzw. Kanten der Baumstruktur entsprechen den Transformationen Ti, mit denen mögliche Realisierungen der Teilobjekte aus den entsprechenden Vorgängerteilobjekten hervorgehen.
  • Mit Hilfe einer derartigen Baumstruktur kann nun eine digitale Bilddatei auf das Vorhandensein des Gesamtobjektes „Hampelmann" abgesucht werden. So gilt es in einem ersten Suchschritt das Teilobjekt O1 in Bezug auf die Objektwurzel innerhalb der digitalen Bilddatei abzusuchen. Die hierbei eingesetzte Suchtechnik kann mit bekannten Suchalgorithmen durchgeführt werden. So wird das erste Teilobjekt O1 unter den erlaubten Transformationen T1 gesucht, das daran angehängte Teilobjekt O2 unter der erlaubten Transformation T2 relativ zu der Position von O1 und so weiter. Der Suchvorgang kann als beendet gelten, wenn alle Teilobjekte O1 bis O4 unter den erlaubten Transformationen T1 bis T4 aufgefunden worden sind.
  • Wird jedoch ein Teilobjekt Oi nicht gefunden, so ergeben sich für die Suche der daran angehängten Teilobjekte Oi+1, Oi+2 usw. unterschiedliche Suchstrategien.
  • In der ersten Variante werden die Teilobjekte, die dem fehlenden Teilobjekt in der Hierarchie unmittelbar folgen, unabhängig von der Lage des nicht gefundenen Teilobjekts gesucht, in der zweiten Variante werden sie gemäß Transformationen gesucht, die sich durch Verknüpfung aller Transformationen ausgehend von dem in der Hierarchie zuletzt aufgefundenen Teilobjekt ergeben
  • Die einzelnen Suchschritte können überdies abgebrochen werden, wenn bestimmte Abbruchkriterien eintreten, wenn beispielsweise eine vorher festgelegte Suchdauer bzw. vorher festgelegter Suchaufwand überschritten wird.

Claims (14)

  1. Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei unter Zugrundelegung von Informationen über ein Referenzobjekt (O) gekennzeichnet durch folgende Verfahrensschritte: – Zergliedern des Referenzobjektes (O) in wenigstens zwei räumlich unterscheidbare Teilobjekte (Oi, i = 1, ..N), – Erfassen eines Satzes von erlaubten Transformationen (Th,i), der angibt wie ein Teilobjekt (Oi) hinsichtlich seiner Lage und Form relativ zu mindestens einem anderen Teilobjekt (Oh) (i ≠ h = 1..N) anzuordnen ist, – Suchen nach einem einzelnen Teilobjekt (Oi) in der digitalen Bilddatei derart, dass die Suche nach Teilobjekten (Oi) durch ein Objektvergleich zwischen dem zu suchenden Teilobjekt (Oi) und Darstellungsformen in der digitalen Bilddatei erfolgt, wobei die Suche unter Zugrundelegung der erlaubten Transformationen (Th,i) des Teilobjektes (Oi) durchgeführt wird, – Wiederholen des vorstehenden Suchschrittes bis alle Teilobjekte (Oi) in der digitalen Bilddatei gefunden sind oder ein Abbruchkriterium erreicht wird, und – Verifizieren des aufgefundenen geometrischen Objektes anhand der durch den Satz von Transformationen (Th,i) vorgegebenen Relativlagen und Formen der Teilobjekte (Oi) untereinander.
  2. Verfahren nach dem Oberbegriff des Anspruchs 1, gekennzeichnet durch folgende Verfahrensschritte: – Zergliedern des Referenzobjektes (O) in wenigstens zwei räumlich unterscheidbare Teilobjekte (Oi, i = 1, ..N), – Erfassen eines Satzes von erlaubten Transformationen (Th,i), der angibt wie ein Teilobjekt (Oi) hinsichtlich seiner Lage und Form relativ zu mindestens einem anderen Teilobjekt (Oh) (i ≠ h = 1..N) anzuordnen ist, – Festlegen einer Hierarchie, nach der die Teilobjekte (Oi) unter Zugrundelegung der Transformationen (Th,i) hinsichtlich ihrer relativen Lage und Form in der digitalen Bilddatei gesucht werden, – Suchen nach dem in der Hierarchie bzw. ermittelten Reihefolge an erster Stelle stehenden Teilobjekt (Oi, i = 1) in der digitalen Bilddatei derart, dass die Suche nach dem Teilobjekt (Oi) durch ein Objektvergleich zwischen dem zu suchenden Teilobjekt (Oi) und Darstellungsformen in der digitalen Bilddatei erfolgt, wobei die Suche unter Zugrundelegung der erlaubten Transformationen (Th,i) des Teilobjektes (Oi) durchgeführt wird, – Suchen nach dem in der Hierarchie nachfolgenden Teilobjekt (Oi+1) unter Zugrundelegung der für dieses Teilobjekt (Oi+1) erlaubten Transformationen (Ti,i+1) hinsichtlich seiner Lage und Form bezüglich des unmittelbar in der Hierarchie zuvor gesuchten Teilobjekts (Oi) in der digitalen Bilddatei, – Wiederholen des vorstehenden Suchschrittes bis alle Teilobjekte (Oi) in der digitalen Bilddatei gefunden sind oder ein Abbruchkriterium erreicht wird.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass das Zergliedern des Referenzobjektes (O) nach individuellen Bewertungskriterien erfolgt.
  4. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass das Zergliedern in einem schrittweise, interaktiven Verfahren erfolgt.
  5. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass das Zergliedern unter stochastischen oder qualitativen und/oder quantitativen Bewertungskriterien automatisch erfolgt.
  6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass der Satz aller erlaubter Transformationen (Th,i) hinsichtlich Lage und Form zweier Teilobjekte (Oh) und (Oi) als Schar affiner Transformationen gewonnen wird.
  7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass der Satz aller erlaubter Transformationen (Th,i) hinsichtlich Lage und Form zweier Teilobjekte (Oh) und (Oi) als Schar allgemein nichtlinearer Transformationen, unter Einschluß von Translation, Rotation und Skalierung gewonnen wird.
  8. Verfahren nach einem der Ansprüche 2 bis 7, dadurch gekennzeichnet, dass die einzelnen Teilobjekte (Oi) gemäß ihrer hierarchischen Ordnung in einem Objektbaum angeordnet werden, in dem die Transformationen hinsichtlich Lage und Form jedes einzelnen Teilobjektes (Oi) relativ zu dem übergeordneten Teilobjekt (Oh) durch eine affine Transformation (Th,i) beschrieben werden.
  9. Verfahren nach einem der Ansprüche 2 bis 8, dadurch gekennzeichnet, dass die Suchen nach dem in der Hierarchie an erster Stelle stehenden Teilobjekt (Oi, i = 1) unter Zugrundelegung der für dieses Teilobjekt (O1) erlaubten Transformationen (T0,1) hinsichtlich Lage und Form bezüglich eines festlegbaren Bildursprungs erfolgt.
  10. Verfahren nach einem der Ansprüche 2 bis 8, dadurch gekennzeichnet, dass die Suche nach den hierarchisch geordneten Teilobjekten (Oi) innerhalb der Bilddatei in einem ersten Schritt ausschließlich unter Zugrundelegung der jeweilig erlaubten Transformationen (Th,i) erfolgt, dass im Falle des Nichtauffindens eines Teilobjektes (Oi) alternativ nach zwei Suchstrategien vorgegangen wird: a) Suche nach Teilobjekten, die unmittelbar auf das nicht aufgefundene Teilobjekt folgen, unabhängig von ihrer Lage in der digitalen Bilddatei oder b) Suche nach Teilobjekten, die unmittelbar auf das nicht aufgefundene Teilobjekt folgen, unter den Transformationen, die sich durch Verknüpfung aller Transformationen ausgehend vom in der Hierarchie zuletzt gefundenen Teilobjekt ergeben.
  11. Verfahren nach einem der Ansprüche 1 bis 10, dadurch gekennzeichnet, dass das Abbruchkriterium dem Nichtauffinden eines oder mehrerer Teilobjekte (Oi) in einer für den Suchvorgang festgelegten Suchzeit oder Suchaufwandes entspricht.
  12. Verfahren nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, dass die Teilobjekte (Oi) in Form von Objektmodellen dargestellt werden, die entweder als Grauwertschablonen oder als Objektkonturen vorliegen.
  13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass in Abhängigkeit des Darstellungsmodells für die Teilobjekte (Oi) die digitale Bilddatei in Form einer Grauwertdarstellung oder in Form eines Konturmodells überführt wird.
  14. Verfahren nach einem der Ansprüche 1 bis 14, dadurch gekennzeichnet, dass die Suche nach einem Teilobjekt (Oi) innerhalb der digitalen Bilddatei durch einen Anpassvorgang sowie einer Minimierung einer Distanzfunktion zwischen dem Teilobjekt (Oi) und einer Darstellungsform in der digitalen Bilddatei durchgeführt wird.
DE10160115A 2001-12-07 2001-12-07 Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei Expired - Fee Related DE10160115B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE10160115A DE10160115B4 (de) 2001-12-07 2001-12-07 Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10160115A DE10160115B4 (de) 2001-12-07 2001-12-07 Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei

Publications (2)

Publication Number Publication Date
DE10160115A1 DE10160115A1 (de) 2003-06-26
DE10160115B4 true DE10160115B4 (de) 2006-06-14

Family

ID=7708347

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10160115A Expired - Fee Related DE10160115B4 (de) 2001-12-07 2001-12-07 Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei

Country Status (1)

Country Link
DE (1) DE10160115B4 (de)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HABERÄCKER, P.: "Praxis der Digitalen Bildverar- beitung und Mustererkennung" Carl Hanser Verlag München Wien, 1995, S. 329-334 *

Also Published As

Publication number Publication date
DE10160115A1 (de) 2003-06-26

Similar Documents

Publication Publication Date Title
EP0409310B1 (de) Verfahren sowie Anordnung zum Bestimmen von Kanten in Bildern
DE102009036474B4 (de) Bilddaten-Kompressionsverfahren, Mustermodell-Positionierungsverfahren bei Bildverarbeitung, Bildverarbeitungsvorrichtung, Bildverarbeitungsprogramm und computerlesbares Aufzeichnungsmedium
DE3722444C2 (de) Verfahren und Vorrichtung zum Erzeugen von Entwurfsmusterdaten
DE10043460C2 (de) Auffinden von Körperpartien durch Auswerten von Kantenrichtungsinformation
DE112009004371T5 (de) Kollisionsbestimmungsvorrichtung und Kollisionsbestimmungsprogramm
DE3608438A1 (de) Verfahren zum berechnen von freien gekruemmten flaechen mittels computergestuetztem design cad und computergestuetzter herstellung cam und numerischer steuerung nc
DE102007028226A1 (de) Auswertungsverfahren für eine zeitliche Sequenz von Röntgenbildern und hiermit korrespondierende Gegenstände
DE112010002677T5 (de) Verfahren und vorrichtung zum bestimmen einer formübereinstimmung in drei dimensionen
DE112019002848T5 (de) System und verfahren zum auffinden und klassifizieren von mustern in einem bild mit einem bildverarbeitungssystem
DE3815869C2 (de)
DE102006045828B4 (de) Verfahren und Vorrichtung zum Erkennen eines Gesichts sowie ein Gesichtserkennungsmodul
DE10017551C2 (de) Verfahren zur zyklischen, interaktiven Bildanalyse sowie Computersystem und Computerprogramm zur Ausführung des Verfahrens
WO2008034599A2 (de) Verfahren und vorrichtung zur bildverarbeitung
EP1766579A2 (de) Verfahren zur detektion geometrischer strukturen in bildern
EP1709587B1 (de) Bildverarbeitungssystem
EP2622540A1 (de) Verfahren zur klassifizierung von mustern in bilddatensätzen
DE10160115B4 (de) Verfahren zur Detektion eines geometrischen Objektes in einer digitalen Bilddatei
DE3238300A1 (de) Verfahren und vorrichtung zur muster- oder zeichenerkennung
DE112020007889T5 (de) Bildverarbeitungseinrichtung, programm und bildverarbeitungsverfahren
DE102020208080A1 (de) Erkennung von Objekten in Bildern unter Äquivarianz oder Invarianz gegenüber der Objektgröße
DE102019008531A1 (de) Verfahren zur bildbasierten Objekterkennung mittels Bounding-Boxes und Non-Maximum Suppression (NMS) in Straßenverkehrsszenen
EP0195281B1 (de) Schaltungsanordnung für die Bildverarbeitung
DE102004050942B4 (de) Bootstrap-Verfahren zum überwachten Einlernen eines Mustererkennungssystems
DE102011075877A1 (de) Auswertungsverfahren für eine Folge von zeitlich aufeinander folgenden Tiefenbildern
DE112022001435T5 (de) Teilsucheinrichtung, teilsuchprogramm und teilsuchverfahren

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R084 Declaration of willingness to licence
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee