DE10304360A1 - Unstarre Bilderfassung unter Verwendung von Abstandsfunktionen - Google Patents

Unstarre Bilderfassung unter Verwendung von Abstandsfunktionen

Info

Publication number
DE10304360A1
DE10304360A1 DE10304360A DE10304360A DE10304360A1 DE 10304360 A1 DE10304360 A1 DE 10304360A1 DE 10304360 A DE10304360 A DE 10304360A DE 10304360 A DE10304360 A DE 10304360A DE 10304360 A1 DE10304360 A1 DE 10304360A1
Authority
DE
Germany
Prior art keywords
shape
source
target
local
global
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10304360A
Other languages
English (en)
Inventor
Nikolaos Paragios
Visvanathan Ramesh
Mikael Rousson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Medical Solutions USA Inc
Original Assignee
Siemens Corporate Research Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Corporate Research Inc filed Critical Siemens Corporate Research Inc
Publication of DE10304360A1 publication Critical patent/DE10304360A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/149Segmentation; Edge detection involving deformable models, e.g. active contour models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10012Stereo images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

Ein System und Verfahren zur unstarren Bilderfassung unter Verwendung von Abstandsfunktionen umfasst Abschnitte zum Empfang einer Quellform in einem Bildraum, welcher ein globales lineares Erfassungsmodell mit lokalen Deformationen zur Beurteilung der Quellform integriert, eine Funktion optimiert, welche durch einen Parameter- oder Merkmalsraum definiert wird, wobei die Funktion die Ähnlichkeit zwischen der Quellform und einer Zielform hinsichtlich Abstandsfunktionen quantifiziert, einen erweiterten Erfassungsraum erzeugt, welcher eine Vielzahl von Klonen der Zielform umfasst, welche kohärent im Bildraum positioniert werden, bewegliche Verbindungen zwischen der Quellform und den Zielformen und Klonen durch ein Level-Set-Verfahren verfolgt und die Quellform durch Suche gemeinsamer Entsprechungen zwischen der Quellform, der Zielform und den Klonen der Zielform erfasst.

Description

    RÜCKVERWEIS AUF VERWANDTE PATENTANMELDUNG
  • Diese Patentanmeldung beansprucht den Nutzen der vorläufigen U.S. Patentanmeldung mit Aktenzeichen 60/353,371 (Patentanwaltsverzeichnis Nr. 2002P01771US), aufgenommen am 1. Februar 2002 mit dem Titel "Matching Distance Functions: A Shape-to-Area Variational Approach for Global-to-Local Registration", welche hiermit durch Verweis in ihrer Gesamtheit aufgenommen ist.
  • STAND DER TECHNIK
  • Die Bilderfassung ist eine herausfordernde Anwendung beim Computersehen und bei der Bildverarbeitung. Man trifft sie in Gebieten wie beispielsweise der Fernerkundung, der biomedizinischen Bildgebung, der Datenindizierung und -abfrage (z. B. digitale Archive), der Überwachung, der Nachproduktion (z. B. Verfolgung, Stereo-Rekonstruktion von mehrfachen Ansichten) und dergleichen an. Viele dieser Anwendungen schließen Daten von mehreren Modalitäten (z. B. biomedizinische Bildgebung) ein, welche sich gegenseitig ergänzende Informationen bereitstellen. Um jedoch richtig verwendet zu werden, erfordert es einen Integrations-/Kombinations-/Fusionsschritt. Verschiedene Anwendungen des Computersehens erfordern die Extraktion bestimmter Strukturen von Interesse, nämlich die Segmentierung der visuellen Informationen. Trotz der Tatsache, dass diese Strukturen eine ähnliche Herkunft aufweisen, können sie bestimmte Grade der Variabilität bieten.
  • Das kardiologische Beispiel bei der biomedizinischen Bildgebung ist typisch. Die Form des Herzens variiert mit Alter, Geschlecht, Ethnizitäten und dergleichen. Zusätzlich kann die Herzform durch Herz- Kreislauferkrankungen beschädigt werden. Bei der medizinischen Bildanalyse gibt es einen starken Bedarf für den Bild- und Formenabgleich. Das Ergebnis dieses Verfahrens kann als eine medizinische Hilfe verwendet werden. Die Bildanalyse in Dokumenten und die Mustererkennung sind auch Gebiete, wo Formerfassung und -abgleich wichtig sind. Hier unterscheiden sich die Schriftbilder von Einzelpersonen, obwohl sie sich auf die gleiche Buchstabengrundlage beziehen.
  • Das Erkennungsproblem kann geeignet gelöst werden, falls die Formen zuerst abgeglichen werden. Das Problem der Erfassung geometrischer Formen ist ein komplexer Sachverhalt beim Sehen, bei der grafischen und der medizinischen Bildgebung. Es wurde in verschiedenen Formen untersucht. Eine allgemeine Erfassungsformel kann wie folgt angegeben werden: gegeben seien zwei Formen, eine Eingabe D und ein Ziel S, sowie ein Unterschiedlichkeitsmaß; man finde die beste Transformation, welche jedem Punkt von D einen entsprechenden Punkt in S zuordnet und das Unterschiedlichkeitsmaß zwischen der transformierten Form V und dem Ziel S minimiert. Diese Unterschiedlichkeit kann entweder bei formbasierten Verfahren entlang der Kontur oder bei flächenbasierten Verfahren im gesamten Gebiet, wie es durch die Kontur festgelegt wird, definiert werden. Das Formerfassungsproblem kann vom Formerkennungsproblem separiert werden. Im Erkennungsszenario können Entsprechungen zwischen den Formen als bekannt betrachtet werden. Es ist dann die Aufgabe, aus einer gegebenen Menge von Beispielen die Form zu finden, welche das niedrigere Unterschiedlichkeitsmaß mit dem Ziel bietet. Alternativ wurden Verfahren zur Formerkennung untersucht, welche keine Entsprechung erfordern und auf dem Vergleich einiger globaler Eigenschaften der Form beruhen.
  • KURZFASSUNG
  • Diese und andere Missstände und Nachteile des Stands der Technik werden von einem System und Verfahren zur unstarren Erfassung unter Verwendung von Abstandsfunktionen angesprochen.
  • Ein System und entsprechendes Verfahren zur unstarren Bilderfassung unter Verwendung von Abstandsfunktionen umfasst Abschnitte zum Empfang einer Quellform in einem Bildraum, welcher ein globales lineares Erfassungsmodell mit lokalen Deformationen zur Beurteilung der Quellform integriert, eine Funktion optimiert, welche durch einen Parameter- oder Merkmalsraum definiert wird, wobei die Funktion die Ähnlichkeit zwischen der Quellform und einer Zielform hinsichtlich Abstandsfunktionen quantifiziert, einen erweiterten Erfassungsraum erzeugt, welcher mehrere Klone der Zielform umfasst, welche kohärent im Bildraum positioniert werden, bewegliche Verbindungen zwischen der Quellform und den Zielformen und Klonen durch ein Level-Set-Verfahren verfolgt und die Quellform durch Suchen gemeinsamer Entsprechungen zwischen der Quellform, der Zielform und den Klonen der Zielform erfasst.
  • Diese und andere Gesichtspunkte, Merkmale und Vorteile der vorliegenden Offenbarung werden durch die folgende Beschreibung beispielhafter Ausführungsformen offenkundig werden, welche in Verbindung mit den begleitenden Zeichnungen gelesen werden muss.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • Die vorliegende Offenbarung lehrt die unstarre Bilderfassung unter Verwendung von Abstandsfunktionen gemäß den folgenden beispielhaften Figuren. Es zeigen:
  • Fig. 1 eine schematische Darstellung einer beispielhaften starren Erfassung einer Hand mit synthetischer Bewegung;
  • Fig. 2 eine schematische Darstellung (1) einer starren Erfassung eines Körpers mit synthetischer Bewegung und verschiedenen Subjekten und (2) einer starren Erfassung eines Körpers mit realer Bewegung;
  • Fig. 3 eine schematische Darstellung der Durchführung des offenbarten Moduls unter verschiedenen Anfangsbedingungen mit empirischer Bewertung der Kostenfunktion, wobei der Maßstab und die Drehung bekannt sind, die Translation jedoch in (i.1) entdeckt werden muss, die Translation in x und der Maßstab bekannt sind, die Translation in y und die Drehung jedoch in (i.2) entdeckt werden müssen, die Translation in x und die Drehung bekannt sind, die Translation in y und der Maßstab jedoch in (ii.1) entdeckt werden müssen und die Translation in x und Translation in y bekannt sind, die Drehung und der Maßstab jedoch in (ii.2) entdeckt werden müssen;
  • Fig. 4 eine schematische Darstellung einiger Ergebnisse der Leistung eines zusätzlichen Terms für eine globale-nach-lokale starre Erfassung eines Körpers mit synthetischer Bewegung und verschiedenen Subjekten;
  • Fig. 5 eine schematische Darstellung von (1) globalen, (2) globalen-nach-lokalen Erfassungen und (3) einer lokalen Erfassung mit Regelungsnebenbedingungen;
  • Fig. 6 eine schematische Darstellung starrer Erfassungen für starre Objekte für verschiedene Anfangsbedingungen;
  • Fig. 7 eine schematische Darstellung einer empirischen Bewertung für (a) die Anfangsbedingungen und (b) die Erfassungsergebnisse, mit Leistungs- oder Erfassungsverhältnissen von 100% in beiden Fällen;
  • Fig. 8 eine schematische Darstellung einer kardiologischen Ultraschallerfassung für reale Subjekte mit realer und synthetischer Bewegung und (a) die Anfangsbedingungen, (b) die Erfassungsergebnisse, (i) verschiedene Quellformen und (ii) die empirische Bewertung mit einem Erfassungsleistungsverhältnis von 100%;
  • Fig. 9 eine schematische Darstellung einer empirischen Bewertung mit (a) Anfangsbedingungen und (b) Erfassungsergebnissen für Erfassungsleistungsverhältnisse von (i) 100% bzw. (ii) 77%;
  • Fig. 10 eine schematische Darstellung der starren Erfassung für unstarre Objekte, welche synthetische Bewegung zeigen, wobei jede Zeile einem unterschiedlichen Fall entspricht mit (a) Anfangsbedingungen, (b und c) Zwischenergebnissen und (d) Erfassungsergebnissen; sowie
  • Fig. 11 ein Blockdiagramm eines Systems zur unstarren Bilderfassung unter Verwendung von Abstandsfunktionen gemäß einer illustrativen Ausführungsform der vorliegenden Offenbarung.
  • AUSFÜHRLICHE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN 1. Einleitung
  • Die vorliegende Offenbarung betrifft die Erfassung geometrischer Formen. Ein primäres Merkmal ist die Verwendung einer einfachen und robusten Darstellung der Form mit Abstandsfunktionen für den globalen-nach- lokalen Abgleich. Es wird ein starr-unveränderliches Abweichungsbezugssystem bereitgestellt, welches gut mit lokalen unstarren Transformationen fertig wird. Die Erfassungsabbildung umfasst ein lineares Bewegungsmodell und ein lokales Deformationsfeld, welches inkrementell gewonnen wird. Zur Demonstration des Leistungsvermögens der gewählten Darstellung wird ein einfaches Kriterium der Summe der Abweichungsquadrate betrachtet. Es wurden eine empirische Plausibilitätsprüfung und viel versprechende Ergebnisse mit Beispielen erhalten, welche eine starke globale Bewegung sowie wichtige lokale Deformationen und willkürliche topologische Veränderungen zeigen.
  • Die vorliegende Offenbarung richtet sich auf den Gesichtspunkt der Erfassung statt des Abgleichs und der Erkennung von Formen. Formenabgleich und -erfassung wurden unter verschiedenen Blickwinkeln betrachtet. Ihre Klassifizierung ist nicht geradlinig, obwohl die Verwendung der folgenden Kriterien eine sinnvolle Auswahl ist: (i) Natur und Domäne der Transformation und (ii) Optimierungsverfahren. Eine Komponente des Erfassungsverfahrens ist das zugrunde gelegte Bewegungsmodell oder die Natur der Transformation, welche zur Abbildung der Quellform auf das Ziel verwendet wird. Die Auswahl der Bewegungstransformation beeinflusst die Leistung des Erfassungsverfahrens.
  • Wie in Fig. 1 gezeigt, wird eine beispielhafte starre Erfassung einer Hand mit synthetischer Bewegung allgemein durch die Referenzziffer 100 bezeichnet. Hier wird die starre Hand 102 jeweils durch die sequenziellen Bewegungsdarstellungen 104 bis 118 überlagert.
  • Unter Bezugnahme auf Fig. 2 zeigt (1) eine starre Erfassung eines Körpers mit synthetischer Bewegung und verschiedenen Subjekten, welche allgemein durch die Referenzziffer 200 bezeichnet ist, und zeigt (2) eine starre Erfassung eines Körpers mit realer Bewegung, welche allgemein durch die Referenzziffer 250bezeichnet ist. Ein erstes starres Subjekt 202 wird jeweils durch die sequenziellen Bewegungsdarstellungen 204 bis 220 überlagert. Ein zweites starres Subjekt 252 wird jeweils durch die sequenziellen Bewegungsdarstellungen 254 bis 268 überlagert.
  • Jetzt unter Bezugnahme auf Fig. 3 werden die Leistungen des offenbarten Moduls unter verschiedenen Anfangsbedingungen mit empirischer Bewertung der Kostenfunktion allgemein durch die Referenzziffern 300, 320, 340 bzw. 360 bezeichnet. Der Kostenfunktion 300 sind der Maßstab und die Drehung bekannt, die Translation muss jedoch entdeckt werden. Der Kostenfunktion 320 sind die Translation in x und der Maßstab bekannt, die Translation in y und die Drehung müssen jedoch entdeckt werden. Der Kostenfunktion 340 sind die Translation in x und die Drehung bekannt, die Translation in y und der Maßstab müssen jedoch entdeckt werden. Und der Kostenfunktion 360 sind die Translation in x und die Translation in y bekannt, die Drehung und der Maßstab müssen jedoch entdeckt werden.
  • Wie in Fig. 4 gezeigt, werden die Ergebnisse der Leistung eines zusätzlichen Terms für eine globale- nach-lokale starre Erfassung eines Körpers mit synthetischer Bewegung und verschiedenen Subjekten allgemein durch die Referenzziffer 400 bezeichnet. Ein starrer Körper 402 wird mit einem ersten Subjekt überlagert, wobei das Subjekt eine sequenzielle synthetische Bewegung aufweist, wie jeweils durch 404 bis 410 bezeichnet ist. Der starre Körper 402 wird mit einem zweiten Subjekt überlagert, wobei das Subjekt eine sequenzielle synthetische Bewegung aufweist, wie jeweils durch 412 bis 418 bezeichnet ist.
  • Unter Bezugnahme auf Fig. 5 werden die Erfassungen für (1) die globale, (2) die globale-nach-lokale und (3) die lokale Erfassung mit Regelungsnebenbedingungen allgemein durch die Referenzziffer 500 bezeichnet. Hier wird ein starrer Körper 502 im Fall der globalen Erfassung jeweils mit sequenziellen synthetischen Bewegungen 510 bis 516 überlagert. Der starre Körper 502 wird im globalen-nach-lokalen Fall jeweils mit sequenziellen synthetischen Bewegungen 520 bis 526 überlagert. Und der starre Körper 502 wird im lokalen Fall jeweils mit sequenziellen synthetischen Bewegungen 530 bis 536 überlagert.
  • Jetzt unter Bezugnahme auf Fig. 6 werden starre Erfassungen starrer Objekte mit verschiedenen Anfangsbedingungen allgemein durch die Referenzziffer 600 bezeichnet. Hier wird ein starrer Körper 602 im Fall der globalen Erfassung jeweils mit sequenziellen synthetischen Bewegungen 610 bis 614 bzw. mit Erfassungsergebnis 616 überlagert. Der starre Körper 602 wird im globalen-nach-lokalen Fall jeweils mit sequenziellen synthetischen Bewegungen 620 bis 624 bzw. mit Erfassungsergebnis 626 überlagert. Und der starre Körper 602 wird im lokalen Fall jeweils mit sequenziellen synthetischen Bewegungen 630 bis 634 bzw. mit Erfassungsergebnis 636 überlagert.
  • Wie in Fig. 7 gezeigt, wird eine empirische Verwertung für (a) Anfangsbedingungen und (b) Erfassungsergebnisse mit Leistungs- oder Erfassungsverhältnissen von 100% in jedem Fall allgemein durch die Referenzziffer 700 bezeichnet. Hier wird eine erste starre Hand 702 mit einer Anfangsbedingung 704 überlagert, um das Erfassungsergebnis 706 zu erhalten. Die starre Hand 702 wird mit einer Anfangsbedingung 708 überlagert, um das Erfassungsergebnis 710 zu erhalten. Die starre Hand 702 wird mit einer Anfangsbedingung 712 überlagert, um das Erfassungsergebnis 714 zu erhalten, und die starre Hand 702 wird mit einer Anfangsbedingung 716 überlagert, um das Erfassungsergebnis 718 zu erhalten, wobei jedes der jeweiligen Erfassungsergebnisse ein Verhältnis von 100% zeigt.
  • Eine zweite starre Form 752 wird mit einer Anfangsbedingung 754 überlagert, um das Erfassungsergebnis 756 zu erhalten. Die starre Form 752 wird mit einer Anfangsbedingung 758 überlagert, um das Erfassungsergebnis 760 zu erhalten. Die starre Form 752 wird mit einer Anfangsbedingung 762 überlagert, um das Erfassungsergebnis 764 zu erhalten, und die starre Form 752 wird mit einer Anfangsbedingung 766 überlagert, um das Erfassungsergebnis 768 zu erhalten, wobei jedes dieser jeweiligen Erfassungsergebnisse auch ein Verhältnis von 100% zeigt.
  • Unter Bezugnahme auf Fig. 8 wird eine kardiologische Ultraschallerfassung für reale Subjekte allgemein durch die Referenzziffer 800 bezeichnet, mit realer und synthetischer Bewegung für (a) Anfangsbedingungen und (b) Erfassungsergebnisse und sowohl (i) für verschiedene Quellformen als auch (ii) für die empirische Bewertung mit Erfassungsleistungsverhältnissen von 100% gezeigt. Hier wird die starre kardiologische Form 802 mit einer realen Anfangsbedingung 804 überlagert, um das Erfassungsergebnis 806 zu erhalten. Die starre Form 802 wird mit einer realen Anfangsbedingung 808 überlagert, um das Erfassungsergebnis 810 zu erhalten. Die starre Form 802 wird mit einer realen Anfangsbedingung 812 überlagert, um das Erfassungsergebnis 814 zu erhalten, und die starre Form 802 wird mit einer realen Anfangsbedingung 816 überlagert, um das Erfassungsergebnis 818 zu erhalten, wobei jedes der jeweiligen Erfassungsergebnisse ein Verhältnis von 100% zeigt.
  • Die starre kardiologische Form 802 wird mit einer synthetischen Anfangsbedingung 854 überlagert, um das Erfassungsergebnis 856 zu erhalten. Die starre Form 802 wird mit einer synthetischen Anfangsbedingung 858 überlagert, um das Erfassungsergebnis 860 zu erhalten. Die starre Form 802 wird mit einer synthetischen Anfangsbedingung 862 überlagert, um das Erfassungsergebnis 864 zu erhalten, und die starre Form 802 wird mit einer synthetischen Anfangsbedingung 866 überlagert, um das Erfassungsergebnis 868 zu erhalten, wobei jedes dieser jeweiligen Erfassungsergebnisse auch ein Verhältnis von 100% zeigt.
  • Jetzt unter Bezugnahme auf Fig. 9 wird eine empirische Bewertung mit (a) Anfangsbedingungen und (b) Erfassungsergebnissen für Erfassungsleistungsverhältnisse von (i) 100% bzw. (ii) 77% allgemein durch die Referenzziffer 900 bezeichnet. Hier wird eine starre Hand 902 mit einer Anfangsbedingung 904 überlagert, um das Erfassungsergebnis 906 zu erhalten. Die starre Hand 902 wird mit einer Anfangsbedingung 908 überlagert, um das Erfassungsergebnis 910 zu erhalten. Die starre Hand 902 wird mit einer Anfangsbedingung 912 überlagert, um das Erfassungsergebnis 914 zu erhalten, und die starre Hand 902 wird mit einer Anfangsbedingung 916 überlagert, um das Erfassungsergebnis 918 zu erhalten, wobei die Erfassungsergebnisse ein Verhältnis von 100% zeigen.
  • Die starre Hand 902 wird mit einer Anfangsbedingung 954 überlagert, um das Erfassungsergebnis 956 zu erhalten. Die starre Hand 902 wird mit einer Anfangsbedingung 958 überlagert, um das Erfassungsergebnis 960 zu erhalten. Die starre Hand 902 wird mit einer Anfangsbedingung 962 überlagert, um das Erfassungsergebnis 964 zu erhalten, und die starre Hand 902 wird mit einer Anfangsbedingung 966 überlagert, um das Erfassungsergebnis 968 zu erhalten, wobei die Erfassungsergebnisse ein Verhältnis von 77% zeigen.
  • Wie in Fig. 10 gezeigt, wird eine starre Erfassung für unstarre Objekte, welche synthetische Bewegung zeigen, allgemein durch die Referenzziffer 1000 bezeichnet, wobei jede Zeile einem unterschiedlichen Fall mit (a) Anfangsbedingungen, (b und c) Zwischenergebnissen und (d) Erfassungsergebnissen entspricht. Hier wird ein starrer Körper 1002 in einem ersten Erfassungsfall mit Anfangsbedingung 1010 überlagert, wobei die Zwischenergebnisse der sequenziellen synthetischen Bewegung 1012 und 1014 mit dem Erfassungsergebnis 1016 erhalten werden. Der starre Körper 1002 wird in einem zweiten Erfassungsfall mit Anfangsbedingung 1020 überlagert, wobei die Zwischenergebnisse der sequenziellen synthetischen Bewegung 1022 und 1024 mit dem Erfassungsergebnis 1026 erhalten werden. Der starre Körper 1002 wird in einem dritten Erfassungsfall mit Anfangsbedingung 1030 überlagert, wobei die Zwischenergebnisse der sequenziellen synthetischen Bewegung 1032 und 1034 mit dem Erfassungsergebnis 1036 erhalten werden. Der starre Körper 1002 wird in einem vierten Erfassungsfall mit Anfangsbedingung 1040 überlagert, wobei die Zwischenergebnisse der sequenziellen synthetischen Bewegung 1042 und 1044 mit dem Erfassungsergebnis 1046 erhalten werden. Der starre Körper 1002 wird in einem fünften Erfassungsfall mit Anfangsbedingung 1050 überlagert, wobei die Zwischenergebnisse der sequenziellen synthetischen Bewegung 1052 und 1054 mit dem Erfassungsergebnis 1056 erhalten werden, und der starre Körper 1002 wird in einem sechsten Erfassungsfall mit Anfangsbedingung 1060 überlagert, wobei die Zwischenergebnisse der sequenziellen synthetischen Bewegung 1062 und 1064 mit dem Erfassungsergebnis 1066 erhalten werden.
  • Fig. 11 zeigt ein Blockdiagramm eines Systems 1100 zur unstarren Bilderfassung unter Verwendung von Abstandsfunktionen gemäß einer illustrativen Ausführungsform der vorliegenden Offenbarung. Das System 1100 umfasst wenigstens einen Prozessor oder eine Zentraleinheit ("CPU") 1102, welche in Signalkommunikation mit einem System-Bus 1104 steht. Ein Nur-Lese-Speicher ("ROM") 1106, ein Schreib-/Lesespeicher ("RAM") 1108, ein Anzeigeadapter 1110, ein E/A-Adapter 1112, ein Benutzerschnittstellenadapter 1114, ein Kommunikationsadapter 1128 und ein Videoadapter 1130stehen auch mit dem System-Bus 1104 in Signalkommunikation.
  • Eine Anzeigeeinheit 1116 steht über den Anzeigeadapter 1110 in Signalkommunikation mit dem System-Bus 1104, eine Plattenspeichereinheit 1118, wie beispielsweise, eine magnetische oder optische Plattenspeichereinheit, steht über den E/A-Adapter 1112 in Signalkommunikation mit dem System-Bus 1104. Eine Maus 1120, eine Tastatur 1122 und eine Blickbewegungsvorrichtung 1124 stehen über den Benutzerschnittstellenadapter 1114 in Signalkommunikation mit dem System-Bus 1104. Eine Videobildgebungsvorrichtung oder Kamera 1132 steht über den Videoadapter 1130 in Signalkommunikation mit dem System-Bus 1104.
  • Eine Optimierungseinheit 1170 und eine Erfassungseinheit 1180 sind auch in das System 1100 und in die Signalkommunikation mit der CPU 1102 und dem System-Bus 1104 eingeschlossen. Die Optimierungseinheit 1170 und die Erfassungseinheit 1180 sind zwar mit dem wenigstens einen Prozessor oder CPU 1102 verbunden dargestellt, diese Komponenten werden jedoch vorzugsweise in Computerprogrammcode ausgedrückt, welcher in wenigstens einem der Speicher 1106, 1108 und 1118 gespeichert ist, wobei der Computerprogrammcode durch die CPU 1102 ausgeführt wird.
  • Wie Durchschnittsfachleute der betreffenden Technik auf der Grundlage der Lehren hierin erkennen werden, sind alternative Ausführungsformen möglich, wie beispielsweise die Verkörperung von Teilen oder des gesamten Computerprogrammcodes in Registern, welche auf einem Prozessor-Chip lokalisiert 1102 sind. Angesichts der Lehren der Offenbarung, welche hier bereitgestellt werden, werden Durchschnittsfachleute der betreffenden Technik verschiedene alternative Konfigurationen und Implementierungen der Optimierungseinheit 1170 und der Erfassungseinheit 1180 sowie der anderen Elemente des Systems 1100 in Betracht ziehen, welche innerhalb des Schutzumfangs und des Geists der vorliegenden Offenbarung liegen.
  • 1.1 Bewegungsmodell und Erfassungsdomäne
  • Starre Transformationen beziehen sich auf Translation, Drehung und Maßstab. Sie beziehen sich auf einen Kompromiss zwischen geringer Komplexität und akzeptablem Abgleich zwischen den verschiedenen Strukturen. Ihre Unfähigkeit, mit unstarren Formen fertig zu werden, welche lokalen Deformationen unterliegen, ist eine beträchtliche Einschränkung. Die affine Transformation kann eine größere Familie von Deformationen bewältigen. Eine derartige Auswahl ist sehr populär bei der Objektverfolgung und setzt voraus, dass sich bewegende Objekte oder Formen planar sind. Bild- und Formerfassung sind zwei andere Bereiche, in welchen affine Modelle mit viel versprechendem Leistungsvermögen bei Bildern/Formen betrachtet wurden, welche Scherung zeigen. Auch die Verwendung der projektiven Geometrie wurde zum Abgleich von Formen in Betracht gezogen. Diese Verfahrensweise kann perspektivische Projektionen und starre Verschiebungen gemeinsam bewältigen und ist für Formen geeignet, welche "schief" erscheinen. Gekrümmte oder elastische Erfassungsverfahren gehen über die Voraussetzung planarer Objekte hinaus und können lokale Deformationen besser bewältigen.
  • Deformierbare Vorlagen sind gewöhnliche Werkzeuge bei der Bildsegmentierung und -erfassung. Die zu entdeckende Form wird unter Verwendung eines Satzes von grundlegenden Funktionen und einem Satz von Steuerungspunkten parametrisiert. Die Segmentierung und/oder die Erfassung wird durch ein elastisches Verfahren erhalten, welches am besten zum Modell der Bildmerkmale oder der Zielform passt. Die Auswahl des Erfassungsmodells betrifft auch die Transformationsdomäne. Es wird vorausgesetzt, dass globale Bewegungsmodelle für den zu erfassenden Gesamtbereich oder das Bild gültig sind.
  • Lokale Deformationen beziehen sich auf pixelweise Erfassungskomponenten. Lokal Erfassungsdomänen sind für Objekte geeignet, welche lokale Deformationen durchmachen. Entsprechungen werden durch einen vom Bildvolumen definierten Erfassungsfluss erhalten, welcher über die Pixel variiert. Es werden Abhängigkeiten über kleine Umgebungen hinweg eingeführt, um die Regelmäßigkeit der Erfassungsabbildung zu gewährleisten und das schlecht gestellte Interferenzproblem zu lösen. Diese Verfahren zeigen eine starke Empfindlichkeit gegenüber Rauschen und versagen bei der Bewältigung von großen Bewegungen, wenn sie nicht richtig initialisiert werden. Ihre Fähigkeit, mit unstarrer Bewegung fertig zu werden, macht sie ziemlich attraktiv. Anders als die lokalen Erfassungsverfahren sind globale Transformationen für die gesamte Form gültig. Entsprechungen zwischen dem Ziel D und der Quelle S werden durch Anwendung der gleichen parametrischen Transformation erhalten. Robustheit ist eine Schlüsseleigenschaft dieser Verfahren.
  • Die Abschätzung der Erfassungsparameter kann wegen der signifikanten Anzahl von Bereichspixeln, welche für Messungen zur Lösung des Interferenzproblems verfügbar sind, zuverlässig ausgeführt werden. Andererseits leisten derartige Verfahren wenig, wenn die Voraussetzungen bezüglich des Erfassungsproblems von der Form der Transformation nicht erfüllt sind, wie beispielsweise bei unstarrer Bewegung. Weder die Auswahl der Transformation noch die Domäne sind ausreichend zur Bestimmung der Erfassungsabbildung. Diese zwei Komponenten müssen in einem Optimierungsbezugssystem mittels der Auswahl eines Unterschiedlichkeitsmaßes integriert werden, welches die Quell- und die Zielformen, das Bewegungsmodell und die Erfassungsdomäne umfasst.
  • 1.2 Optimierungsverfahren
  • Ein Optimierungsverfahren umfasst die Auswahl eines mathematischen Bezugssystems durch Finden eines Optimums einiger Funktionen, welche durch den Parameterraum definiert sind, welcher eine Schlüsselkomponente des Erfassungsverfahrens ist. Diese Funktionen versuchen die Ähnlichkeit oder die Unterschiedlichkeit zwischen zwei Formen zu quantifizieren. Abweichungsbezugssysteme, stochastische Prinzipien und graphengesteuerte Verfahren sind mathematische Räume, welche betrachtet wurden. Das Optimierungsverfahren ist streng auf das mathematische Bezugssystem bezogen. Folglich ist die Verwendung von Gradientenabstiegsverfahren eine übliche Auswahl bei den Abweichungseinstellungen. Es können geometrisches Hashing sowie deterministische Relaxationsalgorithmen, wie Iterative Closest Point, Iterative Conditional Modes und dergleichen verwendet werden. Es kann auch der Merkmalsraum in Betracht gezogen werden, um zusätzliche Klassenbildung der Formerfassungsverfahren durchzuführen. Die Verwendung von Grauniveaumerkmalen, globalen Histogrammen, Bildkrümmung und dergleichen kann zu viel versprechenden Resultaten führen. Insbesondere haben sich mediane Achsen/Rahmen, Stöße, lokale Krümmung und dergleichen bei der Formerfassung hervorragend bewährt.
  • In der vorliegenden Offenbarung wird ein Abweichungsbezugssystem für den starren und unstarren Formenabgleich definiert. Es wird die Verwendung von 2D-Strukturen zur Validierung des Verfahrens betrachtet, welches auf jede beliebige Dimension erweitert werden kann. Der vorliegende Ansatz umfasst zwei Beiträge: (i) die Auswahl eines leistungsfähigen Merkmalraums und (ii) die Integration von globalen linearen Erfassungsmodellen (z. B. starr, affin und dergleichen) sowie lokaler Deformationen. Die interessierenden Strukturen (d. h. 2D-Formen) werden in einer höheren Dimension als Oberflächen betrachtet und unter Verwendung von vorzeichenbehafteten euklidischen Abstandstransformationen dargestellt. Eine derartige Auswahl erzeugt einen erweiterten Erfassungsraum, welcher aus Formklonen besteht, welche kohärent in der Bildebene positioniert werden. Die Erfassung ist dann äquivalent zur Suche gegenseitiger Entsprechungen zwischen der Quelle, der Zielform und ihren Klonen.
  • Ein Abweichungsbezugssystem, welches die globale Bewegung mit lokalen Deformationen integriert, wird zur Abschätzung der Erfassungsparameter verwendet. Dieses Bezugssystem wird am Abstandstransformationsraum definiert und zielt auf das Finden der besten Transformation zwischen den abstandsgetriebenen Repräsentationen der Quelle und des Ziels ab. Die Summe der Abweichungsquadrate zwischen diesen Repräsentationen wird als Optimierungskriterium zur Demonstration der Potenziale des Verfahrens betrachtet.
  • Zur Bewältigung komplexerer Fälle, welche Formen mit Unbestimmtheiten umfassen, wird auch ein durchdachteres Verfahren, einschließlich Erfassung und vorangehenden Lernens, vorgestellt. Die Zielfunktion betrachtet ein lineares parametrisches Modell und ein pixelweises Deformationsfeld, welches zu einem unstarren Erfassungsparadigma führt. Beide Erfassungskomponenten werden gleichzeitig durch ein Gradientenabstiegsverfahren gewonnen.
  • Das vorliegende offenbarte Verfahren führt eine globale-nach-lokale Erfassung durch, wo lokale Deformationen zur Überwindung der Beschränkungen des globalen linearen Modells verwendet werden. Es wurden ermutigende Resultate unter Verwendung von 2D-Formen erhalten. Abstandstransformationen und Level-Set- Repräsentationen wurden für die Bilderfassung/- Segmentierung in der Vergangenheit entweder als Merkmals- oder als ein Optimierungsraum betrachtet. Bei einem Verfahren wird der euklidische Abstand als der Merkmalsraum angesehen. Dann sind 2D-/3D-Objekte unter Verwendung linearer (z. B. starrer, affiner) Transformationen auf ein vorheriges Formmodell zu erfassen. Dieses Modell bezieht sich auf eine Ansammlung von Punkten, welche durch gleichmäßige Stichproben erhalten werden können.
  • Es wurden auch Abstandsabbildungen von den Rändern für den Bildabgleich betrachtet. Diese Verfahren konzentrieren sich auf globale Transformationen und können lokale Deformationen und wichtige Maßstabsvariationen nicht bewältigen. Level-Set- Repräsentationen können mit dem vorliegenden offenbarten Verfahren in Beziehung gebracht werden, wenn Abstandsabbildungen als verschachtelte Funktionen verwendet werden. Beispielsweise kann eine lokale Erfassung durch pixelweise Suche des geodätischen Wegs mit dem geringsten Aufwand zwischen der Quelle und dem Ziel gewonnen werden. Es wurde ein unterschiedlicher Ansatz betrachtet, wobei die Erfassung durch eine Kurvenentwicklungsannäherung gewonnen wird. Es wurden auch Abstandstransformationen zur Beschleunigung des Optimierungsverfahrens betrachtet. Bei einem Verfahren beispielsweise ist der Schlüsselbeitrag ein Bewegungsmodell, welches eine parametrisierte Volumentransformation mit variabler Auflösung durch Steigerung in der Nähe der Form definiert.
  • Abschnitt 2 stellt eine Darstellung der Form auf der Grundlage von Abstandstransformationen vor und zeigt, dass eine derartige Auswahl bezüglich der Translation und der Drehung invariant ist. Im Abschnitt 3 wird eine globale Erfassung unter Verwendung des Kriteriums der Summe der Abweichungsquadrate ("SSD") betrachtet, während in Abschnitt 4 lokale Deformationen vorgestellt werden. Im Abschnitt 5 werden angeleitetes Lernen und unstarre Erfassung dargestellt. Die Schlussfolgerungen und die Diskussion erscheinen in Abschnitt 6.
  • 2. Darstellung der Form
  • Eine entscheidende Komponente im Verfahren zur Erfassung beliebiger Formen ist die zugrunde gelegte Darstellung der Form, da sie das Leistungsvermögen des gewählten Erfassungsalgorithmus signifikant beeinflussen kann. Die Verwendung von punktbasierten Herstellungsmodellen, deformierbaren Modellen und Vorlagen, aktiver Formen, Fourier-Deskriptoren, medianer Achsen und Level-Set-Repräsentationen sind einige Alternativen zur Darstellung von Formen sowie ihrer Variationen. Obwohl diese Repräsentationen leistungsfähig genug sind, um eine bestimmte Anzahl von lokalen Deformationen festzuhalten, erfordern sie eine große Anzahl von Parametern, um wichtige Deformationen von Formen zu bewältigen. Ihre Erweiterungen zur Beschreibung von Strukturen höherer Dimensionen als Kurven und Oberflächen sind auch keineswegs trivial.
  • Folglich wird zur Erhaltung einer globalen-nach-lokalen Erfassung die Verwendung euklidischer Abstandsabbildungen zur Darstellung von Formen betrachtet. Eine derartige Auswahl kann lokale Deformationen bewältigen und ist bezüglich der Translation und der Drehung invariant. Zur Erleichterung der Vorstellung des Verfahrens wird der 2D-Fall betrachtet und eine Lipschitz-Funktion gewählt, welche sich auf eine Abstandstransformationsrepräsentation für eine gegebene Form S bezieht. Die Domäne ist per Definition beschränkt, da sie sich auf die Bilddomäne bezieht. Die Form definiert einen bi-modalen Abschnitt mit konvexer Hülle und Hintergrund. Mit diesen vorgegebenen Definitionen wird die folgende Repräsentation betrachtet:


    wobei sich ED((x, y), S) auf den minimalen euklidischen Abstand zwischen dem Gitterort (x, y) und der Form S bezieht. Dies ist eine Level-Set-Repräsentation von S. Der Fast-Marching-Algorithmus oder andere Verfahren können zur Konstruktion dieser Repräsentationen verwendet werden. Abstandstransformationen können einen geeigneten Merkmalsraum bereitstellen, wenn die entsprechende Zielfunktion unter Verwendung eines Gradientenabstiegsverfahrens optimiert wird. Es kann gezeigt werden, dass der Gradient ein Grenzvektor in der Richtung des Vektors der Abstandsfunktion ist. Hinreichende Bedingungen für die Konvergenz des Gradientenabstiegsverfahrens erfordern stetige erste Ableitungen. Die betrachtete Repräsentation erfüllt diese Bedingungen auf verschiedene Weise. Es kann ferner leicht bewiesen werden, dass diese Repräsentation bezüglich der Translation und der Drehung invariant ist. Es wird eine Form V betrachtet, welche nach der Drehung S um einen Winkel und nach der Translation durch einen Vektor erhalten wird:


  • Wenn dann ein Pixel (x, y) mit dem Abstand d von der Fläche D betrachtet wird, ergibt sich die folgende Beziehung:


  • Die Verwendung der inversen Transformation zwischen D und S für (1, y) führt zur folgenden Gleichung:


  • Folglich ist der Abstand zwischen dem Vektor


    und der Fläche S gegeben durch:


  • Es wurde gezeigt, dass die gewählte Repräsentation bezüglich der Drehung und der Translation invariant ist. Wenn andererseits die Transformation eine Maßstabskomponente zeigt, dann sind die gewählten Darstellungen der Form nicht invariant. Es kann leicht gezeigt werden, dass die folgende Beziehung zwischen den Level-Set-Repräsentationen von S und V unter einer Maßstabstransformation gilt:


  • Die Interpretation dieser Bedingung folgt. Wenn Entsprechungen zwischen der Quelle und dem Ziel bekannt sind, dann sind die entsprechenden Abstände proportional zum Maßstabsfaktor.
  • 3. Globale Erfassung
  • Die Erfassung ist äquivalent zum Finden einer punktweisen Transformation zwischen der aktuellen Form V und der Zielform S, welche ein gegebenes Unterschiedlichkeitsmaß minimiert. Repräsentationen der Abstandstransformation beziehen sich auf einen Raum mit einer höheren Dimension als das Original (z. B. 2D- Formen) und steigern die Problem-/Lösungspotenziale. Es kann eine Transformation A gesucht werden, welche pixelweise Intensitätsentsprechungen zwischen den Darstellungen der Quell- und der Zielform erzeugt. Man kann zeigen, dass Repräsentationen der Abstandstransformationen bezüglich der Translation und der Drehung invariant sind, während man in der Lage ist, die Wirkung von Variationen des Maßstabs vorherzusagen. Diese Bedingungen können zu der folgenden Beschränkung führen:


  • Zur Verwertung dieser Beschränkung wird die Erfassung in einem globalen Optimierungsbezugssystem betrachtet, welches alle Pixel in der Bildebene einschließt. Die Summe der Abstandsquadrate, die Optimierung des Korrelationsverhältnisses, die Maximierung der gemeinsamen Informationen und dergleichen können als ein Ähnlichkeitsmaß zwischen den Darstellungen der Quelle und des Ziels verwendet werden. Zur Vorstellung und Demonstration der Potenziale der gewählten Darstellung der Form und des vorliegenden offenbarten Verfahrens wird ein einfaches, bekanntes und verbreitet verwendetes Kriterium betrachtet: die Summe der Abweichungsquadrate ("SSD"). Folglich wird eine globale starre Deformation zwischen S und D vorausgesetzt, welche drei Parameter [A = (s, θ, T)], einen Drehungswinkel θ, einen Translationsvektor T = (Tx, Ty) und einen Maßstabsfaktor s einschließt.
  • Wie für Fig. 1 beschrieben, weist eine beispielhafte Erfassung einer starren Hand mit synthetischer Bewegung folgende Parameter auf: {s = 1,27, θ = 71,38°, Tx = -19,65, Ty = 21,32}. Folglich kann die folgende Zielfunktion zur Gewinnung der optimalen Erfassungsparameter verwendet werden:


  • Die Ausgangspositionen der Quelle S und des Ziels V können Abstandsabbildungsrepräsentationen erzeugen, welche in einer festgelegten Bildebene nicht gleich definiert sind. Zur Bewältigung dieser technischen Beschränkung sowie zur Senkung der Berechnungskomplexität werden die Gebiete betrachtet, welche durch zwei Konturen mit gleichem Abstand (innen, außen) von den Eingabeformen definiert sind:


    wobei Nδ eine binäre Funktion ist, welche gegeben ist durch:


    wobei die binäre Funktion N die folgende Interpretation aufweist: die Pixel (Isophoten) innerhalb eines Abstandsbereichs, welcher geringer als das Delta der zu erfassenden Formen ist, werden im Optimierungsverfahren betrachtet. Unter Verwendung der offenbarten Formel ist man in der Lage, ein geometrisches Punktentsprechungsproblem in eine Bilderfassungsanwendung zu konvertieren, wobei Intensitätsentsprechungen auf der Grundlage von Raum sowie Merkmalen betrachtet werden.
  • Fig. 2 zeigt (1) eine starre Erfassung eines Körpers mit synthetischer Bewegung und verschiedener Subjekte, welche folgende Parameter aufweist: {s = 0,63, θ = 59,94°, Tx = -13,97, Ty = -14,09}, und (2) eine starre Erfassung eines Körpers mit realer Bewegung. Ein Gradientenabstiegsverfahren kann zur Gewinnung der optimalen Erfassungsparameter verwendet werden:


  • Fig. 3 zeigt nun das Leistungsvermögen des offenbarten Moduls unter verschiedenen Anfangsbedingungen mit empirischer Bewertung der Kostenfunktion. Mit gegebenen starr-invarianten Erfassungskriterien kann behauptet werden, dass das Verfahren für starre Objekte geeignet ist. Die Verwendung von robusten Schätzern kann zur Bewältigung von Objekten, welche lokale Deformationen durchmachen, in Betracht gezogen werden. An diesem Ende wird eine dominierende starre Erfassungskomponente vorausgesetzt. Sie kann wegen der geringen Anzahl von Ausreißern aufgrund der Verwendung von Abstandsabbildungen, welche die Bedeutung lokaler Deformationen zurückstufen, wirksam erhalten werden. Die experimentellen Ergebnisse demonstrieren viel versprechende Potenziale des offenbarten Bezugssystems.
  • Es ist jedoch eine tiefergehende empirische Validierung erforderlich. Die Gestalt der Kostenfunktion ist ein guter Indikator hinsichtlich der Wirksamkeit und/oder der Stabilität des Bezugssystems. Nichtkonvexe Optimierungskriterien, wie das hier betrachtete, können unter den Anfangsbedingungen leiden. Beim vorliegenden offenbarten Ansatz wurde ein sehr strenger Merkmalsraum, die vorzeichenbehafteten Abstandstransformationen, betrachtet, und deshalb würde man erwarten, dass das Leistungsvermögen des Verfahrens befriedigend sein würde. Zur Durchführung einer Studie dieses Leistungsvermögens kann der unbekannte Parameterraum auf zwei Dimensionen beschränkt werden.
  • Es wurden die in Fig. 1 gezeigten Beispiele betrachtet. Dann werden aus dem 4-dimensionalen Parameterraum die folgenden Fälle aus Fig. 3 studiert:
    der Maßstab und die Drehung sind bekannt, die Translation soll entdeckt werden [Fig. (3.(i.1))]. Die Translation in x und der Maßstab sind bekannt, die Translation in y und die Drehung sollen entdeckt werden [Fig. (3.(i.2))]. Die Translation in x und die Drehung sind bekannt, die Translation in y und der Maßstab sollen entdeckt werden [Fig. (3.(ii.1))]. Die Translation in x und die Translation in y sind bekannt, die Drehung und der Maßstab sollen entdeckt werden [Fig. (3.(ii.2))].
  • Ein empirischer Bewertungstest wird betrachtet, bei welchem man den Suchraum unter Verwendung einer gleichmäßigen Stichprobenvorschrift (100 Elemente) für alle im jeweiligen Fall unbekannten Parameter quantifiziert. Die Translation in (x, y) lag im Bereich von [-50,50] × [-50,50], der Maßstab im Bereich von [0,75, 1,25] und die Drehung im Bereich von [-Π, Π]. Dann kann die Kostenfunktion im Raum der zwei unbekannten Parameter durch Betrachtung aller möglichen Kombinationen abgeschätzt werden, welche aus der Stichprobenstrategie abgeleitet wurden, wobei die anderen beiden Parameter festgelegt sind. Die resultierende Funktion, wie in Fig. 3 gezeigt, weist gute Eigenschaften auf; sie ist glatt und weist ein einzelnes globales Minimum auf.
  • Die Kostenfunktion der Fig. 3 weist eine konvexe Form für alle Kombinationen auf, welche zwei unbekannte Erfassungsvariablen einschließen. Diese beschränkte Validierung kann nicht verwendet werden, um die Konvexität der Zielfunktion zu zeigen, wenn das Erfassungsproblem in seiner vollen Dimensionalität betrachtet wird, wie beispielsweise vier Variablen der starren Transformation. Die Gestalt dieser Funktion in einem reduzierten Variablenraum ist jedoch ein guter Indikator für ein Optimierungskriterium mit glatten Eigenschaften. Die Erfassung auf starrer Basis kann eine akzeptable Lösung für eine große Anzahl von Anwendungen der Bildverarbeitung und des Computersehens sein.
  • Die medizinische Bildgebung ist ein Gebiet, in welchem unstarre Bewegung ein übliches Problem darstellt. Die Fähigkeit zur Erzeugung pixelweiser Entsprechungen zwischen physiologischen Strukturen entweder zu Vergleichszwecken oder für klinische Studien besitzt eine wichtige Priorität in der Welt der medizinischen Bildgebung.
  • 4. Globale-nach-lokale Erfassung
  • Lokale Deformationen sind wünschenswerte Erfassungskomponenten. Viele Objekte unterliegen gleichzeitig starrer und unstarrer Bewegung. Wegen des Fehlens von Informationen ist die vollständige Entdeckung des lokalen Deformationsfelds ein schlecht erklärtes Problem. Die Verwendung von Regelungstermen ist eine übliche Praxis zur Überwindung dieser Einschränkung. Die richtigen Anfangsbedingungen sind jedoch eine strenge Erfordernis für die Konvergenz dieses Verfahrens. Die Bewältigung von Bewegung im großen Maßstab ist auch eine Einschränkung von pixelweisen Erfassungsverfahren. Das bis jetzt offenbarte Bezugssystem kann globalen linearen Transformationen Rechnung tragen, welche zu viel versprechenden Ergebnissen führen. Die richtige Behandlung unstarrer Objekte (z. B. Formen) und lokaler Deformationen ist noch ein Problemkreis. Eine derartige Herausforderung kann durch Aufnahme der Idee der lokalen Deformationen in das Verfahren erfüllt werden.
  • Es kann vorausgesetzt werden, dass die beobachtete zu erfassende Form eine starre/affine oder ähnliche Transformation A des Ziels ist plus einige lokale Deformationen (U, V) für unstarre Objektteile:


  • Das lokale Deformationsfeld (u(x, y), v(x, y)) wird in der Bildebene definiert und weist nur für die unstarren Teile der zu erfassenden Form Werte auf. Diese Hypothese kann zu einem zweifachen Erfassungskriterium führen, welches ein globales Bewegungsmodell und ein lokales Deformationsfeld einschließen:


    wobei dies eine Konstante zum Ausbalancieren der Beiträge von zwei Termen ist (d. h. der globalen Bewegung und der lokalen Deformationen). Die Interpretation dieses Kriteriums folgt.
  • Erfassungsfehler, welche durch die Verwendung der starren Transformation verursacht werden, werden unter Verwendung des lokalen Deformationsfelds korrigiert. Die Gestalt dieses Kriteriums garantiert (hinsichtlich der Auswahl von a) primär die Abschätzung der starren Bewegungsparameter und dann die Entdeckung des lokalen Deformationsfelds.
  • Wie für Fig. 4 beschrieben, werden einige Ergebnisse des Leistungsvermögens dieses zusätzlichen Terms angedeutet. Es werden die gleichen Anfangsbedingungen wie die für die Validierung der starren Erfassungskomponente der Fig. 2a verwendeten betrachtet. Man kann die lokalen Korrekturen aufgrund des pixelweisen Deformationsfelds am Objektteil links unten (rechter Fuß) und oben rechts (linke Hand) erkennen. Die lokalen Deformationen steigern die Komplexität des Verfahrens signifikant. Ein einfacher Weg zur Verminderung dieser Komplexität ist die Einschränkung des Suchraums. Das lokale Deformationsfeld muss nur in der Umgebung der Quellform berechnet werden. Das offenbarte Bezugssystem schätzt das globale Bewegungsmodell sowie das lokale Deformationsfeld in einem erweiterten, von der Form getriebenen Raum ab, in welchem die Entsprechung für die ursprünglichen Formen sowie ihre Klone hergestellt wird. Die Verwendung dieses Raums verbessert das Leistungsvermögen des Erfassungsverfahrens.
  • Gleichzeitig ist es eine Aufgabe des lokalen Erfassungsfelds, lokal Deformationen und unstarre Teile zu bewältigen. Es kann vorausgesetzt werden, dass die Erfassungslösung, welche durch die starre Bewegung bereitgestellt wird, sich nahe der optimalen Lösung befindet. Deshalb müssen lokale Deformationen in einem schmalen Band berechnet werden, welches in der Umgebung der Form definiert wurde. An diesem Ende kann die offenbarte Kostenfunktion wie folgt modifiziert werden:


  • Eine derartige Modifikation der Zielfunktion senkt die Berechnungsanforderungen des Verfahrens ohne Veränderung des Leistungsvermögens signifikant. Es können einmal zu Beginn des Verfahrens räumliche Ableitungen berechnet werden, um die Konvergenzgeschwindigkeit weiter zu steigern.
  • 4.1. Glätte-Randbedingungen
  • Reale Objekte, welche Transformationen der Form unterliegen, beziehen sich auf einige physikalische Entitäten. Die Komponenten dieser Entitäten sind verbundene Elemente und müssen ähnliche Transformationen zeigen.
  • Wie für Fig. 4 beschrieben, weist eine globale-nach- lokale Erfassung eines starren Körpers mit synthetischer Bewegung und verschiedenen Subjekten die Parameter {s = 0,63, θ = 59,94°, Tx = -13,97, Ty = -14,09} auf. Die Glätte des pixelweisen Bewegungsfelds ist eine natürliche Voraussetzung der Erfassung. Lokale Deformationen können in der Pixelebene nicht unabhängig sein, und darum muss diese Bedingung während der Entdeckung des lokalen Deformationsfelds auferlegt werden.
  • Die Verwendung von Straftermen zur Einführung dieser Bedingung ist ein übliches Verfahren, wenn das Interferenzproblem gelöst wird. Terme, welche der Glätte auf dem Feld (u, v) Rechnung tragen, können in verschiedener Gestalt betrachtet werden. Die einfachste Gestalt dieser Nebenbedingung wird übernommen, obwohl komplexe und wirksamere Terme in der Literatur gefunden und auch betrachtet werden können:


  • Lokale Deformationen und Glätte werden gezeigt, wobei (Ux, Uy, Vx, Vy) die räumlichen Ableitungen des lokalen Deformationsfelds sind und Delta eine Konstante ist, welche den Trend zwischen der Qualität der lokalen Entsprechungen und der Glätte des Deformationsfelds ausbalanciert. Die Zielfunktion wurde graduell konstruiert, und darum ist ihre Interpretation offenkundig. Der erste Term zielt auf das Finden einer pixelweisen Intensität, wie beispielsweise für eine Level-Set-Repräsentation, und Entsprechungen gemäß einem globalen Bewegungsmodell ab, wie beispielsweise für eine starre Transformation. Der zweite Term zielt auf die Korrektur der Entsprechungen auf der Pixelebene unter Verwendung eines lokalen Deformationsfelds über dem existierenden globalen Modell ab, während der dritte Term diese Deformationen darauf beschränkt, lokal glatt zu sein. Unter Verwendung eines Gradientenabstiegsverfahrens können die folgenden partiellen Differenzialgleichungen für die Abschätzung der Erfassungsparameter gewonnen werden:


  • Die Auswahl des Parameters Alpha ist eine signifikante Komponente des Algorithmus, da er den global-nach- lokal-Faktor steuert. Ferner wird gemäß dieses Parameters die Konstruktion des lokalen Deformationsfelds verzögert, bis die Parameter des globalen starren Modells richtig abgeschätzt werden. Eine Alternative zu dieser Verbindung zwischen globalen und lokalen Erfassungskomponenten ist ein zweistufiger Ansatz, welcher zunächst die Abschätzung des globalen Modells und dann die lokalen Abschätzungen des Deformationsfelds einschließt. Eine derartige Auswahl kann empfindlich gegenüber den Anfangsbedingungen, Rauschen und Ausreißern sein. Ferner umfasst sie die Verwendung von Zeitmaßen zur Steuerung des Gradientenabstiegsverfahrens und kann nicht automatisch vorgenommen werden. Es kann behauptet werden, dass das offenbarte Bezugssystem die gleiche Einschränkung teilt. Ein einfacher Weg, diese Randbedingung zu überwinden, ist die Benachteiligung der Bildung eines reichhaltigen lokalen Deformationsfelds unter Verwendung seiner Größenordnung:


  • Der Nutzen der Verwendung eines derartigen Terms wird die Absenkung der Bedeutung des lokalen Deformationsfelds sein. Gleichzeitig wird ein derartiger Term zusätzliche Komplexität in das Modell einführen. Zur Bewertung des Leistungsvermögens der Erfassung des Verfahrens hinsichtlich des Parameters Alpha wurden mehrere Experimente in einem quantisierten Alpha-Raum durchgeführt. Hinsichtlich ihrer Auswahl sind die individuellen Abschätzungen des globalen Modells und der lokalen Deformationsmaße verschieden. Ihre zusätzlichen gemeinsamen Abschätzungen oder die finale Erfassung bleiben gleich, was zum gleichen gesamten Leistungsvermögen führt.
  • In Fig. 5 werden globale, globale-nach-lokale und lokale Erfassungen gezeigt: (1) global {s = 0,79, θ = 1,34°, Tx = -16,34, Ty = -15,76}, (2) global-nach- lokal {s = 0,81, θ = 2,07°, Tx = -14,97, Ty = -15,43}, (3) lokale Erfassung mit Regelungsnebenbedingungen. Dies wird in Figur (5) klar gezeigt, wobei die folgenden Extremfälle zu Demonstrationszwecken betrachtet wurden: Eine globale starre Transformation mit Alpha = 1,0 wird in Fig. 5.1 gezeigt. Eine global- nach-lokale starre Transformation mit lokalen Deformationen mit Alpha = 0,5 wird in Fig. 5.2 gezeigt, und ein lokales pixelweises Erfassungsmodell mit Alpha = 0,0 wird in Fig. 5.3 gezeigt. Das Leistungsvermögen der Erfassung des offenbarten Bezugssystems war in allen Fällen optimal/gleich.
  • Die ausgewählte Repräsentation erhält sich eine starke Erfassungskraft, da sogar das vollständige pixelweise lokale Deformationsfeld in Fällen großer Verrückungen richtig entdeckt werden kann. Obwohl es wichtig ist anzumerken, dass die Verwendung eines lokalen Deformationsfelds Unbestimmtheiten in das Erfassungsverfahren einführt. Die erfasste Form kann von der ursprünglichen abweichen und eine offene Struktur sein.
  • 5. Global-nach-lokale Erfassung mit Unbestimmtheiten
  • Ein zu vollziehender Schritt vorwärts ist die Bewältigung des Erfassungsproblems in komplexeren Szenarien, in welchen das Ziel keine Form oder Sammlung von Punkten ist, welche auf ein Abstandsfunktionsabbild konvertiert wird, sondern ein Formmodell mit lokalen Veränderlichkeitsabstufungen.
  • 5.1. Formmodell
  • Es kann ein stochastisches Bezugssystem mit zwei unbekannten Variablen betrachtet werden: Das Abbild der Form und die lokalen Abstufungen oder die Veränderlichkeit von Deformationen der Form. Es wurden ähnliche Modelle in einem anderen Zusammenhang offenbart. Dieses Modell bezieht sich auf eine Abstandsfunktion, welche irgendwelchen Veränderlichkeitsmaßen zugeordnet ist:


  • Dann ist für einen gegebenen Pixelort (x, y) und einen gegebenen Wert die bedingte Wahrscheinlichkeit, dass dieser Wert am Ort in S auftritt, gegeben durch:


  • 5.2. Stochastische Erfassung
  • Wenn dieses Modell vorgegeben wird, dann ist ein anspruchsvoller und viel versprechender Ansatz für die Erfassung einer gegebenen Form D die Maximierung der gemeinsamen Dichte zwischen dem Modell und der Eingabeform. Wenn vorausgesetzt wird, dass die bedingten Dichten des Modells über die Pixel unabhängig sind, dann ist das Optimierungskriterium äquivalent mit der Maximierung von:


    was kombiniert mit dem Regelungsterm zum folgenden Minimierungskriterium führt:


  • Für die Minimierung der definierten Funktion kann ein Gradientenabstiegsverfahren verwendet werden. Die erhaltenen Bewegungsgleichungen sind denjenigen ähnlich, welche unter Verwendung der Summe der Abstandsquadrate erhalten wurden. Sie können ferner der Veränderlichkeit des Formmodells Rechnung tragen. In der Konsequenz sind die Beiträge der Pixelorte mit hoher Veränderlichkeit weniger signifikant als diejenigen mit hoher Konfidenz im vorstehenden Modell.
  • 6. Schlussfolgerungen
  • Es wurde ein neues und relativ einfaches Bezugssystem auf der Grundlage von Veränderlichkeitsprinzipien für die globale-nach-lokale Erfassung von Formen offenbart. Das offenbarte Bezugssystem verwendet euklidische Abstandsabbildungen als Merkmalsraum.
  • Veränderlichkeitsprinzipien führen für die Formerfassung zu einem invarianten Paradigma von Maßstab/Drehung/Translation. Die Erweiterung des Verfahrens zur Bewältigung höherer Dimensionen sowie offener Strukturen wird gegenwärtig untersucht. Es wurden ermutigende experimentelle Ergebnisse (siehe z. B. Fig. 6 bis 10) unter Verwendung der Veränderlichkeiten der offenbarten Formeln erhalten.
  • Fig. 6 zeigt nun die starre Erfassung starrer Objekte (1) F-16, (2) F-15, (3) F-22. Jede Zeile entspricht einer anderen Quelle, bei welcher das Ziel das gleiche ist. Für jeden Fall werden verschiedene Anfangsbedingungen betrachtet und genauso wie das Erfassungsergebnis in verschiedenen Spalten gezeigt.
  • Die Effizienz der offenbarten Formeln wird unter Verwendung eines einfachen Optimierungskriteriums, der Summe der Abstandsquadrate, demonstriert. Auf der Grundlage der experimentellen Validierung kann man deshalb schließen, dass die gewählte Darstellung der Form ein starkes Leistungsvermögen bei der Erfassung/Unterscheidung aufweist. Sie kann ferner Okklusionen und lokale Deformationen bewältigen. Zur Validierung des vorliegenden offenbarten Ansatzes wurden Fälle mit Teilokklusionen, lokalen Deformationen und zufällig erzeugter Bewegung zwischen der Quell- und der Zielform betrachtet. Diese Formen waren Bestandteil der gleichen Familie (siehe Fig. 7, 8 und 9). Es wurden zufällige globale Transformationen auf die Quellform unter Verwendung einer 4D-Variablen angewendet, welche im Erfassungsraum (s, θ, Tx, Ty) definiert wurde:


  • Bei allen Beispielen wurden 100 Versuche unter Verwendung eines zufälligen Erzeugungsverfahrens für die Parameter der starren Transformation durchgeführt. In allen Fällen waren die Quelle und das Ziel unterschiedlich. Die erhaltenen Ergebnisse werden in [Fig. (7, 8, 9)] gezeigt. Jede Spalte entspricht einem unterschiedlichen Versuch. Die erste Zeile des Versuchs (a) bezieht sich auf die Anfangsbedingung und die zweite Zeile (b) auf das endgültige Erfassungsergebnis. Ein kleiner Ausschnitt der Anfangsbedingungen (100) wird zu Demonstrationszwecken in [Fig. (7, 8, 9)] dargestellt. Es wird auch das Leistungsvermögen des Erfassungsverfahrens (Erfassungsverhältnis) für jeden Fall angegeben. Innerhalb des Validierungsverfahrens sind Ground-Truth-Daten verfügbar. Deshalb wird das Leistungsvermögen des Verfahrens als Erfassungsverhältnis definiert, also als die Anzahl der erfolgreichen Entdeckungen für die Erfassungsparameter geteilt durch die Anzahl der Versuche. Man kann beobachten, dass das offenbarte Bezugssystem für alle Versuche unter den verschiedenen Anfangsbedingungen der Fig. 7 und 8 im gleichen globalen Minimum konvergiert, falls keine starken lokalen Deformationen vorliegen.
  • Bei den gegebenen experimentellen Ergebnissen kann man voraussetzen, dass die offenbarte Zielfunktion, welche im euklidischen Abstandsraum definiert wurde, glatt und stetig ist. In der Konsequenz kann ein Gradientenabstiegsverfahren im globalen Minimum konvergieren. Es ist interessant festzuhalten, dass sogar im Fall teilweise stark deformierter Formen, wie beispielsweise in Fig. 9 gezeigt, die Zielfunktion ein ähnliches Verhalten zu zeigen scheint. Wenn beispielsweise die Finger schrittweise vom "Hand-"-Subjekt versteckt werden, konvergiert das Verfahren immer in einem der drei lokalen Minima und dem einen globalen Minimum. Obwohl die experimentellen Ergebnisse befriedigend sind, kann man ein reduziertes Leistungsvermögen vorhersagen, wenn symmetrische Formen zu erfassen sind. Symmetrien erzeugen ähnliche Transformationsrepräsentationen, welche Konvergenz in lokalen Minima bewirken können.
  • Wie für Fig. 7 beschrieben, wird für jeden Fall eine empirische Bewertung für (a) Anfangsbedingungen und (b) Erfassungsergebnisse mit einem Leistungsvermögen oder Erfassungsverhältnissen von 100% angegeben. Der Berechnungsaufwand des vorliegenden offenbarten Ansatzes hängt von verschiedenen Faktoren ab. Die Anfangsbedingungen, die Größe des Ziels und der Quelle und die Verbindung zwischen dem globalen Modell und den lokalen Deformationen sind die Hauptparameter, welche an diesem Verfahren beteiligt sind. Die Verwendung von klassischen numerischen Verfahren ist ein signifikanter Nachteil wegen des Erfordernisses von signifikant kleinen Zeitschritten zur Gewährleistung der Stabilität. Man kann die Verwendung von komplizierteren Verfahren betrachten, von welchen einige untersucht werden, was hinsichtlich des globalen Bewegungsmodells zu einem Echtzeitansatz führen wird.
  • Folglich zeigt Fig. 9 die empirische Bewertung mit (a) den Anfangsbedingungen und (b) den Erfassungsergebnissen für Leistungsvermögen oder Erfassungsverhältnisse von (i) 100% und (ii) 77%. Während die Fig. 10 die starre Erfassung für unstarre Objekte zeigt, welche synthetische Bewegung aufweisen, wobei jede Zeile einem verschiedenen Fall mit (a) den Anfangsbedingungen, (b und c) den Zwischenergebnissen und (d) den Erfassungsergebnissen entspricht.
  • Diese und andere Merkmale und Vorteile der vorliegenden Offenbarung können von einem Durchschnittsfachmann in der betreffenden Technik auf der Grundlage der Lehren hier leicht nachgeprüft werden. Es versteht sich, dass die Lehren der vorliegenden Offenbarung in verschiedene Formen von Hardware, Software, Firmware, Spezialprozessoren oder Kombinationen davon implementiert werden können.
  • Die Lehren der vorliegenden Offenbarung werden vorzugsweise als eine Kombination von Hardware und Software implementiert. Die Software wird ferner vorzugsweise als ein Anwendungsprogramm implementiert, welches materiell in einer Programmspeichereinheit enthalten ist. Das Anwendungsprogramm kann von einer Maschine, welche eine geeignete Architektur umfasst, hochgeladen und ausgeführt werden. Vorzugsweise wird die Maschine auf einer Computerplattform implementiert, welche Hardware wie beispielsweise eine oder mehrere Zentraleinheiten ("CPU"), einen Schreib-/Lesespeicher ("RAM") und Eingabeschnittstellen ("E/A") aufweist. Die Computerplattform kann auch ein Betriebssystem und Mikrobefehlscode einschließen. Die verschiedenen hierin beschriebenen Verfahren und Funktionen können entweder Bestandteil des Mikrobefehlscodes oder Bestandteil des Anwendungsprogramms oder irgendeiner Kombination davon sein, welche durch eine CPU durchgeführt werden können. Zusätzlich können verschiedene andere periphere Geräte an die Computerplattform angeschlossen werden, wie beispielsweise ein zusätzliches Datenspeichergerät und ein Druckgerät.
  • Es versteht sich, dass die tatsächlichen Verbindungen zwischen den Systemkomponenten oder den Funktionsblöcken des Verfahrens sich abhängig von der Weise, in welcher die vorliegende Offenbarung programmiert ist, unterscheiden können, weil manche der konstituierenden Systemkomponenten und Verfahren, welche in den begleitenden Zeichnungen dargestellt sind, vorzugsweise als Software implementiert werden. Mit den hier gegebenen Lehren wird der Durchschnittsfachmann in der Lage sein, diese und ähnliche Implementationen oder Konfigurationen der vorliegenden Offenbarung in Betracht zu ziehen.
  • Obwohl hierin die illustrativen Ausführungsformen unter Bezugnahme auf die begleitenden Zeichnungen beschrieben wurden, versteht es sich, dass die vorliegende Offenbarung nicht genau auf diese Ausführungsformen beschränkt ist und dass von einem Durchschnittsfachmann daran verschiedene Änderungen und Modifikationen vorgenommen werden können, ohne den Schutzumfang oder den Gedanken der vorliegenden Offenbarung zu verlassen. Es ist beabsichtigt, alle derartigen Änderungen und Modifikationen innerhalb des Schutzumfangs der vorliegenden Offenbarung einzuschließen, wie er in den angefügten Ansprüchen dargelegt wird.

Claims (23)

1. Verfahren zur unstarren Bilderfassung unter Verwendung von Abstandsfunktionen, das Folgendes umfasst:
Empfangen einer Vielzahl von Pixeln, welche eine Quellform und eine Zielform in einem n-dimensionalen Bildraum definieren; und
Berechnen einer Abstandsabbildung, welche auf die Form anspricht, durch die Berechnung eines minimalen Anstands von jedem Punkt im Bildraum zum nächsten Abschnitt der Form und durch die Definition eines höherdimensionalen n+1-Informationsraums zur Formerfassung.
2. Verfahren nach Anspruch 1, ferner umfassend:
Klonen der Form innerhalb des Bildraums; und
Berechnen einer Abstandsabbildung, welche auf die geklonte Form anspricht, durch die Berechnung eines minimalen Abstands von jedem Punkt im Bildraum zum nächsten Abschnitt der geklonten Form.
3. Verfahren nach Anspruch 2, ferner umfassend die Durchführung einer globalen Erfassung, welche invariant bezüglich der Drehung, der Translation und des Maßstabs ist, durch Minimierung einer Energiekostenfunktion im Informationsraum.
4. Verfahren nach Anspruch 3, wobei die Energiefunktion zur Entdeckung globaler Erfassungsparameter für die Quellform optimiert wird.
5. Verfahren nach Anspruch 3, ferner umfassend die Minimierung der Energiekostenfunktion unter Verwendung eines Gradientenabstiegsverfahrens.
6. Verfahren nach Anspruch 5, ferner umfassend die Abschätzung lokaler Deformationen aus der globalen Erfassung zur Optimierung der Passung einer Quellform zur Zielform.
7. Verfahren nach Anspruch 3, wobei die Energiefunktion auf lokale Deformationen anspricht.
8. Verfahren nach Anspruch 7, wobei die globale Transformation und die lokalen Deformationen unter Verwendung einer lokalen Deformationsdatei kombiniert werden.
9. Verfahren nach Anspruch 8, wobei die lokale Deformationsdatei eine reguläre und eine Glätteordnungsrandbedingung erfüllt.
10. Verfahren nach Anspruch 9, ferner umfassend die Minimierung der Energiekostenfunktion unter Verwendung eines Gradientenabstiegsverfahrens.
11. Verfahren nach Anspruch 5, ferner umfassend die Erfassung der Quellform in einem Formmodell.
12. Verfahren nach Anspruch 11, wobei eine global- nach-lokale Erfassung gemäß der lokalen Qualität des Modells optimiert wird.
13. Verfahren nach Anspruch 12, ferner umfassend die Minimierung einer stochastischen Kostenfunktion gemäß der Qualität des Modells.
14. Verfahren nach Anspruch 13, ferner umfassend die Minimierung der Energiekostenfunktion unter Verwendung eines Gradientenabstiegsverfahrens.
15. Verfahren zur unstarren Bilderfassung unter Verwendung von Abstandsfunktionen, das Folgendes umfasst:
Empfangen einer Quellform und einer Zielform;
Erzeugen eines erweiterten Erfassungsraums, umfassend eine Vielzahl von Klonen der Zielform, welche kohärent in einem Informationsraum positioniert sind;
Integrieren wenigstens eines globalen linearen Erfassungsmodells mit lokalen Deformationen zur Beurteilung der Quellform;
Optimieren einer Funktion, welche durch einen Parameter- oder Merkmalsraum definiert ist, wobei die Funktion die Ähnlichkeit zwischen der Quellform und wenigstens einer Zielform hinsichtlich Abstandsfunktionen quantifiziert; und
Erfassen der Quellform durch Suchen gemeinsamer Entsprechungen zwischen der Quellform, der Zielform und den Klonen der Zielform.
16. Verfahren nach Anspruch 15, wobei die Optimierung die Auswahl eines mathematischen Bezugssystems durch Finden eines Optimums wenigstens einer Funktion zur Quantifizierung der Ähnlichkeit zwischen der Quellform und wenigstens einer Zielform umfasst.
17. Verfahren nach Anspruch 16, wobei das mathematische Bezugssystem durch wenigstens eines der Abweichungs- und stochastischen Prinzipen definiert wird.
18. Verfahren nach Anspruch 15, wobei die Optimierung die Verwendung eines Gradientenabstiegsverfahrens innerhalb des mathematischen Bezugssystems umfasst.
19. Verfahren nach Anspruch 15, wobei der Bildraum größer ist als eine zweidimensionale Bildebene.
20. Verfahren nach Anspruch 15, wobei die Quellform Unbestimmtheiten umfasst, wobei das Verfahren weiterhin Folgendes umfasst:
Betrachten eines linearen parametrischen Modells und eines pixelweisen Deformationsfelds, welches in einem unstarren Erfassungsparadigma resultiert; und
gleichzeitiges Entdecken sowohl des linearen parametrischen Modells als auch eines pixelweisen Deformationsfelds durch ein Gradientenabstiegsverfahren.
21. Vorrichtung zur unstarren Bilderfassung unter Verwendung von Abstandsfunktionen, die Folgendes umfasst:
eine Empfangseinheit zum Empfang einer Quellform und einer Zielform;
eine Kloneinheit, welche in Signalkommunikation mit der Optimierungseinheit zur Erzeugung eines erweiterten Erfassungsraums steht, welcher eine Vielzahl von Klonen der Zielform umfasst, welche kohärent im Informationsraum positioniert sind;
eine Integrationseinheit, welche in Signalkommunikation mit der Empfangseinheit für die Integration wenigstens eines globalen linearen Erfassungsmodells mit lokalen Deformationen zur Beurteilung der Quellform steht;
eine Optimierungseinheit, welche in Signalkommunikation mit der Integrationseinheit zur Optimierung einer Funktion steht, welche durch einen Parameter- oder Merkmalsraum definiert ist, wobei die Funktion die Ähnlichkeit zwischen der Quellform und wenigstens einer Zielform hinsichtlich Abstandsfunktionen quantifiziert; und
eine Erfassungseinheit, welche in Signalkommunikation mit der Verfolgungseinheit zur Erfassung der Quellform durch Suchen gemeinsamer Entsprechungen zwischen der Quellform, der Zielform und den Klonen der Zielform steht.
22. System zur unstarren Bilderfassung unter Verwendung von Abstandsfunktionen, das Folgendes umfasst:
Empfangsmittel zum Empfang einer Quellform und einer Zielform;
Klonmittel, welches in Signalkommunikation mit dem Optimierungsmittel zur Erzeugung eines erweiterten Erfassungsraums steht, welcher eine Vielzahl von Klonen der Zielform umfasst, welche kohärent im Informationsraum positioniert sind;
Integrationsmittel, welches in Signalkommunikation mit dem Empfangsmittel zur Integration wenigstens eines globalen linearen Erfassungsmodells mit lokalen Deformationen zur Beurteilung der Quellform steht;
Optimierungsmittel, welches in Signalkommunikation mit dem Integrationsmittel zur Optimierung einer Funktion steht, welche durch einen Parameter- oder Merkmalsraum definiert ist, wobei die Funktion die Ähnlichkeit zwischen der Quellform und wenigstens einer Zielform hinsichtlich Abstandsfunktionen quantifiziert; und
Erfassungsmittel, welches in Signalkommunikation mit dem Verfolgungsmittel zur Erfassung der Quellform durch Suchen gemeinsamer Entsprechungen zwischen der Quellform, der Zielform und den Klonen der Zielform steht.
23. Maschinenlesbares Programmspeichergerät, welches materiell ein Programm von Befehlen enthält, welche durch die Maschine zur Durchführung der Programmschritte zur unstarren Bilderfassung unter Verwendung von Abstandsfunktionen ausführbar sind, wobei die Programmschritte Folgendes umfasst:
Empfang einer Quellform und einer Zielform;
Erzeugen eines erweiterten Erfassungsraums, umfassend eine Vielzahl von Klonen der Zielform, welche kohärent in einem Informationsraum positioniert sind;
Integrieren wenigstens eines globalen linearen Erfassungsmodells mit lokalen Deformationen zur Beurteilung der Quellform;
Optimieren einer Funktion, welche durch einen Parameter- oder Merkmalsraum definiert ist, wobei die Funktion die Ähnlichkeit zwischen der Quellform und wenigstens einer Zielform hinsichtlich Abstandsfunktionen quantifiziert; und
Erfassen der Quellform durch Suchen gemeinsamer Entsprechungen zwischen der Quellform, der Zielform und den Klonen der Zielform.
DE10304360A 2002-02-01 2003-02-03 Unstarre Bilderfassung unter Verwendung von Abstandsfunktionen Withdrawn DE10304360A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US35337102P 2002-02-01 2002-02-01
US10/356,055 US7200269B2 (en) 2002-02-01 2003-01-31 Non-rigid image registration using distance functions

Publications (1)

Publication Number Publication Date
DE10304360A1 true DE10304360A1 (de) 2003-09-11

Family

ID=27760416

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10304360A Withdrawn DE10304360A1 (de) 2002-02-01 2003-02-03 Unstarre Bilderfassung unter Verwendung von Abstandsfunktionen

Country Status (2)

Country Link
US (1) US7200269B2 (de)
DE (1) DE10304360A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7391882B2 (en) 2004-01-29 2008-06-24 Siemens Medical Solutions Usa, Inc. Prior knowledge, level set representations and visual grouping
CN112241762A (zh) * 2020-10-19 2021-01-19 吉林大学 一种用于病虫害图像分类的细粒度识别方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7639896B2 (en) * 2004-08-09 2009-12-29 Carestream Health, Inc. Multimodal image registration using compound mutual information
JP2006078568A (ja) * 2004-09-07 2006-03-23 Dainippon Screen Mfg Co Ltd 画像処理装置および画像処理プログラム
US7809190B2 (en) * 2006-04-27 2010-10-05 Siemens Medical Solutions Usa, Inc. General framework for image segmentation using ordered spatial dependency
US7865316B2 (en) * 2008-03-28 2011-01-04 Lockheed Martin Corporation System, program product, and related methods for registering three-dimensional models to point data representing the pose of a part
US8320620B1 (en) * 2008-12-18 2012-11-27 Adobe Systems Incorporated Methods and apparatus for robust rigid and non-rigid motion tracking
US20100329571A1 (en) * 2009-06-24 2010-12-30 General Electric Company Shape based registration
US8892186B2 (en) * 2010-09-20 2014-11-18 Siemens Aktiengesellschaft Method and system for detection and tracking of coronary sinus catheter electrodes in fluoroscopic images
US8666477B2 (en) * 2011-03-07 2014-03-04 Siemens Aktiengesellschaft Method and system for tracking of a virtual electrode on a coronary sinus catheter in fluoroscopic images
US9002436B2 (en) * 2011-09-19 2015-04-07 Siemens Aktiengesellschaft Method and system for ablation catheter and circumferential mapping catheter tracking in fluoroscopic images
US9265458B2 (en) 2012-12-04 2016-02-23 Sync-Think, Inc. Application of smooth pursuit cognitive testing paradigms to clinical drug development
US9380976B2 (en) 2013-03-11 2016-07-05 Sync-Think, Inc. Optical neuroinformatics
JP5706933B2 (ja) * 2013-07-31 2015-04-22 キヤノン株式会社 処理装置および処理方法、プログラム
CN103761741B (zh) * 2014-01-23 2017-02-08 电子科技大学 一种基于极化目标分解特征的变分极化sar图像分割方法
US9582882B2 (en) * 2015-03-02 2017-02-28 Nokia Technologies Oy Method and apparatus for image registration in the gradient domain
US9466108B1 (en) 2015-03-31 2016-10-11 Nokia Technologies Oy Method and apparatus for multiple image registration in the gradient domain
CN104966287B (zh) * 2015-06-08 2017-08-08 浙江大学 层次化的多片点云刚性配准方法
CN111798500B (zh) * 2020-07-20 2023-06-23 陕西科技大学 一种基于层次邻域谱特征的微分同胚非刚性配准算法
US11501497B1 (en) 2021-06-28 2022-11-15 Monsarrat, Inc. Placing virtual location-based experiences into a real-world space where they don't fit
CN116321192B (zh) * 2023-02-28 2023-09-19 燕山大学 一种基于最优刚性图的潜器组网编队方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69332042T2 (de) * 1992-12-18 2003-01-02 Koninkl Philips Electronics Nv Ortungszurückstellung von relativ elastisch verformten räumlichen Bildern durch übereinstimmende Flächen
DE69522143T2 (de) * 1994-05-26 2002-04-25 Agfa Gevaert Nv Farbübereinstimmung durch Systemkalibrierung, lineare und nichtlineare Tonbereichsabbildung
US6591004B1 (en) * 1998-09-21 2003-07-08 Washington University Sure-fit: an automated method for modeling the shape of cerebral cortex and other complex structures using customized filters and transformations
GB0112773D0 (en) * 2001-05-25 2001-07-18 Univ Manchester Object identification
GB0114271D0 (en) * 2001-06-12 2001-08-01 Univ Manchester Parameterisation

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7391882B2 (en) 2004-01-29 2008-06-24 Siemens Medical Solutions Usa, Inc. Prior knowledge, level set representations and visual grouping
DE102005003605B4 (de) * 2004-01-29 2013-04-25 Siemens Medical Solutions Usa, Inc. Vorwissen, Niveaumengenrepräsentationen und visuelle Gruppierung
CN112241762A (zh) * 2020-10-19 2021-01-19 吉林大学 一种用于病虫害图像分类的细粒度识别方法

Also Published As

Publication number Publication date
US7200269B2 (en) 2007-04-03
US20030235337A1 (en) 2003-12-25

Similar Documents

Publication Publication Date Title
DE602004009960T2 (de) System und verfahren zum erkennen und vergleichen anatomischer strukturen unter verwendung von erscheinungsbild und form
DE112004000393B4 (de) System und Verfahren zum Verfolgen einer globalen Form eines in Bewegung befindlichen Objekts
DE10304360A1 (de) Unstarre Bilderfassung unter Verwendung von Abstandsfunktionen
DE112004001861B4 (de) System und Verfahren zur Analyse örtlicher verformbarer Bewegungen einer Wand des linken Ventrikels eines Herzens
DE102007046582A1 (de) System und Verfahren zum Segmentieren von Kammern eines Herzens in einem dreidimensionalen Bild
EP1191476B1 (de) Vorrichtung und Verfahren zur Berechnung einer zwei Abbildungen verbindenden Transformation
DE19746939B4 (de) Verfahren zur Messung des Herzmuskels in Herzbildern
DE69910757T2 (de) Wavelet-basierte gesichtsbewegungserfassung für avataranimation
DE69817879T2 (de) Erkennung verzerrter bilder durch schnelle faltung und mittels bilderfassung von markanten punkten und volumeninformation
DE69937897T2 (de) System und verfahren zur 4d rekonstruktion und darstellung
DE60223361T2 (de) Objektidentifikation
DE60133840T2 (de) Vorrichtung und verfahren zur erzeugung einer dreidimensionalen darstellung aus einem zweidimensionalen bild
DE102005003605B4 (de) Vorwissen, Niveaumengenrepräsentationen und visuelle Gruppierung
DE102006035637A1 (de) Verfahren zum Erfassen und Verfolgen von deformierbaren Objekten
EP2284795A2 (de) Quantitative Analyse, Visualisierung und Bewegungskorrektur in dynamischen Prozessen
DE10296836T5 (de) System zur Modellierung statischer und dynamischer dreidimensioner anatomischer Strukturen durch 3D-Modelle
DE102013021729A1 (de) Verbesserung der nadelvisualisierung in der diagnostischen ultraschallbildgebung
DE102006054822A1 (de) Registrierung eines charakteristischen Pfads eines Kolons
DE102010000274A1 (de) Verfahren und Vorrichtung zur automatischen Identifizierung von Bildansichten in einem 3D-Datensatz
DE102004009143A1 (de) Randdetektion für eine medizinische Bildgebung
DE112013003214T5 (de) Verfahren zum Registrieren von Daten
DE112005001743T5 (de) System und Verfahren zur Registrierung und Modellierung verformbarer Formen durch direkte Faktorisierung
Faghih Roohi et al. 4D statistical shape modeling of the left ventricle in cardiac MR images
DE112014000611T5 (de) Verfahren und Vorrichtung zum Erzeugen eines abgeleiteten Bildes unter Verwendung von Bildern verschiedener Typen
DE102006039922A1 (de) System und Verfahren zum Erlernen eines relativen Abstandes in einem Formenraum unter Verwendung von auf einem Bild basierenden Merkmalen

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8127 New person/name/address of the applicant

Owner name: SIEMENS MEDICAL SOLUTIONS USA, INC., MALVERN, PA.,

8120 Willingness to grant licences paragraph 23
8139 Disposal/non-payment of the annual fee