DE112012003377T5

DE112012003377T5 - Bildsegmentierungsverfahren

Info

Publication number: DE112012003377T5
Application number: DE112012003377.9T
Authority: DE
Inventors: Anmelder Gleich
Original assignee: Individual
Current assignee: Individual
Priority date: 2011-08-15
Filing date: 2012-06-19
Publication date: 2014-04-30
Also published as: CN103733207A; CN103733207B; RU2489752C2; US9076216B2; US20140254935A1; JP2014527671A; KR101807352B1; JP5973572B2; KR20140071367A; WO2013025123A1; RU2011134204A; IN2014DN01819A

Abstract

Die Erfindung betrifft die Verarbeitung von Foto- und Videobildern. Eine Suche nach einem Minimum von Kostenfunktionen wird auf einer Anzahl N von Bilddetailebenen, von gröber bis feiner, durchgeführt, und auf jeder Bilddetailebene wird das Bild in Regionen unterteilt; jeder Region wird mittels einer Anzahl n von aufeinanderfolgenden Iterationen ein einzelner Segmentierungswert zugeordnet, danach wird der Wert der Kosten für die Säume an den Regionengrenzen mit unterschiedlichen Bildsegmentierungsarten berechnet, und für jede Region wird ein Segmentierungswert gewählt, der die Summe der Kostenfunktionen der Säume und Daten optimiert. Zur Vermeidung einer Falle bei der Suche nach dem globalen Minimum in einem der lokalen Minima, entstanden durch die hohen Kosten eines Saums um jedwede lokale Region infolge von Rauschen in dem Bild, werden zudem auf jeder Detailebene Teilmengen von Iterationen mit einem reduzierten Eingang von Saumfunktionen in die Summe der Kostenfunktionen durchgeführt. Das technische Ergebnis ist die Segmentierung eines Bildes unter nur geringer Verwendung der Speicherressourcen eines mobilen Geräts, während sowohl die Beständigkeit gegen Bildrauschen als auch die Betriebsgeschwindigkeit aufrechterhalten werden.

Description

TECHNISCHES GEBIET
Die Erfindung betrifft das Gebiet der Foto- und Video-Bildverarbeitung – insbesondere mithilfe mobiler Geräte mit integrierten Foto- und Videokameras – und ist beispielsweise dazu verwendbar, die Qualität eines aus mehreren Eingangs-Einzelbildern gewonnenen Ergebnisbildes zu verbessern.
HINTERGRUND DER ERFINDUNG
Da die Belichtung mehrerer Eingangs-Einzelbilder (Aufnahmen) in der Regel zu unterschiedlichen Zeitpunkten erfolgt, treten bei der Bildung einer Szene Verzerrungen zwischen verschiedenen Einzelbildern auf, die sich in der unterschiedlichen Anordnung bewegter (unbeständiger) Objekte und in der Veränderung von Belichtungsbedingungen der Szene manifestieren (beispielsweise infolge von Bewölkungsveränderungen), was sich auf die Qualität eines Ergebnisbildes auswirkt und sich manifestiert in:

– doppelten Konturen unbeständiger Objekte und in manchen Fällen einer Verdopplung der Anzahl bewegter Objekte in einem Bild
– Halbtransparenz von unbeständigen Objekten
– merklicher Unregelmäßigkeit der Helligkeit oder Farbbalance verschiedener Bereiche des Bildes.

Eine der Methoden zur Verbesserung der Qualität von Bildern mithilfe mobiler Geräte besteht aktuell darin, in einer kurzen Zeitperiode mehrere Einzelbilder aufzunehmen und sie anschließend zusammenzuführen, indem mehrere Bilder zu einem einzigen Ergebnisfoto zusammengefügt werden (wobei ein Panoramabild oder ein Bild mit erhöhtem Dynamikbereich erzeugt wird, das Bildrauschniveau verringert wird usw.). Das Zusammenfügen sollte dabei so erfolgen, dass Säume durch die Verlaufsbahn der geringsten Differenzen von benachbarten Initialbildern passieren und dass sie unbeständige Objekte umgehen. Ein verbreitetes Verfahren zum Bestimmen einer optimalen Saumverlaufsbahn verwendet verschiedene Bildsegmentierungsverfahren [Alexander Vezhnevets, Olga Barinova, ”Image Segmentation Methods: Automatic Segmentation”, Computer Graphics and Multimedia, Ausgabe 4(4)/2006: http://cgm.computergraphics.ru/content/view/147].
In folgenden Fällen der Erzeugung eines Bildes aus mehreren Initialbildern ist die Bildsegmentierung und -zusammenfügung am besten geeignet:

– Erzeugung eines Panoramabildes aus mehreren Aufnahmen, von denen jede nur einen Teil eines Panoramas abbildet
– Erzeugung eines Bildes mit hohem Dynamikbereich aus mehreren Initialbildern mit niedrigem Dynamikbereich.

Zur Verbesserung der Qualität von Bildern unter Verwendung von Segmentierung gibt es verschiedene Verfahren.
Das Clusterverfahren verwendet eine Repräsentation von Bildpunkten, die einem bestimmten Merkmalsraum zugewiesen ist, und dieser Merkmalsraum führt eine Metrik (ein Nähemaß) ein.
Der Nachteil dieses Verfahrens liegt darin, dass die räumliche Anordnung der Punkte entweder gar nicht berücksichtigt wird oder indirekt aufgenommen wird (beispielsweise durch Verwendung der Punktkoordinaten als eines der Merkmale). Daher wird, gewöhnlich nach der Clusterverarbeitung der Bildpunkte, ein Verfahren zum Definieren verbundener Komponenten durchgeführt. Zudem funktionieren Clusterverfahren bei verrauschten Bildern nicht gut: Häufig gehen separate Regionenpunkte verloren, es werden mehrere kleine Regionen erzeugt und so weiter.
Das Verfahren des Regionenwachstums [A. Tremeau und N. Borel, ”A Region Growing and Merging Algorithm to Color Segmentation”, Pattern Recognition, 1997; Y. Kanai, ”Image Segmentation Using Intensity and Color Information”, SPIE – Visual Communications and Image Processing '98; B. Cramariuc, M. Gabbouj und J. Astola, ”Clustering Based Region Growing Algorithm for Color Image Segmentation”, International Conference on Digital Signal Processing, 1997; sowie Y. Deng, B. S. Manjunath und H. Shin, ”Color Image Segmentation”, CVPR 1999] berücksichtigt die räumliche Anordnung der Punkte direkt. Zunächst werden nach einer bestimmten Regel die Mittelpunkte der Regionen ausgewählt und denselben angrenzende Punkte, die ein bestimmtes Kriterium erfüllen, stufenweise hinzugefügt. Der Regionenwachstumsprozess endet, wenn keiner der Bildpunkte mehr zu einer der Regionen hinzugefügt werden kann. Es werden unterschiedliche Kriterien verwendet, auf deren Basis ein Punkt einer Region hinzugefügt wird oder nicht: Nähe eines Punktes zu einem Regionenmittelpunkt, Nähe eines angrenzenden Punktes, der einer Region im vorangegangenen Schritt hinzugefügt wurde, Nähe gemäß einer bestimmten Regionenstatistik, Kosten des kürzesten Weges von einem Punkt zu einem Regionenmittelpunkt usw. Hauptsächlich wird der Regionenwachstumsprozess für separate Regionen genutzt. Jedoch lässt sich auch eine Partitionierung eines ganzen Bildes erzielen, indem diese Prozedur Schritt für Schritt oder gleichzeitig für mehrere Regionen befolgt wird.
Der Nachteil dieses Verfahrens ist seine Unanwendbarkeit für Aufgaben der Saumzusammenfügung; es wird nur in Fällen mit nur einem Referenzbild angewendet. Außerdem erfordert es bei mobilen Geräten beträchtliche Speicherressourcen. Zudem ist die Datenverarbeitungsgeschwindigkeit nicht schnell genug.
Fragmentierungs-Zusammenführungs-Verfahren [A. Tremeau und N. Borel, ”A Region Growing and Merging Algorithm to Color Segmentation”, Pattern Recognition, 1997; B. Cramariuc, M. Gabbouj und J. Astola, ”Clustering Based Region Growing Algorithm for Color Image Segmentation”, International Conference on Digital Signal Processing, 1997; M. Celenk, ”Hierarchical Color Clustering for Segmentation of Textured Images”, Proceedings of the 29th Southeastern Symposium on System Theory, 1997]; [S. Ji und H. W. Park, ”Image Segmentation of Color Image Based on Region Coherency”, Proceedings of ICIP '98; L. Shafarenko, M. Petrov und J. Kittler, ”Automatic Watershed Segmentation of Randomly Textured Color Images”, IEEE Transactions on Image Processing, 1997; und M. Barni, S. Rossi und A. Mecocci, ”A Fuzzy Expert System for Low Level Image Segmentation”, EUSIPCO-96] bestehen hauptsächlich aus zwei Stufen: Fragmentierung und Zusammenführung. Die Fragmentierung beginnt mit einer Partitionierung eines bestimmten Bildes, jedoch nicht unbedingt in uniforme Regionen. Der Regions-Fragmentierungsprozess wird solange durchgeführt, bis ein partitioniertes Bild vorliegt, das die Bedingung der Segment-Uniformität erfüllt (Übersegmentierung). Sodann erfolgt die Vereinigung ähnlicher benachbarter Segmente, bis eine Bildpartitionierung in uniforme Regionen maximaler Größe erzielt ist.
Die Nachteile dieser Verfahren liegen in der geringen Datenverarbeitungsgeschwindigkeit, in der Notwendigkeit größerer Speicherressourcen und in ihrer Verwendung nur im Fall eines einzelnen Referenzbildes.
Das Verfahren der Markov-Feld-Modellierung [G. R. Cross und A. K. Jain, ”Markov Random Field Texture Models”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 1983; S. German und D. German, ”Stochastic Relaxation, Gibbs Distributions, and the Bayesian Restoration of Images”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 1984; R. Szeliski, R. Zabih, D. Scharstein, O. Veksler, V. Kolmogorov, A. Agarwala, M. Tappen, C. Rother, ”A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness-based Priors”, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 30, Nr. 6, Juni 2008] beruht auf der Annahme, dass die Farbe jedes Punktes des Bildes von den Farben einer bestimmten Anzahl angrenzender Punkte abhängt. Es wird eine Zusammenfassung des Bildmodells vorgeschlagen. Auch eine Zusammenfassung zur Textur-Segmentierung ist möglich [Y. Deng, B. S. Manjunath und H. Shin, ”Color Image Segmentation”, CVPR 1999].
Ein Nachteil dieses Verfahrens ist seine schwierige Umsetzung.
Verfahren auf der Basis von Kantendetektionsoperatoren [M. Jacob, M. Unser, ”Design of Steerable Filters for Feature Detection Using Canny-like Criteria”, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 26, Nr. 8, S. 1007–1019; Atilla Ozmen und Emir Tufan Akman, ”Edge Detection Using Steerable Filters and CNN”, 2002] nutzen eine Segmentierung, die im Finden von Regionengrenzen besteht und für Halbtonbilder gut gelöst ist. Ein Halbtonbild wird als Funktion von zwei Variablen angesehen, und es wird angenommen, dass die Regionengrenzen den Maxima des Gradienten dieser Funktion entsprechen. Um sie zu finden, wird eine Differenzgeometrie verwendet. Zur Erhöhung der Beständigkeit gegen Rauschen wird ein Bild üblicherweise vor der Verwendung von Filterung weichgezeichnet. Aufgrund der Kommutierbarkeit des Laplace-Operators und des Gauss'schen Filters sind Weichzeichnung und Grenzfindung gleichzeitig durchführbar.
Ein Nachteil dieses Verfahrens ist mangelnde Beständigkeit gegen Bildrauschen. Da die Definition einer Grenze bei jeder Aufgabe anders ist, muss zudem bei jeder Anwendung der Grenzfindungsverfahren ein Revisionsverfahren für die Filterungsergebnisse gewählt werden.
Optimierungsverfahren [Y. Deng, B. S. Manjunath und H. Shin, ”Color Image Segmentation”, CVPR 1999] bestehen im Partitionieren eines Bildes zu uniformen Regionen, woraus sich eine Optimierungsaufgabe ergibt. Hierfür ist die Segmentierungsaufgabe formuliert als die Aufgabe, nach einer Partitionierung eines Bildes mit bestimmten Eigenschaften zu suchen, sodann wird eine Funktion eingeführt, die den Konformitätsgrad der erzielten Segmentierung mit den vorgelegten Anforderungen widerspiegelt. Beispielsweise wird eine Segmentierungsqualitätsfunktion eingeführt, welche die Verteilung von Farben auf einem Bild verwendet.
Nachteile dieser Verfahren sind der damit verbundene Arbeitsaufwand und die hohen Anforderungen an die Ressourcen mobiler Geräte.
Gemeinsame Nachteile all dieser Verfahren sind:

– die Unanwendbarkeit einer erzielten Segmentierung auf die Aufgaben des Zusammenfügens, weil die Verfahren nur mit einem Referenzbild funktionieren können (Regionenwachstumsverfahren, Fragmentierungs-Vermischung, Kantendetektion)
– Systemressourcenanforderungen, die für mobile Geräte ungeeignet sind – Speicher und Betriebsgeschwindigkeit einer Recheneinheit (Clusterverfahren, Regionenwachstum, Fragmentierungs-Vermischung, Markov-Zufallsfeld, Verfahren der Graphentheorie, Optimierungsansätze)
– unzureichendes Funktionieren bei verrauschten Bildern (Clusterverfahren, Kantendetektion)
– fehlende Berücksichtigung der räumlichen Anordnung von Punkten (Clusterverarbeitung).

Das Graphenschnitt-Minimierungsverfahren kommt der vorgelegten Lösung am nächsten [ US-Patent 6,744,923 , ”System and Method for Fast Approximate Energy Minimization via Graph Cuts”; und R. Szeliski, R. Zabih, D. Scharstein, O. Veksler, V. Kolmogorov, A. Agarwala, M. Tappen, C. Rother, ”A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness-based Priors”, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 30, Nr. 6, Juni 2008]. Ein Bild wird in Form eines gewichteten Graphen mit den Knoten in den Bildpunkten vorgelegt. Die Gewichtung der Graphenverbindungen spiegelt die Ähnlichkeit der Punkte wider (beispielsweise die Distanz zwischen den Punkten nach einer bestimmten Metrik). Die Bildpartitionierung wird durch Graphenschnitte modelliert. Verfahren der Graphentheorie führen die Funktion der Schnitt-”Kosten” ein, welche die Qualität der erzielten Segmentierung widerspiegelt. Somit reduziert sich die Aufgabe der Bildpartitionierung in uniforme Regionen auf die Optimierungsaufgabe, einen Graphenschnitt mit minimalen Kosten zu finden. Abgesehen von der Farb-Uniformität und der Textur der Segmente ermöglicht dieses Verfahren eine Kontrolle der Form von Segmenten, ihrer Größe, der Komplexität der Grenzen usw. Zum Finden eines Minimalkostenschnitts gibt es verschiedene Verfahren: gierige Algorithmen (auf jeder Stufe Wahl derjenigen Verbindungen, welche die Gesamtschnittkosten minimieren würden), Verfahren der dynamischen Programmierung (auf jeder Stufe garantierte Wahl einer optimalen Verbindung, die einen optimalen Weg ergibt) usw.
Ein Nachteil dieses Verfahrens ist die große Zahl von Rechenoperationen, die zum Erzielen einer Lösung erforderlich ist, welche die Betriebsgeschwindigkeit verringert, sowie die Notwendigkeit, eine große Menge zusätzlichen Speichers vorzusehen, um einen optimalen Schnitt zu finden.
ZUSAMMENFASSUNG DER ERFINDUNG
Der Autor hat sich die Aufgabe gestellt, ein Bildsegmentierungsverfahren zu entwerfen, das folgende Anforderungen erfüllt:

– Betriebsgeschwindigkeit
– optimale Bildsegmentierung – d. h. eine solche, die nützlich ist zum Erzielen des globalen Minimums der Summe der Saumkostenfunktion und der Kostenfunktion von Bilddaten (auf Basis von Farbe, Helligkeit und anderen Parametern) – und Proximität der erzielten Segmentierung zu der absoluten optimalen Fragmentierung, analog zu den besten bekannten Verfahren
– keine zusätzlichen Speicherressourcen des mobilen Geräts erforderlich
– Beständigkeit gegen Bildrauschen.

Das Wesentliche der vorgelegten technischen Lösung besteht darin, dass in dem bekannten Bildsegmentierungsverfahren, das nach einem Minimum von Kostenfunktionen sucht, diese Suche auf einer Anzahl N von Bilddetailebenen, von gröber bis feiner, durchgeführt wird und auf jeder Bilddetailebene das Bild in Regionen unterteilt wird; jeder Region wird mittels einer Anzahl n von aufeinanderfolgenden Iterationen ein einzelner Segmentierungswert zugewiesen. Danach wird der Wert der Kostenfunktion für die Säume an den Regionengrenzen mit unterschiedlichen Arten von Bildsegmentierung berechnet, und für jede Region wird ein Segmentierungswert gewählt, der die Summe der Kostenfunktionen der Säume und Daten minimiert.
In den Fällen, in denen es darauf ankommt, einen Einfluss der Säume auf das Segmentierungsergebnis auszuschließen (z. B. wenn eine von der Bildausrichtung unabhängige Segmentierung benötigt wird), erfolgt die Suche nach einem Minimum bei jeder nachfolgenden Iteration durch eine Verarbeitung von Bildregionen, die keine gemeinsamen Grenzen haben, und eine Auswahl der zu verarbeitenden Regionen wird bei jeder nachfolgenden Iteration aktualisiert. Zur Vermeidung einer Falle bei der Suche nach dem globalen Minimum in einem der lokalen Minima, entstanden durch die hohen Kosten eines Saums um jedwede lokale Region, werden zudem auf jeder Detailebene mehrere initiale Iterationen mit einem reduzierten Beitrag von Saumfunktionen in der Summe der Kostenfunktionen durchgeführt. Dies ermöglicht ein Durchspringen (Hindurchtreten) der Säume durch die Kostenspitzen.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
1 gibt ein Beispiel für ein Referenzbild, dessen Farbraum optimal in 12 Farben segmentiert wird.
2 gibt ein Beispiel für eine Referenzsegmentierung für die gröbste Detailebene nur auf Basis der Kostenfunktion der Daten. Die Kostenfunktion der Säume wird als gleich null angenommen.
3 stellt den Segmentierungszustand nach der ersten Iteration dar. Rechtecke mit abgerundeten Flächen kennzeichnen die bei einer gegebenen Iteration verarbeiteten Quadrate. Die horizontale Schraffur kennzeichnet die Quadrate mit veränderter Segmentierung bei einer gegebenen Iteration; die vertikale Schraffur kennzeichnet Quadrate, bei denen die Segmentierung beibehalten wurde.
4 stellt den Segmentierungszustand nach der zweiten Iteration dar.
5 stellt die Endergebnisse der Segmentierung auf jeder der Detailebenen dar. Die untere rechte Ecke stellt die so entstehende Segementierungslösung dar.
6 zeigt Konvergenzdiagramme verschiedener Verfahren – beschrieben in der Abhandlung von R. Szeliski, R. Zabih, D. Scharstein, O. Veksler, V. Kolmogorov, A. Agarwala, M. Tappen und C. Rother, ”A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness-based Priors”, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 30, Nr. 6, Juni 2008 – zum Erreichen des globalen Minimums bei einer Panorama-Zusammenfügungsaufgabe. Die vertikale Achse ist die Abweichung vom globalen Minimum in Prozent; die horizontale Achse ist die logarithmische Zeitachse in Sekunden. Die Diagramme zeigen:

– Verfahren der Markov-Zufallsfelder, ”Iterated Conditional Modes”
– Varianten des Graphenschnittverfahrens, ”Loopy Belief Propagation”
– analog zum Verfahren der ”Loopy Belief Propagation”, ein Verfahren des ”Tree-reweighted Message Passing”
– Vorhersage der Untergrenze des globalen Minimums
– unterschiedliche Varianten des ”Graphenschnitt”-Verfahrens
– das vorgeschlagene Verfahren; der Kreis kennzeichnet die gesamte Verarbeitungszeit und die erzielte Abweichung vom globalen Minimum.

7 und 8 stellen vergrößerte Diagrammversionen von 6 mit einem vergrößerten Maßstab der Abweichung vom globalen Minimum dar.
AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
Das vorgelegte Verfahren wird folgendermaßen durchgeführt: Ein Referenzbild wird einer Anzahl N von Detailebenenoperationen unterzogen (beispielsweise zufällige Partitionierung in Regionen, die bezüglich ihrer Größe nahe beieinander liegen). Auf jeder Detailebene wird eine Anzahl n von Iterationen durchgeführt, solange Veränderungen der Regionensegmentierung verbleiben, die zu einer Verringerung des Gesamtwerts der Funktionen der Säume und Daten führen – oder bis eine maximale akzeptable Anzahl von Iterationen für eine gegebene Detailebene erreicht ist, die durch die Gesamtverarbeitungszeit eines mobilen Geräts begrenzt ist.
Zwei Kostenfunktionen sind in Verwendung:

– die Kostenfunktion der Daten, die angibt, wie optimal die Zuordnung eines spezifischen Bildpixels zu einem der Segmente ist. Beispielsweise ein absoluter Wert der Differenz zwischen einem numerischen Wert der Farbe eines Pixels und der Farbe eines Segments.
– Die Kostenfunktion eines Saums gibt an, wie optimal die Grenzverlaufsbahn von Segmenten an einer gegebenen Stelle ist.

Auf jeder Detailebene können Säume nur entlang der Grenzen von Regionen verlaufen. Die Form der Regionen bleibt für jede der Detailebenen unverändert. Da die Korrekturiterationen, die der initialen, groben folgen, ein Durchspringen (Hindurchtreten) durch die lokalen Minima von Kostenfunktionen erlauben und eine sich daraus ergebende Segmentierung nahe am globalen Minimum liegt, wird diese Begrenzung der Verlaufsbahn von Säume als akzeptabel angesehen.
Eine Segmentierung, die durch Bildfragmentierung erreicht wird und nur auf dem Wert der Kostenfunktion der Daten basiert, ohne die Kosten der Säume zu berücksichtigen, wird als initiale Segmentierung verwendet. Mit einer solchen Segmentierung wird jeder Region der Bildpixel ein Segmentwert zugewiesen, der eine minimale Summe für alle Pixel einer gegebenen Region angibt. Auf den kombinierten Werten der Pixelregionen werden Iterationen mit der primären (groben) Detailebene durchgeführt.
Jede nachfolgende Iteration findet, verglichen mit der vorhergehenden, eine optimalere Segmentierung.
Bei jeder Iteration durchläuft jede der Pixelregionen folgende Prozesse:

– Der lokale Wert der Kostenfunktion wird berechnet, einschließlich der Kosten der Daten und Säume, die eine gegebene Region umgeben;
– die Kostenfunktion wird für alle möglichen Segmentierungswerte für eine gegebene Region berechnet;
– im Falle, dass die initiale Wahl der Segmentierung für eine gegebene Region nicht optimal ist (der Wert der Funktion höher als bei jedweder anderen Segmentierung ist), wird der Wert für eine gegebene Region durch einen optimalen (mit dem Minimalwert der Kostenfunktionen) ersetzt.

Die Regionen werden nacheinander verarbeitet; gleichzeitig wirkt sich der Segmentierungswert in einer spezifischen Region auf die Kosten des Saums aus, die entlang der Grenze einer gegebenen Region passiert, was zur Abhängigkeit einer so entstehenden Segmentierung von einer Reihenfolge der verarbeiteten Regionen führt. In Fällen, in denen es darauf ankommt, den Einfluss der Säume auf ein Segmentierungsergebnis auszuschließen (z. B. wenn eine von der Bildausrichtung unabhängige Segmentierung benötigt wird), erfolgt die Suche nach einem Minimum bei jedem Iterationsdurchgang, indem die Bildregionen, die keine gemeinsamen Grenzen haben, verarbeitet werden; die Wahl der zu verarbeitenden Regionen wird bei jeder nachfolgenden Iteration verändert.
Zur Vermeidung einer Falle bei der Suche nach dem globalen Minimum in einem der lokalen Minima, entstanden durch die hohen Kosten eines Saums um jedwede lokale Region infolge von Rauschen in dem Bild, werden auf jeder Detailebene mehrere initiale Iterationen mit einem reduzierten Eingang von Saumfunktionen in die Summe der Kostenfunktionen durchgeführt. Dies ermöglicht ein Durchspringen (Hindurchtreten) der Säume durch die Kostenspitzen. Nachfolgende Iterationen werden mit dem gewöhnlichen Eingang von Saumfunktionen durchgeführt.
1–5 illustrieren ein spezifisches Umsetzungsbeispiel des vorgelegten Verfahrens, wobei das Referenzbild in Quadrate unterteilt ist und Säume nur entlang von Quadratgrenzen passieren können. Die Erklärungen beziehen sich auf eine Segmentierung eines Farbraums eines Referenzbildes. Während der Segmentierung mehrerer Bilder verändern sich nur Kostenfunktionen der Daten und Säume, weil anstelle einer Verwendung von Pixelfarbwerten als Funktionsparameter andere verwendet werden, die das Maß der Proximität verschiedener Bilder widerspiegeln (beispielsweise eine Helligkeitsdifferenz).
Bei jeder Iteration durchläuft jedes der Quadrate folgende Prozesse:

– der lokale Wert der Kostenfunktion wird berechnet, einschließlich der Kosten der Daten und Säume, die ein gegebenes Quadrat umgeben;
– die Kostenfunktion wird für alle möglichen Segmentierungswerte für ein gegebenes Quadrat berechnet;
– im Falle, dass die initiale Wahl der Segmentierung für ein gegebenes Quadrat nicht optimal ist (der Wert einer Funktion höher als für jedwede andere Segmentierung ist) wird der Wert für ein gegebenes Quadrat durch einen optimalen (mit dem Mininalwert der Kostenfunktionen) ersetzt.

Gerade und ungerade Iterationen werden in gestaffelter Reihenfolge durchgeführt. Bei dieser Reihenfolge hängt das Ergebnis der Verarbeitung in einer separaten Iteration nicht von der Richtung der Saumverlaufsbahn ab. Somit wirken sich auf jeden Saum (an der Seite eines Quadrats) nur ein Quadrat und keine anderen, benachbarten Quadrate aus einer gegebenen Iteration aus.
Um unpraktikabel lange Segmentgrenzen zu vermeiden, wird als Kostenfunktion eines Saums für ein spezifisches Pixel die absolute Differenz numerischer Farbwerte von angrenzenden Pixeln plus eine bestimmte positive Konstante verwendet. In diesem Fall erhöht die Konstante den Wert der Kostenfunktion eines Saums mit der Erhöhung ihrer Gesamtlänge.
Zur Vermeidung einer Falle bei der Suche nach dem globalen Minimum in einem der lokalen Minima werden die ersten drei Iterationen auf jeder Detailebene mit reduzierten Kosten der Saumfunktion mit einem Koeffizienten von 0,6, 0,75 bzw. 0,9 durchgeführt.
Durch Einsparung einer aktuellen Approximation an die optimale Segmentierung und die nur durch die Kostenfunktionen der Daten bei jeder Iteration bedingte Segmentierung kann die Verarbeitungsgeschwindigkeit weiter erhöht werden. Die Größe dieser Daten ist gleich einer doppelten Anzahl der Bildpixel. Zusätzlicher Speicher ist nur zum Speichern von Referenzdaten nötig, die zum Berechnen der Kostenfunktionen der Daten und Säume oder gegebenenfalls für vorberechnete Werte von gegebenen Funktionen benötigt werden, da diese für jedes Pixel während der ganzen Verarbeitung gleich sind.
GEWERBLICHE ANWENDBARKEIT
Das vorgelegte Verfahren hat gegenüber aktuell existierenden, analogen Verfahren folgende Vorteile:

1. Betriebsgeschwindigkeit. Die gesamte Bearbeitungszeit in aktuellen, verbreiteten mobilen Geräten (Veröffentlichungsjahr 2011) liegt innerhalb einer Sekunde.
2. Die Segmentierungsqualität (Nähe zur absoluten/optimalen Segmentierung) ist analog zu den besten bekannten Verfahren.
3. Sehr geringe Anforderungen an die Speicherressourcen bei Umsetzung des Verfahrens.
4. Das Verfahren ist beständig gegen Bildrauschen, da in den lokalen Minima keine Falle vorhanden ist.

Claims

Bildsegmentierungsverfahren, das eine Suche nach einem Minimum der Kostenfunktionen umfasst, wobei: die Suche auf einer Anzahl N von Bilddetailebenen, von gröber bis feiner, durchgeführt wird; das Bild auf jeder Bilddetailebene in Regionen unterteilt (segmentiert) wird; jeder Region mittels einer Anzahl n von aufeinanderfolgenden Iterationen ein einzelner Segmentierungswert zugewiesen wird; bei jeder Iteration der Wert der Kostenfunktion für die Säume an den Regionengrenzen für unterschiedliche Versionen einer Bildsegmentierung berechnet wird; für jede Region ein Segmentierungswert gewählt wird, der die Summe der Kostenfunktionen der Säume und Daten minimiert.
Verfahren gemäß Anspruch 1, wobei die Suche nach einem Minimum bei jeder Iteration durch Verarbeiten der Bildregionen, die keine gemeinsamen Grenzen haben, durchgeführt wird und die Wahl der zu verarbeitenden Regionen für jede Iteration geändert wird.
Verfahren gemäß Anspruch 1, wobei der Eingang der Kostenfunktion von Säumen in die Kombination der Kostenfunktionen der Daten und Säume in einer Teilmenge der Iterationen reduziert wird.