DE112012003377T5 - Bildsegmentierungsverfahren - Google Patents

Bildsegmentierungsverfahren Download PDF

Info

Publication number
DE112012003377T5
DE112012003377T5 DE112012003377.9T DE112012003377T DE112012003377T5 DE 112012003377 T5 DE112012003377 T5 DE 112012003377T5 DE 112012003377 T DE112012003377 T DE 112012003377T DE 112012003377 T5 DE112012003377 T5 DE 112012003377T5
Authority
DE
Germany
Prior art keywords
image
segmentation
region
regions
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE112012003377.9T
Other languages
English (en)
Inventor
Anmelder Gleich
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of DE112012003377T5 publication Critical patent/DE112012003377T5/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/422Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
    • G06V10/426Graphical representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)
  • Image Processing (AREA)

Abstract

Die Erfindung betrifft die Verarbeitung von Foto- und Videobildern. Eine Suche nach einem Minimum von Kostenfunktionen wird auf einer Anzahl N von Bilddetailebenen, von gröber bis feiner, durchgeführt, und auf jeder Bilddetailebene wird das Bild in Regionen unterteilt; jeder Region wird mittels einer Anzahl n von aufeinanderfolgenden Iterationen ein einzelner Segmentierungswert zugeordnet, danach wird der Wert der Kosten für die Säume an den Regionengrenzen mit unterschiedlichen Bildsegmentierungsarten berechnet, und für jede Region wird ein Segmentierungswert gewählt, der die Summe der Kostenfunktionen der Säume und Daten optimiert. Zur Vermeidung einer Falle bei der Suche nach dem globalen Minimum in einem der lokalen Minima, entstanden durch die hohen Kosten eines Saums um jedwede lokale Region infolge von Rauschen in dem Bild, werden zudem auf jeder Detailebene Teilmengen von Iterationen mit einem reduzierten Eingang von Saumfunktionen in die Summe der Kostenfunktionen durchgeführt. Das technische Ergebnis ist die Segmentierung eines Bildes unter nur geringer Verwendung der Speicherressourcen eines mobilen Geräts, während sowohl die Beständigkeit gegen Bildrauschen als auch die Betriebsgeschwindigkeit aufrechterhalten werden.

Description

  • TECHNISCHES GEBIET
  • Die Erfindung betrifft das Gebiet der Foto- und Video-Bildverarbeitung – insbesondere mithilfe mobiler Geräte mit integrierten Foto- und Videokameras – und ist beispielsweise dazu verwendbar, die Qualität eines aus mehreren Eingangs-Einzelbildern gewonnenen Ergebnisbildes zu verbessern.
  • HINTERGRUND DER ERFINDUNG
  • Da die Belichtung mehrerer Eingangs-Einzelbilder (Aufnahmen) in der Regel zu unterschiedlichen Zeitpunkten erfolgt, treten bei der Bildung einer Szene Verzerrungen zwischen verschiedenen Einzelbildern auf, die sich in der unterschiedlichen Anordnung bewegter (unbeständiger) Objekte und in der Veränderung von Belichtungsbedingungen der Szene manifestieren (beispielsweise infolge von Bewölkungsveränderungen), was sich auf die Qualität eines Ergebnisbildes auswirkt und sich manifestiert in:
    • – doppelten Konturen unbeständiger Objekte und in manchen Fällen einer Verdopplung der Anzahl bewegter Objekte in einem Bild
    • – Halbtransparenz von unbeständigen Objekten
    • – merklicher Unregelmäßigkeit der Helligkeit oder Farbbalance verschiedener Bereiche des Bildes.
  • Eine der Methoden zur Verbesserung der Qualität von Bildern mithilfe mobiler Geräte besteht aktuell darin, in einer kurzen Zeitperiode mehrere Einzelbilder aufzunehmen und sie anschließend zusammenzuführen, indem mehrere Bilder zu einem einzigen Ergebnisfoto zusammengefügt werden (wobei ein Panoramabild oder ein Bild mit erhöhtem Dynamikbereich erzeugt wird, das Bildrauschniveau verringert wird usw.). Das Zusammenfügen sollte dabei so erfolgen, dass Säume durch die Verlaufsbahn der geringsten Differenzen von benachbarten Initialbildern passieren und dass sie unbeständige Objekte umgehen. Ein verbreitetes Verfahren zum Bestimmen einer optimalen Saumverlaufsbahn verwendet verschiedene Bildsegmentierungsverfahren [Alexander Vezhnevets, Olga Barinova, ”Image Segmentation Methods: Automatic Segmentation”, Computer Graphics and Multimedia, Ausgabe 4(4)/2006: http://cgm.computergraphics.ru/content/view/147].
  • In folgenden Fällen der Erzeugung eines Bildes aus mehreren Initialbildern ist die Bildsegmentierung und -zusammenfügung am besten geeignet:
    • – Erzeugung eines Panoramabildes aus mehreren Aufnahmen, von denen jede nur einen Teil eines Panoramas abbildet
    • – Erzeugung eines Bildes mit hohem Dynamikbereich aus mehreren Initialbildern mit niedrigem Dynamikbereich.
  • Zur Verbesserung der Qualität von Bildern unter Verwendung von Segmentierung gibt es verschiedene Verfahren.
  • Das Clusterverfahren verwendet eine Repräsentation von Bildpunkten, die einem bestimmten Merkmalsraum zugewiesen ist, und dieser Merkmalsraum führt eine Metrik (ein Nähemaß) ein.
  • Der Nachteil dieses Verfahrens liegt darin, dass die räumliche Anordnung der Punkte entweder gar nicht berücksichtigt wird oder indirekt aufgenommen wird (beispielsweise durch Verwendung der Punktkoordinaten als eines der Merkmale). Daher wird, gewöhnlich nach der Clusterverarbeitung der Bildpunkte, ein Verfahren zum Definieren verbundener Komponenten durchgeführt. Zudem funktionieren Clusterverfahren bei verrauschten Bildern nicht gut: Häufig gehen separate Regionenpunkte verloren, es werden mehrere kleine Regionen erzeugt und so weiter.
  • Das Verfahren des Regionenwachstums [A. Tremeau und N. Borel, ”A Region Growing and Merging Algorithm to Color Segmentation”, Pattern Recognition, 1997; Y. Kanai, ”Image Segmentation Using Intensity and Color Information”, SPIE – Visual Communications and Image Processing '98; B. Cramariuc, M. Gabbouj und J. Astola, ”Clustering Based Region Growing Algorithm for Color Image Segmentation”, International Conference on Digital Signal Processing, 1997; sowie Y. Deng, B. S. Manjunath und H. Shin, ”Color Image Segmentation”, CVPR 1999] berücksichtigt die räumliche Anordnung der Punkte direkt. Zunächst werden nach einer bestimmten Regel die Mittelpunkte der Regionen ausgewählt und denselben angrenzende Punkte, die ein bestimmtes Kriterium erfüllen, stufenweise hinzugefügt. Der Regionenwachstumsprozess endet, wenn keiner der Bildpunkte mehr zu einer der Regionen hinzugefügt werden kann. Es werden unterschiedliche Kriterien verwendet, auf deren Basis ein Punkt einer Region hinzugefügt wird oder nicht: Nähe eines Punktes zu einem Regionenmittelpunkt, Nähe eines angrenzenden Punktes, der einer Region im vorangegangenen Schritt hinzugefügt wurde, Nähe gemäß einer bestimmten Regionenstatistik, Kosten des kürzesten Weges von einem Punkt zu einem Regionenmittelpunkt usw. Hauptsächlich wird der Regionenwachstumsprozess für separate Regionen genutzt. Jedoch lässt sich auch eine Partitionierung eines ganzen Bildes erzielen, indem diese Prozedur Schritt für Schritt oder gleichzeitig für mehrere Regionen befolgt wird.
  • Der Nachteil dieses Verfahrens ist seine Unanwendbarkeit für Aufgaben der Saumzusammenfügung; es wird nur in Fällen mit nur einem Referenzbild angewendet. Außerdem erfordert es bei mobilen Geräten beträchtliche Speicherressourcen. Zudem ist die Datenverarbeitungsgeschwindigkeit nicht schnell genug.
  • Fragmentierungs-Zusammenführungs-Verfahren [A. Tremeau und N. Borel, ”A Region Growing and Merging Algorithm to Color Segmentation”, Pattern Recognition, 1997; B. Cramariuc, M. Gabbouj und J. Astola, ”Clustering Based Region Growing Algorithm for Color Image Segmentation”, International Conference on Digital Signal Processing, 1997; M. Celenk, ”Hierarchical Color Clustering for Segmentation of Textured Images”, Proceedings of the 29th Southeastern Symposium on System Theory, 1997]; [S. Ji und H. W. Park, ”Image Segmentation of Color Image Based on Region Coherency”, Proceedings of ICIP '98; L. Shafarenko, M. Petrov und J. Kittler, ”Automatic Watershed Segmentation of Randomly Textured Color Images”, IEEE Transactions on Image Processing, 1997; und M. Barni, S. Rossi und A. Mecocci, ”A Fuzzy Expert System for Low Level Image Segmentation”, EUSIPCO-96] bestehen hauptsächlich aus zwei Stufen: Fragmentierung und Zusammenführung. Die Fragmentierung beginnt mit einer Partitionierung eines bestimmten Bildes, jedoch nicht unbedingt in uniforme Regionen. Der Regions-Fragmentierungsprozess wird solange durchgeführt, bis ein partitioniertes Bild vorliegt, das die Bedingung der Segment-Uniformität erfüllt (Übersegmentierung). Sodann erfolgt die Vereinigung ähnlicher benachbarter Segmente, bis eine Bildpartitionierung in uniforme Regionen maximaler Größe erzielt ist.
  • Die Nachteile dieser Verfahren liegen in der geringen Datenverarbeitungsgeschwindigkeit, in der Notwendigkeit größerer Speicherressourcen und in ihrer Verwendung nur im Fall eines einzelnen Referenzbildes.
  • Das Verfahren der Markov-Feld-Modellierung [G. R. Cross und A. K. Jain, ”Markov Random Field Texture Models”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 1983; S. German und D. German, ”Stochastic Relaxation, Gibbs Distributions, and the Bayesian Restoration of Images”, IEEE Transactions on Pattern Analysis and Machine Intelligence, 1984; R. Szeliski, R. Zabih, D. Scharstein, O. Veksler, V. Kolmogorov, A. Agarwala, M. Tappen, C. Rother, ”A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness-based Priors”, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 30, Nr. 6, Juni 2008] beruht auf der Annahme, dass die Farbe jedes Punktes des Bildes von den Farben einer bestimmten Anzahl angrenzender Punkte abhängt. Es wird eine Zusammenfassung des Bildmodells vorgeschlagen. Auch eine Zusammenfassung zur Textur-Segmentierung ist möglich [Y. Deng, B. S. Manjunath und H. Shin, ”Color Image Segmentation”, CVPR 1999].
  • Ein Nachteil dieses Verfahrens ist seine schwierige Umsetzung.
  • Verfahren auf der Basis von Kantendetektionsoperatoren [M. Jacob, M. Unser, ”Design of Steerable Filters for Feature Detection Using Canny-like Criteria”, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 26, Nr. 8, S. 1007–1019; Atilla Ozmen und Emir Tufan Akman, ”Edge Detection Using Steerable Filters and CNN”, 2002] nutzen eine Segmentierung, die im Finden von Regionengrenzen besteht und für Halbtonbilder gut gelöst ist. Ein Halbtonbild wird als Funktion von zwei Variablen angesehen, und es wird angenommen, dass die Regionengrenzen den Maxima des Gradienten dieser Funktion entsprechen. Um sie zu finden, wird eine Differenzgeometrie verwendet. Zur Erhöhung der Beständigkeit gegen Rauschen wird ein Bild üblicherweise vor der Verwendung von Filterung weichgezeichnet. Aufgrund der Kommutierbarkeit des Laplace-Operators und des Gauss'schen Filters sind Weichzeichnung und Grenzfindung gleichzeitig durchführbar.
  • Ein Nachteil dieses Verfahrens ist mangelnde Beständigkeit gegen Bildrauschen. Da die Definition einer Grenze bei jeder Aufgabe anders ist, muss zudem bei jeder Anwendung der Grenzfindungsverfahren ein Revisionsverfahren für die Filterungsergebnisse gewählt werden.
  • Optimierungsverfahren [Y. Deng, B. S. Manjunath und H. Shin, ”Color Image Segmentation”, CVPR 1999] bestehen im Partitionieren eines Bildes zu uniformen Regionen, woraus sich eine Optimierungsaufgabe ergibt. Hierfür ist die Segmentierungsaufgabe formuliert als die Aufgabe, nach einer Partitionierung eines Bildes mit bestimmten Eigenschaften zu suchen, sodann wird eine Funktion eingeführt, die den Konformitätsgrad der erzielten Segmentierung mit den vorgelegten Anforderungen widerspiegelt. Beispielsweise wird eine Segmentierungsqualitätsfunktion eingeführt, welche die Verteilung von Farben auf einem Bild verwendet.
  • Nachteile dieser Verfahren sind der damit verbundene Arbeitsaufwand und die hohen Anforderungen an die Ressourcen mobiler Geräte.
  • Gemeinsame Nachteile all dieser Verfahren sind:
    • – die Unanwendbarkeit einer erzielten Segmentierung auf die Aufgaben des Zusammenfügens, weil die Verfahren nur mit einem Referenzbild funktionieren können (Regionenwachstumsverfahren, Fragmentierungs-Vermischung, Kantendetektion)
    • – Systemressourcenanforderungen, die für mobile Geräte ungeeignet sind – Speicher und Betriebsgeschwindigkeit einer Recheneinheit (Clusterverfahren, Regionenwachstum, Fragmentierungs-Vermischung, Markov-Zufallsfeld, Verfahren der Graphentheorie, Optimierungsansätze)
    • – unzureichendes Funktionieren bei verrauschten Bildern (Clusterverfahren, Kantendetektion)
    • – fehlende Berücksichtigung der räumlichen Anordnung von Punkten (Clusterverarbeitung).
  • Das Graphenschnitt-Minimierungsverfahren kommt der vorgelegten Lösung am nächsten [ US-Patent 6,744,923 , ”System and Method for Fast Approximate Energy Minimization via Graph Cuts”; und R. Szeliski, R. Zabih, D. Scharstein, O. Veksler, V. Kolmogorov, A. Agarwala, M. Tappen, C. Rother, ”A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness-based Priors”, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 30, Nr. 6, Juni 2008]. Ein Bild wird in Form eines gewichteten Graphen mit den Knoten in den Bildpunkten vorgelegt. Die Gewichtung der Graphenverbindungen spiegelt die Ähnlichkeit der Punkte wider (beispielsweise die Distanz zwischen den Punkten nach einer bestimmten Metrik). Die Bildpartitionierung wird durch Graphenschnitte modelliert. Verfahren der Graphentheorie führen die Funktion der Schnitt-”Kosten” ein, welche die Qualität der erzielten Segmentierung widerspiegelt. Somit reduziert sich die Aufgabe der Bildpartitionierung in uniforme Regionen auf die Optimierungsaufgabe, einen Graphenschnitt mit minimalen Kosten zu finden. Abgesehen von der Farb-Uniformität und der Textur der Segmente ermöglicht dieses Verfahren eine Kontrolle der Form von Segmenten, ihrer Größe, der Komplexität der Grenzen usw. Zum Finden eines Minimalkostenschnitts gibt es verschiedene Verfahren: gierige Algorithmen (auf jeder Stufe Wahl derjenigen Verbindungen, welche die Gesamtschnittkosten minimieren würden), Verfahren der dynamischen Programmierung (auf jeder Stufe garantierte Wahl einer optimalen Verbindung, die einen optimalen Weg ergibt) usw.
  • Ein Nachteil dieses Verfahrens ist die große Zahl von Rechenoperationen, die zum Erzielen einer Lösung erforderlich ist, welche die Betriebsgeschwindigkeit verringert, sowie die Notwendigkeit, eine große Menge zusätzlichen Speichers vorzusehen, um einen optimalen Schnitt zu finden.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Der Autor hat sich die Aufgabe gestellt, ein Bildsegmentierungsverfahren zu entwerfen, das folgende Anforderungen erfüllt:
    • – Betriebsgeschwindigkeit
    • – optimale Bildsegmentierung – d. h. eine solche, die nützlich ist zum Erzielen des globalen Minimums der Summe der Saumkostenfunktion und der Kostenfunktion von Bilddaten (auf Basis von Farbe, Helligkeit und anderen Parametern) – und Proximität der erzielten Segmentierung zu der absoluten optimalen Fragmentierung, analog zu den besten bekannten Verfahren
    • – keine zusätzlichen Speicherressourcen des mobilen Geräts erforderlich
    • – Beständigkeit gegen Bildrauschen.
  • Das Wesentliche der vorgelegten technischen Lösung besteht darin, dass in dem bekannten Bildsegmentierungsverfahren, das nach einem Minimum von Kostenfunktionen sucht, diese Suche auf einer Anzahl N von Bilddetailebenen, von gröber bis feiner, durchgeführt wird und auf jeder Bilddetailebene das Bild in Regionen unterteilt wird; jeder Region wird mittels einer Anzahl n von aufeinanderfolgenden Iterationen ein einzelner Segmentierungswert zugewiesen. Danach wird der Wert der Kostenfunktion für die Säume an den Regionengrenzen mit unterschiedlichen Arten von Bildsegmentierung berechnet, und für jede Region wird ein Segmentierungswert gewählt, der die Summe der Kostenfunktionen der Säume und Daten minimiert.
  • In den Fällen, in denen es darauf ankommt, einen Einfluss der Säume auf das Segmentierungsergebnis auszuschließen (z. B. wenn eine von der Bildausrichtung unabhängige Segmentierung benötigt wird), erfolgt die Suche nach einem Minimum bei jeder nachfolgenden Iteration durch eine Verarbeitung von Bildregionen, die keine gemeinsamen Grenzen haben, und eine Auswahl der zu verarbeitenden Regionen wird bei jeder nachfolgenden Iteration aktualisiert. Zur Vermeidung einer Falle bei der Suche nach dem globalen Minimum in einem der lokalen Minima, entstanden durch die hohen Kosten eines Saums um jedwede lokale Region, werden zudem auf jeder Detailebene mehrere initiale Iterationen mit einem reduzierten Beitrag von Saumfunktionen in der Summe der Kostenfunktionen durchgeführt. Dies ermöglicht ein Durchspringen (Hindurchtreten) der Säume durch die Kostenspitzen.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 gibt ein Beispiel für ein Referenzbild, dessen Farbraum optimal in 12 Farben segmentiert wird.
  • 2 gibt ein Beispiel für eine Referenzsegmentierung für die gröbste Detailebene nur auf Basis der Kostenfunktion der Daten. Die Kostenfunktion der Säume wird als gleich null angenommen.
  • 3 stellt den Segmentierungszustand nach der ersten Iteration dar. Rechtecke mit abgerundeten Flächen kennzeichnen die bei einer gegebenen Iteration verarbeiteten Quadrate. Die horizontale Schraffur kennzeichnet die Quadrate mit veränderter Segmentierung bei einer gegebenen Iteration; die vertikale Schraffur kennzeichnet Quadrate, bei denen die Segmentierung beibehalten wurde.
  • 4 stellt den Segmentierungszustand nach der zweiten Iteration dar.
  • 5 stellt die Endergebnisse der Segmentierung auf jeder der Detailebenen dar. Die untere rechte Ecke stellt die so entstehende Segementierungslösung dar.
  • 6 zeigt Konvergenzdiagramme verschiedener Verfahren – beschrieben in der Abhandlung von R. Szeliski, R. Zabih, D. Scharstein, O. Veksler, V. Kolmogorov, A. Agarwala, M. Tappen und C. Rother, ”A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness-based Priors”, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 30, Nr. 6, Juni 2008 – zum Erreichen des globalen Minimums bei einer Panorama-Zusammenfügungsaufgabe. Die vertikale Achse ist die Abweichung vom globalen Minimum in Prozent; die horizontale Achse ist die logarithmische Zeitachse in Sekunden. Die Diagramme zeigen:
    • Figure DE112012003377T5_0002
      – Verfahren der Markov-Zufallsfelder, ”Iterated Conditional Modes”
    • Figure DE112012003377T5_0003
      – Varianten des Graphenschnittverfahrens, ”Loopy Belief Propagation”
    • Figure DE112012003377T5_0004
      – analog zum Verfahren der ”Loopy Belief Propagation”, ein Verfahren des ”Tree-reweighted Message Passing”
    • Figure DE112012003377T5_0005
      – Vorhersage der Untergrenze des globalen Minimums
    • Figure DE112012003377T5_0006
      – unterschiedliche Varianten des ”Graphenschnitt”-Verfahrens
    • Figure DE112012003377T5_0007
      – das vorgeschlagene Verfahren; der Kreis kennzeichnet die gesamte Verarbeitungszeit und die erzielte Abweichung vom globalen Minimum.
  • 7 und 8 stellen vergrößerte Diagrammversionen von 6 mit einem vergrößerten Maßstab der Abweichung vom globalen Minimum dar.
  • AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
  • Das vorgelegte Verfahren wird folgendermaßen durchgeführt: Ein Referenzbild wird einer Anzahl N von Detailebenenoperationen unterzogen (beispielsweise zufällige Partitionierung in Regionen, die bezüglich ihrer Größe nahe beieinander liegen). Auf jeder Detailebene wird eine Anzahl n von Iterationen durchgeführt, solange Veränderungen der Regionensegmentierung verbleiben, die zu einer Verringerung des Gesamtwerts der Funktionen der Säume und Daten führen – oder bis eine maximale akzeptable Anzahl von Iterationen für eine gegebene Detailebene erreicht ist, die durch die Gesamtverarbeitungszeit eines mobilen Geräts begrenzt ist.
  • Zwei Kostenfunktionen sind in Verwendung:
    • – die Kostenfunktion der Daten, die angibt, wie optimal die Zuordnung eines spezifischen Bildpixels zu einem der Segmente ist. Beispielsweise ein absoluter Wert der Differenz zwischen einem numerischen Wert der Farbe eines Pixels und der Farbe eines Segments.
    • – Die Kostenfunktion eines Saums gibt an, wie optimal die Grenzverlaufsbahn von Segmenten an einer gegebenen Stelle ist.
  • Auf jeder Detailebene können Säume nur entlang der Grenzen von Regionen verlaufen. Die Form der Regionen bleibt für jede der Detailebenen unverändert. Da die Korrekturiterationen, die der initialen, groben folgen, ein Durchspringen (Hindurchtreten) durch die lokalen Minima von Kostenfunktionen erlauben und eine sich daraus ergebende Segmentierung nahe am globalen Minimum liegt, wird diese Begrenzung der Verlaufsbahn von Säume als akzeptabel angesehen.
  • Eine Segmentierung, die durch Bildfragmentierung erreicht wird und nur auf dem Wert der Kostenfunktion der Daten basiert, ohne die Kosten der Säume zu berücksichtigen, wird als initiale Segmentierung verwendet. Mit einer solchen Segmentierung wird jeder Region der Bildpixel ein Segmentwert zugewiesen, der eine minimale Summe für alle Pixel einer gegebenen Region angibt. Auf den kombinierten Werten der Pixelregionen werden Iterationen mit der primären (groben) Detailebene durchgeführt.
  • Jede nachfolgende Iteration findet, verglichen mit der vorhergehenden, eine optimalere Segmentierung.
  • Bei jeder Iteration durchläuft jede der Pixelregionen folgende Prozesse:
    • – Der lokale Wert der Kostenfunktion wird berechnet, einschließlich der Kosten der Daten und Säume, die eine gegebene Region umgeben;
    • – die Kostenfunktion wird für alle möglichen Segmentierungswerte für eine gegebene Region berechnet;
    • – im Falle, dass die initiale Wahl der Segmentierung für eine gegebene Region nicht optimal ist (der Wert der Funktion höher als bei jedweder anderen Segmentierung ist), wird der Wert für eine gegebene Region durch einen optimalen (mit dem Minimalwert der Kostenfunktionen) ersetzt.
  • Die Regionen werden nacheinander verarbeitet; gleichzeitig wirkt sich der Segmentierungswert in einer spezifischen Region auf die Kosten des Saums aus, die entlang der Grenze einer gegebenen Region passiert, was zur Abhängigkeit einer so entstehenden Segmentierung von einer Reihenfolge der verarbeiteten Regionen führt. In Fällen, in denen es darauf ankommt, den Einfluss der Säume auf ein Segmentierungsergebnis auszuschließen (z. B. wenn eine von der Bildausrichtung unabhängige Segmentierung benötigt wird), erfolgt die Suche nach einem Minimum bei jedem Iterationsdurchgang, indem die Bildregionen, die keine gemeinsamen Grenzen haben, verarbeitet werden; die Wahl der zu verarbeitenden Regionen wird bei jeder nachfolgenden Iteration verändert.
  • Zur Vermeidung einer Falle bei der Suche nach dem globalen Minimum in einem der lokalen Minima, entstanden durch die hohen Kosten eines Saums um jedwede lokale Region infolge von Rauschen in dem Bild, werden auf jeder Detailebene mehrere initiale Iterationen mit einem reduzierten Eingang von Saumfunktionen in die Summe der Kostenfunktionen durchgeführt. Dies ermöglicht ein Durchspringen (Hindurchtreten) der Säume durch die Kostenspitzen. Nachfolgende Iterationen werden mit dem gewöhnlichen Eingang von Saumfunktionen durchgeführt.
  • 15 illustrieren ein spezifisches Umsetzungsbeispiel des vorgelegten Verfahrens, wobei das Referenzbild in Quadrate unterteilt ist und Säume nur entlang von Quadratgrenzen passieren können. Die Erklärungen beziehen sich auf eine Segmentierung eines Farbraums eines Referenzbildes. Während der Segmentierung mehrerer Bilder verändern sich nur Kostenfunktionen der Daten und Säume, weil anstelle einer Verwendung von Pixelfarbwerten als Funktionsparameter andere verwendet werden, die das Maß der Proximität verschiedener Bilder widerspiegeln (beispielsweise eine Helligkeitsdifferenz).
  • Bei jeder Iteration durchläuft jedes der Quadrate folgende Prozesse:
    • – der lokale Wert der Kostenfunktion wird berechnet, einschließlich der Kosten der Daten und Säume, die ein gegebenes Quadrat umgeben;
    • – die Kostenfunktion wird für alle möglichen Segmentierungswerte für ein gegebenes Quadrat berechnet;
    • – im Falle, dass die initiale Wahl der Segmentierung für ein gegebenes Quadrat nicht optimal ist (der Wert einer Funktion höher als für jedwede andere Segmentierung ist) wird der Wert für ein gegebenes Quadrat durch einen optimalen (mit dem Mininalwert der Kostenfunktionen) ersetzt.
  • Gerade und ungerade Iterationen werden in gestaffelter Reihenfolge durchgeführt. Bei dieser Reihenfolge hängt das Ergebnis der Verarbeitung in einer separaten Iteration nicht von der Richtung der Saumverlaufsbahn ab. Somit wirken sich auf jeden Saum (an der Seite eines Quadrats) nur ein Quadrat und keine anderen, benachbarten Quadrate aus einer gegebenen Iteration aus.
  • Um unpraktikabel lange Segmentgrenzen zu vermeiden, wird als Kostenfunktion eines Saums für ein spezifisches Pixel die absolute Differenz numerischer Farbwerte von angrenzenden Pixeln plus eine bestimmte positive Konstante verwendet. In diesem Fall erhöht die Konstante den Wert der Kostenfunktion eines Saums mit der Erhöhung ihrer Gesamtlänge.
  • Zur Vermeidung einer Falle bei der Suche nach dem globalen Minimum in einem der lokalen Minima werden die ersten drei Iterationen auf jeder Detailebene mit reduzierten Kosten der Saumfunktion mit einem Koeffizienten von 0,6, 0,75 bzw. 0,9 durchgeführt.
  • Durch Einsparung einer aktuellen Approximation an die optimale Segmentierung und die nur durch die Kostenfunktionen der Daten bei jeder Iteration bedingte Segmentierung kann die Verarbeitungsgeschwindigkeit weiter erhöht werden. Die Größe dieser Daten ist gleich einer doppelten Anzahl der Bildpixel. Zusätzlicher Speicher ist nur zum Speichern von Referenzdaten nötig, die zum Berechnen der Kostenfunktionen der Daten und Säume oder gegebenenfalls für vorberechnete Werte von gegebenen Funktionen benötigt werden, da diese für jedes Pixel während der ganzen Verarbeitung gleich sind.
  • GEWERBLICHE ANWENDBARKEIT
  • Das vorgelegte Verfahren hat gegenüber aktuell existierenden, analogen Verfahren folgende Vorteile:
    • 1. Betriebsgeschwindigkeit. Die gesamte Bearbeitungszeit in aktuellen, verbreiteten mobilen Geräten (Veröffentlichungsjahr 2011) liegt innerhalb einer Sekunde.
    • 2. Die Segmentierungsqualität (Nähe zur absoluten/optimalen Segmentierung) ist analog zu den besten bekannten Verfahren.
    • 3. Sehr geringe Anforderungen an die Speicherressourcen bei Umsetzung des Verfahrens.
    • 4. Das Verfahren ist beständig gegen Bildrauschen, da in den lokalen Minima keine Falle vorhanden ist.

Claims (3)

  1. Bildsegmentierungsverfahren, das eine Suche nach einem Minimum der Kostenfunktionen umfasst, wobei: die Suche auf einer Anzahl N von Bilddetailebenen, von gröber bis feiner, durchgeführt wird; das Bild auf jeder Bilddetailebene in Regionen unterteilt (segmentiert) wird; jeder Region mittels einer Anzahl n von aufeinanderfolgenden Iterationen ein einzelner Segmentierungswert zugewiesen wird; bei jeder Iteration der Wert der Kostenfunktion für die Säume an den Regionengrenzen für unterschiedliche Versionen einer Bildsegmentierung berechnet wird; für jede Region ein Segmentierungswert gewählt wird, der die Summe der Kostenfunktionen der Säume und Daten minimiert.
  2. Verfahren gemäß Anspruch 1, wobei die Suche nach einem Minimum bei jeder Iteration durch Verarbeiten der Bildregionen, die keine gemeinsamen Grenzen haben, durchgeführt wird und die Wahl der zu verarbeitenden Regionen für jede Iteration geändert wird.
  3. Verfahren gemäß Anspruch 1, wobei der Eingang der Kostenfunktion von Säumen in die Kombination der Kostenfunktionen der Daten und Säume in einer Teilmenge der Iterationen reduziert wird.
DE112012003377.9T 2011-08-15 2012-06-19 Bildsegmentierungsverfahren Withdrawn DE112012003377T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
RU2011134204/07A RU2489752C2 (ru) 2011-08-15 2011-08-15 Способ сегментации изображений
RURU2011134204 2011-08-15
PCT/RU2012/000478 WO2013025123A1 (ru) 2011-08-15 2012-06-19 Способ сегментации изображений

Publications (1)

Publication Number Publication Date
DE112012003377T5 true DE112012003377T5 (de) 2014-04-30

Family

ID=47715296

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112012003377.9T Withdrawn DE112012003377T5 (de) 2011-08-15 2012-06-19 Bildsegmentierungsverfahren

Country Status (8)

Country Link
US (1) US9076216B2 (de)
JP (1) JP5973572B2 (de)
KR (1) KR101807352B1 (de)
CN (1) CN103733207B (de)
DE (1) DE112012003377T5 (de)
IN (1) IN2014DN01819A (de)
RU (1) RU2489752C2 (de)
WO (1) WO2013025123A1 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2489752C2 (ru) * 2011-08-15 2013-08-10 Дмитрий Валерьевич Шмунк Способ сегментации изображений
US9021052B2 (en) * 2012-09-28 2015-04-28 Interactive Memories, Inc. Method for caching data on client device to optimize server data persistence in building of an image-based project
CN103996189B (zh) * 2014-05-05 2017-10-03 小米科技有限责任公司 图像分割方法及装置
US9633444B2 (en) 2014-05-05 2017-04-25 Xiaomi Inc. Method and device for image segmentation
RU2550534C1 (ru) * 2014-07-15 2015-05-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Рыбинский государственный авиационный технический университет имени П.А. Соловьева" Способ автоматического определения толщины слоя с нечеткими границами по изображению

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5787194A (en) * 1994-11-08 1998-07-28 International Business Machines Corporation System and method for image processing using segmentation of images and classification and merging of image segments using a cost function
US6078688A (en) * 1996-08-23 2000-06-20 Nec Research Institute, Inc. Method for image segmentation by minimizing the ratio between the exterior boundary cost and the cost of the enclosed region
US6058210A (en) * 1997-09-15 2000-05-02 Xerox Corporation Using encoding cost data for segmentation of compressed image sequences
US6744923B1 (en) 1999-08-30 2004-06-01 Cornell Research Foundation, Inc. System and method for fast approximate energy minimization via graph cuts
KR100378351B1 (ko) * 2000-11-13 2003-03-29 삼성전자주식회사 색-텍스추어 거리 측정 방법 및 장치와 이를 이용한영상의 영역 구분 방법 및 장치
US7349922B2 (en) * 2001-11-14 2008-03-25 Yeda Research And Development Co. Ltd. Method and apparatus for data clustering including segmentation and boundary detection
GB0130210D0 (en) 2001-12-18 2002-02-06 Caladrius Ltd Segmentation of images using the watershed method
JP2004258750A (ja) * 2003-02-24 2004-09-16 Fuji Photo Film Co Ltd 画像の特徴ベクトルのクラスタリング方法および装置
US8428354B2 (en) * 2009-06-23 2013-04-23 Los Alamos National Security, Llc Image segmentation by hierarchial agglomeration of polygons using ecological statistics
US8345974B2 (en) 2009-07-14 2013-01-01 Hewlett-Packard Development Company, L.P. Hierarchical recursive image segmentation
CN102103744A (zh) * 2011-01-28 2011-06-22 武汉大学 基于最小生成树与统计学习理论的图像分割方法
RU2489752C2 (ru) * 2011-08-15 2013-08-10 Дмитрий Валерьевич Шмунк Способ сегментации изображений
EP2637139A1 (de) * 2012-03-05 2013-09-11 Thomson Licensing Verfahren und Vorrichtung für die Zweischichtsegmentierung
US8792013B2 (en) * 2012-04-23 2014-07-29 Qualcomm Technologies, Inc. Method for determining the extent of a foreground object in an image

Also Published As

Publication number Publication date
CN103733207A (zh) 2014-04-16
CN103733207B (zh) 2017-08-11
RU2489752C2 (ru) 2013-08-10
US9076216B2 (en) 2015-07-07
US20140254935A1 (en) 2014-09-11
JP2014527671A (ja) 2014-10-16
KR101807352B1 (ko) 2017-12-08
JP5973572B2 (ja) 2016-08-23
KR20140071367A (ko) 2014-06-11
WO2013025123A1 (ru) 2013-02-21
RU2011134204A (ru) 2013-02-20
IN2014DN01819A (de) 2015-05-15

Similar Documents

Publication Publication Date Title
EP2467828B1 (de) Verfahren und system zur automatischen objekterkennung und anschliessenden objektverfolgung nach massgabe der objektform
DE60003032T2 (de) Verfahren zur bildsegmentation
DE10317917B4 (de) System und Verfahren zum Umgrenzen und Klassifizieren von Regionen innerhalb einer graphischen Abbildung
DE60129872T2 (de) Verfahren zur Extrahierung von Titeln aus numerischen Bildern
DE102008046859B4 (de) 3D Segmentierung von allgemeiner Läsion in CT
EP1316057B1 (de) Auswerten von kantenrichtungsinformation
DE112007001789B9 (de) Verfahren zum Bewerten eines Bildes im Hinblick auf eine dominante Linie
DE112012004809B4 (de) Kantenverfolgung mit Hysterese-Schwellenwertbildung
DE102015121339A1 (de) Systeme und verfahren zum ermitteln eines zustands einer fahrbahn
DE102016100101A1 (de) System zum maschinellen sehen und analytisches verfahren zur segmentierung planarer oberflächen
DE102013223803A1 (de) Verfahren und Vorrichtung zur Segmentierung eines Belegungsgitters für ein Umfeldmodell eines Fahrerassistenzsystems für ein Fahrzeug
DE602004008471T2 (de) Verfahren und anordnung zur bestimmung einer objektkontur
DE102005010578A1 (de) Lokale Watershed-Operatoren für die Bildsegmentierung
DE112012003377T5 (de) Bildsegmentierungsverfahren
DE102015009820A1 (de) Bildsegmentierung für eine Kamera-Liveeinspielung
DE112013002731T5 (de) Formerkennung unter Nutzung von Kettenkode-Statuszuständen
DE112009003648B4 (de) Verfahren und Vorrichtung zur Barrierentrennung
CN109712143A (zh) 一种基于超像素多特征融合的快速图像分割方法
DE102021128523A1 (de) Hierarchische bildzerlegung zur defekterkennung
DE202017007534U1 (de) Multiskalige 3D-Textursynthese
EP1437685A2 (de) Verfahren zum Segmentieren einer dreidimensionalen Struktur
DE102006044595B4 (de) Bildverarbeitungsvorrichtung zur Segmentierung anhand von Konturpunkten
DE60320118T2 (de) Verfahren zur zusammenlegung von bildern einer videosequenz
DE112014001697T5 (de) Bildverarbeitungsvorrichtung, Bildverarbeitungsprogramm und Betriebsverfahren für Bildverarbeitungsvorrichtung
DE102019105293A1 (de) Schätzung der Bewegung einer Bildposition

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06K0009340000

Ipc: G06V0030148000

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee