EP2622540A1 - Verfahren zur klassifizierung von mustern in bilddatensätzen - Google Patents

Verfahren zur klassifizierung von mustern in bilddatensätzen

Info

Publication number
EP2622540A1
EP2622540A1 EP11771014.5A EP11771014A EP2622540A1 EP 2622540 A1 EP2622540 A1 EP 2622540A1 EP 11771014 A EP11771014 A EP 11771014A EP 2622540 A1 EP2622540 A1 EP 2622540A1
Authority
EP
European Patent Office
Prior art keywords
image data
statistical measures
cluster
clusters
sets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP11771014.5A
Other languages
English (en)
French (fr)
Inventor
Iris Paternoster-Bieker
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of EP2622540A1 publication Critical patent/EP2622540A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram

Definitions

  • the invention relates to a method for classifying patterns in image datasets, and to a computer program product.
  • Textures or patterns play an important role in the composition of natural images, their analysis and classification in various image analysis applications (Porter, R., Canagarajah, N .: Robust rotation invariant texture Classification: wavelet, Gabor filter and GMRF based schemes : IEE Proc.-Vis. Image Signal Processing 144 (1997), No. 3, pp. 180-188).
  • the field of application has a broad spectrum: surface inspection, texture object recognition, OCR, document segmentation, tissue recognition in medical images, automated visual examinations, content-based image search, and remote recognition (see Hiremath, PS, S .: Wavelet Based Features for Texture Classification In: GVIP Journal 6 (2006), No. 3, pp. 55-58).
  • CONFIRMATION COPY displayed local gray values. These values usually have constant or very little different properties within a texture. Thus, different textures can be recognized by comparing these values.
  • Structural models assume that the textures consist of texture primitives. They can be reproduced using primitive positioning controls (see Tuceryan, M., Jain, AK: The Handbook of Pattern Recognition and Computer Vision, World Scientific and Publishing Co., 1998. 207-248 p. //www.cs.iupui.edu/ ⁇ tuceryan/research/ComputerVision/texture- review.pdf).
  • Structural texture analysis models consist of two phases: a) Determining the texture elements b) Defining the positioning rules. This is applicable for very regular textures.
  • the texture primitives may be e.g. with edge detection using the Laplacian-of-Gaussian or difference-of-Gaussian method.
  • Wavelet theory has evolved over time as a unified basis for various signal processing applications such as multiresolution signal processing, machine vision, subband coding and speech compression (Chitre, Y., Dhawan, AP: M-band wavelet discrimination of In: Pattern Recognition 32 (1999), pp. 773-789)
  • multiresolution implies, it deals with the representation and analysis of a signal (image) in several resolutions. The charm of this method is that you can see the properties overlooked in one resolution in a different resolution.
  • the reason for a wavelet transform can be described as follows: When we look at an image, we see contiguous areas of similar textures and intensity levels that make up the objects. If these objects are very small in size and have low contrast, we examine them in higher resolutions. If they are very large and have high contrast values, they will be displayed coarser. But if there are both small and large objects or objects with low and high contrast in an image at the same time, it is advantageous to examine the image in different resolutions. This is the fundamental background for the "multi-resolution and Editing, see Gonzalez, RC; Woods, RE: Digital Image Processing. Pearson Education, Inc. Pearson Prentice Hall, NJ, 2008.
  • Discrete Wavelet function is the Haar wavelet, which is used in one embodiment of this invention.
  • the Haar wavelet was proposed by Alfred Haar in 1910 and is the first known wavelet in the literature. It is also referred to as the "D2" wavelet, a special form of "Daubechies wavelet".
  • the Haar wavelet is also known as a simple and easy orthonormal wavelet. This makes it very easy to implement.
  • the disadvantage is that the Haar wavelet is not continuous and therefore not differentiable. This property may be an advantage or disadvantage depending on the signal.
  • the discrete wavelet transform (wavelet series) of a function f (x) is defined by
  • the magnitude of the wavelet coefficients in a particular channel is greater for those images that have a strong texture property in orientation and frequency represented by the channel. Therefore, the texture of an image can be mapped with a feature vector formed by statistical measures of the wavelet coefficients from the respective channel (sub-band). This finally allows the use of the characteristics of the wavelet coefficients for texture classification.
  • the invention has the object to provide a method for the classification of patterns in image data sets, which can be used to improve conventional classification methods for texture classification.
  • a method for classifying patterns in image data sets, wherein the classification comprises fuzzy c-means clustering comprising ("training phase"): a) acquisition of training image data sets, wherein the training image data sets contain image data of different classes of B) wavelet transformation of the training image data sets to obtain a set of wavelet coefficients for each training image data set; c) determining a set of statistical measures for each training image data set from the associated set of wavelet coefficients; d) Classifying all sets of statistical measures of the training image datasets to form clusters of the sets of statistical measures, each cluster having a cluster center, each cluster center being associated with one or more of the classes of the patterns, e) determining the ambiguity associated clusters, which are several classes of Mu f) reclassifying the sets of statistical measures of the training image data sets of the unclassified clusters to form further clusters of the sets of statistical measures for each not uniquely associated clusters, each additional cluster having a further cluster center, each additional cluster center being associated with one or more of the classes of the patterns
  • Embodiments of the invention have the advantage that it is possible in a reliable manner to classify patterns in image data sets. If, in an initial classification pass according to steps a) -d), individual clusters are assigned to multiple classes of patterns for the purpose of determining cluster centers, the classification for these non-unique clusters is repeated in steps e) and f), thereby the recognition rate increases significantly.
  • the core of the invention is thus the cascaded repetition of steps e) and f) in combination of the determination of statistical measures from the coefficients of wavelet transformations and fuzzy c-means clustering. This ensures that sets of statistical measures of the training image records can be uniquely assigned to a single class of patterns.
  • This "training phase” thus creates a knowledge base (also known as "knowledgebase”) which can then be used to classify real test image data records.
  • cluster problems can be solved in general.
  • the problem with cluster problems is to group a set of data with similar properties and map them to the same cluster. Nearby data points have similar properties and are to be grouped into common clusters.
  • fuzzy C-Means each of the N data elements xi is not only assigned to a cluster, but to each cluster with a certain affiliation Pi j (x). Instead of minimizing the distance to the cluster center for all data elements, the distance of each element belonging to the cluster Center multiplied, cf. Chapter Fuzzy Logic, ln: Kramer, O .: Computational Intelligence, An Introduction, Springer Verlag, Berlin Heidelberg, 2009, pp. 75-99.
  • the cluster centers are calculated alternately according to the above equation in each step, and then the affiliations to the clusters are updated. These two steps are carried out alternately until the sum of the changes in the membership values ⁇ ⁇ falls below a value ⁇ . This defines the cluster centers and the knowledge base.
  • the knowledge base is thus initially built on the basis of a training data set.
  • the method further comprises the following steps (“test phase”): a) acquisition of test image data sets, b) wave-image transformation of the test image data sets to obtain
  • Step e) ensures that, even in the case of potential non-unique assignment of a set of statistical measures to one of the classes of patterns by the reclassification process, the corresponding set of statistical measures of the test image data set can be uniquely assigned to a single class of patterns.
  • step e) the clusters determined in step e) of the training phase are reclassified, using in each case the knowledge base of the individual 'cluster from step f) of the training phase.
  • the training image data sets image data include a first number of different classes of patterns, wherein the number of clusters formed by the classification of the training image data sets corresponds to the first number, wherein for a non-unique cluster - this cluster is assigned a second number of different classes of patterns,
  • the steps e) and f) of the training phase are repeated in cascaded fashion until the number of clearly assignable clusters has exceeded a predetermined minimum value.
  • the minimum value is at least 95%.
  • the statistical measures are chosen such that they are invariant with respect to rotation of the image data sets.
  • the method is stable executable, since the orientation of the image data sets no longer plays a role.
  • the method provides the same precise classification result. If rotation invariance is to be achieved, then the pairs of mutually diagonal channels from the wavelet transform are combined into one statistical feature (Porter, R., Canagarajah, N: Robust rotation invariant texture classification: wavelet, Gabor filter and GMRF based schemes : IEE Proc.-Vis. Image Signal Processing 144 (1997), No. 3, pp. 180-188)
  • wavelet transformations are otherwise scaling invariant, so that the scaling of the image data sets to be classified also plays no role.
  • the statistical measures include an energy value and / or an entropy value and / or a standard deviation.
  • ⁇ Energy In the analysis of the textures of wavelet-transformed images, the mean value of the magnitude of the wavelet coefficients is mostly used.
  • the energy of the nth channel is, according to Porter, R.; Canagarajah, N .: Robust rotation invariant texture Classification: wavelet, Gabor filters and GMRF based schemes.
  • IEE Proc.-Vis. Image Signal Processing 144 (1997), No. 3, pp. 180-188 is defined as follows:
  • i and j are the row and column of the nth channel, and x is the wavelet coefficient within that channel.
  • the third feature may be the entropy value in each channel. This feature has been used e.g. from Chitre, Y.; Dhawan, A.P .: M-band wavelet discrimination of natural textures. In: Pattern Recognition 32 (1999), pp. 773-789 describes and is calculated according to:
  • the training image records contain unique classes of patterns. In other words, a single image is not associated with 2 different classes, but the class assignment of the images is unique.
  • the method further comprises setting the set of statistical measures, wherein steps d) -f) are performed for different set of statistical measures defining the set of statistical measures for which the recognition rate of the training phase is maximized. This set of statistical measures thus determined is then also applied identically in the classification of the test images.
  • the determination of the set of statistical measures can be carried out, for example, as an intermediate step between steps c) and d). However, it can also be determined mathematically in advance (before step c) which sets of statistical measures should be used.
  • the invention relates to a computer program product having computer-executable instructions for performing the method steps as described above.
  • Fig. 2A part A of a tabular overview of the training phase under
  • Fig. 5 is a tabular overview of the wavelet error rate after the 2nd stage of the cascaded classification of the micrographs.
  • Figure 1 shows a graphical overview of various micrographs (publisher, steel iron: straightening series for the evaluation of the structure of annealed hot-work steels, SEP1614 board 2nd Verlag Stahleisen, Dusseldorf, 1996).
  • Micrographs of crude steel show microstructures that arise when the hot steel cools, and are a measure of the quality of the material.
  • the samples are taken from the annealed material, ground and polished and etched in 3% alcoholic nitric acid to reveal micro-homogeneity.
  • the sample viewed under microscope at a magnification of 500: 1 is assigned to an image of a guideline series.
  • FIG. 1 shows the straightening row with the steps from GA1 to GF5.
  • Figures 2A and 2B show a tabular overview of the training phase using 6 wavelet features:
  • the detection rate for pure wavelet features was 72.9%, 27.1% of the images (ie their sets of statistical measures) were incorrect Class assigned. Only 24 clusters were unique, 2 clusters contained 2 classes, 2 clusters consisted of 3 classes, a cluster of 4 and one of 5 classes.
  • cluster # 9 shows both a possible membership of class GC5 and class GD3, with 56 being assigned to sets of statistical measures (belonging to different images) in cluster # 9.
  • FIG. 3 shows the procedure in the diagram.
  • the images used for training purposes consist uniquely of k classes, ie that each image can be uniquely assigned to a single class.
  • These training image data are then classified according to steps b) through d) of the training phase, resulting in a number of k clusters of the sets of statistical measures of the training image data sets in step 302.
  • the training image data sets image data have a number k of different classes of patterns, the number of clusters formed by the classification of the training image data sets corresponding to the number k.
  • the knowledge base is updated accordingly.
  • the cluster centers of the sets are stored by a number p (p> 0) of statistical measures, each cluster center being uniquely assigned a class.
  • Each set of statistical measures can be graphically represented as a point in a p-dimensional space, with the associated cluster center also being arranged in this p-dimensional space. Any further set of statistical measures (for example, a test data set) that is near this cluster center can thus be identified as belonging to that cluster center.
  • step 304 to form further clusters of sets of statistical measures for each non-unique cluster in step 302, each additional cluster having a further cluster center, each additional cluster Center is assigned to one or more of the classes of patterns.
  • cluster 2 consists of n different classes
  • a classification is performed on n different classes.
  • clusters m consisting of I different classes
  • classification is performed on I different classes. This results in further clusters in step 306.
  • the knowledge base is updated accordingly. In accordance with the required recognition rate, this method can be continued cascaded for clusters that can not be assigned unambiguously until a desired recognition rate has been reached. This creates a new knowledge base for each cluster that is reclassified.
  • test execution is understood to mean the application of the method for classifying real images.
  • step 400 a collection of test image data sets is made, to which the classification knowledge base generated in FIG. 3 step 300 is applied.
  • a wavelet transformation of the test image data sets is first performed to obtain a set of wavelet coefficients for each test image data set, whereupon a determination of a set of statistical measures for each test image data set is made from the associated set of wavelet coefficients.
  • the cluster center mappings stored in the knowledge base generated in accordance with Figure 3 are used to classify all sets of statistical measures of the test image data sets to form clusters of the sets of statistical measures of the test image data sets. This results in step 402 different clusters 1..k.
  • the multiple assignment clusters known from training are reclassified, with the re-classification done using the previously determined other cluster centers. That is, for this purpose, the new knowledge bases generated in step 304 are used.
  • steps 404 clustering sets of statistical measures (i.e., individual test images) that can be uniquely assigned to corresponding classes.
  • FIG. 5 shows the non-unique clusters before and after the second classification. Of the previously 228 incorrect assignments, only 31 remain. This results in an improvement of the recognition rate from 72.9% to 96.3% for the cascaded classification of the training data from the wavelet features.
  • the o.g. Classified 1320 microstructures In a test phase, the o.g. Classified 1320 microstructures. In the first stage, 72.5% were correctly assigned, 362 images were wrongly classified. Subsequently, as shown in Figure 4, the multiple assignment clusters known from training were reclassified. In the second stage, another 321 images could be assigned correctly. The remaining 42 represented an error rate of 3.2% and a detection rate of 96.8%.
  • the method of a two-stage classification with fuzzy c-means clustering with the statistical features from the coefficients of wavelet transformation has the advantage that a very good classification result can be reliably achieved.

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

Die Erfindung betrifft Verfahren zur Klassifizierung von Mustern in Bilddatensätzen, wobei die Klassifizierung ein Fuzzy c-Means Clustering umfasst, wobei das Verfahren umfasst eine Erfassung von Trainings-Bilddatensätzen, wobei die Trainings- Bilddatensätze Bilddaten unterschiedlicher Klassen von Mustern enthalten, Wavelet- Transformation der Trainings-Bilddatensätze zum Erhalt eines Satzes von Wavelet- Koeffizienten für jeden Trainings-Bilddatensatz, Bestimmung eines Satzes von statistischen Maßen für jeden Trainings-Bilddatensatz aus dem zugehörigen Satz von Wavelet-Koeffizienten, Klassifizierung aller Sätze von statistischen Maßen der Trainings-Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen, wobei jeder Cluster ein Cluster-Zentrum aufweist, wobei jedes Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist, Bestimmung der nicht eindeutig zugeordneten Cluster, welche mehreren Klassen von Mustern zugeordnet sind, sowie eine erneute Klassifizierung der Sätze von statistischen Maßen der Trainings- Bilddatensätze der nicht eindeutig zugeordneten Cluster zur Bildung von weiteren Clustern der Sätze von statistischen Maßen für jeden nicht eindeutig zugeordneten Cluster, wobei jeder weitere Cluster ein weiteres Cluster-Zentrum aufweist, wobei jedes weitere Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist.

Description

Verfahren zur Klassifizierung von Mustern in Bilddatensätzen Die Erfindung betrifft ein Verfahren zur Klassifizierung von Mustern in Bilddatensätzen, sowie ein Computerprogrammprodukt.
Texturen oder Muster spielen eine wichtige Rolle in der Komposition von natürlichen Bilder, deren Analyse und Klassifikation in verschiedenen Bildanalyse-Applikationen (Porter, R. ; Canagarajah, N.: Robust rotation invariant texture Classification: wavelet, Gabor filter and GMRF based schemes. In: IEE Proc.-Vis. Image Signal Processing 144 (1997), Nr. 3, S. 180-188). Das Anwendungsgebiet hat ein großes Spektrum: Untersuchung von Oberflächen, Objekterkennung anhand seiner Textur, OCR, Dokumentsegmentierung , Gewebeerkennung in medizinischen Bildern, automatisierte visuelle Untersuchungen, inhaltsbasierte Bildsuche und Fernerkennung (vgl. Hiremath, P.S. ; Shivashankar, S.: Wavelet Based Features for Texture Classification. In: GVIP Journal 6 (2006), Nr. 3, S. 55-58).
Die meisten existierenden Texturanalysemethoden basieren auf der Annahme, dass die Texturbilder mit derselben Orientierung und Skalierung aufgenommen worden sind. Dies ist eine Einschränkung bei der Anwendung dieser Methoden. Meistens ist es sehr schwierig oder sogar unmöglich, dieselbe Orientierung, Skalierung und Translation zu gewährleisten (Zhang, J. ; Tan, T.: Brief review of invariant texture analysis methods. In: Pattern Recognition 35 (2002), S. 735-747).
Die Methoden zur Darstellung der Texturmerkmale können grob in einen statistischen oder strukturellen Ansatz unterteilt werden (Haralick, R. M.: Statistical and Structural Approaches to Texture. In: Proceedings of the.lEEE 67 (1979), Nr. 5, S. 786-804). Bei der statistischen Methode werden Texturen anhand der statistischen Eigenschaften der
BESTÄTIGUNGSKOPIE lokalen Grauwerte dargestellt. Diese Werte haben innerhalb einer Textur meistens konstante oder sehr wenig abweichende Eigenschaften. Somit können unterschiedliche Texturen durch einen Vergleich dieser Werte erkannt werden.
Strukturelle Modelle gehen davon aus, dass die Texturen aus Textur-Primitiven bestehen. Sie können mit einer Positionierungsregelung der Primitiven wieder reproduziert werden (vgl. Tuceryan, M. ; Jain, A. K.: The Handbook of Pattern Recognition and Computer Vision. World Scientific and Publishing Co.,, 1998. - 207- 248 S. - http://www.cs.iupui.edu/~tuceryan/research/ComputerVision/texture- review.pdf). Strukturelle Texturanalyse-Modelle bestehen aus zwei Phasen: a) Bestimmung der Textur-Elemente b) Definition der Positionierungsregeln. Dies ist bei sehr regelmässigen Texturen anwendbar. Die Textur-Primitiven können z.B. mit einer Kantenerkennung mit der Methode „Laplacian-of-Gaussian" oder „difference-of- Gaussian" extrahiert werden. Sobald die Primitiven feststehen, werden entweder die Primitiven statistisch ausgewertet oder die Positionierungsregeln dechiffriert (Wu, J.: Rotation Invariant Classification of 3D Surface Texture Using Photometrie Stereo. Thesis submitted for the Degree of Doctor of Philosophy, Department of Computer Science, School of Mathematical and Computer Sciences, Heriot-Watt University, Edinburgh, 2003).
Bei früheren Texturanalyse-Methoden wurden zunächst „first-order" oder „second- order" Statistiken angewendet, danach wurden modellbasierte Methoden wie„Gaussian Markov Random Fields", „Gibbs Random Fields" oder „Wold Model"entwickelt. In diesen Methoden wird die Textur entweder als Linearkombination einer Menge von Basisfunktionen oder als Wahrscheinlichkeitsmodell dargestellt. Die Koeffizienten dieser Modelle werden zur Beschreibung der Textur benutzt. Das Hauptproblem dieser Vorgehensweise ist die Schätzung der Koeffizienten und die Auswahl eines bestmöglich passenden Modells zur gegebenen Textur. Meistens werden die Koeffizienten so transformiert, dass sie translations-, rotations- und skalierungsinvariant sind. Zu den modellbasierten Methoden zählen„Simultaneous autoregressive (SAR)", „Circular Simultaneous Autoregressive (CSAR)", „Rotation Invariant SAR (RISAR)", „Multichanell Gabor Filter", „Fraktalen", „Steerable pyramid" und „Wavelet- Transformation" (vgl. z.B. Zhang, J. ; Tan, T.: Brief review of invariant texture analysis methods. ln:Pattern Recognition 35 (2002), S. 735-747; sowie Mandelbrot, B. B.: The Fractal Geometry of Nature. Freeman, New York, 1983). Die Wavelet-Theorie hat sich im Laufe der Zeit als eine einheitliche Basis für verschiedene signalverarbeitende Applikationen wie „multiresolution" Signalbearbeitung, maschinelles Sehen, Teilbandkodierung und Sprach-Kompression, gebildet (Chitre, Y. ; Dhawan, A.P.: M-band wavelet discrimination of natural textures. In: Pattern Recognition 32 (1999), S. 773-789) . Wie der Name„multiresolution" schon sagt, befasst es sich mit der Repräsentation und Analyse eines Signals (Bildes) in mehreren Auflösungen. Der Reiz dieser Methode liegt darin, dass man die in einer Auflösung übersehenen Eigenschaften in einer anderen Auflösung feststellen kann. Bis Ende der achtziger Jahre blieb das Interesse an dieser Methode gering, doch zur Zeit ist es schwierig, den Überblick über die Vielzahl der wissenschaftlichen Arbeiten über Wavelets zu behalten (Gonzalez, R. C. ; Woods, R. E.: Digital Image Processing. Pearson Education, Inc. Pearson Prentice Hall, New Jersey, 2008).
Anschaulich kann der Grund für eine Wavelet-Transformation wie folgt beschreiben werden: Wenn wir ein Bild betrachten, sehen wir zusammenhängende Bereiche aus ähnlichen Texturen und Intensitätsstufen, die die Objekte bilden. Falls diese Objekte von der Größe her sehr klein sind und einen niedrigen Kontrast haben, untersuchen wir sie in höheren Auflösungen. Falls sie sehr groß sind und hohe Kontrastwerte haben, werden sie grobkörniger dargestellt. Aber wenn in einem Bild gleichzeitig kleine und große Objekte bzw. Objekte mit niedrigem und hohem Kontrast vorhanden sind, ist es vorteilhaft, das Bild in verschiedenen Auflösungen zu untersuchen. Dies ist der fundamentale Hintergrund für die„multiresolutionu-Bearbeitung, vgl Gonzalez, R. C. ; Woods, R. E.: Digital Image Processing. Pearson Education, Inc. Pearson Prentice Hall, New Jersey, 2008.
Man unterscheidet zwischen der sogenannten „kontinuierlichen Wavelet- Transformation" und der „diskreten Wavelet-Transformation". Letztere ist eine unendliche Reihenentwicklung und erfordert damit bei numerischer Rechnung den Abbruch nach endlich vielen Termen.
Ein Beispiel für eine Diskrete Wavelet-Funktion ist das Haar-Wavelet, welches in einer Ausführungsform dieser Erfindung genutzt wird. Das Haar-Wavelet ist von Alfred Haar im 1910 vorgeschlagen und ist in der Literatur das erste bekannt gewordene Wavelet. Es wird auch als„D2" Wavelet bezeichnet, als eine spezielle Form von„Daubechies Wavelet". Das Haar-Wavelet ist auch bekannt als ein möglichst einfaches und orthonormales Wavelet. Dadurch ist es auch sehr einfach implementierbar. Der Nachteil ist, dass das Haar-Wavelet nicht stetig und dadurch nicht differenzierbar ist. Diese Eigenschaft kann je nach Signal von Vorteil oder Nachteil sein.
Die Diskrete Wavelet-Transformation (Wavelet Reihe) einer Funktion f(x) ist definiert durch
OO OO μ=-οο fc= -oo mit den Wavelet Koeffizienten όμ
— o Das Haar-Wavelet <p(x) und seine Skalierungsfunktion φ(χ) sind definiert durch
I 0 < x < l /2. f
I 1 0 < < 1.
-) = { - 1 l/2 < x < L <?(*) = < r ~
I 0 sonst
0 sonst
Die Magnitude der Wavelet-Koeffizienten in einem bestimmten Kanal ist für diejenigen Bilder größer, die eine starke textureile Eigenschaft in Orientierung und Frequenz haben, die durch den Kanal repräsentiert wird. Daher kann die Textur eines Bildes mit einem Merkmalsvektor abgebildet werden, der durch statistische Maße aus den Wavelet-Koeffizienten aus dem jeweiligen Kanal (Sub-band) gebildet wird. Dies ermöglicht schließlich die Verwendung der Charakteristika der Wavelet-Koeffizienten zur Texturklassifikation.
Ein Problem herkömmlicher Klassifizierungsmethoden zur Texturklassifikation ist jedoch, dass die Erkennungsrate von Texturen nur unzureichend ist. Dem gegenüber liegt der Erfindung die Aufgabe zugrunde, ein Verfahren zur Klassifizierung von Mustern in Bilddatensätzen vorzuschlagen, mit welchem sich herkömmliche Klassifizierungsmethoden zur Texturklassifikation verbessern lassen.
Die der Erfindung zugrunde liegende Aufgabe wird mit den Merkmalen der unabhängigen Patentansprüche gelöst. Bevorzugte Ausführungsformen der Erfindung sind in den abhängigen Patenansprüchen angegeben.
Es wird ein Verfahren zur Klassifizierung von Mustern in Bilddatensätzen vorgeschlagen, wobei die Klassifizierung ein Fuzzy c-Means Clustering umfasst, wobei das Verfahren umfasst („Trainingsphase"): a) Erfassung von Trainings-Bilddatensätzen, wobei die Trainings- Bilddatensätze Bilddaten unterschiedlicher Klassen von Mustern enthalten, b) Wavelet-Transformation der Trainings-Bilddatensätze zum Erhalt eines Satzes von Wavelet-Koeffizienten für jeden Trainings-Bilddatensatz, c) Bestimmung eines Satzes von statistischen Maßen für jeden Trainings- Bilddatensatz aus dem zugehörigen Satz von Wavelet-Koeffizienten, d) Klassifizierung aller Sätze von statistischen Maßen der Trainings- Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen, wobei jeder Cluster ein Cluster-Zentrum aufweist, wobei jedes Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist, e) Bestimmung der nicht eindeutig zugeordneten Cluster, welche mehreren Klassen von Mustern zugeordnet sind, f) erneute Klassifizierung der Sätze von statistischen Maßen der Trainings- Bilddatensätze der nicht eindeutig zugeordneten Cluster zur Bildung von weiteren Clustern der Sätze von statistischen Maßen für jeden nicht eindeutig zugeordneten Cluster, wobei jeder weitere Cluster ein weiteres Cluster-Zentrum aufweist, wobei jedes weitere Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist.
Ausführungsformen der Erfindung haben den Vorteil, dass hiermit in zuverlässiger Weise eine Klassifizierung von Mustern in Bilddatensätzen ermöglicht wird. Im Falle dessen in einem initialen Klassifizierungsdurchgang gemäß der Schritte a)-d) zur Bestimmung von Cluster-Zentren einzelne Cluster mehreren Klassen von Mustern zugeordnet sind, wird die Klassifizierung für diese nicht eindeutig zugeordneten Cluster in den Schritten e) und f) wiederholt, wodurch sich die Erkennungsrate signifikant steigert. Kern der Erfindung ist somit die kaskadierte Wiederholung der Schritte e) und f) in Kombination der Ermittlung von statistischen Maßen aus den Koeffizienten von Wavelet-Transformationen und Fuzzy c-Means Clustering. Diese gewährleistet, dass Sätze von statistischen Maßen der Trainings-Bilddatensätze eindeutig einer einzelnen Klasse von Mustern zugeordnet werden können. Durch diese„Trainingsphase" wird somit eine Wissensbasis (auch„Knowledgebase" genannt) erstellt, welche dann zur Klassifikation von realen Test-Bilddatensätzen verwendet werden kann.
Mit Hilfe von Fuzzy-Mengen lassen sich allgemein Cluster-Probleme lösen. Aufgabe ist bei Cluster-Problemen, eine Menge von Daten mit ähnlichen Eigenschaften zu gruppieren und demselben Cluster zuzuordnen. Nahe beieinander liegende Datenpunkte haben ähnliche Eigenschaften und sollen in gemeinsame Cluster gruppiert werden.
Die Anwendung von Fuzzy-Mengen in einer Klassifikationsaufgabe bewirkt, dass diese Klassenzugehörigkeit relaxiert wird und infolgedessen ein Datenelement gleichzeitig allen Klassen mit unterschiedlichen Graden angehören kann (vgl. Tizhoosh, H. R.: Fuzzy-Bildverarbeitung, Einführung in Theorie und Praxis, Springer-Verlag, Heidelberg, 1998). Die Idee von Fuzzy C-Means ist, dass jedes der N Datenelemente xi nicht nur einem Cluster zugeordnet wird, sondern jedem Cluster mit einer gewissen Zugehörigkeit Pij(x). Statt nun für alle Datenelemente die Distanz zum Cluster-Zentrum zu minimieren, wird die Distanz jedes Elementes mit der Zugehörigkeit zum Cluster- Zentrum multipliziert, vgl. Kapitel Fuzzy-Logik, ln:Kramer, O.: Computational Intelligence, Eine Einführung, Springer Verlag, Berlin Heidelberg, 2009, S. 75-99.
Minimiert werden
)V k
^ Σ Σ^ ιι** - ^!2. mit dem Modifizierer„m" (auch als Fuzzyfikator benannt). Die Zugehörigkeitsfunktion und die Cluster-Zentren ergeben sich wie folgt:
Nach Initialisierung der Zugehörigkeiten μ,) werden in jedem Schritt abwechselnd gemäß der vorstehenden Gleichung die Cluster-Zentren berechnet und daraufhin die Zugehörigkeiten zu den Clustern aktualisiert. Diese beiden Schritte werden abwechselnd so lange ausgeführt, bis die Summe der Änderungen der Zugehörigkeitswerte μ^ einen Wert ε unterschreiten. Damit sind die Cluster-Zentren und die Wissensbasis definiert.
Bei der Klassifikation wird somit zunächst anhand einer Trainingsdatenmenge die Wissensbasis aufgebaut.
Nach einer Ausführungsform der Erfindung umfasst das Verfahren ferner folgende Schritte („Testphase"): a) Erfassung von Test-Bilddatensätzen, b) Waveiet-Transformation der Test-Bilddatensätze zum Erhalt
Satzes von Wavelet-Koeffizienten für jeden Test-Bilddatensatz, c) Bestimmung eines Satzes von statistischen Maßen für jeden Test- Bilddatensatz aus dem zugehörigen Satz von Wavelet-Koeffizienten, d) Klassifizierung aller Sätze von statistischen Maßen der Test- Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen der Test-Bilddatensätze, wobei die Klassifizierung unter Verwendung der zuvor bestimmten Cluster-Zentren erfolgt, e) Erneute Klassifizierung der Cluster der Test-Bilddatensätze, für welche zugehörigen Cluster-Zentren mehreren der Klassen der Muster der Trainings-Bilddatensätze zugeordnet waren, wobei die erneute Klassifizierung unter Verwendung der zuvor bestimmten weiteren Cluster-Zentren erfolgt.
Durch diese Schritte wird somit nach Abschluss der Trainingsphase die erzeugte Wissensbasis in Form der eindeutigen Zuordnung von Cluster-Zentren zu Sätzen von statistischen Maßen auf zu analysierende Test-Bilddatensätze angewandt. Schritt e) gewährleistet, dass selbst im Falle einer potentiellen nicht-eindeutigen Zuordnung eines Satzes von statistischen Maßen zu einem der Klassen der Muster durch den erneuten Klassifizierungsvorgang der entsprechende Satz von statistischen Maßen des Test- Bilddatensatzes eindeutig einer einzelnen Klasse von Mustern zugeordnet werden kann.
Anders ausgedrückt, im Rahmen des Tests wird in Schritt d) die zuvor erzeugte Wissensbasis benutzt. In Schritt e) werden die in Schritt e) der Trainingsphase bestimmten Cluster erneut klassifiziert, wobei jeweils die Wissensbasis des einzelnen' Clusters aus Schritt f) der Trainingsphase herangezogen wird.
Nach einer weiteren Ausführungsform der Erfindung enthalten die Trainings- Bilddatensätze Bilddaten eine erste Anzahl unterschiedlicher Klassen von Mustern, wobei die durch die Klassifizierung der Trainings-Bilddatensätze gebildete Anzahl von Clustern der ersten Anzahl entspricht, wobei für einen nicht eindeutig zuordbaren Cluster - diesem Cluster eine zweite Anzahl der unterschiedlichen Klassen von Mustern zugeordnet ist,
- bei der erneuten Klassifizierung dieses Clusters die Anzahl der weiteren Cluster der zweiten Anzahl entspricht. Nach einer weiteren Ausführungsform der Erfindung werden die Schritte e) und f) der Trainingsphase solange kaskadiert wiederholt, bis die Anzahl der eindeutig zuordenbaren Cluster einen vorbestimmten Minimalwert überschritten hat. Beispielsweise beträgt der Minimalwert mindestens 95%.
Nach einer weiteren Ausführungsform der Erfindung werden die statistischen Maße so gewählt, dass diese invariant gegenüber einer Rotation der Bilddatensätze sind. Damit wird das Verfahren stabil ausführbar, da die Orientierung der Bilddatensätze keine Rolle mehr spielt. Bei jeder beliebigen Orientierung der Bilddatensätze liefert das Verfahren das gleich präzise Klassifizierungsergebnis. Sofern Rotationsinvarianz erreicht werden soll, werden die Paare der zueinander diagonalliegenden Kanäle aus der Wavelet- Transformation zu einem statistischen Merkmal kombiniert (Porter, R. ; Canagarajah, N.: Robust rotation invariant texture Classification: wavelet, Gabor filter and GMRF based schemes. In: IEE Proc.-Vis. Image Signal Processing 144 (1997), Nr. 3, S. 180- 188)
Es sei angemerkt, dass Wavelet-Transformationen im Übrigen skalierungsinvariant sind, sodass die Skalierung der zu klassifizierenden Bilddatensätze ebenfalls keine Rolle spielt.
Nach einer weiteren Ausführungsform der Erfindung umfassen die statistischen Maße einen Energie-Wert und/oder einen Entropie-Wert und/oder eine Standardabweichung.
Im Detail können z.B. folgende statistische Maße definiert werden: · Energy: Bei der Analyse der Texturen von wavelet-transformierten Bilder wird meistens der Mittelwert der Magnitude der Wavelet-Koeffizienten benutzt. Die Energie des n'ten Kanals ist gemäß Porter, R. ; Canagarajah, N.: Robust rotation invariant texture Classification: wavelet, Gabor filter and GMRF based schemes. In: IEE Proc.-Vis. Image Signal Processing 144 (1997), Nr. 3, S. 180- 188 wie folgt definiert:
ENERCV lc:,, =
MN
M N
wobei die Dimensionen des Kanals MxN ist, i und j sind die Zeile und Spalte desn'ten Kanals, und x ist der Wavelet-Koeffizient innerhalb dieses Kanals.
• Energy2: Anstatt des obengenannten Energy-Parameters kann gemäß Chitre, Y. ; Dhawan, A.P.: M-band wavelet discrimination of natural textures. In: Pattern Recognition 32 (1999), S. 773-789 eine andere„Energy"-Norm benutzt werden. Dieser Wert kann als zweites Merkmal berechnet werden gemäß:
• Entropy: Das dritte Merkmal kann der Entropie-Wert in jedem Kanal sein. Dieses Merkmal wurde z.B. von Chitre, Y. ; Dhawan, A.P.: M-band wavelet discrimination of natural textures. In: Pattern Recognition 32 (1999), S. 773-789 beschrieben und berechnet sich nach:
Standardabweichung: Dieses Maß wurde z.B. beschrieben durch Manthalkar, R. Biswas, P.K. ; Chatterji, B.N.: Rotation and scale invariant texture features using discrete wavelet packet transform. In: Pattern Recognition Letters 24 (2003), S. 2455-2462:
Es sei angemerkt, dass die Trainings-Bilddatensätze eindeutige Klassen von Mustern enthalten. In andern Worten ist ein einzelnes Bild nicht zu 2 unterschiedlichen Klassen zugeordnet, sondern die Klassenzuordnung der Bilder ist eindeutig. Nach einer weiteren Ausführungsform der Erfindung umfasst das Verfahren während der Trainingsphase ferner eine Festlegung des Satzes von statistischen Maßen, wobei die Schritte d)-f) für verschiedene festgelegte Sätze von statistischen Maßen durchgeführt werden, wobei der Satz an statistischen Maßen festgelegt wird, für den die Erkennungsrate der Trainingsphase maximiert wird. Dieser so festgelegte Satz von statistischen Maßen wird dann auch in entsprechender Weise identisch bei der Klassifizierung der Testbilder angewandt.
Die Festlegung des Satzes von statistischen Maßen kann beispielsweise als Zwischenschritt zwischen den Schritten c) und d) erfolgen. Allerdings kann auch in mathematischer Weise vorab (vor Schritt c) bestimmt werden, welche Sätze von statistischen Maße Verwendung finden sollen.
Somit gehen nach einer Ausführungsform der Erfindung z.B. nicht alle (rotationsinvarianten) statistischen Merkmale in die Klassifizierung ein. Es kann durchaus sein, dass - je nach Untersuchungsaufgabe - einige Merkmale besser geeignet erscheinen, die Klassen zu trennen, als andere. Möglich wäre ein iteratives Verfahren bei dem eine Klassifizierung der Trainingsdaten mit nur einem Teil der statistischen Merkmale vorgenommen wird. Das "bessere" Ergebnis / die bessere Auswahl kann dann weiter verwendet werden. Die im Rahmen des Trainings festgelegten statistischen Maße bleiben beim Test unverändert.
Es sei angemerkt, dass eine Reduktion der Merkmale zur Beschleunigung des Verfahrens führen kann. In einem weiteren Aspekt betrifft die Erfindung ein Computerprogrammprodukt mit von einem Computer ausführbaren Instruktionen zur Durchführung der Verfahrensschritte wie obig beschrieben.
Im Folgenden werden bevorzugte Ausführungsformen der Erfindung anhand der Zeichnungen näher erläutert. Es zeigen:
Fig. 1 eine Übersicht über Gefügebilder,
Fig. 2A Teil A einer tabellarischen Übersicht über die Trainingsphase unter
Verwendung von 6 Wavelet-Merkmalen,
Fig. 2B Teil B einer tabellarischen Übersicht über die Trainingsphase unter
Verwendung von 6 Wavelet-Merkmalen,
Fig. 3 schematische Schritte eines Aufbaus einer kaskadierten Klassifikation in der Trainingsphase,
Fig. 4 schematische Schritte eines Aufbaus einer kaskadierten Klassifikation in der Testphase,
Fig. 5 eine tabellarische Übersicht der Wavelet-Fehlerrate nach der 2ten Stufe der kaskadierten Klassifizierung der Gefügebilder.
Figur 1 zeigt eine grafische Übersicht über verschiedene Gefügebilder (Verlag, Stahleisen: Richtreihe zur Bewertung der Gefüge von geglühten Warmarbeitstählen, SEP1614 Tafel 2. Verlag Stahleisen, Düsseldorf, 1996). Gefügebilder sind mikroskopische Bilder von Rohstahl, die Strukturen zeigen, die beim Erkalten des heißen Stahls entstehen und die ein Maß für die Qualität des Materials darstellen. Die Proben werden dem weichgeglühten Material entnommen, geschliffen und poliert und in 3% alkoholischer Salpetersäure so geätzt, dass sie Mikrohomogenität erkennen lassen. Zur Bewertung der Qualität wird die unter Mikroskop in Vergrößerung von 500:1 betrachtete Probe einem Bild einer Richtreihe zugeordnet. Die Fig. 1 zeigt die Richtreihe mit den Stufen von GA1 bis GF5. Diese 30 Bilddaten wurden digitalisiert, ein Bildausschnitt standardisiert ausgeschnitten und jeder Auschnitt in 5 Grad Schritten rotiert, so dass insgesamt 2.160 Bilddatensätze zur Verfügung standen. Zu den Trainingsdaten sind die Bilder mit Rotationswinkel von 0 bis 135 zugeordnet worden. Dies ergibt insgesamt 840 Bilder (28 Bilder für jede der 30 Klassen). Außerdem wurden Testdaten erzeugt, welche die Bilder mit Winkel größer 135 Grad enthalten, also insgesamt 1.320 Bilder.
Zur beispielhaften Klassifizierung dieser 840 Bilder in der Trainingsphase wurde nun wie obig beschrieben unter Verwendung von Fuzzy c-Means Clustering vorgegangen: Es wurden zunächst eine Wavelet- Transformation für jeden Bilddatensatz zum Erhalt eines Satzes von Wavelet-Koeffizienten für jeden Trainings-Bilddatensatz vorgenommen, wobei anschließend ein Satz von statistischen Maßen für jeden Trainings-Bilddatensatz aus dem zugehörigen Satz von Wavelet-Koeffizienten bestimmt wurde. Anschließend erfolgte die Klassifizierung aller Sätze von statistischen Maßen der Trainings-Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen, wobei jeder Cluster ein Cluster-Zentrum aufweist, wobei jedes Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist.
Fig.2A und 2B zeigen eine tabellarische Übersicht über die Trainingsphase unter Verwendung von 6 Wavelet-Merkmalen: Die Erkennungsrate bei reinen Wavelet- Merkmalen betrug 72,9%, 27,1% der Bilder (d.h. deren Sätze von statistischen Maßen) waren einer falschen Klasse zugeordnet. Lediglich 24 Cluster waren eindeutig, 2 Cluster beinhalteten 2 Klassen, 2 Cluster bestanden aus 3 Klassen, ein Cluster aus 4 und einer aus 5 Klassen.
So zeigt beispielsweise Cluster Nr. 9 sowohl eine mögliche Zugehörigkeit zur Klasse GC5, als auch zur Klasse GD3, wobei 56 der Sätze von statistischen Maßen (zugehörig zu unterschiedlichen Bildern) in den Cluster Nr. 9 zugeordnet wurden.
Aus der Trainingsphase ist bekannt, welche Cluster aus mehreren Klassen bestehen. Erfindungsgemäß erfolgt nun in einem weiteren Schritt durch erneute Klassifizierung derjenigen Cluster, die aus mehreren Klassen bestehen, eine Trennung der vorher zusammengefassten Klassen. Die Klassifizierung wird dabei für jeden Cluster einzeln durchgeführt. Die Figur 3 zeigt die Vorgehensweise im Schema. Zunächst wird davon ausgegangen, dass die zur Trainingszwecken verwendeten Bilder in eindeutiger Weise aus k Klassen bestehen, d.h. dass jedes Bild eindeutig einer einzelnen Klasse zuordenbar ist. Diese Trainingsbilddaten werden daraufhin entsprechend den Schritten b) bis d) der Trainingsphase klassifiziert, woraus sich in Schritt 302 eine Anzahl von k Clustern der Sätze von statistischen Maßen der Trainings-Bilddatensätze ergeben. In anderen Worten weisen die Trainings- Bilddatensätze Bilddaten eine Anzahl k unterschiedlicher Klassen von Mustern auf, wobei die durch die Klassifizierung der Trainings-Bilddatensätze gebildete Anzahl von Clustern der Anzahl k entspricht.
Für die eindeutig identifizierten Cluster, welche nur einer Klasse zugeordnet werden können, wird die Wissensbasis entsprechend aktualisiert. Anschaulich gesprochen werden in der Wissensbasis die Cluster-Zentren der Sätze von einer Anzahl p (p>0) statistischen Maßen gespeichert, wobei jedem Cluster Zentrum eindeutig eine Klasse zugeordnet ist. Jeder Satz von statistischen Maßen kann anschaulich als Punkt in einem p-Dimensionalen Raum dargestellt werden, wobei das zugehörige Cluster- Zentrum ebenfalls in diesem p-Dimensionalen Raum angeordnet ist. Jeder weitere Satz von statistischen Maßen (beispielsweise eines Testdatensatzes), welcher in der Nähe dieses Cluster-Zentrums liegt, kann somit als zu diesem Cluster-Zentrum zugehörig identifiziert werden.
Wie Fig. 3 zeigt, besteht jedoch auch die Möglichkeit, dass einzelne Cluster (z.B. Cluster 2 und Cluster m) nicht eindeutig einer sondern mehreren Klassen zugeordnet wurden. Für diese nicht eindeutig zugeordneten Cluster wird nun in Schritt 304 eine erneute Klassifizierung durchgeführt zur Bildung von weiteren Clustern der Sätze von statistischen Maßen für jeden nicht eindeutig zugeordneten Cluster in Schritt 302, wobei jeder weitere Cluster ein weiteres Cluster-Zentrum aufweist, wobei jedes weitere Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist. Bestand Cluster 2 aus n verschiedenen Klassen, wird eine Klassifizierung auf n verschiedene Klassen durchgeführt. In gleicher Weise wird für Cluster m, welcher aus I verschiedenen Klassen besteht, eine Klassifizierung auf I verschiedene Klassen durchgeführt. Dies resultiert in weiteren Clustern in Schritt 306. Für die nun eindeutig identifizierten Cluster, welche wiederum nur einer Klasse zugeordnet werden können, wird die Wissensbasis entsprechend aktualisiert. Entsprechend der geforderten Erkennungsquote kann dieses Verfahren so lange für nicht eindeutig zuordenbare Cluster kaskadiert fortgeführt werden, bis eine gewünschte Erkennungsquote erreicht ist. Somit entsteht für jeden Cluster, der erneut klassifiziert wird, eine neue Wissensbasis.
Da aus der Trainingsphase bekannt ist, welche Cluster nicht eindeutig zugeordnet waren und für welche eine neue Wissensbasis erzeugt wurde, kann das Verfahren in gleicher Weise bei der Testdurchführung angewandt werden. Als„Testdurchführung" wird hiermit z.B. die Anwendung des Verfahrens zur Klassifizierung von realen Bildern verstanden.
Dies ist in Fig. 4 gezeigt, wo in Schritt 400 eine Erfassung von Test-Bilddatensätzen erfolgt, auf welche die in Fig. 3 Schritt 300 erzeugte Wissensbasis zur Klassifizierung angewendet wird. Im Detail wird zunächst eine Wavelet-Transformation der Test- Bilddatensätze zum Erhalt eines Satzes von Wavelet-Koeffizienten für jeden Test- Bilddatensatz durchgeführt, woraufhin eine Bestimmung eines Satzes von statistischen Maßen für jeden Test-Bilddatensatz aus dem zugehörigen Satz von Wavelet- Koeffizienten erfolgt. Daraufhin werden die in der gemäß Fig. 3 erzeugten Wissensbasis gespeicherten Zuordnungen von Cluster-Zentren dazu verwendet, alle Sätze von statistischen Maßen der Test-Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen der Test-Bilddatensätze zu klassifizieren. Daraus resultieren in Schritt 402 verschiedene Cluster 1..k.
Anschließend werden, wie in Fig. 4 gezeigt, die aus dem Training bekannten Cluster mit mehrfacher Zuordnung erneut klassifiziert, wobei die erneute Klassifizierung unter Verwendung der zuvor bestimmten weiteren Cluster-Zentren erfolgt. D.h., hierzu werden die in Schritt 304 erzeugten neuen Wissensbasen verwendet. Dies resultiert in Schritt 404 in Clustern von Sätzen von statistischen Maßen (d.h. für einzelne Testbilder), welche eindeutig entsprechenden Klassen zugeordnet werden können.
Bezugnehmend auf Fig. 2A und 2B wurde die getrennte Klassifizierung entsprechend dem Verfahren der Figur 3 für die sechs bisher nicht eindeutigen Cluster der Wavelet- Merkmale durchgeführt. Dabei konnten ein Cluster vollständig korrekt zugeordnet werden, bei den anderen wurde eine deutlich Reduktion der verbleibenden Fehler verzeichnet, weil die Klassen besser getrennt wurden. Die Fig. 5 zeigt die nicht eindeutigen Cluster vor und nach der zweiten Klassifikation. Von den vorher 228 falschen Zuordnungen verbleiben nur noch 31. Damit ergibt sich für die kaskadierten Klassifikation der Trainingsdaten aus den Wavelet-Merkmalen eine Verbesserung der Erkennungsrate von 72,9% auf 96.3%.
In einer Testphase wurde zur Verifikation des Verfahrens die o.g. 1320 Gefügebilder klassifiziert. In der ersten Stufe wurden 72,5% korrekt zugeordnet, 362 Bilder waren falsch klassifiziert. Anschließend wurden, wie in Fig. 4 dargestellt, die aus dem Training bekannten Cluster mit mehrfacher Zuordnung erneut klassifiziert. In der 2. Stufe konnten weitere 321 Bilder korrekt zugeordnet werden. Die verbleibenden 42 bedeuteten eine Fehlerquote von 3,2% und eine Erkennungsrate von 96,8%.
Somit hat das Verfahren einer zweistufigen Klassifizierung mit Fuzzy c-Means Clustering mit den statistischen Merkmalen aus den Koeffizienten der Wavelet- Transformation den Vorteil, dass in zuverlässiger Weise ein sehr gutes Klassifizierungsergebnis erzielt werden kann.

Claims

Patentansprüche
1. Verfahren zur Klassifizierung von Mustern in Bilddatensätzen, wobei die Klassifizierung ein Fuzzy c-Means Clustering umfasst, wobei das Verfahren umfasst: a) Erfassung von Trainings-Bilddatensätzen, wobei die Trainings- Bilddatensätze Bilddaten unterschiedlicher Klassen von Mustern enthalten, b) Wavelet-Transformation der Trainings-Bilddatensätze zum Erhalt eines Satzes von Wavelet-Koeffizienten für jeden Trainings-Bilddatensatz, c) Bestimmung eines Satzes von statistischen Maßen für jeden Trainings- Bilddatensatz aus dem zugehörigen Satz von Wavelet-Koeffizienten, d) Klassifizierung aller Sätze von statistischen Maßen der Trainings- Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen, wobei jeder Cluster ein Cluster-Zentrum aufweist, wobei jedes Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist, e) Bestimmung der nicht eindeutig zugeordneten Cluster, welche mehreren Klassen von Mustern zugeordnet sind, f) erneute Klassifizierung der Sätze von statistischen Maßen der Trainings- Bilddatensätze der nicht eindeutig zugeordneten Cluster zur Bildung von weiteren Clustern der Sätze von statistischen Maßen für jeden nicht eindeutig zugeordneten Cluster, wobei jeder weitere Cluster ein weiteres Cluster-Zentrum aufweist, wobei jedes weitere Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist.
2. Verfahren nach Anspruch 1 , weiter umfassend: a) Erfassung von Test-Bilddatensätzen, b) Wavelet-Transformation der Test-Bilddatensätze zum Erhalt eines Satzes von Wavelet-Koeffizienten für jeden Test-Bilddatensatz, c) Bestimmung eines Satzes von statistischen Maßen für jeden Test-
Bilddatensatz aus dem zugehörigen Satz von Wavelet-Koeffizienten, d) Klassifizierung aller Sätze von statistischen Maßen der Test- Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen der Test-Bilddatensätze, wobei die Klassifizierung unter Verwendung der zuvor bestimmten Cluster-Zentren erfolgt, e) Erneute Klassifizierung der Cluster der Test-Bilddatensätze, für welche zugehörigen Cluster-Zentren mehreren der Klassen der Muster der Trainings-Biiddatensätze zugeordnet waren, wobei die erneute Klassifizierung unter Verwendung der zuvor bestimmten weiteren Cluster-Zentren erfolgt.
3. Verfahren nach Anspruch 1 , wobei die Trainings-Biiddatensätze Bilddaten eine erste Anzahl unterschiedlicher Klassen von Mustern enthalten, wobei die durch die Klassifizierung der Trainings-Biiddatensätze gebildete Anzahl von Clustern der ersten Anzahl entspricht, wobei für einen nicht eindeutig zuordenbaren Cluster
- diesem Cluster eine zweite Anzahl der unterschiedlichen Klassen von Mustern zugeordnet ist,
- bei der erneuten Klassifizierung dieses Clusters die Anzahl der weiteren Cluster der zweiten Anzahl entspricht.
4. Verfahren nach Anspruch 1 , wobei die Schritte e) und f) solange kaskadiert wiederholt werden, bis die Anzahl der eindeutig zuordenbaren Cluster einen vorbestimmten Minimalwert überschritten hat.
5. Verfahren nach Anspruch 4, wobei der Minimalwert mindestens 95% beträgt.
6. Verfahren nach Anspruch 1 , wobei die statistischen Maße invariant gegenüber einer Rotation der Bilddatensätze sind.
7. Verfahren nach Anspruch 5, wobei die statistischen Maße einen Energie-Wert und/oder einen Entropie-Wert und/oder eine Standardabweichung umfassen.
8. Verfahren nach Anspruch 1 , ferner mit einer Festlegung des Satzes von statistischen Maßen, wobei die Schritte d)-f) für verschiedene festgelegte Sätze von statistischen Maßen durchgeführt werden, wobei der Satz an statistischen Maßen festgelegt wird, für den die Erkennungsrate maximiert wird.
9. Computerprogrammprodukt mit von einem Computer ausführbaren Instruktionen zur Durchführung der Verfahrensschritte gemäß den vorigen Ansprüchen.
EP11771014.5A 2010-09-29 2011-09-26 Verfahren zur klassifizierung von mustern in bilddatensätzen Withdrawn EP2622540A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102010046867A DE102010046867A1 (de) 2010-09-29 2010-09-29 Verfahren zur Klassifizierung von Mustern in Bilddatensätzen
PCT/EP2011/004808 WO2012052106A1 (de) 2010-09-29 2011-09-26 Verfahren zur klassifizierung von mustern in bilddatensätzen

Publications (1)

Publication Number Publication Date
EP2622540A1 true EP2622540A1 (de) 2013-08-07

Family

ID=44907777

Family Applications (1)

Application Number Title Priority Date Filing Date
EP11771014.5A Withdrawn EP2622540A1 (de) 2010-09-29 2011-09-26 Verfahren zur klassifizierung von mustern in bilddatensätzen

Country Status (3)

Country Link
EP (1) EP2622540A1 (de)
DE (1) DE102010046867A1 (de)
WO (1) WO2012052106A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255781A (zh) * 2018-09-03 2019-01-22 河海大学 一种面向对象的基于crf的多时相多光谱遥感影像变化检测方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036300A (zh) * 2014-06-18 2014-09-10 西安电子科技大学 基于均值漂移分割的遥感图像目标识别方法
CN106845417B (zh) * 2017-01-20 2019-11-08 上海交通大学 基于特征池化与除归一化表示的高分辨率遥感图像分类方法
CN107220977B (zh) * 2017-06-06 2019-08-30 合肥工业大学 基于模糊聚类的有效性指标的图像分割方法
CN107392952B (zh) * 2017-07-19 2019-12-06 天津大学 一种无参考混合失真图像质量评价方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
VAN DE WOUWER G ET AL: "Statistical Texture Characterization from Discrete Wavelet Representations", IEEE TRANSACTIONS ON IMAGE PROCESSING, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 8, no. 4, 1 April 1999 (1999-04-01), XP011026309, ISSN: 1057-7149 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255781A (zh) * 2018-09-03 2019-01-22 河海大学 一种面向对象的基于crf的多时相多光谱遥感影像变化检测方法
CN109255781B (zh) * 2018-09-03 2021-11-30 河海大学 一种面向对象的多光谱高分辨率遥感影像变化检测方法

Also Published As

Publication number Publication date
DE102010046867A1 (de) 2012-03-29
WO2012052106A1 (de) 2012-04-26

Similar Documents

Publication Publication Date Title
EP0780002B1 (de) Verfahren und vorrichtung zur rekonstruktion von in rasterform vorliegenden linienstrukturen
DE60036082T2 (de) Verfahren und vorrichtung zur wiederauffindung von texturbildern
DE69031774T2 (de) Adaptiver Gruppierer
DE4406020C1 (de) Verfahren zur automatisierten Erkennung von Objekten
DE102006010607A1 (de) Wahrscheinlichkeitstheoretischer Verstärkungsbaum-Rahmen zum Lernen von Unterscheidungsmodellen
EP2284795A2 (de) Quantitative Analyse, Visualisierung und Bewegungskorrektur in dynamischen Prozessen
EP2622540A1 (de) Verfahren zur klassifizierung von mustern in bilddatensätzen
DE102009038436A1 (de) Verfahren zur Segmentierung eines Organs in Volumendatensätzen der Magnetresonanztomographie
DE19928231C2 (de) Verfahren und Vorrichtung zur Segmentierung einer Punkteverteilung
DE10251787A1 (de) Verfahren, Vorrichtung und Computerprogramm zur Erfassung von Punktkorrespondenzen in Punktmengen
DE19610066C1 (de) Verfahren zur Erfassung gesichtsbezogener Personendaten und deren Verwendung zur Identifizierung oder Verifikation von Personen
EP1766579A2 (de) Verfahren zur detektion geometrischer strukturen in bildern
DE10260642B4 (de) Verfahren zur Erstellung einer Referenz für Fingerprints und zum Vergleich von Fingerprints
EP2096578A2 (de) Verfahren und Vorrichtung zur Charakterisierung der Formation von Papier
DE112020007889T5 (de) Bildverarbeitungseinrichtung, programm und bildverarbeitungsverfahren
EP0843864B1 (de) Verfahren zum klassifizieren und wiedererkennen von mustern, wobei eine signatur durch das glätten eines polygonzugs erzeugt wird
DE102023107278B3 (de) Verfahren zum Authentifizieren einer auf ihrem Substrat mindestens eine bedruckte Fläche aufweisenden Banknote
DE102018122842A1 (de) Computerimplementiertes Verfahren zur Komprimierung von Messdaten aus einer Messung eines Messvolumens
DE102004018174B4 (de) Verfahren zur Akquisition von Formen aus Bildern mit Fällen und zum fallbasierten Erkennen von Objekten in digitalen Bildern, Computer-Programm-Produkt und digitales Speichermedium zur Ausführung dieses Verfahrens
DE10361838B3 (de) Verfahren zur Bewertung von Ähnlichkeiten realer Objekte
DE102008025213A1 (de) Verfahren zur Segmentierung von Fingerabdruckbildern
DE10213578A1 (de) Verfahren zur Archivierung digitaler Bilder
DE102004018171B4 (de) Verfahren zur Akquisition von Formen aus Bildern luftgetragener Keime und/oder Pollen und zum fallbasierten Erkennen dieser Objekte in digitalen Bildern, Computer-Programm-Produkt und digitales Speichermedium zur Ausführung dieses Verfahrens
EP1220141B1 (de) Verfahren zur Erstellung von Referenzen sowie zum Vergleich von Fingerabdrücken
DE202022101842U1 (de) Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20130429

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

DAX Request for extension of the european patent (deleted)
17Q First examination report despatched

Effective date: 20170405

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20171017