WO2012052106A1 - Method for classifying patterns in image data records - Google Patents

Method for classifying patterns in image data records Download PDF

Info

Publication number
WO2012052106A1
WO2012052106A1 PCT/EP2011/004808 EP2011004808W WO2012052106A1 WO 2012052106 A1 WO2012052106 A1 WO 2012052106A1 EP 2011004808 W EP2011004808 W EP 2011004808W WO 2012052106 A1 WO2012052106 A1 WO 2012052106A1
Authority
WO
WIPO (PCT)
Prior art keywords
image data
statistical measures
cluster
clusters
sets
Prior art date
Application number
PCT/EP2011/004808
Other languages
German (de)
French (fr)
Inventor
Iris Paternoster-Bieker
Original Assignee
Iris Paternoster-Bieker
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iris Paternoster-Bieker filed Critical Iris Paternoster-Bieker
Priority to EP11771014.5A priority Critical patent/EP2622540A1/en
Publication of WO2012052106A1 publication Critical patent/WO2012052106A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram

Definitions

  • the invention relates to a method for classifying patterns in image datasets, and to a computer program product.
  • Textures or patterns play an important role in the composition of natural images, their analysis and classification in various image analysis applications (Porter, R., Canagarajah, N .: Robust rotation invariant texture Classification: wavelet, Gabor filter and GMRF based schemes : IEE Proc.-Vis. Image Signal Processing 144 (1997), No. 3, pp. 180-188).
  • the field of application has a broad spectrum: surface inspection, texture object recognition, OCR, document segmentation, tissue recognition in medical images, automated visual examinations, content-based image search, and remote recognition (see Hiremath, PS, S .: Wavelet Based Features for Texture Classification In: GVIP Journal 6 (2006), No. 3, pp. 55-58).
  • CONFIRMATION COPY displayed local gray values. These values usually have constant or very little different properties within a texture. Thus, different textures can be recognized by comparing these values.
  • Structural models assume that the textures consist of texture primitives. They can be reproduced using primitive positioning controls (see Tuceryan, M., Jain, AK: The Handbook of Pattern Recognition and Computer Vision, World Scientific and Publishing Co., 1998. 207-248 p. //www.cs.iupui.edu/ ⁇ tuceryan/research/ComputerVision/texture- review.pdf).
  • Structural texture analysis models consist of two phases: a) Determining the texture elements b) Defining the positioning rules. This is applicable for very regular textures.
  • the texture primitives may be e.g. with edge detection using the Laplacian-of-Gaussian or difference-of-Gaussian method.
  • Wavelet theory has evolved over time as a unified basis for various signal processing applications such as multiresolution signal processing, machine vision, subband coding and speech compression (Chitre, Y., Dhawan, AP: M-band wavelet discrimination of In: Pattern Recognition 32 (1999), pp. 773-789)
  • multiresolution implies, it deals with the representation and analysis of a signal (image) in several resolutions. The charm of this method is that you can see the properties overlooked in one resolution in a different resolution.
  • the reason for a wavelet transform can be described as follows: When we look at an image, we see contiguous areas of similar textures and intensity levels that make up the objects. If these objects are very small in size and have low contrast, we examine them in higher resolutions. If they are very large and have high contrast values, they will be displayed coarser. But if there are both small and large objects or objects with low and high contrast in an image at the same time, it is advantageous to examine the image in different resolutions. This is the fundamental background for the "multi-resolution and Editing, see Gonzalez, RC; Woods, RE: Digital Image Processing. Pearson Education, Inc. Pearson Prentice Hall, NJ, 2008.
  • Discrete Wavelet function is the Haar wavelet, which is used in one embodiment of this invention.
  • the Haar wavelet was proposed by Alfred Haar in 1910 and is the first known wavelet in the literature. It is also referred to as the "D2" wavelet, a special form of "Daubechies wavelet".
  • the Haar wavelet is also known as a simple and easy orthonormal wavelet. This makes it very easy to implement.
  • the disadvantage is that the Haar wavelet is not continuous and therefore not differentiable. This property may be an advantage or disadvantage depending on the signal.
  • the discrete wavelet transform (wavelet series) of a function f (x) is defined by
  • the magnitude of the wavelet coefficients in a particular channel is greater for those images that have a strong texture property in orientation and frequency represented by the channel. Therefore, the texture of an image can be mapped with a feature vector formed by statistical measures of the wavelet coefficients from the respective channel (sub-band). This finally allows the use of the characteristics of the wavelet coefficients for texture classification.
  • the invention has the object to provide a method for the classification of patterns in image data sets, which can be used to improve conventional classification methods for texture classification.
  • a method for classifying patterns in image data sets, wherein the classification comprises fuzzy c-means clustering comprising ("training phase"): a) acquisition of training image data sets, wherein the training image data sets contain image data of different classes of B) wavelet transformation of the training image data sets to obtain a set of wavelet coefficients for each training image data set; c) determining a set of statistical measures for each training image data set from the associated set of wavelet coefficients; d) Classifying all sets of statistical measures of the training image datasets to form clusters of the sets of statistical measures, each cluster having a cluster center, each cluster center being associated with one or more of the classes of the patterns, e) determining the ambiguity associated clusters, which are several classes of Mu f) reclassifying the sets of statistical measures of the training image data sets of the unclassified clusters to form further clusters of the sets of statistical measures for each not uniquely associated clusters, each additional cluster having a further cluster center, each additional cluster center being associated with one or more of the classes of the patterns
  • Embodiments of the invention have the advantage that it is possible in a reliable manner to classify patterns in image data sets. If, in an initial classification pass according to steps a) -d), individual clusters are assigned to multiple classes of patterns for the purpose of determining cluster centers, the classification for these non-unique clusters is repeated in steps e) and f), thereby the recognition rate increases significantly.
  • the core of the invention is thus the cascaded repetition of steps e) and f) in combination of the determination of statistical measures from the coefficients of wavelet transformations and fuzzy c-means clustering. This ensures that sets of statistical measures of the training image records can be uniquely assigned to a single class of patterns.
  • This "training phase” thus creates a knowledge base (also known as "knowledgebase”) which can then be used to classify real test image data records.
  • cluster problems can be solved in general.
  • the problem with cluster problems is to group a set of data with similar properties and map them to the same cluster. Nearby data points have similar properties and are to be grouped into common clusters.
  • fuzzy C-Means each of the N data elements xi is not only assigned to a cluster, but to each cluster with a certain affiliation Pi j (x). Instead of minimizing the distance to the cluster center for all data elements, the distance of each element belonging to the cluster Center multiplied, cf. Chapter Fuzzy Logic, ln: Kramer, O .: Computational Intelligence, An Introduction, Springer Verlag, Berlin Heidelberg, 2009, pp. 75-99.
  • the cluster centers are calculated alternately according to the above equation in each step, and then the affiliations to the clusters are updated. These two steps are carried out alternately until the sum of the changes in the membership values ⁇ ⁇ falls below a value ⁇ . This defines the cluster centers and the knowledge base.
  • the knowledge base is thus initially built on the basis of a training data set.
  • the method further comprises the following steps (“test phase”): a) acquisition of test image data sets, b) wave-image transformation of the test image data sets to obtain
  • Step e) ensures that, even in the case of potential non-unique assignment of a set of statistical measures to one of the classes of patterns by the reclassification process, the corresponding set of statistical measures of the test image data set can be uniquely assigned to a single class of patterns.
  • step e) the clusters determined in step e) of the training phase are reclassified, using in each case the knowledge base of the individual 'cluster from step f) of the training phase.
  • the training image data sets image data include a first number of different classes of patterns, wherein the number of clusters formed by the classification of the training image data sets corresponds to the first number, wherein for a non-unique cluster - this cluster is assigned a second number of different classes of patterns,
  • the steps e) and f) of the training phase are repeated in cascaded fashion until the number of clearly assignable clusters has exceeded a predetermined minimum value.
  • the minimum value is at least 95%.
  • the statistical measures are chosen such that they are invariant with respect to rotation of the image data sets.
  • the method is stable executable, since the orientation of the image data sets no longer plays a role.
  • the method provides the same precise classification result. If rotation invariance is to be achieved, then the pairs of mutually diagonal channels from the wavelet transform are combined into one statistical feature (Porter, R., Canagarajah, N: Robust rotation invariant texture classification: wavelet, Gabor filter and GMRF based schemes : IEE Proc.-Vis. Image Signal Processing 144 (1997), No. 3, pp. 180-188)
  • wavelet transformations are otherwise scaling invariant, so that the scaling of the image data sets to be classified also plays no role.
  • the statistical measures include an energy value and / or an entropy value and / or a standard deviation.
  • ⁇ Energy In the analysis of the textures of wavelet-transformed images, the mean value of the magnitude of the wavelet coefficients is mostly used.
  • the energy of the nth channel is, according to Porter, R.; Canagarajah, N .: Robust rotation invariant texture Classification: wavelet, Gabor filters and GMRF based schemes.
  • IEE Proc.-Vis. Image Signal Processing 144 (1997), No. 3, pp. 180-188 is defined as follows:
  • i and j are the row and column of the nth channel, and x is the wavelet coefficient within that channel.
  • the third feature may be the entropy value in each channel. This feature has been used e.g. from Chitre, Y.; Dhawan, A.P .: M-band wavelet discrimination of natural textures. In: Pattern Recognition 32 (1999), pp. 773-789 describes and is calculated according to:
  • the training image records contain unique classes of patterns. In other words, a single image is not associated with 2 different classes, but the class assignment of the images is unique.
  • the method further comprises setting the set of statistical measures, wherein steps d) -f) are performed for different set of statistical measures defining the set of statistical measures for which the recognition rate of the training phase is maximized. This set of statistical measures thus determined is then also applied identically in the classification of the test images.
  • the determination of the set of statistical measures can be carried out, for example, as an intermediate step between steps c) and d). However, it can also be determined mathematically in advance (before step c) which sets of statistical measures should be used.
  • the invention relates to a computer program product having computer-executable instructions for performing the method steps as described above.
  • Fig. 2A part A of a tabular overview of the training phase under
  • Fig. 5 is a tabular overview of the wavelet error rate after the 2nd stage of the cascaded classification of the micrographs.
  • Figure 1 shows a graphical overview of various micrographs (publisher, steel iron: straightening series for the evaluation of the structure of annealed hot-work steels, SEP1614 board 2nd Verlag Stahleisen, Dusseldorf, 1996).
  • Micrographs of crude steel show microstructures that arise when the hot steel cools, and are a measure of the quality of the material.
  • the samples are taken from the annealed material, ground and polished and etched in 3% alcoholic nitric acid to reveal micro-homogeneity.
  • the sample viewed under microscope at a magnification of 500: 1 is assigned to an image of a guideline series.
  • FIG. 1 shows the straightening row with the steps from GA1 to GF5.
  • Figures 2A and 2B show a tabular overview of the training phase using 6 wavelet features:
  • the detection rate for pure wavelet features was 72.9%, 27.1% of the images (ie their sets of statistical measures) were incorrect Class assigned. Only 24 clusters were unique, 2 clusters contained 2 classes, 2 clusters consisted of 3 classes, a cluster of 4 and one of 5 classes.
  • cluster # 9 shows both a possible membership of class GC5 and class GD3, with 56 being assigned to sets of statistical measures (belonging to different images) in cluster # 9.
  • FIG. 3 shows the procedure in the diagram.
  • the images used for training purposes consist uniquely of k classes, ie that each image can be uniquely assigned to a single class.
  • These training image data are then classified according to steps b) through d) of the training phase, resulting in a number of k clusters of the sets of statistical measures of the training image data sets in step 302.
  • the training image data sets image data have a number k of different classes of patterns, the number of clusters formed by the classification of the training image data sets corresponding to the number k.
  • the knowledge base is updated accordingly.
  • the cluster centers of the sets are stored by a number p (p> 0) of statistical measures, each cluster center being uniquely assigned a class.
  • Each set of statistical measures can be graphically represented as a point in a p-dimensional space, with the associated cluster center also being arranged in this p-dimensional space. Any further set of statistical measures (for example, a test data set) that is near this cluster center can thus be identified as belonging to that cluster center.
  • step 304 to form further clusters of sets of statistical measures for each non-unique cluster in step 302, each additional cluster having a further cluster center, each additional cluster Center is assigned to one or more of the classes of patterns.
  • cluster 2 consists of n different classes
  • a classification is performed on n different classes.
  • clusters m consisting of I different classes
  • classification is performed on I different classes. This results in further clusters in step 306.
  • the knowledge base is updated accordingly. In accordance with the required recognition rate, this method can be continued cascaded for clusters that can not be assigned unambiguously until a desired recognition rate has been reached. This creates a new knowledge base for each cluster that is reclassified.
  • test execution is understood to mean the application of the method for classifying real images.
  • step 400 a collection of test image data sets is made, to which the classification knowledge base generated in FIG. 3 step 300 is applied.
  • a wavelet transformation of the test image data sets is first performed to obtain a set of wavelet coefficients for each test image data set, whereupon a determination of a set of statistical measures for each test image data set is made from the associated set of wavelet coefficients.
  • the cluster center mappings stored in the knowledge base generated in accordance with Figure 3 are used to classify all sets of statistical measures of the test image data sets to form clusters of the sets of statistical measures of the test image data sets. This results in step 402 different clusters 1..k.
  • the multiple assignment clusters known from training are reclassified, with the re-classification done using the previously determined other cluster centers. That is, for this purpose, the new knowledge bases generated in step 304 are used.
  • steps 404 clustering sets of statistical measures (i.e., individual test images) that can be uniquely assigned to corresponding classes.
  • FIG. 5 shows the non-unique clusters before and after the second classification. Of the previously 228 incorrect assignments, only 31 remain. This results in an improvement of the recognition rate from 72.9% to 96.3% for the cascaded classification of the training data from the wavelet features.
  • the o.g. Classified 1320 microstructures In a test phase, the o.g. Classified 1320 microstructures. In the first stage, 72.5% were correctly assigned, 362 images were wrongly classified. Subsequently, as shown in Figure 4, the multiple assignment clusters known from training were reclassified. In the second stage, another 321 images could be assigned correctly. The remaining 42 represented an error rate of 3.2% and a detection rate of 96.8%.
  • the method of a two-stage classification with fuzzy c-means clustering with the statistical features from the coefficients of wavelet transformation has the advantage that a very good classification result can be reliably achieved.

Abstract

The invention relates to a method for classifying patterns in image data records, wherein the classification comprises a fuzzy c-means clustering, wherein the method comprises detection of training image data records, wherein the training image data records contain image data relating to different classes of patterns, wavelet transformation of the training image data records in order to obtain a set of wavelet coefficients for each training image data record, determination of a set of statistical measures for each training image data record from the associated set of wavelet coefficients, classification of all sets of statistical measures for the training image data records in order to form clusters of the sets of statistical measures, wherein each cluster has a cluster centre, and wherein each cluster centre is assigned to one or more of the classes of patterns, determination of the clusters which have not been uniquely assigned and are assigned to a plurality of classes of patterns, and reclassification of the sets of statistical measures for the training image data records of the clusters which have not been uniquely assigned in order to form further clusters of the sets of statistical measures for each cluster which has not been uniquely assigned, wherein each further cluster has a further cluster centre, and wherein each further cluster centre is assigned to one or more of the classes of patterns.

Description

Verfahren zur Klassifizierung von Mustern in Bilddatensätzen Die Erfindung betrifft ein Verfahren zur Klassifizierung von Mustern in Bilddatensätzen, sowie ein Computerprogrammprodukt.  The invention relates to a method for classifying patterns in image datasets, and to a computer program product.
Texturen oder Muster spielen eine wichtige Rolle in der Komposition von natürlichen Bilder, deren Analyse und Klassifikation in verschiedenen Bildanalyse-Applikationen (Porter, R. ; Canagarajah, N.: Robust rotation invariant texture Classification: wavelet, Gabor filter and GMRF based schemes. In: IEE Proc.-Vis. Image Signal Processing 144 (1997), Nr. 3, S. 180-188). Das Anwendungsgebiet hat ein großes Spektrum: Untersuchung von Oberflächen, Objekterkennung anhand seiner Textur, OCR, Dokumentsegmentierung , Gewebeerkennung in medizinischen Bildern, automatisierte visuelle Untersuchungen, inhaltsbasierte Bildsuche und Fernerkennung (vgl. Hiremath, P.S. ; Shivashankar, S.: Wavelet Based Features for Texture Classification. In: GVIP Journal 6 (2006), Nr. 3, S. 55-58). Textures or patterns play an important role in the composition of natural images, their analysis and classification in various image analysis applications (Porter, R., Canagarajah, N .: Robust rotation invariant texture Classification: wavelet, Gabor filter and GMRF based schemes : IEE Proc.-Vis. Image Signal Processing 144 (1997), No. 3, pp. 180-188). The field of application has a broad spectrum: surface inspection, texture object recognition, OCR, document segmentation, tissue recognition in medical images, automated visual examinations, content-based image search, and remote recognition (see Hiremath, PS, S .: Wavelet Based Features for Texture Classification In: GVIP Journal 6 (2006), No. 3, pp. 55-58).
Die meisten existierenden Texturanalysemethoden basieren auf der Annahme, dass die Texturbilder mit derselben Orientierung und Skalierung aufgenommen worden sind. Dies ist eine Einschränkung bei der Anwendung dieser Methoden. Meistens ist es sehr schwierig oder sogar unmöglich, dieselbe Orientierung, Skalierung und Translation zu gewährleisten (Zhang, J. ; Tan, T.: Brief review of invariant texture analysis methods. In: Pattern Recognition 35 (2002), S. 735-747). Most existing texture analysis methods are based on the assumption that the texture images have been taken with the same orientation and scale. This is a limitation when using these methods. In most cases it is very difficult or even impossible to ensure the same orientation, scaling and translation (Zhang, J., Tan, T .: Brief review of invariant texture analysis methods., In: Pattern Recognition 35 (2002), pp. 735-747 ).
Die Methoden zur Darstellung der Texturmerkmale können grob in einen statistischen oder strukturellen Ansatz unterteilt werden (Haralick, R. M.: Statistical and Structural Approaches to Texture. In: Proceedings of the.lEEE 67 (1979), Nr. 5, S. 786-804). Bei der statistischen Methode werden Texturen anhand der statistischen Eigenschaften der The methods for representing the texture features can be roughly subdivided into a statistical or structural approach (Haralick, RM: Statistical and Structural Approaches to Texture, In: Proceedings of the IEEE 67 (1979), No. 5, pp. 786-804). , In the statistical method, textures are based on the statistical properties of the
BESTÄTIGUNGSKOPIE lokalen Grauwerte dargestellt. Diese Werte haben innerhalb einer Textur meistens konstante oder sehr wenig abweichende Eigenschaften. Somit können unterschiedliche Texturen durch einen Vergleich dieser Werte erkannt werden. CONFIRMATION COPY displayed local gray values. These values usually have constant or very little different properties within a texture. Thus, different textures can be recognized by comparing these values.
Strukturelle Modelle gehen davon aus, dass die Texturen aus Textur-Primitiven bestehen. Sie können mit einer Positionierungsregelung der Primitiven wieder reproduziert werden (vgl. Tuceryan, M. ; Jain, A. K.: The Handbook of Pattern Recognition and Computer Vision. World Scientific and Publishing Co.,, 1998. - 207- 248 S. - http://www.cs.iupui.edu/~tuceryan/research/ComputerVision/texture- review.pdf). Strukturelle Texturanalyse-Modelle bestehen aus zwei Phasen: a) Bestimmung der Textur-Elemente b) Definition der Positionierungsregeln. Dies ist bei sehr regelmässigen Texturen anwendbar. Die Textur-Primitiven können z.B. mit einer Kantenerkennung mit der Methode „Laplacian-of-Gaussian" oder „difference-of- Gaussian" extrahiert werden. Sobald die Primitiven feststehen, werden entweder die Primitiven statistisch ausgewertet oder die Positionierungsregeln dechiffriert (Wu, J.: Rotation Invariant Classification of 3D Surface Texture Using Photometrie Stereo. Thesis submitted for the Degree of Doctor of Philosophy, Department of Computer Science, School of Mathematical and Computer Sciences, Heriot-Watt University, Edinburgh, 2003). Structural models assume that the textures consist of texture primitives. They can be reproduced using primitive positioning controls (see Tuceryan, M., Jain, AK: The Handbook of Pattern Recognition and Computer Vision, World Scientific and Publishing Co., 1998. 207-248 p. //www.cs.iupui.edu/~tuceryan/research/ComputerVision/texture- review.pdf). Structural texture analysis models consist of two phases: a) Determining the texture elements b) Defining the positioning rules. This is applicable for very regular textures. The texture primitives may be e.g. with edge detection using the Laplacian-of-Gaussian or difference-of-Gaussian method. Once the primitives are fixed, either the primitives are statistically evaluated or the positioning rules deciphered (Wu, J .: Rotation Invariant Classification of 3D Surface Texture Using Photometry Stereo.) Thesis submitted for the Degree of Doctor of Philosophy, Department of Computer Science, School of Mathematical and Computer Sciences, Heriot-Watt University, Edinburgh, 2003).
Bei früheren Texturanalyse-Methoden wurden zunächst „first-order" oder „second- order" Statistiken angewendet, danach wurden modellbasierte Methoden wie„Gaussian Markov Random Fields", „Gibbs Random Fields" oder „Wold Model"entwickelt. In diesen Methoden wird die Textur entweder als Linearkombination einer Menge von Basisfunktionen oder als Wahrscheinlichkeitsmodell dargestellt. Die Koeffizienten dieser Modelle werden zur Beschreibung der Textur benutzt. Das Hauptproblem dieser Vorgehensweise ist die Schätzung der Koeffizienten und die Auswahl eines bestmöglich passenden Modells zur gegebenen Textur. Meistens werden die Koeffizienten so transformiert, dass sie translations-, rotations- und skalierungsinvariant sind. Zu den modellbasierten Methoden zählen„Simultaneous autoregressive (SAR)", „Circular Simultaneous Autoregressive (CSAR)", „Rotation Invariant SAR (RISAR)", „Multichanell Gabor Filter", „Fraktalen", „Steerable pyramid" und „Wavelet- Transformation" (vgl. z.B. Zhang, J. ; Tan, T.: Brief review of invariant texture analysis methods. ln:Pattern Recognition 35 (2002), S. 735-747; sowie Mandelbrot, B. B.: The Fractal Geometry of Nature. Freeman, New York, 1983). Die Wavelet-Theorie hat sich im Laufe der Zeit als eine einheitliche Basis für verschiedene signalverarbeitende Applikationen wie „multiresolution" Signalbearbeitung, maschinelles Sehen, Teilbandkodierung und Sprach-Kompression, gebildet (Chitre, Y. ; Dhawan, A.P.: M-band wavelet discrimination of natural textures. In: Pattern Recognition 32 (1999), S. 773-789) . Wie der Name„multiresolution" schon sagt, befasst es sich mit der Repräsentation und Analyse eines Signals (Bildes) in mehreren Auflösungen. Der Reiz dieser Methode liegt darin, dass man die in einer Auflösung übersehenen Eigenschaften in einer anderen Auflösung feststellen kann. Bis Ende der achtziger Jahre blieb das Interesse an dieser Methode gering, doch zur Zeit ist es schwierig, den Überblick über die Vielzahl der wissenschaftlichen Arbeiten über Wavelets zu behalten (Gonzalez, R. C. ; Woods, R. E.: Digital Image Processing. Pearson Education, Inc. Pearson Prentice Hall, New Jersey, 2008). Previous texture analysis methods used first-order or second-order statistics, then developed model-based methods such as Gaussian Markov Random Fields, Gibbs Random Fields, or Wold Model The coefficients of these models are used to describe the texture The main problem with this approach is the estimation of the coefficients and the selection of a best fit model for the given texture, which usually transforms the coefficients model-based methods include "Simultaneous Autoregressive (SAR)", "Circular Simultaneous Autoregressive (CSAR)", "Rotation Invariant SAR (RISAR)", "Multichannel Gabor Filter", " Fractals "," steerable pyramid "and" wavelet transform n "(see, eg, Zhang, J.; Tan, T .: Brief review of invariant texture analysis methods. ln: Pattern Recognition 35 (2002), pp. 735-747; and Mandelbrot, BB: The Fractal Geometry of Nature. Freeman, New York, 1983). Wavelet theory has evolved over time as a unified basis for various signal processing applications such as multiresolution signal processing, machine vision, subband coding and speech compression (Chitre, Y., Dhawan, AP: M-band wavelet discrimination of In: Pattern Recognition 32 (1999), pp. 773-789) As the name "multiresolution" implies, it deals with the representation and analysis of a signal (image) in several resolutions. The charm of this method is that you can see the properties overlooked in one resolution in a different resolution. Until the late 1980s, interest in this method remained low, but it is currently difficult to keep track of the multitude of scientific work on wavelets (Gonzalez, RC, Woods, RE: Digital Image Processing, Pearson Education, Inc.). Pearson Prentice Hall, New Jersey, 2008).
Anschaulich kann der Grund für eine Wavelet-Transformation wie folgt beschreiben werden: Wenn wir ein Bild betrachten, sehen wir zusammenhängende Bereiche aus ähnlichen Texturen und Intensitätsstufen, die die Objekte bilden. Falls diese Objekte von der Größe her sehr klein sind und einen niedrigen Kontrast haben, untersuchen wir sie in höheren Auflösungen. Falls sie sehr groß sind und hohe Kontrastwerte haben, werden sie grobkörniger dargestellt. Aber wenn in einem Bild gleichzeitig kleine und große Objekte bzw. Objekte mit niedrigem und hohem Kontrast vorhanden sind, ist es vorteilhaft, das Bild in verschiedenen Auflösungen zu untersuchen. Dies ist der fundamentale Hintergrund für die„multiresolutionu-Bearbeitung, vgl Gonzalez, R. C. ; Woods, R. E.: Digital Image Processing. Pearson Education, Inc. Pearson Prentice Hall, New Jersey, 2008. Illustratively, the reason for a wavelet transform can be described as follows: When we look at an image, we see contiguous areas of similar textures and intensity levels that make up the objects. If these objects are very small in size and have low contrast, we examine them in higher resolutions. If they are very large and have high contrast values, they will be displayed coarser. But if there are both small and large objects or objects with low and high contrast in an image at the same time, it is advantageous to examine the image in different resolutions. This is the fundamental background for the "multi-resolution and Editing, see Gonzalez, RC; Woods, RE: Digital Image Processing. Pearson Education, Inc. Pearson Prentice Hall, NJ, 2008.
Man unterscheidet zwischen der sogenannten „kontinuierlichen Wavelet- Transformation" und der „diskreten Wavelet-Transformation". Letztere ist eine unendliche Reihenentwicklung und erfordert damit bei numerischer Rechnung den Abbruch nach endlich vielen Termen. A distinction is made between the so-called "continuous wavelet transformation" and the "discrete wavelet transformation". The latter is an infinite series development and thus requires the numerical calculation abort after a finite number of terms.
Ein Beispiel für eine Diskrete Wavelet-Funktion ist das Haar-Wavelet, welches in einer Ausführungsform dieser Erfindung genutzt wird. Das Haar-Wavelet ist von Alfred Haar im 1910 vorgeschlagen und ist in der Literatur das erste bekannt gewordene Wavelet. Es wird auch als„D2" Wavelet bezeichnet, als eine spezielle Form von„Daubechies Wavelet". Das Haar-Wavelet ist auch bekannt als ein möglichst einfaches und orthonormales Wavelet. Dadurch ist es auch sehr einfach implementierbar. Der Nachteil ist, dass das Haar-Wavelet nicht stetig und dadurch nicht differenzierbar ist. Diese Eigenschaft kann je nach Signal von Vorteil oder Nachteil sein. An example of a Discrete Wavelet function is the Haar wavelet, which is used in one embodiment of this invention. The Haar wavelet was proposed by Alfred Haar in 1910 and is the first known wavelet in the literature. It is also referred to as the "D2" wavelet, a special form of "Daubechies wavelet". The Haar wavelet is also known as a simple and easy orthonormal wavelet. This makes it very easy to implement. The disadvantage is that the Haar wavelet is not continuous and therefore not differentiable. This property may be an advantage or disadvantage depending on the signal.
Die Diskrete Wavelet-Transformation (Wavelet Reihe) einer Funktion f(x) ist definiert durch The discrete wavelet transform (wavelet series) of a function f (x) is defined by
OO OO μ=-οο fc= -oo mit den Wavelet Koeffizienten όμ OO OO μ = -οο fc = -oo with the wavelet coefficients ό μ
Figure imgf000006_0001
Figure imgf000006_0001
— o Das Haar-Wavelet <p(x) und seine Skalierungsfunktion φ(χ) sind definiert durch  - o The Haar wavelet <p (x) and its scaling function φ (χ) are defined by
I 0 < x < l /2. f I 0 <x <l / 2. f
I 1 0 < < 1. I 1 0 <<1.
-) = { - 1 l/2 < x < L <?(*) = < r ~ -) = {- 1 l / 2 <x <L <? (*) = < R ~
I 0 sonst  I 0 otherwise
0 sonst  0 otherwise
Die Magnitude der Wavelet-Koeffizienten in einem bestimmten Kanal ist für diejenigen Bilder größer, die eine starke textureile Eigenschaft in Orientierung und Frequenz haben, die durch den Kanal repräsentiert wird. Daher kann die Textur eines Bildes mit einem Merkmalsvektor abgebildet werden, der durch statistische Maße aus den Wavelet-Koeffizienten aus dem jeweiligen Kanal (Sub-band) gebildet wird. Dies ermöglicht schließlich die Verwendung der Charakteristika der Wavelet-Koeffizienten zur Texturklassifikation. The magnitude of the wavelet coefficients in a particular channel is greater for those images that have a strong texture property in orientation and frequency represented by the channel. Therefore, the texture of an image can be mapped with a feature vector formed by statistical measures of the wavelet coefficients from the respective channel (sub-band). This finally allows the use of the characteristics of the wavelet coefficients for texture classification.
Ein Problem herkömmlicher Klassifizierungsmethoden zur Texturklassifikation ist jedoch, dass die Erkennungsrate von Texturen nur unzureichend ist. Dem gegenüber liegt der Erfindung die Aufgabe zugrunde, ein Verfahren zur Klassifizierung von Mustern in Bilddatensätzen vorzuschlagen, mit welchem sich herkömmliche Klassifizierungsmethoden zur Texturklassifikation verbessern lassen. However, a problem with conventional classification methods for texture classification is that the recognition rate of textures is insufficient. In contrast, the invention has the object to provide a method for the classification of patterns in image data sets, which can be used to improve conventional classification methods for texture classification.
Die der Erfindung zugrunde liegende Aufgabe wird mit den Merkmalen der unabhängigen Patentansprüche gelöst. Bevorzugte Ausführungsformen der Erfindung sind in den abhängigen Patenansprüchen angegeben. The object underlying the invention is achieved with the features of the independent claims. Preferred embodiments of the invention are specified in the dependent patent claims.
Es wird ein Verfahren zur Klassifizierung von Mustern in Bilddatensätzen vorgeschlagen, wobei die Klassifizierung ein Fuzzy c-Means Clustering umfasst, wobei das Verfahren umfasst („Trainingsphase"): a) Erfassung von Trainings-Bilddatensätzen, wobei die Trainings- Bilddatensätze Bilddaten unterschiedlicher Klassen von Mustern enthalten, b) Wavelet-Transformation der Trainings-Bilddatensätze zum Erhalt eines Satzes von Wavelet-Koeffizienten für jeden Trainings-Bilddatensatz, c) Bestimmung eines Satzes von statistischen Maßen für jeden Trainings- Bilddatensatz aus dem zugehörigen Satz von Wavelet-Koeffizienten, d) Klassifizierung aller Sätze von statistischen Maßen der Trainings- Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen, wobei jeder Cluster ein Cluster-Zentrum aufweist, wobei jedes Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist, e) Bestimmung der nicht eindeutig zugeordneten Cluster, welche mehreren Klassen von Mustern zugeordnet sind, f) erneute Klassifizierung der Sätze von statistischen Maßen der Trainings- Bilddatensätze der nicht eindeutig zugeordneten Cluster zur Bildung von weiteren Clustern der Sätze von statistischen Maßen für jeden nicht eindeutig zugeordneten Cluster, wobei jeder weitere Cluster ein weiteres Cluster-Zentrum aufweist, wobei jedes weitere Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist. A method is proposed for classifying patterns in image data sets, wherein the classification comprises fuzzy c-means clustering, the method comprising ("training phase"): a) acquisition of training image data sets, wherein the training image data sets contain image data of different classes of B) wavelet transformation of the training image data sets to obtain a set of wavelet coefficients for each training image data set; c) determining a set of statistical measures for each training image data set from the associated set of wavelet coefficients; d) Classifying all sets of statistical measures of the training image datasets to form clusters of the sets of statistical measures, each cluster having a cluster center, each cluster center being associated with one or more of the classes of the patterns, e) determining the ambiguity associated clusters, which are several classes of Mu f) reclassifying the sets of statistical measures of the training image data sets of the unclassified clusters to form further clusters of the sets of statistical measures for each not uniquely associated clusters, each additional cluster having a further cluster center, each additional cluster center being associated with one or more of the classes of the patterns.
Ausführungsformen der Erfindung haben den Vorteil, dass hiermit in zuverlässiger Weise eine Klassifizierung von Mustern in Bilddatensätzen ermöglicht wird. Im Falle dessen in einem initialen Klassifizierungsdurchgang gemäß der Schritte a)-d) zur Bestimmung von Cluster-Zentren einzelne Cluster mehreren Klassen von Mustern zugeordnet sind, wird die Klassifizierung für diese nicht eindeutig zugeordneten Cluster in den Schritten e) und f) wiederholt, wodurch sich die Erkennungsrate signifikant steigert. Kern der Erfindung ist somit die kaskadierte Wiederholung der Schritte e) und f) in Kombination der Ermittlung von statistischen Maßen aus den Koeffizienten von Wavelet-Transformationen und Fuzzy c-Means Clustering. Diese gewährleistet, dass Sätze von statistischen Maßen der Trainings-Bilddatensätze eindeutig einer einzelnen Klasse von Mustern zugeordnet werden können. Durch diese„Trainingsphase" wird somit eine Wissensbasis (auch„Knowledgebase" genannt) erstellt, welche dann zur Klassifikation von realen Test-Bilddatensätzen verwendet werden kann. Embodiments of the invention have the advantage that it is possible in a reliable manner to classify patterns in image data sets. If, in an initial classification pass according to steps a) -d), individual clusters are assigned to multiple classes of patterns for the purpose of determining cluster centers, the classification for these non-unique clusters is repeated in steps e) and f), thereby the recognition rate increases significantly. The core of the invention is thus the cascaded repetition of steps e) and f) in combination of the determination of statistical measures from the coefficients of wavelet transformations and fuzzy c-means clustering. This ensures that sets of statistical measures of the training image records can be uniquely assigned to a single class of patterns. This "training phase" thus creates a knowledge base (also known as "knowledgebase") which can then be used to classify real test image data records.
Mit Hilfe von Fuzzy-Mengen lassen sich allgemein Cluster-Probleme lösen. Aufgabe ist bei Cluster-Problemen, eine Menge von Daten mit ähnlichen Eigenschaften zu gruppieren und demselben Cluster zuzuordnen. Nahe beieinander liegende Datenpunkte haben ähnliche Eigenschaften und sollen in gemeinsame Cluster gruppiert werden. With the help of fuzzy sets, cluster problems can be solved in general. The problem with cluster problems is to group a set of data with similar properties and map them to the same cluster. Nearby data points have similar properties and are to be grouped into common clusters.
Die Anwendung von Fuzzy-Mengen in einer Klassifikationsaufgabe bewirkt, dass diese Klassenzugehörigkeit relaxiert wird und infolgedessen ein Datenelement gleichzeitig allen Klassen mit unterschiedlichen Graden angehören kann (vgl. Tizhoosh, H. R.: Fuzzy-Bildverarbeitung, Einführung in Theorie und Praxis, Springer-Verlag, Heidelberg, 1998). Die Idee von Fuzzy C-Means ist, dass jedes der N Datenelemente xi nicht nur einem Cluster zugeordnet wird, sondern jedem Cluster mit einer gewissen Zugehörigkeit Pij(x). Statt nun für alle Datenelemente die Distanz zum Cluster-Zentrum zu minimieren, wird die Distanz jedes Elementes mit der Zugehörigkeit zum Cluster- Zentrum multipliziert, vgl. Kapitel Fuzzy-Logik, ln:Kramer, O.: Computational Intelligence, Eine Einführung, Springer Verlag, Berlin Heidelberg, 2009, S. 75-99. The application of fuzzy sets in a classification task causes this class membership to be relaxed and, as a result, a data element can simultaneously belong to all classes with different degrees (see Tizhoosh, HR: Fuzzy Image Processing, Introduction to Theory and Practice, Springer-Verlag, Heidelberg , 1998). The idea of fuzzy C-Means is that each of the N data elements xi is not only assigned to a cluster, but to each cluster with a certain affiliation Pi j (x). Instead of minimizing the distance to the cluster center for all data elements, the distance of each element belonging to the cluster Center multiplied, cf. Chapter Fuzzy Logic, ln: Kramer, O .: Computational Intelligence, An Introduction, Springer Verlag, Berlin Heidelberg, 2009, pp. 75-99.
Minimiert werden Minimized
)V k ) V k
^ Σ Σ^ ιι** - ^!2. mit dem Modifizierer„m" (auch als Fuzzyfikator benannt). Die Zugehörigkeitsfunktion und die Cluster-Zentren ergeben sich wie folgt: ^ Σ Σ ^ ιι ** - ^! 2 . with the modifier "m" (also called fuzzyficator) The membership function and the cluster centers are as follows:
Figure imgf000009_0001
Figure imgf000009_0001
Nach Initialisierung der Zugehörigkeiten μ,) werden in jedem Schritt abwechselnd gemäß der vorstehenden Gleichung die Cluster-Zentren berechnet und daraufhin die Zugehörigkeiten zu den Clustern aktualisiert. Diese beiden Schritte werden abwechselnd so lange ausgeführt, bis die Summe der Änderungen der Zugehörigkeitswerte μ^ einen Wert ε unterschreiten. Damit sind die Cluster-Zentren und die Wissensbasis definiert. After initializing the affiliations μ 1 ) , the cluster centers are calculated alternately according to the above equation in each step, and then the affiliations to the clusters are updated. These two steps are carried out alternately until the sum of the changes in the membership values μ ^ falls below a value ε. This defines the cluster centers and the knowledge base.
Bei der Klassifikation wird somit zunächst anhand einer Trainingsdatenmenge die Wissensbasis aufgebaut. In the classification, the knowledge base is thus initially built on the basis of a training data set.
Nach einer Ausführungsform der Erfindung umfasst das Verfahren ferner folgende Schritte („Testphase"): a) Erfassung von Test-Bilddatensätzen, b) Waveiet-Transformation der Test-Bilddatensätze zum Erhalt According to one embodiment of the invention, the method further comprises the following steps ("test phase"): a) acquisition of test image data sets, b) wave-image transformation of the test image data sets to obtain
Satzes von Wavelet-Koeffizienten für jeden Test-Bilddatensatz, c) Bestimmung eines Satzes von statistischen Maßen für jeden Test- Bilddatensatz aus dem zugehörigen Satz von Wavelet-Koeffizienten, d) Klassifizierung aller Sätze von statistischen Maßen der Test- Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen der Test-Bilddatensätze, wobei die Klassifizierung unter Verwendung der zuvor bestimmten Cluster-Zentren erfolgt, e) Erneute Klassifizierung der Cluster der Test-Bilddatensätze, für welche zugehörigen Cluster-Zentren mehreren der Klassen der Muster der Trainings-Bilddatensätze zugeordnet waren, wobei die erneute Klassifizierung unter Verwendung der zuvor bestimmten weiteren Cluster-Zentren erfolgt. Set of wavelet coefficients for each test image data set, c) determining a set of statistical measures for each test image dataset from the associated set of wavelet coefficients; d) classifying all sets of statistical measures of the test image datasets to form clusters of the sets of statistical measures of the test image datasets; Classification is performed using the previously determined cluster centers; e) reclassifying the clusters of the test image data sets for which associated cluster centers were associated with a plurality of the classes of training image data sets, the re-classifying using the previously determined further ones Cluster centers are done.
Durch diese Schritte wird somit nach Abschluss der Trainingsphase die erzeugte Wissensbasis in Form der eindeutigen Zuordnung von Cluster-Zentren zu Sätzen von statistischen Maßen auf zu analysierende Test-Bilddatensätze angewandt. Schritt e) gewährleistet, dass selbst im Falle einer potentiellen nicht-eindeutigen Zuordnung eines Satzes von statistischen Maßen zu einem der Klassen der Muster durch den erneuten Klassifizierungsvorgang der entsprechende Satz von statistischen Maßen des Test- Bilddatensatzes eindeutig einer einzelnen Klasse von Mustern zugeordnet werden kann. As a result of these steps, the generated knowledge base in the form of the unambiguous assignment of cluster centers to sets of statistical measures is thus applied to test image data records to be analyzed after completion of the training phase. Step e) ensures that, even in the case of potential non-unique assignment of a set of statistical measures to one of the classes of patterns by the reclassification process, the corresponding set of statistical measures of the test image data set can be uniquely assigned to a single class of patterns.
Anders ausgedrückt, im Rahmen des Tests wird in Schritt d) die zuvor erzeugte Wissensbasis benutzt. In Schritt e) werden die in Schritt e) der Trainingsphase bestimmten Cluster erneut klassifiziert, wobei jeweils die Wissensbasis des einzelnen' Clusters aus Schritt f) der Trainingsphase herangezogen wird. In other words, during the test, the previously generated knowledge base is used in step d). In step e), the clusters determined in step e) of the training phase are reclassified, using in each case the knowledge base of the individual 'cluster from step f) of the training phase.
Nach einer weiteren Ausführungsform der Erfindung enthalten die Trainings- Bilddatensätze Bilddaten eine erste Anzahl unterschiedlicher Klassen von Mustern, wobei die durch die Klassifizierung der Trainings-Bilddatensätze gebildete Anzahl von Clustern der ersten Anzahl entspricht, wobei für einen nicht eindeutig zuordbaren Cluster - diesem Cluster eine zweite Anzahl der unterschiedlichen Klassen von Mustern zugeordnet ist, According to another embodiment of the invention, the training image data sets image data include a first number of different classes of patterns, wherein the number of clusters formed by the classification of the training image data sets corresponds to the first number, wherein for a non-unique cluster - this cluster is assigned a second number of different classes of patterns,
- bei der erneuten Klassifizierung dieses Clusters die Anzahl der weiteren Cluster der zweiten Anzahl entspricht. Nach einer weiteren Ausführungsform der Erfindung werden die Schritte e) und f) der Trainingsphase solange kaskadiert wiederholt, bis die Anzahl der eindeutig zuordenbaren Cluster einen vorbestimmten Minimalwert überschritten hat. Beispielsweise beträgt der Minimalwert mindestens 95%. - when re-classifying this cluster, the number of further clusters of the second number corresponds. According to a further embodiment of the invention, the steps e) and f) of the training phase are repeated in cascaded fashion until the number of clearly assignable clusters has exceeded a predetermined minimum value. For example, the minimum value is at least 95%.
Nach einer weiteren Ausführungsform der Erfindung werden die statistischen Maße so gewählt, dass diese invariant gegenüber einer Rotation der Bilddatensätze sind. Damit wird das Verfahren stabil ausführbar, da die Orientierung der Bilddatensätze keine Rolle mehr spielt. Bei jeder beliebigen Orientierung der Bilddatensätze liefert das Verfahren das gleich präzise Klassifizierungsergebnis. Sofern Rotationsinvarianz erreicht werden soll, werden die Paare der zueinander diagonalliegenden Kanäle aus der Wavelet- Transformation zu einem statistischen Merkmal kombiniert (Porter, R. ; Canagarajah, N.: Robust rotation invariant texture Classification: wavelet, Gabor filter and GMRF based schemes. In: IEE Proc.-Vis. Image Signal Processing 144 (1997), Nr. 3, S. 180- 188) According to another embodiment of the invention, the statistical measures are chosen such that they are invariant with respect to rotation of the image data sets. Thus, the method is stable executable, since the orientation of the image data sets no longer plays a role. For any orientation of the image data sets, the method provides the same precise classification result. If rotation invariance is to be achieved, then the pairs of mutually diagonal channels from the wavelet transform are combined into one statistical feature (Porter, R., Canagarajah, N: Robust rotation invariant texture classification: wavelet, Gabor filter and GMRF based schemes : IEE Proc.-Vis. Image Signal Processing 144 (1997), No. 3, pp. 180-188)
Es sei angemerkt, dass Wavelet-Transformationen im Übrigen skalierungsinvariant sind, sodass die Skalierung der zu klassifizierenden Bilddatensätze ebenfalls keine Rolle spielt. It should be noted that wavelet transformations are otherwise scaling invariant, so that the scaling of the image data sets to be classified also plays no role.
Nach einer weiteren Ausführungsform der Erfindung umfassen die statistischen Maße einen Energie-Wert und/oder einen Entropie-Wert und/oder eine Standardabweichung. According to a further embodiment of the invention, the statistical measures include an energy value and / or an entropy value and / or a standard deviation.
Im Detail können z.B. folgende statistische Maße definiert werden: · Energy: Bei der Analyse der Texturen von wavelet-transformierten Bilder wird meistens der Mittelwert der Magnitude der Wavelet-Koeffizienten benutzt. Die Energie des n'ten Kanals ist gemäß Porter, R. ; Canagarajah, N.: Robust rotation invariant texture Classification: wavelet, Gabor filter and GMRF based schemes. In: IEE Proc.-Vis. Image Signal Processing 144 (1997), Nr. 3, S. 180- 188 wie folgt definiert: In detail, for example, the following statistical measures can be defined: · Energy: In the analysis of the textures of wavelet-transformed images, the mean value of the magnitude of the wavelet coefficients is mostly used. The energy of the nth channel is, according to Porter, R.; Canagarajah, N .: Robust rotation invariant texture Classification: wavelet, Gabor filters and GMRF based schemes. In: IEE Proc.-Vis. Image Signal Processing 144 (1997), No. 3, pp. 180-188 is defined as follows:
ENERCV lc:,, = ENERCV lc: ,, =
MN MN
M N M N
wobei die Dimensionen des Kanals MxN ist, i und j sind die Zeile und Spalte desn'ten Kanals, und x ist der Wavelet-Koeffizient innerhalb dieses Kanals.  where the dimensions of the channel is MxN, i and j are the row and column of the nth channel, and x is the wavelet coefficient within that channel.
• Energy2: Anstatt des obengenannten Energy-Parameters kann gemäß Chitre, Y. ; Dhawan, A.P.: M-band wavelet discrimination of natural textures. In: Pattern Recognition 32 (1999), S. 773-789 eine andere„Energy"-Norm benutzt werden. Dieser Wert kann als zweites Merkmal berechnet werden gemäß:
Figure imgf000012_0001
• Energy2: Instead of the above energy parameter, according to Chitre, Y.; Dhawan, AP: M-band wavelet discrimination of natural textures. In: Pattern Recognition 32 (1999), pp. 773-789, this value can be calculated as a second feature according to:
Figure imgf000012_0001
• Entropy: Das dritte Merkmal kann der Entropie-Wert in jedem Kanal sein. Dieses Merkmal wurde z.B. von Chitre, Y. ; Dhawan, A.P.: M-band wavelet discrimination of natural textures. In: Pattern Recognition 32 (1999), S. 773-789 beschrieben und berechnet sich nach: • Entropy: The third feature may be the entropy value in each channel. This feature has been used e.g. from Chitre, Y.; Dhawan, A.P .: M-band wavelet discrimination of natural textures. In: Pattern Recognition 32 (1999), pp. 773-789 describes and is calculated according to:
Figure imgf000012_0002
Figure imgf000012_0002
Standardabweichung: Dieses Maß wurde z.B. beschrieben durch Manthalkar, R. Biswas, P.K. ; Chatterji, B.N.: Rotation and scale invariant texture features using discrete wavelet packet transform. In: Pattern Recognition Letters 24 (2003), S. 2455-2462:
Figure imgf000013_0001
Standard deviation: This measure has been described, for example, by Manthalkar, R. Biswas, PK; Chatterji, BN: Rotation and scale invariant texture features using discrete wavelet packet transform. In: Pattern Recognition Letters 24 (2003), pp. 2455-2462:
Figure imgf000013_0001
Es sei angemerkt, dass die Trainings-Bilddatensätze eindeutige Klassen von Mustern enthalten. In andern Worten ist ein einzelnes Bild nicht zu 2 unterschiedlichen Klassen zugeordnet, sondern die Klassenzuordnung der Bilder ist eindeutig. Nach einer weiteren Ausführungsform der Erfindung umfasst das Verfahren während der Trainingsphase ferner eine Festlegung des Satzes von statistischen Maßen, wobei die Schritte d)-f) für verschiedene festgelegte Sätze von statistischen Maßen durchgeführt werden, wobei der Satz an statistischen Maßen festgelegt wird, für den die Erkennungsrate der Trainingsphase maximiert wird. Dieser so festgelegte Satz von statistischen Maßen wird dann auch in entsprechender Weise identisch bei der Klassifizierung der Testbilder angewandt. It should be noted that the training image records contain unique classes of patterns. In other words, a single image is not associated with 2 different classes, but the class assignment of the images is unique. According to a further embodiment of the invention, during the training phase, the method further comprises setting the set of statistical measures, wherein steps d) -f) are performed for different set of statistical measures defining the set of statistical measures for which the recognition rate of the training phase is maximized. This set of statistical measures thus determined is then also applied identically in the classification of the test images.
Die Festlegung des Satzes von statistischen Maßen kann beispielsweise als Zwischenschritt zwischen den Schritten c) und d) erfolgen. Allerdings kann auch in mathematischer Weise vorab (vor Schritt c) bestimmt werden, welche Sätze von statistischen Maße Verwendung finden sollen. The determination of the set of statistical measures can be carried out, for example, as an intermediate step between steps c) and d). However, it can also be determined mathematically in advance (before step c) which sets of statistical measures should be used.
Somit gehen nach einer Ausführungsform der Erfindung z.B. nicht alle (rotationsinvarianten) statistischen Merkmale in die Klassifizierung ein. Es kann durchaus sein, dass - je nach Untersuchungsaufgabe - einige Merkmale besser geeignet erscheinen, die Klassen zu trennen, als andere. Möglich wäre ein iteratives Verfahren bei dem eine Klassifizierung der Trainingsdaten mit nur einem Teil der statistischen Merkmale vorgenommen wird. Das "bessere" Ergebnis / die bessere Auswahl kann dann weiter verwendet werden. Die im Rahmen des Trainings festgelegten statistischen Maße bleiben beim Test unverändert. Thus, according to one embodiment of the invention, e.g. not all (rotationally invariant) statistical features are included in the classification. It may well be that, depending on the task of investigation, some features may be more appropriate for separating classes than others. An iterative method would be possible in which a classification of the training data is carried out with only a part of the statistical features. The "better" result / better selection can then continue to be used. The statistical measures determined during the training remain unchanged during the test.
Es sei angemerkt, dass eine Reduktion der Merkmale zur Beschleunigung des Verfahrens führen kann. In einem weiteren Aspekt betrifft die Erfindung ein Computerprogrammprodukt mit von einem Computer ausführbaren Instruktionen zur Durchführung der Verfahrensschritte wie obig beschrieben. It should be noted that a reduction of the features can lead to an acceleration of the method. In another aspect, the invention relates to a computer program product having computer-executable instructions for performing the method steps as described above.
Im Folgenden werden bevorzugte Ausführungsformen der Erfindung anhand der Zeichnungen näher erläutert. Es zeigen: In the following, preferred embodiments of the invention are explained in more detail with reference to the drawings. Show it:
Fig. 1 eine Übersicht über Gefügebilder, 1 is an overview of micrographs,
Fig. 2A Teil A einer tabellarischen Übersicht über die Trainingsphase unter Fig. 2A part A of a tabular overview of the training phase under
Verwendung von 6 Wavelet-Merkmalen,  Using 6 wavelet features,
Fig. 2B Teil B einer tabellarischen Übersicht über die Trainingsphase unter 2B part B of a tabular overview of the training phase under
Verwendung von 6 Wavelet-Merkmalen,  Using 6 wavelet features,
Fig. 3 schematische Schritte eines Aufbaus einer kaskadierten Klassifikation in der Trainingsphase, 3 shows schematic steps of a construction of a cascaded classification in the training phase,
Fig. 4 schematische Schritte eines Aufbaus einer kaskadierten Klassifikation in der Testphase, 4 shows schematic steps of a construction of a cascaded classification in the test phase,
Fig. 5 eine tabellarische Übersicht der Wavelet-Fehlerrate nach der 2ten Stufe der kaskadierten Klassifizierung der Gefügebilder. Fig. 5 is a tabular overview of the wavelet error rate after the 2nd stage of the cascaded classification of the micrographs.
Figur 1 zeigt eine grafische Übersicht über verschiedene Gefügebilder (Verlag, Stahleisen: Richtreihe zur Bewertung der Gefüge von geglühten Warmarbeitstählen, SEP1614 Tafel 2. Verlag Stahleisen, Düsseldorf, 1996). Gefügebilder sind mikroskopische Bilder von Rohstahl, die Strukturen zeigen, die beim Erkalten des heißen Stahls entstehen und die ein Maß für die Qualität des Materials darstellen. Die Proben werden dem weichgeglühten Material entnommen, geschliffen und poliert und in 3% alkoholischer Salpetersäure so geätzt, dass sie Mikrohomogenität erkennen lassen. Zur Bewertung der Qualität wird die unter Mikroskop in Vergrößerung von 500:1 betrachtete Probe einem Bild einer Richtreihe zugeordnet. Die Fig. 1 zeigt die Richtreihe mit den Stufen von GA1 bis GF5. Diese 30 Bilddaten wurden digitalisiert, ein Bildausschnitt standardisiert ausgeschnitten und jeder Auschnitt in 5 Grad Schritten rotiert, so dass insgesamt 2.160 Bilddatensätze zur Verfügung standen. Zu den Trainingsdaten sind die Bilder mit Rotationswinkel von 0 bis 135 zugeordnet worden. Dies ergibt insgesamt 840 Bilder (28 Bilder für jede der 30 Klassen). Außerdem wurden Testdaten erzeugt, welche die Bilder mit Winkel größer 135 Grad enthalten, also insgesamt 1.320 Bilder. Figure 1 shows a graphical overview of various micrographs (publisher, steel iron: straightening series for the evaluation of the structure of annealed hot-work steels, SEP1614 board 2nd Verlag Stahleisen, Dusseldorf, 1996). Micrographs of crude steel show microstructures that arise when the hot steel cools, and are a measure of the quality of the material. The samples are taken from the annealed material, ground and polished and etched in 3% alcoholic nitric acid to reveal micro-homogeneity. To evaluate the quality, the sample viewed under microscope at a magnification of 500: 1 is assigned to an image of a guideline series. FIG. 1 shows the straightening row with the steps from GA1 to GF5. These 30 image data were digitized, one image section was cut out in a standardized manner and each section was rotated in 5 degree increments so that a total of 2,160 image data sets were available. To the training data the images with rotation angle from 0 to 135 have been assigned. This gives a total of 840 images (28 images for each of the 30 classes). In addition, test data were generated, which contain the images with an angle greater than 135 degrees, so a total of 1,320 images.
Zur beispielhaften Klassifizierung dieser 840 Bilder in der Trainingsphase wurde nun wie obig beschrieben unter Verwendung von Fuzzy c-Means Clustering vorgegangen: Es wurden zunächst eine Wavelet- Transformation für jeden Bilddatensatz zum Erhalt eines Satzes von Wavelet-Koeffizienten für jeden Trainings-Bilddatensatz vorgenommen, wobei anschließend ein Satz von statistischen Maßen für jeden Trainings-Bilddatensatz aus dem zugehörigen Satz von Wavelet-Koeffizienten bestimmt wurde. Anschließend erfolgte die Klassifizierung aller Sätze von statistischen Maßen der Trainings-Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen, wobei jeder Cluster ein Cluster-Zentrum aufweist, wobei jedes Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist. The exemplary classification of these 840 images in the training phase has now proceeded as described above using fuzzy c-means clustering: First, a wavelet transform was performed for each image data set to obtain a set of wavelet coefficients for each training image data set then determining a set of statistical measures for each training image data set from the associated set of wavelet coefficients. Subsequently, the classification of all sets of statistical measures of the training image datasets was made to form clusters of the sets of statistical measures, each cluster having a cluster center, each cluster center being associated with one or more of the classes of the patterns.
Fig.2A und 2B zeigen eine tabellarische Übersicht über die Trainingsphase unter Verwendung von 6 Wavelet-Merkmalen: Die Erkennungsrate bei reinen Wavelet- Merkmalen betrug 72,9%, 27,1% der Bilder (d.h. deren Sätze von statistischen Maßen) waren einer falschen Klasse zugeordnet. Lediglich 24 Cluster waren eindeutig, 2 Cluster beinhalteten 2 Klassen, 2 Cluster bestanden aus 3 Klassen, ein Cluster aus 4 und einer aus 5 Klassen. Figures 2A and 2B show a tabular overview of the training phase using 6 wavelet features: The detection rate for pure wavelet features was 72.9%, 27.1% of the images (ie their sets of statistical measures) were incorrect Class assigned. Only 24 clusters were unique, 2 clusters contained 2 classes, 2 clusters consisted of 3 classes, a cluster of 4 and one of 5 classes.
So zeigt beispielsweise Cluster Nr. 9 sowohl eine mögliche Zugehörigkeit zur Klasse GC5, als auch zur Klasse GD3, wobei 56 der Sätze von statistischen Maßen (zugehörig zu unterschiedlichen Bildern) in den Cluster Nr. 9 zugeordnet wurden. For example, cluster # 9 shows both a possible membership of class GC5 and class GD3, with 56 being assigned to sets of statistical measures (belonging to different images) in cluster # 9.
Aus der Trainingsphase ist bekannt, welche Cluster aus mehreren Klassen bestehen. Erfindungsgemäß erfolgt nun in einem weiteren Schritt durch erneute Klassifizierung derjenigen Cluster, die aus mehreren Klassen bestehen, eine Trennung der vorher zusammengefassten Klassen. Die Klassifizierung wird dabei für jeden Cluster einzeln durchgeführt. Die Figur 3 zeigt die Vorgehensweise im Schema. Zunächst wird davon ausgegangen, dass die zur Trainingszwecken verwendeten Bilder in eindeutiger Weise aus k Klassen bestehen, d.h. dass jedes Bild eindeutig einer einzelnen Klasse zuordenbar ist. Diese Trainingsbilddaten werden daraufhin entsprechend den Schritten b) bis d) der Trainingsphase klassifiziert, woraus sich in Schritt 302 eine Anzahl von k Clustern der Sätze von statistischen Maßen der Trainings-Bilddatensätze ergeben. In anderen Worten weisen die Trainings- Bilddatensätze Bilddaten eine Anzahl k unterschiedlicher Klassen von Mustern auf, wobei die durch die Klassifizierung der Trainings-Bilddatensätze gebildete Anzahl von Clustern der Anzahl k entspricht. From the training phase it is known which clusters consist of several classes. According to the invention, in a further step, by re-classifying those clusters that consist of several classes, a separation of the previously combined classes takes place. The classification is carried out individually for each cluster. FIG. 3 shows the procedure in the diagram. First of all, it is assumed that the images used for training purposes consist uniquely of k classes, ie that each image can be uniquely assigned to a single class. These training image data are then classified according to steps b) through d) of the training phase, resulting in a number of k clusters of the sets of statistical measures of the training image data sets in step 302. In other words, the training image data sets image data have a number k of different classes of patterns, the number of clusters formed by the classification of the training image data sets corresponding to the number k.
Für die eindeutig identifizierten Cluster, welche nur einer Klasse zugeordnet werden können, wird die Wissensbasis entsprechend aktualisiert. Anschaulich gesprochen werden in der Wissensbasis die Cluster-Zentren der Sätze von einer Anzahl p (p>0) statistischen Maßen gespeichert, wobei jedem Cluster Zentrum eindeutig eine Klasse zugeordnet ist. Jeder Satz von statistischen Maßen kann anschaulich als Punkt in einem p-Dimensionalen Raum dargestellt werden, wobei das zugehörige Cluster- Zentrum ebenfalls in diesem p-Dimensionalen Raum angeordnet ist. Jeder weitere Satz von statistischen Maßen (beispielsweise eines Testdatensatzes), welcher in der Nähe dieses Cluster-Zentrums liegt, kann somit als zu diesem Cluster-Zentrum zugehörig identifiziert werden. For the clearly identified clusters, which can only be assigned to one class, the knowledge base is updated accordingly. Illustratively, in the knowledge base, the cluster centers of the sets are stored by a number p (p> 0) of statistical measures, each cluster center being uniquely assigned a class. Each set of statistical measures can be graphically represented as a point in a p-dimensional space, with the associated cluster center also being arranged in this p-dimensional space. Any further set of statistical measures (for example, a test data set) that is near this cluster center can thus be identified as belonging to that cluster center.
Wie Fig. 3 zeigt, besteht jedoch auch die Möglichkeit, dass einzelne Cluster (z.B. Cluster 2 und Cluster m) nicht eindeutig einer sondern mehreren Klassen zugeordnet wurden. Für diese nicht eindeutig zugeordneten Cluster wird nun in Schritt 304 eine erneute Klassifizierung durchgeführt zur Bildung von weiteren Clustern der Sätze von statistischen Maßen für jeden nicht eindeutig zugeordneten Cluster in Schritt 302, wobei jeder weitere Cluster ein weiteres Cluster-Zentrum aufweist, wobei jedes weitere Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist. Bestand Cluster 2 aus n verschiedenen Klassen, wird eine Klassifizierung auf n verschiedene Klassen durchgeführt. In gleicher Weise wird für Cluster m, welcher aus I verschiedenen Klassen besteht, eine Klassifizierung auf I verschiedene Klassen durchgeführt. Dies resultiert in weiteren Clustern in Schritt 306. Für die nun eindeutig identifizierten Cluster, welche wiederum nur einer Klasse zugeordnet werden können, wird die Wissensbasis entsprechend aktualisiert. Entsprechend der geforderten Erkennungsquote kann dieses Verfahren so lange für nicht eindeutig zuordenbare Cluster kaskadiert fortgeführt werden, bis eine gewünschte Erkennungsquote erreicht ist. Somit entsteht für jeden Cluster, der erneut klassifiziert wird, eine neue Wissensbasis. However, as FIG. 3 shows, there is also the possibility that individual clusters (for example cluster 2 and cluster m) have not been unambiguously assigned to one but to several classes. For these non-unique clusters, a re-classification is now performed in step 304 to form further clusters of sets of statistical measures for each non-unique cluster in step 302, each additional cluster having a further cluster center, each additional cluster Center is assigned to one or more of the classes of patterns. If cluster 2 consists of n different classes, a classification is performed on n different classes. Similarly, for clusters m consisting of I different classes, classification is performed on I different classes. This results in further clusters in step 306. For the now clearly identified clusters, which in turn can only be assigned to one class, the knowledge base is updated accordingly. In accordance with the required recognition rate, this method can be continued cascaded for clusters that can not be assigned unambiguously until a desired recognition rate has been reached. This creates a new knowledge base for each cluster that is reclassified.
Da aus der Trainingsphase bekannt ist, welche Cluster nicht eindeutig zugeordnet waren und für welche eine neue Wissensbasis erzeugt wurde, kann das Verfahren in gleicher Weise bei der Testdurchführung angewandt werden. Als„Testdurchführung" wird hiermit z.B. die Anwendung des Verfahrens zur Klassifizierung von realen Bildern verstanden. Since it is known from the training phase which clusters were not unambiguously assigned and for which a new knowledge base was generated, the method can be applied in the same way in the test execution. By way of example, "test execution" is understood to mean the application of the method for classifying real images.
Dies ist in Fig. 4 gezeigt, wo in Schritt 400 eine Erfassung von Test-Bilddatensätzen erfolgt, auf welche die in Fig. 3 Schritt 300 erzeugte Wissensbasis zur Klassifizierung angewendet wird. Im Detail wird zunächst eine Wavelet-Transformation der Test- Bilddatensätze zum Erhalt eines Satzes von Wavelet-Koeffizienten für jeden Test- Bilddatensatz durchgeführt, woraufhin eine Bestimmung eines Satzes von statistischen Maßen für jeden Test-Bilddatensatz aus dem zugehörigen Satz von Wavelet- Koeffizienten erfolgt. Daraufhin werden die in der gemäß Fig. 3 erzeugten Wissensbasis gespeicherten Zuordnungen von Cluster-Zentren dazu verwendet, alle Sätze von statistischen Maßen der Test-Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen der Test-Bilddatensätze zu klassifizieren. Daraus resultieren in Schritt 402 verschiedene Cluster 1..k. This is shown in FIG. 4, where in step 400 a collection of test image data sets is made, to which the classification knowledge base generated in FIG. 3 step 300 is applied. In detail, a wavelet transformation of the test image data sets is first performed to obtain a set of wavelet coefficients for each test image data set, whereupon a determination of a set of statistical measures for each test image data set is made from the associated set of wavelet coefficients. Thereafter, the cluster center mappings stored in the knowledge base generated in accordance with Figure 3 are used to classify all sets of statistical measures of the test image data sets to form clusters of the sets of statistical measures of the test image data sets. This results in step 402 different clusters 1..k.
Anschließend werden, wie in Fig. 4 gezeigt, die aus dem Training bekannten Cluster mit mehrfacher Zuordnung erneut klassifiziert, wobei die erneute Klassifizierung unter Verwendung der zuvor bestimmten weiteren Cluster-Zentren erfolgt. D.h., hierzu werden die in Schritt 304 erzeugten neuen Wissensbasen verwendet. Dies resultiert in Schritt 404 in Clustern von Sätzen von statistischen Maßen (d.h. für einzelne Testbilder), welche eindeutig entsprechenden Klassen zugeordnet werden können. Subsequently, as shown in FIG. 4, the multiple assignment clusters known from training are reclassified, with the re-classification done using the previously determined other cluster centers. That is, for this purpose, the new knowledge bases generated in step 304 are used. This results in steps 404 clustering sets of statistical measures (i.e., individual test images) that can be uniquely assigned to corresponding classes.
Bezugnehmend auf Fig. 2A und 2B wurde die getrennte Klassifizierung entsprechend dem Verfahren der Figur 3 für die sechs bisher nicht eindeutigen Cluster der Wavelet- Merkmale durchgeführt. Dabei konnten ein Cluster vollständig korrekt zugeordnet werden, bei den anderen wurde eine deutlich Reduktion der verbleibenden Fehler verzeichnet, weil die Klassen besser getrennt wurden. Die Fig. 5 zeigt die nicht eindeutigen Cluster vor und nach der zweiten Klassifikation. Von den vorher 228 falschen Zuordnungen verbleiben nur noch 31. Damit ergibt sich für die kaskadierten Klassifikation der Trainingsdaten aus den Wavelet-Merkmalen eine Verbesserung der Erkennungsrate von 72,9% auf 96.3%. Referring to Figs. 2A and 2B, the separate classification has been performed according to the method of Fig. 3 for the six hitherto ambiguous clusters of wavelet features. One cluster could be assigned completely correctly, with the others a significant reduction of the remaining errors was recorded because the classes were better separated. FIG. 5 shows the non-unique clusters before and after the second classification. Of the previously 228 incorrect assignments, only 31 remain. This results in an improvement of the recognition rate from 72.9% to 96.3% for the cascaded classification of the training data from the wavelet features.
In einer Testphase wurde zur Verifikation des Verfahrens die o.g. 1320 Gefügebilder klassifiziert. In der ersten Stufe wurden 72,5% korrekt zugeordnet, 362 Bilder waren falsch klassifiziert. Anschließend wurden, wie in Fig. 4 dargestellt, die aus dem Training bekannten Cluster mit mehrfacher Zuordnung erneut klassifiziert. In der 2. Stufe konnten weitere 321 Bilder korrekt zugeordnet werden. Die verbleibenden 42 bedeuteten eine Fehlerquote von 3,2% und eine Erkennungsrate von 96,8%. In a test phase, the o.g. Classified 1320 microstructures. In the first stage, 72.5% were correctly assigned, 362 images were wrongly classified. Subsequently, as shown in Figure 4, the multiple assignment clusters known from training were reclassified. In the second stage, another 321 images could be assigned correctly. The remaining 42 represented an error rate of 3.2% and a detection rate of 96.8%.
Somit hat das Verfahren einer zweistufigen Klassifizierung mit Fuzzy c-Means Clustering mit den statistischen Merkmalen aus den Koeffizienten der Wavelet- Transformation den Vorteil, dass in zuverlässiger Weise ein sehr gutes Klassifizierungsergebnis erzielt werden kann. Thus, the method of a two-stage classification with fuzzy c-means clustering with the statistical features from the coefficients of wavelet transformation has the advantage that a very good classification result can be reliably achieved.

Claims

Patentansprüche claims
1. Verfahren zur Klassifizierung von Mustern in Bilddatensätzen, wobei die Klassifizierung ein Fuzzy c-Means Clustering umfasst, wobei das Verfahren umfasst: a) Erfassung von Trainings-Bilddatensätzen, wobei die Trainings- Bilddatensätze Bilddaten unterschiedlicher Klassen von Mustern enthalten, b) Wavelet-Transformation der Trainings-Bilddatensätze zum Erhalt eines Satzes von Wavelet-Koeffizienten für jeden Trainings-Bilddatensatz, c) Bestimmung eines Satzes von statistischen Maßen für jeden Trainings- Bilddatensatz aus dem zugehörigen Satz von Wavelet-Koeffizienten, d) Klassifizierung aller Sätze von statistischen Maßen der Trainings- Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen, wobei jeder Cluster ein Cluster-Zentrum aufweist, wobei jedes Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist, e) Bestimmung der nicht eindeutig zugeordneten Cluster, welche mehreren Klassen von Mustern zugeordnet sind, f) erneute Klassifizierung der Sätze von statistischen Maßen der Trainings- Bilddatensätze der nicht eindeutig zugeordneten Cluster zur Bildung von weiteren Clustern der Sätze von statistischen Maßen für jeden nicht eindeutig zugeordneten Cluster, wobei jeder weitere Cluster ein weiteres Cluster-Zentrum aufweist, wobei jedes weitere Cluster-Zentrum einem oder mehreren der Klassen der Muster zugeordnet ist. A method of classifying patterns in image data sets, the classification comprising fuzzy c-means clustering, the method comprising: a) acquiring training image data sets, wherein the training image data sets contain image data of different classes of patterns, b) wavelet Transforming the training image datasets to obtain a set of wavelet coefficients for each training image dataset; c) determining a set of statistical measures for each training image dataset from the associated set of wavelet coefficients; d) classifying all sets of statistical measures of the wavelet coefficients Training image data sets for forming clusters of the sets of statistical measures, each cluster having a cluster center, each cluster center being associated with one or more of the classes of the patterns, e) determining the non-unique clusters which are multiple classes of Associated with patterns, f) reclassification generating the sets of statistical measures of the training image data sets of the uniquely assigned clusters to form further clusters of the sets of statistical measures for each non-unique cluster, each further cluster having a further cluster center, each further cluster center one or more of the classes associated with the pattern.
2. Verfahren nach Anspruch 1 , weiter umfassend: a) Erfassung von Test-Bilddatensätzen, b) Wavelet-Transformation der Test-Bilddatensätze zum Erhalt eines Satzes von Wavelet-Koeffizienten für jeden Test-Bilddatensatz, c) Bestimmung eines Satzes von statistischen Maßen für jeden Test-2. The method of claim 1, further comprising: a) acquiring test image data sets, b) wavelet transforming the test image data sets to obtain a set of wavelet coefficients for each test image data set, c) determining a set of statistical measures for every test
Bilddatensatz aus dem zugehörigen Satz von Wavelet-Koeffizienten, d) Klassifizierung aller Sätze von statistischen Maßen der Test- Bilddatensätze zur Bildung von Clustern der Sätze von statistischen Maßen der Test-Bilddatensätze, wobei die Klassifizierung unter Verwendung der zuvor bestimmten Cluster-Zentren erfolgt, e) Erneute Klassifizierung der Cluster der Test-Bilddatensätze, für welche zugehörigen Cluster-Zentren mehreren der Klassen der Muster der Trainings-Biiddatensätze zugeordnet waren, wobei die erneute Klassifizierung unter Verwendung der zuvor bestimmten weiteren Cluster-Zentren erfolgt. Image data set from the associated set of wavelet coefficients; d) classifying all sets of statistical measures of the test image datasets to form clusters of the sets of statistical measures of the test image datasets, wherein the classification is done using the previously determined cluster centers, e ) Reclassifying clusters of test image datasets for which associated cluster centers were associated with multiple of the classes of training bios datasets, the re-classifying using the previously determined further cluster centers.
3. Verfahren nach Anspruch 1 , wobei die Trainings-Biiddatensätze Bilddaten eine erste Anzahl unterschiedlicher Klassen von Mustern enthalten, wobei die durch die Klassifizierung der Trainings-Biiddatensätze gebildete Anzahl von Clustern der ersten Anzahl entspricht, wobei für einen nicht eindeutig zuordenbaren Cluster 3. The method of claim 1, wherein the training image data sets contain image data of a first number of different classes of patterns, wherein the number of clusters formed by the classification of the training image data sets corresponds to the first number, wherein for a non-unique cluster
- diesem Cluster eine zweite Anzahl der unterschiedlichen Klassen von Mustern zugeordnet ist, - this cluster is assigned a second number of different classes of patterns,
- bei der erneuten Klassifizierung dieses Clusters die Anzahl der weiteren Cluster der zweiten Anzahl entspricht. - when re-classifying this cluster, the number of further clusters of the second number corresponds.
4. Verfahren nach Anspruch 1 , wobei die Schritte e) und f) solange kaskadiert wiederholt werden, bis die Anzahl der eindeutig zuordenbaren Cluster einen vorbestimmten Minimalwert überschritten hat. 4. The method of claim 1, wherein the steps e) and f) are repeated cascaded until the number of uniquely assignable clusters has exceeded a predetermined minimum value.
5. Verfahren nach Anspruch 4, wobei der Minimalwert mindestens 95% beträgt. 5. The method of claim 4, wherein the minimum value is at least 95%.
6. Verfahren nach Anspruch 1 , wobei die statistischen Maße invariant gegenüber einer Rotation der Bilddatensätze sind. The method of claim 1, wherein the statistical measures are invariant to rotation of the image data sets.
7. Verfahren nach Anspruch 5, wobei die statistischen Maße einen Energie-Wert und/oder einen Entropie-Wert und/oder eine Standardabweichung umfassen. 7. The method of claim 5, wherein the statistical measures include an energy value and / or an entropy value and / or a standard deviation.
8. Verfahren nach Anspruch 1 , ferner mit einer Festlegung des Satzes von statistischen Maßen, wobei die Schritte d)-f) für verschiedene festgelegte Sätze von statistischen Maßen durchgeführt werden, wobei der Satz an statistischen Maßen festgelegt wird, für den die Erkennungsrate maximiert wird. The method of claim 1, further comprising determining the set of statistical measures, wherein steps d) -f) are performed for different predetermined sets of statistical measures, wherein the set of statistical measures for which the recognition rate is maximized is determined ,
9. Computerprogrammprodukt mit von einem Computer ausführbaren Instruktionen zur Durchführung der Verfahrensschritte gemäß den vorigen Ansprüchen. A computer program product having computer executable instructions for performing the method steps of the preceding claims.
PCT/EP2011/004808 2010-09-29 2011-09-26 Method for classifying patterns in image data records WO2012052106A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP11771014.5A EP2622540A1 (en) 2010-09-29 2011-09-26 Method for classifying patterns in image data records

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102010046867A DE102010046867A1 (en) 2010-09-29 2010-09-29 Method for classifying patterns in image data sets
DE102010046867.3 2010-09-29

Publications (1)

Publication Number Publication Date
WO2012052106A1 true WO2012052106A1 (en) 2012-04-26

Family

ID=44907777

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2011/004808 WO2012052106A1 (en) 2010-09-29 2011-09-26 Method for classifying patterns in image data records

Country Status (3)

Country Link
EP (1) EP2622540A1 (en)
DE (1) DE102010046867A1 (en)
WO (1) WO2012052106A1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845417A (en) * 2017-01-20 2017-06-13 上海交通大学 Feature based pondization and the high-resolution remote sensing image sorting technique except normalization expression
CN107220977A (en) * 2017-06-06 2017-09-29 合肥工业大学 The image partition method of Validity Index based on fuzzy clustering
CN107392952A (en) * 2017-07-19 2017-11-24 天津大学 It is a kind of to mix distorted image quality evaluating method without reference

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036300A (en) * 2014-06-18 2014-09-10 西安电子科技大学 Mean shift segmentation based remote sensing image target identification method
CN109255781B (en) * 2018-09-03 2021-11-30 河海大学 Object-oriented multispectral high-resolution remote sensing image change detection method

Non-Patent Citations (19)

* Cited by examiner, † Cited by third party
Title
CHEN C H ET AL: "The Handbook of Pattern Recognition and Computer Vision (2nd Edition)", 1 January 1998, WORLD SCIENTIFIC PUBLISHING CO., article TUCERYAN M ET AL: "Chapter 2.1, Texture Analysis", XP002249451 *
CHITRE, Y., DHAWAN, A.P.: "M-band wavelet discrimination of natural textures", PATTERN RECOGNITION, vol. 32, 1999, pages 773 - 789, XP004222746, DOI: doi:10.1016/S0031-3203(98)00111-3
GONZALEZ, R. C., WOODS, R. E.: "Digital Image Processing", 2008, PEARSON EDUCATION, INC. PEARSON PRENTICE HALL
HARALICK, R. M.: "Statistical and Structural Approaches to Texture", PROCEEDINGS OF THE.LEEE, vol. 67, no. 5, 1979, pages 786 - 804, XP001149154
HIREMATH, P.S., SHIVASHANKAR, S.: "Wavelet Based Features for Texture Classification", GVIP JOURNAL, vol. 6, no. 3, 2006, pages 55 - 58
HYONG-EUK LEE ET AL: "Iterative Fuzzy Clustering Algorithm With Supervision to Construct Probabilistic Fuzzy Rule Base From Numerical Data", IEEE TRANSACTIONS ON FUZZY SYSTEMS, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 16, no. 1, 1 February 2008 (2008-02-01), pages 263 - 277, XP011195232, ISSN: 1063-6706, DOI: 10.1109/TFUZZ.2007.903314 *
KRAMER, 0.: "Computational Intelligence, Eine Einführung", 2009, SPRINGER VERLAG, pages: 75 - 99
KYPEROUNTAS ET AL: "Dynamic training using multistage clustering for face recognition", PATTERN RECOGNITION, ELSEVIER, GB, vol. 41, no. 3, 27 October 2007 (2007-10-27), pages 894 - 905, XP022317827, ISSN: 0031-3203, DOI: 10.1016/J.PATCOG.2007.06.017 *
MANDELBROT, B. B.: "Fractal Geometry of Nature", 1983, FREEMAN
MANTHALKAR, R., BISWAS, P.K., CHATTERJI, B.N.: "Rotation and scale invariant texture features using discrete wavelet packet transform", PATTERN RECOGNITION LETTERS, vol. 24, 2003, pages 2455 - 2462, XP004437197, DOI: doi:10.1016/S0167-8655(03)00090-4
PORTER, R., CANAGARAJAH, N.: "Robust rotation invariant texture classification: wavelet, Gabor filter and GMRF based schemes", IEE PROC.-VIS. IMAGE SIGNAL PROCESSING, vol. 144, no. 3, 1997, pages 180 - 188, XP006009045, DOI: doi:10.1049/ip-vis:19971182
See also references of EP2622540A1
TIZHOOSH, H. R.: "Fuzzy-Bildverarbeitung, Einführung in Theorie und Praxis", 1998, SPRINGER-VERLAG
TUCERYAN, M., JAIN, A. K.: "The Handbook of Pattern Recognition and Computer Vision", 1998, WORLD SCIENTIFIC AND PUBLISHING CO., pages: 207 - 248
VON CHITRE, Y., DHAWAN, A.P.: "M-band wavelet discrimination of natural textures", PATTERN RECOGNITION, vol. 32, 1999, pages 773 - 789, XP004222746, DOI: doi:10.1016/S0031-3203(98)00111-3
WU, J., ROTATION INVARIANT CLASSIFICATION OF 3D SURFACE TEXTURE USING PHOTOMETRIC STEREO. THESIS SUBMITTED FOR THE DEGREE OF DOCTOR OF PHILOSOPHY, DEPARTMENT OF COMPUTER SCIENCE, SCHOOL OF MATHEMATICAL AND COMPUTER SCIENCES, 2003
ZHANG J ET AL: "Brief review of invariant texture analysis methods", PATTERN RECOGNITION, ELSEVIER, GB, vol. 35, no. 3, 1 March 2002 (2002-03-01), pages 735 - 747, XP004323409, ISSN: 0031-3203, DOI: 10.1016/S0031-3203(01)00074-7 *
ZHANG, J, TAN, T.: "Brief review of invariant texture analysis methods", PATTERN RECOGNITION, vol. 35, 2002, pages 735 - 747, XP004323409, DOI: doi:10.1016/S0031-3203(01)00074-7
ZHANG, J., TAN, T.: "Brief review of invariant texture analysis methods", PATTERN RECOGNITION, vol. 35, 2002, pages 735 - 747, XP004323409, DOI: doi:10.1016/S0031-3203(01)00074-7

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106845417A (en) * 2017-01-20 2017-06-13 上海交通大学 Feature based pondization and the high-resolution remote sensing image sorting technique except normalization expression
CN106845417B (en) * 2017-01-20 2019-11-08 上海交通大学 Based on feature poolization and the high-resolution remote sensing image classification method except normalization expression
CN107220977A (en) * 2017-06-06 2017-09-29 合肥工业大学 The image partition method of Validity Index based on fuzzy clustering
CN107220977B (en) * 2017-06-06 2019-08-30 合肥工业大学 The image partition method of Validity Index based on fuzzy clustering
CN107392952A (en) * 2017-07-19 2017-11-24 天津大学 It is a kind of to mix distorted image quality evaluating method without reference
CN107392952B (en) * 2017-07-19 2019-12-06 天津大学 no-reference mixed distortion image quality evaluation method

Also Published As

Publication number Publication date
EP2622540A1 (en) 2013-08-07
DE102010046867A1 (en) 2012-03-29

Similar Documents

Publication Publication Date Title
EP0780002B1 (en) Process and apparatus for reconstructing raster-shaped line structures
DE60223982T2 (en) Coding of concentric data
DE60036082T2 (en) METHOD AND DEVICE FOR RECONSTRUCTING TEXTURE IMAGES
DE4406020C1 (en) Automatic digital image recognition system
EP1444654A2 (en) Quantitative analysis, visualization and movement correction in dynamic processes
DE102006010607A1 (en) Object localization method, involves calculating probability values for limitation boxes in input image based on probability that object is arranged in these locations, and selecting box with highest probability as location of object
EP2622540A1 (en) Method for classifying patterns in image data records
DE19928231C2 (en) Method and device for segmenting a point distribution
DE10251787A1 (en) Detecting point correspondences in point quantities for fingerprint verification, involves determining potential association pairs with points from two point quantities and maximum number of pairs
EP0886833B1 (en) Process for capturing and recording individuals facial data and the use of such data for determining or confirming the identity of persons
EP1766579A2 (en) Method for detecting geometrical structures in images
DE10260642B4 (en) Method for creating a reference for fingerprints and comparing fingerprints
EP2096578A2 (en) Method and device for characterising the formation of paper
EP0843864B1 (en) Method of classification and recognition of patterns according to which a signature is produced by smoothing a polygon outline
DE102023107278B3 (en) Method for authenticating a banknote having at least one printed area on its substrate
DE102004018174B4 (en) Method of acquiring forms from images with cases and case-based recognition of objects in digital images, computer program product and digital storage medium for carrying out this method
DE10361838B3 (en) Assessing real object similarities involves generating supporting point vector sets with parameterized object data, transforming according to base functions to determine complex coefficients, grouping into characteristic vector components
DE102008025213A1 (en) Method for segmenting fingerprint images
DE102004018171B4 (en) A method for acquiring shapes from images of airborne germs and / or pollen and for case-based recognition of those objects in digital images, computer program product and digital storage medium for carrying out this method
EP0964391A2 (en) Device for the verification of signals
EP1220141B1 (en) Method for creating references and for comparing fingerprints
DE10213578A1 (en) Process for archiving digital images
DE202022101842U1 (en) A handwritten text recognition system using Brain Net and artificial intelligence
DE112022001435T5 (en) PARTIAL SEARCH DEVICE, PARTIAL SEARCH PROGRAM AND PARTIAL SEARCH METHOD
DE102021202566A1 (en) Device and in particular computer-implemented method for determining a similarity between data sets

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11771014

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2011771014

Country of ref document: EP