WO2011048219A2 - Methode et systeme pour evaluer la ressemblance d'un objet requete a des objets de reference - Google Patents

Methode et systeme pour evaluer la ressemblance d'un objet requete a des objets de reference Download PDF

Info

Publication number
WO2011048219A2
WO2011048219A2 PCT/EP2010/065997 EP2010065997W WO2011048219A2 WO 2011048219 A2 WO2011048219 A2 WO 2011048219A2 EP 2010065997 W EP2010065997 W EP 2010065997W WO 2011048219 A2 WO2011048219 A2 WO 2011048219A2
Authority
WO
WIPO (PCT)
Prior art keywords
data
class
regions
user
similarity
Prior art date
Application number
PCT/EP2010/065997
Other languages
English (en)
Other versions
WO2011048219A3 (fr
Inventor
Mickael Aupetit
Sylvain Lespinats
Original Assignee
Commissariat A L'energie Atomique Et Aux Energies Alternatives
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Commissariat A L'energie Atomique Et Aux Energies Alternatives filed Critical Commissariat A L'energie Atomique Et Aux Energies Alternatives
Priority to US13/503,621 priority Critical patent/US9576223B2/en
Priority to JP2012534714A priority patent/JP2013508840A/ja
Priority to CA2778651A priority patent/CA2778651C/fr
Priority to EP10768037A priority patent/EP2491518A2/fr
Publication of WO2011048219A2 publication Critical patent/WO2011048219A2/fr
Publication of WO2011048219A3 publication Critical patent/WO2011048219A3/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2137Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on criteria of topology preservation, e.g. multidimensional scaling or self-organising maps
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Definitions

  • the present invention provides a method and system for evaluating the similarity of a request object to reference objects. It applies for example in the field of pattern recognition.
  • the object can be a material object, an individual, the state of a system, or a group of such objects, individuals or states, whose physical characteristics are measured.
  • Discriminators are used to classify objects, that is, to make a decision about whether an object belongs to a class or to several predefined classes of objects. For example, the physical characteristics of a patient's condition are measured, such as height, weight, age, blood pressure, and body temperature. This patient is the object query or patient query. The measured values are then provided to a discriminator, who compares these characteristics with those of other patients identified as suffering from a particular disease. These other patients are reference objects or reference patients. Diseases are classes. The discriminator attributes to the patient the same illness as that of the closest reference patients in the sense of a proximity measure based on the characteristics measured. Such applications are used for decision support, they can even do without the opinion of the expert.
  • decision support systems propose to associate a confidence index with the decision made by the discriminator.
  • the proposed decision is not explicit, the system behaves like a black box, but it provides the user with a clue supposed to reassure him on the quality of this decision.
  • This index can be of probabilistic nature, or obtained by the relative comparison of the decisions of several different discriminators.
  • this index is obtained by a relatively complex process from the point of view of the non-specialist user of discrimination methods.
  • the broader system of discrimination that provides both a decision and a confidence index for this decision is a judge and a party, which is not conducive to inspiring user confidence.
  • Other decision support systems are based on the explanation of the decision made by the discriminator in intelligible terms by the user.
  • fuzzy inference systems explain their decision as the result of a weighted sum of logical rules directly implicating the original characteristics of the objects, these quantities and their combination being assumed to be easy to interpret by the user.
  • the number of rules and parameters is often important, which greatly reduces the intelligibility of the system.
  • the projection methods induce a loss of information called false neighborhood or glue, which artificially brings artifacts closer to the extent of their similarity.
  • false neighborhoods exist either because it is technically impossible to respect all the similarities during the projection, or because, although it is technically possible, the projection method could not find this solution.
  • the user can assign to a request object the majority class of surrounding objects on the map, even if these objects are falsely close to the request object.
  • the reference objects close to the request object in the form of a list of reference objects ordered according to their decreasing proximities to the request object.
  • search engines on the Internet where a query results in the display of a list of reference internet pages, ordered by proximity to the query.
  • the list of reference objects presented to the user is dependent on the query used on the one hand, and has a linear order on the other hand.
  • the request results in the display of a set of reference web pages ordered in the form of groups on a flat map and highlighted graphically (color, size ...) so as to signify their proximity to the query.
  • the card presented to the user depends on the request.
  • the user can not build a stable mental representation of the universe of reference objects, this universe never being presented to him completely or independently of the request. He can not judge for himself the quality of the proximity information to the request, which is presented to him. Nor can it easily apprehend the similarities or differences between the query objects translated by their representation in terms of reference objects, since it does not have a fixed base of comparison.
  • the object of the invention is notably to allow the user to obtain a stable mental representation of the universe of the reference objects independently of the request object.
  • the invention proposes to cut the card into disjoint zones each associated with a reference object, and to indicate to the user in each zone, the degree of resemblance between the request object and the reference object of this zone.
  • the subject of the invention is a method for evaluating the class of test data in a data space of dimension D where D> 3, each data item belonging to at least one class containing one or more data.
  • the method includes a step of projecting a reference dataset of the data space into a Q dimension space where Q ⁇ D, the class of each reference datum being known.
  • the method also includes a step of calculating a measure of similarity of the test data to each of the reference data.
  • the method also includes a step of partitioning the projection space into a plurality of disjoint regions each containing the projection of one and only one reference datum.
  • the method includes a step of evaluating the class of the test data, this class being evaluated as being the same class as one of the reference data contained in one of the regions containing the reference data closest to the data item. test in the sense of the similarity measure. Indeed, these regions are the regions most likely to contain a projection of the test data.
  • the data may be digitized data
  • the digitized data may include one or more physical feature measurements of an object, whether it is a hardware object or a group of hardware objects, or whether it is an individual or a group of individuals, or whether it is a state of a system or a group of states of a system, whose characteristics physical properties can be measured.
  • the reference data can be projected into the projection space so as to minimize a function dependent on the similarity measure between the reference data and the distance between the projections of said reference data, so as to preserve, in the projection space, the spatial organization of the reference data.
  • the regions may be the Voronoi regions associated with projections of the reference data in the projection space.
  • the data can be digitized handwritten characters, the classes can group identical characters, each data can be defined by a pixel vector.
  • the data can be digitized seismic curves, a class that can group the curves whose recording corresponds to an earthquake and another class that can group the curves whose recording does not correspond to an earthquake. Earth.
  • the data can be digital photographs of melanomas, a class that can group the photographs of malignant melanomas, and another class that can group the benign melanoma photographs.
  • the present invention also provides a method for assisting a user in deciding the class of test data in a data space of dimension D where D> 3, each data belonging to a class containing one or more data.
  • the method comprises a step according to the invention for evaluating the class of the test data, as well as a step of presenting the user with the regions containing the projections of the reference data which are the closest to the test data. sense of the similarity measure.
  • the region containing the projection of the reference datum that is closest to the test datum in the sense of the similarity measure can be presented to the user by using a predefined color to represent it.
  • the regions containing the projections of the reference data that are closest to the test data in the sense of the similarity measure can be presented to the user by using predefined colors to represent them, so as to represent the regions in descending order of similarity with the test data.
  • the method may comprise a step of assigning the user of a class to the test data item, the class assigned by the user to the test data item may or may not be the class of a reference datum contained. in one of the regions presented to the user.
  • the present invention also relates to a pattern recognition device, characterized in that it implements a method according to the invention.
  • the present invention also relates to a system for evaluating the class of a test data in a data space of dimension D where D> 3, each data belonging to at least one class containing one or more data.
  • the system includes a projection module of a reference dataset of the data space in a Q dimension space where Q ⁇ D, the class of each reference datum being known.
  • the system also includes a module for calculating a measure of similarity of the test data to each of the reference data.
  • the system also includes a partitioning module of the projection space into a plurality of disjoint regions each containing the projection of one and only one reference datum.
  • the system also includes a class evaluation module of the test data, which class is evaluated as being the same class as one of the reference data contained in one of the regions containing the reference data closest to the data item. test in the sense of the similarity measure. Indeed, these regions are the regions most likely to contain a projection of the test data.
  • the data may be digitized data
  • the digitized data may include one or more physical feature measurements of an object, whether it is a hardware object or a group of hardware objects, or whether it is an individual or a group of individuals, or whether it is a state of a system or a group of states of a system, whose characteristics physical properties can be measured.
  • the reference data can be projected into the projection space so as to minimize a function dependent on the similarity measure between the reference data and the distance between the projections of said reference data, so as to preserve, in the projection space, the spatial organization of the reference data.
  • the regions may be the Voronoi regions associated with projections of the reference data in the projection space.
  • the data can be digitized handwritten characters, the classes can group identical characters, each data can be defined by a pixel vector.
  • the data can be digitized seismic curves, a class that can group the curves whose recording corresponds to an earthquake and another class that can group the curves whose recording does not correspond to an earthquake. Earth.
  • the data can be digital photographs of melanomas, a class that can group the photographs of malignant melanomas, and another class that can group the benign melanoma photographs.
  • the present invention also provides a system for assisting a user in deciding the class of test data in a data space of dimension D where D> 3, each data belonging to a class containing one or more data.
  • the system comprises a module according to the invention for evaluating the test data class and a module for presenting the user with the regions containing the projections of the reference data that are closest to the test data in the sense of the measure of similarity.
  • the region containing the projection of the reference datum that is closest to the test datum in the sense of the similarity measure can be presented to the user by using a predefined color to represent it.
  • the regions containing the projections of the reference data that are closest to the test data in the sense of the similarity measure can be presented to the user by using predefined colors to represent them, so as to represent the regions in descending order of similarity with the test data.
  • the system may comprise a module for assigning the user of a class to the test data, the class assigned by the user to the test data which may or may not be the class of reference data contained in one of the regions presented to the user.
  • the main advantages of the invention are that it provides, from a map of the reference objects, a graphical means that makes all the similarities between the request object and the reference objects immediately intelligible to the user without inducing choice a priori.
  • another advantage of the invention is that it does not provide a decision: the user knows that he remains indispensable in his decision-making role, which is conducive to maintaining a sense of responsibility towards him of decision. Similarly, if he wished to evade moral or legal obligations, by using the facility of relying on a decision provided by an automatic system, he does not have that possibility with him. invention. This lack of automatic decision is also conducive to the user projecting on the method a collaborative behavior rather than competitive, likely to increase the confidence it has in it.
  • a system implementing the method according to the invention can be implemented on most computers equipped with a graphic display device.
  • the relative positioning of the reference objects together with their similarity measurement to the request object advantageously makes it possible to order the degree of resemblance of the request object to the reference objects, no longer only according to the measurement of the degree of similarity between the request object and reference objects, but according to both this degree of similarity and the relative similarities between reference objects themselves.
  • the representation space of the reference objects obtained by the method according to the invention makes it possible to determine groups of objects of similar reference in terms of their position in the projection base, each of these groups containing reference objects resembling to a certain degree the query object in terms of the similarity measure. From these groups, it is possible, for example, to assign to the request object the most significant class in the reference object group that is the most similar to the request object, then to assign the second most the request object is the most significant class in the second group of reference objects most similar to the request object, and so for the existing G groups.
  • the representation space of the reference objects obtained by the method according to the invention thus allows this more accurate estimation of the similarity of the request object to the reference objects.
  • FIG. 1 bis, by a diagram, of the projection steps according to the invention
  • FIG. 2 another example of a data card that can be used to implement the invention
  • FIG. 1 illustrates an example of a map of animal species according to the invention.
  • a request object corresponding to the human species, not shown in FIG. 1 is characterized by a set of similarity measurements to reference objects, each object corresponding to another animal species.
  • one reference object corresponds to the species of clams, another to the species of lobsters, another to the species of ladybugs, another to the species of bees, another to the species of kiwis, another to the species of soles, another to the species of haddocks, another to crows, gulls, catfish, dolphins, and toads, hamsters, another for the seal species, another for the piranha species, another for the hare species, another for the mole species, another for the goat species, another for the species of pumas and another species of gorillas.
  • the region around each reference object can be colored according to the proximity of the man to the corresponding species, this according to a given metric. Thanks to the invention, we can observe the proximity of
  • a set S contains N reference objects, which are described by a set of NxK similarity measures ... N between each object i of S and a query object q which does not belong to S.
  • the similarities z m iq are real numbers whose value is a function taking at least the argument object i considered and the object q.
  • z mi q can be obtained from a measure of distance defined between the objects i and q represented as vectors of D characteristics v, and v q defined in a base B D of IR D. It may possibly miss similarity values z mi q , the absence of value is then coded in a specific way.
  • the class of membership of the objects can possibly be provided, it can take the form of a value taken from C possible values, each identifying a class of membership.
  • the function f iz may depend on other parameters, but in any case it depends on at least z m iq .
  • the reference objects are positioned on a map, that is to say a metric space with Q dimensions defined by a base B Q , and the position of the reference object i is defined by a vector w, at Q components in B Q.
  • This positioning can be natural, the reference objects can already have coordinates for representation on the map. Otherwise, this positioning can be manual, performed by the user of the invention. Or this positioning can be automatic: similarity measurements between reference objects, or their position in the base B D , are then used to define the position in the base B Q of the reference objects.
  • the reference objects can be positioned on the map so as to minimize a function of the similarity measurements between the reference objects and distances between their projections on the map so as to preserve on the map the spatial organization of the objects.
  • this function being for example the weighted sum of the absolute values of the two-to-two differences raised to a power x between the measurement of similarity between the reference objects and the Euclidean distance between their projections on the map , the weighting being a function of the similarity measures between the reference objects and the distances between their projections on the map, for example to favor the preservation of small distances rather than large ones, and the power x being a real number.
  • each reference object i is represented by a region R, described below, whose position determines w.
  • a region R is defined whose appearance is parameterized by the K real numbers , ..., p iK ) - Specific appearances are associated with the different possible combinations of no value for these parameters.
  • the Voronoi region can be colored gray by the point of coordinates w, the luminous intensity of this gray being proportional to the value of a parameter p.
  • the Voronoi region of the point w can be colored from the color scale Red, Green, Blue, the color being defined by the value of three parameters pn, p i2 and p i3 in this scale. Parameters p can also be used to modify the shape or the size, for example, of the regions Ri. In other words, there is a possible step of calculating the appearance characteristics of the regions Ri (size, shape, color, texture, orientation, gloss) based on all available information, namely the set S reference objects in the form of their coordinates in the base B D or in the form of their coordinates in the base B Q , the set of similarity measures M of the request object to the reference objects, and the set of functions F.
  • the request object can be visualized by the appearance of the regions R 1.
  • This appearance can be determined by calculating the parameters p iz which are functions of z mi q and possibly any set of additional parameters. If z mi q has no value (missing value), the parameter p iz does not provide a value and a specific appearance is then used.
  • the reference objects S and the request object q not belonging to S can be described in the same base B D , from which, from a share the similarity measures M of each object i of S to the request object q defining the coordinates of q in the base B P are calculated as a function (for example the Euclidean distance) taking as argument the characteristics in B D of the The query object q and the objects of S, and on the other hand the characteristics of the objects of S in the base B Q are obtained by a projection method of these objects of S described in the base B D.
  • a function for example the Euclidean distance
  • the cartesian product of the base B Q and the base B P form a base B s in which each reference object S is described by its coordinates in the base B Q and by those in its base B P , in other words each object of S is described in the base B s by a set of characteristics obtained by projection its characteristics in B D , and a set of characteristics obtained by F functions for calculating its degree of similarity to the request object q.
  • the query object q does not exist as a set of characteristics in the base B s , it only appears implicitly in its degree of similarity to the reference objects.
  • the coordinates of each reference object in the base B s simultaneously carry its degree of similarity to the request object q in the part B P of B s and its degree of similarity to the other reference objects by its absolute position in the part B Q of B s which implicitly gives its position relative to the other reference objects in this base
  • a step of evaluating the degree of similarity of the object query to the reference objects can take place by a function taking as argument the characteristics of the only reference objects in the database B s without the necessity of projecting the query object q into the base B Q of B s .
  • the base B s can take a graphic form, the part B Q of B s giving for each reference object i its position on the screen, the part B P of B s giving the degree of resemblance of the request object q to this reference object i as a color or a specific appearance of a region R, positioned at the same place on the screen.
  • the method according to the invention can be seen as a method for transforming the reference objects S and the request object q described in the database B D to a classifying description of the reference objects in the base B s.
  • the degree of resemblance of the query object q to the reference objects S consubstanciel to their classification is expressed as such by the coordinates of the reference objects in the database.
  • the result of the classification by the method according to the invention is given as such by the value of the coordinates of the reference objects and indirectly of the request object in the base B s .
  • Figure 1a illustrates the steps of projection from B D to B Q and from B D to B P and the constitution of B s by the Cartesian product of B P and B Q , as well as the classification step of query object q in this base B s .
  • FIG. 2 illustrates an example of a data card that can be used to implement the invention in a decision support system, for example a handwritten character recognition system.
  • the objects can be thumbnails of handwritten figures of 8 x 8 pixels in grayscale. The thumbnails are separated into 10 balanced classes corresponding to the ten digits (0, 1, 2, 9).
  • the objective is to find the class of a thumbnail query, that is to say to determine the digit from 0 to 9 which is represented by a matrix of 8 by 8 pixels, this figure not being known a priori .
  • 300 reference thumbnails were arbitrarily selected in a public database.
  • the 300 images were positioned in a plane to form a map, so that the thumbnails are grouped on the map in areas.
  • Each zone can be easily delimited visually from the class of membership of the thumbnails it contains, that is to say, the handwritten number that represent the thumbnails it contains, this figure being known a priori.
  • FIGS. 3, 4 and 5 illustrate the same data card as the card of FIG. 2, the card being used to evaluate according to the invention the figures represented by three examples of request images.
  • the three thumbnails requests correspond to the thumbnails at the top left of Figures 3, 4 and 5, it is the number 0, the number 1 and the letter x respectively. It should be understood that, in accordance with the invention, these three thumbnail requests are not positioned on the map illustrated by FIGS. 3, 4 and 5.
  • each thumbnail can be defined by a vector with 64 values in [0,1], each value in [0, 1] representing the luminous intensity of a pixel.
  • the regions for viewing may be the Voronoi regions associated with each of the reference thumbnails.
  • the Voronoi region associated with a reference thumbnail contains the entire points of the plane that are closer to the point representing this thumbnail on the map than to any other point representing a thumbnail. Then, on presentation of a request thumbnail, the Voronoi regions are colored to visualize the similarity between the object query considered and each reference object.
  • This similarity is determined from the similarity measures M, which can be, in this example, the Euclidean distance in the vector space of the 64-dimensional pixels.
  • the color can be all the more clear that the reference image is close to the small image request in the sense of the Euclidean distance.
  • a null Euclidean distance m (identical image) can be represented by a white region
  • a high Euclidean distance m can be represented by a black region.
  • the minimum Euclidean distance corresponding to a black region it is for example calculated for each reference thumbnail Euclidean distance to the 6 th nearest neighbor, the minimum distance that can be the maximum of the six distances calculated.
  • a Euclidean distance m greater than this minimum distance can be represented by the black color, the shorter Euclidean distances being able to be colored according to a level of color going from dark red (big m) to yellow orange, then to white (m nothing).
  • the request thumbnail represents the handwritten numeral 0, as illustrated by the box at the top left of FIG. 3, a group of neighboring regions appear unambiguously very thin, especially in yellow and in orange. These are the regions associated with reference thumbnails belonging to class 0. This indicates to the user that the query thumbnail probably belongs to this class, which is indeed the case.
  • the invention is therefore effective in the field of pattern recognition. In a generic application, it is an object with all the typical characteristics of a reference object. The decision is easy and the risk of error is low. As part of a decision support system, a "Nothing to report" warning signal could be issued to the user.
  • the request thumbnail represents the handwritten figure 1 illustrated by the box at the top left of FIG.
  • the query thumbnail represents the letter x, as illustrated by the box at the top left of Figure 5, that is to say a character that does not correspond to any reference thumbnail.
  • no region is cleared, which can be interpreted as an indication of an anomaly in the data presented.
  • the proposed invention easily allows the user to detect this anomaly.
  • this is a new atypical object that is not identifiable to the reference classes.
  • a thorough analysis is required, the creation of a new class is to consider.
  • a "Stop" warning signal could be issued to the user.
  • the request image is never positioned on the map, which avoids any visual contradiction between the artificial neighborhood that this positioning would induce and the real neighborhood provided by the similarity measures.
  • the invention only visualizes the real neighborhood provided by the similarity measures, so as to optimize the intelligibility of the information displayed.
  • a similarity measure is a function taking as argument two objects and parameters independent of these objects, such as for example a distance between two objects or an uncertainty on the distance between two objects, or a parameter d scale used to determine the dynamics of similarity measure values, such as its minimum and maximum.
  • Each reference object can be characterized by its position on the map and possibly by one or more similarity measures to all the other reference objects. At least one of the reference objects can be positioned manually or automatically on the map, possibly from the set of similarity measures, so as to allow visual apprehension. In order to facilitate the visual interpretation, it is recommended a positioning such that, in the first place, the more the objects of reference are similar according to an additional measure provided, the closer they are on the map, and secondly, the objects of the same class are close and those of different classes are distant from each other on the map. But the request object is never placed on the map.
  • one or more of the similarity measures between the request object and a reference object can be visualized on the map by a specific appearance, for example in terms of size, shape, color texture, or in the form of of a region associated with this reference object. This can be used to visualize the absence of measurement, or to visualize a similarity with its inaccuracy or uncertainty.
  • Reference objects may have none, one or more ordinal or numerical characteristics, whether continuous or discrete (furnace temperature, radar echo azimuth, number of wheels of a vehicle). Likewise, reference objects may have none, one or more nominal characteristics, such as name, gender, or class of membership. These additional features can be visualized on the map by a specific appearance, by example in terms of size, shape, texture, color, or as a region associated with this reference object.
  • the invention allows the user to visually and comprehensively grasp the proximity of the request object to the reference objects in terms of similarity. Thus, it helps him to make a decision as to the nature of this object and the treatment that may suit him.
  • the association of a cartographic visualization whose position of the reference objects is stable, a similarity measure to be displayed on the map, as well as the absence of positioning of the query object on the map make the invention more particularly exploitable in the field of decision support in discrimination and in the field of anomaly detection of a request object relative to reference objects.
  • the main advantage of the invention is that it presents a map of the reference objects such that the position of these objects or zones used to represent them is fixed and independent of the request object.
  • This map is therefore a stable basis for visual apprehension of the universe of reference objects, as well as easy memorization of this representation. This stability allows the user to focus on the similarities between the request object and the reference objects rather than between the reference objects themselves, since it is not disturbed by object position changes. reference.
  • the representation of the similarity between the request object and the reference objects by a visual parameter of these reference objects, other than their position offers an immediate visual perception of the most similar or the most different reference objects of the reference objects. the request object.
  • a system implementing the method according to the invention described above can be implemented on most computers equipped with a graphic display device.
  • the main advantage of the invention described above is that no decision is made: there is no confidence index, no combination of logical rules, nor any probability of global belonging to classes, all information which the user does not control the provenance and interpretation. It is the similarity measures between the request object and each reference object that are displayed. Above all, it is a measure of similarity between the request object and each reference object that is displayed, and not just a characteristic of the reference objects independent of the request object. This point is particularly advantageous when the objects have more than one characteristic, making it difficult to visualize on the same map these multiple characteristics for each object and complicating the visual comparison with the characteristics of the request object.
  • the invention makes it possible to visualize, without deformation, the raw similarity measurements provided as input.
  • the measure will be known to the user or at least it will be intelligible: there is no bias due to another treatment not controlled by the user. This renders intelligible the information displayed and is conducive to the user having confidence in this information.
  • the invention also applies to objects that do not necessarily have a natural representation in the form of a card, because the representation of the resemblance between the request object and the reference objects does not depend on this positioning.
  • the invention can therefore not only be applied to objects positioned on the card by any automatic or manual means, but it can also be applied to objects whose graphic representation in the form of a card is predefined, such as the borders of the card.
  • each zone corresponds to a reference object.
  • the displayed measurement is a measure of similarity between the request object and the reference objects, which makes it possible to position the first mentally relative to the second, whereas the cards according to the prior art represent information specific to the reference objects represented. regardless of the request object.
  • the fields of application of the invention are vast, the method according to the invention being generic and can therefore be applied to any field involving a decision support system in discrimination, including shape recognition systems.
  • the invention is applicable in the field of medical diagnostic aid, such as the diagnosis of melanoma.
  • diagnosis of melanoma is very difficult for general practitioners.
  • Decision support tools can assist general practitioners in their choice to send or not to consult a dermatologist.
  • the "query" melanoma stains reference melanomas and allows the doctor to determine its severity.
  • the invention is applicable in the field of the search for the origin of seismic events, such as the determination of their natural or anthropogenic origin (e.g. career shots). It is a routine work done by geophysical analysts from signals captured on multiple measurement stations. The analyst visualizes a map of the events usually encountered, grouped spatially according to their origin. The event being analyzed colors similar reference events on the map, thus helping the analyst to determine the origin of the event.
  • origin of seismic events such as the determination of their natural or anthropogenic origin (e.g. career shots).
  • the invention is applicable in the field of marketing, such as customer behavior analysis.
  • Reference customers can be viewed and grouped by category on a map, with each category corresponding to a particular target to whom specific advertising messages are sent.
  • a new customer is visualized according to their proximity to the reference customers, which makes it possible to recognize the category or categories of which it is the closest.
  • the invention is applicable in the field of risk assessment in credit, stock market or insurance. It is a question of assessing the risks of drifting of the financial situation of a customer to define the type of credit or the rate of risk to be applied to him.
  • the invention is applicable in the field of biometrics.
  • An individual can be identified by a photograph of his face or a fingerprint. These elements can be compared to those of reference positioned on a map. The interviewer analyst quickly sees if the individual is similar to one or more reference individuals or conversely completely new.
  • the invention is applicable in the field of industrial or computer security.
  • the operator responsible for monitoring the operation of the plant displays a map of the different reference states usually measured during normal operation.
  • the current state of operation is displayed as a coloring of the reference states related to their similarity to this current state. If the current state appears to move further and further away from the reference states, the operator sees it and initiates the appropriate shutdown, evacuation or simple control procedures.
  • an intruder can be detected in a computer system whose behavior does not resemble normal referenced behavior.
  • the invention is applicable in the field of transport, logistics or predictive maintenance. It is then a matter of monitoring the state of the flows and visual detection of drifts compared to a reference situation.
  • the invention is applicable in the field of classification of digital documents, Internet favorites, web pages or personal folders.
  • a user who visualizes a new website and wishes to add it to the list of his favorite sites is then presented sites already present in this list in the form of a map.
  • the new site then colors the preferred sites according to their similarity with it, which allows the user to decide on the most appropriate category or categories to classify it, or the creation of a new category.
  • the invention is applicable in the field of consumer assistance in the choice of a complex product defined by multiple features, such as a TV, a washing machine, a mobile phone, a computer, a car, a house, an insurance, an investment product, a mobile phone subscription.
  • typical package offers (references) are represented on a card, and the customer is asked to define his type of consumption (so his ideal package).
  • the invention then makes it possible to present to the customer the packages closest to his ideal package, the organization in card to clearly distinguish packages close to the ideal customer over others.
  • the invention then also makes it possible to distinguish the different families of packages that differ drastically according to characteristics that the customer would not have informed (price, internet option ). This allows the customer to focus on each of these families of offers very quickly and visualize "where" it is in the maquis information through the map.
  • thumbnails are for illustrative purposes only. Indeed, the present invention is also applicable to all kinds of data, including digitized data. These digitized data may include physical characteristics measurements taken on a wide variety of objects other than photos, be they physical objects, individuals, system states, or even a group. such objects, individuals or states, whose physical characteristics are measured.
  • these digitized data may include scalars, i.e., real numbers, such as measurements provided by a sensor.
  • these digitized data can also include symbols (element of an alphabet) as an elementary value of a finite set (letter of a word, name of an object, etc.).
  • These digitized data can also include vectors, such as a measurement of a sensor accompanied by its uncertainty or a set of measurements from a sensor network or a signal (sequence of measurements, flows, etc.) or a set of values from a database or a word, a sentence, a text or a set of standardized measures (proportions) or any set of scalar or symbolic data.
  • vectors such as a measurement of a sensor accompanied by its uncertainty or a set of measurements from a sensor network or a signal (sequence of measurements, flows, etc.) or a set of values from a database or a word, a sentence, a text or a set of standardized measures (proportions) or any set of scalar or symbolic data.
  • These digitized data can also include matrices, such as a black-and-white flat image or a set of signals from a sensor network or genetic data or any set of vector data.
  • This digitized data may also include multi-dimensional arrays, such as a sequence of images (video) or a multi-spectral image (satellite image) or a color image (photograph, simulation result) or a 3D image (scanner) or a multi-dimensional mesh (simulation model) or any set of matrix data or smaller multi-dimensional arrays.
  • multi-dimensional arrays such as a sequence of images (video) or a multi-spectral image (satellite image) or a color image (photograph, simulation result) or a 3D image (scanner) or a multi-dimensional mesh (simulation model) or any set of matrix data or smaller multi-dimensional arrays.
  • This digitized data can also include graphs and networks, such as a social network or the Internet or a transport network (road traffic, information, energy, etc.) or a network of interactions (proteins, genes) or a network of sensors or a numerical modeling mesh (modeling 2D, 3D, 3D with the time, etc).
  • graphs and networks such as a social network or the Internet or a transport network (road traffic, information, energy, etc.) or a network of interactions (proteins, genes) or a network of sensors or a numerical modeling mesh (modeling 2D, 3D, 3D with the time, etc).
  • digitized data may also include cellular complexes or hypergraphs, such as a digital modeling mesh (virtual objects, multi-physics modeling, animation films) or biological or molecular or physical or climate or mechanical or chemical models.
  • a digital modeling mesh virtual objects, multi-physics modeling, animation films
  • biological or molecular or physical or climate or mechanical or chemical models such as a digital modeling mesh (virtual objects, multi-physics modeling, animation films) or biological or molecular or physical or climate or mechanical or chemical models.
  • This digitized data can also include complex data such as multimedia documents (organized set of texts, videos, audio signals, etc.) or a collection of documents or any set of organized documents (library).
  • multimedia documents organized set of texts, videos, audio signals, etc.
  • library any set of organized documents
  • This digitized data may also include service subscription contracts, such as telephone subscription contracts, for example.
  • service subscription contracts such as telephone subscription contracts, for example.
  • the method and the system according to the present invention could then advantageously make it possible to choose the most suitable telephone package according to the profile of the user.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Library & Information Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

La présente invention concerne une méthode et un système pour évaluer la classe d'une donnée de test dans un espace de données de dimension D où D ≥ 3, chaque donnée appartenant à au moins une classe regroupant plusieurs données. La méthode comporte une étape de projection d'un jeu de données de référence de l'espace de données dans un espace de dimension Q où Q < D, la classe de chaque donnée de référence étant connue. La méthode comporte également une étape de calcul d'une mesure de similarité de la donnée de test à chacune des données de référence. La méthode comporte également une étape de partitionnement de l'espace de projection en une pluralité de régions disjointes contenant chacune la projection d'une et une seule donnée de référence. La méthode comporte enfin une étape d'évaluation de la classe de la donnée de test, cette classe étant évaluée comme étant la même classe qu'une des données de référence contenue dans une des régions contenant les données de référence les plus proches de la donnée de test au sens de la mesure de similarité. En effet, ces régions sont les régions les plus susceptibles de contenir une projection de la donnée de test. Application : aide à la décision en discrimination, reconnaissance de formes, détection d'anomalies

Description

Méthode et système pour évaluer la ressemblance d'un objet requête à des objets de référence
La présente invention concerne une méthode et un système pour évaluer la ressemblance d'un objet requête à des objets de référence. Elle s'applique par exemple dans le domaine de la reconnaissance de formes. Par exemple, l'objet peut être un objet matériel, un individu, l'état d'un système, ou encore un groupe de tels objets, individus ou états, dont on mesure des caractéristiques physiques.
Les discriminateurs permettent de classifier des objets, c'est-à- dire de prendre une décision sur l'appartenance d'un objet à une classe ou à plusieurs classes prédéfinies d'objets. Par exemple, les caractéristiques physiques de l'état d'un patient sont mesurées, comme sa taille, son poids, son âge, sa tension et sa température corporelle. Ce patient est l'objet requête ou patient requête. Les valeurs mesurées sont ensuite fournies à un discriminateur, qui compare ces caractéristiques à celles d'autres patients identifiés comme souffrant de telle ou telle maladie. Ces autres patients sont les objets de référence ou patients de référence. Les maladies sont les classes. Le discriminateur attribue au patient requête la même maladie que celle des patients de référence les plus proches au sens d'une mesure de proximité basée sur les caractéristiques mesurées. De telles applications sont utilisées pour l'aide à la décision, elles peuvent même permettre de se passer de l'avis de l'expert. Mais elles peuvent aussi fournir à l'expert une classe d'appartenance qui le conforte ou non dans le diagnostic qu'il porte sur le patient et qui peut l'inciter à une analyse plus fine en cas de désaccord. Cependant, l'intelligibilité du résultat du discriminateur est cruciale pour que l'expert puisse avoir confiance en celui-ci et que l'aide soit utile et efficace. Afin d'obtenir la confiance de l'utilisateur, des systèmes d'aide à la décision proposent d'associer un indice de confiance à la décision prise par le discriminateur. La décision proposée n'est pas explicitée, le système se comportant comme une boîte noire, mais il fournit à l'utilisateur un indice censé le rassurer sur la qualité de cette décision. Cet indice peut être de nature probabiliste, ou encore obtenu par la comparaison relative des décisions de plusieurs discriminateurs différents. Dans tous les cas, cet indice est obtenu par un processus relativement complexe du point de vue de l'utilisateur non spécialiste des méthodes de discrimination. D'une certaine manière, le système de discrimination au sens large qui fournit à la fois une décision et un indice de confiance pour cette décision est juge et partie, ce qui n'est pas propice à inspirer la confiance de l'utilisateur. D'autres systèmes d'aide à la décision sont basés sur l'explicitation de la décision prise par le discriminateur en termes intelligibles par l'utilisateur. Par exemple, les systèmes d'inférence floue expliquent leur décision comme le résultat d'une somme pondérée de règles logiques impliquant directement les caractéristiques d'origine des objets, ces grandeurs et leur combinaison étant supposées faciles à interpréter par l'utilisateur. Cependant, afin d'obtenir une discrimination de bonne qualité, le nombre de règles et de paramètres est souvent importants, ce qui diminue beaucoup l'intelligibilité du système. Enfin, d'autres systèmes d'aide à la décision fournissent une probabilité d'appartenance à différentes classes. Dans ce cas, la décision prise par le discriminateur n'est pas unique et le système ne décide pas de l'attribution d'une classe en particulier. Le choix d'une classe pour l'objet requête est laissé à la sagacité de l'utilisateur, qui peut s'aider de ces probabilités. Cependant, les probabilités sont attribuées aux classes dans leur ensemble, sans explicitation du processus qui permet le passage des objets de références à leurs classes d'appartenance. Ainsi, bien que le nombre de probabilités à appréhender soit réduit, puisqu'il est égal au nombre de classes, le processus de calcul de ces probabilités reste inconnu pour l'utilisateur. Donc l'information est globalement peu intelligible pour lui.
Dans ces trois cas de discriminateur selon l'art antérieur, bien que le but initial soit d'assister le travail de l'utilisateur, on lui demande en réalité d'acquérir une compétence supplémentaire dans le domaine de la discrimination automatique. En effet, l'intelligibilité du système pour l'utilisateur dépend de sa compréhension des méthodes souvent sophistiquées employées pour générer la décision.
Outre l'utilisation de discriminateurs pour résoudre des problèmes de classification d'objets, il existe également des méthodes de visualisation des objets et des classes pour analyser la structure de classes ou encore qualifier des projections. Ces méthodes de visualisation peuvent par exemple s'appuyer sur des méthodes de projection des objets permettant notamment de représenter les objets et les classes sur une carte plane. La position des objets sur cette carte est telle que les objets qui se ressemblent d'après une mesure de similarité sont plutôt proches sur la carte. Réciproquement, des objets peu similaires sont plutôt éloignés l'un de l'autre sur la carte. Un objet requête peut alors être positionné sur cette carte par le même principe en tenant compte de sa similarité aux objets de référence déjà positionnés. Outre le problème technique du positionnement de cet objet requête par rapport aux autres, se pose le problème d'interprétation de cette position en termes de classe d'appartenance. En effet, qu'elles tiennent compte des classes ou non, les méthodes de projection induisent une perte d'information appelée faux voisinage ou recollement, qui rapproche artificiellement des objets en fait éloignés d'après la mesure de leur similarité. Ces faux voisinages existent soit parce qu'il est techniquement impossible de respecter l'ensemble des similarités lors de la projection, soit parce que bien qu'elle soit techniquement possible, la méthode de projection n'a pas su trouver cette solution. Ainsi, l'utilisateur peut attribuer à un objet requête la classe majoritaire des objets environnants sur la carte, même si ces objets sont faussement proches de l'objet requête.
Pour tenter de surmonter les problèmes liés aux faux-voisinages, des méthodes de diagnostic permettant de visualiser ces faux-voisinages ont été proposées, comme par exemple dans l'article "Visualizing distortions and recovering topology in continuous projection techniques" (Aupetit M., Neurocomputing, vol. 10, no. 7-9 pp. 1304-1330, 2007). Malheureusement, cette méthode ne permet pas d'évaluer la classe d'un objet requête à partir d'objets de référence appartenant à des classes connues. Ainsi, lorsqu'elle est mise en oeuvre pour qualifier une projection, la méthode manipule simplement des objets qui sont tous "sans étiquette", alors que lorsqu'elle est mise en oeuvre pour analyser la structure de classes, la méthode manipule simplement des objets qui sont tous "étiquetés".
Enfin, on peut aussi visualiser les objets de référence proche de l'objet requête sous forme d'une liste d'objets de référence ordonnés selon leurs proximités décroissantes à l'objet requête. C'est typiquement le cas dans les moteurs de recherche sur le réseau internet, où une requête entraîne l'affichage d'une liste de pages internet de référence, ordonnées par proximité à la requête. Dans ce cas, la liste d'objets de référence présentée à l'utilisateur est dépendante de la requête utilisée d'une part, et présente un ordre linéaire d'autre part. Dans certains moteurs de recherche sur le réseau internet, la requête entraîne l'affichage d'un ensemble de pages internet de référence ordonnées sous formes de groupes sur une carte plane et mises en valeur graphiquement (couleur, taille...) de façon à signifier leur proximité à la requête. Dans ce cas encore, la carte présentée à l'utilisateur dépend de la requête. Dans tous ces cas, la liste des objets de référence présentés, ainsi que leurs positions dans la représentation spatiale (carte) ou linéaire (liste ordonnée), dépendent de la requête. L'utilisateur ne peut donc pas construire une représentation mentale stable de l'univers des objets de référence, cet univers ne lui étant jamais présenté de façon complète ou indépendante de la requête. Il ne peut alors juger par lui-même de la qualité de l'information de proximité à la requête, qui lui est présentée. Il ne peut pas non plus appréhender facilement les ressemblances ou les différences entre les objets requêtes traduits par leur représentation en termes d'objets de référence, puisqu'il n'a pas de base fixe de comparaison.
L'invention a notamment pour but de permettre à l'utilisateur de se faire une représentation mentale stable de l'univers des objets de référence indépendamment de l'objet requête. Pour cela, l'invention propose de découper la carte en zones disjointes chacune associée à un objet de référence, et d'indiquer à l'utilisateur dans chaque zone, le degré de ressemblance entre l'objet requête et l'objet de référence de cette zone. Ainsi, il n'est pas nécessaire de positionner l'objet requête sur la carte, ni de définir une zone de la carte correspondant à l'objet requête. A cet effet, l'invention a pour objet une méthode pour évaluer la classe d'une donnée de test dans un espace de données de dimension D où D > 3, chaque donnée appartenant à au moins une classe contenant une ou plusieurs données. La méthode comporte une étape de projection d'un jeu de données de référence de l'espace de données dans un espace de dimension Q où Q < D, la classe de chaque donnée de référence étant connue. La méthode comporte également une étape de calcul d'une mesure de similarité de la donnée de test à chacune des données de référence. La méthode comporte également une étape de partitionnement de l'espace de projection en une pluralité de régions disjointes contenant chacune la projection d'une et une seule donnée de référence. La méthode comporte enfin une étape d'évaluation de la classe de la donnée de test, cette classe étant évaluée comme étant la même classe qu'une des données de référence contenue dans une des régions contenant les données de référence les plus proches de la donnée de test au sens de la mesure de similarité. En effet, ces régions sont les régions les plus susceptibles de contenir une projection de la donnée de test. Par exemple, les données peuvent être des données numérisées, les données numérisées pouvant inclure une ou plusieurs mesures de caractéristiques physiques d'un objet, qu'il s'agisse d'un objet matériel ou d'un groupe d'objets matériels, ou qu'il s'agisse d'un individu ou d'un groupe d'individus, ou qu'il s'agisse d'un état d'un système ou d'un groupe d'états d'un système, dont des caractéristiques physiques peuvent être mesurées.
Avantageusement, les données de référence peuvent être projetées dans l'espace de projection de manière à minimiser une fonction dépendant de la mesure de similarité entre les données de référence et de la distance entre les projections desdites données de référence, de sorte à préserver, dans l'espace de projection, l'organisation spatiale des données de référence.
Par exemple, les régions peuvent être les régions de Voronoï associées aux projections des données de référence dans l'espace de projection. Par exemple, les données peuvent être des caractères manuscrits numérisés, les classes pouvant regrouper les caractères identiques, chaque donnée pouvant être définie par un vecteur de pixels.
Dans un mode de réalisation, les données peuvent être des courbes sismiques numérisées, une classe pouvant regrouper les courbes dont l'enregistrement correspond à un tremblement de terre et une autre classe pouvant regrouper les courbes dont l'enregistrement ne correspond pas à un tremblement de terre.
Dans un autre mode de réalisation, les données peuvent être des photographies numériques de mélanomes, une classe pouvant regrouper les photographies de mélanomes malins et une autre classe pouvant regrouper les photographies de mélanomes bénins.
La présente invention a également pour objet une méthode pour aider un utilisateur à décider la classe d'une donnée de test dans un espace de données de dimension D où D > 3, chaque donnée appartenant à une classe contenant une ou plusieurs données. La méthode comporte une étape selon l'invention pour évaluer la classe de la donnée de test, ainsi qu'une étape de présentation à l'utilisateur des régions contenant les projections des données de référence qui sont les plus proches de la donnée de test au sens de la mesure de similarité.
Par exemple, la région contenant la projection de la donnée de référence qui est la plus proche de la donnée de test au sens de la mesure de similarité peut être présentée à l'utilisateur par utilisation d'une couleur prédéfinie pour la représenter.
Par exemple, les régions contenant les projections des données de référence qui sont les plus proches de la donnée de test au sens de la mesure de similarité peuvent être présentées à l'utilisateur par utilisation de couleurs prédéfinies pour les représenter, de manière à représenter les régions par ordre décroissant de similarité avec la donnée de test.
Avantageusement, la méthode peut comporter une étape d'attribution par l'utilisateur d'une classe à la donnée de test, la classe attribuée par l'utilisateur à la donnée de test pouvant être ou pas la classe d'une donnée de référence contenue dans l'une des régions présentées à l'utilisateur. La présente invention a également pour objet un dispositif de reconnaissance de formes, caractérisé en ce qu'il implémente une méthode selon l'invention.
La présente invention a également pour objet un système pour évaluer la classe d'une donnée de test dans un espace de données de dimension D où D > 3, chaque donnée appartenant à au moins une classe contenant une ou plusieurs données. Le système comporte un module de projection d'un jeu de données de référence de l'espace de données dans un espace de dimension Q où Q < D, la classe de chaque donnée de référence étant connue. Le système comporte également un module de calcul d'une mesure de similarité de la donnée de test à chacune des données de référence. Le système comporte également un module de partitionnement de l'espace de projection en une pluralité de régions disjointes contenant chacune la projection d'une et une seule donnée de référence. Le système comporte également un module d'évaluation de la classe de la donnée de test, cette classe étant évaluée comme étant la même classe qu'une des données de référence contenue dans une des régions contenant les données de référence les plus proches de la donnée de test au sens de la mesure de similarité. En effet, ces régions sont les régions les plus susceptibles de contenir une projection de la donnée de test.
Par exemple, les données peuvent être des données numérisées, les données numérisées pouvant inclure une ou plusieurs mesures de caractéristiques physiques d'un objet, qu'il s'agisse d'un objet matériel ou d'un groupe d'objets matériels, ou qu'il s'agisse d'un individu ou d'un groupe d'individus, ou qu'il s'agisse d'un état d'un système ou d'un groupe d'états d'un système, dont des caractéristiques physiques peuvent être mesurées.
Avantageusement, les données de référence peuvent être projetées dans l'espace de projection de manière à minimiser une fonction dépendant de la mesure de similarité entre les données de référence et de la distance entre les projections desdites données de référence, de sorte à préserver, dans l'espace de projection, l'organisation spatiale des données de référence. Par exemple, les régions peuvent être les régions de Voronoï associées aux projections des données de référence dans l'espace de projection.
Par exemple, les données peuvent être des caractères manuscrits numérisés, les classes pouvant regrouper les caractères identiques, chaque donnée pouvant être définie par un vecteur de pixels.
Dans un mode de réalisation, les données peuvent être des courbes sismiques numérisées, une classe pouvant regrouper les courbes dont l'enregistrement correspond à un tremblement de terre et une autre classe pouvant regrouper les courbes dont l'enregistrement ne correspond pas à un tremblement de terre.
Dans un autre mode de réalisation, les données peuvent être des photographies numériques de mélanomes, une classe pouvant regrouper les photographies de mélanomes malins et une autre classe pouvant regrouper les photographies de mélanomes bénins.
La présente invention a également pour objet un système pour aider un utilisateur à décider la classe d'une donnée de test dans un espace de données de dimension D où D > 3, chaque donnée appartenant à une classe contenant une ou plusieurs données. Le système comporte un module selon l'invention d'évaluation de la classe de donnée de test et un module de présentation à l'utilisateur des régions contenant les projections des données de référence qui sont les plus proches de la donnée de test au sens de la mesure de similarité.
Par exemple, la région contenant la projection de la donnée de référence qui est la plus proche de la donnée de test au sens de la mesure de similarité peut être présentée à l'utilisateur par utilisation d'une couleur prédéfinie pour la représenter.
Par exemple, les régions contenant les projections des données de référence qui sont les plus proches de la donnée de test au sens de la mesure de similarité peuvent être présentées à l'utilisateur par utilisation de couleurs prédéfinies pour les représenter, de manière à représenter les régions par ordre décroissant de similarité avec la donnée de test.
Avantageusement, le système peut comporter un module d'attribution par l'utilisateur d'une classe à la donnée de test, la classe attribuée par l'utilisateur à la donnée de test pouvant être ou pas la classe d'une donnée de référence contenue dans l'une des régions présentées à l'utilisateur.
L'invention a encore pour principaux avantages qu'elle fournit, à partir d'une carte des objets de référence, un moyen graphique qui rend immédiatement intelligible à l'utilisateur toutes les similarités entre l'objet requête et les objets de référence sans induire de choix a priori. Paradoxalement, un autre avantage de l'invention est qu'elle ne fournit pas de décision: l'utilisateur sait qu'il reste indispensable dans son rôle de décideur, ce qui est propice à maintenir chez lui un sentiment de responsabilité face à la prise de décision. De même, s'il souhaitait se dérober à des obligations morales ou légales, en usant de la facilité qu'il y a à s'en remettre à une décision fournie par un système automatique, il n'a pas cette possibilité avec l'invention. Cette absence de décision automatique est aussi propice à ce que l'utilisateur projette sur la méthode un comportement collaboratif plutôt que concurrentiel, susceptible d'accroître la confiance qu'il a en celle-ci. Enfin, un système implémentant la méthode selon l'invention peut être implémenté sur la plupart des ordinateurs munis d'un dispositif d'affichage graphique.
De plus, le positionnement relatif des objets de référence conjointement à leur mesure de similarité à l'objet requête, positionnement spécifique obtenu par exemple par une projection des objets de référence à partir de leur position dans un espace de base BD de dimension D ou à partir de leurs similarités relatives données par une matrice de similarité, permet avantageusement d'ordonner les degrés de ressemblance de l'objet requête aux objets de référence, non plus en fonction seulement de la mesure du degré de similarité entre l'objet requête et les objets de référence, mais en fonction à la fois de ce degré de similarité et des similarités relatives entre objets de référence eux-mêmes. Plus qu'une simple liste des objets de référence ordonnée par ordre décroissant de leur ressemblance à l'objet requête, l'espace de représentation des objets de référence obtenu par la méthode selon l'invention permet de déterminer des groupes d'objets de référence similaires en termes de leur position dans la base obtenue par projection, chacun de ces groupes contenant des objets de référence ressemblant à un certain degré à l'objet requête en terme de la mesure de similarité. A partir de ces groupes, il est possible par exemple d'attribuer à l'objet requête la classe la plus significative dans le groupe d'objets de référence les plus similaires à l'objet requête, puis d'attribuer comme seconde classe la plus ressemblante à l'objet requête la classe la plus significative dans le second groupe d'objets de référence les plus similaires à l'objet requête, et ainsi pour les G groupes existant. L'espace de représentation des objets de référence obtenu par la méthode selon l'invention permet donc cette estimation plus juste de la ressemblance de l'objet requête aux objets de référence.
D'autres caractéristiques et avantages de l'invention apparaîtront à l'aide de la description qui suit faite en regard de dessins annexés qui représentent :
- la figure 1 , par une carte de données, un exemple de mise en œuvre de l'invention;
- la figure 1 bis, par un diagramme, des étapes de projection selon l'invention ;
- la figure 2, un autre exemple de carte de données utilisable pour mettre en oeuvre l'invention;
- les figures 3, 4 et 5, par une même carte de données, des exemples de mise en œuvre de l'invention.
La figure 1 illustre un exemple de carte d'espèces animales selon l'invention. Un objet requête correspondant à l'espèce humaine, non représenté sur la figure 1 , est caractérisé par un ensemble de mesures de similarité à des objets de référence, chaque objet correspondant à une autre espèce animale. Ainsi, un objet de référence correspond à l'espèce des palourdes, un autre à l'espèce des homards, un autre à l'espèce des coccinelles, un autre à l'espèce des abeilles, un autre à l'espèce des kiwis, un autre à l'espèce des soles, un autre à l'espèce des haddocks, un autre à l'espèce des corneilles, un autre à l'espèce des goélands, un autre à l'espèce des poissons chats, un autre à l'espèce des dauphins, un autre à l'espèce des crapauds, un autre à l'espèce des hamsters, un autre à l'espèce des phoques, un autre à l'espèce des piranha, un autre à l'espèce des lièvres, un autre à l'espèce des taupes, un autre à l'espèce des chèvres, un autre à l'espèce des pumas et un autre à l'espèce des gorilles. Avantageusement, la région autour de chaque objet de référence peut être colorée en fonction de la proximité de l'homme à l'espèce correspondante, ceci selon une métrique donnée. Grâce à l'invention, on peut observer la proximité de l'homme aux mammifères, aux gorilles en particulier.
Pour cela, l'invention s'appuie notamment sur les principes qui suivent. Un ensemble S contient N objets de référence, qui sont décrits par un ensemble de NxK mesures de similarité
Figure imgf000013_0001
...N entre chaque objet i de S et un objet requête q qui n'appartient pas à S. Les similarités zmiq sont des nombres réels dont la valeur est une fonction prenant au moins en argument l'objet i considéré et l'objet q. Eventuellement, zmiq peut être obtenue à partir d'une mesure de distance définie entre les objets i et q représentés sous forme de vecteurs de D caractéristiques v, et vq définis dans une base BD de I RD. Il peut éventuellement manquer des valeurs de similarité zmiq, l'absence de valeur est alors codée de façon spécifique. La classe d'appartenance des objets peut éventuellement être fournie, elle peut prendre la forme d'une valeur prise parmi C valeurs possibles, chacune identifiant une classe d'appartenance.
Pour définir l'apparence de chaque objet i de S par rapport à l'objet requête q, on considère aussi un ensemble de K paramètres ph à piK, soit N vecteurs p, définis dans une base Bp de I RK, ainsi que K fonctions de zmiq, in à fiK définies sur I R et à valeur dans I R, ensemble de fonctions que nous appelons F, telles que pour tout z de 1 ... K, PiZ=fiZ(zmiq). La fonction fiz peut dépendre d'autres paramètres, mais elle dépend dans tous les cas au minimum de zmiq.
Les objets de référence sont positionnés sur une carte, c'est-à- dire un espace métrique à Q dimensions défini par une base BQ, ainsi la position de l'objet de référence i est définie par un vecteur w, à Q composantes dans BQ. Ce positionnement peut être naturel, les objets de référence pouvant déjà posséder des coordonnées permettant une représentation sur la carte. Sinon, ce positionnement peut être manuel, effectué par l'utilisateur de l'invention. Ou encore ce positionnement peut être automatique: des mesures de similarité entre objets de référence, ou encore leur position dans la base BD, sont alors utilisées pour définir la position dans la base BQ des objets de référence. Par exemple, les objets de référence peuvent être positionnés sur la carte de manière à minimiser une fonction des mesures de similarité entre les objets de référence et des distances entre leurs projections sur la carte de sorte à préserver sur la carte l'organisation spatiale des objets de référence dans la base BD, cette fonction pouvant par exemple être la somme pondérée des valeurs absolues des écarts deux à deux élevés à une puissance x entre la mesure de similarité entre les objets de référence et la distance euclidienne entre leurs projections sur la carte, la pondération étant une fonction des mesures de similarité entre les objets de référence et des distances entre leurs projections sur la carte, par exemple pour privilégier la préservation des petites distances plutôt que des grandes, et la puissance x étant un nombre réel.
Puis, chaque objet i de référence est représenté par une région R, décrite ci-dessous et dont w, détermine la position. Pour chaque objet i de référence positionné sur la carte, on définit une région R, dont l'apparence est paramétrée par les K nombres réels
Figure imgf000014_0001
, ... ,piK)- Des apparences spécifiques sont associées aux différentes combinaisons possibles d'absence de valeur pour ces paramètres. Dans un exemple de réalisation décrit par la suite, pour chaque objet i, on peut colorer en gris la région de Voronoï du point de coordonnées w,, l'intensité lumineuse de ce gris étant proportionnelle à la valeur d'un paramètre p . Dans un autre exemple de réalisation, on peut colorer la région de Voronoï du point w, à partir de l'échelle de couleur Rouge, Vert, Bleu, la couleur étant définie par la valeur de trois paramètres pn , pi2 et pi3 dans cette échelle. Les paramètres p, peuvent aussi servir à modifier la forme ou la taille par exemple des régions Ri. En d'autres termes, il existe une étape éventuelle de calcul des caractéristiques d'apparence des régions Ri (taille, forme, couleur, texture, orientation, brillance) se basant sur l'ensemble des informations disponibles, à savoir l'ensemble S des objets de référence sous forme de leurs coordonnées dans la base BD ou sous forme de leurs coordonnées dans la base BQ, l'ensemble des mesures M de similarité de l'objet requête aux objets de références, et l'ensemble des fonctions F.
Avantageusement, l'objet requête peut être visualisé par l'apparence des régions R,. Cette apparence peut être déterminée par le calcul des paramètres piz qui sont des fonctions de zmiq et éventuellement d'un ensemble quelconque de paramètres supplémentaires. Si zmiq n'a pas de valeur (valeur manquante), le paramètre piz ne fournit pas de valeur et une apparence spécifique est alors utilisée.
Par exemple, on peut définir piz comme suit :
Piz = (zfTiiq - mm)/(mM - mm) où mM et mm sont deux paramètres d'échelle. Par exemple, on peut utiliser mm = mink(zmkq) et mM = maxk(zmkq)
En d'autres termes, comme illustré par la figure 1 bis, les objets de référence S et l'objet requête q n'appartenant pas à S, peuvent être décrits dans la même base BD, à partir de laquelle, d'une part les mesures M de similarité de chaque objet i de S à l'objet requête q définissant les coordonnées de q dans la base BP sont calculées comme une fonction (par exemple la distance euclidienne) prenant en argument les caractéristiques dans BD de l'objet requête q et des objets de S, et d'autre part les caractéristiques des objets de S dans la base BQ sont obtenues par une méthode de projection de ces objets de S décrits dans la base BD. Le produit cartésien de la base BQ et la base BP forme une base Bs dans laquelle chaque objet de référence S est décrit par ses coordonnées dans la base BQ et par celles dans sa base BP, en d'autre termes chaque objet de S est décrit dans la base Bs par un ensemble de caractéristiques obtenues par projection de ses caractéristiques dans BD, et un ensemble de caractéristiques obtenues par des fonctions F de calcul de son degré de similarité à l'objet requête q. L'objet requête q n'existe pas en tant qu'ensemble de caractéristiques dans la base Bs, il n'apparait qu'implicitement dans son degré de similarité aux objets de référence. En d'autres termes, les coordonnées de chaque objet de référence dans la base Bs portent simultanément son degré de similarité à l'objet requête q dans la partie BP de Bs et son degré de similarité aux autres objets de référence par sa position absolue dans la partie BQ de Bs qui donne implicitement sa position relative aux autres objets de référence dans cette base Avantageusement, une étape d'évaluation du degré de ressemblance de l'objet requête aux objets de référence peut avoir lieu par une fonction prenant en argument les caractéristiques des seuls objets de référence dans la base Bs sans nécessité de projeter l'objet requête q dans la base BQ de Bs.
Avantageusement, la base Bs peut prendre une forme graphique, la partie BQ de Bs donnant pour chaque objet i de référence sa position sur l'écran, la partie BP de Bs donnant le degré de ressemblance de l'objet requête q à cet objet i de référence sous forme d'une couleur ou d'une apparence spécifique d'une région R, positionnée à ce même endroit sur l'écran. En d'autres termes, la méthode selon l'invention peut être vue comme une méthode de transformation des objets de référence S et de l'objet requête q décrits dans la base BD vers une description classifiante des objets de référence dans la base Bs. En d'autres termes, le degré de ressemblance de l'objet requête q aux objets de référence S consubstanciel à leur classification ainsi avantageusement plus juste au sens décrit précédemment, est exprimé en tant que tel par les coordonnées des objets de référence dans la base Bs résultant de l'application de la méthode. Le résultat de la classification par la méthode objet de l'invention est donné en tant que tel par la valeur des coordonnées des objets de référence et indirectement de l'objet requête dans la base Bs.
La figure 1 bis illustre les étapes de projection de BD vers BQ et de BD vers BP puis la constitution de Bs par le produit cartésien de BP et de BQ, ainsi que l'étape de classification de l'objet requête q dans cette base Bs. La figure 2 illustre un exemple de carte de données pouvant être utilisée pour mettre en œuvre l'invention dans un système d'aide à la décision, par exemple un système de reconnaissance de caractères manuscrits. Ainsi, les objets peuvent être des imagettes de chiffres manuscrits de 8 x 8 pixels en niveaux de gris. Les imagettes sont séparée en 10 classes équilibrées correspondant aux dix chiffres (0, 1 , 2, 9). L'objectif est de retrouver la classe d'une imagette requête, c'est-à-dire de déterminer le chiffre de 0 à 9 qui est représenté par une matrice de 8 par 8 pixels, ce chiffre n'étant pas connu a priori. Dans le présent exemple, 300 imagettes de référence ont été choisies arbitrairement dans une base publique. A l'aide d'une méthode pour laquelle la demanderesse a déposé une autre demande de brevet, les 300 imagettes ont été positionnées dans un plan pour former une carte, de sorte que les imagettes sont regroupées sur la carte dans des zones. Chaque zone peut être facilement délimitée visuellement à partir de la classe d'appartenance des imagettes qu'elle contient, c'est-à-dire du chiffre manuscrit que représentent les imagettes qu'elle contient, ce chiffre étant connu a priori.
Les figures 3, 4 et 5 illustrent la même carte de données que la carte de la figure 2, la carte étant utilisée pour évaluer selon l'invention les chiffres que représentent trois exemples d'imagettes requêtes. Les trois imagettes requêtes correspondent aux imagettes situées en haut à gauche des figures 3, 4 et 5, il s'agit du chiffre 0, du chiffre 1 et de la lettre x respectivement. Il faut bien comprendre que, conformément à l'invention, ces trois imagettes requêtes ne sont pas positionnées sur la carte illustrée par les figures 3, 4 et 5.
Dans le présent exemple, chaque imagette, que ce soit l'une des trois imagettes requêtes ou l'une des 300 imagettes de référence, peut être définie par un vecteur à 64 valeurs dans [0,1 ], chaque valeur dans [0,1 ] représentant l'intensité lumineuse d'un pixel. Dans le présent exemple illustré par les figures 3, 4 et 5, les régions permettant la visualisation peuvent être les régions de Voronoï associées à chacune des imagettes de références. La région de Voronoï associée à une imagette de référence contient l'ensemble des points du plan qui sont plus proches du point représentant cette imagette sur la carte que de tout autre point représentant une imagette. Puis, sur présentation d'une imagette requête, les régions de Voronoï sont colorées pour visualiser la similarité entre l'objet requête considéré et chaque objet de référence. Cette similarité est déterminée à partir des mesures de similarité M, qui peut être, dans le présent exemple, la distance euclidienne dans l'espace vectoriel des pixels à 64 dimensions. Par exemple, la couleur peut être d'autant plus claire que l'imagette de référence est proche de l'imagette requête au sens de la distance euclidienne. Ainsi, une distance euclidienne m nulle (imagette identique) peut être représentée par une région blanche, alors qu'une distance euclidienne m élevée peut être représentée par une région noire. Pour fixer la distance euclidienne minimum correspondant à une région noire, on peut par exemple calculer pour chaque imagette de référence la distance euclidienne à son 6eme plus proche voisin, la distance minimum pouvant être le maximum des six distances calculées. Ainsi, une distance euclidienne m plus grande que cette distance minimum peut être représentée par la couleur noire, les distances euclidienne plus courtes pouvant être colorées selon un niveau de couleur allant du rouge sombre (m grand) au jaune orangé, puis au blanc (m nulle).
Ainsi, lorsque l'imagette requête représente le chiffre manuscrit 0, comme illustré par l'encart en haut à gauche de la figure 3, un groupe de régions voisines apparaissent sans ambiguïté très éclaircies, notamment en jaune et en orange. Ce sont les régions associées aux imagettes de référence appartenant à la classe 0. Cela indique à l'utilisateur que l'imagette requête appartient vraisemblablement à cette classe, ce qui est effectivement le cas. L'invention est donc efficace dans le domaine de la reconnaissance de formes. Dans une application générique, il s'agit d'un objet présentant toutes les caractéristiques typiques d'un objet de référence. La décision est alors facile et le risque d'erreur est faible. Dans le cadre d'un système d'aide à la décision, un signal d'avertissement « Rien à signaler » pourrait être émis à l'intention de l'utilisateur. Par contre, lorsque l'imagette requête représente le chiffre manuscrit 1 illustré par l'encart en haut à gauche de la figure 4, ce ne sont que quelques régions éparses qui apparaissent légèrement éclaircies, notamment en rouge. Ce sont des régions associées à des 1 , à des 2, à des 4, à des 5 et à des 9. Ces régions occupent des zones du plan très différentes, correspondant à des classes variées et aucune n'est très fortement éclaircie. La décision est donc difficile et la prudence s'impose. Notons toutefois qu'il est également difficile pour un lecteur de deviner avec certitude le chiffre sur la base de l'imagette requête. Dans une application générique, il s'agit d'un nouvel objet inhabituel mais qui reste identifiable à quelques unes des classes de référence. Dans ce cas, une analyse approfondie s'impose. Dans le cadre d'un système d'aide à la décision, un signal d'avertissement « Attention » pourrait être émis à l'intention de l'utilisateur.
Enfin, lorsque l'imagette requête représente la lettre x, comme illustré par l'encart en haut à gauche de la figure 5, c'est-à-dire un caractère qui ne correspond à aucune imagette de référence. Dans ce cas, aucune région n'est éclaircie, ce qui peut être interprété comme un indice d'une anomalie de la donnée présentée. Ainsi, l'invention proposée permet facilement à l'utilisateur de détecter cette anomalie. Dans une application générique, il s'agit d'un nouvel objet atypique et non identifiable aux classes de référence. Dans ce cas, une analyse approfondie s'impose, la création d'une nouvelle classe est à envisager. Dans le cadre d'un système d'aide à la décision, un signal d'avertissement « Stop » pourrait être émis à l'intention de l'utilisateur.
Ainsi, selon l'invention, l'imagette requête n'est jamais positionnée sur la carte, ce qui évite toute contradiction visuelle entre le voisinage artificiel qu'induirait ce positionnement et le voisinage réel fourni par les mesures de similarité. L'invention ne visualise que le voisinage réel fourni par les mesures de similarité, de manière à optimiser l'intelligibilité de l'information visualisée. Il faut noter qu'il peut n'exister aucune mesure de similarité entre l'objet requête et un objet de référence (valeur manquante), mais qu'il peut aussi en exister une ou plusieurs. Au sens de la présente invention, une mesure de similarité est une fonction prenant comme argument deux objets et des paramètres indépendants de ces objets, comme par exemple une distance entre deux objets ou une incertitude sur la distance entre deux objets, ou encore un paramètre d'échelle servant à déterminer la dynamique des valeurs de la mesure de similarité, comme son minimum et son maximum. Chaque objet de référence peut être caractérisé par sa position sur la carte et éventuellement par une ou plusieurs mesures de similarité à tous les autres objets de référence. Au moins un des objets de référence peut être positionné manuellement ou automatiquement sur la carte, éventuellement à partir de l'ensemble des mesures de similarités, de sorte à permettre l'appréhension visuelle. Afin de faciliter l'interprétation visuelle, il est préconisé un positionnement tel qu'en premier lieu, plus les objets de références sont similaires suivant une mesure supplémentaire fournie, plus ils sont proches sur la carte, et en second lieu, les objets de même classe sont proches et ceux de classes différentes sont éloignés les uns des autres sur la carte. Mais l'objet requête n'est pour sa part jamais positionné sur la carte.
Aucune, une ou plusieurs des mesures de similarité entre l'objet requête et un objet de référence peuvent être visualisées sur la carte par une apparence spécifique, par exemple en termes de taille, de forme, de texture de couleur, ou encore sous la forme d'une région associée à cet objet de référence. Cela peut permettre de visualiser l'absence de mesure, ou de visualiser une similarité munie de son imprécision ou de son incertitude.
Les objets de référence peuvent posséder aucune, une ou plusieurs caractéristiques ordinales ou numériques, qu'elles soient continues ou discrètes (température d'un four, azimut d'un écho radar, nombre de roues d'un véhicule). De même, les objets de référence peuvent posséder aucune, une ou plusieurs caractéristiques nominales, comme le nom, le genre ou la classe d'appartenance. Ces caractéristiques supplémentaires peuvent être visualisées sur la carte par une apparence spécifique, par exemple en termes de taille, de forme, de texture, de couleur, ou encore sous la forme d'une région associée à cet objet de référence.
L'invention permet à l'utilisateur d'appréhender visuellement et globalement la proximité de l'objet requête aux objets de référence en termes de similarité. Ainsi, elle l'aide à prendre une décision quant à la nature de cet objet et au traitement qui peut lui convenir. L'association d'une visualisation de type cartographique dont la position des objets de référence est stable, d'une mesure de similarité à visualiser sur la carte, ainsi que l'absence de positionnement de l'objet requête sur la carte rendent l'invention plus spécialement exploitable dans le domaine de l'aide à la décision en discrimination et dans le domaine de la détection d'anomalie d'un objet requête relativement à des objets de référence.
L'invention a encore pour principal avantage de présenter une carte des objets de référence telle que la position de ces objets ou des zones servant à les représenter est fixe et indépendante de l'objet requête. Cette carte constitue donc une base stable permettant une appréhension visuelle de l'univers des objets de référence, ainsi qu'une mémorisation facile de cette représentation. Cette stabilité permet à l'utilisateur de focaliser son attention sur les ressemblances entre l'objet requête et les objets de référence plutôt qu'entre les objets de références eux-mêmes, car il n'est pas perturbé par des changement de position des objets de référence.
Par ailleurs, en l'absence de positionnement de l'objet requête parmi les objets de référence, il n'y a pas de stimuli contradictoires entre l'objet requête et les objets de référence.
De plus, la représentation de la ressemblance entre l'objet requête et les objets de référence par un paramètre visuel de ces objets de référence, autre que leur position, offre une perception visuelle immédiate des objets de référence les plus semblables ou les plus différents de l'objet requête.
Enfin, un système implémentant la méthode selon l'invention décrite précédemment peut être implémenté sur la plupart des ordinateurs munis d'un dispositif d'affichage graphique. L'invention décrite précédemment a encore pour principal avantage qu'aucune décision n'est prise : il n'y a pas d'indice de confiance, ni de combinaison de règles logiques, ni de probabilité d'appartenance globale à des classes, toutes informations dont l'utilisateur ne maîtrise pas la provenance et l'interprétation. Ce sont les mesures de similarité entre l'objet requête et chaque objet de référence qui sont visualisées. Surtout, c'est bien une mesure de similarité entre l'objet requête et chaque objet de référence qui est visualisée, et pas seulement une caractéristique des objets de référence indépendante de l'objet requête. Ce point est particulièrement avantageux lorsque les objets possèdent plus d'une caractéristique, rendant difficile la visualisation sur une même carte de ces multiples caractéristiques pour chaque objet et compliquant d'autant la comparaison visuelle aux caractéristiques de l'objet requête. De plus, l'invention permet de visualiser sans déformation les mesures de similarité brutes fournies en entrée. Suivant l'application, la mesure sera connue de l'utilisateur ou au moins lui sera intelligible: il n'y a pas de biais dû à un autre traitement non maîtrisé par l'utilisateur. Ceci rend intelligible l'information visualisée et est propice à ce que l'utilisateur ait confiance dans cette information. L'invention s'applique également à des objets qui n'ont pas nécessairement de représentation naturelle sous forme de carte, car la représentation de la ressemblance entre l'objet requête et les objets de référence ne dépend pas de ce positionnement. L'invention peut donc non seulement s'appliquer à des objets positionnés sur la carte par un moyen automatique ou manuel quelconque, mais elle peut également s'appliquer à des objets dont la représentation graphique sous forme de carte est prédéfinie, comme les frontières de zones géographiques par exemple, où chaque zone correspond à un objet de référence. La mesure visualisée est une mesure de similarité entre l'objet requête et les objets de référence, ce qui permet de positionner mentalement le premier par rapport aux seconds, alors que les cartes selon l'art antérieur représentent une information propre aux objets de référence représentés, indépendamment de l'objet requête. Les domaines d'application de l'invention sont vastes, la méthode selon l'invention étant générique et pouvant donc s'appliquer à tout domaine impliquant un système d'aide à la décision en discrimination, notamment les systèmes de reconnaissance de forme.
Par exemple, l'invention est applicable dans le domaine de l'aide au diagnostic médical, comme le diagnostic des mélanomes. En effet, le diagnostic des mélanomes est très difficile pour les médecins généralistes. Des outils d'aide à la décision peuvent assister les médecins généralistes dans leur choix d'envoyer ou pas les patients consulter un dermatologue. Ainsi, le mélanome « requête » colore les mélanomes de référence et permet au médecin de déterminer sa gravité. On peut généraliser à d'autres pathologies pour lesquelles l'invention permettrait d'aider le médecin dans l'orientation du patient dans le parcours de soins.
Par exemple, l'invention est applicable dans le domaine de la recherche de l'origine des événements sismiques, comme la détermination de leur origine naturelle ou anthropique (e.g. tirs de carrière). C'est un travail de routine fait par des analystes géophysiciens à partir de signaux captés sur de multiples stations de mesure. L'analyste visualise une carte des événements habituellement rencontrés, regroupés spatialement en fonction de leur origine. L'événement en cours d'analyse colore sur la carte les événements de référence similaires, aidant ainsi l'analyste à déterminer l'origine de celui-ci.
Par exemple, l'invention est applicable dans le domaine du marketing, comme l'analyse du comportement des clients. Des clients de référence peuvent être visualisés et regroupés par catégorie sur une carte, chaque catégorie correspondant à une cible particulière à qui sont envoyés des messages publicitaires spécifiques. Un nouveau client est visualisé selon sa proximité aux clients de référence, ce qui permet de reconnaître la ou les catégories dont il est le plus proche.
Par exemple, l'invention est applicable dans le domaine de l'évaluation de risque en crédit, en bourse ou en assurance. Il s'agit d'évaluer les risques de dérive de la situation financière d'un client pour définir le type de crédit ou le taux de risque à lui appliquer.
Par exemple, l'invention est applicable dans le domaine de la biométrie. Un individu peut être identifié par une photographie de son visage ou une empreinte digitale. Ces éléments peuvent être comparés à ceux de référence positionnés sur une carte. L'analyste enquêteur voit rapidement si l'individu est similaire à un ou plusieurs individus de référence ou au contraire complètement nouveau.
Par exemple, l'invention est applicable dans le domaine de la sécurité industrielle ou informatique. Dans une centrale nucléaire, l'opérateur chargé de la surveillance du fonctionnement de la centrale visualise une carte des différents états de référence habituellement mesurés lors d'un fonctionnement normal. L'état actuel de fonctionnement s'affiche sous forme d'une coloration des états de référence liée à leur similarité à cet état actuel. Si l'état actuel apparaît s'éloigner de plus en plus des états de référence, l'opérateur le voit et déclenche les procédures adéquates d'arrêt, d'évacuation ou de simples contrôles. De même, on peut détecter un intrus dans un système informatique, dont les comportements ne ressemblent pas à des comportements normaux référencés.
Par exemple, l'invention est applicable dans le domaine du transport, de la logistique ou encore de la maintenance prédictive. Il s'agit alors de suivi de l'état des flux et de détection visuelle de dérives par rapport à une situation de référence.
Par exemple, l'invention est applicable dans le domaine du classement de documents numériques, de type favoris internet, pages web ou encore dossiers personnels. Un internaute qui visualise un nouveau site internet et qui souhaite l'ajouter dans la liste de ses sites préférés se voit alors présenter les sites déjà présents dans cette liste sous forme d'une carte. Le nouveau site colore alors les sites préférés en fonction de leur similarité avec lui, ce qui permet à l'internaute de décider de la ou des catégories les plus appropriées pour le classer, ou de la création d'une nouvelle catégorie. On peut décliner ce principe pour tout type de document, que ce soit des photos, de la vidéo ou du texte.
Par exemple, l'invention est applicable dans le domaine de l'aide au consommateur dans le choix d'un produit complexe définit par de multiples caractéristiques, comme un téléviseur, une machine à laver, un téléphone portable, un ordinateur, une voiture, une maison, une assurance, un produit d'investissement, un abonnement de téléphonie mobile. Dans ce dernier cas, typique, les offres de forfait (références) sont représentées sur une carte, et l'on demande au client de définir son type de consommation (donc son forfait idéal). L'invention permet alors de présenter au client les forfaits les plus proches de son forfait idéal, l'organisation en carte permettant de distinguer nettement les forfaits proches de l'idéal client par rapport aux autres. L'invention permet alors également de distinguer les différentes familles de forfaits qui différeraient drastiquement selon des caractéristiques que le client n'aurait pas renseignées (prix, option internet...). Cela permet au client de se focaliser sur chacune de ces familles d'offres très rapidement et de visualiser « où » il se trouve dans le maquis des informations grâce à la carte.
L'exemple précédent des imagettes n'est donné qu'à titre d'illustration. En effet, la présente invention est également applicable à toutes sortes de données, notamment des données numérisées. Ces données numérisées peuvent inclure des mesures de caractéristiques physiques prises sur des objets très variés autres que des photos, qu'il s'agisse d'objets matériels, d'individus, d'états d'un système, ou encore d'un groupe de tels objets, individus ou états, dont on mesure des caractéristiques physiques.
Naturellement, ces données numérisées peuvent inclure des scalaires, c'est-à-dire des nombres réels, comme des mesures fournies par un capteur.
Mais ces données numérisées peuvent également inclure des symboles (élément d'un alphabet) comme une valeur élément d'un ensemble fini (lettre d'un mot, nom d'un objet, etc).
Ces données numérisées peuvent également inclure des vecteurs, comme une mesure d'un capteur accompagnée de son incertitude ou un ensemble de mesures issues d'un réseau de capteurs ou un signal (séquence de mesures, flux, etc) ou un ensemble de valeurs issues d'une base de données ou un mot, une phrase, un texte ou un ensemble de mesures normalisées (proportions) ou encore tout ensemble de données scalaires ou symboliques.
Ces données numérisées peuvent également inclure des matrices, comme une image plane en noir et blanc ou un ensemble de signaux issus d'un réseau de capteurs ou des données génétiques ou encore tout ensemble de données vectorielles.
Ces données numérisées peuvent également inclure des tableaux multi-dimensionnels, comme une séquence d'images (vidéo) ou une image multi-spectrale (image satellite) ou une image couleur (photographie, résultat de simulations) ou une image 3D (scanner) ou un maillage multi- dimensionnel (modèle de simulation) ou encore tout ensemble de données matricielles ou de tableaux multi-dimensionnels de dimension inférieure.
Ces données numérisées peuvent également inclure des graphes et des réseaux, comme un réseau social ou le réseau internet ou un réseau de transport (traffic routier, information, énergie, etc) ou un réseau d'interactions (protéines, gènes) ou un réseau de capteurs ou un maillage de modélisation numérique (modélisation 2D, 3D, 3D avec le temps, etc).
Ces données numérisées peuvent également inclure des complexes cellulaires ou des hypergraphes, comme un maillage de modélisation numérique (objets virtuels, modélisation multi-physique, films d'animation) ou des modèles biologiques ou moléculaires ou physiques ou climatiques ou mécaniques ou encore chimiques.
Ces données numérisées peuvent également inclure des données complexes comme des documents multimédias (ensemble organisé de textes, vidéos, signaux audio, etc) ou une collection de documents ou encore tout ensemble de documents organisés (bibliothèque).
Ces données numérisées peuvent également inclure des contrats d'abonnement à un service, comme des contrats d'abonnement téléphoniques par exemple. La méthode et le système selon la présente invention pourraient alors avantageusement permettre de choisir le forfait de téléphone le plus adapté en fonction du profil de l'utilisateur.

Claims

REVENDICATIONS
Méthode pour évaluer la classe d'une donnée de test dans un espace de données de dimension D où D > 3, chaque donnée appartenant à au moins une classe contenant une ou plusieurs données, la méthode étant caractérisée en ce qu'elle comporte:
- une étape de projection d'un jeu de données de référence de l'espace de données dans un espace de dimension Q où Q < D, la classe de chaque donnée de référence étant connue;
- une étape de calcul d'une mesure de similarité de la donnée de test à chacune des données de référence;
- une étape de partitionnement de l'espace de projection en une pluralité de régions disjointes contenant chacune la projection d'une et une seule donnée de référence;
- une étape d'évaluation de la classe de la donnée de test, cette classe étant évaluée comme étant la même classe qu'une des données de référence contenue dans une des régions contenant les données de référence les plus proches de la donnée de test au sens de la mesure de similarité.
Méthode selon la revendication 1 , caractérisée en ce que les données sont des données numérisées.
Méthode selon la revendication 2, caractérisée en ce que les données numérisées incluent une ou plusieurs mesures de caractéristiques physiques d'un objet.
Méthode selon la revendication 3, caractérisée en ce que l'objet est :
- un objet matériel ou un groupe d'objets matériels, ou;
- un individu ou un groupe d'individus, ou;
- un état d'un système ou un groupe d'états d'un système.
Méthode selon la revendication 1 , caractérisée en ce que les données de référence sont projetées dans l'espace de projection de manière à minimiser une fonction dépendant de :
- la mesure de similarité entre les données de référence; - la distance entre les projections desdites données de référence; de sorte à préserver, dans l'espace de projection, l'organisation spatiale des données de référence. 6. Méthode selon la revendication 5, caractérisée en ce que les régions sont les régions de Voronoï associées aux projections des données de référence dans l'espace de projection.
7. Méthode selon la revendication 6, caractérisée en ce que les données sont des caractères manuscrits numérisés, les classes regroupant les caractères identiques, chaque donnée étant définie par un vecteur de pixels.
8. Méthode selon la revendication 1 , caractérisée en ce que les données sont des courbes sismiques numérisées, une classe regroupant les courbes dont l'enregistrement correspond à un tremblement de terre et une autre classe regroupant les courbes dont l'enregistrement ne correspond pas à un tremblement de terre. 9. Méthode selon la revendication 1 , caractérisée en ce que les données sont des photographies numériques de mélanomes, une classe regroupant les photographies de mélanomes malins et une autre classe regroupant les photographies de mélanomes bénins. 10. Méthode pour aider un utilisateur à décider la classe d'une donnée de test dans un espace de données de dimension D où D > 3, chaque donnée appartenant à une classe contenant une ou plusieurs données, la méthode étant caractérisée en ce qu'elle comporte:
- une étape selon la revendication 1 d'évaluation de la classe de donnée de test;
- une étape de présentation à l'utilisateur des régions contenant les projections des données de référence qui sont les plus proches de la donnée de test au sens de la mesure de similarité.
1 1 . Méthode selon la revendication 10, caractérisée en ce que la région contenant la projection de la donnée de référence qui est la plus proche de la donnée de test au sens de la mesure de similarité est présentée à l'utilisateur par utilisation d'une couleur prédéfinie pour la représenter.
12. Méthode selon la revendication 10, caractérisée en ce que les régions contenant les projections des données de référence qui sont les plus proches de la donnée de test au sens de la mesure de similarité sont présentées à l'utilisateur par utilisation de couleurs prédéfinies pour les représenter, de manière à représenter les régions par ordre décroissant de similarité avec la donnée de test.
13. Méthode selon la revendication 10, caractérisée en ce qu'elle comporte une étape d'attribution par l'utilisateur d'une classe à la donnée de test, la classe attribuée par l'utilisateur à la donnée de test pouvant être ou pas la classe d'une donnée de référence contenue dans l'une des régions présentées à l'utilisateur.
14. Dispositif de reconnaissance de formes, caractérisé en ce qu'il implémente une méthode selon l'une quelconque des revendications précédentes.
15. Système pour évaluer la classe d'une donnée de test dans un espace de données de dimension D où D > 3, chaque donnée appartenant à au moins une classe contenant une ou plusieurs données, le système étant caractérisé en ce qu'il comporte:
- un module de projection d'un jeu de données de référence de l'espace de données dans un espace de dimension Q où Q < D, la classe de chaque donnée de référence étant connue;
- un module de calcul d'une mesure de similarité de la donnée de test à chacune des données de référence;
- un module de partionnement de l'espace de projection en une pluralité de régions disjointes contenant chacune la projection d'une et une seule donnée de référence; - un module d'évaluation de la classe de donnée de test, cette classe étant évaluée comme étant la même classe qu'une des données de référence contenue dans une des régions contenant les données de référence les plus proches de la donnée de test au sens de la mesure de similarité.
16. Système selon la revendication 15, caractérisée en ce que les données sont des données numérisées. 17. Système selon la revendication 16, caractérisée en ce que les données numérisées incluent une ou plusieurs mesures de caractéristiques physiques d'un objet.
18. Système selon la revendication 17, caractérisée en ce que l'objet est :
- un objet matériel ou un groupe d'objets matériels, ou;
- un individu ou un groupe d'individus, ou;
- un état d'un système ou un groupe d'états d'un système.
19. Système selon la revendication 15, caractérisée en ce que les données de référence sont projetées dans l'espace de projection de manière à minimiser une fonction dépendant de :
- la mesure de similarité entre les données de référence;
- la distance entre les projections desdites données de référence; de sorte à préserver, dans l'espace de projection, l'organisation spatiale des données de référence.
20. Système selon la revendication 19, caractérisée en ce que les régions sont les régions de Voronoï associées aux projections des données de référence dans l'espace de projection.
21 . Système selon la revendication 20, caractérisée en ce que les données sont des caractères manuscrits numérisés, les classes regroupant les caractères identiques, chaque donnée étant définie par un vecteur de pixels.
22. Système selon la revendication 15, caractérisée en ce que les données sont des courbes sismiques numérisées, une classe regroupant les courbes dont l'enregistrement correspond à un tremblement de terre et une autre classe regroupant les courbes dont l'enregistrement ne correspond pas à un tremblement de terre.
23. Système selon la revendication 15, caractérisée en ce que les données sont des photographies numériques de mélanomes, une classe regroupant les photographies de mélanomes malins et une autre classe regroupant les photographies de mélanomes bénins.
24. Système pour aider un utilisateur à décider la classe d'une donnée de test dans un espace de données de dimension D où D > 3, chaque donnée appartenant à une classe contenant une ou plusieurs données, le système étant caractérisé en ce qu'il comporte:
- un module selon la revendication 1 d'évaluation de la classe de donnée de test;
- un module de présentation à l'utilisateur des régions contenant les projections des données de référence qui sont les plus proches de la donnée de test au sens de la mesure de similarité.
25. Système selon la revendication 24, caractérisée en ce que la région contenant la projection de la donnée de référence qui est la plus proche de la donnée de test au sens de la mesure de similarité est présentée à l'utilisateur par utilisation d'une couleur prédéfinie pour la représenter.
26. Système selon la revendication 24, caractérisée en ce que les régions contenant les projections des données de référence qui sont les plus proches de la donnée de test au sens de la mesure de similarité sont présentées à l'utilisateur par utilisation de couleurs prédéfinies pour les représenter, de manière à représenter les régions par ordre décroissant de similarité avec la donnée de test.
27. Système selon la revendication 24, caractérisée en ce qu'il comporte un module d'attribution par l'utilisateur d'une classe à la donnée de test, la classe attribuée par l'utilisateur à la donnée de test pouvant être ou pas la classe d'une donnée de référence contenue dans l'une des régions présentées à l'utilisateur.
PCT/EP2010/065997 2009-10-23 2010-10-22 Methode et systeme pour evaluer la ressemblance d'un objet requete a des objets de reference WO2011048219A2 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US13/503,621 US9576223B2 (en) 2009-10-23 2010-10-22 Method and system for evaluating the resemblance of a query object to reference objects
JP2012534714A JP2013508840A (ja) 2009-10-23 2010-10-22 参照オブジェクトに対するクエリオブジェクトの類似性を評価するための方法およびシステム
CA2778651A CA2778651C (fr) 2009-10-23 2010-10-22 Methode et systeme pour evaluer la ressemblance d'un objet requete a des objets de reference
EP10768037A EP2491518A2 (fr) 2009-10-23 2010-10-22 Methode et système pour évaluer la ressemblance d'un objet requête à des objets de référence

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0905117A FR2951839B1 (fr) 2009-10-23 2009-10-23 Methode pour evaluer la ressemblance d'un objet requete a des objets de reference
FR0905117 2009-10-23

Publications (2)

Publication Number Publication Date
WO2011048219A2 true WO2011048219A2 (fr) 2011-04-28
WO2011048219A3 WO2011048219A3 (fr) 2011-06-16

Family

ID=42321033

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2010/065997 WO2011048219A2 (fr) 2009-10-23 2010-10-22 Methode et systeme pour evaluer la ressemblance d'un objet requete a des objets de reference

Country Status (6)

Country Link
US (1) US9576223B2 (fr)
EP (1) EP2491518A2 (fr)
JP (1) JP2013508840A (fr)
CA (1) CA2778651C (fr)
FR (1) FR2951839B1 (fr)
WO (1) WO2011048219A2 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3060794A1 (fr) * 2016-12-21 2018-06-22 Commissariat A L'energie Atomique Et Aux Energies Alternatives Procede de determination de l'etat d'un systeme, procede de determination d'une methode de projection optimale et dispositif mettant en œuvre lesdits procedes

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10771247B2 (en) 2013-03-15 2020-09-08 Commerce Signals, Inc. Key pair platform and system to manage federated trust networks in distributed advertising
US10803512B2 (en) * 2013-03-15 2020-10-13 Commerce Signals, Inc. Graphical user interface for object discovery and mapping in open systems
US11222346B2 (en) 2013-03-15 2022-01-11 Commerce Signals, Inc. Method and systems for distributed signals for use with advertising
US20140378810A1 (en) 2013-04-18 2014-12-25 Digimarc Corporation Physiologic data acquisition and analysis
US10425702B2 (en) 2015-09-30 2019-09-24 Sensormatic Electronics, LLC Sensor packs that are configured based on business application
US11436911B2 (en) 2015-09-30 2022-09-06 Johnson Controls Tyco IP Holdings LLP Sensor based system and method for premises safety and operational profiling based on drift analysis
US11151654B2 (en) 2015-09-30 2021-10-19 Johnson Controls Tyco IP Holdings LLP System and method for determining risk profile, adjusting insurance premiums and automatically collecting premiums based on sensor data
US10902524B2 (en) * 2015-09-30 2021-01-26 Sensormatic Electronics, LLC Sensor based system and method for augmenting underwriting of insurance policies
US10552914B2 (en) 2016-05-05 2020-02-04 Sensormatic Electronics, LLC Method and apparatus for evaluating risk based on sensor monitoring
US10810676B2 (en) 2016-06-06 2020-10-20 Sensormatic Electronics, LLC Method and apparatus for increasing the density of data surrounding an event
US10740647B2 (en) 2018-03-14 2020-08-11 Adobe Inc. Detecting objects using a weakly supervised model
US11107219B2 (en) 2019-07-22 2021-08-31 Adobe Inc. Utilizing object attribute detection models to automatically select instances of detected objects in images
US11631234B2 (en) 2019-07-22 2023-04-18 Adobe, Inc. Automatically detecting user-requested objects in images
US11302033B2 (en) 2019-07-22 2022-04-12 Adobe Inc. Classifying colors of objects in digital images
US11468550B2 (en) 2019-07-22 2022-10-11 Adobe Inc. Utilizing object attribute detection models to automatically select instances of detected objects in images
US11468110B2 (en) 2020-02-25 2022-10-11 Adobe Inc. Utilizing natural language processing and multiple object detection models to automatically select objects in images
US11055566B1 (en) * 2020-03-12 2021-07-06 Adobe Inc. Utilizing a large-scale object detector to automatically select objects in digital images
US11587234B2 (en) 2021-01-15 2023-02-21 Adobe Inc. Generating class-agnostic object masks in digital images
US11972569B2 (en) 2021-01-26 2024-04-30 Adobe Inc. Segmenting objects in digital images utilizing a multi-object segmentation model framework
US20230376164A1 (en) * 2022-05-18 2023-11-23 Qatar Foundation For Education, Science And Community Development Active learning for scalable arrangement and grouping of data

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6539115B2 (en) * 1997-02-12 2003-03-25 Fujitsu Limited Pattern recognition device for performing classification using a candidate table and method thereof
US7272593B1 (en) * 1999-01-26 2007-09-18 International Business Machines Corporation Method and apparatus for similarity retrieval from iterative refinement
US6446060B1 (en) * 1999-01-26 2002-09-03 International Business Machines Corporation System and method for sequential processing for content-based retrieval of composite objects
US20090006156A1 (en) * 2007-01-26 2009-01-01 Herbert Dennis Hunt Associating a granting matrix with an analytic platform
US7716226B2 (en) * 2005-09-27 2010-05-11 Patentratings, Llc Method and system for probabilistically quantifying and visualizing relevance between two or more citationally or contextually related data objects
US8005643B2 (en) * 2007-06-26 2011-08-23 Endeca Technologies, Inc. System and method for measuring the quality of document sets
WO2009143040A1 (fr) * 2008-05-19 2009-11-26 Disetronic Medical Systems Ag Outil de recherche informatique pour l'organisation, la visualisation et l'analyse de données cliniques liées au métabolisme et son procédé
US8559671B2 (en) * 2008-12-18 2013-10-15 The Regents Of The University Of California Training-free generic object detection in 2-D and 3-D using locally adaptive regression kernels
US8948515B2 (en) * 2010-03-08 2015-02-03 Sightera Technologies Ltd. Method and system for classifying one or more images
US8498949B2 (en) * 2010-08-11 2013-07-30 Seiko Epson Corporation Supervised nonnegative matrix factorization

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
AUPETIT M.: "Visualizing distortions and recovering topology in continuous projection techniques", NEUROCOMPUTING, vol. 10, no. 7-9, 2007, pages 1304 - 1330, XP022067245, DOI: doi:10.1016/j.neucom.2006.11.018

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3060794A1 (fr) * 2016-12-21 2018-06-22 Commissariat A L'energie Atomique Et Aux Energies Alternatives Procede de determination de l'etat d'un systeme, procede de determination d'une methode de projection optimale et dispositif mettant en œuvre lesdits procedes
EP3340065A1 (fr) * 2016-12-21 2018-06-27 Commissariat à l'Energie Atomique et aux Energies Alternatives Procédé de détermination de l'état d'un système, procédé de détermination d'une méthode de projection optimale et dispositif mettant en oeuvre lesdits procédés

Also Published As

Publication number Publication date
CA2778651A1 (fr) 2011-04-28
JP2013508840A (ja) 2013-03-07
WO2011048219A3 (fr) 2011-06-16
CA2778651C (fr) 2019-01-29
FR2951839A1 (fr) 2011-04-29
EP2491518A2 (fr) 2012-08-29
FR2951839B1 (fr) 2021-06-11
US20130066592A1 (en) 2013-03-14
US9576223B2 (en) 2017-02-21

Similar Documents

Publication Publication Date Title
WO2011048219A2 (fr) Methode et systeme pour evaluer la ressemblance d&#39;un objet requete a des objets de reference
Patra et al. Histogram thresholding for unsupervised change detection of remote sensing images
Pastore et al. Annotation-free learning of plankton for classification and anomaly detection
Ke et al. A comparison of three methods for automatic tree crown detection and delineation from high spatial resolution imagery
Khoshboresh-Masouleh et al. Multiscale building segmentation based on deep learning for remote sensing RGB images from different sensors
Hamedianfar et al. Development of fuzzy rule-based parameters for urban object-oriented classification using very high resolution imagery
FR2991078A1 (fr) Selection d&#39;image basee sur un style photographique
Ruz et al. Automated visual inspection system for wood defect classification using computational intelligence techniques
US7606779B2 (en) Methods and system for data aggregation of physical samples
Chatterjee et al. Intelligent Road Maintenance: a Machine Learning Approach for surface Defect Detection.
CN113313149B (zh) 一种基于注意力机制和度量学习的菜品识别方法
Su et al. Classification of MODIS images combining surface temperature and texture features using the Support Vector Machine method for estimation of the extent of sea ice in the frozen Bohai Bay, China
Zhang et al. Feature extraction for high-resolution imagery based on human visual perception
Sangeetha et al. Detection of pest and disease in banana leaf using convolution Random Forest
Gardella et al. Forgery detection in digital images by multi-scale noise estimation
Paul et al. Canopy averaged chlorophyll content prediction of pear trees using convolutional autoencoder on hyperspectral data
Alshehri A content-based image retrieval method using neural network-based prediction technique
Rehman et al. Long short term memory deep net performance on fused Planet-Scope and Sentinel-2 imagery for detection of agricultural crop
Kanaev et al. Object level HSI-LIDAR data fusion for automated detection of difficult targets
EP2491517B1 (fr) Méthode et système pour évaluer la classe d&#39;une donnée de test dans un espace de données de grande dimension
Ghate et al. Forest wildfire detection and forecasting utilizing machine learning and image processing
Abishek et al. Soil Texture Prediction Using Machine Learning Approach for Sustainable Soil Health Management
Abraham Digital image forgery detection approaches: A review and analysis
Vudattu et al. Change Detection in Synthetic Aperture Radar Images based on a Spatial Pyramid Pooling Attention Network (SPPANet)
Naguib et al. AI Assistance for Home Surveillance

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10768037

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2012534714

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2778651

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 3611/DELNP/2012

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 2010768037

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 13503621

Country of ref document: US