EP4256444A1 - Procédé de traçage numérique de données - Google Patents
Procédé de traçage numérique de donnéesInfo
- Publication number
- EP4256444A1 EP4256444A1 EP21823871.5A EP21823871A EP4256444A1 EP 4256444 A1 EP4256444 A1 EP 4256444A1 EP 21823871 A EP21823871 A EP 21823871A EP 4256444 A1 EP4256444 A1 EP 4256444A1
- Authority
- EP
- European Patent Office
- Prior art keywords
- initial
- data
- historical
- elements
- history
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000006870 function Effects 0.000 claims description 43
- 230000004927 fusion Effects 0.000 claims description 41
- 238000004590 computer program Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 8
- 230000009471 action Effects 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 3
- 238000002844 melting Methods 0.000 claims description 2
- 230000008018 melting Effects 0.000 claims description 2
- 230000000295 complement effect Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 10
- 230000015654 memory Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011524 similarity measure Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002730 additional effect Effects 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 238000009739 binding Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Definitions
- TITLE Digital data tracing process
- the present invention relates to a method for digital plotting of data from several data sources.
- the present invention also relates to a computer program product and an associated readable information medium.
- data compression techniques also called data fusion
- the present description relates to a method for digital plotting of data from several data sources, the method being implemented by computer and comprising the steps of: a. obtaining initial data from several data sources, each initial data comprising initial elements and initial links, each initial element having a type and a value, each initial element belonging to a first category of elements, called initial entities, or to a second category of elements, called initial relations, the initial links connecting initial entities to one another via an initial relation, b.
- a final datum as a function of at least two initial datum following the fusion of initial elements of said initial data with each other according to a fusion strategy, the merged initial elements belonging to the same category of elements and making it possible to obtaining a merged element, the merged element having a type and a value, and c. determining a merge history for each merged item, the merge history including the type and value of each initial item from which the merged item originated, the type and value of the merged item, and data about the merge strategy.
- the method comprises:
- the merge strategy implements functions, each function being represented by a set of function elements each comprising a type and a value, the merge history comprising history elements and history bindings, each history element having a type and a value, the historical elements belonging to: a. a first category of historical elements called historical entities, grouping together the initial elements, the merged element and the function elements representative of the functions, and b. a second category of historical elements, called historical relations, historical links linking historical entities to each other through historical relations;
- each initial element further has an initial history comprising the type and the value of the initial element, as well as data identifying the data source from which the initial element originated, the determined merge history for each merged item including the initial history of each initial item from which the merged item originated;
- each historical entity is associated with at least one additional piece of data chosen from: c. a timestamp indicating the date and/or time of generation of the historical entity, d. data relating to the place of generation of the historical entity, e. data relating to the computer by which the historical entity was generated, and f. data relating to a user of the computer by which the historical entity was generated;
- the initial data of at least one data source come from measurements made by a sensor
- the process comprises: g. a step of acquiring a determined merge history display command for a merged element, and h. a step of displaying the fusion history of said merged element on a display;
- the initial data relate to at least one piece of equipment
- the method comprising a step of implementing an action on the piece of equipment according to the final data(s) obtained, and at least one fusion history.
- the present description also relates to a computer program product comprising a readable information medium, on which is stored a computer program comprising program instructions, the computer program being loadable on a data processing unit and implementing a method as previously described when the computer program is implemented on the data processing unit.
- This description also relates to a readable information medium on which a computer program product as described above is stored.
- Figure 1 a schematic view of an example of a computer allowing the implementation of a digital data plotting process
- FIG. 2 a flowchart of an example implementation of a digital data plotting process
- Figure 3 a schematic representation of an example of a final data G obtained following the fusion of two initial elements G1 and G2 of two distinct initial data
- Figure 4 a schematic representation of an example of three initial histories, each associated with a distinct initial element
- FIG 6 a schematic representation of an example of a merge history associated with a merged element obtained following two merges, the merge history having been represented in two parts for the sake of readability, Figure 6 illustrating only the first part,
- Figure 7 a schematic representation of the second part of the merge history shown in Figure 6, and
- Figure 8 a schematic representation of different entity types and subtypes.
- a computer 10 and a computer program product 12 are illustrated in Figure 1.
- Computer 10 is preferably a computer.
- the computer 10 is an electronic computer suitable for manipulating and/or transforming data represented as electronic or physical quantities in computer registers 10 and/or memories into other similar data corresponding to physical data in memories, registers or other types of display, transmission or storage devices.
- the computer 10 interacts with the computer program product 12.
- the computer 10 comprises a processor 14 comprising a data processing unit 16, memories 18 and an information carrier reader 20.
- the computer 10 also includes a man-machine interface 22, such as a keyboard, and a display 24.
- the computer program product 12 has an information carrier 26.
- the information medium 26 is a medium readable by the computer 10, usually by the data processing unit 16.
- the readable information medium 26 is a medium suitable for storing electronic instructions and capable of being coupled to a computer system bus.
- the information medium 26 is a USB key, a floppy disk or floppy disk (from the English name “floppy disk”), an optical disk, a CD-ROM, a magneto-optical disk, a memory ROM, RAM memory, EPROM memory, EEPROM memory, magnetic card or optical card.
- the computer program 12 comprising program instructions.
- the computer program 12 can be loaded onto the data processing unit 16 and is adapted to cause the implementation of a digital data tracing method, described in the following description, when the computer program 12 is implemented on the processing unit 16 of the computer 10
- FIG. 2 schematically illustrates an example of implementation of a digital data plotting method
- FIGS. 3 to 8 which are examples making it possible to illustrate certain steps of the process.
- the digital plotting method is implemented by the computer 10 in interaction with the computer program product 12, that is to say is implemented by computer.
- the plotting method includes a step 100 of obtaining initial data Di.
- the initial data Di typically comes from several distinct and heterogeneous data sources.
- heterogeneous it is understood that the same information can be described differently depending on the data source considered.
- the initial data Di are, for example, data relating to individuals, installations or equipment.
- Data sources are databases of information.
- the data sources are digital libraries, social networks, blogs, files created by an operator or a machine, GPS signal traces, or even results of sensor data analysis (radar, AIS for example).
- the initial data Di from at least one data source come from measurements made by a sensor.
- the sensor is, for example, a camera, a sound sensor, or any sensor for measuring a physical quantity (radar, AIS for example).
- Each initial datum Di comprises initial elements Ei and initial links Li.
- Each initial element Ei has a type and a value.
- the type of an element corresponds to a concept represented by the element.
- Each type is associated with a set of possible values.
- the value of an element corresponds to the value taken by the type of the element among the set of possible values.
- Each initial element Ei belongs to a first category of elements, called initial entities Ci, or to a second category of elements, called initial relations Ri.
- the initial elements Ei belonging to the first category of elements differ from those of the second category of elements by the types of said elements which are different.
- Initial links Li connect initial entities Ci to each other via an initial relation Ri.
- the initial entities Ci are representative of states (identity of a person, place) and the initial relations Ri establish a link between these states (action of one entity on another).
- each initial datum Di is thus in the form of an ontological representation.
- the ontological representation is, for example, a conceptual graph or a logical representation of order one, that is to say a representation comprising alphanumeric symbols and symbols of punctuation.
- the symbols represent relationships between objects in the real world (Example: location ([Car: “Titine”@V1], [Position: “48.853, 2.35”@ND] expresses that the car V1 is called Titine, and is positioned at the ND location which is located at GPS coordinates 48.853; 2.35).
- an ontology is an entity formed by a set of knowledge, facts and rules relating to a given domain, for example, scientific, cultural, administrative, industrial or commercial know-how.
- an ontology is a set of concepts, each concept being able to relate to other concepts.
- a concept brings together a set of words designating the same notion, typically synonyms.
- an aircraft is a concept that can also be referred to as a flying machine.
- synonyms is not the only possible case.
- a new concept can be the aircraft of the said company.
- An ontology can be represented in the form of a graph whose points are the concepts, a relation being represented by a line between two points, as is the case for conceptual graphs.
- An ontology can also be represented in the form of alphanumeric symbols, as is the case for first-order logical representations.
- each initial datum Di comprises two initial entities Ci, a relation Ri and two links Li connecting each initial entity Ci to the relation Ri.
- the initial data Di represented by the conceptual graph G1 comprises: a first initial entity Ci whose type is “Man” and the value “John Dow”, a second initial entity Ci whose type is “Country” and the value “Philippines”, and a relation Ri whose type is “Relation” and value “Lives”.
- the initial data Di represented by the conceptual graph G2 comprises: a first initial entity Ci whose type is "Person” and the value "J. Dow”, a second initial entity Ci whose type is "Country” and the value "Africa from the south”, and an Ri relationship whose type is "relation” and value is "Travel”.
- a first-order logical representation of the conceptual graph G1 is: Lives ([Man: John Dow], [Country: Philippines]).
- each initial element Ei is, moreover, associated with an initial history Hi allowing the traceability of the initial element Ei, that is to say to go back to information relating to the origin of the initial element Ei.
- the initial history Hi thus comprises the type and the value of the initial element Ei, as well as data identifying the data source from which the initial element Ei originated.
- the initial history Hi has the same form as the initial data Di.
- the initial history Hi includes initial history elements Ehi and initial history links Lhi.
- Each initial Ehi history element has a type and a value.
- Each initial historical element Ehi belongs: either to a first category of initial historical elements called initial historical entities Chi, or to a second category of initial historical elements, called initial historical relations Rhi.
- the initial historical links Lhi connect initial historical entities Chi to each other through the intermediary of the initial historical relations Rhi.
- the initial historical entities Ci are representative of the initial elements Ei and of the data sources, and the initial relations Ri establish a link between these elements.
- the initial historical relations Rhi and the initial historical links Lhi make it possible to establish the origin of the corresponding initial element Ei.
- Each initial history Hi1, Hi2, Hi3 presents a first initial historical entity Chi representative of the initial element Ei to which said initial history Hi corresponds, a second initial historical entity Chi representative of the data source from which the initial element Ei originates, and an initial historical relation Rhi establishing a link between the initial element Ei and the data source from which it originated.
- Hi1 which is the history of the initial entity “Man: John Dow”:
- the first initial historical entity has the type "Man” and the value "John Dow” (corresponds to the initial element),
- the second initial historical entity has the type "Source” and the value "Source A”, and
- each initial historical entity Chi of an initial history Hi is associated with at least one timestamp indicating the date and/or time of generation of the historical entity Ch.
- the The timestamp is shown as a succession of numbers in each initial historical entity Chi. This timestamp is, for example, of the UNIX type, ie it designates the number of seconds elapsed since January 1, 1970 at midnight UTC.
- each initial history Hi comprises at least one initial history entity Chi chosen from an entity representative of: a date and time of creation of a data source (timestamp), a file considered in a data source, and information unit represented on one or more indexed lines of a file.
- Rhi an initial historical relationship Rhi establishing a relationship between the initial historical entities "Source: Source A” and “Date-time: 11/03/2020 14:20", whose type is “Relation” and the value "A date- hour ",
- Rhi an initial historical relationship Rhi establishing a relationship between the initial historical entities "Source: Source A” and “File: C/Documents/aaa.xls”, whose type is “Relation” and value "A file”, and
- Rhi an initial historical relationship Rhi establishing a relationship between the initial historical entities "File: C/Documents/aaa.xls" and "Line: 1446", whose type is “Relation” and value "A line”.
- the initial history Hi of each or at least one entity is empty. This is particularly the case when the original data source is unknown.
- the plotting method includes a step 110 of determining at least one final datum Df.
- the final data Df comes from the fusion of at least two initial elements Ei belonging to different initial data Di, in particular from different data sources.
- the merge is performed according to a merge strategy.
- a merged element Ec having a type and a value is obtained.
- the type of the merged element Ec is the type of one of the initial elements Ei from which the merged element Ec originated; and the value of the merged element Ec is the value of one of the initial elements Ei from which the merged element Ec originated.
- the merging strategy stipulates in particular that the merged elements belong to the same category of elements, that is to say either all to the first category of elements, or all to the second category of elements.
- the merging strategy implements functions F, namely:
- Each function F has, for example, a name, input data, one or more parameters and output data (results).
- This information is, for example, represented by at least one type and at least one corresponding value in a history (merge history), each type and each value associated defining an element, called a function element.
- the fusion is, for example, carried out according to a method as described in document FR 2 986 636 A, document FR 2 940 487 A or in the article by Laudy, C., Ganascia, J. G., & Sedogbo, C (2007, July), High-level fusion based on conceptual graphs.
- pp. 1 -8 IEEE In 2007 10th International Conference on Information Fusion (pp. 1 -8) IEEE.
- FIG. 3 An example of final data Df in the form of a conceptual graph G is illustrated in figure 3.
- the final data Df comes from the initial data Di represented by the conceptual graphs G1 and G2.
- the entity Ci “Man: John Dow” of the initial data Di (first data) represented by the first conceptual graph G1 has been merged with the entity Ci “Person: J. Dow” of the initial data Di ( second datum) represented by the second conceptual graph G2.
- the result of the merge is the merged entity This "Man: John Dow”.
- the type and value of the merged entity is the type and value of the first data.
- the final data Df includes the same elements and links as the initial data Di.
- the tracing method includes a step 120 of determining a fusion history Hc for each merged element Ec.
- the fusion history Hc is a datum making it possible in particular to go back to the initial elements Ei from which the merged element Ec originated.
- the fusion history Hc thus includes information relating to the type and to the value of each initial element Ei from which the merged element Ec originated, the type and value of the merged element Ec and the data relating to the merging strategy.
- the fusion history Hc has the same form as the initial data Di and the final data Df.
- the initial data Di is in the form of an ontological representation, such as a conceptual graph, it will be the same for the final data Df and the fusion history Hc.
- the Hc merge history includes Eh-history elements and Lh-history links.
- Each historical Eh element has a type and a value.
- the types of the historical elements Eh notably include the types of the initial elements Ei, of the merged element Ec and of the function elements representative of the functions F used during the implementation of the merging strategy.
- the values of the entities of the historical graphs are for example the values of the initial elements Ei, of the merged element Ec and of the function elements representative of the functions F used during the implementation of the merging strategy.
- the values represent, for example, the name of the chosen compatibility function, the name of the chosen similarity function, the name of the fusion function or the value of the similarity threshold.
- the historical elements Eh belong: either to a first category of historical elements called historical entities Ch, grouping together the initial elements Ei, the merged element Ec and the function elements, or to a second category of historical elements, called historical relations Rh.
- the historical links Lh connect historical entities Ch between them via historical relations Rh.
- the historical entities Ch are representative of the initial elements Ei, of the merged element Ec and of the function elements representative of the functions F of the fusion strategy, and the initial relations Ri establish a link between these elements.
- the historical relations Rh and the historical links Lh are representative of the fusion strategy applied to the initial elements Ei via the function elements to obtain the merged element Ec.
- the fusion history Hc determined for each merged element Ec includes the initial history Hi of each initial element Ei from which the merged element Ec originates. Such an inclusion allows a non-loss of information during multiple mergers.
- An example of history Hc is illustrated by FIGS. 6 and 7 for a merged element Ec obtained following two merging of elements. The first merge is shown in Figure 7 and the second merge in Figure 6.
- the first merge made it possible to obtain the merged entity Ec "Man: John Dow", from the initial entities "Man: John Dow” and "Person: J. Dow". Box C1 of the Ec history gives information relating to the first merger.
- the part of the merge history Hc relating to the first merge comprises: the merged element Ec "Man: John Dow” resulting from the first merge, the initial histories Hi 1 and Hi2 of the initial entities Chi from which the merged element Ec,
- the historical entities Ch and historical relations Rh relating to the merger strategy including: o a historical entity Ch of the "Merger function” type and value "keep full name”, o a historical entity Ch of the "Merger strategy” type and value "*”, o a historical entity Ch of type "Threshold” and value "0.8” o a historical entity Ch of type “Similarity measure” and value "detection of initials”, o a historical relationship Rh of type “Relation” and value "A resource”, o a historical relation Rh of type “Relation” and value “Merge function”, o a historical relation Rh of type “Relation” and value “Compatibility function ”, and o a historical relation Rh of type “Relation” and value “Produced by”.
- the second merge made it possible to obtain the merged entity Ec "Man: John Dow", from the initial entity “Person: J. Dow” and the entity resulting from the first merge "Man: John Dow” .
- Box C2 of the Ec history gives information relating to the second merger.
- the part of the merge history Hc relating to the second merge includes in particular: the merged element Ec "Man: John Dow” resulting from the second merge, the histories of the entities from which the merged element originated Ec: initial history Hi3 and the part of the history relating to the first merger, and - the historical entities Ch and historical relations Rh relating to the merger strategy which are, in this case, the same as for the first merger.
- each historical entity Ch is associated with at least one additional piece of data chosen from: a timestamp indicating the date and/or time of generation of the historical entity Ch (illustrated in the entity boxes of the examples of FIGS. 6 and 7) , data relating to the place of generation of the historical entity Ch, and data relating to the computer by which the historical entity Ch was generated, data relating to a user of the computer by which the historical entity Ch.
- the tracing method comprises a step 130 of acquiring a command to display the fusion history Hc obtained for a merged element Ec.
- the command emanates from an operator and is acquired via the man-machine interface 22 of the computer 10.
- the command is, for example, issued with a view to verifying the origin of the merged elements Ec.
- the plotting method comprises a step 140 of displaying the history of fusion Hc of said merged element Ec on a display, such as the display 24 of the computer 10.
- the final data Df are by example considered reliable or unreliable, including whether the original data source is considered reliable or unreliable.
- the method comprises a step 150 of implementing an action on the piece of equipment as a function of the final data Df obtained, and of at least one Hc fusion history.
- the maintenance action corresponding to the final data Df is carried out on the equipment, in particular if it has been determined that the final data Df are reliable in view of the fusion histories.
- the present method makes it possible, via the determination of a fusion history Hc, to improve the understanding and reliability of the data resulting from a data fusion, as well as understanding itself as an operation on these data. This facilitates, thus, the exploitation of the merged data.
- the present method thus applies particularly to the technical field of information processing, with application for example to decision support or to the analysis of situations or complex systems, in particular when the information to be merged comes from various heterogeneous sources of information.
- many military and civilian applications use analysis and decision systems based on information from a plurality of heterogeneous sources, such as for example a plurality of sensors (e.g. perimeter surveillance, detection and classification of targets , ammunition self-guiding for the military field, for the civilian field: industrial maintenance, weather forecasting, remote sensing).
- One application is, for example, the analysis of data from heterogeneous sources for the collection of evidence.
- semantic fusion is used to merge heterogeneous data from different data sources. The traceability allowed by this process makes it possible to make the evidence collected more reliable.
- Another application is, for example, the study of information exchanged on social networks where information of different quality levels is used.
- information of different quality levels is used.
- different levels of credibility are attributed to different actors in social networks.
- the present method makes it possible in particular to (i) trace the various mergers carried out (ii), follow the steps carried out while keeping the order of their realizations, (iii) have proof of the steps carried out, and (iv) understand the steps carried out with a need for interpretability.
- the method makes it possible to keep a history of all the mergers carried out.
- the traces of the mergers are, for example, represented using conceptual graphs with a proper ontology which is composed of (i) sub-type and super-type of the entity which has been merged; (ii) an ontology specific to the traceability representing information related to the fusion, and (iii) an ontology specific to the sources of information.
- the entities and relations of the history graph, representing the history of the different merges for a given entity make it possible to represent the similarity function and the associated threshold, the merge function and the compatibility function associated with the merges.
- These traces are represented for each entity or relationship as an additional property that represents its history.
- Each piece of information is preferably timestamped at the time it is created to keep a safe and unambiguous record.
- the present method proposes to follow the process of semantic fusion of heterogeneous data by adding to each merged entity a history in the form of a conceptual graph with its own formalism. This solution makes it possible to follow the evolution of the fusion of each concept and relations. Adding this history to each entity facilitates the history and readability of the information by knowing for each entity where it comes from.
- the present method has in particular the following advantages: (i) the trace of the various fusions carried out; (ii) the trace of all fusion parameters and strategy; (iii) the use of conceptual graphs to represent the trace (same way of representing the knowledge as the information itself which will be merged) makes it possible to merge traces if they are redundant to render traceability information itself condensed; (iv) the process is generic and adaptable to any use case; (v) the process allows an operator to understand the different steps that led to the synthetic information.
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Generation (AREA)
Abstract
La présente invention concerne un procédé de traçage numérique de données issues de plusieurs sources de données, le procédé comprenant les étapes de: a. obtention de données initiales issues de plusieurs sources de données, chaque donnée initiale comprenant des éléments initiaux et des liaisons initiales, chaque élément initial ayant un type et une valeur, b. détermination d'une donnée finale en fonction d'au moins deux données initiales suite à la fusion d'éléments initiaux desdites données initiales entre eux selon une stratégie de fusion, les éléments initiaux fusionnés permettant d'obtenir un élément fusionné ayant un type et une valeur, et c. détermination d'un historique de fusion pour chaque élément fusionné, l'historique de fusion comprenant le type et la valeur de chaque élément initial dont est issu l'élément fusionné, le type et la valeur de l'élément fusionné et des données relatives à la stratégie de fusion.
Description
TITRE : Procédé de traçage numérique de données
La présente invention concerne un procédé de traçage numérique de données issues de plusieurs sources de données. La présente invention concerne aussi un produit programme d’ordinateur et un support lisible d’informations associés.
Dans des domaines tels que la surveillance, de nombreuses données en provenance de différentes sources de données sont collectées et analysées.
Pour diminuer les redondances et faciliter, ainsi, l’analyse des données, des techniques de compression de données, aussi appelées fusion de données, sont utilisées.
Néanmoins, une fois la fusion réalisée, il est difficile de remonter aux informations d’origine. Il n’est en outre pas aisé de comprendre et vérifier les critères de fusion.
Or, cette absence de suivi des opérations effectuées s’avère problématique pour certaines applications critiques, notamment lorsque certaines sources de données sont considérées moins fiables que d’autres. Cela rend les données fusionnées moins fiables et plus difficiles à exploiter.
Il existe donc un besoin pour un procédé permettant d’améliorer la compréhension d’une fusion de données en vue de faciliter l’exploitation des données fusionnées.
A cet effet, la présente description porte sur un procédé de traçage numérique de données issues de plusieurs sources de données, le procédé étant mis en œuvre par ordinateur et comprenant les étapes de : a. obtention de données initiales issues de plusieurs sources de données, chaque donnée initiale comprenant des éléments initiaux et des liaisons initiales, chaque élément initial ayant un type et une valeur, chaque élément initial appartenant à une première catégorie d’éléments, dits entités initiales, ou à une deuxième catégorie d’éléments, dits relations initiales, les liaisons initiales reliant des entités initiales entre elles par l’intermédiaire d’une relation initiale, b. détermination d’une donnée finale en fonction d’au moins deux données initiales suite à la fusion d’éléments initiaux desdites données initiales entre eux selon une stratégie de fusion, les éléments initiaux fusionnés appartenant à une même catégorie d’éléments et permettant d’obtenir un élément fusionné, l’élément fusionné ayant un type et une valeur, et c. détermination d’un historique de fusion pour chaque élément fusionné, l’historique de fusion comprenant le type et la valeur de
chaque élément initial dont est issu l’élément fusionné, le type et la valeur de l’élément fusionné et des données relatives à la stratégie de fusion.
Suivant des modes de réalisation particuliers, pris isolément ou suivant toutes combinaisons techniquement possibles, le procédé comprend :
- la stratégie de fusion met en œuvre des fonctions, chaque fonction étant représentée par un ensemble d’éléments de fonction comprenant chacun un type et une valeur, l’historique de fusion comprenant des éléments historique et des liaisons historique, chaque élément historique ayant un type et une valeur, les éléments historique appartenant à : a. une première catégorie d’éléments historique dits entités historique, regroupant les éléments initiaux, l’élément fusionné et les éléments de fonction représentatifs des fonctions, et b. une deuxième catégorie d’éléments historique, dits relations historique, les liaisons historique reliant des entités historique entre elles par l’intermédiaire des relations historique ;
- les relations historique et les liaisons historique sont représentatives de la stratégie de fusion appliquée aux éléments initiaux via les éléments de fonction pour obtenir l’élément fusionné ;
- chaque élément initial a, en outre, un historique initial comprenant le type et la valeur de l’élément initial, ainsi que des données d’identification de la source de données dont est issu l’élément initial, l’historique de fusion déterminé pour chaque élément fusionné incluant l’historique initial de chaque élément initial dont est issu l’élément fusionné ;
- chaque entité historique est associée à au moins une donnée complémentaire choisie parmi : c. un horodatage indiquant la date et/ou l’heure de génération de l’entité historique, d. une donnée relative au lieu de génération de l’entité historique, e. une donnée relative à l’ordinateur par lequel a été générée l’entité historique, et f. une donnée relative à un utilisateur de l’ordinateur par lequel a été générée l’entité historique ;
- les données initiales d’au moins une source de données sont issues de mesures effectuées par un capteur ;
- le procédé comprend :
g. une étape d’acquisition d’une commande d’affichage de l’historique de fusion déterminé pour un élément fusionné, et h. une étape d’affichage de l’historique de fusion dudit élément fusionné sur un afficheur ;
- les données initiales sont relatives à au moins un équipement, le procédé comprenant une étape de mise en œuvre d’une action sur l’équipement en fonction de la ou de données finales obtenues, et d’au moins un historique de fusion.
La présente description se rapporte également à un produit programme d’ordinateur comportant un support lisible d’informations, sur lequel est mémorisé un programme d’ordinateur comprenant des instructions de programme, le programme d’ordinateur étant chargeable sur une unité de traitement de données et mettant en œuvre un procédé tel que décrit précédemment lorsque le programme d’ordinateur est mis en œuvre sur l’unité de traitement des données.
La présente description se rapporte aussi à un support lisible d’informations sur lequel est mémorisé un produit programme d’ordinateur tel que décrit précédemment.
D’autres caractéristiques et avantages de l’invention apparaîtront à la lecture de la description qui suit de modes de réalisation de l’invention, donnés à titre d’exemple uniquement et en référence aux dessins qui sont :
Figure 1 , une vue schématique d’un exemple d’ordinateur permettant la mise en œuvre d’un procédé de traçage numérique de données,
Figure 2, un organigramme d’un exemple de mise en œuvre d’un procédé de traçage numérique de données,
Figure 3, une représentation schématique d’un exemple d’une donnée finale G obtenue suite à la fusion de deux éléments initiaux G1 et G2 de deux données initiales distinctes,
Figure 4, une représentation schématique d’un exemple de trois historiques initiaux, chacun associé à un élément initial distinct,
Figure 5, une représentation schématique d’un autre exemple d’historique initial,
Figure 6, une représentation schématique d’un exemple d’un historique de fusion associé à un élément fusionné obtenu à la suite de deux fusions, l’historique de fusion ayant été représenté en deux parties par soucis de lisibilité, la figure 6 illustrant seulement la première partie,
Figure 7, une représentation schématique de la deuxième partie de l’historique de fusion illustré en figure 6, et
Figure 8, une représentation schématique de différents types et sous-types d’entités.
Un calculateur 10 et un produit programme d’ordinateur 12 sont illustrés par la figure 1.
Le calculateur 10, est de préférence, un ordinateur.
Plus généralement, le calculateur 10 est un calculateur électronique propre à manipuler et/ou transformer des données représentées comme des quantités électroniques ou physiques dans des registres de calculateur 10 et/ou des mémoires en d’autres données similaires correspondant à des données physiques dans des mémoires, des registres ou d’autres types de dispositifs d’affichage, de transmission ou de mémorisation.
Le calculateur 10 est en interaction avec le produit programme d’ordinateur 12.
Dans l’exemple illustré par la figure 1 , le calculateur 10 comporte un processeur 14 comprenant une unité de traitement de données 16, des mémoires 18 et un lecteur 20 de support d’informations. Dans l’exemple illustré par la figure 1 , le calculateur 10 comprend aussi, une interface homme-machine 22, tel qu’un clavier, et un afficheur 24.
Le produit programme d’ordinateur 12 comporte un support d’informations 26.
Le support d’information 26 est un support lisible par le calculateur 10, usuellement par l’unité de traitement de données 16. Le support lisible d’informations 26 est un médium adapté à mémoriser des instructions électroniques et capable d’être couplé à un bus d’un système informatique.
A titre d’exemple, le support d’informations 26 est une clé USB, une disquette ou disque souple (de la dénomination anglaise « Floppy disc »), un disque optique, un CD- ROM, un disque magnéto-optique, une mémoire ROM, une mémoire RAM, une mémoire EPROM, une mémoire EEPROM, une carte magnétique ou une carte optique.
Sur le support d’informations 26 est mémorisé le programme d’ordinateur 12 comprenant des instructions de programme.
Le programme d’ordinateur 12 est chargeable sur l’unité de traitement de données 16 et est adapté pour entraîner la mise en œuvre d’un procédé de traçage numérique de données, décrit dans la suite de la description, lorsque le programme d’ordinateur 12 est mis en œuvre sur l’unité de traitement 16 du calculateur 10
Le fonctionnement du calculateur 10 va maintenant être décrit en référence à la figure 2, qui illustre schématiquement un exemple de mise en œuvre d’un procédé de traçage numérique de données et aux figures 3 à 8 qui sont des exemples permettant d’illustrer certaines étapes du procédé.
Par le terme « traçage numérique de données », il est entendu le fait d’associer une information à une donnée indiquant l’origine de la donnée et/ou les actions ayant permis d’obtenir la donnée à partir d’autre données.
Dans la description, les termes « fusion » et « compression » sont utilisés de manière équivalente.
Dans l’exemple décrit dans ce qui suit, le procédé de traçage numérique est mis en œuvre par le calculateur 10 en interaction avec le produit programme d’ordinateur 12, c’est- à-dire est mis en œuvre par ordinateur.
Le procédé de traçage comprend une étape 100 d’obtention de données initiales Di. Les données initiales Di sont typiquement issues de plusieurs sources de données distinctes et hétérogènes. Par le terme « hétérogène », il est entendu qu’une même information peut être décrite différemment en fonction de la source de données considérée.
Les données initiales Di sont, par exemple, des données relatives à des individus, à des installations ou à des équipements.
Les sources de données sont des bases de données d’informations. Par exemple, les sources de données sont des bibliothèques numériques, des réseaux sociaux, des blogs, des fichiers créés par un opérateur ou une machine, des traces de signal GPS, ou encore des résultats d’analyses de données de capteurs (radars, AIS par exemple). Avantageusement, les données initiales Di d’au moins une source de données sont issues de mesures effectuées par un capteur. Le capteur est, par exemple, une caméra, un capteur sonore, ou tout capteur de mesure d’une grandeur physique (radar, AIS par exemple).
Chaque donnée initiale Di comprend des éléments initiaux Ei et des liaisons initiales Li.
Chaque élément initial Ei a un type et une valeur. Le type d’un élément correspond à un concept représenté par l’élément. Chaque type est associé à un ensemble de valeurs possibles. La valeur d’un élément correspond à la valeur prise par le type de l’élément parmi l’ensemble de valeurs possibles.
Chaque élément initial Ei appartient à une première catégorie d’éléments, dits entités initiales Ci, ou à une deuxième catégorie d’éléments, dits relations initiales Ri. Les éléments initiaux Ei appartenant à la première catégorie d’éléments diffèrent de ceux de la deuxième catégorie d’éléments par les types desdits éléments qui sont différents.
Les liaisons initiales Li relient des entités initiales Ci entre elles par l’intermédiaire d’une relation initiale Ri. Notamment, les entités initiales Ci sont représentatives d’états (identité d’une personne, lieu) et les relations initiales Ri établissent un lien entre ces états (action d’une entité sur une autre).
Dans un mode de mise en œuvre, chaque donnée initiale Di est, ainsi, sous la forme d’une représentation ontologique. La représentation ontologique est, par exemple, un graphe conceptuel ou une représentation logique d’ordre un, c’est-à-dire une représentation comprenant des symboles alphanumériques et des symboles de
ponctuation. Les symboles représentent des relations entre des objets du monde réel (Exemple : localisation ([Voiture : « Titine »@V1], [Position : « 48.853, 2.35 »@ND] exprime que la voiture V1 est appelé Titine, et est positionnée à la localisation ND qui se trouve aux coordonnées GPS 48.853 ; 2.35).
De manière générale, une ontologie est une entité formée par un ensemble de connaissances, de faits et de règles relatifs à un domaine donné, par exemple, scientifique, culturel, administratif, savoir-faire industriel ou commercial.
Plus précisément, une ontologie est un ensemble de concepts, chaque concept pouvant être en relation avec d’autres concepts. Un concept regroupe un ensemble de mots désignant la même notion, typiquement des synonymes. Par exemple, un aéronef est un concept qui peut également être désigné comme engin volant. Toutefois, le cas des synonymes n’est pas le seul cas possible. A titre d’exemple, pour le concept d’aéronef et le concept les atouts d’une compagnie, un nouveau concept peut être les aéronefs de ladite compagnie.
Une ontologie est représentable sous forme d’un graphe dont les points sont les concepts, une relation étant représentée par un trait entre deux points, comme cela est le cas pour les graphes conceptuels. Une ontologie est aussi représentable sous la forme de symboles alphanumériques, comme cela est le cas pour les représentations logiques d’ordre un.
Dans l’exemple illustré par la figure 3, il est illustré deux données initiales Di, l’une sous la forme d’un graphe conceptuel G1 et l’autre sous la forme d’un graphe conceptuel G2. Dans cet exemple, chaque donnée initiale Di comprend deux entités initiales Ci, une relation Ri et deux liaisons Li reliant chaque entité initiale Ci à la relation Ri. En particulier, la donnée initiale Di représentée par le graphe conceptuel G1 comprend : une première entité initiale Ci dont le type est « Homme » et la valeur « John Dow », une deuxième entité initiale Ci dont le type est « Pays » et la valeur « Philippines », et une relation Ri dont le type est « Relation » et la valeur « Habite ». La donnée initiale Di représentée par le graphe conceptuel G2 comprend : une première entité initiale Ci dont le type est « Personne » et la valeur « J. Dow », une deuxième entité initiale Ci dont le type est « Pays » et la valeur « Afrique du sud », et une relation Ri dont le type est « relation » et la valeur « Voyage ».
L’homme du métier comprendra que la représentation des données sous la forme de graphes conceptuels est donnée à titre d’exemples, ces données pouvant tout à fait être représentées sous d’autres formes. Par exemple, une représentation logique d’ordre un du graphe conceptuel G1 est : Habite ([Homme : John Dow], [Pays : Philippines]).
Avantageusement, chaque élément initial Ei est, en outre, associé à un historique initial Hi permettant la traçabilité de l’élément initial Ei, c’est-à-dire de remonter à des
informations relatives à l’origine de l’élément initial Ei. L’historique initial Hi comprend, ainsi, le type et la valeur de l’élément initial Ei, ainsi que des données d’identification de la source de données dont est issu l’élément initial Ei.
Dans un exemple de mise en œuvre, l’historique initial Hi présente la même forme que les données initiales Di. Ainsi, si les données initiales Di sont sous la forme d’une représentation ontologique, telle qu’un graphe conceptuel, il en sera de même pour l’historique initial Hi. Dans cet exemple, l’historique initial Hi comprend des éléments historiques initiaux Ehi et des liaisons historiques initiales Lhi. Chaque élément historique initial Ehi a un type et une valeur. Chaque élément historique initial Ehi appartient : soit à une première catégorie d’éléments historique initiaux dits entités historique initiales Chi, soit à une deuxième catégorie d’éléments historique initiaux, dits relations historique initiales Rhi.
Les liaisons historique initiales Lhi relient des entités historique initiales Chi entre elles par l’intermédiaire des relations historique initiales Rhi. Notamment, les entités historique initiales Ci sont représentatives des éléments initiaux Ei et des sources de données, et les relations initiales Ri établissent un lien entre ces éléments.
Avantageusement, les relations historique initiales Rhi et les liaisons historique initiales Lhi permettent d’établir l’origine de l’élément initial Ei correspondant.
Dans l’exemple illustré par la figure 4, trois exemples d’historiques initiaux Hi1 , Hi2, Hi3 sont représentés. Chaque historique initial Hi1 , Hi2, Hi3 présente une première entité historique initial Chi représentative de l’élément initial Ei auquel correspond ledit historique initial Hi, une deuxième entité historique initiale Chi représentative de la source de données dont est issu l’élément initial Ei, et une relation historique initiale Rhi établissant un lien entre l’élément initial Ei et la source de données dont il est issu. Ainsi, pour le premier historique initial Hi1 qui est l’historique de l’entité initiale « Homme : John Dow » :
- la première entité historique initiale a pour type « Homme » et pour valeur « John Dow » (correspond à l’élément initial),
- la deuxième entité historique initiale a pour type « Source » et pour valeur « Source A », et
- la relation historique initiale a pour type « relation » et pour valeur « A ressource ». Avantageusement, chaque entité historique initiale Chi d’un historique initial Hi est, associée à au moins un horodatage indiquant la date et/ou l’heure de génération de l’entité historique Ch. Dans l’exemple illustré par la figure 4, l’horodatage est illustré sous la forme d’une succession de chiffres dans chaque entité historique initiale Chi. Cet horodatage est,
par exemple, du type UNIX, c’est-à-dire qu’il désigne le nombre de secondes écoulées depuis le 1 er janvier 1970 à minuit UTC.
Avantageusement, chaque historique initial Hi comprend au moins une entité historique initiale Chi choisie parmi une entité représentative de : une date et une heure de création d’une source de données (horodatage), un fichier considéré dans une source de données, et une information unitaire représentée sur une ou plusieurs lignes indexées d’un fichier.
Ainsi, dans l’exemple illustré par la figure 5, qui est une extension du premier historique initial Hi 1 illustré en figure 4, il est représenté trois entités historique initiales Chi additionnelles et trois relations historique initiales Rhi additionnelles, à savoir :
- une entité historique initiale Chi dont le type est « Date-heure » et dont la valeur est « 11/03/2020 14 : 20 »,
- une entité historique initiale Chi dont le type est « Fichier » et dont la valeur est « C/Documents/aaa.xls »,
- une entité historique initiale Chi dont le type est « Ligne » et dont la valeur est « 1446 »,
- une relation historique initiale Rhi établissant une relation entre les entités historique initiales « Source : Source A » et « Date-heure : 11/03/2020 14 : 20 », dont le type est « Relation » et la valeur « A date-heure »,
- une relation historique initiale Rhi établissant une relation entre les entités historique initiales « Source : Source A » et « Fichier : C/Documents/aaa.xls », dont le type est « Relation » et la valeur « A fichier », et
- une relation historique initiale Rhi établissant une relation entre les entités historique initiales « Fichier : C/Documents/aaa.xls » et « Ligne : 1446 », dont le type est « Relation » et la valeur « A ligne ».
En variante, l’historique initial Hi de chaque ou d’au moins une entité est vide. Cela est notamment le cas lorsque la source de données d’origine est inconnue.
Le procédé de traçage comprend une étape 110 de détermination d’au moins une donnée finale Df. La donnée finale Df est issue de la fusion d’au moins deux éléments initiaux Ei appartenant à des données initiales Di différentes, notamment issues de sources de données différentes. La fusion est effectuée selon une stratégie de fusion.
A l’issue de la fusion, il est obtenu un élément fusionné Ec ayant un type et une valeur. Par exemple, le type de l’élément fusionné Ec est le type de l’un des éléments initiaux Ei dont est issu l’élément fusionné Ec ; et la valeur de l’élément fusionné Ec est la valeur de l’un des éléments initiaux Ei dont est issu l’élément fusionné Ec.
La stratégie de fusion stipule notamment que les éléments fusionnés appartiennent à une même catégorie d’éléments, c’est-à-dire soit tous à la première catégorie d’éléments, soit tous à la deuxième catégorie d’éléments.
Notamment, dans un exemple, la stratégie de fusion met en œuvre des fonctions F, à savoir :
- une fonction de compatibilité propre à tester si les types des éléments à fusionner sont compatibles,
- une fonction de similarité propre à tester la similarité entre les valeurs des éléments à fusionner en fonction d’un seuil de similarité, et une fonction de fusion propre à définir le type et la valeur de l’élément fusionné Ec résultant de la fusion.
Chaque fonction F a, par exemple, un nom, des données d’entrées, un ou plusieurs paramètres et des données de sortie (résultats). Ces informations (données d’entrées, paramètres, données de sortie, nom de la fonction) sont, par exemple, représentées par au moins un type et au moins une valeur correspondante dans un historique (historique de fusion), chaque type et chaque valeur associée définissant un élément, dit élément de fonction.
La fusion est, par exemple, effectuée selon un procédé tel que décrit dans le document FR 2 986 636 A, le document FR 2 940 487 A ou encore dans l’article de Laudy, C., Ganascia, J. G., & Sedogbo, C. (2007, July), High-level fusion based on conceptual graphs. In 2007 10th International Conference on Information Fusion (pp. 1 -8) IEEE.
Un exemple de donnée finale Df sous la forme d’un graphe conceptuel G est illustrée sur la figure 3. La donnée finale Df est issue des données initiales Di représentées par les graphes conceptuels G1 et G2. En particulier, l’entité Ci « Homme : John Dow » de la donnée initiale Di (première donnée) représentée par le premier graphe conceptuel G1 a été fusionnée avec l’entité Ci « Personne : J. Dow » de la donnée initiale Di (deuxième donnée) représentée par le deuxième graphe conceptuel G2. Le résultat de la fusion est l’entité fusionnée Ce « Homme : John Dow ». Ainsi, dans cet exemple, le type et la valeur de l’entité fusionnée Ce sont le type et la valeur de la première donnée. Mises à part les entités initiales Ci fusionnées qui ont été remplacées par l’entité fusionnée Ce, la donnée finale Df comprend les mêmes éléments et liaisons que les données initiales Di.
Le procédé de traçage comprend une étape 120 de détermination d’un historique de fusion Hc pour chaque élément fusionné Ec.
L’historique de fusion Hc est une donnée permettant notamment de remonter aux éléments initiaux Ei dont est issu l’élément fusionné Ec. L’historique de fusion Hc comprend, ainsi, une information relative au type et à la valeur de chaque élément initial Ei
dont est issu l’élément fusionné Ec, au type et à la valeur de l’élément fusionné Ec et des données relatives à la stratégie de fusion.
Dans un exemple de mise en œuvre, l’historique de fusion Hc présente la même forme que les données initiales Di et que la donnée finale Df. Ainsi, si les données initiales Di sont sous la forme d’une représentation ontologique, telle qu’un graphe conceptuel, il en sera de même pour la donnée finale Df et l’historique de fusion Hc.
Dans cet exemple, l’historique de fusion Hc comprend des éléments historique Eh et des liaisons historique Lh. Chaque élément historique Eh a un type et une valeur. Les types des éléments historique Eh comprennent notamment les types des éléments initiaux Ei, de l’élément fusionné Ec et des éléments de fonction représentatifs des fonctions F utilisées lors de la mise en œuvre de la stratégie de fusion. Les valeurs des entités des graphes historique sont par exemple les valeurs des éléments initiaux Ei, de l’élément fusionné Ec et des éléments de fonction représentatifs des fonctions F utilisées lors de la mise en œuvre de la stratégie de fusion. Pour les éléments de fonction, les valeurs représentent, par exemple, le nom de la fonction de compatibilité choisie, le nom de la fonction de similarité choisie, le nom de la fonction de fusion ou la valeur du seuil de similarité.
Les éléments historique Eh appartiennent : soit à une première catégorie d’éléments historique dits entités historique Ch, regroupant les éléments initiaux Ei, l’élément fusionné Ec et les éléments de fonction, soit à une deuxième catégorie d’éléments historique, dits relations historique Rh.
Les liaisons historique Lh relient des entités historique Ch entre elles par l’intermédiaire des relations historique Rh. Notamment, les entités historique Ch sont représentatives des éléments initiaux Ei, de l’élément fusionné Ec et des éléments de fonction représentatifs des fonctions F de la stratégie de fusion, et les relations initiales Ri établissent un lien entre ces éléments.
Avantageusement, les relations historique Rh et les liaisons historique Lh sont représentatives de la stratégie de fusion appliquée aux éléments initiaux Ei via les éléments de fonction pour obtenir l’élément fusionné Ec.
Avantageusement, l’historique de fusion Hc déterminé pour chaque élément fusionné Ec inclut l’historique initial Hi de chaque élément initial Ei dont est issu l’élément fusionné Ec. Une telle inclusion permet une non-perte d’information lors de fusions multiples.
Un exemple d’historique Hc est illustré par les figures 6 et 7 pour un élément fusionné Ec obtenu à la suite de deux fusions d’éléments. La première fusion est illustrée sur la figure 7 et la deuxième fusion sur la figure 6.
La première fusion a permis d’obtenir l’entité fusionnée Ec « Homme : John Dow », à partir des entités initiales « Homme : John Dow » et « Personne : J. Dow ». L’encadré C1 de l’historique Ec donne les informations relatives à la première fusion.
En particulier, la partie de l’historique de fusion Hc relative à la première fusion comprend : l’élément fusionné Ec « Homme : John Dow » résultant de la première fusion, les historiques initiaux Hi 1 et Hi2 des entités initiales Chi dont est issu l’élément fusionné Ec,
- les entités historique Ch et relations historique Rh relatives à la stratégie de fusion comprenant : o une entité historique Ch de type « Fonction de fusion » et de valeur « garder nom complet », o une entité historique Ch de type « Stratégie de fusion » et de valeur « *», o une entité historique Ch de type « Seuil » et de valeur « 0,8 » o une entité historique Ch de type « Mesure de similarité » et de valeur « détection des initiales », o une relation historique Rh de type « Relation » et de valeur « A ressource », o une relation historique Rh de type « Relation » et de valeur « Fonction de fusion », o une relation historique Rh de type « Relation » et de valeur « Fonction de compatibilité », et o une relation historique Rh de type « Relation » et de valeur « Produit par ».
La deuxième fusion a permis d’obtenir l’entité fusionnée Ec « Homme : John Dow », à partir de l’entité initiale « Personne : J. Dow » et de l’entité issue de la première fusion « Homme : John Dow ». L’encadré C2 de l’historique Ec donne les informations relatives à la deuxième fusion.
La partie de l’historique de fusion Hc relative à la deuxième fusion comprend notamment : l’élément fusionné Ec « Homme : John Dow » résultant de la deuxième fusion, les historiques des entités dont est issu l’élément fusionné Ec : historique initial Hi3 et la partie de l’historique relative à la première fusion, et
- les entités historique Ch et relations historique Rh relatives à la stratégie de fusion qui sont, dans ce cas, les mêmes que pour la première fusion.
L’ensemble des types des entités historique Ch correspondants à l’exemple des figures 6 et 7 est récapitulé sur la figure 8. Les types des entités sont dans cet exemple :
« Personne » et « Homme », ces entités se rapportant aux entités initiales et fusionnées, le type « Homme » étant un sous-type du type « Personne ».
« Stratégie de fusion », « Mesure de similarité », « Seuil », « Fonction de fusion », ces entités se rapportant à la stratégie de fusion, et
« Source », cette entité se rapportant aux sources de données.
Avantageusement, chaque entité historique Ch est associée à au moins une donnée complémentaire choisie parmi : un horodatage indiquant la date et/ou l’heure de génération de l’entité historique Ch (illustré dans les cases entités des exemples des figures 6 et 7), une donnée relative au lieu de génération de l’entité historique Ch, et une donnée relative à l’ordinateur par lequel a été générée l’entité historique Ch, une donnée relative à un utilisateur de l’ordinateur par lequel a été générée l’entité historique Ch.
Optionnellement, le procédé de traçage comprend une étape 130 d’acquisition d’une commande d’affichage de l’historique de fusion Hc obtenu pour un élément fusionné Ec. Par exemple, la commande émane d’un opérateur et est acquise via l’interface homme- machine 22 du calculateur 10. La commande est, par exemple, émise en vue de vérifier la provenance des éléments fusionnés Ec.
Le procédé de traçage comprend une étape 140 d’affichage de l’historique de fusion Hc dudit élément fusionné Ec sur un afficheur, tel que l’afficheur 24 du calculateur 10. En fonction de l’historique affiché, les données finales Df sont par exemple considérées fiables ou non fiables, notamment si la source de donnée d’origine est considérée fiable ou non fiable.
Optionnellement, lorsque les données initiales Di sont relatives à au moins un équipement, le procédé comprend une étape 150 de mise en œuvre d’une action sur l’équipement en fonction de la ou de données finales Df obtenues, et d’au moins un historique de fusion Hc. Par exemple, si les données initiales Di et finales Df sont relatives à la maintenance d’un équipement, l’action de maintenance correspondant aux données finales Df est réalisée sur l’équipement, notamment s’il a été déterminé que les données finales Df sont fiables au vu des historiques de fusion.
Ainsi, le présent procédé permet via la détermination d’un historique de fusion Hc d’améliorer la compréhension et la fiabilité des données issues d’une fusion de données,
ainsi que la compréhension elle-même en tant qu’opération sur ces données. Cela facilite, ainsi, l’exploitation des données fusionnées.
Le présent procédé s’applique ainsi particulièrement au domaine technique du traitement d’informations, avec application par exemple à l’aide à la décision ou à l’analyse de situations ou de systèmes complexes, notamment lorsque les informations à fusionner sont issues de diverses sources d’informations hétérogènes. En particulier, de nombreuses applications militaires et civiles utilisent des systèmes d’analyses et de décision basés sur des informations issues d’une pluralité de sources hétérogènes, comme par exemple une pluralité de capteurs (ex : surveillance de périmètres, détection et classification de cibles, autoguidage des munitions pour le domaine militaire, pour le domaine civil : maintenance industrielle, prévision météorologique, télédétection).
Une application est, par exemple, l’analyse de données de sources hétérogènes pour la collection de preuve. Dans ce contexte, la fusion sémantique est utilisée pour fusionner des données hétérogènes provenant de différentes sources de données. La traçabilité permise par le présent procédé permet de fiabiliser les preuves collectées.
Une autre application est, par exemple, l’étude des informations échangées sur les réseaux sociaux où des informations de différents niveaux de qualité sont utilisées. Notamment, différents niveaux de crédibilité sont attribués aux différents acteurs des réseaux sociaux. Ainsi, lors de l’utilisation des informations relayées sur les réseaux sociaux, le présent procédé permet de remonter à l’origine de l’information, ce qui permet d’en évaluer la fiabilité.
Le présent procédé permet notamment de (i) tracer les différentes fusions effectuées (ii), suivre les étapes effectuées tout en gardant l’ordre de leurs réalisations, (iii) avoir une preuve des étapes réalisées, et (iv) comprendre les étapes réalisées avec un besoin d’interprétabilité.
Dans un mode de mise en œuvre, le procédé permet de garder un historique de toutes les fusions réalisées. Les traces des fusions sont, par exemple, représentées à l’aide de graphes conceptuels avec une ontologie propre qui est composée de (i) sous-type et super-type de l’entité qui a été fusionnée; (ii) d’ontologie propre à la traçabilité représentant des informations liées à la fusion, et (iii) d’ontologie propre aux sources d’informations. Les entités et relations du graphe d’historique, représentant l’historique des différentes fusions pour une entité donnée, permettent de représenter la fonction de similarité et le seuil associé, la fonction de fusion et la fonction de compatibilité associés aux fusions. Ces traces sont représentées pour chaque entité ou relation sous la forme d’une propriété en plus qui représente son historique. Chaque information est de préférence horodatée au moment où elle est créée pour garder une trace sûre et sans ambiguïté.
Le présent procédé propose de suivre le processus de fusion sémantique de données hétérogènes en ajoutant à chaque entité fusionnée un historique sous la forme d’un graphe conceptuel avec son propre formalisme. Cette solution permet de suivre l’évolution de la fusion de chaque concept et relations. Le fait d’ajouter cet historique à chaque entité facilite l’historique et la lisibilité de l’information en sachant pour chaque entité d’où elle provient. Le fait d’utiliser le même formalisme (des graphes conceptuels) et de stocker l’information d’historique sous la même forme que l’historique en lui-même permet, d’une part, une homogénéité de l’information et, d’autre part, s’il est souhaité condenser l’historique (graphe d’historique) ou fusionner deux historiques (deux graphes d’historique ou plus), de définir des fonctions de similarité et de fusion propre au graphe d’historique.
Ainsi, le présent procédé présente notamment les avantages suivants : (i) la trace des différentes fusions réalisées ; (ii) la trace de tous les paramètres et stratégie de fusion ; (iii) l’utilisation de graphes conceptuels pour représenter la trace (même manière de représenter la connaissance que l’information en elle-même qui sera fusionnée) permet de fusionner des traces si elles sont redondantes pour rendre une information de traçabilité elle-même condensée ; (iv) le procédé est générique et adaptable à n’importe quel cas d’utilisation ; (v) le procédé permet à un opérateur de comprendre les différentes étapes qui ont mené à l’information synthétique.
L’homme du métier comprendra que les modes de réalisation précédemment décrits peuvent être combinés pour former de nouveaux modes de réalisation pourvu qu’ils soient compatibles techniquement. Notamment, des variantes de représentation des données initiales, finales et des historiques sont compatibles avec le présent procédé. En outre, les exemples décrits portent sur la fusion d’entités, mais le présent procédé est aussi compatible avec la fusion de relations. De plus, les types et les valeurs des entités et relations mentionnées ne sont pas limitatifs et sont à adapter en fonction de l’application visée.
Claims
1. Procédé de traçage numérique de données issues de plusieurs sources de données, le procédé étant mis en œuvre par ordinateur et comprenant les étapes de : a. obtention de données initiales (Di) issues de plusieurs sources de données, chaque donnée initiale (Di) comprenant des éléments initiaux (Ei) et des liaisons initiales (Li), chaque élément initial (Ei) ayant un type et une valeur, chaque élément initial (Ei) appartenant à une première catégorie d’éléments, dits entités initiales (Ci), ou à une deuxième catégorie d’éléments, dits relations initiales (Ri), les liaisons initiales (Li) reliant des entités initiales (Ci) entre elles par l’intermédiaire d’une relation initiale (Ri), b. détermination d’une donnée finale (Df) en fonction d’au moins deux données initiales (Di) suite à la fusion d’éléments initiaux (Ei) desdites données initiales (Di) entre eux selon une stratégie de fusion, les éléments initiaux (Ei) fusionnés appartenant à une même catégorie d’éléments et permettant d’obtenir un élément fusionné (Ec), l’élément fusionné (Ec) ayant un type et une valeur, et c. détermination d’un historique de fusion (Hc) pour chaque élément fusionné (Ec), l’historique de fusion (Hc) comprenant le type et la valeur de chaque élément initial (Ei) dont est issu l’élément fusionné (Ec), le type et la valeur de l’élément fusionné (Ec) et des données relatives à la stratégie de fusion.
2. Procédé selon la revendication 1 , dans lequel la stratégie de fusion met en œuvre des fonctions (F), chaque fonction (F) étant représentée par un ensemble d’éléments de fonction comprenant chacun un type et une valeur, l’historique de fusion (Hc) comprenant des éléments historique (Eh) et des liaisons historique (Lh), chaque élément historique (Eh) ayant un type et une valeur, les éléments historique (Eh) appartenant à : a. une première catégorie d’éléments historique dits entités historique (Ch), regroupant les éléments initiaux (Ei), l’élément fusionné (Ec) et les éléments de fonction représentatifs des fonctions (F), et b. une deuxième catégorie d’éléments historique, dits relations historique (Rh),
les liaisons historique (Lh) reliant des entités historique (Ch) entre elles par l’intermédiaire des relations historique (Rh).
3. Procédé selon la revendication 2, dans lequel les relations historique (Rh) et les liaisons historique (Lh) sont représentatives de la stratégie de fusion appliquée aux éléments initiaux (Ei) via les éléments de fonction pour obtenir l’élément fusionné (Ec).
4. Procédé selon l’une quelconque des revendications 1 à 3, dans lequel chaque élément initial (Ei) a, en outre, un historique initial (Hi) comprenant le type et la valeur de l’élément initial (Ei), ainsi que des données d’identification de la source de données dont est issu l’élément initial (Ei), l’historique de fusion (Hc) déterminé pour chaque élément fusionné (Ec) incluant l’historique initial (Hi) de chaque élément initial (Ei) dont est issu l’élément fusionné (Ec).
5. Procédé selon l’une quelconque des revendications 1 à 4, dans lequel chaque entité historique (Ch) est associée à au moins une donnée complémentaire choisie parmi : a. un horodatage indiquant la date et/ou l’heure de génération de l’entité historique (Ch), b. une donnée relative au lieu de génération de l’entité historique (Ch), c. une donnée relative à l’ordinateur par lequel a été générée l’entité historique (Ch), et d. une donnée relative à un utilisateur de l’ordinateur par lequel a été générée l’entité historique (Ch).
6. Procédé selon l’une quelconque des revendications 1 à 5, dans lequel les données initiales (Di) d’au moins une source de données sont issues de mesures effectuées par un capteur.
7. Procédé selon l’une quelconque des revendications 1 à 6, dans lequel le procédé comprend : a. une étape d’acquisition d’une commande d’affichage de l’historique de fusion (Hc) déterminé pour un élément fusionné (Ec), et b. une étape d’affichage de l’historique de fusion (Hc) dudit élément fusionné (Ec) sur un afficheur.
17
8. Procédé selon l’une quelconque des revendications 1 à 7, dans lequel les données initiales (Di) sont relatives à au moins un équipement, le procédé comprenant une étape de mise en œuvre d’une action sur l’équipement en fonction de la ou de données finales (Df) obtenues, et d’au moins un historique de fusion (Hc).
9. Produit programme d’ordinateur comportant un support lisible d’informations, sur lequel est mémorisé un programme d’ordinateur comprenant des instructions de programme, le programme d’ordinateur étant chargeable sur une unité de traitement de données et mettant en œuvre un procédé selon l’une quelconque des revendications 1 à 8 lorsque le programme d’ordinateur est mis en œuvre sur l’unité de traitement des données.
10. Support lisible d’informations sur lequel est mémorisé un produit programme d’ordinateur selon la revendication 9.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR2012607A FR3117228A1 (fr) | 2020-12-03 | 2020-12-03 | Procédé de tracage numérique de données |
PCT/EP2021/083829 WO2022117677A1 (fr) | 2020-12-03 | 2021-12-01 | Procédé de traçage numérique de données |
Publications (1)
Publication Number | Publication Date |
---|---|
EP4256444A1 true EP4256444A1 (fr) | 2023-10-11 |
Family
ID=75953891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP21823871.5A Pending EP4256444A1 (fr) | 2020-12-03 | 2021-12-01 | Procédé de traçage numérique de données |
Country Status (4)
Country | Link |
---|---|
US (1) | US20240020341A1 (fr) |
EP (1) | EP4256444A1 (fr) |
FR (1) | FR3117228A1 (fr) |
WO (1) | WO2022117677A1 (fr) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7899883B2 (en) * | 2008-06-13 | 2011-03-01 | Microsoft Corporation | Merging versions of documents using multiple masters |
FR2940487A1 (fr) | 2008-12-19 | 2010-06-25 | Thales Sa | Procede et systeme pour la fusion de donnees ou d'informations |
US8346814B2 (en) * | 2009-05-29 | 2013-01-01 | Nokia Corporation | Method and system of splitting and merging information spaces |
FR2986636A1 (fr) | 2012-02-03 | 2013-08-09 | Thales Sa | Procede de traitement d'informations incertaines issues d'une pluralite de sources heterogenes et procede d'aide automatique a la decision associe |
WO2013178528A1 (fr) * | 2012-06-01 | 2013-12-05 | Thomson Licensing | Procédé de stockage de données et de synchronisation de données dans un système de stockage de données distribué |
US9699205B2 (en) * | 2015-08-31 | 2017-07-04 | Splunk Inc. | Network security system |
-
2020
- 2020-12-03 FR FR2012607A patent/FR3117228A1/fr active Pending
-
2021
- 2021-12-01 WO PCT/EP2021/083829 patent/WO2022117677A1/fr active Application Filing
- 2021-12-01 US US18/255,528 patent/US20240020341A1/en active Pending
- 2021-12-01 EP EP21823871.5A patent/EP4256444A1/fr active Pending
Also Published As
Publication number | Publication date |
---|---|
FR3117228A1 (fr) | 2022-06-10 |
WO2022117677A1 (fr) | 2022-06-09 |
US20240020341A1 (en) | 2024-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110428091B (zh) | 基于数据分析的风险识别方法及相关设备 | |
FR3020616A1 (fr) | Dispositif de signalisation d'objets a un module de navigation de vehicule equipe de ce dispositif | |
EP2370938A2 (fr) | Procede et systeme pour la fusion de donnees ou d'information | |
US10169384B2 (en) | Augmented reality model comparison and deviation detection | |
CN111435357A (zh) | 加油站客户流失预测方法、装置、电子设备及存储介质 | |
FR2929411A1 (fr) | Procede et systeme de pistage et de suivi d'emetteurs. | |
CN115828242A (zh) | 基于大型异构图表示学习的安卓恶意软件检测方法 | |
US11614337B2 (en) | Systems and methods for the classification of geographic locations based on vehicle trip logs | |
Nik Effendi et al. | Unlocking the potential of hyperspectral and LiDAR for above-ground biomass (AGB) and tree species classification in tropical forests | |
FR2795848A1 (fr) | Systeme d'intelligence artificielle pour la classification d'evenements, d'objets ou de situations a partir de signaux et de parametres discriminants issus de modeles | |
WO2019123113A1 (fr) | Mise en grappe de facettes sur un cube à facettes bidimensionnelles permettant une exploration de texte | |
WO2021180441A1 (fr) | Mises a jour de bases de donnees de navigation | |
WO2022117677A1 (fr) | Procédé de traçage numérique de données | |
EP0863488A1 (fr) | Procédé de détection de contours de relief dans une paire d'images stéréoscopiques | |
FR3118502A1 (fr) | Procédé de construction et d’entraînement d’un détecteur de la présence d’anomalies dans un signal temporel, dispositifs et procédé associés | |
van Erp et al. | Georeferencing animal specimen datasets | |
Heipke et al. | Updating geospatial databases from images | |
CN110162797B (zh) | 文章质量检测方法和装置 | |
EP2810223B1 (fr) | Procédé de traitement d'informations incertaines issues d'une pluralité de sources hétérogènes et procédé d'aide automatique à la décision associé | |
EP2328115A1 (fr) | Procédé, dispositif et système pour la fusion d'informations provenant de plusieurs capteurs | |
EP4222612A1 (fr) | Procédé et dispositif électronique de génération d'une base structurée de données pertinentes pour la gestion d'une mission, programme d'ordinateur associé | |
EP3340065A1 (fr) | Procédé de détermination de l'état d'un système, procédé de détermination d'une méthode de projection optimale et dispositif mettant en oeuvre lesdits procédés | |
WO2020249719A1 (fr) | Procede et systeme de fusion d'informations | |
Knapp et al. | A Multi-model Approach for Video Data Retrieval in Autonomous Vehicle Development | |
Yousfi et al. | Computer and Information Sciences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: UNKNOWN |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE |
|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE |
|
17P | Request for examination filed |
Effective date: 20230601 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR |
|
DAV | Request for validation of the european patent (deleted) | ||
DAX | Request for extension of the european patent (deleted) |