WO2010070142A2

WO2010070142A2 - Procede et systeme pour la fusion de donnees ou d'information

Info

Publication number: WO2010070142A2
Application number: PCT/EP2009/067666
Authority: WO
Inventors: Claire Fraboulet-Laudy; Jean-Gabriel Ganascia
Original assignee: Thales; Centre National De La Recherche Scientifique; Universite Pierre Et Marie Curie
Priority date: 2008-12-19
Filing date: 2009-12-21
Publication date: 2010-06-24
Also published as: WO2010070142A3; US20120072402A1; FR2940487A1; EP2370938A2; US8818929B2

Abstract

Procédé pour la fusion d'informations de haut niveau sémantique représentant des situations complexes composées de plusieurs objets provenant de plusieurs capteurs ci, lesdites informations pouvant être hétérogènes, ledit procédé comportant les étapes suivantes : acquérir les différentes informations issues desdits capteurs sous forme brute et les transformer pour les mettre sous la forme de graphes conceptuels, un graphe conceptuel représentant plusieurs concepts et les relations qui existent entre eux, et étant composés de nœuds entités et de nœuds relations, avec E l'ensemble des nœuds concepts définis sur un support S, G₁ et G₂ deux graphes conceptuels définis sur S, caractérisé en ce que le procédé détermine une stratégie de fusion notée strategie_fusion comme suit : strategie_fusion =f_fusionΟf_comp :E xE→E∪{ E xE} où f_fusion :{vrai, faux} xE xE→E∪{ E xE} est une fonction de fusion des nœuds concepts des graphes, et f_comp : E xE→{vrai, fauxjxE xE est une fonction de test de compatibilité entre deux nœuds concepts des graphes, et en ce que le procédé comporte une étape au cours de laquelle ladite stratégie de fusion est appliquée aux différentes informations se présentant sous la forme des graphes.

Description

PROCEDE ET SYSTEME POUR LA FUSION DE DONNEES OU

D'INFORMATIONS

L'invention concerne la fusion d'informations provenant de plusieurs capteurs et plus particulièrement le traitement d'informations ou de données issues de capteurs hétérogènes, les données ou informations pouvant elles-mêmes être non homogènes. L'opération de fusion est opérée au moyen d'un processeur, par exemple, au sein d'un système de surveillance. A l'issue de cette opération, le résultat est transmis, par exemple sous la forme d'un signal de commande. Le signal peut être un signal déclenchant un processus de contrôle, ou encore d'affichage de l'information issue de la fusion. Il peut aussi prendre la forme d'un signal d'alarme.

Les systèmes intégrant plusieurs capteurs sont utilisés dans une grande variété de domaines, tels que la surveillance de site, la maintenance, la robotique, les prévisions météorologiques, mais aussi la programmation de systèmes ou de dispositifs tels que des enregistrements de programme TV. De tels systèmes peuvent aussi être mis en œuvre dans des systèmes d'interprétation d'informations issues des médias. Fusionner de l'information ou des données est un processus primordial pour la prise de décision, et ce, quelque soit le domaine d'intérêt dans lequel est pris la décision. En effet, la première étape dans un processus de prise de décision est la collecte d'informations ou de données permettant d'évaluer une situation. Ces informations peuvent provenir de sources variées et être exprimées sous différents formats ou médias. Une fois collectées, les informations doivent être combinées et arrangées de façon à obtenir une vue globale mais synthétique de la situation. Cette combinaison d'informations de nature hétérogène en une vue unique et cohérente constitue un problème complexe à résoudre, mais toutefois, nécessaire pour déclencher et commander des actions en fonction du résultat de la fusion. Une grande majorité des études concernant la fusion d'informations s'attache à fusionner des données homogènes et de bas niveaux numériques essentiellement. D'autres méthodes consistent à fusionner des données de bas niveau de façon à en déduire des informations de plus haut niveau. Par exemple, les données issues de capteurs sismiques, acoustiques, chimique, etc. sont fusionnées et interprétées afin de détecter de façon plus générale, la présence d'une personne dans une pièce ou l'utilisation d'un ordinateur. Ces méthodes s'intéressent toutefois, à des données d'entrée qui sont numériques et de bas niveau, même si la sortie du système de fusion est une information de niveau sémantique plus élevé. Les données de bas niveau sont, par exemple, des pistes radar, des coordonnées d'objets, des vitesses, etc. L'interprétation de ces données est simple et ne nécessite pas d'avoir la connaissance générale du domaine d'intérêt. Certaines méthodes de fusion d'informations reposent sur la théorie de Dempster-Shafer, théorie généralisant la théorie des probabilités, et utilise ainsi des fonctions de croyance. Les fonctions de croyance sont connues pour leur capacité à représenter fidèlement les informations et la vérité de ces informations. La demande de brevet FR 0705528 du Demandeur est un exemple de sa mise en œuvre pour fusionner des informations issues de capteurs indépendants.

De par la généralisation des systèmes informatiques et l'évolution technologique des capteurs sensibles aux événements physiques, les sources d'information se sont multipliées et diversifiées. Corrélativement, les modalités (texte, parole, image, signal RADAR, etc.) sous lesquelles l'information est donnée se sont, elles aussi, multipliées. Afin de bénéficier de la multiplicité des sources et de construire une représentation du monde globale, il devient donc nécessaire de fusionner les informations entre elles, et ce, quelle que soit leur modalité. La fusion d'informations peut être découpée en plusieurs niveaux. Le premier concerne la fusion d'informations portant sur les caractéristiques des objets. Ce niveau de fusion permet d'identifier et raffiner, par fusion de plusieurs observations, l'estimation des caractéristiques des objets présents dans le monde. Le second niveau porte sur la fusion d'objets. Il s'agit d'apprécier l'état des objets présents dans le monde. Le troisième porte sur la découverte des relations entre les différents objets présents dans le monde.

Un des buts de la présente demande de brevet est d'intégrer des informations hétérogènes en les fusionnant à un haut niveau de représentation et en prenant en compte la sémantique qu'elles véhiculent. Les expressions « haut niveau de représentation ou encore sémantique élevée » sont utilisées pour différencier les objets visés par la présente demande de brevet des données numériques de bas niveau. Ainsi les objets traités par le procédé selon l'invention se présentent sous la forme de phrase, d'expression, de syntaxe, etc. Ainsi, un des objectifs de la présente demande de brevet est de fusionner des symboles plutôt que des nombres et avoir une représentation symbolique des objets et des heuristiques. Les heuristiques seront exprimées en fonction de la sémantique (i.e. signification) des informations à fusionner.

La publication de Laudy et al, intitulée « High-level fusion based on conceptual graphs, in 10th International Conférence on Information Fusion, Québec 2007, et celle de 2008, « Information fusion using conceptual graphs : a TV programs case study, in additional Proceeding of the 16th International Conférence on Conceptual Structures, Toulouse, France, pp158-165, proposent une approche pour la fusion symbolique reposant sur l'utilisation des graphes conceptuels connus de l'Homme du métier.

La publication de 2008 précitée, décrit l'utilisation du formalisme des graphes conceptuels pour représenter la connaissance et les informations dans le cadre d'un système de recommandation pour la télévision numérique intelligente. Le système de recommandation analyse les descriptions des programmes télévisés et décide de recommander ou non un programme à un utilisateur spécifique. Pour ce faire, les auteurs utilisent une plateforme de fusion afin d'obtenir des descriptions de programmes télévisés précises et sûres, à la fois en ce qui concerne le planning de programmation et la description du contenu du programme.

Le modèle des graphes conceptuels proposé par JF Sowa et repris dans la publication précitée est essentiellement composé d'un support et des graphes eux-mêmes. Un graphe conceptuel représente plusieurs concepts et les relations qui existent entre eux. Les graphes conceptuels sont composés de nœuds entités et de nœuds relations. La figure 1 représente des entités qui sont dessinées sous forme de rectangles alors que les relations sont ovales. La théorie des graphes conceptuels repose, entre autres, sur l'utilisation d'un support. Le support est une hiérarchie des types de concepts et de relations manipulés. C'est-à-dire qu'il s'agit de l'ensemble de tous les types objets et relations présents dans le monde réel que l'on va représenter, organisés sous la forme d'une hiérarchie. Le support peut donc être vu comme une ontologie simplifiée du domaine d'intérêt qui comprend uniquement les types d'objets et le type de relation. Un nœud concept d'un graphe conceptuel est représenté par deux entités et peut s'écrire sous la forme suivante : [T : r]. T est le type de concept. Il s'agit du type d'objet du monde réel qui est représenté, r est la valeur ou la mesure observée pour l'objet représenté. Par exemple, pour représenter une température de 30 degrés, on pourra écrire le concept [Température : 30], où Température est le type du concept et 30 est sa valeur, aussi appelée réfèrent dans la suite de la description.

Concernant le processus de fusion lui-même, il repose également sur le modèle des graphes conceptuels. L'opération de jointure maximale définie par Sowa rappelé dans les articles précités est utilisée afin de fusionner deux sous-graphes compatibles de deux graphes conceptuels. La figure 1 illustre cette opération. Ainsi, le graphe G₃ est le résultat de la fusion de Gi et de G₂ en utilisant la jointure maximale. Toutefois, l'utilisation de la jointure maximale seule n'est pas suffisante pour fusionner des informations provenant de systèmes réels. Les données réelles sont en effet bruitées et des connaissances sur le domaine sont souvent nécessaires afin de fusionner deux valeurs compatibles, mais différentes. Par exemple, des observations comme une personne nommée « J.Smith » et une personne nommée « M. John Smith » ne sont pas égales, mais le paramètre connaissance pousse à penser que ces deux observations rendent compte de la même personne. Ceci peut aussi s'appliquer à des données représentatives d'un paramètre physique mesuré par un capteur dont l'unité de mesure n'est pas exprimée selon un même format. Les méthodes et dispositifs selon l'art antérieur ne permettent pas de répondre à la problématique précitée. Elles sont restreintes à des données stockées sous forme numériques (pas de chaînes de caractères, par exemple) et sont mises en œuvre dans le cadre de situation très simple, se résumant à une mesure ou à l'état d'une caractéristique d'un objet. Un des objectifs est donc ici de proposer une méthode permettant de fusionner des informations représentant des situations complexes.

Les approches existantes pour la fusion d'informations sont très largement axées vers la fusion de données simples : on fusionne pour obtenir la valeur d'une seule caractéristique d'un seul objet. Au contraire de ces approches, le procédé et le système selon l'invention permettent de représenter et fusionner directement des informations de haut niveau sémantique dans le cadre de situations complexes, où plusieurs acteurs ou objets sont en jeu, liés par des relations spatiales, temporelles ou sémantiques. Un but de l'invention est notamment de rendre paramétrable le procédé de fusion d'informations ou de données en prenant en compte, notamment la connaissance métier et les préférences utilisateur, et au moyen d'un processus de fusion adapté, par exemple, de parvenir à fusionner des données ou des informations qui sont initialement présentées sous des formats hétérogènes et qui vérifient le critère de compatibilité selon une valeur seuil fixée. L'objet de l'invention concerne un procédé pour la fusion d'informations de haut niveau sémantique représentant des situations complexes composées de plusieurs objets ou données provenant de plusieurs capteurs ci, lesdites informations ou données pouvant être hétérogènes, ledit procédé étant exécuté sur un processeur et comportant les étapes suivantes : o acquérir les différentes informations ou données issues d'au moins deux capteurs sous forme brutes et les transformer au sein dudit processeur pour les mettre sous la forme de graphes conceptuels, un graphe conceptuel représentant plusieurs concepts et les relations qui existent entre eux, un graphe conceptuel étant composé de plusieurs nœuds ci entités et de nœuds relations, avec E l'ensemble des nœuds concepts définis sur un support S, Gi et G₂ deux graphes conceptuels définis sur S, les graphes ainsi obtenus étant mémorisés dans une base de données, o définir une base de connaissance contenant des informations propres au domaine d'application de la fusion de données et les règles appliquées dans ledit domaine d'application, et soumettre lesdites informations à une transformée au sein du processeur afin de les présenter sous une forme de graphes conceptuels, le procédé étant caractérisé en ce qu'il comporte une étape où l'on détermine une stratégie de fusion notée

comme suit :

=f fusion ofcomp :E xE^Eu{ E xE} où ffusbn :{vrai, faux} xE xE->Eu{ E xE} est une fonction de fusion des nœuds concepts des graphes, et fcomp : E xE->{vrai, fauxjxE xE est une fonction de test de compatibilité entre deux nœuds concepts des graphes, et en ce que le procédé comporte une étape au cours de laquelle ladite stratégie de fusion est appliquée aux différentes informations issues de la base de connaissance et de la base d'observations se présentant sous la forme des graphes, étape à l'issue de laquelle les données fusionnées sont transmises à un système de prise de décision.

Le procédé utilise, par exemple, comme fonction de compatibilité entre deux nœuds une fonction exprimée sous la forme suivante : fcomp : E x E->{vrai, faux} x E xE où E est l'ensemble des nœuds concepts définis sur un support S et Gi et G₂ sont deux graphes conceptuels définis sur S à comparer.

V( Ci , C₂) G E XE, 3v=f_COmp( Ci , C₂) G V et V=(b, Ci , C₂)

Où v c{vrai, faux} x E x E Et bG Jvrai, faux} où b est une valeur logique

Selon un autre mode de réalisation, le procédé utilise une fonction de compatibilité f_COmp entre deux nœuds concepts c-i, C₂ desdits graphes G-i, G₂ déterminée par rapport à la similarité existant entre les deux éléments de deux graphes à fusionner avec f_Com_P(ci , c₂)=sim(ci, C₂) supérieure ou égale à une valeur seuil.

Afin de définir la compatibilité de deux éléments en fonction de la proportion de constituants identiques entre ces deux éléments, le procédé comporte une mesure de similarité normalisée respectant les conditions (k-i), (k₂) et (k₃) suivantes :

(ki) v(e, e')G ExE ; sim(e, e')=sim(e', e) (symétrie)

(k₂) V(e, e')G ExE avec e différent de e' ; sim(e, e)=sim(e', e')>sim(e, e')

(KO Ve G E sim_norm (e, e) =1 avec E l'ensemble des nœuds concepts définis sur un support S, sim un indice de similarité défini sur ExE ->R⁺ On peut utiliser une fonction de compatibilité f_COmp entre deux nœuds concepts c-i , C₂ à comparer, un nœud concept étant associé à un graphe respectivement G-i, G₂, calculée en fonction d'une distance définie telle que f∞m(c-ι, c₂)=dist(ci, C₂) est inférieure ou égale à une valeur seuil. La mesure de distance est déterminée, par exemple, en fonction des données stockées dans la base de connaissance et vérifie les conditions (kθ, (k'₂), (k₄) et (k₅)

(k-ι) V(e, e')e ExE ; sim(e, e')=sim(e', e) (symétrie)

(k'2) Ve G E diss(e, e) = 0

(k4) dist(e, e')=0 =>e=e'

(k5) dist(e, e')≤dist(e, e") +dist(e", e') Ve, e', e" G E (inégalité triangulaire) La fonction de fusion peut être déterminée de la manière suivante : > ffusion :{vrai, faux} xE xE-> Eu{ E xE} où E est l'ensemble des nœuds concepts définis sur un support S et Gi et G₂ sont deux graphes conceptuels définis sur S à fusionner. Par ailleurs :

ffusion (vrai, Ci , C₂) = f_fus(ci , c₂)=c ffaux (vrai, Ci , C₂) = Id(Ci , C₂)= (ci , C₂)

où f_fus : E xE->E est une fonction définie par un expert du domaine d'application,

C G E est le concept résultant de la fusion de ci et C₂ et Id est la fonction identité définie sur E xE.

L'invention concerne aussi un système pour la fusion d'informations de haut niveau sémantique représentant des situations complexes composées de plusieurs objets ou données provenant de plusieurs capteurs ci, caractérisé en ce qu'il comporte au moins les éléments suivants : o plusieurs capteurs Ci permettant l'observation des informations et des entrées, o Une base de connaissance comprenant des éléments caractéristiques de l'application de fusion et adaptés à paramétrer l'étape de fusion exécutée dans le procédé selon la revendication 1 , et une base d'informations contenant toutes les données issues des capteurs, o Un processeur adapté pour transfomer des informations issues de la base de connaissance et de la base d'informations sous une forme de représentation de graphes conceptuels, lesdites informations mises en forme étant transmises à un processeur adapté à exécuter les étapes suivantes :

- une étape où l'on détermine une stratégie de fusion notée

comme suit :

=f fusion of∞mp :E xE->Eu{ E xE} où f_fusion :{vrai, faux} xE xE->Eu{ E xE} est une fonction de fusion des nœuds concepts des graphes, et fœm_p : E xE->{vrai, fauxjxE xE est une fonction de test de compatibilité entre deux nœuds concepts des graphes.

- une étape au cours de laquelle ladite stratégie de fusion est appliquée aux différentes informations mémorisées se présentant sous la forme des graphes, étape à l'issue de laquelle les données fusionnées sont transmises à un système de prise de décision, o au moins une sortie en liaison avec des dispositifs de commande d'enregistrement et/ou d'affichage des résultats issus de la fusion de données.

Le système de fusion est, par exemple, associé à un dispositif d'enregistrement de programmes TV et en ce qu'il comprend deux sources d'informations qui fournissent des données, traitées de façon à associer à chacune un graphe conceptuel, les informations issues de ces graphes étant fusionnées en tenant compte des préférences utilisateurs présentes dans la base de connaissance et en ce qu'il comporte un module adapté à associer à une émission TV une catégorie et un module émettant un signal représentatif ou encore un signal de commande audit dispositif d'enregistrement.

L'invention sera mieux comprise et d'autres avantages apparaîtront mieux à la lecture de la description détaillée de modes de réalisation donnés à titre d'exemple, description faite en regard de dessins annexés qui représentent :

• la figure 1 , un exemple de fusion de deux graphes conceptuels,

• la figure 2, un synoptique du procédé mis en œuvre dans la présente invention suivant les différents niveaux d'interprétation (quantité de connaissance du domaine nécessaire pour représenter l'information),

• la figure 3, un synoptique du procédé mis en œuvre dans la présente invention, suivant le flux des données,

• la figure 4, un exemple d'architecture pour l'enregistrement de l'application TV,

• la figure 5, un exemple de hiérarchie pour un programme de télévision, et

• les figures 6A et 6B des informations liées à un programme télévision.

Principe du procédé

Le procédé est applicable sur des informations émises sous la forme de langage naturel, textuel ou audio, de données semi-structurées ou encore de données de bas niveau, dans la mesure où il existe un système, automatisé ou non, permettant de décrire, sous forme de graphes conceptuels, le contenu de ces informations en les replaçant dans leur contexte.

La figure 2 schématise un exemple de mise en œuvre du procédé pour différents capteurs C-i, C₂, etc. qui constituent plusieurs sources d'informations différentes. Les informations captées sont tout d'abord extraites par un système d'extraction 10 ou d'interprétation qui a notamment pour fonction d'obtenir l'observation de A et l'observation de B. Les deux observations A et B sont ensuite transmises à un système d'identification 1 1. Les observations A et B sont examinées afin de déterminer si elles sont compatibles et correspondent ou non à des descriptions du même objet dans le monde réel. Un critère de compatibilité est prédéterminé en fonction du domaine d'application de l'invention 12. Si les observations A et B vérifient ce critère, alors elles sont compatibles et fusionnées et sont représentées sur la figure 2 sous la forme AB ou encore ABC lorsque ces trois valeurs sont compatibles.

En cas d'observations incompatibles qui ne vérifient pas ce critère et reflétant visiblement les descriptions de deux objets différents, le procédé détermine alors les relations existant entre les objets. Une telle incompatibilité entre les observations peut se produire, par exemple, lorsqu'une requête de fusion est faite à partir de capteurs pointant, a priori, sur un même dispositif de mémorisation d'un système d'observation ou de surveillance pouvant contenir plusieurs objets. L'incompatibilité entre les observations pourra être due, par exemple, au fait que les capteurs ont observé deux objets différents mais qui sont proches spatialement. Dans ce cas, le procédé permettra de rendre compte à la fois du fait que deux objets distincts existent et de la relation spatiale existant entre les deux objets. Une fois ces relations découvertes, il sera alors possible de décider laquelle des descriptions doit être renvoyée au système à l'origine de la requête de fusion.

Dans les différentes étapes mises en œuvre, le procédé utilise le formalisme des graphes conceptuels pour représenter la connaissance et les informations, tel que celui décrit à la figure 1. Le même modèle va être utilisé pour effectuer le processus de fusion. L'originalité de la présente demande de brevet est notamment d'utiliser l'opérateur de jointure maximale classique et de l'adapter afin de prendre en compte la connaissance métier et les préférences utilisateur. Avantageusement, ceci va permettre de fusionner des données ou des informations incompatibles au sens de la fusion des graphes. La description va faire appel à des heuristiques de fusion à l'intérieur de la jointure maximale. Ces heuristiques de fusion seront appelées « stratégies de fusion ». Les stratégies de fusion sont des fonctions composées qui vont permettre d'encoder de la connaissance associée à un domaine d'application. Elles sont utilisées afin d'étendre la notion de compatibilité entre deux concepts de deux graphes différents. La figure 3 représente de manière schématique les éléments nécessaires à la mise en œuvre de l'invention. Le système comporte plusieurs capteurs Ci qui vont recueillir les informations ou données à fusionner. Ces informations sont transmises à un dispositif d'interprétation et d'extraction 10 afin de les transformer pour qu'elles apparaissent sous une forme de graphes conceptuels. Les observations ainsi mises en forme sont stockées dans une mémoire 13 ou base d'observations qui est en relation avec une base de connaissance métier 12 qui contient différentes données relatives à un métier, un domaine de métier ou un domaine de connaissance, qui vont servir à paramétrer l'étape de fusion. Cette base de connaissances 12 est constituée par exemple par un utilisateur 14 du système. Cette base de connaissance va servir pour la mise en œuvre des différents éléments intervenant dans le procédé : opérateurs mathématiques, paramètres, règles métiers, etc. Les interrogations s'effectuent, par exemple, sous la forme de requêtes transmises de l'utilisateur vers le module 15. Les connaissances de la base 12 et les observations de la mémoire 13 sont mises en correspondance au travers de l'utilisation des opérateurs du module 15 afin de répondre aux requêtes. Ces requêtes permettent à l'utilisateur 14, par exemple, de visualiser la représentation de la situation réelle suivant différents points de vue. Les informations issues des capteurs sont stockées dans la base d'observations, les informations issues de la connaissance du domaine (base de connaissance et règles métiers) et saisies par un opérateur du système sont, elles, stockées dans la base de connaissance. APPLICATION TV

L'exemple qui suit va être donné dans le cadre d'un système de recommandation utilisé pour la télévision numérique intelligente. Le système de recommandation a, notamment pour fonction, d'analyser les descriptions des programmes télévisés et de recommander ou non un programme à un utilisateur spécifique. Pour ce faire, l'invention utilise une plateforme de fusion telle que celle décrite aux figures 3 et 4 afin d'obtenir des descriptions de programmes télévisés précises et fiables, à la fois en ce qui concerne le planning de programmation et la description du contenu du programme. La plateforme de fusion est, par exemple, constituée de modules et d'équipements physiques, tels que des mémoires, des bases de connaissance, processeurs, entrée/sortie permettant l'acquisition et la communication des données entre le système de fusion selon l'invention et les dispositifs de capteurs des données et d'enregistrement ou d'affichage de résultat.

L'exemple va être donné dans un cadre où le nombre de chaînes de télévision disponibles s'accroit très rapidement, l'objectif du système développé est d'aider les utilisateurs à choisir les programmes télévisés qu'ils apprécieront de regarder ou de sauvegarder. Une première étape consiste à construire un système de recommandation pour les programmes télévisés, système qui sera ensuite couplé à un système d'enregistrement vidéo permettant d'enregistrer automatiquement les programmes pertinents pour un utilisateur lorsque celui-ci est absent ou encore un système d'affichage des informations qui seront ensuite utilisées par un utilisateur. Dans le cadre de l'application télénumérique, le système de recommandation est construit grâce à une phase d'apprentissage des habitudes des utilisateurs. Les émissions regardées par les utilisateurs sont étudiées, par le biais de leurs caractéristiques des programmes qui l'intéressent. Cette définition est faite automatiquement, via une phase d'apprentissage, par un algorithme d'apprentissage connu de l'Homme du métier. Les informations sont stockées, par exemple, dans une base d'observations ou base de connaissance.

La figure 4 est un exemple d'architecture possible pour l'enregistrement automatique de certains programmes TV selon des préférences d'un utilisateur. Le système comprend deux sources d'information 20, 21 qui fournissent des données en formant XMLTV via des entrées 28 du système de fusion et de gestion de l'information obtenue. Les données issues de ces deux sources sont traitées de manière à associer pour chacune de ces sources un graphe de concepts 22a, 22b. Les informations des deux graphes sont tout d'abord stockées dans une base de données 23. Elles sont ensuite fusionnées F en tenant compte des éléments mémorisés dans la base de connaissance 27 et selon la méthode détaillée ci-après qui prend en compte les préférences de l'utilisateur accessibles dans le domaine de connaissances. Les informations fusionnées sont ensuite transmises à un dispositif 24 ayant notamment pour fonction d'analyser les descriptions des programmes télévisés, de déterminer à quelle catégorie appartient une émission afin, ensuite, de la recommander ou non à un utilisateur ou encore de transmettre un signal permettant son enregistrement ou encore son affichage sur un écran comme aide à un utilisateur. Ce dispositif 24 va aussi gérer et commander 25 l'enregistrement ou non d'une émission sur des systèmes d'enregistrement vidéo 26A, 26B, 26C ou gérer l'émission d'un signal d'affichage sur un écran 30 qui peut prendre la forme d'une recommandation ou encore être un signal d'alarme. Il est aussi possible de transmettre un signal à une alarme sonore. Les signaux transitent par les sorties 29 du système ou plateforme de fusion. La plateforme de fusion permet d'obtenir des descriptions de programmes télévisés précis et sûrs, à la fois en ce qui concerne le planning de programmation et la description du contenu de ce programme. Le dispositif 24 utilise des informations stockées dans la base d'observations regroupant les graphes.

Pour décider de recommander ou non une émission à un utilisateur, au préalable, on analyse automatiquement les émissions qui sont regardées par cet utilisateur. Ensuite, il faut avoir un moyen de comparer une nouvelle émission à celles qui ont été regardées ou non par le passé par ce même utilisateur. Pour cela, on associe des catégories aux émissions. Une façon très simple d'associer une catégorie à une émission serait de prendre la catégorie proposée par le magazine TV. Cependant, cette façon de faire n'est pas assez précise et donne des résultats peu satisfaisants. Pour cette raison, les personnes qui travaillent sur l'aspect recommandation du système de télévision numérique intelligente ont intégré un module supplémentaire qui détermine la catégorie d'une émission en fonction, entres autres, de mots clés, de sa catégorie, de son heure de diffusion... Le module 24 permettant de classifier une émission dans une catégorie est à distinguer du processus de fusion et de gestion de l'information. Cependant, c'est grâce à la fusion des informations disponibles sur les différentes sources, qu'il est possible d'obtenir suffisamment de caractéristiques sur chacune des émissions afin de les ranger par catégorie. Ce module permettant de déterminer la catégorie à laquelle appartient une émission est un des modules qui utilisent directement le résultat du module de fusion.

Un nouveau programme télévisé est évalué sur la base de sa description. La description d'un tel programme doit contenir les dates de début et de fin de programme, ainsi que le contenu de ce programme. C'est à cette condition que le système d'enregistrement automatique enregistrera les bonnes plages horaires. Le système de recommandation utilisait initialement le flux de données et méta-données transitant via la télévision numérique terrestre ou TNT française, appelé « DVB » pour Digital Video Broadcast. Les métas données de la TNT comprennent des informations telles que le titre, la date de début, la durée, le genre de chaque programme télévisé. Cependant, très peu d'informations sont disponibles quant au contenu du programme lui-même. Afin d'obtenir des descriptions plus détaillées les informations issues de cette source sont fusionnées à celles issues d'une seconde source : le magazine TV en ligne et en poche représenté par la référence 21. Ce sont entre autre, ces données qui entrent dans la composition de la base de données ou base de connaissance utilisée par l'invention. Outre des informations sur le titre, la date de programmation et la durée de chaque programme le magazine produit des informations liées au contenu de chacun d'entre eux. Ainsi, il y aura souvent une description ou un résumé en langage naturel ainsi qu'un avis sur la qualité du programme. Pour un film, par exemple, le réalisateur, l'année de réalisation, les acteurs, etc. seront mentionnés. Selon le modèle des graphes conceptuels exposés précédemment, l'ontologie comprend toutes les entités existant dans un domaine d'application ainsi que les relations qui peuvent exister entre elles. Le mot ontologie est utilisé pour désigner un ensemble structuré des termes et concepts représentant le sens d'un champ d'informations, que ce soient par les métadonnées d'un espace de noms, ou les éléments d'un domaine de connaissances. L'ontologie constitue en soi un modèle de données représentatif d'un ensemble de concepts dans un domaine, ainsi que les relations entre ces concepts. Elle est employée pour raisonner à propos des objets du domaine concerné.

La figure 5 représente un exemple de hiérarchie et de sous- hiérarchies pour un programme TV. L'ensemble des situations susceptibles de se dérouler sont formulées à travers des bases canoniques. Les interactions potentielles entre les entités sont représentées en utilisant le graphe conceptuel associé à un exemple de modèle pour un programme TV. Après avoir défini le modèle du domaine, les observations sont automatiquement acquises dans le formalisme de graphes et stockées sous forme de graphes conceptuels selon des étapes connues de l'Homme du métier dans des mémoires du système TV. Les figures 6A et 6B montrent des exemples d'observations faites sur un flux DVB et sur le site Web de la revue télé poche. Ces observations sont stockées sous forme de graphe conceptuel. La partie droite et la partie gauche de la figure 6B présentent deux graphes conceptuels que le procédé va combiner avant de les fusionner. Il existe plusieurs possibilités d'exécuter la fusion de ces deux types d'observation. Le procédé selon l'invention va utiliser une fonction de jointure maximale étendue, telle que définie par la suite. Le procédé de fusion selon l'invention sera exécuté au sein d'un processeur du système, qui délivrera ensuite un message de commande vers le système d'enregistrement 26 (figure 4). Les données de travail étant définies, on va maintenant détailler les stratégies de fusion précitées qui s'inscrivent comme une extension de la jointure maximale définie par l'art antérieur précité. Pour cette raison, la construction de l'ensemble des hypothèses de fusion de deux graphes, reste dirigée par la recherche de projections compatibles, la notion de compatibilité entre deux nœuds concepts va être étendue selon le principe décrit ci- dessous.

La définition des stratégies de fusion précitées est organisée, dans le présent exemple, en deux parties : « La définition des conditions de compatibilité de deux concepts ou d'informations, et

• Le calcul de la valeur fusionnée de deux concepts ou informations selon des conditions de compatibilité prédéfinies et qui tiennent compte du domaine d'application ou des connaissances métier. Les stratégies de fusion peuvent être exprimées sous la forme d'une composition de fonctions :

Soit E l'ensemble des nœuds concepts définis sur un support S ou ontologie simplifiée. Soient Gi et G₂ deux graphes conceptuels définis sur S. Une stratégie de fusion notée

est définie comme suit :

E ^ E u {E x E} où le sigle o correspond à l'opération mathématique de composition de fonctions, et où f_fusi_on : {vrai, faux}xExE->Eu{E xE} est une fonction de fusion des nœuds concepts des graphes, et f_comp : E xE->{vrai, fauxjxE xE est une fonction de test de compatibilité entre deux nœuds concepts des graphes.

La stratégie de fusion a pour résultat soit le concept fusionné, si les concepts initiaux sont compatibles, soit les concepts initiaux, si ceux-ci ne sont pas compatibles, donc pas fusionnables. Jointure maximale selon une stratégie de fusion

Si E est l'ensemble des nœuds concepts définis sur un support S. Les graphes H, Gi et G₂ sont des graphes conceptuels définis sur S. f_COmp est une fonction de test de compatibilité définie sur E xE ->{vrai, fauxjxExE et ffusion est une fonction de fusion définie sur {vrai, faux} xExE-> Eu{ E xE}.

Le procédé selon l'invention concerne plus particulièrement le procédé de jointure maximale qui s'appuie sur les définitions de la spécialisation, de la généralisation et de la projection connues de l'Homme du métier. Soit fcomp, une fonction de compatibilité définie sur ExE->{vrai, fauxjxExE, soit deux graphes conceptuels Gi et G₂ ayant une généralisation commune H et soient les projections Pi :H->Gi et P₂ :H->G₂ . Pi et P₂ sont compatibles selon la fonction f_COmp si, pour chaque concept c du graphe H, les conditions suivantes sont respectées : • P-i ( c) et P₂( c) ont un sous-type commun différent du type absurde,

• Les référents ou composants de Pi( c) et P₂( c) sont conformes à leur sous-type commun le plus général,

• Les référents de Pi( c) et P₂( c) sont soit égaux, soit l'un des deux est indéfini, soit fcomp(Pi( c), P₂( c)) = (vrai, Pi( c), P₂( c)). Soit

=f fusion of_∞mp :E xE->Eu{ E xE} si deux projections Pi( c) et P₂( c) sont compatibles selon f_COmp, alors, par extension, on dit que Pi( c) et P₂( c) sont compatibles selon

La jointure simple de deux concepts est une opération définie dans le modèle des graphes conceptuels. Nous définissons son extension, la jointure simple de deux concepts selon une stratégie de fusion

ffusion of_∞mp :E xE->Eu{ E xE} comme suit :

Soit deux concepts Ci et C₂ tels que Ci =[ti :r-ι] et c₂=[t₂ :r₂], j= [t :r] est la jointure de ci et C₂ selon

si et seulement si • ti et t₂ ont un sous-type commun différent du type absurde, • t est le sous-type commun de ti et t₂ le plus général,

• n et r₂, respectivement les référents de Ci et C₂ sont conformes à t,

• n est indéfini et r= r₂ ou r₂ est indéfini et r= r^ ou r^ = r₂=r ou f_Com_P(ci , C₂) = (vrai, ci, C₂) et f_fus(ci, c₂)=j=[t :r].

Une définition de la jointure maximale selon une stratégie de fusion telle que

f fusion of_∞mp :E xE->Eu{ E xE} est donc donnée par la formulation suivante :

Définition : Soit H la généralisation commune des graphes Gi et G₂ la plus générale, Pi et P₂ sont deux projections compatibles de H sur Gi et G₂ selon une stratégie de fusion notée strategie_fusiorv Pi et P₂ sont maximalement étendues.

Si deux graphes contiennent des projections compatibles d'une généralisation commune H, ces projections peuvent être étendues en trouvant une généralisation commune plus grande (contenant plus de concepts et/ou relations), contenant H comme sous graphe. Deux projections compatibles sont dites maximalement étendues si elles n'ont pas de telle extension.

Soit H une généralisation commune des graphes Gi et G₂. Soient Pi et P₂ deux projections compatibles selon une fonction f_COmp telles que Pi : H->Gi et

P₂ : H->G₂ Pi et P₂ sont étendues de manière maximale si et seulement s'il n'existe pas de généralisation commune H' de Gi et G₂ telle que H est un sous graphe de H'.

Soit H la généralisation commune des graphes Gi et G₂ la plus générale. Pi et P₂ sont deux projections compatibles de H sur Gi et G₂ selon une stratégie de fusion notée strategie_fUsion- Pi et P₂ sont maximalement étendues. Une jointure selon une stratégie de fusion strategiefusion sur les projections étendues est appelée jointure maximale selon strategiefusion.

Une jointure selon une stratégie de fusion strategie_fusion sur ces projections étendues est appelée jointure maximale selon strategiefusion Stratégies de fusion

La stratégie de fusion fait appel à des notions définies ci-après. Une similarité ou dissimilarité est une application à valeurs numériques qui permet de mesurer le lien entre les individus d'un même ensemble. Pour une similarité le lien est d'autant plus fort que sa valeur est grande. Un indice de similarité ou plus simplement une similarité sur un ensemble E est une application sim : E xE->R⁺ qui vérifie les deux conditions suivantes : (k-i) v(e, e')e ExE ; sim(e, e')=sim(e', e) (symétrie)

(k₂) V(e, e')e ExE avec e différent de e' ; sim(e, e)=sim(e', e')>sim(e, e')

Un indice de similarité est une application diss qui satisfait à la condition ki ci-dessus, et à la condition suivante :

(k'₂) Ve G E diss(e, e) = 0

L'indice de similarité entre deux éléments d'un ensemble peut être normalisé. Dans ce cas, l'application sim_n0rm : ExE -> [0, 1 ] vérifie les deux conditions k-i et k₂ ainsi que la condition suivante : (KO Ve e E simnorm (e, e) =1

Une distance est un indice de dissimilarité qui vérifie en plus les deux propriétés suivantes :

(k-0 dist(e, e')=0 =>e=e'

(k₅) dist(e, e')≤dist(e, e") +dist(e", e') Ve, e', e" e E (inégalité triangulaire)

Définition de la compatibilité

La fonction de compatibilité mise en œuvre dans le procédé selon l'invention peut être définie par rapport à un critère à respecter pour déclarer deux informations « compatibles » pour une ou plusieurs valeurs. Par exemple, pour fixer les idées, la fonction de compatibilité pourra être définie soit en fonction de la distance entre deux valeurs, soit en fonction de toute autre fonction de similarité définie par des experts du domaine d'application. La fonction de compatibilité entre deux nœuds est de la forme suivante : f_∞mp : E x E->{vrai, faux} x E xE où E est l'ensemble des nœuds concepts définis sur un support S et Gi et G₂ sont deux graphes conceptuels définis sur S à comparer. V( C₁ , C₂) G E xE, 3v=f_COmp( C₁ , C₂) G V et v=(b, C₁ , C₂) où v c{vrai, faux} x E x E et bG Jvrai, faux} où b est une valeur logique

La compatibilité entre deux éléments d'un même ensemble peut être calculée, soit par rapport à la similarité existant entre ces deux éléments, soit par rapport à la distance le séparant. La suite de la description donne deux exemples de définition de la fonction de compatibilité selon la mesure de la similarité et la mesure de la distance. Chacune des approches est illustrée sur un cas concret concernant la fusion de description de programmes télévisés. Selon la similarité, la compatibilité de deux éléments peut être définie en fonction de la proportion de constituants identiques entre ces deux éléments. Il sera donc utilisé, dans un premier temps, une mesure de similarité normalisée pour tester la compatibilité de deux concepts, en vue de leur fusion. Cette mesure de similarité est déterminée par un expert du domaine d'application et doit respecter les conditions (k-i), (k₂) et (k₃) rappelées ci-avant. La fonction de compatibilité f_∞mp est donc de la forme suivante : f_∞mp^, C^=SJm(C₁, c₂)>seuil_sim où C₁ et C₂ sont des nœuds concepts à comparer, C₁G E et C₂G E où E est l'ensemble des nœuds concepts définis sur un support S, la valeur seuil_sim est une valeur fixée en fonction du domaine de l'application de l'invention.

Selon la distance, la compatibilité de deux éléments peut être testée en fonction de la distance séparant ces deux éléments. La mesure de distance est déterminée par un expert du domaine d'application et doit respecter les conditions (k-i), (k'₂), (k₄) et (k₅) rappelées ci-avant. Une fois la distance entre deux éléments calculée, elle est comparée à un seuil de compatibilité défini lui aussi par un expert du domaine d'application. La fonction de compatibilité a alors la forme suivante :

F_Comp(ci , c₂)=dist(ci , c₂)<seuildist où c-i et C₂ sont des nœuds concepts à comparer, c-|G E et C₂G E où E est l'ensemble des nœuds concepts définis sur un support S, la valeur pour seuildst est fixée par rapport à une application donnée.

La fonction de compatibilité appliquée par le procédé étant définie, l'étape suivante du procédé est d'exécuter une étape de fusion qui va mettre en œuvre une fonction de fusion explicitée ci-après.

La fonction de fusion permet, pour tout couple de nœuds concept de calculer s'il existe, le nœud concept correspondant à la fusion des nœuds initiaux. Si les nœuds initiaux ne sont pas compatibles, la fonction de fusion aura pour résultat les nœuds initiaux. La fonction de fusion de deux nœuds concepts est de la forme suivante : ffusion :{vrai, faux} xE xE-> Eu{ E xE} où E est l'ensemble des nœuds concepts définis sur un support S et Gi et G₂ sont deux graphes conceptuels définis sur S à fusionner.

Par ailleurs :

ffus_bn (vrai, c-i , C₂) = f_fus(ci , c₂)=c I ffaux (vrai, Ci , C₂) = Id(Ci , C₂)= (ci , C₂) où

- f_fus : E xE->E est une fonction définie par un expert du domaine d'application

- c e E est le concept résultant de la fusion de ci et C₂

- Id est la fonction identité définie sur E xE

II est parfois nécessaire de connaître le contexte de deux observations pour déterminer si elles sont compatibles ou non, et pour déterminer ensuite le résultat de leur fusion. Dans ce cas, les fonctions de compatibilité et de fusion définies par les experts du domaine vont prendre en compte les nœuds concepts et les relations se trouvant dans le voisinage des nœuds concepts étudiés.

Appliqué aux données acquises dans le cadre de la réalisation d'une interface intelligente pour la télévision numérique, la mise en œuvre de l'étape de comparaison et de l'étape de fusion est décrite en relation avec trois stratégies données à titre d'exemple. o Une première stratégie peut être d'étendre la notion de compatibilité entre les dates. Deux dates sont compatibles si la différence entre les deux est inférieure à une valeur seuil donnée, par exemple 5 minutes. Si deux dates sont compatibles mais différentes, la date la plus petite sera choisie s'il s'agit de la date de début de programme, sinon la date la plus tardive sera choisie. o Selon une deuxième stratégie, les notions de compatibilités sont étendues entre les dates et les titres. La compatibilité entre deux dates est calculée comme pour la première stratégie. Deux titres sont compatibles si l'un d'entre eux est contenu dans l'autre. o Selon une troisième stratégie, la notion de compatibilité est aussi étendue entre les dates et les titres. La compatibilité entre deux dates est calculée comme pour la première stratégie. Selon cette stratégie, deux titres sont compatibles si la longueur des sous chaînes communes aux deux titres excède un seuil donné.

L'illustration va être donnée en testant la compatibilité de deux nœuds concepts de type Titre en mettant en œuvre la fonction de compatibilité utilisée dans la troisième stratégie.

La fonction de compatibilité f_∞mp est définie sur E_τ xE_τ ->{vrai, faux} xE_τxE_τ La valeur d'un concept de type Titre est une chaîne de caractères représentant le titre du programme décrit. La fonction de similarité s'appuie sur la longueur cumulée des sous-chaînes de caractères communes entre les deux titres et elle est définie comme suit :

Soit E_τ l'ensemble des nœuds de type Titre, ni et n2 deux nœuds Titres tels que ni = [Titre :t1 ] et n2= [Titre : t2]. Pour le calcul de la similarité entre deux nœuds Titre, on définit la fonction de similarité sim : E_τxE_τ->[0, 1 ] telle que : sim([Titre : t1 ], [Titre : t2]) = sim_ti,_rθ(t1 , t2) Avec tailleSousChainesCommunes(t1 , t2) sim,_itrθ(t1 , t2) = max(taille(t1 ), taille(t2))

Où

L'exemple numérique qui suit a été effectué en testant la compatibilité de nœuds concepts de type Date. Il s'agit en fait des horaires de début et de fin de diffusion des programmes. Intuitivement, il a été choisi de représenter le fait que deux horaires distants de moins de 5 minutes sont compatibles. Afin de manipuler ces horaires sous forme d'entiers et faciliter ainsi les comparaisons, une transformation simple est appliquée, préalablement à tout test de compatibilité, sur les horaires. Chaque horaire est donné sous la forme du nombre de secondes qui s'est écoulé depuis une date de référence. La fonction de compatibilité f_∞mp est donc définie sur : E_Dx E_D->{vrai, faux} xE_Dx E₀, avec E₀ l'ensemble des nœuds concepts de type Date. Soit ndi e E₀ et nd₂ e E₀ deux nœuds Date, tels que nd-ι= [Date :d1 ] et nd₂ = [Date :d₂]. La distance dist :NxN ->{vrai, faux} est définie comme suit : dist([Date :di], [Date :d₂] = dist_date(di, d₂) avec dist_datθ(di, d₂) = I I d_r d₂1 I <300

Les horaires sont donnés en secondes et le seuil correspond à 5 minutes, soit 300 secondes.

Selon un autre mode de réalisation, l'invention s'applique aussi dans le domaine de la gestion de crise. Dans cette application, la définition du modèle du domaine est la toute première étape du processus de fusion.

Pour cela, on définit une ontologie du domaine, par exemple, la description d'une crise géopolitique.

On définit ensuite l'ensemble de situations que l'on souhaite rechercher à l'aide de graphes conceptuels canoniques non instanciés. Les relations potentiellement existantes dans le monde réel sont ainsi définies. L'exemple ci-dessous montre une situation abstraite à rechercher dans le monde réel. Il décrit un événement de type répression qui a lieu à une date donnée, a pour victime une entité qui soutient un certain groupe et est opposé à un autre. La répression est effectuée par un groupe de personnes qui lui aussi soutient un groupe et est opposé à un autre.

[Repression] -

-r_date->[DateCal] , -agent-> [GroupeDePersonnes] -

-soutient-> [GroupeDePersonnes : ?y] , -oppose_a-> [GroupeDePersonnes : ?x] ;

-victime-> [Entité] -

-soutient-> [GroupeDePersonnes : ?x] , -oppose_a-> [GroupeDePersonnes : ?y] ;

-consequence-> [Influence] -patient-> [GroupeDePersonnes : ?x] -consequence-> [Influence] -patient-> [GroupeDePersonnes : ?y]

Une fois la modélisation du domaine effectuée, il s'agit d'acquérir les observations qui se présentent sous la forme de dépêches journalistiques, de compte-rendu d'observation venant d'observateurs humains sur le terrain. Ceci correspond à des observations acquises grâce à un moteur d'extraction d'informations sur des données textuelles.

C'est sur ces données que le procédé va appliquer une étape de jointure maximale selon strategie_fusion définie précédemment.

Utilisation de la jointure maximale comme opérateur de fusion

L'objectif du procédé étant de fusionner autant de paires de concepts compatibles possibles entre deux graphes (deux observations), nous utilisons l'opérateur de jointure maximale. Cet opérateur permet de fusionner des concepts non égaux mais compatibles. De plus, il permet de fusionner le plus de concepts possibles. Cet opérateur donne, lui aussi, plusieurs résultats en fonction des différentes hypothèses de fusion possible.

Dans le cas de données réelles bruitées, deux observations du même objet pourront avoir des valeurs légèrement différentes. Dans ce cas, l'opérateur de jointure maximale n'autorisera pas la fusion des deux observations, alors que, avec la connaissance du domaine, un expert pourra aisément dire qu'il était nécessaire de le fusionner car elle représentait différentes vues du même objet. Un exemple d'un tel cas est donné ci- dessous. La fusion de :

[Repression]-agent->[Police] Et de :

[Repression]-agent->[policiers]

En utilisant la jointure maximale résulterait en le graphe suivant : [Repression]-

-agent->[Police], -agent->[policiers],

Or la connaissance du domaine permet de savoir que les policiers travaillent au sein d'une institution nommée « Police » et que l'on pourrait donc fusionner ces deux concepts.

Le procédé va paramétrer ce dispositif, afin d'intégrer de la connaissance du métier, nécessaire au processus de fusion.

Utilisation de la projection comme opérateur de requêtes

Lorsque les observations concernant une situation sont acquises et stockées sous forme de graphes conceptuels (éventuellement après fusion de ces observations), il s'agit de pouvoir interroger la base de connaissances ainsi constituée et faciliter l'accès à l'information. Là encore, le stockage sous forme de graphes permet l'utilisation de tous les opérateurs définis sur de telles structures. En particulier, l'opérateur de projection est utilisé afin de formuler des requêtes et y soumettre la base de connaissances.

La projection permet de trouver les occurrences spécialisées d'un graphe requête. Par exemple, le graphe requête suivant :

[Répression : ?x]-agent->[GroupeDePersonnes : « rebelles »] permettra d'obtenir la liste des répressions ayant été rapportées par les différents capteurs (ou observateurs), et étant à l'initiative du groupe de personnes nommé « rebelles ». Les projections précises étant difficilement exploitables telles quelles, nous proposons, comme pour la fusion, d'utiliser des heuristiques afin d'utiliser des projections approchées. Ces heuristiques ont pour objectif d'intégrer de la connaissance métier dans l'opérateur de requêtes, ici, la projection.

Paramétrisation à l'aide d'heuristiques métier

Le procédé étant générique, il s'agit ensuite de pouvoir aisément le paramétrer afin de l'adapter au domaine étudié. Le procédé comprend donc un ensemble de règles issues des connaissances métier. L'utilisation de telles règles permet d'injecter de la connaissance métier dans la plateforme de fusion à l'aide d'heuristiques aussi appelées stratégies.

Les stratégies définies pour l'étape d'identification sont appelées stratégies de « choix » car elles permettent de choisir la description à renvoyer en réponse à la requête de fusion. Les stratégies utilisées lors de l'étape de fusion sont des « stratégies de fusion », celles utilisée pour les requêtes à la base de connaissance, des « stratégies de requête ».

Dans tous les cas, il s'agit de règles ou fonctions, intégrant de la connaissance métier vis à vis des observations effectuées. Pour les stratégies de choix, les prémisses de ces règles sont des graphes conceptuels représentant les observations, ainsi que des conditions sur les valeurs des concepts et relations de ces graphes (utilisation des métriques de distance). La conclusion est un graphe conceptuel correspondant à la réponse à envoyer concernant la requête d'identification de(-s) l'observation(-s) valide(-s) - qui devront éventuellement être fusionnées. En ce qui concerne les stratégies de fusion, les prémisses des règles sont les deux relations à fusionner. De façon à prendre en compte le contexte de chacune des observations, les conditions présentes dans les prémisses des règles peuvent porter à la fois sur les valeurs des relations et objets en relations à fusionner, mais aussi sur le graphe complet décrivant l'observation. La conclusion d'une stratégie de fusion est la relation fusionnée. Autrement dit, il s'agit des deux objets résultant de la fusion des deux couples d'objets observés. Ces deux objets étant eux-mêmes liés par la relation correspondant à la fusion des deux relations initialement observées.

L'avantage d'utiliser de telles stratégies de fusion est la possibilité d'associer, à ce procédé générique, des fonctions de fusion par ailleurs largement étudiées et testées dans des domaines. Différentes applications

Le système de fusion selon l'invention peut être mis en oeuvre au sein d'un réseau de communication composé de plusieurs processeurs (sur lesquels sont mis en œuvre les capteurs, les effecteurs et le système de fusion) liés entre eux.

Le stockage des informations (base de connaissances du domaine et base d'observations) peut être effectué sur des disques durs.

Un capteur, dans le cadre de cette invention peut être à la fois un dispositif physique (caméra, radar, micro...) et le dispositif de traitement des données correspondantes.

L'objet de l'invention présente notamment les avantages listés ci- après :la possibilité de fusionner des informations extraites d'un rapport d'observations fait par un humain avec des informations extraites de dépêches de journaux ou encore d'autres sources rendant compte du même événement.

Le procédé est appliqué pour des situations complexes composées de plusieurs acteurs ou objets interagissant. Il s'applique pour des fusions de données de haut niveau sémantique en utilisant des connaissances métiers qui ont un niveau sémantique encore plus élevé.

Plusieurs configurations des capteurs ou des données acquises via les capteurs, profiteront des avantages conférés par l'invention. Nous dressons ici une liste non exhaustive des ces configurations. Observation absente sur un des capteurs Lorsqu'un des capteurs est en panne, il se peut qu'il n'y ait qu'une seule observation. Cette observation doit donc être, à elle seule, le résultat de la requête de fusion. Dans un système gérant les certitudes et les confiances associées à chaque résultat de fusion, la reconnaissance de cette configuration est importante, car elle peut avoir une incidence sur la confiance générale associée au résultat fusionné. Objet non reconnu par un des capteurs

Ce cas doit amener, d'une part, à la reconnaissance par la plateforme de fusion du caractère inconnu de l'objet observé par un des capteurs. D'autre part, la plateforme doit renvoyer au système émetteur de la requête l'observation effectuée par le capteur ayant reconnu l'objet sans la fusionner avec quoi que ce soit.

Observations incompatibles de deux objets différents

Dans ce cas, la fusion des deux observations ne doit pas avoir lieu. La tentative de fusion doit échouer, mais il est parfois préférable aussi que la requête ayant amené à cette demande de fusion ne reste pas sans réponse. Pour cette raison, les deux observations doivent être étudiées afin de déterminer lequel des capteurs a observé le bon objet afin de renvoyer sa description au système émetteur de la requête de fusion. Différents niveaux de granularité sur les objets observés selon le capteur A cause de la différence de précision des capteurs, il se peut que deux observations paraissent incompatibles et donc non fusionnables, alors qu'il s'agit pourtant bien de deux observations du même objet. Ainsi, un objet pourra être observé dans son ensemble par un des capteurs, alors qu'un second n'observera qu'une partie de l'objet. Par ailleurs, le capteur n'observant qu'une partie de l'objet rendra compte, la plupart du temps, de plus de détails concernant cet objet. Il s'agira alors, pour la plateforme de fusion de comprendre qu'il s'agit d'une telle configuration des observations. De plus, il sera intéressant de tirer partie, à la fois de la portion très détaillée de l'information, mais aussi de la vision globale de l'objet. Observations du même objet avec des points de vue différents

Le point de vue ou vocabulaire du capteur peut aussi engendrer un autre cas de figure : deux observations concernent le même objet, mais la façon de l'exprimer est différente est différente selon le capteur étudié. Il s'agira alors de ne pas déclarer ces deux observations comme étant incompatibles, puisque la connaissance du domaine permet d'affirmer qu'il s'agit bien du même objet dans la réalité.

Ainsi, le procédé et le système selon l'invention permettent de fusionner des connaissances de façon homogène et indépendante des modalités sous lesquelles l'information est donnée. Par ailleurs, ces connaissances peuvent être issues des différents niveaux de fusion. Le procédé est générique et peut être appliqué quels que soient les capteurs délivrant l'observation et quelle que soit la situation observée.

Claims

REVENDICATIONS

1 - Procédé pour la fusion d'informations de haut niveau sémantique représentant des situations complexes composées de plusieurs objets ou données provenant de plusieurs capteurs ci, lesdites informations ou données pouvant être hétérogènes, ledit procédé étant exécuté sur un processeur (22) et comportant les étapes suivantes : o acquérir les différentes informations ou données issues d'au moins deux capteurs (20, 21 ) sous forme brutes et les transformer (22a, 22b) au sein dudit processeur (22) pour les mettre sous la forme de graphes conceptuels, un graphe conceptuel représentant plusieurs concepts et les relations qui existent entre eux, un graphe conceptuel étant composé de plusieurs nœuds ci entités et de nœuds relations, avec E l'ensemble des nœuds concepts définis sur un support S, Gi et G₂ deux graphes conceptuels définis sur S, les graphes ainsi obtenus étant mémorisés dans une base de données (23), o définir une base de connaissance (27) contenant des informations propres au domaine d'application de la fusion de données et les règles appliquées dans ledit domaine d'application, et soumettre lesdites informations à une transformée au sein du processeur (22) afin de les présenter sous une forme de graphes conceptuels, le procédé étant caractérisé en ce qu'il comporte une étape où l'on détermine une stratégie de fusion notée

comme suit :

=f fusion ofcomp :E xE^Eu{ E xE} où f_fusbn :{vrai, faux} xE xE->Eu{ E xE} est une fonction de fusion des nœuds concepts des graphes, et fcomp : E xE->{vrai, fauxjxE xE est une fonction de test de compatibilité entre deux nœuds concepts des graphes, et soit deux graphes conceptuels Gi et G₂ ayant une généralisation commune H et soient les projections Pi :H->Gi et P₂ :H->G₂ , Pi et P₂ sont compatibles selon la fonction f_∞mp si, pour chaque concept c du graphe H, les conditions suivantes sont respectées :

• P-i ( c) et P₂( c) ont un sous-type commun différent du type absurde,

• Les référents ou composants de P-ι( c) et P₂( c) sont conformes à leur sous-type commun le plus général,

• Les référents de P-ι( c) et P₂( c) sont soit égaux, soit l'un des deux est indéfini, soit fcomp(P₁( c), P₂( c)) = (vrai, P-ι( c), P₂( c)). et en ce que le procédé comporte une étape au cours de laquelle ladite stratégie de fusion est appliquée aux différentes informations issues de la base de connaissance (27) et de la base d'observations (23) se présentant sous la forme des graphes, étape à l'issue de laquelle les données fusionnées sont transmises à un système de prise de décision.

2 - Procédé selon la revendication 1 , caractérisé en ce que l'on utilise comme fonction de compatibilité entre deux nœuds une fonction exprimée sous la forme suivante : fcomp : E x E->{vrai, faux} x E xE où E est l'ensemble des nœuds concepts définis sur un support S et G-i et G₂ sont deux graphes conceptuels définis sur S à comparer. V( Ci , C₂) G E XE, 3v=f_COmp( Ci , C₂) G V et V=(b, Ci , C₂)

Où v c{vrai, faux} x E x E et bG Jvrai, faux} où b est une valeur logique

3 - Procédé selon la revendication 1 , caractérisé en ce que l'on utilise une fonction de compatibilité f_comp entre deux nœuds concepts c-i, C₂ desdits graphes G-i, G₂ est déterminée par rapport à la similarité existant entre les deux éléments de deux graphes à fusionner avec f_Com_P(ci, c₂)=sim(c-ι, C₂) supérieure ou égale à une valeur seuil.

4 - Procédé selon l'une des revendications 1 et 2, caractérisé en ce que l'on définit la compatibilité de deux éléments en fonction de la proportion de constituants identiques entre ces deux éléments, le procédé comporte une mesure de similarité normalisée respectant les conditions (k-ι), (k₂) et (k₃) suivantes :

(k-ι) V(e, e')e ExE ; sim(e, e')=sim(e', e) (symétrie)

(k₂) V(e, e')e ExE avec e différent de e' ; sim(e, e)=sim(e', e')>sim(e, e')

(KO Ve e E simnorm (e, e) =1 avec E l'ensemble des nœuds concepts définis sur un support S, sim un indice de similarité défini sur ExE ->R⁺

5 - Procédé selon la revendication 1 , caractérisé en ce que l'on utilise une fonction de compatibilité f∞mp entre deux nœuds concepts c-i, C₂ à comparer, un nœud concept étant associé à un graphe respectivement G-i, G₂, est calculée en fonction d'une distance définie telle que f_COm(ci, c₂)=dist(c-ι , C₂) est inférieure ou égale à une valeur seuil.

6 - Procédé selon la revendication 5, caractérisé en ce que la mesure de distance est déterminée en fonction des données stockées dans la base de connaissance et vérifie les conditions (k-i), (k'₂), (k₄) et (k₅)

(k-ι) V(e, e')e ExE ; sim(e, e')=sim(e', e) (symétrie)

(k'2) Ve G E diss(e, e) = 0

(k4) dist(e, e')=0 =>e=e'

(k5) dist(e, e')≤dist(e, e") +dist(e", e') Ve, e', e" G E (inégalité triangulaire)

7 - Procédé selon la revendication 1 , caractérisé en ce que la fonction de fusion est déterminée de la manière suivante : ffusion :{vrai, faux} xE xE-> Eu{ E xE} où E est l'ensemble des nœuds concepts définis sur un support S et Gi et

G₂ sont deux graphes conceptuels définis sur S à fusionner. Par ailleurs : ffusbn (vrai, c-i , C₂) = ff_US(Ci , c₂)=c ffaux (vrai, Ci , C₂) = Id(Ci , C₂)= (ci , C₂)

où f_fus : E xE->E est une fonction définie par un expert du domaine d'application, c e E est le concept résultant de la fusion de Ci et C₂ et Id est la fonction identité définie sur E xE.

8 - Système permettant la fusion d'informations de haut niveau sémantique représentant des situations complexes composées de plusieurs objets ou données provenant de plusieurs capteurs ci, caractérisé en ce qu'il comporte au moins les éléments suivants : o plusieurs capteurs Ci permettant l'observation des informations et des entrées (28), o une base de connaissance (27) comprenant des éléments caractéristiques de l'application de fusion et adaptés à paramétrer l'étape de fusion exécutée dans le procédé selon la revendication 1 , et une base d'informations (23) contenant toutes les données issues des capteurs, un processeur (22) adapté pour transformer des informations issues de la base de connaissance (27) et de la base d'informations (23) sous une forme de représentation de graphes conceptuels, lesdites informations mises en forme étant transmises à un processeur adapté à exécuter les étapes mises en œuvre au sein du procédé selon la revendication 1 ,

o au moins une sortie (29) en liaison avec des dispositifs de commande d'enregistrement et/ou d'affichage des résultats issus de la fusion de données. 9 - Système de fusion d'informations selon la revendication 4, caractérisé en ce que ledit système de fusion est associé un dispositif d'enregistrement (26a, 26b, 26c) de programmes TV et en ce qu'il comprend deux sources d'informations (20, 21 ) qui fournissent des données, traitées de façon à associer à chacune un graphe conceptuel, les informations issues de ces graphes étant fusionnées en tenant compte des préférences utilisateurs présentes dans la base de connaissance et en ce qu'il comporte un module adapté à associer à une émission TV une catégorie et un module émettant un signal représentatif ou encore un signal de commande audit dispositif d'enregistrement.