FR3030079A1 - Moyens pour determiner un niveau de pertinence d’une ressource dans un systeme de traitement d’informations - Google Patents
Moyens pour determiner un niveau de pertinence d’une ressource dans un systeme de traitement d’informations Download PDFInfo
- Publication number
- FR3030079A1 FR3030079A1 FR1462154A FR1462154A FR3030079A1 FR 3030079 A1 FR3030079 A1 FR 3030079A1 FR 1462154 A FR1462154 A FR 1462154A FR 1462154 A FR1462154 A FR 1462154A FR 3030079 A1 FR3030079 A1 FR 3030079A1
- Authority
- FR
- France
- Prior art keywords
- user
- resource
- profile
- context
- resources
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 claims description 35
- 238000004891 communication Methods 0.000 claims description 8
- 230000004048 modification Effects 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 230000003993 interaction Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 14
- 230000009471 action Effects 0.000 description 10
- 238000007726 management method Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 239000004753 textile Substances 0.000 description 6
- 238000009826 distribution Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 235000019640 taste Nutrition 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Debugging And Monitoring (AREA)
- Mobile Radio Communication Systems (AREA)
- Information Transfer Between Computers (AREA)
Abstract
L'invention se rapporte à des moyens pour déterminer, pour un utilisateur, un niveau de pertinence d'une première ressource, parmi un ensemble de ressources accessibles par l'intermédiaire d'un système de traitement d'informations, en : • collectant des informations relatives à des évènements survenus en lien avec l'ensemble des ressources ; • créant ou obtenant un premier profil associé à l'utilisateur, le profil comportant : • calculant une probabilité pour que la première ressource soit pertinente pour l'utilisateur en fonction dudit premier profil.
Description
1 La présente invention se rapporte au domaine des systèmes de traitement personnalisé de l'information, et plus particulièrement, mais non exclusivement, à celui des systèmes de recherche d'information, de recherche d'utilisateurs de référence (par exemple d'experts), de constitution d'une bibliographie à l'aide de connaissances collectives, d'identification de sources d'information ou encore de recherche de données médicales. Elle concerne plus particulièrement des moyens de gestion de profils utilisateurs, ainsi que des moyens de traitement de l'information mettant à profit lesdits profils utilisateurs.
Le traitement de l'information numérique dans un domaine spécifique requiert une double compétence : une première dans le domaine considéré et une seconde dans l'exploitation des outils mis à disposition par le système de traitement de l'information. Dans l'exemple d'un système de recherche d'informations dans une base de données ou de documents, un utilisateur souhaitant obtenir une liste de liens vers des ressources pertinentes pour un sujet donné, doit connaitre et maitriser les commandes, les opérateurs particuliers (opérateurs booléens, filtres spécifiques, etc), et leurs syntaxes, pour exploiter au mieux les capacités dudit système de recherche d'informations. Il est donc peu aisé d'obtenir des résultats optimisés pour un utilisateur donné, la qualité des résultats obtenus étant fonction des capacités de l'utilisateur à formuler de manière optimale et adéquate une requête pertinente. De plus, on constate que les requêtes formulées par des utilisateurs sont souvent courtes et par conséquent ambigües. Ainsi, dans le cas d'un moteur de recherche Web, il a été observé que la taille moyenne d'une requête était de 3.08 termes, comme indiqué dans le document rédigé par Mona Taghavi, Ahmed Patel, Nikita Schmidt, Christopher WilIs, and Yiqi Tew, intitulé "An analysis of web proxy logs with query distribution pattern approach for search engines", Comput. Stand. Interfaces, 34(1): 162-170, janvier 2012.
Pour tenter de répondre à ce problème, il est connu, par exemple du document de brevet US n° 8 538 955, d'évaluer la pertinence des résultats obtenus pour un utilisateur en tenant compte partiellement de l'activité en ligne et de retours/réactions de ce dernier sur différents sites web, ainsi que celle d'utilisateurs tiers partageant avec l'utilisateur des goûts/opinions/préférences communs. Cependant, de tels systèmes de traitement de l'information numérique sont aujourd'hui insuffisament adaptés à la prise en compte conjointe des besoins de recherche d'information explicites et implicites des 3030079 2 utilisateurs. Cela est particulièrement vrai lorsqu'un utilisateur a une très bonne connaissance d'une partie du domaine sa recherche. C'est pourquoi il existe encore un besoin pour des moyens de gestion de profils utilisateurs, ainsi que des moyens de traitement de 5 l'information mettant à profit lesdits profils utilisateurs, notamment pour exploiter les compétences d'une communauté dans un processus d'accès à l'information, et aptes à permettre la prise en compte conjointe d'un contexte et des a priori propres à chaque utilisateur. Un des objets de l'invention est de permettre, à partir de sources de 10 données, l'extraction d'informations pertinentes pour un utilisateur. Un autre objet de l'invention est de permettre l'extraction d'informations pertinentes pour un utilisateur, sans nécessiter préalablement de phases d'apprentissage ou de configuration spécifique audit utilisateur. Un autre objet de l'invention est de permettre l'extraction d'informations pertinentes à partir de ressources de type 15 varié, par exemple à partir de documents, d'informations collectées par d'autres utilisateurs, de flux et/ou sources d'informations hétérogènes, etc. Un autre objet de l'invention est de permettre la prise en compte du contexte de la recherche de l'utilisateur. Un autre objet de l'invention est de permettre l'intégration de préférences explicites d'utilisateurs, difficilement ou non 20 extractibles automatiquement. Un autre objet de l'invention est de permettre, à partir de sources de données telle que des bases de données ou de documents, l'extraction d'informations pertinentes pour un utilisateur, y compris lorsque ce dernier dispose de compétences limitées pour formuler des requêtes. Un autre objet de l'invention est de permettre, à partir de sources de 25 données, l'extraction d'informations pertinentes pour un utilisateur, en s'appuyant sur des utilisateurs de référence. Un autre objet de l'invention est de permettre, à partir de sources de données, l'extraction d'informations pertinentes pour un utilisateur, en prenant compte, conjointement, les compétences d'une communauté dans un processus d'accès à l'information, un 30 contexte et des a priori propres à chaque utilisateur. Un ou plusieurs de ces objets sont remplis par la méthode et le dispositif selon les revendications indépendantes. Les revendications dépendantes fournissent en outre des solutions à ces objets et/ou d'autres avantages.
35 Plus particulièrement, selon un premier aspect, l'invention se rapporte à un procédé pour déterminer, pour un utilisateur, un niveau de pertinence d'une première ressource, parmi un ensemble de ressources accessibles par l'intermédiaire d'un système de traitement d'informations.
3030079 3 On désigne par "ressource", les informations et données accessibles à l'utilisateur par l'intermédiaire du système de traitement d'informations. Chaque ressource peut en particulier être identifiée par un identifiant unique, typiquement un identifiant de ressource unique, plus 5 généralement désigné par l'acronyme anglo-saxon « URI » pour « Uniform Resource Identifier », définit notamment dans le document RFC 3986. Une ressource peut être un document électronique, par exemple une page web, une image ou un document bureautique. Une ressource peut aussi être un système délivrant un flux ou une source de données ou d'informations ou encore un 10 utilisateur. Le procédé comporte les étapes suivantes : - collecte d'informations relatives à des évènements survenus en lien avec l'ensemble des ressources ; - création ou obtention d'un premier profil associé à l'utilisateur, le profil comportant : 15 o au moins un contexte adapté pour permettre la représentation de l'ensemble des conditions susceptibles d'influencer un choix de l'utilisateur et/ou un jugement de pertinence de l'utilisateur relatif(s) aux ressources de l'ensemble de ressources accessibles par l'intermédiaire du système de traitement d'informations ; et, 20 o un premier ensemble comportant au moins un a priori adapté pour permettre la détermination, pour la première ressource, d'un niveau de pertinence selon au moins une propriété mesurable de la première ressource ; et, o un deuxième ensemble comportant au moins une référence à un 25 deuxième profil associé à un utilisateur de référence pour l'utilisateur ; - calcul d'une probabilité pour que la première ressource soit pertinente pour l'utilisateur en fonction dudit premier profil. Le profil de l'utilisateur ainsi créé ou obtenu comporte trois 30 dimensions : au moins un contexte, le premier ensemble, et le deuxième ensemble. Ainsi, en utilisant les trois dimensions du profils conjointement, il est possible d'exploiter le profil de l'utilisateur de manière optimale, comparativement à un profil qui n'exploiterait qu'une parmi lesdites trois dimensions. En effet, les trois dimensions du profil ainsi construit par le procédé 35 selon l'invention interagissent entre-elles en se complétant et se corrigeant. De la même manière que l'humain exploite conjointement son environnement (c'est-à-dire le contexte), son instinct et ses acquis (c'est-à-dire les a priori) et ses pairs (utilisateurs de référence) pour ses prises de décision, le présent 3030079 4 procédé exploite de la même manière ces trois dimensions pour permettre la personnalisation des ressources fournies aux utilisateurs par exemple suite à une requête de ce dernier. Au cours de l'étape de calcul, dans un mode de réalisation, la 5 probabilité que la première ressource soit pertinente pour l'utilisateur peut être obtenue en : - sélectionnant, selon au moins un critère, dans le deuxième ensemble, au moins un profil associé à un des utilisateurs de référence ; - calculant une deuxième probabilité que la première ressource soit 10 pertinente, en fonction dudit au moins un profil associés à un des utilisateurs de référence ; - calculant la probabilité que la première ressource soit pertinente pour l'utilisateur en fonction de la deuxième probabilité et dudit au moins un contexte du premier profil et d'au moins un a priori du premier ensemble.
15 Par exemple, le critère pour sélectionner, dans le deuxième ensemble, ledit au moins un profil associé à un des utilisateurs de référence peut être la similarité entre un des contextes dudit au moins un profil associé à un des utilisateurs de référence et le contexte de la première ressource. Ledit au moins a priori peut être une fonction adaptée pour 20 permettre la détermination, pour la première ressource, du niveau de pertinence selon au moins une des propriétés suivantes : une taille de la première ressource, une date de création de la première ressource, un nombre de liens ou de références pointant sur la première ressource, un rapport signal sur bruit de la première ressource, un type d'adresse par lequel la première ressource 25 est accessible ; un niveau de popularité de la première ressource, un niveau de qualité de la première ressource. Les informations relatives à des évènements survenus en lien avec les ressources peuvent comprendre une ou plusieurs informations parmi la liste suivante : un type d'événement, un identifiant de la ressource ayant produit 30 l'évènement ; une liste ordonnée d'identifiants de ressources résultantes fournis par le système de traitement des informations ; un ensemble de métadonnées associées à l'événement. Au cours de l'étape de collecte, seules les informations relatives à des évènements survenus en lien avec les ressources et répondant à un 35 ensemble de critères propres à l'utilisateur peuvent être collectées. Par exemple, les évènements collectés peuvent être dans un premier temps classés selon leur type sur une échelle comportant des niveaux allant de 0 à 3. Le niveau 0 marque le désintérêt manifeste de l'utilisateur pour les ressources 3030079 5 associées à l'événement, typiquement pour une ressource hors du domaine de l'utilisateur. Le niveau 1 marque un désintérêt modéré, par exemple pour une ressource dans le domaine de l'utilisateur mais non pertinente. Le niveau 2 traduit l'intérêt de l'utilisateur, par exemple des ressources du domaine de 5 l'utilisateur et pertinentes pour l'utilisateur. Le niveau 3 marque un intérêt manifeste, par exemple des ressources du domaine de l'utilisateur et stratégiques pour l'utilisateur. Le critère retenu peut être le suivant : seul les événements classés à un niveau 2 ou 3, sont sélectionnés.
10 Le procédé peut comporter en outre une étape de mise à jour dudit premier profil associé à l'utilisateur, à la suite d'une modification du contexte de l'utilisateur. La modification du contexte de l'utilisateur peut être détectée en particulier à l'aide d'informations, collectées au cours de l'étape de collecte, 15 relatives à des évènements survenus en lien avec des interactions entre l'utilisateur et le système de traitement d'informations. Au cours de l'étape de mise à jour, ledit premier profil associé à l'utilisateur peut être mis à jour en fonction des informations, collectées au cours de l'étape de collecte, relatives aux évènements survenus en lien avec les interactions entre l'utilisateur et le 20 système de traitement d'informations. Ainsi, le profil d'un utilisateur est ainsi dynamique, c'est-à-dire qu'il s'adapte de façon automatique à l'évolution des comportements de l'utilisateur avec le système de traitement d'informations. Par exemple, lorsque l'utilisateur interagit avec le système de traitement d'informations, il produit des événements que le système intercepte puis 25 interprète pour adapter le contexte actuel de l'utilisateur. Le contexte étant un élément compris dans le profil, ce dernier est adapté en conséquence et peut évoluer au cours du temps. Un contexte additionnel peut être ajouté au profil de l'utilisateur, le contexte additionnel étant adapté pour permettre la représentation modifiée de 30 l'utilisateur. En outre, le contexte additionnel est ajouté au profil de l'utilisateur seulement si la similarité entre le contexte additionnel et ledit au moins un contexte adapté pour permettre la représentation de l'utilisateur est inférieure à un seuil. Ainsi, le contexte additionnel est ajouté en cas de rupture de contexte. Au cours de l'étape de mise à jour, ledit premier profil associé à 35 l'utilisateur est mis à jour en fonction du ou des profils au(x)quel(s) le deuxième ensemble fait référence. Selon un deuxième aspect, l'invention se rapporte à un dispositif de gestion de profils utilisateurs, adapté à être couplé, par l'intermédiaire d'un 3030079 6 réseau de communication, à au moins un dispositif client. Le dispositif de gestion de profils utilisateurs est configuré pour accéder à un ensemble de ressources. Le dispositif de gestion est configuré pour déterminer, pour un utilisateur dudit au moins un dispositif client, un niveau de pertinence d'une 5 première ressource, parmi l'ensemble de ressources, en : - collectant des informations relatives à des évènements survenus en lien avec les ressources ; - création ou obtention d'un premier profil associé à l'utilisateur, le profil comportant : 10 o au moins un contexte adapté pour permettre la représentation de l'ensemble des conditions susceptibles d'influencer un choix de l'utilisateur et/ou un jugement de pertinence de l'utilisateur relatif(s) aux ressources de l'ensemble de ressources accessibles par l'intermédiaire du système de traitement d'informations ; et, 15 o un premier ensemble comportant au moins un a priori adapté pour permettre la détermination, pour la première ressource, d'un niveau de pertinence selon au moins une propriété mesurable de la première ressource ; et, o un deuxième ensemble comportant au moins une référence à un 20 deuxième profil associé à un utilisateur de référence pour l'utilisateur ; - calculant une probabilité pour que la première ressource soit pertinente pour l'utilisateur en fonction dudit premier profil. Selon un troisième aspect, l'invention se rapporte à un programme 25 d'ordinateur comportant des instructions pour l'exécution des étapes du procédé selon le premier aspect, lorsque ledit programme est exécuté par un processeur. Chacun de ces programmes peut utiliser n'importe quel langage de programmation, et être sous la forme de code source, code objet, ou de code 30 intermédiaire entre code source et code objet, tel que dans une forme partiellement compilée, ou dans n'importe quelle autre forme souhaitable. EEn particulier, il est possible d'utiliser des langages de script, tels que notament tcl, javascript, python, perl qui permettent une génération de code « à la demande » et ne nécessitent pas de surcharge significative pour leur 35 génération ou leur modification. Selon un quatrième aspect, l'invention se rapporte à un support d'enregistrement lisible par un ordinateur sur lequel est enregistré un 3030079 7 programme d'ordinateur comprenant des instructions pour l'exécution des étapes du procédé selon le premier aspect. Le support d'informations peut être n'importe quelle entité ou n'importe quel dispositif capable de stocker le programme. Par exemple, le 5 support peut comporter un moyen de stockage, tel qu'une ROM, par exemple un CD-ROM ou une ROM de circuit microélectronique, ou encore un moyen d'enregistrement magnétique, par exemple une disquette ou un disque dur. D'autre part, le support d'informations peut être un support transmissible tel qu'un signal électrique ou optique, qui peut être acheminé par un câble 10 électrique ou optique, par radio ou par d'autres moyens. Le programme selon l'invention peut être en particulier téléchargé sur un réseau Internet ou Intranet. Alternativement, le support d'informations peut être un circuit intégré dans lequel le programme est incorporé, le circuit étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé en question.
15 D'autres particularités et avantages de la présente invention apparaîtront, dans la description ci-après de modes de réalisation, en référence aux dessins annexés, dans lesquels : la figure 1 est un schéma d'architecture d'un système de traitement d'informations personnalisé selon un mode de réalisation de l'invention ; 20 la figure 2 est un schéma d'un procédé de gestion de profils utilisateurs dans un système de traitement d'informations, selon un mode de réalisation de l'invention. Dans la suite de la description, les informations et données accessibles à un utilisateur par l'intermédiaire du système de traitement 25 d'informations sont appelées resssources. Plus particulièrement, une ressource est définie par la suite comme un objet adapté à être manipulé par le système d'information, indépendamment de tout contexte d'utilisation. L'ensemble R des ressources est noté R = {r1, rm} avec M le nombre de ressources. Chaque ressource de l'ensemble R peut en particulier être identifiée par un identifiant 30 unique, typiquement un identifiant de ressource unique, définit notamment dans le document RFC 3986. L'identifiant de ressource unique permet notamment d'identifier de façon unique et non ambigü une ressource, physique ou abstraite, généralement disponible par l'intermédiaire d'un réseau de communication. Une ressource peut être un document électronique, par 35 exemple une page web, une image ou un document bureautique. Une ressource peut aussi être un système délivrant un flux ou une source de données ou d'informations. Une ressource peut aussi être un utilisateur du système de traitement d'informations. Un utilisateur peut être une personne 3030079 8 physique à part entière ou bien un ensemble de personnes - par exemple une organisation, un service d'une entreprise, etc. Un utilisateur est une ressource similaire aux autres ressources, auquel un profil est associé et maintenu à jour par le système de traitement d'informations.
5 Dans la suite de la description, la construction d'un profil utilisateur pour un utilisateur donné du système de traitement d'informations va être décrit. Le procédé s'applique toutefois également à une pluralité de profils utilisateurs correspondant à une pluralité d'utilisateurs. La figure 1 est un schéma d'architecture d'un système de traitement 10 d'informations personnalisé selon un mode de réalisation de l'invention. Le système de traitement comporte un gestionnaire 30 de gestion de profils utilisateurs, couplé par l'intermédiaire d'un réseau 16 de communication, à une pluralité de dispositifs client 10a, 10b et à un réseau de données 20 à partir duquel des ressources sont accessibles. Typiquement, le réseau de 15 communication 16 est adapté à mettre en oeuvre des transferts de données entre le gestionnaire 30 de profils utilisateurs et la pluralité de dispositifs client 10a, 10b. Dans un cas usuel, le gestionnaire 30 de profils utilisateurs et les dispositifs clients 10a, 10b sont répartis sur plusieurs sites. Le réseau de communication 16 utilise par exemple le protocole Internet. Le réseau 16 20 comprend typiquement des moyens d'interconnexion usuels pour permettre l'acheminement des données, tel que des routeurs, des ponts, des pare-feu, des commutateurs, etc. Le réseau 20 est par exemple Internet et/ou un réseau local. Sur la figure 1, sont représentés notamment : - un premier dispositif client 110a comportant deux terminaux 12 couplés au 25 réseau 16 de communication ; - un deuxième dispositif client 10b comportant deux terminaux 12 couplés au réseau 16 de communication. Différents utilisateurs 14 peuvent en outre accéder aux terminaux 12. Les terminaux 12 peuvent être d'un des types suivants : ordinateur, téléphone 30 mobile, tablette, serveur, et plus généralement tout dispositif apte à échanger des données par l'intermédiaire du réseau 16. Plus particulièrement, les terminaux 12 sont configurés de sorte à permettre : - la collecte d'informations relatives aux utilisateurs 14 pour permettre la construction et/ou la mise à jour de profils ; 35 - la formulation de requête relative aux ressources accessibles par l'intermédiaire du réseau de données 20; - le transfert des informations collectées et des requêtes aux gestionnaires 30 de profils utilisateurs; 3030079 9 - la présentation de résultats obtenus en réponse des requêtes. Le gestionnaire 30 de profils utilisateurs comporte typiquement un module de protection, par exemple un module pare-feu, pour garantir la sécurité lorsque le gestionnaire 30 est couplé aux réseaux 16 et 20. Le gestionnaire 30 de profils 5 utilisateurs comporte en outre un dispositif de stockage de données 36 relatives à des profils utilisateurs. Le dispositif de stockage de données 36 est typiquement un système de gestion de bases de données ou de documents. Le gestionnaire 30 de profils utilisateurs comporte en outre un dispositif de traitement de données 36 relatives à des profils utilisateurs, par exemple un 10 serveur applicatif. Plus particulièrement, le gestionnaire 30 de profils utilisateurs est configuré pour : - recevoir et/ou collecter des informations relatives aux utilisateurs 14 pour permettre la construction et/ou la mise à jour de profils ; - créer et mettre à jour des profils relatifs aux utilisateurs 14 ; 15 - recevoir et traiter des requêtes relatives aux ressources accessibles par l'intermédiaire du réseau de données 20 ; - transférer les résultats obtenus en réponse aux requêtes des utilisateurs 14 - accéder aux ressources du réseau de données 20 et obtenir des 20 informations relatives auxdites ressources pour traiter les requêtes des utilisateurs 14. En référence à la figure 2, un procédé de gestion de profils utilisateurs dans un système de traitement d'informations, selon un mode de réalisation de l'invention, va maintenant être décrit. Le procédé de gestion de 25 profils utilisateurs est notamment adapté à être mis en oeuvre par le système de traitement d'informations personnalisé selon un mode de réalisation de l'invention illustré sur la figure 1. Les profils ainsi gérés peuvent en particulier être utilisés pour personnaliser un processus d'accès à des informations, telle qu'une recherche d'informations dans des bases de données ou de documents 30 ou encore l'établissement de recommandations personnalisées et optimisées. Dans le mode de réalisation illustré sur la figure 2, le procédé de gestion de profils utilisateurs comporte une étape 110 de collecte d'informations relatives à l'ensemble des ressources R. Dans un mode de réalisation de 35 l'étape 110, entre un instant initial et un instant t, un historique H d'évènements , e2, ..., et est obtenu et/ou généré. L'historique H = [e1, e2, ..., et] est par exemple une liste ordonnée d'évènements e1, e2, , et survenus entre l'instant initial et l'instant t.
3030079 10 Un évènement en peut être représenté par un quadruplet : en = {type, source: r E R, [résultat: r E R], {meta: (clé, valeur)}} dans lequel : - type correspond au type de l'événement en, par exemple un clic, une mise en favoris, une impression, une requête, etc ; 5 - source est l'identifiant unique de la ressource ayant produit l'évènement en . - résultat est la liste ordonnée des identifiants de ressources résultantes fournis par le système de traitement des informations ; - meta est un ensemble de métadonnées associées à l'événement en.
10 Un exemple d'historique H est donné dans le tableau ci-après : évènement type source résultat métadonnées el clic ul {ri} - e 2 favoris ul {ri} - e 3 requête u2 {r2,r5} ((loc, PARIS)) ... ... ... ... ... Dans un mode de réalisation de l'étape 110, seuls les événements répondant à un ensemble de critères sont ajoutés à l'historique H d'évènements 15 el, e2, . Par exemple, les évènements collectés peuvent être dans un premier temps classés selon leur type sur une échelle comportant des niveaux allant de 0 à 3. Le niveau 0 marque le désintérêt manifeste de l'utilisateur pour les ressources associées à l'événement, typiquement pour une ressource hors du domaine de l'utilisateur. Le niveau 1 marque un désintérêt modéré, par 20 exemple pour une ressource dans le domaine de l'utilisateur mais non pertinentes. Le niveau 2 traduit l'intérêt de l'utilisateur, par exemple des ressources du domaine de l'utilisateur et pertinentes pour l'utilisateur. Le niveau 3 marque un intérêt manifeste, par exemple des ressources du domaine de l'utilisateur et stratégiques pour l'utilisateur. Le tableau suivant présente une 25 classification possible des évènements selon leur type relativement à l'échelle préalablement présentée (en considérant par exemple qu'un utilisateur manifeste un intérêt pour une ressource lorsqu'il la visualise pendant plus de 30 secondes) : 30 3030079 11 type niveau Suppression 0 Clic et non 1 intérêt Clic et intérêt 2 Mise en favoris 3 Partage 3 Dans l'exemple d'un système de traitement d'information pour recherche d'information, les retours de pertinence positifs (ici les évènements de niveaux 2 et 3) sont beaucoup plus importants que les retours de pertinence négatifs. Aussi, dans un mode de réalisation, seuls les événements classés à 5 un niveau 2 ou 3, sont ajoutés à l'historique H. Alternativement, il est possible d'ajouter tous les événements à l'historique H et leur attribuer un coefficient de pondération relatif à leur niveau. Le procédé de gestion de profils utilisateurs comporte une étape 120 d'initialisation, de construction et/ou de mise à jour d'un profil pour 10 l'utilisateur. On désigne par profil Pji, un profil associé, à un instant t, à une ressource u, de type utilisateur. Le profil Pji permet en particulier de définir formellement les attentes de ladite ressource u, en matière de traitement d'informations par le système de traitement des informations. Le profil Pji 15 permet notamment de personaliser, pour la ressource u,, le traitement des informations par le système, en particulier de personnaliser les informations qui sont fournies à la ressource u,. Le profil Pji est par exemple employé pour estimer la probabilité P(rIPji) qu'une ressource r soit pertinente pour la ressource ui.
20 Dans un mode de réalisation de l'invention, à l'instant t, un profil P,fi comporte une séquence de contextes Cus'it, un ensemble Aui d'a priori, et un ensemble Rui d'utilisateurs de référence est obtenu, généré ou mis à jour. Ce mode de réalisation présente notamment comme avantage de permettre un suivi efficace de changements fréquents des contextes de l'utilisateur. Or il a 25 été constaté que les utilisateurs ont tendance à être multi-tâches - c'est-à-dire avoir besoin de manipuler des contextes divers et variés - et à changer de contextes relativement fréquemment. Dans un mode de réalisation alternatif, la séquence de contextes peut être réduite à un unique contexte. Ce mode de réalisation alternatif peut être notamment intéressant pour des applications où 30 l'utilisateur est certain de ne pas changer de contexte.
3030079 12 On désigne par « contexte » les informations relatives à une interprétation formelle des évènements passés relatifs à une ressource et caractérisant ladite ressource. Un contexte comprend donc les informations relatives à un ensemble de conditions susceptibles d'influencer les choix et les 5 jugements de pertinence, en tenant compte de retours d'informations obtenus par le système de traitement des informations. A partir de l'historique H, il est possible de déduire un historique restreint Hri à une ressource r, E R correspondant à l'ensemble des évènements pour lesquels la ressource r, est identifiée comme la source. Ainsi, 10 Hri=[ej E Hisource(e0= ri]. Le contexte Crsitd'une ressource ri à l'instant t dans la séquence de contextes s, aussi désigné par le terme contexte courant par opposition au contexte local, est une représentation de la ressource ri fonction de l'historique restreint Hri à la ressource ri à l'instant t. Dans un mode de réalisation, le contexte Crsitd'une ressource r, à l'instant t dans la 15 séquence de contextes s est représenté par une distribution de probabilités sur des thématiques. Alternativement, le contexte peut être représenté par un vecteur de poids dans l'espace vectoriel des termes, ou par un vecteur de poids sur les concepts d'une ontologie etc. Une séquence de contextes est une liste ordonnée dans le temps 20 d'au moins un contexte. L'indice s dans la notation Crsit représente un numéro dans la liste ordonnée dans le temps des contextes. La notion de séquence de contextes permet de représenter les changements de contextes que les utilisateurs peuvent avoir au cours de leur expérience au travers du système d'information.
25 On désigne par contexte local C/it.i, à un instant t, d'un évènement dont la source est la ressource ri, une représentation dudit évènement indépendante des évènements passés. Cette représentation est déterminée à partir des ressources issues dudit évènement et de son type. On désigne par contexte local C/rid'une ressource r, une représentation de cette ressource.
30 À titre d'exemple, calculer le contexte local d'un évènement où l'utilisateur u, place la ressource ri en favoris équivaut à calculer le contexte local C/r.de la ressource ri sachant le type de l'évènement. Dans un mode de réalisation, le contexte local Clri d'un évènement ou le contexte local C/r. d'une ressource est représenté par une distribution de 35 probabilités sur des thématiques. Alternativement, le contexte local peut être représenté par un vecteur de poids dans l'espace vectoriel des termes, ou par un vecteur de poids sur les concepts d'une ontologie etc.
3030079 13 Lorsque de nouveaux évènements se produisent, le contexte d'une ressource ri peut évoluer de deux manières : - le contexte local de cet évènement est suffisamment proche d'un contexte de Crsit, précisant ou complétant ce dernier ; 5 - le contexte local de cet évènement est trop différent, et une rupture de contexte a potentiellement lieu. Lorsqu'une rupture de contexte se produit, un nouveau contexte peut être créé et ajouté dans une séquence de contextes de la ressource ri. Lorsque la rupture de contexte concerne un utilisateur, il peut être proposé à ce dernier de 10 valider ou invalider ladite rupture. Lorsqu'elle concerne un autre type de ressource ri, cette validation peut se faire automatiquement ou, selon le type de ressource, manuellement par un administrateur du système. Aussi, un évènement est considéré en rupture lorsque la similarité entre le contexte local dudit évènement et le contexte courant de la ressource à 15 l'origine de l'évènement est inférieure à un seuil E. Dans un mode de réalisation de l'invention, la similarité est calculée par la divergence de Jensern-Shannon. Au cours d'une étape 122, le contexte Crsitd'une ressource ri à l'instant t est obtenu en appliquant la formule suivante : Crs = f cci, a) avec - 20 - Crs:t-1 le contexte à l'instant t-1 dans la séquence s de la ressource ri, soit le contexte courant jusqu'à ce que le contexte Crsit soit obtenu ; - Cl.it. le contexte local de la ressource ri à l'instant t - f une fonction adaptée pour produire un nouveau contexte en combinant deux contextes, en fonction de leur importance relative 25 contrôlée par le paramètre a; dans le cas présent, la fonction f combine le contexte local Cl.it. et le contexte courant Crsit-1 en fonction du paramètre a. Dans un mode de réalisation, la fonction f est une fonction adaptée 30 pour produire un nouveau contexte en combinant deux contextes, et en accordant une importance aux évènements en fonction de leur nouveauté. En effet, il peut être considéré que plus les évènements sont récents et plus ils sont représentatifs du besoin courant d'un utilisateur. Par exemple, la fonction f peut être une fonction moyenne mobile exponentielle, décrite notamment dans 35 le document de Harry V Roberts, intitulé « Stock-market "patterns" and financial analysis: Methodologica suggestions. », The Journal of Finance , 14(1): 1-10, 3030079 14 1959. Ainsi, au cours de l'étape 122, le contexte Crsitd'une ressource ri à l'instant t peut être obtenu en appliquant la formule suivante : Crsit = a x Clrs'it + (1- a) x Crsit-1 avec 0 < a < 1 la constante de lissage déterminant l'importance du contexte courant par rapport au contexte local de l'évènement.
5 L'obtention du contexte Crsitd'une ressource ri à l'instant t, au cours de l'étape 122, à partir de l'historique H construit au cours de l'étape 110, est typiquement un processus récursif. Un exemple d'un tel processus récursif de construction du contexte va maintenant être brièvement discuté. A l'instant initial, l'historique H ne comporte aucun événement.
10 A un instant t=1, la ressource ri produit un événement eri collecté au cours de l'étape 110, et ajouté à l'historique H. Au cours de l'étape 122, le contexte local C/71.ide l'événement eriest calculé. Le contexte de la ressource ri n'existant pas à l'instant t=1, le contexte Ci1-i est égal au contexte local C/71.i de la ressource ri.
15 A un instant t=2, la ressource ri produit un événement eri collecté au cours de l'étape 110, et ajouté à l'historique H. Au cours de l'étape 122, le nouveau contexte courant Ci1.-i2 de l'événement er. est calculé en fonction du contexte courant du contexte local C/72.ide l'événement eri et du paramètre a. Par exemple, dans le cas d'un contexte courant représenté par une 20 distribution de probabilité sur des thématiques, la fonction f employée pour calculer le nouveau contexte courant Crli2 de l'événement eri est par exemple une combinaison linéaire des distributions de thématiques du contexte Crlil et du contexte local C/72.ide l'événement A un instant t=j, la ressource ri produit un événement eri collecté 25 au cours de l'étape 110, et ajouté à l'historique H. Au cours de l'étape 122, le nouveau contexte courant Cil:il de l'événement eri est calculé en fonction du contexte courant du contexte local C/riide l'événement eri et du paramètre a. Ainsi, la collecte des évènements, la mise à jour de l'historique H, 30 ainsi que du contexte courant, se poursuit ainsi au cours des étapes 110 et 122, à chaque nouvel évènenement. L'ensemble Aui d'a priori compris dans le profil P. est déterminé et/ou mis à jour au cours d'une étape 124. Un a priori est une propriété mesurable d'une ressource. Elle est définie par une fonction f: R -> 11: 35 Un a priori permet de caractériser une ressource selon un aspect particulier et indépendamment de tout contexte. Aussi, l'utilisation d'a priori dans le profil P. permet de prendre en compte les préférences a priori de 3030079 15 l'utilisateur, préférences qui ne pourraient pas nécessairement être représentées dans le contexte. Par exemple, un utilisateur peut avoir un a priori sur l'importance d'une source d'information et ce, indépendamment des ressources qu'elle produit, c'est-à-dire indépendemment de la proximité de 5 chacune desdites ressources avec le contexte de l'utilisateur. Les a priori peuvent être partagés entre plusieurs ressources ou être spécifiques à une ressource donnée. Une liste d'a priori illustrative et non exhaustive est donnée ci-après : - taille : une ressource contenant beaucoup de mots dans sa représentation 10 est plus pertinente ; - date de création : plus une ressource est récente et plus ladite ressource est pertinente ; - nombre de liens entrants : plus une ressource comporte de liens entrants (e.g. : de nombreuses pages comprenant des références à ladite 15 ressources), plus ladite ressource est pertinente ; - rapport information sur bruit : une ressource contenant peu de bruit - par exemple peu de redondance - est plus pertinente ; - type d'adresse: une ressource de type page d'entrée dont l'adresse, typiquement un localisateur uniforme de ressource plus généralement 20 désigné par l'acronyme anglo-saxon « URL » pour « Uniform Resource Locator », est de type racine est plus pertinente qu'un autre type de page ; le type de l'adresse (racine, sous-racine, chemin, fichier) est un indicateur de la pertinence d'une ressource ; - popularité globale d'une ressource : une ressource populaire est plus 25 pertinente ; cette mesure représente la quantité d'évènements (clics, mis en favori ...) associés à sur une ressource ; cette mesure peut se calculer de la façon suivante : pop(r) = Lr'Etoutes les ressources compteur(action sur r') - qualité de la source : une ressource provenant d'une source de qualité est plus pertinente ; la qualité d'une source d'information peut être spécifiée 30 manuellement par un utilisateur. Par exemple : pertinence(source) = 0.8. Le procédé de gestion de profils utilisateurs peut comporter une étape 126 optionnelle d'identification d'au moins un profil associé à un utilisateur de référence pour la ressource ui. L'ensemble Rui d'utilisateurs de référence pour la ressource u, 35 correspond à l'ensemble des utilisateurs dont les profils peuvent être utilisés pour améliorer la pertinence des informations transmises par le système de compteur(action sur r) 3030079 16 traitement d'information à la ressource u,. À la différence d'un système de recommandation de type filtrage collaboratif dans lequel la pertinence d'une ressource est fonction des appréciations des autres utilisateurs sur ladite ressource, l'utilisation de l'ensemble Rui d'utilisateurs de référence sur un profil 5 permet de déterminer la pertinence d'une ressource à l'aide des profils d'un nombre restreint d'utilisateurs, non nécessairement proche de la ressource u,. Dans un mode de réalisation, l'ensemble des ressources u, de type utilisateur est représenté par un graphe orienté, chaque noeud du graphe représentant un utilisateur u,. Dans le graphe orienté, un arc (ui; ui) entre la 10 ressource u, et la ressource uj indique que l'utilisateur u, est un utilisateur de référence pour l'utilisateur uj. Un utilisateur u, est dit de référence pour uj si u, est un prédéceur de uidans le graphe des utilisateurs. L'ensemble Rui d'utilisateurs de référence pour l'utilisateur u,, représenté par le graphe orienté, peut être obtenu ou construit de façon 15 manuelle par l'utilisateur u, ou créé de manière automatique ou semi- automatique par un procédé de recherche et de sélection d'utilisateurs de référence. Un exemple de création de l'ensemble Rui d'utilisateurs de référence pour l'utilisateur u, va maintenant être décrit. Initialement, l'ensemble Rui est vide et l'utilisateur u, n'a donc pas 20 désigné d'utilisateurs de référence. Ultérieurement, l'utilisateur u, choisit, manuellement ou selon des recommandations formulées par le système, un ou plusieurs utilisateurs de référence. Puis, l'utilisateur u, peut ajouter un autre utilisateur de référence, ou en supprimer un présent dans l'ensemble Rui. A l'issue de l'étape 124 ou de l'étape 126 optionnelle, le profil de 25 l'utilisateur est construit et combine trois dimensions : la séquence de contextes Cus'it, l'ensemble Aui d'a priori, et l'ensemble Rui d'utilisateurs de référence. Ainsi, en utilisant les trois dimensions du profil conjointement, il est possible d'exploiter le profil de l'utilisateur de manière optimale, comparativement à un profil qui n'exploiterait qu'une parmi lesdites trois dimensions. En effet, les trois 30 dimensions du profil ainsi construit par le procédé selon l'invention interagissent entre-elles en se complétant et se corrigeant. À titre d'exemple, deux cas d'usages dans lesquels l'effet synergique de l'utilisation des trois dimensions du profil est mis en valeur : - Si une ressource ne correspond pas aux contextes de la séquence de 35 contextes Cus'it de l'utilisateur, mais qu'elle correspond à un ou plusieurs contextes associés aux utilisateurs de référence de l'ensemble Rui, la pertinence de cette ressource pour l'utilisateur pourra être suffisament élevée pour qu'il s'y intéresse : la séquence de contextes Cus'it de l'utilisateur 3030079 17 évoluera donc pour s'adapter à celui de ses utilisateurs de référence. De fait, pour les ressources suivantes, le contexte aura évolué et permettra d'affiner l'ordonnancement des ressources pertinentes pour les utilisateurs de référence ; de manière similaire, lorsque les contextes de la séquence de 5 contextes Cusit ne correspondent pas au contexte local d'une ressource bien que l'utilisateur a un a priori positif sur la ressource, la séquence de contextes Cusit de l'utilisateur évoluera donc pour s'adapter en conséquence; - Un utilisateur peut avoir un a priori négatif sur une ressource mais par définition, un a priori, n'est pas une vérité ; en tenant compte des profils des 10 utilisateurs de référence de l'ensemble Rui, l'estimation de la probabilité que la ressource satisfasse l'utilisateur peut toutefois être composée en conséquence, malgré l'a priori négatif de l'utilisateur. Au cours d'une étape 130, on détermine la probabilité qu'une ressource r satisfasse l'utilisateur u,. Pour cela, la probabilité 13(r1Pji) à un 15 instant t qu'une ressource r soit pertinente pour la ressource u, est alors calculée en fonction d'un contexte local CG, du contexte Cus'it, de l'ensemble Aui d'a priori, et de l'ensemble Rui d'utilisateurs de référence, soit 13(7-113,fi) = P(r1C1r, Cus'it , Aui, Rai). Dans un mode de réalisation de l'étape 130, on détermine la 20 probabilité qu'une ressource r satisfasse l'utilisateur u, en : - dans une étape 132, sélectionnant un groupe Rui(r) dans l'ensemble Rui d'utilisateurs de référence dont le contexte présente une proximité avec la ressource r ; - dans une étape 134, calculant la probabilité que la ressource r satisfasse le 25 groupe d'utilisateurs de référence sélectionnés au cours de l'étape 132, selon une heuristique ; - dans une étape 136, calculant la probabilité que la ressource satisfasse l'utilisateur u,, en fonction du contexte local de la ressource r , du contexte de l'utilisateur u,, des a priori de l'utilisateur u, et de la probabilité que la 30 ressource r satisfasse le groupe d'utilisateurs de référence calculée au cours de l'étape 134. Au cours de l'étape 132, un utilisateur de référence peut être ajouté au groupe d'utilisateurs de référence sélectionné en fonction de sa pertinence pour un domaine précis. En particulier, il est possible de filtrer l'ensemble Rui 35 d'utilisateurs de référence en générant pour la ressource r donnée une liste de couples (u' Cus'it) avec Cusit le contexte des utilisateurs de référence les plus proches du contexte de la ressource r, puis ne conservant que les couples 3030079 18 (u' Cus'it) dont la similarité entre le contexte Cus'it et le contexte de la ressource r est supérieure à un seuil E fixé par exemple par l'utilisateur u,. Au cours de l'étape 134, on calcule par exemple la probabilité P (r1Rui(r)) pour 5 le groupe Rui(r) d'utilisateurs de référence sélectionnés au cours de l'étape 132, en déterminant, pour chaque utilisateur de référence de l'ensemble Rui(r), la probabilité P(riCusi''') que la ressource r convienne audit utilisateur de référence dans le contexte le plus proche de la ressource r. Les probabilités de chaque utilisateur de référence du groupe Rui(r) sont ensuite combinées selon 10 une heurisque pour obtenir la probabilité que la ressource satisfasse le groupe Rui(r). Dans un mode de réalisation de l'invention, l'heuristique utilisée est la probabilité moyenne qui correspond aux besoins moyens des utilisateurs. Alternativement, les heuristiques possibles sont de type probabilité minimale, et probabilité moyenne.
15 Au cours de l'étape 136, la probabilité que la ressource satisfasse l'utilisateur u, peut être calculée en utilisant par exemple un modèle d'apprentissage dans lequel le contexte local de la ressource r , le contexte de l'utilisateur u,, les a-priori de l'utilisateur u, et de la probabilité que la ressource r satisfasse le groupe d'utilisateurs de référence sont les caractéristiques d'entrée.
20 Le procédé, précédemment décrit, repose sur un modèle dynamique, s'adaptant automatiquement à l'évolution des besoins des utilisateurs par le biais des actions qu'ils réalisent sur le système mais aussi par l'influence de leurs utilisateurs de référence. Ainsi, dès lors qu'un utilisateur interagit avec le système, son profil est mis à jour puis exploité afin que les 25 informations qui lui sont fournies correspondent à son besoin actuel. Cette dynamique peut être illustrée par l'exemple décrit ci-après. Dans un système comprenant de trois utilisateurs u1 , u2 , u3, dans un état initial, aucun lien d'influence n'existe entre les utilisateurs. Le profil de chaque utilisateur comprend alors un contexte ainsi que des a priori. Chaque utilisateur 30 peut ensuite indiquer les utilisateurs de référence qui lui sont propress. Cela se traduit par la création de liens entre les utilisateurs. Ainsi, dans l'exemple, l'utilisateur u1 a, pour utilisateur de référence, l'utilisateur u2. L'utilisateur u2 a, pour utilisateur de référence, l'utilisateur u3. L'utilisateur u3 n'a pas d'utilisateur de référence. Une ressource, notée r, est initialement pertinente pour 35 l'utilisateur u3, mais peu pertinente pour les utilisateurs u1 et u2. Si l'utilisateur u3 réalise une action (clique, mise en favoris, etc.) sur r qui marque l'intérêt de l'utilisateur u3 pour cette ressource, un nouvel évènement va être répertorié 3030079 19 dans l'historique du système, et engendrer la mise à jour du profil de l'utilisateur u3 . L'utilisateur u3 étant un utilisateur de référence de u2 , la pertinence de r pour l'utilisateur u2 va être influencée par le profil mis à jour de l'utilisateur u3 et la pertinence de r pourl'utilisateur u2 augmentera. À cet instant, la pertinence 5 de la ressource r pour l'utilisateur u1 reste inchangée car son utilisateur de référence, l'utilisateur u2, n'a pas encore réalisé d'action sur la ressource r. Pour confirmer son intérêt pour la ressource r, l'utilisateur u2 réalise une action sur la ressource r. La ressource r verra alors sa pertinence pour l'utilisateur u1 augmenter car le profil de l'utilisateur u2 aura également été mis à jour, la 10 pertinence de la ressource r pour l'utilisateur u1 restant inchangée. Si l'utilisateur u2 ne réalise aucune action sur r , la ressource r ne présente pas d'intérêt pour l'utilisateur u2. Dans cet exemple, la pertinence de la ressource r pour l'utilisateur u1 et u2 augmentera tant que ces deux utilisateurs réaliseront des actions sur la ressource r, car ces dernieurs marquent tous les deux leur 15 intérêt pour cette ressource et parce que cet intérêt est renforcé par celui de leur utilisateur de référence. Néanmoins, lorsqu'une ressource n'interessera plus l'utilisateur u1 et/ou u2, aucune action n'effectuera la ressource et l'influence en tant qu'utilisateur de référence n'évoluera pas. Un cas d'utilisation détaillée va maintenant être présenté. L'exemple 20 suivant se réfère à quatre utilisateurs : u1, u2, u3, u4. L'utilisateur u1 est considéré comme un utilisateur expert pour l'utilisateur u2, dans le domaine maritime. L'utilisateur u3 est considéré comme un utilisateur expert pour l'utilisateur u4, dans le domaine textile. Dans un état initial, le système accède aux données enregistrées 25 dans le navigateur web des utilisateurs u1, u2, u3, u4, pour initialiser le contexte propre à chaque utilisateur. Ainsi, le système permet d'obtenir, dans cet état initial, des réponses personnalisées pour chaque utilisateur. Par exemple, suite à la réception de l'autorisation d'un utilisateur, l'historique de navigation de l'utilisateur peut être scannée, ainsi que les pages marquées 30 comme favorites dans le navigateur. L'historique des évènements de l'utilisateur peut ainsi être initialisé. Les évènements produits par l'utilisateur enrichissent en temps réel l'historique et le contexte relatif audit utilisateur. Les favoris et l'historique de navigation des utilisateurs u1, u2, u3 et u4 font référence à des pages web ayant trait au domaine maritime et au domaine du textile. Les 35 contextes résultant pour chacun des utilisateurs après la phase d'initialisation sont représentés dans le tableau suivant (le nombre entre parenthèse à côté de chaque terme représente le poids de ce dernier dans le contexte de l'utilisateur) : 3030079 20 u1 u2 u3 u4 bateau (12) bateau (9) textile (15) textile (14) naval (8) naval (4) découpe (13) petit (7) planetsolar (5) petit (2) laser (9) coupe (3) ... ... ... ... Les utilisateurs experts u1 et u3 définissent respectivement leurs a priori, pour spécifier leurs préférences, par exemple celles concernant les 5 sources d'information. Il est pris par ailleurs comme hypothèse que les utilisateurs u2 et u3 n'ont pas défini d'a-priori. Le tableau suivant présente ces a priori : utilisateur source pertinence u1 planetsolar.org 0.8 u1 leparisien.fr 0.5 u3 ifm-paris.com 0.9 Ainsi, l'utilisateur u1 spécifie que la source planetsolar.org et les ressources que ladite ressource produit ont une probabilité a priori d'être 10 pertinente de 80% contre 50% pour la source leparisien.fr et les ressources produites par leparisien.fr. L'utilisateur u2 spécifie que la source ifm-paris.com et les ressource qu'elle produit ont une probabilité a priori d'être pertinentes de 90%. La pertinence des autres sources n'étant pas spécifiée, ces autres sources ne sont donc ni favorisées ni défavorisées lors du calcul de la 15 pertinence d'une ressource. Pour sélectionner les utilisateurs considérés comme utilisateurs de références, les utilisateurs recherchent, par l'intermédiaire du système, les utilisateurs qui leur sont similaires. Par exemple, l'utilisateur u2 se voit proposer l'utilisateur u1. L'utilisateur u4 se voit proposer l'utilisateur u3. Les utilisateurs 20 u2 et u4 valident alors manuellement ou par seuillage les utilisateurs qu'ils souhaitent avoir comme utilisateurs de référence. Les utilisateurs u1 et u3 dits experts, n'utilisent pas cette fonctionnalité. Les profils des utilisateurs u1, u2, u3 et u4 sont par la suite exploités pour personnaliser les réponses aux requêtes. Par exemple, pour une requête « petit 25 bateau » soumise par l'utilisateur u2 (non expert du domaine maritime). L'exploitation du profil de l'utilisateur u2 permet de cibler au mieux la requête. Après la phase d'initialisation, les contextes des utilisateurs sont vides. De fait, lorsque l'utilisateur u2 soumet la requête « petit bateau », il obtiendra 3030079 21 majoritairement des documents liés au domaine du textile (i.e. relatifs à la marque « petit bateau ») qui ne correspondront pas à son besoin. Par la suite, lorsque les utilisateurs de référence auront effectué des recherches, leur contexte ciblera leur domaine respectif (maritime pour u1, textile pour u3) car ils 5 auront, par exemple, définis des a priori suffisament. Ainsi, lorsque l'utilisateur u2 (re) soumettra la requête « petit bateau », son utilisateur de référence (u1) agira implicitement sur la pertinence des ressources retournées et les actions de u2 sur ces ressources permettront de d'enrichir son propre contexte. Lors des recherches suivantes, le contexte de u2 aura évolué et la pertinence des 10 ressources qui lui seront délivrées sera plus grande. En exploitant les a priori, il est encore possible de surpondérer les résultats provenant de sources a priori fiables.
Claims (16)
- REVENDICATIONS1. Procédé pour déterminer, pour un utilisateur, un niveau de pertinence d'une première ressource, parmi un ensemble de ressources accessibles par 5 l'intermédiaire d'un système de traitement d'informations, caractérisé en ce qu'il comporte les étapes suivantes : - collecte (110) d'informations relatives à des évènements survenus en lien avec l'ensemble des ressources ; - création ou obtention (120, 122, 124, 126) d'un premier profil associé à 10 l'utilisateur, le profil comportant : o au moins un contexte adapté pour permettre la représentation de l'ensemble des conditions susceptibles d'influencer un choix de l'utilisateur et/ou un jugement de pertinence de l'utilisateur relatif(s) aux ressources de l'ensemble de ressources accessibles 15 par l'intermédiaire du système de traitement d'informations ; et, o un premier ensemble comportant au moins un a priori adapté pour permettre la détermination, pour la première ressource, d'un niveau de pertinence selon au moins une propriété mesurable de la première ressource ; et, 20 o un deuxième ensemble comportant au moins une référence à un deuxième profil associé à un utilisateur de référence pour l'utilisateur ; - calcul (130, 132, 134, 136) d'une probabilité pour que la première ressource soit pertinente pour l'utilisateur en fonction dudit premier 25 profil
- 2. Procédé selon la revendication 1, dans lequel, au cours de l'étape de calcul (130, 132, 134, 136), la probabilité que la première ressource soit pertinente pour l'utilisateur est obtenue en : - sélectionnant (132), selon au moins un critère, dans le deuxième ensemble, 30 au moins un profil associé à un des utilisateurs de référence ; - calculant (134) une deuxième probabilité que la première ressource soit pertinente, en fonction dudit au moins un profil associés à un des utilisateurs de référence; - calculant (136) la probabilité que la première ressource soit pertinente pour 35 l'utilisateur en fonction de la deuxième probabilité et dudit au moins un contexte du premier profil et d'au moins un a priori du premier ensemble. 3030079 23
- 3. Procédé selon l'une quelconque des revendications précédentes, dans lequel ledit au moins un a priori est une fonction adaptée pour permettre la détermination, pour la première ressource, du niveau de pertinence selon au moins une des propriétés suivantes : une taille de la première ressource, une date de création de la première ressource, un nombre de liens ou de références pointant sur la première ressource, un rapport signal sur bruit de la première ressource, un type d'adresse par lequel la première ressource est accessible ; un niveau de popularité de la première ressource, un niveau de qualité de la première ressource.
- 4. Procédé selon l'une quelconque des revendications précédentes, dans lequel les informations relatives à des évènements survenus en lien avec les ressources comprennent une ou plusieurs informations parmi la liste suivante : un type d'événement, un identifiant de la ressource ayant produit l'évènement ; une liste ordonnée d'identifiants de ressources résultantes fournis par le système de traitement des informations ; un ensemble de métadonnées associées à l'événement.
- 5. Procédé selon l'une quelconque des revendications précédentes, dans lequel, au cours de l'étape de collecte (110), seules les informations relatives à des évènements survenus en lien avec les ressources et répondant 20 à un ensemble de critères propres à l'utilisateur sont collectées
- 6. Procédé selon l'une quelconque des revendications précédentes, comportant en outre une étape de mise à jour (120, 122, 124, 126) dudit premier profil associé à l'utilisateur, à la suite d'une modification du contexte de l'utilisateur. 25
- 7. Procédé selon la revendication 6, dans lequel la modification du contexte de l'utilisateur est détectée à l'aide d'informations, collectées au cours de l'étape de collecte (110), relatives à des évènements survenus en lien avec des interactions entre l'utilisateur et le système de traitement d'informations.
- 8. Procédé selon la revendication 7, dans lequel au cours de l'étape de 30 mise à jour (120, 122, 124, 126), ledit premier profil associé à l'utilisateur est mis à jour en fonction des informations, collectées au cours de l'étape de collecte (110), relatives aux évènements survenus en lien avec les interactions entre l'utilisateur et le système de traitement d'informations.
- 9. Procédé selon l'une quelconque des revendications 6 à 8, dans lequel 35 au cours de l'étape de mise à jour (120, 122, 124, 126) dudit premier profil associé à l'utilisateur, un contexte additionnel est ajouté au profil de l'utilisateur, 3030079 24 le contexte additionnel étant adapté pour permettre la représentation modifiée de l'utilisateur
- 10. Procédé selon la revendication 9, dans lequel au cours de l'étape de mise à jour (120, 122, 124, 126), le contexte additionnel est ajouté au profil de 5 l'utilisateur seulement si la similarité entre le contexte additionnel et ledit au moins un contexte adapté pour permettre la représentation de l'utilisateur est inférieur à un seuil.
- 11. Procédé selon l'une quelconque des revendications 6 à 10, dans lequel au cours de l'étape de mise à jour (120, 122, 124, 126), ledit premier 10 profil associé à l'utilisateur est mis à jour en fonction du ou des profils au(x)quel(s) le deuxième ensemble fait référence.
- 12. Dispositif de gestion (30) de profils utilisateurs, adapté à être couplé, par l'intermédiaire d'un réseau (16) de communication, à au moins un dispositif client (10a, 10b), et configuré pour accéder à un ensemble de ressources, 15 caractérisé en ce que le dispositif de gestion est configuré pour déterminer, pour un utilisateur dudit au moins un dispositif client, un niveau de pertinence d'une première ressource, parmi l'ensemble de ressources, en : - collectant (110) des informations relatives à des évènements survenus en lien avec les ressources ; - créant ou obtenant (120, 122, 124, 126) un premier profil associé à l'utilisateur, le profil comportant : o au moins un contexte adapté pour permettre la représentation de l'ensemble des conditions susceptibles d'influencer un choix de l'utilisateur et/ou un jugement de pertinence de l'utilisateur relatif(s) aux ressources de l'ensemble de ressources accessibles par l'intermédiaire du système de traitement d'informations ; et, o un premier ensemble comportant au moins un a priori adapté pour permettre la détermination, pour la première ressource, d'un niveau de pertinence selon au moins une propriété mesurable de la première ressource ; et, o un deuxième ensemble comportant au moins une référence à un deuxième profil associé à un utilisateur de référence pour l'utilisateur ; - calculant (130, 132, 134, 136) une probabilité pour que la première ressource soit pertinente pour l'utilisateur en fonction dudit premier profil. 3030079 25
- 13. Dispositif de gestion selon la revendication 12, configuré de sorte que la probabilité pour que la première ressource soit pertinente pour l'utilisateur est obtenue en : - calculant (134) la probabilité que la première ressource soit pertinente pour 5 les utilisateurs de référence du deuxième ensemble ; - calculant (136) la probabilité pour que la première ressource soit pertinente pour l'utilisateur u, en fonction du premier profil et de la probabilité que la première ressource soit pertinente pour les utilisateurs de référence du deuxième ensemble. 10
- 14. Dispositif de gestion selon la revendication 12, configuré de sorte que ledit premier profil associé à l'utilisateur est mis à jour (120, 122, 124, 126), à la suite d'une modification du contexte de l'utilisateur.
- 15. Programme d'ordinateur comportant des instructions pour l'exécution des étapes du procédé selon l'une quelconque des revendications 1 à 11, 15 lorsque ledit programme est exécuté par un processeur.
- 16. Support d'enregistrement lisible par un ordinateur sur lequel est enregistré un programme d'ordinateur comprenant des instructions pour l'exécution des étapes du procédé selon l'une quelconque des revendications 1 à 11. 20
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1462154A FR3030079B1 (fr) | 2014-12-10 | 2014-12-10 | Moyens pour determiner un niveau de pertinence d’une ressource dans un systeme de traitement d’informations |
PCT/FR2015/053418 WO2016092218A1 (fr) | 2014-12-10 | 2015-12-10 | Moyens pour déterminer un niveau de pertinence d'une ressource dans un système de traitement d'informations |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1462154A FR3030079B1 (fr) | 2014-12-10 | 2014-12-10 | Moyens pour determiner un niveau de pertinence d’une ressource dans un systeme de traitement d’informations |
Publications (2)
Publication Number | Publication Date |
---|---|
FR3030079A1 true FR3030079A1 (fr) | 2016-06-17 |
FR3030079B1 FR3030079B1 (fr) | 2024-07-26 |
Family
ID=53758247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR1462154A Active FR3030079B1 (fr) | 2014-12-10 | 2014-12-10 | Moyens pour determiner un niveau de pertinence d’une ressource dans un systeme de traitement d’informations |
Country Status (2)
Country | Link |
---|---|
FR (1) | FR3030079B1 (fr) |
WO (1) | WO2016092218A1 (fr) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3093845B1 (fr) * | 2019-03-15 | 2021-08-06 | Ziwig | Procédé de recommandations de ressources personnalisées |
FR3093846B1 (fr) * | 2019-03-15 | 2021-08-06 | Ziwig | Procédé de calcul d’un score de compatibilité pour la recommandation de ressources personnalisées |
FR3093844B1 (fr) * | 2019-03-15 | 2021-08-06 | Ziwig | Procédé de génération d’un programme de ressources personnalisées |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2805391A1 (fr) * | 2008-02-25 | 2009-09-03 | Atigeo Llc | Determination d'informations pertinentes pour des domaines d'interet |
US20120278268A1 (en) * | 2011-04-28 | 2012-11-01 | Nokia Corporation | Method and apparatus for extracting explicit profile representation through adaptive recommender system |
US20130132366A1 (en) * | 2006-04-24 | 2013-05-23 | Working Research Inc. | Interest Keyword Identification |
US8538955B2 (en) * | 2009-11-18 | 2013-09-17 | International Business Machines Corporation | Ranking expert responses and finding experts based on rank |
US20140188866A1 (en) * | 2012-12-31 | 2014-07-03 | Microsoft Corporation | Recommendation engine based on conditioned profiles |
-
2014
- 2014-12-10 FR FR1462154A patent/FR3030079B1/fr active Active
-
2015
- 2015-12-10 WO PCT/FR2015/053418 patent/WO2016092218A1/fr active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130132366A1 (en) * | 2006-04-24 | 2013-05-23 | Working Research Inc. | Interest Keyword Identification |
CA2805391A1 (fr) * | 2008-02-25 | 2009-09-03 | Atigeo Llc | Determination d'informations pertinentes pour des domaines d'interet |
US8538955B2 (en) * | 2009-11-18 | 2013-09-17 | International Business Machines Corporation | Ranking expert responses and finding experts based on rank |
US20120278268A1 (en) * | 2011-04-28 | 2012-11-01 | Nokia Corporation | Method and apparatus for extracting explicit profile representation through adaptive recommender system |
US20140188866A1 (en) * | 2012-12-31 | 2014-07-03 | Microsoft Corporation | Recommendation engine based on conditioned profiles |
Non-Patent Citations (1)
Title |
---|
MONA TAGHAVI ET AL: "An analysis of web proxy logs with query distribution pattern approach for search engines", COMPUTER STANDARDS AND INTERFACES, ELSEVIER SEQUOIA. LAUSANNE, CH, vol. 34, no. 1, 18 July 2011 (2011-07-18), pages 162 - 170, XP028118166, ISSN: 0920-5489, [retrieved on 20110723], DOI: 10.1016/J.CSI.2011.07.001 * |
Also Published As
Publication number | Publication date |
---|---|
WO2016092218A1 (fr) | 2016-06-16 |
FR3030079B1 (fr) | 2024-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9239883B2 (en) | Searching system having a server which automatically generates search data sets for shared searching | |
US8095500B2 (en) | Methods and systems for searching content in distributed computing networks | |
US8032527B2 (en) | Search filtering | |
US20110060716A1 (en) | Systems and methods for improving web site user experience | |
US20110060717A1 (en) | Systems and methods for improving web site user experience | |
RU2731654C1 (ru) | Способ и система для создания пуш-уведомлений, связанных с цифровыми новостями | |
US10229160B2 (en) | Search results based on a search history | |
US20130290369A1 (en) | Contextual application recommendations | |
KR20110036930A (ko) | 복수의 디바이스들에 걸친 개인적인 디지털 자산들을 관리하는 방법 | |
US20100070871A1 (en) | Extendable Recommender Framework for Web-Based Systems | |
US20180285423A1 (en) | Selection of information sources based on social activities | |
US20180365709A1 (en) | Personalized creator recommendations | |
US11762934B2 (en) | Target web and social media messaging based on event signals | |
US20200092611A1 (en) | Method and system for determining a relevancy parameter for content item | |
WO2016198635A1 (fr) | Gestion de noms de domaine du reseau internet | |
FR3030079A1 (fr) | Moyens pour determiner un niveau de pertinence d’une ressource dans un systeme de traitement d’informations | |
EP3494494A1 (fr) | Moyens de diffusion d'un contenu personnalisé dans un réseau de communication | |
Gu et al. | CAMF: context aware matrix factorization for social recommendation | |
WO2009121808A1 (fr) | Procede de gestion de messages electroniques a partir d'un client de messagerie et systeme pour mettre en oeuvre le procede | |
Loizou | How to recommend music to film buffs: enabling the provision of recommendations from multiple domains | |
US20220107872A1 (en) | Methods and servers for storing data associated with users and digital items of a recommendation system | |
Singh et al. | Towards a framework for web page recommendation system based on semantic web usage mining: A case study | |
US20190377767A1 (en) | Personalized content suggestions in computer networks | |
WO2018015515A1 (fr) | Procedes de partage d'opinion, equipements et programmes d'ordinateur pour la mise en oeuvre des procedes | |
Mamun et al. | Profiling Online Users: Emerging Approaches and Challenges |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 2 |
|
PLSC | Publication of the preliminary search report |
Effective date: 20160617 |
|
PLFP | Fee payment |
Year of fee payment: 3 |
|
PLFP | Fee payment |
Year of fee payment: 4 |
|
PLFP | Fee payment |
Year of fee payment: 5 |
|
PLFP | Fee payment |
Year of fee payment: 6 |
|
PLFP | Fee payment |
Year of fee payment: 7 |
|
PLFP | Fee payment |
Year of fee payment: 8 |
|
PLFP | Fee payment |
Year of fee payment: 9 |
|
PLFP | Fee payment |
Year of fee payment: 10 |
|
PLFP | Fee payment |
Year of fee payment: 11 |