FR2959333A1 - Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne - Google Patents
Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne Download PDFInfo
- Publication number
- FR2959333A1 FR2959333A1 FR1001793A FR1001793A FR2959333A1 FR 2959333 A1 FR2959333 A1 FR 2959333A1 FR 1001793 A FR1001793 A FR 1001793A FR 1001793 A FR1001793 A FR 1001793A FR 2959333 A1 FR2959333 A1 FR 2959333A1
- Authority
- FR
- France
- Prior art keywords
- semantic
- textual content
- concept
- online community
- community
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000006399 behavior Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 15
- 230000006978 adaptation Effects 0.000 description 7
- 230000003993 interaction Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000009472 formulation Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Primary Health Care (AREA)
- Machine Translation (AREA)
- Information Transfer Between Computers (AREA)
- Document Processing Apparatus (AREA)
Abstract
Procédé d'adaptation d'un contenu textuel au comportement langagier d'une communauté en ligne, comprenant les étapes suivantes : - établissement d'un nuage sémantique de tags de la communauté en ligne ; - détermination, à partir du nuage sémantique de tags, d'au moins un voisinage sémantique à au moins un concept du contenu textuel ; - reformulation du contenu textuel à l'aide du voisinage sémantique déterminé.
Description
PROCEDE ET SYSTEME D'ADAPTATION D'UN CONTENU TEXTUEL AU COMPORTEMENT LANGAGIER D'UNE COMMUNAUTE EN LIGNE L'invention se rapporte à la communication électronique de groupe au sein d'une communauté en ligne.
L'expression « en ligne » désigne, ici, le simple recours à des dispositifs informatiques et électroniques pour interagir avec des membres d'une communauté. En effet, les communautés en ligne sont accessibles via le réseau Internet (Web 2), tel que par exemples les listes de diffusion, les forums de discussion, ou les réseaux sociaux, ou via un réseau Intranet/Extranet, tel qu'un espace de travail collaboratif d'une entreprise, une communauté de pratique ou analogues. Créée par un ou plusieurs administrateurs, une communauté en ligne, également dénommée communauté virtuelle, représente un lieu de communication électronique de groupe (collective) en temps différé (interactions asynchrones) entre intéressés par une certaine thématique d'ordre social, commercial ou éducatif par exemple. Tout utilisateur intéressé par cette thématique peut se joindre à la communauté et ainsi interagir avec ses membres. Ces derniers peuvent y échanger (déposer et/ou regarder) des contenus textuels, multimédia, ou plus généralement des données. Dans certaines communautés en ligne, seuls les usagers inscrits et identifiés pas un mot de passe peuvent déposer et/ou regarder des contenus. Ces communautés en ligne sont principalement langagières dans le sens où la communication électronique écrite est principalement l'unique moyen permettant un groupement d'utilisateurs de se constituer en une communauté. En effet, à part la thématique intéressant les membres, une communauté en ligne est généralement constituée par l'adoption et la pratique, par le groupe, d'un comportement langagier et interactionnel particulier dans cet espace de communication électronique de groupe. Ceci a pour effet que certaines pratiques langagières se ritualisent au cours du temps au sein d'une communauté en ligne, marquant, en conséquence, un indice d'appartenance communautaire à celle-ci. A001_B115_FR/806772 Autrement dit, l'appartenance à une communauté en ligne se manifeste par le partage d'un vocabulaire, d'un registre de langue, de conventions linguistiques, d'abréviations, d'acronymes, de protocoles de communication, de codes, de spécificités syntaxiques, et de concepts collectivement reconnus et attendus par ses membres, que par les normes linguistiques conventionnelles. A titre d'exemples, dans certaines communautés en ligne, on désigne la capitale de la France par « la ville de la tour Eiffel» ; le responsable d'équipe (dans le cas d'un espace de travail collaboratif sur un réseau Intranet par exemple) par « le Boss », l'expression « Long Term Evolution » par « LTE », le mot « salut » par « sit », l'équipe de football adverse par « les losers », le gagnant dans un jeu, organisé par la communauté en ligne, par « le king » ; on commence un message par « bonjour à tous », et clôture une question par « merci d'avance » ou « merci pour vos réponses »; on se tutoie. Il est à noter que ces pratiques langagières peuvent avoir peu de justesse linguistique en soi, mais elles en trouvent dans les concepts, le vocabulaire, et surtout la sémantique propres à la communauté en ligne. II s'agit d'une culture langagière qui n'est partagée que par les membres habitués d'une communauté en ligne. On parle, dans ce cas, d'un écosystème. Un lien communautaire envers une communauté en ligne se traduit, ainsi, par l'adoption et l'utilisation d'un langage et d'un code commun propre à 25 cette communauté. Pour un nouveau membre dans une certaine communauté en ligne, le dépôt d'une communication écrite (un message, une annotation, un commentaire, une question, ou plus généralement un écrit électronique) n'est réussi que si sa formulation est attendue par les membres habitués de cette 30 communauté. Equivalemment, la lecture d'une communication écrite déjà publiée par cette communauté en ligne n'est comprise au mieux que si ce nouveau membre reconnait (déchiffre) la pratique langagière de cette communauté en ligne. A défaut, tout nouveau membre aura un sentiment d'exclusion de la part de cette communauté en ligne. A001_B115_FR/806772 En effet, un des handicaps majeurs qu'un utilisateur rencontre lorsqu'il rejoint une communauté en ligne est certainement les efforts d'adaptation requis pour devenir un « vrai » membre de cette communauté. Cette adaptation se manifeste par la compréhension rapide et/ou la formulation d'une manière correcte, notamment à la lumière du comportement langagier de cette communauté, d'un écrit électronique. L'interprétation, par les membres d'une communauté en ligne, des messages (notamment des questions) postés par un nouveau membre û donc pas encore familiarisé avec le vocabulaire et la sémantique de cette communauté - peut prendre beaucoup de temps et altérer, par conséquent, la réactivité de cette communauté. Un nouveau utilisateur (ou un nouveau membre) aura, également, besoin de plus de temps pour comprendre une communication provenant de cette communauté en ligne. Un objet de la présente invention est de remédier aux inconvénients 15 précités. Un autre objet de la présente invention est de proposer un nouveau service à valeur ajoutée aux utilisateurs des communautés en lignes. Un autre objet de la présente invention est d'adapter (aligner) le contenu d'une communication électronique écrite au comportement langagier d'une 20 communauté en ligne. Un autre objet de la présente invention est de garantir une représentation uniforme du contenu des espaces de communications des communautés en ligne. Un autre objet de la présente invention est de favoriser et d'améliorer le 25 rendement du partage d'information dans le réseau d'une entreprise. Un autre objet de la présente invention est de faciliter l'intégration des nouveaux membres dans une communauté en ligne. Un autre objet de la présente invention est de caractériser, d'un point de vue linguistique, les communautés en ligne. A001_6115_FR/806772 Un autre objet de la présente invention est de favoriser l'essor des communautés en ligne. Un autre objet de la présente invention est de favoriser l'émergence d'un sentiment d'appartenance, chez un nouveau membre, à une communauté 5 virtuelle. Un autre objet de la présente invention est de proposer un dispositif sociotechnique favorisant l'émergence des communications au sein des communautés en ligne. Un autre objet de la présente invention est d'améliorer l'efficacité des 10 communications électronique de groupe. Un autre objet de la présente invention est d'identifier les comportements langagiers des communautés en ligne. A cette fin, l'invention se rapporte, selon un premier aspect, à un procédé d'adaptation d'un contenu textuel au comportement langagier d'une 15 communauté en ligne, ce procédé comprenant les étapes suivantes : établissement d'un nuage sémantique de tags de la communauté en ligne ; détermination, à partir du nuage sémantique de tags, d'au moins un voisinage sémantique à au moins un concept du contenu 20 textuel ; - reformulation du contenu textuel à l'aide du voisinage sémantique déterminé. L'invention se rapporte, selon un deuxième aspect, à un dispositif d'adaptation d'un contenu textuel au comportement langagier d'une 25 communauté en ligne, ce dispositif comprenant les modules suivants : un analyseur sémantique agencé pour établir un nuage sémantique de tags de la communauté en ligne ; un calculateur de proximité sémantique agencé pour déterminer, à partir du nuage sémantique de tags, d'au moins un voisinage 30 sémantique à au moins un concept du contenu textuel ; un reformulateur sémantique du contenu textuel à l'aide du voisinage sémantique déterminé. A001_B115_FR/806772 L'invention propose, selon un troisième aspect, un produit programme d'ordinateur implémenté sur un support mémoire, susceptible d'être mis en oeuvre au sein d'une unité de traitement informatique et comprenant des instructions pour la mise en oeuvre du procédé résumé ci-dessus.
D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement et de manière concrète à la lecture de la description ci-après de modes de réalisation préférés, laquelle est faite en référence aux dessins annexés dans lesquels : la figure 1 illustre schématiquement les modules d'un dispositif 10 d'adaptation sémantique d'un contenu textuel à un certain comportement langagier ; la figure 2 illustre schématiquement une architecture fonctionnelle non limitative d'un dispositif d'adaptation sémantique d'un contenu textuel à un certain comportement langagier. 15 Sur la figure 1 est représenté un utilisateur 20 procédant à interagir avec une communauté en ligne 51. On entend, ici, par « interagir avec une communauté en ligne » le fait de déposer et/ou de lire un contenu électronique textuel dans l'espace de communication électronique de cette communauté. A titre d'exemples non exhaustifs, la communauté en ligne 51 20 est un réseau social tel que « Facebook®», « Twitter® », « mySpace ®», ou « hi5®»; une indexation personnelle, dite aussi folksonomie (social tagging), telle que « delicious® », « youtube®», « flickr®», ou « yoolink® » ; 25 - un forum de discussion en ligne tel que www.commentcamarche.net, http://forum.hardware.fr/, ou http://voyageforum.com/; ou - un groupe d'utilisateurs sur un réseau Intranet ou Extranet tel qu'un espace de travail collaboratif. Dans son interaction avec une des communautés en ligne 5, l'utilisateur 20 30 est assisté par un adaptateur 10 sémantique. L'adaptateur 10 sémantique est configuré pour effectuer une projection sémantique du contenu textuel généré par l'utilisateur 20 sur les pratiques A001_B115_FR/806772 langagières de la communauté en ligne 51. Cette projection sémantique vise, notamment, à adapter au mieux le contenu textuel, que l'utilisateur 20 souhaite déposer, aux pratiques langagières de la communauté en ligne 51. A cet égard, l'adaptateur 10 sémantique est pourvu d'une pluralité de 5 modules incluant un analyseur 1 sémantique, un calculateur 2 de proximité sémantique, et un reformulateur 3 sémantique. L'analyseur 1 sémantique est agencé pour établir le nuage sémantique (notamment, « semantic cloud » en anglais) de tags (ou de mots clés) d'une communauté en ligne 51. 10 Pour cela, l'analyseur 1 sémantique effectue une analyse conversationnelle des échanges textuels publiés dans la communauté en ligne 51. Ces échanges sont généralement organisés en fils de discussion (un même sujet de discussion dans un forum, une même collection dans « Flickr® », un même projet dans un espace de travail collaboratif, un contenu publié 15 par un groupe d'amis sur « Facebook® » par exemple). Le nuage sémantique de tags, établi par l'analyseur 1 sémantique, est un condensé sémantique des termes caractéristiques de la communauté en ligne 51. Ces termes sont dotés d'au moins une métrique permettant de faire ressortir leurs importances dans les pratiques langagières de cette 20 communauté en ligne 51. A titre d'exemple, une métrique peut être la fréquence d'utilisation d'un certain concept dans les interactions déjà publiées au sein de cette communauté en ligne 51. Dans ce cas, chaque concept est caractérisé par un poids reflétant son occurrence dans cette communauté en ligne 51. 25 En variante ou en combinaison, cette métrique peut aussi se rapporter à d'autres propriétés telle que, par exemple, la distribution de Shanon de la théorie de l'information, qui reflète la quantité d'information qu'un concept comporte. Ainsi, ce nuage sémantique de tags ne se réduit pas à une simple liste des termes les plus utilisés dans une communauté en ligne 51, 30 mais à un véritable condensé sémantique de cette dernière. En effet, à titre d'exemple, un nuage sémantique de tags peut simultanément refléter les concepts les plus fréquents d'un contenu textuel ainsi que leurs proximités
A001_B115_FR/806772 sémantiques dans ce contenu (un nuage sémantique de tags arboré, un nuage sémantique de tags en 3D). Ces concepts peuvent concerner, à titre d'exemples, les règles de politesse (les messages d'ouverture et de clôture d'un 5 message, messages de salutations, remerciements anticipés) ; les abréviations ; - le registre de langue et le vocabulaire (vocabulaire métier, registre courant/soutenu/familier/populaire/argotique par exemple) ; - les indices paralinguistiques (des smileys ou des émoticônes) ; 10 - les ponctuations expressives (écriture en majuscule, démultiplication d'un même signe (redoublement d'un point d'exclamation par exemple) pour traduire l'intensité d'expression d'une opinion ou d'un sentiment) ; la pragmatique des interactions (utilisation des prénoms, se tutoyer). 15 Avantageusement, le nuage sémantique de tags permet de résumer un contenu complexe d'une communauté en ligne 51 à l'aide seulement des pratiques langagières qui lui sont propres. Autrement dit, l'analyseur 1 sémantique permet d'obtenir une image sémantique d'une communauté en ligne 51 à partir de ce qui y est communément pratiqué. 20 Le nuage sémantique de tags d'une communauté en ligne 51 est obtenu indépendamment de tout contenu textuel qu'un utilisateur souhaite déposer/lire dans cette communauté. Le calculateur 2 de proximité sémantique est agencé pour fournir, à partir d'un nuage sémantique de tags établi par l'analyseur 1 sémantique, un 25 voisinage sémantique à un contenu textuel généré par l'utilisateur 20, suivant des rapports de proximité sémantique prédéfinis (par synonymie, par parasynonymie, ou par analyse des logiques subjectives par exemple). Le calculateur 2 de proximité sémantique est configuré pour déterminer, dans le nuage sémantique de tags, des voisinages sémantiques composés 30 des termes/concepts les plus représentatifs, respectivement, des concepts identifiés dans le contenu textuel généré par l'utilisateur 20. Autrement dit, chaque voisinage sémantique déterminé comprend, de préférence, une
A001_B115_FR/806772 pluralité de concepts sémantiquement proche à un concept identifié dans le contenu textuel généré par l'utilisateur. De préférence, le calculateur 2 de proximité sémantique utilise des métadonnées 4 d'ontologies (telles que celles de WordNet®, SentiWordNet®, ConceptNet®), et/ou de vocabulaire prédéfini par l'utilisateur 20 ou généré automatiquement. Ces métadonnées 4 assistent le calculateur 2 de proximité sémantique à identifier les concepts compris dans le contenu textuel généré par l'utilisateur 20, auxquels il est supposé trouver leurs voisinages sémantiques respectifs dans un nuage sémantique de tags. Plus généralement, le calculateur 2 de proximité sémantique est un « mandataire sémantique » (ou « proxy sémantique »), étant donné sa fonction de fourniture d'au moins un voisinage sémantique en réponse à une requête concernant un certain contenu textuel.
Ce proxy sémantique est une métadonnée d'ontologies ou de passerelles vers les plateformes des communautés en ligne, et plus particulièrement vers les systèmes sociaux (réseaux sociaux et systèmes de « taggage » social tels que « Facebook® » ou « Flickr® »). Le reformulateur 3 sémantique permet de récupérer, à partir du nuage sémantique de tags, les termes/concepts étant les plus proches sémantiquement, selon le calculateur 2 de proximité sémantique, à ceux du contenu généré par l'utilisateur 20 ; et de reformuler, en conséquence, le contenu textuel généré par l'utilisateur 20 à l'aide des termes/concepts récupérés. Le contenu généré par l'utilisateur 20 est, donc, adapté à l'aide de son voisinage sémantique sélectionné à partir du nuage sémantique de tags, ensuite présenté à l'utilisateur 20. Dans le cas où le contenu textuel adapté est rejeté par l'utilisateur 20, une nouvelle adaptation différente de la précédente est, de préférence, proposée à l'utilisateur. Pour cela, le reformulateur 3 sémantique A001_B115_FR/806772 s'intéresse à la hiérarchie du contenu des voisinages sémantiques, déterminés par le calculateur 2 de proximité sémantique, vis-à-vis le contenu généré par l'utilisateur 20 en procédant à une mesure de proximité sémantique dont les étapes comprennent : l'évaluation de la distance sémantique entre un concept Ç généré par l'utilisateur 20 et le nuage sémantique NS de la communauté en ligne 51; la recherche d'un autre concept C' dans le voisinage du concept C de sorte que la distance sémantique entre C' et C soit minimale ; - la recommandation du concept C' pour remplacer le concept C, C' étant plus adapté au comportement langagier de cette communauté. Différentes techniques de mesure de la distance sémantique sont décrites, par exemple, dans (M.Z MAALA, et al., « Distance sémantique entre concepts définis en 7148 », publié dans Langages et Modèles à Objets 07 Toulouse, 2007). Une mesure de la similarité sémantique ou du degré de relation sémantique peut être aussi utilisée. On se réfère maintenant à la figure 2, illustrant une procédure d'interaction utilisateur avec une communauté en ligne 51.
La procédure d'adaptation sémantique d'un contenu textuel au comportement langagier d'une communauté en ligne 51 fait appel aux modules fonctionnels précités de la manière suivante: sur requête de l'utilisateur 20 ou d'une manière automatique précédant tout dépôt d'un contenu comprenant une annotation textuelle 21, cette dernière est communiqué au dispositif d'adaptation de contenu textuel au comportement langagier de la communauté en ligne 51 (étape 11 dans la figure 2) ; en utilisant les métadonnées 4 d'ontologies (étape 12 dans la figure 2), le calculateur 2 de proximité sémantique identifie au 30 moins un concept dans l'annotation 21 ; en utilisant de nouveau les métadonnées 4 d'ontologies (étape 12 dans la figure 2), le calculateur 2 de proximité sémantique recherche (étape 13 dans la figure 2), dans le nuage sémantique A001_B115_FR/806772 de tags 31 de la communauté en ligne 51, au moins un voisinage sémantique à chaque concept identifié dans l'annotation textuelle 21 , à l'aide du reformulateur 3 sémantique, les concepts du nuage de tags 31 les plus proches sémantiquement, selon le calculateur 2 de proximité sémantique, sont récupérés, ensuite apportés à l'annotation 21, résultant en une annotation 22 adapté au comportement langagier de la communauté en ligne 51. L'annotation 22 adaptée est adressée à l'utilisateur 20 (étape 14 dans la figure 2) ; l'utilisateur est libre d'approuver ou annuler, en tout ou en partie, les modifications apportées à l'annotation 21 (étape 15 dans la figure 2). De préférence, les concepts modifiés dans le contenu original généré par l'utilisateur 20 sont momentanément mis en surbrillance pour l'utilisateur 20, afin de faciliter l'identification des modifications apportées, accélérant ainsi l'appropriation de ces concepts par l'utilisateur 20 ce qui en résulte l'émergence d'un sentiment d'appartenance chez l'utilisateur 20 à la communauté en ligne 51.
II est à noter que le contenu textuel adapté aux comportements langagiers de la communauté en ligne cible n'est qu'une proposition que l'utilisateur 20 peut ignorer ou refuser. Autrement dit, le contenu textuel modifié ne peut être directement publié sans l'approbation explicite de l'utilisateur. Par ailleurs, le procédé décrit ci-dessus peut être aussi utilisé pour éclaircir, à la lumière du comportement langagier d'une communauté en ligne, un contenu textuel identifié (sélectionné par exemple) dans l'espace de communication de cette communauté. A titre d'exemple, l'utilisation d'un dictionnaire propre à une communauté en ligne permet de clarifier un contenu textuel publié par cette communauté, à tout autre utilisateur non- familiarisé avec cette communauté (un utilisateur d'âge très différent de ceux des membres de cette communauté en ligne par exemple). Le procédé qui vient d'être décrit trouve, notamment, application dans un réseau d'entreprise en vue d'améliorer et de faciliter la communication entre différentes équipes de travail. Grâce à ce procédé, les membres d'un A001_B115_FR/806772 espace de travail collaboratif inter-métiers, ayant des vocabulaires métier/cultures différents, auront une meilleure compréhension réciproque. Ce procédé permet, en outre, d'uniformiser le vocabulaire utilisé (les mêmes abréviations, les mêmes termes techniques par exemple).
Le procédé qui vient d'être décrit présente un certain nombre d'avantages. Il permet en effet d'aligner l'ontologie d'un contenu électronique textuel avec celles d'une communauté en ligne cible, ce qui le rend directement intelligible par les membres de cette communauté. Ce dispositif peut être mis en oeuvre sous la forme d'une extension ou une fonction associée à un navigateur Web et dont l'utilisation peut être automatique ou à l'initiative de l'utilisateur. Le contenu textuel adapté par ce dispositif peut être affiché, par exemple, dans le même emplacement que celui du contenu textuel original, dans une nouvelle fenêtre/onglet, ou dans une infobulle, tout en permettant de préférence, de distinguer les modifications apportées ; et - l'utilisateur d'approuver ou d'ignorer cette proposition (voire, désactiver cette extension/fonction d'adaptation). A001_B115_FR/806772
Claims (10)
- REVENDICATIONS1. Procédé d'adaptation d'un contenu textuel au comportement langagier d'une communauté en ligne, ce procédé comprenant les étapes suivantes : établissement d'un nuage sémantique de tags de la communauté en ligne ; détermination, à partir du nuage sémantique de tags, d'au moins un voisinage sémantique à au moins un concept du contenu textuel ; reformulation du contenu textuel à l'aide du voisinage sémantique déterminé.
- 2. Procédé selon la revendication 1, caractérisé en ce qu'il comprend en outre une étape d'indentification, à l'aide de métadonnées d'ontologies, d'au moins un concept compris dans le contenu textuel.
- 3. Procédé selon l'une quelconque des revendications 1 ou 2, caractérisé en ce que l'étape de détermination d'au moins un voisinage sémantique est faite suivant des rapports de proximité sémantique prédéfinis.
- 4. Procédé selon l'une quelconque des revendications 1 à 3, caractérisé en ce que le voisinage sémantique déterminé comprend une pluralité de concepts sémantiquement proche au concept identifié dans le contenu textuel.
- 5. Procédé selon l'une quelconque des revendications 1 à 4, caractérisé en ce que la reformulation du contenu textuel comprend une étape de sélection d'un concept du nuage sémantique déterminé pour remplacer le concept identifié dans le contenu textuel.
- 6. Procédé selon la revendication 5, caractérisé en ce que le concept sélectionné est le plus proche sémantiquement au concept identifié dans le contenu textuel.
- 7. Dispositif d'adaptation d'un contenu textuel au comportement langagier d'une communauté en ligne, ce dispositif comprenant les modules suivants : un analyseur (1) sémantique agencé pour établir un nuage sémantique de tags de la communauté en ligne (51) ; A001_B115_FR/806772 15un calculateur (2) de proximité sémantique agencé pour déterminer, à partir du nuage sémantique de tags, d'au moins un voisinage sémantique à au moins un concept du contenu textuel ; un reformulateur (3) sémantique du contenu textuel à l'aide du voisinage sémantique déterminé.
- 8. Dispositif selon la revendication 7, caractérisé en ce qu'il comprend en outre des métadonnées (4) d'ontologies permettant d'identifier d'au moins un concept compris dans le contenu textuel.
- 9. Produit programme d'ordinateur implémenté sur un support mémoire, susceptible d'être mis en oeuvre au sein d'une unité de traitement informatique et comprenant des instructions pour la mise en oeuvre d'un procédé selon l'une des revendications 1 à 6.
- 10. Produit programme d'ordinateur selon la revendication 9, caractérisé en ce qu'il est une extension associée à un navigateur Web. A001_B115_FR/806772
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1001793A FR2959333B1 (fr) | 2010-04-27 | 2010-04-27 | Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne |
PCT/EP2011/055968 WO2011134804A1 (fr) | 2010-04-27 | 2011-04-14 | Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne |
CN2011800183384A CN102844775A (zh) | 2010-04-27 | 2011-04-14 | 用于改编文本内容以适应在线社区的语言行为的方法和系统 |
EP11714318A EP2564362A1 (fr) | 2010-04-27 | 2011-04-14 | Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne |
KR1020127026562A KR101415634B1 (ko) | 2010-04-27 | 2011-04-14 | 온라인 커뮤니티의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 방법 및 시스템 |
US13/636,201 US20130096910A1 (en) | 2010-04-27 | 2011-04-14 | Method and system for adapting text content to the language behavior of an online community |
JP2013506579A JP5940056B2 (ja) | 2010-04-27 | 2011-04-14 | テキストコンテンツをオンライン・コミュニティの言語行動に適合させるための方法およびシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1001793A FR2959333B1 (fr) | 2010-04-27 | 2010-04-27 | Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne |
Publications (2)
Publication Number | Publication Date |
---|---|
FR2959333A1 true FR2959333A1 (fr) | 2011-10-28 |
FR2959333B1 FR2959333B1 (fr) | 2014-05-23 |
Family
ID=43125621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR1001793A Expired - Fee Related FR2959333B1 (fr) | 2010-04-27 | 2010-04-27 | Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne |
Country Status (7)
Country | Link |
---|---|
US (1) | US20130096910A1 (fr) |
EP (1) | EP2564362A1 (fr) |
JP (1) | JP5940056B2 (fr) |
KR (1) | KR101415634B1 (fr) |
CN (1) | CN102844775A (fr) |
FR (1) | FR2959333B1 (fr) |
WO (1) | WO2011134804A1 (fr) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9959340B2 (en) * | 2012-06-29 | 2018-05-01 | Microsoft Technology Licensing, Llc | Semantic lexicon-based input method editor |
US10289727B2 (en) | 2015-09-17 | 2019-05-14 | International Business Machines Corporation | Incorporation of semantic attributes within social media |
US10878473B1 (en) * | 2017-11-16 | 2020-12-29 | Amazon Technologies, Inc. | Content modification |
US11307880B2 (en) | 2018-04-20 | 2022-04-19 | Meta Platforms, Inc. | Assisting users with personalized and contextual communication content |
US11010436B1 (en) * | 2018-04-20 | 2021-05-18 | Facebook, Inc. | Engaging users by personalized composing-content recommendation |
CN108664998A (zh) * | 2018-04-27 | 2018-10-16 | 上海爱优威软件开发有限公司 | 一种释义加强的图片训练方法及系统 |
US11176322B2 (en) * | 2018-05-22 | 2021-11-16 | International Business Machines Corporation | Predicting if a message will be understood by recipients |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070033002A1 (en) * | 2005-07-19 | 2007-02-08 | Xerox Corporation | Second language writing advisor |
WO2008021512A2 (fr) * | 2006-08-17 | 2008-02-21 | Neustar, Inc. | Système et procédé de gestion du jargon dans les systèmes de communication |
WO2008025645A2 (fr) * | 2006-08-29 | 2008-03-06 | International Business Machines Corporation | Déchiffrage d'un texte abrégé dans un système de communication électronique |
US20100030551A1 (en) * | 2008-07-31 | 2010-02-04 | Ark Wendy S | Jargon translation in an instant messaging environment |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09245038A (ja) * | 1996-03-07 | 1997-09-19 | Just Syst Corp | 文章作成装置 |
US6161083A (en) * | 1996-05-02 | 2000-12-12 | Sony Corporation | Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation |
ATE207220T1 (de) * | 1996-07-03 | 2001-11-15 | Sopheon N V | System zum unterstützen der produktion von dokumenten |
WO2002001401A1 (fr) * | 2000-06-26 | 2002-01-03 | Onerealm Inc. | Procede et appareil pour normaliser et convertir du contenu structure |
US20040044517A1 (en) * | 2002-08-30 | 2004-03-04 | Robert Palmquist | Translation system |
AU2003291049A1 (en) * | 2002-11-22 | 2004-06-18 | Transclick, Inc. | System and method for speech translation using remote devices |
US8155951B2 (en) * | 2003-06-12 | 2012-04-10 | Patrick William Jamieson | Process for constructing a semantic knowledge base using a document corpus |
US20060020447A1 (en) * | 2004-07-26 | 2006-01-26 | Cousineau Leo E | Ontology based method for data capture and knowledge representation |
US7860873B2 (en) * | 2004-07-30 | 2010-12-28 | International Business Machines Corporation | System and method for automatic terminology discovery |
WO2006086053A2 (fr) * | 2004-12-01 | 2006-08-17 | Whitesmoke, Inc. | Systeme et procede destines a l'enrichissement automatique de documents |
US7653528B2 (en) * | 2005-03-08 | 2010-01-26 | Microsoft Corporation | Resource authoring incorporating ontology |
US7702665B2 (en) * | 2005-06-14 | 2010-04-20 | Colloquis, Inc. | Methods and apparatus for evaluating semantic proximity |
CN100349161C (zh) * | 2005-07-29 | 2007-11-14 | 中国科学院声学研究所 | 一种用于句子分析中动词歧义结构消解的语义分析方法 |
US20080040094A1 (en) * | 2006-08-08 | 2008-02-14 | Employease, Inc. | Proxy For Real Time Translation of Source Objects Between A Server And A Client |
US8145473B2 (en) * | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
US9275036B2 (en) * | 2006-12-21 | 2016-03-01 | International Business Machines Corporation | System and method for adaptive spell checking |
US7869987B2 (en) * | 2007-12-03 | 2011-01-11 | International Business Machines Corporation | Methods involving translating text emphasis |
US8359191B2 (en) * | 2008-08-01 | 2013-01-22 | International Business Machines Corporation | Deriving ontology based on linguistics and community tag clouds |
JP2009043288A (ja) * | 2008-11-10 | 2009-02-26 | Japan Science & Technology Agency | コミュニティ依存型情報検索システム及び方法 |
US9009022B2 (en) * | 2010-03-30 | 2015-04-14 | Young Hee Yi | E-book reader language mapping system and method |
-
2010
- 2010-04-27 FR FR1001793A patent/FR2959333B1/fr not_active Expired - Fee Related
-
2011
- 2011-04-14 CN CN2011800183384A patent/CN102844775A/zh active Pending
- 2011-04-14 KR KR1020127026562A patent/KR101415634B1/ko active IP Right Grant
- 2011-04-14 WO PCT/EP2011/055968 patent/WO2011134804A1/fr active Application Filing
- 2011-04-14 US US13/636,201 patent/US20130096910A1/en not_active Abandoned
- 2011-04-14 EP EP11714318A patent/EP2564362A1/fr not_active Withdrawn
- 2011-04-14 JP JP2013506579A patent/JP5940056B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070033002A1 (en) * | 2005-07-19 | 2007-02-08 | Xerox Corporation | Second language writing advisor |
WO2008021512A2 (fr) * | 2006-08-17 | 2008-02-21 | Neustar, Inc. | Système et procédé de gestion du jargon dans les systèmes de communication |
WO2008025645A2 (fr) * | 2006-08-29 | 2008-03-06 | International Business Machines Corporation | Déchiffrage d'un texte abrégé dans un système de communication électronique |
US20100030551A1 (en) * | 2008-07-31 | 2010-02-04 | Ark Wendy S | Jargon translation in an instant messaging environment |
Also Published As
Publication number | Publication date |
---|---|
KR20120139791A (ko) | 2012-12-27 |
EP2564362A1 (fr) | 2013-03-06 |
JP5940056B2 (ja) | 2016-06-29 |
FR2959333B1 (fr) | 2014-05-23 |
JP2013530437A (ja) | 2013-07-25 |
WO2011134804A1 (fr) | 2011-11-03 |
CN102844775A (zh) | 2012-12-26 |
US20130096910A1 (en) | 2013-04-18 |
KR101415634B1 (ko) | 2014-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kumar et al. | Sentiment analysis of multimodal twitter data | |
US11977854B2 (en) | Computer implemented methods for the automated analysis or use of data, including use of a large language model | |
US20230136902A1 (en) | Computer implemented method for the automated analysis or use of data | |
US12073180B2 (en) | Computer implemented methods for the automated analysis or use of data, including use of a large language model | |
US20170185581A1 (en) | Systems and methods for suggesting emoji | |
US11989527B2 (en) | Computer implemented methods for the automated analysis or use of data, including use of a large language model | |
US9710829B1 (en) | Methods, systems, and articles of manufacture for analyzing social media with trained intelligent systems to enhance direct marketing opportunities | |
US11989507B2 (en) | Computer implemented methods for the automated analysis or use of data, including use of a large language model | |
WO2023161630A1 (fr) | Procédés mis en œuvre par ordinateur pour l'analyse ou l'utilisation automatisée de données, comprenant l'utilisation d'un grand modèle de langage | |
WO2011134804A1 (fr) | Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne | |
Chiranjeevi et al. | A lightweight deep learning model based recommender system by sentiment analysis | |
US20170344642A1 (en) | System and method for automated responses to information needs on websites | |
CN110110053B (zh) | 在间接话语和事务之间建立逻辑连接 | |
US12067362B2 (en) | Computer implemented methods for the automated analysis or use of data, including use of a large language model | |
Fatima et al. | An exploratory and automated study of sarcasm detection and classification in app stores using fine-tuned deep learning classifiers | |
Praet et al. | Comparing automated content analysis methods to distinguish issue communication by political parties on Twitter | |
Pak | Automatic, adaptive, and applicative sentiment analysis | |
Alamsyah et al. | Empowering Indonesian Internet Users: An Approach to Counter Online Toxicity and Enhance Digital Well-Being | |
Herrera et al. | Learning to leverage microblog information for QA retrieval | |
Armstrong et al. | Legends: Folklore on Reddit | |
CN115497482B (zh) | 一种语音对话方法及相关装置 | |
Harwood et al. | Understanding multilingual communities through analysis of code-switching behaviors in social media discussions | |
Mariani et al. | The French language in the digital age | |
Langholm | Constructing a Personal Knowledge Graph from Disparate Data Sources | |
Aksu | Using peer-to-peer communication characteristics to improve gender prediction in electronic discourse |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GC | Lien (pledge) constituted |
Effective date: 20131018 |
|
RG | Lien (pledge) cancelled |
Effective date: 20141016 |
|
CA | Change of address |
Effective date: 20150521 |
|
CA | Change of address |
Effective date: 20150521 |
|
PLFP | Fee payment |
Year of fee payment: 7 |
|
PLFP | Fee payment |
Year of fee payment: 8 |
|
PLFP | Fee payment |
Year of fee payment: 9 |
|
PLFP | Fee payment |
Year of fee payment: 10 |
|
ST | Notification of lapse |
Effective date: 20201209 |