FR2959333A1 - Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne - Google Patents

Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne Download PDF

Info

Publication number
FR2959333A1
FR2959333A1 FR1001793A FR1001793A FR2959333A1 FR 2959333 A1 FR2959333 A1 FR 2959333A1 FR 1001793 A FR1001793 A FR 1001793A FR 1001793 A FR1001793 A FR 1001793A FR 2959333 A1 FR2959333 A1 FR 2959333A1
Authority
FR
France
Prior art keywords
semantic
textual content
concept
online community
community
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR1001793A
Other languages
English (en)
Other versions
FR2959333B1 (fr
Inventor
Johan Stan
Hakim Hacid
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alcatel Lucent SAS
Original Assignee
Alcatel Lucent SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to FR1001793A priority Critical patent/FR2959333B1/fr
Application filed by Alcatel Lucent SAS filed Critical Alcatel Lucent SAS
Priority to KR1020127026562A priority patent/KR101415634B1/ko
Priority to PCT/EP2011/055968 priority patent/WO2011134804A1/fr
Priority to CN2011800183384A priority patent/CN102844775A/zh
Priority to EP11714318A priority patent/EP2564362A1/fr
Priority to US13/636,201 priority patent/US20130096910A1/en
Priority to JP2013506579A priority patent/JP5940056B2/ja
Publication of FR2959333A1 publication Critical patent/FR2959333A1/fr
Application granted granted Critical
Publication of FR2959333B1 publication Critical patent/FR2959333B1/fr
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Primary Health Care (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

Procédé d'adaptation d'un contenu textuel au comportement langagier d'une communauté en ligne, comprenant les étapes suivantes : - établissement d'un nuage sémantique de tags de la communauté en ligne ; - détermination, à partir du nuage sémantique de tags, d'au moins un voisinage sémantique à au moins un concept du contenu textuel ; - reformulation du contenu textuel à l'aide du voisinage sémantique déterminé.

Description

PROCEDE ET SYSTEME D'ADAPTATION D'UN CONTENU TEXTUEL AU COMPORTEMENT LANGAGIER D'UNE COMMUNAUTE EN LIGNE L'invention se rapporte à la communication électronique de groupe au sein d'une communauté en ligne.
L'expression « en ligne » désigne, ici, le simple recours à des dispositifs informatiques et électroniques pour interagir avec des membres d'une communauté. En effet, les communautés en ligne sont accessibles via le réseau Internet (Web 2), tel que par exemples les listes de diffusion, les forums de discussion, ou les réseaux sociaux, ou via un réseau Intranet/Extranet, tel qu'un espace de travail collaboratif d'une entreprise, une communauté de pratique ou analogues. Créée par un ou plusieurs administrateurs, une communauté en ligne, également dénommée communauté virtuelle, représente un lieu de communication électronique de groupe (collective) en temps différé (interactions asynchrones) entre intéressés par une certaine thématique d'ordre social, commercial ou éducatif par exemple. Tout utilisateur intéressé par cette thématique peut se joindre à la communauté et ainsi interagir avec ses membres. Ces derniers peuvent y échanger (déposer et/ou regarder) des contenus textuels, multimédia, ou plus généralement des données. Dans certaines communautés en ligne, seuls les usagers inscrits et identifiés pas un mot de passe peuvent déposer et/ou regarder des contenus. Ces communautés en ligne sont principalement langagières dans le sens où la communication électronique écrite est principalement l'unique moyen permettant un groupement d'utilisateurs de se constituer en une communauté. En effet, à part la thématique intéressant les membres, une communauté en ligne est généralement constituée par l'adoption et la pratique, par le groupe, d'un comportement langagier et interactionnel particulier dans cet espace de communication électronique de groupe. Ceci a pour effet que certaines pratiques langagières se ritualisent au cours du temps au sein d'une communauté en ligne, marquant, en conséquence, un indice d'appartenance communautaire à celle-ci. A001_B115_FR/806772 Autrement dit, l'appartenance à une communauté en ligne se manifeste par le partage d'un vocabulaire, d'un registre de langue, de conventions linguistiques, d'abréviations, d'acronymes, de protocoles de communication, de codes, de spécificités syntaxiques, et de concepts collectivement reconnus et attendus par ses membres, que par les normes linguistiques conventionnelles. A titre d'exemples, dans certaines communautés en ligne, on désigne la capitale de la France par « la ville de la tour Eiffel» ; le responsable d'équipe (dans le cas d'un espace de travail collaboratif sur un réseau Intranet par exemple) par « le Boss », l'expression « Long Term Evolution » par « LTE », le mot « salut » par « sit », l'équipe de football adverse par « les losers », le gagnant dans un jeu, organisé par la communauté en ligne, par « le king » ; on commence un message par « bonjour à tous », et clôture une question par « merci d'avance » ou « merci pour vos réponses »; on se tutoie. Il est à noter que ces pratiques langagières peuvent avoir peu de justesse linguistique en soi, mais elles en trouvent dans les concepts, le vocabulaire, et surtout la sémantique propres à la communauté en ligne. II s'agit d'une culture langagière qui n'est partagée que par les membres habitués d'une communauté en ligne. On parle, dans ce cas, d'un écosystème. Un lien communautaire envers une communauté en ligne se traduit, ainsi, par l'adoption et l'utilisation d'un langage et d'un code commun propre à 25 cette communauté. Pour un nouveau membre dans une certaine communauté en ligne, le dépôt d'une communication écrite (un message, une annotation, un commentaire, une question, ou plus généralement un écrit électronique) n'est réussi que si sa formulation est attendue par les membres habitués de cette 30 communauté. Equivalemment, la lecture d'une communication écrite déjà publiée par cette communauté en ligne n'est comprise au mieux que si ce nouveau membre reconnait (déchiffre) la pratique langagière de cette communauté en ligne. A défaut, tout nouveau membre aura un sentiment d'exclusion de la part de cette communauté en ligne. A001_B115_FR/806772 En effet, un des handicaps majeurs qu'un utilisateur rencontre lorsqu'il rejoint une communauté en ligne est certainement les efforts d'adaptation requis pour devenir un « vrai » membre de cette communauté. Cette adaptation se manifeste par la compréhension rapide et/ou la formulation d'une manière correcte, notamment à la lumière du comportement langagier de cette communauté, d'un écrit électronique. L'interprétation, par les membres d'une communauté en ligne, des messages (notamment des questions) postés par un nouveau membre û donc pas encore familiarisé avec le vocabulaire et la sémantique de cette communauté - peut prendre beaucoup de temps et altérer, par conséquent, la réactivité de cette communauté. Un nouveau utilisateur (ou un nouveau membre) aura, également, besoin de plus de temps pour comprendre une communication provenant de cette communauté en ligne. Un objet de la présente invention est de remédier aux inconvénients 15 précités. Un autre objet de la présente invention est de proposer un nouveau service à valeur ajoutée aux utilisateurs des communautés en lignes. Un autre objet de la présente invention est d'adapter (aligner) le contenu d'une communication électronique écrite au comportement langagier d'une 20 communauté en ligne. Un autre objet de la présente invention est de garantir une représentation uniforme du contenu des espaces de communications des communautés en ligne. Un autre objet de la présente invention est de favoriser et d'améliorer le 25 rendement du partage d'information dans le réseau d'une entreprise. Un autre objet de la présente invention est de faciliter l'intégration des nouveaux membres dans une communauté en ligne. Un autre objet de la présente invention est de caractériser, d'un point de vue linguistique, les communautés en ligne. A001_6115_FR/806772 Un autre objet de la présente invention est de favoriser l'essor des communautés en ligne. Un autre objet de la présente invention est de favoriser l'émergence d'un sentiment d'appartenance, chez un nouveau membre, à une communauté 5 virtuelle. Un autre objet de la présente invention est de proposer un dispositif sociotechnique favorisant l'émergence des communications au sein des communautés en ligne. Un autre objet de la présente invention est d'améliorer l'efficacité des 10 communications électronique de groupe. Un autre objet de la présente invention est d'identifier les comportements langagiers des communautés en ligne. A cette fin, l'invention se rapporte, selon un premier aspect, à un procédé d'adaptation d'un contenu textuel au comportement langagier d'une 15 communauté en ligne, ce procédé comprenant les étapes suivantes : établissement d'un nuage sémantique de tags de la communauté en ligne ; détermination, à partir du nuage sémantique de tags, d'au moins un voisinage sémantique à au moins un concept du contenu 20 textuel ; - reformulation du contenu textuel à l'aide du voisinage sémantique déterminé. L'invention se rapporte, selon un deuxième aspect, à un dispositif d'adaptation d'un contenu textuel au comportement langagier d'une 25 communauté en ligne, ce dispositif comprenant les modules suivants : un analyseur sémantique agencé pour établir un nuage sémantique de tags de la communauté en ligne ; un calculateur de proximité sémantique agencé pour déterminer, à partir du nuage sémantique de tags, d'au moins un voisinage 30 sémantique à au moins un concept du contenu textuel ; un reformulateur sémantique du contenu textuel à l'aide du voisinage sémantique déterminé. A001_B115_FR/806772 L'invention propose, selon un troisième aspect, un produit programme d'ordinateur implémenté sur un support mémoire, susceptible d'être mis en oeuvre au sein d'une unité de traitement informatique et comprenant des instructions pour la mise en oeuvre du procédé résumé ci-dessus.
D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement et de manière concrète à la lecture de la description ci-après de modes de réalisation préférés, laquelle est faite en référence aux dessins annexés dans lesquels : la figure 1 illustre schématiquement les modules d'un dispositif 10 d'adaptation sémantique d'un contenu textuel à un certain comportement langagier ; la figure 2 illustre schématiquement une architecture fonctionnelle non limitative d'un dispositif d'adaptation sémantique d'un contenu textuel à un certain comportement langagier. 15 Sur la figure 1 est représenté un utilisateur 20 procédant à interagir avec une communauté en ligne 51. On entend, ici, par « interagir avec une communauté en ligne » le fait de déposer et/ou de lire un contenu électronique textuel dans l'espace de communication électronique de cette communauté. A titre d'exemples non exhaustifs, la communauté en ligne 51 20 est un réseau social tel que « Facebook®», « Twitter® », « mySpace ®», ou « hi5®»; une indexation personnelle, dite aussi folksonomie (social tagging), telle que « delicious® », « youtube®», « flickr®», ou « yoolink® » ; 25 - un forum de discussion en ligne tel que www.commentcamarche.net, http://forum.hardware.fr/, ou http://voyageforum.com/; ou - un groupe d'utilisateurs sur un réseau Intranet ou Extranet tel qu'un espace de travail collaboratif. Dans son interaction avec une des communautés en ligne 5, l'utilisateur 20 30 est assisté par un adaptateur 10 sémantique. L'adaptateur 10 sémantique est configuré pour effectuer une projection sémantique du contenu textuel généré par l'utilisateur 20 sur les pratiques A001_B115_FR/806772 langagières de la communauté en ligne 51. Cette projection sémantique vise, notamment, à adapter au mieux le contenu textuel, que l'utilisateur 20 souhaite déposer, aux pratiques langagières de la communauté en ligne 51. A cet égard, l'adaptateur 10 sémantique est pourvu d'une pluralité de 5 modules incluant un analyseur 1 sémantique, un calculateur 2 de proximité sémantique, et un reformulateur 3 sémantique. L'analyseur 1 sémantique est agencé pour établir le nuage sémantique (notamment, « semantic cloud » en anglais) de tags (ou de mots clés) d'une communauté en ligne 51. 10 Pour cela, l'analyseur 1 sémantique effectue une analyse conversationnelle des échanges textuels publiés dans la communauté en ligne 51. Ces échanges sont généralement organisés en fils de discussion (un même sujet de discussion dans un forum, une même collection dans « Flickr® », un même projet dans un espace de travail collaboratif, un contenu publié 15 par un groupe d'amis sur « Facebook® » par exemple). Le nuage sémantique de tags, établi par l'analyseur 1 sémantique, est un condensé sémantique des termes caractéristiques de la communauté en ligne 51. Ces termes sont dotés d'au moins une métrique permettant de faire ressortir leurs importances dans les pratiques langagières de cette 20 communauté en ligne 51. A titre d'exemple, une métrique peut être la fréquence d'utilisation d'un certain concept dans les interactions déjà publiées au sein de cette communauté en ligne 51. Dans ce cas, chaque concept est caractérisé par un poids reflétant son occurrence dans cette communauté en ligne 51. 25 En variante ou en combinaison, cette métrique peut aussi se rapporter à d'autres propriétés telle que, par exemple, la distribution de Shanon de la théorie de l'information, qui reflète la quantité d'information qu'un concept comporte. Ainsi, ce nuage sémantique de tags ne se réduit pas à une simple liste des termes les plus utilisés dans une communauté en ligne 51, 30 mais à un véritable condensé sémantique de cette dernière. En effet, à titre d'exemple, un nuage sémantique de tags peut simultanément refléter les concepts les plus fréquents d'un contenu textuel ainsi que leurs proximités
A001_B115_FR/806772 sémantiques dans ce contenu (un nuage sémantique de tags arboré, un nuage sémantique de tags en 3D). Ces concepts peuvent concerner, à titre d'exemples, les règles de politesse (les messages d'ouverture et de clôture d'un 5 message, messages de salutations, remerciements anticipés) ; les abréviations ; - le registre de langue et le vocabulaire (vocabulaire métier, registre courant/soutenu/familier/populaire/argotique par exemple) ; - les indices paralinguistiques (des smileys ou des émoticônes) ; 10 - les ponctuations expressives (écriture en majuscule, démultiplication d'un même signe (redoublement d'un point d'exclamation par exemple) pour traduire l'intensité d'expression d'une opinion ou d'un sentiment) ; la pragmatique des interactions (utilisation des prénoms, se tutoyer). 15 Avantageusement, le nuage sémantique de tags permet de résumer un contenu complexe d'une communauté en ligne 51 à l'aide seulement des pratiques langagières qui lui sont propres. Autrement dit, l'analyseur 1 sémantique permet d'obtenir une image sémantique d'une communauté en ligne 51 à partir de ce qui y est communément pratiqué. 20 Le nuage sémantique de tags d'une communauté en ligne 51 est obtenu indépendamment de tout contenu textuel qu'un utilisateur souhaite déposer/lire dans cette communauté. Le calculateur 2 de proximité sémantique est agencé pour fournir, à partir d'un nuage sémantique de tags établi par l'analyseur 1 sémantique, un 25 voisinage sémantique à un contenu textuel généré par l'utilisateur 20, suivant des rapports de proximité sémantique prédéfinis (par synonymie, par parasynonymie, ou par analyse des logiques subjectives par exemple). Le calculateur 2 de proximité sémantique est configuré pour déterminer, dans le nuage sémantique de tags, des voisinages sémantiques composés 30 des termes/concepts les plus représentatifs, respectivement, des concepts identifiés dans le contenu textuel généré par l'utilisateur 20. Autrement dit, chaque voisinage sémantique déterminé comprend, de préférence, une
A001_B115_FR/806772 pluralité de concepts sémantiquement proche à un concept identifié dans le contenu textuel généré par l'utilisateur. De préférence, le calculateur 2 de proximité sémantique utilise des métadonnées 4 d'ontologies (telles que celles de WordNet®, SentiWordNet®, ConceptNet®), et/ou de vocabulaire prédéfini par l'utilisateur 20 ou généré automatiquement. Ces métadonnées 4 assistent le calculateur 2 de proximité sémantique à identifier les concepts compris dans le contenu textuel généré par l'utilisateur 20, auxquels il est supposé trouver leurs voisinages sémantiques respectifs dans un nuage sémantique de tags. Plus généralement, le calculateur 2 de proximité sémantique est un « mandataire sémantique » (ou « proxy sémantique »), étant donné sa fonction de fourniture d'au moins un voisinage sémantique en réponse à une requête concernant un certain contenu textuel.
Ce proxy sémantique est une métadonnée d'ontologies ou de passerelles vers les plateformes des communautés en ligne, et plus particulièrement vers les systèmes sociaux (réseaux sociaux et systèmes de « taggage » social tels que « Facebook® » ou « Flickr® »). Le reformulateur 3 sémantique permet de récupérer, à partir du nuage sémantique de tags, les termes/concepts étant les plus proches sémantiquement, selon le calculateur 2 de proximité sémantique, à ceux du contenu généré par l'utilisateur 20 ; et de reformuler, en conséquence, le contenu textuel généré par l'utilisateur 20 à l'aide des termes/concepts récupérés. Le contenu généré par l'utilisateur 20 est, donc, adapté à l'aide de son voisinage sémantique sélectionné à partir du nuage sémantique de tags, ensuite présenté à l'utilisateur 20. Dans le cas où le contenu textuel adapté est rejeté par l'utilisateur 20, une nouvelle adaptation différente de la précédente est, de préférence, proposée à l'utilisateur. Pour cela, le reformulateur 3 sémantique A001_B115_FR/806772 s'intéresse à la hiérarchie du contenu des voisinages sémantiques, déterminés par le calculateur 2 de proximité sémantique, vis-à-vis le contenu généré par l'utilisateur 20 en procédant à une mesure de proximité sémantique dont les étapes comprennent : l'évaluation de la distance sémantique entre un concept Ç généré par l'utilisateur 20 et le nuage sémantique NS de la communauté en ligne 51; la recherche d'un autre concept C' dans le voisinage du concept C de sorte que la distance sémantique entre C' et C soit minimale ; - la recommandation du concept C' pour remplacer le concept C, C' étant plus adapté au comportement langagier de cette communauté. Différentes techniques de mesure de la distance sémantique sont décrites, par exemple, dans (M.Z MAALA, et al., « Distance sémantique entre concepts définis en 7148 », publié dans Langages et Modèles à Objets 07 Toulouse, 2007). Une mesure de la similarité sémantique ou du degré de relation sémantique peut être aussi utilisée. On se réfère maintenant à la figure 2, illustrant une procédure d'interaction utilisateur avec une communauté en ligne 51.
La procédure d'adaptation sémantique d'un contenu textuel au comportement langagier d'une communauté en ligne 51 fait appel aux modules fonctionnels précités de la manière suivante: sur requête de l'utilisateur 20 ou d'une manière automatique précédant tout dépôt d'un contenu comprenant une annotation textuelle 21, cette dernière est communiqué au dispositif d'adaptation de contenu textuel au comportement langagier de la communauté en ligne 51 (étape 11 dans la figure 2) ; en utilisant les métadonnées 4 d'ontologies (étape 12 dans la figure 2), le calculateur 2 de proximité sémantique identifie au 30 moins un concept dans l'annotation 21 ; en utilisant de nouveau les métadonnées 4 d'ontologies (étape 12 dans la figure 2), le calculateur 2 de proximité sémantique recherche (étape 13 dans la figure 2), dans le nuage sémantique A001_B115_FR/806772 de tags 31 de la communauté en ligne 51, au moins un voisinage sémantique à chaque concept identifié dans l'annotation textuelle 21 , à l'aide du reformulateur 3 sémantique, les concepts du nuage de tags 31 les plus proches sémantiquement, selon le calculateur 2 de proximité sémantique, sont récupérés, ensuite apportés à l'annotation 21, résultant en une annotation 22 adapté au comportement langagier de la communauté en ligne 51. L'annotation 22 adaptée est adressée à l'utilisateur 20 (étape 14 dans la figure 2) ; l'utilisateur est libre d'approuver ou annuler, en tout ou en partie, les modifications apportées à l'annotation 21 (étape 15 dans la figure 2). De préférence, les concepts modifiés dans le contenu original généré par l'utilisateur 20 sont momentanément mis en surbrillance pour l'utilisateur 20, afin de faciliter l'identification des modifications apportées, accélérant ainsi l'appropriation de ces concepts par l'utilisateur 20 ce qui en résulte l'émergence d'un sentiment d'appartenance chez l'utilisateur 20 à la communauté en ligne 51.
II est à noter que le contenu textuel adapté aux comportements langagiers de la communauté en ligne cible n'est qu'une proposition que l'utilisateur 20 peut ignorer ou refuser. Autrement dit, le contenu textuel modifié ne peut être directement publié sans l'approbation explicite de l'utilisateur. Par ailleurs, le procédé décrit ci-dessus peut être aussi utilisé pour éclaircir, à la lumière du comportement langagier d'une communauté en ligne, un contenu textuel identifié (sélectionné par exemple) dans l'espace de communication de cette communauté. A titre d'exemple, l'utilisation d'un dictionnaire propre à une communauté en ligne permet de clarifier un contenu textuel publié par cette communauté, à tout autre utilisateur non- familiarisé avec cette communauté (un utilisateur d'âge très différent de ceux des membres de cette communauté en ligne par exemple). Le procédé qui vient d'être décrit trouve, notamment, application dans un réseau d'entreprise en vue d'améliorer et de faciliter la communication entre différentes équipes de travail. Grâce à ce procédé, les membres d'un A001_B115_FR/806772 espace de travail collaboratif inter-métiers, ayant des vocabulaires métier/cultures différents, auront une meilleure compréhension réciproque. Ce procédé permet, en outre, d'uniformiser le vocabulaire utilisé (les mêmes abréviations, les mêmes termes techniques par exemple).
Le procédé qui vient d'être décrit présente un certain nombre d'avantages. Il permet en effet d'aligner l'ontologie d'un contenu électronique textuel avec celles d'une communauté en ligne cible, ce qui le rend directement intelligible par les membres de cette communauté. Ce dispositif peut être mis en oeuvre sous la forme d'une extension ou une fonction associée à un navigateur Web et dont l'utilisation peut être automatique ou à l'initiative de l'utilisateur. Le contenu textuel adapté par ce dispositif peut être affiché, par exemple, dans le même emplacement que celui du contenu textuel original, dans une nouvelle fenêtre/onglet, ou dans une infobulle, tout en permettant de préférence, de distinguer les modifications apportées ; et - l'utilisateur d'approuver ou d'ignorer cette proposition (voire, désactiver cette extension/fonction d'adaptation). A001_B115_FR/806772

Claims (10)

  1. REVENDICATIONS1. Procédé d'adaptation d'un contenu textuel au comportement langagier d'une communauté en ligne, ce procédé comprenant les étapes suivantes : établissement d'un nuage sémantique de tags de la communauté en ligne ; détermination, à partir du nuage sémantique de tags, d'au moins un voisinage sémantique à au moins un concept du contenu textuel ; reformulation du contenu textuel à l'aide du voisinage sémantique déterminé.
  2. 2. Procédé selon la revendication 1, caractérisé en ce qu'il comprend en outre une étape d'indentification, à l'aide de métadonnées d'ontologies, d'au moins un concept compris dans le contenu textuel.
  3. 3. Procédé selon l'une quelconque des revendications 1 ou 2, caractérisé en ce que l'étape de détermination d'au moins un voisinage sémantique est faite suivant des rapports de proximité sémantique prédéfinis.
  4. 4. Procédé selon l'une quelconque des revendications 1 à 3, caractérisé en ce que le voisinage sémantique déterminé comprend une pluralité de concepts sémantiquement proche au concept identifié dans le contenu textuel.
  5. 5. Procédé selon l'une quelconque des revendications 1 à 4, caractérisé en ce que la reformulation du contenu textuel comprend une étape de sélection d'un concept du nuage sémantique déterminé pour remplacer le concept identifié dans le contenu textuel.
  6. 6. Procédé selon la revendication 5, caractérisé en ce que le concept sélectionné est le plus proche sémantiquement au concept identifié dans le contenu textuel.
  7. 7. Dispositif d'adaptation d'un contenu textuel au comportement langagier d'une communauté en ligne, ce dispositif comprenant les modules suivants : un analyseur (1) sémantique agencé pour établir un nuage sémantique de tags de la communauté en ligne (51) ; A001_B115_FR/806772 15un calculateur (2) de proximité sémantique agencé pour déterminer, à partir du nuage sémantique de tags, d'au moins un voisinage sémantique à au moins un concept du contenu textuel ; un reformulateur (3) sémantique du contenu textuel à l'aide du voisinage sémantique déterminé.
  8. 8. Dispositif selon la revendication 7, caractérisé en ce qu'il comprend en outre des métadonnées (4) d'ontologies permettant d'identifier d'au moins un concept compris dans le contenu textuel.
  9. 9. Produit programme d'ordinateur implémenté sur un support mémoire, susceptible d'être mis en oeuvre au sein d'une unité de traitement informatique et comprenant des instructions pour la mise en oeuvre d'un procédé selon l'une des revendications 1 à 6.
  10. 10. Produit programme d'ordinateur selon la revendication 9, caractérisé en ce qu'il est une extension associée à un navigateur Web. A001_B115_FR/806772
FR1001793A 2010-04-27 2010-04-27 Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne Expired - Fee Related FR2959333B1 (fr)

Priority Applications (7)

Application Number Priority Date Filing Date Title
FR1001793A FR2959333B1 (fr) 2010-04-27 2010-04-27 Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne
PCT/EP2011/055968 WO2011134804A1 (fr) 2010-04-27 2011-04-14 Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne
CN2011800183384A CN102844775A (zh) 2010-04-27 2011-04-14 用于改编文本内容以适应在线社区的语言行为的方法和系统
EP11714318A EP2564362A1 (fr) 2010-04-27 2011-04-14 Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne
KR1020127026562A KR101415634B1 (ko) 2010-04-27 2011-04-14 온라인 커뮤니티의 언어 거동에 텍스트 컨텐트를 적응시키기 위한 방법 및 시스템
US13/636,201 US20130096910A1 (en) 2010-04-27 2011-04-14 Method and system for adapting text content to the language behavior of an online community
JP2013506579A JP5940056B2 (ja) 2010-04-27 2011-04-14 テキストコンテンツをオンライン・コミュニティの言語行動に適合させるための方法およびシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1001793A FR2959333B1 (fr) 2010-04-27 2010-04-27 Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne

Publications (2)

Publication Number Publication Date
FR2959333A1 true FR2959333A1 (fr) 2011-10-28
FR2959333B1 FR2959333B1 (fr) 2014-05-23

Family

ID=43125621

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1001793A Expired - Fee Related FR2959333B1 (fr) 2010-04-27 2010-04-27 Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne

Country Status (7)

Country Link
US (1) US20130096910A1 (fr)
EP (1) EP2564362A1 (fr)
JP (1) JP5940056B2 (fr)
KR (1) KR101415634B1 (fr)
CN (1) CN102844775A (fr)
FR (1) FR2959333B1 (fr)
WO (1) WO2011134804A1 (fr)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9959340B2 (en) * 2012-06-29 2018-05-01 Microsoft Technology Licensing, Llc Semantic lexicon-based input method editor
US10289727B2 (en) 2015-09-17 2019-05-14 International Business Machines Corporation Incorporation of semantic attributes within social media
US10878473B1 (en) * 2017-11-16 2020-12-29 Amazon Technologies, Inc. Content modification
US11307880B2 (en) 2018-04-20 2022-04-19 Meta Platforms, Inc. Assisting users with personalized and contextual communication content
US11010436B1 (en) * 2018-04-20 2021-05-18 Facebook, Inc. Engaging users by personalized composing-content recommendation
CN108664998A (zh) * 2018-04-27 2018-10-16 上海爱优威软件开发有限公司 一种释义加强的图片训练方法及系统
US11176322B2 (en) * 2018-05-22 2021-11-16 International Business Machines Corporation Predicting if a message will be understood by recipients

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070033002A1 (en) * 2005-07-19 2007-02-08 Xerox Corporation Second language writing advisor
WO2008021512A2 (fr) * 2006-08-17 2008-02-21 Neustar, Inc. Système et procédé de gestion du jargon dans les systèmes de communication
WO2008025645A2 (fr) * 2006-08-29 2008-03-06 International Business Machines Corporation Déchiffrage d'un texte abrégé dans un système de communication électronique
US20100030551A1 (en) * 2008-07-31 2010-02-04 Ark Wendy S Jargon translation in an instant messaging environment

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09245038A (ja) * 1996-03-07 1997-09-19 Just Syst Corp 文章作成装置
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
ATE207220T1 (de) * 1996-07-03 2001-11-15 Sopheon N V System zum unterstützen der produktion von dokumenten
WO2002001401A1 (fr) * 2000-06-26 2002-01-03 Onerealm Inc. Procede et appareil pour normaliser et convertir du contenu structure
US20040044517A1 (en) * 2002-08-30 2004-03-04 Robert Palmquist Translation system
AU2003291049A1 (en) * 2002-11-22 2004-06-18 Transclick, Inc. System and method for speech translation using remote devices
US8155951B2 (en) * 2003-06-12 2012-04-10 Patrick William Jamieson Process for constructing a semantic knowledge base using a document corpus
US20060020447A1 (en) * 2004-07-26 2006-01-26 Cousineau Leo E Ontology based method for data capture and knowledge representation
US7860873B2 (en) * 2004-07-30 2010-12-28 International Business Machines Corporation System and method for automatic terminology discovery
WO2006086053A2 (fr) * 2004-12-01 2006-08-17 Whitesmoke, Inc. Systeme et procede destines a l'enrichissement automatique de documents
US7653528B2 (en) * 2005-03-08 2010-01-26 Microsoft Corporation Resource authoring incorporating ontology
US7702665B2 (en) * 2005-06-14 2010-04-20 Colloquis, Inc. Methods and apparatus for evaluating semantic proximity
CN100349161C (zh) * 2005-07-29 2007-11-14 中国科学院声学研究所 一种用于句子分析中动词歧义结构消解的语义分析方法
US20080040094A1 (en) * 2006-08-08 2008-02-14 Employease, Inc. Proxy For Real Time Translation of Source Objects Between A Server And A Client
US8145473B2 (en) * 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US9275036B2 (en) * 2006-12-21 2016-03-01 International Business Machines Corporation System and method for adaptive spell checking
US7869987B2 (en) * 2007-12-03 2011-01-11 International Business Machines Corporation Methods involving translating text emphasis
US8359191B2 (en) * 2008-08-01 2013-01-22 International Business Machines Corporation Deriving ontology based on linguistics and community tag clouds
JP2009043288A (ja) * 2008-11-10 2009-02-26 Japan Science & Technology Agency コミュニティ依存型情報検索システム及び方法
US9009022B2 (en) * 2010-03-30 2015-04-14 Young Hee Yi E-book reader language mapping system and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070033002A1 (en) * 2005-07-19 2007-02-08 Xerox Corporation Second language writing advisor
WO2008021512A2 (fr) * 2006-08-17 2008-02-21 Neustar, Inc. Système et procédé de gestion du jargon dans les systèmes de communication
WO2008025645A2 (fr) * 2006-08-29 2008-03-06 International Business Machines Corporation Déchiffrage d'un texte abrégé dans un système de communication électronique
US20100030551A1 (en) * 2008-07-31 2010-02-04 Ark Wendy S Jargon translation in an instant messaging environment

Also Published As

Publication number Publication date
KR20120139791A (ko) 2012-12-27
EP2564362A1 (fr) 2013-03-06
JP5940056B2 (ja) 2016-06-29
FR2959333B1 (fr) 2014-05-23
JP2013530437A (ja) 2013-07-25
WO2011134804A1 (fr) 2011-11-03
CN102844775A (zh) 2012-12-26
US20130096910A1 (en) 2013-04-18
KR101415634B1 (ko) 2014-07-09

Similar Documents

Publication Publication Date Title
Kumar et al. Sentiment analysis of multimodal twitter data
US11977854B2 (en) Computer implemented methods for the automated analysis or use of data, including use of a large language model
US20230136902A1 (en) Computer implemented method for the automated analysis or use of data
US12073180B2 (en) Computer implemented methods for the automated analysis or use of data, including use of a large language model
US20170185581A1 (en) Systems and methods for suggesting emoji
US11989527B2 (en) Computer implemented methods for the automated analysis or use of data, including use of a large language model
US9710829B1 (en) Methods, systems, and articles of manufacture for analyzing social media with trained intelligent systems to enhance direct marketing opportunities
US11989507B2 (en) Computer implemented methods for the automated analysis or use of data, including use of a large language model
WO2023161630A1 (fr) Procédés mis en œuvre par ordinateur pour l'analyse ou l'utilisation automatisée de données, comprenant l'utilisation d'un grand modèle de langage
WO2011134804A1 (fr) Procede et systeme d'adaptation d'un contenu textuel au comportement langagier d'une communaute en ligne
Chiranjeevi et al. A lightweight deep learning model based recommender system by sentiment analysis
US20170344642A1 (en) System and method for automated responses to information needs on websites
CN110110053B (zh) 在间接话语和事务之间建立逻辑连接
US12067362B2 (en) Computer implemented methods for the automated analysis or use of data, including use of a large language model
Fatima et al. An exploratory and automated study of sarcasm detection and classification in app stores using fine-tuned deep learning classifiers
Praet et al. Comparing automated content analysis methods to distinguish issue communication by political parties on Twitter
Pak Automatic, adaptive, and applicative sentiment analysis
Alamsyah et al. Empowering Indonesian Internet Users: An Approach to Counter Online Toxicity and Enhance Digital Well-Being
Herrera et al. Learning to leverage microblog information for QA retrieval
Armstrong et al. Legends: Folklore on Reddit
CN115497482B (zh) 一种语音对话方法及相关装置
Harwood et al. Understanding multilingual communities through analysis of code-switching behaviors in social media discussions
Mariani et al. The French language in the digital age
Langholm Constructing a Personal Knowledge Graph from Disparate Data Sources
Aksu Using peer-to-peer communication characteristics to improve gender prediction in electronic discourse

Legal Events

Date Code Title Description
GC Lien (pledge) constituted

Effective date: 20131018

RG Lien (pledge) cancelled

Effective date: 20141016

CA Change of address

Effective date: 20150521

CA Change of address

Effective date: 20150521

PLFP Fee payment

Year of fee payment: 7

PLFP Fee payment

Year of fee payment: 8

PLFP Fee payment

Year of fee payment: 9

PLFP Fee payment

Year of fee payment: 10

ST Notification of lapse

Effective date: 20201209