FR3102869A1 - Procédé d’affichage d’un document textuel enrichi en associant des expressions d’un texte avec des informations explicatives, et dispositifs associés - Google Patents

Procédé d’affichage d’un document textuel enrichi en associant des expressions d’un texte avec des informations explicatives, et dispositifs associés Download PDF

Info

Publication number
FR3102869A1
FR3102869A1 FR1912202A FR1912202A FR3102869A1 FR 3102869 A1 FR3102869 A1 FR 3102869A1 FR 1912202 A FR1912202 A FR 1912202A FR 1912202 A FR1912202 A FR 1912202A FR 3102869 A1 FR3102869 A1 FR 3102869A1
Authority
FR
France
Prior art keywords
expression
textual
text
enriched
displaying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR1912202A
Other languages
English (en)
Other versions
FR3102869B1 (fr
Inventor
Marion Berthaut
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Majenat Sas
Original Assignee
Majenat Sas
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Majenat Sas filed Critical Majenat Sas
Priority to FR1912202A priority Critical patent/FR3102869B1/fr
Priority to CA3097404A priority patent/CA3097404A1/fr
Publication of FR3102869A1 publication Critical patent/FR3102869A1/fr
Application granted granted Critical
Publication of FR3102869B1 publication Critical patent/FR3102869B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

Procédé d’affichage d’un document textuel enrichi en associant des expressions d’un texte avec des informations explicatives, et dispositifs associés Il est proposé un procédé d’affichage d’un document textuel enrichi qui comporte les étapes suivantes : détermination (3.1) au cours d’une première lecture du document textuel d’au moins une expression présentant une difficulté cognitive, recherche (3.6) au cours d’une seconde lecture du texte situé avant ladite expression d’un élément textuel associé à cette expression et offrant une explication plus détaillée de cette expression, enrichissement (3.7) du texte en associant à l’au moins une expression présentant une difficulté cognitive ledit élément textuel, affichage (3.10) du document textuel en reproduisant à la fois l’au moins une expression présentant une difficulté cognitive et l’élément textuel affiché et, en affichant un lien graphique entre cette expression et cet élément textuel. De cette manière, un lecteur ayant des difficultés à lire un texte qui comporte des expressions présentant une difficulté cognitive reçoit des informations explicatives qui l’aide à mieux comprendre la signification de ces expressions. Figure d’abrégé = figure 3

Description

Procédé d’affichage d’un document textuel enrichi en associant des expressions d’un texte avec des informations explicatives, et dispositifs associés
1. DOMAINE DE L’INVENTION
La présente invention concerne le domaine de l’aide à la lecture pour des personnes atteintes de difficultés cognitives, et notamment des personnes dyslexiques. L’invention concerne plus particulièrement la possibilité d’analyser un texte pour en déterminer des expressions susceptibles de générer des difficultés cognitives et ensuite, d’enrichir ce texte par des éléments supplémentaires qui sont reproduits au moment de la lecture et qui vont améliorer la compréhension du lecteur.
2. ARRIÈRE-PLAN TECHNOLOGIQUE
Certaines personnes ont des difficultés cognitives à appréhender le monde extérieur et en particulier à comprendre des éléments élaborés par d’autres personnes. Ces difficultés interviennent dans l’apprentissage de la lecture et de l’écriture sans qu’aucun désordre sensoriel (vue, ouïe), intellectuel ou social ne soit responsable. L’Institut National de la Santé Et de la Recherche Médicale (ISSERM en abrégé) identifie au sein de ces troubles la dyspraxie (trouble du développement moteur et de l’écriture), la dyscalculie (trouble des activités numérique), la dysphasie (trouble du langage oral), les troubles de l’attention, et la dyslexie. Bon nombre de professionnels de la Santé considèrent la dyslexie comme un trouble spécifique de la lecture dont la caractéristique essentielle est une altération spécifique et significative de l’acquisition de la lecture. La correspondance entre les graphèmes et morphèmes, ainsi que le rôle des mots dans la phrase est le problème majeur rencontré par les enfants atteints de ce trouble phonologique.
Pour aider les personnes à surmonter ces difficultés cognitives, des maisons d’édition ont produit des livres adaptés. Il est ainsi possible d’acheter une œuvre littéraire sous une forme numérique et de la reproduire sur un appareil informatique. Cette démocratisation des livres sur supports numériques permet d’envisager de nouvelles méthodes d’assistance pour les personnes atteintes de troubles de la lecture. Dans ces livres, le texte présente des indications visuelles permettant de mieux faire comprendre le sens de certains mots ou groupes de mots, et globalement une meilleure perception du sens des phrases. De ce fait, la lecture pour des personnes ayant des difficultés cognitives est facilitée.
Avec l’avènement du numérique, ces personnes disposent d’un véritable outil qu’elles peuvent adapter en fonction de leurs propres difficultés cognitives. Ces personnes téléchargent leur livre numérique dans un appareil informatique doté d’un écran et d’un clavier et lance la lecture du document. Le livre dispose de boutons de commande ou d’icônes permettant de modifier la mise en évidence graphique de certaines indications qui apparaissent à l’écran. Le lecteur est éventuellement doté d’un haut-parleur pour émettre un son en rapport avec le texte qui est affiché à l’écran, les signaux sonores peuvent être émis par synthèse vocale et reproduire des mots ou des phrases qui sont indiqués par le lecteur (par exemple en appliquant son doigt sur un écran tactile, à l’emplacement desdits mots ou phrase).
Il est connu d’enrichir un texte avec des séparateurs spécifiques. La demande de brevet FR 3 067 135 déposée par la demanderesse et publiée le 7 Décembre 2018 décrit une méthode implémentée par un programme exécutable sur une tablette ou un ordinateur portable. Ce programme met graphiquement en évidence certains mots ou groupes de mots d’une phrase ayant une forte signification sémantique. Pour cela, le document textuel est divisé en une pluralité de phrases séparées par des points, et les phrases sont elles-mêmes divisées par des séparateurs non affichables, appelés « balises », qui délimitent les groupes de mots ayant un sens. Le programme affiche alors ces groupes de mots délimités au début et à la fin par deux séparateurs ou par un point et un séparateur, en évitant de les couper par un saut de ligne. De cette manière, le lecteur lit sur une seule ligne ces groupes de mots, sans avoir besoin de rechercher la suite en sautant une ligne.
Dans certain cas, le mot ou le groupe de mots présente en soi une difficulté intrinsèque de compréhension. Cela peut être le cas lorsque ce mot ou ce groupe de mots est une évocation d’un objet qui a été présenté plus tôt dans le texte. Par exemple, un certain endroit du texte évoque un chien en le nommant et plus tard dans le texte, on peut lire « cette bête » ou « ce quadrupède » sans rappeler son nom, ou le fait que c’est un chien. Certains lecteurs ont des difficultés à faire le lien, des personnes dyslexiques par exemple. C’est particulièrement vrai lorsque l’on a affaire à un pronom et que le nom auquel il se rapporte est loin dans le texte. L’art antérieur décrit de mettre en évidence des groupes de mots ayant un sens mais n’apporte pas d’éléments pour aider à leur compréhension si d’amblée, ces groupes de mots présentent une difficulté de compréhension.
Il existe donc un réel besoin d’une aide à la compréhension d’expressions écrites qui présentent en soi des difficultés cognitives, cette aide peut être fournie en enrichissant le texte lu par des éléments visibles et/ou sonores qui vont apporter des éléments complémentaires à ces groupes de mots et aider à comprendre leur signification.
3. OBJECTIFS DE L’INVENTION
La présente invention apporte une solution qui ne présente pas les inconvénients décrits plus haut, tout en proposant les avantages listés ci-dessus. En particulier, la présente invention permet de rajouter au moment de l’affichage des éléments graphiques et/ou textuels et/ou sonores qui aident à la compréhension d’expressions écrites présentant des difficultés cognitives, et ceci quel que soit le type d’appareil sur lequel ce texte est affiché.
4. PRESENTATION DE L’INVENTION
Sur un plan fonctionnel, l’invention concerne un procédé d’affichage d’un document textuel enrichi qui comporte les étapes suivantes :
- détermination au cours d’une première lecture du document textuel d’au moins une expression présentant une difficulté cognitive,
- recherche au cours d’une seconde lecture du texte situé avant ladite expression d’un élément textuel associé à cette expression et offrant une explication plus détaillée de cette expression,
- enrichissement du texte en associant à l’au moins une expression présentant une difficulté cognitive ledit élément textuel,
- affichage du document textuel en reproduisant à la fois l’au moins une expression présentant une difficulté cognitive et l’élément textuel affiché et, en affichant un lien graphique entre cette expression et cet élément textuel.
De cette manière, un lecteur ayant des difficultés à lire un texte qui comporte des expressions présentant une difficulté cognitive reçoit des informations explicatives qui l’aide à mieux comprendre la signification de ces expressions.
Selon un premier mode de réalisation, le mot présentant une difficulté cognitive est un pronom, la première lecture consistant à déterminer l’élément textuel qui est rapporté par ce pronom, cet élément textuel étant affiché en même temps que ledit pronom. De cette manière, l’élément textuel permet d’identifier l’objet auquel le pronom se rapporte.
Selon un autre mode de réalisation, le lien graphique est un trait reliant l’au moins une expression présentant une difficulté cognitive et l’élément textuel affiché. De cette manière, le lecteur perçoit facilement le lien avec les informations explicatives de l’expression et la comprend plus rapidement.
Selon un autre mode de réalisation, la recherche de l’élément textuel s’effectue en avant à partir du début du document textuel jusqu’à la position où se trouve l’expression associée. De cette manière, les informations explicatives proviennent du début du texte.
Selon un autre mode de réalisation, la recherche de l’élément textuel s’effectue en arrière à partir de la position de l’expression jusqu’au début du document textuel. De cette manière, les informations explicatives sont extraites d’un endroit du texte situé à proximité de ladite expression.
Selon un autre mode de réalisation, un élément graphique est associé à l’au moins une expression présentant une difficulté cognitive, le procédé comportant une étape d’introduction d’un paramètre contrôlant l’affichage de l’élément textuel associé ou de l’élément graphique. De cette manière, l’affichage des éléments visuels supplémentaires s’effectue sous le contrôle du lecteur.
Selon un autre mode de réalisation, le procédé d’affichage comporte une étape de génération des signaux sonores de l’élément textuel produit par une synthèse vocale. De cette manière, le lecteur perçoit aussi de façon auditive les informations explicatives.
Selon un autre mode de réalisation, le procédé d’affichage comporte une étape d’apposition d’une distinction graphique sur au moins une expression du texte associée à un élément textuel, et une étape d’introduction d’une commande pour reproduire ledit élément textuel ou des signaux sonores dudit élément textuel produit par une synthèse vocale. De cette manière, l’affichage de chaque élément visuel supplémentaire associé à chaque expression s’effectue sous le contrôle du lecteur.
Selon un autre mode de réalisation, l’étape d’affichage met graphiquement en évidence les éléments textuels qui sont associés à des expressions, et qui sont situés dans le texte avant ladite expression. De cette manière, le lecteur perçoit que ces éléments textuels sont importants car ils vont expliciter une expression rencontrée dans la suite de la lecture.
Selon un autre mode de réalisation, les étapes de détermination d’au moins une expression présentant une difficulté cognitive et/ou de recherche d’un élément textuel associé à cette expression, mettent en œuvre un agorithme de type Traitement Automatique du Langage Naturel. De cette manière, ces étapes peuvent être exécutées par un ordinateur, sans intervention humaine.
L’invention concerne également un procédé de génération d’un document textuel enrichi, caractérisé en ce qu’il comporte les étapes suivantes :
- détermination au cours d’une première lecture d’un texte d’au moins une expression présentant une difficulté cognitive en mettant en œuvre un agorithme de type Traitement Automatique du Langage Naturel,
- recherche au cours d’une seconde lecture du texte situé avant l’au moins une expression d’un élément textuel associé à cette expression et offrant une explication plus détaillée de cette expression en mettant en œuvre un agorithme de type Traitement Automatique du Langage Naturel,
- génération du texte enrichi en associant ledit élément textuel à l’au moins une expression présentant une difficulté cognitive, l’élément textuel étant destiné à être reproduit lors de l’affichage sur un écran de l’expression associé au cours de la lecture du texte enrichi.
L’invention concerne également un dispositif d’affichage d’un document textuel enrichi, comportant un moyen de détermination au cours d’une première lecture d’un texte d’au moins une expression présentant une difficulté cognitive, caractérisé en ce qu’il comporte un moyen de recherche au cours d’une seconde lecture du texte situé avant ladite expression d’un élément textuel associé à cette expression et offrant une explication plus détaillée de cette expression, un moyen d’enrichissement du texte en associant ledit élément textuel à l’au moins une expression présentant une difficulté cognitive, et un moyen d’affichage du document textuel enrichi en reproduisant à la fois l’au moins une expression présentant une difficulté cognitive et l’élément textuel affiché et, en affichant un lien graphique entre cette expression et cet élément textuel.
L’invention concerne aussi un produit programme d’ordinateur comprenant des instructions de programme pour l’exécution du procédé d’affichage d’un document textuel enrichi ou de génération de ce document textuel enrichi, tel que décrit par les paragraphes précédents.
5. DESCRIPTION DES FIGURES
D’autres caractéristiques et avantages de l’invention apparaîtront à la lecture de la description suivante, donnée à titre d’exemple indicatif et non limitatif, et des dessins annexés, dans lesquels :
-Fig 1 : la figure 1 montre un exemple d’un appareil de lecture pour l’affichage d’un document textuel enrichi selon le procédé objet de la présente invention ;
-Fig 2 : la figure 2 présente les principaux composants d’un serveur distant permettant d’enrichir un document textuel par des informations explicatives ;
-Fig 3 : la figure 3 décrit sous la forme d’un ordinogramme les principales étapes permettant d’enrichir un livre numérique dans une forme qui facilite sa lecture selon un exemple particulier de réalisation ;
-Fig 4 : la figure 4 présente une apparence d’écran avec un livre numérique affiché sans enrichissement par l’appareil de lecture 1 ;
-Fig 5 : la figure 5 présente une apparence d’écran d’un livre numérique affiché avec enrichissement par l’appareil de lecture 1 d’élément textuels ;
-Fig 6 : la figure 6 présente une apparence d’écran d’un livre numérique affiché avec des symboles pour mieux comprendre certaines expressions.
6. DESCRIPTION DETAILLEE D’UN MODE DE REALISATION
6.1 Principe général
La présente invention concerne un procédé d’affichage d’un document textuel enrichi qui comporte les étapes suivantes : détermination au cours d’une première lecture du document textuel d’au moins une expression présentant une difficulté cognitive, recherche au cours d’une seconde lecture du texte situé avant ladite expression d’un élément textuel associé à cette expression et offrant une explication plus détaillée de cette expression, enrichissement du texte en associant à l’au moins une expression présentant une difficulté cognitive ledit élément textuel, affichage du document textuel en reproduisant à la fois l’au moins une expression présentant une difficulté cognitive et l’élément textuel affiché et, en affichant un lien graphique entre cette expression et cet élément textuel. De cette manière, un lecteur ayant des difficultés à lire un texte qui comporte des expressions présentant une difficulté cognitive perçoit des informations explicatives, qui vont l’aider à mieux comprendre la signification de ces expressions.
6.2 Description d’un mode préféré de réalisation
Il existe de nombreuses méthodes permettant de rendre un livre numérique plus facile à lire à des personnes ayant des difficultés cognitives, telles que des personnes dyslexiques. Ces méthodes consistent généralement à mettre en évidence dans le texte imprimé des index qui pointent sur certains mots ou expressions, et à les expliciter en leur adjoignant un élément figuratif ou une image. Prenons par exemple, un texte où l’on cite un chien en le nommant « le quadrupède », il est avantageux de mettre une image d’un chien à coté de ce mot.
Dans un premier mode de réalisation, un livre numérique peut présenter un aspect visuel non modifiable, ce qui est similaire au fait que le lecteur achète un document papier. Pour produire un tel document, l’éditeur lit le texte et analyse son contenu pour en déterminer des mots ou expressions présentant une difficulté de compréhension. Ces mots ou expressions sont alors explicités par la présence d’autres mots ou groupes de mots et/ou d’éléments graphiques placés à proximité immédiate. L’aspect visuel du livre numérique est donc enrichi avant sa commercialisation, et ensuite son aspect visuel ne peut être modifié.
Selon une seconde variante de réalisation, ces méthodes sont implémentées dans un programme exécutable sur une tablette ou un ordinateur portable. Le document créé par l’éditeur comporte des liens associés à des mots ou expressions lisibles dans le texte, ces liens associant d’autres mots ou groupes de mots et/ou des éléments graphiques chargés de les expliciter. Un utilisateur choisit une œuvre ayant au moins une composante textuelle et demande à ce programme d’enrichir l’affichage. Le programme affiche alors en même temps que les mots ou les expressions présentant une difficulté de compréhension, le contenu visuel associé par le lien. Le lecteur dispose donc d’information explicatives pour comprendre ce qu’il lit.
La présente invention améliore cette seconde variante en automatisant le processus d’enrichissement et d’affichage du livre numérique. Présentons tout d’abord un appareil apte à afficher un livre numérique dans une forme qui facilite sa lecture, selon un mode préféré de réalisation de l’invention.
LaFig. 1montre une structure d’un appareil de lecture 1 muni d’un dispositif d’affichage 2. Selon un mode préféré de réalisation de l’invention, l’appareil de lecture de livre est une tablette, mais d’autres appareils sont également utilisables pour la présente invention, comme par exemple un téléphone intelligent ou « smartphone », un ordinateur personnel, ou tout appareil capable d’accéder à des contenus affichables et disposant de moyens de création et d’affichage de menus de navigation.
L’appareil de lecture 1 comporte typiquement une unité centrale ALU 1.1 reliée à une mémoire de stockage MP (programme exécutable et données téléchargées) 1.2, un écran 1.3, un module de communication radio 1.4, et un module d’interface 1.5 avec un clavier 1.6. Le module de communication permet la communication dans la gamme de fréquences radio compatible avec les réseaux de communication sans fil tels que : 2G/GSM, 3G/UMTS ou 4G/LTE. L’écran 1.3 peut être tactile, le clavier 1.6. est alors intégré à cet écran. Le clavier disposant au moins des touches de navigation « DEBUT» et « FIN», typiquement des flèches orientées vers au moins deux directions telles que gauche et droite. Il est évident que dans le cas d’un écran tactile, l’utilisateur peut introduire bien plus que quatre directions par des mouvements appliqués sur l’écran. La tablette comprend également un circuit 1.7 d'affichage de données sur l'écran, appelé souvent circuit OSD, de l'Anglais "On Screen Display" (signifiant "affichage sur l'écran"). Le circuit OSD 1.7 est un générateur de texte et de graphisme qui permet d'afficher à l'écran des menus, des pictogrammes (par exemple, un numéro correspondant à la chaîne visualisée) et notamment les menus de lecture conformément à la présente invention. Le circuit OSD 1.7 est contrôlé par l’Unité Centrale 1.1 et se situe entre celle-ci et l’écran 1.3 en termes de connexion.
La mémoire de stockage 1.2 contient notamment des programmes exécutables résidents et éventuellement, une partie de type Lecture/Ecriture pour l’enregistrement et l’exécution de documents textuels enrichis. La mémoire programme MP contient un module de lecture qui sera appelé par la suite : le « Lecteur». Ce module est chargé de présenter des textes à l’écran et de recevoir des commandes de navigation permettant de changer le contenu affiché à l’écran. Le Lecteur est avantageusement réalisé sous la forme d’un module de programme téléchargeable gratuitement ou non d’un serveur distant et enregistré dans la mémoire MP. Il peut aussi être réalisé sous la forme d’un circuit spécialisé de type ASIC par exemple, et résident dans l’appareil.
Certaines étapes du procédé d’affichage d’un document textuel enrichi sont exécutables au niveau d’un serveur distant et notamment celles permettant de générer un texte enrichi d’au moins un élément visuel supplémentaire. LaFig. 2présente les principaux composants d’un tel serveur distant 10. Selon cet exemple de réalisation, le serveur distant 10 comporte une unité centrale ALU 11 connectée à une mémoire de programme exécutable PM 12, un disque dur HD 13 contenant une base de données pour le stockage de données de façon non-volatile. Le serveur distant 10 contient également une interface I/O 14 pour la communication avec des passerelles 2 via un réseau informatique, Internet par exemple. Le serveur distant 10 reçoit également par cette interface I/O des documents textuels non enrichis émis d’un fournisseur de contenus. Lorsque les documents textuels sont enrichis selon le procédé décrit par la présente invention, ils sont enregistrés dans le disque dur 13 de la base de données. Des utilisateurs peuvent alors se connecter à ce serveur distant 10 et, en contrepartie d’un paiement, télécharge un document enrichi pour le lire sur leur appareil de lecture 1. Il n’est pas exclu que les moyens de liaison diffèrent selon le type d’appareil de lecture, à travers un réseau sans fil (téléphonie mobile 3G/4G) et/ou par un câble via un réseau numérique quelconque.
LaFig. 3décrit sous la forme d’un ordinogramme les principales étapes permettant d’enrichir un livre numérique en y rajoutant au moins un élément visuel supplémentaire associé à une expression et, de le reproduire au niveau d’un appareil de lecture 1. Dans un premier temps, un opérateur se connecte au serveur distant 10, sélectionne un document textuel à enrichir et lance une analyse sémantique au cours d’une première lecture (étape 3.1). Cette analyse consiste à déterminer les expressions qui peuvent présenter des difficultés de compréhension pour un éventuel lecteur. Ces expressions peuvent être : un pronom anaphorique ambigu car l’objet auquel il se rapporte est situé loin dans le texte, une expression complexe ou imagée, comme par exemple : « voir midi à sa porte », ou en langue anglo-saxonne : « call it a day » qui signifie de mettre un point final à une action, une locution complexe telle que « d’ores et déjà », des homophones (« eau et haut », … Selon un premier mode de réalisation, cette analyse s’effectue par un opérateur, ou par un ensemble de lecteurs qui signalent les expressions qui leur ont causé des difficultés cognitives. Selon un autre mode de réalisation, cette analyse est réalisée par un module d’analyse sémantique qui met en oeuvre des algorithmes de Traitement Automatique du Langage Naturel (ou T.A.L.N. en abrégé). Les algorithmes TALN sont exploités dans la librairie logicielle spaCy - https://spacy.io/ et sont notamment utilisés pour les traductions, la reconnaissance vocale et les réponses automatiques aux questions. Les algorithme de TALN permettent d’identifier la nature des mots du texte (par exemple les pronoms anaphoriques), et de calculer les critères permettant de discriminer les pronoms fortement ambigus. Ces algorithmes appliquent des critères tels que : le nombre de pronoms anaphoriques présents dans une phrase, le nombre de mots dans la phrase, la distance (nombre de phrases ou de mots) entre le pronom et les potentiels groupes nominaux ciblés par le pronom, le nombre de potentiels groupes nominaux ciblés par le pronom dans le texte précédent …
A l’étape 3.2, chaque expression trouvée est marquée dans le document textuel, ce marquage permet de générer facilement une caractéristique graphique associée à ces expressions lors de l’affichage. De cette manière, le lecteur voit immédiatement que cette expression a été enrichie d’une information explicative.
Selon un perfectionnement, un niveau de difficulté de compréhension est associé à chaque expression marquée (étape 3.3). Ce niveau de difficulté peut être déterminé par un groupe de lecteurs lisant ce texte, le niveau étant par exemple, le nombre de lecteurs ayant considéré que cette expression présente des difficultés de compréhension. A l’étape 3.4, un tableau d’association est créé, chaque ligne de ce tableau étant associée à une expression du texte, et à un index pointant sur la ligne du tableau correspondant. A l’issue de cette étape, la fin du texte est atteinte et les expressions détectées vont pouvoir être associées à au moins un élément visuel supplémentaire donnant des informations explicatives à ces expressions détectées.
Dans une seconde phase, le tableau est balayé par un index qui pointe ligne par ligne en commençant par la première. La première expression du tableau et son emplacement dans le texte sont alors extraits (étape 3.5). A l’étape 3.6, un mot ou un groupe de mots explicitant l’expression pointée par l’index est alors recherché en amont dans le texte. Selon une première variante, cette recherche s’effectue en partant du début du document. Selon une seconde variante, la recherche de ce groupe de mots s’effectue en arrière dans le texte et à partir de la position de l’expression. Cette seconde variante présente l’avantage d’associer un groupe de mots relativement proche dans le texte de l’expression à expliciter.
Selon un premier mode de réalisation, la recherche et l’extraction d’un mot ou d’un groupe de mots explicitant l’expression pointée s’effectue par un opérateur, ou par un ensemble de lecteurs. Selon un autre mode de réalisation, cette recherche et la détermination des groupes de mots associés à une expression donnée sont réalisées par un module d’analyse sémantique. Ce module met également en oeuvre des algorithmes de Traitement Automatique du Langage Naturel (exploités dans la librairie logicielle spaCy - https://spacy.io/ ) et l’application de méthodes d’apprentissage par transfert basées sur le modèle Bert, telle que expérimenté dans l’article : M. Ionita, Y. Kashnitsky, K. Krige, V. Larin, D. Logvinenko et A. Atanasov, «Resolving Gendered Ambiguous Pronouns with BERT,» 2019. L’application des méthodes d'apprentissage produisent un modèle capable de déterminer de façon automatique la probabilité qu’un groupe nominal du texte soit l’explicitation de l’expression pointée. La comparaison de probabilité de tous les groupes nominaux précédents (jusqu’à une certaine distance dans le texte) permet d’identifier automatiquement le groupe nominal le plus plausible.
A l’étape 3.7, le groupe de mots permettant d’expliciter l’expression marquée est inscrit dans le tableau. Si la fin du tableau n’est pas atteinte (étape 3.8) alors l’expression suivante non encore associée à un élément visuel supplémentaire est extraite afin de trouver en amont dans le texte des informations pour l’expliciter. Si la fin du tableau est atteinte, alors le remplissage du tableau d’association est terminé, ce dernier contient les informations suivantes, selon un exemple de réalisation :
- libellé de l’expression,
- position dans le texte de l’expression (page, ligne, numéro du mot dans la ligne),
- niveau de difficulté de compréhension de l’expression,
- groupe de mots expliquant l’expression,
- type d’élément visuel supplémentaire (texte, sonore, graphique, photo, ..).
A l’étape 3.9, le tableau d’association est incorporé dans le document numérique, il devient de ce fait un « document enrichi ». Le document enrichi peut alors être transmis à des lecteurs potentiels, soit par des téléchargements via un réseau, soit par un support matériel (CD-Rom, DVD, clé USB, carte SD, …). Un utilisateur lance alors son application Lecteur qui récupère le document enrichi et affiche le texte sur l’écran 1.3 (étape 3.10). Lorsque le Lecteur atteint une expression marquée dans le texte, il recherche dans le tableau d’association les données associées. Puis, il reproduit sur l’écran le mot ou le groupe de mots extrait du tableau en le positionnant à proximité de l’expression marquée. Les liens graphiques entre l’expression et les informations explicatives seront décrits et explicités dans la suite de ce document.
On peut ainsi constater que la présente invention permet à un lecteur ayant des difficultés de lire le texte avec une meilleure compréhension. Les documents enrichis peuvent être téléchargés du serveur 10 et mémorisés dans la mémoire 1.2 de l’appareil de lecture 1 ou accessibles à la demande via un réseau. Avantageusement, le texte est enregistré dans un fichier selon le format ePub3, qui est utilisé par de nombreux éditeurs d’ouvrages littéraires. Ce format conçu par l’organisation IDPF (acronyme de International Digital Publishing Forum) permet de stocker des livres numériques. Le texte du livre est stocké dans le fichier avec des informations supplémentaires qui permettront lors de l’affichage de mettre en forme le texte et d’ajouter des liens, un index, des images, etc. Ce format est ouvert, ce qui signifie que chacun peut choisir d’éditer un livre numérique dans ce format, et d’y rajouter des données pour améliorer les caractéristiques de l’affichage, comme le prévoit la présente invention.
Selon un perfectionnement, le lecteur paramètre son appareil pour ne percevoir à l’écran et/ou de façon sonore que des enrichissements associés à des expressions ayant un certain niveau de difficulté ou à partir d’un certain niveau. Pour cela, le Lecteur compare le niveau de difficulté de l’expression avec la valeur introduite par l’utilisateur, si ce niveau est supérieur à la valeur alors l’enrichissement est reproduit. Cette fonctionnalité permet de ne pas trop alourdir l’affichage pour des personnes ayant des difficultés cognitives faibles ou moyennes.
LaFig. 4présente une apparence d’écran avec un livre numérique affiché sans enrichissement par l’appareil de lecture 1. Dans ce cas, les règles de présentation s’appliquent et chaque mot du texte est affiché sans enrichissement graphique. Le lecteur lit le texte et le fait avancer sur l’écran 1.3 par des touches ou des icônes affichées, jusqu’à atteindre la fin du texte.
LaFig. 5présente un exemple d’apparence d’écran avec un livre numérique affiché avec enrichissement par l’appareil de lecture 1 selon un premier mode de réalisation. Selon cet exemple, la difficulté réside dans l’utilisation de pronoms et notamment, le fait que le même pronom est affiché à deux endroits d’une même phrase, ces deux pronoms se rapportant à deux objets différents. Selon cet exemple, le premier pronom « il » désigne le maitre d’un chien (qui s’appelle « Thomas »), et le second pronom « il » : le chien (qui s’appelle « Pollux»). Pour faciliter la lecture, le Lecteur rajoute tout à côté du premier pronom « il » l’objet auquel se rapporte ce « il », en l’occurrence : l’élément textuel « Thomas » et à côté du second pronom « il » : l’élément textuel : « le chien Pollux ». La proximité du l’expression présentant une difficulté et de l’information explicative constitue un lien graphique. D’autres liens graphiques sont possibles, par exemple un mince trait venant relier l’expression qui est alors soulignée et une petite fenêtre d’écran contenant l’information explicative. Il est également possible de créer ce lien graphique en choisissant une couleur particulière apposée à la fois sur l’expression présentant une difficulté et sur l’information explicative. Selon une variante de réalisation, l’élément textuel associé à l’expression présentant une difficulté cognitive est affiché dans un fenêtre dont le pourtour présente une flèche qui pointe sur ladite expression. De cette manière, le lecteur perçoit immédiatement que le contenu de cette fenêtre concerne cette expression. Selon un perfectionnement, la fenêtre et son contenu présente une certaine transparence pour maintenir la lisibilité du reste du texte. Quel que soit la façon d’afficher ce lien, le texte affiché est ainsi rendu plus compréhensible car le lecteur perçoit des éléments visuels supplémentaires associé à ce pronom, qui représente notamment l’objet auquel ce pronom se rapporte.
LaFig. 6présente un exemple apparence d’écran avec un livre numérique affiché avec enrichissement par l’appareil de lecture 1 selon un second mode de réalisation. Selon cet exemple, l’enrichissement consiste 6 à rajouter un symbole graphique ou une image à proximité immédiate de l’expression marquée. Selon cet exemple, le Lecteur rajoute à côté des occurrences du pronom « il » qui désigne le maitre d’un chien un dessin de silhouette masculine, et à côté des occurrences du pronom « il » qui désigne le chien, un dessin de chien. L’élément visuel supplémentaire est extrait d’un tableau associant certains mots ou groupes de mots du livre avec ledit élément visuel, par exemple le maitre du chien avec une sihouette. Ces mots ou groupe de mots ne présentent pas en soi de difficultés cognitives mais à un autre endroit du texte, les objets de ces mots ou groupe de mots sont repris sous la forme d’expressions présentant une difficulté cognitive. Ce second mode de réalisation permet également de rendre le texte plus compréhensible car le lecteur peut facilement deviner quel est l’objet désigné par chaque pronom.
Selon un perfectionnement, chaque ligne du tableau d’association créé au cours des étapes 2.4 à 2.7 peut comporter plusieurs éléments différents associés à une même expression. Par exemple, et pour reprendre les explications associées auxFig. 5et6, le pronom « il » peut être associé à « le chien Pollux » et un symbole représentant un chien. Le choix de l’un ou l’autre élément visuel supplémentaire associé à une même expression peut s’effectuer en fonction de son type : un texte ou un symbole, le lecteur paramétrant son appareil de lecture 1 pour afficher soit l’un soit l’autre.
Selon un autre perfectionnement, lorsqu’un élément visuel supplémentaire associé à une expression est un élément textuel qui est situé dans le texte avant cette expression alors cet élément textuel est mis graphiquement en évidence. Ce marquage des éléments textuels s’effectue lors de l’étape 3.6. Ce marquage peut concerner uniquement la première occurrence dans le document de l’élément textuel, ou la dernière occurrence, ou toutes les occurrences, étant entendu que les éléments marqués se situent toujours avant l’expression associée. Pour reprendre l’exemple décrit par lesFig. 4, 5et6, le ou les premières occurrences de « Thomas » et de « le chien Pollux » sont soulignées, ou affichées avec une couleur particulière. De cette manière, le lecteur est averti au début de sa lecture que ces objets sont cités dans la suite du texte mais avec un autre libellé, par exemple un pronom, ou un nom comme « le maître » ou « l’animal ».
Selon un autre perfectionnement, l’appareil de lecture 1 dispose d’un module de synthèse vocale permettant de générer des signaux audio représentatif d’un texte. Selon ce perfectionnement, le Lecteur appose une distinction graphique sur toutes les expressions du document textuel qui sont associées à un enrichissement. Lorsque le lecteur désire percevoir des informations explicatives, il appuie sur un bouton ou sur l’expression affichée dans le cas d’un écran tactile, le texte associé est alors reproduit en audio sur des haut-parleurs. De cette façon, les enrichissements n’encombrent pas l’écran et leurs reproductions sont contrôlés par le lecteur.
Il doit être évident pour les personnes versées dans l'art que la présente invention permet des modes de réalisation sous de nombreuses autres formes spécifiques sans l'éloigner du domaine d'application de l'invention comme revendiqué. Par conséquent, les présents modes de réalisation et variantes doivent être considérés à titre d'illustration mais peuvent être modifiés dans le domaine défini par la portée des revendications jointes.

Claims (13)

  1. Procédé d’affichage d’un document textuel enrichi, caractérisé en ce qu’il comporte les étapes suivantes :
    - détermination (3.1) au cours d’une première lecture d’un texte d’au moins une expression présentant une difficulté cognitive,
    - recherche (3.6) au cours d’une seconde lecture du texte situé avant ladite expression d’un élément textuel associé à cette expression et offrant une explication plus détaillée de cette expression,
    - enrichissement (3.7) du texte en associant ledit élément textuel à l’au moins une expression présentant une difficulté cognitive,
    - affichage (3.10) du document textuel enrichi en reproduisant à la fois l’au moins une expression présentant une difficulté cognitive et l’élément textuel affiché et, en affichant un lien graphique entre cette expression et cet élément textuel.
  2. Procédé d’affichage d’un document textuel enrichi selon la revendication 1, caractérisé en ce que le mot présentant une difficulté cognitive est un pronom, la première lecture consistant à déterminer l’élément textuel qui est rapporté par ce pronom, cet élément textuel étant affiché en même temps que ledit pronom.
  3. Procédé d’affichage d’un document textuel enrichi selon la revendication 1 ou 2, caractérisé en ce que le lien graphique est un trait reliant l’au moins une expression présentant une difficulté cognitive et l’élément textuel affiché.
  4. Procédé d’affichage d’un document textuel enrichi selon l’une quelconque des revendications précédentes, caractérisé en ce que la recherche de l’élément textuel s’effectue en avant à partir du début du document textuel jusqu’à la position où se trouve l’expression associée.
  5. Procédé d’affichage d’un document textuel enrichi selon l’une des revendications 1 à 3, la recherche de l’élément textuel s’effectue en arrière à partir de la position de l’expression jusqu’au début du document textuel.
  6. Procédé d’affichage d’un document textuel enrichi selon l’une quelconque des revendications précédentes, caractérisé en ce qu’un élément graphique est associé à l’au moins une expression présentant une difficulté cognitive, le procédé comportant une étape d’introduction d’un paramètre contrôlant l’affichage de l’élément textuel associé ou de l’élément graphique.
  7. Procédé d’affichage d’un document textuel enrichi selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il comporte une étape de génération des signaux sonores de l’élément textuel produit par une synthèse vocale.
  8. Procédé d’affichage d’un document textuel enrichi selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il comporte une étape d’apposition d’une distinction graphique sur au moins une expression du texte associée à un élément textuel, et une étape d’introduction d’une commande pour reproduire ledit élément textuel ou des signaux sonores dudit élément textuel produit par une synthèse vocale.
  9. Procédé d’affichage d’un document textuel enrichi selon l’une quelconque des revendications précédentes, caractérisé en ce que l’étape d’affichage met graphiquement en évidence les éléments textuels qui sont associés à des expressions, et qui sont situés dans le texte avant ladite expression.
  10. Procédé d’affichage d’un document textuel enrichi selon l’une quelconque des revendications précédentes, caractérisé en ce que les étapes de détermination (3.1) d’au moins une expression présentant une difficulté cognitive et/ou de recherche (3.6) d’un élément textuel associé à cette expression, mettent en œuvre un agorithme de type Traitement Automatique du Langage Naturel.
  11. Procédé de génération d’un document textuel enrichi, caractérisé en ce qu’il comporte les étapes suivantes :
    - détermination (3.1) au cours d’une première lecture d’un texte d’au moins une expression présentant une difficulté cognitive en mettant en œuvre un agorithme de type Traitement Automatique du Langage Naturel,
    - recherche (3.6) au cours d’une seconde lecture du texte situé avant l’au moins une expression d’un élément textuel associé à cette expression et offrant une explication plus détaillée de cette expression en mettant en œuvre un agorithme de type Traitement Automatique du Langage Naturel,
    - génération (3.7) du texte enrichi en associant ledit élément textuel à l’au moins une expression présentant une difficulté cognitive, l’élément textuel étant destiné à être reproduit lors de l’affichage sur un écran de l’expression associé au cours de la lecture du texte enrichi.
  12. Dispositif d’affichage d’un document textuel enrichi, comportant un moyen de détermination (1.1, 1 .2) au cours d’une première lecture d’un texte d’au moins une expression présentant une difficulté cognitive, caractérisé en ce qu’il comporte un moyen de recherche (1.1, 1.2) au cours d’une seconde lecture du texte situé avant ladite expression d’un élément textuel associé à cette expression et offrant une explication plus détaillée de cette expression, un moyen d’enrichissement (1.1, 1.2) du texte en associant ledit élément textuel à l’au moins une expression présentant une difficulté cognitive, et un moyen d’affichage (1.3) du document textuel enrichi en reproduisant à la fois l’au moins une expression présentant une difficulté cognitive et l’élément textuel affiché et, en affichant un lien graphique entre cette expression et cet élément textuel.
  13. Programme d'ordinateur comportant des instructions pour la mise en œuvre du procédé d’affichage ou de génération selon l'une quelconque des revendications 1 ou 11, lorsque le programme est exécuté par un processeur.
FR1912202A 2019-10-30 2019-10-30 Procédé d’affichage d’un document textuel enrichi en associant des expressions d’un texte avec des informations explicatives, et dispositifs associés Active FR3102869B1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FR1912202A FR3102869B1 (fr) 2019-10-30 2019-10-30 Procédé d’affichage d’un document textuel enrichi en associant des expressions d’un texte avec des informations explicatives, et dispositifs associés
CA3097404A CA3097404A1 (fr) 2019-10-30 2020-10-29 Procede d'affichage d'un document textuel enrichi en associant des expressions d'un texte avec des informations explicatives, et dispositifs associes

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1912202 2019-10-30
FR1912202A FR3102869B1 (fr) 2019-10-30 2019-10-30 Procédé d’affichage d’un document textuel enrichi en associant des expressions d’un texte avec des informations explicatives, et dispositifs associés

Publications (2)

Publication Number Publication Date
FR3102869A1 true FR3102869A1 (fr) 2021-05-07
FR3102869B1 FR3102869B1 (fr) 2023-04-28

Family

ID=69630427

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1912202A Active FR3102869B1 (fr) 2019-10-30 2019-10-30 Procédé d’affichage d’un document textuel enrichi en associant des expressions d’un texte avec des informations explicatives, et dispositifs associés

Country Status (2)

Country Link
CA (1) CA3097404A1 (fr)
FR (1) FR3102869B1 (fr)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170262412A1 (en) * 2007-10-17 2017-09-14 Vcvc Iii Llc Nlp-based entity recognition and disambiguation
US20180046331A1 (en) * 2016-08-12 2018-02-15 Microsoft Technology Licensing, Llc Immersive electronic reading
FR3067140A1 (fr) * 2017-06-01 2018-12-07 Majenat Sas Procede de generation d'un document textuel segmente en rheses destine a etre mis graphiquement en evidence

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170262412A1 (en) * 2007-10-17 2017-09-14 Vcvc Iii Llc Nlp-based entity recognition and disambiguation
US20180046331A1 (en) * 2016-08-12 2018-02-15 Microsoft Technology Licensing, Llc Immersive electronic reading
FR3067140A1 (fr) * 2017-06-01 2018-12-07 Majenat Sas Procede de generation d'un document textuel segmente en rheses destine a etre mis graphiquement en evidence
FR3067135A1 (fr) 2017-06-01 2018-12-07 Majenat Sas Procede d'affichage d'un document textuel segmente en rheses mis graphiquement en evidence

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KALINA BONTCHEVA ET AL: "Shallow Methods for Named Entity Coreference Resolution", 24 June 2002 (2002-06-24), pages 24 - 27, XP055713848, Retrieved from the Internet <URL:https://pdfs.semanticscholar.org/47ff/2b63105758371e9dc14916eb5894549f4f15.pdf?_ga=2.231716504.66766210.1594393559-2008069804.1591380432> [retrieved on 20200710] *

Also Published As

Publication number Publication date
CA3097404A1 (fr) 2021-04-30
FR3102869B1 (fr) 2023-04-28

Similar Documents

Publication Publication Date Title
US10997364B2 (en) Operations on sound files associated with cells in spreadsheets
Pierazzo A rationale of digital documentary editions
US9213705B1 (en) Presenting content related to primary audio content
US11657725B2 (en) E-reader interface system with audio and highlighting synchronization for digital books
US20110153330A1 (en) System and method for rendering text synchronized audio
US20140163957A1 (en) Multimedia message having portions of media content based on interpretive meaning
US20140164371A1 (en) Extraction of media portions in association with correlated input
US20060257827A1 (en) Method and apparatus to individualize content in an augmentative and alternative communication device
KR102159072B1 (ko) 콘텐츠 강화와 읽기 교육 및 이해 가능화를 위한 시스템 및 방법
Leggett Digitization and digital archiving: a practical guide for librarians
US20140161423A1 (en) Message composition of media portions in association with image content
US20140163956A1 (en) Message composition of media portions in association with correlated text
Samarawickrama et al. Comic based learning for students with visual impairments
FR3067140A1 (fr) Procede de generation d&#39;un document textuel segmente en rheses destine a etre mis graphiquement en evidence
FR3102869A1 (fr) Procédé d’affichage d’un document textuel enrichi en associant des expressions d’un texte avec des informations explicatives, et dispositifs associés
EP1194868B1 (fr) Methode et systeme de creation de documents electroniques - auto-publiants et adaptatifs
Nazemi Non-visual representation of complex documents for use in digital talking books
Lee PRESTIGE: MOBILIZING AN ORALLY ANNOTATED LANGUAGE DOCUMENTATION CORPUS
US11699023B2 (en) Producing automated sensory content and associated markers in HTML document publishing
Sandford “Loading memories…”: Deteriorating pasts and distant futures in Stuart Campbell’s These Memories Won’t Last
Hwang Context in Learning, Organizing and Sharing Information
FR3041125A1 (fr) Generateur automatique de document de synthese et moteur de recherche l&#39;utilisant
KR20220134248A (ko) 자기주도 국어 학습 콘텐츠 제공 방법 및 장치
Sriram On writing images: A case study in writing alt text for Orca book publishers
Gleason Accessible User-Generated Social Media for People with Vision Impairments

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20210507

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

PLFP Fee payment

Year of fee payment: 5