FR3067140A1 - Procede de generation d'un document textuel segmente en rheses destine a etre mis graphiquement en evidence - Google Patents
Procede de generation d'un document textuel segmente en rheses destine a etre mis graphiquement en evidence Download PDFInfo
- Publication number
- FR3067140A1 FR3067140A1 FR1854588A FR1854588A FR3067140A1 FR 3067140 A1 FR3067140 A1 FR 3067140A1 FR 1854588 A FR1854588 A FR 1854588A FR 1854588 A FR1854588 A FR 1854588A FR 3067140 A1 FR3067140 A1 FR 3067140A1
- Authority
- FR
- France
- Prior art keywords
- words
- group
- separators
- text
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000001149 cognitive effect Effects 0.000 claims abstract description 14
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 2
- 230000011664 signaling Effects 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 claims description 2
- 230000006872 improvement Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 206010013932 dyslexia Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 208000010877 cognitive disease Diseases 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 208000006888 Agnosia Diseases 0.000 description 1
- 206010003062 Apraxia Diseases 0.000 description 1
- 208000006096 Attention Deficit Disorder with Hyperactivity Diseases 0.000 description 1
- 208000036864 Attention deficit/hyperactivity disease Diseases 0.000 description 1
- 206010049669 Dyscalculia Diseases 0.000 description 1
- 206010013976 Dyspraxia Diseases 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 208000032128 Phonological disease Diseases 0.000 description 1
- 208000022372 Reading disease Diseases 0.000 description 1
- 208000014604 Specific Language disease Diseases 0.000 description 1
- 208000028790 Speech Sound disease Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 201000007201 aphasia Diseases 0.000 description 1
- 208000030137 articulation disease Diseases 0.000 description 1
- 208000015802 attention deficit-hyperactivity disease Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 208000035231 inattentive type attention deficit hyperactivity disease Diseases 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 208000011977 language disease Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008111 motor development Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 208000015897 writing disease Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0483—Interaction with page-structured environments, e.g. book metaphor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- User Interface Of Digital Computer (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
La présente invention concerne un procédé de génération d'un document textuel divisé en une pluralité de phrases séparées par des points, le document étant destiné à être affiché sur plusieurs lignes. Le procédé comporte une étape d'implémentation au sein de chaque phrase de séparateurs non visibles, appelés « balises », divisant la phrase en groupe de mots ayant un sens. Les séparateurs sont conçus pour mettre graphiquement en évidence lors de l'affichage sur un écran des groupes de mots délimités au début et à la fin par deux séparateurs, en affichant un ou plusieurs groupe(s) de mots en entier sur chaque ligne, ou une fraction d'un groupe de mots occupant une ligne affichée suivi d'une ligne suivante contenant uniquement le reste du groupe de mots ainsi fracturé. De cette manière, les groupes de mots ayant un sens sont mis graphiquement en évidence ce qui facilite la lecture pour des personnes ayant des difficultés cognitives.
Description
® PROCEDE DE GENERATION D'UN DOCUMENT TEXTUEL SEGMENTE EN RHESES DESTINE A ETRE MIS GRAPHIQUEMENT EN EVIDENCE.
FR 3 067 140 - A1
La présente invention concerne un procédé de génération d'un document textuel divisé en une pluralité de phrases séparées par des points, le document étant destiné à être affiché sur plusieurs lignes. Le procédé comporte une étape d'implémentation au sein de chaque phrase de séparateurs non visibles, appelés « balises », divisant la phrase en groupe de mots ayant un sens. Les séparateurs sont conçus pour mettre graphiquement en évidence lors de l'affichage sur un écran des groupes de mots délimités au début et à la fin par deux séparateurs, en affichant un ou plusieurs groupe(s) de mots en entier sur chaque ligne, ou une fraction d'un groupe de mots occupant une ligne affichée suivi d'une ligne suivante contenant uniquement le reste du groupe de mots ainsi fracturé. De cette manière, les groupes de mots ayant un sens sont mis graphiquement en évidence ce qui facilite la lecture pour des personnes ayant des difficultés cognitives.
ME 1
Procédé de génération d’un document textuel segmenté en rhèses destiné à être mis graphiquement en évidence
1. Domaine de l’invention
L’invention concerne le domaine de l’aide à la lecture pour des personnes atteintes de difficultés cognitives. L’invention concerne plus particulièrement la possibilité de générer un texte enrichi par des éléments déclenchant lors de l’affichage la mise en évidence de groupes de mots ayant un sens.
2. Art antérieur
De nos jours, il est possible d’acheter une œuvre littéraire sous une forme numérique et de la reproduire sur un appareil informatique. Cette démocratisation des livres sur supports numériques permet d’envisager de nouvelles méthodes d’assistance pour les personnes atteintes de troubles de la lecture. Ces difficultés interviennent dans l’apprentissage de la lecture et de l’écriture sans qu’aucun désordre sensoriel (vue, ouïe), intellectuel ou social ne soit responsable. L’Institut National de la Santé Et de la Recherche Médicale (Inserm) identifie au sein de ces troubles la dyspraxie (trouble du développement moteur et de l’écriture), la dyscalculie (trouble des activités numérique), la dysphasie (trouble du langage oral), les troubles de l’attention, et la dyslexie. Bon nombre de professionnels de la Santé considèrent la dyslexie comme un trouble spécifique de la lecture dont la caractéristique essentielle est une altération spécifique et significative de l’acquisition de la lecture. La correspondance entre les graphèmes et morphèmes, ainsi que dans le rôle des mots dans la phrase est le problème majeur rencontré par les enfants atteints de ce trouble phonologique.
Pour aider les personnes à surmonter ces difficultés cognitives, des maisons d’édition ont produit des livres adaptés. Dans ces livres, l’emploi de polices textuelles spécifiques, de marges et espacements plus importants, ou à l’épuration des illustrations permettent une meilleure perception du sens des phrases et donc une lecture plus facile.
Avec l’avènement du numérique, ces personnes disposent d’un véritable outil qu’elles peuvent adapter en fonction de leurs propres difficultés cognitives. Ces personnes téléchargent leur livre numérique dans un appareil informatique doté d’un écran et d’un clavier et lance la lecture du document. Le livre dispose de boutons de commande ou d’icônes permettant de modifier la mise en évidence graphique de certaines indications qui apparaissent à l’écran.
Parmi ces éléments graphiques, les éditeurs de livre numérique peuvent utiliser le « retour chariot » ou « CR » en abrégé pour stopper la ligne de mots affichés et passer à la ligne du dessous. Un tel code permet de bien mettre en évidence qu’une phrase ou un groupe de mots est terminé, et que le mot qui débute la ligne suivante appartient à un groupe signifiant autre chose. D’autres codes graphiques peuvent être utilisés comme le soulignement, ou le caractère gras. Il est ainsi possible de mettre systématiquement les verbes en gras pour attirer l’attention du lecteur.
Mais l’utilisation de ces codes normalisés pour signaliser des caractéristiques particulières à la lecture n’est pas optimale. En effet, ces codes peuvent déjà être utilisés dans le livre numérique afin de commander l’affichage, conformément aux souhaits de l’auteur du document, ce qui peut être contradictoire avec leur utilisation dans le cadre d’une aide à la lecture.
De plus, ces codes qui modifient l’affichage, peuvent le faire différemment d’un matériel à l’autre, ou lorsque l’utilisateur demande un zoom du texte. Il est important que la distinction graphique apposée à certain mot ou groupe de mots, à cause de leur signification particulière, soit la même quelque soit la taille de l’écran et le niveau de zoom demandé par l’utilisateur.
Il existe donc un réel besoin, d’un code spécifique qui déclenche une modification du texte affiché et qui permet une réelle aide à la lecture pour des personnes atteintes de troubles cognitifs. Ce code spécifique est intégré à certains endroits dans le texte, et permet de modifier l’affichage lors que ce texte est présenté sur un écran, ou imprimer dans un livre.
3. Objectifs de l’invention
La présente invention apporte une solution qui ne présente pas les inconvénients décrits plus haut, tout en proposant les avantages listés ci-dessus. En particulier, la présente invention permet de générer des textes numériques enrichis dotés de codes permettant de modifier l’affichage ou d’imprimer les mots d’une façon particulière, afin d’apposer une caractéristique graphique à certain mots ou groupes de mots, et ceci quel que soit le type d’appareil sur lequel ce texte est affiché.
4. Exposé de l’invention
Sur un plan fonctionnel, l’invention concerne un procédé de génération d’un document textuel divisé en une pluralité de phrases séparées par des points, le document étant destiné à être affiché sur plusieurs lignes. Le procédé comporte une étape d’implémentation au sein de chaque phrase de séparateurs non visibles, appelés « balises », divisant la phrase en groupe de mots ayant un sens, lesdits séparateurs étant conçus pour mettre graphiquement en évidence lors de l’affichage sur un écran des groupes de mots délimités au début et à la fin par deux séparateurs, en affichant un ou plusieurs groupe(s) de mots en entier sur chaque ligne, ou une fraction d’un groupe de mots occupant une ligne affichée suivi d’une ligne suivante contenant uniquement le reste du groupe de mots ainsi fracturé.
De cette manière, il est possible d’enrichir le texte à l’aide d’un code qui au moment de l’affichage de ce texte provoquera une distinction graphique appliquée à certain mot ou groupe de mots, à cause de leur signification particulière. L’utilisation de ce code spécifique déclenche une modification du texte affiché et permet une réelle aide à la lecture pour des personnes atteintes de troubles cognitifs.
Selon un premier perfectionnement, le procédé comporte une étape préalable d’introduction desdits séparateurs dans le document à la suite d’une analyse sémantique réalisé par un ordinateur. De cette manière, il est possible d’automatiser la segmentation du texte en rhèse.
Selon un autre perfectionnement, l’étape préalable prend en compte l’introduction d’une information relative au nombre maximum de caractères par ligne, ladite étape préalable prenant notamment en compte ce nombre pour interdire l’affichage des groupe de mots ayant un sens sur plusieurs lignes. De cette manière, le texte affiché sur un écran déterminé ne présente pas de rhèses à cheval sur deux lignes.
Selon un autre perfectionnement, Procédé selon la revendication 1, caractérisé en ce qu’il comporte une étape préalable d’introduction manuelle desdits séparateurs dans le document.
Selon un autre perfectionnement, le document textuel comporte un document audio correspondant au texte lu, chaque balise étant associé à une information temporelle signalant sa position au sein du document audio. De cette manière, l’utilisateur peut entendre le texte en même temps qu’il le lit.
Selon un autre perfectionnement, ledit séparateur est conçu pour déclencher une mise en évidence par une marque graphique spécifique du mot ou groupe de mots ayant un sens.
Selon un autre perfectionnement, le document textuel est enregistré dans un format ePub3.
Selon un autre aspect, l’invention concerne également un appareil de génération d’un document textuel divisé en une pluralité de phrases séparées par des points, le document étant destiné à être affiché sur plusieurs lignes. Ledit appareil comporte un moyen d’implémentation au sein de chaque phrase de séparateurs non visibles, appelés « balises », divisant la phrase en groupe de mots ayant un sens, lesdits séparateurs étant conçu pour mettre graphiquement en évidence lors de l’affichage sur un écran des groupes de mots délimités au début et à la fin par deux séparateurs, en affichant un ou plusieurs groupe(s) de mots en entier sur chaque ligne, ou une fraction d’un groupe de mots occupant une ligne affichée suivi d’une ligne suivante contenant uniquement le reste du groupe de mots ainsi fracturé.
L’invention concerne aussi un produit programme d’ordinateur comprenant des instructions de programme pour l’exécution du procédé décrit par les paragraphes précédent.
Selon un plan matériel, l’invention concerne également un appareil de lecture d’un document textuel divisé en une pluralité de phrases séparées par des points, comportant un moyen d’affichage affichant le document affiché sur plusieurs lignes, caractérisé en ce qu’il comporte un moyen de détection au sein de chaque phrase de séparateurs non visibles, appelés « balises », divisant la phrase en groupe de mots ayant un sens, le moyen d’affichage mettant graphiquement en évidence des groupes de mots délimités au début et à la fin par deux séparateurs, ledit moyen affichant un ou plusieurs groupe(s) de mots en entier sur chaque ligne, ou une fraction d’un groupe de mots occupant une ligne affichée suivi d’une ligne suivante contenant uniquement le reste du groupe de mots ainsi fracturé.
5. Liste des figures
D’autres caractéristiques et avantages de l’invention apparaîtront plus clairement à la lecture de la description suivante d’un mode de réalisation particulier, donné à titre de simple exemple illustratif et non-limitatif, et des dessins annexés, parmi lesquels :
- la figure 1 présente une structure d’un appareil de lecture muni d’un dispositif d’affichage selon un exemple de réalisation,
- la figure 2 montre un exemple d’ordinogramme présentant les étapes permettant d’afficher un texte dans une forme qui facilite sa lecture,
- la figure 3 présente une apparence d’écran selon l’état de la technique affichant un texte sans aide pour la lecture,
- la figure 4 présente une apparence d’écran affichant un texte avec une aide pour la lecture selon un exemple préféré de réalisation,
- la figure 5 présente un exemple d’apparence d’écran affichant la mise en évidence graphique de chaque rhèse,
- la figure 6 présente une apparence d’écran affichant la mise en évidence graphique de la rhèse en cours de lecture.
6. Description d’un mode de réalisation de l’invention
6.1 Principe général
La présente invention concerne un procédé de génération d’un document textuel divisé en une pluralité de phrases séparées par des points, le document étant destiné à être affiché sur plusieurs lignes. Le procédé comporte une étape d’implémentation au sein de chaque phrase de séparateurs non visibles, appelés « balises », divisant la phrase en groupe de mots ayant un sens. Les séparateurs sont conçus pour mettre graphiquement en évidence lors de l’affichage sur un écran des groupes de mots délimités au début et à la fin par deux séparateurs, en affichant un ou plusieurs groupe(s) de mots en entier sur chaque ligne, ou une fraction d’un groupe de mots occupant une ligne affichée suivi d’une ligne suivante contenant uniquement le reste du groupe de mots ainsi fracturé.
De cette manière, les groupes de mots ayant un sens sont mis graphiquement en évidence ce qui facilite la lecture pour des personnes ayant des difficultés cognitives.
6.2 Description d’un mode préféré de réalisation
Il existe de nombreuses méthodes permettant de rendre un livre numérique plus facile à lire à des personnes ayant des difficultés cognitives, telles que des personnes dyslexiques. Ces méthodes consiste généralement à mettre en évidence dans le texte imprimé des séparateurs qui mettent mieux en évidence certains mots ou groupes de mots. Par exemple, le verbe est imprimé dans une couleur différente.
Ces méthodes ont été implémentées en outil logiciel dans un programme exécutable sur tablette ou ordinateur portable. Un utilisateur choisit une œuvre ayant au moins une composante textuelle et demande à ce programme d’enrichir l’affichage. Le programme va mettre graphiquement en évidence certains mots ou groupes de mots d’une phrase ayant une forte signification sémantique, les personnes ayant des difficultés cognitives ont en effet du mal à distinguer ces mots ou groupes de mots. Présentons tout d’abord un appareil apte à afficher un livre numérique dans une forme qui facilite sa lecture.
La Fig. 1 montre une structure d’un appareil de lecture 1 muni d’un dispositif d’affichage 2 selon un exemple de réalisation de l’invention. Selon un mode préféré de réalisation, le lecteur de livre est une tablette, mais d’autres appareils sont également utilisables pour la présente invention, comme par exemple un téléphone intelligent ou « smartphone », un ordinateur personnel, ou tout appareil capable d’accéder à des contenus affichables et disposant de moyens de création et d’affichage de menus de navigation. Le procédé de génération de texte enrichi est également utilisable pour produire des livres dont la segmentation en rhèses apparaît de la même façon que pour l’affichage, les lignes étant imprimées au fil des pages du livre. Les groupes de mots délimités au début et à la fin par deux séparateurs sont graphiquement mis en évidence, en les affichant en entier sur chaque ligne, ou une fraction d’un groupe de mots occupant une ligne affichée suivi d’une ligne suivante contenant uniquement le reste du groupe de mots ainsi fracturé.
La tablette 1 comporte une unité centrale ALU 1.1 reliée à une mémoire de stockage MP (programme exécutable et données téléchargées) 1.2, un écran S 1.3, un module de communication radio 1.4, et un module d’interface 1.5 avec un clavier 1.6. Le module de communication permet la communication dans la gamme de fréquences radio compatible avec les réseaux de communication sans fil tels que : 2G/GSM, 3G/UMTS ou 4G/LTE. L’écran 1.3 peut être tactile, le clavier 1.6. est alors intégré à cet écran. Le clavier disposant au moins de touche de navigation, typiquement des flèches orientées vers au moins deux directions telles que gauche et droite. Il est évident que dans le cas d’un écran tactile, l’utilisateur peut introduite bien plus que quatre directions par des mouvements appliqués sur l’écran. La tablette comprend également un circuit 1.7 d'affichage de données sur l'écran, appelé souvent circuit OSD, de l'Anglais On Screen Display (signifiant affichage sur l'écran). Le circuit OSD 1.7 est un générateur de texte et de graphisme qui permet d'afficher à l'écran des menus, des pictogrammes (par exemple, un numéro correspondant à la chaîne visualisée) et qui permet d'afficher les menus de navigation conformément à la présente invention. Le circuit OSD 1.7 est contrôlé par l’Unité Centrale 1.1 et s’intercale entre celle-ci et l’écran 1.3.
La mémoire de stockage 1.2 contient notamment des programmes exécutables résidents et éventuellement, une partie de type Lecture/Ecriture pour l’enregistrement et l’exécution de programmes téléchargés. Ces programmes téléchargés sont typiquement des applications dédiées à un usage déterminé tels que messagerie, recherche d’informations sur Internet, téléchargement de documents audio et/ou visuels, télé-achat, etc. La mémoire programme MP contient un module de lecture qui sera appelé par la suite : le « Lecteur». Ce module est chargé de présenter des textes à l’écran et de recevoir des commandes de navigation permettant de changer le contenu affiché à l’écran. Le Lecteur est avantageusement réalisé sous la forme d’un module de programme enregistré dans la mémoire MP. Il peut aussi être réalisé sous la forme d’un circuit spécialisé de type ASIC par exemple.
La Fig. 2 décrit sous la forme d’un ordinogramme les principales étapes permettant de rendre visible un livre numérique dans une forme qui facilite sa lecture. Dans un premier temps, un livre est sélectionné et son contenu sémantique est analysé (étape 2.1). Cette analyse consiste à segmenter le texte du livre en une succession de rhèses. Une rhèse est un groupe de mots d'une phrase qui porte un sens, c’est à dire que, prononcé sans aucun contexte, ce groupe de mots ou ce mot possède une signification.
La segmentation du texte en rhèses s’effectue en plusieurs étapes :
- Segmentation sur la ponctuation
- Segmentation en propositions grammaticales
- Segmentation sur les prépositions et conjonctions charnières
- Segmentation suivant des règles fondées les syntagmes (verbal, adverbial, adjectival, prépositionnel et nominal)
La détermination de chaque rhèse prend en compte comme variable l’empan attentionnel du lecteur type (selon l’âge de la cible). L’empan attentionnel concerne la longueur moyenne du segment, qui dépend de la capacité attentionnelle des lecteurs cible, et donc du niveau de difficulté cognitive du lecteur. Cette information est prise en compte dans le calcul de segmentation, et permet d’adapter la finesse de la segmentation. Plus l'empan est court, plus le texte est segmenté. Il est ainsi possible pour des personnes ayant de grandes difficultés cognitives de limiter le nombre de caractères visibles (lettres, chiffres, symboles, caractères de ponctuation, ...) à 25 par rhèse, alors que pour une personne ayant moins de difficultés, ce nombre est porté à 35.
Afin de prendre en compte ces paramètres, le procédé de génération de texte enrichi comporte une étape d’introduction de ces valeurs, sur un clavier d’ordinateur par exemple. Ces valeurs sont introduites avant l’affichage du texte enrichi ou avant la composition du livre imprimé. Il est ainsi possible d’imprimer des livres différents avec des contenus visuels différents mais le même contenu textuel. De cette manière, pour un même texte, un lecteur peut choisir le livre en fonction de ces difficultés cognitives.
A la date du dépôt de la présente invention, cette analyse est réalisée par un module d’analyse sémantique doublée d’une personne qui valide les propositions du logiciels et finalise la pose des séparateurs dans le texte pour le segmenter en rhèses. Il n’est pas exclu que plus tard, cette segmentation s’effectue entièrement par un module d’analyse sémantique, ce qui n’écarte pas ίο la présente invention qui consiste notamment à utiliser la segmentation quelle que soit la façon dont elle est réalisée.
A l’étape 2.2, le texte est segmenté en une succession de rhèses délimitée par des séparateurs. Puis le texte est enrichi par l’incorporation de balises aux endroits du texte séparant les rhèses (étape 2.3). Une balise est un code informatique compatible avec le standard dans lequel est transmis le texte et qui déclenche une action au niveau de la visualisation du texte ou de son impression. Une balise n’est pas en soi visible mais va modifier la façon d’afficher le texte ou de l’imprimer, et permettre ainsi une lecture plus facile pour des personnes ayant des difficultés cognitives. Une balise peut également comporter un identifiant et des informations de synchronisation avec le fichier audio. Cette dernière donnée permet d’une part de mettre en évidence graphique la rhèse en même temps que l’audio (principe de prompteur à la rhèse dans une lecture audio, plus adaptée qu’un prompteur au mot trop rapide ou un prompteur à la phrase, trop lourd) et d’autre part, de faire énoncer seulement le groupe de mots (soutien audio ponctuel).
Cette dernière fonctionnalité est particulièrement appréciable car elle rend l’autonomie à la personne ayant des difficultés, qui peut ainsi lire tout seul sans risque de mise en échec L’opération d’enrichissement du texte s’effectue au niveau d’un ordinateur. Une fois enrichi, à l’étape 2.4, le texte est enregistré dans un fichier et accessible à la demande via un réseau. Le fichier peut également contenir des images, des sons, des fonctionnalités en javascript, un gabarit, etc.
Avantageusement, le texte est enregistré dans un fichier selon le format ePub3, qui est utilisé par de nombreux éditeurs d’ouvrages littéraires. Ce format conçu par l’organisation IDPF (acronyme de International Digital Publishing Forum) permet de stocker des livres numériques. Le texte du livre est stocké dans le fichier avec des informations supplémentaires qui permettront lors de l’affichage de mettre en forme le texte et d’ajouter des liens, un index, des images, etc. Ce format est ouvert, ce qui signifie que chacun peut choisir d’éditer un livre numérique dans ce format, et d’y rajouter des données pour améliorer les caractéristiques de l’affichage.
Supposons qu’un utilisateur commande le téléchargement d’un livre numérique enrichi selon le procédé faisant l’objet de la présente demande. Cet utilisateur s’adresse alors à un serveur distant puis, après éventuellement avoir justifié d’un paiement ou d’un abonnement, lance le téléchargement ce livre numérique enrichi dans sa tablette (étape 2.5).
Une fois que le fichier est inscrit dans la mémoire 1.2, à l’étape 2.6, l’utilisateur peut lancer à tout moment le Lecteur afin de sélectionner un livre enregistré. Le lancement du Lecteur peut aussi être lancé automatiquement au moment où l’utilisateur navigue dans la mémoire en affichant la liste des livres accessibles et active la lecture de l’un d’entre eux. Le lecteur lit séquentiellement les données textuelles et les affiche en respectant les caractères de pagination, et détecte chaque balise délimitant les rhèses (étape 2.7).
L’affichage peut prendre en compte comme variable le nombre maximum de caractères par ligne, ainsi que la longueur de la ligne liée au gabarit. Le gabarit désigne la maquette numérique d’un livre numérique. Selon la ligne éditoriale de chaque éditeur et de chaque collection voire de chaque livre, la zone de texte peut être plus ou moins large et de ce fait contenir plus ou moins de mots. La longueur de la ligne est prise en compte lorsque la rhèse ne doit pas être coupée par un changement de ligne.
A l’étape 2.8, le Lecteur modifie l’affichage du texte pour prendre en compte la présence des balises. Cette modification consiste à afficher les mots ou les groupes de mots en entier sur chaque ligne, ou à afficher une fraction d’un groupe de mots occupant une ligne affichée suivi d’une ligne suivante contenant uniquement le reste du groupe de mots ainsi fracturé. De cette façon, l’utilisateur de la tablette peut mieux prendre connaissance de la présence de chaque rhèse. Dans le cas de la production d’un livre, cette étape intervient lors de la détermination du contenu texte de chaque ligne de chaque page imprimé. Les retours à la ligne suivante vont permettre de mieux mettre en évidence les rhèses en les séparant par des lignes, tout en prenant en compte le nombre maximum de caractères par ligne, et la longueur de la ligne liée au gabarit.
La Fig. 3 présente une apparence d’écran avec un livre numérique affiché sans application du Lecteur. Dans ce cas, les règles de présentation s’applique et chaque mot du texte est affiché sans distinction graphique. De plus, pour des raisons d’esthétisme, chaque ligne du livre est justifiée, c’est à dire que toutes les premières lettres et toutes les dernières lettres de chaque ligne se positionne selon une même ligne verticale, parallèle au bord de la feuille. On peut constater que l’ensemble des mots forme un bloc compact et que visuellement, on ne peut pas voir les groupes de mots qui portent un sens.
Suite à l’étape 2.2, le fichier contenant le texte dit « enrichi » comporte désormais des balises. En reprenant l’exemple de la Fig.3, les balises sont placées à différents endroits. Comme ces balises ne correspondent pas à des symboles visibles et que les figures représentent justement ce qui est affiché, le texte est ci-dessous reproduit en marquant par des «♦», les endroits où se trouvent les balises.
« Perdu dans ses pensées,φ AliBaba sort de la ville. ¢11 conduit ses trois ânes ♦ vers la forêt, ♦ Au bout d’un moment, ♦ Ali Baba regarde les arbres ♦ autour de lui. ♦ Tiens ! φ se dit-il. ♦ Je ne suis jamais venu φ couper du bois par ici. »
La Fig. 4 présente une apparence d’écran avec le texte ci-dessus affiché en utilisant le Lecteur. Des règles d’affichage s’appliquent alors pour mettre graphiquement en évidence les rhèses en utilisant les balises. La première règle consiste en ce que le groupe de mots constituant une rhèse est insécable. De cette manière, le passage à la ligne soutient le sens. Sans cela et comme le montre la Fig.3, la compréhension peut être altérée quand la lecture s’arrête au bout de la ligne. Dans la mesure du possible, le travail effectué en amont à l’étape 2.1, permet d’interdire des rhèses trop longues qui s’afficheraient ou s’imprimeraient sur plusieurs lignes. Si la rhèse est trop longue alors elle est coupée en son milieu et chaque partie ne s’affiche que sur une seule ligne. Mais si cela n’est pas possible, compte-tenu notamment de la taille de l’écran sur lequel le livre est affiché et donc du nombre maximum de caractères par ligne, alors, dans le cas où la rhèse s’affiche sur deux lignes, au moins le début ou la fin de la rhèse coïncide respectivement avec le début ou la fin de la ligne. Ce nombre maximum peut être celui des caractères affichés sur une ligne d’un écran, ou celui des caractères imprimés sur chaque ligne d’un livre.
La Fig.4 est également une illustration d’une page d’un livre produit par le procédé de génération d’un texte enrichi par des balises.
6.2 Description de variantes de réalisation
La Fig. 5 présente une apparence d’écran avec le même texte affiché par le Lecteur en mettant graphiquement en évidence les rhèses. Dans ce mode de réalisation, le mot ou le groupe de mots constituant une rhèse est alternativement mis en évidence par une marque graphique spécifique, dans ce cas : un encadrement.
Le Lecteur peut également rajouter une distinction graphique mettant en évidence chaque rhèse, et plus précisément les passages d’une rhèse à l’autre. Un premier exemple consiste à apposer la même couleur sur chaque mot d’une même rhèse et à mettre une couleur différente de la précédente rhèse et de la rhèse suivante. Un autre mode de réalisation consiste à entourer une rhèse sur deux d’un cadre suffisamment fin pour ne pas nuire à la bonne lisibilité des caractères. C’est cet exemple de réalisation qui est visible sur la Fig. 5. Le Lecteur peut aussi alterner les modes d’affichage de chaque mot : normal, en italique, et en caractères gras, dans la succession des rhèses. Selon un autre exemple, les rhèses apparaissent dans une zone sans trait autour, et dotée d’un fond de couleur. Par exemple, les lettres des mots de la première et la cinquième rhèse apparaissent noires sur fond vert, les lettres des mots de la seconde et sixième rhèse apparaissent noires sur fond bleu, les lettres des mots de la troisième et septième rhèse apparaissent noires sur fond jaune, les lettres des mots de la quatrième et huitième rhèse apparaissent noires sur fond rouge.
La Fig. 6 présente une apparence d’écran avec le même texte affiché par le Lecteur en faisant apparaître une fenêtre de lecture. Ce mode d’affichage est par exemple utilisé lorsque l’affichage est doublé de la reproduction sonore du texte. Selon cet exemple, seule la rhèse en cours de reproduction audio est mise graphiquement en évidence. Cette reproduction peut être réalisée à l’aide d’un contenu audio incorporé dans le livre numérique, des marqueurs temporels sont alors placés à certains endroits du texte pour synchroniser le contenu audio. Selon une variante, la reproduction s’effectue à l’aide d’un module de synthèse vocale.
Selon une variante de réalisation, la tablette 1 possède un écran tactile et l’utilisateur suit le texte du livre à lire en déplaçant son doigt sur chaque mot. La tablette détermine alors le mot du texte sur lequel le doigt est posé et met graphiquement en évidence la rhèse qui contient ce mot. Ce premier moyen d’introduction de commande permet à la tablette 1 de déterminer facilement où l’utilisateur se situe dans sa lecture.
Selon une variante de réalisation, la tablette 1 possède un moyen permettant de suivre le regard de l’utilisateur lisant le texte, une caméra par exemple. La tablette détermine alors le mot du texte où le regard de l’utilisateur se pose et met graphiquement en évidence la rhèse qui contient ce mot. Dans le cas d’une lecture avec reproduction sonore du texte, on constate que la rhèse est un segment plus adapté que la phrase ou le mot pour soutenir le parcours de l’oeil lors de l’énonciation.
L’utilisateur peut choisir d’activer un ou plusieurs de ces perfectionnements. La sélection s’effectue à partir d’un menu de configuration activable à partir d’une touche ou d’une icône visible sur l’écran. Ainsi, le texte peut s’afficher ou s’imprimer sur les pages d’un livre en modifiant la tabulation pour prendre en compte la position des balises, et en mettant graphiquement en évidence chaque rhèse en les colorisant. Selon un perfectionnement, la personne qui analyse le texte et positionne les balises, choisit un mode d’affichage qui lui paraît le mieux adapté pour des personnes ayant des difficultés cognitives. Ce mode d’affichage est alors enregistré dans le fichier et pris par défaut lors du lancement du Lecteur. Bien évidemment, l’utilisateur final a la possibilité de 5 changer ce mode à sa convenance s’il ne lui convient pas. Si le fichier est enregistré dans l’appareil 1 de l’utilisateur, le mode d’affichage est alors modifié directement dans le fichier.
Il doit être évident pour les personnes versées dans l'art que la présente invention permet des modes de réalisation sous de nombreuses autres formes 10 spécifiques sans l'éloigner du domaine d'application de l'invention comme revendiqué. Par conséquent, les présents modes de réalisation et variantes doivent être considérés à titre d'illustration mais peuvent être modifiés dans le domaine défini par la portée des revendications jointes.
Claims (10)
- REVENDICATIONS1. Procédé de génération d’un document textuel divisé en une pluralité de phrases séparées par des points, le document étant destiné à être affiché sur plusieurs lignes, caractérisé en ce que le procédé comporte une étape d’implémentation au sein de chaque phrase de séparateurs non visibles, appelés « balises », divisant la phrase en groupe de mots ayant un sens, lesdits séparateurs étant conçus pour mettre graphiquement en évidence lors de l’affichage sur un écran des groupes de mots délimités au début et à la fin par deux séparateurs, en affichant un ou plusieurs groupe(s) de mots en entier sur chaque ligne, ou une fraction d’un groupe de mots occupant une ligne affichée suivi d’une ligne suivante contenant uniquement le reste du groupe de mots ainsi fracturé.
- 2. Procédé selon la revendication 1, caractérisé en ce qu’il comporte une étape préalable d’introduction desdits séparateurs dans le document à la suite d’une analyse sémantique réalisée par un ordinateur.
- 3. Procédé selon la revendication 2, caractérisé en ce qu’il comporte une étape préalable d’introduction d’une information relative au nombre maximum de caractères par ligne, ladite étape préalable prenant en compte ce nombre pour interdire l’affichage des groupe de mots ayant un sens sur plusieurs lignes.
- 4. Procédé selon la revendication 1, caractérisé en ce qu’il comporte une étape préalable d’introduction manuelle desdits séparateurs dans le document.
- 5. Procédé selon l’une quelconque des revendications précédentes, caractérisé en ce que le document textuel comporte un document audio correspondant au texte lu, chaque balise étant associé à une information temporelle signalant sa position au sein du document audio.
- 6. Procédé selon la revendication 5, caractérisé en ce que ledit séparateur est conçu pour déclencher une mise en évidence par une marque graphique spécifique du mot ou groupe de mots ayant un sens.
- 7. Procédé selon l’une quelconque des revendications précédentes, caractérisé en ce que le document textuel est enregistré dans un format ePub3.
- 8. Procédé selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il comporte une étape d’introduction d’une valeur d’empan représentative du niveau de difficulté cognitive du lecteur, ladite valeur étant prise en compte dans la segmentation en groupes de mots présentés sur une ligne.
- 9. Appareil de génération d’un document textuel divisé en une pluralité de phrases séparées par des points, le document étant destiné à être affiché sur plusieurs lignes, caractérisé en ce qu’il comporte un moyen d’implémentation au sein de chaque phrase de séparateurs non visibles, appelés « balises », divisant la phrase en groupe de mots ayant un sens, lesdits séparateurs étant conçu pour mettre graphiquement en évidence lors de l’affichage sur un écran des groupes de mots délimités au début et à la fin par deux séparateurs, en affichant un ou plusieurs groupe(s) de mots en entier sur chaque ligne, ou une fraction d’un groupe de mots occupant une ligne affichée suivi d’une ligne suivante contenant uniquement le reste du groupe de mots ainsi fracturé.
- 10. Produit programme d’ordinateur comprenant des instructions de programme pour l’exécution des étapes du procédé selon l’une quelconque
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1754853A FR3067135B1 (fr) | 2017-06-01 | 2017-06-01 | Procede d'affichage d'un document textuel segmente en rheses mis graphiquement en evidence |
FR1754853 | 2017-06-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
FR3067140A1 true FR3067140A1 (fr) | 2018-12-07 |
FR3067140B1 FR3067140B1 (fr) | 2021-10-01 |
Family
ID=59811471
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR1754853A Active FR3067135B1 (fr) | 2017-06-01 | 2017-06-01 | Procede d'affichage d'un document textuel segmente en rheses mis graphiquement en evidence |
FR1854588A Active FR3067140B1 (fr) | 2017-06-01 | 2018-05-29 | Procede de generation d'un document textuel segmente en rheses destine a etre mis graphiquement en evidence |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR1754853A Active FR3067135B1 (fr) | 2017-06-01 | 2017-06-01 | Procede d'affichage d'un document textuel segmente en rheses mis graphiquement en evidence |
Country Status (1)
Country | Link |
---|---|
FR (2) | FR3067135B1 (fr) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3102869A1 (fr) * | 2019-10-30 | 2021-05-07 | Majenat Sas | Procédé d’affichage d’un document textuel enrichi en associant des expressions d’un texte avec des informations explicatives, et dispositifs associés |
FR3119481A1 (fr) * | 2021-02-02 | 2022-08-05 | Universite Claude Bernard Lyon 1 | Procédé et dispositif d’assistance à la lecture et à son apprentissage par focalisation de l’attention. |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998006082A1 (fr) * | 1996-08-07 | 1998-02-12 | Walker Randall C | Traitement de textes |
US7613731B1 (en) * | 2003-06-11 | 2009-11-03 | Quantum Reader, Inc. | Method of analysis, abstraction, and delivery of electronic information |
US20140250355A1 (en) * | 2013-03-04 | 2014-09-04 | The Cutting Corporation | Time-synchronized, talking ebooks and readers |
-
2017
- 2017-06-01 FR FR1754853A patent/FR3067135B1/fr active Active
-
2018
- 2018-05-29 FR FR1854588A patent/FR3067140B1/fr active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998006082A1 (fr) * | 1996-08-07 | 1998-02-12 | Walker Randall C | Traitement de textes |
US7613731B1 (en) * | 2003-06-11 | 2009-11-03 | Quantum Reader, Inc. | Method of analysis, abstraction, and delivery of electronic information |
US20140250355A1 (en) * | 2013-03-04 | 2014-09-04 | The Cutting Corporation | Time-synchronized, talking ebooks and readers |
Non-Patent Citations (3)
Title |
---|
CONSTANCE NIN ET AL: "Segmentation automatique d'un texte en rhèses", ACTES DE LA CONFÉRENCE CONJOINTE JEP-TALN-RECITAL 2016, VOLUME 2, 1 July 2016 (2016-07-01), Paris, FR, pages 531 - 538, XP055438389, Retrieved from the Internet <URL:https://jep-taln2016.limsi.fr/actes/Actes JTR-2016/Papers/T80.pdf> [retrieved on 20180105] * |
MARIE-FRANCE EHRLICH ET AL: "Lire, comprendre, mémoriser les textes sur écran vidéo", COMMUNICATION ET LANGAGES, vol. 65, no. 1, 1 January 1985 (1985-01-01), pages 91 - 106, XP055439796, ISSN: 0336-1500, DOI: 10.3406/colan.1985.1722 * |
NADIA MANA ET AL: "Toward an Enhanced Reader for Dyslexics", CONFERENCE '10 ACM 1-58113-000-0/00/0010, 1 January 2010 (2010-01-01), XP055439802 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3102869A1 (fr) * | 2019-10-30 | 2021-05-07 | Majenat Sas | Procédé d’affichage d’un document textuel enrichi en associant des expressions d’un texte avec des informations explicatives, et dispositifs associés |
FR3119481A1 (fr) * | 2021-02-02 | 2022-08-05 | Universite Claude Bernard Lyon 1 | Procédé et dispositif d’assistance à la lecture et à son apprentissage par focalisation de l’attention. |
Also Published As
Publication number | Publication date |
---|---|
FR3067135B1 (fr) | 2021-04-23 |
FR3067140B1 (fr) | 2021-10-01 |
FR3067135A1 (fr) | 2018-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2345774A1 (fr) | Procede et appareil pour l'affichage d'informations | |
US20080222084A1 (en) | Displaying text of video in browsers on a frame by frame basis | |
CA2608345A1 (fr) | Procede et appareil d'individualisation de contenu dans un dispositif de communication augmentative et alternative | |
Harolds | Tips for giving a memorable presentation, Part IV: Using and composing PowerPoint slides | |
FR3067140A1 (fr) | Procede de generation d'un document textuel segmente en rheses destine a etre mis graphiquement en evidence | |
Skedsmo | How to use comic-strip graphics to represent signed conversation | |
Lahiani | Aesthetic poetry and creative translations: a translational hermeneutic reading | |
SE518881C2 (sv) | Anordning och datorprogram för att understödja läsning av en text | |
Cushing | Cambridge Topics in English Language Language Change | |
FR3102869A1 (fr) | Procédé d’affichage d’un document textuel enrichi en associant des expressions d’un texte avec des informations explicatives, et dispositifs associés | |
Borsuk | The upright script: Words in space and on the page | |
Kung | Exploring the non-substantive aspect of translation through a translanguaging lens | |
Roberts | Using an access-centered design to improve accessibility: A primer for technical communicators | |
Kouroupetroglou | Incorporating typographic, logical and layout knowledge of documents into text-to-speech | |
Petrenko et al. | Linguistic Means of Knowledge Representation in Literary Criticism | |
Pinto et al. | Zunar’s Political Cartoons: An Analysis of Rhetorical Devices | |
Gibson | The Matter of Black Living: The Aesthetic Experiment of Racial Data, 1880–1930 by Autumn Womack | |
Wijaya | Aspects of web accessibility | |
Kouroupetroglou | Accessibility of documents | |
Wagstaff | A Life Writing | |
FR3052587A1 (fr) | ||
Pedzwater | The Taiga Syndrome: A Review. | |
McKenzie et al. | Arturo Desimone, Aruban Argentinian Writer and Visual Artist | |
McDonald et al. | From Philology to Linguistics | |
Iyengar | Playful Letters: A Study in Early Modern Alphabetics. By Erika Mary Boeckeler |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 2 |
|
PLFP | Fee payment |
Year of fee payment: 3 |
|
PLFP | Fee payment |
Year of fee payment: 4 |
|
PLFP | Fee payment |
Year of fee payment: 5 |
|
PLFP | Fee payment |
Year of fee payment: 6 |
|
PLFP | Fee payment |
Year of fee payment: 7 |