FR3078180A1 - METHOD OF VISUALIZING A STRUCTURED DOCUMENT BY A WEB BROWSER AND ASSOCIATED PROGRAM - Google Patents

METHOD OF VISUALIZING A STRUCTURED DOCUMENT BY A WEB BROWSER AND ASSOCIATED PROGRAM Download PDF

Info

Publication number
FR3078180A1
FR3078180A1 FR1851546A FR1851546A FR3078180A1 FR 3078180 A1 FR3078180 A1 FR 3078180A1 FR 1851546 A FR1851546 A FR 1851546A FR 1851546 A FR1851546 A FR 1851546A FR 3078180 A1 FR3078180 A1 FR 3078180A1
Authority
FR
France
Prior art keywords
pages
group
document
groups
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR1851546A
Other languages
French (fr)
Other versions
FR3078180B1 (en
Inventor
Jackir Assan Aly
Moise Akbaraly
Yanis Ghidouche
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Docaxess Fr
Original Assignee
Ipedis
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ipedis filed Critical Ipedis
Priority to FR1851546A priority Critical patent/FR3078180B1/en
Publication of FR3078180A1 publication Critical patent/FR3078180A1/en
Application granted granted Critical
Publication of FR3078180B1 publication Critical patent/FR3078180B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/114Pagination

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

La présente invention se rapporte à un procédé de visualisation via un navigateur web d'un document structuré sous forme d'une succession de pages à la manière d'un document imprimé, comprenant les étapes de : • chargement (41) dans une mémoire du navigateur des pages du document, groupées par groupes de pages successives comprenant une ou plusieurs pages, chaque groupe de pages étant représentée sous forme d'au moins une image des pages du groupe de pages, les groupes de pages étant disposés les uns à la suite des autres ; • détermination (43) du groupe de pages à visualiser pour la lecture ; • remplacement (45) des images du groupe de pages ainsi déterminé par un contenu équivalent structuré sous forme d'une arborescence DOM HTML ; et • visualisation du contenu équivalent.The present invention relates to a method of viewing via a web browser a structured document in the form of a succession of pages in the manner of a printed document, comprising the steps of: • loading (41) into a memory of browser pages of the document, grouped into groups of successive pages comprising one or more pages, each group of pages being represented as at least one image of the pages of the group of pages, the groups of pages being arranged one after the other others ; Determining (43) the group of pages to be displayed for reading; Replacing (45) the images of the page group thus determined by structured equivalent content in the form of an HTML DOM tree; and • viewing the equivalent content.

Description

PROCEDE DE VISUALISATION D’UN DOCUMENT STRUCTURE PARPROCESS FOR VIEWING A DOCUMENT STRUCTURED BY

UN NAVIGATEUR WEB ET PROGRAMME ASSOCIE.A WEB BROWSER AND ASSOCIATED PROGRAM.

DESCRIPTIONDESCRIPTION

Domaine technique [01] La présente invention se rapporte à un procédé de visualisation via un navigateur web d’un document structuré sous forme d’une succession de pages à la manière d’un document imprimé.Technical Field [01] The present invention relates to a method of viewing via a web browser a document structured in the form of a succession of pages in the manner of a printed document.

État de la technique [02] Il est de pratique commune de vouloir dématérialiser un document imprimé pour en permettre la lecture sur un écran d’ordinateur, une tablette ou un téléphone portable.STATE OF THE ART [02] It is common practice to want to dematerialize a printed document to allow it to be read on a computer screen, a tablet or a mobile phone.

[03] C’est ainsi que pour les livres, des normes telles que la norme epub, associées à des programmes d’ordinateur spécifiques de lecture ont été développées pour permettre une lecture adaptée à la taille de l’écran tout en conservant une mise en page proche de celle du livre imprimé original.[03] This is how, for books, standards such as the epub standard, associated with specific computer reading programs have been developed to allow reading adapted to the size of the screen while keeping an up-to-date on page close to that of the original printed book.

[04] De façon plus générale, la norme PDF (ce terme regroupant différentes normes standardisées par l’Organisation Internationale de Normalisation telles que ISO 19005 PDF/A) associée à des modules de lecture spécifiques est utilisée pour intégrer dans des sites web des documents dématérialisés et en permettre la lecture à l’intérieur des navigateurs web.[04] More generally, the PDF standard (this term grouping together various standards standardized by the International Organization for Standardization such as ISO 19005 PDF / A) associated with specific reading modules is used to integrate documents into websites dematerialized and allow it to be read inside web browsers.

[05] Cependant, outre la lourdeur associée à la gestion d’un module de lecture particulier, il est vite apparu préférable d’intégrer les vidéos, diaporama d’images et tout ce qui est souvent regroupé sous le terme de « rich-media >> dans du HTML plutôt que dans du PDF. D’autant qu’une lecture à l’écran d’un fichier PDF est souvent peu ergonomique car ne permettant pas de s’adapter aisément à la taille de l’écran, ni de profiter de la souplesse de navigation offerte par le langage html dans la visualisation d’un site web.[05] However, in addition to the heaviness associated with the management of a particular reading module, it quickly appeared preferable to integrate the videos, image slideshow and all that is often grouped under the term of “rich-media >> in HTML rather than PDF. Especially since reading a PDF file on the screen is often not very ergonomic because it does not allow to easily adapt to the screen size, nor to take advantage of the flexibility of navigation offered by the html language. in viewing a website.

[06] De plus, alors que la lecture d’un livre imprimé se fait sur un axe associé au sens de lecture, par exemple de type horizontal de gauche à droite pour les langues alphabétiques européennes, la lecture à l’écran privilégie un déroulement vertical du texte.[06] In addition, while reading a printed book is done on an axis associated with the direction of reading, for example of horizontal type from left to right for European alphabetic languages, reading on the screen favors a sequence vertical of the text.

[07] Différentes solutions ont été proposées et en particulier de convertir le document imprimé en un fichier HTML respectant plus ou moins la mise en page du document imprimé original, avec un sens de défilement horizontal de gauche à droite.[07] Different solutions have been proposed and in particular to convert the printed document into an HTML file more or less respecting the layout of the original printed document, with a horizontal scrolling direction from left to right.

[08] Un problème est alors apparu avec cette conversion pour de gros documents, c’est-à-dire des documents ayant plusieurs dizaines voire centaines de pages. Le fichier HTML conséquent généré demande de grandes quantités de traitement de la part du navigateur web qui doit en permanence interprété toutes les balises pour générer la visualisation du document. II doit en effet recalculer complètement l’arborescence HTML ainsi que chaque propriété nécessaire à l’habillage graphique de celui-ci. La moindre modification d’affichage se traduit alors par des ralentissements de traitement qui nuisent à la convivialité et à l’ergonomie de la lecture.[08] A problem then appeared with this conversion for large documents, that is to say documents having several tens or even hundreds of pages. The resulting HTML file requires large amounts of processing on the part of the web browser, which must constantly interpret all the tags to generate the visualization of the document. It must indeed completely recalculate the HTML tree structure as well as each property necessary for its graphic design. The slightest change in display then results in processing slowdowns which affect the user-friendliness and ergonomics of reading.

[09] II existe donc un réel besoin pour un procédé de visualisation par un navigateur web d’un document structuré comme un document imprimé palliant ces défauts, inconvénients et obstacles de l’art antérieur, en particulier d’un procédé permettant de garder le style général du document imprimé tout en offrant un confort de lecture et de navigation similaire à ceux offert par des pages web.[09] There is therefore a real need for a method of viewing by a web browser a document structured as a printed document overcoming these defects, drawbacks and obstacles of the prior art, in particular a method for keeping the general style of the printed document while offering a comfort of reading and navigation similar to those offered by web pages.

Description de l’invention [10] Pour résoudre un ou plusieurs des inconvénients cités précédemment, un procédé de visualisation via un navigateur web d’un document structuré sous forme d’une succession de pages à la manière d’un document imprimé, comprend les étapes de :Description of the invention [10] To resolve one or more of the drawbacks mentioned above, a method of viewing via a web browser a document structured in the form of a succession of pages in the manner of a printed document, comprises the following: stages of:

• chargement dans une mémoire du navigateur des pages du document, groupées par groupes de pages successives comprenant une ou plusieurs pages, chaque groupe de pages étant représentée sous forme d’au moins une image des pages du groupe de pages, les groupes de pages étant disposés les uns à la suite des autres ;• loading in a memory of the browser of the pages of the document, grouped by groups of successive pages comprising one or more pages, each group of pages being represented in the form of at least one image of the pages of the group of pages, the groups of pages being arranged one after the other;

• détermination du groupe de pages à visualiser pour la lecture ;• determination of the group of pages to be viewed for reading;

• remplacement des images du groupe de pages ainsi déterminé par un contenu équivalent structuré sous forme d’une arborescence DOM HTML ; et • visualisation du contenu équivalent.• replacement of the images of the page group thus determined by equivalent content structured in the form of a DOM HTML tree structure; and • viewing equivalent content.

[11] Des caractéristiques ou des modes de réalisation particuliers, utilisables seuls ou en combinaison, sont :[11] Particular characteristics or embodiments, usable alone or in combination, are:

• l’étape de détermination comprend la réception d’une action de sélection d’un groupe de pages par un utilisateur ;• the determination step comprises the reception of an action for selecting a group of pages by a user;

• il comprend en outre, lors d’un changement de visualisation d’un groupe de pages par un autre groupe de pages, du remplacement de l’arborescence DOM HTML du groupe de pages précédemment visualisé par la ou les images des pages du groupe de pages ;• it also includes, when changing the display of a group of pages by another group of pages, replacing the DOM HTML tree structure of the page group previously viewed with the image or images of the pages in the group of pages;

• il comprend en outre, après l’étape de visualisation du contenu équivalent, une étape de visualisation du contenu sous un format article permettant une lecture par un utilisateur handicapé, ladite étape étant activée par la réception d’une action de l’utilisateur ;• it further comprises, after the step of viewing the equivalent content, a step of viewing the content in an article format allowing reading by a disabled user, said step being activated by reception of an action from the user;

• il comprend en outre une étape de retour à la visualisation du contenu équivalent ;• it also includes a step of returning to viewing the equivalent content;

• m groupes de pages précédents et suivants sont chargées en format article pendant la lecture du contenu au format article, m étant un entier strictement positif ;• m groups of previous and following pages are loaded in article format while reading content in article format, m being a strictly positive integer;

• il comprend en outre une étape de mise en mémoire tampon du chargement des contenus des arborescences DOM HTML, ladite étape s’exécutant en parallèle de la visualisation du document, et telle que, dans l’ordre de priorité, sont chargées :• it also includes a step of buffering the loading of the contents of the HTML DOM trees, said step being executed in parallel with the viewing of the document, and such that, in order of priority, are loaded:

• les n groupes de pages suivant le groupe de pages en cours de visualisation, n étant un entier strictement positif ;• the n groups of pages following the group of pages being viewed, n being a strictly positive integer;

• les n groupes de pages précédant le groupe de pages en cours de visualisation ;• the n groups of pages preceding the group of pages being viewed;

• les n premiers groupes de pages ;• the first n groups of pages;

• les n derniers groupes de pages ;• the last n groups of pages;

• les autres groupes de pages par ordre de page croissant ;• the other page groups in ascending page order;

• le document structuré est basé sur un document original au format PDF ; et/ou • il comprend des étapes préliminaires de :• the structured document is based on an original document in PDF format; and / or • it includes preliminary stages of:

• transformation du document original en un document XML conforme aux règles d’accessibilité et au contenu du document original ;• transformation of the original document into an XML document in accordance with the accessibility rules and the content of the original document;

• association à chaque type de balise des caractéristiques graphiques en adéquation avec le graphisme du document original afin de former le contenu équivalent ; et, en parallèle, • génération de vignettes images de chaque page, ou groupe de pages ; et • synthèse de l’ensemble pour former le document structuré.• association with each type of tag of graphic characteristics in line with the graphics of the original document in order to form equivalent content; and, in parallel, • generation of image thumbnails of each page, or group of pages; and • synthesis of the whole to form the structured document.

[12] Un autre aspect de l'invention se rapporte à un programme d'ordinateur à installer dans un ordinateur comprenant des instructions pour mettre en oeuvre les étapes d'un procédé tel que défini ci-dessus lors d'une exécution du programme par une unité de calcul dudit appareil.[12] Another aspect of the invention relates to a computer program to be installed in a computer comprising instructions for implementing the steps of a method as defined above when the program is executed by a unit for calculating said device.

Brève description des figures [13] L’invention sera mieux comprise à la lecture de la description qui suit, faite uniquement à titre d’exemple, et en référence aux figures en annexe dans lesquelles :Brief description of the figures [13] The invention will be better understood on reading the description which follows, given solely by way of example, and with reference to the appended figures in which:

- La figure 1 représente un système pour mettre en oeuvre un mode de réalisation de l’invention ;- Figure 1 shows a system for implementing an embodiment of the invention;

- La figure 2 représente schématiquement des pages d’un document imprimé pour être traité par un mode de réalisation de l’invention ;- Figure 2 schematically shows pages of a printed document to be processed by an embodiment of the invention;

- La figure 3 représente un procédé de création d’un document structuré selon un mode de réalisation de l’invention ;- Figure 3 shows a method of creating a structured document according to an embodiment of the invention;

- La figure 4 représente un procédé de visualisation du document créé par le procédé de la figure 3 ; et- Figure 4 shows a method of viewing the document created by the method of Figure 3; and

- Les figures 5A et 5B représentent une évolution de la visualisation du document selon le procédé de la figure 4.FIGS. 5A and 5B represent an evolution of the viewing of the document according to the method of FIG. 4.

Modes de réalisation [14] En référence à la figure 1, un navigateur web est installé sur un ordinateur 1 comprenant une unité d’affichage 3 et une interface 5 permettant à un utilisateur d’interagir. Cet ordinateur 1 est connecté à un serveur 7 via une connexion de données 9.Embodiments [14] With reference to FIG. 1, a web browser is installed on a computer 1 comprising a display unit 3 and an interface 5 allowing a user to interact. This computer 1 is connected to a server 7 via a data connection 9.

[15] Le procédé de visualisation d’un document va maintenant être décrit.[15] The process for viewing a document will now be described.

[16] Le document est d’abord conçu comme un document imprimé comprenant des textes et des illustrations dans une mise en page particulière. En support illustratif, la figure 2 représente quelques pages du document sous une forme schématique. La figure 2A représente la page de couverture, la figure 2B une page N et la figure 2C une page N+1. L’organisation des pages est faite sous forme de 2 colonnes et comprend des textes 21, des titres 23, un tableau 25, des illustrations 27 et un graphique 29.[16] The document is first intended as a printed document comprising text and illustrations in a particular layout. In illustrative support, FIG. 2 represents a few pages of the document in a schematic form. FIG. 2A represents the cover page, FIG. 2B a page N and FIG. 2C a page N + 1. The pages are organized in the form of 2 columns and include texts 21, titles 23, a table 25, illustrations 27 and a graph 29.

[17] Le document imprimé est destiné, par exemple à être envoyé par courrier postal aux lecteurs, ou à être distribué lors d’une manifestation. Cependant, l’éditeur souhaite qu’il soit également accessible en ligne sur un site web hébergé par le serveur 7.[17] The printed document is intended, for example, to be sent by post to readers, or to be distributed at an event. However, the publisher wants it to also be available online on a website hosted by server 7.

[18] Aussi, figure 3, à partir des fichiers d’édition du document préparés à l’étape 30, ou à partir d’un fichier PDF d’impression de celui-ci sont générées, étape 31, des images de chaque page, ou de groupe de pages consécutives. On définit ainsi un groupe de pages comme un ensemble de pages à visualiser en même temps. Typiquement, le groupe de pages associé à la couverture ne comprend qu’une page alors qu’un groupe de pages associés à des pages internes comprend les deux pages se faisant face dans le document imprimé. Chaque image ayant un rôle de vignette est codée dans un format d’image relativement compressé tel que le format jpeg. L’homme du métier sait faire un ajustement de compromis entre la taille du fichier des images d’une part, et la lisibilité de chaque image d’autre part.[18] Also, FIG. 3, from the document editing files prepared in step 30, or from a print PDF file of this, step 31, images of each page are generated , or group of consecutive pages. A group of pages is thus defined as a set of pages to be viewed at the same time. Typically, the group of pages associated with the cover comprises only one page whereas a group of pages associated with internal pages comprises the two pages facing each other in the printed document. Each thumbnail image is encoded in a relatively compressed image format such as jpeg format. A person skilled in the art knows how to make a compromise adjustment between the size of the image file on the one hand, and the readability of each image on the other hand.

Il est à noter qu’il n’est pas nécessaire que chaque image permette la lecture car son rôle est uniquement de permettre la navigation dans le document par l’utilisateur. Ainsi, par exemple, il est possible de choisir un taux de compression dans lequel seuls les titres sont lisibles.It should be noted that it is not necessary for each image to allow reading because its role is only to allow navigation in the document by the user. Thus, for example, it is possible to choose a compression rate in which only the titles are readable.

[19] L’ensemble des images est alors organisé, étape 33, dans un fichier lisible par un navigateur web sous forme d’un ruban ordonné permettant un défilement horizontal ou, de préférence, vertical dans le navigateur web. Concrètement, le fichier est un fichier HTML avec des liens images de type <img> vers les images des groupes de pages.[19] All of the images are then organized, step 33, in a file readable by a web browser in the form of an ordered ribbon allowing horizontal or, preferably, vertical scrolling in the web browser. Concretely, the file is an HTML file with image links of type <img> to the images of the page groups.

[20] En parallèle, chaque groupe de pages est transformé, étape 35, en un document DOM HTML respectant le contenu et la mise en page des pages du groupe. Par exemple, dans l’exemple de la figure 2, la structuration du texte en deux colonnes est maintenue. Et le texte lui-même est balisé comme texte avec une police vectorielle. Ainsi, on peut dire que, pour un groupe de pages, le contenu du document HTML est équivalent à l’image de ce groupe de pages générée à l’étape 31 dans la mesure où la visualisation en est très proche. Cette transformation peut, par exemple, être réalisée par un module d’exportation du logiciel d’édition du document.[20] In parallel, each group of pages is transformed, step 35, into a DOM HTML document respecting the content and layout of the group's pages. For example, in the example in Figure 2, the text is structured in two columns. And the text itself is marked up as text with a vector font. Thus, we can say that, for a group of pages, the content of the HTML document is equivalent to the image of this group of pages generated in step 31 insofar as the visualization is very close. This transformation can, for example, be carried out by an export module of the document editing software.

[21 ] Chaque groupe de pages est donc transformée en un fichier respectant la norme HTML. Par exemple, les illustrations 27 et graphiques 29 correspondent à des liens vers des fichiers images.[21] Each group of pages is therefore transformed into a file respecting the HTML standard. For example, illustrations 27 and graphics 29 correspond to links to image files.

[22] Une seconde transformation, étape 37, est réalisée directement à partir du fichier original. Elle consiste dans un premier temps à générer un fichier XML respectueux de la logique organisationnelle du contenu pour générer un fichier HTML dont la mise en page est adaptée à une lecture sur écran et, en particulier, à une lecture accessible à des lecteurs handicapés. Par exemple, la présentation en deux colonnes illustrées à la figure 2 est remplacée par une présentation sur une seule colonne avec l’ensemble du texte se déroulant verticalement. Ce format est appelé « format article >> par référence à la terminologie utilisée dans les systèmes de gestion de contenu tels que WordPress.[22] A second transformation, step 37, is carried out directly from the original file. It consists first of all in generating an XML file which respects the organizational logic of the content in order to generate an HTML file, the layout of which is suitable for reading on screen and, in particular, for reading accessible to disabled readers. For example, the two-column presentation illustrated in Figure 2 is replaced by a single-column presentation with all of the text scrolling vertically. This format is called "article format" by reference to the terminology used in content management systems such as WordPress.

[23] L’ensemble des résultats de ces transformations est synthétisé, étape 39, en un document structuré composé d’un ensemble de fichiers ayant des liens entre eux avec d’une part le fichier contenant l’ensemble des images des groupes de page et d’autre part, l’ensemble des fichiers décrivant les pages sous forme HTML.[23] All of the results of these transformations are synthesized, step 39, into a structured document composed of a set of files having links between them, on the one hand, the file containing all the images of the page groups. and on the other hand, all the files describing the pages in HTML form.

[24] Les étapes de visualisation du document structuré vont maintenant être décrites en référence à la figure 4.[24] The steps for viewing the structured document will now be described with reference to FIG. 4.

[25] Lorsque l’utilisateur de l’ordinateur 1 clique sur le lien du document structuré pour le visualiser le fichier contenant l’ensemble des liens vers les images créé à l’étape 33, est téléchargé sur l’ordinateur 1, étape 41.[25] When the user of computer 1 clicks on the link of the structured document to view it, the file containing all the links to the images created in step 33 is downloaded to computer 1, step 41 .

[26] A l’étape 43, on détermine quel groupe de pages est à afficher. Par défaut, dans la première demande, il est considéré que c’est la première page qui est à afficher. Mais cela peut être également une page particulière, par exemple associée au lien d’appel, ou bien la dernière page lue dans une navigation précédente et conservée dans un « cookie », ou bien un groupe de pages sélectionné par un clic, ou un défilement, sur une des images.[26] In step 43, it is determined which group of pages is to be displayed. By default, in the first request, it is considered that it is the first page which is to be displayed. But it can also be a particular page, for example associated with the call link, or the last page read in a previous navigation and kept in a "cookie", or a group of pages selected by a click, or a scroll , on one of the images.

[27] Le groupe de pages ainsi déterminé, l’image est remplacée, étape 45, par le document DOM HTML correspondant qui a été généré à l’étape 35. Avec les moyens de calcul actuels, et si le document DOM HTML a été mis en cache au préalable (point qui sera discuté plus loin), le remplacement de l’image par le document DOM HTML est quasi-instantané et invisible pour l’utilisateur. Par contre, contrairement éventuellement à l’image, le document DOM HTML est totalement lisible par l’utilisateur.[27] The group of pages thus determined, the image is replaced, step 45, by the corresponding DOM HTML document which was generated in step 35. With the current calculation means, and if the DOM HTML document has been cached beforehand (point which will be discussed later), the replacement of the image by the HTML DOM document is almost instantaneous and invisible to the user. On the other hand, unlike possibly the image, the DOM HTML document is completely readable by the user.

[28] Ce processus est illustré spécifiquement en figure 5. 5 groupes de pages consécutifs numérotés P1, P2, P3, P4 et P5 sont représentés dans un mode de défilement vertical.[28] This process is specifically illustrated in Figure 5. 5 groups of consecutive pages numbered P1, P2, P3, P4 and P5 are shown in a vertical scrolling mode.

[29] En figure 5A, la visualisation est centrée sur P1. Cela est symbolisé par un écran de visualisation 51 autour de P1. P1 est alors affiché dans son arborescence DOM HTML, symbolisé par HTML. Les autres groupes d’images P2, P3, P4 et P5 sont en mode affichage image, symbolisé par IMG.[29] In FIG. 5A, the display is centered on P1. This is symbolized by a display screen 51 around P1. P1 is then displayed in its DOM HTML tree, symbolized by HTML. The other groups of images P2, P3, P4 and P5 are in image display mode, symbolized by IMG.

[30] En figure 5B, la visualisation est centrée sur P4. Ce changement est par exemple dû à l’action de la molette de la souris par l’utilisateur. A ce moment, P4 est affiché dans son arborescence DOM HTML et P1 est de nouveau en mode affichage image.[30] In FIG. 5B, the display is centered on P4. This change is for example due to the action of the mouse wheel by the user. At this time, P4 is displayed in its DOM HTML tree and P1 is again in image display mode.

[31] Si, à cause d’un handicap ou par simple confort de lecture, l’utilisateur clique, étape 47 de la figure 4, sur le groupe de pages affiché, alors le contenu s’affiche, étape 48, sous forme article avec la mise en page préparée à l’étape 37.[31] If, due to a handicap or by simple reading comfort, the user clicks, step 47 of FIG. 4, on the displayed group of pages, then the content is displayed, step 48, in article form with the layout prepared in step 37.

[32] Il est à noter que, dans ce mode, si le texte en lecture est initialement réparti sur plusieurs pages de différents groupes de pages, l’ensemble du texte et de ses éléments associés, c’est-à-dire les m groupes de pages qui précèdent ou suivent, est téléchargé et inclut dans l’article afin de permettre une lecture continue de ce texte.[32] It should be noted that, in this mode, if the text being read is initially distributed over several pages of different groups of pages, all of the text and its associated elements, ie the m groups of pages which precede or follow, is downloaded and included in the article in order to allow a continuous reading of this text.

[33] Dans cette mise en page, un symbole de fermeture, par exemple une croix, est positionnée dans un coin de l’écran afin qu’un clic dessus referme, étape 49, le mode article et retourne sur le groupe de pages dans sa forme initiale.[33] In this layout, a closing symbol, for example a cross, is positioned in a corner of the screen so that a click on it closes, step 49, the article mode and returns to the group of pages in its initial shape.

[34] Ainsi, au fil de la navigation et de la lecture, il y a une transition régulière entre les images et les fichiers DOM HTML.[34] Thus, during navigation and reading, there is a regular transition between images and DOM HTML files.

[35] Pour fluidifier encore plus cette navigation, l’ensemble du document structuré n’est pas chargé sur l’ordinateur 1 dès l’appel d’accès au document stocké sur le serveur 7. Le principe général consiste à ne commencer à charger que les éléments indispensables puis, en arrière-plan, de télécharger dans le cache du navigateur les éléments dont la lecture à venir est la plus probable au vu du contexte de lecture présent.[35] To make this navigation even more fluid, the entire structured document is not loaded on computer 1 as soon as the access to the document stored on the server is called. The general principle consists in not starting to load only the essential elements then, in the background, to download in the browser cache the elements whose future reading is most likely in view of the present reading context.

[36] Ainsi, dans l’ordre de priorité, sont chargées :[36] Thus, in order of priority, are responsible:

• les n groupes de pages suivant le groupe de pages en cours de visualisation, n étant un entier strictement positif typiquement égal à 10;• the n groups of pages following the group of pages being viewed, n being a strictly positive integer typically equal to 10;

• les n groupes de pages précédant le groupe de pages en cours de visualisation ;• the n groups of pages preceding the group of pages being viewed;

• les n premiers groupes de pages ;• the first n groups of pages;

• les n derniers groupes de pages ;• the last n groups of pages;

• les autres groupes de pages par ordre de page croissant.• the other page groups in ascending page order.

[37] Une fois cet ordre de priorité déterminé, une instruction est donnée au navigateur pour démarrer les requêtes de téléchargement des n groupes de pages. Afin de garder une parfaite maîtrise du téléchargement de chacune des ressources, une file d’attente est mise en place afin que le navigateur ne traite qu’un ensemble de n groupes de pages à la fois selon l’ordre prédéterminé.[37] Once this priority order has been determined, an instruction is given to the browser to start the download requests for the n groups of pages. In order to maintain perfect control over the downloading of each resource, a queue is set up so that the browser only processes a set of n groups of pages at a time in the predetermined order.

[38] Le traitement d’un groupe de pages nécessite plusieurs étapes :[38] Processing a group of pages requires several steps:

• Télécharger les données liées à chacune des pages telles que :• Download the data linked to each of the pages such as:

• Son numéro de page ;• Its page number;

• Ses médias associés ;• Its associated media;

• Son HTML ;• Its HTML;

• Son article ;• His article;

• Ses dimensions ;• Its dimensions;

• Le lien de ses images ;• The link of his images;

• Etc.• Etc.

[39] Une fois la réponse obtenue, de façon toujours asynchrone, le navigateur charge en tâche de fond chacune des images associées aux différents liens.[39] Once the answer is obtained, always asynchronously, the browser loads in the background each of the images associated with the different links.

[40] Ainsi, ce processus permet de s’abstraire de la contrainte de temps de chargement croissant si rapporté au nombre de pages du document. En effet, on peut estimer que le temps de chargement global est le produit du nombre de pages par le temps moyen nécessaire au chargement d’une page.[40] Thus, this process allows to get rid of the constraint of increasing loading time if related to the number of pages of the document. Indeed, we can estimate that the overall loading time is the product of the number of pages by the average time required to load a page.

[41] Chaque page téléchargée est gardée dans le cache pendant tout le cycle de vie de la lecture du document. Cela permet, une fois téléchargées, de pouvoir disposer des informations instantanément, même si ces informations ne sont affichées à l’écran que lors d’une action utilisateur directe comme explicité précédemment.[41] Each downloaded page is kept in the cache throughout the document reading lifecycle. This allows, once downloaded, to be able to have information instantly, even if this information is only displayed on the screen during a direct user action as explained above.

[42] Cela permet avantageusement d’offrir à l’utilisateur une expérience de navigation lui permettant de consulter rapidement la page initialement demandée, de lui garantir une rapide disponibilité des prochaines pages qu’il est susceptible de consulter ainsi qu’un chargement progressif, différé et non bloquant de l’ensemble des informations nécessaires au bon fonctionnement du système.[42] This advantageously makes it possible to offer the user a browsing experience allowing him to quickly consult the page initially requested, to guarantee him rapid availability of the next pages which he is likely to consult as well as a progressive loading, deferred and not blocking of all the information necessary for the proper functioning of the system.

[43] L’invention a été illustrée et décrite en détail dans les dessins et la description précédente. Celle-ci doit être considérée comme illustrative et donnée à titre d’exemple et non comme limitant l’invention à cette seule description. De nombreuses variantes de réalisation sont possibles.[43] The invention has been illustrated and described in detail in the drawings and the preceding description. This should be considered as illustrative and given by way of example and not as limiting the invention to this description only. Many variant embodiments are possible.

[44] Par exemple, la description décrit l’utilisation d’un ordinateur pour visualiser le document. Il est évident pour l’homme du métier que l’ordinateur peut être de tout type comportant un affichage adapté tel que, par exemple, un ordinateur portable, une tablette ou un téléphone portable de type « smartphone ». De même l’interface 5 permettant à l’utilisateur d’interagir peut être de tout type comme un écran tactile ou une commande vocale.[44] For example, the description describes the use of a computer to view the document. It is obvious to a person skilled in the art that the computer can be of any type comprising a suitable display such as, for example, a laptop, a tablet or a “smartphone” type mobile phone. Similarly, the interface 5 allowing the user to interact can be of any type such as a touch screen or a voice command.

[45] De même, l’exemple ci-dessus privilégie la création d’une image par groupes de pages, ce qui simplifie l’organisation du fichier html des images servant à la prévisualisation. Il est cependant possible, quoique moins pratique pour l’organisation de ce fichier html, de générer une image par page et donc un groupe de pages comportant plusieurs pages aura autant d’images que de pages.[45] Similarly, the example above favors the creation of an image by groups of pages, which simplifies the organization of the html file of the images used for previewing. It is however possible, although less practical for the organization of this html file, to generate one image per page and therefore a group of pages comprising several pages will have as many images as pages.

Claims (10)

REVENDICATIONS 1. Procédé de visualisation via un navigateur web d’un document structuré sous forme d’une succession de pages à la manière d’un document imprimé, comprenant les étapes de :1. Method for viewing, via a web browser, a document structured in the form of a succession of pages in the manner of a printed document, comprising the steps of: • chargement (41) dans une mémoire du navigateur des pages du document, groupées par groupes de pages successives comprenant une ou plusieurs pages, chaque groupe de pages étant représentée sous forme d’au moins une image des pages du groupe de pages, les groupes de pages étant disposés les uns à la suite des autres ;• loading (41) into a browser memory of the pages of the document, grouped by groups of successive pages comprising one or more pages, each group of pages being represented in the form of at least one image of the pages of the page group, the groups of pages being arranged one after the other; • détermination (43) du groupe de pages à visualiser pour la lecture ;• determination (43) of the group of pages to be viewed for reading; • remplacement (45) des images du groupe de pages ainsi déterminé par un contenu équivalent structuré sous forme d’une arborescence DOM HTML ; et • visualisation du contenu équivalent.• replacement (45) of the images in the page group thus determined by equivalent content structured in the form of a DOM HTML tree structure; and • viewing equivalent content. 2. Procédé selon la revendication 1, caractérisé en ce que l’étape de détermination (43) comprend la réception d’une action de sélection d’un groupe de pages par un utilisateur.2. Method according to claim 1, characterized in that the determining step (43) comprises the reception of an action for selecting a group of pages by a user. 3. Procédé selon l’une quelconque des revendications 1 ou 2, caractérisé en ce qu’il comprend en outre, lors d’un changement de visualisation d’un groupe de pages par un autre groupe de pages, du remplacement de l’arborescence DOM HTML du groupe de pages précédemment visualisé par la ou les images des pages du groupe de pages.3. Method according to any one of claims 1 or 2, characterized in that it further comprises, when changing the display of a group of pages by another group of pages, replacing the tree structure DOM HTML of the page group previously viewed by the page image (s) of the page group. 4. Procédé selon l’une quelconque des revendications 1,2 ou 3, caractérisé en ce qu’il comprend en outre, après l’étape de visualisation du contenu équivalent, une étape de visualisation du contenu sous un format article permettant une lecture par un utilisateur handicapé, ladite étape étant activée par la réception d’une action de l’utilisateur.4. Method according to any one of claims 1,2 or 3, characterized in that it further comprises, after the step of viewing the equivalent content, a step of viewing the content in an article format allowing reading by a disabled user, said step being activated by receiving a user action. 5. Procédé selon la revendication 4, caractérisé en ce qu’il comprend en outre une étape de retour à la visualisation du contenu équivalent.5. Method according to claim 4, characterized in that it further comprises a step of returning to viewing the equivalent content. 6. Procédé selon la revendication 4 ou 5, caractérisé en ce que m groupes de pages précédents et suivants sont chargées en format article pendant la lecture du contenu au format article, m étant un entier strictement positif.6. Method according to claim 4 or 5, characterized in that m groups of preceding and following pages are loaded in article format during the reading of the content in article format, m being a strictly positive integer. 7. Procédé selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il comprend en outre une étape de mise en mémoire tampon du chargement des contenus des arborescences DOM HTML, ladite étape s’exécutant en parallèle de la visualisation du document, et telle que, dans l’ordre de priorité, sont chargées :7. Method according to any one of the preceding claims, characterized in that it further comprises a step of buffering the loading of the contents of the DOM HTML trees, said step being executed in parallel with the viewing of the document, and such that, in order of priority, are responsible for: • les n groupes de pages suivant le groupe de pages en cours de visualisation, n étant un entier strictement positif ;• the n groups of pages following the group of pages being viewed, n being a strictly positive integer; • les n groupes de pages précédant le groupe de pages en cours de visualisation ;• the n groups of pages preceding the group of pages being viewed; • les n premiers groupes de pages ;• the first n groups of pages; • les n derniers groupes de pages ;• the last n groups of pages; • les autres groupes de pages par ordre de page croissant.• the other page groups in ascending page order. 8. Procédé selon l’une quelconque des revendications précédentes, caractérisé en ce que le document structuré est basé sur un document original au format PDF.8. Method according to any one of the preceding claims, characterized in that the structured document is based on an original document in PDF format. 9. Procédé selon l’une quelconque des revendications précédentes, caractérisé en ce qu’il comprend des étapes préliminaires de :9. Method according to any one of the preceding claims, characterized in that it comprises preliminary stages of: • transformation du document original en un document XML conforme aux règles d’accessibilité et au contenu du document original ;• transformation of the original document into an XML document in accordance with the accessibility rules and the content of the original document; • association à chaque type de balise des caractéristiques graphiques en adéquation avec le graphisme du document original afin de former le contenu équivalent ; et, en parallèle, • génération de vignettes images de chaque page, ou groupe de pages ; et • synthèse de l’ensemble pour former le document structuré.• association with each type of tag of graphic characteristics in line with the graphics of the original document in order to form equivalent content; and, in parallel, • generation of image thumbnails of each page, or group of pages; and • synthesis of the whole to form the structured document. 10. Produit programme d’ordinateur téléchargeable depuis un réseau de communication ou enregistré sur un support lisible par ordinateur et exécutable par un processeur, caractérisé en ce qu’il comprend des instructions de code de programme pour la mise en œuvre du procédé selon l’une au moins des revendications 1 à 9.10. Product computer program downloadable from a communication network or recorded on a computer-readable medium and executable by a processor, characterized in that it includes program code instructions for implementing the method according to at least one of claims 1 to 9.
FR1851546A 2018-02-22 2018-02-22 PROCESS FOR VISUALIZING A STRUCTURED DOCUMENT BY A WEB BROWSER AND ASSOCIATED PROGRAM Active FR3078180B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1851546A FR3078180B1 (en) 2018-02-22 2018-02-22 PROCESS FOR VISUALIZING A STRUCTURED DOCUMENT BY A WEB BROWSER AND ASSOCIATED PROGRAM

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1851546A FR3078180B1 (en) 2018-02-22 2018-02-22 PROCESS FOR VISUALIZING A STRUCTURED DOCUMENT BY A WEB BROWSER AND ASSOCIATED PROGRAM
FR1851546 2018-02-22

Publications (2)

Publication Number Publication Date
FR3078180A1 true FR3078180A1 (en) 2019-08-23
FR3078180B1 FR3078180B1 (en) 2021-05-28

Family

ID=63294286

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1851546A Active FR3078180B1 (en) 2018-02-22 2018-02-22 PROCESS FOR VISUALIZING A STRUCTURED DOCUMENT BY A WEB BROWSER AND ASSOCIATED PROGRAM

Country Status (1)

Country Link
FR (1) FR3078180B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051505A (en) * 2021-03-24 2021-06-29 北京百度网讯科技有限公司 Document display method and device and electronic equipment

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020124025A1 (en) * 2001-03-01 2002-09-05 International Business Machines Corporataion Scanning and outputting textual information in web page images
KR100858103B1 (en) * 2008-02-18 2008-09-11 유니닥스주식회사 Template-based pdf publishing system for web contents
KR101243057B1 (en) * 2012-11-23 2013-03-26 한국과학기술정보연구원 An automated input system and method for producing xml full-text of journal articles
US9727293B1 (en) * 2010-12-21 2017-08-08 Amazon Technologies, Inc. Method and apparatus for paginating electronic documents

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020124025A1 (en) * 2001-03-01 2002-09-05 International Business Machines Corporataion Scanning and outputting textual information in web page images
KR100858103B1 (en) * 2008-02-18 2008-09-11 유니닥스주식회사 Template-based pdf publishing system for web contents
US9727293B1 (en) * 2010-12-21 2017-08-08 Amazon Technologies, Inc. Method and apparatus for paginating electronic documents
KR101243057B1 (en) * 2012-11-23 2013-03-26 한국과학기술정보연구원 An automated input system and method for producing xml full-text of journal articles

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051505A (en) * 2021-03-24 2021-06-29 北京百度网讯科技有限公司 Document display method and device and electronic equipment

Also Published As

Publication number Publication date
FR3078180B1 (en) 2021-05-28

Similar Documents

Publication Publication Date Title
US20210279274A1 (en) Systems and Methods of Building and Using an Image Catalog
US20170364526A1 (en) Systems and Methods for Remote Replay of User Interaction with a Webpage
US9569557B2 (en) Cache management in HTML eReading application
US20090044128A1 (en) Adaptive publishing of content
US9971846B1 (en) Online information system with continuous scrolling and user-controlled content
RU2487400C2 (en) High-precision display of documents in browsing clients
US7840650B2 (en) Sharing of digital media on a network
US8924251B2 (en) Systems and methods for providing one or more pages from an electronic document
US9026900B1 (en) Invisible overlay for dynamic annotation
US20090313574A1 (en) Mobile document viewer
EP1680754B1 (en) Method and system for delivering documents to terminals with limited display capabilities, such as mobile terminals
US10289747B2 (en) Dynamic file concatenation
US10630755B2 (en) Selective consumption of web page data over a data-limited connection
US9667696B2 (en) Low latency web-based DICOM viewer system
FR2980605A1 (en) METHOD FOR RETRIEVING A REPRESENTATION OF A ANNOTATED WEB DOCUMENT, COMPUTER PROGRAM AND ELECTRONIC DEVICE THEREFOR
US9696900B2 (en) System and method for creation and management of digital photo book
US20130031464A1 (en) System and computer-implemented method for incorporating an image into a page of content for transmission over a telecommunications network
TWI409694B (en) Information display device
WO2010063070A1 (en) Method and system for displaying data on a mobile terminal
US20080165207A1 (en) Method and System for Manipulating Graphical Images
FR3078180A1 (en) METHOD OF VISUALIZING A STRUCTURED DOCUMENT BY A WEB BROWSER AND ASSOCIATED PROGRAM
CN113094194A (en) Clipboard information processing method and device
CA3157533A1 (en) Computer based unitary workspace leveraging multiple filetype toggling for dynamic content creation
US20150089559A1 (en) Method and system for managing display of web-based content on portable communication devices
CN114528510A (en) Webpage data processing method and device, electronic equipment and medium

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 2

PLSC Publication of the preliminary search report

Effective date: 20190823

PLFP Fee payment

Year of fee payment: 3

PLFP Fee payment

Year of fee payment: 4

TP Transmission of property

Owner name: DOCAXESS, FR

Effective date: 20220217

PLFP Fee payment

Year of fee payment: 5

PLFP Fee payment

Year of fee payment: 6

PLFP Fee payment

Year of fee payment: 7