WO2002050708A1 - Procede pour diviser des documents structures en plusieurs parties - Google Patents

Procede pour diviser des documents structures en plusieurs parties Download PDF

Info

Publication number
WO2002050708A1
WO2002050708A1 PCT/FR2001/004008 FR0104008W WO0250708A1 WO 2002050708 A1 WO2002050708 A1 WO 2002050708A1 FR 0104008 W FR0104008 W FR 0104008W WO 0250708 A1 WO0250708 A1 WO 0250708A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
document
main
transmitted
secondary part
Prior art date
Application number
PCT/FR2001/004008
Other languages
English (en)
Inventor
Claude Seyrat
Cédric Thienot
Original Assignee
Expway
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Expway filed Critical Expway
Priority to EP01271587A priority Critical patent/EP1344151A1/fr
Priority to AU2002219311A priority patent/AU2002219311A1/en
Priority to JP2002551735A priority patent/JP4145144B2/ja
Priority to US10/451,473 priority patent/US7275060B2/en
Publication of WO2002050708A1 publication Critical patent/WO2002050708A1/fr
Priority to US11/800,550 priority patent/US20070277096A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

Ce procédé s'applique à un document structuré (D) présentant une structure hiérarchique définie par un schéma de structure, et regroupant un ensemble d'informations principal (1) incluant des sous-ensembles d'informations (1.1, 1.2, 1.3, ..., 1.2.2.2), qui eux-mêmes peuvent inclure des sous-ensembles d'informations de plus bas niveau hiérarchique, chaque sous-ensemble d'informations étant associé à un type d'informations respectif. Ce procédé comprend les étapes consistant à diviser le document en parties (P1, P2, P3) manipulables séparément, à savoir une partie principale (P1) et au moins une partie secondaire (P2, P3), la partie principale contenant au moins l'ensemble d'informations principal (1), et la partie secondaire contenant un sous-ensemble d'informations (1.2.1, 1.2.2) qui est retiré de l'ensemble d'informations principal, chaque partie secondaire étant rattachée à la partie principale ou à une autre partie secondaire, et attribuer une valeur prédéfinie au type d'informations de chaque sous-ensemble d'informations (1.2.1, 1.2.2) retiré d'un ensemble d'informations de niveau hiérarchique supérieur (1.2).

Description

PROCEDE POUR DIVISER DES DOCUMENTS STRUCTURES EN PLUSIEURS PARTIES.
La présente invention concerne un procédé permettant de diviser des documents structurés en plusieurs parties.
Elle s'applique notamment, mais non exclusivement, à la manipulation, à la transmission, au stockage et à la lecture de documents structurés multimédia, d'images ou de séquences d'images vidéo ou numériques, des œuvres cinématographiques ou des programmes vidéo, et plus généralement à tout transfert de tels documents entre unités de traitements interconnectées par des réseaux de transmission de données, ou entre une unité de traitement et une unité de stockage, ou encore entre une unité de traitement et une unité de reproduction telle qu'un poste de télévision dans le cas de programmes vidéo.
De plus en plus fréquemment, les documents ainsi manipulés et transmis contiennent plusieurs types d'informations intégrées dans une structure.
Un document structuré est une collection d'ensembles d'informations associés chacun à un type et des attributs, et composés entre eux selon des relations principalement hiérarchiques. Ces documents emploient un langage de structuration tel que SGML, HTML, XML, permettant notamment de distinguer les différents sous-ensembles d'informations composant le document. Par opposition, dans un document dit linéaire, les informations de contenu du document sont mélangées aux informations de présentation et de typage.
Un document structuré inclut des repères de séparation des différents ensembles d'informations du document. Dans le cas des formats SGML, XML ou HTML, ces repères appelés "balises" sont de la forme "<XXXX>" et "</XXXX>", le premier repère indiquant le début d'un ensemble d'informations "XXXX" et le second la fin de cet ensemble. Un ensemble d'informations peut être composé de plusieurs ensembles d'informations de plus bas niveau. Ainsi, un document structuré présente un schéma de structure hiérarchique ou arborescente, chaque nœud représentant un ensemble d'informations et étant relié à un nœud de niveau hiérarchique supérieur représentant un ensemble d'informations qui contient les ensembles d'informations de niveau inférieur. Les nœuds situés en bout de branche de cette structure arborescente représentent des ensembles d'informations contenant des données d'un type prédéfini, qui ne peuvent pas être décomposées en sous-ensembles d'informations.
Ainsi, un document structuré contient des repères de séparation représentés sous la forme de données textuelles ou binaires, ces repères délimitant des ensembles ou sous-ensembles d'informations pouvant eux-mêmes contenir d'autres sous- ensembles d'informations délimités par des repères.
Un document structuré est associé à ce qu'on appelle un schéma de structure définissant sous la forme de règles la structure et le type d'information de chaque ensemble d'informations du document. Un schéma est constitué de groupes imbriqués de structures d'ensembles d'informations, ces groupes pouvant être des séquences ordonnées, des groupes d'éléments alternatifs ou des groupes d'éléments nécessaires, ordonnés ou non ordonnés.
A l'heure actuelle, lorsqu'un document structuré doit être transmis, il est préalablement compressé, de manière à minimiser le volume des données à transmettre. Pour une plus grande efficacité d'un tel traitement de compression, les données de structuration du document sont également compressées, sachant que le destinataire du document est sensé connaître au préalable le schéma de structure du document et peut utiliser le schéma de structure pour déterminer à chaque instant quel ensemble d'informations il va recevoir. Il est donc indispensable que la structure du document transmis corresponde exactement au schéma de structure que le destinataire du document envisage d'utiliser pour la réception et le décodage du document, faute de quoi, le destinataire ne peut pas déterminer le type des données transmises notamment, et donc est incapable de les décoder et de reconstituer le document d'origine.
Or les documents structurés à transmettre ont tendance à devenir de plus en plus volumineux. On envisage par exemple de transmettre ou diffuser de cette manière des descriptions complètes d'œuvres cinématographiques ou de programmes de télévision.
Dans ce contexte, si une erreur de transmission survient durant la transmission d'un document, le destinataire du document peut ne plus être en mesure de déterminer quel sous-ensemble est en cours de transmission, si bien que l'ensemble du document doit à nouveau être transmis. En outre, si l'on souhaite transmettre et simultanément afficher sur un écran une séquence cinématographique, il peut être nécessaire de respecter des plages horaires de transmission des différents éléments de la séquence. Certains éléments de la séquence doivent en outre pouvoir être transmis plusieurs fois pour permettre à un destinataire qui n'était pas connecté au début de la transmission de la séquence, de recevoir et afficher la fin de celle-ci.
Il peut être également nécessaire de remplacer une partie de document par une autre, ces deux parties ayant le même schéma de structure.
La solution consistant à retransmettre l'ensemble du document conduirait à augmenter considérablement le volume des informations à transmettre. Il est donc souhaitable de pouvoir diviser un document en plusieurs parties qui sont transmises séparément. Il s'avère que les procédés de transmission actuels ne permettent pas de transmettre partiellement un document.
La présente invention a pour but de supprimer cet inconvénient. Cet objectif est atteint par la prévision d'un procédé pour diviser un document structuré présentant une structure hiérarchique définie par un schéma de structure, ce document regroupant un ensemble d'informations principal incluant des sous- ensembles d'informations, au moins une partie des sous-ensembles d'informations pouvant inclure des sous-ensembles d'informations de plus bas niveau hiérarchique, chaque sous-ensemble d'informations étant associé à un type d'informations respectif.
Selon l'invention, ce procédé comprend les étapes consistant à :
- diviser le document en parties manipulables séparément, à savoir une partie principale et au moins une partie secondaire, la partie principale contenant au moins l'ensemble d'informations principal, et la partie secondaire contenant un sous-ensemble d'informations qui est retiré de l'ensemble d'informations principal, chaque partie secondaire étant rattachée à la partie principale ou à une autre partie secondaire, et
- attribuer une valeur prédéfinie au type d'informations de chaque sous- ensemble d'informations retiré d'un ensemble d'informations de niveau hiérarchique supérieur.
De cette manière, chaque partie est compréhensible en elle-même et peut être décodée, et ce quel que soit le découpage choisi. En outre, lorsqu'une telle partie est transmise et que la transmission échoue, le reste du document reste valide et la partie non transmise correctement peut être retransmise sans avoir besoin de retransmettre l'ensemble du document. Par ailleurs, il n'est pas nécessaire de disposer des parties principales et secondaires en amont d'une partie pour pouvoir décoder cette dernière, puisque chaque partie est valide et compréhensible en elle-même. Grâce à ces dispositions, un document transmis peut être enrichi et modifié au cours du temps.
Avantageusement, le document comprend un entête qui est inséré dans chaque partie, cet entête comprenant un indicateur dont la valeur indique si le document est complet ou non.
Selon une particularité de l'invention, chaque partie comprend un entête comportant une information donnant l'emplacement de la partie dans la structure hiérarchique du document.
Ladite information d'emplacement de la partie secondaire dans la structure hiérarchique du document décrit avantageusement un chemin dans cette structure, définissant la position de la partie secondaire dans le document.
Ledit chemin peut être défini d'une manière absolue par rapport à l'ensemble principal d'informations du document. Il peut également être défini d'une manière relative par rapport à la position d'une dernière partie secondaire transmise.
Alternativement, chaque type d'informations affecté à la valeur prédéfinie est suivi d'une référence à la partie secondaire contenant le sous-ensemble d'informations associé au type d'informations, ladite information d'emplacement de la partie secondaire dans la structure hiérarchique du document étant la référence de ladite partie secondaire.
Ce procédé peut en outre comprendre la transmission de plusieurs parties du document associées au même emplacement dans la structure. Dans ce cas, la dernière partie transmise remplace la précédente qui est associée au même emplacement.
On peut prévoir également que l'entête de chaque partie comprend une information précisant un mode de traitement de la partie par rapport à une partie associée au même emplacement dans la structure.
Le document structuré est par exemple de type SGML, XML ou HTML.
Un mode de réalisation préféré de l'invention sera décrit ci-après, à titre d'exemple non limitatif, avec référence aux dessins annexés dans lesquels : La figure 1 représente une structure arborescente dont chaque nœud symbolise un ensemble ou sous-ensemble d'informations d'un document structuré qui est normalement transmis en une seule fois ;
La figure 2 montre le document structuré représenté sur la figure 1 découpé en plusieurs parties, chacune pouvant être transmise séparément selon l'invention ;
La figure 3 montre plus en détail la structure des informations contenues dans un document structuré ;
La figure 4 représente une autre structure arborescente illustrant une méthode de définition de la position d'une partie de la structure, transmise séparément du reste de la structure.
La figure 1 représente une structure arborescente comprenant un nœud racine 1 décomposé en trois nœuds de rang inférieur, dont le premier nœud 1.1 n'est pas décomposé en nœuds de rang inférieur, le second nœud 1.2 se compose de deux nœuds 1.2.1 et 1.2.2 et le troisième nœud 1.3 se compose d'un seul nœud 1.3.1. Les deux nœuds 1.2.1 et 1.2.2 du second nœud 1.2 sont rattachés respectivement à un 1.2.1.1 et deux nœuds 1.2.2.1 et 1.2.2.2 de rang inférieur.
Cette structure représente un document structuré D comprenant un entête H dans lequel sont définis un certain nombre de paramètres définissant le format de codage et de représentation du document, et un corps principal B rassemblant les informations et ensembles d'informations constituant le document.
Selon l'invention, un document structuré peut être transmis en plusieurs parties séparées PI, P2, P3, à savoir une partie principale et des parties secondaires P2, P3 qui sont rattachées à la partie principale (figure 2). Une telle transmission est effectuée de préférence après compression d'une manière appropriée de chaque partie à transmettre séparément. Chaque partie de document qu'elle soit compressée ou non comprend un entête H, H2, H3 et un corps principal Bl, B2, B3. Comme représenté sur la figure 3, un corps principal B de document comprend un entête de données DH et un ou plusieurs corps de données DB rassemblant chacun les informations d'un sous-ensemble d'informations du document. L'entête de données DH peut comprendre un champ K permettant de supprimer toute ambiguïté au moment du décodage du document, en donnant notamment un numéro permettant de définir l'ensemble d'informations qui suit, et/ou un champ contenant le nombre N d'occurrences du corps de données DB. Selon le format utilisé, chaque corps de données DB peut comprendre un champ T indiquant le type d'informations qu'il contient, un champ L donnant la longueur de ces informations en nombre de bits ou d'octets, un champ A rassemblant des attributs du sous-ensemble d'informations et un champ Val contenant la valeur ou le contenu du sous-ensemble d'informations. Comme le document est structuré sous une forme arborescente, le champ Val peut lui-même contenir un champ d'entêté de données DH et un ou plusieurs champs contenant un corps de données DB.
Il est à noter à ce sujet que dans le schéma de structure représenté sur la figure 1, les informations contenues dans le document sont rassemblées dans les nœuds 1.1, 1.2.1.1, 1.2.2.1, 1.2.2.2 et 1.3.1 situés aux extrémités des branches, ainsi que dans les champs attribut A des sous-ensembles symbolisés par tous les nœuds du document.
Selon l'invention, lorsque l'on souhaite transmettre partiellement un tel document qu'il soit préalablement compressé ou non, le champ T contenant le type d'information d'un corps de données DB non transmis ou retiré du document, reçoit une valeur prédéfinie indiquant que le sous-ensemble d'informations qui suit n'est pas transmis. Cette valeur particulière prédéfinie de type d'information est par exemple choisie égale à 0 dans le cas d'un document sous forme compressée, les valeurs des autres types d'information étant différentes de 0. Si cette valeur prédéfinie apparaît dans le document transmis, le champ longueur L et les champs A et Val qui suivent normalement le type d'information, n'apparaissent pas dans les données transmises. Par conséquent, à la suite d'un type d'information égal à la valeur prédéfinie, on trouve l'entête DH de l'ensemble d'informations suivant dans le document ou un indicateur de fin de document.
On peut prévoir d'ajouter à l'entête H du document un paramètre indiquant si le document est totalement transmis ou non, de manière à indiquer au destinataire du document si le document qu'il est en train de recevoir est transmis entièrement ou non.
Les parties PI, P2 et P3 peuvent être transmises séparément une ou plusieurs fois. Elles ont à cet effet un entête H, H2, H3 comprenant tout d'abord un paramètre indiquant que le document n'est pas complet, suivi d'une définition de l'emplacement de la partie transmise dans la structure arborescente du document complet.
De cette manière, un document structuré peut être enrichi et modifié au cours du temps.
Il est à noter que la transmission de la partie principale PI n'est pas nécessaire puisque, grâce à la définition de l'emplacement figurant dans l'entête des parties secondaires, l'unité de traitement qui reçoit les parties secondaires transmises peut déterminer l'emplacement de la partie reçue dans la structure du document et ainsi décoder celle-ci. En outre, le découpage du document peut être réalisé de manière à ce que la partie principale ne contienne aucune donnée utile, et à ce que l'ensemble du document puisse être reconstitué à partir des parties secondaires et de leur emplacement dans la structure du document.
En outre, l'entête H, H2, H3 des parties PI, P2, P3 peut comprendre une information précisant un mode de traitement de la partie par rapport à une partie déjà transmise associée au même emplacement dans la structure, à savoir par exemple, si la partie transmise doit remplacer une partie associée au même emplacement, qui a déjà été transmise, ou ne pas être prise en compte si elle figure déjà dans le document reçu, ou encore être fusionnée à la partie associée au même emplacement, qui a déjà été transmise.
Comme illustré sur la figure 4, cette définition d'emplacement peut comprendre le nom de tous les nœuds supérieurs jusqu'au nœud racine R, éventuellement associés à un numéro d'ordre par rapport au nœud supérieur. Par exemple, le premier nœud du premier nœud du troisième nœud du premier nœud rattaché au nœud racine (repéré sur la figure 4 par une succession de flèches issues du nœud racine R) peut être référencé de la manière suivante : /c/a[last]/b(l)/d
Cette notation indique qu'il s'agit du nœud de type "d" relié au premier nœud de type "b" relié au dernier nœud de type "a" relié au nœud de type "c" qui est relié directement au nœud racine R. D'autres parties du document peuvent être ensuite transmises soit en utilisant la méthode de définition absolue (par rapport au nœud racine R) décrite ci-dessus, ou bien, avantageusement, en utilisant une méthode de définition relative. Ainsi, par exemple, le troisième nœud relié au même nœud immédiatement supérieur que le nœud précédent peut être référencé de la manière suivante :
../e[2]
Cette notation indique que l'on fait référence au second nœud qui doit être de type "e" relié au même nœud de niveau immédiatement supérieur référencé par la notation ".7". Il apparaît que cette seconde méthode est plus compacte que la première.
Alternativement, la définition de l'emplacement de la partie de document transmise P2, P3 peut simplement comprendre une référence à la partie de document, cette référence ayant été au préalable transmise dans la partie principale PI du document, par exemple à la suite de la valeur prédéfinie indiquant que le sous-ensemble d'informations qui suit n'est pas transmis.
De préférence, le document ou les parties PI, P2, P3 de document à transmettre sont préalablement compressées. A cet effet, on distingue avantageusement dans chaque partie de document, les informations de structure et les informations de contenu, certaines parties de document pouvant ne comprendre aucune information de contenu. Ainsi dans l'exemple des figures 2 et 3, les informations de structure sont constituées par tous les champs à l'exception des champs valeur Val, lorsque ceux-ci ne sont pas structurés, c'est-à-dire ne sont pas décomposables en sous-ensembles d'informations structurés. Dans l'exemple de la figure 2, il s'agit des champs Val des sous-ensembles d'informations 1.1, 1.2.1.1, 1.2.2.1, 1.2.2.2, et 1.3.1, situés aux extrémités inférieures des branches de la structure arborescente du document.
Le traitement de compression proprement dit consiste par exemple à lire séquentiellement la partie de document à compresser, à appliquer un algorithme de compression approprié pour traiter les informations de structure et à appliquer un algorithme de compression adapté au type d'informations lorsqu'un champ Val non décomposable apparaît durant la lecture de la partie de document. Il est à noter que dans le document ou la partie de document compressé les informations de structure et les informations de contenu apparaissent dans le même ordre que dans le document d'origine non compressé. On peut également bien appliquer un algorithme de compression statistique, tel que Zip.

Claims

REVENDICATIONS
1. Procédé pour diviser un document structuré (D) présentant une structure hiérarchique définie par un schéma de structure, ce document regroupant un ensemble d'informations principal (1) structuré, incluant des sous-ensembles d'informations (1.1, 1.2, 1.3, ..., 1.2.2.2), au moins une partie des sous-ensembles d'informations étant structuré et pouvant inclure des sous- ensembles d'informations de plus bas niveau hiérarchique, chaque sous- ensemble d'informations étant associé dans l'ensemble d'informations de niveau supérieur à un type d'informations (T) respectif, caractérisé en ce qu'il comprend les étapes consistant à :
- diviser le document en parties (PI, P2, P3) structurées manipulables individuellement, à savoir une partie principale (PI) et au moins une partie secondaire (P2, P3), la partie principale contenant au moins l'ensemble d'informations principal (1), et la partie secondaire contenant un sous- ensemble d'informations (1.2.1, 1.2.2) qui est retiré de l'ensemble d'informations principal, chaque partie secondaire étant rattachée à la partie principale ou à une autre partie secondaire, et
- attribuer dans les ensembles d'information (1.2) dans lequel on a retiré au moins un sous-ensemble d'informations une valeur prédéfinie au type d'informations (T) de chaque sous-ensemble d'informations (1.2.1, 1.2.2) retiré .
2. Procédé selon la revendication 1, caractérisé en ce que le document (D) comprend un entête (H) qui est inséré dans chaque partie (PI, P2, P3) retirée du document, cet entête comprenant un indicateur dont la valeur indique si le document est complet ou non.
3. Procédé selon la revendication 1 ou 2, caractérisé en ce que chaque partie (PI, P2, P3) retirée du document comprend un entête (H, H2, H3) comportant une information donnant l'emplacement de la partie dans la structure hiérarchique du document.
4. Procédé selon la revendication 3, caractérisé en ce que ladite information d'emplacement de la partie secondaire dans la structure hiérarchique du document décrit un chemin dans cette structure, définissant la position de la partie secondaire dans le document.
5. Procédé selon la revendication 4, caractérisé en ce que ledit chemin est défini d'une manière absolue par rapport à l'ensemble principal d'informations du document.
6. Procédé selon la revendication 4, caractérisé en ce que chaque partie secondaire retirée du document principal étant transmise séparément de la partie principale du document, ledit chemin est défini d'une manière relative par rapport à la position d'une dernière partie secondaire transmise.
7. Procédé selon la revendication 3, caractérisé en ce que chaque type d'informations (T) affecté à la valeur prédéfinie, apparaissant dans un ensemble d'informations, est suivi d'une référence à la partie secondaire (P2, P3) contenant le sous-ensemble d'informations retiré de l'ensemble d'informations, ladite information d'emplacement de la partie secondaire dans la structure hiérarchique du document étant la référence de ladite partie secondaire.
8. Procédé selon l'une des revendications 1 à 7, caractérisé en ce qu'il comprend en outre la transmission de plusieurs parties du document associées au même emplacement dans la structure, la dernière partie transmise remplaçant la partie du document précédemment transmise, associée au même emplacement dans la structure.
9. Procédé selon l'une des revendications 1 à 7, caractérisé en ce qu'il comprend en outre la transmission de plusieurs parties du document associées au même emplacement dans la structure, l'entête de chaque partie comprenant une information indiquant le mode de traitement de la partie par rapport à une partie déjà transmise associée au même emplacement dans la structure.
10. Procédé selon l'une des revendications 1 à 9, caractérisé en ce que la partie principale et les parties secondaires retirées de la partie principale sont compressées, puis transmises séparément.
11. Procédé selon la revendication 10, caractérisé en ce que chaque ensemble et sous-ensemble d'informations comprenant des informations de structure et des informations de contenu, les informations de structure sont compressées à l'aide d'un algorithme de compression d'informations de structure, et les informations de contenu sont compressées à l'aide d'un algorithme adapté au type d'informations (T) de contenu, les informations de structure et de contenu apparaissant dans la partie de document compressée dans le même ordre que dans la partie de document correspondante non compressée.
12. Procédé selon l'une des revendications 1 à 11, caractérisé en ce que le document est de type SGML, XML ou HTML.
PCT/FR2001/004008 2000-12-18 2001-12-14 Procede pour diviser des documents structures en plusieurs parties WO2002050708A1 (fr)

Priority Applications (5)

Application Number Priority Date Filing Date Title
EP01271587A EP1344151A1 (fr) 2000-12-18 2001-12-14 Procede pour diviser des documents structures en plusieurs parties
AU2002219311A AU2002219311A1 (en) 2000-12-18 2001-12-14 Method for dividing structured documents into several parts
JP2002551735A JP4145144B2 (ja) 2000-12-18 2001-12-14 構造化文書をいくつかの部分に分割する方法
US10/451,473 US7275060B2 (en) 2000-12-18 2001-12-14 Method for dividing structured documents into several parts
US11/800,550 US20070277096A1 (en) 2000-12-18 2007-05-04 Method of dividing structured documents into several parts

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0016507A FR2818409B1 (fr) 2000-12-18 2000-12-18 Procede pour diviser des documents structures en plusieurs parties
FR00/16507 2000-12-18

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US11/800,550 Division US20070277096A1 (en) 2000-12-18 2007-05-04 Method of dividing structured documents into several parts

Publications (1)

Publication Number Publication Date
WO2002050708A1 true WO2002050708A1 (fr) 2002-06-27

Family

ID=8857802

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2001/004008 WO2002050708A1 (fr) 2000-12-18 2001-12-14 Procede pour diviser des documents structures en plusieurs parties

Country Status (6)

Country Link
US (2) US7275060B2 (fr)
EP (1) EP1344151A1 (fr)
JP (1) JP4145144B2 (fr)
AU (1) AU2002219311A1 (fr)
FR (1) FR2818409B1 (fr)
WO (1) WO2002050708A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8111694B2 (en) 2005-03-23 2012-02-07 Nokia Corporation Implicit signaling for split-toi for service guide

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3944014B2 (ja) * 2002-07-09 2007-07-11 株式会社東芝 文書編集方法、文書編集システム及び文書処理プログラム
US7838430B2 (en) * 2003-10-28 2010-11-23 Applied Materials, Inc. Plasma control using dual cathode frequency mixing
US7464330B2 (en) * 2003-12-09 2008-12-09 Microsoft Corporation Context-free document portions with alternate formats
US7383500B2 (en) * 2004-04-30 2008-06-03 Microsoft Corporation Methods and systems for building packages that contain pre-paginated documents
US7549118B2 (en) * 2004-04-30 2009-06-16 Microsoft Corporation Methods and systems for defining documents with selectable and/or sequenceable parts
US8661332B2 (en) * 2004-04-30 2014-02-25 Microsoft Corporation Method and apparatus for document processing
US7359902B2 (en) * 2004-04-30 2008-04-15 Microsoft Corporation Method and apparatus for maintaining relationships between parts in a package
US7418652B2 (en) * 2004-04-30 2008-08-26 Microsoft Corporation Method and apparatus for interleaving parts of a document
US8363232B2 (en) * 2004-05-03 2013-01-29 Microsoft Corporation Strategies for simultaneous peripheral operations on-line using hierarchically structured job information
US7755786B2 (en) 2004-05-03 2010-07-13 Microsoft Corporation Systems and methods for support of various processing capabilities
US8243317B2 (en) * 2004-05-03 2012-08-14 Microsoft Corporation Hierarchical arrangement for spooling job data
US7580948B2 (en) * 2004-05-03 2009-08-25 Microsoft Corporation Spooling strategies using structured job information
US7519899B2 (en) 2004-05-03 2009-04-14 Microsoft Corporation Planar mapping of graphical elements
US7617450B2 (en) * 2004-09-30 2009-11-10 Microsoft Corporation Method, system, and computer-readable medium for creating, inserting, and reusing document parts in an electronic document
US7584111B2 (en) * 2004-11-19 2009-09-01 Microsoft Corporation Time polynomial Arrow-Debreu market equilibrium
US7617451B2 (en) * 2004-12-20 2009-11-10 Microsoft Corporation Structuring data for word processing documents
US7617229B2 (en) * 2004-12-20 2009-11-10 Microsoft Corporation Management and use of data in a computer-generated document
US20060136816A1 (en) * 2004-12-20 2006-06-22 Microsoft Corporation File formats, methods, and computer program products for representing documents
US7770180B2 (en) * 2004-12-21 2010-08-03 Microsoft Corporation Exposing embedded data in a computer-generated document
US7752632B2 (en) * 2004-12-21 2010-07-06 Microsoft Corporation Method and system for exposing nested data in a computer-generated document in a transparent manner
US20070022128A1 (en) * 2005-06-03 2007-01-25 Microsoft Corporation Structuring data for spreadsheet documents
US20060277452A1 (en) * 2005-06-03 2006-12-07 Microsoft Corporation Structuring data for presentation documents
US8176414B1 (en) * 2005-09-30 2012-05-08 Google Inc. Document division method and system
WO2007038844A1 (fr) * 2005-10-06 2007-04-12 Smart Internet Technology Crc Pty Ltd Procedes et systemes pour faciliter l'acces a un schema
JP5570202B2 (ja) * 2009-12-16 2014-08-13 キヤノン株式会社 構造化文書解析装置、構造化文書解析方法、及びコンピュータプログラム
JP5480034B2 (ja) 2010-06-24 2014-04-23 インターナショナル・ビジネス・マシーンズ・コーポレーション 構造化文書の木構造を分割するための方法、プログラムおよびシステム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997034240A1 (fr) * 1996-03-15 1997-09-18 University Of Massachusetts Arbre compact pour le stockage et l'extraction de documents structures hypermedia
EP0928070A2 (fr) * 1997-12-29 1999-07-07 Unwired Planet, Inc. Compression de documents HTML préservant la structure syntaxique
US6119123A (en) * 1997-12-02 2000-09-12 U.S. Philips Corporation Apparatus and method for optimizing keyframe and blob retrieval and storage

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5142689A (en) * 1982-09-27 1992-08-25 Siemens Nixdort Informationssysteme Ag Process for the preparation of the connection of one of several data processor devices to a centrally synchronized multiple line system
JPH08255155A (ja) * 1995-03-16 1996-10-01 Fuji Xerox Co Ltd 全文登録語検索装置および方法
JP3724847B2 (ja) * 1995-06-05 2005-12-07 株式会社日立製作所 構造化文書差分抽出方法および装置
US6061697A (en) * 1996-09-11 2000-05-09 Fujitsu Limited SGML type document managing apparatus and managing method
JPH10143403A (ja) * 1996-11-12 1998-05-29 Fujitsu Ltd 情報管理装置および情報管理プログラム記憶媒体
US6021202A (en) * 1996-12-20 2000-02-01 Financial Services Technology Consortium Method and system for processing electronic documents
JPH1185750A (ja) * 1997-07-08 1999-03-30 Hitachi Ltd 構造化文書処理方法および装置および構造化文書処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3657424B2 (ja) * 1998-03-20 2005-06-08 松下電器産業株式会社 番組情報を放送するセンター装置と端末装置
US6304578B1 (en) * 1998-05-01 2001-10-16 Lucent Technologies Inc. Packet routing and queuing at the headend of shared data channel
JP2000083059A (ja) * 1998-07-06 2000-03-21 Jisedai Joho Hoso System Kenkyusho:Kk インデックス情報配信方法,インデックス情報配信装置,検索装置およびそれらの装置の各手段としてコンピュ―タを機能させるためのプログラムを記録したコンピュ―タ読み取り可能な記録媒体
JP3460597B2 (ja) * 1998-09-22 2003-10-27 日本電気株式会社 複合文書管理システム及び複合文書の構造管理方法ならびに複合文書構造管理プログラムを格納した記録媒体
JP4003854B2 (ja) * 1998-09-28 2007-11-07 富士通株式会社 データ圧縮装置及び復元装置並びにその方法
CA2255047A1 (fr) * 1998-11-30 2000-05-30 Ibm Canada Limited-Ibm Canada Limitee Comparaison de structures hierarchiques et integration des differences
JP4141556B2 (ja) * 1998-12-18 2008-08-27 株式会社日立製作所 構造化文書管理方法及びその実施装置並びにその処理プログラムを記録した媒体
US6311187B1 (en) * 1998-12-29 2001-10-30 Sun Microsystems, Inc. Propogating updates efficiently in hierarchically structured data under a push model
US6377957B1 (en) * 1998-12-29 2002-04-23 Sun Microsystems, Inc. Propogating updates efficiently in hierarchically structured date
US6635089B1 (en) * 1999-01-13 2003-10-21 International Business Machines Corporation Method for producing composite XML document object model trees using dynamic data retrievals
JP2000224257A (ja) * 1999-01-29 2000-08-11 Jisedai Joho Hoso System Kenkyusho:Kk 送信装置および受信装置
TW428146B (en) * 1999-05-05 2001-04-01 Inventec Corp Data file updating method by increment
US6671853B1 (en) * 1999-07-15 2003-12-30 International Business Machines Corporation Method and system for selectively streaming markup language documents
US6996770B1 (en) * 1999-07-26 2006-02-07 Microsoft Corporation Methods and systems for preparing extensible markup language (XML) documents and for responding to XML requests
US6966027B1 (en) * 1999-10-04 2005-11-15 Koninklijke Philips Electronics N.V. Method and apparatus for streaming XML content
GB2363217B (en) * 2000-06-06 2002-05-08 Oracle Corp Data file processing
US6826726B2 (en) * 2000-08-18 2004-11-30 Vaultus Mobile Technologies, Inc. Remote document updating system using XML and DOM
US6850948B1 (en) * 2000-10-30 2005-02-01 Koninklijke Philips Electronics N.V. Method and apparatus for compressing textual documents

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997034240A1 (fr) * 1996-03-15 1997-09-18 University Of Massachusetts Arbre compact pour le stockage et l'extraction de documents structures hypermedia
US6119123A (en) * 1997-12-02 2000-09-12 U.S. Philips Corporation Apparatus and method for optimizing keyframe and blob retrieval and storage
EP0928070A2 (fr) * 1997-12-29 1999-07-07 Unwired Planet, Inc. Compression de documents HTML préservant la structure syntaxique

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LIEFKE H ET AL: "XMILL: AN EFFICIENT COMPRESSOR FOR XML DATA", SIGMOD RECORD, ASSOCIATION FOR COMPUTING MACHINERY, NEW YORK, US, vol. 29, no. 2, June 2000 (2000-06-01), pages 153 - 164, XP001002286 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8111694B2 (en) 2005-03-23 2012-02-07 Nokia Corporation Implicit signaling for split-toi for service guide

Also Published As

Publication number Publication date
US7275060B2 (en) 2007-09-25
FR2818409A1 (fr) 2002-06-21
EP1344151A1 (fr) 2003-09-17
FR2818409B1 (fr) 2003-03-14
US20040054669A1 (en) 2004-03-18
US20070277096A1 (en) 2007-11-29
JP4145144B2 (ja) 2008-09-03
AU2002219311A1 (en) 2002-07-01
JP2004524606A (ja) 2004-08-12

Similar Documents

Publication Publication Date Title
WO2002050708A1 (fr) Procede pour diviser des documents structures en plusieurs parties
FR2844370A1 (fr) Document electronique de description d&#39;un service informatique
EP1358583B1 (fr) Procede de codage et de decodage d&#39;un chemin dans l&#39;arborescence d&#39;un document structure
WO2002063776A2 (fr) Procede de compression/decompression d&#39;un document structure
EP1316220A1 (fr) Procede de compression/decompression de documents structures
EP2015587B1 (fr) Procédé de mémorisation d&#39;un objet multimédia, structure de donnée et terminal associé
FR2945363A1 (fr) Procede et dispositif de codage d&#39;un document structure
US20070226313A1 (en) Method and Device for Recording or Playing Back a Data Stream
FR2924244A1 (fr) Procede et dispositif d&#39;encodage et de decodage d&#39;information
FR2931271A1 (fr) Procede et dispositif de codage d&#39;un document structure et procede et dispositif de decodage d&#39;un document ainsi code
FR2933793A1 (fr) Procedes de codage et de decodage, par referencement, de valeurs dans un document structure, et systemes associes.
EP2234022A1 (fr) Procédé de gestion d&#39;une base de données relationnelle de type SQL
FR2929778A1 (fr) Procedes et dispositifs de codage et de decodage binaire iteratif pour documents de type xml.
FR2930661A1 (fr) Procede d&#39;acces a une partie ou de modification d&#39;une partie d&#39;un document xml binaire, dispositifs associes
FR2853797A1 (fr) Procede et dispositif de pre-traitement de requetes liees a un signal numerique dans une architecture du type client-serveur
WO2017055771A1 (fr) Procédé d&#39;encodage de flux de données vidéo basées sur des groupements d&#39;images (gop)
EP1525663B1 (fr) Compression de donnees numeriques robuste au bruit de transmission
WO2002003245A1 (fr) Procede de stockage d&#39;objets informationnels au format xml dans une base de donnees relationnelle
FR2509553A1 (fr) Procede de diffusion de donnees sur canal de television
WO2008074855A1 (fr) Procede d&#39;envoi de produits multimedia a au moins une unite multimedia, procede de traitement de ces produits multimedia et unite multimedia pour la mise en œuvre de ces procedes
EP2225853B1 (fr) Moniteur de système de communication par messages amélioré
Berkman La littérature algorithmique: frontière entre auteur et lecteur
EP1999649A2 (fr) Procede de generation d&#39;un fichier de description d&#39;un flux binaire, dispositif et produit programme d&#39;ordinateur correspondants
WO2003007615A1 (fr) Methode de protection et de correction d&#39;une information de scene multimedia
WO2001039038A1 (fr) Procede et systeme de prelevement d&#39;information

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ OM PH PL PT RO RU SD SE SG SI SK SL TJ TM TN TR TT TZ UA UG US UZ VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2002551735

Country of ref document: JP

REEP Request for entry into the european phase

Ref document number: 2001271587

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2001271587

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2001271587

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 10451473

Country of ref document: US

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642