FR2811782A1 - Systeme de conversion de documents a structure arborescente par parcours selectif de ladite structure - Google Patents

Systeme de conversion de documents a structure arborescente par parcours selectif de ladite structure Download PDF

Info

Publication number
FR2811782A1
FR2811782A1 FR0009105A FR0009105A FR2811782A1 FR 2811782 A1 FR2811782 A1 FR 2811782A1 FR 0009105 A FR0009105 A FR 0009105A FR 0009105 A FR0009105 A FR 0009105A FR 2811782 A1 FR2811782 A1 FR 2811782A1
Authority
FR
France
Prior art keywords
template
document
procedures
conversion
procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0009105A
Other languages
English (en)
Other versions
FR2811782B1 (fr
Inventor
Pierre Richard
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JAXO EUROP
Original Assignee
JAXO EUROP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JAXO EUROP filed Critical JAXO EUROP
Priority to FR0009105A priority Critical patent/FR2811782B1/fr
Priority to US09/904,170 priority patent/US20020073119A1/en
Publication of FR2811782A1 publication Critical patent/FR2811782A1/fr
Application granted granted Critical
Publication of FR2811782B1 publication Critical patent/FR2811782B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Document Processing Apparatus (AREA)

Abstract

L'invention propose un système de conversion de documents transformant un premier document existant dans un premier format balis e à structure arborescente de noeuds en un second document dans un second format balis e à structure arborescente de noeuds, qui comprend : - des proc edures-gabarits (Template) contenant chacune une première information de s election d'une etendue de parcours de la structure arborescente du premier document, une seconde information de s election d'un type de balise du premier document auquel la proc edure gabarit peut s'appliquer, et un ensemble d'une ou plusieurs actions, au moins certaines proc edures gabarits contenant des actions de collecte d'informations pour le type de balise s electionn e, - un programme contenant des instructions standard (applyTemplates) pour s electivement appeler lesdites proc edures gabarits, - des moyens de traitement r epondant audit programme et aptes, lors de l'appel d'une proc edure-gabarit, à parcourir les noeuds de la structure arborescente inclus dans son etendue s electionn ee, et pour chaque noeud parcouru, à d eterminer si le type de balise correspond à la seconde information de s election et, dans l'affirmative, à exercer la ou les actions correspondantes, et - des moyens aptes, à partir des actions de collecte contenues dans les proc edures-gabarits ex ecut ees, pour construire le second document.

Description

La présente invention concerne d'une façon générale un système et un
procédé de
conversion dynamique et paramétrable d'un ou plusieurs flux de données balisées.
Arrière-plan de l'invention 1. L'Intemrnet et les téléphones portables En matière de communication et d'échanges d'informations, les années 1990 ont témoigné d'innovations technologiques dont les répercussions ont aujourd'hui une étendue mondiale. Deux grandes causes paraissent être à la base de ce phénomène: la montée en puissance de l'Internet d'une part, et la multiplication des appareils
portables " sans fil " -- téléphones, assistants électroniques -- d'autre part.
On peut différentier ces deux causes car elles n'ont eu au départ ni les mêmes origines, ni les mêmes cibles commerciales. L'Internet ressort typiquement du domaine de l'informatique: la population concernée connaît le maniement d'un ordinateur et de ses programmes. Le domaine du " sans fil ", quant à lui, appartient
au le monde de la téléphonie. Il est destiné à une clientèle grand public.
Bien que différentes au départ dans leur conception, leurs méthodes propriétaires et leurs applications, il apparaît aujourd'hui que ces deux techniques de communication électronique vont se rapprocher jusqu'à se confondre. Les consortiums de constructeurs (W3C, WAPforum), les accords réciproques entre les grands industriels de la téléphonie et de l'informatique sont aujourd'hui les premiers jalons
2 5 de cette unification.
Un objectif essentiel de la présente invention est de permettre de produire des
données exploitables par les téléphones portables accédant au réseau Internet.
2. Les langages balisés Le format des données circulant sur l'Internet obéit à des normes précises et internationales qui ont favorisé son essor. Cette normalisation s'applique à toutes les couches participant à l'échange de ces données: la couche de transport TCP/IP (pour " Transmission Control Protocol/Internet Protocol " en terminologie anglosaxonne), le protocole de requête/réponse HTTP (pour " JI4;erText Markup Language " en terminologie anglo-saxone), et finalement le contenu de la réponse elle-même, la page de la Toile (" Web " en terminologie anglosaxonne). Le langage utilisé pour décrire une page de la Toile est de type " balisé ": il comporte ainsi des balises, c'est-à-dire des suites de caractères qui se différencient du texte parce qu'elles sont encadrées par des caractères spéciaux " < " et " > ". La pièce de logiciel qui décode le document balisé s'appelle un analyseur syntaxique (" Parser " en terminologie anglo-saxonne). Les balises créent une véritable hiérarchie au sein du texte, indiquant, par exemple,
qu'il s'agit du titre du 2ème sous-chapitre du 3ème chapitre du corps du document.
C'est par l'analyse de cette hiérarchie que le navigateur de la Toile décide notamment du rendu typographique de chaque portion de texte: titres, paragraphes,
2 0 tableaux, images.
Outre la syntaxe de l'écriture des balises qui permet de les distinguer du texte normal, la hiérarchie des balises fait aussi l'objet de règles: par exemple, un paragraphe ne contient jamais d'autres paragraphes, mais un tableau peut contenir d'autres tableaux. Publiée en 1986, la norme SGML (pour " Standard Generalized Markup Language" en terminologie anglosaxonne) est la première qui définisse la formalisation de ces règles, en particulier en termes de syntaxe d'écriture et de
description des contraintes hiérarchiques. Cette norme SGML donne du langage
balisé une description toutefois purement formelle, sans préciser quelles balises une
application devra utiliser. La norme SGML est " générique ", au sens qu'elle définit les règles communes aux langages de balisage. Mais elle n'est pas, en elle-même, un langage de balisage contrairement à HTML, qui est le langage standard de balisage
des pages de la Toile.
3. Médiocrité du balisage des pages de la Toile Le langage HTML impose qu'une page contienne une suite de balises fixes bien précises (typiquement une centaine ou davantage), les règles du halisage se conformant en théorie aux principes édictés par la norme SGML. Mais dans la pratique, et ce pour des raisons de précédence historique et de complexité de la norme SGML, la majorité des informations existantes sur la Toile entrent en conflit
avec les règles prescrites.
C'est notamment l'absence d'outils de validation qui a permis la prolifération de ces milliards de pages non conformes à la norme SGML, sachant que les concepteurs de ces pages pouvaient librement recourir à des truquages pour arriver à leur objectif premier, à savoir la qualité du rendu typographique obtenu lors de la visualisation des informations. Par exemple, un titre de chapitre au milieu d'un paragraphe permet d'obtenir des caractères gras dans une police de taille plus importante, alors qu'un chapitre au sens de la norme ne peut pas se concevoir comme étant imbriqué dans un paragraphe. Au sens du balisage, c'est une erreur grave, mais les logiciels de
navigation, qui ne sont pas des outils de validation, ne le signalent pas.
Il en résulte qu'aujourd'hui, la majorité des données existantes sur les sites Internet sont vouées à une application unique spécifique qui est leur visualisation sur écran d'ordinateur par le biais des logiciels de navigation standard tels que "Netscape Navigator " ou " Internet Explorer " (marques déposées au nom de leurs titulaires respectifs). Mais la réutilisation de ces pages en vue d'autres applications (comme par exemple l'affichage sur un écran de téléphone portable) ne serait pas envisageable autrement
que par une dégradation conséquente du contenu, sans garantie de résultat fiable.
Un premier objet de la présente invention est de permettre l'adaptation des données actuellement existantes sur les sites en vue de leur traitement par une diversité
d'applications, sans nécessiter une refonte préalable de ces données.
4. La norme XML Des outils de validation sont apparus à peu près dans les années 1993, en révélant au passage l'étendue des erreurs du balisage de la plupart des pages de la Toile. A cet égard, les organisations qui régissent la Toile se livrent à de nombreuses tentatives de normalisation: définition de règles hiérarchiques strictes d'une part, mais aussi laxistes d'autre part, dites transitionnelles, dans le but déclaré de récupérer le plus grand nombre de documents erronés. Malgré ce, il devient impossible d'endiguer le flot croissant de documents générés en violation de la norme. Les mauvaises habitudes sont déjà ancrées et les auteurs refusent ces changements qu'ils ne
comprennent pas.
Pour prendre en main le problème, un consortium dénommé W3C a été créé et, dès 1997, a publié la norme XML (pour " eXtensible Markup Language " en terminologie anglo-saxonne) qui dérive de la norme SGML en la simplifiant, mais qui aussi renforce de façon stricte la syntaxe. La norme XML a remporté un succès considérable dans le monde industriel d'abord, et se popularise peu à peu. Parmi les nombreux exemples d'applications, les téléphones portables accédant à l'Internet utilisent le langage de balisage WML qui respecte scrupuleusement la norme XML; dans le même esprit, les constructeurs de base de données fournissent les moyens d'extraction du contenu dans un format XML; ainsi la spécification EDI (Electronic
Data Interchange en terminologie anglo-saxonne) est en voie de normalisation XML.
Il apparaît toutefois pour les praticiens que la norme XML, avec ses règles strictes, n'enrichit pas, voire appauvrit la norme SGML, plus permissive sur les omissions de
balises courantes.
Comme on le verra plus loin, un autre objectif de la présente invention est la mise au point d'un analyseur syntaxique SGML validant à tolérance de fautes. Il comporte des algorithmes complexes résolvant la plupart des anomalies de balisage et produit un flux de données en conformité stricte avec la norme XML. 5. Conver:.n Comme vu plus haut, le respect des règles de hiérarchie des balises permet la production de documents accessibles à une multiplicité d'applications diverses. En effet, le but du balisage est d'informer du rôle de telle ou telle portion d'information (de texte, d'image), sans présumer de l'usage qui doit en être fait. Chaque application
spécifique traitant ces documents procède d'une manière qui lui est propre.
Dérivant de la norme SGML, la norme XML est " générique ", en ce sens qu'il n'est pas un langage de balisage par lui même. Une page de la Toile qui respecterait la norme XML est écrite dans le langage XHTML (pour "eXtended HyperText Markup Language " en terminologie anglo-saxonne). A supposer qu'une telle page existe, une question qui se pose est de savoir comment traiter les informations qui y sont contenues afin de les présenter sur un téléphone mobile qui présente des
caractéristiques fondamentalement différentes de celles d'un ordinateur personnel.
Sur ce sujet, les publications d'un groupe de travail dénommé WAP Forum (WAP pour " Wireless Application Protocol " en terminologie anglosaxonne) contiennent 2 5 des recommandations qui établissent que, pour produire un document pouvant être visualisé sur un téléphone cellulaire (en particulier selon la norme WML pour " Wireless Markup Language " en terminologie anglo-saxonne), il faut d'abord construire un " super document " au format XML. Ce document, traité par une transformation de type XSL (pour " eXtensible Style Language " en terminologie anglosaxonne) pourra générer soit du code en HTML, soit du code en WML, selon
le script (à savoir une feuille de style au format XSL) utilisé par la transformation.
Ceci est illustré schématiquement sur la figure 1 des dessins.
Il découle de ces évolutions normatives qu'il n'est pas question de pouvoir réutiliser les documents HTML existants, mais que de nouveaux documents doivent être créés de toutes pièces de telle manière qu'une transformation appropriée par un script XSL
permette de reconstituer le docum.e.n dans sa version HTML, si nécessaire.
Mais à ce sujet, on peut s'attendre à ce que la plupart des sites de la Toile refuseront l'approche drastique proposée par le WAP Forum. En particulier, les sites
"< personnels " ne voudront pas changer par manque de temps pour la réécriture.
Quant aux sites " professionnels moyens " (journaux, bourse, transports, etc.), leurs producteurs ont déjà beaucoup investi dans l'écriture HTML de leurs pages, dans la création des automatismes dans les langages cgi- bin et JavaScript (sachant que l'environnement JavaScript que procure XML n'est pas compatible). Enfin et surtout, les producteurs de ces sites ont lourdement investi dans la mise au point du mécanisme d'ensemble, notamment pour faire face à l'incompatibilité des
navigateurs Netscape / Internet Explorer.
2 0 En outre, la norme XML relève d'une " culture informatique " différente: l'histoire a révélé les difficultés du langage SGML qui ne s'est jamais vraiment imposé principalement parce que le concept de hiérarchie du balisage n'est ni simple, ni populaire. Certes le langage XML a simplifié la syntaxe du langage SGML, mais, comme avec SGML, un document écrit dans le langage XML se doit de respecter la hiérarchie des balises. Ainsi, en dépit de la popularité croissante de XML, qui a été bénéfique pour le diffusion du concept de balisage, on ne doit pas s'attendre à ce que
le langage XML apporte beaucoup plus que le langage SGML, son ancêtre.
Il ne semble donc pas réaliste de s'attendre à une généralisation massive de l'approche XML/XSL, si ce n'est peut-être à très long terme, mais l'on ignore ce que
sera devenu alors cette technologie.
Résumé de l'invention La présente invention a en particulier pour objet d'offrir une alternative à cette évolution normative, qui permette, contrairement aux recommandations qui imposent une ré-écriture des pages de façon compatible XML, de pouvoir effectuer des transformations sur la plus grande partie des pages HTML, existantes, y compris la
grande proportion de celles-ci qui comportent des fautes d'écriture.
Plus précisément, grâce à un mécanisme à conversions multiples extrêmement souple, la présente invention vise à ce que les données à convertir ne nécessitent pas d'être normalisées en XML, ni même de respecter strictement la hiérarchie des
balises. Ceci est illustré schématiquement sur la figure 2 des dessins.
Un autre objet encore de la présente invention est d'offrir, pour réaliser de telles conversions, une syntaxe d'écriture d'instructions particulièrement simple à mettre
en oeuvre.
Ainsi la présente invention propose ystème de conversion de documents, destiné à 2 0 transformer un premier document existant dans un premier format balisé à structure arborescente de noeuds en un second document dans un second format balisé à structure arborescente de noeuds, caractérisé en ce qu'il comprend: un ensemble de procédures-gabarits (Template), chaque procédure-gabarit dudit ensemble contenant une première information de sélection d'une étendue de 2 5 parcours de la structure arborescente du premier document, une seconde information de sélection d'un type de balise du premier document auquel la procédure gabarit peut s'appliquer, et un ensemble d'une ou plusieurs actions, au moins certaines procédures gabarits contenant des actions de collecte d'informations délimitées par les balises dont le type correspond à celui défini par la seconde information de sélection de ces procédures gabarits, un programme contenant des instructions standard (applyTemplates) pour sélectivement appeler lesdites procédures gabarits, des moyens de traitement répondant audit programme et aptes, lors de l'appel d'une procédure-gabarit, à parcourir les noeuds de la structure arborescente inclus dans son étendue telle que définie par la première information de sélection de ladite procédure-gabarit, et pour chaque noeud parcouru, à déterminer si le type de balise correspondant audit noeud correspond à la seconde information de sélection et, dans l'affirmative, à exercer la ou les actions correspondantes, et des moyens aptes, à partir des actions de collecte contenues dans les
procédures-gabarits exécutées, pour construire le second document.
Certains aspects préférés, mais non limitatifs, du système selon l'invention sont les suivants: - les actions d'au moins certaines procédures-gabarits contiennent des instructions
d'appel d'autres procédures gabarits.
- la première information de sélection d'étendue d'une procédure-gabarit est basée sur un noeud de départ constitué par le noeud à partir duquel ladite procédure-gabarit
est appelée.
- au moins certaines procédures-gabarits contiennent des actions de création de variables temporaires cloîtrées, tandis que chacune de ces variables cloîtrées est
héritée par toute procédure-gabarit appelée par de telles procéduresgabarits.
- les procédures-gabarits comprennent une procédure-gabarit de base possédant la seconde information de sélection correspondant à un noeud racine de la structure arborescente du premier document, tandis que les actions de ladite procédure-gabarit
de base comprennent un appel de procédures-gabarits.
- les actions de ladite procédure-gabarit de base comprennent un appel de procédures-gabarits dont la seconde information de sélection correspond à un type de
balise " corps ".
- la structure arborescente de noeuds du premier document comprend des noeuds de type "cadre ", et en ce que les actions de ladite procéduregabarit de base comprennent un appel de procédures-gabarits dont la seconde information de
sélection correspond à un type de balise " ensemble de cadres ".
- au moins certaines procédures-gabarits comprennent au moins une action de redirection vers un premier document différent, sur lequel lesdits moyens de
traitement sont appliqués sur la base du même programme.
- au moins certaines procédures gabarits comprennent au moins une action
conditionnelle basée sur le contenu d'une adresse d'accès au premier document.
- au moins certaines procédures-gabarits comprennent au moins une action constituant une méthode d'un objet et/ou au moins une action constituant une
fonction locale programmée.
- certaines procédures-gabarits comprennent une fonction locale d'ancrage apte à convertir une requête adaptée à la structure du second document en une adresse d'un
premier document contenant l'information recherchée.
- les moyens de construction du second document comprennent des actions d'écriture contenues dans certaines procédures-gabarits dont la seconde information de sélection définit une balise à contenu, lesdites actions d'écriture étant aptes à
assembler de façon prédéterminée au moins une partie des contenus desdites balises.
- les premiers documents comprennent des pages structurées dans un langage balisé standard adapté à une consultation sur poste informatique client via l'lnternet, tandis que les seconds documents comprennent des pages structurées dans un second
langage balisé standard adapté à une consultation sur appareil miniature portable.
- le système constitue un gradin d'une architecture multi-gradins.
L'invention propose en outre une architecture informatique multi-gradins, caractérisée en c-.:N'elle comprend en succession, reliés par réseau informatique, un premier gradin de consultation de données sur poste client, un second gradin d'application sur serveur, un troisième gradin d'agrégation de données comprenant un système de conversion tel que défini ci-dessus et un quatrième gradin comprenant
une pluralité de types de sources de données indépendantes.
Par exemple, dans une application de consultation notamment via l'Internet de données agglomérées provenant de sources différentes, cette architecture est en outre caractérisée en ce que la pluralité de types de sources de données indépendantes comprennent au moins deux types de sources parmi les serveurs Internet, les serveurs d'annuaires à accès rapide et les serveurs de bases de données à accès standard par requêtes. L'invention propose enfin une architecture informatique/téléphonique multigradins, caractérisée en ce qu'elle comprend en succession, reliés par réseau informatique et par réseau téléphonique sans fil, un premier gradin de consultation de données sur un appareil portable tel qu'un téléphone portable, un second gradin de transport de données sans fil, un troisième gradin comprenant un système de conversion de documents tel que défini plus haut et un quatrième gradin comprenant au moins un
type de source de données.
Par exemple, dans une application de consultation de données de serveurs Internet standard à partir de téléphones portables, cette architecture est en outre caractérisée en ce que ledit type de source de données consiste en des pages structurées dans un langage balisé standard adapté à une consultation sur poste informatique client, lesdites pages constituant des premiers documents, et en ce que le système de conversion compris dans le troisième gradin est apte à construire des seconds documents dans un second langage balisé standard adapté à une consultation sur
appareil miniature portable.
Brève description des dessins
D'autres aspects, buts et avantages de la présente invention apparaîtront mieux à la
lecture de la description détaillée suivante d'une forme de réalisation préférée de
celle-ci, donnée à titre d'exemple non limitatif et faite en référence aux dessins annexés, sur lesquels: la figure 1, déjà décrite, est une représentation schématique de l'approche classique pour adapter un même contenu à différents environnements physiques et logiques de navigation sur la Toile, la figure 2, également déjà décrite, est une représentation schématique de l'approche retenue selon la présente invention pour atteindre le même type d'objectif, la figure 3 illustre schématiquement un ensemble de blocs fonctionnels mis en oeuvre selon la présente invention, les figures 4 et 5 illustrent schématiquement deux exemples d'architecture à gradins dans lesquelles peut s'intégrer le système de la présente invention, la figure 6 illustre schématiquement une transformation d'arbre en flux réalisée selon l'invention, la figure 7 illustre plus en détail une transformation d'arbre selon l'invention, les figures 8 à 15, 17 et 18 illustrent des extraits de scripts écrits dans le langage ECMAScript et utilisés dans un exemple de mise en oeuvre de la présente invention, la figure 16 illustre une structure d'arbre d'une partie d'un document de départ concernant l'exemple de mise en oeuvre précité, la figure 19 illustre la présentation visuelle d'un document d'origine et d'un document converti selon la présente invention, les figures 20 à 27 illustrent différentes parties d'un journal de trace susceptible d'être généré par le système de la présente invention, et
la figure 28 illustre une Description Technique de Document définissant le format
des scripts de conversion utilisés par la présente invention.
Description détaillée d'une forme de réalisation préférée de l'invention
On notera à titre préliminaire que la plupart des concepts, spécifications, normes, etc.
auxquels se réfère la présente description font l'objet de descriptions détaillées
2 0 accessibles sur le site Internet www.w3.org du Consortium W3C précité.
On notera également que les différents noms de marques cités dans la présente
description et apparaissant sur les dessins sont des marques déposées aux noms de
leurs titulaires respectifs.
1. L'arbre d'un document Comme on le verra en détail plus loin, la conversion que vise à réaliser la présente invention nécessite non seulement d'examiner le contenu des informations, mais également de prendre en compte leur signification dans un contexte: données d'un paragraphe, d'un lien hypertexte, d'une image, d'un son, numéro de carte de crédit, etc. Le mécanisme de conversion selon l'invention s'appuie sur la possibilité de représentation en arbre d'un document, propriété fondamentale de tout document correctement balisé: ainsi la branche " corps du document " d'un document possède
des sous-branches " chapitre " qui possèdent à leur tour des branches " sous-
chapitre ", etc. La théorie des arbres (navigation et transformations) est une des théories fondamentales du traitement de données. C'est ainsi que la conversion du contenu en fonction du contexte utilisée selon la présente invention met en oeuvre une technique
de transformation d'arbre connue en soi.
La théorie des arbres étant abstraite, son application concrète nécessite de décrire: - les caractéristiques de l'arbre (que sont les branches, que sont les feuilles ?); - la navigation au sein de l'arbre (comment par exemple retrouver un ancêtre dans un arbre généalogique ?); et enfin - la transformation de l'arbre (comment par exemple créer un arbre de cousins
germains ?).
Le consortium W3C précité préconise l'utilisation de la spécification DOM (" Document Object Model " en terminologie anglo-saxonne) pour décrire l'arbre XML en termes de modèle de document, et préconise l'utilisation des langages XSL et XSLT (pour " eXtensible Style Language Transformations "> en terminologie
anglo-saxonne) pour leur transformation.
La mise au point de la présente invention a conduit à une étude approfondie de ces
méthodes, en les replaçant dans un contexte industriel d'utilisation.
A cet égard, un objectif annexe de la présente invention a été d'optimiser les
standards existants.
Prônée par les techniques de script dynamique de type DHTML (pour " Dynamic HTML " en terminologie anglo-saxonne), la spécification DOM s'impose comme le
moyen reconnu qui permet la navigation dans les noeuds de l'arbre d'un document.
Ainsi la présente invention utilise la syntaxe DOM pour décrire l'arbre du document, avec certaines extensions de type agent de correspondance MATCHER, que l'on 1 0 détaillera plus loin, destinées à obtenir une plus grande efficacité dans les traversées
de l'arbre.
On observera ici que la transformation édictée par le langage XSL et par les transformations XSLT se fonde sur une approche classique " sélection de noeuds/choix de gabarits ". Cette approche, déjà préconisée par la norme DSSSL (pour " Document Style Semantic and Specification Langage " en terminologie anglo-asxonne), semble être l'un des points positifs du langage XSL Mais le langage XSL est, dans son application industrielle, relativement complexe, et donc met enjeu des connaissances spécifiques et nécessite l'apprentissage d'un nouveau langage de programmation. En outre, XSL/XSLT ne permet pas la navigation DOM et ne
permet pas de bénéficier des outils de programmation les plus reconnus.
En d'autres termes, la présente invention telle qu'on va la décrire en détail constitue un choix optimal parmi une multiplicité d'approches conflictuelles, en proposant une technique d'assemblage unique harmonisant les interactions entre les outils les plus
pratiqués dans le monde de l'industrie documentaire.
2. La conversion de documents La conversion d'un document balisé selon la présente invention est paramétrée par un script, dit " script de conversion ", qui est programmé dans un langage de conversion essentiel pour la mise en oeuvre de la présente invention. Ce langage " fédérateur > > centralise la communication avec les divers modules fonctionnels indépendants requis pour la conversion: * module DOM d'accès aux noeuds de l'arbre du document en entrée, module d'analyse et de recherche de texte (incluant un moteur de recherche par expression régulière); * module d'écriture du.:.ument résultat (incluant un moteur d'épuration); * module d'itération (traversée de l'arbre par sélection de noeuds); * module de maintenance des variables (au niveau global, ou dans l'environnement de service); * module de création d'objets Java;
* module de trace (debogage).
La syntaxe du langage de conversion est dans le présent exemple ECMAScript, tel que strictement spécifié par la norme du même nom. ECMAScript - dont JavaScript est une extension - est un langage simple, couramment pratiqué par les programmeurs de la Toile. Comme on l'a indiqué plus haut, ceci évite de créer pour le programmeur une nouvelle syntaxe, tout en évitant de passer par les scripts balisés selon le langage XSL. Pour tous compléments d'informations sur le langage ECMAScript, on pourra notamment se référer aux informations disponibles sur le
site Internet www.ecma.ch.
Les détails du fonctionnement du langage de conversion sont donnés plus loin.
2 5 3. Description fonctionnelle de l'invention
Le système et le procédé de la présente invention combinent trois fonctions essentielles, dont la première est toutefois facultative pour des documents balisés convenablement construits a) regroupement et transformation des documents balisés qui dérogent aux standards Comme on l'a dit plus haut, dans les milliards d'octets de pages de données électroniques existant sur la Toile, la majorité de ces pages sont en violation de l'aspect structuration de la norme HTML et, en conséquence, ne peuvent être traitées; cette fonction a pour but de récupérer p i. lupart des données existantes et de les normaliser: elle met en oeuvre desalgorithmes à tolérance de fautes développés
de manière à restituer un " arbre de document " conforme aux prescriptions de XML.
b) langage de conversion de cette transformation destiné à des applications en
environnement industriel.
Ce langage de conversion a été conçu pour offrir une souplesse remarquable dans le paramétrage de la conversion de tout document balisé. Les caractéristiques de ce langage de conversion en font un langage puissant, tout en restant facile à mettre en oeuvre. c) outil convertisseur XGate intégrant en un seul produit la transformation en mode 2 0 flux dynamique Cet outil corrige les documents à convertir, interprète le script de conversion et produit le résultat dans un mode de <" flux continu >>: un nombre théoriquement illimité de documents peuvent être convertis en simultané, sous réserve de la bande
2 5 passante liée notamment à la puissance de calcul et à la mémoire disponible.
La bibliothèque des programmes de conversion est écrite de préférence en langage Java. Une application particulièrement révélatrice consiste en la traduction automatique du contenu de sites quelconques de la Toile. Elle utilise un script approprié, écrit dans le langage de conversion, pour traiter le plus grand nombre de
sites " en aveugle >>.
D'autres scripts écrits dans le langage de conversion peuvent être développés pour la traduction sur les téléphones portables de sites HTML ciblés (par exemples
aéroports, résultats sportifs, etc.).
Les bases techniques utilisées pour la mise en oeuvre de la présente invention sont de préférence les suivantes: * Langage Java (Java 1.2, 100% Pure Java), interpréteur ECMAScript; * Architecture à gradins pour le contrôle des demandes à cibles multiples, le regroupement et l'organisation en document balisés des réponses; * Analyseur syntaxique SGML pour une analyse à tolérance de fautes des documents balisés, pour la mise aux normes XML, et pour la génération de l'arborescence du document résultant en tant que mode dynamique de représentation du contenu des données originelles; * Transformation dynamique d'arbre à arbre via un script de type: " modèle/correspondance/sélection >> (" template/match/select " en terminologie anglo-saxonne "), mais introduisant d'autres concepts uniques (interpréteur ECMAScript, recherche par expressions régulières, accès direct aux noeuds par
navigation DOM, environnement de transformation et de service).
Les applications de la présente invention sont nombreuses: * Commerce électronique; * Conversion de page de la Toile à destination de matériels sans fil 2 5 * Suivi de concurrence par analyse intelligente de contenus; * Génération de flux multimédia à partir de sources multiples (musique, images, etc.). Les avantages qu'elle apporte sont principalement les suivants * Sécurité et facilité de déploiement par la centralisation de l'accès aux ressources; 1.8 * Facilité de mise en oeuvre et d'adaptation des scripts de transformation * Extensibilité et efficacité du fait de la séparation des couches d'accès et de logique applicative (transformation); * Stabilité: l'architecture "ouverte" du système met à profit les techniques standard utilisées sur l'Internet: HTTP en tant que protocole de transfert, XML en tant que format universel de données structurées, ECMAScript en tant que langage de transformation.
4. Description détaillée
4.1. Ensemble des modules fonctionnels du convertisseur XGate Le schéma illustré sur la figure 3 des dessins représente les composants essentiels du convertisseur.
Les données sources sont symbolisées par le module " Back-ends ".
Le module " Business Applications " représente la logique de l'application cliente, alimentée par les données transformées par le convertisseur XGate. Ce module constitue par exemple la partie logique applicative d'une l'application de commerce électronique, telle qu'elle est présentée dans l'exemple donné plus loin. Comme indiqué dans ce même exemple, la Business Application communique par les ports HTTP, en constituant un gradin spécifique au niveau TCP/IP. Mais dans les cas les plus simples le module " Business Application" peut ne pas exister. Le client communique alors directement avec la sortie du convertisseur XGate, l'outil de
communication étant le plus souvent un navigateur standard de la Toile.
Le rôle du module " Broker >" est de décomposer chaque requête en ordres à destination d'un module de normalisation "Normalizer">> et d'un module de transformation "Transformer >>. Le module "Broker">> a accès à un module " Repository >> destiné à enregistrer les requêtes les plus courantes et les profils qui y sont associés. Par exemple, dans le cas d'une transformation d'informations codées en HTML vers des informations codées en WML (typiquement pour rendre accessibles sur des téléphones portables des informations accessibles sur des sites Internet), le module " Repository " connaît les caractéristiques physiques du modèle de téléphone portable qui soumet la requête (dimensions de l'écran, etc.) Il connaît
avantageusement aussi le profil de l'appelant (ses sites préférés, etc.).
Le module " Normalizer >" répond à une requête (flèche " Actions >>) en activant le nombre de données sources nécessaires. Le module "Normalizer" restitue ces données au format XML. C'est dans ce module "Normalizer" que se trouve le composant d'analyse syntaxique à tolérance de fautes. Mais ce module peut
également contenir d'autres composants: par exemple, si les données d'un " Back-
ends " auquel il accède sont structurées en une base de données, le module " Normalizer " doit pouvoir engendrer un balisage spécifique à ce type de requête
c'est le rôle du composant de filtrage " Filter " de engendrer ce balisage.
On notera que, pour une requête " Actions " donnée, le nombre de documents XML
générés dépend du nombre de sources de données activées.
Le module "Transformer" répond à une requête (flèche de type "Layout ") en lisant le flux XML émis par le module << Normalizer " et en lui appliquant le ou les scripts de transformation tels que choisis par le module " Broker ". Si besoin est, le module " Transformer " a la possibilité de retourner une requête complémentaire au module " Broker " (ce qui n'est pas symbolisé sur la figure 3 pour des raisons de
2 5 lisibilité).
4.2. Exemples d'architectures fonctionnelles 4.2.1. Application de commerce électronique La figure 4 illustre l'intégration du convertisseur XGate de la présente invention au
sein d'une architecture à 4 gradins pour une application de commerce électronique.
Dans le présent exemple, le but de cette application est de fournir aux clients un catalogue de produits comportant images, prix, et adresses des fournisseurs. Les
clients utilisent un navigateur de Toile pour la visualisation des résultats.
Les différentes informations nécessaires proviennent de source hétérogènes, ici une base de données " SQL Server >> pour les prix, un serveur " LDAP Server " pour les adresses (Lightweight Directory Access Protocol en terminologie anglo-saxonne - il s'agit d'un protocole normalisé facilitant la recherche d'informations organisées en annuaire ou en répertoire, telle que la recherche de personnes classées selon leur nom, leur entreprise, leur pays, etc.), et un serveur " Web Server " pour des pages de
la Toile décrivant les produits (texte, images, son, etc.).
Une logique applicative bien conçue se doit d'être affranchie de toute question relative à l'obtention des informations qu'elle traite. De même, la façon dont ces informations sont affichées physiquement sur l'écran du demandeur n'est pas du ressort de l'application. Pour ce dernier point, le navigateur de Toile traduira le flux HTML émis par la logique applicative en termes d'instructions d'affichage qui
produiront le résultat correspondant sur l'écran de l'ordinateur du client.
Le résultat produit par la logique applicative est donc un flux HTML dont l'interprétation en images est effectuée sur l'ordinateur du client: c'est la notion de
2 5 "gradin" indiquée plus haut.
Chaque gradin possède une responsabilité bien définie, et l'interface de présentation
au niveau du poste client constitue le premier gradin de cette architecture.
Symétriquement, I'obtention et l'assemblage des informations nécessaires font l'objet d'une entité fonctionnelle (gradin) séparée, car on rappelle que ce n'est pas le rôle de la logique applicative. Le convertisseur XGate assure cette tâche en produisant un flux de données de résultat dans le langage XML. Ce langage a été naturellement choisi dans cet exemple comme le langage fédérateur: sa souplesse permet en effet de définir la structure de balisage la plus appropriée aux besoins de telle ou telle application. Le convertisseur XGate permet d'ajouter un niveau de modularité essentiel: la collecte et la normalisation des données hétérogènes. En d'autres termes, la logique applicative ne fait que spécifier en XML ses besoins, via un script XF de conversion requête/résultat. Cette approche en 4 gradins (le quatrième gradin étant au niveau du fournisseur de données) permet un développement aisé, facilement modifiable et
réutilisable, de cet exemple de commerce électronique.
4.2.2. Conversion de HTML vers WML La figure 5 illustre l'accès à partir d'un téléphone portable aux horaires de vol d'avions au départs et arrivée des principaux aéroports français. La faisabilité de cette application a été expérimentée avec succès sur trois modèles de téléphones portables (Nokia 7110, Motorola TimePort P7389, Siemens S351 - marques déposées). L'appel d'un numéro privé à partir d'un tel téléphone portable permet d'obtenir les horaires des vols, les retards et annulations, affichés lisiblement, et mis à jour minute par minute. Le site testé n'a bien sûr subi aucune modification
(d'ailleurs, aucun contact n'a été pris avec les responsables de ce site).
Comme dans l'exemple précédent, le premier gradin est l'interface de présentation il s'agit dans ce cas du téléphone lui-même. Il communique avec le réseau GSM en
mode CSD (plus communément appelé DATA, par opposition au mode SMS -
"< Short Message Service " en terminologie anglo-saxonne).
Sans entrer dans les détails sortant du cadre de la présente invention, le deuxième gradin (adaptation et transport, WSP/WTP, à savoir " Wireless Session Protocol
specification/Wireless Transaction Protocol specification en terminologie anglo-
saxonne) permet au convertisseur XGate de "voir" le téléphone comme un
dispositif IP émettant une requête HTTP et attendant une réponse HTTP en retour.
Ce gradin garantit une indépendance vis-à-vis de la technologie GSM utilisée, fait particulièrement important étant donné l'évolution rapide des technologies concernées. Le convertisseur XGate se trouve au troisième gradin. Il dialogue avec le site concerné, déchiffrant les informations, soumettant d'autres requêtes jusqu'à obtenir l'information que le téléphone appelant demande. Il traduit alors la réponse en générant les balises WML nécessaires à l'affichage en clair de cette réponse sur
l'écran du téléphone.
Responsable du paramétrage de cette transformation, le script de conversion XF est
peu volumineux; typiquement, il n'excède pas une page de code.
4.2.3. Transformation en flux La figure 6 des dessins synthétise le fonctionnement du convertisseur XGate en termes de flux et d'interface; ainsi il ne s'agit pas sur cette figure de modules
2 0 fonctionnels.
Une possibilité intéressante offerte par la présente invention est d'effectuer le travail de conversion en flux continu. Cette caractéristique est responsable de la rapidité de la réponse: ainsi, si la transformation le permet, les premières données en sortie
2 5 peuvent être produites avant d'avoir lu les données en entrée dans leur totalité.
Les arbres des documents d'entrée et de sortie, définis en spécification DOM, sont au coeur de la conversion. Les flèches représentent la transformation noeud à noeud de ces arbres, transformation pilotée via le module " Transformer "> interprétant le script
3 0 de conversion XF.
L'interface " Normalizer >> participe à la construction de l'arbre en entrée. Il est important de noter ici que la technique en flux continu n'impose pas une construction complète de l'arbre comme une condition nécessaire au démarrage de la transformation: ainsi, ce n'est qu'au moment ou la transformation demande une branche qui n'est pas encore construite que l'interface " Normalizer >> lira
suffisamment de données en entrée pour construire cette branche.
L'interface " Finalizer " est quant à elle chargée de fournir le flux de sortie, en parcourant l'arbre DOM résultant. Cette tâche est permanente: si l'une des branches est incomplète, alors seulement l'interface " Finalizer " attendra que la transformation de cette branche soit terminée. Notons une autre caractéristique de l'interface " Finalizer ", à savoir la possibilité qu'elle a d'épurer le flux de sortie. Par exemple, les téléphones portables ne reconnaissent pas les codifications HTML des
caractères accentués, car la Description Technique de Document (DTD) du langage
WML n'inclut pas la codification des caractères accentués. L'interface " Finalizer " possède donc avantageusement un composant de conversion des caractères accentués
en caractères correspondants non accentués.
4.2.4. Agrégation et transformation La figure 7 des dessins, correspondant à un exemple simplifié, montre quelques unes des étapes de la transformation réalisée par le script de conversion XF pour l'application de commerce électronique décrite plus haut. L'interface " Normalizer " a créé les arbres DOM de trois documents XML résultant de la recherche: QUERYDOC (recherche du produit dans la base de donnée), DIRDOC (recherche d'adresses dans la base LDAP), HTML (document contenant les images). Le script de conversion XF construit le document résultant, RESDOC, par une sélection des noeuds appropriés dans chacun des 3 arbres. Cet exemple permet de se rendre compte à la fois de la complexité de l'opération, et, en conséquence, de la puissance du langage de conversion dans lequel est écrit le script XF qui, par sa syntaxe et ses
fonctionnalités en facilite la programmation.
Le modèle du document RESDOC (schéma XML, ou au format DT'D pour
"Document Technical Description" en terminologie anglo-saxonne) est spécifié
dans le deuxième gradin "Logique Applicative" de la figure 4. Le rôle du convertisseur XGate est de décharger cette application de la recherche et de l'assemblage de ce document, opération qui serait extrêmement complexe si une
" programmation classique " avait été mise en oeuvre.
Le schéma de la figure 7 sous-entend que les trois arbres sont indépendants, en ce sens que le convertisseur XGate les construit en parallèle. Mais dans la pratique, la construction des trois arbres en entrée est interdépendante. Par exemple, la recherche d'un produit dans la base de données renseigne le nom du distributeur (CPNY), permettant d'interroger la base LDAP sur ses coordonnées géographiques. Ce principe de chaînage (redirection) utilise les fonctionnalités du module " Broker " (voir figure 3). Il est intégré dans le script de conversion XF via les variables de services. 4.3. Structure d'un script de conversion XF Comme déjà indiqué, le script de conversion XF se situe au coeur de la présente
invention. On va présenter ici quelques unes de ses caractéristiques fondamentales.
4.3.1. Structure générale du script XF: Gabarits 2 5 Un script de conversion XF se compose d'une liste de procédures, chacune d'entre elles étant applicable à des noeuds du document qui satisfont une condition bien définie, comme par exemple " être un noeud de type 'paragraphe' du corps du document ". La condition et sa procédure associée sont appelées gabarits
(<< template ").
On adopte dans la suite les désignations suivantes
Template A: pour tout noeud satisfaisant la condition A, faire (procédure A).
Template B: pour tout noeud satisfaisant la condition B, faire (procédure B).
Template Z: pour tout noeud satisfaisant la condition Z, faire (procédure Z). Sur le plan de la syntaxe, un script de,'onversion XF est lui-même un document en langage balisé. Chaque gabarit y est représenté par une paire de balises ouvrante et fermante, signifiant respectivement le début d'un nouveau gabarit et la fin de ce même gabarit. La condition associée est l'attribut de correspondance " Match " de la balise ouvrante; la procédure à exécuter est le contenu compris entre la balise
ouvrante et la balise fermante de l'élément " template ">.
Ainsi, la clause " pour tout noeud paragraphe du corps du document, faire (procédure
P) " s'écrit de la façon illustrée sur la figure 8.
Cette syntaxe est inspirée de la syntaxe du langage XSL, mais la comparaison s'arrête là. D'abord, la syntaxe du critère " Match " est bien plus simple, comme on le verra plus loin. Ensuite, contrairement à l'élément " gabarit >" du langage XSL (" xsl: template "), l'élement gabarit de XF ne contient aucunes sous-balises. Le contenu de l'élément gabarit est une procédure en langage ECMAScript appelée
" procédure-gabarit ".
4.3.2. Programmation des procédures-gabarits Les explications qui suivent sont faites en référence aux spécifications ECMAScript
et DOM, auxquelles on se référera pour tous les détails nécessaires.
Chaque procédure-gabarit représente une méthode d'un objet de la classe de noeuds
Node, classe standard définie par "< org.w3c.dom.Node " dans la spécification DOM.
Plus précisément, le sujet (" this >") de chaque procédure-gabarit est l'objet noeud de l'arbre DOM qui a satisfait la condition d'exécution (Match). Toutes les méthodes définies par DOM pour la classe Node sont applicables à l'objet sujet (" this ") de la procédure-gabarit. Par exemple, dans la procédure P suivante: XF.log.writeln(this.getNodeName()); qui est appelée pour tout paragraphe du document, l'appel de la fonction DOM
" getNodeName( " appliquée à l'objet " this " retourne le mot " PARA ".
La description des opérations en " liste de gabarits " est une approche
particulièrement bien adaptée à la conversion d'arbre. Cependant, les traversées d'arbres et les récurrences qu'elle peut impliquer ne sont pas intuitives. En créant la notion de procédure-gabarit dont l'objet sujet (" this ") se trouve être le noeud
courant, la compréhension des effets induits est grandement facilitée.
L'approche proposée selon la présente invention possède comme atout majeur une programmation naturelle de la conversion, qui conduit à un code relativement simple,
lisible, qui ne nécessite pas d'apprentissage tout en étant particulièrement puissant.
Le Script de conversion XF se compose donc d'une liste de procéduresgabarits, chaque procédure étant décrite par la balise " template ". Pour que la conversion s'effectue, il faut maintenant procéder à l'exécution de ces procédures, et l'on va
maintenant décrire la façon dont ces procédures sont appelées.
4.3.3. Appel des procédures-gabarits C'est par la méthode " applyTemplate(select) " que les procédures-gabarits sont appelées. Cette méthode est une des méthodes de l'objet global XF, et s'écrit donc: XF. applyTemplate(select) La méthode " applyTemplate >> donne l'ordre de rechercher et d'exécuter tout gabarit applicable aux noeuds de l'arbre rencontrés pendant la traversée spécifiée par la valeur de l'argument de sélection " select ". Cet argument de sélection est dite
" équation de traversée ".
Comme le critère conditionnel d'exécution " Match ", l'équation de traversée utilise une syntaxe simple, proche de celle prônée par le groupe de travail TEI (pour " Text Encoding Initiative" en terminologie anglo-saxonne). En effet; le langage de conversion XF ne nécessite pas une sélection complexe des noeuds. La puissance de ce langage XF provient naturellement de son aptitude à être programmé. Une programmation classique (opérations conditionnelles de type " if... else ", variables, boucles) permet d'exprimer aisément une solution algorithmique, et d'éviter que l'équation de traversée et/ou la condition d'exécution soient les seuls chargés de cette responsabilité. (On notera ici que, si l'on tentait d'utiliser la syntaxe standard du langage XSL, on démontrerait l'inadaptation des équations XSL à résoudre de réelles conditions de conversion: le degré de complexité des équations de correspondance et de sélection augmenterait exponentiellement pour chaque nouvelle condition, nécessitant des heures de travail sans certitude absolue de la validité de l'équation obtenue). La méthode " applyTemplate " engendre une véritable réaction en chaîne. Ainsi, depuis la procédure- gabarit du noeud-racine du document, elle appelle toutes les procédures- gabarits selon l'équation de traversée. Les procédures-gabarits qui satisfont la condition d'exécution " Match " sont activées, et, à leur tour, peuvent lancer une méthode " applyTemplate " qui appelle toutes les procédures de gabarits, etc. 3 0 Ce mécanisme puissant étant parfois difficile à contrôler, on prévoit avantageusement selon l'invention des routines de débogage du script écrit, spécialement étudiées pour fournir les moyens rapides de corriger une erreur de récursivité.
Pour que le dispositif de réaction en chaîne démarre, la procéduregabarit du noeud-
racine du document doit être appelée: c'est la seule procédure qui soit appelée automatiquement. 4.3.4. Administration des variables - cloîtres, environnement de service Le langage de conversion XF fournit des fonctions qui permettent la communication de variables entre procédures- gabarits. Ces variables sont dites "cloîtrées", c'est à dire qu'une procédure-gabarit peut créer son propre jeu de variables (dans son " cloître "), variables qui seront héritées par l'ensemble des procéduresgabarits qu'elle appelle. Une variable crée par un cloître ne peut être transmise au cloître
1 5 parent.
Les variables cloîtrées peuvent être de toute nature: nombres entiers, chaîne de caractères, tableaux, et même objets ECMAScript (autrement appelés " Eléments Dynamiques >"), ce qui permet de d'étendre considérablement la puissance de ce
mécanisme.
* Une méthode " applyTemplate " constitue en outre un moyen pour passer un nombre
quelconque de variables par argument.
2 5 La durée de vie des variables cloîtrées est le temps d'exécution du script de conversion XF dans lequel elles sont définies. Une session, cependant, comporte généralement plusieurs requêtes et donc plusieurs conversions qui peuvent avoir certaines variables en commun. Le langage de conversion XF fournit cette possibilité
par le biais de variables dites d'environnement de service.
Initialisées et réactualisées par le module " Broker "> (voir plus haut), la valeur des variables d'environnement dépend essentiellement du service appelant, et notamment du type de requête arrivant). Dans le cas de la transformation en code WML par exemple, l'identité de l'appelant et le modèle de téléphone sont des variables enregistrées dans l'environnement de service. 4.3.5. Ecriture du document résultat La production du résultat est bien entendu une fonction fondamentale du script de conversion. La méthode "XF.result( " fournit un objet qui permet d'accéder au document en sortie. Par exemple, en donnant accès au noeud racine de ce document, l'écriture du document en sortie revient à mettre en oeuvre les méthodes définies par le modèle DOM pour ajouter des noeuds dans un arbre. Ces méthodes d'accès aléatoire en écriture coexistent avec la méthode " XF.result(.write() " qui additionne simplement un morceau de langage balisé au flux de sortie. Il faut noter que dans tout les scripts expérimentaux réalisés dans le cadre du développement de la présente invention, même les plus complexes, les méthodes d'accès aléatoire ont été rarement nécessaires. 2 0 4.3.6. Autres fonctions du langage de conversion XF Le langage XF peut fournir d'autres fonctions telles que: * recherche de texte par utilisation d'expression régulières * niveau de trace de débogage, 2 5 * instanciation d'objets Java, étant noté ici que l'on a intérêt à limiter le nombre dc méthodes pour garder à ce
langage sa simplicité et son pouvoir fédérateur.
4.4. Exemple concret d'un script de conversion XF Les extraits de code qui sont représentés sur les figures 9 et suivantes illustrent certains des aspects décrits ci-dessus. Ces exemples ont été extraits d'une application de conversion réelle, à savoir la recherche d'horaires de vols d'avions et leur
affichage sur un téléphone WAP.
Dans le cas particulier de cette conversion, applicable à de nombreux autres cas, l'analyse préalable du plan du site concerné de la Toile nous a amené à énoncer les règles suivantes (on omettra ici le choix de l'aéroport pas souci de simplification): * la plupart des pages du site sont organisées en "cadres " (" frames" en terminologie anglo-saxonne). Un tel cadre délimite une portion rectangulaire constituant une souspartie de l'écran d'affichage de la page HTML. Introduit par la deuxième génération des logiciels standard de navigation, ce mécanisme conçoit la page HTML comme une mosaïque de cadres, collection de cadres ou " ensemble de cadres " (" frameset " en terminologie anglo-saxonne), chacun de ces cadres ayant une adresse HTTP qui lui est propre Trouver l'information recherchée à travers des cadres impose un examen du contenu de chacun d'entre eux. Pour toute page dans laquelle une balise " FRAMESET " est rencontrée, la requête doit être redirigée en demandant l'accès à la page correspondant à chacun des cadres composant l'ensemble de cadres. En général, ces cadres sont créés dynamiquement par les programmes de type " cgi-bin " du site exploré (dans le présent exemple, les horaires sont mis à jour toutes les 3 minutes). Rien n'empêche que la page en retour ne
contienne à nouveau une balise FRAMESET: il faut alors réitérer le processus.
* Ces redirections doivent s'enchaîner jusqu'à ce que l'on trouve (dans l'ordre) l'une des deux pages suivantes: - soit la page qui propose le choix: horaires de départ ou d'arrivée;
- soit la page du tableau des horaires (ce que l'on cherche).
* Lorsqu'il est accédé à la page " choix des horaires ", le système propose ce choix sur le téléphone, attend la réponse de l'utilisateur, puis reprend le processus en orientant la recherche vers l'horaire désiré (départ ou arrivée) * Lorsquc la page des horaires est enfin trouvée, le système convertit le tableau au format HTML de la page dans un format approprié pour son affichage sur l'écran du téléphone. La conversion indiquée au dernier point ci-dessus est donc assortie d'une logique de navigation préalable. Dans l'architecture du convertisseur XGate, le module " Broker " est responsable de ces redirections successives. Pour ce q1i, concerne le déroulement de la conversion, le module " Broker " n'est pas visible. Le script de conversion XF, appelé pour toutes les pages auxquelles il est accédé, y fait appel
implicitement, de façon transparente et simple.
4.4.1. Gabarit de base Etant ici rappelé qu'un script XF est une suite de gabarits, le premier gabarit de ce script est représenté sur la figure 9 des dessins.
Ce gabarit est appelé pour le noeud " HTML " de l'arbre du document d'entrée.
S'agissant d'une page de la Toile, ce noeud est le nceud-racine du document, faisant de ce gabarit un " gabarit de base ", qui est le premier appelé dans la liste des
2 0 gabarits qui composent le script de conversion XF.
Toutes les instructions spécifiques à l'outil de conversion commencent par "XF.", qui, en langage Java, signifie que l'on réfère une méthode de l'objet XF. Cet objet fait implicitement de l'environnement du script. Par exemple, dans le corps du gabarit, l'instruction " XF.trace( " demande à l'objet XF de produire une trace de
débogage dans les fichiers de contrôle du déroulement (fichier dit " log ").
L'instruction " XF.applyTemplates(...) " demande au script d'appeler toutes les procédures-gabarits correspondant aux noeuds décrits par l'équation de traversée: 3 0 " origin(.descendant(all,(FRAMESETIBODY)) ". Cette équation utilise une syntaxe
du type " XPointers ". Elle signifie: partant du noeud courant - " origin() " -
parcourir tous les noeuds qui en descendent - << descendant(all,...) " et dont les
noms sont soit " FRAMESET >>, soit " BODY ".
En effet, comme énoncé plus haut, seuls les noeuds dont le nom est " FRAMESET " ou " BODY "> doivent être pris en considération dans le cas particulier de cette conversion. Les noeuds " FRAMESET " arrêtent la conversion pour demander l'accès à la page qu'ils référent; les noeuds de corps "< BODY >> contiennent quant à
eux des résultats à convertir et afficher.
4.4.2. Chaînage des cadres: gabarit FRAMESET On va examiner tout d'abord le gabarit appelé pour les noeuds FRAMESET, tel
qu'illustré sur la figure 10.
La première instruction de cette procédure-gabarit, à savoir " XF. setVar("framed", 1) ", crée la variable cloîtrée "framed" en lui assignat la valeur 1. On en expliquera
plus loin la raison.
Les descendants directs (enfants) du noeud dont le nom est " FRAMESET " sont des noeuds dont le nom est " FRAME >>: ce sont ces noeuds qu'il faut examiner afin de trouver celui qui décrit la page à laquelle il faut accéder. Ceci est effectué de la façon suivante: le modèle DOM définit la méthode " getChildNodes( " qui fournit la liste de tous les enfants d'un noeud donné. On sait que le sujet du script d'un template est le noeud DOM pour lequel ce template à été appelé: c'est l'objet << this >>. La boucle 2 5 de recherche de la page est donc une boucle " for >> classique en soi, qui est désignée
par la référence 101 sur la figure 10.
Le modèle DOM définit que la liste obtenue est un objet (ici de la classe standard " org.w3c.domn.NodeList >>) dont la méthode " item(i) " permet d'en extraire le ièmC élément. A l'intérieur de la boucle " for ", l'instruction désignée en 102 sur la figure permet d'obtenir successivement tous les enfants du noeud " FRAMESET " (à savoir les noeuds " FRAME ">), jusqu'à ce qu'il n'en reste plus (la variable " child " prend alors la valeur " null ") ou que le noeud " FRAME " en question soit celui que
l'on recherchait.
Quant aux critères utilisés, l'examen du script de la figure 10 montre que seuls les cadres nommés: " HOME >, " MainMenu ", " Content ", ou " Result " doivent être sujets a une opération de redirection. C'est cet ensemble de conditions qui, exprimées par les instructions "if (...)" du script de la figure 10, vont piloter
l'opération de redirection.
On notera ici que les noms de ces cadres dépendent du choix du programme du site, qui peut évoluer avec le temps, mais l'on peut en général tabler sur le fait que les noms des cadres risquent moins d'être modifiés que d'autres éléments des pages. Le choix de critères basés sur les noms des cadres semble donc être le meilleur. En outre, on pourra imposer à l'administrateur d'un site de ne pas effectuer de modifications qui pourraient compromettre le fonctionnement du script de conversion, sachant que l'obligation de figer un nom de cadre n'est pas pour lui une contrainte réelle. Ainsi une telle contrainte ne gêne pas les évolutions futures du site
dans le temps, et les adaptations nécessaires du script de conversion restent aisées.
La redirection est déclenchée par l'instruction " XF.redirectTo(...) ", méthode qui prend en paramètre l'adresse HTTP de la nouvelle page. Cette adresse est la valeur de l'attribut " src " du noeud " FRAME ", obtenu par la méthode " getAttribute() "
appliquée dans le modèle DOM au noeud " child " courant, à savoir le cadre.
La redirection vers une autre page relance le script de conversion avec les données (l'arbre en spécification DOM) de la nouvelle page. Par défaut, le même script de conversion est appelé. (On notera ici que le module " Broker" permet de gérer plusieurs scripts à la fois. Ainsi la méthode "XF.redirectTo( " comporte un paramètre optionnel indiquant, si besoin est, le nom du script XF qui doit être exécuté. Ce nom est la valeur de l'attribut " name " de la balise-racine <xf:doc> qui préside à tout script XF. En terminologie XF, un changement de script s'appelle " changement de mode ". Allié au chargement dynamique de fichiers de conversion "XF.load( ", la possibilité de script multiples (gérés par le module "Broker" donne une souplesse remarquable dans l'administration des conversions.) La navigation de noeud " FRAME" à noeud " FRAME " se poursuit jusqu'à ce qu'on accède aux pages,ertinentes. Ces pages ne comportent pas de " FRAMESET " et leur balise "BODY" contient les informations que l'on recherche. 4.4.3. Conversion: gabarit BODY
Le gabarit " BODY " est illustré sur la figure 11 des dessins.
En premier lieu, les instructions indiquées en 111 et 112 sur la figure 11 écrivent dans le fichier de résultat respectivement le prologue et l'épilogue communs à tout document WML. Utilisées fréquemment, les variables " prolog " et " epilog " sont définies une fois pour toutes par le programmeur comme des chaînes de caractères
(" string ") fixes.
Notons que l'exécution de ce gabarit est conditionnée par l'examen de la variable
" framed "; c'est l'instruction désignée par la référence 113 en figure 11.
Si cette condition est vraie, alors on sait que ce noeud "BODY" n'est pas dans une page; en effet, s'il en avait été autrement, le gabarit "< FRAMESET " aurait crée la
variable " framed >> (qui n'aurait donc pas la valeur null).
Le corps BODY d'une page formée de cadres est sans intérêt pour la présente conversion. Plus précisément, dans le langage HTML, une balise BODY peut suivre la balise FRAMESET, mais le contenu de ce BODY est dans ce cas sans intérêt, car il est utilisé par les logiciels de navigation datant d'avant l'époque o le mécanisme de cadres a été introduit. Le plus souvent, une telle balise BODY affiche un texte indiquant l'incapacité du logiciel de navigation à traiter des documents comportant
des cadres.
Dans ce cas, aucune autre instruction de ce gabarit n'est exécutée. Aucun autre
gabarit n'étant actif, la conversion est terminée à ce stade.
Dans le cas contraire, cette page contient soit le menu de l'aéroport, soit l'un des horaires demandés. L'examen de l'addresse HTTP (URL) de la page permet de l'indiquer: dans le présent exemple, si la page contient " HomePage ", il s'agit du
menu; si elle contient <" DayFlight >>, alors il s'agit d'un horaire.
L'adresse de la page courante fait partie des variables d'environnement: on l'obtient
par la méthode XF " getURL( ". Cette méthode produit une chaîne de caractères -
et plus précisément un objet ECMAScript de la classe standard " String " dont la méthode " indexOf ( >> permet de connaître s'il contient ou non la chaîne de
caractères " DayFlight ".
Si c'est le cas, la page contient les horaires, sous forme de tableau HTML: il convient d'examiner le corps de ce tableau, c'est à dire le noeud nommé TBODY (pour " table body "), quelque part dans la descendance du noeud BODY sujet de ce gabarit. C'est ce qu'indique l'équation de navigation désignée par 114 sur la figure 11. 4.4.4. Navigation hypertexte La conversion du tableau des horaires sera décrite plus loin. En premier lieu, on examine le contenu de la clause " else >> désignée par la référence 1 15 sur la figure 11, correspondant au cas o l'adresse de la page ne contient pas la chaîne de
caractères " DayFlight >>.
Dans ce cas, il s'agit donc de la page d'accueil de l'aéroport. L'intervention de l'appelant au téléphone est alors nécessaire: veut-il les horaires de départ ? d'arrivée ? Il faut proposer ces deux choix, et, selon la réponse, naviguer vers la page adéquate. Sur un téléphone WAP, ce résultat est obtenu par l'envoi de la page en langage WML telle qu'illustrée sur la figure 12. La procédure-gabarit appelante (gabarit BODY) a déjà écrit le prologue de cette page WML, et en écrira l'épilogue au retour. Il faut donc générer les deux lignes comportant la balise <a>, c'est-à-dire greffer sur l'arbre de sortie deux noeuds ayant
des balises <a>.
Les balises <a> sont les points d'ancrage de la navigation hypertexte. Leur syntaxe WML est très proche de la syntaxe HTML, si ce n'est que la syntaxe WML impose la lettre " a " minuscule. Lorsque l'appelant activera le mot " Départs " affiché sur son téléphone WAP, il déclenchera une navigation vers la page qui se trouve à
l'adresse HTTP " ddddd >>.
Les valeurs des attributs href: "http://dddd" et "http://aaaaa" sont bien entendu données à titre illustratif. Dans la réalité, il s'agit des adresses HTTP des pages de la 2 0 Toile qui vont permettre de poursuivre la navigation vers les horaires soit de départ, soit d'arrivée (respectivement). Ces valeurs apparaissent dans la page HTML en cours de conversion comme étant l'attribut source des balises <A> dans le code HTML de la page, qui sont donc des noeuds de l'arbre dans la descendance du noeud
courant " BODY >>.
On utilise la lettre " A >> majuscule pour la balise HTML pour bien différencier la balise à rechercher dans la page tITML du document d'entrée de la balise WML <a>
qui doit être générée dans l'arbre de sortie.
Il faut maintenant localiser les noeuds dont les balises sont <A>. L'examen du code de la page HTMI, conduit à remarquer que de tels noeuds ont comme enfant un noeud 3 '7 de type " IMG " (une image) dont l'attribut " src " contient le mot " DEPART " ou le mot " ARRIVEE >". Il faut donc d'abord examiner tout les noeuds " IMG ", c'est-à dire appliquer les gabarits aux descendants de type " IMG ", ce qui s'écrit comme
indiqué à la deuxième ligne de l'instruction 115 de la figure 11.
Le gabarit associé à ces noeuds images est illustré sur la figure 13. On notera ici que, dans '. pratique, l'équation de correspondance " match="IMG" " pourra être plus complexe en restreignant les noeuds candidats IMG à seulement ceux dont le père est un noeud de type A. Par rapport à ce qui précède, il n'y pas réellement de notion nouvelle introduite par
ce gabarit, si ce n'est l'appel à la fonction <" addAnchor() ".
Cette fonction n'est pas la méthode d'un objet (sinon, sa syntaxe serait " sujet.addAnchor( "). Ce n'est pas non plus une instruction définie par ECMAScript. En effet, il s'agit d'une fonction dite " locale ", définie par le
programmeur du script XF en question.
On notera ici que de telles fonctions locales (ou routines) sont un outil précieux pour
le programmeur à des fins de structuration, de réutilisation et de lisibilité du code.
Les scripts XF offrent en eux mêmes cette possibilité. Ces routines, qui peuvent être appelées depuis n'importe quel gabarit, apparaissent dans le contenu de la balise
<xf:script>. Cette balise complète la liste des balises apparaissant dans le script XF.
On notera ici qu'il existe dans le présent exemple une autre balise, <xf:init>, qui apparaît dans un seul script XF, à savoir le script "par défaut". Le script XF par défaut est un script dont la balise-racine <xf:doc> ne possède pas d'attribut de nom "name", ou, s'il existe, possède un tel attribut dont la valeur est le nom réservé
"#default". Le script par défaut est appelé lorsque le mode courant n'est pas défini.
La balise <xf:init> définit alors la procédure de conversion à appliquer lorsque le document source à convertir n'existe pas. C'est ce qui se produit lors du premier contact avec un nouvel appelant au téléphone d'o le nom < init >". C'est aussi ce
qui peut se produire en cas d'erreur de navigation (code HTTP 404).
Un nombre quelconque de routines locales ou de variables locales peuvent être définies. On y trouvera par exemple les variables locales chaînes de caractères prolog
et epilog qui ont été évoquées plus haut.
Dans le cas d'espèce, l'élément " xf:scripts " contient la fonction " addAnchor() " et
se présente de la façon illustrée sur la figure 14.
Le rôle assigné par le programmeur à cette routine est de construire un point d'ancrage: l'activation de ce point depuis le téléphone WAP entraînera la navigation
vers la page désirée de la Toile, ici les horaires de départ ou les horaires d'arrivée.
Cette routine contient une boucle qui recherche le premier noeud " A " dans la lignée parentale du noeud " IMG " courant. Lorsque ce noeud a été trouvé, la routine appelle
la méthode " XF.result(.writeAnchor( ".
On va décrire le rôle de cette méthode en la décomposant.
Tout d'abord, la méthode " XF.result( " permet d'accéder au fichier résultat, à savoir le document qui sera envoyé vers le téléphone WAP. Il s'agit ici d'une écriture séquentielle, mais comme on l'a vu plus haut, il existe d'autres moyens pour écrire ce fichier résultat, tels qu'une écriture en accès aléatoire, à savoir l'ajout d'un
2 5 noeud de l'arbre DOM de sortie.
Ensuite, la méthode " writeAnchor() " de l'objet " fichier résultat " obtenu par la méthode " XF.result( " possède comme premier argument le texte du point d'ancrage associé à la référence hypertexte: " Départs ", ou " Arrivées ". Le second argument est la référence hypertexte, obtenue par la lecture de la valeur de l'attribut " href >> du noeud parent de balise <A>. Le troisième argument est la référence locale,
qui est le nom qu'il faut associer à la référence hypertexte.
Des exemples de valeurs de ces trois arguments sont illustrés sur la figure 15.
pour obtenir le résultat, on écrit dans le fichier de sortie <a href="/xxx/airport.21">Départs</a> " xxx " identifiant la session (l'appelant), "airport" identifiant le mode de transformation (<xf:doc name = "airport">, et " 21 " identifiant l'étape. Sans entrer dans les détails, c'est le rôle du module " Broker " de reconstituer l'adresse réelle de la page qui fournit le résultat et d'indiquer les autres références (appelant, mode, etc..) via les variables d'environnement du script de conversion XF appelé pour la
conversion de cette page.
4.4.5. Affichage du tableau des horaires On va maintenant décrire la conversion du résultat, à savoir le tableau des horaires
2 0 des vols qui correspond au noeud TBODY.
On indique tout d'abord une représentation de l'arbre du document à ce noeud. C'est
là une description classique de la structure commune à tout tableau d'un document
HTML. Cette représentation est illustrée sur la figure 16.
Les enfants du noeud TBODY sont les lignes de la table (noeud TR). Chacune de ces lignes correspond ici à un vol. Les noeuds TR ont pour enfant des noeuds 'ID qui représentent les colonnes de la table. A leur tour, les noeuds TID ont pour descendants le texte même de chacune des colonnes. Ce texte donne les caractéristiques du vol.
On notera ici que le lien de descendance entre un noeud T'ID et le texte associé peut-
être indirect, avec, par exemple, l'intervention d'un noeud indiquant la police de
caractère utilisée.
Pour atteindre le texte de chacune des colonnes, on utilise donc l'équation de navigation: origin ().child(i).descendant (all, #text) " i > " étant une variable indiquant le numéro de la ligne. Cette équation signifie:
partant du noeud courant TBODY - "origin()" - atteindre le ième noeudenfant TR -
"child(i)" - et appliquer le gabarit correspondant à tous les descendants de type text -
"descendant(all,#text)". Le gabarit TBODY utilise donc une boucle d'itération sur toutes les lignes de la table
et s'écrit de la façon illustrée sur la figure 17.
Dans la réalité, il peut se produire que les lignes du tableau ne contiennent pas uniquement les renseignements afférents à chaque vol. Ainsi dans le présent exemple, certaines lignes sont utilisées pour la mise en page: elles sont repérées par un fond blanc, et sont suivies de 2 lignes de titre. C'est ce qui est répercuté dans le
script par la condition désignée par la référence 171 sur la figure 17.
Les lignes qui nous intéressent font l'objet d'un appel à la procéduregabarit chargée 2 5 de la mise en forme du contenu des colonnes (les descendants de type texte). C'est le
rôle de l'instruction désignée par la référence 172 sur la figure 17.
Le premier argument de la méthode " applyTemplates " est l'équation de navigation indiquée plus haut. Il existe un second argument " data ". Cet argument optionnel est
passé tel quel à toutes les procédures-gabarits appliquées.
Pour cet argument <" data ", le programmeur de ce script a choisi un objet chargé de collecter les renseignements contenus dans chaque ligne du tableau. C'est un objet ECMAScript classique, créé classiquement par l'opérateur " new " et désigné par la
référence 173 sur la figure 17.
La définition de l'objet " FlightData >" est locale - il est créé par le programmeur du script XF - et se trouve donc dans le contenu de la balise: <xf:scripts>. S'agissant d'un dispositif standard d'ECMAScript, on n'entrera pas ici dans le détail de la construction de cet objet. Il suffit d'indiquer que l'objet FlightData fournit les méthodes pour collecter les informations associées à chaque ligne décrivant un vol: date, heure, aéroport, numéro du vol, compagnie, etc. En passant cet objet à la procédure gabarit de tout noeud de type texte de la ligne du tableau, chaque champ de l'objet " data " sera complété au fur et à mesure. Lorsque tous ces procédures auront été appliquées, à savoir que la méthode "applyTemplate( > est terminée, l'instruction désignée par la référence 174 sur la figure 17 produira sur le fichier de
sortie le contenu textuel ainsi collecté.
La procédure-gabarit pour chaque portion de texte s'écrit simplement de la façon
illustrée sur la figure 18.
4.4.6. Résultats La figure 19 montre le résultat obtenu sur un téléphone WAP de marque Nokia, en parallèle avec les informations correspondantes identiques affichées sur un
2 5 navigateur de Toile standard.
4.4.7. Trace de contrôle La trace de contrôle (" log>" en terminologie anglo-saxonne) est un fichier de contrôle qui permet de suivre les étapes de la transformation. La trace générée pour l'exemple qui vient d'être décrit comprend les éléments suivants: - conversion 1: enregistrement des messages de corrections de l'analyseur syntaxique; le résultat de la conversion est une redirection (figure 20); - conversion 2, 3 et 4: autres redirections (figures 21 à 23 respectivement) - conversion 5: la page d'accueil de l'aéroport a été trouvée; le script de conversion XF renvoie une page au format WML vers le téléphone WAP; cette page comporte deux liens hypertexte, respectivement vers les Départs et vers les Arrivées. On notera
ici la constr-,tion " $(sid) " qui permet d'identifier l'utilisateur entre chaque requête.
La notation " $(x) " est quant à elle typique des téléphones WAP: elle indique une référence à la variable interne " x " que XF a généré dans l'électronique du téléphone. Le téléphone se connaît et s'identifie auprès du module "Broker>> du convertisseur XGate (figure 24); - conversion 6: l'utilisateur du téléphone s'intéresse aux départs; cette information nécessite une redirection (figure 25); - conversion 7; nouvelle redirection (figure 26); - conversion 8 et fin: le tableau des horaires de départ a été converti au format
WML, et est envoyé au téléphone WAP (figure 27).
4.5. Définition formelle du document XF: DTD Comme on l'a vu plus haut, le script de conversion XF est encapsulé dans un document balisé XML. A ce type de document correspond doit donc correspondre
une " Description Technique de Document " (DTD) qui est représentée sur la figure
28. Bien entendu, la présente invention n'est nullement limitée aux formes de réalisation décrites ci-dessus et représentées sur les dessins, mais l'homme du métier saura y
apporter de nombreuses variantes et modifications.
En particulier, l'homme du métier saura adapter les principes de l'invention aux nouvelles spécifications susceptibles d'apparaître dans la définition des documents 4.3 échangés par un réseau tel que l'Internet, dans la programmation et dans la modélisation d'objets, etc.

Claims (19)

RlEVENDICATIONS
1. Système de conversion de documents, destiné à transformer un premier document existant dans un premier format balisé à structure arborescente de noeuds en un second document dans un second format balisé à structure arborescente de noeuds, caractérisé en ce qu'il comprend: un ensemble de procédures-gabarits (Template), Mhaque procédure-gabarit dudit ensemble contenant une première information de sélection d'une étendue de parcours de la structure arborescente du premier document, une seconde information de sélection d'un type de balise du premier document auquel la procédure gabarit peut s'appliquer, et un ensemble d'une ou plusieurs actions, au moins certaines procédures gabarits contenant des actions de collecte d'informations délimitées par les balises dont le type correspond à celui défini par la seconde information de sélection de ces procédures gabarits, un programme contenant des instructions standard (applyTemplates) pour sélectivement appeler lesdites procédures gabarits, des moyens de traitement répondant audit programme et aptes, lors de l'appel d'une procédure-gabarit, à parcourir les noeuds de la structure arborescente inclus dans son étendue telle que définie par la première information de sélection de ladite procédure-gabarit, et pour chaque noeud parcouru, à déterminer si le type de balise correspondant audit noeud correspond à la seconde information de sélection et, dans l'affirmative, à exercer la ou les actions correspondantes, et des moyens aptes, à partir des actions de collecte contenues dans les
procédures-gabarits exécutées, pour construire le second document.
2. Système selon la revendication 1, caractérisé en ce que les actions d'au moins certaines procédures-gabarits contiennent des instructions d'appel d'autres
procédures gabarits.
3. Système selon la revendication 2, caractérisé en ce que la première information de sélection d'étendue d'une procédure-gabarit est basée sur un noeud de
départ constitué par le noeud à partir duquel ladite procédure-gabarit est appelée.
4. Système selon l'une des revendications 2 et 3, caractérisé en ce qu'au moins
certaines procédures-gabarits contiennent des actions de création de variables temporaires cloîtrées, et en ce que chacune de ces variables cloîtrées est héritéqar
toute procédure-gabarit appelée par de telles procédures-gabarits.
5. Système selon l'une des revendications 1 à 3, caractérisé en ce que les
procédures-gabarits comprennent une procédure-gabarit de base possédant la seconde information de sélection correspondant à un noeud racine de la structure
arborescente du premier document, et en ce que les actions de ladite procédure-
gabarit de base comprennent un appel de procédures-gabarits.
6. Système selon la revendication 5, caractérisé en ce que les actions de ladite procédure-gabarit de base comprennent un appel de procéduresgabarits dont la
seconde information de sélection correspond à un type de balise " corps ".
7. Système selon la revendication 6, caractérisé en ce que la structure arborescente de noeuds du premier document comprend des noeuds de type " cadre ", et en ce que les actions de ladite procédure-gabarit de base comprennent un appel de procédures-gabarits dont la seconde information de sélection correspond à un type de
balise " ensemble de cadres ".
8. Système selon l'une des revendications 1 à 7, caractérisé en ce qu'au moins
certaines procédures-gabarits comprennent au moins une action de redirection vers un premier document différent, sur lequel lesdits moyens de traitement sont
appliqués sur la base du même programme.
9. Système selon l'une des revendications 1 à 8, caractérisé Cen ce qu'au moins
certaines procédures gabarits comprennent au moins une action conditionnelle basée
sur le contenu d'une adresse d'accès au premier document.
10. Système selon l'une des revendications 1 à 9, caractérisé en ce qu'au moins
certaines procédures-gabarits comprennent au moins une action constituant une méthode d'un objet et/ou au moins une action constituant une fonction locale programmée.
11. Système selon la revendications I à 10, caractérisé en ce que certaines
procédures-gabarits comprennent une fonction locale d'ancrage apte à convertir une requête adaptée à la structure du second document en une adresse d'un premier
document contenant l'information recherchée.
12. Système selon l'une des revendications 1 à 11, caractérisé en ce que les
moyens de construction du second document comprennent des actions d'écriture contenues dans certaines procédures-gabarits dont la seconde information de sélection définit une balise à contenu, lesdites actions d'écriture étant aptes à
assembler de façon prédéterminée au moins une partie des contenus desdites balises.
13. Système selon l'une des revendications 1 à 12, caractérisé en ce que les
premiers documents comprennent des pages structurées dans un langage balisé standard adapté à une consultation sur poste informatique client via l'Internet et en ce que les seconds documents comprennent des pages structurées dans un second
2 5 langage balisé standard adapté à une consultation sur appareil miniature portable.
14. Système selon l'une des revendications 1 à 13, caractérisé en ce que les
moyens de traitement et de construction du second document opèrent en mode dynamique au cours d'une session entre un appareil apte à afficher des informations dans la structure des seconds documents et un serveur apte à fournir des informations
dans la structure des premiers documents.
15. Système selon l'une des revendications 1 à 14, caractérisé en ce qu'il
constitue un gradin d'une architecture multi-gradins.
16. Architecture informatique multi-gradins, caractérisée en ce qu'elle comprend en succession, reliés par réseau informatique, un premier gradin de consultation de dennées sur poste-client, un second gradin d'application sur serveur, un troisième gradin d'aggrégation de données comprenant un système de conversion
selon l'une des revendications 1 à 14 et un quatrième gradin comprenant une
pluralité de types de sources de données indépendantes.
17. Architecture selon la revendication 16, caractérisée en ce que la pluralité de types de sources de données indépendantes comprennent au moins deux types de sources parmi les serveurs Internet, les serveurs d'annuaires à accès rapide et les
serveurs de bases de données à accès standard par requêtes.
18. Architecture informatique/téléphonique multigradins, caractérisée en ce qu'elle comprend en succession, reliés par réseau informatique et par réseau téléphonique sans fil, un premier gradin de consultation de données sur un appareil portable tel qu'un téléphone portable, un second gradin de transport de données sans fil, un troisième gradin comprenant un système de conversion de documents selon
l'une des revendications 1 à 14 et un quatrième gradin comprenant au moins un type
de source de données.
19. Architecture selon la revendication 18, caractérisé en ce que ledit type de source de données consiste en des pages structurées dans un langage balisé standard adapté à une consultation sur poste informatique client, lesdites pages constituant des premiers documents, et en ce que le système de conversion compris dans le troisième gradin est apte à construire des seconds documents dans un second langage balisé
standard adapté à une consultation sur appareil miniature portable.
FR0009105A 2000-07-12 2000-07-12 Systeme de conversion de documents a structure arborescente par parcours selectif de ladite structure Expired - Fee Related FR2811782B1 (fr)

Priority Applications (2)

Application Number Priority Date Filing Date Title
FR0009105A FR2811782B1 (fr) 2000-07-12 2000-07-12 Systeme de conversion de documents a structure arborescente par parcours selectif de ladite structure
US09/904,170 US20020073119A1 (en) 2000-07-12 2001-07-11 Converting data having any of a plurality of markup formats and a tree structure

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0009105A FR2811782B1 (fr) 2000-07-12 2000-07-12 Systeme de conversion de documents a structure arborescente par parcours selectif de ladite structure

Publications (2)

Publication Number Publication Date
FR2811782A1 true FR2811782A1 (fr) 2002-01-18
FR2811782B1 FR2811782B1 (fr) 2003-09-26

Family

ID=8852395

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0009105A Expired - Fee Related FR2811782B1 (fr) 2000-07-12 2000-07-12 Systeme de conversion de documents a structure arborescente par parcours selectif de ladite structure

Country Status (2)

Country Link
US (1) US20020073119A1 (fr)
FR (1) FR2811782B1 (fr)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITTV20100122A1 (it) * 2010-09-03 2012-03-04 B & B Holding S R L Metodo e sistema per convertire documenti digitali
CN110795455A (zh) * 2019-09-06 2020-02-14 中国平安财产保险股份有限公司 依赖关系解析方法、电子装置、计算机设备及可读存储介质

Families Citing this family (123)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ479999A0 (en) * 1999-12-22 2000-02-03 Canon Kabushiki Kaisha Structures to represent poorly formed html documents
US20040049737A1 (en) * 2000-04-26 2004-03-11 Novarra, Inc. System and method for displaying information content with selective horizontal scrolling
US7072984B1 (en) 2000-04-26 2006-07-04 Novarra, Inc. System and method for accessing customized information over the internet using a browser for a plurality of electronic devices
US7500188B1 (en) 2000-04-26 2009-03-03 Novarra, Inc. System and method for adapting information content for an electronic device
US7747782B2 (en) * 2000-04-26 2010-06-29 Novarra, Inc. System and method for providing and displaying information content
US8149048B1 (en) 2000-10-26 2012-04-03 Cypress Semiconductor Corporation Apparatus and method for programmable power management in a programmable analog circuit block
US7765095B1 (en) 2000-10-26 2010-07-27 Cypress Semiconductor Corporation Conditional branching in an in-circuit emulation system
US6724220B1 (en) 2000-10-26 2004-04-20 Cyress Semiconductor Corporation Programmable microcontroller architecture (mixed analog/digital)
US8176296B2 (en) 2000-10-26 2012-05-08 Cypress Semiconductor Corporation Programmable microcontroller architecture
US8160864B1 (en) 2000-10-26 2012-04-17 Cypress Semiconductor Corporation In-circuit emulator and pod synchronized boot
US8103496B1 (en) 2000-10-26 2012-01-24 Cypress Semicondutor Corporation Breakpoint control in an in-circuit emulation system
US7213265B2 (en) * 2000-11-15 2007-05-01 Lockheed Martin Corporation Real time active network compartmentalization
US7225467B2 (en) * 2000-11-15 2007-05-29 Lockheed Martin Corporation Active intrusion resistant environment of layered object and compartment keys (airelock)
US20020143823A1 (en) * 2001-01-19 2002-10-03 Stevens Mark A. Conversion system for translating structured documents into multiple target formats
EP1241857A1 (fr) * 2001-03-15 2002-09-18 Nokia Corporation Méthode d'accès de fichiers stockés dans un terminal mobile supportant un protocole internet
US7703009B2 (en) * 2001-04-09 2010-04-20 Huang Evan S Extensible stylesheet designs using meta-tag information
US7305614B2 (en) * 2001-07-17 2007-12-04 International Business Machines Corporation Interoperable retrieval and deposit using annotated schema to interface between industrial document specification languages
US8307045B1 (en) 2001-08-22 2012-11-06 Open Text S.A. System and method for creating target-specific data conversion templates using a master style template
US6836857B2 (en) 2001-10-18 2004-12-28 Sun Microsystems, Inc. Mechanism for debugging a computer process
US6928449B2 (en) * 2001-10-18 2005-08-09 Sun Microsystems, Inc. Mechanism for facilitating backtracking
US7406674B1 (en) 2001-10-24 2008-07-29 Cypress Semiconductor Corporation Method and apparatus for generating microcontroller configuration information
US8078970B1 (en) 2001-11-09 2011-12-13 Cypress Semiconductor Corporation Graphical user interface with user-selectable list-box
JP2003150586A (ja) 2001-11-12 2003-05-23 Ntt Docomo Inc 文書変換システム、文書変換方法及び文書変換プログラムを記録したコンピュータ読み取り可能な記録媒体
US8042093B1 (en) 2001-11-15 2011-10-18 Cypress Semiconductor Corporation System providing automatic source code generation for personalization and parameterization of user modules
US7770113B1 (en) * 2001-11-19 2010-08-03 Cypress Semiconductor Corporation System and method for dynamically generating a configuration datasheet
US6971004B1 (en) 2001-11-19 2005-11-29 Cypress Semiconductor Corp. System and method of dynamically reconfiguring a programmable integrated circuit
US8069405B1 (en) 2001-11-19 2011-11-29 Cypress Semiconductor Corporation User interface for efficiently browsing an electronic document using data-driven tabs
US7774190B1 (en) 2001-11-19 2010-08-10 Cypress Semiconductor Corporation Sleep and stall in an in-circuit emulation system
US7844437B1 (en) 2001-11-19 2010-11-30 Cypress Semiconductor Corporation System and method for performing next placements and pruning of disallowed placements for programming an integrated circuit
US8103497B1 (en) 2002-03-28 2012-01-24 Cypress Semiconductor Corporation External interface for event architecture
AU2003226073A1 (en) * 2002-04-10 2003-10-27 Rsg Systems, Inc. Data exchange method and system
US7308608B1 (en) 2002-05-01 2007-12-11 Cypress Semiconductor Corporation Reconfigurable testing system and method
AU2003245506A1 (en) 2002-06-13 2003-12-31 Mark Logic Corporation Parent-child query indexing for xml databases
AU2003236514A1 (en) * 2002-06-13 2003-12-31 Mark Logic Corporation Xml database mixed structural-textual classification system
CA2393035A1 (fr) * 2002-07-11 2004-01-11 Ibm Canada Limited-Ibm Canada Limitee Conversion de fichiers en langage de balisage
WO2004010337A2 (fr) * 2002-07-22 2004-01-29 Contivo, Inc. Procede et systeme pour modeliser des composants dans un document
US7761845B1 (en) 2002-09-09 2010-07-20 Cypress Semiconductor Corporation Method for parameterizing a user module
US7146643B2 (en) * 2002-10-29 2006-12-05 Lockheed Martin Corporation Intrusion detection accelerator
US7080094B2 (en) * 2002-10-29 2006-07-18 Lockheed Martin Corporation Hardware accelerated validating parser
US20040083466A1 (en) * 2002-10-29 2004-04-29 Dapp Michael C. Hardware parser accelerator
US20070061884A1 (en) * 2002-10-29 2007-03-15 Dapp Michael C Intrusion detection accelerator
US7774831B2 (en) * 2002-12-24 2010-08-10 International Business Machines Corporation Methods and apparatus for processing markup language messages in a network
US20040133854A1 (en) * 2003-01-08 2004-07-08 Black Karl S. Persistent document object model
WO2004068320A2 (fr) * 2003-01-27 2004-08-12 Vincent Wen-Jeng Lue Procede et appareil permettant d'adapter des contenus web a differents dimensions de plage d'affichage
US7272258B2 (en) * 2003-01-29 2007-09-18 Ricoh Co., Ltd. Reformatting documents using document analysis information
CN100470480C (zh) * 2003-02-28 2009-03-18 洛克希德马丁公司 分析程序加速器装置以及更新其的方法
US7328219B2 (en) 2003-03-03 2008-02-05 Raytheon Company System and method for processing electronic data from multiple data sources
US20050015718A1 (en) * 2003-07-16 2005-01-20 Sambhus Mihir Y. Method and system for client aware content aggregation and rendering in a portal server
US7725875B2 (en) * 2003-09-04 2010-05-25 Pervasive Software, Inc. Automated world wide web navigation and content extraction
US20050060707A1 (en) * 2003-09-17 2005-03-17 Tunney William Patrick Method for iterating through elements of a collection
US7454660B1 (en) * 2003-10-13 2008-11-18 Sap Ag System and method for testing applications at the business layer
US20060031750A1 (en) * 2003-10-14 2006-02-09 Waldorf Jerry A Web browser as web service server
US7343554B2 (en) 2003-10-14 2008-03-11 Sun Microsystems, Inc. Mechanisms for supporting back button function of web browser as web service server in interaction with business process engine
US7506072B2 (en) * 2003-10-14 2009-03-17 Sun Microsystems, Inc. Web browser as web service server in interaction with business process engine
US20050198394A1 (en) * 2003-10-14 2005-09-08 Waldorf Jerry A. Data conversion from HTML to XML in a tree structure
US7437666B2 (en) * 2003-10-22 2008-10-14 Intel Corporation Expression grouping and evaluation
US7607099B2 (en) * 2003-11-03 2009-10-20 Intentional Software Corporation Method and system for reversible design tree transformations
US7640497B1 (en) * 2003-12-22 2009-12-29 Apple Inc. Transforming a hierarchical data structure according to requirements specified in a transformation template
US8161376B2 (en) * 2004-01-28 2012-04-17 Sankhya Technologies Private Limited Converting a heterogeneous document
GB2410814A (en) * 2004-02-05 2005-08-10 Stephen John Doyle Document conversion enabling browser content across different types of terminal devices
US7958132B2 (en) * 2004-02-10 2011-06-07 Microsoft Corporation Voting based scheme for electronic document node reuse
US7295049B1 (en) 2004-03-25 2007-11-13 Cypress Semiconductor Corporation Method and circuit for rapid alignment of signals
FR2868571B1 (fr) * 2004-04-05 2006-05-12 Bull Sa Sa Procede de reconnaissance et de referencement pour acces aux objets dynamiques dans les pages de navigation internet
US7539982B2 (en) * 2004-05-07 2009-05-26 International Business Machines Corporation XML based scripting language
US7302426B2 (en) * 2004-06-29 2007-11-27 Xerox Corporation Expanding a partially-correct list of category elements using an indexed document collection
US7558792B2 (en) * 2004-06-29 2009-07-07 Palo Alto Research Center Incorporated Automatic extraction of human-readable lists from structured documents
US7529731B2 (en) * 2004-06-29 2009-05-05 Xerox Corporation Automatic discovery of classification related to a category using an indexed document collection
US8286125B2 (en) 2004-08-13 2012-10-09 Cypress Semiconductor Corporation Model for a hardware device-independent method of defining embedded firmware for programmable systems
US8069436B2 (en) 2004-08-13 2011-11-29 Cypress Semiconductor Corporation Providing hardware independence to automate code generation of processing device firmware
US7451405B2 (en) 2004-09-15 2008-11-11 Research In Motion Limited Method for requesting and viewing a zoomed area of detail from an image attachment on a mobile communication device
GB0427807D0 (en) * 2004-12-18 2005-01-19 Ibm A method,apparatus and computer program for producing input to a transformation engine
US7603620B2 (en) * 2004-12-20 2009-10-13 Ricoh Co., Ltd. Creating visualizations of documents
US7332976B1 (en) 2005-02-04 2008-02-19 Cypress Semiconductor Corporation Poly-phase frequency synthesis oscillator
US7400183B1 (en) 2005-05-05 2008-07-15 Cypress Semiconductor Corporation Voltage controlled oscillator delay cell and method
US7577900B2 (en) * 2005-05-13 2009-08-18 Harris Corporation Mechanism for maintaining data format synchronization between different entities
US8078740B2 (en) 2005-06-03 2011-12-13 Microsoft Corporation Running internet applications with low rights
US20060277224A1 (en) * 2005-06-07 2006-12-07 Microsoft Corporation Synchronizing arbitrary data using a flexible schema
US8089461B2 (en) 2005-06-23 2012-01-03 Cypress Semiconductor Corporation Touch wake for electronic devices
US8225392B2 (en) * 2005-07-15 2012-07-17 Microsoft Corporation Immunizing HTML browsers and extensions from known vulnerabilities
US8239939B2 (en) 2005-07-15 2012-08-07 Microsoft Corporation Browser protection module
US7921367B2 (en) * 2005-12-20 2011-04-05 Oracle International Corp. Application generator for data transformation applications
US9207917B2 (en) 2005-12-20 2015-12-08 Oralce International Corporation Application generator for data transformation applications
US8085067B1 (en) 2005-12-21 2011-12-27 Cypress Semiconductor Corporation Differential-to-single ended signal converter circuit and method
US7761789B2 (en) 2006-01-13 2010-07-20 Ricoh Company, Ltd. Methods for computing a navigation path
US8082496B1 (en) * 2006-01-26 2011-12-20 Adobe Systems Incorporated Producing a set of operations from an output description
US7788579B2 (en) * 2006-03-06 2010-08-31 Ricoh Co., Ltd. Automated document layout design
US8067948B2 (en) 2006-03-27 2011-11-29 Cypress Semiconductor Corporation Input/output multiplexer bus
US8185737B2 (en) 2006-06-23 2012-05-22 Microsoft Corporation Communication across domains
US7680756B2 (en) * 2006-12-29 2010-03-16 Intuit Inc. System and method for creating and implementing community defined presentation structures
WO2008098174A1 (fr) * 2007-02-09 2008-08-14 Novarra, Inc. Procédé et appareil de distribution de contenu d'informations en vue de l'affichage sur un dispositif client
US20080235564A1 (en) * 2007-03-21 2008-09-25 Ricoh Co., Ltd. Methods for converting electronic content descriptions
US8584042B2 (en) 2007-03-21 2013-11-12 Ricoh Co., Ltd. Methods for scanning, printing, and copying multimedia thumbnails
US8812969B2 (en) * 2007-03-21 2014-08-19 Ricoh Co., Ltd. Methods for authoring and interacting with multimedia representations of documents
US8583637B2 (en) * 2007-03-21 2013-11-12 Ricoh Co., Ltd. Coarse-to-fine navigation through paginated documents retrieved by a text search engine
US7647317B2 (en) * 2007-03-30 2010-01-12 Microsoft Corporation Search techniques for page-based document layouts
US8026739B2 (en) 2007-04-17 2011-09-27 Cypress Semiconductor Corporation System level interconnect with programmable switching
US8516025B2 (en) 2007-04-17 2013-08-20 Cypress Semiconductor Corporation Clock driven dynamic datapath chaining
US8040266B2 (en) 2007-04-17 2011-10-18 Cypress Semiconductor Corporation Programmable sigma-delta analog-to-digital converter
US7737724B2 (en) 2007-04-17 2010-06-15 Cypress Semiconductor Corporation Universal digital block interconnection and channel routing
US9564902B2 (en) 2007-04-17 2017-02-07 Cypress Semiconductor Corporation Dynamically configurable and re-configurable data path
US8130025B2 (en) 2007-04-17 2012-03-06 Cypress Semiconductor Corporation Numerical band gap
US8065653B1 (en) 2007-04-25 2011-11-22 Cypress Semiconductor Corporation Configuration of programmable IC design elements
US9720805B1 (en) 2007-04-25 2017-08-01 Cypress Semiconductor Corporation System and method for controlling a target device
US8266575B1 (en) 2007-04-25 2012-09-11 Cypress Semiconductor Corporation Systems and methods for dynamically reconfiguring a programmable system on a chip
US10019570B2 (en) * 2007-06-14 2018-07-10 Microsoft Technology Licensing, Llc Protection and communication abstractions for web browsers
US8266630B2 (en) * 2007-09-03 2012-09-11 International Business Machines Corporation High-performance XML processing in a common event infrastructure
US8049569B1 (en) 2007-09-05 2011-11-01 Cypress Semiconductor Corporation Circuit and method for improving the accuracy of a crystal-less oscillator having dual-frequency modes
US20090150905A1 (en) * 2007-12-11 2009-06-11 Nortel Networks, Limited Integrating non-xml protocols into web browsing applications
US9356805B2 (en) * 2008-06-06 2016-05-31 International Business Machines Corporation Implementing a plurality of interface definitions
US8522135B2 (en) * 2008-06-06 2013-08-27 International Business Machines Corporation Generating a transformation description document for transforming messages
US20100005112A1 (en) * 2008-07-01 2010-01-07 Sap Ag Html file conversion
US11379880B1 (en) * 2008-09-23 2022-07-05 Yahoo Ad Tech Llc Systems and methods for administering an online advertiser bidding interface
US20100162142A1 (en) * 2008-12-22 2010-06-24 Lockheed Martin Corporation Common style sheets for compiled and scripting language applications
US8332815B2 (en) * 2009-03-17 2012-12-11 International Business Machines Corporation Enhanced development tool for utilizing a javascript object notation (JSON) bridge for non-java-based component communication within java-based composite applications
US9448964B2 (en) 2009-05-04 2016-09-20 Cypress Semiconductor Corporation Autonomous control in a programmable system
US20110035655A1 (en) * 2009-08-04 2011-02-10 Sap Ag Generating Forms Using One or More Transformation Rules
US20110218822A1 (en) * 2010-03-04 2011-09-08 Koninklijke Philips Electronics N.V. Remote patient management system adapted for generating a teleconsultation report
US8516362B2 (en) * 2010-09-14 2013-08-20 Usablenet Inc. Methods for extending a document transformation server to process multiple documents from multiple sites and devices thereof
US8819624B2 (en) * 2011-09-26 2014-08-26 Intel Corporation Simulation of web applications and secondary devices in a web browser, web application development tools, and methods using the same
KR101416712B1 (ko) * 2012-07-12 2014-07-09 김영근 정형 및 비정형 데이터를 xml 문서에 구현하는 방법
US20140258816A1 (en) * 2013-03-08 2014-09-11 True Xiong Methodology to dynamically rearrange web content for consumer devices
CN110019968B (zh) * 2017-10-27 2021-04-09 北大方正集团有限公司 Xml文件的处理方法和装置
US11194833B2 (en) * 2019-10-28 2021-12-07 Charbel Gerges El Gemayel Interchange data format system and method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0949571A2 (fr) * 1998-04-07 1999-10-13 Xerox Corporation Systèmes pour la re-conception de documents et méthodes pour rendre l'accès à la toile Internet indépendant de l'appareil

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6279015B1 (en) * 1997-12-23 2001-08-21 Ricoh Company, Ltd. Method and apparatus for providing a graphical user interface for creating and editing a mapping of a first structural description to a second structural description
US7702995B2 (en) * 2000-04-24 2010-04-20 TVWorks, LLC. Method and system for transforming content for execution on multiple platforms
US7747782B2 (en) * 2000-04-26 2010-06-29 Novarra, Inc. System and method for providing and displaying information content

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0949571A2 (fr) * 1998-04-07 1999-10-13 Xerox Corporation Systèmes pour la re-conception de documents et méthodes pour rendre l'accès à la toile Internet indépendant de l'appareil

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"XGate- White Paper; The enterprise, its data and XGate", JAXO, 6 December 1998 (1998-12-06), pages 1 - 23, XP002168330, Retrieved from the Internet <URL:http://w.w.w.jaxo.com> [retrieved on 20010410] *
WEI-YING MA ET AL: "Framework for adaptive content delivery in heterogeneous network environments", MULTIMEDIA COMPUTING AND NETWORKING 2000, SAN-JOSE, CA, USA; PROCEEDINGS OF THE SPIE - THE INTERNATIONAL SOCIETY FOR OPTICAL ENGINEERING, 2000., 24 January 2000 (2000-01-24), pages 86 - 100, XP002168331, ISSN: 0277 -786X, Retrieved from the Internet <URL:http://www.cooltown.hp.com/papers/adcon/MMCN2000> [retrieved on 20010410] *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITTV20100122A1 (it) * 2010-09-03 2012-03-04 B & B Holding S R L Metodo e sistema per convertire documenti digitali
WO2012028978A1 (fr) * 2010-09-03 2012-03-08 B + B Holding S.R.L. Procédé et système de conversion de documents numériques
CN110795455A (zh) * 2019-09-06 2020-02-14 中国平安财产保险股份有限公司 依赖关系解析方法、电子装置、计算机设备及可读存储介质
CN110795455B (zh) * 2019-09-06 2023-11-21 中国平安财产保险股份有限公司 依赖关系解析方法、电子装置、计算机设备及可读存储介质

Also Published As

Publication number Publication date
FR2811782B1 (fr) 2003-09-26
US20020073119A1 (en) 2002-06-13

Similar Documents

Publication Publication Date Title
FR2811782A1 (fr) Systeme de conversion de documents a structure arborescente par parcours selectif de ladite structure
Bonzanini Mastering social media mining with Python
Munzert et al. Automated data collection with R: A practical guide to web scraping and text mining
Richardson et al. RESTful web services
Frischmuth et al. Ontowiki–an authoring, publication and visualization interface for the data web
WO2010149427A1 (fr) Un assistant-conseiller utilisant l&#39;analyse semantique des echanges communautaires
FR2809509A1 (fr) Systeme et procede d&#39;internationalisation du contenu de documents a balises dans un systeme informatique
FR2906383A1 (fr) Referentiel semantique de services web et procede utilisant ce referentiel
Chatterjee et al. Python social media analytics
CN107925698A (zh) 文件类型相关的查询系统
Briola et al. Agent‐oriented and ontology‐driven digital libraries: The IndianaMAS experience
Ravulavaru Google Cloud AI Services Quick Start Guide: Build Intelligent Applications with Google Cloud AI Services
FR2912275A1 (fr) Procede de transmission d&#39;au moins un contenu representatif d&#39;un service, depuis un serveur vers un terminal, dispositif et produit programme d&#39;ordinateur correspondants
Griffin Foundations of Popfly: rapid mashup development
Khan Information society in global age
EP1194868B1 (fr) Methode et systeme de creation de documents electroniques - auto-publiants et adaptatifs
O'Toole Sustainable Web Ecosystem Design
Reese et al. Java for Data Science
Ubels Understanding abstract geo-information workflows and converting them to executable workflows using Semantic Web technologies
Ahmed Towards a utility framework for enterprise business intelligence mashups
Floyd Using XSLT
WO2009141539A2 (fr) Procede et systeme de configuration de documents
Mc Kelvey The capabilities of XML and its interaction with legacy databases
WO2020104743A1 (fr) Procédé de création de documents numériques interactifs
Mohammad Evaluating the Suitability of the MERN Stack in the Development of Food Delivery Applications

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20070330