FR2781629A1 - Automatic alphabet discrimination method for restoring HTML documents in original language, based on analysis of suffix component of URL address - Google Patents

Automatic alphabet discrimination method for restoring HTML documents in original language, based on analysis of suffix component of URL address Download PDF

Info

Publication number
FR2781629A1
FR2781629A1 FR9809559A FR9809559A FR2781629A1 FR 2781629 A1 FR2781629 A1 FR 2781629A1 FR 9809559 A FR9809559 A FR 9809559A FR 9809559 A FR9809559 A FR 9809559A FR 2781629 A1 FR2781629 A1 FR 2781629A1
Authority
FR
France
Prior art keywords
alphabet
document
current document
current
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9809559A
Other languages
French (fr)
Other versions
FR2781629B1 (en
Inventor
Jean Pierre Martiniere
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Priority to FR9809559A priority Critical patent/FR2781629B1/en
Publication of FR2781629A1 publication Critical patent/FR2781629A1/en
Application granted granted Critical
Publication of FR2781629B1 publication Critical patent/FR2781629B1/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

The method involves determining the address suffix of a URL and based on successful determination, ordering the reception of the document. At least one reference alphabet is determined for the document as a function of its header data describing the alphabet used, or if this is unsuccessful, a default alphabet is assigned. Independent claims are included for a system interfacing a terminal and server over an IP network, and for a gateway interfacing system between a videotex terminal and a server over the PSTN.

Description

Procédé de discrimination automatique d'un alphabet pour la restitutionMethod of automatic discrimination of an alphabet for restitution

visuelle ou sonore d'un document HTML,  visual or audio of an HTML document,

et dispositif de gestion de documents HTML correspondant.  and corresponding HTML document management device.

L'invention concerne un procédé de discrimination automatique d'un alphabet, notamment pour la restitution visuelle ou sonore d'un document HTML et un dispositif de gestion de documents HTML correspondant. Par "restitution  The invention relates to a method for automatic discrimination of an alphabet, in particular for the visual or audible reproduction of an HTML document and a device for managing HTML documents. By "restitution

visuelle ou sonore", on entend la visualisation du docu-  visual or audible ", we mean viewing the document

ment et/ou sa lecture vocale.and / or its voice reading.

L'essor considérable de l'échange de données de  The considerable boom in data exchange from

tout type, données, textes ou fichiers image, par l'inter-  any type, data, text or image files, through

médiaire des réseaux de télécommunication, notamment le réseau INTERNET, pose le problème de la communication de  of telecommunications networks, in particular the INTERNET network, poses the problem of the communication of

leurs utilisateurs à partir de cultures et de langues dif-  their users from different cultures and languages

férentes. A l'heure actuelle les documents transmis sur le réseau INTERNET sont transmis sous forme de documents  férentes. At the present time the documents transmitted on the INTERNET network are transmitted in the form of documents

HTML, pour Hyper Text Mark-up Language en langage anglo-  HTML, for Hyper Text Mark-up Language in English language

saxon. Les documents HTML ou compatibles, tels que SGML ou XML, sont constitués généralement d'un fichier HTML et d'éléments associés, tels que par exemple des fichiers image et/ou son, ou d'autres fichiers HTML. Le passage d'un document à un autre se fait généralement à partir  Saxon. HTML or compatible documents, such as SGML or XML, generally consist of an HTML file and associated elements, such as for example image and / or sound files, or other HTML files. The passage from one document to another is generally done from

d'un lien, élément pointant vers une adresse URL. L'asso-  of a link, element pointing to a URL address. Lasso-

ciation de fichiers HTML à un premier fichier HTML (appelé "frame") se fait généralement par référence à l'adresse URL de ces fichiers. Ces adresses URL sont relatives à un  Citation of HTML files to a first HTML file (called "frame") is generally done by reference to the URL address of these files. These URLs relate to a

site, tel qu'un site WEB installé sur ce réseau. WEB dési-  site, such as a WEB site installed on this network. WEB desi-

gne en abrégé le système hypermédia WWW (World-Wide Web)  short for WWW (World-Wide Web) hypermedia system

en langage anglo-saxon.in Anglo-Saxon language.

Les documents précités, couramment appelés docu-  The above documents, commonly called docu-

ments HTML, peuvent donc être écrits, par leurs auteurs, à  HTML elements, can therefore be written, by their authors, to

partir d'alphabets étrangers pour l'utilisateur ayant sol-  from foreign alphabets for the user having sol-

licité et obtenu l'accès à ces documents.  lawful and obtained access to these documents.

Ces documents sont habituellement accessibles, par l'intermédiaire de tout fournisseur d'accès, à partir de  These documents are usually accessible, through any access provider, from

tout terminal interconnecté au réseau INTERNET et habili-  any terminal interconnected to the INTERNET network and authorized

té.you.

En particulier l'accès et l'affichage de ces docu-  In particular the access and display of these documents

ments est actuellement obtenu: - à partir d'un micro ordinateur, dont le clavier et les caractères d'affichage sont notamment adaptés à l'alphabet du pays, ce micro ordinateur étant équipé d'un  is currently obtained: - from a microcomputer, whose keyboard and display characters are particularly adapted to the alphabet of the country, this microcomputer being equipped with a

logiciel spécifique désigné par browser en langage anglo-  specific software designated by browser in English language

saxon, permettant de traiter, des alphabets répondant à la norme W3C, ainsi que des documents écrits d'une manière  Saxon, allowing to treat, alphabets answering the standard W3C, as well as documents written in a way

spécifique dans la langue nationale officielle ou offi-  specific in the official or official national language

ciellement reconnue de ce pays; - en effectuant une opération manuelle, préalable  officially recognized from this country; - by carrying out a manual operation, prior

ou a posteriori à la lecture d'un tel document, qui con-  or after reading such a document, which

siste en général à choisir, pour la machine ou le termi-  is generally to choose, for the machine or the termi-

nal, le type d'alphabet que ce dernier doit utiliser; - à partir d'un décodeur à la norme HTML 4.x et  nal, the type of alphabet the latter should use; - from a HTML 4.x standard decoder and

capable de décoder des documents écrits suivant le stan-  able to decode documents written according to the standard

dard UNICODE ou de détecter les marqueurs placés en tête  UNICODE dart or to detect the markers placed at the head

du document aux fins de préciser l'alphabet qui a été ini-  of the document for the purpose of specifying the alphabet that was initiated

tialement utilisé pour composer ce dernier. On rappelle que le standard UNICODE est défini par la norme ISO/IEC 10 646.  specially used to compose the latter. Remember that the UNICODE standard is defined by the ISO / IEC 10 646 standard.

Toutefois certains pays ont mis en place un procé-  However, some countries have put in place a process

dé spécifique, basé généralement sur des normes existan-  specific die, generally based on existing standards

tes, afin de permettre une adaptation à la langue natio-  in order to allow adaptation to the native language

nale officielle ou officiellement reconnue de ce pays. Ce type de procédé consiste en la récupération de documents  official or officially recognized nal of this country. This type of process consists of recovering documents

d'information existants, en la mise en oeuvre d'outils lo-  of existing information, by implementing lo-

giciels permettant de composer des documents dans cette  software to compose documents in this

langue. Chacun de ces procédés constitue en fait un stan-  language. Each of these processes in fact constitutes a stan-

dard de codage et risque fort, dans chaque pays, de perdu-  coding sting and high risk, in each country, of losing

rer. En outre il existe actuellement une variété relative de terminaux d'accès aux réseaux INTERNET, certains de ces  rer. In addition there are currently a relative variety of Internet access terminals, some of these

derniers ne permettant que des opérations d'affichage li-  only allowing display operations li-

mitées. C'est en particulier le cas des premières versions de terminaux à bas coût, lesquelles permettent l'affichage d'un alphabet satisfaisant à la norme ISO 8859-1, alphabet par défaut, mais n'acceptant aucunement l'affichage au  moths. This is in particular the case with the first versions of low-cost terminals, which allow the display of an alphabet satisfying the ISO 8859-1 standard, alphabet by default, but not accepting display at all.

standard UNICODE ni même d'autres définitions ISO d'alpha-  UNICODE standard or even other ISO definitions of alpha-

bets divers.various bets.

La présente invention a pour objet de remédier aux  The object of the present invention is to remedy the

inconvénients liés à la diversité des situations préci-  disadvantages linked to the diversity of the above situations

tées, subis par les utilisateurs du réseau INTERNET, afin de permettre, notamment, la restitution visuelle ou sonore  ted, suffered by users of the INTERNET network, in order to allow, in particular, visual or audio reproduction

des documents HTML dans leur langue d'origine et leur pré-  HTML documents in their original language and pre-

sentation initiale.initial feeling.

Un autre objet de la présente invention est égale-  Another object of the present invention is also

ment la mise en oeuvre d'un procédé de discrimination auto-  ment the implementation of a process of self-discrimination

matique d'un alphabet pour la visualisation d'un document  subject of an alphabet for viewing a document

HTML afin de permettre, pour les terminaux actuels et fu-  HTML to allow, for current and future terminals

turs acceptant le standard UNICODE, la conversion de ces  turs accepting the UNICODE standard, the conversion of these

documents HTML au standard d'affichage UNICODE précité.  HTML documents with the aforementioned UNICODE display standard.

Un autre objet de la présente invention est, éga-  Another object of the present invention is, also

lement, la mise en oeuvre d'un procédé de discrimination  The implementation of a discrimination process

automatique d'un alphabet pour la visualisation d'un docu-  automatic alphabet for viewing a document

ment HTML, par conversion pour visualisation de tout ou partie du document HTML considéré sous forme de cellules  HTML, by conversion for viewing all or part of the HTML document considered in the form of cells

images dans un format déterminé.images in a specific format.

Un autre objet de la présente invention est, éga-  Another object of the present invention is, also

lement, la mise en oeuvre d'un procédé de discrimination  The implementation of a discrimination process

automatique d'un alphabet pour la visualisation d'un docu-  automatic alphabet for viewing a document

ment HTML, par conversion pour visualisation de tout ou partie du document HTML considéré sous forme de polices de  HTML, by conversion for viewing all or part of the HTML document considered in the form of fonts

caractères résidentes et/ou téléchargeables dans les ter-  characters resident and / or downloadable in the ter-

minaux.mineral.

Un autre objet de la présente invention est, éga-  Another object of the present invention is, also

lement, la mise en oeuvre d'un procédé de discrimination  The implementation of a discrimination process

automatique d'un alphabet, et plus précisément d'une lan-  automatic of an alphabet, and more precisely of a lan-

gue, pour réaliser la lecture vocale de tout ou partie du  gue, to perform voice playback of all or part of the

document HTML considéré.HTML document considered.

Un autre objet de la présente invention est, éga-  Another object of the present invention is, also

lement, la mise en oeuvre d'un procédé de discrimination  The implementation of a discrimination process

automatique d'un alphabet pour la visualisation d'un docu-  automatic alphabet for viewing a document

ment HTML, par conversion pour visualisation de tout ou partie du document HTML considéré sous forme de caractères DRCS, pour Dynamical Redefinition Character Set en langage anglo-saxon, directement utilisables par les terminaux de  HTML ment, by conversion for visualization of all or part of the HTML document considered in the form of DRCS characters, for Dynamical Redefinition Character Set in English language, directly usable by the terminals of

type VIDEOTEX.VIDEOTEX type.

Un autre objet de la présente invention est, éga-  Another object of the present invention is, also

lement, la mise en ouvre d'un procédé de discrimination  The implementation of a discrimination process

automatique d'un alphabet, et plus précisément d'une lan-  automatic of an alphabet, and more precisely of a lan-

gue, pour réaliser la restitution de tout ou partie d'un  gue, to carry out the restitution of all or part of a

document HTML sous forme d'un service de type AUDIOTEL.  HTML document in the form of an AUDIOTEL type service.

Le procédé de discrimination automatique d'un al-  The process of automatic discrimination of an al-

phabet pour la restitution visuelle ou sonore d'un docu-  phabet for visual or audio reproduction of a document

ment HTML dans sa langue d'origine et sa présentation initiale, ce document étant délivré par un site WEB suite à la sélection, par exemple, d'une adresse URL déterminée,  HTML in its original language and its initial presentation, this document being delivered by a WEB site following the selection, for example, of a determined URL address,

conforme à l'objet de la présente invention, est remarqua-  in accordance with the object of the present invention, is remarkable

ble en ce qu'il comporte au moins, pour chaque document HTML courant, les étapes consistant à discriminer dans les adresses URL le suffixe constitutif de cette adresse URL, et suite à la discrimination ou la nondiscrimination de  ble in that it comprises at least, for each current HTML document, the steps consisting in discriminating in the URL addresses the constitutive suffix of this URL address, and following the discrimination or nondiscrimination of

ce suffixe, à commander la réception de ce document cou-  this suffix, to order the receipt of this document

rant, et à déterminer, relativement au document courant, au moins un alphabet de référence en fonction de données d'en-tête de documents descriptives de l'alphabet utilisé,  rant, and to determine, relative to the current document, at least one reference alphabet as a function of header data of documents descriptive of the alphabet used,

et sur réponse positive à cette étape consistant à déter-  and on positive response to this step consisting in determining

miner un alphabet de référence, à affecter à ce document  mine a reference alphabet, to assign to this document

courant l'alphabet de référence déterminé précité.  running the aforementioned determined reference alphabet.

La présente invention a également pour objet la  The present invention also relates to the

mise en ouvre, dans un système d'interfaçage et d'adapta-  implementation, in an interfacing and adaptation system

tion entre un terminal d'accès à un serveur interconnecté  between an access terminal to an interconnected server

à ce serveur par un réseau ou dans un système d'interfa-  to this server through a network or in an interface system

çage de type passerelle entre un terminal de type VIDEOTEX  gateway type connection between a VIDEOTEX type terminal

et un serveur interconnecté à ce système de type passe-  and a server interconnected to this pass-type system

relle par l'intermédiaire d'un réseau soumis à un proto-  through a network subject to a proto

cole d'intercommunication de type IP et de communication de documents HTML, d'un dispositif de gestion automatique  IP type intercommunication and HTML document communication school, automatic management system

de l'alphabet choisi pour la restitution visuelle ou so-  of the alphabet chosen for visual or social restitution

nore de ces documents HTML.of these HTML documents.

Elle sera mieux comprise à la lecture de la des-  It will be better understood on reading the

cription et à l'observation des dessins ci-après dans les-  description and observation of the drawings below in the

quels: - la figure la représente, à titre illustratif, un  which: - the figure represents, by way of illustration, a

organigramme relatif au procédé objet de la présente in-  flowchart relating to the process which is the subject of this information

vention permettant une opération de reconnaissance de  vention allowing a recognition operation of

l'alphabet utilisé par un document HTML courant et d'allo-  the alphabet used by a current HTML document and allo-

cation à ce document d'un alphabet reconnu, l'alphabet re-  cation to this document of a recognized alphabet, the alphabet re-

connu étant explicitement défini, autre qu'un alphabet par défaut, ou correspondant au codage UNICODE; - la figure lb représente, en liaison avec la figure  known being explicitly defined, other than a default alphabet, or corresponding to UNICODE coding; - Figure lb shows, in conjunction with Figure

la, à titre illustratif, un organigramme relatif au procé-  the, by way of illustration, an organization chart relating to the process

dé objet de la présente invention permettant une opération d'allocation d'un alphabet par défaut respectivement d'un alphabet défini estimé, dit alphabet de référence, lorsque aucun alphabet utilisé par le document HTML courant n'est reconnu, l'alphabet défini estimé étant déterminé par une procédure d'estimation spécifique; - la figure lc représente de manière illustrative, le principe d'un processus de masquage appliqué à des mots reconnus de différentes langues, sur un diagramme gradué  object of the present invention allowing an operation of allocating a default alphabet respectively an estimated defined alphabet, called reference alphabet, when no alphabet used by the current HTML document is recognized, the estimated defined alphabet being determined by a specific estimation procedure; - Figure lc illustrates, in an illustrative way, the principle of a masking process applied to recognized words of different languages, on a graduated diagram

en nombre de mots pour une pluralité de langues considé-  in number of words for a plurality of languages considered

rées; - la figure 2a représente un schéma fonctionnel d'un système d'interfaçage et d'adaptation entre un terminal  rees; - Figure 2a shows a block diagram of an interface and adaptation system between a terminal

d'accès à un serveur interconnecté à ce serveur par un ré-  access to a server interconnected with this server by a

seau de type INTERNET équipé d'un module d'analyse et de transformation de documents HTML, dans lequel est implanté un dispositif de gestion automatique de l'alphabet choisi pour la restitution visuelle ou sonore de ces documents  INTERNET type bucket equipped with an HTML document analysis and transformation module, in which is installed an automatic alphabet management device chosen for the visual or audio reproduction of these documents

HTML, conformément au procédé objet de la présente inven-  HTML, in accordance with the process which is the subject of this invention

tion;tion;

- la figure 2b représente un organigramme général re-  - Figure 2b shows a general flowchart

latif à un mode opératoire donné à titre d'exemple non li-  relative to a procedure given by way of nonlimited example

mitatif du dispositif de gestion automatique implanté dans  mitative of the automatic management system implanted in

le module d'analyse et de transformation du système d'in-  the analysis and transformation module of the information system

terfaçage et d'adaptation représenté en figure 2a; -7 - la figure 3a représente un schéma fonctionnel d'un système d'interfaçage de type passerelle entre un terminal de type VIDEOTEX et un serveur interconnecté à ce système de type passerelle par l'intermédiaire d'un réseau soumis  facing and adaptation shown in Figure 2a; FIG. 3a represents a functional diagram of a gateway type interface system between a VIDEOTEX type terminal and a server interconnected to this gateway type system by means of a subject network.

à un protocole d'intercommunication de type IP et de com-  to an IP type intercom and communication protocol

munication de documents HTML, dans lequel est implanté un dispositif de gestion automatique de l'alphabet choisi pour la restitution visuelle ou sonore de ces documents  munication of HTML documents, in which is installed an automatic management system of the alphabet chosen for the visual or audio reproduction of these documents

HTML, conformément au procédé objet de la présente inven-  HTML, in accordance with the process which is the subject of this invention

tion;tion;

- la figure 3b représente un organigramme général re-  - Figure 3b shows a general flowchart

latif à un mode opératoire donné à titre d'exemple non li-  relative to a procedure given by way of nonlimited example

mitatif du dispositif de gestion automatique implanté dans  mitative of the automatic management system implanted in

la passerelle du système d'interfaçage et d'adaptation re-  the gateway to the interfacing and adaptation system

présenté en figure 3a; - la figure 4a représente la visualisation, en France, d'un document HTML délivré par un site WEB situé en Grèce en présentation initiale établie à partir de l'alphabet grec, en l'absence de toute mise en oeuvre du procédé objet de la présente invention; - la figure 4b représente la visualisation, en France, du document HTML représenté en figure 4a, lors de  shown in Figure 3a; FIG. 4a represents the visualization, in France, of an HTML document delivered by a WEB site located in Greece in initial presentation established from the Greek alphabet, in the absence of any implementation of the process object of the present invention; FIG. 4b represents the visualization, in France, of the HTML document represented in FIG. 4a, during

la mise en oeuvre du procédé objet de la présente inven-  the implementation of the process which is the subject of this invention

tion, les caractères de l'alphabet grec d'origine étant restaurés; - la figure 5a représente la visualisation, en France, d'un document HTML délivré par un site WEB situé  tion, the characters of the original Greek alphabet being restored; - Figure 5a shows the display, in France, of an HTML document issued by a WEB site located

au Japon en présentation initiale établie à partir d'idéo-  in Japan in initial presentation based on ideo-

grammes japonais, en l'absence de toute mise en oeuvre du procédé objet de la présente invention; - la figure 5b représente la visualisation, en France, du document HTML représenté en figure 5a, lors de  Japanese grams, in the absence of any implementation of the process which is the subject of the present invention; FIG. 5b represents the visualization, in France, of the HTML document represented in FIG. 5a, during

la mise en oeuvre du procédé objet de la présente inven-  the implementation of the process which is the subject of this invention

tion, les idéogrammes d'origine étant restaurés sous forme de cellules images affichées sur un terminal de type  tion, the original ideograms being restored in the form of image cells displayed on a terminal of the type

VIDEOTEX.VIDEOTEX.

Une description plus détaillée du procédé de discri-  A more detailed description of the discrimination process

mination automatique d'un alphabet ou d'une langue pour la restitution visuelle ou sonore d'un document HTML conforme à l'objet de la présente invention sera maintenant donnée en liaison avec les figures la et lb. D'une manière générale, on rappelle qu'un document  automatic mination of an alphabet or a language for the visual or audio reproduction of an HTML document in accordance with the object of the present invention will now be given in conjunction with FIGS. In general, we recall that a document

HTML est transmis dans sa langue d'origine et sa présenta-  HTML is transmitted in its original language and its presentation

tion initiale à partir d'un site WEB délivrant ce dernier à partir d'une adresse URL déterminée. La sélection d'une  initial tion from a WEB site delivering the latter from a determined URL address. The selection of a

adresse URL permet ainsi d'obtenir les documents HTML dis-  URL address thus makes it possible to obtain the HTML documents available

ponibles au niveau du site WEB précité.  available at the aforementioned WEB site.

Ainsi qu'il a été représenté en figure la, lorsque l'utilisateur sur son terminal sélectionne une adresse URL le procédé objet de la présente invention, en référence à la figure la, pour ce document courant délivré par l'adresse URL demandée, consiste à mettre en ouvre une fonction type d'alphabet consistant au moins en une étape (a) à discriminer dans l'adresse URL précitée le suffixe constitutif de cette adresse URL. On rappelle en effet que les adresses URL comportent habituellement une chaîne de caractères dont l'extension symbolisée par un point et un suffixe est significative du pays dans lequel le site WEB  As shown in FIG. 1a, when the user on his terminal selects a URL address, the method which is the subject of the present invention, with reference to FIG. 1a, for this current document delivered by the requested URL address, consists to implement a standard alphabet function consisting of at least one step (a) in discriminating in the aforementioned URL address the constituent suffix of this URL address. It should be remembered that URL addresses usually include a character string whose extension symbolized by a period and a suffix is significant for the country in which the WEB site

accédé et interrogé est situé et donc de la langue d'ori-  accessed and interrogated is located and therefore of the original language

gine dans laquelle le document HTML correspondant a été normalement établi. Ainsi on rappelle que les extensions courantes sont.gr, pour la Grèce,.ru, pour la Russie, fr, pour la France,.ch pour la Chine,.jp, pour le Japon  gine in which the corresponding HTML document was normally drawn up. Thus we recall that the current extensions are .gr, for Greece, .ru, for Russia, fr, for France, .ch for China, .jp, for Japan

et ainsi de suite.And so on.

Cette étape de discrimination est suivie par exemple d'une étape de mémorisation d'une valeur logique de suf-  This discrimination step is followed for example by a step of memorizing a logical value of suf-

fixe notée VS à laquelle est attribuée la valeur 1 lors-  fixed denoted VS to which the value 1 is assigned when

qu'un suffixe a été reconnu et à laquelle est au contraire  that a suffix has been recognized and to which is on the contrary

attribuée la valeur 0 lorsqu'aucun suffixe n'a été recon-  assigned the value 0 when no suffix has been recognized

nu. En tout état de cause, la valeur logique attribuée à  bare. In any event, the logical value assigned to

la variable VS est mémorisée pour utilisation ultérieure.  the variable VS is stored for later use.

Le procédé objet de la présente invention consiste, suite à la discrimination ou à la non-discrimination du  The process which is the subject of the present invention consists, following discrimination or non-discrimination of the

suffixe précité et à l'allocation de la valeur 0 ou la va-  above suffix and the allocation of the value 0 or the value

leur 1 à la variable logique VS à commander en une étape (b) la réception proprement dite du document courant  their 1 to the logic variable VS to order in a step (b) the actual reception of the current document

c'est-à-dire l'admission pour restitution visuelle ou so-  i.e. admission for visual or visual restitution

nore au niveau du terminal de ce dernier, l'instruction de  nore at the terminal of the latter, the instruction of

restitution visuelle ou sonore n'étant toutefois pas appe-  however, visual or audio reproduction is not called

lée pour la restitution visuelle ou sonore du document  for the visual or audio reproduction of the document

courant.current.

L'étape (b) de commande de réception de ce document  Step (b) to order receipt of this document

courant est alors suivie d'une étape (c) consistant à dé-  current is then followed by a step (c) consisting of

terminer pour ce document courant au moins un alphabet de référence susceptible d'être alloué au document courant  complete for this current document at least one reference alphabet that can be allocated to the current document

considéré.considered.

D'une manière particulièrement avantageuse, on indi-  In a particularly advantageous manner, it is indicated

que que l'alphabet de référence peut consister en l'alpha-  that the reference alphabet can consist of alpha-

bet défini explicitement dans l'en-tête et/ou dans le document d'information relatif au document HTML courant et /ou le cas échéant en la reconnaissance, pour le document  bet explicitly defined in the header and / or in the information document relating to the current HTML document and / or where appropriate in recognition, for the document

courant, d'un codage de type UNICODE, ainsi que des carac-  standard, of a UNICODE type coding, as well as

tères et/ou de séquences privées ou correspondant à des alphabets ISO adoptés en standard dans le pays d'origine, dont émane le document HTML courant considéré. On rappelle  tères and / or sequences private or corresponding to ISO alphabets adopted as standard in the country of origin, from which the current HTML document considered emanates. We recall

que le sigle ISO désigne l'Institute for Standard Organi-  that the acronym ISO indicates the Institute for Standard Organi-

zation en langage anglo-saxon. A titre d'exemple non limitatif on indique que dans les documents HTML établis au Japon ou à tout le moins "japonisés" la séquence de code lB 24 42 indique que les caractères qui suivent cette séquence sont relatifs à des idéogrammes définis dans le jeu JIS alors que la séquence  zation in Anglo-Saxon language. By way of nonlimiting example, it is indicated that in HTML documents established in Japan or at least "Japanese" the code sequence lB 24 42 indicates that the characters which follow this sequence relate to ideograms defined in the JIS game while the sequence

de code lB 28 42 introduit le codage HTML proprement dit.  of code lB 28 42 introduces the actual HTML coding.

Sur réponse positive à l'étape (c) précitée, c'est-à-  Upon a positive response to the aforementioned step (c), i.e.

dire lors de la reconnaissance de l'un des alphabets pré-  say when recognizing one of the pre-

cités comme alphabet de référence, le procédé objet de la présente invention consiste alors à affecter, à l'étape (d), au document courant l'alphabet de référence précité  cited as a reference alphabet, the method which is the subject of the present invention then consists in assigning, in step (d), to the current document the aforementioned reference alphabet

c'est-à-dire l'un des alphabets reconnu, alphabet particu-  that is to say one of the recognized alphabets, particular alphabet

lier ou par défaut. A l'étape (d) précitée l'allocation au document courant de l'alphabet de référence est notée  link or default. In step (d) above, the allocation to the current document of the reference alphabet is noted

VAL PC = VALR.VAL PC = VALR.

En outre, de manière non limitative, à la même étape  In addition, without limitation, at the same stage

(d), et pour une notion de complétude du caractère itéra-  (d), and for a notion of completeness of the iterative character

tif du procédé objet de la présente invention relatif à  tif of the process which is the subject of the present invention relating to

tout document HTML successif, à une variable représenta-  any successive HTML document, to a representative variable

tive de l'alphabet du document HTML précédent notée  tive from the alphabet of the previous HTML document noted

VALPP, qui n'est autre bien entendu que le document cou-  VALPP, which is of course none other than the document

rant actuel, est également alloué l'alphabet de référence précité cette opération étant notée à l'étape (d) de la figure la VAL PP = VAL R. L'étape (d) en tant que telle est alors suivie d'une  rant current, is also allocated the aforementioned reference alphabet this operation being noted in step (d) of the figure the VAL PP = VAL R. The step (d) as such is then followed by a

étape de fin de procédure puisque pour la restitution vi-  end of procedure stage since for the restitution vi-

suelle ou sonore du document courant précité et le cas  soot or sound of the aforementioned current document and the case

échéant de tout document ultérieur à partir de ce même do-  any subsequent document from that same document.

cument courant constituant le document précédent de ce dernier a été attribué un alphabet de référence consistant en l'un des alphabets, reconnu à l'étape (c). D'une ma- nière générale on indique que l'étape de fin de procédure peut consister en un appel d'une fonction de traitement de document pour assurer une mise en page du document courant  current cument constituting the previous document of the latter has been assigned a reference alphabet consisting of one of the alphabets, recognized in step (c). In general, it is indicated that the end of procedure step can consist of a call to a document processing function to ensure a layout of the current document.

précité et finalement assurer un affichage et/ou une lec-  above and finally ensure a display and / or a read-

ture vocale de ce dernier.voice ture of the latter.

Le procédé objet de la présente invention tel que dé-  The process which is the subject of the present invention such as

crit précédemment en liaison avec la figure la permet une restitution visuelle satisfaisante pour la majorité des terminaux et navigateurs modernes satisfaisant à la norme  previously written in connection with FIG. 1a allows a satisfactory visual reproduction for the majority of modern terminals and browsers meeting the standard

HTML 4.x.HTML 4.x.

Cependant, lorsqu'un alphabet au sens ISO du terme est commun à plusieurs langues, comme l'est par exemple l'alphabet par défaut ISO LATIN 1 (ISO0-8859-1), une façon avantageuse mais non limitative de permettre la définition plus précise de la langue à utiliser, notamment pour la restitution sonore du document, va consister, sur réponse positive à l'étape (c), entre autres: au cours d'une étape (g'), à identifier dans les données à restituer un ensemble de mots distinctifs vis-à-vis d'une pluralité de dictionnaires réduits de mots préétablis non communs à plusieurs langues d'origine et mémoriser cette opération de comparaison et d'identification sous forme de listes de mots classées par nombre de mots détectés par langue d'origine et par nombre total de mots, pour établir une  However, when an alphabet in the ISO sense of the term is common to several languages, such as the default alphabet ISO LATIN 1 (ISO0-8859-1), an advantageous but non-limiting way of allowing more definition specifies the language to be used, in particular for the sound reproduction of the document, will consist, upon a positive response in step (c), among others: during a step (g '), to be identified in the data to be restored a set of distinctive words vis-à-vis a plurality of reduced dictionaries of preset words not common to several original languages and memorize this comparison and identification operation in the form of lists of words classified by number of words detected by original language and by total number of words, to establish a

pluralité de variables de classement du nombre de mots dé-  plurality of classification variables for the number of words

tectés par langue d'origine et par nombre total de mots;  tect by original language and by total number of words;

au cours d'une étape (h'), à soumettre les données à res-  during a step (h '), to submit the data to res-

tituer du document courant à un test d'existence ou de non existence d'une fin de document du document courant, et,  to replace the current document with a test for the existence or non-existence of an end of document of the current document, and,

sur réponse positive à ce test d'existence ou de non exis-  on positive response to this test of existence or nonexistence

tence d'une fin de document, (i') allouer au document cou- rant une langue de référence choisie en fonction de la valeur d'au moins une variable de classement du nombre de mots détectés par langue d'origine et par nombre total de mots. Toutefois, et en raison de la diversité des matériels  tence of an end of document, (i ') allocate to the current document a reference language chosen as a function of the value of at least one classification variable of the number of words detected by original language and by total number of words. However, and due to the diversity of materials

connectés à ce réseau précédemment mentionnée dans la des-  connected to this network previously mentioned in the

cription, lorsqu'en référence à l'étape (c) de détermina-  cription, when with reference to step (c) of determining

tion d'au moins un alphabet de référence aucun alphabet défini explicitement dans l'en-tête et/ou dans le document d'information relatif au document HTML n'est détecté ou lorsque le codage UNICODE du document n'est pas détecté ou que des séquences privées ou correspondant à un alphabet  tion of at least one reference alphabet no alphabet defined explicitly in the header and / or in the information document relating to the HTML document is detected or when the UNICODE encoding of the document is not detected or that private sequences or corresponding to an alphabet

ISO autre que celui par défaut, ne sont pas non plus dé-  ISO other than the default, are also not de-

tectées, la réponse à l'étape (c) de détermination est  the response to step (c) of determination is

alors négative.then negative.

Dans un tel cas et conformément à un mode de réalisa-  In such a case and in accordance with an embodiment

tion particulier non limitatif du procédé objet de la pré-  particular non-limiting indication of the process which is the subject of the pre-

sente invention, ce procédé consiste en outre dans une étape (e) à allouer au document courant un alphabet par  sente invention, this method further consists in a step (e) to allocate to the current document an alphabet by

défaut. Cette opération est notée VALPC = AD, AD dési-  default. This operation is noted VALPC = AD, AD desi-

gnant l'alphabet par défaut sur la figure la à l'étape (e). Bien entendu, l'allocation d'un alphabet par défaut à l'étape (e) n'est pas une fin en soi mais constitue, en fait, une solution d'affichage minimal en vue d'assurer  gaining the default alphabet in figure la in step (e). Of course, the allocation of a default alphabet in step (e) is not an end in itself but constitutes, in fact, a minimal display solution in order to ensure

l'affichage et/ou la lecture vocale du document HTML cou-  display and / or voice reading of the HTML document

rant correspondant.rant corresponding.

En conséquence, ainsi que représenté sur la figure la  Consequently, as shown in the figure la

l'étape (e) peut alors être suivie d'une étape (f) consis-  step (e) can then be followed by step (f) consisting of

tant à soumettre les données à restituer du document HTML  both to submit the data to be returned from the HTML document

courant à un processus de filtrage consistant, par exem-  current to a consistent filtering process, e.g.

ple, à discriminer le pourcentage des valeurs de code de ces données à restituer, ce pourcentage de valeurs de code étant noté N. valeurs de code notées CODE comprises entre une première et une deuxième valeurs limites pour établir  ple, to discriminate the percentage of code values of these data to be restored, this percentage of code values being noted N. code values noted CODE comprised between a first and a second limit value to establish

une valeur de pourcentage descriptive de code de ces don-  a descriptive percentage code value of these data

nées à restituer pour le document courant considéré. On  to be returned for the current document considered. We

conçoit bien sûr qu'en fonction de la valeur de pourcen-  of course understands that depending on the value of percent

tage N précitée le procédé objet de la présente invention permet d'établir et de discriminer un alphabet autre que  tage N above the process which is the subject of the present invention makes it possible to establish and discriminate an alphabet other than

l'alphabet par défaut précité, mais susceptible de présen-  the aforementioned default alphabet, but likely to present

ter une meilleure adaptation à la représentation et l'af-  ter a better adaptation to the representation and the af-

fichage et/ou la lecture vocale du document HTML courant  file and / or voice reading of the current HTML document

dans sa version linguistique d'origine.  in its original language version.

Dans un mode de réalisation préférentiel non limita-  In a preferred, non-limiting embodiment,

tif on indique que la première et la deuxième valeurs li-  tif we indicate that the first and second values li-

mites peuvent être prises égales à la valeur A0 et à la valeur FF respectivement, ces valeurs étant exprimées dans ce cas en code hexadécimal. Le pourcentage des valeurs de  mites can be taken equal to the value A0 and the value FF respectively, these values being expressed in this case in hexadecimal code. The percentage of the values of

code comprises entre les valeurs limites précitées est no-  code between the aforementioned limit values is no-

té N, N étant exprimé en %.tee N, N being expressed in%.

L'étape (f) précitée est alors elle-même suivie d'une  The aforementioned step (f) is then itself followed by a

étape (g) de recherche d'un alphabet ou d'une langue par-  step (g) of finding an alphabet or a language by

ticulier dans le document HTML courant, cette étape de re-  particular in the current HTML document, this step of re-

cherche d'un ou d'une langue alphabet particulier  looking for a particular alphabet language or

consistant à identifier et repérer dans les données à res-  consisting in identifying and locating in the data to be

* tituer précitées un ensemble de mots distinctifs, par com-* titrate above a set of distinctive words, by

paraison et identification de ces mots distinctifs vis-à-  comparison and identification of these distinctive words vis-à-vis

vis d'une pluralité de dictionnaires réduits de mots pré-  vis a plurality of reduced dictionaries of pre-

établis, non communs à plusieurs langues d'origine.  established, not common to several languages of origin.

L'opération réalisée à l'étape (g) précitée peut être réalisée de façon à obtenir avantageusement un classement par nombre de mots différents détectés par langue et par  The operation carried out in the aforementioned step (g) can be carried out so as to advantageously obtain a classification by number of different words detected by language and by

nombre total de mots.total number of words.

On comprend en particulier que le mode opératoire précité à l'étape (g) représenté en figure la permet alors  It is understood in particular that the above-mentioned operating mode in step (g) represented in the figure then allows it

d'établir une pluralité de variables de classement du nom-  to establish a plurality of name classification variables-

bre des mots détectés par langue d'origine, c'est-à-dire  number of words detected by original language, i.e.

en fait par alphabet permettant d'exprimer une telle lan-  actually by alphabet allowing to express such a lan-

gue d'origine, et bien entendu par nombre total de mots  original word, and of course by total number of words

dans la langue d'origine considérée.  in the original language considered.

D'une manière générale on indique que les variables  In general, we indicate that the variables

de classement peuvent être organisées en fichiers succes-  can be organized into successive files

sifs tels que représentés schématiquement dans le tableau ci-après: Alphabet Ai Alphabet A2 Alphabet AN-1 Alphabet AN NBMotdifférents NB Mot différents NB_Mot différents NBMotdifférents Alphali Alpha2 AlphaN-1 AlphaN TotalMot_ 1 A1 TotalMot_ 1 A2 Total Mot_ 1 AN-1 TotalMot 1 AN Total Mot 2 Ai Total Mot 2 A2 ITotal Mot 2 AN-1 Total Mot 2 AN Total_Mot 3 A1 Total_Mot_3 A2 TotalMot_3_AN-1 Total_Mot 3 AN TotalMotN-lA1 TotalMotN-lA2 TotalMotN-1iAN-1 TotalMotN-lAN Total_Mot NA1 [TotalMotN A2 Total Mot N AN-1 Total Mot N AN  as shown schematically in the table below: Alphabet Ai Alphabet A2 Alphabet AN-1 Alphabet AN NBMotdifferent NB Different word NB_Mot different NBMotdifferent Alphali Alpha2 AlphaN-1 AlphaN TotalMot_ 1 A1 TotalMot_ 1 A2 Total Mot_ 1 AN-1 TotalMot 1 AN Total Word 2 Ai Total Word 2 A2 ITotal Word 2 AN-1 Total Word 2 AN Total_Mot 3 A1 Total_Mot_3 A2 TotalMot_3_AN-1 Total_Mot 3 AN TotalMotN-lA1 TotalMotN-lA2 TotalMotN-1iAN-1 TotalMotN-lAN Total_Mot NA1 [TotalMotN A2 Total Word N AN-1 Total Word N AN

Dans le tableau précité, on indique que chaque dic-  In the above table, it is indicated that each dic-

tionnaire réduit peut comporter par exemple entre cinq et dix mots pour chaque langue ou alphabet support de chaque  reduced tionnaire can include for example between five and ten words for each language or support alphabet of each

langue considérée. A titre d'exemple non limitatif on in-  language considered. By way of nonlimiting example, we in-

dique que les mots du dictionnaire réduit de chaque langue sont des mots à forte fréquence de répétition, spécifiques à chaque langue considérée, tels que les articles, les pronoms personnels, adjectifs possessifs soit pour le français le, la, les, je, tu, il, mon, ton, son, pour l'anglais the, my, you etc. Dans le tableau précité les différents alphabets sont  states that the words in the reduced dictionary of each language are words with a high frequency of repetition, specific to each language considered, such as articles, personal pronouns, possessive adjectives, either for French le, la, les, je, tu, il, mon, ton, son, for English the, my, you etc. In the above table the different alphabets are

notés alphabet A1 à alphabet An le nombre des mots diffé-  noted alphabet A1 to alphabet An the number of different words

rents sont notés Total mot 1 A1 pour le premier mot de  rents are noted Total word 1 A1 for the first word of

l'alphabet A1, Totalmot_1 A2 pour le premier mot de l'al-  the alphabet A1, Totalmot_1 A2 for the first word of the al-

phabet A2 et ainsi de suite. L'ensemble est alors classé  phabet A2 and so on. The whole is then classified

ainsi que représenté au tableau précité.  as shown in the above table.

On comprend bien sûr que l'étape (g) de recherche d'un alphabet ou d'une langue particulier par analyse et  We understand of course that step (g) of searching for a particular alphabet or language by analysis and

comparaison des mots par rapport aux mots des dictionnai-  comparison of words against words in dictionaries

res réduits est réalisée pour chaque mot du document cou-  reduced res is performed for each word of the document

rant considéré. Pour cette raison, après chaque mot de ce dernier les données à restituer sont soumises à une étape (h) consistant à soumettre les données à restituer de ce document courant à un test d'existence ou de non-existence d'une fin de document de ce dernier. Ce test peut être simplement réalisé par la détection d'un code de fin de document pour le document HTML considéré, ou par détection de la réception complète du document, ou sur réception  rant considered. For this reason, after each word of the latter the data to be restored are subjected to a step (h) consisting in subjecting the data to be restored of this current document to a test of existence or non-existence of an end of document. of the last. This test can be simply carried out by detecting an end-of-document code for the HTML document considered, or by detecting the complete reception of the document, or upon reception

d'une partie du document jugée suffisante pour faire abou-  of part of the document deemed sufficient to terminate

tir le procédé de l'invention, ou encore par détection  from the process of the invention, or by detection

d'un code de fin de fichier.an end of file code.

Sur réponse négative au test d'existence de fin de document de l'étape (h) le processus est poursuivi pour le mot suivant par retour à l'étape (b) réception de document par exemple. On comprend en effet que l'étape réception de document (b) précitée peut être réalisée relativement au  On a negative response to the end-of-document existence test of step (h), the process is continued for the next word by returning to step (b) receiving the document for example. It is in fact understood that the above-mentioned document reception step (b) can be carried out relative to the

mot successif constitutif du document HTML courant consi-  successive word constituting the current HTML document considered

déré. Au contraire sur réponse positive au test de l'étape (h) précédemment mentionnée, le procédé objet de la pré- sente invention consiste à allouer au document courant un  déré. On the contrary, on a positive response to the test of step (h) previously mentioned, the method which is the subject of the present invention consists in allocating to the current document a

alphabet de référence choisi en fonction de la valeur des-  reference alphabet chosen according to the value of-

criptive de pourcentage de code de ces données à resti-  code percentage code of this data to resti-

tuer, la valeur N précitée, pour le document courant  kill, the aforementioned value N, for the current document

considéré et de la valeur d'au moins une variable de clas-  considered and the value of at least one class variable

sement du nombre de mots détectés par langue d'origine et par nombre total de mots. On conçoit par exemple à titre  the number of words detected by original language and by total number of words. We conceive for example as

d'exemple non limitatif qu'une procédure permettant d'al-  non-limiting example that a procedure allowing

louer au document courant un alphabet de référence corres-  rent a corresponding reference alphabet from the current document

pondant à celui choisi à l'étape (g) peut consister à prendre par exemple comme alphabet de référence celui qui  corresponding to that chosen in step (g) can consist in taking for example as a reference alphabet the one which

correspond à la somme du nombre total de mots du diction-  is the sum of the total number of words in the diction-

naire réduit correspondant dont la valeur est la plus forte. Ce mode de réalisation simple n'est pas forcément le plus adapté et il est préférable, en particulier, de soumettre le processus précité, ainsi que représenté sur la figure la en une étape (i), à un test supplémentaire consistant en une comparaison de la valeur descriptive de  corresponding reduced naire with the highest value. This simple embodiment is not necessarily the most suitable and it is preferable, in particular, to subject the aforementioned process, as shown in FIG. 1a in a step (i), to an additional test consisting of a comparison of the descriptive value of

pourcentage de code de données à restituer, pour le docu- ment courant considéré, soit la valeur N précitée, à une valeur de seuil.  percentage of data code to be restored, for the current document considered, ie the aforementioned value N, to a threshold value.

Ce test de comparaison, noté dans ces conditions il sur la figure la peut par exemple consister à comparer la valeur N de pourcentage précité à une valeur  This comparison test, noted under these conditions in FIG. 1a, can for example consist in comparing the value N of the aforementioned percentage with a value

de seuil de référence qui peut être prise égale à 50%.  of reference threshold which can be taken equal to 50%.

Le test réalisé à l'étape (i) et en particulier (il) peut alors être suivi de manière avantageuse d'une étape de mémorisation d'une variable logique C2 représentant la  The test carried out in step (i) and in particular (it) can then be advantageously followed by a step of memorizing a logic variable C2 representing the

condition 2 précitée, à cette variable logique étant at-  condition 2 above, with this logical variable being at-

tribuée la valeur 1 sur réponse positive au test il précé-  tributed the value 1 on positive response to the test it precedes

demment mentionné alors que sur réponse négative au test il précité est allouée une valeur 0 à la variable logique C2. Les étapes de mémorisation précédemment mentionnées peuvent alors être suivies soit du choix de la somme du nombre de mots majoritaires précédemment mentionnés, soit d'un processus beaucoup plus élaboré lequel sera décrit en  Also mentioned when a negative response to the above test is assigned a value 0 to the logic variable C2. The previously mentioned memorization steps can then be followed either by the choice of the sum of the number of majority words previously mentioned, or by a much more elaborate process which will be described in

liaison avec la figure lb ci-après.  link with Figure lb below.

En référence à la figure lb précédemment citée, le test (i) de la figure la, suite à la mémorisation de la variable logique C2, peut comprendre et être suivi, ainsi que représenté sur la figure lb d'au moins un test (j) de reconnaissance de discrimination ou de non-discrimination du suffixe précédemment cité, ce test pouvant alors être simplement réalisé par appel de la variable logique VS  With reference to FIG. 1b previously cited, the test (i) of FIG. 1a, following the storage of the logic variable C2, can understand and be followed, as shown in FIG. 1b of at least one test (j ) recognition of discrimination or non-discrimination of the aforementioned suffix, this test can then be simply carried out by calling the logic variable VS

précédemment mentionnée dans la description et comparaison  previously mentioned in description and comparison

de la valeur de cette variable logique à la valeur 1. Le  from the value of this logic variable to the value 1. The

suffixe ayant été mémorisé précédemment, il est alors pos-  suffix having been memorized previously, it is then pos-

sible de poursuivre l'étape (i) précitée dans le mode de  likely to continue the above step (i) in the mode of

réalisation préférentiel ci-après.  preferential realization below.

Sur réponse positive au test (j) précédemment men-  On positive response to the test (j) previously men-

tionné, un test (k) est prévu consistant à effectuer un  tioned, a test (k) is planned consisting in carrying out a

premier critère de choix d'un alphabet spécifique respec-  first criterion for choosing a specific alphabet respec-

tivement de l'alphabet par défaut alloué à l'étape (e) précédente. Ce premier critère de choix peut consister par  of the default alphabet allocated in step (e) above. This first criterion of choice may consist of

exemple en une comparaison de la variable logique C2 rela-  example in a comparison of the logical variable C2 related

tive à la condition 2 à la valeur 1. Sur réponse positive au test (k) précité, et donc au premier critère de choix,  tive at condition 2 to the value 1. On positive response to the above test (k), and therefore to the first selection criterion,

une étape (k2) est introduite consistant à allouer au do-  a step (k2) is introduced consisting in allocating to the do-

cument courant un alphabet spécifique comme alphabet de référence en fonction du type de suffixe reconnu. Cette opération est notée VAL_PC, variable relative à l'alphabet du document courant, = VALR l'alphabet reconnu étant pris comme alphabet de référence. De la même manière que dans le cas de l'étape (d), cet alphabet spécifique en une étape (kl) est également  Current cument a specific alphabet as a reference alphabet depending on the type of suffix recognized. This operation is noted VAL_PC, variable relating to the alphabet of the current document, = VALR the recognized alphabet being taken as reference alphabet. In the same way as in step (d), this specific alphabet in one step (kl) is also

alloué au document précédant le document courant ulté-  allocated to the document preceding the current document

rieur, c'est-à-dire au document courant actuel. Cette opé-  laughing, that is to say the current document. This operation

ration est notée de la même manière que dans le cas de  ration is noted in the same way as in the case of

l'étape (d) VALPP = VAL_R.step (d) VALPP = VAL_R.

Au contraire, lorsque le test (k) sur la variable lo-  On the contrary, when the test (k) on the variable lo-

gique C2 n'est pas satisfait, et donc sur réponse négative au premier critère de choix 1, au document courant est  gic C2 is not satisfied, and therefore on a negative response to the first choice criterion 1, the current document is

alors alloué l'alphabet par défaut tel que défini précé-  then allocated the default alphabet as defined above

demment avec l'étape (e) comme alphabet de référence.  Use step (e) as the reference alphabet.

L'étape (1) est notée affichage par défaut sur la figure lb. De la même manière que relativement à l'étape (kl) précédemment décrite, cet alphabet par défaut peut alors  Step (1) is noted default display in Figure lb. In the same way as with step (kl) previously described, this default alphabet can then

être alloué au document précédant le document courant ul-  be allocated to the document preceding the current document ul-

térieur. Sur réponse négative au test (j) précité, la variable  térieur. On negative response to the above test (j), the variable

logique VS étant différente de la valeur 1 avec les con-  VS logic being different from the value 1 with the con-

ventions précédemment définies, un deuxième critère de  previously defined, a second criterion of

choix d'un alphabet spécifique respectivement de l'alpha-  choice of a specific alphabet respectively of alpha-

bet par défaut est alors introduit. Ce deuxième critère de choix porte la référence m et consiste en un test de la variable logique C2 relative à la condition 2 précédemment définie à l'étape (il) à la valeur 1. Sur réponse négative au deuxième critère de choix m précité, le procédé objet de la présente invention consiste à effectuer un affichage  default bet is then introduced. This second choice criterion carries the reference m and consists of a test of the logical variable C2 relating to condition 2 previously defined in step (ii) at the value 1. On a negative response to the second choice criterion m above, the method object of the present invention is to perform a display

et/ou une lecture vocale par défaut, c'est-à-dire l'affi-  and / or a default voice reading, i.e. the display

chage et/ou la lecture vocale par défaut tel(s) que défi-  chage and / or default voice playback as defined

ni(s) à l'étape (1) précédemment décrite dans la  nor (s) in step (1) previously described in the

description. Ainsi à l'étape (1) précitée, au document  description. Thus in the above-mentioned step (1), in the document

courant est alloué comme alphabet de référence, l'alphabet  current is allocated as the reference alphabet, the alphabet

par défaut. On indique que l'étape (1) d'affichage par dé-  by default. It is indicated that the step (1) of display by

faut est alors suivie d'une étape de fin de procédure sem-  is then followed by a semi-procedural end step

blable à celle qui a été décrite en liaison avec l'étape  similar to that described in connection with step

(d) précédemment mentionnée dans la description. Il en est  (d) previously mentioned in the description. It is

de même pour les étapes (kl) et (k2) précédemment décri-  similarly for steps (kl) and (k2) previously described

tes.your.

De la même manière que sur réponse négative au pre-  In the same way as on a negative response to the first

mier critère de choix k, la réponse négative au deuxième critère de choix m implique l'appel de l'étape (1) et en  mier choice criterion k, the negative response to the second choice criterion m implies the call of step (1) and in

particulier l'allocation de l'alphabet par défaut au docu-  particular the allocation of the alphabet by default to the docu-

ment précédant le document courant ultérieur dans des con-  preceding the subsequent current document in con-

ditions semblables.similar editions.

Sur réponse positive au deuxième critère de choix m, le procédé objet de la présente invention consiste alors à effectuer un troisième critère de test (n) d'allocation au document précédant le document courant d'un alphabet de référence, c'est-à-dire d'un alphabet autre que l'alphabet  On a positive response to the second selection criterion m, the method which is the subject of the present invention then consists in performing a third test criterion (n) for allocation to the document preceding the current document with a reference alphabet, that is to say -to say of an alphabet other than the alphabet

par défaut.by default.

Sur réponse positive au troisième critère de test n précité, une opération d'allocation au document courant de l'alphabet de référence alloué au document précédant le  On positive response to the third test criterion n above, an operation to allocate to the current document the reference alphabet allocated to the document preceding the

document courant est effectuée à l'étape (o), cette opéra-  current document is performed in step (o), this operation

tion étant notée en conséquence VAL PC = VALPP. L'étape  tion being noted accordingly VAL PC = VALPP. The stage

(o) précitée est alors suivie de l'étape de fin de procé-  (o) above is then followed by the end of process step.

dure précédemment mentionnée dans la description.  duration previously mentioned in the description.

Au contraire, sur réponse négative à l'étape (n) de troisième critère de test, un quatrième critère de test p est alors réalisé, ce quatrième critère de test consistant  On the contrary, on a negative response to step (n) of the third test criterion, a fourth test criterion p is then carried out, this fourth test criterion consisting

en fait en un test de reconnaissance d'au moins un alpha-  actually in a recognition test of at least one alpha-

bet pour déterminer un alphabet reconnu. A titre d'exemple non limitatif, on indique que le quatrième critère de test p peut consister à effectuer une comparaison pl de mots caractéristiques d'un ou plusieurs alphabets avec un masque de décision prédéfini tel qu'un  bet to determine a recognized alphabet. By way of nonlimiting example, it is indicated that the fourth test criterion p may consist in carrying out a comparison pl of words characteristic of one or more alphabets with a predefined decision mask such as a

OU logique par exemple.OR logical for example.

En référence à la figure lc on indique que la fonc-  With reference to FIG. 1c, it is indicated that the function

tion de masquage peut être introduite lorsqu'il existe une ambiguïté sur le nombre de mots reconnus par rapport à deux langues, les langues L1 et L4 par exemple, ainsi que  masking can be introduced when there is ambiguity in the number of words recognized in relation to two languages, languages L1 and L4 for example, as well as

relativement à leur distance, par rapport aux autres lan-  relative to their distance from other lan-

gues telles que les langues L2 et L3 lorsque ces distances  gues such as languages L2 and L3 when these distances

ne sont pas considérées comme significatives.  are not considered significant.

L'étape (pl) de comparaison des mots peut alors être suivie d'une étape (p2) consistant à définir l'existence ou la non-existence d'un alphabet. Ce critère consiste simplement à appliquer aux variables logiques obtenues par l'application du OU logique de masquage d'une comparaison  The step (pl) of comparing words can then be followed by a step (p2) consisting in defining the existence or non-existence of an alphabet. This criterion consists simply in applying to the logical variables obtained by applying the logical OR of masking a comparison

à la valeur 1 de cette variable logique.  at the value 1 of this logic variable.

Sur réponse positive au critère d'existence d'un al-  Upon a positive response to the criterion of existence of an al-

phabet p2 et donc sur réponse positive au quatrième cri-  phabet p2 and therefore on positive response to the fourth cry-

tère de test p le procédé objet de la présente invention  test mother p the process which is the subject of the present invention

consiste alors en une étape (q) à allouer au document cou-  then consists of a step (q) to allocate to the document

rant l'alphabet reconnu, cet alphabet reconnu étant pris comme alphabet de référence, cette opération est notée VAL PC = alphabet reconnu au test q précité. De la même manière que dans le cas des opérations k2 et kl ou de l'étape (d) cet alphabet reconnu est également alloué au  rant the recognized alphabet, this recognized alphabet being taken as the reference alphabet, this operation is denoted VAL PC = alphabet recognized in the aforementioned test q. In the same way as in the case of operations k2 and kl or in step (d) this recognized alphabet is also allocated to the

document précédant le document courant ultérieur, c'est-à-  document preceding the subsequent current document, i.e.

dire au document courant. Cette opération est notée de la même manière VALPP = alphabet reconnu. L'étape (q) est bien entendu suivie de l'étape de fin de procédure précé-  tell the current document. This operation is noted in the same way VALPP = recognized alphabet. Step (q) is of course followed by the step at the end of the previous procedure.

demment mentionnée dans la description.  as mentioned in the description.

Au contraire sur réponse négative à l'étape (p2) de critère d'alphabet, c'est-à-dire, sur réponse négative au quatrième critère de test p de reconnaissance d'au moins  On the contrary, on a negative response to step (p2) of the alphabet criterion, that is to say, on a negative response to the fourth test criterion p of recognition of at least

un alphabet, aucun alphabet n'ayant pu être reconnu con-  an alphabet, no alphabet having been recognized

formément à la mise en ouvre du procédé objet de la pré-  formally to the implementation of the process object of the pre-

sente invention, une étape (r) est alors réalisée  invention, step (r) is then carried out

consistant à permettre une levée de doute quant à la re-  consisting in allowing a removal of doubt as to the

connaissance de l'alphabet par l'utilisateur. Cette étape consiste alors à effectuer un choix manuel d'un alphabet  knowledge of the alphabet by the user. This step then consists in making a manual choice of an alphabet

par ce dernier. Cet alphabet constitue un alphabet préci-  by the latter. This alphabet constitutes a preci-

sé, lequel est alors alloué au document courant, et, de la même manière que relativement aux étapes (q), (kl), (k2)  sé, which is then allocated to the current document, and, in the same way as with steps (q), (kl), (k2)

et (d) au document précédant le document courant ulté-  and (d) the document preceding the subsequent current document.

rieur. L'étape (r) est alors suivie d'une étape de fin de  laughing. Step (r) is then followed by an end step of

procédure telle que décrite précédemment dans la descrip-  procedure as described previously in the description

tion. En ce qui concerne l'initialisation du procédé objet  tion. Regarding the initialization of the object process

de la présente invention, c'est-à-dire lors de la récep-  of the present invention, that is to say when receiving

tion du premier document HTML, cette étape d'initialisa-  tion of the first HTML document, this initialization step

tion peut consister à choisir comme alphabet par défaut un alphabet tel que l'alphabet ISO latin par exemple, ce type  tion can consist in choosing as alphabet by default an alphabet such as the ISO Latin alphabet for example, this type

d'alphabet correspondant à l'alphabet ASCII américain au-  of alphabet corresponding to the American ASCII alphabet above

quel sont ajoutés les caractères accentués européens.  which European accented characters are added.

En outre, on indique que selon une variante de mise en ouvre non limitative du procédé objet de la présente invention, l'étape a) consistant à discriminer dans l'adresse URL le suffixe constitutif de cette dernière peut ne pas être exécutée antérieurement à l'étape b). En  In addition, it is indicated that according to a non-limiting implementation variant of the method which is the subject of the present invention, step a) consisting in discriminating in the URL address the suffix constituting the latter may not be executed prior to the 'step b). In

effet, l'étape a) précitée peut, par exemple, être exécu-  Indeed, the aforementioned step a) can, for example, be executed.

tée préalablement à l'étape j) représentée en figure lb, suite à l'exécution de l'étape i) représentée en figure  ted before step j) shown in figure lb, following the execution of step i) shown in figure

la, sans sortir du cadre de l'objet de la présente inven-  without departing from the scope of the subject of this invention

tion, l'adresse URL ayant été mémorisée.  tion, the URL address having been stored.

Un mode de réalisation spécifique d'un dispositif de  A specific embodiment of a

gestion automatique de l'alphabet choisi pour la restitu-  automatic management of the alphabet chosen for the restitution

tion visuelle ou sonore de documents HTML mis en oeuvre dans un système d'interfaçage et d'adaptation entre un terminal d'accès à un serveur interconnecté par un réseau soumis à un protocole d'intercommunication de type IP pour INTERNET PROTOCOLE et de communication HTML de documents  visual or audio tion of HTML documents implemented in an interface and adaptation system between an access terminal to a server interconnected by a network subject to an IP type intercom protocol for INTERNET PROTOCOL and HTML communication of documents

précités, sera maintenant décrit en liaison avec les figu-  mentioned above, will now be described in connection with the fig-

res 2a et 2b.res 2a and 2b.

D'une manière générale on rappelle que ce type de système d'interfaçage et d'adaptation comprend un module d'analyse et de transformation HTML noté Ml, un module d'anticipation noté M2, un module de conversion en ligne  Generally speaking, it is recalled that this type of interfacing and adaptation system includes an HTML analysis and transformation module denoted Ml, an anticipation module denoted M2, an online conversion module

de documents noté M3 et un module de mémoire cache de do-  of documents noted M3 and a cache memory module of

cuments convertis noté M4. L'ensemble de ces éléments pré-  converted cuments noted M4. All of these elements pre-

cités est connecté par l'intermédiaire d'un système dit  cited is connected via a system called

"proxy" ce système proxy, sur les réseaux INTERNET, ser-  "proxy" this proxy system, on INTERNET networks, serves

vant d'interface d'adaptation entre le terminal et un ser-  front of adaptation interface between the terminal and a service

veur. Le terminal et le serveur sont représentés et désignés comme tels sur la figure 2a. l'ensemble constitué par les éléments précités à savoir le module d'analyse et de transformation HTML Ml, le mécanisme d'anticipation M2,  veur. The terminal and the server are represented and designated as such in FIG. 2a. the set made up of the aforementioned elements, namely the HTML analysis and transformation module Ml, the anticipation mechanism M2,

le module de conversion au vol des documents M3 et le mo-  the M3 document conversion module and the mo-

dule de mémoire cache des documents convertis M4, associés  cache of converted M4 documents, associated

au système proxy est appelé un conjugué. Un conjugué per-  to the proxy system is called a conjugate. A conjugate per-

met, en fait, d'assurer le transfert, avec ou sans conver-  puts, in fact, to ensure the transfer, with or without conver-

sion, des documents délivrés par le serveur vers le terminal au format HTML. Ainsi qu'on l'a représenté de manière schématique sur la figure 2a, le dispositif de gestion automatique de l'alphabet choisi pour la restitution visuelle ou sonore  sion, documents delivered by the server to the terminal in HTML format. As shown diagrammatically in FIG. 2a, the device for automatic management of the alphabet chosen for visual or audio reproduction

de ces documents HTML, est implanté dans le module d'ana-  of these HTML documents, is implemented in the analysis module

lyse 1 et de transformation HTML et pour cette raison  lysis 1 and HTML transformation and for that reason

porte la référence G dans ce module.  carries the reference G in this module.

Le dispositif de gestion G comprend bien entendu des modules de mise en ouvre du procédé tel que précédemment décrit en liaison avec les figures la et lb permettant,  The management device G naturally includes modules for implementing the method as previously described in connection with FIGS. 1a and 1b allowing,

dans les conditions décrites précédemment dans la descrip-  under the conditions described above in the description

tion, d'attribuer à chaque document HTML courant un alpha-  tion, to assign to each HTML document running an alpha-

bet de référence afin de permettre la restitution visuelle ou sonore de ce document courant dans sa langue d'origine  reference bet to allow the visual or audible reproduction of this current document in its original language

et sa version initiale. Ce module de mise en oeuvre du pro-  and its initial version. This program implementation module

cédé précédemment décrit porte la référence 1 sur la fi-  previously described gives the reference 1 on the figure

gure 2b.gure 2b.

En outre le dispositif de gestion G objet de la pré-  In addition, the management device G which is the subject of the pre-

sente invention comprend un module 2 permettant d'assurer la discrimination de la présence ou de l'absence de codage  sente invention includes a module 2 for discriminating the presence or absence of coding

du document courant selon un alphabet UNICODE.  of the current document according to a UNICODE alphabet.

Ainsi que représenté sur la figure 2b précitée, le module 2 de discrimination peut comprendre un module 20 de discrimination de la présence de caractères autres que ceux de l'alphabet par défaut, l'alphabet ISO-8859-l par  As shown in FIG. 2b above, the discrimination module 2 can comprise a module 20 for discriminating the presence of characters other than those of the default alphabet, the alphabet ISO-8859-1 by

exemple, de l'alphabet UNICODE ou d'un autre alphabet ain-  example of the UNICODE alphabet or another alphabet as well

si que d'un module 21 actionné sur réponse positive au mo-  if a module 21 activated on positive response to the

dule 20, le module 21 permettant de discriminer la pré-  dule 20, the module 21 allowing to discriminate the pre-

sence d'un codage UNICODE du document courant ou de carac-  sence of a UNICODE coding of the current document or character

tères codés en mode UNICODE, autres que ceux de l'alphabet par défaut en référence à la figure 2b. On indique que le module 2 de discrimination de la présence respectivement  ters coded in UNICODE mode, other than those in the default alphabet with reference to Figure 2b. It is indicated that the module 2 of discrimination of the presence respectively

de l'absence de codage du document courant selon l'alpha-  the lack of coding of the current document according to alpha-

bet UNICODE correspond à une réponse négative au module 20 alors que la présence de codage du document courant selon  bet UNICODE corresponds to a negative response to module 20 while the presence of coding of the current document according to

l'alphabet UNICODE correspond à la réponse positive du mo-  the UNICODE alphabet corresponds to the positive response of the

dule 20 et à la réponse positive du module 21, présence de  dule 20 and the positive response from module 21, presence of

codage UNICODE, un cas intermédiaire correspondant toute-  UNICODE coding, an intermediate case corresponding all-

fois à l'absence de codage UNICODE du document bien que certains caractères UNICODE soient présents en réponse au  times to the absence of UNICODE coding of the document although certain UNICODE characters are present in response to the

module 20.module 20.

En outre un module de reconnaissance 3 de la compati-  In addition, a recognition module 3 for the compatibility

bilité du terminal avec le codage UNICODE est prévu, ce  terminal flexibility with UNICODE coding is expected, this

module répondant uniquement à la réponse positive respec-  module responding only to the positive response respec-

tivement négative du module 21 précédemment mentionné. Le module 3 de reconnaissance de la compatibilité du terminal  negative of module 21 previously mentioned. Terminal compatibility recognition module 3

avec le codage UNICODE peut comporter un module 30 d'allo-  with UNICODE coding can include a module 30 of allo-

cation, sur réponse négative du module 21, d'un alphabet reconnu au document courant, cet alphabet reconnu étant distinct de l'alphabet par défaut, le document courant  cation, upon negative response from module 21, of a recognized alphabet to the current document, this recognized alphabet being distinct from the default alphabet, the current document

pouvant toutefois contenir en plus des caractères de l'al-  may however contain in addition to characters of the al-

phabet par défaut. Le module 3 de reconnaissance de compa-  default phabet. Compass recognition module 3

tibilité au codage UNICODE du terminal comporte en outre un module proprement dit de reconnaissance de terminal  the UNICODE coding capability of the terminal also includes a terminal recognition module itself

UNICODE 31, 32.UNICODE 31, 32.

Le module 3 de reconnaissance de la compatibilité du  Module 3 for recognizing the compatibility of

0 terminal avec le codage UNICODE permet, ainsi que repré-  0 terminal with UNICODE coding allows, as well as

senté sur la figure 2b, l'émission et la restitution vi-  felt in FIG. 2b, the emission and the restitution vi-

suelle ou sonore du document courant vers le terminal à  audible or audible from the current document to the terminal at

l'étape A lorsque l'alphabet de référence alloué à ce do-  step A when the reference alphabet allocated to this do-

cument courant est l'alphabet par défaut ou que cet alpha-  current cument is the default alphabet or that this alpha-

bet de référence est l'alphabet UNICODE et que le caractère de compatibilité du terminal avec le codage  reference bet is the UNICODE alphabet and that the compatibility character of the terminal with coding

UNICODE est reconnu. En effet, dans un tel cas, un termi-  UNICODE is recognized. Indeed, in such a case, a termi-

nal UNICODE est en mesure d'afficher le document courant HTML sans changement ou intervention. L'étape A est suivie  nal UNICODE is able to display the current HTML document without change or intervention. Step A is followed

bien entendu d'une étape de fin de procédure.  of course an end of procedure step.

Le module 3, associé au module 2 précédemment décrit, permet également la transformation du document courant en fichiers de cellules images à l'étape B lorsque l'alphabet de référence est l'alphabet UNICODE sur réponse positive du module 21 mais que le caractère de compatibilité du terminal avec le codage UNICODE n'est pas reconnu, réponse négative du module 31, ou lorsque l'alphabet du document courant n'est pas l'alphabet UNICODE sur réponse négative  Module 3, associated with module 2 previously described, also allows the transformation of the current document into image cell files in step B when the reference alphabet is the UNICODE alphabet on positive response from module 21 but the character of compatibility of the terminal with UNICODE coding is not recognized, negative response from module 31, or when the alphabet of the current document is not the UNICODE alphabet on negative response

au module 21 et que le caractère de compatibilité du ter-  in module 21 and that the compatibility character of the

minal avec le codage UNICODE n'est pas reconnu, sur ré-  minimum with UNICODE encoding is not recognized, on re-

ponse négative du module 32. L'étape B constitue en fait une étape de transformation du document HTML initial en document HTML dans lequel les caractères alphabétiques  negative response from module 32. Step B in fact constitutes a step of transforming the initial HTML document into an HTML document in which the alphabetic characters

et/ou les idéogrammes sont remplacés par des cellules ima-  and / or the ideograms are replaced by ima-

ges qui permettent alors de représenter ces derniers. De  ges which then make it possible to represent these. Of

manière avantageuse ces cellules images sont alors déli-  advantageously these image cells are then delimited

vrées au format JPEG, GIF ou autres par exemple. On com-  in JPEG, GIF or other formats for example. We understand

prend en particulier que ces cellules images peuvent être combinées ou regroupées pour représenter un ou plusieurs  takes in particular that these image cells can be combined or grouped to represent one or more

idéogrammes en une seule image.ideograms in a single image.

En outre le module 3 associé au module 2 précité per-  In addition, module 3 associated with the aforementioned module 2 per-

met encore la transformation du document courant par co-  still puts the transformation of the current document by co-

dage au moyen de l'alphabet UNICODE à l'étape C lorsque l'alphabet de référence n'est pas l'alphabet UNICODE sur réponse négative du module 21 mais que le caractère de  dage using the UNICODE alphabet in step C when the reference alphabet is not the UNICODE alphabet on a negative response from module 21 but the character of

compatibilité du terminal avec le codage UNICODE est re-  compatibility of the terminal with UNICODE coding is re-

connu, c'est-à-dire sur réponse positive du module 32. Les étapes B et C sont alors suivies d'une étape D permettant l'émission du document transformé vers le terminal tel  known, that is to say on a positive response from module 32. Steps B and C are then followed by step D allowing the transmission of the transformed document to the terminal as

qu'un MINITEL-INTERNET, un micro-ordinateur ou autre.  than a MINITEL-INTERNET, a microcomputer or other.

L'étape D est elle-même suivie d'une étape de fin de pro-  Step D is itself followed by an end of pro-

cédure.cedure.

De la même manière un dispositif de gestion automati-  In the same way an automatic management device

que de l'alphabet choisi pour la restitution visuelle ou sonore de documents HTML peut être mis en oeuvre dans un système d'interfaçage de type passerelle entre un terminal  that the alphabet chosen for the visual or audio reproduction of HTML documents can be implemented in an interface system of the gateway type between a terminal

de type VIDEOTEX interconnecté par l'intermédiaire du ré-  VIDEOTEX type interconnected by means of the

seau téléphonique commuté RTC et d'une liaison spécialisée LT d'un système d'accès PAVI et d'une ligne de type X.25  PSTN switched telephone bucket and a dedicated link LT of a PAVI access system and an X.25 type line

connectée à cette passerelle, la passerelle étant elle-  connected to this gateway, the gateway being itself

même interconnectée par un réseau tel que le réseau INTERNET à différents serveurs. Le réseau est bien entendu soumis à un protocole d'intercommunication de type IP et de communication de documents HTML. Dans un tel cas le dispositif de gestion objet de la présente invention est  even interconnected by a network such as the INTERNET network to different servers. The network is of course subject to an intercom protocol of the IP type and communication of HTML documents. In such a case, the management device object of the present invention is

implanté dans la passerelle constituant un système d'adap-  installed in the gateway constituting an adapta-

tation de type INTERNET/TELETEL pour le terminal VIDEOTEX  INTERNET / TELETEL type for the VIDEOTEX terminal

par exemple.for example.

Le dispositif de gestion objet de la présente inven-  The management system that is the subject of this invention

tion est alors intégré et implanté dans la passerelle et  tion is then integrated and installed in the gateway and

porte pour cette raison la référence G' sur la figure 3a.  therefore bears the reference G 'in FIG. 3a.

En référence à la figure 3b il comprend de la même manière que relativement à la figure 2b, un module 1 de mise en oeuvre du procédé objet de la présente invention permettant  With reference to FIG. 3b, it comprises, in the same way as in relation to FIG. 2b, a module 1 for implementing the method which is the subject of the present invention allowing

d'attribuer au document courant HTML un alphabet de réfé-  to assign to the current HTML document a reference alphabet

rence afin de permettre l'affichage de ce document courant dans sa langue d'origine et sa version initiale. En outre, le dispositif de gestion comporte un module 4 de discrimi-  to allow the display of this current document in its original language and its initial version. In addition, the management device comprises a module 4 for discriminating

nation de la présence respectivement de l'absence de co-  nation of the presence respectively of the absence of co-

dage du document courant selon un alphabet de référence correspondant à un alphabet par défaut, tel que l'alphabet ISO-8859-1, ainsi qu'un module 4o permettant, sur réponse  Dage of the current document according to a reference alphabet corresponding to a default alphabet, such as the ISO-8859-1 alphabet, as well as a 4o module allowing, upon response

positive du module 4 à la présence de l'alphabet par dé-  positive from module 4 to the presence of the alphabet by de-

faut précité, la transformation du document courant en service au format VIDEOTEX à partir de jeux de caractères de base du terminal VIDEOTEX précité. Le module 4o de  above, the transformation of the current document into service in VIDEOTEX format from the basic character sets of the above-mentioned VIDEOTEX terminal. The 4o module of

transformation du document courant permet alors l'affi-  transformation of the current document then allows the affi-

* chage du document HTML ainsi transformé en service* chage the HTML document thus transformed into a service

VIDEOTEX par un retour à une étape de fin de procédure.  VIDEOTEX by returning to an end of procedure step.

En outre un module 5 de discrimination, dans le docu-  In addition, a module 5 on discrimination, in the docu-

ment courant, de la présence d'idéogrammes et/ou de carac-  common, the presence of ideograms and / or characters

tères codés selon le code UNICODE correspondant à des  ters coded according to the UNICODE code corresponding to

idéogrammes est prévu. Ce module 5 est actionné sur ré-  ideograms is expected. This module 5 is actuated on re-

ponse négative du module 4 précédemment mentionné.  negative response from module 4 previously mentioned.

Un module 5o est prévu pour assurer la transformation  A 5o module is planned to ensure the transformation

du document courant en service au format VIDEOTEX sur ré-  of the current document in service in VIDEOTEX format on re-

ponse négative du module 5. Cette transformation est ef-  negative response from module 5. This transformation is ef-

fectuée à partir de jeux de caractères de base du terminal  made from basic terminal character sets

VIDEOTEX et de jeux de caractères redéfinissables dynami-  VIDEOTEX and dynamic redefinable character sets

quement DRCS en fonction de l'alphabet de référence al-  only DRCS according to the reference alphabet al-

loué, ceci permet ainsi un affichage limité en nombre  rented, this allows a display limited in number

d'idéogrammes du document courant.of ideograms of the current document.

Un module 6 est en outre prévu, lequel permet d'assu-  A module 6 is also provided, which makes it possible to

rer la discrimination de la capacité du terminal VIDEOTEX  discriminating the capacity of the VIDEOTEX terminal

précité à afficher des fichiers images. Sur réponse posi-  aforementioned to display image files. On posi-

tive du module 5 de discrimination de présence d'idéogram-  tive of module 5 of ideogram presence discrimination-

mes et/ou de caractères codés selon le code UNICODE correspondant à des idéogrammes, et sur réponse positive au module 6 précité, de discrimination de la capacité du terminal à visualiser et afficher des fichiers images un  mes and / or characters coded according to the UNICODE code corresponding to ideograms, and on positive response to the aforementioned module 6, of discrimination of the terminal's ability to view and display image files a

module de transformation 60 permet d'assurer la transfor-  transformation module 60 ensures the transformation

mation du document courant en service VIDEOTEX à partir de jeux de caractères de base du terminal VIDEOTEX et de jeux  mation of the current document in VIDEOTEX service from basic character sets of the VIDEOTEX terminal and sets

de caractères redéfinissables dynamiquement DRCS en fonc-  dynamically redefinable characters DRCS in function

tion de l'alphabet de référence alloué, ainsi que par  tion of the allocated reference alphabet, as well as by

l'affichage d'idéogrammes reconnus sous forme de cellules-  the display of ideograms recognized in the form of cells-

images. Le module 6o utilise les jeux de caractères de base des terminaux VIDEOTEX, tels que les MINITEL, des  images. The 6o module uses the basic character sets of VIDEOTEX terminals, such as MINITEL,

jeux de caractères DRCS téléchargés d'un nombre d'idéo-  DRCS character sets downloaded from a number of ideo-

grammes reconnus limités en nombre à 47 par document. Tout ou partie des caractères alphabétiques et/ou idéogrammes  recognized grams limited in number to 47 per document. All or part of the alphabetic characters and / or ideograms

peuvent être remplacés par des cellules images les repré-  can be replaced by image cells.

sentant au format JPEG et/ou GIF par exemple.  feeling in JPEG and / or GIF format for example.

Enfin, sur réponse négative au module 6 un module 61  Finally, on negative response to module 6 a module 61

permet d'assurer une transformation du document HTML cou-  allows to transform the HTML document

rant en service VIDEOTEX utilisant les jeux de caractères  rant in VIDEOTEX service using character sets

de base des MINITEL, les jeux de caractères DRCS précédem-  of MINITEL, the DRCS character sets previously

ment téléchargés dans le MINITEL en fonction de l'alphabet reconnu de même que dans le cas du module 5o. Toutefois un affichage en nombre limité d'idéogrammes, 47 par document,  ment downloaded in the MINITEL according to the recognized alphabet as well as in the case of the 5o module. However, a display in a limited number of ideograms, 47 per document,

est également prévu et mis en ouvre par le module 61.  is also planned and implemented by module 61.

La figure 4a représente l'exemple d'un document HTML  Figure 4a shows the example of an HTML document

affiché sur le moniteur d'un terminal en France, ce docu-  displayed on the monitor of a terminal in France, this docu-

ment HTML étant délivré par un site WEB localisé en Grèce par exemple. La figure 4a représente un tel document HTML en l'absence d'application du procédé objet de la présente invention. On constate que l'ensemble du texte affiché  ment HTML being delivered by a WEB site located in Greece for example. FIG. 4a represents such an HTML document in the absence of application of the method which is the subject of the present invention. We see that all of the text displayed

consiste en une succession de caractères sensiblement in-  consists of a succession of characters substantially

intelligibles en raison du type d'alphabet retenu pour l'affichage du document HTML considéré. Il n'existe en ef-  intelligible due to the type of alphabet used to display the HTML document considered. In fact,

fet aucune raison pour que les codes relatifs à chaque ca-  no reason why the codes relating to each card

ractère de l'alphabet grec permettent d'obtenir un code cohérent à partir des codes correspondants utilisés en France. Au contraire en figure 4b on a représenté un document HTML délivré par le même site WEB localisé en Grèce et dans lequel grâce à la mise en ouvre du procédé objet de la présente invention l'ensemble des caractères affichés a été reconstitué à partir de l'alphabet grec d'origine, la visualisation du document étant restituée dans sa version d'origine.  the alphabet of the Greek alphabet make it possible to obtain a coherent code from the corresponding codes used in France. On the contrary in FIG. 4b there is shown an HTML document delivered by the same WEB site located in Greece and in which, thanks to the implementation of the process which is the subject of the present invention, all the characters displayed have been reconstructed from the original Greek alphabet, the visualization of the document being restored in its original version.

Il en est de même en ce qui concerne la figure 5a re-  The same is true with regard to FIG. 5a.

lativement à un document HTML délivré par un site WEB si-  later to an HTML document delivered by a WEB site if-

tué au Japon. L'affichage d'un tel document à partir d'un alphabet utilisé en France délivre également une série de caractères totalement inintelligibles en l'absence de la  killed in Japan. The display of such a document from an alphabet used in France also delivers a series of characters totally unintelligible in the absence of the

mise en oeuvre du procédé objet de la présente invention.  implementation of the process which is the subject of the present invention.

Au contraire en figure 5b on a représenté un document HTML issu du même site WEB localisé au Japon dans lequel toutefois grâce à la mise en oeuvre du procédé objet de la présente invention, les codes correspondants ont été  On the contrary in FIG. 5b, an HTML document has been represented from the same WEB site located in Japan in which, however, thanks to the implementation of the process which is the subject of the present invention, the corresponding codes have been

transformés de façon à représenter des fichiers images re-  transformed to represent image files

présentatifs d'idéogrammes significatifs pour toute per-  presentation of significant ideograms for any person

sonne disposant de la connaissance des idéogrammes  sounds having knowledge of ideograms

précités.cited above.

On a ainsi décrit un procédé de discrimination auto-  A method of self-discrimination has thus been described.

matique d'un alphabet pour la restitution visuelle ou so-  matic of an alphabet for visual or social restitution

nore d'un document HTML particulièrement performant dans  of a particularly efficient HTML document in

la mesure o en raison de l'implantation spécifique de mo-  measure o due to the specific implantation of mo-

dules de mise en oeuvre du procédé sous forme de modules de gestion correspondants en fonction des terminaux utilisés et en particulier du mode de liaison de ces terminaux par l'intermédiaire du réseau INTERNET à différents serveurs, il est ainsi possible de restituer tout document HTML dans sa version d'origine et en particulier dans sa langue d'origine.  dules for implementing the method in the form of corresponding management modules according to the terminals used and in particular the mode of connection of these terminals via the INTERNET network to different servers, it is thus possible to restore any HTML document in its original version and in particular in its original language.

Le procédé de discrimination automatique d'un alpha-  The method of automatic discrimination of an alpha-

bet pour la restitution visuelle ou sonore d'un document  bet for the visual or audio reproduction of a document

HTML peut être implémenté, à titre d'exemples non limita-  HTML can be implemented, as examples not limited to

tifs, au niveau du serveur de fichiers, dans une passe-  tifs, at the file server level, in a pass

relle entre ce serveur et le terminal de consultation, ou  between this server and the consultation terminal, or

dans ce terminal.in this terminal.

Claims (8)

REVENDICATIONS 1. Procédé de discrimination automatique d'un al-  1. Method of automatic discrimination of an al- phabet, notamment pour la restitution visuelle ou sonore  phabet, in particular for visual or sound reproduction d'un document HTML dans sa langue d'origine et sa présen-  an HTML document in its original language and its presentation tation initiale, ce document étant délivré par un site WEB  initial tation, this document being issued by a WEB site obtenu à partir d'une adresse URL déterminée, procédé com-  obtained from a determined URL address, process portant au moins, pour ce document courant HTML, les éta-  bearing at least, for this current HTML document, the pes consistant à:pes consisting of: a) discriminer dans ladite adresse URL le suffixe consti-  a) discriminate in said URL address the suffix tutif de cette adresse URL; et suite à la discrimina-  guardian of this URL address; and following the discrimina- tion ou à la non discrimination dudit suffixe, b) commander la réception dudit document courant; et c) déterminer, relativement audit document courant, au moins un alphabet de référence en fonction de données  tion or non-discrimination of said suffix, b) order the reception of said current document; and c) determining, with respect to said current document, at least one reference alphabet as a function of data d'en-tête de documents descriptives de l'alphabet uti-  of descriptive documents from the alphabet used lisé; et, sur réponse positive de cette étape consis-  read; and, upon a positive response from this step, tant à déterminer, relativement au document courant, un alphabet de référence, d) affecter audit document courant l'alphabet de référence  both to determine, relative to the current document, a reference alphabet, d) assign to said current document the reference alphabet déterminé à l'étape c) précédente.  determined in step c) above. 2. Procédé selon la revendication 1, caractérisé  2. Method according to claim 1, characterized en ce que, sur réponse négative à ladite étape c) consis-  in that, on a negative response to said step c) consis- tant à déterminer relativement audit document courant un alphabet de référence, ledit procédé consiste en outre à: e) allouer audit document courant un alphabet par défaut; et  as long as to determine a reference alphabet relative to said current document, said method also consists in: e) allocating a default alphabet to said current document; and f) soumettre les données à restituer dudit document cou-  f) submit the data to be returned from said document rant à un processus de filtrage consistant à discrimi-  rant to a filtering process consisting in discriminating ner le pourcentage des valeurs de code de ces données à restituer compris entre une première et une deuxième valeurs limites, pour établir une valeur de pourcentage descriptive de code de ces données à restituer pour le document courant considéré;  ner the percentage of the code values of these data to be restored comprised between a first and a second limit values, in order to establish a descriptive percentage value of code of these data to be restored for the current document considered; g) identifier dans lesdites données à restituer un ensem-  g) identify in said data to be returned a set ble de mots distinctifs, par comparaison et identifica-  ble of distinctive words, by comparison and identification tion de ces mots distinctifs vis-à-vis d'une pluralité de dictionnaires réduits de mots préétablis non communs  tion of these distinctive words with respect to a plurality of reduced dictionaries of non-common preset words à plusieurs langues d'origine et mémoriser cette opéra-  to several original languages and memorize this operation- tion de comparaison et d'identification sous forme de listes de mots classées par nombre de mots détectés par  comparison and identification in the form of lists of words classified by number of words detected by langue d'origine et par nombre total de mots, pour éta-  original language and by total number of words, for blir une pluralité de variables de classement du nombre  blur a plurality of number ranking variables de mots détectés par langue d'origine et par nombre to-  of words detected by original language and by total number tal de mots;tal of words; h) soumettre les données à restituer dudit document cou-  h) submit the data to be returned from said document rant à un test d'existence ou de non existence d'une fin de document dudit document courant, et, sur réponse positive à ce test d'existence ou de non existence d'une fin de document, i) allouer audit document courant un alphabet de référence  rant to a test of existence or non-existence of an end of document of said current document, and, on positive response to this test of existence or non existence of an end of document, i) allocate to said current document a reference alphabet choisi en fonction de la valeur descriptive de pourcen-  chosen according to the descriptive value of percent tage de code de ces donnés à restituer pour ce document courant et de la valeur d'au moins une variable de  tage of code of these data to be returned for this current document and of the value of at least one variable of classement du nombre de mots détectés par langue d'ori-  classification of the number of words detected by original language gine et par nombre total de mots.gine and by total number of words. 3. Procédé selon la revendication 1, caractérisé  3. Method according to claim 1, characterized en ce que, sur réponse positive à ladite étape c) consis-  in that, upon a positive response to said step c) consis- tant à déterminer relativement audit document courant un alphabet de référence, ledit procédé consiste en outre à: g') identifier dans lesdites données à restituer un  as long as a reference alphabet is to be determined with respect to said current document, said method also consists in: g ') identifying in said data to restore a ensemble de mots distinctifs, par comparaison et iden-  set of distinctive words, by comparison and iden- tification de ces mots distinctifs vis-à-vis d'une plu-  tification of these distinctive words vis-à-vis a ralité de dictionnaires réduits de mots préétablis non communs à plusieurs langues d'origine et mémoriser cette opération de comparaison et d'identification sous  reality of reduced dictionaries of pre-established words not common to several languages of origin and memorize this comparison and identification operation under forme de listes de mots classées par nombre de mots dé-  form of word lists classified by number of words tectés par langue d'origine et par nombre total de  tect by original language and by total number of mots, pour établir une pluralité de variables de clas-  words, to establish a plurality of class variables- sement du nombre de mots détectés par langue d'origine et par nombre total de mots; h') soumettre les données à restituer dudit document courant à un test d'existence ou de non existence d'une fin de document dudit document courant, et, sur réponse positive à ce test d'existence ou de non existence d'une fin de document,  the number of words detected by original language and by total number of words; h ') submit the data to be returned from said current document to a test for the existence or non-existence of an end of document of said current document, and, on positive response to this test for existence or non-existence of an end of document, i') allouer audit document courant une langue de réfé-  i ') allocate to said current document a reference language rence choisie en fonction de la valeur d'au moins une variable de classement du nombre de mots détectés par  rence chosen according to the value of at least one classification variable of the number of words detected by langue d'origine et par nombre total de mots.  original language and by total number of words. 4. Procédé selon la revendication 2, caractérisé  4. Method according to claim 2, characterized en ce que ladite étape i), consistant à allouer un alpha-  in that said step i), consisting in allocating an alpha- bet de référence audit document courant, comporte au moins  reference bet to said current document, includes at least un test de comparaison de la valeur descriptive de pour-  a descriptive value comparison test of pros centage de code de données à restituer pour le document  centering of data code to restore for the document courant considéré à une valeur de seuil.  current considered at a threshold value. 5. Procédé selon la revendication 2 ou 4, caracté-  5. Method according to claim 2 or 4, character- risé en ce que l'étape i) consistant à allouer audit docu-  laughed at in that step i) consisting in allocating said docu- ment courant un alphabet de référence comprend au moins: j) un test de reconnaissance de discrimination ou de non discrimination dudit suffixe, et, sur réponse positive audit test: k) un premier critère de choix d'un alphabet spécifique,  a current reference alphabet comprises at least: j) a test for recognizing discrimination or non-discrimination of said suffix, and, on a positive response to said test: k) a first criterion for choosing a specific alphabet, respectivement de l'alphabet par défaut, et, sur ré-  respectively the default alphabet, and, on re- ponse positive audit premier critère de choix, k2) al-  positive response to the first choice criterion, k2) al- location au document courant d'un alphabet spécifique  rental to the current document of a specific alphabet comme alphabet de référence en fonction du type de suf-  as a reference alphabet depending on the type of suf- fixe reconnu, allocation k1) de cet alphabet spécifique au document précédant ledit document courant ultérieur, et, sur réponse négative audit premier critère de choix, 1) allocation au document courant de l'alphabet par défaut comme alphabet de référence, et allocation de cet alphabet par défaut audit document précédant le document courant ultérieur, et, sur réponse négative audit test j, m) un deuxième critère de choix d'un alphabet spécifique respectivement de l'alphabet par défaut et, sur réponse négative audit deuxième critère de choix, 1) allocation  recognized fixed, allocation k1) of this alphabet specific to the document preceding said subsequent current document, and, on negative response to said first selection criterion, 1) allocation to the current document of the alphabet by default as the reference alphabet, and allocation of this default alphabet for said document preceding the subsequent current document, and, on negative response to said test j, m) a second criterion for choosing a specific alphabet respectively of the default alphabet and, on negative response for said second choice criterion, 1) allowance au document courant de l'alphabet par défaut comme al-  to the current default alphabet document as al- phabet de référence, et allocation de cet alphabet par  reference phabet, and allocation of this alphabet by défaut audit document précédant le document courant ul-  defect in the document preceding the current document térieur, et, sur réponse positive audit deuxième cri-  and, on positive response to said second cry- tère de choix,mother of choice, n) un troisième critère de test d'allocation audit docu-  n) a third test criterion for allocation to said document ment précédant le document courant d'un alphabet de ré-  preceding the current document with a alphabet of re- férence, et, sur réponse positive audit troisième critère de test, o) allocation audit document courant  reference, and, on positive response to said third test criterion, o) allocation to said current document de l'alphabet de référence alloué audit document précé-  of the reference alphabet allocated to said previous document dant le document courant, et, sur réponse négative au-  in the current document, and, if the answer is negative, dit troisième critère de test, p) un quatrième critère de test de reconnaissance d'au moins un alphabet pour déterminer un alphabet reconnu,  said third test criterion, p) a fourth recognition test criterion of at least one alphabet to determine a recognized alphabet, par comparaison de mots caractéristiques d'un ou plu-  by comparison of characteristic words of one or more sieurs alphabets avec un masque de décision, et, sur  several alphabets with a decision mask, and, on réponse positive au quatrième critère test, q) alloca-  positive response to the fourth test criterion, q) alloca- tion audit document courant de l'alphabet reconnu, et  tion to said current document of the recognized alphabet, and allocation de cet alphabet reconnu audit document pré-  allocation of this alphabet recognized in said pre- cédant le document courant ultérieur, et, sur réponse négative au quatrième critère de test, en l'absence d'alphabet reconnu, r) allocation manuelle par un uti- lisateur d'un alphabet précisé audit document courant, et allocation de cet alphabet précisé audit document  assigning the subsequent current document, and, in the event of a negative response to the fourth test criterion, in the absence of a recognized alphabet, r) manual allocation by a user of an alphabet specified in said current document, and allocation of this specified alphabet audit document précédant le document courant ultérieur.  preceding the subsequent current document. 6. Procédé de discrimination automatique d'un al-  6. Method of automatic discrimination of an al- phabet, notamment pour la restitution visuelle ou sonore  phabet, in particular for visual or sound reproduction d'un document HTML dans sa langue d'origine et sa présen-  an HTML document in its original language and its presentation tation initiale, ce document étant délivré par un site WEB  initial tation, this document being issued by a WEB site obtenu à partir d'une adresse URL déterminée, procédé com-  obtained from a determined URL address, process portant au moins, pour ce document courant HTML, les éta-  bearing at least, for this current HTML document, the pes consistant à: b) commander la réception dudit document courant; et c) déterminer, relativement audit document courant, au moins un alphabet de référence en fonction de données  pes consisting in: b) controlling the reception of said current document; and c) determining, with respect to said current document, at least one reference alphabet as a function of data d'en-tête de documents descriptives de l'alphabet uti-  of descriptive documents from the alphabet used lisé; et, sur réponse positive de cette étape consis-  read; and, upon a positive response from this step, tant à déterminer, relativement au document courant, un alphabet de référence, d) affecter audit document courant l'alphabet de référence  both to determine, relative to the current document, a reference alphabet, d) assign to said current document the reference alphabet déterminé à l'étape c) précédente, et sur réponse néga-  determined in step c) above, and on negative response tive à ladite étape c) consistant à déterminer relati-  tive to said step c) of determining relative vement audit document courant un alphabet de référence: e) allouer audit document courant un alphabet par défaut; et  vement to said current document a reference alphabet: e) allocate to said current document a default alphabet; and f) soumettre les données à restituer dudit document cou-  f) submit the data to be returned from said document rant à un processus de filtrage consistant à discrimi-  rant to a filtering process consisting in discriminating ner le pourcentage des valeurs de code de ces données à restituer compris entre une première et une deuxième valeurs limites, pour établir une valeur de pourcentage descriptive de code de ces données à restituer pour le document courant considéré;  ner the percentage of the code values of these data to be restored comprised between a first and a second limit values, in order to establish a descriptive percentage value of code of these data to be restored for the current document considered; g) identifier dans lesdites données à restituer un ensem-  g) identify in said data to be returned a set ble de mots distinctifs, par comparaison et identifica-  ble of distinctive words, by comparison and identification tion de ces mots distinctifs vis-à-vis d'une pluralité de dictionnaires réduits de mots préétablis non communs  tion of these distinctive words with respect to a plurality of reduced dictionaries of non-common preset words à plusieurs langues d'origine et mémoriser cette opéra-  to several original languages and memorize this operation- tion de comparaison et d'identification sous forme de listes de mots classées par nombre de mots détectés par  comparison and identification in the form of lists of words classified by number of words detected by langue d'origine et par nombre total de mots, pour éta-  original language and by total number of words, for blir une pluralité de variables de classement du nombre  blur a plurality of number ranking variables de mots détectés par langue d'origine et par nombre to-  of words detected by original language and by total number tal de mots;tal of words; h) soumettre les données à restituer dudit document cou-  h) submit the data to be returned from said document rant à un test d'existence ou de non existence d'une fin de document dudit document courant, et, sur réponse positive à ce test d'existence ou de non existence d'une fin de document, i) allouer audit document courant un alphabet de référence  rant to a test of existence or non-existence of an end of document of said current document, and, on positive response to this test of existence or non existence of an end of document, i) allocate to said current document a reference alphabet choisi en fonction de la valeur descriptive de pourcen-  chosen according to the descriptive value of percent tage de code de ces donnés à restituer pour ce document courant et de la valeur d'au moins une variable de  tage of code of these data to be returned for this current document and of the value of at least one variable of classement du nombre de mots détectés par langue d'ori-  classification of the number of words detected by original language gine et par nombre total de mots.gine and by total number of words. 7. Dans un système d'interfaçage et d'adaptation entre un terminal d'accès à un serveur interconnectés par un réseau, soumis à un protocole d'intercommunication de type IP et de communication de documents HTML, ce système  7. In an interfacing and adaptation system between an access terminal to a server interconnected by a network, subject to an intercom protocol of the IP type and communication of HTML documents, this system d'interfaçage et d'adaptation comprenant un module d'ana-  interfacing and adaptation including an analysis module lyse et de transformation HTML, un module d'anticipation, un module de conversion en ligne de documents et un module de mémoire cache de documents convertis, un dispositif de gestion automatique de l'alphabet choisi pour la restitu- tion visuelle ou sonore de ces documents HTML courants comprenant au moins, dans ledit module d'analyse et de transformation HTML: - des moyens de mise en ouvre du procédé selon  HTML lysis and transformation, a anticipation module, an online document conversion module and a cache module for converted documents, an automatic alphabet management device chosen for the visual or audio reproduction of these current HTML documents comprising at least, in said HTML analysis and transformation module: - means for implementing the method according to l'une des revendications 1 à 6, lesdits moyens permettant  one of claims 1 to 6, said means allowing d'attribuer au document courant un alphabet de référence,  to assign to the current document a reference alphabet, permettant la restitution visuelle ou sonore de ce docu-  allowing the visual or audio reproduction of this document ment courant dans sa langue d'origine et sa version ini-  fluent in its original language and original version tiale; - des moyens de discrimination de la présence,  tial; - means of discrimination of presence, respectivement de l'absence de codage dudit document cou-  respectively the absence of coding of said document rant selon un alphabet UNICODE; - des moyens de reconnaissance de la compatibilité dudit terminal avec le codage UNICODE; lesdits moyens de reconnaissance de la compatibilité de ce terminal avec le codage UNICODE permettant: ò soit l'émission et la restitution visuelle ou sonore dudit document courant lorsque l'alphabet de référence alloué à ce document courant est l'alphabet par défaut ou que cet alphabet de référence est l'alphabet UNICODE et que le caractère de compatibilité du terminal avec le codage UNICODE est reconnu;  rant according to a UNICODE alphabet; means for recognizing the compatibility of said terminal with UNICODE coding; said means of recognizing the compatibility of this terminal with UNICODE coding allowing: ò either the transmission and the visual or audio reproduction of said current document when the reference alphabet allocated to this current document is the default alphabet or when this reference alphabet is the UNICODE alphabet and the compatibility of the terminal with UNICODE coding is recognized; * soit la transformation dudit document courant en fi-  * or the transformation of said current document into fi- chiers de cellules images lorsque cet alphabet de réfé-  image cell les when this reference alphabet rence est l'alphabet UNICODE mais que le caractère de compatibilité du terminal avec le codage UNICODE n'est  rence is the UNICODE alphabet but the compatibility character of the terminal with UNICODE coding is not pas reconnu ou lorsque cet alphabet n'est pas l'alpha-  not recognized or when this alphabet is not the alpha- bet UNICODE de référence et que le caractère de compa-  bet UNICODE of reference and that the character of compa- tibilité du terminal avec le codage UNICODE n'est pas reconnu, puis émission et affichage du document courant transformé; ou encore transformation du document courant par codage  tibility of the terminal with UNICODE coding is not recognized, then transmission and display of the current document transformed; or transformation of the current document by coding au moyen de l'alphabet UNICODE puis émission et resti-  using the UNICODE alphabet then emission and resti- tution visuelle ou sonore du document courant transfor-  visual or audio tution of the current document transformed mé lorsque cet alphabet de référence n'est pas  even when this reference alphabet is not l'alphabet UNICODE mais que le caractère de compatibi-  the UNICODE alphabet but that the character of compatibi- lité du terminal avec le codage UNICODE est reconnu.  The unity of the terminal with UNICODE coding is recognized. 8. Dans un système d'interfaçage de type passe-  8. In a pass-type interface system relle entre un terminal de type VIDEOTEX interconnecté par l'intermédiaire du réseau téléphonique commuté et d'une liaison spécialisée à ce système de type passerelle et un serveur interconnecté à ce système de type passerelle par  between a VIDEOTEX type terminal interconnected via the switched telephone network and a dedicated link to this gateway type system and a server interconnected to this gateway type system by l'intermédiaire d'un réseau soumis à un protocole d'inter-  through a network subject to an inter- communication de type IP et de communication de documents HTML, un dispositif de gestion automatique de l'alphabet  IP type communication and HTML document communication, an automatic alphabet management device choisi pour la restitution visuelle ou sonore de ces docu-  chosen for the visual or audio reproduction of these documents ments HTML courants comprenant au moins, dans ladite pas-  common HTML elements including at least, in said step serelle: - des moyens de mise en oeuvre du procédé selon  serelle: - means of implementing the method according to l'une des revendications 1 à 6, lesdits moyens permettant  one of claims 1 to 6, said means allowing d'attribuer au document courant un alphabet de référence,  to assign to the current document a reference alphabet, permettant la restitution visuelle ou sonore de ce docu-  allowing the visual or audio reproduction of this document ment courant dans sa langue d'origine et sa version ini-  fluent in its original language and original version tiale; - des moyens de discrimination de la présence,  tial; - means of discrimination of presence, respectivement de l'absence de codage dudit document cou-  respectively the absence of coding of said document rant selon un alphabet de référence correspondant à un al-  rant according to a reference alphabet corresponding to an al- phabet par défaut, et, sur réponse positive à la présence de cet alphabet par défaut,  phabet by default, and, on positive response to the presence of this alphabet by default, u transformation dudit document courant en un ou plu-  u transformation of said current document into one or more sieurs services au format VIDEOTEX à partir de jeux de caractères de base dudit terminal VIDEOTEX; et sur ré-  several services in VIDEOTEX format from basic character sets of said VIDEOTEX terminal; and on re- ponse négative à la présence de cet alphabet par dé-  negative answer to the presence of this alphabet by de- faut, - des moyens de discrimination dans ledit document courant de la présence d'idéogrammes et/ou de caractères  is necessary, - means of discrimination in said current document of the presence of ideograms and / or characters codés selon le code UNICODE correspondant à des idéogram-  coded according to the UNICODE code corresponding to ideograms- mes, et sur réponse négative à ladite discrimination de présence d'idéogrammes et/ou de caractères codés selon le code UNICODE correspondant à des idéogrammes  mes, and on negative response to said discrimination of the presence of ideograms and / or characters coded according to the UNICODE code corresponding to ideograms transformation dudit document courant en un ou plu-  transformation of said current document into one or more sieurs services au format VIDEOTEX à partir de jeux de caractères de base du terminal VIDEOTEX et de jeux de caractères redéfinissables dynamiquement (DRCS), et restitution visuelle ou sonore du document courant transformé correspondant; - des moyens de discrimination de la capacité dudit terminal VIDEOTEX à afficher des fichiers images, et  several services in VIDEOTEX format from basic character sets of the VIDEOTEX terminal and dynamically redefinable character sets (DRCS), and visual or audio reproduction of the corresponding current transformed document; means of discriminating the capacity of said VIDEOTEX terminal to display image files, and sur réponse positive audit test de discrimination de pré-  on positive response to said pre-discrimination test sence d'idéogrammes et/ou de caractères codés selon le code UNICODE correspondant à des idéogrammes;  sence of ideograms and / or characters coded according to the UNICODE code corresponding to ideograms; * sur réponse négative à ladite discrimination de capaci-  * on negative response to said discrimination of capacity té dudit terminal VIDEOTEX à afficher des fichiers ima-  of said VIDEOTEX terminal to display ima- ges, transformation dudit document courant en un ou plusieurs services au format VIDEOTEX à partir de jeux de caractères de base du terminal VIDEOTEX et de jeux de caractères redéfinissables dynamiquement (DRCS), en  ges, transformation of said current document into one or more services in VIDEOTEX format from basic character sets of the VIDEOTEX terminal and dynamically redefinable character sets (DRCS), fonction de l'alphabet de référence alloué et restitu-  function of the reference alphabet allocated and returned tion visuelle ou sonore du document ainsi transformé,  visual or audible tion of the document thus transformed, la restitution visuelle comprenant également l'affi-  visual restitution including also the chage d'idéogrammes du document courant, et  chage of ideograms of the current document, and sur réponse positive à ladite discrimination de capaci-  upon a positive response to said discrimination in capacity té dudit terminal VIDEOTEX à afficher des fichiers ima- ges, transformation dudit document courant en un ou plusieurs services au format VIDEOTEX à partir de jeux de caractères de base du terminal VIDEOTEX et de jeux de caractères redéfinissables dynamiquement (DRCS), en  t of said VIDEOTEX terminal to display image files, transformation of said current document into one or more services in VIDEOTEX format from basic character sets of the VIDEOTEX terminal and dynamically redefinable character sets (DRCS), into fonction de l'alphabet de référence alloué et restitu-  function of the reference alphabet allocated and returned tion visuelle ou sonore du document ainsi transformé,  visual or audible tion of the document thus transformed, la restitution visuelle comprenant également l'affi-  visual restitution including also the chage d'idéogrammes reconnus sous forme de cellules images.  chage of ideograms recognized in the form of image cells.
FR9809559A 1998-07-27 1998-07-27 METHOD FOR AUTOMATIC DISCRIMINATION OF AN ALPHABET FOR VISUAL OR SOUND RESTITUTION OF AN HTML DOCUMENT, AND DEVICE FOR MANAGING HTML DOCUMENTS THEREFOR Expired - Fee Related FR2781629B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR9809559A FR2781629B1 (en) 1998-07-27 1998-07-27 METHOD FOR AUTOMATIC DISCRIMINATION OF AN ALPHABET FOR VISUAL OR SOUND RESTITUTION OF AN HTML DOCUMENT, AND DEVICE FOR MANAGING HTML DOCUMENTS THEREFOR

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9809559A FR2781629B1 (en) 1998-07-27 1998-07-27 METHOD FOR AUTOMATIC DISCRIMINATION OF AN ALPHABET FOR VISUAL OR SOUND RESTITUTION OF AN HTML DOCUMENT, AND DEVICE FOR MANAGING HTML DOCUMENTS THEREFOR

Publications (2)

Publication Number Publication Date
FR2781629A1 true FR2781629A1 (en) 2000-01-28
FR2781629B1 FR2781629B1 (en) 2006-09-22

Family

ID=9529035

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9809559A Expired - Fee Related FR2781629B1 (en) 1998-07-27 1998-07-27 METHOD FOR AUTOMATIC DISCRIMINATION OF AN ALPHABET FOR VISUAL OR SOUND RESTITUTION OF AN HTML DOCUMENT, AND DEVICE FOR MANAGING HTML DOCUMENTS THEREFOR

Country Status (1)

Country Link
FR (1) FR2781629B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0723369A1 (en) * 1995-01-23 1996-07-24 NTEX datacommunications bv Access method retrieving Internet information through Teletext/Videotex and the reverse

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0723369A1 (en) * 1995-01-23 1996-07-24 NTEX datacommunications bv Access method retrieving Internet information through Teletext/Videotex and the reverse

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KIKUI G ET AL: "Cross-lingual Information retrieval on the WWW", ECAI96, 12TH EUROPEAN CONFERENCE ON ARTIFICIAL INTELLIGENCE, MULSAIC96 WORKSHOP, 1996, http://www.iit.nrcps.ariadne-t.gr./~costass/muls3.html, pages 1 - 6, XP002099141 *
KIKUI, G: "Identifying the Coding System and Language of On-line Documents on the internet", SIXTEENTH INTERNATIONAL CONFERENCE OF COMPUTATIONAL LINGUISTICS (COLING), August 1996 (1996-08-01), pages 652 - 657, XP002099142 *

Also Published As

Publication number Publication date
FR2781629B1 (en) 2006-09-22

Similar Documents

Publication Publication Date Title
KR100329244B1 (en) Remote web page reader
US6032162A (en) System for processing and storing internet bookmark address links
US20080195954A1 (en) Delivery of contextually relevant web data
FR2813409A1 (en) Configuration of a peripheral for processing of electronic documents in a communication network, uses user data to access level of service available to that user on a network and prepares configuration from user data and service level data
US20100281311A1 (en) Method and system for reconstructing error response messages under web application environment
FR2857763A1 (en) METHOD OF ACCESSING AND SHARING A DIGITAL DOCUMENT IN A P2P COMMUNICATION NETWORK
CN109376133A (en) File access method and file access system
FR2826748A1 (en) Description of an interface applicable to a data object, uses Extended Markup Language XML and XML schema language associated with the XML language to describe parts of a function
FR2795835A1 (en) METHOD FOR VERIFYING CODE TRANSFORMERS FOR AN ON-BOARD SYSTEM, IN PARTICULAR ON A CHIP CARD
FR2880966A1 (en) AUTOMATIC NAVIGATION METHOD IN INTERPOSITION MODE
FR2781629A1 (en) Automatic alphabet discrimination method for restoring HTML documents in original language, based on analysis of suffix component of URL address
FR2826761A1 (en) Network sent extensible mark up language document analysis having language detected and assigned content value read/automatic identification digital word assembly with mark up language/length equal value read.
EP1515522A1 (en) Method of inserting information concerning thematic filtering of HTML pages and corresponding system
CN109523591A (en) Processing method, device, equipment and the storage medium of picture
FR2855695A1 (en) Multimedia programs radio broadcasting method for e.g. PDA, involves adding header to multimedia programs before broadcasting each program, where header indicates type of client device for which program is destined
EP3465476B1 (en) Method for invoking an application service via a browser
FR3030820A1 (en) METHOD FOR ACCESSING DIGITAL CONTENT IN A COMMUNICATION NETWORK USING TERMINAL EQUIPMENT CONNECTED WITH THE COMMUNICATION NETWORK
EP3262536B1 (en) Method for the accelerated download of a web page to a communication terminal
FR2884380A1 (en) Interactive voice service designing and developing method, involves generating automatically software components, from intermediate format description files and/or software code search, in exception data base containing preset exceptions
FR3089027A1 (en) Assistant device, Method for answering questions, Response agent device and Method for providing an answer item
FR2853788A1 (en) METHOD AND DEVICE FOR ACCESSING A DIGITAL DOCUMENT IN A PEER-TO-PEER COMMUNICATION NETWORK
CN104978247A (en) Application test method, application test device and application test system
EP2677708B1 (en) Communication method of an audiovisual message, and communication system
FR2809908A1 (en) Real time web site HTML to WML translation system uses comment markers in separate server
CN117150168A (en) Chat record output method, device and storage medium

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20080331