FR2781629A1 - Automatic alphabet discrimination method for restoring HTML documents in original language, based on analysis of suffix component of URL address - Google Patents
Automatic alphabet discrimination method for restoring HTML documents in original language, based on analysis of suffix component of URL address Download PDFInfo
- Publication number
- FR2781629A1 FR2781629A1 FR9809559A FR9809559A FR2781629A1 FR 2781629 A1 FR2781629 A1 FR 2781629A1 FR 9809559 A FR9809559 A FR 9809559A FR 9809559 A FR9809559 A FR 9809559A FR 2781629 A1 FR2781629 A1 FR 2781629A1
- Authority
- FR
- France
- Prior art keywords
- alphabet
- document
- current document
- current
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
- G06F40/129—Handling non-Latin characters, e.g. kana-to-kanji conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/263—Language identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
Procédé de discrimination automatique d'un alphabet pour la restitutionMethod of automatic discrimination of an alphabet for restitution
visuelle ou sonore d'un document HTML, visual or audio of an HTML document,
et dispositif de gestion de documents HTML correspondant. and corresponding HTML document management device.
L'invention concerne un procédé de discrimination automatique d'un alphabet, notamment pour la restitution visuelle ou sonore d'un document HTML et un dispositif de gestion de documents HTML correspondant. Par "restitution The invention relates to a method for automatic discrimination of an alphabet, in particular for the visual or audible reproduction of an HTML document and a device for managing HTML documents. By "restitution
visuelle ou sonore", on entend la visualisation du docu- visual or audible ", we mean viewing the document
ment et/ou sa lecture vocale.and / or its voice reading.
L'essor considérable de l'échange de données de The considerable boom in data exchange from
tout type, données, textes ou fichiers image, par l'inter- any type, data, text or image files, through
médiaire des réseaux de télécommunication, notamment le réseau INTERNET, pose le problème de la communication de of telecommunications networks, in particular the INTERNET network, poses the problem of the communication of
leurs utilisateurs à partir de cultures et de langues dif- their users from different cultures and languages
férentes. A l'heure actuelle les documents transmis sur le réseau INTERNET sont transmis sous forme de documents férentes. At the present time the documents transmitted on the INTERNET network are transmitted in the form of documents
HTML, pour Hyper Text Mark-up Language en langage anglo- HTML, for Hyper Text Mark-up Language in English language
saxon. Les documents HTML ou compatibles, tels que SGML ou XML, sont constitués généralement d'un fichier HTML et d'éléments associés, tels que par exemple des fichiers image et/ou son, ou d'autres fichiers HTML. Le passage d'un document à un autre se fait généralement à partir Saxon. HTML or compatible documents, such as SGML or XML, generally consist of an HTML file and associated elements, such as for example image and / or sound files, or other HTML files. The passage from one document to another is generally done from
d'un lien, élément pointant vers une adresse URL. L'asso- of a link, element pointing to a URL address. Lasso-
ciation de fichiers HTML à un premier fichier HTML (appelé "frame") se fait généralement par référence à l'adresse URL de ces fichiers. Ces adresses URL sont relatives à un Citation of HTML files to a first HTML file (called "frame") is generally done by reference to the URL address of these files. These URLs relate to a
site, tel qu'un site WEB installé sur ce réseau. WEB dési- site, such as a WEB site installed on this network. WEB desi-
gne en abrégé le système hypermédia WWW (World-Wide Web) short for WWW (World-Wide Web) hypermedia system
en langage anglo-saxon.in Anglo-Saxon language.
Les documents précités, couramment appelés docu- The above documents, commonly called docu-
ments HTML, peuvent donc être écrits, par leurs auteurs, à HTML elements, can therefore be written, by their authors, to
partir d'alphabets étrangers pour l'utilisateur ayant sol- from foreign alphabets for the user having sol-
licité et obtenu l'accès à ces documents. lawful and obtained access to these documents.
Ces documents sont habituellement accessibles, par l'intermédiaire de tout fournisseur d'accès, à partir de These documents are usually accessible, through any access provider, from
tout terminal interconnecté au réseau INTERNET et habili- any terminal interconnected to the INTERNET network and authorized
té.you.
En particulier l'accès et l'affichage de ces docu- In particular the access and display of these documents
ments est actuellement obtenu: - à partir d'un micro ordinateur, dont le clavier et les caractères d'affichage sont notamment adaptés à l'alphabet du pays, ce micro ordinateur étant équipé d'un is currently obtained: - from a microcomputer, whose keyboard and display characters are particularly adapted to the alphabet of the country, this microcomputer being equipped with a
logiciel spécifique désigné par browser en langage anglo- specific software designated by browser in English language
saxon, permettant de traiter, des alphabets répondant à la norme W3C, ainsi que des documents écrits d'une manière Saxon, allowing to treat, alphabets answering the standard W3C, as well as documents written in a way
spécifique dans la langue nationale officielle ou offi- specific in the official or official national language
ciellement reconnue de ce pays; - en effectuant une opération manuelle, préalable officially recognized from this country; - by carrying out a manual operation, prior
ou a posteriori à la lecture d'un tel document, qui con- or after reading such a document, which
siste en général à choisir, pour la machine ou le termi- is generally to choose, for the machine or the termi-
nal, le type d'alphabet que ce dernier doit utiliser; - à partir d'un décodeur à la norme HTML 4.x et nal, the type of alphabet the latter should use; - from a HTML 4.x standard decoder and
capable de décoder des documents écrits suivant le stan- able to decode documents written according to the standard
dard UNICODE ou de détecter les marqueurs placés en tête UNICODE dart or to detect the markers placed at the head
du document aux fins de préciser l'alphabet qui a été ini- of the document for the purpose of specifying the alphabet that was initiated
tialement utilisé pour composer ce dernier. On rappelle que le standard UNICODE est défini par la norme ISO/IEC 10 646. specially used to compose the latter. Remember that the UNICODE standard is defined by the ISO / IEC 10 646 standard.
Toutefois certains pays ont mis en place un procé- However, some countries have put in place a process
dé spécifique, basé généralement sur des normes existan- specific die, generally based on existing standards
tes, afin de permettre une adaptation à la langue natio- in order to allow adaptation to the native language
nale officielle ou officiellement reconnue de ce pays. Ce type de procédé consiste en la récupération de documents official or officially recognized nal of this country. This type of process consists of recovering documents
d'information existants, en la mise en oeuvre d'outils lo- of existing information, by implementing lo-
giciels permettant de composer des documents dans cette software to compose documents in this
langue. Chacun de ces procédés constitue en fait un stan- language. Each of these processes in fact constitutes a stan-
dard de codage et risque fort, dans chaque pays, de perdu- coding sting and high risk, in each country, of losing
rer. En outre il existe actuellement une variété relative de terminaux d'accès aux réseaux INTERNET, certains de ces rer. In addition there are currently a relative variety of Internet access terminals, some of these
derniers ne permettant que des opérations d'affichage li- only allowing display operations li-
mitées. C'est en particulier le cas des premières versions de terminaux à bas coût, lesquelles permettent l'affichage d'un alphabet satisfaisant à la norme ISO 8859-1, alphabet par défaut, mais n'acceptant aucunement l'affichage au moths. This is in particular the case with the first versions of low-cost terminals, which allow the display of an alphabet satisfying the ISO 8859-1 standard, alphabet by default, but not accepting display at all.
standard UNICODE ni même d'autres définitions ISO d'alpha- UNICODE standard or even other ISO definitions of alpha-
bets divers.various bets.
La présente invention a pour objet de remédier aux The object of the present invention is to remedy the
inconvénients liés à la diversité des situations préci- disadvantages linked to the diversity of the above situations
tées, subis par les utilisateurs du réseau INTERNET, afin de permettre, notamment, la restitution visuelle ou sonore ted, suffered by users of the INTERNET network, in order to allow, in particular, visual or audio reproduction
des documents HTML dans leur langue d'origine et leur pré- HTML documents in their original language and pre-
sentation initiale.initial feeling.
Un autre objet de la présente invention est égale- Another object of the present invention is also
ment la mise en oeuvre d'un procédé de discrimination auto- ment the implementation of a process of self-discrimination
matique d'un alphabet pour la visualisation d'un document subject of an alphabet for viewing a document
HTML afin de permettre, pour les terminaux actuels et fu- HTML to allow, for current and future terminals
turs acceptant le standard UNICODE, la conversion de ces turs accepting the UNICODE standard, the conversion of these
documents HTML au standard d'affichage UNICODE précité. HTML documents with the aforementioned UNICODE display standard.
Un autre objet de la présente invention est, éga- Another object of the present invention is, also
lement, la mise en oeuvre d'un procédé de discrimination The implementation of a discrimination process
automatique d'un alphabet pour la visualisation d'un docu- automatic alphabet for viewing a document
ment HTML, par conversion pour visualisation de tout ou partie du document HTML considéré sous forme de cellules HTML, by conversion for viewing all or part of the HTML document considered in the form of cells
images dans un format déterminé.images in a specific format.
Un autre objet de la présente invention est, éga- Another object of the present invention is, also
lement, la mise en oeuvre d'un procédé de discrimination The implementation of a discrimination process
automatique d'un alphabet pour la visualisation d'un docu- automatic alphabet for viewing a document
ment HTML, par conversion pour visualisation de tout ou partie du document HTML considéré sous forme de polices de HTML, by conversion for viewing all or part of the HTML document considered in the form of fonts
caractères résidentes et/ou téléchargeables dans les ter- characters resident and / or downloadable in the ter-
minaux.mineral.
Un autre objet de la présente invention est, éga- Another object of the present invention is, also
lement, la mise en oeuvre d'un procédé de discrimination The implementation of a discrimination process
automatique d'un alphabet, et plus précisément d'une lan- automatic of an alphabet, and more precisely of a lan-
gue, pour réaliser la lecture vocale de tout ou partie du gue, to perform voice playback of all or part of the
document HTML considéré.HTML document considered.
Un autre objet de la présente invention est, éga- Another object of the present invention is, also
lement, la mise en oeuvre d'un procédé de discrimination The implementation of a discrimination process
automatique d'un alphabet pour la visualisation d'un docu- automatic alphabet for viewing a document
ment HTML, par conversion pour visualisation de tout ou partie du document HTML considéré sous forme de caractères DRCS, pour Dynamical Redefinition Character Set en langage anglo-saxon, directement utilisables par les terminaux de HTML ment, by conversion for visualization of all or part of the HTML document considered in the form of DRCS characters, for Dynamical Redefinition Character Set in English language, directly usable by the terminals of
type VIDEOTEX.VIDEOTEX type.
Un autre objet de la présente invention est, éga- Another object of the present invention is, also
lement, la mise en ouvre d'un procédé de discrimination The implementation of a discrimination process
automatique d'un alphabet, et plus précisément d'une lan- automatic of an alphabet, and more precisely of a lan-
gue, pour réaliser la restitution de tout ou partie d'un gue, to carry out the restitution of all or part of a
document HTML sous forme d'un service de type AUDIOTEL. HTML document in the form of an AUDIOTEL type service.
Le procédé de discrimination automatique d'un al- The process of automatic discrimination of an al-
phabet pour la restitution visuelle ou sonore d'un docu- phabet for visual or audio reproduction of a document
ment HTML dans sa langue d'origine et sa présentation initiale, ce document étant délivré par un site WEB suite à la sélection, par exemple, d'une adresse URL déterminée, HTML in its original language and its initial presentation, this document being delivered by a WEB site following the selection, for example, of a determined URL address,
conforme à l'objet de la présente invention, est remarqua- in accordance with the object of the present invention, is remarkable
ble en ce qu'il comporte au moins, pour chaque document HTML courant, les étapes consistant à discriminer dans les adresses URL le suffixe constitutif de cette adresse URL, et suite à la discrimination ou la nondiscrimination de ble in that it comprises at least, for each current HTML document, the steps consisting in discriminating in the URL addresses the constitutive suffix of this URL address, and following the discrimination or nondiscrimination of
ce suffixe, à commander la réception de ce document cou- this suffix, to order the receipt of this document
rant, et à déterminer, relativement au document courant, au moins un alphabet de référence en fonction de données d'en-tête de documents descriptives de l'alphabet utilisé, rant, and to determine, relative to the current document, at least one reference alphabet as a function of header data of documents descriptive of the alphabet used,
et sur réponse positive à cette étape consistant à déter- and on positive response to this step consisting in determining
miner un alphabet de référence, à affecter à ce document mine a reference alphabet, to assign to this document
courant l'alphabet de référence déterminé précité. running the aforementioned determined reference alphabet.
La présente invention a également pour objet la The present invention also relates to the
mise en ouvre, dans un système d'interfaçage et d'adapta- implementation, in an interfacing and adaptation system
tion entre un terminal d'accès à un serveur interconnecté between an access terminal to an interconnected server
à ce serveur par un réseau ou dans un système d'interfa- to this server through a network or in an interface system
çage de type passerelle entre un terminal de type VIDEOTEX gateway type connection between a VIDEOTEX type terminal
et un serveur interconnecté à ce système de type passe- and a server interconnected to this pass-type system
relle par l'intermédiaire d'un réseau soumis à un proto- through a network subject to a proto
cole d'intercommunication de type IP et de communication de documents HTML, d'un dispositif de gestion automatique IP type intercommunication and HTML document communication school, automatic management system
de l'alphabet choisi pour la restitution visuelle ou so- of the alphabet chosen for visual or social restitution
nore de ces documents HTML.of these HTML documents.
Elle sera mieux comprise à la lecture de la des- It will be better understood on reading the
cription et à l'observation des dessins ci-après dans les- description and observation of the drawings below in the
quels: - la figure la représente, à titre illustratif, un which: - the figure represents, by way of illustration, a
organigramme relatif au procédé objet de la présente in- flowchart relating to the process which is the subject of this information
vention permettant une opération de reconnaissance de vention allowing a recognition operation of
l'alphabet utilisé par un document HTML courant et d'allo- the alphabet used by a current HTML document and allo-
cation à ce document d'un alphabet reconnu, l'alphabet re- cation to this document of a recognized alphabet, the alphabet re-
connu étant explicitement défini, autre qu'un alphabet par défaut, ou correspondant au codage UNICODE; - la figure lb représente, en liaison avec la figure known being explicitly defined, other than a default alphabet, or corresponding to UNICODE coding; - Figure lb shows, in conjunction with Figure
la, à titre illustratif, un organigramme relatif au procé- the, by way of illustration, an organization chart relating to the process
dé objet de la présente invention permettant une opération d'allocation d'un alphabet par défaut respectivement d'un alphabet défini estimé, dit alphabet de référence, lorsque aucun alphabet utilisé par le document HTML courant n'est reconnu, l'alphabet défini estimé étant déterminé par une procédure d'estimation spécifique; - la figure lc représente de manière illustrative, le principe d'un processus de masquage appliqué à des mots reconnus de différentes langues, sur un diagramme gradué object of the present invention allowing an operation of allocating a default alphabet respectively an estimated defined alphabet, called reference alphabet, when no alphabet used by the current HTML document is recognized, the estimated defined alphabet being determined by a specific estimation procedure; - Figure lc illustrates, in an illustrative way, the principle of a masking process applied to recognized words of different languages, on a graduated diagram
en nombre de mots pour une pluralité de langues considé- in number of words for a plurality of languages considered
rées; - la figure 2a représente un schéma fonctionnel d'un système d'interfaçage et d'adaptation entre un terminal rees; - Figure 2a shows a block diagram of an interface and adaptation system between a terminal
d'accès à un serveur interconnecté à ce serveur par un ré- access to a server interconnected with this server by a
seau de type INTERNET équipé d'un module d'analyse et de transformation de documents HTML, dans lequel est implanté un dispositif de gestion automatique de l'alphabet choisi pour la restitution visuelle ou sonore de ces documents INTERNET type bucket equipped with an HTML document analysis and transformation module, in which is installed an automatic alphabet management device chosen for the visual or audio reproduction of these documents
HTML, conformément au procédé objet de la présente inven- HTML, in accordance with the process which is the subject of this invention
tion;tion;
- la figure 2b représente un organigramme général re- - Figure 2b shows a general flowchart
latif à un mode opératoire donné à titre d'exemple non li- relative to a procedure given by way of nonlimited example
mitatif du dispositif de gestion automatique implanté dans mitative of the automatic management system implanted in
le module d'analyse et de transformation du système d'in- the analysis and transformation module of the information system
terfaçage et d'adaptation représenté en figure 2a; -7 - la figure 3a représente un schéma fonctionnel d'un système d'interfaçage de type passerelle entre un terminal de type VIDEOTEX et un serveur interconnecté à ce système de type passerelle par l'intermédiaire d'un réseau soumis facing and adaptation shown in Figure 2a; FIG. 3a represents a functional diagram of a gateway type interface system between a VIDEOTEX type terminal and a server interconnected to this gateway type system by means of a subject network.
à un protocole d'intercommunication de type IP et de com- to an IP type intercom and communication protocol
munication de documents HTML, dans lequel est implanté un dispositif de gestion automatique de l'alphabet choisi pour la restitution visuelle ou sonore de ces documents munication of HTML documents, in which is installed an automatic management system of the alphabet chosen for the visual or audio reproduction of these documents
HTML, conformément au procédé objet de la présente inven- HTML, in accordance with the process which is the subject of this invention
tion;tion;
- la figure 3b représente un organigramme général re- - Figure 3b shows a general flowchart
latif à un mode opératoire donné à titre d'exemple non li- relative to a procedure given by way of nonlimited example
mitatif du dispositif de gestion automatique implanté dans mitative of the automatic management system implanted in
la passerelle du système d'interfaçage et d'adaptation re- the gateway to the interfacing and adaptation system
présenté en figure 3a; - la figure 4a représente la visualisation, en France, d'un document HTML délivré par un site WEB situé en Grèce en présentation initiale établie à partir de l'alphabet grec, en l'absence de toute mise en oeuvre du procédé objet de la présente invention; - la figure 4b représente la visualisation, en France, du document HTML représenté en figure 4a, lors de shown in Figure 3a; FIG. 4a represents the visualization, in France, of an HTML document delivered by a WEB site located in Greece in initial presentation established from the Greek alphabet, in the absence of any implementation of the process object of the present invention; FIG. 4b represents the visualization, in France, of the HTML document represented in FIG. 4a, during
la mise en oeuvre du procédé objet de la présente inven- the implementation of the process which is the subject of this invention
tion, les caractères de l'alphabet grec d'origine étant restaurés; - la figure 5a représente la visualisation, en France, d'un document HTML délivré par un site WEB situé tion, the characters of the original Greek alphabet being restored; - Figure 5a shows the display, in France, of an HTML document issued by a WEB site located
au Japon en présentation initiale établie à partir d'idéo- in Japan in initial presentation based on ideo-
grammes japonais, en l'absence de toute mise en oeuvre du procédé objet de la présente invention; - la figure 5b représente la visualisation, en France, du document HTML représenté en figure 5a, lors de Japanese grams, in the absence of any implementation of the process which is the subject of the present invention; FIG. 5b represents the visualization, in France, of the HTML document represented in FIG. 5a, during
la mise en oeuvre du procédé objet de la présente inven- the implementation of the process which is the subject of this invention
tion, les idéogrammes d'origine étant restaurés sous forme de cellules images affichées sur un terminal de type tion, the original ideograms being restored in the form of image cells displayed on a terminal of the type
VIDEOTEX.VIDEOTEX.
Une description plus détaillée du procédé de discri- A more detailed description of the discrimination process
mination automatique d'un alphabet ou d'une langue pour la restitution visuelle ou sonore d'un document HTML conforme à l'objet de la présente invention sera maintenant donnée en liaison avec les figures la et lb. D'une manière générale, on rappelle qu'un document automatic mination of an alphabet or a language for the visual or audio reproduction of an HTML document in accordance with the object of the present invention will now be given in conjunction with FIGS. In general, we recall that a document
HTML est transmis dans sa langue d'origine et sa présenta- HTML is transmitted in its original language and its presentation
tion initiale à partir d'un site WEB délivrant ce dernier à partir d'une adresse URL déterminée. La sélection d'une initial tion from a WEB site delivering the latter from a determined URL address. The selection of a
adresse URL permet ainsi d'obtenir les documents HTML dis- URL address thus makes it possible to obtain the HTML documents available
ponibles au niveau du site WEB précité. available at the aforementioned WEB site.
Ainsi qu'il a été représenté en figure la, lorsque l'utilisateur sur son terminal sélectionne une adresse URL le procédé objet de la présente invention, en référence à la figure la, pour ce document courant délivré par l'adresse URL demandée, consiste à mettre en ouvre une fonction type d'alphabet consistant au moins en une étape (a) à discriminer dans l'adresse URL précitée le suffixe constitutif de cette adresse URL. On rappelle en effet que les adresses URL comportent habituellement une chaîne de caractères dont l'extension symbolisée par un point et un suffixe est significative du pays dans lequel le site WEB As shown in FIG. 1a, when the user on his terminal selects a URL address, the method which is the subject of the present invention, with reference to FIG. 1a, for this current document delivered by the requested URL address, consists to implement a standard alphabet function consisting of at least one step (a) in discriminating in the aforementioned URL address the constituent suffix of this URL address. It should be remembered that URL addresses usually include a character string whose extension symbolized by a period and a suffix is significant for the country in which the WEB site
accédé et interrogé est situé et donc de la langue d'ori- accessed and interrogated is located and therefore of the original language
gine dans laquelle le document HTML correspondant a été normalement établi. Ainsi on rappelle que les extensions courantes sont.gr, pour la Grèce,.ru, pour la Russie, fr, pour la France,.ch pour la Chine,.jp, pour le Japon gine in which the corresponding HTML document was normally drawn up. Thus we recall that the current extensions are .gr, for Greece, .ru, for Russia, fr, for France, .ch for China, .jp, for Japan
et ainsi de suite.And so on.
Cette étape de discrimination est suivie par exemple d'une étape de mémorisation d'une valeur logique de suf- This discrimination step is followed for example by a step of memorizing a logical value of suf-
fixe notée VS à laquelle est attribuée la valeur 1 lors- fixed denoted VS to which the value 1 is assigned when
qu'un suffixe a été reconnu et à laquelle est au contraire that a suffix has been recognized and to which is on the contrary
attribuée la valeur 0 lorsqu'aucun suffixe n'a été recon- assigned the value 0 when no suffix has been recognized
nu. En tout état de cause, la valeur logique attribuée à bare. In any event, the logical value assigned to
la variable VS est mémorisée pour utilisation ultérieure. the variable VS is stored for later use.
Le procédé objet de la présente invention consiste, suite à la discrimination ou à la non-discrimination du The process which is the subject of the present invention consists, following discrimination or non-discrimination of the
suffixe précité et à l'allocation de la valeur 0 ou la va- above suffix and the allocation of the value 0 or the value
leur 1 à la variable logique VS à commander en une étape (b) la réception proprement dite du document courant their 1 to the logic variable VS to order in a step (b) the actual reception of the current document
c'est-à-dire l'admission pour restitution visuelle ou so- i.e. admission for visual or visual restitution
nore au niveau du terminal de ce dernier, l'instruction de nore at the terminal of the latter, the instruction of
restitution visuelle ou sonore n'étant toutefois pas appe- however, visual or audio reproduction is not called
lée pour la restitution visuelle ou sonore du document for the visual or audio reproduction of the document
courant.current.
L'étape (b) de commande de réception de ce document Step (b) to order receipt of this document
courant est alors suivie d'une étape (c) consistant à dé- current is then followed by a step (c) consisting of
terminer pour ce document courant au moins un alphabet de référence susceptible d'être alloué au document courant complete for this current document at least one reference alphabet that can be allocated to the current document
considéré.considered.
D'une manière particulièrement avantageuse, on indi- In a particularly advantageous manner, it is indicated
que que l'alphabet de référence peut consister en l'alpha- that the reference alphabet can consist of alpha-
bet défini explicitement dans l'en-tête et/ou dans le document d'information relatif au document HTML courant et /ou le cas échéant en la reconnaissance, pour le document bet explicitly defined in the header and / or in the information document relating to the current HTML document and / or where appropriate in recognition, for the document
courant, d'un codage de type UNICODE, ainsi que des carac- standard, of a UNICODE type coding, as well as
tères et/ou de séquences privées ou correspondant à des alphabets ISO adoptés en standard dans le pays d'origine, dont émane le document HTML courant considéré. On rappelle tères and / or sequences private or corresponding to ISO alphabets adopted as standard in the country of origin, from which the current HTML document considered emanates. We recall
que le sigle ISO désigne l'Institute for Standard Organi- that the acronym ISO indicates the Institute for Standard Organi-
zation en langage anglo-saxon. A titre d'exemple non limitatif on indique que dans les documents HTML établis au Japon ou à tout le moins "japonisés" la séquence de code lB 24 42 indique que les caractères qui suivent cette séquence sont relatifs à des idéogrammes définis dans le jeu JIS alors que la séquence zation in Anglo-Saxon language. By way of nonlimiting example, it is indicated that in HTML documents established in Japan or at least "Japanese" the code sequence lB 24 42 indicates that the characters which follow this sequence relate to ideograms defined in the JIS game while the sequence
de code lB 28 42 introduit le codage HTML proprement dit. of code lB 28 42 introduces the actual HTML coding.
Sur réponse positive à l'étape (c) précitée, c'est-à- Upon a positive response to the aforementioned step (c), i.e.
dire lors de la reconnaissance de l'un des alphabets pré- say when recognizing one of the pre-
cités comme alphabet de référence, le procédé objet de la présente invention consiste alors à affecter, à l'étape (d), au document courant l'alphabet de référence précité cited as a reference alphabet, the method which is the subject of the present invention then consists in assigning, in step (d), to the current document the aforementioned reference alphabet
c'est-à-dire l'un des alphabets reconnu, alphabet particu- that is to say one of the recognized alphabets, particular alphabet
lier ou par défaut. A l'étape (d) précitée l'allocation au document courant de l'alphabet de référence est notée link or default. In step (d) above, the allocation to the current document of the reference alphabet is noted
VAL PC = VALR.VAL PC = VALR.
En outre, de manière non limitative, à la même étape In addition, without limitation, at the same stage
(d), et pour une notion de complétude du caractère itéra- (d), and for a notion of completeness of the iterative character
tif du procédé objet de la présente invention relatif à tif of the process which is the subject of the present invention relating to
tout document HTML successif, à une variable représenta- any successive HTML document, to a representative variable
tive de l'alphabet du document HTML précédent notée tive from the alphabet of the previous HTML document noted
VALPP, qui n'est autre bien entendu que le document cou- VALPP, which is of course none other than the document
rant actuel, est également alloué l'alphabet de référence précité cette opération étant notée à l'étape (d) de la figure la VAL PP = VAL R. L'étape (d) en tant que telle est alors suivie d'une rant current, is also allocated the aforementioned reference alphabet this operation being noted in step (d) of the figure the VAL PP = VAL R. The step (d) as such is then followed by a
étape de fin de procédure puisque pour la restitution vi- end of procedure stage since for the restitution vi-
suelle ou sonore du document courant précité et le cas soot or sound of the aforementioned current document and the case
échéant de tout document ultérieur à partir de ce même do- any subsequent document from that same document.
cument courant constituant le document précédent de ce dernier a été attribué un alphabet de référence consistant en l'un des alphabets, reconnu à l'étape (c). D'une ma- nière générale on indique que l'étape de fin de procédure peut consister en un appel d'une fonction de traitement de document pour assurer une mise en page du document courant current cument constituting the previous document of the latter has been assigned a reference alphabet consisting of one of the alphabets, recognized in step (c). In general, it is indicated that the end of procedure step can consist of a call to a document processing function to ensure a layout of the current document.
précité et finalement assurer un affichage et/ou une lec- above and finally ensure a display and / or a read-
ture vocale de ce dernier.voice ture of the latter.
Le procédé objet de la présente invention tel que dé- The process which is the subject of the present invention such as
crit précédemment en liaison avec la figure la permet une restitution visuelle satisfaisante pour la majorité des terminaux et navigateurs modernes satisfaisant à la norme previously written in connection with FIG. 1a allows a satisfactory visual reproduction for the majority of modern terminals and browsers meeting the standard
HTML 4.x.HTML 4.x.
Cependant, lorsqu'un alphabet au sens ISO du terme est commun à plusieurs langues, comme l'est par exemple l'alphabet par défaut ISO LATIN 1 (ISO0-8859-1), une façon avantageuse mais non limitative de permettre la définition plus précise de la langue à utiliser, notamment pour la restitution sonore du document, va consister, sur réponse positive à l'étape (c), entre autres: au cours d'une étape (g'), à identifier dans les données à restituer un ensemble de mots distinctifs vis-à-vis d'une pluralité de dictionnaires réduits de mots préétablis non communs à plusieurs langues d'origine et mémoriser cette opération de comparaison et d'identification sous forme de listes de mots classées par nombre de mots détectés par langue d'origine et par nombre total de mots, pour établir une However, when an alphabet in the ISO sense of the term is common to several languages, such as the default alphabet ISO LATIN 1 (ISO0-8859-1), an advantageous but non-limiting way of allowing more definition specifies the language to be used, in particular for the sound reproduction of the document, will consist, upon a positive response in step (c), among others: during a step (g '), to be identified in the data to be restored a set of distinctive words vis-à-vis a plurality of reduced dictionaries of preset words not common to several original languages and memorize this comparison and identification operation in the form of lists of words classified by number of words detected by original language and by total number of words, to establish a
pluralité de variables de classement du nombre de mots dé- plurality of classification variables for the number of words
tectés par langue d'origine et par nombre total de mots; tect by original language and by total number of words;
au cours d'une étape (h'), à soumettre les données à res- during a step (h '), to submit the data to res-
tituer du document courant à un test d'existence ou de non existence d'une fin de document du document courant, et, to replace the current document with a test for the existence or non-existence of an end of document of the current document, and,
sur réponse positive à ce test d'existence ou de non exis- on positive response to this test of existence or nonexistence
tence d'une fin de document, (i') allouer au document cou- rant une langue de référence choisie en fonction de la valeur d'au moins une variable de classement du nombre de mots détectés par langue d'origine et par nombre total de mots. Toutefois, et en raison de la diversité des matériels tence of an end of document, (i ') allocate to the current document a reference language chosen as a function of the value of at least one classification variable of the number of words detected by original language and by total number of words. However, and due to the diversity of materials
connectés à ce réseau précédemment mentionnée dans la des- connected to this network previously mentioned in the
cription, lorsqu'en référence à l'étape (c) de détermina- cription, when with reference to step (c) of determining
tion d'au moins un alphabet de référence aucun alphabet défini explicitement dans l'en-tête et/ou dans le document d'information relatif au document HTML n'est détecté ou lorsque le codage UNICODE du document n'est pas détecté ou que des séquences privées ou correspondant à un alphabet tion of at least one reference alphabet no alphabet defined explicitly in the header and / or in the information document relating to the HTML document is detected or when the UNICODE encoding of the document is not detected or that private sequences or corresponding to an alphabet
ISO autre que celui par défaut, ne sont pas non plus dé- ISO other than the default, are also not de-
tectées, la réponse à l'étape (c) de détermination est the response to step (c) of determination is
alors négative.then negative.
Dans un tel cas et conformément à un mode de réalisa- In such a case and in accordance with an embodiment
tion particulier non limitatif du procédé objet de la pré- particular non-limiting indication of the process which is the subject of the pre-
sente invention, ce procédé consiste en outre dans une étape (e) à allouer au document courant un alphabet par sente invention, this method further consists in a step (e) to allocate to the current document an alphabet by
défaut. Cette opération est notée VALPC = AD, AD dési- default. This operation is noted VALPC = AD, AD desi-
gnant l'alphabet par défaut sur la figure la à l'étape (e). Bien entendu, l'allocation d'un alphabet par défaut à l'étape (e) n'est pas une fin en soi mais constitue, en fait, une solution d'affichage minimal en vue d'assurer gaining the default alphabet in figure la in step (e). Of course, the allocation of a default alphabet in step (e) is not an end in itself but constitutes, in fact, a minimal display solution in order to ensure
l'affichage et/ou la lecture vocale du document HTML cou- display and / or voice reading of the HTML document
rant correspondant.rant corresponding.
En conséquence, ainsi que représenté sur la figure la Consequently, as shown in the figure la
l'étape (e) peut alors être suivie d'une étape (f) consis- step (e) can then be followed by step (f) consisting of
tant à soumettre les données à restituer du document HTML both to submit the data to be returned from the HTML document
courant à un processus de filtrage consistant, par exem- current to a consistent filtering process, e.g.
ple, à discriminer le pourcentage des valeurs de code de ces données à restituer, ce pourcentage de valeurs de code étant noté N. valeurs de code notées CODE comprises entre une première et une deuxième valeurs limites pour établir ple, to discriminate the percentage of code values of these data to be restored, this percentage of code values being noted N. code values noted CODE comprised between a first and a second limit value to establish
une valeur de pourcentage descriptive de code de ces don- a descriptive percentage code value of these data
nées à restituer pour le document courant considéré. On to be returned for the current document considered. We
conçoit bien sûr qu'en fonction de la valeur de pourcen- of course understands that depending on the value of percent
tage N précitée le procédé objet de la présente invention permet d'établir et de discriminer un alphabet autre que tage N above the process which is the subject of the present invention makes it possible to establish and discriminate an alphabet other than
l'alphabet par défaut précité, mais susceptible de présen- the aforementioned default alphabet, but likely to present
ter une meilleure adaptation à la représentation et l'af- ter a better adaptation to the representation and the af-
fichage et/ou la lecture vocale du document HTML courant file and / or voice reading of the current HTML document
dans sa version linguistique d'origine. in its original language version.
Dans un mode de réalisation préférentiel non limita- In a preferred, non-limiting embodiment,
tif on indique que la première et la deuxième valeurs li- tif we indicate that the first and second values li-
mites peuvent être prises égales à la valeur A0 et à la valeur FF respectivement, ces valeurs étant exprimées dans ce cas en code hexadécimal. Le pourcentage des valeurs de mites can be taken equal to the value A0 and the value FF respectively, these values being expressed in this case in hexadecimal code. The percentage of the values of
code comprises entre les valeurs limites précitées est no- code between the aforementioned limit values is no-
té N, N étant exprimé en %.tee N, N being expressed in%.
L'étape (f) précitée est alors elle-même suivie d'une The aforementioned step (f) is then itself followed by a
étape (g) de recherche d'un alphabet ou d'une langue par- step (g) of finding an alphabet or a language by
ticulier dans le document HTML courant, cette étape de re- particular in the current HTML document, this step of re-
cherche d'un ou d'une langue alphabet particulier looking for a particular alphabet language or
consistant à identifier et repérer dans les données à res- consisting in identifying and locating in the data to be
* tituer précitées un ensemble de mots distinctifs, par com-* titrate above a set of distinctive words, by
paraison et identification de ces mots distinctifs vis-à- comparison and identification of these distinctive words vis-à-vis
vis d'une pluralité de dictionnaires réduits de mots pré- vis a plurality of reduced dictionaries of pre-
établis, non communs à plusieurs langues d'origine. established, not common to several languages of origin.
L'opération réalisée à l'étape (g) précitée peut être réalisée de façon à obtenir avantageusement un classement par nombre de mots différents détectés par langue et par The operation carried out in the aforementioned step (g) can be carried out so as to advantageously obtain a classification by number of different words detected by language and by
nombre total de mots.total number of words.
On comprend en particulier que le mode opératoire précité à l'étape (g) représenté en figure la permet alors It is understood in particular that the above-mentioned operating mode in step (g) represented in the figure then allows it
d'établir une pluralité de variables de classement du nom- to establish a plurality of name classification variables-
bre des mots détectés par langue d'origine, c'est-à-dire number of words detected by original language, i.e.
en fait par alphabet permettant d'exprimer une telle lan- actually by alphabet allowing to express such a lan-
gue d'origine, et bien entendu par nombre total de mots original word, and of course by total number of words
dans la langue d'origine considérée. in the original language considered.
D'une manière générale on indique que les variables In general, we indicate that the variables
de classement peuvent être organisées en fichiers succes- can be organized into successive files
sifs tels que représentés schématiquement dans le tableau ci-après: Alphabet Ai Alphabet A2 Alphabet AN-1 Alphabet AN NBMotdifférents NB Mot différents NB_Mot différents NBMotdifférents Alphali Alpha2 AlphaN-1 AlphaN TotalMot_ 1 A1 TotalMot_ 1 A2 Total Mot_ 1 AN-1 TotalMot 1 AN Total Mot 2 Ai Total Mot 2 A2 ITotal Mot 2 AN-1 Total Mot 2 AN Total_Mot 3 A1 Total_Mot_3 A2 TotalMot_3_AN-1 Total_Mot 3 AN TotalMotN-lA1 TotalMotN-lA2 TotalMotN-1iAN-1 TotalMotN-lAN Total_Mot NA1 [TotalMotN A2 Total Mot N AN-1 Total Mot N AN as shown schematically in the table below: Alphabet Ai Alphabet A2 Alphabet AN-1 Alphabet AN NBMotdifferent NB Different word NB_Mot different NBMotdifferent Alphali Alpha2 AlphaN-1 AlphaN TotalMot_ 1 A1 TotalMot_ 1 A2 Total Mot_ 1 AN-1 TotalMot 1 AN Total Word 2 Ai Total Word 2 A2 ITotal Word 2 AN-1 Total Word 2 AN Total_Mot 3 A1 Total_Mot_3 A2 TotalMot_3_AN-1 Total_Mot 3 AN TotalMotN-lA1 TotalMotN-lA2 TotalMotN-1iAN-1 TotalMotN-lAN Total_Mot NA1 [TotalMotN A2 Total Word N AN-1 Total Word N AN
Dans le tableau précité, on indique que chaque dic- In the above table, it is indicated that each dic-
tionnaire réduit peut comporter par exemple entre cinq et dix mots pour chaque langue ou alphabet support de chaque reduced tionnaire can include for example between five and ten words for each language or support alphabet of each
langue considérée. A titre d'exemple non limitatif on in- language considered. By way of nonlimiting example, we in-
dique que les mots du dictionnaire réduit de chaque langue sont des mots à forte fréquence de répétition, spécifiques à chaque langue considérée, tels que les articles, les pronoms personnels, adjectifs possessifs soit pour le français le, la, les, je, tu, il, mon, ton, son, pour l'anglais the, my, you etc. Dans le tableau précité les différents alphabets sont states that the words in the reduced dictionary of each language are words with a high frequency of repetition, specific to each language considered, such as articles, personal pronouns, possessive adjectives, either for French le, la, les, je, tu, il, mon, ton, son, for English the, my, you etc. In the above table the different alphabets are
notés alphabet A1 à alphabet An le nombre des mots diffé- noted alphabet A1 to alphabet An the number of different words
rents sont notés Total mot 1 A1 pour le premier mot de rents are noted Total word 1 A1 for the first word of
l'alphabet A1, Totalmot_1 A2 pour le premier mot de l'al- the alphabet A1, Totalmot_1 A2 for the first word of the al-
phabet A2 et ainsi de suite. L'ensemble est alors classé phabet A2 and so on. The whole is then classified
ainsi que représenté au tableau précité. as shown in the above table.
On comprend bien sûr que l'étape (g) de recherche d'un alphabet ou d'une langue particulier par analyse et We understand of course that step (g) of searching for a particular alphabet or language by analysis and
comparaison des mots par rapport aux mots des dictionnai- comparison of words against words in dictionaries
res réduits est réalisée pour chaque mot du document cou- reduced res is performed for each word of the document
rant considéré. Pour cette raison, après chaque mot de ce dernier les données à restituer sont soumises à une étape (h) consistant à soumettre les données à restituer de ce document courant à un test d'existence ou de non-existence d'une fin de document de ce dernier. Ce test peut être simplement réalisé par la détection d'un code de fin de document pour le document HTML considéré, ou par détection de la réception complète du document, ou sur réception rant considered. For this reason, after each word of the latter the data to be restored are subjected to a step (h) consisting in subjecting the data to be restored of this current document to a test of existence or non-existence of an end of document. of the last. This test can be simply carried out by detecting an end-of-document code for the HTML document considered, or by detecting the complete reception of the document, or upon reception
d'une partie du document jugée suffisante pour faire abou- of part of the document deemed sufficient to terminate
tir le procédé de l'invention, ou encore par détection from the process of the invention, or by detection
d'un code de fin de fichier.an end of file code.
Sur réponse négative au test d'existence de fin de document de l'étape (h) le processus est poursuivi pour le mot suivant par retour à l'étape (b) réception de document par exemple. On comprend en effet que l'étape réception de document (b) précitée peut être réalisée relativement au On a negative response to the end-of-document existence test of step (h), the process is continued for the next word by returning to step (b) receiving the document for example. It is in fact understood that the above-mentioned document reception step (b) can be carried out relative to the
mot successif constitutif du document HTML courant consi- successive word constituting the current HTML document considered
déré. Au contraire sur réponse positive au test de l'étape (h) précédemment mentionnée, le procédé objet de la pré- sente invention consiste à allouer au document courant un déré. On the contrary, on a positive response to the test of step (h) previously mentioned, the method which is the subject of the present invention consists in allocating to the current document a
alphabet de référence choisi en fonction de la valeur des- reference alphabet chosen according to the value of-
criptive de pourcentage de code de ces données à resti- code percentage code of this data to resti-
tuer, la valeur N précitée, pour le document courant kill, the aforementioned value N, for the current document
considéré et de la valeur d'au moins une variable de clas- considered and the value of at least one class variable
sement du nombre de mots détectés par langue d'origine et par nombre total de mots. On conçoit par exemple à titre the number of words detected by original language and by total number of words. We conceive for example as
d'exemple non limitatif qu'une procédure permettant d'al- non-limiting example that a procedure allowing
louer au document courant un alphabet de référence corres- rent a corresponding reference alphabet from the current document
pondant à celui choisi à l'étape (g) peut consister à prendre par exemple comme alphabet de référence celui qui corresponding to that chosen in step (g) can consist in taking for example as a reference alphabet the one which
correspond à la somme du nombre total de mots du diction- is the sum of the total number of words in the diction-
naire réduit correspondant dont la valeur est la plus forte. Ce mode de réalisation simple n'est pas forcément le plus adapté et il est préférable, en particulier, de soumettre le processus précité, ainsi que représenté sur la figure la en une étape (i), à un test supplémentaire consistant en une comparaison de la valeur descriptive de corresponding reduced naire with the highest value. This simple embodiment is not necessarily the most suitable and it is preferable, in particular, to subject the aforementioned process, as shown in FIG. 1a in a step (i), to an additional test consisting of a comparison of the descriptive value of
pourcentage de code de données à restituer, pour le docu- ment courant considéré, soit la valeur N précitée, à une valeur de seuil. percentage of data code to be restored, for the current document considered, ie the aforementioned value N, to a threshold value.
Ce test de comparaison, noté dans ces conditions il sur la figure la peut par exemple consister à comparer la valeur N de pourcentage précité à une valeur This comparison test, noted under these conditions in FIG. 1a, can for example consist in comparing the value N of the aforementioned percentage with a value
de seuil de référence qui peut être prise égale à 50%. of reference threshold which can be taken equal to 50%.
Le test réalisé à l'étape (i) et en particulier (il) peut alors être suivi de manière avantageuse d'une étape de mémorisation d'une variable logique C2 représentant la The test carried out in step (i) and in particular (it) can then be advantageously followed by a step of memorizing a logic variable C2 representing the
condition 2 précitée, à cette variable logique étant at- condition 2 above, with this logical variable being at-
tribuée la valeur 1 sur réponse positive au test il précé- tributed the value 1 on positive response to the test it precedes
demment mentionné alors que sur réponse négative au test il précité est allouée une valeur 0 à la variable logique C2. Les étapes de mémorisation précédemment mentionnées peuvent alors être suivies soit du choix de la somme du nombre de mots majoritaires précédemment mentionnés, soit d'un processus beaucoup plus élaboré lequel sera décrit en Also mentioned when a negative response to the above test is assigned a value 0 to the logic variable C2. The previously mentioned memorization steps can then be followed either by the choice of the sum of the number of majority words previously mentioned, or by a much more elaborate process which will be described in
liaison avec la figure lb ci-après. link with Figure lb below.
En référence à la figure lb précédemment citée, le test (i) de la figure la, suite à la mémorisation de la variable logique C2, peut comprendre et être suivi, ainsi que représenté sur la figure lb d'au moins un test (j) de reconnaissance de discrimination ou de non-discrimination du suffixe précédemment cité, ce test pouvant alors être simplement réalisé par appel de la variable logique VS With reference to FIG. 1b previously cited, the test (i) of FIG. 1a, following the storage of the logic variable C2, can understand and be followed, as shown in FIG. 1b of at least one test (j ) recognition of discrimination or non-discrimination of the aforementioned suffix, this test can then be simply carried out by calling the logic variable VS
précédemment mentionnée dans la description et comparaison previously mentioned in description and comparison
de la valeur de cette variable logique à la valeur 1. Le from the value of this logic variable to the value 1. The
suffixe ayant été mémorisé précédemment, il est alors pos- suffix having been memorized previously, it is then pos-
sible de poursuivre l'étape (i) précitée dans le mode de likely to continue the above step (i) in the mode of
réalisation préférentiel ci-après. preferential realization below.
Sur réponse positive au test (j) précédemment men- On positive response to the test (j) previously men-
tionné, un test (k) est prévu consistant à effectuer un tioned, a test (k) is planned consisting in carrying out a
premier critère de choix d'un alphabet spécifique respec- first criterion for choosing a specific alphabet respec-
tivement de l'alphabet par défaut alloué à l'étape (e) précédente. Ce premier critère de choix peut consister par of the default alphabet allocated in step (e) above. This first criterion of choice may consist of
exemple en une comparaison de la variable logique C2 rela- example in a comparison of the logical variable C2 related
tive à la condition 2 à la valeur 1. Sur réponse positive au test (k) précité, et donc au premier critère de choix, tive at condition 2 to the value 1. On positive response to the above test (k), and therefore to the first selection criterion,
une étape (k2) est introduite consistant à allouer au do- a step (k2) is introduced consisting in allocating to the do-
cument courant un alphabet spécifique comme alphabet de référence en fonction du type de suffixe reconnu. Cette opération est notée VAL_PC, variable relative à l'alphabet du document courant, = VALR l'alphabet reconnu étant pris comme alphabet de référence. De la même manière que dans le cas de l'étape (d), cet alphabet spécifique en une étape (kl) est également Current cument a specific alphabet as a reference alphabet depending on the type of suffix recognized. This operation is noted VAL_PC, variable relating to the alphabet of the current document, = VALR the recognized alphabet being taken as reference alphabet. In the same way as in step (d), this specific alphabet in one step (kl) is also
alloué au document précédant le document courant ulté- allocated to the document preceding the current document
rieur, c'est-à-dire au document courant actuel. Cette opé- laughing, that is to say the current document. This operation
ration est notée de la même manière que dans le cas de ration is noted in the same way as in the case of
l'étape (d) VALPP = VAL_R.step (d) VALPP = VAL_R.
Au contraire, lorsque le test (k) sur la variable lo- On the contrary, when the test (k) on the variable lo-
gique C2 n'est pas satisfait, et donc sur réponse négative au premier critère de choix 1, au document courant est gic C2 is not satisfied, and therefore on a negative response to the first choice criterion 1, the current document is
alors alloué l'alphabet par défaut tel que défini précé- then allocated the default alphabet as defined above
demment avec l'étape (e) comme alphabet de référence. Use step (e) as the reference alphabet.
L'étape (1) est notée affichage par défaut sur la figure lb. De la même manière que relativement à l'étape (kl) précédemment décrite, cet alphabet par défaut peut alors Step (1) is noted default display in Figure lb. In the same way as with step (kl) previously described, this default alphabet can then
être alloué au document précédant le document courant ul- be allocated to the document preceding the current document ul-
térieur. Sur réponse négative au test (j) précité, la variable térieur. On negative response to the above test (j), the variable
logique VS étant différente de la valeur 1 avec les con- VS logic being different from the value 1 with the con-
ventions précédemment définies, un deuxième critère de previously defined, a second criterion of
choix d'un alphabet spécifique respectivement de l'alpha- choice of a specific alphabet respectively of alpha-
bet par défaut est alors introduit. Ce deuxième critère de choix porte la référence m et consiste en un test de la variable logique C2 relative à la condition 2 précédemment définie à l'étape (il) à la valeur 1. Sur réponse négative au deuxième critère de choix m précité, le procédé objet de la présente invention consiste à effectuer un affichage default bet is then introduced. This second choice criterion carries the reference m and consists of a test of the logical variable C2 relating to condition 2 previously defined in step (ii) at the value 1. On a negative response to the second choice criterion m above, the method object of the present invention is to perform a display
et/ou une lecture vocale par défaut, c'est-à-dire l'affi- and / or a default voice reading, i.e. the display
chage et/ou la lecture vocale par défaut tel(s) que défi- chage and / or default voice playback as defined
ni(s) à l'étape (1) précédemment décrite dans la nor (s) in step (1) previously described in the
description. Ainsi à l'étape (1) précitée, au document description. Thus in the above-mentioned step (1), in the document
courant est alloué comme alphabet de référence, l'alphabet current is allocated as the reference alphabet, the alphabet
par défaut. On indique que l'étape (1) d'affichage par dé- by default. It is indicated that the step (1) of display by
faut est alors suivie d'une étape de fin de procédure sem- is then followed by a semi-procedural end step
blable à celle qui a été décrite en liaison avec l'étape similar to that described in connection with step
(d) précédemment mentionnée dans la description. Il en est (d) previously mentioned in the description. It is
de même pour les étapes (kl) et (k2) précédemment décri- similarly for steps (kl) and (k2) previously described
tes.your.
De la même manière que sur réponse négative au pre- In the same way as on a negative response to the first
mier critère de choix k, la réponse négative au deuxième critère de choix m implique l'appel de l'étape (1) et en mier choice criterion k, the negative response to the second choice criterion m implies the call of step (1) and in
particulier l'allocation de l'alphabet par défaut au docu- particular the allocation of the alphabet by default to the docu-
ment précédant le document courant ultérieur dans des con- preceding the subsequent current document in con-
ditions semblables.similar editions.
Sur réponse positive au deuxième critère de choix m, le procédé objet de la présente invention consiste alors à effectuer un troisième critère de test (n) d'allocation au document précédant le document courant d'un alphabet de référence, c'est-à-dire d'un alphabet autre que l'alphabet On a positive response to the second selection criterion m, the method which is the subject of the present invention then consists in performing a third test criterion (n) for allocation to the document preceding the current document with a reference alphabet, that is to say -to say of an alphabet other than the alphabet
par défaut.by default.
Sur réponse positive au troisième critère de test n précité, une opération d'allocation au document courant de l'alphabet de référence alloué au document précédant le On positive response to the third test criterion n above, an operation to allocate to the current document the reference alphabet allocated to the document preceding the
document courant est effectuée à l'étape (o), cette opéra- current document is performed in step (o), this operation
tion étant notée en conséquence VAL PC = VALPP. L'étape tion being noted accordingly VAL PC = VALPP. The stage
(o) précitée est alors suivie de l'étape de fin de procé- (o) above is then followed by the end of process step.
dure précédemment mentionnée dans la description. duration previously mentioned in the description.
Au contraire, sur réponse négative à l'étape (n) de troisième critère de test, un quatrième critère de test p est alors réalisé, ce quatrième critère de test consistant On the contrary, on a negative response to step (n) of the third test criterion, a fourth test criterion p is then carried out, this fourth test criterion consisting
en fait en un test de reconnaissance d'au moins un alpha- actually in a recognition test of at least one alpha-
bet pour déterminer un alphabet reconnu. A titre d'exemple non limitatif, on indique que le quatrième critère de test p peut consister à effectuer une comparaison pl de mots caractéristiques d'un ou plusieurs alphabets avec un masque de décision prédéfini tel qu'un bet to determine a recognized alphabet. By way of nonlimiting example, it is indicated that the fourth test criterion p may consist in carrying out a comparison pl of words characteristic of one or more alphabets with a predefined decision mask such as a
OU logique par exemple.OR logical for example.
En référence à la figure lc on indique que la fonc- With reference to FIG. 1c, it is indicated that the function
tion de masquage peut être introduite lorsqu'il existe une ambiguïté sur le nombre de mots reconnus par rapport à deux langues, les langues L1 et L4 par exemple, ainsi que masking can be introduced when there is ambiguity in the number of words recognized in relation to two languages, languages L1 and L4 for example, as well as
relativement à leur distance, par rapport aux autres lan- relative to their distance from other lan-
gues telles que les langues L2 et L3 lorsque ces distances gues such as languages L2 and L3 when these distances
ne sont pas considérées comme significatives. are not considered significant.
L'étape (pl) de comparaison des mots peut alors être suivie d'une étape (p2) consistant à définir l'existence ou la non-existence d'un alphabet. Ce critère consiste simplement à appliquer aux variables logiques obtenues par l'application du OU logique de masquage d'une comparaison The step (pl) of comparing words can then be followed by a step (p2) consisting in defining the existence or non-existence of an alphabet. This criterion consists simply in applying to the logical variables obtained by applying the logical OR of masking a comparison
à la valeur 1 de cette variable logique. at the value 1 of this logic variable.
Sur réponse positive au critère d'existence d'un al- Upon a positive response to the criterion of existence of an al-
phabet p2 et donc sur réponse positive au quatrième cri- phabet p2 and therefore on positive response to the fourth cry-
tère de test p le procédé objet de la présente invention test mother p the process which is the subject of the present invention
consiste alors en une étape (q) à allouer au document cou- then consists of a step (q) to allocate to the document
rant l'alphabet reconnu, cet alphabet reconnu étant pris comme alphabet de référence, cette opération est notée VAL PC = alphabet reconnu au test q précité. De la même manière que dans le cas des opérations k2 et kl ou de l'étape (d) cet alphabet reconnu est également alloué au rant the recognized alphabet, this recognized alphabet being taken as the reference alphabet, this operation is denoted VAL PC = alphabet recognized in the aforementioned test q. In the same way as in the case of operations k2 and kl or in step (d) this recognized alphabet is also allocated to the
document précédant le document courant ultérieur, c'est-à- document preceding the subsequent current document, i.e.
dire au document courant. Cette opération est notée de la même manière VALPP = alphabet reconnu. L'étape (q) est bien entendu suivie de l'étape de fin de procédure précé- tell the current document. This operation is noted in the same way VALPP = recognized alphabet. Step (q) is of course followed by the step at the end of the previous procedure.
demment mentionnée dans la description. as mentioned in the description.
Au contraire sur réponse négative à l'étape (p2) de critère d'alphabet, c'est-à-dire, sur réponse négative au quatrième critère de test p de reconnaissance d'au moins On the contrary, on a negative response to step (p2) of the alphabet criterion, that is to say, on a negative response to the fourth test criterion p of recognition of at least
un alphabet, aucun alphabet n'ayant pu être reconnu con- an alphabet, no alphabet having been recognized
formément à la mise en ouvre du procédé objet de la pré- formally to the implementation of the process object of the pre-
sente invention, une étape (r) est alors réalisée invention, step (r) is then carried out
consistant à permettre une levée de doute quant à la re- consisting in allowing a removal of doubt as to the
connaissance de l'alphabet par l'utilisateur. Cette étape consiste alors à effectuer un choix manuel d'un alphabet knowledge of the alphabet by the user. This step then consists in making a manual choice of an alphabet
par ce dernier. Cet alphabet constitue un alphabet préci- by the latter. This alphabet constitutes a preci-
sé, lequel est alors alloué au document courant, et, de la même manière que relativement aux étapes (q), (kl), (k2) sé, which is then allocated to the current document, and, in the same way as with steps (q), (kl), (k2)
et (d) au document précédant le document courant ulté- and (d) the document preceding the subsequent current document.
rieur. L'étape (r) est alors suivie d'une étape de fin de laughing. Step (r) is then followed by an end step of
procédure telle que décrite précédemment dans la descrip- procedure as described previously in the description
tion. En ce qui concerne l'initialisation du procédé objet tion. Regarding the initialization of the object process
de la présente invention, c'est-à-dire lors de la récep- of the present invention, that is to say when receiving
tion du premier document HTML, cette étape d'initialisa- tion of the first HTML document, this initialization step
tion peut consister à choisir comme alphabet par défaut un alphabet tel que l'alphabet ISO latin par exemple, ce type tion can consist in choosing as alphabet by default an alphabet such as the ISO Latin alphabet for example, this type
d'alphabet correspondant à l'alphabet ASCII américain au- of alphabet corresponding to the American ASCII alphabet above
quel sont ajoutés les caractères accentués européens. which European accented characters are added.
En outre, on indique que selon une variante de mise en ouvre non limitative du procédé objet de la présente invention, l'étape a) consistant à discriminer dans l'adresse URL le suffixe constitutif de cette dernière peut ne pas être exécutée antérieurement à l'étape b). En In addition, it is indicated that according to a non-limiting implementation variant of the method which is the subject of the present invention, step a) consisting in discriminating in the URL address the suffix constituting the latter may not be executed prior to the 'step b). In
effet, l'étape a) précitée peut, par exemple, être exécu- Indeed, the aforementioned step a) can, for example, be executed.
tée préalablement à l'étape j) représentée en figure lb, suite à l'exécution de l'étape i) représentée en figure ted before step j) shown in figure lb, following the execution of step i) shown in figure
la, sans sortir du cadre de l'objet de la présente inven- without departing from the scope of the subject of this invention
tion, l'adresse URL ayant été mémorisée. tion, the URL address having been stored.
Un mode de réalisation spécifique d'un dispositif de A specific embodiment of a
gestion automatique de l'alphabet choisi pour la restitu- automatic management of the alphabet chosen for the restitution
tion visuelle ou sonore de documents HTML mis en oeuvre dans un système d'interfaçage et d'adaptation entre un terminal d'accès à un serveur interconnecté par un réseau soumis à un protocole d'intercommunication de type IP pour INTERNET PROTOCOLE et de communication HTML de documents visual or audio tion of HTML documents implemented in an interface and adaptation system between an access terminal to a server interconnected by a network subject to an IP type intercom protocol for INTERNET PROTOCOL and HTML communication of documents
précités, sera maintenant décrit en liaison avec les figu- mentioned above, will now be described in connection with the fig-
res 2a et 2b.res 2a and 2b.
D'une manière générale on rappelle que ce type de système d'interfaçage et d'adaptation comprend un module d'analyse et de transformation HTML noté Ml, un module d'anticipation noté M2, un module de conversion en ligne Generally speaking, it is recalled that this type of interfacing and adaptation system includes an HTML analysis and transformation module denoted Ml, an anticipation module denoted M2, an online conversion module
de documents noté M3 et un module de mémoire cache de do- of documents noted M3 and a cache memory module of
cuments convertis noté M4. L'ensemble de ces éléments pré- converted cuments noted M4. All of these elements pre-
cités est connecté par l'intermédiaire d'un système dit cited is connected via a system called
"proxy" ce système proxy, sur les réseaux INTERNET, ser- "proxy" this proxy system, on INTERNET networks, serves
vant d'interface d'adaptation entre le terminal et un ser- front of adaptation interface between the terminal and a service
veur. Le terminal et le serveur sont représentés et désignés comme tels sur la figure 2a. l'ensemble constitué par les éléments précités à savoir le module d'analyse et de transformation HTML Ml, le mécanisme d'anticipation M2, veur. The terminal and the server are represented and designated as such in FIG. 2a. the set made up of the aforementioned elements, namely the HTML analysis and transformation module Ml, the anticipation mechanism M2,
le module de conversion au vol des documents M3 et le mo- the M3 document conversion module and the mo-
dule de mémoire cache des documents convertis M4, associés cache of converted M4 documents, associated
au système proxy est appelé un conjugué. Un conjugué per- to the proxy system is called a conjugate. A conjugate per-
met, en fait, d'assurer le transfert, avec ou sans conver- puts, in fact, to ensure the transfer, with or without conver-
sion, des documents délivrés par le serveur vers le terminal au format HTML. Ainsi qu'on l'a représenté de manière schématique sur la figure 2a, le dispositif de gestion automatique de l'alphabet choisi pour la restitution visuelle ou sonore sion, documents delivered by the server to the terminal in HTML format. As shown diagrammatically in FIG. 2a, the device for automatic management of the alphabet chosen for visual or audio reproduction
de ces documents HTML, est implanté dans le module d'ana- of these HTML documents, is implemented in the analysis module
lyse 1 et de transformation HTML et pour cette raison lysis 1 and HTML transformation and for that reason
porte la référence G dans ce module. carries the reference G in this module.
Le dispositif de gestion G comprend bien entendu des modules de mise en ouvre du procédé tel que précédemment décrit en liaison avec les figures la et lb permettant, The management device G naturally includes modules for implementing the method as previously described in connection with FIGS. 1a and 1b allowing,
dans les conditions décrites précédemment dans la descrip- under the conditions described above in the description
tion, d'attribuer à chaque document HTML courant un alpha- tion, to assign to each HTML document running an alpha-
bet de référence afin de permettre la restitution visuelle ou sonore de ce document courant dans sa langue d'origine reference bet to allow the visual or audible reproduction of this current document in its original language
et sa version initiale. Ce module de mise en oeuvre du pro- and its initial version. This program implementation module
cédé précédemment décrit porte la référence 1 sur la fi- previously described gives the reference 1 on the figure
gure 2b.gure 2b.
En outre le dispositif de gestion G objet de la pré- In addition, the management device G which is the subject of the pre-
sente invention comprend un module 2 permettant d'assurer la discrimination de la présence ou de l'absence de codage sente invention includes a module 2 for discriminating the presence or absence of coding
du document courant selon un alphabet UNICODE. of the current document according to a UNICODE alphabet.
Ainsi que représenté sur la figure 2b précitée, le module 2 de discrimination peut comprendre un module 20 de discrimination de la présence de caractères autres que ceux de l'alphabet par défaut, l'alphabet ISO-8859-l par As shown in FIG. 2b above, the discrimination module 2 can comprise a module 20 for discriminating the presence of characters other than those of the default alphabet, the alphabet ISO-8859-1 by
exemple, de l'alphabet UNICODE ou d'un autre alphabet ain- example of the UNICODE alphabet or another alphabet as well
si que d'un module 21 actionné sur réponse positive au mo- if a module 21 activated on positive response to the
dule 20, le module 21 permettant de discriminer la pré- dule 20, the module 21 allowing to discriminate the pre-
sence d'un codage UNICODE du document courant ou de carac- sence of a UNICODE coding of the current document or character
tères codés en mode UNICODE, autres que ceux de l'alphabet par défaut en référence à la figure 2b. On indique que le module 2 de discrimination de la présence respectivement ters coded in UNICODE mode, other than those in the default alphabet with reference to Figure 2b. It is indicated that the module 2 of discrimination of the presence respectively
de l'absence de codage du document courant selon l'alpha- the lack of coding of the current document according to alpha-
bet UNICODE correspond à une réponse négative au module 20 alors que la présence de codage du document courant selon bet UNICODE corresponds to a negative response to module 20 while the presence of coding of the current document according to
l'alphabet UNICODE correspond à la réponse positive du mo- the UNICODE alphabet corresponds to the positive response of the
dule 20 et à la réponse positive du module 21, présence de dule 20 and the positive response from module 21, presence of
codage UNICODE, un cas intermédiaire correspondant toute- UNICODE coding, an intermediate case corresponding all-
fois à l'absence de codage UNICODE du document bien que certains caractères UNICODE soient présents en réponse au times to the absence of UNICODE coding of the document although certain UNICODE characters are present in response to the
module 20.module 20.
En outre un module de reconnaissance 3 de la compati- In addition, a recognition module 3 for the compatibility
bilité du terminal avec le codage UNICODE est prévu, ce terminal flexibility with UNICODE coding is expected, this
module répondant uniquement à la réponse positive respec- module responding only to the positive response respec-
tivement négative du module 21 précédemment mentionné. Le module 3 de reconnaissance de la compatibilité du terminal negative of module 21 previously mentioned. Terminal compatibility recognition module 3
avec le codage UNICODE peut comporter un module 30 d'allo- with UNICODE coding can include a module 30 of allo-
cation, sur réponse négative du module 21, d'un alphabet reconnu au document courant, cet alphabet reconnu étant distinct de l'alphabet par défaut, le document courant cation, upon negative response from module 21, of a recognized alphabet to the current document, this recognized alphabet being distinct from the default alphabet, the current document
pouvant toutefois contenir en plus des caractères de l'al- may however contain in addition to characters of the al-
phabet par défaut. Le module 3 de reconnaissance de compa- default phabet. Compass recognition module 3
tibilité au codage UNICODE du terminal comporte en outre un module proprement dit de reconnaissance de terminal the UNICODE coding capability of the terminal also includes a terminal recognition module itself
UNICODE 31, 32.UNICODE 31, 32.
Le module 3 de reconnaissance de la compatibilité du Module 3 for recognizing the compatibility of
0 terminal avec le codage UNICODE permet, ainsi que repré- 0 terminal with UNICODE coding allows, as well as
senté sur la figure 2b, l'émission et la restitution vi- felt in FIG. 2b, the emission and the restitution vi-
suelle ou sonore du document courant vers le terminal à audible or audible from the current document to the terminal at
l'étape A lorsque l'alphabet de référence alloué à ce do- step A when the reference alphabet allocated to this do-
cument courant est l'alphabet par défaut ou que cet alpha- current cument is the default alphabet or that this alpha-
bet de référence est l'alphabet UNICODE et que le caractère de compatibilité du terminal avec le codage reference bet is the UNICODE alphabet and that the compatibility character of the terminal with coding
UNICODE est reconnu. En effet, dans un tel cas, un termi- UNICODE is recognized. Indeed, in such a case, a termi-
nal UNICODE est en mesure d'afficher le document courant HTML sans changement ou intervention. L'étape A est suivie nal UNICODE is able to display the current HTML document without change or intervention. Step A is followed
bien entendu d'une étape de fin de procédure. of course an end of procedure step.
Le module 3, associé au module 2 précédemment décrit, permet également la transformation du document courant en fichiers de cellules images à l'étape B lorsque l'alphabet de référence est l'alphabet UNICODE sur réponse positive du module 21 mais que le caractère de compatibilité du terminal avec le codage UNICODE n'est pas reconnu, réponse négative du module 31, ou lorsque l'alphabet du document courant n'est pas l'alphabet UNICODE sur réponse négative Module 3, associated with module 2 previously described, also allows the transformation of the current document into image cell files in step B when the reference alphabet is the UNICODE alphabet on positive response from module 21 but the character of compatibility of the terminal with UNICODE coding is not recognized, negative response from module 31, or when the alphabet of the current document is not the UNICODE alphabet on negative response
au module 21 et que le caractère de compatibilité du ter- in module 21 and that the compatibility character of the
minal avec le codage UNICODE n'est pas reconnu, sur ré- minimum with UNICODE encoding is not recognized, on re-
ponse négative du module 32. L'étape B constitue en fait une étape de transformation du document HTML initial en document HTML dans lequel les caractères alphabétiques negative response from module 32. Step B in fact constitutes a step of transforming the initial HTML document into an HTML document in which the alphabetic characters
et/ou les idéogrammes sont remplacés par des cellules ima- and / or the ideograms are replaced by ima-
ges qui permettent alors de représenter ces derniers. De ges which then make it possible to represent these. Of
manière avantageuse ces cellules images sont alors déli- advantageously these image cells are then delimited
vrées au format JPEG, GIF ou autres par exemple. On com- in JPEG, GIF or other formats for example. We understand
prend en particulier que ces cellules images peuvent être combinées ou regroupées pour représenter un ou plusieurs takes in particular that these image cells can be combined or grouped to represent one or more
idéogrammes en une seule image.ideograms in a single image.
En outre le module 3 associé au module 2 précité per- In addition, module 3 associated with the aforementioned module 2 per-
met encore la transformation du document courant par co- still puts the transformation of the current document by co-
dage au moyen de l'alphabet UNICODE à l'étape C lorsque l'alphabet de référence n'est pas l'alphabet UNICODE sur réponse négative du module 21 mais que le caractère de dage using the UNICODE alphabet in step C when the reference alphabet is not the UNICODE alphabet on a negative response from module 21 but the character of
compatibilité du terminal avec le codage UNICODE est re- compatibility of the terminal with UNICODE coding is re-
connu, c'est-à-dire sur réponse positive du module 32. Les étapes B et C sont alors suivies d'une étape D permettant l'émission du document transformé vers le terminal tel known, that is to say on a positive response from module 32. Steps B and C are then followed by step D allowing the transmission of the transformed document to the terminal as
qu'un MINITEL-INTERNET, un micro-ordinateur ou autre. than a MINITEL-INTERNET, a microcomputer or other.
L'étape D est elle-même suivie d'une étape de fin de pro- Step D is itself followed by an end of pro-
cédure.cedure.
De la même manière un dispositif de gestion automati- In the same way an automatic management device
que de l'alphabet choisi pour la restitution visuelle ou sonore de documents HTML peut être mis en oeuvre dans un système d'interfaçage de type passerelle entre un terminal that the alphabet chosen for the visual or audio reproduction of HTML documents can be implemented in an interface system of the gateway type between a terminal
de type VIDEOTEX interconnecté par l'intermédiaire du ré- VIDEOTEX type interconnected by means of the
seau téléphonique commuté RTC et d'une liaison spécialisée LT d'un système d'accès PAVI et d'une ligne de type X.25 PSTN switched telephone bucket and a dedicated link LT of a PAVI access system and an X.25 type line
connectée à cette passerelle, la passerelle étant elle- connected to this gateway, the gateway being itself
même interconnectée par un réseau tel que le réseau INTERNET à différents serveurs. Le réseau est bien entendu soumis à un protocole d'intercommunication de type IP et de communication de documents HTML. Dans un tel cas le dispositif de gestion objet de la présente invention est even interconnected by a network such as the INTERNET network to different servers. The network is of course subject to an intercom protocol of the IP type and communication of HTML documents. In such a case, the management device object of the present invention is
implanté dans la passerelle constituant un système d'adap- installed in the gateway constituting an adapta-
tation de type INTERNET/TELETEL pour le terminal VIDEOTEX INTERNET / TELETEL type for the VIDEOTEX terminal
par exemple.for example.
Le dispositif de gestion objet de la présente inven- The management system that is the subject of this invention
tion est alors intégré et implanté dans la passerelle et tion is then integrated and installed in the gateway and
porte pour cette raison la référence G' sur la figure 3a. therefore bears the reference G 'in FIG. 3a.
En référence à la figure 3b il comprend de la même manière que relativement à la figure 2b, un module 1 de mise en oeuvre du procédé objet de la présente invention permettant With reference to FIG. 3b, it comprises, in the same way as in relation to FIG. 2b, a module 1 for implementing the method which is the subject of the present invention allowing
d'attribuer au document courant HTML un alphabet de réfé- to assign to the current HTML document a reference alphabet
rence afin de permettre l'affichage de ce document courant dans sa langue d'origine et sa version initiale. En outre, le dispositif de gestion comporte un module 4 de discrimi- to allow the display of this current document in its original language and its initial version. In addition, the management device comprises a module 4 for discriminating
nation de la présence respectivement de l'absence de co- nation of the presence respectively of the absence of co-
dage du document courant selon un alphabet de référence correspondant à un alphabet par défaut, tel que l'alphabet ISO-8859-1, ainsi qu'un module 4o permettant, sur réponse Dage of the current document according to a reference alphabet corresponding to a default alphabet, such as the ISO-8859-1 alphabet, as well as a 4o module allowing, upon response
positive du module 4 à la présence de l'alphabet par dé- positive from module 4 to the presence of the alphabet by de-
faut précité, la transformation du document courant en service au format VIDEOTEX à partir de jeux de caractères de base du terminal VIDEOTEX précité. Le module 4o de above, the transformation of the current document into service in VIDEOTEX format from the basic character sets of the above-mentioned VIDEOTEX terminal. The 4o module of
transformation du document courant permet alors l'affi- transformation of the current document then allows the affi-
* chage du document HTML ainsi transformé en service* chage the HTML document thus transformed into a service
VIDEOTEX par un retour à une étape de fin de procédure. VIDEOTEX by returning to an end of procedure step.
En outre un module 5 de discrimination, dans le docu- In addition, a module 5 on discrimination, in the docu-
ment courant, de la présence d'idéogrammes et/ou de carac- common, the presence of ideograms and / or characters
tères codés selon le code UNICODE correspondant à des ters coded according to the UNICODE code corresponding to
idéogrammes est prévu. Ce module 5 est actionné sur ré- ideograms is expected. This module 5 is actuated on re-
ponse négative du module 4 précédemment mentionné. negative response from module 4 previously mentioned.
Un module 5o est prévu pour assurer la transformation A 5o module is planned to ensure the transformation
du document courant en service au format VIDEOTEX sur ré- of the current document in service in VIDEOTEX format on re-
ponse négative du module 5. Cette transformation est ef- negative response from module 5. This transformation is ef-
fectuée à partir de jeux de caractères de base du terminal made from basic terminal character sets
VIDEOTEX et de jeux de caractères redéfinissables dynami- VIDEOTEX and dynamic redefinable character sets
quement DRCS en fonction de l'alphabet de référence al- only DRCS according to the reference alphabet al-
loué, ceci permet ainsi un affichage limité en nombre rented, this allows a display limited in number
d'idéogrammes du document courant.of ideograms of the current document.
Un module 6 est en outre prévu, lequel permet d'assu- A module 6 is also provided, which makes it possible to
rer la discrimination de la capacité du terminal VIDEOTEX discriminating the capacity of the VIDEOTEX terminal
précité à afficher des fichiers images. Sur réponse posi- aforementioned to display image files. On posi-
tive du module 5 de discrimination de présence d'idéogram- tive of module 5 of ideogram presence discrimination-
mes et/ou de caractères codés selon le code UNICODE correspondant à des idéogrammes, et sur réponse positive au module 6 précité, de discrimination de la capacité du terminal à visualiser et afficher des fichiers images un mes and / or characters coded according to the UNICODE code corresponding to ideograms, and on positive response to the aforementioned module 6, of discrimination of the terminal's ability to view and display image files a
module de transformation 60 permet d'assurer la transfor- transformation module 60 ensures the transformation
mation du document courant en service VIDEOTEX à partir de jeux de caractères de base du terminal VIDEOTEX et de jeux mation of the current document in VIDEOTEX service from basic character sets of the VIDEOTEX terminal and sets
de caractères redéfinissables dynamiquement DRCS en fonc- dynamically redefinable characters DRCS in function
tion de l'alphabet de référence alloué, ainsi que par tion of the allocated reference alphabet, as well as by
l'affichage d'idéogrammes reconnus sous forme de cellules- the display of ideograms recognized in the form of cells-
images. Le module 6o utilise les jeux de caractères de base des terminaux VIDEOTEX, tels que les MINITEL, des images. The 6o module uses the basic character sets of VIDEOTEX terminals, such as MINITEL,
jeux de caractères DRCS téléchargés d'un nombre d'idéo- DRCS character sets downloaded from a number of ideo-
grammes reconnus limités en nombre à 47 par document. Tout ou partie des caractères alphabétiques et/ou idéogrammes recognized grams limited in number to 47 per document. All or part of the alphabetic characters and / or ideograms
peuvent être remplacés par des cellules images les repré- can be replaced by image cells.
sentant au format JPEG et/ou GIF par exemple. feeling in JPEG and / or GIF format for example.
Enfin, sur réponse négative au module 6 un module 61 Finally, on negative response to module 6 a module 61
permet d'assurer une transformation du document HTML cou- allows to transform the HTML document
rant en service VIDEOTEX utilisant les jeux de caractères rant in VIDEOTEX service using character sets
de base des MINITEL, les jeux de caractères DRCS précédem- of MINITEL, the DRCS character sets previously
ment téléchargés dans le MINITEL en fonction de l'alphabet reconnu de même que dans le cas du module 5o. Toutefois un affichage en nombre limité d'idéogrammes, 47 par document, ment downloaded in the MINITEL according to the recognized alphabet as well as in the case of the 5o module. However, a display in a limited number of ideograms, 47 per document,
est également prévu et mis en ouvre par le module 61. is also planned and implemented by module 61.
La figure 4a représente l'exemple d'un document HTML Figure 4a shows the example of an HTML document
affiché sur le moniteur d'un terminal en France, ce docu- displayed on the monitor of a terminal in France, this docu-
ment HTML étant délivré par un site WEB localisé en Grèce par exemple. La figure 4a représente un tel document HTML en l'absence d'application du procédé objet de la présente invention. On constate que l'ensemble du texte affiché ment HTML being delivered by a WEB site located in Greece for example. FIG. 4a represents such an HTML document in the absence of application of the method which is the subject of the present invention. We see that all of the text displayed
consiste en une succession de caractères sensiblement in- consists of a succession of characters substantially
intelligibles en raison du type d'alphabet retenu pour l'affichage du document HTML considéré. Il n'existe en ef- intelligible due to the type of alphabet used to display the HTML document considered. In fact,
fet aucune raison pour que les codes relatifs à chaque ca- no reason why the codes relating to each card
ractère de l'alphabet grec permettent d'obtenir un code cohérent à partir des codes correspondants utilisés en France. Au contraire en figure 4b on a représenté un document HTML délivré par le même site WEB localisé en Grèce et dans lequel grâce à la mise en ouvre du procédé objet de la présente invention l'ensemble des caractères affichés a été reconstitué à partir de l'alphabet grec d'origine, la visualisation du document étant restituée dans sa version d'origine. the alphabet of the Greek alphabet make it possible to obtain a coherent code from the corresponding codes used in France. On the contrary in FIG. 4b there is shown an HTML document delivered by the same WEB site located in Greece and in which, thanks to the implementation of the process which is the subject of the present invention, all the characters displayed have been reconstructed from the original Greek alphabet, the visualization of the document being restored in its original version.
Il en est de même en ce qui concerne la figure 5a re- The same is true with regard to FIG. 5a.
lativement à un document HTML délivré par un site WEB si- later to an HTML document delivered by a WEB site if-
tué au Japon. L'affichage d'un tel document à partir d'un alphabet utilisé en France délivre également une série de caractères totalement inintelligibles en l'absence de la killed in Japan. The display of such a document from an alphabet used in France also delivers a series of characters totally unintelligible in the absence of the
mise en oeuvre du procédé objet de la présente invention. implementation of the process which is the subject of the present invention.
Au contraire en figure 5b on a représenté un document HTML issu du même site WEB localisé au Japon dans lequel toutefois grâce à la mise en oeuvre du procédé objet de la présente invention, les codes correspondants ont été On the contrary in FIG. 5b, an HTML document has been represented from the same WEB site located in Japan in which, however, thanks to the implementation of the process which is the subject of the present invention, the corresponding codes have been
transformés de façon à représenter des fichiers images re- transformed to represent image files
présentatifs d'idéogrammes significatifs pour toute per- presentation of significant ideograms for any person
sonne disposant de la connaissance des idéogrammes sounds having knowledge of ideograms
précités.cited above.
On a ainsi décrit un procédé de discrimination auto- A method of self-discrimination has thus been described.
matique d'un alphabet pour la restitution visuelle ou so- matic of an alphabet for visual or social restitution
nore d'un document HTML particulièrement performant dans of a particularly efficient HTML document in
la mesure o en raison de l'implantation spécifique de mo- measure o due to the specific implantation of mo-
dules de mise en oeuvre du procédé sous forme de modules de gestion correspondants en fonction des terminaux utilisés et en particulier du mode de liaison de ces terminaux par l'intermédiaire du réseau INTERNET à différents serveurs, il est ainsi possible de restituer tout document HTML dans sa version d'origine et en particulier dans sa langue d'origine. dules for implementing the method in the form of corresponding management modules according to the terminals used and in particular the mode of connection of these terminals via the INTERNET network to different servers, it is thus possible to restore any HTML document in its original version and in particular in its original language.
Le procédé de discrimination automatique d'un alpha- The method of automatic discrimination of an alpha-
bet pour la restitution visuelle ou sonore d'un document bet for the visual or audio reproduction of a document
HTML peut être implémenté, à titre d'exemples non limita- HTML can be implemented, as examples not limited to
tifs, au niveau du serveur de fichiers, dans une passe- tifs, at the file server level, in a pass
relle entre ce serveur et le terminal de consultation, ou between this server and the consultation terminal, or
dans ce terminal.in this terminal.
Claims (8)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9809559A FR2781629B1 (en) | 1998-07-27 | 1998-07-27 | METHOD FOR AUTOMATIC DISCRIMINATION OF AN ALPHABET FOR VISUAL OR SOUND RESTITUTION OF AN HTML DOCUMENT, AND DEVICE FOR MANAGING HTML DOCUMENTS THEREFOR |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9809559A FR2781629B1 (en) | 1998-07-27 | 1998-07-27 | METHOD FOR AUTOMATIC DISCRIMINATION OF AN ALPHABET FOR VISUAL OR SOUND RESTITUTION OF AN HTML DOCUMENT, AND DEVICE FOR MANAGING HTML DOCUMENTS THEREFOR |
Publications (2)
Publication Number | Publication Date |
---|---|
FR2781629A1 true FR2781629A1 (en) | 2000-01-28 |
FR2781629B1 FR2781629B1 (en) | 2006-09-22 |
Family
ID=9529035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR9809559A Expired - Fee Related FR2781629B1 (en) | 1998-07-27 | 1998-07-27 | METHOD FOR AUTOMATIC DISCRIMINATION OF AN ALPHABET FOR VISUAL OR SOUND RESTITUTION OF AN HTML DOCUMENT, AND DEVICE FOR MANAGING HTML DOCUMENTS THEREFOR |
Country Status (1)
Country | Link |
---|---|
FR (1) | FR2781629B1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0723369A1 (en) * | 1995-01-23 | 1996-07-24 | NTEX datacommunications bv | Access method retrieving Internet information through Teletext/Videotex and the reverse |
-
1998
- 1998-07-27 FR FR9809559A patent/FR2781629B1/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0723369A1 (en) * | 1995-01-23 | 1996-07-24 | NTEX datacommunications bv | Access method retrieving Internet information through Teletext/Videotex and the reverse |
Non-Patent Citations (2)
Title |
---|
KIKUI G ET AL: "Cross-lingual Information retrieval on the WWW", ECAI96, 12TH EUROPEAN CONFERENCE ON ARTIFICIAL INTELLIGENCE, MULSAIC96 WORKSHOP, 1996, http://www.iit.nrcps.ariadne-t.gr./~costass/muls3.html, pages 1 - 6, XP002099141 * |
KIKUI, G: "Identifying the Coding System and Language of On-line Documents on the internet", SIXTEENTH INTERNATIONAL CONFERENCE OF COMPUTATIONAL LINGUISTICS (COLING), August 1996 (1996-08-01), pages 652 - 657, XP002099142 * |
Also Published As
Publication number | Publication date |
---|---|
FR2781629B1 (en) | 2006-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100329244B1 (en) | Remote web page reader | |
US6032162A (en) | System for processing and storing internet bookmark address links | |
US20080195954A1 (en) | Delivery of contextually relevant web data | |
FR2813409A1 (en) | Configuration of a peripheral for processing of electronic documents in a communication network, uses user data to access level of service available to that user on a network and prepares configuration from user data and service level data | |
US20100281311A1 (en) | Method and system for reconstructing error response messages under web application environment | |
FR2857763A1 (en) | METHOD OF ACCESSING AND SHARING A DIGITAL DOCUMENT IN A P2P COMMUNICATION NETWORK | |
CN109376133A (en) | File access method and file access system | |
FR2826748A1 (en) | Description of an interface applicable to a data object, uses Extended Markup Language XML and XML schema language associated with the XML language to describe parts of a function | |
FR2795835A1 (en) | METHOD FOR VERIFYING CODE TRANSFORMERS FOR AN ON-BOARD SYSTEM, IN PARTICULAR ON A CHIP CARD | |
FR2880966A1 (en) | AUTOMATIC NAVIGATION METHOD IN INTERPOSITION MODE | |
FR2781629A1 (en) | Automatic alphabet discrimination method for restoring HTML documents in original language, based on analysis of suffix component of URL address | |
FR2826761A1 (en) | Network sent extensible mark up language document analysis having language detected and assigned content value read/automatic identification digital word assembly with mark up language/length equal value read. | |
EP1515522A1 (en) | Method of inserting information concerning thematic filtering of HTML pages and corresponding system | |
CN109523591A (en) | Processing method, device, equipment and the storage medium of picture | |
FR2855695A1 (en) | Multimedia programs radio broadcasting method for e.g. PDA, involves adding header to multimedia programs before broadcasting each program, where header indicates type of client device for which program is destined | |
EP3465476B1 (en) | Method for invoking an application service via a browser | |
FR3030820A1 (en) | METHOD FOR ACCESSING DIGITAL CONTENT IN A COMMUNICATION NETWORK USING TERMINAL EQUIPMENT CONNECTED WITH THE COMMUNICATION NETWORK | |
EP3262536B1 (en) | Method for the accelerated download of a web page to a communication terminal | |
FR2884380A1 (en) | Interactive voice service designing and developing method, involves generating automatically software components, from intermediate format description files and/or software code search, in exception data base containing preset exceptions | |
FR3089027A1 (en) | Assistant device, Method for answering questions, Response agent device and Method for providing an answer item | |
FR2853788A1 (en) | METHOD AND DEVICE FOR ACCESSING A DIGITAL DOCUMENT IN A PEER-TO-PEER COMMUNICATION NETWORK | |
CN104978247A (en) | Application test method, application test device and application test system | |
EP2677708B1 (en) | Communication method of an audiovisual message, and communication system | |
FR2809908A1 (en) | Real time web site HTML to WML translation system uses comment markers in separate server | |
CN117150168A (en) | Chat record output method, device and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
ST | Notification of lapse |
Effective date: 20080331 |